Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🚀 ERNIE 4.5 von Baidu: 424 Milliarden Parameter starkes Open Source Modell mit innovativer MoE-Architektur
📱 Gemma 3n: Googles neues KI-Modell speziell für Smartphones und Edge-Geräte
🤖 Gartner warnt: 40% der KI-Agenten-Projekte scheitern bis 2027 an hohen Kosten und unklaren Vorteilen
🏥 Microsoft AI übertrifft Ärzte: 85% Treffsicherheit bei komplexen Diagnosen vs. 20% bei Medizinern
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Produktneuheiten
ERNIE 4.5 von Baidu: Multimodale KI mit 424 Milliarden Parametern, innovativer MoE-Architektur und Open Source
ERNIE 4.5 ist eine multimodale Mixture-of-Experts-(MoE)-Modellfamilie von Baidu mit 424 Milliarden Gesamtparametern und 47 Milliarden aktivierten Parametern pro Token. Das Modell kombiniert Text- und Bildverarbeitung durch eine heterogene MoE-Struktur mit modality-isolated routing und speziellen Verlustfunktionen, die eine gegenseitige Verstärkung der Modalitäten ermöglichen. Die Trainingsstrategie ist gestaffelt: zuerst Text, dann multimodale Integration mit ViT-basierten visuellen Experten. Für effizientes Training und Inferenz nutzt ERNIE 4.5 fortschrittliche Parallelisierung, FP8-Mixed-Precision und verlustfreie 4-/2-Bit-Quantisierung. Varianten sind für unterschiedliche Anwendungen feinjustiert (SFT, DPO, UPO). Die Modelle sind unter Apache-2.0-Lizenz frei verfügbar und unterstützen extrem lange Kontextlängen von über 130.000 Tokens.
👉 ERNIE 4.5 Technischer Bericht | 👉 Mitteilung von Hugging Face
Gemma 3n: Googles neues Multitalent für KI auf dem Smartphone
Gemma 3n ist Googles neuestes Open Source KI-Modell, das speziell für den Einsatz auf mobilen und Edge-Geräten entwickelt wurde. Dank der innovativen MatFormer-Architektur (Matryoshka Transformer) vereint es mehrere Modelle in einem, was flexible Anpassung an unterschiedliche Hardware ermöglicht. Mit Per-Layer Embeddings wird die Speichernutzung optimiert, während Features wie KV Cache Sharing die Geschwindigkeit bei langen Eingaben deutlich steigern. Gemma 3n integriert fortschrittliche Audio- und Vision-Encoder und unterstützt beliebte Entwickler-Tools, um leistungsstarke, multimodale KI-Anwendungen direkt auf dem Gerät zu ermöglichen.
Perplexity Max – Das neue Power-Abo
Perplexity Max ist das bisher leistungsstärkste Abonnement von Perplexity, konzipiert für Nutzer, die unbegrenzte KI-Leistung und frühzeitigen Zugang zu den neuesten Features verlangen. Es bietet unbegrenzte Nutzung der Labs, mit denen sich komplexe Dashboards, Präsentationen und Web-Apps erstellen lassen. Max-Abonnenten erhalten zudem exklusiven Early Access zu neuen Produkten wie dem Comet-Browser, der als intelligenter Webpartner fungiert. Außerdem beinhaltet das Paket Zugang zu Top-KI-Modellen wie OpenAI o3-pro und Claude Opus 4 sowie priorisierten Support. Zielgruppe sind Profis, Content-Ersteller, Business-Strategen und Forscher mit hohem Analysebedarf. Perplexity Max ist ab sofort auf Web und iOS verfügbar.
Industrienachrichten
KI-Agenten übernehmen Kontrolle: Sind wir bereit für autonome Systeme?
2025 markiert den Beginn einer neuen Ära, in der KI-Agenten zunehmend echte Autonomie erhalten und eigenständig Aufgaben ausführen – von Terminbuchungen bis hin zu komplexen Entscheidungen. OpenAI und andere Firmen entwickeln solche Agenten, die ohne menschliches Eingreifen agieren können und damit einen wichtigen Schritt Richtung Künstliche Allgemeine Intelligenz (AGI) darstellen. Diese Entwicklung birgt enorme Chancen, etwa Effizienzsteigerungen und neue Services, doch gleichzeitig wächst das Risiko von Fehlverhalten, Missbrauch und Kontrollverlust. Experten warnen, dass wir aktuell unzureichend auf diese Veränderungen vorbereitet sind und fordern klare Sicherheitspraktiken und Regulierungen, um die Risiken zu minimieren und die Verantwortlichkeiten zu definieren.
👉 Artikel bei MIT Technology Review
Gartner warnt: KI-Agenten-Hype führt zu massenhaftem Scheitern bis 2027
Bis Ende 2027 werden laut Gartner über 40 % der aktuell gestarteten Projekte mit KI-Agenten wieder eingestellt. Hauptgründe sind hohe Betriebskosten, unklare wirtschaftliche Vorteile und unzureichende Risikokontrolle. Viele Projekte befinden sich noch im Experimentierstadium und werden vom aktuellen Hype getrieben, was dazu führt, dass Unternehmen die Komplexität und Kosten unterschätzen. Zudem betreiben zahlreiche Anbieter sogenanntes „Agent Washing“, indem sie herkömmliche Tools als KI-Agenten vermarkten, obwohl ihnen echte Agentenfähigkeiten fehlen.
Kontext-Engineering: Die Kunst, KI-Agenten effizient zu steuern
Kontext-Engineering ist entscheidend für die Leistungsfähigkeit von KI-Agenten: Es geht darum, das Kontextfenster eines LLM gezielt mit relevanten Informationen zu füllen. Vier Strategien haben sich etabliert: Schreiben (Informationen außerhalb des Kontextfensters speichern), Auswählen (gezielt relevante Informationen einblenden), Komprimieren (nur notwendige Tokens behalten, z.B. durch Zusammenfassungen) und Isolieren (Kontext auf Subagenten oder Umgebungen aufteilen). Tools wie LangGraph und LangSmith unterstützen diese Methoden und helfen, Agenten effizienter und robuster zu machen.
KI als Ladenbesitzer: Wie gut kann Claude einen kleinen Shop autonom managen?
Anthropic kooperierte mit der KI-Sicherheitsfirma Andon Labs im Projekt „Vend“, bei dem Claude Sonnet 3.7 (alias „Claudius“) einen kleinen, automatisierten Laden im Büro eigenständig managen sollte. Andon Labs übernahm dabei die physische Unterstützung wie Nachfüllen und Kundenkontakt, während Claude alle Geschäftsentscheidungen traf. Trotz innovativer Fähigkeiten bei Lieferantensuche und Kundenservice scheiterte Claude wirtschaftlich: Er verschenkte Waren, halluzinierte Zahlungsinformationen und gab zu viele Rabatte. Das Experiment zeigt, dass KI-Agenten reale Geschäftsprozesse übernehmen können, aber noch verbesserte Werkzeuge und Anleitungen benötigen, um profitabel zu agieren.
Mark Zuckerberg formiert Meta Superintelligence Labs mit Top-Talenten aus der KI-Branche
Mark Zuckerberg hat bei Meta ein neues "Superintelligence"-Team gegründet, um die Entwicklung von KI zu beschleunigen, die menschliche Intelligenz übertrifft. Die Meta Superintelligence Labs (MSL) werden von Alexandr Wang, ehemals CEO von Scale AI, geleitet, der auch Meta’s Chief AI Officer ist. Nat Friedman, ehemaliger GitHub-CEO, co-leitet das Team. Meta investierte 14,3 Milliarden Dollar in Scale AI und rekrutierte zahlreiche Experten von OpenAI, Anthropic und Google. Ziel ist es, persönliche Superintelligenz für Milliarden Nutzer zu schaffen und die nächste Generation von KI-Modellen zu entwickeln.
Elon Musks xAI sichert 10 Milliarden Dollar für KI-Infrastruktur und Expansion
Elon Musks KI-Startup xAI hat eine Finanzierungsrunde über 10 Milliarden US-Dollar abgeschlossen, aufgeteilt in 5 Milliarden Dollar Schulden (gesicherte Anleihen und Terminkredite) und 5 Milliarden Dollar strategische Eigenkapitalinvestitionen, organisiert von Morgan Stanley. Die Mittel sollen den Ausbau von xAIs KI-Infrastruktur vorantreiben, darunter eines der weltweit größten Rechenzentren und die Weiterentwicklung der KI-Plattform Grok. Das Supercomputer-System Colossus mit 200.000 GPUs wurde in Rekordzeit gebaut und soll weiter auf bis zu 1 Million GPUs wachsen. xAI plant zudem, bis zu 20 Milliarden Dollar weiteres Eigenkapital aufzunehmen, was die Unternehmensbewertung auf bis zu 200 Milliarden Dollar heben könnte. Die Finanzierungsrunde unterstreicht das Vertrauen der Investoren in xAIs Vision, trotz wachsender Konkurrenz durch OpenAI, Amazon und andere Tech-Giganten.
👉 Artikel bei Economy Middle East
Dänemark stärkt Persönlichkeitsrechte im Kampf gegen Deepfakes
Dänemark will mit einem neuen Gesetz Bürgern das Urheberrecht an ihrem eigenen Gesicht, ihrer Stimme und ihrem Körper zusichern. Damit sollen Deepfakes und KI-generierte Fälschungen ohne Zustimmung untersagt werden. Betroffene können die Löschung solcher Inhalte verlangen und Schadenersatz fordern. Plattformen, die nicht reagieren, drohen empfindliche Strafen. Für Satire und Parodie gibt es Ausnahmen. Dänemark setzt damit ein klares Zeichen für den Schutz der digitalen Identität und könnte europaweit Vorbild werden.
Cloudflare blockiert standardmäßig KI-Bots – Neue Ära für Web-Inhalte und Monetarisierung
Cloudflare schützt ab Juli 2025 automatisch die Websites seiner Kunden, indem es KI-Bots wie GPTBot (OpenAI) oder ClaudeBot (Anthropic) standardmäßig blockiert. Website-Betreiber können den Zugriff dieser Bots manuell erlauben oder verbieten. Zudem führt Cloudflare ein „Pay-per-Crawl“-Modell ein, mit dem Webseitenbetreiber für jeden Zugriff durch KI-Bots eine Vergütung erhalten können. Hintergrund ist der massive Anstieg aggressiver KI-Crawler, die Inhalte ohne Erlaubnis und oft ohne Verlinkung für Trainingsdaten sammeln, was Urhebern Einnahmen entzieht. Cloudflares Schritt sichert so rund 20% des Webs, stärkt die Kontrolle der Content-Ersteller und schafft neue Geschäftsmodelle im Umgang mit KI-Datenzugriff.
👉 Artikel bei MIT Technology Review
Zahlen, Studien, Wissenschaft
Generative KI verändert den Arbeitsmarkt: Nutzung, Produktivität und soziale Dynamiken
Die Studie „The Labor Market Effects of Generative Artificial Intelligence“ analysiert erstmals umfassend den Einsatz generativer KI im Arbeitsmarkt. Sie zeigt, dass 30,1% der Befragten ab 18 Jahren generative KI am Arbeitsplatz nutzen, vor allem jüngere, besser ausgebildete und höher verdienende Personen in Branchen wie Kundenservice, Marketing und IT. Die Arbeit dokumentiert erhebliche Produktivitätsgewinne durch KI, etwa Zeitersparnisse von über 60% bei vielen Aufgaben. Zudem beleuchtet sie Effekte auf Jobsuche und Arbeitsmarktstrukturen, was wichtige Implikationen für Politik, Unternehmen und Forschung mit sich bringt.
Microsoft AI auf dem Weg zur medizinischen Superintelligenz: KI übertrifft Ärzte bei komplexen Diagnosen
Microsoft AI hat mit dem Diagnostic Orchestrator (MAI-DxO) einen KI-basierten Diagnostik-Ansatz entwickelt, der in komplexen Fällen aus dem New England Journal of Medicine eine Treffsicherheit von bis zu 85% erreicht – mehr als viermal so hoch wie bei erfahrenen Ärzten. Die KI arbeitet dabei nicht nur genauer, sondern auch kosteneffizienter als Mediziner. MAI-DxO simuliert ein virtuelles Ärzteteam, das schrittweise Fragen stellt, Tests anordnet und Diagnosen überprüft. Dieses orchestrierte Vorgehen ermöglicht eine präzise und ressourcenschonende Diagnostik, die das Potenzial hat, die Gesundheitsversorgung zu revolutionieren und Kosten zu senken. Microsoft betont jedoch, dass die Technologie noch nicht klinisch zugelassen ist und Ärzte weiterhin unersetzlich bleiben.
👉 Mitteilung von Microsoft | 👉 Die Studie
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.