Das KI-Update für die Woche 03-2026
10.01. - 16.01.
Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🤖 Cowork: Claude wird zum digitalen Kollegen mit Zugriff auf Ordner & autonomer Aufgabenplanung
🏥 MedGemma 1.5 & MedASR: Googles neue open-source Medizin-KI für Bildinterpretation & Spracherkennung
🛒 Universal Commerce Protocol: Google, Shopify & Walmart schaffen offenen Standard für KI-gestützten Handel
💼 Anthropic zeigt: KI beschleunigt komplexe Aufgaben um Faktor 12 - mit Auswirkungen auf Qualifikationsprofile
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Produktneuheiten
Cowork: Claude als digitaler Kollege für Alltagsaufgaben
Anthropic stellt Cowork vor, eine Research-Preview für Claude Max-Abonnenten auf macOS, die Claude Zugriff auf ausgewählte Computerordner gibt. Claude kann Dateien lesen, bearbeiten oder erstellen - etwa Downloads sortieren, Ausgaben aus Screenshots extrahieren oder Berichte aus Notizen generieren. Im Gegensatz zu normalen Chats plant und führt Claude Aufgaben autonom durch, mit Nutzerkontrolle und Warnungen vor riskanten Aktionen wie Löschungen. Es werden Sicherheit durch explizite Zugriffsrechte betont und vor Prompt-Injection-Risiken gewarnt, während Verbesserungen wie Windows-Support geplant sind.
Gemini stellt „Personal Intelligence“ vor - personalisierte KI mit Google-Apps
Google führt in der Gemini-App die Beta-Funktion „Personal Intelligence“ ein, die mit Gmail, Photos und anderen Apps verknüpft wird, um maßgeschneiderte Vorschläge zu geben - etwa für Reisen oder Projekte. Josh Woodward betont, wie Gemini Kontext aus E-Mails, Fotos und Videos analysiert, um proaktive, nutzerbezogene Antworten zu liefern, ohne sensible Daten extern zu senden. Datenschutz steht im Vordergrund: Die Funktion ist opt-in, referenziert Quellen transparent und trainiert nicht direkt auf privaten Inhalten; Feedback wird für Verbesserungen gesucht. Verfügbar zunächst für US-AI-Pro/Ultra-Nutzer.
SAILs Science Context Protocol vereint KI-Agenten in der Forschung
Das Shanghai Artificial Intelligence Laboratory (SAIL) hat das open-source Science Context Protocol (SCP) unter Apache 2.0 veröffentlicht. Es verbindet KI-Agenten, Roboter und Labore über lokale Clients, zentrale Hubs und Edge-Server, um Experimente reproduzierbar zu planen, auszuführen und zu archivieren - von natürlichen Sprachzielen bis hin zu physischen Tests. SCP nutzt über 1.600 Tools, JSON-Experimentdateien und strengere Sicherheit als das Model Context Protocol (MCP), um multidisziplinäre, autonome Wissenschaft zu ermöglichen.
Veröffentlichungen und Ankündigungen
Google veröffentlicht MedGemma 1.5 und MedASR für fortschrittliche Medizin-KI
Google Research hat MedGemma 1.5 (4B) vorgestellt, eine Weiterentwicklung des offenen Modells für medizinische Bildinterpretation, die CT-Scans, Histopathologie und weitere Modalitäten besser unterstützt. Basierend auf Community-Feedback verbessert es die Textgenerierung für Berichte und visuelle Fragen-Antworten. Parallel wird MedASR als offenes Sprach-zu-Text-Modell für medizinische Diktate und Gespräche eingeführt, das nahtlos mit MedGemma kombiniert werden kann. Autoren Daniel Golden und Fereshteh Mahvar kündigen zudem den MedGemma Impact Challenge-Hackathon auf Kaggle mit 100.000 Dollar Preisen an, um innovative Healthcare-Anwendungen zu fördern. Modelle sind auf Hugging Face verfügbar;
👉 Mitteilung von Google Research
GLM-Image: Open-Source-Meilenstein für hochpräzise Bildgenerierung
Z.ai stellt GLM-Image vor, das erste open-source, industrietaugliche diskrete autoregressive Bildgenerierungsmodell. Es nutzt eine hybride Architektur aus autoregressivem Modell (9B) und Diffusionsdecoder (7B), die Text-zu-Bild sowie Bild-zu-Bild-Generierung in einem System ermöglicht - inklusive Editing, Style-Transfer und Identitätserhaltung. Das Modell glänzt durch dichte Wissensintegration, hohe Detailtreue und Top-Benchmarks bei Open-Source-Modellen (z. B. 0.9524 Englisch, 0.9788 Chinesisch). Es ist auf Hugging Face und via API verfügbar.
TranslateGemma: Googles neue offene Übersetzungs-Modelle
Google stellt TranslateGemma vor, eine Familie offener Übersetzungs-Modelle auf Basis von Gemma 3, die 55 Sprachen abdecken. Der Blogbeitrag vom Google Technology Blog hebt hervor, dass Entwickler diese Modelle frei nutzen und anpassen können, um hochwertige Übersetzungen zu erzeugen - von Text bis hin zu Audio. Ziel des Autors ist es, die Innovationskraft für KI-Entwickler zu betonen und den offenen Zugang zu multilingualer KI zu fördern.
Industrienachrichten
Google startet Universal Commerce Protocol für KI-gestützten Handel
Google hat gemeinsam mit führenden Einzelhändlern wie Shopify, Walmart und Target das Universal Commerce Protocol (UCP) entwickelt - einen Open-Source-Standard für nahtlosen, KI-gestützten Handel. Das Protokoll löst Integrationsengpässe durch eine standardisierte Schnittstelle, die den gesamten Einkaufsprozess von der Produktsuche bis zur Bezahlung unterstützt. UCP ermöglicht es Unternehmen, ihre Angebote auf verschiedenen KI-Plattformen zu präsentieren, während sie die volle Kontrolle über ihre Geschäftslogik behalten. Die Technologie ist bereits in Google-Produkten wie AI Mode in Search und der Gemini-App implementiert und bietet flexible Integrationsoptionen über APIs oder Agent-zu-Agent-Kommunikation.
Machen Filesystem-Tools den Vector-Search überflüßig?
LlamaIndex testet in einem Experiment, ob agentische Filesystem-Suche (fs-explorer mit Tools wie grep oder parse_file) traditionelles RAG übertrumpft. Bei fünf arXiv-Papieren schnitt der Agent besser bei Korrektheit (8,4 vs. 6,4) und Relevanz (9,6 vs. 8) ab, war aber langsamer (11,17s vs. 7,36s). Beim Skalieren auf 1000 Abstracts dominiert RAG in Geschwindigkeit und leicht in Korrektheit. Der Autor Clelia Astra Bertelli schlussfolgert: Es hängt von Komplexität und Anforderungen ab - Filesystem für kleine Sätze, RAG für Skalierung.
Microsofts „Community-First AI Infrastructure“: Fünf Versprechen an US-Gemeinden
Microsoft startet 2026 eine Initiative für verantwortungsvolle KI-Infrastruktur, die an historische Großprojekte wie Kanäle oder Stromnetze anknüpft. Verglichen werden AI-Datenzentren mit früheren Entwicklungen, wobei Erfolg nur gelingt, wenn lokale Belastungen wie Strom und Wasser ausgeglichen werden. Fünf Commitments: volle Stromkostenübernahme ohne Preiserhöhung für Haushalte, Wasserreduktion mit Netto-Wiederauffüllung, lokale Jobs durch Ausbildung (z. B. NABTU und Datacenter Academy), volle Grundsteuerzahlungen sowie Investitionen in KI-Schulungen und Nonprofits. Ziel: Gemeinden stärken.
Zahlen, Studien, Wissenschaft
Anthropics neue Bausteine für KI-Wirtschaftsanalyse
Anthropic stellt im vierten Economic-Index-Bericht “economic primitives” vor: fünf Messgrößen (Aufgabenkomplexität, Fertigkeitsniveau, Nutzungszweck, KI-Autonomie, Erfolgsrate), abgeleitet aus Claude-Gesprächen aus November 2025. Diese erlauben präzise Einblicke in KI-Einflüsse auf Arbeit. Komplexe Aufgaben (z.B. College-Niveau) werden um Faktor 12 beschleunigt, API noch stärker; Erfolgsraten sinken leicht bei Komplexität. Berufliche Abdeckung steigt auf 49%, KI übernimmt tendenziell höherqualifizierte Teile – was zu Deskilling-Effekten führen könnte. Produktivitätsgewinn korrigiert auf 1,0-1,2 Prozentpunkte jährlich. Nutzung variiert global: Bildung in ärmeren Ländern, Arbeit in reicheren.
KI verändert Informationsberufe nachhaltig
Microsofts Auswertung von über 200.000 Copilot-Dialogen zeigt den größten KI-Effekt in Berufen wie Journalismus, Vertrieb, IT, Management, Beratung und Wissenschaft, wo sie Informationsarbeit ergänzt. Berufe mit Hochschulabschluss profitieren stärker, doch auch mittlere Qualifikationen weisen hohe Effekte auf - bei Schulung, angepassten Prozessen und klaren Verantwortlichkeiten. Der Autor unterstreicht: KI-Kenntnisse werden Grundqualifikation; Erfolg entscheidet sich über Domänenwissen, Technikverständnis und kritisches Denken, was Personal- und KI-Strategien verschmilzt.
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.








