Das KI-Update für die Woche 05-2026
26.01.-30.01.
Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🤖 Moltbot geht viral: Open-Source KI-Assistent mit 100.000 GitHub-Stars
🧬 AlphaGenome von DeepMind: KI analysiert millionenlange DNA-Sequenzen für personalisierte Medizin
🌍 Qwen3-Max-Thinking von Alibaba überholt GPT-5.2 & Claude in 19 Benchmarks
🔬 Yann LeCun (ex Meta) gründet AMI Labs mit 600-Mio.-Dollar-Finanzierung – Fokus auf Healthcare
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Veröffentlichungen und Ankündigungen
Moltbot: Der KI-Assistent erledigt Aufgaben und wird dadurch über Nacht zum neuen Star
Moltbot (ehemals Clawdbot) ist ein Open-Source-KI-Assistent, welcher in dieser Woche komplett viral gegangen ist. Das Projekt erreichte in kürzester Zeit über 100.000 GitHub-Stars. Es ermöglicht Nutzern, einen persönlichen digitalen Helfer selbst zu hosten, der zahlreiche Alltagsaufgaben übernimmt.
Der Assistent glänzt durch seine Vielseitigkeit: Er kann Termine verwalten, Emails verarbeiten und priorisieren, Dokumente zusammenfassen, Recherchen durchführen und personalisierte Empfehlungen geben. Besonders geschätzt wird seine Fähigkeit, Nutzungsgewohnheiten zu erlernen und proaktiv relevante Informationen bereitzustellen, ohne dass externe Server involviert werden. Datenschutzbewusste Nutzer profitieren, da alle Daten lokal verbleiben.
Die Anpassungsfähigkeit über APIs und Plugins erlaubt die Integration mit diversen Diensten und Tools. Experten warnen jedoch vor möglichen Sicherheitsrisiken bei selbst-gehosteten KI-Systemen. Moltbot markiert den Wandel von Coding-Assistenten (2025) zu umfassenden persönlichen KI-Helfern als dominierender Trend 2026.
👉 Artikel bei MacStories | 👉 Artikel bei TechCrunch | 👉 GitHub Repo
Moonshot AI veröffentlicht Kimi K2.5
Moonshot AI hat mit Kimi K2.5 ein neues Open-Source-Multimodal-Modell vorgestellt, das als ihr bisher leistungsstärkstes Modell gilt. K2.5 baut auf dem Vorgänger Kimi K2 auf und wurde mit etwa 15 Billionen gemischten visuellen und textbasierten Tokens weiter trainiert. Das Modell zeichnet sich durch verbesserte Fähigkeiten in den Bereichen Codierung mit visueller Intelligenz aus und kann Bilder und Text verarbeiten, um produktionsreifen Code zu erstellen. K2.5 repräsentiert einen bedeutenden Fortschritt im Bereich der visuellen agentischen Intelligenz.
Alibabas Qwen3-Max-Thinking überholt führende KI-Modelle
Alibaba hat mit Qwen3-Max-Thinking sein bisher leistungsstärkstes KI-Modell vorgestellt. Laut offiziellen Angaben erreicht das Modell in 19 etablierten Benchmarks eine Leistung, die mit führenden Systemen wie GPT-5.2-Thinking, Claude-Opus-4.5 und Gemini 3 Pro vergleichbar ist. Besonders hervorzuheben sind die adaptive Werkzeugnutzung für Informationsabruf und Code-Interpretation sowie fortschrittliche Test-Skalierungstechniken, die die Reasoning-Fähigkeiten verbessern. Mit Unterstützung für 119 Sprachen und einer Kontextlänge von bis zu 128.000 Token positioniert sich Qwen3-Max-Thinking als bedeutende Alternative im KI-Markt.
Entwicklerleitfaden für Gemini 3
Google veröffentlicht den offiziellen Entwicklerleitfaden für die Gemini-3-Modellfamilie, die als intelligenteste Generation mit Fokus auf agentische Workflows, autonomem Programmieren und multimodalen Aufgaben positioniert wird. Gemini 3 Pro eignet sich für komplexe Schlussfolgerungen mit breitem Wissen, während Flash Geschwindigkeit und Preisvorteile bietet – beide mit 1-Mio.-Token-Eingabefenster und Wissensstand Januar 2025.
Neue API-Features wie thinking_level (low/high für Latenz- oder Tiefe-Kontrolle), media_resolution für präzise Bild-/Video-Analyse und Gedankensignaturen zur Kontextkontinuität werden detailliert mit Codebeispielen in Python, JS und REST erklärt.
Google DeepMind lanciert Project Genie - Unendliche Welten erschaffen
Google DeepMind stellt mit Project Genie einen experimentellen Prototypen vor, der auf dem Weltmodell Genie 3 basiert. US-Nutzer mit Google AI Ultra-Abo (ab 18) können interaktive, dynamische Welten per Text- und Bildprompts skizzieren, erkunden und remixen - von Physiksimulationen bis zu fiktiven Szenarien. Der Autor betont verantwortungsvolle Entwicklung in Google Labs, trotz Limitationen wie Physiktreue und Latenz, um Nutzerfeedback für AGI-Forschung zu sammeln.
Produktneuheiten
DeepSeek-OCR 2: Fortschritt bei KI-basierter Dokumentenverarbeitung
DeepSeek AI hat kürzlich DeepSeek-OCR 2 veröffentlicht, ein innovatives Open-Source-Modell zur Dokumentenerfassung. Das System führt einen neuartigen "Causal Flow Vision Encoder" (DeepEncoder V2) ein, der Dokumente ähnlich wie Menschen liest – mit semantischem Verständnis statt starrer Scanning-Muster. Mit minimalen visuellen Tokens (256-1120) erreicht es einen Benchmark-Score von 91,09% und übertrifft damit Gemini 3 Pro bei der Dokumentenanalyse. Der Quellcode und das Modell sind auf GitHub und Hugging Face verfügbar.
Qwen3-TTS: Offenes Sprachgenerationssystem für Designer und Entwickler
Qwen hat seine Qwen3-TTS-Familie als Open-Source-Lösung veröffentlicht. Das umfassende Sprachgenerationssystem bietet verschiedene Modellvarianten mit beeindruckenden Fähigkeiten: von natürlicher Sprachgestaltung (Voice Design) über 3-Sekunden-Stimmklonen bis zur kontrollierbaren Klangfarbenmanipulation. Die Suite umfasst Base-Modelle (1,7B und 0,6B) sowie spezialisierte Versionen wie CustomVoice mit neun vortrainierten Stimmvariationen in verschiedenen Sprachen.
Gemini 3 Flash mit neuer “Agentic Vision”-Fähigkeit für intelligente Bildanalyse
Google hat mit “Agentic Vision” eine innovative Funktion für Gemini 3 Flash vorgestellt, die visuelle Analysefähigkeiten auf ein neues Level hebt. Diese Technologie kombiniert visuelles Denkvermögen mit Code-Ausführung, um Antworten direkt auf Bildbeweisen zu basieren. Das KI-Modell kann dabei wie ein “kleiner Detektiv” arbeiten - es zoomen, zuschneiden, zählen und Bilder analysieren, indem es automatisch Python-Code generiert. Neben der Bildanalyse glänzt Gemini 3 Flash auch in den Bereichen Programmierung, Gaming und Deepfake-Erkennung.
Industrienachrichten
Yann LeCuns KI-Startup AMI zielt auf Healthcare ab
Yann LeCun gründet Advanced Machine Intelligence Labs (AMI) mit Fokus auf „World Models“ und strebt eine Finanzierung von rund 600 Millionen Dollar bei 3,5 Milliarden Valuation an. Als CEO holt er Alex LeBrun von Nabla, einem AI-Healthtech-Unternehmen für Arztgespräche-Transkription, der Healthcare als Priorität sieht, da Large Language Models dort ungenau sind und World Models bessere Präzision versprechen. Erste Partnerschaft mit Nabla; Produkte in circa einem Jahr erwartet.
Dario Amodei warnt vor Risiken leistungsstarker KI
Dario Amodei, CEO von Anthropic, hat einen bemerkenswerten 20.000-Wörter-Essay mit dem Titel “The Adolescence of Technology: Confronting and Overcoming the Risks of Powerful AI” veröffentlicht. Der Text befasst sich mit den Gefahren, die leistungsstarke KI für die nationale Sicherheit, Wirtschaft und Demokratie darstellen könnte. Bemerkenswert ist auch Amodeis persönliches Engagement: Alle Anthropic-Mitgründer haben zugesagt, 80% ihres Vermögens zu spenden. Der Essay beleuchtet potenzielle Risiken fortschrittlicher KI-Systeme und schlägt Wege vor, diese Herausforderungen zu bewältigen.
Europa plant Ausschluss von US-Tech aus kritischer Infrastruktur
Die Gesellschaft für Informatik warnt vor einer “digitalen Kolonialisierung” Europas durch US-Unternehmen und fordert einen strategischen Kurswechsel in der staatlichen IT-Strategie. Kritische Infrastrukturen wie Energie- und Gesundheitswesen sollen künftig keine US-Technologien mehr nutzen, um Abhängigkeiten zu reduzieren. Österreich könnte hier eine führende Rolle übernehmen. Diese Maßnahme wäre allerdings mit erheblichen Kosten und Herausforderungen verbunden. Die Diskussion reflektiert wachsende Bedenken bezüglich technologischer Abhängigkeiten und potenzieller Sicherheitsrisiken durch externe Kontrollelemente in europäischer Infrastruktur.
Zahlen, Studien, Wissenschaft
AlphaGenome: Googles KI-Durchbruch in der DNA-Analyse
DeepMind präsentiert in Nature AlphaGenome, ein KI-Modell, das bis zu einer Million Basenpaare lange DNA-Sequenzen analysiert und Tausende molekularer Signale wie Genexpression, Splicing, Chromatinzugänglichkeit und 3D-Struktur vorhersagt – mit Fokus auf Mensch und Maus. Es entschlüsselt Effekte nicht-codierender Mutationen, etwa bei Krebs oder seltenen Erkrankungen, und beschleunigt Diagnose sowie Forschung. Das Modell ist offen zugänglich via API, Code und Weights auf GitHub, um globale Wissenschaft voranzutreiben.
EDEN: Neue KI-Modelle für die Zukunft der personalisierten Medizin
Die EDEN-Modellfamilie mit bis zu 28 Milliarden Parametern verbessert die Entwicklung von Therapeutika erheblich. Trainiert auf 9,7 Billionen Nukleotid-Tokens erreicht das System bemerkenswerte Erfolge: 63,2% Trefferquote bei Rekombinasen zur Genintegration, 97% Wirksamkeit bei antimikrobiellen Peptiden gegen multiresistente Erreger und Design synthetischer Mikrobiome mit 99% taxonomischer Genauigkeit. Diese KI-Innovation öffnet neue Wege für programmierbare medizinische Lösungen.
ATLAS: Praktische Skalierungsgesetze für mehrsprachige KI-Modelle
Google Research stellt mit ATLAS (Adaptive Transfer Scaling Laws) die umfangreichste Studie zu mehrsprachigem Pretraining vor - 774 Experimente mit Modellen von 10M bis 8B Parametern über 400+ Sprachen. Die Autoren leiten präzise Skalierungsgesetze ab, die Modellgröße, Datensatzgröße und Sprachverteilungen vorhersagen und optimieren, um die „Curse of Multilinguality“ zu entschlüsseln. Ziel ist es, Entwicklern eine evidenzbasierte Roadmap für globale, nicht-englischzentrierte Modelle zu bieten, inklusive Transfermatrizen und Crossover-Punkten für Pretraining vs. Finetuning.
👉 Mitteilung von Google Research
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.








