Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🧠 Kontext-Engineering: Anthropic zeigt die nächste Evolutionsstufe nach Prompt-Engineering
🤝 AMD & OpenAI: Strategische Partnerschaft für 6 Gigawatt AI-GPUs bis 2026
💼 Gemini Enterprise: Googles umfassende KI-Plattform für den Arbeitsplatz
🔍 Indeed-Studie: KI kann 41% aller Job-Fähigkeiten teilweise übernehmen
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Produktneuheiten
Google DeepMind präsentiert Gemini 2.5 Computer Use Modell – KI steuert Benutzeroberflächen wie ein Mensch
Google DeepMind veröffentlicht das Gemini 2.5 Computer Use Modell, eine spezialisierte KI, die basierend auf Gemini 2.5 Pro direkt mit grafischen Benutzeroberflächen (Web und Mobile) interagiert. Entwickelt für automatisches Klicken, Tippen und Scrollen, übertrifft es führende Modelle bei Genauigkeit und Geschwindigkeit. Die KI agiert in Schleifen, nimmt Screenshots und User-Anfragen auf und steuert die UI in Echtzeit mit Sicherheitsmechanismen, die Fehlbedienungen und Missbrauch verhindern. Erprobt wird es schon in UI-Tests und Workflow-Automationen, zugänglich über die Gemini API in Google AI Studio und Vertex AI.
Qwen3-VL: Multimodale KI mit scharfer Wahrnehmung und tiefer Logik
Der neu lancierte Qwen3-VL ist das derzeit stärkste Vision-Sprachmodell aus der Qwen-Familie und bietet erhebliche Fortschritte in Textverständnis, visueller Wahrnehmung, räumlicher Erfassung und langem Kontext bis zu 1 Million Tokens. Neben multimodalem Denken und präzisem multilinguale OCR unterstützt es visuelle Agentenfähigkeiten, visuellen Code, komplexes räumliches und zeitliches Verständnis sowie fortgeschrittene STEM-Reasoning-Aufgaben. Qwen3-VL erreicht Spitzenleistungen gegen große geschlossene Modelle, ist quelloffen und betont das Ziel, KI von bloßer Wahrnehmung zu echtem Verstehen, logischem Denken und Handlung zu bringen.
Veröffentlichungen und Ankündigungen
OpenAI bringt mit AgentKit neue Werkzeuge für KI-Agenten-Entwicklung
OpenAI hat AgentKit vorgestellt, ein umfassendes Toolkit für Entwickler zur visuellen Gestaltung, schnellen Bereitstellung und Optimierung von KI-Agenten. Das Herzstück, der Agent Builder, ermöglicht das Drag-and-Drop-Erstellen komplexer Agenten-Workflows ohne Programmieraufwand. Ergänzt wird das Kit durch eine Connector Registry zur zentralen Verwaltung von Datenanbindungen und ChatKit, mit dem sich chatbasierte Agenten direkt in Anwendungen einbinden lassen. Neue Evaluierungs- und Fine-Tuning-Features verbessern die Leistung und Sicherheit der Agenten. AgentKit erleichtert damit deutlich und beschleunigt die Entwicklung produktionsreifer KI-Agenten.
Gemini Enterprise: Googles neue KI-Plattform für den Arbeitsplatz
Sundar Pichai stellte auf dem “Gemini at Work”-Event Gemini Enterprise vor, eine umfassende KI-Plattform, die Google AI in jeden Arbeitsablauf integrieren soll. Gemini Enterprise verbindet Firmendaten, Tools und Mitarbeiter sicher an einem Ort und geht weit über einfache Chatbots hinaus. Nutzer können mit Unternehmensdokumenten und -daten interagieren sowie KI-Agenten erstellen und einsetzen. Beispiele erfolgreicher Anwendungen sind HCA Healthcare, das durch automatisierte Pflegeübergaben Millionen Stunden sparen will, und Best Buy mit deutlich verbesserter Kundenserviceeffizienz. Diese Plattform markiert für Google den nächsten großen Schritt in der KI-unterstützten Arbeit.
KI-Browser Comet von Perplexity jetzt kostenlos und uneingeschränkt verfügbar
Perplexity hat seinen KI-gestützten Browser Comet seit dem 7. Oktober 2025 für alle Nutzer kostenfrei freigegeben. Zuvor war Comet nur zahlenden Max-Tarif-Abonnenten zugänglich. Der auf Chromium basierende Browser integriert Perplexitys KI-Agenten tief in die Nutzererfahrung und kann komplexe Aufgaben wie Online-Buchungen oder das Verwalten von E-Mails und Kalendern eigenständig erledigen. Nutzer können Comet mit Diensten wie Google, Outlook, Dropbox und WhatsApp verbinden. Perplexity plant, Verlage finanziell zu beteiligen, wenn deren Inhalte in der KI-Suche verwendet werden, was aktuell auch rechtliche Auseinandersetzungen provoziert. Mobilversionen folgen noch.
Speech-to-Retrieval (S2R) – Die neue Art der Sprachsuche ohne Textumwandlung
Google präsentiert Speech-to-Retrieval (S2R), eine innovative Technologie, die direkt aus gesprochener Sprache das Informationsziel erkennt, ohne erst in Text umzuwandeln. Damit werden typische Fehler der automatischen Spracherkennung vermieden, die Suchergebnisse verbessern sich deutlich. Durch eine duale Encoder-Architektur verwandelt S2R Audio- und Dokumenteninhalte in vergleichbare Vektoren, um relevante Treffer direkt zu ermitteln. Der begleitend veröffentlichte Multisprachen-Datensatz Simple Voice Questions (SVQ) unterstützt die Forschung. S2R ist bereits in mehreren Sprachen im Einsatz und sorgt für präzisere Spracherlebnisse.
Industrienachrichten
Effektives Kontext-Engineering für KI-Agenten: Die nächste Evolutionsstufe nach Prompt-Engineering
Die Autoren von Anthropic beschreiben in ihrem Beitrag den Wandel von Prompt- zu Kontext-Engineering bei der Arbeit mit großen Sprachmodellen (LLMs). Kontext-Engineering geht über das Schreiben optimaler Eingabeaufforderungen hinaus und fokussiert sich darauf, die richtigen Informationsfragmente (Tokens) im begrenzten “Aufmerksamkeitsbudget” der Modelle zu kuratieren, um gewünschte Verhaltensweisen zu erzielen. Schlüsseltechniken sind klare System-Prompts, effiziente Tool-Nutzung, gezielte Beispiele sowie dynamische Kontext-Abrufe „just in time“. Für langanhaltende Aufgaben empfehlen sie Methoden wie Kompaktion (Kontextzusammenfassung), strukturierte Notizen und Sub-Agenten-Architekturen, um Kontextlimitierungen zu überwinden. Kontext-Engineering ist eine fundamentale Entwicklung, um leistungsfähige, flexible KI-Agenten auf Basis moderner LLMs zu realisieren.
AMD und OpenAI schließen strategische Partnerschaft für 6 Gigawatt AI-GPUs
AMD und OpenAI gaben ein mehrjähriges Abkommen bekannt, bei dem OpenAI 6 Gigawatt AMD Instinct GPUs für seine KI-Infrastruktur einsetzen wird, beginnend mit 1 Gigawatt der MI450-Serie in der zweiten Jahreshälfte 2026. Die Partnerschaft umfasst die gemeinsame Produktoptimierung und technische Zusammenarbeit über mehrere Hardware-Generationen hinweg. AMD gewährt OpenAI zudem bis zu 160 Millionen Aktienoptionen, deren Ausübung von Meilensteinen und Kurszielen abhängt. Die Vereinbarung soll für AMD Einnahmen in Milliardenhöhe generieren und beschleunigt den Ausbau der globalen KI-Rechenkapazität erheblich. Der Aktienkurs von AMD reagierte mit einem Anstieg von über 35%.
Zahlen, Studien, Wissenschaft
Studie zeigt: KI kann jeden vierten Job zum Teil übernehmen
Eine aktuelle Studie der Jobplattform Indeed zeigt, dass 41 Prozent der in Stellenanzeigen geforderten Fähigkeiten ganz oder teilweise durch Künstliche Intelligenz übernommen werden können. Besonders betroffen sind Tätigkeiten in der Softwareentwicklung, Datenanalyse und Buchhaltung, wo 26 Prozent der Jobs bereits stark von KI geprägt sind. Körpernahe Berufe wie Pflege bleiben weitgehend unbeeinflusst. Nur ein Prozent der Fähigkeiten ist vollständig automatisierbar, meist eng begrenzte Routinen. Menschen bleiben in diesen Rollen wichtig für die Überwachung und Koordination der KI. Die Studie basiert auf US-Daten, ist aber gut auf Deutschland übertragbar und warnt vor Risiken für Wohlstand und Wettbewerbsfähigkeit durch den leichteren globalen Wissenszugang.
👉 Artikel bei FAZ | 👉 Beitrag von Prof. Holger Schmidt auf LinkedIn
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.