Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🤖 Anthropic: Claude 3.5 kann jetzt Computer wie Menschen bedienen
🎨 Midjourney kündigt eigenen Bildeditor für direkte Bearbeitung an
📰 OpenAI und Lenfest Institute fördern lokalen Journalismus mit KI
🔍 Google DeepMind macht KI-Text-Wasserzeichen Open Source
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Produktneuheiten
Anthropic stellt Claude 3.5 Sonnet und Haiku mit Computer-Nutzungsfähigkeiten vor
Anthropic hat die aktualisierten Modelle Claude 3.5 Sonnet und Claude 3.5 Haiku vorgestellt, die signifikante Verbesserungen in der Softwareentwicklung bieten. Besonders bemerkenswert ist die Einführung der Computer-Nutzung. Diese Funktion ermöglicht es Claude, den Cursor zu steuern, Klicks durchzuführen und Texteingaben zu machen, ähnlich wie Menschen es tun. Diese Entwicklung stellt einen bedeutenden Fortschritt dar, da sie eine Vielzahl neuer Anwendungen eröffnet. Trotz der Erfolge bleibt Claude in der Nutzung von Software noch hinter menschlichen Fähigkeiten zurück, erzielt jedoch mit 14,9% in Tests eine bessere Leistung als andere KI-Modelle.
👉 Die Mitteilung von Anthropic
👉 Die Mitteilung von Anthropic (Computer Nutzung)
Meta präsentiert neue KI-Modelle und Forschungsinitiativen
Meta's FAIR-Team hat mehrere neue KI-Modelle und Forschungsprojekte vorgestellt, darunter das Segment Anything Model 2.1, das die Segmentierung von Objekten in Bildern verbessert. Zudem wurde Meta Spirit LM eingeführt, ein multimodales Sprachmodell, das Text- und Sprachgenerierung nahtlos kombiniert. Layer Skip optimiert die Leistung großer Sprachmodelle durch beschleunigte Generationszeiten. Weitere Initiativen umfassen Sicherheitsforschung im Bereich der post-quanten Kryptographie mit SALSA und die Entwicklung von Meta Lingua, einer Plattform zur effizienten Modellentwicklung. Diese Fortschritte sollen die Forschungsgemeinschaft inspirieren und die Entwicklung verantwortungsbewusster KI fördern.
Elon Musks X.AI startet API für Grok-Entwicklung
Elon Musks Unternehmen X.AI hat eine API für Grok vorgestellt, die es Drittentwicklern ermöglicht, auf der KI-Plattform aufzubauen. Diese neue Schnittstelle soll die Integration von Grok in verschiedene Anwendungen erleichtern und die Entwicklung innovativer Lösungen fördern. Die API bietet Entwicklern Zugang zu den Funktionen von Grok, wodurch sie maßgeschneiderte Anwendungen erstellen können, die auf den fortschrittlichen KI-Technologien von X.AI basieren. Dies könnte die Nutzung von KI in verschiedenen Branchen erheblich erweitern.
Runway stellt Act-One vor: Neue KI-Funktion für realistische Gesichtsausdrücke in Animationen
Runway hat eine neue KI-Funktion namens Act-One eingeführt, die die Animation von Gesichtsausdrücken für KI-generierte Charaktere erheblich vereinfacht. Nutzer können einfach ein Video von sich oder einem Schauspieler aufnehmen, um Mimik und Mikroausdrücke zu erfassen, ohne auf komplexe Motion-Capture-Technologie angewiesen zu sein. Diese Funktion ermöglicht eine realistische Darstellung über verschiedene Kamerawinkel und eröffnet neue kreative Möglichkeiten in der Videoerstellung, sowohl für animierte als auch für lebende Charaktere. Act-One wird schrittweise für Nutzer des Gen-3 Alpha Modells verfügbar gemacht.
IBM präsentiert Granite 3.0: Leistungsstarke KI-Modelle für Unternehmen mit Fokus auf Transparenz und Sicherheit
IBM hat am 21. Oktober 2024 im Rahmen des TechXchange-Events die Granite 3.0 Modelle vorgestellt, die als die leistungsstärksten KI-Modelle des Unternehmens gelten. Diese Modelle bieten überlegene Leistung, Transparenz und Sicherheit und sind unter der Apache 2.0 Lizenz verfügbar. Die Modellfamilie umfasst verschiedene Varianten für allgemeine Zwecke sowie Sicherheitsmodelle (Granite Guardian), die Risiken in KI-Anwendungen überwachen. IBM betont, dass Unternehmen durch die Kombination der Granite-Modelle mit eigenen Daten signifikante Kosteneinsparungen erzielen können, während sie gleichzeitig hohe Leistungsstandards erreichen.
Stable Diffusion 3.5: Leistungsstarke Modelle für kreative Anwendungen
Stability AI hat Stable Diffusion 3.5 veröffentlicht, das mehrere anpassbare Modellvarianten umfasst, darunter Stable Diffusion 3.5 Large und Large Turbo. Diese Modelle sind für den Einsatz auf Consumer-Hardware optimiert und können kostenlos für kommerzielle Zwecke bis zu einem Jahresumsatz von 1 Million Dollar genutzt werden. Die Veröffentlichung zielt darauf ab, eine breite Palette von Benutzern, von Wissenschaftlern bis hin zu Startups, zu unterstützen. Am 29. Oktober wird zusätzlich das Modell Stable Diffusion 3.5 Medium verfügbar sein.
👉 Die Mitteilung von Stability AI
Genmo präsentiert Mochi 1: Ein Open-Source-KI-Modell zur Videogenerierung

Genmo hat Mochi 1, ein Open-Source-Modell zur Videogenerierung, vorgestellt. Mit 10 Milliarden Parametern setzt es neue Standards in der Qualität von Bewegung und der Einhaltung von Eingabeaufforderungen. Die aktuelle Version unterstützt 480p, während eine HD-Version mit 720p noch in diesem Jahr erwartet wird. Mochi 1 ist unter der Apache 2.0-Lizenz verfügbar, was Entwicklern und Forschern ermöglicht, das Modell zu nutzen und weiterzuentwickeln. Genmo zielt darauf ab, die Kluft zwischen KI-Generierung und Realität zu überbrücken und die Kreativität von KI zu fördern.
Der Midjourney-Editor kommt
Midjourney macht einen bedeutenden Schritt in Richtung kreativer Freiheit und kündigt die Integration eigener Bildbearbeitungswerkzeuge an. Diese neue Funktion ermöglicht es Nutzern, generierte Bilder direkt in einem separaten Bearbeitungsfenster zu modifizieren. Der Editor bietet fortschrittliche Werkzeuge wie Inpainting, Outpainting und präzise Maskenbearbeitung. Benutzer können nun ihre Kreationen verfeinern, Bereiche neu generieren und nahtlose Erweiterungen vornehmen. Diese Innovation verbessert den kreativen Workflow erheblich und eröffnet neue Möglichkeiten für digitale Künstler und Designer. Besonders interessant ist die Möglichkeit, die bearbeiteten Bilder als neue Ausgangsbasis für weitere KI-Generationen zu nutzen.
👉 Pressemitteilung von Midjourney
Industrienachrichten
Zusammenarbeit zwischen OpenAI und dem Lenfest Institute zur Stärkung des lokalen Journalismus
Die Lenfest Institute AI Collaborative und Fellowship-Programm wurde ins Leben gerufen, um lokalen Nachrichtenorganisationen durch KI-Technologien nachhaltige Geschäftsmodelle zu ermöglichen. Fünf Medienhäuser erhalten Fördermittel, um AI-Stipendiaten einzustellen, die Projekte zur Verbesserung der Geschäftsnachhaltigkeit und zur Implementierung von KI in ihren Redaktionen durchführen. OpenAI und Microsoft unterstützen das Programm mit insgesamt bis zu 10 Millionen Dollar. Ziel ist es, innovative Lösungen zu entwickeln, die die Rolle des Journalismus stärken und neue Einnahmequellen erschließen.
Google DeepMind macht KI-Text-Wasserzeichen Open Source
Google DeepMind hat das Tool SynthID entwickelt, um KI-generierte Texte zu identifizieren, und stellt es nun als Open Source zur Verfügung. SynthID fügt unsichtbare Wasserzeichen in den Text ein, um die Herkunft zu kennzeichnen und so gegen Fehlinformationen vorzugehen. In umfangreichen Tests zeigte sich, dass die Qualität der generierten Texte nicht beeinträchtigt wird. Die Open-Source-Verfügbarkeit ermöglicht es Entwicklern, diese Technologie in ihre eigenen Modelle zu integrieren, was die Sicherheit und Transparenz im Umgang mit KI verbessert. Experten betonen jedoch, dass Wasserzeichen allein nicht ausreichen und zusätzliche Sicherheitsmaßnahmen erforderlich sind.
👉 Artikel bei Technology Review
Europäisches Parlament verbessert Archivzugang mit KI
Das Europäische Parlament hat mit „Archibot“, einem KI-gestützten Tool, das auf Claude basiert, den Zugang zu seinen umfangreichen Archiven optimiert. Nutzer können nun in über 2,1 Millionen Dokumenten schneller und effizienter suchen, was die Suchzeit um 80 % reduziert und die Nutzerzufriedenheit um etwa 60 % steigert. Archibot ermöglicht eine globale, mehrsprachige Recherche und fördert Transparenz in der EU-Governance. Die Integration von generativer KI wird als erster Schritt gesehen, um legislative Prozesse zu verbessern und den Bürgern einen besseren Zugang zu Informationen zu bieten.
👉 Die Mitteilung von Anthropic
Zahlen, Studien, Wissenschaft
KI als Schlüssel zur Tierkommunikation: Chancen und Herausforderungen
Die Earth Species Project (ESP) nutzt KI, um die Kommunikation von Tieren zu entschlüsseln, was unser Verhältnis zur Natur verändern könnte. Wissenschaftler haben bereits herausgefunden, dass Elefanten einzigartige Namen verwenden und Wale vokalisieren ähnlich wie Menschen sprechen. Doch diese Fortschritte werfen auch ethische Fragen auf: Wie beeinflusst das Aufzeichnen von Tiergeräuschen ihr Verhalten? Kritiker warnen vor möglichen Schäden durch Missverständnisse. Die Forschung könnte jedoch auch Tierschutzfälle stärken, indem sie das Leiden von Tieren besser dokumentiert und damit deren rechtlichen Schutz verbessert.
KI und der Arbeitsmarkt: Eine neue Ära der Jobveränderungen
Generative Künstliche Intelligenz, wie ChatGPT, wird in entwickelten Ländern nahezu jeden zweiten Arbeitsplatz beeinflussen. Eine Untersuchung der Job-Plattform Indeed zeigt, dass die KI-Betroffenheit bereits zu einem signifikanten Rückgang der Stellenangebote führt. Forscher analysierten 280 Fähigkeiten aus Stellenanzeigen und stellten fest, dass KI-Systeme wie OpenAI's GPT-4 viele dieser Fähigkeiten bereits beherrschen. Dies deutet auf tiefgreifende Veränderungen im Arbeitsmarkt hin, die sowohl Chancen als auch Herausforderungen mit sich bringen.
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.