Liebe KI-Enthusiasten,
herzlich willkommen zu einer neuen Ausgabe unseres KI-Newsletters, der Sie über die neuesten Entwicklungen und Innovationen in der Welt der künstlichen Intelligenz auf dem Laufenden hält.
Wichtigste Punkte heute
🚀 Meta präsentiert LLaMA 3, das neue Open-Source-Sprachmodell mit 8B, 70B und demächst auch 400B Parametern
🤖 X AI präsentiert Grok-1.5V, ein multimodales KI-Modell, das visuelle Informationen und deren Integration in komplexe Schlussfolgerungen ermöglicht.
💰 Microsoft investiert 1,5 Milliarden US-Dollar in G42 für AI-Entwicklung und globale Expansion stärkt Abu Dhabis Position als globales AI-Zentrum.
📹 Microsofts VASA-1 erzeugt lebensechte, gesprochene Video-Porträts in Echtzeit
Viel Spaß
Ihr
Martin Blaha
🔥 Gefällt Ihnen unser Newsletter? Unterstützen Sie unsere Arbeit, in dem Sie uns Ihren Freunden und Kollegen empfehlen:
Produktneuheiten
Meta präsentiert LLaMA 3 - Die neueste Open-Source-Sprachmodell-Innovation
Meta AI stellt LLaMA 3 vor, das neueste Open-Source-Sprachmodell der LLaMA-Serie. Aktuell sind die 8B und 70B Parameter Versionen verfügbar. Eine 400B Parameter Version befindet sich noch im Training. LLaMA 3 ist darauf ausgelegt, die Funktionalität zu erweitern, insbesondere in Bereichen wie Coding und komplexes Problemlösen, und baut auf den verbesserten Trainingsmethoden von LLaMA2 auf. Die ersten Banchmarks sehen sehr vielversprechend aus. Falls Sie LLaMA 3 selbst ausprobieren wollen, es gibt jetzt auch ein ChatGPT-ähnliches Interface:
https://www.meta.ai/
. Allerdings funktioniert der Zugang von Europa aus aktuell nur mit einem VPN (wählen Sie USA aus).
Grok-1.5V: Ein Meilenstein in der Multimodalität
Die Einführung von Grok-1.5 Vision markiert einen bedeutenden Fortschritt in der multimodalen KI. Das Open Source KI-Modell übertrifft seine Vorgänger in der Verarbeitung visueller Informationen und kann komplexe Schlussfolgerungen ziehen. Es ist in der Lage, Code aus Skizzen zu generieren, Kalorien aus Fotos von Lebensmitteln zu berechnen, Kinderzeichnungen in Gute-Nacht-Geschichten zu verwandeln und Internet-Memes zu erklären. x.AI plant, Grok-1.5V in den nächsten Monaten um weitere Modalitäten wie Bilder, Audio und Video zu erweitern.
Reka AI stellt das Multimodal-Sprachmodell Reka Core vor
Reka AI hat den fortschrittlichen Multimodal-Sprachmodell Reka Core vorgestellt, der mit führenden Modellen von OpenAI, Anthropic und Google in Schlüsselbewertungsmetriken konkurrenzfähig ist. Reka Core ist ein wichtiger Schritt, da es einer von nur zwei Anbietern von Modellen ist, die umfassende Multimodal-Eingabe unterstützen, einschließlich Bild, Video und Audio sowie Text. Das Modell ist in verschiedenen Branchen einsetzbar, darunter E-Commerce, Soziale Medien, Digitaler Inhalt und Videospiele, Gesundheitswesen und Robotik.
Industrienachrichten
Microsoft investiert 1,5 Milliarden US-Dollar in Abu Dhabis G42 für AI-Entwicklung und globale Expansion
Microsoft investiert 1,5 Milliarden US-Dollar in G42, ein führendes AI-Technologie-Holdingunternehmen mit Sitz in Abu Dhabi, um AI-Entwicklung und globale Expansion zu beschleunigen. Die Partnerschaft soll die Vorteile von sicheren AI-Technologien und Cloud-Fähigkeiten verantwortungsvoll mit wachsenden Volkswirtschaften weltweit teilen. Microsoft und G42 werden außerdem einen 1-Milliarden-Dollar-Fonds für Entwickler unterstützen. Diese Investitionen stärken Abu Dhabis Position als globales AI-Zentrum und fördern die digitale Transformation der UAE.
OpenAI Developers: Neue Updates für die Assistants API
OpenAI Developers haben eine Reihe von Updates für die Assistants API angekündigt, die eine neue Dateisuche-Funktion umfasst. Diese Funktion ermöglicht die Integration von Wissensabfragen und unterstützt bis zu 10.000 Dateien pro Assistent. Die neue Funktion wird durch neue vektorbasierte Speicherobjekte für automatisierte Dateiparser, -chunking und -eingebettung ermöglicht. Diese Updates zielen darauf ab, die Entwicklung von Softwareanwendungen mit OpenAIs leistungsstarken Modellen für Unternehmen erschwinglicher und effizienter zu gestalten.
Die Evolution des CFOs: Künstliche Intelligenz und die Zukunft der Finanzführung
Die Rolle des CFO in Banken wird durch KI und fortschrittliche Analytik neu definiert. CFOs werden zu "Chief Future Officers" mit strategischer Navigations- und Szenarioplanungsaufgaben. KI hilft CFOs, neue Geschäftsmodelle zu identifizieren und Wachstumsstrategien zu entwickeln, was eine agile Anpassung und interdisziplinäre Zusammenarbeit erfordert.
Bedeutung von Digitalisierung und KI für Unternehmen: Zehn innovative Ideen im Fokus
Die Bedeutung von Digitalisierung und KI für Unternehmen wird durch zehn innovative Ideen verdeutlicht. Dazu gehören die Nutzung von generativer KI, die Umgestaltung von Unternehmen hin zu einer digitalen Arbeitsweise und die Einführung eines individuellen KI-Assistenten für jeden Mitarbeiter. Zudem wird die Bedeutung von Next-Generation-Betriebsmodellen hervorgehoben, die signifikante Veränderungen in der Arbeitsweise von Unternehmen erfordern, wie die Digitalisierung von Arbeitsaufgaben und die Einführung von fortschrittlichen Analysen.
Veröffentlichungen und Ankündigungen
Microsofts VASA-1 erzeugt lebensechte, gesprochene Video-Porträts in Echtzeit
Das VASA-1-Projekt von Microsoft Research beschäftigt sich mit der Erzeugung von lebensechten, audio-gesteuerten Gesichtern in Echtzeit. Die Methode von VASA-1 erzielt die besten Ergebnisse auf allen evaluierten Metriken, einschließlich Audio-Lippen-Synchronisation, Posen-bezogenen Metriken und der Fréchet Video Distance (FVD). Die Methode kann Videos mit einer Größe von 512x512 Pixeln bei 45 fps in der Offline-Batch-Verarbeitung und bis zu 40 fps in der Online-Verarbeitung generieren. Und das auf Basis eines einzigen Bildes als Vorlage. Sehr überzeugend! Eine Veröffentlichung steht aktuell nicht an, da Microsoft zunächst sicherstellen will, dass diese Technologie nicht misbraucht werden kann.
Boston Dynamics stellt elektrischen Roboter Atlas vor
Boston Dynamics hat den hydraulischen Atlas in den Ruhestand verabschiedet und ein vollständig elektrisches Modell eingeführt, das für reale Anwendungen konzipiert ist. Der elektrische Atlas soll stärker und vielseitiger als seine Vorgänger sein, mit neuen Greifer-Optionen und fortschrittlichen AI- und Machine-Learning-Tools, einschließlich Verstärkungslernens und Computer Vision. Das Unternehmen arbeitet mit ausgewählten innovativen Kunden, darunter Hyundai, zusammen, um Atlas-Anwendungen in den nächsten Jahren zu testen und zu verbessern, und ist zuversichtlich, einen Roboter liefern zu können, der für langweilige, schmutzige und gefährliche Aufgaben in der realen Welt geeignet ist.
Zahlen, Studien, Wissenschaft
Ein Blick auf den Standford AI Index Report
Der AI Index Bericht 2024 ist die siebte Ausgabe, die sich auf wesentliche Trends in der KI konzentriert, einschließlich technischer Fortschritte, öffentlicher Wahrnehmung und geopolitischer Dynamiken. Er führt neue Schätzungen zu Kosten von KI-Trainings ein, enthält Analysen des Landschaftsbildes verantwortungsvoller KI und ein Kapitel über den Einfluss von KI auf Wissenschaft und Medizin. Der Stanford-Bericht hebt hervor, dass KI in einigen Bereichen die Leistung von Menschen übertrifft, aber auch die steigenden Kosten für die KI-Entwicklung kritisiert. Laut dem Bericht erzielen Unternehmen durchschnittlich einen ROI von 250% aus AI-Investitionen, aber andere Berichte zeigen niedrigere durchschnittliche Renditen oder diskutieren die Schwierigkeiten bei der Ermittlung des ROI. Die IDC-Umfrage ergab, dass 71% der Befragten angaben, dass ihre Unternehmen bereits AI einsetzen, und 22% planen, dies innerhalb der nächsten 12 Monate zu tun.
ChatGPT im wissenschaftlichen Review-Prozess
ChatGPT findet vermehrt Anwendung im wissenschaftlichen Review-Prozess. Eine Studie der Stanford University zeigt, dass ChatGPT zu einer signifikanten Zunahme bestimmter Adjektive in Peer-Reviews führt. Während ChatGPT im Bildungsbereich positive Auswirkungen hat, müssen ethische Aspekte wie Transparenz und Verantwortungsbewusstsein bei der Nutzung von KI-Tools berücksichtigt werden. Insgesamt birgt ChatGPT das Potenzial, Bildung und Forschung zu transformieren, erfordert jedoch eine reflektierte und ethisch verantwortungsvolle Anwendung.
Gentoo-Linux verbietet KI-generierten Code – Urheberrechte, Qualität und ethische Bedenken als Gründe
Der Open-Source-Distributor Gentoo-Linux verbietet ab sofort den Einsatz von KI-generiertem oder -assistiertem Code in seiner Linux-Distribution. Das siebenköpfige Gentoo-Council nennt hierfür drei Gründe: Probleme mit Urheberrechten, Qualitätsbedenken und ethische Fragen. Die Urheberrechtsproblematik entsteht durch die Verwendung urheberrechtlich geschützten Materials zur Schulung von Large Language Models (LLMs). Die Qualitätsbedenken resultieren daraus, dass LLMs zwar gut darin sind, plausibel aussehenden Blödsinn zu produzieren, aber nicht alle Nutzer in der Lage sind, dies zu erkennen. Die ethischen Bedenken betreffen die enorme Energieverschwendung, die Entlassung und Ausbeutung von IT-Arbeitern, die Produktion von Spam und Betrug sowie die Verunreinigung des Internets. Der Beschluss lässt offensichtlich viele Fragen offen und ist umstritten.
Fehlende KI-Strategie bremst KI-Einsatz in deutschen Unternehmen
Laut einer Bitkom-Studie ziehen 52 Prozent der deutschen Unternehmen den Einsatz von KI nicht einmal in Erwägung. Lediglich 15 Prozent nutzen KI bereits. Der Grund: Vielen Unternehmen fehlt eine KI-Strategie.
Ich wünsche Ihnen ein schönes Wochenende!
Prompt Well and Prosper!
Ihr
Martin Blaha
Das KI-Update ist eine wöchentliche Publikation, die von Martin Blaha (3pconsulting.net) produziert wird. Kontakt- und Geschäftsanfragen gerne über LinkedIn.