Liebe Leserinnen und Leser,
das Jahr 2023 hat gute Chancen als das Jahr 1 nach KI-Ankunft bezeichnet zu werden. Seit der Vorstellung von ChatGPT 3.5 von OpenAI im November 2022 waren wir Zeugen einer rasanten Entwicklung der KI-Technologie und vor allem ihrer Verbreitung.
Lassen Sie uns heute die Geschehnisse des letzten Jahres Revue passieren lassen und auf die wesentlichen KI-Meilensteine des Jahres 2023 zurückblicken.
Die wichtigsten Entwicklungen für Sie zusammengefasst:
Happy Birthday ChatGPT: 100 Millionen monatlich aktive Nutzer
Der Platzhirsch unter den Generativen KIs, ChatGPT, feiert sein einjähriges Bestehen und konnte bereits zwei Monaten nach der Einführung beeindruckenden 100 Millionen monatlich aktiven Nutzern vorzeigen, was es zu der am schnellsten wachsenden App machte. Weitere Meilensteine:
Einführung von GPT-4 im Rahmen des ChatGPT Plus Abos
Vorstellung von Custom GPTs, die als individuell trainierte Chatbots, spezielle Aufgaben übernehmen können. Der angekündigte GPT-Store wurde jedoch auf 2024 verschoben.
Vorstellung der ChatGPT App (zunächst für Android, später auch für iPhone).
ChatGPT-4 V wurde im September multimodal: es kann jetzt Bilder interpretieren und mittels DALL-E 3 auch erstellen. Die Integration von Spracherkennung und -Ausgabe in die mobile App ermöglicht ein “richtiges Gespräch” mit der KI von OpenAI.
Die Zusammenarbeit mit dem Partner Microsoft, der sich Anfang des Jahres mit 10 Mrd. USD an OpenAI beteiligte und nun 49% an OpenAI hält, wurde weiter ausgebaut. Dies führte in Folge zu einem Feature-Feuerwerk auf der Microsoft-Seite, da das Unternehmen KI-Funktionalitäten in vielen der eigenen Produkte integrierte.
Die Turbulenzen um Sam Altman, den CEO bei OpenAI, der zunächst abberufen und dann nach 5 Tagen als CEO wieder eingesetzt wurde, haben jedoch auch viel Verwirrung und Spekulationen ausgelöst. Bis heute ist nicht klar, was diese Ereignisse verursachte.
Im Dezember wurde bekannt, dass New York Times OpenAI und Microsoft wegen Verletzung der Copyright-Rechte verklagt hat. Es geht um den Vorwurf, nicht lizenzierte Texte zum KI-Training verwendet zu haben.
Kommerzielle Wettbewerber zogen nach - konnten GPT-4 bis jetzt aber nicht schlagen
Microsoft rollt KI-Unterstützung aus
In mehreren Schritten hat Microsoft sein Produktangebot um KI-Funktionalitäten erweitert (Copilots) und setzt somit auf die Integration von KI in eigene Produkten. Aktuell besteht das Angebot aus:
Copilot - “Ihr täglicher KI-Begleiter”
KI-gesteuerte Suche mit Bing, Edge und in Windows
Copilots in Teams, Outlook, Word, Excel und PowerPoint, sowie in Designer
Für Entwickler wurde u.a. Copilot Studio und Copilot for Azure, Azure KI Studio vorgestellt
Im Dezember hat Microsoft Phi-2, ein Small Language Model vorgestellt. Dieses Forschungsprojekt zielt darauf ab, viel kleinere KI-Modelle zu entwickeln, die aber mit Modellen vergleichbarer Leistung mithalten können.
Gemini von Google
Google stellt mit Gemini sein bisher größtes KI-Modell vor, das eine echte Konkurrenz für GPT-4 darstellen soll. Aktuelle Tests zeigen allerdings, dass es sicher eher um einen GPT-3.5 Konkurrenten handelt. Das Video, was Google zur Vorstellung des neuen KI-Modells präsentierte, sorgte für viel Begeisterung. Allerdings war der vermittelte Eindruck einer fließenden Kommunikation mit dem Model das Resultat einer zusammengeschnittenen Produktion, was im Netz für viel Aufregung (und auch Enttäuschung) sorgte. Google Gemini gibt es in drei Varianten: Ultra, Pro und Nano.
Google plant, Gemini ab 2024 in seiner Google Workspace Produktreihe zu integrieren.
Grok von X / Twitter
Erst im April wurde xAI von Elon Musk gegründet, 6 Monate später folgte die Vorstellung von Grok, dem KI-Model von xAI. Grok wird nur für Premium+ Abonnenten von X & Twitter verfügbar sein und reicht in etwa an GPT-3.5 heran.
Q von Amazon
Amazon stellte im November seinen KI-Chatbot vor, der in das Amazon-Ecosystem inkl. AWS integriert ist.
Claude von Antropic
Das KI-Model wurde im Laufe des Jahres auf 2.1 aktualisiert und kann jetzt mit Dokumenten mit bis zu 150,000 Wörtern (etwa 500 Seiten) umgehen. Damit können Anwender die komplette technische Dokumentation oder Code-Basis hochladen und durch Claude auswerten, verbessern etc. lassen. Claude wird via API von vielen namenhaften Unternehmen wie Slack, Notion, Quora oder Zoom in ihren Produkten eingesetzt.
Perplexity
Perplexity geht einen anderen Weg und ermöglicht Recherchen ähnlich wie bei Suchmaschinen - mit Quellennachweisen. Darüber hinaus ermöglicht es zahlenden Nutzern bei ihren Chat-Sessions die Auswahl diverser KI-Modelle wie GPT-4, Gemini, Claude 2.1 oder Mistral. Somit positioniert sich Perplexity eher wie ein generisches KI-Werkzeug.
Open Source Modelle lassen hoffen, liegen aber ebenfalls noch zurück
Das Jahr 2023 war ebenso ein gutes Jahr für die Open Source KI-Gemeinde. Folgende Meilensteine sind besonders erwähnenswert:
Vorstellung von Llama 2 (Large Language Model von Meta)
Vorstellung von Mistral 7 und 8 (Large Language Model von Mistral, einem französischen Startup, das auf Grund der Serie-A Finanzierung mit 2 Mrd. USD bewertet wird)
Stable Diffusion XL (Text-to-Image Model von Stability)
Diese Entwicklung lässt hoffen, dass sich Open Source KI-Modelle zu einem ernsthaften Gegenspieler von proprietären KI-Modellen der Big Tech entwickeln werden. Das wird für einen größeren Wettbewerb am Markt sorgen, wovon wir alle profitieren sollten.
KI-Regulierung ist weltweit auf dem Vormarsch
Die Executive Order von President Biden (USA)
The Executive order des White House wurde im Oktober veröffentlicht. Die Anordnung legt eine Reihe von Maßnahmen fest, die von verschiedenen Bundesbehörden durchgeführt werden sollen, um die potenziellen Vorteile und Risiken von KI zu bewerten und zu mindern, insbesondere in den Bereichen Sicherheit, nationale Sicherheit, kritische Infrastruktur, biologische Waffen, synthetischer Inhalt und Datenschutz.
Die EU einigt sich an Regulierung für Künstliche Intelligenz (EU AI Act)
Die EU hat den AI Act verabschiedet, der eine risikobasierte Herangehensweise, Transparenzanforderungen und spezifische Regeln für unterschiedliche Unternehmen vorsieht.
Es gab sehr viele Produktneuheiten, hier die wichtigsten
Midjourney
Midjourney, der Marktführer bei Bildgenerierenden (Text-to-Image) KI-Modellen, hat im Jahr 2023 eine beeindruckende Entwicklung hingelegt. Das neueste Modell V6 erleichtert das Prompting, verbessert weiter die Bildqualität und kann nun deutlich besser Text in Bildern einbinden.
Leonardo
Mit Leonardo können Sie entweder Ihre eigenen KI-Modelle trainieren oder auf bereits trainierte KI-Modelle zurückgreifen, um Bilder oder andere künstlerische Werke zu kreieren. Leonardo legt den Fokus auf granulare Kontrolle während des gesamten kreativen Prozesses und fördert das menschliche kreative Potenzial. Die Funktionalität von Leonardo wurde das ganze Jahr über kontinuierlich verbesserst.
Adobe Firefly
Im März hatte Adobe sein bildgenerierende Software Adobe Firefly vorgestellt. Laut Adobe “bietet es neue Möglichkeiten zur Ideenfindung, Kreation und Kommunikation und verbessert gleichzeitig die kreativen Arbeitsabläufe mithilfe generativer KI erheblich und ist so konzipiert, dass es für die kommerzielle Nutzung sicher ist.” Alle Fans von Adobe Produkten sollten es unbedingt testen, da es auch andere Adobe Produkte (wie z.B. Photoshop) integriert ist.
Runway
Runway ist eine Text/Image-to-Video Anwendung. Damit lassen sich kurze Videos erstellen. Die Qualität von den erzeugten Videos hat sich in diesem Jahr enorm verbessert. Wenn Sie Canva nutzen, können Sie Runway innerhalb der Anwendung nutzen (wählen Sie dazu die App Magic Media und dann Video).
Pika
Ähnlich wie Runway ist Pika eine neue Anwendung zum Generieren von Videos. Die Text/Image-to-Video Technologie erlebt, ähnlich wie die KI-gestützte Bilderzeugung, eine unglaublich schnelle Verbesserung und hat somit das Potenzial das Film-Geschäft komplett auf den Kopf zu stellen. Auch deswegen kam es in Hollywood zum (längsten) Streit von Schauspielern (Writers Guild of America, SAG-AFTRA), was den Einsatz von KI in Filmen und Streaming-Angeboten angeht.
Heygen
Heygen veröffentlichte im August die Version 2 von ihrem Avatar Clone. Mit Heygen erstellen Sie Videos in Studioqualität mit KI-generierten Avataren und Stimmen. Damit lassen sich Training- und Schulungsvideos künftig wesentlich einfacher und schneller produzieren.
Ist das alles?
Nein. Beim weiten nicht.
In den USA ging 2023 jeder vierte Venture Capital Dollar in KI-Unternehmen (entspricht 23 Mrd. USD VC in 2023)
Nvidia hat dank dem blühenden KI-Geschäft seine Marktposition als Lieferant von KI-Chips ausgebaut und den Aktienkurs mit 250% mehr als verdoppelt.
Apple will KI in alle seine Produkte einbauen.
In der Forschung hat KI geholfen neue Materialen zu entdecken, neue strukturelle Klassen von Antibiotika zu entdecken und vieles mehr.
…
Wie geht es im Jahr 2024 weiter?
Jede Vorhersage ist schwer. Nichtsdestotrotz möchte ich ein Paar Punkte, die ich sehe, herausstellen:
Wir werden KI in immer mehr Produkten des Alltags sehen (siehe z.B. bei Microsoft und Google, Apple, SAP).
Während Ende 2023 noch ~70% der Leute in Deutschland nicht oder nicht wirklich mit ChatGPT & Co arbeiten, wird sich dieses Verhältnis dadurch in 2024 ändern.
Software-Entwicklung mit Hilfe der KI wird zur Normalität im Alltag werden.
Der Einzug der KI in den Unternehmensalltag wird für Produktivitätssteigerungen sorgen, aber vermutlich auch Kündigungen mit sich bringen.
OpenAI wird GPT-5, den Nachfolger von GPT-4V vorstellen und wird uns einmal mehr wieder verblüffen.
Die AGI (Artificial General Intelligence) liegt allerdings noch weiter in ferner Zukunft.
Open Source KI-Modelle könnten zu den kommerziellen hinsichtlich ihrer Ausgabe-Qualität aufstoßen.
Mistral, LLama und weitere Meta KI-Modelle sind in der Pool-Position.
Mal sehen, was Aleph Alpha, das Heidelberger Unternehmen, das erst im November in der Serie-B mit über €500 Mill. ausgestattet wurde, im Jahr 2024 vorstellt. Ich tippe auf die Zusammenarbeit mit dem Mittelstand und den Großen.
Wir werden wahrscheinlich noch mehr Gerichtsverfahren wegen Copyright-Verstößen sehen, die dazu hoffentlich führen werden, dass es mehr Transparenz bzgl. des Ursprungs von KI-Trainingsdaten geben wird.
KI wird in der Forschung für weitere Entdeckungen sorgen.
Die Entwicklung verspricht, spannend zu bleiben.
Was sind Ihre Einschätzungen?
Ich freue mich auf Ihre Kommentare.
Alles Gute und einen guten Rutsch ins Neue Jahr!
Feier Sie schön, bleiben Sie mir gewogen und wir sehen uns dann wieder im Januar 2024!
Prompt Well and Prosper!
Ihr
Martin Blaha