Chatbots sind der heißeste Trend im Internet aktuell. Täglich werden neue Modelle, Applikationen und auch dazugehörige Sprachmodelle von den Top Tech-Giants auf den Markt geworfen. Deshalb vergleichen wir in diesem Blogbeitrag die derzeit Top 3 der Next Level AI Chatbots und ihre Large Language Modells.
OpenAI mit ChatGPT hat die Büchse der Pandorra eröffnet – Google, Meta & Co. feuern mittlerweile aus allen Rohren, um diesen „Next River of Revenue“ nicht zu verpassen. Um die derzeit auf dem Markt befindlichen Modelle, Applikationen und Tools jedoch vergleichen zu können, sollte man erst einmal einen Blick auf die dahinter liegenden LLMs (Large Language Modells) werfen.
Doch was sind LLMs eigentlich?
Ein "Large Language Model" (LLM) ist ein leistungsstarkes sprachliches Modell, das entwickelt wurde, um menschenähnlichen Text zu generieren und natürliche Sprache zu verstehen. Es basiert auf künstlicher Intelligenz und maschinellem Lernen und wird in der Regel mit großen Mengen an Textdaten trainiert. Ein LLM kann kontextbezogene Aufgaben wie Textgenerierung, Übersetzung, Textzusammenfassung, Fragen beantworten und mehr durchführen. Es kann auch als Konversationspartner agieren und aufgrund des kontextuellen Verständnisses der eingegebenen Sätze angemessene Antworten generieren.
Ein bekanntes Beispiel für ein LLM ist GPT-3 (Generative Pre-trained Transformer 3), das von OpenAI entwickelt wurde. Es wurde mit einer großen Menge an Textdaten trainiert und kann dadurch eine beeindruckende Fähigkeit zur Verarbeitung und Generierung von Text demonstrieren.
Solche Sprachmodelle sind deshalb sehr komplex und groß, weil sie eine enorme Anzahl an Parametern oder Gewichtungen enthalten. Die Anzahl der Parameter ist ein Maß dafür, wie viele Informationen das Modell während des Trainings gelernt hat und wie umfangreich seine Fähigkeit zur Textgenerierung ist. Die Größe eines LLMs wird oft in Millionen oder sogar Milliarden von Parametern gemessen. Beispielsweise hat GPT-4 ca. 100 Billion, Google´s Bard ca. 540 Billion und Cohere ca. 52 Billionen Parameter. Diese große Anzahl von Parametern ermöglicht es den Modellen, ein umfangreiches Wissen über Sprache und Text zu entwickeln und komplexere Aufgaben zu bewältigen. Das wiederum ist zwar beeindruckend, aber trotzdem versteht eine künstliche Intelligenz Inhalte nicht so, wie Menschen solche Inhalte erfassen. Die Sprachmodelle haben keine Überzeugungen, Emotionen oder Wünsche, und jede Ausgabe, die sie erzeugen, ist lediglich das Ergebnis eines statistischen Musters, das sie beim Training gelernt haben. Das Training und die Verwendung großer LLMs erfordern deshalb erhebliche Rechenressourcen und Speicherplatz. Es braucht leistungsstarke Computerinfrastrukturen und erhebliche Trainingszeiten. Daher sind sie oft auf Unternehmen und Organisationen mit entsprechenden Ressourcen beschränkt. Die Top 3 im Rennen um den „besten“ künstlichen Gesprächspartner kommen derzeit aus den Unternehmen Open AI, Google und Cohere. Werfen wir also einen Blick auf diese drei Musketiere der digitalen Zukunft.
ChatGPT von OpenAI
ChatGPT ist ein spezielles Large Language Model (LLM), das auf der GPT-4-Architektur basiert. Es wurde entwickelt, um menschenähnlichen Text in einer Konversationsumgebung zu generieren und auf Fragen, Anfragen und Anweisungen zu reagieren. Es verfügt über ein kontextuelles Verständnis von Sprache und kann aufgrund seines Trainings große Mengen an Wissen und Informationen abrufen. ChatGPT ist darauf spezialisiert, Informationen zu liefern, Fragen zu beantworten, Anleitungen zu geben und bei verschiedenen Themen zu unterstützen. Populär wurde ChatGPT, weil man es für Small Talk und allgemeine Konversationen verwenden kann und dabei verblüffende Antworten generiert. Ausserdem kann ChatGPT sehr gut Umgangssprache übersetzen. So z.B. in juristische Schriftsätze, Verträge, Geschäftskorrespondenz oder auch Programmiercode.
Soziale und wirtschaftliche Auswirkungen von ChatGPT
Die Einführung von ChatGPT hat zu einer breiten Diskussion geführt, die konventionelle Normen in Frage stellen und die Schnittstellen der Mensch-Maschine-Interaktion neu definieren. Die Gesellschaft profitiert enorm von dieser Technologie, da sie den Zugang zu Informationen demokratisiert und geografische und sozioökonomische Grenzen überwindet. Sie ist ein Hilfsmittel für den Einzelnen, das die Bildung unterstützt, indem es detaillierte Erklärungen zu komplexen Themen liefert. Sie könnte ein wertvoller Helfer für Menschen mit Behinderungen sein, der ihnen den Zugang zu digitalen Plattformen erleichtert. Diese Vorteile sind jedoch auch mit Herausforderungen verbunden. Large Language Models werden in einigen Bereichen menschliche Arbeitskräfte ersetzen, insbesondere in Aufgaben, die auf Sprachverständnis und -generierung basieren. Dies wird zu Veränderungen auf dem Arbeitsmarkt führen und möglicherweise zu Arbeitsplatzverlusten in bestimmten Bereichen führen. Wenn ChatGPT zum Beispiel in bestimmten Kontexten wie Kundenservice oder medizinischer Beratung eingesetzt wird, müssen klare Richtlinien für den Einsatz und eine angemessene Überwachung vorhanden sein. Es ist wichtig, dass die Nutzung von LLMs transparent und ethisch verantwortungsvoll erfolgt, denn das Potenzial für Missbrauch, wie die massive Erstellung von Fake-News erfordert einen sorgfältigen Umgang. Mit der zunehmenden Integration von KI in die Gesellschaft werden deshalb auch Fragen des Datenschutzes und der Sicherheit immer wichtiger. Diese Bedenken mit den potenziellen Vorteilen von ChatGPT in Einklang zu bringen, ist eine wichtige Aufgabe für Entwickler, Regulierungsbehörden und zahlreiche NGOs.
Wirtschaftlich gesehen ist ChatGPT auf die Menge an Informationen beschränkt, die von OpenAI in das System eingespeist werden. Der Einsatz von ChatGPT dient im Allgemeinen der Verbesserung Ihrer betrieblichen Arbeitsabläufe, z. B. der Automatisierung von Texterstellungsaufgaben, der Produktion von Inhalten, der allgemeinen Beantwortung von E-Mails usw.. ChatGPT ist dabei lediglich eine Vorlage für den Einstieg in die Automation. Finetuning und „trained Modells“ sind nötig, um exakt die Aufgaben zu erledigen, die unternehmensindividuell nötig sind. Solche Finetunings jedoch erfordern weitere Informationen über die Anpassung von Parametern, die Sammlung von Daten, Schulungen und vor allem die Programmierung mit der OpenAI-Plattform.
Cohere
Cohere wurde von ehemaligen Google-Brain Entwicklern gegründet und baut semantische Suchen für Podcast-Plattformen und andere LLM-gestützten Architekturen für Unternehmen. Das Besondere dabei: Kunden sind nicht an eine Cloud gebunden und die Benutzeroberfläche ist so intuitiv einfach, dass sie nicht nur den Zugang zu fortgeschrittenen NLP-Modellen erleichtert, sondern auch eine Umgebung zum Lernen und Erforschen fördert. Dieses Engagement für die Demokratisierung der NLP-Technologie ist ein Beleg für die Vision von Cohere AI, KI für alle zugänglich zu machen, unabhängig von den Kenntnissen im Bereich maschinelles Lernen.
Wirtschaftlich gesehen ist Cohere mit seiner Verfügbarkeit auf dem Amazon Marketplace einfach zu integrieren. Eines der herausragenden Merkmale von Cohere AI ist die einfache Feinabstimmung auf der Plattform. Dabei ist Cohere AI zwar ein leistungsstarkes Tool, scheut aber auch nicht die Verantwortung, die damit einhergeht. Das Unternehmen geht proaktiv auf Datenschutz- und Sicherheitsbedenken ein und setzt sich dafür ein, die Verbreitung von Vorurteilen oder Fehlinformationen zu verhindern. Dieser vorausschauende Ansatz, gepaart mit dem transformativen Potenzial von Cohere AI, wird die Unternehmenslandschaft und die Art und Weise, wie wir AI in der Wirtschaft wahrnehmen, sicherlich neu definieren.
Das Dritte Musketier: Google´s Bard
Google BARD (Bidirectional and AutoRegressive Transformers) ist ein Large Language Model (LLM), das auf einer Transformer-Architektur entwickelt wurde. BARD ist ein sogenanntes "seq2seq"-Modell, das darauf abzielt, natürliche Sprache zu generieren und zu verstehen. Es verfügt über eine bidirektionale und autoregressive Fähigkeit, was bedeutet, dass es sowohl in Vorwärts- als auch in Rückwärtsrichtung Informationen verwenden und Texte generieren kann. Dadurch ist es in der Lage, kontextsensitive Aufgaben wie Textzusammenfassung, maschinelle Übersetzung und Frage-Antwort-Systeme durchzuführen. Google BARD wurde mit einer großen Menge an Textdaten trainiert und kann daher eine beeindruckende Fähigkeit zur Verarbeitung und Generierung von Text demonstrieren. Basierend auf dem neusten Sprachmodell PaLM2 wird sich Google´s BARTD bald in 40 Sprachen unterhalten können, wobei der größte Unterschied zu ChatGPT und Cohere die BARD Fähigkeit ist, Informationen direkt aus dem Internet zu ziehen und Bilder in den Antworten mit einzubeziehen. Darüber hinaus könnte die Einführung von KI-gestützen Tools wie Sidekick, das kontextbezogene Vorschläge in Google Docs bietet, die Art und Weise, wie Menschen mit digitalen Plattformen umgehen, neu definieren. Die Einführung von Codey zum Beispiel, das speziell für die Code-Vervollständigung entwickelt wurde, kann die Produktivität im Technologiesektor steigern. Darüber hinaus können Unternehmen mit Googles Workspace-Suite, die KI zur automatischen Generierung von Tabellen und Bildern einsetzt, mit optimierten Abläufen rechnen. Diese Funktionen sind zwar auf dem Vormarsch, aber sie sind noch nicht weltweit verfügbar. Leider ist Google BARD derzeit auch noch nicht in Deutschland verfügbar, was jedoch mittels eines VPN Tunnels relativ einfach überbrückbar ist.
“Done is better than perfect”
Dieses Marc Zuckerberg Mantra haben mittlerweile alle großen Tech-Innovatoren für sich geclaimt. Deshalb gibt es neben all den coolen Dingen, die ChatGPT tun kann auch einige Einschränkungen bei ChatGPT. Zu den Fehlern und Ungenauigkeiten in den Ergebnissen von ChatGPT gehören zirkuläre oder sich wiederholende Antworten auf dieselbe Frage, ethische Probleme in den Lösungen im Sinne von Voreingenommenheit, Kodierungsfehler, das Fehlen von Zitaten für die verwendeten Quellen und einer der wichtigsten: sachliche Fehler in einigen Antworten. Bei Cohere AI liegt seine Hauptbeschränkung in seinem mangelnden Bekanntheitsgrad im Vergleich zu anderen bereits „etablierteren“ Modellen. Google Bard wiederum war anfangs voller Fehler und Ungenauigkeiten. Das Problem dieses Bots ist, dass er manchmal den Kontext der vorangegangenen Unterhaltung vergisst. Aber das wird Google genau so wie OpenAI und auch Cohere seine Nachteile recht schnell in den Griff bekommen und per Updates eleminieren.
Fazit:
Seit der Einführung von ChatGPT haben sich die Menschen rund um den Globus über die Fülle von Anwendungen aufgeregt. Das Tool wurde sogar in einigen Ländern verboten und zahlreiche Menschen haben Angst, dass KI Arbeitsplätze ersetzen und schädliche Auswirkungen haben könnte. Allen voran die selbsternannten „Innovatoren“ aus der Kreativ und Beratungsbranche, die häufig den Fortschritt predigen, während sie des Teufel Allchemie selbst insgeheim verfluchen und mit allerlei Tricks umgehen. Stilblüten wie AI-Policies von Kreativ-Agenturen, die ihre digitale Kompetenz auf die Einstellung eines CDOs beschränken zahlen am Ende mehr auf das traditionelle Dienstleister-Mantra vom "wir kommen durch jeden Türrahmen ohne einen blauen Fleck" ein. Das ist zugegeben clever und wird sicher von den meisten Konzern-Kunden goutiert. Aber letztendlich wird es nicht darüber hinweg täuschen, dass uns KI effizienter machen wird, was wiederum auch bedeutet, dass wohl einige Berufsgruppen ihre Konfortzone verlassen müssen.
Wenn auch Ihr Unternehmen den Einsatz von Marketing Technologie plant oder den vorhandenen TechStack mit generative AI Applikationen ausbauen möchte, bieten unsere Marketing Engineers im Bereich der Requirement Engineerings sowie der nachfolgenden Orchestrierung und Implementierung von Marketing Technologie Anwendungen folgende Einstiegspunkte für Marketing Entscheider und ihre Teams an:
- Unser Marketing Automation Power Briefing vermittelt kompaktes Basiswissen über die aktuelle Anbieterlandscape an Automations-Tools und AI-gestützten Applikationen für Marketing- und Salesentscheider und ihre Teams.
- Unser Markenautomat Readiness Check findet methodisch Anwendungenspotenziale für AI-gestützte Automationen wiederkehrender Prozesse in bestehenden Marketing Strukturen.
- Mit unserem Implementation-Sprint setzen wir konkrete, klar abgezirkelte AI Lösungen – so wie zum Beispiel einen Thought Leadership CHATBOT auf ChatGPT Basis - direkt in ihren Marketing Operations um.
- In Learning Journeys zeigen Ihnen unsere Marketing Engineers die Potenziale Ihrer bestehen Martech Tools auf und helfen mit konkreten Anwendungen und Tricks, die Möglichkeiten bestehenden TechStacks optimal auszunutzen. Denn nichts ist teurer, als ungenutzte oder teilgenutzte, aber bezahlte Marketing Technologie!!!
Gern kontaktieren und fordern Sie uns!