RegioSignaleBlog: Sascha, was empfiehlst Du mir, wenn ich im Internet recherchieren? Sollte ich googeln oder besser ChatGPT fragen?
Sascha Wolter: Das hängt ganz davon ab. Wenn es kurz und knapp um Fakten geht, ist die klassische Suchmaschine gut, aber die Inhalte der Ergebnisse musst Du Dir dann noch selbst erschließen. ChatGPT ist ein sprachlich arbeitendes Tool primär für sprachliche Aufgaben – etwa Textvorschläge erstellen oder Texte zusammenfassen lassen. Die großen Suchmaschinenanbieter arbeiten daran, beides zu kombinieren.
RegioSignaleBlog: Die Frage hängt natürlich mit Deinem Job zusammen. Du bist „Human Machine Interfaces & Large Language Models-Advisor“ bei DB Systel. Was muss man sich darunter vorstellen?
Sascha Wolter: Klingt wie eine Aneinanderreihung von Buzzwords, ist aber eigentlich ganz einfach. Bei dem, was ich mache und was mich antreibt, geht es immer um den Einsatz von Technologie und Künstlicher Intelligenz zum Nutzen der Anwender:innen an der Schnittstelle zwischen Mensch und Maschine. Davon profitieren sollen die Kollge:innen bei der DB oder die Kund:innen – und im besten Fall beide. Das lässt sich sehr gut mit sprachlichen Medien gestalten, so wie ja auch „Siri“ und „Alexa“ Sprachassistenten sind. ChatGPT gibt dem Thema jetzt noch einmal eine neue Qualität.
RegioSignaleBlog: Verrätst Du zuerst etwas über die Technologien, die dahinterstehen?
Sascha Wolter: Grundsätzlich lassen sich zwei Verfahren unterscheiden, die Conversational AI und die Generative AI. Conversational AI ist gewissermaßen ein Rollenspiel, bei dem in vorstrukturierten Bahnen den Nutzenden Dialogmöglichkeiten angeboten werden. Der Chatbot ist das klassische Beispiel. ChatGPT ist Generative AI und kann mehr, nämlich über das Medium Sprache eigenständig Inhalte generieren. Das eröffnet neue Möglichkeiten, steht aber erst am Anfang. Hier sind die Freiheitsgrade größer als bei einem vorstrukturieren Dialog, aber die Fehlermöglichkeiten sind es auch. Viele Grundbausteine und Fähigkeiten spielen überall eine Rolle. Die Systeme müssen gesprochene und geschriebene Sprache verstehen und ausgeben können, was je nach Anwendungsfall auch Dialekte, unterschiedliche Sprachniveaus und Fachvokabular einbezieht. Sie müssen auch die Intentionen hinter einer Frage verstehen. Was bezweckt eine Nutzer:in eigentlich, was will sie oder er wirklich wissen?
RegioSignaleBlog: Hast Du Beispiele für konkrete Anwendungen?
Sascha Wolter: Weil Sprache unsere primäre Interaktionsform ist, sind auch die Anwendungsmöglichkeiten riesig. Bei der DB nutzen wir Conversational AI, also die Chatbots der DB Smile-Familie. Damit beantworten wir zum Beispiel Kundenfragen oder helfen Bewerber:innen weiter, die sich nach einem Job bei der DB umschauen. Aber die Anwendungen gehen auch noch deutlich weiter. Ein Beispiel dafür ist eine Übersetzungshilfe, mit der Triebfahrzeugführer:innen auf Strecken im Ausland mit den dortigen Leitstellen in ihrer Muttersprache kommunizieren können, also quasi ein Babelfish. Wir arbeiten auch an einer KI-basierten Unterstützung für Mitarbeiter:innen im Kundenkontakt. Die Kombination aus Conversational AI und Generative AI macht Vorschläge für die Gesprächsführung und recherchiert im Hintergrund relevante Informationen. Bei vielen KI-basierten Anwendungen spielt die Entlastung von Routineaufgaben eine Rolle. Wir wollen unsere Kolleg:innen bei ihrer Arbeit unterstützen und entlasten.
RegioSignaleBlog: Welchen Einfluss haben solche Dialog-Anwendungen auf die User Experience?
Sascha Wolter: Das hängt vom jeweiligen User und Use Case ab. Fahrgäste erhalten beispielsweise schneller und gezielter eine Antwort. Die kann bei Standardfragen schon ein Chatbot liefern. Zugleich haben die Kolleg:innen durch diese Entlastung mehr Zeit für anspruchsvolle Aufgaben, bei denen sie dann natürlich weiterhin durch künstliche Intelligenz unterstützt werden. Unter dem Strich steigt so die Kundenzufriedenheit. Mit dem Begriff „Dialog“ bin ich bei elektronischen Systemen aber etwas vorsichtig. Niemand will mit einem IT-System wirklich ein Gespräch führen. Es handelt sich eher um ein dialogisches Erlebnis, um zu einer Lösung zu gelangen, um das Verfeinern der Suche nach den konkreten Bedürfnissen der Fragenden. Und um kundenorientierte, natürlich aufbereitete Antworten.
RegioSignaleBlog: Wie siehst Du die weitere Entwicklung von ChatGPT und Generativer KI?
Sascha Wolter: ChatGPT und Generative KI bieten eine Menge potenzieller Anwendungsgebiete. Aber man muss sehen, dass ChatGPT kein Wissenstaschenrechner ist, der zuverlässig immer die richtigen Antworten ausspuckt. Die große Stärke ist die Sprachverarbeitung. Das Ergebnis basiert dann auf der Kombination sprachlicher Wahrscheinlichkeiten und hat schon deshalb immer Unschärfen. Die ergeben sich zusätzlich durch den Datenstand, mit dem das System trainiert wurde. Was ein System überhaupt wissen kann, hat auch zeitliche Grenzen. Die Frage nach der aktuellen Wetterlage kann da schon schwierig sein. Dafür reicht es nicht, meteorologische Zusammenhänge der Vergangenheit zu reproduzieren, dafür ist der Wetterbericht von heute nötig. Das Potenzial von ChatGPT und Generativer KI hängt also davon ab, sie mit dynamischem Wissen zu kombinieren und die Unschärfen immer weiter zu minimieren. Das ist die Aufgabe, darin besteht die Herausforderung.