Blog
Anastasia Linnik
Schon heute ist Natural Language Generation nicht mehr aus der Content-Produktion im Digital Commerce wegzudenken – doch welche Potentiale birgt die KI-Technologie in der Zukunft? Retresco-CEO Johannes Sommer gibt im MDR Interview „Das menschliche Korrektiv ist wichtig“ einen Einblick auf zu erwartende Entwicklungen der KI-basierten Sprachtechnologie: „Die Entwicklungen solcher Systeme sind ja rasant – wenn man einmal Orakel spielen möchte, wo geht die Reise hin?“ (ab 11:08 Min) – ebendiese spannende Frage wollen wir im folgenden Blogpost näher beleuchten.
Den kreativen und effizienzgetrieben Kopf setzt die Fähigkeit automatisch Texte zu verfassen vor vielen Möglichkeiten: zahlreich sind die Anwendungsszenarien und schier unendlich scheint das Potenzial. Jedoch liegt eine entscheidende Voraussetzung für die automatische Textgenerierung in der umfassenden und konsistenten Verfügbarkeit von Datenquellen, und zwar zu jedem Aspekt, der sich im finalen Text wiederfinden soll. Denn letztendlich befähigt Natural Language Generation zur automatischen Generierung von Text auf Basis von strukturierten Daten – im Umkehrschluss bedeutet das: ohne Daten keinen Text. Kreative Businessideen sind somit zwar eine notwendige, im Gegensatz zu guten und konsistenten Datenquellen, aber keine hinreichende Voraussetzung für die erfolgreiche Textgenerierung. In der Vergangenheit wurde die Verfügbarkeit bzw. mangelnde Verfügbarkeit von Daten somit oft zum Engpass für Textgenerierungsprojekte. Doch die digitale Transformation hat in den letzten Jahren die dringende Notwendigkeit und hohe Relevanz der Implementierung und Optimierung eines gezielten Datenmanagements verdeutlicht und branchenübergreifend zu einem Aufrüsten geführt: Dies beinhaltet ein gebündeltes Datenmanagement für eine zentrale Verwaltung diverser Datenquellen sowie ein klarer Fokus auf das Erschließen von konsistenten und qualitativ hochwertigen Datenquellen. Wir von Retresco sind überzeugt: Dieser Trend wird sich künftig weiter fortsetzen, wobei sich Daten deutlich einfacher und effektiver bündeln lassen und neue, automatisch generierte Content-Formate ermöglicht werden.
Aufbauend auf den kurzfristigen Entwicklungen wird die Natural Language Generation Technologie mittelfristig leichter zugänglich und schneller implementierbar werden. Denn mehr Output bedeutet gleichzeitig mehr Input für Maschinelles Lernen: die einerseits immer weiter verbreitete Nutzung der Technologie und die andererseits neu entstehenden Formate bedeuten einen exponentiellen Anstieg an Trainingsmaterial für Maschinelles Lernen, welches in einer Verbesserung von Verfahren und Sprachmodellen resultiert. Als Konsequenz sinkt der Aufwand an Zeit und Ressourcen, welcher der Textgenerierung initial vorhergeht und ein autonomeres Arbeiten der Technologie durch größere Trainingsdatenverfügbarkeit ist die Folge.
Mehr Autonomie bedeutet vor allem einen Gewinn an Effizienz und skalierbarem Output, ist aber nicht misszuverstehen mit einem grundlegenden semantischen Verständnis von Sinnzusammenhängen auf Seite der Maschine. Systeme im Bereich Maschinelles Lernen können enorme Datenmengen verarbeiten und daraus sehr präzise Voraussagen treffen. Die erlernte Fähigkeit besteht also darin, Muster zu erkennen, korrekt zu interpretieren und richtig zu reagieren. Dem menschlichen Gehirn vermittelt dies die Illusion eines tiefgehenden Verständnisses, welches allerdings mittelfristig noch nicht vorhanden ist.
Wie anfangs erwähnt, basierte eine erfolgreiche Textgenerierung auf strukturierten Daten. Um solche Daten nutzen und weiterverarbeiten zu können, wird für das Maschinelle Lernen in einem initialen Training Regeln definiert, wie die vorhandenen Datensätze zu interpretieren sind. Langfristig entfällt dieser initiale Schritt: Auf Basis von Beispieloutput und entsprechender Datengrundlage wird Maschinelles Lernen künftig eigenständig komplette Texte formulieren können. Statt regelbasierter Ableitungen trifft die Technologie dann auf Basis von hochvolumigen Trainings eigenständig Schlussfolgerungen.
Dieser Ansatz ist auch als End-to-End-Textgenerierung bekannt und zielt darauf ab, dass ein Natural Language Generation System sich den Prozess der Textgenerierung von den strukturierten Daten bis hin zum fertigen Text – also von einem Ende der Prozesskette zur anderen – selbst aneignet. Zu welchen Erfolgen dieser Ansatz führen kann, können Interessierte in unserem Hackathon-Nachbericht nachlesen. Zu welchen Erfolgen dieser Ansatz langfristig führen wird, können Sie und Ihr Unternehmen gemeinsam mit uns in einem individuellen Anwendungsfall erschließen oder als Teil unseres Teams aktiv mitgestalten.
Um den beschriebenen Entwicklungen an Substanz zu verleihen, ist eine zeitliche Einordnung erforderlich. Wenn wir von langfristig sprechen, meinen wir maximal 5 Jahre. Konkret bedeutet dies: Wir rechnen fest damit, dass in maximal 5 Jahren eine komplette Automatisierung der Texterstellung im Digital Commerce erreicht ist.
Sie möchten wissen, wie Sie von diesen Potenzialen profitieren und wie diese aktiv mitgestalten können? Dann beraten wir Sie gern. In einem persönlichen Gespräch besprechen wir individuelle Umsetzungsszenarien und entwickeln so eine maßgeschneiderte Lösung für Sie – wenden Sie sich gerne an kontaktformular@retresco.de.