Natural Language Generation: aus Daten werden Texte

Nicht erst seit gestern stellt die Digitalisierung nahezu sämtliche Prozesse in Unternehmen und Organisationen auf den Prüfstand. Eine neue Dynamik und besondere Herausforderungen in den digitalen Wandel bringen jüngste Entwicklungen aus dem Bereich Künstliche Intelligenz (KI).

Von der Analyse großer Datenmengen über die Steuerung der Produktion in smarten Fabriken bis hin zur Technologie in selbstfahrenden Autos kommt „Artificial Intelligence“ bereits in vielen Feldern zum Einsatz. Ein Teilgebiet von Künstlicher Intelligenz ist die automatische Erzeugung natürlicher Sprache – Natural Language Generation (NLG).

Natural Language Generation gehört zum Natural Language Processing und bezeichnet die Erstellung natürlichsprachlicher Texte durch eine Software. Auf den Punkt gebracht ist NLG der Prozess der Übernahme strukturierter Daten und deren Umwandlung in Text. Überall dort wo strukturierte Daten generiert werden – etwa im E-Commerce, an der Börse oder in der Berichterstattung für Sport, Wirtschaft bzw. Wetter – kann NLG-Software aus Daten leserfreundliche Texte erstellen.

Wie funktioniert NLG?

Daten bilden das Fundament einer NLG-Anwendung, für Texte in natürlicher Sprache müssen zusätzlich vorab Vorlagen und Bedingungen definiert sein. Die Vorlagen sind im Wesentlichen vorformulierte Sätze, die mithilfe von Daten- und Lexikalisierungsalgorithmen individualisiert werden. Bedingungen sind hier die Umstände, die erfüllt sein müssen, damit die Vorlage zum Einsatz kommt.

Im Erstellungsprozess ordnet die Software die Vorlagen in einer bestimmten „narrativen“ Reihenfolge an. Die vorgegebene Abfolge, in der die Vorlagen angeordnet sind, wird als „Storyplot“ bezeichnet.

NLG kann zusätzlich „Big Data“ in die Texterstellung einbeziehen. Abhängig von den Input-Daten und der Komplexität der definierten Bedingungen ist Natural Language Generation somit in der Lage, Sachverhalte darzustellen oder Zahlen detailliert zu interpretieren.

In der konkreten Umsetzung von NLG-Projekten haben sich zwei Ansätze etabliert. Sind die Anforderungen standardisiert und verfügen die Anwender über keine Programmierkenntnisse, bietet sich eine SaaS-Lösung an. Eine webbasierte NLG-Plattform ermöglicht die Anbindung an eine Datenquelle via API, die Formulierung von Textbausteinen und Bedingungen sowie die Anbindung des Outputs, etwa an ein CMS.

Alternativ dazu steht ein betreuter Service, bei dem ein Team aus erfahrenen Entwicklern, Datenexperten und Linguisten das NLG-Projekt auf spezielle Bedürfnisse anpasst und realisiert.

Wo wird NLG bereits eingesetzt?

Die Generierung von natürlicher Sprache durch Algorithmen befindet sich noch in einem vergleichsweise frühen Stadium. Auch wenn die Möglichkeiten längst nicht vollständig ausgelotet sind, bewähren sich einige konkrete Anwendungen bereits in der Praxis:

Nachrichten

Newsportale gehören zu den Vorreitern beim Einsatz von NLG. Automatisch generierte Beiträge eignen sich insbesondere für Textsorten mit einer hohen Dichte an standardisierten Formulierungen. Dazu gehören zum Beispiel die Berichterstattung für Sportarten, Börsennachrichten oder Wettervorhersagen. Ein Beispiel für Roboterjournalismus mit einer Lösung von Retresco, zeigt der Generator für Fußballberichte.

Report

Ob in der Business Intelligence oder in der Kommunikation mit Privatkunden: ausformulierte Berichte lesen sich eingängiger als reine Zahlenkolonnen. Überall dort wo große Datenmengen erhoben werden, kann Natural Language Generation helfen, Entwicklungen deskriptiv darzustellen und Informationen zu interpretieren. Ein Anwendungsbeispiel sind etwa die Fondsreports großer Finanzdienstleister für private Anleger.

E-Commerce

Je mehr Produkte ein Online-Shop enthält, desto aufwendiger ist die redaktionelle Erstellung von einzigartigen Produktbeschreibungen. Automatische Textgenerierung sorgt für signifikante Effizienzsteigerungen im gesamten Prozess der Contentproduktion. Dort, wo NLG im E-Commerce im Einsatz ist, lassen sich zudem positive Effekte auf User-Experience und SEO-Sichtbarkeit messen.

Chatbots

Besondere Stärke entfaltet Natural Language Generation in Kombination mit Natural Language Understanding (NLU). So vereinen beispielsweise Chatbots NLG und NLU: Dialogprogramme verstehen die Eingaben eines Nutzers und generieren sinnvolle Antworten. Über Maschinelles Lernen entwickelt sich die Präzision der natürlich generierten Aussagen fortlaufend weiter.

Welche Potentiale ergeben sich durch den Einsatz von NLG?

Automatische Texterstellung kommt wie Künstliche Intelligenz generell nicht aus der Steckdose. Fortgeschrittene Anwendungen der Natural Language Generation benötigen nach der ersten Einrichtung jedoch so gut wie keinen menschlichen Eingriff und bieten daher eine Reihe von Chancen:

Schnelligkeit

NLG verkürzt die Erstellung von Texten auf Millisekunden. Die Generierung von Daten und deren Übersetzung in natürlichsprachige Texte geschieht mit NLG faktisch in Echtzeit.

Genauigkeit

Im Gegensatz zu den Texten menschlicher Autoren sind automatisch generierte Texte fehlerfrei – vorausgesetzt die vorformulierten Elemente enthalten keine Rechtschreib-, Grammatik- oder Syntaxfehler. Das senkt die Kosten langfristig deutlich, da die Notwendigkeit, jeden produzierten Text Korrektur zu lesen, entfällt.

Echtzeit-Verarbeitung

NLG-Systeme sind in der Lage, Änderungen in den verwendeten Daten in Echtzeit zu erkennen und entsprechend zu reagieren. Ein konkreter Anwendungsfall ist etwa der Staumelder einer Website. Über eine API erhält das NLG-System fortwährend neue Daten und aktualisiert die entsprechenden Texte in Echtzeit.

Ressourcen freisetzen

Ein NLG-System entbindet Texter und Redakteure von monotoner Routine-Arbeit. Das erlaubt qualifizierten Kräften mehr Zeit für die Beschäftigung mit kreativen oder konzeptionellen Aufgaben.

Optimierung und Rationalisierung

Unternehmen aus allen Branchen und jeder Größe profitieren über Einspareffekte messbar von automatischer Textgenerierung. Nach einem initialen Setup sinken die Kosten für wiederkehrende administrative Aufgaben drastisch.

Quellen & PDF:

Natural Language Generation: An Introduction (The University of Edinburgh, Informatics | PDF)