Automatische Texterstellung revolutioniert die Erstellung von Inhalten in immer mehr Bereichen. So setzen Nachrichten-Portale im Content-Mix zunehmend auf Roboterjournalismus. Online-Shops nutzen computergenerierte Texte zur Inszenierung von Produkten. Smarte Anwendungen kreieren automatisiert individuelle Reports wie Geschäftsberichte, Immobilien-Exposés oder Fondsreports.
Automatische Textgenerierung, auch unter dem Synonym Natural Language Generation (NLG) bekannt, ist ein Teilgebiet Künstlicher Intelligenz. KI-basierte Software ist heute in der Lage, natürlichsprachliche Inhalte effizient zu generieren und in Echtzeit bereitzustellen.
Die Funktionsweise von automatischer Texterstellung ist auch ohne tiefgehendes technisches Vorwissen schnell und verständlich erklärt. Notwendige Bedingung für die Erstellung von automatisch generierten Texten sind immer strukturierte Daten.
Einfach ausgedrückt handelt es sich dabei um Informationen in Tabellenform. Am Beispiel Wetterberichte sind das etwa die Informationen zu Temperatur, Luftdruck oder Niederschlagswahrscheinlichkeit an einem Ort. Auf die Börse bezogen können das die Werte wie Zu- bzw. Abnahme eines Indexes oder Kursschwankungen sein, beim Betexten von Produktbeschreibungen Artikelmerkmale wie Farbe, Größe oder Gewicht. Für menschliche Leser sind solche reinen Zahlenkolonnen weniger eingängig lesbar als Fließtext.
Zur Verbesserung des Nutzererlebnis übersetzt spezielle Software die Daten in Texte. Dabei fügt ein Programm die Informationen in inhaltlich relevante Bestandteile einer intelligenten Textvorlage ein. Bausteine einer solchen Vorlage könnten am Beispiel eines automatisierten Wetterberichtes etwa sein:
Erhält die Anwendung in diesem Beispiel strukturierte Daten zu Höchst- und Tiefstwerten füllen sich Satz 1 sowie Satz 2. Satz 3 wird nur vervollständigt und auf einer Website ausgegeben, wenn auch die Daten zur Niederschlagswahrscheinlichkeit übermittelt werden.
Leistungsfähige Software geht über die reine Beschreibung von Ereignissen hinaus. Abhängig von der Struktur der Daten und den hinterlegten Satzvorlagen, sind komplexe Tools in der Lage, dem Anwender Interpretationen von Daten in Textform zu liefern. Besonders interessant sind diese Use Cases für Analysen von Unternehmensdaten im Rahmen von Business Intelligence.
Um welche Sorte automatisch generierten Textes es sich auch handelt: die Vorlagen für die Elemente von Texten sind nicht von einem Computer erstellt. Dieser initiale Input muss von einem menschlichen Redakteur mit entsprechendem Domänenwissen stammen. Und auch nach dem Setup sollte das System regelmäßig auf neu aufgetretene Grenzfälle überprüft und gepflegt werden. Automatische Texterstellung macht Texter nicht komplett beschäftigungslos – Natural Language Generation entbindet vor allem von Standardaufgaben und schafft mehr Raum für kreative Tätigkeiten.
Automatisch erstellte Texte sind so gut wie jedem Internetnutzer bereits begegnet. Die Größe eines Portals spielt bei für NLG-Anwendungen keine Rolle. So kommen computergenerierte Beiträge in den Online-Auftritten der Leitmedien und in regionalen Zeitungsportalen gleichermaßen zum Einsatz.
Sportberichte, Erdbebenbenachrichtigungen, Börsennews, Wetterberichte oder Staumeldungen sind etablierte Anwendungsbereiche automatischer Textgenerierung. Besonders interessant sind computergenerierte Beiträge für regionale Medien. In Großbritannien finden erste Versuche statt, bei denen Texte mit lokaler Relevanz aus öffentlichen Datenquellen der Behörden erstellt werden.
In punkto Qualität lässt sich bei bestimmten Textsorten des Roboterjournalismus kaum ein Unterschied zwischen automatisch erstellten Beiträgen und denen menschlicher Schreiber feststellen. Tests mit Fußball-Spielberichten ergaben beispielsweise, dass Leser die Erzeugnisse des „Roboterjournalisten“ natürlicher einschätzten, als die Beiträge eines „echten“ Redakteurs.
Weite Verbreitung findet die automatische Texterstellung auch im E-Commerce. Weil Online-Shops fortlaufend große Mengen an Produktbeschreibungen benötigen, haben Portalbetreiber computergestützte Textgenerierung als effizienten Modus der Betextung entdeckt.
Ein weiteres Anwendungsgebiet von automatischer Textgenerierung mit hohem direktem Einsparpotential sind ausformulierte Reports aus dem Bereich Business Intelligence. Wo von Analyse- und Reporting-Tools große Datenmengen erhoben werden, hilft automatische Textgenerierung dabei, Big Data zu interpretieren und aus Nullen und Einsen verständliche Stories zu machen.
Automatische Texterstellung macht nicht für jeden Anwendungsbereich Sinn. Wenn etwa aufwändige Recherchen die Basis für einen Hintergrund-Bericht sind oder in einem Meinungsbeitrag das Pro und Contra eines Standpunktes analysiert wird, stößt Roboterjournalismus klar an Grenzen. Hier werden auch weiterhin journalistische Profis mit Gespür und Erfahrung gefragt bleiben.