Blog
Anastasia Linnik
Text-Automatisierung avanciert zu einem der wichtigsten Einsatzgebiete von Künstlicher Intelligenz im Digital Commerce. Denn die Technologie ermöglicht es, qualitativ hochwertigen Content automatisiert in verschiedenen Sprachen und für unterschiedlichste Kanäle zu erstellen. Automatisierte Textgenerierung ist bei führenden Online-Shop-Betreiber/innen und Händler/innen inzwischen fest etabliert. Zugleich entwickelt sich die Technologie kontinuierlich weiter und eröffnet neue Möglichkeiten. Nicht zuletzt angesichts neuester Entwicklungen wie GPT-3 oder BLOOM ist aktuell viel von End-to-End Textgenerierung die Rede. Nachfolgend skizzieren wir, was es mit der neuen Technologie von GPT-3 auf sich hat.
GPT-3 steht für „Generative Pre-trained Transformer 3“ und zählt zu den sogenannten großen Sprachmodellen, die mittels Deep Learning frei verfügbare Internet-Inhalte „lesen“ und sich das notwendige Wissen antrainieren können. Dieses Modell bietet Fähigkeiten, über die bisherige Generatoren in dieser Form nicht verfügten. Sie sind in der Lage Text automatisiert in überzeugender Qualität zu verfassen. Das Marketing-Versprechen dieses Ansatzes ist es, dass sich jede Art an Content „on Demand“ und ohne Setup erstellen lässt. Deshalb wird auch von einer End-to-End Textgenerierung gesprochen. Das GPT-3-Modell braucht lediglich eine Instruktion und grob strukturierte Daten – und schon kann GPT-3 einen Text „ausspucken“.
Auch wenn GPT-3 aktuell nur in einem assistierenden Prozess mit Content-Teams eingesetzt werden, liefert es brauchbare Texte quasi auf Knopfdruck. Das erleichtert die Arbeit ungemein: es geht nicht mehr darum, Ideen oder Informationen zu sammeln und diese auszuformulieren, sondern nur noch darum, bereits ausformulierte Texte zu prüfen und zu korrigieren. Soll der Content höchste Qualitätsansprüche erfüllen und damit nicht gegen Google-Richtlinien verstoßen, also rechtlich und sachlich korrekt verwendet werden, müssen Content-Manager/innen aber weiterhin jeden einzelnen generierten Text prüfen und unter Umständen anpassen. Denn die durch GPT-3 generierten Aussagen sind nicht überprüfbar, da es sich um einen nicht-deterministischen Ansatz handelt. Das heißt man weiß nicht, welcher Datenpunkt zu welchen Aussagen führt.
GPT-3 ist ein KI-basiertes Sprachverarbeitungsmodell. Hierbei werden Texte auf Basis neuronaler Netzwerke bearbeitet und generiert, indem der Content auf Basis der eingegebenen Daten erzeugt wird. Gespeist werden die GPT-3-Algorithmen aus im Internet verfügbaren Text-Datensätzen wie Common Crawl, WebText sowie Bücher-Datensätzen und dem englischsprachigen Wikipedia. Bei der Texteingabe werden individuelle Muster identifiziert – und der wahrscheinlichste Content als Output an den/die Anwender/in ausgegeben.
Die Einsatzmöglichkeiten von GPT-3 sind enorm. Die Vorteile dieser Trendtechnologie liegen vor allem in der schnellen und kosteneffektiven Erzeugung von Texten. Zentral ist hierbei, dass sich aus einer kleinen Textbasis automatisch auch größere Text-Mengen generieren lassen. Dies ist für Unternehmen besonders dann interessant, sofern die Texterstellung durch das Content-Team zu zeitaufwändig ist und ein erster Aufschlag für eine Fülle unterschiedlicher Anzeigentexte oder Produktbeschreibungen bereitgestellt werden soll. Zugleich eignet sich dieses Sprachmodell für die Generierung und Verarbeitung repetitiver Informationen – etwa für das Management wiederkehrender Anfragen im Kunden-Chat.
Trotz der sprachlichen Fähigkeiten von GPT-3, weist die Technologie beim Erzeugen der Texte inhaltliche Schwächen auf. Da GPT-3 auf Englisch getrimmt ist, sind die Ergebnisse in deutscher Sprache bislang weniger zufriedenstellend. Zugleich besteht bei längeren Texten und sich regelmäßig wiederholenden Passagen die Gefahr, dass Content-Elemente immer identisch steril formuliert werden und keine neuen Nuancen hinzugefügt werden. Dies ist nicht zuletzt bei Anzeigentexten und Produktbeschreibungen problematisch, wo es um inhaltliche Varianz geht, um eine Vielzahl ähnlicher, aber nicht identischer Angebote zu differenzieren.
Da GPT-3 auf im Internet frei verfügbaren Daten basiert, ist die Technologie nicht davor gefeit, etwaige darin implizit oder explizit vorkommende Vorurteile oder negative Äußerungen zu übernehmen und diese in den automatisch generierten Content einfließen zu lassen. Die Unternehmen können also nicht komplett ausschließen, ob es bei den automatisch erstellten Texten zu einer Diskriminierung hinsichtlich Geschlechts, Religion, Rasse oder ethnischer Zugehörigkeit kommt. Außerdem ist GPT-3 nicht immer unbedingt auf dem neuesten Wissensstand, denn der darauf basierende Internet-Speicher muss regelmäßig aktualisiert werden. Effektiv sollten Texte nach einer entsprechenden Qualitätskontrolle veröffentlicht werden, wobei meist Kürzungen, Umstellungen und neue Kombinationen erforderlich sind.
Von einem verlässlichen Einsatz im Digital Commerce und Marketing ist GPT-3 noch entfernt. Der automatisch generierte Content ist nicht sofort ohne Bearbeitung verwendbar. Vielmehr sind Content-Manager/innen gut beraten das Output von GPT-3 immer zu prüfen. GPT-3 kommt eine unterstützende Funktion zu, die die Teams entlastet, damit diese sich auf ihre Kernaufgaben konzentrieren können. Zugleich ist GPT-3 aber auch eine zukunftsweisende Technologie, die Content-Manager/innen bei der Erstellung von Inhalten unterstützt. Kurzum: Es gilt, die weiteren Entwicklungen dieser spannenden Trendtechnologie im Auge zu behalten.
Für Fragen und weitere Details zu GPT-3 und seinen Einsatzmöglichkeiten stehen unsere Expertinnen und Experten gerne zur Verfügung. Sprich uns einfach an!