Was ist Deep Learning?

Deep Learning, auch unter den Bezeichnungen „Deep Structured Learning“ oder „Hierarchisches Lernen“ bekannt, ist eine spezielle Methode aus dem Bereich des Maschinellen Lernens und damit auch ein Teilgebiet der Künstlichen Intelligenz. Obwohl das Konzept bereits in den 1980er-Jahren erstmalig formuliert wurde, gewinnt Deep Learning dank immer leistungsstärkerer Soft- und Hardware, dem Vorhandensein großer Datensätze und der Entwicklung besserer Algorithmen in der letzten Zeit beträchtlich an Bedeutung.

Wie funktioniert Deep Learning?

Beim Deep Learning werden häufig Algorithmen zur Mustererkennung aus dem Bereich der neuronalen Netze verwendet. Entgegen einem beliebten Bild zur Erklärung des Phänomens kopieren Deep Learning-Modelle neuronale Netze des menschlichen Gehirns nicht 1:1 – die Strukturen ähneln sich aktuell nur oberflächlich.

Auch wenn der Aufbau dem unseres Hirns (noch) nicht gleicht, liegt ein Erfolgsgeheimnis des Ansatzes darin, dass es in den letzten Jahren gelungen ist, sehr große Netzwerke mit vielen aufeinanderfolgenden Schichten anzulegen und zu trainieren. Die vielen Schichten zwischen Input und Output sorgen für eine komplexe, tiefe Struktur – daher „tiefgehendes Lernen“. Schließlich ergibt sich ein individuelles Modell, das die Erkennung von Mustern und die Vorhersagen bezüglich neuer Phänomene erlaubt.

Im Gegensatz zum allumfassenden Wissenserwerb eines Menschen beschränkt sich der Deep Learning-Prozess einer Maschine auf eine genau umgrenzte Problemstellung. Das heißt auch, dass die Daten, die zum Trainieren eines neuronalen Netzes verwendet werden, direkt für das zu lösende Problem relevant sein müssen.

Maschinelles Lernen kommt dort zur Anwendung, wo aus großen Datenmengen Muster abgeleitet und Entscheidungen getroffen werden sollen. Deep Learning hat gegenüber anderen Methoden des Maschinellen Lernens besonders dann Vorteile, wenn sehr viele unstrukturierte Daten vorliegen, also für Videos, Bilder, Audiodateien oder Text. Weiteres Plus von Deep Learning: Die Ergebnisse sind häufig präziser als der Output anderer Modelle.

Beispiel für Deep Learning

So kann beispielsweise eine Anwendung zur Bilderkennung lernen wie eine Katze aussieht. Das Machine-Learning-System bekommt dazu eine große Anzahl von Bildern eingespeist. Hohe Rechenleistung ist notwendig, um im Anschluß jedes einzelne Bild zu analysieren und zu bewerten.

Die erste Darstellungsschicht kann die einzelnen Pixel des Katzenbildes abstrahieren und anschließend Umrisse bzw. Kanten codieren. Im zweiten Layer des neuronalen Netzwerkes werden verschiedene Anordnungen von Kanten zusammengesetzt und codiert. Die dritte Schicht könnte Elemente wie Nase und Augen der Katze codieren, bevor der vierte Layer erkennt, dass das Bild ein Katzengesicht zeigt. Als Ergebnis ordnet das Modell das Bild der Kategorie Katze oder Nicht-Katze zu.

Das Besondere am Deep Learning sind die selbstoptimierenden Prozesse. Die Systeme lernen ohne durch Experten einprogrammierte Vorkenntnisse, welche Features aus den Input-Daten auf welcher Ebene am effektivsten transformiert werden. Das hat den Vorteil, dass der Mensch nicht eingreifen muss. Andererseits ist aber auch nicht immer ganz klar, was das System lernt. Deep Learning Modelle gelten daher auch als Black Box.

Anwendungen für Deep Learning

Klassifizikation bzw. Gruppierung von Daten und/oder die Erstellung von Vorhersagen – Deep Learning löst dort für menschliche Anwender Herausforderungen, wo Maschinen mit großem Daten-Input konfrontiert sind. Häufige Anwendungsfälle für Deep Learning sind Bild- und Spracherkennung, prädiktive Analysen, Empfehlungssysteme oder Anomalieerkennung.

„Dieses Bild zeigt unangemessene Inhalte“, „Diese Finanztransaktion ist Betrug“ oder „Diese E-Mail ist Spam!“ sind praktisch verwertbare Aussagen, die auf Deep Learning-basierte Klassifizierung zurückgehen.

Die Gruppierung von Daten ermöglicht Resultate wie „Der Anwender sucht sehr wahrscheinlich dieses Dokument“ oder „Diese beiden Geräusche sind ähnlich“. Letztgenanntes Beispiel ist eine der Voraussetzungen, um Tonausschnitte in größeren Audiodateien zu identifizieren und das gesprochene Wort als Text zu transkribieren.

Durch Deep Learning gewonnen wäre auch eine relevante Vorhersage wie beispielsweise: „Auf Basis der Daten zum bisherigen Nutzerverhalten prognostizieren wir für User XY eine Kündigung des Abos unseres SaaS-Service.“

Eine oder mehrere der beschriebenen Deep Learning-Prozesse kommen in alltäglich genutzten Services zum Einsatz, etwa in der Sprachsteuerung von Alexa, dem Bilder-Tagging von Facebook oder der automatischen Übersetzung von DeepL.

Quellen, Verweise & PDF:

Deep Learning (MIT Technology Review)

Deep Learning (MIT Press book)

Deep Learning (Université de Montréal, Yoshua Bengio - PDF)