„Maschinelles Lernen ist ein Feld der Künstlichen Intelligenz. Es wendet statistische Techniken an, um Computern die Fähigkeit zu verleihen, aus Daten zu lernen, ohne explizit programmiert zu sein.“ Diese Definition stammt von Arthur Samuel, dem Erfinder des Begriffes und einem der Pioniere auf dem Gebiet Künstliche Intelligenz.
Die grundlegende Definition stammt aus dem Jahr 1959 und hat an Gültigkeit seither nichts eingebüsst. Verändert haben sich seitdem jedoch die Rahmenbedingungen, Möglichkeiten und Einsatzgebiete für Maschinelles Lernen. Machine-Learning-Systeme können heute enorme Datenmengen verarbeiten, daraus sehr präzise Voraussagen treffen und somit sehr vielseitig angewendet werden.
Maschinelles Lernen ist ein Prozess. Die Fähigkeit einer Maschine, Muster zu erkennen, korrekt zu interpretieren und daraufhin richtig zu reagieren, wird erst durch das Trainieren mit Daten geschaffen. Der Lernprozess kann auf zwei unterschiedliche Arten verlaufen.
Beim überwachten Lernen wird der Maschine für jede Eingabe auch die korrekte Ausgabe formuliert. Ein gutes Beispiel für überwachtes Maschinelles Lernen ist die Erkennung von handgeschriebenen Buchstaben. Dabei werden dem Machine-Learning-System Bilder eines handschriftlichen ABC eingespeist. Zu jedem dieser Bilder ist in den Metadaten die von einem menschlichen „Lehrer“ formulierte Information hinterlegt, um welchen Buchstaben es sich jeweils handelt. Auf diese Weise lernt das System in der Trainingsphase die unterschiedlichen Ausprägungen, in denen Menschen einen Buchstaben schreiben. Ist das Training abgeschlossen, sollte das System aus dem Gelernten abstrahieren können und Handschriften eindeutig erkennen.
Dem gegenüber steht ein Ansatz, der als unbeaufsichtigtes Lernen bezeichnet wird. Während überwachtes Lernen Muster entdeckt, bei denen das System einen Datensatz von „richtigen Antworten“ hat, finden beim unüberwachten Lernen Machine-Learning-Systeme Muster, wo wir es nicht tun. Dies kann daran liegen, dass die „richtigen Antworten“ nicht beobachtbar oder nicht möglich sind, oder dass es für ein bestimmtes Problem nicht einmal eine „richtige Antwort“ an sich gibt. Die Algorithmen sind dabei auf sich gestellt, Strukturen und Gemeinsamkeiten in den Daten zu erkennen und daraus ein Lernmodell zu erstellen. Das führt dazu, dass solche Systeme oftmals eine Black Box sind, bei der auch die Programmierer nicht wissen, welche Annahmen das System aus den Daten gelernt hat.
Praktisch kommt unüberwachtes Maschinelles Lernen zum Beispiel dort zum Einsatz, wo Anbieter von Marketing-Daten riesige Datensätze scannen und Nutzer in bestimmte Cluster einordnen.
Die Grundlagen für Maschinelles Lernen wurden bereits in der Mitte des vergangenen Jahrhunderts gelegt. Doch erst in den letzten Jahren entfaltet sich das Potential des Ansatzes. Mehrere Trends begünstigen die rasante Weiterentwicklung des Feldes und die Einsatzmöglichkeiten des Machine Learning in den letzten Jahren. Im Zuge der fortschreitenden Digitalisierung sind mehr und mehr Daten vorhanden, die sich zum Lernen verwenden lassen.
Computer werden gleichzeitig performanter, um große Datenmengen zu verarbeiten. Einen Schub erlebt Maschinelles Lernen daher auch, seit komplexe Grafikprozessoren mit mehreren Kernen parallele Berechnungen erlauben.
Mit zunehmender Größe des Datenbestandes steigt auch die Notwendigkeit, die Daten zu interpretieren, zu ordnen und weiterzuverarbeiten. Wissenschaftliche Entwicklungen fanden so schnell Eingang in kommerziell genutzte Anwendungen.
Je umfassender Künstliche Intelligenz und Maschinelles Lernen in den Alltag der Menschen eindringen, desto häufiger tauchen die damit in Zusammenhang stehenden Begriffe in den Medien auf.
Zu Unschärfen und Verwechslungen kommt es oft zwischen den Konzepten Künstliche Intelligenz, Maschinelles Lernen und Deep Learning. Der Zusammenhang ist im Grunde einfach, mit den Konzepten verhält es sich wie bei einer russischen Matrjoschka. Die größte, äußere Puppe ist das Feld Künstliche Intelligenz. Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz, während Deep Learning als Unterdisziplin des Maschinellen Lernens gilt.
Das „Deep“ in Deep Learning bezieht sich auf die Anzahl der Schichten, durch die die Daten transformiert werden. Deep Learning nutzt im Prozess des Maschinellen Lernens hierarchische Schichten bzw. eine Hierarchie zur Erkennung von Mustern. So werden beispielsweise in einem tiefen neuronalen Netze zur Bilderkennung zuerst einfache Kanten und Kontraste in einem Bild erkannt, während spätere Schichten komplexe Strukturen erfassen.
Automatisches Maschinelles Lernen vereinfacht durch weitgehende Automatisierung das Setup eines Machine-Learning-Systems. Dabei werden entweder der gesamte Prozess oder ausgewählte Schritte automatisiert, sodass für die einzelnen Module und Lernschritte nicht je ein Experte benötigt wird. So kann zum Beispiel die Aufbereitung der Daten, die Auswahl von Merkmalen oder die Modellauswahl automatisiert werden. Der Google Dienst Cloud AutoML etwa verspricht, dass die Lösung selbst Anwendern mit geringen Programmierkenntnissen die Erstellung von Machine-Learning-Systemen wie Übersetzungsmodellen oder Modellen für natürliche Sprache ermöglicht.
Ein weiterer Begriff, der oft im Zusammenhang mit Machine Learning fällt, ist Data Mining. Zwischen maschinellem Lernen und Data Mining bestehen viele Gemeinsamkeiten, aber auch signifikante Unterschiede. Maschinenlernen basiert auf bekannten Merkmalen und fokussiert auf Vorhersagen. Im Gegensatz dazu konzentriert sich Data Mining auf das Entdecken unbekannter Eigenschaften in den Daten.
Introduction to Machine Learning (Alex Smola & S.V.N. Vishwanathan | PDF)
Einführung in Maschinelles Lernen zur Datenanalyse (Prof. Dr. - Ing. Morris Riedel | PDF)