KI Lexikon –
Unsupervised Learning
Unsupervised Learning ist eine Disziplin des Machine Learnings bei der Computer Algorithmen ausführen, um Datensätze ohne menschliches Zutun zu analysieren und zu clustern. Unsupervised Learning findet in vielen Bereichen Anwendung wie beispielsweise bei der Segmentierung von Kunden oder bei der Bilderkennung Anwendung.
Was ist Unsupervised Learning?
Beim Unsupervised Learning handelt es sich um ein Verfahren, welches sich auf die Mustererkennung in nicht gelabelten Datensätzen konzentriert. Anders als beim Supervised Learning ist eine initiale Gruppierung der Daten nicht notwendig. Ziel des Unsupervised Learnings ist es, diese Gruppierungen selbst zu erkennen und versteckte Muster zu entdecken.
Welche Ansätze gibt es im Unsupervised Learning?
Es gibt unterschiedliche Verfahren, welche dem Unsupervised Learning zugeordnet werden.
- K-Means Algorithmus: Hier werden Datenpunkte in K Gruppen eingeteilt. K ist die Anzahl der Cluster basierend auf dem Abstand zu dem Gruppen Zentroiden. Nahe gelegende Punkte werden dem gleichen Cluster bzw. der gleichen Kategorie zugeordnet
- Hierarchisches Clustering: Datenpunkte werden bei diesem Algorithmus initial isoliert als separate Gruppe betrachtet und mit Iterationen zu größeren Gruppen zusammengefasst.
- Assoziationsregeln: Hierbei handelt es sich um eine rollenbasierte Methode, welche die Beziehung zwischen Variablen in dem betrachteten Datenset aufdeckt. Ein Beispiel ist der Apriori Algorithmus, welcher die Häufigkeit von zusammen auftretenden Ausprägungen analysiert und basierend darauf beispielsweise Empfehlungen für Serien oder Bücher ausgibt.
Anwendungsbereiche von Unsupervised Learning
Angewendet wird Unsupervised Learning beispielsweise beim Kategorisieren von Nachrichten. Auch in der Computervision greift man auf die Algorithmen beispielsweise zur Objekterkennung zurück. Im Bereich des Streamings hilft Unsupervised Learning dabei Muster in Daten zu erkennen, um Nutzern passende Empfehlungen auszusprechen. Im Bereich Sicherheit kann man durch Unsupervised Learning Anomalien entdecken und so Fehler und Betrug aufdecken.