KI Lexikon –
XLNet (eXtreme Transformer)
Was ist XLNet (eXtreme Transformer)?
Bei XLNet handelt es sich um ein neuronales Netzwerk Modell für Natural Language Processing (NLP), also zur natürlichen Sprachverarbeitung. Die Entwicklung erfolgte, um Einschränkungen anderer Transformermodelle, wie zum Beispiel BERT, zu eliminieren. Das Modell liefert somit eine noch bessere Leistung bei NLP Aufgaben.
Wie funktioniert XLNet?
Anders als Transformermodelle wie zum Beispiel BERT, ist XLNet in der Lage, bidirektionale Kontexte zu modellieren. Mit dieser permutations-basierten Architektur ist XLNet in der Lage, alle Tokens gleichzeitig zu berücksichtigen, anstatt nur zwei Richtungen gleichzeitig zu betrachten.
Dazu nutzt XLNet eine Autoregressionsformulierung. Dabei wird die Vorhersage jedes Tokens durch die Summe seiner vorherigen Tokens berechnet. So können durch das Modell mehr Informationen aus dem Textinput gewonnen und eine verbesserte Leistung erzielt werden.
Trainiert wird das Modell mit Hilfe von maschinellem Lernen. Große Textdatenbanken dienen als Lerngrundlage. Das Modell wird dann auf neue Textinputs angewendet, um neue Vorhersagen zu generieren.
Vorteile von XLNet
Im Vergleich zu anderen Transformermodellen zur natürlichen Sprachverarbeitung, hat XLNet einige Vorteile:
- Ganzheitlichere Verarbeitung: XLNet berechnet die Bedeutung jedes einzelnen Tokens auf Basis der gesamten Eingabe. So können bessere Vorhersagen getroffen werden. Verzerrungen bei der Datenverarbeitung werden reduziert.
- Bessere Leistung: XLNet übertrifft Vergleichsmodelle wie BERT in vielen Tests.
- Arbeit mit unvollständigen Informationen möglich: XLNet ist in der Lage, mit unvollständigen Informationen zu arbeiten und ist somit auch in schwierigen Umgebungen einsetzbar.
- Umfangreiche Einsatzmöglichkeiten: XLNet kann für viele NLP Aufgaben trainiert werden. Dazu gehören zum Beispiel die Sentimentalanalyse, die Textklassifikation sowie die Fragenbeantwortung.
XLNet ist mit seinen Vorteilen somit ein wichtiger Fortschritt für den Bereich von NLP Aufgaben.