KI Lexikon –
Named Entity Recognition
Named Entity Recognition betitelt als Teildisziplin der Computerlinguistik die Identifikation und Klassifikation von Eigennamen in Texten und wird beispielsweise zur Verschlagwortung von Texten und der Beantwortung von Suchanfragen angewendet.
Was versteht man unter Named Entity Recognition?
Named Entity Recognition, zu Deutsch Eigennamenerkennung, bezeichnet die Disziplin, natürliche Sprache mittels Computer zu verarbeiten. Unter Eigennamen versteht man ein Wort bzw. eine Wortfolge, die eine Entität, also eine Person, einen Ort oder ein Datum benennt. Speziell geht es darum, diese Eigennamen zu erkennen und in Kategorien einzuordnen. Der Nutzen dieses Ansatzes ist zur Informationsextraktion groß und für das Verständnis des Textes durch einen Computer unverzichtbar.
Auf welche Verfahren greift Named Entity Recognition zurück?
Es existieren unterschiedliche Ansätze zur Implementierung von Named Entity Recognition. Sie können wörterbuchbasiert sein. Dann werden Texte mit Wörterbüchern verglichen, um Entitäten in diesen zu finden. Außerdem gibt es den regelbasierten Ansatz. Dabei werden kontextbasierte Regeln genutzt, um Eigennamen in Texten zu identifizieren. Der Machine Learning Ansatz nutzt mittels vorbereiteter Datensätzen trainierte Modelle. Dieser Ansatz verspricht die höchste Erfolgsquote, sofern die Menge und Qualität der zum Training verwendeten Daten hoch sind.
Welche Anwendungsfälle und Einsatzmöglichkeiten hat Named Entity Recognition?
Vor allem bei der Arbeit mit großen Textmengen, sind die Anwendungsmöglichkeiten der Named Entity Recognition vielfältig. Überall dort, wo Informationen aus Texten automatisch extrahiert werden sollen, sind die Methoden hilfreich. Dies ist zum Beispiel der Fall, wenn viele Texte automatisch verschlagwortet werden sollen. Außerdem ist die Filterung und Kategorisierung von Kundenanfragen denkbar. Named Entity Recognition ermöglich die automatische Analyse von Nachrichtentrends. Im medizinischen Bereich kann sie helfen, um klinische Texte zu kategorisieren.