Last Updated on 2 Jahren by Christian Kaiser

KI Lexikon –

Data Augmentation

Was ist Data Augmentation?

Mit Data Augmentation kann durch maschinelles Lernen die Größe des Trainingsdatensatzes erhöht werden, indem synthetische Daten generiert werden. Bereits vorhandene Daten werden durch Data Augmentation verändert.

Wo kommt Data Augmentation zum Einsatz?

Data Augmentation kommt immer dann zum Einsatz, wenn eine Vielzahl an Datensätzen benötigt wird. Das ist vor allem in den folgenden Bereichen der Fall:

  • Bilderkennung: Bilder werden durch Data Augmentation gedreht, beschnitten, gespiegelt sowie verändert oder erweitert werden. Auch die Perspektiven sowie Beleuchtungsbedingungen können im Rahmen von Data Augmentation abgewandelt werden. So können aus einem Bild mehrere Bilder erzeugt werden, die im Training eines Modells genutzt werden können.
  • Object Detection beziehungsweise die Objekterkennung: Objekte, können auf einem Bild erkannt werden, und können mithilfe von Data Augmentation gedreht, skaliert und beschnitten werden, um das Objekt an unterschiedliche Stellen im Bild zu platzieren.
  • Bei Natural Language Processing  (NLP) kann der Satzbau verändert werden. Darüber hinaus können Wörter hinzugefügt oder entfernt werden, um unterschiedliche Schreibstile nachzuahmen.

Warum ist Data Augmentation so wichtig?

Vor allem beim Anlernen von Künstlicher Intelligenz durch maschinelles Lernen und Deep Learning wird eine Vielzahl an Datensätzen gebraucht, um ein adäquates Modell zu trainieren. Denn je mehr Datensätze im Training genutzt werden, desto besser wird das Modell arbeiten. Vor allem, wenn die Sammlung und das Zusammentragen von Daten dabei sehr aufwändig ist, hilft Data Augmentation, eine Vielzahl an Datensätzen auf Basis von vorhandenen Daten zu generieren.