KI Lexikon –

Variational Autoencoder (VAE)

Spricht man im Zusammenhang von Machine Learning von Variational Autoencodern (kurz VAE), meint man damit eine bestimmte Architektur künstlicher neuronaler Netze. Bei Variational Autoencodern handelt es sich um eine regulierte Version eines Autoencoders, welche die Generierung neuer Daten ermöglicht, beispielsweise bei der Generierung von Bildern oder digitaler Kunst.

Aufbau und Funktionsweise eines Variational Autoencoders 

Während Autoencoder allein für die Reduktion der Dimensionen und eine Encoder-Decoder-Architektur vorweisen, adressieren Variational Autoencoder das Problem der Inhaltsgenerierung. Hat man einen Autoencoder trainiert, kann man damit Inhalte kodieren und dekodieren, hat aber noch keine Möglichkeit neue Inhalte zu generieren. Ein VAE besteht auch aus einem Decoder und einem Encoder. Statt nur eines latenten Vektors beim Autoencodern, gibt es beim Variational Autoencoder drei Vektoren – den mean Vektor, den standard deviation Vektor und den sampled latent Vektor. Der sampled latent Vektor wählt zufällig Werte aus dem standard deviation Vektor und dem mean Vektor aus. Diese werden an den Decoder übergeben. 

Ein Variational Autoencoder ist reguliert trainiert, um sicherzustellen, dass der latente Raum gute Eigenschaften hat und einer Überanpassung entgegenzuwirken. Diese Regulierung ermöglicht den generativen Prozess neuer Inhalte. 

Das Training des Modells erfolgt in 4 Schritten: 

  1. Kodieren des Eingangs als Verteilung über den latenten Raum 
  2. Ein Punkt der Verteilung wird ausgewählt und genauer betrachtet 
  3. Der Punkt wird dekodiert, sodass der Rekonstruktionsfehler berechnet werden kann 
  4. Der Rekonstruktionsfehler wird durch das neuronale Netz zurückverfolgt 

Anwendungsfall eines VAE 

Ein konkretes Anwendungsbeispiel ist die Analyse einer Gesichterdatenbank. Bilder werden auf unterschiedliche Merkmale, wie Haarfarbe, Geschlecht und Lächeln untersucht. Ein Variational Autoencoder gibt für jedes Merkmal eine Wahrscheinlichkeitsverteilung aus und wählt daraus einen zufälligen Wert. Werden diese zufälligen Werte an den Decoder übergeben, wird ein ähnliches Bild rekonstruiert. 

Auch das Generieren von neuen Gesichtern fällt unter die Anwendung von Variational Autoencodern.