Analyse der Varianzen

Die Hauptkomponentenanalyse liefert neben den Hauptkomponenten auch die zugehörigen Varianzen zurück. Hauptkomponenten mit einer zugehörigen Varianz von null oder nahe null tragen nicht oder vernachlässigbar wenig zum Informationsgehalt der gesamten Datenmatrix bei. Deutlich wird dies, wenn die kumulierten Varianzen über der Anzahl der Hauptkomponenten aufgetragen werden. Am Beispiel der Varianzen der 2016 Hauptkomponenten der YaleFaces-Datenmatrix erhalten wir folgendes Ergebnis:

Der Abbildung ist zu entnehmen, dass vergleichsweise wenig Hauptkomponenten bzw. Eigengesichter ausreichend sind, um die Gesichter der Datenmatrix mit nur geringem Qualitätsverlust zu reproduzieren. Genauer analysieren werden wir dies im nachfolgenden Abschnitt.

Beispiel
Darstellung der kumulierten Varianzen über der Anzahl der Hauptkomponenten.
Quiz
Wie viel Informationsgehalt bleibt behalten, wenn die Datenmatrix aus dem Beispiel zuvor unter Verwendung der ersten 100 Hauptkomponenten reduziert wird?
ca. 25%
ca. 50%
ca. 75%
nahezu 100%
Inverse Transformation