Die Funktion PrincipalComponents.compute(A, n) erwartet folgende (verpflichtende) Argumente:
Argument | Datentyp | Hinweis |
A | Datenfeld | Matrix |
n | Zahl | ganzzahlig, positiv |
Es wird eine Hauptkomponentenanalyse bezüglich der Daten aus A durchgeführt. Dabei wird jede Zeile der Matrix als ein Datensatz angesehen, die Spalten beschreiben entsprechend die Variablen.
Die Zahl n definiert die Anzahl der Hauptkomponenten, die zurückgegeben sowie bei der Transformation berücksichtigt werden: Die Datensätze bzw. Zeile von A werden in einen n-dimensionalen Unterraum projiziert.
Zurückgegeben wird ein Objekt bestehend aus folgenden Variablen:
Variable | Datentyp | Hinweis |
Q | Datenfeld | Matrix (Hauptkomponenten) |
v | Datenfeld | Vektor (Varianzen der Variablen) |
R | Datenfeld | Matrix (Eingangsdaten auf Unterraum projiziert) |
Jede Zeile der Matrix Q entspricht einer Hauptkomponente, jeweils bezogen auf die zugehörigen Varianzen des Vektors v. Die Varianzen sind dabei absteigend sortiert. Das Datenfeld R beinhaltet die auf den neuen n-dimensionalen Unterraum projiziert Eingangsdaten A.
Zudem kann folgende Option verwendet werden:
Variable | Datentyp | Hinweis | Default-Wert |
explained_variance | Zeichenkette | on oder off | off |
Falls die Option explained_variance als on definiert wird, dann werden die kumulierten Varianzen über der Anzahl der Hauptkomponenten dargestellt. Der Abbildung kann somit entnommen werden, wie viele Hauptkomponenten benötigt werden, um die Daten mit einer ausreichenden Genauigkeit zu beschreiben. Damit dient die Darstellung auch als Entscheidungsfindung zur finalen Wahl von n.