Korrelationsmatrix

Eine Möglichkeit, um alle Kombinationen von je zwei Merkmalen in einer Übersicht zu bündeln, ist die Korrelationsmatrix. Diese beinhaltet die Korrelationen zwischen je weil Merkmalen:

Alle Einträge der Korrelationsmatrix haben einen Wert zwischen -1 und +1. Je näher ein Eintrag der Matrix an -1 bzw. +1, desto größer ist der lineare Zusammenhang zwischen den zugehörigen Merkmalen.

Am Beispiel des IrisFlower-Datensatzes macht die Korrelationsmatrix jedoch nur für die ersten vier Merkmale Sinn, da das fünfte Merkmal lediglich die Art der Gattung definiert.

Zur Referenz

Beispiel
Korrelationsmatrix zum IrisFlower-Datensatz.

Die Korrelationsmatrix zuvor ist zwar schön und gut, aber eigentlich hat diese keine Aussagekraft bezogen auf unseren Datensatz bestehend aus Blüten von drei Arten der Gattung Schwertlilie. Viel aussagekräftiger ist die Korrelationsmatrix, wenn auch hier die Daten der drei Arten getrennt voneinander betrachtet werden.

Beispiel
Korrelationsmatrix zum IrisFlower-Datensatz.
Quiz
Bei welcher Art der Gattung besitzt die Korrelationsmatrix negative Einträge?
Iris setosa
Iris versicolor
Iris virginica
bei keiner der drei Arten
Exkurs Dokumentation