Merkmale im Vergleich

Bislang haben wir nur einzelne Merkmale untersucht, nun möchten wir jeweils zwei Merkmale im Verhältnis zueinander betrachten. Und auch das weiterhin im Vergleich zwischen den drei Arten.

Dazu sei bemerkt, dass die Eda.pick Funktion nicht nur verwendet werden kann, um einzelne Spalten zu extrahieren. Es können auch mehrere Spalten gleichzeitig ausgegeben werden:

Zur Referenz

Die Funktion liefert in diesem Falle entsprechend keine Zahlenreihe (eindimensionales Datenfeld), sondern eine Tabelle (zweidimensionales Datenfeld) zurück. Mit anderen Worten erhalten wir einen reduzierten Datensatz, bei dem einige Zeilen und Spalten des Originaldatensatzes entfernt wurden.

Beispiel
Zwei Merkmale im Vergleich zueinander.
Beispiel
Zwei Merkmale im Vergleich zueinander.

Die Streudiagramme zuvor, insbesondere wenn man sich mehrere Kombinationsmöglichkeiten der Merkmale anschaut, lassen weitere Aussagen über den Datensatz zu:

Es lässt sich vermuten, dass der Datensatz durchaus sehr gut zur Klassifikation geeignet ist. Mit anderen Worten: Anhand der Längen und Breiten der Kelch- und Kronblätter lässt sich eine Schwertlilie durchaus in eine der drei Arten klassifizieren.

Die Aussage zuvor beruht auf der Beobachtung, dass die Blüten der drei Klassen im Streudiagramme jeweils in mehr oder weniger abgegrenzten Clustern auftauchen. Wären in allen Streudiagramme alle bunten Punkt wild durchmischt, könnte man noch keine Aussage darüber treffen, ob sich der Datensatz zur Klassifikation eignet oder nicht.

Quiz
Was passiert, falls p = [0,0] gewählt wird, also Kelchblattlänge über Kelchblattlänge dargestellt wird?
Es erscheint eine Fehlermeldung.
Es erscheint ein Koordinatensystem, aber ohne Inhalt/Punkte.
Alle Punkte liegen exakt auf einer Geraden.
Korrelationsmatrix