Korrelation

Abschließend stellen wir eine Kennzahl vor, um nun zwei Zahlenreihen miteinander zu vergleichen bzw. in Verbindung zu setzen:

Die Korrelation oder der Korrelationskoeffizient zweier Zahlenreihen (englisch: correlation) ist ein Maß für den Grad des linearen Zusammenhangs der beiden Zahlenreihen.

Für zwei Zahlenreihen

mit jeweils Elementen lässt sich die Korrelation folgendermaßen berechnen:

Dabei sind und die Mittelwerte der Zahlenreihen und . Wichtig sind insbesondere die folgenden Eigenschaften:

Für die Korrelation bzw. für den Korrelationskoeffizienten zweier Zahlenreihen gilt:

  1. Die Korrelation hat stets einen Wert zwischen -1 und +1.
  2. Bei einem Wert von +1 bzw. von -1 besteht ein vollständig linearer Zusammenhang zwischen den Zahlenreihen.
  3. Bei einem Wert von 0 lässt sich (statistisch) kein linearer Zusammenhang zwischen den Zahlenreihen erkennen.

Diese Eigenschaften können auch in der folgenden Anwendung beobachtet werden. Dort wird ein Datensatz erzeugt, der als Liste von Punkten angesehen werden kann:

x-Koordinatey-Koordinate
Punkt 1ZahlenwertZahlenwert
Punkt 2ZahlenwertZahlenwert
.........
Punkt mZahlenwertZahlenwert

Berechnet wird der Korrelationskoeffizient zwischen den beiden Spalten des Datensatzes.

Die Dokumentation zur Funktion findest du im Statistics-Paket:

Zur Referenz

Veranschaulichung
Es werden zwei zufällige Zahlenreihen erstellt sowie in einem Koordinatensystem dargestellt. Zudem wird der Korrelationskoeffizient berechnet.
Beispiel
Es wird der Korrelationskoeffizient zweier Zahlenreihen berechnet.
Beispiel
Es wird der Korrelationskoeffizient zweier Zahlenreihen des SocialAds-Datenpakets berechnet.
Quiz
Was ist der Korrelationskoeffizient der folgenden Zahlenreihen: [1, 2, 3, 4, 5, 6] und [7, 3, 2, -5, 8, 1]
-1.00
-0.29
-0.25
0.00
0.29
0.64
Was ist der Korrelationskoeffizient der Zahlenreihen von Merkmal 1 (Index 0) und Merkmal 4 (Index 3) des SocialAds-Datenpakets?
-1.00
-0.29
-0.25
0.00
0.29
0.64
Korrelationsmatrix