Box-Plot

Die folgende Möglichkeit der graphischen Darstellung eignet sich für eine oder mehrere Zahlenreihen, jeweils bestehend aus einer mittleren bis großen Anzahl an Zahlen.

Ein Box-Plot liefert auf einfache Art und Weise einen Eindruck davon, in welchem Bereich die Daten einer Zahlenreihe liegen. Allerdings muss dazu genau verstanden werden, wie ein Box-Plot aufgebaut ist, was wir anhand einer Skizze beschreiben:

Die Kennwerte der Abbildung lassen sich folgendermaßen zusammenfassen:

  1. Der Median ist gleich dem empirischen 0.50-Quantil, also q(0.50)
  2. Das untere Quartil (Viertel) ist gleich dem empirischen 0.25-Quantil, also q(0.25)
  3. Das obere Quartil (Viertel) ist gleich dem empirischen 0.75-Quantil, also q(0.75)
  4. Der Interquartilsabstand ist die Differenz aus oberen und unteren Quartil, also q(0.75)-q(0.25)
  5. Der untere Whisker ist gleich dem kleinsten Wert der Zahlenreihe, wobei der untere Whisker nicht kleiner werden darf als das untere Quartil minus das 1.5-fache des Interquartilsabstands
  6. Der obere Whisker ist gleich dem größten Wert der Zahlenreihe, wobei der obere Whisker nicht größer werden darf als das obere Quartil plus das 1.5-fache des Interquartilsabstands
  7. Untere Ausreißer sind Zahlen der Zahlenreihe (falls vorhanden), die kleiner sind als der untere Whisker
  8. Obere Ausreißer sind Zahlen der Zahlenreihe (falls vorhanden), die größer sind als der obere Whisker

Zur Wiederholung: Eine Definition des empirischen p-Quantils findest du hier:

Zur Referenz

Schaue dir die folgenden Beispiele an, um dich mit Box-Plots vertraut zu machen.

Die ausführliche Dokumentation zum Befehl des nachfolgenden Beispiels findest du im Eda-Paket:

Zur Referenz

Beispiel
Einfaches Beispiel zur graphischen Darstellung.
Beispiel
Es werden zwei Zahlenreihen (Spalten) des SocialAds-Datenpakets dargestellt.

Im Beispiel zuvor wurde die Funktion Eda.pick verwendet. Diese dient dazu, eine Spalte eines Datensatzes (in Form einer Tabelle bzw. eines zweidimensionalen Datenfeldes) als einzelne Zahlenreihe auszugeben.

Die ausführliche Dokumentation zur .pick-Funktion findest du im Eda-Paket:

Zur Referenz

Quiz
Wo groß ist der Anteil der Zahlen einer Zahlenreihe, die sich im Bereich zwischen oberen und unteren Quartil befinden?
unter 10%
25%
50%
75%
über 90%
Es kann nur dann untere Ausreißer geben, wenn es keine oberen Ausreißer gibt und umgekehrt.
Die Aussage ist korrekt
Die Aussage ist falsch
Histogramm