Die folgende Möglichkeit der graphischen Darstellung eignet sich für eine oder mehrere Zahlenreihen, jeweils bestehend aus einer mittleren bis großen Anzahl an Zahlen.
Ein Box-Plot liefert auf einfache Art und Weise einen Eindruck davon, in welchem Bereich die Daten einer Zahlenreihe liegen. Allerdings muss dazu genau verstanden werden, wie ein Box-Plot aufgebaut ist, was wir anhand einer Skizze beschreiben:
Die Kennwerte der Abbildung lassen sich folgendermaßen zusammenfassen:
- Der Median ist gleich dem empirischen 0.50-Quantil, also q(0.50)
- Das untere Quartil (Viertel) ist gleich dem empirischen 0.25-Quantil, also q(0.25)
- Das obere Quartil (Viertel) ist gleich dem empirischen 0.75-Quantil, also q(0.75)
- Der Interquartilsabstand ist die Differenz aus oberen und unteren Quartil, also q(0.75)-q(0.25)
- Der untere Whisker ist gleich dem kleinsten Wert der Zahlenreihe, wobei der untere Whisker nicht kleiner werden darf als das untere Quartil minus das 1.5-fache des Interquartilsabstands
- Der obere Whisker ist gleich dem größten Wert der Zahlenreihe, wobei der obere Whisker nicht größer werden darf als das obere Quartil plus das 1.5-fache des Interquartilsabstands
- Untere Ausreißer sind Zahlen der Zahlenreihe (falls vorhanden), die kleiner sind als der untere Whisker
- Obere Ausreißer sind Zahlen der Zahlenreihe (falls vorhanden), die größer sind als der obere Whisker
Zur Wiederholung: Eine Definition des empirischen p-Quantils findest du hier:
Schaue dir die folgenden Beispiele an, um dich mit Box-Plots vertraut zu machen.
Die ausführliche Dokumentation zum Befehl des nachfolgenden Beispiels findest du im Eda-Paket: