Exkurs: Ausreißer

Bislang haben wir unterschiedliche Kennzahlen für Zahlenreihen kennengelernt. Worauf wir aber nicht eingegangen sind, sind die Vor- und Nachteile beispielsweise zwischen Mittelwert und Median. Um dies zu verdeutlichen, gehen wir in diesem Exkurs auf Ausreißer ein:

Bei einem Element einer Zahlenreihe spricht man von Ausreißer, wenn der Wert des Elements nicht den (groben) Erwartungen entspricht.

Ausreißer haben also Werte, die deutlich größer oder kleiner als die sonst üblichen Werten sind (z.B. hervorgerufen durch Messfehler). Und genau hier liegt auch einer der Vorteile zwischen Mittelwert und Median:

Der Median einer Zahlenreihe ist deutlich robuster gegen Ausreißer im Vergleich zum Mittelwert.

Darüber hinaus lässt sich das empirische Quantil nutzen, um Ausreißer einer Messreihe zu identifizieren. Um dies zu verdeutlichen, bezeichnen wir mit das empirische p-Quantil und damit:

Der Wert entspricht also der Differenz zwischen 0.75-Quantil und 0.25-Quantil. Nun lässt sich ein Element einer Zahlenreihe als Ausreißer definieren, falls

gilt. Natürlich lassen sich die Parameter 0.25 und 0.75 sowie 1.5 je nach Anwendungsfall beliebig variieren.

Veranschaulichung
Dargestellt ist eine Zahlenreihe (farbige Punkte) sowie 0.25-Quantil, Median und 0.75-Quantil (graue Linien). Ausreißer wie zuvor definiert werden in Rot dargestellt.
Quiz
Korrelation