Statistische Kennzahlen

Falls (wie in unserem Falle) ein Datensatz in Form einer Tabelle zu erkunden ist, so kann es sinnvoll sein, sich als allererstes die wichtigsten statistischen Kennzahlen der Merkmale bestimmen zu lassen. Hierzu stellt das Statistics-Paket folgenden Befehl zur Verfügung:

Der Befehl Statistics.explore dient dazu, die wichtigsten statistischen Kennzahlen eines tabellarischen Datensatzes zu bestimmen.

Zur Referenz

Wie auch der Referenz entnommen werden kann, haben die Zeilen der Darstellung folgende Bedeutung:

countAnzahl der Elemente der Spalte / des Merkmals
meanMittelwert der Spalte / des Merkmals
stdStandardabweichung der Spalte / des Merkmals
minMinimalwert der Spalte / des Merkmals
p25unteres Quartil der Spalte / des Merkmals
p50Median der Spalte / des Merkmals
p75oberes Quartil der Spalte / des Merkmals
maxMaximalwert der Spalte / des Merkmals

Als kleine Hilfestellung zum Beispiel sowie zum nachfolgenden Quiz wiederholen wir zudem die Merkmale des Datensatzes:

index.0=Merkmal 1=Kelchblattlänge=erste Spalte des Datensatzes
index.1=Merkmal 2=Kelchblattbreite=zweite Spalte des Datensatzes
index.2=Merkmal 3=Kronblattlänge=dritte Spalte des Datensatzes
index.3=Merkmal 4=Kronblattbreite=vierte Spalte des Datensatzes
index.4=Merkmal 5=Art der Gattung=fünfte Spalte des Datensatzes
Beispiel
Wichtige statistische Kennzahlen des IrisFlower-Datensatzes.
Quiz
Was ist der Mittelwert der Kelchblattbreite?
0.10
0.83
3.05
1.80
2.00
5.80
Was ist der Minimalwert der Kronblattbreite?
0.10
0.83
3.05
1.80
2.00
5.80
Was ist das obere Quartil der Kronblattbreite?
0.10
0.83
3.05
1.80
2.00
5.80
Wertebereich der Merkmale