Statistische Kennzahlen
Falls (wie in unserem Falle) ein Datensatz in Form einer Tabelle zu erkunden ist, so kann es sinnvoll sein, sich als allererstes die wichtigsten statistischen Kennzahlen der Merkmale bestimmen zu lassen. Hierzu stellt das Statistics-Paket folgenden Befehl zur Verfügung:
Der Befehl Statistics.explore dient dazu, die wichtigsten statistischen Kennzahlen eines tabellarischen Datensatzes zu bestimmen.
Wie auch der Referenz entnommen werden kann, haben die Zeilen der Darstellung folgende Bedeutung:
count | Anzahl der Elemente der Spalte / des Merkmals |
mean | Mittelwert der Spalte / des Merkmals |
std | Standardabweichung der Spalte / des Merkmals |
min | Minimalwert der Spalte / des Merkmals |
p25 | unteres Quartil der Spalte / des Merkmals |
p50 | Median der Spalte / des Merkmals |
p75 | oberes Quartil der Spalte / des Merkmals |
max | Maximalwert der Spalte / des Merkmals |
Als kleine Hilfestellung zum Beispiel sowie zum nachfolgenden Quiz wiederholen wir zudem die Merkmale des Datensatzes:
index.0 | = | Merkmal 1 | = | Kelchblattlänge | = | erste Spalte des Datensatzes |
index.1 | = | Merkmal 2 | = | Kelchblattbreite | = | zweite Spalte des Datensatzes |
index.2 | = | Merkmal 3 | = | Kronblattlänge | = | dritte Spalte des Datensatzes |
index.3 | = | Merkmal 4 | = | Kronblattbreite | = | vierte Spalte des Datensatzes |
index.4 | = | Merkmal 5 | = | Art der Gattung | = | fünfte Spalte des Datensatzes |