Das PalmerPenguins-Datenpaket stellt einen Datensatz zur Verfügung, der Informationen von insgesamt 342 Pinguinen beinhaltet. Der Datensatz kann neben der Datenanalyse auch zur Klassifikation verwendet werden.
Um genauer zu sein: Das Paket beinhaltet eine Tabelle bzw. Matrix (zweidimensionales Datenfeld) bestehend aus 342 Zeilen und fünf Spalten. Jede Zeile beschreibt einen Pinguin anhand der folgenden Daten:
Spalte | Beschreibung | Einheit |
0 | Gattung | - |
1 | Schnabellänge | mm |
2 | Schnabeltiefe | mm |
3 | Flossenlänge | mm |
4 | Gewicht | g |
Dabei kann die Gattung als Klassifikationsergebnis mit folgender Definition angesehen werden:
Wert | Gattung |
0 | Adelie |
1 | Gentoo |
2 | Chinstrap |
Wie genau die Abmessungen des Schnabels zu verstehen sind, zeigt die folgende Abbildung:
Neben der tabellarischen Ausgabe stehen die Daten (normiert bzw. skaliert) vollumfänglich sowie aufgeteilt in Trainings- und Test-Umfang zur Verfügung:
Trainings-Umfang | 228 Pinguine |
Test-Umfang | 114 Pinguine |
Wie genau die Datensätze zu verwenden sind, wird anhand der Beispiele erläutert.
Das PalmerPenguins-Datenpaket wurde anhand von Daten erstellt, die über GitHub zur Verfügung stehen (abgerufen am 21. April 2022). Die Daten wurden mit dem Einverständnis der Palmer Station (Antarctica) unter der Creative Commons Public Domain 1.0 Universell License (CC0 1.0) vertrieben und ursprünglich in folgendem Artikel veröffentlicht:
K.B. Gorman, T.D. Williams, W.R. Fraser. 2014. Ecological sexual dimorphism and environmental variability within a community of Antarctic penguins (genus Pygoscelis). PLoS ONE 9: e90081.
Auch das oben verwendete Bildmaterial wurde GitHub entnommen: Artwork by @allison_horst.
Das PalmerPenguins-Datenpaket wird unter der Creative Commons Public Domain 1.0 Universell License vertrieben:
PalmerPenguins.js | 29. November 2023 | Copyright © 2023 by Daniel Scholz |
Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0