Mushroom

Das Mushroom-Datenpaket beinhaltet Daten, um Pilze hinsichtlich ihrer Essbarkeit zu klassifizieren. Genauer wird jeder Pilz durch zehn äußere Merkmale beschrieben, um dadurch in essbar oder nicht essbar (giftig) zu klassifizieren:

IndexBeschreibung
0Form des Hutes
1Oberfläche des Hutes
2Farbe des Hutes
3Abstand der Lamellen
4Farbe der Lamellen
5Oberfläche des Stiels (oberhalb des Ringes)
6Oberfläche des Stiels (unterhalb des Ringes)
7Farbe des Stiels (oberhalb des Ringes)
8Farbe des Stiels (unterhalb des Ringes)
9Typ des Ringes
10Pilz essbar (0) oder Pilz giftig (1)

Die genaue Definition dieser Merkmale kann folgendem PDF-Dokument entnommen werden:

mushroom.pdf

Die Daten können verwendet werden, um eine Klassifikationsaufgabe zu formulieren. Für diesen Anwendungsfall werden die insgesamt 1773 Objekte (Pilze) in Trainings- und Testdaten aufgeteilt, wobei die zu bestimmende Größe die Essbarkeit ist:

Trainings-Umfang886 Pilze
Test-Umfang887 Pilze

Wie genau die Datensätze zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.

Datenquelle

Das Mushroom-Datenpaket wurde anhand von Daten erstellt, die als Mushroom Data Set über das UCI Machine Learning Repository zur Verfügung stehen (abgerufen am 14. Juni 2021). Diese Daten werden unter der Creative Commons Public Domain 1.0 Universell License (CC0 1.0) vertrieben.

Lizenzhinweis

Das Mushroom-Datenpaket wird unter der Creative Commons Public Domain 1.0 Universell License vertrieben:

Mushroom.js29. November 2023Copyright © 2023 by Daniel Scholz

Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0

Übersicht
Das Mushroom-Datenpaket stellt folgende Funktionen zur Verfügung:
Download
Das Mushroom-Datenpaket steht über folgenden Link zum Download bereit.
Beispiel
Es werden die Daten des Mushroom-Pakets ausgelesen.
Beispiel
Der Trainings-Umfang des Mushroom-Pakets wird verwendet, um ein neuronales Netz zu trainieren. Anschließend wird anhand des Test-Umfangs überprüft, wie viele Test-Datensätze tatsächlich korrekt klassifiziert werden.