Beispiel Essbarkeit von Pilzen

Unser erstes Anwendungsbeispiel besteht darin, anhand von zehn äußeren Merkmalen zu entscheiden, ob ein Pilz essbar ist oder nicht (giftig bzw. ungesund).

Mit der Skizze zuvor lassen sich die zehn Merkmale folgendermaßen beschreiben:

Merkmal 1Form des Hutes
Merkmal 2Oberfläche des Hutes
Merkmal 3Farbe des Hutes
Merkmal 4Abstand der Lamellen
Merkmal 5Farbe der Lamellen
Merkmal 6Oberfläche des Stiels (oberhalb des Ringes)
Merkmal 7Oberfläche des Stiels (unterhalb des Ringes)
Merkmal 8Farbe des Stiels (oberhalb des Ringes)
Merkmal 9Farbe des Stiels (unterhalb des Ringes)
Merkmal 10Typ des Ringes
ZielvariablePilz essbar (0) oder Pilz giftig (1)

Wie genau die Merkmale als Zahlenwert beschrieben werden, kann dem PDF-Dokument entnommen werden:

mushroom.pdf

Der zugehörige Datensatz samt ausführlicher Dokumentation befindet sich hier:

Zur Referenz

Der gesamte zur Verfügung stehende Datensatz wird in zwei Umfänge aufgeteilt:

  1. Trainingsdaten: Dieser Teil des Datensatzes wird verwendet, um eine logistische Regression durchzuführen (d.h., um die Parameter der Modellfunktion zu bestimmen).
  2. Testdaten: Anschließend kann dieser Teil genutzt werden, um das Ergebnis der Regression zu evaluieren (d.h., die Objekte der Testdaten werden von der Modellfunktion ausgewertet).

Wie dies genau aussehen kann, demonstrieren wir am folgenden Beispiel. Dort werden die Trainingsdaten verwendet, um eine logistische Regression durchzuführen bzw. um die Modellfunktion zu bestimmen. Anschließend wird ein zufälliges Objekt der Testdaten gewählt, um dieses an der Modellfunktion auszuwerten.

Beispiel
Regressionsaufgabe zur Klassifikation von Pilzen.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut. Schaue dir neben der Dokumentation des Mushroom-Datensatzes auch die Referenz des LogisticRegression-Paketes an:

Zur Referenz

Führe den Quellcode mehrfach aus und diskutiere, ob die Essbarkeit der Pilze mittels logistischer Regression gut vorhergesagt werden kann.

Quiz
Trainings- und Testphase