Nachdem wir gelernt haben, was Entscheidungsbäume sind und wie diese mittels Trainingsdaten erstellt werden können, sammeln wir praktische Erfahrungen mit der Klassifikation von Schwertlilien:
Das IrisFlower-Paket beinhaltet Datensätze, um Blumen der Gattung Schwertlilie (Iris) anhand der Größe der Blütenblätter hinsichtlich dreier Arten der Gattung zu klassifizieren.
Um genauer zu sein: Die Blüte der Schwertlilie wird anhand der Kron- und Klechblätter beschrieben:
Als Klassifikationsergebnis wird jeder Blüte eine der folgenden Arten zugewiesen:
index | Beschreibung |
0 | Borsten Schwertlilie (Iris setosa) |
1 | Verschiedenfarbige Schwertlilie (Iris versicolor) |
2 | Virginische Schwertlilie (Iris virginica) |
Die Daten des Pakets sind in einen Trainings- und einen Test-Umfang aufgeteilt:
Trainings-Umfang | 100 Objekte |
Test-Umfang | 50 Objekte |
Im folgenden Beispiel werden diese Daten verwendet, um einen Entscheidungsbaum anhand der Trainingsdaten zu erstellen sowie anhand der Testdaten zu evaluieren. Hierzu kommt das DecisionTree-Paket zum Einsatz:
Die Wahl des Merkmals findet gemäß der periodischen Vorgehensweise statt und die Schwellwerte werden auf Grundlage der Mittelwert-Regel bestimmt.