Da der Umfang der Trainingsdaten bei Entscheidungsbäumen von zentraler Bedeutung ist, wollen wir dazu ein wenig Erfahrungen sammeln. Um genauer zu sein, beschäftigen wir uns mit der Klassifikation bunter Punkte in der Ebene unter Verwendung des ClassificationData-Pakets:
Im folgenden Beispiel werden Punkte in der Ebene zufällig verteilt, die in vier Farben klassifiziert werden sollen. Ein Trainings-Umfang bestehend aus 500 Punkten sieht etwa so aus:
Anhand dieser Klassifikationsaufgabe kann sehr schön der Einfluss des Umfangs der Trainingsdaten verdeutlicht werden.