Testphase

Selbst wenn das neuronale Netz aus der Anwendung zuvor sehr zuverlässige Ergebnisse liefert, kann keineswegs davon ausgegangen werden, dass das neuronale Netz im Allgemeinen sinnvoll zur Lösung der Schwertlilien-Klassifikationsaufgabe eingesetzt werden kann. Denn:

Es besteht die Möglichkeit, dass während der Trainigsphase die Gewichte und Schwellwerte derart bestimmt werden, sodass die Klassifikationsaufgabe lediglich bezogen auf die Trainingsdaten zuverlässig gelöst werden kann.

Was daher benötigt wird, ist eine Testphase, die durchzuführen ist, nachdem das neuronale Netz trainiert wurde. Die grundlegende Vorgehensweise ist daher folgende:

  1. Anhand der Trainingsdaten wird das neuronale Netz dahingehend trainiert, sodass die Klassifikationsaufgabe (bezogen auf die Trainingsdaten) möglichst gut gelöst wird.
  2. Anschließend werden Testdaten verwendet, um das (bereits trainierte) neuronale Netz zu testen. Ziel ist es, möglichst viele der Testdaten korrekt zu klassifizieren.

Genau wie bei den Trainingsdaten benötigen wir auch bei den Testdaten Eingangssignale mit jeweils bekanntem Klassifikationsergebnis. Wenn wir nun einen Datensatz haben, beispielsweise bestehend aus 150 Blüten mit jeweils bekannter Art der Schwertlilien, dann wird dieser zufällig in Trainigs- und Testdaten aufgeteilt:

Während der Testphase wird nun geschaut, wie viele Eingangssignale der Testdaten korrekt klassifiziert werden. Das Ergebnis wird häufig als prozentualer Anteil zurückgegeben. Dabei gilt wie gehabt:

Um sich für ein Klassifikationsergebnis zu entscheiden, wird jeweils das Objekt gewählt, dessen Ausgangsneuron den größten Wert hat.

In der folgenden Anwendung kannst du das Ergebnis der Testphase bezogen auf die Schwertlilien-Klassifikationsaufgabe beobachten.

Es zu beachten, dass der Zufall eine zentrale Rolle spielt: bei der Aufteilung des Datensatzes in Trainingsmenge und Testmenge sowie beim Trainieren des neuronalen Netzes.

Anwendung
Der Datensatz zur Klassifikation von Schwertlilien (150 Blüten) wird zufällig aufgeteilt in Trainingsdaten (100 Blüten) und Testdaten (50 Blüten). Anschließend wird ein neuronales Netz trainiert und getestet.
Aufgabe

Mache dich mit der Anwendung zuvor vertraut. Führe eine kleine Statistik und ermittle, wie viel Prozent der Testdaten durchschnittlich korrekt klassifiziert werden. Was war das schlechteste und was das beste Ergebnis?

Quiz
Konfusionsmatrix