Umfang der Trainingsdaten

In der folgenden Experimentieraufgabe untersuchen wir einen weiteren Parameter, der das Testergebnis erheblich beeinflussen kann, nämlich den Umfang der Trainingsdaten: Es wird ein neuronales Netz zum Layout [2,16,16,5] trainiert und getestet, wobei 20 000 Iterationen sowie eine Batchsize von 100 verwendet wird.

Hinweis: Aufgrund des gewählten Layouts nimmt die Trainingsphase (in Abhängigkeit deines Geräts) durchaus ein wenig Zeit in Anspruch.

Nach der Trainingsphase wird das neuronale Netz jeweils an Testdaten wie zuvor bestehend aus 2000 Punkten evaluiert. Zurückgegeben wird schließlich die Anzahl der korrekt klassifizierten Testdaten.

Anwendung
Über die Buttons kannst du den Umfang der Trainingsdaten variieren und eine Trainings- sowie anschließende Testphase durchführen.
Aufgabe

Protokolliere jeweils die Anzahl der korrekt klassifizierten Testdaten in folgender Grafik:

Anhand der Experimentieraufgabe sollte eindeutig zu erkennen sein, dass der Umfang der Trainingsdaten einen erheblichen Einfluss auf das Testergebnis haben kann. Dabei gilt sogar:

Falls die Batchsize kleiner ist als die Anzahl der Trainingsdaten, dann bedeutet ein größerer Umfang der Trainingsdaten keine Steigerung in der Rechenzeit der Trainingsphase.

Das bedeutet zusammenfassend: Je mehr Trainingsdaten zur Verfügung stehen, desto besser kann das neuronale Netz zur Lösung einer Klassifikationsaufgabe trainiert werden.

Quiz
Hast du dich mit der Anwendung beschäftigt?
ja
nein
Zusammenfassung