Batchsize

Ein weiterer Parameter der Trainingsphase ist die sogenannte Batchsize oder Losgröße. Denn insbesondere um Rechenzeit zu sparen, werden in jeder Iteration der Trainingsphase nicht sämtliche Datensätze (Punkte) der Trainingsmenge zur Verbesserung der Gewichte und Schwellwerte herangezogen, sondern nur ein Teil davon.

Die Batchsize bestimmt die Anzahl der Trainingsobjekte (Punkte), die pro Iteration der Trainingsphase ausgewählt werden. Mit anderen Worten: In jeder Iteration der Trainingsphase wird gemäß der Batchsize nur ein Teil der Trainingsdaten zufällig ausgewählt und diesbezüglich trainiert (bzw. optimiert).

Die folgende Abbildung zeigt eine Analyse zur Wahl der Batchsize, wobei jeweils ein neuronales Netz zum Layout [2,8,8,3] trainiert wurde:

Dargestellt ist die Anzahl der korrekt klassifizierten Trainingsdaten in Abhängigkeit der Anzahl der Iterationen der Trainingsphase. Dabei wurden folgende Werte für die Batchsize verwendet:

blauBatchsize = 4
rotBatchsize = 10
grünBatchsize = 100

Je größer die Batchsize, desto weniger Iterationen werden benötigt, um bereits gute Klassifikationsergebnisse zu erzielen. Allerdings nimmt die Rechenzeit der Trainingsphase entsprechend zu. Zudem sind bei einer kleinen Batchsize größere statistische Schwankungen zu beobachten.

Quiz
Je kleiner die Batchsize, desto geringer ist die Rechenzeit der Trainingsphase.
Die Aussage ist wahr.
Die Aussage ist falsch.
Mit einer kleinen Batchsize können niemals so gute Ergebnisse erzielt werden wie mit einer großen Batchsize.
Die Aussage ist wahr.
Die Aussage ist falsch.
Umfang der Trainingsdaten