Ausblick

Bislang hatten wir es ausschließlich mit neuronalen Netzen zu tun, bei denen die Gewichte und Schwellwerte bereits berechnet wurden. Dabei besteht die zentrale Aufgabe jeweils darin, genau diese zu bestimmen. Als Ausblick möchten wir die grobe Vorgehensweise skizzieren.

Wie beim maschinellen Lernen üblich, werden Datensätze benötigt, um ein Modell (neuronales Netz) trainieren und testen zu können. Bezogen auf Klassifikationsaufgaben bedeutet dies, dass viele Objekte in einem Datensatz (Tabelle) zusammengefasst werden. Jedes Objekt wird beschrieben durch seine Eingangsdaten bzw. Merkmale sowie dem bekannten Klassifikationsergebnis, dem Label:

Merkmal 1Merkmal 2...Merkmal nLabel
Objekt 1WertWert...WertIndex der Klasse
Objekt 2WertWert...WertIndex der Klasse
...............
Objekt mWertWert...WertIndex der Klasse

Der gesamte Datensatz wird nun in zwei Umfänge aufgeteilt, nämlich in Trainingsdaten und Testdaten.

Trainingsphase

Die Trainingsdaten werden genutzt, um die Parameters eines Verfahrens zur Lösung der Klassifikationsaufgabe (bezogen auf die Trainingsdaten) bestmöglich zu bestimmen. Im Falle von neuronalen Netzen bedeutet dies, die Gewichte und Schwellwerte unter Verwendung der Trainingsdaten derart zu berechnen, sodass möglichst viele Trainingsdaten korrekt klassifiziert werden können.

Man spricht an dieser Stelle von der sogenannten Trainingsphase. Algorithmisch handelt es sich dabei um ein mathematisches Optimierungsverfahren, auf das wir in einem fortgeschrittenen Kurs eingehen werden.

Testphase

Sind die Parameter (Gewichte und Schwellwerte) bestimmt, können die Testdaten zur Evaluierung verwendet werden. Damit ergibt sich schließlich eine Aussage darüber, wie gut das neuronale Netz zur Lösung der Klassifikationsaufgabe geeignet ist. Auch hierauf gehen wir in einem gesonderten Kurs näher ein.

Quiz

Die folgenden Fragen beziehen sich auf das zuvor besprochene Beispiel zur Klassifikation von Pilzen.

Wie viele Merkmale besitzt der Datensatz zur Klassifikation von Pilzen?
2
6
10
48
Wie viele unterschiedliche Label besitzt der Datensatz zur Klassifikation von Pilzen?
2
6
10
48
Zur Übersicht