Die Klassifikationsaufgabe

Zur Veranschaulichung eines einfachen Klassifikationsproblems erzeugen wir insgesamt 2000 Objekte mit jeweils (bekannter) zugehöriger Klasse. Um genauer zu sein: Die Objekte besitzen zwei Merkmale als Zahlen zwischen 0 und 1, sodass die Merkmale auch als Koordinaten eines Punktes angesehen werden können. Wir klassifizieren in drei Klassen (rot, grün und blau), wobei die zu den Objekten gehörige Klasse in der visuellen Darstellung jeweils als Farbe dargestellt wird.

Eine Möglichkeit, um derartige Datensätze erstellen zu können, bietet das ClassificationData-Paket:

Zur Referenz

Beispiel
Es wird ein Datensatz bestehend aus 2000 Objekten erzeugt: Jedes Objekt beinhaltet die Koordinaten eines Punktes (.input) sowie die zugehörige Klasse gekennzeichnet durch ihre Farbe als Zeichenkette (.color).

Anhand der Ausgabe können wir auch die vierte Annahme des Abschnitts zuvor genauer verstehen: Dass Objekte einer Klasse gewisse Ähnlichkeiten aufweisen, lässt sich daran erkennen, dass es in der visuellen Darstellung einzelne Regionen gibt, in denen alle Objekte bzw. Punkte dieselbe Farbe haben und somit zur selben Kategorie gehören.

Die zugehörige Klassifikationsaufgabe bedeutet nun, dass weiteren Objekten (Koordinaten eines Punktes bzw. zwei Zahlen zwischen 0 und 1) jeweils eine der drei Klassen (rot, grün und blau) zugewiesen werden. Und zwar derart, sodass die beobachteten Ähnlichkeiten (d.h. Regionen der Farben) beibehalten bleiben.

Im Folgenden werden wir diese Klassifikationsaufgabe unter Verwendung neuronaler Netze genauer untersuchen.

Quiz

In dieser Aufgabe untersuchen wir die zuvor eingeführte Klassifikationsaufgabe: Gegeben sind bereits 2000 Punkte mit bekanntem Klassifikationsergebnis (rot, grün und blau). Nun kommen drei Punkte hinzu und es soll entschieden werden, zu welcher Klasse bzw. Farbe die neuen Punkte gehören.

Was ist das erwartete Klassifikationsergebnis von Punkt A?
rot
grün
blau
nicht eindeutig
Was ist das erwartete Klassifikationsergebnis von Punkt B?
rot
grün
blau
nicht eindeutig
Was ist das erwartete Klassifikationsergebnis von Punkt C?
rot
grün
blau
nicht eindeutig
Trainingsdaten