Bevor wir uns mit der zentralen Frage diesen Kurses befassen, nämlich wie neuronale Netze trainiert werden können, wollen wir zunächst verstehen, was Klassifikationsprobleme allgemein überhaupt sind.
Bei einem Klassifikationsprobleme handelt es sich um folgende Aufgabe: Gegeben seien Objekte, die durch Eingangsdaten (Merkmale) beschrieben werden können (beispielsweise zehn Zahlenwerte, die einen Pilz beschreiben). Sämtliche Objekte gehören jeweils (genau) einer Klasse bzw. Kategorie an (z.B. essbar oder giftig). Eine Klassifikationsaufgabe bedeutet nun, anhand der Eingangsdaten (Merkmale) zu entscheiden, welcher Klasse die Objekte angehören:
Ein Klassifikationsproblem ist dann gegeben, wenn anhand gewisser Merkmale eines Objekts entschieden werden soll, welcher Klasse das Objekt (wahrscheinlich) angehört.
Wie wir bereits gelernt haben, sind künstliche neuronale Netze somit eine Möglichkeit, um Klassifikationsprobleme zu lösen. Sinnvoll ist das Vorhaben aber nur dann, wenn einige Voraussetzungen bzw. Annahmen erfüllt sind:
- Es ist stets bekannt, um welche Klassen es sich handelt (beispielsweise die Klassen essbar und giftig).
- Sämtliche Objekte gehören genau einer der bekannten Klassen an.
- Es ist eine (große) Anzahl an Trainingsdaten vorhanden. Genauer ist eine (große) Menge an Objekten vorhanden, wobei jeweils bekannt ist, welcher Klasse die Objekte angehören.
- Objekte, die zur selben Klasse gehören, weisen gewisse Ähnlichkeiten auf. Ist dies nicht der Fall, dann kann das Klassifikationsproblem auch nicht zufriedenstellend gelöst werden.
Um Klassifikationsprobleme sowie die zuvor genannten Voraussetzungen genauer verstehen und analysieren zu können, erzeugen wir im nächsten Abschnitt eigene Datensätze, die sich in Form bunter Punkte darstellen lassen.