Der Datensatz
Die Struktur eines Datensatzes zur Klassifikation von Punkten bezüglich Farben ist folgende:
x-Koordinate | y-Koordinate | Farbe |
0.51 | 0.58 | grün |
0.71 | 0.90 | rot |
0.17 | 0.04 | blau |
0.51 | 0.67 | grün |
0.33 | 0.06 | grün |
... | ... | ... |
0.52 | 0.99 | grün |
0.60 | 0.94 | rot |
0.49 | 0.89 | grün |
Ein neuronales Netz zur Klassifikation in rot, grün und blau könnte so aufgebaut sein:
Der Datensatz zuvor übertragen in Eingangssignal und Ausgangssignal zum Trainieren und Testen des neuronalen Netzes entspricht der folgenden Tabelle:
Eingangssignal | gewünschtes Ausgangssignal | Ausgangssignal entspricht |
[ 0.51, 0.58 ] | [ 0, 1, 0 ] | grün |
[ 0.71, 0.90 ] | [ 1, 0, 0 ] | rot |
[ 0.17, 0.04 ] | [ 0, 0, 1 ] | blau |
[ 0.51, 0.67 ] | [ 0, 1, 0 ] | grün |
[ 0.33, 0.06 ] | [ 0, 1, 0 ] | grün |
... | ... | ... |
[ 0.52, 0.99 ] | [ 0, 1, 0 ] | grün |
[ 0.60, 0.94 ] | [ 1, 0, 0 ] | rot |
[ 0.49, 0.89 ] | [ 0, 1, 0 ] | grün |
Eine Möglichkeit, um mit der taralino-Bibliothek einen derartigen Datensatz zu erzeugen, bietet das ClassificationData-Paket. Die genaue Datenstruktur muss nicht zwingend vollständig verstanden werden, kann aber bei Interesse in der Referenz nachgeschlagen werden:
Wie nun damit ein Datensatz erzeugt und dargestellt werden kann, zeigt der folgende Quellcode.