In diesem Abschnitt greifen wir auf die zuvor beschriebenen Verfahren zurück und besprechen, wie ein Bild verarbeitet wird, um anschließend das zugehörige Eingangssignal eines neuronalen Netzes zu erhalten.
Um genauer zu sein: Wenn ein Schwarz-Weiß-Bild gegeben ist, dann wird dieses zunächst unter Verwendung geeigneter Filter bearbeitet, um markante Stellen des Bildes hervorzuheben. Anschließend wird ein Pooling durchgeführt. Diese Vorgehensweise erläutern wir anhand des folgenden kleinen Beispiels etwas genauer:
Gegeben ist ein Bild, welches aus 6 x 6 Pixel besteht. Auf dieses Bild werden zwei 3 x 3-Filter angewandt, sodass sich zwei neue Bilder (weiterhin bestehend aus jeweils 6 x 6 Pixel) ergeben. Anschließend wird ein 2 x 2-Pooling durchgeführt, es folgen entsprechend zwei Bilder bestehend aus jeweils 3 x 3 Pixel. Diese Pixel der Reihe nach von oben links nach unten rechts angeordnet ergeben nun genau das Eingangssignal, welches anschließend in einem neuronalen Netz verarbeitet werden kann.
Zusammenfassend wurden im Beispiel zuvor die folgenden drei Parameter verwendet:
Parameter | Name | Wert | zulässige Werte |
Anzahl der Filter | count | 2 | 1, 2, 3, 4, ... |
Größe der Filter | size | 3 | 3, 5, 7, 9, ... |
Größe der Pooling-Blöcke | pooling | 2 | 1, 2, 3, 4, ... |
Abgesehen von der Größe des Bildes entscheiden diese drei Parameter darüber, aus wie vielen Neuronen das Eingangssignal besteht. In der folgenden Anwendung kannst du weitere Erfahrungen sammeln, wobei zunächst genau die Werte aus dem Beispiel zuvor eingegeben wurden. Wir fassen zusammen:
Ein Schwarz-Weiß-Bild wird unter Verwendung mehrere Filter gleicher Größe sowie einer Pooling-Strategie verarbeitet, um das Eingangssignal des neuronalen Netzes zu erhalten. Alle Neuronen des Eingangssignals besitzen einen Wert zwischen 0 und 1.