Eingangssignale

In diesem Abschnitt greifen wir auf die zuvor beschriebenen Verfahren zurück und besprechen, wie ein Bild verarbeitet wird, um anschließend das zugehörige Eingangssignal eines neuronalen Netzes zu erhalten.

Um genauer zu sein: Wenn ein Schwarz-Weiß-Bild gegeben ist, dann wird dieses zunächst unter Verwendung geeigneter Filter bearbeitet, um markante Stellen des Bildes hervorzuheben. Anschließend wird ein Pooling durchgeführt. Diese Vorgehensweise erläutern wir anhand des folgenden kleinen Beispiels etwas genauer:

Gegeben ist ein Bild, welches aus 6 x 6 Pixel besteht. Auf dieses Bild werden zwei 3 x 3-Filter angewandt, sodass sich zwei neue Bilder (weiterhin bestehend aus jeweils 6 x 6 Pixel) ergeben. Anschließend wird ein 2 x 2-Pooling durchgeführt, es folgen entsprechend zwei Bilder bestehend aus jeweils 3 x 3 Pixel. Diese Pixel der Reihe nach von oben links nach unten rechts angeordnet ergeben nun genau das Eingangssignal, welches anschließend in einem neuronalen Netz verarbeitet werden kann.

Zusammenfassend wurden im Beispiel zuvor die folgenden drei Parameter verwendet:

ParameterNameWertzulässige Werte
Anzahl der Filtercount21, 2, 3, 4, ...
Größe der Filtersize33, 5, 7, 9, ...
Größe der Pooling-Blöckepooling21, 2, 3, 4, ...

Abgesehen von der Größe des Bildes entscheiden diese drei Parameter darüber, aus wie vielen Neuronen das Eingangssignal besteht. In der folgenden Anwendung kannst du weitere Erfahrungen sammeln, wobei zunächst genau die Werte aus dem Beispiel zuvor eingegeben wurden. Wir fassen zusammen:

Ein Schwarz-Weiß-Bild wird unter Verwendung mehrere Filter gleicher Größe sowie einer Pooling-Strategie verarbeitet, um das Eingangssignal des neuronalen Netzes zu erhalten. Alle Neuronen des Eingangssignals besitzen einen Wert zwischen 0 und 1.

Beispiel
Definition eines Faltungsnetzwerks: Angegeben wird die Größe des Bildes gefolgt von den drei zuvor genannten Parametern.
Quiz

Nutze den Quellcode zuvor, um folgende Fragen zu beantworten.

Wie vielen Neuronen besitzt das Eingangssignal, falls ein Bild bestehend aus 40 x 40 Pixel unter Verwendung der folgenden Parameter verarbeitet wird: Sieben 5 x 5-Filter sowie ein 4 x 4-Pooling?
16
140
700
2800
Wie vielen Neuronen besitzt das Eingangssignal, falls ein Bild bestehend aus 40 x 40 Pixel unter Verwendung der folgenden Parameter verarbeitet wird: Sieben 3 x 3-Filter sowie ein 4 x 4-Pooling?
16
140
700
2800
Layout