Mit einem Regelwerk zur Tokenisierung ist eindeutig definiert, wie anhand von Texten ein Bag-of-Words erstellt werden kann. Wir haben auch schon gelernt, wie anschließend ein Text unter Verwendung des Bag-of-Words als Datenfeld (Vektor) beschrieben wird.
In diesem Abschnitt wollen wir nochmals genauer verstehen, wie nun ein Text als Eingangssignal eines neuronalen Netzes angesehen werden kann. Wir demonstrieren die Vorgehensweise anhand kurzer Quellcodes und beginnen mit der Ausgabe eines Bag-of-Words.