Dank des kennengelernten HotelReviews-Datenpakets können wir nun ein neuronales Netz zur Sentimentanalyse trainieren und testen. Wir treffen dazu folgende Definition:
Eine Hotelbewertung gilt als positiv, falls mindestens vier Sterne vergeben wurden. Anderenfalls definieren wir die Bewertung als negativ.
Falls der vollständige Trainingsumfang verwendet wird, besteht das zugehörige Bag-of-Words aus 26244 Wörtern bzw. Token. Entsprechend besitzt auch das neuronale Netz zur Lösung der Aufgabe ein Eingangssignal bestehend aus 26244 Neuronen. Als Ausgangssignal werden zwei Neuronen verwendet, da wir nur zwischen positiv und negativ klassifizieren. Ohne verborgene Schichten erhalten wir damit das folgende Layout:
In der nachfolgenden Anwendung kannst du eigene Erfahrungen sammeln. Je nach Trainingsphase sowie Wahl der Parameter lassen sich etwa 90 Prozent der Testdaten korrekt klassifizieren. Das ist ein durchaus beachtliches Ergebnis, da Bewertungen mit 3 von 5 Sternen nicht unbedingt als eindeutig negativ zu verstehen sind.