Ergebnisse

Dank des kennengelernten HotelReviews-Datenpakets können wir nun ein neuronales Netz zur Sentimentanalyse trainieren und testen. Wir treffen dazu folgende Definition:

Eine Hotelbewertung gilt als positiv, falls mindestens vier Sterne vergeben wurden. Anderenfalls definieren wir die Bewertung als negativ.

Falls der vollständige Trainingsumfang verwendet wird, besteht das zugehörige Bag-of-Words aus 26244 Wörtern bzw. Token. Entsprechend besitzt auch das neuronale Netz zur Lösung der Aufgabe ein Eingangssignal bestehend aus 26244 Neuronen. Als Ausgangssignal werden zwei Neuronen verwendet, da wir nur zwischen positiv und negativ klassifizieren. Ohne verborgene Schichten erhalten wir damit das folgende Layout:

In der nachfolgenden Anwendung kannst du eigene Erfahrungen sammeln. Je nach Trainingsphase sowie Wahl der Parameter lassen sich etwa 90 Prozent der Testdaten korrekt klassifizieren. Das ist ein durchaus beachtliches Ergebnis, da Bewertungen mit 3 von 5 Sternen nicht unbedingt als eindeutig negativ zu verstehen sind.

Quellcode
Vollständiges Beispiel zur Sentimentanalyse anhand von Hotelbewertungen.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut und experimentiere mit den folgenden Parametern:

  1. Verändere den Umfang der Trainingsdaten
  2. Verändere den Umfang der Testdaten
  3. Verändere die Anzahl der Iterationen der Trainingsphase
  4. Verändere die Batchsize
  5. Führe eine verborgene Schicht ein

Beachte, dass die Rechenzeit je nach Wahl der Parameter durchaus einige Zeit in Anspruch nehmen kann. Diskutiere deine Beobachtungen.

Quiz
Hast du dich mit dem Quellcode und der Aufgabe zuvor beschäftigt?
ja
nein
Allgemeine Bemerkungen