HotelReviews

Das HotelReviews-Datenpaket beinhaltet Kritiken, welche auf der Plattform Trip Advisor zur Bewertung von Hotels abgegeben wurden. Jeder Datensatz beinhaltet den Text der Bewertung sowie die Anzahl der vergebenen Sterne: 1 (schlecht) bis 5 (sehr gut).

Sämtliche Daten wurden dem Trip Advisor Hotel Reviews entnommen (aufgerufen am 3. Juni 2021) und für unsere Zwecke angepasst, um diese beispielsweise zwecks Klassifikationsaufgaben zu verwenden. Das Paket beinhaltet 6000 Bewertungen, die auch in Trainings- und Test-Umfang aufgeteilt wurden:

Trainings-Umfang5000 Bewertungen
Test-Umfang1000 Bewertungen

Wie genau der Datensatz zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.

Datenquelle

Das HotelReviews-Datenpaket wurde anhand von Daten erstellt, die unter kaggle zur Verfügung stehen (abgerufen am 1. Mai 2021). Diese Daten werden unter der Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0) vertrieben. Ursprünglich veröffentlicht wurden die Daten im Zusammenhang des folgenden Artikels:

M.H. Alam, W.-J. Ryu, S. Lee. 2016. Joint multi-grain topic sentiment: modeling semantic aspects for online reviews. Information Sciences 339: 206–223.

Lizenzhinweis

Das HotelReviews-Datenpaket wird unter der Creative Commons Attribution-NonCommercial 4.0 International License vertrieben:

HotelReviews.js29. November 2023Copyright © 2023 by Daniel Scholz

Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC BY-NC 4.0

Übersicht
Das HotelReviews-Datenpaket stellt folgende Funktionen zur Verfügung:
Download
Das HotelReviews-Datenpaket steht über folgenden Link zum Download bereit.
Beispiel
Beispiel zur Ausgabe einzelner Datensätze des HotelReviews-Datenpakets. Für den Wert der Variablen k kann anstelle der 12 eine (ganze) Zahl zwischen 0 und 4999 gewählt werden.
Beispiel
Beispiel zur Sentiment Detection anhand von Hotelbewertungen.