Das HotelReviews-Datenpaket beinhaltet Kritiken, welche auf der Plattform Trip Advisor zur Bewertung von Hotels abgegeben wurden. Jeder Datensatz beinhaltet den Text der Bewertung sowie die Anzahl der vergebenen Sterne: 1 (schlecht) bis 5 (sehr gut).
Sämtliche Daten wurden dem Trip Advisor Hotel Reviews entnommen (aufgerufen am 3. Juni 2021) und für unsere Zwecke angepasst, um diese beispielsweise zwecks Klassifikationsaufgaben zu verwenden. Das Paket beinhaltet 6000 Bewertungen, die auch in Trainings- und Test-Umfang aufgeteilt wurden:
Trainings-Umfang | 5000 Bewertungen |
Test-Umfang | 1000 Bewertungen |
Wie genau der Datensatz zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.
Das HotelReviews-Datenpaket wurde anhand von Daten erstellt, die unter kaggle zur Verfügung stehen (abgerufen am 1. Mai 2021). Diese Daten werden unter der Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0) vertrieben. Ursprünglich veröffentlicht wurden die Daten im Zusammenhang des folgenden Artikels:
M.H. Alam, W.-J. Ryu, S. Lee. 2016. Joint multi-grain topic sentiment: modeling semantic aspects for online reviews. Information Sciences 339: 206–223.
Das HotelReviews-Datenpaket wird unter der Creative Commons Attribution-NonCommercial 4.0 International License vertrieben:
HotelReviews.js | 29. November 2023 | Copyright © 2023 by Daniel Scholz |
Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC BY-NC 4.0