Das WineQuality-Datenpaket beinhaltet einen Datensatz mit Eigenschaften von insgesamt 4898 Weinen. Pro Wein stehen folgende Werte zur Verfügung:
Index | Beschreibung |
0 | Säuregehalt (gesamt) |
1 | Essigsäuregehalt |
2 | Citronensäuregehalt |
3 | Restsüße |
4 | Chloridgehalt |
5 | Schwefeldioxidgehalt (frei) |
6 | Schwefeldioxidgehalt (gesamt) |
7 | Dichte |
8 | pH-Wert |
9 | Sulfatgehalt |
10 | Alkoholgehalt |
11 | Qualität (gemessen) als Punktzahl zwischen 0 und 10 |
Die Daten können auch verwendet werden, um eine Regressionsanalyse durchzuführen oder eine Klassifikationsaufgabe zu lösen. Für diese Anwendungsfälle werden die 4898 Objekte (Weine) in Trainings- und Testdaten aufgeteilt, wobei die zu bestimmende Größe die Qualität ist:
Trainingsdaten | 3673 Objekte (Weine) |
Testdaten | 1225 Objekte (Weine) |
Wie genau die Daten zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.
Das WineQuality-Datenpaket wurde anhand von Daten erstellt, die von Paulo Cortez als Wine Quality Dataset zur Verfügung gestellt wurden (abgerufen am 20. November 2022). Diese Daten werden unter der Creative Commons Public Domain 1.0 Universell License (CC0 1.0) vertrieben. Siehe auch:
P. Cortez, A. Cerdeira, F. Almeida, T. Matos, J. Reis. 2009. Modeling wine preferences by data mining from physicochemical properties. Decision Support Systems 47. Seiten 547-553.
Das WineQuality-Datenpaket wird unter der Creative Commons Public Domain 1.0 Universell License vertrieben:
WineQuality.js | 29. November 2023 | Copyright © 2023 by Daniel Scholz |
Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0