Das HousePrices-Datenpaket beinhaltet einen Datensatz mit Eigenschaften von 20 433 Häuserblöcken in Kalifornien, die 1990 im Rahmen eines Zensus erhoben wurden. Pro Häuserblock stehen folgende Werte zur Verfügung:
Index | Beschreibung |
0 | Längengrad des Häuserblocks |
1 | Breitengrad des Häuserblocks |
2 | Alter in Jahren |
3 | Anzahl der Zimmer insgesamt |
4 | Anzahl der Schlafzimmer |
5 | Anzahl der Bewohner insgesamt |
6 | Anzahl der Haushalte |
7 | mittleres Jahreseinkommen pro Haushalt in Tausend US-Dollar |
8 | durchschnittlicher Wert pro Haushalt in Tausend US-Dollar |
Die Daten können verwendet werden, um eine Regressionsanalyse durchzuführen. Für diesen Anwendungsfall werden die insgesamt 20 433 Objekte (Häuserblocks) in Trainings- und Testdaten aufgeteilt, wobei die zu bestimmende Größe der durchschnittliche Wert pro Haushalt ist:
Trainingsdaten | 15 324 Objekte (Häuserblöcke) |
Testdaten | 5 109 Objekte (Häuserblöcke) |
Wie genau die Daten zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.
Das HousePrices-Datenpaket wurde anhand von Daten erstellt, die über kaggle zur Verfügung gestellt wurden (abgerufen am 20. November 2022). Diese Daten werden unter der Creative Commons Public Domain 1.0 Dedication License (CC0 1.0) vertrieben. Siehe auch:
R. Kelley Pace, Ronald Barry. 1997. Sparse spatial autoregressions. Statistics & Probability Letters 33. Seiten 291-297.
Das HousePrices-Datenpaket wird unter der Creative Commons Public Domain 1.0 Dedication License vertrieben:
HousePrices.js | 29. November 2023 | Copyright © 2023 by Daniel Scholz |
Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0