Nun bist du an der Reihe: Die abschließende Projektaufgabe besteht darin, eine explorative Datenanalyse anhand einer der folgenden Datensätze durchzuführen.
Das PalmerPenguins-Paket beinhaltet Daten zur Klassifikation von Pinguinen. Inhaltlich ist dieser Datensatz damit sehr vergleichbar zu den IrisFlower-Daten.
Das WebshopCustomers-Paket stellt Daten von Kunden eines Webshops bereit. Genauer enthält das Datenpaket drei Informationen bzw. Merkmale von insgesamt 320 Kunden.
Das SocialAds-Paket beinhaltet einen Datensatz mit Eigenschaften von insgesamt 800 Usern (Nutzern) eines sozialen Netzwerks, denen ein spezieller Ad (Werbebanner) angezeigt wird.
Das WineQuality-Paket beinhaltet einen Datensatz mit Eigenschaften von insgesamt 4898 Weinen.
Das HousePrices-Paket beinhaltet einen Datensatz mit Eigenschaften von 20 433 Häuserblöcken in Kalifornien, die 1990 im Rahmen eines Zensus erhoben wurden.
Das OpenCaching-Paket stellt im Wesentlichen drei Datensätze (Tabellen) zur Beschreibung von Geocaches bereit, die über opencaching.de veröffentlicht wurden.
Wähle dir einen Datensatz aus, der dir am meisten zusagt. Als Hinweis sei bemerkt, dass die Komplexität bzw. der Schwierigkeitsgrad der Datensätze zuvor von oben nach unten zunehmend ist. Insbesondere beim OpenCaching-Paket gilt es, Datensätze (Tabellen) miteinander in Verbindung zu setzen.