Projektaufgabe

Abschließend möchten wir im Rahmen einer Projektaufgabe die beiden Methoden der Clusteranalyse auf einen etwas größeren Datensatz anwenden:

Das Scribble-Paket beinhaltet Daten von Strichzeichnungen, die zur Klassifikation, zur Clusteranalyse oder zur Dimensionsreduktion verwendet werden können.

Zur Referenz

Im folgenden Beispiel werden Daten des Scribble-Pakets verwendet, um einen Datensatz zur Clusteranalyse zu erstellen. Angewendet wird bereits der k-Means-Algorithmus und die nachfolgende Aufgabe besteht darin, auch das DBSCAN-Verfahren zu analysieren. Erfahrungen mit Klassifikationsproblemen können hilfreich sein, sind aber nicht zwingend erforderlich.

Beispiel
Es wird ein Datensatz bestehend aus Strichzeichnungen des Scribble-Pakets erstellt, welche mit dem k-Means-Algorithmus analysiert werden.
Projektaufgabe

Mache dich mit dem Quellcode des Beispiels zuvor vertraut. Schaue zunächst, inwieweit alle Strichzeichnungen der drei Objekte Apfel, Fisch und Blume jeweils in einem Cluster zusammengefasst werden. Bearbeite anschließend folgende Teilaufgaben:

  1. Wende auch das DBSCAN-Verfahren auf den Datensatz X an.
  2. Variiere die zugehörigen Parameter und analysiere die Ellenbogenmethode.
  3. Finde geeignete Werte für die Parameter samples und radius, damit auch das DBSCAN-Verfahren die Objekte in möglichst drei Cluster gruppiert.
  4. Füge neben Apfel, Fisch und Blume weitere Strichzeichnungen hinzu.

Diskutiere abschließend, ob sich die Clusteranalyse auch als Lösungsansatz für Klassifikationsprobleme eignet.

Quiz
Zur Übersicht