Wir haben in diesem Kurs eine spezielle Problemformulierung eingeführt und mit dem k-Means-Algorithmus einen der wichtigsten Lösungsverfahren der Clusteranalyse kennengelernt.
Dennoch sei bemerkt, dass sich aufgrund der Problemformulierung alle Objekte eines Clusters in konvexen Bereichen befinden, nämlich genau in den Voronoi-Zellen bezüglich der Cluster-Schwerpunkte.
Je nach Datenlage und Aufgabenstellung können andere Problemformulierung von Bedeutung sein, wie die folgende Abbildung zeigt:
Veranschaulicht sind zwei Datensätze mit diversen Objekten (bzw. Punkten), die sich jeweils recht eindeutigen in zwei Cluster aufteilen lassen. In beiden Fällen würde der k-Means-Algorithmus keine zufriedenstellende Ergebnisse liefern. Stattdessen kommen hier andere Problemformulierung und entsprechend auch andere Lösungsverfahren zum Einsatz. Darauf gehen wir in nachfolgenden Kursen näher ein.