Codebeispiel

Nachdem wir den k-Means-Algorithmus genau vorgestellt haben, folgt nun ein Quellcode-Beispiel. Insbesondere sei dabei auf die Optionen der Funktion ClusterAnalysis.kmeans hingewiesen:

runs definiert Anzahl, wie häufig der Algorithmus durchgeführt wird (mit jeweils zufälligen Startclustern). Zurückgegeben wird (wie im Abschnitt zuvor besprochen) das Ergebnis des Durchlaufs mit dem kleinsten WCSS-Fehlermaß.

maximal_iterations definiert die maximale Anzahl an Iterationen pro Durchlauf. In der Regel endet das Verfahren bevor die maximale Anzahl an Iterationen erreicht wird, bei großen Datensätzen muss das aber nicht immer der Fall sein.

Die genaue Referenz zur Funktion findest du hier:

Zur Referenz

Beispiel
Es werden Daten mit dem ClusteringData-Paket erstellt, welche anschließend unter Verwendung des k-Means-Algorithmus verarbeitet werden. Daten und Ergebnis werden ausgegeben.
Aufgabe

Mache dich mit dem Quellcode des Beispiels zuvor vertraut. Schaue dir dazu auch die Referenz zur Erzeugung der Datensätze an:

Zur Referenz

Variiere nun insbesondere die folgenden Parameter und beobachte die Auswirkungen:

  1. Verändere die Anzahl an Clustern auf einen Wert zwischen zwei und fünf.
  2. Variiere den Radius sowie die Anzahl an Objekten bzw. Punkten bei der Erstellung der Datensätze.
  3. Setze die Optionen runs und maximal_iterations jeweils auf eins.
Quiz
Hast du dich mit dem Quellcode beschäftigt und die Parameter variiert? Stimmen die Beobachtungen mit deinen Erwartungen überein?
ja
nein
Ellenbogenmethode