Nachdem wir den k-Means-Algorithmus genau vorgestellt haben, folgt nun ein Quellcode-Beispiel. Insbesondere sei dabei auf die Optionen der Funktion ClusterAnalysis.kmeans hingewiesen:
runs definiert Anzahl, wie häufig der Algorithmus durchgeführt wird (mit jeweils zufälligen Startclustern). Zurückgegeben wird (wie im Abschnitt zuvor besprochen) das Ergebnis des Durchlaufs mit dem kleinsten WCSS-Fehlermaß.
maximal_iterations definiert die maximale Anzahl an Iterationen pro Durchlauf. In der Regel endet das Verfahren bevor die maximale Anzahl an Iterationen erreicht wird, bei großen Datensätzen muss das aber nicht immer der Fall sein.
Die genaue Referenz zur Funktion findest du hier: