Gewichtungen

Als kleine Ergänzung zum k-Means-Algorithmus sei bemerkt, dass es ja nach Anwendungsfall sinnvoll sein kann, wenn die Merkmale der Objekte (bzw. Koordinaten der Punkte) geeignet gewichtet werden. In der Praxis sollte z.B. eine Gewichtung vorgenommen werden, wenn der Datensatz Ausreißer besitzt oder die Werte der einzelnen Merkmale ganz unterschiedliche Größenordnungen haben.

Die Funktion ClusterAnalysis.kmeans stellt für diesen Fall die folgende Option zur Verfügung:

weights ist ein Datenfeld (Vektor) zur Gewichtung der einzelnen Merkmale der Objekte.

Im folgenden Beispiel wird ein Merkmal (genauer die x-Koordinaten der Punkte) auf null gesetzt, sodass dieses Merkmal bei der Durchführung des k-Means-Algorithmus keine Rolle spielt.

Beispiel
Es werden Daten mit dem ClusteringData-Paket erstellt, welche anschließend unter Verwendung des k-Means-Algorithmus verarbeitet werden. Die beiden Merkmale (bzw. Koordinaten) der Objekte (bzw. Punkte) werden unterschiedlich gewichtet.
Aufgabe

Verändere das Beispiel zuvor dahingehend, sodass die x-Koordinaten 10-mal stärker gewichtet werden als die y-Koordinaten.

Quiz
Hast du dich mit dem Quellcode beschäftigt? Stimmen die Beobachtungen mit deinen Erwartungen überein?
ja
nein
Grenzen