taralino

Multidimensionale Skalierung

Auch wenn die mathematischen Berechnungen der Hauptkomponentenanalyse zur Dimensionsreduktion nicht im Detail vorgestellt wurden, die Ergebnisse waren dennoch recht anschaulich. Nun stellen wir mit der metrischen multidimensionalen Skalierung ein zweites Verfahren vor, dass die Beobachtungen zuvor nochmals vertieft. Die metrische multidimensionale Skalierung (kurz MDS) ist eigentlich ein Verfahren der Statistik, dass aber auch im Data Science Verwendung findet.

Angenommen, es sind die Abstände zwischen je zwei Objekten eines Datensatzes bekannt. Diese Daten (in Form einer symmetrischen Distanzmatrix) werden der metrischen multidimensionalen Skalierung übergeben, um die Objekte derart in niedrigdimensionale Objekte zu überführen, sodass die Abstände zwischen den Objekten möglichst gleich bleiben. Ohne auch hier im Detail auf die genauen Berechnungen einzugehen, sei erwähnt, dass im Wesentlichen eine Eigenwertberechnung durchzuführen ist.

Die metrische multidimensionale Skalierung macht also genau das, was wir zuvor auch bei der Hauptkomponentenanalyse beobachtet haben: Die Abstände zwischen den Objekten bleiben relativ zueinander bestmöglichst erhalten. In anderen Worten:

Ähnliche Objekte eines Datensatzes weisen auch nach der Dimensionsreduktion unter Verwendung einer metrischen multidimensionalen Skalierung Ähnlichkeiten auf.

Offen bleibt die Frage, wie die Distanzmatrix bestimmt werden kann. Darauf gehen wir im nachfolgenden Abschnitt ein.

Beispiel

Dimensionsreduktion unter Verwendung einer metrischen multidimensionalen Skalierung.

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <script src="taralino.js"></script>
  <script src="Scribble.js"></script>
</head>
<body>
<script>

// Parameter zum Scribble-Datensatz
var item = "pizza";
var size = 12;
var count = 200;

// Datensatz erzeugen / auslesen
var X = Scribble.get(item, {size:size, count:count});

// Dimensionsreduktion durchfuehren
var T = DimensionReduction.mds(X, 2, {metric:"manhattan"});

// Reduzierten Datensatz darstellen
Plot.init(400, 400, {axis:["y-Achse (Merkmal 2)","x-Achse (Merkmal 1)"]});
Plot.list(T);
Plot.draw();

</script>
</body>
</html>

Vorschau Download Kopie speichern