Abstandsmaße

Bei einem Datensatz bestehend aus m Merkmalen ist jedes Objekt nichts anderes als eine Vektor bestehend aus m Einträgen. Die Distanzmatrix zur metrischen multidimensionalen Skalierung kann also bestimmt werden, indem die Abstände zwischen je zwei Objekten bzw. Vektoren berechnet werden. Dabei können unterschiedliche Abstandsmaße eingesetzt werden.

Euklidische Metrik

Das bekannteste Abstandsmaß ist die Euklidische Metrik. Wie aus der Schule bekannt, wird der Abstand zwischen zwei Punkten und folgendermaßen bestimmt:

Es handelt sich dabei um die Länge, die man mit einem Lineal messen kann. Die Metrik lässt sich auch für Vektoren (Objekte) mit einer beliebigen Anzahl an Variablen (Merkmalen) berechnen:

Manhattan-Metrik

Je nach Anwendungsfall kann es aber auch sinnvoll sein, ein anderes Abstandsmaß zu verwenden. Die Manhattan-Metrik beispielsweise ist folgendermaßen definiert:

Der Name ist motiviert durch die Länge eines kürzesten Weges zwischen zwei Kreuzungen im Straßengitter von Manhattan:

Die Länge der Linie A entspricht dem Abstand nach der Euklidischen Metrik. Die Länge des Linienzuges B entspricht dem Abstand nach der Manhattan-Metrik.

Maximum-Metrik

Schließlich kann auch die Maximum-Metrik eingesetzt werden, die folgendermaßen definiert ist:

Welches Abstandsmaß zur Bestimmung der Distanzmatrix verwendet werden sollte, kann nicht pauschal beantwortet werden. Die Wahl der Metrik ist in Abhängigkeit der Eigenschaften der vorliegenden Daten zu treffen.

Quiz

Gegeben seien die beiden Objekte und bestehend aus Merkmalen.

Was ist der Abstand bezüglich der Euklidischen Metrik?
0
1
2
3
4
5
Was ist der Abstand bezüglich der Manhattan-Metrik?
0
1
2
3
4
5
Was ist der Abstand bezüglich der Maximum-Metrik?
0
1
2
3
4
5
Zusammenhang