Bei einem Datensatz bestehend aus m Merkmalen ist jedes Objekt nichts anderes als eine Vektor bestehend aus m Einträgen. Die Distanzmatrix zur metrischen multidimensionalen Skalierung kann also bestimmt werden, indem die Abstände zwischen je zwei Objekten bzw. Vektoren berechnet werden. Dabei können unterschiedliche Abstandsmaße eingesetzt werden.
Das bekannteste Abstandsmaß ist die Euklidische Metrik. Wie aus der Schule bekannt, wird der Abstand zwischen zwei Punkten und folgendermaßen bestimmt:
Es handelt sich dabei um die Länge, die man mit einem Lineal messen kann. Die Metrik lässt sich auch für Vektoren (Objekte) mit einer beliebigen Anzahl an Variablen (Merkmalen) berechnen:
Je nach Anwendungsfall kann es aber auch sinnvoll sein, ein anderes Abstandsmaß zu verwenden. Die Manhattan-Metrik beispielsweise ist folgendermaßen definiert:
Der Name ist motiviert durch die Länge eines kürzesten Weges zwischen zwei Kreuzungen im Straßengitter von Manhattan:
Die Länge der Linie A entspricht dem Abstand nach der Euklidischen Metrik. Die Länge des Linienzuges B entspricht dem Abstand nach der Manhattan-Metrik.
Schließlich kann auch die Maximum-Metrik eingesetzt werden, die folgendermaßen definiert ist:
Welches Abstandsmaß zur Bestimmung der Distanzmatrix verwendet werden sollte, kann nicht pauschal beantwortet werden. Die Wahl der Metrik ist in Abhängigkeit der Eigenschaften der vorliegenden Daten zu treffen.