Wie selbstverständlich haben wir in den Abschnitten zuvor davon geredet, die kürzesten Abstände zwischen zwei Punkten zu bestimmen. Allerdings handelt es sich dabei um ein durchaus komplexes Thema, da es sehr unterschiedliche Möglichkeiten gibt, den Abstand zwischen zwei Punkten zu bestimmen. Als kleinen Exkurs stellen wir einige Möglichkeiten vor.
Das bekannteste Abstandsmaß ist die Euklidische Metrik. Wie aus der Schule bekannt, wird der Abstand zwischen zwei Punkten und folgendermaßen bestimmt:
Es handelt sich dabei um die Länge, die man mit einem Lineal messen kann. Die Metrik lässt sich auch für Vektoren mit einer beliebigen Anzahl an Variablen berechnen (also für Punkte in einem n-dimensionalen Raum):
Die Euklidische Metrik ist auch das Abstandsmaß, das in den Abschnitten zuvor eingesetzt wurde.
Je nach Anwendungsfall kann es aber auch sinnvoll sein, ein anderes Abstandsmaß zu verwenden. Die Manhattan-Metrik beispielsweise ist folgendermaßen definiert:
Der Name ist motiviert durch die Länge eines kürzesten Weges zwischen zwei Kreuzungen im Straßengitter von Manhattan:
Die Länge der Linie A entspricht dem Abstand nach der Euklidischen Metrik. Die Länge des Linienzuges B entspricht dem Abstand nach der Manhattan-Metrik.
Schließlich kann auch die Maximum-Metrik eingesetzt werden, die folgendermaßen definiert ist:
Welche Metrik zur Lösung einer Klassifikationsaufgabe eingesetzt werden sollte, kann nicht pauschal beantwortet werden. Die Wahl der Metrik ist in Abhängigkeit der Eigenschaften der vorliegenden Daten zu treffen.