Isomap

Eine Erweiterung der metrischen multidimensionalen Skalierung ist die sogenannte Isomap-Methode, die wir nun als dritte Möglichkeit der Dimensionsreduktion vorstellen. Die Idee besteht darin, zur Bestimmung der Distanzmatrix nicht direkt die Abstände zwischen je zwei Objekten zu verwenden, sondern zuvor einen Nachbarschaftsgraphen zu erstellen. Die Isomap-Methode ist damit ein grafisches und geometrisches Verfahren.

Die Vorgehensweise zur Erstellung eines Nachbarschaftsgraphen ist folgende: Zunächst definiert ein Parameter die Anzahl der nächsten Nachbarn, die verwendet werden sollen, etwa q = 3. Nun wird ein Graph erstellt, wobei jedes Objekt des Datensatzes einem Knoten entspricht. Jeder Knoten bzw. jedes Objekt wird mit den q nächsten Nachbarn durch eine Kante verbunden. Das Gewicht bzw. die Länge der Kante entspricht dabei dem Abstand der beiden Objekte.

Auf diese Art und Weise entsteht ein gewichteter Graph, nämlich der Nachbarschaftsgraph in Abhängigkeit des Parameters q sowie in Abhängigkeit eines Abstandsmaßes (siehe zuvor). Schließlich muss auf geeignete Art und Weise sichergestellt werden, dass der Nachbarschaftsgraph zusammenhängend ist (darauf gehen wir hier aber nicht weiter ein).

Im nächsten Schritt kann die Distanzmatrix auf Basis des Nachbarschaftsgraphen erstellt werden: Hierzu wird jeweils der kürzeste Weg zwischen je zwei Objekten im Nachbarschaftsgraphen bestimmt und als Distanz verwendet. Im Beispiel aus der Abbildung zuvor ergibt sich ein Abstand zwischen den Objekten A und B, der offensichtlich größer ist als der direkte Abstand.

Zusammenfassend entsteht eine symmetrische Distanzmatrix, die nun zur Durchführung einer metrischen multidimensionalen Skalierung verwendet wird.

Falls für den Parameter q ein Wert gewählt wird, der größer oder gleich der Anzahl der Objekte des Datensatzes ist, dann ist die Isomap-Methode identisch zur metrischen multidimensionalen Skalierung.

Die Aussage zuvor beruht darauf, dass der Nachbarschaftsgraph im beschriebenen Falle vollständig ist. Somit ergibt sich eine Distanzmatrix, welche die direkten Abstände zwischen je zwei Objekten berücksichtigt.

Beispiel
Dimensionsreduktion unter Verwendung der Isomap-Methode.
Quiz

Gegeben sei der folgende (gewichtete) Nachbarschaftsgraph, um die Distanzmatrix zu bestimmen:

Was ist der Abstand zwischen Objekt A und Objekt D?
4
5
8
9
12
16
18
Was ist der Abstand zwischen Objekt B und Objekt F?
4
5
8
9
12
16
18
Was ist der Abstand zwischen Objekt F und Objekt B?
4
5
8
9
12
16
18
Klassifikationsaufgaben