Die Funktion NearestNeighbor.get(X, y, k) erwartet folgende (verpflichtende) Argumente:
Argument | Datentyp | Hinweis |
X | Datenfeld | Vergleichsdaten als Matrix |
y | Datenfeld | zu vergleichendes Objekt als Vektor |
k | Zahl | ganzzahlig, positiv |
Die Funktion führt eine Nächste-Nachbarn-Bestimmung anhand der Vergleichsdaten X sowie des zu vergleichenden Objekts y durch. Zurückgegeben werden die k nächsten Nachbarn anhand der Indizes der zugehörigen Vergleichsdaten aus X (aufsteigend sortiert nach Abstand).
Um genauer zu sein: Die Vergleichsdaten X sind als Matrix (zweidimensionales Datenfeld) zu definieren, wobei jede Zeile der Matrix als ein Objekt angesehen wird. Dies bedeutet auch, dass die Länge des Vektors bzw. des Objekts y der Anzahl der Spalten von X entsprechen muss. Zurückgegeben werden die Indizes der Zeilen (bzw. Objekte) der Matrix, die (bezogen auf das gewählte Abstandsmaß) dem zu vergleichenden Objekt y am nächsten sind.
Es kann folgende Option verwendet werden:
Variable | Datentyp | Hinweis | Default-Wert |
metric | Zeichenkette | manhattan, euclidean, maximum oder cosine | euclidean |
Die Option metric definiert die Metrik, die als Abstandsmaß verwendet werden soll.
Es ist auch möglich, dass X als eine Liste von Objekten mit jeweils folgenden Variablen definiert wird:
Variable | Datentyp | Hinweis |
input | Datenfeld | Objekt als Vektor |
index | Zahl | ganzzahlig, nicht negativ |
Dies bedeutet, dass für X auch die Trainingsdaten eines Klassifikationsproblems eingesetzt werden können.