DimensionReduction

Das DimensionReduction-Paket stellt unterschiedliche Verfahren der Dimensionsreduktion zur Verfügung.

Allgemein handelt es sich bei der Dimensionsreduktion um Verfahren, die hochdimensionale Daten auf einen niedrigdimensionalen Raum transformieren. Somit können Datensätze (Tabellen) mit vielen Merkmalen (Spalten) auf eine kleinere Anzahl an Merkmalen reduziert werden. Sinnvolle Verfahren der Dimensionsreduktion berücksichtigen dabei, dass der Informationsgehalt der Daten möglichst groß bleibt. Dies bedeutet, dass beispielsweise in hochdimensionale Raum ähnliche Objekte (ähnliche Zeilen) auch im niedrigdimensionalen Raum ähnlich sind.

Insbesondere kann die Dimensionsreduktion verwendet werden, um Datensätze auf zwei oder drei Merkmale zu reduzieren. Dies hat den Vorteil, dass die Daten anschließend geeignet visuell dargestellt werden können.

Übersicht
Das DimensionReduction-Paket stellt folgende Funktionen zur Verfügung:
Beispiel
Es wird ein Datensatz bestehend aus Objekten mit jeweils vier Merkmalen unter Verwendung einer metrischen multidimensionalen Skalierung auf zwei Merkmale reduziert.
Beispiel
Es wird der IrisFlower-Datensatz ausgelesen und auf zwei Merkmale reduziert. Das Ergebnis wird farblich nach Klassenzugehörigkeit dargestellt