RandomForest

Ein Random Forest ist eigentlich nichts anderes als eine Zusammenstellung mehrerer Entscheidungsbäume zu einem Wald (forest). Die einzelnen Entscheidungsbäume sind jeweils unterschiedlich, da bei der Erstellung an jedem Knoten ein zufälliges Merkmal gewählt wird (random).

Somit kann ein Random Forest verwendet werden, um eine Klassifikationsaufgabe zu lösen: Bei einem zu klassifizierenden Objekt entscheidet die Mehrheit der Bäume des Waldes mit dem gleichen Klassifikationsergebnis.

Übersicht
Das RandomForest-Paket stellt folgende Befehle und Funktionen zur Verfügung:
Beispiel
Bevor ein Random Forest bestimmt wird, werden Trainingsdaten im dafür benötigten Format definiert. Anschließend wird die Klassifikation eines Objekts durchgeführt.
Beispiel
Es werden Trainings- und Testdaten unter Verwendung des ClassificationData-Pakets erzeugt. Anhand dieser Daten wird ein Random Forest erstellt und anschließend getestet. Dargestellt wird die zugehörige Konfusionsmatrix.