.train_test

Die Funktion Split.train_test(A, n, m) erwartet folgende (verpflichtende) Argumente:

ArgumentDatentypHinweis
ADatenfeldbestehend aus mindestens vier Elementen
nZahlpositiv (relativer Anteil Trainingsmenge)
mZahlpositiv (relativer Anteil Testmenge)

Das Datenfeld A wird (zufällig) in zwei (disjunkte) Mengen aufgeteilt. Der Umfang der beiden Mengen steht im Verhältnis n:m zueinander. Zurückgegeben wird ein Objekt mit folgenden Variablen:

VariableDatentypHinweis
trainDatenfeldTrainingsmenge
testDatenfeldTestmenge

Zudem können folgende Optionen verwendet werden:

VariableDatentypHinweisDefault-Wert
seedZahlganzzahlig, positivzufällige Wahl
randomBoolean-true

Für die Reproduzierbarkeit kann seed explizit definiert werden. Falls diese Option verwendet wird, dann wird beim wiederholten Aufruf der Funktion jeweils das identische Ergebnis zurückgeliefert. Zudem führt die Option random=false dazu, dass der Datensatz ohne zufälliges Vermischen aufgeteilt wird.

Beispiel
Es wird ein Datenfeld zufällig in Trainings- und Testmenge aufgeteilt.
Beispiel
Es wird ein Datenfeld zufällig in Trainings- und Testmenge aufgeteilt. Die Option seed führt dazu, dass das Ergebnis reproduzierbar ist.
Beispiel
Es wird ein Datensatz zufällig in Trainings- und Testmenge aufgeteilt.
Zur Übersicht