.train_test
Die Funktion Split.train_test(A, n, m) erwartet folgende (verpflichtende) Argumente:
Argument | Datentyp | Hinweis |
A | Datenfeld | bestehend aus mindestens vier Elementen |
n | Zahl | positiv (relativer Anteil Trainingsmenge) |
m | Zahl | positiv (relativer Anteil Testmenge) |
Das Datenfeld A wird (zufällig) in zwei (disjunkte) Mengen aufgeteilt. Der Umfang der beiden Mengen steht im Verhältnis n:m zueinander. Zurückgegeben wird ein Objekt mit folgenden Variablen:
Variable | Datentyp | Hinweis |
train | Datenfeld | Trainingsmenge |
test | Datenfeld | Testmenge |
Zudem können folgende Optionen verwendet werden:
Variable | Datentyp | Hinweis | Default-Wert |
seed | Zahl | ganzzahlig, positiv | zufällige Wahl |
random | Boolean | - | true |
Für die Reproduzierbarkeit kann seed explizit definiert werden. Falls diese Option verwendet wird, dann wird beim wiederholten Aufruf der Funktion jeweils das identische Ergebnis zurückgeliefert. Zudem führt die Option random=false dazu, dass der Datensatz ohne zufälliges Vermischen aufgeteilt wird.