Die Funktion LogisticRegression.train(X) erwartet folgende (verpflichtende) Argumente:
Argument | Datentyp | Hinweis |
X | Datenfeld | Trainingsdaten (Liste von Objekten) |
Es wird eine logistische Regression auf Basis der Trainingsdaten X durchgeführt. Verwendet wird dazu eine vereinfachte Variante der Maximum-Likelihood-Methode. Zurückgegeben werden die Faktoren der logistischen Regression als Datenfeld (Vektor), siehe Beispiel unten.
Das Argument X ist als eine Liste von Objekten mit folgenden Variablen zu definieren:
Variable | Datentyp | Hinweis |
input | Datenfeld | Objekt des Datensatzes als Vektor (Eingangsvariablen) |
target | Zahl | Ergebnis (0 oder 1) |
Zudem kann folgende Option verwendet werden:
Variable | Datentyp | Hinweis | Default-Wert |
runs | Zahl | ganzzahlig, positiv | 1 |
Da bei der Trainingsphase der logistischen Regression eine nichtlineare Optimierungsaufgabe zu lösen ist, kommt ein iteratives Lösungsverfahren zum Einsatz (siehe NonlinearProgramming). Dank der Option runs kann die Anzahl der Optimierungsdurchläufe (mit jeweils zufälligen Startwerten) variiert werden. Zurückgegeben wird das Ergebnis des besten Durchlaufs.