Fehlermetriken

Neben dem Histogramm gibt es weitere Möglichkeiten, die Güte der Modellfunktion anhand sogenannter Fehlermetriken zu messen. Die Metriken können dabei sowohl auf die Trainingsdaten als auch auf die Testdaten angewandt werden.

Neben dem Histogramm können die folgenden Fehlermetriken dazu beitragen, eine Entscheidung darüber zu treffen, ob sich eine Regressionsaufgabe ausreichend gut mittels linearer Regression lösen lässt.

Mean Absolute Error

Eine gängige Fehlermetrik ist die mittlere absolute Abweichung (englisch: mean absolute error). Wie der Name schon sagt, handelt es sich dabei um den Mittelwert der absoluten Abweichungen zwischen bekanntem Ergebnis (Zielvariable) und Vorhersage aufgrund der Modellfunktion. Bezogen auf die Testdaten bedeutet dies:

Dabei ist die Anzahl der Testobjekte.

Root Mean Squared Error

Eine weitere Fehlermetrik ist die Wurzel der mittleren quadratischen Abweichung (englisch: root mean squared error). Hier handelt es sich um die Wurzel des Mittelwertes der quadratischen Abweichungen zwischen bekanntem Ergebnis (Zielvariable) und Vorhersage aufgrund der Modellfunktion. Bezogen auf die Testdaten bedeutet dies:

Dabei ist die Anzahl der Testobjekte.

Bestimmtheitsmaß (R²)

Das Bestimmtheitsmaß (häufig bezeichnet als R²) basiert auf einem Verhältnis zwischen der Summe der quadratischen Abweichung und der Summe der quadratischen Abweichungen zum Mittelwert der Zielvariablen:

Dabei ist die Mittelwert der Zielvariablen sämtlicher Testobjekte.

Wenn die Zielvariablen sämtlicher Testobjekte mit der Modellfunktion exakt vorhergesagt werden können, also für alle Testobjekte , dann nimmt R² den bestmöglichen Wert von 1 an.

Andererseits sind auch R²-Werte kleiner als 0 möglich, nämlich wenn die Vorhersage schlechter ist, als lediglich konstant den Mittelwert der Zielvariablen vorherzusagen.

Beispiel
Regressionsaufgabe zur Bestimmung der Weinqualität: Fehlermetriken.
Aufgabe

Mache dich mit dem Quellcode zuvor vertraut. Die Dokumentation der Fehlermetriken findest du wie üblich hier:

Zur Referenz

Erprobe auch die anderen Fehlermetriken und bewerte die Ergebnisse.

Quiz
Grenzen