Konfusionsmatrix

Die visuelle Darstellung der Ergebnisse zur Analyse einer Testphase wie zuvor sind nur daher möglich, da wir ein sehr einfaches Klassifikationsproblem untersucht haben, dessen Eingangsdaten sich als Punkte darstellen lassen.

Im Allgemeinen ist eine derartige Darstellung nicht möglich, sondern man untersucht die sogenannte Wahrheitsmatrix oder Konfusionsmatrix. Dabei handelt es sich um eine Tabelle, welche das Ergebnis der Testphase beschreibt. Die Konfusionsmatrix zur Klassifikationsaufgabe aus dem Abschnitt zuvor ist folgende:

Gemäß der Anzahl der Klassen bzw. Kategorien besitzt die Tabelle drei Spalten und drei Zeilen. Gezählt wird jeweils, wie viele Testobjekte (mit bekannter Zugehörigkeit) als was (d.h. welche Farbe) klassifiziert wurden. Beispielsweise wurden 508 Testobjekte, welche bekanntermaßen der Klasse rot angehören, auch tatsächlich als rot klassifiziert. Hingegen wurden 66 Testobjekte mit der bekannten Klasse grün fälschlicherweise als blau klassifiziert.

Zudem kann der Tabelle als Summe der Einträge auf der Diagonalen entnommen werden, dass insgesamt 1711 von 2000 Testobjekten korrekt klassifiziert wurden. Dies entspricht ungefähr 86 Prozent.

Quiz

Gegeben sei ein Klassifikationsproblem, welches Objekte in die vier Kategorien rot, grün, blau und gelb klassifiziert. Nach einer Trainingsphase wird eine Testphase durchgeführt. Das Ergebnis wird anhand folgender Konfusionsmatrix zusammengefasst:

Wie viele Testobjekte der (bekannten) Klasse rot wurden fälschlicherweise als gelb klassifiziert?
0
20
60
100
220
Sämtliche Testobjekte der (bekannten) Klasse gelb wurden korrekt klassifiziert.
Aussage stimmt
Aussage stimmt nicht
Es gibt Testobjekte, die fälschlicherweise als grün klassifiziert wurden.
Aussage stimmt
Aussage stimmt nicht
Wie viel Objekte wurden insgesamt getestet?
250
500
750
1000
Wie viel Prozent der Testobjekte wurden insgesamt korrekt klassifiziert?
0%
20%
40%
60%
80%
100%
Layout neuronaler Netze