Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Unterschied zurückrufen (RD)
Die Kennzahl der Erinnerungsdifferenz (RD) ist der Unterschied beim Erinnerungsvermögen des Modells zwischen der bevorzugten Facet a und der ungünstigen Facet d. Jeder Unterschied zwischen diesen Rückrufen ist eine mögliche Form von Verzerrung. Bei der Rückrufrate handelt es sich um die True-Positive-Rate (TPR), mit der gemessen wird, wie oft das Modell die Fälle korrekt vorhersagt, die zu einem positiven Ergebnis führen sollten. Die Rückrufaktion ist für eine Facet perfekt, wenn alle Fälle mit y=1 für diese Facet korrekt mit y'=1 vorhergesagt wurden. Der Erinnerungsvermögen ist größer, wenn das Modell falsch negative Ergebnisse minimiert, die als Fehler vom Typ II bezeichnet werden. Wie viele Personen in zwei verschiedenen Gruppen (Facetn a und d), die für Kredite in Frage kommen sollten, werden beispielsweise vom Modell korrekt erkannt? Wenn die Rückrufrate bei der Kreditvergabe an die Facet a hoch, bei der Kreditvergabe an die Facet d jedoch niedrig ist, ist die Differenz ein Maß für diese Verzerrung gegenüber der Gruppe, die zu Facet d gehört.
Die Formel für den Unterschied zwischen den Rückrufraten für die Facetn a und d:
RD = TPa/(TPa + FNa) – TPd/(TPd + FNd) = TPRa – TPRd
Wobei gilt:
-
TP a sind die wahren positiven Ergebnisse, die für Facet a vorhergesagt wurden.
-
FN a sind die falsch negativen Werte, die für Facet a vorhergesagt wurden.
-
TP d sind die wahren positiven Ergebnisse, die für Facet d vorhergesagt wurden.
-
FNd sind die falsch negativen Werte, die für Facet d vorhergesagt wurden.
-
TPRa = TPa/(TPa + FNa) ist der Recall für Facet a oder ihre tatsächliche positive Rate.
-
TPRd TPd/(TPd + FNd) ist der Rückruf für Facet d oder ihre tatsächliche positive Rate.
Betrachten Sie zum Beispiel die folgenden Konfusionsmatrizen für die Facetn a und d.
Konfusionsmatrix für die bevorzugte Facet a
Vorhersagen der Klasse A | Tatsächliches Ergebnis 0 | Tatsächliches Ergebnis 1 | Gesamt |
---|---|---|---|
0 | 20 | 5 | 25 |
1 | 10 | 65 | 75 |
Gesamt | 30 | 70 | 100 |
Konfusionsmatrix für die benachteiligte Facet d
Vorhersagen der Klasse D | Tatsächliches Ergebnis 0 | Tatsächliches Ergebnis 1 | Gesamt |
---|---|---|---|
0 | 18 | 7 | 25 |
1 | 5 | 20 | 25 |
Gesamt | 23 | 27 | 50 |
Der Wert der Erinnerungsdifferenz ist RD = 65/70 – 20/27 = 0,93 – 0,74 = 0,19, was auf einen Bias gegenüber Facet d hindeutet.
Der Wertebereich für die Erinnerungsdifferenz zwischen den Facetn a und d für die binäre und mehrkategoriale Klassifikation ist [-1, +1]. Diese Metrik ist nicht für kontinuierliche Etiketten verfügbar.
-
Positive Werte ergeben sich, wenn für Facet a ein höherer Erinnerungswert als für Facet d vorhanden ist. Dies deutet darauf hin, dass das Modell mehr echte positive Ergebnisse für Facet a als für Facet d findet, was eine Form von Verzerrung ist.
-
Werte nahe Null deuten darauf hin, dass der Erinnerungswert für die verglichenen Facetn ähnlich ist. Dies deutet darauf hin, dass das Modell in diesen beiden Facetn etwa die gleiche Anzahl an echten positiven Ergebnissen findet und nicht verzerrt ist.
-
Negative Werte ergeben sich, wenn für Facet d ein höherer Erinnerungswert als für Facet a vorhanden ist. Dies deutet darauf hin, dass das Modell für Facet d mehr echte positive Ergebnisse findet als für Facet a, was eine Form von Verzerrung ist.