Spezifitätsunterschied (SD) - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Spezifitätsunterschied (SD)

Der Spezifitätsunterschied (SD) ist der Unterschied in der Spezifität zwischen der bevorzugten Facet a und der ungünstigen Facet d. Die Spezifität misst, wie oft das Modell ein negatives Ergebnis korrekt vorhersagt (y'=0). Jeder Unterschied in diesen Spezifitäten ist eine mögliche Form von Verzerrung.

Die Spezifität ist für eine Facet perfekt, wenn alle y=0-Fälle für diese Facet korrekt vorhergesagt wurden. Die Spezifität ist größer, wenn das Modell falsch positive Ergebnisse minimiert, was als Fehler vom Typ I bezeichnet wird. Beispielsweise ist der Unterschied zwischen einer niedrigen Spezifität für die Kreditvergabe an Facet a und einerhohen Spezifität für die Kreditvergabe an Facet d ein Maß für die Verzerrung gegenüber Facet d.

Die folgende Formel bezieht sich auf den Unterschied in der Spezifität für die Facetn a und d.

        SD = TNd/(TN d + FPd) — TNa/(TN a + FPa) = TNR d - TNR a

Die folgenden Variablen, die zur Berechnung von SD verwendet wurden, sind wie folgt definiert:

  • TNd sind die wahren negativen Werte, die für Facet d vorhergesagt wurden.

  • FPd sind die falsch positiven Ergebnisse, die für Facet d vorhergesagt wurden.

  • TNd sind die wahren negativen Werte, die für Facet a vorhergesagt wurden.

  • FPd sind die falsch positiven Ergebnisse, die für Facet a vorhergesagt wurden.

  • TNRa= TNa/(TN a + FPa) ist die wahre negative Rate, auch bekannt als Spezifität, für Facette a.

  • TNRd= TNd/(TN d + FPd) ist die tatsächliche negative Rate, auch bekannt als Spezifität, für Facette d.

Betrachten Sie zum Beispiel die folgenden Konfusionsmatrizen für die Facetn a und d.

Konfusionsmatrix für die bevorzugte Facet a

Vorhersagen der Klasse A Tatsächliches Ergebnis 0 Tatsächliches Ergebnis 1 Gesamt
0 20 5 25
1 10 65 75
Gesamt 30 70 100

Konfusionsmatrix für die benachteiligte Facet d

Vorhersagen der Klasse D Tatsächliches Ergebnis 0 Tatsächliches Ergebnis 1 Gesamt
0 18 7 25
1 5 20 25
Gesamt 23 27 50

Der Wert des Spezifitätsunterschieds ist SD = 18/(18+5) - 20/(20+10) = 0.7826 - 0.6667 = 0.1159, was auf eine Verzerrung gegenüber Facet d hinweist.

Der Wertebereich für den Spezifitätsunterschied zwischen den Facetn a und d für die binäre und mehrkategoriale Klassifikation ist [-1, +1]. Diese Metrik ist nicht für kontinuierliche Etiketten verfügbar. Die verschiedenen SD-Werte bedeuten Folgendes:

  • Positive Werte werden erhalten, wenn die Spezifität für die Facet d höher ist als für die Facet a. Dies deutet darauf hin, dass das Modell für Facet d weniger falsch positive Ergebnisse findet als für Facet a. Ein positiver Wert weist auf eine systematische Abweichung gegenüber Facet d hin.

  • Werte nahe Null deuten darauf hin, dass die Spezifität der verglichenen Facetn ähnlich ist. Dies deutet darauf hin, dass das Modell in beiden Facetn eine ähnliche Anzahl falsch positiver Ergebnisse feststellt und nicht verzerrt ist.

  • Negative Werte ergeben sich, wenn die Spezifität für Facet a höher ist als für Facet d. Dies deutet darauf hin, dass das Modell mehr falsch positive Ergebnisse für Facet a als für Facet d findet. Ein negativer Wert weist auf eine systematische Abweichung gegenüber Facet a hin.