Differenza di specificità (SD) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Differenza di specificità (SD)

La differenza di specificità (SD) è la differenza di specificità tra il facet favorito a e il facet sfavorito d. La specificità misura la frequenza con cui il modello prevede correttamente un risultato negativo (y'=0). Qualsiasi differenza in queste specificità è una potenziale forma di distorsione.

La specificità è perfetta per un facet se tutti i casi y=0 sono previsti correttamente per tale facet. La specificità è maggiore quando il modello riduce al minimo i falsi positivi, un fenomeno noto come errore di tipo I. Ad esempio, la differenza tra una bassa specificità per i prestiti al facet a, e un’elevata specificità per la concessione di prestiti al faccet d è una misura della distorsione rispetto al facet d.

La formula seguente indica la differenza di specificità per i facet a e d.

        SD = TNd/(TN+ FP) - TN/(TN d + FPd) = - a a a TNR d TNR a

Le seguenti variabili utilizzate per calcolare la SD sono definite come segue:

  • TNd sono i veri negativi previsti per il facet d.

  • FPd sono i falsi positivi previsti per il facet d.

  • TNd sono i veri negativi previsti per il facet a.

  • FPd sono i falsi positivi previsti per il facet a.

  • TNRa= TNa/(TN a + FPa) è il vero tasso negativo, noto anche come specificità, per la sfaccettatura a.

  • TNRd= TNd/(TN d + FPd) è il vero tasso negativo, noto anche come specificità, per la sfaccettatura d.

Ad esempio, considera le seguenti matrici di confusione per i facet a e d.

Matrice di confusione per il facet favorito a

Previsioni di classe a Obiettivo effettivo 0 Obiettivo effettivo 1 Totale
0 20 5 25
1 10 65 75
Totale 30 70 100

Matrice di confusione per il facet sfavorito d

Previsioni di classe d Obiettivo effettivo 0 Obiettivo effettivo 1 Totale
0 18 7 25
1 5 20 25
Totale 23 27 50

Il valore della differenza di specificità è SD = 18/(18+5) - 20/(20+10) = 0.7826 - 0.6667 = 0.1159, il che indica una distorsione rispetto al facet d.

L'intervallo di valori per la differenza di specificità tra i facet a e d per la classificazione binaria e multicategoria è [-1, +1]. Questo parametro non è disponibile per le etichette continue. Ecco cosa implicano i diversi valori di SD:

  • I valori positivi si ottengono quando esiste una specificità maggiore per il facet d rispetto al facet a. Ciò suggerisce che il modello trova meno falsi positivi per il facet d rispetto al facet a. Un valore positivo indica una distorsione rispetto al facet d.

  • I valori vicini allo zero indicano che la specificità dei facet confrontati è simile. Ciò suggerisce che il modello rileva un numero simile di falsi positivi in entrambi questi facet e non è parziale.

  • I valori negativi si ottengono quando esiste una specificità maggiore per il facet a rispetto al facet d. Ciò suggerisce che il modello trova più falsi positivi per il facet a che per il facet d. Un valore negativo indica una distorsione rispetto al facet a.