Differenza di richiamo (RD)

La metrica della differenza di richiamo (RD) è la differenza di richiamo del modello tra il facet favorito a e il facet sfavorito d. Qualsiasi differenza in questi richiami è una potenziale forma di distorsione. Il richiamo è il tasso di veri positivi (TPR), che misura la frequenza con cui il modello prevede correttamente i casi che dovrebbero avere un esito positivo. Il richiamo è perfetto per un facet se tutti i casi y=1 sono previsti correttamente come y'=1 per quel facet. Il richiamo è maggiore quando il modello minimizza i falsi negativi, noti come errore di tipo II. Ad esempio, quante persone appartenenti a due gruppi diversi (facet a e d) che dovrebbero avere diritto ai prestiti vengono individuate correttamente dal modello? Se il tasso di richiamo è elevato per i prestiti al facet a, ma basso per i prestiti al facet d, la differenza fornisce una misura di questa distorsione rispetto al gruppo appartenente al facet d.

La formula per la differenza nei tassi di richiamo per i facet a e d è la seguente:

RD = TP_a/(TP_a + FN_a) - TP_d/(TP_d + FN_d) = TPR_a - TPR_d

Dove:

TP_a sono i veri positivi previsti per il facet a.
FN_a sono i falsi negativi previsti per il facet a.
TP_d sono i veri positivi previsti per il facet d.
FN_d sono i falsi negativi previsti per il facet d.
TPR_a = TP_a/(TP_a + FN_a) è il richiamo per il facet a, ovvero il suo tasso di veri positivi.
TPR_d TP_d/(TP_d + FN_d) è il richiamo per il facet d, ovvero il suo tasso di veri positivi.

Ad esempio, considera le seguenti matrici di confusione per i facet a e d.

Matrice di confusione per il facet favorito a

Previsioni di classe a	Obiettivo effettivo 0	Obiettivo effettivo 1	Totale
0	20	5	25
1	10	65	75
Totale	30	70	100

Matrice di confusione per il facet sfavorito d

Previsioni di classe d	Obiettivo effettivo 0	Obiettivo effettivo 1	Totale
0	18	7	25
1	5	20	25
Totale	23	27	50

Il valore della differenza di richiamo è RD = 65/70 - 20/27 = 0,93 - 0,74 = 0,19, il che indica una distorsione rispetto al facet d.

L'intervallo di valori per la differenza di richiamo tra i facet a e d per la classificazione binaria e multicategoria è [-1, +1]. Questo parametro non è disponibile per le etichette continue.

I valori positivi si ottengono quando il richiamo per il facet a è maggiore rispetto al facet d. Ciò suggerisce che il modello rileva più facet positivi per il facet a che per il facet d, che è una forma di distorsione.
I valori vicini allo zero indicano che il richiamo per i facet confrontati è simile. Ciò suggerisce che il modello rileva circa lo stesso numero di veri positivi in entrambi i facet e non è parziale.
I valori negativi si ottengono quando il richiamo per il facet d è maggiore rispetto al facet a. Ciò suggerisce che il modello rileva più facet positivi per il facet d che per il facet a, che è una forma di distorsione.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Differenza di specificità (SD)

Differenza nelle percentuali di accettazione (DAR)