Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Differenza di richiamo (RD)
La metrica della differenza di richiamo (RD) è la differenza di richiamo del modello tra il facet favorito a e il facet sfavorito d. Qualsiasi differenza in questi richiami è una potenziale forma di distorsione. Il richiamo è il tasso di positività reale (TPR), che misura la frequenza con cui il modello prevede correttamente i casi che dovrebbero avere un esito positivo. Il richiamo è perfetto per un facet se tutti i casi y=1 sono previsti correttamente come y'=1 per quel facet. Il richiamo è maggiore quando il modello minimizza i falsi negativi, noti come errore di tipo II. Ad esempio, quante persone appartenenti a due gruppi diversi (facet a e d) che dovrebbero avere diritto ai prestiti vengono individuate correttamente dal modello? Se il tasso di richiamo è elevato per i prestiti al facet a, ma basso per i prestiti al facet d, la differenza fornisce una misura di questa distorsione rispetto al gruppo appartenente al facet d.
La formula per la differenza nei tassi di richiamo per i facet a e d è la seguente:
RD = TPa/(aTP+ FNa) - TPd/(dTP+FNd) = - TPR a TPR d
Dove:
-
TPa sono i veri positivi previsti per il facet a.
-
FNa sono i falsi negativi previsti per il facet a.
-
TPd sono i veri positivi previsti per il facet d.
-
FNd sono i falsi negativi previsti per il facet d.
-
TPRa= TPa/(TP a + FNa) è il richiamo per la sfaccettatura a, ovvero il suo tasso effettivo positivo.
-
TPRdTPd/(TP d + FNd) è il richiamo per la sfaccettatura d, ovvero la sua velocità effettiva positiva.
Ad esempio, considera le seguenti matrici di confusione per i facet a e d.
Matrice di confusione per il facet favorito a
Previsioni di classe a | Obiettivo effettivo 0 | Obiettivo effettivo 1 | Totale |
---|---|---|---|
0 | 20 | 5 | 25 |
1 | 10 | 65 | 75 |
Totale | 30 | 70 | 100 |
Matrice di confusione per il facet sfavorito d
Previsioni di classe d | Obiettivo effettivo 0 | Obiettivo effettivo 1 | Totale |
---|---|---|---|
0 | 18 | 7 | 25 |
1 | 5 | 20 | 25 |
Totale | 23 | 27 | 50 |
Il valore della differenza di richiamo è RD = 65/70 - 20/27 = 0,93 - 0,74 = 0,19, il che indica una distorsione rispetto al facet d.
L'intervallo di valori per la differenza di richiamo tra i facet a e d per la classificazione binaria e multicategoria è [-1, +1]. Questo parametro non è disponibile per le etichette continue.
-
I valori positivi si ottengono quando il richiamo per il facet a è maggiore rispetto al facet d. Ciò suggerisce che il modello rileva più facet positivi per il facet a che per il facet d, che è una forma di distorsione.
-
I valori vicini allo zero indicano che il richiamo per i facet confrontati è simile. Ciò suggerisce che il modello rileva circa lo stesso numero di veri positivi in entrambi i facet e non è parziale.
-
I valori negativi si ottengono quando il richiamo per il facet d è maggiore rispetto al facet a. Ciò suggerisce che il modello rileva più facet positivi per il facet d che per il facet a, che è una forma di distorsione.