Differenza di richiamo (RD) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Differenza di richiamo (RD)

La metrica della differenza di richiamo (RD) è la differenza di richiamo del modello tra il facet favorito a e il facet sfavorito d. Qualsiasi differenza in questi richiami è una potenziale forma di distorsione. Il richiamo è il tasso di positività reale (TPR), che misura la frequenza con cui il modello prevede correttamente i casi che dovrebbero avere un esito positivo. Il richiamo è perfetto per un facet se tutti i casi y=1 sono previsti correttamente come y'=1 per quel facet. Il richiamo è maggiore quando il modello minimizza i falsi negativi, noti come errore di tipo II. Ad esempio, quante persone appartenenti a due gruppi diversi (facet a e d) che dovrebbero avere diritto ai prestiti vengono individuate correttamente dal modello? Se il tasso di richiamo è elevato per i prestiti al facet a, ma basso per i prestiti al facet d, la differenza fornisce una misura di questa distorsione rispetto al gruppo appartenente al facet d.

La formula per la differenza nei tassi di richiamo per i facet a e d è la seguente:

        RD = TPa/(aTP+ FNa) - TPd/(dTP+FNd) = - TPR a TPR d

Dove:

  • TPa sono i veri positivi previsti per il facet a.

  • FNa sono i falsi negativi previsti per il facet a.

  • TPd sono i veri positivi previsti per il facet d.

  • FNd sono i falsi negativi previsti per il facet d.

  • TPRa= TPa/(TP a + FNa) è il richiamo per la sfaccettatura a, ovvero il suo tasso effettivo positivo.

  • TPRdTPd/(TP d + FNd) è il richiamo per la sfaccettatura d, ovvero la sua velocità effettiva positiva.

Ad esempio, considera le seguenti matrici di confusione per i facet a e d.

Matrice di confusione per il facet favorito a

Previsioni di classe a Obiettivo effettivo 0 Obiettivo effettivo 1 Totale
0 20 5 25
1 10 65 75
Totale 30 70 100

Matrice di confusione per il facet sfavorito d

Previsioni di classe d Obiettivo effettivo 0 Obiettivo effettivo 1 Totale
0 18 7 25
1 5 20 25
Totale 23 27 50

Il valore della differenza di richiamo è RD = 65/70 - 20/27 = 0,93 - 0,74 = 0,19, il che indica una distorsione rispetto al facet d.

L'intervallo di valori per la differenza di richiamo tra i facet a e d per la classificazione binaria e multicategoria è [-1, +1]. Questo parametro non è disponibile per le etichette continue.

  • I valori positivi si ottengono quando il richiamo per il facet a è maggiore rispetto al facet d. Ciò suggerisce che il modello rileva più facet positivi per il facet a che per il facet d, che è una forma di distorsione.

  • I valori vicini allo zero indicano che il richiamo per i facet confrontati è simile. Ciò suggerisce che il modello rileva circa lo stesso numero di veri positivi in entrambi i facet e non è parziale.

  • I valori negativi si ottengono quando il richiamo per il facet d è maggiore rispetto al facet a. Ciò suggerisce che il modello rileva più facet positivi per il facet d che per il facet a, che è una forma di distorsione.