Differenza di precisione (AD) - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Differenza di precisione (AD)

La metrica della differenza di precisione (AD) è la differenza tra l'accuratezza della previsione per diversi facet. Questa metrica determina se la classificazione in base al modello è più accurata per un facet rispetto all'altro. AD indica se un facet presenta una percentuale maggiore di errori di tipo I e di tipo II. Tuttavia, non è in grado di distinguere tra errori di tipo I e di tipo II. Ad esempio, il modello può avere la stessa precisione per i diversi dati demografici relativi all'età, ma gli errori possono essere principalmente falsi positivi (errori di tipo I) per un gruppo basato sull'età e principalmente falsi negativi (errori di tipo II) per l'altro.

Inoltre, se l'approvazione dei prestiti viene effettuata con una precisione molto maggiore per un gruppo demografico di mezza età (facet a) rispetto a un altro gruppo demografico basato sull'età (facet d), a una percentuale maggiore di richiedenti qualificati del secondo gruppo viene negato un prestito (FN) o a una percentuale maggiore di richiedenti non qualificati di quel gruppo viene negato un prestito (FP) o entrambi. Ciò può portare a iniquità all'interno del gruppo per il secondo gruppo, anche se la percentuale di prestiti concessi è quasi la stessa per entrambi i gruppi in base all'età, come indicato da un valore DPPL vicino allo zero.

La formula per la metrica AD è la differenza tra la precisione di previsione per il facet a, ACCa, meno quella per il facet d, ACCd:

        AD = ACCa - ACCd

Dove:

  • ACCa = (TPa + TNa)/(TPa + TNa + FPa + FNa)

    • TPa sono i veri positivi previsti per il facet a

    • TNa sono i veri negativi previsti per il facet a

    • FPa sono i falsi positivi previsti per il facet a

    • FNa sono i falsi negativi previsti per il facet a

  • ACCd = (TPd + TNd)/(TPd + TNd + FPd + FNd)

    • TPd sono i veri positivi previsti per il facet d

    • TNd sono i veri negativi previsti per il facet d

    • FPd sono i falsi positivi previsti per il facet d

    • FNd sono i falsi negativi previsti per il facet d

Ad esempio, supponiamo che un modello approvi i prestiti a 70 richiedenti dal facet a di 100 e respinga gli altri 30. 10 non avrebbero dovuto ricevere il prestito (FPa) e 60 sono stati approvati (TPa). 20 dei rifiuti avrebbero dovuto essere approvati (FNa) e 10 sono stati correttamente respinti (TNa). La precisione per il facet a è la seguente:

        ACCa = (60 + 10)/(60 + 10 + 20 + 10) = 0,7

Quindi, supponiamo che un modello approvi i prestiti a 50 richiedenti dal facet d di 100 e respinga gli altri 50. 10 non avrebbero dovuto ricevere il prestito (FPa) e 40 sono stati approvati (TPa). 40 dei rifiuti avrebbero dovuto essere approvati (FNa) e 10 sono stati correttamente respinti (TNa). La precisione per il facet a è determinata come segue:

        ACCd = (40 + 10)/(40 + 10 + 40 + 10) = 0,5

La differenza di precisione è quindi AD = ACCa - ACCd = 0,7 - 0,5 = 0,2. Ciò indica che esiste una distorsione rispetto al facet d poiché la metrica è positiva.

L’intervallo di valori per AD per etichette di facet binarie e multicategoria è [-1, +1].

  • I valori positivi si verificano quando la precisione di previsione per il facet a è maggiore di quella per il facet d. Indicano che il facet d risente maggiormente di una combinazione di falsi positivi (errori di tipo I) o falsi negativi (errori di tipo II). Ciò significa che esiste una potenziale distorsione nei confronti del facet sfavorito d.

  • I valori prossimi allo zero si verificano quando la precisione di previsione per il facet a è simile a quella per il facet d.

  • I valori negativi si verificano quando la precisione di previsione per il facet d è maggiore di quella per il facet a t. Indicano che il facet a risente maggiormente di una combinazione di falsi positivi (errori di tipo I) o falsi negativi (errori di tipo II). Ciò significa che esiste una distorsione nei confronti del facet favorito a.