Differenza nelle percentuali di accettazione (DAR)

La metrica della differenza nei tassi di accettazione (DAR) è la differenza nei rapporti tra le previsioni vere positive (TP) e quelle positive osservate (TP + FP) per i facet a e d. Questa metrica misura la differenza nella precisione del modello per prevedere le accettazioni relative a questi due facet. La precisione misura la frazione di candidati qualificati dal pool di candidati qualificati identificati come tali dal modello. Se la precisione del modello per la previsione dei candidati qualificati diverge tra i facet, si tratta di una distorsione e la sua entità viene misurata dal DAR.

La formula per la differenza nei tassi di accettazione tra i facet a e d è la seguente:

DAR = TP_a/(TP_a + FP_a) - TP_d/(TP_d + FP_d)

Dove:

TP_a sono i veri positivi previsti per il facet a.
FP_a sono i falsi positivi previsti per il facet a.
TP_d sono i veri positivi previsti per il facet d.
FP_d sono i falsi positivi previsti per il facet d.

Ad esempio, supponiamo che il modello accetti 70 richiedenti di mezza età (facet a) per prestiti (etichette positive previste) di cui solo 35 siano effettivamente accettati (etichette positive osservate). Supponiamo inoltre che il modello accetti 100 richiedenti provenienti da altre fasce demografiche (facet d) per prestiti (etichette positive previste) di cui solo 40 siano effettivamente accettati (etichette positive osservate). Quindi, DAR = 35/70 - 40/100 = 0,10, il che indica una potenziale distorsione nei confronti delle persone qualificate della seconda fascia di età (facet d).

L’intervallo di valori per DAR per etichette di facet binarie, multicategoria e continue è [-1, +1].

I valori positivi si verificano quando il rapporto tra i facet positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per il facet a è maggiore dello stesso rapporto per il facet d. Questi valori indicano una possibile distorsione rispetto al facet sfavorito d causata dalla presenza di un numero relativamente maggiore di falsi positivi nel facet d. Maggiore è la differenza tra i rapporti, più estrema è la distorsione apparente.
I valori prossimi allo zero si verificano quando il rapporto tra i risultati positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per i facet a e d presenta valori simili che indicano che le etichette osservate per i risultati positivi vengono previste con uguale precisione dal modello.
I valori negativi si verificano quando il rapporto tra i facet positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per il facet d è maggiore del rapporto del facet a. Questi valori indicano una possibile distorsione nei confronti del facet favorito a causata dalla presenza di un numero relativamente maggiore di falsi positivi nel facet a. Quanto più negativa è la differenza tra i rapporti, più estrema è la distorsione apparente.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Differenza di richiamo (RD)

Differenza nelle percentuali di rifiuto (DRR)