Differenza nei tassi di accettazione () DAR - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Differenza nei tassi di accettazione () DAR

La metrica relativa ai tassi di accettazione (DAR) è la differenza tra i rapporti tra le previsioni vere positive (TP) e quelle positive osservate (TP + FP) per le sfaccettature a e d. Questa metrica misura la differenza nella precisione del modello per prevedere le accettazioni relative a questi due facet. La precisione misura la frazione di candidati qualificati dal pool di candidati qualificati identificati come tali dal modello. Se la precisione del modello per la previsione dei candidati qualificati diverge tra gli aspetti, si tratta di una distorsione e la sua entità viene misurata con. DAR

La formula per la differenza nei tassi di accettazione tra i facet a e d è la seguente:

        DAR= TPa/(aTP+ FPa) - TP/(TP+ FP) d d d

Dove:

  • TPa sono i veri positivi previsti per il facet a.

  • FPa sono i falsi positivi previsti per il facet a.

  • TPd sono i veri positivi previsti per il facet d.

  • FPd sono i falsi positivi previsti per il facet d.

Ad esempio, supponiamo che il modello accetti 70 richiedenti di mezza età (facet a) per prestiti (etichette positive previste) di cui solo 35 siano effettivamente accettati (etichette positive osservate). Supponiamo inoltre che il modello accetti 100 richiedenti provenienti da altre fasce demografiche (facet d) per prestiti (etichette positive previste) di cui solo 40 siano effettivamente accettati (etichette positive osservate). Quindi DAR = 35/70 - 40/100 = 0,10, il che indica un potenziale pregiudizio nei confronti delle persone qualificate della seconda fascia di età (sfaccettatura d).

L'intervallo di valori DAR per le etichette binarie, sfaccettate e continue è [-1, +1].

  • I valori positivi si verificano quando il rapporto tra i facet positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per il facet a è maggiore dello stesso rapporto per il facet d. Questi valori indicano una possibile distorsione rispetto al facet sfavorito d causata dalla presenza di un numero relativamente maggiore di falsi positivi nel facet d. Maggiore è la differenza tra i rapporti, più estrema è la distorsione apparente.

  • I valori prossimi allo zero si verificano quando il rapporto tra i risultati positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per i facet a e d presenta valori simili che indicano che le etichette osservate per i risultati positivi vengono previste con uguale precisione dal modello.

  • I valori negativi si verificano quando il rapporto tra i facet positivi previsti (accettazioni) e i risultati positivi osservati (richiedenti qualificati) per il facet d è maggiore del rapporto del facet a. Questi valori indicano una possibile distorsione nei confronti del facet favorito a causata dalla presenza di un numero relativamente maggiore di falsi positivi nel facet a. Quanto più negativa è la differenza tra i rapporti, più estrema è la distorsione apparente.