Impatto diversificato (DI) - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Impatto diversificato (DI)

La differenza nelle proporzioni positive nella metrica prevista delle etichette può essere valutata sotto forma di report.

Il confronto delle proporzioni positive nella metrica prevista delle etichette può essere valutato sotto forma di report anziché come differenza, come avviene con Differenza nelle proporzioni positive nelle etichette previste () DPPL. La metrica di impatto diversificato (DI) è definita come il rapporto tra la proporzione di previsioni positive (y' = 1) per il facet d e la proporzione di previsioni positive (y' = 1) per il facet a. Ad esempio, se le previsioni del modello concedono prestiti al 60% di un gruppo di mezza età (facet a) e al 50% di altri gruppi di età (facet d), allora DI = 0,5/0,6 = 0,8, il che indica una distorsione positiva e un impatto negativo sull'altra fascia di età rappresentata dal facet d.

La formula per il rapporto tra le proporzioni delle etichette previste è la seguente:

        DI = q'd/q'a

Dove:

  • q'a = n'a(1)/na è la proporzione prevista del facet a che ottiene un risultato positivo di valore 1. Nel nostro esempio, si tratta della percentuale di persone di mezza età che si prevede otterrà un prestito. Qui n'a(1) rappresenta il numero di membri del facet a che ottengono un risultato previsto positivo e na è il numero di membri del facet a.

  • q'd = n'd(1)/nd è la proporzione prevista del facet d che ottiene un risultato positivo di valore 1. Nel nostro esempio, si prevede che un facet di persone anziane e giovani otterrà un prestito. Qui n'd(1) rappresenta il numero di membri del facet d che ottengono un risultato previsto positivo e nd il numero di membri del facet d.

Per le etichette di facet binarie, multicategoria e continue, i valori DI variano nell'intervallo [0, ∞).

  • I valori inferiori a 1 indicano che il facet a ha una percentuale maggiore di risultati positivi previsti rispetto al facet d. Questo fenomeno viene definito distorsione positiva.

  • Un valore pari a 1 indica una parità demografica.

  • I valori maggiori di 1 indicano che il facet d ha una percentuale maggiore di risultati positivi previsti rispetto al facet a. Questo fenomeno viene definito distorsione negativa.