Impacto díspar (DI) - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Impacto díspar (DI)

A diferença nas proporções positivas na métrica de rótulos previstos pode ser avaliada na forma de uma proporção.

A comparação de proporções positivas na métrica de rótulos previstos pode ser avaliada na forma de uma proporção em vez de como uma diferença, como acontece com o Diferença nas proporções positivas nos rótulos previstos (DPPL). A métrica de impacto díspar (DI) é definida como a razão da proporção de previsões positivas (y’ = 1) para a faceta d sobre a proporção de previsões positivas (y’ = 1) para a faceta a. Por exemplo, se as previsões do modelo concederem empréstimos a 60% de um grupo de meia-idade (faceta a) e 50% de outras faixas etárias (faceta d), então DI = 0,5/0,6 = 0,8, o que indica um desvio positivo e um impacto adverso no outro grupo etário representado pela faceta d.

A fórmula para a diferença das proporções dos rótulos previstos:

        DI = q'd/q'a

Em que:

  • q'a = n'a(1)/na é a proporção prevista da faceta a que obtém um resultado positivo de valor 1. Em nosso exemplo, a proporção de uma faceta de meia-idade prevista para a concessão de um empréstimo. Aqui, n'a(1) representa o número de membros da faceta a que obtêm um resultado positivo previsto e na é o número de membros da faceta a.

  • q'd = n'd(1)/nd é a proporção prevista da faceta d que obtém um resultado positivo de valor 1. Em nosso exemplo, uma faceta de pessoas mais velhas e mais jovens previu a concessão de um empréstimo. Aqui, n'd(1) representa o número de membros da faceta d que obtêm um resultado positivo previsto e nd é o número de membros da faceta d.

Para rótulos binários, contínuos e de facetas multicategóricas, os valores de DI variam ao longo do intervalo [0, ∞).

  • Valores menores que 1 indicam que a faceta a tem uma proporção maior de resultados positivos previstos do que a faceta d. Isso é conhecido como desvio positivo.

  • Um valor de 1 indica uma paridade demográfica.

  • Valores maiores que 1 indicam que a faceta d tem uma proporção maior de resultados positivos previstos do que a faceta a. Isso é conhecido como desvio negativo.