Diferença nas taxas de aceitação (DAR) - Amazon SageMaker

Diferença nas taxas de aceitação (DAR)

A diferença na métrica das taxas de aceitação (DAR) é a diferença nas proporções entre as predições positivas verdadeiras (TP) e as positivas observadas (TP + FP) para as facetas a e d. Essa métrica mede a diferença na precisão do modelo para prever as aceitações dessas duas facetas. A precisão mede a fração de candidatos qualificados do conjunto de candidatos qualificados identificados como tal pelo modelo. Se a precisão do modelo para prever candidatos qualificados diverge entre as facetas, isso é um desvio e sua magnitude é medida pela DAR.

A fórmula para a diferença nas taxas de aceitação entre as facetas a e d:

        DAR = TPa/(TPa + FPa) - TPd/(TPd + FPd)

Em que:

  • TPa são os positivos verdadeiros previstos para a faceta a.

  • FPa são os falso-positivos previstos para a faceta a.

  • TPd são os positivos verdadeiros previstos para a faceta d.

  • FPd são os falso-positivos previstos para a faceta d.

Por exemplo, suponha que o modelo aceite 70 candidatos de meia-idade (faceta a) para um empréstimo (rótulos positivos previstos), dos quais apenas 35 são realmente aceitos (rótulos positivos observados). Suponha também que o modelo aceite 100 candidatos de outras faixas etárias (faceta d) para um empréstimo (rótulos positivos previstos), dos quais apenas 40 são realmente aceitos (rótulos positivos observados). Então DAR = 35/70 - 40/100 = 0,10, o que indica um desvio potencial contra pessoas qualificadas da segunda faixa etária (faceta d).

O intervalo de valores para DAR para rótulos binários, contínuos e de facetas multicategóricas é [-1, +1].

  • Valores positivos ocorrem quando a razão entre os positivos previstos (aceitações) e os resultados positivos observados (candidatos qualificados) para a faceta a é maior que a mesma proporção para a faceta d. Esses valores indicam um possível desvio contra a faceta desfavorecida d causada pela ocorrência de relativamente mais falso-positivos na faceta d. Quanto maior a diferença nas proporções, mais extremo é o desvio aparente.

  • Valores próximos de zero ocorrem quando a proporção entre os positivos previstos (aceitações) e os resultados positivos observados (candidatos qualificados) para as facetas a e d têm valores semelhantes, indicando que os rótulos observados para resultados positivos estão sendo previstos com igual precisão pelo modelo.

  • Valores negativos ocorrem quando a razão entre os positivos previstos (aceitações) e os resultados positivos observados (candidatos qualificados) para a faceta d é maior do que a mesma proporção para a faceta a. Esses valores indicam um possível desvio contra a faceta favorecida a causado pela ocorrência de relativamente mais falso-positivos na faceta a. Quanto mais negativa for a diferença nas proporções, mais extremo será o desvio aparente.