As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Diferença de precisão (AD)
A métrica de diferença de precisão (AD) é a diferença entre a precisão da previsão para diferentes facetas. Essa métrica determina se a classificação pelo modelo é mais precisa para uma faceta do que para a outra. A AD indica se uma faceta incorre em uma proporção maior de erros do Tipo I e do Tipo II. Mas ela não consegue diferenciar entre erros do Tipo I e do Tipo II. Por exemplo, o modelo pode ter a mesma precisão para diferentes faixas etárias, mas os erros podem ser principalmente falso-positivos (erros do Tipo I) para um grupo baseado na idade e principalmente falso-negativos (erros do Tipo II) para o outro.
Além disso, se as aprovações de empréstimos forem feitas com muito mais precisão para um grupo demográfico de meia-idade (faceta a) do que para outro grupo demográfico baseado na idade (faceta d), uma proporção maior de candidatos qualificados no segundo grupo terá seu empréstimo negado (FN) ou uma proporção maior de candidatos não qualificados desse grupo obterão um empréstimo (FP) ou ambos. Isso pode levar à injustiça dentro do grupo para o segundo grupo, mesmo que a proporção de empréstimos concedidos seja quase a mesma para ambos os grupos com base na idade, o que é indicado por um DPPL valor próximo de zero.
A fórmula para a métrica AD é a diferença entre a precisão da predição para a faceta a ACCa, menos a da faceta d,: ACC d
AD = ACC a - ACC d
Em que:
-
ACCa= (TP a + TNa)/(TP a + TN + FP a + a FN) a
-
TPa são os positivos verdadeiros previstos para a faceta a
-
TNa são os negativos verdadeiros previstos para a faceta a
-
FPa são os falso-positivos previstos para a faceta a
-
FNa são os falso-negativos previstos para a faceta a
-
-
ACCd= (TP d + TNd)/(TP d + TN + FP d + d FN) d
-
TPd são os positivos verdadeiros previstos para a faceta d
-
TNd são os negativos verdadeiros previstos para a faceta d
-
FPd são os falso-positivos previstos para a faceta d
-
FNd são os falso-negativos previstos para a faceta d
-
Por exemplo, suponha que um modelo aprove empréstimos para 70 candidatos da faceta a de 100 e rejeite os outros 30. 10 não deveriam ter recebido o empréstimo (FPa) e 60 foram aprovados, o que deveria ter sido (TPa). 20 das rejeições deveriam ter sido aprovadas (FNa) e 10 foram rejeitadas corretamente (TNa). A precisão da faceta a é a seguinte:
ACCa= (60 + 10)/(60 + 10 + 20 + 10) = 0,7
Em seguida, suponha que um modelo aprove empréstimos para 50 candidatos da faceta d de 100 e rejeite os outros 50. 10 não deveriam ter recebido o empréstimo (FPa) e 40 foram aprovados, o que deveria ter sido (TPa). 40 das rejeições deveriam ter sido aprovadas (FNa) e 10 foram rejeitadas corretamente (TNa). A precisão da faceta a é determinada conforme a seguir:
ACCd= (40 + 10)/(40 + 10 + 40 + 10) = 0,5
A diferença de precisão é, portanto, AD = ACC a - ACC d = 0,7 - 0,5 = 0,2. Isso indica que há um desvio em relação à faceta d, pois a métrica é positiva.
O intervalo de valores do AD para rótulos binários e de facetas multicategóricas é [-1, +1].
-
Valores positivos ocorrem quando a precisão da previsão para a faceta a é maior do do que para a faceta d. Isso significa que a faceta d sofre mais com alguma combinação de falso-positivos (erros do Tipo I) ou falso-negativos (erros do Tipo II). Isso significa que há um desvio potencial contra a faceta d desfavorecida.
-
Valores próximos de zero ocorrem quando a precisão da previsão para a faceta a é semelhante à da faceta d.
-
Valores negativos ocorrem quando a precisão da previsão para a faceta d é maior do que para a faceta a t. Isso significa que a faceta a sofre mais com alguma combinação de falso-positivos (erros do Tipo I) ou falso-negativos (erros do Tipo II). Isso significa que há um desvio contra a faceta a favorecida.