As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Dados pós-treinamento e métricas de viés do modelo
O Amazon SageMaker Clarify fornece onze dados pós-treinamento e métricas de viés de modelos para ajudar a quantificar várias concepções de justiça. Esses conceitos não podem ser todos satisfeitos simultaneamente e a seleção depende das especificidades dos casos envolvendo possíveis desvios que estão sendo analisados. A maioria dessas métricas é uma combinação dos números retirados das matrizes de confusão de classificação binária para os diferentes grupos demográficos. Como a equidade e o desvio podem ser definidos por uma ampla variedade de métricas, é necessário o julgamento humano para entender e escolher quais métricas são relevantes para o caso de uso individual, e os clientes devem consultar as partes interessadas apropriadas para determinar a medida apropriada de equidade para sua aplicação.
Usamos a notação a seguir para debater as métricas de desvio. O modelo conceitual descrito aqui é para classificação binária, em que os eventos são rotulados como tendo apenas dois resultados possíveis em seu espaço amostral, chamados de positivos (com valor 1) e negativos (com valor 0). Esse framework geralmente é extensível à classificação multicategórica de forma direta ou a casos que envolvem resultados contínuos valiosos, quando necessário. No caso da classificação binária, rótulos positivos e negativos são atribuídos aos resultados registrados em um conjunto de dados bruto para uma faceta favorecida a e para uma faceta desfavorecida d. Esses rótulos y são chamados de rótulos observados para diferenciá-los dos rótulos previstos y' que são atribuídos por um modelo de machine learning durante os estágios de treinamento ou inferências do ciclo de vida do ML. Esses rótulos são usados para definir distribuições de probabilidade Pa(y) e Pd(y) para seus respectivos resultados facetários.
-
rótulos:
-
y representa os n rótulos observados para resultados de eventos em um conjunto de dados de treinamento.
-
y' representa os rótulos previstos para os n rótulos observados no conjunto de dados por um modelo treinado.
-
-
resultados:
-
Um resultado positivo (com valor 1) para uma amostra, como a aceitação de uma candidatura.
-
n(1) é o número de rótulos observados para resultados positivos (aceitações).
-
n'(1) é o número de rótulos previstos para resultados positivos (aceitações).
-
-
Um resultado negativo (com valor 0) para uma amostra, como uma rejeição de candidatura.
-
n(0) é o número de rótulos observados para resultados negativos (rejeições).
-
n'(0) é o número de rótulos previstos para resultados negativos (rejeições).
-
-
-
valores da faceta:
-
faceta a — O valor da característica que define um grupo demográfico que o desvio favorece.
-
na é o número de rótulos observados para o valor da faceta favorecido: na = na(1) + na(0) a soma dos rótulos observados positivos e negativos para a faceta de valor a.
-
n'a é o número de rótulos previstos para o valor da faceta favorecido: n'a = n'a(1) + n'a(0) a soma dos rótulos de resultados previstos positivos e negativos para a faceta de valor a. Observe que n'a = na.
-
-
faceta d — O valor da característica que define um grupo demográfico que o desvio desfavorece.
-
nd é o número de rótulos observados para o valor da faceta desfavorecido: nd = nd(1) + nd(0) a soma dos rótulos observados positivos e negativos para a faceta de valor d.
-
n'd é o número de rótulos previstos para o valor da faceta desfavorecido: n'd = n'd(1) + n'd(0) a soma dos rótulos previstos positivos e negativos para a faceta de valor d. Observe que n'd = nd.
-
-
-
distribuições de probabilidade para resultados dos resultados dos dados facetários rotulados:
-
Pa(y) é a distribuição de probabilidade dos rótulos observados para a faceta a. Para dados binários rotulados, essa distribuição é dada pela razão entre o número de amostras na faceta a rotulada com resultados positivos e o número total, Pa(y1) = na(1)/ na, e a razão entre o número de amostras com resultados negativos e o número total, Pa(y0) = na(0)/ na.
-
Pd(y) é a distribuição de probabilidade dos rótulos observados para a faceta d. Para dados binários rotulados, essa distribuição é dada pelo número de amostras na faceta d rotulada com resultados positivos e o número total, Pd(y1) = nd(1)/ nd, e a razão entre o número de amostras com resultados negativos e o número total, Pd(y0) = nd(0)/ nd.
-
A tabela a seguir contém uma folha de dicas para orientação rápida e links para as métricas de desvio pós-treinamento.
Métricas de desvio pós-treinamento
Métrica de desvio pós-treinamento | Descrição | Exemplo de pergunta | Interpretar valores de métricas |
---|---|---|---|
Diferença nas proporções positivas nos rótulos previstos (DPPL) | Mede a diferença na proporção de previsões positivas entre a faceta favorecida a e a faceta desfavorecida d. |
Houve um desequilíbrio entre os grupos demográficos nos resultados positivos previstos que possa indicar desvio? |
Intervalo para rótulos normalizados binárias e de facetas multicategóricas: Intervalo para rótulos contínuos: (-∞, +∞) Interpretação:
|
Impacto díspar (DI) | Mede a proporção das proporções dos rótulos previstos para a faceta favorecida a e a faceta desfavorecida d. | Houve um desequilíbrio entre os grupos demográficos nos resultados positivos previstos que possa indicar desvio? |
Intervalo para rótulos binários normalizados, contínuos e de facetas multicategóricas: [0,∞) Interpretação:
|
Disparidade demográfica condicional em rótulos previstos () CDDPL | Mede a disparidade de rótulos previstos entre diferentes facetas como um todo, mas também por subgrupos. | Alguns grupos demográficos têm uma proporção maior de rejeições nos resultados de pedido de empréstimo do que a proporção de aceitações? |
A faixa de CDDPL valores para resultados binários, multicategoriais e contínuos:
|
Teste de inversão contrafactual (FT) | Examina cada membro da faceta d e avalia se membros semelhantes da faceta a têm previsões de modelos diferentes. | Um grupo de uma faixa etária específica corresponde estreitamente em todas as características a uma faixa etária diferente, mas paga mais, em média? | O intervalo para rótulos binários e de facetas multicategóricas é [-1,
+1] .
|
Diferença de precisão (AD) | Mede a diferença entre a precisão da previsão para as facetas favorecidas e desfavorecidas. | O modelo prevê rótulos com a mesma precisão para aplicações em todos os grupos demográficos? | O intervalo para rótulos binários e de facetas multicategóricas é [-1,
+1] .
|
Diferença de recordação (RD) | Compara a recordação do modelo quanto às facetas favorecidas e desfavorecidas. | Existe um desvio baseado na idade nos empréstimos devido a um modelo com maior recordação para uma faixa etária em comparação com outra? |
Intervalo para classificação binária e multicategorial:
|
Diferença na aceitação condicional () DCAcc | Compara os rótulos observados com os rótulos previstos por um modelo. Avalia se isso é o mesmo em todas as facetas para resultados positivos previstos (aceitações). | Ao comparar uma faixa etária com outra, os empréstimos são aceitos com mais ou menos frequência do que o previsto (baseado nas qualificações)? |
O intervalo para rótulos binários, contínuos e de facetas multicategóricas: (-∞, +∞).
|
Diferença nas taxas de aceitação (DAR) | Mede a diferença nas proporções entre os resultados positivos observados (TP) e os positivos previstos (TP + FP) entre as facetas favorecidas e desfavorecidas. | O modelo tem a mesma precisão ao prever aceitações de empréstimos para candidatos qualificados em todas as faixas etárias? | O intervalo para rótulos binários, contínuos e de faceta multicategórica é [-1, +1] .
|
Diferença de especificidade (SD) | Compara a especificidade do modelo entre facetas favorecidas e desfavorecidas. | Existe um desvio baseado na idade nos empréstimos porque o modelo prevê uma maior especificidade para uma faixa etária em comparação com outra? |
Intervalo para classificação binária e multicategorial:
|
Diferença na rejeição condicional () DCR | Compara os rótulos observados com os rótulos previstos por um modelo e avalia se isso é o mesmo em todas as facetas para resultados negativos (rejeições). | Há mais ou menos rejeições para pedidos de empréstimo do que o previsto para uma faixa etária em comparação com outra baseado nas qualificações? | O intervalo para rótulos binários, contínuos e de facetas multicategóricas: (-∞, +∞).
|
Diferença nas taxas de rejeição (DRR) | Mede a diferença nas proporções entre os resultados negativos observados (TN) e os negativos previstos (TN + FN) entre as facetas desfavorecidas e favorecidas. | O modelo tem a mesma precisão ao prever rejeições de empréstimos para candidatos não qualificados em todas as faixas etárias? | O intervalo para rótulos binários, contínuos e de faceta multicategórica é [-1, +1] .
|
Igualdade de tratamento (TE) | Mede a diferença na proporção de falso-positivos e falso-negativos entre as facetas favorecidas e desfavorecidas. | Em pedidos de empréstimo, a proporção relativa de falso-positivos para falso-negativos é a mesma em todas as faixas etárias? | O intervalo para rótulos binários e de facetas multicategóricas: (-∞, +∞).
|
Entropia generalizada (GE) | Mede a desigualdade nos benefícios b atribuídos a cada entrada pelas previsões do modelo. |
Dos dois modelos de candidatos para classificação de pedido de empréstimo, um leva a uma distribuição irregular dos resultados desejados do que o outro? | O intervalo para rótulos binários e multicategóricos: (0, 0.5). A GE é indefinida quando o modelo prevê somente falso-negativos.
|
Para obter informações adicionais sobre métricas de desvio pós-treinamento, consulte Fairness Measures for Machine Learning in Finance
Tópicos
- Diferença nas proporções positivas nos rótulos previstos (DPPL)
- Impacto díspar (DI)
- Diferença na aceitação condicional () DCAcc
- Diferença na rejeição condicional () DCR
- Diferença de especificidade (SD)
- Diferença de recordação (RD)
- Diferença nas taxas de aceitação (DAR)
- Diferença nas taxas de rejeição (DRR)
- Diferença de precisão (AD)
- Igualdade de tratamento (TE)
- Disparidade demográfica condicional em rótulos previstos () CDDPL
- Teste de inversão contrafactual (FT)
- Entropia generalizada (GE)