As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Disparidade demográfica condicional () CDD
A métrica de disparidade demográfica (DD) determina se uma faceta tem uma proporção maior de resultados rejeitados no conjunto de dados do que de resultados aceitos. No caso binário em que há duas facetas, homens e mulheres, por exemplo, que constituem o conjunto de dados, a desfavorecida é rotulada como faceta d e a favorita é rotulada como faceta a. Por exemplo, no caso de admissões em faculdades, se as candidatas (mulheres) representassem 46% dos candidatos rejeitados e representassem apenas 32% dos candidatos aceitos, afirmamos que há disparidade demográfica porque a taxa de rejeição de mulheres excede a taxa de aceitação. As candidatas mulheres são rotuladas como faceta d neste caso. Se os candidatos (homens) representavam 54% dos candidatos rejeitados e 68% dos candidatos aceitos, então não há uma disparidade demográfica para essa faceta, pois a taxa de rejeição é menor que a taxa de aceitação. Os candidatos (homens) são rotulados como faceta d neste caso.
A fórmula para a disparidade demográfica para a faceta d menos favorecida é a seguinte:
DDd = nd(0)/n(0) - nd(1)/n(1) = PdR(y0) - PdA(y1)
Em que:
-
n(0) = na(0) + nd(0) é o número total de resultados rejeitados no conjunto de dados para a faceta favorecida a e a faceta desfavorecida d.
-
n(1) = na(1) + nd(1) é o número total de resultados aceitos no conjunto de dados para a faceta favorecida a e a faceta desfavorecida d.
-
PdR(y0) é a proporção de resultados rejeitados (com valor 0) na faceta d.
-
PdA(y1) é a proporção de resultados aceitos (valor 1) na faceta d.
Para o exemplo de admissão na faculdade, a disparidade demográfica para mulheres é DDd = 0,46 - 0,32 = 0,14. Para homens DDa = 0,54 - 0,68 = - 0,14.
Uma métrica de disparidade demográfica condicional (CDD) que condiciona o DD em atributos que definem um estrato de subgrupos no conjunto de dados é necessária para descartar o paradoxo de Simpson. O reagrupamento pode fornecer insights sobre a causa das aparentes disparidades demográficas nas facetas menos favorecidas. O caso clássico surgiu no caso de admissões em Berkeley, onde os homens foram aceitos com uma taxa geral mais alta do que as mulheres. As estatísticas desse caso foram usadas nos cálculos de exemplo de DD. No entanto, quando os subgrupos departamentais foram examinados, as mulheres demonstraram ter taxas de admissão mais altas do que os homens quando condicionadas pelo departamento. A explicação foi que as mulheres se inscreveram em departamentos com taxas de aceitação mais baixas do que os homens. O exame das taxas de aceitação subagrupadas revelou que as mulheres foram realmente aceitas em uma taxa mais alta do que os homens nos departamentos com taxas de aceitação mais baixas.
A CDD métrica fornece uma única medida para todas as disparidades encontradas nos subgrupos definidos por um atributo de um conjunto de dados por meio da média deles. É definida como a média ponderada das disparidades demográficas (DDi) para cada um dos subgrupos, com cada disparidade de subgrupo ponderada em proporção ao número de observações contidas. A fórmula para a disparidade demográfica condicional é a seguinte:
CDD= (1/n) * ․ i n i * DD i
Em que:
-
∑ini = n é o número total de observações e ni é o número de observações para cada subgrupo.
-
DDi = ni(0)/n(0) - ni(1)/n(1) = PiR(y0) - PiA(y1) é a disparidade demográfica para o iésimo subgrupo.
A disparidade demográfica de um subgrupo (DDi) é a diferença entre a proporção de resultados rejeitados e a proporção de resultados aceitos para cada subgrupo.
O intervalo de valores de DD para resultados binários para o conjunto de dados completo DDd ou para seus subgrupos condicionalizados DDi é [-1, +1].
-
+1: quando não há rejeições na faceta a ou subgrupo e nenhuma aceitação na faceta d ou subgrupo
-
Valores positivos indicam que há uma disparidade demográfica, pois a faceta d ou subgrupo tem uma proporção maior dos resultados rejeitados no conjunto de dados do que dos resultados aceitos. Quanto maior o valor, menos favorece a faceta e maior a disparidade.
-
Valores negativos indicam que não há uma disparidade demográfica, pois a faceta d ou subgrupo tem uma proporção maior dos resultados aceitos no conjunto de dados do que dos resultados rejeitados. Quanto menor o valor, mais favorecida é a faceta.
-
-1: quando não há rejeições na faceta d ou subgrupo e nenhuma aceitação na faceta a ou subgrupo
Se você não condiciona nada, então CDD é zero se e somente se DPL for zero.
Essa métrica é útil para explorar os conceitos de discriminação direta e indireta e de justificativa objetiva na legislação e jurisprudência de não discriminação da UE e do Reino Unido. Para obter informações adicionais, consulte Por que a imparcialidade não pode ser automatizada