Diferencia en las tasas de aceptación () DAR - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Diferencia en las tasas de aceptación () DAR

La métrica de diferencia en las tasas de aceptación (DAR) es la diferencia en las relaciones entre las predicciones positivas verdaderas (TP) y las positivas observadas (TP + FP) en las facetas a y d. Esta métrica mide la diferencia en la precisión del modelo para predecir las aceptaciones de estas dos facetas. La precisión mide la fracción de candidatos cualificados del grupo de candidatos cualificados que el modelo identifica como tales. Si la precisión del modelo para predecir los candidatos cualificados difiere entre las facetas, se trata de un sesgo y su magnitud se mide mediante el. DAR

La fórmula para la diferencia en tasas de aceptación entre las facetas a y d es la siguiente:

        DAR= TPa/(TP a + FPa) - TPd/(TP d + FP) d

Donde:

  • TPa son los verdaderos positivos predichos para la faceta a.

  • FPa son los falsos positivos predichos para la faceta a.

  • TPd son los verdaderos positivos predichos para la faceta d.

  • FPd son los falsos positivos predichos para la faceta d.

Por ejemplo, suponga que el modelo acepta 70 candidatos de mediana edad (faceta a) para un préstamo (etiquetas predichas positivas), de los cuales solo se aceptan 35 (etiquetas observadas positivas). Suponga también que el modelo acepta 100 candidatos de otros grupos demográficos (faceta d) para un préstamo (etiquetas predichas positivas), de los cuales solo se aceptan 40 (etiquetas observadas positivas). Entonces DAR = 35/70 - 40/100 = 0,10, lo que indica un posible sesgo en contra de las personas cualificadas del segundo grupo de edad (faceta d).

El rango de valores DAR para las etiquetas binarias, multicategoría y continuas es [-1, +1].

  • Los valores positivos se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) para la faceta a es mayor que la misma relación para la faceta d. Estos valores indican un posible sesgo en contra de la faceta desfavorecida d debido a la ocurrencia de un número relativamente mayor de falsos positivos en la faceta d. Cuanto mayor sea la diferencia de las relaciones, más extremo será el sesgo aparente.

  • Los valores cercanos a cero se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) en las facetas a y d tiene valores similares, lo que indica que las etiquetas observadas de resultados positivos están siendo predichas con la misma precisión por el modelo.

  • Los valores negativos se producen cuando la relación entre los resultados positivos predichos (aceptaciones) y los resultados positivos observados (candidatos cualificados) para la faceta d es mayor que la misma relación para la faceta a. Estos valores indican un posible sesgo en contra de la faceta favorecida a provocado por la ocurrencia de un número relativamente mayor de falsos positivos en la faceta a. Cuanto más negativa sea la diferencia de las relaciones, más extremo será el sesgo aparente.