Impacto dispar (DI)
La métrica de diferencia en las proporciones positivas en las etiquetas predichas se puede evaluar en forma de cociente.
La comparación de la métrica de proporciones positivas en las etiquetas predichas se puede evaluar en forma de proporción en lugar de como diferencia, como ocurre con laDiferencia en las proporciones positivas de las etiquetas predichas (DPPL). La métrica de impacto dispar (DI) se define como la relación entre la proporción de predicciones positivas (y' = 1) para la faceta d y la proporción de predicciones positivas (y' = 1) para la faceta a. Por ejemplo, si las predicciones del modelo conceden préstamos al 60 % de un grupo de mediana edad (faceta a) y al 50 % de otros grupos de edad (faceta d), entonces DI = 0,5/0,6 = 0,8, lo que indica un sesgo positivo y un impacto adverso en el otro grupo de edad representado por la faceta d.
La fórmula para la relación de proporciones de las etiquetas predichas es la siguiente:
DI = q'd/q'a
Donde:
-
q'a = n'a(1)/na es la proporción predicha de la faceta a que obtiene un resultado positivo de valor 1. En el ejemplo, la proporción de una faceta de mediana edad que se prevé que van a obtener un préstamo. Aquí n'a(1) representa el número de miembros de la faceta a que obtienen un resultado positivo predicho y na es el número de miembros de la faceta a.
-
q'd = n'd(1)/nd es la proporción predicha de la faceta d que obtiene un resultado positivo de valor 1. En el ejemplo, una faceta de personas de edad avanzada y jóvenes que se prevé que van a obtener un préstamo. Aquí n'd(1) representa el número de miembros de la faceta d que obtienen un resultado positivo predicho y nd es el número de miembros de la faceta d.
En el caso de las etiquetas de facetas multicategoría, binarias y continuas, el rango de valores DI oscila a lo largo del intervalo [0, ∞).
-
Los valores inferiores a 1 indican que la faceta a tiene una mayor proporción de resultados positivos predichos que la faceta d. Esto se conoce como sesgo positivo.
-
Un valor de 1 indica paridad demográfica.
-
Los valores superiores a 1 indican que la faceta d tiene una mayor proporción de resultados positivos predichos que la faceta a. Esto se conoce como sesgo negativo.