Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Différence dans les taux d'acceptation (DAR)
La métrique de la différence des taux d'acceptation (DAR) est la différence des rapports entre les prédictions de vrais positifs (TP) et les positifs observés (TP + FP) pour les facettes a et d. Cette métrique mesure la différence de précision du modèle pour prédire les acceptations à partir de ces deux facettes. La précision mesure la fraction de candidats qualifiés du groupe de candidats qualifiés, identifiés comme tels par le modèle. Si la précision du modèle pour prédire les candidats qualifiés diverge entre les facettes, il s'agit là d'un biais et son ampleur est mesurée par le DAR.
La formule de calcul de la différence de taux d'acceptation entre les facettes a et d :
DAR = TPa/(TPa + FPa) - TPd/(TPd + FPd)
Où :
-
TPa sont les vrais positifs prédits pour la facette a.
-
FPa sont les faux positifs prédits pour la facette a.
-
TPd sont les vrais positifs prédits pour la facette d.
-
FPd sont les faux positifs prédits pour la facette d.
Par exemple, supposons que le modèle accepte d'accorder un prêt à 70 candidats d'âge moyen (facette a) (étiquettes positives prédites), dont seulement 35 sont effectivement acceptés (étiquettes positives observées). Supposons également que le modèle accepte d'accorder un prêt à 100 candidats d'autres groupes d'âge (facette d) (étiquettes positives prédites), dont seulement 40 sont effectivement acceptés (étiquettes positives observées). Comme la DAR = 35/70 - 40/100 = 0,10, cela indique un biais potentiel envers les personnes qualifiées du second groupe d'âge (facette d).
La plage de valeurs du DAR pour les étiquettes binaires, multicatégorie et continues est [-1, +1].
-
Des valeurs positives se produisent lorsque le rapport entre les positifs prédits (acceptations) et les résultats positifs observés (candidats qualifiés) pour la facette a est supérieur au même rapport pour la facette d. Ces valeurs indiquent un biais possible envers la facette défavorisée d dû à la présence d'un nombre relativement supérieur de faux positifs dans la facette d. Le biais apparent est d'autant plus extrême que la différence des rapports est importante.
-
Des valeurs proches de zéro se produisent lorsque le rapport entre les positifs prédits (acceptations) et les résultats positifs observés (candidats qualifiés) pour les facettes a et d est similaire, ce qui indique que le modèle prédit avec la même précision des étiquettes observées pour les résultats positifs.
-
Des valeurs négatives se produisent lorsque le rapport entre les positifs prédits (acceptations) et les résultats positifs observés (candidats qualifiés) pour la facette d est supérieur à celui de la facette a. Ces valeurs indiquent un biais possible envers la facette favorisée a dû à la présence d'un nombre relativement supérieur de faux positifs dans la facette a. Le biais apparent est d'autant plus extrême que la différence des rapports est négative.