Distance de variation totale (TVD)

La métrique de biais des données de distance de variation totale (TVD) est la moitié de la ₁ norme L. TVDIl s'agit de la plus grande différence possible entre les distributions de probabilité pour les résultats d'étiquette des facettes a et d. La norme L₁ est la distance de Hamming, une métrique utilisée pour comparer deux chaînes de données binaires en déterminant le nombre minimum de substitutions nécessaires pour qu'une chaîne en devienne une autre. Si les chaînes devaient être des copies les unes des autres, la métrique détermine le nombre d'erreurs qui se sont produites lors de la copie. Dans le contexte de la détection des biais, TVD quantifie le nombre de résultats de la facette a qui devraient être modifiés pour correspondre aux résultats de la facette d.

La formule pour la distance de variation totale est la suivante :

TVD= ½ _* L ₁ (P_a, P_d)

Supposons par exemple que vous avez une distribution de résultats avec trois catégories, y_i = {y₀, y₁, y₂} = {accepté, sur liste d'attente, rejeté} dans un scénario multicatégoriel d'admission à l'université. Vous devez calculer les différences entre les nombres de facettes a et d pour chaque résultatTVD. Le résultat est le suivant :

Où :

n_a⁽ⁱ⁾ est le nombre des résultats de la énième catégorie dans la facette a : par exemple n_a⁽⁰⁾ est le nombre d'acceptations de la facette a.
n_d⁽ⁱ⁾ est le nombre des résultats de la énième catégorie dans la facette d : par exemple n_d⁽²⁾ est le nombre de rejets de la facette d.

La plage de TVD valeurs pour les résultats binaires, multicatégoriels et continus est [0, 1), où :
- Les valeurs proches de zéro signifient que les distributions d'étiquettes sont similaires.
- Les valeurs positives indiquent une divergence dans les distributions d'étiquettes, d'autant plus importante que le nombre de valeurs positives est élevé.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Norme Lp (LP)

Kolmogorov-Smirnov (KS)