処理の同等性 (TE)

処理の同等性 (TE) は、ファセット a と d 間の偽陰性と偽陽性の比率の差です。このメトリクスの主な考え方は、グループ全体の精度が同じであっても、あるグループに対するエラーが、他のグループよりも、より有害であるかどうかを評価することです。エラー率は偽陽性と偽陰性の合計から得られますが、これら 2 つの内訳はファセット間で大きく異なる可能性があります。TE は、エラーがファセット全体で類似または異なる方法で補正されているかどうかを測定します。

処理の同等性の計算式は次のとおりです。

TE = FN_d/FP_d - FN_a/FP_a

コードの説明は以下のとおりです。

FN_d は、ファセット d に対して予測される偽陰性です。
FP_d は、ファセット d に対して予測される偽陽性です。
FN_a は、ファセット a に対して予測される偽陰性です。
FP_a は、ファセット a に対して予測される偽陽性です。

FP_a または FP_d がゼロの場合、メトリクスは無制限になることに注意してください。

例えば、ファセット a から 100 人、ファセット d から 50 人のローン申請者がいるとします。ファセット a の場合、8 人が誤ってローンを拒否され (FN_a)、別の 6 人が誤って承認されました (FP_a)。残りの予測は正しかったので、TP_a + TN_a = 86 になります。ファセット d の場合、5 人が誤って拒否され (FN_d)、2 人が誤って承認されました (FP_d)。残りの予測は正しかったので、TP_d + TN_d = 43 になります。偽陰性と偽陽性の比率は、ファセット a では 8/6 = 1.33、ファセット d では 5/2 = 2.5 になります。したがって、両方のファセットの精度が同じであっても、TE = 2.5 - 1.33 = 1.167 になります。

ACC_a = (86)/(86+ 8 + 6) = 0.86

ACC_d = (43)/(43 + 5 + 2) = 0.86

バイナリおよびマルチカテゴリファセットラベルの条件付き拒否の差の値の範囲は、(-∞, +∞) です。TE メトリクスは、連続ラベルには定義されていません。このメトリクスの解釈は、偽陽性 (タイプ I エラー) と偽陰性 (タイプ II エラー) の相対的な重要性により異なります。

正の値は、ファセット d の偽陰性と偽陽性の比率がファセット a より大きい場合に発生します。
ゼロに近い値は、ファセット a の偽陰性と偽陽性の比率がファセット d と似ている場合に発生します。
負の値は、ファセット d の偽陰性と偽陽性の比率がファセット a より小さい場合に発生します。

注記

以前のバージョンでは、取り扱いの平等性は FN_d / FP_d - FN_a / FP_a ではなく FP_a / FN_a - FP_d / FN_d として計算されると記載されていました。ただし、どちらのバージョンも使用できます。詳細については、「Fairness measures for Machine Learning in Finance」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

精度差 (AD)

予測ラベルの条件付き属性格差 (CDDPL)