処理の同等性 (TE) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

処理の同等性 (TE)

処理の同等性 (TE) は、ファセット a と d 間の偽陰性と偽陽性の比率の差です。このメトリクスの主な考え方は、グループ全体の精度が同じであっても、あるグループに対するエラーが、他のグループよりも、より有害であるかどうかを評価することです。エラー率は偽陽性と偽陰性の合計から得られますが、これら 2 つの内訳はファセット間で大きく異なる可能性があります。TE は、エラーがファセット全体で類似または異なる方法で補正されているかどうかを測定します。

処理の同等性の計算式は次のとおりです。

        TE = FNd/FPd - FNa/FPa

コードの説明は以下のとおりです。

  • FNd は、ファセット d に対して予測される偽陰性です。

  • FPd は、ファセット d に対して予測される偽陽性です。

  • FNa は、ファセット a に対して予測される偽陰性です。

  • FPa は、ファセット a に対して予測される偽陽性です。

FPa または FPd がゼロの場合、メトリクスは無制限になることに注意してください。

例えば、ファセット a から 100 人、ファセット d から 50 人のローン申請者がいるとします。ファセット a の場合、8 人が誤ってローンを拒否され (FNa)、別の 6 人が誤って承認されました (FPa)。残りの予測は正しかったので、TPa + TNa = 86 になります。ファセット d の場合、5 人が誤って拒否され (FNd)、2 人が誤って承認されました (FPd)。残りの予測は正しかったので、TPd + TNd = 43 になります。偽陰性と偽陽性の比率は、ファセット a では 8/6 = 1.33、ファセット d では 5/2 = 2.5 になります。したがって、両方のファセットの精度が同じであっても、TE = 2.5 - 1.33 = 1.167 になります。

        ACCa = (86)/(86+ 8 + 6) = 0.86

        ACCd = (43)/(43 + 5 + 2) = 0.86

バイナリおよびマルチカテゴリファセットラベルの条件付き拒否の差の値の範囲は、(-∞, +∞) です。TE メトリクスは、連続ラベルには定義されていません。このメトリクスの解釈は、偽陽性 (タイプ I エラー) と偽陰性 (タイプ II エラー) の相対的な重要性により異なります。

  • 正の値は、ファセット d の偽陰性と偽陽性の比率がファセット a より大きい場合に発生します。

  • ゼロに近い値は、ファセット a の偽陰性と偽陽性の比率がファセット d と似ている場合に発生します。

  • 負の値は、ファセット d の偽陰性と偽陽性の比率がファセット a より小さい場合に発生します。

注記

以前のバージョンでは、取り扱いの平等性は FNd / FPd - FNa / FPa ではなく FPa / FNa - FPd / FNd として計算されると記載されていました。ただし、どちらのバージョンも使用できます。詳細については、「Fairness measures for Machine Learning in Finance」を参照してください。