特異度差 (SD) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

特異度差 (SD)

特異度差 (SD) とは、有利なファセット a と不利なファセット d の特異度の差です。特異度は、モデルが負の結果 (y'=0) を正しく予測する頻度を測定します。これらの特異度の差は、バイアスの潜在的な形です。

特異度は、すべての y=0 のケースがそのファセットに対して正しく予測されている場合に、そのファセットに最適です。Type I エラーと呼ばれる偽陽性をモデルが最小化すると、特異度は高くなります。例えば、ファセット a へのローンの特異度が低いことと、ファセット d へのローンの特異度が高いことの違いは、ファセット d に対するバイアスの尺度です。

次の式は、ファセット a と d の特異度の違いを示しています。

        SD = TN d/ (TNd + FP d) - TN a/ (TNa + FP a) = TNRd - TNRa

SD の計算に使用される以下の変数は、次のように定義されます。

  • TNd は、ファセット d に対して予測される真陰性です。

  • FPd は、ファセット d に対して予測される偽陽性です。

  • TNd は、ファセット a に対して予測される真陰性です

  • FPd は、ファセット a に対して予測される偽陽性です。

  • TNRa = TN a/(TNa + FP a) は、ファセット a の真の負のレートで、特異性とも呼ばれます。

  • TNRd = TN d/(TNd + FP d) は、ファセット d の真陰性率で、特異性とも呼ばれます。

例えば、ファセット a と d について、次の混同行列を考えてみます。

有利なファセット a の混同行列

クラス a の予測 実際の結果 0 実際の結果 1 合計
0 20 5 25
1 10 65 75
合計 30 70 100

不利なファセット d の混同行列

クラス d の予測 実際の結果 0 実際の結果 1 合計
0 18 7 25
1 5 20 25
合計 23 27 50

特異度差の値は SD = 18/(18+5) - 20/(20+10) = 0.7826 - 0.6667 = 0.1159 で、これはファセット d に対するバイアスを示しています。

二項分類とマルチカテゴリ分類のファセット a と d 間の特異度の差の値の範囲は、[-1, +1] です。このメトリクスは、連続ラベルの場合には使用できません。SD のさまざまな値が意味するものは次のとおりです。

  • 正の値は、ファセット a よりもファセット d の方が、特異度が高い場合に得られます。このことから、モデルではファセット d の偽陽性がファセット a よりも少ないことが示唆されます。正の値はファセット d に対するバイアスを示します。

  • ゼロに近い値は、比較されるファセットの特異度が類似していることを示します。これは、モデルが両方のファセットでほぼ同数の偽陽性を検出し、バイアスがないことを示唆しています。

  • 負の値は、ファセット d よりもファセット a の方が、特異度が高い場合に得られます。このことから、モデルではファセット a の偽陽性がファセット d よりも多いことが示唆されます。負の値はファセット a に対するバイアスを示します。