翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
特異度差 (SD)
特異度差 (SD) とは、有利なファセット a と不利なファセット d の特異度の差です。特異度は、モデルが負の結果 (y'=0) を正しく予測する頻度を測定します。これらの特異度の差は、バイアスの潜在的な形です。
特異度は、すべての y=0 のケースがそのファセットに対して正しく予測されている場合に、そのファセットに最適です。Type I エラーと呼ばれる偽陽性をモデルが最小化すると、特異度は高くなります。例えば、ファセット a へのローンの特異度が低いことと、ファセット d へのローンの特異度が高いことの違いは、ファセット d に対するバイアスの尺度です。
次の式は、ファセット a と d の特異度の違いを示しています。
SD = TN d/ (TNd + FP d) - TN a/ (TNa + FP a) = TNRd - TNRa
SD の計算に使用される以下の変数は、次のように定義されます。
-
TNd は、ファセット d に対して予測される真陰性です。
-
FPd は、ファセット d に対して予測される偽陽性です。
-
TNd は、ファセット a に対して予測される真陰性です
-
FPd は、ファセット a に対して予測される偽陽性です。
-
TNRa = TN a/(TNa + FP a) は、ファセット a の真の負のレートで、特異性とも呼ばれます。
-
TNRd = TN d/(TNd + FP d) は、ファセット d の真陰性率で、特異性とも呼ばれます。
例えば、ファセット a と d について、次の混同行列を考えてみます。
有利なファセット a
の混同行列
クラス a の予測 | 実際の結果 0 | 実際の結果 1 | 合計 |
---|---|---|---|
0 | 20 | 5 | 25 |
1 | 10 | 65 | 75 |
合計 | 30 | 70 | 100 |
不利なファセット d
の混同行列
クラス d の予測 | 実際の結果 0 | 実際の結果 1 | 合計 |
---|---|---|---|
0 | 18 | 7 | 25 |
1 | 5 | 20 | 25 |
合計 | 23 | 27 | 50 |
特異度差の値は SD = 18/(18+5) - 20/(20+10) = 0.7826
- 0.6667 = 0.1159
で、これはファセット d に対するバイアスを示しています。
二項分類とマルチカテゴリ分類のファセット a と d 間の特異度の差の値の範囲は、[-1, +1]
です。このメトリクスは、連続ラベルの場合には使用できません。SD のさまざまな値が意味するものは次のとおりです。
-
正の値は、ファセット a よりもファセット d の方が、特異度が高い場合に得られます。このことから、モデルではファセット d の偽陽性がファセット a よりも少ないことが示唆されます。正の値はファセット d に対するバイアスを示します。
-
ゼロに近い値は、比較されるファセットの特異度が類似していることを示します。これは、モデルが両方のファセットでほぼ同数の偽陽性を検出し、バイアスがないことを示唆しています。
-
負の値は、ファセット d よりもファセット a の方が、特異度が高い場合に得られます。このことから、モデルではファセット a の偽陽性がファセット d よりも多いことが示唆されます。負の値はファセット a に対するバイアスを示します。