リコール差 (RD)

リコール差 (RD) メトリクスは、有利なファセット a と不利なファセット d 間のモデルのリコールの差です。これらのリコールの差は、バイアスの潜在的な形です。リコールは真陽性率 (TPR) で、モデルが正の結果を受け取る場合を正しく予測する頻度を測定します。リコールは、すべての y=1 のケースがそのファセットの y'=1 として正しく予測されている場合に、ファセットに最適です。モデルがタイプ II エラーと呼ばれる偽陰性を最小化すると、リコールが大きくなります。例えば、ローンの対象となるべき 2 つの異なるグループ (ファセット a と d) に属する人のうち、何人がモデルによって正しく検出されましたか。ファセット a への融資ではリコール率が高いが、ファセット d への融資ではリコール率が低い場合、その差はファセット d に属するグループに対するこのバイアスの測定値を提供します。

ファセット a および d のリコール率の差の計算式は次のとおりです。

RD = TP_a/(TP_a + FN_a) - TP_d/(TP_d + FN_d) = TPR_a - TPR_d

コードの説明は以下のとおりです。

TP_a は、ファセット a に対して予測される真陽性です。
FN_a は、ファセット a に対して予測される偽陰性です。
TP_d は、ファセット d に対して予測される真陽性です。
FN_d は、ファセット d に対して予測される偽陰性です。
TPR_a = TP_a/(TP_a + FN_a) は、ファセット a のリコールまたはその真陽性率です。
TPR_d TP_d/(TP_d + FN_d) は、ファセット d のリコールまたはその真陽性率です。

例えば、ファセット a と d について、次の混同行列を考えてみます。

有利なファセット a の混同行列

クラス a の予測	実際の結果 0	実際の結果 1	Total
0	20	5	25
1	10	65	75
Total	30	70	100

不利なファセット d の混同行列

クラス d の予測	実際の結果 0	実際の結果 1	Total
0	18	7	25
1	5	20	25
Total	23	27	50

リコール差の値は、RD = 65/70 - 20/27 = 0.93 - 0.74 = 0.19 で、ファセット d に対するバイアスを示します。

二項分類とマルチカテゴリ分類のファセット a と d 間のリコール差の値の範囲は、[-1, +1] です。このメトリクスは、連続ラベルの場合には使用できません。

正の値は、ファセット d よりもファセット a の方が、リコールが高い場合に得られます。これは、モデルが、バイアスの形式であるファセット d よりもファセット a の真陽性をより多く検出することを示しています。
ゼロに近い値は、比較されるファセットのリコールが類似していることを示します。これは、モデルがこれらのファセットの両方でほぼ同じ数の真陽性を検出し、バイアスがないことを示しています。
負の値は、ファセット a よりもファセット d の方が、リコールが高い場合に得られます。これは、モデルが、バイアスの形式であるファセット a よりもファセット d の真陽性をより多く検出することを示しています。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

特異度差 (SD)

承認率の差 (DAR)