リコール差 (RD) - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

リコール差 (RD)

リコール差 (RD) メトリクスは、有利なファセット a と不利なファセット d 間のモデルのリコールの差です。これらのリコールの差は、バイアスの潜在的な形です。リコールは真陽性率 (TPR) で、モデルが正の結果を受け取る場合を正しく予測する頻度を測定します。リコールは、すべての y=1 のケースがそのファセットの y'=1 として正しく予測されている場合に、ファセットに最適です。モデルがタイプ II エラーと呼ばれる偽陰性を最小化すると、リコールが大きくなります。例えば、ローンの対象となるべき 2 つの異なるグループ (ファセット a と d) に属する人のうち、何人がモデルによって正しく検出されましたか。ファセット a への融資ではリコール率が高いが、ファセット d への融資ではリコール率が低い場合、その差はファセット d に属するグループに対するこのバイアスの測定値を提供します。

ファセット a および d のリコール率の差の計算式は次のとおりです。

        RD = TPa/(TPa + FNa) - TPd/(TPd + FNd) = TPRa - TPRd

コードの説明は以下のとおりです。

  • TPa は、ファセット a に対して予測される真陽性です。

  • FNa は、ファセット a に対して予測される偽陰性です。

  • TPd は、ファセット d に対して予測される真陽性です。

  • FNd は、ファセット d に対して予測される偽陰性です。

  • TPRa = TPa/(TPa + FNa) は、ファセット a のリコールまたはその真陽性率です。

  • TPRd TPd/(TPd + FNd) は、ファセット d のリコールまたはその真陽性率です。

例えば、ファセット a と d について、次の混同行列を考えてみます。

有利なファセット a の混同行列

クラス a の予測 実際の結果 0 実際の結果 1 Total
0 20 5 25
1 10 65 75
Total 30 70 100

不利なファセット d の混同行列

クラス d の予測 実際の結果 0 実際の結果 1 Total
0 18 7 25
1 5 20 25
Total 23 27 50

リコール差の値は、RD = 65/70 - 20/27 = 0.93 - 0.74 = 0.19 で、ファセット d に対するバイアスを示します。

二項分類とマルチカテゴリ分類のファセット a と d 間のリコール差の値の範囲は、[-1, +1] です。このメトリクスは、連続ラベルの場合には使用できません。

  • 正の値は、ファセット d よりもファセット a の方が、リコールが高い場合に得られます。これは、モデルが、バイアスの形式であるファセット d よりもファセット a の真陽性をより多く検出することを示しています。

  • ゼロに近い値は、比較されるファセットのリコールが類似していることを示します。これは、モデルがこれらのファセットの両方でほぼ同じ数の真陽性を検出し、バイアスがないことを示しています。

  • 負の値は、ファセット a よりもファセット d の方が、リコールが高い場合に得られます。これは、モデルが、バイアスの形式であるファセット a よりもファセット d の真陽性をより多く検出することを示しています。