條件式接受的差異 (DCAcc)

此指標將比較觀察標籤與模型預測標籤，並評估各個構面獲得預測正值結果是否相同。此指標接近模仿人類偏差，因為與訓練資料集中的標籤 (標籤 y) 相比，它量化模型在某個構面的正面結果 (標籤 y') 了多少。例如，如果與包含其他年齡組 (構面 d) 相比，在中年組 (構面 a) 的貸款申請訓練資料集中觀察接受次數 (正值結果)，比不同資格的模型預測要多。這可能表示貸款核准方式存在有利於中年族群的潛在偏差。

條件式接受差異的公式：

DCAcc = c_a - c_d

其中：

c_a = n_a⁽¹⁾/ n'_a⁽¹⁾ 是構面 a 的值 1 (接受) 的觀察正值結果數目，與構面 a 的預測的正結果 (接受) 數目比率。
c_d = n_d⁽¹⁾/ n'_d⁽¹⁾ 是構面 d 值 1 (接受) 觀察正值結果數目，與構面 d 的預測正結果 (接受) 的預測數目比率。

DCAcc 指標可以擷取正值和負偏差，這些偏差可根據資格揭露偏好的待遇。考慮以下不同年齡的貸款接受偏差情況。

範例 1：正偏差

假設我們的資料集有 100 個中年人 (構面 a) 和來自其他年齡組的 50 人 (構面 d) 申請貸款，其中模型建議構面 a 有 60 和構面 d 有 30 給予貸款。因此，相對於 DPPL 指標，預測比例是無偏差，但觀察標籤顯示構面 a 有 70 和構面 d 有 20 獲得了貸款。換句話說，比訓練資料建議的 (70/60 = 1.17) 觀察標籤，模型允許中年構面多 17% 的貸款，並且比觀察標籤建議的 (20/30 = 0.67)，允許其他年齡組多 33% 的貸款。DCAcc 值的計算提供以下內容：

DCAcc = 70/60 - 20/30 = 1/2

正值表示對中年構面 a 有潛在偏差，與其他構面 d 相比，接受率低於觀察資料 (視為無偏差)。

範例 2：負偏差

假設我們的資料集有 100 個中年人 (構面 a) 和來自其他年齡組的 50 人 (構面 d) 申請貸款，其中模型建議構面 a 有 60 和構面 d 有 30 給予貸款。因此，相對於 DPPL 指標，預測比例是無偏差，但觀察標籤顯示構面從面 a 有 50 而構面 d 有 40 獲得了貸款。換句話說，比訓練資料建議的 (50/60 = 0.83) 觀察標籤，模型允許中年構面多 17% 的貸款，並且比觀察標籤建議的 (40/30 = 1.33)，允許其他年齡組多 33% 的貸款。DCAcc 值的計算提供以下內容：

DCAcc = 50/60 - 40/30 = -1/2

負值顯示與中年構面 a 相比，觀察資料 (視為無偏差) 顯示構面 d 具有較低接受率的潛在偏差。

請注意，您可以使用 DCAcc 來協助您偵測潛在的 (非刻意) 偏差，方法是以人力介入設定監督模型預測。例如，假設模型的預測 y' 是無偏差，但最終決定是由一個人 (可能使用其他功能) 做出的，他們可以改變模型預測以生成 y' 的新版本和最終版本。人類的額外處理可能會無意中拒絕一個構面不成比例數字的貸款。DCAcc 可協助偵測此類潛在的偏差。

二進位、多類別構面和連續性標籤的條件式接受差異值範圍是 (-∞, +∞)。

當與構面 a 的預測接受次數相比，觀察接受次數比率高於構面 d 的相同比率時，會出現正值。這些值顯示對構面 a 的合格申請人可能存在偏差。比率的差異越大，偏差越明顯越極端。
當構面 a 的預測接受數目與構面 d 的預測接受數目相似時，會出現接近零的值。這些值顯示預測的接受率與標籤資料中的觀察值一致，並且兩個構面的合格申請人都以類似的方式被接受。
當觀察接受次數與構面 a 的預測接受次數小於構面 d 的比率時，會出現負值。這些值顯示對構面 d 的合格申請人可能存在偏差。比率的差異值越負，明顯的偏差就越極端。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

差別影響 (DI)

條件式拒絕的差異 (DCR)