接受率差异 (DAR)

接受率差异 (DAR) 指标是分面 a 和 d 的真阳性 (TP) 预测值与观测到的阳性值 (TP + FP) 之比的差值。该指标衡量了模型对这两个分面的接受率的预测精度差异。精度衡量的是模型从合格候选人库中识别出的合格候选人的比例。如果模型对合格申请人的预测精度在不同分面之间存在差异，这就是偏差，其大小由 DAR 来衡量。

分面 a 和 d 之间接受率差异的公式：

DAR = TP_a/(TP_a + FP_a) - TP_d/(TP_d + FP_d)

其中：

TP_a 是分面 a 的真阳性预测值。
FP_a 是分面 a 的假阳性预测值。
TP_d 是分面 d 的真阳性预测值。
FP_d 是分面 d 的假阳性预测值。

例如，假设该模型接受 70 名中年申请人（分面 a）申请贷款（预测阳性标签），其中只有 35 人实际被接受（观测阳性标签）。还假设该模型接受来自其他年龄人群（分面 d）的 100 名申请人申请贷款（预测阳性标签），其中只有 40 人实际被接受（观测阳性标签）。那么 DAR = 35/70 - 40/100 = 0.10，这表明存在不利于第二个年龄组（分面 d）合格人群的潜在偏差。

二进制、多类别分面和连续标签的 DAR 值范围为 [-1, +1]。

当分面 a 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比大于分面 d 的这一比率时，就会出现正值。这些值表示由于分面 d 中出现相对较多的假阳性，因此可能存在不利于不利分面 d 的偏差。比率的差异越大，表观偏差就越严重。
当分面 a 和 d 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比具有相似的值时，就会出现接近零的值，这表明模型以同样的精度预测阳性结果的观测标签。
当分面 d 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比大于分面 a 的这一比率时，就会出现负值。这些值表示由于分面 a 中出现相对较多的假阳性，因此可能存在不利于有利分面 a 的偏差。比率的差异越负，表观偏差就越严重。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

查全率差异 (RD)

拒绝率差异 (DRR)