本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
有条件录取的差异 (DCAcc)
该指标将观测标签与模型预测标签进行比较,并评估各分面的预测阳性结果是否相同。该指标接近于模仿人类的偏差,因为它量化了与训练数据集中观测的结果(标签 y)相比,模型对某个分面预测的阳性结果(标签 y')多了多少。例如,如果与包含其他年龄组的分面(分面 d)相比,在训练数据集中观测的中年组(分面 a)贷款申请的接受率(阳性结果)高于基于资格条件的模型预测值,则可能表明贷款批准方式上存在有利于中年组的潜在偏差。
有条件接受差异的公式:
DCAcc= c a-c d
其中:
-
ca = na(1)/ n'a(1) 是分面 a 中值为 1(接受)的观测阳性结果数与分面 a 的预测阳性结果(接受)数之比。
-
cd = nd(1)/ n'd(1) 是分面 d 中值为 1(接受)的观测阳性结果数与分面 d 的预测阳性结果(接受)数之比。
该DCAcc指标可以捕捉正面和负面的偏见,这些偏见揭示了基于资格的优惠待遇。请考虑以下在贷款接受方面存在基于年龄的偏差的示例。
示例 1:正偏差
假设我们的数据集有 100 名中年人(分面 a)和 50 名来自其他年龄组的人(分面 d)申请贷款,其中模型建议向分面 a 中的 60 人和分面 d 中的 30 人发放贷款。因此,预测的比例相对于该DPPL指标是没有偏见的,但是观察到的标签显示,来自分面a的70%和来自分面 d 的20%获得了贷款。换句话说,该模型向中年组分面发放贷款的人数比训练数据中建议的观测标签少 17% (70/60 = 1.17),向其他年龄组发放贷款的人数比建议的观测标签多 33% (20/30 = 0.67)。该DCAcc值的计算结果如下:
DCAcc= 70/60-20/30 = 1/2
正值表示存在对中年组分面 a 的潜在偏差,与另一分面 d 相比,接受率低于观测数据(视为无偏差)所指示的值。
示例 2:负偏差
假设我们的数据集有 100 名中年人(分面 a)和 50 名来自其他年龄组的人(分面 d)申请贷款,其中模型建议向分面 a 中的 60 人和分面 d 中的 30 人发放贷款。因此,预测的比例相对于该DPPL指标是没有偏见的,但是观察到的标签显示,来自分面 a 的50%和分面 d 的40%获得了贷款。换句话说,该模型向中年组分面发放贷款的人数比训练数据中建议的观测标签少 17% (50/60 = 0.83),向其他年龄组发放贷款的人数比建议的观测标签多 33% (40/30 = 1.33)。该DCAcc值的计算结果如下:
DCAcc= 50/60-40/30 = -1/2
负值表示存在不利于分面 d 的潜在偏差,与中年组分面 a 相比,接受率低于观测数据(视为无偏差)所指示的值。
请注意,您可以使用DCAcc来帮助您检测人类在环境中监督模型预测的潜在(非故意的)偏差。 human-in-the-loop例如,假设模型的预测 y' 无偏差,但最终决策由人类做出(可能还可以访问其他特征),该人可以修改模型预测以生成新的最终版 y'。人工额外处理可能会无意中拒绝向过多来自某一分面的人发放贷款。DCAcc可以帮助发现此类潜在的偏见。
二进制、多类别分面和连续标签的有条件接受差异的值范围为 (-∞, +∞)。
-
当分面 a 的观测接受次数与预测接受次数之比高于分面 d 的这一比率时,就会出现正值。这些值表示可能存在不利于分面 a 中合格申请人的偏差。比率的差异越大,表观偏差就越严重。
-
当分面 a 的观测接受次数与预测接受次数之比类似于分面 d 的这一比率时,就会出现接近零的值。这些值表示预测的接受率与标签数据中的观测值一致,并且两个分面的合格申请人被接受的情况相似。
-
当分面 a 的观测接受次数与预测接受次数之比低于分面 d 的这一比率时,就会出现负值。这些值表示可能存在不利于分面 d 中合格申请人的偏差。比率的差异越负,表观偏差就越严重。