기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
허용률의 차이(DAR)
수락률(DAR) 지표의 차이는 패싯 a 및 d에 대해 관찰된 양수(TP + FP)에 대한 참 양수(TP) 예측의 비율 차이입니다. 이 지표는 모델이 이 두 가지 패싯에서의 승인 건수를 예측해내는 정밀도의 차이를 측정합니다. 정밀도는 적격 후보자로 이루어진 풀에서 해당 모델에 의해 적격하다고 식별되는 후보자의 비율을 측정합니다. 적격 신청자를 예측하기 위한 모델 정밀도가 패싯 간에 분기하는 경우 편향이며 크기는에 의해 측정됩니다DAR.
패싯 a와 패싯 d 사이에서 나타나는 승인율 차이를 구하는 공식:
DAR = TPa/(TPa + FPa) - TPd/(TPd + FPd)
위치:
-
TPa는 패싯 a에 대해 예측된 참 긍정입니다.
-
FPa는 패싯 a에 대해 예측된 거짓 긍정입니다.
-
TPd는 패싯 d에 대해 예측된 참 긍정입니다.
-
FPd는 패싯 d에 대해 예측된 거짓 긍정입니다.
예를 들어, 모델이 중년층 신청자 70명(패싯 a)으로부터 대출 신청을 접수(예측된 긍정적 레이블)했는데 그 중에서 35명만 실제로 승인(관찰된 긍정적 레이블)되었다고 가정해 보겠습니다. 또한 모델이 다른 연령대의 신청자 100명(패싯 d)으로부터 대출 신청을 접수(예측된 긍정적 레이블)했는데 그 중에서 40명만 실제로 승인(관찰된 긍정적 레이블)되었다고 가정해 보겠습니다. 그런 다음 DAR = 35/70 - 40/100 = 0.10으로, 이는 두 번째 연령대(패싯 d)의 적격자에 대한 잠재적 편향을 나타냅니다.
DAR 바이너리, 다중 범주 패싯 및 연속 레이블의 값 범위는 [-1, +1]입니다.
-
양수 값은 패싯 a의 관찰된 긍정적 결과(적격 신청자)에 대한 예측된 긍정(승인)의 비율이 패싯 d에서의 동일한 비율보다 클 때 발생합니다. 이러한 값은 패싯 d에서 상대적으로 더 많은 거짓 긍정이 생성됨에 따라 불리한 패싯 d에 대한 편향이 존재할 수 있음을 나타냅니다. 해당 비율의 차이가 클수록 명백한 편향은 더욱 심해집니다.
-
패싯 a와 패싯 d에 대해 예측된 긍정적 결과(승인)와 관찰된 긍정적 결과(적격 신청자)의 상대적 비율이 비슷한 값을 가질 때 0에 가까운 값이 얻어집니다.이는 긍정적 결과에 대한 관찰된 레이블이 해당 모델에 의해 동일한 정밀도로 예측되고 있음을 나타냅니다.
-
음수 값은 패싯 d의 관찰된 긍정적 결과(적격 신청자)에 대한 예측된 긍정(승인)의 비율이 패싯 a에서의 비율보다 클 때 발생합니다. 이러한 값은 패싯 a에서 상대적으로 더 많은 거짓 긍정이 생성됨에 따라 유리한 패싯 a에 대한 편향이 존재할 수 있음을 나타냅니다. 해당 비율에서의 차이가 부정적일수록 명백한 편향은 더욱 심해집니다.