대우 평등(TE)

대우 평등(TE)은 패싯 a와 패싯 d 사이에서 나타나는 거짓 부정 대 거짓 긍정 비율의 차이입니다. 이 지표의 핵심 개념은 여러 그룹 간의 정확도가 동일하더라도 오류 발생 시 다른 그룹에 비해 특정 그룹에 더 많은 피해가 발생하는지 여부를 평가하는 것입니다. 오류율은 거짓 긍정과 거짓 부정의 합계를 통해 계산되지만, 두 종류의 오류를 자세히 살펴보면 패싯에 따라 매우 다른 양상이 나타날 수 있습니다. TE는 여러 패싯에서 오류가 유사한 방식으로 보정되는지 아니면 다른 방식으로 보정되는지를 측정합니다.

대우 평등을 구하는 공식:

TE = FN_d/FP_d - FN_a/FP_a

위치:

FN_d은 패싯 d에 대해 예측된 거짓 부정입니다.
FP_d는 패싯 d에 대해 예측된 거짓 긍정입니다.
FN_a은 패싯 a에 대해 예측된 거짓 부정입니다.
FP_a는 패싯 a에 대해 예측된 거짓 긍정입니다.

참고로 FP_a 또는 FP_d가 0이면 지표에 제한이 없습니다.

예를 들어, 패싯 a에는 100명의 대출 신청자가 있고 패싯 d에는 50명의 대출 신청자가 있다고 가정해 보겠습니다. 패싯 a에서는 8건의 대출이 잘못 거부되었고(FN_a), 다른 6건은 잘못 승인되었습니다(FP_a). 나머지 예측은 참이었으므로, TP_a + TN_a = 86이 됩니다. 패싯 d에서는 5건의 대출이 잘못 거부되었고(FN_d), 2건은 잘못 승인되었습니다(FP_d). 나머지 예측은 참이었으므로, TP_d + TN_d = 43이 됩니다. 거짓 부정 대 거짓 긍정의 비율은 패싯 a의 경우 8/6 = 1.33이고 패싯 d의 경우 5/2 = 2.5입니다. 따라서 두 패싯의 정확도가 같더라도 TE = 2.5 - 1.33 = 1.167이 됩니다.

ACC_a = (86)/(86+ 8 + 6) = 0.86

ACC_d = (43)/(43 + 5 + 2) = 0.86

바이너리 및 멀티카테고리 패싯 레이블에 대한 조건부 거부 건수 차이의 값 범위는 (-∞, +∞)입니다. 연속형 레이블에 대해서는 TE 지표가 정의되지 않습니다. 이 지표의 해석은 거짓 긍정(제1종 오류)과 거짓 부정(제2종 오류) 사례의 상대적 중요도에 따라 달라집니다.

양수 값은 패싯 d에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 a에서의 비율보다 클 때 얻어집니다.
0에 가까운 값은 패싯 a에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 d에서의 비율과 비슷한 수준일 때 얻어집니다.
음수 값은 패싯 d에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 a에서의 비율보다 작을 때 얻어집니다.

참고

이전 버전에서는 대우 평등 지표가 FN_d / FP_d - FN_a / FP_a가 아닌 FP_a / FN_a - FP_d / FN_d으로서 계산된다고 나와 있습니다. 두 버전 모두 사용이 가능합니다. 자세한 내용은 Fairness measures for Machine Learning in Finance 단원을 참조하십시오.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

정확도 차이(AD)

예측 레이블의 조건부 인구통계학적 차이(CDDPL)