기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
대우 평등(TE)
대우 평등(TE)은 패싯 a와 패싯 d 사이에서 나타나는 거짓 부정 대 거짓 긍정 비율의 차이입니다. 이 지표의 핵심 개념은 여러 그룹 간의 정확도가 동일하더라도 오류 발생 시 다른 그룹에 비해 특정 그룹에 더 많은 피해가 발생하는지 여부를 평가하는 것입니다. 오류율은 거짓 긍정과 거짓 부정의 합계를 통해 계산되지만, 두 종류의 오류를 자세히 살펴보면 패싯에 따라 매우 다른 양상이 나타날 수 있습니다. TE는 여러 패싯에서 오류가 유사한 방식으로 보정되는지 아니면 다른 방식으로 보정되는지를 측정합니다.
대우 평등을 구하는 공식:
TE = FNd/FPd - FNa/FPa
위치:
-
FNd은 패싯 d에 대해 예측된 거짓 부정입니다.
-
FPd는 패싯 d에 대해 예측된 거짓 긍정입니다.
-
FNa은 패싯 a에 대해 예측된 거짓 부정입니다.
-
FPa는 패싯 a에 대해 예측된 거짓 긍정입니다.
참고로 FPa 또는 FPd가 0이면 지표에 제한이 없습니다.
예를 들어, 패싯 a에는 100명의 대출 신청자가 있고 패싯 d에는 50명의 대출 신청자가 있다고 가정해 보겠습니다. 패싯 a에서는 8건의 대출이 잘못 거부되었고(FNa), 다른 6건은 잘못 승인되었습니다(FPa). 나머지 예측은 참이었으므로, TPa + TNa = 86이 됩니다. 패싯 d에서는 5건의 대출이 잘못 거부되었고(FNd), 2건은 잘못 승인되었습니다(FPd). 나머지 예측은 참이었으므로, TPd + TNd = 43이 됩니다. 거짓 부정 대 거짓 긍정의 비율은 패싯 a의 경우 8/6 = 1.33이고 패싯 d의 경우 5/2 = 2.5입니다. 따라서 두 패싯의 정확도가 같더라도 TE = 2.5 - 1.33 = 1.167이 됩니다.
ACCa = (86)/(86+ 8 + 6) = 0.86
ACCd = (43)/(43 + 5 + 2) = 0.86
바이너리 및 멀티카테고리 패싯 레이블에 대한 조건부 거부 건수 차이의 값 범위는 (-∞, +∞)입니다. 연속형 레이블에 대해서는 TE 지표가 정의되지 않습니다. 이 지표의 해석은 거짓 긍정(제1종 오류)과 거짓 부정(제2종 오류) 사례의 상대적 중요도에 따라 달라집니다.
-
양수 값은 패싯 d에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 a에서의 비율보다 클 때 얻어집니다.
-
0에 가까운 값은 패싯 a에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 d에서의 비율과 비슷한 수준일 때 얻어집니다.
-
음수 값은 패싯 d에 대한 거짓 부정과 거짓 긍정의 비율이 패싯 a에서의 비율보다 작을 때 얻어집니다.
참고
이전 버전에서는 대우 평등 지표가 FNd / FPd - FNa / FPa가 아닌 FPa / FNa - FPd / FNd으로서 계산된다고 나와 있습니다. 두 버전 모두 사용이 가능합니다. 자세한 내용은 Fairness measures for Machine Learning in
Finance