本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
處理方式平等 (TE)
處理方式平等 (TE) 是構面 a 和 d 間的偽陰性與偽陽性比率差異。這個指標的主要目的是評估,即使群組之間的準確性相同,錯誤對一個群組的危害是否比另一個群組高? 錯誤率來自偽陽性和偽陽性的總數,但總數的明細在構面間可能會有很大的不同。TE 測量錯誤是否以相似或不同的方式補償構面。
處理方式平等的公式:
TE = FNd/FPd - FNa/FPa
其中:
-
FNd 是構面 d 預測的偽陰性。
-
FPd 是構面 d 預測的偽陽性。
-
FNa 是構面 a 預測的偽陰性。
-
FPa 是構面 a 預測的偽陽性。
請注意,如果 FP a 或 FP d 為零,則指標將變為無界。
例如,假設有構面 a 的 100 位貸款申請人和構面 d 的 50 位貸款申請人。對於構面 a,8 為被錯誤拒絕了貸款 (FNa),另外 6 位被錯誤核准 (FPa)。其餘的預測是真實的,所以 TPa + TNa = 86。對於構面 d,5 位被錯誤拒絕 (FNd),2 位被錯誤核准 (FPd)。其餘的預測是真實的,所以 TPd + TNd = 43。針對 構面 a,偽陰性與偽陽性的比率等於 8/6 = 1.33,而構面 d 則為 5/2 = 2.5。因此 TE = 2.5 - 1.33 = 1.167,即使兩個構面具有相同的精確度:
ACCa = (86)/(86+ 8 + 6) = 0.86
ACCd = (43)/(43 + 5 + 2) = 0.86
二進位和多類別構面標籤的條件式拒絕差異值範圍為 (-∞, +∞)。TE 指標未定義為連續性標籤。此指標的解釋取決於偽陽性 (第一型誤差) 和偽陰性 (第二型誤差) 的相對重要性。
-
當構面 d 的偽陰性與偽陽性比率大於構面 a 時,會出現正值。
-
當構面 a 的偽陰性與偽陽性比率與構面 d 的比率相似時,會出現接近零的值。
-
當構面 d 的偽陰性與偽陽性的比率小於構面 a 時,會發生負值。
注意
先前版本列出的處理方式相等指標計算方式為 FPa / FNa - FPd / FNd 而不是 FNd / FPd - FNa / FPa。雖然任何一個版本都可以使用。如需詳細資訊,請參閱Fairness measures for Machine Learning in
Finance