訓練後資料和模型偏差指標 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練後資料和模型偏差指標

Amazon SageMaker Clarify 提供十一個訓練後資料和模型偏差指標,以協助量化各種公平的概念。這些概念無法全部同時滿足,並且選擇取決於涉及分析潛在偏差情況下的具體情況。這些指標中的大多數都是從不同人口統計組的二進位分類混淆矩陣中,獲得的數字的組合。由於公平性和偏差可以透過廣泛的指標來定義,因此需要人為判斷來了解和選擇與個別使用案例相關的指標,客戶應諮詢適當的利害關係人,以確定申請使用適當的公平性量值。

我們使用下面的符號來討論偏差指標。描述的概念性模型用於二進位分類,其中事件被標籤為在其範例空間中只有兩個可能的結果,稱為正 (值為 1) 和負 (值為 0)。該框架通常可以直接擴展到多類別分類,或者在需要時涉及連續性有價值結果的案例。在二進位分類案例中,正值和負值標籤會指派給原始資料集中記錄的結果,以及有利構面 a 和不利構面 d。這些標籤 y 稱為觀察標籤,用來區分它們與機器學習模型在機器學習 (ML) 生命週期的訓練或推論階段期間指派的預測標籤 y'。這些標籤用於定義機率分布 Pa(y) 和 Pd(y) 為其各自的構面結果。

  • 標籤:

    • y 代表訓練資料集中事件結果的 n 個觀察標籤。

    • y' 代表經過訓練的模型在資料集中 n 個觀察標籤的預測標籤。

  • 成果:

    • 樣本的正值結果 (值為 1),例如申請接受。

      • n(1) 是正結果 (接受) 的觀察標籤數目。

      • n'(1) 是正結 果(接受) 的預測標籤數目。

    • 樣本的負值結果 (值為 0),例如申請拒絕。

      • n(0) 是負結果 (接受) 的觀察標籤數目。

      • n'(0) 是負結果 (接受) 的預測標籤數目。

  • 構面值:

    • 構面 a – 定義對偏差有利人口統計特徵值。

      • na 是有利構面值的觀察標籤數目:na = na(1) + na(0) 構面 a 值的正值和負值觀察標籤總和。

      • n'a 是有利構面值的預測標籤數目:n'a = n'a(1) + n'a(0) 構面 a 值的正值和負值預測標籤總和。請注意,n'a = na

    • 構面 d — 定義對偏差不利人口統計特徵值。

      • nd 是不利構面值的觀察標籤數目:nd = nd(1) + nd(0) 構面 d 值的正值和負值觀察標籤總和。

      • n'd 是不利構面值的預測標籤數目:n'd = n'd(1) + n'd(0) 構面 a 值的正值和負值預測標籤總和。請注意,n'd = nd

  • 標籤構面資料結果的結果機率分布:

    • Pa(y) 是構面 a 的觀察標籤機率分布。對於二進位標籤的資料,此分布由標籤為總數正結果的構面 a 中的樣本數目比率,Pa(y1) = na(1)/ na,以及總數負結果的樣本數比率,Pa(y0) = na(0)/ na

    • Pd(y) 是構面 d 的觀察標籤機率分布。對於二進位標籤的資料,此分布由標籤為總數正結果的構面 d 中的樣本數目比率,Pd(y1) = nd(1)/ nd,以及總數負結果的樣本數比率,Pd(y0) = nd(0)/ nd

下表包含快速指引的備忘單,以及訓練後偏差指標的連結。

訓練後偏差指標

訓練後偏差指標 描述 範例問題 解譯指標值
預測標籤中正比例的差異 (DPPL) 測量有利構面 a 和不利構面 d 之間的正預測比例差異。

在可能出現偏差的預測正值結果中,人口統計組是否存在不平衡?

標準化二進位和多類別構面標籤的範圍:[-1,+1]

連續性標籤的範圍:(-∞, +∞)

解釋:

  • 正值顯示有利構面 a 具有較高的預測正值結果比例。

  • 接近零的值顯示構面之間預測正值結果的比例更相等。

  • 負值顯示不利構面 d 具有較高的預測正值結果比例。

差別影響 (DI) 測量有利構面 a 和不利構面 d 的預測標籤比例。 在可能出現偏差的預測正值結果中,人口統計組是否存在不平衡?

標準化二進位、多類別構面和連續性標籤的範圍:[0,∞)

解釋:

  • 小於 1 的值顯示有利構面 a 具有較高的預測正值結果比例。

  • 值 1 顯示我們具有人口統計平等性。

  • 大於 1 的值顯示不利構面 d 具有較高的預測正值結果比例。

預測標籤中的條件人口統計差異 (CDDPL) 測量整體構面之間的預測標籤差異,也可以按子組進行測量。 有些人口統計組別的貸款申請結果被拒絕比例是否比其接受比例更大?

二進位、多類別和連續結果CDDPL的值範圍: [-1, +1]

  • 正值顯示構面 d 被拒絕超過接受的結果。

  • 接近零顯示平均沒有人口統計差異。

  • 負值顯示構面 a 被拒絕超過接受的結果。

反事實翻轉測試 (FT) 檢查構面 d 的每個項目,並評估構面 a 的類似項目是否具有差別模型預測。 一組特定年齡的人口統計是否與不同年齡組別的所有特徵密切相符,但平均支付的費用卻更高? 二進位和多類別構面標籤的範圍為[-1, +1]
  • 當對於不利構面 d 的不利反事實最輕拍決定的數目超過有利數目出現正值。

  • 當不利和有利的反事實翻轉測試決定平衡出數量時,會出現接近零的值。

  • 當不利構面 d 的不利反事實最輕的決定數目小於有利時候,會發生負值。

準確度差異 (AD) 測量有利和不有利構面的預測準確度之間的差異。 該模型是否準確地預測所有人口統計群組的申請的標籤? 二進位和多類別構面標籤的範圍為[-1, +1]
  • 正值顯示構面 d 在某些偽陽性 (第一型錯誤) 或偽陰性 (第二型錯誤) 的組合中受到更多影響。這表示對不利構面 d 存在潛在的偏差。

  • 當構面 a 的預測精確度與構面 d 的預測準確度相似時,會出現接近零的值。

  • 負值顯示構面 a 受某些偽陽性 (第一型錯誤) 或偽陰性 (第二型錯誤) 的組合的影響更大。這表示對有利構面 a 具有偏差。

召回差異 (RD) 比較有利和不有利構面的模型重新召回。 貸款是否由於相比於一個年齡組別的模型,另一個年齡組別的召回率較高,而存在年齡的偏差?

二進位和多類別分類的範圍:[-1, +1]

  • 正值表示模型會為構面 a 尋找更多的真陽性,並且偏向於不利構面 d

  • 接近零的值表示模型在兩個構面中尋找大約相同數目的真陽性,且沒有偏差。

  • 負值表示模型會為構面 d 尋找更多的真陽性,並且偏向於有利構面 a

條件接受的差異 (DCAcc) 比較觀察標籤與模型預測標籤。評估預測正值結果 (接受) 的各個構面是否相同。 將比較一個年齡組別與另一個年齡組別時,接受貸款的頻率是否比預期的要低 (根據資格)?

二進位、多類別構面和連續性標籤的範圍:(-∞, +∞)。

  • 正值顯示,對不利構面 d 的合格申請人可能有偏差。

  • 接近零的值顯示來自兩個構面的合格申請人都以類似的方式被接受。

  • 負值顯示對有利構面 a 合格申請人的可能偏差。

接受率的差異 (DAR) 衡量觀察正值結果 (TP) 與預測正值 (TP + FP) 的有利和不利構面之間比率的差異。 在預測所有年齡段的合格申請人貸款接受時,該模型是否具有相同的精確度? 二進位、多類別構面和連續性標籤的範圍為[-1, +1]
  • 正值顯示由於在不利構面 d 中出現相對較多偽陽性所導致的構面 d 可能偏差。

  • 接近零的值顯示正值結果 (接受) 的觀測標籤會以相等的精確度預測模型。

  • 負值顯示由於有利構面 a 中發生相對較多偽陽性所導致的構面 a 可能偏差。

特異性差異 (SD) 比較有利構面和不有利構面之間模型的特異性。 貸款是否因為該模型預測一個年齡組與另一個年齡組相比具有更高的特異性,而存在年齡的偏差?

二進位和多類別分類的範圍:[-1, +1]

  • 正值表示模型會針對構面 d 找到較少的偽陽性,並且偏向於不利構面 d

  • 接近零的值表示模型在兩個構面都找到類似數目的偽陽性,且沒有偏差。

  • 負值表示模型為構面 a 找到較少的偽陽性,並且偏向於有利構面 a

條件拒絕的差異 (DCR) 比較觀察標籤與模型預測標籤,並評估負值結果 (拒絕) 的各個構面是否相同。 根據資格條件,與另一個年齡組別相比,一個年齡組別的貸款申請的拒絕次數是否多於或少於預期數目? 二進位、多類別構面和連續性標籤的範圍:(-∞, +∞)。
  • 正值顯示,對不利構面 d 的合格申請人可能有偏差。

  • 接近零的值顯示兩個構面的合格申請人都以類似的方式被拒絕。

  • 負值顯示對有利構面 a 合格申請人的可能偏差。

拒絕率的差異 (DRR) 測量觀察負值結果 (TN) 與預測負值 (TN + FN) 在不利和有利構面之間的比率的差異。 在預測所有年齡層的不合格申請人其貸款拒絕時,該模型是否具有相同的精確度? 二進位、多類別構面和連續性標籤的範圍為[-1, +1]
  • 正值顯示有利構面 a 中發生相對較多的偽陽性所造成的可能偏差。

  • 接近零的值顯示兩個構面都以相同的精確度預測負值結果 (拒絕)。

  • 負值顯示在不利構面 d 中發生相對較多的偽陰性所造成的可能偏差。

處理方式平等 (TE) 測量有利和不利構面之間偽陽性與偽陰性比率的差異。 在貸款申請中,所有年齡的人口統計學中偽陽性與偽陰性的相對比率是否相同? 二進位和多類別構面標籤的範圍:(-∞, +∞)。
  • 當構面 a 的偽陽性與偽陽性的比率大於構面 d 的偽陽性值時,會出現正值。

  • 當構面 a 的偽陽性與偽陰性的比率與構面 d 的比率相似時,會出現接近零的值。

  • 當構面 a 的偽陽性與偽陰性的比率小於構面 d 時,會發生負值。

廣義熵 (GE) 測量模型預測b指派給每個輸入優點的不平等性。 在兩種貸款申請分類的候選模式中,其中一種模式是否會導致期望結果的分布比另一種更不均勻? 二進位和多類別標籤的範圍:(0, 0.5)。當模型僅預測偽陰性時,GE 為未定義。
  • 當所有預測都正確或所有預測都是偽陽性時,就會出現零值。

  • 正值顯示優點不平等;0.5 對應到最大不等式。

有關訓練後偏差指標的其他資訊,請參閱機器學習在金融領域的一系列公平量值