非對稱 Shapley 值 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

非對稱 Shapley 值

SageMaker Clarify 時間序列預測模型解釋解決方案是植根於合作遊戲理論 的特徵屬性方法,其精神與 相似SHAP。具體而言,Clarify 在機器學習和可解釋性中使用隨機順序群組值 ,也稱為非對稱 Shapley 值

背景介紹

目標是計算特定預測模型 f 的輸入特徵屬性。預測模型採用下列輸入:

  • 過去時間序列 (目標 TS)。例如,這可能是巴黎柏林航線中超過每日火車乘客,以 x t表示。

  • (選用) 共變數時間序列。例如,這可能是節日和天氣資料,以 zt �� RS 表示。使用 時,共變數 TS 只能用於過去的步驟,也可以用於未來的步驟 (包含在節日行事曆中)。

  • (選用) 靜態共變數,例如服務品質 (例如第 1 或第 2 類),以 u �� RE 表示。

根據特定應用程式案例,可以省略靜態共變數、動態共變數或兩者。假設預測時間範圍 K ≥ 0 (例如 K=30 天),則模型預測的特徵可以是公式:f(x [1:T], z [1:T+K], u) = x [T+1:T +K+1]

下圖顯示典型預測模型的相依性結構。時間 t+1 的預測取決於先前提到的三種輸入類型。

典型預測模型的相依性結構。

方法

透過在原始輸入衍生的一系列點上查詢時間序列模型 f 來計算解釋。在遊戲理論建構之後,Clarify 會反覆模糊輸入 (即設定為基準值) 部分,以平均方式呈現預測差異。時間結構可以按時間順序或反時間順序或兩者進行導覽。透過反覆新增第一個步驟的資訊,以及最後一個步驟的反時間性來建立時間解釋。後者模式在出現延遲偏差時可能更合適,例如預測股票價格時。計算解釋的一個重要屬性是,如果模型提供決定性輸出,它們會加總到原始模型輸出。

產生的屬性

產生的屬性是將特定時間步驟的個別貢獻或輸入特徵標記在每個預測時間步驟的最終預測的分數。Clarify 提供下列兩個精細度進行說明:

  • 適時說明費用低廉,僅提供有關特定時間步驟的資訊,例如過去第 19 天的資訊對預測未來第 1 天有何貢獻。這些屬性不會個別解釋目標和共變數時間序列的靜態共變數和彙總說明。屬性是矩陣 A,其中每個 A tk都是時間步驟 t 對時間步驟 T+k 預測的屬性。請注意,如果模型接受未來的共變數,t 可以大於 T

  • 精細說明比較密集運算,並提供輸入變數所有屬性的完整明細。

    注意

    精細說明僅支援時間順序。

    產生的屬性是由下列項目組成的三元屬性:

    • 與輸入時間序列相關的矩陣 Ax �� RT×K,其中 A tkxxt 對預測步驟 T+k 的屬性

    • 與共變數時間序列相關的 Tensor Az �� RT+K×S×K,其中 A tskzzts​ (即 sth 共變數 TS) 的屬性,以預測步驟 T+k

    • 與靜態共變數相關的 Matrix Au �� RE×K,其中 A ekuue (eth 靜態共變數) 對預測步驟 T+k 的屬性

無論其細微性為何,解釋也包含偏移向量 B ∈ RK,當所有資料混淆時,代表模型的「基本行為」。