不對稱沙普利值 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

不對稱沙普利值

SageMaker 澄清時間序列預測模型說明解決方案是一種植根於合作博弈論的功能歸因方法,類似於精神SHAP。具體來說,Cleven 在機器學習和可解釋性中使用隨機順序組值,也稱為不對稱的 Shapley 值

背景介紹

目標是計算輸入圖徵給定預測模型 f 的屬性。預測模型採用下列輸入:

  • 過去的時間序列(目標 TS)例如,這可能是通過巴黎-柏林路線的每日火車乘客,用 x 表示。t

  • (選擇性) 共變時間序列。例如,這可能是慶祝活動和天氣數據,由 z R S 表示t使用時,共變 TS 僅可用於過去的時間步長,也可用於 future 的時間步長(包括在節日日曆中)。

  • (可選)靜態協變量,例如服務質量(如第一或第二類),由 u R E 表示。

視特定應用程式案例而定,可省略靜態協變數、動態協變數或兩者。給定預測水平線 K ≥0(例如 K = 30 天),模型預測可以通過以下公式來表徵:f(x[1:T],z[1:T+K],u)= x。[T+1:T +K+1]

下圖顯示典型預測模型的相依性結構。時間 t+1 的預測取決於前面提到的三種類型的輸入。

典型預測模型的相依性結構。

方法

透過在原始輸入所衍生的一系列點上查詢時間序列模型 f 來計算解釋。在遊戲理論結構之後,澄清由迭代方式混淆輸入部分(即設置為基準值)導致的預測中的平均差異。時間結構可以按時間順序或反時間順序進行導航,或兩者兼而有之。按時間順序排列的說明是以反覆方式新增第一個時間步驟的資訊,同時從最後一個步驟反向時間順序建立。在存在時近偏差的情況下,後一種模式可能更合適,例如在預測股票價格時。計算解釋的一個重要屬性是,如果模型提供確定性輸出,它們總和為原始模型輸出。

產生的屬性

產生的屬性是在每個預測時間步長標記特定時間步長或輸入特徵對最終預測的個別貢獻的評分。澄清提供了以下兩個粒度的解釋:

  • Timewise 的解釋價格低廉,並且僅提供有關特定時間步長的信息,例如過去 19 天的信息對 future 第一天的預測有多大貢獻。這些屬性不能單獨解釋靜態協變量以及目標和協變時間序列的彙總解釋。該屬性是一個矩陣 A,其中每個 A tk 是時間步長 t 對時間步長 T+ k 的預測歸因。請注意,如果模型接受 future 的協變數,t 可以大於 T。

  • 細粒度的解釋會更加密集運算,並提供輸入變數所有屬性的完整劃分。

    注意

    細粒度的解釋僅支持按時間順序排列。

    產生的屬性是由以下內容組成的三元組:

    • 矩陣 A x R T×K 與輸入時間序列有關,其中 A tk x 是 x t 對預測步驟 T+k 的歸因

    • 張量 A z R T +K×S×K 與共變時間序列有關,其中 A tsk z 是 z ts​(即 sth 共變量 TS)對預測步驟 T+k 的歸因

    • 矩陣 A u R E×K 與靜態協變量有關,其中 A ek u 是 ue(eth 靜態共變量)朝向預測步驟 T+k 的歸因

無論粒度如何,解釋還包含一個偏移向量 B R K,代表模型在所有數據被混淆時的「基本行為」。