本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker Clarify 時間序列預測模型解釋解決方案是一種特徵屬性方法,根植於合作遊戲理論
背景介紹
目標是運算特定預測模型 f 的輸入特徵屬性。預測模型採用下列輸入:
過去時間序列 (目標 TS)。例如,這可能是巴黎柏林航線中超過每日火車乘客,以 x 表示t。
(選用) 共變數時間序列。例如,這可能是節日和天氣資料,以 zt �� RS 表示。使用 時,共變數 TS 只能用於過去的步驟,也可以用於未來的步驟 (包含在節日行事曆中)。
(選用) 靜態共變數,例如 u �� RE 表示的服務品質 (例如第 1 級或第 2 級)。
根據特定應用程式案例,可以省略靜態共變數、動態共變數或兩者。假設預測時間範圍 K ≥ 0 (例如 K=30 天),模型預測的特徵可以是公式:f(x[1:T], z[1:T+K], u) = x[T+1:T +K+1]。
下圖顯示典型預測模型的相依性結構。t+1 時間的預測取決於先前提到的三種輸入類型。

方法
透過查詢原始輸入衍生的一系列點上的時間序列模型 f 來計算解釋。在遊戲理論建構之後,Clarify 會以反覆方式混淆 (即設定為基準值) 輸入部分,來平均預測的差異。時間結構可以按時間順序或反時間順序或兩者進行導覽。時間描述是透過反覆新增第一個步驟的資訊,以及最後一個步驟的反時間性來建立。後者模式在出現延遲偏差時可能更合適,例如預測股票價格時。計算解釋的一個重要屬性是,如果模型提供決定性輸出,它們會加總到原始模型輸出。
產生的屬性
產生的屬性是將特定時間步驟或輸入特徵的個別貢獻標記在每個預測時間步驟的最終預測中的分數。Clarify 提供下列兩個精細程度的說明:
適時說明費用低廉,僅提供有關特定時間步驟的資訊,例如過去第 19 天的資訊對預測未來第 1 天有何貢獻。這些屬性不會個別解釋靜態共變數,也不會彙總目標和共變數時間序列的說明。屬性是矩陣 A,其中每個 A tk都是時間步驟 t 的屬性,用於時間步驟 T+k 的預測。請注意,如果模型接受未來的共變數,t 可以大於 T。
精細解釋比較密集運算,並提供輸入變數所有屬性的完整明細。
注意
精細說明僅支援時間順序。
產生的屬性是由下列項目組成的三元組:
與輸入時間序列相關的矩陣 Ax �� RT×K,其中 tkAx 是 xt 對預測步驟 T+k 的屬性
Tensor Az �� RT+K×S×K 與共變數時間序列相關,其中 tskAz 是 zts (即 sth 共變數 TS) 對預測步驟 T+k 的屬性
與靜態共變數相關的 Matrix Au �� RE×K,其中 Aeku 是 ue (eth 靜態共變數) 對預測步驟 T+k 的屬性
無論精細程度為何,解釋也包含偏移向量 B ∈ RK,當所有資料混淆時,代表模型的「基本行為」。