非対称シェープリー値 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

非対称シェープリー値

SageMaker Clarify 時系列予測モデルの説明ソリューションは、協調ゲーム理論 に根差した特徴属性メソッドであり、 に似ていますSHAP。具体的には、Clarify はランダムな順序グループ値 を使用します。これは、機械学習と説明可能性における非対称シェープリー値とも呼ばれます。

背景

目標は、特定の予測モデル への入力特徴の属性を計算することです。予測モデルでは、次の入力が使用されます。

  • 過去の時系列 (ターゲット TS)。例えば、これは、x で表されるパリ-ベルリンルートの毎日列車の乗員を過ぎている可能性がありますt

  • (オプション) 共変時系列。例えば、これは zt ∈ RS で表される祝祭日と気象データです。使用する場合、共変数 TS は過去の時間ステップ、または将来のステップ (祝祭日カレンダーに含まれる) でのみ使用できます。

  • (オプション) u ∈ RE で表されるサービスの品質 (1 番目または 2 番目のクラスなど) などの静的な共変数。

静的な共分散、動的共分散、またはその両方は、特定のアプリケーションシナリオに応じて省略できます。予測期間 K ≥ 0 (K=30 日など) を考慮すると、モデル予測は式 f(x [1:T], z [1:T+K], u) = x [T+1:T +K+1]によって特徴付けられます。

次の図は、一般的な予測モデルの依存関係構造を示しています。t+1 時の予測は、前述の 3 種類の入力によって異なります。

一般的な予測モデルの依存関係構造。

[メソッド]

説明は、元の入力によって導出された一連のポイントで時系列モデル f をクエリすることによって計算されます。ゲーム理論的な構築の後、Clarify は入力の部分を難読化 (つまり、ベースライン値に を設定) することによって導かれる予測の差を平均化します。時間構造は、時系列または非時系列の順序、またはその両方でナビゲートできます。時系列の説明は、最初のステップからの情報を繰り返し追加し、最後のステップからのアンチ時系列によって構築されます。後者モードは、株価の予測時など、最近のバイアスがある場合により適している場合があります。計算された説明の重要なプロパティの 1 つは、モデルが決定論的出力を提供する場合、元のモデル出力に合計することです。

結果の属性

結果として生じる属性は、特定の時間ステップまたは入力特徴量の個々の寄与度を、各予測時間ステップの最終予測にマークするスコアです。Clarify では、次の 2 つの詳細度で説明できます。

  • 時間的説明は安価で、過去の 19 日目の情報が将来の 1 日目の予測にどの程度貢献したかなど、特定の時間ステップに関する情報のみを提供します。これらの属性は、個々の静的な共変数を説明しず、ターゲット時系列と共変数時系列の集計説明も説明しません。属性は行列 A で、各 A tkは時間ステップ T+k の予測に対する時間ステップ t の属性です。 モデルが将来の共変数を受け入れる場合、tT よりも大きくなる可能性があることに注意してください。

  • 詳細な説明は計算負荷が高く、入力変数のすべての属性の完全な内訳を提供します。

    注記

    きめ細かな説明は時系列のみをサポートします。

    結果として得られる属性は、以下で構成されるトリプレットです。

    • 入力時系列に関連する行列 Ax ∈ RT×K。A tkx は予測ステップ T+k に対する xt の属性です。

    • Tensor Az ∈ RT+K×S×K は、共分散時系列に関連しており、A tskz は予測ステップ T+k に対する zts​ (つまり、sth 共分散 TS) の属性です。

    • 静的共変数に関連するマトリックス Au ∈ RE×K。ここで、A eku は予測ステップ T+k に対する ue (eth 静的共変数) の属性です。

詳細度に関係なく、説明には、すべてのデータが難読化されたときのモデルの「基本的な動作」を表すオフセットベクトル B ∈ RK も含まれています。