Valores assimétricos de Shapley - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Valores assimétricos de Shapley

A solução de explicação do modelo de previsão de séries temporais SageMaker Clarify é um método de atribuição de recursos baseado na teoria dos jogos cooperativos, semelhante em espírito a. SHAP Especificamente, o Clarify usa valores de grupos de ordem aleatória, também conhecidos como valores de Shapley assimétricos em aprendizado de máquina e explicabilidade.

Contexto

O objetivo é calcular as atribuições dos recursos de entrada de um determinado modelo de previsão f. O modelo de previsão usa as seguintes entradas:

  • Séries temporais passadas (alvo TS). Por exemplo, isso pode ser o passado diário de passageiros de trem na rota Paris-Berlim, indicada por x. t

  • (Opcional) Uma série temporal covariável. Por exemplo, podem ser festividades e dados meteorológicos, indicados por z ∈ R S. t Quando usada, a covariável TS pode estar disponível apenas para as etapas passadas ou também para as futuras (incluídas no calendário festivo).

  • (Opcional) Covariáveis estáticas, como qualidade de serviço (como 1ª ou 2ª classe), indicadas por u ∈ R E.

Covariáveis estáticas, covariáveis dinâmicas ou ambas podem ser omitidas, dependendo do cenário de aplicação específico. Dado um horizonte de predição K ≥ 0 (por exemplo, K = 30 dias), a previsão do modelo pode ser caracterizada pela fórmula: f (x[1:T], z[1:T+K], u) = x. [T+1:T +K+1]

O diagrama a seguir mostra uma estrutura de dependência para um modelo de previsão típico. A previsão no tempo t+1 depende dos três tipos de entradas mencionados anteriormente.

Estrutura de dependência para um modelo de previsão típico.

Método

As explicações são calculadas consultando o modelo de série temporal f em uma série de pontos derivados da entrada original. Seguindo as construções teóricas dos jogos, o Clarify calcula a média das diferenças nas previsões conduzidas pela ofuscação (ou seja, pela definição de um valor básico) de partes das entradas de forma iterativa. A estrutura temporal pode ser navegada em ordem cronológica ou anticronológica, ou ambas. As explicações cronológicas são construídas adicionando informações iterativamente da primeira etapa de tempo, enquanto anticronológicas a partir da última etapa. O último modo pode ser mais apropriado na presença de viés de recência, como na previsão dos preços das ações. Uma propriedade importante das explicações computadas é que elas somam a saída do modelo original se o modelo fornecer saídas determinísticas.

Atribuições resultantes

As atribuições resultantes são pontuações que marcam contribuições individuais de intervalos de tempo específicos ou recursos de entrada para a previsão final em cada intervalo de tempo previsto. O Clarify oferece as duas granularidades a seguir para explicações:

  • As explicações temporais são baratas e fornecem informações apenas sobre intervalos de tempo específicos, como o quanto as informações do 19º dia no passado contribuíram para a previsão do 1º dia no futuro. Essas atribuições não explicam as covariáveis estáticas individualmente e as explicações agregadas das séries temporais alvo e covariável. As atribuições são uma matriz A em que cada A tk é a atribuição da etapa de tempo t para a previsão da etapa de tempo T+k. Observe que, se o modelo aceitar covariáveis futuras, t pode ser maior que T.

  • Explicações refinadas são mais intensivas em termos computacionais e fornecem uma análise completa de todas as atribuições das variáveis de entrada.

    nota

    Explicações refinadas suportam apenas a ordem cronológica.

    As atribuições resultantes são um trio composto pelo seguinte:

    • Matriz A x ∈ R T×K relacionada à série temporal de entrada, onde A tkx é a atribuição de x à etapa de previsão T+k t

    • Tensor A zR T+K×S×K relacionado à série temporal da covariável, onde A z é a atribuição de tskz (ou seja, a sétima covariável TS) para a etapa de previsão T+k ts​

    • Matriz A u ∈ R E×K relacionada às covariáveis estáticas, onde A eku é a atribuição de u e (a covariável estática eth) para a etapa de previsão T+k

Independentemente da granularidade, a explicação também contém um vetor de deslocamento B R K que representa o “comportamento básico” do modelo quando todos os dados são ofuscados.