As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Valores assimétricos de Shapley
A solução de explicação do modelo de previsão de séries temporais SageMaker Clarify é um método de atribuição de recursos baseado na teoria dos jogos cooperativos
Contexto
O objetivo é calcular as atribuições dos recursos de entrada de um determinado modelo de previsão f. O modelo de previsão usa as seguintes entradas:
Séries temporais passadas (alvo TS). Por exemplo, isso pode ser o passado diário de passageiros de trem na rota Paris-Berlim, indicada por x. t
(Opcional) Uma série temporal covariável. Por exemplo, podem ser festividades e dados meteorológicos, indicados por z ∈ R S. t Quando usada, a covariável TS pode estar disponível apenas para as etapas passadas ou também para as futuras (incluídas no calendário festivo).
(Opcional) Covariáveis estáticas, como qualidade de serviço (como 1ª ou 2ª classe), indicadas por u ∈ R E.
Covariáveis estáticas, covariáveis dinâmicas ou ambas podem ser omitidas, dependendo do cenário de aplicação específico. Dado um horizonte de predição K ≥ 0 (por exemplo, K = 30 dias), a previsão do modelo pode ser caracterizada pela fórmula: f (x[1:T], z[1:T+K], u) = x. [T+1:T +K+1]
O diagrama a seguir mostra uma estrutura de dependência para um modelo de previsão típico. A previsão no tempo t+1 depende dos três tipos de entradas mencionados anteriormente.
Método
As explicações são calculadas consultando o modelo de série temporal f em uma série de pontos derivados da entrada original. Seguindo as construções teóricas dos jogos, o Clarify calcula a média das diferenças nas previsões conduzidas pela ofuscação (ou seja, pela definição de um valor básico) de partes das entradas de forma iterativa. A estrutura temporal pode ser navegada em ordem cronológica ou anticronológica, ou ambas. As explicações cronológicas são construídas adicionando informações iterativamente da primeira etapa de tempo, enquanto anticronológicas a partir da última etapa. O último modo pode ser mais apropriado na presença de viés de recência, como na previsão dos preços das ações. Uma propriedade importante das explicações computadas é que elas somam a saída do modelo original se o modelo fornecer saídas determinísticas.
Atribuições resultantes
As atribuições resultantes são pontuações que marcam contribuições individuais de intervalos de tempo específicos ou recursos de entrada para a previsão final em cada intervalo de tempo previsto. O Clarify oferece as duas granularidades a seguir para explicações:
As explicações temporais são baratas e fornecem informações apenas sobre intervalos de tempo específicos, como o quanto as informações do 19º dia no passado contribuíram para a previsão do 1º dia no futuro. Essas atribuições não explicam as covariáveis estáticas individualmente e as explicações agregadas das séries temporais alvo e covariável. As atribuições são uma matriz A em que cada A tk é a atribuição da etapa de tempo t para a previsão da etapa de tempo T+k. Observe que, se o modelo aceitar covariáveis futuras, t pode ser maior que T.
Explicações refinadas são mais intensivas em termos computacionais e fornecem uma análise completa de todas as atribuições das variáveis de entrada.
nota
Explicações refinadas suportam apenas a ordem cronológica.
As atribuições resultantes são um trio composto pelo seguinte:
Matriz A x ∈ R T×K relacionada à série temporal de entrada, onde A tkx é a atribuição de x à etapa de previsão T+k t
Tensor A z ∈ R T+K×S×K relacionado à série temporal da covariável, onde A z é a atribuição de tskz (ou seja, a sétima covariável TS) para a etapa de previsão T+k ts
Matriz A u ∈ R E×K relacionada às covariáveis estáticas, onde A eku é a atribuição de u e (a covariável estática eth) para a etapa de previsão T+k
Independentemente da granularidade, a explicação também contém um vetor de deslocamento B ∈ R K que representa o “comportamento básico” do modelo quando todos os dados são ofuscados.