Valores assimétricos de Shapley

A solução de explicação do modelo de previsão de séries temporais SageMaker Clarify é um método de atribuição de recursos baseado na teoria dos jogos cooperativos, semelhante em espírito ao SHAP. Especificamente, o Clarify usa valores de grupos de ordem aleatória, também conhecidos como valores assimétricos de Shapley em machine learning e explicabilidade.

Contexto

O objetivo é calcular as atribuições dos atributos de entrada de um determinado modelo de previsão f. O modelo de previsão recebe as seguintes entradas:

Série temporal passada (TS de destino). Por exemplo, pode ser os passageiros de trem diários do passado na rota Paris-Berlim, indicada por x_t.
(Opcional) Uma série temporal covariável. Por exemplo, podem ser festividades e dados meteorológicos, indicados por z_t ∈ R^S. Quando usada, a covariável TS pode estar disponível apenas para intervalos de tempos passados ou também para os futuros (incluídos no calendário festivo).
(Opcional) Covariáveis estáticas, como qualidade de serviço (como 1ª ou 2ª classe), indicadas por u ∈ R^E.

Covariáveis estáticas, covariáveis dinâmicas ou ambas podem ser omitidas, dependendo do cenário de aplicação específico. Dado um horizonte de predição K ≥ 0 (por exemplo, K = 30 dias), a predição de modelo pode ser caracterizada pela fórmula: f(x_[1:T], z_[1:T+K], u) = x_{[T+1:T +K+1]}.

O diagrama a seguir mostra uma estrutura de dependência para um modelo de previsão típico. A predição no tempo t+1 depende dos três tipos de entradas mencionados anteriormente.

Método

As explicações são calculadas consultando o modelo de série temporal f em uma série de pontos derivados da entrada original. Seguindo os constructos teóricas dos jogos, o Clarify calcula a média das diferenças nas predições conduzidas pela ofuscação (ou seja, pela definição de um valor básico) de partes das entradas de forma iterativa. A estrutura temporal pode ser navegada em ordem cronológica, anticronológica ou ambas. As explicações cronológicas são criadas adicionando informações iterativamente do primeiro intervalo de tempo, enquanto anticronológicas a partir do último. O último modo pode ser mais apropriado na presença de desvio de recência, como na previsão dos preços de ações. Uma propriedade importante das explicações computadas é que elas somam a saída do modelo original se o modelo fornecer saídas determinísticas.

Atribuições resultantes

As atribuições resultantes são pontuações que marcam contribuições individuais de intervalos de tempo específicos ou atributos de entrada para a previsão final em cada intervalo de tempo previsto. O Clarify oferece as duas granularidades a seguir para explicações:

As explicações temporais são econômicas e fornecem informações apenas sobre intervalos de tempo específicos, como o quanto as informações do 19º dia no passado contribuíram para a previsão do 1.º dia no futuro. Essas atribuições não explicam as covariáveis estáticas individualmente e as explicações agregadas das séries temporais covariáveis e de destino. As atribuições são uma matriz A em que cada A_tk é a atribuição do intervalo de tempo t para a previsão do intervalo de tempo T+k. Observe que, se o modelo aceitar covariáveis futuras, t pode ser maior que T.
Explicações refinadas são mais intensivas em termos computacionais e fornecem uma análise completa de todas as atribuições das variáveis de entrada.

nota
Explicações refinadas são compatíveis com apenas a ordem cronológica.

As atribuições resultantes são um trio composto pelo seguinte:
- Matriz A^x ∈ R^T×K relacionada à série temporal de entrada, em que A_tk^x é a atribuição de x_t para a previsão de T+k
- Tensor A^u ∈ R^E×K relacionado à série temporal de covariável, em que A_tsk^z é a atribuição de z_ts (ou seja, a sétima covariável TS) para a previsão de T+k
- Matriz A^u ∈ R^E×K relacionada às covariáveis estáticas, em que A_ek^u é a atribuição de u_e (a oitava covariável estática) para a previsão de T+k

Independentemente da granularidade, a explicação também contém um vetor de deslocamento B ∈ R^K que representa o “comportamento básico” do modelo quando todos os dados são ofuscados.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Valores de Shapley

Linhas de base do SHAP para explicabilidade

Valores assimétricos de Shapley

Contexto

Método

Atribuições resultantes

nota