Previsões de séries temporais no Amazon Canvas SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Previsões de séries temporais no Amazon Canvas SageMaker

nota

Os modelos de previsão de séries temporais são compatíveis somente com conjuntos de dados tabulares.

O Amazon SageMaker Canvas oferece a capacidade de usar previsões de séries temporais de aprendizado de máquina. As previsões de séries temporais permitem que você faça previsões que podem variar com o tempo.

Você pode fazer uma previsão de série temporal para os seguintes exemplos:

  • Prevendo seu inventário nos próximos meses.

  • O número de itens vendidos nos próximos quatro meses.

  • O efeito da redução do preço nas vendas durante as festas de fim de ano.

  • Inventário de itens nos próximos 12 meses.

  • O número de clientes que entrarão em uma loja nas próximas horas.

  • Prever como uma redução de 10% no preço de um produto afeta as vendas em um período de tempo.

Para fazer uma previsão de séries temporais, seu conjunto de dados deve ter o seguinte:

  • Uma coluna de data e hora com todos os valores do tipo datetime.

  • Uma coluna de destino que tem os valores que você está usando para prever valores futuros.

  • Uma coluna de ID do item que contém identificadores exclusivos para cada item em seu conjunto de dados, como SKU números.

Os valores datetime na coluna de data e hora devem usar um dos seguinte formatos:

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

Você pode fazer previsões para os seguintes intervalos:

  • 1 min

  • 5 min

  • 15 min

  • 30 min

  • 1 hora

  • 1 dia

  • 1 semana

  • 1 mês

  • 1 ano

Valores futuros em seu conjunto de dados de entrada

O Canvas detecta automaticamente colunas em seu conjunto de dados que podem conter valores futuros. Se presentes, esses valores podem aumentar a precisão das previsões. O Canvas marca essas colunas específicas com um rótulo Future values. O Canvas infere a relação entre os dados nessas colunas e a coluna de destino que você está tentando prever e utiliza essa relação para gerar previsões mais precisas.

Por exemplo, você pode prever a quantidade de sorvete vendida por um supermercado. Para fazer uma previsão, você deve ter uma coluna de data e hora e uma coluna que indique a quantidade de sorvete que o supermercado vendeu. Para uma previsão mais precisa, seu conjunto de dados também pode incluir o preço, a temperatura ambiente, o sabor do sorvete ou um identificador exclusivo do sorvete.

As vendas de sorvetes podem aumentar quando o clima está mais quente. Uma diminuição no preço do sorvete pode resultar em mais unidades vendidas. Ter uma coluna com dados de temperatura ambiente e uma coluna com dados de preços pode melhorar sua capacidade de prever o número de unidades de sorvete que o supermercado vende.

Embora fornecer valores futuros seja opcional, isso ajuda você a realizar análises hipotéticas diretamente no aplicativo Canvas, mostrando como mudanças nos valores futuros podem alterar suas previsões.

Processando valores ausentes

Você pode ter dados ausentes por diferentes motivos. O motivo da sua falta de dados pode informar como você deseja que o Canvas os impute. Por exemplo, sua organização pode usar um sistema automático que só monitora quando uma venda acontece. Se você estiver usando um conjunto de dados proveniente desse tipo de sistema automático, há valores ausentes na coluna de destino.

Importante

Se você tiver valores ausentes na coluna de destino, recomendamos usar um conjunto de dados que não os tenha. SageMaker O Canvas usa a coluna de destino para prever valores futuros. Valores ausentes na coluna de destino podem reduzir consideravelmente a precisão da previsão.

Para valores ausentes no conjunto de dados, o Canvas atribui automaticamente os valores ausentes para você, preenchendo a coluna de destino com 0 e outras colunas numéricas com o valor médio da coluna.

No entanto, você pode selecionar sua própria lógica de preenchimento para a coluna de destino e outras colunas numéricas em seus conjuntos de dados. As colunas de destino têm diretrizes e restrições de preenchimento diferentes das demais colunas numéricas. As colunas de destino são preenchidas até o fim do período histórico, enquanto as colunas numéricas são preenchidas nos períodos histórico e futuro até o final do horizonte de previsão. O Canvas só preenche valores futuros em uma coluna numérica se seus dados tiverem, pelo menos, um registro com um timestamp futuro e um valor para essa coluna específica.

Você pode escolher uma das seguintes opções de lógica para atribuir valores ausentes em seus dados:

  • zero – Preencha com 0.

  • NaN – Preencha com NaN, ou não é um número. Isso só é compatível com a coluna de destino.

  • mean – Preencha com o valor médio da série de dados.

  • median – Preencha com o valor mediano da série de dados.

  • min – Preencha com o valor mínimo da série de dados.

  • max – Preencha com o valor máximo da série de dados.

Ao escolher uma lógica de preenchimento, você deve considerar como a lógica será interpretada pelo seu modelo. Por exemplo, em um cenário de varejo, registrar zero vendas de um item disponível é diferente de registrar zero vendas de um item indisponível, pois esse último não implica necessariamente em uma falta de interesse no cliente no item indisponível. Nesse caso, preencher com 0 a coluna de destino do conjunto de dados pode fazer que o modelo seja subestimado em suas previsões e deduza a falta de interesse do cliente em itens indisponíveis. Por outro lado, o preenchimento com NaN pode fazer com que o modelo ignore ocorrências reais de zero itens vendidos de itens disponíveis.

Tipos de previsões

É possível fazer um dos tipos de previsões a seguir:

  • Item único

  • Todos os itens

Para uma previsão de todos os itens em seu conjunto de dados, o SageMaker Canvas retorna uma previsão para os valores futuros de cada item em seu conjunto de dados.

Para uma previsão de um único item, você especifica o item e o SageMaker Canvas retorna uma previsão para os valores futuros. A previsão inclui um gráfico de linhas que representa graficamente os valores previstos ao longo do tempo.