Conjunto de dados de substituição - Amazon Forecast

O Amazon Forecast não está mais disponível para novos clientes. Os clientes existentes do Amazon Forecast podem continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conjunto de dados de substituição

Um conjunto de dados de substituição é uma versão modificada da série temporal relacionada à linha de base que contém somente os valores que você deseja alterar em uma previsão de hipóteses. O conjunto de dados de substituição deve conter as dimensões de previsão, identificadores de itens e carimbos de data e hora na série temporal relacionada à linha de base, bem como pelo menos uma série temporal alterada. Esse conjunto de dados é mesclado com a série temporal relacionada à linha de base para criar um conjunto de dados transformado usado para a previsão de hipóteses. O conjunto de dados de substituição deve estar em CSV formato.

Esse conjunto de dados não deve conter carimbos de data e hora duplicados para a mesma série temporal.

Veja vários exemplos de como você pode especificar uma série temporal de substituição e como essas especificações são interpretadas. Considere o caso em que você está fazendo previsões diárias e o horizonte de previsão é de 2022-08-01 a 2022-08-03. A série temporal relacionada à linha de base para todos os exemplos é fornecida na tabela a seguir.

item_id timestamp preço stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Unchanged values

Para aplicar um desconto de 10% no item_1 para 2022-08-02 e 2022-08-03, basta especificar o seguinte para o conjunto de dados de substituição:

Conjunto de dados de substituição
item_id timestamp preço

item_1

2022-08-02

90

item_1

2022-08-03

90

No entanto, também é válido especificar valores inalterados no conjunto de dados de substituição. Quando usadas como conjuntos de dados de substituição, cada uma das três tabelas a seguir produzirá os mesmos resultados da tabela fornecida anteriormente.

Conjunto de dados de substituição por uma coluna inalterada
item_id timestamp preço stock_count

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

Conjunto de dados de substituição com linhas inalteradas
item_id timestamp preço

item_1

2022-08-01

100

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

75

item_2

2022-08-02

75

item_2

2022-08-03

75

Conjunto de dados de substituição com linhas e colunas inalteradas
item_id timestamp preço stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Missing values

Os valores ausentes na série temporal de substituição são substituídos por valores da série temporal relacionada à linha de base. Considere o cenário em que você aplica um desconto de 10% no item_1 para 2022-08-02 e 2022-08-03 e aumenta o estoque do item_2 em 2022-08-01. Esse conjunto de dados de substituição é suficiente:

Conjunto de dados de substituição com valores ausentes
item_id timestamp preço stock_count

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

5000

Os valores que faltam nessa tabela são imputados da série temporal relacionada à linha de base.

Extraneous values

Valores estranhos na série temporal de substituição são ignorados ao criar uma previsão de hipóteses. Ou seja, os valores no conjunto de dados de substituição que não correspondem aos valores na série temporal relacionada à linha de base não são modelados. Considere esse conjunto de dados de substituição:

Conjunto de dados de substituição com valores estranhos
item_id timestamp preço stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-01

50

125

item_3

2022-08-02

50

125

item_3

2022-08-03

50

125

As linhas contendo item_3 são ignoradas e não fazem parte da análise de hipóteses.

Historical changes

As alterações no conjunto de dados de substituição que estão fora do horizonte de previsão são ignoradas. Considere esse conjunto de dados de substituição:

Conjunto de dados de substituição com valores fora do horizonte de previsão
item_id timestamp preço stock_count

item_1

2022-07-31

100

50

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_1

2022-08-04

100

50

item_2

2022-07-31

75

500

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-04

75

500

As linhas contendo 2022-07-31 e 2022-08-04 são ignoradas e não fazem parte da análise de hipóteses.

Dimensões do Forecast

Se você incluir dimensões de previsão em seu conjunto de dados, deverá incluí-las no conjunto de dados substituto. Considere esta série temporal relacionada à linha de base:

item_id store_id timestamp preço stock_count

item_1

store_1

2022-08-01

100

50

item_1

store_1

2022-08-02

100

50

item_1

store_1

2022-08-03

100

50

item_1

store_2

2022-08-01

75

500

item_1

store_2

2022-08-02

75

500

item_1

store_2

2022-08-03

75

500

Portanto, o conjunto de dados de substituição para um desconto de 10% em todas as lojas em 2022-08-02 seria o seguinte:

item_id store_id timestamp preço

item_1

store_1

2022-08-02

90

item_1

store_2

2022-08-02

67,5