Conjunto de datos de reemplazo - Amazon Forecast

Amazon Forecast ya no está disponible para nuevos clientes. Los clientes actuales de Amazon Forecast pueden seguir utilizando el servicio con normalidad. Más información

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conjunto de datos de reemplazo

Un conjunto de datos de reemplazo es una versión modificada de la serie temporal relacionada de referencia que contiene solo los valores que desea cambiar en una previsión condicional. El conjunto de datos de reemplazo debe contener las dimensiones de la previsión, los identificadores de los artículos y las marcas temporales en las series temporales relacionadas de referencia, así como al menos 1 serie temporal cambiada. Este conjunto de datos se fusiona con la serie temporal relacionada de referencia para crear un conjunto de datos transformado que se utiliza para la previsión condicional. El conjunto de datos de reemplazo debe estar en CSV formato.

Este conjunto de datos no debe contener marcas temporales duplicadas para la misma serie temporal.

A continuación se muestran varios ejemplos de cómo se puede especificar una serie temporal de reemplazo y cómo se interpretan esas especificaciones. Considere el caso en el que realiza una previsión diaria y el horizonte de previsión va desde el 1 de agosto de 2022 hasta el 3 de agosto de 2022. La serie temporal relacionada de referencia de todos los ejemplos se muestra en la siguiente tabla.

item_id Marca de tiempo precio recuento_existencias

artículo_1

01/08/2022

100

50

artículo_1

2022-08-02

100

50

artículo_1

2022-08-03

100

50

artículo_2

2022-08-01

75

500

artículo_2

2022-08-02

75

500

artículo_2

2022-08-03

75

500

Unchanged values

Para aplicar un descuento del 10 % en el artículo_1 para el 2 de agosto de 2022 y el 3 de agosto de 2022, basta con especificar lo siguiente para el conjunto de datos de reemplazo:

Conjunto de datos de reemplazo
item_id Marca de tiempo precio

artículo_1

2022-08-02

90

artículo_1

2022-08-03

90

Sin embargo, también es válido especificar valores sin cambios en el conjunto de datos de reemplazo. Cuando se utilizan como conjuntos de datos de reemplazo, cada una de las tres tablas siguientes arrojará los mismos resultados que la tabla proporcionada anteriormente.

Conjunto de datos de reemplazo con una columna sin cambios
item_id Marca de tiempo precio recuento_existencias

artículo_1

2022-08-02

90

50

artículo_1

2022-08-03

90

50

Conjunto de datos de reemplazo con filas sin cambios
item_id Marca de tiempo precio

artículo_1

2022-08-01

100

artículo_1

2022-08-02

90

artículo_1

2022-08-03

90

artículo_2

2022-08-01

75

artículo_2

2022-08-02

75

artículo_2

2022-08-03

75

Conjunto de datos de reemplazo con filas y columnas sin cambios
item_id Marca de tiempo precio recuento_existencias

artículo_1

2022-08-01

100

50

artículo_1

2022-08-02

90

50

artículo_1

2022-08-03

90

50

artículo_2

2022-08-01

75

500

artículo_2

2022-08-02

75

500

artículo_2

2022-08-03

75

500

Missing values

Los valores que faltan en la serie temporal de reemplazo se sustituyen por valores de la serie temporal relacionada de referencia. Considere el escenario en el que aplica un 10 % de descuento en el artículo_1 para el 2 de agosto de 2022 y el 3 de agosto de 2022 y aumenta las existencias del artículo_2 el 1 de agosto de 2022. Este conjunto de datos de reemplazo es suficiente:

Conjunto de datos de reemplazo con valores que faltan
item_id Marca de tiempo precio recuento_existencias

artículo_1

2022-08-02

90

artículo_1

2022-08-03

90

artículo_2

2022-08-01

5000

Los valores que faltan en esta tabla se imputan a la serie temporal relacionada de referencia.

Extraneous values

Los valores ajenos a la serie temporal de reemplazo se ignoran al crear una previsión condicional. Es decir, los valores del conjunto de datos de reemplazo que no se corresponden con los valores de la serie temporal relacionada de referencia no se modelan. Considere este conjunto de datos de reemplazo:

Conjunto de datos de reemplazo con valores ajenos
item_id Marca de tiempo precio recuento_existencias

artículo_1

2022-08-01

100

50

artículo_1

2022-08-02

100

50

artículo_1

2022-08-03

100

50

artículo_2

2022-08-01

75

500

artículo_2

2022-08-02

75

500

artículo_2

2022-08-03

75

500

artículo_3

2022-08-01

50

125

artículo_3

2022-08-02

50

125

artículo_3

2022-08-03

50

125

Las filas que contienen el artículo_3 se ignoran y no forman parte del análisis condicional.

Historical changes

Se ignoran los cambios en el conjunto de datos de reemplazo que estén fuera del horizonte de previsión. Considere este conjunto de datos de reemplazo:

Conjunto de datos de reemplazo con valores fuera del horizonte de previsión
item_id Marca de tiempo precio recuento_existencias

artículo_1

2022-07-31

100

50

artículo_1

2022-08-01

100

50

artículo_1

2022-08-02

100

50

artículo_1

2022-08-03

100

50

artículo_1

2022-08-04

100

50

artículo_2

2022-07-31

75

500

artículo_2

2022-08-01

75

500

artículo_2

2022-08-02

75

500

artículo_2

2022-08-03

75

500

artículo_3

2022-08-04

75

500

Las filas que contienen el 31 de julio de 2022 y el 4 de agosto de 2022 se omiten y no forman parte del análisis condicional.

Dimensiones de Forecast

Si incluye las dimensiones de previsión en su conjunto de datos, debe incluirlas en el conjunto de datos de reemplazo. Considere esta serie temporal relacionada de referencia:

item_id id_tienda Marca de tiempo precio recuento_existencias

artículo_1

tienda_1

2022-08-01

100

50

artículo_1

tienda_1

2022-08-02

100

50

artículo_1

tienda_1

2022-08-03

100

50

artículo_1

tienda_2

2022-08-01

75

500

artículo_1

tienda_2

2022-08-02

75

500

artículo_1

tienda_2

2022-08-03

75

500

Por lo tanto, el conjunto de datos para reemplazar un 10 % de descuento en todas las tiendas el 2 de agosto de 2022 sería el siguiente:

item_id id_tienda Marca de tiempo precio

artículo_1

tienda_1

2022-08-02

90

artículo_1

tienda_2

2022-08-02

67,5