대체 데이터 세트 - Amazon Forecast

Amazon Forecast는 더 이상 신규 고객이 사용할 수 없습니다. Amazon Forecast의 기존 고객은 평소와 같이 서비스를 계속 사용할 수 있습니다. 자세히 알아보기

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

대체 데이터 세트

대체 데이터 세트는 what-if 예측에서 변경하려는 값만 포함하는 기준선 관련 시계열의 수정된 버전입니다. 대체 데이터 세트에는 기준선 관련 시계열의 예측 차원, 항목 식별자, 타임스탬프와 하나 이상의 변경된 시계열이 포함되어야 합니다. 이 데이터 세트는 기준선 관련 시계열과 병합되어 what-if 예측에 사용되는 변환된 데이터 세트를 생성합니다. 대체 데이터 세트는 CSV 형식이어야 합니다.

이 데이터 세트에는 동일한 시계열에 대한 중복된 타임스탬프가 포함되어서는 안 됩니다.

다음은 대체 시계열을 지정하는 방법과 해당 사양을 해석하는 방법에 대한 몇 가지 예제입니다. 일별 예측을 하고 예측 기간이 2022-08-01부터 2022-08-03까지인 경우를 생각해 보세요. 모든 예제의 기준선 관련 시계열이 다음 표에 나와 있습니다.

item_id 타임스탬프 가격 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Unchanged values

2022-08-02 및 2022-08-03에 item_1에 10% 할인을 적용하려면 대체 데이터 세트에 다음을 지정하는 것으로 충분합니다.

대체 데이터 세트
item_id 타임스탬프 가격

item_1

2022-08-02

90

item_1

2022-08-03

90

하지만 대체 데이터 세트에 변경되지 않은 값을 지정하는 것도 유효합니다. 대체 데이터 세트로 사용할 경우 다음 세 테이블 각각은 이전에 제공된 테이블과 동일한 결과를 산출합니다.

열이 변경되지 않은 대체 데이터 세트
item_id 타임스탬프 가격 stock_count

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

행이 변경되지 않은 대체 데이터 세트
item_id 타임스탬프 가격

item_1

2022-08-01

100

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

75

item_2

2022-08-02

75

item_2

2022-08-03

75

행과 열이 변경되지 않은 대체 데이터 세트
item_id 타임스탬프 가격 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Missing values

대체 시계열에서 누락된 값은 기준선 관련 시계열의 값으로 대체됩니다. 2022-08-02 및 2022-08-03에 item_1에 10% 할인을 적용하고 2022-08-01에 item_2의 재고를 늘리는 시나리오를 생각해 보세요. 다음과 같은 대체 데이터 세트로 충분합니다.

누락된 값이 있는 대체 데이터 세트
item_id 타임스탬프 가격 stock_count

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

5000

이 테이블에서 누락된 값은 기준선 관련 시계열에서 귀속됩니다.

Extraneous values

what-if 예측을 생성할 때 대체 시계열의 관련 없는 값은 무시됩니다. 즉, 기준선 관련 시계열의 값과 일치하지 않는 대체 데이터 집합의 값은 모델링되지 않습니다. 다음 대체 데이터 세트를 생각해 보세요.

관련 없는 값이 있는 대체 데이터 세트
item_id 타임스탬프 가격 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-01

50

125

item_3

2022-08-02

50

125

item_3

2022-08-03

50

125

item_3이 포함된 행은 무시되며 what-if 분석에 포함되지 않습니다.

Historical changes

예측 기간을 벗어난 대체 데이터 세트의 변경 사항은 무시됩니다. 다음 대체 데이터 세트를 생각해 보세요.

예측 기간을 벗어난 값이 있는 대체 데이터 세트
item_id 타임스탬프 가격 stock_count

item_1

2022-07-31

100

50

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_1

2022-08-04

100

50

item_2

2022-07-31

75

500

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-04

75

500

2022-07-31과 2022-08-04를 포함하는 행은 무시되며 what-if 분석에 포함되지 않습니다.

예측 차원

데이터 세트에 예측 차원을 포함하는 경우 대체 데이터 세트에도 해당 차원을 포함해야 합니다. 다음과 같은 기준선 관련 시계열을 생각해 보세요.

item_id store_id 타임스탬프 가격 stock_count

item_1

store_1

2022-08-01

100

50

item_1

store_1

2022-08-02

100

50

item_1

store_1

2022-08-03

100

50

item_1

store_2

2022-08-01

75

500

item_1

store_2

2022-08-02

75

500

item_1

store_2

2022-08-03

75

500

따라서 2022-08-02에 모든 매장에서 10% 할인이 적용되는 대체 데이터 세트는 다음과 같습니다.

item_id store_id 타임스탬프 가격

item_1

store_1

2022-08-02

90

item_1

store_2

2022-08-02

67.5