代替データセット - Amazon Forecast

Amazon Forecast は、新規顧客には利用できなくなりました。Amazon Forecast の既存のお客様は、通常どおりサービスを引き続き使用できます。詳細はこちら

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

代替データセット

代替データセットは、What-If 予想で変更したい値のみを含むベースライン関連の時系列を修正したバージョンです。代替データセットには、ベースライン関連の時系列の予想ディメンション、アイテム識別子、タイムスタンプと、少なくとも 1 つの変更された時系列が含まれている必要があります。このデータセットをベースライン関連の時系列と統合して、What-If 予想に使用される変換済みデータセットを作成します。代替データセットは CSV 形式である必要があります。

このデータセットには、同じ時系列のタイムスタンプが重複してはいけません。

次に、代替時系列を指定する方法とそれらの仕様の解釈方法の例をいくつか示します。日次予測を行っていて、予想期間が 2022 年 8 月 1 日から 2022 年 8 月 3 日までの場合を考えてみましょう。すべての例のベースライン関連の時系列を以下の表に示します。

item_id timestamp 料金 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Unchanged values

2022-08-02 と 2022-08-03 の item_1 に 10% の割引を適用するには、代替データセットに以下を指定すれば十分です。

代替データセット
item_id timestamp 料金

item_1

2022-08-02

90

item_1

2022-08-03

90

ただし、代替データセットでは変更されていない値を指定することも有効です。代替データセットとして使用すると、次の 3 つのテーブルはそれぞれ、以前に提供したテーブルと同じ結果になります。

列が変更されていない代替データセット
item_id timestamp 料金 stock_count

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

行が変更されていない代替データセット
item_id timestamp 料金

item_1

2022-08-01

100

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

75

item_2

2022-08-02

75

item_2

2022-08-03

75

行と列が変更されていない代替データセット
item_id timestamp 料金 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Missing values

代替時系列の欠損値は、ベースライン関連の時系列の値に置き換えられます。2022 年 8 月 2 日と 2022 年 8 月 3 日に item_1 に 10% の割引を適用し、2022 年 8 月 1 日に item_2 の在庫を増やすシナリオを考えてみましょう。この代替データセットで十分です。

値が欠落している代替データセット
item_id timestamp 料金 stock_count

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

5000

このテーブルにない値は、ベースライン関連の時系列から代入されます。

Extraneous values

What-If 予想を作成する場合、代替時系列の余分な値は無視されます。つまり、ベースラインに関連する時系列の値と一致しない代替データセットの値はモデル化されません。次の代替データセットを考えてみましょう。

無関係な値を含む代替データセット
item_id timestamp 料金 stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-01

50

125

item_3

2022-08-02

50

125

item_3

2022-08-03

50

125

item_3 を含む行は無視され、What-If 分析には含まれません。

Historical changes

予測範囲外の代替データセットの変更は無視されます。次の代替データセットを考えてみましょう。

予測範囲外の値を含む代替データセット
item_id timestamp 料金 stock_count

item_1

2022-07-31

100

50

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_1

2022-08-04

100

50

item_2

2022-07-31

75

500

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-04

75

500

2022-07-31 と 2022-08-04 を含む行は無視され、What-If 分析には含まれません。

予想ディメンション

データセットに予想ディメンションを含める場合は、それを代替データセットに含める必要があります。ベースラインに関連する次の時系列を考えてみましょう。

item_id store_id timestamp 料金 stock_count

item_1

store_1

2022-08-01

100

50

item_1

store_1

2022-08-02

100

50

item_1

store_1

2022-08-03

100

50

item_1

store_2

2022-08-01

75

500

item_1

store_2

2022-08-02

75

500

item_1

store_2

2022-08-03

75

500

したがって、2022 年 8 月 2 日に全店舗での 10% 割引の代替データセットは次のようになります。

item_id store_id timestamp 料金

item_1

store_1

2022-08-02

90

item_1

store_2

2022-08-02

67.5