使用相關時間序列資料集 - Amazon Forecast

Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用服務。進一步了解"

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用相關時間序列資料集

相關時間序列資料集包含目標時間序列資料集未包含的時間序列資料,可能會改善預測器的準確性。

例如,在需求預測網域中,目標時間序列資料集會包含 timestampitem_id維度,而互補的相關時間序列資料集也會包含下列補充功能:item pricepromotionweather

一個相關時間序列資料集最多可包含 10 個預測維度 (與目標時間序列資料集相同),以及最多 13 個相關的時間序列功能。

Python 筆記本

如需使用相關時間序列資料集step-by-step指南,請參閱整合相關時間序列

注意

包含預測時間範圍內任何值的相關時間序列會被視為前瞻性時間序列。

相關時間序列有兩種形式:

  • 歷史時間序列:預測期間內沒有資料點的時間序列。

  • 前瞻時間序列具有預測時間範圍內資料點的時間序列。

歷史相關時間序列包含截至預測時間範圍的資料點,且不包含預測時間範圍內的任何資料點。前瞻相關時間序列包含預測期間之前之內的資料點。

Time series graph showing target, forward-looking, and historical related data with forecast window.

相關時間序列資料集有下列限制:

  • 它不能包含來自目標時間序列的目標值。

  • 它必須包括 item_idtimestamp 維度,以及至少一個相關特徵 (例如 price)。

  • 相關時間序列功能資料必須是 intfloat 資料類型。

  • 若要使用整個目標時間序列,目標時間序列資料集中的所有項目也必須包含在相關的時間序列資料集中。如果相關時間序列僅包含目標時間序列中的項目子集,則模型建立和預測產生將僅限於該特定項目子集。

    例如,如果目標時間序列包含 1000 個項目,且相關的時間序列資料集僅包含 100 個項目,則模型和預測將僅以這 100 個項目為基礎。

  • 在相關時間序列資料集中記錄資料的頻率,必須符合您要產生預測的間隔 (預測精細程度)。

    例如,如果您想要以每週精細程度產生預測,則在相關時間序列中記錄資料的頻率也必須是每週,即使在目標時間序列中記錄資料的頻率是每日也一樣。

  • 相關時間序列資料集中每個項目的資料都必須早於或從目標時間序列資料集中對應 item_id 的開頭 timestamp 開始。

    例如,如果 socks 的目標時間序列資料從 2019-01-01 開始,而 shoes 的目標時間序列資料從 2019-02-01 開始,則 socks 的相關時間序列資料必須早於或在 2019-01-01 開始,而 shoes 的資料必須早於或在 2019-02-01 開始。

  • 對於前瞻性相關時間序列資料集,每個項目的最後一個時間戳記必須位於使用者指定的預測時段 (稱為預測期間) 中的最後一個時間戳記。

    在以下的範例相關時間序列檔案中,襪子和鞋子的 timestamp 資料必須結束於 2019-07-01 或其後 (最後記錄的時間戳記)「加上」預測期間。如果目標時間序列中的資料頻率為每日,且預測期間為 10 天,則必須在 2019-07-11 之前,在前瞻性相關時間序列檔案中提供每日資料點。

  • 對於歷史相關時間序列資料集,每個項目的最後一個時間戳記必須符合目標時間序列中的最後一個時間戳記。

    在下面的時間序列檔案中,襪子和鞋子timestamp的資料都必須在 2019-07-01 (上次記錄的時間戳記) 結束。

  • 相關時間序列資料集中提供的預測維度必須等於或目標時間序列資料集中指定的維度子集。

  • 相關時間序列不能缺少值。如需相關時間序列資料集中遺失值的資訊,請參閱處理遺失值

下表顯示正確設定的相關時間序列資料集檔案。在本範例中,假設下列情況:

  • 目標時間序列資料集記錄的最後一個資料點為 2019-07-01。

  • 預測期間為 10 天。

  • 預測精細程度為每日 (D)。

"" 資料列表示上一列與後續列之間的所有資料點。

timestamp item_id store price
2019-01-01 襪子 NYC 10
2019-01-02 襪子 NYC 10
2019-01-03 襪子 NYC 15
...
2019-06-01 襪子 NYC 10
...
2019-07-01 襪子 NYC 10
...
2019-07-11 襪子 NYC 20
2019-01-05 襪子 SFO 45
...
2019-06-05 襪子 SFO 10
...
2019-07-01 襪子 SFO 10
...
2019-07-11 襪子 SFO 30
2019-02-01 鞋子 ORD 50
...
2019-07-01 鞋子 ORD 75
...
2019-07-11 鞋子 ORD 60

下表顯示目標時間序列的相容資料記錄頻率,以及以每週精細度預測的相關時間序列。由於相關時間序列資料集中的資料無法彙總,所以預測僅接受與所選預測精細度相同的相關時間序列資料頻率。

目標輸入資料頻率 相關時間序列頻率 預測精細程度 Forecast 支援?
每日 每週 每週
每週 每週 每週
N/A 每週 每週
每日 每日 每週
注意

若要將現有預測器升級至 AutoPredictor,請參閱 升級至 AutoPredictor

使用舊版預測器時,您可以在使用 CNN-QRDeepAR+Prophet 演算法訓練預測器時使用相關的時間序列資料集。NPTSARIMAETS 不接受相關的時間序列資料。

下表顯示每個 Amazon Forecast 演算法接受的相關時間序列類型。

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

歷史相關時間序列

前瞻相關時間序列

使用 AutoML 時,您可以同時提供歷史和未來相關的時間序列資料,而預測只會在適用的情況下使用這些時間序列。

如果您提供前瞻相關時間序列資料,預測會將相關資料與 CNN-QR、DeepAR+ 和 Prophet 搭配使用,而且不會將相關資料與 NPTS、ARIMA 和 ETS 搭配使用。如果提供的歷史相關時間序列資料,預測將搭配 CNN-QR 使用相關資料,且不會搭配 DeepAR+、Prophet、NPTS、ARIMA 和 ETS 使用相關資料。