Utilisation d'ensembles de données RELATED_TIME_SERIES - Amazon Forecast

Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d'ensembles de données RELATED_TIME_SERIES

Un ensemble de données RELATED_TIME_SERIES comprend des données chronologiques qui ne sont pas incluses dans un ensemble de données TARGET_TIME_SERIES et qui peuvent améliorer la précision de votre prédicteur.

Par exemple, dans le domaine de la prévision de la demande, un jeu de données de séries chronologiques cible contiendra timestamp des item_id dimensions, tandis qu'un jeu de données de séries chronologiques connexe complémentaire inclut également les fonctionnalités supplémentaires suivantes : item pricepromotion,, etweather.

Un ensemble de données RELATED_TIME_SERIES peut contenir jusqu'à 10 dimensions de prévision (les mêmes que dans votre ensemble de données TARGET_TIME_SERIES) et jusqu'à 13 fonctions chronologiques associées.

Carnets en Python

Pour un step-by-step guide sur l'utilisation des ensembles de données de séries chronologiques connexes, voir Incorporation de séries chronologiques connexes.

Note

Une série chronologique connexe qui contient des valeurs comprises dans l'horizon de prévision est traitée comme une série chronologique prospective.

Les séries chronologiques connexes se présentent sous deux formes :

  • Séries chronologiques historiques : séries chronologiques sans points de données dans l'horizon de prévision.

  • Séries chronologiques prospectives : séries chronologiques dont les points de données se situent dans l'horizon de prévision.

Les séries chronologiques associées à l'historique contiennent des points de données allant jusqu'à l'horizon de prévision et ne contiennent aucun point de données situé dans l'horizon de prévision. Les séries chronologiques prospectives contiennent des points de données allant jusqu'à l'horizon de prévision et à l'intérieur de celui-ci.

Time series graph showing target, forward-looking, and historical related data with forecast window.

Un ensemble de données RELATED_TIME_SERIES est soumis aux restrictions suivantes :

  • Il ne peut pas inclure la valeur cible de TARGET_TIME_SERIES.

  • Il doit inclure les dimensions item_id et timestamp, et au moins une fonction associée (telle que price).

  • Les données de fonction RELATED_TIME_SERIES doivent avoir le type de données int ou float.

  • Pour utiliser l'intégralité de la série chronologique cible, tous les éléments du jeu de données de séries chronologiques cible doivent également être inclus dans le jeu de données de séries chronologiques correspondant. Si une série chronologique associée ne contient qu'un sous-ensemble d'éléments de la série chronologique cible, la création du modèle et la génération de prévisions seront limitées à ce sous-ensemble spécifique d'éléments.

    Par exemple, si la série chronologique cible contient 1 000 éléments et que le jeu de données de séries chronologiques associé ne contient que 100 éléments, le modèle et les prévisions seront basés uniquement sur ces 100 éléments.

  • La fréquence à laquelle les données sont enregistrées dans le jeu de données de série chronologique associé doit correspondre à l'intervalle auquel vous souhaitez générer les prévisions (la granularitéde prévision).

    Par exemple, si vous souhaitez générer des prévisions selon une granularité hebdomadaire, la fréquence à laquelle les données sont enregistrées dans la série chronologique associée doit également être hebdomadaire, même si la fréquence à laquelle les données sont enregistrées dans la série chronologique cible est quotidienne.

  • Les données de chaque élément de l'ensemble de données RELATED_TIME_SERIES doivent débuter avant ou à la date correspondant au timestamp initial de l'élément item_id correspondant dans l'ensemble de données TARGET_TIME_SERIES.

    Par exemple, si les données TARGET_TIME_SERIES pour socks commencent le 01 01 2019 et que les données TARGET_TIME_SERIES pour shoes commencent le 02 01 2019, les données RELATED_TIME_SERIES pour socks doivent commencer le 01 01 2019 ou avant et les données pour shoes doivent commencer le 02 01 2019 ou avant.

  • Pour les ensembles de données de séries chronologiques prospectifs, le dernier horodatage de chaque élément doit figurer sur le dernier horodatage de la fenêtre de prévision désignée par l'utilisateur (appelée horizon de prévision).

    Dans l'exemple de fichier RELATED_TIME_SERIES ci-dessous, les données timestamp pour les chaussettes et les chaussures doivent se terminer le 01 07 2019 ou après (horodatage de fin enregistré) plus l'horizon de prévision. Si la fréquence des données de la série chronologique cible est quotidienne et que l'horizon de prévision est de 10 jours, les points de données quotidiens doivent être fournis dans le fichier de séries chronologiques prospectives jusqu'au 11 juillet 2019.

  • Pour les ensembles de données de séries chronologiques associées à l'historique, le dernier horodatage de chaque élément doit correspondre au dernier horodatage de la série chronologique cible.

    Dans l'exemple de fichier de série chronologique connexe ci-dessous, les timestamp données relatives aux chaussettes et aux chaussures doivent se terminer le 2019-07-01 (dernier horodatage enregistré).

  • Les dimensions Forecast fournies dans le jeu de données de séries chronologiques associé doivent être égales ou constituer un sous-ensemble des dimensions désignées dans le jeu de données de séries chronologiques cible.

  • Les séries chronologiques associées ne peuvent pas comporter de valeurs manquantes. Pour plus d'informations sur les valeurs manquantes dans un jeu de données de séries chronologiques associé, consultez la section Gestion des valeurs manquantes.

Le tableau suivant montre un fichier d'ensemble de données RELATED_TIME_SERIES correctement configuré. Pour cet exemple, supposons ce qui suit :

  • Le dernier point de données a été enregistré dans l'ensemble de données TARGET_TIME_SERIES le 01 07 2019.

  • L'horizon de prévision est de 10 jours.

  • La granularité de prévision est quotidienne (D).

Une ligne «  » indique tous les points de données entre les lignes précédentes et suivantes.

timestamp item_id store price
2019-01-01 socks NYC 10
2019-01-02 socks NYC 10
2019-01-03 socks NYC 15
...
2019-06-01 socks NYC 10
...
2019-07-01 socks NYC 10
...
2019-07-11 socks NYC 20
2019-01-05 socks SFO 45
...
2019-06-05 socks SFO 10
...
2019-07-01 socks SFO 10
...
2019-07-11 socks SFO 30
2019-02-01 shoes ORD 50
...
2019-07-01 shoes ORD 75
...
2019-07-11 shoes ORD 60

Le tableau suivant montre les fréquences d'enregistrement de données compatibles pour les séries chronologiques cibles et les séries chronologiques connexes à prévoir selon une granularité hebdomadaire. Comme les données d'un jeu de données de séries chronologiques associé ne peuvent pas être agrégées, Forecast accepte uniquement une fréquence de données de série chronologique associée identique à la granularité de prévision choisie.

Données d'entrée cibles (fréquence) Fréquence des séries chronologiques connexes Granularité des prévisions Soutenu par Forecast ?
Chaque jour Hebdomadaire Hebdomadaire Oui
Hebdomadaire Hebdomadaire Hebdomadaire Oui
N/A Hebdomadaire Hebdomadaire Oui
Chaque jour Chaque jour Hebdomadaire Non
Note

Pour mettre à niveau un prédicteur existant vers AutoPredictor, voir Mise à niveau vers AutoPredictor

Lorsque vous utilisez un prédicteur existant, vous pouvez utiliser un jeu de données de séries chronologiques associé lorsque vous entraînez un prédicteur avec les algorithmes CNN-QR, DeepAr+ et Prophet. NPTSARIMA, et n'acceptez ETSpas les données de séries chronologiques associées.

Le tableau suivant indique les types de séries chronologiques associées que chaque algorithme Amazon Forecast accepte.

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

Séries chronologiques liées à l'historique

Séries chronologiques prospectives

Lorsque vous utilisez AutoML, vous pouvez fournir des données de séries chronologiques historiques et prospectives, et Forecast n'utilisera ces séries chronologiques que le cas échéant.

Si vous fournissez des séries chronologiques prospectives, Forecast utilisera les données associées avec CNN -QR, DeepAr+ et Prophet, et n'utilisera pas les données associées avecNPTS, et. ARIMA ETS Si des données de séries chronologiques relatives à l'historique sont fournies, Forecast utilisera les données associées avec CNN -QR, mais n'utilisera pas les données associées avec DeepAr+, Prophet,NPTS, ARIMA et. ETS