Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »
Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation d'ensembles de données RELATED_TIME_SERIES
Un ensemble de données RELATED_TIME_SERIES comprend des données chronologiques qui ne sont pas incluses dans un ensemble de données TARGET_TIME_SERIES et qui peuvent améliorer la précision de votre prédicteur.
Par exemple, dans le domaine de la prévision de la demande, un jeu de données de séries chronologiques cible contiendra timestamp
des item_id
dimensions, tandis qu'un jeu de données de séries chronologiques connexe complémentaire inclut également les fonctionnalités supplémentaires suivantes : item price
promotion
,, etweather
.
Un ensemble de données RELATED_TIME_SERIES peut contenir jusqu'à 10 dimensions de prévision (les mêmes que dans votre ensemble de données TARGET_TIME_SERIES) et jusqu'à 13 fonctions chronologiques associées.
Carnets en Python
Pour un step-by-step guide sur l'utilisation des ensembles de données de séries chronologiques connexes, voir Incorporation de séries chronologiques connexes.
Rubriques
Séries chronologiques historiques et prospectives
Note
Une série chronologique connexe qui contient des valeurs comprises dans l'horizon de prévision est traitée comme une série chronologique prospective.
Les séries chronologiques connexes se présentent sous deux formes :
-
Séries chronologiques historiques : séries chronologiques sans points de données dans l'horizon de prévision.
-
Séries chronologiques prospectives : séries chronologiques dont les points de données se situent dans l'horizon de prévision.
Les séries chronologiques associées à l'historique contiennent des points de données allant jusqu'à l'horizon de prévision et ne contiennent aucun point de données situé dans l'horizon de prévision. Les séries chronologiques prospectives contiennent des points de données allant jusqu'à l'horizon de prévision et à l'intérieur de celui-ci.
Validation des ensembles de données RELATED_TIME_SERIES
Un ensemble de données RELATED_TIME_SERIES est soumis aux restrictions suivantes :
-
Il ne peut pas inclure la valeur cible de TARGET_TIME_SERIES.
-
Il doit inclure les dimensions
item_id
ettimestamp
, et au moins une fonction associée (telle queprice
). -
Les données de fonction RELATED_TIME_SERIES doivent avoir le type de données
int
oufloat
. -
Pour utiliser l'intégralité de la série chronologique cible, tous les éléments du jeu de données de séries chronologiques cible doivent également être inclus dans le jeu de données de séries chronologiques correspondant. Si une série chronologique associée ne contient qu'un sous-ensemble d'éléments de la série chronologique cible, la création du modèle et la génération de prévisions seront limitées à ce sous-ensemble spécifique d'éléments.
Par exemple, si la série chronologique cible contient 1 000 éléments et que le jeu de données de séries chronologiques associé ne contient que 100 éléments, le modèle et les prévisions seront basés uniquement sur ces 100 éléments.
-
La fréquence à laquelle les données sont enregistrées dans le jeu de données de série chronologique associé doit correspondre à l'intervalle auquel vous souhaitez générer les prévisions (la granularitéde prévision).
Par exemple, si vous souhaitez générer des prévisions selon une granularité hebdomadaire, la fréquence à laquelle les données sont enregistrées dans la série chronologique associée doit également être hebdomadaire, même si la fréquence à laquelle les données sont enregistrées dans la série chronologique cible est quotidienne.
-
Les données de chaque élément de l'ensemble de données RELATED_TIME_SERIES doivent débuter avant ou à la date correspondant au
timestamp
initial de l'élémentitem_id
correspondant dans l'ensemble de données TARGET_TIME_SERIES.Par exemple, si les données TARGET_TIME_SERIES pour
socks
commencent le 01 01 2019 et que les données TARGET_TIME_SERIES pourshoes
commencent le 02 01 2019, les données RELATED_TIME_SERIES poursocks
doivent commencer le 01 01 2019 ou avant et les données pourshoes
doivent commencer le 02 01 2019 ou avant. -
Pour les ensembles de données de séries chronologiques prospectifs, le dernier horodatage de chaque élément doit figurer sur le dernier horodatage de la fenêtre de prévision désignée par l'utilisateur (appelée horizon de prévision).
Dans l'exemple de fichier RELATED_TIME_SERIES ci-dessous, les données
timestamp
pour les chaussettes et les chaussures doivent se terminer le 01 07 2019 ou après (horodatage de fin enregistré) plus l'horizon de prévision. Si la fréquence des données de la série chronologique cible est quotidienne et que l'horizon de prévision est de 10 jours, les points de données quotidiens doivent être fournis dans le fichier de séries chronologiques prospectives jusqu'au 11 juillet 2019. -
Pour les ensembles de données de séries chronologiques associées à l'historique, le dernier horodatage de chaque élément doit correspondre au dernier horodatage de la série chronologique cible.
Dans l'exemple de fichier de série chronologique connexe ci-dessous, les
timestamp
données relatives aux chaussettes et aux chaussures doivent se terminer le 2019-07-01 (dernier horodatage enregistré). -
Les dimensions Forecast fournies dans le jeu de données de séries chronologiques associé doivent être égales ou constituer un sous-ensemble des dimensions désignées dans le jeu de données de séries chronologiques cible.
-
Les séries chronologiques associées ne peuvent pas comporter de valeurs manquantes. Pour plus d'informations sur les valeurs manquantes dans un jeu de données de séries chronologiques associé, consultez la section Gestion des valeurs manquantes.
Exemple : fichier de séries chronologiques prospectives
Le tableau suivant montre un fichier d'ensemble de données RELATED_TIME_SERIES correctement configuré. Pour cet exemple, supposons ce qui suit :
-
Le dernier point de données a été enregistré dans l'ensemble de données TARGET_TIME_SERIES le 01 07 2019.
-
L'horizon de prévision est de 10 jours.
-
La granularité de prévision est quotidienne (
D
).
Une ligne « …
» indique tous les points de données entre les lignes précédentes et suivantes.
timestamp |
item_id |
store |
price |
---|---|---|---|
2019-01-01 | socks | NYC | 10 |
2019-01-02 | socks | NYC | 10 |
2019-01-03 | socks | NYC | 15 |
... |
|||
2019-06-01 | socks | NYC | 10 |
... |
|||
2019-07-01 | socks | NYC | 10 |
... |
|||
2019-07-11 | socks | NYC | 20 |
2019-01-05 | socks | SFO | 45 |
... |
|||
2019-06-05 | socks | SFO | 10 |
... |
|||
2019-07-01 | socks | SFO | 10 |
... |
|||
2019-07-11 | socks | SFO | 30 |
2019-02-01 | shoes | ORD | 50 |
... |
|||
2019-07-01 | shoes | ORD | 75 |
... |
|||
2019-07-11 | shoes | ORD | 60 |
Exemple : Granularité des prévisions
Le tableau suivant montre les fréquences d'enregistrement de données compatibles pour les séries chronologiques cibles et les séries chronologiques connexes à prévoir selon une granularité hebdomadaire. Comme les données d'un jeu de données de séries chronologiques associé ne peuvent pas être agrégées, Forecast accepte uniquement une fréquence de données de série chronologique associée identique à la granularité de prévision choisie.
Données d'entrée cibles (fréquence) | Fréquence des séries chronologiques connexes | Granularité des prévisions | Soutenu par Forecast ? |
---|---|---|---|
Chaque jour | Hebdomadaire | Hebdomadaire | Oui |
Hebdomadaire | Hebdomadaire | Hebdomadaire | Oui |
N/A | Hebdomadaire | Hebdomadaire | Oui |
Chaque jour | Chaque jour | Hebdomadaire | Non |
Anciens prédicteurs et séries chronologiques associées
Note
Pour mettre à niveau un prédicteur existant vers AutoPredictor, voir Mise à niveau vers AutoPredictor
Lorsque vous utilisez un prédicteur existant, vous pouvez utiliser un jeu de données de séries chronologiques associé lorsque vous entraînez un prédicteur avec les algorithmes CNN-QR, DeepAr+ et Prophet. NPTSARIMA, et n'acceptez ETSpas les données de séries chronologiques associées.
Le tableau suivant indique les types de séries chronologiques associées que chaque algorithme Amazon Forecast accepte.
CNN-QR | DeepAR+ | Prophet | NPTS | ARIMA | ETS | |
---|---|---|---|---|---|---|
Séries chronologiques liées à l'historique |
||||||
Séries chronologiques prospectives |
Lorsque vous utilisez AutoML, vous pouvez fournir des données de séries chronologiques historiques et prospectives, et Forecast n'utilisera ces séries chronologiques que le cas échéant.
Si vous fournissez des séries chronologiques prospectives, Forecast utilisera les données associées avec CNN -QR, DeepAr+ et Prophet, et n'utilisera pas les données associées avecNPTS, et. ARIMA ETS Si des données de séries chronologiques relatives à l'historique sont fournies, Forecast utilisera les données associées avec CNN -QR, mais n'utilisera pas les données associées avec DeepAr+, Prophet,NPTS, ARIMA et. ETS