Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »
Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Algorithme CNN-QR
Amazon Forecast Forecasting CNN-QR, Convolutional Neural Network - Quantile Regression, est un algorithme d'apprentissage automatique propriétaire pour les prédictions de séries temporelles scalaires (unidimensionnelles) à l'aide de réseaux neuronaux convolutifs (CNN) causaux. Cet algorithme d'apprentissage supervisé entraîne un modèle global à partir d'une vaste collection de séries chronologiques et utilise un décodeur quantile pour effectuer des prédictions probabilistes.
Rubriques
Mise en route avec CNN-QR
Vous pouvez entraîner un prédicteur avec CNN-QR de deux manières :
-
Sélection manuelle de l'algorithme CNN-QR.
-
Choisir AutoML (CNN-QR fait partie d'AutoML).
Si vous ne savez pas quel algorithme utiliser, nous vous recommandons de sélectionner AutoML, et Forecast sélectionnera CNN-QR s'il s'agit de l'algorithme le plus précis pour vos données. Pour savoir si CNN-QR a été sélectionné comme modèle le plus précis, utilisez l'DescribePredictorAPI ou choisissez le nom du prédicteur dans la console.
Voici quelques cas d'utilisation clés de CNN-QR :
-
Forecast l'aide d'ensembles de données volumineux et complexes : CNN-QR fonctionne mieux lorsqu'il est formé avec des ensembles de données volumineux et complexes. Le réseau neuronal peut apprendre à travers de nombreux ensembles de données, ce qui est utile lorsque vous disposez de séries chronologiques et de métadonnées d'éléments connexes.
-
Prévisions avec séries chronologiques historiques connexes - CNN-QR n'exige pas que les séries chronologiques associées contiennent des points de données compris dans l'horizon de Forecast. Cette flexibilité accrue vous permet d'inclure un plus large éventail de séries chronologiques et de métadonnées d'articles connexes, telles que le prix des articles, les événements, les statistiques Web et les catégories de produits.
Comment fonctionne CNN-QR
CNN-QR est un modèle sequence-to-sequence (Seq2Seq) de prévision probabiliste qui teste dans quelle mesure une prédiction reconstruit la séquence de décodage, en fonction de la séquence de codage.
L'algorithme permet différentes fonctionnalités dans les séquences d'encodage et de décodage. Vous pouvez donc utiliser une série chronologique associée dans l'encodeur et l'omettre dans le décodeur (et vice versa). Par défaut, les séries chronologiques associées avec des points de données dans l'horizon de prévision seront incluses à la fois dans l'encodeur et dans le décodeur. Les séries chronologiques associées sans points de données dans l'horizon de prévision seront uniquement incluses dans l'encodeur.
CNN-QR effectue une régression quantile avec un CNN causal hiérarchique servant d'extracteur de caractéristiques apprenable.
Pour faciliter les modèles d'apprentissage dépendant du temps, tels que les pics pendant les week-ends, CNN-QR crée automatiquement des séries chronologiques de fonctionnalités basées sur la granularité des séries chronologiques. Par exemple, CNN-QR crée deux séries chronologiques de caractéristiques (day-of-month et day-of-year) à une fréquence hebdomadaire. L'algorithme utilise ces séries temporelles de caractéristiques dérivées avec les séries temporelles de caractéristiques personnalisées fournies au cours de l'entraînement et de l'inférence. L'exemple suivant montre une série chronologique cible et deux fonctionnalités dérivées de séries chronologiques :ui,1,t
représente l'heure du jour etui,2,t
représente le jour de la semaine.zi,t
CNN-QR inclut automatiquement ces séries chronologiques de fonctionnalités en fonction de la fréquence des données et de la taille des données d'entraînement. Le tableau suivant répertorie les fonctions qui peuvent être obtenues pour chaque fréquence de temps prise en charge.
Fréquence des séries chronologiques | Caractéristiques dérivées |
---|---|
Minute | minute-of-hour, hour-of-day, day-of-week, day-of-month, day-of-year |
Heure | hour-of-day, day-of-week, day-of-month, day-of-year |
jour | day-of-week, day-of-month, day-of-year |
semaine | week-of-month, week-of-year |
Mois | month-of-year |
Pendant l'entraînement, chaque série chronologique du jeu de données d'entraînement se compose de deux fenêtres contextuelles et prévisionnelles adjacentes avec des longueurs prédéfinies fixes. Cela est illustré dans la figure ci-dessous, où la fenêtre contextuelle est représentée en vert et la fenêtre de prévision est représentée en bleu.
Vous pouvez utiliser un modèle formé sur un ensemble d'entraînement donné pour générer des prévisions pour les séries chronologiques de l'ensemble d'entraînement et pour d'autres séries chronologiques. L'ensemble de données d'apprentissage consiste en une série chronologique cible, qui peut être associée à une liste de séries chronologiques et de métadonnées d'éléments connexes.
La figure ci-dessous montre comment cela fonctionne pour un élément d'un jeu de données d'entraînement indexé pari
. L'ensemble de données d'entraînement comprend une série chronologiquezi,t
cible et deux séries chronologiques associées,xi,1,t
etxi,2,t
. La première série chronologique connexe est une série chronologique prospective, et la seconde est une série chronologique historique.xi,1,t
xi,2,t
CNN-QR apprend à travers la série chronologique cible et les séries chronologiques associéesxi,1,t
etxi,2,t
, pour générer des prévisions dans la fenêtre de prévision, représentée par la ligne orange.zi,t
Utilisation de données connexes avec CNN-QR
Le CNNQR prend en charge les ensembles de données de séries chronologiques connexes historiques et prospectives. Si vous fournissez un jeu de données de séries chronologiques lié à l'avenir, toute valeur manquante sera remplie selon la méthode de remplissage future. Pour plus d'informations sur les séries chronologiques historiques et prospectives connexes, voir Utilisation d'ensembles de données de séries chronologiques connexes.
Vous pouvez également utiliser des ensembles de données de métadonnées d'articles avec CNN-QR. Il s'agit d'ensembles de données contenant des informations statiques sur les éléments de votre série chronologique cible. Les métadonnées des éléments sont particulièrement utiles pour les scénarios de prévision à froid dans lesquels il existe peu ou pas de données historiques. Pour plus d'informations sur les métadonnées des éléments, voir Métadonnées des éléments.
Hyperparamètres CNN-QR
Amazon Forecast optimise les modèles CNN-QR sur des hyperparamètres sélectionnés. Lorsque vous sélectionnez CNN-QR manuellement, vous avez la possibilité de transmettre des paramètres d'apprentissage pour ces hyperparamètres. Le tableau suivant répertorie les hyperparamètres réglables de l'algorithme CNN-QR.
Nom du paramètre | Valeurs | Description |
---|---|---|
context_length |
|
Le nombre de points temporels que le modèle lit avant de faire des prédictions. En général, CNN-QR a des valeurs supérieures à Si la valeur pour |
use_related_data |
|
Détermine les types de données chronologiques connexes à inclure dans le modèle. Choisissez l'une des quatre options suivantes :
|
use_item_metadata |
|
Détermine si le modèle inclut les métadonnées des éléments. Choisissez l'une des deux options suivantes :
|
epochs |
|
Nombre maximum de passages complets sur les données d'entraînement. Les petits ensembles de données nécessitent plus d'époques. Pour les valeurs élevées de |
Optimisation des hyperparamètres (HPO)
L'optimisation des hyperparamètres (HPO) consiste à sélectionner les valeurs d'hyperparamètres optimales pour un objectif d'apprentissage spécifique. Avec Forecast, vous pouvez automatiser ce processus de deux manières :
-
En choisissant AutoML, HPO s'exécutera automatiquement pour CNN-QR.
-
Sélection manuelle de CNN-QR et réglage
PerformHPO = TRUE
.
L'ajout de séries chronologiques et de métadonnées d'articles connexes n'améliore pas toujours la précision de votre modèle CNN-QR. Lorsque vous exécutez AutoML ou activez HPO, CNN-QR teste la précision de votre modèle avec et sans les séries chronologiques et les métadonnées d'éléments connexes fournies, et sélectionne le modèle avec la plus grande précision.
Amazon Forecast optimise automatiquement les trois hyperparamètres suivants lors d'une HPO et vous fournit les valeurs d'entraînement finales :
-
context_length : détermine jusqu'où le réseau peut voir dans le passé. Le processus HPO définit automatiquement une valeur
context_length
qui maximise la précision du modèle, tout en tenant compte du temps de formation. -
use_related_data : détermine les formes de données de séries chronologiques connexes à inclure dans votre modèle. Le processus HPO vérifie automatiquement si les données de vos séries chronologiques associées améliorent le modèle et sélectionne le réglage optimal.
-
use_item_metadata : détermine s'il faut inclure les métadonnées des éléments dans votre modèle. Le processus HPO vérifie automatiquement si les métadonnées de votre article améliorent le modèle et choisit le paramètre optimal.
Note
Si la fonctionHoliday
supplémentaireuse_related_data
est sélectionnéeNONE
ouHISTORICAL
si elle est sélectionnée, cela signifie que l'inclusion des données relatives aux vacances n'améliore pas la précision du modèle.
Vous pouvez définir la configuration HPO pour l'context_length
hyperparamètre si vous la définissezPerformHPO = TRUE
lors de la sélection manuelle. Toutefois, vous ne pouvez modifier aucun aspect de la configuration HPO si vous choisissez AutoML. Pour plus d'informations sur la configuration HPO, consultez l'IntergerParameterRangeAPI.
Conseils et bonnes pratiques
Évitez les valeurs élevées pour ForecastHorizon - L'utilisation de valeurs supérieures à 100 augmente leForecastHorizon
temps d'entraînement et peut réduire la précision du modèle. Si vous souhaitez procéder à des prévisions plus lointaines, envisagez de regrouper vos données à une fréquence plus élevée. Par exemple, utilisez 5min
plutôt que 1min
.
Les CNN permettent une longueur de contexte plus longue. Avec CNN-QR, vous pouvez définir une valeurcontext_length
légèrement supérieure à celle de Deepar+, car les CNN sont généralement plus efficaces que les RNN.
Ingénierie des fonctionnalités des données associées : essayez différentes combinaisons de séries chronologiques et de métadonnées d'éléments connexes lors de l'entraînement de votre modèle, et évaluez si les informations supplémentaires améliorent la précision. Différentes combinaisons et transformations de séries chronologiques et de métadonnées d'éléments connexes produiront des résultats différents.
CNN-QR ne fait pas de prévisions au quantile moyen : lorsque vous le configurezForecastTypes
mean
avec l' CreateForecastAPI, les prévisions seront plutôt générées au quantile médian (0.5
ouP50
).