Prévisions de séries chronologiques dans Amazon SageMaker Canvas - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prévisions de séries chronologiques dans Amazon SageMaker Canvas

Note

Les modèles de prévision de séries temporelles ne sont pris en charge que pour les jeux de données tabulaires.

Amazon SageMaker Canvas vous permet d'utiliser des prévisions de séries chronologiques basées sur le machine learning. Les prédictions de séries temporelles vous permettent de faire des prédictions qui peuvent varier avec le temps.

Vous pouvez réaliser une prédiction de série temporelle pour les exemples suivants :

  • Prédire votre inventaire au cours des prochains mois.

  • Le nombre d'articles vendus au cours des quatre prochains mois.

  • L'effet de la réduction des prix sur les ventes pendant la période des fêtes.

  • Stock d'articles au cours des 12 prochains mois.

  • Nombre de clients entrant dans un magasin au cours des prochaines heures.

  • Prédire l'impact de la réduction de 10 % du prix d'un produit sur une période donnée.

Pour effectuer une prédiction de série temporelle, votre jeu de données doit comporter les éléments suivants :

  • Une colonne d'horodatage avec toutes les valeurs possédant le type datetime.

  • Une colonne cible qui contient les valeurs que vous utilisez pour prédire les valeurs futures.

  • Une colonne d'ID d'élément qui contient des identifiants uniques pour chaque élément de votre ensemble de données, tels que des SKU numéros.

Les valeurs datetime de la colonne d'horodatage doivent utiliser l'un des formats suivants :

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

Vous pouvez formuler des prévisions pour les intervalles suivants :

  • 1 min

  • 5 min

  • 15 min

  • 30 min

  • 1 heure

  • 1 jour

  • 1 semaine

  • 1 mois

  • 1 an

Valeurs futures de votre jeu de données en entrée

Canvas détecte automatiquement les colonnes de votre jeu de données susceptibles de contenir des valeurs futures. Si elles sont présentes, ces valeurs peuvent améliorer la précision des prévisions. Canvas marque ces colonnes spécifiques d'une Future values étiquette. Canvas déduit la relation entre les données de ces colonnes et la colonne cible que vous essayez de prévoir, et utilise cette relation pour générer des prévisions plus précises.

Par exemple, vous pouvez prévoir la quantité de glace vendue par un supermarché. Pour effectuer une prédiction, vous devez disposer d'une colonne d'horodatage et d'une colonne indiquant la quantité de glace vendue par le supermarché. Pour une prédiction plus précise, votre jeu de données peut également inclure le prix, la température ambiante, la saveur de la glace ou un identifiant unique pour la glace.

Les ventes de glace peuvent augmenter lorsqu'il fait plus chaud. Une baisse du prix de la glace peut entraîner une plus grande quantité d'unités vendues. Le fait d'avoir une colonne contenant des données sur la température ambiante et une colonne contenant des données de prix peut améliorer votre capacité à prédire le nombre d'unités de glace vendues par le supermarché.

Bien que la fourniture de valeurs futures soit facultative, elle vous permet d'effectuer des analyses hypothétiques directement dans l'application Canvas, en vous montrant comment les modifications des valeurs futures pourraient modifier vos prévisions.

Gestion des valeurs manquantes

Des données peuvent être manquantes pour différentes raisons. La raison de vos données manquantes peut indiquer comment vous souhaitez que Canvas les impute. Par exemple, votre organisation peut utiliser un système automatique qui ne les suit que lorsqu'une vente a lieu. Si vous utilisez un jeu de données provenant de ce type de système automatique, vous avez des valeurs manquantes dans la colonne cible.

Important

Si des valeurs sont manquantes dans la colonne cible, nous vous recommandons d'utiliser un ensemble de données qui n'en contient pas. SageMaker Canvas utilise la colonne cible pour prévoir les valeurs futures. Les valeurs manquantes dans la colonne cible peuvent réduire considérablement la précision de la prédiction.

Pour les valeurs manquantes dans le jeu de données, Canvas les impute automatiquement en remplissant la colonne cible 0 et les autres colonnes numériques avec la valeur médiane de la colonne.

Vous pouvez toutefois sélectionner votre propre logique de remplissage pour la colonne cible et les autres colonnes numériques de vos ensembles de données. Les directives et restrictions de remplissage des colonnes cibles sont différentes de celles des autres colonnes numériques. Les colonnes cibles sont remplies jusqu'à la fin de la période historique, tandis que les colonnes numériques sont remplies pour les périodes historiques et futures jusqu'à la fin de l'horizon de prévision. Canvas ne remplit les valeurs futures dans une colonne numérique que si vos données contiennent au moins un enregistrement avec un horodatage futur et une valeur pour cette colonne spécifique.

Vous pouvez choisir l'une des options de logique de remplissage suivantes pour imputer les valeurs manquantes à vos données :

  • zero— Remplissez avec0.

  • NaN— Remplir avec NaN, ou pas un chiffre. Ceci n'est pris en charge que pour la colonne cible.

  • mean— Remplissez avec la valeur moyenne de la série de données.

  • median— Remplissez avec la valeur médiane de la série de données.

  • min— Remplissez avec la valeur minimale de la série de données.

  • max— Remplissez avec la valeur maximale de la série de données.

Lorsque vous choisissez une logique de remplissage, vous devez tenir compte de la manière dont votre modèle interprète cette logique. Par exemple, dans un scénario de vente au détail, l'enregistrement de zéro vente d'un article disponible est différent de l'enregistrement de zéro vente d'un article indisponible, car ce dernier scénario n'implique pas nécessairement un manque d'intérêt du client pour l'article indisponible. Dans ce cas, le fait de 0 renseigner la colonne cible de l'ensemble de données risque de sous-biaiser les prévisions du modèle et de déduire un manque d'intérêt des clients pour les articles non disponibles. À l'inverse, le remplissage par NaN peut amener le modèle à ignorer les véritables occurrences où aucun article n'est vendu parmi les articles disponibles.

Types de prévisions

Vous pouvez créer l'un des types de prédiction suivants :

  • Élément unique

  • Tous les éléments

Pour une prévision pour tous les éléments de votre jeu de données, SageMaker Canvas renvoie une prévision pour les valeurs futures de chaque élément de votre ensemble de données.

Pour une prévision d'un seul article, vous spécifiez l'article et SageMaker Canvas renvoie une prévision pour les valeurs futures. La prédiction inclut un graphique linéaire qui trace les valeurs prédites au fil du temps.