Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Planifiez vos flux de travail ML

Mode de mise au point
Planifiez vos flux de travail ML - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Avec Amazon SageMaker AI, vous pouvez gérer l'ensemble de votre flux de travail ML lorsque vous créez des ensembles de données, effectuez des transformations de données, créez des modèles à partir de données et déployez vos modèles sur des points de terminaison à des fins d'inférence. Si vous effectuez régulièrement un sous-ensemble d'étapes de votre flux de travail, vous pouvez également choisir d'exécuter ces étapes selon un calendrier. Par exemple, vous pouvez planifier une tâche dans SageMaker Canvas pour exécuter une transformation sur de nouvelles données toutes les heures. Dans un autre scénario, vous souhaiterez peut-être planifier une tâche hebdomadaire pour surveiller la dérive du modèle que vous avez déployé. Vous pouvez définir un calendrier récurrent pour n'importe quel intervalle de temps : vous pouvez itérer toutes les secondes, toutes les minutes, tous les jours, toutes les semaines, tous les mois ou le 3e vendredi de chaque mois à 15 heures.

Les scénarios suivants résument les options qui s'offrent à vous en fonction de votre cas d'utilisation.
  • Cas d'utilisation 1 : créez et planifiez votre flux de travail ML dans un environnement sans code. Pour les débutants ou les novices en matière d' SageMaker IA, vous pouvez utiliser Amazon SageMaker Canvas pour créer votre flux de travail ML et créer des exécutions planifiées à l'aide du planificateur basé sur l'interface utilisateur de Canvas.

  • Cas d'utilisation 2 : créez votre flux de travail dans un seul bloc-notes Jupyter et utilisez un planificateur sans code. Les praticiens expérimentés du ML peuvent utiliser du code pour créer leur flux de travail ML dans un bloc-notes Jupyter et utiliser l'option de planification sans code disponible avec le widget Notebook Jobs. Si votre flux de travail ML se compose de plusieurs blocs-notes Jupyter, vous pouvez utiliser la fonctionnalité de planification du SDK Python Pipelines décrite dans le cas d'utilisation 3.

  • Cas d'utilisation 3 : créez et planifiez votre flux de travail ML à l'aide de Pipelines. Les utilisateurs avancés peuvent utiliser le SDK Amazon SageMaker Python ou les options de EventBridge planification Amazon disponibles avec Pipelines. Vous pouvez créer un flux de travail ML composé d'étapes comprenant des opérations avec divers AWS services et fonctionnalités d' SageMaker IA, tels qu'Amazon EMR.

Descripteur Cas d'utilisation 1 Cas d'utilisation 2 Cas d'utilisation 3
SageMaker Fonctionnalité d'IA Traitement des données Amazon SageMaker Canvas et planification du flux de travail ML Widget de planification des tâches liées aux ordinateurs portables (interface utilisateur) Options de planification du SDK Python Pipelines
Description Avec Amazon SageMaker Canvas, vous pouvez planifier des exécutions automatiques des étapes de traitement des données et, dans le cadre d'une procédure distincte, des mises à jour automatiques des ensembles de données. Vous pouvez également planifier indirectement l'ensemble de votre flux de travail ML en configurant une configuration qui exécute une prédiction par lots chaque fois qu'un ensemble de données spécifique est mis à jour. Pour le traitement automatique des données et les mises à jour des ensembles de données, SageMaker Canvas fournit un formulaire de base dans lequel vous sélectionnez une heure et une date de début ainsi qu'un intervalle de temps entre les exécutions (ou une expression cron si vous planifiez une étape de traitement des données). Pour plus d'informations sur la planification des étapes de traitement des données, consultezCréez un calendrier pour traiter automatiquement les nouvelles données. Pour plus d'informations sur la planification des mises à jour des ensembles de données et des prédictions par lots, consultezComment gérer les automatisations. Si vous avez créé votre flux de travail de traitement des données et de pipeline dans un seul bloc-notes Jupyter, vous pouvez utiliser le widget Notebook Jobs pour exécuter votre bloc-notes à la demande ou selon un calendrier. Le widget Notebook Jobs affiche un formulaire de base dans lequel vous spécifiez le type de calcul, le calendrier d'exécution et les paramètres personnalisés facultatifs. Vous définissez votre programme de course en sélectionnant un intervalle basé sur le temps ou en insérant une expression cron. Le widget est automatiquement installé dans Studio, ou vous pouvez effectuer une installation supplémentaire pour utiliser cette fonctionnalité dans votre JupyterLab environnement local. Pour plus d'informations sur Notebook Jobs, consultezSageMaker Emplois sur ordinateur portable. Vous pouvez utiliser les fonctionnalités de planification du SDK SageMaker AI si vous avez implémenté votre flux de travail ML avec Pipelines. Votre pipeline peut inclure des étapes telles que le réglage précis, le traitement des données et le déploiement. Pipelines propose deux méthodes de planification de votre pipeline. Vous pouvez créer une EventBridge règle Amazon ou utiliser le PipelineScheduleconstructeur du SDK SageMaker AI pour définir un calendrier. Pour plus d'informations sur les options de planification disponibles dans Pipelines, consultezPlanifier les exécutions du pipeline.
Optimisé pour Fournit une option de planification pour un flux de travail SageMaker Canvas ML Fournit une option de planification basée sur l'interface utilisateur pour les flux de travail ML basés sur Jupyter Notebook Fournit un SDK d' SageMaker IA ou une option de EventBridge planification pour les flux de travail ML
Considérations Vous pouvez planifier votre flux de travail avec le framework sans code Canvas, mais les mises à jour des ensembles de données et les mises à jour des transformations par lots peuvent gérer jusqu'à 5 Go de données. Vous pouvez planifier un bloc-notes à l'aide du formulaire de planification basé sur l'interface utilisateur, mais pas plusieurs blocs-notes dans le même travail. Pour planifier plusieurs blocs-notes, utilisez la solution basée sur le code du SDK Pipelines décrite dans le cas d'utilisation 3. Vous pouvez utiliser les fonctionnalités de planification plus avancées (basées sur le SDK) fournies par Pipelines, mais vous devez vous référer à la documentation de l'API pour spécifier les options correctes plutôt que de les sélectionner dans un menu d'options basé sur l'interface utilisateur.
Environnement recommandé Amazon SageMaker Canvas Studio, JupyterLab environnement local Studio, JupyterLab environnement local, n'importe quel éditeur de code

Ressources supplémentaires

SageMaker L'IA propose les options supplémentaires suivantes pour planifier vos flux de travail.
ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.