Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Avec Amazon SageMaker AI, vous pouvez gérer l'ensemble de votre flux de travail ML lorsque vous créez des ensembles de données, effectuez des transformations de données, créez des modèles à partir de données et déployez vos modèles sur des points de terminaison à des fins d'inférence. Si vous effectuez régulièrement un sous-ensemble d'étapes de votre flux de travail, vous pouvez également choisir d'exécuter ces étapes selon un calendrier. Par exemple, vous pouvez planifier une tâche dans SageMaker Canvas pour exécuter une transformation sur de nouvelles données toutes les heures. Dans un autre scénario, vous souhaiterez peut-être planifier une tâche hebdomadaire pour surveiller la dérive du modèle que vous avez déployé. Vous pouvez définir un calendrier récurrent pour n'importe quel intervalle de temps : vous pouvez itérer toutes les secondes, toutes les minutes, tous les jours, toutes les semaines, tous les mois ou le 3e vendredi de chaque mois à 15 heures.
Les scénarios suivants résument les options qui s'offrent à vous en fonction de votre cas d'utilisation.
Cas d'utilisation 1 : créez et planifiez votre flux de travail ML dans un environnement sans code. Pour les débutants ou les novices en matière d' SageMaker IA, vous pouvez utiliser Amazon SageMaker Canvas pour créer votre flux de travail ML et créer des exécutions planifiées à l'aide du planificateur basé sur l'interface utilisateur de Canvas.
Cas d'utilisation 2 : créez votre flux de travail dans un seul bloc-notes Jupyter et utilisez un planificateur sans code. Les praticiens expérimentés du ML peuvent utiliser du code pour créer leur flux de travail ML dans un bloc-notes Jupyter et utiliser l'option de planification sans code disponible avec le widget Notebook Jobs. Si votre flux de travail ML se compose de plusieurs blocs-notes Jupyter, vous pouvez utiliser la fonctionnalité de planification du SDK Python Pipelines décrite dans le cas d'utilisation 3.
Cas d'utilisation 3 : créez et planifiez votre flux de travail ML à l'aide de Pipelines. Les utilisateurs avancés peuvent utiliser le SDK Amazon SageMaker Python
ou les options de EventBridge planification Amazon disponibles avec Pipelines. Vous pouvez créer un flux de travail ML composé d'étapes comprenant des opérations avec divers AWS services et fonctionnalités d' SageMaker IA, tels qu'Amazon EMR.
Descripteur | Cas d'utilisation 1 | Cas d'utilisation 2 | Cas d'utilisation 3 |
---|---|---|---|
SageMaker Fonctionnalité d'IA | Traitement des données Amazon SageMaker Canvas et planification du flux de travail ML | Widget de planification des tâches liées aux ordinateurs portables (interface utilisateur) | Options de planification du SDK Python Pipelines |
Description | Avec Amazon SageMaker Canvas, vous pouvez planifier des exécutions automatiques des étapes de traitement des données et, dans le cadre d'une procédure distincte, des mises à jour automatiques des ensembles de données. Vous pouvez également planifier indirectement l'ensemble de votre flux de travail ML en configurant une configuration qui exécute une prédiction par lots chaque fois qu'un ensemble de données spécifique est mis à jour. Pour le traitement automatique des données et les mises à jour des ensembles de données, SageMaker Canvas fournit un formulaire de base dans lequel vous sélectionnez une heure et une date de début ainsi qu'un intervalle de temps entre les exécutions (ou une expression cron si vous planifiez une étape de traitement des données). Pour plus d'informations sur la planification des étapes de traitement des données, consultezCréez un calendrier pour traiter automatiquement les nouvelles données. Pour plus d'informations sur la planification des mises à jour des ensembles de données et des prédictions par lots, consultezComment gérer les automatisations. | Si vous avez créé votre flux de travail de traitement des données et de pipeline dans un seul bloc-notes Jupyter, vous pouvez utiliser le widget Notebook Jobs pour exécuter votre bloc-notes à la demande ou selon un calendrier. Le widget Notebook Jobs affiche un formulaire de base dans lequel vous spécifiez le type de calcul, le calendrier d'exécution et les paramètres personnalisés facultatifs. Vous définissez votre programme de course en sélectionnant un intervalle basé sur le temps ou en insérant une expression cron. Le widget est automatiquement installé dans Studio, ou vous pouvez effectuer une installation supplémentaire pour utiliser cette fonctionnalité dans votre JupyterLab environnement local. Pour plus d'informations sur Notebook Jobs, consultezSageMaker Emplois sur ordinateur portable. | Vous pouvez utiliser les fonctionnalités de planification du SDK SageMaker AI si vous avez implémenté votre flux de travail ML avec Pipelines. Votre pipeline peut inclure des étapes telles que le réglage précis, le traitement des données et le déploiement. Pipelines propose deux méthodes de planification de votre pipeline. Vous pouvez créer une EventBridge règle Amazon ou utiliser le PipelineSchedule |
Optimisé pour | Fournit une option de planification pour un flux de travail SageMaker Canvas ML | Fournit une option de planification basée sur l'interface utilisateur pour les flux de travail ML basés sur Jupyter Notebook | Fournit un SDK d' SageMaker IA ou une option de EventBridge planification pour les flux de travail ML |
Considérations | Vous pouvez planifier votre flux de travail avec le framework sans code Canvas, mais les mises à jour des ensembles de données et les mises à jour des transformations par lots peuvent gérer jusqu'à 5 Go de données. | Vous pouvez planifier un bloc-notes à l'aide du formulaire de planification basé sur l'interface utilisateur, mais pas plusieurs blocs-notes dans le même travail. Pour planifier plusieurs blocs-notes, utilisez la solution basée sur le code du SDK Pipelines décrite dans le cas d'utilisation 3. | Vous pouvez utiliser les fonctionnalités de planification plus avancées (basées sur le SDK) fournies par Pipelines, mais vous devez vous référer à la documentation de l'API pour spécifier les options correctes plutôt que de les sélectionner dans un menu d'options basé sur l'interface utilisateur. |
Environnement recommandé | Amazon SageMaker Canvas | Studio, JupyterLab environnement local | Studio, JupyterLab environnement local, n'importe quel éditeur de code |
Ressources supplémentaires
SageMaker L'IA propose les options supplémentaires suivantes pour planifier vos flux de travail.
Qu'est-ce qu'Amazon EventBridge Scheduler ? . Les options de planification décrites dans cette section incluent des options prédéfinies disponibles dans SageMaker Canvas, Studio et le SDK SageMaker AI Python. Toutes les options étendent les fonctionnalités d'Amazon EventBridge, et vous pouvez également créer votre propre solution de planification personnalisée avec EventBridge.
Exécutions planifiées et basées sur des événements pour les pipelines de processeurs de fonctionnalités. Avec Amazon SageMaker Feature Store Feature Processing, vous pouvez configurer vos pipelines de traitement des fonctionnalités pour qu'ils s'exécutent selon un calendrier ou à la suite d'un autre événement de AWS service.