Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Créez un calendrier pour traiter automatiquement les nouvelles données
La section suivante s'applique uniquement aux tâches SageMaker de traitement. Si vous avez utilisé les paramètres Canvas par défaut ou EMR Serverless pour créer une tâche distante afin d'appliquer des transformations à l'ensemble de votre ensemble de données, cette section ne s'applique pas.
Si vous traitez des données régulièrement, vous pouvez créer un calendrier pour exécuter automatiquement la tâche de traitement. Par exemple, vous créez une planification qui exécute automatiquement une tâche de traitement lorsque vous recevez de nouvelles données. Pour plus d'informations sur le traitement des tâches, consultezExporter vers Amazon S3.
Lorsque vous créez une tâche, vous devez spécifier un IAM rôle autorisé à créer la tâche. Vous pouvez utiliser cette AmazonSageMakerCanvasDataPrepFullAccesspolitique pour ajouter des autorisations.
Ajoutez la politique de confiance suivante au rôle pour EventBridge permettre de l'assumer.
{
"Effect": "Allow",
"Principal": {
"Service": "events.amazonaws.com"
},
"Action": "sts:AssumeRole"
}
Lorsque vous créez un planning, Data Wrangler crée un eventRule
in. EventBridge Des frais vous sont facturés à la fois pour les règles d'événement que vous créez et pour les instances utilisées pour exécuter la tâche de traitement.
Pour plus d'informations sur EventBridge les tarifs, consultez EventBridge les tarifs Amazon. Pour plus d'informations sur le traitement des tarifs des offres d'emploi, consultez Amazon SageMaker Pricing.
Vous pouvez définir une planification à l'aide d'une des méthodes suivantes :
Les sections suivantes décrivent les procédures relatives à la planification des tâches lors du remplissage des paramètres SageMaker des tâches de traitement lors de l'exportation de vos données vers Amazon S3. Toutes les instructions suivantes commencent dans la section Associer les plannings des paramètres des tâches de SageMaker traitement.
- CRON
-
Utilisez la procédure suivante pour créer un calendrier avec une CRON expression.
-
Dans le panneau latéral Exporter vers Amazon S3, assurez-vous que vous avez désactivé le bouton de configuration automatique des tâches et que l'option SageMaker Traitement est sélectionnée.
-
Dans les paramètres de la tâche de SageMaker traitement, ouvrez la section Associer les plannings et choisissez Create new schedule.
-
La boîte de dialogue Créer un nouveau calendrier s'ouvre. Dans le champ Schedule Name (Nom de la planification), indiquez le nom de la planification.
-
Pour Run Frequency, sélectionnez CRON.
-
Pour chacun des champs Minutes, Heures, Jours du mois, Mois et Jour de la semaine, entrez des valeurs CRON d'expression valides.
-
Sélectionnez Create (Créer).
-
(Facultatif) Choisissez Add another schedule (Ajouter une autre planification) pour exécuter la tâche selon une autre planification.
Vous pouvez associer un maximum de deux planifications. Les planifications sont indépendantes et ne s'influencent pas mutuellement, sauf si les heures se chevauchent.
-
Sélectionnez l'une des méthodes suivantes :
-
Planifier et exécuter maintenant : le travail s'exécute immédiatement et s'exécute ensuite selon les plannings.
-
Planification uniquement : la tâche s'exécute uniquement selon les plannings que vous spécifiez.
-
Choisissez Exporter après avoir renseigné les autres paramètres de la tâche d'exportation.
- RATE
-
Utilisez la procédure suivante pour créer un calendrier avec une RATE expression.
-
Dans le panneau latéral Exporter vers Amazon S3, assurez-vous que vous avez désactivé le bouton de configuration automatique des tâches et que l'option SageMaker Traitement est sélectionnée.
-
Dans les paramètres de la tâche de SageMaker traitement, ouvrez la section Associer les plannings et choisissez Create new schedule.
-
La boîte de dialogue Créer un nouveau calendrier s'ouvre. Dans le champ Schedule Name (Nom de la planification), indiquez le nom de la planification.
-
Pour Run Frequency (Fréquence d'exécution), choisissez Rate (Taux).
-
Pour Value (Valeur), spécifiez un entier.
-
Pour Unit (Unité), sélectionnez l'une des options suivantes :
-
Sélectionnez Create (Créer).
-
(Facultatif) Choisissez Add another schedule (Ajouter une autre planification) pour exécuter la tâche selon une autre planification.
Vous pouvez associer un maximum de deux planifications. Les planifications sont indépendantes et ne s'influencent pas mutuellement, sauf si les heures se chevauchent.
-
Sélectionnez l'une des méthodes suivantes :
-
Planifier et exécuter maintenant : le travail s'exécute immédiatement et s'exécute ensuite selon les plannings.
-
Planification uniquement : la tâche s'exécute uniquement selon les plannings que vous spécifiez.
-
Choisissez Exporter après avoir renseigné les autres paramètres de la tâche d'exportation.
- Recurring
-
Utilisez la procédure suivante pour créer une planification qui exécute une tâche de manière récurrente.
-
Dans le panneau latéral Exporter vers Amazon S3, assurez-vous que vous avez désactivé le bouton de configuration automatique des tâches et que l'option SageMaker Traitement est sélectionnée.
-
Dans les paramètres de la tâche de SageMaker traitement, ouvrez la section Associer les plannings et choisissez Create new schedule.
-
La boîte de dialogue Créer un nouveau calendrier s'ouvre. Dans le champ Schedule Name (Nom de la planification), indiquez le nom de la planification.
-
Pour Fréquence d'exécution, choisissez Récurrent.
-
Dans le champ Every x hours (Toutes les x heures), spécifiez la fréquence horaire à laquelle la tâche s'exécute au cours de la journée. Les valeurs valides sont des nombres entiers compris entre 1
et 23
.
-
Pour On days (Journées), choisissez l'une des options suivantes :
-
Every Day (Tous les jours)
-
Weekends (Le week-end)
-
Weekdays (Jours de la semaine)
-
Select Days (Certains jours)
-
(Facultatif) Si vous avez sélectionné Select Days (Certains jours), choisissez les jours de la semaine où la tâche doit s'exécuter.
La planification est réinitialisée tous les jours. Si vous planifiez une tâche pour qu'elle s'exécute toutes les cinq heures, elle s'exécute aux heures suivantes au cours de la journée :
-
00:00
-
05:00
-
10 h 00
-
15h00
-
20h00
-
Sélectionnez Create (Créer).
-
(Facultatif) Choisissez Add another schedule (Ajouter une autre planification) pour exécuter la tâche selon une autre planification.
Vous pouvez associer un maximum de deux planifications. Les planifications sont indépendantes et ne s'influencent pas mutuellement, sauf si les heures se chevauchent.
-
Sélectionnez l'une des méthodes suivantes :
-
Planifier et exécuter maintenant : le travail s'exécute immédiatement et s'exécute ensuite selon les plannings.
-
Planification uniquement : la tâche s'exécute uniquement selon les plannings que vous spécifiez.
-
Choisissez Exporter après avoir renseigné les autres paramètres de la tâche d'exportation.
- Specific time
-
Utilisez la procédure suivante pour créer une planification qui exécute une tâche à des heures spécifiques.
-
Dans le panneau latéral Exporter vers Amazon S3, assurez-vous que vous avez désactivé le bouton de configuration automatique des tâches et que l'option SageMaker Traitement est sélectionnée.
-
Dans les paramètres de la tâche de SageMaker traitement, ouvrez la section Associer les plannings et choisissez Create new schedule.
-
La boîte de dialogue Créer un nouveau calendrier s'ouvre. Dans le champ Schedule Name (Nom de la planification), indiquez le nom de la planification.
-
Pour Fréquence d'exécution, choisissez Heure de début.
-
Pour Heure de début, entrez une heure au UTC format (par exemple,09:00
). L'heure de début correspond par défaut au fuseau horaire dans lequel vous vous trouvez.
-
Pour On days (Journées), choisissez l'une des options suivantes :
-
Every Day (Tous les jours)
-
Weekends (Le week-end)
-
Weekdays (Jours de la semaine)
-
Select Days (Certains jours)
-
(Facultatif) Si vous avez sélectionné Select Days (Certains jours), choisissez les jours de la semaine où la tâche doit s'exécuter.
-
Sélectionnez Create (Créer).
-
(Facultatif) Choisissez Add another schedule (Ajouter une autre planification) pour exécuter la tâche selon une autre planification.
Vous pouvez associer un maximum de deux planifications. Les planifications sont indépendantes et ne s'influencent pas mutuellement, sauf si les heures se chevauchent.
-
Sélectionnez l'une des méthodes suivantes :
-
Planifier et exécuter maintenant : le travail s'exécute immédiatement et s'exécute ensuite selon les plannings.
-
Planification uniquement : la tâche s'exécute uniquement selon les plannings que vous spécifiez.
-
Choisissez Exporter après avoir renseigné les autres paramètres de la tâche d'exportation.
Vous pouvez utiliser le SageMaker AWS Management Console pour afficher les tâches dont l'exécution est planifiée. Vos tâches de traitement s'exécutent dans Pipelines. Chaque tâche de traitement possède son propre pipeline. Elle s'exécute en tant qu'étape de traitement dans le pipeline. Vous pouvez consulter les planifications que vous avez créées dans un pipeline. Pour plus d'informations sur l'affichage d'un pipeline, veuillez consulter Afficher les détails d'un pipeline.
Utilisez la procédure suivante pour afficher les tâches que vous avez planifiées.
Pour afficher les tâches que vous avez planifiées, procédez comme suit.
-
Ouvrez Amazon SageMaker Studio Classic.
-
Canalisations ouvertes
-
Consultez les pipelines des tâches que vous avez créées.
Le pipeline qui exécute la tâche utilise le nom de la tâche en tant que préfixe. Par exemple, si vous avez créé une tâche nommée housing-data-feature-enginnering
, le nom du pipeline est canvas-data-prep-housing-data-feature-engineering
.
-
Choisissez le pipeline contenant votre tâche.
-
Consultez l'état des pipelines. Les pipelines dont le champ Status (État) indique Succeeded (Réussi) ont correctement exécuté la tâche de traitement.
Pour arrêter l'exécution de la tâche de traitement, procédez comme suit :
Pour arrêter l'exécution d'une tâche de traitement, supprimez la règle d'événement qui spécifie la planification. La suppression d'une règle d'événement arrête l'exécution de toutes les tâches associées à la planification. Pour plus d'informations sur la suppression d'une règle, consultez la section Désactivation ou suppression d'une EventBridge règle Amazon.
Vous pouvez également arrêter et supprimer les pipelines associés aux planifications. Pour plus d'informations sur l'arrêt d'un pipeline, consultez StopPipelineExecution. Pour plus d'informations sur la suppression d'un pipeline, consultez DeletePipeline.