Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
API du planificateur du crawler
L'API Planificateur du crawler décrit les types de données des crawlers AWS Glue, ainsi que l'API permettant de créer, supprimer, mettre à jour et répertorier les crawlers.
Types de données
Structure du planificateur
Objet de planification utilisant une instruction cron
pour planifier un événement.
Champs
-
ScheduleExpression
– Chaîne UTF-8.Une expression
cron
utilisée pour spécifier la planification (consultez Time-Based Schedules for Jobs and Crawlers (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier :cron(15 12 * * ? *)
. -
State
– Chaîne UTF-8 (valeurs valides :SCHEDULED
|NOT_SCHEDULED
|TRANSITIONING
).État de la planification.
Opérations
Action UpdatecrawlerSchedule (Python : update_crawler_schedule)
Met à jour la planification d'un crawler à l'aide d'une expression cron
.
Requête
-
CrawlerName
– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler dont la planification doit être mise à jour.
-
Schedule
– Chaîne UTF-8.L'expression
cron
mise à jour utilisée pour spécifier la planification (voir Planifications temporelles pour les tâches et les crawlers). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier :cron(15 12 * * ? *)
.
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundException
InvalidInputException
VersionMismatchException
SchedulerTransitioningException
OperationTimeoutException
Action StartcrawlerSchedule (Python : start_crawler_schedule)
Modifie l'état de la planification pour l'crawler spécifié par SCHEDULED
, sauf si l'crawler est déjà en cours d'exécution ou si l'état de la planification est déjà SCHEDULED
.
Requête
-
CrawlerName
– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler à planifier.
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundException
SchedulerRunningException
SchedulerTransitioningException
NoScheduleException
OperationTimeoutException
Action StopcrawlerSchedule (Python : stop_crawler_schedule)
Définit l'état de la planification de l'crawler spécifié sur NOT_SCHEDULED
, mais n'arrête pas l'crawler s'il est déjà en cours d'exécution.
Requête
-
CrawlerName
– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler dont l'état de la planification doit être défini.
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundException
SchedulerNotRunningException
SchedulerTransitioningException
OperationTimeoutException