API du planificateur du crawler - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

API du planificateur du crawler

L'API Planificateur du crawler décrit les types de données des crawlers AWS Glue, ainsi que l'API permettant de créer, supprimer, mettre à jour et répertorier les crawlers.

Types de données

Structure du planificateur

Objet de planification utilisant une instruction cron pour planifier un événement.

Champs
  • ScheduleExpression – Chaîne UTF-8.

    Une expression cron utilisée pour spécifier la planification (consultez Time-Based Schedules for Jobs and Crawlers (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : cron(15 12 * * ? *).

  • State – Chaîne UTF-8 (valeurs valides : SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

    État de la planification.

Opérations

Action UpdatecrawlerSchedule (Python : update_crawler_schedule)

Met à jour la planification d'un crawler à l'aide d'une expression cron.

Requête
  • CrawlerNameObligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de l'crawler dont la planification doit être mise à jour.

  • Schedule – Chaîne UTF-8.

    L'expression cron mise à jour utilisée pour spécifier la planification (voir Planifications temporelles pour les tâches et les crawlers). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : cron(15 12 * * ? *).

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • SchedulerTransitioningException

  • OperationTimeoutException

Action StartcrawlerSchedule (Python : start_crawler_schedule)

Modifie l'état de la planification pour l'crawler spécifié par SCHEDULED, sauf si l'crawler est déjà en cours d'exécution ou si l'état de la planification est déjà SCHEDULED.

Requête
  • CrawlerNameObligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de l'crawler à planifier.

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • EntityNotFoundException

  • SchedulerRunningException

  • SchedulerTransitioningException

  • NoScheduleException

  • OperationTimeoutException

Action StopcrawlerSchedule (Python : stop_crawler_schedule)

Définit l'état de la planification de l'crawler spécifié sur NOT_SCHEDULED, mais n'arrête pas l'crawler s'il est déjà en cours d'exécution.

Requête
  • CrawlerNameObligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de l'crawler dont l'état de la planification doit être défini.

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • EntityNotFoundException

  • SchedulerNotRunningException

  • SchedulerTransitioningException

  • OperationTimeoutException