Crawler-Scheduler-API - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Crawler-Scheduler-API

Die Crawler-Scheduler-API beschreibt AWS Glue-Crawler-Datentypen zusammen mit der API zum Erstellen, Löschen, Aktualisieren und Auflisten von Crawlern.

Datentypen

Planstruktur

Ein Planungsobjekt, das eine cron-Anweisung zum Planen eines Ereignisses verwendet.

Felder
  • ScheduleExpression – UTF-8-Zeichenfolge.

    Ein cron-Ausdruck, der verwendet wird, um den Zeitplan festzulegen (siehe Zeitbasierte Pläne für Aufträge und Crawler). Wenn Sie beispielsweise etwas täglich um 12:15 UTC ausführen möchten, würden Sie Folgendes angeben: cron(15 12 * * ? *).

  • State – UTF-8-Zeichenfolge (zulässige Werte: SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

    Der Status des Zeitplans.

Operationen

Aktion UpdateCrawlerSchedule (Python: update_crawler_schedule)

Aktualisiert den Zeitplan eines Crawlers über einen cron-Ausdruck.

Anfrage
  • CrawlerNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Name des Crawlers, dessen Zeitplan aktualisiert werden soll.

  • Schedule – UTF-8-Zeichenfolge.

    Der aktualisierte cron-Ausdruck, der verwendet wird, um den Zeitplan anzugeben (siehe Zeitpläne für Aufträge und Crawler). Wenn Sie beispielsweise etwas täglich um 12:15 UTC ausführen möchten, würden Sie Folgendes angeben: cron(15 12 * * ? *).

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • SchedulerTransitioningException

  • OperationTimeoutException

Aktion StartCrawlerSchedule (Python: start_crawler_schedule)

Ändert den Planungsstatus des angegebenen Crawlers zu SCHEDULED, sofern der Crawler nicht bereits ausgeführt wird oder der Planungsstatus nicht bereits SCHEDULED lautet.

Anfrage
  • CrawlerNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Name des Crawlers, der geplant werden soll.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • SchedulerRunningException

  • SchedulerTransitioningException

  • NoScheduleException

  • OperationTimeoutException

Aktion StopCrawlerSchedule (Python: stop_crawler_schedule)

Legt den Planungsstatus des angegebenen Crawlers auf NOT_SCHEDULED fest, stoppt den Crawler jedoch nicht, wenn er bereits ausgeführt wird.

Anfrage
  • CrawlerNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Name des Crawlers, dessen Planungsstatus festgelegt werden soll.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • SchedulerNotRunningException

  • SchedulerTransitioningException

  • OperationTimeoutException