API del pianificatore del crawler - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

API del pianificatore del crawler

L'API del pianificatore del crawler descrive i tipi di dati delle ricerche per indicizzazione AWS Glue e l'API per la loro creazione, eliminazione, aggiornamento ed elenco.

Tipi di dati

Struttura della pianificazione

Oggetto di pianificazione che utilizza una dichiarazione cron per pianificare un evento.

Campi
  • ScheduleExpression: stringa UTF-8.

    Espressione cron usata per specificare la pianificazione (consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare: cron(15 12 * * ? *).

  • State: stringa UTF-8 (valori validi: SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

    Lo stato della pianificazione.

Operazioni

Operazione UpdateCrawlerSchedule (Python: update_crawler_schedule)

Aggiorna la pianificazione di un crawler utilizzando un'espressione cron.

Richiesta
  • CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome del crawler la cui programmazione è da aggiornare.

  • Schedule: stringa UTF-8.

    Espressione cron aggiornata usata per specificare la pianificazione, consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare: cron(15 12 * * ? *).

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • SchedulerTransitioningException

  • OperationTimeoutException

Operazione StartCrawlerSchedule (Python: start_crawler_schedule)

Cambia lo stato della pianificazione del crawler specificato su SCHEDULED, a meno che il crawler non sia già in esecuzione o lo stato della pianificazione sia già impostata su SCHEDULED.

Richiesta
  • CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome del crawler da pianificare.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • SchedulerRunningException

  • SchedulerTransitioningException

  • NoScheduleException

  • OperationTimeoutException

Operazione StopCrawlerSchedule (Python: stop_crawler_schedule)

Imposta lo stato della pianificazione del crawler specificato su NOT_SCHEDULED, ma non arresta il crawler se è già in esecuzione.

Richiesta
  • CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Nome del crawler il cui stato della programmazione è da impostare.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • SchedulerNotRunningException

  • SchedulerTransitioningException

  • OperationTimeoutException