— tipi di dati —Pianificazione — operazioni —UpdateCrawlerSchedule (update_crawler_schedule)StartCrawlerSchedule (start_crawler_schedule)StopCrawlerSchedule (stop_crawler_schedule)

API del pianificatore del crawler

L'API del pianificatore del crawler descrive i tipi di dati delle ricerche per indicizzazione AWS Glue e l'API per la loro creazione, eliminazione, aggiornamento ed elenco.

Tipi di dati

Struttura della pianificazione

Struttura della pianificazione

Oggetto di pianificazione che utilizza una dichiarazione cron per pianificare un evento.

Campi

ScheduleExpression: stringa UTF-8.

Espressione cron usata per specificare la pianificazione (consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare: cron(15 12 * * ? *).
State: stringa UTF-8 (valori validi: SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

Lo stato della pianificazione.

Operazioni

Operazione UpdateCrawlerSchedule (Python: update_crawler_schedule)
Operazione StartCrawlerSchedule (Python: start_crawler_schedule)
Operazione StopCrawlerSchedule (Python: stop_crawler_schedule)

Operazione UpdateCrawlerSchedule (Python: update_crawler_schedule)

Aggiorna la pianificazione di un crawler utilizzando un'espressione cron.

Richiesta

CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

Nome del crawler la cui programmazione è da aggiornare.
Schedule: stringa UTF-8.

Espressione cron aggiornata usata per specificare la pianificazione, consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare: cron(15 12 * * ? *).

Risposta

Nessun parametro di risposta.

Errori

EntityNotFoundException
InvalidInputException
VersionMismatchException
SchedulerTransitioningException
OperationTimeoutException

Operazione StartCrawlerSchedule (Python: start_crawler_schedule)

Cambia lo stato della pianificazione del crawler specificato su SCHEDULED, a meno che il crawler non sia già in esecuzione o lo stato della pianificazione sia già impostata su SCHEDULED.

Richiesta

CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

Nome del crawler da pianificare.

Risposta

Nessun parametro di risposta.

Errori

EntityNotFoundException
SchedulerRunningException
SchedulerTransitioningException
NoScheduleException
OperationTimeoutException

Operazione StopCrawlerSchedule (Python: stop_crawler_schedule)

Imposta lo stato della pianificazione del crawler specificato su NOT_SCHEDULED, ma non arresta il crawler se è già in esecuzione.

Richiesta

CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

Nome del crawler il cui stato della programmazione è da impostare.

Risposta

Nessun parametro di risposta.

Errori

EntityNotFoundException
SchedulerNotRunningException
SchedulerTransitioningException
OperationTimeoutException

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Statistiche delle colonne

Script ETL auto-generanti