Crea una pianificazione per elaborare automaticamente i nuovi dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea una pianificazione per elaborare automaticamente i nuovi dati

Nota

La sezione seguente si applica solo ai lavori di SageMaker elaborazione. Se hai utilizzato le impostazioni predefinite di Canvas o EMR Serverless per creare un lavoro remoto per applicare le trasformazioni al tuo set di dati completo, questa sezione non si applica.

Se elabori i dati periodicamente, puoi creare una pianificazione per eseguire automaticamente il processo di elaborazione. Ad esempio, è possibile creare una pianificazione che esegue automaticamente un processo di elaborazione quando si ottengono nuovi dati. Per ulteriori informazioni sull'elaborazione dei lavori, consulta. Esportazione in Amazon S3

Quando si crea un lavoro, è necessario specificare un IAM ruolo con le autorizzazioni per creare il lavoro. È possibile utilizzare la AmazonSageMakerCanvasDataPrepFullAccesspolitica per aggiungere autorizzazioni.

Aggiungi la seguente politica di fiducia al ruolo per EventBridge consentirne l'assunzione.

{ "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com" }, "Action": "sts:AssumeRole" }
Importante

Quando crei una pianificazione, Data Wrangler crea un eventRule ingresso. EventBridge Ti vengono addebitati costi sia per le regole degli eventi che crei sia per le istanze utilizzate per eseguire il processo di elaborazione.

Per informazioni sui EventBridge prezzi, consulta la pagina EventBridge dei prezzi di Amazon. Per informazioni sui prezzi dei lavori di elaborazione, consulta Amazon SageMaker Pricing.

Puoi impostare una pianificazione utilizzando uno dei seguenti metodi:

  • CRONespressioni

    Nota

    Data Wrangler non supporta le seguenti espressioni:

    • LW#

    • Abbreviazioni per i giorni

    • Abbreviazioni per i mesi

  • RATEespressioni

  • Ricorrente: per l'esecuzione del processo Imposta un intervallo orario o giornaliero.

  • Ora specifica: per l'esecuzione del processo imposta giorni e orari specifici.

Le seguenti sezioni forniscono le procedure per la pianificazione dei lavori durante la compilazione delle impostazioni del processo di SageMaker elaborazione durante l'esportazione dei dati in Amazon S3. Tutte le seguenti istruzioni iniziano nella sezione Pianificazioni degli associati delle impostazioni del processo di SageMaker elaborazione.

CRON

Utilizzare la procedura seguente per creare una pianificazione con un'CRONespressione.

  1. Nel pannello laterale Esporta in Amazon S3, assicurati di aver disattivato l'interruttore di configurazione automatica del lavoro e di aver selezionato l'SageMaker opzione Elaborazione.

  2. Nelle impostazioni del SageMaker processo di elaborazione, apri la sezione Pianificazioni di associazione e scegli Crea nuova pianificazione.

  3. Viene visualizzata la finestra di dialogo Crea nuova pianificazione. Per Nome della pianificazione, specifica il nome della pianificazione.

  4. Per Run Frequency, scegliete CRON.

  5. Per ciascuno dei campi Minuti, Ore, Giorni del mese, Mese e Giorno della settimana, inserite valori di CRON espressione validi.

  6. Scegli Create (Crea) .

  7. (Facoltativo) seleziona Aggiungi un’altra pianificazione per eseguire il lavoro in base a una pianificazione aggiuntiva.

    Nota

    È possibile associare un massimo di due pianificazioni. Le pianificazioni sono indipendenti e non si influenzano tra loro a meno che i tempi non si sovrappongano.

  8. Seleziona una delle seguenti opzioni:

    • Pianifica ed esegui ora: il processo viene eseguito immediatamente e successivamente viene eseguito secondo le pianificazioni.

    • Solo pianificazione: il processo viene eseguito solo in base alle pianificazioni specificate.

  9. Scegli Esporta dopo aver compilato il resto delle impostazioni del processo di esportazione.

RATE

Utilizzate la procedura seguente per creare una pianificazione con un'RATEespressione.

  1. Nel pannello laterale Esporta in Amazon S3, assicurati di aver disattivato l'interruttore di configurazione automatica del lavoro e di aver selezionato l'SageMaker opzione Elaborazione.

  2. Nelle impostazioni del SageMaker processo di elaborazione, apri la sezione Pianificazioni di associazione e scegli Crea nuova pianificazione.

  3. Viene visualizzata la finestra di dialogo Crea nuova pianificazione. Per Nome della pianificazione, specifica il nome della pianificazione.

  4. Per Frequenza di esecuzione, seleziona Frequenza.

  5. Per Valore, specifica un numero intero.

  6. Per Unità, seleziona una delle opzioni seguenti:

    • Minuti

    • Ore

    • Giorni

  7. Scegli Create (Crea) .

  8. (Facoltativo) seleziona Aggiungi un’altra pianificazione per eseguire il lavoro in base a una pianificazione aggiuntiva.

    Nota

    È possibile associare un massimo di due pianificazioni. Le pianificazioni sono indipendenti e non si influenzano tra loro a meno che i tempi non si sovrappongano.

  9. Seleziona una delle seguenti opzioni:

    • Pianifica ed esegui ora: il processo viene eseguito immediatamente e successivamente viene eseguito secondo le pianificazioni.

    • Solo pianificazione: il processo viene eseguito solo in base alle pianificazioni specificate.

  10. Scegli Esporta dopo aver compilato il resto delle impostazioni del processo di esportazione.

Recurring

Utilizza la procedura seguente per creare una pianificazione che esegua un processo su base ricorrente.

  1. Nel pannello laterale Esporta in Amazon S3, assicurati di aver disattivato l'interruttore di configurazione automatica del lavoro e di aver selezionato l'SageMaker opzione Elaborazione.

  2. Nelle impostazioni del SageMaker processo di elaborazione, apri la sezione Pianificazioni di associazione e scegli Crea nuova pianificazione.

  3. Viene visualizzata la finestra di dialogo Crea nuova pianificazione. Per Nome della pianificazione, specifica il nome della pianificazione.

  4. Per Frequenza di esecuzione, scegliete Ricorrente.

  5. Per Ogni x ore, specifica la frequenza oraria di esecuzione del processo durante il giorno. I valori validi sono numeri interi compresi nell'intervallo tra 1 e 23.

  6. Per In giorni, seleziona una delle seguenti opzioni:

    • Ogni giorno

    • Fine settimana

    • Giorni della settimana

    • Seleziona giorni

    1. (Facoltativo) Se hai selezionato Seleziona giorni, seleziona i giorni della settimana in cui eseguire il processo.

    Nota

    La pianificazione viene ripristinata ogni giorno. Se pianifichi l'esecuzione di un processo ogni cinque ore, questo viene eseguito nelle seguenti ore del giorno:

    • 00:00

    • 05:00

    • 10:00

    • 15:00

    • 20:00

  7. Scegli Create (Crea) .

  8. (Facoltativo) seleziona Aggiungi un’altra pianificazione per eseguire il lavoro in base a una pianificazione aggiuntiva.

    Nota

    È possibile associare un massimo di due pianificazioni. Le pianificazioni sono indipendenti e non si influenzano tra loro a meno che i tempi non si sovrappongano.

  9. Seleziona una delle seguenti opzioni:

    • Pianifica ed esegui ora: il processo viene eseguito immediatamente e successivamente viene eseguito secondo le pianificazioni.

    • Solo pianificazione: il processo viene eseguito solo in base alle pianificazioni specificate.

  10. Scegli Esporta dopo aver compilato il resto delle impostazioni del processo di esportazione.

Specific time

Utilizzare la procedura seguente per creare una pianificazione che esegua un processo a orari specifici.

  1. Nel pannello laterale Esporta in Amazon S3, assicurati di aver disattivato l'interruttore di configurazione automatica del lavoro e di aver selezionato l'SageMaker opzione Elaborazione.

  2. Nelle impostazioni del SageMaker processo di elaborazione, apri la sezione Pianificazioni di associazione e scegli Crea nuova pianificazione.

  3. Viene visualizzata la finestra di dialogo Crea nuova pianificazione. Per Nome della pianificazione, specifica il nome della pianificazione.

  4. Per Frequenza di esecuzione, scegli Ora di inizio.

  5. Per Ora di inizio, inserisci un'ora nel UTC formato (ad esempio,09:00). Per impostazione predefinita, l'ora di inizio corrisponde al fuso orario in cui ti trovi.

  6. Per In giorni, seleziona una delle seguenti opzioni:

    • Ogni giorno

    • Fine settimana

    • Giorni della settimana

    • Seleziona giorni

    1. (Facoltativo) Se hai selezionato Seleziona giorni, seleziona i giorni della settimana in cui eseguire il processo.

  7. Scegli Create (Crea) .

  8. (Facoltativo) seleziona Aggiungi un’altra pianificazione per eseguire il lavoro in base a una pianificazione aggiuntiva.

    Nota

    È possibile associare un massimo di due pianificazioni. Le pianificazioni sono indipendenti e non si influenzano tra loro a meno che i tempi non si sovrappongano.

  9. Seleziona una delle seguenti opzioni:

    • Pianifica ed esegui ora: il processo viene eseguito immediatamente e successivamente viene eseguito secondo le pianificazioni.

    • Solo pianificazione: il processo viene eseguito solo in base alle pianificazioni specificate.

  10. Scegli Esporta dopo aver compilato il resto delle impostazioni del processo di esportazione.

Puoi utilizzare il SageMaker AWS Management Console per visualizzare i lavori la cui esecuzione è pianificata. I processi di elaborazione vengono eseguiti all'interno di Pipelines. Ogni processo di elaborazione ha una propria pipeline. Viene eseguito come fase di elaborazione all'interno della pipeline. All'interno di una pipeline puoi visualizzare le pianificazioni che hai creato. Per informazioni sulla visualizzazione di una pipeline, consulta Visualizza i dettagli di una pipeline.

Per visualizzare i processi pianificati utilizza la procedura seguente.

Per visualizzare i processi che hai programmato, procedi come segue.

  1. Apri Amazon SageMaker Studio Classic.

  2. Pipeline aperte

  3. Visualizza le pipeline dei lavori che hai creato.

    La pipeline che esegue il processo utilizza il nome del processo come prefisso. Ad esempio, se hai creato un processo denominato housing-data-feature-enginnering, il nome della pipeline sarà canvas-data-prep-housing-data-feature-engineering

  4. Selezionare la pipeline contenente il tuo processo.

  5. Visualizza lo stato delle pipeline. Le pipeline con stato Riuscito hanno eseguito correttamente il processo di elaborazione.

Per interrompere l'esecuzione del processo di elaborazione, effettua le seguenti operazioni:

Per interrompere l'esecuzione di un processo di elaborazione, elimina la regola di evento che specifica la pianificazione. L'eliminazione di una regola di evento interrompe l'esecuzione di tutti i processi associati alla pianificazione. Per informazioni sull'eliminazione di una regola, consulta Disabilitazione o eliminazione di una regola Amazon. EventBridge

Puoi anche interrompere ed eliminare le pipeline associate alle pianificazioni. Per informazioni sull'arresto di una pipeline, consulta. StopPipelineExecution Per informazioni sull'eliminazione di una pipeline, vedere. DeletePipeline