Configurazione degli aggiornamenti automatici per un set di dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazione degli aggiornamenti automatici per un set di dati

Dopo aver importato il set di dati iniziale in Amazon SageMaker Canvas, potresti avere altri dati da aggiungere al tuo set di dati. Ad esempio, potresti ricevere dati di inventario alla fine di ogni settimana che desideri aggiungere al tuo set di dati. Invece di importare i dati più volte, è possibile aggiornare il set di dati esistente e aggiungere o rimuovere file da esso.

Nota

È possibile aggiornare solo i set di dati che hai importato tramite caricamento locale o Amazon S3.

Con gli aggiornamenti automatici dei set di dati, specifichi una posizione in cui Canvas controlla i file con una frequenza specificata. Se si importano nuovi file durante l'aggiornamento, lo schema dei file deve corrispondere esattamente al set di dati esistente.

Ogni volta che si aggiorna il set di dati, Canvas crea una nuova versione del set di dati. È possibile utilizzare solo la versione più recente del tuo set di dati per creare un modello o generare previsioni. Per ulteriori informazioni sulla visualizzazione della cronologia delle versioni del tuo set di dati, consulta Visualizzazione dei dettagli dei set di dati.

Inoltre, puoi utilizzare gli aggiornamenti dei set di dati con previsioni automatiche in batch, che avviano un processo di previsione in batch ogni volta che aggiorni il set di dati. Per ulteriori informazioni, consulta Previsioni in batch in Canvas SageMaker .

La sezione seguente descrive come eseguire aggiornamenti automatici al set di dati.

Un aggiornamento automatico si verifica quando si imposta una configurazione per Canvas per aggiornare il set di dati a una determinata frequenza. Ti consigliamo di utilizzare questa opzione se ricevi regolarmente nuovi file di dati che desideri aggiungere al tuo set di dati.

Quando imposti la configurazione dell'aggiornamento automatico, specifichi una posizione Amazon S3 in cui caricare i file e una frequenza con cui Canvas controlla la posizione e importa i file. Ogni istanza di Canvas che aggiorna il set di dati viene definita processo. Per ogni processo, Canvas importa tutti i file nella posizione Amazon S3. Se hai un file con lo stesso nome di file esistenti nel set di dati, Canvas sovrascrive i vecchi file con i nuovi.

Per gli aggiornamenti automatici dei set di dati, Canvas non esegue la convalida dello schema. Se lo schema dei file importati durante un aggiornamento automatico non corrisponde allo schema dei file esistenti o supera i limiti di dimensione (consulta Import a dataset per una tabella delle limitazioni delle dimensioni dei file), si verificheranno errori durante l'esecuzione dei processi.

Nota

È possibile impostare solo un massimo di 20 configurazioni automatiche nell'applicazione Canvas. Inoltre, Canvas esegue aggiornamenti automatici solo quando sei connesso all'applicazione Canvas. Se esci dall'applicazione Canvas, gli aggiornamenti automatici vengono sospesi fino a quando non effettui nuovamente l'accesso.

Per configurare gli aggiornamenti automatici per il set di dati, effettua le seguenti operazioni:

  1. Apri l'applicazione SageMaker Canvas.

  2. Nel pannello di navigazione a sinistra, scegli Set di dati.

  3. Dall'elenco dei set di dati, scegli il set di dati che desideri aggiornare.

  4. Scegli il menu a discesa Aggiorna set di dati e scegli Aggiornamento manuale. Verrai reindirizzato alla scheda Aggiornamenti automatici del set di dati.

  5. Attiva l'opzione Aggiornamento automatico abilitato.

  6. Per Specifica un'origine dati, inserisci il percorso Amazon S3 di una cartella in cui prevedi di caricare regolarmente i file.

  7. Per Scegli una frequenza, seleziona Oraria, Settimanale o Giornaliera.

  8. Per Specifica un'ora di inizio, utilizza il calendario e il selettore dell'ora per selezionare quando si desidera avviare il primo processo di aggiornamento automatico.

  9. Quando si è pronti per creare la configurazione di aggiornamento automatico, scegliere Salva.

Canvas avvia il primo processo della cadenza di aggiornamento automatico all'ora di inizio specificata.