Risoluzione dei problemi - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi

Se riscontri errori in Amazon SageMaker Batch Transform, consulta i seguenti suggerimenti per la risoluzione dei problemi.

errori di timeout massimo

Se si verificano errori di timeout massimo durante l'esecuzione di processi di trasformazione in batch, prova quanto segue:

  • iniziate con il record singolo BatchStrategy, un batch di dimensioni predefinite (6 MB) o inferiore specificato nel parametro MaxPayloadInMB e un set ridotto di dati campione. Regola il parametro di timeout massimo InvocationsTimeoutInSeconds (che ha un massimo di 1 ora) fino a quando non ricevi una risposta di chiamata riuscita.

  • Dopo aver ricevuto una risposta di invocazione riuscita, aumenta MaxPayloadInMB (che ha un massimo di 100 MB) e i parametri InvocationsTimeoutInSeconds per trovare la dimensione massima del batch in grado di supportare il timeout del modello desiderato. In questa fase è possibile utilizzare il record singolo o il record multiplo BatchStrategy.

    Nota

    Il superamento del limite MaxPayloadInMB causa un errore. Questo può accadere con un set di dati di grandi dimensioni qualora non fosse possibile suddividerlo, il parametro SplitType fosse impostato su nessuno oppure i singoli record all'interno del set di dati superassero il limite.

  • (Facoltativo) Ottimizza il parametro MaxConcurrentTransforms, che specifica il numero massimo di richieste parallele che possono essere inviate a ogni istanza in un'attività di trasformazione in batch. Tuttavia, il valore di MaxConcurrentTransforms * MaxPayloadInMB non deve superare i 100 MB.

Output incompleto

SageMaker utilizza Amazon S3 Multipart API Upload per caricare i risultati di un processo di trasformazione in batch su Amazon S3. Se si verifica un errore, i risultati caricati vengono rimossi da Amazon S3. In alcuni casi, come ad esempio un'interruzione nella connessione di rete, può rimanere su Amazon S3 un caricamento in più parti incompleto. Un caricamento incompleto potrebbe verificarsi anche se hai più file di input, ma alcuni file non possono essere elaborati da SageMaker Batch Transform. I file di input che non è stato possibile elaborare non avranno file di output corrispondenti in Amazon S3.

Per evitare di incorrere in costi di storage, ti consigliamo di aggiungere la policy del bucket S3 alle regole del ciclo di vita del bucket S3. Questa policy elimina i caricamenti in più parti incompleti che potrebbero essere archiviati nel bucket S3. Per ulteriori informazioni, consulta Gestione del ciclo di vita degli oggetti.

Processo si presenta come failed

Se un processo di trasformazione in batch non riesce a elaborare un file di input a causa di un problema con il set di dati, SageMaker contrassegna il lavoro comefailed. Se un file di input contiene un record non valido, il processo di trasformazione non crea un file di output per quel file di input perché questo impedisce di mantenere lo stesso ordine nei dati trasformati e nel file di input. Quando il set di dati contiene più file di input, un processo di trasformazione continua a elaborare i file di input anche se non riesce a elaborarne uno. I file elaborati generano comunque risultati utilizzabili.

Se utilizzi algoritmi personalizzati, puoi utilizzare testo segnaposto, ad esempio ERROR, quando l'algoritmo trova un record non valido in un file di input. Ad esempio, se l'ultimo record in un set di dati non è valido, l'algoritmo inserisce il testo segnaposto per tale record nel file di output.