Guida alla risoluzione dei problemi - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida alla risoluzione dei problemi

Fai riferimento a questa guida alla risoluzione dei problemi per aiutarti a eseguire il debug degli errori che potresti riscontrare durante le esecuzioni dei processi pianificati relativi al notebook.

La definizione del processo non crea processi

Se la definizione del lavoro non avvia alcun processo, il notebook o il lavoro di formazione potrebbero non essere visualizzati nella sezione Lavori sulla barra di navigazione a sinistra di Amazon SageMaker Studio. In tal caso, puoi trovare i messaggi di errore nella sezione Pipelines sulla barra di navigazione a sinistra di Studio. Ogni definizione di notebook o processo di formazione appartiene a una pipeline di esecuzione. Le seguenti sono le cause più comuni del mancato avvio dei job del notebook.

Autorizzazioni mancanti

  • Il ruolo assegnato alla definizione del lavoro non ha un rapporto di fiducia con Amazon EventBridge. Cioè, EventBridge non può assumere il ruolo.

  • Il ruolo assegnato alla definizione del processo non dispone dell'autorizzazione per chiamare SageMaker AI:StartPipelineExecution.

  • Il ruolo assegnato alla definizione del processo non dispone dell'autorizzazione per chiamare SageMaker AI:CreateTrainingJob.

EventBridge quota superata

Se viene visualizzato un Put* errore come quello riportato nell'esempio seguente, significa che è stata superata una EventBridge quota. Per risolvere il problema, puoi eliminare le EventBridge esecuzioni inutilizzate o chiedere di AWS Support aumentare la quota.

LimitExceededException) when calling the PutRule operation: The requested resource exceeds the maximum number allowed

Per ulteriori informazioni sulle EventBridge quote, consulta la sezione EventBridge Quote Amazon.

Limite di quota delle pipeline superato

Se compare un errore simile all'esempio seguente, significa che è stato superato il numero di pipeline eseguibili. Per risolvere il problema, è possibile eliminare le pipeline non utilizzate nell'account o chiedere a AWS Support di aumentare la quota.

ResourceLimitExceeded: The account-level service limit 'Maximum number of pipelines allowed per account' is XXX Pipelines, with current utilization of XXX Pipelines and a request delta of 1 Pipelines.

Per ulteriori informazioni sulle quote della pipeline, consulta Endpoints e quote di Amazon SageMaker AI.

Limite di processi di addestramento superato

Se compare un errore simile all'esempio seguente, significa che è stato superato il numero di processi di addestramento eseguibili. Per risolvere questo problema, riduci il numero di lavori di formazione nel tuo account o chiedi AWS Support di aumentare la tua quota.

ResourceLimitExceeded: The account-level service limit 'ml.m5.2xlarge for training job usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.

Per ulteriori informazioni sulle quote dei lavori di formazione, consulta Endpoints e quote di Amazon SageMaker AI.

Le visualizzazioni automatiche sono disattivate nei notebook SparkMagic

Se il tuo notebook utilizza il SparkMagic PySpark kernel e lo esegui come Notebook Job, potresti notare che le tue visualizzazioni automatiche sono disabilitate nell'output. L'attivazione della visualizzazione automatica causa il blocco del kernel, quindi l'esecutore di lavoro del notebook attualmente disabilita le visualizzazioni automatiche come soluzione alternativa.