Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Se riscontrate errori nei processi di elaborazione di SageMaker Clarify, consultate i seguenti scenari per identificare il problema.
Nota
Il motivo dell'errore e il messaggio di uscita devono contenere messaggi descrittivi ed eccezioni, se rilevate, durante l'esecuzione. Un motivo comune degli errori è che i parametri sono mancanti o non validi. Se ricevi messaggi poco chiari, confusi o fuorvianti o non riesci a trovare una soluzione, invia un feedback.
Argomenti
L'esecuzione del processo di elaborazione sta impiegando troppo tempo
Messaggio di errore relativo a una configurazione dell'analisi non valida
Il calcolo delle metriche di bias non riesce per alcune o tutte le metriche
Mancata corrispondenza tra la configurazione di analisi e dataset/model input/output
Il processo di elaborazione non riesce a terminare
Se il processo di elaborazione non riesce a terminare, prova a eseguire le operazioni indicate di seguito:
-
Ispeziona i log del processo direttamente nel notebook in cui hai eseguito il processo. I log del processo si trovano nell'output della cella del notebook in cui è stata avviata l'esecuzione.
-
Controllate i log in del job. CloudWatch
-
Aggiungi la riga seguente nel tuo notebook per descrivere l'ultimo processo di elaborazione e cerca il motivo dell'errore e il messaggio di uscita:
-
clarify_processor.jobs[-1].describe()
-
-
Esegui il seguente comando AWS CLI; per descrivere il processo di elaborazione e cerca il motivo dell'errore e il messaggio di uscita:
-
aws sagemaker describe-processing-job —processing-job-name <processing-job-id>
-
L'esecuzione del processo di elaborazione sta impiegando troppo tempo
Se l'esecuzione del processo di elaborazione impiega troppo tempo, utilizza i seguenti metodi per trovare la causa principale.
Controlla se la configurazione delle risorse è sufficiente per gestire il carico di calcolo. Per velocizzare il processo, prova quanto segue:
-
Utilizzate un tipo di istanza più grande. SageMaker Clarify interroga ripetutamente il modello e un'istanza più grande può ridurre significativamente i tempi di calcolo. Per un elenco delle istanze disponibili, delle relative dimensioni di memoria, larghezza di banda e altri dettagli sulle prestazioni, consulta i prezzi di Amazon SageMaker AI
. -
Aggiungi altre istanze. SageMaker Clarify può utilizzare più istanze per spiegare più punti dati di input in parallelo. Per abilitare il calcolo parallelo, imposta il valore
instance_count
su più di1
quando chiamiSageMakerClarifyProcessor
. Per ulteriori informazioni, consulta Come eseguire processi di elaborazione SageMaker Clarify paralleli. Se aumenti il conteggio istanze, monitora le prestazioni dell'endpoint per controllare che sia in grado di distribuire il carico aumentato. Per ulteriori informazioni, consulta Acquisizione di dati da endpoint in tempo reale. -
Se stai elaborando SHapley Additive exPlanations (SHAP) valori, riduci il
num_samples
parametro nel file di configurazione dell'analisi. Il numero di campioni influisce direttamente su quanto segue:-
La dimensione dei set di dati sintetici inviati all'endpoint
-
Runtime processo
La riduzione del numero di campioni può anche portare a una riduzione della precisione nella stima SHAP valori. Per ulteriori informazioni, consulta File di configurazione dell'analisi.
-
Il processo di elaborazione termina senza risultati e viene visualizzato un messaggio di CloudWatch avviso
Se il processo di elaborazione termina ma non viene trovato alcun risultato, CloudWatch i registri generano un messaggio di avviso che indica che Signal 15 ha ricevuto, è in corso
. Questo avviso indica che il processo è stato interrotto perché una richiesta del cliente ha richiamato l'StopProcessingJob
API o che il processo è scaduto il tempo assegnato per il suo completamento. In quest'ultimo caso, controlla la durata massima nella configurazione del processo (max_runtime_in_seconds
) e aumentala secondo necessità.
Messaggio di errore relativo a una configurazione dell'analisi non valida
-
Se viene visualizzato il messaggio di errore
Impossibile caricare la configurazione dell'analisi come JSON.
, ciò significa che il file di input della configurazione dell'analisi per il processo di elaborazione non contiene un oggetto JSON valido. Controlla la validità dell'oggetto JSON utilizzando un linter JSON. -
Se viene visualizzato il messaggio di errore
Errore di convalida dello schema di configurazione dell'analisi.
, ciò significa che il file di input della configurazione dell'analisi per il processo di elaborazione contiene campi sconosciuti o tipi non validi per alcuni valori del campo. Esamina i parametri di configurazione nel file e confrontali con i parametri elencati nel file di configurazione dell'analisi. Per ulteriori informazioni, consulta File di configurazione dell'analisi.
Il calcolo delle metriche di bias non riesce per alcune o tutte le metriche
Se ricevi uno dei seguenti messaggi di errore: Nella colonna dell'etichetta prevista non sono presenti valori delle etichette, la serie Indice previsto positivo contiene tutti valori falsi.
o Il tipo di dati della serie colonna dell'etichetta prevista non è lo stesso della serie colonna dell'etichetta.
, prova quanto segue:
-
Controlla che venga utilizzato il set di dati corretto.
-
Controlla se la dimensione del set di dati è troppo piccola; se, ad esempio, contiene solo poche righe. Ciò può far sì che gli output del modello abbiano lo stesso valore o che il tipo di dati venga dedotto in modo errato.
-
Controlla se l'etichetta o la sfaccettatura viene considerata continua o categorica. SageMaker Clarify utilizza l'euristica per determinare il.
DataType
Per quanto riguarda le metriche di distorsione successive all'allenamento, il tipo di dati restituito dal modello potrebbe non corrispondere a quello contenuto nel set di dati o SageMaker Clarify potrebbe non essere in grado di trasformarlo correttamente. -
Nel report sui bias, dovresti vedere un valore singolo per le colonne categoriche o un intervallo per le colonne continue.
-
Ad esempio, se una colonna ha i valori 0,0 e 1,0 come float, verrà trattata come continua anche se i valori univoci sono troppo pochi.
-
Mancata corrispondenza tra la configurazione di analisi e dataset/model input/output
-
Controlla che il formato della linea di base nella configurazione dell'analisi sia lo stesso del formato del set di dati.
-
Se ricevi il messaggio di errore
Impossibile convertire la stringa in float.
, controlla che il formato sia specificato correttamente. Potrebbe anche indicare che le previsioni del modello hanno un formato diverso rispetto alla colonna dell'etichetta o potrebbe indicare che la configurazione dell'etichetta o delle probabilità non è corretta. -
Se ricevi il messaggio di errore
Impossibile localizzare il facet.
oppureLe intestazioni devono contenere un'etichetta.
oLe intestazioni nella configurazione non corrispondono al numero di colonne nel set di dati.
oNomi delle funzionalità non trovati.
, controlla che le intestazioni corrispondano alle colonne. -
Se ricevi il messaggio di errore
I dati devono contenere funzionalità.
, controlla il modello di contenuto per JSON Lines e confrontalo con l'esempio del set di dati, se disponibile.
Il modello restituisce Errore interno del server 500 oppure il container ritorna alle previsioni per record a causa di un errore del modello
Se ricevi il messaggio di errore Ritorno alle previsioni per record a causa di un errore del modello.
, ciò potrebbe indicare che il modello non è in grado di gestire la dimensione del batch, di essere limitato o semplicemente non accetta l'input passato dal container a causa di problemi di serializzazione. È necessario esaminare CloudWatch i log dell'endpoint SageMaker AI e cercare messaggi di errore o traceback. Nei casi di limitazione dei modelli, può essere utile utilizzare un tipo di istanza diverso o aumentare il numero di istanze per l'endpoint.
Ruolo di esecuzione non valido
Ciò indica che il ruolo fornito non è corretto o che gli mancano le autorizzazioni necessarie. Controlla il ruolo e le relative autorizzazioni utilizzati per configurare il processo di elaborazione e verifica la policy di autorizzazione e di attendibilità per il ruolo.
Impossibile scaricare i dati
Ciò indica che non è stato possibile scaricare gli input del processo per l'avvio del processo. Controlla il nome del bucket e le autorizzazioni per il set di dati e gli input di configurazione.
Impossibile connettersi all'IA SageMaker
Ciò indica che il lavoro non è riuscito a raggiungere gli endpoint del servizio SageMaker AI. Controlla le impostazioni di configurazione di rete per il processo di elaborazione e verifica la configurazione del cloud privato virtuale (VPC).