As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Se você encontrar falhas nas tarefas de processamento do SageMaker Clarify, consulte os cenários a seguir para ajudar a identificar o problema.
nota
O motivo da falha e a mensagem de saída devem conter mensagens descritivas e exceções, se encontradas, durante a execução. Um motivo comum para erros é a ausência ou a invalidade dos parâmetros. Se você encontrar mensagens pouco claras, confusas ou enganosas ou não conseguir encontrar uma solução, envie um comentário.
Tópicos
O trabalho de processamento está demorando muito para ser executado
O trabalho de processamento termina sem resultados e você recebe uma CloudWatch mensagem de aviso
O cálculo da métrica de desvio falha em várias ou em todas as métricas
Incompatibilidade entre a configuração de análise e dataset/model input/output
Falha na conclusão do trabalho de processamento
Se o trabalho de processamento não for concluído, você pode tentar o seguinte:
-
Inspecione os logs de trabalho diretamente no caderno em que você executou o trabalho. Os logs de trabalho estão localizados na saída da célula do caderno em que você iniciou a execução.
-
Inspecione os registros do trabalho. CloudWatch
-
Adicione a seguinte linha em seu caderno para descrever o último trabalho de processamento e procurar o motivo da falha e a mensagem de saída:
-
clarify_processor.jobs[-1].describe()
-
-
Execute o seguinte comando AWS CLI; para descrever o trabalho de processamento e procurar o motivo da falha e a mensagem de saída:
-
aws sagemaker describe-processing-job —processing-job-name <processing-job-id>
-
O trabalho de processamento está demorando muito para ser executado
Se seu trabalho de processamento estiver demorando muito para ser executado, use as seguintes formas para encontrar a causa raiz:
Verifique se a configuração do recurso é suficiente para lidar com sua carga de computação. Para acelerar seu trabalho, experimente o seguinte:
-
Use um tipo de instância maior. SageMaker Esclareça as consultas repetidas do modelo, e uma instância maior pode reduzir significativamente seu tempo de computação. Para obter uma lista das instâncias disponíveis, seus tamanhos de memória, largura de banda e outros detalhes de desempenho, consulte Amazon SageMaker AI Pricing
. -
Adicione mais instâncias. SageMaker O Clarify pode usar várias instâncias para explicar vários pontos de dados de entrada em paralelo. Para habilitar a computação paralela, defina seu
instance_count
para mais do que1
quando você chamar oSageMakerClarifyProcessor
. Para obter mais informações, consulte Como executar trabalhos paralelos de processamento do SageMaker Clarify. Se você aumentar sua contagem de instâncias, monitore o desempenho do seu endpoint para verificar se ele pode implantar o aumento da carga. Para obter mais informações, consulte Capturar dados do endpoint em tempo real. -
Se você estiver computando SHapley Additive exPlanations (SHAP) valores, reduza o
num_samples
parâmetro em seu arquivo de configuração de análise. O número de amostras afeta diretamente o seguinte:-
O tamanho dos conjuntos de dados sintéticos que são enviados ao seu endpoint
-
Tempo de execução do trabalho
Reduzir o número de amostras também pode levar à redução da precisão na estimativa SHAP valores. Para obter mais informações, consulte Arquivos de configuração de análise.
-
O trabalho de processamento termina sem resultados e você recebe uma CloudWatch mensagem de aviso
Se o trabalho de processamento for concluído, mas nenhum resultado for encontrado, os CloudWatch registros produzirão uma mensagem de aviso que diz Sinal 15 recebido, limpando
. Esse aviso indica que o trabalho foi interrompido devido a uma solicitação do cliente chamada StopProcessingJob
API ou porque o trabalho esgotou o tempo previsto para sua conclusão. No último caso, verifique o runtime máximo na configuração do trabalho (max_runtime_in_seconds
) e aumente-o conforme necessário.
Mensagem de erro para configuração de análise inválida
-
Se você receber a mensagem de erro
Não é possível carregar a configuração de análise como JSON
, significa que o arquivo de entrada de configuração de análise para o trabalho de processamento não contém um objeto JSON válido. Verifique a validade do objeto JSON usando um linter JSON. -
Se você receber a mensagem de erro
Erro de validação do esquema de configuração da análise
, significa que o arquivo de entrada de configuração de análise para o trabalho de processamento contém campos desconhecidos ou tipos inválidos para alguns valores de campo. Revise os parâmetros de configuração no arquivo e faça uma verificação cruzada com os parâmetros listados no arquivo de configuração da análise. Para obter mais informações, consulte Arquivos de configuração de análise.
O cálculo da métrica de desvio falha em várias ou em todas as métricas
Se você receber uma das seguintes mensagens de erro Nenhum valor de rótulo está presente na coluna de rótulo previsto, a série de índices previstos positivos contém todos os valores falsos.
ou O tipo de dados da série da coluna de rótulo previsto não é o mesmo da série da coluna de rótulo.
, tente o seguinte:
-
Verifique se o conjunto de dados correto está sendo usado.
-
Verifique se o tamanho do conjunto de dados é muito pequeno; se, por exemplo, ele contém apenas algumas linhas. Isso pode fazer com que as saídas do modelo tenham o mesmo valor ou que o tipo de dados seja inferido incorretamente.
-
Verifique se o rótulo ou a faceta são tratados como contínuos ou categóricos. SageMaker O Clarify usa heurísticas para determinar o.
DataType
Para métricas de viés pós-treinamento, o tipo de dados retornado pelo modelo pode não corresponder ao que está no conjunto de dados ou o SageMaker Clarify pode não conseguir transformá-lo corretamente. -
No relatório de desvios, você deve ver um valor único para colunas categóricas ou um intervalo para colunas contínuas.
-
Por exemplo, se uma coluna tiver valores 0,0 e 1,0 como flutuantes, ela será tratada como contínua mesmo que haja poucos valores exclusivos.
-
Incompatibilidade entre a configuração de análise e dataset/model input/output
-
Verifique se o formato da linha de base na configuração da análise é o mesmo do conjunto de dados.
-
Se você receber a mensagem de erro
Não foi possível converter a string em flutuante.
, verifique se o formato está especificado corretamente. Também pode indicar que as predições de modelo têm um formato diferente da coluna do rótulo ou pode indicar que a configuração do rótulo ou das probabilidades está incorreta. -
Se você receber a mensagem de erro
Não foi possível localizar a faceta.
,Os cabeçalhos devem conter um rótulo.
,Os cabeçalhos na configuração não correspondem ao número de colunas no conjunto de dados.
ouNomes de atributos não encontrados.
, verifique se os cabeçalhos correspondem às colunas. -
Se você receber a mensagem de erro,
Os dados devem conter atributos.
, verifique o modelo de conteúdo para linhas JSON e compare-o com a amostra do conjunto de dados, se disponível.
O modelo retornar 500 erros internos do servidor ou o contêiner volta às predições por registro devido a um erro do modelo
Se você receber a mensagem de erro, Fallback para a predição por registro devido a um erro do modelo.
, pode indicar que o modelo não consegue lidar com o tamanho do lote, ser limitado ou simplesmente não aceita a entrada passada pelo contêiner devido a problemas de serialização. Você deve revisar os CloudWatch registros do endpoint de SageMaker IA e procurar mensagens de erro ou rastreamentos. Para casos de controle de utilização de modelos, pode ser útil usar um tipo de instância diferente ou aumentar o número de instâncias para o endpoint.
O perfil de execução é inválido
Isso indica que o perfil fornecido está incorreto ou não tem as permissões necessárias. Verifique o perfil e suas permissões que foram usadas para configurar o trabalho de processamento e verifique a permissão e a política de confiança do perfil.
Falha ao baixar dados
Isso indica que as entradas do trabalho não puderam ser baixadas para que o trabalho fosse iniciado. Verifique o nome do bucket e as permissões do conjunto de dados e das entradas de configuração.
Não foi possível conectar-se à SageMaker IA
Isso indica que o trabalho não conseguiu alcançar os pontos finais do serviço de SageMaker IA. Verifique as configurações de rede para o trabalho de processamento e verifique a configuração da nuvem privada virtual (VPC).