Solucionar erros - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solucionar erros

Esta seção contém informações sobre como entender e evitar erros comuns, as mensagens de erro que eles geram e orientações sobre como resolver esses erros. Antes de prosseguir, pergunte-se:

Você encontrou um erro antes de implantar seu modelo? Se sim, Solucionar erros de compilação do Neo.

Você encontrou um erro depois de compilar seu modelo? Se sim, consulte Solucionar erros de inferência do Neo.

Você encontrou um erro ao tentar compilar seu modelo para dispositivos Ambarella? Se sim, veja Solucionar erros Ambarella.

Tipos de classificação de erros

Essa lista classifica os erros de usuários que você pode receber do Neo. Isso inclui erros de acesso e permissão e erros de carregamento para cada uma das estruturas com suporte. Todos os outros erros são erros do sistema.

O Neo transmite os erros para esses dados diretamente do serviço dependente.

  • Acesso negado ao chamar sts: AssumeRole

  • Qualquer erro 400 ao chamar o S3 para fazer download ou upload de um modelo de cliente.

  • Erro do PassRole

Supondo que o compilador do Neo tenha carregado com êxito um .tar.gz do Amazon S3, verifique se o tarball contém os arquivos necessários para a compilação. Os critérios de verificação são específicos da estrutura:

  • TensorFlow: Espera somente o arquivo protobuf (*.pb ou *.pbtxt). Para modelos salvos, espera uma pasta de variáveis.

  • Pytorch: Espera apenas um arquivo pytorch (*.pth).

  • MXNET: Espera apenas um arquivo de símbolos (*.json) e um arquivo de parâmetros (*.params).

  • XGBoost: Espera apenas um arquivo de modelo XGBoost (* .model). O modelo de entrada tem limitação de tamanho.

Supondo que o compilador Neo tenha carregado com sucesso o arquivo .tar.gz de Amazon S3 e que o tarball contenha arquivos necessários para compilação. O critério de verificação é:

  • OperatorNotImplemented: Um operador não foi implementado.

  • OperatorAttributeNotImplemented: o atributo no operador especificado não foi implementado.

  • OperatorAttributeRequired: é necessário um atributo para um gráfico de símbolos interno, mas ele não está listado no gráfico do modelo de entrada do usuário.

  • OperatorAttributeValueNotValid: o valor do atributo no operador específico não é válido.