Solucione erros de inferência do Neo. - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solucione erros de inferência do Neo.

Esta seção contém informações sobre como evitar e resolver alguns dos erros comuns que você pode encontrar ao implantar e/ou invocar o endpoint. Esta seção se aplica à PyTorch versão 1.4.0 ou posterior e à MXNetv1.7.0 ou posterior.

  • Certifique-se de que a primeira inferência (inferência de aquecimento) em um dado de entrada válido seja feita em model_fn(), se você definiu a model_fn em seu script de inferência, caso contrário, a seguinte mensagem de erro poderá ser vista no terminal quando predict API for chamada:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."
  • Certifique-se de que as variáveis ​​de ambiente na tabela a seguir estão definidas. Se não estiverem definidas, a seguinte mensagem de erro poderá aparecer:

    No terminal:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (503) from <users-sagemaker-endpoint> with message "{ "code": 503, "type": "InternalServerException", "message": "Prediction failed" } ".

    Em CloudWatch:

    W-9001-model-stdout com.amazonaws.ml.mms.wlm.WorkerLifeCycle - AttributeError: 'NoneType' object has no attribute 'transform'
    Chave Valor
    SAGEMAKER_PROGRAM inference.py
    SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/model/code
    SAGEMAKER_CONTAINER_LOG_LEVEL 20
    SAGEMAKER_REGION <your region>
  • Certifique-se de que a variável de MMS_DEFAULT_RESPONSE_TIMEOUT ambiente esteja definida como 500 ou um valor maior ao criar o modelo Amazon SageMaker AI; caso contrário, a seguinte mensagem de erro poderá ser vista no terminal:

    An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (0) from <users-sagemaker-endpoint> with message "Your invocation timed out while waiting for a response from container model. Review the latency metrics for each container in Amazon CloudWatch, resolve the issue, and try again."