Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Solución de problemas de canalizaciones de inferencia
Para solucionar los problemas de la canalización de inferencias, utilice los CloudWatch registros y los mensajes de error. Si utilizas imágenes de Docker personalizadas en una canalización que incluye los algoritmos SageMaker integrados de Amazon, es posible que también tengas problemas con los permisos. Para conceder los permisos necesarios, cree una política de Amazon Elastic Container Registry (AmazonECR).
Temas
Solucionar problemas de ECR permisos de Amazon para canalizaciones de inferencia
Cuando utilizas imágenes de Docker personalizadas en una canalización que incluye algoritmos SageMaker integrados, necesitas una ECRpolítica de Amazon. La política permite a tu ECR repositorio de Amazon conceder permiso SageMaker para extraer la imagen. La política debe agregar los permisos siguientes:
{ "Version": "2008-10-17", "Statement": [ { "Sid": "allowSageMakerToPull", "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": [ "ecr:GetDownloadUrlForLayer", "ecr:BatchGetImage", "ecr:BatchCheckLayerAvailability" ] } ] }
Utilice CloudWatch los registros para solucionar problemas de las canalizaciones de SageMaker inferencia
SageMaker publica los registros de contenedores para los puntos de enlace que despliegan una canalización de inferencia CloudWatch a Amazon en la siguiente ruta para cada contenedor.
/aws/sagemaker/Endpoints/{EndpointName}/{Variant}/{InstanceId}/{ContainerHostname}
Por ejemplo, los registros para este punto de conexión se publican en los siguientes grupos de registros y secuencias:
EndpointName: MyInferencePipelinesEndpoint Variant: MyInferencePipelinesVariant InstanceId: i-0179208609ff7e488 ContainerHostname: MyContainerName1 and MyContainerName2
logGroup: /aws/sagemaker/Endpoints/MyInferencePipelinesEndpoint logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName1 logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName2
Un flujo de registro es una secuencia de eventos de registro que comparten la misma fuente. Cada fuente independiente de registros forma un CloudWatch flujo de registros independiente. Un grupo de registro es un grupo de flujos de registro que comparten la misma configuración de retención, monitorización y control de acceso.
Para ver los grupos de registro y secuencias
Abra la CloudWatch consola en https://console.aws.amazon.com/cloudwatch/
. -
En el panel de navegación, elija Registros.
-
En Grupos de registro, filtre en
MyInferencePipelinesEndpoint
: -
Para ver los flujos de registros, en la página Grupos de CloudWatch registros, elija y
MyInferencePipelinesEndpoint
, a continuación, Buscar grupo de registros.
Para obtener una lista de los registros que se SageMaker publican, consulteRegistros y métricas de canalización de inferencias.
Utilizar mensajes de error para solucionar problemas de canalizaciones de inferencia
Los mensajes de error de canalización de inferencia indican que los contenedores presentan errores.
Si se produce un error al SageMaker invocar un punto final, el servicio devuelve un ModelError
(código de error 424), que indica qué contenedor ha fallado. Si la carga útil de la solicitud (la respuesta del contenedor anterior) supera el límite de 5 MB, SageMaker proporciona un mensaje de error detallado, como:
Se recibió la respuesta de MyContainerName 1 con el código de estado 200. Sin embargo, la carga útil de la solicitud de MyContainerName 1 a MyContainerName 2 es de 6000000 bytes, lo que ha superado el límite máximo de 5 MB.
Si un contenedor no supera la comprobación de estado del ping mientras SageMaker está creando un punto final, devuelve un ClientError
e indica todos los contenedores que no pasaron la comprobación de ping en la última comprobación de estado.