Solución de problemas de puntos de conexión multicontenedor - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de puntos de conexión multicontenedor

Las siguientes secciones pueden ayudarle a solucionar errores de puntos de conexión multicontenedor.

Errores de comprobación de estado de ping

Con varios contenedores, la memoria y CPU del punto de conexión están sometidas a una mayor presión durante la creación del punto de conexión. En concreto, las métricas MemoryUtilization y CPUUtilization son más altas que las de los puntos de conexión de un solo contenedor, ya que la presión de utilización es proporcional al número de contenedores. Por este motivo, le recomendamos que elija tipos de instancias con suficiente memoria y CPU para asegurarse de que la instancia dispone de memoria suficiente para cargar todos los modelos (la misma guía se aplica a la implementación de una canalización de inferencia). De lo contrario, es posible que no se pueda crear el punto de conexión y se produzca un error como XXX did not pass the ping health check.

Falta la etiqueta Docker accept-bind-to-port = true

Los contenedores de un punto de conexión multicontenedor escuchan en el puerto especificado en la variable de entorno SAGEMAKER_BIND_TO_PORT en lugar de puerto 8080. Cuando un contenedor se ejecuta en un punto final con varios contenedores, la SageMaker IA proporciona automáticamente esta variable de entorno al contenedor. Si esta variable de entorno no está presente, los contenedores de manera predeterminada asignan el uso del puerto 8080. Para indicar que el contenedor cumple con este requisito, ejecute el siguiente comando para añadir una etiqueta a su Dockerfile:

LABEL com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true

De lo contrario, aparecerá un mensaje de error como Your Ecr Image XXX does not contain required com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true Docker label(s).

Si su contenedor necesita escuchar en otro puerto, elija un puerto que esté en el intervalo especificado por la variable de entorno SAGEMAKER_SAFE_PORT_RANGE. Especifique el valor como un rango inclusivo en el formato XXXX -YYYY, donde XXXX y YYYY son números enteros de varios dígitos. SageMaker La IA proporciona este valor automáticamente cuando se ejecuta el contenedor en un punto final con varios contenedores.