Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Invoque un punto de conexión multicontenedor con invocación directa
SageMaker Los puntos de enlace de varios contenedores de IA permiten a los clientes implementar varios contenedores para implementar diferentes modelos en un punto final de IA. SageMaker Puede alojar hasta 15 contenedores de inferencia diferentes en un único punto de conexión. Al utilizar la invocación directa, puede enviar una solicitud a un contenedor de inferencia específico alojado en un punto de conexión multicontenedor.
Para invocar un punto de conexión multicontenedor con invocación directa, llame a invoke_endpointTargetContainerHostname
.
En el siguiente ejemplo, se invoca directamente el secondContainer
de un punto de conexión multicontenedor para obtener una predicción.
import boto3 runtime_sm_client = boto3.Session().client('sagemaker-runtime') response = runtime_sm_client.invoke_endpoint( EndpointName ='my-endpoint', ContentType = 'text/csv', TargetContainerHostname='secondContainer', Body = body)
Para cada solicitud de invocación directa a un punto de conexión multicontenedor, solo el contenedor con TargetContainerHostname
procesa la solicitud de invocación. Se producirán errores de validación si realiza alguna de las siguientes acciones:
-
Especificar un
TargetContainerHostname
que no exista en el punto de conexión -
No especifique un valor para
TargetContainerHostname
en una solicitud a un punto de conexión configurado para invocación directa -
No especifique un valor para
TargetContainerHostname
en una solicitud a un punto de conexión configurado para invocación directa.