Invoque un punto de conexión multicontenedor con invocación directa - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Invoque un punto de conexión multicontenedor con invocación directa

SageMaker Los puntos de enlace de varios contenedores de IA permiten a los clientes implementar varios contenedores para implementar diferentes modelos en un punto final de IA. SageMaker Puede alojar hasta 15 contenedores de inferencia diferentes en un único punto de conexión. Al utilizar la invocación directa, puede enviar una solicitud a un contenedor de inferencia específico alojado en un punto de conexión multicontenedor.

Para invocar un punto de conexión multicontenedor con invocación directa, llame a invoke_endpoint como lo haría con cualquier otro punto de conexión y especifique qué contenedor desea invocar mediante el parámetro TargetContainerHostname.

En el siguiente ejemplo, se invoca directamente el secondContainer de un punto de conexión multicontenedor para obtener una predicción.

import boto3 runtime_sm_client = boto3.Session().client('sagemaker-runtime') response = runtime_sm_client.invoke_endpoint( EndpointName ='my-endpoint', ContentType = 'text/csv', TargetContainerHostname='secondContainer', Body = body)

Para cada solicitud de invocación directa a un punto de conexión multicontenedor, solo el contenedor con TargetContainerHostname procesa la solicitud de invocación. Se producirán errores de validación si realiza alguna de las siguientes acciones:

  • Especificar un TargetContainerHostname que no exista en el punto de conexión

  • No especifique un valor para TargetContainerHostname en una solicitud a un punto de conexión configurado para invocación directa

  • No especifique un valor para TargetContainerHostname en una solicitud a un punto de conexión configurado para invocación directa.