Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Para crear un punto de conexión multicontenedor (Boto 3)

Modo de enfoque
Para crear un punto de conexión multicontenedor (Boto 3) - Amazon SageMaker

Cree un punto de conexión multicontenedor llamando a las API CreateModel, CreateEndpointConfig y CreateEndpoint como lo haría para crear cualquier otro punto de conexión. Puede ejecutar estos contenedores secuencialmente como una canalización de inferencia o ejecutar cada contenedor individual mediante la invocación directa. Los puntos de conexión multicontenedor tienen los siguientes requisitos cuando llama: create_model

  • Utilice el parámetro Containers en lugar de PrimaryContainer e incluya más de un contenedor en el parámetro Containers.

  • El ContainerHostname parámetro es obligatorio para cada contenedor en un punto de conexión multicontenedor con invocación directa.

  • Defina el parámetro Mode del campo InferenceExecutionConfig en Direct para la invocación directa de cada contenedor o Serial para utilizarlos como una canalización de inferencia. El modo predeterminado es Serial.

nota

Actualmente, hay un límite de hasta 15 contenedores admitidos en un punto de conexión multicontenedor.

En el siguiente ejemplo, se crea un modelo multicontenedor para la invocación directa.

  1. Cree elementos contenedores y InferenceExecutionConfig con invocación directa.

    container1 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag', 'ContainerHostname': 'firstContainer' } container2 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag', 'ContainerHostname': 'secondContainer' } inferenceExecutionConfig = {'Mode': 'Direct'}
  2. Cree el modelo con los elementos contenedores y establece el campo InferenceExecutionConfig.

    import boto3 sm_client = boto3.Session().client('sagemaker') response = sm_client.create_model( ModelName = 'my-direct-mode-model-name', InferenceExecutionConfig = inferenceExecutionConfig, ExecutionRoleArn = role, Containers = [container1, container2] )

Para crear un punto de conexión, debe llamar a create_endpoint_config y create_endpoint como lo haría para crear cualquier otro punto de conexión.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.