Invoque um endpoint de vários contêineres com invocação direta

Os endpoints de vários contêineres do SageMaker permitem que os clientes implantem vários contêineres para modelos diferentes, em um único endpoint do SageMaker. Você pode hospedar até 15 contêineres de inferência diferentes em um único endpoint. Quando usar a invocação direta, você pode enviar uma solicitação para um contêiner de inferência específico hospedado em um endpoint de vários contêineres.

Para invocar um endpoint de vários contêineres com invocação direta, chame invoke_endpoint como você invocaria qualquer outro endpoint e especifique qual contêiner você deseja invocar usando o parâmetro TargetContainerHostname.

O exemplo a seguir invoca diretamente o secondContainer de um endpoint de vários contêineres para obter uma predição.


import boto3
runtime_sm_client = boto3.Session().client('sagemaker-runtime')

response = runtime_sm_client.invoke_endpoint(
   EndpointName ='my-endpoint',
   ContentType = 'text/csv',
   TargetContainerHostname='secondContainer', 
   Body = body)

Para cada solicitação de invocação direta para um endpoint de vários contêineres, somente o contêiner com o TargetContainerHostname processa a solicitação de invocação. Você receberá erros de validação se fizer o seguinte:

Especifique um TargetContainerHostname que não exista no endpoint
Não especifique um valor para TargetContainerHostname em uma solicitação para um endpoint configurado para invocação direta
Especifique um valor para TargetContainerHostname em uma solicitação para um endpoint que não esteja configurado para invocação direta.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Atualizar um endpoint de vários contêineres

Segurança com um endpoint de vários contêineres com invocação direta