Endpoint com vários contêineres

SageMaker Os endpoints de IA de vários contêineres permitem que os clientes implantem vários contêineres, que usam modelos ou estruturas diferentes, em um único SageMaker endpoint de IA. Os contêineres podem ser executados em uma sequência como um pipeline de inferência, ou cada contêiner pode ser acessado individualmente usando invocação direta para melhorar a utilização do endpoint e otimizar os custos.

Para obter informações sobre como invocar os contêineres em um endpoint de vários contêineres em sequência, consulte Pipelines de inferência na Amazon AI SageMaker.

Para obter informações sobre como invocar o contêiner específico em um endpoint de vários contêineres em sequência, consulte Invoque um endpoint de vários contêineres com invocação direta

Tópicos

A política a seguir permite solicitações invoke_endpoint somente quando o valor do campo TargetContainerHostname corresponde a uma das expressões regulares especificadas.

A política a seguir nega solicitações invoke_endpoint somente quando o valor do campo TargetContainerHostname corresponde a uma das expressões regulares especificadas na declaração Deny.

Para obter informações sobre chaves de condição de SageMaker IA, consulte Chaves de condição para SageMaker IA no Guia AWS Identity and Access Management do usuário.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Defina políticas de ajuste de escala automático para implantações de endpoints multimodelo

Criar um endpoint de vários contêineres (Boto 3)