Opções avançadas de endpoint para inferência com a Amazon AI SageMaker

Com a inferência em tempo real, você pode otimizar ainda mais o desempenho e o custo com as seguintes opções avançadas de inferência:

Endpoints multimodelo: Use esta opção se você tiver vários modelos que usam o mesmo framework e podem compartilhar um contêiner. Essa opção ajuda a otimizar os custos melhorando a utilização do endpoint e reduzindo as despesas de implantação.
Endpoint com vários contêineres: Use esta opção se você tiver vários modelos que usam frameworks diferentes e requerem contêineres próprios. Você obtém muitos dos benefícios dos endpoints multimodelo e pode implantar uma variedade de estruturas e modelos.
Pipelines de inferência serial: use esta opção se você deseja hospedar modelos com lógica de pré-processamento e pós-processamento por trás de um endpoint. Os pipelines de inferência são totalmente gerenciados pela SageMaker IA e oferecem menor latência porque todos os contêineres são hospedados nas mesmas instâncias da Amazon. EC2

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Opções de inferência

Próximas etapas