As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Opções avançadas de endpoint para inferência com a Amazon AI SageMaker
Com a inferência em tempo real, você pode otimizar ainda mais o desempenho e o custo com as seguintes opções avançadas de inferência:
-
Endpoints multimodelo: Use esta opção se você tiver vários modelos que usam o mesmo framework e podem compartilhar um contêiner. Essa opção ajuda a otimizar os custos melhorando a utilização do endpoint e reduzindo as despesas de implantação.
-
Endpoint com vários contêineres: Use esta opção se você tiver vários modelos que usam frameworks diferentes e requerem contêineres próprios. Você obtém muitos dos benefícios dos endpoints multimodelo e pode implantar uma variedade de estruturas e modelos.
-
Pipelines de inferência serial: use esta opção se você deseja hospedar modelos com lógica de pré-processamento e pós-processamento por trás de um endpoint. Os pipelines de inferência são totalmente gerenciados pela SageMaker IA e oferecem menor latência porque todos os contêineres são hospedados nas mesmas instâncias da Amazon. EC2