Obter instâncias prospectivas instantâneas

O Inference Recommender também pode fornecer uma lista de instâncias em potencial, ou tipos de instância que podem ser adequados para seu modelo, na página de detalhes do modelo de SageMaker IA. O recomendador de inferência executa automaticamente a análise comparativa em relação ao seu modelo para que você forneça as instâncias potenciais. Como essas são recomendações preliminares, recomendamos que você execute outros trabalhos de recomendação de instâncias para obter resultados mais precisos.

Você pode ver uma lista de instâncias potenciais do seu modelo de forma programática usando a DescribeModelAPI, o SDK do SageMaker Python ou o console de IA. SageMaker

nota

Você não obterá instâncias potenciais para modelos que você criou na SageMaker IA antes que esse recurso fosse disponibilizado.

Para visualizar instâncias em potencial para seu modelo por meio do console, faça o seguinte:

Acesse o SageMaker console em https://console.aws.amazon.com/sagemaker/.
No painel de navegação à esquerda, selecione Inferência e, em seguida, selecione Modelos.
Na lista de modelos, escolha seu modelo.

Na página de detalhes do seu modelo, acesse a seção Instâncias potenciais para implantar o modelo. A captura de tela a seguir mostra essa seção.

Captura de tela da lista de instâncias potenciais na página de detalhes do modelo.

Nesta seção, você pode visualizar as possíveis instâncias otimizadas em termos de custo, throughput e latência para implantação do modelo, juntamente com informações adicionais para cada tipo de instância, como tamanho da memória, contagem de CPU e GPU e custo por hora.

Se você decidir comparar um exemplo de carga útil e executar um trabalho completo de recomendação de inferência para seu modelo, poderá iniciar um trabalho de recomendação de inferência padrão nesta página. Para iniciar um trabalho padrão por meio do console, faça o seguinte:

Na página de detalhes do modelo, na seção Instâncias potenciais para implantar o modelo, escolha Executar o trabalho de recomendador de inferência.
Na caixa de diálogo que aparece, para o bucket do S3 para análise comparativa da carga útil, insira o local do Amazon S3 onde você armazenou um exemplo de carga para seu modelo.
Em Tipo de conteúdo da carga útil, insira os tipos de MIME para seus dados de carga útil.
(Opcional) Na seção Compilação de modelo usando SageMaker Neo, para a configuração de entrada de dados, insira uma forma de dados no formato de dicionário.
Escolha Executar trabalho.

O Inference Recommender inicia o trabalho, e você pode ver o trabalho e seus resultados na página da lista de recomendações de inferência no console de IA. SageMaker

Se você quiser executar um trabalho avançado e realizar testes de carga personalizados ou se quiser definir configurações e parâmetros adicionais para seu trabalho, consulte Executar um teste de carga personalizado.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Trabalhos de recomendação

Recomendações de inferência