As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Recomendador de SageMaker inferência da Amazon
O Amazon SageMaker Inference Recommender é um recurso do Amazon SageMaker AI. Ele reduz o tempo necessário para colocar modelos de aprendizado de máquina (ML) em produção ao automatizar os testes de carga e o ajuste de modelos em todas as instâncias de SageMaker AI ML. Você pode usar o recomendador de inferência para implantar seu modelo em um endpoint de inferência em tempo real ou sem servidor que ofereça melhor desempenho com custo mais baixo. O Inference Recommender ajuda você a selecionar o melhor tipo de instância e configuração para seus modelos e workloads de ML. Ele considera fatores como contagem de instâncias, parâmetros de contêiner, otimizações de modelo, simultaneidade máxima e tamanho da memória.
O Amazon SageMaker Inference Recommender cobra apenas pelas instâncias usadas durante a execução dos trabalhos.
Como funciona
Para usar o Amazon SageMaker Inference Recommender, você pode criar um modelo de SageMaker IA ou registrar um modelo no SageMaker Registro de modelos com seus artefatos de modelo. Use o console de SageMaker IA AWS SDK for Python (Boto3) ou o console para executar trabalhos de benchmarking para diferentes configurações de endpoints de SageMaker IA. Os trabalhos do recomendador de inferência ajudam você a coletar e visualizar métricas de desempenho e utilização de recursos para ajudá-lo a decidir qual tipo de endpoint e configuração escolher.
Como começar
Se você for um usuário iniciante do Amazon SageMaker Inference Recommender, recomendamos que você faça o seguinte:
-
Leia a Pré-requisitos para usar o Amazon Inference Recommender SageMaker seção para se certificar de que você atendeu aos requisitos para usar o Amazon SageMaker Inference Recommender.
-
Leia a seção Empregos de recomendação com o Amazon SageMaker Inference Recommender para iniciar seus primeiros trabalhos de recomendação do recomendador de inferência.
-
Explore o exemplo introdutório do caderno Jupyter do Amazon SageMaker Inference Recommender ou analise os exemplos de cadernos
na seção a seguir.
Cadernos de exemplo
O seguinte exemplo de cadernos Jupyter pode ajudá-lo com os fluxos de trabalho para vários casos de uso no recomendador de inferência:
-
Se você quiser um caderno introdutório que compare um TensorFlow modelo, consulte o caderno SageMaker Inference
Recommender. TensorFlow -
Se você quiser comparar um HuggingFace modelo, consulte o SageMaker Inference Recommender
para notebook. HuggingFace -
Se você quiser comparar um XGBoost modelo, consulte o caderno SageMaker Inference XGBoost Recommender
. -
Se você quiser revisar CloudWatch as métricas de seus trabalhos do Inference Recommender, consulte o caderno de métricas do SageMaker Inference CloudWatch Recommender
.