As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Dimensione automaticamente os SageMaker modelos da Amazon
A Amazon SageMaker oferece suporte à escalabilidade automática (escalabilidade automática) para seus modelos hospedados. O ajuste de escala automático ajusta dinamicamente o número de instâncias provisionadas para um modelo em resposta às alterações no workload. Quando a workload aumenta, o ajuste de escala automático disponibiliza mais instâncias online. Quando a workload diminui, o ajuste de escala automático remove as instâncias desnecessárias para que você não precise pagar pelas instâncias provisionadas que não está usando.
Tópicos
- Visão geral do Auto Scaling
- Configurar a ajuste de escala automático do modelo com o console
- Registrar um modelo
- Definir uma política de escalabilidade
- Aplicar uma política de escalabilidade
- Editar uma política de escalabilidade
- Excluir uma política de escalabilidade
- Verifique o status de uma atividade de escalabilidade descrevendo as atividades de escalabilidade
- Testes de carga da configuração de ajuste de escala automático
- Use AWS CloudFormation para criar uma política de escalabilidade
- Atualizar ou excluir endpoints que usam escalonamento automático