As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Escalabilidade automática dos modelos da Amazon SageMaker
A Amazon SageMaker oferece suporte à escalabilidade automática (escalabilidade automática) para seus modelos hospedados. O ajuste de escala automático ajusta dinamicamente o número de instâncias provisionadas para um modelo em resposta às alterações no workload. Quando a workload aumenta, o ajuste de escala automático disponibiliza mais instâncias online. Quando a workload diminui, o ajuste de escala automático remove as instâncias desnecessárias para que você não precise pagar pelas instâncias provisionadas que não está usando.
Tópicos
- Visão geral das políticas de ajuste de escala automático
- Pré-requisitos de escalonamento automático
- Configurar a ajuste de escala automático do modelo com o console
- Registrar um modelo
- Definir uma política de escalabilidade
- Aplicar uma política de escalabilidade
- Instruções para editar uma política de escalabilidade
- Desative temporariamente as políticas de escalabilidade
- Excluir uma política de escalabilidade
- Verifique o status de uma atividade de escalabilidade descrevendo as atividades de escalabilidade
- Testes de carga da configuração de ajuste de escala automático
- Use AWS CloudFormation para criar uma política de escalabilidade
- Atualize endpoints que usam escalonamento automático
- Excluir endpoints configurados para escalonamento automático