As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajuste de escala automático com endpoints
Em vez de ajustar manualmente o número de unidades de inferência provisionadas para seus endpoints de classificação de documentos e endpoints de reconhecimento de entidades, você pode usar o ajuste de escala automático para definir automaticamente o provisionamento de endpoints de acordo com suas necessidades de capacidade.
Há duas maneiras de usar o ajuste de escala automático para ajustar o número de unidades de inferência provisionadas para seu endpoint:
-
Monitoramento do objetivo: defina o ajuste de escala automático para ajustar o provisionamento de endpoints de acordo com as necessidades de capacidade com base no uso.
-
Escalabilidade programada: defina o ajuste de escala automático para ajustar o provisionamento de endpoints de acordo com as necessidades de capacidade em um cronograma especificado.
Você pode definir o escalonamento automático somente com o AWS Command Line Interface (AWS CLI). Para obter mais informações sobre o ajuste de escala automático, consulte O que é o Application Auto Scaling?