Políticas de dimensionamento com monitoramento do objetivo para o Application Auto Scaling
Uma política de escalabilidade de rastreamento de destinos escala automaticamente a aplicação com base em um valor de métrica de destino. Isso permite que a aplicação mantenha uma performance ideal e uma eficiência de custos sem a necessidade de intervenção manual.
Com o rastreamento de destinos, você seleciona uma métrica e um valor de destino para representar a utilização média ideal ou o nível de throughput para a aplicação. O Application Auto Scaling cria e gerencia os alarmes do CloudWatch que acionam eventos de escalabilidade quando a métrica se desvia do destino. Isso é semelhante a como um termostato mantém a temperatura desejada.
Por exemplo, digamos que você tenha um aplicativo atualmente executado em uma frota spot e queira que a utilização de CPU da frota permaneça próximo de 50% quando a carga no aplicativo mudar. Isso fornece capacidade extra para lidar com picos de tráfego sem manter um número excessivo de recursos ociosos.
Você pode satisfazer essa necessidade criando uma política de escalabilidade com monitoramento de objetivo visando uma utilização média de 50% da CPU. Em seguida, o Application Auto Scaling aumentará a escala horizontalmente (aumento da capacidade) quando a CPU exceder 50% para lidar com o aumento de carga. Ele reduzirá a escala horizontalmente (diminuição da capacidade) quando a CPU estiver abaixo de 50% para otimizar os custos durante os períodos de baixa utilização.
As políticas de rastreamento de destinos eliminam a necessidade de definir manualmente os alarmes e os ajustes de escalabilidade do CloudWatch. O Application Auto Scaling lida com isso automaticamente com base no destino definido.
É possível basear as políticas de rastreamento de destinos em métricas definidas previamente ou personalizadas:
-
Métricas definidas previamente: correspondem a métricas fornecidas pelo Application Auto Scaling, como a utilização média da CPU ou a contagem média de solicitações por destino.
-
Métricas personalizadas: é possível usar a matemática em métricas para combinar métricas, aproveitar métricas existentes ou usar suas próprias métricas personalizadas publicadas no CloudWatch.
Escolha uma métrica que realiza alterações inversamente proporcionais a uma alteração na capacidade do seu destino escalável. Portanto, se você dobrar a capacidade, a métrica diminuirá em 50%. Isso permite que os dados de métricas acionem com precisão eventos de escalabilidade proporcionais.