Como funcionam os planos de escalabilidade - AWS Auto Scaling

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como funcionam os planos de escalabilidade

AWS Auto Scaling permite que você use planos de escalabilidade para configurar um conjunto de instruções para escalar seus recursos. Se você trabalha com AWS CloudFormation ou adiciona tags a recursos escaláveis, pode configurar planos de escalabilidade para diferentes conjuntos de recursos, por aplicativo. O AWS Auto Scaling console fornece recomendações para estratégias de escalabilidade personalizadas para cada recurso. Após criar o plano de escalabilidade, ele mescla escalabilidade dinâmica e métodos de escalabilidade preditiva para oferecer suporte à estratégia de escalabilidade.

O que é uma estratégia de escalabilidade?

A estratégia de escalabilidade explica AWS Auto Scaling como otimizar a utilização dos recursos em seu plano de escalabilidade. Você pode otimizar para disponibilidade de custo ou um equilíbrio de ambos. Como alternativa, você também pode criar sua própria estratégia personalizada, de acordo com as métricas e os limites definidos por você. Você pode definir estratégias separadas para cada recurso ou tipo de recurso.

As estratégias de escalabilidade incluem a otimização da disponibilidade versus custo, ou o equilíbrio entre elas.
O que é a escalabilidade dinâmica?

A escalabilidade dinâmica cria políticas de escalabilidade de rastreamento de destino para os recursos ​​em seu plano de escalabilidade. Essas políticas de escalabilidade ajustam a capacidade do recurso em resposta a alterações ativas na utilização de recursos. A intenção é fornecer capacidade suficiente para manter a utilização no valor de destino especificado pela estratégia de escalabilidade. Isso é semelhante à forma como o termostato mantém a temperatura da casa. Você escolhe a temperatura, e o termostato faz o resto.

Gráficos comparando a utilização e a capacidade com e sem escalabilidade dinâmica.

Por exemplo, você pode configurar seu plano de escalabilidade para manter o número de tarefas que o serviço do Amazon Elastic Container Service (Amazon ECS) executa em 75% da CPU. Quando a utilização da CPU do serviço ultrapassa 75% (o que significa que mais de 75% da CPU reservada para o serviço está sendo usada), o alarme de expansão aciona sua política de escalabilidade para adicionar outra tarefa ao serviço para ajudar com o aumento de carga.

O que é a escalabilidade preditiva?

A escalabilidade preditiva usa machine learning para analisar toda a workload histórica do recurso e faz previsões regulares sobre a carga futura. É um método semelhante ao das previsões meteorológicas. Usando a previsão, a escalabilidade preditiva gera ações de escalabilidade programadas para garantir que a capacidade do recurso esteja disponível antes que o aplicativo precise dela. Assim como na escalabilidade dinâmica, a escalabilidade preditiva funciona para manter a utilização no valor de destino especificado pela estratégia de escalabilidade.

Gráficos mostrando a carga histórica, a previsão gerada e as ações de escalonamento tomadas.

Por exemplo, você pode habilitar a escalabilidade preditiva e configurar a estratégia de escalabilidade para manter a utilização média da CPU do grupo do Auto Scaling em 50%. Sua previsão chama picos de tráfego para ocorrerem todos os dias às 8h. O plano de escalabilidade cria as ações de escalabilidade agendadas futuras para garantir que o grupo do Auto Scaling esteja pronto para lidar com o tráfego com antecedência. Isso ajuda a manter a performance do aplicativo constante, com o objetivo de sempre ter a utilização de recursos o mais próximo possível de 50% o tempo todo.

Veja a seguir os principais conceitos para entender escalabilidade preditiva:

  • Previsão de carga: AWS Auto Scaling analisa até 14 dias de histórico para uma métrica de carga especificada e prevê a demanda futura para os próximos dois dias. Esses dados estão disponíveis em intervalos de uma hora e são atualizados diariamente.

  • Ações de escalonamento programadas: AWS Auto Scaling programa as ações de escalabilidade que aumentam e diminuem proativamente a capacidade de acordo com a previsão de carga. No horário programado, AWS Auto Scaling atualiza a capacidade mínima com o valor especificado pela ação de escalabilidade programada. A intenção é manter a utilização de recursos no valor de destino especificado pela estratégia de escalabilidade. Se o seu aplicativo requer mais capacidade que previsão, escalabilidade dinâmica está disponível para adicionar capacidade adicional.

  • Comportamento de capacidade máxima: limites de capacidade mínima e máxima para autoescalabilidade se aplicam a cada recurso. No entanto, é possível controlar se a aplicação pode aumentar a capacidade além de sua capacidade máxima quando a capacidade de previsão é maior que a capacidade máxima.

nota

Agora é possível usar as políticas de escalabilidade preditiva dos grupos do Auto Scaling. Para obter mais informações, consulte Escalabilidade predtiva o Amazon EC2 Auto Scaling no Manual do usuário do Amazon EC2 Auto Scaling.