REL07-BP03 Obter recursos após determinar que mais recursos são necessários para uma workload
Escale os recursos proativamente para atender à demanda e evitar impacto na disponibilidade.
Muitos serviços da AWS são escalados automaticamente para atender à demanda. Se estiver usando instâncias do Amazon EC2 ou clusters do Amazon ECS, você poderá configurar o ajuste de escala automático desses clusters para que ocorra com base nas métricas de uso que correspondam à demanda da workload. Para o Amazon EC2, a utilização média da CPU, a contagem de solicitações do balanceador de carga ou a largura de banda da rede podem ser usadas para aumentar (ou reduzir) a escala horizontalmente das instâncias do EC2. Para o Amazon ECS, a utilização média da CPU, a contagem de solicitações do balanceador de carga e a utilização da memória podem ser usados para aumentar (ou reduzir) a escala horizontalmente das tarefas do ECS. Usando o ajuste de escala automático do destino na AWS, o Auto Scaler atua como um termostato doméstico, adicionando ou removendo recursos para manter o valor pretendido (por exemplo, 70% de utilização da CPU) que você especificar.
O Amazon EC2 Auto Scaling também pode fazer o ajuste de escala automático preditivo, que usa machine learning para analisar a workload histórica de cada recurso e prevê regularmente a carga futura para os próximos dois dias.
A Lei de Little ajuda a calcular quantas instâncias de computação (instâncias do EC2, funções simultâneas do Lambda, etc.) são necessárias.
L = λW
L = número de instâncias (ou simultaneidade média no sistema)
λ = taxa média na qual as solicitações chegam (requisições por segundo)
W = tempo médio que cada solicitação gasta no sistema (s)
Por exemplo, a 100 rps, se cada solicitação demorar 0,5 segundos para ser processada, você precisará de 50 instâncias para acompanhar a demanda.
Nível de risco exposto se esta prática recomendada não for estabelecida: Médio
Orientação para implementação
-
Obtenha recursos após a detecção de que mais recursos são necessários para uma workload. Escale os recursos proativamente para atender à demanda e evitar impacto na disponibilidade.
-
Calcule quantos recursos computacionais serão necessários (simultaneidade de computação) para atender a uma determinada taxa de solicitações.
-
Quando você tiver um padrão histórico de uso, configure o ajuste de escala agendado para o Amazon EC2 Auto Scaling.
-
Usar o ajuste de escala preditivo da AWS
-
Recursos
Documentos relacionados: