Como funciona Limites máximos de capacidade Considerações Regiões do compatíveis

Como a escalabilidade preditiva funciona

Este tópico explica como funciona a escala preditiva e descreve o que deve ser considerado quando você cria uma política de escala preditiva.

Tópicos

Como funciona
Limites máximos de capacidade
Considerações
Regiões do compatíveis

Como funciona

Para usar a escala preditiva, crie uma política de escalabilidade preditiva que especifique a CloudWatch métrica a ser monitorada e analisada. Para que a escala preditiva comece a prever valores futuros, essa métrica deve ter pelo menos 24 horas de dados.

Depois que você cria a política, a escala preditiva começa a analisar os dados de métricas dos últimos 14 dias para identificar padrões. Ele usa essa análise para gerar uma previsão horária dos requisitos de capacidade para as próximas 48 horas. A previsão é atualizada a cada 6 horas usando os CloudWatch dados mais recentes. À medida que novos dados chegam, a escala preditiva é capaz de melhorar continuamente a precisão das previsões futuras.

Quando você ativa a escala preditiva pela primeira vez, ela é executada no modo somente de previsão. Nesse modo, ele gera previsões de capacidade, mas não escala de fato seu grupo do Auto Scaling com base nessas previsões. Isso permite que você avalie a exatidão e a adequação da previsão. Você pode visualizar os dados de previsão usando a operação da API GetPredictiveScalingForecast ou o AWS Management Console.

Depois de revisar os dados de previsão e decidir iniciar a escala com base nesses dados, alterne a política de escala para o modo de previsão e escala. Neste modo:

Se a previsão espera um aumento na carga, o Amazon EC2 Auto Scaling aumentará a capacidade com a escalabilidade horizontal.
Se a previsão esperar uma redução na carga, ela não será reduzida a escala horizontalmente para remover a capacidade. Se quiser remover a capacidade que não é mais necessária, você deverá criar políticas de escala dinâmica.

Por padrão, o Amazon EC2 Auto Scaling escala seu grupo de Auto Scaling no início de cada hora com base na previsão daquela hora. Opcionalmente, você pode especificar uma hora de início anterior usando a propriedade SchedulingBufferTime na operação da API PutScalingPolicy ou a configuração de instâncias de pré-execução no AWS Management Console. Isso faz com que o Amazon EC2 Auto Scaling lance novas instâncias antes da demanda prevista, dando tempo para inicializar e se preparar para lidar com o tráfego.

Para dar suporte à execução de novas instâncias antes da demanda prevista, recomendamos enfaticamente que você ative o aquecimento de instância padrão para o seu grupo do Auto Scaling. Isso especifica um período após uma atividade de escalabilidade horizontal durante o qual o Amazon EC2 Auto Scaling não será escalado, mesmo que as políticas de escalabilidade dinâmica indiquem que a capacidade deve ser reduzida. Isso ajuda você a garantir que as instâncias recém-executadas tenham tempo suficiente para começar a atender ao aumento do tráfego antes de serem consideradas para operações de redução da escala horizontalmente. Para obter mais informações, consulte Definir o aquecimento padrão da instância para um grupo do Auto Scaling.

Limites máximos de capacidade

Os grupos de Auto Scaling têm uma configuração de capacidade máxima que limita o número máximo de EC2 instâncias que podem ser executadas para o grupo. Quando as políticas de escalabilidade estão definidas, um grupo não pode aumentar sua capacidade desejada acima do limite da capacidade máxima.

Como alternativa, você pode permitir que a capacidade máxima do grupo seja aumentada automaticamente se a capacidade prevista se aproximar ou exceder a capacidade máxima do grupo do Auto Scaling. Para ativar esse comportamento, use as propriedades MaxCapacityBreachBehavior e MaxCapacityBuffer na operação da API PutScalingPolicy ou a configuração de comportamento de capacidade máxima no AWS Management Console.

Atenção

Tenha cuidado ao permitir que a capacidade máxima seja aumentada automaticamente. Isso pode fazer com que mais instâncias sejam executadas do que o pretendido se a capacidade máxima aumentada não for monitorada e gerenciada. A capacidade máxima aumentada passa a ser a nova capacidade máxima normal do grupo do Auto Scaling até que você a atualize manualmente. A capacidade máxima não diminui automaticamente de volta ao máximo original.

Considerações

Confirme se a escalabilidade preditiva é adequada para sua workload. Uma workload será uma boa opção para o uso da escalabilidade preditiva se ela apresentar padrões de carga recorrentes específicos do dia da semana ou da hora do dia. Para verificar isso, configure políticas de escalabilidade preditiva no modo somente previsão e consulte as recomendações do console. O Amazon EC2 Auto Scaling fornece recomendações com base em observações sobre o desempenho potencial da política. Avalie a previsão e as recomendações antes de permitir que a escalabilidade preditiva escale ativamente sua aplicação.
A escalabilidade preditiva precisa de pelo menos 24 horas de dados históricos para começar a previsão. No entanto, as previsões serão mais eficazes se os dados históricos abrangerem duas semanas completas. Se você atualizar sua aplicação criando um novo do grupo do Auto Scaling e excluindo o antigo, o novo grupo do Auto Scaling precisará de 24 horas de dados históricos de carga antes que a escalabilidade preditiva possa começar a gerar previsões novamente. É possível usar métricas personalizadas para agregar métricas em grupos do Auto Scaling novos e antigos. Senão, talvez seja necessário esperar alguns dias para obter uma previsão mais precisa.
Escolha uma métrica de carga que represente com precisão a carga total da sua aplicação e que seja o aspecto mais importante a ser escalado.
Usá-la com a escalabilidade preditiva ajuda você a seguir de perto a curva de demanda para a aplicação, reduzindo a escala na horizontal durante períodos de baixo tráfego e aumentando-a quando o tráfego é maior do que o esperado. Quando várias políticas de escalabilidade estão ativas, cada política determina a capacidade desejada de forma independente e a capacidade desejada é definida como a capacidade máxima entre essas. Por exemplo, se 10 instâncias forem necessárias para permanecer na utilização-alvo em uma política de escalabilidade com monitoramento do objetivo e 8 instâncias forem necessárias para permanecer na utilização-alvo em uma política de dimensionamento preditiva, a capacidade desejada do grupo será definida como 10. Também recomendamos usar políticas de ajuste de escala de rastreamento de metas em seu ajuste de escala dinâmico. Para obter mais informações, consulte Escalabilidade dinâmica para Amazon EC2 Auto Scaling.
Um pressuposto básico da escalabilidade preditivo é que o grupo do Auto Scaling é homogêneo e todas as instâncias têm capacidade igual. Se isso não for verdade para seu grupo, a capacidade prevista pode ser imprecisa. Portanto, tenha cuidado ao criar políticas de escalabilidade preditiva para grupos de instâncias mistas, já que diferentes tipos de instâncias podem ser provisionados com capacidades diferentes. Veja a seguir alguns exemplos para os quais a capacidade prevista será imprecisa:
- Sua política de escalabilidade preditiva é baseada na utilização da CPU, mas o número de v CPUs em cada instância do Auto Scaling varia entre os tipos de instância.
- Sua política de escalabilidade preditiva é baseada na entrada ou na saída da rede, mas throughput de largura de banda da rede para cada instância do Auto Scaling varia entre os tipos de instância. Por exemplo, os tipos de instância M5 e M5n são semelhantes, mas o tipo de instância M5n oferece throughput de rede significativamente maior.

Regiões do compatíveis

Leste dos EUA (Norte da Virgínia)
Leste dos EUA (Ohio)
Oeste dos EUA (Norte da Califórnia)
Oeste dos EUA (Oregon)
África (Cidade do Cabo)
Ásia-Pacífico (Hong Kong)
Ásia-Pacífico (Jacarta)
Ásia-Pacífico (Mumbai)
Ásia-Pacífico (Osaka)
Ásia-Pacífico (Seul)
Ásia-Pacífico (Singapura)
Ásia-Pacífico (Sydney)
Ásia-Pacífico (Tóquio)
Canadá (Central)
China (Pequim)
China (Ningxia)
Europa (Frankfurt)
Europa (Irlanda)
Europa (Londres)
Europa (Milão)
Europa (Paris)
Europa (Estocolmo)
Oriente Médio (Bahrein)
Oriente Médio (Emirados Árabes Unidos)
América do Sul (São Paulo)
AWS GovCloud (Leste dos EUA)
AWS GovCloud (Oeste dos EUA)

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Escalabilidade preditiva

Criar uma política de escalabilidade preditiva ()