As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Como a escalabilidade preditiva funciona
Este tópico explica como a escalabilidade preditiva funciona e descreve o que considerar ao criar uma política de escalabilidade preditiva.
Como funciona
Para usar a escala preditiva, crie uma política de escalabilidade preditiva que especifique a CloudWatch métrica a ser monitorada e analisada. Para que a escala preditiva comece a prever valores futuros, essa métrica deve ter pelo menos 24 horas de dados.
Depois de criar a política, a escalabilidade preditiva começa a analisar os dados métricos dos últimos 14 dias para identificar padrões. Ele usa essa análise para gerar uma previsão horária dos requisitos de capacidade para as próximas 48 horas. A previsão é atualizada a cada 6 horas usando os CloudWatch dados mais recentes. À medida que novos dados chegam, a escala preditiva é capaz de melhorar continuamente a precisão das previsões futuras.
Quando você ativa a escala preditiva pela primeira vez, ela é executada somente no modo de previsão. Nesse modo, ele gera previsões de capacidade, mas na verdade não escala seu grupo de Auto Scaling com base nessas previsões. Isso permite avaliar a precisão e a adequação da previsão. Você pode visualizar os dados de previsão usando a GetPredictiveScalingForecast
API operação ou AWS Management Console o.
Depois de analisar os dados de previsão e decidir começar a escalar com base nesses dados, mude a política de escalabilidade para o modo de previsão e escala. Neste modo:
-
Se a previsão espera um aumento na carga, o Amazon EC2 Auto Scaling aumentará a capacidade com a escalabilidade horizontal.
-
Se a previsão esperar uma diminuição na carga, ela não será ampliada para remover a capacidade. Se quiser remover a capacidade que não é mais necessária, você deve criar políticas de escalabilidade dinâmica.
Por padrão, o Amazon EC2 Auto Scaling escala seu grupo de Auto Scaling no início de cada hora com base na previsão daquela hora. Opcionalmente, você pode especificar um horário de início anterior usando a SchedulingBufferTime
propriedade na PutScalingPolicy
API operação ou a configuração de instâncias de pré-lançamento no. AWS Management Console Isso faz com que o Amazon EC2 Auto Scaling lance novas instâncias antes da demanda prevista, dando tempo para inicializar e se preparar para lidar com o tráfego.
Para oferecer suporte ao lançamento de novas instâncias antes da demanda prevista, é altamente recomendável que você ative o aquecimento de instâncias padrão para seu grupo de Auto Scaling. Isso especifica um período após uma atividade de escalabilidade horizontal durante o qual o Amazon EC2 Auto Scaling não será escalado, mesmo que as políticas de escalabilidade dinâmica indiquem que a capacidade deve ser reduzida. Isso ajuda você a garantir que as instâncias recém-lançadas tenham tempo suficiente para começar a atender ao aumento do tráfego antes de serem consideradas para operações de expansão. Para obter mais informações, consulte Definir o aquecimento padrão da instância para um grupo do Auto Scaling.
Limite máximo de capacidade
Os grupos de Auto Scaling têm uma configuração de capacidade máxima que limita o número máximo de EC2 instâncias que podem ser executadas para o grupo. Por padrão, quando as políticas de escalabilidade são definidas, elas não podem aumentar a capacidade acima da capacidade máxima.
Como alternativa, você pode permitir que a capacidade máxima do grupo seja aumentada automaticamente se a capacidade prevista se aproximar ou exceder a capacidade máxima do grupo Auto Scaling. Para habilitar esse comportamento, use as MaxCapacityBuffer
propriedades MaxCapacityBreachBehavior
e na PutScalingPolicy
API operação ou a configuração de comportamento de capacidade máxima no AWS Management Console.
Atenção
Tenha cuidado ao permitir que a capacidade máxima seja aumentada automaticamente. Isso pode fazer com que mais instâncias sejam lançadas do que o pretendido se o aumento da capacidade máxima não for monitorado e gerenciado. A capacidade máxima aumentada então se torna a nova capacidade máxima normal para o grupo Auto Scaling até que você a atualize manualmente. A capacidade máxima não diminui automaticamente de volta ao máximo original.
Considerações
-
Confirme se a escalabilidade preditiva é adequada para sua workload. Uma workload será uma boa opção para o uso da escalabilidade preditiva se ela apresentar padrões de carga recorrentes específicos do dia da semana ou da hora do dia. Para verificar isso, configure políticas de escalabilidade preditiva no modo somente previsão e consulte as recomendações do console. O Amazon EC2 Auto Scaling fornece recomendações com base em observações sobre o desempenho potencial da política. Avalie a previsão e as recomendações antes de permitir que a escalabilidade preditiva escale ativamente sua aplicação.
-
A escalabilidade preditiva precisa de pelo menos 24 horas de dados históricos para começar a previsão. No entanto, as previsões serão mais eficazes se os dados históricos abrangerem duas semanas completas. Se você atualizar sua aplicação criando um novo do grupo do Auto Scaling e excluindo o antigo, o novo grupo do Auto Scaling precisará de 24 horas de dados históricos de carga antes que a escalabilidade preditiva possa começar a gerar previsões novamente. É possível usar métricas personalizadas para agregar métricas em grupos do Auto Scaling novos e antigos. Senão, talvez seja necessário esperar alguns dias para obter uma previsão mais precisa.
-
Escolha uma métrica de carga que represente com precisão a carga total do seu aplicativo e seja o aspecto do seu aplicativo que é mais importante escalar.
-
Usar escalabilidade dinâmica com escalabilidade preditiva ajuda você a acompanhar de perto a curva de demanda do seu aplicativo, aumentando a escala durante períodos de baixo tráfego e aumentando a escala quando o tráfego é maior do que o esperado. Quando várias políticas de escalabilidade estão ativas, cada política determina a capacidade desejada de forma independente e a capacidade desejada é definida como a capacidade máxima entre essas. Por exemplo, se 10 instâncias forem necessárias para permanecer na utilização-alvo em uma política de escalabilidade com monitoramento do objetivo e 8 instâncias forem necessárias para permanecer na utilização-alvo em uma política de dimensionamento preditiva, a capacidade desejada do grupo será definida como 10. Se você não conhece o escalonamento dinâmico, recomendamos o uso de políticas de escalabilidade de rastreamento de metas. Para obter mais informações, consulte Escalabilidade dinâmica para Amazon EC2 Auto Scaling.
-
Um pressuposto básico da escalabilidade preditivo é que o grupo do Auto Scaling é homogêneo e todas as instâncias têm capacidade igual. Se isso não for verdade para seu grupo, a capacidade prevista pode ser imprecisa. Portanto, tenha cuidado ao criar políticas de escalabilidade preditiva para grupos mistos de instâncias, pois podem ser provisionadas instâncias de diferentes tipos com capacidade desigual. Veja a seguir alguns exemplos para os quais a capacidade prevista será imprecisa:
-
Sua política de escalabilidade preditiva é baseada na CPU utilização, mas o número de vCPUs em cada instância do Auto Scaling varia entre os tipos de instância.
-
Sua política de escalabilidade preditiva é baseada na entrada ou na saída da rede, mas throughput de largura de banda da rede para cada instância do Auto Scaling varia entre os tipos de instância. Por exemplo, os tipos de instância M5 e M5n são semelhantes, mas o tipo de instância M5n oferece throughput de rede significativamente maior.
-
Regiões compatíveis
Leste dos EUA (Norte da Virgínia)
Leste dos EUA (Ohio)
Oeste dos EUA (N. da Califórnia)
Oeste dos EUA (Oregon)
África (Cidade do Cabo)
Ásia-Pacífico (Hong Kong)
Ásia-Pacífico (Jacarta)
Ásia-Pacífico (Mumbai)
Ásia-Pacífico (Osaka)
Ásia-Pacífico (Seul)
Ásia-Pacífico (Singapura)
Ásia-Pacífico (Sydney)
Ásia-Pacífico (Tóquio)
Canadá (Central)
China (Pequim)
China (Ningxia)
Europa (Frankfurt)
Europa (Irlanda)
Europa (Londres)
Europa (Milão)
Europa (Paris)
Europa (Estocolmo)
Oriente Médio (Barém)
Oriente Médio (UAE)
América do Sul (São Paulo)
AWS GovCloud (Leste dos EUA)
AWS GovCloud (Oeste dos EUA)