Políticas de Auto Scaling - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Políticas de Auto Scaling

Uma política de escalabilidade tem os seguintes componentes:

  • Uma métrica alvo — A CloudWatch métrica que, ElastiCache com o Valkey ou o Redis OSS Auto Scaling, usa para determinar quando e quanto escalar.

  • Capacidade mínima e máxima: o número mínimo e máximo de fragmentos a ser usado para a escalabilidade.

    Importante

    Ao criar a política de Auto Scaling, se a capacidade atual for maior que a capacidade máxima configurada, fazemos isso MaxCapacity durante scaleIn a criação da política. Da mesma forma, se a capacidade atual for menor que a capacidade mínima configurada, nós vamos scaleOut para MinCapacity o.

  • Um período de desaquecimento: a quantidade de tempo, em segundos, que outra ação de aumento ou redução de escala na horizontal deve aguardar antes de ser iniciada, após a conclusão de uma ação de expansão ou redução.

  • Uma função vinculada ao serviço — uma função do AWS Identity and Access Management (IAM) vinculada a um serviço específico AWS . Uma função vinculada ao serviço inclui todas as permissões que o serviço exige para chamar outros AWS serviços em seu nome. ElastiCache com Valkey ou RedisOSS, o Auto Scaling gera automaticamente essa função AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG para você.

  • Habilitar ou desabilitar atividades de redução de escala na horizontal: capacidade de habilitar ou desabilitar atividades de redução de escala na horizontal para uma política.

Métrica de destino para o Auto Scaling

Nesse tipo de política, uma métrica predefinida ou personalizada e um valor alvo para a métrica são especificados em uma configuração de política de escalabilidade de rastreamento de metas. ElastiCache com Valkey ou Redis, o Auto OSS Scaling cria e CloudWatch gerencia alarmes que acionam a política de escalabilidade e calculam o ajuste de escalabilidade com base na métrica e no valor alvo. A política de escalabilidade adiciona ou remove fragmentos/réplicas conforme necessário para manter a métrica no valor de destino especificado ou próxima a ele. Além de manter a métrica próxima ao valor de destino, uma política de escalabilidade de rastreamento de destino também se ajusta às flutuações na métrica, devido a workloads variáveis. Essas políticas também minimizam flutuações rápidas no número de fragmentos/réplicas disponíveis para seu cluster.

Por exemplo, considere uma política de escalabilidade que use a métrica predefinida de média ElastiCachePrimaryEngineCPUUtilization. Essa política pode manter a CPU utilização em, ou perto de, uma porcentagem específica de utilização, como 70 por cento.

nota

Para cada cluster, você pode criar somente uma política de Auto Scaling para cada métrica de destino.

Capacidades mínima e máxima

Estilhaços

Você pode especificar o número máximo de fragmentos que podem ser escalados ElastiCache com o escalonamento automático Valkey ou Redis. OSS Esse valor deve ser menor que ou igual a 250, com um mínimo de 1. Você também pode especificar o número mínimo de fragmentos a serem gerenciados pelo escalonamento automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de fragmentos de 250.

Réplicas

Você pode especificar o número máximo de réplicas a serem gerenciadas ElastiCache com o OSS escalonamento automático Valkey ou Redis. Esse valor deve ser igual ou menor que 5. Você também pode especificar o número mínimo de réplicas a serem gerenciadas pelo escalonamento automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de réplicas de 5.

Para determinar o número mínimo e máximo de fragmentos/réplicas que você precisa para um tráfego típico, teste a configuração do Auto Scaling com a taxa esperada de tráfego para o modelo.

nota

ElastiCache com as políticas de OSS auto scaling do Valkey ou do Redis, aumente a capacidade do cluster até que ele atinja o tamanho máximo definido ou até que os limites de serviço sejam aplicados. Para solicitar um aumento de limite, consulte Limites de serviço da AWS e selecione o tipo de limite Nodes per cluster per instance type (Nós por cluster por tipo de instância).

Importante

Redução de escala na horizontal quando não há tráfego Se o tráfego de uma variante se tornar zero, ElastiCache com Valkey ou Redis, escale OSS automaticamente para o número mínimo de instâncias especificado.

Período de desaquecimento

Você pode ajustar a responsividade das políticas de escalabilidade com monitoramento do objetivo, adicionando períodos de desaquecimento que afetam a escalabilidade de seu cluster. Um desaquecimento bloqueia solicitações subsequentes de redução ou expansão até o período expirar. Isso retarda a exclusão de fragmentos/réplicas em seu OSS cluster ElastiCache com Valkey ou Redis para solicitações de expansão e a criação de fragmentos/réplicas para solicitações de expansão. Você pode especificar os seguintes desaquecimentos:

  • Uma atividade de escalabilidade reduz o número de fragmentos/réplicas em seu cluster. Um desaquecimento de redução especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de redução antes que quaisquer outras atividades de redução possam iniciar.

  • Uma atividade de expansão aumenta o número de fragmentos/réplicas em seu cluster. Um desaquecimento de expansão especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de expansão antes que quaisquer outras atividades de expansão possam iniciar.

Quando o período de desaquecimento de redução ou aumento de escala na horizontal não é especificado, o padrão para o aumento é de 600 segundos, e para a redução, 900 segundos.

Habilitar ou desabilitar atividades de redução

Você pode habilitar ou desabilitar atividades de redução para as políticas. Habilitar atividades de redução de escala na horizontal permite que as políticas de escalabilidade excluam fragmentos/réplicas. Quando as atividades de redução são habilitadas, o desaquecimento de redução na política de escalabilidade aplica-se a atividades de redução. Desabilitar atividades de redução de escala na horizontal evita que as políticas de escalabilidade excluam fragmentos/réplicas.

nota

As atividades de escalabilidade horizontal estão sempre habilitadas para que a política de escalabilidade possa ser criada ElastiCache com fragmentos/réplicas do Valkey ou do RedisOSS, conforme necessário.