Saiba mais sobre escalabilidade automática para frota spot - Amazon Elastic Compute Cloud

Saiba mais sobre escalabilidade automática para frota spot

A escalabilidade automática permite que a frota spot aumente ou diminua sua capacidade com base na demanda. Com escalabilidade automática, uma frota spot pode executar instâncias (aumentar a escala horizontalmente) ou encerrar instâncias (reduzir a escala horizontalmente) no intervalo especificado, em resposta a uma ou mais políticas de escalabilidade.

A escalabilidade automática para frota spot é possível por uma combinação das APIs do Amazon EC2, do Amazon CloudWatch e do Application Auto Scaling. As solicitações de frota spot são criadas com o Amazon EC2, os alarmes são criados com o CloudWatch e as políticas de escalabilidade são criadas com o Application Auto Scaling.

Tipos de escalabilidade automática

A frota spot oferece suporte aos seguintes tipos de escalabilidade automática:

  • Escalabilidade de rastreamento de destino: aumenta ou reduz a capacidade atual da frota com base em um valor pretendido para uma métrica específica. Isso é semelhante à forma como o termostato mantém a temperatura da sua casa, ou seja, você seleciona a temperatura desejada e o termostato faz o resto.

  • Escalabilidade em etapas: aumenta ou diminui a capacidade atual da frota com base em um conjunto de ajustes de escalabilidade, conhecidos como ajustes em etapas, que variam com base no tamanho da ruptura do alarme.

  • Escalabilidade programado: aumenta ou diminui a capacidade atual da frota com base em data e hora.

Considerações

Ao usar a escalabilidade automática para sua frota spot, considere o seguinte:

  • Ponderação de instância: se estiver usando ponderação de instância, lembre-se de que a frota spot pode exceder a capacidade de destino, conforme necessário. A capacidade atendida pode ser um número de ponto flutuante, mas a capacidade de destino deve ser um inteiro, portanto, a frota spot é arredondada para o próximo inteiro. Você deve levar em conta esses comportamentos ao ver o resultado de uma política de escalabilidade quando um alarme é acionado. Por exemplo, suponha que a capacidade de destino seja 30, a capacidade atendida seja 30,1 e a política de escalabilidade subtraia 1. Quando o alarme é acionado, o processo de escalabilidade automática subtrairá 1 de 30,1 para obter 29,1 e o arredondará para 30, portanto, nenhuma ação de escalabilidade é executada. Suponhamos também que você selecione os pesos de instância 2, 4 e 8 e uma capacidade de destino igual a 10, mas nenhuma instância de peso 2 esteja disponível. Sendo assim, a frota spot provisionou instâncias de pesos 4 e 8 para uma capacidade atendida igual a 12. Se a política de escalabilidade reduzir a capacidade de destino em 20% e um alarme for acionado, o processo de escalabilidade automática subtrairá 12*0,2 de 12 para obter 9,6 e o arredondará para 10, portanto, nenhuma ação de escalabilidade será executada.

  • Período de espera: as políticas de escalabilidade que você cria para a frota spot são compatíveis com um período de espera. Esse é o número de segundos após o encerramento de uma ação de escalabilidade em que as atividades de escalabilidade anteriores, relacionadas ao acionamento, podem influenciar eventos futuros de escalabilidade. Para expandir as políticas enquanto o período do desaquecimento estiver em vigor, a capacidade que foi adicionada pelo evento de expansão anterior que iniciou o desaquecimento é calculada como parte da capacidade desejada para a expansão seguinte. A intenção é expandir de forma contínua (mas não excessivamente). Para políticas de redução, o período do desaquecimento é utilizado para bloquear a escala subsequente nas solicitações até que expire. A intenção é reduzir de forma conservadora para proteger a disponibilidade de sua aplicação. Contudo, se outro alarme acionar uma política de expansão durante o período do desaquecimento após uma redução, a escalabilidade automática expandirá seu destino dimensionável imediatamente.

  • Usar monitoramento detalhado: recomendamos que você escale com base nas métricas da instância com intervalos de um minuto, pois isso garante uma resposta mais rápida às mudanças de utilização. Aumentar a escalabilidade com base em métricas com intervalos de cinco minutos pode resultar em tempo de resposta mais lento e na escalabilidade com base em dados de métricas obsoletos. Para enviar dados de métrica das instâncias ao CloudWatch em períodos de 1 minuto, você deve habilitar especificamente o monitoramento detalhado. Para ter mais informações, consulte Gerenciar o monitoramento detalhado das instâncias do Amazon EC2 e Criar uma solicitação de frota spot usando parâmetros definidos (console).

  • AWS CLI: caso use a AWS CLI para configurar o escalabilidade da frota spot, você usará a CLI application-autoscaling. Para obter mais informações, consulte os seguintes recursos do :