Estratégias de alocação para vários tipos de instância - Amazon EC2 Auto Scaling

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Estratégias de alocação para vários tipos de instância

Ao usar vários tipos de instância, você gerencia como o Amazon EC2 Auto Scaling atenderá à sua capacidade sob demanda e spot dos tipos de instância possíveis. Para fazer isso, você especifica estratégias de alocação.

Para analisar as melhores práticas para um grupo de instâncias mistas, consulteVisão geral da configuração para criar um grupo de instâncias mistas.

Instâncias spot

O Amazon EC2 Auto Scaling fornece as seguintes estratégias de alocação para instâncias spot:

price-capacity-optimized (recomendado)

A estratégia de alocação otimizada de preço e capacidade analisa o preço e a capacidade para selecionar os pools de instâncias spot com menor probabilidade de interrupção e com o preço mais baixo possível.

Recomendamos esta estratégia quando você está começando. Para obter mais informações, consulte Introdução à estratégia de price-capacity-optimized alocação para instâncias spot do EC2 no AWS blog.

capacity-optimized

O Amazon EC2 Auto Scaling solicita sua instância spot do pool com capacidade ideal para o número de instâncias que estão sendo executadas.

Com as instâncias spot, a definição de preço muda lentamente ao longo do tempo com base em tendências de longo prazo na oferta e na demanda. No entanto, a capacidade flutua em tempo real. A estratégia capacity-optimized executa Instâncias spot automaticamente nos grupos mais disponíveis observando dados de capacidade em tempo real e prevendo quais são os mais disponíveis. Isso ajuda a minimizar possíveis interrupções para cargas de trabalho que podem ter um custo mais alto de interrupção associado ao reinício do trabalho e ao ponto de verificação. Para dar a certos tipos de instância uma maior chance de serem executadas primeiro, use capacity-optimized-prioritized.

capacity-optimized-prioritized

Você define a ordem dos tipos de instância para as substituições do modelo de execução da prioridade mais alta para a mais baixa (do primeiro ao último na lista). O Amazon EC2 Auto Scaling respeita as prioridades de tipo de instância com base no melhor esforço, mas primeiro otimiza a capacidade. Essa é uma boa opção para workloads em que a possibilidade de interrupção deve ser minimizada, mas em que a preferência por determinados tipos de instância também é importante. Se a estratégia de alocação sob demanda for definida como prioritized, a mesma prioridade será aplicada ao atender a capacidade sob demanda.

lowest-price

O Amazon EC2 Auto Scaling solicita suas instâncias spot usando os pools de menor preço dentro de uma zona de disponibilidade, entre o número N de pools spot que você especifica para a configuração de pools de menor preço. Por exemplo, se você especificar quatro tipos de instância e quatro zonas de disponibilidade, seu grupo do Auto Scaling poderá acessar até 16 pools spot. (Quatro em cada zona de disponibilidade.) Se você especificar dois pools de Spot (N=2) para a estratégia de alocação, seu grupo do Auto Scaling poderá aproveitar os dois pools de preço mais baixo por zona de disponibilidade para preencher sua capacidade Spot.

Como essa estratégia considera apenas o preço da instância e não a disponibilidade de capacidade, ela pode levar a altas taxas de interrupção.

O Amazon EC2 Auto Scaling tenta extrair instâncias spot do número N de pools que você especifica. No entanto, se um pool ficar sem capacidade spot antes de atender à capacidade desejada, o Amazon EC2 Auto Scaling continua a atender à sua solicitação usando o próximo pool de preço mais baixo. Para atender à capacidade desejada, você pode receber instâncias spot de mais pools do que o número N especificado. Da mesma forma, se a maioria dos pools não tiver capacidade Spot, você poderá receber a capacidade total desejada de menos pools do que o número N especificado.

nota

Se você configurar sua instância spot para iniciar com AMD SEV-SNP ativado, uma tarifa adicional de uso por hora será cobrada. Essa tarifa equivale a 10% da Taxa sob demanda por hora do tipo de instância selecionado. Se a estratégia de alocação usar o preço como entrada, a Amazon EC2 Auto Scaling não incluirá essa tarifa adicional; somente o preço spot será usado.

Instâncias sob demanda

O Amazon EC2 Auto Scaling fornece as seguintes estratégias de alocação que podem ser usadas para instâncias sob-demanda:

lowest-price

O Amazon EC2 Auto Scaling implanta automaticamente o tipo de instância com preço mais baixo em cada zona de disponibilidade com base no preço sob demanda atual.

Para atender à capacidade desejada, você pode receber instâncias sob demanda de mais de um tipo de instância em cada zona de disponibilidade. Isso depende da quantidade de capacidade que você solicitar.

prioritized

Ao atender à capacidade sob demanda, o Amazon EC2 Auto Scaling determina qual tipo de instância usar primeiro com base na ordem dos tipos de instância na lista de substituições de modelo de execução. Por exemplo, digamos que você especifique três substituições de modelo de execução na seguinte ordem: c5.large, c4.large e c3.large. Quando suas instâncias sob demanda são iniciadas, o grupo do Auto Scaling preenche a capacidade sob demanda começando com,c5.large c4.large e, em seguida, c3.large.

Considere o seguinte ao gerenciar a ordem de prioridade de suas instâncias sob demanda:

  • Você pode pagar antecipadamente pelo uso para obter descontos significativos para Instâncias sob demanda usando Savings Plans ou instâncias reservadas. Para obter mais informações, consulte a página de preços do Amazon EC2.

  • Com instâncias reservadas, sua taxa de desconto da definição de preço normal da instância sob demanda se aplicará se o Amazon EC2 Auto Scaling iniciar tipos de instância correspondentes. Portanto, se você tiver Instâncias reservadas não utilizadas para c4.large, poderá definir a prioridade do tipo de instância para dar a prioridade mais alta para suas Instâncias reservadas a um tipo de instância c4.large. Quando uma instância c4.large é ativada, você recebe os preços de instância reservada.

  • Com os Savings Plans, sua taxa de desconto da definição de preço normal da instância sob demanda é aplicada ao usar os Amazon EC2 Instance Savings Plans ou Compute Savings Plans. Com Savings Plans, você tem mais flexibilidade ao priorizar seus tipos de instância. Contanto que você use tipos de instância cobertos pelo seu Savings Plan, você pode defini-los em qualquer ordem de prioridade. Você também pode ocasionalmente alterar toda a ordem de seus tipos de instância, enquanto ainda recebe a taxa de desconto do Savings Plan. Para obter mais informações sobre Savings Plans, consulte o Savings Plans User Guide (Guia do usuário de Savings Plans).

Como as estratégias de alocação funcionam com pesos

Quando você especifica o WeightedCapacity parâmetro em suas substituições (ou "DesiredCapacityType": "vcpu" ou "DesiredCapacityType": "memory-mib" no nível do grupo), as estratégias de alocação funcionam exatamente como funcionam para outros grupos do Auto Scaling.

A única diferença é que, quando você escolhe a price-capacity-optimized estratégia lowest-price or, suas instâncias vêm dos pools de instâncias com o menor preço por unidade em cada zona de disponibilidade. Para ter mais informações, consulte Configurar um grupo de Auto Scaling para usar pesos de instância.

Por exemplo, imagine que você tem um grupo do Auto Scaling com vários tipos de instância com diferentes quantidades de vCPUs. Você usa lowest-price para suas estratégias de alocação spot e sob demanda. Se você optar por atribuir pesos com base na contagem de vCPUs de cada tipo de instância, o Amazon EC2 Auto Scaling iniciará os tipos de instância que tenham o menor preço por valores de peso atribuídos (por exemplo, por vCPU) no momento do cumprimento. Se for uma instância spot, isso significa o menor preço spot por vCPU. Se for uma instância sob demanda, isso significa o menor preço sob demanda por vCPU.