Estrategias de asignación de varios tipos de instancias - Amazon EC2 Auto Scaling

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Estrategias de asignación de varios tipos de instancias

Cuando utiliza varios tipos de instancias, administra la forma en que Amazon EC2 Auto Scaling satisface sus capacidades bajo demanda y spot () a partir de los posibles tipos de instancias. Para ello, debe especificar estrategias de asignación.

Para revisar las prácticas recomendadas para un grupo de instancias mixtas, consulte Información general de la configuración de creación de un grupo de instancias mixtas.

Spot Instances

Amazon EC2 Auto Scaling proporciona las siguientes estrategias de asignación para las instancias puntuales:

price-capacity-optimized (recomendado)

La estrategia de asignación optimizada por precio y capacidad analiza tanto el precio como la capacidad para seleccionar los grupos de instancias de spot que tienen menos probabilidades de interrupción y el precio más bajo posible.

Le recomendamos esta estrategia cuando empiece. Para obtener más información, consulte Introducción a la estrategia de price-capacity-optimized asignación para las instancias EC2 puntuales en el AWS blog.

capacity-optimized

Amazon EC2 Auto Scaling solicita su instancia puntual del grupo con una capacidad óptima para el número de instancias que se están lanzando.

Con las instancias de spot, los precios cambian lentamente en función de tendencias a largo plazo registradas en la oferta y la demanda. Sin embargo, la capacidad fluctúa en tiempo real. La estrategia capacity-optimized inicia instancias de spot de forma automática en los grupos con mayor disponibilidad, analizando los datos de capacidad en tiempo real y prediciendo cuáles son los que tienen una mayor disponibilidad. Esto ayuda a minimizar las posibles interrupciones de trabajo que pueden tener un costo de interrupción superior asociado al reinicio del trabajo y la creación de puntos de control. Para brindar una mayor probabilidad de lanzar primero a ciertos tipos de instancia, utilice capacity-optimized-prioritized.

capacity-optimized-prioritized

Se establece el orden de los tipos de instancia para las anulaciones de plantillas de lanzamiento de mayor a menor prioridad (de la primera a la última de la lista). Amazon EC2 Auto Scaling respeta las prioridades de tipo de instancia haciendo todo lo posible, pero optimiza primero la capacidad. Esta es una buena opción para cargas de trabajo en las que se debe minimizar la posibilidad de interrupción, pero también importa la preferencia por ciertos tipos de instancia. Si la estrategia de asignación bajo demanda se establece en prioritized, se aplica la misma prioridad cuando se completa la capacidad bajo demanda.

lowest-price (no se recomienda)

Amazon EC2 Auto Scaling solicita sus instancias puntuales utilizando los grupos con el precio más bajo dentro de una zona de disponibilidad, entre el número N de grupos puntuales que especifique para la configuración de grupos con el precio más bajo. Por ejemplo, si especifica cuatro tipos de instancia y cuatro zonas de disponibilidad, el grupo de escalado automático puede acceder a un máximo de 16 grupos de spot. (Cuatro en cada zona de disponibilidad). Si especifica dos grupos de spot (N = 2) para la estrategia de asignación, el grupo de escalado automático puede recurrir a los dos grupos más baratos por zona de disponibilidad para cumplir con su capacidad de spot.

Dado que esta estrategia solo tiene en cuenta el precio de la instancia y no la disponibilidad de capacidad, podría generar tasas de interrupción elevadas.

Amazon EC2 Auto Scaling se esfuerza por extraer instancias puntuales del número N de grupos que especifique. Sin embargo, si un grupo se queda sin capacidad puntual antes de cumplir con la capacidad deseada, Amazon EC2 Auto Scaling seguirá satisfaciendo su solicitud utilizando el siguiente grupo con el precio más bajo. Para que se logre la capacidad deseada, es posible que reciba instancias de spot de una cantidad de grupos mayor al número N de grupos que especificó. Del mismo modo, si la mayoría de los grupos no tienen capacidad de spot, es posible que reciba su capacidad deseada total de menos grupos que el número N de grupos que especificó.

nota

Si configura la instancia de spot para lanzarla con la característica SEV-SNP de AMD activada, se le cobrará una tarifa de uso por hora adicional que equivale al 10 % de la tarifa horaria bajo demanda del tipo de instancia seleccionado. Si la estrategia de asignación utiliza el precio como variable, Amazon EC2 Auto Scaling no incluye esta tarifa adicional; solo se utiliza el precio spot.

instancias bajo demanda

Amazon EC2 Auto Scaling proporciona las siguientes estrategias de asignación que se pueden utilizar para las instancias bajo demanda:

lowest-price

Amazon EC2 Auto Scaling implementa automáticamente el tipo de instancia con el precio más bajo en cada zona de disponibilidad en función del precio bajo demanda actual.

Para garantizar que se logre la capacidad deseada, es posible que reciba instancias bajo demanda de más de un tipo de instancia en cada zona de disponibilidad. Esto depende de la cantidad de capacidad que solicite.

prioritized

Al satisfacer la capacidad bajo demanda, Amazon EC2 Auto Scaling determina qué tipo de instancia usar primero en función del orden de los tipos de instancia en la lista de anulaciones de plantillas de lanzamiento. Por ejemplo, supongamos que se especifican tres anulaciones de plantilla de lanzamiento en el siguiente orden: c5.large, c4.large y c3.large. Cuando se lanzan las instancias bajo demanda, el grupo de escalado automático satisface la capacidad bajo demanda en el siguiente orden: c5.large, c4.large y luego c3.large.

Tenga en cuenta lo siguiente cuando administre el orden de prioridad de las instancias a petición:

  • Puede pagar el uso por adelantado para conseguir importantes descuentos en las instancias bajo demanda a través de Savings Plans o las instancias reservadas. Para obtener más información, consulta la página de EC2 precios de Amazon.

  • En el caso de las instancias reservadas, se aplicará la tarifa con descuento del precio normal de las instancias bajo demanda si Amazon EC2 Auto Scaling lanza tipos de instancias coincidentes. Esto significa que, si tiene instancias reservadas de c4.large sin utilizar, puede establecer la prioridad del tipo de instancia para asignar la prioridad más alta de sus instancias reservadas a un tipo de instancia c4.large. Cuando se lanza una instancia c4.large, obtendrá el precio de instancia reservada.

  • Con los Savings Plans, se aplica la tarifa con descuento del precio normal de On-Demand Instance al utilizar Amazon EC2 Instance Savings Plans o Compute Savings Plans. Con Savings Plans, tiene más flexibilidad a la hora de priorizar los tipos de instancia. Siempre que utilice tipos de instancia que estén incluidos en su Savings Plans, puede asignarles cualquier orden de prioridad. Ocasionalmente, puede, además ,cambiar todo el orden de los tipos de instancia y seguir beneficiándose de la tarifa de Savings Plans con descuento. Para obtener más información sobre Savings Plans, consulte la Guía del usuario de Savings Plans.

Cómo funcionan las estrategias de asignación con las ponderaciones

Cuando especifique el parámetro WeightedCapacity en las anulaciones (o "DesiredCapacityType": "vcpu" o "DesiredCapacityType": "memory-mib" a nivel de grupo), las estrategias de asignación funcionan exactamente igual que con otros grupos de escalado automático.

Suponga que tiene un grupo de Auto Scaling con varios tipos de instancias que tienen cantidades variables de vCPUs. Lo utiliza lowest-price para sus estrategias de asignación puntual y bajo demanda. Si decide asignar ponderaciones en función del recuento de vCPU de cada tipo de instancia, Amazon EC2 Auto Scaling lanza los tipos de instancias que tengan el precio más bajo según los valores de peso asignados (por ejemplo, por vCPU) en el momento de la gestión logística. Si se trata de una instancia de spot, significa el precio de spot más bajo por vCPU. Si se trata de una instancia bajo demanda, significa el precio bajo demanda más bajo por vCPU.

Para obtener más información, consulte Configuración de un grupo de escalado automático para utilizar ponderación de instancias.