Descripción del escalado automático para las flotas de spot - Amazon Elastic Compute Cloud

Descripción del escalado automático para las flotas de spot

El escalado automático permite que su flota de spot pueda aumentar o disminuir la capacidad de destino de forma automática en función de la demanda. Con el escalado automático, una flota de spot puede iniciar instancias (escalado horizontal) o terminar instancias (reducción horizontal) dentro del rango especificado en respuesta a una o varias políticas de escalado.

El escalado automático para la flota de spot es posible gracias a una combinación de las API de Amazon EC2, Amazon CloudWatch y Application Auto Scaling. Las solicitudes de flota de spot se crean con Amazon EC2, las alarmas se crean con CloudWatch y las políticas de escalado se crean con Application Auto Scaling.

Tipos de escalado automático

La flota de spot admite los siguientes tipos de escalado automático:

  • Escalado del seguimiento de destino: permite aumentar o reducir la capacidad actual de la flota en función de un valor de destino especificado en una métrica determinada. Funciona de forma similar a los termostatos, que mantienen la temperatura del hogar: el usuario selecciona la temperatura deseada y el termostato hace el resto.

  • Escalado por pasos: permite aumentar o reducir la capacidad actual de la flota en función de una serie de ajustes de escalado, denominados ajustes por pasos, que varían en función del tamaño de la interrupción de alarma.

  • Escalado programado: permite aumentar o reducir la capacidad actual de la flota en función de la fecha y la hora.

Consideraciones

Cuando utilice el escalado automático para su flota de spot, tenga en cuenta lo siguiente:

  • Ponderación de instancias: si utiliza la ponderación de instancias, recuerde que la flota de spot puede superar la capacidad de destino según sea necesario. La capacidad utilizada puede ser un número de coma flotante, pero la capacidad de destino debe ser un número entero, por lo que la flota de spot redondea hacia arriba al siguiente entero. Debe tener en cuenta estos comportamientos cuando observe los resultados de una política de escalado después de dispararse una alarma. Por ejemplo, suponga que la capacidad de destino es de 30, la capacidad atendida es de 30,1 y la política de escalado resta 1. Cuando se dispara la alarma, el proceso de escalado automático resta 1 a 30,1, que da 29,1; así que al redondear hacia arriba, el resultado es 30, por lo que no se realiza ninguna acción de escalado. Veamos otro ejemplo: supongamos que seleccionó ponderaciones de instancias de 2, 4 y 8, y una capacidad de destino de 10, pero no había disponible ninguna instancia con ponderación 2, por lo que la flota de spot aprovisionó instancias de ponderaciones 4 y 8, que producen una capacidad utilizada de 12. Si la política de escalado disminuye la capacidad de destino en un 20 % y se dispara una alarma, el proceso de escalado automático resta 12*0,2 de 12, que es igual a 9,6 y, al redondear hacia arriba, da 10, por lo que no se realiza ninguna acción de escalado.

  • Periodo de recuperación: las políticas de escalado que crea para la flota de spot admiten un periodo de recuperación. Es el número de segundos después de completarse una actividad de escalado en que las actividades del escalado anterior relacionadas con un disparador pueden influir en los futuros eventos de escalado. Para políticas de escalado ascendente, mientras el periodo de recuperación está en vigor, la capacidad que se agregó en el anterior evento de escalado ascendente que inició la recuperación se calcula como parte de la capacidad deseada para el siguiente escalado ascendente. La intención es realizar continuamente (pero no excesivamente) un escalado ascendente. Para políticas de escalado descendente, el periodo de recuperación se usa para bloquear subsiguientes solicitudes de escalado descendente hasta que haya caducado. La intención es realizar un escalado descendente de manera conservadora para proteger la disponibilidad de la aplicación. No obstante, si otra alarma dispara una política de escalado ascendente durante el periodo de recuperación después de un escalado descendente, el escalado automático realiza inmediatamente un escalado ascendente del destino escalable.

  • Use la monitorización detallada: le recomendamos realizar el escalado según métricas de instancia cuya frecuencia sea de un minuto, ya que esto garantiza una respuesta más rápida a los cambios de utilización. Realizar el escalado utilizando métricas con una frecuencia de 5 minutos puede generar un tiempo de respuesta más lento y hacer que el escalado se realice con datos de métricas que están obsoletos. Para enviar los datos de las métricas de la instancia a CloudWatch en periodos de 1 minuto, puede habilitar una monitorización detallada específicamente para la instancia. Para obtener más información, consulte Administración del monitoreo detallado para sus instancias de EC2 y Creación de una solicitud de flota de spot con los parámetros definidos (consola).

  • AWS CLI: si utiliza la AWS CLI para configurar el escalado de la flota de spot, utilizará la CLI de application-autoscaling. Para obtener más información, consulte los siguientes recursos: