Cómo funcionan los planes de escalado

AWS Auto Scaling le permite usar planes de escalado para configurar un conjunto de instrucciones para escalar sus recursos. Si trabaja con recursos escalables AWS CloudFormation o les agrega etiquetas, puede configurar planes de escalado para diferentes conjuntos de recursos por aplicación. La AWS Auto Scaling consola proporciona recomendaciones para estrategias de escalado personalizadas para cada recurso. Después de crear el plan de escalado, combina los métodos de escalado dinámico y escalado predictivo para ayudarlo a desarrollar su propia estrategia de escalado.

¿Qué es una estrategia de escalado?

La estrategia de escalado indica AWS Auto Scaling cómo optimizar la utilización de los recursos en su plan de escalado. Puede optimizar la disponibilidad, los costos o mantener un equilibrio entre ambos. Otra opción consiste en crear una estrategia propia, de acuerdo con las métricas y umbrales que se definan. Puede establecer estrategias independientes para cada recurso o tipo de recurso.

Las estrategias de escalado incluyen la optimización de la disponibilidad frente al costo, o un equilibrio entre ambas.

¿Qué es el escalado dinámico?

El escalado dinámico crea políticas de escalado de seguimiento de destino para los recursos del plan de escalado. Estas políticas de escalado ajustan la capacidad de los recursos en respuesta a los cambios en la utilización de los recursos. El objetivo es proporcionar suficiente capacidad para mantener la utilización de recursos en el valor de destino especificado por la estrategia de escalado. Se asemeja a los termostatos que se utilizan para mantener la temperatura del hogar. Se elige la temperatura y el termostato hace el resto.

Gráficos que comparan la utilización y la capacidad con y sin escalamiento dinámico.

Por ejemplo, puede configurar el plan de escalado de forma que mantenga el número de tareas que ejecuta el servicio Amazon Elastic Container Service (Amazon ECS) al 75 % de CPU. Cuando la utilización de CPU del servicio excede el 75 % (lo que significa que se utiliza más del 75 % de la CPU que se ha reservado para el servicio), esto indica a la política de escalado que debe agregar otra tarea al servicio a fin de ayudar con el aumento de carga.

¿Qué es el escalado predictivo?

El escalado predictivo utiliza machine learning para analizar la carga de trabajo histórica de cada uno de los recursos y pronostica de forma periódica la carga futura. Esto es similar a cómo funcionan las previsiones meteorológicas. Utilizando la previsión, el escalado predictivo genera acciones de escalado programadas para garantizar que la capacidad de los recursos esté disponible antes de que la aplicación la necesite. Al igual que el escalado dinámico, el escalado predictivo mantiene la utilización en el valor objetivo especificado por la estrategia de escalado.

Gráficos que muestran la carga histórica, la previsión generada y las medidas de escalado adoptadas.

Por ejemplo, puede habilitar el escalado predictivo y configurar la estrategia de escalado de forma que mantenga la utilización media de la CPU del grupo de Auto Scaling en el 50 por ciento. Su pronóstico indica que se van a producir picos de tráfico todos los días a las 8:00 h. El plan de escalado crea las acciones de escalado programadas futuras para asegurarse de que el grupo de Auto Scaling esté listo para atender el tráfico de antemano. Esto ayuda a mantener constante el rendimiento de la aplicación, siempre con el objetivo de tener la capacidad necesaria de mantener la utilización de recursos tan cercana al 50 por ciento como sea posible en todo momento.

A continuación se enumeran los conceptos clave para comprender el escalado predictivo:

Previsión de carga: AWS Auto Scaling analiza hasta 14 días de historial para una métrica de carga específica y prevé la demanda futura para los próximos dos días. Estos datos se encuentran disponibles en intervalos de una hora y se actualizan todos los días.
Acciones de escalado AWS Auto Scaling programadas: programa las acciones de escalado que aumentan y disminuyen la capacidad de forma proactiva para que coincidan con la previsión de carga. A la hora programada, AWS Auto Scaling actualiza la capacidad mínima con el valor especificado en la acción de escalado programada. El objetivo es mantener la utilización de recursos en el valor de destino especificado por la estrategia de escalado. Si la aplicación necesita más capacidad de la prevista, el escalado dinámico está disponible para añadir capacidad adicional.
Comportamiento de capacidad máxima: se aplican límites de capacidad mínima y máxima para el escalado automático a cada recurso. Sin embargo, es posible controlar si la aplicación puede aumentar la capacidad más allá de su capacidad máxima en el caso de que la capacidad prevista sea superior a la capacidad máxima.

nota

Ahora, en su lugar, puede utilizar las políticas de escalado predictivo de los grupos de Auto Scaling. Para obtener más información, consulte Escalado predictivo para un grupo de Amazon EC2 Auto Scaling en la Guía del usuario de Amazon EC2 Auto Scaling.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

¿Qué es un plan de escalado?

Prácticas recomendadas