Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Este tema explica cómo funciona el escalado predictivo y describe qué debe tener en cuenta al crear una política de escalado predictivo.
Funcionamiento
Para utilizar el escalado predictivo, cree una política de escalado predictivo que especifique la CloudWatch métrica que se va a supervisar y analizar. Para que el escalado predictivo comience a pronosticar valores futuros, esta métrica debe tener datos de, por lo menos, las últimas 24 horas.
Tras crear la política, el escalado predictivo comienza a analizar los datos de las métricas de los últimos 14 días para identificar patrones. Utiliza este análisis para generar una previsión horaria de los requisitos de capacidad para las próximas 48 horas. La previsión se actualiza cada 6 horas con los CloudWatch datos más recientes. A medida que llegan nuevos datos, el escalado predictivo puede mejorar continuamente la precisión de las previsiones futuras.
La primera vez que se habilita el escalado predictivo, se ejecuta en modo de solo previsión. En este modo, genera previsiones de capacidad, pero no escala el grupo de escalado automático en función de esas previsiones. Esto permite evaluar la precisión e idoneidad de la previsión. Puede ver los datos del pronóstico mediante la operación de API GetPredictiveScalingForecast
o la AWS Management Console.
Tras revisar los datos de previsión y decidir empezar a escalar en función de esos datos, cambie la política de escalado al modo de previsión y escalado. En este modo:
-
Si la previsión prevé un aumento de la carga, Amazon EC2 Auto Scaling aumentará la capacidad mediante el escalado horizontal.
-
Si la previsión prevé una disminución de la carga, no se reducirá la capacidad mediante la reducción horizontal. Si desea eliminar la capacidad que ya no necesita, debe crear políticas de escalado dinámico.
De forma predeterminada, Amazon EC2 Auto Scaling escala el grupo de Auto Scaling al principio de cada hora en función de la previsión para esa hora. Si lo desea, puede especificar una hora de inicio más temprana mediante la propiedad SchedulingBufferTime
en la operación de la API PutScalingPolicy
o la configuración Instancias previas al lanzamiento en la AWS Management Console. Esto hace que Amazon EC2 Auto Scaling lance nuevas instancias antes de la demanda prevista, lo que les da tiempo para arrancar y prepararse para gestionar el tráfico.
Para permitir el lanzamiento de instancias nuevas antes de la demanda prevista, se recomienda encarecidamente habilitar la preparación predeterminada de instancias para su grupo de escalado automático. Esto especifica un período de tiempo después de una actividad de escalado horizontal durante el cual Amazon EC2 Auto Scaling no escalará automáticamente, incluso si las políticas de escalado dinámico indican que se debe reducir la capacidad. Esto ayuda a garantizar que las instancias recién lanzadas dispongan del tiempo suficiente para empezar a atender el aumento del tráfico antes de que se las considere para operaciones de reducción horizontal. Para obtener más información, consulte Establecimiento de la preparación predeterminada de instancias para un grupo de escalado automático.
Límite de la capacidad máxima
Los grupos de Auto Scaling tienen una configuración de capacidad máxima que limita la cantidad máxima de EC2 instancias que se pueden lanzar para el grupo. De manera predeterminada, cuando se establecen políticas de escalado, estas no pueden aumentar la capacidad por encima de la capacidad máxima.
Como alternativa, puede permitir que la capacidad máxima del grupo aumente automáticamente si la capacidad previste se aproxima o supera la capacidad máxima del grupo de escalado automático. Para habilitar este comportamiento, utilice las propiedades MaxCapacityBreachBehavior
y MaxCapacityBuffer
de la operación de API PutScalingPolicy
o la configuración de Comportamiento de capacidad máxima de la AWS Management Console.
aviso
Tenga cuidado al permitir que la capacidad máxima aumente automáticamente. Esto puede provocar el lanzamiento de más instancias de las previstas si no se supervisa ni gestiona el aumento de la capacidad máxima. La capacidad máxima incrementada se convertirá en la nueva capacidad máxima normal para el grupo de escalado automático hasta que la actualice manualmente. La capacidad máxima no vuelve a disminuir automáticamente hasta el máximo original.
Consideraciones
-
Confirme si el escalado predictivo es adecuado para su carga de trabajo. Una carga de trabajo es idónea para el escalado predictivo si presenta patrones de carga recurrentes específicos del día de la semana o de la hora del día. Para comprobar esto, configure las políticas de escalado predictivo en el modo solo previsión y, a continuación, consulte las recomendaciones de la consola. Amazon EC2 Auto Scaling ofrece recomendaciones basadas en observaciones sobre el rendimiento potencial de las políticas. Evalúe la previsión y su precisión antes de permitir que el escalado predictivo escale la aplicación de forma activa.
-
Para comenzar el pronóstico, el escalado predictivo necesita al menos 24 horas de datos históricos. Sin embargo, las previsiones son más eficaces si los datos históricos abarcan dos semanas completas. Si para actualizar la aplicación crea un nuevo grupo de escalado automático y elimina el anterior, el nuevo grupo de escalado automático necesita 24 horas de datos de carga históricos antes de que el escalado predictivo pueda volver a generar pronósticos. Puede usar métricas personalizadas para agregar métricas de grupos de escalado automático nuevos y antiguos. De lo contrario, es posible que tenga que esperar unos días para obtener una previsión más precisa.
-
Elija una métrica de carga que represente con precisión la carga total de la aplicación y que sea el aspecto de la aplicación que más le interese escalar.
-
El uso del escalado dinámico en conjunto con el escalado predictivo le ayuda a seguir de cerca la curva de demanda de su aplicación, reduciendo horizontalmente durante periodos de bajo tráfico y escalando horizontalmente cuando el tráfico es mayor de lo esperado. Cuando hay activas varias políticas de escalado, cada política determina la capacidad deseada de forma independiente, y la capacidad deseada se establece en el máximo de ellas. Por ejemplo, si se requieren 10 instancias para mantenerse en la utilización de destino en una política de escalado de seguimiento de destino y se requieren 8 instancias para mantenerse en la utilización de destino en una política de escalado predictivo, la capacidad deseada del grupo se establece en 10. Si no está familiarizado con el escalado dinámico, le recomendamos que utilice políticas de escalado de seguimiento de objetivo. Para obtener más información, consulte Escalado dinámico para Amazon EC2 Auto Scaling.
-
Una suposición fundamental del escalado predictivo es que el grupo de escalado automático es homogéneo y todas las instancias tienen la misma capacidad. Si esto no es así en el caso de su grupo, es posible que la capacidad prevista sea incorrecta. Por lo tanto, tenga cuidado cuando cree políticas de escalado predictivo para grupos de instancias mixtas, porque se pueden aprovisionar instancias de distintos tipos con una capacidad desigual. A continuación se presentan algunos ejemplos en los que la capacidad prevista será incorrecta:
-
Su política de escalado predictivo se basa en el uso de la CPU, pero el número de v CPUs en cada instancia de Auto Scaling varía según el tipo de instancia.
-
La política de escalado predictivo se basa en la entrada o salida de la red, pero el rendimiento del ancho de banda de la red para cada instancia de Auto Scaling varía según los tipos de instancias. Por ejemplo, los tipos de instancias M5 y M5n son similares, pero el tipo de instancia M5n ofrece un rendimiento de red significativamente superior.
-
Regiones compatibles
Este de EE. UU. (Norte de Virginia)
Este de EE. UU. (Ohio)
Oeste de EE. UU. (Norte de California)
Oeste de EE. UU. (Oregón)
África (Ciudad del Cabo)
Asia-Pacífico (Hong Kong)
Asia-Pacífico (Yakarta)
Asia-Pacífico (Bombay)
Asia-Pacífico (Osaka)
Asia-Pacífico (Seúl)
Asia-Pacífico (Singapur)
Asia-Pacífico (Sídney)
Asia-Pacífico (Tokio)
Canadá (centro)
China (Pekín)
China (Ningxia)
Europa (Fráncfort)
Europa (Irlanda)
Europa (Londres)
Europa (Milán)
Europa (París)
Europa (Estocolmo)
Medio Oriente (Baréin)
Medio Oriente (EAU)
América del Sur (São Paulo)
AWS GovCloud (Este de EE. UU.)
AWS GovCloud (Estados Unidos-Oeste)