Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Escalado automático de los modelos de Amazon SageMaker AI
Amazon SageMaker AI admite el escalado automático (autoescalado) para sus modelos alojados. El escalado automático ajusta dinámicamente el número de instancias aprovisionadas para un modelo en respuesta a los cambios en su carga de trabajo. Cuando la carga de trabajo aumenta, el escalado automático proporciona más instancias en línea. Cuando la carga de trabajo desciende, el escalado automático quita las instancias innecesarias, a fin de que no pague por las instancias aprovisionadas que no utiliza.
Temas
Información general sobre las políticas de escalado automático
Configuración del escalado automático de modelos con la consola
Comprobación del estado de una actividad de escalado describiendo las actividades de escalado
Se utiliza AWS CloudFormation para crear una política de escalado
Actualización de puntos de conexión que utilizan el escalado automático
Eliminación de puntos de conexión configurados para el escalado automático