Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Escala automáticamente los SageMaker modelos de Amazon
Amazon SageMaker admite el escalado automático (autoescalado) para sus modelos alojados. El escalado automático ajusta dinámicamente el número de instancias aprovisionadas para un modelo en respuesta a los cambios en su carga de trabajo. Cuando la carga de trabajo aumenta, el escalado automático proporciona más instancias en línea. Cuando la carga de trabajo desciende, el escalado automático quita las instancias innecesarias, a fin de que no pague por las instancias aprovisionadas que no utiliza.
Temas
- Descripción general del escalado automático
- Configuración del escalado automático de modelos con la consola
- Registrar un modelo
- Definir una política de escalado
- Aplicar una política de escalado
- Edición de una política de escalado
- Eliminación de una política de escalado
- Compruebe el estado de una actividad de escalado describiendo las actividades de escalado
- Prueba de carga de la configuración de escalado automático
- Úselo AWS CloudFormation para crear una política de escalado
- Actualizar o eliminar puntos finales que utilizan el escalado automático