Configuración del escalado automático de modelos con la consola

Modo de enfoque

Configuración del escalado automático de modelos con la consola - Amazon SageMaker AI

Configuración del escalado automático de un modelo (consola)

Abre la consola Amazon SageMaker AI en https://console.aws.amazon.com/sagemaker/.
En el panel de navegación, elija Inferencia y, a continuación, elija Puntos de conexión.
Elija el punto de conexión y, a continuación, en Configuración del tiempo de ejecución de punto de conexión, elija la variante.
Elija Configure auto scaling (Configurar escalado automático).
En la página Configurar escalado automático de variantes, para Escalado automático de variantes, realice lo siguiente:
1. Para Recuento mínimo de instancias, escriba el número mínimo de instancias que desee que conserve la política de escalado. Se requiere al menos 1 instancia.
2. Para Recuento máximo de instancias, escriba el número máximo de instancias que desee que conserve la política de escalado.
Para una política de escalado integrada, haga lo siguiente:
1. Para la Métrica de destino, se selecciona automáticamente SageMakerVariantInvocationsPerInstance para la métrica y no se puede cambiar.
2. Para el Valor de destino, escriba el número medio de invocaciones por instancia por minuto para el modelo. Para determinar este valor, siga las directrices en Prueba de carga.
3. (Opcional) Para Periodo de recuperación de escalado descendente (segundos) y Periodo de recuperación de escalado ascendente (segundos), escriba la cantidad de tiempo, en segundos, para cada periodo de recuperación.
4. (Opcional) Seleccione Deshabilitar escalado descendente si no desea que el escalado automático termine instancias cuando disminuye el tráfico.
Seleccione Guardar.

Este procedimiento registra un modelo como destino escalable con Application Auto Scaling. Al registrar un modelo, Application Auto Scaling realiza las comprobaciones de validación para garantizar lo siguiente:

El modelo existe
Los permisos son suficientes.
No está registrando ninguna variante con una instancia que sea una instancia de desempeño por ráfagas como T2.

nota
SageMaker La IA no admite el escalado automático para instancias con capacidad de ráfaga, como la T2, porque ya permiten aumentar la capacidad con cargas de trabajo cada vez mayores. Para obtener información sobre las instancias de rendimiento explosivo, consulta los tipos de instancias de Amazon EC2 .

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Requisitos previos

Registrar un modelo

Seleccione sus preferencias de cookies

Personalizar preferencias de cookies

Esenciales

De rendimiento

Funcionales

De publicidad

No se pueden guardar las preferencias de cookies

Configuración del escalado automático de modelos con la consola

Configuración del escalado automático de un modelo (consola)

nota

¿Le ha servido de ayuda esta página?

Tema siguiente:

Tema anterior:

¿Necesita ayuda?