Actualización de puntos de conexión que utilizan el escalado automático - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actualización de puntos de conexión que utilizan el escalado automático

Cuando actualiza un punto de conexión, Application Auto Scaling realiza la comprobación para ver si alguno de los modelos de ese punto de conexión es el objetivo del escalado automático. Si la actualización cambia el tipo de instancia de cualquier modelo que sea un destino para el escalado automático, se producirá un error en la actualización.

En el AWS Management Console, verá una advertencia en la que se le indica que debe anular el registro del modelo del escalado automático antes de poder actualizarlo. Si intenta actualizar el punto de enlace llamada a la API UpdateEndpoint, se produce un error en la llamada. Antes de actualizar el punto final, elimine las políticas de escalado configuradas para él y anule el registro de la variante como destino escalable mediante una llamada a la acción DeregisterScalableTargetApplication Auto Scaling API. Después de actualizar el punto de conexión, puede registrar la variante como destino escalable y asociar una política de escalado.

Existe una excepción. Si cambias el modelo por una variante que está configurada para el escalado automático, el escalado automático de Amazon SageMaker AI permite la actualización. Esto se debe a que cambiar el modelo no afecta normalmente lo suficiente al rendimiento como para cambiar el comportamiento de escalado. Si actualiza un modelo para una variante configurada para el escalado automático, asegúrese de que el cambio al modelo no afecte significativamente al rendimiento y al comportamiento del escalado automático.

Cuando actualice los puntos finales de SageMaker IA a los que se ha aplicado el escalado automático, complete los siguientes pasos:

Actualización de un punto de conexión que tiene aplicado el escalado automático
  1. Para anular el registro del punto final como objetivo escalable, llama. DeregisterScalableTarget

  2. Dado que el escalado automático está bloqueado mientras la operación de actualización está en curso (o si desactivó el escalado automático en el paso anterior), es posible que desee tomar la precaución adicional de aumentar el número de instancias del punto de conexión durante la actualización. Para ello, actualice el recuento de instancias para las variantes de producción alojadas en el punto de enlace llamando a UpdateEndpointWeightsAndCapacities.

  3. Llame a DescribeEndpoint repetidamente hasta que el valor del campo EndpointStatus de la respuesta sea InService.

  4. Llame a DescribeEndpointConfig para obtener los valores de la configuración del punto de enlace actual.

  5. Cree una configuración de punto de enlace nueva llamando a CreateEndpointConfig. Para las variantes de producción en las que desea mantener el recuento o el peso de las instancias existentes, utilice el mismo nombre de variante de la respuesta de la llamada a DescribeEndpointConfig en el paso anterior. Para todos los demás valores, utilice los valores que obtuvo como respuesta cuando llamó a DescribeEndpointConfig en el paso anterior.

  6. Actualice el punto de enlace llamando a UpdateEndpoint. Especifique la configuración de punto de enlace que ha creado en el paso anterior en el campo EndpointConfig. Si desea conservar las propiedades de variante, como el recuento de instancias o el peso, establezca el valor del parámetro RetainAllVariantProperties en True. Esto especifica que las variantes de producción con el mismo nombre se actualizarán con el DesiredInstanceCount más reciente de la respuesta de la llamada a DescribeEndpoint, independientemente de los valores del campo InitialInstanceCount en el nuevo EndpointConfig.

  7. (Opcional) Vuelva a activar el escalado automático llamando a RegisterScalableTargety PutScalingPolicy.

nota

Los pasos 1 y 7 solo son necesarios si actualiza un punto de enlace con los siguientes cambios:

  • Cambio del tipo de instancia para una variante de producción que tenga configurado el escalado automático

  • Eliminación de una variante de producción con el escalado automático configurado.