Actualizar o eliminar puntos finales que utilizan el escalado automático - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actualizar o eliminar puntos finales que utilizan el escalado automático

Actualice los puntos finales que utilizan el escalado automático

Al actualizar un punto final, Application Auto Scaling comprueba si alguno de los modelos de ese punto final es objetivo del escalado automático. Si la actualización cambiara el tipo de instancia de cualquier modelo que sea un objetivo para el escalado automático, la actualización fallará.

En el AWS Management Console, verá una advertencia en la que se le indica que debe anular el registro del modelo del escalado automático antes de poder actualizarlo. Si intenta actualizar el punto final llamando al UpdateEndpointAPI, la llamada fallará. Antes de actualizar el punto final, elimine las políticas de escalado configuradas para él y anule el registro de la variante como destino escalable mediante una llamada a la acción DeregisterScalableTargetApplication Auto ScalingAPI. Tras actualizar el punto final, puede registrar la variante actualizada como un objetivo escalable y adjuntar una política de escalado.

Existe una excepción. Si cambias el modelo por una variante que está configurada para el escalado automático, el escalado SageMaker automático de Amazon permite la actualización. Esto se debe a que cambiar el modelo no suele afectar al rendimiento lo suficiente como para cambiar el comportamiento de escalado. Si actualiza un modelo para una variante configurada para el escalado automático, asegúrese de que el cambio en el modelo no afecte significativamente al rendimiento ni al comportamiento de escalado.

Cuando actualice los SageMaker puntos finales a los que se ha aplicado el escalado automático, complete los siguientes pasos:

Para actualizar un punto final al que se ha aplicado el escalado automático
  1. Para anular el registro del punto final como objetivo escalable, llame. DeregisterScalableTarget

  2. Como el autoescalado está bloqueado mientras la operación de actualización está en curso (o si ha desactivado el autoescalado en el paso anterior), puede que desee tomar la precaución adicional de aumentar el número de instancias de su terminal durante la actualización. Para ello, llama UpdateEndpointWeightsAndCapacitiespara actualizar los recuentos de instancias de las variantes de producción alojadas en el punto final.

  3. Llama DescribeEndpointrepetidamente hasta que el valor del EndpointStatus campo de la respuesta seaInService.

  4. Llame DescribeEndpointConfigpara obtener los valores de la configuración actual del punto final.

  5. Cree una nueva configuración de punto final mediante una llamada CreateEndpointConfig. En el caso de las variantes de producción en las que desee conservar el número o el peso de las instancias existentes, utilice el mismo nombre de variante utilizado en la respuesta a la llamada DescribeEndpointConfigen el paso anterior. Para todos los demás valores, usa los valores que obtuviste como respuesta cuando llamaste DescribeEndpointConfigen el paso anterior.

  6. Actualice el punto de enlace llamando a UpdateEndpoint. Especifique la configuración de punto de enlace que ha creado en el paso anterior en el campo EndpointConfig. Si desea conservar las propiedades de variante, como el recuento de instancias o el peso, establezca el valor del parámetro RetainAllVariantProperties en True. Esto especifica que las variantes de producción con el mismo nombre se actualizarán con el DesiredInstanceCount más reciente de la respuesta de la llamada a DescribeEndpoint, independientemente de los valores del campo InitialInstanceCount en el nuevo EndpointConfig.

  7. (Opcional) Vuelva a activar el escalado automático llamando a RegisterScalableTargety PutScalingPolicy.

nota

Los pasos 1 y 7 solo son necesarios si actualiza un punto de enlace con los siguientes cambios:

  • Cambiar el tipo de instancia para una variante de producción que tiene configurado el escalado automático

  • Eliminar una variante de producción que tiene configurado el escalado automático.

Eliminar puntos finales configurados para el escalado automático

Si elimina un punto final, Application Auto Scaling comprueba si alguno de los modelos de ese punto final es objetivo del escalado automático. Si hay alguno y usted tiene permiso para anular el registro del modelo, Application Auto Scaling anula el registro de esos modelos como objetivos escalables sin notificárselo. Si utiliza una política de permisos personalizada que no otorga permisos para la DeregisterScalableTargetacción, debe solicitar el acceso a esta acción antes de eliminar el punto final.

nota

Como IAM usuario, es posible que no tenga los permisos suficientes para eliminar un punto final si otro usuario configuró el escalado automático para una variante en ese punto final.