Cierre temporal de las políticas de escalado - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cierre temporal de las políticas de escalado

Después de configurar el escalado automático, tiene las siguientes opciones si necesita investigar un problema sin que las políticas de escalado interfieran (escalado dinámico):

  • Suspenda temporalmente las actividades de escalado y, a continuación, las reanude. Para ello, register-scalable-targetCLIejecute el comando o la RegisterScalableTargetAPIacción y especifique un valor booleano para ambosDynamicScalingInSuspended. DynamicScalingOutSuspended

    En el siguiente ejemplo, se muestra cómo suspender las políticas de escalado para una variante denominada my-variant, que se ejecuta en el punto de conexión my-endpoint.

    aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}'
  • Evite que políticas de escalado de seguimiento de destino específicas se reduzcan horizontalmente en su variante desactivando la parte de reducción horizontal de la política. Este método evita que la política de escalado elimine instancias, a la vez que le permite crearlas según sea necesario.

    Deshabilite temporalmente las actividades escalables y, a continuación, las habilite editando la política mediante el put-scaling-policyCLIcomando o la PutScalingPolicyAPIacción y especificando un valor booleano para. DisableScaleIn

    A continuación se muestra un ejemplo de configuración de seguimiento de destino para una política de escalado en la que se escalará horizontalmente, pero no se reducirá horizontalmente.

    { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }