Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Aplicar una política de escalado
Una vez registrado su modelo y definido una política de escalado, aplique la política de escalado al modelo registrado. Esta sección muestra cómo aplicar una política de escalado con la AWS Command Line Interface (AWS CLI) o la API de Application Auto Scaling.
Temas
Aplicación de una política de escalado de seguimiento de destino (AWS CLI)
Para aplicar una política de escalado a su modelo, utilice el put-scaling-policy AWS CLI comando con los siguientes parámetros:
-
--policy-name
: el nombre de la política de escalado. -
--policy-type
: establezca este valor enTargetTrackingScaling
. -
--resource-id
: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpoint
y el identificador único es el nombre de la variante. Por ejemplo,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
: establezca este valor ensagemaker
. -
--scalable-dimension
: establezca este valor ensagemaker:variant:DesiredInstanceCount
. -
--target-tracking-scaling-policy-configuration
: configuración de la política de escalado de seguimiento de destino que se usará para el modelo.
En el siguiente ejemplo se aplica una política de escalado de seguimiento de destino denominada
en una variante llamada my-scaling-policy
que se ejecuta en el punto de conexión my-variant
. Para la opción my-endpoint
--target-tracking-scaling-policy-configuration
, especifique el archivo config.json
que creó anteriormente.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Aplicación de una política de escalado (API de Application Auto Scaling)
Para aplicar una política de escalado a una variante con la API de Application Auto Scaling, utilice la acción PutScalingPolicy de la API de Application Auto Scaling con los siguientes parámetros:
-
PolicyName
: el nombre de la política de escalado. -
ServiceNamespace
: establezca este valor ensagemaker
. -
ResourceID
: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpoint
y el identificador único es el nombre de la variante. Por ejemplo,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
: establezca este valor ensagemaker:variant:DesiredInstanceCount
. -
PolicyType
: establezca este valor enTargetTrackingScaling
. -
TargetTrackingScalingPolicyConfiguration
: configuración de la política de escalado de seguimiento de objetivos que se usará para la variante.
En el siguiente ejemplo se aplica una política de escalado de seguimiento de destino denominada
en una variante llamada my-scaling-policy
que se ejecuta en el punto de conexión my-variant
. La configuración de la política mantiene el promedio de invocaciones por instancia en 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }