As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Aplicar uma política de escalabilidade
Depois de registrar seu modelo e definir uma política de escalabilidade, aplique a política de escalabilidade ao modelo registrado. Esta seção mostra como aplicar uma política de escalabilidade usando o AWS Command Line Interface (AWS CLI) ou o Application API Auto Scaling.
Tópicos
Aplique uma política de escalabilidade de rastreamento de metas ()AWS CLI
Para aplicar uma política de escalabilidade ao seu modelo, use o put-scaling-policy AWS CLI comando com os seguintes parâmetros:
-
--policy-name
—O nome da política de escalabilidade. -
--policy-type
—Defina esse valor comoTargetTrackingScaling
. -
--resource-id
—O identificador de recurso para a variante. Para esse parâmetro, o tipo de recurso éendpoint
e o identificador exclusivo é o nome da variante. Por exemplo,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
—Defina esse valor comosagemaker
. -
--scalable-dimension
—Defina esse valor comosagemaker:variant:DesiredInstanceCount
. -
--target-tracking-scaling-policy-configuration
— A configuração da política de escalabilidade de rastreamento de metas a ser usada no modelo.
O exemplo a seguir aplica uma política de escalabilidade de rastreamento de destino nomeada
a uma variante chamadamy-scaling-policy
, em execução no my-variant
endpoint. Para a my-endpoint
--target-tracking-scaling-policy-configuration
opção, especifique o config.json
arquivo que você criou anteriormente.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Aplique uma política de escalabilidade (Application API Auto Scaling)
Para aplicar uma política de escalabilidade a uma variante com o Application Auto API Scaling, use PutScalingPolicya ação Application API Auto Scaling com os seguintes parâmetros:
-
PolicyName
—O nome da política de escalabilidade. -
ServiceNamespace
—Defina esse valor comosagemaker
. -
ResourceID
—O identificador de recurso para a variante. Para esse parâmetro, o tipo de recurso éendpoint
e o identificador exclusivo é o nome da variante. Por exemplo,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
—Defina esse valor comosagemaker:variant:DesiredInstanceCount
. -
PolicyType
—Defina esse valor comoTargetTrackingScaling
. -
TargetTrackingScalingPolicyConfiguration
—A configuração da política de escalabilidade de rastreamento de destino a ser usada para a variante.
O exemplo a seguir aplica uma política de escalabilidade de rastreamento de destino nomeada
a uma variante chamadamy-scaling-policy
, em execução no my-variant
endpoint. A configuração da política mantém a média de invocações por instância em 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }