本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
套用擴展政策
註冊模型並定義擴展政策後,請將擴展政策套用至已註冊的模型。本節說明如何使用 AWS Command Line Interface (AWS CLI) 或應用程式自動調整規模來套用資源調整政策API。
套用目標追蹤擴展政策 (AWS CLI)
若要將擴展政策套用至您的模型,請搭配下列參數使用put-scaling-policy AWS CLI 命令:
-
--policy-name
—擴展政策的名稱。 -
--policy-type
—將此值設定為TargetTrackingScaling
。 -
--resource-id
—此變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如:endpoint/
。my-endpoint
/variant/my-variant
-
--service-namespace
—將此值設定為sagemaker
。 -
--scalable-dimension
—將此值設定為sagemaker:variant:DesiredInstanceCount
。 -
--target-tracking-scaling-policy-configuration
要用於模型的目標追蹤縮放原則組態。
下列範例會
將名為的目標追蹤資源調整政策套用至在my-scaling-policy
端點上執行的名稱為my-endpoint
的變體。針對此my-variant
--target-tracking-scaling-policy-configuration
選項,指定您先前建立的config.json
檔案。
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
套用資源調整政策 (Application Auto ScalingAPI)
若要使用「應用程式 Auto Scaling」將資源調整政策套用至變體API,請搭配下列參數使用「PutScalingPolicy應用程式自API動調整」動作:
-
PolicyName
—擴展政策的名稱。 -
ServiceNamespace
—將此值設定為sagemaker
。 -
ResourceID
—此變體的資源識別符。針對這項參數,資源的類型為endpoint
,而唯一識別符是變體的名稱。例如:endpoint/
。my-endpoint
/variant/my-variant
-
ScalableDimension
—將此值設定為sagemaker:variant:DesiredInstanceCount
。 -
PolicyType
—將此值設定為TargetTrackingScaling
。 -
TargetTrackingScalingPolicyConfiguration
—要用於變體的目標追蹤擴展政策組態。
下列範例會
將名為的目標追蹤資源調整政策套用至在my-scaling-policy
端點上執行的名稱為my-endpoint
的變體。原則設定會將每個執行個體的平均呼叫保持在 70。my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }