套用擴展政策 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

套用擴展政策

註冊模型並定義擴展政策後,請將擴展政策套用至已註冊的模型。本節說明如何使用 AWS Command Line Interface (AWS CLI) 或應用程式自動調整規模來套用資源調整政策API。

套用目標追蹤擴展政策 (AWS CLI)

若要將擴展政策套用至您的模型,請搭配下列參數使用put-scaling-policy AWS CLI 命令:

  • --policy-name—擴展政策的名稱。

  • --policy-type—將此值設定為 TargetTrackingScaling

  • --resource-id—此變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如:endpoint/my-endpoint/variant/my-variant

  • --service-namespace—將此值設定為 sagemaker

  • --scalable-dimension—將此值設定為 sagemaker:variant:DesiredInstanceCount

  • --target-tracking-scaling-policy-configuration要用於模型的目標追蹤縮放原則組態。

下列範例會my-scaling-policy將名為的目標追蹤資源調整政策套用至在my-endpoint端點上執行的名稱為my-variant的變體。針對此--target-tracking-scaling-policy-configuration選項,指定您先前建立的config.json檔案。

aws application-autoscaling put-scaling-policy \ --policy-name my-scaling-policy \ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json

套用資源調整政策 (Application Auto ScalingAPI)

若要使用「應用程式 Auto Scaling」將資源調整政策套用至變體API,請搭配下列參數使用「PutScalingPolicy應用程式自API動調整」動作:

  • PolicyName—擴展政策的名稱。

  • ServiceNamespace—將此值設定為 sagemaker

  • ResourceID—此變體的資源識別符。針對這項參數,資源的類型為 endpoint,而唯一識別符是變體的名稱。例如:endpoint/my-endpoint/variant/my-variant

  • ScalableDimension—將此值設定為 sagemaker:variant:DesiredInstanceCount

  • PolicyType—將此值設定為 TargetTrackingScaling

  • TargetTrackingScalingPolicyConfiguration—要用於變體的目標追蹤擴展政策組態。

下列範例會my-scaling-policy將名為的目標追蹤資源調整政策套用至在my-endpoint端點上執行的名稱為my-variant的變體。原則設定會將每個執行個體的平均呼叫保持在 70。

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }