Menerapkan kebijakan penskalaan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menerapkan kebijakan penskalaan

Setelah Anda mendaftarkan model dan menentukan kebijakan penskalaan, terapkan kebijakan penskalaan ke model terdaftar. Bagian ini menunjukkan cara menerapkan kebijakan penskalaan menggunakan AWS Command Line Interface (AWS CLI) atau Application Auto API Scaling.

Menerapkan kebijakan penskalaan pelacakan target ()AWS CLI

Untuk menerapkan kebijakan penskalaan pada model Anda, gunakan put-scaling-policy AWS CLI perintah dengan parameter berikut:

  • --policy-name—Nama kebijakan penskalaan.

  • --policy-type—Tetapkan nilai ini keTargetTrackingScaling.

  • --resource-id—Pengidentifikasi sumber daya untuk varian. Untuk parameter ini, tipe sumber daya adalah endpoint dan pengidentifikasi unik adalah nama varian. Misalnya, endpoint/my-endpoint/variant/my-variant.

  • --service-namespace—Tetapkan nilai ini kesagemaker.

  • --scalable-dimension—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount.

  • --target-tracking-scaling-policy-configuration—Konfigurasi kebijakan penskalaan pelacakan target yang akan digunakan untuk model.

Contoh berikut menerapkan kebijakan penskalaan pelacakan target yang diberi nama my-scaling-policy ke varian bernamamy-variant, berjalan di titik my-endpoint akhir. Untuk --target-tracking-scaling-policy-configuration opsi, tentukan config.json file yang Anda buat sebelumnya.

aws application-autoscaling put-scaling-policy \ --policy-name my-scaling-policy \ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json

Menerapkan kebijakan penskalaan (Application Auto API Scaling)

Untuk menerapkan kebijakan penskalaan ke varian dengan Application Auto API Scaling, gunakan PutScalingPolicytindakan Application API Auto Scaling dengan parameter berikut:

  • PolicyName—Nama kebijakan penskalaan.

  • ServiceNamespace—Tetapkan nilai ini kesagemaker.

  • ResourceID—Pengidentifikasi sumber daya untuk varian. Untuk parameter ini, tipe sumber daya adalah endpoint dan pengidentifikasi unik adalah nama varian. Misalnya, endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount.

  • PolicyType—Tetapkan nilai ini keTargetTrackingScaling.

  • TargetTrackingScalingPolicyConfiguration—Konfigurasi kebijakan penskalaan pelacakan target yang akan digunakan untuk varian.

Contoh berikut menerapkan kebijakan penskalaan pelacakan target yang diberi nama my-scaling-policy ke varian bernamamy-variant, berjalan di titik my-endpoint akhir. Konfigurasi kebijakan menjaga pemanggilan rata-rata per instance pada 70.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }