Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menerapkan kebijakan penskalaan
Setelah Anda mendaftarkan model dan menentukan kebijakan penskalaan, terapkan kebijakan penskalaan ke model terdaftar. Bagian ini menunjukkan cara menerapkan kebijakan penskalaan menggunakan AWS Command Line Interface (AWS CLI) atau Application Auto API Scaling.
Topik
Menerapkan kebijakan penskalaan pelacakan target ()AWS CLI
Untuk menerapkan kebijakan penskalaan pada model Anda, gunakan put-scaling-policy AWS CLI perintah dengan parameter berikut:
-
--policy-name
—Nama kebijakan penskalaan. -
--policy-type
—Tetapkan nilai ini keTargetTrackingScaling
. -
--resource-id
—Pengidentifikasi sumber daya untuk varian. Untuk parameter ini, tipe sumber daya adalahendpoint
dan pengidentifikasi unik adalah nama varian. Misalnya,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
—Tetapkan nilai ini kesagemaker
. -
--scalable-dimension
—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount
. -
--target-tracking-scaling-policy-configuration
—Konfigurasi kebijakan penskalaan pelacakan target yang akan digunakan untuk model.
Contoh berikut menerapkan kebijakan penskalaan pelacakan target yang diberi nama
ke varian bernamamy-scaling-policy
, berjalan di titik my-variant
akhir. Untuk my-endpoint
--target-tracking-scaling-policy-configuration
opsi, tentukan config.json
file yang Anda buat sebelumnya.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Menerapkan kebijakan penskalaan (Application Auto API Scaling)
Untuk menerapkan kebijakan penskalaan ke varian dengan Application Auto API Scaling, gunakan PutScalingPolicytindakan Application API Auto Scaling dengan parameter berikut:
-
PolicyName
—Nama kebijakan penskalaan. -
ServiceNamespace
—Tetapkan nilai ini kesagemaker
. -
ResourceID
—Pengidentifikasi sumber daya untuk varian. Untuk parameter ini, tipe sumber daya adalahendpoint
dan pengidentifikasi unik adalah nama varian. Misalnya,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount
. -
PolicyType
—Tetapkan nilai ini keTargetTrackingScaling
. -
TargetTrackingScalingPolicyConfiguration
—Konfigurasi kebijakan penskalaan pelacakan target yang akan digunakan untuk varian.
Contoh berikut menerapkan kebijakan penskalaan pelacakan target yang diberi nama
ke varian bernamamy-scaling-policy
, berjalan di titik my-variant
akhir. Konfigurasi kebijakan menjaga pemanggilan rata-rata per instance pada 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }