Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memeriksa status aktivitas penskalaan dengan menjelaskan aktivitas penskalaan
Anda dapat memeriksa status aktivitas penskalaan untuk titik akhir yang diskalakan otomatis dengan menjelaskan aktivitas penskalaan. Application Auto Scaling memberikan informasi deskriptif tentang aktivitas penskalaan di namespace yang ditentukan dari enam minggu sebelumnya. Untuk informasi selengkapnya, lihat Aktivitas penskalaan untuk Application Auto Scaling di Panduan Pengguna Application Auto Scaling.
Untuk memeriksa status aktivitas penskalaan, gunakan describe-scaling-activitiesperintah. Anda tidak dapat memeriksa status aktivitas penskalaan menggunakan konsol.
Topik
Jelaskan aktivitas penskalaan ()AWS CLI
Untuk menjelaskan aktivitas penskalaan untuk semua sumber daya SageMaker AI yang terdaftar dengan Application Auto Scaling, gunakan perintah, describe-scaling-activitiesyang sagemaker
menentukan opsi tersebut. --service-namespace
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker
Untuk menggambarkan aktivitas penskalaan untuk sumber daya tertentu, sertakan --resource-id
opsi.
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
Contoh berikut menunjukkan output yang dihasilkan ketika Anda menjalankan perintah ini.
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "string",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "string",
"StatusMessage": "string"
}
Identifikasi aktivitas penskalaan yang diblokir dari kuota instance ()AWS CLI
Saat Anda memperkecil skala (menambahkan lebih banyak instance), Anda mungkin mencapai kuota instans tingkat akun Anda. Anda dapat menggunakan describe-scaling-activitiesperintah untuk memeriksa apakah Anda telah mencapai kuota instans Anda. Ketika Anda melebihi kuota Anda, penskalaan otomatis diblokir.
Untuk memeriksa apakah Anda telah mencapai kuota instans Anda, gunakan describe-scaling-activitiesperintah dan tentukan ID sumber daya untuk --resource-id
opsi tersebut.
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
Dalam sintaks pengembalian, periksa StatusMessagekunci StatusCodedan dan nilai terkaitnya. StatusCode
kembaliFailed
. Di dalamnya StatusMessage
ada pesan yang menunjukkan bahwa kuota layanan tingkat akun telah tercapai. Berikut ini adalah contoh dari apa pesan itu mungkin terlihat seperti:
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "minimum capacity was set to 110",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "Failed",
"StatusMessage": "Failed to set desired instance count to 110. Reason: The
account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000
Instances, with current utilization of 997 Instances and a request delta
of 20 Instances. Please contact AWS support to request an increase for this
limit. (Service: AmazonSageMaker; Status Code: 400;
Error Code: ResourceLimitExceeded; Request ID: request-id)."
}