Memeriksa status aktivitas penskalaan dengan menjelaskan aktivitas penskalaan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memeriksa status aktivitas penskalaan dengan menjelaskan aktivitas penskalaan

Anda dapat memeriksa status aktivitas penskalaan untuk titik akhir yang diskalakan otomatis dengan menjelaskan aktivitas penskalaan. Application Auto Scaling memberikan informasi deskriptif tentang aktivitas penskalaan di namespace yang ditentukan dari enam minggu sebelumnya. Untuk informasi selengkapnya, lihat Aktivitas penskalaan untuk Application Auto Scaling di Panduan Pengguna Application Auto Scaling.

Untuk memeriksa status aktivitas penskalaan, gunakan describe-scaling-activitiesperintah. Anda tidak dapat memeriksa status aktivitas penskalaan menggunakan konsol.

Jelaskan aktivitas penskalaan ()AWS CLI

Untuk menjelaskan aktivitas penskalaan untuk semua SageMaker sumber daya yang terdaftar dengan Application Auto Scaling, gunakan perintah, describe-scaling-activitiesyang sagemaker menentukan opsi. --service-namespace

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Untuk menggambarkan aktivitas penskalaan untuk sumber daya tertentu, sertakan --resource-id opsi.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Contoh berikut menunjukkan output yang dihasilkan ketika Anda menjalankan perintah ini.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identifikasi aktivitas penskalaan yang diblokir dari kuota instance ()AWS CLI

Saat Anda memperkecil skala (menambahkan lebih banyak instance), Anda mungkin mencapai kuota instans tingkat akun Anda. Anda dapat menggunakan describe-scaling-activitiesperintah untuk memeriksa apakah Anda telah mencapai kuota instans Anda. Ketika Anda melebihi kuota Anda, penskalaan otomatis diblokir.

Untuk memeriksa apakah Anda telah mencapai kuota instans Anda, gunakan describe-scaling-activitiesperintah dan tentukan ID sumber daya untuk --resource-id opsi tersebut.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Dalam sintaks pengembalian, periksa StatusMessagekunci StatusCodedan dan nilai terkaitnya. StatusCodekembaliFailed. Di dalamnya StatusMessage ada pesan yang menunjukkan bahwa kuota layanan tingkat akun telah tercapai. Berikut ini adalah contoh dari apa pesan itu mungkin terlihat seperti:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }