透過描述擴展活動來檢查擴展活動的狀態 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

透過描述擴展活動來檢查擴展活動的狀態

您可以藉由描述擴展活動,檢查自動擴展端點的擴展活動狀態。Application Auto Scaling 提供過去六週內指定命名空間中擴展活動的描述性資訊。如需詳細資訊,請參閱《Application Auto Scaling 使用者指南》中的 Application Auto Scaling 擴展活動。

若要檢查擴展活動的狀態,請使用 describe-scaling-activities命令。您無法使用主控台檢查擴展活動的狀態。

描述擴展活動 (AWS CLI)

若要描述向 Application Auto Scaling 註冊的所有 SageMaker AI 資源的擴展活動,請使用 describe-scaling-activities命令,sagemaker--service-namespace選項指定 。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

若要描述特定資源的擴展活動,請包含 --resource-id選項。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

下列範例顯示執行此命令時產生的輸出。

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

從執行個體配額識別封鎖的擴展活動 (AWS CLI)

當您向外擴展 (新增更多執行個體) 時,您可能會達到帳戶層級執行個體配額。您可以使用 describe-scaling-activities命令來檢查是否已達到執行個體配額。當您超過配額時,自動擴展會遭到封鎖。

若要檢查是否已達到執行個體配額,請使用 describe-scaling-activities命令,並指定 --resource-id選項的資源 ID。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

在傳回語法中,檢查 StatusCodeStatusMessage 鍵及其相關值。StatusCode 傳回 Failed。在 StatusMessage 內有一則訊息,指出已達到帳戶層級的服務配額。以下是訊息的範例:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }