Überprüfen Sie den Status einer Skalierungsaktivität, indem Sie die Skalierungsaktivitäten beschreiben - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überprüfen Sie den Status einer Skalierungsaktivität, indem Sie die Skalierungsaktivitäten beschreiben

Sie können den Status einer Skalierungsaktivität für Ihren auto skalierten Endpunkt überprüfen, indem Sie die Skalierungsaktivitäten beschreiben. Application Auto Scaling bietet beschreibende Informationen zu den Skalierungsaktivitäten im angegebenen Namespace aus den letzten sechs Wochen. Weitere Informationen finden Sie unter Skalierungsaktivitäten für Application Auto Scaling im Application Auto Scaling Scaling-Benutzerhandbuch.

Verwenden Sie den describe-scaling-activitiesBefehl, um den Status einer Skalierungsaktivität zu überprüfen. Sie können den Status einer Skalierungsaktivität nicht mit der Konsole überprüfen.

Beschreiben Sie die Skalierungsaktivitäten (AWS CLI)

Um die Skalierungsaktivitäten für alle SageMaker KI-Ressourcen zu beschreiben, die bei Application Auto Scaling registriert sind, verwenden Sie den describe-scaling-activitiesBefehl und geben Sie sagemaker die --service-namespace Option an.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

Um Skalierungsaktivitäten für eine bestimmte Ressource zu beschreiben, fügen Sie die --resource-id Option hinzu.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Das folgende Beispiel zeigt die Ausgabe, die erzeugt wird, wenn Sie diesen Befehl ausführen.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

Identifizieren Sie blockierte Skalierungsaktivitäten anhand von Instanzkontingenten (AWS CLI)

Wenn Sie horizontal skalieren (weitere Instances hinzufügen), erreichen Sie möglicherweise Ihr Instance-Kontingent auf Kontoebene. Sie können den describe-scaling-activitiesBefehl verwenden, um zu überprüfen, ob Sie Ihr Instanzkontingent erreicht haben. Wenn Sie Ihr Kontingent überschreiten, wird Auto Scaling blockiert.

Um zu überprüfen, ob Sie Ihr Instance-Kontingent erreicht haben, verwenden Sie den describe-scaling-activitiesBefehl und geben Sie die Ressourcen-ID für die --resource-id Option an.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

Überprüfen Sie in der Syntax der Antwort die Tasten StatusCode und StatusMessageund die zugehörigen Werte. StatusCode gibt Failed zurück. StatusMessage enthält die Meldung, dass das Service Quota auf Kontoebene erreicht wurde. Es folgt ein Beispiel dafür, wie diese Mitteilung aussehen könnte:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }