조정 활동을 설명하여 조정 활동의 상태 확인 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

조정 활동을 설명하여 조정 활동의 상태 확인

조정 활동을 설명하여 자동 조정된 엔드포인트의 조정 활동 상태를 확인할 수 있습니다. Application Auto Scaling은 지난 6주 동안 지정된 네임스페이스의 조정 활동에 대한 설명 정보를 제공합니다. 자세한 내용은 Application Auto Scaling 사용 설명서의 Application Auto Scaling에 대한 조정 활동을 참조하세요. Auto Scaling

조정 활동의 상태를 확인하려면 describe-scaling-activities 명령을 사용합니다. 콘솔을 사용하여 조정 활동의 상태를 확인할 수 없습니다.

조정 활동 설명(AWS CLI)

Application Auto Scaling 에 등록된 모든 SageMaker 리소스에 대한 조정 활동을 설명하려면 describe-scaling-activities 명령을 사용하고 --service-namespace 옵션sagemaker에 를 지정합니다.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

특정 리소스에 대한 조정 활동을 설명하려면 --resource-id 옵션을 포함합니다.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

다음 예제는 이 명령을 실행할 때 생성된 출력을 보여줍니다.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

인스턴스 할당량(AWS CLI)에서 차단된 조정 활동 식별

확장(인스턴스 추가)하면 계정 수준 인스턴스 할당량에 도달할 수 있습니다. describe-scaling-activities 명령을 사용하여 인스턴스 할당량에 도달했는지 확인할 수 있습니다. 할당량을 초과하면 자동 조정이 차단됩니다.

인스턴스 할당량에 도달했는지 확인하려면 describe-scaling-activities 명령을 사용하고 --resource-id 옵션의 리소스 ID를 지정합니다.

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

반환 구문 내에서 StatusCodeStatusMessage 키와 관련 값을 확인합니다. 는 를 StatusCode 반환합니다Failed. StatusMessage 안에 계정 수준 서비스 할당량에 도달했다는 메시지가 나타납니다. 다음은 표시될 수 있는 메시지의 예입니다.

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact AWS support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }