기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모델에 크기 조정 정책을 추가하기 전에 먼저 오토 크기 조정을 위해 모델을 등록하고 모델의 크기 조정 한도를 정의해야 합니다.
다음 절차에서는 AWS Command Line Interface () 또는 Application Auto Scaling API를 사용하여 오토 스케일링을 위한 모델(프로덕션 변형AWS CLI)을 등록하는 방법을 다룹니다.
모델 등록(AWS CLI)
프로덕션 변형을 등록하려면 register-scalable-target 명령과 다음 파라미터를 사용합니다.
-
--service-namespace
—이 값을sagemaker
로 설정하세요. -
--resource-id
- 모델(특히 프로덕션 변형)의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 프로덕션 변형의 이름입니다. 예:endpoint/
.my-endpoint
/variant/my-variant
-
--scalable-dimension
—이 값을sagemaker:variant:DesiredInstanceCount
로 설정하세요. -
--min-capacity
—최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며max-capacity
에 지정된 값과 같거나 작아야 합니다. -
--max-capacity
—인스턴스의 최대 수입니다. 이 값은 최소 1로 설정되어야 하며min-capacity
에 지정된 값과 같거나 커야 합니다.
다음 예제는 동적으로 조정되어 1~8개의 인스턴스를 보유할 수 있으며
엔드포인트에서 실행되며 이름이 my-endpoint
인 변수를 등록하는 방법을 보여줍니다.my-variant
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1
\ --max-capacity8
모델 등록(Application Auto Scaling API)
Application Auto Scaling로 모델을 등록하려면, 다음 파라미터와 함께 RegisterScalableTarget Application Auto Scaling API 작업을 사용하세요.
-
ServiceNamespace
—이 값을sagemaker
로 설정하세요. -
ResourceID
- 프로덕션 변형의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은endpoint
이고 고유 식별자는 변형의 이름입니다. 예:endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
—이 값을sagemaker:variant:DesiredInstanceCount
로 설정하세요. -
MinCapacity
—최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며MaxCapacity
에 지정된 값과 같거나 작아야 합니다. -
MaxCapacity
—인스턴스의 최대 수입니다. 이 값은 최소 1로 설정되어야 하며MinCapacity
에 지정된 값과 같거나 커야 합니다.
다음 예제는 동적으로 조정되어 1~8개의 인스턴스를 보유할 수 있으며
엔드포인트에서 실행되며 이름이 my-endpoint
인 변수를 등록하는 방법을 보여줍니다.my-variant
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/
my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1
, "MaxCapacity":8
}