모델 등록 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델 등록

모델에 크기 조정 정책을 추가하기 전에 먼저 모델을 자동 크기 조정에 등록하고 모델의 크기 조정 한도를 정의해야 합니다.

다음 절차에서는 AWS Command Line Interface () 또는 Application Auto Scaling을 사용하여 오토 스케일링을 위한 모델(프로덕션 변형AWS CLI)을 등록하는 방법을 다룹니다API.

모델 등록(AWS CLI)

프로덕션 변형을 등록하려면 다음 파라미터와 함께 register-scalable-target 명령을 사용합니다.

  • --service-namespace - 이 값을 sagemaker로 설정하세요.

  • --resource-id - 모델(특히 프로덕션 변형)의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 프로덕션 변형의 이름입니다. 예: endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension - 이 값을 sagemaker:variant:DesiredInstanceCount로 설정하세요.

  • --min-capacity- 최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 max-capacity에 지정된 값과 같거나 작아야 합니다.

  • --max-capacity- 최대 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 min-capacity에 지정된 값과 같거나 커야 합니다.

다음 예제에서는 my-endpoint 엔드포인트에서 my-variant실행 중인 라는 변형을 등록하는 방법을 보여줍니다. 이 변형은 1~8개의 인스턴스를 갖도록 동적으로 확장할 수 있습니다.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

모델 등록(Application Auto ScalingAPI)

Application Auto Scaling 에 모델을 등록하려면 다음 파라미터와 함께 RegisterScalableTarget Application Auto Scaling API 작업을 사용합니다.

  • ServiceNamespace - 이 값을 sagemaker로 설정하세요.

  • ResourceID - 프로덕션 변형의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension - 이 값을 sagemaker:variant:DesiredInstanceCount로 설정하세요.

  • MinCapacity- 최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 MaxCapacity에 지정된 값과 같거나 작아야 합니다.

  • MaxCapacity- 최대 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 MinCapacity에 지정된 값과 같거나 커야 합니다.

다음 예제에서는 my-endpoint 엔드포인트에서 my-variant실행되고 1~8개의 인스턴스를 사용하도록 동적으로 확장할 수 있는 라는 변형을 등록하는 방법을 보여줍니다.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }