쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

모델 등록

포커스 모드
모델 등록 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델에 크기 조정 정책을 추가하기 전에 먼저 오토 크기 조정을 위해 모델을 등록하고 모델의 크기 조정 한도를 정의해야 합니다.

다음 절차에서는 AWS Command Line Interface () 또는 Application Auto Scaling API를 사용하여 오토 스케일링을 위한 모델(프로덕션 변형AWS CLI)을 등록하는 방법을 다룹니다.

모델 등록(AWS CLI)

프로덕션 변형을 등록하려면 register-scalable-target 명령과 다음 파라미터를 사용합니다.

  • --service-namespace—이 값을 sagemaker로 설정하세요.

  • --resource-id - 모델(특히 프로덕션 변형)의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 프로덕션 변형의 이름입니다. 예: endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension—이 값을 sagemaker:variant:DesiredInstanceCount로 설정하세요.

  • --min-capacity—최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 max-capacity에 지정된 값과 같거나 작아야 합니다.

  • --max-capacity—인스턴스의 최대 수입니다. 이 값은 최소 1로 설정되어야 하며 min-capacity에 지정된 값과 같거나 커야 합니다.

다음 예제는 동적으로 조정되어 1~8개의 인스턴스를 보유할 수 있으며 my-endpoint 엔드포인트에서 실행되며 이름이 my-variant인 변수를 등록하는 방법을 보여줍니다.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

모델 등록(Application Auto Scaling API)

Application Auto Scaling로 모델을 등록하려면, 다음 파라미터와 함께 RegisterScalableTarget Application Auto Scaling API 작업을 사용하세요.

  • ServiceNamespace—이 값을 sagemaker로 설정하세요.

  • ResourceID - 프로덕션 변형의 리소스 식별자입니다. 이 파라미터에서 리소스 유형은 endpoint이고 고유 식별자는 변형의 이름입니다. 예: endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension—이 값을 sagemaker:variant:DesiredInstanceCount로 설정하세요.

  • MinCapacity—최소 인스턴스 수입니다. 이 값은 최소 1로 설정되어야 하며 MaxCapacity에 지정된 값과 같거나 작아야 합니다.

  • MaxCapacity—인스턴스의 최대 수입니다. 이 값은 최소 1로 설정되어야 하며 MinCapacity에 지정된 값과 같거나 커야 합니다.

다음 예제는 동적으로 조정되어 1~8개의 인스턴스를 보유할 수 있으며 my-endpoint 엔드포인트에서 실행되며 이름이 my-variant인 변수를 등록하는 방법을 보여줍니다.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }
프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.