자동 모델 튜닝 리소스 제한 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

자동 모델 튜닝 리소스 제한

SageMaker AI는 자동 모델 튜닝에 사용되는 리소스에 대해 다음과 같은 기본 제한을 설정합니다.

리소스 리전 기본 제한 높일 수 있음

병렬(동시) 하이퍼파라미터 튜닝 작업 수

모두

100

N/A

검색할 수 있는 하이퍼파라미터 수*

모두

30

N/A

하이퍼파라미터 튜닝 작업 당 정의된 지표 수

모두

20

N/A

하이퍼파라미터 튜닝 작업 당 병렬 훈련 작업 수

모두

10

100

[베이지안 최적화] 하이퍼파라미터 튜닝 작업 당 훈련 작업 수

모두

750

N/A

[임의 검색] 하이퍼파라미터 튜닝 작업 당 훈련 작업 수

모두

750

10000

[하이퍼밴드] 하이퍼파라미터 튜닝 작업 당 훈련 작업 수

모두

750

N/A

[그리드] 하이퍼파라미터 튜닝 작업당 훈련 작업 수(명시적으로 지정되거나 검색 공간에서 추론된 것)

모두

750

N/A

하이퍼파라미터 튜닝 작업의 최대 실행 시간

모두

30일

N/A

* 각 범주형 하이퍼파라미터는 최대 30개의 서로 다른 값을 가질 수 있습니다.

리소스 제한 예제

하이퍼파라미터 튜닝 작업을 계획할 경우 훈련 리소스에 대한 제한도 고려해야 합니다. SageMaker AI 훈련 작업의 기본 리소스 제한에 대한 자세한 내용은 SageMaker AI 제한을 참조하세요. 모든 하이퍼파라미터 튜닝 작업이 실행되는 모든 동시 훈련 인스턴스는 허용되는 총 훈련 인스턴스 수에 대해 계산됩니다. 예를 들어, 10개의 동시 하이퍼파라미터 튜닝 작업을 실행하는 경우, 각각의 하이퍼파라미터 튜닝 작업은 총 100개의 훈련 작업을 실행하고 동시 훈련 작업을 20개 실행합니다. 이러한 각각의 훈련 작업은 하나의 ml.m4.xlarge 인스턴스에서 실행됩니다. 다음과 같은 제한이 적용됩니다.

  • 동시 하이퍼파라미터 튜닝 작업 수: 10개의 튜닝 작업이 제한값인 100개보다 적기 때문에 제한을 늘릴 필요가 없습니다.

  • 하이퍼파라미터 튜닝 작업당 훈련 작업 수: 100개의 훈련 작업이 제한값인 750개보다 적기 때문에 제한을 늘릴 필요가 없습니다.

  • 하이퍼파라미터 튜닝 작업당 동시 훈련 작업 수: 기본 제한이 10개이기 때문에 제한은 20개로 늘리도록 요청해야 합니다.

  • SageMaker AI 훈련 ml.m4.xlarge 인스턴스: 각각 20개의 동시 훈련 작업을 실행하는 하이퍼파라미터 튜닝 작업이 10개 있으므로 200개로 제한 증가를 요청해야 합니다. 기본 제한은 인스턴스 20개입니다.

  • SageMaker AI 훈련 총 인스턴스 수: 하이퍼파라미터 튜닝 작업이 10개 있고 각각 동시 훈련 작업이 20개 실행되므로 200개로 제한 증가를 요청해야 합니다. 기본 제한은 인스턴스 20개입니다.

할당량 증가 요청:
  1. AWS 지원 센터 페이지를 열고 필요한 경우, 로그인한 다음 사례 생성을 선택합니다.

  2. Create case(사례 생성) 페이지에서 Service limit increase(서비스 제한 증가)를 선택합니다.

  3. 사례 세부 정보 패널에서 한도 유형에 대해 SageMaker AI 자동 모델 튜닝 [Hyperparameter Optimization]을 선택합니다.

  4. 요청 1요청 패널에서 요청하려는 리전, 늘릴 리소스 한도, 새 한도 값을 선택합니다. 할당량 증가에 대해 추가 요청이 있는 경우 다른 요청 추가를 선택합니다.

    리소스 제한 증가 요청 UI.
  5. 사례 설명 패널에 사용 사례에 대한 설명을 입력합니다.

  6. 연락처 옵션 패널에서 기본 설정 연락 방법(, 채팅 또는 전화)을 선택한 다음 제출을 선택합니다.