기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
자동 모델 튜닝은 하이퍼파라미터 튜닝이라고도 하는데, 데이터 세트에 대해 광범위한 하이퍼파라미터 범위를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다. 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘에서 계산하는 지표 중에서 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다.
모델 튜닝에 대한 추가 정보는 SageMaker AI를 사용한 자동 모델 튜닝 섹션을 참조하세요.
IP Insights 알고리즘으로 계산되는 지표
Amazon SageMaker AI IP Insights 알고리즘은 IP 주소와 엔터티 간의 연결을 학습하는 비지도 학습 알고리즘입니다. 이 알고리즘은 관측 데이터 포인트(포지티브 샘플)와 무작위로 생성된 데이터 포인트(네거티브 샘플)를 구분하도록 학습하는 판별자 모델을 훈련합니다. IP Insights에 대한 자동 모델 튜닝은 라벨링되지 않은 검증 데이터와 자동으로 생성된 네거티브 샘플을 가장 정확하게 구분할 수 있는 모델을 찾는데 도움을 줍니다. 유효성 검사 데이터 세트에 대한 모델 정확도는 Receiver Operating Characteristic(ROC) 곡선 아래의 면적으로 측정됩니다. 이 validation:discriminator_auc
지표는 0.0~1.0의 값을 가질 수 있는데, 여기서 1.0은 완벽한 정확도를 나타냅니다.
IP Insights 알고리즘은 검증 중 validation:discriminator_auc
지표를 계산해, 이 지표의 값을 하이퍼파라미터 튜닝을 위해 최적화하기 위한 목표 함수로 사용합니다.
지표 이름 | 설명 | 최적화 방향 |
---|---|---|
validation:discriminator_auc |
유효성 검사 데이터 세트의 ROC 곡선 아래 영역. 검증 데이터 세트는 라벨링되지 않습니다. Area Under the Curve(AUC)는 유효성 검사 데이터 포인트와 무작위로 생성된 데이터 포인트를 구분할 수 있는 모델의 능력을 나타내는 지표입니다. |
최대화 |
튜닝 가능한 IP Insights 하이퍼파라미터
SageMaker AI IP Insights 알고리즘에 대해 다음 하이퍼파라미터를 조정할 수 있습니다.
파라미터 이름 | 파라미터 유형 | 권장 범위 |
---|---|---|
epochs |
IntegerParameterRange |
MinValue: 1, MaxValue: 100 |
learning_rate |
ContinuousParameterRange |
MinValue: 1e-4, MaxValue: 0.1 |
mini_batch_size |
IntegerParameterRanges |
MinValue: 100, MaxValue: 50000 |
num_entity_vectors |
IntegerParameterRanges |
MinValue: 10000, MaxValue: 1000000 |
num_ip_encoder_layers |
IntegerParameterRanges |
MinValue: 1, MaxValue: 10 |
random_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
shuffled_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
vector_dim |
IntegerParameterRanges |
MinValue: 8, MaxValue: 256 |
weight_decay |
ContinuousParameterRange |
MinValue: 0.0, MaxValue: 1.0 |