기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모델을 사용자 지정하여 사용 사례에 맞게 성능 개선
모델 사용자 지정은 특정 사용 사례에 대한 성능을 개선하기 위해 모델에 훈련 데이터를 제공하는 프로세스입니다. Amazon Bedrock 파운데이션 모델을 사용자 지정하여 성능을 개선하고 더 나은 고객 경험을 제공할 수 있습니다. Amazon Bedrock은 현재 다음과 같은 사용자 지정 방법을 제공합니다.
-
추출
추출을 사용하여 더 큰 지능형 모델(교사라고 함)에서 더 작고 빠르며 비용 효율적인 모델(학생이라고 함)로 지식을 이전할 수 있습니다. Amazon Bedrock은 최신 데이터 합성 기법을 사용하여 교사 모델에서 다양하고 품질이 좋은 응답을 생성하여 추출 프로세스를 자동화하고 학생 모델을 미세 조정합니다.
추출을 사용하려면 사용 사례에 맞게 정확도를 달성하고자 하는 교사 모델과 미세 조정할 학생 모델을 선택합니다. 그런 다음 사용 사례별 프롬프트를 입력 데이터로 제공합니다. Amazon Bedrock은 지정된 프롬프트에 대해 교사 모델에서 응답을 생성한 다음 응답을 사용하여 학생 모델을 미세 조정합니다. 필요에 따라 레이블이 지정된 입력 데이터를 프롬프트-응답 페어로 제공할 수 있습니다.
추출 사용에 대한 자세한 내용은 섹션을 참조하세요Amazon Bedrock에서의 모델 추출.
-
미세 조정
레이블이 지정된 데이터를 제공하여 특정 작업에 대한 성능이 개선되도록 모델을 훈련시킵니다. 레이블이 지정된 예제의 훈련 데이터세트를 제공하면 모델이 특정 유형의 입력에 대해 생성해야 하는 출력 유형을 연관시키는 방법을 학습할 수 있습니다. 모델 파라미터는 프로세스에서 조정되며, 훈련 데이터세트로 표시되는 작업에 대해 모델의 성능이 향상됩니다.
-
지속적인 사전 훈련
레이블이 지정되지 않은 데이터를 제공하여 파운데이션 모델이 특정 유형의 입력에 익숙해지도록 사전 훈련시킵니다. 특정 주제의 데이터를 제공하여 모델을 해당 영역에 노출시킬 수 있습니다. 지속적인 사전 훈련 프로세스는 입력 데이터에 맞게 모델 파라미터를 조정하고 도메인 지식을 개선합니다.
예를 들어, 대규모 언어 모델을 훈련하는 데 공개적으로 사용할 수 없는 비즈니스 문서와 같은 개인 데이터를 사용하여 모델을 훈련시킬 수 있습니다. 또한 레이블이 지정되지 않은 데이터를 더 많이 사용할 수 있게 되면 모델을 재훈련하여 계속해서 개선할 수 있습니다.
모델 사용자 지정 할당량에 대한 자세한 내용은 AWS 일반 참조의 Amazon Bedrock endpoints and quotas를 참조하세요.
참고
모델에서 처리한 토큰 수(훈련 데이터 말뭉치의 토큰 수 x 에포크 수) 및 모델당 매월 청구되는 모델 스토리지에 따라 모델 훈련 요금이 부과됩니다. 자세한 내용은 Amazon Bedrock 요금
모델 사용자 지정에서 다음 단계를 수행합니다.
-
사용자 지정 작업에 대한 훈련 및 필요한 경우 검증 데이터세트를 만듭니다.
-
새 사용자 지정 IAM 역할을 사용하려면 데이터의 S3 버킷에 액세스할 수 있도록 IAM 권한을 설정합니다. 기존 역할을 사용하거나 콘솔이 적절한 권한을 가진 역할을 자동으로 만들게 할 수도 있습니다.
-
하이퍼파라미터 값을 조정해 훈련 프로세스를 제어하여 미세 조정 또는 지속적인 사전 훈련 작업을 만듭니다.
-
훈련 또는 검증 지표를 보거나 모델 평가를 사용하여 결과를 분석합니다.
-
새롭게 만든 사용자 지정 모델을 위한 프로비저닝된 처리량을 구매합니다.
-
모델 추론과 같은 Amazon Bedrock 작업에서 기본 모델과 마찬가지로 사용자 지정 모델을 사용합니다.