Amazon Bedrock 모델 디스털레이션을 위한 사전 조건 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Bedrock 모델 디스털레이션을 위한 사전 조건

모델 추출 작업을 시작하기 전에 다음 사전 조건을 완료합니다.

  1. 교사 모델 결정

    학생 모델보다 훨씬 더 크고 성능이 뛰어나며 사용 사례에 맞게 정확성을 달성하고자 하는 교사 모델을 선택합니다. 추출 작업을 더 효과적으로 만들려면 사용 사례와 유사한 작업에 대해 이미 훈련된 모델을 선택합니다. Amazon Bedrock에서 지원하는 교사 모델에 대한 자세한 내용은 섹션을 참조하세요Amazon Bedrock 모델 디스털레이션에 지원되는 모델 및 리전.

  2. 학생 모델 결정

    크기가 훨씬 작은 학생 모델을 선택합니다. Amazon Bedrock이 지원하는 학생 모델에 대한 자세한 내용은 섹션을 참조하세요Amazon Bedrock 모델 디스털레이션에 지원되는 모델 및 리전.

  3. 입력 데이터 세트 준비

    사용자 지정 모델에 대한 입력 데이터 세트를 준비하려면 .jsonl 파일을 생성합니다. 각 줄은 레코드에 해당하는 JSON 객체입니다. 만든 파일은 선택한 사용자 지정 방법 및 모델의 형식을 준수해야 하며, 파일의 레코드는 크기 요구 사항을 준수해야 합니다.

    참고

    Anthropic 또는 Meta Llama 모델을 사용하는 경우이 단계를 계속 진행합니다.

    모델을 추출Amazon Nova에 사용하는 경우 다음 지침을 참조한 다음 4단계를 진행합니다.

    입력 데이터를 프롬프트로 제공합니다. Amazon Bedrock은 입력 데이터를 사용하여 교사 모델에서 응답을 생성하고 생성된 응답을 사용하여 학생 모델을 미세 조정합니다. Amazon Bedrock이 사용하는 입력에 대한 자세한 내용과 사용 사례에 가장 적합한 옵션을 선택하려면 섹션을 참조하세요Amazon Bedrock Model Distillation 작동 방식.

    입력 데이터 세트 준비에 대한 지침을 보려면 사용 사례에 가장 적합한 옵션을 선택합니다.

    옵션 1: 자체 프롬프트 제공

    프롬프트를 수집하여 JSON L(JSONL) 형식으로 저장합니다. JSONL의 각 레코드는 다음 구조를 사용해야 합니다.

    • 값이 있어야 하는 schemaVersion 필드를 포함합니다bedrock-conversion-2024.

    • [선택 사항] 모델에 할당된 역할을 나타내는 시스템 프롬프트를 포함합니다.

    • messages 필드에 모델에 제공된 입력 프롬프트가 포함된 사용자 역할을 포함합니다.

    • [선택 사항] messages 필드에 원하는 응답이 포함된 어시스턴트 역할을 포함합니다.

    미리 보기 릴리스 Anthropic 및 Meta Llama 모델의 경우 단일 전환 대화 프롬프트만 지원하므로 사용자 프롬프트는 하나만 사용할 수 있습니다. Amazon Nova 모델은 멀티턴 대화를 지원하므로 하나의 레코드 내에서 여러 사용자 및 어시스턴트 교환을 제공할 수 있습니다.

    예제 형식

    { "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "A chat between a curious User and an artificial intelligence Bot. The Bot gives helpful, detailed, and polite answers to the User's questions." } ], "messages": [ { "role": "user", "content": [ { "text": "why is the sky blue" } ] }, { "role": "assistant" "content": [ { "text": "The sky is blue because molecules in the air scatter blue light from the Sun more than other colors." } ] } ] }

    옵션 2: 호출 로그 사용

    모델 추출에 호출 로그를 사용하려면 모델 호출 로깅을 설정하고 모델 호출 작업 중 하나를 사용하고 Amazon S3 버킷을 로그의 대상으로 설정했는지 확인합니다. 모델 추출 작업을 시작하려면 먼저 로그에 액세스할 수 있는 Amazon Bedrock 권한을 제공해야 합니다. 호출 로그 설정에 대한 자세한 내용은 Amazon CloudWatch Logs를 사용하여 모델 호출 모니터링을 참조하세요.

    이 옵션을 사용하면 Amazon Bedrock이 프롬프트만 사용할지 아니면 호출 로그의 프롬프트-응답 페어를 사용할지 지정할 수 있습니다. Amazon Bedrock이 프롬프트만 사용하도록 하려면 Amazon Bedrock이 독점 데이터 합성 기술을 추가하여 교사 모델에서 다양하고 품질이 높은 응답을 생성할 수 있습니다. Amazon Bedrock이 프롬프트-응답 페어를 사용하도록 하려는 경우 Amazon Bedrock은 교사 모델의 응답을 다시 생성하지 않습니다. Amazon Bedrock은 간접 호출 로그의 응답을 직접 사용하여 학생 모델을 미세 조정합니다.

    중요

    학생 모델을 미세 조정하기 위해 Amazon Bedrock에 최대 15K000개의 프롬프트 또는 프롬프트 응답 페어를 제공할 수 있습니다. 학생 모델이 특정 요구 사항에 맞게 미세 조정되도록 하려면 다음을 수행하는 것이 좋습니다.

    • Amazon Bedrock이 프롬프트만 사용하도록 하려면 모든 모델에서에서 생성된 프롬프트-응답 페어가 100개 이상 있는지 확인합니다.

    • Amazon Bedrock이 호출 로그의 응답을 사용하도록 하려면 선택한 교사 모델과 정확히 일치하는 호출 로그의 모델에서 생성된 프롬프트-응답 페어가 100개 이상 있어야 합니다.

    선택적으로 모델 호출 작업 중 하나를 사용하여 호출 로그의 프롬프트-응답 페어에 요청 메타데이터를 추가한 다음 나중에 이를 사용하여 로그를 필터링할 수 있습니다. Amazon Bedrock은 필터링된 로그를 사용하여 학생 모델을 미세 조정할 수 있습니다.

    여러 요청 메타데이터를 사용하여 로그를 필터링하려면 단일 작업 부울 연산자 AND, OR 또는 NOT을 사용합니다. 작업을 결합할 수 없습니다. 단일 요청 메타데이터 필터링의 경우 부울 연산자 NOT을 사용합니다.

  4. 적절한 권한이 있는 IAM 서비스 역할이 아직 없는 경우의 지침에 따라 적절한 권한이 있는 새 사용자 지정 AWS Identity and Access Management (IAM) 서비스 역할을 생성모델 사용자 지정을 위한 서비스 역할 생성하여 역할을 설정합니다. 를 사용하여 서비스 역할을 AWS Management Console 자동으로 생성하려는 경우이 사전 조건을 건너뛸 수 있습니다.

  5. (선택 사항) 추가 보안 구성을 설정합니다.