모델 평가 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델 평가

Amazon Bedrock은 모델 평가 작업을 지원합니다. 모델 평가 작업의 결과를 통해 모델 출력을 비교한 다음 다운스트림 제너레이티브 AI 애플리케이션에 가장 적합한 모델을 선택할 수 있습니다.

모델 평가 작업은 텍스트 생성, 텍스트 분류, 질문 답변, 텍스트 요약과 같은 대형 언어 모델 (LLM) 의 일반적인 사용 사례를 지원합니다.

자동 모델 평가 작업에 대한 모델의 성능을 평가하려면 내장된 프롬프트 데이터셋 또는 자체 프롬프트 데이터세트를 사용할 수 있습니다. 워커를 사용하는 모델 평가 작업의 경우 자체 데이터셋이 있어야 합니다.

자동 모델 평가 작업을 생성할지, 작업 인력을 사용하는 모델 평가 작업을 생성할지 선택할 수 있습니다.

개요: 자동 모델 평가 작업

자동 모델 평가 작업을 사용하면 모델의 작업 수행 능력을 빠르게 평가할 수 있습니다. 특정 사용 사례에 맞게 조정한 사용자 지정 프롬프트 데이터 세트를 제공하거나 사용 가능한 내장형 데이터 세트를 사용할 수 있습니다.

개요: 작업자를 사용하는 모델 평가 작업

작업자를 사용하는 모델 평가 작업을 사용하면 모델 평가 프로세스에 사람의 의견을 반영할 수 있습니다. 이들은 회사 직원이거나 업계의 분야별 전문가 그룹일 수 있습니다.

다음 주제에서는 사용 가능한 모델 평가 작업과 사용할 수 있는 지표 종류에 대해 설명합니다. 또한 사용 가능한 내장형 데이터 세트와 자체 데이터 세트를 지정하는 방법도 설명합니다.