기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
이 섹션에서는 예시 코드와 설명이 포함된 다음 노트북 자습서를 제공합니다.
-
JumpStart 모델의 프롬프트 고정 관념화를 평가하는 방법
-
Amazon Bedrock 모델의 텍스트 요약 정확도를 평가하는 방법
추가 노트북
fmeval GitHub
-
bedrock-claude-factual-knowledge.ipnyb
- Amazon Bedrock에서 호스팅되는 Anthropic Claude 2 모델의 사실적 지식을 평가합니다. -
byo-model-outputs.ipynb
– 추론 요청을 모델에 보내는 대신 자체 모델 출력을 가져오는 JumpStart에서 호스팅되는 Falcon 7b 모델 의 사실적 지식을 제공합니다. -
custom_model_runner_chat_gpt.ipnyb
- Hugging Face
에서 호스팅되는 사용자 지정ChatGPT 3.5
모델의 사실적 지식을 평가합니다.