모델 평가 노트북 자습서

이 섹션에서는 예시 코드와 설명이 포함된 다음 노트북 자습서를 제공합니다.

추가 노트북

fmeval GitHub 디렉터리에는 다음과 같은 추가 예시 노트북이 포함되어 있습니다.

bedrock-claude-factual-knowledge.ipnyb - Amazon Bedrock에서 호스팅되는 Anthropic Claude 2 모델의 사실적 지식을 평가합니다.
byo-model-outputs.ipynb – 추론 요청을 모델에 보내는 대신 자체 모델 출력을 가져오는 JumpStart에서 호스팅되는 Falcon 7b 모델의 사실적 지식을 제공합니다.
custom_model_runner_chat_gpt.ipnyb - Hugging Face에서 호스팅되는 사용자 지정 ChatGPT 3.5 모델의 사실적 지식을 평가합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

fmeval 라이브러리 사용

JumpStart 모델의 프롬프트 고정 관념화 평가