モデル評価ノートブックのチュートリアル

このセクションでは、サンプルコードと説明を含む次のノートブックチュートリアルを提供します。

追加のノートブック

fmeval GitHub ディレクトリには、次の追加のノートブック例が提供されています。

bedrock-claude-factual-knowledge.ipnyb – 事実に関する知識向けの Amazon Bedrock でホストされている Anthropic Claude 2 モデルを評価します。
byo-model-outputs.ipynb – 事実に関する知識向けの JumpStart でホストされている Falcon 7b モデルを評価します。モデルに推論リクエストを送信する代わりに独自のモデル出力を使用できます。
custom_model_runner_chat_gpt.ipnyb – 事実に関する知識向けの Hugging Face でホストされているカスタム ChatGPT 3.5 モデルを評価します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

fmeval ライブラリを使用する

JumpStart モデルのプロンプトのステレオタイプ評価を行う