翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデル評価ノートブックのチュートリアル
このセクションでは、サンプルコードと説明を含む次のノートブックチュートリアルを提供します。
-
プロンプトのステレオタイプ化のために JumpStart モデルを評価する方法。
-
Amazon Bedrock モデルを評価してテキスト要約の精度を評価する方法。
追加のノートブック
fmeval GitHub
-
bedrock-claude-factual-knowledge.ipnyb
– Amazon Bedrock でホストされている Anthropic Claude 2 モデルを評価して、事実的な知識を得ます。 -
byo-model-outputs.ipynb
– モデルに推論リクエストを送信する代わりに独自のモデル出力をもたらす事実上の知識 JumpStart を得るために、 でホストされている Falcon 7b モデルを評価します。 -
custom_model_runner_chat_gpt.ipnyb
– でホストされているカスタム ChatGPT 3.5
モデルHugging Face
を評価して事実関係を把握します。