本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Bedrock 评估选择表现最佳的知识库
您可以使用计算指标来评估知识库从您的数据源中检索相关信息的有效性,以及生成的答案在回答问题方面的有效性。知识库评估的结果允许您比较不同的知识库,然后选择适合您的 AI 应用程序的最佳知识库。
您可以设置两种不同类型的知识库评估作业。
-
仅限检索 — 在仅限检索的模型评估作业中,评估器模型用于根据您的知识库进行推断。该报告基于从您的知识库中检索到的数据以及您选择的指标。
-
检索和响应生成 — 在检索和响应生成模型评估工作中,评估器模型用于根据您的知识进行推断。该报告基于从您的知识库中检索到的数据以及评估者模型生成的摘要。
使用以下主题来了解如何创建和管理知识库评估作业,以及您可以使用的绩效指标类型。