本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Amazon Bedrock 中评估模型的性能
使用模型评估来评估 Amazon Bedrock 模型的性能和有效性。您可以创建自动模型作业来查看性能指标,例如模型的语义稳健性。您还可以利用人工团队对评估进行评分并提供他们的意见。
自动评估会生成计算得出的分数和指标,帮助您评估模型的有效性。基于人为的评估使用一组人员,他们提供与某些指标相关的评分和偏好。
要创建模型评估任务,您必须能够访问至少一个 Amazon Bedrock 模型。模型评估作业支持使用基础模型、自定义基础模型以及已购买预配置吞吐量的模型。