护栏的组成部分 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

护栏的组成部分

Amazon Bedrock Guardrails 由一系列不同的筛选策略组成,您可以配置这些策略来避免出现不良和有害的内容,并删除或屏蔽敏感信息以保护隐私。

您可以在护栏中配置以下策略:

  • 内容过滤器 — 您可以配置阈值来屏蔽包含仇恨、侮辱、性、暴力、不当行为(包括犯罪活动)和即时攻击(即时注入和越狱)等有害内容的输入提示或模型响应。例如,电子商务网站可以设计其在线助手,以避免使用不恰当的语言,例如仇恨言论或侮辱。

  • 拒绝的主题 — 您可以在生成式 AI 应用程序中定义一组要避免的主题。例如,银行助理应用程序可以设计为避免与非法投资建议相关的话题。

  • 单词过滤器 — 您可以配置一组自定义单词或短语,以便在用户与生成式 AI 应用程序之间的交互中检测和屏蔽这些单词或短语。例如,您可以检测和屏蔽亵渎内容以及特定的自定义词语,例如竞争对手姓名或其他令人反感的词语。

  • 敏感信息过滤器-您可以在用户输入和 FM 响应中检测敏感内容,例如个人身份信息 (PII) 或自定义正则表达式实体。根据用例,您可以拒绝包含敏感信息的输入,也可以在 FM 响应中对其进行编辑。例如,您可以编辑用户的个人信息,同时根据客户和代理对话记录生成摘要。

  • 情境接地检查 — 如果模型响应中的幻觉没有在源信息中扎根(事实上不准确或添加了新信息),或者与用户的查询无关,则可以检测和过滤模型响应中的幻觉。例如,如果模型响应偏离检索段落中的信息或未回答用户的问题,则可以在RAG应用程序(检索增强生成)中屏蔽或标记响应。