本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在里面创建护栏 AWS 控制台
您可以通过设置配置、定义要拒绝的主题、提供用于处理有害和敏感内容的过滤器以及为何时阻止提示和用户响应编写消息来创建防护栏。
当提示和用户响应被屏蔽时,护栏必须包含至少一个过滤器和消息。您可以选择使用默认消息。您可以添加过滤器并在以后迭代护栏,方法是按照中的步骤配置护栏所需的所有组件。修改护栏
选择与您选择的方法相对应的选项卡,然后按照步骤操作。
- Console
-
要在中创建护栏 AWS 控制台
-
登录 AWS Management Console 使用具有 Amazon Bedrock 权限的IAM角色,然后打开 Amazon Bedrock 控制台,网址为。https://console.aws.amazon.com/bedrock/
-
在左侧导航窗格中,选择 “护栏”。
-
在护栏部分,选择创建护栏。
-
在提供护栏详细信息页面上,执行以下操作:
-
在护栏详细信息部分,提供护栏的名称和可选描述。
-
在 “已屏蔽的消息” 中输入一条消息,提示将在调用护栏时显示。选中 “对响应使用相同的屏蔽消息” 复选框,以便在对响应调用防护栏时使用相同的消息。
-
(可选)默认情况下,您的护栏使用加密 AWS 托管式密钥。 要使用您自己的客户管理的KMS密钥,请选择密KMS钥选择旁边的右箭头,然后选中 “自定义加密设置(高级)” 复选框。您可以选择现有的 AWS KMS 按键或选择 “创建” AWS KMS 创建新的 key。
-
对于护栏创建选项,请选择使用毒性过滤器快速创建以使用默认设置,或者选择创建自己的护栏以自定义护栏设置。您也可以选择查看和编辑毒性过滤器来查看或自定义您的护栏过滤器的亵渎内容和提示攻击过滤器设置。
-
(可选)要向护栏添加标签,请选择标签旁边的右箭头。然后,选择添加新标签并为标签定义键值对。有关更多信息,请参阅 使用标签管理资源。
-
选择下一步。
注意
您必须配置至少一个过滤器才能创建护栏。然后,您可以选择 “创建” 来跳过其他筛选器的创建。
-
-
(可选)在配置内容过滤器页面上,使用内容过滤器屏蔽有害词语和对话通过执行以下操作来设置筛选出与中定义的类别相关的内容的程度:
-
要为有害类别配置过滤器,请选择启用有害类别过滤器。您可以为有害类别中的即时攻击选择过滤器。配置您希望每个过滤器对用户向模型提供的提示的严格程度。
-
要为提示攻击配置过滤器,请选择启用提示攻击过滤器。配置您希望过滤器检测和阻止越狱和提示注入攻击的严格程度。
-
选择 “创建” 以创建护栏,或者选择 “使用高级过滤器” 来自定义过滤器设置。
-
-
(可选)在 “添加被拒绝的话题” 页面上,您可以添加被拒绝的话题或选择 “跳至查看并创建”。
-
要定义要屏蔽的主题,请选择添加被拒绝的主题。然后执行以下操作:
-
输入主题的名称。
-
在主题定义框中,定义主题。有关如何定义被拒绝主题的指南,请参阅屏蔽被拒绝的话题以移除有害内容。
-
(可选)要添加与此主题相关的代表性输入提示或模型响应,请选择 “添加示例短语” 旁边的右箭头。在框中输入一个短语。要添加其他短语,请选择 “添加短语”。
-
配置完被拒绝的主题后,选择确认。
-
-
您可以对 “已拒绝” 主题执行以下操作。
-
要添加其他主题,请选择添加被拒绝的主题。
-
要编辑主题,请在 “操作” 列中选择与该主题位于同一行中的三个点图标。然后选择 “编辑”。完成编辑后,选择确认。
-
要删除一个或多个主题,请选中要删除的主题对应的复选框。选择 “删除”,然后选择 “删除选定项”。
-
要删除所有主题,请选择删除,然后选择全部删除。
-
要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( )。设置您的首选项,然后选择 “确认”。
-
-
配置完被拒绝的主题后,选择下一步。
-
-
(可选)在 “添加字词过滤器” 页面上,执行以下操作:
-
在 “筛选亵渎内容” 部分中,选择 “筛选亵渎内容” 以屏蔽提示和回复中的亵渎内容。亵渎清单基于传统定义,并且会不断更新。
-
在 “添加自定义单词和短语” 部分中,选择如何添加要屏蔽的单词和短语。如果您选择上传文件,则文件中的每一行应包含一个单词或一个最多包含三个单词的短语。不要包含标题。您有以下选项:
选项 说明 手动添加单词和短语 在 “查看和编辑单词和短语” 部分直接添加单词和短语。 从本地文件上传 要上传包含单词和短语的.txt 或.csv 文件,请在选择此选项后选择 “选择文件”。 从亚马逊 S3 对象上传 要从 Amazon S3 上传文件,请在选择此选项后指定 S3 对象。文件中的每一行都应包含一个单词或一个最多包含三个单词的短语。 -
您可以在 “查看和编辑单词和短语” 部分编辑要屏蔽的单词和短语。您有以下选项:
-
如果您从本地文件或 Amazon S3 对象上传了单词列表,则此部分将填充您的单词列表。要筛选有错误的项目,请选择显示错误。
-
要向单词列表中添加项目,请选择 “添加单词或短语”。在框中输入一个单词或一个最多包含三个单词的短语,然后按 Enter 键或选择勾号图标以确认该项目。
-
要编辑项目,请选择该项目旁边的编辑图标 ( )。
-
要从单词列表中删除项目,请选择垃圾桶图标 ( ),或者,如果您正在编辑项目,请选择该项目旁边的删除图标 ( )。
-
要删除包含错误的项目,请选择全部删除,然后选择删除所有有错误的行
-
要删除所有项目,请选择全部删除,然后选择删除所有行
-
要搜索项目,请在搜索栏中输入表达式。
-
要仅显示有错误的项目,请选择标有 “全部显示” 的下拉菜单,然后选择 “仅显示错误”。
-
要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( )。设置您的首选项,然后选择 “确认”。
-
默认情况下,此部分显示表格编辑器。要切换到可以在每行中输入单词或短语的文本编辑器,请选择文本编辑器。文本编辑器提供以下功能:
-
您可以从其他文本编辑器中复制单词列表并将其粘贴到该编辑器中。
-
包含错误的项目旁边会出现一个红色 X 图标,错误列表出现在编辑器下方。
-
-
-
选择 “跳过” 以查看并创建以创建护栏,或者选择 “下一步” 为PII和正则表达式模式添加过滤器。
-
-
(可选)在 “添加敏感信息过滤器” 页面上,配置过滤器以屏蔽或屏蔽敏感信息。有关更多信息,请参阅 使用敏感信息过滤器PII从对话中删除。执行以下操作:
-
在 “PII类型” 部分中,配置要屏蔽或屏蔽的个人身份信息 (PII) 类别。您有以下选项:
-
要添加PII类型,请选择添加PII类型。然后执行以下操作:
-
在 “类型” 列中,选择一种PII类型。
-
在 “护栏行为” 列中,选择护栏是应屏蔽包含该PII类型的内容,还是使用标识符将其掩盖。
-
-
要添加所有PII类型,请选择 “添加PII类型” 旁边的下拉箭头。然后选择要应用于它们的护栏行为。
警告
如果指定行为,则为PII类型配置的任何现有行为都将被覆盖。
-
要删除PII类型,请选择垃圾桶图标 ( )。
-
要删除包含错误的行,请选择 “全部删除”,然后选择 “删除所有有错误的行”
-
要删除所有PII类型,请选择 “全部删除”,然后选择 “删除所有行”
-
要搜索行,请在搜索栏中输入表达式。
-
要仅显示有错误的行,请选择标有 “全部显示” 的下拉菜单,然后选择 “仅显示错误”。
-
要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( )。设置您的首选项,然后选择 “确认”。
-
-
在正则表达式模式部分,使用正则表达式定义护栏要过滤的模式。您有以下选项:
-
要添加模式,请选择添加正则表达式模式。配置以下字段:
字段 描述 名称 图案的名称 正则表达式模式 定义模式的正则表达式 防护机制行为 选择是屏蔽包含该图案的内容,还是使用标识符对其进行掩盖。要仅在日志中屏蔽模式,请选择 “无”。 添加描述 (可选)写下模式的描述 -
要编辑模式,请在 “操作” 列中选择与主题同行的三个点图标。然后选择 “编辑”。完成编辑后,选择确认。
-
要删除一个或多个图案,请选中要删除的图案对应的复选框。选择 “删除”,然后选择 “删除选定项”。
-
要删除所有模式,请选择 “删除”,然后选择 “全部删除”。
-
要搜索模式,请在搜索栏中输入表达式。
-
要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( )。设置您的首选项,然后选择 “确认”。
-
-
配置完敏感信息过滤器后,选择 “下一步” 或 “跳过” 以查看和创建。
-
-
在添加上下文接地检查页面(可选)上,配置阈值以屏蔽未接地或不相关的信息。
注意
对于每种类型的检查,您可以移动滑块或输入介于 0 到 0.99 之间的阈值。为您的使用选择合适的阈值。较高的阈值要求响应必须扎根或相关,并具有很高的可信度。低于阈值的响应将被过滤。要了解有关上下文接地检查的更多信息,请参阅上下文接地检查。
-
在 “接地” 字段中,选择 “启用接地检查” 以检查模型响应是否接地。
-
在相关性字段中,选择启用相关性检查以检查模型响应是否相关。
-
选择下一步。
-
-
查看并创建-查看护栏的设置。
-
在要更改的任意部分中选择 “编辑”。
-
如果您对护栏的设置感到满意,请选择 “创建” 来创建护栏。
-
-
- API
-
要创建护栏,请发送请求。CreateGuardrail请求格式如下:
POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
-
description
为护栏指定name
和。 -
在和字段中指定护栏成功屏蔽提示或模型响应时的消息。
blockedInputMessaging
blockedOutputsMessaging
-
为对象中的护栏指定要拒绝的主题。
topicPolicy
topics
列表中的每个项目都与一个主题相关。有关主题中字段的更多信息,请参阅主题。-
给一个
name
andescription
d,这样护栏就可以正确识别话题。 -
在
action
字段DENY
中指定。 -
(可选)最多提供五个示例,将其归类为属于
examples
列表中的主题。
-
-
在
contentPolicy
对象中为 Amazon Bedrock 中定义的有害类别指定过滤强度。filters
列表中的每一项都属于一个有害类别。有关更多信息,请参阅 使用内容过滤器屏蔽有害词语和对话。有关内容过滤器中字段的更多信息,请参阅ContentFilter。-
在
type
字段中指定类别。 -
为字段中的提示和
strength
textToTextFiltersForPrompt
字段中的模型响应指定过滤器的强度textToTextFiltersForResponse
。strength
-
-
(可选)在护栏上贴上任何标签。有关更多信息,请参阅 使用标签管理资源。
-
(可选)为了安全起见,ARN请在
kmsKeyId
字段中包含KMS密钥的。
响应格式如下:
HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }
-