本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用敏感信息过滤器PII从对话中删除
Amazon Bedrock Guardrails 可在输入提示或模型响应中检测敏感信息,例如个人身份信息 (PIIs)。您还可以使用正则表达式 (regex) 定义特定于您的用例或组织的敏感信息。
在护栏检测到敏感信息后,您可以配置以下处理信息的模式。
阻止-敏感信息筛选策略可以阻止对敏感信息的请求。此类申请的示例可能包括基于公共文件的一般问答申请。如果在提示或响应中检测到敏感信息,则护栏会阻止所有内容并返回您配置的消息。
掩码 — 敏感信息筛选策略可以屏蔽或编辑模型响应中的信息。例如,在生成用户与客户服务代理之间的对话摘要PIIs时,护栏会屏蔽。如果在模型响应中检测到敏感信息,则护栏会使用标识符对其进行掩盖,敏感信息将被屏蔽并替换为标识符标签(例如:[NAME-1]、[NAME-2]、[EMAIL-1] 等)。
Amazon Bedrock Guardrails 提供以下功能PIIs来屏蔽或屏蔽敏感信息:
-
一般性问题
-
ADDRESS
实际地址,例如 “Anytown 大街 100 号USA” 或 “Suite #12,123 号楼”。地址可以包括街道、建筑物、位置、城市、州、国家、县、邮政编码、辖区和社区等信息。
-
AGE
个人的年龄,包括数量和时间单位。例如,在 “我已经 40 岁了” 这句话中,Amazon Bedrock Guardrails 将 “40 岁” 视为一个年龄。
-
NAME
个人的名字。该实体类型不包括头衔,例如 “博士”、“先生”、“夫人”或“小姐”。Amazon Bedrock Guardrails 不会将此实体类型应用于属于组织或地址的名称。例如,护栏将 “John Doe 组织” 识别为一个组织,它将 “Jane Doe Street” 识别为地址。
-
EMAIL
电子邮件地址,例如 marymajor@email.com。
-
PHONE
电话号码。该实体类型还包括传真号码和寻呼机号码。
-
USERNAME
用于标识帐户的用户名,例如登录名、屏幕名称、昵称或句柄。
-
PASSWORD
用作密码的字母数字字符串,例如 “* very20special #pass *”。
-
DRIVER_ID
分配给驾驶执照的号码,驾驶执照是允许个人在公共道路上驾驶一辆或多辆机动车辆的官方文件。驾驶执照号码由字母数字字符组成。
-
LICENSE_PLATE
车辆牌照由车辆登记的所在州或国家签发。乘用车的格式通常为 5 到 8 位数,由大写字母和数字组成。格式因签发州或国家的不同而异。
-
VEHICLE_IDENTIFICATION_NUMBER
车辆识别码 (VIN) 是车辆的唯一标识。VIN内容和格式在 ISO3779 规范中定义。每个国家/地区都有特定的代码和格式VINs.
-
-
财务
-
CREDIT_DEBIT_CARD_CVV
VISA、 MasterCard、和 Discover 信用卡和借记卡上显示的三位数信用卡验证码 (CVV)。对于美国运通信用卡或借记卡,CVV是四位数的数字代码。
-
CREDIT_DEBIT_CARD_EXPIRY
信用卡或借记卡的到期日期。此数字的长度通常为四位数,通常格式为月/年或 MM/YY。Amazon Bedrock Guardrails 可以识别诸如 1 月 21 日、2021 年 1 月 1 日和 2021 年 1 月等到期日期。
-
CREDIT_DEBIT_CARD_NUMBER
信用卡或借记卡的号码。这些数字的长度可以从 13 到 16 位数字不等。但是,当只有最后 4 位数字存在时,Amazon Comprehend 也能识别信用卡或借记卡号。
-
PIN
一个四位数的个人识别码 (PIN),您可以使用它访问您的银行账户。
-
INTERNATIONAL_BANK_ACCOUNT_NUMBER
国际银行账号在每个国家都有特定的格式。欲了解更多信息,请参阅 www.iban.com/structure
。 -
SWIFT_CODE
SWIFT代码是银行识别码 (BIC) 的标准格式,用于指定特定的银行或分行。银行使用这些代码进行汇款,例如国际电汇。
SWIFT代码由 8 或 11 个字符组成。11 位数的代码指的是特定的分支机构,而 8 位数的代码(或以 “” 结尾的 11 位数代码)XXX指的是总部或主要办公室。
-
-
IT
-
IP_ ADDRESS
一个IPv4地址,比如 198.51.100.0。
-
MAC_ADDRESS
媒体访问控制 (MAC) 地址是分配给网络接口控制器 (NIC) 的唯一标识符。
-
URL
一个网址,比如 www.example.com。
-
AWS_ACCESS_KEY
与私有访问密钥关联的唯一标识符;您可以使用访问密钥 ID 和私有访问密钥进行编程签名 AWS 以加密方式发送请求。
-
AWS_SECRET_KEY
与访问密钥关联的唯一标识符。您可以使用访问密钥 ID 和私有访问密钥进行编程签名 AWS 以加密方式发送请求。
-
-
USA具体
-
美国_ _ BANK _ ACCOUNT NUMBER
美国银行账号,长度通常为 10 到 12 位数字。
-
美国_ _ BANK _ ROUTING NUMBER
美国银行账户的路由号码。它们通常长度为九位数,
-
美国_ _ INDIVIDUAL _ TAX _ IDENTIFICATION NUMBER
美国个人纳税人识别号 (ITIN) 是一个以 “9” 开头的九位数字,第四位数字包含 “7” 或 “8”。ITIN可以在第三位和第四位数字之后使用空格或短划线进行格式化。
-
美国_ _ PASSPORT NUMBER
美国护照编号。护照编码由 6 到 9 个字母数字字符组成。
-
美国_ _ SOCIAL _ SECURITY NUMBER
美国社会安全号码 (SSN) 是一个九位数的号码,发给美国公民、永久居民和临时工作居民。
-
-
加拿大特有
-
CA_ _ HEALTH NUMBER
加拿大医疗服务号码是一个 10 位数的唯一标识符,是个人获得医疗保健福利所必需的。
-
CA_ _ SOCIAL _ INSURANCE NUMBER
加拿大社会保险号 (SIN) 是一个九位数的唯一标识符,是个人获得政府计划和福利所必需的。
的格式SIN为三组三位数字,例如 123- 456-789。SIN可以通过名为 Luhn
算法的简单校验码过程来验证。
-
-
英国专用
-
英国_ _ NATIONAL _ HEALTH _ SERVICE NUMBER
英国国家健康服务号码是一个 10 至 17 位数字,例如 485 777 3456。当前系统对 10 位数字进行格式化,在第 3 位和第 6 位数字之后使用空格。最后一位数字是错误检测的校验和。
-
英国_ _ NATIONAL _ INSURANCE NUMBER
英国国民保险号码 (NINO) 为个人提供获得国民保险(社会保障)福利的机会。它在英国税收系统中也用于某些目的。
该数字共有 9 位数字,以两个字母开头,后跟 6 个数字和 1 个字母。NINO可以在两个字母后面以及第二、第四和第六位数字之后使用空格或短划线进行格式化。
-
英国_ _ UNIQUE _ TAXPAYER _ REFERENCE NUMBER
英国唯一纳税人参考编号 (UTR) 是一个 10 位数字,用于识别纳税人或企业。
-
-
自定义
-
正则@@ 表达式过滤器 — 您可以使用正则表达式来定义护栏识别和操作的模式,例如序列号、预订 ID 等。
-