使用敏感資訊篩選器PII從對話中移除 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用敏感資訊篩選器PII從對話中移除

Amazon 基岩護欄會在輸入提示或模型回應中偵測敏感資訊,例如個人識別資訊 (PIIs)。您也可以使用規則運算式 (regex) 來定義特定於使用案例或組織的敏感資訊。

護欄偵測到敏感資訊之後,您可以設定下列處理資訊的模式。

  • 封鎖 — 敏感資訊篩選原則可以封鎖敏感資訊的要求。此類申請的例子可能包括基於公共文件的一般問答申請。如果在提示或回應中偵測到敏感資訊,護欄會封鎖所有內容,並傳回您設定的訊息。

  • 遮罩 — 敏感資訊篩選原則可以遮罩或密文模型回應中的資訊。例如,護欄將PIIs在生成用戶和客戶服務代理之間的對話摘要時進行屏蔽。如果在模型響應中檢測到敏感信息,則護欄用標識符掩蓋它,敏感信息將被屏蔽並替換為標識符標籤(例如:[NAME-1],[NAME-2],[EMAIL-1] 等)。

Amazon 基岩護欄提供下列功PIIs能來封鎖或遮罩敏感資訊:

  • 一般

    • ADDRESS

      物理地址,例如「100 大街,任何城鎮USA」或「套房 #12,123 號樓」。地址可以包括街道、建築物、位置、城市、州、國家、縣、郵遞區號、分區和鄰近地區等資訊。

    • AGE

      個人的年齡,包括數量和時間單位。例如,在「我 40 歲」一詞中,Amazon 基岩護欄承認「40 歲」是一個年齡。

    • NAME

      個人的姓名。此實體類型不包括標題,例如博士、先生、太太或小姐。Amazon 基岩護欄不會將此實體類型套用至組織或地址的名稱。例如,護欄將「Doe 組織」識別為一個組織,並將「李四街」識別為地址。

    • EMAIL

      電子郵件地址,例如 marymajor@email.com

    • PHONE

      電話號碼。此實體類型還包括傳真和呼叫器號碼。

    • USERNAME

      識別帳戶的使用者名稱,例如登入名稱、螢幕名稱、暱稱或帳號。

    • PASSWORD

      用作密碼的英數字串,例如「* very20 特殊 #pass *」。

    • DRIVER_ID

      分配給駕駛執照的號碼,這是一份正式文件,允許個人在公共道路上操作一輛或多輛機動車輛。駕照號碼由英數字元組成。

    • LICENSE_PLATE

      車輛的車牌是由車輛註冊的州或國家簽發的。乘用車的格式通常為五到八位數字,由大寫字母和數字組成。格式根據發行州或國家的位置而異。

    • VEHICLE_IDENTIFICATION_NUMBER

      車輛識別號碼 (VIN) 可唯一識別車輛。VIN內容和格式在 ISO3779 規範中定義。每個國家/地區都有特定的代碼和格式VINs。

  • 金融

    • CREDIT_DEBIT_CARD_CVV

      一個三位數的卡片驗證碼 (CVV),出現在 VISA MasterCard, 和發現信用卡和借記卡。對於美國運通信用卡或簽帳金融卡,CVV是一個四位數的數字代碼。

    • CREDIT_DEBIT_CARD_EXPIRY

      信用卡或簽帳卡到期日 此數字通常為四位數,通常格式為月/年或 MM/ YY。Amazon 基岩護欄可識別到期日期,例如 2021 年 1 月 21 日,2021 年 1 月和 2021 年 1 月

    • CREDIT_DEBIT_CARD_NUMBER

      信用卡或簽帳卡號碼。這些數字的長度可以從 13 到 16 位數不等。不過,當只有最後四位數字出現時,Amazon Comprehend 也會辨識信用卡或簽帳金融卡號碼。

    • PIN

      一組四位數字的個人識別號碼 (PIN),您可以使用此號碼存取您的銀行帳戶。

    • INTERNATIONAL_BANK_ACCOUNT_NUMBER

      國際銀行帳戶號碼在每個國家/地區都有特定的格式。如需詳細資訊,請參閱「iban.com」。

    • SWIFT_CODE

      SWIFT代碼是銀行識別碼 (BIC) 的標準格式,用於指定特定的銀行或分行。銀行使用這些代碼進行匯款,例如國際電匯。

      SWIFT代碼由八個或 11 個字元組成。11 位數代碼是指特定分支機構,而 8 位數代碼(或以 'XXX' 結尾的 11 位數代碼)則指總部或主要辦公室。

    • IP_ ADDRESS

      一個IPv4地址,如 198.51.100.0

    • MAC_ADDRESS

      媒體存取控制 (MAC) 位址是指派給網路介面控制器 (NIC) 的唯一識別碼。

    • URL

      一個網址,例如:如。

    • AWS_ACCESS_KEY

      與秘密存取金鑰相關聯的唯一識別碼;您可以使用存取金鑰 ID 和秘密存取金鑰以程式設計方式簽署 AWS 請求加密。

    • AWS_SECRET_KEY

      與存取金鑰相關聯的唯一識別碼。您使用訪問密鑰 ID 和秘密訪問密鑰進行編程簽名 AWS 請求加密。

  • USA具體的

    • 美國 _ BANK _ ACCOUNT NUMBER

      美國銀行帳戶號碼,通常長度為 10 至 12 位數字。

    • 美國 _ BANK _ ROUTING NUMBER

      美國銀行帳戶的分行代碼。這些通常是九位數字長度,

    • 美國 _ INDIVIDUAL _ TAX _ IDENTIFICATION NUMBER

      美國個人納稅人識別號碼 (ITIN) 是一個九位數字,以「9」開頭,並以「7」或「8」作為第四位數字。ITIN可以使用空格或破折號在第三位和第四位數字之後進行格式化。

    • 美國 _ _ PASSPORT NUMBER

      美國護照號碼。護照號碼範圍為六至九個英數字元。

    • 美國 _ SOCIAL _ SECURITY NUMBER

      美國社會安全號碼 (SSN) 是發給美國公民、永久居民和臨時工作居民的九位數字。

  • 加拿大特定

    • 加拿大 _ HEALTH NUMBER

      加拿大 Health 服務號碼是一個 10 位數的唯一識別碼,個人需要獲得醫療保健福利。

    • 加拿大 _ SOCIAL _ INSURANCE NUMBER

      加拿大社會保險號碼 (SIN) 是九位數的唯一識別碼,個人需要使用政府計劃和福利。

      SIN被格式化為三個數字的群組,例如 123- 456-789。A SIN 可以通過稱為 Luhn 算法的簡單檢查數字過程進行驗證。

  • 英國特定

    • 英國 _ NATIONAL _ HEALTH _ SERVICE NUMBER

      英國國民 Health 服務號碼是一個 10-17 位數字的數字,例如:485 777 3456。目前的系統會將 10 位數字格式化,並在第三位和第六位數字之後加上空格。最後一個數字是偵測錯誤的總和檢查碼。

    • 英國 _ NATIONAL _ INSURANCE NUMBER

      英國國民保險號碼(NINO)為個人提供國民保險(社會安全)福利的機會。它也用於英國稅收制度的某些目的。

      數字長度為九位數,以兩個字母開頭,後跟六個數字和一個字母。A NINO 可以用空格或破折號的兩個字母後和第二,第四和第六位數字後進行格式化。

    • 英國 _ UNIQUE _ TAXPAYER _ REFERENCE NUMBER

      英國唯一納稅人參考(UTR)是一個 10 位數字,用於識別納稅人或企業。

  • Custom (自訂)

    • 正則表達式過濾器-您可以使用正則表達式來定義護欄的模式,以識別和採取行動,例如序列號,預訂 ID 等。