本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
建立護欄
您可以透過設定組態、定義要拒絕的主題、提供篩選條件來處理有害和敏感的內容,以及撰寫訊息,以用於封鎖提示和使用者回應。
護欄必須至少包含一個篩選條件和訊息,以便在提示和使用者回應遭到封鎖時傳送。您可以選擇使用預設訊息。您可以稍後遵循 中的步驟,在護欄上新增篩選條件並反覆運算修改護欄,以設定護欄所需的所有元件。
選擇您偏好方法的索引標籤,然後遵循下列步驟:
- Console
-
在 AWS 主控台中建立護欄
-
AWS Management Console 使用具有 Amazon Bedrock 許可的 IAM 角色登入 ,然後開啟 Amazon Bedrock 主控台,網址為 https://https://console.aws.amazon.com/bedrock/
。 -
從左側導覽窗格中,選取護欄。
-
在護欄區段中,選取建立護欄。
-
在提供護欄詳細資訊頁面上,執行下列動作:
-
在護欄詳細資訊區段中,提供護欄的名稱和選用的描述。
-
針對呼叫護欄時顯示的提示,輸入封鎖訊息的訊息。選取核取方塊,以使用相同的封鎖訊息,讓回應在回應上叫用護欄時使用相同的訊息。
-
(選用) 根據預設,您的護欄會使用 加密 AWS 受管金鑰。若要使用您自己的客戶受管 KMS 金鑰,請選取 KMS 金鑰選擇旁的向右箭頭,然後選取自訂加密設定 (進階) 核取方塊。您可以選取現有的 AWS KMS 金鑰,或選取建立金鑰來建立新的 AWS KMS 金鑰。
-
對於護欄建立選項,選取使用毒性篩選條件快速建立以使用預設設定,或選取建立您自己的護欄以自訂您的護欄設定。您也可以選取檢視和編輯毒性篩選條件,以檢視或自訂護欄篩選條件褻瀆和提示攻擊篩選條件設定。
-
(選用) 若要將標籤新增至護欄,請選取標籤旁的向右箭頭。然後,選取新增標籤並定義標籤的鍵值對。如需詳細資訊,請參閱標記 Amazon Bedrock 資源。
-
選擇 Next (下一步)。
注意
您必須設定至少一個篩選條件來建立護欄。然後,您可以選取建立來略過其他篩選條件的建立。
-
-
(選用) 在設定內容篩選條件頁面上,使用內容篩選條件封鎖有害的單字和對話透過執行下列動作,設定您想要篩選掉與 中定義之類別相關的內容的強度:
-
若要設定有害類別的篩選條件,請選取設定有害類別篩選條件。選取文字和/或影像,從提示或對模型的回應中篩選文字或影像內容。針對您要套用至每個類別的篩選層級,選取無、低、中或高。您可以選擇對提示或回應具有不同的篩選條件層級。您可以在有害類別中選取提示性攻擊的篩選條件。設定您希望每個篩選條件對於使用者提供給模型的提示有多嚴格。
-
若要設定提示遭到攻擊的篩選條件,請選取啟用提示攻擊篩選條件。設定您希望篩選條件偵測和封鎖越獄和提示注入攻擊的嚴格程度。
-
選取建立以建立護欄,或選取使用進階篩選條件來自訂篩選條件設定。
-
-
(選用) 在新增拒絕的主題頁面上,您可以新增拒絕的主題,或選取跳至檢閱並建立。
-
若要定義要封鎖的主題,請選取新增拒絕的主題。然後執行下列動作:
-
輸入新主題的 名稱 (Name)。
-
在主題的定義方塊中,定義主題。如需如何定義遭拒主題的指導方針,請參閱 封鎖被拒絕的主題,以協助移除有害的內容。
-
(選用) 若要新增與此主題相關的代表性輸入提示或模型回應,請選取新增範例片語旁的向右箭頭。在方塊中輸入片語。若要新增另一個片語,請選取新增片語。
-
當您完成設定拒絕的主題時,請選取確認。
-
-
您可以使用遭拒的主題執行下列動作。
-
若要新增另一個主題,請選取新增拒絕的主題。
-
若要編輯主題,請在動作欄中選取與主題相同列中的三個點圖示。然後選取編輯。完成編輯後,請選取確認。
-
若要刪除主題,請選取要刪除主題的核取方塊。選取刪除,然後選取刪除選取。
-
若要刪除所有主題,請選取刪除,然後選取全部刪除。
-
若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 (
)。設定您的偏好設定,然後選取確認。
-
-
當您完成設定拒絕的主題時,請選取下一步。
-
-
(選用) 在新增字詞篩選條件頁面上,執行下列動作:
-
在篩選褻瀆性區段中,選取篩選褻瀆性以封鎖提示和回應中的褻瀆性。褻瀆的清單是以傳統定義為基礎,並會持續更新。
-
在新增自訂字詞和片語區段中,選取如何新增要封鎖的護欄字詞和片語。如果您選擇上傳檔案,檔案中的每一行都應包含一個單字或最多三個單字的片語。請勿包含標頭。您有下列選項:
選項 指示 手動新增單字和片語 直接在檢視和編輯單字和片語區段中新增單字和片語。 從本機檔案上傳 若要上傳包含單字和片語的 .txt 或 .csv 檔案,請選取選取此選項後選擇檔案。 從 Amazon S3 物件上傳 若要從 Amazon S3 上傳檔案,請在選取此選項後指定 S3 物件。檔案中的每一行都應包含一個字詞或最多三個字詞的片語。 -
您可以在檢視和編輯單字和片語區段中編輯要封鎖的護欄單字和片語。您有下列選項:
-
如果您從本機檔案或 Amazon S3 物件上傳字詞清單,此區段將填入您的字詞清單。若要篩選有錯誤的項目,請選取顯示錯誤。
-
若要將項目新增至字詞清單,請選取新增字詞或片語。在方塊中輸入最多三個單字的單字或片語,然後按 Enter 鍵或選取核取記號圖示以確認項目。
-
若要編輯項目,請選取項目旁的編輯圖示 (
)。
-
若要從文字清單中刪除項目,請選取垃圾桶圖示 (
),或者,如果您正在編輯項目,請選取項目旁的刪除圖示 (
)。
-
若要刪除包含錯誤的項目,請選取全部刪除,然後選取刪除有錯誤的所有資料列
-
若要刪除所有項目,請選取全部刪除,然後選取刪除所有列
-
若要搜尋項目,請在搜尋列中輸入表達式。
-
若要僅顯示有錯誤的項目,請選取標記為顯示全部的下拉式功能表,然後選取僅顯示錯誤。
-
若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 (
)。設定您的偏好設定,然後選取確認。
-
根據預設,本節會顯示資料表編輯器。若要切換到文字編輯器,您可以在其中在每個行中輸入單字或片語,請選取文字編輯器。文字編輯器提供下列功能:
-
您可以從另一個文字編輯器複製字詞清單,並將其貼到此編輯器中。
-
包含錯誤的項目旁會出現紅色 X 圖示,且錯誤清單會顯示在編輯器下方。
-
-
-
選取略過以檢閱和建立以建立護欄,或選取下一步以新增 PII 和 regex 模式的篩選條件。
-
-
(選用) 在新增敏感資訊篩選條件頁面上,設定篩選條件以封鎖或遮罩敏感資訊。如需詳細資訊,請參閱使用敏感資訊篩選條件從對話中移除 PII。請執行下列操作:
-
在 PII 類型區段中,設定個人識別資訊 (PII) 類別以封鎖或遮罩。您有下列選項:
-
若要新增 PII 類型,請選取新增 PII 類型。然後,執行下列動作:
-
在類型欄中,選取 PII 類型。
-
在護欄行為欄中,選取護欄是否應封鎖包含 PII 類型的內容,或使用識別符將其遮罩。
-
-
若要新增所有 PII 類型,請選取新增 PII 類型旁的下拉箭頭。然後選擇要套用的護欄行為。
警告
如果您指定行為,您為 PII 類型設定的任何現有行為都會遭到覆寫。
-
若要刪除 PII 類型,請選取垃圾桶圖示 (
)。
-
若要刪除包含錯誤的列,請選取全部刪除,然後選取刪除所有包含錯誤的列
-
若要刪除所有 PII 類型,請選取全部刪除,然後選取刪除所有資料列
-
若要搜尋資料列,請在搜尋列中輸入表達式。
-
若要僅顯示有錯誤的列,請選取標記為顯示全部的下拉式功能表,然後選取僅顯示錯誤。
-
若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 (
)。設定您的偏好設定,然後選取確認。
-
-
在 Regex 模式區段中,使用規則運算式來定義要篩選的護欄模式。您有下列選項:
-
若要新增模式,請選取新增 regex 模式。設定下列欄位:
欄位 描述 名稱 模式的名稱 Regex 模式 定義模式的規則運算式 護欄行為 選擇是否要封鎖包含模式的內容,或使用識別符將其遮罩。若要僅在日誌中遮罩模式,請選取無。 新增描述 (選用) 撰寫模式的描述 -
若要編輯模式,請在動作欄中選取與主題相同列中的三個點圖示。然後選取編輯。完成編輯後,請選取確認。
-
若要刪除模式,請選取要刪除模式的核取方塊。選取刪除,然後選取刪除選取。
-
若要刪除所有模式,請選取刪除,然後選取全部刪除。
-
若要搜尋模式,請在搜尋列中輸入表達式。
-
若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 (
)。設定您的偏好設定,然後選取確認。
-
-
當您完成設定敏感資訊篩選條件時,請選取下一步或略過以檢視和建立。
-
-
在新增內容式接地檢查頁面上 (選用),設定閾值以封鎖未接地或不相關的資訊。
注意
對於每種類型的檢查,您可以移動滑桿或輸入閾值,從 0 到 0.99。為您的使用選取適當的閾值。較高的閾值需要以高度可信度為基礎或相關的回應才能允許。低於閾值的回應將被篩選。若要進一步了解內容式接地檢查,請參閱使用內容式接地檢查來篩選回應中的幻覺。
-
在 Grounding 欄位中,選取啟用 Grounding 檢查,以檢查模型回應是否已接地。
-
在關聯性欄位中,選取啟用關聯性檢查,以檢查模型回應是否相關。
-
選取下一步。
-
-
檢閱和建立 – 檢閱護欄的設定。
-
在您要變更的任何區段中選取編輯。
-
當您對護欄的設定感到滿意時,請選取建立以建立護欄。
-
-
- API
-
若要建立護欄,請傳送 CreateGuardrail 請求。請求格式如下所示:
POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
-
description
為護欄指定name
和 。 -
在
blockedInputMessaging
和blockedOutputsMessaging
欄位中,指定當護欄成功封鎖提示或模型回應時的訊息。 -
在
topicPolicy
物件中指定要拒絕的護欄主題。topics
清單中的每個項目都與一個主題相關。如需主題中欄位的詳細資訊,請參閱主題。-
提供
name
和 ,description
以便護欄可以正確識別主題。 -
在
action
DENY
欄位中指定 。 -
(選用) 提供最多五個範例,您可以將這些範例分類為屬於
examples
清單中的主題。
-
-
為
contentPolicy
物件中 Amazon Bedrock 定義的有害類別指定篩選條件強度。filters
清單中的每個項目都與有害類別相關。如需詳細資訊,請參閱使用內容篩選條件封鎖有害的單字和對話。如需內容篩選條件中欄位的詳細資訊,請參閱 ContentFilter。-
在
type
欄位中指定 類別。 -
在
strength
欄位的textToTextFiltersForPrompt
欄位中指定提示的篩選條件強度,並在 的strength
欄位中指定模型回應的篩選條件強度textToTextFiltersForResponse
。
-
-
(選用) 將任何標籤連接到護欄。如需詳細資訊,請參閱標記 Amazon Bedrock 資源。
-
(選用) 為了安全起見,請在
kmsKeyId
欄位中包含 KMS 金鑰的 ARN。
回應格式如下:
HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }
-