本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
封鎖遭拒的主題以移除有害內容
護欄可以使用一組在生成式 AI 應用程式環境中不需要的拒絕主題來設定。例如,銀行可能希望他們的 AI 助手避免與投資建議有關的任何對話或進行與加密貨幣有關的對話。
您最多可以定義 30 個拒絕的主題。輸入提示和模型完成將根據每個拒絕的主題進行評估。如果偵測到其中一個拒絕的主題,設定為護欄一部分的封鎖郵件將傳回給使用者。
拒絕的主題可以透過提供主題的自然語言定義以及一些可選的主題範例片語來定義。定義和範例片語用於偵測輸入提示或模型完成是否屬於主題。
拒絕的主題使用下列參數定義。
-
名稱 — 主題的名稱。名稱應該是名詞或短語。不要在名稱中描述主題。例如:
-
Investment Advice
-
-
定義 — 最多 200 個字元,總結主題內容。定義應描述主題及其子主題的內容。
以下是您可以提供的範例主題定義:
Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.
-
範例片語 — 參照主題的最多五個範例片語的清單。每個片語最多可以有 100 個字元。樣本是一個提示或接續,顯示應該過濾掉的內容類型。例如:
-
Is investing in the stocks better than bonds?
-
Should I invest in gold?
-
定義您要封鎖的主題的最佳作法
以清晰精確的方式定義主題。清晰明確的主題定義可以提高主題偵測的準確性。例如,用於檢測與加密貨幣關聯的查詢或語句的主題可以定義為
Question or information associated with investing, selling, transacting, or procuring cryptocurrencies
。請勿在主題定義中包含範例或指示。例如,
Block all contents associated to cryptocurrency
是指令,而不是主題的定義。這些指示不得用作主題定義的一部分。請勿定義負面主題或例外狀況。例如,
All contents except medical information
或Contents not containing medical information
是主題的否定義,不得使用。請勿使用拒絕的主題來擷取實體或文字。例如
Statement or questions containing the name of a person "X"
或Statements with a competitor name Y
。主題定義代表主題或主題,護欄會根據上下文評估輸入。主題篩選不應用於擷取個別字詞或實體類型。相反,請考慮使用使用敏感資訊篩選器PII從對話中移除或用使用單詞過濾器從對話中刪除特定的單詞和短語列表於此類用例。