本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
屏蔽拒绝的主题以帮助删除有害内容
您可以通过配置防护机制来定义一系列拒绝的主题,这些主题不适合在生成式人工智能应用程序的上下文中出现。例如,银行可能希望其人工智能助手避免任何与投资建议相关的对话,或避免参与与加密货币相关的对话。
您最多可以定义 30 个拒绝的主题。系统将根据每个拒绝的主题对输入提示和模型的输出进行评估。如果检测到某个拒绝的主题,系统会将作为防护机制的一部分配置的屏蔽消息返回给用户。
您可以通过提供主题的自然语言定义以及该主题的一些可选示例短语来定义拒绝的主题。定义和示例短语用于检测输入提示或模型的输出是否属于该主题。
您可以通过以下参数来定义拒绝的主题。
-
名称 – 主题的名称。名称应为名词或短语。不要在名称中描述主题。例如:
-
Investment Advice
-
-
定义 – 最多 200 个字符,用于总结主题内容。定义应描述主题及其子主题的内容。
以下是您可以提供的主题定义示例:
Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.
-
示例短语 – 最多包含五个与主题相关的示例短语的列表。每个短语最多 100 个字符。示例是指能够展示应被筛除的内容的提示或续写。例如:
-
Is investing in the stocks better than bonds?
-
Should I invest in gold?
-
定义要屏蔽的主题的最佳实践
以简洁明确的方式定义主题。清晰明确的主题定义可以提高主题检测的准确性。例如,用于检测与加密货币相关的查询或语句的主题可以定义为
Question or information associated with investing, selling, transacting, or procuring cryptocurrencies
。不要在主题定义中包含示例或指令。例如,
Block all contents associated to cryptocurrency
是指令,而不是主题定义。这类指令不得用作主题定义的一部分。不要定义否定主题或例外情况。例如,
All contents except medical information
或Contents not containing medical information
是否定主题定义,不得使用。不要使用拒绝的主题来捕获实体或单词。例如,
Statement or questions containing the name of a person "X"
或Statements with a competitor name Y
。主题定义代表一个主题,防护机制会根据上下文评估输入。主题筛选不应用于捕获单个单词或实体类型。有关这些用例使用单词筛选条件从对话中删除特定的单词和短语的更多信息使用敏感信息过滤器PII从对话中删除,请参阅或。