本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
利用推理参数影响响应生成
运行模型推理时,您可以调整推理参数以影响模型响应。推理参数可以更改模型在生成过程中考虑的可能输出池,也可以限制最终响应。要了解不同模型的推理参数,请参阅 基础模型的推理请求参数和响应字段。
以下类别的参数是不同模型中的常见参数:
随机性和多样性
对于任何给定序列,模型都能确定序列中下一个词元选项的概率分布。为了生成输出中的每个词元,模型会从该分布中采样。随机性和多样性是指模型响应中的变体数量。您可以通过限制或调整分布来控制这些因素。根基模型通常支持使用以下参数控制响应的随机性和多样性。
-
温度 – 影响预测输出的概率分布形状,还会影响模型选择概率较低输出的可能性。
-
选择较低的值可影响模型选择概率较高的输出。
-
选择较高的值可影响模型选择概率较低的输出。
从技术角度来说,温度可调节下一个词元的概率质量函数。温度越低,函数曲线越陡,响应的确定性越高;温度越高,函数曲线越平,响应的随机性越高。
-
-
排名前 K – 模型为下一个词元考虑的最有可能的候选项数量。
-
选择较低的值可减小池的大小,并将选项限制为可能性更高的输出。
-
选择较高的值以增加池的大小,并允许模型考虑不太可能的输出。
例如,如果为“排名前 K”选择的值是 50,则模型会从 50 个最有可能作为序列中下一个词元的词元中进行选择。
-
-
Top P – 模型为下一个词元考虑的最有可能的候选项所占百分比。
-
选择较低的值可减小池的大小,并将选项限制为可能性更高的输出。
-
选择较高的值以增加池的大小,并允许模型考虑不太可能的输出。
从技术角度来说,模型会计算一组响应的累积概率分布,并且只考虑分布中的排名前 P%。
例如,如果为“排名前 P”选择的值是 0.8,则模型会从可能作为序列中下一个词元的词元概率分布的前 80% 中进行选择。
-
下表总结了这些参数的作用。
参数 | 较低值的作用 | 较高值的作用 |
---|---|---|
Temperature | 增加概率较高词元的可能性 降低概率较低词元的可能性 |
增加概率较低词元的可能性 降低概率较高词元的可能性 |
Top K | 移除概率较低的词元 | 允许概率较低的词元 |
Top P | 移除概率较低的词元 | 允许概率较低的词元 |
为了方便理解这些参数,我们以 I hear the hoof beats of "
这个示例提示为例来解释一下。假设模型确定以下三个字词作为下一个词元的候选项。模型还为每个字词分配一个概率。
{ "horses": 0.7, "zebras": 0.2, "unicorns": 0.1 }
-
如果设置较高的温度,概率分布会变平,概率差异会变小,从而增加选择“unicorns”的概率,降低选择“horses”的概率。
-
如果将排名前 K 设置为 2,模型只会考虑最有可能的前 2 个候选项,即:“horses”和“zebras”。
-
如果将排名前 P 设置为 0.7,模型只会考虑“horses”,因为只有它是位于概率分布前 70% 的候选项。如果将排名前 P 设置为 0.9,则模型会考虑“horses”和“zebras”,因为它们位于概率分布的前 90%。
长度
根基模型通常支持使用参数限制响应的长度。下面提供了这些参数的示例。
-
响应长度 – 一个精确的值,用于指定要在生成的响应中返回的词元数量下限或上限。
-
惩罚 – 用于指定对响应中的输出进行惩罚的程度。示例包括以下内容。
-
响应的长度。
-
响应中的重复词元。
-
词元在响应中的出现频率。
-
响应中的词元类型。
-
-
停止序列 – 用于指定可阻止模型生成更多词元的字符序列。如果模型生成了您指定的停止序列,则将在该序列之后停止生成。