AI21 LabsJurassic-2模型

本节提供推理参数和使用AI21 LabsAI21 LabsJurassic-2模型的代码示例。

主题

推理参数
代码示例

推理参数

这些AI21 LabsJurassic-2模型支持以下推理参数。

主题

随机性和多样性
Length
重复
模型调用请求正文字段
模型调用响应正文字段

随机性和多样性

这些AI21 LabsJurassic-2模型支持以下参数来控制响应的随机性和多样性。

Temperature (temperature) – 使用较低的值可降低响应中的随机性。
Top P (topP) – 使用较低的值可忽略不太可能的选项。

Length

这些AI21 LabsJurassic-2模型支持以下参数来控制生成的响应的长度。

Max completion length (maxTokens) – 指定生成的响应中的最大词元数。
Stop sequences (stopSequences) – 配置模型可识别的停止序列，遇到停止序列后，模型停止生成更多词元。按 Enter 键可在停止序列中插入换行符。使用 Tab 键结束对停止序列的插入。

重复

这些AI21 LabsJurassic-2模型支持以下参数来控制生成的响应中的重复性。

Presence penalty (presencePenalty) – 使用较高的值可降低生成的新词元已在提示或完成内容中至少出现过一次的概率。
Count penalty (countPenalty) – 使用较高的值可降低生成的新词元已在提示或完成内容中至少出现过一次的概率。与出现次数成正比。
Frequency penalty (frequencyPenalty) – 使用较高的值可降低生成的新词元已在提示或完成内容中至少出现过一次的概率。此值与词元出现的频率成正比（标准化为文本长度）。
Penalize special tokens — 降低特殊字符重复出现的概率。默认值为 true。
- Whitespaces (applyToWhitespaces) – true 值会将惩罚应用于空格和新行。
- Punctuations (applyToPunctuation) – true 值会将惩罚应用于标点。
- Numbers (applyToNumbers) – true 值会将惩罚应用于数字。
- Stop words (applyToStopwords) – true 值会将惩罚应用于停顿词。
- Emojis (applyToEmojis) – true 值且将表情符号排除在惩罚范围之外。

模型调用请求正文字段

使用AI21 Labs模型进行InvokeModel或InvokeModelWithResponseStream调用时，请在body字段中填入符合以下对象的 JSON 对象。在 prompt 字段中输入提示。


{
    "prompt": string,
    "temperature": float,
    "topP": float,
    "maxTokens": int,
    "stopSequences": [string],
    "countPenalty": {
        "scale": float
    },
    "presencePenalty": {
        "scale": float
    },
    "frequencyPenalty": {
        "scale": float
    }
}

要惩罚特殊词元，请将这些字段添加到任何惩罚对象中。例如，您可以按如下方式修改 countPenalty 字段。


"countPenalty": {
    "scale": float,
    "applyToWhitespaces": boolean,
    "applyToPunctuations": boolean,
    "applyToNumbers": boolean,
    "applyToStopwords": boolean,
    "applyToEmojis": boolean
}

下表显示了数字参数的最小值、最大值和默认值。

类别	参数	JSON 对象格式	最高	默认
随机性和多样性	Temperature	温度	1	0.5
随机性和多样性	Top P	topP	1	0.5
Length	Max tokens (mid, ultra, and large models)	maxTokens	8,191	200
Length	Max tokens (other models)	maxTokens	2,048	200
重复	Presence penalty	presencePenalty	5	0
	Count penalty	countPenalty	1	0
	Frequency penalty	frequencyPenalty	500	0

模型调用响应正文字段

有关响应中的 body 字段的格式的信息，请参阅 https://docs.ai21.com/reference/j2-complete-ref。

注意

Amazon Bedrock 以整数值的形式返回响应标识符 (id)。

代码示例

此示例说明如何调用 A2I 模型AI21 LabsJurassic-2 Mid。


import boto3
import json

brt = boto3.client(service_name='bedrock-runtime')

body = json.dumps({
    "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", 
    "maxTokens": 200,
    "temperature": 0.5,
    "topP": 0.5
})

modelId = 'ai21.j2-mid-v1'
accept = 'application/json'
contentType = 'application/json'

response = brt.invoke_model(
    body=body, 
    modelId=modelId, 
    accept=accept, 
    contentType=contentType
)

response_body = json.loads(response.get('body').read())

# text
print(response_body.get('completions')[0].get('data').get('text'))

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

AnthropicClaude消息 API

Cohere模型