必要欄位推論參數模型調用請求主體欄位模型調用回應主體欄位程式碼範例 Jamba 1.5 Large 的程式碼範例

AI21 Labs Jamba 模型

本節提供使用 AI21 Labs Jamba 模型的推論參數和程式碼範例。

主題

必要欄位
推論參數
模型調用請求主體欄位
模型調用回應主體欄位
程式碼範例
Jamba 1.5 Large 的程式碼範例

必要欄位

AI21 Labs Jamba 模型支援下列必要欄位：

訊息 (messages) – 此聊天中先前的訊息，從最舊（索引 0) 到最新。清單中必須至少有一個使用者或助理訊息。包含使用者輸入和系統回應。清單的總大小上限為約 256K 個字符。每個訊息都包含下列成員：
角色 (role) – 訊息作者的角色。下列其中一值：
- 使用者 (user) – 使用者提供的輸入。此處提供的任何與system提示中提供的指示衝突的指示，都優先於system提示指示。
- 助理 (assistant) – 模型產生的回應。
- 系統 (system) – 提供給系統的初始指示，提供有關產生訊息音調和語音的一般指引。初始系統訊息是選用的，但建議提供聊天音調的指導。例如，「您是實用的聊天機器人，擁有地球科學背景和迷人的法國風格。」
內容 (content) – 訊息的內容。

推論參數

AI21 實驗室 Jamba 模型支援下列推論參數。

隨機性和多樣性

AI21 實驗室 Jamba 模型支援下列參數，以控制回應中的隨機性和多樣性。

溫度 (temperature) – 每個答案要提供多少變化。將此值設定為 0 可確保每次對相同問題都提供相同的回應。設定較高的值會鼓勵更多變化。修改從中取樣字符的分佈。預設：1.0，範圍：0.0 – 2.0
前 P (top_p) – 將每個步驟中的下一個字符集區限制為可能字符的前 N 百分位數，其中 1.0 表示所有可能字符的集區，0.01 表示最可能下一個字符的集區。

長度

AI21 Labs Jamba 模型支援下列參數，以控制產生的回應長度。

完成長度上限 (max_tokens) – 每個產生的回應訊息所允許的字符數量上限。一般而言，限制輸出長度的最佳方法是在系統提示中提供長度限制（例如，「將您的答案限制為三個句子」)。預設：4096，範圍：0 – 4096。
停止序列 (stop) – 在模型產生其中一個字串時結束訊息。停止序列不包含在產生的訊息中。每個序列的長度最多可達 64K，而且可以包含 \n 個字元的新行。

範例：
- 具有單字和句號的單一停止字串：「monkeys」。
- 多個停止字串和新行：【"cat"、"dog"、" ."、"####"、"\n"】
回應數量 (n) – 要產生的聊天回應數量。串流回應的備註 n 必須為 1。如果 n 設定為大於 1，則設定temperature=0一律會失敗，因為所有答案都保證為重複。預設：1，範圍：1 – 16

重複

AI21 實驗室 Jamba 模型支援下列參數，以控制所產生回應中的重複。

頻率懲罰 (frequency_penalty) – 透過增加此數字，減少單一回應訊息中重複單字的頻率。此懲罰會逐漸增加字詞在回應產生期間出現的次數。如果有任何重複的單字，將設為 2.0 會產生字串，其中只有幾個。
存在懲罰 (presence_penalty) – 透過增加此數字，降低單一訊息中重複單字的頻率。與頻率懲罰不同，無論單字出現多少次，存在懲罰都是相同的。

模型調用請求主體欄位

當您使用 AI21 Labs 模型進行 InvokeModel 或 InvokeModelWithResponseStream 呼叫時，請將符合下列內容的 JSON 物件填入 body 欄位。在 prompt 欄位中輸入提示詞。


{
  "messages": [
    {
      "role":"system", // Non-printing contextual information for the model
      "content":"You are a helpful history teacher. You are kind and you respond with helpful content in a professional manner. Limit your answers to three sentences. Your listener is a high school student."
    },
    {
      "role":"user", // The question we want answered.
      "content":"Who was the first emperor of rome?"
    }
  ],
  "n":1 // Limit response to one answer
}

模型調用回應主體欄位

如需回應中 body 欄位格式的相關資訊，請參閱 https：//https://docs.ai21.com/reference/jamba-instruct-api#response-details。

程式碼範例

此範例說明如何呼叫 AI21 實驗室 Jamba-Instruct 模型。

invoke_model


import boto3 
import json

bedrock = session.client('bedrock-runtime', 'us-east-1') 
response = bedrock.invoke_model( 
        modelId='ai21.jamba-instruct-v1:0', 
        body=json.dumps({
            'messages': [ 
                { 
                    'role': 'user', 
                    'content': 'which llm are you?' 
                } 
             ], 
         }) 
       ) 

print(json.dumps(json.loads(response['body']), indent=4))

對等


import boto3 
import json

bedrock = session.client('bedrock-runtime', 'us-east-1')
response = bedrock.converse( 
    modelId='ai21.jamba-instruct-v1:0', 
    messages=[ 
        { 
            'role': 'user', 
            'content': [ 
                { 
                    'text': 'which llm are you?' 
                } 
             ] 
          } 
     ] 
  ) 

print(json.dumps(json.loads(response['body']), indent=4))

Jamba 1.5 Large 的程式碼範例

此範例說明如何呼叫 AI21 Labs Jamba 1.5 Large 模型。

invoke_model


POST https://bedrock-runtime.us-east-1.amazonaws.com/model/ai21.jamba-1-5-mini-v1:0/invoke-model HTTP/1.1
{
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful chatbot with a background in earth sciences and a charming French accent."
    },
    {
      "role": "user",
      "content": "What are the main causes of earthquakes?"
    }
  ],
  "max_tokens": 512,
  "temperature": 0.7,
  "top_p": 0.9,
  "stop": ["###"],
  "n": 1
}

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

AI21 LabsJurassic-2 模型

Luma AI 模型