本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
下列程式碼範例示範如何使用 和 AWS CLI Python SDK 建立佈建輸送量,以及如何管理和叫用它。您可以從基礎模型或您已自訂的模型建立佈建輸送量。開始之前,請執行下列先決條件:
先決條件
下列範例使用Amazon Nova Lite模型,其模型 ID 為 amazon.nova-lite-v1:0:24k
。如果您還沒有,Amazon Nova Lite請依照 中的步驟請求存取 新增或移除對 Amazon Bedrock 基礎模型的存取權。
如果您想要為不同的基礎模型或自訂模型購買佈建輸送量,您必須執行下列動作:
-
透過執行下列其中一項,尋找模型的 ID (適用於基礎模型)、名稱 (適用於自訂模型) 或 ARN (適用於任一):
-
如果您要購買基礎模型的佈建輸送量,請尋找支援以下列其中一種方式佈建之模型的 ID 或 Amazon Resource Name (ARN):
-
在 的資料表中查詢值佈建輸送量支援的區域和模型。
-
傳送 ListFoundationModels 請求,並指定
byInferenceType
的值PROVISIONED
,以查看支援佈建的模型清單。在modelId
或modelArn
欄位中尋找 值。
-
-
如果您要購買自訂模型的佈建輸送量,請尋找您以下列其中一種方式自訂模型的名稱或 Amazon Resource Name (ARN):
-
在 Amazon Bedrock 主控台中,從左側導覽窗格中選擇自訂模型。在模型清單中尋找自訂模型的名稱,或選取它,然後在模型詳細資訊中尋找模型 ARN。
-
傳送 ListCustomModels 請求,並在回應中尋找自訂模型的
modelName
或modelArn
值。
-
-
-
在下列範例中修改 InvokeModel 請求
body
的 ,以在 中尋找符合模型內文的格式基礎模型的推論請求參數和回應欄位。
選擇您偏好方法的索引標籤,然後遵循下列步驟:
-
透過在終端機中執行下列命令,傳送 CreateProvisionedModelThroughput 請求以建立稱為
MyPT
的無遞交佈建輸送量:aws bedrock create-provisioned-model-throughput \ --model-units 1 \ --provisioned-model-name
MyPT
\ --model-id amazon.nova-lite-v1:0:24k -
回應會傳回
provisioned-model-arn
。等待建立完成。若要檢查其狀態,請執行下列命令provisioned-model-id
,傳送 GetProvisionedModelThroughput 請求,並提供佈建模型的名稱或 ARN 做為 :aws bedrock get-provisioned-model-throughput \ --provisioned-model-id
${provisioned-model-arn}
-
傳送 InvokeModel 請求,以您的佈建模型執行推論。提供
CreateProvisionedModelThroughput
回應中傳回之佈建模型的 ARN,做為model-id
。輸出會寫入目前資料夾中名為output.txt
的檔案。aws bedrock-runtime invoke-model \ --model-id
${provisioned-model-arn}
\ --body '{ "messages": [{ "role": "user", "content": [{ "text": "Hello" }] }], "inferenceConfig": { "temperature":0.7 } }' \ --cli-binary-format raw-in-base64-out \ output.txt -
使用下列命令傳送 DeleteProvisionedModelThroughput 請求來刪除佈建輸送量。您不再需要支付佈建輸送量的費用。
aws bedrock delete-provisioned-model-throughput --provisioned-model-id
MyPT