本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
為 Amazon 基岩模型購買佈建輸送量
當您購買模型的佈建輸送量時,您可以指定模型的承諾用量層級以及要配置的模型單位 (mU) 數量。如需 MU 配額,請參閱佈建的輸送量配額。您可以分配給佈建輸送量的 MU 數量取決於佈建輸送量的承諾期限:
-
根據預設,您的帳戶會為您提供 2 mU,以便在佈建輸送量之間進行分配,無需承諾。
-
如果您要購買承諾產品的佈建輸送量,則必須先造訪AWS 支援中心
,為您的帳戶申請 MU,以便在具有承諾量的佈建輸送量之間進行分配。授與您的請求之後,您可以購買含承諾的佈建輸送量。
注意
購買佈建輸送量之後,您只能在選取自訂模型時變更相關模型。您可以將關聯的模型變更為下列其中一項:
-
它是從定制的基本模型。
-
衍生自相同基礎模型的另一個自訂模型。
若要瞭解如何購買模型的佈建輸送量,請選取與您選擇方法相對應的索引標籤,然後依照步驟執行。
- Console
-
-
AWS Management Console 使用具有 Amazon 基岩許可的 IAM 角色登錄,然後在 https://console.aws.amazon.com/bedrock/ 打開 Amazon 基岩主控台。
-
從左側導覽窗格中選取「評估與部署」下的佈建輸送量。
-
在「佈建輸送量」段落中,選擇購買佈建的輸送量。
-
針對「佈建輸送量詳細資訊」段落,執行下列動作:
-
在佈建輸送量名稱欄位中,輸入佈建輸送量的名稱。
-
在「選取模型」下,選取基礎模型提供者或自訂模型類別。然後選取要佈建輸送量的模型。
注意
若要查看無需承諾即可購買佈建輸送量的基礎模型,請參閱佈建輸送量的支援區域和模型。
在該 AWS GovCloud (US) 區域中,您只能針對沒有承諾的自訂模型購買佈建輸送量。
-
(選擇性) 若要將標籤與您的佈建輸送量產生關聯,請展開標記區段,然後選擇新增標記。如需詳細資訊,請參閱 使用標籤管理資源。
-
-
對於承諾詞彙與模型單位區段,請執行下列動作:
-
在 「選取承諾使用期限」段落中,選取您要確認使用佈建輸送量的時間量。
-
在「模型單位」欄位中,輸入所需的模型單位數 (mU)。如果您要佈建具有承諾產品的模型,則必須先造訪AWS 支援中心
,以要求增加可購買的 MU 數量。
-
-
在估算的購買摘要下方,檢閱預估成本。
-
選擇購買佈建輸送量。
-
複查出現的備註,並選取核取方塊以確認履約承諾期間與價格。然後選擇確認購買。
-
主控台會顯示 [佈建輸送量概觀] 頁面。「佈建輸送量」表格中「佈建輸送量」的狀態會變成「建立」。建立完成「佈建輸送量」後,「狀態」 會變成「服務中」。如果更新失敗,「狀態」 會變成「失敗」。
-
- API
-
若要購買佈建輸送量,請透過 Amazon 基岩控制平面端點傳送請CreateProvisionedModelThroughput求 (請參閱請求和回應格式以及欄位詳細資訊連結)。
注意
若要查看無需承諾即可購買佈建輸送量的基礎模型,請參閱佈建輸送量的支援區域和模型。
在該 AWS GovCloud (US) 區域中,您只能針對沒有承諾的自訂模型購買佈建輸送量。
下表簡要說明參數和要求主體 (如需詳細資訊和要求結構,請參閱CreateProvisionedModelThroughput 要求語法):
變數 是否為必要? 使用案例 modelId 是 指定購買佈建輸送量的基礎模型 ID 或 ARN,或自訂模型名稱或 ARN 模型行銷 是 以指定要購買的模型單位 (mU) 數量。要增加您可以購買的 MU 數量,請訪問AWS 支持中心 以請求增加您可以購買的 MU 數量 provisionedModelName 是 指定佈建輸送量的名稱 提交持續時間 否 指定認可至佈建輸送量的持續時間。省略此欄位以選擇無承諾訂價 標籤 否 將標籤與佈建輸送量建立關聯 clientRequestToken 否 為了防止請求的重複 回應會傳回一個
provisionedModelArn
,您可以modelId
在模型推論中當做一個使用。若要檢查佈建輸送量何時可供使用,請傳送GetProvisionedModelThroughput要求並檢查狀態為InService
。如果更新失敗,其狀態將是Failed
,且GetProvisionedModelThroughput回應將包含failureMessage
.