本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Amazon Bedrock 中的佈建輸送量來增加模型調用容量
輸送量是指模型處理和傳回的輸入和輸出的數量和速率。您可以購買佈建輸送量,以固定成本為模型佈建更高層級的輸送量。如果您自訂模型,則必須購買佈建輸送量才能使用。
您購買的佈建輸送量會每小時向您收費。如需定價的詳細資訊,請參閱 Amazon Bedrock 定價
-
您選擇的模型 (對於自訂模型,定價與其自訂的基礎模型相同)。
-
您為佈建輸送量指定的模型單位 (MUs) 數量。MU 為指定的模型提供特定的輸送量層級。MU 的輸送量層級會指定下列項目:
-
MU 可在一分鐘內跨所有請求處理的輸入字符數量。
-
MU 可在一分鐘內跨所有請求產生的輸出字符數量。
注意
如需 MU 指定項目的詳細資訊,請聯絡您的 AWS 帳戶 管理員。
-
-
您承諾保留佈建輸送量的持續時間。承諾持續時間越長,每小時價格的折扣就越大。您可以選擇以下層級的承諾:
-
無承諾 – 您可以隨時刪除佈建輸送量。
-
1 個月 – 在一個月的承諾期限結束之前,您無法刪除佈建輸送量。
-
6 個月 – 在六個月的承諾期限結束之前,您無法刪除佈建輸送量。
注意
帳單會持續進行,直到您刪除佈建輸送量為止。
-
下列步驟概述設定和使用佈建輸送量的程序。
-
決定您要為佈建輸送量購買的 MUs 數量,以及您要承諾使用佈建輸送量的時間長度。
-
購買基礎或自訂模型的佈建輸送量。
-
建立佈建模型後,您可以使用它來執行模型推論。