使用 Amazon Bedrock 中的佈建輸送量來增加模型調用容量 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon Bedrock 中的佈建輸送量來增加模型調用容量

輸送量是指模型處理和傳回的輸入和輸出的數量和速率。您可以購買佈建輸送量,以固定成本為模型佈建更高層級的輸送量。如果您自訂模型,則必須購買佈建輸送量才能使用。

您購買的佈建輸送量會每小時向您收費。如需定價的詳細資訊,請參閱 Amazon Bedrock 定價。每小時價格取決於下列因素:

  1. 您選擇的模型 (對於自訂模型,定價與其自訂的基礎模型相同)。

  2. 您為佈建輸送量指定的模型單位 (MUs) 數量。MU 為指定的模型提供特定的輸送量層級。MU 的輸送量層級會指定下列項目:

    • MU 可在一分鐘內跨所有請求處理的輸入字符數量。

    • MU 可在一分鐘內跨所有請求產生的輸出字符數量。

    注意

    如需 MU 指定項目的詳細資訊,請聯絡您的 AWS 帳戶 管理員。

  3. 您承諾保留佈建輸送量的持續時間。承諾持續時間越長,每小時價格的折扣就越大。您可以選擇以下層級的承諾:

    • 無承諾 – 您可以隨時刪除佈建輸送量。

    • 1 個月 – 在一個月的承諾期限結束之前,您無法刪除佈建輸送量。

    • 6 個月 – 在六個月的承諾期限結束之前,您無法刪除佈建輸送量。

    注意

    帳單會持續進行,直到您刪除佈建輸送量為止。

下列步驟概述設定和使用佈建輸送量的程序。

  1. 決定您要為佈建輸送量購買的 MUs 數量,以及您要承諾使用佈建輸送量的時間長度。

  2. 購買基礎或自訂模型的佈建輸送量。

  3. 建立佈建模型後,您可以使用它來執行模型推論