選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

推論在 Amazon Bedrock 中的運作方式

焦點模式
推論在 Amazon Bedrock 中的運作方式 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

當您提交輸入至模型時,模型會預測後續可能的字符序列,並將該序列傳回為輸出。Amazon Bedrock 可讓您使用您選擇的基礎模型執行推論。當您執行推論時,請提供下列輸入:

在不同 AWS 區域中叫用模型

當您叫用模型時,您可以選擇要在 AWS 區域 其中叫用模型的 。您可以提出之請求的頻率和大小配額取決於 區域。您可以在 Amazon Bedrock 服務配額中搜尋下列配額來尋找這些配額

  • ${Model} 的每分鐘隨需模型推論請求

  • ${Model} 的每分鐘隨需 InvokeModel 權杖

您也可以叫用推論描述檔,而不是基礎模型本身。推論描述檔會定義模型和一個或多個區域,而推論描述檔可以將模型調用請求路由到這些區域。透過叫用包含多個區域的推論設定檔,您可以提高輸送量。如需詳細資訊,請參閱使用跨區域推論提高輸送量

對 區域的請求可能會在共用相同父區域的本機區域提供。例如,向美國東部 (維吉尼亞北部) (us-east-1) 提出的請求可在與其相關聯的任何本地區域提供,例如,Atlanta、US (us-east-1-atl-2a)。

使用跨區域推論時,適用相同的原則。例如,對美國AnthropicClaude 3 Haiku推論描述檔提出的請求,可能會在其父區域位於美國的任何當地區域提供,例如西雅圖、美國 (us-west-2-sea-1a)。將新的本機區域新增至 時 AWS,也會將其新增至對應的跨區域推論端點。

若要查看本機端點及其相關聯的父區域清單,請參閱AWS 本機區域位置

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。