Amazon Bedrock 知識庫的支援區域和模型 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 知識庫的支援區域和模型

Amazon Bedrock 知識庫支援美洲、亞洲和歐洲的 區域。Amazon、Cohere 和 Anthropic 提供的特定模型支援知識庫。您可以使用模型將資料轉換為向量內嵌,以及用於資訊擷取和回應產生的模型。

您必須啟用模型存取,才能使用知識庫支援的模型。

如果您使用 Amazon Bedrock API,請記下將資料轉換為向量內嵌知識庫擷取和產生 所需的模型 Amazon Resource Name (ARN)。複製所選模型的模型 ID 做為知識庫,並依照模型資源類型的ARN範例,ARN使用模型 (資源) ID 建構模型。

如果您使用 Amazon Bedrock 主控台,則不需要建構模型 ARN,因為您可以選擇可用的模型作為建立知識庫的步驟的一部分。

下列區域支援 Amazon Bedrock 知識庫:

注意

Amazon Titan Text Premier 目前僅適用於 us-east-1區域。

區域
美國東部 (維吉尼亞北部)
美國西部 (奧勒岡)
加拿大 (中部)
亞太區域 (孟買)
亞太區域 (新加坡) (門控存取)
亞太區域 (悉尼)
亞太區域 (東京)
歐洲 (法蘭克福)
歐洲 (倫敦)
Europe (Paris)
歐洲 (愛爾蘭) (門禁)
南美洲 (聖保羅)
AWS GovCloud (美國西部)

您可以使用下列模型將資料轉換為資料向量內嵌表示法:

注意

您無法再使用 Amazon 建立新的向量存放區 Titan Embeddings G1 - Text。 先前使用 Amazon 建立的向量存放區 Titan Embeddings G1 - Text 仍受支援。

模型名稱 模型 ID
Amazon Titan Embeddings G1 - Text amazon.titan-embed-text-v1
Amazon Titan 文字內嵌 V2 amazon.titan-embed-text-v2:0
Cohere Embed (英文) cohere.embed-english-v3
Cohere Embed (多語言) cohere.embed-multilingual-v3

您可以搭配 使用下列模型 RetrieveAndGenerate API 從知識庫擷取資訊後產生回應的操作:

注意

RetrieveAndGenerateAPI查詢知識庫並使用支援的 Amazon Bedrock 知識庫模型,從其擷取的資訊產生回應。擷取API只會查詢知識庫;不會產生回應。因此,使用 擷取結果後API,您可以將結果用於任何 Retrieve Amazon Bedrock 或 SageMaker 模型的InvokeModel請求,以產生回應。

模型 模型 ID
Amazon Titan Text Premier amazon.titan-text-premier-v1:0
Anthropic Claude v2.0 anthropic.claude-v2
Anthropic Claude v2.1 anthropic.claude-v2:1
Anthropic Claude 3 Sonnet v1 anthropic.claude-3-sonnet-20240229-v1:0
Anthropic Claude 3.5 Sonnet anthropic.claude-3-5-sonnet-20240620-v1:0
Anthropic Claude 3 Haiku v1 anthropic.claude-3-haiku-20240307-v1:0
Anthropic Claude Instant v1 人類。claude-instant-v1
Meta Llama 3.1 8B Instruct meta.llama3-1-8b-instruct-v1:0
Meta Llama 3.1 70B Instruct meta.llama3-1-70b-instruct-v1:0
Meta Llama 3.1 405B Instruct meta.llama3-1-405b-instruct-v1:0

RetrieveAndGenerate API 操作支援下列類型的輸送量:

  • 隨需 – 將模型推論請求傳送至您目前的區域。在尖峰使用率爆增期間,您的請求速率或磁碟區可能會受到限制。在主控台中選擇隨需輸送量,或在 中指定模型 ID RetrieveAndGenerate 請求。

  • 跨區域推論 – 跨一組區域分發模型推論請求,以允許更高的輸送量並促進更高的彈性。指定推論描述檔,定義區域端點,以將模型調用請求傳送至 中的 RetrieveAndGenerateCreateDataSource 請求。如需詳細資訊,請參閱透過跨區域推論改善復原能力

    重要

    如果您使用跨區域推論,您的資料可以跨區域共用。