本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Bedrock 知識庫的支援區域和模型
Amazon Bedrock 知識庫支援美洲、亞洲和歐洲的 區域。Amazon、Cohere 和 Anthropic 提供的特定模型支援知識庫。您可以使用模型將資料轉換為向量內嵌,以及用於資訊擷取和回應產生的模型。
您必須啟用模型存取,才能使用知識庫支援的模型。
如果您使用 Amazon Bedrock API,請記下將資料轉換為向量內嵌和知識庫擷取和產生 所需的模型 Amazon Resource Name (ARN)。複製所選模型的模型 ID 做為知識庫,並依照模型資源類型的ARN範例,ARN使用模型 (資源) ID 建構模型。
如果您使用 Amazon Bedrock 主控台,則不需要建構模型 ARN,因為您可以選擇可用的模型作為建立知識庫的步驟的一部分。
下列區域支援 Amazon Bedrock 知識庫:
注意
Amazon Titan Text Premier 目前僅適用於 us-east-1
區域。
區域 |
---|
美國東部 (維吉尼亞北部) |
美國西部 (奧勒岡) |
加拿大 (中部) |
亞太區域 (孟買) |
亞太區域 (新加坡) (門控存取) |
亞太區域 (悉尼) |
亞太區域 (東京) |
歐洲 (法蘭克福) |
歐洲 (倫敦) |
Europe (Paris) |
歐洲 (愛爾蘭) (門禁) |
南美洲 (聖保羅) |
AWS GovCloud (美國西部) |
您可以使用下列模型將資料轉換為資料向量內嵌表示法:
注意
您無法再使用 Amazon 建立新的向量存放區 Titan Embeddings G1 - Text。 先前使用 Amazon 建立的向量存放區 Titan Embeddings G1 - Text 仍受支援。
模型名稱 | 模型 ID |
---|---|
Amazon Titan Embeddings G1 - Text | amazon.titan-embed-text-v1 |
Amazon Titan 文字內嵌 V2 | amazon.titan-embed-text-v2:0 |
Cohere Embed (英文) | cohere.embed-english-v3 |
Cohere Embed (多語言) | cohere.embed-multilingual-v3 |
您可以搭配 使用下列模型 RetrieveAndGenerate API 從知識庫擷取資訊後產生回應的操作:
注意
會RetrieveAndGenerateAPI查詢知識庫並使用支援的 Amazon Bedrock 知識庫模型,從其擷取的資訊產生回應。擷取API只會查詢知識庫;不會產生回應。因此,使用 擷取結果後API,您可以將結果用於任何 Retrieve
Amazon Bedrock 或 SageMaker 模型的InvokeModel
請求,以產生回應。
模型 | 模型 ID |
---|---|
Amazon Titan Text Premier | amazon.titan-text-premier-v1:0 |
Anthropic Claude v2.0 | anthropic.claude-v2 |
Anthropic Claude v2.1 | anthropic.claude-v2:1 |
Anthropic Claude 3 Sonnet v1 | anthropic.claude-3-sonnet-20240229-v1:0 |
Anthropic Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0 |
Anthropic Claude 3 Haiku v1 | anthropic.claude-3-haiku-20240307-v1:0 |
Anthropic Claude Instant v1 | 人類。claude-instant-v1 |
Meta Llama 3.1 8B Instruct | meta.llama3-1-8b-instruct-v1:0 |
Meta Llama 3.1 70B Instruct | meta.llama3-1-70b-instruct-v1:0 |
Meta Llama 3.1 405B Instruct | meta.llama3-1-405b-instruct-v1:0 |
RetrieveAndGenerate API 操作支援下列類型的輸送量:
-
隨需 – 將模型推論請求傳送至您目前的區域。在尖峰使用率爆增期間,您的請求速率或磁碟區可能會受到限制。在主控台中選擇隨需輸送量,或在 中指定模型 ID RetrieveAndGenerate 請求。
-
跨區域推論 – 跨一組區域分發模型推論請求,以允許更高的輸送量並促進更高的彈性。指定推論描述檔,定義區域端點,以將模型調用請求傳送至 中的 RetrieveAndGenerate或 CreateDataSource 請求。如需詳細資訊,請參閱透過跨區域推論改善復原能力。
重要
如果您使用跨區域推論,您的資料可以跨區域共用。