本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於知識庫之自有向量存放區的先決條件
若要存放轉換為文件的向量內嵌,請使用向量存放區。如果您希望 Amazon Bedrock 為您自動在 Amazon OpenSearch Serverless 中建立向量索引,請略過此先決條件並繼續 在 Amazon Bedrock 知識庫中建立知識庫。
如果您想要儲存二進位向量內嵌,而非標準浮點 (float32) 向量內嵌,則必須使用支援二進位向量的向量存放區。Amazon OpenSearch Serverless 目前是唯一支援儲存二進位向量的向量存放區。
您可以設定自己的支援向量存放區,為資料的向量內嵌表示編製索引。您可以為下列資料建立欄位:
-
透過您選擇的內嵌模型,從資料來源中的文字產生的向量欄位。
-
從資料來源中的檔案擷取的文字區塊欄位。
-
Amazon Bedrock 管理的來源檔案中繼資料欄位。
-
(如果您使用 Amazon Aurora 資料庫,並想要設定中繼資料的篩選) 與來源檔案建立關聯的中繼資料欄位。如果您計劃在其他向量存放區中設定篩選,則不必設定這些欄位進行篩選。
您可以使用 KMS金鑰加密第三方向量存放區。如需詳細資訊,請參閱知識庫資源加密。
選取對應於向量存放區服務的標籤,您將用來建立向量索引。
- Amazon OpenSearch Serverless
-
-
若要在 中的 Amazon OpenSearch Serverless 中設定許可和建立向量搜尋集合 AWS Management Console,請遵循《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合的步驟 1 和 2。設定集合時,請注意下列考量事項:
-
為集合提供您選擇的名稱和描述。
-
若要將您的集合設為私有,請選取安全性區段的標準建立。然後,在網路存取設定區段中,選取 VPC做為存取類型,然後選擇VPC端點。如需設定 Amazon OpenSearch Serverless 集合VPC端點的詳細資訊,請參閱《Amazon Service 開發人員指南》中的使用介面端點 (AWS PrivateLink) 存取 Amazon OpenSearch Serverless。 OpenSearch
-
-
建立集合之後,請在建立知識庫時記下 的集合ARN。
-
在左側導覽窗格中,選取無伺服器下的集合。然後選取您的向量搜尋集合。
-
選取索引索引標籤。然後選擇建立向量索引。
-
在向量索引詳細資訊區段中,在向量索引名稱欄位中輸入索引的名稱。
-
在向量欄位區段中,選擇新增向量欄位。Amazon Bedrock 會將資料來源的向量內嵌存放在此欄位。提供下列組態:
-
向量欄位名稱 – 提供欄位的名稱 (例如
embeddings
)。 -
引擎 – 用於搜尋的向量引擎。選取失敗。
-
維度 — 向量中的維度數。請參閱下表,判斷向量應包含多少維度:
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
距離指標 — 用於測量向量之間相似性的指標。建議使用 Euclidean。
-
-
展開中繼資料管理區段,並新增兩個欄位來設定向量索引,以存放知識庫可以使用向量擷取的其他中繼資料。下表說明要為每個欄位指定的欄位和值:
欄位描述 映射欄位 資料類型 可篩選 Amazon Bedrock 會將資料中的原始文字區塊化,並將區塊儲存在此欄位中。 您選擇的名稱 (例如 text
)字串 True Amazon Bedrock 會將與知識庫相關的中繼資料存放在此欄位中。 您選擇的名稱 (例如 bedrock-metadata
)字串 False -
建立知識庫時,請注意您為向量索引名稱、向量欄位名稱和中繼資料管理映射欄位名稱選擇的名稱。然後選擇 Create (建立)。
建立向量索引後,您可以繼續建立知識庫。下表摘要說明您將輸入所記下的每個資訊。
欄位 知識庫設定 (主控台) 中的對應欄位 知識庫設定中的對應欄位 (API) 描述 集合 ARN 集合 ARN 集合ARN 向量搜尋集合的 Amazon Resource Name (ARN)。 向量索引名稱 向量索引名稱 vectorIndexName 向量索引的名稱。 向量欄位名稱 向量欄位 vectorField 存放資料來源之向量內嵌的欄位名稱。 中繼資料管理 (第一個映射欄位) 文字欄位 textField 要從資料來源存放原始文字的欄位名稱。 中繼資料管理 (第二個映射欄位) Bedrock 受管中繼資料欄位 metadataField 存放 Amazon Bedrock 管理之中繼資料的欄位名稱。 如需在 Amazon OpenSearch Serverless 中設定向量存放區的詳細資訊,請參閱《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合。
-
- Amazon Aurora (RDS)
-
-
依照使用 Aurora PostgreSQL 做為知識庫的步驟,建立 Amazon Aurora 資料庫 (DB) 叢集、結構描述和資料表。建立資料表時,請使用下列資料欄和資料類型進行設定。您可以使用您喜歡的資料欄名稱,而不是下表所列的名稱。記下您選擇的資料欄名稱,以便您可以在知識庫設定期間提供這些資料欄名稱。
欄名稱 資料類型 知識庫設定 (主控台) 中的對應欄位 知識庫設定中的對應欄位 (API) 描述 id UUID 主索引鍵 主索引鍵 primaryKeyField
包含每個記錄的唯一識別碼。 內嵌項目 向量 向量欄位 vectorField
包含資料來源的向量內嵌項目。 區塊 文字 文字欄位 textField
包含來自資料來源的原始文字區塊。 中繼資料 JSON Bedrock 受管中繼資料欄位 metadataField
包含執行來源屬性及啟用資料擷取和查詢所需的中繼資料 -
(選用) 如果您將中繼資料新增至檔案以進行篩選,則還必須為檔案中的每個中繼資料屬性建立資料欄,並指定資料類型 (文字、數字或布林值)。例如,如果您的資料來源中
genre
存在 屬性,您可以新增名為 的欄,genre
並將 指定text
為資料類型。在資料擷取期間,這些資料欄會填入對應的屬性值。 -
遵循使用 Amazon Aurora 和 進行密碼管理的步驟,設定 Aurora AWS Secrets Manager 資料庫叢集的 AWS Secrets Manager 秘密。
-
建立資料庫叢集並設定秘密之後,請注意下列資訊。
知識庫設定 (主控台) 中的欄位 知識庫設定中的欄位 (API) 描述 Amazon Aurora 資料庫叢集 ARN resourceArn 資料庫叢集ARN的 。 資料庫名稱 databaseName 您資料庫的名稱 資料表名稱 tableName 資料庫叢集中的資料表名稱 秘密 ARN credentialsSecretArn AWS Secrets Manager 資料庫叢集金鑰ARN的
-
- Pinecone
-
注意
如果您使用 Pinecone,您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量存放區服務。您有責任遵守適用於從第三方服務使用和傳輸資料的任何第三方條款。
如需在 中設定向量存放區的詳細文件 Pinecone,請參閱 Pinecone 作為 Amazon Bedrock 的知識庫
。 設定向量存放區時,請注意下列資訊,以便在建立知識庫時填寫這些資訊:
-
連線字串 – 索引管理頁面URL的端點。
-
命名空間 – (選用) 用於將新資料寫入資料庫的命名空間。如需詳細資訊,請參閱使用命名空間
。
建立 時,您必須提供其他組態 Pinecone 索引:
-
名稱 — 向量索引的名稱。選擇您選擇的任何有效名稱。稍後,當您建立知識庫時,請在向量索引名稱欄位中輸入您選擇的名稱。
-
維度 — 向量中的維度數。請參閱下表,判斷向量應包含多少維度。
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
距離指標 — 用於測量向量之間相似性的指標。我們建議您針對使用案例嘗試不同的指標。我們建議您從餘弦相似性開始。
存取您的 Pinecone 索引,您必須提供 Pinecone API 金鑰,透過 傳送至 Amazon Bedrock AWS Secrets Manager。
為您的 設定秘密 Pinecone 組態
-
請依照建立 AWS Secrets Manager 秘密中的步驟,將金鑰設定為
apiKey
,並將值設定為 API 以存取您的 Pinecone 索引。 -
若要尋找您的API金鑰,請開啟您的 Pinecone 主控台
,然後選取API金鑰。 -
建立秘密後,請記下KMS金鑰ARN的 。
-
遵循中的步驟,將許可連接至您的服務角色,以解密ARNKMS金鑰的 解密包含您知識庫的向量存放區密 AWS Secrets Manager 碼的權限。
-
稍後,當您建立知識庫時,ARN請在登入資料秘密欄位中輸入 ARN。
-
- Redis Enterprise Cloud
-
注意
如果您使用 Redis Enterprise Cloud,您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量存放區服務。您有責任遵守適用於使用和傳輸第三方服務資料的任何第三方條款。
如需在 中設定向量存放區的詳細文件 Redis Enterprise Cloud,請參閱整合 Redis Enterprise Cloud 搭配 Amazon Bedrock
。 設定向量存放區時,請注意下列資訊,以便在建立知識庫時填寫這些資訊:
-
端點 URL – 資料庫URL的公有端點。
-
向量索引名稱 – 資料庫的向量索引名稱。
-
向量欄位 – 存放向量內嵌的欄位名稱。請參閱下表,判斷向量應包含多少維度。
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
文字欄位 – Amazon Bedrock 存放原始文字區塊的欄位名稱。
-
Bedrock 受管中繼資料欄位 – Amazon Bedrock 存放與您知識庫相關之中繼資料的欄位名稱。
存取您的 Redis Enterprise Cloud 叢集,您必須提供 Redis Enterprise Cloud 透過 將安全組態傳送至 Amazon Bedrock AWS Secrets Manager。
為您的 設定秘密 Redis Enterprise Cloud 組態
-
按照 Transport Layer Security (TLS)
中的步驟,啟用 TLS 以將資料庫與 Amazon Bedrock 搭配使用。 -
請遵循建立 AWS Secrets Manager 秘密中的步驟。使用 中的適當值設定下列金鑰 Redis Enterprise Cloud 秘密中的組態:
-
username
– 存取 的使用者名稱 Redis Enterprise Cloud 資料庫。若要尋找您的使用者名稱,請查看 Redis 主控台內資料庫的安全性區段下方。 -
password
– 存取您 的密碼 Redis Enterprise Cloud 資料庫。若要尋找您的使用者名,請查看 Redis 主控台內資料庫的安全性區段下方。 -
serverCertificate
— 來自 Redis 雲端憑證授權單位的憑證內容。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。 -
clientPrivateKey
— 來自 Redis 雲端憑證授權單位之憑證的私密金鑰。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。 -
clientCertificate
— Redis 雲端憑證授權單位的憑證公有金鑰。依照下載憑證的步驟,從 Redis 管理主控台下載伺服器憑證。
-
-
建立秘密後,請注意其 ARN。稍後,當您建立知識庫時,ARN請在登入資料秘密欄位中輸入 ARN。
-
- MongoDB Atlas
-
注意
如果您使用 MongoDB Atlas,您同意授權 代表您 AWS 存取指定的第三方來源,以便為您提供向量儲存服務。您有責任遵守適用於從第三方服務使用和傳輸資料的任何第三方條款。
如需在 MongoDB Atlas 中設定向量存放區的詳細文件,請參閱 MongoDB Atlas 作為 Amazon Bedrock 的知識庫
。 當您設定向量存放區時,請注意建立知識庫時要新增的下列資訊:
-
端點 URL – MongoDB Atlas 叢集URL的端點。
-
資料庫名稱 – MongoDB Atlas 叢集中的資料庫名稱。
-
集合名稱 – 資料庫中集合的名稱。
-
登入資料秘密 ARN – 您在 AWS Secrets Manager 中建立的秘密的 Amazon Resource Name (ARN),其中包含 MongoDB Atlas 叢集中資料庫使用者的使用者名稱和密碼。
-
(選用) 登入資料秘密的客戶受管KMS金鑰 ARN – 如果您加密登入資料秘密 ARN,請提供KMS金鑰,以便 Amazon Bedrock 可以將其解密。
建立 MongoDB Atlas 索引時,您必須提供其他欄位映射組態:
-
向量索引名稱 – 集合上 MongoDB Atlas 向量搜尋索引的名稱。
-
向量欄位名稱 – Amazon Bedrock 應存放向量內嵌的欄位名稱。
-
文字欄位名稱 – Amazon Bedrock 應存放原始區塊文字的欄位名稱。
-
中繼資料欄位名稱 – Amazon Bedrock 應存放來源屬性中繼資料的欄位名稱。
(選用) 若要讓 Amazon Bedrock 透過 連線至 MongoDB Atlas 叢集AWS PrivateLink,請參閱使用 Amazon Bedrock 搭配 MongoDB Atlas 的RAG工作流程
。 -