本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
若要存放轉換文件的向量內嵌,請使用向量存放區。如果您希望 Amazon Bedrock 自動為您在 Amazon OpenSearch Serverless 中建立向量索引,請略過此先決條件並繼續 透過連線至 Amazon Bedrock 知識庫中的資料來源來建立知識庫。
如果您想要儲存二進位向量內嵌,而非標準浮點 (float32) 向量內嵌,則必須使用支援二進位向量的向量存放區。Amazon OpenSearch Serverless 目前是唯一支援儲存二進位向量的向量存放區。
您可以設定自己的支援向量存放區,為資料的向量內嵌表示編製索引。您可以為下列資料建立欄位:
-
您所選的內嵌模型從資料來源中的文字產生的向量欄位。
-
從資料來源中的檔案擷取的文字區塊欄位。
-
Amazon Bedrock 管理的來源檔案中繼資料欄位。
-
(如果您使用 Amazon Aurora 資料庫,並想要設定中繼資料的篩選) 與來源檔案建立關聯的中繼資料欄位。如果您打算在其他向量存放區中設定篩選,則不必設定這些欄位進行篩選。
您可以使用 KMS 金鑰加密第三方向量存放區。如需詳細資訊,請參閱知識庫資源加密。
選取對應於向量存放區服務的標籤,您將用來建立向量索引。
-
若要在 Amazon OpenSearch Serverless 中設定許可和建立向量搜尋集合 AWS Management Console,請遵循《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合的步驟 1 和 2。設定集合時請注意下列考量事項:
-
為集合提供您選擇的名稱和描述。
-
若要讓集合成為私有,請選取安全性區段的標準建立。然後,在網路存取設定區段中,選取 VPC 做為存取類型,然後選擇 VPC 端點。如需為 Amazon OpenSearch Serverless 集合設定 VPC 端點的詳細資訊,請參閱《Amazon OpenSearch Service 開發人員指南》中的使用界面端點 (AWS PrivateLink) 存取 Amazon OpenSearch Serverless。 OpenSearch
-
-
建立集合之後,請在建立知識庫時記下 的集合 ARN。
-
在左側導覽窗格中,選取無伺服器下的集合。然後選取您的向量搜尋集合。
-
選取索引索引標籤。然後選擇建立向量索引。
-
在向量索引詳細資訊區段中,在向量索引名稱欄位中輸入索引的名稱。
-
在向量欄位區段中,選擇新增向量欄位。Amazon Bedrock 會將資料來源的向量內嵌存放在此欄位。提供下列組態:
-
向量欄位名稱 – 提供欄位的名稱 (例如
embeddings
)。 -
引擎 – 用於搜尋的向量引擎。選取失敗。
-
維度 — 向量中的維度數。請參閱下表,判斷向量應包含多少維度:
模型 維度 Titan G1 內嵌 - 文字 1,536 Titan V2 內嵌 - 文字 1,024 Cohere Embed 英文 1,024 Cohere Embed 多語言 1,024 -
距離指標 — 用於測量向量之間相似性的指標。建議使用 Euclidean。
-
-
展開中繼資料管理區段,並新增兩個欄位來設定向量索引,以存放知識庫可以使用向量擷取的其他中繼資料。下表說明要為每個欄位指定的欄位和值:
欄位描述 映射欄位 資料類型 可篩選 Amazon Bedrock 會將資料中的原始文字區塊化,並將區塊存放在此欄位中。 您選擇的名稱 (例如 text
)字串 True Amazon Bedrock 會將與知識庫相關的中繼資料存放在此欄位。 您選擇的名稱 (例如 bedrock-metadata
)字串 False -
請記下您在建立知識庫時為向量索引名稱、向量欄位名稱和中繼資料管理映射欄位名稱選擇的名稱。然後選擇 Create (建立)。
建立向量索引後,您可以繼續建立知識庫。下表摘要說明您將輸入所記下之每段資訊的位置。
欄位 | 知識庫設定 (主控台) 中的對應欄位 | 知識庫設定 (API) 中的對應欄位 | 描述 |
---|---|---|---|
集合 ARN | 集合 ARN | collectionARN | 向量搜尋集合的 Amazon Resource Name (ARN)。 |
向量索引名稱 | 向量索引名稱 | vectorIndexName | 向量索引的名稱。 |
向量欄位名稱 | 向量欄位 | vectorField | 存放資料來源向量內嵌的欄位名稱。 |
中繼資料管理 (第一個映射欄位) | 文字欄位 | textField | 要從資料來源存放原始文字的欄位名稱。 |
中繼資料管理 (第二個映射欄位) | Bedrock 受管中繼資料欄位 | metadataField | 存放 Amazon Bedrock 管理之中繼資料的欄位名稱。 |
如需在 Amazon OpenSearch Serverless 中設定向量存放區的詳細資訊,請參閱《Amazon OpenSearch Service 開發人員指南》中的使用向量搜尋集合。