本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將資料與 Amazon Bedrock 知識庫同步
建立知識庫後,您可以擷取或同步資料,以便查詢資料。擷取會根據您指定的向量內嵌模型和組態,將資料來源中的原始資料轉換為向量內嵌。
開始擷取之前,請檢查資料來源是否符合下列條件:
-
您已設定資料來源的連線資訊。若要設定資料來源連接器以從資料來源儲存庫中擷取資料,請參閱支援的資料來源連接器 。您可以在建立知識庫時設定資料來源。
-
您已設定您選擇的向量內嵌模型和向量存放區。請參閱支援的向量內嵌模型和向量存放區知識庫 。您可以將向量內嵌設定為建立知識庫的一部分。
-
檔案採用支援的格式。如需詳細資訊,請參閱支援文件格式 。
-
檔案不會超過 Amazon Bedrock 端點中指定的擷取任務檔案大小,以及 中的配額 AWS 一般參考。
-
如果您的資料來源包含中繼資料檔案,請檢查下列條件,以確保中繼資料檔案不會被忽略:
-
每個
.metadata.json
檔案與其關聯的來源檔案共用相同的檔案名稱和副檔名。 -
如果知識庫的向量索引位於 Amazon OpenSearch Serverless 向量存放區中,請檢查向量索引是否已使用
faiss
引擎設定。如果向量索引是使用nmslib
引擎設定,您必須執行下列其中一項操作:-
在主控台中建立新的知識庫,讓 Amazon Bedrock 自動為您在 Amazon OpenSearch Serverless 中建立向量索引。
-
在向量存放區中建立另一個向量索引,然後選取
faiss
作為引擎 。然後建立新的知識庫並指定新的向量索引。
-
-
如果知識庫的向量索引位於 Amazon Aurora 資料庫叢集中,請檢查索引的資料表是否包含中繼資料檔案中每個中繼資料屬性的資料欄,然後再開始擷取。
-
每次從資料來源新增、修改或移除檔案時,都必須同步資料來源,以便將其重新索引至知識庫。同步是增量的,因此 Amazon Bedrock 只會處理自上次同步以來新增、修改或刪除的文件。
若要了解如何將資料擷取至知識庫並與最新資料同步,請選取與您所選方法對應的索引標籤,然後遵循下列步驟: