本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
GraphRAG 已完全整合至 Amazon Bedrock 知識庫,並使用 Amazon Neptune Analytics 進行圖形和向量儲存。您可以在知識庫中透過 AWS Management Console、 AWS CLI或 AWS SDK 開始使用 GraphRAG。
您不需要任何現有的圖形基礎設施即可開始使用 GraphRAG。Amazon Bedrock 知識庫會自動管理從 Amazon Neptune 建立和維護圖形。系統會從您上傳到 Amazon S3 儲存貯體的文件擷取實體、事實和關係,以自動建立和更新圖形。因此,您可以向最終使用者提供相關回應,而無需事先了解圖形建模。圖形將儲存在 Amazon Neptune Analytics 中。
建立知識庫時,您可以設定或指定下列項目:
-
定義和識別知識庫的一般資訊。
-
具有知識庫許可的服務角色。
-
知識庫的組態,包括從資料來源轉換資料時使用的內嵌模型,以及要存放內嵌之服務的儲存組態。
注意
您無法使用根使用者建立知識庫。請先使用 IAM 使用者登入,再開始這些步驟。
以下說明如何從主控台和使用 CLI 建立使用 Neptune GraphRAG 的知識庫。
從主控台建立 Neptune Analytics 的知識庫
-
AWS Management Console 使用具有 Amazon Bedrock 許可的 IAM 角色登入 ,然後開啟位於 https://https://console.aws.amazon.com/bedrock/
的 Amazon Bedrock 主控台。 -
在左側導覽窗格中,選擇知識庫。
-
在知識庫區段中,選擇建立,然後選擇具有向量存放區的知識庫。
-
(選用) 在知識庫詳細資訊下,變更預設名稱並提供知識庫的說明。
-
在 IAM 許可下,選擇提供 Amazon Bedrock 許可以存取其他必要 的 IAM 角色 AWS 服務。您可以讓 Amazon Bedrock 為您建立服務角色,也可以選擇使用您為 Neptune Analytics 建立的自訂角色。如需範例,請參閱「在 Amazon Neptune Analytics 中存取向量資料庫的許可」。
-
請務必選擇 Amazon S3 做為資料來源,然後選擇下一步來設定資料來源。
-
提供將用作資料來源的檔案的 S3 URI,以將知識庫連接到 ,並與 Amazon Neptune Analytics 整合。如需您可以提供的其他步驟和選用資訊,請參閱 將資料來源連接至您的知識庫。
-
在內嵌模型區段中,選擇內嵌模型,將您的資料轉換為向量內嵌。或者,您可以使用其他組態區段來指定向量維度。對於內嵌類型,我們建議您使用浮點向量內嵌。
注意
內嵌模型的向量維度必須符合您在建立 Neptune Analytics 圖形時指定的向量維度。
-
在向量資料庫區段中,選擇建立向量存放區的方法,然後選擇 Amazon Neptune Analytics (GraphRAG) 做為向量存放區,以存放將用於查詢的內嵌。若要建立向量存放區,您可以使用下列其中一種方法:
-
我們建議您使用快速建立新的向量存放區方法,快速開始建立向量存放區。選擇 Amazon Neptune Analytics (GraphRAG) 作為向量存放區。此選項不需要您擁有任何現有的 Neptune Analytics 資源。知識庫會自動在 Amazon Neptune 中產生和存放文件內嵌,以及衍生自文件體的實體及其關係的圖形表示。
-
或者,如果您已建立 Neptune Analytics 圖形和向量索引,您可以使用選擇已建立的向量存放區選項。選擇 Amazon Neptune Analytics (GraphRAG) 作為向量存放區,並在向量索引中識別圖形 ARN、向量欄位名稱和中繼資料欄位名稱。如需詳細資訊,請參閱使用您為知識庫建立的向量存放區的先決條件。
-
-
選擇下一步並檢閱知識庫的詳細資訊。您可以在繼續和建立知識庫之前編輯任何區段。
注意
建立知識庫所需的時間取決於您的特定組態。建立知識庫完成後,知識庫的狀態會變更為就緒或可用狀態。
一旦您的知識庫準備就緒且可用,請第一次以及每當您想要將內容保持在最新狀態時同步您的資料來源。在主控台中選取您的知識庫,然後在資料來源概觀區段中選取同步。
-
選擇建立知識庫。當 Amazon Bedrock 正在建立知識庫時,您應該會看到進行中的狀態。您必須等待建立完成,才能同步資料來源。
-
Amazon Bedrock 完成建立知識庫後,若要設定資料來源,請遵循 中的指示將資料來源連接至您的知識庫。
同步資料來源
建立知識庫之後,您可以擷取或同步資料,以便查詢資料。擷取會擷取圖形結構,並根據您指定的向量內嵌模型和組態,將資料來源中的原始資料轉換為向量內嵌。
下列命令顯示如何使用 CLI 啟動擷取任務的範例。
aws bedrock-agent start-ingestion-job \ --data-source-id
<"ABCDEFGHIJ">
\ --knowledge-base-id<"EFGHIJKLMN">
如需詳細資訊,以及如何使用主控台和 API 同步資料來源,請參閱 將您的資料與您的 Amazon Bedrock 知識庫同步。
擷取知識庫的變更
使用 Amazon S3 做為資料來源時,您可以修改資料來源,並在一個步驟中同步變更。透過直接擷取,您可以在單一動作中直接新增、更新或刪除知識庫中的檔案,而且您的知識庫可以存取文件,而無需同步。直接擷取使用 KnowledgeBaseDocuments
API 操作,為您直接提交到為知識庫設定的向量存放區的文件編製索引。您也可以直接使用這些操作檢視知識庫中的文件,而不需要導覽至連線的資料來源即可檢視。如需詳細資訊,請參閱直接將變更擷取至知識庫。
測試知識庫
現在您已設定知識庫,您可以傳送佇列並產生回應來進行測試。
下列程式碼顯示範例 CLI 命令。
aws bedrock-agent-runtime retrieve \ --knowledge-base-id
<"ABCDEFGHIJ">
\ --retrieval-query="{\"text\": \"What are the top three video games available now?\"}"
如需詳細資訊,請參閱查詢連接到 Amazon Neptune Analytics 圖形的知識庫。