本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Bedrock 知識庫可讓您將專屬資訊整合到生成式 AI 應用程式,以建立擷取增強產生 (RAG) 解決方案。知識庫會搜尋您的資料,以尋找最有用的資訊,並可用來回答自然語言問題。
注意
您無法使用根使用者建立知識庫。請先使用 IAM使用者登入,再開始這些步驟。
當您建立知識庫時,您可以設定知識庫的組態和許可、選擇要連接的資料來源、將資料轉換為內嵌的內嵌模型,以及將向量內嵌保留在其中的向量存放區。選擇您偏好方法的索引標籤,然後遵循下列步驟:
設定知識庫的組態和許可
-
AWS Management Console 使用IAM具有 Amazon Bedrock 許可的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/
。 -
在左側導覽窗格中,選擇知識庫。
-
在知識庫區段中,選取建立按鈕。
-
(選用) 變更預設名稱並提供知識庫的描述。
-
選擇提供 Amazon Bedrock 存取其他必要 AWS 服務許可的 AWS Identity and Access Management (IAM) 角色。您可以讓 Amazon Bedrock 建立服務角色,或選擇您已建立的自訂角色。
-
選擇資料來源以連接您的知識庫。
-
(選用) 將標籤新增至您的知識庫。如需詳細資訊,請參閱標記 Amazon Bedrock 資源。
-
(選用) 設定 服務,為您的知識庫交付活動日誌。
-
前往下一節,並遵循 中的步驟將資料來源連接至您的知識庫來設定資料來源。
-
選擇內嵌模型,將您的資料轉換為向量內嵌。
-
(選用) 展開其他組態區段以查看下列組態選項 (並非所有模型都支援所有組態):
-
內嵌類型 – 是否要將資料轉換為浮點 (float32) 向量內嵌 (更精確但更昂貴) 或二進位向量內嵌 (更不精確但成本更低)。若要了解哪些內嵌模型支援二進位向量,請參閱支援的內嵌模型。
-
向量維度 – 較高的值可提高準確度,但會增加成本和延遲。
-
-
選擇向量存放區以存放將用於查詢的向量內嵌。您有下列選項:
-
快速建立新的向量存放區 – 選擇其中一個可供 Amazon Bedrock 建立的向量存放區。
-
Amazon OpenSearch Serverless – Amazon Bedrock 知識庫會建立 Amazon OpenSearch Serverless 向量搜尋集合和索引,並使用必要欄位進行設定。
-
Amazon Aurora PostgreSQL Serverless – Amazon Bedrock 會設定 Amazon Aurora PostgreSQL Serverless 向量存放區。此程序會從 Amazon S3 儲存貯體取得非結構化文字資料,將其轉換為文字區塊和向量,然後將其存放在 PostgreSQL 資料庫中。如需詳細資訊,請參閱快速建立 Amazon Bedrock 的 Aurora PostgreSQL 知識庫。
-
Amazon Neptune Analytics – Amazon Bedrock 使用擷取增強產生 (RAG) 技術與圖形結合,以增強生成 AI 應用程式,讓最終使用者可以取得更準確且全面的回應。
-
-
選擇您建立的向量存放區 – 選取支援的向量存放區,並在向量索引中識別向量欄位名稱和中繼資料欄位名稱。如需詳細資訊,請參閱適用於知識庫之自有向量存放區的先決條件。
注意
如果您的資料來源是 Confluence、Microsoft SharePoint或 Salesforce 執行個體,則唯一支援的向量存放區服務是 Amazon OpenSearch Serverless。
-
-
如果您的資料來源包含映像,請指定 Amazon S3,URI以存放剖析器將從資料擷取的映像。可在查詢期間傳回映像。
注意
多模式資料僅支援 Amazon S3 和自訂資料來源。
-
檢查知識庫的詳細資訊。您可以在繼續和建立知識庫之前編輯任何區段。
注意
建立知識庫所需的時間取決於您的特定組態。建立知識庫完成後,知識庫的狀態會變更為就緒或可用狀態。
一旦知識庫準備就緒且可用,請第一次同步資料來源,並隨時將內容保持在最新狀態。在主控台中選取您的知識庫,然後在資料來源概觀區段中選取同步。