選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

在 Amazon Bedrock 知識庫中建立知識庫

焦點模式
在 Amazon Bedrock 知識庫中建立知識庫 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 知識庫可讓您將專屬資訊整合到生成式 AI 應用程式,以建立擷取增強產生 (RAG) 解決方案。知識庫會搜尋您的資料,以尋找最有用的資訊,並可用來回答自然語言問題。

注意

您無法使用根使用者建立知識庫。請先使用 IAM使用者登入,再開始這些步驟。

當您建立知識庫時,您可以設定知識庫的組態和許可、選擇要連接的資料來源、將資料轉換為內嵌的內嵌模型,以及將向量內嵌保留在其中的向量存放區。選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console
設定知識庫的組態和許可
  1. AWS Management Console 使用IAM具有 Amazon Bedrock 許可的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/

  2. 在左側導覽窗格中,選擇知識庫

  3. 知識庫區段中,選取建立按鈕。

  4. (選用) 變更預設名稱並提供知識庫的描述。

  5. 選擇提供 Amazon Bedrock 存取其他必要 AWS 服務許可的 AWS Identity and Access Management (IAM) 角色。您可以讓 Amazon Bedrock 建立服務角色,或選擇您已建立的自訂角色

  6. 選擇資料來源以連接您的知識庫。

  7. (選用) 將標籤新增至您的知識庫。如需詳細資訊,請參閱標記 Amazon Bedrock 資源

  8. (選用) 設定 服務,為您的知識庫交付活動日誌。

  9. 前往下一節,並遵循 中的步驟將資料來源連接至您的知識庫來設定資料來源。

  10. 選擇內嵌模型,將您的資料轉換為向量內嵌。

  11. (選用) 展開其他組態區段以查看下列組態選項 (並非所有模型都支援所有組態):

    • 內嵌類型 – 是否要將資料轉換為浮點 (float32) 向量內嵌 (更精確但更昂貴) 或二進位向量內嵌 (更不精確但成本更低)。若要了解哪些內嵌模型支援二進位向量,請參閱支援的內嵌模型

    • 向量維度 – 較高的值可提高準確度,但會增加成本和延遲。

  12. 選擇向量存放區以存放將用於查詢的向量內嵌。您有下列選項:

    • 快速建立新的向量存放區 – 選擇其中一個可供 Amazon Bedrock 建立的向量存放區。

      • Amazon OpenSearch Serverless – Amazon Bedrock 知識庫會建立 Amazon OpenSearch Serverless 向量搜尋集合和索引,並使用必要欄位進行設定。

      • Amazon Aurora PostgreSQL Serverless – Amazon Bedrock 會設定 Amazon Aurora PostgreSQL Serverless 向量存放區。此程序會從 Amazon S3 儲存貯體取得非結構化文字資料,將其轉換為文字區塊和向量,然後將其存放在 PostgreSQL 資料庫中。如需詳細資訊,請參閱快速建立 Amazon Bedrock 的 Aurora PostgreSQL 知識庫

      • Amazon Neptune Analytics – Amazon Bedrock 使用擷取增強產生 (RAG) 技術與圖形結合,以增強生成 AI 應用程式,讓最終使用者可以取得更準確且全面的回應。

    • 選擇您建立的向量存放區 – 選取支援的向量存放區,並在向量索引中識別向量欄位名稱和中繼資料欄位名稱。如需詳細資訊,請參閱適用於知識庫之自有向量存放區的先決條件

      注意

      如果您的資料來源是 Confluence、Microsoft SharePoint或 Salesforce 執行個體,則唯一支援的向量存放區服務是 Amazon OpenSearch Serverless。

  13. 如果您的資料來源包含映像,請指定 Amazon S3,URI以存放剖析器將從資料擷取的映像。可在查詢期間傳回映像。

    注意

    多模式資料僅支援 Amazon S3 和自訂資料來源。

  14. 檢查知識庫的詳細資訊。您可以在繼續和建立知識庫之前編輯任何區段。

    注意

    建立知識庫所需的時間取決於您的特定組態。建立知識庫完成後,知識庫的狀態會變更為就緒或可用狀態。

    一旦知識庫準備就緒且可用,請第一次同步資料來源,並隨時將內容保持在最新狀態。在主控台中選取您的知識庫,然後在資料來源概觀區段中選取同步

API

若要建立知識庫,請使用 Amazon Bedrock 建置時間端點的代理程式傳送CreateKnowledgeBase請求。

注意

如果您要連線到非結構化資料來源,且偏好讓 Amazon Bedrock 在 Amazon OpenSearch Service 中為您建立和管理向量存放區,請使用 主控台。如需詳細資訊,請參閱在 Amazon Bedrock 知識庫中建立知識庫。

下列是必要欄位:

欄位 基本描述
name 知識庫的名稱
roleArn 知識庫服務角色ARN的 。
knowledgeBaseConfiguration 包含知識庫的組態。請參閱以下詳細資訊。
storageConfiguration (只有在您連線到非結構化資料來源時才需要)。 包含您選擇的資料來源服務的組態。

在 中knowledgeBaseConfiguration,指定您計劃將知識庫連接到的資料來源type的 ,然後指定要使用的內嵌模型ARN的 和 組態。如需詳細資訊,請參閱 VectorKnowledgeBaseConfiguration您可以指定下列類型:

  • VECTOR – 用於非結構化資料來源。指定要使用ARN的內嵌模型的 和 組態。如需詳細資訊,請參閱VectorKnowledgeBaseConfiguration

  • STRUCTURED – 適用於結構化資料存放區。指定要使用的結構化資料存放區的類型,以及該資料存放區的組態。

下列欄位為選用:

欄位 使用案例
description 知識庫的描述。
clientToken 為確保API請求僅完成一次。如需詳細資訊,請參閱確保等冪。
標籤 將標籤與流程建立關聯。如需詳細資訊,請參閱標記 Amazon Bedrock 資源

knowledgeBaseConfiguration 欄位會映射至KnowledgeBaseConfiguration物件。在其中,VECTORtype 欄位中指定 。在 中VectorKnowledgeBaseConfiguration,指定要使用ARN的內嵌模型的 及其組態。

storageConfiguration 欄位會映射至StorageConfiguration物件。在其中,在 type 欄位中指定您計劃連接的向量存放區,並包含與該向量存放區對應的欄位。如需您需要提供的資訊StorageConfiguration詳細資訊,請參閱 中的每個向量存放區組態類型。

設定知識庫的組態和許可
  1. AWS Management Console 使用IAM具有 Amazon Bedrock 許可的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/

  2. 在左側導覽窗格中,選擇知識庫

  3. 知識庫區段中,選取建立按鈕。

  4. (選用) 變更預設名稱並提供知識庫的描述。

  5. 選擇提供 Amazon Bedrock 存取其他必要 AWS 服務許可的 AWS Identity and Access Management (IAM) 角色。您可以讓 Amazon Bedrock 建立服務角色,或選擇您已建立的自訂角色

  6. 選擇資料來源以連接您的知識庫。

  7. (選用) 將標籤新增至您的知識庫。如需詳細資訊,請參閱標記 Amazon Bedrock 資源

  8. (選用) 設定 服務,為您的知識庫交付活動日誌。

  9. 前往下一節,並遵循 中的步驟將資料來源連接至您的知識庫來設定資料來源。

  10. 選擇內嵌模型,將您的資料轉換為向量內嵌。

  11. (選用) 展開其他組態區段以查看下列組態選項 (並非所有模型都支援所有組態):

    • 內嵌類型 – 是否要將資料轉換為浮點 (float32) 向量內嵌 (更精確但更昂貴) 或二進位向量內嵌 (更不精確但成本更低)。若要了解哪些內嵌模型支援二進位向量,請參閱支援的內嵌模型

    • 向量維度 – 較高的值可提高準確度,但會增加成本和延遲。

  12. 選擇向量存放區以存放將用於查詢的向量內嵌。您有下列選項:

    • 快速建立新的向量存放區 – 選擇其中一個可供 Amazon Bedrock 建立的向量存放區。

      • Amazon OpenSearch Serverless – Amazon Bedrock 知識庫會建立 Amazon OpenSearch Serverless 向量搜尋集合和索引,並使用必要欄位進行設定。

      • Amazon Aurora PostgreSQL Serverless – Amazon Bedrock 會設定 Amazon Aurora PostgreSQL Serverless 向量存放區。此程序會從 Amazon S3 儲存貯體取得非結構化文字資料,將其轉換為文字區塊和向量,然後將其存放在 PostgreSQL 資料庫中。如需詳細資訊,請參閱快速建立 Amazon Bedrock 的 Aurora PostgreSQL 知識庫

      • Amazon Neptune Analytics – Amazon Bedrock 使用擷取增強產生 (RAG) 技術與圖形結合,以增強生成 AI 應用程式,讓最終使用者可以取得更準確且全面的回應。

    • 選擇您建立的向量存放區 – 選取支援的向量存放區,並在向量索引中識別向量欄位名稱和中繼資料欄位名稱。如需詳細資訊,請參閱適用於知識庫之自有向量存放區的先決條件

      注意

      如果您的資料來源是 Confluence、Microsoft SharePoint或 Salesforce 執行個體,則唯一支援的向量存放區服務是 Amazon OpenSearch Serverless。

  13. 如果您的資料來源包含映像,請指定 Amazon S3,URI以存放剖析器將從資料擷取的映像。可在查詢期間傳回映像。

    注意

    多模式資料僅支援 Amazon S3 和自訂資料來源。

  14. 檢查知識庫的詳細資訊。您可以在繼續和建立知識庫之前編輯任何區段。

    注意

    建立知識庫所需的時間取決於您的特定組態。建立知識庫完成後,知識庫的狀態會變更為就緒或可用狀態。

    一旦知識庫準備就緒且可用,請第一次同步資料來源,並隨時將內容保持在最新狀態。在主控台中選取您的知識庫,然後在資料來源概觀區段中選取同步

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。