查詢知識庫並擷取資料 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

查詢知識庫並擷取資料

設定知識庫之後,您可以使用 查詢,並從與查詢相關的來源資料中擷取區塊 Retrieve API 操作。您也可以使用重新排名模型,而不是預設的 Amazon Bedrock 知識庫排名器,來排名來源區塊,以便在擷取期間保持關聯性。

若要了解如何查詢知識庫,請選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console
若要測試您的知識庫
  1. AWS Management Console 使用IAM具有 Amazon Bedrock 許可的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/

  2. 在左側導覽窗格中,選擇知識庫

  3. 知識庫區段中,執行下列其中一個動作:

    • 選擇您要測試的知識庫旁的選項按鈕,然後選取測試知識庫。測試視窗會從右側展開。

    • 選擇您要測試的知識庫。測試視窗會從右側展開。

  4. 在測試視窗中,清除產生查詢的回應,以傳回直接從知識庫擷取的資訊。

  5. (選用) 選取組態圖示 ( ) 以開啟組態。您可以修改下列組態:

    • 搜尋類型 – 指定查詢知識庫的方式。如需詳細資訊,請參閱搜尋類型

    • 擷取結果的數量上限 – 指定要擷取的結果數量上限。如需詳細資訊,請參閱擷取結果的數量上限

    • 篩選條件 – 指定每個群組中最多 5 個篩選條件群組和最多 5 個篩選條件,以搭配檔案的中繼資料使用。如需詳細資訊,請參閱手動中繼資料篩選

  6. 在聊天視窗的文字方塊中輸入查詢,然後選取執行以傳回知識庫的回應。

  7. 來源區塊會依相關性順序直接傳回。從資料來源擷取的影像也可以傳回為來源區塊。

  8. 若要查看傳回區塊的詳細資訊,請選取顯示來源詳細資訊

    • 若要查看您為查詢設定的組態,請展開查詢組態

    • 若要檢視來源區塊的詳細資訊,請選擇其旁邊的向右箭頭 ( ) 展開它。您可以看到下列資訊:

      • 來源區塊的原始文字。若要複製此文字,請選擇複製圖示 ( )。如果您使用 Amazon S3 存放資料,請選擇外部連結圖示 ( ) 以導覽至包含 檔案的 S3 物件。

      • 如果您使用 Amazon S3 存放資料,則與來源區塊相關聯的中繼資料。屬性/欄位索引鍵和值是在與來源文件相關聯的 .metadata.json 檔案中定義。如需詳細資訊,請參閱 中的中繼資料和篩選區段設定和自訂查詢和回應產生

聊天選項
  • 開啟產生回應,以根據擷取的來源區塊來產生回應。如果您變更設定,聊天視窗中的文字將全部清除。

  • 若要清除聊天視窗,請選取新庫圖示 ( )。

  • 若要複製聊天視窗中的所有輸出,請選取複製圖示 ( )。

API

若要查詢知識庫並只傳回資料來源的相關文字,請傳送 Retrieve Amazon Bedrock 執行時間端點的 代理程式請求。

下列是必要欄位:

欄位 基本描述
knowledgeBaseId 指定要查詢的知識庫。
retrievalQuery 包含text欄位以指定查詢。
guardrailsConfiguration 包含 guardrailsId和 等 guardrailsConfiguration 欄位guardrailsVersion,以搭配 請求使用您的護欄

下列欄位為選用:

欄位 使用案例
nextToken 傳回下一批次的回應 (請參閱下方的回應欄位)。
retrievalConfiguration 包含用於自訂向量搜尋的查詢組態。如需更多資訊,請參閱KnowledgeBaseVectorSearchConfiguration

您可以在預設 Amazon Bedrock 知識庫排名模型上使用重新排名模型,方法是在 中包含 rerankingConfiguration 欄位KnowledgeBaseVectorSearchConfigurationrerankingConfiguration 欄位會映射到VectorSearchRerankingConfiguration物件,您可以在其中指定要使用的重新排名模型、要包含的任何其他請求欄位、在重新排名期間篩選文件的中繼資料屬性,以及重新排名後要傳回的結果數目。如需詳細資訊,請參閱VectorSearchRerankingConfiguration

注意

如果您指定的numberOfRerankedResults值大於 中的numberOfResultsKnowledgeBaseVectorSearchConfiguration,則傳回的結果數目上限是 的值numberOfResults。例外狀況是如果您使用查詢分解 (如需詳細資訊,請參閱 中的查詢修改一節設定和自訂查詢和回應產生。如果您使用查詢分解,numberOfRerankedResults則 最多可達 的五倍numberOfResults

回應會傳回來自資料來源的來源區塊,做為 retrievalResults 欄位中KnowledgeBaseRetrievalResult物件的陣列。每個 KnowledgeBaseRetrievalResult都包含下列欄位:

欄位 描述
內容 在 中包含文字來源區塊text,或在 欄位中包含影像來源區塊byteContent如果內容是映像,URI則會以下列格式傳回 base64 編碼內容的資料:data:image/jpeg;base64,${base64-encoded string}
中繼資料 包含每個中繼資料屬性作為索引鍵,中繼資料值作為索引鍵映射JSON的值。
location 包含來源區塊所屬文件URL的 URI或 。
分數 文件的關聯性分數。您可以使用此分數來分析結果的排名。

如果來源區塊的數量超過回應中可以容納的數量,則會在 nextToken 欄位中傳回值。在另一個請求中使用該值來傳回下一批結果。

如果擷取的資料包含影像,回應也會傳回下列回應標頭,其中包含回應中傳回之來源區塊的中繼資料:

  • x-amz-bedrock-kb-byte-content-source – 包含映像URI的 Amazon S3。

  • x-amz-bedrock-kb-description – 包含影像的 base64 編碼字串。

注意

如果您在產生回應時收到提示超過字元限制的錯誤,您可以透過以下方式縮短提示: