本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
查詢知識庫並擷取資料
設定知識庫之後,您可以使用 查詢,並從與查詢相關的來源資料中擷取區塊 Retrieve API 操作。您也可以使用重新排名模型,而不是預設的 Amazon Bedrock 知識庫排名器,來排名來源區塊,以便在擷取期間保持關聯性。
若要了解如何查詢知識庫,請選擇您偏好方法的索引標籤,然後遵循下列步驟:
- Console
-
若要測試您的知識庫
-
AWS Management Console 使用IAM具有 Amazon Bedrock 許可的角色登入 ,並在 開啟 Amazon Bedrock 主控台https://console.aws.amazon.com/bedrock/
。 -
在左側導覽窗格中,選擇知識庫。
-
在知識庫區段中,執行下列其中一個動作:
-
選擇您要測試的知識庫旁的選項按鈕,然後選取測試知識庫。測試視窗會從右側展開。
-
選擇您要測試的知識庫。測試視窗會從右側展開。
-
-
在測試視窗中,清除產生查詢的回應,以傳回直接從知識庫擷取的資訊。
-
(選用) 選取組態圖示 ( ) 以開啟組態。您可以修改下列組態:
-
在聊天視窗的文字方塊中輸入查詢,然後選取執行以傳回知識庫的回應。
-
來源區塊會依相關性順序直接傳回。從資料來源擷取的影像也可以傳回為來源區塊。
-
若要查看傳回區塊的詳細資訊,請選取顯示來源詳細資訊。
-
若要查看您為查詢設定的組態,請展開查詢組態。
-
若要檢視來源區塊的詳細資訊,請選擇其旁邊的向右箭頭 ( ) 展開它。您可以看到下列資訊:
-
來源區塊的原始文字。若要複製此文字,請選擇複製圖示 ( )。如果您使用 Amazon S3 存放資料,請選擇外部連結圖示 ( ) 以導覽至包含 檔案的 S3 物件。
-
如果您使用 Amazon S3 存放資料,則與來源區塊相關聯的中繼資料。屬性/欄位索引鍵和值是在與來源文件相關聯的
.metadata.json
檔案中定義。如需詳細資訊,請參閱 中的中繼資料和篩選區段設定和自訂查詢和回應產生。
-
-
聊天選項
-
開啟產生回應,以根據擷取的來源區塊來產生回應。如果您變更設定,聊天視窗中的文字將全部清除。
-
若要清除聊天視窗,請選取新庫圖示 ( )。
-
若要複製聊天視窗中的所有輸出,請選取複製圖示 ( )。
-
- API
-
若要查詢知識庫並只傳回資料來源的相關文字,請傳送 Retrieve Amazon Bedrock 執行時間端點的 代理程式請求。
下列是必要欄位:
欄位 基本描述 knowledgeBaseId 指定要查詢的知識庫。 retrievalQuery 包含 text
欄位以指定查詢。guardrailsConfiguration 包含 guardrailsId
和 等 guardrailsConfiguration 欄位guardrailsVersion
,以搭配 請求使用您的護欄下列欄位為選用:
欄位 使用案例 nextToken 傳回下一批次的回應 (請參閱下方的回應欄位)。 retrievalConfiguration 包含用於自訂向量搜尋的查詢組態。如需更多資訊,請參閱KnowledgeBaseVectorSearchConfiguration。 您可以在預設 Amazon Bedrock 知識庫排名模型上使用重新排名模型,方法是在 中包含
rerankingConfiguration
欄位KnowledgeBaseVectorSearchConfiguration。rerankingConfiguration
欄位會映射到VectorSearchRerankingConfiguration物件,您可以在其中指定要使用的重新排名模型、要包含的任何其他請求欄位、在重新排名期間篩選文件的中繼資料屬性,以及重新排名後要傳回的結果數目。如需詳細資訊,請參閱VectorSearchRerankingConfiguration。注意
如果您指定的
numberOfRerankedResults
值大於 中的numberOfResults
值KnowledgeBaseVectorSearchConfiguration,則傳回的結果數目上限是 的值numberOfResults
。例外狀況是如果您使用查詢分解 (如需詳細資訊,請參閱 中的查詢修改一節設定和自訂查詢和回應產生。如果您使用查詢分解,numberOfRerankedResults
則 最多可達 的五倍numberOfResults
。回應會傳回來自資料來源的來源區塊,做為
retrievalResults
欄位中KnowledgeBaseRetrievalResult物件的陣列。每個 KnowledgeBaseRetrievalResult都包含下列欄位:欄位 描述 內容 在 中包含文字來源區塊 text
,或在 欄位中包含影像來源區塊byteContent
。如果內容是映像,URI則會以下列格式傳回 base64 編碼內容的資料:data:image/jpeg;base64,
。${base64-encoded string}
中繼資料 包含每個中繼資料屬性作為索引鍵,中繼資料值作為索引鍵映射JSON的值。 location 包含來源區塊所屬文件URL的 URI或 。 分數 文件的關聯性分數。您可以使用此分數來分析結果的排名。 如果來源區塊的數量超過回應中可以容納的數量,則會在
nextToken
欄位中傳回值。在另一個請求中使用該值來傳回下一批結果。如果擷取的資料包含影像,回應也會傳回下列回應標頭,其中包含回應中傳回之來源區塊的中繼資料:
-
x-amz-bedrock-kb-byte-content-source
– 包含映像URI的 Amazon S3。 -
x-amz-bedrock-kb-description
– 包含影像的 base64 編碼字串。
注意
您無法在設定中繼資料篩選條件時篩選這些中繼資料回應標頭。
-
注意
如果您在產生回應時收到提示超過字元限制的錯誤,您可以透過以下方式縮短提示:
-
減少擷取結果的數量上限 (這會縮短 中 $search_results$ 預留位置的填入內容知識庫提示範本:協調和產生)。
-
使用使用較小區塊的區塊策略重新建立資料來源 (這會縮短 中 $search_results$ 預留位置的填入內容知識庫提示範本:協調和產生)。
-
縮短提示範本。
-
縮短使用者查詢 (這會縮短 中 $query$ 預留位置的填入內容知識庫提示範本:協調和產生)。