調整容量 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調整容量

注意

功能支援會因索引類型和正在使用的搜尋 API 而有所不同。若要查看您所使用的索引類型和搜尋 API 是否支援此功能,請參閱索引類型

Amazon Kendra 以容量單位提供索引的資源。每個容量單位為您的索引提供額外的資源。文件儲存和查詢有不同的容量單位。您只能將容量單位新增至 GenAI Enterprise Edition 和 Amazon Kendra Enterprise 索引。您無法將容量新增至 Developer Edition 索引。

文件儲存容量單位為您的索引提供下列額外儲存。

  • Amazon Kendra GenAI Enterprise Edition – 20,000 個文件或 200MB 的擷取文字。

  • Amazon Kendra Enterprise Edition – 100,000 個文件或 30 GB 的儲存體。

查詢容量單位為您的索引提供下列其他查詢。每秒的查詢會跨擷取和查詢 API 共用。

  • Amazon Kendra GenAI Enterprise Edition – 每秒 0.1 個查詢或每天大約 8,000 個查詢。

  • Amazon Kendra Enterprise Edition – 每秒 0.1 個查詢或每天大約 8,000 個查詢。

每個索引都有等於 1 個容量單位的基本容量 (30 GB/200MB 的儲存體和每秒 0.1 個查詢)。每個額外的容量單位都會有額外的成本。如需詳細資訊,請參閱 Amazon Kendra 定價

您最多可以將 100 個額外容量單位新增至儲存體,並查詢索引的資源。如果您需要更多單位,請聯絡 Support

您每天最多可以調整容量單位 5 次,以符合您的用量需求。您無法將文件儲存容量減少到低於索引中存放的文件數量。例如,如果您要存放 150,000 個文件,則無法將儲存容量減少至低於 1 個額外單位。

您可以在主控台中選取索引名稱來開啟索引設定和其他資訊,以檢視索引正在使用的資源,也可以使用 DescribeIndex API。

Amazon Kendra 當您超過索引的容量時, 也會傳回例外狀況。當所有文件的總擷取大小超過索引的限制ServiceQuotaExceededException時,您會收到 。當文件數量超過索引的限制時,您會InvalidRequest取得每個文件的 。當每秒的查詢數量超過限制ThrottlingException時,您會收到 。如需限制的詳細資訊,請參閱 的配額 Amazon Kendra

累積查詢最多會持續 24 小時。

檢視容量

透過選取索引的名稱來存取詳細資訊,以透過 Amazon Kendra 主控台檢視索引正在使用的資源。主控台也提供用量圖表,讓您可以判斷索引使用的儲存體和查詢容量。您可以使用此資訊來協助您規劃何時新增額外的容量。

檢視文件儲存和查詢使用 (主控台)
  1. 登入 AWS Management Console ,並在 https://https://console.aws.amazon.com/kendra/home 開啟 Amazon Kendra 主控台。

  2. 從索引清單中,選擇您要存取的索引。

  3. 捲動至設定區段,以檢視目前的文件儲存和查詢容量總計。

若要使用 Amazon Kendra API 檢視容量,請使用 DescribeIndex API 中的 CapacityUnits 參數。

新增和移除容量

如果您需要索引的額外容量,您可以使用 主控台或 Amazon Kendra API 新增。

新增或移除儲存體或查詢容量 (主控台)
  1. 登入 AWS Management Console ,並在 https://https://console.aws.amazon.com/kendra/home 開啟 Amazon Kendra 主控台。

  2. 從索引清單中,選擇您要存取的索引。

  3. 選取編輯,或從動作下拉式清單選取編輯

  4. 選取下一步以前往佈建詳細資訊頁面。

  5. 新增或移除文件儲存和/或查詢容量單位。

  6. 繼續選取下一步以前往檢閱頁面,然後選取更新以儲存您的變更。

更新索引的容量後,變更可能需要幾分鐘才會生效。

若要使用 Amazon Kendra API 新增或移除容量,請使用 UpdateIndex API 中的 CapacityUnits 參數。

Amazon Kendra 智慧排名容量

容量單位為重新評分執行計畫提供每秒以下額外的重新評分請求。重新評分執行計畫是用來佈建重新評分 API 的資源。

  • 每秒 0.01 個請求。

每個重新評分執行計劃都附帶一個基本容量,等於 1 個容量單位 (每秒 0.01 個請求)。每個額外的容量單位都會有額外的成本。如需詳細資訊,請參閱 Amazon Kendra 定價

您最多可以為 rescore 執行計畫新增 1000 個額外容量單位。如果您需要更多單位,請聯絡 Support

查詢建議容量

使用查詢建議時,基本查詢容量為每秒 2.5 個 GetQuerySuggestions 呼叫。GetQuerySuggestions 容量是 索引佈建查詢容量的五倍,或每秒 2.5 個呼叫的基本容量,以較高者為準。例如,索引的基本容量是每秒 0.1 個查詢,GetQuerySuggestions 容量的基礎為每秒 2.5 個呼叫。如果將每秒另外 0.1 次查詢新增到索引的每秒 0.2 次查詢總數,則 GetQuerySuggestions 容量為每秒 2.5 次呼叫 (高於每秒 0.2 次查詢的五倍)。

Amazon Kendra 體驗容量

搜尋體驗容量

Amazon Kendra 開始調節 QueryQuerySuggestionsSubmitFeedback針對您每秒 Amazon Kendra 15 個請求和每秒 40 個請求的查詢爆量。對於超過 150 個查詢容量單位的索引,這些限制仍然適用。

例如,索引的查詢容量單位為 150,因此您的搜尋體驗應用程式可以每秒處理 15 個請求。不過,如果您擴展到 200 個查詢容量單位,則您的搜尋體驗應用程式仍會每秒處理 15 個請求。如果您將索引限制為 100 個查詢容量單位,則您的搜尋體驗應用程式每秒只會處理 10 個請求。

自適應查詢爆量

Amazon Kendra 有 1 個查詢容量單位的佈建基本容量。您每天最多可以使用 8,000 個查詢,每秒至少 0.1 個查詢的輸送量 (每個查詢容量單位)。累積查詢最多會持續 24 小時,並且可以容納流量爆增。允許爆量的數量會有所不同,因為它取決於叢集在任何指定時間的負載。佈建足夠的查詢容量單位來處理尖峰負載層級。

處理超出佈建輸送量之意外流量爆增的適應性方法是 Amazon Kendra內建的適應性查詢爆量。自適應查詢爆量可在 企業版中取得 Amazon Kendra。

自適應查詢爆量是一種內建功能,可讓您套用未使用的查詢容量來處理非預期的流量。 會每秒依佈建查詢的每秒速率 Amazon Kendra 累積未使用的查詢,最多達您為 Amazon Kendra 索引佈建的查詢數量上限。這些累積的查詢用於超出配置容量的非預期流量。適應性查詢爆量的最佳效能可能有所不同,取決於多種因素,例如您的總索引大小、查詢複雜性、累積未使用的查詢,以及索引的整體負載。建議您執行自己的負載測試,以準確測量爆量容量。