了解 Amazon CloudSearch 限制 - Amazon CloudSearch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

了解 Amazon CloudSearch 限制

此表格顯示 Amazon 內部的命名和大小限制 CloudSearch。如果您需要提高搜尋網域的分割區的最大數量,可以提交請求。如需增加其他限制 (例如搜尋網域數目上限) 的相關資訊,請聯絡 Amazon CloudSearch。

下表總結了當前的 Amazon CloudSearch 限制。

項目 限制
批次大小 批次大小上限為 5 MB。
資料載入量

您可以每 10 秒載入一個文件批次 (大約每 24 小時 10,000 個批次),每個批次大小上限為 5 MB。

超過此限制會大幅提高文件更新的延遲,並可能導致節流。為了減輕此風險,您可以選擇較大的執行個體類型,以提高更新容量。如需詳細資訊,請參閱Creating Document Batches

重要

無論您選擇哪種執行個體類型,Amazon 都 CloudSearch 不保證在同一秒鐘內收到的文件順序。例如,如果您間隔十分之一秒傳送三種更新,最後一個更新不一定會是最後送出的。保留更新順序是遵守此限制的另一個原因。

文件大小 文件大小上限為 1 MB。
文件欄位 文件中不可超過 200 個欄位。
表達式
  • 最多可為網域設定 50 個運算式。

  • 運算式的大小上限是 10240 個位元組。

  • 運算式可傳回的最大值是 max(int64_t)。

反白
  • 搜尋詞彙出現次數可予反白的上限為 5。

  • 傳回的反白句僅限文字欄位內的前 10 KB 資料。

索引欄位
  • 最多可為網域設定 200 個索引欄位。動態欄位視為一個索引欄位,但通常符合多個文件欄位。動態欄位可能導致您索引中的欄位總數超過 200 個。如果使用動態欄位,請將索引欄位的數量保持低於 1,000 個,以避免影響效能。

  • 欄位中可以指定高達 1000 個值。

  • 可為陣列類型欄位指定高達 20 個來源。

  • 文字欄位的最大大小為 4096 UTF -8 個程式碼點。

  • 欄位的預設值大小上限為 1 KB。

  • int 欄位可包含落在 -9,223,372,036,854,775,808 到 9,223,372,036,854,775,807 (含) 範圍內的值。

  • 文字或文字陣列欄位中的個別字詞如果超過 256 個字元,會被視為停用詞。

命名慣例
  • 網域名稱:允許的字元為 a-z (小寫字母)、0-9 和連字號 (-)。網域名稱必須以字母或數字開頭,長度至少 3 個字元且不超過 28 個字元。

  • 欄位名稱:允許的字元為 a-z (小寫字母)、0-9 和 _ (底線)。欄位名稱必須以字母開頭,長度至少 1 個字元且不超過 64 個字元。名稱 score 是保留項目,不得做為欄位名稱使用。

  • 運算式名稱:允許的字元為 a-z (小寫字母)、0-9 和 _ (底線)。運算式名稱必須以字母開頭,長度至少 3 個字元且不超過 64 個字元。名稱 score 是保留項目,不得做為運算式名稱使用。

  • 文件IDs:文件 ID (_id) 可以包含任何字母或數字以及下列字元:_-= #;:/? @ &. 文件長度IDs必須至少為 1,且不得超過 128 個字元。

政策文件大小 Amazon CloudSearch 政策文件的最大大小為 100 KB。
區域限制 ap-northeast-2 區域僅支援 m4 執行個體類型。
_score 文件的文字相關性分數是正浮點值。
搜尋網域 每個AWS帳戶最多可以創建 100 個搜索域。
搜尋分割區

搜尋索引最多可分散在 10 個分割區。如果您需要提高此限制,可以提交請求

為避免搜尋查詢失敗,Amazon CloudSearch 網域可能會超出此最大分區限制,但新增的文件會被拒絕。如果您遇到此情況,請刪除文件並觸發 IndexDocumentsAPI. 或請求提高限制。

您可以監控 Amazon CloudWatch IndexUtilizationPartitions指標,以便在超過最大分區限制之前採取行動。

搜尋複本

每個搜尋分區最多可有 5 個複本。

注意

啟用多重可用區可加倍複本數量。

搜尋請求
  • 複合查詢:最多可以包含 1024 個子句。

  • GETrequest:以要求形式提交的搜尋要求大小上限為 HTTP GET 8190 位元組。

  • 面向參數:您可以傳回的面向值最大數量為 10,000 個。

  • 大小參數:可以包含落在 0 到 10000 範圍內的值。大小和啟動參數的總和不得超過 10,000 個。如果需要翻頁瀏覽超過 10,000 個命中項目,請使用游標。

  • 排序參數:可以包含最多 10 個 int 欄位和運算式。

  • 啟動參數:可以包含落在 0 到 10000 範圍內的值。大小和啟動參數的總和不得超過 10,000 個。如果需要翻頁瀏覽超過 10,000 個命中項目,請使用游標。

建議者
  • 您可以為網域定義最多 10 個建議者。

  • 只有文字欄位的前 512 個位元組將用於產生建議。

  • 分數會從建議者的 SortExpression 加以計算並捨入到最接近的整數,下限為 0 且上限為 2^31-1。

同義詞字典大小 Amazon CloudSearch 同義詞詞典的最大大小為 100 KB。