本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Managed Service for Prometheus Service Quotas
以下兩節說明與 Amazon Managed Service for Prometheus 相關的配額和限制。
Service Quotas
Amazon Managed Service for Prometheus 具有以下配額。Amazon Managed Service for Prometheus vends CloudWatch 使用指標來監控 Prometheus 資源使用量。使用 CloudWatch 用量指標警示功能,您可以監控 Prometheus 資源和用量,以防止限制錯誤。
隨著專案和工作區的成長,您可能需要監控或請求增加的最常見配額為:每個工作區的啟用中序列、每個工作區的擷取率,以及每個工作區的擷取成組分解大小。
對於所有可調整的配額,您可透過選取可調整欄中的連結或請求增加配額
動態套用每個工作區的啟用中序列限制。如需詳細資訊,請參閱啟用中序列預設值。每個工作區的擷取速率和每個工作區的擷取爆量大小共同控制了您可以將資料擷取到工作區的速度。如需詳細資訊,請參閱 擷取限流。
注意
除非另有說明,否則這些配額是每個工作區。
名稱 | 預設 | 可調整 | 描述 |
---|---|---|---|
每個工作區含中繼資料的啟用中指標 | 每個受支援的區域:20,000 | 否 | 每個工作區具有中繼資料的唯一啟用中指標數量。注意:如果達到限制,則會記錄指標範例,但會捨棄超過限制的中繼資料。 |
每個工作區的啟用中序列 | 每個受支援的區域:每 2 小時 10,000,000 | 是 |
每個工作區的唯一啟用中序列數量。如果在過去 2 小時內呈報範例,則該序列為啟用中。容量從 2M 到 10M 是根據最後 30 分鐘的使用量自動調整。 |
警示管理員定義檔案中的警示彙總群組大小 | 每個受支援的區域:1,000 | 是 |
警示管理員定義檔案中警示彙總群組的大小上限。group_by 的每個標籤值組合都會建立彙總群組。 |
警示管理員定義檔案大小 | 每個受支援的區域:1 MB | 否 | 警示管理員定義檔案的大小上限。 |
Alert Manager 中的警示承載大小 | 每個受支援的區域:20 MB | 否 | 每個工作區所有 Alert Manager 警示的最大警示承載大小。警示大小取決於標籤和註釋。 |
Alert Manager 中的警示 | 每個受支援的區域:1,000 | 是 |
每個工作區的並行警示管理員警示數目上限。 |
HA 追蹤器叢集 | 每個受支援的區域:500 | 否 | HA 追蹤器會追蹤每個工作區擷取樣本的叢集數量上限。 |
擷取每個工作區成組分解大小 | 每個受支援的區域:1,000,000 | 是 |
每個工作區每秒一次突發可擷取的最大範例數量。 |
每個工作區的擷取速率 | 每個受支援的區域:170,000 | 是 |
每個工作區每秒的指標範例擷取率。 |
警示管理員定義檔案中的抑制規則 | 每個受支援的區域:100 | 是 |
警示管理員定義檔案中抑制規則的數量上限。 |
標籤大小 | 每個受支援的區域:7 KB | 否 | 系列接受所有標籤和標籤值的最大組合大小。 |
每個公制系列的標籤 | 每個受支援的區域:70 | 是 |
每個指標序列的標籤數量。 |
中繼資料長度 | 每個受支援的區域:1 KB | 否 | 指標中繼資料可接受的最大長度。中繼資料是指指標名稱、類型、單位和說明文字。 |
每個指標的中繼資料 | 每個受支援的區域:10 | 否 | 每個指標的中繼資料數量。 |
警示管理員路由樹狀結構節點 | 每個受支援的區域:100 | 是 |
警示管理員路由樹狀結構中節點的數量上限。 |
每秒交易中每個區域的API操作數目 | 每個受支援的區域:10 | 是 |
每秒每個區域的API作業數目上限。這包括工作區 CRUD APIs、標記 APIs、規則群組命名空間 CRUD APIs和警示管理員定義 CRUD APIs。 |
每秒交易中每個工作區的 GetSeries、 GetLabels 和 GetMetricMetadata API 操作數目 | 每個受支援的區域:10 | 否 | 每個工作區每秒的 GetSeries、 GetLabels 和 GetMetricMetadata Prometheus 相容API操作數目上限。 |
每秒交易中每個工作區的操作數量 QueryMetrics API | 每個受支援的區域:300 | 否 | 每個工作區每秒與 QueryMetrics Prometheus 相容的API操作數目上限。 |
每秒交易中每個工作區的操作數量 RemoteWrite API | 每個受支援的區域:3,000 個 | 否 | 每個工作區每秒與 RemoteWrite Prometheus 相容的API操作數目上限。 |
交易中每個工作區每秒的其他 Prometheus 相容API操作數目 | 每個受支援的區域:100 | 否 | 所有其他與 Prometheus 相容的工作區每秒最大API操作數 ListAlerts,APIs包括 ListRules、 等。 |
查詢位元組以進行即時查詢 | 所有受支援的區域:5 GB | 否 | 750MB 可以透過單一即時查詢進行掃描。 |
範圍查詢的查詢位元組 | 所有受支援的區域:5 GB | 否 | 在單一範圍查詢中,每 24 小時間隔可掃描的最大位元組數。 |
擷取的查詢區塊 | 每個受支援的區域:20,000,000 | 否 | 單一查詢期間可掃描的區塊的最大數量。 |
範例查詢 | 每個受支援的區域:50,000,000 | 否 | 單一查詢期間可掃描的最大範例數量。 |
查詢序列擷取 | 每個受支援的區域:12,000,000 | 否 | 單一查詢期間可掃描的最大序列數量。 |
查詢時間範圍 (天) | 每個受支援的區域:32 | 否 | QueryMetrics GetSeries、 和 的最大時間範圍 GetLabels APIs。 |
請求規模 | 每個受支援的區域:1 MB | 否 | 擷取或查詢的請求大小上限。 |
擷取資料的保留時間 (天) | 每個受支援的區域:150 | 是 |
工作區內資料保留的天數。系統會刪除超過此值的資料。您可以請求配額更改以增加或減少此值。 |
規則評估間隔 | 每個受支援的區域:30 秒 | 是 |
最小規則評估間隔。 |
規則群組命名空間定義檔大小 | 每個受支援的區域:1 MB | 否 | 規則群組命名空間定義檔案的大小上限。 |
每個工作區的規則 | 每個受支援的區域:2,000 | 是 |
每個工作區的規則數量上限。 |
警示管理員定義檔案中的範本 | 每個受支援的區域:100 | 是 |
警示管理員定義檔案中的範本數量上限。 |
每個帳戶每個區域的工作 | 每個受支援的區域:25 | 是 |
每個區域的工作區的數量上限。 |
啟用中序列預設值
Amazon Managed Service for Prometheus 可讓您預設使用最多啟用中時間序列的配額。
Amazon Managed Service for Prometheus 工作區會自動調整為您的擷取量。隨著使用量增加,Amazon Managed Service for Prometheus 會將您的時間序列容量自動增加至基準使用量的兩倍,直到預設配額為止。例如,如果過去 30 分鐘的平均啟用中時間序列為 350 萬,則您最多可以使用 700 萬個時間序列,而不需進行限流。
如果您需要先前基準的兩倍以上,Amazon Managed Service for Prometheus 會隨著擷取磁碟區增加而自動分配更多容量,以協助確保您的工作負載不會經歷持續的限流,直到到達您的配額為止。但是,如果過去 30 分鐘超過先前基準的兩倍以上,還是會出現限流情況。為避免限流,Amazon Managed Service for Prometheus 建議在增加到先前啟用中時間序列的兩倍以上時,逐漸增加擷取。
注意
啟用中時間序列的最小容量為 2 百萬,若您的序列小於 200 萬個,則不會出現限流。
若要超過預設配額,您可請求增加配額。
擷取限流
根據您目前的限制,Amazon Managed Service for Prometheus 會擷取每個工作區的限流。這有助於維持工作區的效能。如果您超過限制,您會在 CloudWatch 指標DiscardedSamples
中看到 (包含rate_limited
原因)。您可以使用 Amazon CloudWatch 來監控擷取,並建立警示,在接近限流限制時提醒您。如需詳細資訊,請參閱使用 CloudWatch 指標監控 Amazon Managed Service for Prometheus 資源。
Amazon Managed Service for Prometheus 使用權杖儲存貯體演算法
擷取的每個資料範例都會從儲存貯體中移除一個權杖。如果您的儲存貯體大小 (每個工作區的擷取爆量大小) 為 1,000,000,則您的工作區可以在一秒內擷取一百萬個資料範例。如果要擷取的樣本超過 100 萬個,則會受到限制,且不會再擷取任何記錄。其他資料樣本將被捨棄。
儲存貯體會自動以設定的速率重新填充。如果儲存貯體低於其最大容量,則每秒會新增一組字符數量,直到達到其最大容量為止。如果補充權杖到達時儲存貯體已滿,則會將其捨棄。儲存貯體無法容納超過其權杖數量上限。範例擷取的補充速率由每個工作區限制的擷取速率設定。如果每個工作區的擷取速率設定為 170,000,則儲存貯體的補充速率為每秒 170,000 個字符。
如果您的工作區每秒擷取 1,000,000 個資料範例,您的儲存貯體會立即減少為零權杖。然後,儲存貯體每秒會重新填充 170,000 個字符,直到達到 1,000,000 個字符的最大容量為止。如果不再擷取,則先前清空的儲存貯體會在 6 秒內返回其最大容量。
注意
擷取會在批次請求中發生。如果您有 100 個權杖可用,並傳送具有 101 個範例的請求,則整個請求會遭到拒絕。Amazon Managed Service for Prometheus 不接受部分請求。如果您要寫入收集器,您可以管理重試 (批次較小或經過一段時間後)。
您不需要等到儲存貯體已滿,工作區才能擷取更多資料範例。您可以在權杖新增至儲存貯體時使用權杖。如果您立即使用補充權杖,則儲存貯體不會達到其最大容量。例如,如果您耗盡儲存貯體,您可以繼續每秒擷取 170,000 個資料範例。只有在每秒擷取少於 170,000 個資料樣本時,儲存貯體才能重新填充至最大容量。
對擷取資料的其他限制
針對擷取到工作區的資料,Amazon Managed Service for Prometheus 也有下列額外要求。這些不可調整。
-
拒絕擷取超過 1 小時的指標範例。
-
每個範例和中繼資料都必須有指標名稱。