CloudWatch 統計定義 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CloudWatch 統計定義

統計資料是隨著指定期間的指標資料彙總。繪製或擷取指標的統計資料時,請指定時間期間,例如五分鐘,以用來計算每個統計值。例如,如果期間是五分鐘,總和是五分鐘期間收集的所有樣本值的總和,而最小值是在五分鐘期間收集的最小值。

CloudWatch 支援下列測量結果統計資料。

  • SampleCount是期間內資料點的數量。

  • Sum (總和) 是指在該期間收集的所有資料點的值總和。

  • 平均值是指定期間的 Sum/SampleCount

  • 最小值是在指定期間內觀察到的最低值。

  • 最大值是在指定期間內觀察到的最高值。

  • 百分位數 (p) 會指出資料集中相關準備好的值。例如,p95 是第 95 個百分位數,亦表示 95% 的資料是低於此值且 5% 資料高於這個值。百分位數協助您更加了解您指標資料的分佈。

  • 裁剪平均值 (TM) 是兩個指定邊界之間的所有值的平均值。計算平均值時,會忽略邊界以外的值。您可以將邊界定義為介於 0 到 100 之間的一個或兩個數字,最多可達 10 位小數位數。這些數字可以是絕對值或百分比。例如:tm90 會在移除具有最高值的 10% 資料點後計算平均值。TM(2%:98%) 會計算移除 2% 最低資料點和 2% 最高資料點後的平均值。TM(150:1000) 會在移除所有低於或等於 150 或高於 1000 的資料點後計算平均值。

  • 四分位數平均值 (IQM)四分位間範圍的修剪平均值,或值的中間 50%。它等於 TM(25%:75%)

  • 縮尾均值 (WM) 類似於裁剪平均值。但是,對於縮尾均值,不會忽略邊界外的值,而是會將其視為等於適當邊界邊緣的值。在此正規化之後,即會計算平均值。您可以將邊界定義為介於 0 到 100 之間的一個或兩個數字,最多可達 10 位小數位數。例如:wm98 會計算平均值,同時將最高值的 2% 處理為等於 98 個百分位數的值。WM(10%:90%) 會計算平均值,同時將最高 10% 的資料點視為 90% 界限的值,並將最低 10% 的資料點視為 10% 界限的值。

  • 百分位數排名 (PR)是符合固定閾值的百分比。例如,PR(:300) 會傳回值為 300 或以下的資料點百分比。PR(100:2000) 會傳回值介於 100 到 2000 之間的資料點百分比。

    百分位數排名在下界上是排斥的,並且在上界包容性。

  • 裁剪計數 (TC) 是裁剪平均統計資料所選範圍內的資料點數目。例如,tc90 會傳回資料點數目,不包括落在最高 10% 值的任何資料點。TC(0.005:0.030) 會傳回值介於 0.005 (不含) 和 0.030 (含) 之間的資料點數目。

  • 裁剪總和 (TS) 是裁剪平均統計資料所選範圍內的資料點的值總和。它相當於 (裁剪平均值) * (裁剪計數)。例如:ts90 會傳回資料點的總和,不包括落在最高 10% 值的任何資料點。TS(80%:) 會傳回資料點的值總和,不包括值範圍最低 80% 的任何資料點。

注意

對於「裁剪平均值」、「裁剪計數」、「裁剪總和」和「縮尾均值」,如果您將兩個邊界定義為固定值而非百分比,則計算會包含等於較高邊界的值,但不包含等於下邊界的值。

語法

對於「裁剪平均值」、「裁剪計數」、「裁剪總和」和「縮尾均值」,套用下列語法規則:

  • 使用帶有百分比符號的一個或兩個數字的括號,定義要用作資料集中位於您指定的兩個百分位數之間的值的邊界。例如,TM(10%:90%) 僅使用第 10 和第 90 個百分位數之間的值。TM(:95%) 會使用從資料設定最低端到第 95 個百分位數的值,忽略具有最高值的 5% 資料點。

  • 使用含有一個或兩個數字的括號 (不含百分比符號) 可定義用作資料集中的值的邊界,且這些值位於您指定的明確值之間。例如,TC(80:500) 只會使用介於 80 (不含) 和 500 (含) 之間的值。TC(:0.5) 僅使用等於或小於 0.5 的值。

  • 使用沒有括號的數字來計算使用百分比,忽略高於指定百分位數的資料點。例如,tm99 會計算平均值,同時忽略具有最高值的 1% 資料點。其與 TM(:99%) 相同。

  • 裁剪平均值、裁剪計數、裁剪總和以及縮尾均值都可以在指定範圍時使用大寫字母縮寫,例如 TM(5%:95%)TM(100:200)TM(:95%)。當您只指定一個數字時,它們只能使用小寫字母縮寫,例如 tm99

統計資料使用案例

  • 裁剪均值對於具有較大範例大小的指標 (例如網頁延遲) 最有用。例如,tm99 忽略了網路問題或人為錯誤可能導致的極高異常值,以提供一般請求的平均延遲更準確的數字。同樣地,TM(10%:) 會忽略最低 10% 的延遲值,例如快取點擊所產生的延遲值。另外,TM(10%:99%) 不包含這兩種類型的異常值。建議您使用裁剪平均值來監視延遲。

  • 每當您使用修剪平均值時,最好密切注意裁剪計數,以確保裁剪平均值計算中使用的值數量足以在統計上顯著。

  • 百分位數排名可讓您將值放入範圍的「箱」中,而且您可以使用它來手動建立長條圖。若要執行此動作,請將值分解成各種不同的資料箱,例如 PR(:1)PR(1:5)PR(5:10)PR(10:)。將這些資料箱中的每一個以長條圖形式放入視覺效果中,並且您有一個直方圖。

    百分位數排名在下界上是排斥的,並且在上界包容性。

百分位數與裁剪平均值

百分位數 (例如 p99) 和裁剪平均值 (例如 tm99) 測量相似,但值不相同。p99tm99 均會忽略具有最高值的資料點的 1%,而這會被視為異常值。之後,p99 是剩餘 99% 的 最大值,而 tm99 是剩餘 99% 的平均值。如果您正在查看 Web 請求的延遲,p99 告訴您最糟糕的客戶體驗,忽略異常值;而 tm99 告訴您平均客戶體驗,忽略異常值。

裁剪平均值是一個不錯的延遲統計數字,如果您想要最佳化您的客戶體驗。

使用百分位數、裁剪平均值和一些其他統計數字的需求

CloudWatch 需要原始資料點來計算以下統計資料:

  • 百分位數

  • 裁剪平均值

  • 四分位平均值

  • 縮尾均值

  • 裁剪的總和

  • 裁剪

  • 百分位數排名

如果您使用統計數字集而非原始資料的統計數字來為自訂統計數字發佈資料,只有在以下條件之一為 true 時,您才能擷取此資料的這些統計數字類型:

  • 統計資料集的 SampleCount 值為 1,而最小值、最大值和總和都是相等的。

  • 最小值和最大值相等,並且總和等於最小乘以 SampleCount。

下列 AWS 服務包含支援這些統計資料類型的測量結果。

  • API 閘道

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

此外,當任何指標值為負數時,這些統計數字類型不適用於指標。