本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
檢視 CloudWatch RUM 儀表板
CloudWatch RUM 透過互動式儀表板收集和視覺化使用者工作階段的應用程式效能資料。透過擷取載入時間、Apdex 分數、裝置資訊、地理位置和錯誤模式,團隊可以快速識別效能瓶頸、根據實際使用者影響排定修正的優先順序,並確保不同瀏覽器、裝置和地理區域的最佳體驗,協助組織更加了解使用者行為,進而減少最終使用者沮喪並改善應用程式可靠性。
CloudWatch RUM 入門
透過 https://console.aws.amazon.com/cloudwatch/
開啟 CloudWatch 主控台。 -
在導覽窗格中,選擇 Application Signals (APM), RUM。
RUM 主控台會顯示概觀頁面,提供所有應用程式監控、運作狀態和關鍵操作指標的合併檢視。在概觀頁面中,選取應用程式監視器,以使用效能、錯誤、工作階段、指標和組態索引標籤存取詳細檢視。
概觀
概觀頁面是 CloudWatch RUM 主控台的登陸頁面。它提供所有應用程式監視器的高階摘要,協助您快速評估受監控應用程式的運作狀態、效能趨勢和營運涵蓋範圍。
摘要卡
在概觀頁面頂端,四個摘要卡提供所有應用程式監視器的at-a-glance狀態:
-
需要注意 (依運作狀態) — 顯示有多少個應用程式監視器需要注意,依嚴重和降級計數細分。進度列表示需要注意的監視器比例。
-
趨勢變差 — 顯示有多少應用程式監視器在總數中具有惡化趨勢。
-
設定和涵蓋範圍 — 顯示有多少應用程式監視器未設定 SLOs以及有多少應用程式監視器已停用追蹤,協助您識別監控設定中的差距。
-
SLOs和警示 — 顯示總 SLIs 中違反SLIs 數量,以及目前觸發的警示數量。
快速篩選條件
左側面板提供快速篩選條件,透過下列方式縮小應用程式清單範圍:
-
平台 — Web、iOS 或 Android。
-
運作狀態 — 運作狀態良好、嚴重、降級或無資料。
-
SLI 狀態 — 運作狀態良好、運作狀態不佳或無 SLOs。
-
追蹤 — 啟用或停用。
-
趨勢 — 惡化、改善或穩定。
-
主要問題 — 依影響應用程式監控的主要問題類型進行篩選。
選擇清除篩選條件以重設所有篩選條件。
應用程式監視器資料表
App Monitors 資料表會列出具有下列資料欄的所有應用程式監控:
-
名稱 — 應用程式監視器的名稱,具有平台圖示 (Web、iOS 或 Android)。
-
工作階段 — 在所選時間範圍中記錄的工作階段數量,以長條圖視覺化顯示。
-
SLI 狀態 — 服務層級指標的狀態。顯示運作狀態不佳的 SLIs計數 (例如 "1/2 Unhealthy"),如果未設定 SLO,則顯示建立 SLOs連結。
-
運作狀態 — 應用程式的運作狀態:運作狀態、關鍵狀態、降級狀態或無資料。
-
檢視洞見 — 選擇此連結以開啟應用程式監視器的診斷側邊面板 (請參閱 診斷側邊面板)。
-
主要問題 — 影響應用程式的主要問題類型。對於 Web 應用程式監控,值包括 JS 錯誤、Perf 或 HTTP 錯誤/故障。對於行動應用程式監控,值包括 Crashes、ANRs/App Hangs、Perf 或 HTTP 錯誤/故障。
-
趨勢 — 趨勢方向和幅度的描述 (例如,「JS 錯誤 +1% 較差的工作階段」或「Perf +81% 較差的工作階段」)。
-
追蹤 — 啟用追蹤時的檢視追蹤連結,否則為啟用追蹤連結。
-
服務 — 連結服務的 SLI 運作狀態 (例如 "1/1 Unhealthy"),如果未連結任何服務,則為破折號。
-
上次收到事件 — 自上次收到遙測事件以來的時間 (例如,「1 分鐘前」或「過去 4 週內未收到事件」)。
使用資料表上方的搜尋列,依名稱尋找特定的應用程式監視器。您可以按一下資料欄標頭來排序資料表,並使用齒輪圖示來自訂哪些資料欄可見。動作下拉式清單和新增應用程式監控按鈕可讓您直接從此頁面管理應用程式監控。
運作狀態
運作狀態欄會根據相對於所選時間範圍內工作階段總數的影響工作階段百分比,提供每個應用程式操作狀態的at-a-glance,包括發生錯誤或頁面載入緩慢的工作階段。
每個應用程式監視器會顯示下列其中一個狀態:
| 狀態 | 受影響的工作階段 | Description |
|---|---|---|
| 運作狀態良好 | 低於 1% | 應用程式正在正常參數內操作。 |
| 降級 | 介於 1% 到 5% 之間 | 應用程式正在經歷可能需要注意的錯誤率提高或效能降低。 |
| 嚴重 | 超過 5% | 應用程式遇到需要立即調查的重大錯誤或效能問題。 |
| 沒有資料 | — | 資料不足,無法判斷應用程式的運作狀態。當應用程式監視器尚未收到最近的遙測資料時,就會發生這種情況。 |
診斷側邊面板
當您在資料表中選擇應用程式監視器的檢視洞見時,診斷側邊面板會在頁面右側開啟。面板會顯示應用程式監控名稱,並提供兩個索引標籤:
運作狀態索引標籤:顯示導致運作狀態的錯誤明細 (例如,JS 錯誤、HTTP 錯誤 (4xx) 和 HTTP 錯誤 (5xx)),以及顏色編碼指標。指標區段會顯示互動式時間序列圖形。按一下圖形中的某個點,以檢視相關工作階段。
對於 Web 應用程式監控,會顯示下列圖形:
-
頁面檢視 — 一段時間內的頁面檢視計數。
-
頁面載入時間 (p75) — 以秒為單位的第 75 個百分位數頁面載入時間。
-
JS 錯誤 — 一段時間內的 JavaScript 錯誤工作階段計數。
-
HTTP 錯誤 — 一段時間內的 HTTP 4xx 錯誤和 5xx 錯誤計數。
對於行動應用程式監視器 (Android 和 iOS),會顯示下列圖形:
-
畫面載入時間 — 畫面載入時間隨時間的變化。
-
畫面載入 — 一段時間內的畫面載入計數。
-
損毀 — 一段時間內的損毀工作階段計數。
-
App Hangs/ANRs — 一段時間內的 App Hang (iOS) 或 ANR (Android) 工作階段計數。
-
HTTP 錯誤 — 一段時間內的 HTTP 4xx 錯誤和 5xx 錯誤計數。
在指標下方,面板也會顯示:
-
違反 SLOs — 列出處於違反狀態之任何 SLOs資料表,其中包含 SLO 詳細資訊的連結。
-
處於 ALARM 狀態的警示 — 列出應用程式監視器目前觸發的任何警示的資料表。
相關工作階段索引標籤 — 顯示與指標圖表中所選資料點相關的工作階段。
Web 應用程式儀表板
選取 Web 應用程式監視器時,您會看到下列索引標籤:
-
效能索引標籤會顯示頁面效能資訊,包括載入時間、請求資訊、Web 關鍵數值,以及一段時間內的頁面載入。在此索引標籤上,您也可以切換頁面載入、資源和位置之間的檢視,以查看頁面效能的詳細資訊。
Page Loads 檢視具有互動式 Web vitals 圖形,您可以在其中查看頁面中核心 Web vitals 的不同百分位數值,並在圖形上選擇資料點,以檢視 CloudWatch RUM 擷取的相關工作階段。從那裡,您可以使用診斷資料表中的其中一個連結導覽至工作階段索引標籤,以識別導致效能問題的特定條件。標籤也具有應用程式效能索引 (Apdex) 分數,表示最終使用者的滿意度。分數範圍從 0 (最不滿意) 到 1 (最滿意)。分數僅根據應用程式效能而定。如需 Apdex 分數的詳細資訊,請參閱 CloudWatch RUM 如何設定 Apdex 分數。底部的資料表根據頁面 ID 列出前 100 個頁面載入時間。 您可以在資料表標頭旁的下拉式清單中變更此屬性。
同樣地,資源檢視會顯示資源請求時間和依資源類型計數。位置檢視具有互動式地圖,可讓您深入查看更精細的檢視,並調查特定區域中的效能問題。
右側的診斷面板也有瀏覽器和裝置索引標籤,顯示造成效能問題的前 5 個瀏覽器/裝置。您可以按一下長條圖以導覽至工作階段索引標籤,進一步調查問題。
-
JS 錯誤索引標籤會在摘要元件中顯示 JavaScript 錯誤計數和速率,以及具有最多錯誤的瀏覽器和裝置。此索引標籤包含圖表,顯示具有 JS 錯誤的工作階段數量和失敗率。您可以按一下圖表中的任何資料點,在診斷面板中檢視相關工作階段。底部的資料表列出前 100 個 JS 錯誤。資料表中的錯誤計數連結可用來導覽至工作階段索引標籤,您可以在其中檢視相關工作階段。
-
Http 請求索引標籤會在頂端的 HTTP 請求摘要中顯示 HTTP 請求磁碟區和錯誤資訊。此標籤包含具有 HTTP 錯誤、HTTP 故障和網路故障的圖表。您可以按一下圖表中的任何資料點,在診斷面板中檢視相關工作階段。底部的資料表列出有問題的前 100 個網路路由。如果您展開其中一個資料列,您可以看到該 URL 的熱門錯誤訊息。資料表中的錯誤計數連結可用來導覽至工作階段索引標籤,您可以在其中檢視相關工作階段。
-
工作階段索引標籤會顯示資料表,以遞減時間順序列出所有工作階段。在底部,瀑布視覺化會顯示所選工作階段的所有遙測,協助您追蹤使用者互動並識別效能問題。您可以按一下錯誤欄中的錯誤連結,篩選特定錯誤事件的瀑布圖。您可以選擇瀑布中的每一列,以開啟診斷面板,您可以在其中檢視原始事件。
對於 HTTP 請求,如果您已啟用追蹤,您會看到 HTTP 和 Xray 事件的 traceId,連結至 Traces 主控台。對於 JS 錯誤或 HTTP 錯誤事件等事件,診斷面板包含具有堆疊追蹤的例外狀況索引標籤。瀑布中的檢視按鈕可讓您快速存取此資訊。
-
User Journey (使用者旅程) 索引標籤會顯示客戶用來導覽應用程式的路徑。您可以看到客戶在何處進入您的應用程式,以及他們退出應用程式的頁面。您也可以查看他們選用的路徑,以及遵循這些路徑的客戶百分比。您可以在節點上暫停,以取得有關該頁面的更多詳細資訊。您可以選擇單一路徑來反白顯示連線,以便於檢視。根據預設,此頁面會顯示直到第 2 次互動的使用者旅程。您可以按一下新增路徑按鈕來檢視進一步的互動。
-
指標索引標籤會顯示應用程式監視器發佈的所有預設 CloudWatch 指標,包括效能 Web 關鍵指標、錯誤指標 (JavaScript 錯誤、HTTP 錯誤/故障)、磁碟區、使用者流程和 apdex 指標。如果您為應用程式建立延伸指標,標籤也會在延伸指標區段中包含這些指標的子集。此子集包含 PageViewCount、PerformanceNavigationDuration、Http4xxCount、Http5xxCount 和 JsErrorCount 類型的指標。儀表板會顯示每種指標類型的三種指標變化。由於這些是 CloudWatch 指標,您也可以使用新增至儀表板選項將此標籤匯出至您自己的儀表板,並加以更新以包含更多指標。
(選用) 在前五個索引標籤的任何一個上,您可以使用頂部的篩選條件列,根據使用者 ID、工作階段 ID 和其他事件特定篩選條件來篩選資料。您也可以使用左側的快速篩選面板,篩選頁面 IDs、頁面群組、裝置、瀏覽器、位置等屬性子集。您可以使用儲存篩選條件選項儲存這些篩選條件,也可以使用篩選條件列旁的選取篩選條件下拉式清單重複使用。
行動應用程式儀表板
選取行動應用程式監視器時,您會看到下列索引標籤:
-
效能索引標籤可讓您深入了解行動應用程式的效能,包括螢幕載入時間、應用程式啟動時間 (冷和暖)、效能指標,以及一段時間內的 Apdex 分數。詳細檢視會依畫面名稱、作業系統版本、應用程式版本、裝置和國家/地區細分效能。按一下圖表中的畫面載入時間、應用程式啟動時間或位置資料點,將開啟右側的診斷面板,提供與資料點相關的進一步洞見,其中包含最新的相關工作階段和工作階段索引標籤的連結,以進行故障診斷。
在此索引標籤上,您也可以在畫面載入、應用程式啟動和位置之間切換檢視,以查看應用程式效能的詳細資訊。
標籤也具有應用程式效能索引 (Apdex) 分數,表示最終使用者的滿意度。分數範圍從 0 (最不滿意) 到 1 (最滿意)。分數僅根據應用程式效能而定。如需 Apdex 分數的詳細資訊,請參閱 CloudWatch RUM 如何設定 Apdex 分數。
-
Errors 索引標籤將應用程式問題分為三個類別:Network Errors、Crashes 和 ANRs (Android)/App Hangs (iOS)。Network Errors 索引標籤具有折線圖,顯示網路延遲、用戶端錯誤 (4xx 狀態碼) 和伺服器錯誤 (5xx 狀態碼)。按一下圖表中任一行的資料點將開啟診斷面板。下表列出 100 個最常見的網路路由。按一下選項按鈕會依選取的網路路由篩選折線圖。
同樣地,Crashes 和 ANRs/App Hangs 索引標籤會顯示每個錯誤計數的行序列,而且這些都是難處理的。下表顯示最常見的頂端當機訊息或 ANR/App Hang 堆疊追蹤。按一下選項按鈕會篩選圖表,而按一下錯誤訊息會顯示完整的堆疊追蹤。
-
工作階段索引標籤會顯示資料表,以遞減時間順序列出所有工作階段。在底部,瀑布視覺化會顯示所選工作階段的所有遙測,協助您追蹤使用者互動並識別效能問題。可以選擇瀑布中的每一列來開啟診斷面板。對於 HTTP 請求,您會看到連結至 Traces 主控台的 traceId。
對於具有非 2xx 狀態碼、當機或 ANRs(Android)/App Hangs (iOS) 的 HTTP 請求,診斷面板包含具有堆疊追蹤的例外標籤。瀑布中的檢視按鈕可讓您快速存取此資訊。
-
指標索引標籤會顯示應用程式監視器發佈的所有預設 CloudWatch 指標,包括效能指標 (畫面載入時間、冷應用程式啟動時間)、錯誤指標 (當機、ANRsApp Hangs、HTTP 錯誤/故障)、磁碟區和 apdex 指標。如果您為應用程式建立延伸指標,標籤也會在延伸指標區段中包含這些指標的子集。此子集包含 ScreenLoadTime、ScreenLoadCount、CrashCount、Http4xxCount、Http5xxCount、ANRCount/AppHangCount、ColdLaunchTime 和 WarmLaunchTime 類型的指標。儀表板會顯示每種指標類型的三種指標變化。由於這些是 CloudWatch 指標,您也可以使用新增至儀表板選項將此標籤匯出至您自己的儀表板,並更新以包含更多指標。
-
組態索引標籤可讓您存取應用程式監視器的一般設定和組態詳細資訊。您也可以存取程式碼片段索引標籤,其中包含使用 ADOT SDK 檢測行動應用程式的指示,包括手動和零碼檢測選項。
CloudWatch RUM 如何設定 Apdex 分數
Apdex (應用程式效能指標) 是一項開放的標準,其定義了一種報告、基準化分析和評估應用程式回應時間的方法。Apdex 分數可協助您了解並識別隨時間推移對應用程式效能的影響。
Apdex 分數表示最終使用者的滿意度。分數範圍從 0 (最不滿意) 到 1 (最滿意)。分數僅根據應用程式效能而定。不會要求使用者對應用程式進行評分。
每個個別 Apdex 分數分屬於三種閾值之一。根據 Apdex 閾值和實際應用程式回應時間,有三種效能類型,如下所示:
-
滿意 - 實際應用程式回應時間小於或等於 Apdex 閾值。對於 CloudWatch RUM 而言,此閾值為 2000 毫秒或更少。
-
可容忍 - 實際應用程式回應時間大於 Apdex 閾值,但小於或等於 Apdex 閾值的四倍。對於 CloudWatch RUM,此範圍為 2000 – 8000 毫秒。
-
令人沮喪:實際應用程式回應時間大於 Apdex 閾值的四倍。對於 CloudWatch RUM,此範圍大於 8000 毫秒。
總計 0-1 Apdex 分數是使用以下公式來計算:
(positive scores + tolerable scores/2)/total scores * 100