OPS08-BP03 分析工作負載追蹤 - 卓越運作支柱

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

OPS08-BP03 分析工作負載追蹤

分析追蹤資料對於實現應用程式營運歷程的全面檢視至關重要。透過視覺化和了解各種不同元件之間的互動,就能微調效能、找出瓶頸,並且增強使用者體驗。

預期成果:清楚掌握應用程式的分散式操作,就能更快解決問題並增強使用者體驗。

常見的反模式:

  • 忽略追蹤資料,只依賴日誌和指標。

  • 不會將追蹤資料與相關日誌建立關聯。

  • 忽略從追蹤產生的指標,如延遲和故障率。

建立此最佳實務的優勢:

  • 改善故障診斷並減少解決的平均時間 (MTTR)。

  • 深入了解依賴性及其影響。

  • 快速識別和糾正效能問題。

  • 利用追蹤衍生的指標制定明智的決策。

  • 透過最佳化元件互動改善使用者體驗。

未建立此最佳實務時的曝險等級:

實作指引

AWS X-Ray 提供了全方位的追蹤資料分析套件,能讓您深入了解服務互動的各個層面、監控使用者活動,以及偵測效能問題。 ServiceLens、X-Ray Insights、X-Ray Analytics 和 Amazon DevOpsGuru 等功能可增強從追蹤資料衍生的可操作洞察深度。

實作步驟

下列步驟提供結構化方法,可有效使用 AWS 服務實作追蹤資料分析:

  1. 整合 AWS X-Ray:確保 X-Ray 與您的應用程式整合,以擷取追蹤資料。

  2. 分析 X-Ray 指標:深入研究 X-Ray 追蹤衍生的指標,例如延遲、請求率、錯誤率和回應時間分佈,使用服務地圖來監控應用程式運作狀態。

  3. 使用 ServiceLens:利用ServiceLens地圖增強服務和應用程式的可觀測性。如此就能將追蹤、指標、日誌、警報和其他運作狀況資訊整合在一起檢視。

  4. 啟用 X-Ray Insights

    1. 開啟 X-Ray Insights,以自動偵測追蹤中的異常。

    2. 檢查洞見以找出明確的模式並確定根本原因,例如故障率或延遲增加。

    3. 請參考 Insights 時間軸,依時間順序查看所偵測到問題的分析。

  5. 使用 X-Ray AnalyticsX-Ray Analytics 可讓您徹底探索追蹤資料、精確定位模式並擷取洞見。

  6. 使用 X-Ray 中的群組:在 X-Ray 中建立群組,即可根據如高延遲等條件篩選追蹤,以進行更針對性的分析。

  7. 合併 Amazon DevOpsGuru :讓 Amazon DevOpsGuru 受益於機器學習模型,以找出追蹤中的操作異常。

  8. 使用 CloudWatch Synthetics :使用 CloudWatch Synthetics 建立 Canary,以持續監控您的端點和工作流程。這些 Canary 可與 X-Ray 整合,以提供追蹤資料,用來對要測試的應用程式進行深入分析。

  9. 使用實際使用者監控 (RUM):使用 AWS X-Ray 和 CloudWatch RUM,您可以從應用程式的最終使用者開始透過下游 AWS 受管服務分析和偵錯請求路徑。這樣做有助於找出影響最終使用者的延遲趨勢和錯誤。

  10. 與日誌建立關聯:將追蹤資料與 X-Ray 追蹤檢視中的相關日誌建立關聯,以深入了解應用程式行為。如此可讓您檢視與追蹤的交易直接相關的日誌事件。

  11. 實作CloudWatch跨帳戶可觀測性 監控和疑難排解跨區域內多個帳戶的應用程式。

實作計劃的工作量:

資源

相關的最佳實務:

相關文件:

相關影片:

相關範例: