本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
OPS04-BP02 實作應用程式遙測
應用程式遙測是工作負載可觀測性的基礎。發出遙測至關重要,它為您的應用程式狀態以及技術和業務成果的實現提供了可行洞見。從疑難排解到測量新功能的影響,或確保與業務金鑰效能指標 (KPIs) 保持一致,應用程式遙測會告知您建置、操作和發展工作負載的方式。
指標、日誌和追蹤構成了可觀測性的三個主要支柱。其可作為描述應用程式狀態的診斷工具。隨著時間的推移,它們有助於建立基準並識別異常。不過,為了確保監控活動與業務目標之間的一致性,定義和監控 至關重要KPIs。與技術指標相比,企業KPIs通常更容易識別問題。
其他遙測類型,例如真實使用者監控 (RUM) 和合成交易,可補充這些主要資料來源。RUM 提供即時使用者互動的洞見,而合成交易模擬潛在的使用者行為,有助於在實際使用者遇到瓶頸之前進行偵測。
預期成果:獲得工作負載效能且可付諸行動的洞見。這些洞見可讓您做出有關效能最佳化的主動決策、提高工作負載穩定性、使 CI/CD 程序更順暢,並且有效利用資源。
常見的反模式:
-
不完整的可觀測性:忽略在工作負載的每一層納入可觀測性,導致出現可能遮蔽重要系統效能和行為洞見的盲點。
-
分散的資料檢視:當資料分散在多個工具和系統中時,便難以提供涵蓋工作負載運作狀況和效能的全面概覽。
-
使用者報告問題:缺乏透過遙測和業務KPI監控主動偵測問題的跡象。
建立此最佳實務的優勢:
-
知情決策:透過遙測和業務的洞察KPIs,您可以做出資料驅動的決策。
-
改善運作效率:資料驅動的資源利用率可帶來成本效益。
-
提高工作負載穩定性:更快偵測並解決問題,進而改善正常運作。
-
更順暢的 CI/CD 程序:從遙測資料獲得的洞見,有助於改進程序並交付可靠的程式碼。
未建立此最佳實務時的曝險等級:高
實作指引
若要為工作負載實作應用程式遙測,請使用 AWS Amazon CloudWatch
實作步驟
-
確定要收集的資料:確定可提供工作負載運作狀況、效能和行為實質洞見的重要指標、日誌和追蹤。
-
部署CloudWatch代理程式
:代理 CloudWatch 程式對於從您的工作負載及其基礎基礎設施中取得系統和應用程式指標和日誌至關重要。 CloudWatch 代理程式也可以用來收集 OpenTelemetry 或 X-Ray 追蹤,並將其傳送至 X-Ray。 -
實作日誌和指標的異常偵測:使用CloudWatch 日誌異常偵測和CloudWatch指標異常偵測,自動識別應用程式操作中的異常活動。這些工具使用機器學習演算法來偵測異常並發出提醒,進而提升監控能力,並加快對潛在中斷或安全威脅的回應時間。設定這些功能以主動管理應用程式運作狀態和安全性。
-
安全敏感日誌資料:使用 Amazon CloudWatch Logs 資料保護來遮罩日誌中的敏感資訊。此功能可在存取敏感資料前進行自動偵測和遮罩,從而有助於維護隱私權與合規性。實作資料遮罩,以安全地處理和保護敏感詳細資訊,例如個人識別資訊 (PII)。
-
使用 來測試您的應用程式 AWS X-Ray:除了部署 CloudWatch代理程式之外,測試應用程式以發出追蹤資料也很重要。此程序可提供工作負載行為和效能的進一步洞見。
-
將整個應用程式的資料收集標準化:將整個應用程式的資料收集實務標準化。採取一致的方式有助於找出資料關聯並進行分析,進而提供應用程式行為的全面概覽。
-
實作跨帳戶可觀測性: AWS 帳戶 使用 Amazon CloudWatch 跨帳戶可觀測性增強跨多個 的監控效率。使用此功能,您可以將不同帳戶的指標、日誌和警示合併為單一檢視,可簡化管理並改善組織 AWS 環境中已識別問題的回應時間。
-
分析資料並採取行動:資料收集和標準化完成後,請使用 Amazon CloudWatch
進行指標和日誌分析,以及AWS X-Ray 追蹤分析。這類分析可產生有關工作負載運作狀況、效能和行為的洞見,進而引導您進行決策。
實作計劃的工作量:高
資源
相關的最佳實務:
相關文件:
相關影片:
相關範例: