監控 Amazon ECS - Amazon Elastic Container Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 Amazon ECS

監控是維護 Amazon ECS 和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點故障時更輕鬆地進行偵錯。開始監控 Amazon ECS 之前,請建立監控計畫,其中包含下列問題的答案:

  • 監控目標是什麼?

  • 要監控哪些資源?

  • 監控這些資源的頻率為何?

  • 要使用哪些監控工具?

  • 誰將執行監控任務?

  • 發生問題時應該通知誰?

提供的指標依據叢集中的任務與服務的啟動類型而定。如果您使用服務的 Fargate 啟動類型,則會提供 CPU 和記憶體使用率指標,以協助監控您的服務。對於 Amazon EC2 啟動類型,您擁有並需要監控建立基礎基礎設施的 EC2 執行個體。叢集、服務和任務提供其他 CPU 和記憶體保留和使用率指標。

下一步是建立您環境中正常 Amazon ECS 效能的基準,方法是測量不同時間和不同負載條件下的效能。當您監控 Amazon ECS 時,請儲存歷史監控資料,以便與目前的效能資料進行比較、識別正常效能模式和效能異常,以及設計解決問題的方法。

若要建立基準,您至少必須監控下列項目:

  • Amazon ECS 叢集的 CPU 和記憶體保留和使用率指標

  • Amazon CPU 服務的 ECS 和記憶體使用率指標

    如需詳細資訊,請參閱檢視 Amazon ECS 指標