AWS Systems Manager のモニタリング
モニタリングは、AWS Systems Manager と AWS ソリューションの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。マルチポイント障害が発生した場合は、その障害をデバッグできるように、AWS ソリューションのすべての部分からモニタリングデータを収集する必要があります。ただし、Systems Manager のモニタリングを開始する前に、以下の質問に対する回答を反映したモニタリング計画を作成する必要があります。
-
どのような目的でモニタリングしますか?
-
どのリソースをモニタリングしますか?
-
どのくらいの頻度でこれらのリソースをモニタリングしますか?
-
使用するモニタリングツールは?
-
誰がモニタリングタスクを実行しますか?
-
問題が発生したときに誰が通知を受け取りますか?
モニタリングの目的を定義し、モニタリングの計画を作成したら、次のステップとして、お客様の環境内で通常の Systems Manager パフォーマンスのベースラインを確立します。さまざまな時間帯に、さまざまな負荷条件で Systems Manager パフォーマンスを測定します。Systems Manager をモニタリングしながら、収集したモニタリングデータの履歴を保存する必要があります。現在の Systems Manager パフォーマンスをこの履歴データと比較して、通常のパフォーマンスパターンとパフォーマンス異常を識別することで、異常への対処方法を作成することが容易になります。
たとえば、オートメーションワークフロー、パッチベースラインの適用、メンテナンスウィンドウイベント、および設定のコンプライアンスなどのオペレーションの成功または失敗をモニタリングできます。オートメーションは AWS Systems Manager の一機能です。
マネージドノードの CPU 使用率、ディスク I/O、およびネットワーク使用率をモニタリングすることもできます。確立したベースラインからパフォーマンスが外れた場合は、ノードの再設定または最適化を行って CPU 使用率の抑制、ディスク I/O の改善、またはネットワークトラフィックの低減を行うことが必要な場合があります。EC2 インスタンスのモニタリングの詳細については、「Amazon EC2 ユーザーガイド」の「Amazon EC2 のモニタリング」を参照してください。
トピック
- モニタリングツール
- 統合された CloudWatch Logs へのノードログの送信 (CloudWatch エージェント)
- CloudWatch Logs に SSM Agent ログを送信する
- 変更リクエストイベントのモニタリング
- オートメーションのモニタリング
- Amazon CloudWatch を使用した Run Command メトリクスのモニタリング
- AWS Systems Manager による AWS CloudTrail API コールのログ記録
- CloudWatch Logs を使用した自動アクション出力のログ記録
- Run Command の Amazon CloudWatch Logs の設定
- Amazon EventBridge を使用して Systems Manager イベントをモニタリングする
- Amazon SNS 通知を使用した Systems Manager のステータス変更のモニタリング
モニタリングツール
この章のコンテンツでは、Systems Manager と他の AWS リソースのモニタリングに使用できるツールの使用方法について説明します。ツールの詳細なリストについては、「AWS Systems Manager でのログ記録とモニタリング」を参照してください。