アマゾン EC2 リソースのモニタリング
モニタリングはアマゾン EC2 インスタンスおよび AWS ソリューションの信頼性、可用性、およびパフォーマンスを維持するうえで重要な部分です。マルチポイント障害が発生した場合はその障害をより簡単にデバッグできるように、AWS ソリューションのすべての部分からモニタリングデータを収集する必要があります。
AWS はアマゾン EC2 のモニタリングに使用できるさまざまなツールを提供します。アマゾン EC2 および CloudWatch のコンソールダッシュボードにはアマゾン EC2 環境の状態が一目でわかるビューが表示されます。さらに、以下が提供されています。
-
システムステータスのチェック - インスタンスを使用する際に必要な AWS システムをモニタリングして、正常に実行されていることを確認します。これらのチェックでは修復には AWS の関与が必要なインスタンスの根本的な問題が検出されます。システムステータスチェックが失敗した場合、AWS によって問題が修正されるのを待つか、自分自身で (例えば、インスタンスを停止、再起動、終了、置換するなどによって) 問題を解決できます。システムステータスチェックの失敗の原因となる問題には次のようなものがあります。
-
ネットワーク接続の喪失
-
システム電源の喪失
-
物理ホストのソフトウェアの問題
-
ネットワーク到達可能性に影響する、物理ホスト上のハードウェアの問題
詳細についてはAmazon EC2 インスタンスのステータスチェックを参照してください。
-
-
インスタンスステータスのチェック - 個々のインスタンスのソフトウェアとネットワークの設定をモニタリングします。これらのチェックではユーザーが関与して修復する必要のある問題が検出されます。インスタンスステータスチェックが失敗した場合、通常はお客様ご自身で (インスタンスの再起動、オペレーティングシステムの修正など) 問題を修復する必要があります。インスタンスステータスチェックの失敗の原因となる問題には次のようなものがあります。
-
失敗したシステムステータスチェック
-
誤って設定されたネットワークまたは起動設定
-
メモリの枯渇
-
破損したファイルシステム
-
互換性のないカーネル
詳細についてはAmazon EC2 インスタンスのステータスチェックを参照してください。
-
-
アマゾン CloudWatch アラーム - 指定した期間にわたって単一のメトリクスをモニタリングし、複数の期間にわたる特定のしきい値に対するメトリクスの値に基づいて 1 つ以上のアクションを実行します。アクションはアマゾン Simple Notification Service (アマゾン SNS) のトピックまたは アマゾン EC2 Auto Scaling のポリシーに送信される通知です。アラームは持続している状態変化に対してのみアクションを呼び出します。CloudWatch アラームはメトリクスが特定の状態になっただけではアクションを呼び出しません。アクションを呼び出すには状態が変化して、指定した期間継続している必要があります。詳細については「CloudWatch を使用したインスタンスのモニタリング」を参照してください。
-
アマゾン EventBridge イベント - AWS サービスを自動化し、システムイベントに自動的に応答します。AWS サービスからのイベントはほぼリアルタイムに EventBridge に提供され、イベントが記述したルールと一致したときに実行する自動アクションを指定できます。詳細については「EventBridge を使用して Amazon EC2 を自動化する」を参照してください。
-
AWS CloudTrail ログ - アマゾン EC2 API に対して行われた呼び出しに関する詳細情報を取得し、アマゾン S3 でログファイルとして保存します。CloudTrail ログを使用して、行われた呼び出し、呼び出しのソース IP アドレス、呼び出し元、および呼び出し時間を判断できます。詳細については「AWS CloudTrail を使用して Amazon EC2 API コールをログに記録する」を参照してください。
-
CloudWatch エージェント - EC2 インスタンスとオンプレミスサーバー上のホストとゲストの両方からログとシステムレベルのメトリクスを収集します。詳細についてはアマゾン CloudWatch ユーザーガイドのCloudWatch エージェントを使用して アマゾン EC2 インスタンスとオンプレミスサーバーからメトリクスとログを収集するを参照してください。