Lightsail リソースメトリクスのモニタリング - Amazon Lightsail

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Lightsail リソースメトリクスのモニタリング

Amazon Lightsail のインスタンス、データベース、ディストリビューション、ロードバランサー、コンテナサービス、バケットのパフォーマンスをモニタリングするには、メトリクスデータをチェックして収集します。時間の経過とともにベースラインを確立し、リソースのパフォーマンスに関する異常や問題をより簡単に検出できるようにアラームを設定できます。

Amazon Lightsail は、インスタンス、データベース、コンテンツ配信ネットワーク (CDN) ディストリビューション、ロードバランサー、コンテナサービス、バケットのメトリクスデータをレポートします。このデータは Lightsail コンソールで表示およびモニタリングできます。モニタリングは、 リソースの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。リソースから定期的にメトリクスデータをモニタリングして収集し、マルチポイント障害が発生した場合に、より簡単にデバッグできるようにします。

目次

リソースを効果的にモニタリングする

環境内の通常のリソースパフォーマンスのベースラインを確立する必要があります。さまざまな時間帯に、さまざまな負荷条件でパフォーマンスを測定します。リソースをモニタリングするときは、時間の経過に伴うリソースのパフォーマンスの履歴を書き留めて記録する必要があります。収集した履歴データに対して、リソースの現在のパフォーマンスを比較します。これにより、通常のパフォーマンスパターンとパフォーマンスの異常を特定し、それらに対処するための方法を考案することができます。

たとえば、インスタンスの CPU 使用率、ネットワーク使用率、ステータスチェックをモニタリングできます。確立したベースラインからパフォーマンスが外れた場合は、インスタンスの再設定または最適化を行って CPU 使用率の抑制、またはネットワークトラフィックの低減を行うことが必要な場合があります。インスタンスが CPU 使用率のしきい値を超えて動作し続ける場合は、インスタンスのより大きなプランに切り替えることをお勧めします (5 USD/月プランではなく 7 USD/月プランを使用します)。インスタンスの新しいスナップショットを作成し、大きなプランを使用してスナップショットから新しいインスタンスを作成することで、より大きなプランに切り替えることができます。

ベースラインを確立したら、リソースが指定されたしきい値を超えたときに通知するように Lightsail コンソールでアラームを設定できます。詳細については、「通知」および「アラーム」を参照してください。

メトリクスの概念と用語

以下の用語と概念は、Lightsail でのメトリクスの使用をよりよく理解するのに役立ちます。

メトリクス

メトリクスは、時間順に並んだ一連のデータポイントを表します。メトリクスはモニタリング対象の変数と考え、データポイントは時間の経過と共に変数の値を表します。メトリクスは、名前によって一意に定義されます。例えば、Lightsail が提供するインスタンスメトリクスには、CPU 使用率 (CPUUtilization)、受信ネットワークトラフィック ()、送信ネットワークトラフィック (NetworkIn) などがありますNetworkOut。Lightsail で利用可能なすべてのリソースメトリクスの詳細については、「Lightsail で利用可能なメトリクス」を参照してください。

メトリクスの保持

期間が 60 秒 (1 分の解像度) のデータポイントは、15 日間使用できます。期間が 300 秒 (5 分の解像度) のデータポイントは、63 日間使用できます。期間が 3600 秒 (1 時間の解像度) のデータポイントは、455 日 (15 か月) 間使用できます。

最初は短い期間で発行されるデータポイントは、長期的なストレージのため一緒に集計されます。たとえば、1 分の精度を持つデータポイントは、1 分の解像度で 15 日間使用できます。15 日を過ぎてもこのデータはまだ利用できますが、集計され、5 分の解像度のみで取得可能になります。63 日を過ぎるとこのデータはさらに集計され、1 時間の解像度のみで利用できます。これらの期間よりも長いメトリクスの可用性が必要な場合は、Lightsail API、 AWS Command Line Interface (AWS CLI)、および SDKs を使用して、オフラインまたは異なるストレージのデータポイントを取得できます。

詳細については、GetRelationalDatabaseMetricDataLightsail API リファレンスGetInstanceMetricDataGetBucketMetricDataGetLoadBalancerMetricData「」、「」、GetDistributionMetricData「」、「」、「」、「」を参照してください。

統計

メトリクス統計は、一定期間にわたってデータを集計する手段です。統計情報の例としては、AverageSumMaximum などがあります。たとえば、Average 統計を使用してインスタンスの CPU 使用率メトリクスデータを平均化し、Sum 統計を使用してデータベース接続を追加したり、Maximum 統計を使用してロードバランサーの最大応答時間を取得したりできます。

使用可能なメトリクス統計のリストについては、Lightsail API リファレンスの「 の統計 GetInstanceMetricData」、 GetLoadBalancerMetricData「」の統計「」、「」の統計「」、「「」の統計 GetDistributionMetricData「」、「「」の統計 GetRelationalDatabaseMetricData」を参照してください。 GetBucketMetricData

単位

各統計には、測定単位があります。単位の例は、BytesSecondsCountPercent などです。単位の完全なリストについては、Lightsail API リファレンスの「 の単位 GetInstanceMetricData」、「 GetLoadBalancerMetricDataの単位」、「 GetDistributionMetricDataの単位」、「 の単位 GetRelationalDatabaseMetricData」を参照してください。

期間

期間とは、返されたデータポイントの粒度を示す特定のデータポイントに関連付けられた時間の長さです。各データポイントは、指定された期間に収集されたメトリクスデータの集約を表しています。期間は秒単位で定義され、期間の有効値は 60 秒 (1 分) と 300 秒 (5 分) の倍数です。

Lightsail API を使用してデータポイントを取得する場合、期間、開始時刻、終了時刻を指定できます。これらのパラメータでは、データポイントに関連する全体の時間長を決定します。Lightsail はメトリクスデータを 1 分または 5 分単位でレポートするため、60 秒と 300 秒の倍数で期間を指定する必要があります。開始時刻と終了時刻に指定する値は、Lightsail が返す期間の数を決定します。10 分区切りで集約された統計を取得する場合は、期間を 600 に指定します。1 時間分の集約された統計の場合は、期間を 3600 などに設定します。

Lightsail アラームでは、期間も重要です。Lightsail は 5 分ごとにアラームのデータポイントを評価し、アラームの各データポイントは 5 分間の集計データを表します。特定のメトリクスをモニタリングするアラームを作成すると、そのメトリクスを指定したしきい値と比較するように Lightsail に要求します。Lightsail がその比較を行う方法を広範囲に制御できます。比較を行う期間を指定し、結論に達するために使用する評価期間の数を指定することもできます。詳細については、「 アラーム」を参照してください。

アラーム

アラームは、指定した期間に 1 つのメトリクスをモニタリングし、メトリクスが指定したしきい値を超えたときに通知します。通知は、Lightsail コンソールに表示されるバナー、指定した E メールアドレスに送信される E メール、指定した携帯電話番号に送信される SMS テキストメッセージにすることができます。詳細については、「 アラーム」を参照してください。

Lightsail で利用可能なメトリクス

インスタンスメトリクス

次のインスタンスメトリクスを使用できます。詳細については、Amazon Lightsail」を参照してください。

  • CPU 使用率 (CPUUtilization) — 割り当てられたコンピューティングユニットのうち、現在インスタンス上で使用されているものの割合。このメトリクスは、インスタンスでアプリケーションを実行するための処理能力を識別します。インスタンスにフルプロセッサコアが割り当てられていない場合、オペレーティングシステムのツールの割合は Lightsail よりも低くなります。

    Lightsail コンソールでインスタンスの CPU 使用率メトリクスグラフを表示すると、持続可能でバースト可能なゾーンが表示されます。これらのゾーンの意味の詳細については、「CPU 使用率の持続可能なゾーンとバースト可能なゾーン」を参照してください。

  • バーストキャパシティ (BurstCapacityTime) および割合 (BurstCapacityPercentage) — バーストキャパシティ分数は、インスタンスが CPU 使用率 100% でバーストできる時間を表します。バーストキャパシティの割合は、インスタンスで利用できる CPU パフォーマンスの割合です。インスタンスはバースト容量を継続的に消費し、蓄積します。インスタンスが 100% の CPU 使用率で動作しているときにのみ、バーストキャパシティの分数がフルレートで消費されます。インスタンスバーストキャパシティの詳細については、Amazon Lightsail」を参照してください。

  • 受信ネットワークトラフィック (NetworkIn) — すべてのネットワークインターフェイスでの、このインスタンスによって受信されたバイト数。このメトリクスは、1 つのインスタンスへの着信ネットワークトラフィックの量を表しています。報告された数は、期間中に受信されたバイト数です。このメトリクスは 5 分間隔でレポートされるため、レポートされた数を 300 で割ると、バイト/秒を算出できます。

  • 送信ネットワークトラフィック (NetworkOut) — すべてのネットワークインターフェイスでの、このインスタンスから送信されたバイト数。このメトリクスは、1 つのインスタンスからの発信ネットワークトラフィックの量を表しています。報告された数は、期間中に送信されたバイト数です。このメトリクスは 5 分間隔でレポートされるため、レポートされた数を 300 で割ると、バイト/秒を算出できます。

  • ステータスチェックの失敗 (StatusCheckFailed) — インスタンスが、インスタンスステータスチェックとシステムステータスチェックの両方に合格したか失敗したかをレポートします。このメトリクスは 0 (合格) または 1 (失敗) となります。このメトリクスは、1 分間の頻度で利用できます。

  • インスタンスステータスチェックの失敗 (StatusCheckFailed_Instance) — インスタンスがインスタンスステータスチェックに合格したか、失敗したかをレポートします。このメトリクスは 0 (合格) または 1 (失敗) となります。このメトリクスは、1 分間の頻度で利用できます。

  • ステータスチェックの失敗 (StatusCheckFailed_System) — インスタンスが、システムステータスチェックに合格したか失敗したかをレポートします。このメトリクスは 0 (合格) または 1 (失敗) となります。このメトリクスは、1 分間の頻度で利用できます。

  • トークンメタデータなしのリクエスト (MetadataNoToken) — トークンなしでインスタンスのメタデータサービスに正常にアクセスした回数。このメトリクスにより、トークンを使用しない Instance Metadata Service バージョン 1 を使用してインスタンスメタデータにアクセスするプロセスがあるかどうかがわかります。すべてのリクエストがトークン支援のセッション (Instance Metadata Service バージョン 2 など) を使用している場合、値は 0 になります。詳細については、Amazon Lightsail」を参照してください。

データベースメトリクス

次のデータベースメトリクスを使用できます。詳細については、Amazon Lightsail」を参照してください。

  • CPU 使用率 (CPUUtilization) — データベースで現在使用されている CPU 使用率の割合。

  • データベース接続 (DatabaseConnections) — 使用中のデータベース接続の数。

  • ディスクのキューの深度 (DiskQueueDepth) — ディスクへのアクセスを待機している未処理の IO (読み取り/書き込みリクエスト) の数。

  • 空きストレージ容量 (FreeStorageSpace) — 使用可能なストレージの容量。

  • ネットワーク受信スループット (NetworkReceiveThroughput) — モニタリングとレプリケーションに使用する顧客データベーストラフィックと AWS トラフィックの両方を含む、データベースの受信ネットワークトラフィック。

  • ネットワーク送信スループット (NetworkTransmitThroughput) — モニタリングとレプリケーションに使用する顧客データベーストラフィックと AWS トラフィックの両方を含む、データベースの送信ネットワークトラフィック。

ディストリビューションメトリクス

以下のディストリビューションメトリクスが利用可能です。詳細については、Amazon Lightsail」を参照してください。

  • リクエスト (Requests) — すべての HTTP メソッド、および HTTP と HTTPS 両方のリクエストについて、ディストリビューションが受信したビューワーリクエストの総数。

  • アップロードされたバイト数 (BytesUploaded) — POST リクエストと PUT リクエストを使用して、ディストリビューションによってオリジンにアップロードされたバイト数。

  • ダウンロードされたバイト数 (BytesDownloaded) — GET リクエスト、HEAD リクエスト、および OPTIONS リクエストに対してビューワーがダウンロードしたバイト数。

  • トータルエラー率 (TotalErrorRate) — レスポンスの HTTP ステータスコードが 4xx または 5xx であったすべてのビューワーリクエストの割合 (%)。

  • HTTP 4xx トータルエラー率 (4xxErrorRate) — レスポンスの HTTP ステータスコードが 4xx であったすべてのビューワーリクエストの割合 (%)。このような場合、クライアントまたはクライアントビューワーでエラーが発生した可能性があります。たとえば、ステータスコード 404 (Not Found) は、クライアントが、検出できないオブジェクトをリクエストしたことを意味します。

  • HTTP 5xx トータルエラー率 (5xxErrorRate) — レスポンスの HTTP ステータスコードが 5xx であったすべてのビューワーリクエストの割合 (%)。このような場合、オリジンサーバーはリクエストを満たしませんでした。たとえば、ステータスコード 503 (Service Unavailable) は、オリジンサーバーが現在利用できないことを意味します。

ロードバランサーのメトリクス

次のロードバランサーメトリクスを使用できます。詳細については、Amazon Lightsail」を参照してください。

  • 正常ホスト数 (HealthyHostCount) — 正常と見なされるターゲットインスタンスの数。

  • 異常ホスト数 (UnhealthyHostCount) — 異常と見なされるターゲットインスタンスの数。

  • ロードバランサー HTTP 4XX (HTTPCode_LB_4XX_Count) — ロードバランサーから発生した HTTP 4XX クライアントエラーコードの数。リクエストの形式が不正な場合、または不完全な場合は、クライアントエラーが生成されます。これらのリクエストは、ターゲットインスタンスによって受信されませんでした。この数には、ターゲットインスタンスによって生成される応答コードは含まれません。

  • ロードバランサー HTTP 5XX (HTTPCode_LB_5XX_Count) — ロードバランサーから発生した HTTP 5XX サーバーのエラーコードの数。これには、ターゲットインスタンスによって生成される応答コードは含まれません。ロードバランサーにアタッチされている正常なインスタンスがない場合、またはリクエストレートがインスタンスやロードバランサーの容量を超える場合 (スピルオーバー)、このメトリクスが報告されます。

  • インスタンス HTTP 2XX (HTTPCode_Instance_2XX_Count) — ターゲットインスタンスによって生成された HTTP 2XX 応答コードの数。これには、ロードバランサーによって生成される応答コードは含まれません。

  • インスタンス HTTP 3XX (HTTPCode_Instance_3XX_Count) — ターゲットインスタンスによって生成された HTTP 3XX 応答コードの数。これには、ロードバランサーによって生成される応答コードは含まれません。

  • インスタンス HTTP 4XX (HTTPCode_Instance_4XX_Count) — ターゲットインスタンスによって生成された HTTP 4XX 応答コードの数。これには、ロードバランサーによって生成される応答コードは含まれません。

  • インスタンス HTTP 5XX (HTTPCode_Instance_5XX_Count) — ターゲットインスタンスによって生成された HTTP 5XX 応答コードの数。これには、ロードバランサーによって生成される応答コードは含まれません。

  • インスタンスからの応答時間 (InstanceResponseTime) — ロードバランサーがリクエストを送信してから、ターゲットインスタンスからの応答を受信するまでの経過時間 (秒)。

  • クライアント TLS ネゴシエーションエラー数 (ClientTLSNegotiationErrorCount) — クライアントにより開始され、ロードバランサーによって生成された TLS エラーのためにロードバランサーとのセッションを確立しなかった、TLS 接続の数。暗号化またはプロトコルの不一致が原因である場合があります。

  • リクエストの数 (RequestCount) — IPv4 経由で処理されたリクエストの数。この数には、ロードバランサーのターゲットインスタンスによって生成されたレスポンスを含むリクエストのみが含まれます。

  • 拒否された接続数 (RejectedConnectionCount) — ロードバランサーが接続の最大数に達したため、拒否された接続の数。

コンテナサービスのメトリクス

以下のコンテナサービスメトリクスが利用可能です。詳細については、「コンテナサービスメトリクスを表示する」を参照してください。

  • CPU 使用率 (CPUUtilization) — コンテナサービスの全ノードで現在使用されているコンピューティングユニットの平均比率。このメトリクスは、コンテナサービス上のコンテナを実行するのに必要な処理能力を特定します。

  • メモリ使用率 (MemoryUtilization) — コンテナサービスの全ノードで現在使用されているメモリの平均比率。このメトリクスは、コンテナサービス上のコンテナを実行するのに必要なメモリを特定します。

バケットメトリクス

次のバケットメトリクスが利用可能です。詳細については、Amazon Lightsail」を参照してください。

  • [バケットサイズ (BucketSizeBytes)] — バケットに保存されたデータの量。この値を計算するには、バケット内のすべてのオブジェクト (最新のオブジェクトと最新でないオブジェクトの両方) のサイズを合計します。これには、バケットに対するすべての不完全なマルチパートアップロードのすべてのパートのサイズも含めます。

  • [オブジェクトの数 (NumberOfObjects)] — バケットに保存されたオブジェクトの総数。この値を計算するには、バケット内のすべてのオブジェクト (最新のオブジェクトと最新でないオブジェクトの両方) と、バケットに対するすべての不完全なマルチパートアップロードの合計パート数をカウントします。

注記

バケットが空の場合、バケットメトリックスデータはレポートされません。