**このページの改善にご協力ください** 

このユーザーガイドに貢献するには、すべてのページの右側のペインにある「**GitHub でこのページを編集する**」リンクを選択してください。

# オブザーバビリティダッシュボードを使用してクラスターをモニタリングする
<a name="observability-dashboard"></a>

Amazon EKS コンソールにはクラスターのパフォーマンスに関する可視性を提供するオブザーバビリティダッシュボードが含まれています。このダッシュボードの情報は、問題を迅速に検出、トラブルシューティング、是正するのに役立ちます。オブザーバビリティダッシュボードの該当するセクションを開くには、**[ヘルスとパフォーマンスの概要]** で項目を選択してください。この概要は**[オブザーバビリティ]** タブなど、いくつかの場所に含まれています。

オブザーバビリティダッシュボードは、複数のタブに分かれています。

## 概要
<a name="observability-summary"></a>

**[ヘルスとパフォーマンスの概要]** にはさまざまなカテゴリの項目数が一覧表示されます。各数値はそのカテゴリのリストを含むオブザーバビリティダッシュボード内の場所へのハイパーリンクとして機能します。

## クラスターヘルス
<a name="observability-cluster-health"></a>

 **クラスターヘルス**は注意すべき重要な通知であり、その中には可能な限り早急に対処しなければならない可能性のあるものも含まれています。このリストでは説明と、影響を受けるリソースを確認できます。クラスターヘルスには、**[ヘルスの問題]** と **[設定情報]** という 2 つのテーブルが含まれています。**[ヘルスの問題]** のステータスを更新するには、更新ボタン ( ↻ ) を選択してください。**[設定情報]** は、24 時間に 1 回自動的に更新されます。手動で更新することはできません。

**[ヘルスの問題]** の詳細については、「[クラスターの正常性に関するよくある質問およびエラーコードと解決パス](troubleshooting.md#cluster-health-status)」を参照してください。**[設定情報]** の詳細については、「[Kubernetes バージョンアップグレードの準備およびクラスターインサイトでの設定ミスのトラブルシューティング](cluster-insights.md)」を参照してください。

## コントロールプレーンのモニタリング
<a name="observability-control-plane"></a>

**[コントロールプレーンのモニタリング]** タブは 3 つのセクションに分かれており、それぞれがクラスターのコントロールプレーンのモニタリングとトラブルシューティングに役立ちます。

### メトリクス
<a name="observability-metrics"></a>

Kubernetes バージョン `1.28` 以降のクラスターの場合、**[メトリクス]** セクションにはさまざまなコントロールプレーンコンポーネントについて収集された複数のメトリクスのグラフが表示されます。

セクションの上部で選択することで、すべてのグラフの X 軸で使用される期間を設定できます。更新ボタン ( ↻ ) を使用してデータを更新できます。個別のグラフごとに、縦三点リーダーのボタン ( ⋮ ) をクリックすると、CloudWatch のオプションを含むメニューが開きます。

これらのメトリクスなどはCloudWatch における `AWS/EKS` 名前空間の基本的なモニタリングメトリクスとして自動的に使用できます。詳細については「*Amazon CloudWatch ユーザーガイド*」の「[基本モニタリングと詳細モニタリング](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch-metrics-basic-detailed.html)」を参照してください。より詳細なメトリクス、ビジュアライゼーション、インサイトを取得するには「*Amazon CloudWatch ユーザーガイド*」の「[Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html)」を参照してください。あるいは、Prometheus ベースのモニタリングが必要な場合は「[Prometheus を使用してクラスターのメトリクスをモニタリングする](prometheus.md)」を参照してください。

次の表には使用可能なメトリクスが記載されています。


| メトリクス | 説明 | 
| --- | --- | 
|  APIServer リクエスト  |  API サーバーに対して実行された 1 分あたりのリクエスト。  | 
|  APIServer 合計リクエスト 4XX  |  HTTP 4XX レスポンスコード (クライアント側のエラー) が発生した、1 分あたりの API サーバーリクエストの数。  | 
|  APIServer 合計リクエスト 5XX  |  HTTP 5XX レスポンスコード (サーバー側のエラー) が発生した、1 分あたりの API サーバーリクエストの数。  | 
|  APIServer 合計リクエスト 429  |  HTTP 429 レスポンスコード (リクエストが多すぎます) が発生した、1 分あたりの API サーバーリクエストの数。  | 
|  ストレージサイズ  |  ストレージデータベース (`etcd`) のサイズ。  | 
|  スケジューラーの試行  |  「unschedulable」、「error」、「scheduled」の結果による、ポッドのスケジュールの試行回数。  | 
|  保留中のポッド  |  キュータイプが「active」、「backoff」、「unschedulable」、「gated」の保留中のポッドの数。  | 
|  API サーバーリクエストのレイテンシー  |  API サーバーリクエストのレイテンシー。  | 
|  API サーバーの現在処理中のリクエスト  |  API サーバーの現在処理中のリクエスト。  | 
|  ウェブフックリクエスト  |  1 分あたりのウェブフックリクエスト。  | 
|  ウェブフックリクエストの拒否  |  拒否されたウェブフックリクエストの数。  | 
|  ウェブフックリクエストのレイテンシー P99  |  外部サードパーティーのウェブフックリクエストの 99 パーセンタイルレイテンシー。  | 

### CloudWatch Log Insights
<a name="observability-log-insights"></a>

**[CloudWatch Log Insights]** セクションにはコントロールプレーンの監査ログに基づくさまざまなリストが表示されます。この機能を使用するにはAmazon EKS コントロールプレーンログをオンにする必要があります。これは**[CloudWatch のコントロールプレーンログを表示]** セクションから実行できます。

データを収集するのに十分な時間が経過したら、**[すべてのクエリを実行]** したり、一回に 1 つのリストについて **[クエリを実行]** を選択したりできます。クエリを実行するたびに、CloudWatch から追加料金が課金します。セクションの上部に表示する結果の期間を選択してください。クエリをより高度に制御したい場合は**[CloudWatch で表示]** を選択できます。これにより、ニーズに合わせて CloudWatch でクエリを更新できます。

詳細については「Amazon CloudWatch Logs ユーザーガイド」の「[CloudWatch Logs Insights を使用したログデータの分析](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html)」を参照してください。

### CloudWatch でコントロールプレーンのログを表示する
<a name="observability-cp-logs"></a>

**[ログ記録を管理]** を選択して、使用可能なログタイプを更新します。ログ記録を有効にした後、CloudWatch Logs にログが表示されるまでに数分かかります。十分な時間が経過したら、このセクションのリンクを **[表示]** を選択して、該当するログに移動します。

詳細については「[コントロールプレーンログを CloudWatch Logs に送信する](control-plane-logs.md)」を参照してください。

## クラスターのインサイト
<a name="observability-cluster-insights"></a>

**[インサイトをアップグレード]** の表では問題が表示されるほか、是正措置が推奨されます。これにより、新しい Kubernetes バージョンにアップグレードするための検証プロセスが加速されます。Amazon EKS はKubernetes バージョンのアップグレードに影響を及ぼす可能性のある問題のリストに照らしてクラスターを自動的にスキャンします。**[インサイトをアップグレード]** の表にはこのクラスターに対して Amazon EKS によって実行されるインサイトチェックと、関連付けられたステータスが一覧表示されます。

Amazon EKS はKubernetes プロジェクトの変更と、新しいバージョンに関連する Amazon EKS サービスの変更の評価に基づいて実行されるインサイトチェックのリストを維持し、定期的に更新します。Amazon EKS コンソールは各インサイトのステータスを自動的に更新します。これは最終更新時刻の列で確認できます。

詳細については「[Kubernetes バージョンアップグレードの準備およびクラスターインサイトでの設定ミスのトラブルシューティング](cluster-insights.md)」を参照してください。

## ノードのヘルスの問題
<a name="observability-node-health-issues"></a>

Amazon EKS ノードモニタリングエージェントはノードログを自動的に読み取り、ヘルスの問題を検出します。自動修復設定に関係なく、必要に応じて調査できるように、すべてのノードのヘルスの問題が報告されます。問題タイプが説明なしで一覧にされている場合はそのポップオーバー要素で説明を読み取ることができます。

ページを更新すると、解決された問題はリストから消えます。自動修復が有効になっている場合、アクションを起こさなくても解決されるヘルスの問題が一時的に表示されます。自動修復でサポートされていない問題の場合はタイプによっては手動アクションが必要になる場合があります。

ノードのヘルスの問題を報告するにはクラスターで Amazon EKS 自動モード を使用するか、ノードモニタリングエージェントのアドオンが必要です。詳細については、「[ノードのヘルス問題を検出し、自動ノード修復を有効にする](node-health.md)」を参照してください。

## EKS 機能
<a name="observability-capabilities"></a>

**[機能]** セクションには、クラスター内の EKS 機能リソースのステータスとヘルスが表示されます。クラスター内の機能とそのマネージド Kubernetes リソースの両方に関するヘルスとステータスの通知は、ここでモニタリングできます。ページを更新すると、解決された問題はリストから消えます。

詳細については、「[機能リソースの使用](working-with-capabilities.md)」を参照してください。