Amazon による OpenSearch クラスターメトリクスのモニタリング CloudWatch - Amazon OpenSearch サービス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon による OpenSearch クラスターメトリクスのモニタリング CloudWatch

Amazon OpenSearch Service は、ドメインから Amazon . CloudWatch lets にデータを発行します CloudWatch。ユーザーは、これらのデータポイントに関する統計を、メトリクス と呼ばれる時系列データの順序付けられたセットとして取得します。 OpenSearch サービスは、ほとんどのメトリクスを CloudWatch 60 秒間隔で に送信します。汎用または磁気 EBS ボリュームを使用する場合、EBS ボリュームのメトリクスは 5 分ごとのみに更新されます。すべての累積メトリクス (例: ThreadpoolWriteRejecetedThreadpoolSearchRejected) はメモリ内であり、状態が失われます。メトリクスは、ノードドロップ、ノードバウンス、ノード交換、ブルー/グリーンデプロイ中にリセットされます。Amazon の詳細については CloudWatch、「Amazon ユーザーガイド CloudWatch 」を参照してください。

OpenSearch サービスコンソールには、 からの raw データに基づいて一連のグラフが表示されます CloudWatch。必要に応じて、コンソールのグラフ CloudWatch の代わりに でクラスターデータを表示することもできます。サービスは、メトリクスを 2 週間アーカイブし、その後破棄します。メトリクスは追加料金なしで提供されますが、ダッシュボードとアラームの作成には引き続き CloudWatch 料金がかかります。詳細については、「Amazon CloudWatch の料金」を参照してください。

OpenSearch サービスは、次のメトリクスを に発行します CloudWatch。

でのメトリクスの表示 CloudWatch

CloudWatch メトリクスは、最初にサービス名前空間によってグループ化され、次に各名前空間内のさまざまなディメンションの組み合わせによってグループ化されます。

CloudWatch コンソールを使用してメトリクスを表示するには
  1. https://console.aws.amazon.com/cloudwatch/ で CloudWatch コンソールを開きます。

  2. 左のナビゲーションペインで、[Metrics] (メトリクス) を見つけ、[All metrics] (すべてのメトリクス) を選択します。ES/OpenSearchService 名前空間を選択します。

  3. ディメンションを選択して、対応するメトリクスを表示します。個別のノードのメトリクスは、ClientId, DomainName, NodeId ディメンションにあります。クラスターメトリクスは、Per-Domain, Per-Client Metrics ディメンションにあります。一部のノードメトリクスは、クラスターレベルで集計されるため、両方のディメンションに含まれます。シャードメトリクスは、ClientId, DomainName, NodeId, ShardRole ディメンションにあります。

を使用してメトリクスのリストを表示するには AWS CLI

次のコマンドを実行します。

aws cloudwatch list-metrics --namespace "AWS/ES"

Service でのヘルスチャートの解釈 OpenSearch

OpenSearch サービスでメトリクスを表示するには、クラスターヘルスタブとインスタンスヘルスタブを使用します。インスタンスのヘルスタブでは、ボックスチャートを使用して各 OpenSearchノードのヘルスを at-a-glance 可視化します。

  • それぞれの色付きの箱は、指定した期間におけるノードの値範囲を示しています。

  • 青色の箱は他のノードと同じ値を示します。赤色の箱は異常値を示します。

  • 各箱の白線は、ノードの現在値を示します。

  • 各拍の両脇にある「ひげ」は、期間におけるすべてのノードの最大値と最小値を示します。

ドメインの設定を変更すると、[クラスターヘルス] タブと [インスタンスヘルス] タブの各インスタンスのリストが正しい数に戻る前に、しばらくの間 2 倍のサイズになる場合があります。この動作の説明については、「Amazon OpenSearch Service での設定変更」を参照してください。

クラスターメトリクス

Amazon OpenSearch Service は、クラスターに対して以下のメトリクスを提供します。

メトリクス 説明
ClusterStatus.green

値 1 は、すべてのインデックスシャードがクラスターのノードに割り当てられることを示します。

関連する統計: Maximum

ClusterStatus.yellow 値 1 は、すべてのインデックスのプライマリシャードがクラスターのノードに割り当てられていることを示しますが、1 つ以上のインデックスのレプリカシャードが割り当てられていません。詳細については、「黄色のクラスター状態」を参照してください。

関連する統計: Maximum

ClusterStatus.red

値 1 は、少なくとも 1 つのインデックスのプライマリとレプリカの両方のシャードが、クラスターのノードに割り当てられないことを示します。詳細については、「赤のクラスター状態」を参照してください。

関連する統計: Maximum

Shards.active

アクティブなプライマリとレプリカの両方のシャードの合計数。

関連する統計: Maximum、Sum

Shards.unassigned

クラスターのノードに割り当てられていないシャードの数。

関連する統計: Maximum、Sum

Shards.delayedUnassigned

タイムアウト設定によってノード割り当てが遅れたシャードの数。

関連する統計: Maximum、Sum

Shards.activePrimary

アクティブなプライマリシャードの数。

関連する統計: Maximum、Sum

Shards.initializing

初期化中のシャードの数。

関連する統計情報: Sum

Shards.relocating

再配置中のシャードの数。

関連する統計情報: Sum

Nodes

専用マスターノードとノードを含む、 OpenSearch サービスクラスター内の UltraWarm ノードの数。詳細については、「Amazon OpenSearch Service での設定変更」を参照してください。

関連する統計: Maximum

SearchableDocuments

クラスター内のすべてのデータノードで検索可能なドキュメントの合計数。

関連する統計情報: Minimum、Maximum、Average

DeletedDocuments

クラスター内のすべてのデータノードで削除対象としてマークされたドキュメントの合計数。これらのドキュメントは検索結果に表示されなくなり、セグメントのマージ中に削除されたドキュメント OpenSearch のみをディスクから削除します。このメトリクスは、削除リクエスト後に増加し、セグメントマージ後に減少します。

関連する統計情報: Minimum、Maximum、Average

CPUUtilization

クラスター内のデータノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべてのノードを表します。このメトリクスは、個別のノードでも利用できます。

関連する統計: Maximum、Average

FreeStorageSpace

クラスター内のデータノードの空き領域。Sum はクラスターの合計空き容量を示しますが、正確な値を得るには期間を 1 分にする必要があります。MinimumMaximum は、それぞれ空き領域が最も少ないノードと最も多いノードを示します。このメトリクスは個々のノードでも使用できます。このメトリクスClusterBlockExceptionが に達すると、 OpenSearch サービスは をスローします0。復旧するには、インデックスを削除する、より大きなインスタンスを追加する、既存のインスタンスに EBS ベースのストレージを追加する、のいずれかを実行する必要があります。詳細については、「使用可能なストレージ領域の不足」を参照してください。

OpenSearch サービスコンソールには、この値が GiB で表示されます。Amazon CloudWatch コンソールには、MiB で表示されます。

注記

FreeStorageSpace は、 および _cat/allocation APIsが提供する値 OpenSearch _cluster/statsよりも常に低くなります。 OpenSearch サービスは、内部オペレーションのために各インスタンスのストレージ領域の割合を予約します。詳細については、「ストレージ要件の計算」を参照してください。

関連する統計: Minimum、Maximum、Average、Sum

ClusterUsedSpace

クラスターの合計使用領域。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

OpenSearch サービスコンソールには、この値が GiB で表示されます。Amazon CloudWatch コンソールには、MiB で表示されます。

関連する統計: Minimum、Maximum

ClusterIndexWritesBlocked

クラスターで、着信する書き込みリクエストを受け入れるか、ブロックするかを指定します。値 0 では、クラスターでリクエストを受け入れます。値 1 ではリクエストをブロックします。

代表的なものとしては、FreeStorageSpace が少なすぎる、JVMMemoryPressure が高すぎるなどがあります。この問題を軽減するには、ディスク容量の追加やクラスターのスケーリングを検討します。

関連する統計: Maximum

JVMMemoryPressure

クラスター内のすべてのデータノードに使用される Java ヒープの最大パーセンテージ。 OpenSearch サービスは、Java ヒープにインスタンスの RAM の半分を使用し、ヒープサイズは 32 GiB までです。インスタンスは最大 64 GiB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。「Amazon OpenSearch Service の推奨 CloudWatch アラーム」を参照してください。

関連する統計: Maximum

注記

このメトリクスのロジックは、サービスソフトウェア R20220323 で変更されました。詳細については、「リリースノート」を参照してください。

OldGenJVMMemoryPressure

クラスター内のすべてのデータノードにおける「旧世代」で使用する Java ヒープの最大パーセンテージ。このメトリクスは、ノードレベルでも使用できます。

関連する統計: Maximum

AutomatedSnapshotFailure

クラスターの失敗した自動スナップショットの数。1 の値は、自動スナップショットが過去 36 時間、ドメイン用に取られなかったことを示します。

関連する統計: Minimum、Maximum

CPUCreditBalance

クラスター内の、データノードに使用できる残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、Amazon EC2 デベロッパーガイドの「CPU クレジット」を参照してください。このメトリクスは、T2 のインスタンスタイプでのみ使用できます。

関連する統計: Minimum

OpenSearchDashboardsHealthyNodes

OpenSearch Dashboards のヘルスチェック。最小、最大、および平均がすべて 1 に等しい場合、Dashboards は正常に動作しています。最大が 1、最小が 0、平均が 0.7 の 10 個のノードがある場合、これは 7 個のノード (70%) が正常であり、3 個のノード (30%) が正常でないことを意味します。

関連する統計情報: Minimum、Maximum、Average

OpensearchDashboardsReportingFailedRequestSysErrCount

サーバーの問題または機能の制限により失敗した OpenSearch Dashboards レポートを生成するリクエストの数。

関連する統計情報: Sum

OpensearchDashboardsReportingFailedRequestUserErrCount

クライアントの問題により失敗した OpenSearch Dashboards レポートを生成するリクエストの数。

関連する統計情報: Sum

OpensearchDashboardsReportingRequestCount

OpenSearch Dashboards レポートを生成するリクエストの合計数。

関連する統計情報: Sum

OpensearchDashboardsReportingSuccessCount

OpenSearch Dashboards レポートを生成するために成功したリクエストの数。

関連する統計情報: Sum

KMSKeyError

値 1 は、保管中のデータの暗号化に使用される AWS KMS キーが無効になっていることを示します。通常のオペレーションにドメインを復元するには、キーを再度有効にします。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連する統計: Minimum、Maximum

KMSKeyInaccessible

値 1 は、保管中のデータの暗号化に使用される AWS KMS キーが削除されたか、 OpenSearch サービスへの許可が取り消されたことを示します。この状態にあるドメインを復元することはできません。ただし、手動のスナップショットがある場合は、それを使用してドメインのデータを新しいドメインに移行できます。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連する統計: Minimum、Maximum

InvalidHostHeaderRequests

無効な (または欠落している) ホストヘッダーを含む OpenSearch クラスターに対して行われた HTTP リクエストの数。有効なリクエストには、ホストヘッダー値としてドメインホスト名が含まれます。 OpenSearch サービスでは、制限付きアクセスポリシーを持たないパブリックアクセスドメインに対する無効なリクエストが拒否されます。すべてのドメインに制限付きアクセスポリシーを適用することをお勧めします。

このメトリクスの値が大きい場合は、 OpenSearch クライアントがリクエストにドメインホスト名 (IP アドレスなどではない) を含めていることを確認します。

関連する統計情報: Sum

OpenSearchRequests (previously ElasticsearchRequests)

OpenSearch クラスターに対して行われたリクエストの数。

関連する統計情報: Sum

2xx, 3xx, 4xx, 5xx

特定の HTTP レスポンスコード (2xx、3xx、4xx、5xx) の発生につながった、ドメインへのリクエストの数。

関連する統計情報: Sum

ThroughputThrottle

ディスクがスロットリングされたかどうかが示されます。スロットリングは、ReadThroughputMicroBursting と WriteThroughputMicroBursting の合計スループットが最大スループット MaxProvisionedThroughput よりも高い場合に発生します。MaxProvisionedThroughput は、インスタンススループットまたはプロビジョニングされたボリュームスループットのうち、低い方の値です。値 1 は、ディスクがスロットリングされていることを示しています。値 0 は正常な動作を示します。

インスタンスのスループットについては、「Amazon EBS 最適化インスタンスを使用する」を参照してください。ボリュームスループットの詳細については、「Amazon EBS ボリュームの種類」を参照してください。

関連する統計: Minimum、Maximum

IopsThrottle

ドメインの 1 秒あたりの入出力オペレーション数 (IOPS) がスロットリングされているかどうかを示します。スロットリングは、データノードの IOPS が、データノードの EBS ボリュームまたは EC2 インスタンスの最大許容制限を超えた場合に発生します。

インスタンス IOPS の詳細については、「Amazon EBS 最適化インスタンス」を参照してください。ボリューム IOPS の詳細については、「Amazon EBS ボリュームタイプ」を参照してください。

関連する統計: Minimum、Maximum

専用マスターノードメトリクス

Amazon OpenSearch Service は、専用マスターノード に対して以下のメトリクスを提供します。

メトリクス 説明
MasterCPUUtilization

専用マスターノードが使用する CPU リソースの最大パーセンテージ。このメトリクスが 60 パーセントに達する場合、インスタンスタイプのサイズを増やすことをお勧めします。

関連する統計: Maximum

MasterFreeStorageSpace

このメトリクスは関係ないため無視できます。このサービスはデータノードとしてマスターノードを使用しません。

MasterJVMMemoryPressure

クラスター内のすべての専用マスターノードで使用する Java ヒープの最大パーセンテージ。このメトリクスが 85 パーセントに達する場合、より大規模なインスタンスタイプに移行することをお勧めします。

関連する統計: Maximum

注記

このメトリクスのロジックは、サービスソフトウェア R20220323 で変更されました。詳細については、「リリースノート」を参照してください。

MasterOldGenJVMMemoryPressure

マスターノードごとの「旧世代」で使用される Java ヒープの最大パーセンテージ。

関連する統計: Maximum

MasterCPUCreditBalance

クラスター内の専用マスターノードで使用できる、残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、Amazon EC2 デベロッパーガイドの「CPU クレジット」を参照してください。このメトリクスは、T2 のインスタンスタイプでのみ使用できます。

関連する統計: Minimum

MasterReachableFromNode

MasterNotDiscovered 例外のヘルスチェック。値 1 は正常な動作を示します。値 0 は、/_cluster/health/ の動作が正常ではないことを示します。

障害が発生すると、ソースノードからマスターノードにアクセスすることができなくなります。通常、ネットワーク接続の問題または AWS 依存関係の問題が原因です。

関連する統計: Maximum

MasterSysMemoryUtilization

使用中のマスターノードのメモリの割合。

関連する統計: Maximum

EBS ボリュームメトリクス

Amazon OpenSearch Service では、EBS ボリュームの以下のメトリクスが提供されます。

メトリクス 説明
ReadLatency

EBS ボリュームでの読み取り操作のレイテンシー (秒単位)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

WriteLatency

EBS ボリュームでの書き込み操作のレイテンシー (秒単位)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

ReadThroughput

EBS ボリュームでの読み取り操作のスループット (バイト/秒単位)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

ReadThroughputMicroBursting

マイクロバーストを考慮に入れたときの、EBS ボリュームにおける読み取りオペレーションのスループット (バイト/秒)。このメトリクスは、個別のノードでも利用できます。マイクロバーストは、EBS ボリュームがきわめて短い時間 (1 分未満) に高い IOPS またはスループットをバーストするときに発生します。

関連する統計情報: Minimum、Maximum、Average

WriteThroughput

EBS ボリュームでの書き込み操作のスループット (バイト/秒単位)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

WriteThroughputMicroBursting

マイクロバーストを考慮に入れたときの、EBS ボリュームにおける書き込みオペレーションのスループット (バイト/秒)。このメトリクスは、個別のノードでも利用できます。マイクロバーストは、EBS ボリュームがきわめて短い時間 (1 分未満) に高い IOPS またはスループットをバーストするときに発生します。

関連する統計情報: Minimum、Maximum、Average

DiskQueueDepth

EBS ボリュームに対する保留中の入出力 (I/O) リクエストの数。

関連する統計情報: Minimum、Maximum、Average

ReadIOPS

EBS ボリュームでの読み取り操作の入出力 (I/O) 操作数 (1 秒あたり)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

ReadIOPSMicroBursting

マイクロバーストを考慮に入れたときの、EBS ボリュームでの読み取り操作の入出力 (I/O) 操作数 (1 秒あたり)。このメトリクスは、個別のノードでも利用できます。マイクロバーストは、EBS ボリュームがきわめて短い時間 (1 分未満) に高い IOPS またはスループットをバーストするときに発生します。

関連する統計情報: Minimum、Maximum、Average

WriteIOPS

EBS ボリュームでの書き込み操作の入出力 (I/O) 操作数 (1 秒あたり)。このメトリクスは、個別のノードでも利用できます。

関連する統計情報: Minimum、Maximum、Average

WriteIOPSMicroBursting

マイクロバーストを考慮に入れたときの、EBS ボリュームでの書き込み操作の入出力 (I/O) 操作数 (1 秒あたり)。このメトリクスは、個別のノードでも利用できます。マイクロバーストは、EBS ボリュームがきわめて短い時間 (1 分未満) に高い IOPS またはスループットをバーストするときに発生します。

関連する統計情報: Minimum、Maximum、Average

BurstBalance

EBS ボリュームの、バーストバケットに残っている入出力 (I/O) クレジットの割合。値 100 は、ボリュームが最大クレジット数を累積したことを意味します。このパーセンテージが 70% を下回る場合は、「低 EBS バーストバランス」を参照してください。gp3 ボリュームタイプを使用するドメインと、ボリュームサイズが 1,000 GiB を超える gp2 ボリュームを使用するドメインのバーストバランスは 0 のままになります。

関連する統計情報: Minimum、Maximum、Average

インスタンスメトリクス

Amazon OpenSearch Service は、ドメイン内のインスタンスごとに次のメトリクスを提供します。 OpenSearch また、これらのインスタンスメトリクスを集約して、クラスター全体の状態に関するインサイトを提供します。この動作を確認するには、コンソールで [サンプル数] 統計を使用します。以下のテーブルの各メトリクスには、ノードクラスターに関連する統計を含みます。

重要

Elasticsearch のバージョンが異なる場合、_index API への呼び出しの処理にも異なるスレッドプールが使用されます。Elasticsearch 1.5 および 2.3 は、インデックス作成スレッドプールを使用します。Elasticsearch 5.x 、6.0、および 6.2 はバルクスレッドプールを使用し、Elasticsearch OpenSearch 6.3 以降は書き込みスレッドプールを使用します。現在、 OpenSearch サービスコンソールにはバルクスレッドプールのグラフは含まれていません。

GET _cluster/settings?include_defaults=true を使用して、クラスターのスレッドプールとキューサイズを確認します。

メトリクス 説明
ConcurrentSearchRate

データノード上のすべてのシャードに対して 1 分あたりの同時セグメント検索を使用した検索リクエストの合計数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

ConcurrentSearchLatency

ノードで N 分から 1 分 (N-1) までの同時セグメント検索を使用したすべての検索で取得された合計時間のミリ秒単位の差。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

IndexingLatency

ノード内のすべてのインデックス作成オペレーションにかかった合計時間 (ミリ秒) の、N 分と (N-1) 分の差。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

IndexingRate

1 分あたりのインデックス作成オペレーションの数。2 つのドキュメントを追加し、2 つのカウントを 4 つのオペレーションとして更新する _bulk API への 1 回の呼び出し。これは 1 つ以上のノードに分散する可能性があります。そのインデックスに 1 つ以上のレプリカがあり、 OpenSearch最適化されたインスタンス がないドメインにある場合、クラスター内の他のノードも合計 4 つのインデックス作成オペレーションを記録します。最適化されたインスタンスを持つ OpenSearch ドメインの場合、レプリカを持つ他のノードはオペレーションを記録しません。ドキュメントの削除はこのメトリクスに対してカウントされません。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

SearchLatency

ノード内のすべての検索にかかった合計時間 (ミリ秒) の、N 分と (N-1) 分の差。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

SearchRate

データノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

SegmentCount

データノードでのセグメントの数。セグメントが多いほど、各検索にかかる時間が長くなります。 OpenSearch 場合によっては、小さいセグメントを大きいセグメントにマージします。

関連するノードの統計: Maximum、Average

関連するクラスターの統計: Sum、Maximum、Average

SysMemoryUtilization

インスタンスが使用中のメモリの割合。このメトリクスの高い値は正常であり、通常はクラスターに問題はありません。潜在的なパフォーマンスおよび安定性の問題の指標については、「JVMMemoryPressure メトリクス」を参照してください。

関連するノードの統計: Minimum、Maximum、Average

関連するクラスターの統計: Minimum、Maximum、Average

JVMGCYoungCollectionCount

「新世代」ガベージコレクションが実行された回数。実行数が大量になり、かつ増え続けることは、通常のクラスター操作の一部です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCYoungCollectionTime

クラスターで「新世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCOldCollectionCount

「旧世代」ガベージコレクションが実行された回数。十分なリソースがあるクラスターでは、この回数は少ないままですが、まれに増加します。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCOldCollectionTime

クラスターで「旧世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

OpenSearchDashboardsConcurrentConnections

Dashboards への OpenSearchアクティブな同時接続の数。この数が一貫して増加する場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

OpenSearchDashboardsHealthyNode

個々の OpenSearch Dashboards ノードのヘルスチェック。値 1 は正常な動作を示します。値 0 は Dashboards がアクセス不可であることを示します。

関連するノードの統計: Minimum

関連するクラスターの統計: Minimum、Maximum、Average

OpenSearchDashboardsHeapTotal

OpenSearch Dashboards に割り当てられたヒープメモリの容量を MiB 単位で表します。EC2 インスタンスタイプが異なると、正確なメモリ割り当てに影響する可能性があります。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

OpenSearchDashboardsHeapUsed

OpenSearch Dashboards が使用するヒープメモリの絶対量を MiB で表したものです。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

OpenSearchDashboardsHeapUtilization

Dashboards が OpenSearch使用する使用可能なヒープメモリの最大パーセンテージ。この値が 80% を超えて増加する場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Minimum、Maximum、Average

OpenSearchDashboardsOS1MinuteLoad

OpenSearch Dashboards の 1 分間の CPU 負荷平均。CPU ロードは、理想的には 1.00 未満にとどまるはずです。一時的なスパイクは問題ありませんが、このメトリクスが一貫して 1.00 を超える場合は、インスタンスタイプのサイズを増やすことをお勧めします。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

OpenSearchDashboardsRequestTotal

OpenSearch Dashboards に対して行われた HTTP リクエストの合計数。システムの速度が遅い、または Dashboards リクエストの数が多い場合は、インスタンスタイプのサイズを増やすことを検討してください。

関連するノードの統計: Sum

関連するクラスターの統計: Sum

OpenSearchDashboardsResponseTimesMaxInMillis

OpenSearch Dashboards がリクエストに応答するのにかかる最大時間をミリ秒単位で表します。リクエストで結果が返ってくるために一貫して時間がかかる場合は、インスタンスタイプのサイズを増やすことを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Maximum、Average

SearchTaskCancelled

コーディネーターノードのキャンセル数。

関連するノードの統計: Sum

関連するクラスターの統計: Sum

SearchShardTaskCancelled

データノードのキャンセル数。

関連するノードの統計: Sum

関連するクラスターの統計: Sum、

ThreadpoolForce_mergeQueue

強制マージスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolForce_mergeRejected

強制マージスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolForce_mergeThreads

強制マージスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolIndexQueue

インデックス作成スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。インデックスキューの最大サイズは 200 です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolIndexRejected

インデックス作成スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolIndexThreads

インデックス作成スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolSearchQueue

検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。検索キューの最大サイズは 1,000 です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolSearchRejected

検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolSearchThreads

検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

Threadpoolsql-workerQueue

SQL 検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

Threadpoolsql-workerRejected

SQL 検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

Threadpoolsql-workerThreads

SQL 検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolBulkQueue

バルクスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolBulkRejected

バルクスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolBulkThreads

バルクスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolIndexSearcherQueue

インデックス検索スレッドプール内のキューに入れられたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolIndexSearcherRejected

インデックス検索スレッドプールで拒否されたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolIndexSearcherThreads

インデックス検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteThreads

書き込みスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteQueue

書き込みスレッドプールでキューに入っているタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteRejected

書き込みスレッドプールで拒否されたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

注記

バージョン 7.1 では、デフォルトの書き込みキューサイズが 200 から 10000 に引き上げられたため、このメトリクスは OpenSearch サービスからの拒否を示す唯一の指標ではなくなりました。CoordinatingWriteRejectedPrimaryWriteRejected、および ReplicaWriteRejected メトリクスを使用して、バージョン 7.1 以降での拒否をモニタリングします。

CoordinatingWriteRejected

前回の OpenSearch サービスプロセスの起動以降にインデックス作成の負荷により調整ノードで発生した拒否の合計数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

このメトリクスは、バージョン 7.1 以降で使用できます。

PrimaryWriteRejected

前回の OpenSearch サービスプロセスの起動以降にインデックス作成のプレッシャーが原因でプライマリシャードで発生した拒否の合計数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

このメトリクスは、バージョン 7.1 以降で使用できます。

ReplicaWriteRejected

前回の OpenSearch サービスプロセスの起動以降にインデックス作成のプレッシャーが原因でレプリカシャードで発生した拒否の合計数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

このメトリクスは、バージョン 7.1 以降で使用できます。

UltraWarm メトリクス

Amazon OpenSearch Service では、UltraWarmノードについて以下のメトリクスを提供しています。

メトリクス 説明
WarmCPUUtilization

クラスター内の UltraWarm ノードの CPU 使用率。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべての UltraWarm ノードを表します。このメトリクスは、個々の UltraWarm ノードでも使用できます。

関連する統計: Maximum、Average

WarmFreeStorageSpace

ウォームストレージの空き容量 (MiB)。はアタッチされたディスクではなく Amazon S3 を使用するため UltraWarm、関連する統計Sumは のみです。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連する統計情報: Sum

WarmSearchableDocuments

クラスター内のすべてのウォームインデックスで検索可能なドキュメントの合計数。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連する統計情報: Sum

WarmSearchLatency

N 分から 1 分 (N-1) UltraWarm の間の でのすべての検索で取得された合計時間のミリ秒単位の差。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

WarmSearchRate

UltraWarm ノード上のすべてのシャードに対する 1 分あたりの検索リクエストの合計数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

WarmStorageSpaceUtilization

クラスターで使用中のウォームストレージスペースの合計容量 (MiB)。

関連する統計: Maximum

HotStorageSpaceUtilization

クラスターで使用しているホットストレージの合計容量。

関連する統計: Maximum

WarmSysMemoryUtilization

使用中のウォームノードのメモリの割合。

関連する統計: Maximum

HotToWarmMigrationQueueSize

現在、ホットストレージからウォームトストレージへの移行を待機しているインデックスの数。

関連する統計: Maximum

WarmToHotMigrationQueueSize

現在、ウォームストレージからホットストレージへの移行を待機しているインデックスの数。

関連する統計: Maximum

HotToWarmMigrationFailureCount

失敗したホットからウォームへの移行の合計数。

関連する統計情報: Sum

HotToWarmMigrationForceMergeLatency

移行プロセスの強制マージステージの平均レイテンシー。この段階が一貫して時間がかかりすぎる場合は、index.ultrawarm.migration.force_merge.max_num_segments を増やすことを検討してください。

関連する統計: Average

HotToWarmMigrationSnapshotLatency

移行プロセスのスナップショットステージの平均レイテンシー。この段階が一貫して時間がかかりすぎる場合は、シャードが適切にサイズ設定され、クラスター全体に分散されていることを確認します。

関連する統計: Average

HotToWarmMigrationProcessingLatency

ホットからウォームへの移行が成功した場合の平均レイテンシーで、キューに費やした時間を含まない。この値は、移行プロセスの強制マージ、スナップショット、およびシャード再配置ステージを完了するのにかかる時間の合計です。

関連する統計: Average

HotToWarmMigrationSuccessCount

ホットからウォームへの移行に成功した合計数。

関連する統計情報: Sum

HotToWarmMigrationSuccessLatency

ホットからウォームへの移行が成功した場合の平均レイテンシーで、キューに費やされた時間を含む。

関連する統計: Average

WarmThreadpoolSearchThreads

UltraWarm 検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

WarmThreadpoolSearchRejected

UltraWarm 検索スレッドプールで拒否されたタスクの数。この数が継続的に増加する場合は、ノード UltraWarmの追加を検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

WarmThreadpoolSearchQueue UltraWarm 検索スレッドプール内のキューに入れられたタスクの数。キューサイズが一貫して大きい場合は、ノードの追加 UltraWarmを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

WarmJVMMemoryPressure

ノードに使用される UltraWarm Java ヒープの最大パーセンテージ。

関連する統計: Maximum

注記

このメトリクスのロジックは、サービスソフトウェア R20220323 で変更されました。詳細については、「リリースノート」を参照してください。

WarmOldGenJVMMemoryPressure

UltraWarm ノードあたりの「旧世代」に使用される Java ヒープの最大パーセンテージ。

関連する統計: Maximum

WarmJVMGCYoungCollectionCount

「未世代」ガベージコレクションが UltraWarm ノードで実行された回数。実行数が大量になり、かつ増え続けることは、通常のクラスター操作の一部です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

WarmJVMGCYoungCollectionTime

クラスターがノードで「小さな世代」ガベージコレクションの実行に UltraWarm費やしたミリ秒単位の時間。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

WarmJVMGCOldCollectionCount

「旧世代」ガベージコレクションが UltraWarm ノードで実行された回数。十分なリソースがあるクラスターでは、この回数は少ないままですが、まれに増加します。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

WarmConcurrentSearchRate

UltraWarm ノード上のすべてのシャードに対して 1 分あたりの同時セグメント検索を使用した検索リクエストの合計数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Sum、Maximum、Average

WarmConcurrentSearchLatency

UltraWarm ノードで N 分から 1 分 (N-1) の間の同時セグメント検索を使用したすべての検索で取得された合計時間のミリ秒単位の差。

関連するノードの統計: Average

関連するクラスターの統計: Maximum、Average

WarmThreadpoolIndexSearcherQueue

UltraWarm インデックス検索スレッドプール内のキューに入れられたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

WarmThreadpoolIndexSearcherRejected

UltraWarm インデックス検索スレッドプールで拒否されたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

WarmThreadpoolIndexSearcherThreads

UltraWarm インデックス検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスター統計: Sum、Average

コールドストレージのメトリクス

Amazon OpenSearch Service は、コールドストレージ について以下のメトリクスを提供します。

メトリクス 説明
ColdStorageSpaceUtilization

クラスターで使用しているコールドストレージの合計容量 (MiB)。

関連する統計情報: Max

ColdToWarmMigrationFailureCount

コールドからウォームへの移行に失敗した移行の合計数。

関連する統計情報: Sum

ColdToWarmMigrationLatency

コールドからウォームへの移行が正常に完了するまでの時間。

関連する統計: Average

ColdToWarmMigrationQueueSize

現在、コールドストレージからウォームストレージへの移行を待機しているインデックスの数。

関連する統計: Maximum

ColdToWarmMigrationSuccessCount

コールドからウォームへの移行に成功した合計数。

関連する統計情報: Sum

WarmToColdMigrationFailureCount

ウォームからコールドへの移行に失敗した合計数。

関連する統計情報: Sum

WarmToColdMigrationLatency

ウォームからコールドへの移行が正常に完了するまでの時間。

関連する統計: Average

WarmToColdMigrationQueueSize

現在、ウォームストレージからコールドストレージへの移行を待機しているインデックスの数。

関連する統計: Maximum

WarmToColdMigrationSuccessCount

ウォームからコールドへの移行に成功した合計数。

関連する統計情報: Sum

OR1 メトリクス

Amazon OpenSearch Service は、OR1 インスタンス に対して次のメトリクスを提供します。

メトリクス 説明
RemoteStorageUsedSpace

クラスターで使用中の Amazon S3 スペースの合計容量 (MiB)。

関連する統計情報: Sum

RemoteStorageWriteRejected

リモートストレージとレプリケーションの負荷により、プライマリシャードで拒否されたリクエストの総数。これは、前回の OpenSearch サービスプロセスのスタートアップから計算されます。

関連する統計情報: Sum

アラートメトリクス

Amazon OpenSearch Service では、 にアラートを送信するために以下のメトリクスが用意されています。

メトリクス 説明
AlertingDegraded

値 1 は、アラートインデックスが赤であるか、1 つ以上のノードがスケジュールどおりでないことを意味します。値 0 は正常な動作を示します。

関連する統計: Maximum

AlertingIndexExists

値 1 は、.opensearch-alerting-config インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。アラート機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

AlertingIndexStatus.green

インデックスのヘルス。値 1 は、緑を意味します。値 0 は、インデックスが存在しないか、緑ではないことを意味します。

関連する統計: Maximum

AlertingIndexStatus.red

インデックスのヘルス。値 1 は、赤を意味します。値 0 は、インデックスが存在しないか、赤でないことを意味します。

関連する統計: Maximum

AlertingIndexStatus.yellow

インデックスのヘルス。値 1 は、黄色を意味します。値 0 は、インデックスが存在しないか、黄色でないことを意味します。

関連する統計: Maximum

AlertingNodesNotOnSchedule

値 1 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。値 0 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。 OpenSearch サービスコンソールを確認するか、_nodes/statsリクエストを実行して、リソース使用率が高いノードがあるかどうかを確認します。

関連する統計: Maximum

AlertingNodesOnSchedule

値 1 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。値 0 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。

関連する統計: Maximum

AlertingScheduledJobEnabled

値 1 は、opensearch.scheduled_jobs.enabled クラスター設定が true であることを意味します。値 0 は、その設定が false であり、スケジュールされたジョブが無効であることを意味します。

関連する統計: Maximum

異常検出のメトリクス

Amazon OpenSearch Service は、異常検出 について以下のメトリクスを提供します。

メトリクス 説明
ADPluginUnhealthy

値 1 は、異常検出プラグインが正しく動作していないことを意味します。これは、障害の数が多いか、使用しているインデックスの 1 つが赤の状態であるためです。値 0 は、プラグインが想定どおりに動作していることを示します。

関連する統計: Maximum

ADExecuteRequestCount

異常検出のリクエストの数。

関連する統計情報: Sum

ADExecuteFailureCount

異常検出に失敗したリクエストの数。

関連する統計情報: Sum

ADHCExecuteFailureCount

高基数ディテクターの異常検出に失敗したリクエストの数。

関連する統計情報: Sum

ADHCExecuteRequestCount

高基数ディテクターの異常検出のリクエストの数。

関連する統計情報: Sum

ADAnomalyResultsIndexStatusIndexExists

値 1 は、.opensearch-anomaly-results エイリアスが指すインデックスが存在することを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ADAnomalyResultsIndexStatus.red

値 1 は、 .opensearch-anomaly-results エイリアスが指すインデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ADAnomalyDetectorsIndexStatusIndexExists

値 1 は、.opensearch-anomaly-detectors インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ADAnomalyDetectorsIndexStatus.red

値 1 は、.opensearch-anomaly-detectors インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ADModelsCheckpointIndexStatusIndexExists

値 1 は、.opensearch-anomaly-checkpoints インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ADModelsCheckpointIndexStatus.red

値 1 は、.opensearch-anomaly-checkpoints インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

Amazon OpenSearch Service は、非同期検索 に対して以下のメトリクスを提供します。

非同期検索コーディネーターノードの統計 (コーディネーターノードあたり)

メトリクス 説明
AsynchronousSearchSubmissionRate

過去 1 分間に送信された非同期検索の数。

AsynchronousSearchInitializedRate

過去 1 分間に初期化された非同期検索の数。

AsynchronousSearchRunningCurrent

現在実行中の非同期検索の数。

AsynchronousSearchCompletionRate

過去 1 分間に正常に完了した非同期検索の数。

AsynchronousSearchFailureRate

過去 1 分間に完了し、失敗した非同期検索の数。

AsynchronousSearchPersistRate

過去 1 分間に持続した非同期検索の数。

AsynchronousSearchPersistFailedRate

過去 1 分間に持続できなかった非同期検索の数。

AsynchronousSearchRejected

ノードの稼働時間以降に拒否された非同期検索の合計数。

AsynchronousSearchCancelled

ノードの稼働時間以降にキャンセルされた非同期検索の合計数。

AsynchronousSearchMaxRunningTime

過去 1 分間にノードで実行されている非同期検索の最長時間。

非同期検索クラスター統計

メトリクス 説明
AsynchronousSearchStoreHealth

過去 1 分間に持続したインデックス (赤/赤以外) 内のストアのヘルス。

AsynchronousSearchStoreSize

過去 1 分間のすべてのシャードのシステムインデックスのサイズ。

AsynchronousSearchStoredResponseCount

過去 1 分間にシステムインデックスに保存されたレスポンスの数。

Auto-Tune メトリクス

Amazon OpenSearch Service は、Auto-Tune の以下のメトリクスを提供します。

メトリクス 説明
AutoTuneChangesHistoryHeapSize

ヒープサイズチューニング値の MiB 単位の変更履歴。

AutoTuneChangesHistoryJVMYoungGenArgs

JVM YongGen 引数の変更履歴。

AutoTuneFailed

Auto-Tune の変更が失敗したかどうかを示すブール値。

AutoTuneSucceeded

Auto-Tune の変更が成功したかどうかを示すブール値。

AutoTuneValue 中断を伴わない変更のキュー変更履歴 (カウント) とキャッシュチューニング変更履歴 (MiB 単位)。

Multi-AZ with Standby メトリクス

Amazon OpenSearch Service は、スタンバイ のマルチ AZ に対して次のメトリクスを提供します。

アクティブなアベイラビリティーゾーンにおけるデータノードのノードレベルメトリクス

メトリクス 説明
CPUUtilization クラスター内のデータノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべてのノードを表します。このメトリクスは、個別のノードでも利用できます。
FreeStorageSpace

クラスター内のデータノードの空き領域。Sum はクラスターの合計空き容量を示しますが、正確な値を得るには期間を 1 分にする必要があります。MinimumMaximum は、それぞれ空き領域が最も少ないノードと最も多いノードを示します。このメトリクスは個々のノードでも使用できます。このメトリクスClusterBlockExceptionが に達すると、 OpenSearch サービスは をスローします0。復旧するには、インデックスを削除する、より大きなインスタンスを追加する、既存のインスタンスに EBS ベースのストレージを追加する、のいずれかを実行する必要があります。詳細については、「使用可能なストレージ領域の不足」を参照してください。

OpenSearch サービスコンソールには、この値が GiB で表示されます。Amazon CloudWatch コンソールには、MiB で表示されます。

JVMMemoryPressure クラスター内のすべてのデータノードに使用される Java ヒープの最大パーセンテージ。 OpenSearch サービスは、Java ヒープにインスタンスの RAM の半分を使用し、ヒープサイズは 32 GiB までです。インスタンスは最大 64 GiB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。「Amazon OpenSearch Service の推奨 CloudWatch アラーム」を参照してください。
SysMemoryUtilization インスタンスが使用中のメモリの割合。このメトリクスの高い値は正常であり、通常はクラスターに問題はありません。潜在的なパフォーマンスおよび安定性の問題の指標については、「JVMMemoryPressure メトリクス」を参照してください。
IndexingLatency

ノード内のすべてのインデックス作成オペレーションにかかった合計時間 (ミリ秒) の、N 分と (N-1) 分の差。

IndexingRate 1 分あたりのインデックス作成オペレーションの数。
SearchLatency

ノード内のすべての検索にかかった合計時間 (ミリ秒) の、N 分と (N-1) 分の差。

SearchRate データノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。
ThreadpoolSearchQueue 検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。検索キューの最大サイズは 1,000 です。
ThreadpoolWriteQueue 書き込みスレッドプールでキューに入っているタスクの数。
ThreadpoolSearchRejected

検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

ThreadpoolWriteRejected 書き込みスレッドプールで拒否されたタスクの数。

アクティブなアベイラビリティーゾーンにおけるクラスターのクラスターレベルメトリクス

メトリクス 説明
DataNodes アクティブシャードとスタンバイシャードの合計数。
DataNodesShards.active アクティブなプライマリとレプリカの両方のシャードの合計数。
DataNodesShards.unassigned

クラスターのノードに割り当てられていないシャードの数。

DataNodesShards.initializing 初期化中のシャードの数。
DataNodesShards.relocating 再配置中のシャードの数。

アベイラビリティーゾーンのローテーションメトリクス

ActiveReads.Availability-Zone = 1 の場合、ゾーンはアクティブです。ActiveReads.Availability-Zone = 0 の場合、ゾーンはスタンバイ状態です。

ポイントインタイムメトリクス

Amazon OpenSearch Service は、ポイントインタイム (PIT) 検索について以下のメトリクスを提供します。

PIT コーディネーターノードの統計 (コーディネーターノードあたり)

メトリクス 説明
CurrentPointInTime ノード内のアクティブな PIT 検索コンテキストの数。
TotalPointInTime ノードのアップタイム以降の、期限切れの PIT 検索コンテキストの数。
AvgPointInTimeAliveTime ノードのアップタイム以降の、PIT 検索コンテキストの平均キープアライブ数。
HasActivePointInTime 値が 1 の場合、アクティブな PIT コンテキストがノードのアップタイム以降に存在していることを示します。値が 0 の場合は存在していません。
HasUsedPointInTime 値が 1 の場合、期限切れの PIT コンテキストがノードのアップタイム以降に存在していることを示します。値が 0 の場合は存在していません。

SQL メトリクス

Amazon OpenSearch Service では、SQL サポート に関する以下のメトリクスを提供しています。

メトリクス 説明
SQLFailedRequestCountByCusErr

クライアントの問題により失敗した _sql API へのリクエストの数。例えば、IndexNotFoundException により、リクエストが HTTP ステータスコード 400 を返す場合があります。

関連する統計情報: Sum

SQLFailedRequestCountBySysErr

サーバーの問題または機能の制限により失敗した _sql API へのリクエストの数。例えば、VerificationException により、リクエストが HTTP ステータスコード 503 を返す場合があります。

関連する統計情報: Sum

SQLRequestCount

_sql API へのリクエストの数。

関連する統計情報: Sum

SQLDefaultCursorRequestCount

SQLRequestCount に似ていますが、測定対象はページネーションのリクエストのみです。

関連する統計情報: Sum

SQLUnhealthy

値 1 は、特定のリクエストに応答して、SQL プラグインが 5xx レスポンスコードを返すか、無効なクエリ DSL を に渡すことを示します OpenSearch。他のリクエストは引き続き成功します。値 0 は、最近の障害がないことを示します。値 1 が持続して表示される場合、クライアントがプラグインに対して行っているリクエストのトラブルシューティングを行います。

関連する統計: Maximum

k-NN メトリクス

Amazon OpenSearch Service には、k 最近傍 (k-NN) プラグインの以下のメトリクスが含まれています。

メトリクス 説明
KNNCacheCapacityReached

キャッシュ容量に達したかどうかのノード単位のメトリクス。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計: Maximum

KNNCircuitBreakerTriggered

サーキットブレーカーがトリガーされるかどうかのクラスタ単位のメトリクス。KNNCacheCapacityReached についていずれかのノードが 1 の値を返す場合、この値も 1 を返します。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計: Maximum

KNNEvictionCount

メモリ制約またはアイドル時間のためにキャッシュから削除されたグラフ数のノード単位のメトリクス。インデックスの削除のために発生した明示的な削除はカウントされません。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

KNNGraphIndexErrors

ドキュメントの knn_vector フィールドを、エラーを生成したグラフに追加するリクエストの数のノードごとのメトリクス。

関連する統計情報: Sum

KNNGraphIndexRequests

ドキュメントの knn_vector フィールドを、グラフに追加するリクエストの数のノードごとのメトリクス。

関連する統計情報: Sum

KNNGraphMemoryUsage

現在のキャッシュサイズ (メモリー内のすべてのグラフの合計サイズ) のノードごとのメトリクス (KB)。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計: Average

KNNGraphQueryErrors

エラーを生成したグラフクエリの数のノード単位のメトリクス。

関連する統計情報: Sum

KNNGraphQueryRequests

グラフクエリの数のノード単位のメトリクス。

関連する統計情報: Sum

KNNHitCount

キャッシュヒットの数のノード単位のメトリクス。ユーザーがすでにメモリにロードされているグラフのクエリを行ったときに、キャッシュヒットが発生します。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

KNNLoadExceptionCount

グラフをキャッシュにロードしようとしたときに例外が発生した回数のノード単位のメトリクス。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

KNNLoadSuccessCount

プラグインがグラフをキャッシュに正常にロードした回数のノード単位のメトリクス。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

KNNMissCount

キャッシュミスの数のノード単位のメトリクス。ユーザーがまだメモリにロードされていないグラフのクエリを行ったときに、キャッシュミスが発生します。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

KNNQueryRequests

k-NN プラグインが受信したクエリリクエストの数のノード単位のメトリクス。

関連する統計情報: Sum

KNNScriptCompilationErrors

スクリプトのコンパイル中のエラーの数のノード単位のメトリクス。この統計は、k-NN スコアスクリプト検索にのみ関係します。

関連する統計情報: Sum

KNNScriptCompilations

k-NN スクリプトがコンパイルされた回数のノードごとのメトリクス。通常、この値は 1 または 0 であるはずですが、コンパイルされたスクリプトを含むキャッシュがいっぱいになると、k-NN スクリプトが再コンパイルされる可能性があります。この統計は、k-NN スコアスクリプト検索にのみ関係します。

関連する統計情報: Sum

KNNScriptQueryErrors

スクリプトクエリ中のエラーの数のノード単位のメトリクス。この統計は、k-NN スコアスクリプト検索にのみ関係します。

関連する統計情報: Sum

KNNScriptQueryRequests

スクリプトクエリの合計数のノード単位のメトリクス。この統計は、k-NN スコアスクリプト検索にのみ関係します。

関連する統計情報: Sum

KNNTotalLoadTime

k-NN がグラフをキャッシュにロードするのにかかった時間 (ナノ秒)。このメトリクスは、おおよその k-NN 検索にのみ関係します。

関連する統計情報: Sum

Amazon OpenSearch Service は、クラスター間検索 について以下のメトリクスを提供します。

ソースドメインのメトリクス

メトリクス ディメンション 説明
CrossClusterOutboundConnections

ConnectionId

接続されたノードの数。スキップされたドメインが 1 つ以上レスポンスに含まれている場合は、このメトリクスを使用して異常な接続を追跡します。この数が 0 になった場合、その接続は正常ではありません。

CrossClusterOutboundRequests

ConnectionId

ターゲットドメインに送信された検索リクエストの数。ドメインでクラスター間検索リクエストが過負荷になっているかどうかを確認し、このメトリクスのスパイクと JVM/CPU スパイクの関連性を探るために使用します。

ターゲットドメインのメトリクス

メトリクス ディメンション 説明
CrossClusterInboundRequests

ConnectionId

ソースドメインから受信した着信接続リクエストの数。

予期せず接続が失われた場合は、 CloudWatch アラームを追加します。アラームを作成する手順については、「静的しきい値 に基づいてアラームを作成する」を参照してください CloudWatch

クラスター間レプリケーションメトリクス

Amazon OpenSearch Service は、クラスター間レプリケーション について以下のメトリクスを提供します。

メトリクス 説明
ReplicationRate

1 秒あたりのレプリケーションオペレーションの平均率。このメトリクスは IndexingRate メトリクスに似ています。

LeaderCheckPoint

特定の接続については、すべてのレプリケートインデックスにおけるリーダーチェックポイントの合計値。このメトリクスを使用して、レプリケーションのレイテンシーを測定できます。

FollowerCheckPoint

特定の接続については、すべてのレプリケートインデックスにおけるフォロワーチェックポイントの合計値。このメトリクスを使用して、レプリケーションのレイテンシーを測定できます。

ReplicationNumSyncingIndices

SYNCING のレプリケーションステータスを持つインデックスの数。

ReplicationNumBootstrappingIndices

BOOTSTRAPPING のレプリケーションステータスを持つインデックスの数。

ReplicationNumPausedIndices

PAUSED のレプリケーションステータスを持つインデックスの数。

ReplicationNumFailedIndices

FAILED のレプリケーションステータスを持つインデックスの数。

CrossClusterOutboundReplicationRequests

フォロワードメイン上のレプリケーショントランスポートリクエストの数。トランスポートリクエストは内部的なものであり、レプリケーション API オペレーションが呼び出されるたびに発生します。これらは、フォロワードメインがリーダードメインからの変更をポーリングする際にも発生します。

CrossClusterInboundReplicationRequests

リーダードメイン上のレプリケーショントランスポートリクエストの数。トランスポートリクエストは内部的なものであり、レプリケーション API オペレーションが呼び出されるたびに発生します。

AutoFollowNumSuccessStartReplication

特定の接続のレプリケーションルールによって正常に作成されたフォロワーインデックスの数。

AutoFollowNumFailedStartReplication

一致するパターンがあったときにレプリケーションルールによって作成されなかったフォロワーインデックスの数。この問題は、リモートクラスターのネットワーク上の問題、またはセキュリティ上の問題 (すなわち、関連付けられているロールにレプリケーションを開始する許可がない) が原因となって発生する可能性があります。

AutoFollowLeaderCallFailure

新しいデータをプルするための、フォロワーインデックスからリーダーインデックスへのクエリが失敗したかどうか。1 の値は、直前の 1 分間に 1 つ以上の失敗した呼び出しがあったことを意味します。

Learning to Rank のメトリクス

Amazon OpenSearch Service では、 Learning to Rank に関する以下のメトリクスを提供しています

メトリクス 説明
LTRRequestTotalCount

ランク付けリクエストの合計数。

LTRRequestErrorCount

失敗したリクエストの合計数。

LTRStatus.red

プラグインの実行に必要なインデックスの 1 つが赤であるかどうかを追跡します。

LTRMemoryUsage

プラグインで使用されるメモリの合計。

LTRFeatureMemoryUsageInBytes

Learning to Rank 機能フィールドで使用されるメモリの量 (バイト単位)。

LTRFeaturesetMemoryUsageInBytes

すべての Learning to Rank 機能セットで使用されるメモリの量 (バイト単位)。

LTRModelMemoryUsageInBytes

すべての Learning to Rank モデルで使用されるメモリの量 (バイト単位)。

Piped Processing Language のメトリクス

Amazon OpenSearch Service は、パイプ処理言語 について以下のメトリクスを提供します。

メトリクス 説明
PPLFailedRequestCountByCusErr

クライアントの問題により失敗した _ppl API へのリクエストの数。例えば、IndexNotFoundException により、リクエストが HTTP ステータスコード 400 を返す場合があります。

PPLFailedRequestCountBySysErr

サーバーの問題または機能の制限により失敗した _ppl API へのリクエストの数。例えば、VerificationException により、リクエストが HTTP ステータスコード 503 を返す場合があります。

PPLRequestCount

_ppl API へのリクエストの数。