Valkey と Redis のメトリクス OSS - Amazon ElastiCache

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Valkey と Redis のメトリクス OSS

Amazon ElastiCache 名前空間には、次の Valkey および Redis OSSメトリクスが含まれます。これらのメトリクスは、Valkey エンジンを使用する場合も同じです。

ReplicationLagEngineCPUUtilization、、SuccessfulWriteRequestLatencyおよび を除きSuccessfulReadRequestLatency、これらのメトリクスは info コマンドから派生します。各メトリクスは、キャッシュノードレベルで算出されます。

info コマンドの完全なドキュメントについては、http://valkey.io/commands/info を参照してください。

以下の資料も参照してください

メトリクス 説明 [単位]
ActiveDefragHits アクティブなデフラグメンテーションプロセスで実行された 1 分あたりの値の再割り当て数。これはactive_defrag_hits、 の 統計から算出されますINFO 数値
AuthenticationFailures AUTH コマンドOSSを使用して Valkey または Redis への認証に失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 Count
BytesUsedForCache データセット、バッファなど、OSSすべての目的で Valkey または Redis によって割り当てられた合計バイト数。 バイト
Dimension: Tier=Memory を使用する Valkey または Redis OSSクラスターの場合のデータ階層化 ElastiCache: メモリによるキャッシュに使用される合計バイト数。これは、 used_memory の 統計の値ですINFO バイト
Dimension: Tier=SSD を使用する Valkey または Redis OSSクラスターの のデータ階層化 ElastiCache: によるキャッシュに使用される合計バイト数SSD。 バイト
BytesReadFromDisk ディスクから読み取られる 1 分あたりの合計バイト数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 バイト
BytesWrittenToDisk ディスクに書き込まれる 1 分あたりの合計バイト数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 バイト
CacheHits メインディクショナリで読み取り専用のキー検索に成功した数。これは、 keyspace_hits の 統計から算出されますINFO Count
CacheMisses メインディクショナリで読み取り専用のキー検索に失敗した数。これは、 keyspace_misses の 統計から算出されますINFO Count
CommandAuthorizationFailures ユーザーが呼び出すためのアクセス許可を持たないコマンドの実行に失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 Count
CacheHitRate Valkey または Redis OSSインスタンスの使用効率を示します。キャッシュ比率が約 0.8 より小さい場合、かなりの量のキーが削除された、期限切れになった、または存在しないことを意味します。これは、cache_hitscache_misses 統計を使用して、次の方法で計算されます: cache_hits /(cache_hits + cache_misses) 割合 (%)
ChannelAuthorizationFailures ユーザーがアクセス許可を持たないチャネルへのアクセスに失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このメトリクスにアラームを設定することをお勧めします。 Count
CurrConnections リードレプリカからの接続を除くクライアント接続の数。各ケースでクラスターをモニタリングする接続の 4~6 ElastiCache を使用します。これは、 の connected_clients 統計から算出されますINFO Count
CurrItems キャッシュの項目数。これは、keyspace 統計に基づき、キー空間全体のすべてのキーを合計することで算出されます。 Count
のデータ階層化 ElastiCache を使用するクラスターの Dimension: Tier=Memory です。メモリ内の項目の数です。 Count
のデータ階層化 ElastiCache を使用するクラスターの Dimension: Tier=SSD (ソリッドステートドライブ) です。の項目数SSD。 Count
CurrVolatileItems TTL が設定されているすべてのデータベース内のキーの総数。これは、expires 統計に基づき、キー空間全体で TTL 設定を持つすべてのキーを合計することで算出されます。 Count
DatabaseCapacityUsagePercentage

使用中のクラスターの総データ容量の割合。

データ階層型インスタンスでは、メトリクスは として計算されます。ここで(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity)used_memorymaxmemoryは から取得されますINFO

それ以外の場合、メトリクスは used_memory/maxmemory を使用して計算されます。

割合 (%)
DatabaseCapacityUsageCountedForEvictPercentage

オーバーヘッドと に使用されるメモリを除く、使用中のクラスターの合計データ容量の割合COB。このメトリクスは次のように計算されます。

used_memory - mem_not_counted_for_evict/maxmemory

データ階層化インスタンスでは、メトリクスは次のように計算されます。

(used_memory + SSD used) / (maxmemory + SSD total capacity)

used_memorymaxmemoryが取得される場所 INFO

割合 (%)
DatabaseMemoryUsagePercentage 使用中のクラスターのメモリの割合。これは、 used_memory/maxmemoryから を使用して計算されますINFO 割合 (%)
DatabaseMemoryUsageCountedForEvictPercentage オーバーヘッドと に使用されるメモリを除く、使用中のクラスターのメモリの割合COB。これは、 used_memory-mem_not_counted_for_evict/maxmemoryから を使用して計算されますINFO 割合 (%)
DB0AverageTTL INFO コマンドavg_ttlの 統計DBOから keyspace を公開します。レプリカはキーを失効させず、プライマリノードがキーを失効させるまで待機します。プライマリノードがキーを期限切れにする (または のためにキーを削除するLRU) と、DELコマンドが合成され、すべてのレプリカに送信されます。したがって、レプリカノードの DB0AverageTTL は、キーが期限切れにならないため、 を追跡しないため、0 になりますTTL。 ミリ秒
EngineCPUUtilization

Valkey または Redis OSS エンジンスレッドのCPU使用率を提供します。Valkey と Redis OSSはシングルスレッドであるため、このメトリクスを使用してプロセス自体の負荷を分析できます。EngineCPUUtilization メトリクスは、プロセスのより正確な可視性を提供します。CPUUtilization メトリクスと組み合わせて使用できます。 は、他のオペレーティングシステムや管理プロセスを含むサーバーインスタンス全体のCPU使用率をCPUUtilization公開します。4 vCPUs つ以上のノードタイプが大きい場合は、 EngineCPUUtilizationメトリクスを使用してスケーリングのしきい値をモニタリングおよび設定します。

注記

ElastiCache ホストでは、バックグラウンドプロセスがホストをモニタリングして、マネージドデータベースエクスペリエンスを提供します。これらのバックグラウンドプロセスは、CPUワークロードの大部分を占める可能性があります。これは、3 つ以上の を持つ大規模なホストでは重要ではありませんvCPUs。ただし、2 vCPUs 以下の小さいホストに影響を与える可能性があります。EngineCPUUtilization メトリクスのみをモニタリングする場合、ホストが Valkey または Redis からのCPU使用率が高くOSS、バックグラウンドモニタリングプロセスからのCPU使用率が高いという状況に気付くことはありません。したがって、2 vCPUs以下のホストの CPUUtilizationメトリクスをモニタリングすることをお勧めします。

割合 (%)
Evictions maxmemory の制限のため排除されたキーの数。これは、 の evicted_keys 統計から算出されますINFO Count
GlobalDatastoreReplicationLag これは、セカンダリリージョンのプライマリノードとプライマリリージョンのプライマリノード間の遅延です。クラスターモードが有効な Valkey または Redis の場合OSS、遅延はシャード間の最大遅延を示します。 [秒]
IamAuthenticationExpirations 期限切れの IAM認証済み Valkey または Redis OSS接続の合計数。IAM による認証 の詳細については、ユーザーガイドで確認できます。 Count
IamAuthenticationThrottling スロットリングされた IAM- 認証された Valkey または Redis OSSAUTHまたは HELLOリクエストの合計数。IAM による認証 の詳細については、ユーザーガイドで確認できます。 Count
IsMaster ノードが現在のシャード/クラスタのプライマリノードかどうかを示します。メトリクスは 0 (プライマリではない) または 1 (プライマリ) にすることができます。 Count
KeyAuthorizationFailures ユーザーがアクセス許可を持たないキーへのアクセスに失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 Count
KeysTracked Valkey または Redis キー追跡によって追跡されるOSSキーの数を の割合で表しますtracking-table-max-keys。キーラッキングは、クライアント側のキャッシュを支援するために使用され、キーが変更されたときにクライアントに通知します。 Count
MemoryFragmentationRatio Valkey または Redis OSS エンジンのメモリ割り当ての効率を示します。特定のしきい値は、異なる動作を意味します。推奨値は、1.0 を超える断片化です。これは、 mem_fragmentation_ratio statisticの から計算されますINFO 数値
NewConnections この期間内にサーバーによって受け入れられた接続の総数。これは、 の total_connections_received 統計から算出されますINFO
注記

Redis OSSバージョン 5 以前 ElastiCache で を使用している場合、このメトリクスによって報告された 2 つから 4 つの接続が ElastiCache によってクラスターのモニタリングに使用されます。ただし、 ElastiCache for Redis OSSバージョン 6 以降で を使用する場合、クラスターのモニタリング ElastiCache に が使用する接続は、このメトリクスに含まれません。

Count
NumItemsReadFromDisk ディスクから取得される 1 分あたりの項目の総数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 Count
NumItemsWrittenToDisk ディスクに書き込まれる 1 分あたりの項目の総数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 Count
MasterLinkHealthStatus このステータスの値は、0 または 1 のいずれかになります。値 0 は、プライマリノードの ElastiCacheデータが OSSの Valkey または Redis と同期していないことを示しますEC2。値 1 は、データが同期されていることを示します。移行を完了するには、 CompleteMigrationAPIオペレーションを使用します。 ブール値
Reclaimed キーの有効期限切れイベントの総数。これは、 の expired_keys 統計から算出されますINFO Count
ReplicationBytes レプリケートされたノードについては、ReplicationBytes は、プライマリがすべてのレプリカに対して送信するバイト数を報告します。このメトリクスは、レプリケーショングループに対する書き込み負荷を表します。これは、 の master_repl_offset 統計から算出されますINFO バイト
ReplicationLag このメトリクスは、リードレプリカとして実行中のノードにのみ適用できます。レプリカのプライマリノードからの変更適用の進行状況を秒で表します。Valkey 7.2 以降および Redis OSS5.0.6 以降では、遅延をミリ秒単位で測定できます。 [秒]
SaveInProgress このバイナリメトリクスは、バックグラウンド保存 (分岐または分岐なし) が進行中の場合は常に 1 を返し、それ以外の場合は 0 を返します。バックグラウンド保存プロセスは一般に、スナップショットおよび同期の際に使用されます。これらのオペレーションによりパフォーマンスが低下する可能性があります。SaveInProgress メトリクスを使用して、パフォーマンスが低下した原因がバックグラウンド保存プロセスであるかどうかを診断できます。これは、 の rdb_bgsave_in_progress 統計から算出されますINFO ブール値
TrafficManagementActive Redis ElastiCache の OSSが、受信コマンド、モニタリング、レプリケーションに割り当てられたトラフィックを調整することで、トラフィックをアクティブに管理しているかどうかを示します。トラフィックは、Valkey または Redis で処理できる数よりも多くのコマンドがノードに送信されると管理OSSされ、エンジンの安定性と最適なオペレーションを維持するために使用されます。データポイントが 1 の場合は、提供されているワークロードに対してノードが過小評価されていることを示している可能性があります。
注記

この指標が引き続き有効な場合は、クラスターを評価してスケールアップとスケールアウトのどちらが必要かを判断します。関連するメトリクスには、NetworkBandwidthOutAllowanceExceeded および EngineCPUUtilization が含まれます。

ブール値
SuccessfulWriteRequestLatency

成功した書き込みリクエストのレイテンシー。

有効な統計: Average、Sum、Min、Max、Sample Count、p0 から p100 までの任意のパーセンタイル。サンプル数には、正常に実行されたコマンドのみが含まれます。

マイクロ秒
SuccessfulReadRequestLatency

読み取りリクエストが成功するまでのレイテンシー。

有効な統計: Average、Sum、Min、Max、Sample Count、p0 から p100 までの任意のパーセンタイル。サンプル数には、正常に実行されたコマンドのみが含まれます。

マイクロ秒
ErrorCount

指定された期間中に失敗したコマンドの合計数。

有効な統計: Average、Sum、Min、Max

Count
E のngineCPUUtilization 可用性

AWS 以下にリストされているリージョンは、サポートされているすべてのノードタイプで使用できます。

リージョン リージョン名
us-east-2 米国東部(オハイオ)
us-east-1 米国東部 (バージニア北部)
us-west-1 米国西部 (北カリフォルニア)
us-west-2 米国西部 (オレゴン)
ap-northeast-1 アジアパシフィック (東京)
ap-northeast-2 アジアパシフィック (ソウル)
ap-northeast-3 アジアパシフィック (大阪)
ap-east-1 アジアパシフィック (香港)
ap-south-1 アジアパシフィック (ムンバイ)
ap-southeast-1 アジアパシフィック (シンガポール)
ap-southeast-2 アジアパシフィック (シドニー)
ap-southeast-3 アジアパシフィック (ジャカルタ)
ca-central-1 カナダ (中部)
cn-north-1 中国 (北京)
cn-northwest-2 中国 (寧夏)
me-south-1 中東 (バーレーン)
eu-central-1 欧州 (フランクフルト)
eu-west-1 欧州 (アイルランド)
eu-west-2 欧州 (ロンドン)
eu-west-3 欧州(パリ)
eu-south-1 欧州 (ミラノ)
af-south-1 アフリカ (ケープタウン)
eu-north-1 欧州 (ストックホルム)
sa-east-1 南米 (サンパウロ)
us-gov-west-1 AWS GovCloud (米国西部)
us-gov-east-1 AWS GovCloud (米国東部)

以下は特定の種類のコマンドの集計で、info commandstats から算出されています。commandstats セクションには、呼び出し数、これらのコマンドが消費した合計CPU時間、コマンド実行あたりの平均CPU消費時間など、コマンドタイプに基づく統計が表示されます。コマンドタイプごとに、次の行が追加されます: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX

以下に示すレイテンシーメトリクスは、 の commandstats 統計を使用して計算されますINFO。それらは次のように計算されます: delta(usec)/delta(calls)delta は、1 分以内の差分として計算されます。レイテンシーは、 がコマンドを処理する ElastiCache のにかかったCPU時間として定義されます。データ階層化を使用するクラスターの場合、 から項目を取得するのにかかる時間はこれらの測定値に含まれSSDないことに注意してください。

利用可能なコマンドの完全なリストについては、Valkey ドキュメントの「commands」を参照してください。

メトリクス 説明 [単位]
ClusterBasedCmds クラスターベースのコマンドの総数。これは、クラスターに対して実行されるすべてのコマンド (cluster slotcluster info など) を合計することによって commandstats 統計から算出されます。 Count
ClusterBasedCmdsLatency クラスターベースのコマンドのレイテンシー。 マイクロ秒
EvalBasedCmds eval ベースのコマンドの合計数。これは、evalevalsha を合計することによって commandstats 統計から算出されます。 Count
EvalBasedCmdsLatency Eval ベースのコマンドのレイテンシー。 マイクロ秒
GeoSpatialBasedCmds 地理空間ベースのコマンドの総数。これは commandstats 統計から算出されます。これは、すべての geo の種類のコマンド (geoaddgeodistgeohashgeoposgeoradius、および georadiusbymember) を合計することによって算出されます。 Count
GeoSpatialBasedCmdsLatency 地理空間ベースのコマンドのレイテンシー。 マイクロ秒
GetTypeCmds read-only 型のコマンドの合計数。これは、すべての read-only の種類のコマンド (gethgetscardlrange など) を合計することによって commandstats 統計から算出されます。 Count
GetTypeCmdsLatency 読み取りコマンドのレイテンシー。 マイクロ秒
HashBasedCmds ハッシュベースのコマンドの総数。これは、1 つ以上のハッシュに対して実行されるすべてのコマンド (hgethkeyshvalshdel など) を合計することによって commandstats 統計から算出されます。 Count
HashBasedCmdsLatency ハッシュベースのコマンドのレイテンシー。 マイクロ秒
HyperLogLogBasedCmds HyperLogLog ベースのコマンドの合計数。これは、すべての pf の種類のコマンド (pfaddpfcountpfmerge など) を合計することによって commandstats 統計から算出されます。 Count
HyperLogLogBasedCmdsLatency HyperLogLogベースのコマンドのレイテンシー。 マイクロ秒
JsonBasedCmds 読み取りJSONコマンドと書き込みコマンドの両方を含むコマンドの合計数。これは、JSONキーに対して実行されるすべてのJSONコマンドを合計することによって commandstats 統計から算出されます。 Count
JsonBasedCmdsLatency 読み取りJSONコマンドと書き込みコマンドの両方を含む、すべてのコマンドのレイテンシー。 マイクロ秒
JsonBasedGetCmds JSON 読み取り専用コマンドの合計数。これは、 JSON キーに対して実行されるすべてのJSON読み取りコマンドを合計することによってcommandstats、 統計から算出されます。 Count
JsonBasedGetCmdsLatency JSON 読み取り専用コマンドのレイテンシー。 マイクロ秒
JsonBasedSetCmds JSON 書き込みコマンドの合計数。これは、 JSON キーに対して実行されるすべてのJSON書き込みコマンドを合計することによって commandstats統計から算出されます。 Count
JsonBasedSetCmdsLatency JSON 書き込みコマンドのレイテンシー。 マイクロ秒
KeyBasedCmds キーベースのコマンドの総数。これは、複数のデータ構造で 1 つ以上のキーに対して実行されるすべてのコマンド (delexpirerename など) を合計することによって、commandstats 統計から算出されます。 Count
KeyBasedCmdsLatency キーベースのコマンドのレイテンシー。 マイクロ秒
ListBasedCmds リストベースのコマンドの総数。これは、1 つ以上のリストに対して実行されるすべてのコマンド (lindexlrangelpushltrim など) を合計することによって commandstats 統計から算出されます。 Count
ListBasedCmdsLatency リストベースのコマンドのレイテンシー。 マイクロ秒
NonKeyTypeCmds キーベースではないコマンドの合計数。これは、キーに対して実行されないすべてのコマンド (acldbsizeinfo など) を合計することによって commandstats 統計から算出されます。 Count
NonKeyTypeCmdsLatency コマンドの non-key-basedレイテンシー。 マイクロ秒
PubSubBasedCmds pub/sub 機能のコマンドの総数。これは、pub/sub 機能で使用されるすべてのコマンド (psubscribepublishpubsubpunsubscribessubscribesunsubscribespublishsubscribeunsubscribe) を合計することによって commandstats 統計から算出されます。 Count
PubSubBasedCmdsLatency PubSubBased コマンドのレイテンシー。 マイクロ秒
SetBasedCmds セットベースのコマンドの総数。これは、1 つ以上のセットに対して実行されるすべてのコマンド (scardsdiffsaddsunion など) を合計することによって commandstats 統計から算出されます。 Count
SetBasedCmdsLatency セットベースのコマンドのレイテンシー。 マイクロ秒
SetTypeCmds write 型のコマンドの合計数。これは、データ上で動作する mutative の種類のすべてのコマンド (sethsetsaddlpop など) を合計することによって commandstats 統計から算出されます。 Count
SetTypeCmdsLatency 書き込みコマンドのレイテンシー。 マイクロ秒
SortedSetBasedCmds ソートされたセットベースのコマンドの総数。これは、1 つ以上のソートされたセットに対して実行されるすべてのコマンド (zcountzrangezrankzadd など) を合計することによって commandstats 統計から算出されます。 Count
SortedSetBasedCmdsLatency ソートベースのコマンドのレイテンシー。 マイクロ秒
StringBasedCmds 文字列ベースのコマンドの総数。これは、1 つ以上の文字列に対して実行されるすべてのコマンド (strlensetexsetrange など) を合計することによって commandstats 統計から算出されます。 Count
StringBasedCmdsLatency 文字列ベースのコマンドのレイテンシー。 マイクロ秒
StreamBasedCmds ストリームベースのコマンドの総数。これは、1 つ以上のストリームデータの種類に対して実行されるすべてのコマンド (xrangexlenxaddxdel など) を合計することによって commandstats 統計から算出されます。 Count
StreamBasedCmdsLatency ストリームベースのコマンドのレイテンシー。 マイクロ秒