Valkey 및 Redis에 대한 지표 OSS - Amazon ElastiCache

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Valkey 및 Redis에 대한 지표 OSS

Amazon ElastiCache 네임스페이스에는 다음과 같은 Valkey 및 Redis OSS 지표가 포함됩니다. 이러한 지표는 Valkey 엔진을 사용할 때와 동일합니다.

ReplicationLag 및 를 제외하고 EngineCPUUtilization이러한 지표는 info 명령에서 파생됩니다. 각 지표는 캐시 노드 수준에서 계산됩니다.

info 명령에 대한 전체 설명서는 http://valkey.io/commands/info 참조하세요.

참고 항목

지표 설명 단위
ActiveDefragHits 활성 조각 모음 프로세스에서 수행된 분당 값 재할당 수입니다. 이는 active_defrag_hits 의 통계에서 파생됩니다INFO. 숫자
AuthenticationFailures AUTH 명령을 OSS 사용하여 Valkey 또는 Redis에 인증하려는 총 실패한 시도 횟수입니다. ACL LOG 명령을 사용하여 개별 인증 실패에 대한 자세한 정보를 찾을 수 있습니다. 무단 액세스 시도를 감지하려면 이에 대한 경보를 설정하는 것이 좋습니다. 개수
BytesUsedForCache 데이터 세트, 버퍼 등을 포함하여 모든 목적에 OSS 대해 Valkey 또는 Redis에서 할당한 총 바이트 수입니다. 바이트
Dimension: Tier=Memory 를 사용하는 Valkey 또는 Redis OSS 클러스터의 경우의 데이터 계층화 ElastiCache: 메모리별 캐시에 사용되는 총 바이트 수입니다. 이는 used_memory 의 통계 값입니다INFO. 바이트
Dimension: Tier=SSD 를 사용하는 Valkey 또는 Redis OSS 클러스터의 경우의 데이터 계층화 ElastiCache: 에서 캐시에 사용하는 총 바이트 수입니다SSD. 바이트
BytesReadFromDisk 분당 디스크에서 읽은 총 바이트 수입니다. 의 데이터 계층화 ElastiCache를 사용하는 클러스터에서만 지원됩니다. 바이트
BytesWrittenToDisk 분당 디스크에 쓴 총 바이트 수입니다. 의 데이터 계층화 ElastiCache를 사용하는 클러스터에서만 지원됩니다. 바이트
CacheHits 기본 사전의 성공한 읽기 전용 키 조회수입니다. 이는 keyspace_hits 의 통계에서 파생됩니다INFO. 개수
CacheMisses 기본 사전의 성공하지 못한 읽기 전용 키 조회 수입니다. 이는 keyspace_misses 의 통계에서 파생됩니다INFO. 개수
CommandAuthorizationFailures 사용자가 호출 권한이 없는 명령을 실행한 실패한 시도의 총 수입니다. ACL LOG 명령을 사용하여 개별 인증 실패에 대한 자세한 정보를 찾을 수 있습니다. 무단 액세스 시도를 감지하려면 이에 대한 경보를 설정하는 것이 좋습니다. 개수
CacheHitRate Valkey 또는 Redis OSS 인스턴스의 사용 효율성을 나타냅니다. 캐시 비율이 약 0.8보다 낮으면 상당한 양의 키가 제거되거나, 만료되거나, 존재하지 않음을 의미합니다. 이는 cache_hitscache_misses 통계를 사용하여 다음과 같은 방식으로 계산됩니다. cache_hits /(cache_hits + cache_misses) %
ChannelAuthorizationFailures 사용자가 액세스 권한이 없는 채널에 액세스 실패한 시도의 총 수입니다. ACL LOG 명령을 사용하여 개별 인증 실패에 대한 자세한 정보를 찾을 수 있습니다. 무단 액세스 시도를 감지하려면 이 지표에 대한 경보를 설정하는 것이 좋습니다. 개수
CurrConnections 읽기 전용 복제본의 연결을 제외한 클라이언트 연결 수. 각 경우에 클러스터를 모니터링하기 위해 연결 중 2~4개를 ElastiCache 사용합니다. 이는 connected_clients 의 통계에서 파생됩니다INFO. 개수
CurrItems 캐시 항목 수입니다. 이는 keyspace 통계에서 파생되어 전체 키스페이스의 모든 키를 합산합니다. 개수
의 데이터 계층화 ElastiCache를 사용하는 클러스터용 Dimension: Tier=Memory입니다. 메모리에 있는 항목 수입니다. 개수
의 데이터 계층화 ElastiCache를 사용하는 클러스터용 Dimension: Tier=SSD(solid state drives)입니다. 의 항목 수입니다SSD. 개수
CurrVolatileItems ttl이 설정된 모든 데이터베이스의 총 키 수입니다. 이는 expires 통계에서 파생되어 모든 키를 전체 키스페이스의 ttl 세트와 합산합니다. 개수
DatabaseCapacityUsagePercentage

사용 중인 클러스터용 전체 데이터 용량의 백분율입니다.

데이터 계층형 인스턴스의 경우 지표는 로 계산되며(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), 여기서 used_memorymaxmemory는 에서 가져옵니다INFO.

다른 모든 경우 지표는 를 사용하여 계산됩니다used_memory/maxmemory.

%
DatabaseCapacityUsageCountedForEvictPercentage

오버헤드 및 에 사용되는 메모리를 제외하고 사용 중인 클러스터의 총 데이터 용량의 백분율입니다COB. 이 지표는 다음과 같이 계산됩니다.

used_memory - mem_not_counted_for_evict/maxmemory

데이터 계층형 인스턴스에서 지표는 다음과 같이 계산됩니다.

(used_memory + SSD used) / (maxmemory + SSD total capacity)

여기서 used_memorymaxmemory는 에서 가져옵니다. INFO

%
DatabaseMemoryUsagePercentage 사용 중인 클러스터용 메모리의 백분율입니다. 이는 used_memory/maxmemory의 를 사용하여 계산됩니다INFO. %
DatabaseMemoryUsageCountedForEvictPercentage 오버헤드 및 에 사용되는 메모리를 제외하고 사용 중인 클러스터의 메모리 백분율입니다COB. 이는 used_memory-mem_not_counted_for_evict/maxmemory의 를 사용하여 계산됩니다INFO. %
DB0AverageTTL INFO 명령 통계avg_ttlDBO에서 keyspace 를 노출합니다. 복제본은 키를 만료 처리하지 않고 프라이머리 노드에서 키를 만료 처리할 때까지 기다립니다. 기본 노드가 키가 만료되면(또는 로 인해 제거되면LRU) 모든 복제본으로 전송되는 DEL 명령을 합성합니다. 따라서 DB0AverageTTL는 복제본 노드의 경우 키가 만료되지 않아 를 추적하지 않기 때문에 0입니다TTL. 밀리초
EngineCPUUtilization

Valkey 또는 Redis OSS 엔진 스레드의 CPU 사용률을 제공합니다. Valkey와 RedisOSS는 단일 스레드이므로 이 지표를 사용하여 프로세스 자체의 부하를 분석할 수 있습니다. EngineCPUUtilization 지표는 프로세스에 대한 보다 정확한 가시성을 제공합니다. 지표와 함께 사용할 수 있습니다. CPUUtilization 는 다른 운영 체제 및 관리 프로세스를 포함하여 서버 인스턴스의 CPU 사용률을 전체적으로 CPUUtilization 노출합니다. 4개 vCPUs 이상의 더 큰 노드 유형의 경우 EngineCPUUtilization 지표를 사용하여 조정을 위한 임계값을 모니터링하고 설정합니다.

참고

ElastiCache 호스트에서 백그라운드 프로세스는 호스트를 모니터링하여 관리형 데이터베이스 환경을 제공합니다. 이러한 백그라운드 프로세스는 CPU 워크로드의 상당 부분을 차지할 수 있습니다. 이는 가 2개 이상인 대규모 호스트에서는 중요하지 않습니다vCPUs. 하지만 2개 vCPUs 이하의 작은 호스트에 영향을 미칠 수 있습니다. EngineCPUUtilization 지표만 모니터링하는 경우 Valkey 또는 Redis에서 사용량이 많OSS고 백그라운드 모니터링 프로세스에서 CPU 사용량이 많은 호스트CPU가 과부하되는 상황을 알지 못합니다. 따라서 CPUUtilization 2개 vCPUs 이하의 호스트에 대한 지표를 모니터링하는 것이 좋습니다.

%
Evictions maxmemory 제한으로 인해 제거된 키 수입니다. 이는 evicted_keys 의 통계에서 파생됩니다INFO. 개수
GlobalDatastoreReplicationLag 보조 리전의 기본 노드와 기본 리전의 기본 노드 간의 지연입니다. 클러스터 모드가 활성화된 Valkey 또는 Redis OSS의 경우 지연은 샤드 간의 최대 지연을 나타냅니다.
IamAuthenticationExpirations 만료된 IAM인증된 Valkey 또는 Redis OSS 연결의 총 수입니다. IAM을 사용하는 인증에 대한 자세한 내용은 사용 설명서를 참조하세요. 개수
IamAuthenticationThrottling 제한된 IAM인증된 Valkey 또는 Redis OSS AUTH 또는 HELLO 요청의 총 수입니다. IAM을 사용하는 인증에 대한 자세한 내용은 사용 설명서를 참조하세요. 개수
IsMaster 노드가 현재 샤드/클러스터의 기본 노드인지 여부를 나타냅니다. 이 지표는 0(기본 노드 아님) 또는 1(기본 노드임)일 수 있습니다. 개수
KeyAuthorizationFailures 사용자가 액세스 권한이 없는 키에 액세스한 실패한 시도의 총 수입니다. ACL LOG 명령을 사용하여 개별 인증 실패에 대한 자세한 정보를 찾을 수 있습니다. 무단 액세스 시도를 감지하려면 이에 대한 경보를 설정하는 것이 좋습니다. 개수
KeysTracked Valkey 또는 Redis 키 추적으로 추적되는 OSS 키 수를 의 백분율로 나타낸 것입니다tracking-table-max-keys. 키 추적은 클라이언트 측 캐싱을 지원하고 키가 수정된 경우, 클라이언트에 알리는 데 사용됩니다. 개수
MemoryFragmentationRatio Valkey 또는 Redis OSS 엔진의 메모리 할당 효율성을 나타냅니다. 특정 임계값은 다른 동작을 나타냅니다. 조각화를 1.0 이상으로 설정하는 것이 좋습니다. 이는 mem_fragmentation_ratio statistic 의 에서 계산됩니다INFO. 숫자
NewConnections 이 기간에 서버에서 허용된 총 연결 수입니다. 이는 total_connections_received 의 통계에서 파생됩니다INFO.
참고

ElastiCache (Redis OSS) 버전 5 이하를 사용하는 경우 이 지표에서 보고하는 연결 중 2~4개가 에서 클러스터를 모니터링하는 ElastiCache 데 사용됩니다. 그러나 ElastiCache (Redis OSS) 버전 6 이상을 사용하는 경우 에서 클러스터를 모니터링하는 ElastiCache 데 사용하는 연결은 이 지표에 포함되지 않습니다.

개수
NumItemsReadFromDisk 분당 디스크에서 검색된 총 항목 수입니다. 의 데이터 계층화 ElastiCache를 사용하는 클러스터에서만 지원됩니다. 개수
NumItemsWrittenToDisk 분당 디스크에 기록된 총 항목 수입니다. 의 데이터 계층화 ElastiCache를 사용하는 클러스터에서만 지원됩니다. 개수
MasterLinkHealthStatus 이 상태에는 0 또는 1의 두 가지 값이 있습니다. 값 0은 기본 노드의 ElastiCache 데이터가 OSS 의 Valkey 또는 Redis와 동기화되지 않았음을 나타냅니다EC2. 값 1은 데이터가 동기화되었음을 나타냅니다. 마이그레이션을 완료하려면 CompleteMigration API 작업을 사용합니다.
Reclaimed 키 만료 이벤트 총 수입니다. 이는 expired_keys 의 통계에서 파생됩니다INFO. 개수
ReplicationBytes 복제된 구성 노드의 경우 ReplicationBytes가 기본 노드에서 모든 복제본에 전송하는 바이트 수를 보고합니다. 이 지표는 복제 그룹에 대한 쓰기 부하를 나타냅니다. 이는 master_repl_offset 의 통계에서 파생됩니다INFO. 바이트
ReplicationLag 이 지표는 읽기 복제본으로 실행되는 노드에 한해 적용됩니다. 기본 노드에서 변경 내용을 적용할 때 복제본에서 경과된 시간(초)을 나타냅니다. Valkey 7.2 이상 및 Redis OSS 엔진 버전 5.0.6 이상의 경우 지연을 밀리초 단위로 측정할 수 있습니다.
SaveInProgress 이 이진 지표는 백그라운드 저장(forked 또는 forkless)가 진행 중일 때마다 1을, 그렇지 않으면 0을 반환합니다. 백그라운드 저장 프로세스는 일반적으로 스냅샷 작업과 동기화 작업에 사용됩니다. 하지만 이 두 가지 작업은 성능 저하의 원인이 되기도 합니다. 이때는 SaveInProgress 지표를 사용하면 백그라운드 저장 프로세스로 인한 성능 저하 여부를 진단할 수 있습니다. 이는 rdb_bgsave_in_progress 의 통계에서 파생됩니다INFO.
TrafficManagementActive ElastiCache (Redis OSS)가 수신 명령, 모니터링 또는 복제에 할당된 트래픽을 조정하여 트래픽을 적극적으로 관리하고 있는지 여부를 나타냅니다. 트래픽은 Valkey 또는 Redis에서 처리할 수 있는 것보다 많은 명령이 노드로 전송될 때 관리OSS되며 엔진의 안정성과 최적의 작동을 유지하는 데 사용됩니다. 데이터 포인트가 1이면 노드가 제공되는 워크로드에 대해 적게 크기 조정되었음을 나타낼 수 있습니다.
참고

이 지표가 활성 상태로 유지되면 클러스터를 평가하여 스케일 업 또는 스케일 아웃이 필요한지 결정하세요. 관련 지표에는 NetworkBandwidthOutAllowanceExceededEngineCPUUtilization이 포함됩니다.

E ngineCPUUtilization 가용성

AWS 다음 나열된 리전은 지원되는 모든 노드 유형에서 사용할 수 있습니다.

리전 리전 이름
us-east-2 미국 동부(오하이오)
us-east-1 미국 동부(버지니아 북부)
us-west-1 미국 서부(캘리포니아 북부)
us-west-2 미국 서부(오레곤)
ap-northeast-1 아시아 태평양(도쿄)
ap-northeast-2 아시아 태평양(서울)
ap-northeast-3 아시아 태평양(오사카)
ap-east-1 아시아 태평양(홍콩)
ap-south-1 아시아 태평양(뭄바이)
ap-southeast-1 아시아 태평양(싱가포르)
ap-southeast-2 아시아 태평양(시드니)
ap-southeast-3 아시아 태평양(자카르타)
ca-central-1 캐나다(중부)
cn-north-1 중국(베이징)
cn-northwest-2 중국(닝샤)
me-south-1 중동(바레인)
eu-central-1 유럽(프랑크푸르트)
eu-west-1 유럽(아일랜드)
eu-west-2 유럽(런던)
eu-west-3 EU(파리)
eu-south-1 유럽(밀라노)
af-south-1 아프리카(케이프타운)
eu-north-1 유럽(스톡홀름)
sa-east-1 남아메리카(상파울루)
us-gov-west-1 AWS GovCloud (미국 서부)
us-gov-east-1 AWS GovCloud (미국 동부)

다음은 info commandstats에서 파생된 몇 가지 유형의 명령 모음입니다. 명령 통계 섹션에서는 호출 수, 이러한 명령에서 소비한 총 CPU 시간, 명령 실행당 CPU 소비한 평균을 포함하여 명령 유형에 따른 통계를 제공합니다. 각 명령 유형에 다음 행이 추가됩니다. cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX

다음 대기 시간 지표는 의 명령 통계 통계를 사용하여 계산됩니다INFO. 이러한 지표는 delta(usec)/delta(calls) 방식으로 계산됩니다. delta는 1분 이내의 차이로 계산됩니다. 지연 시간은 명령을 처리하는 ElastiCache 데 걸리는 CPU 시간으로 정의됩니다. 데이터 계층화를 사용하는 클러스터의 경우 항목을 가져오는 데 걸리는 시간은 이러한 측정에 포함되지 SSD 않습니다.

사용 가능한 명령의 전체 목록은 Valkey 설명서의 명령을 참조하세요.

지표 설명 단위
ClusterBasedCmds 클러스트 기반 명령 총 수입니다. 이는 클러스터(cluster slot, cluster info등)에 작용하는 모든 명령을 합산하여 commandstats 통계에서 파생됩니다. 개수
ClusterBasedCmdsLatency 클러스터 기반 명령의 대기 시간입니다. 마이크로초
EvalBasedCmds EVAL 기반 명령의 총 명령 수입니다. 이는 commandstats eval, 를 합산하여 통계에서 파생됩니다evalsha. 개수
EvalBasedCmdsLatency eval 기반 명령의 대기 시간입니다. 마이크로초
GeoSpatialBasedCmds geospatial 기반 명령의 총 명령 수입니다. 이는 commandstats 통계에서 파생됩니다. 이 수는 모든 geo 유형의 명령(geoadd, geodist, geohash, geopos, georadiusgeoradiusbymember)을 합산하여 계산됩니다. 개수
GeoSpatialBasedCmdsLatency geospatial 기반 명령의 대기 시간입니다. 마이크로초
GetTypeCmds read-only 유형 명령의 총 건수입니다. 이는 모든 read-only 유형 명령(get, commandstats , hget, scard lrange등)을 합산하여 통계에서 파생됩니다. 개수
GetTypeCmdsLatency 읽기 명령의 지연 시간. 마이크로초
HashBasedCmds 해시 기반 명령의 총 수입니다. 이는 하나 이상의 commandstats 해시(hget, , hkeys, hvals hdel등)에 대해 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
HashBasedCmdsLatency 해시 기반 명령의 지연 시간. 마이크로초
HyperLogLogBasedCmds HyperLogLog 기반 명령 총 건수입니다. 이는 모든 pf 유형의 명령(pfadd, commandstats pfcount, pfmerge등)을 합산하여 통계에서 파생됩니다. 개수
HyperLogLogBasedCmdsLatency HyperLogLog기반 명령의 지연 시간입니다. 마이크로초
JsonBasedCmds 읽기 및 쓰기 JSON 명령을 모두 포함한 총 명령 수입니다. 이는 JSON 키에 따라 작동하는 모든 JSON 명령을 합산하여 commandstats 통계에서 파생됩니다. 개수
JsonBasedCmdsLatency 읽기 및 쓰기 JSON 명령을 포함한 모든 명령의 지연 시간입니다. 마이크로초
JsonBasedGetCmds JSON 읽기 전용 명령의 총 수입니다. 이는 JSON 키에 작용하는 모든 JSON 읽기 명령을 합산하여 commandstats 통계에서 파생됩니다. 개수
JsonBasedGetCmdsLatency JSON 읽기 전용 명령의 지연 시간입니다. 마이크로초
JsonBasedSetCmds 총 JSON 쓰기 명령 수입니다. 이는 JSON 키에 작용하는 모든 JSON 쓰기 명령을 합산하여 commandstats 통계에서 파생됩니다. 개수
JsonBasedSetCmdsLatency JSON 쓰기 명령의 지연 시간입니다. 마이크로초
KeyBasedCmds 키 기반 명령 총 수입니다. 이는 여러 데이터 구조(del, commandstats expirerename, 등)에서 하나 이상의 키에 대해 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
KeyBasedCmdsLatency 키 기반 명령의 지연 시간. 마이크로초
ListBasedCmds 목록 기반 명령 총 수입니다. 이는 하나 이상의 목록(lindex, commandstats , lrange, lpush ltrim등)에 따라 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
ListBasedCmdsLatency 목록 기반 명령의 지연 시간. 마이크로초
NonKeyTypeCmds 키 기반이 아닌 명령의 총 수입니다. 이는 commandstats 또는 와 같이 키에 대해 작동하지 않는 모든 명령을 합산하여 통계에서 파생됩니다acldbsizeinfo. 개수
NonKeyTypeCmdsLatency 명령의 지연 시간 non-key-based입니다. 마이크로초
PubSubBasedCmds pub/sub 기능의 명령 총 수입니다. 이는 psubscribe, , , , , publish, , , pubsub, , 와 같은 pub/sub 기능에 사용되는 모든 명령을 합산하여 commandstats통계에서 파생됩니다punsubscribessubscribesunsubscribespublishsubscribeunsubscribe. 개수
PubSubBasedCmdsLatency pub/sub 기반 명령의 대기 시간입니다. 마이크로초
SetBasedCmds 집합 기반 명령 총 수입니다. 이는 하나 이상의 세트(scard, commandstats , sdiff, sadd sunion등)에 대해 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
SetBasedCmdsLatency 집합 기반 명령의 지연 시간. 마이크로초
SetTypeCmds write 유형의 총 명령 건수입니다. 이는 데이터에서 작동하는 모든 mutative 유형의 명령(set, commandstats , hset, sadd lpop등)을 합산하여 통계에서 파생됩니다. 개수
SetTypeCmdsLatency 쓰기 명령의 지연 시간. 마이크로초
SortedSetBasedCmds 정렬된 집합 기반 명령 총 수입니다. 이는 하나 이상의 정렬된 세트(zcount, commandstats , zrange, zrank zadd등)에 대해 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
SortedSetBasedCmdsLatency 정렬 기반 명령의 지연 시간. 마이크로초
StringBasedCmds 문자열 기반 명령 총 수입니다. 이는 하나 이상의 문자열(strlen, commandstats , setex setrange등)에 대해 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
StringBasedCmdsLatency 문자열 기반 명령 지연 시간 마이크로초
StreamBasedCmds 총 스트림 기반 명령 수입니다. 이는 하나 이상의 스트림 데이터 유형(xrange, commandstats , xlen, xadd xdel등)에 따라 작동하는 모든 명령을 합산하여 통계에서 파생됩니다. 개수
StreamBasedCmdsLatency 스트림 기반 명령의 지연 시간. 마이크로초