Métricas para Valkey e Redis OSS - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Métricas para Valkey e Redis OSS

O Amazon ElastiCache namespace inclui as seguintes métricas do Valkey e do Redis. OSS Essas métricas são as mesmas quando se usa o mecanismo Valkey.

Com exceção deReplicationLag,, EngineCPUUtilizationSuccessfulWriteRequestLatency, eSuccessfulReadRequestLatency, essas métricas são derivadas do info comando. Cada métrica é calculada no nível de nó de cache.

Para obter a documentação completa do info comando, consulte http://valkey. io/commands/info.

Consulte também

Métrica Descrição Unidade
ActiveDefragHits O número de realocações de valor por minuto executada pelo processo de desfragmentação ativo. Isso é derivado da active_defrag_hits estatística em INFO. Número
AuthenticationFailures O número total de tentativas malsucedidas de autenticação no Valkey ou no Redis OSS usando o comando. AUTH Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
BytesUsedForCache O número total de bytes alocados pelo Valkey ou pelo Redis OSS para todos os fins, incluindo o conjunto de dados, os buffers e assim por diante. Bytes
Dimension: Tier=Memorypara OSS clusters Valkey ou Redis usandoHierarquização de dados em ElastiCache: O número total de bytes usados para cache por memória. Esse é o valor da used_memory estatística em INFO. Bytes
Dimension: Tier=SSDpara OSS clusters Valkey ou Redis usandoHierarquização de dados em ElastiCache: O número total de bytes usados para cache por. SSD Bytes
BytesReadFromDisk O número total de bytes lidos no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
BytesWrittenToDisk O número total de bytes gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
CacheHits O número de buscas de chaves somente leitura bem-sucedidas no dicionário principal. Isso é derivado da keyspace_hits estatística em INFO. Contagem
CacheMisses O número de buscas de chaves somente leitura malsucedidas no dicionário principal. Isso é derivado da keyspace_misses estatística em INFO. Contagem
CommandAuthorizationFailures O número total de tentativas falhadas por usuários para executar comandos que eles não têm permissão para chamar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
CacheHitRate Indica a eficiência de uso da instância Valkey ou RedisOSS. Se a proporção de cache for inferior a aproximadamente 0,8, isso significa que uma quantidade significativa de chaves são despejadas, expiradas ou não existem. Isso é calculado usando as estatísticas cache_hits e cache_misses da seguinte maneira: cache_hits /(cache_hits + cache_misses). Percentual
ChannelAuthorizationFailures O número total de tentativas falhadas por usuários de acessar canais que eles não têm permissão para acessar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme nesta métrica para detectar tentativas de acesso não autorizadas. Contagem
CurrConnections O número de conexões de clientes, excluindo conexões de réplicas de leitura. ElastiCache usa de 4 a 6 conexões para monitorar o cluster em cada caso. Isso é derivado da connected_clients estatística em INFO. Contagem
CurrItems O número de itens no cache. Deriva da estatística keyspace, somando todas as chaves em todo o espaço de chaves. Contagem
Dimension: Tier=Memory para clusters usando Hierarquização de dados em ElastiCache. O número de itens em memória. Contagem
Dimension: Tier=SSD (unidades de estado sólido) para clusters usando Hierarquização de dados em ElastiCache. O número de itens emSSD. Contagem
CurrVolatileItems Número total de chaves em todos os bancos de dados que têm um ttl definido. Deriva da estatística expires, somando todas as chaves com um ttl definido em todo o keyspace. Contagem
DatabaseCapacityUsagePercentage

Porcentagem da capacidade total de dados para o cluster que está em uso.

Em instâncias com camadas de dados, a métrica é calculada como(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), de onde used_memory e de onde maxmemory são INFOtiradas.

Em todos os outros casos, a métrica é calculada usando used_memory/maxmemory.

Percentual
DatabaseCapacityUsageCountedForEvictPercentage

Porcentagem da capacidade total de dados do cluster que está em uso, excluindo a memória usada para sobrecarga e. COB Essa métrica é calculada como:

used_memory - mem_not_counted_for_evict/maxmemory

Em instâncias de dados em camadas, a métrica é calculada como:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

de onde used_memory e de onde maxmemory são retirados INFO

Percentual
DatabaseMemoryUsagePercentage Porcentagem de memória para o cluster que está em uso. Isso é calculado usando used_memory/maxmemory from INFO. Percentual
DatabaseMemoryUsageCountedForEvictPercentage Porcentagem da memória do cluster que está em uso, excluindo a memória usada para sobrecarga e. COB Isso é calculado usando used_memory-mem_not_counted_for_evict/maxmemory from INFO. Percentual
DB0AverageTTL Exposições avg_ttl DBO da keyspace estatística de comando. INFO As réplicas não expiram as chaves; em vez disso, esperam que os nós primários expirem as chaves. Quando um nó primário expira uma chave (ou a expulsa por causa delaLRU), ele sintetiza um DEL comando, que é transmitido para todas as réplicas. Portanto, DB0Average TTL é 0 para nós de réplica, devido ao fato de que eles não expiram as chaves e, portanto, não rastreiam. TTL Milissegundos
EngineCPUUtilization

Fornece CPU a utilização do encadeamento do mecanismo Valkey ou RedisOSS. Como o Valkey e o Redis OSS são de um único segmento, você pode usar essa métrica para analisar a carga do processo em si. A métrica EngineCPUUtilization fornece uma visibilidade mais precisa do processo. Você pode usá-lo em conjunto com a CPUUtilization métrica. CPUUtilizationexpõe CPU a utilização da instância do servidor como um todo, incluindo outros sistemas operacionais e processos de gerenciamento. Para tipos de nós maiores com quatro vCPUs ou mais, use a EngineCPUUtilization métrica para monitorar e definir limites para escalabilidade.

nota

Em um ElastiCache host, os processos em segundo plano monitoram o host para fornecer uma experiência de banco de dados gerenciado. Esses processos em segundo plano podem ocupar uma parte significativa da CPU carga de trabalho. Isso não é significativo em hosts maiores com mais de doisvCPUs. Mas isso pode afetar hospedeiros menores com 2 vCPUs ou menos. Se você monitorar apenas a EngineCPUUtilization métrica, não terá conhecimento das situações em que o host está sobrecarregado com o alto CPU uso do Valkey ou do Redis OSS e com o alto CPU uso dos processos de monitoramento em segundo plano. Portanto, recomendamos monitorar a CPUUtilization métrica para hosts com dois vCPUs ou menos.

Percentual
Evictions O número de chaves que foram removidas devido ao limite maxmemory. Isso é derivado da evicted_keys estatística em INFO. Contagem
GlobalDatastoreReplicationLag Esse é o atraso entre o nó primário da região secundária e o nó primário da região primária. Para Valkey ou Redis habilitado para o modo de clusterOSS, o atraso indica o atraso máximo entre os fragmentos. Segundos
IamAuthenticationExpirations O número total de conexões Valkey ou Redis IAM autenticadas e expiradas. OSS Você pode encontrar mais informações sobre o Autenticação com IAM no guia do usuário. Contagem
IamAuthenticationThrottling O número total de solicitações ou solicitações Valkey ou Redis IAM autenticadas por limitação. OSS AUTH HELLO Você pode encontrar mais informações sobre o Autenticação com IAM no guia do usuário. Contagem
IsMaster Indica se o nó é o nó primário do fragmento/cluster atual. A métrica pode ser 0 (não primária) ou 1 (primária). Contagem
KeyAuthorizationFailures O número total de tentativas falhadas por usuários de acessar chaves que eles não têm permissão para acessar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
KeysTracked O número de chaves que estão sendo rastreadas pelo rastreamento de chaves Valkey ou Redis OSS como uma porcentagem de. tracking-table-max-keys O monitoramento de chaves é usado para ajudar o cache do lado do cliente e notifica os clientes quando as chaves são modificadas. Contagem
MemoryFragmentationRatio Indica a eficiência na alocação de memória do motor Valkey ou RedisOSS. Certos limites significarão comportamentos diferentes. O valor recomendado é ter fragmentação acima de 1,0. Isso é calculado a partir mem_fragmentation_ratio statistic de INFO. Número
NewConnections O número total de conexões que foram aceitas pelo servidor durante esse período. Isso é derivado da total_connections_received estatística em INFO.
nota

Se você estiver usando ElastiCache a OSS versão 5 ou inferior do Redis, entre duas e quatro das conexões relatadas por essa métrica serão usadas ElastiCache para monitorar o cluster. No entanto, ao usar o ElastiCache Redis OSS versão 6 ou superior, as conexões usadas ElastiCache para monitorar o cluster não são incluídas nessa métrica.

Contagem
NumItemsReadFromDisk O número total de itens recuperados do disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
NumItemsWrittenToDisk O número total de itens gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
MasterLinkHealthStatus Esse status tem dois valores: 0 ou 1. O valor 0 indica que os dados no nó ElastiCache primário não estão sincronizados com o Valkey ou o Redis ativadoOSS. EC2 O valor de 1 indica que os dados não estão sincronizados. Para concluir a migração, use a CompleteMigrationAPIoperação. Booleano
Reclaimed O número total de eventos de expiração de chaves. Isso é derivado da expired_keys estatística em INFO. Contagem
ReplicationBytes Para nós em uma configuração replicada, ReplicationBytes informa o número de bytes que a primária está enviando para todas as suas réplicas. Essa métrica é representante da carga de gravação no grupo de replicação. Isso é derivado da master_repl_offset estatística em INFO. Bytes
ReplicationLag Essa métrica é aplicável somente para um nó de em execução como uma réplica de leitura. Ela representa o tempo decorrido, em segundos, até a réplica aplicar alterações do nó primário. Para Valkey 7.2 e versões posteriores e Redis OSS 5.0.6 em diante, o atraso pode ser medido em milissegundos. Segundos
SaveInProgress Essa métrica binária retorna 1 sempre que um salvamento de plano de fundo (com ou sem bifurcação) está em andamento e 0 caso não esteja. Um processo de salvamento de plano de fundo geralmente é usado durante snapshots e sincronizações. Essas operações podem prejudicar o desempenho. Usando a métrica SaveInProgress, você pode diagnosticar se uma performance prejudicada foi causada por um processo de salvamento de plano de fundo. Isso é derivado da rdb_bgsave_in_progress estatística em INFO. Booleano
TrafficManagementActive Indica se ElastiCache o Redis OSS está gerenciando ativamente o tráfego ajustando o tráfego alocado para comandos de entrada, monitoramento ou replicação. O tráfego é gerenciado quando mais comandos são enviados ao nó do que podem ser processados pelo Valkey ou pelo Redis OSS e é usado para manter a estabilidade e a operação ideal do mecanismo. Quaisquer pontos de dados de 1 podem indicar que o nó está subdimensionado para a workload que está sendo fornecida.
nota

Se essa métrica permanecer ativa, avalie o cluster para decidir se é necessário aumentar a escala verticalmente ou horizontalmente. As métricas relacionadas incluem NetworkBandwidthOutAllowanceExceeded e EngineCPUUtilization.

Booleano
SuccessfulWriteRequestLatency

Latência de solicitações de gravação bem-sucedidas.

Estatísticas válidas: média, soma, mínimo, máximo, contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
SuccessfulReadRequestLatency

Latência de solicitações de leitura bem-sucedidas.

Estatísticas válidas: média, soma, mínimo, máximo, contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
ErrorCount

O número total de comandos com falha durante o período especificado.

Estatísticas válidas: média, soma, mínimo, máximo

Contagem
ngineCPUUtilization Disponibilidade do E

AWS As regiões listadas a seguir estão disponíveis em todos os tipos de nós compatíveis.

Região Nome da região
us-east-2 Leste dos EUA (Ohio)
us-east-1 Leste dos EUA (Norte da Virgínia)
us-west-1 Oeste dos EUA (Norte da Califórnia)
us-west-2 Oeste dos EUA (Oregon)
ap-northeast-1 Ásia-Pacífico (Tóquio)
ap-northeast-2 Ásia-Pacífico (Seul)
ap-northeast-3 Asia Pacific (Osaka)
ap-east-1 Ásia-Pacífico (Hong Kong)
ap-south-1 Asia Pacific (Mumbai)
ap-southeast-1 Ásia-Pacífico (Singapura)
ap-southeast-2 Ásia-Pacífico (Sydney)
ap-southeast-3 Ásia-Pacífico (Jacarta)
ca-central-1 Canadá (Central)
cn-north-1 China (Pequim)
cn-northwest-2 China (Ningxia)
me-south-1 Oriente Médio (Bahrein)
eu-central-1 Europa (Frankfurt)
eu-west-1 Europa (Irlanda)
eu-west-2 Europa (Londres)
eu-west-3 UE (Paris)
eu-south-1 Europa (Milão)
af-south-1 África (Cidade do Cabo)
eu-north-1 Europa (Estocolmo)
sa-east-1 América do Sul (São Paulo)
us-gov-west-1 AWS GovCloud (Oeste dos EUA)
us-gov-east-1 AWS GovCloud (Leste dos EUA)

A seguir estão agregações de determinados tipos de comandos, derivados de info commandstats: A seção commandstats fornece estatísticas com base no tipo de comando, incluindo o número de chamadas, o CPU tempo total consumido por esses comandos e a média CPU consumida por execução de comando. Para cada tipo de comando, é adicionada a seguinte linha: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

As métricas de latência listadas a seguir são calculadas usando a estatística commandstats de. INFO Elas são calculadas da seguinte maneira: delta(usec)/delta(calls). O delta é calculado como a diferença dentro de um minuto. A latência é definida como CPU o tempo gasto ElastiCache para processar o comando. Observe que, para clusters que usam camadas de dados, o tempo necessário para buscar itens não SSD está incluído nessas medições.

Para obter uma lista completa dos comandos disponíveis, consulte comandos na documentação do Valkey.

Métrica Descrição Unidade
ClusterBasedCmds O número total de comandos que são baseados em cluster. Deriva da estatística commandstats, somando todos os comandos que atuam em um cluster (cluster slot, cluster info etc.). Contagem
ClusterBasedCmdsLatency Latência de comandos baseados em cluster. Microssegundos
EvalBasedCmds O número total de comandos para comandos baseados em avaliação. É derivado da estatística commandstats, pela soma de eval, evalsha. Contagem
EvalBasedCmdsLatency Latência de comandos baseados em avaliação. Microssegundos
GeoSpatialBasedCmds O número total de comandos para comandos baseados em dados geoespaciais. Deriva da estatística commandstats. Ele é derivado somando todos o tipos de comandos geo: geoadd, geodist, geohash, geopos, georadius, e georadiusbymember. Contagem
GeoSpatialBasedCmdsLatency Latência de comandos baseados em dados geoespaciais. Microssegundos
GetTypeCmds O número total de comandos do tipo read-only. Deriva da estatística commandstats, somando todos os comandos do tipo read-only (get, hget, scard, lrange etc.) Contagem
GetTypeCmdsLatency Latência de comandos de leitura. Microssegundos
HashBasedCmds O número total de comandos baseados em hash. Deriva da estatística commandstats, somando todos os comandos que atuam em um ou mais hashes (hget, hkeys, hvals, hdel etc.). Contagem
HashBasedCmdsLatency Latência de comandos baseados em hash. Microssegundos
HyperLogLogBasedCmds O número total de comandos baseados em HyperLogLog. Deriva da estatística commandstats, somando todos os comandos do tipo pf (pfadd, pfcount, pfmerge etc.). Contagem
HyperLogLogBasedCmdsLatency Latência dos comandos HyperLogLog baseados. Microssegundos
JsonBasedCmds O número total de JSON comandos, incluindo comandos de leitura e gravação. Isso é derivado da commandstats estatística pela soma de todos os JSON comandos que atuam sobre JSON as teclas. Contagem
JsonBasedCmdsLatency Latência de todos os JSON comandos, incluindo comandos de leitura e gravação. Microssegundos
JsonBasedGetCmds O número total de comandos JSON somente para leitura. Isso é derivado da commandstats estatística pela soma de todos os comandos de JSON leitura que atuam sobre JSON as teclas. Contagem
JsonBasedGetCmdsLatency Latência de comandos somente JSON para leitura. Microssegundos
JsonBasedSetCmds O número total de comandos de JSON gravação. Isso é derivado da commandstats estatística pela soma de todos os comandos de JSON gravação que atuam sobre JSON as chaves. Contagem
JsonBasedSetCmdsLatency Latência dos comandos de JSON gravação. Microssegundos
KeyBasedCmds O número total de comandos baseados em chave. Deriva da estatística commandstats, somando todos os comandos que atuam em uma ou mais chaves em várias estruturas de dados (del, expire, rename etc.). Contagem
KeyBasedCmdsLatency Latência de comandos baseados em chave. Microssegundos
ListBasedCmds O número total de comandos baseados em lista. Deriva da estatística commandstats, somando todos os comandos que atuam em uma ou mais listas (lindex, lrange, lpush, ltrim etc.). Contagem
ListBasedCmdsLatency Latência de comandos baseados em lista. Microssegundos
NonKeyTypeCmds O número total de comandos não baseados em chave. É derivado da estatística commandstats, somando todos os comandos que não atuam em uma chave; por exemplo, acl, dbsize ou info. Contagem
NonKeyTypeCmdsLatency Latência dos non-key-based comandos. Microssegundos
PubSubBasedCmds O número total de comandos para a funcionalidade pub/sub. É derivado das estatísticas commandstats, somando todos os comandos usados para a funcionalidade pub/sub: psubscribe, publish, pubsub, punsubscribe, ssubscribe, sunsubscribe, spublish, subscribe e unsubscribe. Contagem
PubSubBasedCmdsLatency Latência de comandos baseados em pub/sub. Microssegundos
SetBasedCmds O número total de comandos que são baseados em conjuntos. Deriva da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos (scard, sdiff, sadd, sunion etc.). Contagem
SetBasedCmdsLatency Latência de comandos baseados em conjunto. Microssegundos
SetTypeCmds O número total de tipos de comando write. Deriva da estatística commandstats, somando todos os tipos de comando mutative que operam em dados (set, hset, sadd, lpop etc.) Contagem
SetTypeCmdsLatency Latência de comandos de gravação. Microssegundos
SortedSetBasedCmds O número total de comandos que são classificados com base em conjuntos. Deriva da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos classificados (zcount, zrange, zrank, zadd etc.). Contagem
SortedSetBasedCmdsLatency Latência de comandos baseados em classificação. Microssegundos
StringBasedCmds O número total de comandos baseados em string. Deriva da estatística commandstats, somando todos os comandos que atuam em uma ou mais strings (strlen, setex, setrange etc.). Contagem
StringBasedCmdsLatency Latência de comandos baseados em string. Microssegundos
StreamBasedCmds O número total de comandos que são baseados em fluxo. Deriva da estatística commandstats, somando todos os comandos que atuam em um ou mais tipos de dados de fluxos (xrange, xlen, xadd, xdel etc.). Contagem
StreamBasedCmdsLatency Latência de comandos baseados em fluxo. Microssegundos