View a markdown version of this page

Métricas para o Valkey e Redis OSS - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Métricas para o Valkey e Redis OSS

O namespace Amazon ElastiCache inclui as seguintes métricas do Valkey e Redis OSS. Essas métricas são as mesmas quando se usa o mecanismo Valkey.

Com exceção de ReplicationLag, EngineCPUUtilization, SuccessfulWriteRequestLatency e SuccessfulReadRequestLatency, essas métricas são derivadas do comando info. Cada métrica é calculada no nível de nó de cache.

Para obter a documentação completa do info comando, consulte http://valkey.io/commands/info.

Consulte também

Métrica Description Unidade
ActiveDefragHits O número de realocações de valor por minuto executada pelo processo de desfragmentação ativo. Deriva da estatística active_defrag_hits no comando INFO. Número
AuthenticationFailures O número total de tentativas falhadas de autenticação para o Valkey ou Redis OSS usando o comando AUTH. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
BytesUsedForCache O número total de bytes alocados pelo Valkey ou Redis OSS para todas as finalidades, inclusive o conjunto de dados, buffers, etc. Bytes
Dimension: Tier=Memory para clusters do Valkey ou Redis OSS usando Hierarquização de dados em ElastiCache: o número total de bytes usados para cache por memória. Esse é o valor da estatística used_memory em INFO. Bytes
Dimension: Tier=SSD para clusters do Valkey ou Redis OSS usando Hierarquização de dados em ElastiCache: o número total de bytes usados para cache por SSD. Bytes
BytesReadFromDisk O número total de bytes lidos no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
BytesWrittenToDisk O número total de bytes gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
CacheHits O número de buscas de chaves somente leitura bem-sucedidas no dicionário principal. Deriva da estatística keyspace_hits no comando INFO. Contagem
CacheMisses O número de buscas de chaves somente leitura malsucedidas no dicionário principal. Deriva da estatística keyspace_misses no comando INFO. Contagem
CommandAuthorizationFailures O número total de tentativas falhadas por usuários para executar comandos que eles não têm permissão para chamar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
CacheHitRate Indica a eficiência de uso da instância Valkey ou Redis OSS. Se a proporção de cache for inferior a aproximadamente 0,8, isso significa que uma quantidade significativa de chaves são despejadas, expiradas ou não existem. Isso é calculado usando as estatísticas cache_hits e cache_misses da seguinte maneira: cache_hits /(cache_hits + cache_misses). Percentual
ChannelAuthorizationFailures O número total de tentativas falhadas por usuários de acessar canais que eles não têm permissão para acessar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme nesta métrica para detectar tentativas de acesso não autorizadas. Contagem
CurrConnections O número de conexões de clientes, excluindo conexões de réplicas de leitura. ElastiCache usa de 4 a 6 conexões para monitorar o cluster em cada caso. Deriva da estatística connected_clients no comando INFO. Contagem
CurrItems O número de itens no cache. Deriva da estatística keyspace, somando todas as chaves em todo o keyspace. Contagem
Dimension: Tier=Memory para clusters usando Hierarquização de dados em ElastiCache. O número de itens em memória. Contagem
Dimension: Tier=SSD (unidades de estado sólido) para clusters usando Hierarquização de dados em ElastiCache. O número de itens em SSD. Contagem
CurrVolatileItems Número total de chaves em todos os bancos de dados que têm um ttl definido. Deriva da estatística expires, somando todas as chaves com um ttl definido em todo o keyspace. Contagem
CurrItemsWithVolatileFields O número de chaves que contêm campos de hash com expiração definida. Disponível para Valkey 9.0 e versões posteriores. Contagem
ReclaimedFields O número de campos de hash expirados recuperados pelo processo de expiração ativo. Disponível para Valkey 9.0 e versões posteriores. Contagem
DatabaseCapacityUsagePercentage

Porcentagem da capacidade total de dados para o cluster que está em uso.

Em instâncias com camadas de dados, a métrica é calculada como (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), onde used_memory e maxmemory são obtidas de INFO.

Em todos os outros casos, a métrica é calculada usando used_memory/maxmemory.

Percentual
DatabaseCapacityUsageCountedForEvictPercentage

Porcentagem da capacidade total de dados para o cluster que está em uso, excluindo a memória usada para sobrecarga e COB. Essa métrica é calculada como:

used_memory - mem_not_counted_for_evict/maxmemory

Em instâncias de dados em camadas, a métrica é calculada como:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

onde used_memory e maxmemory são obtidos de INFO

Percentual
DatabaseMemoryUsagePercentage Porcentagem de memória para o cluster que está em uso. É calculado usando used_memory/maxmemory de INFO. Percentual
DatabaseMemoryUsageCountedForEvictPercentage Porcentagem de memória para o cluster que está em uso, excluindo a memória usada para sobrecarga e COB. É calculado usando used_memory-mem_not_counted_for_evict/maxmemory de INFO. Percentual
DB0AverageTTL Expõe o avg_ttl de DBO a partir da estatística keyspace do comando INFO. As réplicas não expiram as chaves; em vez disso, esperam que os nós primários expirem as chaves. Quando um nó primário expira uma chave (ou a remove por causa do LRU), ele sintetiza um DEL, que é transmitido para todas as réplicas. Assim sendo, DB0AverageTTL é 0 para nós de réplica, devido ao fato de que eles não expiram chaves e, portanto, não rastreiam TTL. Milissegundos
EngineCPUUtilization

Fornece utilização da CPU do thread do mecanismo Valkey ou Redis OSS. Como o Valkey e o Redis OSS são de thread único, você pode usar essa métrica para analisar a carga do próprio processo. A métrica EngineCPUUtilization fornece uma visibilidade mais precisa do processo. Você pode usá-la em conjunto com a métrica CPUUtilization. CPUUtilization expõe a utilização de CPU da instância do servidor como um todo, incluindo outros processos de sistema operacional e de gerenciamento. Para tipos de nós maiores com quatro vCPUs ou mais, use a métrica EngineCPUUtilization para monitorar e definir limites para a escalabilidade.

nota

Em um ElastiCache host, os processos em segundo plano monitoram o host para fornecer uma experiência de banco de dados gerenciado. Esses processos em segundo plano podem ocupar uma parte significativa da workload da CPU. Isso não é significativo em hosts maiores com mais de duas vCPUs. Mas pode afetar hosts menores com 2vCPUs ou menos. Se você monitorar apenas a métrica EngineCPUUtilization, desconhecerá situações em que o host está sobrecarregado com alto uso da CPU do Valkey ou Redis OSS e alto uso da CPU dos processos de monitoramento em segundo plano. Portanto, recomendamos monitorar a métrica CPUUtilization para hosts com duas vCPUs ou menos.

Percentual
Evictions O número de chaves que foram removidas devido ao limite maxmemory. Deriva da estatística evicted_keys no comando INFO. Contagem
GlobalDatastoreReplicationLag Esse é o atraso entre o nó primário da região secundária e o nó primário da região primária. Para o Valkey ou Redis OSS habilitado para modo cluster, o atraso indica o atraso máximo entre os fragmentos. Segundos
IamAuthenticationExpirations O número total de conexões IAM-authenticated Valkey ou Redis OSS expiradas. Você pode encontrar mais informações sobre o Autenticação com o IAM no guia do usuário. Contagem
IamAuthenticationThrottling O número total de solicitações IAM-authenticated Valkey ou Redis OSS AUTH ou HELLO limitadas. Você pode encontrar mais informações sobre o Autenticação com o IAM no guia do usuário. Contagem
IsMaster Indica se o nó é o nó primário da corrente shard/cluster. A métrica pode ser 0 (não primária) ou 1 (primária). Contagem
KeyAuthorizationFailures O número total de tentativas falhadas por usuários de acessar chaves que eles não têm permissão para acessar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
KeysTracked O número de chaves que estão sendo monitoradas pelo monitoramento de chaves do Valkey ou Redis OSS como um percentual de tracking-table-max-keys. O monitoramento de chaves é usado para ajudar o cache do lado do cliente e notifica os clientes quando as chaves são modificadas. Contagem
MemoryFragmentationRatio Indica a eficiência na alocação de memória do mecanismo Valkey ou Redis OSS. Certos limites significarão comportamentos diferentes. O valor recomendado é ter fragmentação acima de 1,0. É calculada com base em mem_fragmentation_ratio statistic do comando INFO. Número
NewConnections O número total de conexões que foram aceitas pelo servidor durante esse período. Deriva da estatística total_connections_received no comando INFO.
nota

Se você estiver usando o ElastiCache Redis OSS versão 5 ou inferior, entre duas e quatro das conexões relatadas por essa métrica serão usadas ElastiCache para monitorar o cluster. No entanto, ao usar o ElastiCache Redis OSS versão 6 ou superior, as conexões usadas ElastiCache para monitorar o cluster não são incluídas nessa métrica.

Contagem
NumItemsReadFromDisk O número total de itens recuperados do disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
NumItemsWrittenToDisk O número total de itens gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
MasterLinkHealthStatus Esse status tem dois valores: 0 ou 1. O valor 0 indica que os dados no nó ElastiCache primário não estão sincronizados com o Valkey ou o Redis OSS no EC2. O valor de 1 indica que os dados não estão sincronizados. Para concluir a migração, use a operação CompleteMigrationda API. Booleano
Reclaimed O número total de eventos de expiração de chaves. Deriva da estatística expired_keys no comando INFO. Contagem
ReplicationBytes Para nós em uma configuração replicada, ReplicationBytes informa o número de bytes que a primária está enviando para todas as suas réplicas. Essa métrica é representante da carga de gravação no grupo de replicação. Deriva da estatística master_repl_offset no comando INFO. Bytes
ReplicationLag Essa métrica é aplicável somente para um nó de em execução como uma réplica de leitura. Ela representa o tempo decorrido, em segundos, até a réplica aplicar alterações do nó primário. Para o Valkey 7.2 e posteriores, e Redis OSS 5.0.6 e posteriores, o atraso pode ser medido em milissegundos. Segundos
SaveInProgress Essa métrica binária retorna 1 sempre que um salvamento de plano de fundo (com ou sem bifurcação) está em andamento e 0 caso não esteja. Um processo de salvamento de plano de fundo geralmente é usado durante snapshots e sincronizações. Essas operações podem prejudicar o desempenho. Usando a métrica SaveInProgress, você pode diagnosticar se uma performance prejudicada foi causada por um processo de salvamento de plano de fundo. Deriva da estatística rdb_bgsave_in_progress no comando INFO. Booleano
TrafficManagementActive Indica se, ElastiCache para Redis, o OSS está gerenciando ativamente o tráfego ajustando o tráfego alocado para comandos de entrada, monitoramento ou replicação. O tráfego é gerenciado quando mais comandos são enviados ao nó do que podem ser processados ​​pelo Valkey ou Redis OSS e é usado para manter a estabilidade e a operação ideal do mecanismo. Quaisquer pontos de dados de 1 podem indicar que o nó está subdimensionado para a workload que está sendo fornecida.
nota

Se essa métrica permanecer ativa, avalie o cluster para decidir se é necessário aumentar a escala verticalmente ou horizontalmente. As métricas relacionadas incluem NetworkBandwidthOutAllowanceExceeded e EngineCPUUtilization.

Booleano
SuccessfulWriteRequestLatency

Latência de solicitações de gravação bem-sucedidas.

Estatísticas válidas: Média, Soma, Mín., Máx., Contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
SuccessfulReadRequestLatency

Latência de solicitações de leitura bem-sucedidas.

Estatísticas válidas: Média, Soma, Mín., Máx., Contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
ErrorCount

O número total de comandos com falha durante o período especificado.

Estatísticas válidas: média, soma, máx. e mín.

Contagem
SearchNumberOfIndexes

Número de índices criados

Contagem
SearchTotalIndexedDocuments

Número total de chaves em todos os índices

Contagem
SearchUsedMemoryBytes

Número de bytes de memória consumidos em todas as estruturas de dados de pesquisa

Bytes
BlockedConnections O número de clientes atualmente em um estado bloqueado, aguardando comandos de bloqueio, comoBLPOP. Isso é derivado do blocked_clients campo em INFO. Contagem
RejectedConnections O número de conexões que o mecanismo rejeitou, principalmente quando o número de clientes conectados atingiu o maxclients limite. Isso é derivado do rejected_connections campo em INFO. Contagem
PubSubChannels O número de pub/sub canais ativos nesse nó que têm pelo menos um assinante. Essa contagem não inclui pub/sub canais fragmentados. Isso é derivado do pubsub_channels campo em INFO. Contagem
PubSubShardChannels O número de pub/sub canais fragmentados ativos nesse nó que têm pelo menos um assinante. Os canais fragmentados direcionam as mensagens somente dentro do fragmento, em vez de transmitir em todo o cluster. Se a contagem de pub/sub canais estiver crescendo com a utilização, considere mudar para fragmentado para pub/sub escalar horizontalmente. Isso é derivado do pubsubshard_channels campo em INFO. Disponível no Valkey 7.2 e posterior e no Redis OSS 7.0 e versões posteriores. Contagem
UsedMemoryDataset Uma estimativa da memória em bytes usada pelos dados reais do usuário (chaves e valores), excluindo a sobrecarga, como buffers de replicação, buffers de saída do cliente e metadados internos. Isso é derivado do used_memory_dataset campo em INFO. Use essa métrica em conjunto BytesUsedForCache para entender quanto da memória alocada é consumida pelos dados reais versus pela sobrecarga. Disponível no Valkey 7.2 e posterior e no Redis OSS 4.0 e posterior. Bytes
AllocatorFragmentationBytes A quantidade de memória em bytes desperdiçada devido à fragmentação do alocador. Ao contrárioMemoryFragmentationRatio, que reflete a sobrecarga total de RSS do processo, incluindo OS-level fatores não acionáveis, essa métrica isola a fragmentação que o parâmetro do mecanismo pode resolver. activedefrag Isso é derivado do allocator_frag_bytes campo em INFO. Bytes
AllocatorFragmentationRatio A proporção da fragmentação do alocador em relação à memória alocada total. Valores acima de 1,0 representam fragmentação; quanto maior o valor, mais severa é a fragmentação. Ao contrárioMemoryFragmentationRatio, que reflete a sobrecarga total de RSS do processo, incluindo OS-level fatores não acionáveis, essa métrica isola a fragmentação que o parâmetro do mecanismo pode resolver. activedefrag Isso é derivado do allocator_frag_ratio campo em INFO. Número
ProcessedCommands O número total de comandos processados pelo mecanismo. Os comandos rejeitados antes da execução não são contados. Isso é derivado do total_commands_processed campo em INFO. Contagem

A seguir estão agregações de determinados tipos de comandos, derivados de info commandstats: A seção commandstats fornece estatísticas baseadas no tipo de comando, incluindo o número de chamadas, o tempo total de CPU consumido por esses comandos e a CPU média consumida por execução de comando. Para cada tipo de comando, é adicionada a seguinte linha: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

As métricas de latência listadas a seguir são calculadas com a estatística commandstats de INFO. Elas são calculadas da seguinte maneira: delta(usec)/delta(calls). O delta é calculado como a diferença dentro de um minuto. A latência é definida como o tempo gasto pela CPU ElastiCache para processar o comando. Observe que, para clusters que usam classificação de dados por nível, o tempo necessário para buscar itens no SSD não está incluído nessas medições.

Para obter uma lista completa dos comandos disponíveis, consulte comandos na documentação do Valkey.

Métrica Description Unidade
ClusterBasedCmds O número total de comandos que são baseados em cluster. Deriva da estatística commandstats, somando todos os comandos que atuam em um cluster (cluster slot, cluster info etc.). Contagem
ClusterBasedCmdsLatency Latência de comandos baseados em cluster. Microssegundos
EvalBasedCmds O número total de comandos para comandos baseados em avaliação. É derivado da estatística commandstats, pela soma de eval, evalsha. Contagem
EvalBasedCmdsLatency Latência de comandos baseados em avaliação. Microssegundos
GeoSpatialBasedCmds O número total de comandos para comandos baseados em dados geoespaciais. É derivado da estatística commandstats. Ele é derivado somando todos o tipos de comandos geo: geoadd, geodist, geohash, geopos, georadius, e georadiusbymember. Contagem
GeoSpatialBasedCmdsLatency Latência de comandos baseados em dados geoespaciais. Microssegundos
GetTypeCmds O número total de comandos do tipo read-only. É derivado da estatística commandstats, somando todos os comandos do tipo read-only (get, hget, scard, lrange, etc.) Contagem
GetTypeCmdsLatency Latência de comandos de leitura. Microssegundos
HashBasedCmds O número total de comandos baseados em hash. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais hashes (hget, hkeys, hvals, hdel, etc.). Contagem
HashBasedCmdsLatency Latência de comandos baseados em hash. Microssegundos
HyperLogLogBasedCmds O número total de comandos baseados em HyperLogLog. É derivado da estatística commandstats, somando todos os comandos do tipo pf (pfadd, pfcount, pfmerge, etc.). Contagem
HyperLogLogBasedCmdsLatency Latência dos HyperLogLog-based comandos. Microssegundos
JsonBasedCmds O número total de comandos JSON, incluindo comandos de leitura e gravação. É derivado da estatística commandstats, somando todos os comandos JSON que atuam em chaves JSON. Contagem
JsonBasedCmdsLatency Latência de todos os comandos JSON, incluindo comandos de leitura e gravação. Microssegundos
JsonBasedGetCmds O número total de comandos JSON somente leitura. É derivado da estatística commandstats, somando todos os comandos de leitura JSON que atuam em chaves JSON. Contagem
JsonBasedGetCmdsLatency Latência dos comandos JSON somente leitura. Microssegundos
JsonBasedSetCmds O número total de comandos de gravação JSON. É derivado da estatística commandstats, somando todos os comandos de gravação JSON que atuam em chaves JSON. Contagem
JsonBasedSetCmdsLatency Latência dos comandos de gravação JSON. Microssegundos
KeyBasedCmds O número total de comandos baseados em chave. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais chaves em várias estruturas de dados (del, expire, rename, etc.). Contagem
KeyBasedCmdsLatency Latência de comandos baseados em chave. Microssegundos
ListBasedCmds O número total de comandos baseados em lista. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais listas (lindex, lrange, lpush, ltrim, etc.). Contagem
ListBasedCmdsLatency Latência de comandos baseados em lista. Microssegundos
NonKeyTypeCmds O número total de comandos não baseados em chave. É derivado da estatística commandstats, somando todos os comandos que não atuam em uma chave; por exemplo, acl, dbsize ou info. Contagem
NonKeyTypeCmdsLatency Latência de comandos não baseados em chave. Microssegundos
PubSubBasedCmds O número total de comandos para pub/sub funcionalidade. Isso é derivado das commandstats estatísticas pela soma de todos os comandos usados para pub/sub funcionalidade:psubscribe, publishpubsub,punsubscribe,ssubscribe,sunsubscribe,spublish,subscribe, e. unsubscribe Contagem
PubSubBasedCmdsLatency Latência dos comandos pub/sub baseados. Microssegundos
SetBasedCmds O número total de comandos que são baseados em conjuntos. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos (scard, sdiff, sadd, sunion, etc.). Contagem
SetBasedCmdsLatency Latência de comandos baseados em conjunto. Microssegundos
SetTypeCmds O número total de tipos de comando write. É derivado da estatística commandstats, somando todos os tipos de comando mutative que operam em dados (set, hset, sadd, lpop, etc.) Contagem
SetTypeCmdsLatency Latência de comandos de gravação. Microssegundos
SortedSetBasedCmds O número total de comandos que são classificados com base em conjuntos. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos classificados (zcount, zrange, zrank, zadd, etc.). Contagem
SortedSetBasedCmdsLatency Latência de comandos baseados em classificação. Microssegundos
StringBasedCmds O número total de comandos baseados em string. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais strings (strlen, setex, setrange, etc.). Contagem
StringBasedCmdsLatency Latência de comandos baseados em string. Microssegundos
StreamBasedCmds O número total de comandos que são baseados em fluxo. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais tipos de dados de fluxos (xrange, xlen, xadd, xdel, etc.). Contagem
StreamBasedCmdsLatency Latência de comandos baseados em fluxo. Microssegundos
SearchBasedCmds O número total de comandos Search, incluindo comandos de leitura e gravação. Isso é derivado da estatística commandstats pela soma de todos os comandos Search. Contagem
SearchBasedCmdsLatency Latência de todos os comandos Search, incluindo comandos de leitura e gravação. Microssegundos
SearchBasedGetCmds O número total de comandos Search somente leitura. Isso é derivado da estatística commandstats pela soma de todos os comandos Search de leitura. Contagem
SearchBasedGetCmdsLatency Latência dos comandos Search somente leitura. Microssegundos
SearchBasedSetCmds O número total de comandos de gravação Search. Isso é derivado da estatística commandstats pela soma de todos os comandos Search de gravação. Contagem
SearchBasedSetCmdsLatency Latência dos comandos Search de leitura. Microssegundos