Métricas para Valkey e Redis OSS - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Métricas para Valkey e Redis OSS

O Amazon ElastiCache namespace inclui as seguintes métricas do Valkey e do Redis. OSS Essas métricas são as mesmas ao usar o mecanismo Valkey.

Com exceção de ReplicationLag eEngineCPUUtilization, essas métricas são derivadas do info comando. Cada métrica é calculada no nível de nó de cache.

Para obter a documentação completa do info comando, consulte http://valkey.io/commands/info.

Consulte também

Métrica Descrição Unidade
ActiveDefragHits O número de realocações de valor por minuto executada pelo processo de desfragmentação ativo. Isso é derivado da active_defrag_hits estatística em INFO. Número
AuthenticationFailures O número total de tentativas malsucedidas de autenticação no Valkey ou no Redis OSS usando o comando. AUTH Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
BytesUsedForCache O número total de bytes alocados pelo Valkey ou pelo Redis OSS para todos os fins, incluindo o conjunto de dados, os buffers e assim por diante. Bytes
Dimension: Tier=Memorypara OSS clusters Valkey ou Redis usandoHierarquização de dados em ElastiCache: O número total de bytes usados para cache por memória. Esse é o valor da used_memory estatística em INFO. Bytes
Dimension: Tier=SSDpara OSS clusters Valkey ou Redis usandoHierarquização de dados em ElastiCache: O número total de bytes usados para cache por. SSD Bytes
BytesReadFromDisk O número total de bytes lidos no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
BytesWrittenToDisk O número total de bytes gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
CacheHits O número de buscas de chaves somente leitura bem-sucedidas no dicionário principal. Isso é derivado da keyspace_hits estatística em INFO. Contagem
CacheMisses O número de buscas de chaves somente leitura malsucedidas no dicionário principal. Isso é derivado da keyspace_misses estatística em INFO. Contagem
CommandAuthorizationFailures O número total de tentativas falhadas por usuários para executar comandos que eles não têm permissão para chamar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
CacheHitRate Indica a eficiência de uso da instância Valkey ou RedisOSS. Se a proporção de cache for inferior a aproximadamente 0,8, isso significa que uma quantidade significativa de chaves são despejadas, expiradas ou não existem. Isso é calculado usando as estatísticas cache_hits e cache_misses da seguinte maneira: cache_hits /(cache_hits + cache_misses). Percentual
ChannelAuthorizationFailures O número total de tentativas falhadas por usuários de acessar canais que eles não têm permissão para acessar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme nesta métrica para detectar tentativas de acesso não autorizadas. Contagem
CurrConnections O número de conexões de clientes, excluindo conexões de réplicas de leitura. ElastiCache usa de duas a quatro conexões para monitorar o cluster em cada caso. Isso é derivado da connected_clients estatística em INFO. Contagem
CurrItems O número de itens no cache. Isso é derivado da keyspace estatística, somando todas as chaves em todo o espaço de teclas. Contagem
Dimension: Tier=Memory para clusters usando Hierarquização de dados em ElastiCache. O número de itens em memória. Contagem
Dimension: Tier=SSD (unidades de estado sólido) para clusters usando Hierarquização de dados em ElastiCache. O número de itens emSSD. Contagem
CurrVolatileItems Número total de chaves em todos os bancos de dados que têm um ttl definido. Isso é derivado da expires estatística, somando todas as chaves com um ttl definido em todo o espaço de teclas. Contagem
DatabaseCapacityUsagePercentage

Porcentagem da capacidade total de dados para o cluster que está em uso.

Em instâncias com camadas de dados, a métrica é calculada como(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), de onde used_memory e de onde maxmemory são INFOtiradas.

Em todos os outros casos, a métrica é calculada usandoused_memory/maxmemory.

Percentual
DatabaseCapacityUsageCountedForEvictPercentage

Porcentagem da capacidade total de dados do cluster que está em uso, excluindo a memória usada para sobrecarga e. COB Essa métrica é calculada como:

used_memory - mem_not_counted_for_evict/maxmemory

Em instâncias de dados em camadas, a métrica é calculada como:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

de onde used_memory e de onde maxmemory são retirados INFO

Percentual
DatabaseMemoryUsagePercentage Porcentagem de memória para o cluster que está em uso. Isso é calculado usando used_memory/maxmemory from INFO. Percentual
DatabaseMemoryUsageCountedForEvictPercentage Porcentagem da memória do cluster que está em uso, excluindo a memória usada para sobrecarga e. COB Isso é calculado usando used_memory-mem_not_counted_for_evict/maxmemory from INFO. Percentual
DB0AverageTTL Exposições avg_ttl DBO da keyspace estatística de comando. INFO As réplicas não expiram as chaves; em vez disso, esperam que os nós primários expirem as chaves. Quando um nó primário expira uma chave (ou a expulsa por causa delaLRU), ele sintetiza um DEL comando, que é transmitido para todas as réplicas. Portanto, DB0Average TTL é 0 para nós de réplica, devido ao fato de que eles não expiram as chaves e, portanto, não rastreiam. TTL Milissegundos
EngineCPUUtilization

Fornece CPU a utilização do encadeamento do mecanismo Valkey ou RedisOSS. Como o Valkey e o Redis OSS são de um único segmento, você pode usar essa métrica para analisar a carga do processo em si. A EngineCPUUtilization métrica fornece uma visibilidade mais precisa do processo. Você pode usá-lo em conjunto com a CPUUtilization métrica. CPUUtilizationexpõe CPU a utilização da instância do servidor como um todo, incluindo outros sistemas operacionais e processos de gerenciamento. Para tipos de nós maiores com quatro vCPUs ou mais, use a EngineCPUUtilization métrica para monitorar e definir limites para escalabilidade.

nota

Em um ElastiCache host, os processos em segundo plano monitoram o host para fornecer uma experiência de banco de dados gerenciado. Esses processos em segundo plano podem ocupar uma parte significativa da CPU carga de trabalho. Isso não é significativo em hosts maiores com mais de doisvCPUs. Mas isso pode afetar hospedeiros menores com 2 vCPUs ou menos. Se você monitorar apenas a EngineCPUUtilization métrica, não terá conhecimento das situações em que o host está sobrecarregado com o alto CPU uso do Valkey ou do Redis OSS e com o alto CPU uso dos processos de monitoramento em segundo plano. Portanto, recomendamos monitorar a CPUUtilization métrica para hosts com dois vCPUs ou menos.

Percentual
Evictions O número de chaves que foram removidas devido ao limite maxmemory. Isso é derivado da evicted_keys estatística em INFO. Contagem
GlobalDatastoreReplicationLag Esse é o atraso entre o nó primário da região secundária e o nó primário da região primária. Para Valkey ou Redis habilitado para o modo de clusterOSS, o atraso indica o atraso máximo entre os fragmentos. Segundos
IamAuthenticationExpirations O número total de conexões Valkey ou Redis IAM autenticadas e expiradas. OSS Você pode encontrar mais informações sobre o Autenticação com IAM no guia do usuário. Contagem
IamAuthenticationThrottling O número total de solicitações ou solicitações Valkey ou Redis IAM autenticadas por limitação. OSS AUTH HELLO Você pode encontrar mais informações sobre o Autenticação com IAM no guia do usuário. Contagem
IsMaster Indica se o nó é o nó primário do fragmento/cluster atual. A métrica pode ser 0 (não primária) ou 1 (primária). Contagem
KeyAuthorizationFailures O número total de tentativas falhadas por usuários de acessar chaves que eles não têm permissão para acessar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o ACLLOGcomando. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
KeysTracked O número de chaves que estão sendo rastreadas pelo rastreamento de chaves Valkey ou Redis OSS como uma porcentagem de. tracking-table-max-keys O monitoramento de chaves é usado para ajudar o cache do lado do cliente e notifica os clientes quando as chaves são modificadas. Contagem
MemoryFragmentationRatio Indica a eficiência na alocação de memória do motor Valkey ou RedisOSS. Certos limites significarão comportamentos diferentes. O valor recomendado é ter fragmentação acima de 1,0. Isso é calculado a partir mem_fragmentation_ratio statistic de INFO. Número
NewConnections O número total de conexões que foram aceitas pelo servidor durante esse período. Isso é derivado da total_connections_received estatística em INFO.
nota

Se você estiver usando ElastiCache (RedisOSS) versão 5 ou inferior, entre duas e quatro das conexões relatadas por essa métrica serão usadas ElastiCache para monitorar o cluster. No entanto, ao usar a versão 6 ou superior do ElastiCache (RedisOSS), as conexões usadas ElastiCache para monitorar o cluster não são incluídas nessa métrica.

Contagem
NumItemsReadFromDisk O número total de itens recuperados do disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
NumItemsWrittenToDisk O número total de itens gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
MasterLinkHealthStatus Esse status tem dois valores: 0 ou 1. O valor 0 indica que os dados no nó ElastiCache primário não estão sincronizados com o Valkey ou o Redis ativadoOSS. EC2 O valor de 1 indica que os dados não estão sincronizados. Para concluir a migração, use a CompleteMigrationAPIoperação. Booleano
Reclaimed O número total de eventos de expiração de chaves. Isso é derivado da expired_keys estatística em INFO. Contagem
ReplicationBytes Para nós em uma configuração replicada, ReplicationBytes informa o número de bytes que a primária está enviando para todas as suas réplicas. Essa métrica é representante da carga de gravação no grupo de replicação. Isso é derivado da master_repl_offset estatística em INFO. Bytes
ReplicationLag Essa métrica é aplicável somente para um nó de em execução como uma réplica de leitura. Ela representa o tempo decorrido, em segundos, até a réplica aplicar alterações do nó primário. Para Valkey 7.2 e versões posteriores e do OSS motor Redis 5.0.6 em diante, o atraso pode ser medido em milissegundos. Segundos
SaveInProgress Essa métrica binária retorna 1 sempre que um salvamento de plano de fundo (com ou sem bifurcação) está em andamento e 0 caso não esteja. Um processo de salvamento de plano de fundo geralmente é usado durante snapshots e sincronizações. Essas operações podem prejudicar o desempenho. Usando a métrica SaveInProgress, você pode diagnosticar se uma performance prejudicada foi causada por um processo de salvamento de plano de fundo. Isso é derivado da rdb_bgsave_in_progress estatística em INFO. Booleano
TrafficManagementActive Indica se o ElastiCache (RedisOSS) está gerenciando ativamente o tráfego ajustando o tráfego alocado para comandos de entrada, monitoramento ou replicação. O tráfego é gerenciado quando mais comandos são enviados ao nó do que podem ser processados pelo Valkey ou pelo Redis OSS e é usado para manter a estabilidade e a operação ideal do mecanismo. Quaisquer pontos de dados de 1 podem indicar que o nó está subdimensionado para a workload que está sendo fornecida.
nota

Se essa métrica permanecer ativa, avalie o cluster para decidir se é necessário aumentar a escala verticalmente ou horizontalmente. As métricas relacionadas incluem NetworkBandwidthOutAllowanceExceeded e EngineCPUUtilization.

Booleano
E ngineCPUUtilization disponibilidade

AWS As regiões listadas a seguir estão disponíveis em todos os tipos de nós compatíveis.

Região Nome da região
us-east-2 Leste dos EUA (Ohio)
us-east-1 Leste dos EUA (N. da Virgínia)
us-west-1 Oeste dos EUA (N. da Califórnia)
us-west-2 Oeste dos EUA (Oregon)
ap-northeast-1 Ásia-Pacífico (Tóquio)
ap-northeast-2 Ásia-Pacífico (Seul)
ap-northeast-3 Asia Pacific (Osaka)
ap-east-1 Ásia-Pacífico (Hong Kong)
ap-south-1 Asia Pacific (Mumbai)
ap-southeast-1 Ásia-Pacífico (Singapura)
ap-southeast-2 Ásia-Pacífico (Sydney)
ap-southeast-3 Ásia-Pacífico (Jacarta)
ca-central-1 Canadá (Central)
cn-north-1 China (Pequim)
cn-northwest-2 China (Ningxia)
me-south-1 Oriente Médio (Barém)
eu-central-1 Europa (Frankfurt)
eu-west-1 Europa (Irlanda)
eu-west-2 Europa (Londres)
eu-west-3 UE (Paris)
eu-south-1 Europa (Milão)
af-south-1 África (Cidade do Cabo)
eu-north-1 Europa (Estocolmo)
sa-east-1 América do Sul (São Paulo)
us-gov-west-1 AWS GovCloud (Oeste dos EUA)
us-gov-east-1 AWS GovCloud (Leste dos EUA)

A seguir estão agregações de determinados tipos de comandos, derivados de info commandstats: A seção commandstats fornece estatísticas com base no tipo de comando, incluindo o número de chamadas, o CPU tempo total consumido por esses comandos e a média CPU consumida por execução de comando. Para cada tipo de comando, é adicionada a seguinte linha: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

As métricas de latência listadas a seguir são calculadas usando a estatística commandstats de. INFO Elas são calculadas da seguinte maneira: delta(usec)/delta(calls). O delta é calculado como a diferença dentro de um minuto. A latência é definida como CPU o tempo gasto ElastiCache para processar o comando. Observe que, para clusters que usam camadas de dados, o tempo necessário para buscar itens não SSD está incluído nessas medições.

Para obter uma lista completa dos comandos disponíveis, consulte os comandos na documentação do Valkey.

Métrica Descrição Unidade
ClusterBasedCmds O número total de comandos que são baseados em cluster. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em um cluster (cluster slot,cluster info, e assim por diante). Contagem
ClusterBasedCmdsLatency Latência de comandos baseados em cluster. Microssegundos
EvalBasedCmds O número total de comandos para comandos baseados em avaliação. Isso é derivado da commandstats estatística pela soma eval de,. evalsha Contagem
EvalBasedCmdsLatency Latência de comandos baseados em avaliação. Microssegundos
GeoSpatialBasedCmds O número total de comandos para comandos baseados em dados geoespaciais. Isso é derivado da commandstats estatística. Ele é derivado somando todos o tipos de comandos geo: geoadd, geodist, geohash, geopos, georadius, e georadiusbymember. Contagem
GeoSpatialBasedCmdsLatency Latência de comandos baseados em dados geoespaciais. Microssegundos
GetTypeCmds O número total de comandos do tipo read-only. Isso é derivado da commandstats estatística pela soma de todos os comandos de read-only tipo (get,, hget scardlrange, e assim por diante.) Contagem
GetTypeCmdsLatency Latência de comandos de leitura. Microssegundos
HashBasedCmds O número total de comandos baseados em hash. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em um ou mais hashes (hget,, hkeys hvalshdel, e assim por diante). Contagem
HashBasedCmdsLatency Latência de comandos baseados em hash. Microssegundos
HyperLogLogBasedCmds O número total de comandos baseados em HyperLogLog. Isso é derivado da commandstats estatística pela soma de todos os pf tipos de comandos (pfadd,pfcount,pfmerge, etc.). Contagem
HyperLogLogBasedCmdsLatency Latência dos comandos HyperLogLog baseados. Microssegundos
JsonBasedCmds O número total de JSON comandos, incluindo comandos de leitura e gravação. Isso é derivado da commandstats estatística pela soma de todos os JSON comandos que atuam sobre JSON as teclas. Contagem
JsonBasedCmdsLatency Latência de todos os JSON comandos, incluindo comandos de leitura e gravação. Microssegundos
JsonBasedGetCmds O número total de comandos JSON somente para leitura. Isso é derivado da commandstats estatística pela soma de todos os comandos de JSON leitura que atuam sobre JSON as teclas. Contagem
JsonBasedGetCmdsLatency Latência de comandos somente JSON para leitura. Microssegundos
JsonBasedSetCmds O número total de comandos de JSON gravação. Isso é derivado da commandstats estatística pela soma de todos os comandos de JSON gravação que atuam sobre JSON as chaves. Contagem
JsonBasedSetCmdsLatency Latência dos comandos de JSON gravação. Microssegundos
KeyBasedCmds O número total de comandos baseados em chave. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em uma ou mais chaves em várias estruturas de dados (del, expirerename, e assim por diante.). Contagem
KeyBasedCmdsLatency Latência de comandos baseados em chave. Microssegundos
ListBasedCmds O número total de comandos baseados em lista. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em uma ou mais listas (lindex,, lrange lpushltrim, e assim por diante). Contagem
ListBasedCmdsLatency Latência de comandos baseados em lista. Microssegundos
NonKeyTypeCmds O número total de comandos não baseados em chave. Isso é derivado da commandstats estatística pela soma de todos os comandos que não atuam em uma tecla, por exemploacl, dbsize ou. info Contagem
NonKeyTypeCmdsLatency Latência dos non-key-based comandos. Microssegundos
PubSubBasedCmds O número total de comandos para a funcionalidade pub/sub. Isso é derivado das commandstats estatísticas pela soma de todos os comandos usados para a funcionalidade do pub/sub:psubscribe,,publish,,pubsub,punsubscribe, ssubscribesunsubscribe, e. spublish subscribe unsubscribe Contagem
PubSubBasedCmdsLatency Latência de comandos baseados em pub/sub. Microssegundos
SetBasedCmds O número total de comandos que são baseados em conjuntos. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em um ou mais conjuntos (scard,,, sdiff saddsunion, e assim por diante). Contagem
SetBasedCmdsLatency Latência de comandos baseados em conjunto. Microssegundos
SetTypeCmds O número total de tipos de comando write. Isso é derivado da commandstats estatística pela soma de todos os mutative tipos de comandos que operam nos dados (set,, hset saddlpop, e assim por diante). Contagem
SetTypeCmdsLatency Latência de comandos de gravação. Microssegundos
SortedSetBasedCmds O número total de comandos que são classificados com base em conjuntos. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em um ou mais conjuntos ordenados (zcount,,, zrange zrankzadd, e assim por diante). Contagem
SortedSetBasedCmdsLatency Latência de comandos baseados em classificação. Microssegundos
StringBasedCmds O número total de comandos baseados em string. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em uma ou mais strings (strlen,, setexsetrange, e assim por diante). Contagem
StringBasedCmdsLatency Latência de comandos baseados em string. Microssegundos
StreamBasedCmds O número total de comandos que são baseados em fluxo. Isso é derivado da commandstats estatística pela soma de todos os comandos que atuam em um ou mais tipos de dados de fluxos (xrange,, xlen xaddxdel, e assim por diante). Contagem
StreamBasedCmdsLatency Latência de comandos baseados em fluxo. Microssegundos