Que métricas devo monitorar? - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Que métricas devo monitorar?

As CloudWatch métricas a seguir oferecem uma boa visão ElastiCache do desempenho. Na maioria dos casos, recomendamos que você defina CloudWatch alarmes para essas métricas para que você possa tomar medidas corretivas antes que ocorram problemas de desempenho.

CPUUtilization

Essa é uma métrica em nível de host relatada como uma porcentagem. Para obter mais informações, consulte Métricas em nível de host.

Valkey e Redis OSS

Para tipos de nós menores com 2 vCPUs ou menos, use a CPUUtilization métrica para monitorar sua carga de trabalho.

De um modo geral, sugerimos que você defina seu limite em 90% do que está disponívelCPU. Como o Valkey e o Redis OSS são ambos de thread único, o valor limite real deve ser calculado como uma fração da capacidade total do nó. Por exemplo, suponha que você esteja usando um tipo de nó com dois núcleos. Nesse caso, o limite para CPUUtilization seria 90/2 ou 45%.

Você precisará determinar seu próprio limite, com base no número de núcleos no nó de cache que você está usando. Se você exceder esse limite e sua workload principal for proveniente de solicitações de leitura, amplie seu cluster de cache adicionando réplicas de leitura. Se a workload principal é de solicitações de gravação, dependendo da configuração do cluster, recomendamos que você:

  • Clusters Valkey ou Redis OSS (modo de cluster desativado): amplie usando um tipo de instância de cache maior.

  • Clusters Valkey ou Redis OSS (modo de cluster ativado): adicione mais fragmentos para distribuir a carga de trabalho de gravação em mais nós primários.

dica

Em vez de usar a métrica Host-LevelCPUUtilization, OSS os usuários do Valkey e do Redis podem usar a métricaEngineCPUUtilization, que relata a porcentagem de uso no núcleo do mecanismo Valkey ou Redis. OSS Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para Valkey e Redis OSS.

Para tipos de nós maiores com 4 vCPUs ou mais, talvez você queira usar a EngineCPUUtilization métrica, que relata a porcentagem de uso no núcleo do OSS mecanismo Valkey ou Redis. Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para Redis OSS.

Memcached

Como o Memcached é multi-threaded, essa métrica pode atingir até 90%. Se você exceder esse limite, aumente seu cluster de cache usando um tipo de nó de cache maior ou escale para baixo adicionando mais nós de cache.

E ngineCPUUtilization

Para tipos de nós maiores com 4 vCPUs ou mais, talvez você queira usar a EngineCPUUtilization métrica, que relata a porcentagem de uso no núcleo do OSS mecanismo Redis. Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para Valkey e Redis OSS.

Para obter mais informações, consulte a CPUsseção Monitoramento das melhores práticas com a Amazon ElastiCache (RedisOSS) usando a Amazon CloudWatch.

SwapUsage (Valkey e RedisOSS)

Esta é uma métrica em nível de host relatada em bytes. Para obter mais informações, consulte Métricas em nível de host.

A FreeableMemory CloudWatch métrica próxima de 0 (ou seja, abaixo de 100 MB) ou a SwapUsage métrica maior que a FreeableMemory métrica indica que um nó está sob pressão de memória. Se isso ocorrer, consulte os seguintes tópicos:

Evictions

Esta é uma métrica do mecanismo de cache. Recomendamos que você determine seu próprio limite de alarme para essa métrica com base nas necessidades do seu aplicativo.

Se você estiver usando o Memcached e exceder o limite escolhido, aumente seu cluster usando um tipo de nó maior ou expanda adicionando mais nós.

CurrConnections

Esta é uma métrica do mecanismo de cache. Recomendamos que você determine seu próprio limite de alarme para essa métrica com base nas necessidades do seu aplicativo.

Um número crescente de CurrConnectionspode indicar um problema com seu aplicativo; você precisará investigar o comportamento do aplicativo para resolver esse problema.

Para obter mais informações, consulte a seção Conexões em Monitoramento das melhores práticas com a Amazon ElastiCache (RedisOSS) usando a Amazon CloudWatch.

Memória (Valkey e RedisOSS)

A memória é um aspecto central do Valkey e do RedisOSS. Compreender a utilização da memória do seu cluster é necessário para evitar a perda de dados e acomodar o crescimento futuro do seu conjunto de dados. As estatísticas sobre a utilização da memória de um nó estão disponíveis na seção de memória do INFOcomando.

Para obter mais informações, consulte a seção Memória em Monitoramento das melhores práticas com a Amazon ElastiCache (RedisOSS) usando a Amazon CloudWatch.

Rede

Um dos fatores determinantes para a capacidade de largura de banda da rede do cluster é o tipo de nó selecionado. Para obter mais informações sobre a capacidade de rede do seu nó, consulte os ElastiCache preços da Amazon.

Para obter mais informações, consulte a seção Rede em Monitoramento das melhores práticas com a Amazon ElastiCache (RedisOSS) usando a Amazon CloudWatch.

Latência

Você pode medir a latência de um comando com um conjunto de CloudWatch métricas que fornecem latências agregadas por estrutura de dados. Essas métricas de latência são calculadas usando a commandstats estatística do comando INFOValkey.

Para obter mais informações, consulte a seção Latência em Monitoramento das melhores práticas com a Amazon ElastiCache usando a Amazon CloudWatch.

Replicação

O volume de dados que está sendo replicado é visível através da métrica ReplicationBytes. Embora essa métrica seja representante da carga de gravação no grupo de replicação, ela não fornece insights sobre a integridade da replicação. Para este efeito, você pode usar a métrica ReplicationLag.

Para obter mais informações, consulte a seção Replicação em Monitoramento das melhores práticas com a Amazon ElastiCache (RedisOSS) usando a Amazon. CloudWatch

Gerenciamento de tráfego (Valkey e RedisOSS)

ElastiCache (RedisOSS) gerencia automaticamente o tráfego em relação a um nó quando mais comandos de entrada são enviados ao nó do que os que podem ser processados pelo Valkey ou pelo Redis. OSS Isso é feito para manter a operação e estabilidade ideais do mecanismo.

Quando o tráfego for gerenciado ativamente em um nó, a métrica TrafficManagementActive emitirá pontos de dados de 1. Isso indica que o nó está subdimensionado para a workload que está sendo fornecida. Se essa métrica permanecer em 1 por longos períodos, avalie o cluster para decidir se é necessário aumentar a escala verticalmente ou horizontalmente.

Para obter mais informações, consulte a métrica TrafficManagementActive na página Métricas.