Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Monitoramento do DAX

Modo de foco
Monitoramento do DAX - Amazon DynamoDB

Você pode monitorar as principais métricas, como a taxa de acertos de cache, para garantir o desempenho ideal do cluster do DAX, diagnosticar problemas e determinar o momento de escalar o cluster. A verificação regular das principais métricas ajuda você a manter o desempenho, a estabilidade e a economia, ajustando a escala do cluster para atender às necessidades da workload. Para obter mais informações sobre o monitoramento do DAX, consulte Monitoramento da produção.

A seguinte lista apresenta algumas das principais métricas que você deve monitorar:

  • Taxa de acertos de cache: mostra a eficiência com que o DAX fornece dados que estão armazenados em cache, reduzindo a necessidade de acessar as tabelas subjacentes do DynamoDB. Poucas perdas no cache para o cluster indicam boa eficiência de armazenamento em cache. Por outro lado, poucos acertos de cache sugerem que talvez seja necessário rever a configuração de TTL do armazenamento em cache ou que a workload não é adequada para armazenamento em cache.

    Use o Amazon CloudWatch para calcular a taxa de acertos de cache do cluster do DAX. Compare as métricas ItemCacheHits, ItemCacheMisses, QueryCacheHits e QueryCacheMisses para obter essa taxa. A fórmula a seguir mostra como a taxa de acertos de cache é calculada. Para calcular a taxa usando essa fórmula, divida a quantidade de acertos de cache pela soma dos acertos e das perdas no cache.

    Cache hit ratio = Cache hits / (Cache hits + Cache misses)

    A taxa de acertos de cache é um número entre 0 e 1, que é representado como uma porcentagem. Quanto maior for essa porcentagem, melhor será a utilização geral do cache.

  • ErrorRequestCount: contagem de solicitações que resultaram em erros de usuário relatados pelo nó ou cluster. ErrorRequestCount inclui solicitações que foram limitadas pelo nó ou cluster. O monitoramento de erros do usuário pode ajudar você a identificar configurações incorretas de escalabilidade ou padrões de itens/partições ativos na aplicação.

  • Latências de operação: o monitoramento da latência das operações de leitura e gravação de e para o cluster do DAX pode ajudar você a identificar gargalos de desempenho. O aumento das latências pode indicar problemas na rede ou na configuração do cluster do DAX, ou a necessidade de escalar.

  • Consumo da rede: fique de olho nas métricas NetworkBytesIn e NetworkBytesOut para monitorar o tráfego de rede do cluster do DAX. Um aumento inesperado no throughput da rede pode significar mais solicitações de clientes ou padrões de consulta ineficientes que estão fazendo com que mais dados sejam transferidos.

    O monitoramento do consumo da rede ajuda você a gerenciar os custos do cluster do DAX. Também garante que a rede não se torne um gargalo para o desempenho do cluster.

  • Taxa de remoção: mostra com que frequência os itens são removidos do cache para abrir espaço para novos itens. Se a taxa de remoção aumentar com o tempo, isso poderá significar que o cache é muito pequeno ou que sua estratégia de armazenamento em cache não é eficaz.

    Monitore a métrica EvictedSize no CloudWatch para determinar se o tamanho do cache é adequado para a workload. Se o tamanho total removido continuar aumentando, talvez seja necessário aumentar a escala do cluster do DAX verticalmente para acomodar um cache maior.

  • Utilização da CPU: refere-se ao percentual de utilização da CPU pelo nó ou cluster. Essa é uma métrica essencial para monitorar qualquer banco de dados ou sistema de armazenamento em cache. Uma alta utilização da CPU pode significar que o cluster do DAX pode estar sobrecarregado e precisar passar por ajuste da escala para lidar com o aumento da demanda.

    Monitore a métrica CPUUtilization do cluster do DAX. Se a utilização da CPU se aproximar ou exceder consistentemente o patamar de 70–80%, considere aumentar a escala do cluster do DAX verticalmente conforme descrito na seção a seguir.

    Se o número de solicitações enviadas ao DAX exceder a capacidade de um nó, o DAX limitará a taxa em que aceita solicitações adicionais. Ele faz isso retornando uma ThrottlingException. O DAX avalia continuamente a utilização da CPU para determinar o volume de solicitações que consegue processar enquanto mantém um estado de cluster íntegro.

    Você pode monitorar a métrica ThrottledRequestCount publicada pelo DAX no CloudWatch. Se você vir essas exceções regularmente, considere aumentar o cluster.

Escalar um cluster do DAX usando dados de monitoramento

Você pode determinar se precisa aumentar ou reduzir a escala do cluster do DAX verticalmente monitorando suas métricas de desempenho.

  • Aumentar a escala vertical ou horizontalmente: se o cluster do DAX tiver alta utilização da CPU, poucos acertos de cache (após otimizar a estratégia de armazenamento em cache) ou altas latências de operação, você deverá aumentar a escala verticalmente do cluster. A adição de nós, também chamada de aumento horizontal da escala, pode ajudar a distribuir a carga de maneira mais uniforme. Para workloads com quantidades cada vez maiores de gravações por segundo, pode ser necessário escolher nós mais poderosos (aumentar a escala verticalmente).

  • Reduzir a escala verticalmente: se você observar consistentemente baixa utilização da CPU e latências de operação abaixo dos limites, talvez tenha provisionado recursos em excesso. Nesses casos, reduza a escala de nós verticalmente para reduzir os custos. Você pode reduzir o número de nós para 1 durante períodos de baixa utilização, mas não pode desligar totalmente o cluster.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.