Respostas a perguntas comuns sobre configuração de alta disponibilidade no Amazon Managed Service for Prometheus - Amazon Managed Service para Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Respostas a perguntas comuns sobre configuração de alta disponibilidade no Amazon Managed Service for Prometheus

Devo incluir o valor __replica__ em outro rótulo para rastrear os pontos de amostra?

Em uma configuração de alta disponibilidade, o Amazon Managed Service for Prometheus garante que as amostras de dados não sejam duplicadas ao eleger um líder no cluster de instâncias do Prometheus. Se a réplica líder parar de enviar amostras de dados por 30 segundos, o Amazon Managed Service for Prometheus automaticamente transforma outra instância do Prometheus em uma réplica líder e ingere dados do novo líder, incluindo quaisquer dados perdidos. Portanto, a resposta é não, isso não é recomendado.  Fazer isso pode causar problemas como:

  • Consultar um count no PromQL pode retornar um valor maior do que o esperado durante o período de eleição de um novo líder.

  • O número de active series aumenta durante o período de eleição de um novo líder e atinge o active series limits. Consulte AMPCotas para obter mais informações.

O Kubernetes parece ter seu próprio rótulo de cluster e não está desduplicando minhas métricas. Como corrijo isso?

Uma nova métrica apiserver_storage_size_bytes foi introduzida no Kubernetes 1.28, com um rótulo. cluster Isso pode causar problemas com a desduplicação no Amazon Managed Service for Prometheus, que depende da etiqueta. cluster No Kubernetes 1.3, o rótulo é renomeado para storage-cluster_id (ele também é renomeado em patches posteriores de 1.28 e 1.29). Se seu cluster estiver emitindo essa métrica com o cluster rótulo, o Amazon Managed Service for Prometheus não poderá deduplicar a série temporal associada. Recomendamos que você atualize seu cluster Kubernetes para a versão corrigida mais recente para evitar esse problema. Como alternativa, você pode renomear o cluster rótulo em sua apiserver_storage_size_bytes métrica antes de inseri-lo no Amazon Managed Service for Prometheus.

nota

Para obter mais detalhes sobre a mudança no Kubernetes, consulte Renomear o cluster Label para storage_cluster_id para a métrica apiserver_storage_size_bytes no projeto Kubernetes. GitHub