Devo incluir o valor __replica__ em outro rótulo para rastrear os pontos de amostra?O Kubernetes parece ter seu próprio rótulo de cluster e não está desduplicando minhas métricas. Como corrijo isso?

Respostas a perguntas comuns sobre a configuração de alta disponibilidade no Amazon Managed Service for Prometheus

Devo incluir o valor replica em outro rótulo para rastrear os pontos de amostra?

Em uma configuração de alta disponibilidade, o Amazon Managed Service for Prometheus garante que as amostras de dados não sejam duplicadas ao eleger um líder no cluster de instâncias do Prometheus. Se a réplica líder parar de enviar amostras de dados por 30 segundos, o Amazon Managed Service for Prometheus automaticamente transforma outra instância do Prometheus em uma réplica líder e ingere dados do novo líder, incluindo quaisquer dados perdidos. Portanto, a resposta é não, isso não é recomendado. Fazer isso pode causar problemas como:

Consultar um count no PromQL pode retornar um valor maior do que o esperado durante o período de eleição de um novo líder.
O número de active series aumenta durante o período de eleição de um novo líder e atinge o active series limits. Para obter mais informações, consulte Cotas do AMP.

O Kubernetes parece ter seu próprio rótulo de cluster e não está desduplicando minhas métricas. Como corrijo isso?

Uma nova métrica apiserver_storage_size_bytes foi introduzida no Kubernetes 1.28, com um rótulo cluster. Isso pode causar problemas com a desduplicação no Amazon Managed Service for Prometheus, que depende do rótulo cluster. No Kubernetes 1.3, o rótulo é renomeado para storage-cluster_id (ele também é renomeado em patches posteriores da 1.28 e 1.29). Se seu cluster estiver emitindo essa métrica com o rótulo cluster, o Amazon Managed Service for Prometheus não poderá desduplicar a série temporal associada. Recomendamos que você atualize seu cluster do Kubernetes para a versão corrigida mais recente para evitar esse problema. Outra possibilidade é renomear o rótulo cluster em sua métrica apiserver_storage_size_bytes antes de inseri-lo no Amazon Managed Service for Prometheus.

nota

Para obter mais detalhes sobre a mudança no Kubernetes, consulte Renomear o cluster Label para storage_cluster_id para a métrica apiserver_storage_size_bytes no projeto Kubernetes. GitHub

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Enviar dados de alta disponibilidade com o chart do Helm da comunidade do Prometheus

Disponibilidade entre regiões