Respuestas a preguntas habituales sobre la configuración de alta disponibilidad en Amazon Managed Service para Prometheus - Servicio administrado por Amazon para Prometheus

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Respuestas a preguntas habituales sobre la configuración de alta disponibilidad en Amazon Managed Service para Prometheus

¿Debo incluir el valor __replica__ en otra etiqueta para hacer un seguimiento de los puntos de muestra?

En un entorno de alta disponibilidad, Amazon Managed Service para Prometheus garantiza que las muestras de datos no se dupliquen mediante la elección de un líder en el clúster de instancias de Prometheus. Si la réplica líder deja de enviar muestras de datos durante 30 segundos, Amazon Managed Service para Prometheus convierte de forma automática otra instancia de Prometheus en réplica líder e ingiere los datos del nuevo líder, incluidos los datos omitidos. Por lo tanto, la respuesta es no, no se recomienda.  Si lo hace, puede provocar problemas como los siguientes:

  • Al consultar un count en PromQL, es posible que se devuelva un valor superior al esperado durante el periodo de elección de un nuevo líder.

  • El número de active series aumenta durante el periodo de elección de un nuevo líder y alcanza el active series limits. Para obtener más información, consulte Cuotas de AMP.

Parece que Kubernetes tiene su propia etiqueta cluster y no desduplica mis métricas. ¿Cómo puedo solucionarlo?

En Kubernetes 1.28 se incorporó la nueva métrica apiserver_storage_size_bytes con la etiqueta cluster. Esto puede provocar problemas con la desduplicación de Amazon Managed Service para Prometheus, que depende de la etiqueta cluster. En Kubernetes 1.3, se ha cambiado el nombre de la etiqueta por storage-cluster_id (también se ha cambiado en las revisiones posteriores de 1.28 y 1.29). Si el clúster emite esta métrica con la etiqueta cluster, Amazon Managed Service para Prometheus no puede desduplicar la serie de tiempo asociada. Le recomendamos que actualice el clúster de Kubernetes a la última versión revisada para evitar este problema. Como alternativa, puede cambiar a la etiqueta cluster en la métrica apiserver_storage_size_bytes antes de la ingesta en Amazon Managed Service para Prometheus.

nota

Para obtener más información sobre el cambio a Kubernetes, consulte Rename Label cluster to storage_cluster_id for apiserver_storage_size_bytes metric en el proyecto de GitHub de Kubernetes.