¿Debo incluir el valor __replica__ en otra etiqueta para hacer un seguimiento de los puntos de muestra?Parece que Kubernetes tiene su propia etiqueta cluster y no deduplica mis métricas. ¿Cómo puedo solucionarlo?

Respuestas a preguntas habituales sobre la configuración de alta disponibilidad en Amazon Managed Service para Prometheus

¿Debo incluir el valor replica en otra etiqueta para hacer un seguimiento de los puntos de muestra?

En un entorno de alta disponibilidad, Amazon Managed Service para Prometheus garantiza que las muestras de datos no se dupliquen mediante la elección de un líder en el clúster de instancias de Prometheus. Si la réplica líder deja de enviar muestras de datos durante 30 segundos, Amazon Managed Service para Prometheus convierte de forma automática otra instancia de Prometheus en réplica líder e ingiere los datos del nuevo líder, incluidos los datos omitidos. Por lo tanto, la respuesta es no, no se recomienda. Si lo hace, puede provocar problemas como los siguientes:

Al consultar un count en PromQL, es posible que se devuelva un valor superior al esperado durante el periodo de elección de un nuevo líder.
El número de active series aumenta durante el periodo de elección de un nuevo líder y alcanza el active series limits. Para obtener más información, consulte Cuotas de AMP.

Parece que Kubernetes tiene su propia etiqueta cluster y no deduplica mis métricas. ¿Cómo puedo solucionarlo?

En Kubernetes 1.28 se incorporó la nueva métrica apiserver_storage_size_bytes con la etiqueta cluster. Esto puede provocar problemas con la deduplicación de Amazon Managed Service para Prometheus, que depende de la etiqueta cluster. En Kubernetes 1.3, se ha cambiado el nombre de la etiqueta por storage-cluster_id (también se ha cambiado en las revisiones posteriores de 1.28 y 1.29). Si el clúster emite esta métrica con la etiqueta cluster, Amazon Managed Service para Prometheus no puede deduplicar la serie de tiempo asociada. Le recomendamos que actualice el clúster de Kubernetes a la última versión revisada para evitar este problema. Como alternativa, puede cambiar a la etiqueta cluster en la métrica apiserver_storage_size_bytes antes de la ingesta en Amazon Managed Service para Prometheus.

nota

Para obtener más información sobre el cambio a Kubernetes, consulte Cambiar el nombre del clúster de etiquetas a storage_cluster_id para la métrica apiserver_storage_size_bytes del proyecto Kubernetes. GitHub

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Envío de datos de alta disponibilidad con el gráfico de Helm de la comunidad de Prometheus

Disponibilidad entre regiones