

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Solución de errores de Amazon Managed Service para Prometheus
<a name="AMP-troubleshooting"></a>

Utilice las siguientes secciones como ayuda para solucionar los problemas que puedan presentarse con Amazon Managed Service para Prometheus.

**Topics**
+ [Errores 429 o de límite superado](#AMP-troubleshoot-429)
+ [Veo muestras duplicadas](#AMP-troubleshoot-duplicate)
+ [Veo errores en los ejemplos de marcas de tiempo](#AMP-troubleshoot-duplicate-ordering)
+ [Aparece un mensaje de error relacionado con un límite](#AMP-troubleshoot-limiterror)
+ [La producción del servidor de Prometheus local supera el límite.](#AMP-understand-output)
+ [Algunos datos no aparecen](#AMP-troubleshoot-discarded-data)

## Errores 429 o de límite superado
<a name="AMP-troubleshoot-429"></a>

Si ve un error 429 similar al siguiente ejemplo, significa que las solicitudes han superado las cuotas de ingesta de Amazon Managed Service para Prometheus.

```
ts=2020-10-29T15:34:41.845Z caller=dedupe.go:112 component=remote level=error remote_name=e13b0c 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 
Too Many Requests: ingestion rate limit (6666.666666666667) exceeded while adding 499 samples and 0 metadata
```

Si ve un error 429 similar al siguiente ejemplo, significa que las solicitudes han superado la cuota de Amazon Managed Service para Prometheus en cuanto al número de métricas activas en un espacio de trabajo.

```
ts=2020-11-05T12:40:33.375Z caller=dedupe.go:112 component=remote level=error remote_name=aps 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: user={{accountid}}_{{workspace_id}}: 
per-user series limit (local limit: 0 global limit: 3000000 actual local limit: 500000) exceeded
```

Si ve un error 429 similar al siguiente ejemplo, significa que las solicitudes han superado la cuota de Amazon Managed Service para Prometheus con respecto a la tasa (transacciones por segundo) a la que puede enviar datos al espacio de trabajo con la API compatible con `RemoteWrite` Prometheus.

```
ts=2024-03-26T16:50:21.780708811Z caller=dedupe.go:112 component=remote level=error remote_name=ab123c 
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=1000 exemplarCount=0 err="server returned HTTP status 429 Too Many Requests: {\"message\":\"Rate exceeded\"}"
```

Si ve un error 400 similar al siguiente ejemplo, significa que las solicitudes han superado la cuota de Amazon Managed Service para Prometheus para la serie temporal activa. Para obtener información detallada sobre cómo se gestionan las cuotas de series temporales activas, consulte [Cuotas de series activas predeterminadas](AMP_quotas.md#AMP-dynamic-series).

```
ts=2024-03-26T16:50:21.780708811Z caller=push.go:53 level=warn
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/{{workspace_id}}/api/v1/remote_write
msg="non-recoverable error" count=500 exemplarCount=0 
err="server returned HTTP status 400 Bad Request: maxFailure (quorum) on a given error family, rpc error: code = Code(400) 
desc = addr=10.1.41.23:9095 state=ACTIVE zone=us-east-1a, rpc error: code = Code(400) 
desc = user={{accountid}}_{{workspace_id}}: per-user series limit of 10000000 exceeded, 
Capacity from 2,000,000 to 10,000,000 is automatically adjusted based on the last 30 min of usage. 
If throttled above 10,000,000 or in case of incoming surges, please contact administrator to raise it. 
(local limit: 0 global limit: 10000000 actual local limit: 92879)"
```

Para obtener más información sobre las cuotas de servicio de Amazon Managed Service para Prometheus y sobre cómo solicitar aumentos, consulte [Cuotas de servicio de Amazon Managed Service para Prometheus](AMP_quotas.md).

## Veo muestras duplicadas
<a name="AMP-troubleshoot-duplicate"></a>

Si utiliza un grupo de Prometheus de alta disponibilidad, debe utilizar etiquetas externas en las instancias de Prometheus para configurar la desduplicación. Para obtener más información, consulte [Desduplicación de métricas de alta disponibilidad enviadas a Amazon Managed Service para Prometheus](AMP-ingest-dedupe.md).

En la sección siguiente, analizamos otras cuestiones relacionadas con los datos duplicados.

## Veo errores en los ejemplos de marcas de tiempo
<a name="AMP-troubleshoot-duplicate-ordering"></a>

Amazon Managed Service para Prometheus ingiere los datos en orden y espera que cada muestra tenga una fecha posterior a la de la muestra anterior.

Si los datos no llegan en orden, pueden aparecer errores sobre `out-of-order samples`, `duplicate sample for timestamp` o `samples with different value but same timestamp`. Estos problemas suelen deberse a una configuración incorrecta del cliente que envía los datos a Amazon Managed Service para Prometheus. Si utiliza un cliente de Prometheus que se ejecuta en modo agente, busque en la configuración reglas con el nombre de serie duplicado o destinos duplicados. Si las métricas proporcionan la marca de tiempo de forma directa, compruebe que no estén desordenadas.

*Para obtener más información sobre cómo funciona o cómo comprobar la configuración, consulta la entrada del blog [Understanding Duplicate Samples and Out-of-order Timestamp Errors in Prometheus](https://promlabs.com/blog/2022/12/15/understanding-duplicate-samples-and-out-of-order-timestamp-errors-in-prometheus/) de Prom Labs.*

## Aparece un mensaje de error relacionado con un límite
<a name="AMP-troubleshoot-limiterror"></a>

**nota**  
Amazon Managed Service for Prometheus [CloudWatch proporciona métricas de uso para supervisar el uso](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-CW-usage-metrics.html) de los recursos de Prometheus. Con la función de alarma de métricas de CloudWatch uso, puede supervisar los recursos y el uso de Prometheus para evitar errores de límite.

Si ve uno de los siguientes mensajes de error, puede solicitar un aumento de una de las cuotas de Amazon Managed Service para Prometheus para solucionar el problema. Para obtener más información, consulte [Cuotas de servicio de Amazon Managed Service para Prometheus](AMP_quotas.md).
+ Si se {{<value>}} ha superado el límite por serie por usuario, póngase en contacto con el administrador para aumentarlo
+ Se {{<value>}} ha superado el límite por serie métrica; póngase en contacto con el administrador para aumentarlo
+ ingestion rate limit (...) exceeded
+ series has too many labels (...) series: '%s'
+ the query time range exceeds the limit (query length: xxx, limit: yyy)
+ the query hit the max number of chunks limit while fetching chunks from ingesters
+ Limit exceeded. Maximum workspaces per account.

## La producción del servidor de Prometheus local supera el límite.
<a name="AMP-understand-output"></a>

Amazon Managed Service para Prometheus cuenta con cuotas de servicio para la cantidad de datos que un espacio de trabajo puede recibir de los servidores de Prometheus. Para saber la cantidad de datos que el servidor de Prometheus envía a Amazon Managed Service para Prometheus, puede ejecutar las siguientes consultas en el servidor de Prometheus. Si descubre que el resultado de Prometheus supera un límite de Amazon Managed Service para Prometheus, puede solicitar un aumento de la cuota de servicio correspondiente. Para obtener más información, consulte [Cuotas de servicio de Amazon Managed Service para Prometheus](AMP_quotas.md).


**Realiza consultas en el servidor de Prometheus local autoadministrado para encontrar los límites de resultados.**  

| Tipo de datos | Consulta que se utiliza | 
| --- | --- | 
| Serie activa actual | `prometheus_tsdb_head_series` | 
| Tasa de ingesta actual | `rate(prometheus_tsdb_head_samples_appended_total[5m])` | 
| Most-to-least lista de series activas por nombre métrico | `sort_desc(count by(__name__) ({__name__!=""}))` | 
| Número de etiquetas por serie de métricas | `group by(mylabelname) ({__name__!=""})` | 

## Algunos datos no aparecen
<a name="AMP-troubleshoot-discarded-data"></a>

Los datos que se envían a Amazon Managed Service para Prometheus se pueden descartar por varios motivos. En la siguiente tabla se muestran los motivos por los que los datos podrían descartarse en lugar de ingerirse.

Puedes hacer un seguimiento de la cantidad y los motivos por los que se descartan los datos a través de Amazon CloudWatch. Para obtener más información, consulte [Usa CloudWatch métricas para monitorear los recursos de Amazon Managed Service for Prometheus](AMP-CW-usage-metrics.md).


|  Motivo  |  Significado  | 
| --- | --- | 
| greater\_than\_max\_sample\_age | Se descartan las líneas de registro anteriores a la hora actual | 
| new-value-for-timestamp | Las muestras duplicadas se envían con la misma marca de tiempo que la muestra anterior, pero con valores diferentes. | 
| per\_metric\_series\_limit | El usuario ha alcanzado el límite de series activas por métrica | 
| per\_user\_series\_limit | El usuario ha alcanzado el límite total de series activas | 
| rate\_limited | Tasa de ingesta limitada | 
| sample-out-of-order | Las muestras se envían de forma desordenada y no se pueden procesar | 
| label\_value\_too\_long | El valor de la etiqueta supera el límite de caracteres permitido | 
| max\_label\_names\_per\_series | El usuario ha seleccionado los nombres de las etiquetas por métrica | 
| missing\_metric\_name | No se ha proporcionado el nombre de la métrica | 
| metric\_name\_invalid | El nombre de la métrica proporcionado no es válido | 
| label\_invalid | Se ha proporcionado una etiqueta no válida | 
| duplicate\_label\_names | Se han proporcionado nombres de etiquetas duplicados  | 