

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Solucionar erros do Amazon Managed Service for Prometheus
<a name="AMP-troubleshooting"></a>

Use as seções a seguir para solucionar problemas com o Amazon Managed Service for Prometheus.

**Topics**
+ [Erros 429 ou de limite de excedido](#AMP-troubleshoot-429)
+ [Vejo amostras duplicadas](#AMP-troubleshoot-duplicate)
+ [Vejo erros sobre carimbos de data/hora de amostra](#AMP-troubleshoot-duplicate-ordering)
+ [Vejo uma mensagem de erro relacionada a um limite](#AMP-troubleshoot-limiterror)
+ [A saída local do servidor Prometheus excede o limite.](#AMP-understand-output)
+ [Alguns dos meus dados não estão aparecendo](#AMP-troubleshoot-discarded-data)

## Erros 429 ou de limite de excedido
<a name="AMP-troubleshoot-429"></a>

Se você ver um erro 429 semelhante ao exemplo a seguir, suas solicitações excederam as cotas de ingestão do Amazon Managed Service for Prometheus.

```
ts=2020-10-29T15:34:41.845Z caller=dedupe.go:112 component=remote level=error remote_name=e13b0c 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 
Too Many Requests: ingestion rate limit (6666.666666666667) exceeded while adding 499 samples and 0 metadata
```

Se você ver um erro 429 semelhante ao exemplo a seguir, suas solicitações excederam a cota do Amazon Managed Service for Prometheus para o número de métricas ativas em um espaço de trabalho.

```
ts=2020-11-05T12:40:33.375Z caller=dedupe.go:112 component=remote level=error remote_name=aps 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: user={{accountid}}_{{workspace_id}}: 
per-user series limit (local limit: 0 global limit: 3000000 actual local limit: 500000) exceeded
```

Se você vir um erro 429 semelhante ao exemplo a seguir, suas solicitações excederam a cota do Amazon Managed Service for Prometheus para a taxa (transações por segundo) em que você pode enviar dados para seu espaço de trabalho usando a API `RemoteWrite` compatível com o Prometheus.

```
ts=2024-03-26T16:50:21.780708811Z caller=dedupe.go:112 component=remote level=error remote_name=ab123c 
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/{{workspace_id}}/api/v1/remote_write 
msg="non-recoverable error" count=1000 exemplarCount=0 err="server returned HTTP status 429 Too Many Requests: {\"message\":\"Rate exceeded\"}"
```

Se você vir um erro 400 semelhante ao exemplo a seguir, suas solicitações excederam as cotas do Amazon Managed Service for Prometheus para séries temporais ativas. Para obter detalhes sobre como as cotas de séries temporais ativas são processadas, consulte [Cotas padrão de séries ativas.](AMP_quotas.md#AMP-dynamic-series).

```
ts=2024-03-26T16:50:21.780708811Z caller=push.go:53 level=warn
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/{{workspace_id}}/api/v1/remote_write
msg="non-recoverable error" count=500 exemplarCount=0 
err="server returned HTTP status 400 Bad Request: maxFailure (quorum) on a given error family, rpc error: code = Code(400) 
desc = addr=10.1.41.23:9095 state=ACTIVE zone=us-east-1a, rpc error: code = Code(400) 
desc = user={{accountid}}_{{workspace_id}}: per-user series limit of 10000000 exceeded, 
Capacity from 2,000,000 to 10,000,000 is automatically adjusted based on the last 30 min of usage. 
If throttled above 10,000,000 or in case of incoming surges, please contact administrator to raise it. 
(local limit: 0 global limit: 10000000 actual local limit: 92879)"
```

Para obter mais informações sobre as Service Quotas do Amazon Managed Service for Prometheus e sobre como solicitar aumentos, consulte [Service Quotas do Amazon Managed Service for Prometheus](AMP_quotas.md)

## Vejo amostras duplicadas
<a name="AMP-troubleshoot-duplicate"></a>

Se você estiver usando um grupo Prometheus de alta disponibilidade, precisará usar rótulos externos em suas instâncias do Prometheus para configurar a desduplicação. Para obter mais informações, consulte [Eliminar a duplicação de métricas de alta disponibilidade enviadas para o Amazon Managed Service for Prometheus](AMP-ingest-dedupe.md).

Outros problemas relacionados a dados duplicados são discutidos na próxima seção.

## Vejo erros sobre carimbos de data/hora de amostra
<a name="AMP-troubleshoot-duplicate-ordering"></a>

O Amazon Managed Service for Prometheus ingere dados em ordem e espera que cada amostra tenha um registro de data e hora posterior à amostra anterior.

Se seus dados não chegarem em ordem, você poderá ver erros sobre `out-of-order samples`, `duplicate sample for timestamp` ou `samples with different value but same timestamp`. Esses problemas geralmente são causados pela configuração incorreta do cliente que está enviando dados para o Amazon Managed Service for Prometheus. Se você estiver usando um cliente do Prometheus em execução no modo atendente, verifique a configuração de regras com nome de série duplicado ou destinos duplicados. Se suas métricas fornecerem diretamente o carimbo de data/hora, verifique se elas não estão fora de ordem.

*Para obter mais detalhes sobre como isso funciona ou maneiras de verificar sua configuração, consulte a postagem do blog [Entendendo amostras duplicadas e erros de registro de Out-of-order data e hora no Prometheus da Prom](https://promlabs.com/blog/2022/12/15/understanding-duplicate-samples-and-out-of-order-timestamp-errors-in-prometheus/) Labs.*

## Vejo uma mensagem de erro relacionada a um limite
<a name="AMP-troubleshoot-limiterror"></a>

**nota**  
O Amazon Managed Service para Prometheus [CloudWatch fornece métricas de uso para monitorar o uso](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-CW-usage-metrics.html) dos recursos do Prometheus. Usando o recurso de alarme de métricas de CloudWatch uso, você pode monitorar os recursos e o uso do Prometheus para evitar erros de limite.

Se você receber uma das mensagens de erro a seguir, poderá solicitar um aumento em uma das cotas do Amazon Managed Service for Prometheus para resolver o problema. Para obter mais informações, consulte [Service Quotas do Amazon Managed Service for Prometheus](AMP_quotas.md).
+ limite de série por usuário {{<value>}} excedido, entre em contato com o administrador para aumentá-lo
+ limite de série por métrica {{<value>}} excedido, entre em contato com o administrador para aumentá-lo
+ limite de taxa de ingestão (...) excedido
+ a série tem muitos rótulos (...) series: '%s'
+ o intervalo de tempo de consulta excede o limite (comprimento da consulta: xxx, limite: yyy)
+ a consulta atingiu o limite máximo de partes ao buscar partes dos ingestores
+ Limite excedido. Máximo de espaços de trabalho por conta.

## A saída local do servidor Prometheus excede o limite.
<a name="AMP-understand-output"></a>

O Amazon Managed Service for Prometheus tem Service Quotas para a quantidade de dados que um espaço de trabalho pode receber dos servidores Prometheus. Para encontrar a quantidade de dados que seu servidor Prometheus está enviando para o Amazon Managed Service for Prometheus, você pode executar as seguintes consultas em seu servidor Prometheus. Se você descobrir que sua produção do Prometheus está excedendo o limite do Amazon Managed Service for Prometheus, você pode solicitar um aumento de Service Quota correspondente. Para obter mais informações, consulte [Service Quotas do Amazon Managed Service for Prometheus](AMP_quotas.md).


**Consultas em seu servidor Prometheus autônomo local para encontrar os limites de saída.**  

| Tipo de dados | Consulta a ser usada | 
| --- | --- | 
| Séries ativas atuais | `prometheus_tsdb_head_series` | 
| Taxa de ingestão atual | `rate(prometheus_tsdb_head_samples_appended_total[5m])` | 
| Most-to-least lista de séries ativas por nome de métrica | `sort_desc(count by(__name__) ({__name__!=""}))` | 
| Número de rótulos por série métrica | `group by(mylabelname) ({__name__!=""})` | 

## Alguns dos meus dados não estão aparecendo
<a name="AMP-troubleshoot-discarded-data"></a>

Os dados enviados ao Amazon Managed Service for Prometheus podem ser descartados por vários motivos. A tabela a seguir mostra os motivos pelos quais os dados podem ser descartados em vez de serem ingeridos.

Você pode rastrear a quantidade e os motivos pelos quais os dados são descartados usando a Amazon. CloudWatch Para obter mais informações, consulte [Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus](AMP-CW-usage-metrics.md).


|  Motivo  |  Significado  | 
| --- | --- | 
| greater\_than\_max\_sample\_age | Descarte de linhas de log que são mais antigas do que a hora atual | 
| new-value-for-timestamp | As amostras duplicadas são enviadas com o mesmo carimbo de data/hora da amostra anterior, mas com valores diferentes. | 
| per\_metric\_series\_limit | O usuário atingiu o limite ativo da série por métrica | 
| per\_user\_series\_limit | O usuário atingiu o limite total de séries ativas | 
| rate\_limited | Taxa de ingestão limitada | 
| sample-out-of-order | As amostras são enviadas fora de ordem e não podem ser processadas | 
| label\_value\_too\_long | O valor do rótulo é maior do que o limite permitido de caracteres | 
| max\_label\_names\_per\_series | O usuário atingiu o limite de nomes dos rótulos por métrica | 
| missing\_metric\_name | O nome da métrica não foi fornecido | 
| metric\_name\_invalid | Nome da métrica inválido fornecido | 
| label\_invalid | Rótulo inválido fornecido | 
| duplicate\_label\_names | Nomes de rótulos duplicados fornecidos  | 