Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisez les sections suivantes pour résoudre les problèmes liés à Amazon Managed Service for Prometheus.
Rubriques
429 ou limite d'erreurs dépassées
Si une erreur 429 similaire à l’exemple suivant s’affiche, cela signifie que vos demandes ont dépassé les quotas d’ingestion d’Amazon Managed Service for Prometheus.
ts=2020-10-29T15:34:41.845Z caller=dedupe.go:112 component=remote level=error remote_name=e13b0c url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: ingestion rate limit (6666.666666666667) exceeded while adding 499 samples and 0 metadata
Si une erreur 429 similaire à l’exemple suivant s’affiche, cela signifie que vos demandes ont dépassé le quota du nombre de métriques actives dans un espace de travail d’Amazon Managed Service for Prometheus.
ts=2020-11-05T12:40:33.375Z caller=dedupe.go:112 component=remote level=error remote_name=aps url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: user=accountid
_workspace_id
: per-user series limit (local limit: 0 global limit: 3000000 actual local limit: 500000) exceeded
Si vous voyez une erreur 429 similaire à l'exemple suivant, vos demandes ont dépassé le quota d'Amazon Managed Service pour Prometheus en ce qui concerne le taux (transactions par seconde) auquel vous pouvez envoyer des données à votre espace de travail à l'aide de l'API compatible RemoteWrite
Prometheus.
ts=2024-03-26T16:50:21.780708811Z caller=dedupe.go:112 component=remote level=error remote_name=ab123c url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=1000 exemplarCount=0 err="server returned HTTP status 429 Too Many Requests: {\"message\":\"Rate exceeded\"}"
Si vous voyez une erreur 400 similaire à l'exemple suivant, vos demandes ont dépassé le quota d'Amazon Managed Service pour Prometheus pour les séries chronologiques actives. Pour plus de détails sur la façon dont les quotas de séries chronologiques actifs sont gérés, voirSérie active par défaut.
ts=2024-03-26T16:50:21.780708811Z caller=push.go:53 level=warn url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 exemplarCount=0 err="server returned HTTP status 400 Bad Request: maxFailure (quorum) on a given error family, rpc error: code = Code(400) desc = addr=10.1.41.23:9095 state=ACTIVE zone=us-east-1a, rpc error: code = Code(400) desc = user=accountid
_workspace_id
: per-user series limit of 10000000 exceeded, Capacity from 2,000,000 to 10,000,000 is automatically adjusted based on the last 30 min of usage. If throttled above 10,000,000 or in case of incoming surges, please contact administrator to raise it. (local limit: 0 global limit: 10000000 actual local limit: 92879)"
Pour plus d’informations sur les quotas de service d’Amazon Managed Service for Prometheus et sur la manière de demander des augmentations, consultez la section Service Quotas d’Amazon Managed Service for Prometheus.
Je vois des exemples en double.
Si vous utilisez un groupe Prometheus haute disponibilité, vous devez utiliser des étiquettes externes sur vos instances Prometheus pour configurer la déduplication. Pour de plus amples informations, veuillez consulter Déduplication des métriques haute disponibilité envoyées à Amazon Managed Service for Prometheus.
D'autres problèmes liés aux données dupliquées sont abordés dans la section suivante.
Je vois des erreurs concernant les horodatages des échantillons
Amazon Managed Service for Prometheus ingère les données dans l'ordre et s'attend à ce que chaque échantillon soit horodaté plus tard que l'échantillon précédent.
Si vos données n'arrivent pas dans l'ordre, vous pouvez voir des erreurs concernant out-of-order
samples
duplicate sample for timestamp
, ousamples with
different value but same timestamp
. Ces problèmes sont généralement dus à une configuration incorrecte du client qui envoie les données à Amazon Managed Service for Prometheus. Si vous utilisez un client Prometheus fonctionnant en mode agent, vérifiez la configuration pour détecter les règles comportant un nom de série dupliqué ou des cibles dupliquées. Si vos statistiques fournissent directement l'horodatage, vérifiez qu'elles ne sont pas hors ordre.
Pour plus de détails sur son fonctionnement ou sur les moyens de vérifier votre configuration, consultez le billet de blog Understanding Duplicate Samples and Out-of-order Timestamp Errors in Prometheus de Prometheus de Prom Labs
Je vois un message d’erreur lié à une limite.
Note
Amazon Managed Service for Prometheus CloudWatch fournit des statistiques d'utilisation pour surveiller l'utilisation des ressources de Prometheus. À l'aide de la fonction d'alarme des métriques d' CloudWatchutilisation, vous pouvez surveiller les ressources et l'utilisation de Prometheus afin d'éviter les erreurs de limite.
Si l’un des messages d’erreur suivants s’affiche, vous pouvez demander une augmentation de l’un des quotas Amazon Managed Service for Prometheus afin de résoudre le problème. Pour de plus amples informations, veuillez consulter Service Quotas d’Amazon Managed Service for Prometheus.
-
limite de série par utilisateur
<value>
dépassée, veuillez contacter l'administrateur pour l'augmenter -
limite par série métrique en cas de
<value>
dépassement, veuillez contacter l'administrateur pour l'augmenter -
limite de taux d’ingestion (...) dépassée
-
la série comporte trop d’étiquettes (...) série : « % »
-
la plage de temps de requête dépasse la limite (longueur de la requête : xxx, limite : yyy)
-
la requête a atteint la limite maximale du nombre de morceaux lors de la récupération des morceaux auprès des ingesters
-
Limite dépassée. Nombre maximal d’espaces de travail par compte.
La sortie de votre serveur Prometheus local dépasse la limite.
Amazon Managed Service for Prometheus impose des quotas de service correspondant à la quantité de données qu’un espace de travail peut recevoir des serveurs Prometheus. Pour connaître la quantité de données que votre serveur Prometheus envoie à Amazon Managed Service for Prometheus, vous pouvez exécuter les requêtes suivantes sur votre serveur Prometheus. Si vous constatez que les résultats renvoyés par Prometheus dépassent la limite fixée par Amazon Managed Service for Prometheus, vous pouvez demander une augmentation du quota de service correspondant. Pour de plus amples informations, veuillez consulter Service Quotas d’Amazon Managed Service for Prometheus.
Type de données | Requête à utiliser |
---|---|
Séries actives en cours |
|
Taux d’ingestion actuel |
|
Most-to-least liste des séries actives par nom de métrique |
|
Nombre d’étiquettes par série de métriques |
|
Certaines de mes données n'apparaissent pas
Les données envoyées à Amazon Managed Service for Prometheus peuvent être supprimées pour diverses raisons. Le tableau suivant indique les raisons pour lesquelles les données peuvent être supprimées au lieu d'être ingérées.
Vous pouvez suivre la quantité de données supprimées et les raisons pour lesquelles elles sont supprimées à l'aide d'Amazon CloudWatch. Pour de plus amples informations, veuillez consulter Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus.
Raison |
Signification |
---|---|
greater_than_max_sample_age |
Supprimer les lignes de journal plus anciennes que l'heure actuelle |
new-value-for-timestamp |
Les échantillons dupliqués sont envoyés avec un horodatage différent de celui enregistré précédemment. |
per_metric_series_limit |
L’utilisateur a atteint la limite de séries actives par métrique. |
per_user_series_limit |
L’utilisateur a atteint le nombre total de séries actives. |
rate_limited |
Taux d’ingestion limité |
sample-out-of-order |
Les échantillons sont envoyés en dehors de la commande et ne peuvent pas être traités. |
label_value_too long |
La valeur de l’étiquette est supérieure à la limite de caractères autorisée. |
max_label_names_per_series |
L’utilisateur a cliqué sur les noms d’étiquette par métrique |
missing_metric_name |
Le nom de la métrique n’est pas fourni. |
metric_name_invalid |
Nom de métrique fourni non valide. |
label_invalid |
Étiquette fournie non valide. |
duplicate_label_names |
Noms d’étiquettes fournis en double. |