429 ou limite d'erreurs dépassées Je vois des exemples en double.Je vois des erreurs concernant les horodatages des échantillons Je vois un message d’erreur lié à une limite.La sortie de votre serveur Prometheus local dépasse la limite.Certaines de mes données n'apparaissent pas Erreur HTTP 422 : délai d'expiration de la requête

Résoudre les erreurs liées à Amazon Managed Service for Prometheus

Utilisez les sections suivantes pour résoudre les problèmes liés à Amazon Managed Service for Prometheus.

Rubriques

429 ou limite d'erreurs dépassées
Je vois des exemples en double.
Je vois des erreurs concernant les horodatages des échantillons
Je vois un message d’erreur lié à une limite.
La sortie de votre serveur Prometheus local dépasse la limite.
Certaines de mes données n'apparaissent pas
Erreur HTTP 422 : délai d'expiration de la requête

429 ou limite d'erreurs dépassées

Si une erreur 429 similaire à l’exemple suivant s’affiche, cela signifie que vos demandes ont dépassé les quotas d’ingestion d’Amazon Managed Service for Prometheus.


ts=2020-10-29T15:34:41.845Z caller=dedupe.go:112 component=remote level=error remote_name=e13b0c 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/workspace_id/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 
Too Many Requests: ingestion rate limit (6666.666666666667) exceeded while adding 499 samples and 0 metadata

Si une erreur 429 similaire à l’exemple suivant s’affiche, cela signifie que vos demandes ont dépassé le quota du nombre de métriques actives dans un espace de travail d’Amazon Managed Service for Prometheus.


ts=2020-11-05T12:40:33.375Z caller=dedupe.go:112 component=remote level=error remote_name=aps 
url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/workspace_id/api/v1/remote_write 
msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: user=accountid_workspace_id: 
per-user series limit (local limit: 0 global limit: 3000000 actual local limit: 500000) exceeded

Si vous voyez une erreur 429 similaire à l'exemple suivant, vos demandes ont dépassé le quota d'Amazon Managed Service pour Prometheus en ce qui concerne le taux (transactions par seconde) auquel vous pouvez envoyer des données à votre espace de travail à l'aide de l'API compatible RemoteWrite Prometheus.


ts=2024-03-26T16:50:21.780708811Z caller=dedupe.go:112 component=remote level=error remote_name=ab123c 
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/workspace_id/api/v1/remote_write 
msg="non-recoverable error" count=1000 exemplarCount=0 err="server returned HTTP status 429 Too Many Requests: {\"message\":\"Rate exceeded\"}"

Si vous voyez une erreur 400 similaire à l'exemple suivant, vos demandes ont dépassé le quota d'Amazon Managed Service pour Prometheus pour les séries chronologiques actives. Pour plus de détails sur la façon dont les quotas de séries chronologiques actifs sont gérés, voirQuotas par défaut des séries actives.


ts=2024-03-26T16:50:21.780708811Z caller=push.go:53 level=warn
url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/workspace_id/api/v1/remote_write
msg="non-recoverable error" count=500 exemplarCount=0 
err="server returned HTTP status 400 Bad Request: maxFailure (quorum) on a given error family, rpc error: code = Code(400) 
desc = addr=10.1.41.23:9095 state=ACTIVE zone=us-east-1a, rpc error: code = Code(400) 
desc = user=accountid_workspace_id: per-user series limit of 10000000 exceeded, 
Capacity from 2,000,000 to 10,000,000 is automatically adjusted based on the last 30 min of usage. 
If throttled above 10,000,000 or in case of incoming surges, please contact administrator to raise it. 
(local limit: 0 global limit: 10000000 actual local limit: 92879)"

Pour plus d’informations sur les quotas de service d’Amazon Managed Service for Prometheus et sur la manière de demander des augmentations, consultez la section Service Quotas d’Amazon Managed Service for Prometheus.

Je vois des exemples en double.

Si vous utilisez un groupe Prometheus haute disponibilité, vous devez utiliser des étiquettes externes sur vos instances Prometheus pour configurer la déduplication. Pour de plus amples informations, veuillez consulter Déduplication des métriques haute disponibilité envoyées à Amazon Managed Service for Prometheus.

D'autres problèmes liés aux données dupliquées sont abordés dans la section suivante.

Je vois des erreurs concernant les horodatages des échantillons

Amazon Managed Service for Prometheus ingère les données dans l'ordre et s'attend à ce que chaque échantillon soit horodaté plus tard que l'échantillon précédent.

Si vos données n'arrivent pas dans l'ordre, vous pouvez voir des erreurs concernant out-of-order samplesduplicate sample for timestamp, ousamples with different value but same timestamp. Ces problèmes sont généralement dus à une configuration incorrecte du client qui envoie les données à Amazon Managed Service for Prometheus. Si vous utilisez un client Prometheus fonctionnant en mode agent, vérifiez la configuration pour détecter les règles comportant un nom de série dupliqué ou des cibles dupliquées. Si vos statistiques fournissent directement l'horodatage, vérifiez qu'elles ne sont pas hors ordre.

Vous pouvez configurer un créneau horaire pour que votre espace de travail accepte les échantillons hors service. Pour de plus amples informations, veuillez consulter Configurez votre espace de travail.

Pour plus de détails sur son fonctionnement ou sur les moyens de vérifier votre configuration, consultez le billet de blog Understanding Duplicate Samples and Out-of-order Timestamp Errors in Prometheus de Prometheus de Prom Labs.

Je vois un message d’erreur lié à une limite.

Note

Amazon Managed Service for Prometheus CloudWatch fournit des statistiques d'utilisation pour surveiller l'utilisation des ressources de Prometheus. À l'aide de la fonction d'alarme des métriques d' CloudWatchutilisation, vous pouvez surveiller les ressources et l'utilisation de Prometheus afin d'éviter les erreurs de limite.

Si l’un des messages d’erreur suivants s’affiche, vous pouvez demander une augmentation de l’un des quotas Amazon Managed Service for Prometheus afin de résoudre le problème. Pour de plus amples informations, veuillez consulter Service Quotas d’Amazon Managed Service for Prometheus.

limite de série par utilisateur <value> dépassée, veuillez contacter l'administrateur pour l'augmenter
limite par série métrique en cas de <value> dépassement, veuillez contacter l'administrateur pour l'augmenter
limite de taux d’ingestion (...) dépassée
la série comporte trop d’étiquettes (...) série : « % »
la plage de temps de requête dépasse la limite (longueur de la requête : xxx, limite : yyy)
la requête a atteint la limite maximale du nombre de morceaux lors de la récupération des morceaux auprès des ingesters
Limite dépassée. Nombre maximal d’espaces de travail par compte.

La sortie de votre serveur Prometheus local dépasse la limite.

Amazon Managed Service for Prometheus impose des quotas de service correspondant à la quantité de données qu’un espace de travail peut recevoir des serveurs Prometheus. Pour connaître la quantité de données que votre serveur Prometheus envoie à Amazon Managed Service for Prometheus, vous pouvez exécuter les requêtes suivantes sur votre serveur Prometheus. Si vous constatez que les résultats renvoyés par Prometheus dépassent la limite fixée par Amazon Managed Service for Prometheus, vous pouvez demander une augmentation du quota de service correspondant. Pour de plus amples informations, veuillez consulter Service Quotas d’Amazon Managed Service for Prometheus.

Interrogez votre serveur Prometheus local autonome pour connaître les limites de sortie.
Type de données	Requête à utiliser
Séries actives en cours	`prometheus_tsdb_head_series`
Taux d’ingestion actuel	`rate(prometheus_tsdb_head_samples_appended_total[5m])`
Most-to-least liste des séries actives par nom de métrique	`sort_desc(count by(__name__) ({__name__!=""}))`
Nombre d’étiquettes par série de métriques	`group by(mylabelname) ({__name__!=""})`

Certaines de mes données n'apparaissent pas

Les données envoyées à Amazon Managed Service for Prometheus peuvent être supprimées pour diverses raisons. Le tableau suivant indique les raisons pour lesquelles les données peuvent être supprimées au lieu d'être ingérées.

Vous pouvez suivre la quantité de données supprimées et les raisons pour lesquelles elles sont supprimées à l'aide d'Amazon CloudWatch. Pour de plus amples informations, veuillez consulter Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus.

Raison	Signification
greater_than_max_sample_age	Supprimer les lignes de journal plus anciennes que l'heure actuelle
new-value-for-timestamp	Les échantillons dupliqués sont envoyés avec le même horodatage que l'échantillon précédent, mais avec des valeurs différentes.
per_metric_series_limit	L’utilisateur a atteint la limite de séries actives par métrique.
per_user_series_limit	L’utilisateur a atteint le nombre total de séries actives.
rate_limited	Taux d’ingestion limité
sample-out-of-order	Les échantillons sont envoyés hors commande et ne peuvent pas être traités. Cette raison n'est émise que lorsque la fenêtre temporelle hors service est définie sur 0.
échantillon trop vieux	L'échantillon est plus ancien que la période de rupture configurée et ne peut pas être traité.
limite de taux de commande hors limite	Out-of-order la limite de taux d'ingestion a été atteinte et l'échantillon ne peut pas être traité. Pour de plus amples informations, veuillez consulter Service Quotas d’Amazon Managed Service for Prometheus.
label_value_too long	La valeur de l’étiquette est supérieure à la limite de caractères autorisée.
max_label_names_per_series	L’utilisateur a cliqué sur les noms d’étiquette par métrique
missing_metric_name	Le nom de la métrique n’est pas fourni.
metric_name_invalid	Nom de métrique fourni non valide.
label_invalid	Étiquette fournie non valide.
duplicate_label_names	Noms d’étiquettes fournis en double.
histogramme_native_sample_size_bytes_exceeded	L'échantillon d'histogramme natif dépasse la taille d'échantillon maximale autorisée. Réduisez le nombre de compartiments ou de travées dans l'histogramme côté client.
schéma_histogramme_natif non valide	La valeur de schéma de l'histogramme natif n'est pas valide. Les schémas valides sont compris entre -4 et 8. Vérifiez la configuration de votre client Prometheus pour connaître les paramètres. `NativeHistogramBucketFactor`
histogramme_natif_invalide	L'histogramme natif échoue à la validation (par exemple, nombre de compartiments négatif, nombre de compartiments non concordant ou travées de compartiments mal formées). Cela indique généralement un bogue dans la bibliothèque d'instrumentation.
native_histogram_buckets_exceeded	L'histogramme natif dépasse le nombre maximal de compartiments et la résolution ne peut pas être réduite automatiquement. Réduisez le nombre de buckets côté client en utilisant`NativeHistogramMaxBucketNumber`.
native_histogram_rate_limited	L'échantillon d'histogramme natif a été rejeté car la limite de taux d'ingestion de l'histogramme natif a été atteinte. Réduisez le nombre de séries d'histogrammes natifs ou la fréquence de capture, ou demandez une augmentation de la limite.
par utilisateur_native_histogram_series_limit	L'utilisateur a atteint la limite de séries actives de l'histogramme natif par espace de travail. Réduisez le nombre de séries d'histogrammes natifs ou demandez une augmentation de limite.

Erreur HTTP 422 : délai d'expiration de la requête

Si votre requête dure plus d'une minute, Amazon Managed Service for Prometheus renvoie un code d'état HTTP 422. L'exemple suivant illustre cette erreur :


{"status":"error","errorType":"execution","error":"query timed out - consider simplifying your query"}

Pour réduire le temps d'évaluation, appliquez une ou plusieurs des approches suivantes :

Spécifiez une fenêtre temporelle plus courte pour évaluer moins d'échantillons.
Ajoutez des correcteurs d'étiquettes pour réduire le nombre de séries évaluées par votre requête.
Utilisez les règles d'enregistrement pour précalculer les agrégations coûteuses que vous demandez fréquemment.
Évitez les correspondances de regex sur les étiquettes à forte cardinalité (étiquettes comportant de nombreuses valeurs uniques).

Pour de plus amples informations, veuillez consulter Interroger vos métriques Prometheus.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Points de terminaison de VPC d’Interface

Identification