Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus

Amazon Managed Service for Prometheus envoie des statistiques d'utilisation à. CloudWatch Ces métriques fournissent une visibilité sur l’utilisation de votre espace de travail. Les métriques vendues se trouvent dans les AWS/Prometheus espaces de noms AWS/Usage et dans. CloudWatch Ces statistiques sont disponibles CloudWatch gratuitement. Pour plus d'informations sur les mesures d'utilisation, consultez la section Mesures CloudWatch d'utilisation.

CloudWatch nom de la métrique Nom de la ressource CloudWatch espace de noms Description

ResourceCount

IngestionRate

AWS/Usage

Taux d’ingestion d’échantillons

Unités : nombre par seconde

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

ActiveSeries

AWS/Usage

Nombre de séries actives par espace de travail

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

ActiveAlerts

AWS/Usage

Nombre d’alertes actives par espace de travail

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

SizeOfAlerts

AWS/Usage

Taille totale de toutes les alertes de l'espace de travail, en octets

Unité : Octets

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

SuppressedAlerts

AWS/Usage

Nombre d’alertes supprimées par espace de travail. Une alerte peut être supprimée par un silence ou une inhibition.

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

UnprocessedAlerts

AWS/Usage

Nombre d’alertes non traitées par espace de travail. Une alerte n'est pas traitée une fois qu'elle est reçue par AlertManager, mais elle attend la prochaine évaluation du groupe d'agrégation.

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

ResourceCount

AllAlerts

AWS/Usage

Nombre d’alertes dans n’importe quel état par espace de travail.

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

AlertManagerAlertsReceived

-

AWS/Prometheus

Nombre total d'alertes réussies reçues par le gestionnaire d'alertes

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

AlertManagerNotificationsFailed

-

AWS/Prometheus

Nombre de livraisons d’alertes ayant échoué

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

AlertManagerNotificationsThrottled

-

AWS/Prometheus

Nombre d’alertes bloquées

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

DiscardedSamples*

-

AWS/Prometheus

Nombre d’échantillons rejetés par motif

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

RuleEvaluations

-

AWS/Prometheus

Nombre total d’évaluations de règles

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

RuleEvaluationFailures

-

AWS/Prometheus

Nombre d’échecs d’évaluation des règles dans l’intervalle

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

RuleGroupIterationsMissed

-

AWS/Prometheus

Nombre d’itérations de groupes de règles manquées dans l’intervalle.

Unités : nombre

Statistiques valides : moyenne, minimum, maximum, somme

*Certaines des raisons pour lesquelles les échantillons sont rejetés sont les suivantes.

Raison

Signification

greater_than_max_sample_age

Jeter les échantillons datant de plus d'une heure.

new-value-for-timestamp

Les échantillons dupliqués sont envoyés avec un horodatage différent de celui enregistré précédemment.

per_metric_series_limit

L'utilisateur a atteint la limite de séries actives par métrique.

per_user_series_limit

L'utilisateur a atteint la limite du nombre total de séries actives.

rate_limited

Taux d'ingestion limité.

sample-out-of-order

Les échantillons sont envoyés hors commande et ne peuvent pas être traités.

label_value_too long

La valeur de l'étiquette est supérieure à la limite de caractères autorisée.

max_label_names_per_series

L'utilisateur a sélectionné les noms des libellés par métrique.

missing_metric_name

Le nom de la métrique n'est pas fourni.

metric_name_invalid

Le nom de métrique fourni n'est pas valide.

label_invalid

Libellé fourni non valide.

duplicate_label_names

Des noms d'étiquettes dupliqués ont été fournis.

Note

Une métrique inexistante ou manquante est identique à la valeur de cette métrique égale à 0.

Note

RuleGroupIterationsMissed, RuleEvaluations et RuleEvaluationFailures ont la dimension RuleGroup de la structure suivante :

RuleGroupNamespace;RuleGroup

Régler une CloudWatch alarme sur les métriques vendues par Prometheus

Vous pouvez surveiller l'utilisation des ressources Prometheus à l'aide d'alarmes. CloudWatch

Pour régler une alarme sur le nombre de ActiveSeriesdans Prometheus
  1. Choisissez l'onglet Graphed metrics et faites défiler l'écran vers le bas jusqu'à l'ActiveSeriesétiquette.

    Dans la vue Graphed metrics, seules les métriques actuellement ingérées apparaissent.

  2. Sélectionnez l’icône de notification dans la colonne Actions.

  3. Dans Specify metric and conditions, entrez la condition de seuil dans le champ Conditions value et choisissez Suivant.

  4. Dans Configure actions, sélectionnez une rubrique SNS existante ou créez-en une nouvelle à laquelle envoyer la notification.

  5. Dans Add name and description, ajoutez le nom de l’alarme et une description facultative.

  6. Sélectionnez Créer une alerte.