Création et gestion des règles d'alerte Grafana - Amazon Managed Grafana

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création et gestion des règles d'alerte Grafana

Cette rubrique de documentation est conçue pour les espaces de travail Grafana compatibles avec la version 8.x de Grafana.

Pour les espaces de travail Grafana compatibles avec la version 10.x de Grafana, voir. Travailler dans la version 10 de Grafana

Pour les espaces de travail Grafana compatibles avec la version 9.x de Grafana, voir. Travailler dans la version 9 de Grafana

Une règle d'alerte est un ensemble de critères d'évaluation qui déterminent si une alerte est déclenchée. La règle comprend une ou plusieurs requêtes et expressions, une condition, la fréquence d'évaluation et éventuellement la durée pendant laquelle la condition est remplie.

Alors que les requêtes et les expressions sélectionnent l'ensemble de données à évaluer, une condition définit le seuil qu'une alerte doit atteindre ou dépasser pour créer une alerte. Un intervalle indique la fréquence à laquelle une règle d'alerte est évaluée. La durée, lorsqu'elle est configurée, indique la durée pendant laquelle une condition doit être remplie. Les règles peuvent également définir le comportement d'alerte en l'absence de données.

Les sections suivantes décrivent la création et la gestion de différents types de règles d'alerte Grafana.

Création de règles d'alerte gérées par Cortex ou Loki

Grafana vous permet de créer des règles d'alerte pour une instance externe de Cortex ou Loki.

Note

Cortex est la base de données de séries chronologiques utilisée par Amazon Managed Service pour les sources de données Prometheus et Prometheus.

Prérequis

  • Vérifiez que vous disposez des autorisations d'écriture sur la source de données Prometheus. Dans le cas contraire, vous ne pourrez pas créer ou mettre à jour les règles d'alerte gérées par Cortex.

  • Pour les sources de données Cortex et Loki, activez l'API Ruler en configurant leurs services respectifs.

    • Loki — Le type de stockage des local règles, par défaut pour la source de données Loki, prend uniquement en charge l'affichage des règles. Pour modifier les règles, configurez l'un des autres types de stockage.

    • Cortex — N'utilisez pas /prometheus l'ancien /api/prom préfixe. La source de données Prometheus prend en charge Cortex et Prometheus, et Grafana s'attend à ce que l'API Query et l'API Ruler se trouvent sous la même URL. Vous ne pouvez pas fournir d'URL distincte pour l'API Ruler.

Note

Si vous ne souhaitez pas gérer les règles d'alerte pour une source de données Loki ou Prometheus en particulier, accédez à ses paramètres et décochez la case Gérer les alertes via l'interface utilisateur d'alerte.

Pour ajouter une règle d'alerte gérée par Cortex ou Loki
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte répertoriant les alertes existantes.

  2. Choisissez Nouvelle règle d'alerte.

  3. À l'étape 1, ajoutez le nom, le type et l'emplacement de stockage de la règle, comme suit :

    • Dans Nom de la règle, ajoutez un nom descriptif. Ce nom est affiché dans la liste des règles d'alerte. Il s'agit également de l'alertnameétiquette de chaque instance d'alerte créée à partir de cette règle.

    • Dans le menu déroulant Type de règle, sélectionnez Alerte gérée par Cortex/Loki.

    • Dans le menu déroulant Sélectionner une source de données, sélectionnez une source de données Prometheus ou Loki.

    • Dans le menu déroulant Namespace, sélectionnez un espace de noms de règles existant. Sinon, choisissez Ajouter nouveau et entrez un nom pour en créer un. Les espaces de noms peuvent contenir un ou plusieurs groupes de règles et n'ont qu'un objectif organisationnel. Pour plus d’informations, consultez Groupes de règles et espaces de noms Cortex ou Loki.

    • Dans le menu déroulant Groupe, sélectionnez un groupe existant dans l'espace de noms sélectionné. Sinon, choisissez Ajouter nouveau et entrez un nom pour en créer un. Les règles nouvellement créées sont ajoutées à la fin du groupe. Les règles d'un groupe s'exécutent de manière séquentielle à intervalles réguliers, avec le même temps d'évaluation.

  4. À l'étape 2, ajoutez la requête à évaluer.

    La valeur peut être une expression ProMQL ou LogQL. La règle déclenche une alerte si le résultat de l'évaluation comporte au moins une série dont la valeur est supérieure à 0. Une alerte est créée pour chaque série.

  5. À l'étape 3, ajoutez des conditions.

    Dans la zone de texte Pour de la condition, spécifiez la durée pendant laquelle la condition doit être vraie avant que l'alerte ne soit déclenchée. Si vous le spécifiez5m, les conditions doivent être vraies pendant cinq minutes avant que l'alerte ne soit déclenchée.

    Note

    Une fois qu'une condition est remplie, l'alerte passe à Pending l'état. Si la condition reste active pendant la durée spécifiée, l'alerte passe à l'Firingétat. S'il n'est plus atteint, il revient à l'Normalétat.

  6. À l'étape 4, ajoutez des métadonnées supplémentaires associées à la règle.

    • Ajoutez une description et un résumé pour personnaliser les messages d'alerte. Utilisez les directives dansAnnotations et étiquettes pour les règles d'alerte.

    • Ajoutez l'URL, le panneau, le tableau de bord et les identifiants d'alerte de Runbook.

    • Ajoutez des étiquettes personnalisées.

  7. Choisissez Prévisualiser les alertes pour évaluer la règle et voir quelles alertes elle produirait. Il affiche une liste d'alertes avec l'état et la valeur de chacune d'elles.

  8. Choisissez Enregistrer pour enregistrer la règle ou Enregistrer et quitter pour enregistrer la règle et revenir à la page d'alerte.

Création de règles d'enregistrement gérées par Cortex ou Loki

Vous pouvez créer et gérer des règles d'enregistrement pour une instance externe de Cortex ou de Loki. Les règles d'enregistrement calculent à l'avance les expressions fréquemment nécessaires ou les expressions coûteuses en termes de calcul et enregistrent le résultat sous la forme d'un nouvel ensemble de séries chronologiques. L'interrogation de cette nouvelle série chronologique est plus rapide, en particulier pour les tableaux de bord, car ils demandent la même expression à chaque actualisation des tableaux de bord.

Prérequis

Pour les sources de données Cortex et Loki, activez l'API Ruler en configurant leurs services respectifs.

  • Loki — Le type de stockage des local règles, par défaut pour la source de données Loki, prend uniquement en charge l'affichage des règles. Pour modifier les règles, configurez l'un des autres types de stockage.

  • Cortex — Lorsque vous configurez une source de données Grafana Prometheus pour qu'elle pointe vers Cortex, utilisez l'ancien préfixe et non. /api/prom /prometheus La source de données Prometheus prend en charge Cortex et Prometheus, et Grafana s'attend à ce que l'API Query et l'API Ruler se trouvent sous la même URL. Vous ne pouvez pas fournir d'URL distincte pour l'API Ruler.

Note

Si vous ne souhaitez pas gérer les règles d'alerte pour une source de données Loki ou Prometheus en particulier, accédez à ses paramètres et décochez la case Gérer les alertes via l'interface utilisateur d'alerte.

Pour ajouter une règle d'enregistrement géré par Cortex ou Loki
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte répertoriant les alertes existantes.

  2. Choisissez Nouvelle règle d'alerte.

  3. À l'étape 1, ajoutez le nom, le type et l'emplacement de stockage de la règle, comme suit.

    • Dans Nom de la règle, ajoutez un nom descriptif. Ce nom est affiché dans la liste des règles d'alerte. Il s'agit également de l'alertnameétiquette de chaque instance d'alerte créée à partir de cette règle.

    • Dans le menu déroulant Type de règle, sélectionnez Alerte gérée par Cortex/Loki.

    • Dans le menu déroulant Sélectionner une source de données, sélectionnez une source de données Prometheus ou Loki.

    • Dans le menu déroulant Namespace, sélectionnez un espace de noms de règles existant. Sinon, choisissez Ajouter nouveau et entrez un nom pour en créer un. Les espaces de noms peuvent contenir un ou plusieurs groupes de règles et n'ont qu'un objectif organisationnel. Pour plus d’informations, consultez Groupes de règles et espaces de noms Cortex ou Loki.

    • Dans le menu déroulant Groupe, sélectionnez un groupe existant dans l'espace de noms sélectionné. Sinon, choisissez Ajouter nouveau et entrez un nom pour en créer un. Les règles nouvellement créées sont ajoutées à la fin du groupe. Les règles d'un groupe s'exécutent de manière séquentielle à intervalles réguliers, avec le même temps d'évaluation.

  4. À l'étape 2, ajoutez la requête à évaluer.

    La valeur peut être une expression ProMQL ou LogQL. La règle déclenche une alerte si le résultat de l'évaluation comporte au moins une série dont la valeur est supérieure à 0. Une alerte est créée pour chaque série.

  5. À l'étape 3, ajoutez des métadonnées supplémentaires associées à la règle.

    • Ajoutez une description et un résumé pour personnaliser les messages d'alerte. Utilisez les directives dansAnnotations et étiquettes pour les règles d'alerte.

    • Ajoutez l'URL, le panneau, le tableau de bord et les identifiants d'alerte de Runbook.

    • Ajoutez des étiquettes personnalisées.

  6. Choisissez Enregistrer pour enregistrer la règle ou Enregistrer et quitter pour enregistrer la règle et revenir à la page d'alerte.

Création de règles d'alerte gérées par Grafana

Grafana vous permet de créer des règles d'alerte qui interrogent une ou plusieurs sources de données, réduisent ou transforment les résultats et les comparent entre eux ou fixent des seuils. Lorsque celles-ci sont traitées, Grafana envoie des notifications au point de contact.

Note

La création de règles d'alerte gérées par Grafana lors de l'utilisation des alertes Grafana entraîne l'envoi de plusieurs notifications lorsque la règle correspond. Certains fournisseurs de points de contact peuvent disposer d'options configurables pour dédupliquer les notifications.

Pour ajouter une règle gérée par Grafana
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte répertoriant les alertes existantes.

  2. Choisissez Nouvelle règle d'alerte.

  3. À l'étape 1, ajoutez le nom, le type et l'emplacement de stockage de la règle, comme suit :

    • Dans Nom de la règle, ajoutez un nom descriptif. Ce nom est affiché dans la liste des règles d'alerte. Il s'agit également de l'alertnameétiquette de chaque instance d'alerte créée à partir de cette règle.

    • Dans la liste déroulante Type de règle, sélectionnez Alerte gérée par Grafana.

    • Dans le menu déroulant Dossier, sélectionnez le dossier dans lequel vous souhaitez stocker la règle. Si vous ne sélectionnez aucun dossier, la règle est enregistrée dans le General dossier. Pour créer un dossier, sélectionnez le menu déroulant et entrez un nouveau nom de dossier.

  4. À l'étape 2, ajoutez les requêtes et les expressions à évaluer.

    • Conservez le nom par défaut ou passez la souris dessus et cliquez sur l'icône d'édition pour modifier le nom.

    • Pour les requêtes, sélectionnez une source de données dans le menu déroulant.

    • Ajoutez une ou plusieurs requêtes ou expressions (pour plus de détails sur les expressions, voir Expressions dans la documentation de Grafana).

    • Pour chaque expression, sélectionnez soit la condition classique pour créer une règle d'alerte unique, soit les options Mathématiques, Réduire ou Rééchantillonner pour générer des alertes distinctes pour chaque série. Pour plus de détails sur ces options, consultezRègles uniques et multidimensionnelles.

    • Choisissez Exécuter les requêtes pour vérifier que la requête est réussie.

  5. À l'étape 3, ajoutez des conditions.

    • Dans le menu déroulant Condition, sélectionnez la requête ou l'expression pour lancer la règle d'alerte.

    • Pour Evaluer chaque, spécifiez la fréquence d'évaluation. Ce doit être un multiple de 10 secondes. Par exemple, 1m, 30s.

    • Pour Evaluer pour, spécifiez la durée pendant laquelle la condition doit être vraie avant qu'une alerte ne soit déclenchée.

      Note

      Lorsqu'une condition est violée, l'alerte passe à Pending l'état. Si la condition reste violée pendant la durée spécifiée, l'alerte passe à l'Firingétat. S'il n'est plus atteint, il revient à l'Normalétat.

    • Dans Configurer l'absence de données et la gestion des erreurs, configurez le comportement des alertes en l'absence de données. Utilisez les instructions contenues dans. Gestion de l'absence de données ou des cas d'erreur

    • Choisissez Prévisualiser les alertes pour vérifier le résultat de l'exécution de la requête en ce moment. L'aperçu exclut l'absence de données et les conditions de gestion des erreurs.

  6. À l'étape 4, ajoutez des métadonnées supplémentaires associées à la règle.

    • Ajoutez une description et un résumé pour personnaliser les messages d'alerte. Utilisez les directives dansAnnotations et étiquettes pour les règles d'alerte.

    • Ajoutez l'URL, le panneau, le tableau de bord et les identifiants d'alerte de Runbook.

    • Ajoutez des étiquettes personnalisées.

  7. Choisissez Enregistrer pour enregistrer la règle ou Enregistrer et quitter pour enregistrer la règle et revenir à la page d'alerte.

Règles uniques et multidimensionnelles

Pour les règles d'alerte gérées par Grafana, vous pouvez créer une règle avec une condition classique ou vous pouvez créer une règle multidimensionnelle.

Règle unidimensionnelle (condition classique)

Utilisez une expression de condition classique pour créer une règle qui déclenche une seule alerte lorsque sa condition est remplie. Pour une requête qui renvoie plusieurs séries, Grafana ne suit pas l'état d'alerte de chaque série. Grafana n'envoie donc qu'une seule alerte, même lorsque les conditions d'alerte sont remplies pour plusieurs séries.

Pour plus d'informations sur le formatage des expressions, voir Expressions dans la documentation de Grafana.

Règle multidimensionnelle

Pour générer une instance d'alerte distincte pour chaque série renvoyée dans la requête, créez une règle multidimensionnelle.

Note

Chaque instance d'alerte générée par une règle multidimensionnelle est prise en compte dans votre quota total d'alertes. Les règles ne sont pas évaluées lorsque vous atteignez votre quota d'alertes. Pour plus d'informations sur les quotas pour les règles multidimensionnelles, consultezErreurs liées au quota atteint.

Pour créer plusieurs instances à partir d'une seule règle MathReduce, utilisez ou Resample expressions pour créer une règle multidimensionnelle. Par exemple, vous pouvez :

  • Ajoutez une Reduce expression pour chaque requête afin d'agréger les valeurs de la plage de temps sélectionnée en une seule valeur. (Non nécessaire pour les règles utilisant des données numériques).

  • Ajoutez une Math expression avec la condition de la règle. Cela n'est pas nécessaire si une requête ou une expression de réduction renvoie déjà 0 si la règle ne doit pas déclencher d'alerte, ou un nombre positif si elle doit lancer une alerte.

    Voici quelques exemples :

    • $B > 70s'il doit lancer une alerte si la valeur de la requête/expression B est supérieure à 70.

    • $B < $C * 100au cas où il devrait déclencher une alerte si la valeur de B est inférieure à la valeur de C multipliée par 100. Si les requêtes comparées contiennent plusieurs séries dans leurs résultats, les séries issues de différentes requêtes sont mises en correspondance si elles ont les mêmes étiquettes ou si l'une est un sous-ensemble de l'autre.

Note

Grafana ne prend pas en charge les requêtes d'alerte avec des variables de modèle. Plus d'informations sont disponibles sur la page de communauté Les variables de modèle ne sont pas prises en charge dans les requêtes d'alerte lors de la configuration d'Alert.

Considérations relatives aux performances pour les règles multidimensionnelles

Chaque instance d'alerte est prise en compte dans le quota d'alertes. Les règles multidimensionnelles qui créent un nombre d'instances supérieur au quota d'alerte ne sont pas évaluées et renvoient une erreur de quota. Pour plus d’informations, consultez Erreurs liées au quota atteint.

Les alertes multidimensionnelles peuvent avoir un impact important sur les performances de votre espace de travail Grafana, ainsi que sur les performances de vos sources de données lorsque Grafana les interroge pour évaluer vos règles d'alerte. Les considérations suivantes peuvent être utiles lorsque vous essayez d'optimiser les performances de votre système de surveillance.

  • Fréquence d'évaluation des règles — La propriété Evaluer chaque règle d'alerte contrôle la fréquence d'évaluation des règles. Nous recommandons d'utiliser la fréquence d'évaluation la plus basse acceptable.

  • Cardinalité de l'ensemble de résultats : le nombre d'instances d'alerte que vous créez avec une règle influe sur ses performances. Supposons que vous surveillez les erreurs de réponse d'API pour chaque chemin d'API, sur chaque machine virtuelle de votre parc. Cet ensemble a pour cardinalité le nombre de chemins multiplié par le nombre de machines virtuelles. Vous pouvez réduire la cardinalité du jeu de résultats, par exemple en surveillant le nombre total d'erreurs par machine virtuelle plutôt que par chemin par machine virtuelle.

  • Complexité de la requête : les requêtes que les sources de données peuvent traiter et auxquelles elles peuvent répondre rapidement consomment moins de ressources. Bien que cette considération soit moins importante que les autres considérations répertoriées ci-dessus, si vous les réduisez autant que possible, l'examen des performances de chaque requête peut faire la différence. Vous devez également être conscient de l'impact de l'évaluation de ces règles sur les performances de vos sources de données. Les requêtes d'alerte constituent souvent la grande majorité des requêtes traitées par les bases de données de surveillance, de sorte que les mêmes facteurs de charge qui affectent l'instance de Grafana les affectent également.

Erreurs liées au quota atteint

Il existe un quota pour le nombre d'instances d'alerte que vous pouvez avoir dans un même espace de travail. Lorsque vous atteignez ce nombre, vous ne pouvez plus créer de nouvelles règles d'alerte dans cet espace de travail. Avec les alertes multidimensionnelles, le nombre d'instances d'alerte peut varier dans le temps.

Il est important de garder à l'esprit les points suivants lorsque vous travaillez avec des instances d'alerte.

  • Si vous créez uniquement des règles unidimensionnelles, chaque règle est une instance d'alerte unique. Vous pouvez créer le même nombre de règles dans un même espace de travail que votre quota d'instance d'alerte, mais pas plus.

  • Les règles multidimensionnelles créent plusieurs instances d'alerte, mais leur nombre n'est pas connu tant qu'elles ne sont pas évaluées. Par exemple, si vous créez une règle d'alerte qui suit l'utilisation du processeur de vos instances Amazon EC2, il se peut qu'il y ait 50 instances EC2 lorsque vous la créez (et donc 50 instances d'alerte), mais si vous ajoutez 10 instances EC2 supplémentaires une semaine plus tard, l'évaluation suivante comportera 60 instances d'alerte.

    Le nombre d'instances d'alerte est évalué lorsque vous créez une alerte multidimensionnelle, et vous ne pouvez pas en créer une qui vous fasse immédiatement dépasser votre quota d'instances d'alerte. Le nombre d'instances d'alerte pouvant changer, votre quota est vérifié chaque fois que vos règles sont évaluées.

  • Au moment de l'évaluation d'une règle, si une règle vous oblige à dépasser votre quota d'instances d'alerte, cette règle n'est pas évaluée tant qu'une mise à jour n'est pas apportée à la règle d'alerte qui ramène le nombre total d'instances d'alerte en dessous du quota de service. Dans ce cas, vous recevez une notification d'alerte vous informant que votre quota a été atteint (la notification utilise la politique de notification de la règle en cours d'évaluation). La notification inclut une Error annotation avec la valeurQuotaReachedError.

  • Règle qui entraîne l'évaluation d'un QuotaReachedError arrêt. L'évaluation ne reprend que lorsqu'une mise à jour est effectuée et l'évaluation après la mise à jour ne provoque pas elle-même deQuotaReachedError. Une règle qui n'est pas en cours d'évaluation indique l'erreur Quota atteint dans la console Grafana.

  • Vous pouvez réduire le nombre d'instances d'alerte en supprimant les règles d'alerte ou en modifiant les alertes multidimensionnelles afin de réduire le nombre d'instances d'alerte (par exemple, en ayant une alerte sur les erreurs par machine virtuelle, plutôt qu'une alerte sur les erreurs par API dans une machine virtuelle).

  • Pour reprendre les évaluations, mettez à jour l'alerte et enregistrez-la. Vous pouvez le mettre à jour pour réduire le nombre d'instances d'alerte, ou si vous avez apporté d'autres modifications pour réduire le nombre d'instances d'alerte, vous pouvez l'enregistrer sans le modifier. Si elle peut être reprise, elle l'est. Si cela en cause un autreQuotaReachedError, vous ne pouvez pas l'enregistrer.

  • Lorsqu'une alerte est enregistrée et reprend son évaluation sans dépasser le quota d'alertes, l'erreur Quota atteint peut continuer à s'afficher dans la console Grafana pendant un certain temps (jusqu'à son intervalle d'évaluation). Cependant, l'évaluation des règles d'alerte démarre et des alertes sont envoyées si le seuil de la règle est atteint.

  • Pour plus de détails sur le quota d'alertes, ainsi que sur les autres quotas, consultezQuotas de service Amazon Managed Grafana.

Gestion de l'absence de données ou des cas d'erreur

Choisissez des options pour gérer le comportement des alertes en l'absence de données ou en cas d'erreur.

Les options permettant de ne traiter aucune donnée sont répertoriées dans le tableau suivant.

Option « Aucune donnée » Attitude

Aucune donnée

Créez une alerte DatasourceNoData avec le nom et l'UID de la règle d'alerte, ainsi que l'UID de la source de données qui n'a renvoyé aucune donnée sous forme d'étiquette.

Alerte

Définissez l'état de la règle d'alerte surAlerting.

OK

Définissez l'état de la règle d'alerte surNormal.

Les options de gestion des cas d'erreur sont répertoriées dans le tableau suivant.

Option d'erreur ou de délai d'expiration Attitude

Alerte

Définissez l'état de la règle d'alerte sur Alerting

OK

Définissez l'état de la règle d'alerte sur Normal

Erreur

Créez une alerte DatasourceError avec le nom et l'UID de la règle d'alerte, ainsi que l'UID de la source de données qui n'a renvoyé aucune donnée sous forme d'étiquette.

Annotations et étiquettes pour les règles d'alerte

Les annotations et les étiquettes sont des paires clé-valeur associées aux alertes provenant de la règle d'alerte, de la réponse de la source de données et de l'évaluation de la règle d'alerte. Ils peuvent être utilisés directement dans les notifications d'alerte ou dans les modèles et les fonctions des modèles pour créer un contact de notification de manière dynamique.

Annotations

Les annotations sont des paires clé-valeur qui fournissent des informations supplémentaires sur une alerte. Vous pouvez utiliser les annotations suivantes :description,summary,runbook_url, alertIddashboardUid, etpanelId. Ils sont affichés dans les détails des règles et des alertes dans l'interface utilisateur et peuvent être utilisés dans les modèles de messages des points de contact.

Etiquettes

Les étiquettes sont des paires clé-valeur qui contiennent des informations sur une alerte. L'étiquette définie pour une alerte est générée et complétée tout au long du processus d'évaluation et de notification des alertes. Ils sont utilisés de la manière suivante.

Les variables de modèle suivantes sont disponibles lorsque vous développez des annotations et des étiquettes.

Name (Nom) Description

$labels

Les libellés de la requête ou de la condition. Par exemple : {{ $labels.instance }} et {{ $labels.job }}. Cette option n'est pas disponible lorsque la règle utilise une condition classique.

$values

Les valeurs de toutes les expressions mathématiques et de réduction qui ont été évaluées pour cette règle d'alerte. Par exemple{{ $values.A }}, {{ $values.A.Labels }} et {{ $values.A.Value }}A est le refID de l'expression. Ceci n'est pas disponible lorsque la règle utilise une condition classique

$value

Chaîne de valeur de l'instance d'alerte. Par exemple, [ var='A' labels={instance=foo} value=10 ].

Gestion des règles d'alerte

La page Alertes répertorie les règles d'alerte. Par défaut, les règles sont regroupées par type de source de données. La section Grafana répertorie les règles gérées par Grafana, et la section Cortex/Loki répertorie les règles relatives aux sources de données compatibles avec Prometheus. Vous pouvez consulter les règles d'alerte pour les sources de données compatibles avec Prometheus, mais vous ne pouvez pas les modifier.

Afficher les règles d'alerte

Grâce aux alertes Grafana, vous pouvez consulter toutes vos alertes sur une seule page.

Pour afficher les détails des alertes
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte. Par défaut, les règles sont affichées par groupes par type de source de données. Vous pouvez également consulter l'état actuel de chaque alerte (ces informations sont décrites plus en détail dans le texte suivant).

  2. Dans Afficher sous, vous pouvez basculer entre les vues de groupe et d'état en choisissant l'option que vous préférez.

  3. Cliquez sur la flèche à côté d'une ligne pour afficher plus de détails sur cette ligne. Les détails d'une règle incluent les étiquettes des règles, les annotations, les sources de données et les requêtes, ainsi qu'une liste des instances d'alerte résultant de la règle.

Vue de groupe

La vue de groupe montre les règles d'alerte Grafana regroupées par dossier et les règles d'alerte Loki ou Prometheus groupées par +. namespace group Il s'agit de la vue de liste de règles par défaut, destinée à la gestion des règles. Vous pouvez développer chaque groupe pour afficher la liste des règles de ce groupe. Développez davantage une règle pour en afficher les détails. Vous pouvez également développer les boutons d'action et les alertes résultant de la règle pour en afficher les détails.

Vue de l'État

La vue État affiche les règles d'alerte regroupées par état. Utilisez cette vue pour avoir une vue d'ensemble des règles dans quel état. Chaque règle peut être étendue pour afficher ses détails. Boutons d'action et toutes les alertes générées par cette règle, et chaque alerte peut être étendue pour afficher ses détails.

Règles d'alerte de filtrage

Vous pouvez filtrer les règles d'alerte qui apparaissent sur la page Alertes de plusieurs manières.

  • Vous pouvez filtrer pour afficher les règles qui interrogent une source de données spécifique en choisissant Sélectionner les sources de données, puis en sélectionnant une source de données sur laquelle filtrer.

  • Vous pouvez filtrer par étiquette en choisissant des critères de recherche dans Rechercher par étiquette. Certains exemples de critères incluentenvironment=production,region=~US|EU,severity!=warning.

  • Vous pouvez filtrer pour afficher les règles dans un état spécifique en choisissant Filtrer les alertes par état, puis en sélectionnant l'état que vous souhaitez afficher.

Modifier ou supprimer des règles d'alerte

Les règles d'alerte gérées par Grafana ne peuvent être modifiées ou supprimées que par les utilisateurs disposant d'autorisations de modification pour le dossier contenant les règles. Les règles d'alerte pour une instance externe de Cortex ou Loki peuvent être modifiées ou supprimées par les utilisateurs ayant des rôles d'éditeur ou d'administrateur.

Pour modifier ou supprimer une règle
  1. Développez une règle jusqu'à ce que vous puissiez voir les commandes de règle pour Afficher, Modifier et Supprimer.

  2. Choisissez Modifier pour ouvrir la page de création de règles. Effectuez les mises à jour de la même manière que vous créez une règle. Pour plus de détails, consultez les instructions figurant dans Création de règles d'alerte gérées par Grafana ouCréation de règles d'alerte gérées par Cortex ou Loki.

  3. Choisissez éventuellement Supprimer pour supprimer une règle.

Groupes de règles et espaces de noms Cortex ou Loki

Vous pouvez organiser vos règles. Les règles sont créées au sein de groupes de règles, et les groupes de règles sont organisés en espaces de noms. Les règles d'un groupe de règles sont exécutées séquentiellement à intervalles réguliers. L'intervalle par défaut est d'une minute. Vous pouvez renommer les espaces de noms et les groupes de règles Cortex ou Loki, et modifier les intervalles d'évaluation des groupes de règles.

Pour modifier un groupe de règles ou un espace de noms
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte.

  2. Accédez à une règle au sein du groupe de règles ou de l'espace de noms que vous souhaitez modifier.

  3. Cliquez sur l'icône Modifier (stylo).

  4. Apportez des modifications au groupe de règles ou à l'espace de noms.

    Note

    Pour les espaces de noms, vous ne pouvez modifier que le nom. Pour les groupes de règles, vous modifiez le nom ou l'intervalle d'évaluation des règles du groupe. Par exemple, vous pouvez 1m choisir d'évaluer les règles une fois par minute ou 30s toutes les 30 secondes.

  5. Sélectionnez Enregistrer les modifications.