PERF05-BP07 Vérification des métriques à intervalles réguliers - Pilier Efficacité des performances

PERF05-BP07 Vérification des métriques à intervalles réguliers

Vérifiez les métriques qui sont collectées dans le cadre de la maintenance de routine ou en réponse à des événements ou des incidents. Utilisez ces vérifications pour identifier d’une part les métriques qui ont été essentielles pour traiter les problèmes, et d’autre part les métriques supplémentaires, si elles ont été suivies, qui pourraient aider à identifier, traiter ou empêcher les problèmes.

Anti-modèles courants :

  • Vous autorisez les métriques à rester dans un état d’alarme pendant longtemps.

  • Vous créez des alarmes qui ne sont pas exploitables par un système d’automatisation.

Avantages liés au respect de cette bonne pratique : passez en revue en permanence les métriques qui sont collectées pour vérifier qu’elles identifient, résolvent ou préviennent correctement les problèmes. Les métriques peuvent également devenir caduques si vous les laissez dans un état d’alarme pendant longtemps.

Niveau de risque encouru si cette bonne pratique n’est pas respectée : moyen

Directives d’implémentation

Améliorez constamment la surveillance et la collecte des métriques. Lorsque vous répondez aux incidents ou aux événements, évaluez les métriques qui ont été utiles dans la gestion du problème et les métriques qui auraient pu aider mais ne sont pas suivies actuellement. Utilisez cette méthode pour améliorer la qualité des métriques que vous collectez afin de pouvoir prévenir ou résoudre plus rapidement les incidents futurs.

Lorsque vous répondez aux incidents ou aux événements, évaluez les métriques qui ont été utiles dans la gestion du problème et les métriques qui auraient pu aider mais ne sont pas suivies actuellement. Utilisez ce processus pour améliorer la qualité des métriques que vous collectez afin de pouvoir prévenir ou résoudre plus rapidement les incidents futurs.

Étapes d’implémentation

  • Définition de métriques : définissez des métriques de performance critiques à surveiller qui correspondent à votre objectif de charge de travail, notamment des métriques telles que le temps de réponse et l’utilisation des ressources.

  • Établissement de bases de référence : définissez une base de référence et une valeur souhaitable pour chaque métrique. La base de référence doit fournir des points de référence pour identifier les écarts ou les anomalies.

  • Établissement d’une cadence : définissez une cadence (hebdomadaire ou mensuelle, par exemple) pour examiner les métriques critiques.

  • Identification des problèmes de performance : au cours de chaque examen, évaluez les tendances et les écarts par rapport aux valeurs de référence. Recherchez les goulots d’étranglement ou les anomalies au niveau des performances. Pour les problèmes identifiés, effectuez une analyse détaillée des causes profondes afin de comprendre la raison principale du problème.

  • Identification des actions correctives : utilisez votre analyse pour identifier les actions correctives. Cela peut inclure le réglage des paramètres, la correction de bogues et la mise à l’échelle des ressources.

  • Documentation des résultats : documentez vos conclusions, y compris les problèmes identifiés, les causes profondes et les mesures correctives.

  • Répétition et amélioration : évaluez et améliorez en permanence le processus de révision des métriques. Utilisez les enseignements tirés de la révision précédente pour améliorer le processus au fil du temps.

Ressources

Documents connexes :

Vidéos connexes :

Exemples connexes :