Des options alarmantes avec CloudWatch - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Des options alarmantes avec CloudWatch

La réalisation d'une analyse ponctuelle et automatisée de mesures importantes vous aide à détecter et à résoudre les problèmes avant qu'ils n'affectent vos charges de travail. CloudWatch facilite le diagramme et la comparaison de plusieurs mesures en utilisant plusieurs statistiques sur une période donnée. Vous pouvez utiliser CloudWatch pour effectuer une recherche sur toutes les mesures avec les valeurs de dimension requises pour trouver les mesures dont vous avez besoin pour votre analyse.

Nous vous recommandons de commencer votre approche de capture de mesures en incluant un ensemble initial de mesures et de dimensions à utiliser comme référence pour surveiller une charge de travail. Au fil du temps, la charge de travail arrive à maturité et vous pouvez ajouter des mesures et des dimensions supplémentaires pour vous aider à l'analyser et à la prendre en charge. Vos applications ou charges de travail peuvent utiliser plusieursAWSet possédant leurs propres mesures personnalisées, vous devez regrouper ces ressources sous un espace de noms pour les identifier plus facilement.

Vous devez également examiner comment les données de journalisation et de surveillance sont corrélées afin de pouvoir identifier rapidement les données de journalisation et de surveillance pertinentes pour diagnostiquer des problèmes spécifiques. Vous pouvez utiliserServiceLens CloudWatchpour corréler les traces, les mesures, les journaux et les alarmes pour diagnostiquer les problèmes. Vous devez également envisager d'inclure des dimensions supplémentaires dans les mesures et les identificateurs dans les journaux de vos charges de travail afin de vous aider à rechercher et à identifier rapidement les problèmes entre les systèmes et les services.

A l'aide de CloudWatch alarmes pour surveiller et alarmes

Vous pouvez utiliserAlarmes CloudWatchpour réduire la surveillance manuelle de vos charges de travail ou applications. Vous devez commencer par examiner les mesures que vous capturez pour chaque composant de charge de travail et déterminez les seuils appropriés pour chaque mesure. Assurez-vous d'identifier quels membres de l'équipe doivent être avertis lorsqu'un seuil est atteint. Vous devez établir et cibler des groupes de distribution plutôt que des membres individuels de l'équipe.

Les alarmes CloudWatch peuvent s'intégrer à votre solution de gestion des services pour créer automatiquement de nouveaux tickets et exécuter des flux de travail opérationnels. Par exemple,AWSfournit le logicielAWSConnecteur de gestion des services pourServiceNowetCentre de service Jirapour vous aider à configurer rapidement des intégrations. Cette approche est essentielle pour garantir que les alarmes déclenchées sont reconnues et alignées sur vos flux de travail opérationnels existants qui pourraient déjà être définis dans ces produits.

Vous pouvez également créer plusieurs alarmes pour la même mesure avec des seuils et des périodes d'évaluation différents, ce qui permet d'établir un processus d'escalade. Par exemple, si vous avez unOrderQueueDepthqui suit les commandes des clients, vous pouvez définir un seuil inférieur sur une courte période moyenne d'une minute qui notifie les membres de l'équipe d'application par e-mail ouSlack. Vous pouvez également définir une autre alarme pour la même mesure sur une période plus longue de 15 minutes au même seuil, et ces pages, courriels et avertir l'équipe d'application et le responsable de l'équipe d'application. Enfin, vous pouvez définir une troisième alarme pour un seuil moyen fort sur une période de 30 minutes qui notifie la haute direction et avertit tous les membres de l'équipe précédemment notifiés. La création de plusieurs alarmes vous aide à prendre différentes mesures pour différentes conditions. Vous pouvez commencer par un processus de notification simple, puis l'ajuster et l'améliorer au besoin.

A l'aide de CloudWatch détection d'anomalies pour surveiller et alarmer

Vous pouvez utiliserDétection d'anomalies CloudWatchsi vous n'êtes pas sûr des seuils à appliquer pour une mesure particulière ou si vous souhaitez qu'une alarme ajuste automatiquement les valeurs de seuil en fonction des valeurs historiques observées. CloudWatch la détection des anomalies est particulièrement utile pour les mesures qui peuvent présenter des changements réguliers et prévisibles de l'activité, par exemple, les commandes d'achat quotidiennes pour une livraison le jour même augmentant avant une heure limite. La détection des anomalies permet de régler automatiquement les seuils et de réduire les fausses alarmes. Vous pouvez activer la détection des anomalies pour chaque mesure et statistique, et configurer CloudWatch pour alarmer en fonction des valeurs aberrantes.

Par exemple, vous pouvez activer la détection d'anomalies pour leCPUUtilizationMetric et le paramètreAVGstatistique sur une instance EC2. La détection des anomalies utilise ensuite jusqu'à 14 jours de données historiques pour créer le modèle d'apprentissage automatique (ML). Vous pouvez créer plusieurs alarmes avec différentes bandes de détection d'anomalies pour établir un processus d'escalade d'alarme, similaire à la création de plusieurs alarmes standard avec des seuils différents.

Pour plus d'informations sur cette section, consultezCréation d'une alarme CloudWatch basée sur une détection d'anomaliedans le CloudWatch .

Une alarmante dans plusieurs comptes et régions

Les propriétaires d'applications et de charges de travail doivent créer des alarmes au niveau de l'application pour les charges de travail couvrant plusieurs régions. Nous vous recommandons de créer des alarmes distinctes dans chaque compte et région dans lequel votre charge de travail est déployée. Vous pouvez simplifier et automatiser ce processus à l'aide d'un compte et d'une régionAWS CloudFormation StackSets et des modèles pour déployer des ressources applicatives avec les alarmes requises. TemplateVous pouvez configurer les actions d'alarme pour cibler une rubrique Amazon Simple Notification Service (Amazon SNS) commune, ce qui signifie que la même notification ou action de correction est utilisée quel que soit le compte ou la région.

Dans les environnements multi-comptes et multi-régions, nous vous recommandons de créer des alarmes agrégées pour vos comptes et régions afin de surveiller les problèmes liés aux comptes et aux régions en utilisantAWS CloudFormation StackSets et des mesures agrégées, telles que la moyenneCPUUtilizationsur toutes les instances EC2.

Vous devez également envisager de créer des alarmes standard pour chaque charge de travail configurée pour la norme. CloudWatch métriques et journaux que vous capturez. Par exemple, vous pouvez créer une alarme distincte pour chaque instance EC2 qui surveille la mesure d'utilisation du processeur et avertit une équipe d'opérations centrales lorsque l'utilisation moyenne du processeur est supérieure à 80 % par jour. Vous pouvez également créer une alarme standard qui surveille quotidiennement l'utilisation moyenne du processeur sous 10 %. Ces alarmes aident l'équipe des opérations centrales à travailler avec des propriétaires de charges de travail spécifiques pour modifier la taille des instances EC2 lorsque cela est nécessaire.

Automation de la création d'alarmes avec les balises d'instance EC2

La création d'un ensemble d'alarmes standard pour vos instances EC2 peut prendre du temps, être incohérente et sujette à des erreurs. Vous pouvez accélérer le processus de création d'alarme en utilisant leAlarmes automatiques Amazon Cloudwatchpour créer automatiquement un ensemble standard d'alarmes CloudWatch pour vos instances EC2 et créer des alarmes personnalisées basées sur des balises d'instance EC2. La solution élimine la nécessité de créer manuellement des alarmes standard et peut être utile lors d'une migration à grande échelle d'instances EC2 utilisant des outils tels que CloudEndure. Vous pouvez également déployer cette solution avecAWS CloudFormation StackSets pour prendre en charge plusieurs comptes et régions. Pour de plus amples informations, veuillez consulterUtiliser des balises pour créer et gérer Amazon CloudWatch alarmes pour instances Amazon EC2sur leAWSUn blog.