Alarmierende Optionen mit CloudWatch - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Alarmierende Optionen mit CloudWatch

Durch die einmalige und automatisierte Analyse wichtiger Metriken können Sie Probleme erkennen und lösen, bevor sie sich auf Ihre Workloads auswirken. CloudWatch macht es einfach, mehrere Metriken zu grafieren und zu vergleichen, indem mehrere Statistiken über einen bestimmten Zeitraum verwendet werden. Sie können es verwenden CloudWatch um alle Metriken mit den erforderlichen Dimensionswerten zu durchsuchen, um die Metriken zu finden, die Sie für Ihre Analyse benötigen.

Wir empfehlen Ihnen, Ihren Ansatz zur Metrikenerfassung zu beginnen, indem Sie einen ersten Satz von Metriken und Dimensionen einbeziehen, die als Baseline für die Überwachung einer Workload verwendet werden sollen. Im Laufe der Zeit reift die Arbeitslast und Sie können zusätzliche Metriken und Dimensionen hinzufügen, um sie weiter zu analysieren und zu unterstützen. Ihre Anwendungen oder Workloads verwenden möglicherweise mehrereAWSRessourcen und über eigene benutzerdefinierte Metriken sollten Sie diese Ressourcen unter einem Namespace gruppieren, um sie leichter zu identifizieren.

Sie sollten auch überlegen, wie Protokollierungs- und Überwachungsdaten korreliert sind, damit Sie schnell die relevanten Protokollierungs- und Überwachungsdaten identifizieren können, um bestimmte Probleme zu diagnostizieren. Sie können es verwendenCloudWatch-ServiceLensum Traces, Metriken, Protokolle und Alarme für die Diagnose von Problemen zu korrelieren. Sie sollten auch erwägen, zusätzliche Dimensionen in Metriken und Kennungen in Protokolle für Ihre Workloads einzubeziehen, damit Sie schnell nach Problemen zwischen Systemen und Diensten suchen und identifizieren können.

benutzen CloudWatch Alarmen zur Überwachung und Alarmen

Sie können es verwendenCloudWatch-Alarmeum die manuelle Überwachung in Ihren Workloads oder Anwendungen zu reduzieren. Sie sollten zunächst die Metriken überprüfen, die Sie für jede Workload-Komponente erfassen, und die entsprechenden Schwellenwerte für jede Metrik ermitteln. Stellen Sie sicher, dass Sie angeben, welche Teammitglieder benachrichtigt werden müssen, wenn ein Schwellenwert überschritten wird. Sie sollten Verteilergruppen einrichten und ansprechen, anstatt einzelne Teammitglieder.

CloudWatch-Alarme können in Ihre Service-Management-Lösung integriert werden, um automatisch neue Tickets zu erstellen und betriebliche Workflows auszuführen. Beispiel,AWSstellt dasAWSService Management Connector fürServiceNowundJira-Service-Deskum Sie dabei zu unterstützen, Integrationen schnell einzurichten. Dieser Ansatz ist entscheidend, um sicherzustellen, dass erhöhte Alarme anerkannt und auf Ihre bestehenden Arbeitsabläufe abgestimmt werden, die möglicherweise bereits in diesen Produkten definiert sind.

Sie können auch mehrere Alarme für dieselbe Metrik erstellen, die unterschiedliche Schwellenwerte und Auswertungszeiträume aufweisen, was zur Einrichtung eines Eskalationsprozesses beiträgt. Zum Beispiel, Sie haben einOrderQueueDepthMetrik, die Kundenbestellungen verfolgt, können Sie einen niedrigeren Schwellenwert über einen kurzen durchschnittlichen Zeitraum von einer Minute definieren, der die Mitglieder des Anwendungsteams per E-Mail oder benachrichtigtSlackaus. Sie können auch einen weiteren Alarm für dieselbe Metrik über einen längeren Zeitraum von 15 Minuten mit demselben Schwellenwert definieren und diese Seiten, E-Mails und benachrichtigt den Leiter des Anwendungsteams und des Anwendungsteams. Schließlich können Sie einen dritten Alarm für einen harten durchschnittlichen Schwellenwert über einen Zeitraum von 30 Minuten definieren, der das Obermanagement benachrichtigt und alle zuvor benachrichtigten Teammitglieder benachrichtigt. Durch das Erstellen mehrerer Alarme können Sie verschiedene Maßnahmen für verschiedene Bedingungen ergreifen. Sie können mit einem einfachen Benachrichtigungsprozess beginnen und ihn dann nach Bedarf anpassen und verbessern.

benutzen CloudWatch Anomalieerkennung zu überwachen und zu alarmieren

Sie können es verwendenCloudWatch-Anomalieerkennungwenn Sie sich nicht sicher sind, welche Schwellenwerte für eine bestimmte Metrik angewendet werden sollen, oder wenn Sie möchten, dass ein Alarm die Schwellenwerte basierend auf beobachteten historischen Werten automatisch anpasst. CloudWatch Die Anomalieerkennung ist besonders nützlich für Metriken, die regelmäßige, vorhersehbare Änderungen der Aktivität aufweisen können, z. B. tägliche Bestellungen für die Lieferung am selben Tag, die vor einer Stichzeit zunehmen. Die Anomalieerkennung ermöglicht Schwellenwerte, die sich automatisch anpassen und Fehlalarme reduzieren können. Sie können die Anomalieerkennung für jede Metrik und Statistik aktivieren und konfigurieren CloudWatch zu alarmieren basierend auf Ausreißer.

Zum Beispiel können Sie die Anomalieerkennung für denCPUUtilization-Metrik und dasAVG-Statistik einer EC2-Instance. Die Anomalieerkennung verwendet dann bis zu 14 Tage historische Daten, um das Modell des maschinellen Lernens (ML) zu erstellen. Sie können mehrere Alarme mit verschiedenen Anomalieerkennungsbändern erstellen, um einen Alarmeskalationsprozess einzurichten, ähnlich wie beim Erstellen mehrerer Standardalarme mit unterschiedlichen Schwellenwerten.

Weitere Informationen zu diesem Abschnitt finden Sie unterErstellen eines CloudWatch-Alarms basierend auf Anomalieerkennungim CloudWatch -Dokumentation.

Alarmierend in mehreren Regionen und Konten

Anwendungs- und Workload-Besitzer sollten Alarme auf Anwendungsebene für Workloads erstellen, die sich über mehrere Regionen erstrecken. Wir empfehlen, separate Alarme in jedem Konto und jeder Region zu erstellen, in der Ihre Workload bereitgestellt wird. Sie können diesen Prozess vereinfachen und automatisieren, indem Sie Konto- und Regionsunabhängig verwendenAWS CloudFormation StackSets und Vorlagen zum Bereitstellen von Anwendungsressourcen mit den erforderlichen Alarmen. TemplateSie können die Alarmaktionen so konfigurieren, dass sie auf ein allgemeines Amazon Simple Notification Service (Amazon SNS) Thema abzielen, was bedeutet, dass unabhängig vom Konto oder der Region dieselbe Benachrichtigungs- oder Behebungsaktion verwendet wird.

In Umgebungen mit mehreren Konten und mehreren Regionen empfehlen wir Ihnen, aggregierte Alarme für Ihre Konten und Regionen zu erstellen, um Konto- und Regionalprobleme mithilfe derAWS CloudFormation StackSets und aggregierte Metriken wie DurchschnittCPUUtilizationIn allen EC2-Instances.

Sie sollten auch erwägen, Standardalarme für jede Arbeitslast zu erstellen, die für den Standard konfiguriert ist CloudWatch Metriken und Protokolle, die Sie erfassen. Beispielsweise können Sie für jede EC2-Instanz einen separaten Alarm erstellen, der die CPU-Auslastungsmetrik überwacht und ein zentrales Betriebsteam benachrichtigt, wenn die durchschnittliche CPU-Auslastung täglich über 80% beträgt. Sie können auch einen Standardalarm erstellen, der die durchschnittliche CPU-Auslastung unter 10% täglich überwacht. Diese Alarme helfen dem zentralen Betriebsteam, mit bestimmten Workload-Besitzern zusammenzuarbeiten, um die Größe der EC2-Instanzen bei Bedarf zu ändern.

Automatisieren der Alarmerstellung mit EC2-Instance-Tags

Das Erstellen eines Standardsatzes von Alarmen für Ihre EC2-Instanzen kann zeitaufwändig, inkonsistent und fehleranfällig sein. Sie können den Alarmerstellungsprozess beschleunigen, indem Sie dieAmazon-Cloudwatch-Auto-AlarmeLösung, um automatisch einen Standardsatz von CloudWatch-Alarmen für Ihre EC2-Instanzen zu erstellen und benutzerdefinierte Alarme basierend auf EC2-Instance-Tags zu erstellen. Die Lösung macht die Notwendigkeit überflüssig, Standardalarme manuell zu erstellen, und kann bei einer groß angelegten Migration von EC2-Instanzen nützlich sein, die Tools wie CloudEndure verwendet. Sie können diese Lösung auch mitAWS CloudFormation StackSets um mehrere Regionen und Konten zu unterstützen. Weitere Informationen finden Sie unterVerwenden Sie Tags, um Amazon zu erstellen und zu pflegen CloudWatch -Alarmen für Amazon EC2 EC2-Instancesauf derAWSBlog-