Erste Schritte mit Incident Detection and Response - AWSBenutzerleitfaden zur Erkennung und Reaktion auf Vorfälle

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit Incident Detection and Response

Workloads und Alarme sind für die Erkennung und Reaktion auf AWS Vorfälle von zentraler Bedeutung. AWS arbeitet eng mit Ihnen zusammen, um spezifische Workloads zu definieren und zu überwachen, die für Ihr Unternehmen von entscheidender Bedeutung sind. AWS hilft Ihnen bei der Einrichtung von Alarmen, die Ihr Team schnell über erhebliche Leistungsprobleme oder Auswirkungen auf Kunden informieren. Richtig konfigurierte Alarme sind für die proaktive Überwachung und schnelle Reaktion auf Vorfälle im Rahmen von Incident Detection and Response unerlässlich.

Workloads

Mithilfe von Incident Detection and Response können Sie bestimmte Workloads für die Überwachung und das Management kritischer AWS Vorfälle auswählen. Ein Workload ist eine Sammlung von Ressourcen und Code, die zusammenarbeiten, um einen geschäftlichen Nutzen zu erzielen. Ein Workload kann aus allen Ressourcen und dem Code bestehen, aus denen Ihr Bankzahlungsportal oder ein Kundenbeziehungsmanagementsystem (CRM) besteht. Sie können einen Workload in einem einzelnen AWS Konto oder in mehreren AWS Konten hosten.

Beispielsweise könnten Sie eine monolithische Anwendung in einem einzigen Konto hosten (z. B. Employee Performance App im folgenden Diagramm). Oder Sie haben eine Anwendung (z. B. Storefront Webapp im Diagramm), die in Microservices aufgeteilt ist, die sich über verschiedene Konten erstrecken. Ein Workload kann Ressourcen, wie z. B. eine Datenbank, mit anderen Anwendungen oder Workloads gemeinsam nutzen, wie im Diagramm dargestellt.

Diagram showing applications and services across multiple accounts with shared databases.

Informationen zu den ersten Schritten mit dem Workload-Onboarding finden Sie unter Workload-Onboarding und Fragebogen zum Workload-Onboarding.

Alarme

Alarme sind ein wichtiger Bestandteil von Incident Detection and Response, da sie Einblick in die Leistung Ihrer Anwendungen und der zugrunde liegenden Infrastruktur bieten. AWS AWS arbeitet mit Ihnen zusammen, um geeignete Metriken und Alarmschwellenwerte zu definieren, die nur ausgelöst werden, wenn es kritische Auswirkungen auf Ihre überwachten Workloads gibt. Ziel ist es, dass Alarme die von Ihnen angegebenen Problemlöser einbeziehen, die dann mit dem Incident-Management-Team zusammenarbeiten können, um Probleme schnell zu beheben. Alarme sollten so konfiguriert werden, dass sie nur dann in den Alarmstatus wechseln, wenn die Leistung oder das Kundenerlebnis erheblich beeinträchtigt sind und sofortige Maßnahmen erforderlich sind. Zu den wichtigsten Arten von Alarmen gehören Alarme, die auf geschäftliche Auswirkungen hinweisen, Amazon CloudWatch Canaries und aggregierte Alarme, die Abhängigkeiten überwachen.

Informationen zu den ersten Schritten mit der Erfassung von Alarmen finden Sie unter Alarmeingang und Fragebogen zur Alarmerfassung.

Anmerkung

Informationen zum Ändern Ihrer Runbooks, Workload-Informationen oder der im Rahmen von Incident Detection and Response überwachten Alarme finden Sie unterAWS. Fragen Sie in Incident Detection and Response nach Änderungen an einem integrierten Workload