Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Reaktionspläne in Incident Manager erstellen und konfigurieren
Mit Reaktionsplänen können Sie planen, wie Sie auf einen Vorfall reagieren, der sich auf Ihre Benutzer auswirkt. Ein Reaktionsplan dient als Vorlage, die Informationen darüber enthält, an wen Sie sich wenden müssen, wie schwer das Ereignis zu erwarten ist, welche automatischen Runbooks initiiert werden müssen und welche Kennzahlen überwacht werden müssen.
Bewährte Methoden
Sie können die Auswirkungen von Vorfällen auf Ihre Teams reduzieren, wenn Sie Vorfälle im Voraus planen. Teams sollten bei der Erstellung eines Reaktionsplans die folgenden bewährten Methoden berücksichtigen.
-
Optimiertes Engagement — Identifizieren Sie das Team, das für einen Vorfall am besten geeignet ist. Wenn Sie mit einer zu großen Verteilerliste oder mit den falschen Teams zusammenarbeiten, können Sie während eines Vorfalls Verwirrung stiften und Reaktionszeit verschwenden.
-
Zuverlässige Eskalation — Für Ihre Engagements im Rahmen eines Reaktionsplans empfehlen wir, einen Einsatzplan anstelle von Kontakten oder Bereitschaftszeiten zu wählen. Der Einsatzplan sollte die einzelnen Ansprechpartner oder Bereitschaftszeitpläne (die mehrere wechselnde Ansprechpartner enthalten) angeben, die bei Vorfällen aktiv werden sollen. Da die in Ihrem Einsatzplan angegebenen Einsatzkräfte manchmal nicht erreichbar sein können, sollten Sie in Ihrem Reaktionsplan Ersatzkräfte einrichten, um diese Szenarien abzudecken. Wenn die primären und sekundären Ansprechpartner nicht verfügbar sind oder andere ungeplante Lücken in der Abdeckung bestehen, benachrichtigt Incident Manager dennoch einen Kontakt über den Vorfall.
-
Runbooks — Verwenden Sie Runbooks, um wiederholbare, verständliche Schritte bereitzustellen, die den Stress reduzieren, dem ein Einsatzkräfte während eines Vorfalls ausgesetzt ist.
-
Zusammenarbeit — Nutzen Sie Chat-Kanäle, um die Kommunikation bei Vorfällen zu optimieren. Chat-Kanäle helfen den Einsatzkräften, über Informationen auf dem Laufenden zu bleiben. Über diese Kanäle können sie auch Informationen mit anderen Respondern teilen.
Erstellung eines Reaktionsplans
Gehen Sie wie folgt vor, um einen Reaktionsplan zu erstellen und die Reaktion auf Vorfälle zu automatisieren.
Um einen Reaktionsplan zu erstellen
-
Öffnen Sie die Incident Manager-Konsole
und wählen Sie im Navigationsbereich Reaktionspläne aus. -
Wählen Sie Reaktionsplan erstellen aus.
-
Geben Sie unter Name einen eindeutigen und identifizierbaren Namen für den Reaktionsplan ein, der im Amazon-Ressourcennamen (ARN) für den Reaktionsplan verwendet werden soll.
-
(Optional) Geben Sie unter Anzeigename einen Namen ein, der für Menschen besser lesbar ist, damit Sie den Reaktionsplan leichter identifizieren können, wenn Sie Incidents erstellen.
-
Fahren Sie fort, indem Sie Standardwerte für Incident-Datensätze angeben.
Standardwerte für Vorfälle angeben
Damit Sie Vorfälle effektiver verwalten können, können Sie Standardwerte angeben. Incident Manager wendet diese Werte auf alle Vorfälle an, die mit einem Reaktionsplan verknüpft sind.
Um Standardwerte für Vorfälle anzugeben
-
Geben Sie unter Titel einen Titel für diesen Vorfall ein, damit Sie ihn auf der Incident Manager-Startseite leichter identifizieren können.
-
Wählen Sie unter Auswirkung eine Auswirkungsstufe aus, um den potenziellen Umfang eines Vorfalls anzugeben, der auf der Grundlage dieses Reaktionsplans ausgelöst wurde, z. B. Kritisch oder Niedrig. Informationen zu den Einstufungen der Auswirkungen in Incident Manager finden Sie unterTriage.
-
(Optional) Geben Sie unter Zusammenfassung eine kurze Zusammenfassung der Art der Vorfälle ein, die anhand dieses Reaktionsplans erstellt wurden.
-
(Optional) Geben Sie für Deduplizierungszeichenfolge eine Deduplizierungszeichenfolge ein. Incident Manager verwendet diese Zeichenfolge, um zu verhindern, dass dieselbe Grundursache mehrere Vorfälle in demselben Konto verursacht.
Eine Deduplizierungszeichenfolge ist ein Begriff oder ein Ausdruck, den das System verwendet, um nach doppelten Vorfällen zu suchen. Wenn Sie eine Deduplizierungszeichenfolge angeben, sucht Incident Manager bei der Erstellung des Vorfalls nach offenen Vorfällen, die dieselbe Zeichenfolge in dem
dedupeString
Feld enthalten. Wenn ein Duplikat erkannt wird, dedupliziert Incident Manager den neueren Vorfall in den vorhandenen Incident.Anmerkung
Standardmäßig dedupliziert Incident Manager automatisch mehrere Vorfälle, die durch denselben CloudWatch Amazon-Alarm oder dasselbe Amazon-Ereignis verursacht wurden. EventBridge Sie müssen keine eigene Deduplizierungszeichenfolge eingeben, um eine Duplizierung für diese Ressourcentypen zu verhindern.
-
(Optional) Fügen Sie unter Incident-Tags Tag-Schlüssel und Werte hinzu, die Sie Incidents zuweisen möchten, die anhand dieses Reaktionsplans erstellt wurden.
Sie müssen über die
TagResource
Berechtigung für die Incident-Datensatzressource verfügen, um Incident-Tags innerhalb des Reaktionsplans festzulegen. -
Geben Sie anschließend einen optionalen Chat-Kanal an, über den die Problemlöser miteinander über Vorfälle kommunizieren können.
(Optional) Geben Sie einen Chat-Kanal zur Reaktion auf Vorfälle an
Wenn Sie einen Chat-Kanal in einen Reaktionsplan aufnehmen, erhalten die Einsatzkräfte über diesen Kanal aktuelle Informationen über den Vorfall. Mithilfe von Chat-Befehlen können sie direkt vom Chat-Kanal aus mit dem Vorfall interagieren.
Mithilfe von AWS Chatbot können Sie einen Kanal erstellen für Slack, für Microsoft Teams, oder für Amazon Chime zur Verwendung in Ihren Reaktionsplänen. Informationen zum Erstellen eines Chat-Kanals in AWS Chatbot finden Sie im AWS Chatbot Administratorhandbuch.
Wichtig
Der Incident Manager muss berechtigt sein, Beiträge im Amazon Simple Notification Service (AmazonSNS) -Thema eines Chat-Kanals zu veröffentlichen. Wenn Sie nicht berechtigt sind, dieses SNS Thema zu veröffentlichen, können Sie es nicht zum Reaktionsplan hinzufügen. Incident Manager veröffentlicht eine Testbenachrichtigung zu dem SNS Thema, um die Berechtigungen zu überprüfen.
Weitere Informationen zu Chat-Kanälen finden Sie unterChat-Kanäle für Einsatzkräfte in Incident Manager erstellen und integrieren.
So geben Sie einen Chat-Kanal zur Reaktion auf Vorfälle an
-
Wählen Sie unter Chat-Kanal einen AWS Chatbot Chat-Kanal aus, über den die Einsatzkräfte während eines Vorfalls kommunizieren können.
Tipp
Um einen neuen Chat-Kanal zu erstellen AWS Chatbot, wählen Sie Neuen Chatbot-Client konfigurieren.
-
Wählen Sie für SNSChat-Kanal-Themen zusätzliche SNS Themen aus, zu denen Sie während des Vorfalls etwas veröffentlichen möchten. Wenn mehrere SNS Themen hinzugefügt werden, AWS-Regionen erhöht sich die Redundanz für den Fall, dass eine Region zum Zeitpunkt des Vorfalls nicht verfügbar ist.
-
Fahren Sie fort, indem Sie die Ansprechpartner, Bereitschaftszeiten und Eskalationspläne auswählen, die während eines Vorfalls hinzugezogen werden sollen.
(Optional) Wählen Sie die Ressourcen aus, die für die Reaktion auf Vorfälle zuständig sind
Es ist wichtig, die am besten geeigneten Ansprechpartner zu finden, wenn ein Vorfall eintritt. Als bewährte Methode empfehlen wir, dass Sie wie folgt vorgehen:
-
Fügen Sie Kontakte und Bereitschaftszeiten als Eskalationskanäle in einem Eskalationsplan hinzu.
-
Wählen Sie einen Eskalationsplan als Engagement in einem Reaktionsplan.
Weitere Informationen zu Kontakten und Eskalationsplänen finden Sie unter Kontakte im Incident Manager erstellen und konfigurieren und. Erstellung eines Eskalationsplans für die Einbindung von Einsatzkräften in Incident Manager
Um Ressourcen für die Reaktion auf Vorfälle auszuwählen
-
Wählen Sie für Engagements eine beliebige Anzahl von Eskalationsplänen, Bereitschaftszeiten und individuellen Kontakten aus.
-
Fahren Sie fort, indem Sie optional ein Runbook angeben, das im Rahmen Ihrer Schadensbegrenzung ausgeführt werden soll.
(Optional) Geben Sie ein Runbook zur Minderung von Vorfällen an
Sie können Runbooks von AWS Systems Manager Automation, einer Funktion von, verwenden AWS Systems Manager, um allgemeine Anwendungs- und Infrastrukturaufgaben in Ihrer Umgebung zu automatisieren. AWS Cloud
Jedes Runbook definiert einen Runbook-Workflow. Ein Runbook-Workflow umfasst die Aktionen, die Systems Manager auf Ihren verwalteten Knoten oder anderen AWS Ressourcentypen ausführt. In Incident Manager steuert ein Runbook die Reaktion auf Vorfälle und deren Behebung.
Weitere Informationen zur Verwendung von Runbooks in Reaktionsplänen finden Sie unter. Integration von Systems Manager Automation-Runbooks in Incident Manager zur Behebung von Vorfällen
So geben Sie ein Runbook zur Minderung von Vorfällen an:
-
Führen Sie für Runbook einen der folgenden Schritte aus:
-
Wählen Sie Runbook aus Vorlage klonen, um eine Kopie des standardmäßigen Incident Manager-Runbooks zu erstellen. Geben Sie unter Runbook-Name einen aussagekräftigen Namen für das neue Runbook ein.
-
Wählen Sie Existierendes Runbook auswählen aus. Wählen Sie den Besitzer, das Runbook und die Version aus, die Sie verwenden möchten.
Tipp
Um ein Runbook von Grund auf neu zu erstellen, wählen Sie „Neues Runbook konfigurieren“.
Weitere Informationen zum Erstellen eines Runbooks finden Sie unter Integration von Systems Manager Automation-Runbooks in Incident Manager zur Behebung von Vorfällen.
-
-
Geben Sie im Bereich Parameter alle angeforderten Parameter für das von Ihnen ausgewählte Runbook ein.
Die verfügbaren Parameter sind die vom Runbook angegebenen. Ein Runbook benötigt möglicherweise andere Parameter als ein anderes. Einige Parameter sind möglicherweise erforderlich und andere optional.
In vielen Fällen können Sie einen statischen Wert für einen Parameter manuell eingeben, z. B. eine Liste von EC2 Amazon-InstancesIDs. Sie können Incident Manager auch die Parameterwerte bereitstellen lassen, die durch einen Incident dynamisch generiert wurden.
-
(Optional) Geben Sie für die Rolle AWS Identity and Access Management (IAM) an AutomationAssumeRole, die verwendet werden soll. Diese Rolle muss über die erforderlichen Berechtigungen verfügen, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.
Anmerkung
Wenn nichts angegeben
AssumeRole
ist, versucht Incident Manager, die Runbook-Dienstrolle zu verwenden, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.Wählen Sie eine der folgenden Optionen aus:
-
ARNWert eingeben — Geben Sie den Amazon-Ressourcennamen (ARN) eines AssumeRole manuell im Format ein
arn:aws:iam::
. Beispiel,account-id
:role/assume-role-name
arn:aws:iam::123456789012:role/MyAssumeRole
. -
Bestehende Servicerolle verwenden — Wählen Sie eine Rolle mit den erforderlichen Berechtigungen aus einer Liste vorhandener Rollen in Ihrem Konto aus.
-
Neue Servicerolle erstellen — Wählen Sie aus den AWS verwalteten Richtlinien, die Sie Ihrer hinzufügen möchten AssumeRole. Nachdem Sie diese Option ausgewählt haben, wählen Sie für AWS verwaltete Richtlinien eine oder mehrere Richtlinien aus der Liste aus.
Sie können den vorgeschlagenen Standardnamen für die neue Rolle akzeptieren oder einen Namen Ihrer Wahl eingeben.
Anmerkung
Diese neue Runbook-Dienstrolle ist dem spezifischen Runbook zugeordnet, das Sie ausgewählt haben. Sie kann nicht mit verschiedenen Runbooks verwendet werden. Das liegt daran, dass der Ressourcenbereich der Richtlinie keine anderen Runbooks unterstützt.
-
-
Geben Sie für die Runbook-Dienstrolle die Rolle an, die IAM verwendet werden soll, um die Berechtigungen bereitzustellen, die für den Zugriff auf das Runbook selbst und den Start des Workflows erforderlich sind.
Die Rolle muss mindestens die
ssm:StartAutomationExecution
Aktion für Ihr spezielles Runbook zulassen. Damit das Runbook kontenübergreifend funktioniert, muss die Rolle auch diests:AssumeRole
Aktion für die Rolle zulassen, die Sie in derAWS-SystemsManager-AutomationExecutionRole
Rolle erstellt haben. Verwaltung von Vorfällen über Regionen hinweg AWS-Konten im Incident ManagerWählen Sie eine der folgenden Optionen aus:
-
Neue Servicerolle erstellen — Incident Manager erstellt für Sie eine Runbook-Servicerolle, die die zum Starten des Runbook-Workflows erforderlichen Mindestberechtigungen umfasst.
Als Rollenname können Sie den vorgeschlagenen Standardnamen akzeptieren oder einen Namen Ihrer Wahl eingeben. Wir empfehlen, den vorgeschlagenen Namen zu verwenden oder den Namen des Runbooks im Namen beizubehalten. Das liegt daran, dass das neue Runbook mit dem von Ihnen ausgewählten Runbook verknüpft AssumeRole ist und möglicherweise nicht die für andere Runbooks erforderlichen Berechtigungen enthält.
-
Vorhandene Servicerolle verwenden — Eine IAM Rolle, die Sie oder Incident Manager zuvor erstellt haben, gewährt die erforderlichen Berechtigungen.
Wählen Sie unter Rollenname den Namen der vorhandenen Rolle aus, die Sie verwenden möchten.
-
-
Erweitern Sie Zusätzliche Optionen und wählen Sie eine der folgenden Optionen aus, um anzugeben AWS-Konto , wo der Runbook-Workflow ausgeführt werden soll.
-
Konto des Eigentümers des Reaktionsplans — Startet den Runbook-Workflow in dem AWS-Konto , der ihn erstellt hat.
-
Betroffenes Konto — Startet den Runbook-Workflow in dem Konto, das den Vorfall ausgelöst oder gemeldet hat.
Wählen Sie Betroffenes Konto, wenn Sie Incident Manager für kontenübergreifende Szenarien verwenden und das Runbook auf Ressourcen im betroffenen Konto zugreifen muss, um diese zu beheben.
-
-
Fahren Sie fort, indem Sie optional einen PagerDuty Service in den Reaktionsplan integrieren.
(Optional) Integrieren eines PagerDuty Dienstes in den Reaktionsplan
Um einen PagerDuty Service in den Reaktionsplan zu integrieren
Wenn Sie Incident Manager mit integrieren PagerDuty, PagerDuty erstellt jedes Mal, wenn Incident Manager einen Incident erstellt, einen entsprechenden Incident. Der Incident PagerDuty verwendet den Paging-Workflow und die Eskalationsrichtlinien, die Sie dort zusätzlich zu denen in Incident Manager definiert haben. PagerDuty fügt Timeline-Ereignisse aus Incident Manager als Notizen zu Ihrem Vorfall hinzu.
-
Erweitern Sie Integrationen von Drittanbietern und aktivieren Sie dann das Kontrollkästchen PagerDuty Integration aktivieren.
-
Wählen Sie unter Geheim auswählen das Geheimnis aus, in AWS Secrets Manager dem Sie die Anmeldeinformationen für den Zugriff auf Ihr PagerDuty Konto speichern.
Hinweise zum Speichern Ihrer PagerDuty Anmeldeinformationen in einem Secrets Manager Secret finden Sie unterSpeichern von PagerDuty Zugangsdaten in einem AWS Secrets Manager geheimen Ordner.
-
Wählen Sie unter PagerDuty Service den Service aus Ihrem PagerDuty Konto aus, für den Sie den PagerDuty Incident erstellen möchten.
-
Fahren Sie fort, indem Sie optionale Tags hinzufügen und den Reaktionsplan erstellen.
Hinzufügen von Tags und Erstellen des Reaktionsplans
Um Tags hinzuzufügen und den Reaktionsplan zu erstellen
-
(Optional) Wenden Sie im Bereich „Tags“ ein oder mehrere Tag-Schlüsselname/Wert-Paare auf den Reaktionsplan an.
Tags sind optionale Metadaten, die Sie einer Ressource zuweisen. Mithilfe von Stichwörtern können Sie eine Ressource auf unterschiedliche Weise kategorisieren, z. B. nach Zweck, Eigentümer oder Umgebung. Möglicherweise möchten Sie einen Reaktionsplan taggen, um die Art des Vorfalls, den er eindämmen soll, die Arten von Eskalationskanälen, die er enthält, oder den Eskalationsplan, der damit verknüpft wird, zu identifizieren. Weitere Informationen zur Kennzeichnung von Incident Manager-Ressourcen finden Sie unter. Ressourcen im Incident Manager taggen
-
Wählen Sie Reaktionsplan erstellen aus.