Reaktionspläne in Incident Manager erstellen und konfigurieren - Incident Manager

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Reaktionspläne in Incident Manager erstellen und konfigurieren

Mit Reaktionsplänen können Sie planen, wie Sie auf einen Vorfall reagieren, der sich auf Ihre Benutzer auswirkt. Ein Reaktionsplan dient als Vorlage, die Informationen darüber enthält, an wen Sie sich wenden müssen, wie schwer das Ereignis zu erwarten ist, welche automatischen Runbooks initiiert werden müssen und welche Kennzahlen überwacht werden müssen.

Bewährte Methoden

Sie können die Auswirkungen von Vorfällen auf Ihre Teams reduzieren, wenn Sie Vorfälle im Voraus planen. Teams sollten bei der Erstellung eines Reaktionsplans die folgenden bewährten Methoden berücksichtigen.

Optimiertes Engagement — Identifizieren Sie das Team, das für einen Vorfall am besten geeignet ist. Wenn Sie mit einer zu großen Verteilerliste oder mit den falschen Teams zusammenarbeiten, können Sie während eines Vorfalls Verwirrung stiften und Reaktionszeit verschwenden.
Zuverlässige Eskalation — Für Ihre Engagements im Rahmen eines Reaktionsplans empfehlen wir, einen Einsatzplan anstelle von Kontakten oder Bereitschaftszeiten zu wählen. Der Einsatzplan sollte die einzelnen Ansprechpartner oder Bereitschaftszeitpläne (die mehrere wechselnde Ansprechpartner enthalten) angeben, die bei Vorfällen aktiv werden sollen. Da die in Ihrem Einsatzplan angegebenen Einsatzkräfte manchmal nicht erreichbar sein können, sollten Sie in Ihrem Reaktionsplan Ersatzkräfte einrichten, um diese Szenarien abzudecken. Wenn die primären und sekundären Ansprechpartner nicht verfügbar sind oder andere ungeplante Lücken in der Abdeckung bestehen, benachrichtigt Incident Manager dennoch einen Kontakt über den Vorfall.
Runbooks — Verwenden Sie Runbooks, um wiederholbare, verständliche Schritte bereitzustellen, die den Stress reduzieren, dem ein Einsatzkräfte während eines Vorfalls ausgesetzt ist.
Zusammenarbeit — Nutzen Sie Chat-Kanäle, um die Kommunikation bei Vorfällen zu optimieren. Chat-Kanäle helfen den Einsatzkräften, über Informationen auf dem Laufenden zu bleiben. Über diese Kanäle können sie auch Informationen mit anderen Respondern teilen.

Erstellung eines Reaktionsplans

Gehen Sie wie folgt vor, um einen Reaktionsplan zu erstellen und die Reaktion auf Vorfälle zu automatisieren.

Um einen Reaktionsplan zu erstellen

Öffnen Sie die Incident Manager-Konsole und wählen Sie im Navigationsbereich Reaktionspläne aus.
Wählen Sie Reaktionsplan erstellen aus.
Geben Sie unter Name einen eindeutigen und identifizierbaren Namen für den Reaktionsplan ein, der im Amazon-Ressourcennamen (ARN) für den Reaktionsplan verwendet werden soll.
(Optional) Geben Sie unter Displayname einen besser lesbaren Namen ein, um den Reaktionsplan leichter identifizieren zu können, wenn Sie Incidents erstellen.
Fahren Sie fort, indem Sie Standardwerte für Incident-Datensätze angeben.

Standardwerte für Vorfälle angeben

Damit Sie Vorfälle effektiver verwalten können, können Sie Standardwerte angeben. Incident Manager wendet diese Werte auf alle Vorfälle an, die mit einem Reaktionsplan verknüpft sind.

Um Standardwerte für Vorfälle anzugeben

Geben Sie unter Titel einen Titel für diesen Vorfall ein, damit Sie ihn auf der Incident Manager-Startseite leichter identifizieren können.
Wählen Sie unter Auswirkung eine Auswirkungsstufe aus, um den potenziellen Umfang eines Vorfalls anzugeben, der auf der Grundlage dieses Reaktionsplans ausgelöst wurde, z. B. Kritisch oder Niedrig. Informationen zu den Einstufungen der Auswirkungen in Incident Manager finden Sie unterTriage.
(Optional) Geben Sie unter Zusammenfassung eine kurze Zusammenfassung der Art der Vorfälle ein, die anhand dieses Reaktionsplans erstellt wurden.
(Optional) Geben Sie für Deduplizierungszeichenfolge eine Deduplizierungszeichenfolge ein. Incident Manager verwendet diese Zeichenfolge, um zu verhindern, dass dieselbe Grundursache mehrere Vorfälle in demselben Konto verursacht.

Eine Deduplizierungszeichenfolge ist ein Begriff oder ein Ausdruck, den das System verwendet, um nach doppelten Vorfällen zu suchen. Wenn Sie eine Deduplizierungszeichenfolge angeben, sucht Incident Manager bei der Erstellung des Vorfalls nach offenen Vorfällen, die dieselbe Zeichenfolge in dem dedupeString Feld enthalten. Wenn ein Duplikat erkannt wird, dedupliziert Incident Manager den neueren Vorfall in den vorhandenen Incident.

Anmerkung
Standardmäßig dedupliziert Incident Manager automatisch mehrere Vorfälle, die durch denselben CloudWatch Amazon-Alarm oder dasselbe Amazon-Ereignis verursacht wurden. EventBridge Sie müssen keine eigene Deduplizierungszeichenfolge eingeben, um eine Duplizierung für diese Ressourcentypen zu verhindern.
(Optional) Fügen Sie unter Incident-Tags Tag-Schlüssel und Werte hinzu, die Sie Incidents zuweisen möchten, die anhand dieses Reaktionsplans erstellt wurden.

Sie müssen über die TagResource Berechtigung für die Incident-Datensatzressource verfügen, um Incident-Tags innerhalb des Reaktionsplans festzulegen.
Geben Sie anschließend einen optionalen Chat-Kanal an, über den die Problemlöser miteinander über Vorfälle kommunizieren können.

(Optional) Angabe eines Chat-Kanals zur Reaktion auf Vorfälle

Wenn Sie einen Chat-Kanal in einen Reaktionsplan aufnehmen, erhalten die Einsatzkräfte über diesen Kanal aktuelle Informationen zum Vorfall. Mithilfe von Chat-Befehlen können sie direkt vom Chat-Kanal aus mit dem Vorfall interagieren.

Mit Amazon Q Developer in Chat-Anwendungen können Sie einen Kanal für erstellen Slack, für Microsoft Teams, oder für Amazon Chime zur Verwendung in Ihren Reaktionsplänen. Informationen zum Erstellen eines Chat-Kanals in Amazon Q Developer in Chat-Anwendungen finden Sie im Administratorhandbuch für Amazon Q Developer in Chat-Anwendungen.

Wichtig

Der Incident Manager muss berechtigt sein, Beiträge im Amazon Simple Notification Service (Amazon SNS) -Thema eines Chat-Kanals zu veröffentlichen. Wenn Sie nicht berechtigt sind, dieses SNS-Thema zu veröffentlichen, können Sie es nicht zum Reaktionsplan hinzufügen. Incident Manager veröffentlicht eine Testbenachrichtigung zum SNS-Thema, um die Berechtigungen zu überprüfen.

Weitere Informationen zu Chat-Kanälen finden Sie unterChat-Kanäle für Einsatzkräfte in Incident Manager erstellen und integrieren.

So geben Sie einen Chat-Kanal zur Reaktion auf Vorfälle an

Wählen Sie unter Chat-Kanal einen Chat-Kanal von Amazon Q Developer in Chat-Anwendungen aus, über den die Mitarbeiter während eines Vorfalls kommunizieren können.

Tipp
Um einen neuen Chat-Kanal in Amazon Q Developer in Chat-Anwendungen zu erstellen, wählen Sie Neuen Chatbot-Client konfigurieren.
Wählen Sie für SNS-Themen für Chat-Kanäle zusätzliche SNS-Themen aus, zu denen Sie während des Vorfalls etwas veröffentlichen möchten. Wenn mehrere SNS-Themen hinzugefügt werden, AWS-Regionen erhöht sich die Redundanz für den Fall, dass eine Region zum Zeitpunkt des Vorfalls nicht verfügbar ist.
Wählen Sie anschließend die Ansprechpartner, Bereitschaftszeiten und Eskalationspläne aus, die während eines Vorfalls hinzugezogen werden sollen.

(Optional) Wählen Sie die Ressourcen aus, die für die Reaktion auf Vorfälle zuständig sind

Es ist wichtig, die am besten geeigneten Ansprechpartner zu finden, wenn ein Vorfall eintritt. Als bewährte Methode empfehlen wir, dass Sie wie folgt vorgehen:

Fügen Sie Kontakte und Bereitschaftszeiten als Eskalationskanäle in einem Eskalationsplan hinzu.
Wählen Sie einen Eskalationsplan als Engagement in einem Reaktionsplan.

Weitere Informationen zu Kontakten und Eskalationsplänen finden Sie unter Kontakte im Incident Manager erstellen und konfigurieren und. Erstellung eines Eskalationsplans für die Einbindung von Einsatzkräften in Incident Manager

Um Ressourcen für die Reaktion auf Vorfälle auszuwählen

Wählen Sie für Engagements eine beliebige Anzahl von Eskalationsplänen, Bereitschaftszeiten und individuellen Kontakten aus.
Fahren Sie fort, indem Sie optional ein Runbook angeben, das im Rahmen Ihrer Schadensbegrenzung ausgeführt werden soll.

(Optional) Geben Sie ein Runbook zur Minderung von Vorfällen an

Sie können Runbooks von AWS Systems Manager Automation, einem Tool in, verwenden AWS Systems Manager, um allgemeine Anwendungs- und Infrastrukturaufgaben in Ihrer Umgebung zu automatisieren. AWS Cloud

Jedes Runbook definiert einen Runbook-Workflow. Ein Runbook-Workflow umfasst die Aktionen, die Systems Manager auf Ihren verwalteten Knoten oder anderen AWS Ressourcentypen ausführt. In Incident Manager steuert ein Runbook die Reaktion auf Vorfälle und deren Behebung.

Weitere Informationen zur Verwendung von Runbooks in Reaktionsplänen finden Sie unter. Integration von Systems Manager Automation-Runbooks in Incident Manager zur Behebung von Vorfällen

So geben Sie ein Runbook zur Minderung von Vorfällen an:

Führen Sie für Runbook einen der folgenden Schritte aus:
- Wählen Sie Runbook aus Vorlage klonen, um eine Kopie des standardmäßigen Incident Manager-Runbooks zu erstellen. Geben Sie unter Runbook-Name einen aussagekräftigen Namen für das neue Runbook ein.
- Wählen Sie Existierendes Runbook auswählen aus. Wählen Sie den Besitzer, das Runbook und die Version aus, die Sie verwenden möchten.
  
  Tipp
  Um ein Runbook von Grund auf neu zu erstellen, wählen Sie „Neues Runbook konfigurieren“.
  Weitere Informationen zum Erstellen eines Runbooks finden Sie unter Integration von Systems Manager Automation-Runbooks in Incident Manager zur Behebung von Vorfällen.
Geben Sie im Bereich Parameter alle angeforderten Parameter für das von Ihnen ausgewählte Runbook ein.

Die verfügbaren Parameter sind die vom Runbook angegebenen. Ein Runbook benötigt möglicherweise andere Parameter als ein anderes. Einige Parameter sind möglicherweise erforderlich und andere optional.

In vielen Fällen können Sie einen statischen Wert für einen Parameter manuell eingeben, z. B. eine Liste von EC2 Amazon-Instances IDs. Sie können Incident Manager auch die Parameterwerte bereitstellen lassen, die durch einen Incident dynamisch generiert wurden.
(Optional) Geben Sie für AutomationAssumeRoledie zu AWS Identity and Access Management verwendende (IAM-) Rolle an. Diese Rolle muss über die erforderlichen Berechtigungen verfügen, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.

Anmerkung
Wenn nichts angegeben AssumeRole ist, versucht Incident Manager, die Runbook-Dienstrolle zu verwenden, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.

Wählen Sie eine der folgenden Optionen aus:
- ARN-Wert eingeben — Geben Sie den Amazon-Ressourcennamen (ARN) eines AssumeRole manuell im Format einarn:aws:iam::account-id:role/assume-role-name. Beispiel, arn:aws:iam::123456789012:role/MyAssumeRole.
- Bestehende Servicerolle verwenden — Wählen Sie eine Rolle mit den erforderlichen Berechtigungen aus einer Liste vorhandener Rollen in Ihrem Konto aus.
- Neue Servicerolle erstellen — Wählen Sie aus den AWS verwalteten Richtlinien, die Sie Ihrer hinzufügen möchten AssumeRole. Nachdem Sie diese Option ausgewählt haben, wählen Sie für AWS verwaltete Richtlinien eine oder mehrere Richtlinien aus der Liste aus.
  
  Sie können den vorgeschlagenen Standardnamen für die neue Rolle akzeptieren oder einen Namen Ihrer Wahl eingeben.
  
  Anmerkung
  Diese neue Runbook-Dienstrolle ist dem spezifischen Runbook zugeordnet, das Sie ausgewählt haben. Sie kann nicht mit verschiedenen Runbooks verwendet werden. Das liegt daran, dass der Ressourcenbereich der Richtlinie keine anderen Runbooks unterstützt.
Geben Sie für die Runbook-Servicerolle die IAM-Rolle an, die verwendet werden soll, um die Berechtigungen bereitzustellen, die für den Zugriff auf das Runbook selbst und den Start des Workflows erforderlich sind.

Die Rolle muss mindestens die ssm:StartAutomationExecution Aktion für Ihr spezielles Runbook zulassen. Damit das Runbook kontenübergreifend funktioniert, muss die Rolle auch die sts:AssumeRole Aktion für die Rolle zulassen, die Sie in der AWS-SystemsManager-AutomationExecutionRole Rolle erstellt haben. Verwaltung von Vorfällen über Regionen hinweg AWS-Konten im Incident Manager

Wählen Sie eine der folgenden Optionen aus:
- Neue Servicerolle erstellen — Incident Manager erstellt für Sie eine Runbook-Servicerolle, die die zum Starten des Runbook-Workflows erforderlichen Mindestberechtigungen umfasst.
  
  Als Rollenname können Sie den vorgeschlagenen Standardnamen akzeptieren oder einen Namen Ihrer Wahl eingeben. Wir empfehlen, den vorgeschlagenen Namen zu verwenden oder den Namen des Runbooks im Namen beizubehalten. Das liegt daran, dass das neue Runbook mit dem von Ihnen ausgewählten Runbook verknüpft AssumeRole ist und möglicherweise nicht die für andere Runbooks erforderlichen Berechtigungen enthält.
- Vorhandene Servicerolle verwenden — Eine IAM-Rolle, die Sie oder Incident Manager zuvor erstellt haben, gewährt die erforderlichen Berechtigungen.
  
  Wählen Sie unter Rollenname den Namen der vorhandenen Rolle aus, die Sie verwenden möchten.
Erweitern Sie Zusätzliche Optionen und wählen Sie eine der folgenden Optionen aus, um anzugeben AWS-Konto , wo der Runbook-Workflow ausgeführt werden soll.
- Konto des Eigentümers des Reaktionsplans — Startet den Runbook-Workflow in dem AWS-Konto , der ihn erstellt hat.
- Betroffenes Konto — Startet den Runbook-Workflow in dem Konto, das den Vorfall ausgelöst oder gemeldet hat.
  
  Wählen Sie Betroffenes Konto, wenn Sie Incident Manager für kontenübergreifende Szenarien verwenden und das Runbook auf Ressourcen im betroffenen Konto zugreifen muss, um diese zu beheben.
Fahren Sie fort, indem Sie optional einen PagerDuty Service in den Reaktionsplan integrieren.

(Optional) Integrieren eines PagerDuty Dienstes in den Reaktionsplan

Um einen PagerDuty Service in den Reaktionsplan zu integrieren

Wenn Sie Incident Manager mit integrieren PagerDuty, PagerDuty erstellt jedes Mal, wenn Incident Manager einen Incident erstellt, einen entsprechenden Incident. Der Incident PagerDuty verwendet den Paging-Workflow und die Eskalationsrichtlinien, die Sie dort zusätzlich zu denen in Incident Manager definiert haben. PagerDuty fügt Timeline-Ereignisse aus Incident Manager als Notizen zu Ihrem Vorfall hinzu.

Erweitern Sie Integrationen von Drittanbietern und aktivieren Sie dann das Kontrollkästchen PagerDuty Integration aktivieren.
Wählen Sie unter Geheim auswählen das Geheimnis aus, in AWS Secrets Manager dem Sie die Anmeldeinformationen für den Zugriff auf Ihr PagerDuty Konto speichern.

Hinweise zum Speichern Ihrer PagerDuty Anmeldeinformationen in einem Secrets Manager Secret finden Sie unterSpeichern von PagerDuty Zugangsdaten in einem geheimen Ordner AWS Secrets Manager.
Wählen Sie unter PagerDuty Service den Service aus Ihrem PagerDuty Konto aus, für den Sie den PagerDuty Incident erstellen möchten.
Fahren Sie fort, indem Sie optionale Tags hinzufügen und den Reaktionsplan erstellen.

Hinzufügen von Tags und Erstellen des Reaktionsplans

Um Tags hinzuzufügen und den Reaktionsplan zu erstellen

(Optional) Wenden Sie im Bereich „Tags“ ein oder mehrere Tag-Schlüsselname/Wert-Paare auf den Reaktionsplan an.

Tags sind optionale Metadaten, die Sie einer Ressource zuweisen. Mithilfe von Stichwörtern können Sie eine Ressource auf unterschiedliche Weise kategorisieren, z. B. nach Zweck, Eigentümer oder Umgebung. Möglicherweise möchten Sie einen Reaktionsplan taggen, um die Art des Vorfalls, den er eindämmen soll, die Arten von Eskalationskanälen, die er enthält, oder den Eskalationsplan, der damit verknüpft wird, zu identifizieren. Weitere Informationen zur Kennzeichnung von Incident Manager-Ressourcen finden Sie unter. Ressourcen im Incident Manager taggen
Wählen Sie Reaktionsplan erstellen aus.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Integration von Systems Manager Automation-Runbooks zur Behebung von Vorfällen

Identifizierung potenzieller Ursachen für Vorfälle aus anderen Diensten

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden

Reaktionspläne in Incident Manager erstellen und konfigurieren

Bewährte Methoden

Erstellung eines Reaktionsplans

Um einen Reaktionsplan zu erstellen

Standardwerte für Vorfälle angeben

Um Standardwerte für Vorfälle anzugeben

Anmerkung

(Optional) Angabe eines Chat-Kanals zur Reaktion auf Vorfälle

Wichtig

So geben Sie einen Chat-Kanal zur Reaktion auf Vorfälle an

Tipp

(Optional) Wählen Sie die Ressourcen aus, die für die Reaktion auf Vorfälle zuständig sind

Um Ressourcen für die Reaktion auf Vorfälle auszuwählen

(Optional) Geben Sie ein Runbook zur Minderung von Vorfällen an

Tipp

Anmerkung

Anmerkung

(Optional) Integrieren eines PagerDuty Dienstes in den Reaktionsplan

Um einen PagerDuty Service in den Reaktionsplan zu integrieren

Hinzufügen von Tags und Erstellen des Reaktionsplans

Um Tags hinzuzufügen und den Reaktionsplan zu erstellen

Hat Ihnen diese Seite geholfen?

Nächstes Thema:

Vorheriges Thema:

Brauchen Sie Hilfe?