Arbeiten mit Reaktionsplänen in Incident Manager - Incident Manager

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Arbeiten mit Reaktionsplänen in Incident Manager

Mit Reaktionsplänen können Sie planen, wie Sie auf einen Vorfall reagieren, der sich auf Ihre Benutzer auswirkt. Ein Reaktionsplan dient als Vorlage, die Informationen darüber enthält, an wen Sie sich wenden müssen, wie schwer das Ereignis zu erwarten ist, welche automatischen Runbooks initiiert werden müssen und welche Kennzahlen überwacht werden müssen.

Bewährte Methoden

Sie können die Auswirkungen von Vorfällen auf Ihre Teams reduzieren, wenn Sie Vorfälle im Voraus planen. Teams sollten bei der Erstellung eines Reaktionsplans die folgenden bewährten Methoden berücksichtigen.

  • Optimiertes Engagement — Identifizieren Sie das Team, das für einen Vorfall am besten geeignet ist. Wenn Sie mit einer zu großen Verteilerliste oder mit den falschen Teams zusammenarbeiten, können Sie während eines Vorfalls Verwirrung stiften und Reaktionszeit verschwenden.

  • Zuverlässige Eskalation — Für Ihre Engagements im Rahmen eines Reaktionsplans empfehlen wir, einen Einsatzplan anstelle von Kontakten oder Bereitschaftszeiten zu wählen. Der Einsatzplan sollte die einzelnen Ansprechpartner oder Bereitschaftszeitpläne (die mehrere wechselnde Ansprechpartner enthalten) angeben, die bei Vorfällen aktiv werden sollen. Da die in Ihrem Einsatzplan angegebenen Einsatzkräfte manchmal nicht erreichbar sein können, sollten Sie in Ihrem Reaktionsplan Ersatzkräfte einrichten, um diese Szenarien abzudecken. Wenn die primären und sekundären Ansprechpartner nicht verfügbar sind oder andere ungeplante Lücken in der Abdeckung bestehen, benachrichtigt Incident Manager dennoch einen Kontakt über den Vorfall.

  • Runbooks — Verwenden Sie Runbooks, um wiederholbare, verständliche Schritte bereitzustellen, die den Stress reduzieren, dem ein Einsatzkräfte während eines Vorfalls ausgesetzt ist.

  • Zusammenarbeit — Nutzen Sie Chat-Kanäle, um die Kommunikation bei Vorfällen zu optimieren. Chat-Kanäle helfen den Einsatzkräften, über Informationen auf dem Laufenden zu bleiben. Über diese Kanäle können sie auch Informationen mit anderen Respondern teilen.

Erstellung eines Reaktionsplans

Gehen Sie wie folgt vor, um einen Reaktionsplan zu erstellen und die Reaktion auf Vorfälle zu automatisieren.

Um einen Reaktionsplan zu erstellen
  1. Öffnen Sie die Incident Manager-Konsole und wählen Sie im Navigationsbereich Reaktionspläne aus.

  2. Wählen Sie Reaktionsplan erstellen aus.

  3. Geben Sie unter Name einen eindeutigen und identifizierbaren Namen für den Reaktionsplan ein, der im Amazon-Ressourcennamen (ARN) für den Reaktionsplan verwendet werden soll.

  4. (Optional) Geben Sie unter Displayname einen besser lesbaren Namen ein, um den Reaktionsplan leichter identifizieren zu können, wenn Sie Incidents erstellen.

  5. Fahren Sie fort, indem Sie Standardwerte für Incident-Datensätze angeben.

Standardwerte für Vorfälle angeben

Damit Sie Vorfälle effektiver verwalten können, können Sie Standardwerte angeben. Incident Manager wendet diese Werte auf alle Vorfälle an, die einem Reaktionsplan zugeordnet sind.

Um Standardwerte für Vorfälle anzugeben
  1. Geben Sie unter Titel einen Titel für diesen Vorfall ein, damit Sie ihn auf der Incident Manager-Startseite leichter identifizieren können.

  2. Wählen Sie unter Auswirkung eine Auswirkungsstufe aus, um den potenziellen Umfang eines Vorfalls anzugeben, der auf der Grundlage dieses Reaktionsplans ausgelöst wurde, z. B. Kritisch oder Niedrig. Informationen zu den Einstufungen der Auswirkungen in Incident Manager finden Sie unterTriage.

  3. (Optional) Geben Sie unter Zusammenfassung eine kurze Zusammenfassung der Art der Vorfälle ein, die anhand dieses Reaktionsplans erstellt wurden.

  4. (Optional) Geben Sie für Deduplizierungszeichenfolge eine Deduplizierungszeichenfolge ein. Incident Manager verwendet diese Zeichenfolge, um zu verhindern, dass dieselbe Grundursache mehrere Vorfälle in demselben Konto verursacht.

    Eine Deduplizierungszeichenfolge ist ein Begriff oder ein Ausdruck, den das System verwendet, um nach doppelten Vorfällen zu suchen. Wenn Sie eine Deduplizierungszeichenfolge angeben, sucht Incident Manager bei der Erstellung des Vorfalls nach offenen Vorfällen, die dieselbe Zeichenfolge in dem dedupeString Feld enthalten. Wenn ein Duplikat erkannt wird, dedupliziert Incident Manager den neueren Vorfall in den vorhandenen Incident.

    Anmerkung

    Standardmäßig dedupliziert Incident Manager automatisch mehrere Vorfälle, die durch denselben CloudWatch Amazon-Alarm oder dasselbe Amazon-Ereignis verursacht wurden. EventBridge Sie müssen keine eigene Deduplizierungszeichenfolge eingeben, um eine Duplizierung für diese Ressourcentypen zu verhindern.

  5. (Optional) Fügen Sie unter Incident-Tags Tag-Schlüssel und Werte hinzu, die Sie Incidents zuweisen möchten, die anhand dieses Reaktionsplans erstellt wurden.

    Sie müssen über die TagResource Berechtigung für die Incident-Datensatzressource verfügen, um Incident-Tags innerhalb des Reaktionsplans festzulegen.

  6. Geben Sie anschließend einen optionalen Chat-Kanal an, über den die Problemlöser miteinander über Vorfälle kommunizieren können.

(Optional) Angabe eines Chat-Kanals zur Reaktion auf Vorfälle

Wenn Sie einen Chat-Kanal in einen Reaktionsplan aufnehmen, erhalten die Einsatzkräfte über diesen Kanal aktuelle Informationen zum Vorfall. Mithilfe von Chat-Befehlen können sie direkt vom Chat-Kanal aus mit dem Vorfall interagieren.

Mithilfe AWS Chatbot können Sie einen Channel für Slack oder Amazon Chime erstellen, den Sie in Ihren Reaktionsplänen verwenden können. Informationen zum Erstellen eines Chat-Kanals in finden Sie im AWS Chatbot AWS ChatbotAdministratorhandbuch.

Wichtig

Der Incident Manager muss berechtigt sein, Beiträge im Amazon Simple Notification Service (Amazon SNS) -Thema eines Chat-Kanals zu veröffentlichen. Wenn Sie nicht berechtigt sind, dieses SNS-Thema zu veröffentlichen, können Sie es nicht zum Reaktionsplan hinzufügen. Incident Manager veröffentlicht eine Testbenachrichtigung zum SNS-Thema, um die Berechtigungen zu überprüfen.

Weitere Informationen zu Chat-Kanälen finden Sie unterArbeiten mit Chat-Kanälen in Incident Manager.

So geben Sie einen Chat-Kanal zur Reaktion auf Vorfälle an
  1. Wählen Sie unter Chat-Kanal einen AWS Chatbot Chat-Kanal aus, über den die Einsatzkräfte während eines Vorfalls kommunizieren können.

    Tipp

    Um einen neuen Chat-Kanal zu erstellenAWS Chatbot, wählen Sie Neuen Chatbot-Client konfigurieren.

  2. Wählen Sie für SNS-Themen für Chat-Kanäle zusätzliche SNS-Themen aus, zu denen Sie während des Vorfalls etwas veröffentlichen möchten. Wenn mehrere SNS-Themen hinzugefügt werden, AWS-Regionen erhöht sich die Redundanz für den Fall, dass eine Region zum Zeitpunkt des Vorfalls nicht verfügbar ist.

  3. Wählen Sie anschließend die Ansprechpartner, Bereitschaftszeiten und Eskalationspläne aus, die während eines Vorfalls hinzugezogen werden sollen.

(Optional) Wählen Sie die Ressourcen aus, die für die Reaktion auf Vorfälle zuständig sind

Es ist wichtig, die am besten geeigneten Ansprechpartner zu finden, wenn ein Vorfall eintritt. Als bewährte Methode empfehlen wir, dass Sie wie folgt vorgehen:

  1. Fügen Sie Kontakte und Bereitschaftszeiten als Eskalationskanäle in einem Eskalationsplan hinzu.

  2. Wählen Sie einen Eskalationsplan als Engagement in einem Reaktionsplan.

Weitere Informationen zu Kontakten und Eskalationsplänen finden Sie unter Mit Kontakten im Incident Manager arbeiten und. Arbeiten mit Eskalationsplänen im Incident Manager

Um Ressourcen für die Reaktion auf Vorfälle auszuwählen
  1. Wählen Sie für Engagements eine beliebige Anzahl von Eskalationsplänen, Bereitschaftszeiten und individuellen Kontakten aus.

  2. Fahren Sie fort, indem Sie optional ein Runbook angeben, das im Rahmen Ihrer Schadensbegrenzung ausgeführt werden soll.

(Optional) Geben Sie ein Runbook zur Schadensbegrenzung an

Sie können Runbooks von AWS Systems ManagerAutomation, einer Funktion von, verwendenAWS Systems Manager, um allgemeine Anwendungs- und Infrastrukturaufgaben in Ihrer Umgebung zu automatisieren. AWS Cloud

Jedes Runbook definiert einen Runbook-Workflow. Ein Runbook-Workflow umfasst die Aktionen, die Systems Manager auf Ihren verwalteten Knoten oder anderen AWS Ressourcentypen ausführt. In Incident Manager steuert ein Runbook die Reaktion auf Vorfälle und deren Behebung.

Weitere Informationen zur Verwendung von Runbooks in Reaktionsplänen finden Sie unter. Arbeiten mit Systems Manager Automation-Runbooks in Incident Manager

So geben Sie ein Runbook zur Minderung von Vorfällen an:

  1. Führen Sie für Runbook einen der folgenden Schritte aus:

    • Wählen Sie Runbook aus Vorlage klonen, um eine Kopie des standardmäßigen Incident Manager-Runbooks zu erstellen. Geben Sie unter Runbook-Name einen aussagekräftigen Namen für das neue Runbook ein.

    • Wählen Sie Bestehendes Runbook auswählen aus. Wählen Sie den Besitzer, das Runbook und die Version aus, die Sie verwenden möchten.

      Tipp

      Um ein Runbook von Grund auf neu zu erstellen, wählen Sie Neues Runbook konfigurieren.

      Weitere Informationen zum Erstellen eines Runbooks finden Sie unter Arbeiten mit Systems Manager Automation-Runbooks in Incident Manager.

  2. Geben Sie im Bereich Parameter alle angeforderten Parameter für das von Ihnen ausgewählte Runbook ein.

    Die verfügbaren Parameter sind die vom Runbook angegebenen. Ein Runbook benötigt möglicherweise andere Parameter als ein anderes. Einige Parameter sind möglicherweise erforderlich und andere optional.

    In vielen Fällen können Sie einen statischen Wert für einen Parameter manuell eingeben, z. B. eine Liste von Amazon EC2 EC2-Instance-IDs. Sie können Incident Manager auch die Parameterwerte bereitstellen lassen, die durch einen Incident dynamisch generiert wurden.

  3. (Optional) Geben Sie für AutomationAssumeRoledie zu AWS Identity and Access Management verwendende (IAM-) Rolle an. Diese Rolle muss über die erforderlichen Berechtigungen verfügen, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.

    Anmerkung

    Wenn nichts angegeben AssumeRole ist, versucht Incident Manager, die Runbook-Dienstrolle zu verwenden, um die einzelnen Befehle auszuführen, die im Runbook angegeben sind.

    Wählen Sie eine der folgenden Optionen aus:

    • ARN-Wert eingeben — Geben Sie den Amazon-Ressourcennamen (ARN) eines AssumeRole manuell im Format einarn:aws:iam::account-id:role/assume-role-name. Zum Beispiel arn:aws:iam::123456789012:role/MyAssumeRole.

    • Bestehende Servicerolle verwenden — Wählen Sie eine Rolle mit den erforderlichen Berechtigungen aus einer Liste vorhandener Rollen in Ihrem Konto aus.

    • Neue Servicerolle erstellen — Wählen Sie aus den AWS verwalteten Richtlinien, die Sie Ihrer hinzufügen möchten AssumeRole. Nachdem Sie diese Option ausgewählt haben, wählen Sie für AWSverwaltete Richtlinien eine oder mehrere Richtlinien aus der Liste aus.

      Sie können den vorgeschlagenen Standardnamen für die neue Rolle akzeptieren oder einen Namen Ihrer Wahl eingeben.

      Anmerkung

      Diese neue Runbook-Dienstrolle ist dem spezifischen Runbook zugeordnet, das Sie ausgewählt haben. Sie kann nicht mit verschiedenen Runbooks verwendet werden. Das liegt daran, dass der Ressourcenbereich der Richtlinie keine anderen Runbooks unterstützt.

  4. Geben Sie für die Runbook-Dienstrolle die IAM-Rolle an, die verwendet werden soll, um die Berechtigungen bereitzustellen, die für den Zugriff auf das Runbook selbst und den Start des Workflows erforderlich sind.

    Die Rolle muss mindestens die ssm:StartAutomationExecution Aktion für Ihr spezielles Runbook zulassen. Damit das Runbook kontenübergreifend funktioniert, muss die Rolle auch die sts:AssumeRole Aktion für die Rolle zulassen, die Sie in der AWS-SystemsManager-AutomationExecutionRole Rolle erstellt haben. Regions- und kontenübergreifendes Incident-Management im Incident Manager

    Wählen Sie eine der folgenden Optionen aus:

    • Neue Servicerolle erstellen — Incident Manager erstellt für Sie eine Runbook-Servicerolle, die die zum Starten des Runbook-Workflows erforderlichen Mindestberechtigungen umfasst.

      Als Rollenname können Sie den vorgeschlagenen Standardnamen akzeptieren oder einen Namen Ihrer Wahl eingeben. Wir empfehlen, den vorgeschlagenen Namen zu verwenden oder den Namen des Runbooks im Namen beizubehalten. Das liegt daran, dass das neue Runbook mit dem von Ihnen ausgewählten Runbook verknüpft AssumeRole ist und möglicherweise nicht die für andere Runbooks erforderlichen Berechtigungen enthält.

    • Vorhandene Servicerolle verwenden — Eine IAM-Rolle, die Sie oder Incident Manager zuvor erstellt haben, gewährt die erforderlichen Berechtigungen.

      Wählen Sie unter Rollenname den Namen der vorhandenen Rolle aus, die Sie verwenden möchten.

  5. Erweitern Sie Zusätzliche Optionen und wählen Sie eine der folgenden Optionen aus, um anzugebenAWS-Konto, wo der Runbook-Workflow ausgeführt werden soll.

    • Konto des Eigentümers des Reaktionsplans — Startet den Runbook-Workflow in demAWS-Konto, der ihn erstellt hat.

    • Betroffenes Konto — Startet den Runbook-Workflow in dem Konto, das den Vorfall ausgelöst oder gemeldet hat.

      Wählen Sie Betroffenes Konto, wenn Sie Incident Manager für kontenübergreifende Szenarien verwenden und das Runbook auf Ressourcen im betroffenen Konto zugreifen muss, um diese zu beheben.

  6. Fahren Sie fort, indem Sie optional einen PagerDuty Service in den Reaktionsplan integrieren.

(Optional) Integrieren eines PagerDuty Dienstes in den Reaktionsplan

Um einen PagerDuty Service in den Reaktionsplan zu integrieren

Wenn Sie Incident Manager mit integrieren PagerDuty, PagerDuty erstellt jedes Mal, wenn Incident Manager einen Incident erstellt, einen entsprechenden Incident. Der Incident PagerDuty verwendet den Paging-Workflow und die Eskalationsrichtlinien, die Sie dort zusätzlich zu denen in Incident Manager definiert haben. PagerDuty fügt Timeline-Ereignisse aus Incident Manager als Notizen zu Ihrem Vorfall hinzu.

  1. Erweitern Sie Integrationen von Drittanbietern und aktivieren Sie dann das Kontrollkästchen PagerDuty Integration aktivieren.

  2. Wählen Sie unter Geheim auswählen das Geheimnis aus, in AWS Secrets Manager dem Sie die Anmeldeinformationen für den Zugriff auf Ihr PagerDuty Konto speichern.

    Hinweise zum Speichern Ihrer PagerDuty Anmeldeinformationen in einem Secrets Manager Secret finden Sie unterSpeichern von PagerDuty Anmeldeinformationen in einem - AWS Secrets Manager Secret.

  3. Wählen Sie unter PagerDuty Service den Service aus Ihrem PagerDuty Konto aus, für den Sie den PagerDuty Incident erstellen möchten.

  4. Fahren Sie fort, indem Sie optionale Tags hinzufügen und den Reaktionsplan erstellen.

Hinzufügen von Tags und Erstellen des Reaktionsplans

Um Tags hinzuzufügen und den Reaktionsplan zu erstellen
  1. (Optional) Wenden Sie im Bereich „Tags“ ein oder mehrere Tag-Schlüsselname/Wert-Paare auf den Reaktionsplan an.

    Tags sind optionale Metadaten, die Sie einer Ressource zuweisen. Mithilfe von Stichwörtern können Sie eine Ressource auf unterschiedliche Weise kategorisieren, z. B. nach Zweck, Eigentümer oder Umgebung. Möglicherweise möchten Sie einen Reaktionsplan taggen, um die Art des Vorfalls, den er eindämmen soll, die Arten von Eskalationskanälen, die er enthält, oder den Eskalationsplan, der damit verknüpft wird, zu identifizieren. Weitere Informationen zur Kennzeichnung von Incident Manager-Ressourcen finden Sie unter. Taggen von Ressourcen in Incident Manager

  2. Wählen Sie Reaktionsplan erstellen aus.