在事件管理器控制台中查看事件详细信息 - Incident Manager

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在事件管理器控制台中查看事件详细信息

AWS Systems Manager 事件管理器会从检测到事件的那一刻起一直跟踪您的事件,直到事件得到解决,再到事后分析。您可以在 Incident Manager 控制台的事件列表页面上查找所有事件,其中包含直接指向事件详细信息的链接。

在控制台中查看事件列表

事件列表页面包含三个部分:未解决的事件已解决的事件分析。您可以在该页面手动跟踪新事件并创建分析。要了解有关手动跟踪事件的更多信息,请参阅手动创建事件本指南的事件创建部分。要了解事后分析,请参阅本指南的 在 Incident Manager 中执行事件后分析 部分。

事件详细信息会以图块形式显示未解决的事件,其中包括该事件的标题、影响、持续时间和聊天频道。解决事件后,事件会移动到已解决事件列表中。分析位于第二个选项卡中。

在控制台中查看事件详情

事件详细信息页面提供了可以用于管理事件的详细洞察力和工具。在此页面上,您可以启动运行手册以缓解事件,添加事件备注,与其他解决者互动,并查看事件详细信息,例如时间轴、指标、属性和相关资源。

如下图所示,事件详情页面包括几个部分:顶部横幅、事件备注,以及包含其他信息和资源的七个选项卡。默认情况下,热门横幅和事件备注部分显示在所有事件详细信息页面上。

事件详细信息页面包含 7 个选项卡,其中包含与事件相关的信息。

本主题说明了事件详细信息页面的元素以及您可以从该页面执行的操作。

顶部横幅

每个事件详细信息页面的顶部横幅都包含以下信息:

  • 状态——事件的当前状态可以是未解决已解决

  • 影响——事件对您的环境的影响。它可以是高、中和低。要更改事件的影响,请选择编辑属性

  • 聊天频道——访问聊天频道的链接,您可以在其中查看事件更新和通知。

  • 持续时间——响应者解决事件之前经过的时间。

  • 运行手册——与此事件相关的运行手册的状态。状态可以是等待输入成功失败。如果运行手册的状态是正在等待输入,则可以选择该运行手册来查看操作详细信息。您可以选择不成功来查看超时故障取消的运行手册。

  • 参与度——互动总数和每次互动的状态。创建互动时,其状态为已互动。确认互动后,状态将从已互动更改为已确认。Incident Manager 不支持第三方互动的确认。此类互动仍处于已互动状态。

您可以通过选择横幅右上角的编辑来编辑事件标题、影响和聊天频道。

事件备注

屏幕右侧显示事件备注部分。使用备注,您可以与其他处理事件的用户进行协作和沟通。您可以解释所采用的缓解措施、所发现的潜在根本原因或事件的当前状态。最佳实践是,使用事件备注部分发布状态更新以及您或其他人对事件采取的行动。如果您需要与其他解决者进行实时沟通,请使用 Incident Manager 中提供的聊天频道。

要添加备注,请选择添加事件备注按钮,然后输入您的备注。备注可以包含有关事件状态的更新或任何其他向其他用户提供可见性的相关信息。如果需要,您还可以编辑或删除事件备注。

注意

任何IAM有权运行ssm-incidents:UpdateTimelineEventssm-incidents:DeleteTimelineEvent操作的用户都可以编辑和删除笔记。但是,当您与其他账户共享事件时,资源策略不包括 ssm-incidents:DeleteTimelineEvent 操作。这样可以防止与您共享事件的用户删除备注。您可以在 AWS CloudTrail 控制台中查看 Incident Manager 事件中备注的审计跟踪记录。

选项卡

事件详细信息页面有七个选项卡,方便响应者在事件发生时查找和查看信息。选项卡名称中显示一个计数器,表示该选项卡的更新次数。有关各选项卡内容和可用操作的更多信息,请继续阅读。

概述

概述选项卡是响应者的登录页面。它包含事件摘要、最近的时间轴事件列表和当前运行手册步骤。

响应者使用摘要来了解已采取的行动、任何变更的结果、可能的后续步骤以及有关事件影响的信息。要更新摘要,请选择摘要部分右上角的编辑

重要

如果多个响应者同时编辑摘要字段,则最后提交编辑内容的响应者将覆盖所有其他输入。

最近的时间轴事件部分包含 Incident Manager 填充的时间轴,其中包含五个最新的事件。利用这一部分了解事件的状态和最近发生的情况。要查看完整的时间轴,请继续进入时间轴选项卡。

概述页面还显示当前运行手册步骤。此步骤可能是在您的 AWS 环境中自动运行的步骤,也可能是一组针对响应者的手动说明。要查看完整的运行手册,包括之前和接下来的步骤,请选择运行手册选项卡。

诊断

诊断选项卡包含有关您的 AWS 托管应用程序和系统的重要信息,包括有关指标的信息以及调查发现(如果启用)。

使用指标

事件管理器使用 Amazon CloudWatch 填充此选项卡上的指标和警报图表。要了解有关定义警报和指标的事件管理最佳实践的更多信息,请参阅 监控 本用户指南的事件计划部分。

要添加指标
  • 选择该选项卡右上角的添加

    • 要从现有 CloudWatch 控制面板添加指标,请选择从现有 CloudWatch 控制面板

      1. 选择控制面板。这会添加所选控制面板中的所有指标和警报。

      2. (可选)您也可以从控制面板中选择指标来查看特定指标。

    • 选择来源 CloudWatch并粘贴指标来源,即可添加单个指标。要复制指标来源:

      1. 打开 CloudWatch 控制台,网址为https://console.aws.amazon.com/cloudwatch/

      2. 在导航窗格中,选择指标

      3. 全部指标选项卡上的搜索字段中,输入搜索词(例如,指标名称或资源名称),然后选择输入

        例如,如果您搜索CPUUtilization指标,则将显示具有该指标的关联命名空间和维度。

      4. 选择一个搜索结果,查看指标。

      5. 选择来源选项卡并复制来源。

指标警报图表只能通过相关的响应计划添加到事件详细信息中,或者在添加指标时选择 “来自现有 CloudWatch控制面板”。

要删除指标,请选择删除,然后从提供的指标下拉列表中选择要删除的指标。

查看 AWS CodeDeploy 和的调查结果 AWS CloudFormation

启用调查发现并配置所有必要权限后,任何可能与特定事件相关的调查发现都会附加到该事件中。响应者可以在事件详细信息页面上查看有关这些调查发现的信息。

查看 CodeDeploy 和的调查结果 CloudFormation
  1. 打开 Incident Manager 控制台

  2. 选择要调查的事件名称。

  3. 诊断选项卡的调查发现区域中,将任何报告的调查发现的开始时间与事件的开始时间进行比较。

  4. 要查看有关某项查找结果的更多详细信息,请在 “参考” 列中,选择指向 CodeDeploy或 CloudFormation 查找结果的链接。

时间轴

使用时间轴选项卡跟踪事件期间发生的事件。Incident Manager 会自动填充时间轴事件,以识别事件期间发生的重大事件。响应者可以根据手动检测到的事件添加自定义事件。在事后分析期间,时间轴选项卡提供了有关如何更好地准备和响应未来的事件的宝贵洞察力。有关事后分析的更多信息,请参阅 在 Incident Manager 中执行事件后分析

要添加自定义时间轴事件,请选择添加。使用日历选择日期,然后输入时间。所有时间都采用您的本地时区。提供在时间轴上显示的事件的简要说明。

要编辑现有的自定义事件,请在时间轴上选择该事件,然后选择编辑。您可以更改自定义事件的时间、日期和描述。您只能编辑自定义事件。

运行手册

响应者可以在事件详细信息页面的运行手册选项卡中查看运行手册步骤并启动新的运行手册。

要启动新的运行手册,请在运行手册部分中选择启动运行手册。使用搜索字段查找要启动的运行手册。提供启动运行手册时要使用的所有必需参数运行手册的版本。在事件发生期间从运行手册选项卡启动的运行手册使用当前登录账户的权限。

要在 Systems Manager 中导航到运行手册定义,请在运行手册下选择运行手册的标题。要在 Systems Manager 中导航到运行手册的运行实例,请在执行详细信息下选择执行详细信息。这些页面显示了用于启动运行手册的模板,以及当前运行的自动化文档实例的具体详细信息。

运行手册步骤部分显示了所选运行手册自动执行或响应者手动执行的步骤列表。这些步骤会随着其成为当前步骤而展开,显示完成该步骤所需的信息或有关该步骤操作的详细信息。自动运行手册步骤在自动化完成后解析。手动步骤要求响应者在每个步骤的底部选择下一步。步骤完成后,步骤输出将显示为下拉菜单。

要取消运行手册的执行,请选择取消运行手册。这将停止运行手册的执行,并且不会完成运行手册中的任何其他步骤。

互动

事件详细信息的互动选项卡推动了响应者和团队的互动。在该选项卡中,您可以看到与谁互动,谁已响应,以及哪些响应者将作为上报计划的一部分互动。响应者可以直接通过该选项卡与其他联系人互动。要了解有关创建联系人和上报计划的更多信息,请参阅本指南的 在事件管理器中创建和配置联系人在事件管理器中为响应者参与制定升级计划 部分。

您可以配置包含联系人和上报计划的响应计划,以便在事件开始时自动开始互动。要了解有关配置响应计划的更多信息,请参阅本指南的 在事件管理器中创建和配置响应计划 部分。

您可以在表格中查找有关每个联系人的信息。该表格包含以下信息:

  • 名称——指向显示联系方式和互动计划的联系人详细信息页面的链接。

  • 上报计划——指向与联系人互动的上报计划的链接。

  • 联系人来源-标识与该联系人联系的服务,例如 AWS Systems Manager 或 PagerDuty。

  • 已互动——显示计划何时与联系人互动,或何时作为上报计划的一部分与联系人互动。

  • 已确认——显示联系人是否已确认互动。

要确认互动,响应者可以执行下列操作之一:

  • 电话呼叫——出现提示时输入 1

  • SMS— 使用提供的代码回复消息,或在事件的 “参与” 选项卡上输入提供的代码。

  • 电子邮件——在事件的互动选项卡上输入提供的代码。

相关项目选项卡用于收集与事件缓解相关的资源。这些资源可以是外部资源的链接ARNs,也可以是上传到 Amazon S3 存储桶的文件。该表显示描述性标题以及ARN、链接或存储桶的详细信息。在使用 S3 存储桶之前,请查看《Amazon S3 用户指南》中的 Amazon S3 安全最佳实践

将文件上传到 Amazon S3 存储桶时,该存储桶上的版本控制要么已启用,要么已暂停。在存储桶上启用版本控制后,上传的文件如果与现有文件同名,就会被添加为该文件的新版本。如果暂停版本控制,上传的文件如果与现有文件同名,就会覆盖现有文件。要了解有关版本控制的更多信息,请参阅《Amazon S3 用户指南》中的在 S3 存储桶中使用版本控制

删除文件相关项目时,该文件会从事件中删除,但不会从 Amazon S3 存储桶中删除。要了解有关从 Amazon S3 存储桶中删除对象的更多信息,请参阅《Amazon S3 用户指南》中的删除 Amazon S3 对象

属性

属性选项卡提供了有关事件的以下详细信息。

事件属性部分,您可以查看以下内容:

  • 状态——描述事件的当前状态。事件可以是未解决已解决

  • 开始时间——在 Incident Manager 中创建事件的时间。

  • 解决时间——在 Incident Manager 中解决事件的时间。

  • Amazon 资源名称 (ARN)-事件ARN的名称。在聊天中引用事件ARN时使用,或者使用 AWS Command Line Interface (AWS CLI) 命令。

  • 响应计划——确定所选事件的响应计划。选择响应计划会打开响应计划的详细信息页面。

  • 父级 OpsItem-将 OpsItem创建者标识为事件的父项。父母 OpsItem 可以有多个相关事件和后续行动项目。选择父项 OpsItem将在中打开 OpsItems 详细信息页面 OpsCenter。

  • 分析——标识根据此事件创建的分析。根据已解决的事件创建分析,以改进您的事件响应流程。选择分析以打开分析详细信息页面。

  • 所有者——创建事件的账户。

标签部分,您可以查看和编辑与事件记录关联的标签密钥和值。有关 Incident Manager 中标签的更多信息,请参阅 在 Incident Manager 中标记资源