分析运营洞察以减少 OpsItems - AWS Systems Manager

分析运营洞察以减少 OpsItems

OpsCenter 运营洞察显示有关重复 OpsItems 的信息。OpsCenter 在您的账户中自动分析 OpsItems 并生成三种类型的洞察。您可以在 OpsCenter 摘要选项卡的运营洞察部分中查看此信息。

  • 重复 OpsItems – 当八个或更多 OpsItems 对同一资源具有相同的标题时,将生成洞察。

  • 最常见的标题 – 当超过 50 个 OpsItems 具有相同标题时,将生成洞察。

  • 生成最多 OpsItems 的资源 – 当 AWS 资源具有超过 10 个打开的 OpsItems 时,将生成洞察。这些洞察及其对应的资源显示在 OpsCenter 摘要选项卡上的生成最多 OpsItem 的资源表中。资源按 OpsItem 计数的递减顺序列出。

注意

OpsCenter 为以下资源类型创建生成最多 OpsItems 的资源洞察:

  • Amazon Elastic Compute Cloud(Amazon EC2)实例

  • Amazon EC2 安全组

  • Amazon EC2 自动扩缩组

  • Amazon Relational Database Service(Amazon RDS)数据库

  • Amazon RDS 集群

  • AWS Lambda 函数

  • Amazon DynamoDB 表

  • Elastic Load Balancing 负载均衡器

  • Amazon Redshift 集群

  • AWS Certificate Manager 证书

  • Amazon Elastic Block Store 卷

OpsCenter 强制实施每种类型 15 个洞察的限制。如果某个类型达到此限制,OpsCenter 会停止显示该类型的更多洞察。要查看其他洞察,您必须解决与该类型的 OpsInsight 相关的所有 OpsItems。如果由于 15 个洞察的限制而无法在控制台中显示待处理的洞察,则该洞察将在另一个洞察关闭后变为可见。

当您选择某个洞察后,OpsCenter 会显示受影响的 OpsItems 和资源的相关信息。以下屏幕截图展示了一个示例,其中包含重复 OpsItem 洞察的详细信息。

OpsCenter 洞察的详细视图,其中包含有关 OpsItems 的信息。

默认情况下,“运营洞察”处于关闭状态。有关使用运营洞察的更多信息,请参阅以下主题。

启用运营洞察

您可以在 Systems Manager 控制台的 OpsCenter 页面上启用运营洞察。当您启用运营洞察后,Systems Manager 将创建名为 AWSServiceRoleForAmazonSSM_OpsInsights 的 AWS Identity and Access Management(IAM)服务相关角色。服务相关角色是一种与 Systems Manager 直接关联的独特类型的 IAM 角色。服务相关角色是预定义的角色,包括相应服务代表您调用其他 AWS 服务 所需的所有权限。有关 AWSServiceRoleForAmazonSSM_OpsInsights 服务相关角色的更多信息,请参阅在 Systems Manager OpsCenter 中使用角色创建运营洞察 OpsItem

注意

请注意以下重要信息:

  • 将向您的 AWS 账户 收取运营洞察的费用。有关更多信息,请参阅AWS Systems Manager 定价

  • OpsCenter 使用批处理定期刷新洞察。这意味着 OpsCenter 中显示的洞察列表可能不同步。

按照以下过程在 OpsCenter 中启用和查看运营洞察。

启用和查看运营洞察
  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 AWS Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 运营洞察可用消息框中,选择启用。如果您没有看到此消息,请向下滚动到运营洞察部分,然后选择启用

  4. 启用此功能后,在摘要选项卡上,向下滚动到运营洞察部分。

  5. 要查看经过筛选的洞察列表,选择重复OpsItems最常见的标题生成最多 OpsItems 的资源旁边的链接。要查看所有洞察,选择 View all operational insights (查看所有运营洞察)

  6. 选择洞察 ID 以查看更多信息。

基于洞察解决重复的 OpsItems

要解决洞察问题,必须先解决与洞察关联的所有 OpsItems 的问题。您可以使用 AWS-BulkResolveOpsItemsForInsight 运行手册来解决与洞察关联的 OpsItems 的问题。

为了帮助您解决重复的 OpsItems,并减少由源创建的 OpsItems 的数量,Systems Manager 提供了以下自动化运行手册:

  • AWS-BulkResolveOpsItems 运行手册解决与指定筛选条件匹配的 OpsItems。

  • AWS-AddOpsItemDedupStringToEventBridgeRule 运行手册将为与特定 Amazon EventBridge 规则关联的所有 OpsItem 目标添加重复数据删除字符串。如果某一规则已经包含重复数据删除字符串,则此运行手册不会再添加该字符串。

  • 如果 EventBridge 中的某一规则生成数十或数百个 OpsItems,则 AWS-DisableEventBridgeRule 将关闭该规则。

解决运营洞察问题
  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 AWS Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 在 Overview (概览) 选项卡上,向下滚动到 Operational insights (运营洞察)

  4. 选择查看所有运营洞察

  5. 选择洞察 ID 以查看更多信息。

  6. 选择运行手册,然后选择执行

禁用运营洞察

当您关闭运营洞察后,系统将停止创建新的洞察,并停止在控制台中显示洞察。任何处于活动状态的洞察在系统中都保持不变,但您不会在控制台中看到它们。如果您再次启用此功能,系统将显示之前未解决的洞察,并开始创建新的洞察。按照以下过程关闭运营洞察。

关闭运营洞察
  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 AWS Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 选择设置

  4. Operational insights (运营洞察) 部分,选择 Edit (编辑),然后切换 Disable (禁用) 选项。

  5. 选择保存