开始学习事件检测和响应 - AWS事件检测和响应用户指南

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始学习事件检测和响应

工作负载和警报是AWS事件检测和响应的核心。 AWS 与您密切合作,定义和监控对您的业务至关重要的特定工作负载。 AWS 帮助您设置警报,快速将重大绩效问题或客户影响通知您的团队。正确配置的警报对于在事件检测和响应中进行主动监控和快速事件响应至关重要。

工作负载

您可以使用事件检测和响应选择特定的工作负载进行监控和关键AWS事件管理。工作负载是资源和代码的集合,它们协同工作以提供业务价值。工作负载可能是构成银行支付门户或客户关系管理 (CRM) 系统的所有资源和代码。您可以在单个 AWS 账户或多个 AWS 账户中托管工作负载。

例如,您可能在单个账户中托管了一个整体应用程序(例如,下图中的员工绩效应用程序)。或者,您可能将一个应用程序(例如图中的 Storefront Webapp)分解为跨不同账户的微服务。工作负载可能与其他应用程序或工作负载共享资源(例如数据库),如图所示。

Diagram showing applications and services across multiple accounts with shared databases.

要开始使用工作负载入门,请参阅工作负载入和工作负载入入卷。

警报

警报是事件检测和响应的关键部分,因为它们可以让您了解应用程序和底层 AWS 基础设施的性能。 AWS 与您合作定义适当的指标和警报阈值,这些指标和警报阈值只有在您监控的工作负载受到严重影响时才会触发。目标是让警报与您指定的解决人员接触,然后他们可以与事件管理团队合作以快速缓解任何问题。应将警报配置为仅在性能或客户体验明显下降需要立即注意时才进入警报状态。一些关键类型的警报包括指示业务影响的警报、Amazon CloudWatch Canaries 警报和监控依赖关系的聚合警报。

要开始使用警报摄取,请参阅警报摄取和警报摄取调查问卷。

注意

要更改您的运行手册、工作负载信息或在 “AWS事件检测和响应” 中监控的警报,请参阅在 “事件检测和响应” 中请求更改已载入的工作负载