Comece a usar Detecção e Resposta a Incidentes - AWSGuia do usuário de detecção e resposta a incidentes

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Comece a usar Detecção e Resposta a Incidentes

Cargas de trabalho e alarmes são fundamentais para a detecção e AWS resposta a incidentes. AWS trabalha em estreita colaboração com você para definir e monitorar cargas de trabalho específicas que são essenciais para seus negócios. AWS ajuda você a configurar alarmes que notificam rapidamente sua equipe sobre problemas significativos de desempenho ou impacto no cliente. Alarmes configurados corretamente são essenciais para o monitoramento proativo e a resposta rápida a incidentes na Detecção e Resposta a Incidentes.

Workloads

Você pode selecionar cargas de trabalho específicas para monitoramento e gerenciamento de incidentes críticos usando a Detecção e Resposta a AWS Incidentes. Uma carga de trabalho é uma coleção de recursos e códigos que trabalham juntos para gerar valor comercial. Uma carga de trabalho pode ser todos os recursos e códigos que compõem seu portal de pagamento bancário ou um sistema de gerenciamento de relacionamento com o cliente (CRM). Você pode hospedar uma carga de trabalho em uma única AWS conta ou em várias AWS contas.

Por exemplo, você pode ter um aplicativo monolítico hospedado em uma única conta (por exemplo, o Employee Performance App no diagrama a seguir). Ou você pode ter um aplicativo (por exemplo, o Storefront Webapp no diagrama) dividido em microsserviços que se estendem por contas diferentes. Uma carga de trabalho pode compartilhar recursos, como um banco de dados, com outros aplicativos ou cargas de trabalho, conforme mostrado no diagrama.

Diagram showing applications and services across multiple accounts with shared databases.

Para começar com a integração da carga de trabalho, consulte Integração da carga de trabalho e questionário de integração da carga de trabalho.

Alarmes

Os alarmes são uma parte fundamental da detecção e resposta a incidentes, pois fornecem visibilidade do desempenho de seus aplicativos e da AWS infraestrutura subjacente. AWS trabalha com você para definir métricas e limites de alarme apropriados que só serão acionados quando houver um impacto crítico nas cargas de trabalho monitoradas. O objetivo é que os alarmes envolvam seus resolvedores específicos, que podem então colaborar com a equipe de gerenciamento de incidentes para mitigar rapidamente quaisquer problemas. Os alarmes devem ser configurados para entrar no estado de alarme somente quando houver uma degradação significativa no desempenho ou na experiência do cliente que exija atenção imediata. Alguns tipos principais de alarmes incluem aqueles que indicam impacto nos negócios, Amazon CloudWatch Canaries e alarmes agregados que monitoram dependências.

Para começar com a ingestão de alarmes, consulte Ingestão de alarmes e Questionário de ingestão de alarmes.

nota

Para fazer alterações em seus runbooks, nas informações da carga de trabalho ou nos alarmes monitorados na Detecção e Resposta a AWS Incidentes, consulte. Solicite alterações em uma carga de trabalho integrada na Detecção e Resposta a Incidentes