O que é detecção e resposta a AWS incidentes? - AWSGuia do usuário de detecção e resposta a incidentes

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é detecção e resposta a AWS incidentes?

AWSA Detecção e Resposta a Incidentes oferece aos clientes qualificados do AWS Enterprise Support um engajamento proativo de incidentes para reduzir o potencial de falhas e acelerar a recuperação de cargas de trabalho críticas em caso de interrupções. A Detecção e Resposta a Incidentes facilitam sua colaboração AWS para desenvolver runbooks e planos de resposta personalizados para cada carga de trabalho integrada.

A Detecção e Resposta a Incidentes oferece os seguintes recursos principais:

  • Observabilidade aprimorada: AWS especialistas fornecem orientação para ajudá-lo a definir e correlacionar métricas e alarmes entre as camadas de aplicativos e infraestrutura de sua carga de trabalho para detectar interrupções precocemente.

  • Tempo de resposta de 5 minutos: engenheiros de gerenciamento de incidentes (IMEs) monitoram suas cargas de trabalho integradas 24 horas por dia, 7 dias por semana, para detectar incidentes críticos. A IMEs resposta dentro de 5 minutos após o disparo de um alarme ou em resposta a um caso de Support crítico para os negócios que você encaminha para a Detecção e Resposta a Incidentes.

  • Resolução mais rápida: IMEs use runbooks predefinidos e personalizados desenvolvidos para suas cargas de trabalho para responder em 5 minutos, criar um caso de Support em seu nome e gerenciar incidentes em sua carga de trabalho. IMEsforneça propriedade única para incidentes e mantenha você envolvido com os AWS especialistas certos até que o incidente seja resolvido.

  • Gerenciamento de incidentes para AWS eventos: como entendemos o contexto de sua carga de trabalho crítica (por exemplo, contas, serviços e instâncias), podemos detectar e notificá-lo proativamente sobre um possível impacto em sua carga de trabalho durante um AWS evento de serviço. Se solicitado, IMEs interaja com você durante os eventos do AWS serviço e forneça atualizações sobre os eventos. Embora a Detecção e Resposta a Incidentes não possam priorizar sua recuperação durante um evento de serviço, a Detecção e Resposta a Incidentes fornece orientação de Support para ajudá-lo a implementar seu plano de mitigação.

  • Potencial reduzido de falha: após a resolução, eles IMEs fornecem uma análise pós-incidente (mediante solicitação). Além disso, AWS especialistas trabalham com você para aplicar as lições aprendidas para melhorar o plano de resposta a incidentes e os runbooks. Você também pode aproveitar AWS Resilience Hub o rastreamento contínuo da resiliência em suas cargas de trabalho.