Conceitos básicos do Incident Manager - Incident Manager

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conceitos básicos do Incident Manager

Esta seção explica o Prepare-se no console do Incident Manager. Você precisa concluir o Prepare-se no console antes de poder iniciar o gerenciamento de incidentes. O assistente orienta você na configuração do conjunto de replicação, de pelo menos um contato e um plano de escalação, além do primeiro plano de resposta. Os guias a seguir ajudarão você a entender o Incident Manager e o ciclo de vida do incidente:

Pré-requisitos

Se você estiver usando o Incident Manager pela primeira vez, consulte o Configurando o AWS Systems Manager Incident Manager. Recomendamos configurar o Incident Manager na conta que você usa para gerenciar suas operações.

Recomendamos que você realize a configuração rápida do Systems Manager antes de iniciar o assistente Prepare-se do Incident Manager. Use a Configuração rápida do Systems Manager para configurar os serviços e os atributos da AWS conforme as práticas recomendadas. O Incident Manager usa os recursos do Systems Manager para gerenciar incidentes associados a suas contas da Contas da AWS e os benefícios de ter o Systems Manager configurado primeiro.

Assistente Prepare-se

Na primeira vez que usar o Incident Manager, você poderá acessar o assistente Prepare-se na página inicial do serviço Incident Manager. Para acessar o assistente Prepare-se depois de realizar a configuração pela primeira vez, escolha Preparar na página da lista Incidentes.

  1. Abra o console do Incident Manager.

  2. Na página inicial do serviço Incident Manager, escolha Prepare-se.

Configurações gerais
  1. Em Configurações gerais, escolha Arquivos.

  2. Leia os Termos e condições. Se você concordar com os termos e condições do Incident Manager, selecione Eu li e concordo com os termos e condições do Incident Manager e escolha Próximo.

  3. Na área Regiões, sua atual Região da AWS aparece como a primeira região em seu conjunto de replicação. Para adicionar mais regiões ao seu conjunto de replicação, escolha-as na lista de regiões.

    Recomendamos incluir pelo menos duas regiões. Caso uma região esteja temporariamente indisponível, as atividades relacionadas a incidentes ainda podem ser roteadas para a outra região.

    nota

    A criação do conjunto de replicação cria o perfil AWSServiceRoleforIncidentManager vinculado a serviços na conta. Para saber mais sobre esse perfil, consulte Usar perfis vinculados ao serviço do Incident Manager.

  4. Para configurar a criptografia do conjunto de replicação, faça um dos seguintes procedimentos:

    nota

    Todos os recursos do Incident Manager são criptografados. Para saber mais sobre como seus dados são criptografados, consulte Proteção de dados no Incident Manager. Para obter mais informações sobre o conjunto de replicação do Incident Manager, consulte Como usar o conjunto de replicação do Incident Manager.

    • Para usar uma AWS chave própria, escolha Usar AWS chave própria.

    • Para usar sua própria AWS KMS chave, escolha Escolher uma AWS KMS key existente. Para cada região selecionada na etapa 3, escolha uma chave AWS KMS ou insira um nome do recurso da Amazon (ARN) do AWS KMS.

      dica

      Se você não tiver uma AWS KMS key disponível, escolha Criar uma AWS KMS key.

  5. (Opcional) Na área Tags insira uma ou mais tags para o conjunto de replicação. Uma tag inclui uma chave e, opcionalmente, um valor.

    Tags são metadados opcionais que você atribui a um recurso. As tags permitem categorizar um recurso de diferentes formas, como por finalidade, proprietário ou ambiente. Para obter mais informações, consulte Marcando recursos no Incident Manager.

  6. (Opcional) Na área Acesso ao serviço, para ativar o atributo Descobertas, escolha a caixa de seleção Criar perfil de serviço para descobertas nesta conta.

    Uma descoberta é uma informação sobre uma implantação de código ou alteração na infraestrutura que ocorreu na mesma época em que um incidente foi criado. Cada descoberta pode ser examinada como uma possível causa do incidente. As informações sobre essas possíveis causas são adicionadas à página Detalhes do incidente. Com informações sobre essas implantações e mudanças prontamente disponíveis, os respondentes não precisam pesquisar essas informações manualmente.

    dica

    Para ver informações sobre o perfil a ser criado, escolha Exibir permissões.

  7. Escolha Criar.

    Para saber mais sobre conjuntos de replicação e resiliência, consulte Resiliência em AWS Systems Manager Incident Manager.

Contatos (opcional)
  1. Escolha Criar contato.

    O Incident Manager engaja os contatos durante um incidente. Para obter mais informações sobre contatos, consulte Como trabalhar com contatos do Incident Manager.

  2. Em Nome, insira o nome do contato.

  3. Em Alias exclusivo, insira um alias para identificar esse contato.

  4. Na seção Canal de contato, faça o seguinte para definir como o contato será engajado durante incidentes:

    1. Em Tipo, escolha E-mail, SMS ou Voz.

    2. Em Nome do canal, insira um nome exclusivo para ajudá-lo a identificar o canal.

    3. Em Detalhes, insira o endereço de e-mail ou número de telefone do contato.

      Os números de telefone devem ter de 9 a 15 caracteres e começar com +, seguidos pelo código do país e pelo número do assinante.

    4. Para criar outro canal de contato, escolha Adicionar um novo canal de contato. Recomendamos definir pelo menos dois canais para cada contato.

  5. Na área Plano de engajamento, faça o seguinte para definir por quais canais notificar o contato e por quanto tempo esperar por uma confirmação em cada canal. Selecione os canais de contato a serem usados para interagir com o contato durante incidentes.

    nota

    Recomendamos definir pelo menos dois dispositivos no plano de engajamento.

    1. Em Nome do canal de contato, escolha um canal especificado na área Canal de contato.

    2. Em Tempo de engajamento (min), insira o número de minutos de espera antes de interagir com o canal de contato.

      Recomendamos que você selecione pelo menos um dispositivo para engajar no início de um engajamento, especificando 0 (zero) minutos de tempo de espera.

    3. Para adicionar mais canais de contato ao plano de engajamento, escolha Adicionar engajamento.

  6. (Opcional) Na área Tags insira uma ou mais tags para o contato. Uma tag inclui uma chave e, opcionalmente, um valor.

    Tags são metadados opcionais que você atribui a um recurso. As tags permitem categorizar um recurso de diferentes formas, como por finalidade, proprietário ou ambiente. Para obter mais informações, consulte Marcando recursos no Incident Manager.

  7. Para criar o registro de contato e enviar códigos de ativação para os canais de contato definidos, escolha Próximo.

  8. (Opcional) Na página Ativação do canal de contato, insira o código de ativação enviado para cada canal.

    Você pode gerar novos códigos de ativação posteriormente se não conseguir inseri-los agora.

  9. Repita a etapa quatro até adicionar todos os seus contatos ao Incident Manager.

  10. Depois que todos os contatos forem inseridos, escolha Concluir.

(Opcional) Planos de escalação
  1. Escolha Criar plano de escalação.

    Um plano de escalação escala os contatos durante um incidente, garantindo que o Incident Manager envolva os respondentes corretos durante um incidente. Para obter mais informações sobre planos de escalação, consulte Como trabalhar com planos de escalação no Incident Manager.

  2. Em Nome, insira um nome exclusivo para o plano de escalação.

  3. Em Alias, insira um alias exclusivo para ajudá-lo a identificar o plano de escalação.

  4. Na área do Estágio 1, faça o seguinte:

    1. Em Canal de escalação, escolha os canais de contato para engajar.

    2. Se você quiser que um contato possa interromper a progressão dos estágios do plano de escalação, selecione Confirmação interrompe a progressão do plano.

    3. Para adicionar mais canais a um estágio, escolha Adicionar canal de escalação.

  5. Para criar um novo estágio no plano de escalação, escolha Adicionar estágio e adicione os detalhes do estágio.

  6. (Opcional) Na área Tags adicione uma ou mais tags ao plano de escalação. Uma tag inclui uma chave e, opcionalmente, um valor.

    Tags são metadados opcionais que você atribui a um recurso. As tags permitem categorizar um recurso de diferentes formas, como por finalidade, proprietário ou ambiente. Para obter mais informações, consulte Marcando recursos no Incident Manager.

  7. Escolha Criar plano de escalação.

Plano de resposta
  1. Selecione Criar plano de resposta. Use o plano de resposta para reunir os contatos e os planos de escalação criados. Ao usar o assistente Prepare-se, as seções a seguir são opcionais, especialmente se for a primeira vez que você configura um plano de resposta:

    • Canal de chat

    • Runbooks

    • Engajamentos

    • Integrações de terceiros

    Para obter informações sobre como adicionar esses elementos aos planos de resposta posteriormente, consulte Preparação para incidentes no Incident Manager.

  2. Em Nome, insira um nome exclusivo e identificável para o plano de resposta. O nome é usado para criar o ARN do plano de resposta ou em planos de resposta sem nome de exibição.

  3. (Opcional) Em Nome de exibição, insira um nome para ajudá-lo a identificar esse plano de resposta ao criar incidentes.

  4. Em Título, insira um título para ajudar a identificar o tipo de incidente relacionado a esse plano de resposta. O valor que você especifica está incluído no título de cada incidente. O alarme ou o evento que iniciou o incidente também é adicionado ao título.

  5. Em Impacto, selecione o nível de impacto que você espera para incidentes relacionados a esse plano de resposta, como Critical ou Low.

  6. (Opcional) Em Resumo, insira uma breve descrição usada para fornecer uma visão geral do incidente. O Incident Manager preenche automaticamente as informações relevantes no resumo durante um incidente.

  7. (Opcional) Em Cadeia de desduplicação, insira uma cadeia de caracteres de desduplicação. O Incident Manager usa essa string para evitar que a mesma causa raiz crie vários incidentes na mesma conta.

    Uma sequência de desduplicação é um termo ou frase que o sistema usa para verificar incidentes duplicados. Se você especificar uma string de desduplicação, o Incident Manager pesquisará incidentes abertos que contenham a mesma string dedupeString no campo ao criar o incidente. Se uma duplicação for detectada, o Incident Manager desduplica o incidente mais recente no incidente existente.

    nota

    Por padrão, o Incident Manager desduplica automaticamente vários incidentes criados pelo mesmo alarme do Amazon CloudWatch ou no evento do Amazon EventBridge. Você não precisa inserir sua própria sequência de desduplicação para evitar a duplicação desses tipos de recursos.

  8. (Opcional) Na área Tags adicione uma ou mais tags ao plano de resposta. Uma tag inclui uma chave e, opcionalmente, um valor.

    Tags são metadados opcionais que você atribui a um recurso. As tags permitem categorizar um recurso de diferentes formas, como por finalidade, proprietário ou ambiente. Para obter mais informações, consulte Marcando recursos no Incident Manager.

  9. Selecione os contatos e os planos de escalação a serem aplicados ao incidente no menu suspenso Engajamentos.

  10. Selecione Criar plano de resposta.

Depois de criar um plano de resposta, você pode associar os alarmes do Amazon CloudWatch ou os eventos do Amazon EventBridge ao plano de resposta. Isso criará automaticamente um incidente com base em um alarme ou evento. Para obter mais informações, consulte Criação de incidentes no Incident Manager.