AWSSupport-TroubleshootOpenSearchHighCPU - AWS Systems Manager Referência do runbook de automação

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AWSSupport-TroubleshootOpenSearchHighCPU

Descrição

O AWSSupport-TroubleshootOpenSearchHighCPU runbook fornece uma solução automatizada para coletar dados de diagnóstico de um domínio do Amazon OpenSearch Service para solucionar problemas graves. CPU

Como funciona?

O AWSSupport-TroubleshootOpenSearchHighCPU runbook ajuda a solucionar problemas de alta CPU utilização no domínio do Amazon OpenSearch Service.

O runbook executa as seguintes etapas:

  • Executa o DescribeDomainAPIno domínio fornecido do Amazon OpenSearch Service para obter os metadados do cluster.

  • Verifica se o domínio do Amazon OpenSearch Service é público ou VPC baseado na Amazon e, com a ajuda de AWS CloudFormation, cria uma AWS Lambda função pública ou VPCbaseada na Amazon.

  • A função Lambda busca dados de diagnóstico dos domínios do Amazon OpenSearch Service.

  • Usa uma máquina de AWS Step Functions estado para orquestrar várias execuções de funções Lambda para coletar dados mais abrangentes.

  • Armazena os dados coletados em um grupo de CloudWatch registros da Amazon por 24 horas por padrão.

  • Exclui os recursos criados, exceto o grupo de CloudWatch registros.

Tipo de documento

Automação

Proprietário

Amazon

Plataformas

Linux, macOS, Windows

Parâmetros

IAMPermissões necessárias

O parâmetro AutomationAssumeRole requer as seguintes ações para usar o runbook com êxito.

  • cloudformation:CreateStack

  • cloudformation:CreateStack

  • cloudformation:DescribeStacks

  • cloudformation:DescribeStackEvents

  • cloudformation:DeleteStack

  • lambda:CreateFunction

  • lambda:DeleteFunction

  • lambda:InvokeFunction

  • lambda:GetFunction

  • lambda:TagResource

  • es:DescribeDomain

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSubnets

  • ec2:DescribeVpcs

  • ec2:DescribeNetworkInterfaces

  • ec2:CreateNetworkInterface

  • ec2:DescribeInstances

  • ec2:AttachNetworkInterface

  • ec2:DeleteNetworkInterface

  • logs:CreateLogGroup

  • logs:PutRetentionPolicy

  • logs:TagResource

  • states:CreateStateMachine

  • states:DeleteStateMachine

  • states:StartExecution

  • states:TagResource

  • states:DescribeStateMachine

  • states:DescribeExecution

  • iam:PassRole

  • iam:CreateRole

  • iam:DeleteRole

  • iam:GetRole

  • iam:PutRolePolicy

  • iam:DeleteRolePolicy

  • ssm:DescribeAutomationExecutions

  • ssm:GetAutomationExecution

O LambdaExecutionRole parâmetro requer as seguintes ações para usar o runbook com êxito:

  • es:ESHttpGet

  • ec2:CreateNetworkInterface

  • ec2:DescribeNetworkInterfaces

  • ec2:DeleteNetworkInterface

  • logs:CreateLogStream

  • logs:PutLogEvents

A função de execução do Lambda concede à função permissão para acessar AWS serviços e recursos exigidos por esse runbook. Para obter mais informações, consulte Função de execução do Lambda.

nota

Osec2:DescribeNetworkInterfaces,ec2:CreateNetworkInterface, e só ec2:DeleteNetworkInterface são necessários se seu cluster de OpenSearch serviços for VPCbaseado na Amazon para permitir que a função Lambda crie e gerencie as interfaces de VPC rede da Amazon. Para obter mais informações, consulte Conectando redes externas a recursos em uma função de execução da Amazon VPC e da Lambda.

Instruções

Siga estas etapas para configurar a automação:

  1. Navegue até AWSSupport- TroubleshootOpenSearchHigh CPU no AWS Systems Manager console.

  2. Selecione Execute automation (Executar automação).

  3. Você pode usar os seguintes parâmetros de entrada:

    • AutomationAssumeRole (Opcional):

      O Amazon Resource Name (ARN) da função AWS Identity and Access Management (IAM) que permite que o Systems Manager Automation execute as ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.

    • DomainName (Obrigatório):

      O nome do domínio do Amazon OpenSearch Service que você deseja solucionar para CPU problemas graves.

    • LambdaExecutionRoleForOpenSearch(Obrigatório):

      A ARN da IAM função a ser anexada à função Lambda. A função Lambda usa as credenciais dessa função para assinar solicitações no domínio do Amazon OpenSearch Service. Se o controle de acesso refinado estiver habilitado no domínio do Amazon OpenSearch Service, você deverá mapear essa função para uma função de back-end do OpenSearch Service Dashboards com uma permissão mínima de “cluster_monitor”.

    • DataRetentionDays (Opcional):

      O número de dias para reter os dados de diagnóstico coletados do domínio do Amazon OpenSearch Service. Por padrão, os dados são retidos por 24 horas (um dia). Você pode optar por reter os dados por no máximo 30 dias.

    • NumberOfDataSamples (Opcional):

      O número de amostras de dados a serem coletadas do domínio do Amazon OpenSearch Service. Por padrão, 5 amostras de dados são coletadas. Você pode coletar até 10 amostras e a função Lambda será invocada para cada coleta de amostras.

    Input parameters form for AWS Systems Manager Automation with fields for roles and settings.
  4. Se você ativou o controle de acesso refinado em um cluster de OpenSearch serviços, certifique-se de que o arn da LambdaExecutionRole função esteja mapeado para uma função com pelo menos permissão. cluster_monitor

    Cluster permissions section showing cluster_monitor permission granted.
    Backend roles interface showing an AWSIAM role for Lambda execution and options to remove or add roles.
  5. Selecione Executar.

  6. A automação é iniciada.

  7. O runbook de automação realiza as seguintes etapas:

    • checkConcurrency:

      Garante que haja apenas uma execução desse runbook visando o domínio especificado do Amazon OpenSearch Service. Se o runbook encontrar outra execução com o mesmo nome de domínio, ele retornará um erro e terminará.

    • getDomainConfig:

      Obtém os detalhes da configuração do domínio OpenSearch de serviço de destino.

    • provisionResources:

      Provisiona os recursos para coleta de dados usando AWS CloudFormation.

    • waitForStackCriação:

      Espera a conclusão da AWS CloudFormation pilha.

    • describeStackResources:

      Descreve a AWS CloudFormation pilha e obtém a ARN da máquina de estado.

    • runStateMachine:

      Invoca a função Lambda do coletor de dados uma ou mais vezes executando uma máquina de estado Step Functions.

    • describeErrorsFromStackEvents:

      Descreve os erros da AWS CloudFormation pilha em busca de erros.

    • unstageOpenSearchHighCPUAutomation:

      Exclui a AWSSupport-TroubleshootOpenSearchHighCPU AWS CloudFormation pilha.

    • describeErrorsFromStackDeletion:

      Descreve os erros encontrados ao excluir a AWS CloudFormation pilha.

    • finalStatus:

      Retorna a saída final do AWSSupport-TroubleshootOpenSearchHighCPU runbook.

  8. Depois de concluído, revise a seção Outputs para obter os resultados detalhados da execução.

    • finalStatus.FinalOutput:

      Fornece o grupo de CloudWatch registros em que os dados de diagnóstico são armazenados.

    Output message indicating hot thread data collection completed with log group details.

Referências

Automação do Systems Manager

AWS documentação de serviço