AWSSupport-TroubleshootOpenSearchHighCPU - AWS Systems Manager Referencia del manual de automatización

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWSSupport-TroubleshootOpenSearchHighCPU

Descripción

El AWSSupport-TroubleshootOpenSearchHighCPU manual proporciona una solución automatizada para recopilar datos de diagnóstico de un dominio de Amazon OpenSearch Service para solucionar problemas graves. CPU

¿Cómo funciona?

El AWSSupport-TroubleshootOpenSearchHighCPU manual ayuda a solucionar problemas de alta CPU utilización en el dominio de Amazon OpenSearch Service.

El manual lleva a cabo los siguientes pasos:

  • Lo ejecuta DescribeDomainAPIen el dominio de Amazon OpenSearch Service proporcionado para obtener los metadatos del clúster.

  • Comprueba si el dominio de Amazon OpenSearch Service es público o está VPC basado en Amazon y, con la ayuda de AWS CloudFormation, crea una AWS Lambda función pública o VPCbasada en Amazon.

  • La función Lambda obtiene datos de diagnóstico de los dominios de Amazon OpenSearch Service.

  • Utiliza una máquina de AWS Step Functions estados para organizar múltiples ejecuciones de funciones Lambda a fin de recopilar datos más completos.

  • De forma predeterminada, almacena los datos recopilados en un grupo de CloudWatch registros de Amazon durante 24 horas.

  • Elimina los recursos creados, excepto el grupo de CloudWatch registros.

Tipo de documento

Automatización

Propietario

Amazon

Plataformas

Linux, macOS, Windows

Parámetros

Permisos necesarios IAM

El parámetro AutomationAssumeRole requiere las siguientes acciones para utilizar el manual de procedimientos correctamente.

  • cloudformation:CreateStack

  • cloudformation:CreateStack

  • cloudformation:DescribeStacks

  • cloudformation:DescribeStackEvents

  • cloudformation:DeleteStack

  • lambda:CreateFunction

  • lambda:DeleteFunction

  • lambda:InvokeFunction

  • lambda:GetFunction

  • lambda:TagResource

  • es:DescribeDomain

  • ec2:DescribeSecurityGroups

  • ec2:DescribeSubnets

  • ec2:DescribeVpcs

  • ec2:DescribeNetworkInterfaces

  • ec2:CreateNetworkInterface

  • ec2:DescribeInstances

  • ec2:AttachNetworkInterface

  • ec2:DeleteNetworkInterface

  • logs:CreateLogGroup

  • logs:PutRetentionPolicy

  • logs:TagResource

  • states:CreateStateMachine

  • states:DeleteStateMachine

  • states:StartExecution

  • states:TagResource

  • states:DescribeStateMachine

  • states:DescribeExecution

  • iam:PassRole

  • iam:CreateRole

  • iam:DeleteRole

  • iam:GetRole

  • iam:PutRolePolicy

  • iam:DeleteRolePolicy

  • ssm:DescribeAutomationExecutions

  • ssm:GetAutomationExecution

El LambdaExecutionRole parámetro requiere las siguientes acciones para utilizar correctamente el runbook:

  • es:ESHttpGet

  • ec2:CreateNetworkInterface

  • ec2:DescribeNetworkInterfaces

  • ec2:DeleteNetworkInterface

  • logs:CreateLogStream

  • logs:PutLogEvents

La función de ejecución de Lambda otorga a la función permiso para acceder a AWS los servicios y recursos que requiere este manual. Para obtener más información, consulte Rol de ejecución de Lambda.

nota

Los ec2:DescribeNetworkInterfacesec2:CreateNetworkInterface, y solo ec2:DeleteNetworkInterface son necesarios si el clúster de OpenSearch servicios está VPCbasado en Amazon para permitir que la función Lambda cree y gestione las interfaces de VPC red de Amazon. Para obtener más información, consulte Conectar redes salientes a recursos en una función de ejecución de Amazon VPC y Lambda.

Instrucciones

Siga estos pasos para configurar la automatización:

  1. Navegue hasta el AWSSupport- TroubleshootOpenSearchHigh CPU en la AWS Systems Manager consola.

  2. Elija Execute automation (Ejecutar automatización).

  3. Para los parámetros de entrada, introduzca lo siguiente:

    • AutomationAssumeRole (Opcional):

      El nombre del recurso de Amazon (ARN) de la función AWS Identity and Access Management (IAM) que permite a Systems Manager Automation realizar las acciones en su nombre. Si no se especifica ningún rol, Systems Manager Automation utiliza los permisos del usuario que comienza este manual de procedimientos.

    • DomainName (Obligatorio):

      El nombre del dominio de Amazon OpenSearch Service del que quieres solucionar CPU problemas graves.

    • LambdaExecutionRoleForOpenSearch(Obligatorio):

      El ARN IAM rol que se va a asociar a la función Lambda. La función Lambda usa las credenciales de este rol para firmar las solicitudes al dominio de Amazon OpenSearch Service. Si el control de acceso detallado está habilitado en el dominio de Amazon OpenSearch Service, debes asignar este rol a un rol de backend de OpenSearch Service Dashboards con un permiso mínimo de «cluster_monitor».

    • DataRetentionDays (Opcional):

      El número de días que se conservarán los datos de diagnóstico recopilados del dominio de Amazon OpenSearch Service. De forma predeterminada, los datos se conservan durante 24 horas (un día). Puede optar por conservar los datos durante un máximo de 30 días.

    • NumberOfDataSamples (Opcional):

      El número de muestras de datos que se van a recopilar del dominio OpenSearch de Amazon Service. De forma predeterminada, se recopilan 5 muestras de datos. Puede recopilar hasta 10 muestras y se invocará la función Lambda para cada colección de muestras.

    Input parameters form for AWS Systems Manager Automation with fields for roles and settings.
  4. Si ha habilitado un control de acceso detallado en un clúster de OpenSearch servicios, asegúrese de que el LambdaExecutionRole rol arn esté asignado a un rol con al menos permiso. cluster_monitor

    Clúster permissions section showing cluster_monitor permission granted.
    Backend roles interface showing an AWSIAM role for Lambda execution and options to remove or add roles.
  5. Seleccione Ejecutar.

  6. Se inicia la automatización.

  7. El manual de procedimientos de automatización realiza los siguientes pasos:

    • checkConcurrency:

      Garantiza que solo haya una ejecución de este runbook dirigida al dominio de Amazon OpenSearch Service especificado. Si el runbook encuentra otra ejecución dirigida al mismo nombre de dominio, devuelve un error y finaliza.

    • getDomainConfig:

      Obtiene los detalles de configuración del dominio de OpenSearch servicio de destino.

    • provisionResources:

      Aprovisiona los recursos para la recopilación de datos mediante AWS CloudFormation.

    • waitForStackCreación:

      Espera a que se complete la AWS CloudFormation pila.

    • describeStackResources:

      Describe la AWS CloudFormation pila y obtiene la ARN de la máquina de estados.

    • runStateMachine:

      Invoca la función Lambda del recopilador de datos una o más veces mediante la ejecución de una máquina de estados Step Functions.

    • describeErrorsFromStackEvents:

      Describe los errores de la AWS CloudFormation pila de errores.

    • unstageOpenSearchHighCPUAutomation:

      Elimina la AWSSupport-TroubleshootOpenSearchHighCPU AWS CloudFormation pila.

    • describeErrorsFromStackDeletion:

      Describe los errores encontrados al eliminar la AWS CloudFormation pila.

    • finalStatus:

      Devuelve el resultado final del AWSSupport-TroubleshootOpenSearchHighCPU runbook.

  8. Una vez finalizada, consulte la sección de resultados para ver los resultados detallados de la ejecución.

    • finalStatus.FinalOutput:

      Proporciona el grupo de CloudWatch registros en el que se almacenan los datos de diagnóstico.

    Output message indicating hot thread data collection completed with log group details.

Referencias

Automatización de Systems Manager

AWS documentación de servicio