Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWSSupport-TroubleshootOpenSearchRedYellowCluster
Descripción
AWSSupport-TroubleshootOpenSearchRedYellowCluster
El manual de automatización se utiliza para identificar la causa del estado de salud de los clústeres rojos o amarillos y guiarlo para cambiar el clúster de nuevo a verde.
¿Cómo funciona?
El manual le AWSSupport-TroubleshootOpenSearchRedYellowCluster
ayuda a solucionar la causa del clúster rojo o amarillo y proporciona los siguientes pasos para resolver este problema mediante el análisis de la configuración del clúster y el uso de los recursos.
El manual de ejecución lleva a cabo los siguientes pasos:
-
Llama a la DescribeDomainAPI en el dominio de destino para obtener la configuración del clúster.
-
Comprueba si el dominio del OpenSearch servicio está basado en Internet (público) o en Amazon Virtual Private Cloud (VPC).
-
Crea una función pública o basada en Amazon VPC en AWS Lambda función de la configuración del clúster. Nota: La función Lambda contiene el código de solución de problemas que ejecuta el OpenSearch Servicio en APIs el clúster para determinar por qué el clúster está en estado rojo o amarillo.
-
Elimina la función Lambda.
-
Muestra las comprobaciones realizadas y los siguientes pasos recomendados para resolver el problema del clúster rojo o amarillo.
Tipo de documento
Automatización
Propietario
Amazon
Plataformas
Linux, macOS, Windows
Parámetros
Permisos de IAM necesarios
El parámetro AutomationAssumeRole
requiere las siguientes acciones para utilizar el manual de procedimientos correctamente.
-
cloudformation:CreateStack
-
cloudformation:DescribeStacks
-
cloudformation:DescribeStackEvents
-
cloudformation:DeleteStack
-
lambda:CreateFunction
-
lambda:DeleteFunction
-
lambda:InvokeFunction
-
lambda:GetFunction
-
es:DescribeDomain
-
es:DescribeDomainConfig
-
ec2:DescribeSecurityGroups
-
ec2:DescribeSubnets
-
ec2:DescribeVpcs
-
ec2:DescribeNetworkInterfaces
-
ec2:CreateNetworkInterface
-
ec2:DeleteNetworkInterface
-
ec2:DescribeInstances
-
ec2:AttachNetworkInterface
-
cloudwatch:GetMetricData
-
iam:PassRole
El LambdaExecutionRole
parámetro requiere las siguientes acciones para utilizar correctamente el runbook:
-
es:ESHttpGet
-
ec2:CreateNetworkInterface
-
ec2:DescribeNetworkInterfaces
-
ec2:DeleteNetworkInterface
Descripción general de la LambdaExecutionRole
política:
A continuación, se muestra un ejemplo del rol de ejecución de una función Lambda (rol AWS Identity and Access Management (IAM)) que otorga a la función permiso para acceder a los AWS servicios y recursos que requiere este manual. Para obtener más información, consulte Rol de ejecución de Lambda.
nota
Los ec2:DescribeNetworkInterfaces
ec2:CreateNetworkInterface
, y solo ec2:DeleteNetworkInterface
son necesarios si el clúster de OpenSearch servicio está basado en Amazon VPC para permitir que la función Lambda cree y gestione las interfaces de red de Amazon VPC. Para obtener más información, consulte Conexión de redes salientes a recursos en una función de ejecución de Amazon VPC y Lambda.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "es:ESHttpGet", "Resource": [ "arn:<partition>:es:<region>:<account-id>:domain/<domain-name>/", "arn:<partition>:es:<region>:<account-id>:domain/<domain-name>/_cluster/health", "arn:<partition>:es:<region>:<account-id>:domain/<domain-name>/_cat/indices", "arn:<partition>:es:<region>:<account-id>:domain/<domain-name>/_cat/allocation", "arn:<partition>:es:<region>:<account-id>:domain/<domain-name>/_cluster/allocation/explain" ] }, { "Condition": { "ArnLikeIfExists": { "ec2:Vpc": "arn:<partition>:ec2:<region>:<account-id>:vpc/<vpc_id>" } }, "Action": [ "ec2:DeleteNetworkInterface", "ec2:CreateNetworkInterface", "ec2:DescribeNetworkInterfaces", "ec2:UnassignPrivateIpAddresses", "ec2:AssignPrivateIpAddresses" ], "Resource": "*", "Effect": "Allow" } ] }
Instrucciones
Siga estos pasos para configurar la automatización:
-
Navegue hasta la consola AWSSupport-TroubleshootOpenSearchRedYellowCluster
. AWS Systems Manager -
Elija Execute automation (Ejecutar automatización).
-
Para los parámetros de entrada, introduzca lo siguiente:
-
AutomationAssumeRole (Opcional):
El nombre del recurso de Amazon (ARN) del rol AWS Identity and Access Management (IAM) que permite a Systems Manager Automation realizar las acciones en su nombre. Si no se especifica ningún rol, Systems Manager Automation utiliza los permisos del usuario que comienza este manual de procedimientos.
-
LambdaExecutionRole (Obligatorio):
El ARN de la función de IAM que Lambda utilizará para firmar las solicitudes a tu clúster de Amazon Service. OpenSearch
-
DomainName (Obligatorio):
El nombre del dominio del OpenSearch servicio con el estado de salud del clúster en rojo o amarillo.
-
UtilizationThreshold (Opcional):
El porcentaje del umbral de utilización utilizado para comparar las métricas CPUUtilization y las de JVMMemory presión. El valor predeterminado es 80.
-
-
Si ha habilitado un control de acceso detallado en un clúster de OpenSearch servicios, asegúrese de que el
LambdaExecutionRole
rol arn esté asignado a un rol con al menos permiso.cluster_monitor
-
Seleccione Ejecutar.
-
Se inicia la automatización.
-
El manual de procedimientos de automatización realiza los siguientes pasos:
-
GetClusterConfiguration:
Obtiene la configuración del clúster de servicios. OpenSearch
-
Crea AWSLambdaFunctionStack:
Crea una función Lambda temporal en su cuenta mediante. AWS CloudFormation La función Lambda se utiliza para ejecutar el OpenSearch servicio. APIs
-
WaitForAWSLambdaFunctionStack:
Espera a que se complete la CloudFormation pila.
-
GetClusterMetricsFromCloudWatch:
Obtiene las métricas relacionadas con los clústeres OpenSearch de Amazon CloudWatch ClusterStatus y JVMMemory Pressure Service y su fecha de creación. CPUUtilization
-
RunOpenSearchAPIs:
Utiliza la función Lambda para llamar al OpenSearch Servicio APIs y analizar los datos de las métricas del clúster para diagnosticar la causa del estado rojo o amarillo del clúster.
-
Eliminar AWSLambdaFunctionStack:
Elimina la función Lambda creada por esta automatización en su cuenta.
-
-
Una vez finalizada, consulte la sección de resultados para ver los resultados detallados de la ejecución.
-
RootCause:
Proporciona una descripción general de la causa identificada por la que el estado del clúster está en rojo o amarillo.
-
IssueDescription:
Proporciona detalles sobre por qué el clúster está en estado rojo o amarillo y las posibles medidas para devolverlo al estado verde.
-
Referencias
Automatización de Systems Manager
AWS documentación de servicio
-
Consulta Solución de problemas de Amazon OpenSearch Service para obtener más información