Solução de problemas do Systems Manager Automation - AWS Systems Manager

Solução de problemas do Systems Manager Automation

Use as informações a seguir para ajudar você a solucionar problemas com o AWS Systems Manager Automation, um recurso do AWS Systems Manager. Este tópico inclui tarefas específicas para resolver problemas com base em mensagens de erro de Automação.

Erros comuns de automação

Esta seção inclui informações sobre erros comuns de Automação.

VPC não definida 400

Por padrão, quando o Automation executa o runbook AWS-UpdateLinuxAmi ou AWS-UpdateWindowsAmi, o sistema cria uma instância temporária na VPC padrão (172.30.0.0/16). Se tiver excluído a VPC padrão, você receberá o seguinte erro:

VPC not defined 400

Para resolver esse problema, você deve especificar um valor para o parâmetro de entrada SubnetId.

Falha ao iniciar a execução da automação

Uma automação pode apresentar falhas com um erro de acesso negado ou um erro de perfil assumido inválido, se você não tiver configurado corretamente as políticas e os perfis do AWS Identity and Access Management (IAM) para o Automation.

Acesso negado

Os exemplos a seguir descrevem situações em que uma automação não foi iniciada, sinalizando um erro de acesso negado.

Acesso negado à API do Systems Manager

A mensagem de erro: User: user arn isn't authorized to perform: ssm:StartAutomationExecution on resource: document arn (Service: AWSSimpleSystemsManagement; Status Code: 400; Error Code: AccessDeniedException; Request ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)

  • Causa possível 1: o usuário que está tentando iniciar a automação não tem permissões para invocar a API StartAutomationExecution. Para resolver esse problema, anexe a política do IAM requerida ao usuário que foi usado para iniciar a automação.

  • Causa possível 2: o usuário que está tentando iniciar a automação tem permissões para invocar a API StartAutomationExecution, mas não tem permissões para invocar a API usando o runbook específico. Para resolver esse problema, anexe a política do IAM requerida ao usuário que foi usado para iniciar a automação.

Acesso negado por ausência de permissões PassRole

A mensagem de erro: User: user arn isn't authorized to perform: iam:PassRole on resource: automation assume role arn (Service: AWSSimpleSystemsManagement; Status Code: 400; Error Code: AccessDeniedException; Request ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)

O usuário que está tentando iniciar a automação não tem permissões PassRole para assumir o perfil. Para resolver esse problema, anexe a política iam:PassRole ao perfil do usuário que está tentando iniciar a automação. Para ter mais informações, consulte Tarefa 2: Anexar a política iam:PassRole à função de automação.

Função assumida inválida

Quando você executa um Automation, uma função assumida é fornecida no runbook ou transmitida como um valor de parâmetro para o runbook. Diferentes tipos de erros poderão ocorrer se a função assumida não for especificada ou configurada corretamente.

Função de admissão malformada

Mensagem de erro: The format of the supplied assume role ARN isn't valid. A função de admissão está mal formatada. Para resolver esse problema, verifique se uma função assumida válida está especificada no seu runbook ou como um parâmetro em runtime ao executar a automação.

Não é possível assumir o perfil assumido

A mensagem de erro: The defined assume role is unable to be assumed. (Service: AWSSimpleSystemsManagement; Status Code: 400; Error Code: InvalidAutomationExecutionParametersException; Request ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)

  • Causa possível 1: a função assumida não existe. Para resolver esse problema, crie a função. Para ter mais informações, consulte Configurar a automação. Detalhes específicos para a criação dessa função estão descritos no seguinte tópico, Tarefa 1: Criar uma função de serviço para a automação.

  • Causa possível 2: a função assumida não possui uma relação de confiança com o serviço do Systems Manager. Para resolver esse problema, crie a relação de confiança. Para obter mais informações, consulte Não consigo assumir uma função no Manual do usuário do IAM.

Execução iniciada, mas o status falhou

Falhas específicas da ação

Runbooks contêm etapas e elas são executadas em ordem. Cada etapa invoca uma ou mais APIs de Serviço da AWS. Essas APIs determinam as entradas, o comportamento e as saídas da etapa. Há vários locais em que um erro pode causar uma falha na etapa. As mensagens de falha indicam quando e onde um erro ocorreu.

Para ver uma mensagem de falha no console do Amazon Elastic Compute Cloud (Amazon EC2), escolha o link View Outputs (Exibir resultados) da etapa com falha. Para ver uma mensagem de falha da AWS CLI, chame get-automation-execution e procure o atributo FailureMessage em um StepExecution com falha.

Nos exemplos a seguir, uma etapa associada à ação aws:runInstance falhou. Cada exemplo explora um tipo diferente de erro.

Imagem ausente

A mensagem de erro: Automation Step Execution fails when it's launching the instance(s). Get Exception from RunInstances API of ec2 Service. Exception Message from RunInstances API: [The image id '[ami id]' doesn't exist (Service: AmazonEC2; Status Code: 400; Error Code: InvalidAMIID.NotFound; Request ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)]. Please refer to Automation Service Troubleshooting Guide for more diagnosis details.

A ação aws:runInstances recebeu uma entrada para um ImageId que não existe. Para resolver esse problema, atualize o runbook ou os valores de parâmetros com o ID correto da AMI.

A política do perfil assumido não tem permissões suficientes

A mensagem de erro: Automation Step Execution fails when it's launching the instance(s). Get Exception from RunInstances API of ec2 Service. Exception Message from RunInstances API: [You aren't authorized to perform this operation. Encoded authorization failure message: xxxxxxx (Service: AmazonEC2; Status Code: 403; Error Code: UnauthorizedOperation; Request ID: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)]. Please refer to Automation Service Troubleshooting Guide for more diagnosis details.

A função de assunção não tem permissão suficiente para invocar a API RunInstances em instâncias do EC2. Para resolver esse problema, anexe uma política do IAM à função assumida que tenha permissão para invocar a API RunInstances. Para obter mais informações, consulte Criar perfis de serviço para o Automation usando o console.

Estado inesperado

A mensagem de erro: Step fails when it's verifying launched instance(s) are ready to be used. Instance i-xxxxxxxxx entered unexpected state: shutting-down. Please refer to Automation Service Troubleshooting Guide for more diagnosis details.

  • Causa possível 1: há um problema com a instância ou o serviço do Amazon EC2. Para resolver esse problema, faça login na instância ou revise o log do sistema da instância para entender por que ela iniciou o desligamento.

  • Causa possível 2: o script de dados do usuário especificado para a ação aws:runInstances tem um problema ou uma sintaxe incorreta. Verifique a sintaxe do script de dados do usuário. Além disso, verifique se os scripts de dados do usuário não desligam a instância ou invocam outros scripts que desligam a instância.

Referência a falhas específicas de ação

Quando uma etapa falha, a mensagem de falha pode indicar qual serviço foi invocado quando a falha ocorreu. A tabela a seguir lista os serviços invocados por cada ação. Ela também fornece links para obter informações sobre cada serviço.

Ação Serviços da AWS invocados por essa ação Para obter informações sobre este serviço Solucionar problemas de conteúdo

aws:runInstances

Amazon EC2

Guia do usuário do Amazon EC2

Solucionar problemas com instâncias do EC2

aws:changeInstanceState

Amazon EC2

Guia do usuário do Amazon EC2

Solucionar problemas com instâncias do EC2

aws:runCommand

Systems Manager

AWS Systems Manager Run Command

Solução de problemas do Run Commando do Systems Manager

aws:createImage

Amazon EC2

Amazon Machine Images

aws:createStack

AWS CloudFormation

Guia do UsuárioAWS CloudFormation

Resolução de problemasAWS CloudFormation

aws:deleteStack

AWS CloudFormation

Guia do UsuárioAWS CloudFormation

Resolução de problemasAWS CloudFormation

aws:deleteImage

Amazon EC2

Imagens de máquina da Amazon

aws:copyImage

Amazon EC2

Amazon Machine Images

aws:createTag

Amazon EC2, Systems Manager

Recurso e etiquetas do EC2

aws:invokeLambdaFunction

AWS Lambda

AWS Lambda Guia do desenvolvedor

Solução de problemas do Lambda

Erro interno do serviço de automação

A mensagem de erro: Internal Server Error. Please refer to Automation Service Troubleshooting Guide for more diagnosis details.

Um problema com o serviço Automation está impedindo que o runbook especificado seja executado corretamente. Para resolver esse problema, entre em contato com o AWS Support. Forneça o ID de execução e o ID de cliente, se disponíveis.

Execução iniciada, mas tempo limite atingido

A mensagem de erro: Step timed out while step is verifying launched instance(s) are ready to be used. Please refer to Automation Service Troubleshooting Guide for more diagnosis details.

Uma etapa na ação aws:runInstances atingiu o tempo limite. Isso pode acontecer se a ação da etapa demorar mais para ser executada do que o valor especificado para timeoutSeconds na etapa. Para resolver esse problema, especifique um valor mais longo para o parâmetro timeoutSeconds da ação aws:runInstances. Se isso não resolver o problema, investigue por que a etapa demora mais para ser executada do que o esperado