Tentando atualizar um cluster - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tentando atualizar um cluster

A seção a seguir fornece possíveis soluções de problemas que podem ocorrer ao tentar atualizar um cluster.

O comando pcluster update-cluster falha ao ser executado localmente

Verifique o ~/.parallelcluster/pcluster-cli.log em seu sistema de arquivos local para ver os detalhes da falha.

Ver clusterStatus é UPDATE_FAILED com comando pcluster describe-cluster

Se a atualização da pilha de clusters for revertida, verifique os detalhes do erro no arquivo /var/log/chef-client.logs.

Verifique se seu problema foi mencionado em Problemas GitHub conhecidos em AWS ParallelCluster em GitHub.

A atualização do cluster atingiu o tempo limite

Isso pode ser um problema relacionado ao cfn-hup não sendo executado. Se o daemon cfn-hup for encerrado por uma causa externa, ele não será reiniciado automaticamente. Se cfn-hup não estiver em execução, durante uma atualização do cluster, a CloudFormation pilha inicia o processo de atualização conforme o esperado, mas o procedimento de atualização não é ativado no nó principal e a implantação da pilha eventualmente expira. Para obter mais informações, consulte Solução de problemas de tempo limite de atualização de cluster quando cfn-hup não está em execução para solucionar o problema e corrigir o problema.