Résolution d'un délai d'expiration de mise à jour du cluster en cas cfn-hup d'inexécution - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution d'un délai d'expiration de mise à jour du cluster en cas cfn-hup d'inexécution

L'cfn-hupassistant est un démon qui détecte les modifications apportées aux métadonnées des ressources et exécute les actions spécifiées par l'utilisateur lorsqu'une modification est détectée. C'est ainsi que vous pouvez effectuer des mises à jour de configuration sur vos EC2 instances Amazon en cours d'exécution par le biais de cette UpdateStack API action.

Actuellement, le cfn-hup daemon est lancé par lesupervisord. Mais après le lancement, le cfn-hup processus est déconnecté du supervisord contrôle. Si le cfn-hup démon est tué par un acteur externe, il ne redémarre pas automatiquement. S'il cfn-hup n'est pas en cours d'exécution, lors d'une mise à jour du cluster, la CloudFormation pile lance le processus de mise à jour comme prévu, mais la procédure de mise à jour n'est pas activée sur le nœud principal et la pile finit par atteindre un délai d'expiration. Dans les journaux du cluster/var/log/chef-client, vous pouvez voir que la recette de mise à jour n'est jamais invoquée.

Vérifiez et redémarrez cfn-hup en cas de panne

  1. Sur le nœud principal, vérifiez s'il cfn-hup est en cours d'exécution :

    $ ps aux | grep cfn-hup
  2. Vérifiez cfn-hup le journal /var/log/cfn-hup.log et /var/log/supervisord.log le nœud principal.

  3. S'il cfn-hup n'est pas en cours d'exécution, essayez de le redémarrer en exécutant :

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup