Problembehandlung bei einem Timeout für ein Cluster-Update, wenn es cfn-hup nicht läuft - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Problembehandlung bei einem Timeout für ein Cluster-Update, wenn es cfn-hup nicht läuft

Der cfn-hup Helper ist ein Daemon, der Änderungen an Ressourcenmetadaten erkennt und benutzerdefinierte Aktionen ausführt, wenn eine Änderung erkannt wird. So nehmen Sie über die UpdateStack API Aktion Konfigurationsupdates auf Ihren laufenden EC2 Amazon-Instances vor.

Derzeit wird der cfn-hup Daemon von der supervisord gestartet. Nach dem Start entzieht sich der cfn-hup Prozess jedoch der supervisord Kontrolle. Wenn der cfn-hup Dämon von einem externen Akteur getötet wird, wird er nicht automatisch neu gestartet. Wenn es cfn-hup nicht läuft, startet der CloudFormation Stack während eines Cluster-Updates den Aktualisierungsvorgang wie erwartet, aber das Aktualisierungsverfahren ist auf dem Hauptknoten nicht aktiviert und der Stack erreicht irgendwann ein Timeout. Den Clusterprotokollen können Sie entnehmen/var/log/chef-client, dass das Aktualisierungsrezept nie aufgerufen wird.

Überprüfen Sie die Prüfung und starten Sie cfn-hup sie neu, falls Fehler auftreten

  1. Überprüfen Sie auf dem Hauptknoten, ob cfn-hup Folgendes läuft:

    $ ps aux | grep cfn-hup
  2. Überprüfen Sie das cfn-hup Protokoll /var/log/cfn-hup.log und /var/log/supervisord.log auf dem Hauptknoten.

  3. Wenn es cfn-hup nicht läuft, versuchen Sie es neu zu starten, indem Sie Folgendes ausführen:

    $ sudo /opt/parallelcluster/pyenv/versions/cookbook_virtualenv/bin/supervisorctl start cfn-hup