嘗試更新叢集 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

嘗試更新叢集

下一節提供故障診斷解決方案,解決您嘗試更新叢集時可能發生的問題。

pcluster update-cluster 命令無法在本機執行

如需失敗詳細資訊~/.parallelcluster/pcluster-cli.log,請參閱本機檔案系統中的 。

看到 clusterStatusUPDATE_FAILED具有 pcluster describe-cluster命令

如果叢集堆疊更新復原,請檢查 /var/log/chef-client.logs 檔案以取得錯誤詳細資訊。

檢查 上的GitHub 已知問題中是否提及您的問題 AWS ParallelCluster GitHub。

叢集更新逾時

這可能是與cfn-hup未執行有關的問題。如果cfn-hup魔族被外部原因終止,則不會自動重新啟動。如果 cfn-hup 未執行,則在叢集更新期間, CloudFormation 堆疊會如預期啟動更新程序,但不會在主機節點上啟用更新程序,且堆疊部署最終會逾時。如需詳細資訊,請參閱 對cfn-hup未執行的叢集更新逾時進行故障診斷以疑難排解並從問題中復原。