Slurmprolog 與 epilog - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Slurmprologepilog

從 AWS ParallelCluster 版本 3.6.0 開始,部署的Slurm組態包 AWS ParallelCluster 括PrologEpilog組態參數:

# PROLOG AND EPILOG Prolog=/opt/slurm/etc/scripts/prolog.d/* Epilog=/opt/slurm/etc/scripts/epilog.d/* SchedulerParameters=nohold_on_prolog_fail BatchStartTimeout=180

有關更多信息,請參閱文檔中的 Prolog 和 Epilog 指南。Slurm

AWS ParallelCluster 包括以下序言和 epilog 腳本:

  • 90_plcuster_health_check_manager(在Prolog文件夾中)

  • 90_pcluster_noop(在Epilog文件夾中)

注意

Prolog和資Epilog料夾必須至少包含一個檔案。

您可以通過將自己的自定義prologepilog腳本添加到相應的PrologEpilog文件夾中來使用它們。

警告

Slurm以相反的字母順序執行資料夾中的每個指令碼。

prologepilog指令碼的執行時間持續時間會影響執行工作所需的時間。執行多個或長時間執行的prolog指令碼時,請更新BatchStartTimeout組態設定。預設值為 3 分鐘。

如果您使用的是自訂prologepilog指令碼,請在相應的PrologEpilog資料夾中找出指令碼。建議您保留在每個自訂90_plcuster_health_check_manager指令碼之前執行的指令碼。如需更多詳細資訊,請參閱 Slurm組態自訂