Slurmprolog および epilog - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Slurmprolog および epilog

AWS ParallelCluster バージョン 3.6.0 以降、 で AWS ParallelCluster デプロイされるSlurm設定には、 Prologおよび Epilog設定パラメータが含まれています。

# PROLOG AND EPILOG Prolog=/opt/slurm/etc/scripts/prolog.d/* Epilog=/opt/slurm/etc/scripts/epilog.d/* SchedulerParameters=nohold_on_prolog_fail BatchStartTimeout=180

詳細については、Slurm ドキュメントの「Prolog and Epilog Guide」を参照してください。

AWS ParallelCluster には、次の prolog スクリプトと epilog スクリプトが含まれています。

  • 90_plcuster_health_check_manager (Prolog フォルダ内)

  • 90_pcluster_noop (Epilog フォルダ内)

注記

Prolog および Epilog フォルダの両方に、少なくとも 1 つのファイルが含まれている必要があります。

独自のカスタム prolog または epilog スクリプトを対応する Prolog および Epilog フォルダに追加して使用できます。

警告

Slurm はフォルダ内のすべてのスクリプトをアルファベットの降順で実行します。

prolog および epilog スクリプトの実行時間は、ジョブの実行に必要な時間に影響します。複数または長時間実行される prolog スクリプトを実行する場合は、BatchStartTimeout 設定を更新します。デフォルトは 3 分です。

カスタム prologepilog スクリプトを使用している場合は、それぞれの Prolog および Epilog フォルダでスクリプトを見つけます。すべてのカスタムスクリプトの前に実行される 90_plcuster_health_check_manager スクリプトを実行し続けることを推奨します。詳細については、「Slurm 設定のカスタマイズ」を参照してください。