

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# PCS の Slurm AWS バージョンのリリースノート
<a name="slurm-versions_release-notes"></a>

このトピックでは、 AWS PCS で現在サポートされている Slurm バージョンごとの重要な変更について説明します。クラスターをアップグレードするときは、古いバージョンと新しいバージョンの変更を確認することをお勧めします。

## Slurm 25.11
<a name="slurm-versions_release-notes_25.11"></a>

**PCS AWS で実装された変更**
+ スケジューラの監査ログは、`PCS_SCHEDULER_AUDIT_LOGS`ログタイプを通じて個別に配信されるようになりました。これにより、ログ配信を独立して制御してトラブルシューティングと監査を簡素化できます。詳細については、[「AWS PCS のスケジューラ監査ログ](https://docs.aws.amazon.com/pcs/latest/userguide/monitoring_scheduler-audit-logs.html)」を参照してください。
+ 迅速再キューはデフォルトで有効になっています。ノードの問題 (容量不足エラーなど) が原因で失敗したジョブは、 を使用してスケジューリングの優先度が最も高いジョブを再キューに入れることができます`sbatch --requeue=expedite`。これは `SchedulerParameters=enable_expedited_requeue` 設定によって制御されます。
+ `requeue_delay` パラメータは、デフォルトが 5 秒のカスタムクラスター設定として使用できます。以前は、再キューの遅延は認証情報の有効期限 (70 秒) に関連していました。管理者は、 を介してこれを個別に設定できるようになりました`SchedulerParameters=requeue_delay=<seconds>`。
+ `HealthCheckNodeState` は `START_ONLY`値をサポートするようになりました。この値は、ノードの起動時 (slurmd start) にのみヘルスチェックプログラムを実行します。
+ `CommunicationParameters=disable_http` は、Slurm 25.11 で導入された HTTP エンドポイント (メトリクスとヘルスプローブ) を無効にするようにデフォルトで設定されています。これらのエンドポイントを再度有効にするには、 を設定します`CommunicationParameters=enable_http`。詳細については、[「AWS PCS の Slurm メトリクス](https://docs.aws.amazon.com/pcs/latest/userguide/slurm-metrics.html)」を参照してください。

**既知の問題**
+ Slurm 25.11 `AccountingStorageEnforce=QOS`は、 が設定されていない場合でも、 `AllowQOS`と`DenyQOS`パーティションの設定を検証します。`AllowQOS` または で参照されている QOS `DenyQOS`が Slurm アカウンティングデータベースに存在しない場合、 は致命的なエラーで`slurmctld`終了します。Slurm 25.11 にアップグレードまたは再起動する前に、パーティション`AllowQOS`と`DenyQOS`設定にリストされているすべての QOS 値がアカウンティングデータベースに存在することを確認してください。
+ `slurmd` ログにはエラーメッセージ が表示される場合があります`error: cannot create url_parser context for http_parser/libhttp_parser`。これは、 が設定されている場合でも発生する既知の Slurm の問題`CommunicationParameters=disable_http`です。エラーは安全に無視でき、クラスターオペレーションには影響しません。

Slurm 25.11 の詳細については、以下の出版物を参照してください。
+ SchedMD リリースのお知らせ: [https://www.schedmd.com/slurm-version-25-11-0-is-now-available/](https://www.schedmd.com/slurm-version-25-11-0-is-now-available/)
+ SchedMD リリースノート: [https://github.com/SchedMD/slurm/blob/slurm-25.11/RELEASE\_NOTES.md](https://github.com/SchedMD/slurm/blob/slurm-25.11/RELEASE_NOTES.md)

## Slurm 25.05
<a name="slurm-versions_release-notes_25.05"></a>

**PCS AWS で実装された変更**
+ Slurm requeue\_on\_resume\_failure SchedulerParameter がデフォルトで有効になりました。
+ 「stderr」は、Slurm 25.05 で無効になっているため、LogTimeFormat のオプションとして削除されました。
+ AWS PCS はマルチクラスターのサック設定をサポートしています。ログインノードは複数のクラスターにアクセスできます。

Slurm 25.05 の詳細については、以下の出版物を参照してください。
+ SchedMD リリースのお知らせ: [https://www.schedmd.com/slurm-version-25-05-0-is-now-available/](https://www.schedmd.com/slurm-version-25-05-0-is-now-available/)
+ SchedMD リリースノート: [https://github.com/SchedMD/slurm/blob/slurm-25-05-0-1/RELEASE\_NOTES.md](https://github.com/SchedMD/slurm/blob/slurm-25-05-0-1/RELEASE_NOTES.md)

## Slurm 24.11
<a name="slurm-versions_release-notes_24.11"></a>

**PCS AWS で実装された変更**
+ AWS PCS は Slurm アカウンティングをサポートしています。詳細については、「[PCS での Slurm AWS アカウンティング](slurm-accounting.md)」を参照してください。

Slurm 24.11 の詳細については、以下の出版物を参照してください。
+ [SchedMD リリースのお知らせ](https://www.schedmd.com/slurm-version-24-11-0-is-now-available/)
+ [SchedMD リリースノート](https://github.com/SchedMD/slurm/blob/slurm-24-11-0-1/RELEASE_NOTES)

## Slurm 24.05
<a name="slurm-versions_release-notes_24.05"></a>

**PCS AWS で実装される変更**
+ 新しい Slurm Step Manager モジュールが PCS AWS でデフォルトで有効になりました。このモジュールでは、ステップ管理を中央コントローラーからコンピューティングノードにオフロードすることで、ステップ使用率が高い環境でのシステム同時実行を大幅に改善することで、大きなメリットが得られます。この設定をサポートし、分離`Prolog`と`Epilog`プロセスの実行を改善するために、新しいプロログフラグ (`Contain`、`Alloc`) が有効になっています。
+ コントローラーからコンピューティングノードへの階層通信を有効にすると、Slurm ノード内通信を最適化できるため、スケーラビリティとパフォーマンスが向上します。さらに、ルーティング設定では、プラグインのデフォルトのルーティングアルゴリズムではなく、コントローラーからの通信にパーティションノードリストを使用するようになり、システムの耐障害性が向上しました。
+ 新しいハッシュプラグインは、前の を`HashPlugin=hash/sha3`置き換えます`hash/k12 plugin`。これは PCS AWS クラスターでデフォルトで有効になりました。
+ Slurm コントローラーログに、 へのすべてのインバウンドリモートプロシージャコール (RPC) の拡張監査機能が含まれるようになりました`slurmctld`。ログには、接続処理前の送信元アドレス、認証されたユーザー、および RPC タイプが含まれます。

Slurm 24.05 の詳細については、以下の出版物を参照してください。
+ [SchedMD リリースのお知らせ](https://www.schedmd.com/slurm-version-24-05-0-is-now-available/)
+ [SchedMD リリースノート](https://github.com/SchedMD/slurm/blob/slurm-24-05-0-1/RELEASE_NOTES)

## Slurm 23.11
<a name="slurm-versions_release-notes_23.11"></a>

**PCS で変更できる Slurm AWS 設定**
+  の`SuspendTime`デフォルトは です`60`。PCS AWS `scaleDownIdleTimeInSeconds`設定パラメータを使用して設定します。詳細については、*AWS PCS API リファレンス*`ClusterSlurmConfiguration`のデータ型の [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds)パラメータを参照してください。
+  `MaxJobCount` および `MaxArraySize`は、クラスター用に選択したサイズに基づいています。詳細については、PCS `CreateCluster` API *AWS リファレンスの API* アクションの [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size)パラメータを参照してください。
+  Slurm `SelectTypeParameters` 設定のデフォルトは です`CR_CPU`。クラスターの作成時に設定`slurmCustomSettings`するための の値として指定できます。詳細については、「PCS `CreateCluster` API *AWS リファレンス*」の「 API アクションの [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings)パラメータ」および[SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)」を参照してください。
+ クラスターレベルで `Prolog`と `Epilog` を設定できます。クラスターの作成時に設定`slurmCustomSettings`するための の値として指定できます。詳細については、*AWS 「PCS API リファレンス*」の[https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html)「」と[SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)」を参照してください。
+ コンピューティングノードグループレベルで `Weight`と `RealMemory` を設定できます。コンピューティングノードグループを作成するときに設定`slurmCustomSettings`するための の値として指定できます。詳細については、*AWS 「PCS API リファレンス*」の[https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html)「」と[SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)」を参照してください。