翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS PCS 用のカスタム AMIs を構築するためのソフトウェアインストーラ
AWS は、インスタンスに PCS AWS ソフトウェアをインストールできるダウンロード可能なファイルを提供します。 は、関連するバージョンの Slurm とその依存関係をダウンロード、コンパイル、およびインストールできるソフトウェア AWS も提供します。これらの手順を使用して、PCS で使用するカスタム AMIs AWS を構築することも、独自の方法を使用することもできます。
目次
AWS PCS ソフトウェアインストーラ
AWS PCS ソフトウェアインストーラは、インスタンスブートストラッププロセス中に PCS AWS と連携するようにインスタンスを設定します。カスタム AMI に PCS AWS ソフトウェアをインストールするには、 AWSが提供するインストーラを使用する必要があります。
Slurm インストーラ
Slurm インストーラは、関連するバージョンの Slurm とその依存関係をダウンロード、コンパイル、インストールします。Slurm インストーラを使用して、PCS 用のカスタム AMIs AWS を構築できます。Slurm インストーラが提供するソフトウェア設定と整合性がある場合は、独自のメカニズムを使用することもできます。
AWSが提供するソフトウェアは、以下をインストールします。
-
リクエストされたメジャーバージョンとメンテナンスバージョン (現在のバージョン 24.05.x) の Slurm
- ライセンス GPL 2 -
Slurm は を
--sysconfdir
に設定して構築されます/etc/slurm
-
Slurm は、 オプション
--enable-pam
と を使用して構築されています。--without-munge
-
Slurm は オプションで構築されます
--sharedstatedir=/run/slurm/
-
Slurm は ™X と JWT サポートで構築されています
-
Slurm が にインストールされている
/opt/aws/pcs/schedulers/slurm-24.05
-
-
OpenPMIX
(バージョン 4.2.6) – ライセンス -
OpenPMIX は のサブディレクトリとしてインストールされます。
/opt/aws/pcs/scheduler/
-
-
libjwt
(バージョン 1.17.0) – ライセンス MPL-2.0 -
libjwt は のサブディレクトリとしてインストールされます。
/opt/aws/pcs/scheduler/
-
AWSが提供するソフトウェアは、システム設定を次のように変更します。
-
ビルドによって作成された Slurm
systemd
ファイルは、ファイル名/etc/systemd/system/
で にコピーされますslurmd-24.05.service
。 -
存在しない場合、Slurm ユーザーとグループ (
slurm:slurm
) は の UID/GID で作成されます401
。 -
Amazon Linux 2 および Rocky Linux 9 では、インストールによって EPEL リポジトリが追加され、Slurm またはその依存関係を構築するために必要なソフトウェアがインストールされます。
-
RHEL9 では、インストールによって
codeready-builder-for-rhel-9-rhui-rpms
とepel-release-latest-9
が Slurm またはその依存関係を構築するために必要なソフトウェアfedoraproject
をインストールできるようになります。
サポートされるオペレーティングシステム
AWS PCS ソフトウェアと Slurm インストーラは、次のオペレーティングシステムをサポートしています。
-
Amazon Linux 2
-
RedHat Enterprise Linux 9
-
Rocky Linux 9
-
Ubuntu 22.04
詳細については、「PCS AWS でサポートされているオペレーティングシステム」を参照してください。
注記
AWS Deep Learning AMIs Amazon Linux 2 および Ubuntu 22.04 に基づく (DLAMI) バージョンは、PCS AWS ソフトウェアおよび Slurm インストーラと互換性がある必要があります。詳細については、「 AWS Deep Learning AMIs デベロッパーガイド」の「DLAMI の選択」を参照してください。
サポートされるインスタンスタイプ
AWS PCS ソフトウェアと Slurm インストーラは、サポートされているオペレーティングシステムのいずれかを実行できるよりも、任意の x86_64 または arm64 インスタンスタイプをサポートします。
サポートされている Slurm バージョン
Slurm の次のメジャーバージョンがサポートされています。
-
Slurm 24.05
-
Slurm 23.11
チェックサムを使用してインストーラを検証する
SHA256 チェックサムを使用して、インストーラの tarball (.tar.gz) ファイルを確認できます。ソフトウェア発行元の ID を確認し、発行後にアプリケーションの変更または破損がないことを確認するために、この操作を行うことをお勧めします。
tarball を検証するには
SHA256 チェックサムに sha256sum ユーティリティを使用し、tarball ファイル名を指定します。 SHA256 tarball ファイルを保存したディレクトリから コマンドを実行する必要があります。
-
SHA256
$
sha256sumtarball_filename.tar.gz
コマンドは、次の形式でチェックサム値を返します。
checksum_value
tarball_filename.tar.gz
コマンドによって返されるチェックサム値と、次の表に示すチェックサム値を比較します。チェックサムが一致すると、インストールスクリプトを安全に実行できます。
重要
チェックサムが一致しない場合は、インストールスクリプトを実行しないでください。サポート
例えば、次のコマンドは Slurm 24.05.5-2 tarball の SHA256 チェックサムを生成します。
$
sha256sum aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz
出力例:
7cc8d8294f2fbff95fe0602cf9e21e02003b5d96c0730e0a18c6aa04c7a4967b aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz
次の表に、インストーラの最新バージョンのチェックサムを示します。us-east-1
を PCS AWS を使用する に置き換え AWS リージョン ます。
Installer (インストーラ) | URL のダウンロード | SHA256 チェックサム |
---|---|---|
AWS PCS エージェント 1.1.1-1 |
|
|
AWS PCS エージェント 1.1.0-1 |
|
|
AWS PCS エージェント 1.0.1-1 |
|
|
AWS PCS エージェント 1.0.0-1 |
|
|
Installer (インストーラ) | URL のダウンロード | SHA256 チェックサム |
---|---|---|
スラム 24.05.5-2 |
|
|
スラム 23.11.10-3 |
|
|
スラム 23.11.10-2 |
|
|
スラム 23.11.10-1 |
|
|
スラム 23.11.9-1 |
|
|