翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
外部 Slurmdbd アカウンティングによるクラスターの作成
外部 Slurmdbd アカウンティングを使用してクラスターを設定および作成する方法について説明します。詳細については、「 Slurmでのアカウンティング AWS ParallelCluster」を参照してください。
AWS ParallelCluster コマンドラインインターフェイス (CLI) または API を使用する場合、 AWS ParallelCluster イメージとクラスターを作成または更新するときに作成されたリソースに対して AWS のみ料金が発生します。詳細については、AWS 「 が使用する のサービス AWS ParallelCluster」を参照してください。
AWS ParallelCluster UI はサーバーレスアーキテクチャ上に構築されており、ほとんどの場合、 AWS Free Tierカテゴリ内で使用できます。詳細については、「AWS ParallelCluster UI のコスト」を参照してください。
このチュートリアルでは、 AWS CloudFormation クイック作成テンプレートを使用して、クラスターと同じ VPC に Slurmdbd インスタンスをデプロイするために必要なコンポーネントを作成します。このテンプレートは、クラスターとデータベース間の接続のための基本的なネットワークとセキュリティの設定を作成します。
注記
以降version 3.10.0
、 はクラスター設定パラメータ を使用して外部 Slurmdbd AWS ParallelCluster をサポートしますSlurmSettings / ExternelSlurmdbd
。
注記
クイック作成テンプレートはその一例です。このテンプレートは、すべての想定されるユースケースをカバーしているわけではありません。本番環境のワークロードに適した設定と容量を備えた外部 Slurmdbd を作成することはお客様の責任です。
前提条件:
-
AWS ParallelCluster がインストールされます。
-
AWS CLI がインストールされ、設定されています。
-
CLI の実行に必要なアクセス許可を持つ pcluster AWS Identity and Access Management ロールがあります。
-
Slurm アカウンティングデータベースがある。Slurm アカウンティングデータベースを作成するチュートリアルを実行するには、「Slurm アカウンティングデータベーススタックを作成する」のステップ 1 および 2 に従います。
ステップ 1: Slurmdbd スタックを作成する
このチュートリアルでは、CloudFormation クイック作成テンプレート (us-east-1
)
ネットワーク
-
VPCId: Slurmdbd インスタンスを起動するための VPC ID。
-
SubnetId: Slurmdbd インスタンスを起動するためのサブネット ID。
-
PrivatePrefix: VPC の CIDR プレフィックス。
-
PrivateIp: Slurmdbd インスタンスに割り当てるセカンダリプライベート IP。
データベース接続
-
DBMSClientSG: Slurmdbd インスタンスにアタッチするセキュリティグループ。このセキュリティグループは、データベースサーバーと Slurmdbd インスタンス間の接続を許可する必要があります。
-
DBMSDatabaseName: データベースの名前。
-
DBMSUsername: データベースのユーザー名。
-
DBMSPasswordSecretArn: データベースへのパスワードを含むシークレット。
-
DBMSUri: データベースサーバーの URI。
インスタンス設定
-
InstanceType: slurmdbd インスタンスに使用するインスタンスタイプ。
-
KeyName: slurmdbd インスタンスに使用する Amazon EC2 キーペア。
Slurmdbd 設定
-
AMIID : Slurmdbd インスタンスの AMI。AMI は ParallelCluster AMI である必要があります。ParallelCluster AMI のバージョンにより、Slurmdbd のバージョンが決まります。
-
MungeKeySecretArn: Slurmdbd とクラスター間の通信を認証するために使用する munge キーを含むシークレット。
-
SlurmdbdPort: slurmdbd で使用するポート番号。
-
EnableSlurmdbdSystemService: slurmdbd をシステムサービスとして有効にし、インスタンスの起動時に実行します。
警告
データベースが別のバージョンの SlurmDB で作成した場合は、Slurmdbd をシステムサービスとして使用しないでください。
データベースに多数のエントリが含まれている場合、Slurm Database Daemon (SlurmDBD) はデータベースの更新に数十分かかり、この間は応答しなくなることがあります。
SlurmDB をアップグレードする前に、データベースのバックアップを作成します。詳細については、Slurm のドキュメント
ステップ 2: 外部 Slurmdbd を有効にしたクラスターを作成する
提供された AWS CloudFormation テンプレートは、いくつかの定義された出力を持つ AWS CloudFormation スタックを生成します。
から AWS Management Console、 AWS CloudFormation スタックの出力タブを表示して、作成されたエンティティを確認します。Slurm アカウンティングを有効にするには、これらの出力の一部 AWS ParallelCluster を設定ファイルで使用する必要があります。
-
SlurmdbdPrivateIp: SlurmSettings / ExternalSlurmdbd / Host クラスター設定パラメータに使用します。
-
SlurmdbdPort: SlurmSettings / ExternalSlurmdbd / ポートクラスター設定パラメータの値に使用されます。
-
AccountingClientSecurityGroup: これは、HeadNode / Networking / AdditionalSecurityGroups 設定パラメータで定義されているクラスターのヘッドノードにアタッチされているセキュリティグループです。
AWS CloudFormation スタックビューのパラメータタブから追加します。
-
MungeKeySecretArn: SlurmSettings / MungeKeySecretArn クラスター設定パラメータ値に使用します。
クラスター設定ファイルのデータベースパラメータを出力値で更新します。pcluster AWS CLI を使用してクラスターを作成します。
$
pcluster create-cluster -ncluster-3.x
-cpath/to/cluster-config.yaml
クラスターを作成すると、sacctmgr
や sacct
などの Slurm アカウンティングコマンドを使い始めることができます。
警告
ParallelCluster
と外部 SlurmDB との間のトラフィックは暗号化されません。クラスターと外部 SlurmDB は、信頼できるネットワークで実行することをお勧めします。