外部アSlurmdbdカウンティングを使用したクラスターの作成 - AWS ParallelCluster

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

外部アSlurmdbdカウンティングを使用したクラスターの作成

外部Slurmdbdアカウンティングを使用してクラスターを設定および作成する方法について説明します。詳細については、「 Slurmでの アカウン AWS ParallelClusterティング」を参照してください。

AWS ParallelCluster コマンドラインインターフェイス (CLI) または API を使用する場合、 AWS ParallelCluster イメージとクラスターを作成または更新したときに作成された AWS リソースに対してのみ料金が発生します。詳細については、「 AWS が使用する のサービス AWS ParallelCluster」を参照してください。

AWS ParallelCluster UI はサーバーレスアーキテクチャ上に構築されており、ほとんどの場合、 AWS Free Tier カテゴリ内で使用できます。詳細については、AWS ParallelCluster 「UI のコスト」を参照してください。

このチュートリアルでは、 AWS CloudFormation クイック作成テンプレートを使用して、クラスターと同じ VPC に Slurmdbd インスタンスをデプロイするために必要なコンポーネントを作成します。テンプレートは、クラスターとデータベース間の接続の基本的なネットワークとセキュリティ設定を作成します。

注記

以降version 3.10.0、 はクラスター設定パラメータ を使用して外部 Slurmdbd AWS ParallelCluster をサポートしますSlurmSettings / ExternelSlurmdbd

注記

クイック作成テンプレートはその一例です。このテンプレートは、考えられるすべてのユースケースをカバーしているわけではありません。本番環境のワークロードに適した設定と容量で外部 Slurmdbd を作成するのはユーザーの責任です。

前提条件:

ステップ 1: Slurmdbd スタックを作成する

このチュートリアルでは、CloudFormation クイック作成テンプレート (us-east-1) を使用して Slurmdbd スタックを作成します。テンプレートには以下の入力が必要です。

ネットワーク
  • VPCId: Slurmdbd インスタンスを起動する VPC ID。

  • SubnetId: Slurmdbd インスタンスを起動するサブネット ID。

  • PrivatePrefix: VPC の CIDR プレフィックス。

  • PrivateIp: Slurmdbd インスタンスに割り当てるセカンダリプライベート IP。

データベース接続
  • DBMSClientSG: Slurmdbd インスタンスにアタッチするセキュリティグループ。このセキュリティグループは、データベースサーバーと Slurmdbd インスタンス間の接続を許可する必要があります。

  • DBMS DatabaseName: データベースの名前。

  • DBMSUsername: データベースのユーザー名。

  • DBMS PasswordSecretArn: データベースへのパスワードを含むシークレット。

  • DBMSUri: データベースサーバーの URI。

インスタンス設定
  • InstanceType: slurmdbd インスタンスに使用するインスタンスタイプ。

  • KeyName: slurmdbd インスタンスに使用する Amazon EC2 キーペア。

Slurmdbd の設定
  • AMIID: Slurmdbd インスタンスの AMI。AMI は ParallelCluster AMI である必要があります。 ParallelCluster AMI のバージョンによって、Slurmdbd のバージョンが決まります。

  • MungeKeySecretArn: Slurmdbd とクラスター間の通信を認証するために使用する m"" キーを含むシークレット。

  • SlurmdbdPort: slurmdbd が使用するポート番号。

  • EnableSlurmdbdSystemService: slurmdbd をシステムサービスとして有効にし、インスタンスの起動時に実行させます。

警告

データベースが別のバージョンの によって作成された場合はSlurmDB、 をシステムサービスSlurmdbdとして使用しないでください。

データベースに多数のエントリが含まれている場合、 はデータベースの更新に数分間かかり、この時間間隔中に応答しないSlurm Database Daemon (SlurmDBD)ことがあります。

をアップグレードする前にSlurmDB、データベースのバックアップを作成します。詳細については、「Slurmドキュメント」を参照してください。

ステップ 2: 外部Slurmdbdを有効にしてクラスターを作成する

提供された AWS CloudFormation テンプレートは、いくつかの定義された出力を持つ AWS CloudFormation スタックを生成します。

から AWS Management Console、 AWS CloudFormation スタックの出力タブを表示して、作成されたエンティティを確認します。Slurm アカウンティングを有効にするには、これらの出力の一部 AWS ParallelCluster を設定ファイルで使用する必要があります。

AWS CloudFormation スタックビューのパラメータタブから追加します。

クラスター設定ファイルのデータベースパラメータを出力値で更新します。pcluster AWS CLI を使用してクラスターを作成します。

$ pcluster create-cluster -n cluster-3.x-c path/to/cluster-config.yaml

クラスターが作成されたら、sacctmgrsacct などの Slurm アカウンティングコマンドを使い始めることができます。

警告

ParallelCluster と外部間のトラフィックSlurmDBは暗号化されません。信頼されたネットワークSlurmDBでクラスターと外部 を実行することをお勧めします。