例

以下の構成例では、Slurm、Torque、AWS Batch の各スケジューラーを使用した AWS ParallelCluster 構成を示しています。

注記

バージョン 2.11.5 以降は、AWS ParallelCluster では SGE または Torque スケジューラの使用はサポートしていません。

Slurm Workload Manager (`slurm`)

次の例では、slurm スケジューラでクラスターを起動します。この例では、1 つのクラスターを 2 つのジョブキューで起動します。最初のキュー spot には、初期状態で 2 つの t3.micro スポットインスタンスが用意されています。最大で 10 インスタンスまで拡張でき、10 分間ジョブが実行されなかった場合には最小で 1 インスタンスまで拡張することができます (scaledown_idletime 設定で調整可能)。2 番目のキューである ondemand は、インスタンスがない状態からスタートし、最大で 5 台の t3.micro オンデマンドインスタンスまで拡張することができます。


[global]
update_check = true
sanity_check = true
cluster_template = slurm

[aws]
aws_region_name = <your AWS リージョン>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster slurm]
key_name = <your EC2 keypair name>
base_os = alinux2                   # optional, defaults to alinux2
scheduler = slurm
master_instance_type = t3.micro     # optional, defaults to t3.micro
vpc_settings = public
queue_settings = spot,ondemand

[queue spot]
compute_resource_settings = spot_i1
compute_type = spot                 # optional, defaults to ondemand

[compute_resource spot_i1]
instance_type = t3.micro
min_count = 1                       # optional, defaults to 0
initial_count = 2                   # optional, defaults to 0

[queue ondemand]
compute_resource_settings = ondemand_i1

[compute_resource ondemand_i1]
instance_type = t3.micro
max_count = 5                       # optional, defaults to 10

Son of Grid Engine (`sge`) および Torque Resource Manager (`torque`)

注記

この例は、バージョン 2.11.4 以前の AWS ParallelCluster バージョンにのみ適用されます。バージョン 2.11.5 以降は、AWS ParallelCluster では SGE または Torque スケジューラの使用はサポートしていません。

次の例では、torque または sge のスケジューラでクラスターを起動します。SGE を使用するには、scheduler = torque を scheduler = sge に変更します。サンプルの設定では、最大 5 つの同時ノードが許可され、10 分間ジョブが実行されない場合、2 つにスケールダウンします。


[global]
update_check = true
sanity_check = true
cluster_template = torque

[aws]
aws_region_name = <your AWS リージョン>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster torque]
key_name = <your EC2 keypair name>but they aren't eligible for future updates
base_os = alinux2                   # optional, defaults to alinux2
scheduler = torque                  # optional, defaults to sge
master_instance_type = t3.micro     # optional, defaults to t3.micro
vpc_settings = public
initial_queue_size = 2              # optional, defaults to 0
maintain_initial_size = true        # optional, defaults to false
max_queue_size = 5                  # optional, defaults to 10

注記

バージョン 2.11.5 以降は、AWS ParallelCluster では SGE または Torque スケジューラの使用はサポートしていません。これらのバージョンを使用する場合は、引き続き使用することも、AWS のサービスチームや AWS サポートチームからのトラブルシューティングサポートを利用することもできます。

AWS Batch (`awsbatch`)

次の例では、awsbatch スケジューラでクラスターを起動します。ジョブリソースのニーズに基いて、より良いインスタンスタイプを選択するように設定されています。

サンプルの設定では、最大 40 の同時 vCPU が許可され、10 分間 (scaledown_idletime 設定で調整可能) ジョブが実行されない場合、ゼロにスケールダウンします。


[global]
update_check = true
sanity_check = true
cluster_template = awsbatch

[aws]
aws_region_name = <your AWS リージョン>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster awsbatch]
scheduler = awsbatch
compute_instance_type = optimal # optional, defaults to optimal
min_vcpus = 0                   # optional, defaults to 0
desired_vcpus = 0               # optional, defaults to 4
max_vcpus = 40                  # optional, defaults to 20
base_os = alinux2               # optional, defaults to alinux2, controls the base_os of
                                # the head node and the docker image for the compute fleet
key_name = <your EC2 keypair name>
vpc_settings = public

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

[vpc] セクション

AWS ParallelCluster の仕組み

例

注記

目次

Slurm Workload Manager (slurm)

Son of Grid Engine (sge) および Torque Resource Manager (torque)

注記

注記

AWS Batch (awsbatch)

Slurm Workload Manager (`slurm`)

Son of Grid Engine (`sge`) および Torque Resource Manager (`torque`)

AWS Batch (`awsbatch`)