Slurm Beispiel SGE und Torque Beispiel AWS Batch Beispiel

Beispiele

Die folgenden Beispielkonfigurationen demonstrieren AWS ParallelCluster Konfigurationen mit Slurm, Torque, und AWS Batch Scheduler.

Anmerkung

Ab Version 2.11.5 wird die Verwendung von AWS ParallelCluster nicht unterstützt SGE or Torque Scheduler.

Inhalt

Slurm Workload Manager (`slurm`)

Das folgende Beispiel startet einen Cluster mit dem Scheduler slurm. In der Beispielkonfiguration wird 1 Cluster mit 2 Jobwarteschlangen gestartet. In der ersten Warteschlange spot sind zunächst 2 t3.micro Spot-Instances verfügbar. Sie kann auf maximal 10 Instances und auf mindestens 1 Instanz herunterskaliert werden, wenn 10 Minuten lang keine Jobs ausgeführt wurden (einstellbar über die scaledown_idletime Einstellung). Die zweite Warteschlange beginnt ohne Instanzen und kann auf maximal 5 t3.micro On-Demand-Instanzen skaliert werden. ondemand


[global]
update_check = true
sanity_check = true
cluster_template = slurm

[aws]
aws_region_name = <your AWS-Region>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster slurm]
key_name = <your EC2 keypair name>
base_os = alinux2                   # optional, defaults to alinux2
scheduler = slurm
master_instance_type = t3.micro     # optional, defaults to t3.micro
vpc_settings = public
queue_settings = spot,ondemand

[queue spot]
compute_resource_settings = spot_i1
compute_type = spot                 # optional, defaults to ondemand

[compute_resource spot_i1]
instance_type = t3.micro
min_count = 1                       # optional, defaults to 0
initial_count = 2                   # optional, defaults to 0

[queue ondemand]
compute_resource_settings = ondemand_i1

[compute_resource ondemand_i1]
instance_type = t3.micro
max_count = 5                       # optional, defaults to 10

Son of Grid Engine (`sge`) und Torque Resource Manager (`torque`)

Anmerkung

Dieses Beispiel gilt nur für AWS ParallelCluster Versionen bis einschließlich Version 2.11.4. Beginnend mit Version 2.11.5 unterstützt AWS ParallelCluster es nicht die Verwendung von SGE or Torque Scheduler.

Im folgenden Beispiel wird ein Cluster mit dem sge Scheduler torque OR gestartet. Zur Verwendung SGE, wechseln Sie scheduler = torque zu. scheduler = sge Die Beispielkonfiguration erlaubt maximal 5 gleichzeitige Knoten und wird auf zwei herunterskaliert, wenn 10 Minuten lang keine Jobs ausgeführt wurden.


[global]
update_check = true
sanity_check = true
cluster_template = torque

[aws]
aws_region_name = <your AWS-Region>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster torque]
key_name = <your EC2 keypair name>but they aren't eligible for future updates
base_os = alinux2                   # optional, defaults to alinux2
scheduler = torque                  # optional, defaults to sge
master_instance_type = t3.micro     # optional, defaults to t3.micro
vpc_settings = public
initial_queue_size = 2              # optional, defaults to 0
maintain_initial_size = true        # optional, defaults to false
max_queue_size = 5                  # optional, defaults to 10

Anmerkung

Ab Version 2.11.5 wird die Verwendung von AWS ParallelCluster nicht unterstützt SGE or Torque Scheduler. Wenn Sie diese Versionen verwenden, können Sie sie weiterhin verwenden oder den Support der AWS Service- und Support-Teams AWS bei der Fehlerbehebung unterstützen.

AWS Batch (`awsbatch`)

Das folgende Beispiel startet einen Cluster mit dem Scheduler awsbatch. Es ist so eingestellt, dass es auf der Grundlage Ihrer Anforderungen an die Jobressourcen den besseren Instanztyp auswählt.

Die Beispielkonfiguration erlaubt maximal 40 gleichzeitige V und wird auf Null herunterskaliertCPUs, wenn 10 Minuten lang keine Jobs ausgeführt wurden (einstellbar über die scaledown_idletime Einstellung).


[global]
update_check = true
sanity_check = true
cluster_template = awsbatch

[aws]
aws_region_name = <your AWS-Region>

[vpc public]
master_subnet_id = <your subnet>
vpc_id = <your VPC>

[cluster awsbatch]
scheduler = awsbatch
compute_instance_type = optimal # optional, defaults to optimal
min_vcpus = 0                   # optional, defaults to 0
desired_vcpus = 0               # optional, defaults to 4
max_vcpus = 40                  # optional, defaults to 20
base_os = alinux2               # optional, defaults to alinux2, controls the base_os of
                                # the head node and the docker image for the compute fleet
key_name = <your EC2 keypair name>
vpc_settings = public

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

[vpc] Abschnitt

Wie AWS ParallelCluster funktioniert

Beispiele

Anmerkung

Inhalt

Slurm Workload Manager (slurm)

Son of Grid Engine (sge) und Torque Resource Manager (torque)

Anmerkung

Anmerkung

AWS Batch (awsbatch)

Slurm Workload Manager (`slurm`)

Son of Grid Engine (`sge`) und Torque Resource Manager (`torque`)

AWS Batch (`awsbatch`)