[cluster] 區段 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

[cluster] 區段

定義可用於建立叢集的叢集範本。組態檔案可以包含多個[cluster]區段。

相同的叢集範本可用來建立多個叢集。

格式是 [cluster cluster-template-name]。[cluster] 依預設會使用 區段中由 cluster_template設定命名的[global]區段,但可以在pcluster命令列上覆寫。

cluster-template-name 必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

[cluster default]

additional_cfn_template

(選用) 定義要與叢集一起啟動的其他 AWS CloudFormation 範本。此額外範本用於建立叢集外但屬於叢集生命週期一部分的資源。

此值必須是公有範本的 HTTP URL,並提供所有參數。

沒有預設值。

additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml

更新政策:如果變更此設定,則不允許更新。

additional_iam_policies

(選用) 指定 Amazon ARNs 的 IAM 政策 Amazon Resource Name (EC2) 清單。除了以逗號 AWS ParallelCluster 分隔 所需的許可之外,此清單還會連接到叢集中使用的根角色。IAM 政策名稱及其 ARN 不同。名稱無法用作 的引數additional_iam_policies

如果您的意圖是將額外的政策新增至叢集節點的預設設定,建議您使用 additional_iam_policies設定傳遞額外的自訂 IAM 政策,而不是使用 ec2_iam_role設定來新增特定 EC2 政策。這是因為 additional_iam_policies 已新增至 AWS ParallelCluster 所需的預設許可。現有的 ec2_iam_role 必須包含所有必要的許可。不過,由於新增功能時,所需的許可通常會從發行版本變更為發行版本,因此現有 ec2_iam_role可能會過時。

沒有預設值。

additional_iam_policies = arn:aws:iam::123456789012:policy/CustomEC2Policy
注意

2.5.0 AWS ParallelCluster 版中additional_iam_policies已新增 的支援。

更新政策:此設定可以在更新期間變更。

base_os

(必要) 指定將哪個作業系統類型用於叢集。

可用選項如下:

  • alinux2

  • centos7

  • ubuntu1804

  • ubuntu2004

注意

對於 AWS 以 Graviton 為基礎的執行個體,僅ubuntu2004支援 ubuntu1804alinux2或 。

注意

centos8 2.11.4 AWS ParallelCluster 版已移除 的支援。ubuntu2004 已新增 的支援,並在 2.11.0 AWS ParallelCluster 版ubuntu1604中移除 alinux和 的支援。centos8 已新增 的支援,並在 2.10.0 AWS ParallelCluster 版centos6中移除 的支援。alinux2 2.6.0 版已 AWS ParallelCluster 新增 的支援。ubuntu1804 已新增 的支援,並在 2.5.0 AWS ParallelCluster 版ubuntu1404中移除 的支援。

除了下表中 AWS 區域 提及不支援 的特定 以外centos7。所有其他 AWS 商業區域都支援下列所有作業系統。

分割區 (AWS 區域) alinux2 centos7 ubuntu1804ubuntu2004
商業 (所有 AWS 區域 未特別提及) True True True
AWS GovCloud (美國東部) (us-gov-east-1) True False True
AWS GovCloud (美國西部) (us-gov-west-1) True False True
中國 (北京) (cn-north-1) True False True
中國 (寧夏) (cn-northwest-1) True False True
注意

base_os 參數也會決定用來登入叢集的使用者名稱。

  • centos7: centos

  • ubuntu1804ubuntu2004ubuntu

  • alinux2: ec2-user

注意

在 2.7.0 AWS ParallelCluster 版之前, base_os 參數為選用,預設值為 alinux。從 2.7.0 版開始 AWS ParallelCluster ,需要 base_os 參數。

注意

如果 scheduler 參數為 awsbatch,則僅支援 alinux2

base_os = alinux2

更新政策:如果變更此設定,則不允許更新。

cluster_resource_bucket

(選用) 指定用於託管叢集建立時產生的資源的 Amazon S3 儲存貯體名稱。儲存貯體必須已啟用版本控制。如需詳細資訊,請參閱《Amazon Simple Storage Service 使用者指南》中的使用版本控制。此儲存貯體可用於多個叢集。儲存貯體必須與叢集位於相同的區域。

如果未指定此參數,則會在建立叢集時建立新的儲存貯體。新儲存貯體的名稱為 parallelcluster-random_string。在此名稱中,random_string 是英數字元的隨機字串。所有叢集資源都存放在此儲存貯體中,路徑格式為 bucket_name/resource_directory。 的格式resource_directorystack_name-random_string,其中 stack_name 是 使用的其中一個 AWS CloudFormation 堆疊的名稱 AWS ParallelCluster。的值 bucket_name 可以在parallelcluster-clustername堆疊輸出中的 ResourcesS3Bucket值中找到。的值 resource_directory 可以在相同堆疊的ArtifactS3RootDirectory輸出值中找到。

預設值為 parallelcluster-random_string

cluster_resource_bucket = amzn-s3-demo-bucket
注意

cluster_resource_bucket 2.10.0 AWS ParallelCluster 版已新增 的支援。

更新政策:如果變更此設定,則不允許更新。無法強制更新此設定。

cluster_type

(選用) 定義要啟動的叢集類型。如果已定義queue_settings設定,則必須將此設定取代為[queue]區段中的compute_type設定。

有效選項為:ondemandspot

預設值為 ondemand

如需 Spot 執行個體的詳細資訊,請參閱 使用 競價型執行個體

注意

使用 Spot 執行個體需要您的 帳戶中存在AWSServiceRoleForEC2Spot服務連結角色。若要使用 在帳戶中建立此角色 AWS CLI,請執行下列命令:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的 Spot 執行個體請求的服務連結角色

cluster_type = ondemand

更新政策:必須停止運算機群,才能變更此設定以進行更新。

compute_instance_type

(選用) 定義用於叢集運算節點的 Amazon EC2 執行個體類型。執行個體類型的架構必須與用於master_instance_type設定的架構相同。如果已定義queue_settings設定,則必須將此設定取代為[compute_resource]區段中的instance_type設定。

如果您使用的是awsbatch排程器,請參閱 UI AWS Batch 中的運算環境建立,以取得支援的執行個體類型清單。

當排程器為 awsbatch 時,預設為 t2.microoptimal

compute_instance_type = t2.micro
注意

2.8.0 AWS AWS ParallelCluster 版中已新增對 Graviton 型執行個體 (包括 A1C6g執行個體) 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

compute_root_volume_size

(選用) 以 GB (GiB) 為單位指定 ComputeFleet 根磁碟區大小。AMI 必須支援 growroot

預設值為 35

注意

對於 2.5.0 和 2.10.4 之間的 AWS ParallelCluster 版本,預設值為 25。在 2.5.0 AWS ParallelCluster 版之前,預設值為 20。

compute_root_volume_size = 35

更新政策:必須停止運算機群,才能變更此設定以進行更新。

custom_ami

(選用) 指定要用於頭部和運算節點的自訂 AMI ID,而非預設發佈的 AMIs。如需詳細資訊,請參閱 修改 AMI建置自訂 AWS ParallelCluster AMI

沒有預設值。

custom_ami = ami-00d4efc81188687a0

如果自訂 AMI 需要額外的許可才能啟動,則必須將這些許可新增至使用者和頭部節點政策。

例如,如果自訂 AMI 具有與其相關聯的加密快照,則使用者和頭節點政策都需要以下其他政策:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:<AWS_REGION>:<AWS_ACCOUNT_ID>:key/<AWS_KMS_KEY_ID>" ] } ] }

更新政策:如果變更此設定,則不允許更新。

cw_log_settings

(選用) 使用 CloudWatch Logs 組態識別 [cw_log]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [cw_log]區段Amazon CloudWatch 儀表板與 Amazon CloudWatch Logs 的整合

例如,以下設定指定[cw_log custom-cw]啟動的 區段用於 CloudWatch Logs 組態。

cw_log_settings = custom-cw
注意

cw_log_settings 2.6.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

dashboard_settings

(選用) 使用 CloudWatch 儀表板組態識別 [dashboard]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[dashboard]一節

例如,下列設定指定[dashboard custom-dashboard啟動的 區段用於 CloudWatch 儀表板組態。

dashboard_settings = custom-dashboard
注意

dashboard_settings 2.10.0 AWS ParallelCluster 版已新增 的支援。

更新政策:此設定可以在更新期間變更。

dcv_settings

(選用) 使用 Amazon DCV 組態識別 [dcv]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[dcv]一節

例如,以下設定指定 [dcv custom-dcv] 開始的 區段用於 Amazon DCV 組態。

dcv_settings = custom-dcv
注意

在以 AWS Graviton 為基礎的執行個體上,僅支援 Amazon DCValinux2

注意

dcv_settings 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

desired_vcpus

(選用) 指定運算環境中所需的 vCPUs 數量。僅在排程器是 awsbatch 時才使用。

預設值為 4

desired_vcpus = 4

更新政策:更新期間不會分析此設定。

disable_cluster_dns

(選用) 指定是否不應建立叢集的 DNS 項目。根據預設, AWS ParallelCluster 會建立 Route 53 託管區域。如果 disable_cluster_dns 設定為 true,則不會建立託管區域。

預設值為 false

disable_cluster_dns = true
警告

叢集需要名稱解析系統才能正常運作。如果 disable_cluster_dns 設定為 true,則必須提供額外的名稱解析系統。

重要

disable_cluster_dns = true只有在指定queue_settings設定時才支援。

注意

disable_cluster_dns 2.9.1 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

disable_hyperthreading

(選用) 停用頭部和運算節點上的超執行緒。並非所有執行個體類型都可以停用超執行緒。如需支援停用超執行緒的執行個體類型清單,請參閱《Amazon CPU 使用者指南》中的每個執行個體類型的 CPU 核心和每個 Word 核心的執行緒。 EC2 如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的disable_hyperthreading設定。

預設值為 false

disable_hyperthreading = true
注意

disable_hyperthreading 只會在 時影響頭部節點scheduler = awsbatch

注意

disable_hyperthreading 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

ebs_settings

(選用) 使用安裝在主機節點上的 Amazon EBS 磁碟區來識別[ebs]區段。使用多個 Amazon EBS 磁碟區時,請在清單中輸入這些參數,每個參數以逗號分隔。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

最多支援五 (5) 個額外的 Amazon EBS 磁碟區。

如需詳細資訊,請參閱[ebs]一節

例如,以下設定指定 Amazon EBS 磁碟區啟動[ebs custom1][ebs custom2]使用的區段。

ebs_settings = custom1, custom2

更新政策:如果變更此設定,則不允許更新。

ec2_iam_role

(選用) 定義連接至叢集中所有執行個體的 Amazon Word 現有 EC2 IAM角色的名稱。IAM 角色名稱及其 Amazon Resource Name (ARN) 不同。ARNs 無法用作 的引數ec2_iam_role

如果指定此選項,則會忽略 additional_iam_policies 設定。如果您的意圖是將額外的政策新增至叢集節點的預設設定,我們建議您使用 additional_iam_policies設定傳遞額外的自訂 IAM 政策,而不是使用 ec2_iam_role設定。

如果未指定此選項,則會使用 Amazon AWS ParallelCluster IAM 的預設 EC2 角色。如需詳細資訊,請參閱AWS Identity and Access Management 中的 角色 AWS ParallelCluster

沒有預設值。

ec2_iam_role = ParallelClusterInstanceRole

更新政策:如果變更此設定,則不允許更新。

efs_settings

(選用) 指定與 Amazon EFS 檔案系統相關的設定。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[efs]一節

例如,下列設定指定 開始的 區段[efs customfs]用於 Amazon EFS 檔案系統組態。

efs_settings = customfs

更新政策:如果變更此設定,則不允許更新。

enable_efa

(選用) 如果存在,請指定為運算節點啟用彈性布料轉接器 (EFA)。若要檢視支援 EC2 的 Word 執行個體清單EFA,請參閱《Amazon EC2 Linux 執行個體使用者指南》中的支援執行個體類型。如需詳細資訊,請參閱Elastic Fabric Adapter。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的enable_efa設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱 placementplacement_group

enable_efa = compute
注意

2.10.1 AWS ParallelCluster 版中已新增對 EFA on Arm 型 Graviton2 執行個體的支援。

更新政策:如果變更此設定,則不允許更新。

enable_efa_gdr

(選用) 從 2.11.3 AWS ParallelCluster 版開始,此設定沒有效果。如果執行個體類型和作業系統都支援 GPUDirect (遠端直接記憶體存取),則一律會啟用 Elastic Fabric Adapter RDMA(EFA) 支援。

注意

AWS ParallelCluster 2.10.0 版到 2.11.2 版:如果 compute, 會指定為運算節點啟用 GPUDirect (遠端直接記憶體存取) 的 Elastic Fabric Adapter RDMA(EFA) 支援。將此設定設為 compute需要將enable_efa設定設為 compute。EFA RDMA GPUDirect 支援由特定作業系統上的特定執行個體類型 (p4d.24xlarge) 支援 (base_osalinux2centos7ubuntu1804ubuntu2004)。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的enable_efa_gdr設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱 placementplacement_group

enable_efa_gdr = compute
注意

enable_efa_gdr 2.10.0 AWS ParallelCluster 版已新增 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

enable_intel_hpc_platform

(選用) 如果存在,表示接受 Intel Parallel Studio 的最終使用者授權合約。這會導致 Intel Parallel Studio 安裝在主機節點上並與運算節點共用。這會將幾分鐘的時間新增到頭部節點引導的時間。enable_intel_hpc_platform 設定僅在 上受支援 CentOS 7 (base_os = centos7)。

預設值為 false

enable_intel_hpc_platform = true
注意

enable_intel_hpc_platform 參數與以 AWS Graviton 為基礎的執行個體不相容。

注意

enable_intel_hpc_platform 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

encrypted_ephemeral

(選用) 使用 LUKS (Linux 統一金鑰設定),以不可復原的記憶體內金鑰加密暫時性執行個體存放磁碟區。

如需詳細資訊,請參閱https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md

預設值為 false

encrypted_ephemeral = true

更新政策:如果變更此設定,則不允許更新。

ephemeral_dir

(選用) 定義使用執行個體存放區磁碟區的掛載路徑。

預設值為 /scratch

ephemeral_dir = /scratch

更新政策:如果變更此設定,則不允許更新。

extra_json

(選用) 定義合併至 的額外 JSON Chef dna.json。如需詳細資訊,請參閱 建置自訂 AWS ParallelCluster AMI

預設值為 {}

extra_json = {}
注意

從 2.6.1 AWS ParallelCluster 版開始,在啟動節點時,大多數安裝配方預設會略過,以改善啟動時間。若要執行所有安裝配方,以便在啟動時間獲得更佳的回溯相容性,請將 "skip_install_recipes" : "no"新增至 extra_json設定中的 cluster金鑰。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }

更新政策:必須停止運算機群,才能變更此設定以進行更新。

fsx_settings

(選用) 指定定義 FSx for Lustre 組態的區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[fsx]一節

例如,以下設定指定 [fsx fs] FSx for Lustre 組態使用 啟動的 區段。

fsx_settings = fs

更新政策:如果變更此設定,則不允許更新。

iam_lambda_role

(選用) 定義現有 AWS Lambda 執行角色的名稱。此角色會連接到叢集中的所有 Lambda 函數。如需詳細資訊,請參閱《AWS Lambda 開發人員指南》中的 AWS Lambda 執行角色

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

IAM 角色名稱及其 Amazon Resource Name (ARN) 不同。ARNs 無法用作 的引數iam_lambda_role。如果同時定義 iam_lambda_role ec2_iam_role和 ,且 schedulersgeslurmtorque,則不會建立任何角色。如果 schedulerawsbatch,則會在 期間建立角色pcluster start。如需範例政策,請參閱 ParallelClusterLambdaPolicy 使用 SGE、 Slurm或 TorqueParallelClusterLambdaPolicy 使用 awsbatch

沒有預設值。

iam_lambda_role = ParallelClusterLambdaRole
注意

iam_lambda_role 2.10.1 AWS ParallelCluster 版已新增 的支援。

更新政策:此設定可以在更新期間變更。

initial_queue_size

(選用) 將 Amazon EC2 執行個體的初始數量設定為在叢集中以運算節點形式啟動。如果已定義queue_settings設定,則必須移除此設定,並以[compute_resource]區段中的initial_count設定取代。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

此設定僅適用於傳統排程器 (SGE, Slurm 和 Torque)。 如果maintain_initial_size設定為 true,則initial_queue_size設定必須至少為一 (1) 個。

如果排程器是 awsbatch,請改用 min_vcpus

預設為 2

initial_queue_size = 2

更新政策:此設定可以在更新期間變更。

key_name

(選用) 為現有的 Amazon EC2 金鑰對命名,以啟用 SSH 存取執行個體。

key_name = mykey
注意

在 2.11.0 AWS ParallelCluster 版之前, key_name是必要的設定。

更新政策:如果變更此設定,則不允許更新。

maintain_initial_size

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

(選用) 維持傳統排程器的 Auto Scaling 群組初始大小 (SGE, Slurm 和 Torque).

如果排程器是 awsbatch,請改用 desired_vcpus

此設定是布林值旗標。如果設定為 true,Auto Scaling 群組的成員不會比 的值更少initial_queue_size,且 的值initial_queue_size必須是一 (1) 個或更高。叢集仍可擴充至 max_queue_size 值。如果cluster_type = spot這樣,Auto Scaling 群組可以中斷執行個體,且大小可能會降至 以下initial_queue_size

如果設定為 false,Auto Scaling 群組可以縮減為零 (0) 個成員,以防止資源在不需要時閒置。

如果已定義queue_settings設定,則必須移除此設定,並由[compute_resource]區段中的 initial_countmin_count設定取代。

預設為 false

maintain_initial_size = false

更新政策:此設定可以在更新期間變更。

master_instance_type

(選用) 定義用於頭部節點的 Amazon EC2 執行個體類型。執行個體類型的架構必須與用於compute_instance_type設定的架構相同。

在具有 免費方案 AWS 區域 的 中, 預設為 免費方案執行個體類型 (t2.microt3.micro)。在沒有免費方案 AWS 區域 的 中, 預設為 t3.micro。如需 AWS 免費方案的詳細資訊,請參閱 AWS 免費方案FAQs

master_instance_type = t2.micro
注意

在 2.10.1 AWS ParallelCluster 版之前, t2.micro 全部預設為 AWS 區域。在 2.10.0 AWS ParallelCluster 版中, p4d.24xlarge不支援前端節點。2.8.0 AWS AWS ParallelCluster 版中已新增對 Graviton 型執行個體 (例如 A1C6g) 的支援。

更新政策:如果變更此設定,則不允許更新。

master_root_volume_size

(選用) 以 GB (GiB) 為單位指定頭部節點根磁碟區大小。AMI 必須支援 growroot

預設值為 35

注意

對於 2.5.0 和 2.10.4 之間的 AWS ParallelCluster 版本,預設值為 25。在 2.5.0 AWS ParallelCluster 版之前,預設值為 20。

master_root_volume_size = 35

更新政策:如果變更此設定,則不允許更新。

max_queue_size

(選用) 設定可在叢集中啟動的 Amazon EC2 執行個體數量上限。如果已定義queue_settings設定,則必須移除此設定,並以[compute_resource]區段中的max_count設定取代。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

此設定僅適用於傳統排程器 (SGE, Slurm 和 Torque).

如果排程器是 awsbatch,請改用 max_vcpus

預設為 10

max_queue_size = 10

更新政策:此設定可以在更新期間變更,但如果值減少,則應該停止運算機群。否則,現有的節點可能會終止。

max_vcpus

(選用) 指定運算環境中的 vCPUs 數量上限。僅在排程器是 awsbatch 時才使用。

預設值為 20

max_vcpus = 20

更新政策:此設定無法在更新期間減少。

min_vcpus

(選用) 維持awsbatch排程器 Auto Scaling 群組的初始大小。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

如果排程器是 SGE, Slurm、 或 Torque,請maintain_initial_size改用 。

運算環境的成員數不得少於 min_vcpus 的值。

預設為 0

min_vcpus = 0

更新政策:此設定可以在更新期間變更。

placement

(選用) 定義叢集置放群組邏輯,讓整個叢集或只有運算執行個體可以使用叢集置放群組。

如果已定義queue_settings設定,則應移除此設定,並以每個[queue]區段placement_group的設定取代。如果相同的置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的執行個體容量不足。多個佇列只有在預先建立並在每個佇列placement_group的設定中設定時,才能共用置放群組。如果每個[queue]區段都定義了placement_group設定,則頭部節點不能位於佇列的置放群組中。

有效選項為 clustercompute

當排程器為 時,不會使用此參數awsbatch

預設值為 compute

placement = compute

更新政策:如果變更此設定,則不允許更新。

placement_group

(選用) 定義叢集置放群組。如果已定義queue_settings設定,則應移除此設定,並以[queue]區段中的placement_group設定取代。

有效選項為下列值:

  • DYNAMIC

  • 現有的 Amazon EC2 叢集置放群組名稱

設為 DYNAMIC 時,即會建立唯一的置放群組,並在叢集堆疊過程將其刪除。

當排程器為 時,不會使用此參數awsbatch

如需置放群組的詳細資訊,請參閱《Amazon EC2 使用者指南》中的置放群組。如果相同置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的執行個體容量不足

沒有預設值。

並非所有執行個體類型都支援叢集置放群組。例如, 的預設執行個體類型t3.micro不支援叢集置放群組。如需支援叢集置放群組的執行個體類型清單相關資訊,請參閱《Amazon EC2 使用者指南》中的叢集置放群組規則和限制。如需使用置放群組的秘訣,請參閱 置放群組和執行個體啟動問題

placement_group = DYNAMIC

更新政策:如果變更此設定,則不允許更新。

post_install

(選用) 指定在所有節點引導動作完成後執行的安裝後指令碼的 URL。如需詳細資訊,請參閱自訂引導操作

使用 awsbatch做為排程器時,安裝後指令碼只會在主節點上執行。

參數格式可以是 http://hostname/path/to/script.shs3://bucket-name/path/to/script.sh

沒有預設值。

post_install = s3://<bucket-name>/my-post-install-script.sh

更新政策:必須停止運算機群,才能變更此設定以進行更新。

post_install_args

(選用) 指定要傳遞至安裝後指令碼的引數引號清單。

沒有預設值。

post_install_args = "argument-1 argument-2"

更新政策:必須停止運算機群,才能變更此設定以進行更新。

pre_install

(選用) 指定在啟動任何節點部署引導動作之前執行的預先安裝指令碼的 URL。如需詳細資訊,請參閱自訂引導操作

使用 awsbatch做為排程器時,預先安裝指令碼只會在主節點上執行。

參數格式可以是 http://hostname/path/to/script.shs3://bucket-name/path/to/script.sh

沒有預設值。

pre_install = s3://bucket-name/my-pre-install-script.sh

更新政策:必須停止運算機群,才能變更此設定以進行更新。

pre_install_args

(選用) 指定要傳遞至預先安裝指令碼的引數引號清單。

沒有預設值。

pre_install_args = "argument-3 argument-4"

更新政策:必須停止運算機群,才能變更此設定以進行更新。

proxy_server

(選用) 定義 HTTP 或 HTTPS 代理伺服器,通常為 http://x.x.x.x:8080

沒有預設值。

proxy_server = http://10.11.12.13:8080

更新政策:如果變更此設定,則不允許更新。

queue_settings

(選用) 指定叢集使用佇列而非同質運算機群,以及使用哪些[queue]區段。列出的第一個[queue]區段是預設排程器佇列。queue 區段名稱必須以小寫字母開頭,包含不超過 30 個字元,且僅包含小寫字母、數字和連字號 (-)。

重要

queue_settings 只有在 scheduler 設定為 時,才支援 slurm。不得指定 cluster_typecompute_instance_typeinitial_queue_sizemaintain_initial_sizemax_queue_sizeplacementplacement_group、 和 spot_price設定。您可以在 [cluster]區段[queue] 區段中指定 disable_hyperthreadingenable_efa設定,但不能同時指定兩者。

最多支援五 (5) 個[queue]區段

如需詳細資訊,請參閱[queue]一節

例如,以下設定指定 [queue q1][queue q2] 使用的區段。

queue_settings = q1, q2
注意

queue_settings 2.9.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

raid_settings

(選用) 使用 Amazon EBS 磁碟區 RAID 組態識別 [raid]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[raid]一節

例如,以下設定指定[raid rs]開始用於 Auto Scaling 組態的 區段。

raid_settings = rs

更新政策:如果變更此設定,則不允許更新。

s3_read_resource

(選用) 指定 AWS ParallelCluster 節點獲授予唯讀存取權的 Amazon S3 資源。

例如, arn:aws:s3:::my_corporate_bucket*提供對 的唯讀存取 my_corporate_bucket 儲存貯體和 至儲存貯體中的物件。

如需格式的詳細資訊,請參閱使用 Amazon S3

沒有預設值。

s3_read_resource = arn:aws:s3:::my_corporate_bucket*

更新政策:此設定可以在更新期間變更。

s3_read_write_resource

(選用) 指定 Amazon S3 資源,哪些 AWS ParallelCluster 節點獲授予讀取/寫入存取權。

例如, arn:aws:s3:::my_corporate_bucket/Development/* 提供 Development資料夾中所有物件的讀取/寫入存取權 my_corporate_bucket 儲存貯體。

如需格式的詳細資訊,請參閱使用 Amazon S3

沒有預設值。

s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*

更新政策:此設定可以在更新期間變更。

scaling_settings

使用 Auto Scaling 組態識別 [scaling]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[scaling]一節

例如,以下設定指定 啟動的 區段[scaling custom]用於 Auto Scaling 組態。

scaling_settings = custom

更新政策:如果變更此設定,則不允許更新。

scheduler

(必要) 定義叢集的排程器。

有效選項如下:

awsbatch

AWS Batch

如需awsbatch排程器的詳細資訊,請參閱聯網設定AWS Batch (awsbatch)

sge
注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

Son of Grid Engine (SGE)

slurm

Slurm Workload Manager (Slurm)

torque
注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

Torque Resource Manager (Torque)

注意

在 2.7.0 AWS ParallelCluster 版之前, scheduler 參數為選用,預設值為 sge。從 2.7.0 AWS ParallelCluster 版開始,需要 scheduler 參數。

scheduler = slurm

更新政策:如果變更此設定,則不允許更新。

shared_dir

(選用) 定義掛載共用 Amazon EBS 磁碟區的路徑。

請勿將此選項與多個 Amazon EBS 磁碟區搭配使用。反之,請在每個[ebs]區段下提供shared_dir值。

如需使用多個 Amazon EBS 磁碟區的詳細資訊,請參閱[ebs]一節

預設值為 /shared

下列範例顯示掛載在 的共用 Amazon EBS 磁碟區/myshared

shared_dir = myshared

更新政策:如果變更此設定,則不允許更新。

spot_bid_percentage

(選用)awsbatch是排程器時,設定用於計算 ComputeFleet Spot 價格上限的隨需百分比。

如果未指定,則會選取目前的 Spot 市價,上限為隨需價格。

spot_bid_percentage = 85

更新政策:此設定可以在更新期間變更。

spot_price

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

(選用) 設定傳統排程器上 ComputeFleet 的 Spot 價格上限 (SGE, Slurm 和 Torque)。 僅在cluster_type設定設為 時使用spot。如果您未指定值,則會向您收取 Spot 價格,以隨需價格為上限。如果已定義queue_settings設定,則必須移除此設定,並以[compute_resource]區段中的spot_price設定取代。

如果排程器是 awsbatch,請改用 spot_bid_percentage

如需尋找符合您需求的 Spot 執行個體的協助,請參閱 Spot 執行個體顧問

spot_price = 1.50
注意

在 2.5.0 AWS ParallelCluster 版中,如果spot_price未指定 cluster_type = spot ,則 ComputeFleet 的執行個體啟動會失敗。這是在 2.5.1 AWS ParallelCluster 版中修正的。

更新政策:此設定可以在更新期間變更。

tags

(選用) 定義要使用的標籤 AWS CloudFormation。

如果透過 --tags 指定命令列標籤,則會使用組態標籤來合併它們。

命令列標籤會覆寫具有相同金鑰的組態標籤。

標籤是 JSON 格式。請勿在大括號外使用引號。

如需詳細資訊,請參閱AWS CloudFormation 《 使用者指南》中的AWS CloudFormation 資源標籤類型

tags = {"key" : "value", "key2" : "value2"}

更新政策:如果變更此設定,則不允許更新。

注意

更新政策不支援將 2.8.0 版tags的設定 AWS ParallelCluster 變更為 2.9.1 版。

對於 2.10.0 版到 2.11.7 版,支援變更tags設定的列出的更新政策並不準確。不支援修改此設定的叢集更新。

template_url

(選用) 定義用來建立叢集的 AWS CloudFormation 範本路徑。

更新使用原先建立堆疊所用的範本。

預設為 https://aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json

警告

這是進階參數。此設定的任何變更都會由您自行承擔風險。

template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.9.cfn.json

更新政策:更新期間不會分析此設定。

vpc_settings

(必要) 使用部署叢集的 Amazon VPC 組態來識別 [vpc]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[vpc]一節

例如,以下設定指定 [vpc public] 開始的 區段用於 Amazon VPC 組態。

vpc_settings = public

更新政策:如果變更此設定,則不允許更新。