[cluster] 區段 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

[cluster] 區段

定義可用於建立叢集的叢集範本。組態檔案可以包含多個[cluster]區段。

相同的叢集範本可用來建立多個叢集。

格式是 [cluster cluster-template-name]。[cluster] 依預設會使用 區段中由 cluster_template設定命名的[global]區段,但可以在pcluster命令列上覆寫。

cluster-template-name 必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

[cluster default]

additional_cfn_template

(選用) 定義要與叢集一起啟動的其他 AWS CloudFormation 範本。此額外範本用於建立叢集外的資源,但這些資源是叢集生命週期的一部分。

值必須是公有範本HTTPURL的 ,並提供所有參數。

沒有預設值。

additional_cfn_template = https://<bucket-name>.s3.amazonaws.com/my-cfn-template.yaml

更新政策:如果變更此設定,則不允許更新。

additional_iam_policies

(選用) 指定 Amazon IAM政策的 Amazon Resource Names (ARNs) 清單EC2。除了逗號 AWS ParallelCluster 分隔所需的許可之外,此清單還會連接到叢集中使用的根角色。IAM 政策名稱及其ARN不同。名稱無法用作 的引數additional_iam_policies

如果您的意圖是將額外的政策新增至叢集節點的預設設定,建議您使用 additional_iam_policies設定傳遞額外的自訂IAM政策,而不是使用 ec2_iam_role設定來新增特定EC2政策。這是因為 additional_iam_policies 已新增至 AWS ParallelCluster 所需的預設許可。現有的 ec2_iam_role 必須包含所有必要的許可。但是,由於新增功能時,所需的許可通常會從版本變更為版本,因此現有 ec2_iam_role可能會過時。

沒有預設值。

additional_iam_policies = arn:aws:iam::123456789012:policy/CustomEC2Policy
注意

additional_iam_policies 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:此設定可以在更新期間變更。

base_os

(必要) 指定將哪個作業系統類型用於叢集。

可用選項如下:

  • alinux2

  • centos7

  • ubuntu1804

  • ubuntu2004

注意

對於以 AWS Graviton 為基礎的執行個體,僅ubuntu2004支援 ubuntu1804alinux2或 。

注意

centos8 2.11.4 AWS ParallelCluster 版已移除 的支援。在 ubuntu2004 2.11.0 AWS ParallelCluster 版中已新增 的支援,並ubuntu1604已移除 alinux和 的支援。centos8 已新增 的支援,並在 2.10.0 AWS ParallelCluster 版centos6中移除 的支援。alinux2 2.6.0 版中 AWS ParallelCluster 已新增 的支援。ubuntu1804 已新增 的支援,並在 2.5.0 AWS ParallelCluster 版ubuntu1404中移除 的支援。

除了下表中 AWS 區域 提到的特定不支援 centos7。所有其他 AWS 商業區域都支援下列所有作業系統。

分割區 (AWS 區域) alinux2 centos7 ubuntu1804ubuntu2004
商業 ( AWS 區域 未特別提及) True True True
AWS GovCloud (美國東部) (us-gov-east-1 True False True
AWS GovCloud (美國西部) (us-gov-west-1 True False True
中國 (北京) (cn-north-1) True False True
中國 (寧夏) (cn-northwest-1) True False True
注意

base_os 參數也會決定用來登入叢集的使用者名稱。

  • centos7: centos

  • ubuntu1804ubuntu2004ubuntu

  • alinux2: ec2-user

注意

在 2.7.0 AWS ParallelCluster 版之前, base_os 參數為選用,預設值為 alinux。從 2.7.0 版開始 AWS ParallelCluster ,需要 base_os 參數。

注意

如果 scheduler 參數為 awsbatch,則僅支援 alinux2

base_os = alinux2

更新政策:如果變更此設定,則不允許更新。

cluster_resource_bucket

(選用) 指定用於託管叢集建立時產生的資源的 Amazon S3 儲存貯體名稱。儲存貯體必須已啟用版本控制。如需詳細資訊,請參閱Amazon Simple Storage Service 使用者指南中的使用版本控制。此儲存貯體可用於多個叢集。儲存貯體必須與叢集位於相同的區域。

如果未指定此參數,則會在建立叢集時建立新的儲存貯體。新儲存貯體的名稱為 parallelcluster-random_string。在此名稱中,random_string 是英數字元的隨機字串。所有叢集資源都存放在具有 表單 的路徑中bucket_name/resource_directoryresource_directory 具有 表單 stack_name-random_string,其中 stack_name 是 使用的其中一個 AWS CloudFormation 堆疊的名稱 AWS ParallelCluster。的值 bucket_name 可以在parallelcluster-clustername堆疊輸出中的 ResourcesS3Bucket 值中找到。的值 resource_directory 可以在來自相同堆疊的ArtifactS3RootDirectory輸出值中找到。

預設值為 parallelcluster-random_string

cluster_resource_bucket = amzn-s3-demo-bucket
注意

cluster_resource_bucket 2.10.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。無法強制更新此設定。

cluster_type

(選用) 定義要啟動的叢集類型。如果已定義queue_settings設定,則必須將此設定取代為[queue]區段 中的compute_type設定。

有效選項為:ondemandspot

預設值為 ondemand

如需 Spot 執行個體的詳細資訊,請參閱 使用 競價型執行個體

注意

使用 Spot 執行個體需要AWSServiceRoleForEC2Spot服務連結角色存在於您的帳戶中。若要使用 在帳戶中建立此角色 AWS CLI,請執行下列命令:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

如需詳細資訊,請參閱 Amazon EC2使用者指南 中的 Spot 執行個體請求的服務連結角色

cluster_type = ondemand

更新政策:必須停止運算機群,才能變更此設定以進行更新。

compute_instance_type

(選用) 定義用於叢集運算節點的 Amazon EC2執行個體類型。執行個體類型的架構必須與master_instance_type用於設定的架構相同。如果已定義queue_settings設定,則必須將此設定取代為[compute_resource]區段 中的instance_type設定。

如果您使用的是awsbatch排程器,請參閱 AWS Batch 使用者介面中的運算環境建立,以取得支援的執行個體類型清單。

當排程器為 awsbatch 時,預設為 t2.microoptimal

compute_instance_type = t2.micro
注意

2.8.0 AWS ParallelCluster 版中已新增對 AWS Graviton 型執行個體 (包括 A1C6g執行個體) 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

compute_root_volume_size

(選用) 以 GB (GiB ) 為單位指定 ComputeFleet 根磁碟區大小。必須AMI支援 growroot

預設值為 35

注意

對於 2.5.0 和 2.10.4 之間的 AWS ParallelCluster 版本,預設值為 25。在 2.5.0 AWS ParallelCluster 版之前,預設值為 20。

compute_root_volume_size = 35

更新政策:必須停止運算機群,才能變更此設定以進行更新。

custom_ami

(選用) 指定AMI要用於主機和運算節點的自訂 ID,而不是預設發佈的 AMIs。如需詳細資訊,請參閱 修改 AMI建置自訂 AWS ParallelCluster AMI

沒有預設值。

custom_ami = ami-00d4efc81188687a0

如果自訂AMI需要額外的許可才能啟動,則必須將這些許可新增至使用者和前端節點政策。

例如,如果自訂AMI具有與其相關聯的加密快照,則使用者和頭節點政策都需要下列其他政策:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:<AWS_REGION>:<AWS_ACCOUNT_ID>:key/<AWS_KMS_KEY_ID>" ] } ] }

更新政策:如果變更此設定,則不允許更新。

cw_log_settings

(選用) 使用 CloudWatch Logs 組態識別 [cw_log]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[cw_log]章節 Amazon CloudWatch 儀表板與 Amazon CloudWatch Logs 整合

例如,下列設定指定開始的區段[cw_log custom-cw]用於 CloudWatch Logs 組態。

cw_log_settings = custom-cw
注意

cw_log_settings 2.6.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

dashboard_settings

(選用) 使用 CloudWatch儀表板組態識別 [dashboard]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[dashboard]一節。

例如,下列設定指定開始的區段[dashboard custom-dashboard用於 CloudWatch 儀表板組態。

dashboard_settings = custom-dashboard
注意

dashboard_settings 2.10.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:此設定可以在更新期間變更。

dcv_settings

(選用) 使用 Amazon DCV組態識別 [dcv]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [dcv]一節

例如,下列設定會指定 [dcv custom-dcv] Amazon DCV組態使用的啟動區段。

dcv_settings = custom-dcv
注意

在 AWS Graviton 型執行個體上,Amazon DCV僅支援 alinux2

注意

dcv_settings 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

desired_vcpus

(選用) 在 vCPUs 運算環境中指定所需的 數目。僅在排程器是 awsbatch 時才使用。

預設值為 4

desired_vcpus = 4

更新政策:更新期間不會分析此設定。

disable_cluster_dns

(選用) 指定是否不應建立叢集DNS的項目。根據預設, 會 AWS ParallelCluster 建立 Route 53 託管區域。如果 disable_cluster_dns 設定為 true,則不會建立託管區域。

預設值為 false

disable_cluster_dns = true
警告

叢集需要名稱解析系統才能正常運作。如果 disable_cluster_dns 設定為 true,則必須提供額外的名稱解析系統。

重要

disable_cluster_dns = true只有在指定queue_settings設定時才支援。

注意

disable_cluster_dns 2.9.1 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

disable_hyperthreading

(選用) 停用主機和運算節點上的超執行緒。並非所有執行個體類型都可以停用超執行緒。如需支援停用超執行緒的執行個體類型清單,請參閱 Amazon EC2使用者指南 中的CPU每個執行個體類型的每個CPU核心和執行緒。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的disable_hyperthreading設定。

預設值為 false

disable_hyperthreading = true
注意

disable_hyperthreading 只會在 時影響主機節點scheduler = awsbatch

注意

disable_hyperthreading 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

ebs_settings

(選用) 使用安裝在主機節點上的 Amazon EBS磁碟區來識別[ebs]區段。使用多個 Amazon EBS磁碟區時,請在清單中輸入這些參數,每個參數都以逗號分隔。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

最多支援五 (5) 個額外的 Amazon EBS磁碟區。

如需詳細資訊,請參閱 [ebs]一節

例如,下列設定指定 Amazon EBS磁碟區啟動[ebs custom1][ebs custom2]使用的區段。

ebs_settings = custom1, custom2

更新政策:如果變更此設定,則不允許更新。

ec2_iam_role

(選用) 定義EC2連接至叢集中所有執行個體的 Amazon 現有IAM角色的名稱。IAM 角色名稱及其 Amazon Resource Name (ARN) 不同。ARNs 無法用作 的引數ec2_iam_role

如果指定此選項,則會忽略 additional_iam_policies 設定。如果您的意圖是將額外的政策新增至叢集節點的預設設定,建議您使用 additional_iam_policies設定傳遞額外的自訂IAM政策,而不是使用 ec2_iam_role設定。

如果未指定此選項,EC2則會使用 Amazon 的預設 AWS ParallelCluster IAM角色。如需詳細資訊,請參閱AWS Identity and Access Management 中的 角色 AWS ParallelCluster

沒有預設值。

ec2_iam_role = ParallelClusterInstanceRole

更新政策:如果變更此設定,則不允許更新。

efs_settings

(選用) 指定與 Amazon EFS 檔案系統相關的設定。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱[efs]一節。

例如,下列設定指定 [efs customfs] Amazon EFS 檔案系統組態使用啟動的 區段。

efs_settings = customfs

更新政策:如果變更此設定,則不允許更新。

enable_efa

(選用) 如果存在,請指定已為運算節點啟用 Elastic Fabric Adapter (EFA)。若要檢視支援 的EC2執行個體清單EFA,請參閱 Amazon EC2 適用於 Linux 執行個體的使用者指南 中的支援執行個體類型。如需詳細資訊,請參閱Elastic Fabric Adapter。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的enable_efa設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱 placementplacement_group

enable_efa = compute
注意

在 2.10.1 AWS ParallelCluster 版中新增了對 EFA Arm 型 Graviton2 執行個體的支援。

更新政策:如果變更此設定,則不允許更新。

enable_efa_gdr

(選用) 從 2.11.3 AWS ParallelCluster 版開始,此設定沒有效果。如果執行個體類型和作業系統都支援 GPUDirectRDMA(遠端直接記憶體存取EFA),則一律會啟用 Elastic Fabric Adapter () 支援。

注意

AWS ParallelCluster 2.10.0 至 2.11.2 版:如果 compute,則指定為運算節點啟用 Elastic Fabric Adapter (EFA) 支援 GPUDirectRDMA(遠端直接記憶體存取)。將此設定設為 compute需要將enable_efa設定設為 compute。EFA 支援GPUDirectRDMA特定作業系統 ( 為 alinux2centos7ubuntu1804p4d.24xlarge) 上的特定執行個體類型 (base_osubuntu2004。如果已定義queue_settings設定,則可以定義此設定,也可以定義[queue]區段中的enable_efa_gdr設定。應使用叢集置放群組以充分減少執行個體之間的延遲。如需詳細資訊,請參閱 placementplacement_group

enable_efa_gdr = compute
注意

enable_efa_gdr 2.10.0 AWS ParallelCluster 版已新增 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

enable_intel_hpc_platform

(選用) 如果存在,則表示接受 Intel Parallel Studio 的最終使用者授權合約。這會導致 Intel Parallel Studio 安裝在主機節點上並與運算節點共用。這會將幾分鐘新增至主機節點開機所需的時間。enable_intel_hpc_platform 設定僅在 上受支援 CentOS 7 (base_os = centos7)。

預設值為 false

enable_intel_hpc_platform = true
注意

enable_intel_hpc_platform 參數與以 AWS Graviton 為基礎的執行個體不相容。

注意

enable_intel_hpc_platform 2.5.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:如果變更此設定,則不允許更新。

encrypted_ephemeral

(選用) 使用 LUKS(Linux 統一金鑰設定),使用不可復原的記憶體內金鑰加密暫時性執行個體存放磁碟區。

如需詳細資訊,請參閱https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md

預設值為 false

encrypted_ephemeral = true

更新政策:如果變更此設定,則不允許更新。

ephemeral_dir

(選用) 定義在使用執行個體存放區磁碟區時掛載它們的路徑。

預設值為 /scratch

ephemeral_dir = /scratch

更新政策:如果變更此設定,則不允許更新。

extra_json

(選用) 定義合併到 JSON的額外項目 Chef dna.json。如需詳細資訊,請參閱 建置自訂 AWS ParallelCluster AMI

預設值為 {}

extra_json = {}
注意

從 2.6.1 AWS ParallelCluster 版開始,在啟動節點時,依預設會略過大部分的安裝配方,以改善啟動時間。若要以啟動時間的費用執行所有安裝配方,以獲得更好的向後相容性,請將 "skip_install_recipes" : "no"新增至 extra_json 設定中的 cluster 金鑰。例如:

extra_json = { "cluster" : { "skip_install_recipes" : "no" } }

更新政策:必須停止運算機群,才能變更此設定以進行更新。

fsx_settings

(選用) 指定定義 FSx Lustre 組態的 區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [fsx]一節

例如,下列設定指定啟動的 區段[fsx fs]用於 FSx for Lustre 組態。

fsx_settings = fs

更新政策:如果變更此設定,則不允許更新。

iam_lambda_role

(選用) 定義現有 AWS Lambda 執行角色的名稱。此角色會連接至叢集中的所有 Lambda 函數。如需詳細資訊,請參閱《AWS Lambda 開發人員指南》中的 AWS Lambda 執行角色

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

IAM 角色名稱及其 Amazon Resource Name (ARN) 不同。ARNs 無法用作 的引數iam_lambda_role。如果同時定義 iam_lambda_role ec2_iam_role和 ,且 schedulersgeslurmtorque,則不會建立任何角色。如果 schedulerawsbatch,則會在 期間建立角色pcluster start。如需政策範例,請參閱 ParallelClusterLambdaPolicy 使用 SGE, Slurm,或 TorqueParallelClusterLambdaPolicy 使用 awsbatch

沒有預設值。

iam_lambda_role = ParallelClusterLambdaRole
注意

iam_lambda_role 2.10.1 AWS ParallelCluster 版中已新增 的支援。

更新政策:此設定可以在更新期間變更。

initial_queue_size

(選用) 將 Amazon EC2執行個體的初始數量設定為在叢集中啟動的運算節點。如果已定義queue_settings設定,則必須移除此設定,並由[compute_resource]區段 中的initial_count設定取代。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

此設定僅適用於傳統排程器 (SGE, Slurm 和 Torque)。 如果maintain_initial_size設定為 true,則initial_queue_size設定必須至少為一 (1) 個。

如果排程器是 awsbatch,請改用 min_vcpus

預設為 2

initial_queue_size = 2

更新政策:此設定可以在更新期間變更。

key_name

(選用) 為現有的 Amazon EC2金鑰對命名,以啟用對執行個體的SSH存取。

key_name = mykey
注意

在 2.11.0 AWS ParallelCluster 版之前, key_name是必要的設定。

更新政策:如果變更此設定,則不允許更新。

maintain_initial_size

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

(選用) 維護傳統排程器 Auto Scaling 群組的初始大小 (SGE, Slurm 和 Torque).

如果排程器是 awsbatch,請改用 desired_vcpus

此設定是布林值旗標。如果設定為 true,Auto Scaling 群組的成員不會少於 的值initial_queue_size,且 的值initial_queue_size必須是一 (1) 或更高。叢集仍可擴充至 max_queue_size 值。如果 cluster_type = spot ,Auto Scaling 群組可以中斷執行個體,且大小可能會降至 以下initial_queue_size

如果設定為 false,Auto Scaling 群組可以縮減為零 (0) 成員,以防止資源在不需要時閒置。

如果已定義 queue_settings 設定,則必須移除此設定,並由[compute_resource]區段 中的 initial_countmin_count設定取代。

預設為 false

maintain_initial_size = false

更新政策:此設定可以在更新期間變更。

master_instance_type

(選用) 定義用於主機節點的 Amazon EC2執行個體類型。執行個體類型的架構必須與用於compute_instance_type設定的架構相同。

在具有 免費方案 AWS 區域 的 中,預設為 免費方案執行個體類型 (t2.microt3.micro)。在 中 AWS 區域 沒有免費方案的 中,預設為 t3.micro。如需 AWS 免費方案的詳細資訊,請參閱 AWS 免費方案 FAQs

master_instance_type = t2.micro
注意

在 2.10.1 AWS ParallelCluster 版之前, 在所有 t2.micro中預設為 AWS 區域。在 2.10.0 AWS ParallelCluster 版中, p4d.24xlarge不支援主機節點。2.8.0 AWS ParallelCluster 版中已新增對 AWS Graviton 型執行個體 (例如 A1C6g) 的支援。

更新政策:如果變更此設定,則不允許更新。

master_root_volume_size

(選用) 以 GB (GiB ) 為單位指定主機節點根磁碟區大小。必須AMI支援 growroot

預設值為 35

注意

對於 2.5.0 和 2.10.4 之間的 AWS ParallelCluster 版本,預設值為 25。在 2.5.0 AWS ParallelCluster 版之前,預設值為 20。

master_root_volume_size = 35

更新政策:如果變更此設定,則不允許更新。

max_queue_size

(選用) 設定可在叢集中啟動的 Amazon EC2執行個體數量上限。如果已定義queue_settings設定,則必須移除此設定,並以[compute_resource]區段 中的max_count設定取代。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

此設定僅適用於傳統排程器 (SGE, Slurm 和 Torque).

如果排程器是 awsbatch,請改用 max_vcpus

預設為 10

max_queue_size = 10

更新政策:此設定可以在更新期間變更,但如果值減少,則應停止運算機群。否則,現有的節點可能會終止。

max_vcpus

(選用) 指定 vCPUs 運算環境中的 數目上限。僅在排程器是 awsbatch 時才使用。

預設值為 20

max_vcpus = 20

更新政策:此設定無法在更新期間減少。

min_vcpus

(選用) 維護awsbatch排程器 Auto Scaling 群組的初始大小。

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

如果排程器是 SGE, Slurm,或 Torque,請maintain_initial_size改用 。

運算環境的成員數不得少於 min_vcpus 的值。

預設為 0

min_vcpus = 0

更新政策:此設定可以在更新期間變更。

placement

(選用) 定義叢集置放群組邏輯,讓整個叢集或僅運算執行個體可以使用叢集置放群組。

如果已定義queue_settings設定,則應移除此設定,並以每個區段placement_group的設定取代。 [queue]如果相同的置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱 Amazon EC2使用者指南 中的執行個體容量不足。多個佇列只有在預先建立並在每個佇列placement_group的設定中設定時,才能共用置放群組。如果每個[queue]區段都定義了placement_group設定,則主機節點不能位於佇列的置放群組中。

有效選項為 clustercompute

當排程器為 時,不會使用此參數awsbatch

預設值為 compute

placement = compute

更新政策:如果變更此設定,則不允許更新。

placement_group

(選用) 定義叢集置放群組。如果已定義queue_settings設定,則應移除此設定,並由[queue]區段 中的placement_group設定取代。

有效選項為下列值:

  • DYNAMIC

  • 現有的 Amazon EC2叢集置放群組名稱

設為 DYNAMIC 時,即會建立唯一的置放群組,並在叢集堆疊過程將其刪除。

當排程器為 時,不會使用此參數awsbatch

如需置放群組的詳細資訊,請參閱 Amazon EC2使用者指南 中的置放群組。如果相同的置放群組用於不同的執行個體類型,則請求可能會因為容量不足錯誤而失敗。如需詳細資訊,請參閱 Amazon EC2使用者指南 中的執行個體容量不足

沒有預設值。

並非所有執行個體類型都支援叢集置放群組。例如, 的預設執行個體類型t3.micro不支援叢集置放群組。如需支援叢集置放群組的執行個體類型清單的相關資訊,請參閱 Amazon EC2使用者指南 中的叢集置放群組規則和限制。如需使用置放群組的秘訣,請參閱 置放群組和執行個體啟動問題

placement_group = DYNAMIC

更新政策:如果變更此設定,則不允許更新。

post_install

(選用) 指定在所有節點引導動作完成後執行URL的安裝後指令碼的 。如需詳細資訊,請參閱自訂引導操作

使用 awsbatch做為排程器時,安裝後指令碼只會在主機節點上執行。

參數格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

沒有預設值。

post_install = s3://<bucket-name>/my-post-install-script.sh

更新政策:必須停止運算機群,才能變更此設定以進行更新。

post_install_args

(選用) 指定要傳遞至安裝後指令碼的引數引號清單。

沒有預設值。

post_install_args = "argument-1 argument-2"

更新政策:必須停止運算機群,才能變更此設定以進行更新。

pre_install

(選用) 指定在啟動任何節點部署引導動作之前執行URL的預先安裝指令碼的 。如需詳細資訊,請參閱自訂引導操作

使用 awsbatch做為排程器時,預先安裝指令碼只會在主機節點上執行。

參數格式可以是 http://hostname/path/to/script.shs3://bucketname/path/to/script.sh

沒有預設值。

pre_install = s3://<bucket-name>/my-pre-install-script.sh

更新政策:必須停止運算機群,才能變更此設定以進行更新。

pre_install_args

(選用) 指定要傳遞至預先安裝指令碼的引數引號清單。

沒有預設值。

pre_install_args = "argument-3 argument-4"

更新政策:必須停止運算機群,才能變更此設定以進行更新。

proxy_server

(選用) 定義 HTTP或 HTTPS Proxy 伺服器,通常為 http://x.x.x.x:8080

沒有預設值。

proxy_server = http://10.11.12.13:8080

更新政策:如果變更此設定,則不允許更新。

queue_settings

(選用) 指定叢集使用佇列而非同質運算機群,以及使用哪些[queue]區段。列出的第一個[queue]區段是預設排程器佇列。queue 區段名稱必須以小寫字母開頭,包含不超過 30 個字元,且僅包含小寫字母、數字和連字號 (-)。

重要

queue_settings 只有在 scheduler 設定為 時受支援slurm。不得指定 cluster_typecompute_instance_typeinitial_queue_sizemaintain_initial_sizemax_queue_sizeplacementplacement_groupspot_price設定。disable_hyperthreadingenable_efa設定可以在 [cluster]區段[queue] 區段中指定,但不能同時指定兩者。

最多支援五 (5) 個[queue]區段

如需詳細資訊,請參閱[queue]一節。

例如,下列設定指定啟動[queue q1][queue q2]使用的區段。

queue_settings = q1, q2
注意

queue_settings 2.9.0 AWS ParallelCluster 版中已新增 的支援。

更新政策:必須停止運算機群,才能變更此設定以進行更新。

raid_settings

(選用) 使用 Amazon EBS磁碟區RAID組態識別 [raid]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [raid]一節

例如,下列設定指定[raid rs]開始用於 Auto Scaling 組態的區段。

raid_settings = rs

更新政策:如果變更此設定,則不允許更新。

s3_read_resource

(選用) 指定 Amazon S3 資源,其中 AWS ParallelCluster 節點被授予唯讀存取權。

例如, arn:aws:s3:::my_corporate_bucket*提供對 的唯讀存取權 my_corporate_bucket 儲存貯體和 至儲存貯體中的物件。

如需格式的詳細資訊,請參閱使用 Amazon S3

沒有預設值。

s3_read_resource = arn:aws:s3:::my_corporate_bucket*

更新政策:此設定可以在更新期間變更。

s3_read_write_resource

(選用) 指定 Amazon S3 資源,哪些 AWS ParallelCluster 節點被授予讀取/寫入存取權。

例如, arn:aws:s3:::my_corporate_bucket/Development/* 提供對 Development資料夾中所有物件的讀取/寫入存取權 my_corporate_bucket 儲存貯體。

如需格式的詳細資訊,請參閱使用 Amazon S3

沒有預設值。

s3_read_write_resource = arn:aws:s3:::my_corporate_bucket/*

更新政策:此設定可以在更新期間變更。

scaling_settings

使用 Auto Scaling 組態識別 [scaling]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [scaling]一節

例如,下列設定指定 Auto Scaling 組態[scaling custom]使用啟動的區段。

scaling_settings = custom

更新政策:如果變更此設定,則不允許更新。

scheduler

(必要) 定義叢集的排程器。

有效選項為下列值:

awsbatch

AWS Batch

如需awsbatch排程器的詳細資訊,請參閱聯網設定AWS Batch (awsbatch)

sge
注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

Son of Grid Engine (SGE)

slurm

Slurm Workload Manager (Slurm)

torque
注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

Torque Resource Manager (Torque)

注意

在 2.7.0 AWS ParallelCluster 版之前, scheduler 參數為選用,預設值為 sge。從 2.7.0 AWS ParallelCluster 版開始,需要 scheduler 參數。

scheduler = slurm

更新政策:如果變更此設定,則不允許更新。

shared_dir

(選用) 定義掛載共用 Amazon EBS磁碟區的路徑。

請勿將此選項與多個 Amazon EBS磁碟區搭配使用。相反地,請在每個[ebs]區段 下提供shared_dir值。

如需使用多個 Amazon EBS磁碟區的詳細資訊,請參閱[ebs]一節

預設值為 /shared

下列範例顯示掛載在 的共用 Amazon EBS磁碟區/myshared

shared_dir = myshared

更新政策:如果變更此設定,則不允許更新。

spot_bid_percentage

(選用)awsbatch是排程器時 ComputeFleet,設定用於計算 最高 Spot 價格的隨需百分比。

如果未指定,則會選取目前的 Spot 市價,上限為隨需價格。

spot_bid_percentage = 85

更新政策:此設定可以在更新期間變更。

spot_price

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。

(選用) 為傳統排程器 ComputeFleet 上的 設定 Spot 價格上限 (SGE, Slurm 和 Torque)。 僅在cluster_type設定設為 時使用spot。如果您未指定值,則會向您收取 Spot 價格,以隨需價格為上限。如果已定義queue_settings設定,則必須移除此設定,並由[compute_resource]區段 中的spot_price設定取代。

如果排程器是 awsbatch,請改用 spot_bid_percentage

如需尋找符合您需求的 Spot 執行個體的協助,請參閱 Spot 執行個體顧問

spot_price = 1.50
注意

在 2.5.0 AWS ParallelCluster 版中,如果spot_price未指定 cluster_type = spot ,則執行個體會啟動 ComputeFleet 失敗。這是在 2.5.1 AWS ParallelCluster 版中修正的。

更新政策:此設定可以在更新期間變更。

tags

(選用) 定義 要使用的標籤 AWS CloudFormation。

如果透過 --tags 指定命令列標籤,則會使用組態標籤來合併它們。

命令列標籤會覆寫具有相同金鑰的組態標籤。

標籤JSON已格式化。請勿在捲曲支架之外使用引號。

如需詳細資訊,請參閱 AWS CloudFormation 使用者指南 中的AWS CloudFormation 資源標籤類型

tags = {"key" : "value", "key2" : "value2"}

更新政策:如果變更此設定,則不允許更新。

注意

更新政策不支援將 2.8.0 版tags的設定 AWS ParallelCluster 變更為 2.9.1 版。

對於 2.10.0 版到 2.11.7 版,支援變更tags設定的列出的更新政策並不準確。不支援修改此設定時的叢集更新。

template_url

(選用) 定義用來建立叢集的 AWS CloudFormation 範本路徑。

更新使用原先建立堆疊所用的範本。

預設為 https://aws_region_name-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version.cfn.json

警告

這是進階參數。此設定的任何變更都會由您自行承擔風險。

template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.9.cfn.json

更新政策:更新期間不會分析此設定。

vpc_settings

(必要) 使用部署叢集的 Amazon VPC組態來識別 [vpc]區段。區段名稱必須以字母開頭,包含不超過 30 個字元,且僅包含字母、數字、連字號 (-) 和底線 (_)。

如需詳細資訊,請參閱 [vpc]一節

例如,下列設定會指定 [vpc public] Amazon VPC組態使用的啟動區段。

vpc_settings = public

更新政策:如果變更此設定,則不允許更新。