設定 AWS ParallelCluster - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 AWS ParallelCluster

安裝後 AWS ParallelCluster,請完成下列組態步驟。

確認 AWS 您的帳戶具有的角色包含執行 pcluster 所需的許可CLI。如需詳細資訊,請參閱AWS ParallelCluster 範例執行個體和使用者政策

設定您的 AWS 登入資料。如需詳細資訊,請參閱 AWS CLI 使用者指南中的設定 AWS CLI

$ aws configure AWS Access Key ID [None]: AKIAIOSFODNN7EXAMPLE AWS Secret Access Key [None]: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY Default AWS 區域 name [us-east-1]: us-east-1 Default output format [None]:

啟動叢集 AWS 區域 的 必須至少有一個 Amazon EC2金鑰對。如需詳細資訊,請參閱《Amazon 使用者指南》中的 Amazon EC2金鑰對 EC2

$ pcluster configure

設定精靈會提示您輸入建立叢集所需的所有資訊。使用 AWS Batch 做為排程器時,序列的詳細資訊與使用 時不同 Slurm。 如需叢集組態的詳細資訊,請參閱 組態

注意

從 2.11.5 版開始, AWS ParallelCluster 不支援使用 SGE 或 Torque 排程器。您可以在 和 2.11.4 之前的版本中繼續使用它們,但它們不符合未來更新的資格,也不符合 AWS 服務和 AWS 支援團隊對支援進行故障診斷的資格。

Slurm

從有效 AWS 區域 識別符清單中,選擇您要叢集執行 AWS 區域 的位置。

注意

AWS 區域 顯示的 清單是以您帳戶的分割區為基礎,且僅包含為您的帳戶 AWS 區域 啟用的 。如需 AWS 區域 為您的帳戶啟用 的詳細資訊,請參閱《》中的管理 AWS 區域AWS 一般參考。顯示的範例來自 AWS 全域分割區。如果您的帳戶位於 AWS GovCloud (US) 分割區中,則只會列出該分割區 AWS 區域 中的 (gov-us-east-1gov-us-west-1)。同樣地,如果您的帳戶位於 AWS 中國分割區中,則只會顯示 cn-northwest-1 cn-north-1和 。如需 AWS 區域 支援的完整清單 AWS ParallelCluster,請參閱 支援地區

Allowed values for the AWS 區域 ID: 1. af-south-1 2. ap-east-1 3. ap-northeast-1 4. ap-northeast-2 5. ap-south-1 6. ap-southeast-1 7. ap-southeast-2 8. ca-central-1 9. eu-central-1 10. eu-north-1 11. eu-south-1 12. eu-west-1 13. eu-west-2 14. eu-west-3 15. me-south-1 16. sa-east-1 17. us-east-1 18. us-east-2 19. us-west-1 20. us-west-2 AWS 區域 ID [ap-northeast-1]:

選擇要與叢集搭配使用的排程器。

Allowed values for Scheduler: 1. slurm 2. awsbatch Scheduler [slurm]:

選擇作業系統。

Allowed values for Operating System: 1. alinux2 2. centos7 3. ubuntu1804 4. ubuntu2004 Operating System [alinux2]:
注意

alinux2 2.6.0 AWS ParallelCluster 版中已新增 的支援。

輸入運算節點叢集的最小和最大大小。這是以執行個體數量為單位測量而得。

Minimum cluster size (instances) [0]: Maximum cluster size (instances) [10]:

輸入頭部和運算節點執行個體類型。對於執行個體類型,您的帳戶執行個體限制足以滿足您的需求。如需詳細資訊,請參閱《Amazon EC2使用者指南》中的隨需執行個體限制

Master instance type [t2.micro]: Compute instance type [t2.micro]:

金鑰對是從在所選 EC2 中向 Amazon 註冊的金鑰對中選取 AWS 區域。

Allowed values for EC2 Key Pair Name: 1. prod-uswest1-key 2. test-uswest1-key EC2 Key Pair Name [prod-uswest1-key]:

完成上述步驟後,決定要使用現有 VPC或讓 VPC 為您 AWS ParallelCluster 建立 。如果您沒有正確設定的 VPC, AWS ParallelCluster 可以建立新的 。它在相同的公有子網路中同時使用頭部和運算節點,或僅使用公有子網路中具有私有子網路中所有節點的頭部節點。您可以達到 VPCs中 的數量限制 AWS 區域。VPCs 每個的預設限制為 5 個 AWS 區域。如需此限制以及如何請求增加的詳細資訊,請參閱《Amazon VPC 使用者指南》中的 VPC和 子網路

如果您讓 AWS ParallelCluster 建立 VPC,您必須決定所有節點是否都應該位於公有子網路中。

重要

VPCs 根據預設, 建立 AWS ParallelCluster 的 不會啟用VPC流程日誌。 VPC流程日誌可讓您擷取進出 中網路介面之 IP 流量的相關資訊VPCs。如需詳細資訊,請參閱《Amazon VPC使用者指南》中的VPC流程日誌

注意

如果您選擇 1. Master in a public subnet and compute fleet in a private subnet, AWS ParallelCluster 會建立會產生額外費用的NAT閘道,即使您指定免費方案資源。

Automate VPC creation? (y/n) [n]: y Allowed values for Network Configuration: 1. Master in a public subnet and compute fleet in a private subnet 2. Master and compute fleet in the same public subnet Network Configuration [Master in a public subnet and compute fleet in a private subnet]: 1 Beginning VPC creation. Please do not leave the terminal until the creation is finalized

如果您未建立新的 VPC,則必須選取現有的 VPC。

如果您選擇 AWS ParallelCluster 建立 VPC,請記下 VPC ID,以便稍後使用 AWS CLI 刪除。

Automate VPC creation? (y/n) [n]: n Allowed values for VPC ID: # id name number_of_subnets --- --------------------- --------------------------------- ------------------- 1 vpc-0b4ad9c4678d3c7ad ParallelClusterVPC-20200118031893 2 2 vpc-0e87c753286f37eef ParallelClusterVPC-20191118233938 5 VPC ID [vpc-0b4ad9c4678d3c7ad]: 1

選取 VPC 之後,您需要決定是否使用現有的子網路或建立新的子網路。

Automate Subnet creation? (y/n) [y]: y
Creating CloudFormation stack... Do not leave the terminal until the process has finished
AWS Batch

從有效 AWS 區域 識別符清單中,選擇您要叢集執行 AWS 區域 的位置。

Allowed values for AWS 區域 ID: 1. ap-northeast-1 2. ap-northeast-2 3. ap-south-1 4. ap-southeast-1 5. ap-southeast-2 6. ca-central-1 7. eu-central-1 8. eu-north-1 9. eu-west-1 10. eu-west-2 11. eu-west-3 12. sa-east-1 13. us-east-1 14. us-east-2 15. us-west-1 16. us-west-2 AWS 區域 ID [ap-northeast-1]:

選擇要與叢集搭配使用的排程器。

Allowed values for Scheduler: 1. slurm 2. awsbatch Scheduler [awsbatch]:

當選取 awsbatch 做為排程器時,alinux2 會用作為作業系統。

輸入運算節點叢集的最小和最大大小。這是在 中測量vCPUs。

Minimum cluster size (vcpus) [0]: Maximum cluster size (vcpus) [10]:

輸入頭部節點執行個體類型。使用 awsbatch 排程器時,運算節點會使用 optimal 的執行個體類型。

Master instance type [t2.micro]:

Amazon EC2金鑰對是從在所選 EC2 中向 Amazon 註冊的金鑰對中選取 AWS 區域。

Allowed values for EC2 Key Pair Name: 1. prod-uswest1-key 2. test-uswest1-key EC2 Key Pair Name [prod-uswest1-key]:

決定是否使用現有 VPCs或讓 VPCs 為您 AWS ParallelCluster 建立。如果您沒有正確設定的 VPC, AWS ParallelCluster 可以建立新的 。它在相同的公有子網路中同時使用頭部和運算節點,或僅使用公有子網路中具有私有子網路中所有節點的頭部節點。您可以達到 VPCs中 的數量限制 AWS 區域。的預設數量VPCs為 5。如需此限制以及如何請求增加的詳細資訊,請參閱《Amazon VPC 使用者指南》中的 VPC和 子網路

重要

VPCs 根據預設, 建立 AWS ParallelCluster 的 不會啟用VPC流程日誌。 VPC流程日誌可讓您擷取進出 中網路介面之 IP 流量的相關資訊VPCs。如需詳細資訊,請參閱《Amazon VPC使用者指南》中的VPC流程日誌

如果您讓 AWS ParallelCluster 建立 VPC,請決定所有節點是否都應該位於公有子網路中。

注意

如果您選擇 1. Master in a public subnet and compute fleet in a private subnet, AWS ParallelCluster 會建立會產生額外費用的NAT閘道,即使您指定免費方案資源。

Automate VPC creation? (y/n) [n]: y Allowed values for Network Configuration: 1. Master in a public subnet and compute fleet in a private subnet 2. Master and compute fleet in the same public subnet Network Configuration [Master in a public subnet and compute fleet in a private subnet]: 1 Beginning VPC creation. Please do not leave the terminal until the creation is finalized

如果您未建立新的 VPC,則必須選取現有的 VPC。

如果您選擇 AWS ParallelCluster 建立 VPC,請記下 VPC ID,以便稍後使用 AWS CLI 刪除。

Automate VPC creation? (y/n) [n]: n Allowed values for VPC ID: # id name number_of_subnets --- --------------------- --------------------------------- ------------------- 1 vpc-0b4ad9c4678d3c7ad ParallelClusterVPC-20200118031893 2 2 vpc-0e87c753286f37eef ParallelClusterVPC-20191118233938 5 VPC ID [vpc-0b4ad9c4678d3c7ad]: 1

選取 VPC 後,決定要使用現有的子網路或建立新的子網路。

Automate Subnet creation? (y/n) [y]: y
Creating CloudFormation stack... Do not leave the terminal until the process has finished

當您完成上述步驟時,簡單的叢集會啟動至 VPC。VPC 使用支援公有 IP 地址的現有子網路。子網路的路由表為 0.0.0.0/0 => igw-xxxxxx。請注意下列條件:

  • VPC 必須有 DNS Resolution = yesDNS Hostnames = yes

  • 對於 , 也VPC應該有具有正確 DHCP的選項domain-name AWS 區域。預設DHCP選項集已指定必要的 AmazonProvidedDNS。 如果指定多個網域名稱伺服器,請參閱《Amazon VPC使用者指南》中的DHCP選項集。使用私有子網路時,請使用NAT閘道或內部代理來啟用運算節點的 Web 存取。如需詳細資訊,請參閱網路組態

當所有設定都包含有效值時,您可以執行建立命令來啟動叢集。

$ pcluster create mycluster

叢集達到「CREATE_COMPLETE」狀態後,您可以使用一般SSH用戶端設定來連線到它。如需連線至 Amazon EC2執行個體的詳細資訊,請參閱《Amazon EC2使用者指南》中的 EC2 使用者指南

若要刪除叢集,請執行下列命令。

$ pcluster delete --region us-east-1 mycluster

若要刪除 中的網路資源VPC,您可以刪除 CloudFormation 網路堆疊。堆疊名稱開頭為 "parallelclusternetworking-" 和 包含 "YYYYMMDDHHMMSS" 格式的建立時間。您可以使用 list-stacks 命令列出堆疊。

$ aws --region us-east-1 cloudformation list-stacks \ --stack-status-filter "CREATE_COMPLETE" \ --query "StackSummaries[].StackName" | \ grep -e "parallelclusternetworking-" "parallelclusternetworking-pubpriv-20191029205804"

您可以使用 delete-stack 命令來刪除堆疊。

$ aws --region us-east-1 cloudformation delete-stack \ --stack-name parallelclusternetworking-pubpriv-20191029205804

為您pcluster configure建立VPC的 不會在 CloudFormation 聯網堆疊中建立。您可以在 主控台或使用 VPC手動刪除。 AWS CLI

$ aws --region us-east-1 ec2 delete-vpc --vpc-id vpc-0b4ad9c4678d3c7ad