設定 AWS ParallelCluster - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定 AWS ParallelCluster

安裝之後 AWS ParallelCluster,完成下列設定步驟。

驗證您的 AWS 帳戶的角色包含執行 pclusterCLI. 如需詳細資訊,請參閱AWS ParallelCluster 範例執行個體和使用者政策

設定您的 AWS 認證。如需詳細資訊,請參閱配置 AWS CLI 中的 AWS CLI 用戶指南

$ aws configure AWS Access Key ID [None]: AKIAIOSFODNN7EXAMPLE AWS Secret Access Key [None]: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY Default AWS 區域 name [us-east-1]: us-east-1 Default output format [None]:

所以此 AWS 區域 啟動叢集的位置必須至少有一個 Amazon EC2 key pair。如需詳細資訊,請參閱 Amazon EC2使用者指南中的 Amazon EC2 金鑰對

$ pcluster configure

設定精靈會提示您輸入建立叢集所需的所有資訊。使用時序列的細節不同 AWS Batch 作為調度程序與使用相比 Slurm。 如需叢集配置的詳細資訊,請參閱組態

注意

從版本 2.11.5 開始, AWS ParallelCluster 不支持使用 SGE 或 Torque 排程器。您可以在 2.11.4 以下版本中繼續使用它們,但它們不符合 future 更新或疑難排解支援的資格 AWS 服務及 AWS Support 團隊。

Slurm

從有效列表 AWS 區域 識別碼,選擇 AWS 區域 您希望叢集執行的位置。

注意

的列表 AWS 區域 顯示的是基於您帳戶的分區,並且僅包括 AWS 區域 已針對您的帳戶啟用。如需有關啟用的詳細資訊 AWS 區域 對於您的帳戶,請參閱管理 AWS 區域 中的 AWS 一般參考。 顯示的例子來自 AWS 全域磁碟分割。如果您的帳戶在 AWS GovCloud (US) 分割區,僅 AWS 區域 在該分區中列出(gov-us-east-1gov-us-west-1)。同樣,如果您的帳戶位於 AWS 中國分區,只cn-northwest-1cn-north-1和顯示。如需完整清單 AWS 區域 支持 AWS ParallelCluster,請參閱支援地區

Allowed values for the AWS 區域 ID: 1. af-south-1 2. ap-east-1 3. ap-northeast-1 4. ap-northeast-2 5. ap-south-1 6. ap-southeast-1 7. ap-southeast-2 8. ca-central-1 9. eu-central-1 10. eu-north-1 11. eu-south-1 12. eu-west-1 13. eu-west-2 14. eu-west-3 15. me-south-1 16. sa-east-1 17. us-east-1 18. us-east-2 19. us-west-1 20. us-west-2 AWS 區域 ID [ap-northeast-1]:

選擇要與叢集搭配使用的排程器。

Allowed values for Scheduler: 1. slurm 2. awsbatch Scheduler [slurm]:

選擇作業系統。

Allowed values for Operating System: 1. alinux2 2. centos7 3. ubuntu1804 4. ubuntu2004 Operating System [alinux2]:
注意

在中加入alinux2了 Support AWS ParallelCluster 版本為 2.6.0。

輸入運算節點叢集的最小和最大大小。這是以執行個體數量為單位測量而得。

Minimum cluster size (instances) [0]: Maximum cluster size (instances) [10]:

即會輸入標頭和運算節點執行個體類型。對於執行個體類型,您的帳戶執行個體限制足以滿足您的需求。如需詳細資訊,請參閱 Amazon EC2 使用者指南中的隨需執行個體限制

Master instance type [t2.micro]: Compute instance type [t2.micro]:

key pair 是從所選 Amazon 註冊的密鑰對EC2中選擇 AWS 區域.

Allowed values for EC2 Key Pair Name: 1. prod-uswest1-key 2. test-uswest1-key EC2 Key Pair Name [prod-uswest1-key]:

完成上述步驟後,決定是使用現有的VPC還是 let AWS ParallelCluster 為您創VPC建一個。如果您沒有正確配置VPC, AWS ParallelCluster 可以創建一個新的。它可以在同一個公有子網路中同時使用頭節點和計算節點,或者只使用公有子網路中的頭節點,其中包含私有子網路中的所有節點。它有可能達到你的VPCs數量限制 AWS 區域。 每個預設限制VPCs為五 AWS 區域。 如需有關此限制以及如何請求提高的詳細資訊,請參閱 Amazon VPC 使用者指南中的VPC和子網路

如果你讓 AWS ParallelCluster 建立時VPC,您必須決定是否所有節點都應位於公有子網路中。

重要

VPCs創建者 AWS ParallelCluster 依預設,不要啟用VPC流程記錄。VPC流程記錄可讓您擷取有關進出VPCs. 如需詳細資訊,請參閱 Amazon VPC 使用者指南中的VPC流程日誌

注意

如果你選擇 1. Master in a public subnet and compute fleet in a private subnet AWS ParallelCluster 即使您指定了免費方案資源,也會建立會產生額外費用的NAT閘道。

Automate VPC creation? (y/n) [n]: y Allowed values for Network Configuration: 1. Master in a public subnet and compute fleet in a private subnet 2. Master and compute fleet in the same public subnet Network Configuration [Master in a public subnet and compute fleet in a private subnet]: 1 Beginning VPC creation. Please do not leave the terminal until the creation is finalized

如果您不建立新的VPC,則必須選取現有的VPC。

如果您選擇擁有 AWS ParallelCluster 創建VPC,記下 VPC ID,以便您可以使用 AWS CLI 稍後刪除它。

Automate VPC creation? (y/n) [n]: n Allowed values for VPC ID: # id name number_of_subnets --- --------------------- --------------------------------- ------------------- 1 vpc-0b4ad9c4678d3c7ad ParallelClusterVPC-20200118031893 2 2 vpc-0e87c753286f37eef ParallelClusterVPC-20191118233938 5 VPC ID [vpc-0b4ad9c4678d3c7ad]: 1

選取之VPC後,您需要決定是使用現有子網路還是建立新的子網路。

Automate Subnet creation? (y/n) [y]: y
Creating CloudFormation stack... Do not leave the terminal until the process has finished
AWS Batch

從有效列表 AWS 區域 識別碼,選擇 AWS 區域 您希望叢集執行的位置。

Allowed values for AWS 區域 ID: 1. ap-northeast-1 2. ap-northeast-2 3. ap-south-1 4. ap-southeast-1 5. ap-southeast-2 6. ca-central-1 7. eu-central-1 8. eu-north-1 9. eu-west-1 10. eu-west-2 11. eu-west-3 12. sa-east-1 13. us-east-1 14. us-east-2 15. us-west-1 16. us-west-2 AWS 區域 ID [ap-northeast-1]:

選擇要與叢集搭配使用的排程器。

Allowed values for Scheduler: 1. slurm 2. awsbatch Scheduler [awsbatch]:

當選取 awsbatch 做為排程器時,alinux2 會用作為作業系統。

輸入運算節點叢集的最小和最大大小。這是在測量vCPUs。

Minimum cluster size (vcpus) [0]: Maximum cluster size (vcpus) [10]:

已輸入頭節點實例類型。使用 awsbatch 排程器時,運算節點會使用 optimal 的執行個體類型。

Master instance type [t2.micro]:

Amazon EC2 key pair 是從所選 Amazon 註冊的密鑰對EC2中選擇的 AWS 區域.

Allowed values for EC2 Key Pair Name: 1. prod-uswest1-key 2. test-uswest1-key EC2 Key Pair Name [prod-uswest1-key]:

決定是否使用現有的VPCs還是讓 AWS ParallelCluster VPCs為您創造。如果您沒有正確配置VPC, AWS ParallelCluster 可以創建一個新的。它可以在同一個公有子網路中同時使用頭節點和計算節點,或者只使用公有子網路中的頭節點,其中包含私有子網路中的所有節點。它有可能達到你的VPCs數量限制 AWS 區域。 預設數目VPCs為 5。如需有關此限制以及如何請求提高的詳細資訊,請參閱 Amazon VPC 使用者指南中的VPC和子網路

重要

VPCs創建者 AWS ParallelCluster 依預設,不要啟用VPC流程記錄。VPC流程記錄可讓您擷取有關進出VPCs. 如需詳細資訊,請參閱 Amazon VPC 使用者指南中的VPC流程日誌

如果你讓 AWS ParallelCluster 創建一個VPC,決定是否所有節點都應該在公共子網中。

注意

如果你選擇 1. Master in a public subnet and compute fleet in a private subnet AWS ParallelCluster 即使您指定了免費方案資源,也會建立會產生額外費用的NAT閘道。

Automate VPC creation? (y/n) [n]: y Allowed values for Network Configuration: 1. Master in a public subnet and compute fleet in a private subnet 2. Master and compute fleet in the same public subnet Network Configuration [Master in a public subnet and compute fleet in a private subnet]: 1 Beginning VPC creation. Please do not leave the terminal until the creation is finalized

如果您不建立新的VPC,則必須選取現有的VPC。

如果您選擇擁有 AWS ParallelCluster 創建VPC,記下 VPC ID,以便您可以使用 AWS CLI 稍後刪除它。

Automate VPC creation? (y/n) [n]: n Allowed values for VPC ID: # id name number_of_subnets --- --------------------- --------------------------------- ------------------- 1 vpc-0b4ad9c4678d3c7ad ParallelClusterVPC-20200118031893 2 2 vpc-0e87c753286f37eef ParallelClusterVPC-20191118233938 5 VPC ID [vpc-0b4ad9c4678d3c7ad]: 1

選取之VPC後,請決定是使用現有子網路還是建立新的子網路。

Automate Subnet creation? (y/n) [y]: y
Creating CloudFormation stack... Do not leave the terminal until the process has finished

當您完成上述步驟後,一個簡單的叢集會啟動到VPC. VPC使用支援公用 IP 位址的現有子網路。子網路的路由表是0.0.0.0/0 => igw-xxxxxx。請注意下列條件:

  • 必VPC須具有DNS Resolution = yesDNS Hostnames = yes

  • VPC應該還具有正確domain-name的DHCP選項 AWS 區域。 預設DHCP選項集已指定必要的 AmazonProvidedDNS。 如果指定多個網域名稱伺服器,請參閱 Amazon VPC 使用者指南中的DHCP選項集。使用私有子網路時,請使用NAT閘道或內部 Proxy 來啟用計算節點的 Web 存取。如需詳細資訊,請參閱網路組態

當所有設定都包含有效值時,您可以執行建立命令來啟動叢集。

$ pcluster create mycluster

叢集達到 "CREATE_COMPLETE" 狀態後,您可以使用一般用SSH戶端設定來連線至叢集。如需連接至 Amazon EC2 執行個體的詳細資訊,請參閱 Amazon EC2使用者指南中的EC2使用者指南

若要刪除叢集,請執行下列命令。

$ pcluster delete --region us-east-1 mycluster

若要刪除中的網路資源VPC,您可以刪除網 CloudFormation 路堆疊。堆疊名稱開頭為」parallelclusternetworking-「,並以" YYYYMMDDHHMMSS "格式包含建立時間。您可以使用列表堆棧命令列出堆棧

$ aws --region us-east-1 cloudformation list-stacks \ --stack-status-filter "CREATE_COMPLETE" \ --query "StackSummaries[].StackName" | \ grep -e "parallelclusternetworking-" "parallelclusternetworking-pubpriv-20191029205804"

堆棧可以使用刪除堆棧命令被刪除

$ aws --region us-east-1 cloudformation delete-stack \ --stack-name parallelclusternetworking-pubpriv-20191029205804

為您創pcluster configure建的VPC不是在 CloudFormation 網絡堆棧中創建的。您可以在主控台中VPC手動刪除,或使用 AWS CLI.

$ aws --region us-east-1 ec2 delete-vpc --vpc-id vpc-0b4ad9c4678d3c7ad