更新計 AWS PCS算節點群組 - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

更新計 AWS PCS算節點群組

本主題提供可用選項的概觀,並說明更新AWSPCS計算節點群組時應考量的事項。

更新計AWSPCS算節點群組的選項

更新AWSPCS計算節點群組可讓您變更由啟動之執行個體的屬性 AWSPCS,以及啟動這些執行個體的規則。例如,您可以將節點群組執行個體取代AMI為另一個安裝了不同軟體的執行個體。或者,您可以更新安全群組以變更輸入或輸出網路連線。您也可以變更擴展設定,甚至變更 Spot 執行個體的偏好購買選項。

下列節點群組設定在建立之後無法變更:

  • 名稱

  • 執行個體

更新 AWS PCS計算節點群組時的考量

計算節點群組會定義用於處理工作、提供互動式殼層存取權和其他工作的EC2執行個體。它們通常與一或多個 AWS PCS佇列相關聯。當您更新計算節點群組以變更其行為 (或其節點的行為) 時,請考慮下列事項:

  • 當計算節點群組狀態從 [更新] 變更為 [使用中] 時,對計算節點群組屬性的變會生。使用更新的屬性啟動新執行個體。

  • 不影響特定節點組態的更新不會影響執行中的節點。例如,新增子網路並變更配置策略。

  • 如果您更新計算節點群組的啟動範本,則必須更新計算節點群組以使用新版本。

  • 若要從計算節點群組中的節點新增或移除安全群組,請編輯其啟動範本並更新計算節點群組。使用更新的安全群組組啟動新執行個體。

  • 如果您直接編輯計算節點群組所使用的安全性群組,則執行中和 future 執行個體會立即生效。

  • 如果您在運算節點群組使用的IAM執行個體設定檔中新增或移除權限,則執行中和 future 執行個體會立即生效。

  • 若要變更運算節點群組執行個體所使AMI用的執行個體,請更新計算節點群組 (或其啟動範本) 以使用新的執行個體,AMI然後等待 AWS PCS取代執行個體。

  • AWS PCS在節點群組更新作業之後,取代節點群組中的現有執行個體。如果節點上有正在執行的工作,則可以在 AWS PCS取代節點之前完成這些工作。互動式使用者程序 (例如在登入節點執行個體上) 會終止。Active當 AWS PCS標示要取代的執行個體時,節點群組狀態會返回到,但實際的取代會在執行個體閒置時發生。

  • 如果減少運算節點群組中允許的執行個體數目上限,請從 Slurm AWS PCS 移除節點以達到新的最大值。 AWS PCS終止與已移除的 Slurm 節點相關聯的執行中執行個體。已移除節點上的執行中工作會失敗,並返回其佇列。

  • AWS PCS為每個計算節點群組建立受管理的啟動範本。它們被命名為pcs-identifier-do-not-delete。請勿在建立或更新計算節點群組時選取它們,否則節點群組將無法正常運作。

  • 如果您更新計算節點群組以使用 Spot 進行購買選項,您的帳戶中必須具有AWSServiceRoleForEC2Spot服務連結角色。如需詳細資訊,請參閱Amazon EC2 Spot 角色 for AWS PCS

更新AWSPCS計算節點群組

您可以使用AWS管理主控台或更新節點群組AWSCLI。

AWS Management Console
更新計算節點群組
  1. 開啟AWSPCS主控台,位於:https://console.aws.amazon.com/pcs/home#/clusters

  2. 選取您要更新計算節點群組的叢集。

  3. 瀏覽至 [計算節點群組],移至您要更新的節點群組,然後選取 [編輯]。

  4. 在 [運算組態]、[其他設定] 和 [Slurm自訂設定] 區段中,更新以下任何值:

    • 執行個體 — 您無法變更運算節點群組中的執行個體。

  5. 選擇更新。套用變時,「狀態」欄位會顯示「更新」。

    重要

    計算節點群組更新可能需要幾分鐘的時間。

AWS CLI
更新計算節點群組
  1. 使用以下命令更新您的計算節點群組。執行命令之前,請執行下列替換:

    1. Replace (取代) region-code 與您要在其中創建集群的AWS區域。

    2. Replace (取代) my-node-group 使用名稱或computeNodeGroupId計算節點群組。

    3. Replace (取代) my-cluster 與您的群集clusterId的名稱或。

    aws pcs update-compute-node-group --region region-code \ --cluster-identifier my-cluster \ --compute-node-group-identifier my-node-group
  2. 更新除以外的任何節點群組參數--instance-configs。例如,要設置一個新的 AMI ID,傳遞到--amiId my-custom-ami-id哪裡 my-custom-ami-id 由您AMI的選擇取代。

重要

更新計算節點群組可能需要幾分鐘的時間。

您可以使用以下命令查詢節點組的狀態。

aws pcs get-compute-node-group --region region-code \ --cluster-identifier my-cluster \ --compute-node-group-identifier my-node-group