使用 SageMaker AI 主控台在訓練計劃上建立 SageMaker HyperPod 叢集 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 SageMaker AI 主控台在訓練計劃上建立 SageMaker HyperPod 叢集

若要從 SageMaker AI 主控台 UI 使用訓練計劃建立 SageMaker HyperPod 叢集,請遵循下列步驟:

  1. 前往位於 https://https://console.aws.amazon.com/sagemaker/ 的 SageMaker AI 主控台。

  2. 在左側導覽窗格中,選擇 Hyperpod,然後選擇建立叢集

  3. 設定執行個體群組時,您可以選取符合運算容量需求的計劃。

SageMaker AI 主控台界面顯示用於在 SageMaker HyperPod 叢集中建立執行個體群組的模態視窗。表單包含執行個體群組名稱、執行個體類型、數量、執行個體容量 (具有隨需和訓練計劃選項) 的欄位,以及建立中生命週期指令碼的目錄路徑。

檢閱並建立您的叢集。使用訓練計畫的執行個體群組會在訓練計畫變成 時擴展到指定的目標執行個體計數Active,視可用容量而定。在每個預留容量期間結束前三十分鐘,執行個體群組會開始縮減至零個執行個體。此縮減狀態會持續到下一個預留容量期間開始或計劃結束為止。在整個過程中,無論目前的執行個體計數為何,運作狀態良好的執行個體群組都會在初始建立之後維持 InService 狀態。