SageMaker HyperPod CLI 命令 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker HyperPod CLI 命令

下表摘要說明 SageMaker HyperPod CLI命令。

注意

如需完整CLI參考,請參閱 儲存庫README中的 。 SageMaker HyperPod CLI GitHub

SageMaker HyperPod CLI 命令 實體 描述
hyperpod get-clusters 叢集/存取 列出使用者已啟用的所有叢集,其IAM具有許可,可提交訓練 workloadsGives 目前未執行任何工作負載或任務之完整可用執行個體的快照,以及最大容量,依運作狀態檢查狀態分組 (例如: BurnInPassed)
hyperpod connect-cluster 叢集/存取 kubectl 將 設定為在指定的 HyperPod 叢集和命名空間上操作
hyperpod start-job job 將任務提交至目標叢集-任務名稱在命名空間層級將是唯一的 - 使用者將能夠透過將它們作為CLI引數傳遞來覆寫 yaml 規格
hyperpod get-job job 顯示已提交任務的中繼資料
hyperpod list-jobs job 列出已新增使用者之已連線叢集/命名空間中的所有任務,並具有提交訓練工作負載的IAM許可
hyperpod cancel-job job 停止和刪除任務,並放棄基礎運算資源。此任務無法再次繼續。如有需要,需要啟動新的任務。
hyperpod list-pods Pod 列出命名空間中指定任務中的所有 Pod
hyperpod get-log Pod 擷取指定任務中 Particulat Pod 的日誌
hyperpod exec Pod 在指定的 Pod (s) 的 Shell 中執行 bash 命令,並發佈輸出
hyperpod --help 公用程式 列出所有支援的命令