SageMaker HyperPod CLI命令 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker HyperPod CLI命令

下表摘要說明這些指 SageMaker HyperPod CLI令。

注意

如需完整的CLI參考資料,請參閱SageMaker HyperPod CLI GitHub存放庫README中的。

SageMaker HyperPod CLI命令 實體 描述
hyperpod get-clusters 群集/存取 列出使用者已啟用的所有叢集,並具備IAM提交訓練 workloadsGives 未執行任何工作負載或工作的整個可用執行個體的目前快照,以及最大容量,並依健康狀態檢查狀態分組 (例如: BurnInPassed)
hyperpod connect-cluster 群集/存取 配置kubectl為在指定的 HyperPod 集群和命名空間上運行
hyperpod start-job job 將 Job 提交到目標叢集-作業名稱在命名空間層級是唯一的-使用者可以將它們作為引數傳遞來覆寫 yaml spec CLI
hyperpod get-job job 顯示已提交工作的中繼資料
hyperpod list-jobs job 列出已新增使用者的連線叢集/命名空間中的所有工作,並具有提交訓練工作負載的IAM權限
hyperpod cancel-job job 停止並刪除工作,並放棄基礎計算資源。無法再繼續此工作。如有需要,需要開始新的工作。
hyperpod list-pods Pod 列出命名空間中指定工作中的所有網繭
hyperpod get-log Pod 擷取指定工作中特定網繭的記錄
hyperpod exec Pod 在指定的 pod 的殼層中執行 bash 命令,並發佈輸出
hyperpod --help 效用 列出所有支援的指令