SageMaker HyperPod CLI命令 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SageMaker HyperPod CLI命令

下表汇总了这些 SageMaker HyperPod CLI命令。

注意

有关完整CLI参考,请参阅SageMaker HyperPod CLI GitHub存储库README中的。

SageMaker HyperPod CLI命令 实体 描述
hyperpod get-clusters 集群/访问 列出用户IAM有权向其提交训练 workloadsGives 的所有集群、未运行任何工作负载或作业的全部可用实例的当前快照以及最大容量,按运行状况检查状态分组(例如: BurnInPassed)
hyperpod connect-cluster 集群/访问 配置为kubectl对指定的 HyperPod 集群和命名空间进行操作
hyperpod start-job 作业 将作业提交到目标集群——任务名称在命名空间级别上将是唯一的——用户将能够通过将它们作为参数传递来覆盖 yaml 规范 CLI
hyperpod get-job 作业 显示已提交作业的元数据
hyperpod list-jobs 作业 列出已连接的集群/命名空间中已向其添加了IAM有权提交训练工作负载的用户的所有作业
hyperpod cancel-job 作业 停止和删除任务并放弃底层计算资源。此任务无法再次恢复。如果需要,需要开始一份新工作。
hyperpod list-pods 容器组(pod) 列出命名空间中给定作业中的所有 pod
hyperpod get-log 容器组(pod) 检索指定任务中特定 Pod 的日志
hyperpod exec 容器组(pod) 在指定 pod 的 shell 中运行 bash 命令并发布输出
hyperpod --help 实用程序 列出了所有支持的命令