在 HyperPod 集群节点上交互式开发生命周期脚本 - Amazon SageMaker

在 HyperPod 集群节点上交互式开发生命周期脚本

本节将介绍如何以交互方式开发生命周期脚本,而无需重复创建和删除 HyperPod 集群。

  1. 使用基本生命周期脚本创建 HyperPod 集群。

  2. 登录集群节点。

  3. 通过编辑并在节点上反复运行脚本 (configure_xyz.sh) 来开发脚本。

    1. HyperPod 以根用户身份运行生命周期脚本,因此我们建议您在开发时以根用户身份运行 configure_xyz.sh,以确保脚本在 HyperPod 运行时在相同条件下进行测试。

  4. 通过添加类似以下代码的行,将脚本整合到 lifecycle_script.py 中。

    ExecuteBashScript("./utils/configure_xyz.sh").run()
  5. 将更新的生命周期脚本上传到最初用于上传基本生命周期脚本的 S3 存储桶。

  6. 创建一个新的 HyperPod 集群,测试 lifecycle_script.py 的集成版本。