在 HyperPod 上创建 Slurm 集群前验证 JSON 配置文件
要在提交集群创建请求前验证 JSON 配置文件,请使用配置验证脚本 validate-config.py
create_cluster.json
和 provisioning_parameters.json
文件,请按以下步骤运行验证脚本。
python3 validate-config.py --cluster-config
create_cluster.json
--provisioning-parametersprovisioning_parameters.json
下面是一个成功验证的输出示例。
✔️ Validated instance group name worker-group-1 is correct ... ✔️ Validated subnet subnet-012345abcdef67890 ... ✔️ Validated security group sg-012345abcdef67890 ingress rules ... ✔️ Validated security group sg-012345abcdef67890 egress rules ... ✔️ Validated FSx Lustre DNS name fs-012345abcdef67890.fsx.us-east-1.amazonaws.com ✔️ Validated FSx Lustre mount name abcdefgh ✅ Cluster Validation succeeded