将适用于 Lustre 的 Amazon FSx 安装到 HyperPod 集群上
要将适用于 Lustre 的 Amazon FSx 共享文件系统挂载到 HyperPod 集群,请进行以下设置
-
使用 Amazon VPC。
-
要让 HyperPod 集群实例在 VPC 中通信,请确保将 使用 Amazon VPC 设置 SageMaker HyperPod 附加到 SageMaker HyperPod 的 IAM 角色。
-
在
create_cluster.json
中,包含以下 VPC 信息。"VpcConfig": { "SecurityGroupIds": [ "
string
" ], "Subnets": [ "string
" ] }有关设置 Amazon VPC 的更多提示,请参阅 使用 SageMaker HyperPod 的先决条件。
-
-
要完成使用适用于 Lustre 的 Amazon FSx 配置 Slurm,请在
provisioning_parameters.json
中指定 Amazon FSx DNS 名称和 Amazon FSx 挂载名称,如图中 从 HyperPod 提供的基本生命周期脚本开始 一节所示。您可以从账户中的适用于 Lustre 的 Amazon FSx 管理控制台或运行以下 AWS CLI 命令aws fsx describe-file-systems
找到 Amazon FSx 信息。"fsx_dns_name": "
fs-12345678a90b01cde
.fsx.us-west-2
.amazonaws.com", "fsx_mountname": "1abcdefg
"