将适用于 Lustre 的 Amazon FSx 安装到 HyperPod 集群上 - Amazon SageMaker

将适用于 Lustre 的 Amazon FSx 安装到 HyperPod 集群上

要将适用于 Lustre 的 Amazon FSx 共享文件系统挂载到 HyperPod 集群,请进行以下设置

  1. 使用 Amazon VPC。

    1. 要让 HyperPod 集群实例在 VPC 中通信,请确保将 使用 Amazon VPC 设置 SageMaker HyperPod 附加到 SageMaker HyperPod 的 IAM 角色。

    2. create_cluster.json 中,包含以下 VPC 信息。

      "VpcConfig": { "SecurityGroupIds": [ "string" ], "Subnets": [ "string" ] }

      有关设置 Amazon VPC 的更多提示,请参阅 使用 SageMaker HyperPod 的先决条件

  2. 要完成使用适用于 Lustre 的 Amazon FSx 配置 Slurm,请在 provisioning_parameters.json 中指定 Amazon FSx DNS 名称和 Amazon FSx 挂载名称,如图中 从 HyperPod 提供的基本生命周期脚本开始 一节所示。您可以从账户中的适用于 Lustre 的 Amazon FSx 管理控制台或运行以下 AWS CLI 命令 aws fsx describe-file-systems 找到 Amazon FSx 信息。

    "fsx_dns_name": "fs-12345678a90b01cde.fsx.us-west-2.amazonaws.com", "fsx_mountname": "1abcdefg"