将 Amazon f FSx or Lustre 安装到集群中 HyperPod - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 Amazon f FSx or Lustre 安装到集群中 HyperPod

要将 Amazon f FSx or Lustre 共享文件系统挂载到您的 HyperPod 集群,请进行以下设置。

  1. 使用 Amazon VPC。

    1. 要使 HyperPod 集群实例在您的 VPC 内进行通信,请确保将附加 SageMaker HyperPod使用您的亚马逊 VPC 进行设置到的 IAM 角色 SageMaker HyperPod。

    2. create_cluster.json 中,包含以下 VPC 信息。

      "VpcConfig": { "SecurityGroupIds": [ "string" ], "Subnets": [ "string" ] }

      有关设置 Amazon VPC 的更多提示,请参阅 使用 SageMaker HyperPod 的先决条件

  2. 要完成使用 Ama FSx zon for Lustre 配置 Slurm,请在中指定 Amazon FSx DNS 名称和亚马逊 FSx 挂载名称,provisioning_parameters.json如本节中的图所示。从提供的基本生命周期脚本开始 HyperPod您可以从账户中的 Amazon for Lustre 控制台或通过运行以下 AWS CLI 命令来查找亚马逊 FSx FSx 信息。aws fsx describe-file-systems

    "fsx_dns_name": "fs-12345678a90b01cde.fsx.us-west-2.amazonaws.com", "fsx_mountname": "1abcdefg"