选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

查看环境变量参考

聚焦模式
查看环境变量参考 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

的教程中定义并使用了以下环境变量为 SageMaker HyperPod Slurm 集群设置多个控制器节点。除非明确保留,否则这些环境变量仅在当前会话中可用。它们是使用$variable_name语法定义的。带有键/值对的变量表示 AWS创建的资源,而没有键的变量是用户定义的。

环境变量参考
变量 描述
$BACKUP_SUBNET
  • 密钥示例:BackupPrivateSubnet

  • 示例值:subnet-04a8ab51748510a51

  • 描述:用于创建 HyperPod Slurm 集群的备份私有子网 ID。

$COMPUTE_IG_NAME
  • 示例值:compute-nodes

  • 描述:用于创建集群的计算实例组的名称。

$COMPUTE_NODE_ROLE
  • 密钥示例:AmazonSagemakerClusterExecutionRoleArn

  • 示例值:arn:aws:iam::111122223333:role/sagemaker-hyperpod-AmazonSagemakerClusterExecutionR-123OTacPcKk1

  • 描述:计算实例组的 IAM 角色的 Amazon 资源名称 (ARN)。

$CONTOLLER_IG_NAME
  • 示例值:controller-machine

  • 描述:用于创建集群的控制器实例组的名称。

$DB_USER_NAME
$EMAIL
$PRIMARY_SUBNET
  • 密钥示例:PrimaryPrivateSubnet

  • 示例值:subnet-01a56ebc42df102a7

  • 描述:用于创建 HyperPod Slurm 集群的主私有子网 ID。

$POLICY
  • 示例值:arn:aws:iam::111122223333:policy/AmazonSagemakerExecutionPolicy

  • 描述:您创建并附加到控制器实例组的 Slurm 执行角色的 IAM 策略 ARN。

$REGION
  • 示例值:us-east-1

  • 描述:您创建所有资源 AWS 区域 的位置。

$ROOT_BUCKET_NAME
  • 密钥示例:SecurityGroup

  • 示例值:sagemaker-lifecycle-ab214000

  • 描述:上传生命周期脚本的 Amazon S3 存储桶的名称。

$SECURITY_GROUP
$SLURM_DB_ENDPOINT_ADDRESS
  • 密钥示例:SlurmDBEndpointAddress

  • 示例值:sagemaker-hyperpod-mh-slurmdbinstance-sxcmatjv0ei0.clplgxt06ysb.us-east-1.rds.amazonaws.com

  • 描述:创建集群时使用的 Amazon RDS 数据库终端节点。

$SLURM_DB_SECRET_ARN
  • 密钥示例:SlurmDBSecretArn

  • 示例值:arn:aws:secretsmanager:us-east-1:111122223333:secret:sagemaker-hyperpod-mh-db-secret-us-east-1-dmz72K

  • 描述:创建集群时使用的数据库密钥 ARN。

$SLURM_EXECUTION_ROLE_ARN
  • 密钥示例:SlurmExecutionRoleArn

  • 示例值:arn:aws:iam::111122223333:role/sagemaker-hyperpod-mhSlurmExecutionRole-us-east-1

  • 描述:控制器实例组的 IAM 角色 ARN,用于创建集群。

$SLURM_FSX_DNS_NAME
$SLURM_FSX_MOUNT_NAME
$SLURM_SNS_FAILOVER_TOPIC_ARN
  • 密钥示例:SlurmFailOverSNSTopicArn

  • 示例值:arn:aws:sns:us-east-1:111122223333:sagemaker-hyperpod-mhSlurmFailOverTopic-us-east-1

  • 描述:亚马逊 SNS 主题 ARN,用于。创建配置文件

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。