本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在配置使用 AWS Batch运行多节点并行作业的计算环境时,需要考虑几个注意事项。
-
UNMANAGED
计算环境不支持多节点并行作业。 -
如果打算将多节点并行作业提交到计算环境,请在单个可用区中创建集群 置放群组,并将其与计算资源进行关联。这样可保证多节点并行作业位于实例的逻辑分组内,同时保持高的网络流量潜力。有关更多信息,请参阅 Amazon EC2 用户指南中的置放群组。
-
使用竞价型实例的计算环境不支持多节点并行作业。
-
AWS Batch 多节点并行任务使用 Amazon ECS
awsvpc
网络模式,该模式为您的多节点并行任务容器提供了与 Ama EC2 zon 实例相同的网络属性。每个多节点并行作业容器都可获得自己的弹性网络接口、主要私有 IP 地址以及内部 DNS 主机名。在同一 VPC 子网中创建网络接口,作为其主机计算资源。适用于计算资源的任何安全组,也适用于该主机计算资源。有关更多信息,请参阅 《Amazon Elastic Container Service 开发人员指南》 中的 使用 awsvpc Network Mode 的任务联网。 -
与计算环境关联的安全组不得超过 5 个。
-
对于具有公有 IP 地址的多节点并行作业,
awsvpc
网络模式不提供弹性网络接口。要访问 Internet,必须在配置为使用 NAT 网关的私有子网中启动计算资源。有关更多信息,请参阅 Amazon VPC 用户指南中的 NAT 网关。节点间通信必须使用节点的私有 IP 地址或 DNS 主机名。运行于公有子网内计算资源之上的多节点并行作业,无出站网络访问。要创建具有私有子网和 NAT 网关的 VPC,请参阅创建 Virtual Private Cloud 。 -
创建并附加到计算资源的弹性网络接口,不能由您的账户手动分离或修改。这是为了防止意外删除与正在运行的作业关联的弹性网络接口。要释放任务的弹性网络接口,请终止作业。
-
您的计算环境必须有足够的最大 v CPUs 才能支持您的多节点 parallel 作业。
-
您的 Amazon EC2 实例配额包括运行任务所需的实例数量。例如,如果作业需要 30 个实例,但您的账户在区域内只能运行 20 个实例。则您的工作会卡在
RUNNABLE
状态中。 -
如果为多节点并行作业中的节点组指定了实例类型,那么计算环境必须能够启动该实例类型。