Elastic Fabric Adapter - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种具有操作系统旁路功能的网络设备,可与同一子网上的其他实例进行低延迟的网络通信。EFA通过 Libfabric 公开,并且可供使用消息传递接口 (MPI) 的应用程序使用。

要EFA与一起使用 AWS ParallelCluster,请将该行enable_efa = true添加到该[queue]部分

要查看支持的EC2实例列表EFA,请参阅 Amazon Linux 实例EC2用户指南中的支持的实例类型

有关 enable_efa 设置的更多信息,请参阅 [queue] 部分中的 enable_efa

应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅placementplacement_group

有关更多信息,请参阅 Amazon EC2 用户指南中的弹性结构适配器以及使用弹性结构适配器扩展HPC工作负载和 AWS ParallelClusterAWS开源博客

注意

默认情况下,Ubuntu 启用分发 ptrace (过程跟踪)保护。从 AWS ParallelCluster 2,6.0 开始,ptrace 保护已禁用,这样 Libfabric 才能正常运行。有关更多信息,请参阅《亚马逊EC2用户指南》中的禁用 ptrace 保护

注意

2.10.1 版本中增加了EFA对基于 ARM 的 Graviton2 实例的支持。 AWS ParallelCluster