Elastic Fabric Adapter - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一種具有 OS-bypass 功能的網路裝置,可與相同子網路上的其他執行個體進行低延遲網路通訊。EFA 是使用 Libfabric 公開,並且可以使用簡訊傳遞界面 (MPI) 供應用程式使用。

若要搭配 AWS ParallelCluster 和 Slurm排程器使用 EFA,請將 SlurmQueues / ComputeResources / Efa / Enabled設為 true

若要檢視支援 EFA 的 Amazon EC2 執行個體清單,請參閱《Amazon EC2 Linux 執行個體使用者指南》中的支援的執行個體類型

我們建議您在置放群組中執行已啟用 EFA 的執行個體。如此一來,執行個體就會在單一可用區域中的低延遲群組中啟動。如需如何使用 設定置放群組的詳細資訊 AWS ParallelCluster,請參閱 SlurmQueues / Networking / PlacementGroup

如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的 Elastic Fabric Adapter,以及》AWS Open Source 部落格》中的使用彈性布料轉接器擴展 HPC 工作負載 AWS ParallelCluster

注意

不同可用區域不支援彈性布料轉接器 (EFA)。如需詳細資訊,請參閱排程 / SlurmQueues / Networking / SubnetIds

注意

根據預設,Ubuntu分佈會啟用 ptrace(程序追蹤) 保護。 ptrace保護會停用,讓 Libfabric 正常運作。如需詳細資訊,請參閱《Amazon EC2 使用者指南》中的停用 ptrace 保護