Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Elastic Fabric Adapter per AI/ML e HPC carichi di lavoro su Amazon EC2
Un Elastic Fabric Adapter (EFA) () è un dispositivo di rete che è possibile collegare alle EC2 istanze Amazon per accelerare le applicazioni di Intelligenza Artificiale (AI), Machine Learning (ML) e High Performance Computing (HPC). EFAconsente di ottenere le prestazioni applicative di un AI/ML on-premise o HPC cluster, con la scalabilità, la flessibilità e l'elasticità fornite dal Cloud. AWS
EFAgarantisce valori di latenza più bassi e coerenti e un throughput più elevato rispetto al TCP trasporto generalmente utilizzato nei sistemi cloudHPC. Migliora inoltre le prestazioni delle comunicazioni tra istanze, essenziali per il dimensionamento dell'AI/ML e delle applicazioni. HPC Ottimizzato per operare sull'infrastruttura di AWS rete esistente, è in grado di dimensionarsi in funzione dei requisiti delle applicazioni.
EFAsi integra con Libfabric versione 1.7.0 e supporta Nvidia Collective Communications Library (NCCL) per le applicazioni AI e ML e Open MPI 4 e successivi per MPI le applicazioni. HPC
Indice
- EFAnozioni di base
- Librerie e interfacce supportate
- Tipi di istanze supportati
- Sistemi operativi supportati
- EFAlimitazioni
- EFAprezzi
- Inizia con e EFA MPI
- Inizia con e EFA NCCL
- Ottimizzare la larghezza di banda di rete
- Crea e allega un EFA
- Scollega ed elimina un EFA
- Monitoraggio di un EFA
- Verifica del EFA programma di installazione
EFAnozioni di base
Un EFA dispositivo può essere collegato a un'EC2istanza in due modi:
-
Utilizzando un'EFAinterfaccia tradizionale, chiamata anche EFA withENA, che crea sia un EFA dispositivo che un ENA dispositivo.
-
Utilizzando un'interfaccia EFA -only, che crea solo il EFA dispositivo.
Il EFA dispositivo offre funzionalità come il bypass del sistema operativo integrato e il controllo della congestione tramite il protocollo Scalable Reliable Datagram (). SRD Le caratteristiche del EFA dispositivo consentono una funzionalità di trasporto affidabile e a bassa latenza che consente all'EFAinterfaccia di fornire migliori prestazioni delle applicazioni HPC e ML su Amazon. EC2 Inoltre, il ENA dispositivo offre una rete IP tradizionale.
Per interfacciarsi con il trasporto di rete del sistema, in genere HPC le applicazioni AI/ML utilizzano NCCL e le applicazioni utilizzano l'interfaccia di trasmissione dei messaggi (MPI) per interfacciarsi con il trasporto di rete del sistema. Nel AWS Cloud questo ha comportato l'interfacciarsi delle applicazioni con NCCL oMPI, che a sua volta utilizza lo stack TCP /IP del sistema operativo e il driver del ENA dispositivo per consentire la comunicazione di rete tra istanze.
Con un'interfaccia tradizionale EFA (EFAconENA) o EFA solo AI/ML applications use NCCL and HPC applications use MPI, to interface directly with the Libfabric API. The Libfabric API bypasses the operating system kernel and communicates directly with the EFA device to put packets on the network. This reduces overhead and enables AI/ML e HPC applicazioni per un'esecuzione più efficiente.
Nota
Componente core del framework OpenFabrics Interfaces (OFI), Libfabric definisce ed esporta lo spazio utente API di. OFI Per maggiori informazioni, consulta il OpenFabrics sito Web di Libfabric
Differenze tra ENAEFA, e EFA -only interfacce di rete
Amazon EC2 fornisce due tipi di interfacce di rete:
-
ENAle interfacce forniscono tutte le tradizionali funzionalità di rete e routing IP necessarie per supportare le reti IP per un. VPC Per ulteriori informazioni, consulta Abilita una rete avanzata con ENA le tue EC2 istanze.
-
EFA(EFAconENA) le interfacce forniscono sia il ENA dispositivo per la rete IP sia il dispositivo per le EFA comunicazioni a bassa latenza e ad alto rendimento.
-
EFA-only le interfacce supportano solo le funzionalità del dispositivo, senza il EFA dispositivo per le reti IP tradizionali. ENA
La tabella seguente fornisce un confronto tra e EFA solo ENA le EFA interfacce di rete.
ENA | EFA(con) EFA ENA | EFA-Solo | |
---|---|---|---|
Supporta la funzionalità di rete IP | Sì | Sì | No |
Possono essere assegnati IPv4 o IPv6 indirizzi | Sì | Sì | No |
Può essere utilizzato, ad esempio, come interfaccia di rete principale | Sì | Sì | No |
Conta ai fini ENI del limite di allegati, ad esempio | Sì | Sì | Sì |
Supporto per tipi di istanza | Supportata su tutti i tipi di istanze basate su Nitro | Tipi di istanze supportati | Tipi di istanze supportati |
Denominazione dei parametri in EC2 APIs | interface |
efa |
efa-only |
Denominazione dei campi nella console EC2 | Nessuna selezione | EFAcon ENA | EFA-Solo |
Librerie e interfacce supportate
EFAsSupporta le seguenti interfacce e librerie:
-
Open MPI 4 e versioni successive
Nota
Per le istanze basate su Graviton ti consigliamo di utilizzare Open MPI 4.0 o versioni successive.
-
Intel MPI 2019 aggiornamento 5 e successivi
-
NVIDIACollective Communications Library (NCCL) 2.4.2 e versioni successive
-
AWS Neuron SDK versione 2.3 e successive
Tipi di istanze supportati
I seguenti tipi di istanza supportano EFAs:
Per visualizzare i tipi di istanza disponibili supportati EFAs in una regione specifica
I tipi di istanza disponibili variano in base alla regione. Per visualizzare i tipi di istanza disponibili supportati EFAs in una regione, utilizzate il describe-instance-typescomando con il --region
parametro. Includi il --filters
parametro per assegnare i risultati ai tipi di istanza supportati EFA e il --query
parametro per assegnare l'output al valore diInstanceType
.
aws ec2 describe-instance-types --region
us-east-1
--filters Name=network-info.efa-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort
Sistemi operativi supportati
Il supporto del sistema operativo varia a seconda del tipo di processore. Nella tabella seguente vengono illustrati i sistemi operativi supportati.
Sistema operativo | tipi di istanze Intel/ AMD (x86_64 ) |
AWS Tipi di istanze Graviton () arm64 |
---|---|---|
Amazon Linux 2023 | ✓ | ✓ |
Amazon Linux 2 | ✓ | ✓ |
RHEL8 e 9 | ✓ | ✓ |
Debian 10, 11 e 12 | ✓ | ✓ |
Rocky Linux 8 e 9 | ✓ | ✓ |
Ubuntu 20.04, 22.04 e 24.04 | ✓ | ✓ |
SUSELinux Enterprise 15 e versioni successive SP2 | ✓ | ✓ |
Apri SUSE Leap 15.5 e versioni successive | ✓ |
Nota
Ubuntu 20.04 consente il supporto diretto peer quando viene utilizzato con istanze dl1.24xlarge
.
EFAlimitazioni
EFAshanno le seguenti limitazioni:
Nota
EFAil traffico si riferisce al traffico trasmesso attraverso il EFA dispositivo di un'interfaccia EFA (EFAconENA) o di EFA sola interfaccia.
-
EFAil traffico tra istanze P4d/P4de/ e altri tipi di DL1 istanze non è attualmente supportato.
-
I tipi di istanza che supportano più schede di rete possono essere configurati con uno EFA per scheda di rete. Tutti gli altri tipi di istanza supportati supportano solo un EFA per istanza.
-
Per
m7g.16xlarge
ec7g.16xlarge
le istanzer7g.16xlarge
dedicate e gli host dedicati non sono supportati quando EFA è collegato un. -
EFAil traffico non può attraversare le zone di disponibilità oVPCs. Ciò non si applica al normale traffico IP proveniente dal ENA dispositivo di un'EFAinterfaccia.
-
EFAil traffico non è instradabile. mentre è sempre possibile instradare il normale traffico IP dal ENA dispositivo di un'EFAinterfaccia.
-
EFAnon è supportato su AWS Outposts.
-
Il EFA dispositivo con interfaccia EFA (EFAconENA) è supportato nelle istanze di Windows solo per le applicazioni basate su AWS Cloud Digital Interface Software Development Kit (AWS CDI SDK). Se si collega un'interfaccia EFA (EFAconENA) a un'istanza di Windows per applicazioni non CDI SDK basate, questa funge da ENA interfaccia, senza le funzionalità aggiuntive del EFA dispositivo. L'interfaccia EFA -only non è supportata dalle applicazioni AWS CDI basate su Windows o Linux. Per ulteriori informazioni, consultate la Guida per l'utente del AWS Cloud Digital Interface Software Development Kit (AWS CDI SDK).
EFAprezzi
EFAè disponibile come funzionalità EC2 di rete Amazon opzionale che puoi abilitare su qualsiasi istanza supportata senza costi aggiuntivi.