Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
PERF02-BP06 Usa acceleratori di calcolo ottimizzati basati su hardware
Utilizza gli acceleratori hardware per eseguire determinate funzioni in modo più efficiente rispetto alle alternative CPU basate.
Anti-pattern comuni:
-
Nel carico di lavoro non hai confrontato un'istanza per uso generico con un'istanza dedicata in grado di offrire prestazioni più elevate e costi inferiori.
-
Stai utilizzando acceleratori di calcolo basati su hardware per attività che possono essere più efficienti utilizzando alternative basate su hardware. CPU
-
Non stai monitorando l'utilizzo. GPU
Vantaggi derivanti dall'adozione di questa best practice: utilizzando acceleratori basati su hardware, come le unità di elaborazione grafica (GPUs) e gli array di porte programmabili sul campo (FPGAs), è possibile eseguire determinate funzioni di elaborazione in modo più efficiente.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Le istanze di elaborazione accelerata forniscono l'accesso ad acceleratori di calcolo basati su hardware come and. GPUs FPGAs Questi acceleratori hardware eseguono determinate funzioni, come l'elaborazione grafica o la corrispondenza dei modelli di dati, in modo più efficiente rispetto alle alternative basate. CPU Molti carichi di lavoro accelerati, come il rendering grafico, la transcodifica e il machine learning, sono altamente variabili in termini di utilizzo di risorse. Esegui questo hardware solo per il tempo necessario e disattivalo con l'automazione quando non serve per migliorare l'efficienza complessiva delle prestazioni.
Passaggi dell'implementazione
-
Identifica le istanza a calcolo accelerato in grado di soddisfare i tuoi requisiti.
-
Per i carichi di lavoro di machine learning, sfrutta l'hardware appositamente progettato e specifico per il tuo carico di lavoro, come AWS Trainium
, Inferentia e Amazon.AWS EC2 DL1 AWS Le istanze Inferentia come le istanze Inf2 offrono prestazioni/watt migliori fino al 50% rispetto alle istanze Amazon comparabili. EC2 -
Raccogli i parametri di utilizzo delle istanze a calcolo accelerato. Ad esempio, puoi utilizzare l' CloudWatch agente per raccogliere metriche come
utilization_gpu
eutilization_memory
per le tue, GPUs come mostrato in Collect NVIDIA GPU metrics with Amazon. CloudWatch -
Ottimizza il codice, il funzionamento della rete e le impostazioni degli acceleratori hardware per garantire il pieno utilizzo dell'hardware sottostante.
-
Utilizza le librerie e i driver più recenti ad alte prestazioni. GPU
-
Usa l'automazione per rilasciare GPU istanze quando non sono in uso.
Risorse
Documenti correlati:
Video correlati:
Esempi correlati: