Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
PERF02-BP06 Utilice aceleradores de cómputo optimizados basados en hardware
Utilice aceleradores de hardware para realizar determinadas funciones de forma más eficiente que las alternativas CPU basadas en hardware.
Patrones comunes de uso no recomendados:
-
En su carga de trabajo, no ha comparado una instancia de uso general con una instancia personalizada que pueda ofrecer mayor rendimiento y costos más reducidos.
-
Está utilizando aceleradores de cómputo basados en hardware para tareas que pueden ser más eficientes si utiliza alternativas basadas en hardware. CPU
-
No está supervisando el uso. GPU
Ventajas de establecer esta práctica recomendada: Al utilizar aceleradores basados en hardware, como las unidades de procesamiento de gráficos (GPUs) y las matrices de compuertas programables en campo (FPGAs), puede realizar determinadas funciones de procesamiento de manera más eficiente.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
Las instancias de computación acelerada proporcionan acceso a aceleradores de cómputo basados en hardware, como y. GPUs FPGAs Estos aceleradores de hardware realizan determinadas funciones, como el procesamiento gráfico o la coincidencia de patrones de datos, de manera más eficiente que las alternativas basadas en el hardware. CPU Muchas cargas de trabajo aceleradas, como el renderizado, la transcodificación y el machine learning, son muy variables en cuanto al uso de recursos. Ejecute este hardware solo durante el tiempo que sea necesario y retírelo mediante automatización cuando no se requiera para mejorar la eficiencia del rendimiento general.
Pasos para la implementación
-
Identifique qué instancias de computación acelerada pueden satisfacer sus requisitos.
-
Para las cargas de trabajo de aprendizaje automático, aproveche el hardware diseñado específicamente para su carga de trabajo, como AWS Trainium
,AWS Inferentia y Amazon. EC2 DL1 AWS Las instancias de inferencia, como las instancias Inf2, ofrecen hasta un 50% más de rendimiento por vatio que las instancias de Amazon comparables. EC2 -
Recopile las métricas de uso de las instancias de computación acelerada. Por ejemplo, puedes usar CloudWatch un agente para recopilar métricas como
utilization_gpu
yutilization_memory
para ti, tal y GPUs como se muestra en Recopilar NVIDIA GPU métricas con Amazon CloudWatch. -
Optimice el código, el funcionamiento de la red y la configuración de los aceleradores de hardware para asegurarse de que se aprovecha al máximo el hardware subyacente.
-
Utilice las bibliotecas y los controladores de alto rendimiento más recientes. GPU
-
Utilice la automatización para lanzar GPU instancias cuando no estén en uso.
Recursos
Documentos relacionados:
Videos relacionados:
-
AWS re:Invent 2021: Cómo seleccionar GPU instancias de Amazon Elastic Compute Cloud para
el aprendizaje profundo -
AWS re:Invent 2022 - Accelerate deep learning and innovate faster with AWS Trainium
Ejemplos relacionados: