SUS05-BP04 Otimizar o uso de aceleradores de computação baseados em hardware
Otimize o uso de instâncias com computação acelerada para reduzir as demandas de infraestrutura física de sua workload.
Antipadrões comuns:
-
Você não está monitorando o uso da GPU.
-
Você está usando uma instância de finalidade geral para workload, enquanto uma instância criada especificamente pode oferecer maior desempenho, menor custo e melhor desempenho por watt.
-
Você está usando aceleradores de computação baseados em hardware para tarefas em que são mais eficientes usando alternativas baseadas em CPU.
Benefícios de estabelecer esta prática recomendada: Ao otimizar o uso de aceleradores baseados em hardware, você pode reduzir as demandas de infraestrutura física de sua workload.
Nível de risco exposto se esta prática recomendada não for estabelecida: Médio
Orientação para implementação
Se você precisar de alta capacidade de processamento, poderá se beneficiar do uso de instâncias com computação acelerada, que fornecem acesso a aceleradores de computação baseados em hardware, como unidades de processamento gráfico (GPUs) e matrizes de portas programáveis em campo (FPGAs). Esses aceleradores de hardware executam certas funções, como processamento gráfico ou correspondência de padrões de dados, com mais eficiência do que alternativas baseadas em CPU. Muitas workloads aceleradas, como renderização, transcodificação e machine learning, são altamente variáveis em termos de uso de recursos. Execute este hardware somente pelo tempo necessário e desative-as com automação quando não precisar mais delas para reduzir o consumo de recursos.
Etapas da implementação
-
Identifique quais instâncias com computação acelerada podem atender aos seus requisitos.
-
Para workloads de machine learning, utilize hardware específico para sua workload, como AWS Trainium
, AWS Inferentia e o Amazon EC2 DL1 . Instâncias do AWS Inferentia, como instâncias Inf2, oferecem performance até 50% melhor por watt em relação a instâncias comparáveis do Amazon EC2 . -
Colete métricas de uso para suas instâncias com computação acelerada. Por exemplo, você pode usar o agente do CloudWatch para coletar métricas como
utilization_gpu
eutilization_memory
para suas GPUs, conforme mostrado em Colete métricas da GPU NVIDIA com o Amazon CloudWatch. -
Otimize o código, a operação de rede e as configurações dos aceleradores de hardware para garantir que o hardware subjacente seja totalmente utilizado.
-
Use as mais recentes bibliotecas de alto desempenho e drivers de GPU.
-
Use automação para liberar instâncias de GPU quando não estiverem em uso.
Recursos
Documentos relacionados:
Vídeos relacionados: