Começar a usar instâncias aceleradas por GPU
Os tipos de instância acelerada por GPU de quinta geração, como os mostrados na lista a seguir, oferecem os recursos de maior desempenho para aplicações de aprendizado profundo e computação de alta performance (HPC). Selecione o link do tipo de instância para saber mais sobre seus recursos.
Para obter uma lista completa das especificações de tipo de instância para tipos de instâncias aceleradas, consulte Computação acelerada na referência de Tipos de instância do Amazon EC2.
Configuração de software
A maneira mais fácil de começar a usar tipos de instâncias aceleradas de GPU de quinta geração é lançar uma instância de uma AMI doAWS Deep Learning pré-configurada com todo o software necessário. Para o AMIs de deep learning da AWS mais recente para uso com tipos de instâncias aceleradas de GPU consulte AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
Se você precisar criar uma AMI personalizada para inicializar instâncias que hospedam aplicações de aprendizado profundo ou HPC, recomendamos instalar as seguintes versões mínimas de software em cima da imagem base:
Software | Tipo de instância | Versão mínima |
---|---|---|
Driver NVIDIA | P5 | 530 |
P5e | 550 | |
CUDA | P5, P5e | 12.1 |
NVIDIA GDRCopy | P5, P5e | 2.3 |
Instaladora EFA | P5, P5e | 1.24.1 |
NCCL | P5, P5e | 2.18.3 |
plug-in aws-ofi-nccl | P5, P5e | 1.7.2-aws |
Também recomendamos que você configure a instância para não usar estados C mais profundos. Para obter mais informações, consulte High performance and low latency by limiting deeper C-states no Amazon Linux 2 User Guide. A mais recente AMI de GPU básica de aprendizado profundo da AWS está pré-configurada para não usar estados C mais profundos.
Sobre como configurar redes e Elastic Fabric Adapter (EFA), consulte Maximize a largura de banda da rede em instâncias do Amazon EC2 com várias placas de rede.
Recomendações específicas do Ubuntu 20.04
As recomendações a seguir para o Ubuntu 20.04 ajudam a evitar a nomenclatura imprevisível da interface na inicialização.
-
Verifique se você está executando
systemd 245.4-4ubuntu3.19
ou posterior com o seguinte comando:systemd --version
-
Verifique se você configurou o GRUB:
-
Abra o arquivo de configuração
/etc/default/grub
em um editor de texto. -
Edite a entrada
GRUB_CMDLINE_LINUX_DEFAULT
para incluirnet.naming-scheme=v247
. -
Reinicie sua instância executando
sudo update-grub
.
-