GPU アクセラレーテッドインスタンスの使用を開始する - Amazon Elastic Compute Cloud

GPU アクセラレーテッドインスタンスの使用を開始する

以下のリストにあるような第 5 世代の GPU アクセラレーテッドインスタンスタイプは、深層学習やハイパフォーマンスコンピューティング (HPC) アプリケーションに最良のパフォーマンス機能を提供します。機能の詳細については、インスタンスタイプのリンクを選択してください。

高速化インスタンスタイプのインスタンスタイプ仕様に関する完全なリストについては、「Amazon EC2 Instance Types」リファレンスで「Accelerated computing」を参照してください。

ソフトウェア設定

第 5 世代 GPU アクセラレーテッドインスタンスタイプの使用を開始する最も簡単な方法は、すべての必須ソフトウェアで事前設定されている AWS Deep Learning AMI からインスタンスを起動することです。GPU アクセラレーテッドインスタンスタイプで使用するための最新の AWS Deep Learning AMIs については、「AWS Deep Learning Base GPU AMI (Ubuntu 20.04)」を参照してください。

深層学習または HPC アプリケーションをホストするインスタンスを起動するためにカスタム AMI を構築する必要がある場合は、ベースイメージ上に以下の最小ソフトウェアバージョンをインストールすることをお勧めします。

ソフトウェア インスタンスタイプ 最小バージョン
NVIDIA ドライバー P5 530
P5e 550
CUDA P5、P5e 12.1
NVIDIA GDRCopy P5、P5e 2.3
EFA インストーラ P5、P5e 1.24.1
NCCL P5、P5e 2.18.3
aws-ofi-nccl プラグイン P5、P5e 1.7.2-aws

また、より深い C ステートを使用しないようにインスタンスを設定することをお勧めします。詳細については、Amazon Linux 2 ユーザーガイドの「より深い C ステートの制限による高パフォーマンスと低レイテンシー」を参照してください。最新の AWS Deep Learning Base GPU AMI は、より深い C ステートを使用しないように事前設定されています。

ネットワークと Elastic Fabric Adapter (EFA) 設定については、「複数のネットワークカードを使用して Amazon EC2 インスタンスのネットワーク帯域幅を最大化する」を参照してください。

Ubuntu 20.04 固有の推奨事項

Ubuntu 20.04 に関する以下の推奨事項は、起動時に想定外のインターフェイス名が付けられるのを防ぐのに役立ちます。

  • 以下のコマンドを実行して、systemd 245.4-4ubuntu3.19 以降かを確認してください。

    $ systemd --version
  • GRUB を設定したことを確認します。

    • /etc/default/grub 設定ファイルをテキストエディタで開きます。

    • GRUB_CMDLINE_LINUX_DEFAULT エントリを編集して net.naming-scheme=v247 を含めます。

    • sudo update-grub を実行してインスタンスを再起動します。