GPU アクセラレーションコンテナを実行する (EC2 での Linux)

PDF

RSS

フォーカスモード

このページは役に立ちましたか?

フィードバックを送信

GPU アクセラレーションコンテナを実行する (EC2 での Linux) - アマゾン EKS

このページの改善にご協力ください

本ユーザーガイドの改善にご協力いただけませんか? すべてのページの右側のペインにある GitHub リンクで、このページの編集を選択してください。皆さまにご協力いただくことで、あらゆる人々に使いやすいユーザーガイドになります。

このページの改善にご協力ください

Amazon EKS 最適化高速 Amazon Linux AMI は、標準的な Amazon EKS 最適化 Amazon Linux AMI 上に構築されています。これらの AMI の詳細については、「Amazon EKS 最適化高速 Amazon Linux AMI」を参照してください。次のテキストでは、AWS Neuron ベースのワークロードを有効にする方法について説明します。

AWS Neuron (ML アクセラレーター) ベースのワークロードを有効にする

Amazon EKS Neuron でを使用するトレーニングおよび推論ワークロードの詳細については、以下のリファレンスを参照してください。

コンテナ - Kubernetes - 開始方法 (AWS Neuron ドキュメント)
GitHub での AWS Neuron EKS サンプルでのトレーニング
Amazon EKS で AWSInferentia を使用して ML 推論ワークロードをデプロイする

次の手順で、Amazon EKS 最適化高速 AMI を使用しながら GPU ベースのインスタンス上でワークロードを実行する方法を説明します。

GPU ノードをクラスターに加えた後、Kubernetes 用 NVIDIA デバイスプラグインをクラスターの DaemonSet として適用する必要があります。次のコマンドを実行する前に、vX.X.X を必要となる NVIDIA/k8s-device-plugin バージョンに置き換えます。
```
kubectl apply -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/vX.X.X/deployments/static/nvidia-device-plugin.yml
```
ノードに割り当て可能な GPU があることは、次のコマンドで確認できます。
```
kubectl get nodes "-o=custom-columns=NAME:.metadata.name,GPU:.status.allocatable.nvidia\.com/gpu"
```

次の内容で、nvidia-smi.yaml という名前のファイルを作成します。タグを nvidia/cuda に必要なタグに置き換えます。このマニフェストでは、ノード上で nvidia-smi を実行する NVIDIA CUDA コンテナを起動します。


apiVersion: v1
kind: Pod
metadata:
  name: nvidia-smi
spec:
  restartPolicy: OnFailure
  containers:
  - name: nvidia-smi
    image: nvidia/cuda:tag
    args:
    - "nvidia-smi"
    resources:
      limits:
        nvidia.com/gpu: 1

次のコマンドを使用してマニフェストを適用します。
```
kubectl apply -f nvidia-smi.yaml
```

Pod の実行の終了後、次のコマンドを使用してログを表示します。


kubectl logs nvidia-smi

出力例は次のとおりです。


Mon Aug  6 20:23:31 20XX
+-----------------------------------------------------------------------------+
| NVIDIA-SMI XXX.XX                 Driver Version: XXX.XX                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla V100-SXM2...  On   | 00000000:00:1C.0 Off |                    0 |
| N/A   46C    P0    47W / 300W |      0MiB / 16160MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ML のために準備する

Windows GPU AMI を実行する

Cookie の設定を選択する

Cookie の設定をカスタマイズする

Essential

Performance

Functional

Advertising

Cookie の設定を保存できません

GPU アクセラレーションコンテナを実行する (EC2 での Linux)

このページは役に立ちましたか?

AWS Neuron (ML アクセラレーター) ベースのワークロードを有効にする

次のトピック

前のトピック:

ヘルプが必要ですか?