このページの改善にご協力ください
本ユーザーガイドの改善にご協力いただけませんか? すべてのページの右側のペインにある GitHub リンクで、このページの編集を選択してください。皆さまにご協力いただくことで、あらゆる人々に使いやすいユーザーガイドになります。
Amazon EKS 最適化高速 Amazon Linux AMI は、標準的な Amazon EKS 最適化 Amazon Linux AMI 上に構築されています。これらの AMI の詳細については、「Amazon EKS 最適化高速 Amazon Linux AMI」を参照してください。次のテキストでは、AWS Neuron ベースのワークロードを有効にする方法について説明します。
AWS Neuron (ML アクセラレーター) ベースのワークロードを有効にする
Amazon EKS Neuron で を使用するトレーニングおよび推論ワークロードの詳細については、以下のリファレンスを参照してください。
-
コンテナ - Kubernetes - 開始方法
(AWS Neuron ドキュメント) -
GitHub での AWS Neuron EKS サンプルでのトレーニング
次の手順で、Amazon EKS 最適化高速 AMI を使用しながら GPU ベースのインスタンス上でワークロードを実行する方法を説明します。
-
GPU ノードをクラスターに加えた後、Kubernetes 用 NVIDIA デバイスプラグイン
をクラスターの DaemonSet として適用する必要があります。次のコマンドを実行する前に、 vX.X.X
を必要となる NVIDIA/k8s-device-pluginバージョンに置き換えます。 kubectl apply -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/vX.X.X/deployments/static/nvidia-device-plugin.yml
-
ノードに割り当て可能な GPU があることは、次のコマンドで確認できます。
kubectl get nodes "-o=custom-columns=NAME:.metadata.name,GPU:.status.allocatable.nvidia\.com/gpu"
-
次の内容で、
nvidia-smi.yaml
という名前のファイルを作成します。タグ
を nvidia/cudaに必要なタグに置き換えます。このマニフェストでは、ノード上で nvidia-smi
を実行する NVIDIA CUDAコンテナ を起動します。 apiVersion: v1 kind: Pod metadata: name: nvidia-smi spec: restartPolicy: OnFailure containers: - name: nvidia-smi image: nvidia/cuda:tag args: - "nvidia-smi" resources: limits: nvidia.com/gpu: 1
-
次のコマンドを使用してマニフェストを適用します。
kubectl apply -f nvidia-smi.yaml
-
Pod の実行の終了後、次のコマンドを使用してログを表示します。
kubectl logs nvidia-smi
出力例は次のとおりです。
Mon Aug 6 20:23:31 20XX +-----------------------------------------------------------------------------+ | NVIDIA-SMI XXX.XX Driver Version: XXX.XX | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 Tesla V100-SXM2... On | 00000000:00:1C.0 Off | 0 | | N/A 46C P0 47W / 300W | 0MiB / 16160MiB | 0% Default | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: GPU Memory | | GPU PID Type Process name Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+