モニタリング - AWS Deep Learning AMIs

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

モニタリング

DLAMI には、いくつかの GPU モニタリングツールがプリインストールされています。このガイドでは、ダウンロードしてインストールするために利用できるツールについても言及されています。

  • CloudWatch を使用して GPU をモニタリングする - Amazon CloudWatch で GPU 使用状況統計を報告するプリインストールされたユーティリティ。

  • nvidia-smi CLI - 全体的な GPU コンピューティングおよびメモリ使用率をモニタリングするユーティリティ。これは ( AWS Deep Learning AMIs DLAMI) にプリインストールされています。

  • NVML C ライブラリ - GPU モニタリングおよび管理機能に直接アクセスできる C ベースの API。これは、内部の nvidia-smi CLI によって使用され、DLAMI にプリインストールされています。また、それらの言語での開発を容易にするため、Python および Perl がバインドされています。DLAMI にプリインストールされた gpumon.py ユーティリティは、nvidia-ml-py の pynvml パッケージを使用しています。

  • NVIDIA DCGM - クラスター管理ツール。開発者ページにアクセスし、このツールをインストールして設定する方法を確認してください。

ヒント

NVIDIA の開発者ブログで、DLAMI にインストールされている CUDA ツールの使用方法に関する最新情報を確認してください。