监控 - AWS Deep Learning AMIs

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控

您预DLAMI装了多个GPU监控工具。本指南还将介绍可用于下载和安装的工具。

  • GPUs使用监视器 CloudWatch-预装的实用程序,可向 Amazon CloudWatch 报告GPU使用情况统计信息。

  • nvidia-smi CLI-用于监控整体GPU计算和内存利用率的实用程序。它已预装在你的 AWS Deep Learning AMIs (DLAMI) 上。

  • NVMLC 库-基于 C 的库API,用于直接访问GPU监控和管理功能。nvidia-smi 在幕后使用它,并已CLI预先安装在你的。DLAMI它还具有 Python 和 Perl 绑定以方便采用这些请求进行开发。你上预安装的 gpumon.py 实用程序DLAMI使用的是来自的 pynvml 软件包。nvidia-ml-py

  • NVIDIADCGM-集群管理工具。请访问开发人员页面,了解如何安装和配置此工具。

提示

请查看开发NVIDIA者博客,了解有关使用您安装的CUDA工具的最新信息DLAMI: