Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Collectez NVIDIA GPU des métriques
Vous pouvez utiliser l' CloudWatch agent pour collecter des NVIDIA GPU métriques à partir de serveurs Linux. Pour configurer cela, ajoutez une nvidia_gpu
section à l'intérieur de la metrics_collected
section du fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Section Linux.
En outre, un NVIDIA pilote doit être installé sur l'instance. NVIDIApilotes préinstallés sur certaines Amazon Machine Images (AMIs). Sinon, vous pouvez installer le pilote manuellement. Pour plus d'informations, consultez Installer des NVIDIA pilotes sur des instances Linux.
Les métriques suivantes peuvent être collectées. Toutes ces métriques sont collectées sans aucun CloudWatch Unit
, mais vous pouvez spécifier une unité pour chaque métrique en ajoutant un paramètre au fichier de configuration de l' CloudWatch agent. Pour de plus amples informations, veuillez consulter Section Linux.
Métrique | Nom de la métrique dans CloudWatch | Description |
---|---|---|
|
|
Pourcentage de temps pendant lequel un ou plusieurs noyaux GPU étaient en fonctionnement au cours de la dernière période d'échantillonnage. |
|
|
GPUTempérature centrale en degrés Celsius. |
|
|
Dernière consommation d'énergie mesurée pour l'ensemble de la carte, en watts. |
|
|
Pourcentage de temps sur la dernière période d'échantillonnage au cours de laquelle la mémoire globale (périphérique) était en cours de lecture ou d'écriture. |
|
|
Pourcentage de la vitesse maximale du ventilateur auquel le ventilateur de l'appareil est censé fonctionner. |
|
|
Mémoire totale déclarée, en Mo. |
|
|
Mémoire utilisée, en Mo. |
|
|
Mémoire libre, en Mo. |
|
|
Génération de liens actuelle. |
|
|
Largeur de liens actuelle. |
|
|
Nombre actuel de sessions de l'encodeur. |
|
|
Moyenne mobile des images d'encodage par seconde. |
|
|
Moyenne mobile de la latence d'encodage en microsecondes. |
|
|
Fréquence actuelle de l'horloge de graphiques (ombrage). |
|
|
Fréquence actuelle de l'horloge multiprocesseur de streaming (SM). |
|
|
Fréquence actuelle de l'horloge mémoire. |
|
|
Fréquence actuelle des horloges vidéo (encodeur et décodeur). |
Toutes ces mesures sont collectées avec les dimensions suivantes :
Dimension | Description |
---|---|
|
Un identifiant unique pour le GPU sur ce serveur. Représente l'index de la bibliothèque de NVIDIA gestion (NVML) du périphérique. |
|
Le type deGPU. Par exemple, |
|
Nom d'hôte du serveur. |