Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Raccogli NVIDIA GPU metriche
È possibile utilizzare l' CloudWatch agente per raccogliere NVIDIA GPU metriche dai server Linux. Per configurarlo, aggiungi una nvidia_gpu
sezione all'interno della metrics_collected
sezione del file di configurazione dell' CloudWatch agente. Per ulteriori informazioni, consulta Sezione Linux.
Inoltre, sull'istanza deve essere installato un NVIDIA driver. NVIDIAi driver sono preinstallati su alcune Amazon Machine Images (AMIs). In caso contrario, il driver può essere installato manualmente. Per ulteriori informazioni, consulta Installare NVIDIA i driver sulle istanze Linux.
È possibile raccogliere i seguenti parametri. Tutte queste metriche vengono raccolte senza CloudWatch Unit
, ma è possibile specificare un'unità per ogni metrica aggiungendo un parametro al file di configurazione dell' CloudWatch agente. Per ulteriori informazioni, consulta Sezione Linux.
Parametro | Nome della metrica in CloudWatch | Descrizione |
---|---|---|
|
|
La percentuale di tempo durante l'ultimo periodo di campionamento durante il quale uno o più kernel GPU erano in esecuzione. |
|
|
La GPU temperatura interna in gradi Celsius. |
|
|
L'ultimo assorbimento di potenza misurato per l'intera scheda, in watt. |
|
|
La percentuale di tempo nell'ultimo periodo di campionamento in cui la memoria globale (dispositivo) veniva letta o scritta. |
|
|
La percentuale di velocità massima attualmente prevista per il funzionamento della ventola del dispositivo. |
|
|
Memoria totale riportata, in MB. |
|
|
Memoria utilizzata, in MB. |
|
|
Memoria libera, in MB. |
|
|
L'attuale generazione del collegamento. |
|
|
L'attuale larghezza del collegamento. |
|
|
Il numero attuale di sessioni dell'encoder. |
|
|
La media mobile dei fotogrammi di codifica al secondo. |
|
|
La media mobile della latenza di codifica in microsecondi. |
|
|
L'attuale frequenza di clock della scheda video (shader). |
|
|
L'attuale frequenza di clock dello Streaming Multiprocessor (SM). |
|
|
L'attuale frequenza di clock della memoria. |
|
|
L'attuale frequenza di clock del video (encoder più decoder). |
Tutti questi parametri vengono raccolti con le seguenti dimensioni:
Dimensione | Descrizione |
---|---|
|
Un identificatore univoco per il GPU su questo server. Rappresenta l'indice NVIDIA Management Library (NVML) del dispositivo. |
|
Il tipo diGPU. Ad esempio, |
|
Il nome host del server. |