Raccolta di parametri dei processi con il plug-in procstat - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Raccolta di parametri dei processi con il plug-in procstat

Il plug-in procstat consente di recuperare i parametri dai singoli processi. Il plugin è supportato sui server Linux e sui server che eseguono una versione supportata di Windows Server. Questa sezione descrive come configurare l' CloudWatch agente per procstat e visualizzare le metriche importate dall' CloudWatch agente. Elenca inoltre le metriche raccolte da procstat.

Nota

Il procstat plug-in non è supportato per il tipo di lancio Fargate negli ambienti Amazon ECS.

Configura l' CloudWatch agente per procstat

Per utilizzare il plugin procstat, aggiungi una procstat sezione nella sezione del file di configurazione dell'metrics_collectedagente. CloudWatch Esistono tre modi per specificare i processi da monitorare. Puoi usare solo uno di questi metodi, ma puoi specificare uno o più processi da monitorare.

  • pid_file: consente di selezionare i processi in base ai nomi dei file PID creati.

  • exe: consente di selezionare i processi i cui nomi corrispondono alla stringa specificata, utilizzando regole di corrispondenza delle espressioni regolari. La corrispondenza è di tipo "contiene", ovvero se si specifica agent come il termine da abbinare, i processi con nomi come cloudwatchagent corrispondono al termine. Per ulteriori informazioni, consulta la pagina Syntax.

  • pattern: consente di selezionare i processi in base alla righe di comando utilizzate per avviare i processi. Le righe di comando di tutti i processi selezionati corrispondono alla stringa specificata utilizzando regole di corrispondenza delle espressioni regolari. L'intera riga di comando è selezionata, inclusi i parametri e le opzioni utilizzati con il comando.

    La corrispondenza è di tipo "contiene", ovvero se si specifica -config come il termine da abbinare, i processi con parametri come -c corrispondono al termine.

  • drop_original_metrics Facoltativo. Se utilizzi il campo aggregation_dimensions nella sezione metrics per raggruppare i parametri in risultati aggregati, per impostazione predefinita l'agente invia sia i parametri aggregati che i parametri originali separati per ogni valore della dimensione. Se non vuoi che le metriche originali vengano inviate a CloudWatch, puoi specificare questo parametro con un elenco di metriche. Le metriche specificate insieme a questo parametro non hanno le relative metriche per dimensione riportate. CloudWatch Vengono invece riportati solo i parametri aggregati. Ciò riduce il numero di parametri raccolti dall'agente, riducendo i costi.

L' CloudWatch agente utilizza solo uno di questi metodi, anche se includi più di una delle sezioni precedenti. Se si specifica più di una sezione, l' CloudWatch agente utilizza la pid_file sezione se presente. In caso contrario, utilizza la sezione exe.

Su Linux server, le stringhe specificate in una sezione exe o pattern vengono valutate come espressioni regolari. Su server che eseguono Windows Server, queste stringhe vengono valutate come query WMI. Ad esempio, sarebbe pattern: "%apache%". Per ulteriori informazioni, consulta la pagina LIKE Operator.

Indipendentemente dal metodo utilizzato, puoi includere un parametro metrics_collection_interval opzionale, che specifica la frequenza in secondi di raccolta di tali parametri. Se non specifichi questo parametro, verrà utilizzato il valore predefinito di 60 secondi.

Negli esempi nelle sezioni seguenti, la sezione procstat è la sola inclusa nella sezione metrics_collected del file di configurazione dell'agente. I file di configurazione effettivi possono anche includere altre sezioni in metrics_collected. Per ulteriori informazioni, consulta Crea o modifica manualmente il file di configurazione CloudWatch dell'agente.

Configura con pid_file

La sezione procstat di esempio seguente monitora i processi che creano i file PID example1.pid e example2.pid. Ogni processo raccogli parametri diversi. I parametri raccolti dal processo che crea example2.pid vengono raccolti ogni 10 secondi, mentre i parametri raccolti dal processo example1.pid vengono raccolti ogni 60 secondi, ovvero il valore predefinito.

{ "metrics": { "metrics_collected": { "procstat": [ { "pid_file": "/var/run/example1.pid", "measurement": [ "cpu_usage", "memory_rss" ] }, { "pid_file": "/var/run/example2.pid", "measurement": [ "read_bytes", "read_count", "write_bytes" ], "metrics_collection_interval": 10 } ] } } }

Configurazione con exe

La sezione procstat di esempio seguente monitora tutti i processi con nomi che corrispondono alle stringhe agent o plugin. Ogni processo raccoglie gli stessi parametri.

{ "metrics": { "metrics_collected": { "procstat": [ { "exe": "agent", "measurement": [ "cpu_time", "cpu_time_system", "cpu_time_user" ] }, { "exe": "plugin", "measurement": [ "cpu_time", "cpu_time_system", "cpu_time_user" ] } ] } } }

Configurazione con modello

La sezione procstat di esempio seguente monitora tutti i processi con righe di comando che corrispondono alle stringhe config o -c. Ogni processo raccoglie gli stessi parametri.

{ "metrics": { "metrics_collected": { "procstat": [ { "pattern": "config", "measurement": [ "rlimit_memory_data_hard", "rlimit_memory_data_soft", "rlimit_memory_stack_hard", "rlimit_memory_stack_soft" ] }, { "pattern": "-c", "measurement": [ "rlimit_memory_data_hard", "rlimit_memory_data_soft", "rlimit_memory_stack_hard", "rlimit_memory_stack_soft" ] } ] } } }

Parametri raccolti da Procstat

La tabella seguente elenca i parametri che puoi raccogliere con il plug-in procstat.

L' CloudWatch agente aggiunge procstat all'inizio dei seguenti nomi di metriche. La sintassi varia a seconda che la raccolta venga eseguita da un server Linux o da un server che esegue Windows Server. Ad esempio, il parametro cpu_time viene visualizzato come procstat_cpu_time quando viene raccolto da Linux e come procstat cpu_time quando viene raccolto da Windows Server.

Nome parametro Disponibile su Descrizione

cpu_time

Linux

Il tempo di utilizzo della CPU. Questo parametro è misurato in centesimi di secondo.

Unità: numero

cpu_time_guest

Linux

Il periodo di tempo durante il quale il processo si trova in modalità guest. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_guest_nice

Linux

La quantità di tempo in cui il processo è in esecuzione in un simpatico ospite. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_idle

Linux

Il periodo di tempo durante il quale il processo si trova in modalità di inattività. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_iowait

Linux

Il periodo di tempo durante il quale il processo è in attesa di operazioni di I/O da completare. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_irq

Linux

Il periodo di tempo durante il quale il processo lavora sulle interruzioni. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_nice

Linux

Il periodo di tempo durante il quale il processo si trova in modalità nice. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_soft_irq

Linux

Il periodo di tempo durante il quale il processo lavora sulle interruzioni del software. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_steal

Linux

Il tempo impiegato per l'esecuzione in altri sistemi operativi durante l'esecuzione in un ambiente virtualizzato. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_stolen

Linux, Windows Server

Il periodo di tempo durante il quale il processo si trova nello stato di stolen time (tempo rubato), ovvero il tempo impiegato su altri sistemi operativi in un ambiente virtualizzato. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: nessuna

cpu_time_system

Linux, Windows Server, macOS

Il periodo di tempo durante il quale il processo si trova in modalità di sistema. Questo parametro è misurato in centesimi di secondo.

Tipo: Float

Unità: numero

cpu_time_user

Linux, Windows Server, macOS

Il periodo di tempo durante il quale il processo si trova in modalità utente. Questo parametro è misurato in centesimi di secondo.

Unità: numero

cpu_usage

Linux, Windows Server, macOS

La percentuale di tempo durante il quale il processo è attivo su qualsiasi capacità.

Unità: percentuale

memory_data

Linux, macOS

La quantità di memoria utilizzata dal processo per i dati.

Unità: byte

memory_locked

Linux, macOS

La quantità di memoria bloccata dal processo.

Unità: byte

memory_rss

Linux, Windows Server, macOS

La quantità di memoria reale (set residente) utilizzata dal processo.

Unità: byte

memory_stack

Linux, macOS

La quantità di memoria stack utilizzata dal processo.

Unità: byte

memory_swap

Linux, macOS

La quantità di memoria swap utilizzata dal processo.

Unità: byte

memory_vms

Linux, Windows Server, macOS

La quantità di memoria virtuale utilizzata dal processo.

Unità: byte

num_fds

Linux

Il numero di descrittori di file aperti da questo processo.

Unità: nessuna

num_threads

Linux, Windows, macOS

Il numero di thread nel processo.

Unità: nessuna

pid

Linux, Windows Server, macOS

Identificatore processo (ID).

Unità: nessuna

pid_count

Linux, Windows Server, macOS

Il numero di processi IDs associati al processo.

Sui server Linux e sui computer macOS il nome completo di questa metrica è procstat_lookup_pid_count e su Windows Server è procstat_lookup pid_count.

Unità: nessuna

read_bytes

Linux, Windows Server

Il numero di byte letti dal processo dai dischi.

Unità: byte

write_bytes

Linux, Windows Server

Il numero di byte scritti dal processo sui dischi.

Unità: byte

read_count

Linux, Windows Server

Il numero di operazioni di lettura del disco eseguite dal processo.

Unità: nessuna

rlimit_realtime_priority_hard

Linux

Il limite hard alla priorità in tempo reale che può essere impostato per questo processo.

Unità: nessuna

rlimit_realtime_priority_soft

Linux

Il limite soft alla priorità in tempo reale che può essere impostato per questo processo.

Unità: nessuna

rlimit_signals_pending_hard

Linux

Il limite hard al numero massimo di segnali che possono essere messi in coda da questo processo.

Unità: nessuna

rlimit_signals_pending_soft

Linux

Il limite soft al numero massimo di segnali che possono essere messi in coda da questo processo.

Unità: nessuna

rlimit_nice_priority_hard

Linux

Il limite hard alla priorità nice massima che può essere impostata da questo processo.

Unità: nessuna

rlimit_nice_priority_soft

Linux

Il limite soft alla priorità nice massima che può essere impostata da questo processo.

Unità: nessuna

rlimit_num_fds_hard

Linux

Il limite del numero massimo di descrittori di file che un processo può avere aperti.

Unità: nessuna

rlimit_num_fds_soft

Linux

Il limite soft del numero massimo di descrittori di file che un processo può avere aperti.

Unità: nessuna

write_count

Linux, Windows Server

Il numero di operazioni di scrittura del disco eseguite dal processo.

Unità: nessuna

involuntary_context_switches

Linux

Il numero di volte in cui si è verificato un passaggio di contesto involontario del processo.

Unità: nessuna

voluntary_context_switches

Linux

Il numero di volte in cui si è verificato un passaggio di contesto volontario del processo.

Unità: nessuna

realtime_priority

Linux

L'utilizzo corrente di priorità real-time per il processo.

Unità: nessuna

nice_priority

Linux

L'utilizzo corrente di priorità nice per il processo.

Unità: nessuna

signals_pending

Linux

Il numero di segnali in attesa di essere gestiti dal processo.

Unità: nessuna

rlimit_cpu_time_hard

Linux

Il limite di risorsa di tempo CPU hard per il processo.

Unità: nessuna

rlimit_cpu_time_soft

Linux

Il limite di risorsa di tempo CPU soft per il processo.

Unità: nessuna

rlimit_file_locks_hard

Linux

Il limite di risorsa dei blocchi file hard per il processo.

Unità: nessuna

rlimit_file_locks_soft

Linux

Il limite di risorsa dei blocchi file soft per il processo.

Unità: nessuna

rlimit_memory_data_hard

Linux

Il limite di risorse hard sul processo per memoria utilizzata per i dati.

Unità: byte

rlimit_memory_data_soft

Linux

Il limite di risorse soft sul processo per memoria utilizzata per i dati.

Unità: byte

rlimit_memory_locked_hard

Linux

Il limite di risorse hard sul processo per memoria bloccata.

Unità: byte

rlimit_memory_locked_soft

Linux

Il limite di risorse soft sul processo per memoria bloccata.

Unità: byte

rlimit_memory_rss_hard

Linux

Il limite di risorse hard sul processo per memoria fisica.

Unità: byte

rlimit_memory_rss_soft

Linux

Il limite di risorse soft sul processo per memoria fisica.

Unità: byte

rlimit_memory_stack_hard

Linux

Il limite di risorsa hard sullo stack del processo.

Unità: byte

rlimit_memory_stack_soft

Linux

Il limite di risorsa soft sullo stack del processo.

Unità: byte

rlimit_memory_vms_hard

Linux

Il limite di risorse hard sul processo per memoria virtuale.

Unità: byte

rlimit_memory_vms_soft

Linux

Il limite di risorse soft sul processo per memoria virtuale.

Unità: byte

Visualizzazione delle metriche di processo importate dall'agente CloudWatch

Dopo aver importato le metriche di processo in CloudWatch, puoi visualizzare queste metriche come grafici di serie temporali e creare allarmi in grado di monitorare queste metriche e avvisarti se superano una soglia specificata. La procedura seguente mostra come visualizzare i parametri del processo come grafico delle serie temporali. Per ulteriori informazioni sull'impostazione degli allarmi, consulta Utilizzo degli CloudWatch allarmi Amazon.

Per visualizzare le metriche di processo nella console CloudWatch
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione, seleziona Parametri.

  3. Scegli lo spazio dei nomi da utilizzare per i parametri raccolti dall'agente. Per impostazione predefinita, lo è CWAgent, ma è possibile che sia stato specificato uno spazio dei nomi diverso nel file di configurazione dell' CloudWatch agente.

  4. Scegli una dimensione di parametro (ad esempio, Per-Instance Metrics (Parametri per istanza)).

  5. La scheda All metrics (Tutti i parametri) visualizza tutti i parametri per tale dimensione nello spazio dei nomi. Puoi eseguire le operazioni indicate di seguito:

    1. Per creare il grafico di un parametro, seleziona la casella di controllo accanto al parametro. Per selezionare tutte i parametri, seleziona la casella di controllo nella riga dell'intestazione della tabella.

    2. Per ordinare la tabella, utilizza l'intestazione della colonna.

    3. Per filtrare per risorsa, scegli l'ID della risorsa e quindi Add to search (Aggiungi alla ricerca).

    4. Per filtrare in base a un parametro, scegli il nome del parametro e quindi Add to search (Aggiungi alla ricerca).

  6. (Facoltativo) Per aggiungere questo grafico a una CloudWatch dashboard, scegli Azioni, Aggiungi alla dashboard.