CloudWatch 客服人員收集的指標 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CloudWatch 客服人員收集的指標

您可以在伺服器上安裝 CloudWatch 代理程式,以從伺服器收集指標。您可以在 Amazon EC2執行個體和內部部署伺服器上安裝代理程式。您也可以在執行 Linux、Windows Server 或 macOS 的電腦上安裝代理程式。如果您在 Amazon EC2執行個體上安裝代理程式,則除了在 Amazon EC2執行個體上預設啟用的指標之外,代理程式收集的指標也是如此。如需在執行個體上安裝 CloudWatch 代理程式的相關資訊,請參閱 使用 CloudWatch 代理程式收集指標、日誌和追蹤。您可以使用本節來了解 CloudWatch 客服人員收集的指標。

CloudWatch 客服人員在 Windows Server 執行個體上收集的指標

在執行 Windows Server 的伺服器上,安裝 CloudWatch 代理程式可讓您在 Windows Performance Monitor 中收集與計數器相關聯的指標。這些計數器的 CloudWatch 指標名稱是透過在物件名稱和計數器名稱之間放置空格來建立。例如, Processor 物件的% Interrupt Time計數器在 Processor % Interrupt Time中會指定指標名稱 CloudWatch。如需有關 Windows 效能監控計數器的詳細資訊,請參閱 Microsoft Windows Server 文件。

CloudWatch 客服人員收集指標的預設命名空間為 CWAgent,不過您可以在設定客服人員時指定不同的命名空間。

Linux 和 macOS 執行個體上的代理程式收集 CloudWatch的指標

下表列出您可以在 Linux 伺服器和 macOS 電腦上使用 CloudWatch 代理程式收集的指標。

指標 描述

cpu_time_active

在任何容量中CPU處於作用中狀態的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_guest

CPU 為訪客作業系統CPU執行虛擬 的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_guest_nice

CPU 為訪客作業系統CPU執行虛擬 的時間量,這是低優先順序,而且可以被其他程序中斷。這個指標是以百分之一秒來測量。

單位:無

cpu_time_idle

CPU 閒置的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_iowait

CPU 等待 I/O 操作完成的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_irq

CPU 服務中斷的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_nice

CPU 處於具有低優先順序程序的使用者模式的時間量,這很容易被較高優先順序的程序中斷。這個指標是以百分之一秒來測量。

單位:無

cpu_time_softirq

CPU 服務軟體中斷的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_steal

CPU 遭竊時間 的時間量,也就是在虛擬化環境中的其他作業系統中花費的時間。這個指標是以百分之一秒來測量。

單位:無

cpu_time_system

CPU 處於系統模式的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_time_user

CPU 處於使用者模式的時間量。這個指標是以百分之一秒來測量。

單位:無

cpu_usage_active

在任何容量中CPU處於作用中狀態的時間百分比。

單位:百分比

cpu_usage_guest

CPU 為訪客作業系統CPU執行虛擬 的時間百分比。

單位:百分比

cpu_usage_guest_nice

CPU 為訪客作業系統CPU執行虛擬 的時間百分比,這是低優先順序,而且可以被其他程序中斷。

單位:百分比

cpu_usage_idle

CPU 閒置的時間百分比。

單位:百分比

cpu_usage_iowait

CPU 等待 I/O 操作完成的時間百分比。

單位:百分比

cpu_usage_irq

CPU 服務中斷的時間百分比。

單位:百分比

cpu_usage_nice

CPU 處於具有低優先順序程序的使用者模式的時間百分比,較高優先順序程序可以輕鬆中斷。

單位:百分比

cpu_usage_softirq

CPU 服務軟體中斷的時間百分比。

單位:百分比

cpu_usage_steal

CPU 遭竊時間 的時間百分比,或在虛擬化環境中的其他作業系統中花費的時間百分比。

單位:百分比

cpu_usage_system

CPU 處於系統模式的時間百分比。

單位:百分比

cpu_usage_user

CPU 處於使用者模式的時間百分比。

單位:百分比

disk_free

磁碟上的可用空間。

單位:位元組

disk_inodes_free

磁碟上可用的索引節點數量。

單位:計數

disk_inodes_total

磁碟上預留的所有索引節點數量。

單位:計數

disk_inodes_used

磁碟上使用的索引節點數量。

單位:計數

disk_total

磁碟上的總空間,包括已使用的和可用空間。

單位:位元組

disk_used

磁碟上的已使用空間。

單位:位元組

disk_used_percent

已使用總磁碟空間的百分比。

單位:百分比

diskio_iops_in_progress

已發至裝置驅動程式但尚未完成的 I/O 請求數量。

單位:計數

diskio_io_time

磁碟有 I/O 請求排入佇列的時間量。

單位:毫秒

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_reads

磁碟讀取操作的數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_read_bytes

讀取自磁碟的位元組數目。

單位:位元組

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_read_time

讀取請求在磁碟上等待的時間。多個同時等待的讀取請求都會增加數量。例如,如果有 5 個請求平均都等待了 100 毫秒,則會報告 500 個。

單位:毫秒

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_writes

磁碟寫入操作的數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_write_bytes

寫入至磁碟的位元組數目。

單位:位元組

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

diskio_write_time

寫入請求在磁碟上等待的時間。多個同時等待的寫入請求都會增加數量。例如,如果有 8 個請求平均都等待了 1000 毫秒,則會報告 8000 個。

單位:毫秒

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

ethtool_bw_in_allowance_exceeded

由於傳入彙總頻寬超過執行個體的上限,因此佇列和/或捨棄的封包數目。

只有在您已在 CloudWatch 代理程式組態檔案的 區段ethtool中列出指標時,才會收集metrics_collected此指標。如需詳細資訊,請參閱 收集網路效能指標

單位:無

ethtool_bw_out_allowance_exceeded

因傳出的彙總頻寬超過執行個體的上限而排入佇列及/或丟棄的封包數目。

只有在您已在 CloudWatch 代理程式組態檔案的 區段ethtool中列出指標時,才會收集metrics_collected此指標。如需詳細資訊,請參閱 收集網路效能指標

單位:無

ethtool_conntrack_allowance_exceeded

因為連線追蹤超過執行個體的上限且無法建立新的連線,而丟棄的封包數目。這可能會導致傳送或傳回執行個體流量的封包遺失。

只有在您已在 CloudWatch 代理程式組態檔案的 區段ethtool中列出指標時,才會收集metrics_collected此指標。如需詳細資訊,請參閱 收集網路效能指標

單位:無

ethtool_linklocal_allowance_exceeded

由於本機代理服務流量PPS的 超過網路介面的上限,因此捨棄的封包數目。這會影響服務DNS、執行個體中繼資料服務和 Amazon Time Sync Service 的流量。

只有在您已在 CloudWatch 代理程式組態檔案的 區段ethtool中列出指標時,才會收集metrics_collected此指標。如需詳細資訊,請參閱 收集網路效能指標

單位:無

ethtool_pps_allowance_exceeded

由於雙向PPS超過執行個體的最大值,因此佇列和/或捨棄的封包數量。

只有在您已在 CloudWatch 代理程式組態檔案的 區段ethtool中列出指標時,才會收集metrics_collected此指標。如需詳細資訊,請參閱收集網路效能指標

單位:無

mem_active

在最後一個取樣期間以一些方式使用的記憶體數量。

單位:位元組

mem_available

可用的記憶體數量,可以立即指定到程序。

單位:位元組

mem_available_percent

可用的記憶體百分比,可以立即指定到程序。

單位:百分比

mem_buffered

用於緩衝區的記憶體數量。

單位:位元組

mem_cached

用於檔案快取的記憶體數量。

單位:位元組

mem_free

未使用的記憶體數量。

單位:位元組

mem_inactive

在最後一個抽象期間以某些方式而未使用的記憶體數量。

單位:位元組

mem_total

記憶體總量。

單位:位元組

mem_used

目前使用中的記憶體數量。

單位:位元組

mem_used_percent

目前使用中的記憶體百分比。

單位:百分比

net_bytes_recv

網路介面收到的位元組數目。

單位:位元組

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_bytes_sent

網路介面傳送的位元組數目。

單位:位元組

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_drop_in

此網路介面所接收且已捨棄的封包數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_drop_out

此網路介面所傳輸且已捨棄的封包數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_err_in

此網路介面偵測到的接收錯誤數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_err_out

此網路介面偵測到的傳送錯誤數量。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_packets_sent

此網路介面傳送的封包數目。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

net_packets_recv

此網路介面接收的封包數目。

單位:計數

此指標應使用的唯一統計資訊為 Sum。請勿選擇 Average

netstat_tcp_close

沒有狀態的TCP連線數目。

單位:計數

netstat_tcp_close_wait

等待用戶端終止請求的TCP連線數目。

單位:計數

netstat_tcp_closing

等待來自用戶端的確認終止請求的TCP連線數目。

單位:計數

netstat_tcp_established

已建立的TCP連線數。

單位:計數

netstat_tcp_fin_wait1

在關閉TCP連線的過程中,FIN_WAIT1處於 狀態的連線數。

單位:計數

netstat_tcp_fin_wait2

在關閉TCP連線的過程中,FIN_WAIT2處於 狀態的連線數。

單位:計數

netstat_tcp_last_ack

等待用戶端傳送TCP連線終止訊息確認的連線數目。這是連線關閉前的最後一個狀態。

單位:計數

netstat_tcp_listen

目前接聽連線請求的TCP連接埠數目。

單位:計數

netstat_tcp_none

與非作用中用戶端的TCP連線數。

單位:計數

netstat_tcp_syn_sent

傳送TCP連線請求後等待相符連線請求的連線數目。

單位:計數

netstat_tcp_syn_recv

在傳送和接收TCP連線請求之後,等待連線請求確認的連線數目。

單位:計數

netstat_tcp_time_wait

TCP 目前等待以確保用戶端收到連線終止請求確認的連線數目。

單位:計數

netstat_udp_socket

目前UDP連線的數量。

單位:計數

processes_blocked

封鎖的程序數量。

單位:計數

processes_dead

無效的程序數量,在 Linux 上以 X 狀態代碼指出。

此指標不會在 macOS 電腦上收集。

單位:計數

processes_idle

閒置的程序數量 (睡眠超過 20 秒)。僅適用於免費BSD執行個體。

單位:計數

processes_paging

正在分頁的程序數量,在 Linux 上以 W 狀態代碼指出。

此指標不會在 macOS 電腦上收集。

單位:計數

processes_running

執行中的程序數量,以 R 狀態代碼指出。

單位:計數

processes_sleeping

睡眠中的程序數量,以 S 狀態代碼指出。

單位:計數

processes_stopped

停止的程序數量,以 T 狀態代碼指出。

單位:計數

processes_total

在執行個體上的程序總數。

單位:計數

processes_total_threads

構成程序的執行緒總數。此指標只適用於 Linux 執行個體。

此指標不會在 macOS 電腦上收集。

單位:計數

processes_wait

分頁中的程序數目,由免費BSD執行個體上的W狀態碼表示。此指標僅適用於免費BSD執行個體,不適用於 Linux、Windows Server 或 macOS 執行個體。

單位:計數

processes_zombies

殭屍程序數量,以 Z 狀態代碼指出。

單位:計數

swap_free

未使用的切換空間數量。

單位:位元組

swap_used

目前使用中的交換空間數量。

單位:位元組

swap_used_percent

目前使用中的交換空間百分比。

單位:百分比

CloudWatch 客服人員收集的記憶體指標定義

當 CloudWatch 代理程式收集記憶體指標時,來源是主機的記憶體管理子系統。舉例來說,Linux 核心會在 /proc 中公開由作業系統維護的資料。對記憶體而言,該資料位於 /proc/meminfo 中。

每個不同的作業系統和架構對於各種程序所使用的資源都有不同的計算。如需詳細資訊,請參閱下列區段。

在每個收集間隔期間,每個執行個體上的 CloudWatch 代理程式會收集執行個體資源,並計算在該執行個體中執行的所有程序所使用的資源。此資訊會回報給 CloudWatch 指標。您可以在 CloudWatch 客服人員組態檔案中設定收集間隔的長度。如需詳細資訊,請參閱 CloudWatch 代理程式組態檔案:代理程式區段

下列清單說明如何定義 CloudWatch 客服人員收集的記憶體指標。

  • 作用中記憶體 – 程序正在使用的記憶體。換句話說,就是目前正在執行的應用程式所使用的記憶體。

  • 可用記憶體 – 系統不需要進入交換狀態,即可立即提供給程序的記憶體 (也稱為虛擬記憶體)。

  • 緩衝記憶體 – 以不同速度和優先順序運作之硬體裝置或程式程序所共用的資料區域。

  • 快取記憶體 – 存放在 CPU可能需要的程式操作中重複使用的程式指示和資料。

  • 閒置記憶體 – 尚未使用且隨時可用的記憶體。系統可在需要時完全自由使用。

  • 非作用中記憶體 – 「最近」未存取的頁面。

  • 總記憶體 – 實際實體記憶體的大小RAM。

  • 已使用記憶體 – 程式和程序目前正在使用的記憶體。

Linux:收集的指標和使用的計算

收集的指標和單位:

  • 作用中 (位元組)

  • 可用 (位元組)

  • 可用百分比 (百分比)

  • 緩衝 (位元組)

  • 快取 (位元組)

  • 閒置 (位元組)

  • 非作用中 (位元組)

  • 總計 (位元組)

  • 已使用 (位元組)

  • 已使用百分比 (百分比)

已使用記憶體 = 記憶體總計 - 可用記憶體 - 快取記憶體 - 緩衝記憶體

記憶體總計 = 已使用記憶體 + 可用記憶體 + 快取記憶體 + 緩衝記憶體

macOS:收集的指標和使用的計算

收集的指標和單位:

  • 作用中 (位元組)

  • 可用 (位元組)

  • 可用百分比 (百分比)

  • 閒置 (位元組)

  • 非作用中 (位元組)

  • 總計 (位元組)

  • 已使用 (位元組)

  • 已使用百分比 (百分比)

可用記憶體 = 閒置記憶體 + 非作用中記憶體

已使用記憶體 = 記憶體總計 - 可用記憶體

記憶體總計 = 可用記憶體 - 已使用記憶體

Windows:收集的指標

以下列出在 Windows 主機上收集的指標。所有這些指標的 Unit 均為 None

  • 可用位元組

  • 快取錯誤數/秒

  • 頁面錯誤數/秒

  • 頁數/秒

因為 CloudWatch 代理程式會從效能計數器剖析事件,所以沒有用於 Windows 指標的計算。

範例:在 Linux 上計算記憶體指標

舉例來說,假設在 Linux 主機上輸入 cat /proc/meminfo 命令會顯示下列結果:

MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>

在此範例中, CloudWatch 客服人員將收集下列值。 CloudWatch 客服人員收集和報告的所有值都是位元組。

  • mem_total:3916173312 位元組

  • mem_available:2209103872 位元組 (MemFree + 快取)

  • mem_free:473808896 位元組

  • mem_cached:1893990400 位元組 (cached + SReclaimable

  • mem_used:1419075584 位元組 (MemTotal – (MemFree + Buffers + (Cached + SReclaimable)))

  • mem_buffered:129667072 位元組

  • mem_available_percent:56.41%

  • mem_used_percent:36.24% (mem_used / mem_total) * 100