本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
針對叢集指標的 Amazon CloudWatch 警示
從 3.6 AWS ParallelCluster 版開始,您可以使用 Amazon CloudWatch 警示來設定叢集,以監控主節點。一個警報會監控根磁碟區disk_used_percent
。另一個警報會監控mem_used_percent
度量。如需詳細資訊,請參閱 Amazon CloudWatch 使用者指南中的CloudWatch代理程式收集的指標。
警報的名稱如下:
-
cluster-name
_DiskAlarm_HeadNode -
cluster-name
_MemAlarm_HeadNode
cluster-name
。
在導覽窗格中選擇 [警報],存取CloudWatch主控台中的警報。下列影像顯示叢集的磁碟使用量警示和記憶體使用量警示。
磁碟使用率警示處於 1 個資料點的磁碟使用率百分比大於 90% 的ALARM
狀態 (在 1 分鐘的時間內)。
記憶體使用量警示處於 1 個資料點的記憶體使用率百分比大於 90% 的ALARM
狀態,在 1 分鐘的時間內。
注意
AWS ParallelCluster默認情況下不配置警報操作。如需如何設定警示動作 (例如傳送通知) 的相關資訊,請參閱警示動作。如需 Amazon CloudWatch 警示的詳細資訊,請參閱 Amazon 使用CloudWatch者指南中的使用 Amazon CloudWatch 警示。
如果您不想建立這些 Amazon CloudWatch 警報,請false
在叢集組態中將 Monitoring/Dashboards/CloudWatch/設定Enabled為來停用警示。這也會禁用亞馬遜CloudWatch儀表板的創建。如需詳細資訊,請參閱Amazon CloudWatch 儀表板。
注意
如果您停用 Amazon CloudWatch 儀表板的創建,也會停用 Amazon CloudWatch disk_used_percent
和叢集的memory_used_percent
警示。