Amazon CloudWatch 儀表板 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon CloudWatch 儀表板

建立叢集時會建立 Amazon CloudWatch 儀表板。這可讓您更輕鬆地監控叢集中的節點,以及檢視儲存在 Amazon CloudWatch Logs 中的日誌。儀表板的名稱為 ClusterName-RegionClusterName 是叢集的名稱,而 Region AWS 區域 是叢集所在的 。您可以在主控台中存取儀表板,也可以開啟 https://console.aws.amazon.com/cloudwatch/home?region=Region#dashboards:name=ClusterName-Region

下圖顯示叢集的範例 CloudWatch 儀表板。

Dashboard graphs of the status of cluster resources.

主機節點執行個體指標

儀表板的第一個區段會顯示 Amazon EC2指標的主機節點圖表。

如果您的叢集具有共用儲存體,則下一節會顯示共用儲存體指標。

叢集運作狀態指標

如果您的叢集使用 Slurm 為了排程,叢集運作狀態指標圖表會顯示即時叢集運算節點錯誤。如需詳細資訊,請參閱疑難排解叢集健康度。從 3.6.0 AWS ParallelCluster 版開始,叢集運作狀態指標會新增至儀表板。

主節點日誌

最後一個區段會列出依 AWS ParallelCluster日誌、排程器日誌、Amazon DCV整合日誌和系統日誌分組的主機節點日誌。

如需 Amazon CloudWatch 儀表板的詳細資訊,請參閱 Amazon 使用者指南 中的使用 Amazon CloudWatch 儀表板 CloudWatch

如果您不想建立 Amazon CloudWatch 儀表板,您可以將 Monitoring / Dashboards / CloudWatch / 設定為 Enabled將其關閉false

注意

如果您停用 Amazon CloudWatch 儀表板的建立,您也可以停用叢集的 Amazon CloudWatch disk_used_percentmemory_used_percent警示。如需詳細資訊,請參閱針對叢集指標的 Amazon CloudWatch 警示

從 3.6 AWS ParallelCluster 版開始新增 disk_used_percentmemory_used_percent警示。