使用指標監控 Ray 任務 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用指標監控 Ray 任務

您可以使用 AWS Glue Studio 和 Amazon CloudWatch 來監控 Ray 任務。CloudWatch 可透過 Ray 收集並處理來自 AWS Glue 的原始指標,進而使這些指標可供分析。這些指標會在 AWS Glue Studio 主控台中以視覺化方式呈現,因此您可以在任務執行時監控任務。

如需如何監控 AWS Glue 的一般概觀,請參閱使用 Amazon CloudWatch 指標監控 AWS Glue。如需如何使用 AWS Glue 發佈的 CloudWatch 指標的一般概觀,請參閱使用 Amazon CloudWatch 監控

在 AWS Glue 主控台中監控 Ray 任務

在任務執行的詳細資訊頁面的執行詳細資訊區段下方,您可以檢視預先建立的彙總圖表,其中將可用的任務指標以視覺化方式呈現。AWS Glue Studio 會針對每個任務執行傳送任務指標到 CloudWatch。您可以使用這些任務指標建立叢集和工作的設定檔,以及存取有關每個節點的詳細資訊。

如需有關可用指標圖表的詳細資訊,請參閱 檢視 Ray 工作執行的 Amazon CloudWatch 測量結果

CloudWatch 中的 Ray 任務指標概觀

在 CloudWatch 中啟用詳細監控功能時,我們會發佈 Ray 指標。指標會發佈至 Glue/Ray CloudWatch 命名空間。

  • 執行個體指標

    我們會針對指派給任務的執行個體,發佈 CPU、記憶體和磁碟使用率的指標。這些指標會由 ExecutorIdExecutorTypehost 等特性識別。這些指標是標準 Linux CloudWatch 代理程式指標的子集。您可以在 CloudWatch 文件中找到指標名稱和特性的相關資訊。如需詳細資訊,請參閱 CloudWatch 代理程式收集的指標

  • Ray 叢集指標

    我們會將執行指令碼的 Ray 程序中的指標轉送至此命名空間,然後提供對您而言最重要的指標。可用的指標可能因 Ray 版本而異。如需有關任務正在執行之 Ray 版本的詳細資訊,請參閱 AWS Glue 版本

    Ray 會在執行個體層級收集指標。它還提供了任務和叢集的指標。如需有關 Ray 基礎指標策略的詳細資訊,請參閱 Ray 文件中的指標

注意

我們不會將 Ray 指標發佈至僅用於 AWS Glue ETL 任務的 Glue/Job Metrics/ 命名空間。