使用 EMR Studio 调试应用程序和任务
借助 Amazon EMR Studio,您可以启动数据应用程序界面,以便在浏览器中分析应用程序和任务运行情况。
您还可以从 Amazon EMR 控制台为在 EC2 集群上运行的 Amazon EMR 启动持久性的集群外用户界面。有关更多信息,请参阅 在 Amazon EMR 中查看持久性应用程序用户界面。
注意
根据您的浏览器设置,您可能需要启用弹出窗口才能打开应用程序 UI。
有关配置和使用应用程序界面的信息,请参阅 YARN 时间线服务器
调试 Amazon EC2 任务上运行的 Amazon EMR
调试在 EMR Serverless 上运行的 EMR Studio
与在 Amazon EC2 上运行的 Amazon EMR 类似,您可以使用 Workspace 用户界面来分析您的 EMR Serverless 应用程序。在 Workspace UI 中,当您使用 Amazon EMR 发行版 6.14.0 及更高版本时,您可以从 Workspace 中的笔记本电脑实例启动 Spark Web 用户界面(Spark UI 或 Spark 历史记录服务器)。为方便起见,我们还提供了指向驱动程序日志的链接,便于您快速访问 Spark 驱动程序日志。
使用 Spark 历史记录服务器调试 Amazon EMR on EKS 任务运行
当您向 Amazon EMR on EKS 集群提交任务运行时,可以使用 Spark 历史记录服务器访问该任务运行的日志。Spark 历史记录服务器提供了监控 Spark 应用程序的工具,例如:调度流程阶段和任务列表、RDD 大小和内存使用情况概述以及环境信息。您可以通过以下方式启动 Amazon EMR on EKS 任务运行的 Spark 历史记录服务器:
-
当您使用具有 EMR on EKS 托管式端点的 Amazon EMR Studio 提交任务运行时,可以通过 Workspace 的笔记本文件启动 Spark 历史记录服务器。
-
当您使用 Amazon EMR on EKS 的 AWS CLI 或者 AWS SDK 提交任务运行时,可以通过 EMR Studio UI 启动 Spark 历史记录服务器。
有关如何使用 Spark 历史记录服务器的信息,请参阅 Apache Spark 文档的监控和仪表
从 EMR Studio Workspace 中的笔记本文件启动 Spark 历史记录服务器
-
打开连接到 Amazon EMR on EKS 集群的 Workspace。
-
在 Workspace 中选择并打开笔记本文件。
-
选择笔记本文件顶部的 Spark UI,以在新选项卡打开持久性 Spark 历史记录服务器。
通过 EMR Studio UI 启动 Spark 历史记录服务器
注意
EMR Studio UI 中的任务列表仅显示:您使用 Amazon EMR on EKS 的 AWS CLI 或者 AWSSDK 提交的任务运行。
-
在您的 EMR Studio 中,从页面左侧选择 Amazon EMR on EKS。
-
搜索您常用于提交任务运行的 Amazon EMR on EKS 虚拟集群。您可在搜索框中输入值,按 status (状态) 或 ID 筛选集群列表。
-
选择集群以打开其详细信息页面。详细信息页面显示有关集群的信息,例如 ID、命名空间和状态。该页面还显示了提交至该集群的所有运行任务的列表。
-
在集群详细信息页面中选择要调试的任务运行。
-
在 Jobs (任务) 列表的右上角,选择 Launch Spark History Server (启动 Spark 历史记录服务器),以在新的浏览器选项卡中打开应用程序界面。