本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 EMR Studio 调试应用程序和作业
借助 Amazon EMR Studio,您可以启动数据应用程序界面来分析浏览器中的应用程序和任务运行。
您也可以从 Amazon EMR 控制台为在集群上EMR运行的 Amazon 启动EC2集群外的永久用户界面。有关更多信息,请参阅 在 Amazon 中查看永久应用程序用户界面 EMR。
注意
根据您的浏览器设置,您可能需要启用弹出窗口才能打开应用程序 UI。
有关配置和使用应用程序接口的信息,请参阅YARN时间轴服务器
调试在亚马逊上EMR运行的亚马逊EC2作业
在EMR无服务器上运行的调试EMR工作室
与在亚马逊上EMR运行的 Amazon 类似EC2,您可以使用 Workspace 用户界面来分析您的EMR无服务器应用程序。在工作区用户界面中,当你使用亚马逊 6.14.0 及更高EMR版本时,你可以从工作区中的笔记本启动 Spark 网络用户界面(Spark UI 或 Spark History Server)。为方便起见,我们还提供了指向驱动程序日志的链接,便于您快速访问 Spark 驱动程序日志。
使用 Spark 历史服务器EMR在EKS作业运行时调试 Amazon
当您向EKS集群EMR上的 Amazon 提交任务运行时,您可以使用 Spark 历史服务器访问该任务运行的日志。Spark History Server 提供了用于监控 Spark 应用程序的工具,例如调度程序阶段和任务列表、RDD大小和内存使用情况摘要以及环境信息。您可以通过以下方式在EKS作业运行时启动适用于 Amaz EMR on 的 Spark 历史服务器:
-
当您使用带有 Amazon EMR on EKS 托管终端节点的 EMR Studio 提交任务运行时,您可以从工作区中的笔记本文件启动 Spark 历史服务器。
-
当你使用 AWS CLI 或 AWS SDK for Amaz EMR on 提交任务运行时EKS,你可以从 EMR Studio 用户界面启动 Spark History Server。
有关如何使用 Spark 历史记录服务器的信息,请参阅 Apache Spark 文档的监控和仪表
从 EMR Studio 工作区中的笔记本文件启动 Spark 历史服务器
-
打开一个连接到 Amazon EMR on EKS 集群的工作空间。
-
在 Workspace 中选择并打开 Notebook 文件。
-
选择 Notebook 文件顶部的 Spark UI,以在新选项卡打开持久性 Spark 历史记录服务器。
从 EMR Studio 用户界面启动 Spark 历史服务器
注意
EMRStudio 用户界面中的任务列表仅显示您使用 AWS CLI 或 AWS SDK在 Amazon EMR 上提交的任务运行EKS。
-
在您的 EMR Studio 中,选择页面左侧的 Amazon EMR。EKS
-
搜索您用来提交任务运行的 Amaz EMR on EKS 虚拟集群。您可在搜索框中输入值,按 status (状态) 或 ID 筛选集群列表。
-
选择集群以打开其详细信息页面。详细信息页面显示有关集群的信息,例如 ID、命名空间和状态。该页面还显示了提交至该集群的所有运行任务的列表。
-
在集群详细信息页面中选择要调试的任务运行。
-
在 Jobs (任务) 列表的右上角,选择 Launch Spark History Server (启动 Spark 历史记录服务器),以在新的浏览器选项卡中打开应用程序界面。