选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

Amazon EMR Notebooks 概述

聚焦模式
Amazon EMR Notebooks 概述 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

注意

EMR Notebooks 在控制台中作为 Amazon EMR Studio Workspaces 提供。通过控制台中的创建 Workspace 按钮,可以创建新的 Notebooks。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR Notebooks 是控制台中的 Amazon EMR Studio WorkspacesAmazon EMR 控制台

您可以使用亚马逊 EMR 笔记本和运行 Apache Spark 的亚马逊 EMR 集群在亚马逊 EMR 控制台 JupyterLab中创建和打开 Jupyter 笔记本和界面。EMR Notebook 是一款“无服务器”Notebook,可用于运行查询和代码。与传统 Notebook 不同,EMR Notebook 的内容(Notebook 单元格中的方程、查询、模型、代码和叙述性文本)在客户端中运行。命令是使用 EMR 集群上的内核执行的。Notebook 内容也将独立于集群数据保存到 Amazon S3 中以实现持久性和灵活重用。

您可以启动集群,附加 EMR Notebook 以进行分析,然后终止集群。您还可以关闭已附加到一个正在运行的集群的 Notebook 并切换到另一个 Notebook。多个用户可以同时将 Notebooks 附加到同一个集群,并在 Amazon S3 中相互共享 Notebook 文件。利用这些功能,您可以按需运行集群以节省成本,并减少为不同的集群和数据集重新配置 Notebooks 所花费的时间。

您还可以使用 Amazon EMR API 以编程方式执行 EMR Notebook,而无需与 Amazon EMR 控制台交互(“无头执行”)。您需要在具有参数标签的 EMR Notebook 中包含一个单元格。该单元格允许脚本将新输入值传递给 Notebook。参数化 Notebooks 可以通过不同的输入值集重复使用。无需复制同一 Notebook 以使用新输入值进行编辑和执行。针对参数化 Notebook 的每次运行,Amazon EMR 都在 S3 上创建并保存输出 Notebook。有关 EMR Notebook API 代码示例,请参阅EMR Notebooks 的示例编程命令

重要

EMR Notebooks 的功能支持使用 Amazon EMR 5.18.0 及更高版本的集群。建议您将 EMR Notebooks 与使用最新版 Amazon EMR(或最低 5.30.0、5.32.0 或 6.2.0 版本)的集群配合使用。在这些版本中,Jupyter 内核在附加的集群而不是 Jupyter 实例上运行。这有助于提高性能并增强您自定义内核和库的能力。有关更多信息,请参阅 集群发行版的功能差异

对于 Amazon S3 存储和 Amazon EMR 集群收取适用的费用。

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。