本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
亚马逊 EMR Studio
Amazon EMR Studio 是一个基于 Web 的集成开发环境 (IDE),适用于在亚马逊EMR集群上运行的完全托管的 Jupyter 笔记本电脑。你可以为你的团队设置 EMR Studio 来开发、可视化和调试用 R、Python、Scala 和 PySpark编写的应用程序。EMR工作室集成了 AWS Identity and Access Management (IAM) 和 IAM Identity Center,因此用户可以使用其公司凭据登录。
您可以免费创建EMR工作室。使用 EMR Studio 时,将收取 Amazon S3 存储和亚马逊EMR集群的适用费用。有关产品详情和亮点,请参阅 Amazon EMR Studio
EMRStudio 的主要特点
Amazon EMR Studio 提供以下功能:
-
使用对用户进行身份验证 AWS Identity and Access Management (IAM),或者与 AWS IAM Identity Center 有或没有可信身份传播和您的企业身份提供商。
-
按需访问和启动 Amazon EMR 集群以运行 Jupyter 笔记本作业。
-
EMR在EKS集群上连接到 Amazon,以便在任务运行时提交工作。
-
浏览并保存示例笔记本。有关示例笔记本的更多信息,请参阅 EMRStudio 笔记本示例 GitHub 存储库
。 -
使用 Python、 PySpark、Spark Scala、Spark R 或 Spark 分析数据SQL,并安装自定义内核和库。
-
与同一 Workspace 中的其他用户实时协作。有关更多信息,请参阅 在工作EMR室中配置工作空间协作。
-
在使用笔记本中的数据之前,使用 EMR Studio SQL Explorer 浏览数据目录、运行SQL查询和下载结果。
-
使用编排工具(例如 Apache Airflow 或 Amazon Managed Workflows for Apache Airflow)将参数化笔记本作为计划工作流的一部分运行。有关更多信息,请参阅使用MWAA在 EMR Notebook 上编排分析作业
AWS 大数据博客。 -
链接代码存储库,例如 GitHub 和 BitBucket。
-
使用 Spark 历史服务器、Tez 用户界面或YARN时间轴服务器跟踪和调试作业。
EMRStudio HIPAA 符合资格,并已获得HITRUSTCSF和 SOC 2的认证。有关HIPAA合规性的更多信息 AWS 服务,请参阅https://aws.amazon.com/compliance/hipaa-compliance/
EMRStudio 也 FedRamp 符合规定。有关亚马逊遵守的合规计划的更多信息,请参阅亚马逊EMR合规性验证。EMR有关其他合规计划的更多信息 AWS 服务,请参阅 AWS 按合规计划划分的范围内的服务
Amazon EMR Studio 功能历史
下表列出了 Amazon EMR 托管扩展功能的更新。
发行日期 | 能力 |
---|---|
2024年1月5日 |
在 EMR Studio 中添加了支持 AWS GovCloud (美国东部)和 AWS GovCloud (美国西部)。 |
2023 年 11 月 26 日 |
为使用身份中心身份验证的 EMR Studio 添加了对可信IAM身份传播的支持。 |
2023 年 10 月 26 日 |
增加了创建具有交互功能的EMR无服务器应用程序的功能。 |
2023 年 2 月 28 日 |
增加了 AWS KMS 为EMR无服务器应用程序的应用程序日志存储提供客户管理的密钥支持。 |
2023 年 2 月 23 日 |
为提交EMR无服务器作业添加了一键创建IAM角色。为EMR无服务器应用程序选择自定义映像时添加了ECR查找。 |
2023 年 1 月 27 日 |
无头执行笔记本可以用 |
2023 年 1 月 23 日 |
持久性应用程序已经过优化,可以缩短启动时间。 |