本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
从 Studio 创建EMR无服务器应用程序
数据科学家和数据工程师可以直接从 Studio 用户界面创建EMR无服务器应用程序。在开始之前,请确保已按照一设置权限以允许从 SageMaker Studio 发布和启动亚马逊EMR应用程序节中所述配置了必要的权限。这些权限授予 Studio 创建、启动、查看、访问和终止应用程序的能力。
要从 Studio 创建EMR无服务器应用程序,请执行以下操作:
-
在 Studio 用户界面中,导航到左侧面板,然后在左侧导航菜单中选择数据节点。然后,滚动并选择 Amazon EMR 应用程序和集群选项。这将打开一个页面,在无服务器EMR应用程序选项卡下显示您可以从 Studio 环境中访问的 Amazon 应用程序。
-
选择右上角的创建无服务器应用程序按钮。这将打开 “创建应用程序” 页面,类似于您在应用程序设置选项中选择 “使用自定义设置” 时在EMR无服务器控制台
中看到的视图。 -
为您的应用程序提供必要的详细信息,包括名称和要设置的任何特定可配置参数,然后选择创建应用程序。
所有配置设置都有默认值,可以选择修改。有关每个可用参数的详细信息,请参阅 EMR Serverless 用户指南中的配置应用程序。
注意
-
在 Studio UI 中创建应用程序的过程中,您可以选择创建应用程序或创建并启动应用程序。根据您的选择,应用程序将分别进入
Creating
或Starting
状态。如果您选择在不立即启动应用程序的情况下创建应用程序,请确保 “提交作业时自动启动应用程序” 选项保持选中状态。这将确保当你稍后提交要在其上运行的作业时,应用程序会自动转换到该
Starting
状态。 -
对于最简单的设置,我们建议将 “网络连接” 部分下的 “虚拟私有云 (VPC)” 选项设置为默认值 “无法与您的VPC资源建立网络连接”。这允许在您的域中创建应用程序,VPC而无需进行任何其他网络配置。
在任何其他情况下,请确保执行以下步骤:
-
与你同行VPCs。
-
向您的私有子网路由表中添加路由。
-
按照中的详细说明配置您的安全组为您的 Amazon EMR 集群配置网络访问权限。
除了默认的 “无网络连接” 选项之外,这可以确保您的应用程序的网络设置正确。
-
-
对于通过 Studio Classic 用户界面创建的应用程序,将自动应用以下配置:
-
已启用的 Apache Livy 端点。
-
该应用程序标有以下内容:
-
sagemaker:user-profile-arn
-
sagemaker: domain-arn
-
sagemaker: space-arn
如果您在 Studio 之外创建应用程序,请确保手动启用 Apache Livy 端点并将相同的标签集应用于该应用程序。
-
-
-
创建应用程序后,Studio Classic 用户界面会显示 “应用程序已成功创建” 消息,新应用程序将出现在无服务器应用程序列表中。
要连接到您的EMR无服务器应用程序,请参阅 从 Studi EMR o 连接到无服务器应用程序