本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
编辑目标节点
Amazon SageMaker Canvas 数据流中的目标节点指定存储处理和转换后的数据的 Amazon S3 位置,并在数据流中应用所有配置的转换。您可以编辑现有目标节点的配置,然后选择重新运行任务以覆盖指定 Amazon S3 位置的数据。有关添加新目标节点的更多信息,请参阅添加目标节点。
使用以下步骤编辑数据流中的目标节点并启动导出任务。
编辑目标节点
-
导航到您的数据流。
-
选择要编辑的目标节点旁边的省略号图标。
-
在上下文菜单中,选择 “编辑”。
-
编辑目标侧面板打开。在此面板中,您可以编辑数据集名称、Amazon S3 位置以及导出和分区设置等详细信息。
-
(可选)在要导出的其他节点中,您可以在运行导出任务时选择更多要处理的目标节点。
-
如果您希望 Canvas 将数据流转换应用于整个数据集并导出结果,请选中 “处理整个数据集” 选项。如果取消选择此选项,Canvas 将仅对交互式 Data Wrangler 数据流中使用的数据集样本应用变换。
-
如果您希望 Canv as 自动确定是使用 Canvas 应用程序内存运行作业,还是使用 EMR Serverless 作业运行作业,请选中 “自动作业配置” 选项。如果您取消选择此选项并手动配置作业,则可以选择使用EMR无服务器或 SageMaker 处理作业。有关如何配置EMR无服务器或 SageMaker 处理作业的说明,请参阅前一节导出到 Amazon S3。
-
完成更改后,选择 “更新”。
保存对目标节点配置的更改不会自动重新运行作业或覆盖已经处理和导出的数据。再次导出数据以使用新配置运行作业。如果您决定使用作业再次导出数据,Canvas 会使用更新的目标节点配置将数据转换并输出到指定位置,从而覆盖所有现有数据。