将数据导入 Data Wrangler - Amazon Personalize

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据导入 Data Wrangler

配置 SageMaker 域并在新选项卡中启动 Data Wrangler 后,就可以将数据从源导入到 Data Wrangler 了。当您使用 Data Wrangler 为 Amazon Personalize 准备数据时,一次只能导入一个数据集。我们建议从物品交互数据集开始。您不能使用 Data Wrangler 来准备操作数据集或操作交互数据集。

您从数据流页面开始。该页面应类似于以下内容。

描绘了 Data Wrangler 的数据流页面,其中包含导入数据和使用示例数据集选项。

要开始导入数据,请选择导入数据并指定您的数据源。Data Wrangler 支持 40 多个源。其中包括诸如亚马逊 Redshift、亚马逊或亚马逊 Athena 之类的 AWS 服务EMR,以及第三方,例如 Snowflake 或。 DataBricks不同的数据源有不同的连接和导入数据的步骤。

有关可用来源的完整列表和数据导入 step-by-step 说明,请参阅《Amazon SageMaker 开发者指南》中的导入

将数据导入 Data Wrangler 后,就可以对其进行转换了。有关数据转换的信息,请参阅转换数据