将数据集中的训练数据导出到 Amazon S3 - Amazon Personalize

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据集中的训练数据导出到 Amazon S3

将数据导入 Amazon Personalize 数据集后,您可以将数据导出到 Amazon S3 存储桶。您可以导出数据,来验证和检查 Amazon Personalize 用来生成建议、实时查看您之前记录的物品交互事件或对数据进行离线分析的数据。

您可以选择仅导出批量导入的数据(使用 Amazon Personalize 数据集导入任务导入),也可以选择仅导出您单独导入的数据(使用控制台或者 PutEventsPutUsersPutItems 操作导入的记录),或者两者兼而有之。

注意

您无法导出操作交互数据集或操作数据集中的数据。

对于与所有字段 完全匹配的记录,Amazon Personalize 仅导出一条记录。如果两条记录具有相同的 ID,但一个或多个字段不同,则 Amazon Personalize 会根据您选择导出的数据包含或删除记录:

  • 如果您同时导出批量数据和增量数据,则 Amazon Personalize 将仅导出具有相同 ID 的最新物品(在物品数据集导出中),并仅导出具有相同 ID 的用户(在用户数据集导出中)。对于物品交互数据集,Amazon Personalize 会导出所有物品交互数据。

  • 如果您仅导出增量数据,Amazon Personalize 会导出您单独导入的所有商品、用户或商品互动数据,包括具有这些数据的商品或用户IDs。只有与所有字段完全匹配的记录才会被排除在外。

  • 如果您仅导出批量数据,Amazon Personalize 会包含您批量导入的所有商品、用户或商品互动数据,包括具有这些数据的商品或用户IDs。只有与所有字段完全匹配的记录才会被排除在外。

要导出数据集,请创建数据集导出作业。数据集导出任务是一种记录导出工具,可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个CSV文件中。输出CSV文件包括标题行,其列名与数据集架构中的字段相匹配。