本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将数据集中的训练数据导出到 Amazon S3
将数据导入 Amazon Personalize 数据集后,您可以将数据导出到 Amazon S3 存储桶。您可以导出数据,来验证和检查 Amazon Personalize 用来生成建议、实时查看您之前记录的物品交互事件或对数据进行离线分析的数据。
您可以选择仅导出批量导入的数据(使用 Amazon Personalize 数据集导入任务导入),也可以选择仅导出您单独导入的数据(使用控制台或者 PutEvents
、PutUsers
或 PutItems
操作导入的记录),或者两者兼而有之。
注意
您无法导出操作交互数据集或操作数据集中的数据。
对于与所有字段 完全匹配的记录,Amazon Personalize 仅导出一条记录。如果两条记录具有相同的 ID,但一个或多个字段不同,则 Amazon Personalize 会根据您选择导出的数据包含或删除记录:
-
如果您同时导出批量数据和增量数据,则 Amazon Personalize 将仅导出具有相同 ID 的最新物品(在物品数据集导出中),并仅导出具有相同 ID 的用户(在用户数据集导出中)。对于物品交互数据集,Amazon Personalize 会导出所有物品交互数据。
-
如果您仅导出增量数据,Amazon Personalize 会导出您单独导入的所有商品、用户或商品互动数据,包括具有这些数据的商品或用户IDs。只有与所有字段完全匹配的记录才会被排除在外。
-
如果您仅导出批量数据,Amazon Personalize 会包含您批量导入的所有商品、用户或商品互动数据,包括具有这些数据的商品或用户IDs。只有与所有字段完全匹配的记录才会被排除在外。
要导出数据集,请创建数据集导出作业。数据集导出任务是一种记录导出工具,可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个CSV文件中。输出CSV文件包括标题行,其列名与数据集架构中的字段相匹配。