

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将数据集中的训练数据导出到 Amazon S3
<a name="export-data"></a>

将数据导入 Amazon Personalize 数据集后，您可以将数据导出到 Amazon S3 存储桶。您可以导出数据，来验证和检查 Amazon Personalize 用来生成建议、实时查看您之前记录的物品交互事件或对数据进行离线分析的数据。

您可以选择仅导出批量导入的数据（使用 Amazon Personalize 数据集导入任务导入），也可以选择仅导出您单独导入的数据（使用控制台或者 `PutEvents`、`PutUsers` 或 `PutItems` 操作导入的记录），或者两者兼而有之。

**注意**  
 您无法导出操作交互数据集或操作数据集中的数据。

对于与*所有字段* 完全匹配的记录，Amazon Personalize 仅导出一条记录。如果两条记录具有相同的 ID，但一个或多个字段不同，则 Amazon Personalize 会根据您选择导出的数据包含或删除记录：
+ 如果您同时导出批量数据和增量数据，则 Amazon Personalize 将仅导出具有相同 ID 的最新物品（在物品数据集导出中），并仅导出具有相同 ID 的用户（在用户数据集导出中）。对于物品交互数据集，Amazon Personalize 会导出所有物品交互数据。
+ 如果您仅导出增量数据，则 Amazon Personalize 会导出您单独导入的所有物品、用户或物品交互数据，包括具有相同 ID 的物品或用户。只有与所有字段完全匹配的记录才会被排除在外。
+ 如果您仅导出批量数据，则 Amazon Personalize 会包括您批量导入的所有物品、用户或物品交互数据，包括具有相同 ID 的物品或用户。只有与所有字段完全匹配的记录才会被排除在外。

要导出数据集，请创建数据集导出作业。*数据集导出作业* 是一种记录导出工具，可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个 CSV 文件。输出 CSV 文件包括标题行，其列名称与数据集架构中的字段相匹配。

**Topics**
+ [数据集导出作业权限要求](export-permissions.md)
+ [在 Amazon Personalize 中创建数据集导出作业](create-dataset-export-job.md)