本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将训练数据导入 Amazon Personalize 数据集
完成创建架构和数据集后,就可以将训练数据导入到数据集。导入数据时,您可以选择批量、单独导入记录(或两者兼而有之)。
-
批量导入涉及一次性导入大量历史记录。您可以自己准备批量数据,然后将其从 Amazon S3 中的CSV文件直接导入 Amazon Personalize。有关如何准备数据的信息,请参阅为 Amazon Personalize 准备训练数据。如果您在准备数据时需要帮助,可以使用 SageMaker AI Data Wrangler 来准备和导入批量项目交互、用户和项目数据。有关更多信息,请参阅 使用 Amazon A SageMaker I Data Wrangler 准备和导入批量数据。
-
如果您没有批量数据,则可以使用单独的导入操作来收集数据和直播事件,直到满足 Amazon Personalize 训练要求以及域应用场景或配方的数据要求。有关记录事件的信息,请参阅记录实时事件以影响推荐。有关导入单个记录的信息,请参阅将单个记录导入 Amazon Personalize 数据集。
将数据导入 Amazon Personalize 数据集后,您可以对其进行分析、将其导出到 Amazon S3 存储桶、对其进行更新,或者通过删除数据集将其删除。
如果您导入的项目、用户或操作的编号与数据集中已有的记录相同,Amazon Personalize 会将其替换为新记录。如果您记录了两个具有完全相同时间戳和相同属性的商品互动或操作互动事件,Amazon Personalize 将只保留其中一个事件。
随着目录的增长,使用额外批量或单个数据导入操作来更新历史数据。要获得实时建议,请将您的物品交互数据集与用户的行为保持同步。为此,您可以使用事件跟踪器和 PutEvents 操作记录实时交互事件。有关更多信息,请参阅 记录实时事件以影响推荐
导入数据后,就可以创建域推荐器(适用于域数据集组)或自定义资源(适用于自定义数据集组),以根据您的数据训练模型。使用这些资源生成建议。有关更多信息,请参阅 Amazon Personalize 中的域推荐器或 用于训练和部署 Amazon Personalize 模型的自定义资源。