本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将训练数据导入 Amazon Personalize 数据集
创建完架构和数据集后,就可以将训练数据导入数据集了。导入数据时,您可以选择批量、单独导入记录(或两者兼而有之)。
-
批量导入涉及一次性导入大量历史记录。您可以自己准备批量数据,然后将其从 Amazon S3 中的CSV文件直接导入 Amazon Personalize。有关如何准备数据的信息,请参阅为 Amazon Personalize 准备培训数据。如果您在准备数据时需要帮助,可以使用 D SageMaker ata Wrangler 来准备和导入批量项目交互、用户和项目数据。有关更多信息,请参阅 使用 Amazon Data Wrangler 准备和导入批量 SageMaker 数据。
-
如果您没有批量数据,则可以使用单独的导入操作来收集数据和直播事件,直到您满足 Amazon Personalize 培训要求以及您的域用例或配方的数据要求。有关录制事件的信息,请参阅记录实时事件以影响推荐。有关导入单个记录的信息,请参见将个人记录导入 Amazon Personalize 数据集。
将数据导入 Amazon Personalize 数据集后,您可以对其进行分析、将其导出到 Amazon S3 存储桶、对其进行更新,或者通过删除数据集将其删除。
随着目录的增长,使用额外批量或单个数据导入操作来更新历史数据。要获得实时建议,请将您的物品交互数据集与用户的行为保持同步。为此,您可以使用事件跟踪器和 PutEvents 操作记录实时交互事件。有关更多信息,请参阅 记录实时事件以影响推荐
导入数据后,您可以创建域推荐器(适用于域数据集组)或自定义资源(用于自定义数据集组),以根据您的数据训练模型。使用这些资源生成建议。有关更多信息,请参阅Amazon Personalize 中的域名推荐者 或用于培训和部署 Amazon Personalize 模型的自定义资源。