准备清单 - Amazon Personalize

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备清单

在您查看了 Amazon Personalize 的工作原理并完成入门练习后,您可以开始准备使用 Amazon Personalize 处理自己的数据了。此清单列出了 Amazon Personalize 的特征、要求和数据指南。它可以帮助您进行规划,也可以将其用作在 Amazon Personalize 中创建资源时的参考。

您是否将自己的使用案例与 Amazon Personalize 资源进行了匹配?

Amazon Personalize 建议可以解决以下使用案例:

  • 为用户生成个性化建议

  • 推荐类似或相关物品

  • 推荐趋势或热门物品

  • 为用户建议下一个最佳操作

  • 按相关性重新排序(仅限使用自定义资源)

  • 生成用户细分(仅限使用自定义资源)

Amazon Personalize 提供基于域的资源和为这些使用案例配置的自定义资源。首先,创建域数据集组或自定义数据集组:

  • 对于域数据集组,创建针对 VIDEO_ON_DEMAND 或 ECOMMERCE 域进行预配置和优化的资源。

    如果您有流视频或电子商务应用程序,我们建议您从域数据集组开始。您仍然可以添加自定义资源,例如针对自定义使用案例训练的解决方案和解决方案版本。而且,您仍然可以使用自定义资源来获取批量推荐。您无法在域数据集组中创建次佳操作资源,包括操作和操作交互数据集。

  • 对于自定义数据集组,选择与您的使用案例相匹配的食谱。然后,只训练和部署可配置的解决方案与解决方案版本(经过训练的 Amazon Personalize 建议模型)。准备就绪后,您可以在活动中部署解决方案版本以获得实时推荐。或者,您也可以在没有广告活动的情况下获得批量推荐。

    如果您没有流视频或电子商务应用程序,我们建议您创建自定义数据集组。否则,从域数据集组开始,然后根据需要添加自定义资源。

有关 Amazon Personalize 中提供的使用案例和自定义食谱的信息,请参阅域使用案例和自定义配方

您是否有足够的物品交互数据?

对于所有使用案例和配方,您的 25 个唯一用户必须进行至少 1000 次物品交互,每个用户至少有两次交互。为获得高质量的建议,我们建议您至少有 1000 名用户的最少 5 万次物品交互,每位用户有两次或更多次物品交互。

如果您不确定自己是否有足够的数据,可以使用 Amazon Personalize 控制台导入和分析数据。有关更多信息,请参阅 分析数据集中数据的质量和数量

您是否有实时事件流式传输架构?

如果您没有足够的物品交互数据,则可以使用 Amazon Personalize 来收集其它实时事件数据。对于一些食谱和使用案例,Amazon Personalize 可以从用户的最新活动中学习,并在他们使用您的应用程序时更新建议。

有关记录事件的信息(包括事件如何影响建议、第三方事件跟踪服务列表以及示例实施),请参阅记录实时事件以影响推荐

您的数据是否针对 Amazon Personalize 进行了优化?

我们建议您在数据中检查以下内容:

  • 检查是否缺失值。我们建议至少 70% 的记录包含每个属性的数据。我们建议允许空值的列的填写率至少为 70%。

  • 修复数据中的任何不准确之处或问题,例如命名约定不一致、项类别重复、数据集之间的 ID 不匹配或 ID 重复。这些问题可能会对建议产生负面影响或导致意外行为。例如,您的数据中可能同时有“N/A”和“不适用”,但仅基于“N/A”筛选建议。标记为“不适用”的物品不会被筛选器删除。

  • 如果一个物品、用户或操作可以有多个类别(例如一部电影有多种类型),请将分类值合并到一个属性中,并使用 | 运算符分隔每个值。例如,电影的 GENRES 数据可能是动作 | 冒险 | 惊悚片。

  • 避免为一列设置超过 1000 个可能的类别(除非该列包含仅用于筛选目的的数据)。

有关数据建议的完整列表以及如何使用 Amazon Personalize 识别问题的说明,请参阅分析数据集中数据的质量和数量

您是否收集可以改进建议的可选数据?

以下数据可以帮助提高建议相关性。

  • 事件类型(对所有域数据集组使用案例为必填项)

  • 事件值

  • 上下文元数据

  • 物品和用户元数据

  • 操作交互数据(仅由 PERSONALIZED_ACTIONS 配方使用)

有关 Amazon Personalize 可以使用的数据类型的更多信息,请参阅 Amazon Personalize 可以使用的数据类型

您是否有计划测试您的建议?

您可以使用 A/B 测试来比较不同用户组与来自不同模型的建议进行交互的结果。A/B 测试可以帮助您比较不同的建议策略,并查看建议是否有助于您实现业务目标。有关更多信息,请参阅 使用 A/B 测试衡量建议影响

您是否还有其他业务目标?

在一些情况下,除了为用户生成相关建议外,您可能还有其他目标。例如,您可能想要最大限度地提高收入,或者推广某个类别中某些类型的物品。以下 Amazon Personalize 特征可以提供帮助:

  • 推广:您可以使用推广来确保一定比例的物品满足您的业务需求。有关更多信息,请参阅 通过建议推广物品

  • 针对业务目标进行优化:对于某些自定义数据集组食谱,您可以针对自定义目标优化解决方案,例如最大限度地提高流式传输时长或增加收入。有关更多信息,请参阅 针对其他目标优化解决方案

  • 筛选建议。使用筛选器将业务规则应用于建议。您可以使用筛选器,在建议中包含或排除某些类型的物品。有关更多信息,请参阅 筛选建议和用户细分