模型训练最佳实践

您可以采取一些措施来提高 Neptune ML 模型的性能。

选择正确的节点属性

并非图形中的所有属性都可能有意义或与您的机器学习任务相关。在数据导出过程中，应排除任何不相关的属性。

以下是一些最佳实践：

《Amazon 机器学习开发人员指南》中的特征处理提供了与 Neptune ML 相关的其它特征处理指南。

异常值是指与其余数据明显不同的数据点。数据异常值可能会破坏或误导训练过程，从而导致训练时间延长或模型精度降低。除非异常值确实很重要，否则应在导出数据之前消除异常值。

存储在 Neptune 中的图形可能有重复的节点或边缘。这些冗余元素将为 ML 模型训练引入噪声。在导出数据之前，请消除重复的节点或边缘。

导出图形时，您可以更改处理特征的方式和构造图形的方式，以提高模型性能。

以下是一些最佳实践：

当边缘属性具有边缘类别的含义时，在某些情况下值得将其转换为边缘类型。
用于数值属性的默认规范化策略是 min-max，但在某些情况下，其它规范化策略效果更好。您可以预处理该属性并更改规范化策略，如model-HPO-configuration.json 文件的元素中所述。
导出过程会根据属性类型自动生成特征类型。例如，它将 String 属性视为类别特征，并将 Float 和 Int 属性视为数值特征。如果需要，可以在导出后修改特征类型（请参阅model-HPO-configuration.json 文件的元素）。

数据处理操作从图形中推理超参数配置范围。如果生成的模型超参数范围和默认值不很适用于您的图形数据，则可以编辑 HPO 配置文件以创建自己的超参数调整策略。

以下是一些最佳实践：

当图形变大时，默认的隐藏维度大小可能不足以包含所有信息。您可以更改 num-hidden 超参数来控制隐藏的维度大小。
对于知识图谱嵌入 (KGE) 模型，您可能需要根据图形结构和预算更改正在使用的特定模型。

TrainsE 模型难以处理一对多 (1-N)、多对一 (N-1) 和多对多 (N-N) 关系。DistMult 模型难以处理对称关系。RotatE 擅长对各种关系进行建模，但在训练期间比 TrainsE 和 DistMult 更昂贵。
在某些情况下，当节点标识和节点特征信息都很重要时，您应该使用 `concat-node-embed` 告诉 Neptune ML 模型，通过将节点的特征与其初始嵌入项串联来获得节点的初始表示形式。
当您在某些超参数上获得相当不错的性能时，您可以根据这些结果调整超参数搜索空间。

提前停止可以在不降低模型性能的情况下，显著减少模型训练的运行时间和关联成本。它还可以防止模型对训练数据进行过度拟合。

提前停止取决于对验证集性能的定期测量。最初，性能会随着训练进行而提高，但是当模型开始过度拟合时，它再次开始下降。提前停止特征可识别模型开始过度拟合的点并在该点停止模型训练。

Neptune ML 监控验证指标调用，并将最新的验证指标与上次 n 评估中验证指标的平均值进行比较，其中 n 是使用 window-for-early-stop 参数设置的数字。一旦验证指标比该平均值差，Neptune ML 就会停止模型训练并保存迄今为止最好的模型。

您可以使用以下参数控制提前停止：

Neptune ML 中的提前停止特征还可以使用 SageMaker HPO 热启动特征停止与其它训练任务相比性能不佳的训练。这也可以降低成本并提高 HPO 的质量。

有关其工作原理的描述，请参阅运行热启动超参数调整任务。

热启动提供了将从以前的训练工作中学习到的信息传递给后续训练任务的能力，并具有两个明显的好处：

此特征在 Neptune ML 中自动启用，允许您在模型训练时间和性能之间取得平衡。如果您对当前模型的性能感到满意，则可以使用该模型。否则，您会运行更多的 HPO，这些 HPO 使用先前运行的结果进行热启动，以便发现更好的模型。

AWS 提供专业支持服务，以帮助您解决在 Neptune 项目上进行机器学习时遇到的问题。如果您遇到困难，请联系 AWS Support。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

自定义超参数

模型转换