因子分解机的工作原理

聚焦模式

因子分解机的工作原理 - 亚马逊 SageMaker AI

因子分解机模型的预测任务是估算从特征集 x_i 到目标域的函数 ŷ。该域对于回归是实际值，对于分类是二元值。因子分解机模型是有监督的，因此它具有可用的训练数据集 (x_i,y_j)。该模型呈现的优势是它使用因子分解的参数化方法来捕获两两特征交互。它可以用数学表示，如下所示：

该等式中的三个项分别对应于模型的三个分量：

w₀ 项表示全局偏置。
w_i 线性项对第 i 个变量的强度进行建模。
<v_i,v_j> 因子分解项对第 i 个和第 j 个变量之间的成对交互进行建模。

全局偏置项和线性项与线性模型中的相同。第三项将两两特征交互建模为每个特征所学习的相应因子的内积。所学因子也可视为每种特征的嵌入向量。例如，在分类任务中，如果一对特征往往更频繁地在积极标记样本中共同发生，则其因子的内积将较大。也就是说，其嵌入向量在余弦相似性方面彼此接近。有关因子分解机模型的更多信息，请参阅因子分解机。

对于回归任务，通过尽可能减小模型预测 ŷ_n 与目标值 y_n 之间的平方误差来训练模型。这称为平方损失：