苹果研究人员提出了一种新的张量分解模型,用于处理隐式反馈的协同过滤

苹果研究人员提出了新的张量分解模型,用于处理隐式反馈的协同过滤

从过去的行为中推断用户偏好的能力对于有效的个性化建议至关重要。许多产品没有星级评分使得这个任务变得更加具有挑战性。过去的行为通常以二进制形式解释,表示用户是否与某个对象进行过互动。基于这些二进制数据,必须做出额外的假设来从这种隐蔽的输入中推断用户的偏好。

合理假设是观众喜欢他们参与过的内容,并忽略那些没有引起他们注意的内容。然而,这种假设在实际使用中很少正确。消费者可能不参与某个产品,是因为他们根本不知道它的存在。因此,更合理的假设是用户只是忽略或不关心无法互动的方面。

研究表明,人们倾向于偏爱自己已经熟悉的产品而不是那些不熟悉的产品。这个想法为贝叶斯个性化排序(BPR)提供了基础,这是一种用于定制推荐的技术。在BPR中,数据被转化为一个三维二进制张量D,其中第一个维度表示用户。

苹果的一项新研究创建了一种不依赖于传递性的流行基本产品评级(BPR)模型的变体。为了泛化,他们提出了一种替代的张量分解方法。他们引入了一种称为Sliced Anti-symmetric Decomposition (SAD) 的新型基于隐式反馈的协同过滤模型。使用用户-项目交互的新颖三维张量视角,SAD在每个项目中添加了一个额外的潜在向量,而不像传统方法那样估计用户(用户向量)和项目(项目向量)的潜在表示。为了在评估相对偏好时产生项目之间的交互,这个新向量将常规点积推导出的偏好泛化到了通用内积。当该向量坍缩为1时,SAD成为一种最先进的协同过滤模型;在这项研究中,我们允许其值从数据中确定。允许新项目向量的值超过1的决策具有深远的影响。成对比较中存在的循环被解释为用户的心理模型不是线性的证据。

团队提出了一种快速的组坐标下降方法用于SAD参数估计。简单的随机梯度下降(SGD)用于快速获得准确的参数估计。使用模拟研究,他们首先展示了SGD的有效性和SAD的表达能力。然后,利用上述三种免费资源,他们将SAD与其他七种最先进的推荐模型进行对比。这项工作还表明,通过结合以前忽视的数据和实体之间的关系,更新后的模型提供了更可靠和准确的结果。

对于这项工作,研究人员将协同过滤称为隐式反馈。然而,SAD的应用不仅限于上述数据类型。例如,具有明确评级的数据集包含可以在模型拟合过程中立即使用的部分顺序,而不是在事后评估模型一致性的当前做法。