一种项目邻居信息对比增强的推荐方法

文档序号：36266029发布日期：2023-12-06 10:16阅读：40来源：国知局

本发明涉及个性化推荐的，尤其是指一种项目邻居信息对比增强的推荐方法。

背景技术：

1、个性化推荐算法能够从海量信息中挖掘出用户感兴趣的内容，以满足用户的个性化偏好。早期推荐效果较好的基于协同过滤的推荐方法，通过用户和项目交互的数据进行建模，以预测用户的偏好，但此类方法通常面临用户-项目交互数据稀疏，以及新用户冷启动的问题。为此，通过引入其他辅助信息，如用户或项目属性、社交网络和知识图谱等，用来辅助提升推荐效果的方法日益得到关注。知识图谱作为推荐方法中一种有效的辅助信息，因其包含了大量具有语义关联的知识，通过建立实体与推荐中用户和项目的关联，以缓解数据稀疏和冷启动问题，在推荐方法中被广泛应用。

2、现有的基于知识图谱的推荐工作主要围绕如何将知识图谱异构信息有效地整合到用户和项目的潜在向量表示的方法研究，其大致可以分为基于路径的方法、基于嵌入的方法以及基于传播方法三类：基于路径的方法通过知识图谱中的关系构建元结构(如元路径、元图等)，计算不同路径下实体之间的语义相似度，进而挖掘图谱中用户与项目之间潜在关系来增强推荐。基于嵌入的方法使用知识图谱嵌入技术将kg中高维稀疏的实体和关系映射到一个低维稠密的向量空间，降低其计算复杂性，并通过实体和项目对齐，将低维的实体嵌入和关系嵌入集成到推荐框架中丰富用户和项目的特征，从而进行推荐。基于混合的方法采用嵌入传播机制，将kg的语义信息与kg中的路径相结合，通过传播和聚合操作以获取多跳邻居信息，进而丰富用户或项目的特征并做出推荐。总体来说，基于传播的方法将知识图谱的语义信息与kg中的路径相结合，综合了基于路径和基于嵌入方法的优点，并克服了这两类方法的局限性。因此，基于传播的方法成为基于知识图谱的推荐系统中主流选择。但现有的基于传播的方法大多数聚焦于传播和聚合机制的设计，很少关注知识图谱中存在知识噪声和监督信息弱的问题，使得推荐性能不佳。

技术实现思路

1、本发明的目的在于克服现有技术的缺点与不足，提出了一种项目邻居信息对比增强的推荐方法，能够减少知识噪声和增强监督信号，充分挖掘用户和项目的潜在特征，提升推荐效果。

2、为实现上述目的，本发明所提供的技术方案为：一种项目邻居信息对比增强的推荐方法，包括以下步骤：

3、s1：获取原始用户-项目交互数据，并对数据进行预处理得到统一格式的用户-项目交互数据；

4、s2：对预处理后的用户-项目交互数据进行实体对齐，建立用户、项目和知识图谱之间的关联；通过协同传播获取用户和项目的初始传播集，并采用知识传播获取用户和项目的邻居集；

5、s3：对用户和项目的邻居集使用知识感知注意力机制分配注意力权重，并根据注意力权重大小区分用户和项目的邻居特征对用户和项目的重要性；其中，所述知识感知注意力机制用于计算邻居集中知识即三元组的权重，实现细粒度的邻居信息编码，获得用户和项目的邻居特征；

6、s4：将经过知识感知注意力机制得到的项目的邻居特征作为原始视图，采用数据增强处理，获得增强的项目邻居特征作为增强视图；

7、s5：在增强视图和原始视图之间，采用对比学习计算两个视图间的共同特征，减少项目邻居特征中的噪声数量，并将增强视图和原始视图作为项目的邻居特征和增强的项目邻居特征输出；

8、s6：在项目的邻居特征、增强的项目邻居特征和用户邻居特征之间进行内积运算，预测用户点击每个项目的概率。

9、进一步，所述步骤s2包括以下步骤：

10、s21：对于输入的用户-项目交互数据，协同传播是从用户-项目交互数据中获取关键的协同信号，并显式编码为用户和项目的表示；根据用户-项目交互数据能反映用户的部分偏好，用户的表示通过相关项目体现；用户u的初始实体集定义如下式：

11、

12、式中，a为项目-实体对齐集，yuv＝1表示用户与项目交互的数据，v为项目，e为实体；

13、考虑到一个项目能够被多个用户交互的场景，采用“项目-用户-项目”传播策略，将用户-项目交互数据包含在项目的初始实体集中，以丰富项目的表示；因此，项目v的初始实体集定义如下式：

14、

15、式中，表示相同用户的不同项目之间的关联，将用户-项目的协同信号显式地包含在项目-项目视图中；

16、s22：将用户u的初始实体集和项目v的初始实体集作为知识传播的种子，沿着知识图谱中的关系传播，以获得关联的实体，构建用户u和项目v的多跳实体集；对于第l阶的用户和项目在知识图谱传播生成的关联实体定义如下：

17、

18、式中，o为用户u或者项目v的统一占位符，g代表知识图谱，(h,r,t)为知识图谱中的三元组，h为头实体，r为关系，t为尾实体，l为传播的跳数，取值范围在1-l之间，表达以为头实体寻找知识图谱中关联的尾实体t作为第l阶的头实体；

19、s23：将知识传播生成的关联实体作为头实体集，获取各三元组作为用户和项目的邻居集；对于第l阶用户或项目的邻居集定义头实体集为查找知识图谱中三元组中对应的关系和尾实体，以形成用户和项目邻居集，第l阶邻居集定义如下：

20、

21、式中，表达以实体集为头实体构成的三元组集；

22、s24：将步骤s22和s23进行l次，得到各邻居集其中代表第l跳用户或项目的三元组集，为挖掘知识图谱中结构信息和语义信息，增强用户和项目的特征表示提供了材料。

23、进一步，所述步骤s3包括以下步骤：

24、s31：对于输入邻居集在知识感知注意力机制中，计算邻居集中每个三元组注意力权重来揭示不同的三元组表达含义的差异性，以有效编码邻居中各知识即三元组；考虑中第m个三元组知识感知注意力嵌入βm的公式如下：

25、βm＝αmtm

26、αm＝σ(w2leakrelu(w1(leakrelu(w0(hm||rm||tm)+b0))+b1)+b2)

27、式中，αm为知识感知注意力函数，用于学习邻居中各三元组的重要性；leakrelu为非线性激活函数，防止梯度消失；σ为激活函数sigmoid，‖是拼接操作；w0、w1、w2为网络参数，随反向传播而更新，b0、b1、b2为偏差，hm为第m个三元组的头实体，rm为第m个三元组的关系，tm为第m个三元组的尾实体；

28、s32：对于邻居中的每个三元组依次采用知识感知注意力机制，得到知识感知注意力嵌入其中代表邻居包含的三元组的数量；将邻居的知识感知注意力嵌入进行累加，得到邻居的嵌入表示如下式:

29、

30、式中，m表示当前为第m个三元组，∑为求和操作；对于邻居集进行l次知识感知注意力机制运算，得到知识感知注意力嵌入其中代表第l次用户或项目的知识感知注意力嵌入。

31、进一步，所述步骤s4包括以下步骤：

32、s41：对于输入的项目邻居的嵌入进行项目邻居数据增强，引入服从均匀分布的噪声，模拟项目特征的均匀性；对于第l跳项目邻居嵌入其项目邻居增强的嵌入的公式如下：

33、

34、式中，δs为添加的噪声向量，且||δs||＝ε是一个小常数；

35、s42：为了限制δs在数值上等同半径为ε的超球面上的点，δs的公式如下：

36、

37、式中，x为服从0-1均匀发布的数据，sign为符号函数，rd代表x的维度为d；

38、s43：将步骤s41和s42经过l次迭代传播，得到增强的项目邻居特征集其中代表第l个增强的项目邻居特征。

39、进一步，在步骤s5中，将增强的项目邻居特征集和项目邻居的嵌入集视为两个视图进行对比学习；将相同阶的项目邻居嵌入视为正对，即和反之视为负对；其中，对比损失函数linfonce的公式如下：

40、

41、式中，τ是温度参数，调控样本的均匀分布；通过对比损失函数引入额外的监督信息，能够鼓励项目邻居嵌入均匀分布在潜在空间中，以便预测时更好区分其差异性。

42、进一步，所述步骤s6包括以下步骤：

43、s61：经过知识感知注意力机制编码的邻居嵌入集为而用户和项目用户和项目的初始实体集包含协同信息，其用户和项目协同嵌入表示：

44、

45、

46、式中，embedding为嵌入函数，为用户的协同嵌入，为项目的协同嵌入；

47、通过拼接各邻居嵌入和协同嵌入以获得用户和项目的嵌入eo，表示如下：

48、

49、式中，o为统一占位符，表示用户u和项目v的特征，为用户或项目的协同嵌入；此外，考虑到项目邻居增强是添加弱噪声来增强项目的邻居嵌入，将增强项目的邻居嵌入集直接用于推荐任务；最终的项目表示如下式：

50、

51、

52、式中，ev代表项目的嵌入拼接表示，e′v为增强项目的嵌入拼接表示，表示增强的项目协同嵌入，+代表相加操作；

53、s62：根据最终的用户表示eu和项目表示用户偏好函数y(u,v)定义为：

54、

55、式中，t代表转置操作；

56、s63：为了将推荐任务和对比学习结合，采用多任务训练策略，将推荐任务和对比学习放在一起进行训练，优化可学习参数；。对于知识感知的推荐任务，采用bpr损失函数，如下式：

57、

58、式中，lbpr为bpr损失函数，为正样本的预测值，为负样本的预测值，u表示用户，i表示正样本，j为负样本，o′＝{(u,i,j)|(u,i)∈o+,(u,j)∈o-}是可训练的数据集，用户-项目有交互记为o+，用户-项目无交互记为o-，并设置o+与o-数据比例为1:1，σ为是sigmoid函数；

59、s64：采用多任务学习策略将bpr损失函数lbpr和对比损失函数linfonce结合，最终的损失函数l如下式：

60、

61、式中，θ为参数集，λ1和λ2为参数，是以λ2为参数的l2范式。

62、本发明与现有技术相比，具有如下优点与有益效果：

63、1、本发明设计了一种知识感知注意力机制，可以有效捕获邻居中关键三元组信息。

64、2、本发明设计项目邻居增强方法，降低了项目邻居的知识噪声。并不需要重新构建新视图，降低了时间复杂度。

65、3、本发明利用对比学习进行项目视图间的互相学习，缓解交互信号稀疏的问题。

66、总之，本发明能通过使用对比学习和注意力机制来提升获取特征的质量，缓解用户-项目交互数据稀疏，增强监督信号。结合知识图谱和用户-项目交互信息，充分挖掘用户和项目潜在特征，通过有目的增强项目邻居，对比项目邻居间的信息，减少知识图谱中的知识冗余，以有效地增强项目特征。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王海荣周北京
技术所有人：北方民族大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。