一种自动提取元路径的异构信息网络推荐方法

文档序号:34587994发布日期:2023-06-28 15:50阅读:99来源:国知局
一种自动提取元路径的异构信息网络推荐方法

本发明涉及异构信息网络推荐领域,特别是涉及一种自动提取元路径的异构信息网络推荐方法。


背景技术:

1、随着互联网时代的快速发展,大量的信息不断涌现,极大地便利了用户的交流与信息选择。但这也同时带来了信息过载的问题,信息过载极大地影响了人们获取有用信息的效率。而推荐系统旨在挖掘用户潜在兴趣,为用户匹配最适合的信息,从而解决信息过载问题,并挖掘长尾需求、提升用户体验。经过几十年的发展,推荐系统已经成功应用于电子商务、多媒体等服务场景。

2、异构信息网络(heterogeneous information network,hin)是一种通用的融合多源数据的方法。基于异构信息网络的推荐系统在信息融合、探索结构语义等方面具有显著优势,不仅可以有效缓解数据稀疏与冷启动问题,而且有助于提升推荐系统的准确性和可解释性,因此取得了广泛的关注与应用。

3、现有的大多数基于异构信息网络的推荐方法都利用元路径从异构信息网络获得丰富的用户和物品辅助信息。例如pathsim及其变体hetesim是基于元路径的相似性测量方法。pathsim能够在网络中找到对等对象(例如,找到相似领域和具有相似声誉的作者),这在许多情况下比基于随机游走的相似性度量更有意义。因为元路径引入了更多的背景信息,并且设计的元路径满足对称性等良好属性。这些优点使得元路径能够整合更多的语义信息,但元路径需要手动设计。但这两种方法仍然是矩阵分解等后续工作的基石。受益于元路径的高可读性和不同元路径的不同权重的优势,基于元路径的方法还具有坚实的可解释性的优势。

4、尽管现在已经有了不少利用元路径的工作,也在一定程度提高了推荐性能,但到目前为止仍然存在几个尚待解决的挑战。首先,现有的大部分基于路径的方法都是先由专业人员手工设计元路径模式后再按照模式寻找路径实例。这样的方法严重依赖人工输入一系列任务相关的元路径,这对于没有专业知识用户来说是困难的。更重要的是,人工设计的元路径往往无法覆盖所有可能的路径实例,这极大地阻碍了推荐质量的提高。除此之外,现有的基于异构信息网络的推荐算法,都在尽可能多地使用多元信息进行推荐,但是很少在推荐算法中学习路径或元路径的显式表示,无法直观地表示推荐过程。此外,mcrec虽然学习了元路径的上下文显式表示,但其在生成元路径上下文嵌入时,没有考虑到用户对各路径实例的偏好。


技术实现思路

1、本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种自动提取元路径的异构信息网络推荐方法。

2、为了实现本发明的上述目的,本发明提供了一种自动提取元路径的异构信息网络推荐方法,包括以下步骤:

3、s1,自动提取元路径:首先挖掘实体之间具有不同语义的路径实例,充分利用hin中的实体关系。然后根据路径经过的实体类型对全部路径实例进行归类整理,从而获得自动挖掘出的元路径;

4、s2,将所述元路径输入层次注意力网络中,得到用户的项目推荐列表。

5、进一步地,包括从s1提取的元路径中选择突出的路径:

6、选取路径长度小于设定阈值的路径;每对实体间(只考虑用户和项目间)可能存在数条路径,它们长度不一、顺序不同,拥有不同的语义信息。在这些路径中,长度相对较短的路径足以建模实体关系,而较长的路径可能会引入远端邻居,模糊语义意义,从而引入大量噪声。

7、和/或按照优先级进行路径筛选,保留优先级高的路径。在对路径实例进行归类整理后,每种元路径下可能存在数条路径,它们可能质量高低不一,保留全部的路径会引入不必要的语义信息,随机选择路径可能会保留质量不高的路径。计算路径的优先级对其筛选可以有效降低噪声对推荐的影响。

8、进一步地,利用预训练模型为每个具有用户-项目交互记录的节点学习潜在向量,然后计算路径实例中相邻节点的余弦相似度,取平均值作为路径的优先级。这样的优先级得分直接反映了两个节点之间的关联程度。

9、进一步地,在计算路径实例中相邻节点的余弦相似度时,对于每条路径实例,只计算其中前几对节点的相似度,而不计算最后一对节点相似度。因为当前面的节点顺序确定后,后面的节点顺序也相应确定,即能认为在一条路径实例中,前面的节点起了决定性作用。

10、进一步地,所述层次注意力网络包括:节点聚合成层、路径实例注意力层、元路径注意力层和预测层,

11、节点聚合成层节点聚合成层由若干卷积神经网络组成,路径实例注意力层和元路径注意力层都使用一层全连接网络来实现注意力机制。

12、进一步地,所述s2包括:

13、s2-1,在节点聚合成层中得到路径实例的嵌入,元路径φ下的路径实例p的嵌入定义如下:

14、

15、其中表示路径实例p的嵌入矩阵;

16、conv1d表示卷积运算;

17、θ是conv1d中的所有相关参数;

18、s2-2,采用路径实例注意力层,自动学习不同路径实例的重要性:

19、元路径φ共有k个路径实例的嵌入,表示为通过一层全连接网络学习各路径实例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数

20、

21、表示元路径φ下的路径实例p的权重系数;

22、其中wp和wk分别是路径实例p的权重矩阵和路径实例k的权重矩阵;

23、表示元路径φ的路径实例p的嵌入;

24、bp和bk分别是路径实例p的偏置向量和路径实例k的偏置向量;

25、σ(w)是relu函数;

26、k为元路径φ下的路径实例数量;

27、因此,元路径φ的嵌入表示cφ通过其包含的路径实例与相应的系数进行聚合得到:

28、

29、s2-3,通过元路径注意力层,以交互中的用户-物品对的信息作为辅助信息,自动学习不同元路径的重要性,并相应地聚合s2-2的元路径的嵌入表示,学习基于上下文的元路径表示:

30、将用户嵌入、物品嵌入以及从路径实例注意力层获得的元路径φ的嵌入cφ为输入,使用一层全连接网络来变换语义特定的嵌入,每条元路径的重要性表示如下:

31、su,i,φ=σ(wu·eu+wi·ei+wφ·cφ+b)  (4)

32、su,i,φ表示元路径φ的重要性;

33、wu、wi、wφ分别为eu、ei、cφ的权重矩阵;

34、eu和ei分别为用户的低维嵌入和项目(物品)的低维嵌入;

35、cφ表示元路径φ的嵌入表示;

36、b为偏置向量;

37、σ()是relu函数;

38、然后通过使用softmax函数将上述所有元路径的重要性归一化而得到元路径的权重表示αu,i,φ:

39、

40、su,i,φ表示每个基于节点对(u,i)的元路径φ的重要性;

41、su,i,m表示每个基于节点对(u,i)的元路径m的重要性;

42、节点对(u,i)即就是用户物品对,u、i分别表示用户和物品;

43、m表示元路径集中的某元路径;

44、mu→i表示元路径集;

45、通过元路径的权重αu,i,φ能解释元路径对u和i之间相互作用的贡献。很明显,αu,i,φ越高,元路径就越重要。

46、将元路径的权重αu,i,φ作为系数,融合元路径φ的嵌入cφ,得到最终元路径上下文的嵌入,如下所示:

47、

48、其中cu→i表示基于元路径的上下文嵌入;

49、φ表示元路径φ;

50、cφ表示元路径φ的嵌入;

51、综上所述,元路径注意力层通过为每个元路径引入偏好向量来建立对元路径的个性化偏好模型,学习到的元路径上下文嵌入能够特定于交互,并捕获不同的交互上下文。

52、s2-4,通过预测层中的查找层将用户和项目的one-hot表示转换成低维密集向量,然后对用户、元路径上下文以及物品形成的三联体建模,得到三方交互的嵌入yu,i:

53、yu,i=(eu⊙et)⊙σ(cu→i)  (7)

54、其中,eu、ei和cu→i分别为用户的低维嵌入、项目的低维嵌入以及基于元路径的上下文嵌入;

55、⊙是一个成对的乘法算子(又称哈达玛德积算子);

56、σ(·)是sigmoid激活函数;

57、然后将三方交互的嵌入送入两层的多层感知机mlp中,以生成为用户u推荐物品i的概率:

58、

59、用户u推荐物品i的概率;

60、σ1(·)、σ2(·)是激活函数;

61、w1、w2是权重矩阵;

62、b1、b2是偏置向量;

63、yu,i交互的嵌入表示。

64、综上所述,由于采用了上述技术方案,本发明具有以下优点:

65、(1)通过设计的自动挖掘元路径的方法,从基于异构信息网络中的交互场景中自动挖掘出有意义的路径实例,路径实例能表示推荐过程和推荐原因。

66、(2)通过层次注意力网络学习元路径上下文表示,考虑了用户对各路径实例的偏好,然后将基于元路径的上下文纳入互动的三方交互建模的异构信息网络推荐模型,从而实现为用户匹配最适合的信息。

67、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1