一种基于知识图谱的有限敏感属性信息的公平性推荐方法与流程

文档序号：36349225发布日期：2023-12-14 00:53阅读：36来源：国知局

本发明涉及推荐算法应用，更具体地说，本发明涉及一种基于知识图谱的有限敏感属性信息的公平性推荐方法。

背景技术：

1、随着大数据时代的来临，人们进入了信息爆炸的时代，如何在海量数据中为人们提供符合其需求的产品变得尤为重要，为解决这一问题，推荐系统应运而生。推荐系统能够根据人们的历史交互记录，生成其感兴趣的物品，推荐系统涉及到众多领域，例如网络购物，电影推荐，新闻等，极大的便利了人们的生活。然而，推荐数据十分稀疏，用户真正交互的项目，在总体项目中占比非常稀少，严重制约了推荐系统的性能。为了缓解这一问题，知识图谱被引入到推荐系统中，知识图谱存储着大量真实世界的知识，其表示形式为异构图，图中的节点表示实体，图中的边，表示实体之间的关系。通过将知识图谱与用户项目交互图进行合并，可以提取到用户和项目之间更加丰富的语义，从而对推荐系统建模用户和项目信息进行补充，获得更有效的用户和项目表示。

2、近期，推荐系统的公平性问题也引起了人们的关注，随着推荐系统的进一步发展，人们不仅需要推荐系统提供准确的推荐结果，也希望推荐系统能够提供公平的推荐结果，即用户不希望推荐系统受到自身敏感属性的影响，例如年龄、性别、职业因素，这对于提升用户的使用体验十分重要。传统的推荐系统往往忽略了公平性的因素，根据推荐结果可以很容易的推断出用户的敏感属性，因此如何有效去除用户的敏感属性是目前亟待解决的问题。同时，用户敏感属性的去除依赖训练数据需要有大量的敏感属性标签，然而在真实场景中，能够提供敏感属性的用户群体往往很少，少量的敏感属性标签也严重制约了公平性算法的性能，因此如何能够在敏感属性标签有限的条件下提供公平的推荐结果同样十分重要。

3、为了解决上述问题，现提供一种技术方案。

技术实现思路

1、为了克服现有技术的上述缺陷，本发明提供一种基于知识图谱的有限敏感属性信息的公平性推荐方法，通过构建用户项目知识图谱丰富推荐数据，解决推荐数据稀疏性的技术问题，随后引入图神经网络来建模更有效的用户表示，之后通过用户敏感属性估计网络，生成用户敏感属性标签，解决敏感属性有限的技术问题，最后通过用户敏感属性过滤网络生成公平的用户表示，解决用户敏感属性去除技术问题，从而实现公平性推荐，有效地提升了推荐系统的公平性，通过用户敏感属性估计网络能够为每个用户生成敏感属性标签，从而缓解敏感属性信息有限的问题，最后通过用户敏感属性过滤网络保证去除用户敏感属性，提供公平的推荐结果，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明提供如下技术方案：

3、一种基于知识图谱的有限敏感属性信息的公平性推荐方法，包括如下步骤：

4、步骤一，构建用户项目二部图：根据用户的历史交互项目序列，生成用户项目二部图，用户项目二部图中的节点为用户或者项目，用户项目二部图中的边为交互行为；

5、步骤二，构建知识图谱：根据项目的属性信息构建知识图谱，知识图谱中的节点表示项目和属性值，知识图谱中的边表示项目和属性之间的关系；

6、步骤三，构建用户项目知识图谱：依据用户项目二部图和知识图谱中的共同的项目节点，将用户项目二部图和知识图谱进行合并，生成用户项目知识图谱；

7、步骤四，建模用户表示：将用户项目知识图谱输入至图神经网络，通过消息传播函数逐层传播，生成用户表示；

8、步骤五，估计用户敏感属性：通过设计敏感属性估计网络，为所有用户估计其对应的敏感属性；

9、步骤六，过滤用户敏感属性：设计过滤网络，通过对抗训练过滤用户敏感属性，得到公平的用户表示；

10、步骤七，计算最终损失函数：最终的损失函数通过将传统推荐任务对应的推荐损失函数、敏感属性估计网络对应的损失函数以及过滤网络对应的损失函数进行加和获得；

11、步骤八，检查循环次数是否达到预设次数：当达到设定的训练次数时，结束训练，并提供用户公平的推荐结果；当未达到设定的训练次数时，则返回步骤四。

12、作为本发明进一步的方案，步骤四建模用户表示，将用户项目知识图谱输入到图神经网络中，通过消息传播函数逐层传播，生成用户表示，通过将用户项目知识图谱g作为图神经网络的输入，并利用注意力机制强化图神经网络的信息传递过程，用户节点的表示为：用户项目知识图谱中目标节点为h，h节点的邻居表示计算公式为：

13、

14、nh＝{(h,r,t)|(h,r,t)∈g}；

15、

16、

17、式中：eu为用户节点的表示，σ为激活函数，w1为可学习的权重矩阵，h为用户项目知识图谱中目标节点，为节点h的邻居表示，α(h,r,t)为注意力值，(h,r,t)为知识图谱中的边，nh为以h为头节点的三元组，r为节点h的一邻居，t为节点h的另一邻居，为第l层节点h的更新表示，为第l-1层节点h的更新表示，为第l-1层以h为头节点的三元组的更新表示。

18、作为本发明进一步的方案，注意力值的计算公式为：

19、α(h,r,t)＝σ(w1et·(w1eh+er))；

20、

21、式中：σ为激活函数，w1为可学习的权重矩阵，et为节点t的表示，eh为节点h的表示，er为节点r的表示。

22、作为本发明进一步的方案，步骤五估计用户敏感属性，通过设计敏感属性估计网络，为所有用户估计其对应的敏感属性，利用获得的用户表示估计每个用户的敏感属性标签，敏感属性标签的计算公式为：

23、

24、式中：为用户的敏感属性标签，w1为可学习的权重矩阵；

25、将节点嵌入用户的敏感属性标签，再通过softmax函数得到最终敏感属性的估计表示：

26、

27、式中：为最终敏感属性的估计表示。

28、作为本发明进一步的方案，步骤六过滤用户敏感属性，设计过滤网络，通过对抗训练过滤用户敏感属性，得到公平的用户表示，过滤敏感属性过滤网络表示为：

29、

30、式中：mu为过滤敏感属性过滤网络表示，q为敏感属性的总数，w1为可学习的权重矩阵，并与敏感属性一一对应。

31、作为本发明进一步的方案，步骤七计算最终损失函数，最终的损失函数通过将传统推荐任务对应的推荐损失函数、敏感属性估计网络对应的损失函数以及过滤网络对应的损失函数进行加和获得，具体步骤为：

32、步骤w1，根据去除敏感属性的用户嵌入来计算用户对于不同项目的偏好程度，用户对于不同项目的偏好程度的计算公式为：

33、yui＝mutei；

34、式中：yui为用户i对于不同项目的偏好程度，mut为过滤敏感属性过滤网络表示的转置；

35、步骤w2，计算传统推荐任务对应的推荐损失函数其物理意义为用户交互过的项目应比其未交互的项目取得更高的打分，推荐损失函数的计算公式为：

36、

37、式中：为推荐损失函数，g+为观测到的用户项目交互，g-为未观测到的用户项目交互，yuj为用户j对于不同项目的偏好程度；

38、步骤w3，计算用户敏感属性估计网络损失函数其物理意义为半监督分类，即利用部分用户敏感属性标签来预测全体用户敏感属性标签，用户敏感属性估计网络损失函数的计算公式为：

39、

40、式中：为用户敏感属性估计网络损失函数，s为全体敏感属性，u+为有敏感属性的用户集合，su为敏感属性对应的标签；

41、步骤w4，计算用户敏感属性过滤网络损失函数利用对抗训练的方法训练一组判别网络，最小化用户预测敏感属性的概率，从而使得用户与敏感属性无关，达到去除用户敏感属性的目标，用户敏感属性过滤网络损失函数的计算公式如下：

42、

43、式中：为用户敏感属性过滤网络损失函数，f为交叉熵损失函数；

44、步骤w5，最终的整体损失函数计算公式为：

45、

46、式中：为最终的损失函数，λ2以及λ3为衰减系数。

47、本发明一种基于知识图谱的有限敏感属性信息的公平性推荐方法的技术效果和优点：

48、1、本发明通过提出一种基于知识图谱的有限敏感属性信息的公平性推荐方法，能够有效地提升推荐系统公平性；

49、2、本发明通过使用基于注意力机制的图神经网络，能够从用户项目知识图谱建模更有效地用户表示，通过用户敏感属性估计网络能够为每个用户生成敏感属性标签，从而缓解敏感属性信息有限的问题，最后通过用户敏感属性过滤网络保证去除用户敏感属性，提供了公平的推荐结果；

50、3、本发明通过适当改进能够拓展到多种推荐任务中，在推荐领域具有一定的应用前景。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李其明张钊庄福振徐勇军
技术所有人：中科（厦门）数据智能研究院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。