面向Non-IID图数据的推荐模型构建方法及系统

文档序号：37678330发布日期：2024-04-18 20:51阅读：10来源：国知局

本发明涉及人工智能，尤其涉及面向non-iid图数据的推荐模型构建方法及系统。

背景技术：

1、图神经网络(graph neural networks，gnn)在从图数据中提取信息和导出表达性节点的嵌入方面可以表现出优秀的性能，表达性节点嵌入有助于面向non-iid图数据的推荐模型构建和链接预测等下游任务。然而，如果需要得到一个经过良好训练的图神经网络需要大量的训练图数据，这些数据在实践中可能分布在多个数据所有者之间，且由于隐私问题，这些数据所有者(又名客户端)可能不愿意共享数据，因此导致了数据隔离的问题。

2、图神经网络的发展激发了近年来联邦图神经网络(fedgnns)领域的出现，且该领域近年来发展迅速。联邦学习的框架解决了图神经网络需要大量数据训练的问题，打破了客户端之间的数据壁垒，但是同时又存在联邦学习会遇到高度非独立同分布问题。例如，在图挖掘任务中常见的客户端之间存在统计异质性的情况下，全局模型可能无法很好地概括所有客户端的本地数据。因此，有必要将个性化集成到联邦图学习中，而不是针对单一的共识模型的训练。也就是说，客户端将根据自己的数据集调整全局模型，并训练个性化的本地模型。

3、现有的用于社交用户推荐的个性化联邦图神经网络面向non-iid图数据的推荐模型构建过程中，主要针对的是多个客户端、一个中央服务器的场景，利用本地客户端与其他客户端进行通信，或者通过第三方服务器增强本地数据，再通过本地数据训练本地图神经网络模型，再将本地模型参数上传到联邦学习服务器进行聚合，服务器再将聚合后的参数广播给所有客户端进行更新。进行多次迭代后，直到模型收敛。社交网络数据是一种私密性较高的数据，利用本地客户端与其他客户端进行通信，存在着本地客户端数据隐私泄露的风险，且本地客户端内私有数据处理以及外部数据利用，都依赖与客户端间的通信或是客户端与服务端间的通信，增加了数据通信复杂度，进而影响了后续推荐模型建立的效率。此外，在现有技术中，服务器端的参数聚合通常采用平均聚合的方式，没有考虑到每个本地客户端的个性化表达，使得本地客户端内的推荐模型的推荐精度较低。

技术实现思路

1、本发明提供一种面向non-iid图数据的推荐模型构建方法及系统，可以提高面向non-iid图数据的推荐模型构建的效率。

2、为实现上述目的，本发明提供的一种面向non-iid图数据的推荐模型构建方法，包括：

3、获取本地客户端的数据图，并利用预设的节点排序方法对所述数据图中的节点进行筛选，得到高中心性节点，所述数据图包括社交用户推荐网络图；

4、将所述高中心性节点在所述数据图中进行标注，得到节点标注数据图；

5、对所述数据图进行采样，得到数据子图，利用所述节点标注数据图中的高中心性节点在所述数据子图中进行节点强化，得到强化子图；

6、根据所述强化子图训练本地图神经网络模型，并将所述本地图神经网络模型的参数添加噪声参数后上传至中央服务器；

7、所述中央服务器利用预设的参数聚合公式聚合每个本地客户端的参数获得聚合参数，并将聚合参数分发至本地客户端。

8、可选地，所述利用预设的节点排序方法对所述数据图中的节点进行筛选，得到高中心性节点，包括：

9、计算所述数据图中所有节点的pagerank值；

10、根据所述pagerank值选取预设数量的节点，得到所述高中心性节点。

11、可选地，所述计算所述数据图中所有节点的pagerank值，包括：

12、采用下述公式计算所述数据图中所有节点的pagerank值：

13、

14、其中，pr(vi)为节点vi的pagerank值，pr(vj)为节点vj的pagerank值，in(vi)为指向第i个节点的节点集合，vj为指向第i个节点的节点集合中的第j个节点，out(vj)为从节点vj指出的节点集合，|out(vj)|为节点vj指出的节点集合的大小，d为系数。

15、可选地，所述对所述数据图进行采样，得到数据子图，包括：

16、对所述数据子图进行无偏随机采样，得到源节点集；

17、根据预设的采样步长，在所述源节点集中进行随机游走采样，并根据所述随机游走采样的节点权重进行节点选择；

18、对选择后的节点以及节点之间的边进行整合，得到所述数据子图。

19、可选地，所述利用所述节点标注数据图中的高中心性节点在所述数据子图中进行节点强化，得到强化子图，包括：

20、获取所述数据子图的节点集，并从所述节点集中查询高中心性节点；

21、对所述数据子图中的高中心性节点进行复制，得到复制节点；

22、将所述复制节点和所述复制节点的原高中心性节点的邻居节点进行连接，得到复制子图；

23、将所有所述数据子图中的高中心性节点的邻居节点和对应的高中心性节点的复制节点进行连接，得到复制子图集；

24、整合所述复制子图集得到所述强化子图。

25、可选地，所述根据所述强化子图训练本地图神经网络模型，包括：

26、利用预设的图神经网络获取所述强化子图中的任意节点的节点特征和该节点的邻居节点特征；

27、根据所述任意节点的节点特征和对应的邻居节点特征进行面向non-iid图数据的推荐模型构建，得到节点预测标签分布；

28、计算所述预测标签分布与真实标签分布的损失值，并根据所述损失值对所述预设的图神经网络进行参数更新，参数更新完成后得到本地图神经网络模型。

29、可选地，所述计算所述预测标签分布与真实标签分布的损失值，包括：

30、采用下述公式计算损失值：

31、

32、其中，为节点预测标签分布，y为节点真实标签分布，o为样本，c为类别，c为所有类别数量，yo,c为样本o对应的类别标签分布的one-hot值，为样本o对应的预测标签分布的one-hot值，为每个样本在所有类别上的损失值。

33、为了解决上述问题，本发明还提供一种面向non-iid图数据的推荐模型构建系统，所述系统包括：包括本地客户端和中央服务器；所述中央服务器和所述客户端通信，并基于所述的面向non-iid图数据的推荐模型构建方法在本地客户端中构建推荐模型。

34、可选地，所述中央服务器接收所述本地客户端中图神经网络模型的参数，并通过预设的参数聚合公式将所述参数进行聚合，得到聚合参数。

35、可选地，所述中央服务器将所述聚合参数分发至所述本地客户端后，所述本地客户端保存所述聚合参数至推荐模型。

36、本发明实施例利用预设的节点排序方法对所述数据图中的节点进行筛选，得到高中心性节点，可以实现数据图中重要性节点的明显区分，提高数据图中高中心性节点的表达性，其中，所述数据图为社交用户推荐网络图，数据图中的节点表示社交用户，另外，将所述高中心性节点在所述数据图中进行标注，通过高中心性节点对数据图进行划分，利用高中心性节点划分子图得到数据图代表性特征，实现本地客户端不需要与其他客户端通信即可得到高代表性特征的效果，再者，通过高中心性节点强化数据子图，可以增强数据子图的个性化表达，提高数据图中节点分类的准确率，为后续训练本地图神经网络模型提供更具有表达性的特征，最后，通过所述中央服务器利用预设的参数聚合公式聚合每个本地客户端的参数，并将所述参数分发至本地客户端，可以实现各客户端参数的表达性，本地客户端得到的参数可以保证数据的匿名性，从而保证外部无法获取该数据图的代表性特征的位置，保证本地客户端中数据图的安全性。本发明通过筛选高中心性节点，再通过高中心性节点强化数据子图，最后通过所述中央服务器利用预设的参数聚合公式聚合每个本地客户端的参数的整体流程，不仅可以通过高中心性节点保证每个客户端内数据图的个性化以及安全性，对用户社交信息隐私保护，此外，整体流程还可以提升本地客户端内模型建立的效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：付春雷,胡智杰,胡春强,蔡斌,夏晓峰,桑军
技术所有人：重庆大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。