一种基于特征迁移的社交网络嵌入方法

文档序号:34179291发布日期:2023-05-17 07:56阅读:60来源:国知局
一种基于特征迁移的社交网络嵌入方法

本发明涉及动态社交网络嵌入,尤其涉及一种基于特征迁移的社交网络嵌入方法。


背景技术:

1、网络数据在现实世界中普遍存在,图结构是复杂网络中常用的信息载体,它建模实体之间的双向交互,将图中的节点映射到低维空间中同时保留节点间的关系是图嵌入研究的主要任务。当前大多数的图嵌入方法都是面向静态网络的,即网络中节点和边的是固定不变的,然而静态网络不能描述网络的动态变化。针对静态网络的研究忽略了网络的拓扑结构以及网络中的属性信息是随着时间不断变化的。因此,动态网络图嵌入的研究更符合网络随时间变化的规律,而且动态网络中利用节点和边的变化设计图嵌入更符合实际,例如:社交网络中新朋友关系的产生会导致网络中出现新的连边;引文网络中新论文的加入会使得网络中出现新的节点和连边等。近几年,由于社交网站和应用程序的流行,社交网络结构的分析受到了相当大的关注,对社交网络进行网络嵌入表示进行研究具有较高的实用性。

2、社交网络嵌入研究除了上述实际应用价值外,也推动了复杂网络领域中其它研究的发展,比如:节点聚类、多标签分类问题等下游任务,网络中表征相似的节点会分布在同一个二维空间中,形成不同的社团划分,社团划分时节点的丰富特征就起到非常关键的作用。社交网络随着时间的变化不断进行训练,能够学到更多隐藏信息,使得节点特征更贴近实际,也使得节点聚类、社团发现结果更加精确;针对链路预测问题,社交网络图嵌入训练时能够挖掘网络拓扑结构和属性随时间变化的隐藏信息,使得链路预测的准确性提升。社交网络图嵌入的研究对网络中的评价指标研究也起到了推动作用,包括模块度、轮廓系数等等。目前,对于社交网络的表示学习,通常是将其处理为图快照的形式,分别计算每个图快照上的嵌入表示,然后将所有快照上的嵌入对齐并映射到相同的向量空间中。这一方法得到的节点表征不能保证嵌入的稳定性,使得习得的节点嵌入在下游任务上表现不佳。因此,可以设计一种图快照之间特征迁移的策略用于得到面向图快照的社交网络的嵌入表示。

3、对于社交网络嵌入的研究根据其是否能处理节点新增和删除分为直推式社交网络嵌入和归纳式社交网络嵌入。其中,直推式社交网络嵌入方法仅能处理节点固定、边随时间动态变化的情况,这就极大地限制了其适用的场景,具有较大的局限性。其次,当前大多数社交网络图嵌入模型结合了递归神经网络记忆时间属性信息,模型的叠加增加了大型动态社交网络数据训练的复杂度,使得模型对硬件要求较高,难以泛化推广。此外,以图快照为研究基础的社交网络图嵌入模型忽略了训练过程中嵌入的稳定性以及网络变化过程中节点邻居间的相互作用,这使得模型习得的嵌入其表达能力不够强大,在下游任务中应用效果不佳。


技术实现思路

1、本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于特征迁移的社交网络嵌入方法,借鉴迁移学习的思想在特征更新时考虑到了节点的邻居结构之间的相似性,所以在继承前一时刻的嵌入表示的同时能够保持网络的结构特征,从而稳定的学习社交网络中信息的演化过程,得到更加丰富的节点表示。

2、为解决上述技术问题,本发明所采取的技术方案是:一种基于特征迁移的社交网络嵌入方法,首先对社交网络等间隔取快照,从而得到离散的图快照序列,然后使用图卷积神经网络对快照进行表示;针对动态社交网络演化过程中的节点、连边可能出现的不同情况,制定不同的迁移策略以及图快照之间特征迁移的迁移权重;计算节点在不同情形下对应的节点表征;该方法具体包括以下步骤:

3、步骤1:对动态社交网络等间隔取快照,得到不同切片步长下的图快照序列;

4、步骤1.1:读取动态社交网络数据集;

5、步骤1.2:使用切片步长ts对动态社交网络数据集进行等时间间隔的切片处理,得到处理后的离散图快照序列dg={g1,g2,…,gn};

6、步骤2:在得到图快照序列之后,使用图卷积神经网络学习图快照gt的信息,1≤t≤n,得到在图快照gt上节点i的节点表征hti,并将节点表征存储起来;

7、步骤2.1:读取图快照gt信息,1≤t≤n,统计得到该图快照对应的邻接矩阵at;

8、步骤2.2:将步骤2.1得到的邻接矩阵at加上图快照gt的自连接矩阵it,得到图卷积神经网络的最终输入bt,具体的计算方式如公式(1)所示:

9、bt=at+it      (1)

10、其中,自连接矩阵it为主对角线全1,其余位置全0的方阵;

11、步骤2.3:将得到的bt作为输入数据,输入到两层的图卷积神经网络进行卷积,得到该图快照上节点i的节点表征hti,i∈[0,n-1],n为图快照gt上的节点个数,进而得到图快照gt对应的节点表征矩阵ht;

12、步骤3、根据t时刻和t+1时刻的图快照得到的其对应的邻接矩阵at和at+1,统计出各个图快照上各节点的邻居节点数量;

13、步骤3.1:根据t时刻的图快照gt得到该时刻对应的邻接矩阵at,统计出节点i在t时刻的邻居节点数量wt;

14、步骤3.2:根据t+1时刻的图快照gt+1得到该时刻对应的邻接矩阵at+1,统计出节点i在t+1时刻的邻居节点数量wt+1;

15、步骤4:针对动态社交网络演化过程中的节点、连边可能出现的不同情况,制定不同的迁移策略以及图快照之间特征迁移的迁移权重,具体为:

16、ⅰ、当节点新增时,新增节点的初始特征更新为其邻居节点特征的即节点新增时的迁移权重

17、ⅱ、当边新增时,两个节点间新增了连边,那么这两个节点的初始特征就更新为两个节点特征和的即边新增时的迁移权重

18、ⅲ、当节点消失时,若节点i的邻居节点j消失,那么节点i的初始特征就更新为原来特征的即节点消失时的迁移权重

19、ⅳ、当边消失时,若节点i、j之间的连边消失,那么节点i、j的初始特征更新为原来特征的即连边消失时的迁移权重

20、ⅴ、当节点、连边均无变化时,若节点i在t+1时刻的图快照与t时刻图快照中的一阶邻居没有发生变化,则节点i的初始特征保持t时刻的特征,即节点与连边无变化时的迁移权重w=1;

21、步骤5:在得到图快照之间特征迁移的迁移权重之后,针对动态社交网络演化过程中的节点、连边可能出现的不同情况,计算节点在不同情形下对应的节点表征;

22、(1)当节点新增时,新增节点j的初始特征更新为其邻居节点i的特征的具体的节点新增时的节点表征表示如公式(2)所示:

23、htj=w·hti+b       (2)

24、其中,表示节点新增时的迁移权重,hti为t时刻节点i的节点表征,htj为t时刻新增节点j的节点表征,b为偏移量;

25、(2)当边新增时,即节点i、j之间新增了连边,那么这两个节点的初始特征就更新为两个节点特征和的即边新增时的节点表征表示如公式(3)所示:

26、htj=w·(hti+hij)+b       (3)

27、其中,表示边新增时的迁移权重,hti为t时刻节点i的节点表征,htj为t时刻节点j的节点表征,b为偏移量;

28、(3)当节点消失时,若节点i的邻居节点j消失,那么节点i的初始特征就更新为原来特征的即节点消失时的节点表征表示如公式(4)所示:

29、htj=w·hti+b       (4)

30、其中,表示节点消失时的迁移权重,hti为t时刻节点i的节点表征,htj为t时刻节点j的节点表征,b为偏移量;

31、(4)当边消失时,若节点i、j之间的连边消失,那么节点i、j的初始特征更新为原来特征的即连边消失时的节点表征如公式(5)所示:

32、htj=w·hti+b        (5)

33、其中,表示边消失时的迁移权重,hti为t时刻节点i的节点表征,htj为t时刻节点j的节点表征,b为偏移量;

34、(5)当节点、连边均无变化时,若节点i在t+1时刻的图快照与t时刻图快照中的一阶邻居没有发生变化,则节点i的初始特征保持t时刻的特征,即节点与连边无变化时的节点表征如公式(6)所示;

35、htj=w·hti+b         (6)

36、其中,w=1表示节点、连边无变化时的迁移权重,hti为t时刻节点i的节点表征,htj为t时刻节点j的节点表征,b为偏移量;

37、步骤6:重复执行步骤2-5直至得到最后一个图快照序列gn上的节点嵌入表示,然后将最后一个图快照序列上的节点嵌入表示作为计算得到的社交网络最终节点嵌入。

38、采用上述技术方案所产生的有益效果在于:本发明提供的一种基于特征迁移的社交网络嵌入方法,该方法是一种归纳式的方法,其能够处理社交网络中节点新增和删除的情况,这极大的增加了该方法的适用场景。其次,该方法引入迁移学习的思想,使得方法的时间复杂度较低,对模型训练的硬件要求有所降低,便于泛化推广。

39、该方法在学习节点嵌入的过程中考虑了邻居结构之间的相似性,前一时刻图快照的节点表征作为下一时刻的图快照的节点表征,使得模型能够稳定的学习社交网络中的网络演化信息,这使得习得的节点表征更加稳定,并且学习节点嵌入的过程中所耗费的时间复杂度较低,且对硬件要求不高。此外,通过相关下游实验验证,本发明方法在节点聚类和社团分类上实验效果优于现有算法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1