一种社交网络对齐方法

文档序号:31706504发布日期:2022-10-01 11:35阅读:67来源:国知局
一种社交网络对齐方法

1.本发明属于互联网技术领域,具体涉及一种社交网络对齐方法。


背景技术:

2.在互联网时代,用户在不同的网络服务平台中存在着各式各样的数据,这些数据具有很好的挖掘价值,但是在进行数据挖掘的同时也带来了许多严峻的挑战,例如各个平台之间数据不互通,导致挖掘不同平台之间的数据存在困难。因此将在多个不同的社交网络平台找出相同用户的问题定义为网络对齐,网路对齐可以将不同平台的用户联系起来,从而挖掘出具有丰富价值的数据。
3.基于网络这一结构化数据的特性,可以将用户看作节点,将用户之间的关系看作边,因此绝大多数社交网络对齐都是依据图卷积神经网络和图结构来进行学习和寻找两个不同网络中相同的节点,但是这些对齐方法都是显式或者隐式的,在对齐过程中假设使用的两个社交网络是不重叠的,然而现实中,原始的不同社交网络中不可避免地存在同一用户,因此现有技术在社交网络对齐时会由于这些同一用户产生的噪声,导致社交网络的对齐效果低。


技术实现要素:

4.为了解决上述在社交网络对齐时会由于不同社交网络中不可避免地存在同一用户而产生的噪声,导致网络对齐效果低,本发明提出一种社交网络对齐方法,具体包括以下步骤:
5.s1:采集不同社交平台的社交网络用户数据,并按照用户关系分别形成第一社交网络图和第二社交网络图;
6.s2:从第一社交网络图中和第二社交网络图中的已知相同用户中取一部分用户构成用户对,将用户对合并,形成第三社交网络图;
7.s3:计算出第三社交网络图的邻接矩阵,将第三社交网络图的邻接矩阵输入到编码器中得到所有用户的第一用户节点表示矩阵;
8.s4:将第一用户节点表示矩阵和邻接矩阵输入到去噪模型中,计算得出第三社交网络图的遮盖矩阵;
9.s5:根据遮盖矩阵中最大的k个值与第三社交网络图的邻接矩阵的乘积,计算得出第三社交网络图中所有用户的遮盖邻接矩阵;
10.s6:将遮盖邻接矩阵输入到所述编码器中得到所有用户的第二用户节点表示矩阵;
11.s7:根据所述第二用户节点表示矩阵,得出第三社交网络图中已知相同用户中另一部分用户之间的第一相似度,和第二用户节点表示矩阵与一部分用户构成的用户对集合之间的第二相似度;
12.s8:利用第一相似度和第二相似度的差值来更新去噪模型的学习参数;
13.s9:重复s4-s8,当所述差值小于设定阈值时,输出更新后的遮盖邻接矩阵,并根据遮盖邻接矩阵对第三社交网络图中的未知用户合并对齐。
14.本发明的至少具有以下有益效果:
15.本发明设计了一种社交网络对齐方法,此方法通过从第一社交网络图中和第二社交网络图中获取一部分已知相同用户,通过将已知相同用户中的一部分用户合并,形成第三社交网络图,计算出第三社交网络图的邻接矩阵,通过邻接矩阵获取第一节点表示矩阵,通过第一节点表示矩阵和邻接矩阵输入去噪模型得出遮盖矩阵,根据遮盖矩阵对邻接矩阵遮盖,得到遮盖邻接矩阵,根据遮盖邻接矩阵对第三社交网络图中的未知用户进行合并对齐(去噪)从而得到去噪后的第三社交网络图,同时本发明还根据遮盖邻接矩阵,计算出第二节点表示矩阵,通过计算第二节点表示矩阵中第三社交网络图中已知相同用户中另一部分用户之间的第一相似度,和第二用户节点表示矩阵与一部分用户构成的用户对集合之间的第二相似度的差值,更新去噪模型的学习参数,提高了模型的去噪效果,加快去噪时间。
附图说明
16.图1是本发明的方法流程图;
17.图2为本发明实施例的示意图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下,所获得的其他实施例,都属于本发明的保护范围。
19.本发明提出一种社交网络对齐方法,如图1和图2所示,具体包括以下步骤:
20.采集不同社交平台的社交网络用户数据,并按照用户关系分别形成第一社交网络图和第二社交网络图,其中,所述用户关系为用户之间的关注、好友、通讯等之一。
21.从第一社交网络图中和第二社交网络图中的已知相同用户中取一部分用户构成用户对,将用户对合并,形成第三社交网络图,其中所述已知相同用户为在对两个社交网络图进行对齐时根据社交网络用户数据获取的有限用户,相同用户可以表示为身份信息相同、id相同、年龄相同、生日相同中的一种。
22.进一步的,第三社交网络图的形成过程为:
[0023][0024]
其中,map表示映射函数,node表示第一社交网络图和第二社交网络图中的任意用户,otherwise表示第一社交网络图和第二社交网络图中不属于a中的用户,g
merage
表示第三社交网络图,a表示用户对。
[0025]
计算出第三社交网络图的邻接矩阵,将第三社交网络图的邻接矩阵输入到编码器中得到所有用户的第一用户节点表示矩阵,其中,所述编码器为,网络对齐编码器。
[0026]
优选地,计算出第三社交网络图的邻接矩阵,具体包括:
[0027][0028]
其中,ne(j)表示与第三社交网络图中用户j具有关系的用户集合,a
merage
表示第三社交网络图的邻接矩阵,i和j表示第三社交网络图中任意两个不同的用户。
[0029]
将第一用户节点表示矩阵和邻接矩阵输入到去噪模型中,计算得出第三社交网络图的遮盖矩阵,其中,图卷积神经网络模型和正则化模型。
[0030]
优选地,计算得出第三社交网络图的遮盖矩阵具体包括:
[0031]
将第一用户节点表示矩阵作为图卷积神经网络模型的节点原始特征,并将第三社交网络图的邻接矩阵作为图卷积神经网络模型的输入,计算得出第三社交网络图的节点特征:
[0032][0033]
其中,h
(l)
表示图卷积神经网络中第l层的节点特征,σ表示非线性激活函数,是的度矩阵,表示a
merage
波浪,a
merage
表示第三社交网络图的邻接矩阵,i为单位矩阵,当l=n-1时,h
(n)
表示第三社交网络图的节点特征,当l=0时,h
(0)
=x
merage
为节点原始特征,w表示图卷积神经网络中的学习参数,n表示图卷积神经网络的层数,其中,w表示图卷积神经网络中的学习参数,初始值为本领域技术人员随机设置,其中,w在图卷积神经网络中的每一层数值一样类似于一个常数。
[0034]
对第三社交网络图的节点特征用正则化模型进行正则化处理,对正则化处理后的节点特征进行解码得到第三社交网络图的遮盖矩阵:
[0035]
z=normalize(h
(n)
)
[0036]
mask=σ(z@z
t
)
[0037]
normalize表示正则化函数,z表示对第三社交网络图的节点特征进行正则化处理后的节点特征,z
t
表示z的转置,@表示矩阵乘法,mask表示第三社交网络图的遮盖矩阵,σ表示非线性激活函数。
[0038]
根据遮盖矩阵中最大的k个值与第三社交网络图的邻接矩阵的乘积,计算得出第三社交网络图中所有用户的遮盖邻接矩阵,例如,选择遮盖矩阵mask中最大的k个值构成topk(mask),并通过topk(mask)*a
merage
计算得出第三用户图网络结构g
merage
的遮盖邻接矩阵a
mask

[0039]
将遮盖邻接矩阵输入到所述编码器中得到所有用户的第二用户节点表示矩阵,其中所述编码器为网络对齐编码器。
[0040]
根据所述第二用户节点表示矩阵,得出第三社交网络图中已知相同用户中另一部分用户之间的第一相似度,和第二用户节点表示矩阵与一部分用户构成的用户对集合之间的第二相似度,优选地,从第二用户节点表示矩阵中选出已知相同用户中另一部分用户的节点表示,通过计算已知相同用户中另一部分用户之间的节点表示相似度得出第一相似度,从第二用户节点表示矩阵中选出用户对的节点表示,并组成用户对节点表示集合,通过计算用户对节点表示集合与第二用户节点表示矩阵的相似度,得出第二相似度,包括:
[0041][0042][0043][0044][0045][0046]
其中,node第一社交网络图中和第二社交网络图中的任意用户,y1和y2表示已知相同用户中另一部分用户中的任意两个用户,sim表示余弦相似度函数,表示已知相同用户中另一部分用户的节点表示集合,表示用户y1在第二节点表示矩阵x
mask
中的节点表示,表示用户y2在第二节点表示矩阵x
mask
中的节点表示,sim1表示和的第一相似度,表示所有用户对在第二用户节点表示矩阵x
mask
中的节点表示,sim2表示x
mask
与的第二相似度,表示第一相似度和第二相似度的差值,a表示用户对,b表示已知相同用户中另一部分用户。
[0047]
利用第一相似度和第二相似度的差值来更新去噪模型的学习参数。
[0048]
重复s4-s8,当所述差值小于设定阈值时,输出更新后的遮盖邻接矩阵,并根据遮盖邻接矩阵对第三社交网络图中的未知用户合并对齐。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1