一种融合多空间特征的网络对齐模型及其应用

文档序号:30982375发布日期:2022-08-03 00:55阅读:411来源:国知局
一种融合多空间特征的网络对齐模型及其应用

1.本发明属于数据挖掘领域,是一种融合多空间特征进行网络对齐的方法。


背景技术:

2.随着在线社交平台的兴起,人们往往会同时加入多个社交网络,研究人员希望从更高的视角,利用多源网络挖掘更多的领域信息,此类需求催生出了网络对齐这一研究方向。随着相关研究的发展,网络对齐已经在许多应用中发挥着重要作用,例如跨社交网络推荐、蛋白质间的相互作用匹配以及模式识别等。
3.网络对齐旨在通过找到多个网络中的等价实体,将不同网络进行链接,给研究人员提供更高维度的数据分析视角。现有方法大多在欧氏空间中利用网络表示技术进行网络对齐,可以很好地捕捉较为规则的网络结构特征,但欧氏空间网络表示难以准确刻画真实世界中网络的层级结构特点,而新兴的双曲空间网络表示则较为擅长捕捉网络的层级结构特征。针对此类问题,我们利用多空间网络表示学习来获取欧氏空间和双曲空间的嵌入特征,更全面地对网络结构进行建模。同时利用特征融合促进跨空间信息交互,以更好的对节点身份进行表征,提升网络对齐中节点匹配的准确率。我们提出了一种跨越多个属性网络进行异常对齐的方法,解决了现有网络对齐方法无法准确捕捉网络层级结构以及低维空间对齐效果不理想等问题。


技术实现要素:

4.为克服现有技术的不足,本发明提出一种融合多空间特征的网络对齐方法。网络对齐旨在找到不同网络之间的对应关系,通过真实世界中同一实体在不同网络中的相应节点来对不同社交网络进行链接,从而给研究人员提供更高维度的数据分析视角。本发明主要目的是挖掘多个网络中对应现实世界相同实体的不同节点,利用网络表示学习得到的节点特征将其对应起来,从而链接多个网络。例如在多个社交网络中,通过本方法可以挖掘出部分网络中的匿名账号,从而帮助有关部门掌握不良分子的行为信息。
5.本发明采用如下技术方案予以实施:
6.一种融合多空间特征的网络对齐模型,所述模型通过网络中节点的锚链接预测判断其余节点是否为现实世界同一实体,所述模型通过如下步骤实现:
7.多空间表示学习:给定两个输入网络gs和g
t
,同时学习网络空间中的规则结构和层级结构特征,对原始网络在不同几何空间上进行卷积来获取网络中节点的邻居信息,得到每个节点的欧氏空间嵌入表示和双曲空间嵌入表示:
8.跨空间映射:由于两个网络gs和g
t
的嵌入表示是在不同潜在空间分别学习的,空间分布会有差异,将两个网络欧氏空间和双曲空间的嵌入分别映射至相同几何空间的潜在空间中;
9.跨空间融合:基于映射之后的网络嵌入,对每个网络的欧氏空间网络嵌入和双曲空间网络嵌入进行融合,以促进两个几何空间之间的信息交互,达到捕捉不同结构特征的
目的;
10.锚链接预测:为了完成网络对齐任务,采用一个多层感知机来预测任意一对来自gs和g
t
的节点对之间是否存在锚链接。
11.本发明还可以采用如下技术方案予以实施:
12.一种融合多空间特征的网络对齐模型应用,
13.将欧式空间网络和双曲空间网络嵌入已知网络的锚节点中进行多空间网络结构表示;
14.通过多空间网络结构表示的节点信息进行跨空间映射;即:
15.所述欧氏空间网络的映射函数通过如下约束得到:
[0016][0017]
其中:|
·
|f为两个网络嵌入表示之间的欧氏空间距离矩阵,γe为φe(
·
)的参数。
[0018]
所述双曲空间的映射函数通过如下约束得到:
[0019][0020]
其中:φh(
·
)为双曲空间映射函数,为双曲空间距离。
[0021]
通过如下公式对欧式空间网络嵌入结构表示和双曲空间网络嵌入结构表示进行跨空间融合;
[0022][0023][0024]
其中:h
t
,hs为双曲空间网络嵌入,zs,z
t
为欧氏空间网络嵌入。
[0025]
通过如下公式预测节点是否为锚链接:
[0026][0027]
其中:[
·
||
·
]表示嵌入的串联w和b为可训练参数,y是潜在锚链接集合。
[0028]
进一步,所述欧式空间网络嵌入过程:
[0029]
对已知每个网络可矩阵表示:邻接矩阵a和节点特征矩阵x,对节点特征矩阵x中的每一行xi表示节点的特征;对邻接矩阵a进行归一化:
[0030][0031]
其中:i为单位矩阵,d∈rn×n为对角度矩阵进行;
[0032]
对节点特征矩阵进行图卷积得到欧氏空间中的网络结构表示,
[0033][0034]
其中:为指定层的欧氏空间参数矩阵;σ(
·
)为一个非线性函数,例如:relu(
·
)=max(0,
·
);z
l
∈rn×d为第l层的节点嵌入矩阵,输入层z0=x;d为每一个节点嵌入的维度。
[0035]
进一步,所述双曲空间网络嵌入过程:
[0036]
通过如下公式将其映射到双曲空间,
[0037][0038]
其中:为向量v的模。
[0039]
对于给定的网络,一个(l+1)层gcn在双曲空间中生成节点嵌入矩阵所示:
[0040][0041]
其中:为双曲线性变换,agg(
·
)为双曲空间的邻域聚合操作,则为双曲非线性激活函数;
[0042]
双曲线性变换先用对数映射将双曲空间中的点映射到切线空间,在切线空间上做线性变换;再用指数映射将切线空间中的向量投影回双曲流形,具体公式如下:
[0043][0044]
其中:h为输入双曲空间网络嵌入。
[0045]
双曲邻域聚合通过将它们映射到原点的切线空间,使用连接和欧几里德多层感知器计算它们之间的权重,具体计算方式如下:
[0046][0047][0048]
有益效果:
[0049]
本发明提出的方法是一个适用于多种场景的网络对齐算法。本发明通过利用多种几何空间的几何特点,提取并融合网络中不同的结构特征,得到准确的网络节点表示,从而更好地进行网络对齐,解决了现有基于网络表示学习的网络对齐方法大多采用欧氏空间的网络表示嵌入,没有考虑到欧氏空间对于结构复杂的现实世界网络(特别是对于具有一定层级结构的网络)嵌入效果不好的问题。同时本发明可以应用于大量现实应用:例如在社交网络中,很多用户同时使用多个社交平台以享受更多样化的服务,网络对齐可以更好的对不同社交网络的用户进行链接,可以更好地实现跨领域推荐;在数据隐私方面,本发明可以帮助用户及时发现隐私泄露的现象,从而加强隐私防护;在网络安全方面,本发明可以使用网络对齐进行匿名账号身份识别,帮助有关部门掌握不良分子的账号行为。
[0050]
通过实践得知,本发明应用范围广泛,扩展性强,能够适用于不同场景,在多种类别的网络中进行网络对齐,从而进行信息挖掘。可以有效地帮助研究人员进行人员身份对齐,同时可以帮助追踪职业发展路径,对后续网络分析有着重要意义。
附图说明:
[0051]
附图1为本发明方法的模型结构图;
[0052]
附图2是分布映射的思路示意图;
[0053]
附图3在重名识别场景中的网络对齐示意图;
[0054]
附图4为网络对齐结果热力图。
具体实施方式
[0055]
本发明提出的融合多空间特征的网络对齐方法在网络表示学习过程中为每个网络同时传播欧氏空间和双曲空间中的邻居信息以获得节点表示,而后使用各自空间的方式对网络表示进行映射,进而进行网络对齐。
[0056]
如图1、图2、图3和图4所示,首先给出本发明涉及到的相关定义,给出一个网络为g=(v,e),其中v是图g中所有节点的集合;n=|v|为图g中的节点数量。e代表了图g中有关系的节点集合,也就是边集合。a为图g的邻接矩阵,当且仅当(vi,vj)∈e时a
ij
=1,否则a
ij
=0。若网络gs中的节点和网络g
t
中的在社会或现实世界为同一实体,则这两个节点为一对锚节点,则链接被称为锚链接。网络对齐的目的是在给定的两个网络中,通过已知的节点信息预测可能存在的锚节点对,也就是跨网络锚链接预测。
[0057]
融合多空间特征的网络对齐方法具体包含以下步骤:
[0058]
1)多空间表示学习:每个网络可以用两个矩阵表示:邻接矩阵a和节点特征矩阵x。不同的几何空间对不同数据的适配程度千差万别。例如欧氏空间较为平直,十分适合表示均匀规律的数据结构;而双曲空间随着曲率的变化,空间密度也会发生变化,越靠近边缘空间密度越高,适合表示树状结构或具有一定层次关系的数据。而现实世界中的网络数据往往同时包含多种结构特征,因此,本发明同时学习网络的欧氏空间嵌入表示和双曲空间嵌入表示来获取不同特征。为了得到欧氏空间和双曲空间中的网络结构表示,本文需要对输入特征矩阵在两个空间进行图卷积,它遵循以下前馈传递(函数定义见具体实施方案)。
[0059][0060][0061]
2)跨空间映射:由于节点的嵌入表示在嵌入过程中被映射到不同的潜在空间,在语义和空间上下文方面可能会有很大的差异。为了降低模型映射损失,本文对欧氏空间嵌入zs和z
t
使用欧氏空间映射,对双曲空间嵌入hs和h
t
使用双曲空间映射,将其分别映射至相同的潜在空间。我们使用如下公式来得到空间映射函数φ(
·
)(函数定义见具体实施方案)。
[0062][0063]
3)跨空间融合:在得到分布映射后的多空间嵌入表示zs、z
t
和hs、h
t
后,为了同时获取到欧氏空间和双曲空间嵌入网络结构表示的特点,本发明对不同几何空间的嵌入表示进行融合。由于双曲空间的嵌入表示并不能直接与欧氏空间的嵌入表示进行交互,需要将不同空间的嵌入表示进行几何空间映射,而欧氏空间映射至双曲空间会产生较大的信息损失,因此本发明采用将双曲空间嵌入表示利用对数映射操作映射至切线空间的方式进行空间融合。
[0064]
本发明通过如下方式分别融合了从欧氏空间和双曲空间中学习到的两个网络的
节点信息。
[0065][0066][0067]
4)锚链接预测:网络对齐的最终目的为预测一对节点是否为一个锚链接,因此本发明利用已知锚链接构造一个判别器,判别器通过多层感知机实现。其前馈传递如下。
[0068][0069]
在判别器中输入节点对的嵌入信息,就可以得到二分类概率,即该节点对是否为锚链接本发明通过不同空间的信息交互,提出了融合多空间特征的网络对齐方法gina。
[0070]
gina的整体框架如附图1所示,模型主要由四个部分组成:
[0071]
(a)首先是多空间表示学习,给定两个输入网络gs和g
t
,为了同时学习网络空间中的规则结构和层级结构特征,本方法对原始网络在不同几何空间上进行卷积来获取网络中节点的邻居信息,得到每个节点的欧氏空间嵌入表示和双曲空间嵌入表示。
[0072]
(b)由于两个网络gs和g
t
的嵌入表示是在不同潜在空间分别学习的,空间分布会有差异,因此,本发明实现了跨空间映射将两个网络欧氏空间和双曲空间的嵌入分别映射至相同几何空间的潜在空间中。
[0073]
(c)基于映射之后的网络嵌入,本方法对每个网络的欧氏空间网络嵌入和双曲空间网络嵌入进行融合,以促进两个几何空间之间的信息交互,达到捕捉不同结构特征的目的。
[0074]
(d)最后,为了完成网络对齐任务,本方法使用一个多层感知机来预测任意一对来自gs和g
t
的节点对之间是否存在锚链接。
[0075]
1)多空间表示学习
[0076]
欧氏空间网络嵌入:每个网络可以用两个矩阵表示:邻接矩阵a和节点特征矩阵x(如果节点没有特征,它可以是单位矩阵),x中的每一行xi表示节点的特征。首先对邻接矩阵a进行归一化:
[0077][0078]
其中i为单位矩阵,d∈rn×n为对角度矩阵。为了得到欧氏空间中的网络结构表示,本发明需要对输入特征矩阵进行图卷积,它遵循以下前馈传递:
[0079][0080]
其中:为指定层的欧氏空间参数矩阵;σ(
·
)为一个非线性函数,例如:relu(
·
)=max(0,
·
);z
l
∈rn×d为第l层的节点嵌入矩阵,输入层z0=x;d为每一个节点嵌入的维度。该前馈传递通过归一化后的邻接矩阵来使每个节点获取其邻居节点的信息,从而学习网络结构。
[0081]
双曲空间网络嵌入:本发明网络在双曲空间中的嵌入表示,欧氏空间中使用的基本操作(例如矩阵的加法、乘法和非线性变换)在双曲空间中不能保持相同的性质,所以无法在双曲空间中直接进行图卷积,本发明首先使用如下方式将其映射到双曲空间。
[0082][0083]
因此,对于给定的网络,一个(l+1)层gcn在双曲空间中生成节点嵌入矩阵的前馈传递如下所示:
[0084][0085]
其中:为双曲线性变换,agg(
·
)为双曲空间的邻域聚合操作,则为双曲非线性激活函数。
[0086]
双曲线性变换先用对数映射将双曲空间中的点映射到切空间,然后在切空间上做线性变换,再用指数映射将切空间中的向量投影回双曲流形,具体公式如下:
[0087][0088]
双曲邻域聚合通过将它们映射到原点的切线空间,使用连接和欧几里德多层感知器(mlp)计算它们之间的权重,具体计算方式如下:
[0089][0090][0091]
双曲非线性激活函数使用非线性激活来学习非线性变换,这在gcn中很重要,可以防止多层网络崩溃为单层网络,具体计算方式如下:
[0092][0093]
2)跨空间映射
[0094]
由于本发明分别学习了欧氏空间和双曲空间的网络嵌入表示,为了降低模型映射损失,本发明对欧氏空间嵌入zs和z
t
使用欧氏空间映射,本方法对双曲空间嵌入hs和h
t
使用双曲空间映射,将其分别映射至相同的潜在空间,单空间映射过程如附图2所示。
[0095]
其中:欧氏空间的映射函数通过如下约束得到:
[0096][0097]
而双曲空间的映射函数通过如下约束,利用双曲空间的距离函数得到:
[0098][0099]
3)跨空间融合
[0100]
为了同时获取到欧氏空间和双曲空间嵌入网络结构表示的特点,本发明对不同几何空间的嵌入表示进行融合。由于双曲空间的嵌入表示并不能直接与欧氏空间的嵌入表示进行交互,需要将不同空间的嵌入表示进行几何空间映射,而欧氏空间映射至双曲空间会产生较大的信息损失,因此,本发明采用将双曲空间嵌入表示利用对数映射操作映射至切线空间的方式进行空间融合。
[0101]
具体来说,本发明通过如下方式分别融合了从欧氏空间和双曲空间中学习到的网络结构信息
[0102][0103][0104]
本发明在其中添加了一个超参数,即融合空间系数λ来控制不同几何空间的构成重要程度。在特征融合之后,节点嵌入不仅通过交互学习整合不同空间的几何特征,而且会保持原始空间的属性和结构信息。
[0105]
4)锚链接预测
[0106]
网络对齐的最终目的为预测一对未知节点是否为一个锚链接,因此本发明利用已知锚链接构造一个判别器,判别器通过多层感知机实现。其前馈传递如下。
[0107][0108]
在判别器中输入节点对的嵌入信息,就可以得到二分类概率,即该节点对是否为锚链接。
[0109]
本方法的整体算法流程如下表所示。
[0110]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1