本发明属于深度学习安全技术领域,具体涉及一种基于图卷积网络梯度的节点信息隐藏方法。
背景技术:
随着科学技术的快速发展,人们使用互联网进行浏览、购物等行为日渐平凡。而在人工智能时代,大众的行为习惯会作为重要的信息来源,在经过深度信息处理之后能够提取出群众的各种隐藏信息。一方面,提取的隐藏信息能够为学术领域提供更加丰富细致的材料,推动学术的发展;另一方面,提取的隐藏信息能够提高商店等服务型对象对群众的服务效果。
但是随着信息挖掘的深入,许多学者发现信息安全也是一个非常重要的问题,过度的采集和挖掘用户信息会造成用户信息泄露问题,尤其会引发目标用户的信息保护问题。因此,在保留绝大部分信息的情况下,如何降低目标用户的隐藏信息的可挖掘性是一个值得关注的问题。
在社交网络中,社区反应的是网络中个体行为的局部性特征以及其相互之间的关联关系。作为一项网络科学中的基础性研究,社区发现是指分析及预测整个网络各元素间的交互关系。但是从信息保护的角度来说,在社交网络中,对目标节点信息的保护是一个非常重要的研究问题,尤其,在尽量减小改变网络结构的情况下,如何降低目标节点信息的泄露是一个极其待研究的问题。
技术实现要素:
本发明的目的是提供一种基于图卷积网络梯度的节点信息隐藏方法,该方法能够在尽可能较小改变网络结构的情况下,对网络目标节点信息进行隐藏。
为实现上述发明目的,本发明提供以下技术方案:
一种基于图卷积网络梯度的节点信息隐藏方法,包括以下步骤:
(1)构建网络图,并根据所述网络图对应的连边集合构建邻接矩阵,并对所述邻接矩阵进行预处理;
(2)构建图卷积网络模型,以预处理后的邻接矩阵和邻接矩阵对应的单位矩阵作为所述图卷积网络模型的输入,以网络节点的真实类标作为所述图卷积网络模型的监督输出,以所有网络节点的交叉熵作为目标损失函数,完成对所述图卷积网络模型的训练,并确定所述图卷积网络模型的最终权重信息;
(3)根据所述最终权重信息,并以在尽可能保证非目标节点分类准确,且使目标节点分类错误为目标,构建目标函数,利用所述目标函数求取所述邻接矩阵对应的连边梯度矩阵;
(4)根据设定的梯度阈值,对所述连边梯度矩阵进行符号化,获得连边梯度符号矩阵;
(5)利用所述连边梯度符号矩阵对所述邻接矩阵进行更新,以实现对节点信息的隐藏。
图卷积网络是一种针对网络节点的半监督分类算法。为了提取图卷积网络在处理网络节点时所有连边对目标网络节点分类的梯度,本发明将图卷积网络中的目标函数设计为使得目标网络节点的分类错误而剩余网络节点的分类正确,并依据目标函数对邻接矩阵进行求导,得到整个邻接矩阵的连边梯度矩阵,再依据所对应的梯度矩阵对网络结构进行修改,在保持尽量减少网络结构变化的情况下,使得目标网络节点的分类错误,而且保证剩余网络节点的分类正确,从而做到隐藏节点信息的目的。
优选地,所述对所述邻接矩阵进行预处理包括:
对于n×n邻接矩阵a,依次执行以下操作:
a=a+in,
dii=∑jaij,
其中,i,j∈{1,2,···,n},dii为度矩阵d的对角线上的第i个元素。
由于图卷积网络是一个频域处理的深度算法,所以首先需要对数据进行预处理,将其转换成拉普拉斯矩阵再进行计算。
本发明中,构建的图卷积网络模型由两层卷积神经网络组成,其中,第一层卷积神经网络的激活函数为relu激活函数,第二层卷积神经网络的激活函数为softmax函数。
在训练的过程中,所述图卷积网络模型的目标损失函数loss1为:
其中,s表示网络图中的网络节点总个数,f表示网络节点的真实类标的个数,ysf表示属于第f个真实类标的第s个网络节点的真实类标数据,zsf表示属于第f个真实类标的第s个网络节点的预测类标数据,
利用随机梯度下降算法和目标损失函数loss1优化卷积神经网络的所有权重信息,以实现对所述图卷积网络模型的训练。
步骤(3)中,构建的目标函数loss2为:
其中,s=t∪u,t表示网络图中的目标网络节点总个数,t表示网络图中的非目标网络节点总个数,f表示网络节点的真实类标的个数,ytf表示属于第f个真实类标的第t个目标网络节点的真实类标数据,ztf表示属于第f个真实类标的第t个目标网络节点的预测类标数据,yuf表示属于第f个真实类标的第u个非目标网络节点的真实类标数据,zuf表示属于第f个真实类标的第u个非目标网络节点的预测类标数据。
本发明中,以在尽可能保证非目标节点分类准确,且使目标节点分类错误为目标构建目标函数loss2,利用对目标函数loss2求连边的偏导数得到所有连边所对应的梯度矩阵。
优选地,所述利用所述目标函数求取所述邻接矩阵对应的连边梯度矩阵包括:
利用目标函数loss2对邻接矩阵中的每个连边求偏导,得到连边对应的梯度,邻接矩阵中所有连边对应的梯度组成连边梯度矩阵。
本发明利用目标函数对所有连边进行求偏导,可以获得所有连边对整体目标函数产生的影响程度,即用梯度的方式衡量连边对于所有网络节点分类结果的影响能力。
在获得所有连边的梯度信息之后,本发明能够依据梯度信息,以最小的代价重构网络,即改变网络中的部分连边权重信息,使得最终的分类结果呈现针对所有具有类标的节点集合的分类中,使得目标网络节点分类错误的同时,尽可能保证非目标网格节点分类准确,以达到在隐藏关键节点信息的情况下,尽可能保留其他节点的信息。
在计算得到邻接矩阵所对应的连边梯度矩阵之后,考虑到网络结构中的连边变化存在的特殊性,本发明提出了一种梯度符号化计算,将梯度信息进一步变化成符合实际情况的变化策略,最终实现更新邻接矩阵的效果,实现目标节点信息隐藏。
具体地,所述连边梯度符号矩阵中的元素gij的计算公式为:
其中,μ表示梯度阈值。
梯度符号计算公式中的梯度阈值μ过小,则会使得网络结构变化过大;μ值过大,则会使得目标网络节点的信息隐藏效果不理想。因此,适当的设置梯度阈值是十分重要的,一般情况下,梯度阈值根据实际需求μ设定。
具体地,步骤(5)的具体过程为:
对于邻接矩阵中的每个元素,根据连边梯度符号矩阵对应位置的元素值对邻接矩阵的元素进行更新,具体为:
gij=1表示增加网络节点i和网络节点j之间的连边;
gij=-1表示删除网络节点i和网络节点j之间的连边;
gij=0表示不改变网络节点i和网络节点j之间的连边。
在删除网络节点的连边时,需要确保连边两端网络节点不会成为孤立节点。
本发明具有的有益效果为:
本发明所提出的一种基于图卷积网络梯度的节点信息隐藏方法能够在保证整体节点可识别的情况下,使得节点分类和社区发现等算法无法实现对目标节点进行正确的分类,实现在目标节点的信息隐藏。
附图说明
图1是本发明提供的连边梯度矩阵的获取过程示意图;
图2是本发明提供的邻接矩阵的更新过程示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
在本实施例中,选择以citeseer数据集作为本实施例的实验数据集。具体地对节点信息隐藏的过程分为两个阶段,分别为如图1所示的连边梯度矩阵的计算阶段和如图2所示的邻接矩阵的梯度更新阶段。下面分别对两个阶段的具体流程进行陈述。
连边梯度矩阵的计算阶段的具体过程如下:
s101,根据citeseer数据集建立网络图:
依据数据集建立无向网络g=(v,e),其中,citeseer网络中节点个数n=3264,连边个数为4551条,所对应的类标个数f=6。
s102,构建邻接矩阵,并对邻接矩阵进行预处理:
将图卷积网络模型的输入数据设置为2126×2126大小的单位矩阵in,即x=in;
根据网络中的连边集合e构建邻接矩阵a=(aij)n×n,i,j∈{1,2,···,n},其中,
对邻接矩阵a依次执行以下操作:
实现对邻接矩阵a的预处理。
s103,构建并训练图卷积网络模型:
本实施例中,采用tensorflow搭建两层的图卷积网络。
首先,随机初始化两层网络的权重信息w(0)和w(1);
然后,将邻接矩阵预处理过的
接下来,将第一层的输出作为第二层网络的输入数据,为了提高训练过程中的梯度传播效果,本实施例使用softmax函数作为最终层的激活函数,其定义为:
本实施例中,前馈模型简写成:
接下来,定义目标损失函数。本实施例中以所有网络节点的交叉熵作为目标损失函数,即将目标损失函数loss1定义为:
其中,y表示真实节点类标数据,z表示预测节点类标数据,f表示节点类标个数。
最后,对图卷积网络模型进行训练,以确定所述图卷积网络模型的最终权重信息。
s104,构建目标函数,并根据目标函数计算连边梯度矩阵:
首先,根据最终权重信息构建目标函数loss2:
目标函数loss2的实际意义在于:针对所有具有类标的节点集合s=t∪u的分类中使得目标节点集合t内节点的分类错误的同时,尽可能保证非目标节点集合u内节点的分类准确。
然后,对目标函数loss2求所有连边的偏导,得到邻接矩阵中的所有连边所对应的梯度gij,网络连边的梯度信息就是所对应的连边对目标函数loss2产生的影响程度,将所有连边相对应的梯度组成所对应的连边梯度矩阵gn×n。
邻接矩阵的梯度更新阶段:
s201,根据设定的梯度阈值μ,对连边梯度矩阵gn×n进行符号化,获得连边梯度符号矩阵。
其中,连边梯度符号矩阵中的元素gij的计算公式为:
s202,利用连边梯度符号矩阵gn×n对邻接矩阵a进行更新,以实现对节点信息的隐藏。
具体地,对于邻接矩阵中的每个元素,根据连边梯度符号矩阵对应位置的元素值对邻接矩阵的元素进行更新,具体为:
gij=1表示增加网络节点i和网络节点j之间的连边;
gij=-1表示删除网络节点i和网络节点j之间的连边;
gij=0表示不改变网络节点i和网络节点j之间的连边。
此外,在删除网络节点的连边时,需要确保连边两端网络节点不会成为孤立节点。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。