对抗链路预测的用于网络结构隐私保护的链路删除方法与流程

文档序号:18617189发布日期:2019-09-06 22:08阅读:190来源:国知局
对抗链路预测的用于网络结构隐私保护的链路删除方法与流程
本发明属于网络空间安全隐私保护
技术领域
,涉及一种对抗链路预测的用于网络结构隐私保护的链路删除方法。
背景技术
:在当今数据化时代,数据隐私泄露已成为当前最棘手的网络安全问题之一。尤其是社交网络结构数据的隐私保护尤为重要,主要体现为两点:1)社交网络结构数据是人们研究社交网络的基础;2)社交网络中部分重要的链路(或称之为边)往往是敏感的,比如某两个用户之间的私密朋友关系,隐私泄露可能会给用户造成巨大的精神困扰或经济损失。网络中的敏感链路我们称之为“目标链路”,因为他们往往是攻击者的目标。一般情况下,目标链路仅是所有链路的一小部分。当然,用户可以选择隐藏(或删除)目标链路来对外伪装不存在社交关系。然而仅隐藏目标链路还远远不够,因为攻击者可以通过链路预测方法(比如基于共同邻居数量)预测出已隐藏的链路,即造成严重隐私泄露,此为当前亟需解决的隐私问题。传统针对网络结构的隐私保护方法主要考虑结构扰动策略,即链路重连机制。主要有随机增删法和随机置换法。随机增删法,通过随机增加k条边,再随机删除k条边,保证节点的平均度保持不变。该方法容易实现,但过于简单,且被攻击后,隐私泄露严重。随机置换法:随机选定两条链路,判断是否符合保持节点度不变的置换方式,如果符合则置换,否则不置换。该方法可以保证每个节点的度不变,但未针对目标链路进行隐私保护。综上所述,现有的网络结构扰动法都存在一定缺陷:1.网络结构可用性大大降低。现有方法既删除了真实链路,同时增加了虚假的链路,在一定程度上可保护结构隐私,但原始网络的可用性大大降低。因为虚假链路的加入使得网络产生了新的网络安全问题,比如虚假链路检测;2.现有方法主要考虑网络结构整体的隐私保护,即假设网络中所有的链路均需隐私保护,导致隐私保护没有针对性,对重要目标链路保护不足。技术实现要素:本发明的目的在于克服上述现有技术的缺点,提供一种对抗链路预测的用于网络结构隐私保护的链路删除方法。为达到上述目的,本发明采用以下技术方案予以实现:一种对抗链路预测的用于网络结构隐私保护的链路删除方法,包括以下步骤:s1:从原始网络链路集中选取若干条目标链路;并将所有目标链路从原始网络链路集中删除;并给定删除预算k和链路删除计数器i,其中:i=0;s2:将当前网络链路集中的所有链路的初始权重值设为0;链路删除计数器i=i+1;s3:找出每条目标链路的两个端节点的共同邻居;对于每条目标链路,将每个端节点与共同邻居之间的链路的权重值加1;s4:当最大权重值大于0且i不大于k时;进行s5,否则进行s7;s5:选取一条权重值最大的链路并删除;s6:更新s2中的当前网络链路集,并返回s2;s7:删除结束,得到最终网络链路集。本发明进一步的改进在于:原始网络链路集中的链路为无向链路。s1中从原始网络链路集中选取若干目标链路的方法为随机游走抽样或基于启发式的抽样。目标链路总数量至少为1且小于原始网络链路集中链路数量的5%。删除预算k至少为1且小于原始网络链路集中链路个数的5%。s5的具体方法为:选取当前网络链路集中最大权重值的链路,当权重值为最大权重值的链路个数大于一条时,从所有权重值为最大权重值的链路中随机选取一条删除;当权重值为最大权重值的链路个数为一条时,删除权重值为最大权重值的链路。还包括:s8:对最终网络链路集的隐私保护效果与可用性进行评价。隐私保护效果采用相似性指数下降程度评价。可用性采用最终网络链路集的属性值评价,属性值包括平均节点度、平均介数、最大介数、距离中心性和特征向量值。与现有技术相比,本发明具有以下有益效果:通过从原始网络链路集中选取若干条目标链路,并将所有目标链路从原始网络链路集中删除;找出每条目标链路的两个端节点的共同邻居;进行每条链路权重值的更新;对于每条目标链路,选取一条权重值最大的链路并删除。在链路删除的过程中,每次循环更新权重并删除权重值最大的链路,在保留网络可用性的同时增加了迷惑性,使得攻击者在很大程度上无法预测目标链路的存在,保证得到的最终网络链路集对目标链路而言,具有较强的抗链路攻击能力;本发明通过共同邻居确定链路权重值进而选择权重值最大的链路删除的删除策略,能够保证删除较少的边,尽可能保留原始网络的信息,保持较好的网络可用性,对网络的关键特征破坏有限,比如度分布、节点重要性、社团属性等。由于链路删除方法是一种近似最优方法,具有完备的理论保障,采用链路删除策略更易于被接受,因为现有公布的社交网络数据仅是真实网络的采样,网络链路本身就缺失、不完备,是被人们广泛接受的,因此删除部分边仅是造成链路信息不完备,不会引入新的网络问题。同时,相比较传统的网络结构扰动法,本发明方法没有增加虚假链路,对网络整体结构的影响较小,故可较好地保留原始网络的可用性。进一步的,目标链路总数量至少为1且小于原始网络链路集中链路数量的5%;删除预算k至少为1且小于原始网络链路集中链路个数的5%;删除预算k比例较小,整个方法的耗时少,在大规模网络中,比如百万、千万乃至数十亿条链路的社交网络中均是可运行的,且得到的网络抗链路攻击能力较强,效率高。附图说明图1为本发明的方法流程框图;图2为本发明的实施例进行非目标链路删除的流程示意图。具体实施方式为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。首先解释本发明中的一些名词含义:对于给定的社交网络g=(v,e),v为节点集,e为链路集,选取一个目标链路集合h,h为e的子集。一条链路用其两端的节点对来表示,即(u,v)表示节点u与v之间的无向链路。节点对之间的相似性指数定义为此二节点的共同邻居个数。对于给定的删除预算k,即最多删除k条非目标链路。下面结合附图对本发明做进一步详细描述:参见图1,本发明对抗链路预测的用于网络结构隐私保护的链路删除方法,首先删除目标链路并初始化链路删除计数器;其次,初始化链路权重;再次,遍历所有目标链路,并更新链路权重;最后,选择权重值最大的链路并删除,直至完毕。具体包括以下步骤:s1:从原始网络链路集中选取若干条目标链路;并将所有目标链路从原始网络链路集中删除;并给定删除预算k和链路删除计数器i,其中:i=0。从原始网络链路集中选取若干目标链路的方法为随机游走抽样或基于启发式的抽样;这里介绍随机游走抽样的具体方法:a1:首先随机选取原始网络链路集中的一条链路,作为第一目标链路,然后对第一目标链路进行访问,并且确定与第一目标链路有关联的信息;a2:不去访问所有与第一目标链路相关联的链路,只是随机抽取原始网络链路集中的一个链路,作为第二目标链路,下一步只对第二目标链路访问;a3:若找不到与第一目标链路不相关联的链路,那么就选取一个相关联的链路,整个过程如此反复,直至选取预设数量的目标链路。目标链路的数量占总链路数量的0~5%且至少一条;删除预算k为原始网络链路集中链路个数的0~5%且至少为1。原始网络链路集中的链路为无向链路。s2:将当前网络链路集中的所有链路的初始权重值设为0;链路删除计数器i=i+1;s3:找出每条目标链路的两个端节点的共同邻居;对于每条目标链路,将每个端节点与共同邻居之间的链路的权重值加1;本发明提出的选择边的方法将所有目标链路端节点的共同邻居数之和作为优化目标函数。但不仅限于共同邻居数相似性指标,还可用与共同邻居相关的其他相似性指标,比如杰卡德系数,salton,hubpromoted,hubdepressed,leicht-holme-newman,adamic-adar和resourceallocation等。该优化目标函数是一个关于删除非目标链路集的函数,具有单调、子模特性,可采用贪婪算法近似求得最优解。s4:当最大权重值大于0且i不大于k时;进行s5,否则进行s7;s5:选取一条权重值最大的链路并删除,具体为:选取当前网络链路集中最大权重值的链路,当权重值为最大权重值的链路个数大于一条时,从所有权重值为最大权重值的链路中随机选取一条删除;当权重值为最大权重值的链路个数为一条时,删除权重值为最大权重值的链路;s6:更新s2中的当前网络链路集,并返回s2;s7:删除结束,得到最终网络链路集。s8:对最终网络链路集的隐私保护效果与可用性进行评价。隐私保护效果采用最终网络链路集的相似性指数下降程度评价;可用性采用最终网络链路集的属性值评价,属性值包括平均节点度、平均介数、最大介数、距离中心性和特征向量值。实施例本实施例中,参见图2,原始网络链路集中共有6个节点,分别为a、b、c、d、e和f;共有9条无向链路,分别为(a,b)、(a,c)、(b,d)、(b,c)、(c,d)、(d,e)、(d,f)、(e,c)和(e,f)。其中虚线代表目标链路,实线代表非目标链路,删除预算k=2。将当前网络链路集中的所有链路的初始权重值设为0;链路删除计数器i=1。通过随机抽样选取(b,c)和(d,e)为目标链路,找出(b,c)目标链路的两个端节点的共同邻居a和d;找出(d,e)目标链路的两个端节点的共同邻居c和f。对于(b,c)目标链路,将b和c端节点与共同邻居a和d之间的链路的权重值加1;对于(d,e)目标链路,将d和e端节点与共同邻居c和f之间的链路的权重值加1;最终权重值为1的链路为:(a,b)、(a,c)、(b,d)、(d,f)、(e,c)和(e,f);权重值为2的链路为:(c,d);最大权重值大于0且i=1<k=2;删除链路(c,d)。将当前网络链路集中的所有链路的初始权重值设为0,链路删除计数器i=2。找出(b,c)目标链路的两个端节点的共同邻居a;找出(d,e)目标链路的两个端节点的共同邻居f。对于(b,c)目标链路,将b和c端节点与共同邻居a之间的链路的权重值加1;对于(d,e)目标链路,将d和e端节点与共同邻居f之间的链路的权重值加1;最终权重值为1的链路为:(a,b)、(a,c)、(d,f)和(e,f);权重值为0的链路为:(b,d)和(e,c)。最大权重值大于0且i=2=k=2;从(a,b)、(a,c)、(d,f)和(e,f)随机选出(a,c)删除。将当前网络链路集中的所有链路的初始权重值设为0,链路删除计数器i=3;i=3>k=2,删除结束,得到最终网络链路集。参考表1,本发明中最终网络链路集的可用性评估。对比随机删除法,在一幅实际的社交网络(arenas-email)中进行测试。结果显示,如果目标链路的比例控制在1%,k=0.5%的原始网络链路集的个数时,本发明生成的最终网络链路集可以保持原始网络97%以上的可用性。表1最终网络链路集的可用性评估表采用方法随机删除法本发明方法可用性破坏程度2.97%2.97%参考表2,本发明与随机删除法的隐私分析结果展示表。在做隐私分析时采用的相似性指数为共同邻居个数,个数越大,两者之间存在边的概率越大。实际结果表明,选取总链路约1%的链路为目标链路,相似性指标下降率随着k值得增加大幅下降,当k=0.5%的原始网络链路集的个数时,本发明方法可使相似性较原始值平均下降50%,而随机法仅下降6.8%左右。表2本发明与随机删除法的隐私分析结果展示表采用方法随机删除法本发明方法相似性较原始值下降比例6.8%50%本发明可有效对社交网络中的敏感关系链接进行隐私保护,抵御攻击者通过链路预测来攻击敏感链路的存在性,该方法通用于大规模社交网络,并可较好保持原始网络的可用性。以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1