一种社交网络的异常检测与优化方法、系统及计算机设备与流程

文档序号:18869894发布日期:2019-10-14 19:17阅读:214来源:国知局
一种社交网络的异常检测与优化方法、系统及计算机设备与流程

本发明属于复杂社交网络中敏感关系的安全防护技术领域以及关键链路的挖掘分析与调控优化技术,具体为一种社交网络调控机制的异常检测与优化方法、系统及计算机设备。



背景技术:

在在线社交网络中,潜在的商业利益导致了虚假账户的产生和扩散。社交网络中存在着大量的虚假账户,以微博为例,有大量的机器人账户转发各种广告或者充当水军,还有一些账户存在贩卖色情视频、发布谣言、诈骗等行为,这些账户都属于虚假账户。虚假账户的存在对安全造成了重大威胁。并且,现实社交网络中总是存在着不同水平的噪声(错误或者干扰项),社交网络的规则性和模式就不够明显,对异常检测和调控的效果会产生不利的影响,因此,就有必要对社交网络进行精确的重构,并基于关键链路采取必要的调控方式来达到对已重构网络的优化完善。

但是,传统的重构方法并不能度量网络的内在重构能力,降低了对网络的评价和优化,侧重于尽可能精确地建模规则组件,没有明确捕捉子结构和网络重构之间的内在关系。因此,微观网络元素在宏观网络分析中的作用不明确,最终导致解释能力差。并且结构模式学习技术在网络重构中的应用还很少受到重视,这将导致重构精度较低,从而影响我们对虚假账户的异常检测。如果能够准确地量化网络结构规律性,通过社交网络链路的扰动调控,改变与目标对象相关的结构模式,还可以为社交网络的优化完善提供一个新的思路。



技术实现要素:

为了识别社交网络上存在大量的虚假账户,并优化重构的社交网络,本发明提出一种基于社交网络调控机制的异常检测与优化方法、系统及计算机设备,如图1,所述方法包括以下具体步骤:

s1、根据社交网络构建图数据,获得图数据的邻接矩阵,采用重构算法对图数据进行强化去噪,得到重构社交网络;

s2、定义规则性水平来评估重构社交网络的规则性水平,计算网络链路的似然性;

s3、在重构的社交网络中,按升序对链路的似然性进行排序,并获得排名列表;

s4、从排名列表的第一项开始依次遍历排名列表,计算若移除当前项后社交网络的规则性水平,如果当前规则性水平有所提高,则移除该项对应的链路;

s5、输出经过步骤s4优化后的社交网络。

进一步的,步骤s1包括:

s11、以社交网络中的用户为节点、用户之间的关系为边构建一个无向图作为图数据,并将图数据用邻接矩阵表示;

s12、构建低秩自表示网络模型,使用增广拉格朗日乘数方法得到最优表示矩阵和误差矩阵;

s13、通过最优的表示矩阵和基矩阵获得重构社交网络的链路存在可能性矩阵sm;

s14、,将矩阵sm以条目符号分为正分量sm+和负分量sm-

s15、若正分量sm+中的条目在邻接矩阵x中存在,则排除该条目,剩余条目中链路的似然性高于阈值的条目为缺失的链路;

s16、若负分量sm-中的条目在邻接矩阵x中没有,即对应项为0,则该条目,为虚假链路。

进一步的,网络低秩自表示建模包括:

其中,e为误差项,x为社交网络的邻接矩阵,z为社交网络的表示矩阵,rank(·)表示矩阵的秩,λ为平衡参数,||·||2,1表示矩阵范数。

进一步的,所述邻接矩阵表示为x∈rn×m,即邻接矩阵为一个m×n维的矩阵,邻接矩阵的每一列被视为一个局部结构,第i列的局部结构表示为:

其中,x:,i表示邻接矩阵第i列的局部结构;d:,k表示局部结构x:,k的基矩阵,zk,i是基矩阵d:,k的权重。

进一步的,通过优化的表示矩阵和基矩阵获得重构社交网络的链路存在可能性矩阵sm包括:

sm=xz*+(xz*)t

其中,x为基矩阵,z*为通过优化的表示矩阵,上标t表示转置矩阵。

进一步的,规则性度量表示为:

其中,σr为规则性度量,n为表示矩阵的维数,r为表示矩阵的秩,a为表示矩阵中的非零条目的数量。

进一步的,计算网络链路的似然性包括:网络链路的似然性通过其首末两端的节点的重构似然性来估计,表示为:

ui,j=rc(i)×rc(j);

其中,ui,j表示节点i与节点j之间的链路的似然性;rc(k)表示网络节点k的重构似然性,zk,i表示基矩阵d:,k的权重,|·|表示绝对值,n表示矩阵的维数。

本发明可以通过使用重构网络和“真实”社交网络之间的差异,即剩余链路,作为测试集来评估,本发明一方面可以挖掘出必要的数据用来识别出虚假账户,另一方面又能对重构网络进行优化,提升它的有效性和精确度,时间性能和复杂度也都得到了优化。

附图说明

图1为本发明一种基于社交网络调控机制的异常检测与优化方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提出一种社交网络的异常检测与优化方法、系统及计算机设备,所述方法包括以下具体步骤:

s1、根据社交网络构建图数据,获得图数据的邻接矩阵,采用重构算法对图数据进行强化去噪,得到重构社交网络;

s2、定义规则性水平来评估重构社交网络的规则性水平,计算网络链路的似然性;

s3、在重构的社交网络中,按升序对链路的似然性进行排序,并获得排名列表;

s4、从排名列表的第一项开始依次遍历排名列表,计算若移除当前项后社交网络的规则性水平,如果当前规则性水平有所提高,则移除该项对应的链路;

s5、输出经过步骤s4优化后的社交网络。

在数据发布环境下,本发明首先从大量复杂网络中收集需要的社交网络关系数据,然后对数据进行预处理,识别出敏感关系,抽象为图数据,获得它的邻接矩阵,并以此网络建模,量化其规律性,计算重构似然性,再调节其可重构性,实现虚假账户的识别以及重构网络的优化完善,最后,将得到的优化社交网络以网络数据的形式再发布回复杂网络中去。

在本实施例中,个体或者账户就抽象为节点,账户与账户、人与人之间的关系就表示为链路。由这种图数据可以很轻松的获得其对应的邻接矩阵。为了加强社交网络规则性和结构模式,便于异常检测与优化,在社交网络的重构中,本发明让x∈rn×m表示社交网络的邻接矩阵。矩阵x的每一列都被视为一个局部结构x:,i,因此x包含m个局部结构,即,[x:,1,x:,2,…,x:,m]。给定一个完整的基矩阵d=[d:,1,d:,2,…,d:,m]∈rn×m,每个局部结构都可以被基的一组线性组合表示如下:

其中zk,i对应基d:,k的权重。因此,网络的邻接矩阵x能够以x=dz的方式重构,其中z∈rn×m是表示矩阵。为了认识网络的组织原理,基矩阵d的最佳候选是邻接矩阵x。基于上述讨论,社交网络可以低秩自表示建模为:

其中e是误差项,λ≥0是平衡不同项的权衡参数,z为表示矩阵。

一个常见的做法是用表示矩阵的的核范数||z||*,即rank(z)的奇异值之和来代替z的秩(即lrnr重构算法)。但值得注意的是,所提出的网络模型的目标是通过联合寻找所有数据的最低等级表示来识别内在结构模式;为了解决社交网络重构问题,本发明着重于以准确的方式推断底层网络,因此,本发明用了frobenius范数(简称f-范数)代替核范数,就得到了lfnr重构算法,这可以大大降低网络建模的计算复杂度,在保证网络重构高精度的前提下,可以高效地重构网络;为了解决这个问题,本发明引入辅助变量j使目标函数可分离,则可通过求解如下增广拉格朗日乘数(alm)问题来处理:

其中,||·||*表示求核范数,表示f2范数,||·||2,1表示矩阵范数;y1和y2是拉格朗日乘数,而μ>0是惩罚参数,上标t表示矩阵的转置矩阵。然后分别最小化j、z和e。考虑到求解效率,本发明选择了不精确alm方法来求解。将社交网络的邻接矩阵和权衡参数输入到此算法就可以得到表示矩阵和错误矩阵。然后将求解得到的最优的表示矩阵z*与基矩阵x以sm=xz*+(xz*)t的方式相结合就可以重构出“真实”的社交网络链路存在可能性矩阵sm,其中的元素表示该链路存在的概率,0表示一定不存在,1表示一定存在,0和1之间的表示其存在概率,而负的则表示虚假链路。从某种意义上讲,该矩阵的效果等同于邻接矩阵,象征着“真实”社交网络,即重构后的社交网络。得到得分矩阵后,根据条目符号,将sm分为正分量sm+和负分量sm-,通过将正分量sm+中的条目与邻接矩阵x相比较来将删除条目,剩余条目中链路的似然性高于阈值的条目为缺失的链路,通过将负分量sm-中的条目与邻接矩阵x进行比较,对sm-条目的似然性进行排序,剩余条目中似然性低于阈值的条目为虚假链路。

为了量化重构社交网络的规则性水平,计算其链路的似然性,并识别虚假账户,本发明将所提出的自表示网络模型直接用于分析局部结构的共同性并表征网络链路的作用。其中网络规则性旨在衡量复杂网络能够被建模和重构的程度,实际上可以通过局部结构的共同性来捕捉。网络的某些局部结构可能完全相同,它们的比例可以用表示矩阵z*的秩来表征,网络中相同的局部结构越多,表示矩阵在自表示模型中的秩就越少。即使没有相同的局部结构,一些局部结构也可以被构造为其它结构的组合。在这种情况下,局部结构的正则性可以用表示矩阵的非零条目的数量来表征。于是基于表示矩阵我们定义了σr来度量网络规则性:

其中n、r和a分别是表示矩阵的维数、秩和非零条目的数量。(n-r)/n表示网络中相同局部结构的比例,a/(n·r)表征了局部结构的正则性。而对于链路似然性,表示矩阵的第k行代表节点k的局部结构对其他结构的重构的贡献。非零条目的数量越多,用于重构的节点k的局部结构的频率越高。于是,对于网络节点k其重构似然性为:

节点重构似然性的较大值意味着节点的相关链路用于网络重构的频率较高。所以网络链路的似然性可以通过其末端节点的重构似然性来估计:

ui,j=rc(i)×rc(j)。

其中ui,j就是节点i,j之间的链路的似然性。其值较大的更有可能是规则链路。所有未观察到的链路都根据它们的分数进行排序,并且分数高的链路具有高的存在可能性。类似地,所有观察到的链路都被排序,得分较低的链路更有可能是虚假链路,而虚假链路对应的就是虚假账户,从而实现了社交网络虚假账户的异常检测。

本发明还提出一种基于社交网络调控机制的异常检测与优化系统,包括所述系统包括依次相连的社交网络获取模块、社交网络转化模块、邻接矩阵生成单元、基矩阵生成单元、社交网络重构模块、虚假链路判断模块以及重构网络调节模块;其特征在于:

所述社交网络获取模块用户获取社交网络中用户的社交关系与用户信息;

所述社交网络转化模块用户将社交网络中用户的社交关系转化为图数据表示;

所述邻接矩阵生成单元用于将图数据转换为邻接矩阵;

所述基矩阵生成单元用户根据邻接矩阵生成基矩阵;生成过程是将邻接矩阵分解为基矩阵与基矩阵权值的乘积;

所述社交网络重构模块用户对图数据进行强化去噪,得到重构的社交网络;

所述虚假链路判断模块用户计算网络链路的似然性,并通过网络链路的似然性判断该网络链路是否为虚假链路;

所述重构网络调节模块用户删除网络链路中的虚假链路。

进一步的,所述虚假链路判断模块包括低序自表示网络模型子单元、增广拉格朗日乘子单元、条目符号判断子单元、虚假链路判决器;根据低序自表示网络模型子单元利用增广拉格朗日乘子单元求解出表示矩阵和误差矩阵;根据表示矩阵和基矩阵获得重构社交网络的链路存在可能性矩阵sm,在此步骤中使用了矩阵乘法器和矩阵矩阵加法器,链路存在可能性矩阵sm表示为sm=xz*+(xz*)t;在条目符号判断子单元中以条目符号为依据将链路存在可能性矩阵sm分为正分量sm+和负分量sm-并输入虚假链路判决器,在虚假链路判决器中,将负分量sm-中的条目在邻接矩阵中进行搜索,若该条目在邻接矩阵中不存在,则该条目对应的链路为虚假。

进一步的,所述重构网络调节模块包括规则性量度计算器、链路似然性计算器、排序子单元和删除子单元,链路似然性计算器计算链路的似然性,排序器将链路的似然性升序排列得到排名列表;利用规则性量度计算器依次计算列表中的元素,若移除当前元素后重构网络的规则性量度上升,则利用删除子单元删除当前元素对应的链路,使得重构网络的规则性水平上升。

一种基于社交网络调控机制的异常检测与优化计算机设备,包括存储器、处理器以及存储在存储器上并可以在处理器上运行的计算机程序,所述处理器执行的计算机程序实现前述任一一种所述的方法。

本发明就可以利用提出的规则性度量来衡量规则性水平。显而易见的是社交网络的规则性越高,可预测性就越高,可重构性就越高,重构的精度也就越高。所以可以通过提高社交网络的规则性,改变与目标对象相关的结构模式,来对重构网络进行优化。尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1