基于边零模型的网络边社团发现方法与流程

文档序号:11655272阅读:250来源:国知局

本发明属于网络社团发现技术领域,尤其涉及一种基于边零模型的网络边社团发现方法。



背景技术:

随着网络的不断发展,其规模已经增长到了一个非常庞大的数量级。在这些大规模网络中,以往小规模网络研究中的重要问题,诸如移除某个结点或某条边对整个网络结构的影响这类问题,已不再有重要的研究价值,因为一个结点或一条边的移除对大型网络的结构影响是可以忽略不计的。人们往往更关心关于网络结构的一些统计特征的研究,例如整个网络的结点度的取值分布的形态,要破坏多大比例的网络结点或边才能使整个网络结构被破坏等等。以往认为研究一个复杂系统,只需将系统的组成要素的性质单独研究清楚,就能得到整个复杂系统的行为特性,但是研究表明,复杂系统的行为特性不能靠仅仅独立研究其各组成要素,而应将各组成要素当一个整体来进行研究。在这种大背景下,随着网络研究的不断深入,人们发现在不同类型的网络中得到的反映网络结构的性质和行为机制往往是一致的,在一个网络上得到的规律可以很容易地映射到另一个网络的研究中。这种不同网络具有一致或相似的结构性质或行为特征的现象,推动着网络研究以一个前所未有的速度向前发展,这类研究的对象――大规模网络,常常被称作复杂网络。

研究表明,实际的复杂网络是具有一定组织特性的网络结构,如小世界性,聚集性和结点度的分布不均匀性等等。这种组织结构特性可以用网络社团来描述。从直观上讲,社团是指由网络节点组成的一个个节点子集合,子集合内部节点之间连接紧密,而各子集合之间节点连接稀疏。网络社团的这种直观意义表明社团内的节点通常是一组具有某种共同属性或起某种相似作用的节点集合。

模块度是衡量网络社团划分质量的标准,其基本想法是把社团划分后的网络与相应的零模型进行比较,以度量社团划分的质量。模块度值的大小主要取决于网络的社团划分情况,可以用来定量的衡量网络社团划分质量,其值越接近1,表示网络划分出的社团结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度q来获得最优的网络社团划分。

随着复杂网络研究的兴起,随机图成为一种重要复杂网络模型。常用的复杂网络的随机图模型主要有以下几种:具有给定平均度的随机图模型,具有给定度分布的广义随机图,以及具有给定度相关特性的随机重连的零模型。复杂网络的随机图模型的许多性质可以做较为严格的理论分析,与此同时,可以通过与适当的随机图模型做比较来分析实际网络的设计和演化特性。

近些年来,复杂网络中的边社团结构拥有广泛的理论分析意义,边社团划分也是近年来网络科学研究的热点话题。众多研究者根据网络中边的特性提出了一些社团发现方法。

2010年,ahn等提出了复杂网络中的连边社团结构。作者将社团看作是一组紧密相连的连边的集合,而不是通常定义的紧密节点的集合,因此,节点可以属于多个社团,而一条边只能属于一个社团。作者给出连边对和连边相似度的概念,并提出了相应的社团检测算法。

2011年,kim等将点社团发现中信息传播的方法用于边社团;同年,panl等提出一种基于局部信息的边社团检测方法;ye等提出一种在矩形网络中检测连边社团的方法,上述方法均在不同程度上提高了连边社团检测的效率。

2013年,he等人提出一种超节点和连边社团的概念,对于一个网络,作者同时采用点社团和边社团的检测方法,提出一种学习方法,将网络中的社团自然分为点社团与边社团,从而优化社团发现结果。



技术实现要素:

本发明的发明目的是:为了更有效的划分边社团,本发明提出了一种适用于边网络的基于边零模型的网络边社团发现方法。

本发明的技术方案是:一种基于边零模型的网络边社团发现方法,包括以下步骤:

a、将网络中每条边作为一个社团,得到社团数量m;其中m为网络中边的数量;

b、遍历网络中每条边eij,得到所有与边eij相邻的邻边,构建边零模型,针对每条邻边ejk计算边eij加入邻边ejk所在社团的边社团系数增量;

c、根据步骤b中计算的边社团系数增量得到边社团系数增量最大值所对应的社团c,将边eij合并至社团c;

d、判断每条边所在社团是否存在变化;若社团存在变化,则返回步骤b;若社团不存在变化,则进行下一步骤;

e、将步骤d中社团作为一条新的边,生成新的边网络;

f、判断步骤e中生成新的边网络与原网络是否存在变化;若生成新的边网络与原网络存在变化,则返回步骤b;若生成新的边网络与原网络不存在变化,则完成边社团发现。

进一步地,所述步骤b中所有与边eij相邻的邻边采用边的度表示与边eij的端点i和端点j相邻的边的个数,具体表示为:

deij=ki+kj-2

其中,deij为边的度,ki,kj分别表示端点i和端点j的度。

进一步地,所述步骤b中构建边零模型包括以下分步骤:

s1、计算网络中每条边eij的边的度deij,并将每条边依次排列;

s2、将每条边eij的两个端点延伸出个deij线头与其它边相连,且若两条边相连则其非公共端点不相连;

s3、将所有线头进行配对,生成边零模型。

进一步地,所述步骤b中边社团系数的计算公式具体为:

其中,esij是eij的边强度,eosij,jk是边eij和边ejk的邻边连接强度,δ(g(eij),g(ejk))为冲击函数。

进一步地,所述冲击函数δ(g(eij),g(ejk))的取值为当边eij和边ejk属于同一个边社团时冲击函数δ(g(eij),g(ejk))取1,当边eij和边ejk不属于同一个边社团时冲击函数δ(g(eij),g(ejk))取0。

本发明的有益效果是:本发明通过构建边零模型表示网络中的边社团结构,并采用采用边社团系数作为衡量网络边社团结构的功能函数,能够更加清晰有效的分析网络中边的结构特性,便于在实际网络中应用边网络的特性进行社团发现,解决了利用传统的连边检测方法无法检测er随机网络、br无标度网络中的边社团发现问题,具有广泛的应用前景。

附图说明

图1是本发明的基于边零模型的网络边社团发现方法流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,为本发明的基于边零模型的网络边社团发现方法流程示意图。一种基于边零模型的网络边社团发现方法,包括以下步骤:

a、将网络中每条边作为一个社团,得到社团数量m;其中m为网络中边的数量;

b、遍历网络中每条边eij,得到所有与边eij相邻的邻边,构建边零模型,针对每条邻边ejk计算边eij加入邻边ejk所在社团的边社团系数增量;

c、根据步骤b中计算的边社团系数增量得到边社团系数增量最大值所对应的社团c,将边eij合并至社团c;

d、判断每条边所在社团是否存在变化;若社团存在变化,则返回步骤b;若社团不存在变化,则进行下一步骤;

e、将步骤d中社团作为一条新的边,生成新的边网络;

f、判断步骤e中生成新的边网络与原网络是否存在变化;若生成新的边网络与原网络存在变化,则返回步骤b;若生成新的边网络与原网络不存在变化,则完成边社团发现。

在步骤a中,在复杂网络中,节点的度描述了与该节点相邻的节点的个数,能够反应出节点的连接属性。而对于网络中的边,本发明通过边的度及其强度来衡量复杂网络中的边之间的连接关系。

本发明以邻接矩阵表示一个网络结构,以无权无向网络为例,在一个网络中,网络的邻接矩阵a=(aij)n×n,是一个n阶方阵,其中n为网络中节点个数,矩阵中元素aij取值为当有从顶点i指向顶点j的边时元素aij为1,当没有从顶点i指向顶点j的边时元素aij为1。

在步骤b中,对于网络中的边,如果两条边拥有公共顶点,那么这两条边为相邻边。本发明通过边的度来衡量某条边相邻的边的个数。

对于网络g中的任意一条边eij,所有与边eij相邻的邻边采用边的度表示与边eij的端点i和端点j相邻的边的个数,具体表示为:

deij=ki+kj-2

其中,deij为边的度,ki,kj分别表示端点i和端点j的度。

由于网络中一条边拥有两个端点,因此可以将其分为左度和右度。其中边的左度表示一条边一个端点的邻边个数,记为:

边的右度表示一条边另一个端点的邻边个数,记为:

边的度数描述了一条边的邻边条数,同节点度数相同,是边的基本属性之一,能够用于直接衡量边在网络中的重要程度。但对于两条边,其相关性无法仅仅通过其是否相邻简单描述。这是由于对于两条邻边而言,其非公共端点是否相连也决定了这两条邻边的联系紧密度,因此,边的度无法完全描述两条邻边之间的相关性,因此本发明利用边的连接强度来表示两条边之间的连接强度。

若两条边相邻,其边连接强度由公共节点的度数及其非公共节点是否相连决定,因此,边的连接强度可以表示为:

其中,kj为公共节点j的度,aik为邻接矩阵中第i行k列的值,当节点i与节点k连接时aik取值为1,当节点i与节点k不连接时aik取值为0,β为平滑常数。

本发明通过边的连接强度可以定义某条边的边强度。边强度表示一条边与其所有邻边的连接强度总和,记为:

与边的度数类似,这里的边的左强度为表示一条边与其一个端点的邻边的连接强度总和;边的左强度为表示一条边与其另一个端点的邻边的连接强度总和。利用边的度数与连接强度可以对网络中边的连接重要程度进行度量,从而建立边零模型。

在点随机模型中,我们把与一个实际网络具有相同节点数和相同的某些性质的随机网络称为该实际网络的随机网络。这里的“某些性质”可以是平均度,度分布,聚类系数,同配系数等等,或者是他们的某种组合。从统计学角度看,“具有某些性质的网络g也具有另一性质”是一个零假设,而为了要验证这一假设是否成立,就需要与原网络g具有相同规模和相同性质的随机网络作为参照系,以判别另一种性质是否为这类随机网络的典型特征。这类随机网络模型在统计学上称为零模型。

按照约束条件从少到多,可以定义不同阶次的零模型:

(1)0阶零模型:与原网络具有相同节点数n和边数μ的随机化网络。

(2)1阶零模型:与原网络具有相同节点数n和度分布p(k)的随机化网络,通常做法是每个节点的度值都保持不变,即度序列保持不变。

(3)2阶零模型:与原网络具有相同节点数n和二阶度相关特性p(k,k’)的随机化网络。

以此类推,我们还可以定义更高阶的零模型。类似的,以本发明复杂网络中的边为单位,根据与原网络具有相同边数和相同性质的随机网络得到边零模型。在边零模型中,网络中的边是构成边零模型的单位,而边由节点相连,边之间的连接关系是随机的,按照约束条件不同,可以得到不同阶次的网络零模型如下:

0阶边零模型:与原网络具有相同节点数n,相同网络数m,平均边度数的网络随机模型;

1阶边零模型:与原网络具有相同节点数n,相同网络数m,边度数分布p1(de)的网络随机模型;

2阶边零模型:与原网络具有相同节点数n,相同网络数m,边度数2阶联合分布p2(de1,de2)的网络随机模型;

n阶边零模型:与原网络具有相同节点数n,相同网络数m,边度数n阶联合分布pn(de1,de2...den)的网络随机模型;

本发明以1阶边零模型为例构建边的社团系数。与单网络类似,1阶边零模型同时具有一定的随机性以及与原网络相同的总体边度特性。我们构造的边零模型首先是一个不具有边社团结构的随机化网络,而边零模型阶数越高,边社团结构越明显,因此不能选择高阶数的边零模型。因此,本发明使用1阶边零模型满足模型社团结构的随机性,未做特殊说明,本发明中的边零模型均指1阶边零模型。本发明采用网络配置的思想构建网络1阶零模型,以保证零模型与原网络具有相同节点数n、网络数m、边度数分布p(de)。为了有效地划分边社团,本发明采用边随机网络的1阶零模型作为网络模型,构建边零模型,具体包括以下分步骤:

s1、计算网络中每条边eij的边的度deij,并将每条边依次排列;

s2、将每条边eij的两个端点延伸出个deij线头与其它边相连,且若两条边相连则其非公共端点不相连;

s3、将所有线头进行配对,生成边零模型。

在上述过程中,边的度数之和即公共节点的连接边总是一定的,记为ms,表示为:

其中,x∈s,s为所有公共节点集合。从而得到一阶边零模型的成边概率为:

特别的,在边零模型的生成中,边的数目相同并不意味着边的总度数就相同,因此将相同数目的边配置到网络中难以寻找出合理的边零模型,并且在随机重连中,交换相同度数的边并不是变随机模型的唯一解。

本发明基于边零模型,利用边社团系数用于研究复杂网络中的边社团结构。由于边度数无法全面描述邻边之间的联系紧密度,因此本发明使用边强度作为计算边社团系数的基本因子。这里的边社团系数具体为社团中相邻边之间实际的连边强度与零模型的连边强度之差,并以采用边总强度归一化,边社团系数的计算公式具体为::

其中,esij是eij的边强度,eosij,jk是边eij和边ejk的邻边连接强度,δ(g(eij),g(ejk))为冲击函数。其中,esij是eij的边强度,eosij,jk是边eij和边ejk的邻边连接强度,δ(g(eij),g(ejk))为冲击函数。

本发明通过上述方法针对每条边eij加入邻边ejk所在社团前的边社团系数和边eij加入邻边ejk所在社团后的边社团系数的变化,计算得到边eij加入邻边ejk所在社团的边社团系数增量。

在步骤c中,本发明通过比较步骤b中计算得到的边社团系数增量得到边社团系数增量最大值,再将边社团系数增量最大值所对应的社团c,将边eij添加到社团c,合并两个社团。

在步骤d中,本发明重复步骤b和c,直至每条边所属的社团固定不再发生变化了,就可以判断整个网路中的社团不再变化,从而进行下一步骤。

在步骤e中,针对上述步骤所划分出的社团,将其看作一个新的边,生成新的边网络。社团强度即社团中所有边强度之和;社团之间的边强度为两个社团中所有边的边连接强度总和。

在步骤f中,判断步骤e中生成新的边网络与原网络是否存在变化;若生成新的边网络与原网络存在变化,则返回步骤b,重复上述步骤;若生成新的边网络与原网络不存在变化,则完成边社团发现。

本发明采用边社团系数衡量边社团的联系紧密程度,当边社团系数最大时,边网络的社团划分结果最为理想。本发明的时间复杂度为o(demax×m),其中demax为网络中度数最大边的度数,m表示边数,与传统的节点社团发现bgll算法的数量级相同,远低于传统的边社团的划分方法o(m3)。本发明还适用于传统的连边检测方法无法检测的er随机网络、br无标度网络中的边社团发现。因此,本发明的边零模型能够用于凸显网络中的边社团结构,并且边社团系数能够更加广泛地运用于边社团的发现,尤其是大规模网络中。通过运用合适的边零模型,还能够更加清晰的分析网络中边的结构特性,便于我们在实际网络中应用边网络的特性进行分析,从而能够高效而准确的进行复杂网络边社团划分。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1