基于信息理论的复杂网络社团检测方法

文档序号:6592647阅读:442来源:国知局
专利名称:基于信息理论的复杂网络社团检测方法
技术领域
本发明属于数据处理和复杂网络技术领域,涉及一种基于信息理论发现复杂网络中社团结构的方法。
背景技术
当今时代,以互联网为代表的信息技术的迅猛发展使人类社会迅速步入了网络时代。在计算机世界中复杂网络无处不在,同样在现实世界中,也到处可以看到复杂网络(complex network)的身影,从城市公路网络到航空航线网络,从超大规模集成电路到大型电力网络,无一不是复杂网络的具体表现。复杂网络还可以用来描述人与人之间的社会关系,论文之间的引用关系等等。复杂网络已经成为当前最重要的多学科交叉领域之一。Boccara对复杂网络给出了一个明确的定义:如果某些网络的组成部分的表现行为已经被了解,但是由于缺乏足够的科学知识而无法预测这些网络的整体行为,则称这些网络为复杂网络。科学家们通过统计的方法发现,复杂网络具有社团属性的现象。许多实际网络中都有社团结构的存在,即整个网络包含若干个“社团(community)”。虽然对网络的社团还没有一个形式化的定义,但是社团的一个比较直观的表现是:社团是网络中的结点以及由这些结点之间所连接的边组成的结构,网络社团结构具有相同社团结点互相连接紧密,不同社团节点之间连接稀疏的特点。复杂网络社团的检测方法旨在揭示出复杂网络中真实存在的社团结构。现有技术提出了复杂网络社团结构的探测方法,例如201010613184.0、201010165418.X和201210154812.2,这些方法基本都是从网络节点的度出发讨论社团结构的检测问题,但是,这些方法存在一些不足,其一是算法的复杂度往往过高,难以满足大规模网络的运算需要;其二,对于最优的社团数目,并没有特别明确的指标予以判别;其三,所得到的结果可能是不稳定的,即对于原有的网络,一些微小连接的改变可能导致结果发生巨大的变化。这些不足将可能限制其在工程应用中功能的发挥,需要新的技术方案予以弥补。

发明内容
为了更好地处理网络的社团检测问题,使得其对于有权重的网络也是适用的,本发明旨在提出一种基于信息理论的网络社团划分方法,使之可以处理一大类含有权重的网络社团检测问题,并具有较好的社团结构检测效果,是一种新的和高效的处理关联数据的技术,以期更好地为生产和生活实践服务。为达到以上的目的和实践需要,本发明“基于信息理论的网络社团检测方法”采用如下的技术方案实现,共分为六个步骤:
A、根据网络的结构和权重信息,对其节点编号,得到该网络的概率矩阵:
该概率矩阵具体的制作方法为:
设定一个网络中有个节点,对其进行I到的编号,得到一个nXn的概率矩阵,第i行和第J.列上的元H j)为:
权利要求
1.基于信息理论的复杂网络社团检测方法,其特征在于所述复杂网络社团检测方法包括如下步骤: A、根据网络的结构和权重信息,对其节点编号,得到该网络的概率矩阵; B、根据信息理论的方法得到合并两点为一个社团时的信息损失; C、找到信息损失最小的两个节点进行合并,并更新原有网络的节点集; D、根据更新后的节点集,计算网络的模块度系数,计算方法为:e靡孤 其中,iW是第A个社团内部连接的权重和,取是第A个社团所有包含的节点的权重和,£是网络中全部节点的权重和,是现有网络中的社团个数; E、重复B、C和D的 过程,直到社团个数为I; F、比较以上计算出的^值,最大的那个^值对应的社团数及相应的社团结构即为该数据处理技术检测到的最优社团结构。
2.根据权利要求1所述的基于信息理论的复杂网络社团检测方法,其特征在于步骤A中,所述概率矩阵具体的制作方法为: 设定一个网络中有个节点,对其进行I到的编号,得到一个的概率矩阵,第i行和第J.列上的元素P (i,j)为..PiU) =;当_ _时,%7表示节点i和节点J.u jM.之间的权重,当f =)时,Wij表示表示节点i的度。
3.根据权利要求1所述的基于信息理论的复杂网络社团检测方法,其特征在于所述步骤B的具体步骤为: 假设u和r为网络中的两个节点,且, U5CV,合并第u和第^个节点后造成的信息损失为: Ai(KV) = /<u)2^pC/| ) logI Kv)免K/1 V) log,j~tjjlPL/IKv}) 其中,切是合并后的条件概率,计算为: PO K V = ^ ^ pU\^)+pU\ v) PW+PWp(u)+P(V)
4.根据权利要求1所述的基于信息理论的复杂网络社团检测方法,其特征在于所述步骤C的具体步骤如下:比较两两节点间的信息损失,找到最小的两个节点进行合并,形成一个新的节点,从原有的节点集中删除这两个节点,加入这两个节点合并后形成的新的节点,更新原有网络的节点集。
全文摘要
基于信息理论的复杂网络社团检测方法,涉及一种基于信息理论发现复杂网络中社团结构的方法。本发明的检测方法包括如下步骤步骤A、对网络节点进行编号,根据网络的结构和权重信息,制作该网络的概率矩阵;B、根据信息理论的方法得到合并两点为一个社团时的信息损失;C、找到信息损失最小的两个节点进行合并,并更新原有网络的社团结构;D、计算更新结构后网络的模块度系数;E、重复B、C和D的过程,直到社团个数为1;F、找出最大的模块度系数对应的社团数及相应的社团结构。本方法的有益效果是结果客观、稳定,可用于含有权重的网络结构,有严格的社团数选取标准,计算耗时少,适用于大规模网络。
文档编号G06F17/30GK103164533SQ20131012090
公开日2013年6月19日 申请日期2013年4月9日 优先权日2013年4月9日
发明者李永立, 吴冲, 王子政, 郑宇宁 申请人:哈尔滨工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1