一种基于局部相似度的社区挖掘方法

文档序号:6544694阅读:301来源:国知局
一种基于局部相似度的社区挖掘方法
【专利摘要】本发明公开了一种基于局部相似度的社区挖掘方法,该方法通过网络结构本身关系的紧密与否发现关系紧密的局部区域,将这些区域视为社区的雏形赋予标签,然后根据投票原则采用标签传播的办法再扩展、调整这些区域形成社区。本发明不需要任何人工参数,直接通过网络本身结点联系的紧密与否的结构性质得到社区结构。
【专利说明】一种基于局部相似度的社区挖掘方法
【技术领域】
[0001] 本发明涉及一种社区挖掘方法,具体地说,具体涉及一种基于局部相似度的社区挖掘方法。
【背景技术】
[0002]社会网络是由一些个人或组织以及它们之间的联系所构成的集合。20世纪90年代,随着网络技术的迅猛发展,特别是近几年SNS(socialnetworkingsystem)的涌现,越来越多的个人用户加入到由这些虚拟关系所构建的网络中,社会网络的研究得到了逐步加强。现今涌现出了大量的社会网络平台,包括网络论坛(如天涯社区,CSDN,小虫网等),聊天室(如新浪聊天室),校园BBS系统(如水木清华,一塌糊涂等),社会关系网站(如Facebook等),博客(如Myspace,Twitter),即时通讯网络(如MSN、QQ)等等,积累了海量的、不断更新的社会网络数据。这些社会网络是人们现实生活直接或间接的反应,并进一步影响了人们的社会行为,例如网站中互相评论、标记和连接日志的博友是现实生活中的好友,或者可能发展为现实生活中的好友,维基百科(Wikipedia)已经成为互联网上最大、最流行的参考书,IMDB论坛上的影片评论成为观众购票观影的指南。
[0003]社区是复杂的社会网络的基本特征之一。将社会网络抽象成图,将参与的对象表示成点,对象之间的关系表示成线,则社区为一个子图,该子图内部的关系比较紧密,子图与子图外部(其他子图)之间的关系相对稀疏。物理类聚,人以群分,认识网络中的社区结构,有助于理解复杂的网络结构中组织架构,进而能够理解对象之间关系的相互影响和组织功能。目前社区挖掘方法往往从某些角度定义一个描述社区优劣的定量指标,然后利用贪心算法,将初始网络看成一个社区不断拆分或将初始网络中每个结点看成是一个社区不断合并,最终使得这个指标尽可能达到最优。也有一些方法需要预定义参数(比如社区个数等阈值)和某种关系度量函数对网络结点进行分类得出社区结构。总而言之,这些方法事实上限制了社区形成的过程、形状和结构。

【发明内容】

[0004]为了克服现有技术中存在的缺陷,本发明提供一种基于局部相似度的社区挖掘方法,该方法通过网络结构本身联系的紧密与否发现关系紧密的局部区域,将这些局部区域视为社区的雏形赋予初始标签,然后根据投票原则采用标签传播的办法再扩展、调整这个区域形成社区。不需要任何人工参数,直接通过网络本身结点联系的紧密与否的结构性质得到社区结构。
[0005]为了叙述方便,先对基本概念进行形式化定义。设网络G= (V,E),其中V =Iv1, V2,......VnI为结点集合,E= {θ!, e2,......ej为边集,其中ei e VXV。Vi的邻居记








η
SN(Vi)JPN(Vi) = IvjIwij > 0} ,Vi 的星型邻域 St(Vi) = {vj UN(Vi)Q 记火(ν;) = Ση’"








7=1
表示结点Vi关联的边权值之和,定义为Vi的度。[0006]其技术方案如下:
[0007]—种基于局部相似度的社区挖掘方法,包括以下步骤:
[0008](I)根据网络的邻接矩阵计算各结点对的相似度。
[0009]那么结点对(Vi,Vj)的相似度计算公式如下:
【权利要求】
1.一种基于局部相似度的社区挖掘方法,其特征在于,包括以下步骤: (1)根据网络的邻接矩阵计算各结点对的相似度; (2)如果某结点对的相似度是其邻接结点中相似度最大的,这找出这些结点对构成紧密点对; (3)若某些结点构成的集合,其中的某个结点总有另外一个在集合中的结点与之构成紧密点对,并且任何一个在里面的结点,与之构成紧密点对的另外一个结点均不在集合之外,这些结点就构成了紧密微社团;找出所有这些紧密微社团; (4)给所有的紧密微社团赋予初始标签,同一个紧密微社团中的结点初始标签相同,紧密微社团之间的初始标签不同; (5)根据投票原则进行标签传播,直到任何结点的标签均不能更新; (6)得到了最终的社团结构。
2.根据权利要求1所述的基于局部相似度的社区挖掘方法,其特征在于: (1)相似度的计算方法 设网络 G = (V, E),其中 V = Iv1, V2,......vn}为结点集合,E = {e1; e2,......em}为边集,其中ei e VXV ;Vi的邻居记为N(Vi),即N(Vi) = IvjIwij > 0} ,Vi的星型邻域St(Vi)={vj U N(Vi);记&(0 = 表示结点Vi关联的边权值之和,定义为Vi的度; 那么结点对(Vi, Vj)的相似度计算公式如下:
【文档编号】G06F17/30GK103927371SQ201410167205
【公开日】2014年7月16日 申请日期:2014年4月24日 优先权日:2014年4月24日
【发明者】翁伟, 朱顺痣, 曾志强, 张念, 肖蕾, 马樱 申请人:厦门理工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1