一种社会网络中的邻域跟随社区发现方法

文档序号:8381568阅读:434来源:国知局
一种社会网络中的邻域跟随社区发现方法
【技术领域】
[0001] 本发明涉及社会网络技术领域,特别是一种社会网络中的邻域跟随社区发现方 法。
【背景技术】
[0002] 从社会网络中检测社区结构是社会网络分析中的一项重要任务,无论是理论上还 是实际应用中都具有十分重要的意义。通过挖掘网络中的社区结构,能够发现网络中隐含 的组织结构信息、社会功能以及社区成员之间隐含的有趣属性,如共同爱好等。通过研宄社 会网络中社区之间、个体之间以及个体与社区之间的关系,可以挖掘出大量有价值的信息, 可应用于许多领域。
[0003] 针对社区发现,已经出现了很多经典的方法。总体上,社区发现的经典方法包括基 于图分割、层次聚类、模块度优化、标签传播、极大团、边图划分、种子节点扩展、模糊聚类的 社区发现方法。 ΛΖ方法是较早出现的一种社区发现方法,其优化目标为极小化社区间连接数目与社区 内连接数目之差,并使用贪心策略寻找最优的社区划分。ΛΖ方法的主要缺点在于需要社区 数和社区的平均规模作为算法的输入参数,且对输入参数很敏感,算法的时间复杂度也较 尚。
[0004] 6?? Girvan和Newman提出的基于边介数的分裂式层次聚类方法。由于边介数 的计算代价较大,0??法的时间复杂度达到久? 2/?),其中《为边数,为节点数,不适用于 大规模网络。为解决大规模网络的应用问题,Newman等在O韵基础上提出了 /???法。/W 方法提出了模块度作为网络划分质量的标准,设计了一种基于模块度的凝聚式层次聚类方 法,其时间复杂度为久皿)。模块度为研宄人员提供了一种用于选择网络划分的目标函数, 研宄人员将贪心策略、模拟退火、极值优化、禁忌搜索、整数规划等多种优化策略应用于模 块度优化,模块度优化是目前社区发现的主流方法,典型方法包括fiW、似、況?以及 整数规划法,但是存在分辨率问题,难以发现小规模社区,而且由于模块度优化的搜索空 间非常大,当应用于大规模网络时,方法的结果也变得很不可靠。
[0005] 基于信息传播的思想,Raghavan等提出了标签传播方法Z/^,考虑社会网络的 结构特征和信息传播特性,通过基于局部搜索的标签更新,经迭代收敛后将具有相同标签 的节点聚合到同一社区。1/?的最大优点在于无需参数,收敛速度快,具有线性时间复杂度 〇0?),适用于大规模社会网络;但由于标签更新规则的随机性,的稳定性和精度较差。 FMWu-Huberman)方法将复杂网络建模为电路系统,网络连接看作是具有电阻的线路,不同 位置的网络节点具有不同电位势,通过启发式规则寻找最大位势差以区分不同的社区。M 方法具有近似线性的时间复杂度,但是需要社区数目和社区规模作为输入参数。Rosvall 等提出了 一种基于最小化随机游走平均编码长度模型的聚类方法//?/〇#卻。的优 点是社区发现速度快、准确率高、无需社区数量作为输入参数,但是当社区结构趋向不清晰 时,聚类效果下降明显。
[0006] 上述社区发现方法通常存在参数敏感或者时间复杂度高的问题,难以应用于大规 模复杂网络的社区发现,综上,现有的社会网络社区发现方法从发现的社区结构质量以及 时间效率上看都尚有很大的提升空间。面对大规模社交网络的场景,现有方法无论实在效 果和效率上都难以满足要求。

【发明内容】

[0007] 本发明的目的在于提供一种社会网络中的邻域跟随社区发现方法,该方法有利于 提尚社区检测的精度和效率。
[0008] 为实现上述目的,本发明的技术方案是:一种社会网络中的邻域跟随社区发现方 法,包括以下步骤: 步骤A :读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络 图; 步骤B :根据社会网络图,遍历社会网络图中的节点,将所有节点的角色初始化为未确 定; 步骤C :根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系; 步骤D :根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划 分至同一社区。
[0009] 进一步地,所述步骤C中,确定节点间的跟随关系,包括以下步骤: 步骤Cl :对于所遍历的节点A按照最可信赖邻域跟随规则选择节点釦 步骤C2 :设置节点Z的社区跟随目标为节点么并更新节点础勺社区跟随者数量,即以 节点^为社区跟随目标的节点数量; 步骤C3 :若节点Z的角色尚未确定,则将节点Z的角色设置为社区跟随者; 步骤C4 :判定节点A是否满足作为社区领导者的条件,如果满足,设置节点A的角色为 社区领导者;反之设置节点左的角色为社区跟随者; 步骤C5 :重复步骤C1~C4,直到社会网络图中的所有节点均已遍历。
[0010] 进一步地,所述步骤Cl中,采用的最可信赖邻域跟随规则为:获取节点Z的邻域中 社区跟随节点最多的节点作为节点Z的社区跟随目标,定义为:
【主权项】
1. 一种社会网络中的邻域跟随社区发现方法,其特征在于,包括以下步骤: 步骤A:读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络 图; 步骤B:根据社会网络图,遍历社会网络图中的节点,将所有节点的角色初始化为未确 定; 步骤C:根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系; 步骤D:根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划 分至同一社区。
2. 根据权利要求1所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所 述步骤C中,确定节点间的跟随关系,包括以下步骤: 步骤C1 :对于所遍历的节点按照最可信赖邻域跟随规则选择节点釦 步骤C2 :设置节点z的社区跟随目标为节点么并更新节点础勺社区跟随者数量,即以 节点^为社区跟随目标的节点数量; 步骤C3 :若节点z的角色尚未确定,则将节点z的角色设置为社区跟随者; 步骤C4 :判定节点A是否满足作为社区领导者的条件,如果满足,设置节点A的角色为 社区领导者;反之设置节点左的角色为社区跟随者; 步骤C5 :重复步骤C1~C4,直到社会网络图中的所有节点均已遍历。
3. 根据权利要求2所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所 述步骤C1中,采用的最可信赖邻域跟随规则为:获取节点z的邻域中社区跟随节点最多的 节点作为节点^的社区跟随目标,定义为:
其中私表示节点所选择的社区跟随目标,AfeigA/wrAoot/U)表示节点x的 邻域,定义为:
其中#U)为节点^的邻居节点集合,由与节点^有边相连的所有节点构成,定义为:
其中分别为社会网络图邮]节点集合与边集合; /b#示节点jl的社区跟随节点数,即节点jl的邻域中,以节点j为社区跟随目标的节 点数量,定义为:
其中示节点J前邻域中,以节点J为社区跟随目标的节点集合,即与节 点J之间存在直接邻域跟随关系的节点集合,宙义为:
其中尸4 _/表示节点与节点J之间存在直接邻域跟随关系,定义为:
节点Z的邻域包含节点本身,因此节点Z的社区跟随目标可以是节点Z本身;如节点z的邻域中有多个节点满足跟随节点数最多的条件,则从中选择度最大的节点作为节点Z的 社区跟随目标;如仍有多个节点满足度最大的条件,则从中随机选择一个节点作为节点Z 的跟随目标。
4. 根据权利要求3所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,定 义节点在社区中的两种角色:社区领导者和社区跟随者,社区由不同角色的节点以及节点 间的跟随关系构成,一个社区由一个社区领导者节点和其余的社区跟随者节点构成,社区 内的每个节点都直接或间接地跟随社区领导者节点,一个由社区领导者节点7表示的社区 定义为:
其中:/表示节点^与节点7之间存在直接邻域跟随关系,即节点x直接跟 随社区领导者节点7, /表示节点I与节点7之间存在间接邻域跟随关系,即 节点X不属于7的邻域,但两个节点间存在中间节点,构成一个从到/的跟随链:,Y^ / - ?,, ^ ,即节点4司接跟随社区领导者节点厶记为:r 表示 由社区领导者节点7表示的社区包括社区领导者节点自身。
5. 根据权利要求4所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所 述步骤B4中,判定节点A是否满足作为社区领导者的条件定义为:
即给定参数r(0〈K1),刍节点雄]用笆为社凶跟随有时,右M4彡r,则将节点础勺 角色设置为社区领导者;若节点^为社区领导者但Z仏〈r,则重新设置节点左的角色为社 区跟随者; 其中Z仏表示节点左的领袖质量,为节点左的社区跟随节点数与节点左的社区跟随目 标的社区跟随节点数的比值,以反映节点独立于其社区跟随目标的能力,定义为:
其中为节点左的社区跟随节点数为节点左的社区跟随目标的社区跟 随节点数。
6. 根据权利要求5所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所 述步骤D中,根据节点间的跟随关系得到网络社区,具体包括以下步骤: 步骤D1 :对于所遍历的节点寻找节点z所跟随的社区领导者节点7; 步骤D2 :获取由社区领导者节点/所代表的节点集合,即由社区领导者节点/所代表 的社区,将节点r添加到该集合中; 步骤D3 :重复步骤D1~D2,直到社会网络图中的所有节点均已遍历。
7.根据权利要求6所述的一种社会网络中的邻域跟随社区发现方法,其特征在于,所 述步骤D1中,寻找节点z所跟随的社区领导者节点/的具体方法如下:对于所遍历的节点 A若节点^的角色为社区领导者,则社区领导者节点7即节点z本身;若节点的角色为社 区跟随者,则沿着节点^到社区领导者节点的跟随链上溯,直到找到社区领导者节点,即在 跟随链上找到角色为社区领导者的节点,将节点^所跟随的社区领导者节点7设置为该节 点;若在上溯过程中发现某个节点的社区跟随目标为节点z本身,即出现跟随环路情况时, 则停止上溯,将节点^的角色设置为社区领导者节点,即节点^的社区领导者节点/设置为 节点z本身。
【专利摘要】本发明涉及社会网络技术领域,特别是一种社会网络中的邻域跟随社区发现方法,包括以下步骤:步骤A:读取社会网络数据,构造以社会网络用户为节点,用户关系为边的社会网络图;步骤B:根据社会网络图,遍历社会网络图中的节点,确定节点间的跟随关系;步骤C:根据节点间的跟随关系,遍历社会网络图中的节点,将跟随同一节点的节点划分至同一社区,得到社会网络的社区结构。该方法可提高社区检测的精度和效率,且具有接近线性的时间复杂度,能够快速有效地挖掘社会网络中的社区结构,可应用于目标群体挖掘、精确营销等领域。
【IPC分类】G06Q50-00
【公开号】CN104700311
【申请号】CN201510046397
【发明人】陈羽中, 牛玉贞, 郭文忠, 施松
【申请人】福州大学
【公开日】2015年6月10日
【申请日】2015年1月30日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1