一种基于节点相似度的有向网络化简系统的制作方法

文档序号:9887768阅读:316来源:国知局
一种基于节点相似度的有向网络化简系统的制作方法
【技术领域】
[0001] 本发明涉及复杂网络计算技术领域,尤其涉及一种基于节点相似度的有向网络的 网络化简系统。
【背景技术】
[0002] 在现实生活中,包括生物、基因、社交、通信等个体和个体之间通常会以有向的方 式建立联系,形成复杂的有向网络。社团发现是复杂网络研究的一个分支,通过分析网络特 征,发现网络中的社团结构及其相互作用的关联性,从而打开了理解群体性复杂行为的新 视角。其成果可用于用户群体行为分析、推荐系统和基因功能关联性挖掘等相关领域。
[0003] 然而,随着科技的发展,大数据时代的到来,数据规模呈现出爆炸性增长趋势,网 络规模越来越大,而通常社团发现算法的时间和空间复杂度较高,很难直接应用于大规模 复杂网络的社团发现。
[0004] 针对大规模网络的社团发现问题,目前有两个解决思路:
[0005] (1)利用主流的并行计算技术和大数据分析平台,将算法进行并行化,利用多部计 算机的计算资源执行计算任务。
[0006] (2)大型网络中的节点和连边重要性不同,可以通过不同的策略算法将大型网络 进行化简,来避免针对整个数据集进行采集和测量,只保留网络主干,从而提高下一步社团 发现的效率;
[0007] 利用并行计算提高算法效率的方法需要有并行计算环境的支撑,并且算法必须是 可被并行化的,这两个缺点使得该方法门槛和成本较高,且适用性不高;
[0008] 目前主流的网络化简方法以采样算法为主,如基于图遍历的采样算法和基于随机 游走的采样算法。采样算法主要考虑保证整个网络宏观层面在采样前后不丢失属性信息, 但是会造成网络局部节点的丢失,即产生离群节点。有研究人员提出了一个根据节点相似 度排序的网络化简方法,将网络中的非重要连边剔除,已到达减少网络规模的目的,但是只 能用于无向网络的化简。

【发明内容】

[0009] 鉴于上述的分析,本发明旨在提供一种有向网络化简系统,用以解决大规模有向 网络的网络化简;不损失节点信息,且不会因删除连边产生离散节点。
[0010] 本发明的目的主要是通过以下技术方案实现的:
[0011] -种基于节点相似度的有向网络化简系统,包括相似度计算模块,入边筛选模块、 出边筛选模块及输出模块;
[0012] 所述相似度计算模块用于对原始网络G中每一节点i的入边相似度及出边相似度 进行计算;
[0013] 所述入边筛选模块用于对每一节点i的所有入边的相似度进行从高到低排序,保 留相似度大于阈值的连边;
[0014] 所述出边筛选模块用于对每一节点i的所有出边的相似度进行从高到低排序,保 留相似度大于阈值的连边;
[0015] 所述输出模块用于输出化简后的网络。
[0016] 进一步,所述相似度计算模块包括入边相似度计算子模块及出边相似度计算子模 块;所述入边相似度计算子模块用于计算原始网络G中的任一节点i和原始网络G中指向节 点i的集合Ad j+( i)中的任一节点j的相似度。
[0017] 进一步,所述入边筛选模块中应用的阈值与控制网络化简程度的调节参数的有 关,保留相似度大于阈值的连边,具体为对节点i的所有入边的相似度进行从高到低排序, 保留前(< Γ条边,< 为节点i的入度。
[0018] 进一步,所述出边相似度计算子模块用于计算原始网络G中的任一节点i和原始网 络G中节点i所指向的其他节点的集合Adr(i)中的任一节点j的相似度。
[0019] 进一步,所述出边筛选模块中应用的阈值与控制网络化简程度的调节参数^有 关,保留相似度大于阈值的连边,具体为对节点i的所有出边的相似度进行从高到低排序, 保留前以y' :条边,< 为节点i的出度。
[0020] 进一步,所述相似度计算模块所采用的计算方式为
[0021] Sim(i\ j) - , (/"./') + 5///7,,.(/, /) + SiwJL j)) ,
[0022] 其中,Simcc(i,j)为共引关系节点的相似度、Simtr(i,j)为具有耦合关系节点的相 似度、Sim br(i,j)为具有传递关系节点的相似度。
[0023]进一步,所述共引关系节点的相似度计算公式为:
[0024]
[0025] 耦合关系节点的相似度计算公式为:
[0026]
[0027]传递关系节点的相似度计算公式为:
[0028]
[0029] 式中,Adj+(i)表示原始网络G中指向节点i的集合,Adjli)表示原始网络G中节点i 所指向的其他节点的集合;Adj+(j)表示原始网络G中与节点j相连,且指向节点j的所有节 点的集合,Adjl j)表示原始网络G中与节点j相连,且被节点j指向的所有节点的集合。
[0030] 进一步,控制网络化简程度的调节参数ei、Θ2的取值范围为(0,1)。。
[0031]本发明有益效果如下:
[0032] (1)该系统适用于大规模有向网络的网络化简;
[0033] (2)采用该系统进行网络化简不损失节点信息,且不会因删除连边产生离散节点;
[0034] (3)经该系统化简的网络,在进行社团发现时,其结果与不经处理就进行社团发现 的网络精度偏差不大;
[0035] (4)通过该系统处理后的网络,在进行社团发现时能极大的提高计算效率
[0036] 本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0037] 附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图 中,相同的参考符号表不相同的部件。
[0038]图1为本发明结构框图
[0039] 图2为采用本发明所进行的社团发现过程图;
[0040] 图3(a)为共引关系节点示意图;
[0041 ]图3(b)为耦合关系节点示意图;
[0042]图3(c)为传递关系节点示意图;
[0043]图4为采用本发明所进行网络化简前后对比示意图。
【具体实施方式】
[0044]下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并 与本发明的实施例一起用于阐释本发明的原理。
[0045] 本发明的目的是提供一种基于节点相似性计算的网络化简系统,作为复杂网络社 团发现的预处理阶段,使用该系统可以在对有向网络进行化简的同时,保证社团发现精确 度,从而提升网络社团发现的效率。
[0046] 如图1所述,该系统包括相似度计算模块,入边筛选模块、出边筛选模块及输出模 块;相似度计算模块包括入边相似度计算子模块及出边相似度计算子模块;入边相似度计 算子模块用于计算原始网络G中的任一节点i和原始网络G中指向节点i的集合Adj+(i)中的 任一节点j的相似度。出边相似度计算子模块用于计算原始网络G中的任一节点i和原始网 络G中节点i所指向的其他节点的集合Adjli)中的任一节点j的相似度。入边筛选模块用于 对每一节点i的所有入边的相似度进行从高到低排序,保留相似度大于阈值的连边;入边筛 选模块中应用的阈值与控制网络化简程度的调节参数 ei有关,保留相似度大于阈值的连 边,具体为对节点i的所有入边的相似度进行从高到低排序,保留前(4+)81条边,<为节点i 的入度。出边筛选模块用于对每一节点i的所有出边的相似度进行从高到低排序,保留相似 度大于阈值的连边;输出模块用于输出化简后的网络;出边筛选模块中应用的阈值与控制 网络化简程度的调节参数e2有关,保留相似度大于阈值的连边,具体为对节点i的所有出边 的相似度进行从高到低排序,保留前Γ条边,4为节点i的出度。
[0047] 该系统具有良好的扩展性,可以和主流的社团发现相结合使用,从而提高社团发 现过程的整体效率。其整个过程如图2所示。本发明的系统主要内容涵盖流程1至5,为社团 发现的预处理部分,6至8部分为目前现有的成果,主要为表明整个流程的完整性和化简方 法的通用扩展性。
[0048] 通过一系列的计算,得出网络中连边关系的重要性,然后根据网络结构的特性将 部分非重要连边删除,从而达
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1