基于节点支配能力相似性的功能模块检测方法

文档序号:6549761阅读:174来源:国知局
基于节点支配能力相似性的功能模块检测方法
【专利摘要】本发明公开了一种基于节点支配能力相似性的功能模块检测方法,主要解决现有技术无法有效地在有向网络数据中挖掘稀疏功能模块的问题。其技术方案是:基于网络的最大匹配分析节点间有向的控制关系;用节点控制区域和观测区域刻画与稠密性无关的、节点定向支配网络的能力大小;从支配系统控制过程的角度衡量节点的功能相似性,给出基于马尔科夫随机抽样过程的最大匹配枚举方法,计算支配能力的相似性;将支配能力相似性用到有向网络的聚类分析中,检测出与有向控制关系相关的、稀疏的功能模块。本发明具有检测结果不受数据的权重噪声影响的优点,可为有向、稀疏网络数据中的知识发现提供工具支持。
【专利说明】基于节点支配能力相似性的功能模块检测方法
【技术领域】
[0001]本发明属于数据挖掘领域,特别涉及有向复杂网络中基于节点支配能力相似性的功能模块检测方法,可用于基于大数据的知识发现等。
【背景技术】
[0002]通常在真实网络数据中,本质上隶属于同一模块的个体具有高度相似的功能,例如,社会网络中,同一社团的个体通常具有相同兴趣爱好;生物网络中,同一复合体中的蛋白质共同参与完成某个特定生物过程;技术网络中,同一组页面通常表达相近的主题。采用分层聚类的方法来发现网络中的功能模块时,第一步就是要计算网络中各个节点之间的相似性,然后通过凝聚或分裂过程将相似性高的节点划分到相同的模块中。
[0003]典型的相似性度量包括如下几类:
[0004]1.共享邻居
[0005]这类指标认为两个节点x、y的共同邻居个数越多,其相似值Sxy越大。基于这种思想的相似性度量指标有十多种不同的变形,这里给出最常见的基于Jaccard系数的方法:
【权利要求】
1.一种基于节点支配能力相似性的功能模块检测方法,包括如下步骤: (1)数据处理: (Ia)输入网络数据,用有向图G(V,L)对其建模,其中V为节点的集合,L为连接节点的边的集合; (Ib)设初始时刻t = O,计算有向图G (V,L)的最大匹配Mt ; (2)基于最大匹配Mt,构造网络的控制格局和观测格局: (2a)用最大匹配Mt将有向图G (V,L)划分成不相交的径、环结构; (2b)检索有向图G(V,L)中所有从径的非顶节点指向环的边,组成控制附加边集合CL ; (2c)用Mt U CL中的边连接节点集合V,得到一个能反映出控制所有节点状态方式的子图CF (V,Mt U CL),作为网络的控制格局; (2d)对最大匹配Mt反向,得到反向最大匹配M/,对有向图G(V,L)的边的集合L反向,得到反向边的集合Li和相应的反向图Gi (N, V ),用该反向最大匹配M/将反向图G' (V,L')划分成不相交的径、环结构; (2e)检索反向图G' (N, V )中所有从径的非顶节点指向环的边,组成观测附加边集合OL ; (2f)用M/ U OL中的边连接节点集合V,得到一个能反映出观测所有节点状态方式的子图OF (V, Mt' U 0L),作为网络的观测格局; (3)计算节点控制区域和观测区域: (3a)对任意节点i,将其在子图CF (V,Mt U CL)上的可达节点集合作为节点i的控制子空间CSi (Mt),并入节点i的控制区域CSi ; (3b)对任意节点i,将其在子图OF(V,Mt, U 0L)上的可达节点集合作为节点i的观测子空间OSi (M/ ),并入节点i的观测区域OSi ; (3c)对所有节点的控制区域大小和观测区域大小累加求和,得到t时刻节点影响能力之和 et = ZiIcsiKxi1si ; (4)枚举有向图G(V,L)的最大匹配: (4a)将t时刻节点影响能力之和Θ t与t-Ι时刻节点影响能力之和θ η相比,如果节点影响能力之和的增长率在连续的Ψ个时刻中都小于阈值ε,执行步骤(5),否则,执行步骤(4b),其中 Ψ = 50,阈值 ε = 0.000001 ; (4b)基于最大匹配Mt采用马尔科夫随机过程抽样,生成新的最大匹配Μ’; (4c)设置风,令t = t+1,返回步骤(2) (5)计算节点支配能力相似性: (5a)对任意节点1、j,计算其控制区域CS1、CSj的Jaccard系数作为控制能力相似性
C^nCSj值:
2.根据权利要求1所述的方法,其中所述步骤(Ib)中计算有向图G(V,L)的最大匹配Mt,采用匈牙利算法或Hopcroft-Karp算法,该最大匹配Mt是有向图G (V, L)中边的子集合,满足C= L,最大匹配Mt中任意两条边都不共享起始端点和终止端点,且最大匹配Mt的势MtI的值最大。
3.根据权利要求1所述的方法,其中步骤(4b)所述的基于最大匹配Mt采用马尔科夫随机过程抽样,生成新的最大匹配1厂’,按如下步骤进行: (4bI)设置有向图(T (V,L) = G(V,L),将有向图(T(V,L)中属于最大匹配Mt的边作为匹配边,不属于最大匹配Mt的边作为非匹配边,将最大匹配Mt加入到t时刻的候选最大匹配集合凡中; (4b2)随机选择属于最大匹配Mt的从节点i指向节点j的一条匹配边lu,并在有向图G*(V, L)中删除该匹配边I。; (4b3)在有向图(T(V,L)中搜索起始于节点i的可增广路径,如果搜索不到该可增广路径,执行步骤(4b6),否则,执行步骤(4b4); (4b4)把起始于节点i的可增广路径中的非匹配边标记为匹配边,把该可增广路径中的匹配边标记为非匹配边,然后将所有匹配边作为候选的最大匹配M%加入到t时刻的候选最大匹配集合中; (4b5)从候选的最大匹配Μ*中找到起始于节点i的边,并在有向图G*(V,L)中删除该起始于节点i的边,返回步骤(4b3); (4b6)从t时刻的候选最大匹配集合凡中随机选择一个最大匹配作为新的最大匹配M';ew ο
【文档编号】G06F19/00GK104021199SQ201410267391
【公开日】2014年9月3日 申请日期:2014年6月16日 优先权日:2014年6月16日
【发明者】高琳, 王炳波, 郭杏莉, 王玙, 邓岳 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1