生物分子网络拓扑结构比对的自适应方法

文档序号:9261518阅读:526来源:国知局
生物分子网络拓扑结构比对的自适应方法
【技术领域】
[0001] 本发明设及一种生物分子网络拓扑结构比对的自适应方法。
【背景技术】
[0002] 生物分子网络是生物体内各种分子通过相互作用来完成各种复杂的生物功能的 一个复杂网络。复杂网络的比对问题是一个图的全局比对问题,设及到大量的计算,其隐含 的子图同构问题已被证实是一个NP完全问题(Non-deterministic化lynomial的问题), 也即是多项式复杂程度的非确定性问题。目前,普遍采用图来表示生物分子网络,并W图论 的方法来研究生物分子网络结构,图中的节点表示生物分子,图中的边表示生物分子之间 的调控、相互作用各种关系。
[0003]目前,生物分子网络仅用图论的方法来研究生物分子网络的比对还面临着绪多的 问题,主要包括:
[0004] (1)生物分子网络比对主要是基于相似矩阵进行最优匹配,而该最优匹配方法不 适合生物网络的比对问题,该方法在匹配中计算复杂,耗时间长;
[000引 似在生物分子网络比对中,节点的拓扑结构是不同的,匹配节点对其邻居节点匹 配的影响强弱不同,现有的技术没有进行自适应的计算。

【发明内容】

[0006] 本发明的目的在于克服现有技术存在的不足,提供一种生物分子网络拓扑结构比 对的自适应方法,该方法对两个不同物种的复杂生物分子网络拓扑结构进行比对,能找到 不同生物分子网络之间的最优匹配,降低自适应的计算时间;该方法在网络变化后,仍可W 找到原始生物分子网络的比对,得到更优的比对结果。
[0007] 为达到上述目的,本发明的构思是;首先使用生物分子网络间的生物序列相似系 数和拓扑结构相似系数,迭代计算两个生物分子网络中每一对生物分子的节点与节点之间 的相似系数,使用匈牙利算法和贪屯、算法进行匹配,然后根据第一生物分子网络Ga中的节 点和第二生物分子网络咕中的节点之间的映射矩阵M\使用节点对的邻居节点之间的相似 性,自适应地构建更新相似矩阵SN最后,根据迭代的连续相邻的生物分子的相似矩阵SW 和生物分子的Sk相似矩阵Sk匹配的比较,判断是否结束运算,结束时,获取结果最优的生物 分子网络的相似矩阵SW的相似参数。
[000引根据上述发明构思,本发明采用下述技术方案:
[0009] 生物分子网络拓扑结构比对的自适应方法,其特征在于该方法的具体操作步骤如 下:
[0010] a.构建两个分子网络的初始相似矩阵S°,该两个分子网络分别记为第一生物分子 网络Ga和第二生物分子网络Ge,所述的初始相似矩阵s°中的S° (a。bj.)表示节点和节点 bi之间的相似系数,其中aiGGA,bj.GGb表示第一生物分子网络Ga中的节点,bj.表示第 二生物分子网络Gb中的节点;
[0011]b.根据当前迭代步的相似矩阵s\使用匈牙利算法、贪屯、算法对第一生物分子网 络Ga中的节点和第二生物分子网络Ge中的节点进行匹配,获得GA中的节点和Ge中的节点 之间的映射矩阵M\其中k表示迭代步数,初始时k= 0 ;其中每一个元素Mk(a。bj.)为1或 0,1表示节点a;和节点bi匹配,0则表示不匹配;
[001引C.根据步骤b所得的映射矩阵M'S使用节点的邻居节点之间的相似性,自适应地 更新相似矩阵Sk,然后结合生物分子的初始生物相似性和生物分子在各自网络中的拓扑相 似特征,计算得到下一生物分子的相似矩阵SW;
[0013] d.计算每一迭代步的映射矩阵Mk的得分SS\然后计算生物分子的相似矩阵sw 和Sk之间对应元素差值的绝对值,判断是否结束迭代计算,若生物分子的相似矩阵SW和 Sk之间对应元素的差值的绝对值的最大值小于阔值A,A体现允许的计算误差,则结束计 算,取第m(0 < =m< =k)步的映射矩阵r为最终映射结果,其中m需满足该步的映射矩 阵r的得分SS-最大;否则,若生物分子的相似矩阵sw和Sk之间对应元素的差值的绝对值 的最大值不小于阔值A,则不结束计算,返回步骤B到步骤F继续进行计算,直到前后两次 生物分子的相似矩阵SW和Sk之间对应元素的差值的绝对值的最大值小于设定的阔值A, 则结束计算;
[0014] 根据权利要求1所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所 述的步骤b的具体方法为:
[0015] b-1、遍历Ga的每一个节点,如果该个节点在网络Gc中的相似节点数不小于一个阔 值该阔值为一经验值,就把该个节点在相似矩阵Sk中对应的行归入到匈牙利矩阵Hk中,否 则归入贪屯、矩阵Gk中;
[0016]b-2、使用匈牙利算法处理匈牙利矩阵化并在Gk中标记那些已经匹配的列;如果 在有效的时间内获得结果,则进行下一步,否则结束处理,把匈牙利矩阵Hk合并到贪屯、矩阵 Gk中;
[0017] b-3、使用贪屯、算法处理贪屯、矩阵Gk中由那些没有被标记的列构成的矩阵,和b-2 中匈牙利矩阵Hk的结果合并,获得最终映射Mk。
[0018] 上述步骤C的迭代计算Ga和Ge的相似矩阵Sk其具体计算方式采用下述公式;
[0019]
[0020] 其中,oa康示a。和a义间存在边,&V一表示bv和b之间存在边,a。和bV 是在当前迭代步完成后相匹配的节点,deg(ai)为节点a;的度;结合生物分子的初始生物相 似性和生物分子在各自网络中的拓扑相似特征,迭代计算得到生物分子的相似矩阵S^。
[0021] 上述的迭代计算得到两个分子网络的相似矩阵SW的具体步骤如下;
[0022] C-1.计算两个分子网络节点a;和节点bi在网络拓扑结构上的平均相似性,其相 似性的各个方面由Ni(a。bp和馬(a。bp表示;
[0023]C-2.在两个分子网络节点节点a;和节点bi的初始相似系数5°(3。6^基础上集成 它们在网络拓扑结构上的平均相似性,计算SW,其中上标k和k+1代表迭代次数,具体公式 如下:
[0027]Ni(a。bj)表示a;和bj的邻居节点之间的平均相似性,N2(a。bj)表示非邻居节点 之间的平均相似性,max炒4)表示矩阵SW的最大值,5表示一个0到1之间的值,由用户输 入确定,用W控制节点生物相似性和拓扑相似性的权重。
[002引上述的计算生物分子a,和bj.在网络拓扑结构上的平均相似性的具体方法为:
[0029]
[0030]其中,Ni(a。bj)表示节点a;和bJ的邻居节点,即该些节点和ai或bJ之间存在边, 之间的平均相似性,N, (a。bj.)表示节点a,和bj.的非邻居节点,即该些节点和ai或bj.之间不 存在边,之间的平均相似性,由deg(ai)表示节点a;的度,一"康示a。和a义间存在边, 入表示a。和a义间不存在边,auGGa表示a。是Ga中的一个节点,bvEGb表示bV是Gb中的一个节点,S(a。,by)表示a。和bV的相似系数,n1为Ga的节点数,n2为Gb的节点数, 上标k代表迭代次数。
[0031] 上述的映射矩阵的得分SSk侧重于生物意义的打分阳Sk和表示拓扑意义的边正确 率ECk计算得到,其具体计算方式如下;
[003引SSk=PESk+100XECk
[003引其中阳S哺ECk的计算方式如下;设网络A为Ga= (V^Ei),网络B为Gb= (V2,E2), 其中,Vi,V2分别代表网络Ga,Gb的节点集合,且|Vil二叫,IV2I二叫,即Ga中有ni个节点, Gb有n2个节点巧。V康示节点a1,a。存在于GA中,扣(fl,.),扣(a,,)分别表示在第k次 迭代时Gb中与a1,a。对应的匹配节点;E1,E2分别代表Ga,Gb的边集合,(a。a。)=eiu表示 边6iu的两个端点是节点a1,a。,eiuGE康示边eiu是GA的一条边;护' (。,:))表示Ga的 节点a;和GB中与其对应的节点护(。,)的初始相似系数。Ga与GB的PESk为;
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1