生物分子网络拓扑结构比对的自适应方法_4

文档序号:9261518阅读:来源:国知局
,能找到在生物学意义和拓 扑结构意义上都更相似的比对结果,更好地应对物种的进化,在物种进化网络拓扑变化后, 可W找到更多的保守匹配节点对,具有更高的稳定性。
[0104]本文结合说明书附图和具体实施例进行阐述只是用于帮助理解本发明的方法和 核屯、思想。本发明所述的方法并不限于【具体实施方式】中所述的实施例,本领域技术人员依 据本发明的方法和思想得出的其它实施方式,同样属于本发明的技术创新范围。本说明书 内容不应理解为对本发明的限制。
【主权项】
1. 生物分子网络拓扑结构比对的自适应方法,其特征在于该方法的具体操作步骤如 下: a. 构建两个分子网络的初始相似矩阵S°,该两个分子网络分别记为第一生物分子网络 Ga和第二生物分子网络G B,所述的初始相似矩阵S°中的S ° (?, bp表示节点%和节点b 间的相似系数,其中a# GA,b」e Gb &1表示第一生物分子网络Ga中的节点,b」表示第二生 物分子网络Gb中的节点; b. 根据当前迭代步的相似矩阵Sk,使用匈牙利算法、贪心算法对第一生物分子网络Ga 中的节点和第二生物分子网络Gb中的节点进行匹配,获得Ga中的节点和Gb中的节点之间 的映射矩阵M k,其中k表示迭代步数,初始时k = O :其中每一个元素 Mk(?, bp为1或0,1 表示节点ai和节点b i匹配,0则表示不匹配; c. 根据步骤b所得的映射矩阵Mk,使用节点的邻居节点之间的相似性,自适应地更新 相似矩阵Sk,然后结合生物分子的初始生物相似性和生物分子在各自网络中的拓扑相似特 征,计算得到下一生物分子的相似矩阵S k+1; d. 计算每一迭代步的映射矩阵Mk的得分SS k,然后计算生物分子的相似矩阵Sk+1和S k 之间对应元素差值的绝对值,判断是否结束迭代计算,若生物分子的相似矩阵Sk+1和S k之 间对应元素的差值的绝对值的最大值小于阈值λ,λ为允许的计算误差,则结束计算,取 第m,0 < m < k步的映射矩阵,为最终映射结果,其中m需满足该步的映射矩阵M m的得分 SSn最大;否则,若生物分子的相似矩阵S k+1和S k之间对应元素的差值的绝对值的最大值不 小于阈值λ,则不结束计算,返回步骤b到步骤d继续进行计算,直到前后两次生物分子的 相似矩阵S k+1和S k之间对应元素的差值的绝对值的最大值小于阈值λ,则结束计算。2. 根据权利要求1所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所述 的步骤b的具体方法为: b-Ι、遍历Ga的每一个节点,如果这个节点在网络Gb中的相似节点数不小于一个阈值 (该阈值为一经验值),就把这个节点在相似矩阵Sk中对应的行归入到匈牙利矩阵Hk中,否 则归入贪心矩阵G k中; b_2、使用匈牙利算法处理匈牙利矩阵Hk,并在Gk中标记那些已经匹配的列;如果在有 效的时间内获得结果,则进行下一步,否则结束处理,把匈牙利矩阵Hk合并到贪心矩阵Gk 中; b_3、使用贪心算法处理贪心矩阵Gk中由那些没有被标记的列构成的矩阵,和b-2中匈 牙利矩阵Hk的结果合并,获得最终映射Mk。3. 根据权利要求1所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所述 步骤c的迭代计算GJP G B的相似矩阵S k其具体计算方式采用下述公式:其中,A 〇 ai表不aJPl a i之间存在边,A 表不1\和b』之间存在边,a。和b v是在 当前迭代步完成后相匹配的节点,deg(ai)为节点%的度;结合生物分子的初始生物相似性 和生物分子在各自网络中的拓扑相似特征,迭代计算得到生物分子的相似矩阵Sk+1。4. 根据权利要求3所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所述 的迭代计算得到两个分子网络的相似矩阵Sk+ 1的具体步骤如下: C-1.计算两个分子网络节点%和节点b i在网络拓扑结构上的平均相似性,其相似性 的各个方面由N1 (ai,bj)和N2 (ai,bj)表示; C-2.在两个分子网络节点节点ai和节点b啲初始相似系数S °(ai,bp基础上集成它 们在网络拓扑结构上的平均相似性,计算Sk+1,其中上标k和k+Ι代表迭代次数,具体公式如 下:N1 (a^bj)表示%和13』·的邻居节点之间的平均相似性,Njaobj)表示非邻居节点之间 的平均相似性,max(Sk+1)表示矩阵Sk+1的最大值,3隶示一个0到1之间的值,由用户输入 确定,用以控制节点生物相似性和拓扑相似性的权重。5. 根据权利要求4所述的生物分子网络拓扑结构比对的自适应方法,其特征在于中所 述的计算生物分子%和在网络拓扑结构上的平均相似性的具体方法为:其中,N1 (ap bj)表示节点aJP b」的邻居节点,即这些节点和a 1或b」之间存在边,之间 的平均相似性,N2 (ap bj)表示节点aJP b」的非邻居节点,即这些节点和a 1或b」之间不存 在边,之间的平均相似性,由degh)表示节点%的度,4 表示a,a i之间存在边, A α,.:表不au和a之间不存在边,a ue G 4表不a u是G A中的一个节点,b ve G B表不b ^ G1^的一个节点,S (a u, bv)表示au和b v的相似系数,η $ Ga的节点数,η 2为Gb的节点数, 上标k代表迭代次数。6. 根据权利要求1所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所述 的映射矩阵的得分SSk侧重于生物意义的打分PES k和表示拓扑意义的边正确率ECk计算得 到,其具体计算方式如下: SSk= PES k+100XECk 其中PESk和ECk的计算方式如下:设网络A Sga= (V ^E1),网络B Sgb= (V2, E2),其 中,别代表网络Ga,Gb的节点集合,且IV1I =II1, Iv2I =n2,即Ga中有η 1节点,Gb 有]12个节点;ai,aue \^表示节点ai,au存在于GA>f,<(?,·),#(?)分别表示在第k次迭 代时Gb中与a i,au对应的匹配节点;E i,&分别代表G A,Gb的边集合,(a i,au) = eiu表示边 eiu的两个端点是节点a i,au,eiue E i表示边e ^是Ga的一条边;(?,_))表示Ga的节 点ajP G B中与其对应的节点# (?〇的初始相似系数。Ga与G B的PES k为:7. 根据权利要求1所述的生物分子网络拓扑结构比对的自适应方法,其特征在于所述 的结束计算的判断,有两个依据条件,只要满足一个,即可结束计算: Dl、Sk+1与S k或S k与S η对应元素差值绝对值的最大值小于一个限定的阈值(0. 01): max (I Sk+1-Sk I) <= 0. 01 或 max (I Sk-Sk-11) <= 〇. 01 D2、映射矩阵的得分连续三步不变化: SSk+1 (GA,Gb) = SSk (GA,Gb) = SSk-1 (GA,Gb)。
【专利摘要】本发明涉及一种生物分子网络拓扑结构比对的自适应方法。该方法用于寻找两个生物分子网络生物学意义上的最优映射,其步骤如下:A、构建第一生物分子网络和第二生物分子网络的初始相似矩阵 。B、基于相似矩阵,获得第一生物分子网络中的节点和第二生物分子网络之间的比对映射矩阵。C、根据当前迭代步的匹配结果,自适应地更新相似矩阵,然后计算得到下一迭代步生物分子的相似矩阵。D、计算每一迭代步的映射矩阵的得分,然后判断是否结束计算。其特点在于针对节点的网络拓扑特点自适应地计算网络节点之间的相似性,有效降低仅用匈牙利算法而需要的大量计算时间,同时提高仅用贪心算法的准确率,从而找出比同类算法更好的映射。
【IPC分类】G06F19/24
【公开号】CN104978498
【申请号】CN201510179743
【发明人】谢江, 马进, 项超娟, 谭军, 丁旺, 文铁桥, 郭毅可, 张武
【申请人】上海大学
【公开日】2015年10月14日
【申请日】2015年4月16日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1