一种基于生物网络的蛋白质复合物求取方法

文档序号:10613123阅读:345来源:国知局
一种基于生物网络的蛋白质复合物求取方法
【专利摘要】本发明公开一种基于生物网络的蛋白质复合物求取方法,解决分析生物网络中蛋白质相互作用并求取蛋白质复合物的问题。该方法将蛋白质生物网络构建成图模型,依据给定的种子顶点和蛋白质间的相互作用,结合蛋白质集群适应度和蛋白质顶点适应度的求解方法,分析蛋白质间的相互作用,求解蛋白质复合物。本发明能够形成解决在生物网络中求取蛋白质复合物问题的方案,使蛋白质复合物求取问题在解决过程的准确性和高效性方面得到保障。
【专利说明】
一种基于生物网络的蛋白质复合物求取方法
技术领域
[0001] 本发明涉及一种蛋白质复合物求取方法,主要利用蛋白质间相互作用的关系,结 合蛋白质集群适应度和蛋白质顶点适应度求解蛋白质复合物,属于计算机技术、生物技术 等交叉技术应用领域。
【背景技术】
[0002] 生物网络,是由化合物、蛋白质分子以及蛋白质间相互作用关系组成的生物结构。 生物网络视角提供了一组可用于分析整个生物体系结构的方法,并且提供了一系列理论用 以说明从这些结构中观察到的模式。生物网络技术也应用与大多数科学试验中,如酵母双 杂交系统,质谱法和蛋白质芯片技术。
[0003] 在新的时代,最重要的挑战之一是分析蛋白间相互作用,并鉴定出蛋白质复合物。 分析蛋白间相互作用有助于理解某些生物过程和预测蛋白质功能。本发明采用重叠聚类算 法,引入蛋白质适应度的求取方法,形成蛋白质复合物组成的方案。重叠聚类算法是一种寻 找拥有最佳适应度的蛋白质集群的方法。蛋白质适应度求取方法是选择组成复合物蛋白质 的关键方法。本发明能够形成解决在生物网络中求取蛋白质复合物问题的方案,使蛋白质 复合物求取问题在解决过程的准确性和高效性方面得到保障。
[0004] 本发明给出一种基于生物网络的蛋白质复合物求取方法,解决分析生物网络中的 蛋白质相互作用并求取蛋白质复合物的问题。该方法将蛋白质生物网络构建成图模型,依 据给定的种子顶点和蛋白质间的相互作用,结合蛋白质集群适应度和蛋白质顶点适应度的 求解方法,分析蛋白质间的相互作用,求解蛋白质复合物。

【发明内容】

[0005] 技术问题:本发明要解决生物网络中的蛋白质复合物求取问题,该问题是指给定 一个生物网络模型,包括蛋白质顶点集,蛋白质间的相互作用关系和种子顶点的集合,从中 选择部分蛋白质组成蛋白质复合物,使该复合物中的蛋白质能够相互适应,并使该复合物 拥最佳适应能力。
[0006] 技术方案:所述生物网络中的蛋白质复合物求取问题描述如下:给定一个生物网 络模型G(V,E,W),该模型包括顶点集V,边集E和蛋白质间相互作用关系集合W。给定必要蛋 白质集EP、蛋白质适应度的临界值t和顶点适应度临界值t m。该任务首先需要计算必要蛋白 质图Ge中子图的蛋白质适应度,构建必要子图集合Se,然后计算每个必要子图Si中每个顶点 的适应度fem,选出最大必要蛋白质P em,求取必要图Ce;其次要计算非必要蛋白质图Gn中子图 的蛋白质适应度,构建非必要子图集合3",然后计算每个必要子图S,中每个顶点的适应度 fnm,选出最大非必要蛋白质Pnm,求取非必要图Cn;最后求取必要图Ce和非必要图C n合并后得 到的答案图C,即要求取的蛋白质复合物。在构建图模型过程中,把每个蛋白质看作一个节 点,边的权值定义为蛋白质间相互作用的强度,边的权值越大,蛋白质间相互作用越强;边 的权值越小,蛋白质间的相互作用越弱。
[0007] 该方法包括以下步骤:
[0008] 步骤1)用户输入图信息,建立图模型G(V,E,W):根据用户输入图信息,建立顶点集 V,边集E和边权集合W,得到图模型G(V,E,W);
[0009] 步骤2)构建必要子图集合Se:求取必要蛋白质图Ge,从图Ge中选取适应度ti符合条 件的顶点构建成子图Si,所有子图&构成必要子图集合
[0010] 步骤3)构造必要图Ce:筛选最大必要蛋白质Pem,把适应度fem符合条件的最大必要 蛋白质加入临时图Η,符合条件的临时图Η加入必要图Ce ;
[0011] 步骤4)构建非必要子图集合Sn:求取非必要蛋白质图Gn,从图Gn中选取适应度ti符 合条件的顶点构建成子图Si,所有子图&构成非必要子图集合S n;
[0012] 步骤5)构造非必要图Cn:筛选最大非必要蛋白质Pnm,把适应度fnm符合条件的最大 非必要蛋白质Pnm加入临时图H,符合条件的临时图Η加入非必要图C n;
[0013] 步骤6)求取答案图C:求取非必要图GjP必要图Ge的并集,得到答案图C。
[0014] 其中:
[0015] 所述的步骤1)用户输入图信息,建立图模型G(V,E,W),具体为:
[0016] 步骤11)用户输入图G(V,E,W)的顶点集V和边集E,以及边权集合W;所述顶点集V = {vi,V2, · · ·,Vn};边集E= {ei(Vi,Vj),e2(Vi,Vj),· · ·,em(Vi,Vj)},边集E中的每个元素 e(Vi, Vj)代表连接顶点Vi和顶点Vj的边;边权集合W= |wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)},边权 集合W中的每个元素 W(Vi,Vj)代表边6(>:1,¥」)的权重,所述11代表顶点个数,1]1代表边数,;[和」 代表不同顶点的下标,i和j是1到η之间的整数;
[0017] 步骤12)用户输入必要蛋白质集ΕΡ、蛋白质适应度的临界值t和顶点适应度临界值 U;所述必要蛋白质集EP,是指用户指定必须存在的蛋白质顶点的集合;所述蛋白质的适应 度,是指蛋白质集群在图G(V,E,W)中适应能力;所述顶点适应度,是指蛋白质顶点在图G(V, E,W)中的适应能力;所述蛋白质适应度的临界值t,是指蛋白质子图的适应度不能低于所给 临界值t;所述顶点适应度临界值U,是指顶点的适应度不能低于所给临界值U。
[0018] 所述的步骤2)构建必要子图集合&,具体为:
[0019] 步骤21)把不属于必要蛋白质集EP的顶点Vi从图G(V,E,W)中移走,得到必要蛋白 质图Ge;
[0020] 步骤22)选出图Ge中顶点个数大于1并且适应度^大于种子适应度临界值U的子图 Si,并把所有符合条件的子图Si加入到必要子图集合S冲;所述适应度,是指子图Si对应的 适应度,其计算公式为
其中表示顶点V在图肿的 入度权重,入度权重4是指在图Η中与顶点ν直接相连的边权和,其计算公式为:
良示顶点ν在图Η中的出度权重,0是指在图Η 外与顶点ν直接相连的边权和,其计算公式为:
;所述子图S,, 是指顶点集和边集分别是图Ge的顶点集的子集和边集的子集的图;所述必要子图集合Se,是 指包含所有子图Si的集合;
[0021] 步骤23)对必要子图集合&中的每个子图Si排序,按子图规模和适应度进行非 递增排序,即按子图Si的规模从小到大排序,如果规模相等,按子图51的适应度从小到大排 序;所述子图31的规模,是指子图&中包含的顶点个数的大小;
[0022] 步骤24)建立一个必要图Ce,初始化必要图Ce为空,即Ce=〇。
[0023] 所述的步骤3)构造必要图Ce,具体为:
[0024]步骤31)如果必要子图集合Se为空,跳转到步骤4);
[0025]步骤32)按先后顺序从必要子图集合S冲取出每个子图Si,令临时图H = Si;找到临 时图Η的邻居集合N;所述临时图H,是指用来表示一个指定图的变量;所述临时图Η的邻居集 合Ν,是指临时图Η中所有顶点邻居的集合;初始化标记变量flag = true ;所述标记变量 flag,是指一个布尔型变量;
[0026] 步骤33)如果标记变量flag = false,跳转到步骤3),在邻居集合N中选出最大必要 蛋白质Pem,所述最大必要蛋白质Pem,是指在邻居集合N中适应度fem最大的必要蛋白质,其 中,必要蛋白质的适应度fem的计算公式为:= ,如果最大适应度fem不大于0, 跳转到步骤35);
[0027]步骤34)把最大必要蛋白质Pem加入临时图Η中,更新邻居集合N,返回步骤33);
[0028] 步骤35)在邻居集合Ν中选出最大非必要蛋白质Pnm,所述最大非必要蛋白质Pnm,是 指示在邻居集合N中适应度fr?最大的非必要蛋白质;其中,非必要蛋白质的适应度fnm的计 算公式为:;^1? = ;^+^丨-:^^1?丨;如果最大适应度;^111不大于蛋白质适应度的临界值1:,跳转到 步骤37);
[0029] 步骤36)把蛋白质P?加入临时图Η中,更新邻居集合N;返回步骤33);
[0030] 步骤3 7)把临时图Η加入必要图Ce中,把含有临时图Η中顶点的子图Si从子图集合Se 中移除;把标记变量flag更新为false,即flag = false,返回步骤33)。
[0031] 所述的步骤4)构建必要子图集合Sn,具体为:
[0032]步骤41)移除图G中属于图Ge的蛋白质顶点,得到非必要蛋白质图Gn;
[0033] 步骤42)把非必要蛋白质图Gn中的所有顶点数大于1并且适应度大于种子适应度 临界值U的子图Si加入到非必要子图集合5"中;所述子图5 1,是指顶点集和边集分别是非必 要蛋白质图6"的顶点集的子集和边集的子集的图;所述非必要子图集合Sn,是指包含所有子 图Si的集合;
[0034] 步骤43)对非必要子图集合Sn中的每个子图Si排序,按子图51的规模和适应度进行 非递增排序;
[0035] 步骤44)建立一个非必要图Cn,初始化图Cn为空,即Cn = Φ。
[0036] 所述的步骤5)构造非必要图Cn,具体为:
[0037] 步骤51)如果非必要子图集合Sn为空,跳转到步骤6);
[0038]步骤52)按先后顺序从非必要子图集合Sn*取出每个子图Si,令临时图H=Si;找到 临时图Η的邻居集合N,初始化标记变量f lag = true;
[0039] 步骤53)如果标记变量flag = false,跳转到步骤5),在邻居集合N中选出最大非必 要蛋白质Ρ?,如果最大适应度不大于0,跳转到步骤55);
[0040]步骤54)把蛋白质P?加入临时图Η中,更新邻居集合N,返回步骤53);
[0041 ]步骤55)在邻居集合Ν中选出最大必要蛋白质Pem,如果最大适应度fem不大于蛋白 质适应度的临界值t,跳转到步骤57);
[0042]步骤56)把蛋白质pem加入子图Η中,更新邻居集合N,返回步骤53);
[0043] 步骤57)把子图Η加入到非必要图(:冲,把含有子图Η中顶点的子图Si从子图集合Sn 中移除,把标记变量flag更新为false,即flag = false,返回步骤53)。
[0044] 所述的步骤6)求取答案图C,具体为:
[0045] 步骤61)求取非必要图G4P必要图Ge的并集,图Gn和图Ge的并集即为答案图C,即C = CeUCn;
[0046] 步骤62)得到答案图C。
[0047] 有益效果:本发明利用图算法形成高效的生物网络蛋白质复合物求取方法。具体 体现如下有益效果:
[0048] 1)本发明提供一种生物网络蛋白质复合物求取方法,其完整的方法过程包括将生 物网络中的复合物、蛋白质及蛋白质间相互作用的关系定义成图模型、采用重叠聚类算法 获得答案图。
[0049] 2)本发明中所述建模过程中,提供一个或一套较为抽象的图模型,能够将实际问 题中的相关求解方法转化为数学化的模型形式。
[0050] 3)本发明中引入了适应度的概念,把复杂的问题简单化,便于理解算法思想和求 解答案图,使蛋白质复合物求解问题最终能够得到较优精确解。
【附图说明】
[0051 ]图1是基于生物网络的蛋白质复合物求取方法流程图。
【具体实施方式】
[0052]下面对本发明附图的某些实施例作更加详细的描述。
[0053]根据附图1,本发明【具体实施方式】为:
[0054] 1) ·用户输入图信息,建立图模型G(V,E,W)。
[0055] 11).用户输入图G(V,E,W)的顶点集合V:V={V1, V2,V3,V4,V5};输入边集合E:E = {ei(Vl,V2),e2(Vl,V3),e3(V3, V4),e4(V3,V5),e5(V4, V5) };输入边权集合W:W= {wi(Vl,V2),W2 (VI,V3),W3(V3, V4),W4(V3, V5),W5(V4, V5) },其中W1(V1,V2) = 1,W2(V1,V3) = 1,W3(V3,V4) = 2,W4 (V3 , V5 ) 一 3 , W5 ( V4 , V5 ) 一 3〇
[0056] 12).用户输入必要蛋白质集:EP= {vi,V2,V3};输入蛋白质适应度的临界值t = l; 输入顶点适应度临界值L = L
[0057] 2).构建必要子图集合Se,具体步骤如下:
[0058] 21).把不属于必要蛋白质集EP的顶V4和V5从图G(V,E,W)中移走,得到必要蛋白质 图66乂={¥6而属}。其中^代表蛋白质图6(3的顶点集力={%^3}瓜代表蛋白质图6 (3 的边集,Ee= {ei(vi,V2),e2(vi,V3)} 代表蛋白质图Ge的边权集合,W e = |ffi(vi,V2),W2(vi, V3)} Ο
[0059] 22).计算图Ge中顶点个数大于1的子图的适应度^.,选出适应度义大于种子适应度 临界值tm的子图S,,加入必要子图集合中。求得i
.其中 L I ,即4 得到必要子图集合Se= {&}。
[0060] 23).对必要子图集合Se中的每个子图Si按规模和适应度进行非递增排序,得到Se = {Si}〇
[0061 ] 24).初始化必要图Ce为空,即Ce=〇。
[0062] 3).构造必要图Ce。
[0063 ] 31).从必要子图集合Se中取出子图Si,令临时图H= Si。找到临时图Η的邻居集合N, 求得Ν= {VI,V2,V3}。初始化标记变量flag = true。
[0064] 32).计算邻居集合N中必要蛋白质的适应度,根据必要蛋白质的适应度fem的计算 公式fem=fH+{em}-fH-{em},求得
得到最大必要蛋白质Pem = VI。所 求最大必要蛋白质VI的适应度fl小于0。
[0065] 33).邻居集合N中不存在非必要蛋白质Pnm,默认最大非必要蛋白质Pnm的适应度fnm 小于蛋白质适应度的临界值t。把临时图Η加入必要图Ce,得到Ce= {{vi,V2,V3},{ei(vi,V2), e2(vi,V3)},{wi(vi,V2),W2(V1,V3)}},把标记变量flag更亲jf为false,即flag = false〇
[0066] 34) .flag值为false,结束循环。
[0067] 4).构建必要子图集合。
[0068] 41).把属于必要蛋白质集EP的顶点V1,V!^P V3从图G(V,E,W)中移走,得到非必要蛋 白质图6",6"={¥"311,1}。其中,¥ 11代表蛋白质图611的顶点集,¥11={^,^}$11代表蛋白质图 Gn的边集,En= {e5(V4,V5)} ;Wn代表蛋白质图Gn的边权集合,Wn= {W5(V4,V5)}。
[0069] 42).计算图6"中顶点个数大于1的子图的适应度I,选出适应度4大于种子适应度 临界值tm的子图Si,加入非必要子图集合Sn*。求得
求得 得到非必要子图集合3η={&}。
[0070] 43).对非必要子图集合Sn中的每个子图Si按规模和适应度进行非递增排序,得到 Sn= {Si} 〇
[0071] 44).初始化非必要图Cn为空,gp Cn = Φ。
[0072] 5).求取非必要图Cn。
[0073] 51).从非必要子图集合Sn中取出子图Si,令临时图H=Si。找到临时图Η的邻居集合 Ν,求得N= {v3,V4,V5}。初始化标记变量flag = true。
[0074] 52).计算邻居集合N中非必要蛋白质的适应度,根据非必要蛋白质的适应度fnm的 计算公式;^1?=;^+^1-;^^1?1,求得.得到最大必要蛋白质Pnm = V4。所求最 大必要蛋白质V4的适应度f4小于0。
[0075] 53).计算邻居集合N中必要蛋白质的适应度,根据必要蛋白质的适应度fem的计算 公式fem = fH+{em}-fH-{em},求得 < =一,求得最大必要蛋白质Pnm=V3。 17
[0076] 54).所求最大必要最大必要蛋白质Pnm的适应度f3不大于蛋白质适应度的临界值 t。把临时图Η加入非必要图Cn,得到Cn= { {V4,V5},{e5(V4,V5) },|ff5(V4,V5)} },把标记变量 f lag更新1 为false,艮P flag = false 〇
[0077] 55) .flag值为false,结束循环。
[0078] 6).求取答案图C。
[0079] 61).求取非必要图Gn和必要图Ge的合并图,得到答案图C,即C = CeUCn。
[0080] 62).得到答案图 C(Vc,Ec,Wc),其中,顶点集合Vc={v 1,v2,v3,V4,v5};边集合E c={el (V1,V2),e2(Vl,V3),e3(V3,V4),e4(V3,V5),e5(V4,V5)};边权集合Wc= {wi(Vl,V2),W2(V1,V3),W3 (V3,V4),W4(V3,V5),W5(V4,V5)},W1(V1,V2) = 1,W2(V1,V3) = 1,W3(V3,V4) = 2,W4(V3,V5)=3,W5 (V4 , V5 ) - 3 〇
【主权项】
1. 一种基于生物网络的蛋白质复合物求取方法,其特征在于该方法包括W下步骤: 步骤1)用户输入图信息,建立图模型G(V,E,W):根据用户输入图信息,建立顶点集V,边 集E和边权集合W,得到图模型G(V,E,W); 步骤2)构建必要子图集合Se:求取必要蛋白质图Ge,从图Ge中选取适应度ti符合条件的 顶点构建成子图Si,所有子图Si构成必要子图集合Se; 步骤3)构造必要图Ce:筛选最大必要蛋白质Pem,把适应度fem符合条件的最大必要蛋白 质Pem加入临时图Η,符合条件的临时图Η加入必要图Ce ; 步骤4)构建非必要子图集合Sn:求取非必要蛋白质图Gn,从图Gn中选取适应度ti符合条 件的顶点构建成子图Si,所有子图Si构成非必要子图集合Sn; 步骤5)构造非必要图Cn:筛选最大非必要蛋白质Pnm,把适应度fnm符合条件的最大非必 要蛋白质Ργ?加入临时图H,符合条件的临时图Η加入非必要图Cn; 步骤6)求取答案图C:求取非必要图Gn和必要图Ge的并集,得到答案图C。2. 根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤1)用户输入图信息,建立图模型G(V,E,W),具体为: 步骤11)用户输入图G(V,E,W)的顶点集V和边集E,W及边权集合W;所述顶点集V={vi, V2, . . .,Vn};边集E= {ei(Vi,Vj) ,e2(Vi,Vj), . . . ,em(Vi,Vj)},边集E中的每个元素 e(Vi,Vj)代 表连接顶点Vi和顶点Vj的边;边权集合W= {wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)},边权集合W 中的每个元素 w(Vi,Vj)代表边e(Vi,Vj)的权重,所述η代表顶点个数,m代表边数,i和j代表 不同顶点的下标,i和j是1到η之间的整数; 步骤12)用户输入必要蛋白质集ΕΡ、蛋白质适应度的临界值t和顶点适应度临界值U;所 述必要蛋白质集EP,是指用户指定必须存在的蛋白质顶点的集合;所述蛋白质的适应度,是 指蛋白质集群在图G(V,E,W)中适应能力;所述顶点适应度,是指蛋白质顶点在图G(V,E,W) 中的适应能力;所述蛋白质适应度的临界值t,是指蛋白质子图的适应度不能低于所给临界 值t;所述顶点适应度临界值U,是指顶点的适应度不能低于所给临界值tm。3. 根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤2)构建必要子图集合Se,具体为: 步骤21)把不属于必要蛋白质集EP的顶点VI从图G(V,E,W)中移走,得到必要蛋白质图 Ge; 步骤22)选出图Ge中顶点个数大于1并且适应度ti大于种子适应度临界值tm的子图Si,并 把所有符合条件的子图Si加入到必要子图集合Se中;所述适应度ti,是指子图Si对应的适应 度,其计算公式为:其中《(Μ ^表示顶点V在图Η中的入度 权重,入度权重逆是指在图Η中与顶点V直接相连的边权和,其计算公式为:表示顶点V在图Η中的出度权重,Ml/)是指在图Η 外与顶点V直接相连的边权和,其计算公式为巧述子图Si, 是指顶点集和边集分别是图Ge的顶点集的子集和边集的子集的图;所述必要子图集合Se,是 指包含所有子图Si的集合; 步骤23)对必要子图集合Se中的每个子图Si排序,按子图Si的规模和适应度进行非递增 排序,即按子图Si的规模从小到大排序,如果规模相等,按子图Si的适应度从小到大排序;所 述子图Si的规模,是指子图Si中包含的顶点个数的大小; 步骤24 )建立一个必要图Ce,初始化必要图Ce为空,即Ce = Φ。4. 根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤3)构造必要图Ce,具体为: 步骤31)如果必要子图集合Se为空,跳转到步骤4); 步骤32)按先后顺序从必要子图集合S冲取出每个子图Si,令临时图H=Si;找到临时图 Η的邻居集合N;所述临时图H,是指用来表示一个指定图的变量;所述临时图Η的邻居集合N, 是指临时图Η中所有顶点邻居的集合;初始化标记变量flag =化ue;所述标记变量flag,是 指一个布尔型变量; 步骤33)如果标记变量flag = false,跳转到步骤3),在邻居集合N中选出最大必要蛋白 质Pem,所述最大必要蛋白质Pem,是指在邻居集合N中适应度fem最大的必要蛋白质,其中,必 要蛋白质的适应度fem的计算公式为:fem = fH+W-fH-{em},如果最大适应度fem不大于0,跳转 到步骤35); 步骤34)把最大必要蛋白质Pem加入临时图Η中,更新邻居集合N,返回步骤33); 步骤35)在邻居集合Ν中选出最大非必要蛋白质Pnm,所述最大非必要蛋白质Pnm,是指示 在邻居集合N中适应度fnm最大的非必要蛋白质;其中,非必要蛋白质的适应度fnm的计算公 式为:片111=扣+{。111}-扣-{。111};如果最大适应度片111不大于蛋白质适应度的临界值1:,跳转到步骤 37); 步骤36 )把蛋白质Pnm加入临时图Η中,更新邻居集合N;返回步骤33 ); 步骤37)把临时图Η加入必要图Ce中,把含有临时图Η中顶点的子图Si从子图集合Se中移 除;把标记变量flag更新为false,即flag = false,返回步骤33)。5. 根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤4)构建必要子图集合Sn,具体为: 步骤41)移除图G中属于图Ge的蛋白质顶点,得到非必要蛋白质图Gn; 步骤42)把非必要蛋白质图Gn中的所有顶点数大于1并且适应度大于种子适应度临界值 U的子图Si加入到非必要子图集合Sn中;所述子图Si,是指顶点集和边集分别是非必要蛋白 质图Gn的顶点集的子集和边集的子集的图;所述非必要子图集合Sn,是指包含所有子图Si的 集合; 步骤43)对非必要子图集合Sn中的每个子图Si排序,按子图Si的规模和适应度进行非递 增排序; 步骤44)建立一个非必要图Cn,初始化图Cn为空,即Cn=〇。6. 根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤5)构造非必要图Cn,具体为: 步骤51)如果非必要子图集合Sn为空,跳转到步骤6); 步骤52)按先后顺序从非必要子图集合Sn中取出每个子图Si,令临时图H = Si;找到临时 图Η的邻居集合N,初始化标记变量f lag = true; 步骤53)如果标记变量flag = false,跳转到步骤5),在邻居集合Ν中选出最大非必要蛋 白质Pr?,如果最大适应度fnm不大于ο,跳转到步骤55 ); 步骤54)把蛋白质Pnm加入临时图Η中,更新邻居集合N,返回步骤53); 步骤55)在邻居集合Ν中选出最大必要蛋白质Pem,如果最大适应度fem不大于蛋白质适应 度的临界值t,跳转到步骤57); 步骤56)把蛋白质Pem加入子图Η中,更新邻居集合N,返回步骤53); 步骤57)把子图助日入到非必要图Cn中,把含有子图Η中顶点的子图Si从子图集合Sn中移 除,把标记变量flag更新为化Ise,即flag =化Ise,返回步骤53)。7.根据权利要求1所述的基于生物网络的蛋白质复合物求取方法,其特征在于所述的 步骤6)求取答案图C,具体为: 步骤61)求取非必要图Gn和必要图Ge的并集,图Gn和图Ge的并集即为答案图C,即C = CeU Cn; 步骤62)得到答案图C。
【文档编号】G06F19/12GK105975804SQ201610281013
【公开日】2016年9月28日
【申请日】2016年4月29日
【发明人】田思明, 陈志 , 岳文静, 陈雨诗, 王宇虹, 卜杰, 陈志远
【申请人】南京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1