一种基于逻辑模型分析信号转导网络中节点重要性的方法

文档序号:6548945阅读:195来源:国知局
一种基于逻辑模型分析信号转导网络中节点重要性的方法
【专利摘要】本发明公开了一种基于逻辑模型分析信号转导网络中节点重要性的方法。该方法包括以下步骤:S1,根据数据库中存储的信号转导通路,构建一个信号转导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为逻辑的串并联模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4,当节点中的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率改变值,通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导网络功能的重要性。通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单个节点的重要性。
【专利说明】一种基于逻辑模型分析信号转导网络中节点重要性的方法
【技术领域】
[0001]本发明涉及生物信息学【技术领域】,具体而言,涉及一种基于逻辑模型分析信号转导网络中节点重要性的方法。
【背景技术】
[0002]在信号转导网络中,衡量单个蛋白质的重要性有助于发现细胞信号转导过程中关键的蛋白质以及生物系统的薄弱环节,关键的蛋白质以及生物系统的薄弱环节的发现将有助于人们更好的认识生物体,将有助于一些药物的筛选和研发。目前,在信号转导网络中度量蛋白质重要性的方法还较少。
[0003]在生物学上,愈加重要的节点对应的基因必要性愈高,愈加重要的节点具有更慢的进化速率,以这种方法来衡量蛋白质重要性需要进行较多的实验研究,且不易进行定量分析。在蛋白质相互作用网络中,连接度是最常用的描述蛋白质重要性的拓扑指标。节点的连接度是指所有与该节点可以发生相互作用的节点的数目。通常连接度更高的节点对于保证网络的整体结构和功能更加重要,但该指标仅考察了节点的局部特性,未考虑节点所在的整个网络的拓扑结构。实际上,部分连接度较低的节点有可能成为网络的瓶颈,当它们发生故障时,整个网络结构被破坏,使得信号无法有效传递,从而导致疾病的发生。
[0004]还有一些方法通过网络的流量分析来进行网络中节点重要性的预测。如文章Liuff, et al.SigFlux: a novel network feature to evaluate the importance of proteins insignal transduction networks.BMC Bioinformatics, 2006, 7:515 提出 了一种基于网络中的最小路集预测节点重要性的方法,详细步骤如下:
[0005]I)从文献中下载小鼠海马神经元的信号转导网络,作为待研究网络;
[0006]2)采用宽度优先搜索算法生成输入和输出之间的所有通路,采用MFinder软件搜索网络中所有的反馈回路,得到网络中的最小路集;
[0007]3)提出了一种度量单个蛋白质重要性的新特征SigFlux,定义为包含该节点的最小路集数占所有最小路集数目的比例,并根据网络中通路和反馈回路的分布情况计算蛋白质的SigFlux值;
[0008]4)将SigFlux与小鼠基因的必要性和进化速率进行相关分析,进一步比较SigFlux与连接度指标,说明SigFlux作为衡量蛋白质重要性指标的有效性。
[0009]从上述现有技术中可以看出,其预测节点重要性主要是基于信号转导网络的部分拓扑属性来预测网络中单个节点的重要性,没有从网络的全局结构来分析节点的重要作用,并且缺乏从概率上的故障分析机制,未考虑单个节点的故障发生概率的提高对整个网络所造成的影响。

【发明内容】

[0010]本发明旨在提供一种基于逻辑模型分析信号转导网络中节点重要性的方法,以解决现有技术中未考虑单个节点的故障发生概率的提高对整个网络所造成的影响的技术问题。
[0011]为了实现上述目的,根据本发明的一个方面,提供了一种基于逻辑模型分析信号转导网络中节点重要性的方法。该方法包括以下步骤:SI,根据数据库中存储的信号转导通路,构建一个信号转导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为逻辑的串并联模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4,当节点中的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率改变值,通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导网络功能的重要性。
[0012]进一步地,该方法还包括:S5,将信号转导网络发生故障的概率改变值与基因的必要性和基因的进化速率进行相关分析,与预设连接度指标进行比较,进而对信号转导网络中的参数进行调整。
[0013]进一步地,在步骤S4中,设定在不发生故障的情况下,信号转导网络中各个节点发生故障的概率是一个固定值。
[0014]进一步地,在步骤S4中,设定在正常情况下,将在正常情况下信号转导网络中各个节点发生故障的概率设定为一常数值,常数值为信号转导网络中各个节点发生故障的平均值,当单个节点发生故障时,该单个节点发生故障的对应概率变为1,计算各个最基本的串联和并联结构发生故障的概率,进而推算出信号转导网络发生故障的概率。
[0015]进一步地,步骤SI中,现有数据库中存储的各种信号转导通路为人、小鼠、果蝇、线虫或酵母的各种信号转导通路。
[0016]应用本发明的技术方案,通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单个节点的重要性;从概率上分析单个节点的故障发生概率的提高对整个网络所造成的影响,容易进行定量分析;可以方便的将单个节点的重要性分析推广到多个节点的联合重要性分析,发现网络中的薄弱模块。可以通过分析的方法发现信号转导网络中重要的节点,为生物实验设计提供指导,帮助研究网络中节点的功能。
【专利附图】

【附图说明】
[0017]构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0018]图1示出了根据本发明一典型实施方式的基于逻辑模型分析信号转导网络中节点重要性的方法的流程图;
[0019]图2示出了根据本发明另一典型实施方式的基于逻辑模型分析信号转导网络中节点重要性的方法的流程图;
[0020]图3A示出了真实的细胞凋亡信号转导网络的局部;
[0021 ] 图3B示出了图3A对应的串并联逻辑模型;
[0022]图4A不出了最基本的串联结构;以及
[0023]图4B不出了最基本的并联结构;
[0024]图5示出了人的凋亡信号转导网络;
[0025]图6示出了图5模块划分后的示意图;
[0026]图7示出了图6对应的逻辑关系图;[0027]图8示出了图7中模块I对应的中间子模块。
【具体实施方式】
[0028]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0029]根据本发明一种典型的实施方式,提供一种基于逻辑模型分析信号转导网络中节点重要性的方法。该方法包括以下步骤:S1,根据数据库中存储的信号转导通路,构建一个信号转导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为逻辑的串并联模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4,当上述节点中的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率改变值,通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导网络功能的重要性,如图1所示。
[0030]应用本发明的技术方案,通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单个节点的重要性;串并联关系是计算网络故障发生概率的基础,将大的网络逐级分解成基本的串并联结构才能根据所有节点的故障概率计算出整个网络的故障概率,从而从概率上分析单个节点的故障发生概率的提高对整个网络所造成的影响,与实际的疾病发生情况比较吻合,容易进行定量分析;可以方便的将单个节点的重要性分析推广到多个节点的联合重要性分析,发现网络中的薄弱模块。
[0031]对于复杂的信号转导网络,将其直接转换成逻辑关系模型是比较困难的。其基本思路是将复杂网络逐级划分:第一步是将其划分为相互独立的多个模块;第二步是将由第一步获得的模块继续划分,区分其内部的串并联关系,如果模块内部可以区分出单个节点的串并联关系,则该模块的逻辑关系模型转换结束,否则继续将该模块进行划分,分为多个独立的小块,重复划分步骤;最后是将由各模块内的逻辑关系模型进行拼接,形成最终的逻辑关系模型。
[0032]优选的,如图2所示,方法进一步包括:S5,将信号转导网络发生故障的概率改变值与基因的必要性和基因的进化速率进行相关分析,与预设连接度指标进行比较,进而对信号转导网络中的参数进行调整,从而更有利于得到令人满意的结果,即与生物学数据相吻合,如与基因必要性一致。其中,基因的必要性和进化速率等数据采用现有的生物学数据库中的信息,如小鼠的必要性数据存储在MGD中。其中,预设的连接度指标根据现有数据库中的息得到。
[0033]根据本发明一种典型的实施方式,在步骤S4中,设定在正常情况下,信号转导网络中各个节点发生故障的概率是一个固定值,这样方便后续概率的计算。例如,在步骤S4中,将在正常情况下信号转导网络中各个节点发生故障的概率设定为一常数值,常数值为信号转导网络中各个节点发生故障的平均值,当单个节点发生故障时,该单个节点发生故障的对应概率变为1,计算各个最基本的串联和并联结构发生故障的概率,进而推算出信号转导网络发生故障的概率。其中,正常情况下是指信号转导网络能够正常转导的情况下。
[0034]本发明的基于逻辑模型分析信号转导网络中节点重要性的方法可以用于各种物种中信号转导通路的评估,例如人、小鼠、果蝇、线虫或酵母的各种信号转导通路。
[0035]在本发明的一典型的实施方式中,该基于逻辑模型分析信号转导网络中节点重要性的方法包括以下步骤:
[0036]1.信号转导网络的构建及表示为逻辑模型
[0037]对于信号转导网络,网络中的节点之间存在的连接关系,形成了拓扑结构。通过整个网络结构保证信号的有效传输,特别是通过通路的冗余机制,保证网络的部分节点发生错误(故障)时,网络仍能够正常的发挥功能。在一条通路中,根据节点之间的与和或的关系,可以将其转换为串并联逻辑模型。例如,如图3A是一个真实的信号转导网络,其对应的串并联逻辑模型如图3B所示。这里不区分节点之间的激活和抑制关系。
[0038]2.计算整个网络的故障概率
[0039]对于复杂的串并联逻辑网络,总可以将其划分为图4A和图4B中最基本的串并联结构。其中,图4A示出了最基本的串联结构,图4B示出了最基本的并联结构。
[0040]对于串联结构,设节点A、B、C对应的故障发生概率分别为P㈧、P⑶和P (C),那么由这三个节点构成的串联系统G发生故障的概率为:
[0041]P(G) = 1-[1-P(A)] [1-P(B)] [1-P(C)] (I)
[0042]由这三个节点构成的并联系统R发生故障的概率为:
[0043]P (R) =P ⑷ P ⑶ P (C) (2)
[0044]通过将复杂系统划分为基本的串并联模块,可以根据单个节点的故障发生概率计算出整个系统发生故障的概率。
[0045]由基本模块计算总体故障概率的过程与前面模块划分的步骤是相反的,前面是由大的网络逐级划分为小的模块,这里则由小的模块开始计算故障概率,逐级扩大模块范围,直至包含整个网络计算出整个网络的故障概率。
[0046]3.单个节点的重要性度量
[0047]假定在正常情况下,网络中各个节点i发生故障的概率是一个固定值,如P (i)=
0.5,根据网络的逻辑模型,可以计算出整个系统Stl发生故障的总概率P(Stl)。
[0048]对于网络中的单个节点i,当其发生故障时,其对应概率变为P (i) = I。认为此时没有其他节点发生故障,那么可以计算出在此条件下,整个系统的故障概率Si的P(S1),正常情况下P (Si)≥ P (S0)。
[0049]节点i的重要性定义为:
[0050]FW=P(Si)-P(S0) (3)
[0051]该值表征了节点i发生故障对整个网络发生故障的概率影响,从而可以定量的评估该节点对于整个网络结构的重要性。
[0052]4.多个节点的重要性度量
[0053]与单个节点的重要性度量相类似,假定η个节点{1,…,η}同时发生故障,其节点的故障概率均变为P (i) = l,i = 1,…,n,可以计算出在此条件下,整个系统的故障概率Sn的P (Sn)。这η个节点的联合重要性定义为:
[0054]F (n) = P(Sn)-P(S0) (4)
[0055]注意到,该联合重要性并不等同于η个节点的单独重要性的叠加,而与这η个节点的分布和连接情况有密切联系。
[0056]下面将结合实施例进一步说明本发明的有益效果,下列没有特别描述的步骤,均可采用本领域的常规技术手段实现。[0057]实施例1
[0058]I)根据现有数据库中存储的各种信号转导通路,构建人的凋亡信号转导网络,如图5所示。对于如图5所示的人的凋亡信号转导网络,对其进行模块划分和逻辑关系转换。
[0059]2)将图5划分成相互独立的模块I和模块2,如图6所示。
[0060]3)根据图6进行逻辑关系划分,得到对应的逻辑关系图,如图7所示。
[0061]4)设定正常情况下,单个节点的故障发生概率为一个常值(如0.1),根据逻辑关系图,可以计算出整个网络的故障发生概率。其计算方法是先计算各模块内的故障发生概率,然后得到整个网络的故障发生概率。对于模块1,可以划分出中间子模块,如图8所示。
[0062]先计算中间子模块的故障发生概率Pm,
[0063]Pm = 0.1 [1-(1-0.1) (1-0.01)] [1-(1-0.1) (1-0.01)] = 0.0012
[0064]然后综合得到整个模块概率为:
[0065]P(M1) = 1-(1-0.1) {1-PJ (1-0.1) = 0.1910
[0066]对于模块2,其为5个节点的串联,对应的故障概率为:
[0067]P(M2) = 1-(1-0.1)5 = 0.4095
[0068]最后可得总的网络故障发生概率P (Stl) = 0.2241,此处计算较复杂,可编程实现。
[0069]当其中某个节点i发生故障时,其故障发生改变为1,重复以上计算过程,得到新的故障发生概率P(Si),然后根据其差值衡量单个节点的重要性。
[0070]对于该网络,CaSpaSe3节点是最为重要的,其重要性分值为I。其他节点的重要性概率均小于1,如对于Caspase9,其重要性分值为0.5738。
[0071]类似的,可以计算模块I和模块2的重要性分值。
[0072]从上述实施例可以看出,采用本发明的技术方案至少具有以下有益效果:
[0073]1、通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单个节点的重要性;
[0074]2、从概率上分析单个节点的故障发生概率的提高对整个网络所造成的影响,与实际的疾病发生情况比较吻合,容易进行定量分析;
[0075]3、可以方便的将单个节点的重要性分析推广到多个节点的联合重要性分析,发现网络中的薄弱模块。
[0076]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种基于逻辑模型分析信号转导网络中节点重要性的方法,其特征在于,包括以下步骤: Si,根据数据库中存储的信号转导通路,构建一个信号转导网络; S2,根据所述信号转导网络中节点之间的连接关系将所述信号转导网络表示为逻辑的串并联1?型; S3,对所述信号转导网络的总体结构分解为最基本的串联和并联结构; S4,当所述节点中的单个节点或多个节点的故障发生概率改变时,计算所述信号转导网络发生故障的概率改变值,通过所述信号转导网络发生故障的概率改变值度量所述单个节点或所述多个节点对保持所述信号转导网络功能的重要性。
2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括: S5,将所述信号转导网络发生故障的概率改变值与基因的必要性和基因的进化速率进行相关分析,与预设连接度指标进行比较,进而对所述信号转导网络中的参数进行调整。
3.根据权利要求1所述的方法,其特征在于,在所述步骤S4中,设定在不发生故障的情况下,所述信号转导网络中各个节点发生故障的概率是一个固定值。
4.根据权利要求3所述的方法,其特征在于,在所述步骤S4中,将在正常情况下所述信号转导网络中各个节点发生故障的概率设定为一常数值,所述常数值为所述信号转导网络中各个节点发生故障的平均值,当单个节点发生故障时,该单个节点发生故障的对应概率变为1,计算各个所述最基本的串联和并联结构发生故障的概率,进而推算出所述信号转导网络发生故障的概率。
5.根据权利要求1所述的方法,其特征在于,所述步骤SI中,所述数据库中存储的各种信号转导通路为人、小鼠、果蝇、线虫或酵母的各种信号转导通路。
【文档编号】G06F19/00GK103995983SQ201410251938
【公开日】2014年8月20日 申请日期:2014年6月9日 优先权日:2014年6月9日
【发明者】刘伟, 孙志强, 宫二铃 申请人:中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1