蛋白质信号转导子网的预测方法和装置制造方法

文档序号:6541087阅读:214来源:国知局
蛋白质信号转导子网的预测方法和装置制造方法
【专利摘要】本发明公开了一种蛋白质信号转导子网的预测方法和装置。其中,蛋白质信号转导子网的预测方法包括:建立步骤:建立信号转导网络;第一计算步骤:计算信号转导网络中每个节点和每条边的分值;第一获取步骤:获取信号转导网络中的目标节点及多个第一目标信号子网;第二计算步骤:计算每个第一目标信号子网的子网分值和显著性概率值;第二获取步骤:获取第一目标信号子网中的多个第二目标信号子网;以及确定步骤:确定多个第二目标信号子网中子网分值最高的第二目标信号子网为信号转导子网。通过本发明,解决了现有技术中蛋白质信号转导子网的预测精度低的问题,进而达到了降低预测复杂度、提高预测效率的效果。
【专利说明】蛋白质信号转导子网的预测方法和装置
【技术领域】
[0001]本发明涉及数据处理领域,具体而言,涉及一种蛋白质信号转导子网的预测方法和装置。
【背景技术】
[0002]信号转导网络中涉及很多蛋白质及蛋白质之间的相互作用。大部分分析方法都是基于静态的信号转导模型,即假定一对蛋白质能够发生相互作用,那么在这两个节点之间存在一个连接,网络的结构和特性不随着时间和条件的改变而改变。在实际系统中,信号转导网络时刻都在发生改变,也正是这种改变才使得生物体能够对外界刺激快速作出响应,完成各种复杂的生物学功能。因此,对信号转导网络进行动态的分析是揭示生物系统运行规律的关键。
[0003]静态网络提供了对于细胞内系统行为的定性描述,而蛋白质或基因表达数据可以提供分子在不同条件/时间/样本状态下的定量信息,因此,将这两种数据源结合起来可用于阐释细胞内系统的动态组织形式。目前,常用的方法是利用不同条件对应的基因表达谱来识别条件特异子网,用于帮助筛选疾病相关的生物标志物以及发现在不同表型之间通路的变化。条件特异的子网构建方法包括单基因差异分析、基因集差异分析以及基于聚类方法的基因共表达分析等。也有少数方法同时考虑单个基因的差异表达和基因对之间的变化相关性。
[0004]现有技术中一种基于基因表达数据发现条件特异的蛋白质相互作用子网的方法,详细步骤如下:
[0005]I)从蛋白质相互作用数据库HPRD中下载人的蛋白质相互作用数据集,构建静态蛋白质相互作用网络;
[0006]2)同时考虑网络中节点和边随条件的变化,定义综合打分函数;
[0007]3)建立全局优化算法COSINE,利用遗传算法提取条件特异的子网;
[0008]4)基于两个仿真数据集和三个真实的芯片数据集,发现目标疾病相关的特异子网;
[0009]5)将该方法筛选到的特异子网与其他方法得到的子网进行比较,评估预测方法的性能。
[0010]上述方式主要是基于基因表达信息,来预测条件特异的蛋白质相互作用子网,由于基因表达数据存在一定噪声,且与实验条件密切相关,使得该方法的预测精度不高,并且算法复杂性较大,运行速度较慢。
[0011]针对相关技术中蛋白质信号转导子网的预测精度低的问题,目前尚未提出有效的解决方案。

【发明内容】

[0012]本发明的主要目的在于提供一种蛋白质信号转导子网的预测方法和装置,以解决现有技术中蛋白质信号转导子网的预测精度低的问题。
[0013]根据本发明的一个方面,提供了一种蛋白质信号转导子网的预测方法。
[0014]根据本发明的蛋白质信号转导子网的预测方法包括:建立步骤:建立信号转导网络,其中,一种蛋白质为信号转导网络的一个节点,具有通信关系的两种蛋白质之间的通道为信号转导网络的一条边;第一计算步骤:计算信号转导网络中每个节点和每条边的分值;第一获取步骤:获取信号转导网络中的目标节点及多个第一目标信号子网,其中,目标节点为信号转导网络中节点分值最高的节点,第一目标信号子网为信号转导网络中与目标节点连通的信号子网;第二计算步骤:计算每个第一目标信号子网的子网分值和显著性概率值;第二获取步骤:获取第一目标信号子网中的多个第二目标信号子网,其中,第二目标信号子网为显著性概率值小于预设值的第一目标信号子网;以及确定步骤:确定多个第二目标信号子网中子网分值最高的第二目标信号子网为信号转导子网。
[0015]进一步地,采用以下方式计算每个节点的分值:获取节点i对应的蛋白质的实际丰度比和预设丰度比,其中,节点i为信号转导网络中的任一节点;以及根据节点i对应的实际丰度比和目标节点对应预设丰度比,计算节点i的分值。
[0016]进一步地,根据实际丰度比和预设丰度比,计算节点i的分值包括:按照以下公式计算节点i的分值:
【权利要求】
1.一种蛋白质信号转导子网的预测方法,其特征在于,包括: 建立步骤:建立信号转导网络,其中,一种蛋白质为所述信号转导网络的一个节点,具有通信关系的两种蛋白质之间的通道为所述信号转导网络的一条边; 第一计算步骤:计算所述信号转导网络中每个节点和每条边的分值; 第一获取步骤:获取所述信号转导网络中的目标节点及多个第一目标信号子网,其中,所述目标节点为所述信号转导网络中节点分值最高的节点,所述第一目标信号子网为所述信号转导网络中与所述目标节点连通的信号子网; 第二计算步骤:计算每个所述第一目标信号子网的子网分值和显著性概率值; 第二获取步骤:获取所述第一目标信号子网中的多个第二目标信号子网,其中,所述第二目标信号子网为所述显著性概率值小于预设值的所述第一目标信号子网;以及 确定步骤:确定多个所述第二目标信号子网中子网分值最高的所述第二目标信号子网为所述信号转导子网。
2.根据权利要求1所述的预测方法,其特征在于,采用以下方式计算每个节点的分值: 获取节点i对应的蛋白质的实际丰度比和预设丰度比,其中,所述节点i为所述信号转导网络中的任一节点;以及 根据所述节点i对应的实际丰度比和所述目标节点对应预设丰度比,计算所述节点i的分值。
3.根据权利要求2所述的预测方法,其特征在于,根据所述实际丰度比和所述预设丰度比,计算所述节点i的分值包括: 按照公式,
4.根据权利要求1所述的预测方法,其特征在于,采用以下方式计算每条边的分值: 获取边i所连接的两个节点对应的蛋白质的实际丰度比,其中,所述边i为所述信号转导网络中的任一边;以及 根据所述边i所连接的两个节点对应的蛋白质的实际丰度比,计算所述边i的分值。
5.根据权利要求4所述的预测方法,其特征在于,根据所述边i所连接的两个节点对应的蛋白质的实际丰度比,计算所述边i的分值包括:按照公式
6.根据权利要求1所述的预测方法,其特征在于,按照以下公式计算每个所述第一目标信号子网的子网分值:
7.根据权利要求1所述的预测方法,其特征在于,计算每个所述第一目标信号子网的显著性概率值包括: 从所述信号转导网络中获取预设数量的第三目标信号子网,其中,所述第三目标信号子网的节点的数量与第一目标信号子网i2的节点的数量相同,所述第三目标信号子网的边的数量与所述第一目标信号子网i2的边的数量相同; 计算每个所述第三目标信号子网的子网分值;以及 按照公式
8.根据权利要求7所述的预测方法,其特征在于,在确定多个所述第二目标信号子网中子网分值最高的所述第二目标信号子网为所述信号转导子网之后,所述预测方法还包括: 判断所述信号转导子网是否满足预设条件;以及 在判断出所述信号转导子网不满足所述预设条件的情况下,调整所述预设值和所述预设数量,并再次执行所述第二计算步骤、所述第二获取步骤和所述确定步骤。
9.一种蛋白质信号转导子网的预测装置,其特征在于,包括: 建立单元,用于建立信号转导网络,其中,一种蛋白质为所述信号转导网络的一个节点,具有通信关系的两种蛋白质之间的通道为所述信号转导网络的一条边; 第一计算单元,用于计算所述信号转导网络中每个节点和每条边的分值; 第一获取单元,用于获取所述信号转导网络中的目标节点及多个第一目标信号子网,其中,所述目标节点为所述信号转导网络中节点分值最高的节点,所述第一目标信号子网为所述信号转导网络中与所述目标节点连通的信号子网; 第二计算单元,用于计算每个所述第一目标信号子网的子网分值和显著性概率值;第二获取单元,用于获取所述第一目标信号子网中的多个第二目标信号子网,其中,所述第二目标信号子网为所述显著性概率值小于预设值的所述第一目标信号子网;以及确定单元,用于确定多个所述第二目标信号子网中子网分值最高的所述第二目标信号子网为所述信号转导子网。
10.根据权利要求9所述的预测装置,其特征在于,所述第一计算单元包括: 第一获取模块,用于获取节点i对应的蛋白质的实际丰度比和预设丰度比,其中,所述节点i为所述信号转导网络中的任一节点;以及 第一计算模块,用于根据所述节点i对应的实际丰度比和所述目标节点对应预设丰度t匕,计算所述节点i的分值。
11.根据权利要求10所述的预测装置,其特征在于,所述第一计算模块用于按照以下公式计算所述节点i的分值:
12.根据权利要求9所述的预测装置,其特征在于,所述第一计算单元还包括: 第二获取模块,用于获取边i所连接的两个节点对应的蛋白质的实际丰度比,其中,所述边i为所述信号转导网络中的任一边;以及 第二计算模块,用于根据所述边i所连接的两个节点对应的蛋白质的实际丰度比,计算所述边i的分值。
13.根据权利要求12所述的预测装置,其特征在于,所述第二计算模块用于按照以下公式计算所述边i的分值:
14.根据权利要求9所述的预测装置,其特征在于,所述第二计算单元用于按照以下公式计算每个所述第一目标信号子网的子网分值:
15.根据权利要求9所述的预测装置,其特征在于,所述第二计算单元包括: 第三获取模块,用于从所述信号转导网络中获取预设数量的第三目标信号子网,其中,所述第三目标信号子网的节点的数量与第一目标信号子网i2的节点的数量相同,所述第三目标信号子网的边的数量与所述第一目标信号子网i2的边的数量相同; 第三计算模块,用于计算每个所述第三目标信号子网的子网分值;以及 第四计算模块,用于按照公式P = $计算所述的第一目标信号子网i2的显著性概率值P,其中,N2为所述第三目标信号子网的数量,N1为子网分值大于所述第一目标信号子网i2的子网分值的所述第三目标信号子网的数量,所述第一目标信号子网i2为多个所述第一目标信号子网中的任一信号子网。
16.根据权利要求15所述的预测装置,其特征在于,所述预测装置还包括: 判断单元,用于判断所述信号转导子网是否满足预设条件;以及 调整单元,用于在判断出所述信号转导子网不满足所述预设条件的情况下,调整所述预设值和所述预设数量,以使所述第二计算单元、所述第二获取单元和所述确定单元再次确定所述信号转导子网。
【文档编号】G06F19/12GK103870720SQ201410102941
【公开日】2014年6月18日 申请日期:2014年3月19日 优先权日:2014年3月19日
【发明者】刘伟, 谢红卫 申请人:中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1