基于Pathway蛋白质组学的质谱优选肽段自动挑选方法

文档序号:6444254阅读:610来源:国知局
专利名称:基于Pathway蛋白质组学的质谱优选肽段自动挑选方法
技术领域
本发明涉及一种质谱优选肽段的挑选方法,特别涉及一种基于Pattway蛋白质组学的质谱优选肽段自动挑选方法,属于生物信息学技术领域。
背景技术
在蛋白质组研究领域中,质谱仪器对目标肽段的准确挑选与否对实验结果有着极其重要的影响。为了使质谱仪器对目标肽段的挑选更加准确,常规的做法是将质谱分析总时间分为数个segment,在每个segment里设定给予优先选择的肽段,这样可以防止目标肽段被其他高丰度杂质肽段或噪声所掩盖。但是现在设定优选肽段都是由人工来实现的,实验人员在实验设计时做出实验假说,并据此确定实验过程中需要重点关注的蛋白。例如,实验人员在实验设计时假设糖尿病患者血清样本中的glucose含量会发生变化,则会在实验中验证glucose的含量变化是否符合假设,在每个segment中将优选肽段确定为glucose的肽段。因此,每个segment中优选肽段的确定极度依赖实验人员的经验,易遗漏该疾病导致的其他未知蛋白质的含量变化;而且手动挑选的过程工作量繁冗,面对海量生物数据易使人产生疲劳感,从而导致实验结果的不理想与实验的投入产出比不高。

发明内容
本发明的目的是针对现有技术的缺点,利用计算机实现质谱优选肽段的自动筛选,取代生物实验者手动挑选工作量的繁冗,大大提高蛋白质组实验的效率,并扩大蛋白的关注范围,提高发生含量变化的蛋白的检出率,为蛋白质组的研究提供更便捷的工具。本发明提供了一种基于Pattway蛋白质组学的质谱优选肽段自动挑选方法,包括以下步骤A.将目标代谢通路上所有涉及到的蛋白质名称作为关键词,对待研究生物的全蛋白序列进行目标蛋白群的提取;B.对所提取的目标蛋白群按照实验所用的蛋白酶进行理论酶切,产生所有目标蛋白的理论酶切肽段;C.计算所有的理论酶切肽段的理论分子量(Mass)、理论保留时间(NET)、等电点 (Pi);D.根据实际设定的理论分子量和等电点筛选符合条件的理论肽段,得到质谱的优选肽段集合,即所有实验中需要重点关注的肽段;该肽段集合及每个肽段的理论保留时间作为在实际实验的每个segment中设定优选肽段的依据。有益效果本发明提供的方法便于计算机实现,可以取代传统的人工手动挑选方式,避免生物实验者手动挑选工作量的繁冗,大大提高蛋白质组实验的效率,并扩大蛋白的关注范围, 提高发生含量变化的蛋白的检出率,使蛋白质组的研究更加便捷与准确。


图1为本发明提供的基于蛋白质组学的质谱优选肽段自动挑选方法的流程图。
具体实施例方式为使本发明的目的、技术方案和优点更加清晰明了,以下结合附图,具体说明本发明的优选实施方式。图1为本实施方式实现的基于I^ttway驱动定量蛋白质组学的质谱优选肽段计算机自动挑选方法的流程图,该方法包括以下步骤步骤101 以fasta文件格式读取待研究生物的全蛋白序列。本例选用大肠杆菌, 从NCBI获取其全蛋白序列,记为ecoli. fasta,该文件中每个蛋白质以“ >”作为每一个蛋白的开始;步骤102 根据待研究的目标代谢途径,以txt文件格式读取目标代谢途径上涉及的蛋白质名称,本例以大肠杆菌糖代谢途径为研究对象,将该代谢途径上的蛋白名称储存于targetprotein. txt文件中,每个蛋白名称单独占据一行,共17个蛋白;步骤103 根据步骤102读取的目标代谢途径蛋白质,从步骤101读取的全蛋白序列中提取出对应蛋白质序列,提取出的信息包括该蛋白的名称、种属来源、氨基酸序列,目标蛋白序列存于targetsequence. txt文件中;目标蛋白群的提取可以采用字符串匹配方法简单实现读取targetprotein. txt 里的每行,采用迭代的方法在ecoli. fasta文件里寻找相同字符串,将含有相同字符串的蛋白质从全蛋白文件中提取出来。步骤104 对步骤103提取出的蛋白质序列进行理论酶切,按照所用的蛋白酶对蛋白质氨基酸序列的特异性酶切位点,将目标蛋白群各自的氨基酸序列在特异性位点进行酶切,产生理论酶切肽段总库,存于P印tides, txt。本实施例中所用的蛋白酶为胰蛋白酶,赖氨酸(K)和精氨酸(R)为其特异性酶切位点。本实施例中,理论酶切采用的方法是对氨基酸序列逐位读取识别,遇“K”或“R”即进行切割。步骤105 对步骤104生成的理论酶切肽段总库里的肽段计算理论分子量(Mass)、 理论保留时间(NET)、等电点(pi);理论分子量的计算是将肽段的全部氨基酸的分子量相加,此处假设有η个氨基酸,再减去氨基酸脱水缩合形成肽段的η-1个H2O的分子量,计算得到的为肽段的理论分子量;理论保留时间可以采用Kangas/Petritis神经网络训练算法,Kangas/Petritis SCX 保留时间算法,Krokhin Hydrophobicity 算法,Mant Hydrophobocity 算法。由于实验中所用的色谱质谱联用仪器的设置条件是按Kangas/Petritis神经网络训练算法的条件设置的,用该方法计算的理论保留时间与实际得到的保留时间最接近,故本实施例中理论保留时间的计算采用Kangas/Petritis神经网络训练算法。% ^ WifMatthew Monroe^Protein Digestion Simulator 软件里采用的算法。步骤106 根据设定的肽段挑选条件(该挑选条件一般通过设定肽段分子量和等电点的取值范围来完成),对肽段总库进行筛选,生成肽段数量大大减少的优选肽段库。本实施例中设置的分子量和等电点筛选条件为=Mass彡700,7彡pi ( 14。按条件进行剔除选择之后,符合条件的每个目标蛋白的理论酶切肽段大大减少,由此构建得到数量合适的优选肽段集合。至此,本实施例就得到了优选肽段集合以及每个肽段的理论保留时间。在质谱分析实验中,首先将优选肽段集合中的每个肽段按照理论保留时间进行排序,然后以该时间排序及理论保留时间为依据,将它们设置到实际质谱过程中各个segment的时间区间里, 作为相应segment的优选肽段,即可以实现对目标肽段快速、准确的挑选。应该理解的是,本实施方式只是本发明实施的具体实例,不应该是本发明保护范围的限制。在不脱离本发明的精神与范围的情况下,对上述内容进行等效的修改或变更均应包含在本发明所要求保护的范围之内。
权利要求
1.一种基于I^ttiway蛋白质组学的质谱优选肽段自动挑选方法,包括以下步骤A.将目标代谢通路上所有涉及到的蛋白质名称作为关键词,对待研究生物的全蛋白序列进行目标蛋白群的提取;B.对所提取的目标蛋白群按照实验所用的蛋白酶进行理论酶切,产生所有目标蛋白的理论酶切肽段;C.计算所有的理论酶切肽段的理论分子量(Mass)、理论保留时间(NET)、等电点 (Pl);D.根据实际设定的理论分子量和等电点筛选符合条件的理论肽段,得到质谱的优选肽段集合,即所有实验中需要重点关注的肽段;该肽段集合及每个肽段的理论保留时间作为在实际实验的每个segment中设定优选肽段的依据。
2.根据权利要求1所述的一种基于Pattway蛋白质组学的质谱优选肽段自动挑选方法,其特征在于步骤A中目标蛋白群的提取采用字符串匹配方法。
3.根据权利要求1所述的一种基于Pattway蛋白质组学的质谱优选肽段自动挑选方法,其特征在于步骤A中提取出的目标蛋白群信息包括蛋白的名称、种属来源、氨基酸序列。
4.根据权利要求1所述的一种基于Pattway蛋白质组学的质谱优选肽段自动挑选方法,其特征在于步骤B中理论酶切的方法为按照所用的蛋白酶对蛋白质氨基酸序列的特异性酶切位点,将目标蛋白群各自的氨基酸序列在特异性位点进行酶切。
全文摘要
本发明涉及一种基于Pathway蛋白质组学的质谱优选肽段自动挑选方法,包括以下步骤A.使用目标代谢通路上所有涉及到的蛋白质名称对待研究生物的全蛋白序列进行目标蛋白群的提取;B.对所提取的目标蛋白群进行理论酶切,产生所有目标蛋白的理论酶切肽段;C.计算所有的理论酶切肽段的理论分子量(Mass)、理论保留时间(NET)、等电点(pI);D.筛选符合条件的理论肽段,得到质谱的优选肽段集合,作为在实际实验的每个segment中设定优选肽段的依据。本发明提供的方法便于计算机实现,可以取代传统的人工手动挑选方式,大大提高蛋白质组实验的效率,并提高发生含量变化的蛋白的检出率,使蛋白质组的研究更加便捷与准确。
文档编号G06F19/18GK102567653SQ201110452448
公开日2012年7月11日 申请日期2011年12月29日 优先权日2011年12月29日
发明者刘雪琴, 唐晓英 申请人:北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1