一种分析iTRAQ数据的方法

文档序号:587096阅读:1619来源:国知局
专利名称:一种分析iTRAQ数据的方法
技术领域
本发明属于生物技术领域,涉及蛋白质组学定量数据分析方面。
背景技术
iTRAQ(同位素标记相对和绝对定量技术)是近年来最新开发的一种新的蛋白质组学定量研究技术,它具有定量效果好、重复性高等优点,可对多达四种不同的样本同时进行定量分析,从事生物方面研究的科学工作者们常用iTRAQ技术来加速蛋白质的定量研在蛋白质组学的研究中,仅仅知道蛋白质的成分并不足以对蛋白质给出最终定论,因为蛋白质的浓度对与实现其在细胞中的功能来说极其重要,一种特殊蛋白质在浓度上的变化,就能预示细胞的突变过程。而应用传统的方法对蛋白质进行相对和绝对浓度进行测量,在敏感度和精确度上面都难以达到理想的效果。随着蛋白质组学中的方法学研究的不断提高,基于高度敏感性和精确性的串联质谱方法,不需要凝胶,就可以获得相对和绝对定量的蛋白质结果,英国Leeds (利兹)大学的博士 Darryl Pappin因此发明了一种新型的同位素标记相对和绝对定量技术,用来进行蛋白质组学的定量研究,即iTRAQ技术。iTRAQ的操作程序一般如下。将蛋白质裂解为肽段,然后用iTRAQ试剂进行差异标记。再将标记的样本相混合,这样就可以对其进行比较。与样本结合后,通常用MudPIT(多维蛋白质鉴定技术)进行下一步的操作,用2D液相色谱串联质谱进行分析。在质谱分析鉴定特殊肽离子片断结构的基础上,采用美国应用生物系统公司的软件包MASCOT (http // www. appliedbiosystems, com. cn/)禾口 Protein Pilot 对每一个月太段进行鉴定。Darryl Pappin博士表示,水解之后,每一个蛋白质会产生大量的肽段。用四种iTRAQ试剂对每一个肽段进行标记,每一种都被看作是独立的测量,所有的测试都是均勻的。但是,有一些蛋白质也许只进行一次肽测定,对哪些肽继续进行研究最终是由研究人员决定的。iTRAQ技术的一大优点是,它可以对任何类型的蛋白质进行鉴定,包括高分子量蛋白质,酸性蛋白质和碱性蛋白质,2D凝胶电泳对这些蛋白质都束手无策。而且,2D凝胶电泳无法对膜蛋白那样的不溶性蛋白质进行分析,但是iTRAQ标记系统和质谱法联合使用可解决这些问题。如其他蛋白质分析技术一样,使用iTRAQ技术进行蛋白质的定量分析,也许产生大量的数据,因而使用一种合理的方法去分析数据,解决数据发掘问题,获取iTRAQ标记串联质谱分析得到丰富的蛋白质信息,显得十分重要。本发明设计了一套用于iTRAQ数据分析的方法流程,通过制定合理的分析步骤, 选取优化的分析参数,达到获取丰富蛋白质信息的目的。

发明内容
本发明的内容主要为,一种iTRAQ数据分析的方法,通过优化过的过程和参数对 iTRAQ技术分析得来的蛋白质数据进行分析,获取有用的蛋白质信息。本方法的主要实施流程为步骤一、差异蛋白筛选。通过对原始iTRAQ数据进行分组筛选,获取差异结果。步骤二、GCKGene ontology)分析。通过向GO数据库进行映射查询,获取较全面的基因功能信息,以有向无环图显示。步骤三、Pattway分析。与GO分析类似。通过与KEGG数据库进行比较查询,构造基因之间相互作用通路。步骤四、Gene network分析。本方法的核心步骤,通过整合3种不同的相互作用关系,得到基因互作网络图。


图1、本发明所述一种分析iTRAQ数据的方法的实施流程图
具体实施例方式本发明所述,一种分析iTRAQ数据的方法应用于蛋白质iTRAQ分析数据的分析方面,本发明中将以小鼠细胞的iTRAQ分析数据为例,说明本方法的具体实施步骤步骤一、差异蛋白筛选。筛选的原始数据来源于小鼠细胞iTRAQ检测后的 proteinpilot软件分析结果。对数据按实验分组进行组间筛选,获得差异表达蛋白,后续分析以实验数据中的C组和B组的差异筛选结果为例。步骤二、GCKGene ontology)分析。上个步骤中得到的差异表达蛋白可作为GO分析的输入数据,使用 EASE(http://david. abcc. ncifcrf. gov/ease/ease. jsp)软件,将差异蛋白基因分别向Gene ontology数据库(www.geneontology.org)的各节点进行映射,计算每个节点的基因数目。差异基因按照biological process (生物学过程)进行分类。步骤三、Pathway分析。与GO分析类似,将差异表达蛋白想KEGG数据库(www. genome, jp/kegg/)进行映射,得到各蛋白基因之间的调节通路。调节通路图中,各节点便是一个基因,通过设置不同颜色来区分上调基因与下调基因。步骤四、Gene network分析。我们同时整合3种不同的相互作用关系1)KEGG数据库中基因之间的蛋白互做、基因调控、蛋白修饰等关系;2)已有的高通量实验,如酵母双杂交等证实的蛋白-蛋白相互作用;3)已有文献报道的中提到的基因之间的相互作用。来对各个蛋白基因进行相互作用分析。对三种关系使用不用的数据库作为分析来源,将3种分析的数据结果进行整合,得到各个基因之间的相互作用网络图,即Gene network。以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
权利要求
1.本发明所述一种分析iTRAQ数据的方法,它包含如下几步主要特征 步骤一、差异蛋白筛选,通过对原始iTRAQ数据进行分组筛选,获取差异结果; 步骤二、GO分析,通过向GO数据库进行映射查询,获取较全面的基因功能信息,以有向无环图显示;步骤三、Pathway分析,与GO分析类似。通过与KEGG数据库进行比较查询,构造基因之间相互作用通路;步骤四、Gene network分析,通过整合3种不同的相互作用关系,得到基因互作网络图。
全文摘要
本发明针对iTRAQ蛋白质定量分析数据的特点,设计了一种分析iTRAQ数据的方法,其主要流程为步骤一、差异蛋白筛选,通过对原始iTRAQ数据进行分组筛选,获取差异结果;步骤二、GO分析,通过向GO数据库进行映射查询,获取较全面的基因功能信息,以有向无环图显示;步骤三、Pathway分析,与GO分析类似。通过与KEGG数据库进行比较查询,构造基因之间相互作用通路;步骤四、Gene network分析,通过整合3种不同的相互作用关系,得到基因互作网络图。
文档编号C12Q1/68GK102321733SQ20101054606
公开日2012年1月18日 申请日期2010年11月15日 优先权日2010年11月15日
发明者曾华宗 申请人:上海聚类生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1