一种通过循环差减进行大规模cDNA克隆和测序的方法

文档序号:453098阅读:502来源:国知局
专利名称:一种通过循环差减进行大规模cDNA克隆和测序的方法
技术领域
本发明涉及遗传学、分子生物学和cDNA克隆领域。更具体地,本发明涉及一种对某一物种的任一种细胞类型进行大规模全面cDNA测序的方法。
随着生物学尤其是分子生物学的发展,目前人们已经知道,生物的性状由遗传物质-基因所决定。为了深入了解生物的各种生化过程,为了了解疾病与基因的相关性,为了开发具有新品质的农作物等,都需要人们能够尽可能地(最好全面地)获得生物体的DNA资料。
在任何一种生物体(尤其是真核生物)中,基因的表达因空间和时间而存在很大差异。即使是同一生物个体,其不同类型的细胞会表达不同的基因,同一细胞在不同时期也会表达不同的基因。例如,以人为例,人类基因组中的基因总数估计在5万至10万条之间(Bishop,J.O.,J.G.Morton,M.Rosbash,and M.Richardson.(1974)Three abundance classes in Hela cell messenger RNA.Nature 250199-204.)。在任一细胞类型中,大约只有一万条基因是表达的,而这些基因在单个细胞中的平均表达量可能从20万个拷贝至不到一个拷贝不等。因此,如何尽可能多地,甚至全部地测得被表达的基因就成为本领域一个难以逾越的障碍。
随着PCR技术的改进,从单个细胞中(Li,H.,Gyllensten,U.B.,Cui,X.,Saiki,R.K.,Erlich,H.A.& Arnheim,N.(1988)Nature(London)335,414-417)制备cDNA文库已成为可能。而且在理论上可以制备出代表着大部分以至全部基因的一系列cDNA文库。因此,先制备cDNA文库,然后对从cDNA文库中随机选取的cDNA克隆进行不重复的大规模测序,已被证明是发现新基因的一条有效途径(Adams,M.D.,J.M.Kelley,J.D.Gocayne,M.Dubnick,M.H.Polemeropoulos,H.Xiao,C.R.Kerlavage,W.R.McCombie,and J.Craig Venter.(1991)Complementary DNA sequencingExpressedsequence tags and Human Genome Project.Science 2521651-1656.Adams,M.D.,A.R.Kerlavage,C.Fields,and J.C.Venter.(1993a)3,400 new expressed sequence tagsidentify diversity of transcripts in human brain.Nature Genet.4256-257.Adams,M.D.,M.B.Soares,A.R.Kerlavage,C.Fields,and J.C.Venter.(1993b)Rapid cDNA sequencing(expressed sequence tags)from a dirextionally cloned human infant brain cDNA library.Nature Genet.4373-380.;Adams,M.D.,A.R.Kerlavage,R.D.Fleischmann,R.A.Fuldner,C.J.Bult,N.H.Lee,E.F.Kirkness,K.C.Weinstock,J.D.Gocayne,O.White,et al.(1995)Initial assessment of human gene diversity and expression patterns based upon 83millions nucleotides of cDNA sequence.Nature 3773-174.;Khan,A.S.,A.S.Wilcox,M.H.Polymeropoulos,J.A.Hopkins,T.J.Stevens,M.Robinson,A.K.Orpana,andJ.M.Sikela.(1992)Single pass sequencing and physical and genetic mapping of humanbrain cDNAs.Nature Genet.2180-185.;McCombie,W.R.,M.D.Adams,J.M.Kelley,M.G.FitzGerald,T.R.Utterback,M.Khan,M.Dubnick,A.R.Kerlavage,J.C.Venter,andC.Fields.(1992)Caenorhabditis elegans expressed sequence tags identity gene familiesand potential disease gene homologues.Nature Genet.1124-131.;Okubo,K.,N.Hori.R.Matoba,T.Niiyama,A.Fukushima,Y.Kojima,and K.Matsubara.(1992)LargeScale cDNA sequencing for analysis of quantitative and qualitative aspects of geneexpression.Nature Genet.2173-179.)。这种大规模随机cDNA测序技术方法的完善必将大大加速正在进行的人类和其它物种新基因发现计划。
然而,开展大规模随机cDNA测序工作必须克服的各种技术难点首先,由于各种细胞类型本身的丰度就有差异,每种细胞类型中各类基因的表达量差异极大,因此如果需要测得一种生物体的全部cDNA,就需要从处于发育的不同阶段的细胞中获取cDNA,从而使得一个完整的cDNA文库变得极为庞大。在容量达到107个克隆的cDNA文库中,任何组织中即使是最稀少种类的mRNA也可能被重复克隆进去,从而使消减工作以及最稀有基因的挑选工作几乎无法进行。为克服这些困难,首先就迫切需要找到一种理想的构建cDNA文库的方法。因为一般的cDNA文库常常包含了一些丰度很高但并非想要得到的克隆(简称为“垃圾”克隆)(Adams,M.D.,J.M.Kelley,J.D.Gocayne,M.Dubnick,M.H.Polemeropoulos,H.Xiao,C.R.Kerlavage,W.R.McCombie,and J.Craig Venter.(1991)Complementary DNAsequencingExpressed sequence tags and Human Genome Project.Science 2521651-1656.Adams,M.D.,M.Dubnick,A.R.Kerlavage,R.Moreno,J.M.Kelley,T.R.Utterback,J.W.Nagle,C.Fields,and J.Craig Venter.(1992)Sequence identification of 2,375 humanbrain genes.Nature 355632-634.)。这些“垃圾”克隆包括(1)、仅由mRNA的Poly A尾构成的克隆;(2)、仅有极短的cDNA插入片段的克隆;(3)、仅含有接头—寡聚(dT)18引物(该引物用于与人工接头连接的cDNA第一链的合成)3′部分的克隆。
(4)、嵌合克隆,指来源于在连接反应中由几条不同的mRNA相连接而产生的,易造成假象的cDNA克隆。
这些克隆的存在不仅会严重损害大规模测序方法在整体上的有效性,还将在很大程度上破坏所得测序结果的完整性。
除此之外,作为一条普遍的规律,某种cDNA克隆在其cDNA文库中的丰度总是和与它相对应的mRNA在细胞中的丰度相同。复性动力学的分析显示,在任一典型的体细胞中的mRNA,按其丰度分类可分为以下三类①、丰度极高的mRNA(这类mRNA通常只有10-15种,但高度重复,其含量占总含量的10-20%);②、中等丰度的mRNA(约有1000-2000种,中度重复,占mRNA总含量的40-45%);③、低丰度的mRNA,又称“复杂的”mRNA(拷贝数低,这类mRNA约有15,000-20,000种,但也只占mRNA总含量的40-45%)(Bishop,J.O.,J.G.Morton,M.Rosbash,and M.Richardson.(1974)Three abundance classes in Hela cell messengerRNA.Nature 250199-204.;Davidson,E.H.and R.J.Britten.(1979)Regulation of geneexpressionPossible role of repetitives sequences.Science 2041052-1059.)。
因此,当大多数①与②类mRNA已被鉴定后,再从文库中取出一个新克隆时,它将有超过60%的可能性是一条已测序列的。要发现一条新基因就不得不做大量的重复测序工作。由于mRNA的丰度差异极大,造成大量的重复测序,即使是许多市售的高质量cDNA文库,也不是进行大规模cDNA测序的理想材料。
为了克服以上困难,构建高质量的cDNA文库,并对其进行均质化和差减化技术处理是目前较先进而有前途的技术发展方向。
均质化方法之一是对基因组DNA进行饱和杂交,它虽然可以使cDNA文库均质化(Weissman,S.M.(1978)Mol.Biol.Med.4,133-143.;),但这种方法实际并不可行的,因为要提供出饱和数量的稀少cDNA去参加杂交反应是非常困难的。另一种方法是利用复性动力学,按照二级动力学的条件,对cDNA进行退火,因为稀少的cDNA退火的速度比丰度较高的cDNA更慢,因此退火后剩下的单链cDNA片段将在这个反应过程中逐步均质化(即丰度较低的cDNA有更多的机会留下,从而使cDNA文库中各种丰度的cDNA克隆数目接近一致)(Weissman,S.M.(1987)Mol.Biol Med.4,133-143.;Ko,M.S.H..(1990)Nucleic Acids Res.18,5705-5711.;Patanjali,S.R.,Parimoo,S.& Weissman,S.M.(1991)Proc.Natl.Acad.Sci.USA 88.1943-1947.)。均质化方法可使cDNA文库中的每种克隆的出现频率维持在一个较小的范围内。根据一些学者的实践经验,想得到完全等克分子的cDNA文库实际是不可能的。
均质化的好处在于(1)均质化cNDA文库能加速克隆的定位,以便得到与疾病相关的基因,能提高差减杂交的效率,加速寻找表达序列在染色体上的排布及它们在已克隆到基因组DNA大片段上的位置(即外显子作图)。(2)通过减少彼此相同的克隆数,均质化使在膜上高密度地覆盖cDNA文库成为可能(在一张非均质化文库膜上覆盖107个克隆则是一项可望而不可及的工作)。(3)通过增加稀少的cDNA克隆的出现频率而同时又减少高丰度cDNA的比率,均质化能通过cDNA的随机测序大大加速表达序列数据库的发展。
选用均质化的文库,即所有克隆的丰度基本一致的文库将会有利于大规模测(Soares,M.B.1994.Construction of directionally cloned cDNA libraries in phagemidvectors.In Automated DNA sequencing and analysis(ed.M.D.Adams,C.Fields andJ.C.Venter),pp.110-114.Academic Press,New York,NY..Soares,M.B.,M.F.Bonaldo,P.Jelenc,L.Lawton,and A.Efstratiadis.1994.Consruction andcharacterization of a normalized cDNA library.Proc.Natl.Acad.Sci.919228-9232.),这一点已得到Berry等人实验的证实(Berry,R.,T.J.Stevens,N.A.Walter,A.S.Wilcox,T.Rubano,J.A.Hopkins,J.Weber,R.Goold,M.B.Soares,and J.M.Sikela.1995.Gene-based sequence-tagged-sites(STSs)as the basis for a human gene map.NatureGenet.10415-423.;Houlgatte,R.,R.Mariage-Samson,S.Duprat,A.Tessier,S.Bentolila,B.Lamy,and C.Auffray.1995.The Genexpress IndexA resource for gene discovery andgenic map of human genome.Genome Res.5272-304.)。计算结果表明,在COt=5.5时(其中,CO代表总DNA浓度,单位是以核苷酸数计的摩尔每升;t代表时间(复性时间),单位是秒),三类mRNA中高丰度类型的含量急剧减少,各类克隆的丰度也就被限制在一定的范围之内了(Soares,M.B.1994.Construction of directionally clonedcDNA libraries in phagemid vectors.In Automated DNA sequencing and analysis(ed.M.D.Adams,C.Fields and J.C.Venter),pp.110-114.Academic Press,New York,NY.)。
由于在人类全部基因中已有相当大一部分完成了鉴定工作,所以不可能再完全依赖均质化文库的方法来避免对那些在多种组织中都有表达的基因进行重复测序。因此Soares等人认为,选用可对表达量低的基因以及尚未被鉴定的基因有富集作用的差减cDNA文库,将在大规模全部测序中发挥出越来越强的优势。
在为了提高文库中最长的那些cDNA克隆的表现度而所作的尝试中,Soares等人已建立了四种构建均质化文库的方法(参见下面的论述),并将其成功地应用于构建各种均质化文库(包括15个人类文库、3个小鼠文库、2个大鼠文库和1个孟氏血吸虫(Schistosoma mansoni)。其中的人类与小鼠文库已提供给“人类基因组分子分析和表达综合协作组织”(IMAGE)(Lennon,G.G.,C.Auffray,M.Polymeropoulos,andM.B.Soares.1996.The I.M.A.G.E.ConsortiumAn integrated molecular analysis ofgenomes and their expression.Genomics 33151-152.)。而且已从这些文库中得到了总共315,408个表达序列标签(expressed sequence tag,简称为“EST”)。该文献已对上述四种使cDNA文库均质化的方法作一详细说明并进行比较分析;还对构建差减cDNA文库的一种简单流程作了祥细描述。
虽然,现有技术中已有一些均质化和差减方法,但是仍存在许多不足之处。在Soares等人94年发表的文章(Soares,M.B.1994.Construction of directionally clonedcDNA libraries in phagemid vectors.In Automated DNA sequencing and analysis(ed.M.D.Adams,C.Fields and J.C.Venter),pp.110-114.Academic Press,New York,NY.)中详细描述了一种均质化方法(即Soares方法1)。该方法被用于构建1NIB与1NFLS均质化文库,并且从这两个文库中分别获得了45,192条和86,088条表达序列标签(EST)。通过这一均质化方法,可以将克隆的丰度限定在一狭窄范围。但是,用Southern分析法对这两个文库进行的广泛鉴定表明,在应用Soares方法1的均质化过程中,截短的克隆时常会比它们对应的未截短的克隆更容易被保留下来。
为何在用Soares方法1(Soares,M.B.1994.Construction of directionally clonedcDNA libraries in phagemid vectors.In Automated DNA sequencing and analysis(ed.M.D.Adams,C.Fields and J.C.Venter),pp.110-114.Academic Press,New York,NY.)进行均质化过程中,截短的cDNA会比它们对应的未截短更容易保留下来呢?为了弄清这一问题,不妨先看一下Soares方法1的简要步骤(1)由定向克隆的cDNA文库制备的单链DNA与寡聚(dT)18引物退火。
(2)在脱氧核苷酸及二脱氧核苷酸存在下,进行人为控制下的引物延伸反应,产生长约200-300个核苷酸的非编码链3′端延伸产物。
(3)HAP(羟基磷灰石柱)层析,纯化上一步骤产生的部分双链环状DNA。
(4)将步骤(3)所得的部分双链环状DNA进行解链,并使其在一个相对较低的COt下复性(COt约为5-10)。
(5)用HAP纯化剩下的单链环状DNA,即得均质化文库。
(6)将单链环状DNA转化为双链环状DNA。
(7)由穿孔法将双链质粒注入宿主菌。
由于截短的cDNA相对于它们所对应的未截短cDNA而言产生的概率较低,因此,在复性反应中,cDNA的扩增产物将更能与和它有重叠区的未截短cDNA复性,而不是与它本身的模板(即截短的cDNA)复性。另一方面,未截短cDNA的扩增产物也是最可能与其本身的模板(而非截短的cDNA)复性。这不仅因为未截短cDNA的数量高于截短的cDNA,还因为由未截短克隆扩增出的短片段与一个截短的克隆之间存在重叠区的可能性很小。这样造成的结果是,未截短的单链克隆很可能将与不止一个扩增产物(这些扩增片段相互无重叠区)复性,而截短的克隆将很可能保持单链状态,从而在HAP筛选后得以保留在洗脱液中,成为均质化文库的组成部分。
为此Soares等人设计了方法2-1与2-2(即Soares方法2-1与2-2),二者除杂交条件不同外,其余步骤完全一样。借此,可以以由原始文库制备的质粒DNA为模板,在体外合成RNA,并将该RNA用作与以单链环状DNA形式存在的相同文库进行杂交的驱逐片段(driver)(即与文库杂交的核酸片段)。这两种改进方法提高了均质化文库中最长的那些cDNA克隆的表现度。
但是,在每一个以Soares方法2-1和方法2-2构建的文库中,Soares等都发现存在一些远比其它克隆更难以实现均质化的cDNA克隆(如在5Nb2HFLS20W肝/脾文库中的α-球蛋白基因及乳房文库中的G3PD基因)。虽然这一问题在方法2-3中已有改进,但其均质化程度仍难以达到由Soares方法1所得均质化程度相同水平。此外,方法2-3并非一个真正的均质化过程,因为其目的并非使所有cDNA克隆的丰度达到相等(或接近),而在于显著减少(甚至消除,视使用的COt而定)丰度最高的那些克隆的表现度。
虽然Soares等人在综合Soares方法1与方法2优点的基础上尝试建立了方法3与方法4,以便既能达到可由Soares方法1获得的充分的均质化程度,又能达到可由方法2-1,2-2及2-3获得的最长cDNA克隆的高度表现度。但是仍只是局部的改进,所以效果并没有很大提高。
因此,本领域迫切需要高效率且全面地进行大规模随机cDNA测序的技术方案,以便有力地推进分子生物学、遗传学、医药和育种等领域的发展。
本发明的目的在于提供一种适于高效地进行大规模cDNA测序的方法,该方法可应用于各种真核生物,尤其高度植物和动物(如哺乳动物)的cDNA大规模测序。
本发明的发明目的是通过如下技术方案实现的一种cDNA测序方法,它包括以下步骤(1)以生物体的组织为材料,构建cDNA起始文库,其中该文库中的插入片段长度为0.5-3.0kb;(2)按设定的分档Cot值,对步骤(1)的cDNA起始文库进行均质化,从而得到对应于分档Cot值的cDNA均质化文库,其中Co是总DNA浓度,单位是以核苷酸数计的摩尔每升而t是复性时间,单位是秒;
(3)对于前一步骤的各cDNA均质化库,分别挑选5-500个克隆进行DNA测序;(4)用已测序的cDNA克隆来合成对应于已测序列的探针,并将该合成的探针与前一步骤中的cDNA均质化库进行杂交差减,从而从该cDNA库中除去已测序的cDNA克隆,并形成差减化处理过的均质化cDNA库;(5)重复步骤(3)和(4)1-5,000次。
本发明的发明人通过研究发现,为了更有效和更全面地测定在某一生物体、某一组织、或某一细胞中表达的基因,可以通过以下措施来实现构建高质量的cDNA起始文库以保证文库中克隆对应于几乎所有或所有的mRNA;对Cot值进行分档,以便在均质化过程中各种丰度的cDNA被保留在一种或多种cDNA均质化文库中;和通过差减杂交,从均质化cDNA库中除去已被测序的cDNA克隆,使杂交差减的cDNA均质化库保留未被测序的cDNA克隆,从而显著提高下一轮测序的效率。
为了研究基因在不同组织的表达情况,本发明方法还可以用生物体不同组织为材料,构建不同组织的cDNA起始文库;并分别均质化以得到不同组织的均质化库;在不同组织的cDNA均质化库之间进行杂交差减,以形成杂交差减化的均质化cDNA库。此外,还可以先在不同组织的cDNA起始文库之间进行差减杂交,以获得含有差异表达cDNA的起始文库。
在本发明中,“不同组织”指因生物体不同,类型不同,发育阶段不同和/或病理状况不同等而导致的不完全相同的组织。不同组织的例子包括(但并不限于)同一生物体的不同类型的组织(如人的脑和肌肉)、同一生物体不同发育阶段的组织(如胚胎期和成年期的脑)、同一生物体的正常组织和病理组织(如正常的脑和患老年痴呆病的脑组织)、和不同生物体的组织(如大鼠和兔的脑组织)等。
对于构建的待测序的某个cDNA文库,先用不同组织的cDNA起始文库或cDNA均质化文库进行杂交差减,可以有效快速地测得所需的表达存在差异的cDNA。具体地,对于待测序的病理组织cDNA文库,可以用正常组织的cDNA文库进行杂交差减,以便快速有效地获得在病理组织中表达存在差异的cDNA克隆并测序。类似地,用不同发育阶段的同一组织类型的cDNA文库进行杂交差减,就可以获得在不同发育阶段表达存在差异的cDNA克隆。
此外,为了进一步提高测序效率,减少重复测序,在杂交差减步骤中,还可根据已知的cDNA序列信息(尤其如果对于某一物种(如人)已经知道较多的DNA序列信息)人工合成探针,或者利用其他已有的测序过的克隆来合成相应的探针;并将该合成的探针与cDNA起始文库或上一步骤中的cDNA均质化库进行杂交差减。
在本发明中所用的DNA测序方法可选用本领域常规的测序方法,可以手工进行,也可以用自动测序仪进行。一种有用的DNA测序程序包括对于测定的序列片段,判断是否是新的cDNA克隆;对于新的cDNA克隆,进行5′端完整性分析;对于5′端完整的新cDNA克隆,继续测序直到获得全长序列。
在本发明中,在均质化过程中,通常将Cot值被分成3-8档。也可以分成更多的档(如10档)或更少档(如2档)。然而较佳地,分成3-5档。
一种方案是将Cot值被分成如下的三档0<Cot≤1、Cot=1-50和Cot≥50,从而使相同的cDNA起始文库可以在不同Cot值得到对应的,选自下组的均质化库(a)高重复cDNA均质化库;(b)中等重复cDNA均质化库;和(c)低重复cDNA均质化库。另一种方案是将Cot值分成如下的四档0<Cot≤0.5;Cot=0.5-10;Cot=10-50和Cot≥50。尤其是为了测定低丰度的cDNA,可以在Cot值为0-5范围内多划分几档。
获得高质量的cDNA起始文库(即含有大多数或全部cDNA,并且垃圾克隆少)也是成功进行测序的关键。为此,应采用合适的高效扩增技术,对抽提的mRNA进行扩增,以形成相应的cDNA,这些技术包括(但并不限于)混合逆转录酶技术、SMART PCR技术、核苷酸加帽技术和它们的组合。此外,必须对扩增判断进行分离,以去除过短的(如小于200bp)片段。再将符合长度要求的片段插入合适的载体,构建成cDNA起始文库。
一种可用于本发明的构建cDNA起始文库的方法包括抽提mRNA,通过选自下组的技术对mRNA进行扩增,以形成相应的cDNA混合逆转录酶技术、SMART PCR技术、核苷酸加帽技术和它们的组合;分离收集0.5-3.0kb的cDNA片段;将分离的cDNA片段克隆人合适的载体;分离含0.5-3.0kb插入片段的载体;转化合适的菌体,得到cDNA起始文库。
其中,分离收集0.5-3.0kb的cDNA片段可通过电泳割胶或凝胶层析柱纯化技术;而分离含0.5-3.0kb插入片段的载体可通过HPLC反相层析。
作为本发明的发明点之一,本方法发明首先提出了构建高质量cDNA起始基因文库的一系列技术步骤,其目的在于从一开始就最大限度地减少“垃圾”克隆进入各种不同组织的cDNA起始基因文库的数量。其中,通过高效的核酸扩增技术步骤可扩增出最完整长度的cDNA,克隆进载体之前和之后都被纯化处理,这些技术步骤可确保构建的cDNA起始基因文库中的cDNA足够长。
此外,据Soares,et al(Proc.Natl.Acad.Sci.USA Vol.91,pp.9228-9232,)报道,约有13%的IB文库(来源于人脑mRNA)克隆子缺少poly(A)尾。据估计这可能是由于扩增时失常引发所造成的。因此,为了进一步提高cDNA起始文库的质量,可以用结合有d(T)18-25的亲和柱进行处理可大大减少cDNA起始基因文库中缺少poly(A)尾的克隆子数量,以确保构建出的cDNA起始基因文库质量更高。
为了测定在某一生物体中表达的各种基因,为了确保高效率地大规模随机cDNA测序工作的顺利进行,一种有利的方法是构建足够多或所有的来源该物种(如人)的这种高质量的cDNA起始文库。例如,这些cDNA起始文库可以是人类、小鼠、大鼠及血吸虫的cDNA起始文库,也可以是某物种的正常组织或典型病理组织的cDNA起始库,或不同发育阶段组织的cDNA文库。用于构建cDNA起始文库的材料可以是各种组织。例如,可包括(但不限于)源自下列材料的cDNA起始库(a)人婴儿脑,人胎肝脾,人足孕胎盘,人8-9周胎盘,人乳房,成人脑,人视网膜,人松果体腺,人卵巢癌,人黑素细胞,人胎心,人甲状旁腺癌,人衰老成纤维细胞,人多发性硬化病灶,人胎肺,(b)交配后19.5天的小鼠胚胎,交配后17.5天的小鼠胚胎,交配后13.5-14.5天的小鼠胚胎,(c)大鼠心,大鼠肾;(d)8周龄成体血吸虫等。
足够多的高质量cDNA起始基因文库的必要性,是因为在某种单独的细胞类型中,估计有三分之一的mRNA在每个细胞中的表达量只有1-10个拷(Galau,G.A.,Britten,R.J.&Davidson,E.H.(1977)Proc.Natl.Acad.Sci.USA 74,1020-1023.)。而一种单独的细胞类型可以表达出1万条乃至更多的mRNA。如果每条mRNA都产生出两到三条分开的500bp至2000bp的cDNA片段,那么在经过完全的均质化之后,任一单独的cDNA片段的表现度将是1/30,000。当cDNA的来源于复杂组织时,单独片段的表现度将降得更低。如果一个文库来源于在不同阶段表达的所有mRNA,则每一片段的表现度将低于1/100,000。
为此,可通过以下的一系列步骤来获得具有完全代表性(即各类型细胞中的表达序列都可得到体现)的文库。这些步骤为从适当数量的器官或组织出发分别制备每一种器官或组织的文库并使之初步均质化,对每个文库再分别进行专门的均质化。
其次,作为本发明的发明点之二,本发明方法在构建了足够多的高质量cDNA起始基因文库的基础上,提出了对这种高质量的cDNA起始库在足够多不同的Cot值下进行均质化,从而使某一特定正常组织的或典型病理组织的所有cDNA分布在足够多的不同的均质化小库中,每个这种小库都代表了均质化程度更高,针对性更强的一类cDNA集合。来源于同一特定正常组织或典型病理组织cDNA起始库的这些均质化小库的总和就构成该特定正常组织或典型病理组织cDNA的总和。
此外,还可通过差减化步骤可得到只在或主要在该特定正常组织或典型病理组织表达的多种均质化小库。如上所述,差减化可包括用已测过的cDNA克隆所制备的探针对cDNA起始库或小库杂交以去除已测过的cDNA克隆。
已有技术中,,研究人员往往期望找到极少的几个最佳Cot值来解决问题,而实际上并未成功。他们往往把杂交当作简单的二级动力学反应,并且预计,当混合物中最稀有组分有50%复性时,最丰富组分在单链DNA中的表现度将不超过最稀有的组分的两倍。实际上的杂交情况则远比这复杂。最丰富的组分杂交比预期的要快。在一些早期的实验中,最丰富组分在单链DNA中表现度甚至显著低于较稀有的组分。这一效应主要原因很可能是双链片段与剩下的单链cDNA继续杂交。因此,现有技术中的解决方法是选择合适的复性时间以及复性反应物的浓度,以便将上述效应减少到一个尚能让人接受的水平。此外,在反应的不同阶段加入羟基磷灰石以去除双链产物的方法,则可使该效应进一步降低。但即便如此,取极少的几个Cot值进行均质化和差减化的方法仍只能部分解决问题,效果仍不能令人满意。
此外,Smith,M.J.,Brititen,R.J.& Davidson,E.H.(1975)Proc.Natl.Acad.Sci.USA72,4805-4809.;Marrow,J.F.(1974)Doctoral thesis(Stanford Univ.,Stanford,CA),pp,101-190.Mol.Cell.Biol.10,243-253.的实验结果与通过二级动力学反应规律而对复性反应作出的预测有两点不符。其一,丰度最高的cDNA减少的速率比预期的要快,且它们在单链组分的绝对数量上可以低于某些低丰度类群。其二,即使是在最短的复性时间里,从双链组分中仍可找到相当数量的稀有种类cDNA(这两点是与预测不符的两点实验结果)。对第一个反常规现象的解释在该文献上有所讨论(Smith,M.J.,Brititen,R.J.& Davidson,E.H.(1975)Proc.Natl.Acad.Sci.USA 72,4805-4809.;Marrow,J.F.(1974)Doctoral thesis(Stanford Univ.,Stanford,CA),pp,101-190.Mol.Cell.Biol.10,243-253.)。这是因为在复性过程中,如果存在同源区,则来自同一种类的mRNA的长片段与短片段就会复性而产生出一条单链尾巴。这样一种结构能够与剩余的单链DNA中的同源片段继续配对,从而使反应不在遵循二级动力学的机制。这样的动力学行为导致了单链DNA向双链DNA组分的额外转化。于是,即使是象c-myc与TCR这样罕有的mRNA也会在任一复性时间下同时出现在单链DNA组分与双链DNA组分之中。
Soares,et al(Proc.Natl.Acad.Sci.USA Vol.91,pp.9228-9232,)在两个相差不大的Cot值(即5.5和2.5)下分别构造了两个人婴脑文库(1NIB文库和2NIB文库)。结果发现某些克隆在1NIB文库中出现频率减少但在2NIB文库中却增加了。这说明不同Cot值对不同丰度的mRNA在cDNA文库中的出现频率有形成。
以脑为例,基于脑的mRNA丰度估计值的计算表明,最佳富集程度在COt为5-10时获得,但是也只是相对多的部分cDNA而已。如果COt太小(小于等于1),则仅有极高丰度(第一类)mRNA被富集;而中度丰度(第二类)mRNA不能被富集。另一方面,如果COt值过高(大于等于50),则第一类mRNA的富集程度会变得不那么显著,因为此时复杂性高的(第三类)mRNA的表现度也变得高了。因此,本发明提出对于cDNA起始文库,只有根据不同的材料来源和/或测序需要取多个不同的Cot值构建一系列的均质化库。才能确保所有的cDNA都被分布在不同的均质化库中。
作为,本发明的发明点之三,是在对均质化cDNA库每次挑取克隆测序后,都对前一步骤中的均质化cDNA库进行循环性杂交差减,从而除去已测序克隆,并保留未测序克隆,供下一轮测序之用。因此显著提供了测序效率,大大降低了重复测序的可能性。
具体地说,本发明方法可包括以下主要步骤(1)构建高质量的cDNA起始库。
构建cDNA的一般方法参见上文,较佳地,本发明方法在对mRNA进行扩增形成其相应cDNA时宜选用选自下组的一种或多种技术混合逆转录酶技术(使用FD耐热逆转录酶。复旦学报37(2)225-228;中国生物化学和分子生物学报14(2)170-174,1998)、SMART PCR技术(Clontech,SMARTM*PCR cDNALibrary Construction Kit User Manual(PT3000-1)、核苷酸加帽技术等(KazuoMaruyama and Sumio Sugano(1994)Oligo-cappinga simple methods to replace thecap structure of eukaryotic mRNAs with oligoribonucleotides.Gene 138,171-174.Carninci,P.et al.(1996)High-efficiency full-length cDNA cloning by biotinylatedCAP trapper.Genomics 37,327-336.),这样可以提高产物中全长cDNA的比例。其次,为了确保cDNA起始文库中全长cDNA克隆的比例,在扩增出cDNA后,宜分离具有所需长度(通常至少200bp)的扩增产物,例如通过走电泳割胶或凝胶层析柱纯化收集0.5-3.0Kb的cDNA片段,然后再克隆进合适的载体中。最后形成的的载体过HPLC反向柱,并分离出比载体增加插入片段长度(如0.5-3.0-2kb)的峰,收集质粒然后转化进合适的菌体,就得到了高质量的cDNA起始库。
通过以上步骤,可以使得到的高质量cDNA起始库中的“垃圾”克隆所占的比例少到可忽略不计的程度。
一种有利的策略是尽可能得到某一种生物体足够多的不同的正常组织或典型病理组织的高质量的cDNA起始文库,这样就可以获得覆盖该生物体几乎全部或全部表达基因的cDNA起始文库。
(2)按Cot值分档进行均质化接着,按已有均质化方法,对前一步骤构建好的高质量cDNA起始库分别进行均质化,不同点在于,将Cot值进行分档,按不同的Cot值分别进行均质化。因为不存在一个所谓的“最佳Cot值”,按此“最佳Cot值”既可以实现均质化又可保留对应于各种丰度cDNA克隆。相反,只有在不同Cot值下构建一系列的均质化库才能确保所有的cDNA都被分布在不同的均质化库中。
具体操作时可根据不同来源的cDNA起始库需要取不同足够多个Cot值(Cot定义Co代表总DNA浓度,单位是以核苷酸数计的摩尔每升;t代表时间,单位是秒。)。
例如,把Cot值分为高、中、低三档,每一档中再取若干个不同的Cot值,使同一cDNA起始库分别形成三大类均质化库,即高重复cDNA均质化库(Cot值≤1)、中度重复cDNA均质化库(Cot值=1-50)、低重复或稀有cDNA均质化库(Cot值≥50),每一大类均质化还可根据需要进一步细分出更小的均质化库。这一过程简单图示如

图1所示。
(3)预先杂交差减该预先杂交差减步骤是可选的。为了更有针对性地或更快速地找到目的基因,可以对均质化文库进行预先杂交差减。例如在不同组织类型(如脑和肝脏)的相同丰度(如高丰度)cDNA均质化文库之间进行杂交差减,以便快速测定表达存在差异的cDNA。或者,在同一组织(如脑组织)的正常组织和病理组织的cDNA均质化文库之间进行预先杂交差减。或者在同一组织的正常组织的不同丰度的cDNA均质化文库(如高丰度cDNA均质化库和低丰度cDNA均质化库)之间进行预先杂交差减(从而差减掉高丰度cDNA),以便着重测定低丰度的cDNA。
因此,按已有均质化方法,在不同的cDNA库之间进行预先差减性均质化后,可以得到差减化的均质化库。
这一过程如图2所示。其中用非A cDNA起始库(包括B起始库,C起始库……)作模板合成DNA或RNA片段作为驱逐片段(Driver即与始文库杂交的片段,可以是单链DNA或RNA)。
(4)挑选克隆进行测序按本领域常规的测序方法,对上述步骤得到的未经过或经过预先杂交差减处理的cDNA均质化文库或,随机地挑选5-500个克隆进行大规模cDNA测序,判断是否为新的cDNA克隆。如果是新的,做5’端完整性分析,直到拿到全长序列。
(5)杂交差减所有已测出的较长cDNA克隆形成了已测序cDNA库,并以此为基础合成探针,与前一步骤得到的cDNA起始库或均质化库或差减化的均质化文库杂交。结果排除上一步骤文库中已测过的cDNA克隆,并保留未测过的克隆,因此进一步显著了提高大规模测序的效率。保留下的未测序克隆构成了差减化处理过的均质化cDNA库,用于下一循环的测序。
(6)重复上述的(4)测序和(5)杂交差减步骤通过重复测序和(5)杂交差减步骤,便可以高效地测得新序列,并且又保留未测序cDNA供下一步测序。重复该循环的次数没有限制,通常为1-5000次。可以按实际情况和需要决定循环次数,例如根据是否获得了所需基因,每个循环中被测序克隆的数目等。
这一过程的示意图参见图3。
以下通过不起限定作用的实施例进一步测序本发明,这些实施例仅用于阐述目的。
实施例通用方法(A)、HPLC反相层析反相层析(Reversed phase chrometography,RPC)分辨率高,而且因材料耐压,可在高压液相层析柱上使用,使分离高效、快速,因此在核酸分离纯化中应用越来越普遍,并且具有以下优点(1)分离不同大小的寡核苷酸分辨率好,在分离10-130的共聚腺嘌呤核苷酸时,可将相差一个核苷酸的片段分开,而且回收率高,回收样品纯度也好。
(2)分离DNA限制性内切酶片段可分离大小仅相差4个碱基的片段。
(3)分离纯化质粒DNA cc型分子质粒DNA粗制品在RPC柱上分离时,可得到纯化的cc分子。
此外,HPLC柱可用于分离纯化质粒,它可除掉污染性的蛋白和其它核酸(如高分子量RNA),并可使相差一两百碱基对的不同质粒得到较好的分离。通常可选用如下操作条件柱Bio-Gel质粒柱柱大小50 7.8mm
Cetolog号码125-0537样品PUC18100ug流动相A0.02M磷酸钾,50%甲酰胺,pH6.7B0.02M磷酸钾,50%甲酰胺,pH6.7 1.5MKCl梯度50%B 10min,50-70%B 30min流速1.0ml/min检测1uv@270nm(B)、羟基磷灰石柱层析以羟基磷灰石分离单链DNA与双链DNA的方法,在文献中有详细记载(Britten,R.J.,Graham,D.E.& Neufeld,B.R.(1974)Methods Enzymol.29,363-418.)。用于洗脱DNA单链组分与双链组分的磷酸二氢钠浓度分别为0.1M与0.35M。但是,小于200bp的双链DNA与实验中经HaeIII酶切M13mp13DNA而得的各种长度的单链组分一样,都会被浓度为0.1M的磷酸缓冲液洗脱。为了避免这类极小双链DNA片段对单链DNA洗出液造成污染,所有的均质化实验过程均采用大于400bp的DNA组分。
将伯乐公司(Bio-Rad)生产的羟基磷灰石(型号为DNA-grade Bio-Gel HTP)按1∶10的比例悬浮于含0.1%SDS的0.01M磷酸二氢钠溶液(pH7.0)中。将这一匀浆灌入带有水夹套的层析柱中(床体积为1.0ml),洗脱液流速定为8-10ml/hr。其结合与洗脱的特性已通过M13mp18单链DNA的HaeIII酶切产物以及(life Technologies公司出品的)1Kb双链DNA序列梯度(用作双链DNA参照物)而完成了测试。使用Neslab生产的循环式水浴装置将层析柱温度保持在60℃。单链及双链DNA洗脱条件的校准工作是通过使用其浓度从0.05M至0.4M,以每级浓度0.02M递增的一系列分级梯度磷酸二氢钠缓冲液而完成的。所有缓冲液中均含有0.1%SDS。
(C)、洗脱液(峰)的脱盐和浓缩从羟基磷灰石柱上洗脱下来的单链DNA并不适于直接进行PCR扩增。这是因为(i)洗出液中存在高浓度的磷酸二氢钠及SDS,将会抑制TaqDNA多聚酶的活性。(ii)洗出液中单链DNA的浓度太低。为此可选用以下几种方法解决问题,即(Centricon-30过滤,Glassmilk纯化(生产商提供手册),正丁醇与异丁醇浓缩,冰冻干燥后透析等等之中,作者选择Centricon-30过滤法来使微量的单链DNA回收(Stafford,D.W.& Bieber,D.(1975)Biochem.Biophys.Acta 378,18-21.)。因为这一方法有高达90%的回收率并能彻底地将盐分除去。
将层析柱洗出液以离心的方法使其在Centricom-30型滤膜上过滤,从而把洗出液体积由开始时的10-12ml浓缩为100-200ul,并用无菌水或TE缓冲液(10mMTris.HCl,pH8.0/1mM EDTA)对其清洗至少三次。实施例1构建来源于人正常组织或典型病理组织的高质量的cDNA起始库以及只在正常人婴儿脑中表达的均质化和差减化cDNA小库并进行大规模cDNA测序在本实施例中用于构建cDNA起始库的构建材料包括下列材料(随着测序的不断深入,或者根据需要还可增加构建来源于其它正常组织或典型病理组织材料的cDNA起始库)人婴儿脑,人胎肝脾,人足孕胎盘,人8-9周胎盘,人乳房,成人脑,人视网膜,人松果体腺,人卵巢癌,人黑素细胞,人胎心,人甲状旁腺癌,人衰老成纤维细胞,人多发性硬化病灶,人胎肺。
具体地,这些材料是(1)、人婴脑是来自一个死于脊柱肌肉萎缩的72天的女性婴儿。
(2)、人肝脾来自一个胚胎20周的正常女性胎儿。
(3)、所有的细胞Poly(A)+mRNA来自乳房整形手术取出的正常乳房组织。
(4)、所有成人脑的RNA来自于一个死于主动脉瘤破裂的55岁的男子,脑组织(包括左右大脑、顶骨部、颞部、枕部皮层皮层下白质、基底神经节、丘脑、小脑、中脑、脑桥、延髓)取自其死后17-18小时。
(5)、所有的人正常视网膜细胞的RNA来自一个55岁的男性高加索人种。
(6)、正常人的松果体取自三个不同的人种1、48岁的男性高加索人,2、18岁的女性高加索人,3、20岁的美州黑人。
(7)、所有人卵巢癌细胞的mRNA来自一个36岁的三期乳头状囊腺癌病人,已发生表面扩散和转移。
(8)、所有人黑色细胞DNA取自正常包皮。
(9)、正常胎心、胎肺取自胚胎19周的标本。
(10)、人甲状旁腺瘤取自偶发性腺瘤。
(11)、胞质mRNA取自人正常衰老成纤维细胞,该细胞由表皮正常的成纤维细胞质代其细胞表型为胞体增大、扁平、停止分裂(加5-溴尿嘧啶,(48小时后掺入率小于2%)。
在构建过程中,人婴儿脑用Lamda(λ)BA载体构建,其余材料均用pT7T3-Pac载体构建cDNA文库。胚胎肝/脾cDNA文库的克隆位点在PacI和EcoR I酶切点之间,婴儿脑文库的克隆位点在NotI和HindIII之间,其余的均在NotI和EcoR I之间。
以正常女婴脑的cDNA文库为例,其构建过程如下从正常女婴脑(72天)中提取Poly(A)+RNA用于构建cDNA文库(IB)。合成寡聚核苷酸5’-AACTGGAAGAATTCGCGGCCGCAGGAAT18-3’作为合成单链cDNA的引物,这段寡聚核苷酸含有一个NotI位点的(下划线部分)。采用核苷酸加帽技术扩增,这样可以提高产物中全长cDNA的比例。走电泳割胶收集2.0Kb的cDNA片段,然后将cDNA与HindIII接头连接,然后经NotI酶切与含有HindIII和NotI位点的噬菌体L-BA连接,载体L-BA由pEMBL-9(+)衍生而来(Dente,L.,Cesareni,G.&Cortese,R.(1983)Nucleic Acids Res.11,1645-1655.)。L-BA带有氨苄抗性基因,质粒和f1噬菌体的复制起点及多克隆位点(5’HindIII-BamHI-NotI-EcoRI3’)。将重组噬菌体与辅助噬菌体M13K07(Vieira,J.and J.Messing.1987.Production of single-strandedplasmid DNA.Methods Enzymol.1533-11.)感染进入细菌,使双链DNA转变成含cDNA插入片段的单链环状DNA。
按与构建正常女婴脑的cDNA文库相同的方式构建上述其他材料的cDNA文库,不同点仅在于用其他材料替换正常女婴脑,用载体pT7T3-Pac代替Lamid BA,以及用相应的限制性内切酶(PacI/EcoR I或NotI/EcoR I)代替NotI/HindIII。
单链cDNA起始文库的DNA的制备将从IB文库中得到的质粒DNA经过HPLC反向柱和亲和柱纯化后,通过电穿孔法转化进入DH5αF’菌株。菌体与37℃在含Ap(即氨卞青霉素)的培养基中培养至OD600值为0.2,将含量超过20倍的辅助噬菌体进行超感染,过4小时即可获得单链DNA(Vieira,J.et al.1987,同上)。
为了减少双链复制型(RF)DNA的出现,将得到的20μg样品DNA用PvuII酶切(PvuII只切双链DNA),然后用酚/氯仿抽提,加入2ml的加样缓冲液(0.12M磷酸纳缓冲液,pH6.8/10mM EDTA/1%SDS)进行稀释,并通过羟基磷灰石(HAP)层析柱在60℃进行纯化,柱用相同缓冲液(1ml柱床体积,0.4HAP)进行预平衡。用6ml的加样缓冲液进行洗柱,这部分溶液与通过柱的分馏物结合。对样品用水饱和2-丁酮抽提两次,用无水的2-丁酮抽提一次,用水饱和酚抽提一次(每次抽提加3倍体积抽提液)。过Nensorb柱(DuPont/NEN)脱盐离子,用乙醇沉淀,最后走低熔点的琼脂糖凝胶电泳,以便去掉辅助噬菌体DNA和任何在纯化时由于RNase A消化所引进tRNA和寡聚核糖核苷酸,然后切下胶上含单链文库DNA的区域,用β-琼脂糖酶(New EnglishBiolabs)酶切消化,最后DNA进行纯化及用乙醇沉淀。
以上构建好的高质量的脑等材料的cDNA文库(IB),具有如下特点cDNA插入片段的平均长度为1.7Kb,通常从5’端测序即能获得编码区域的遗传信息;代表mRNA poly(A)尾的长度短,从3’端测序便得到较多的有用信息;非重组克隆出现的频率极低(0.1%);对大于2000个克隆单轮测序表明,未曾发现有嵌合cDNA出现。
构建cDNA均质化文库一般认为,3’非编码区与其转录物的匹配几乎是唯一的,因此可以预料,在退火时3’非编码区仅与其互补链配对。相反,由于编码区多代表寡基因或多基因家族的成员,因此编码区间的交叉杂交常导致在均质化过程中文库中稀少的cDNA减少。而作者的方法防止了这种可能性。在开始时,以单链环状cDNA为模板从cDNA 3’端合成一段短的互补链,并在受控条件下将链长度控制在很小的范围内(200±20nt)。由于脑mRNA 3’非编码区的平均长度为750nt(Hawkins,J.D.(1988)Nucleic Acids Res.16,9893-9908.),因此大多数的参与退火反应的合成的互补链应缺少编码区序列。然而,经过这种部分延伸步骤后有必要通过羟基磷灰石层析进行纯化产物,其目的是IB文库中因缺少poly(A)尾而不能进行引物合成的单链DNA在第一轮过柱时约有0.1%的DNA会与柱非特异性结合。
方法包括以下的步骤解链、退火,接着通过羟基磷灰石层析对未缔合环状DNA(均质化文库)进行纯化并电穿孔转化进入细菌。为了通过有限度的延伸合成大约200nt的核苷酸链,加了9pmol的寡聚核苷酸引物5’-GGCCGCAGGAAT15-3’于4.5pmol的单链IB文库DNA中,反应体系体积为150ul,含30mM Tris.Hcl(pH7.5);50mM NaCl;15mM MgCl2;1mM DTT;0.1mM dNTPs;2.5mM ddATP,ddCTP,和ddGTP以及微量[α32P]dCTP的混合物于60℃水浴5分钟,然后50℃水浴15分钟,温度降至37℃,加入75单位Klenow DNA多聚酶(United States Biochemical),并水浴30分钟,加入EDTA(20mM)终止反应,并用酚/氯仿抽提,然后用含50ug经超声处理的变性的鲑鱼精子DNA载体(salmon sperm DNA carrier)的2ml HAP加样缓冲液进行稀释,并通过羟基磷灰石层析柱(如上所述),用6ml的洗脱液(0.4M磷酸纳缓冲液,pH6.8/10mM EDTA/1% SDS)将结合于羟基磷灰石上的部分双链DNA洗脱,加含50ug DNA载体的14ml水,使洗脱液中的磷酸浓度为0.12M,重复以上层析步骤。最后得到的洗脱液用上面介绍的方法进行抽提和脱盐,并用乙醇沉淀DNA。沉淀物(112ng)用2.5ul甲酰胺溶解,加一滴矿物油,在80℃加热3分钟,使DNA链解离,然后加入0.5ul Tris.Hcl(pH7.5),0.1M EDTA,0.5ul 5M NaCl,1ul(5ug)(dT)25-30,0.5ul(0.5ug)延伸引物,使反应体系总体积为5ul,进行退火反应,最后两种成份用于封阻腺嘌呤残基(即初始poly(A)尾)和单链环状DNA上的寡聚核苷酸链的延伸。
退火的混合物在42℃保温,在下述不同时间后各取出2.5ul样品1小时后取出2.5ul样品(计算COt=0.42);(A1+++)2.36小时后取出2.5ul样品(计算COt=1)。(A2+++)2.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成两个高重复cDNA均质化小库(即A1+++和A2+++)。并从洗脱峰中得到单链环状DNA(方法如上所述)。得到的单链环状DNA用分光光度计测定浓度后,从复以上步骤。
退火的混合物在42℃保温,在下述不同时间后各取出1.5ul样品13小时后取出1.5ul样品(计算COt=5.5);(A1++)23.6小时后取出1.5ul样品(计算COt=10)。(A2++)70.8小时后取出1.5ul样品(计算COt=30)。(A3++)2.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成三个中度重复cDNA均质化小库(即A1++、A2++和A3++)并从洗脱峰中得到单链环状DNA(方法如上所述)。得到的单链环状DNA用分光光度计测定浓度后,从复以上步骤。
退火的混合物在42℃保温,在下述不同时间后各取出2.5ul样品118小时后取出2.5ul样品(计算COt=50);(A1+)188小时后取出2.5ul样品(计算COt=80)。(A2+)2.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成两个低重复cDNA均质化小库(即A1+和A2+)。并从洗脱峰中得到单链环状DNA(方法如上所述),按下述方法分别转化形成两个稀有cDNA均质化小库(即A1-和A-2)。由于部分双链DNA的电穿孔转换效率比单链环状DNA要高100倍(Rubenstein,J.L.R.,Brice,A.E.J.,Ciaranello,R.D.,Denney,D.,Porteus,M.H.& Usdin,T.B.(1990)Nucleic Acids Res.18,4833-4842.),于是加入随机六碱基顺序和T7DNA多聚酶(Sequenase version II;United States Biochemical)进行引物延伸,从而使单链环状DNA变成部分双链DNA,其反应混合物体积为10-20ul,含1mM dNTPs。加EDTA(终浓度为20mM)终止反应,经过酚抽提,乙醇沉淀,得到的cDNA溶于10mM Tris.HCl,pH 7.5/1mM EDTA,然后电穿孔转化进入感受态DNA(DH10,GIBCO/BRL)。为了测定转化子数目,在电穿孔后1小时,将10ul菌液涂于含75ug/ml氨苄的LB平板上(测定显示可获得含2.5×106个克隆的均质化文库),用Qiagen质粒试剂盒(Qiagen,Chatsworth,CA)可抽提获得超螺旋质粒DNA。
构建只在正常人婴儿脑中表达的均质化和差减化cDNA小库与上述均质化步骤相同,但以下列cDNA起始库作为模板合成片断与前面构建好的人婴儿脑A1+++和A2+++作差减均质化处理人胎肝脾,人足孕胎盘,人8-9周胎盘,人乳房,成人脑,人视网膜,人松果体腺,人卵巢癌,人黑素细胞,人胎心,人甲状旁腺癌,人衰老成纤维细胞,人多发性硬化病灶,人胎肺。
退火的混合物在42℃保温后分别取Cot值为0.42和1,构建两个均质化小库,这样富集在HAP柱上的是同时在上述cDNA起始库中都高度表达的cDNA,而穿透峰则为只在A+++(A即人婴儿脑)中表达的高丰度cDNA,表示为spA1+++、spA2+++。
同样方法与A++库差减性均质化处理,但退火的混合物在42℃保温后分别取Cot值为5.5,10,30。收集穿透峰转化可得只在A中(即人婴儿脑)表达的中等丰度的三个均质化小库,表示为spA1++、spA2++、spA3++。
同样方法分别与A+和A-库差减性均质化处理,但退火的混合物在42℃保温后分别取Cot值为50,80。收集穿透峰转化可得只在A中(即人婴儿脑)表达的低等丰度的两个均质化小库,表示为spA1+、spA2+以及稀有丰度的两个均质化小库,表示为spA1-和spA2-。
对每一上述步骤得到的小库进行大规模cDNA测序,判断是否为新的cDNA克隆。如果是新的,做5’端完整性分析,直到拿到全长序列。所有已测出的较长的cDNA克隆形成已有cDNA库,并以此合成探针,与前述步骤得到的cDNA起始库及均质化等步骤形成的小库杂交,排除已测过的cDNA克隆,保留为测过的克隆,以进一步提高大规模测序的效率。这一过程简单图示3所示。杂交方法见下文。
菌落杂交将双层尼龙膜(duplicate nylon filters)geneScreenPlus;DuPont/NEN)按方法(Grunstein,M.& Hogness,D.(1975)Proc.Natl.Acad.Sci.USA 72,3961-3965.)进行处理,让菌落在膜上生长以便筛选文库。杂交在42℃下进行,反应体系为50%甲酰胺,5×Denhardt’s溶液,0.75M NaCl,0.15M Tris.HCl,pH7.5,0.1M磷酸纳,2%SDS,其中含经剪切和变性的100ug/ml的鲑鱼精子DNA,放射性探针用Prime-it II试剂盒(Stratagene)通过合成引物制备(Feinberg,A.P.& Vogelstein,B.(1983)Anal.Biochem.132,6-13.Feinberg,A.P.& Vogelstein,B.(1984)Anal.Biochem.137,266-267)。
DNA测序用Wizard Minipreps DNA纯化系统(Promega)制备双链质粒DNA模板,用通用的顺向和反向M13荧光引物从两端测序,用Biomek 1000 workstation(Beckman)测定反应物,然后将反应物转移到PCR仪(Perkin-Elmer/Cetus)上进行循环测定。用370A DNA自动测序仪(Applied Bios)对反应物进行分析。在国家生物技术信息中心(the National Center for Biotechnology Information)服务器上用BLASTalgorithm(Altschul,S.F.,W.Gish,W.Miller,E.Myers,and D.J.Lipman.1990.Basic localalignment search tool.J.Mol.Biol.215403-410.)对核酸和蛋白数据库进行检索。实施例2构建只在或主要在脊髓肌萎缩症婴脑(72天)中表达的均质化和差减化cDNA小库并进行大规模cDNA测序构建来源于人不同组织细胞的高质量cDNA起始库根据生产厂商的说明书,可用Oligotex mRNA试剂盒从脊髓肌萎缩症婴脑(72天)等细胞中的RNA纯化Poly(A)+RNA(用于分离胞质RNA的衰老成纤维细胞除外),但要进行二次纯化。,cDNA文库的构建非常重要。在典型的反应中,1ug的Poly(A)+RNA在37℃条件下与两倍分子的带有NotI标记的(dT)18[对肝/脾文库则带有PacI标记的PacI]过量的引物退火。然后在37℃条件下用上标反转录酶(Life Technologies)进行反转录;或者Poly(A)+RNA可在45℃条件下用四倍过量的带NotI标记的(dT)25引物退火,并在45℃条件下反转录。标记是一个2-6个核苷酸的序列,对不同的文库有不同的特异性,可用于鉴定不同的文库。除了婴儿脑、胎儿肝/脾和足孕胎盘的文库外,其它所有文库的第一链cDNA合成均以以下寡聚核苷酸为引物TGTTACCAATCTGAAG-TGGGAGCGGCCGC-标记-(dT)18或25。对于胎心、脑和足孕的胎盘文库的第一链cDNA合成用AACTGGAAGAATTAATTAAAG-ATCT(dT)18(Pharmacia)为引物。寡聚核苷酸AACTGGAAGAAT-TAATTAAAGATCT(dT)18用于胎儿肝/脾cDNA第一链的合成引物。将双链cDNA用柱长64cm,直径0.2cm的聚丙烯酰氨凝胶柱按分子大小进行凝胶过滤分离,然后用500到1000倍分子过量的接头连接。婴儿脑cDNA带有HindIII酶切位点的接头,然后用NotI酶切,用聚丙烯酰氨凝胶柱进行第二次分离,再定向克隆到载体LafmidBA的NotI和HindIII切点之间(Soares,M.B.1994.Construction of directionally clonedcDNA libraries in phagemid vectors.In Automated DNA sequencing and analysis(ed.M.D.Adams,C.Fields and J.C.Venter),pp.110-114.Academic Press,New York,NY.USA74,1020-1023.)。胚胎肝/脾cDNA用带EcoR I切点的接头连接,如上分离,然后用PacI酶切,定向克隆到pT7T3-Pac载体的PacI和EcoR I的位点之间。其它所有种类的cDNA用带EcoR I切点的接头连接,如上分离后,用NotI酶切,再定向克隆到pT7T3-Pac载体的NotI和EcoR I的位点之间(Pharmacia)。pT7T3-Pac与pT7T3-Pac18D(Pharmacia)大体相同,带有一个修饰过的多位点接头。分别转化E.coli得到来源于人不同组织细胞的最初cDNA文库。分别将从这些最初cDNA文库中得到的质粒DNA经过HPLC反向柱和亲和柱纯化后,通过电穿孔法转化进入DH5αF’菌株,按以下方法可得各种单链和双链高质量cDNA起始文库。
以下是pT7T3-Pac的多接头序列和侧翼序列5’-CACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATM13反向测序引物GACATGATTACGAATTTAATACGACTCACTATAGGGAATTTGGCCT7启动子CTCGAGGCCAAGAATTCCCGACTACGTAGTCGGGGATCCGTCTTSfiIEcoRI SnaBI BamHIAATTAAGCGGCCGCAAGCTTATTCCCTTTAGTGAGGGTTAATTTPact NotI HindIII T3启动子TAGCTTGGCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAM13测序引物AACCCTGGCGTTACCCAACTTAATCGCCTTGCAG-3’。
体外构建纯化的高质量的单链环状DNA起始文库利用GeneII(噬菌体F1的内切酶)和E.coli外切核酶酶III(Exo III)的联合作用,可将双链噬菌体DNA转化成单链,应按厂商的说明进行操作(Life Technologies公司,目录号10356-020)。如前所述(Soares,M.B.1994.Construction of directionallycloned cDNA libraries in phagemid vectors.In Automated DNA sequencmg andanalysis(ed.M.D.Adams,C.Fields and J.C.Venter),pp.110-114.Academic Press,NewYork,NY.USA 74,1020-1023.),得到的单链环状DNA可用HAP层析方式(Bio-Rad)从剩余的双链质粒DNA纯化。噬菌体F1复制的起始蛋白是一种位点特异性的核酸内切酶,它能与噬菌体载体的F1起始点相结合并在超螺旋DNA上造一个切口。切口链以后被Exo III从3′端切掉,产生单链环(Hoheisel,J.D.1993.On the activities ofEscherichia coil exonuclease III.Anal.Biochem.209238-246.),由于Gene II将超螺旋转变成松弛质粒的作用不完全,所以必需用HAP纯化单链环。Gene II的反应是在30℃的条件下进行1小时,典型的反应包括4ulcDNA文库的超螺旋质粒,1ulGeneII(Life Technologies),2ul 10×GeneII缓冲液(Life Technologies),总体积为20ul。随后,在65℃温度下5分钟使GeneII失活,冰冷却后加2ul Exo III(LifeTechnologies,目录号18013-011,65单位/ul),在37℃条件下保温30分钟。再用蛋白酶K(Boehringer Mannheim)将GeneII和Exo III酶切,反应条件为50℃,15分钟,反应总体积100ul,包括10mM Tris(PH7.8),5mM EDTA,0.5%SDS,和136ul蛋白酶K。然后用等体积的酚、氯仿、异戊醇(25∶24∶1)抽提,再用乙醇使DNA沉淀,接着用PvuII在37℃下酶切2小时。这样做是为了使剩余的超螺旋质粒转换成线性DNA分子,以提高其在实验条件下与HAP亲和力。因为PvuII无法切割单链所以在载体上有两个PvuII切点。加2ul加样缓冲液
稀释该反应,并在60℃温度下HAP亲合层析,应当用同样的缓冲液预平衡层析柱(床体积为1ml,0.4g HAP)。用6ml的加样缓冲液清洗过后,将洗后的缓冲液与流通组分合并,然后样品用水饱和的二丁醇抽两次,无水二丁醇抽一次,水饱和的乙醚抽一次(每次抽提用3倍的体积)。残余的乙醚用真空吹干,用Nensorb柱(DuPont/NEN)依照厂商的特别说明进行脱盐,最后浓缩到0.35ml,并用乙醇沉淀。应当指出用GeneII和Exo III制备的单链环DNA与体内噬菌质粒产生的单链DNA极性相反(互补链)。
体内产生高质量的共价闭合单链cDNA起始文库如文献(Vieira,J.& Messing,J.(1978)Methods Enzymol.153,3-11.)所述,用电穿孔方法将原始文库的质粒DNA转入到E.coli DH5αFi菌中,在37℃氨苄青霉素选择培养到OD600为0.2,用10-20倍过量的辅助噬菌体M13KO7(Pharmacia)进行超感染,培养4小时后收集,得到单链环状质粒。
单链环转为双链质粒乙醇沉淀单链环(<50ug),并在11ul水中重悬浮。然后加4ul 5×测序酶缓冲液(USB)和1ul的引物(1ug),将混合物在65℃保温5分钟,37℃3分钟,然后加入1ul的测序(2.0版本,USB公司),1ul0.1M的DTT,2ul混合dNTP(每种脱氧核苷酸的终浓度在10mM),在37℃下保温30分钟。再加入10mM Tris(PH8.0)和1mM EDTA(TE),使四种物质的总容量加到100ul,并用酚、氯仿、异戊醇(25∶24∶1)抽提一次。
用乙醇沉淀质粒DNA并溶于3ul TE。下列寡聚核苷酸用于这个引物延伸反应(1)M13反向测序引物(5i-AGCGGATAACAATTTCACACAGGA-3i),它与体外制备的单链互补。(2)寡聚Amp(5′-GACTGGTGAGTACTCAA-CCAAGTC-3′),它与体内制备的单链pT7T3-Pac或单链Lafmid BA质粒的氨苄青霉素抗性基因互补。
以上构建好的各种高质量cDNA起始文库,具有如下特点cDNA插入片段的平均长度为1.7Kb,通常从5’端测序即能获得编码区域的遗传信息;代表mRNApoly(A)尾的长度短,从3’端测序便得到较多的有用信息;非重组克隆出现的频率极低(0.01%);对大于2000个克隆单轮测序表明,未曾发现有嵌合cDNA重组克隆出现。
构建cDNA均质化小文库这也是一个基于复性动力学的方法。该方法是将由PCR产生的20倍过量的cDNA插入片段与以单链环状形式存在的文库本身杂交,然后用HAP纯化剩余的单链质粒,将其转为双链,用电穿孔法导人DH10B细菌中,最后用氨苄青霉素选择繁殖。cDNA插入片段的PCR扩增是在高保真放大PCR系统(Boehringer Mannheim)中按说明书方法进行的,这个放大系统含有Taq和Pwo DNA酶(Barnes,W.M.1994.PCRamplification of up to 35-kb DNA with high fidelity and high yield from lambdabacteriophage templates.Proc.Natl.Acad.Sci.912216-2220.)的酶混合物组成。将1ul(2.5-5.0ug)DNA模板[双链质粒(脊髓肌萎缩症婴脑、胎儿肺、甲状旁腺瘤、衰老的成纤维细胞cDNA起始文库)或离体制备的单链环状DNA(胎儿心脏、胎儿肝/脾cDNA起始文库]与2uldNTP贮备液(每一种贮备液在反应中的终浓度均为200Um),5ul 20uM的T7引物(5′-TAATACGACTCACTATAGGG-3′),5ul 20uM的T3引物(5′-ATTAACCCTCACTAAAGGGA-3′),10ul 10×1高保真放大系统的缓冲液,0.75ul高保真放大系统的酶混合物(2.6单位),76.25ul的水混合物,然后加入50ul的矿物油,反应在一个Perkin Elmer热循环器中进行,扩增循环条件如下,先在7分钟内将温度从室温升到94℃,然后在94℃保温1分钟,55℃2分钟,72℃3分钟,72℃7分钟,按此过程循环20次。PCR扩增的片段依照说明书由高纯度PCR产物纯化试剂盒纯化,纯化后的PCR产物用乙醇沉淀,溶于5ulTE中,然后将1.5ul(0.5ug)PCR产物与5ul(50ug)的基因DNA(离体制备的单链环状DNA)混合,在混合液中加上去离子甲酰胺,0.5ul(10ug)5′封阻寡聚AV-1(5′-CCTCGTGCCGAATTCTTGGCCTCGAGGGCCAAATTCCCTATAGTGAGTGTATTA-3′),0.5ul(10ug)3′-封阻寡聚AR(5′-ATTAACCCT-CACTAAA-GGGAATAAGCTTGCGGCCGCT20-3i,用于除胎儿肝脾文库之外的所有基因文库或0.5ul(10ug)3′封阻寡聚AV-2(5′-ATTAACCCTCACTAAAGGGAATAAGCTTGCGGCCGCTTAATTAAAGATCT19-3′,仅用于胎儿肝/脾文库),再后用10ul矿物油封口,于80℃下加热3分钟,再加入1ul 10×缓冲液-A[1.2MNaCl,0.1M Tris(pH8.0)和50mM EDTA,用于脊髓肌萎缩症婴脑、胎儿肺、胎儿心脏、甲状旁腺瘤、衰老成纤维细胞cDNA起始文库]或加入1ul 10×缓冲液-B[1.2MNaCl,0.1M Tris(pH8.0)和50mM EDTA和10%的SDS,用于14Nb2HFL20W-胎儿肝/脾cDNA起始文库],再加入1.5ul水,杂交反应在30℃下进行,时间分别如下文所述(分别计算所得的COt值),剩余的单链环状DNA由HAP层析纯化,转为双链,然后用电穿孔法导入的DH10B(Life Technologies)细菌中,如前所述。
以下B代表脊髓肌萎缩症婴脑细胞cDNA起始文库,并以此为例具体说明cDNA均质化小文库的构建过程。前述退火的混合物在30℃保温,在下列不同时间后各取出2.5ul样品0.17小时后取出2.5ul样品(计算COt=0.42);(B1+++)0.4小时后取出2.5ul样品(计算COt=1)。(B2+++)2.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成两个高重复cDNA均质化小库(即B1+++和B2+++)。并从洗脱峰中得到单链环状DNA(方法如上所述)。得到的单链环状DNA用分光光度计测定浓度后,重复以上步骤。
退火的混合物在42℃保温,在下述不同时间后各取出1.5ul样品2.2小时后取出1.5ul样品(计算COt=5.5);(B1++)4小时后取出1.5ul样品(计算COt=10)。(B2++)12小时后取出1.5ul样品(计算COt=30)。(B3++)1.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成三个中度重复cDNA均质化小库(即B1++、B2++和B3++)
并从洗脱峰中得到单链环状DNA(方法如上所述)。得到的单链环状DNA用分光光度计测定浓度后,重复以上步骤。
退火的混合物在42℃保温,在下述不同时间后各取出2.5ul样品20小时后取出2.5ul样品(计算COt=50);(B1+)32小时后取出2.5ul样品(计算COt=80)。(B2+)2.5ul样品分别利用羟基磷灰石层析法使未杂交的单链环状DNA与重新结合的部分双链DNA分开,后者分别转化形成两个低重复cDNA均质化小库(表示为B1+和B2+)。并从洗脱峰中得到单链环状DNA(方法如上所述),按下述方法分别转化形成两个稀有cDNA均质化小库(表示为B1-和B-2)。由于部分双链DNA的电穿孔转换效率比单链环状DNA要高100倍(Rubenstein,J.L.R.,Brice,A.E.J.,Ciaranello,R.D.,Denney,D.,Porteus,M.H.& Usdin,T.B.(1990)Nucleic Acids Res.18,4833-4842.),于是加入随机六碱基顺序和T7DNA多聚酶(Sequenase version II;UnitedStates Biochemical)进行引物延伸,从而使单链环状DNA变成部分双链DNA,其反应混合物体积为10-20ul,含1mM dNTPs。加EDTA(终浓度为20mM)终止反应,经过酚抽提,乙醇沉淀,得到的cDNA溶于10mM Tris.HCl,pH 7.5/1mM EDTA,然后电穿孔转化进入感受态DNA(DH10,GIBCO/BRL)。为了测定转化子数目,在电穿孔后1小时,将10ul菌液涂于含75ug/ml氨苄的LB平板上(测定显示可获得含2.5 106个克隆的均质化文库),用Qiagen质粒试剂盒(Qiagen,Chatsworth,CA)可抽提获得超螺旋质粒DNA。
构建只在或主要在脊髓肌萎缩症婴脑细胞中表达的cDNA均质化小库以下是对前面构建好的脊髓肌萎缩症婴脑细胞cDNA均质化小库分别进行差减化处理。按照说明书,用Olagen Midi-prep的试剂盒可以制备双链质粒DNA。这些DNA来自人正常婴脑,成人脑,人胎肝脾,人足孕胎盘,人8-9周胎盘,人乳房,人视网膜,人松果体腺,人卵巢癌,人黑素细胞,人胎心,人甲状旁腺癌,人衰老成纤维细胞,人多发性硬化病灶,人胎肺等高质量的cDNA起始文库,然后将双链质粒DNA在体外转为单链环状DNA,如前所述,单链环状DNA用HAP层析纯化,作为采用T7和T3引物的PCR扩增的模板,将总量为1.5ug的cDNA起始文库群中(再4ul去离子甲酰胺中)得到的经PCR扩增的DNA插入片段,分别与来自以上构建好的脊髓肌萎缩症婴脑细胞cDNA均质化小库的单链环状混合(在2ul去离子甲酰胺中),加入2.1ul(42ug)的5’封阻寡聚AV-1,和2.1ul(42ug)的3’封阻寡聚AV-2,然后加入10ul矿物油,在80℃下加热反应30分钟,再加入1.2ul 10×缓冲液B和0.6ul水,杂交反应在30℃下及如下文所述不同时间(分别计算所得的COt值)进行,将未杂交的单链环状DNA由HAP纯化,转为双链,用电穿孔法导入DH10B细菌,然后用氨苄青霉素选择繁殖,以得到差减的只在或主要在脊髓肌萎缩症婴脑细胞中表达的cDNA均质化小库。与HAP结合的DNA也作同样的处理和纯化,用于控制实验。
以上与B1+++和B2+++在30℃保温退火,时间分别为0.73小时和1.8小时,相应的Cot值分别为0.42和1,这样富集在HAP柱上的是同时在上述cDNA起始库中都高度表达的cDNA,而穿透峰则为只在B+++中表达的高丰度cDNA,表示为spB1+++、spB2+++。
同样方法与B++库差减性均质化处理,但退火的混合物在30℃保温后时间分别为9.7小时,17.7小时和53.3小时,相应的Cot值为5.5,10和30。收集穿透峰转化可得只在B中表达的中等丰度的三个均质化小库,表示为spB1++、spB2++和spB3++。
同样方法分别与A+和A-库差减性均质化处理,但退火的混合物在30℃保温后时间分别为88.9小时和142小时,相应的Cot值为50和80。收集穿透峰转化可得只在B中表达的低等丰度的两个均质化小库,表示为spB1+、spB2+以及稀有丰度的两个均质化小库,表示为spB1-和spB2-。
对每一上述步骤得到的小库进行大规模cDNA测序,判断是否为新的cDNA克隆。如果是新的,做5’端完整性分析,直到拿到全长序列。所有已测出的较长的cDNA克隆形成已有cDNA库,并以此合成探针,与前述步骤得到的cDNA起始库及均质化等步骤形成的小库杂交,排除已测过的cDNA克隆,保留为测过的克隆,以进一步提高大规模测序的效率。这一过程简单图示3所示。杂交方法见下文。
菌落杂交将双层尼龙膜(duplicate nylon filters)geneScreenPlus;DuPont/NEN)按方法(Grunstein,M.& Hogness,D.(1975)Proc.Natl.Acad.Sci.USA 72,3961-3965.)进行处理,让菌落在膜上生长以便筛选文库。杂交在42℃下进行,反应体系为50%甲酰胺,5×Denhardt’s溶液,0.75M NaCl,0.15M Tris.HCl,pH7.5,0.1M磷酸纳,2%SDS,其中含经剪切和变性的100ug/ml的鲑鱼精子DNA,放射性探针用Prime-it II试剂盒(Stratagene)通过合成引物制备(Feinberg,A.P.& Vogelstein,B.(1983)Anal.Biochem.132,6-13.Feinberg,A.P.& Vogelstein,B.(1984)Anal.Biochem.137,266-267)。
DNA测序用Wizard Minipreps DNA纯化系统(Promega)制备双链质粒DNA模板,用通用的顺向和反向M13荧光引物从两端测序,用Biomek 1000 workstation(Beckman)测定反应物,然后将反应物转移到PCR仪(Perkin-Elmer/Cetus)上进行循环测定。用370A DNA自动测序仪(Applied Bios)对反应物进行分析。在国家生物技术信息中心(the National Center for Biotechnology Information)服务器上用BLASTalgorithm(Altschul,S.F.,W.Gish,W.Miller,E.Myers,and D.J.Lipman.1990.Basic localalignment search tool.J.Mol.Biol.215403-410.)对核酸和蛋白数据库进行检索。
重复测序和差减循环50次,测得新序列的效率远大于10%。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
权利要求
1.一种cDNA测序方法,其特征在于,它包括以下步骤(1)以生物体的组织为材料,构建cDNA起始文库,其中该文库中的插入片段长度为0.5-3.0kb;(2)按设定的分档Cot值,对步骤(1)的cDNA起始文库进行均质化,从而得到对应于分档Cot值的cDNA均质化文库,其中Co是总DNA浓度,单位是以核苷酸数计的摩尔每升而t是复性时间,单位是秒;(3)对于前一步骤的各cDNA均质化库,分别挑选5-500个克隆进行DNA测序;(4)用已测序的cDNA克隆来合成对应于已测序列的探针,并将该合成的探针与前一步骤中的cDNA均质化库进行杂交差减,从而从该cDNA库中除去已测序的cDNA克隆,并形成差减化处理过的均质化cDNA库;(5)重复步骤(3)和(4)1-5,000次。
2.如权利要求1所述的方法,其特征在于,在步骤(1)和(2)中,以该生物体不同组织为材料,构建不同组织的cDNA起始文库;并分别均质化以得到不同组织的均质化库;在不同组织的cDNA均质化库之间进行杂交差减,以形成杂交差减化的均质化cDNA库。
3.如权利要求2所述的方法,其特征在于,所述的不同的组织包括同一生物体的不同类型的组织、同一生物体不同发育阶段的组织、同一生物体的正常组织和病理组织、和不同生物体的组织。
4.如权利要求1所述的方法,其特征在于,步骤(4)中还包括,根据已知的cDNA序列信息人工合成探针,或者利用其他已有的测序过的克隆来合成相应的探针;并将该合成的探针与前一步骤中的cDNA均质化库进行杂交差减。
5.如权利要求1所述的方法,其特征在于,在步骤(3)中,DNA测序包括对于测定的序列片段,判断是否是新的cDNA克隆;对于新的cDNA克隆,进行5′端完整性分析;对于5′端完整的新cDNA克隆,继续测序直到获得全长序列。
6.如权利要求1所述的方法,其特征在于,步骤(2)中,分档Cot值被分成3-8档。
7.如权利要求6所述的方法,其特征在于,该Cot被分成如下的三档0<Cot≤1;Cot=1-50;和Cot≥50,从而得到选自下组的均质化库(a)高重复cDNA均质化库;(b)中等重复cDNA均质化库;和(c)低重复cDNA均质化库。
8.如权利要求1所述的方法,其特征在于,在步骤(1)中,cDNA起始文库的构建步骤包括抽提mRNA,通过选自下组的技术对mRNA进行扩增,以形成相应的cDNA混合逆转录酶技术、SMART PCR技术、核苷酸加帽技术和它们的组合;分离收集0.5-3.0kb的cDNA片段;将分离的cDNA片段克隆入合适的载体;分离含0.5-3.0kb插入片段的载体;转化合适的菌体,得到cDNA起始文库。
9.如权利要求1所述的方法,其特征在于,在步骤(1)中,cDNA起始文库的构建步骤包括抽提mRNA,通过选自下组的技术对mRNA进行扩增,以形成相应的cDNA混合逆转录酶技术、SMART PCR技术、核苷酸加帽技术和它们的组合;分离收集0.5-3.0kb的cDNA片段;将分离的cDNA片段克隆人合适的载体;分离含0.5-3.0kb插入片段的载体;转化合适的菌体,得到cDNA文库;从该cDNA文库中抽提重组DNA,并过Poly(T)10-25亲和柱,收集与Poly(T)10-25结合的重组DNA,转化合适的菌体,得到cDNA起始文库。
10.如权利要求8或9所述的方法,其特征在于,分离收集0.5-3.0kb的cDNA片段是通过电泳割胶或凝胶层析柱纯化技术;而分离含0.5-3.0kb插入片段的载体是通过HPLC反相层析。
全文摘要
本发明提供了一种cDNA循环差减测序方法,它包括步骤:(1)以生物体的组织为材料,构建高质量的cDNA起始文库;(2)按设定的分档C
文档编号C12N15/10GK1264744SQ99102450
公开日2000年8月30日 申请日期1999年2月26日 优先权日1999年2月26日
发明者毛裕民, 谢毅 申请人:上海生元基因开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1