使用转座和重组以操作和测序核酸分子的方法

文档序号:566820阅读:341来源:国知局
专利名称:使用转座和重组以操作和测序核酸分子的方法
背景技术
相关领域位点特异性重组酶位点特异性重组酶是许多微生物(例如病毒和细菌)中存在的蛋白质,其特征在于具有内切核酸酶和连接酶性质。这些重组酶(在某些情况下与相关的蛋白质一起)识别DNA中的碱基特异序列并使位于那些区段侧翼的DNA区段发生交换。重组酶和相关蛋白质共同被称作“重组蛋白质”(见例如,Landy,A.,Current Opinion in Biotechnology 3699-707(1993))。
不同生物的许多重组系统已有描述。见例如,Hoess等,NucleicAcids Research 14(6)2287(1986);Abremski等,J.Biol.Chem.261(1)391(1986);Campbell,J.Bacteriol.174(23)7495(1992);Qian等,J.Biol.Chem.267(11)7794(1992);Araki等,J.Mol.Biol.225(1)25(1992);Maeser和Kahnmann,Mol.Gen.Genet.230170-176(1991)Esposito等,Nucl.Acids Res.25(18)3605(1997)。这些中的许多属于重组酶的整合酶家族(Argos等,EMBO J.5433-440(1986);Vaziyanov等,Nucl.Acids Res.27930(1990))。其中研究最好的可能是λ噬菌体的整合酶/att系统(Landy,A.Current Opinions inGenetics and Devel.3699-707(1993))、P1噬菌体的Cre/loxP系统(Hoess和Abremski(1990),Nucleic Acids and Molecular Biology,第4卷,编Eckstein和Lilley,Berlin-HeidelbergSperinger-Verlag;第90-109页)、和酿酒酵母(Saccaromyces cerevisiae)2μ环状质粒的FLP/FRT系统(Broach等,Cell 29227-234(1982))。转座子转座子是可动遗传因子。转座子在结构上是可变的,被描述为简单型或复合型,但典型地编码一个转座催化酶,术语称作转座酶,该酶两侧为以倒转方向组织的DNA序列。对于转座子特性的更为完全的讨论,可以参考Mobile Genetic Elements,D.J.Sherratt编,OxfordUniversity出版(1995)和Mobile DNA,D.E.Berg和M.M.Howe编,American Soceity fot Microbiology(1989),Washington,DC,两本书均特此并入本文作为参考。
转座子已被用于将DNA插入靶DNA序列中。作为一般原则,转座子在靶DNA的插入是随机事件。该原则的一个例外是转座子Tn7的插入。作为生命周期的一个部分,转座子Tn7可以将自身整合到大肠杆菌(E.coli)基因组的特异位点中(Stellwagen,A.E.和Craig,N.L.Trends inBiochemical Sciences 23,486-490,1998,特此并入本文作为参考)。该位点特异性插入已被用于体内操作杆状病毒的基因组(Lucklow等,J.Virol.674566-4579(1993),特此并入本文作为参考)。对于其特点为向受体DNA分子中的随机位置移动的可转座元件而言,Tn7的位点特异性是非典型的。为了本申请的目的,除非另行指出,转座将用于指随机或半随机的移动,而重组将用于指位点特异性重组事件。因此,Tn7在attTn7位点中的位点特异性插入将被称作重组事件,而Tn7的随机插入将被称作转座事件。
York等(Nucleic Acids Research,26(8)1927-1933,(1998))公开了基于使用Tn5在质粒分子内的转座事件制备嵌套缺失的体外方法。含有侧翼为两个19碱基对的Tn5转座酶识别序列及靶DNA序列的卡那霉素抗性基因的载体,在存在纯化的转座酶蛋白质的情况下作体外孵育。在使用低DNA浓度的条件下,有利于分子内转座反应发生,该反应被成功用于在靶DNA中制备一套嵌套缺失。这些作者提出,通过将终止信号包括在识别序列相邻的所有三种阅读框中,该系统可以用于在靶DNA编码的蛋白质中产生C端截短。此外,这些作者提出,将His标签和激酶区域包含在内可以用于制备N端缺失蛋白质以便作进一步分析。
Devine等(Nucleic Acids Research,223765-3772(1994)和美国专利5,677,170和5,843,772,所有均特此并入本文作为参考)公开了用于体外将DNA区段插入受体DNA分子中的人工转座子的构建。该系统利用酵母YT1病毒样颗粒的插入催化酶作为转座酶活性的来源。使用标准方法,将目的DNA区段克隆在转座子样元件TY1两末端间。当存在TY1插入催化酶时,所获元件将随机整合至第二靶DNA分子中。重组位点由以上提及的重组蛋白介导的重组反应的一个关键特征是DNA分子上参与重组反应的常称作“重组位点”的识别序列。这些重组位点是参加的核酸分子上被重组蛋白质在重组过程中识别和结合的不连续DNA部分或区段。例如,Cre重组酶的重组位点是34个碱基对序列的loxP,该序列由位于8碱基对核心序列侧翼的两个13碱基对反向重复(充当重组酶识别位点)组成。见Sauer,B.,Curr.Opin.Biotech.5521-527(1994)的


图1。识别序列的其它例子包括重组蛋白1 Int所识别的attB、attP、attL、和attR序列。attB为含有两个9碱基对核心型Int结合位点和一个7碱基对重叠区的约25碱基对序列,而attP为含有核心型Int结合位点和臂型Int结合位点以及辅助蛋白质即整合宿主因子(IHF)、FIS和外切酶(Xis)的位点的约240个碱基对序列。见Landy,Curr.Opin.Biotech.3699-707(1993)。核酸测序历史上,使用两种主要技术测序核酸。第一种方法以其共开发者命名为“Maxam和Gilbert测序”(Maxam,A.M.和Gilbert,W.,Proc.Natl.Acad.Sci.USA74560-564,1997),在该方法中DNA被放射性标记,之后被分成四个样品,并用选择性破坏DNA中特异核苷酸碱基和在破坏位点切割分子的化学药品进行处理。通过利用凝胶电泳将所获片段分离为离散条带并将凝胶暴露于X光片,可以从该胶片上读出最初DNA分子的序列。已使用该技术测定了某些复杂DNA分子的序列,包括灵长类动物病毒SV40(Fiers,W.等,Nature 273113-120,1978;Reddy,V.B.等,Science 200494-502,1978)和细菌质粒pBR322(Sutcliffe,G.,Cold Spring Harbor Symp.Quant.Biol.4377-90,1979)的序列。测序的另一技术以其开发者命名为“Sanger测序”(Sanger,F.和Coulson,A.R.,J.Mol.Biol.94444-448,1975),该技术也是传统使用的。该方法使用DNA聚合酶的DNA聚合活性,当与终止反应的双脱氧核苷三磷酸(Sanger,F.等,Proc.Natl.Acad.Sci.USA 745463-5467,1977)和一短引物(可以对两者中的一个作可检测标记)的混合物合并后,该DNA聚合酶产生一系列特异终止在四个脱氧碱基之一的新合成DNA片段。然后通过凝胶电泳分离这些片段,并按以上Maxam和Gilbert测序中所描述的方法确定序列。通过实施四个不同的反应(一个使用一种ddNTP),可以快速地确定甚至相当复杂的DNA分子的序列(Sanger,F.等,Nature265678-695,1977;Barnes,W.,Meth.Enzymol.152538-556,1987)。
尽管已使用了多年,但Maxam/Gilbert和Sanger测序常是耗时、昂贵的,而且在序列确定中易产生错误。更近来,使用基于扩增的方法测定核酸分子的核苷酸序列。可能这些方法中最常用的依赖于对Mullis和同事描述的聚合酶链式反应(PCR)(见美国专利4,683,195和4,683,202)的使用,尤其是使用在自动PCR方法学所用的相对高温度下仍保持活性的热稳定酶如DNA聚合物(见Saiki,R.K.等,Science 239487-491(1988);美国专利4,889,818和4,965,188)。基于扩增的核酸测序方法,尤其是自动双脱氧测序方法如“循环测序”,利用PCR应用中所用的热稳定聚合酶和温度循环以及单个引物和ddNTP,导致从每个模板合成多种双脱氧终止的寡核苷酸,这与标准Sanger测序中产生的单一寡核苷酸是不同的。除了由每个模板合成多种寡核苷酸造成的灵敏度增加外,自动测序中较高变性温度的使用也提高了测序效率(即,发生较少的错误掺入)并允许对GC丰富或含有显著二级结构的模板进行测序。
标准Sanger测序方法和基于扩增的技术的关键要求是测序引物杂交位点的DNA序列的信息。尽管可以使用与目的片段相邻的载体中的引物位点对已知载体中的小片段进行测序,但较大片段的测序则稍成问题。
克服该问题的一种可能方法是合成具有与最初测序反应所确定的序列互补的序列的新引物。该技术常称作目的基因“步行”。
目的基因“步行”的一个替代方法是在目的DNA分子中构建一套嵌套缺失(见Henikoff,Gene 28(3)351-9,1984)。在插入片段和载体的一个连接处切开含有插入片段的载体。然后所获线性DNA分子与外切核酸酶一起孵育,以从插入片段末端起去除碱基。通过改变孵育时间,可以改变从插入片段上去除的碱基数目,获得一系列含有进行性缺失的插入片段的DNA。对核酸酶处理的DNA进行连接和转化后,可以分离出大量在载体的引物位点相邻处具有新序列的克隆,由此允许使用与消化位点相邻的载体序列杂交的引物对整个插入片段进行测序。
在近来发展的技术中,转座子被用于将已知序列的小DNA分子插入未知序列的较大DNA分子中。该已知序列可以用作为引物识别位点,由此可以使用标准测序方法确定与该插入的转座子相邻的较大DNA分子的DNA序列。Strathmann等(Proc.Natl.Acad.Sci.USA,881247-1250,1990)描述了一个这样的系统,该系统利用了gd转座子向靶DNA的体内插入。将目的DNA克隆至“小质粒”中,以便使转座子偏向于插入靶DNA中而非载体DNA中。
Devine等在美国专利5,728,551(特此并入本文作为参考)中描述了一个用于测序应用的体外转座子插入系统。使称作“引物岛(primerisland)”人工转座子(PART)的人工转座子在转座酶存在时与含有靶DNA的载体反应。筛选所获群体以鉴定在靶DNA中含有PART的分子,并对PART在靶中的定位进行作图。选择PART在靶DNA中被适当地间隔的载体群,并使用与PART中序列杂交的引物确定靶的DNA序列。
尽管可以将转座子插入靶DNA分子中,但基于该技术的测序方法仍受到显著的限制。转座子在含有靶DNA的载体中插入的随机本质导致转座子在载体中的同样频繁的插入。因此,目前的方法需要繁琐的分拣程序(例如通过限制性作图)以鉴定在靶DNA中含有适当插入片段的克隆,或接受载体的重复测序。两种方法都相当大地增加了测序计划的劳动量和费用。
因此,在本领域中需要另一种测序系统,以克服现有技术的方法的缺陷,并为更快速、有效和经济地确定核酸分子的核苷酸序列提供条件。本发明满足了这种需要和其它需要。
发明简述本发明一般涉及包含至少一个整合序列和至少一个重组位点的核酸分子(DNA或RNA),其中该重组位点可以定位在整合序列内和/或外(如邻近整合序列)。根据本发明,整合序列可以包括通过重组或整合成为目的核酸分子一部分的任何核酸分子。整合序列的例子包括,但不限于,转座子、插入序列、整合病毒、返巢内含子(homing intron)、或其它整合元件,或它们的各种组合。在一些优选实施方案中,本发明整合序列可以是插入序列或转座子或它们的衍生物。一方面,将至少两个重组位点(它们可以相同或不同)包含在整合序列外的核酸分子中,并且使它们优选位于整合序列的两侧。另一方面,将至少两个重组位点(它们可以相同或不同)包含在整合序列中。本发明特别提供了包含侧翼为重组位点的靶核酸序列和至少一个插在靶序列中的整合序列的核酸分子(优选载体)。根据本发明,重组位点可以用于使序列和目的分子发生交换、从目的分子中缺失序列、将序列掺入目的分子中,或以其它方式用于鉴定、操作、分析和/或选择目的分子。
另一方面,利用同源重组的多种策略可以提供一种替代转座子的方法用于使目的DNA区段整合至靶序列中。这些策略可以在体内或在体外实现。Yu等(Proc.Natl.Sci.USA 2000年5月23;97(11)5978-83)显示,与靶序列有同源性的DNA区段可以有效地被整合至预先确定的DNA序列中。可以使用这些方法将重组位点、选择标记、功能性元件整合至靶序列的确定座位中。类似地,利用体外异源双链形成和修复反应的几个报道也已被用于将基因和其它DNA区段插入靶序列中(Volkov AA等,Nucl.Acids.Res.1999年9月15;27(18)e18)。因此可以使用重组位点侧翼的寡核苷酸所确定的完全或部分同源性,以制备含有定向、部分定向或随机插入的重组位点的靶序列群。
本发明中使用的重组位点可以是核酸分子上参与重组反应的任何重组蛋白识别序列。在本发明那些利用一个以上重组位点的实施方案中,这些重组位点可以相同或不同,并可以彼此重组或可以不或基本上不彼此重组。本发明所考虑的重组位点也包括野生型或天然存在的重组位点的突变体、衍生物或变体。优选的重组位点修饰包括那些增加重组的修饰,该增加基本上选自(i)促进整合重组;(ii)促进切除重组;(iii)降低对宿主因子的需要;(iv)增加共合体或产物形成的效率;和(v)增加共合体和/或产物形成的特异性。优选的修饰包括增加重组特异性的修饰、允许重组位点或其部分(或包含重组位点或其部分的核酸分子)充当扩增(例如通过PCR)的引物位点的修饰、去除一或多个终止密码子的修饰、和/或避免发夹形成的修饰。根据本发明使用的优选重组位点包括att位点、FRT位点和lox位点,或它们的突变体、衍生物、片段、部分和变体(或它们的组合)。本发明考虑的重组位点也包括这些重组位点的部分。
本发明的整合序列可以包含一个或多个元件和/或功能性序列和/或位点(或它们的组合),这包括一或多个与一或多个目的测序或扩增引物互补的序列(例如测序引物位点或扩增引物位点)、一或多个选择标记(例如,毒性基因、抗生素抗性基因等)、一或多个转录或翻译位点或信号、一或多个转录或翻译终止位点、一或多个复制起点、一或多个重组位点(或其部分)等。一个实施方案中,整合序列可以包含一或多个重组位点(或其部分)和一或多个选择标记。因此,根据本发明,可以使用整合序列将一或多个重组位点(或其部分)或其它目的位点或序列掺入任何核酸分子中。根据本发明可以通过体外或体内装配来引入整合序列。本发明的方法可以利用一或多个可以相同或不同的整合序列。因此,具有不同功能性位点或信号的不同整合序列的用途也是本发明所考虑的。
本发明还提供将整合序列插入靶核酸序列中的方法,该方法包含将侧翼为重组位点的目的靶序列和至少一个整合序列,在足以使至少一个所述整合序列整合或插入到所述靶序列中的条件下进行孵育,和任选地筛选含有所述至少一个整合序列的所述靶序列。根据本发明,这些靶序列优选包含在载体中,并且优选的整合序列是一或多个转座子。可以优选地通过使用位于目的靶序列侧翼的重组位点来选择含有至少一个整合序列的靶序列。在一个优选方面,使用重组克隆以转移和选择含有整合序列的靶序列。根据本发明,该方法优选包括(a)从第一核酸分子上将含有至少一个整合序列或其部分并且侧翼为重组位点或其部分的靶序列转移至第二核酸分子上;和(b)选择含有侧翼为重组位点或其部分的所述靶序列的所述第二核酸分子。
在一个优选方面,该第一和/或第二核酸分子是载体。例如,可以通过使用整合序列和/或靶序列所包含的一或多个选择标记,选择所述第二核酸分子。也可以在根据本发明的筛选策略中利用第二核酸分子所包含的一或多个选择标记。作为替代,或者此外,还可以使用负选择以选择除去不含目的靶序列的第二核酸分子。在一个优选方面,利用重组克隆将含有至少一个整合序列的靶序列转移至载体中。优选地,联合使用载体和整合序列所包含的选择标记,以选择含有靶序列/整合序列的期望载体产物。以此方式,可以选择除去不需要的产物,例如含有未插入整合序列的靶序列的载体。
在本发明再一方面,将所选择的含有整合序列的靶序列用于对靶序列的进一步操作中。在此方面,本发明使得可以通过整合序列的随机整合随机插入期望序列,这可以用于操作或分析靶序列。例如,整合序列所包含的测序引物位点在靶序列中的随机插入使得可以对靶序列的各个部分或全部进行测序。一方面,可以利用来自靶的部分序列信息通过分析和比较这些部分序列的序列重叠,确定靶的完整核酸序列。或者,整合序列所包含的扩增引物位点在靶序列中的随机插入使得可以对靶序列的部分或全部进行扩增,而整合序列所包含的转录或调节序列的随机插入使得可以从靶序列的各部分或全部表达出蛋白质或多肽。同样,基因或基因部分(例如GUS、GST、GFP等)的随机插入也使得可以构建一群目的靶序列的基因融合物。此外,整合序列所包含的重组位点(或其部分)的随机插入还使得可以构建一群目的靶序列的缺失突变体。任选地,可以克隆靶序列的缺失部分。因此,本发明涉及操作或分析(例如测序、扩增、缺失、突变、表达分析等)全部或部分靶核酸分子的方法,该方法包含(a)选择含有至少一个整合序列或其部分并且侧翼为重组位点或其部分的靶序列,和(b)对含有所述整合序列的所述靶序列的至少一部分进行操作或分析(例如测序、扩增、突变、表达分析等)。
在一个优选方面,这些操作或分析通过整合序列所包含的一或多个位点来起始或完成。
根据本发明,测序步骤可以包含(a)将待测序的核酸分子和一或多个引物、一或多个核苷酸及一或多个终止试剂混合,以形成混合物;(b)在足以合成一群与所述待测分子的全部或部分互补的分子的条件下,孵育所述混合物;和(c)分离所述群体以确定所述待测分子的全部或部分核苷酸序列。
更具体地,本发明测序方法可以包含(a)使引物与第一核酸分子杂交;(b)使所述分子与一或多个核苷酸及一或多个终止试剂接触;(c)在足以合成一群与所述第一核酸分子的全部或部分互补的核酸分子的条件下,孵育步骤(b)的混合物,其中所述合成分子的长度较所述第一分子的短而且所述合成分子在其3’末端包含终止试剂;和(d)按大小分离所述合成分子,以便可以确定所述第一分子的至少一部分核苷酸序列。
本发明还提供在目的核酸分子中制备缺失的方法,该方法包括使包含至少第一重组位点的核酸分子和包含至少第二重组位点的整合序列在一定条件下接触以便至少一个所述整合序列插入所述核酸分子中;和使至少所述第一和所述第二重组位点重组,籍此造成所述核酸分子的至少一个部分缺失。在一些实施方案中,可以克隆靶核酸分子的缺失部分。在一个优选方面,将在缺失点处产生一个新的重组位点。例如,attP和attB之间的重组可以在缺失点处产生一个attL或attR位点。然后可以使用这些新重组位点对含有这些新重组位点的靶或载体序列作进一步操作。在一个优选方面,目的核酸分子可以是包含靶序列的载体。在此方面,靶序列和/或载体序列可以包含所述第一重组位点,而整合序列(在某些实施方案中为转座子)包含第二重组位点。在此方面,可以首先将靶序列插入含有至少第一重组位点的载体中。另一方面,可以将第一和第二重组位点通过一或多个整合序列掺入靶序列和/或载体中。将整合序列插入靶序列内的一或多个位置后,可以通过允许两个重组位点之间发生重组来制备一群缺失突变体。其它不同大小和不同位置的缺失可以通过在目的靶序列和/或载体内的不同位置包括其它的重组位点来实现。因此,可以将第三、第四和/或第五重组位点插在靶或载体序列内的不同位置(例如通过含有这些不同重组位点的其它整合序列)。在这些位点间造成重组将允许进一步缺失靶或载体序列。例如,可以通过首先在第一和第二重组位点间造成重组以产生第一缺失和一个位于缺失点处的新重组位点(例如一个第三重组位点),在靶或载体序列中插入一个第四重组位点(优选地通过插入含有一或多个重组位点的整合序列),并在所述第三和第四重组位点间造成重组以产生第二缺失并在缺失点处创造一个新的重组位点(例如一个第五重组位点),从而相继地在靶或载体序列中造成缺失。该过程可以重复许多次以在目的靶和/或载体序列中产生许多缺失。
本发明提供置换或交换目的核酸分子中的序列的方法。该方法包括使包含至少第一重组位点的核酸分子和包含至少第二重组位点的整合序列在一定条件下接触,以便至少一个所述整合序列插入所述核酸分子中;和用侧翼为重组位点的至少第二核酸分子置换所述分子中侧翼为所述第一和第二重组位点的一或多个序列。在一些实施方案中,靶序列和第二核酸分子编码肽、多肽或蛋白质,而重组事件将使这些编码的肽、多肽或蛋白质置于同一个阅读框中。该第二分子可以含有一或多个基因或基因的部分。在一个优选方面,用于该置换的目的核酸分子是包含靶序列的载体。在此方面,靶序列和/或载体序列包含所述第一重组位点,而整合序列(优选转座子)包含第二重组位点。在此方面,可以首先将靶序列插入含有至少一个第一重组位点的载体中。另一方面,第一和第二重组位点可以通过一或多个整合序列掺入靶序列和/或载体中。将整合序列插入靶序列内的一或多个位置后,可以通过允许侧翼为重组位点的一群第二核酸分子置换侧翼为所述第一和第二重组位点的分子,制备一群融合物。
本发明另一实施方案中,可以通过以下方法向目的核酸分子中添加一或多个重组位点,该方法包括(a)使一或多个包含一或多个重组位点或其部分的整合序列和一或多个核酸分子接触;和(b)在足以使所述含有重组位点的整合序列掺入所述核酸分子中的条件下,孵育所述混合物。
在一些优选实施方案中,在体外使一或多个核酸分子和一或多个整合序列接触。
一旦该一或多个重组位点(和/或其部分)掺入目的核酸分子后,可以使用这些重组位点转移侧翼为这些重组位点的核酸分子。因此,根据本发明,含有重组位点或其部分的整合序列的随机插入使得可以将许多重组位点(或其部分)掺入目的分子中。通过重组克隆,这些重组位点的使用为将侧翼有重组位点的分子部分转移至一或多个载体中提供了方法。例如,将侧翼为第一和第二重组位点(它们优选不彼此重组)的一或许多目的分子和包含第三和第四重组位点(它们优选不彼此重组)的载体,在足以允许第一重组位点和第三重组位点重组而第二重组位点和第四重组位点重组的条件下,进行混合。然后可以根据本发明选择包含载体和侧翼为重组位点的核酸分子的期望产物。在一个优选方面,可以通过将许多目的分子转移至一或多个载体中,制备一群分子。因此,本发明使得可以构建可以代表起始遗传材料的所有或部分的文库。在一个优选方面,该文库可以使用本发明从cDNA、基因组或染色体遗传材料制备。
在另一方面,可以直接使掺入目的核酸分子中的重组位点进行重组,而不需要转移至不同的核酸分子或载体上。由此,侧翼为重组位点的分子可以在重组位点的重组后环化。优选地,该环状分子在重新环化位点处含有一个新的重组位点。由此,通过使位于目的核酸分子内的第一重组位点和第二重组位点重组,可以创造一个新的环化分子,其包含最初侧翼为重组位点的核酸分子。在一个优选方面,该环化分子含有至少一个复制起点,以便该分子可以在宿主细胞中自主复制或在宿主细胞中起载体的作用。该环化分子还可以含有一或多个选择标记。一方面,可以由一或多个整合序列提供一或多个复制起点和/或选择标记。因此,重组后,该分子优选将包含至少一个重组位点、至少一个选择标记、目的核酸分子和复制起点。因此,本发明提供了方法,通过该方法可以使用重组位点构建一个或一群包含目的原始核酸分子的部分的载体。以此方式,本发明使得可以从起始遗传材料如cDNA、基因组或染色体DNA有效地制备文库。
在一个相关方面,本发明提供了方法,通过该方法可以借助待环化分子内至少第一和第二重组位点的重组使线性核酸分子环化。优选地,该第一和第二重组位点位于线性分子的末端或近末端。在一个优选方面,通过衔接子(其包含至少一个重组位点或其部分)与线性分子的一或两个末端的连接、和/或通过用包含一个重组位点或其部分的引物扩增线性分子,将重组位点加在线性分子的末端或近末端。或者,可以使用包含共价连接的拓扑异构酶的DNA区段,以将接头(例如包含至少一个重组位点或其部分的接头)或其它DNA区段和其它线性DNA区段的末端连接在一起(Shuman,S.,J.Biol.Chem.26932678(1994))。另一方面,可以将添加衔接子及用引物进行扩增组合起来使用以便将重组位点掺入分子的末端。以此方式,可以构建以下线性分子,在该线性分子的第一末端处或邻近处含有第一重组位点而在该线性分子的第二末端处或邻近处含有第二重组位点。根据本发明,这些重组位点的重组将产生环状分子。优选地,该环状分子在再环化的位点处含有一个新的重组位点。在一个优选方面,该环状分子包含一个复制起点和/或至少一个选择标记。一方面,可以将一或多个含有一或多个功能位点如复制起点、选择标记、转录信号等的整合序列整合入此线性或环化分子中,为该分子提供功能性序列。另一方面,整合序列(优选是转座子)使复制起点和任选地至少一个选择标记掺入到该线性或环状分子中。
本发明还涉及实施本发明方法的试剂盒,尤其是用于扩增和测序核酸、构建缺失体、构建突变体、和将重组位点插入目的核酸分子中的试剂盒。这些试剂盒可以包含一或多个本发明核酸分子如整合序列和/或本发明载体。这些试剂盒可以任选地包含选自下组的一或多种其它成分一或多种核苷酸、一或多种聚合酶和/或逆转录酶、一或多种适合的缓冲液、一或多种引物和一或多种终止剂(例如一或多种双脱氧核苷酸)。
本发明组合物、方法和试剂盒优选使用λ噬菌体位点特异性重组系统并最优选地使用GATEWAYTM重组克隆技术(可从InvitrogenCorporation,Life Technologies Division(Rockville,MD)获得)来制备和实施。
根据本领域已知知识、根据以下附图和发明详述,以及根据权利要求,本发明的其它优选实施方案对于普通技术人员将是明了的。
附图简述
图1是本发明重组反应的示意图。
图2示意性表现了转座子在靶核酸分子和/或载体核酸分子中的插入。
图3示意性表现了可以如何使用本发明通过在转座反应后实施重组克隆步骤以选择包含插入序列的靶核酸分子。
图4A是使用含有重组位点的转座子克隆基因组DNA的示意图。
图4B是使用含有经定向以允许生产性和非生产性重组反应得以发生的重组位点的转座子,克隆基因组DNA的示意图。
图5示意性显示了设计用于通过重组转移选择标记的转座子。
图6是使用包含毒性基因的转座子克隆基因组DNA的示意图。
图7是使用包含复制起点的转座子和包含选择标记的转座子克隆基因组DNA的示意图。
图8A是使用本发明组合物和方法构建亚克隆的示意图。
图8B是使用本发明组合物和方法置换一部分靶序列的示意图。
图9是使用含有复制起点的插入序列根据本发明方法构建亚克隆的示意图。
图10是使用本发明组合物和方法从PCR产物构建基因导向载体的示意图。
图11是使用本发明组合物和方法在靶DNA分子中构建缺失的示意图。
图12是使用本发明组合物和方法克隆靶分子的缺失部分的示意图。
图13是使用本发明组合物和方法制备附着于固相基质上的核酸分子群的示意图。
在这些图中,RS指示重组位点并通过数字下标区分这些重组位点,SM和数字下标指示选择标记。两个相容性重组位点的反应产物由RS指明,而下标指出发生重组的这两个位点。
发明详述定义在以下描述中,我们广泛利用大量在分子生物学中使用的术语。为了清晰一致地理解说明书和权利要求(包括指定的范围),我们提供以下定义。
扩增本文所用扩增是指借助一或多种具有聚合酶活性的多肽(例如一或多种核酸聚合酶或一或多种逆转录酶)、用于增加核苷酸序列拷贝数的任何体外方法。核酸扩增导致核苷酸插入DNA和/或RNA分子或引物中,籍此形成一个新的与模板互补的核酸分子。所形成的核酸分子和其模板可以用作模板以合成其它核酸分子。正如本文所用,一个扩增反应可以由多轮核酸复制组成。DNA扩增反应包括例如聚合酶链式反应(PCR)。一个PCR反应可以由5-100个循环的DNA分子变性及合成组成。
基因本文所用基因是指含有多肽或蛋白质表达所必需的信息的核酸序列。它包括启动子和结构基因以及其它参与该蛋白质表达的序列。
宿主本文所用宿主是指作为可复制表达载体、克隆载体或任何核酸分子的受体的任何原核或真核生物。该核酸分子可以包含,但不限于,结构基因、转录调节序列(例如启动子、增强子、阻遏子等)和/或复制起点(ori)。正如本文所用,术语“宿主”、“宿主细胞”、“重组宿主”和“重组宿主细胞”可以互换使用。对于这些宿主的例子,参见Maniatis等,分子克隆实验室手册(Molecular CloningA Laboratory Manual),Cold Spring Harbor Laboratory,Cold Spring Harbor,纽约(1982)。
杂交本文所用术语杂交和进行杂交是指两个互补单链核酸分子(RNA和/或DNA)的碱基配对以给出双链分子。正如本文所用,即使碱基配对并不完全互补,两个核酸分子也可以杂交。因此,只要使用适当的条件(这是本领域熟知的),错配的碱基并不妨碍两个核酸分子的杂交。一些方面,“杂交”是在“严紧条件”下进行。“严紧条件”在本文中用于指42℃在以下溶液中孵育过夜,该溶液包含50%甲酰胺、5×SSC(150mM NaCl,150mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5×Denhardt氏溶液、10%葡聚糖硫酸酯、和20g/ml经剪切的变性鲑精DNA,之后在0.1×SSC中于约65℃洗涤滤膜。
掺入本文作用掺入是指成为核酸(如DNA)分子或引物的一个部分。
插入片段本文所用插入片段是指作为较大核酸分子的一个部分的一段期望核酸区段。根据本发明,插入片段可以是靶核酸分子。
插入片段供体本文所用插入片段供体是指带有插入片段的本发明的两个亲本核酸分子(例如RNA或DNA)中的一个。插入片段供体包含两侧均被重组位点包围的插入片段。插入供体可以是线性的或环状的。在本发明一个实施方案中,插入片段供体是环状DNA分子而且在重组信号之外还包含一段克隆载体序列(见
图1)。当使用一群插入片段或一群核酸区段制备插入供体时,将获得一群插入供体,而且这些供体可以根据本发明进行使用。
整合序列本文所用整合序列是指能够随机插入靶核酸分子中的任何核苷酸序列。整合序列在本领域中又称作可动遗传因子。本领域普通技术人员已知的任何整合序列均可以用于实施本发明,它们包括但不限于转录转座子(可转座元件)、整合病毒(如逆转录病毒)、IS元件、逆转录转座子、接合转座子、果蝇(Drosophila)的P元件、细菌的毒力因子、或真核生物的可动遗传因子如mariner、Tc1和Sleeping Beauty。根据本发明也可以使用本领域技术人员已知的其它可动遗传因子。
文库本文所用文库是指核酸分子(环状或线性)的集合。在一个实施方案中,文库可以包含大量(即两个或多个)核酸分子,这些核酸分子可以或可以不来自于共同的生物、器官、组织或细胞来源。在另一实施方案中,文库代表生物核酸含量的全部或部分或一个显著部分(“基因组”文库),或是代表细胞、组织、器官或生物所表达核酸分子的全部或部分或一个显著部分的一套核酸分子(cDNA文库)。在其它实施方案中,文库可以包含在靶中不同位置含有插入片段的靶DNA分子。文库还可以包含通过一或多个序列的从头合成、诱变等制备的随机序列。这些文库可以或可以不被包含在一或多个载体中。
核苷酸本文所用核苷酸是指碱基-糖-磷酸的组合。核苷酸是核酸分子(DNA和RNA)的单体单位。术语核苷酸包括核糖核苷三磷酸ATP、UTP、CTP、GTP及脱氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP,或它们的衍生物。这些衍生物包括,例如,[αS]dATP、7-脱氮dGTP和7-脱氮dATP。术语核苷酸在本文中还指双脱氧核糖核苷三磷酸(ddNTP)和它们的衍生物。双脱氧核糖核苷三磷酸的举例说明性例子包括,但不限于,ddATP、ddCTP、ddGTP、ddITP和ddTTP。根据本发明,“核苷酸”可以不标记,或可以通过熟知技术作可检测标记。可检测标记物包括,例如,放射性同位素、荧光标记物、化学发光标记物、生物发光标记物和酶标记物。
寡核苷酸本文所用寡核苷酸是包含一段共价连接的核苷酸序列的合成或天然分子,所述核苷酸通过一个核苷酸的戊糖的3’位和相邻核苷酸的戊糖的5’位之间的磷酸二酯键连接在一起。
引物本文所用引物是指在核酸分子(例如DNA分子)的扩增或聚合过程通过核苷酸单体的共价键合而延伸的单链或双链寡核苷酸。一方面,引物可以是测序引物(例如通用测序引物)。另一方面,引物可以包含重组位点或其部分。
产物本文所用产物是指重组克隆程序的过程中第二次重组事件后产生的、包含A和D序列的其中一个期望的子代分子(见
图1)。产物包含待克隆或亚克隆的核酸。根据本发明,当使用一群插入片段供体时,所获产物分子群将含有该插入片段供体群的插入片段的所有或部分,而且优选将含有插入供体的原始分子的代表群。
启动子本文所用启动子是指转录调节序列的一个例子,具体地是指一般被描述为位于起始密码子近端的基因5’区的DNA序列。邻近DNA区段的转录起始于启动子区。阻抑型启动子的转录速率响应阻抑剂而降低。诱导型启动子的转录速率响应诱导剂将增加。组成型启动子的转录速率不受到特异的调节,尽管它可以在一般代谢条件的影响下发生改变。
识别序列本文所用识别序列是指蛋白质、化学化合物、DNA或RNA分子(例如限制性内切酶、修饰性甲基化酶、或重组酶)所识别和接合的一段特定序列。本发明中,识别序列通常是指重组位点。例如,Cre重组酶的识别序列是loxP,它是由位于一段8碱基对核心序列两侧的两个13碱基对的反向重复(充当重组酶结合位点)组成的一段34个碱基对的序列。见Sauer,B.,Current Opinion in Biotechnology 5521-527(1994)的
图1。识别序列的其它例子有重组酶1整合酶所识别的attB、attP、attL、和attR序列。attB是含有两个9碱基对核心型Int结合位点和一个7碱基对重叠区的约25碱基对的序列。attP是含有核心型Int结合位点和臂型Int结合位点以及辅助蛋白质整合宿主因子(IHF)、FIS和切除酶(Xis)的位点的一段约240个碱基对的序列。见Landy,CurrentOpinion in Biotechnology 3699-707(1993)。根据本发明还可以对这些位点进行改造以增强本发明方法中产物的产量。当经改造的该位点缺少的P1或H1域以使得重组反应不可逆转时(例如attR或attP),这些位点可以被称作attR’或attP’,以显示这些位点的这些域已通过某种方式而被修饰。
重组蛋白本文所用重组蛋白包括切除性或整合性蛋白质、酶、辅因子或参与涉及一或多个重组位点的重组反应的相关因子,重组蛋白可以是野生型蛋白质(见Landy,Current Opinion in Biotechnology3699-707(1993))、或其突变体、衍生物、片段和变体。
重组位点本文所用重组位点是指核酸分子上参与整合/重组反应的重组蛋白质识别序列。重组位点是该参与的核酸分子上被位点特异性重组蛋白质在整合或重组初期识别和结合的不连续核酸片段或区段。例如,Cre重组酶的重组位点是loxP,它是由位于一段8碱基对核心序列两侧的两个13碱基对的反向重复(充当重组酶结合位点)组成的一段34个碱基对的序列。见Sauer,B.,Current Opinion in Biotechnology5521-527(1994)的
图1。识别序列的其它例子包括此处所述attB、attP、attL、和attR序列,及它们的突变体、片段、变体和衍生物,这些识别序列被重组蛋白1 Int和被辅助蛋白质整合宿主因子(IHF)、FIS和切除酶(Xis)所识别。见Landy,Current Opinion in Biotechnology3699-707(1993)。
重组克隆(Recombinational Cloning)本文所用重组克隆是指例如描述于美国专利5,888,732(其内容完整地并入本文作为参考)中的一种方法,通过该方法核酸分子或这些分子群体的区段可以在体外或体内被交换、插入、置换、替代或修饰。优选地,该克隆方法是一种体外方法。
抑制盒本文所用抑制盒是指存在于亚克隆载体中含有阻遏子或选择标记的一段核酸区段。
选择标记本文所用选择标记是指通常在特定条件下,允许选出或选择除去含有它的分子(如复制子)或细胞的一段核酸区段。这些标记可以编码一种活性,例如,但不限于,产生RNA、肽或蛋白质;或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。选择标记的例子包括但不限于(1)所编码产物提供对抗毒性化合物的抗性(如抗生素)的DNA区段;(2)所编码产物为受体细胞中否则将缺少的产物的DNA区段(例如tRNA基因、营养缺陷标记);(3)所编码产物抑制基因产物活性的DNA区段;(4)所编码产物可以容易地得到鉴别(例如,表型标记如β-半乳糖苷酶、绿色荧光蛋白(GFP)、和细胞表面蛋白)的DNA区段;(5)与否则将有害于细胞生存和/或功能的产物结合的DNA区段;(6)抑制以上1-5项所述任何DNA区段的活性的DNA区段(例如反义寡核苷酸);(7)与修饰底物的产物(例如限制性内切酶)结合的DNA区段;(8)能够用于分离或鉴定期望分子的DNA区段(例如特异蛋白质结合位点);(9)编码可能是非功能性的特异核苷酸序列(例如,用于分子亚群的PCR扩增)的DNA区段;(10)当缺少时,将直接或间接地赋予对特定化合物的抗性或敏感性的DNA区段;和/或(11)所编码产物在受体细胞中具有毒性的DNA区段。
选择方案本文所用选择方案是指允许从混合物中选出、富集、或鉴定一种或多种期望产物或一种或多种分子的任何方法。在某些优选实施方案中,选择方案导致仅选出、富集一或多种期望产物或分子。正如此处所定义的,选择DNA分子包括(a)选择或富集期望DNA分子的存在量,和(b)选择除去或减少不属于期望DNA分子的DNA分子的存在量。
一个实施方案中,选择方案(可以逆向进行)可以采取三种形式中的一种,这将参照
图1来进行讨论。此处以选择标记和针对它的阻遏子来举例,第一种选出含有区段D和缺少区段C的分子。第二种选择除去含有区段C的分子并选出含有区段D的分子。第二种形式的可能实施方案将具有带有对于体外反应产物待导入的细胞而言有毒性的基因的DNA片段。毒性基因可以是表达为毒性基因产物(毒性蛋白质或RNA)的DNA,或可以是本身自然就具有毒性。(后一情况中,毒性基因应理解为带有其“可遗传性状”的典型定义。)这些毒性基因产物的例子是本领域熟知的,包括但不限于限制性内切酶(如DpnI)、胸苷激酶(TK)基因、细胞凋亡相关基因(如ASK1或bcl-2/ced-9家族成员)、逆转录病毒的基因包括人免疫缺陷病毒(HIV)的那些基因、防卫素如NP-1、反向重复或成对的回文DNA序列、噬菌体的裂解基因如来自fX174或噬菌体T4的那些;抗生素敏感性基因如rpsL、抗微生物剂敏感性基因如pheS、质粒致死基因(Killer gene)、所产生的基因产物对宿主细胞有毒的真核转录载体基因如GATA-1、和在缺少抑制功能时杀死宿主的基因如kicB、ccdB、fx174E(Liu,Q.等,Curr.Biol.81300-1309(1998))、及负面影响复制子稳定性和/或复制的其它基因。或者,毒性基因可以是在体外可选择的,例如限制性位点。
可操作地与诱导型启动子连接的、编码限制性内切酶的许多基因是已知,可以将它们用于本发明。见,如美国专利4,960,707(DpnI和DpnII);5,000,333、5,082,784和5,192,675(KpnI);5,147,800(NgoAIII和NgoAI);5,179,015(FspI和HaeIII);5,200,333(HaeII和TaqI);5,248,605(HpaII);5,312,746(ClaI);5,231,021和5,304,480(XhoI和XhoII);5,334,526(AluI);5,470,740(NsiI);5,534,428(SstI/SacI);5,202,248(NcoI);5,139,942(NdeI);和5,098,839(PacI)。也参见Wilson,G.G.,Nucl.Acids Res.192539-2566(1991);和Lunnen,K.D.等,Gene 7425-32(1988)。
在第二种形式中,区段D带有选择标记。该毒性基因将清除含有该载体供体、共合体和副产物分子的转化体,同时选择标记可以用于选出含有产物的细胞和选择除去仅含有插入片段供体的细胞。
第三种形式选出在同一分子上顺式含有区段A和D的细胞,而非在不同分子上反式含有这两个区段的细胞。这可以通过分成两个无活性片段(分别在区段A和D上)的选择标记来实现。这些片段相对重组位点按一定方式排列,以致当这些区段被重组事件带到一起时,它们可以重新构成一个功能性选择标记。例如,重组事件可以将启动子和结构核酸分子(例如基因)连接在一起,可以将一个结构核酸分子的两个片段连接在一起,或可以将编码存活所需异二聚体基因产物的核酸分子连接在一起,或可以将一个复制子的各部分连接在一起。
位点特异性重组酶本文所用位点特异性重组酶是指一类典型具有至少以下4种活性(或其组合)的重组酶(1)识别一或两个特异核酸序列;(2)切割所述序列;(3)参与链交换的拓扑异构酶活性;和(4)重新缝合切割的核酸链的连接酶活性。见Sauer,B.,Current Opinions inBiotechnology 5521-527(1994)。保守性位点特异性重组不同于同源重组和转座,因为它对于两个参加者具有高度特异性。链交换机制涉及特异DNA序列的切割和重新连接,而没有DNA的合成(Landy,A.(1989)Ann.Rev.Biochem.58913-949)。
结构基因正如本文所用,结构基因是指可以被转录为随后可翻译成特异多肽所特征性的氨基酸序列的信使RNA的核酸序列。
亚克隆载体本文所用,亚克隆载体是指包含一个环状或线性核酸分子的克隆载体,其优选包括一个适当的复制子。本发明中,亚克隆载体(
图1中区段D)还可以含有期望掺入终产物中作用于克隆的DNA插入片段(
图1中区段A)或与克隆的DNA插入片段一起作用的功能性和/或调节元件。亚克隆载体还可以含有选择标记。
靶核酸分子正如本文所用,靶核酸分子是指使用本发明所作用的目的核酸区段(优选DNA)。
模板正如本文所用,模板是指待扩增、合成或测序的双链或单链核酸分子。对于双链DNA分子,在可以对这些分子进行扩增、合成或测序之前将其双链变性以形成第一和第二链,或可以直接使用该双链分子作为模板。对于单链模板,和模板的至少一个部分互补的引物在适合的条件下进行杂交,然后具有聚合酶活性的一或多种多肽(例如DNA聚合酶和/或逆转录转录酶)可以合成与该模板的全部或部分互补的分子。或者,对于双链模板,可以联合使用一或多个转录调节序列(例如一或多个启动子)和一或多个聚合酶,以制备与模板的全部或部分互补的核酸分子。根据本发明,新合成的分子可以和最初模板等长或比最初模板短。在新合成分子的合成或延伸过程中的错配掺入或链滑移(strand slippage)可以导致一或多个错配碱基。因此,合成的分子不一定完全和模板互补。此外,可以在合成或扩增过程中使用一群核酸模板以产生一群典型地代表初始模板群的核酸分子。
转录调节序列本文所用转录调节序列是指核酸分子上所包含的以任何构型或几何形状存在的功能性核苷酸链,该序列的作用是调节一或多个结构基因向信使RNA的转录。转录调节序列包括,但不限于,启动子、增强子、阻遏子等。“转录调节序列”、“转录位点”和“转录信号”可以互换使用。
载体正如本文所用,载体是指给插入片段提供有用的生物学或生物化学性质的核酸分子(优选DNA)。例子包括质粒、噬菌体、自主复制序列(ARS)、着丝粒、和能够在体外或在宿主细胞中复制或被复制、或能够将期望核酸区段递送至宿主细胞内的期望位置的其它序列。载体可以具有一或多个限制性内切酶识别位点,在该位点处序列可以以可确定的方式被切开而不丧失载体的基本生物功能,而且可以在此位点处拼接入核酸片段以便造成其复制和克隆。载体还可以提供引物位点(例如为PCR)、转录和/或翻译起始和/或调节位点、重组信号、复制子、选择标记等。明显地,根据本发明,还可以应用不要求使用同源重组、转座或限制性酶的插入期望核酸片段的方法(例如,但不限于,PCR片段的UDG克隆(美国专利5,334,575,完整地并入本文作为参考)、TA克隆等),以将片段克隆至待使用的克隆载体中。克隆载体还可以含有一或多个适用于鉴定转化了克隆载体的细胞的选择标记。
载体供体正如本文所用,载体供体是指本发明两个亲本核酸分子(例如RNA或DNA)之一,其带有包含了将成为期望产物一部分的载体的区段。载体供体包含亚克隆载体D(或如果插入片段供体没有已经含有克隆载体,则可以将其称作克隆载体)和重组位点包围的区段C(见
图1)。区段C和/或D可以含有按上述选择方案有助于选择期望子代产物分子的元件。重组信号可以相同或不同,并可以被相同或不同的重组酶作用。此外,载体供体可以是线性或环状。
本文所用的重组DNA技术和分子及细胞生物学领域中使用的其它术语一般可以被适用领域的普通技术人员所理解。概要本发明涉及通过将至少一个整合序列(例如转座子)插入靶核酸分子中、随后采用重组克隆将该修饰的靶核酸分子转移至载体,对核酸分子(RNA或DNA)进行的构建。根据本发明,重组克隆使得可以有效筛选和鉴定含有包含了整合序列的全部或部分的靶序列的分子(尤其是载体)。因此,可以将目的位点或序列(整合序列所包含的)插入靶序列中,以便对靶核酸分子作进一步操作。待导入靶核酸分子内的本发明整合序列可以包含任何数量或组合的功能性序列,例如引物位点(如引物如测序引物或扩增引物可以与之杂交以起始核酸合成、扩增或测序的序列)、转录或翻译信号或调节序列如启动子、核糖体结合位点、实现翻译的序列如Kozak和Shine-Delgarno序列、起始密码子、复制起点、终止信号如终止密码子、重组位点(或其部分)、选择标记、和构建(例如N端或羧基端)蛋白质融合物的基因或基因的部分如GST、GUS、GFP和它们的组合。插入这些目的序列后,可以一各种方式操作这些分子,这些方法包括对靶序列的全部或部分进行测序或扩增(即,通过使用整合序列所导入的至少一或多个引物位点)、突变靶序列(即,通过插入、缺失或替代靶序列)、和从靶序列或部分表达蛋白质(即,通过插入翻译和/或转录信号)。
本发明还涉及通过在分子中插入含重组位点的整合序列以及进行重组克隆或造成插入的重组位点的重组,来克隆核酸分子(例如基因组DNA或cDNA)。因此,可以将一或多个包含至少一个重组位点的整合序列插入目的分子内,以便允许重组克隆或克隆该分子或其部分。在此方面,整合序列还可以包含其它目的功能性序列(例如引物位点、转录和翻译信号、终止信号、选择标记、复制起点等,见上述),以允许对通过本发明方法获得的分子作进一步操作。
用于本发明的重组位点可以是参与重组反应的任何识别序列。这些重组位点可以相同或不同,并可以是野生型或天然存在的重组位点或是修饰的或突变的重组位点。本发明所用重组位点的例子包括,但不限于,λ噬菌体的重组位点(如attP、attB、attL和attR及它们的突变体或衍生物)和来自其它噬菌体如P1、phi80、P22、P2、186、P4和P1的重组位点(包括lox位点如loxP和loxP511)。根据本发明可以使用这些系统的相应重组蛋白以及指明的重组位点。提供用于本发明的重组位点和重组蛋白的其它系统包括酿酒酵母的FLP/FRT系统、解离酶家族(例如gd、Tn3解离酶、Hin、Gin和Cin)、和IS231和其它苏云金芽孢杆菌(Bacillus thuringiensis)的可转座元件。本发明所用的优选重组蛋白质和突变或修饰的重组位点包括描述于以下文献中的那些美国专利5,888,732、共同待决的美国申请09/438,358(1991年11月12日提交)和共同待决的美国申请09/517,466(2000年3月2日提交),以及与可从Invitrogen Corporation,Life Technologies Division(Rockville,MD)获得的GATEWAYTM克隆技术有关的那些。整合序列本领域技术人员已知的任何整合序列均可以用于实施本发明。整合序列在本领域中又称作可动遗传因子。在一些优选实施方案中,整合序列可以是转座子(可转座元件)。本领域技术人员已知的任何转座子序列均可以适合用于本发明。在一些优选实施方案中,适用于本发明的转座子包括,但不限于,Tn3家族转座子、Tn3、TnA、gd、Tn1000、Tn5、Tn1721、Tn7、Tn9、Tn10和它们的衍生物和突变体。
在其它优选实施方案中,整合序列可以是整合性病毒。在一些优选实施方案中,整合性病毒可以是λ类噬菌体。λ类噬菌体被发现包括,但不限于,大肠杆菌噬菌体如1、21、434、f80和HK022以及沙门氏菌(Salmonella)噬菌体如P22。在其它优选实施方案中,整合性病毒可以是与l无关的噬菌体,如Mu-1、P2和P4。本领域技术人员已知的其它整合性病毒也可以用于实施本发明。
在其它优选实施方案中,整合序列可以是IS元件如IS1、IS2、IS4、IS5和它们的衍生物和突变体。在其它实施方案中,整合序列可以是逆转录病毒、逆转录转座子、接合转座子、果蝇的P元件、细菌毒力因子或真核生物的可动遗传因子如mariner、Tc1和Sleeping Beauty。根据本发明,也可以使用本领域技术人员已知的其它可动遗传因子。复制起点复制起点(ori)是核酸分子中核酸分子起始复制处的核酸序列。正如本文所用,注意词复制起点包括可定义的复制起点以及核酸分子复制所必需的一或多个相邻控制元件。复制过程中DNA合成的可定义起始点和相邻控制元件或多个元件的这种组合也可以被称作复制子。适合用于本发明的复制子包括,但不限于,pMB1复制子、p15A复制子、pSC101复制子、ColE1复制子、R6K复制子、F复制子、P1复制子、Rts1复制子、pColV-K30复制子、ldv复制子、pIP522复制子、R1162/RSF1010复制子、RK2复制子、pSa复制子和RA1复制子。适于实施本发明的复制子并不限于那些在大肠杆菌中起作用的复制子。在其它生物中起作用的复制子包括,但不限于,PS10复制子、pCTTI复制子、pWV02复制子、pF3A复制子和pIP404复制子。适用于真核细胞,包括但不限于昆虫细胞、酵母细胞、哺乳动物细胞、两栖类动物细胞或下述的所有宿主细胞,的复制子可以联合本发明使用。宿主细胞本发明还涉及包含本发明一或多个核酸分子或载体,尤其是此处描述的那些核酸分子和载体,的宿主细胞。根据本发明此方面可以使用的代表性宿主细胞包括,但不限于,细菌细胞、酵母细胞、昆虫细胞、植物细胞、和动物细胞。优选的细菌宿主细胞包括埃希氏菌属(Escherichiaspp.)细胞(尤其是大肠杆菌(E.coli)细胞,最尤其是大肠杆菌菌株DH10B、Stbl2、DH5α、DB3、DB3.1(优选大肠杆菌LIBRARY EFFICIENCYDB3.1TM感受态细胞;Invitrogen Corporation,Life TechnologiesDivision,Rockville,MD)、DB4和DB5(参见2000年3月2日提交的美国申请518,188,其公开文本完整地并入本文作为参考)、大肠杆菌W菌株如1999年6月22日提交的美国临时专利申请60/139,889描述的那些)、芽孢杆菌属(Bacillus spp.)细胞(尤其是枯草芽孢杆菌(B.subtilis)和巨大芽孢杆菌(B.megaterium)细胞)、链霉菌属(Streptomyces spp.)细胞、欧文氏杆菌属(Erwinia spp.)细胞、克雷白氏杆菌属(Klebsiella spp.)细胞、沙雷氏菌属(Serratia spp.)细胞(尤其是粘质沙雷氏菌(S.marcessans)细胞)、假单胞菌属(Pseudomonas spp.)细胞(尤其是铜绿假单胞菌(P.aeruginosa)细胞)、和沙门氏菌属(Salmonella spp.)细胞(尤其是鼠伤寒沙门氏菌(S.typhimurium)和伤寒沙门氏菌(S.typhi)细胞)。优选的动物宿主细胞包括昆虫细胞(最尤其是Drosophila melanogaster细胞、草地贪夜蛾(Spodopterafrugiperda)Sf9和Sf21细胞、及粉纹夜蛾(Trichoplusa)High-Five细胞)、线虫细胞(尤其是C.elegans细胞)、鸟类细胞、两栖类动物细胞(尤其是滑爪蟾(Xenopus laevis)细胞)、爬行动物细胞、和哺乳动物细胞(最尤其是CHO、COS、VERO、BHK和人细胞)。优选的酵母细胞包括酿酒酵母细胞和巴斯德毕赤氏酵母(Pichia pastoris)细胞。这些和其它适合的宿主细胞均可以从商业途径获得,例如从InvitrogenCorporation,Life Technologies Division(Rockville,Mayland)、美国典型培养物保藏中心(Manassas,Virginia)、和农业研究机构保藏中心(NRRL;Peoria,Illinois)购买获得。
向此处所述宿主细胞中导入本发明的核酸分子和/或载体,以产生包含本发明一或多个核酸分子和/或载体的方法将是本领域普通技术人员熟悉的。例如,可以使用感染、转导、转染和转化的熟知技术,向宿主细胞中导入本发明核酸分子和/或载体。或者,可以以沉淀的形式例如磷酸钙沉淀的形式,或和脂形成复合物的形式,向宿主细胞中导入本发明核酸分子和/或载体。也可以使用电穿孔将本发明核酸分子和/或载体导入宿主中。同样,可以将此类分子导入化学感受态细胞中。在一些优选实施方案中,化学感受态细胞是大肠杆菌细胞,尤其是大肠杆菌W细胞。如果载体是病毒,则可以体外对其进行包装或将其导入包装细胞中,然后可以将包装病毒转导至细胞中。因此,根据本发明的此方面,适于将本发明核酸分子和/或载体导入细胞中的广泛多种技术是本领域技术人员熟知的和常规的。在以下文献中对这些技术作了详细的综述Sambrook,J.等,分子克隆实验室手册(Molecular Cloning,A Laboratory Manual)第2版,Cold Spring Hatbor,NYCold Spring Harbor Laboratory Press,第16.30-16.55页(1989);Watson J.D.等,重组DNA(Recombinant DNA)第2版,纽约W.H.Freeman and Co.,第213-234页(1992);和Winnacker,E.-L.,从基因到克隆(From Genes to Clones),纽约VCH Publishers(1987),这些是详细描述这些技术的许多实验室手册的例子,为了它们的相关公开,将它们完整地并入本文作为参考。聚合酶本发明所用聚合酶包括但不限于聚合酶(DNA和RNA聚合酶)和逆转录酶。DNA聚合酶包括,但不限于,嗜热杠热菌(Thermus thermophilus)(Tth)DNA聚合酶、水生栖热菌(Thermus aquaticus)(Taq)DNA聚合酶、那不勒斯栖热袍菌(Thermotoga neopolitana)(Tne)DNA聚合酶、海栖热袍菌(Thermotoga maritima)(Tma)DNA聚合酶、Thermococcus litoralis(Tli或VENTTM)DNA聚合酶、激烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶、DEEPVENTTMDNA聚合酶、Pyrococcus woosii(Pwo)DNA聚合酶、火球菌属物种(Pyrococcus sp)KOD2(KOD)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillus sterothermophilus)(Bst)DNA聚合酶、Bacilluscaldophilus(Bca)DNA聚合酶、酸热硫化热菌(Sulfolobusacidoaldarius)(Sac)DNA聚合酶、嗜酸热原体(Thermoplasmaacidophilum)(Tac)DNA聚合酶、黄栖热菌(Thermus flavus)(Tfl/Tub)DNA聚合酶、红栖热菌(Thermus ruber)(Tru)DNA聚合酶、Thermusbrockianus(DYNAZYMETM)DNA聚合酶、热自养甲烷杆菌(Methanobacterium thermoautotrophicum)(Mth)DNA聚合酶、分枝杆菌属(mycobacterium)DNA聚合酶(Mtb,Mlep)、大肠杆菌pol I DNA聚合酶、T5 DNA聚合酶、T7 DNA聚合酶、和一般的pol I型DNA聚合酶和它们的突变体、变体和衍生物。RNA聚合酶例如T3、T5和SP6及它们的突变体、变体和衍生物也均可以用于本发明。
本发明所用核酸聚合酶可以是中温的或嗜热的,优选嗜热的。优选的中温DNA聚合酶包括可以从以下生物分离的所有DNA聚合酶的Pol I家族(和它们相应的Klenow片段)如大肠杆菌、流感嗜血杆菌(H.influenzae)、D.radiodurans、H.pylori、C.auratiacus、R.prowazekii、T.pallidum、Synechocystis sp.、枯草芽孢杆菌(B.subtilis)、L.lactis、S.pneumoniae、M.tuberculosis、M.leprae、M.smegmatis、噬菌体L5、phi-C31、T7、T3、T5、SP01、SP02、酿酒酵母(S.cerevisiae)MIP-1、和真核生物C.elegans及D.melanogaster(Astatke,M.等,1998,J.Mol.Biol.278,147-165)的线粒体;分离自任何来源的pol III型DNA聚合酶,以及它们的突变体、衍生物或变体,等。可以在本发明方法和组合物中使用的优选热稳定DNA聚合酶包括Taq、Tne、Tma、Pfu、KOD、Tfl、Tth、Stoffel片段、VENTTM及DEEPVENTTMDNA聚合酶、和它们的突变体、变体和衍生物(美国专利5,436,149;美国专利4,889,818;美国专利4,965,188;美国专利5,079,352;美国专利5,614,365;美国专利5,374,553;美国专利5,270,179;美国专利5,047,342;美国专利5,512,462;WO92/06188;WO92/06200;WO96/10640;WO97/09451;Barnes,W.M.,Gene,11229-35(1992);Lawyer,F.C.等,PCR Meth.Appl.2275-287(1993);Flaman,J.M.等,Nucl.Acids Res.22(15)3259-3260(1994))。
用于本发明的逆转录酶包括任何具有逆转录酶活性的酶。这些酶包括,但不限于,逆转录病毒的逆转录酶、逆转录转座子的逆转录酶、乙型肝炎病毒的逆转录酶、花椰菜花叶病毒的逆转录酶、细菌的逆转录酶、Tth DNA聚合酶、Taq DNA聚合酶(Saiki,R.K.等,Science 239487-491(1988);美国专利4,889,818和4,965,188)、Tne DNA聚合酶(WO96/10640和WO97/09451)、Tma DNA聚合酶(美国专利5,374,553)和它们的突变体、变体或衍生物(参见例如WO97/09451和WO98/47912)。用于本发明的优选酶包括RNase H活性降低、基本上降低或消除了的那些酶。“RNaseH活性基本降低”的酶是指该酶具有相应野生型或RNase H+酶(如野生型Moloney鼠白血病病毒(M-MLV)、禽成髓细胞瘤病毒(AMV)或Rous肉瘤病毒(RSV)逆转录酶)的RNase H活性的不到约20%、更优选不到约15%、10%或5%、最优选不到约2%。任何酶的RNase H活性均可以通过多种测试方法来确定,这些方法例如描述于如美国专利5,244,797;Kotewicz,M.L.等,Nucl.Acids.Res.16265(1988);和Gerard,G.F.等,FOCUS14(5)91(1992)中的那些,所有这些文献的公开文本均完整地并入本文作为参考。用于本发明的尤其优选多肽包括,但不限于,M-MLVH-逆转录酶、RSVH-逆转录酶、AMVH-逆转录酶、RAV(Rous相关病毒)H-逆转录酶、MAV(成髓细胞瘤相关病毒)H-逆转录酶、HIVH-逆转录酶。(参见美国专利5,244,797和WO98/47912)。然而,本领域普通技术人员将理解,能够从核糖核酸分子产生DNA分子(即具有逆转录酶活性)的任何酶均可以同等地用于本发明的组合物、方法和试剂盒中。
用于本发明的具有聚合酶活性的酶可以从商业途径获得,例如从Invitrogen Corporation,Life Technologies Division(Rockville,Maryland);Perkin-Elmer(Branchburg,New Jersey);New EnglandBiolabs(Beverly,Massachusetts);或Boehringer MannheimBiochemicals(Indianapolis,Indiana)获得。用于本发明的具有逆转录酶活性的酶可以从商业途径获得,例如从Invitrogen Corporation,Life Technologies Division(Rockville,Maryland);Pharmacia(Piscataway,New Jersey);Sigma(Saint Louis,Missouri);或Boehringer Mannheim Biochemicals(Indianapolis,Indiana)获得。或者,可以根据本领域普通技术人员熟知的分离和纯化天然蛋白质的标准程序(参见例如Houts,G.E.等,J.Virol.29517(1979)),从其天然病毒或细菌来源分离具有聚合酶活性的聚合酶或逆转录酶。此外,这些聚合酶/逆转录酶可以通过本领域普通技术人员熟悉的重组DNA技术来制备(参见例如Kotewicz,M.L.等,Nucl.Acids Res.16265(1988);美国专利5,244,797;WO98/47912;Soltis,D.A.和Skalka,A.M.,Proc.Natl.Acad.Sci.USA 853372-3379(1988))。具有聚合酶活性和逆转录酶活性的酶的例子包括本申请中描述的所有那些。核酸合成、扩增和测序的方法本发明可以联合涉及核酸分子如DNA(包括cDNA)和RNA分子合成的任何方法一起应用。这些方法包括,但不限于,核酸合成方法、核酸扩增方法和核酸测序方法。
根据本发明的此方面,核酸合成方法可以包含一或多个步骤。例如,本发明提供合成核酸分子的方法,其包括(a)将核酸模板(例如,包含整合序列的靶分子)和一或多个引物和一或多个具有聚合酶或逆转录酶活性的酶混合,以形成混合物;和(b)在足以产生和模板的全部或部分互补的第一核酸分子的条件下,温育该混合物。根据本发明的此方面,核酸模板可以是DNA分子如cDNA分子或文库,或RNA分子如mRNA分子。足以允许合成发生的条件如pH、温度、离子强度和孵育时间可以由本领域技术人员来优化。
根据本发明,可以从获自天然来源如各种细胞、组织、器官或生物的核酸分子制备靶或模板核酸分子或文库。可以用作核酸分子来源的细胞可以是原核细胞(细菌细胞,包括埃希氏杆菌属、芽孢杆菌属、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、葡萄球菌属(Staphlococcus)、链球菌属(Streptococcus)、梭状芽胞杆菌属(Clostridium)、衣原体(Chlamydia)、奈瑟氏球菌属(Neisseria)、密螺旋体属(Treponema)、支原体(Mycoplasma)、疏螺旋体属(Borrelia)、军团菌属(Legionella)、假单胞菌属(Pseudomonas)、分支杆菌属(Mycobacterium)、螺杆菌属(Helicobacter)、欧文氏菌属(Erwinia)、土壤杆菌属(Agrobacterium)、根瘤菌属(Rhizobium)、和链霉菌属(Streptomyces)的物种的那些细胞),或真核细胞(包括真菌(特别是酵母的)、植物、原生动物及其它寄生物、和动物包括昆虫(尤其是果蝇属细胞)、线虫(尤其是Caenorhabditis elegans的细胞)、和哺乳动物(尤其是人细胞)的细胞)。
当然,可以有利地使用的其它核酸合成技术对于本领域普通技术人员将是易于明了的。
在本发明其它方面,本发明可以联合扩增或测序核酸分子的方法一起应用。根据本发明的此方面,核酸扩增方法可以包括在本领域一般已知称为一步(例如一步RT-PCR)或两步(例如两步RT-PCR)逆转录酶-扩增反应的方法中,应用一或多个具有逆转录酶活性的多肽。对于长核酸分子(即长度大于约3-5Kb)的扩增,可以使用DNA聚合酶的组合,参见WO98/06736和WO95/16028。
根据本发明,扩增方法可以包含一或多个步骤。例如,本发明提供用于扩增核酸分子的方法,包含(a)将一或多个具有聚合酶活性的酶与一或多个核酸模板(例如包含整合序列的靶分子)混合;和(b)在足以允许具有聚合酶活性的酶扩增与模板的全部或部分互补的一或多个核酸分子的条件下,孵育该混合物。本发明还提供通过这些方法扩增的核酸分子。
扩增和分子核酸分子或片段的一般方法是本领域普通技术人员熟知的(参见例如美国专利4,683,195;4,683,202;和4,800,159;Innis,M.A.等编,PCR实验指南方法和应用的指导(PCR ProtocolsA Guide toMethods and Applications),San Diego,CaliforniaAcademic Press,Inc.(1990);Griffin,H.G.和Griffin,A.M.编,PCR技术当前的创新(PCR TechnologyCurrent Innovations),Boca Raton,Florida;CRCPress(1994))。例如,根据本发明可以使用的扩增方法包括PCR(美国专利4,683,195和4,683,292)、链置换扩增(SDA;美国专利5,455,166;EP0684315)、和基于核酸序列的扩增(NASBA;美国专利5,409,818;EP0329822)。
典型地,这些扩增方法包括(a)将一或多个具有聚合酶活性的酶与核酸样品在存在一或多个引物序列的情况下混合;和(b)优选通过PCR或等价的自动扩增技术,扩增该核酸样品以产生大量扩增的核酸片段。
通过本发明方法进行扩增或合成后,可以分离扩增的或合成的核酸片段作进一步使用或表征。该步骤通常可以通过借助大小或任何物理或生物化学方法包括凝胶电泳、毛细管电泳、层析(包括分子筛、亲和和免疫层析)、密度梯度离心和免疫吸附,分离扩增的或合成的核酸片段来完成。尤其优选通过凝胶电泳分离核酸片段,因为它提供了快速和高重复性地灵敏分离许多核酸片段的手段、并允许直接同时地比较几个核酸样品中的这些片段。在另一优选实施方案中,可以扩展该方法以分离和表征这些片段或任何通过本发明方法扩增或合成的核酸片段。因此,本发明还指向通过本发明扩增或合成方法产生的分离的核酸分子。
在该实施方案中,根据标准技术如电洗脱或物理切除,从用于鉴定的凝胶(见上)上取出一或多个扩增的或合成的核酸片段。然后将这些分离的单一核酸片段插入适于转染或转化多种原核(细菌)或真核(酵母、植物或动物包括人和其它哺乳动物)细胞的标准载体包括表达载体中。或者,还可以通过例如测序(即,确定核酸片段的核苷酸序列)、通过以下描述的方法和本领域的其它标准方法(参见指向DNA测序方法的美国专利4,962,022和5,498,523),表征本发明方法所制备的核酸分子。
根据本发明,核酸测序方法可以包含一或多个步骤。例如,本发明可以和用于测序核酸分子的方法联合应用。该方法包含(a)将具有聚合酶活性的酶和待测序的核酸分子、一或多个引物、一或多个核苷酸、及一或多个终止剂(例如双脱氧核苷酸)混合,以形成混合物;(b)在足以合成和待测序的分子的全部或部分互补的一群分子的条件下,孵育该混合物;和(c)分离该群体以确定待测序分子的全部或部分核苷酸序列。
可以使用的核酸测序技术包括例如描述于美国专利4,962,022和5,498,523公开的那些双脱氧测序方法。试剂盒另一方面,本发明提供可以和本发明一起使用的试剂盒。根据本发明此方面的试剂盒可以包含一或多个容器,这些容器可以含有选自下组的一或多个成分一或多个本发明的核酸分子或载体、一或多个聚合酶、一或多个逆转录酶、一或多个插入催化酶、一或多个重组蛋白(或其它实施本发明方法的酶)、一或多个缓冲液、一或多个去污剂、一或多个限制性内切酶、一或多个核苷酸、一或多个终止剂(例如ddNTP)、一或多个转染剂、焦磷酸酶等。本发明试剂盒还可以包含实施本发明的说明书。
相关领域普通技术人员将明了,依据普通技术人员已知的知识从本文所包含的本发明描述出发,对本文所述方法和应用的其它适合修改和改变将是十分明了的,而且可以进行这些适合修改和改变而不偏离本发明范围或它的任何实施方案。目前我们已详细描述了本发明,通过参考以下实施例可以更清楚地理解本发明,由此为了举例说明的目的包括这些实施例,它们并不旨在限制本发明。
实施例实施例1构建含转座子的靶DNA分子根据GATEWAYTM克隆系统的方法和程序(参见美国专利5,888,732、美国专利申请09/438,358和09/517,466,和题为GATEWAYTM克隆技术的说明书手册(第1和2版本),所有这些均完整地并入本文作为参考),按照所述,将靶分子克隆至适于重组克隆的第一载体中。简要地说,将靶DNA分子插入适当载体中以便靶分子被重组位点包围。在一些方案中,重组位点不能够彼此重组。使含有靶的第一载体与如下溶液接触,该溶液含有整合序列如转座子、适当的辅因子如缓冲盐、离子等、及催化整合序列插入靶DNA分子中的酶。或者,可以在体内反应中将转座子插入靶DNA,例如Strathmann等(Proceedings of the National Academy ofSciences,USA,881247-1250,1991,特此并入本文作为参考)描述的为了插入基于gd的转座子的质粒接合转移。尽管本实施例指向体外在靶DNA中插入转座子,但本领域技术人员将明了,可以使用本领域技术人员已知的方法体外实施相应的反应。这些相应的方法被认为属于本发明的范围。转座子的DNA序列将包括充当插入催化酶底物的末端序列,而该酶将催化此转座子插入靶DNA分子中。正如以上讨论的,插入催化酶也将催化转座子插入载体中。转座反应的结果是一群在载体和靶分子内的不同位置插有转座子的分子,见图2所示。靶DNA序列为两个重组位点(RS1和RS2)所包围。整合序列显示包含选择标记(SM2)和位于两末端的引物结合序列。本领域技术人员将明了,修饰这些特性和包含其它特性都属于本发明的范围。因为插入反应是随机的,如所示,整合序列可以既插入靶中又插入载体中。
适用于本发明的转座子可以包含一或多个选择标记。在一些实施方案中,本发明转座子可以包含毒性基因。毒性基因可以是自杀基因,即只要该基因表达它对于易感性生物就是致死性的,或者毒性基因可以是条件致死性的,即仅在该基因表达和存在某种其它因素时它对于易感性生物才是致死性的。此外,适用于本发明测序方法的转座子可以包含一或多个适于结合引物的序列。可以利用引物确定邻近转座子的靶DNA分子的序列,或可以将引物用于其它目的如PCR。适合的序列可以是任何长度的,只要引物与待测序DNA一起孵育时形成的引物DNA双链体足够稳定以允许随后的反应(即测序或PCR)进行就可以。引物结合位点的实际核苷酸序列并不是关键的,只要已知即可。适合引物结合序列的选择和随后反应的适当反应条件的确定是本领域普通技术人员的常规任务。
适于插入DNA靶分子中以便克隆部分靶的转座子可以包含一或多个重组位点或其部分。在一些优选实施方案中,本发明转座子将含有可以相同或不同的两个重组位点。这两个位点可以彼此以相反方向存在。
适于克隆应用的转座子可以包含复制起点。一些实施方案中,可以选择复制起点,以便其与用于实施本发明的载体的一或多个的复制起点相容。这将允许包含来源于转座子的复制起点的核酸分子可以在还含有载体的细胞中稳定地维持。在其它实施方案中,可以选择复制起点以便其与载体中的复制起点不相容。这将有利于将载体和含有核酸分子的转座子分离开。复制起点的序列和特征是本领域技术人员熟知的。适合的复制起点的例子可以参见Current Protocols in Molecular Biology,Ausubel等编,John Wiley and Sons,1994,该文献特此并入本文作为参考。其它适合的复制起点是本领域技术人员已知的,并属于本发明的范围。用于本发明的复制起点可以指导含有它们的核酸分子在多种生物中复制。在一些实施方案中,复制起点可以在原核宿主细胞如前面讨论的那些细胞中发挥作用。在其它实施方案中,复制起点可以在真核宿主细胞中发挥作用。
适用于本发明的转座子可以含有包括一或多个充当一或多个限制性酶的底物的位点的DNA序列。在一些优选实施方案中,用于本发明的转座子可以包含充当具有罕见切割位点的限制性酶(又称作“稀有切割酶(rare cutter)”)的底物的位点。在本发明一些实施方案中,载体供体还可以为稀有切割酶提供一或多个位点。在一些实施方案中,可以提供具有两个稀有切割酶位点的载体供体,这两个位点可以相同或不同而且与重组位点相邻。
本发明转座子可以包含以上讨论的一个以上特征。例如,转座子可以包含复制起点以及重组位点,并还可以包含一或多个引物结合序列、选择标记和/或自杀基因。其它有用的特征组合对本领域技术人员将是易于明了的,并属于本发明范围。
在一些优选实施方案中,转座子与含靶的第一载体在转座反应中的摩尔比为从约25∶1至约1∶25。在优选实施方案中,该摩尔比将从约10∶1至约1∶10。可以改变此摩尔比以便确保将一个转座子插入DNA靶中。当第一载体的大小比靶大时,则可能期望具有较高的转座子∶载体比例,以使反应偏向于在每个含靶的第一载体中进行多点插入,以便实现在靶DNA中的插入。相反地,当靶DNA的大小比载体大时,可能期望降低转座子∶载体比例。
典型的体外转座反应物可以含有转座子、含靶的第一载体、离子、缓冲剂等。适合的反应条件可以是约100-500ng转座子和约1mg含靶的第一载体。反应可以含有浓度在约0.5mM至约250mM的二价金属离子。在优选实施方案中,MgCl2可以是二价金属离子的来源并可以以约1mM至约50mM、更优选约5mM至约20mM的浓度存在。反应溶液还可以含有浓度在约1mM至约100mM、更优选约5mM至约50mM、最优选约10mM至约25mM的缓冲剂。适合的缓冲剂是Tris。反应溶液还可以含有浓度约0.1mM至约5mM,优选约1mM的还原剂如β-巯基乙醇(β-ME)、二巯苏糖醇(DTT)或二硫赤藓糖醇(DTE)。反应溶液的pH可以从约6.5至约8.5,优选约7.5。反应溶液可以含有浓度在约1mM至约100mM、优选约5mM至约25mM、最优选约10mM的一价阳离子。适合的一价阳离子来源包括KCl和NaCl。一组适合的反应条件是15mM MgCl2、10mM Tris·HCl(pH 7.5)、10mM KCl、1mM DTT和充足的插入催化酶活性以催化插入反应。适合的反应条件将根据整合序列/插入催化酶对的来源而改变。本领域技术人员将明了,已知的各种插入催化酶在对各酶而言特殊的条件下具有最佳活性。为指定的酶确定和优选反应条件可以通过本领域技术人员的常规实验来完成。反应条件可以基于转座子和载体的大小、及插入催化酶制剂的活性而改变。在一些实施方案中,转座反应可以在存在可增加反应中存在的核酸种类的有效浓度的试剂下进行。属于此类的适合试剂是聚乙二醇(PEG)。适合的PEG是PEG8000。可以在适当温度下,例如约20℃至约37℃下孵育反应混合物一段适当长的时间,例如约15分钟至约16小时。对于给定的转座子、靶和插入催化酶制剂,最佳温度和孵育期可以由本领域普通技术人员通过常规实验确定。
在孵育转座反应物后,可以就此使用该DNA,或可以按本领域技术人员已知的方式对其进行纯化。当不经纯化使用时,可以通过例如65℃加热20分钟,失活插入催化酶。从转座反应物中纯化该DNA的适当方法包括酚/氯仿抽提和乙醇沉淀、使用硅石(例如可从InvitrogenCorporation,Life Technologies Division,Rockville,MD获得的CONCERTTM系统)提取、或本领域技术人员使用的任何其它纯化方案。
当转座反应足够有效率时,将产生足够多的包含有含转座子的靶DNA分子的第一载体分子以充当随后重组反应的底物。在其它情况下,可能必需用转座反应产生的分子转化感受态宿主生物并培养转化生物以扩增反应产物。转化生物可以培养在适合的选择剂如抗生素存在的情况下,以便确保在生长的生物体中存在位于转座子上的选择标记。扩增步骤是本领域常规的,并且无需进行过多的试验,技术人员可以选择适当的生物和转化条件并分离扩增的反应产物。实施例2含转座子的靶分子和载体供体的重组可以使用重组克隆,将第一载体中含转座子的靶DNA分子转移至第二载体中。正如图3所示,可以将前一实施例中讨论的插入反应的产物与称作载体供体的第二载体混合。载体供体包含重组位点,在图3中标示为RS3和RS4,这些重组位点和第一载体中存在的重组位点是相容的。当混合物和适当的重组蛋白质接触后,靶DNA分子被转移至第二载体上。在图3所示实施方案中,载体供体在两个重组位点之间包含毒性基因并在重组位点外含有一个选择标记(SM3)。适当载体供体分子的制备见Hartley等提交的美国专利5,888,732,以及可从InvitrogenCorporation,Life Technologies Division(Rockville,MD)获得的题为GATEWAYTM克隆技术的说明书手册(第1和2版)。
在适当缓冲液中孵育第一和第二载体。可以针对所用具体载体和重组蛋白质优化反应条件。反应溶液可以含有能够维持期望pH的浓度的缓冲剂。缓冲剂的浓度可以从约1mM至约100mM。优选地,从约10mM至约50mM。适合的缓冲剂是Tris。反应溶液的pH可以根据所用重组酶的最适pH而改变。在优选实施方案中,反应溶液的pH在约6.5至约8.5、更优选约7.0至8.0、最优选7.5。反应溶液可以含有浓度在约1mM至约100mM、优选从约5mM至约50mM、最优选约20mM至约35mM的一价阳离子。适当的一价阳离子来源是NaCl。反应溶液还可以含有浓度约0.1mM至约10mM,优选约1mM至约5mM的亚精胺。反应溶液还可以含有浓度约50mg/ml至约5mg/ml、优选约100mg/ml至约1mg/ml、最优选约500mg/ml的牛血清白蛋白(BSA)。反应溶液还可以含有浓度约0.1mM至约10mM、优选约1mM至约5mM的螯合剂。一组适合的反应条件是50mM Tris·HCl(pH7.5)、33mM NaCl、5mM亚精胺·HCl和500mg/ml牛血清白蛋白。当重组位点是attL和attR衍生物时,则反应条件可以包括25mM Tris·HCl(pH7.5)、22mM NaCl、5mM EDTA、5mM亚精胺·HCl和1mg/ml牛血清白蛋白。反应混合物在约25℃孵育60分钟,再与蛋白酶如蛋白酶K一起孵育10分钟以失活重组蛋白。在重组反应前将载体线性化可以增加重组反应的效率。这可以通过用适合的限制性酶消化来实现。或者,可以在重组反应物中加入拓扑异构酶I。在重组反应后,可以使用反应混合物转化感受态宿主生物。转化的宿主可以培养在适合选择剂存在的情况下以确保存在期望反应产物。例如,在转座子编码针对一种抗生素的抗性而第二载体编码针对另一抗生素的抗性的那些实施方案中,用于转化宿主的培养基可以包含两种抗生素。在图3所示实施方案中,转座子带有选择标记SM2,而载体供体带有SM3。在此情况下,第一载体可以编码针对第三种抗生素即SM1的抗性。生长条件将选出缺少毒性基因的情况。能够在这些条件下生长的任何生物将含有来自转座子的选择标记和来自第二载体的选择标记,并将不含有毒性基因。这些分子是第一载体和第二载体之间重组和共合中间体拆分的结果。正如图3所示,产物分子含有包含插入片段并被重组位点包围的靶DNA,其中的重组位点是载体供体中的位点和最初的两侧位点的重组(标示为RS1+3和RS2+4)的产物。例如,如果最初的两侧位点是attL1和attL2,而载体供体中的位点是attR1和attR2,则根据位点相对靶序列的取向,产物分子将含有由一侧的attB1或attP1和另一侧的attB2或attP2包围的靶核酸。在某些优选实施方案中,产物分子可以含有被独特的突变attB位点包围的靶核酸。
或者,在重组反应后,可以将混合物体外用于进一步操作该靶可以使用与转移有含转座子的DNA区段的载体互补的寡核苷酸和与转座子互补的寡核苷酸,以制备一群从载体延伸至转座子插入片段位置的扩增子。可以对这些区段克隆(例如,如果寡核苷酸含有重组位点、或如果载体被拓扑异构酶作用后)和进一步操作或测序。在另一此方面,扩增前,还可以分离、扩增该群体的各成员,并对扩增产物直接测序,籍此省去克隆和增殖该DNA区段的需要。
在一些实施方案中,靶DNA可以具有当导入适当宿主细胞后导致一或多个目的生物活性表达的序列。例如,靶DNA序列的导入可以导致某一特定酶活性的表达。在这些实施方案中,可能期望针对缺少目的生物学活性来筛选用重组反应混合物转化的宿主细胞,由此鉴定出其中转座子已插入了生物活性表达所必需的序列中的克隆。这提供了关于编码该活性的序列在此较大靶DNA序列中的位置的信息。对于大的靶序列例如当靶序列是粘粒、BAC、YAC或基因组片段时,这将是尤其有用的。
含转座子的靶DNA分子的序列可以通过靶DNA分子和结合部分转座子序列的引物接触,然后实施本领域技术人员已知的任何适当的测序操作方案来确定。
重要的是应注意,对于测序应用,本发明克服了转座子插入载体序列而非插入靶DNA或在插入靶DNA之外还插入载体序列中所造成的障碍。为了简单起见,图2仅描述在含靶的载体分子中的单个插入;然而,本领域技术人员将明了,多个插入也是可能的。在转座反应完成后将靶DNA移入第二载体中的重组步骤,有效地消除了对测序载体的担心,因为没有从重组反应回收第一载体序列。这与现有技术是不同的,现有技术中在载体中的插入将使得必需重复测序载体或实施繁琐的筛选程序以消除转座子插在载体中的克隆。在转座子插在载体和靶序列中的那些情况下,所获分子不能在现有技术的方法中使用,因为在待测序的同一分子中存在的两个引物结合位点将造成难以理解的混合产物。由于本发明方法除去了起始DNA分子含转座子的载体部分,所以可以从指定的转座反应中回收到更多能够被测序的分子。实施例3使用插入和重组操作大核酸分子正如图4A所示,本发明方法可以用于克隆大DNA分子例如基因组DNA的区段。除了基因组DNA外,本发明方法还允许克隆任何较大DNA分子的区段。因此,尽管本发明的此实施方案是以基因组DNA为例的,但本领域技术人员将明了,可以使用这些方法克隆任何大DNA分子的区段。例如,大DNA分子可以是YAC、BAC或任何分离的染色体或它们的部分。
从目的生物分离基因组DNA并与包含一或多个重组位点的转座子及插入催化酶在引起转座子向基因组DNA中整合的条件下进行接触。然后将基因组DNA与具有和转座子中重组位点相容的重组位点的载体供体接触(图4A)。或者,可以使转座子和载体供体中的重组位点取一定方向,以便转座子单独不能和载体供体产生生产性的反应(图4B)。在存在适当重组蛋白质时进行孵育后,可以使用反应混合物转化感受态宿主细胞。在选出载体供体上选择标记和选择除去毒性基因的条件下,培养该转化宿主细胞。在一些实施方案中,可以修饰转座子,以便重组事件使基因组DNA和选择标记转移至载体供体上。转座子的此构型显示在图5中。
适于涉及基因组DNA克隆的实施方案的转座子可以包含两个重组位点。在一些优选实施方案中,重组位点具有相同序列并且取向相反,即反向重复。图6显示了使用该实施方案克隆基因组DNA的示意图。在一些实施方案中,转座子可以包含编码毒性基因的DNA序列。此类转座子可用于防止转座子或在提供用于克隆的重组位点的转座子间还有一个转座子的基因组片段的重组克隆。在其它优选实施方案中,重组位点可以具有不同序列并取向相反。在转座子插入后,使基因组DNA和具有与转座子的那些重组位点相容的重组位点的载体供体、及适当的重组蛋白质,在导致转座子上的重组位点和载体供体上的重组位点间发生重组的条件下进行接触。转化和筛选可以按上述方式进行。在一些实施方案中,可能期望在载体供体上包括一或多个和用于转座子和载体供体重组的那些重组位点有不同特异性的其它重组位点(图6)。这些其它位点可以用于进一步操作克隆的DNA。例如,可能期望将克隆的DNA转移至不同的载体上,而这可以使用这些其它的重组位点来实现。
在一些优选实施方案中,用于基因组克隆的转座子可以包含复制起点。将包含一或多个重组位点并还包含复制起点的转座子插入基因组DNA中。存在于转座子上的重组位点可以和存在相邻转座子上的重组位点重组,导致两个重组位点间的片段被切除。由于该切除的分子是具有复制起点的环状分子,故该切除分子能够稳定地维持在宿主细胞中。为了有利于筛选切除分子,本发明的转座子可以选择性包含一或多个选择标记。在此类一些实施方案中,可能期望将两个不同群体的转座子整合入基因组DNA中。在一个优选实施方案中,一个群体可以包含一个重组位点和一个复制起点,而另一个转座子可以包含选择标记和一个重组位点。存在于两个相邻转座子上的这两个重组位点间的重组产生了含有复制起点和选择标记以及目的DNA的DNA分子。可以将该分子转化至适当宿主细胞系中并使用一或多个选择标记对其进行选择。这示意性地显示在图7中。
整合反应中存在的基因组DNA的浓度和转座子的浓度的比可以发生变动,以便控制转移至载体供体中的基因组DNA片段的大小。通过增加转座子的浓度,可以降低此基因组DNA片段的平均大小。实施例4使用转座和重组构建亚克隆可以使用含有转座子的靶DNA构建含有少于靶DNA完整序列的克隆。这些较小的克隆一般被称作亚克隆。可以将转座子插入含有重组位点或被重组位点所包围的靶DNA中,以产生图8A顶图显示的分子。该转座子可以含有不同于靶分子的重组位点的一或多个重组位点,并还可以含有一或多个选择标记。然后将此分子和一或多个含有将与转座子和靶上位点重组的重组位点的载体供体接触。在一些实施方案中,可以提供具有额外重组位点的含有靶DNA的载体,而载体供体含有与这些额外位点重组的重组位点。进行重组,然后将重组反应产生的核酸插入宿主细胞中。通过将部分转化反应物铺在各种选择性培养上,可以分离出期望的亚克隆,见图8A所示。
在一些实施方案中,例如图8B中所示的那些,可以置换靶DNA的区段。例如,可以使由RS1和RS2包围的靶DNA区段和置换序列交换。因此,靶DNA大区段和小置换序列的交换将导致缺失部分靶序列。该置换序列可以向靶DNA中引入任何期望的特征,包括但不限于,期望生物活性的表达。
在本发明一些实施方案中,包含重组位点、复制起点和选择标记的转座子被整合到靶分子中。选择转座子上存在的重组位点,以便其与包含靶DNA分子的载体上存在的重组位点相容。插入转座子后,在没有载体供体的情况下进行重组。结果是切除了转座子上存在的重组位点和载体上存在的重组位点之间的DNA。因为靶DNA的切除部分包含复制起点和选择标记,可以将该切除部分插入宿主细胞并且其将获得稳定的维持。结果是亚克隆了靶DNA的此切除部分。这示意性地显示在图9中。实施例5使用转座和重组克隆PCR片段本发明方法可以用于克隆PCR片段。含有重组序列(或其部分)的引物被用于扩增靶DNA序列(参见1997年10月24日提交的美国临时专利申请60/065,930和美国专利申请系列号09/177,387)。或者,例如,通过包括限制性酶的识别序列,PCR引物可以具有允许产生可连接末端的序列。所获被重组位点(或可连接末端)包围的线性片段与含有选择标记和复制起点的转座子反应。转座子整合后,进行重组反应(或连接反应)。结果是具有复制起点和选择标记的环状分子。或者,可以首先将该分子环化,随后进行转座子的整合。可以将此环状分子环化至感受态宿主细胞中并进行维持。该方法对于构建基因导向载体将尤其有用。在此类一些实施方案中,转座子可以包含赋予新霉素抗性的选择标记。并可以用G-418筛选包含该选择标记的细胞。
图10显示了该方法的示意图。在
图10所示实施方案中,靶DNA分子使用含有标示为RS1和RS2的重组位点的引物进行扩增。将整合序列插入扩增产物中,然后通过重组事件使之环化。在其它实施方案中,可以使含有整合序列的扩增产物和含有与扩增产物中的那些重组位点相容的重组位点的另一核酸分子反应。实施例6在靶DNA分子中构建缺失使含有被两个非相互作用的不同重组位点包围的靶DNA分子的载体和转座子及插入催化酶,在引起转座子插入靶分子或载体或两者中的条件下进行接触。构建转座子以含有和位于靶DNA分子侧翼的重组位点之一相容的重组位点以及测序引物结合位点。此外,转座子可以含有编码选择标记的序列和编码毒性基因的序列,这些序列的分布如
图11所示。
转座子插入包含靶DNA分子的载体中后,可以在转座子上存在的重组位点和载体上存在的相容重组位点之间进行重组反应。参照
图11,这将是RS3和RS2之间的重组。使用该重组反应混合物转化对该毒性基因敏感的感受态宿主细胞,使用转座子上存在的选择标记和载体上存在的选择标记,将转化后的宿主细胞铺在含有适合筛选试剂的平板上。转座子在载体序列中的插入或转座子在靶DNA中的插入致使转座子中重组位点相对载体中的同源重组位点取向相反时,将导致保留毒性基因并因此在转化后不产生菌落的分子。当将转座子插入靶DNA中以致转座子中重组位点与载体上重组位点具有相同方向时,将缺失掉一部分靶DNA和含有毒性基因的转座子部分。所获缺失质粒将在转化后产生菌落。可以从阳性菌落回收质粒并通过凝胶电泳确定回收的质粒的大小以便分析缺失了多少靶DNA。任选地,可以使用常规技术通过限制性作图分析这些质粒。
或者,可以按
图12所示回收缺失的序列。将含有一或多个重组位点的插入元件插入含有重组位点的分子的靶区域中。当与载体供体接触时,插入元件上的重组位点和靶分子上的重组位点之间的区域被转移到载体供体上,导致克隆了最初靶的缺失部分。实施例7在固相支持物上制备核酸分子群本发明方法还可以用于制备附着在固相支持物上的分子群。该方法可以被用于分离该群体的成员,提供核酸分子,该核酸分子可以充当扩增模板或可以用作进一步添加和操作DNA区段的底物、或可以用于系统例如体外转录/翻译系统及用作产生探针的模板。在
图13所示意性描述的一个这样的方面,靶DNA与含有至少一个重组位点的转座子反应。在本发明该方面的一个优选实施方案中,靶DNA和转座子是线性的,但也可以使用其它构型和结构(例如环状、超螺旋、发夹等)的这些分子。含有重组位点的转座子的随机(或定向)整合将产生一群均含有重组位点的分子。还可以将该群体和固定在固相基质上的重组位点反应,以便该重组反应导致靶DNA和固定化重组位点产生共价键合。这样,固定化基质的每个部件将含有该群体的一个成员。
这些固定化群体有许多用途例如,可以进一步使用各个部件作为底物使用与转座子和靶DNA末端互补的寡核苷酸进行扩增。通过使用转座子作为移动引物位点测序该群体的几个成员,可以确定大DNA区段的全部序列。相似地,从该部件上的成员产生的扩增子可以用于制备探针、表达蛋白质区段、定位域(DNA或蛋白质)等。应当注意,如果期望的话,可以使用含有重组位点和与靶DNA末端相容的一个末端的载体,克隆或在扩增后克隆每个群体的成员。
为了清晰理解我们已通过举例说明和实施例一定程度地详细描述了本发明,本领域普通技术人员将明了,可以通过在条件、配方和其它参数的宽的等同范围内修改或改变本发明而不影响本发明或其任何具体实施方案的范围,并且这些修饰或改变将被包含在所附权利要求的范围内。
在该说明书中提及的所有公开出版物、专利、专利申请表现出本发明所属领域技术人员的水平,在此将它们并入作为参考,这就等同于将每个公开文本、专利或专利申请具体地个别地并入作为参考。
权利要求
1.包含至少一个重组位点或其部分的整合序列。
2.权利要求1的整合序列,其中所述整合序列还含有至少一个选自下组的元件一或多个引物位点、一或多个转录或翻译信号或调节序列、一或多个终止信号、一或多个复制起点、一或多个选择标记和一或多个基因或基因的部分。
3.侧翼有至少第一重组位点和至少第二重组位点的靶核酸序列,其中所述靶核酸序列包含至少一个整合序列。
4.权利要求3的靶核酸序列,其中所述整合序列还包含至少一个选自下组的元件一或多个引物位点、一或多个转录或翻译信号或调节序列、一或多个终止信号、一或多个重组位点或其部分、一或多个复制起点、一或多个选择标记和一或多个基因或基因的部分。
5.选择包含至少一个整合序列的靶核酸分子的方法,其包括使侧翼有重组位点的目的靶序列和至少一个整合序列,在足以导致至少一个所述整合序列整合入所述靶序列的条件下,进行孵育;和选择所述靶序列。
6.权利要求5的方法,其中所述选择包括将所述靶序列转移至载体中。
7.选择靶核酸分子的方法,包括将侧翼有重组位点并包含至少一个整合序列的靶序列自第一核酸分子转移至第二核酸分子上;和选择含有侧翼为重组位点的所述靶序列的所述第二核酸分子。
8.确定核酸分子的序列的方法将侧翼有重组位点并含有至少一个整合序列的靶序列自第一核酸分子转移至第二核酸分子;和确定所述靶序列的至少一个部分的序列。
9.根据权利要求8的方法,其中所述整合序列含有至少一个引物位点。
10.根据权利要求8的方法,其中所述转移是通过重组克隆来实现的。
11.根据权利要求8的方法,其中所述转移是在体外或在体内进行的。
12.在核酸分子中制备一或多个缺失的方法,包括使包含至少第一重组位点的核酸分子和包含至少第二重组位点的整合序列在一定条件下接触,以致至少一个所述整合序列被插入所述核酸分子中;和使至少所述第一和所述第二重组位点发生重组,籍此导致所述核酸分子的至少一个部分缺失。
13.在核酸分子中制备一或多个缺失的方法,其包括获得包含至少第一和第二重组位点的所述核酸分子;和使所述第一和所述第二重组位点重组,籍此导致所述核酸分子的至少一个部分缺失。
14.克隆核酸分子或核酸分子群的方法,包括将一或多个包含至少一个重组位点的整合序列插入至少一个核酸分子中;和将一或多个侧翼为重组位点的核酸分子通过重组克隆方式转移至一或多个载体上。
15.权利要求14的方法,其中所述核酸分子是基因组、染色体或cDNA。
16.克隆核酸分子或核酸分子群的方法,其包括将一或多个包含至少一个重组位点的整合序列插入至少一个核酸分子中,籍此导致所述核酸分子包含至少第一和第二重组位点;和使所述至少第一和第二重组位点重组。
17.权利要求16的方法,其中所述第一和第二重组位点的重组导致产生环状分子。
18.权利要求16的方法,其中所述第一和第二重组位点被所述核酸分子的至少一个部分分开。
19.权利要求16的方法,其中所述整合序列包含至少一个选自下组的元件一或多个引物位点、一或多个转录或翻译信号或调节序列、一或多个终止信号、一或多个复制起点、一或多个选择标记和一或多个基因或基因的部分。
20.权利要求16的方法,其中所述整合序列包含一或多个复制起点和/或一或多个选择标记。
21.使线性核酸分子环化的方法,其包括获得包含至少第一和第二重组位点的线性核酸分子;和使所述第一和第二重组位点重组。
22.权利要求21的方法,其中所述重组位点位于所述线性核酸分子的两端或两端附近。
23.权利要求21的方法,其中通过用一或多个包含至少一个重组位点或其部分的引物进行扩增,将所述第一和/或第二重组位点添加至所述线性核酸分子上。
24.权利要求21的方法,其中通过添加一或多个包含至少一个重组位点或其部分的衔接子,将所述第一和/或第二重组位点添加在所述线性核酸分子上。
25.权利要求21的方法,其还包括使所述线性核酸分子和至少一个整合序列在足以导致至少一个所述整合序列插入所述线性核酸分子中的条件下进行孵育。
26.权利要求21的方法,其还包括使所述环化核酸分子和至少一个整合序列在足以使至少一个所述整合序列插入所述环化分子中的条件下进行孵育。
27.权利要求16的方法,其中所述核酸分子是基因组、染色体或cDNA。
28.权利要求21的方法,其中所述核酸分子是基因组、染色体或cDNA。
29.根据权利要求13的方法,其中所述第一和所述第二重组位点在体外发生重组。
全文摘要
本发明一般涉及用于操作核酸分子,尤其是用于克隆、测序、扩增和突变所述分子,的方法、试剂盒和组合物。具体地,本发明涉及重组位点和重组克隆在操作、选择和分析目的核酸分子中的用途。
文档编号C12N15/10GK1399684SQ00816196
公开日2003年2月26日 申请日期2000年10月25日 优先权日1999年10月25日
发明者M·A·布拉什, J·L·哈特利, G·F·坦普勒 申请人:茵维特罗根公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1