用于修饰核酸的转座子末端组合物和方法

文档序号:3566878阅读:650来源:国知局
专利名称:用于修饰核酸的转座子末端组合物和方法
技术领域
本发明涉及使用转座酶和转座子末端组合物从靶DNA产生加标签的DNA片段的文库的方法、组合物和试剂盒。所产生的ssDNA片段可用作模板,例如用于多种应用,包括,例如高通量的、大规模平行的和/或多重的DNA测序。
背景技术
存在多种方法和应用,对这些方法和应用而言,从双链DNA (dsDNA)靶分子产生断裂的且加标签的DNA分子的文库是令人期望的。通常,目的是从较大的dsDNA分子产生较小的单链DNA(ssDNA)分子(例如DNA片段)以用作DNA或RNA聚合酶反应中的模板(例如,用作DNA测序反应或DNA或RNA扩增反应中的模板,在这些扩增反应中引物与标签退火并通过聚合酶延伸)。直到最近,使用桑格双脱氧链终止测序法进行大多数的DNA测序,在该方法中,使用待测序的DNA作模板通过聚合酶延伸引物。进行四种反应,每种具有全部规范的核苷酸 (dATP、dCTP、dGTP、和dTTP)的混合物和四种链终止的双脱氧核苷酸(ddATP、ddCTP、ddGTP 或ddTTP)之一,并且每种反应产生开始于引物且终止于双脱氧核苷酸的一组嵌套的链终止的片段。当这些链终止的DNA分子在电泳后按大小分离时,掺入ddNTP的次序反映模板 DNA的序列。使用这些方法,可确定距引物位点数百碱基或上千碱基的序列。较大序列的确定需要由来自众多克隆的重叠信息将较大序列拼接在一起。因为这些传统方法需要大量DNA模板,并且因为如果大量非模板DNA存在那么这些方法产生的结果不佳,所以通常使用克隆的或扩增的DNA进行桑格双脱氧测序。例如,在正式开始于1990年并且在2000年以人类基因组序列‘草图’的完成宣告结束并且在2006 年公布最后一条人类染色体的序列的人类基因组计划(Human Genome Project)过程中进行的大部分测序是基于使用由宿主细菌的群体构成的基因组文库,每个宿主细菌携带被克隆到DNA载体中的DNA分子,以致各自携带一段基因组DNA的所有DNA克隆的集合代表整个基因组。这是枯燥的和高度反复的过程,涉及大量DNA克隆(例如,BAC克隆)的构建和堆积,进而常常对这些DNA克隆进行亚克隆以产生用作测序模板的较小DNA克隆的文库。通常,将这些方法中使用的引物设计成与载体退火,以致这些引物将在测序反应过程中延伸到未知的克隆DNA中。这种方法允许相同的引物组用于分析许多不同的克隆。为了降低人类基因组测序计划所需亚克隆的量,有时使用的一种方法为“体外转座”。体外转座方法包括使用称作转座子的可移动遗传元件来将小段已知序列的DNA插入未知DNA的中间。该方法包括将来自基因组文库的DNA克隆与转座子在发生转座子单次插入DNA克隆中的条件下孵育,然后以体外转座反应的等分部分转化大肠杆菌细胞,并选择包含由该转座子所编码的标志物诸如抗生素抗性标志物的细胞。因此,体外转座反应从 DNA母克隆中产生“转座子插入克隆”的文库,每个转座子插入克隆包含在该DNA克隆中的不同位置插入的转座子。然后使用每种DNA链的不同引物从每个转座子末端向外对每个插入克隆测序。如以上所述,通过重叠从不同插入克隆获得的序列构建DNA母克隆的完整序列。使用人类基因组计划的这种转座子插入法的实例由Butterfield,YSN等人,Nucleic Acids Res 30 :2460_2468,2002 ;Shevchenko,Y 等人,Nucleic Acids Res 30:2469-2477, 2002 ;以及Haapa,S等人,Genome Res 9 :308_315,1999描述。人类基因组计划的体外转座方法的使用使基因组DNA克隆和由基因组DNA编码的mRNA产生的cDNA克隆的完整测序变得容易。然而,这种体外转座法的一个缺点是它并非完全在体外,因为它需要转化大肠杆菌细胞、选择包含转座子插入的大肠杆菌菌落、以及随后从用于测序的转座子插入克隆中分离DNA的步骤。为了消除用等分部分的体外转座反应转化大肠杆菌并且在选择性培养基上培养该大肠杆菌细胞以获得转座子插入克隆的要求,Teknanen等人(美国专利第6,593,113 号)开发了基于完全体外转座子方法,包括体外转座反应和选择测序模板的PCR扩增反应。 根据Teknanen等人,在其方法中使用的检验的DNA或靶DNA可以在数个碱基对到最多40 千碱基对,不使用甚至更长的DNA片段作靶DNA的唯一限制因素是扩增反应诸如PCR不能扩增更长片段。因此,在使用这种方法产生测序模板的一些实施方案中,首先使至多约40Kb 的检验的DNA或靶DNA经历体外转座反应,然后使用与该靶DNA中的已知序列互补的固定引物或如果该靶DNA被克隆在载体中与该载体中的序列互补的固定引物作为第一 PCR引物,并使用与该靶DNA接合(join)的转座子末端的序列互补的选择性引物任选地加上在其 3'端具有已知身份的一至十个额外的核苷酸作为第二 PCR引物,进行PCR扩增。在另一个实施方案中,两种选择性引物用于PCR扩增步骤,它们中的至少一种在其3'端具有已知身份的一至十个额外的核苷酸。Teknanen等人的方法提供为桑格测序提供了某些益处,因为它们消除了使用大肠杆菌细胞来选择具有转座子插入的DNA分子的需要。然而,这些方法限于大小至多约40Kb的靶DNA,由于固定引物或选择性引物的使用,这些方法选择只表现出由该靶DNA表现出的序列的一部分的DNA分子。因此,尽管这些方法可用于桑格测序,但它们不适合于产生用于更新的“下一代” DNA测序方法的测序模板,所述“下一代” DNA测序方法能够在使用大规模平行或多重形式的单次测序操作中从高达数百万测序模板中产生序列数据。下一代测序平台包括454 FLX 、或 454 TITANIUM (Roche)、S0LEXA 基因组分析仪(Illumina)、HELISC0PE 单分子测序仪(Helicos Biosciences)和 SOLID DNA 测序仪(Life Technologies/Applied Biosystems)仪器),以及仍处于由诸如 Intelligent Biosystems和I^acific Biosystems等公司研发之下的其他平台。尽管产生序列信息的化学对于不同的下一代测序平台而言是不同的,所有这些下一代测序平台共有从极其大量的测序模板中产生序列数据的共同特征,在这些测序模板上测序反应同时运行。一般来说,来自所有这些测序反应的数据使用扫描仪收集,然后使用计算机和强大的生物信息程序进行装配并进行分析。测序反应以“大规模平行”或“多重”的方式执行、读数、装配并进行分析。 这些仪器的大规模平行的性质需要在思考以下问题上的转变需要哪种测序模板和如何产生它们以便从这些强大的仪器获得最大可能的测序数据量。因此,不需要大肠杆菌中的DNA克隆的基因组文库,现在有必要考虑关于产生DNA片段文库的体外系统,所述DNA片段文库包括从样品中的靶DNA产生的DNA片段的集合或群体,其中在该集合或群体中的全部DNA 片段的组合显示的序列是产生这些DNA片段的靶DNA的序列的质量上和/或数量上的代表。实际上,在一些情况下,有必要考虑关于产生由多个基因组DNA片段文库构成的DNA片段文库,所述多个基因组DNA片段文库中的每一个用不同的地址标签或条码标记以允许鉴定每个测序片段的来源。一般来说,这些下一代测序方法需要基因组DNA或双链cDNA (由RNA制备)断裂成更小的ssDNA片段并添加标签到ssDNA片段的至少一条链或优选两条链。在一些方法中, 这些标签为使用DNA聚合酶的DNA测序提供了引发位点。在一些方法中,这些标签还提供了用于将片段捕获到表面诸如珠上的位点(例如,对于这些方法中的一些而言,在乳液PCR 扩增之前;例如,使用如美国专利第7,323,305号所述的方法)。在大多数情况下,用作下一代测序的模板的DNA片段文库包含5'-和3'加标签的DNA片段或“加双标签的DNA片段”。一般来说,目前用于产生下一代测序用的DNA片段文库的方法包括使用超声破碎器、 喷雾器或核酸酶断裂期望测序的靶DNA (例如,包括基因组DNA或在RNA的反转录后的双链 cDNA的靶DNA),并且接合(例如,通过连接)由衔接子或标签构成的寡核苷酸到这些片段的5'和3'端。目前用于产生下一代测序模板的方法存在许多问题和低效率,如在世界最大的基因组中心之一威尔康信托桑格研究所(Wellcome Trust Sanger hstitute)所用的工作流程所阐明的(例如,在Quail,MA等人,Nature Methods 5 1005-1010,2008中所述)。例如,Quail等人发现用于测序的基因组DNA的雾化导致损失按质量计大约一半的DNA并且只有大约5%的起始DNA由使用Illumina基因组分析仪测序所期望的处于大约200_bp大小范围内的片段构成。他们发现称为“适应焦点声学(adapted focused acoustics) ”的替代方法给出更高产率的断裂DNA并且大约17%的起始DNA由期望的200_bp大小范围内的片段构成,但即使是这种方法在样品或靶DNA方面也是浪费的。更进一步,得到的DNA片段通常需要通过凝胶电泳选择大小,以及对大小选择的DNA片段进行加标签的额外步骤,这是困难的、费力的、耗时的和昂贵的。因此,目前在用于对供下一代测序中使用的双链DNA进行断裂和加标签的许多方法浪费DNA,需要昂贵的断裂仪器,并且用于断裂、加标签和回收加标签的DNA片段的程序是困难的、繁琐的、费力的、耗时的、效率低、成本高,需要相对大量的样品核酸。此外,这些方法中的许多方法产生的加标签的DNA片段不完全代表它们从其中产生的样品核酸中包含的序列。因此,本领域中需要的是克服目前方法的局限性的用于以大规模平行方式产生加双标签的DNA片段的文库的方法。下一代测序方法中的一些方法在其测序过程中使用环状ssDNA底物。例如,在各自通过引用并入本文的Drmanac等人的美国专利申请第20090011943号;20090005252 号;20080318796 号;20080234136 号;20080213771 号;20070099208 号;和 20070072208 公开了用于大规模平行的DNA测序的环状ssDNA模板的产生。Gunderson和Meemers的美国专利的申请第20080242560号公开的方法包括制备数字DNA球(例如,在美国专利申请第20080242560号中的图8);和/或DNA诸如基因组DNA的基因座特异性切割和扩增,对于扩增包括通过多重置换扩增或全基因组扩增(例如,该专利申请中的

图17)或通过超分支RCA(例如,该专利申请中的图18)以用于产生扩增的核酸阵列(例如,ILLUMINA BeadArrays ;ILLUMINA, San Diego CA, USA)。需要用于从生物样品的DNA(例如,从基因组DNA或线粒体DNA或附加体DNA, 包括克隆在质粒、BAC、F黏粒或其他附加型载体中的DNA)制备加标签的环状ssDNA片段的改进的方法,组合物和试剂盒,所述加标签的环状ssDNA用于在扩增或DNA测序方法中使用(诸如在下述文献中描述的方法=Drmanac等人的美国专利申请第20090011943号; 20090005252 号;20080318796 号;20080234136 号;20080213771 号;20070099208 号;以及 20070072208号;或在Gunderson和Steemersor的美国专利申请第20080242560号或由 Pacific Biosciences 的 Turner 等人在其网站 www. pacificbiosciences. com 上公告)。更进一步,用于扩增诸如全基因组扩增的一些方法也需要基因组DNA的断裂和加标签。这些方法中的一些综述于通过引用并入本文的由Hughs和R. Lasken编辑的 Whole Genome Amplification (全基因组扩增),2005,Scion Publishing Ltd(在万维网 scionpublishing. com 上)中。需要从靶DNA分子产生DNA片段的文库的改进的方法以用于扩增,包括从一种生物(例如,从临床样品)或从多种生物(例如,来自环境样品的宏基因组靶DNA)中扩增全基因组或部分基因组,用于进一步分析(例如,通过实时?0 、乳液PCR、比较基因组杂交 (CGH)、比较基因组程序(CGQ),或用于制备DNA特异性标记的探针(例如,染色体特异性探针,例如,染色体涂料(chromosome paints),或例如基因特异性探针,例如用于荧光原位杂交(FISH),用于各种目的(例如,用于研究目的、诊断目的和工业目的)。因此,本领域中需要用于从靶DNA中制备供核酸分析方法诸如下一代测序方法和扩增方法中使用的加标签的DNA片段的文库的方法。需要用于产生DNA片段文库的方法,所述方法不需要专门仪器,并且所述方法更容易、快捷,需要更少的动手时间,可以用更小的 DNA样品和更小的体积进行,有效地对片段的一端或两端进行加标签,并且产生的标签DNA 片段是产生它们的样品中的靶核酸的质量上和数量上的代表。发明概述本发明涉及用于处理核酸的方法、组合物和试剂盒,并且尤其是使用转座子组合物将DNA断裂和加标签的方法和组合物。本发明的方法、组合物和试剂盒可用于例如产生供例如下一代测序方法、荧光原位杂交及类似方法中使用的加标签的DNA片段的文库。在一些优选的实施方案中,本发明涉及从来自任何来源的包含任何感兴趣的dsDNA(包括由 RNA制备的双链cDNA)的靶DNA制备线性ssDNA片段或加标签的环状ssDNA片段(以及其扩增产物),以用于基因组分析、亚基因组分析、转录组分析、或宏基因组分析、或RNA表达的分析。在一些实施方案中,本发明提供了用于产生靶DNA的加标签的DNA片段的文库的方法,所述方法包括将该靶DNA与转座酶和转座子末端或转座子末端组合物一起孵育,所述转座子末端或转座子末端组合物包含在5'部分中具有标签结构域的转移链,所述孵育是在如下条件下进行其中转座酶催化转座反应,并且其中靶DNA断裂产生多个靶DNA片段,并且所述转座子末端或转座子末端组合物的转移链与所述多个靶DNA片段中的每一个片段的5'端接合,以产生多个5'加标签的靶DNA片段。在一些实施方案中,所述方法还包括将所述多个5'加标签的靶DNA片段与至少一种核酸修饰酶一起在如下条件下孵育其中3'标签与所述5'加标签的靶DNA片段的3'端接合以产生包含(comprising)加双标签的靶DNA片段。在一些实施方案中,本发明提供了将靶DNA的片段加标签的方法,所述方法包括将靶DNA与转座酶和转座子末端或转座子末端组合物一起孵育,所述转座子末端或转座子末端组合物包含在5'部分中含标签结构域的转移链,所述孵育是在如下条件下进行其中转座酶催化转座反应,其中所述靶DNA断裂并且所述转座子末端或转座子末端组合物的转移链与所述靶DNA的片段的5'端接合以产生5'加标签的靶DNA片段。在一些优选的实施方案中,所述方法还包括将5'加标签的靶DNA片段与核酸修饰酶一起在如下条件下孵育其中3'标签与所述5'加标签的靶DNA片段的3'端接合以产生加双标签的靶DNA片段。所述方法不限于使用任何具体的核酸修饰酶。例如,核酸修饰酶包括聚合酶、核酸酶、 连接酶以及类似核酸修饰酶。在一些优选的实施方案中,核酸修饰酶包括DNA聚合酶,并且 3'标签是通过延伸5'加标签的靶DNA片段的3'端而形成。在一些实施方案中,DNA聚合酶包括依赖模板的DNA聚合酶,并且在一些实施方案中,DNA聚合酶包括不依赖模板的DNA 聚合酶。在一些优选的实施方案中,DNA聚合酶为具有链置换和/或5'核酸酶活性的依赖模板的DNA聚合酶。在一些实施方案中,在本方法中使用的核酸修饰酶是连接酶,并且3 ‘标签是通过寡核苷酸与5'加标签的靶DNA片段的3'端的连接而形成。在一些实施方案中,连接酶包括依赖模板的连接酶,而在一些实施方案中,连接酶包括不依赖模板的连接酶。在一些实施方案中,转移末端包括标签结构域。在某些优选的实施方案中,标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。在一些实施方案中,标签域为包括选自以下的测序标签或由选自以下的测序标签构成的测序标签域Roche 454A测序标签和Roche 454B测序标签,ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics 测序标签。一些实施方案还包括扩增一种或多种5'加标签的靶DNA片段和/或加双标签的靶DNA片段。在一些优选的实施方案中,扩增包括使用PCR扩增反应、链置换扩增反应、滚环扩增反应、连接酶链反应、转录介导的扩增反应或环介导的扩增反应中的一种或多种。在关于本发明的某些优选的实施方案中,扩增包括非选择性扩增构成DNA片段文库的5'加标签的靶DNA片段或构成DNA片段文库的加双标签的靶DNA片段。在本发明的一些实施方案中,对片段或文库加标签使用的转座子末端组合物包含在核酸序列上具有至少一个核苷酸差异的多条转移链,并且扩增包括基于5'端标签或标签域的核酸序列选择性扩增加双标签的DNA片段。在其他实施方案中,扩增包括使用与加双标签的靶DNA片段的3'标签互补的单个寡核苷酸引物的聚合酶链反应。在一些实施方案中,扩增包括使用单个寡核苷酸引物的链置换扩增反应,其中该寡核苷酸引物只由核糖核苷酸构成,或只由嘌呤核糖核苷酸和只由嘧啶2' -F-2'-脱氧核糖核苷酸构成,并且链置换扩增反应包括链置换DNA聚合酶和核糖核酸酶H。在一些实施方案中,扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中该第一 PCR引物的至少3'端部分与加双标签的靶DNA片段的3'标签互补,并且其中该第二 PCR引物的至少3'端部分显示加双标签的靶 DNA片段的5'标签或标签域的至少一部分的序列。在某些优选的实施方案中,所述第一寡核苷酸引物或第二寡核苷酸引物包括5'端部分,其中所述第一引物的至少5'端部分不与所述加双标签的靶DNA片段的3'标签互补,或者其中所述第二引物的5'端部分不显示所述加双标签的靶DNA片段的5'标签或标签域的至少一部分的序列。在特别优选的实施方案中,第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR引物的至少5'端部分不与所述加双标签的靶DNA片段的3'标签互补,和/或其中所述第二 PCR引物的5'端部分不显示所述加双标签的靶DNA片段的5'标签域的至少一部分的序列。在一些实施方案中,本发明提供了从靶DNA产生加标签的环状单链DNA片段群体的方法。在某些实施方案中,这种方法包括将靶DNA与转座酶和转座子末端或转座子末端组合物一起孵育,所述转座子末端或转座子末端组合物包含在5'部分中具有标签结构域且在3'部分中具有转座子末端的转移链,所述孵育是在如下条件下进行其中转座酶催化转座反应,使得所述靶DNA断裂产生多个靶DNA片段,并且所述转座子末端或转座子末端组合物的转移链与所述多个靶DNA片段中的每一个片段的5'端接合以产生5'加标签的靶DNA片段的群体。这些方法还包括如下步骤使5'加标签的靶DNA片段变性产生单链的5'加标签的靶DNA片段,并且将所述单链的5'加标签的靶DNA片段与核酸连接酶一起在如下条件下孵育其中所述单链的5'加标签的靶DNA片段以分子内方式连接形成加标签的环状单链DNA片段,这些加标签的环状单链DNA片段各自显示所述转移链的序列和所述靶DNA的一部分的序列。在一些实施方案中,切割这些环状单链DNA是令人期望的。因此,在本发明的方法的一些实施方案中,标签域显示切割位点的序列或结构,并且所述方法还包括将加标签的环状单链DNA片段与构成切割酶组合物的至少一种酶一起孵育,其中所述切割酶组合物切割该加标签的环状单链DNA片段以产生加双标签的线性单链DNA片段。在某些优选的实施方案中,切割酶组合物包括限制性内切酶。在一些实施方案中,标签域显示限制性位点的序列,并且所述方法还包括对与该标签域互补的加标签的环状单链DNA片段寡核苷酸退火, 并且将该加标签的环状单链DNA片段与识别该限制性位点的限制性内切核酸酶一起孵育, 其中该限制性内切酶切割该加标签的环状单链DNA片段产生加双标签的线性单链DNA片段。在一些实施方案中,扩增本发明片段和文库是有用的。因此,一些实施方案还包括扩增加标签的环状单链DNA片段和/或加双标签的线性单链DNA片段中的一种或多种。在某些优选的实施方案中,扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中该第一 PCR引物的至少3'端部分与该加标签的环状单链DNA片段或该加双标签的线性单链DNA片段中的转移链的序列的至少一部分互补,并且其中该第二 PCR引物的至少3'端部分与该加标签的环状单链DNA片段或该加双标签的线性单链DNA片段中的转移链的互补序列(complement)的至少一部分互补。在扩增加标签的环状单链DNA片段或加双标签的线性单链DNA片段的一些实施方案中,所述第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR 引物的5'端部分不与该加标签的环状单链DNA片段或该加双标签的线性单链DNA片段中的转移链的序列互补,并且其中所述第二 PCR引物的5'端部分不与该加标签的环状单链 DNA片段或该加双标签的线性单链DNA片段中的转移链的互补序列互补。在一些实施方案中,本发明提供了从靶DNA中产生加标签的环状DNA片段的群体的方法,所述方法包括将靶DNA与转录酶和发夹转座子末端组合物一起孵育,所述发夹转座子末端组合物包含显示在其5'端的非转移链序列、在其3'端的转移链序列以及包含标签结构域的间插环序列的寡核苷酸,所述孵育是在如下条件下进行其中寡核苷酸可形成分子内茎-环,并且其中转座酶催化转座反应,使得该靶DNA断裂产生多个靶DNA片段, 并且该发夹转座子末端组合物的寡核苷酸与所述多个靶DNA片段中的每一个片段的5'端接合以产生5'加标签的靶DNA片段的群体。在一些实施方案中,所述方法还包括在这些片段分子中填充缺口和连接切口。在一些实施方案中,这种方法包括将5'加标签的靶DNA片段的群体与依赖模板的连接酶和没有5'到3'外切核酸酶、3'到5'外切核酸酶和链置换活性的DNA聚合酶或一种或多种大小的随机序列寡核苷酸一起孵育,单独或组合的所述寡核苷酸与转座酶和发夹转座子末端组合物进行转座反应后产生的5'加标签的靶DNA片段中的单链缺口具有相同的长度,所述孵育在如下条件下进行其中该5'加标签的靶DNA 片段中的单链缺口被填充并且每个5'加标签的DNA片段的3'端与包含该靶DNA的互补部分的另一个5'加标签的DNA片段的5'端接合,形成包含环结构中的标签域和该靶DNA 的一部分的两条链的加标签的环状DNA片段。在某些优选的实施方案中,填充和接合包括将该5'加标签的DNA片段与DNA聚合酶一起在如下条件下孵育其中每个5'加标签的 DNA片段的3'端被延伸形成5'加标签的DNA片段延伸产物的群体;并且包括将该5'加标签的DNA片段延伸产物与依赖模板的连接酶一起在如下条件下孵育其中该5'加标签的DNA片段延伸产物被连接,由此产生所述加标签的环状DNA片段。在特别优选的实施方案中,DNA聚合酶和连接酶在混合物中提供,并且在单一反应混合物中进行填充和连接。在一些实施方案中,填充和连接步骤包括将该5'加标签的DNA片段与一种或多种大小的随机序列寡核苷酸以及依赖模板的连接酶一起在如下条件下孵育其中该随机序列寡核苷酸退火并填充单链缺口,并且被彼此连接或与5'加标签的DNA片段的相邻端连接,形成加标签的环状DNA片段。在优选的实施方案中,所述方法还包括将加标签的环状DNA片段与线性DNA、未连接的随机序列寡核苷酸和/或未与靶DNA接合的发夹转座子末端组合物分离。在特别优选的实施方案中,用T5外切核酸酶处理包含所述加标签的环状DNA片段的反应混合物以除去线性DNA,诸如未连接的片段和随机序列寡核苷酸。在一些实施方案中,切割加标签的环状DNA分子是令人期望的。例如,在一些实施方案中,所述方法还包括如下步骤在环结构中切割加标签的环状DNA片段以产生扇尾形双链DNA片段,该扇尾形双链DNA片段的每条链在其5 ‘端上具有标签的一部分并且在其3'端上具有标签的一部分。因此,在本发明的方法的一些实施方案中,环结构中的标签域显示切割位点的序列和结构,并且所述方法还包括将加标签的环状单链DNA片段与构成切割酶组合物的至少一种酶一起孵育,其中所述切割酶组合物切割该加标签的环状单链 DNA片段以产生扇尾形双链DNA片段。在一些实施方案中,切割酶组合物包括N-糖基化酶和AP内切核酸酶。在某些优选的实施方案中,切割酶是尿嘧啶-N-糖基化酶和AP内切核酸酶及FPG蛋白的N-糖基化酶,并且AP内切核酸酶选自大肠杆菌内切核酸酶III或内切核酸酶IV。在某些优选的实施方案中,切割酶组合物包括限制性内切酶。在一些实施方案中, 标签域显示限制性位点的序列,并且所述方法还包括对与该标签域互补的加标签的环状单链DNA片段寡核苷酸退火,并且将该加标签的环状单链DNA片段与识别该限制性位点的限制性内切核酸酶一起孵育,其中该限制性内切酶切割该加标签的环状单链DNA片段产生扇尾形双链DNA片段,该扇尾形双链DNA片段的每条链在其5'端上具有该标签的一部分并且在其3'上具有该标签的一部分。一些实施方案包括另外包括使扇尾形双链DNA片段变性产生加双标签的线性单链DNA片段。所述环状和扇尾形实施方案在如下方法中找到用途所述方法包括使用DNA片段作为DNA测序法或扩增反应中的模板。因此,在一些实施方案中,本发明的方法还包括扩增加标签的环状DNA片段、扇尾形双链DNA片段和/或加双标签的线性单链DNA片段。在优选的实施方案中,扩增包括使用PCR扩增反应、链置换扩增反应、滚环扩增反应、连接酶链反应、转录介导的扩增反应或环介导的扩增反应中的一种或多种。在特别优选的实施方案中, 扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中该第一 PCR引物的至少3'端部分与该标签域的至少一部分互补,并且其中该第二 PCR引物的至少3'端部分显示该标签域的至少一部分的序列。在一些实施方案中,该第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中该第一PCR引物的5'端部分不与该标签序列互补,并且其中该第二 PCR引物的5'端部分不显示该标签域的序列。上述任何一种PCR扩增的优选实施方案包括如下扩增其中该第一 PCR引物和/ 或该第二 PCR引物的5'端部分显示标签域。在更加优选的实施方案中,标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。在本文所述的方法的特别优选的实施方案中,标签域为测序标签域,所述测序标签域包括选自以下的测序标签或由选自以下的测序标签构成=Roche 454A测序标签和 Roche 454B 测序标签,ILLUMINA 301^14"1测序标签、々 ?1丨6(1 Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或Complete Genomics测序标签。在一些实施方案中,本发明提供了将靶DNA的片段加标签的方法,所述方法包括将靶DNA与转座酶和转座子末端或转座子末端组合物一起孵育,所述转座子末端或转座子末端组合物包含在其5'部分中显示不为转座子末端的标签域的序列,并且在其3'部分中显示该转移的转座子末端的序列的转移链,其中该靶DNA被断裂并且该转座子末端组合物的转移链与该靶DNA的片段的5'端接合以产生5'加标签的靶DNA片段。在一些实施方案中,本发明提供了产生5'加标签的DNA片段文库的方法,所述方法包括将靶DNA与转座酶和转座子末端组合物一起孵育,所述转座子末端组合物包含在其 5'部分中显示用于特定目的的一种或多种标签域的序列,并且在其3'部分中显示该转移的转座子末端的序列的转移链,所述孵育在如下条件下进行其中转座酶催化转座反应,其中该靶DNA被断裂,并且该转座子末端组合物的转移链与该靶DNA的片段的5'端接合产生 5'加标签的靶DNA片段,使得该转座反应产生多个5'加标签的靶DNA片段,所述多个5'加标签的靶DNA片段构成来自靶DNA的DNA片段文库。本发明还提供了组合物。例如,在一些实施方案中,本发明提供了包含合成的核酸分子的组合物,所述合成的核酸分子具有含标签域的5'部分和含转座子末端的转移链的 3'部分。在一些实施方案中,本发明提供了包含多种合成的核酸分子的组合物,其中所述核酸分子包含5'部分和3'部分,该5'部分包含具有至少一个核苷酸差异的标签域,该 3'部分包含转座子末端的转移链。在上述组合物的一些实施方案中,核酸分子的至少3'部分是双链DNA。在某些优选的实施方案中,转座子末端是Tn5转座子末端,而在其他实施方案中,转座子末端是Mu转座子末端。在一些实施方案中,核酸分子组合物的标签域包括限制性位点域、捕获标签域、 测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。在特别优选的实施方案中,标签域包括测序标签,所述测序标签包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B测序标签,ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics 测序标签。在一些实施方案中,包含核酸分子的组合物还包括纯化的转座酶。在优选的实施方案中,转座酶选自Tn5转座酶和Mu转座酶。在优选的实施方案中,核酸分子和转座酶在混合物中提供。在特别优选的实施方案中,该混合物还包括非离子洗涤剂。在更加优选的实施方案中,该非离子洗涤剂包括Nonidet Ρ-40和/或吐温-20。在一些实施方案中,本发明提供了包含上面或本文其他地方描述的任何组合物的试剂盒。在一些实施方案中,试剂盒还包括连接酶、聚合酶和/或用于扩增反应的试剂中的一种或多种。在特别优选的实施方案中,用于扩增反应的试剂包括用于聚合酶链反应的试剂。在优选的实施方案中,用于扩增反应和/或聚合酶链反应的试剂包括至少一种引物,并且在特别优选的实施方案中,这些试剂包括如下引物其中包含与核酸分子的5'部分的标签域的互补序列互补的3'部分。在优选的实施方案中,标签域包括限制性位点域、 捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种,并且在特别优选的实施方案中,标签域包括测序标签域,所述测序标签域包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics 测序标签。在一些实施方案中,本发明的试剂盒还包括用于DNA测序反应的试剂。在一些实施方案中,本发明包括包含双链靶DNA和上述任何一种加标签的转座子末端核酸分子和/或转座酶组合物的反应混合物。在一些实施方案中,本发明提供了包含纯化的转座酶和多个合成转座子末端或转座子末端组合物的组合物。在一些实施方案中,转座子末端组合物包括发夹转座子末端, 而在一些实施方案中,合成的转座子末端或转座子末端组合物包括分开的转移链和非转移链。在一些优选的实施方案中,转移链包括5'标签域,例如包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。在特别优选的实施方案中,标签域包括测序标签,所述测序标签包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B测序标签,ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics 测序标签。在一些实施方案中,包含纯化的转座酶的组合物包括多个合成的转座子末端,所述转座子末端包含至少两条转移链,这两条转移链彼此具有至少一个核苷酸差异,并且在优选的实施方案中,转移链包括5'部分和3'部分,其中转移链的至少两个5'部分包括彼此具有至少一个核苷酸差异的标签,并且其中转移链的3'部分包括相同的转座子末端序列。在一些实施方案中,转座子末端包括Mu转座子末端并且转座酶是Mu转座酶,并且在一些优选的实施方案中,转移链的3'部分包括来自Mu转座子末端的序列,并且其中转移链的5'部分不是来自Mu转座子。在一些实施方案中,转座子末端包括Tn5转座子末端并且转座酶是Τη5转座酶,并且在一些优选的实施方案中,转移链的3'部分包括来自Τη5转座子末端的序列,并且其中转移链的5'部分不是来自Τη5转座子。在一些实施方案中,本发明提供了包含DNA片段文库的组合物,其中该DNA片段文库包括靶DNA的片段,该片段具有包含来自转座子末端或转座子末端组合物的转移链的序列的5'端。在优选的实施方案中,来自转移链的序列包括5'标签域,并且在更加优选的实施方案中,DNA片段文库包括靶DNA的片段,该片段包含与转座子末端或转座子末端组合物的转移链互补的3'标签。在一些实施方案中,DNA片段文库包括靶DNA的双链片段。在一些实施方案中,本发明提供了包含靶DNA的加标签的环状DNA片段的组合物, 所述靶DNA的加标签的环状DNA片段包含如下部分该部分包含在其5'端的非转移链、在其3'端的转移链序列、包含标签域的间插环序列、靶DNA的一部分的两条链的序列。在一些实施方案中,本发明提供了包含靶DNA的加标签的环状单链DNA片段的组合物,所述靶DNA的加标签的环状单链DNA片段包含来自转座子末端或转座子末端组合物的转移链以及来自靶DNA的单链部分。在优选的实施方案中,转移链序列包括标签域。在一些实施方案中,本发明提供了包含靶DNA的扇尾形双链DNA片段的组合物,所述靶DNA的扇尾形双链DNA片段包含靶DNA的双链部分,其中每条链具有包含转移链序列的至少一部分的5'端和包含非转移链序列的至少一部分的3'端。在本概述中并且在下面的发明详述中描述了本发明的实施方案,通过引用将发明详述并入此处。尽管已结合具体实施方案对本发明进行描述,应理解要求保护的发明不应过多地限于这些具体实施方案。附图简述下面的图形成本说明书的一部分并且被包括来进一步展示本发明的某些方面。通过结合本文提供的具体实施方案的详述参考这些图中的一个或多个,可以更好地理解本发明。图1提供了显示在转座反应中转座子插入靶DNA中的示意图。图2提供了显示在转座反应中通过插入转座子末端使靶DNA断裂和加标签的示意图。
图3提供了两次转座酶催化的转座子末端组合物插入事件的产物的示意图。因此,在该图的左侧描绘的转座酶催化的转座子末端组合物插入的产物显示如下转座子末端方向其中该转座子末端组合物的转移链(即,其中转移的转座子末端显示序列 5' AGATGTGTATAAGAGACAG 3' (SEQ ID NO :1),且其端 3'接合靶 DNA)在顶链中;并且在该图的右侧描绘的转座酶催化的转座子末端组合物插入的产物显示如下转座子末端方向 其中转移链在底链中。非转移链是SEQ ID NO :2。图4图解了用于产生加标签的DNA片段的文库的两种不同的加标签的转座子末端的实例,每种加标签的转座子末端包含在5'部分中具有不同标签的转移链寡核苷酸以供中使用。使用例如具有5'核酸酶或链置换活性的DNA聚合酶延伸每条链的3'端,产生加双标签的ssDNA片段。显示的转移链序列是SEQ ID NO 1 ;非转移链是SEQ ID NO :2。图5显示了琼脂糖凝胶的图像,该图像示出使用不同的转座体(transposome)浓度产生的5'加标签的DNA片段转座产物的大小范围。图6显示了琼脂糖凝胶的图像,该图像示出在存在或不存在二甲基甲酰胺(DMF) 的情况下在不同温度下、具有不同反应缓冲液的五分钟反应中产生的5'加标签的DNA片段转座产物的大小范围。图7图解了以下方法的一个实例,所述方法使用具有链置换DNA聚合酶活性和/ 或具有5'-到-3'外切核酸酶活性的DNA聚合酶来接合转移链的互补序列与来自体外转座反应的5'加标签的DNA片段,以产生包含加双标签的ssDNA片段的DNA片段的文库。如所示出的,DNA聚合酶的链置换和/或5'-到-3'外切核酸酶活性置换或消化在DNA聚合酶延伸产物的下游退火的DNA,并且DNA聚合酶进行的延伸接合第二标签,该第二标签包含与插入相反链中的第一标签互补的DNA序列或由其构成。在一些实施方案中,使用与转移链的互补序列互补的寡核苷酸对加双标签的DNA片段产物进行PCR扩增。显示的转移链序列是SEQ TD NO 1 ;非转移链是SEQ ID NO :2。图8图解了以下方法的一个实例,所述方法使用具有链置换DNA聚合酶活性和/ 或具有5'-到-3'外切核酸酶活性的DNA聚合酶来接合第二标签与来自体外转座反应的 5'加标签的DNA片段以产生包含加双标签的DNA片段的DNA片段的文库。如所示出的,DNA 聚合酶的链置换和/或5'-到-3'外切核酸酶活性置换或消化在DNA聚合酶延伸产物的下游退火的DNA,并且DNA聚合酶进行的延伸接合第二标签,该第二标签包含与插入相反链中的第一标签互补的DNA序列或由其构成。在一些实施方案中,使用与相应的第一或第二标签中的不同序列互补的寡核苷酸作为PCR引物对加双标签的ssDNA片段产物进行PCR扩增。显示的转移链序列是SEQ ID NO :1 ;非转移链是SEQ ID NO :2。图9提供了相比于使用喷雾产生的对照文库,使用根据本发明的实施方案产生的 DNA片段文库的单个重叠群的测序读序长度(read length)、准确度和覆盖率的比较。图10提供了显示通过在转座反应中插入加标签的转座子末端、接着通过标签特异性PCR+/-条码使靶DNA断裂和加标签以产生Roche/4M相容的文库的示意图。图11显示了琼脂糖凝胶的图像,该图像示出了用于制备如图10所图解的加条码的Roche/454 FLX相容的测序文库的输入DNA(泳道幻、5‘加标签的DNA片段转座产物的大小范围(泳道3)、PCR反应产物的大小范围(泳道4)、以及对照反应(泳道5)。图12显示了琼脂糖凝胶的图像,该图像示出了用于以类似于图10所图解的方法由扩增子DNA制备Roche/454 FLX钛相容的测序文库的5 ‘加标签的DNA片段转座产物的大小范围(泳道2)、PCR反应产物的大小范围(泳道3)、以及对照反应(泳道5)。图13提供了显示通过在转座反应中插入加标签的转座子末端、接着通过标签特异性PCR+/-条码使靶DNA断裂和加标签以产生Illumina/Solexa相容的文库的示意图。图14显示了琼脂糖凝胶的图像,该图像示出了用于制备如图13所图解的加条码的Illumina GAII相容的测序文库的输入DNA(泳道2)、5'加标签的DNA片段转座产物的大小范围(泳道3)、PCR反应产物的大小范围(泳道4)、以及对照反应(泳道5)。图15比较了文库制备的现有技术方法与根据本发明的实施方案的DNA片段文库制备的过程和复杂性。图16显示在双链靶DNA(例如,基因组DNA或双链cDNA)的存在下在体外转座酶反应中孵育转座酶(例如,这里的EZ-Tn5 转座酶)和发夹转座子末端组合物(例如,这里描绘的EZ-Tn5 “pMETS-N-MENTS”发夹转座子末端组合物)后本发明方法的产物的实例。图17.用发夹转座子末端组合物对靶DNA进行断裂和加标签。图17A显示从发夹转座子末端组合物到靶DNA中的两次转座酶催化的插入事件产生的产物的示意图。简言之,在包含转座酶和发夹转座子末端组合物(例如,EZ-Tn5 转座酶和EZ-Tn5 发夹转座子末端组合物)的体外转座酶反应中孵育靶DNA(例如,包含双链基因组DNA或cDNA)。 每种插入的发夹转座子末端组合物的转移末端序列经环结构与该转座子末端的非转移链序列接合。该环可具有任何任意的标签域,诸如限制性位点域、捕获标签域、测序标签域、 检测标签域、地址标签域、转录启动子域或扩增标签域。例如,测序标签域可显示Roche 454A测序标签或Roche 454B测序标签的序列。例如,在该图中,测序标签域在互补的转座子末端序列(茎)之间的环中显示一个或多个序列。图17B显示使用0、0.5、1、2或 3 μ M的pMETS-N-MENTS发夹转座子末端组合物和等摩尔量的EZ_Tn5 转座酶(EPICENTRE Biotechnologies,Madison, WI)在 33mM Tris 乙酸盐 pH 7. 6、66mM KOAc 禾Π IOmM Mg(OAc)2 中在37°C孵育2小时后,1 μ g的Τ7 Dili基因组dsDNA的5'加标签和断裂的产物的STOR Gold染色的琼脂糖电泳凝胶。图18.5'加标签的环状DNA模板的产生。图18A是所述方法的一个实施方案的示意图。简言之,通过发夹转座子末端组合物两次插入靶DNA所产生的9个核苷酸的缺口通过如下方式填充使用缺乏5'-到-3'外切核酸酶和链置换活性的DNA聚合酶(例如, T4 DNA聚合酶)和作为模板的缺口区中的单链DNA延伸所产生的5'加标签的DNA片段的3'端,然后使用依赖模板的连接酶(例如,大肠杆菌DNA连接酶)连接该5'加标签的 DNA片段的DNA聚合酶延伸产物来产生加标签的环状DNA片段。该加标签的环状DNA片段对T5外切核酸酶具有抵抗力,在该图的实施方案中使用该T5外切核酸酶来移除未连接的线性单链和双链的DNA。图18B显示在存在或不存在T4 DNA聚合酶和/或大肠杆菌DNA连接酶的情况下产生的反应产物的STOR Gold染色的琼脂糖电泳凝胶。如所显示的,对 T5外切核酸酶的处理具有抵抗力的加标签的环状DNA片段只在T4 DNA聚合酶和大肠杆菌 DNA连接酶都存在的情况下产生。图19图解了使用末端转移酶接合第二(3')标签与5'加标签的DNA片段,产生包含5'和3'加标签的(“加双标签的”)的ssDNA片段的DNA片段的文库。在这个图解的实施方案中,使用依赖模板的DNA聚合酶添加包含测序标签(SEQ)的测序标签域。
图20图解了使用末端标签寡核苷酸作为模板来添加第二(3')标签至5'加标签的ssDNA片段以产生包含加双标签的ssDNA片段的DNA片段的文库。图21图解了一个实施方案,其中在DNA连接酶和包含5'部分及3'部分的连接加标签寡核苷酸(ligation tagging oligonucleotide)的存在下孵育5‘加标签的DNA 片段,该5'部分在其5'端上具有磷酸基团并且显示与单链DNA的9碱基缺口或区域退火的随机序列,该单链DNA由EZ-Tn5转座酶催化的EZ-Tn5 ME转座子末端插入靶DNA中而产生,该3'部分显示第二标签序列(标签#2)。在该实例中,连接加标签寡核苷酸具有显示 6-核苷酸随机序列的5'部分。该随机序列与9-碱基缺口区中的单链退火的靶DNA退火, 该9-碱基缺口区由转座子末端(例如,这里的19-碱基对EZ-Tn5嵌合末端或ME转座子末端)插入双链靶DNA中而产生。与缺口区中的单链靶DNA退火以使得5’ -磷酸化末端紧靠5'加标签的DNA片段的3'端的那些连接加标签寡核苷酸然后在依赖模板的连接反应中通过核酸连接酶而接合,由此产生第一标签在5'端上并且第二标签在3'端上的5'和 3'加标签的DNA片段。因此,如果转座子末端插入发生在靶DNA的两条链的极接近处(例如,彼此在大约50Kb、大约40Kb、大约30Kb、大约20Kb、大约10Kb、大约5Kb、大约1Kb、大约 500bp或优选在大约150bp到大约500bp内的靶DNA中的位点),那么该双重加标签的链可被纯化、PCR扩增、任选地用可检测的染料标记(例如,用作与例如用于表达分析的微阵列退火的靶),或首先被捕获在表面上(例如,在珠子上;例如用于下一代测序的珠子),然后扩增(例如,使用乳液PCR,例如用作下一代测序模板;或使用有限循环PCR,例如在拷贝数变异(CNV)实验中使用,例如通过微阵列上的比较基因组杂交)。图22 (A)显示使用本发明的方法的基因组DNA的DNA断裂、加标签和环化的实施方案的示意图。黑线的尖头方框代表p4M. IMEDS转座子末端组合物。虚线代表T7 Dlll 基因组dsDNA片段。图22 (B)显示使用p454. IMEDS转座子末端组合物和EZ_Tn5 转座酶(EPICENTRE Biotechnologies)的T7 Dili基因组dsDNA的5,加标签和断裂的产物的琼脂糖凝胶。如所示在存在或不存在EZ-Tn5转座酶的情况下,将1 μ g的T7 Dlll基因组dsDNA在有或没有0. 5 μ M的p454. IMEDS转座子末端组合物时在33mM Tris乙酸盐pH 7. 6、66mM KOAc和 IOmM Mg(OAc)2中在37°C下孵育1小时。通过在1 %琼脂糖凝胶中电泳分辨5‘加标签的线性ssDNA反应产物并用STOR Gold染色。图23 (A)显示使用pMETS和p454. 1寡核苷酸作为PCR引物PCR扩增加标签的环状ssDNA片段的示意图。图23 (B)显示在使用pMETS和pc454. 1寡核苷酸作为PCR引物通过PCR对使用本发明的方法获得的加标签的环状ssDNA片段进行扩增时获得的PCR扩增产物的琼脂糖凝胶。首先,如图22(B)中所示获得的5'加标签的断裂的dsDNA通过95°C加热3分钟并迅速在冰上冷却而变性。如实施例17中所示在存在或不存在400单位的CIRCLIGASE ssDNA 连接酶的情况下于60°C将得到的变性的5'加标签的线性ssDNA片段的一部分在Tris乙酸盐pH 7. 6、66mM KOAc,2. 5mM MnCl2和IM甜菜碱中孵育2小时,以便使该5'加标签的线性ssDNA片段环化。将反应产物与外切核酸酶I和外切核酸酶III 一起在37°C孵育1小时以便在PCR扩增前消化线性ssDNA片段。然后使用pMETS和pc454. 1寡核苷酸作为PCR 引物通过PCR扩增该加标签的环状ssDNA片段。通过1 %琼脂糖电泳分辨PCR产物并通过SYBR Gold染色显现。定义除非在本文别处具体限定或不同地描述,否则以下与本发明有关的术语和描述应按照下面给出的来理解。当本文使用术语“例如”、“如”、“诸如”、“包括”、“包含”或其变体时,这些术语将不
被认为是限制性术语,而将被解释为表示“但不限于”或“不限于”。除非本文另外指明或根据上下文明显矛盾,否则术语“一个”和“一种”以及“该” 和类似指称物在描述本发明的上下文中(尤其在以下权利要求的上下文中)使用应被解释成覆盖单数和复数。如本文所用,术语“分离的”、“来分离”、“分离”、“纯化的”、“来纯化”、“纯化”以及它
们的语法等同物在本文使用时,除非另外指明,否者是指从分离材料的样品或来源(例如细胞)中减少至少一种污染物(诸如蛋白和/或核酸序列)的量。因此纯化导致“富集”, 即样品中期望的蛋白和/或核酸序列的量的增加。如本文所用,“标签(tag) ”是指向它所接合的核酸片段提供寻址手段的非靶核酸组分,一般为DNA。例如,在优选的实施方案中,标签包括允许与其相连的DNA的鉴定、识别和/或分子操作或生物化学操作的核苷酸序列(例如,通过提供用于使寡核苷酸退火的位点,所述寡核苷酸诸如用于DNA聚合酶延伸的引物或者捕获反应或连接反应的寡核苷酸)。 将标签与DNA分子接合的过程有时在本文称为“加标签”并且经历加标签或含标签的DNA称为“加标签的”(例如,“加标签的DNA”)。如本文所用,术语“连接酶”是指催化核酸链的5'-磷酸和3'-羟基末端之间磷酸二酯键的分子内形成和分子间形成的核酸修饰酶。连接酶包括例如,可接合单链RNA 和DNA的末端的不依赖模板的连接酶诸如CIRCLIGASE ssDNA连接酶,以及在双链DNA中密封切口的依赖模板的连接酶或同源连接酶(以下描述的实例)。如本文所用,“同源连接酶”或“依赖模板的连接酶”表示催化在与互补多核苷酸退火时彼此邻近的DNA链的5'-磷酸与3'-羟基末端之间磷酸二酯键的分子内和分子间形成的DNA连接酶。分子内连接的一些实施方案产生环状分子并称为“环化”。与要连接的 DNA末端中的两个末端邻近地退火的多核苷酸在本文被称为“连接模板”并且这种连接被称为“同源连接”或“依赖模板的连接”。连接模板可以是生物样品的基因组DNA或其他DNA中的互补DNA序列(在这种情况下,通常称其为“靶序列”),或者连接模板可以是为了用于特定测定或方法而特别合成和/或提供的“桥接寡脱氧核糖核苷酸”或“连接夹板(ligation splint)寡脱氧核糖核苷酸”(或“连接夹板”)。同源DNA连接酶或依赖模板的DNA连接酶的实例包括NAD型DNA连接酶,诸如大肠杆菌DNA连接酶、Tth DNA连接酶、Tfl DNA连接酶和 AMPLIGASE DNA 连接酶(EPICENTRE Biotechnologies, Madison, WI,USA),它们只有在存在连接模板的情况下催化ssDNA分子的分子内连接;以及ATP型DNA连接酶,诸如T4 DNA连接酶或FASTLINK DNA连接酶(EPICENTRE Biotechnologies),尽管对于平端连接 ATP型DNA连接酶不需要连接模板,但它们更有效地催化依赖模板的连接。在一些优选的实施方案中,依赖模板的连接酶来自于嗜冷细菌或嗜冷噬菌体以使得连接可在较低温度下进行(例如,当形成连接接点的寡核苷酸或多核苷酸的序列显示较低Tm时)。选择如下DNA连接酶以在该方法中使用所述DNA连接酶在用于接合的DNA分子(例如,5'加标签的DNA片段延伸产物或5'加标签的DNA片段与随机序列寡核苷酸) 退火持续足以被连接酶连接的时间的温度下是有活性的。在本发明的方法的实施方案中的一个重要步骤是使用体外转座反应将靶DNA断裂并加标签以产生加标签的DNA片段。体外转座反应需要转座酶、转座子末端组合物以及适合的反应条件。“转座酶”表示如下的酶该酶能够与包含转座子末端的组合物(例如,转座子、转座子末端、转座子末端组合物)形成功能复合物并催化该包含转座子末端的组合物插入或转座进入在体外转座反应中与该酶孵育的双链靶DNA中。术语“转座子末端”表示只显示在体外转座反应中与转座酶或整合酶形成有功能的复合物所必需的核苷酸序列(“转座子末端序列”)的双链DNA。转座子末端与识别并结合该转座子末端的转座酶或整合酶形成“复合物”或“联合复合物(synaptic complex) ”或“转座体复合物”或“转座体组合物”,并且该复合物能够将该转座子末端插入或转座进入在体外转座反应中与其孵育的靶DNA中。转座子末端显示由“转移的转座子末端序列”或“转移链”以及“非转移的转座子末端序列”或“非转移链”构成的两条互补序列。例如,与体外转座反应中有活性的高活性Tn5转座酶(例如,ΕΖ-Τη5 转座酶,EPICENTRE Biotechnologies, Madison,WI,USA)形成复合物的一个转座子末端包括显示如下“转移的转座子末端序列”的转移链5' AGATGTGTATAAGAGACAG 3' (SEQ ID NO 1),以及显示如下“非转移的转座子末端序列”的非转移链5' CTGTCT CTTATACACATCT 3' (SEQ ID NO 2) 在体外转座反应中,转移链的3'端与靶DNA接合或转移至靶DNA。在体外转座反应中,显示与转移的转座子末端序列互补的转座子末端序列的非转移链不与靶DNA接合或不转移至靶DNA。在一些实施方案中,转移链和非转移链是共价接合的。例如,在一些实施方案中, 在单个寡核苷酸上提供转移链序列和非转移链序列,例如在发夹构型中。这样,尽管非转移链的游离端没有通过转座反应直接与靶DNA接合,但该非转移链间接与DNA片段相连,因为该非转移链通过发夹结构的环与转移链连接。“转座子末端组合物”表示包含转座子末端(即,能够与转座酶作用进行转座反应的最小双链DNA片段)任选地加上转移的转座子末端序列5'-的和/或非转移的转座子末端序列3'的另外的序列的组合物。例如,与标签相连的转座子末端为“转座子末端组合物”。在一些实施方案中,转座子末端组合物包括两种转座子末端寡核苷酸或由两种转座子末端寡核苷酸构成,所述转座子末端寡核苷酸由联合显示转座子末端的序列并且其中的一条或两条链包括另外的序列的“转移的转座子末端寡核苷酸”或“转移链”以及“非转移链末端寡核苷酸”或“非转移链”构成。术语“转移的转座子末端寡核苷酸”和“转移链”可互换使用并且是指“转座子末端”和“转座子末端组合物” 二者的转移部分,即不考虑转座子末端是否与标签或其他部分相连。类似地,术语“非转移的转座子末端寡核苷酸”和“非转移链”可互换使用并且是指“转座子末端,,和“转座子末端组合物,,二者的非转移部分。在一些实施方案中,转座子末端组合物是“发夹转座子末端组合物”。如本文所用,“发夹转座子末端组合物”表示由单个寡脱氧核糖核苷酸构成的转座子末端组合物,所述寡脱氧核糖核苷酸显示在其5'端的非转移链转座子末端序列、在其3'端的转移的转座子末端序列以及足够长的允许分子内茎-环形成的在该非转移的转座子末端序列与该转移的转座子末端序列之间的间插的任意序列, 以使得该转座子末端部分能够在转座反应中发挥功能。在一些实施方案中,发夹转座子末端组合物的5'端在5'-核苷酸的5'位置具有磷酸基团。在一些实施方案中,在发夹转座子末端组合物的非转移的转座子末端序列与转移的转座子末端序列之间的间插的任意序列提供用于特定用途或应用的标签(例如,包括一个或多个标签域)。在一些实施方案中,本发明的方法产生加标签的环状ssDNA片段。在一些实施方案中,加标签的环状ss DNA片段仅显示转座子末端组合物的转移链的序列,而加标签的环状ss DNA片段不显示转座子末端组合物的非转移链的序列。在一些实施方案中,在本发明的方法中使用的转座子末端组合物包括仅显示与转座酶或整合酶形成复合物并且为转座反应所需的转座子末端序列的转座子末端寡核苷酸; 在这些实施方案中,使用该方法产生的加标签的环状ssDNA片段中的标签仅显示转移的转座子末端序列。然而,在一些实施方案中,转座子末端组合物包括至少一种转座子末端寡核苷酸或由其构成,所述转座子末端寡核苷酸除了转座子末端序列之外还显示一种或多种其他的核苷酸序列。因此,在一些实施方案中,转座子末端组合物包括显示转移的转座子末端序列 5'的一种或多种其他核苷酸序列的转移链,所述一种或多种其他核苷酸序列也由标签显示。因此,除了转移的转座子末端序列之外,标签可具有一个或多个其他的标签部分或标签域。如本文所用,“标签部分”或“标签域”表示显示用于期望的预定目的或应用的序列的标签的部分或结构域。一种标签部分或标签域是“转座子末端域”,该标签部分或标签域显示转移的转座子末端序列。在其中转移链也显示转移的转座子末端序列5'的一种或多种其他核苷酸序列的一些实施方案中,标签在所述5'部分中也具有一种或多种其他的“标签域”,标签域中的每一种为任何期望的目的而提供。例如,本发明的一些实施方案包括以下转座子末端组合物或由其构成,所述转座子末端组合物包括如下或由如下构成(i)显示转移的转座子末端序列5'的一种或多种序列的转移链,所述转移的转座子末端序列包括标签域或由标签域构成,所述标签域选自限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种;以及(ii)显示非转移的转座子末端序列的非转移链。本发明包括使用所述转座子末端组合物中的任何一个或多个的方法的实施方案。如本文所用,“切割域”是指易感的核酸序列。如本文所用,“限制性位点域”表示显示用于使利用限制性内切核酸酶的切割容易的目的的序列的标签域。例如,在一些实施方案中,使用限制性位点域来产生加双标签的线性ssDNA片段。在一些实施方案中,使用限制性位点域在标签域中产生相容的双链的5' 端,以使得可使用依赖模板的DNA连接酶将这个末端连接至另一个DNA分子。在一些优选的实施方案中,在标签中的限制性位点域显示在靶DNA中如果有也只很少出现的限制性位点的序列(例如,稀有切割的限制性内切核酸酶诸如NotI或AscI的限制性位点)。在一些优选的实施方案中,在限制性位点域中的限制性位点是用于II型限制性内切核酸酶诸如FokI限制性内切核酸酶的限制性位点。在其中转座子末端组合物的转移链包括转移的转座子末端序列5'-的一个或多个限制性位点域的一些实施方案中,所述方法还包括使与加标签的环状ssDNA片段的单链限制性位点互补的寡脱氧核糖核苷酸退火,然后使用识别该限制性位点的限制性内切核酸酶在该限制性位点切割该加标签的环状ssDNA片段。因此,在一些实施方案中,所述方法包括使加标签的环状ssDNA片段线性化以产生加双标签的线性ssDNA片段。在其中转座子末端组合物的转移链包括转移的转座子末端序列5'-的一个或多个限制性位点域的一些其他的实施方案中,该转座子末端组合物的转移链包括含限制性位点的双链发夹,并且该方法还包括使用识别该限制性位点的限制性内切核酸酶在该限制性位点切割加标签的线性ssDNA片段的步骤;然而,在一些实施方案中,这种方法不是优选的,因为双链发夹提供了 dsDNA的位点,转座子末端组合物可被转座酶或整合酶转座进入该dsDNA的位点中。在包括以下的一些优选的实施方案中(i)通过与单链限制性位点互补的寡脱氧核糖核苷酸的退火或通过使用包含双链发夹的转移链,产生双链的限制性位点,并且(ii) 然后使用识别该双链的限制性位点的限制性内切核酸酶切割该限制性位点,该方法还包括将限制性内切核酸酶切割的加标签的线性ssDNA片段与具有相容的3'端的另一种DNA分子相连接的步骤。如本文所用,“捕获标签域”或“捕获标签”表示如下标签域显示用于使该标签域接合的ssDNA片段的捕获容易的目的的序列(例如,提供退火位点或亲和标签用于将加标签的环状ssDNA片段或加双标签的线性ssDNA片段捕获在珠子或其他表面上,例如,其中该标签域序列的退火位点允许通过与表面上的特异性序列诸如在珠子或在微芯片或微阵列或在测序珠子上的探针退火来捕获)。在该方法的一些实施方案中,在加标签的环状ssDNA 片段或加双标签的线性ssDNA片段通过与表面上的互补探针退火而被捕获后,捕获标签域提供用于使用所述加标签的环状ssDNA片段或所述加双标签的线性ssDNA片段(或所述加标签的环状ssDNA片段或加双标签的线性ssDNA片段的互补序列)作为模板引发DNA合成的位点。在一些其他的实施方案中,捕获标签域包括与化学基团或化学部分接合的转移链的5'部分,所述化学基团或化学部分包括亲和性结合分子或由其构成(例如,其中转移链的5'部分与第一亲和性结合分子诸如生物素、抗生蛋白链菌素、抗原或结合该抗原的抗体接合,所述第一亲和性结合分子允许在第二亲和性结合分子附连的表面上捕获环状加标签的ssDNA片段或加双标签的线性ssDNA片段,所述第二亲和性结合分子与所述第一亲和性结合分子形成特异性结合对)。如本文所用,“测序标签域”或“测序标签”表示显示用于如下目的的序列的标签域使利用合成加标签的环状ssDNA片段的方法对该标签接合的ssDNA片段的测序容易(例如,提供引发位点用于通过合成测序,或提供退火位点用于通过连接测序,或提供退火位点用于通过杂交测序)。例如,在一些实施方案中,测序标签域提供了用于引发所述 ssDNA片段或所述ssDNA片段的互补序列的DNA合成的位点。如本文所用,“扩增标签域”表示显示用于如下目的的序列的标签域使所述标签附加的核酸的扩增容易。例如,在一些实施方案中,扩增标签域提供用于使用DNA聚合酶的核酸扩增反应(例如,PCR扩增反应或链置换扩增反应或滚环扩增反应)的引发位点,或用于在核酸扩增反应(例如,连接链反应)中使用依赖模板的连接酶连接探针的连接模板。如本文所用,“检测标签域”或“检测标签”表示显示用于如下目的的序列或可检测的化学部分或生物化学部分的标签域使加标签的环状ssDNA片段或加双标签的线性 ssDNA片段的检测容易(例如,其中所述序列或化学部分包括可检测的分子或与可检测的分子接合;所述可检测的分子诸如选自以下的可检测分子可见的、荧光的、化学发光的或其他可检测的染料;在存在底物的情况下可检测的酶,例如碱性磷酸酶与NBT加BCIP或过氧化物酶与适合的底物);可检测的蛋白,例如,绿色荧光蛋白;以及与可检测的部分结合或者可与另一种可检测的亲和性结合分子形成亲和性结合对或特异性结合对的亲和性结合分子;或本领域已知的许多其他可检测分子或系统中的任何一种)。如本文所用,“地址标签域”或“地址标签”表示显示允许特定样品的鉴定的序列的标签域(例如,其中转移链具有对每种样品显示不同序列的不同地址标签域)。如本文所用,“转录启动子域”或“启动子域”表示显示用于RNA聚合酶启动子的正义启动子序列或反义启动子序列的序列的标签域。如本文所用,“正义启动子序列”表示与充当RNA聚合酶转录的模板的DNA链接合的RNA聚合酶启动子的序列,所述RNA聚合酶结合RNA聚合酶启动子并且在适于转录的反应条件下从RNA聚合酶启动子启动转录。如本文所用,“反义启动子序列”表示与正义启动子序列互补的RNA聚合酶启动子的序列。在一些实施方案中,由转录启动子域显示的正义启动子序列用于结合单链的RNA聚合酶启动子并自其启动转录的RNA聚合酶,在这些实施方案中,正义启动子序列足以作为RNA聚合酶启动子发挥功能(例如,用于噬菌体N4 RNA聚合酶)。在一些实施方案中,正义启动子序列用于结合双链的RNA聚合酶启动子并自其启动转录的RNA聚合酶,在这些实施方案中,该方法包括在使用结合双链RNA聚合酶启动子并自其启动转录的RNA聚合酶进行转录之前, 使RNA聚合酶启动子变为双链的(例如,通过正义启动子序列与显示与正义启动子序列互补的反义启动子序列的寡脱氧核糖核苷酸退火,或者通过使用加标签的环状ssDNA片段或加双标签的线性ssDNA片段作为模板来合成包含正义启动子序列或由正义启动子序列构成的dsDNA)。在一些实施方案中,正义启动子序列是用于T7型RNA聚合酶(例如,选自T7 RNA聚合酶、T3 RNA聚合酶和SP6 RNA聚合酶)的。显示正义启动子序列的转录启动子域使得合成与使用该方法与转座子末端组合物的转移链相连接的单链靶RNA互补的RNA成为可能。使用包含如下转移链的转座子末端组合物产生的加标签的环状ssDNA片段不能被RNA 聚合酶转录所述转移链具有显示反义启动子序列的转录启动子域。然而,在一些实施方案中,通过延伸与加标签的环状ssDNA片段退火的引物而合成的dsDNA用于通过RNA聚合酶的转录,所述RNA聚合酶结合双链RNA聚合酶启动子并自其启动转录;在这些实施方案中, 合成的RNA显示与加标签的环状ssRNA片段相同的序列。不同的标签域的名称和描述是为了便利,这样使得理解和讨论不同实施方案中的标签的不同部分或域的预定目的和应用更容易。然而,这些名称和描述不旨在以任何方式限制标签或其任何一种标签域的使用或应用。因此,任何具体的标签或标签域可用于除了预定的或主要的目的或应用以外任何目的,或者代替预定的或主要的目的或应用的任何目的。同样,一种标签域可包括两种或更多种其他标签域(例如,测序标签域可包括转座子末端域和转座子末端域5'-的另一种标签域),或一种标签域可提供两种或更多种不同的标签域的功能或目的或应用(例如,转座子末端域可提供转移的转座子末端的目的并且还提供用于特定应用的测序标签域和/或捕获标签域的功能或目的)。更进一步,不必按照一种或多种不同的域描述标签以便用于任何特定的目的或应用或功能。如本文所用,在提到核酸或核酸反应时使用的术语“扩增”或“扩增的”、“扩增了,, 是指制备特定核酸诸如靶核酸或例如按照本发明的实施方案产生的加标签的核酸的拷贝的体外方法。扩增核酸的许多方法是本领域已知的,并且扩增反应包括聚合酶链反应、连接酶链反应、链置换扩增反应、滚环扩增反应、转录介导的扩增方法诸如NASBA(例如,美国专利第5,409,818号)、环介导的扩增方法(例如,使用成环序列的“LAMP”扩增,例如,在美国专利第6,410,278号中所述)。扩增的核酸可以是包含DNA或RNA或DNA和RNA的混合物、 由DNA或RNA或DNA和RNA的混合物构成的、或者衍生自DNA或RNA或DNA和RNA的混合物的DNA,包括修饰的DNA和/或RNA。从核酸分子的扩增产生的产物(即“扩增产物”)可以是DNA或RNA,DNA和RNA核苷或核苷酸的混合物,而不论起始核酸是DNA、RNA或是DNA 和RNA 二者,或者这些产物可以包括修饰的DNA或RNA核苷或核苷酸。“拷贝”不必表示对靶序列的完美序列互补性或同一性。例如,拷贝可包括核苷酸类似物诸如脱氧肌苷或脱氧尿苷,有意的序列变更(诸如通过包含可与靶序列杂交但不互补的序列的引物,和/或扩增过程中出现的序列错误引入的序列变更。本文的“亲和性结合物质”或“亲和性结合分子”或“亲和性分子”表示对于彼此具有亲和力并且在称为“结合条件”的某些条件下彼此“结合”形成“特异性结合对”的分子。例如,生物素和抗生蛋白链菌素,生物素和抗生物素蛋白,或者洋地黄毒苷和结合洋地黄毒苷的特异性抗体是“特异性结合对”的实例,其中每个特异性结合对的成员包括“亲和性结合分子”或“亲和性结合物质”或“亲和性分子”。可使用本领域已知的方法将亲和性结合分子(例如,生物素和/或抗生蛋白链菌素)与其他分子(例如,与RNA或DNA)或与固体表面共价地接合或轭合,或非共价地结合(例如,使用D. Mvage等人,Pierce Chemical Company, 1992 的 Avidin-Biotin Chemistry :A Handbook (抗生物素蛋白-生物素化学手册)禾口在R. P. Hoagland,Molecular Probes, Inc.的Handbook of Fluorescent Probes and Research Products (荧光探针和研究产物手册),第九版,以及在Academic Press, Inc., San Diego, CA, 1996 出版的 Greg Τ. Hermanson 的 BI0C0NJUGATE ^Techniques (生物轭合技术)中所述的试剂和方法)。与DNA和RNA轭合的亲和性分子也可以使用寡核苷酸合成仪使用本领域中已知的试剂和方法来合成。根据本发明的术语“结合”表示由于非共价键造成的亲和性分子和亲和性结合物质之间的相互作用,所述非共价键诸如但不限于氢键、疏水相互作用、范德华键和离子键。 不希望受理论限制,在本领域中相信这些种类的非共价键导致结合,部分上是由于特异性结合对中包含的分子的互补形状或结构。基于“结合”的定义和种类繁多的亲和性结合分子或特异性结合对,很显然结合条件对于不同的特异性结合对是不同的。本领域技术人员可容易地发现或确定样品中在亲和性结合分子之间发生结合所凭借的条件。具体而言,本领域技术人员可容易地确定可使本领域中被认为是“特异性结合”的亲和性结合分子之间的结合发生所凭借的条件。如本领域中所了解的,这种特异性通常是由于在亲和性结合分子之间的亲和性比对样品中的其他物质和组分(例如,容器壁、固体支持体)的亲和性高。 在某些情况下,特异性还可能包括或可能由于,亲和性结合分子的缔合比与样品中的其他物质或组分的缔合显著更快。
术语“使退火”或“使杂交”以及“退火”或“杂交”是指具有经由沃森-克里克碱基配对形成复合物的充分互补性的核苷酸序列之间形成复合物。就本发明来说,彼此之间 “对其互补”或“与之互补”或与其“杂交”或“退火”的核酸序列应该能形成或形成服务于预定目的的足够稳定的“杂交体”或“复合物”。不要求由一个核酸分子显示的序列内的每个核酸碱基能够与由第二核酸分子显示的序列内的每个核酸碱基进行碱基配对或配对或复合,以便这两个核酸分子或其中显示的相应序列与彼此“互补”或“退火”或“杂交”。如本文所述,在提及按碱基配对法则联系的核苷酸的序列时使用术语“互补的”或“互补性”。 例如,序列5' -A-G-T-3'与序列3' -T-C-A-5'互补。互补性可以是“部分的”,其中核酸碱基中只有一些根据碱基配对法则匹配。或者,在核酸之间可具有“完全的”或“全部的”互补性。核酸链之间的互补性的程度对核酸链之间的杂交的效率和强度具有显著影响。这在扩增反应以及依赖于核酸的杂交的检测方法中是特别重要的。术语“同源性”是指一条核酸序列与另一条核酸序列的互补性程度。可具有部分同源性或完全同源性(即,互补性)。 部分互补的序列是至少部分地抑制完全互补的序列与靶核酸的杂交的序列并且使用功能术语“基本上同源的”称呼。完全互补的序列与靶序列的杂交的抑制可使用杂交测定(DNA 印迹或RNA印迹,溶液杂交等)在低严格度条件下来检查。基本上同源的序列或探针将竞争或抑制完全同源的序列与靶在低严格度条件下的结合(即杂交)。这并不是说低严格度条件是允许非特异性结合的条件;低严格度条件要求两条序列与彼此的结合是特异性(即选择性)相互作用。非特异性结合的不存在可以通过使用缺乏互补性或只具有低互补性程度(例如,小于约30%的互补性)的第二靶来测试。在特异性结合很低或不存在的情况下, 探针将不与核酸靶杂交。当用于提及双链核酸序列诸如cDNA或基因组克隆时,术语“基本上同源的”是指可在本文所述的低严格度条件下与双链核酸序列的一条链或两条链杂交的任何寡核苷酸或探针。如本文所用,在提及互补的核酸链的配对时使用术语“退火”或“杂交”。杂交和杂交强度(即,核酸链之间的缔合强度)受本领域中公知的许多因素影响,包括核酸之间的互补性程度,包括受诸如盐浓度影响的条件的严格度,形成的杂交体的Tm(解链温度),其他组分的存在(例如,存在或不存在聚乙二醇或甜菜碱),杂交链的摩尔浓度以及核酸链的G:C含量。一般来说,“cDNA”或“cDNA分子”是指使用感兴趣的RNA分子的至少一部分作为模板通过RNA依赖性DNA聚合酶或反转录酶催化的与该感兴趣的RNA分子退火的引物的延伸而合成的“互补的DNA”(该过程也称为“反转录”)。所合成的cDNA分子与该模板的至少一部分“同源”或“碱基配对”或“形成复合物”。如本文所用,“DNA片段的群体”是指例如来自靶DNA的DNA片段的大多数或集合。 在一些实施方案中,DNA片段群体包括DNA片段文库,所述DNA片段文库包含性质上和/或数量上代表靶DNA序列的序列,而在一些实施方案中,DNA片段的群体含DNA文库的子集, 例如,该群体可不代表靶DNA的序列。如本文所用,“DNA片段文库”或“DNA片段的文库”表示从靶DNA产生的加标签的 DNA片段(例如,加双标签的DNA片段或加标签的环状ssDNA片段)的集合或群体,其中在该集合或群体中加标签的DNA片段的组合显示在性质上和/或数量上代表从中产生加标签的DNA片段的靶DNA的序列的序列,并且其中没有通过有意使用基于该靶DNA的核苷酸或序列组成包括或排除加标签的DNA片段的方法来选择接受或选择反对处于该集合或群体中加标签的DNA片段出于各种原因,有可能DNA片段文库可不包含代表由靶DNA显示的每条序列的加标签的DNA片段。例如,在一些实施方案中,加标签的DNA片段文库可不包含显示包括线性 dsDNA的靶DNA的末端序列的加标签的DNA片段(例如,由于两个转座子末端组合物低频率插入靶DNA的末端部分)。一般地说,对于预定的目的或应用来说,可接受显示靶DNA的某些部分或区域的序列的加标签的DNA片段的低频率或缺乏。然而,对于认为产生如下DNA 片段文库对于特定目的或应用来说是重要的或令人期望的那些情形中,本发明还包括另外的方法实施方案在所述DNA片段文库中,加标签的DNA片段以较高的可能性显示由产生这些片段的靶DNA所显示的每条序列(例如,参见名为(“用于产生在靶DNA末端具有改进的序列代表性的DNA片段文库的方法”)的说明书章节)。更进一步,在一些情况下,如果更多的靶DNA分子存在于所述方法的转座反应步骤中,则DNA片段文库将包含显示靶DNA的每条序列的加标签的DNA片段的可能性将会提高,从而使用所述方法产生更多的5'加标签的DNA片段分子。因此,用于提高DNA片段文库包含显示靶DNA所显示的每条序列的加标签的DNA片段的可能性的另一种方法是扩增靶DNA,然后使用该扩增的靶DNA代替靶DNA以用于产生DNA片段文库。又在其中靶DNA包括使用反转录反应从RNA制备的dsDNA的其他的实施方案中,在使用反转录步骤将RNA转化成dsDNA之前,通过扩增RNA来扩增靶DNA的量。本文公开了可用于提供扩增的靶DNA的一些用于扩增RNA和DNA分子的方法。然而, 本发明不受用于扩增靶DNA的方法限制。在一些实施方案中,使用本文公开的方法之一扩增靶DNA,而在一些其他的实施方案中,使用本领域已知的另一种方法。如本文所用,术语“核酸修饰酶”是指作用于DNA来实现修饰的任何酶,所述修饰例如切割、连接、聚合、磷酸化等等。核酸修饰酶包括,例如聚合酶、核酸酶、转移酶、连接酶、磷酸化酶、磷酸酶、甲基化酶、转座酶等等。“DNA修饰酶”包括作用于DNA的任何酶,包括也作用于其他底物诸如RNA的酶。如本文所用,“DNA聚合酶”是指催化脱氧核糖核苷酸聚合成DNA链的酶。DNA聚合酶包括需要模板核酸来确定聚合物中添加脱氧核糖核酸的次序的“依赖模板的DNA聚合酶”,或者它们可以是“不依赖模板的”,以致它们催化聚合作用而不参考模板序列。“依赖DNA的DNA聚合酶”是通过延伸与DNA模板退火的引物来合成互补的 DNA ( “cDNA” )拷贝的酶。一些依赖DNA的DNA聚合酶还可以从RNA模板合成互补的DNA 拷贝,这一过程也称为“反转录”。可反转录的DNA聚合酶也可以称为“反转录酶”。除了合成DNA聚合物外,DNA聚合酶可包括其他特征或活性。例如,可将DNA聚合酶表征为具有或缺乏5'到3'外切核酸酶活性(也称为5'外切核酸酶或5'核酸酶活性),3'到5'外切核酸酶活性,链置换活性,并且可以就它们可持续(processive)或可分布的程度对其进行表征,如下面更详细讨论的。一些DNA聚合酶能够将与模板链互补的链置换为由该聚合酶合成的新DNA链。这一过程称为“链置换”并且具有这种活性的DNA聚合酶在本文称为“链置换DNA聚合酶”。 用于链置换DNA合成的模板可以是线性或环状的单链DNA(ssDNA)或双链DNA(dsDNA)。如果DNA模板是单链环,那么引发的DNA合成绕该环一圈又一圈进行,链的连续置换早于复制链,这一过程称为“滚环复制”。滚环复制导致环状模板的串联拷贝的合成。一般来说, 优选的是,用于本发明的方法的DNA模板特异性DNA聚合酶有效率地合成具有适合长度的DNA用于预定目的而不从模板上“脱落”(或终止DNA的合成),这称为酶的持续合成能力 (processivity)。DNA聚合酶的链置换能力可使用该聚合酶在由Fire和Xu(Proc. Natl. Acad. Sci. USA 92 :4641-4645,1995)所述的滚换复制测定中容易地确定。链置换和DNA聚合酶持续持续合成能力还可以使用Kong等人(J. Biol. Chem. 268 1965-1975,1993)描述的方法来测定。末端转移酶在本文也被定义为DNA聚合酶,所述DNA聚合酶用作本发明的试剂盒和方法的一些实施方案中的组合物。末端转移酶在一些实施方案中是优选的,因为它催化不依赖模板地添加dNTP到DNA的3'羟基末端。一些实施方案包括的方法使用具有释放以可检测的部分(例如,包含可见的、荧光的、化学发光的或其他可检测的分子的部分)标记的核苷酸的5'到3'外切核酸酶活性的DNA聚合酶组合物作为测定DNA聚合并从而检测和/或定量在样品中充当模板的核酸分子的存在的手段(例如,用与Applied Biosystems, Inc.的TaqMan 测定类似的方式)。 在一些实施方案中,本发明包含缺乏5'到3'外切核酸酶活性的DNA聚合酶组合物。一些实施方案包括的方法使用缺乏5'到3'外切核酸酶活性的DNA聚合酶组合物。例如,在一些实施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶组合物用于DNA 测序。例如,在一些其它实施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶组合物用于全基因组扩增。在一些实施方案中,本发明包含具有5'到3'外切核酸酶活性的DNA聚合酶组合物。在一些优选的实施方案中(例如,其中除了依赖模板的连接酶之外,在本文所述方法的一种方法中使用DNA聚合酶用于接合),该方法使用缺乏5'核酸酶活性(包括5'到3' 外切核酸酶和依赖5'结构的核酸酶活性二者)的DNA聚合酶组合物。例如,在一些其他的实施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶组合物用于填充缺口。因此,在方法或试剂盒的一些实施方案中中,本发明包括缺乏5'核酸酶活性的DNA聚合酶组合物。 然而,具有释放以可检测的部分(例如,包含可见的、荧光的、化学发光的或其他可检测的分子的部分)标记的核苷酸或寡核苷酸的5'核酸酶活性的作为测定DNA聚合并从而检测和/或定量在样品中充当模板的核酸分子的存在的手段(例如,用与Applied Biosystems, Inc.的TaqMan 测定类似的方式)的DNA聚合酶组合物可用于定量使用本发明的方法产生的DNA分子。可使用的链置换DNA聚合酶的实例包括但不限于R印liPHI phi29 DNA聚合酶、 DisplaceAce DNA 聚合酶、rGka DNA 聚合酶、kquiTherm DNA 聚合酶、iTaq DNA 聚合酶、 Tfl DNA 聚合酶、和 MMLV 反转录酶(全部可从 EPICENTRE Biotechnologies, Madison, WI, USA获得)。在一些实施方案中,缺乏3'到5'外切核酸酶校正活性的DNA聚合酶与具有这种活性的DNA聚合酶诸如FAILSAFE DNA聚合酶的掺合物用作链置换DNA聚合酶。酶掺合物在一些实施方案中是有用的,因为它在DNA合成过程中显示改善的保真度(S卩,它合成具有较少的不与模板互补的核苷酸的DNA)。许多DNA聚合酶在特定条件下的保真度和/或错误率是已知的,测量保真度的方法(例如,通过测序)也是已知的。一般来说,在本发明的链置换扩增方法中期望该方法中使用的链置换DNA聚合酶的量尽可能高但不抑制或不利地影响反应。例如,REPLIPHI phi29 DNA聚合酶 (EPICENTRE)在20微升反应中能够以大约一微克蛋白使用,并且DISPLACE DNA聚合酶 (EPICENTRE)在50微升反应中能够以大约50单位到大约300单位使用。因为单位的定义对于不同的DNA聚合酶以及甚至对于不同卖家或来源的相似DNA聚合酶来说都是不同的, 并且还因为每种酶的活性在不同的温度以及在不同的反应条件下是不同的,所以期望针对使用的每种DNA模板和引物优化链置换DNA聚合酶的量以及反应条件。链置换可通过使用链置换因子诸如解旋酶变得容易,但是因为各种DNA聚合酶可用于本发明,所以通常不需要这种链置换因子。认为可在存在链置换因子的情况下进行滚环复制的任何DNA聚合酶适合用在包括链置换的本发明的实施方案中,即使该DNA聚合酶在不存在这种因子的情况下不进行滚环复制。允许滚环复制的链置换因子包括但不限于 BMRFl 聚合酶辅助亚基(Tsurumi 等人,J. Virology, 67 :7648-7653,1993),腺病毒 DNA 结合蛋白(Zijderveld 和 van der Vliet, J. Virology,68 :1158_1164,1994),单纯疱疹病毒蛋白 ICP8 (Boehmer 和 Lehman, J. Virology, 67 :711-715,1993) ;Skaliter 和 Lehman, Proc. Natl. Acad. Sci. USA, 91 :10,665-10,669,1994),单链 DNA 结合蛋白(SSB ;Rigler 和 Romano, J. Biol. Chem.,270 :8910-8919,1995),以及小牛胸腺解旋酶(Siegel 等人,J. Biol Chem.,267 :13,629-13,635,1992),全部这些文献均通过引用并入本文。如本文所用的“单核苷”或“核苷”是指由共价连接至戊糖的嘌呤(鸟嘌呤(G)或腺嘌呤(A))或嘧啶(胸腺嘧啶(T)、尿嘧啶(U)或胞苷(C))碱基构成的化合物,而“核苷酸”是指在戊糖的一个羟基基团处磷酸化的核苷。术语“规范的”用来指DNA中常见的四种常见的核酸碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶,或指对应的包含规范的碱基的脱氧核糖核苷、脱氧核糖核苷酸或2'-脱氧核糖核苷-5'-三磷酸。术语“非规范的”用来指DNA 中除了四种规范的碱基之外的核酸碱基或指对应的包含非规范碱基的脱氧核糖核苷、脱氧核糖核苷酸或2'-脱氧核糖核苷-5'-三磷酸。例如,尽管尿嘧啶是RNA中的常见核酸碱基,但尿嘧啶是DNA中的非规范碱基。“非规范碱基”见于由于非规范核苷酸的掺入(例如,通过使用寡核苷酸合成仪合成或通过使用DNA聚合酶合成)或由于现有碱基(规范的或非规范的)的修饰产生的核酸。“核酸”或“多核苷酸”表示包含一系列也称为“核苷”的“单核苷”的聚合物分子, 其中一个核苷的戊糖的3'位置通过核苷间连接诸如但不限于磷酸二酯键与下一个核苷的戊糖的5'位置相连接。与磷酸基团相连接的核苷称为“核苷酸”。与该系列中的下一个核苷酸的5'位置连接的核苷酸称为“5'的”或“5'核苷酸”,而与该5'核苷酸的3'位置连接的核苷酸称为“3'的”或“3'核苷酸”。如本文所用,术语“5'-的”和“3'-的”是指在核酸单链内特定的化学基团、核苷酸、核苷酸的序列或遗传元件(例如,RNA聚合酶启动子序列)相对于另一个化学基团、核苷酸、核苷酸的序列或遗传元件的位置或方向。如果在一条链上第一核酸序列是第二序列3'-的,那么在互补链上该第一序列的互补序列将是第二序列的互补序列5'-的。本发明的描述将理解为根据特定的核酸链内序列或遗传元件的相对5'或3'位置和方向。称线性核酸分子具有“5'-末端”(5'端)和“3'-末端”(3'端),因为核酸的磷酸二酯键在取代的单核苷酸的糖部分的5'碳和3'碳处出现。新连接将与5'碳连接处的多核苷酸的末端是其5'末端核苷酸。新连接将与3'碳连接处的多核苷酸的末端是其 3'末端核苷酸。如本文所用的末端核苷酸是在3'末端或5'末端的端位置的核苷酸。核酸的戊糖可以是核糖,在这种情况下,核酸或多核苷酸被称为“RNA”,或者核酸的戊糖可以是2'-脱氧核糖,在这种情况下,核酸或多核苷酸被称为“DNA”。可选地,特别是如果核酸以化学方式合成,那么核酸可由DNA单核苷酸和RNA单核苷酸组成。在RNA和 DNA中,每种戊糖被共价地连接至四种常见的或“规范的”核酸碱基(每种也称为“碱基”) 之一。与糖连接的主要的天然存在的碱基中的三种(腺嘌呤、胞苷和鸟嘌呤)对于DNA和 RNA是共同的,而一种碱基是不同的;DNA具有额外的碱基胸腺嘧啶,而RNA具有额外的碱基尿苷。在一些情况下,尿苷可作为DNA中的碱基存在。本领域技术人员通常将小的多核苷酸看作“寡核苷酸”。将如本文所用的术语“寡核苷酸”定义为包含两个或更多个脱氧核糖核苷酸或核糖核苷酸、优选大约6到100个核苷酸的分子,但是对寡核苷酸的长度没有确定的限制。确切大小取决于许多因素,而这些因素又取决于寡核苷酸的最终功能或用途。同样,出于多种原因,本发明的核酸或多核苷酸可包括一种或多种修饰的核酸碱基、糖部分或核苷间连接。通过举例,使用包含修饰的碱基、糖部分或核苷间连接的核酸或多核苷酸的一些原因包括但不限 于(I)Tm的改变;(2)改变多核苷酸对一种或多种核酸酶的易感性;(3)提供用于连接标记的部分;(4)提供标记或标记猝灭剂;或(5)提供用于连接溶液中或结合于表面的另一种分子的部分,诸如生物素。例如,在一些实施方案中,可将寡核苷酸诸如引物合成为使得随机部分包含一种或多种构象受限制的核酸类似物,诸如但不限于其中的核糖环被连接2' -0原子与4' -C原子的亚甲基桥“锁定”的一种或多种核糖核酸类似物(例如,可从Exiqon,Inc.的“LNA ”商标下获得);这些修饰的核苷酸导致每个核苷酸单体的Tm或解链温度提高大约2摄氏度到大约8摄氏度。如果Tm提高,有可能降低末端加标签的寡核糖核苷酸的随机3'部分中的随机核苷酸数目。然而,必须确认修饰的核苷酸诸如LNA在为其预定目的的方法中发挥功能以及满足该方法的其他标准。例如, 在其中使用包含核糖核苷酸的寡核苷酸引物的一些实施方案中,在该方法中使用修饰的核苷酸的一个指标可以是包含该修饰的核苷酸的寡核苷酸可以被单链特异性RNA酶消化。为了完成本发明的目标,通过举例,在多核苷酸或寡核苷酸中的一个或多个位置的单核苷酸中的核酸碱基可包括鸟嘌呤、腺嘌呤、尿嘧啶、胸腺嘧啶或胞苷,或者可选地,所述核酸碱基中的一种或多种可包含修饰的碱基,诸如但不限于黄嘌呤、烯丙氨基 (allyamino)-尿嘧啶、烯丙氨基-胸腺嘧啶核苷、次黄嘌呤、2-氨基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、4-硫尿嘧啶、6-硫鸟嘌呤、氮尿嘧啶和脱氮尿嘧啶、胸腺嘧啶核苷、胞嘧啶、腺嘌呤或鸟嘌呤。更进一步,它们可包含用如下部分衍生的核酸碱基生物素部分、洋地黄毒苷部分、荧光部分或化学发光部分、猝灭部分或某种其他部分。本发明不限于列出的核酸碱基;给出这份名单示出可用于方法中的特定目的的范围广泛的碱基的实例。就本发明的核酸或多核苷酸来说,糖部分中的一个或多个可包括2'-脱氧核糖, 或者可选地,糖部分中的一个或多个可包括某种其他糖部分,诸如但不限于提供对一些核酸酶的抵抗力的核糖或2'-氟代-2'-脱氧核糖或2' -0-甲基-核糖,或可通过与可见的、荧光的、红外荧光的或其他可检测的染料或具有亲电子的、光反应性的、炔基或其他反应性化学部分的化学物质进行反应而标记的2'-氨基2'-脱氧核糖或2'-叠氮基-2'-脱氧核糖。本发明的核酸或多核苷酸的核苷间连接可以是磷酸二酯键连接,或者可选地,核苷间连接中的一种或多种可包括修饰的连接,诸如但不限于硫代磷酸酯、二硫代磷酸酯、 硒代磷酸酯(phosphoroselenate)、或二硒代磷酸酯(phosphorodiselenate)连接,它们对一些核酸酶具有抵抗力。
当提及显示“随机序列”的寡核苷酸或寡核苷酸的部分时,我们表示,对于该随机序列部分内的每个核苷酸位置而言,使用等量的所有四种规范的核苷酸碱基(A、G、C以及 T或U)合成该寡核苷酸或其部分。这种方法导致包含(4到η次方)+1种不同寡核苷酸的寡核苷酸混合物的合成,其中“η”等于随机序列部分内的核苷酸位置的数目。因此,在这些实施方案中,寡核苷酸包括代表随机序列部分的所有可能序列的许多不同寡核苷酸的混合物。当提及显示“半随机序列”的寡核苷酸或寡核苷酸的部分时,我们表示合成半随机寡核苷酸或部分(例如,使用寡核苷酸合成仪),其中使用等量的所有四种规范的核苷酸碱基 (A、G、C以及T或U)合成一些核苷酸位置(即那些位置如以上所述是“随机的”),但是只使用规范的碱基核苷酸(即A、C、G以及T或U)中的一种、两种或三种而不是所有四种来合成半随机部分内的一个或多个其他位置。在一些实施方案中,寡核苷酸包括具有“简并碱基” 的一个或多个核苷酸,用“简并碱基”我们表示能够与除根据A与T或U配对和G与C配对的标准碱基配对法则之外的一种或多种核酸碱基进行碱基配对的核酸碱基,并且“简并核苷酸”是包含简并碱基的核苷酸。本文可互换使用的多核苷酸或寡核苷酸(包括引物)的 “部分”或“区域”是2个碱基或更多个碱基的连续序列。在其他实施方案中,区域或部分为至少约1个、2个、3个、5个、10个、15个、20个、25个、50个、75个或甚至更多连续的核苷酸中的任何一种。“引物”是可以被核酸聚合酶延伸的一般具有游离的3' -OH基团的寡核苷酸 (“oligo”)。对于依赖模板的聚合酶而言,一般至少引物寡核苷酸的3'部分与模板核酸的部分互补,该寡核苷酸通过氢键合和其他分子力与模板“结合”(或“复合”、“退火”或“杂交”)以给出引物/模板复合物用于启动DNA聚合酶进行的合成,并且通过添加与DNA合成过程中的模板互补的在3'端连接的共价键合的碱基延伸引物(即,“引物延伸的”)。结果是引物延伸产物。依赖模板的DNA聚合酶(包括反转录酶)一般需要寡核苷酸引物与单链模板的复合以启动DNA合成(“引发”),但对于与DNA模板互补的RNA的合成(转录),RNA 聚合酶一般不需要引物。
“单链特异性DNA酶”表示特异性消化单链DNA但不消化单链RNA或与互补的RNA 或DNA退火或复合的RNA或DNA的DNA酶,不论所述互补的RNA或DNA是另外的核酸分子的一部分(例如,通过分子间碱基配对)还是相同核酸分子的一部分(例如,通过分子内碱基配对)。单链特异性DNA酶可以是内切核酸酶或外切核酸酶,只要它具有将单链DNA特异性消化为单体或短的寡脱氧核糖核苷酸的活性。在一些优选的实施方案中,将包括引物在内的寡脱氧核糖核苷酸在利用它们的方法的步骤之后通过用单链特异性DNA酶消化而从反应混合物中移除。外切核酸酶I、外切核酸酶VII和Rec J外切核酸酶是示例性单链特异性DNA酶。 本文的“T7型RNA聚合酶”(RNAP)表示T7 RNA聚合酶(例如,参见由Goeddel, DV, Academic Press,1990 编辑的 Methods in Enzymology (酶学方法),第 185 卷中的 Studier, FW等人,第60-89页)或从“T7型”噬菌体获得的RNAP,T7型噬菌体表示具有与噬菌体T7的遗传结构相似的遗传结构的噬菌体。已发现所有检验的T7型噬菌体的遗传结构基本上与T7的遗传结构相同。根据本发明的T7型噬菌体的实例包括但不限于大肠杆菌噬菌体 T3、phi I、phi II、W31、H、Y、Al、122、cro、C21、C22 和 C23 ;恶臭假单胞菌 (Pseudomonas putida)gh-1 ; ^^^Π Κ · (Salmonella typhimurium)SP6;粘质沙雷氏菌(Serratia marcescens)噬菌体IV ;柠檬酸杆菌属(Citrobacter)噬菌体 ViIII ;以及 Klebsiella 噬菌体 11 号(Hausmann, Current Topics in Microbiology and Immunology75 :77_109,1976 ;Korsten 等人,J. Gen.Virol. 43:57_73,1975 ;Dunn,等人,Nature New Biology 230 :94_96,1971 ;Towle,等人,J. Biol. Chem. 250 :1723_1733, 1975 ;Butler 和 Chamberlin,J. Biol. Chem. 257 :5772_5778,1982),以及这种 RNAP 的突变体形式(例如,Sousa等人,美国专利第5, 849, 546号;Padilla, R和Sousa, R, Nucleic Acids Res. ,15 :el38,2002 ;Sousa, R ^P Mukher jee, S,Prog Nucleic Acid Res Mol Biol, 73 1-41,2003 ;Guillerez,J,等人,美国专利申请第20040091854号)。在本发明优选的实施方案中,所用的启动子是被T7型RNA聚合酶识别的野生型或突变的启动子序列。在一些实施方案中,启动子可以是单链的,诸如假启动子(例如,Ohmichi等人,Proc. Natl. Acad. Sci.USA 99 :54-59,2002)或N4 vRNAP启动子,在这种情况下,利用包含N4 vRNAP (称为 “小 vRNAP”,EPICENTRE Biotechnologies, Madison, WI, USA)的转录活性的 1,106_ 氨基酸结构域(对应于氨基酸998-2103)的截短的蛋白(Kazmierczak, K. Μ.,等人,EMBO J. ,21 5815-5823,2002)。如本文所用,“靶DNA”是指经历转座以例如产生加标签的DNA片段(例如,5'或 3'加标签的或加双标签的线性ssDNA或dsDNA片段或加标签的环状ssDNA片段)的文库的任何感兴趣的dsDNA。 “靶DNA”可以从任何体内或体外来源获得,包括来自不论活的还是死的一种或多种细胞、组织、器官或生物,或来自任何生物来源或环境来源(例如,水、空气、土壤)。例如, 在一些实施方案中,靶DNA包括真核dsDNA和/或原核dsDNA或由其构成,所述真核dsDNA 和/或原核dsDNA产生于或源自于人、动物、植物、真菌(例如,霉菌或酵母)、细菌、病毒、 类病毒、支原体或其他微生物。在一些实施方案中,靶DNA包括如下物质或由其构成基因组DNA,亚基因组DNA,染色体DNA (例如,来自分离的染色体或染色体的部分,如来自染色体的一个或多个基因或基因座),线粒体DNA,叶绿体DNA,质粒或其他附加体来源的DNA(或其中包含的重组DNA),或通过RNA的反转录制备的双链cDNA,所述RNA的反转录使用依赖 RNA的DNA聚合酶或反转录酶产生第一链cDNA,然后延伸与该第一链cDNA退火的引物产生 dsDNA。在一些实施方案中,靶DNA包括核酸分子中或由核酸分子制备的多个dsDNA分子 (例如,在基因组DNA中由其制备的多个dsDNA分子或由RNA制备的cDNA),所述核酸分子处于或来自生物来源(例如,细胞、组织、器官、生物)或环境来源(例如,水、空气、土壤、唾液、痰、尿、粪便)。在一些实施方案中,靶DNA来自体外来源。例如,在一些实施方案中,靶 DNA包括在体外从单链DNA (ssDNA)或从单链或双链RNA中制备的dsDNA (例如,使用本领域公知的方法,诸如使用适合的依赖DNA和/或依赖RNA的DNA聚合酶(反转录酶)的引物延伸)或由其构成。在一些实施方案中,靶DNA包括使用任何本领域已知的方法从一种或多种双链或单链的DNA或RNA分子的全部或部分制备的dsDNA或由其构成,所述本领域已知的方法包括如下方法DNA或RNA扩增(例如,PCR或反转录-PCR (RT-PCR)),转录介导的扩增方法,扩增一种或多种核酸分子的全部或部分);在质粒、F黏粒、BAC或其他载体中的一种或多种核酸分子的全部或部分的分子克隆,所述质粒、F黏粒、BAC或其他载体随后在适合的宿主细胞中复制;或通过杂交捕获一种或多种核酸分子,诸如通过与阵列或微阵列上的DNA探针杂交(例如,通过“序列捕获”;例如,使用来自ROCHE NIMBLEGEN,AGILENT或FEBIT的试剂盒和/或阵列)。 在一些实施方案中,“靶DNA”表示在用于产生加标签的DNA片段(例如,5'和3' 加标签的或加双标签的线性ssDNA或dsDNA片段或加标签的环状ssDNA片段)的文库之前制备或修饰的dsDNA。例如,本发明的发明人观察到来自包括具有小于IOKb大小的dsDNA 分子的靶DNA的末端的下一代序列数据的代表性比来自该靶DNA的中间的序列数据的代表性低。不希望受理论束缚,对于这种观察结果的一种可能的解释是找到具有以相反方向插入线性dsDNA分子的末端的两种转座子末端组合物的DNA片段的可能性比找到具有以相反方向插入该线性dsDNA分子的中间的两种转座子末端组合物的DNA片段的可能性低。因此, 在一些实施方案中,为了产生更好地代表末端序列的加双标签的DNA片段或加标签的环状 DNA片段的文库,所述方法还包括提供在该方法中使用的包括以下dsDNA的靶DNA (例如, 双链基因组DNA或从RNA诸如mRNA制备的cDNA),所述dsDNA在5 ‘端和/或3 ‘端已具有标签。例如,在一些实施方案中,靶DNA包括通过如下方式从RNA制备的双链cDNA 通过延伸具有3'部分和5'部分的第一链cDNA合成引物合成第一链cDNA,其中该3'部分与 RNA的3'末端部分互补并且该5'部分包括第一标签,然后使用本文别处描述的末端加标签的寡核苷酸和DNA聚合酶将第二标签与该第一链cDNA的3'末端接合,然后使用DNA聚合酶通过延伸与该第二标签退火的第二链cDNA合成引物来合成双链cDNA。可选地,在一些其他优选的实施方案中,为了产生更好地代表末端序列的加双标签的DNA片段的文库,在用于产生加双标签的DNA片段或加标签的环状DNA片段的方法中使用的靶DNA包括通过线性dsDNA的分子内连接制备的环状dsDNA (例如,其通过双链基因组DNA或从RNA诸如mRNA 制备的双链cDNA的分子内连接制备)。因此,在一些实施方案中,所述方法还包括使用连接酶(例如,T4DNA连接酶)连接线性dsDNA以产生用作该方法中的靶DNA的环状dsDNA。 在包括通过连接线性dsDNA产生用作靶DNA的环状dsDNA的方法的一些实施方案中,在连接步骤之前用T4DNA聚合酶和T4多核苷酸激酶(例如,使用END-It DNA末端修复试剂盒 (EPICENTRE Biotechnologies,Madison,WI,USA))处理线性 dsDNA 以便使末端变平并且使 5'端磷酸化。如本文所用,“DNA片段”表示从较长DNA分子上切割或释放或断裂以致不再与母体分子相连的靶DNA的部分或碎片或区段。DNA片段可以是双链的(“dsDNA片段”)或单链的(“ssDNA片段”),并且从靶DNA产生DNA片段的过程称为“断裂”靴DNA。在一些优选的实施方案中,所述方法用于产生包含加标签的DNA片段的集合或群体的“DNA片段文库”。“模板”是被核酸聚合酶诸如DNA聚合酶拷贝的核酸分子。不论该核酸分子包含两条链(即,为“双链的”)还是只包含一条链(即,为“单链的”),用作指定由合成的核酸所显示的核苷酸序列的所述核酸分子的链是“模板”或“模板链”。由该核酸聚合酶合成的核酸与该模板互补。RNA和DNA总是以5'到3'方向合成,开始于模板链的3'端,并且核酸双链体的两条链总是对齐使得这两条链的5'端处于该双链体的相对端(并且,必然地, 3'端也是如此)。RNA和DNA模板需要引物来启动DNA聚合酶的合成,但是启动依赖DNA 的RNA聚合酶的合成不需要引物,所述依赖DNA的RNA聚合酶通常被简称为“RNA聚合酶”。“末端转移酶”也称为“末端脱氧核糖核苷转移酶”或“TdT”,是催化脱氧核糖核苷三磷酸(dNTP)或单个双脱氧核糖核苷三磷酸不依赖模板地添加(或“加尾”)至DNA的 3'-羟基末端的DNA聚合酶。在本领域中使用的可商购获得的常见末端转移酶在表达来自小牛胸腺的重组基因的大肠杆菌菌株中产生。在一些实施方案中,本发明还包括将5' 加标签的DNA片段在变性后与TdT和dNTP在一定条件下孵育并且持续足够的时间,其中合成具有第二标签的5'和3'加标签的DNA片段,所述第二标签包括同聚DNA尾。在一些实施方案中,同聚DNA尾还被用作合成双链cDNA的引发位点。在一些实施方案中,用于合成 DNA的第二链的引物具有与包括同聚尾的第二标签互补的3'部分,和显示不与第一标签、 靶DNA或包含同聚尾的第二标签互补的任意期望序列的5'部分。例如,在一些实施方案中,引物的5'部分显示RNA聚合酶启动子的反义启动子序列并且所述方法还包括将得到的双链cDNA与RNA聚合酶在合成RNA的条件下孵育足够时间。在一些实施方案中,在本发明的方法中使用的转座子末端寡核苷酸只显示转座反应中所需的转座子末端序列。然而,在一些实施方案中,转座子末端寡核苷酸中的至少一种另外显示转座子末端序列5'-的一种或多种其他的核苷酸序列。因此,在一些实施方案中,所述方法或试剂盒使用具有3'部分和5'部分的转移链,其中该3'部分显示转移的转座子末端序列,而该5'部分显示不参与形成与转座酶的功能复合物的一种或多种另外的序列。对哪些另外的序列用于转移链的5'部分中的一种或多种另外的序列没有限制,这些序列可用来完成任何期望的目的。例如,在一些实施方案中,转移链的5'部分显示一种或多种另外的标签序列(例如,允许通过与表面诸如珠子上的特异性序列或微芯片或阵列上的探针退火而捕获的标签序列;例如,用于在下一代测序的珠子上的捕获;例如用于在使用Roche 454 Next-Gen测序仪测序的珠子上的捕获的454A或454B标签序列)或一种或多种用于本方法的产物的鉴定、检测(例如,荧光检测)或分选的序列。在一些其他实施方案中,转移链的5'部分显示一种或多种另外的核苷酸或序列或化学基团或化学部分,所述核苷酸或序列或化学基团或化学部分包括亲和性结合(例如,允许通过与表面诸如珠子上的特异性序列或微芯片或阵列上的探针退火而捕获的标签序列)或由其构成。在一些优选的实施方案中,将转移链的5'部分中的一种或多种另外的序列的大小最小化以便使该转移链在体外转座酶反应过程中插入到自身的可能性或频率降到最低。例如,在一些实施方案中,转移链的5'部分的大小小于大约150个核苷酸、小于大约100个核苷酸、小于大约 75个核苷酸、小于大约50个核苷酸、小于大约25个核苷酸或小于大约15个核苷酸。在一些实施方案中,转移链的5'端具有5'-单磷酸基团。在一些实施方案中,转移链和非转移链都具有5'-单磷酸基团。在一些优选的实施方案中,只有非转移链的5' 端具有5'-单磷酸基团。在一些其他的实施方案中,在转移链的5'端上没有5'-单磷酸基团。根据本发明的术语“转座酶”旨在表示能够与转座反应中需要的转座子末端或转座子末端序列形成功能复合物的酶。本发明的转座酶还包括来自反转录转座子和反转录病毒的整合酶。“转座反应”是其中一个或多个转座子末端在随机位点或几乎随机的位点插入靶DNA中的反应。在转座反应中的必需组分是转座酶和显示转座子末端的核苷酸序列的 DNA寡核苷酸,所述转座子末端的核苷酸序列包括转移的转座子末端序列及其互补序列、 非转移的转座子末端序列以及形成功能性转座复合物所需的其他组分。本发明的方法通过利用由高活性Tn5转座酶和Τη5型转座子末端(Goryshin,I.和Reznikoff,W. S., J.Biol. Chem.,273 =7367,1998)或由MuA转座酶和包含Rl和R2末端序列的Mu转座子末端(Mizuuchi, K.,Cell, 35 :785,1983 ;Savilahti, H,等人,EMBO J. , 14 :4893,1995)形成的转座复合物来举例说明。然而,在本发明中可使用任何能够以随机或几乎随机的方式并以足够的效率为其预定目的将靶DNA 5'加标签和断裂而插入转座子末端的转座系统。 可用于本发明的方法评估的本领域已知的转座系统的实例包括但不限于金黄色葡萄球菌(Staphylococcus aureus) Tn552 (Colegio OR 等人,J Bacterid.,183 :2384_8,2001 ; Kirby C 等人,Mol Microbiol, 43 173-86, 2002), Tyl(Devine SE, ^P Boeke JD.,Nucleic Acids Res. ,22 :3765_72,1994和国际专利申请第 WO 95/23875 号),转座子Tn7 (Craig,NL, Science. 271 1512,1996 ;Craig, NL,综述于Curr Top Microbiol Immunol, 204 27-48, 1996),TnlO 和 ISlO (Kleckner N,等人,Curr Top Microbiol Immunol,204 :49_82,1996), Mariner 转座酶(Lampe DJ,等人,EMBO J.,15 :5470_9,1996),Tcl (Plasterk RH, Curr Top Microbiol Immunol, 204 125—43,1996),P 元件(Gloor, GB, Methods Mol Biol, 260 97-114,2004),Tn3(Ichikawa H,和 Ohtsubo Ε.,J Biol Chem. 265 18829-32,1990),细菌插入序列(Ohtsubo,F 和 Sekine,Y, Curr. Top. Microbiol. Immunol. 204 1-26,1996),反转录病毒(Brown P0,等人,Proc Natl Acad Sci USA,86 :2525_9,1989),和酵母的反转录转座子(Boeke JD 和 Corces VG, Annu Rev Microbiol. 43 403-34,1989)。

用于将转座子末端插入靶序列中的方法可使用任何适合的转座子系统在体外进行,所述适合的转座子系统是可利用的适合的体外转座系统或者可基于本领域的知识开发。一般来说,本发明的方法中使用的适合的体外转座系统在最低限度需要足够纯度、足够浓度和足够的体外转座活性的转座酶以及与该转座酶形成功能性复合物的转座子末端,所述功能性复合物具有能够催化转座反应的相应转座酶。可用在本发明中的适合的转座酶转座子末端序列包括但不限于与转座酶形成复合物的野生型、衍生的或突变的转座子末端序列,所述转座酶选自转座酶的野生型形式、衍生形式或突变形式。已被申请人在本发明的方法中成功使用的示例性转座酶包括Tn5转座酶和MuA转座酶的野生型形式或突变形式(尽管在本发明的方法中产生5'加标签的DNA片段时ΕΖ-Τη5转座酶比相等蛋白量的MuA转座酶显著更有效率),但已知或后来开发用于确定的转座子末端的有效体外转座的组合物和条件的任何其他转座酶可用在本发明的方法中。由Τη5转座酶或MuA转座酶的野生型形式或突变形式识别的转座子末端序列是优选的,并且当与转座酶复合时产生最高转座效率的那些转座子末端序列连同与其复合的相应活性最佳的转座酶一起对于本发明的实施方案而言是最优选的。优选地,选择如下转座子其中用于转座的转座酶所需的转座酶末端序列不太大,并且转座子末端序列具有可能的最小尺寸,该最小尺寸对于预定目的很好地发挥功能并且是使得同一序列只很少出现或优选根本不出现在靶DNA或样品DNA中的足够尺寸。通过举例,Τη5来源的ΕΖ-Τη5 转座子末端序列的转座子末端序列只包含19个核苷酸, 而一些其他的转座酶需要大得多的末端序列用于转座(例如,MuA转座酶需要约51个核苷酸的转座子末端序列)。可用于将转座子末端插入靶核酸中的适合的体外转座系统包括但不限于使用可从EPICENTRE Technologies, Madison, WI获得的EZ_Tn5 高活性Τη5转座酶或来自 EPICENTRE 的 HyperMu 高活性 MuA 转座酶或诸如可从 Finnzymes 0y, Espoo, Finland 获得的另外的MuA转座酶。显示相应的转座子末端的序列的转座子末端寡核苷酸可利用寡核苷酸合成仪合成或者基于从相应卖家获得的信息或利用本领域公知的信息从商业来源购买。例如,在实施例1中提供了 EZ-Tn5 转座酶的高活性转座子嵌合末端的核苷酸序列,并且有关EZ-Tn5 转座酶的另外信息在公布的文献中可用并且在来自EPICENTRE Biotechnologies, Madison, WI, USA 的 www. EpiBio. com 在线可用。在一些实施方案中,根据本发明将转座子末端插入到靶DNA中也可以在体内进行。如果转座在体内进行,那么转座到靶DNA中优选通过将转座酶和适合的转座子末端组合物的联合复合物电穿孔进入宿主细胞中来实现,如在美国专利第6,159,736号(通过引用并入本文)中所述。这种转座方法通过利用如下复合物举例说明使用与(Goryshin, I.和Reznikoff,W. S. J. Biol. Chem.,273 =7367,1998)所述的方法类似的方法由高活性 Tn5转座酶和适合的Τη5型转座子末端组合物所形成的转座复合物或由HyperMu 高活性 MuA转座酶(EPICENTRE,Madison, WI)和显示由该转座酶识别的Rl和R2末端序列的适合的MuA转座子末端组合物所形成的转座复合物。转座子末端组合物和转座酶之间的适合的联合复合物或Transposome 复合物(EPICENTRE)可按照美国专利第6,159,736号以及 Goryshin和Reznikoff的相关专利所述,或按照Tn5型EZ_Tn5 Transposome 复合物或来自 EPICENTRE Technologies, Madison, WI 的 HyperMu MuA Transposome 复合物的产品资料所述来制备,除外的是使用只显示一种转座子末端的寡核苷酸而不是通常在相应多核苷酸或寡核苷酸的每个末端处或附近具有两种转座子末端的多核苷酸或寡核苷酸。本发明还包括用于本发明的任何一种方法的试剂盒和单独组合物。试剂盒是可用于执行本发明的方法的单独组合物的组合,其中将这些组合物优化以在该方法中一起使用。组合物包括用于本发明的方法的至少一个步骤的单独的组分或组分的掺合物。本发明包括可由本发明的任两种组合物的组合组装的任何试剂盒以及在本发明的试剂盒或方法中使用的任何新颖组合物。可选地,试剂盒可以由处于便利使用形式例如按单次使用部分预先等分的形式的单一组分或组合物组装,并且可任选地包括一套使用该组分或组合物的说明书。发明描述引言本发明涉及用于处理核酸的方法和组合物和试剂盒,并且尤其是使用转座子组合物将DNA断裂和加标签的方法和组合物。本发明的方法、组合物和试剂盒可用于从包含任何感兴趣的dsDNA (包括从RNA制备的双链cDNA)的来自任何来源的靶DNA中产生加双标签的线性ssDNA片段或加标签的环状ssDNA片段(及其扩增产物)的文库,以用于基因组分析、亚基因组分析、转录组分析或宏基因组分析或RNA表达的分析(例如,用于制备标记的靶以用于微阵列分析;例如,用于拷贝数变异的分析,用于单核苷酸多态性的检测和分析, 以及用于从环境样品诸如土壤来源或水来源寻找基因)。这些方法可用于多种过程,包括但不限于用于以下的过程扩增一种或多种生物的全基因组(例如,全基因组扩增或WGA), 所述生物包括培养条件或生长条件未知的一种或多种微生物或环境生物;实时PCR ;乳液 PCR;比较基因组杂交(CGH);比较基因组测序(CGS);以及用于制备供应用如荧光原位杂交 (FISH)用的DNA特异性探针(例如,染色体特异性探针,例如染色体涂料,或例如基因特异性探针或基因座特异性探针)。在一些实施方案中,在一些实施方案中,这些方法还可用于产生大规模平行的DNA测序(所谓的“下一代测序”)的模板。这些过程或应用中的每一种可用于研究目的和分子诊断目的。
本发明提供了用于从包含在任何感兴趣的样品中的包括双链DNA(dsDNA)的靶 DNA中产生加标签的DNA片段的文库的方法、组合物和试剂盒。这些方法更容易、快捷,需要更少的动手时间,可用更小的样品和更小量的样品核酸进行,在对片段两个末端的加标签中更有效率,并且产生的加双标签的DNA片段在性质上和/或数量上代表从中产生它们的样品核酸。这些方法可容易地用手执行而无需仪器,而且容易适应高通量环境中的机器自动化。方法实施方案本文公开的本发明的方法的所有实施方案使用体外转座反应同时将靶DNA碎成片段并将标签接合至每个片段的5'端。因为所有的方法是相关的,所以除非另外具体说明是关于特定的实施方案,否则本文出现的关于一个实施方案的方法也可以用于本文所述的另一个实施方案。利用体外转座反应的本文公开的方法的所有实施方案可通过装配如下反应来执行所述反应利用单独的转座酶组合物和转座子末端组合物或单一转座体组合物,所述单一转座体组合物包括在转座酶和转座子末端组合物之间形成的稳定复合物。因此,将理解描述使用转座酶和转座子末端组合物的任何方法也可以使用由转座酶和转座子末端组合物组成的转座体组合物,并且描述使用转座体组合物的任何方法也可以使用构成转座体组合物的单独的转座酶和转座子末端组合物。这通过下面本发明的一种一般方法的两种描述来说明。本发明的一个实施方案是用于从包括任何感兴趣的dsDNA的靶DNA产生加标签的 DNA片段的文库的方法(例如,用作下一代测序模板或扩增模板),该方法包括在体外转座反应中将靶DNA与至少一种转座酶以及与该转座酶形成转座复合物的转座子末端组合物孵育,该转座子末端组合物包含(i)显示转移的转座子末端序列和任选的转移的转座子末端序列5'的另外的序列的转移链,以及(ii)显示与转移的转座子末端序列互补的序列的非转移链,所述孵育在一定条件下进行并且持续足够的时间,其中发生多次插入靶DNA中, 每次插入导致包括转移链或由转移链构成的第一标签与靶DNA中的核苷酸的5'端接合, 从而断裂靶DNA并产生退火的5'加标签的DNA片段的群体,每个退火的5'加标签的DNA 片段在5'端具有第一标签;然后将5'加标签的DNA片段的3'端与该第一标签或与第二标签接合,从而产生加标签的DNA片段(例如,包括加标签的环状ssDNA片段或5'和3' 加标签的DNA片段(或“加双标签的DNA片段”))的文库。在一个优选的实施方案中,如最近的上文描述的,使用单独的转座酶和转座子末端组合物执行该方法,而在一些其他优选的实施方案中,使用包含在转座酶和转座子末端组合物之间形成的复合物的转座体组合物执行该方法。因此,本发明的一个优选的实施方案是用于从包括任何感兴趣的dsDNA的体外转座反应中的靶DNA产生加标签的DNA片段的文库的方法(例如,用作下一代测序模板或扩增模板),该方法包括将靶DNA与一种或多种转座体组合物孵育,所述一种或多种转座体组合物各自包含在转座酶以及与该转座酶形成转座复合物的转座子末端组合物之间的复合物,该转座子末端组合物包含(i)显示转移的转座子末端序列和任选的转移的转座子末端序列5'的另外的序列的转移链,以及(ii)显示与转移的转座子末端序列互补的序列的非转移链,所述孵育在一定条件下进行并且持续足够的时间,其中发生多次插入靶DNA中, 每次插入导致包括转移链或由转移链构成的第一标签与靶DNA中的核苷酸的5'端接合,从而断裂靶DNA并产生退火的5'加标签的DNA片段的群体,每个退火的5'加标签的DNA 片段在5'端具有第一标签;然后将5'加标签的DNA片段的3'端与该第一标签或与第二标签接合,从而产生加标签的DNA片段(例如,包括加标签的环状ssDNA片段或5'和3' 加标签的DNA片段(或“加双标签的DNA片段”))的文库。
在本发明的任何方法的一些实施方案中,在体外转座反应中使用的转座酶和转座子末端组合物的量或转座体组合物的量在每50微升反应每50纳克靶DNA大约1皮摩尔和大约25皮摩尔之间。在本发明的任何方法的一些优选的实施方案中,在体外转座反应中使用的转座酶和转座子末端组合物的量或转座体组合物的量在每50微升反应每50纳克靶DNA大约5皮摩尔和大约50皮摩尔之间。在其中转座酶是高活性Tn5转座酶并且转座子末端组合物包括MEDS转座子末端组合物、或者其中转座体组合物包括高活性Τη5转座酶和包括MEDS转座子末端的转座子末端组合物的本发明的任何方法的一些优选的实施方案中,在体外转座反应中使用的所述转座酶和转座子末端组合物或所述转座体组合物的量在每50微升反应每50纳克靶DNA大约5皮摩尔和大约25皮摩尔之间。在其中转座酶是高活性Τη5转座酶或MuA转座酶的本发明的任何方法的一些优选的实施方案中,在体外转座反应中使用的转座酶和转座子末端组合物的终浓度或转座体组合物的终浓度为至少250ηΜ ; 在一些其他的实施方案中,高活性Τη5转座酶或MuA转座酶及其相应的转座子末端组合物或转座体组合物的终浓度为至少500ηΜ。在本发明的任何方法的一些实施方案中,体外转座反应的反应时间是两小时或更少,一小时或更少,30分钟或更少,或15分钟或更少。在本发明的任何方法的一些优选的实施方案中,体外转座反应的反应时间是5分钟或更少。在其中转座酶组合物包括高活性Τη5 转座酶和包括MEDS转座子末端的转座子末端组合物的本发明的任何方法的一些优选的实施方案中,体外转座反应的反应时间是5分钟或更少。在一些实施方案中,所述方法还包括使用热稳定的DNA聚合酶和与第一标签或第二标签互补的至少一种引物非选择性扩增包括加双标签的DNA片段或加标签的环状ssDNA 片段的加标签的DNA片段的步骤。在只有一种转座酶用于体外转座反应的方法的一些优选的实施方案中,扩增加标签的DNA片段的步骤包括使用显示转移链的至少一部分的序列的单一引物扩增加双标签的DNA片段或加标签的环状ssDNA片段。在一些实施方案中,使用单一引物扩增加标签的DNA片段的步骤包括PCR或滚环复制反应。在一些实施方案中,用于扩增的引物的5'部分包括测序标签域或由测序标签域构成。在本发明的任何方法的一些优选的实施方案中,DNA片段的文库用于提供DNA测序或核酸扩增的模板。本发明包括用于产生包括加双标签的DNA片段或加标签的环状ssDNA片段的加标签的DNA片段的文库的几种实施方案,如以下所讨论。使用具有链置换活性或5'核酸酶活性的DNA聚合酶产生包括加双标签的DNA片段的加标签的DNA片段所述方法的一个优选实施方案包括将体外转座反应中的靶DNA与至少一种转座体在一定条件下孵育足够的时间来产生退火的5'加标签的DNA片段的群体;然后将退火的5'加标签的DNA片段的群体与具有链置换活性或5'核酸酶活性的DNA聚合酶在没有热循环并且其中退火的5'加标签的DNA片段不被变性的条件下孵育,其中DNA聚合酶使用互补链作为模板延伸退火的5'加标签的DNA片段的每条链的3'端并且置换或消化非转移链,从而产生包括加双标签的dsDNA片段的加标签的DNA片段的文库。所述方法的一个优选的实施方案包括将体外转座反应中的靶DNA与至少一种转座体孵育以产生退火的5'加标签的DNA片段的群体;将退火的5'加标签的DNA片段的群体与具有链置换活性或5'核酸酶活性的DNA聚合酶孵育以产生加双标签的dsDNA片段; 并且使该加双标签的dsDNA片段变性以产生包括加双标签的ssDNA片段的加标签的DNA片段的文库(例如,通过加热到95°C并快速冷却)。在所述方法的这个实施方案的一个优选的形式中,包括加双标签的ssDNA片段的加标签的DNA片段的文库从单个管中的靶DNA中产生而没有进行任何介入纯化步骤。在包括使用具有链置换活性或5'核酸酶活性的DNA聚合酶产生包括加双标签的 DNA片段的加标签的DNA片段的文库的方法的一些实施方案中,该方法还包括使用热稳定的DNA聚合酶和与第二标签互补的至少一种引物扩增包括加双标签的DNA片段的加标签的 DNA片段的步骤。在该方法的一些优选的实施方案中,扩增包括加双标签的DNA片段的加标签的DNA片段的文库的步骤包括只使用显示转移链的至少一部分的序列的一种寡脱氧核糖核苷酸作为PCR引物以及加双标签的DNA片段作为模板通过PCR扩增加标签的DNA片段的文库。因此,该实施方案是对从靶DNA产生的包括加双标签的DNA片段的加标签的DNA 片段的文库进行单引物PCR扩增的方法。如果靶DNA包括生物的总基因组DNA,这个实施方案是非选择性全基因扩增的方法。在其中在如下方法的体外转座反应中使用单一转座子末端组合物的一些优选的实施方案中所述方法包括使用具有链置换活性或5'核酸酶活性的DNA聚合酶产生包括加双标签的DNA片段的加标签的DNA片段的文库并且还通过PCR扩增产生的加双标签的 DNA片段,使用两种不同的PCR引物,这些PCR引物的每一种显示组成转座子末端组合物的转移的转座子末端的至少一部分的序列。在一些优选的实施方案中,每种PCR引物包括3 ‘ 部分和5'部分,其中该3'部分显示相应的转移的转座子末端序列并且该5'部分显示用于特定目的的相应标签域的序列(例如,用于下一代测序或扩增的测序标签域或扩增标签域,以及任选的地址标签域)。在如下任何方法的一些优选的实施方案中,体外转座反应中的至少一种转座体包括两种不同的转座体或由两种不同的转座体构成所述方法包括使用具有链置换活性或 5'核酸酶活性的DNA聚合酶产生包括加双标签的DNA片段的加标签的DNA片段的文库。在其中使用两种不同的转座体的一些优选的实施方案中,这两种转座体中的每一种包括相同的转座酶但包括不同的转座子末端组合物。在其中使用两种不同的转座体的一些优选的实施方案中,这两种不同的转座体各自包括相同的转座酶并且转座子末端组合物包含不同的转移链。在其中使用两种不同转座体的一些优选的实施方案中,这两种转座体中的每一种包括不同的转座酶和不同的转座子末端组合物,这些转座子末端组合物中的每一种与相应的转座酶一起形成功能复合物。在如下方法的一些优选的实施方案中所述方法在体外转座反应中使用两种不同的转座子末端组合物并且使用具有链置换活性或5'核酸酶活性的 DNA聚合酶产生包括加双标签的ssDNA片段的加标签的DNA片段的文库,第一标签显示一种转座子末端组合物的转移链的序列,并且第二标签显示另一种转座子末端组合物的非转移链的序列。
在如下方法的一些优选的实施方案中所述方法包括使用具有链置换活性或5' 核酸酶活性的DNA聚合酶产生包括加双标签的DNA片段的加标签的DNA片段的文库,其中在体外转座反应中使用两种不同的转座子末端组合物,并且该方法还包括通过PCR扩增产生的加双标签的DNA片段的步骤,使用两种不同的PCR引物,这些PCR引物中的一种显示组成一种转座子末端组合物的转移链的至少一部分的序列并且这些PCR引物中的另一种显示组成另一种转座子末端组合物的转移链的至少一部分的序列。在以下的一些优选的实施方案中其中组成每种相应的转座子末端组合物的转移链包括3'部分和5'部分,其中该 3'部分显示相应的转移的转座子末端序列,并且每种相应的转移链的5'部分显示用于特定目的的包括标签域的不同序列(例如,用于下一代测序或扩增的测序标签域或扩增标签域以及任选的地址标签域),每种PCR引物显示相应的转移的转座子寡核苷酸的标签域的序列。#用末端转产牛句,括力D双标签的DNA片段的力Dt示签的DNA片段所述方法的另一种实施方案包括将体外转座反应中的靶DNA与至少一种转座体孵育以产生5'加标签的dsDNA片段;使该5'加标签的dsDNA片段变性以产生5'加标签的ssDNA片段;并且将该5'加标签的ssDNA片段与由末端转移酶构成的DNA聚合酶和该末端转移酶的至少一种dNTP底物在一定条件下孵育并且持续足够的时间,其中该末端转移酶接合由聚(dNMP)构成的第二标签与该5'加标签的DNA片段的3'端,从而产生包括加双标签的DNA片段的加标签的DNA片段的文库(例如,图3)。在该方法的一些实施方案中,组成转座体的转座子末端组合物的非转移的转座子末端寡核苷酸的3'端被封闭(例如,通过使用具有双脱氧核苷酸或3' -0-甲基-核苷酸作为3'末端核苷酸的非转移的转座子末端寡核苷酸),该封闭的3'核苷酸阻止由末端转移酶添加聚(dNMP),由此阻止该非转移的转座子末端寡核苷酸的背景加标签。所述方法的又另一种实施方案包括将体外转座反应中的靶DNA与至少一种转座体孵育以产生5'加标签的DNA片段;不经预先的变性步骤,将该5'加标签的DNA片段与由末端转移酶构成的DNA聚合酶和该末端转移酶的至少一种dNTP底物在一定条件下孵育并且持续足够时间,其中该末端转移酶接合由聚(dNMP)构成的第二标签与该5'加标签的 DNA片段的3'端,从而产生包括加双标签的DNA片段的加标签的DNA片段的文库。在该方法的一些实施方案中,组成转座体的转座子末端组合物的非转移的转座子末端寡核苷酸的 3'端被封闭(例如,通过使用具有双脱氧核苷酸或3' -0-甲基-核苷酸作为3'末端核苷酸的非转移的转座子末端寡核苷酸)。DNAjg^SI禾Π末端力时示签寡核苷Il产4^. 力D双标签的DNA片段的力时示签白勺 DNA片段所述方法的又另一个实施方案包括将体外转座反应中的靶DNA与至少一种转座体孵育以产生5'加标签的dsDNA片段;使该5'加标签的dsDNA片段变性以产生5'加标签的ssDNA片段(例如通过加热到95°C并快速冷却);并使用DNA聚合酶和末端加标签寡核苷酸将第二标签与该5'加标签的ssDNA片段接合(例如,图4),从而产生包括加双标签的DNA片段的加标签的DNA片段的文库。在一些优选的实施方案中,使用DNA聚合酶和末端加标签寡核苷酸接合第二标签与5'加标签的DNA片段的3'端的步骤包括(1)提供包括5'部分和3'部分或由其构成的末端加标签寡核苷酸,其中该5'部分显示与期望与5'加标签的ssDNA片段的3'末端接合的第二加标签的序列互补的序列,并且该3'部分显示随机序列,该随机序列包括三到八个(例如,3、4、5、6、7或8个) 随机核苷酸或由其构成,在这些随机寡核苷酸中,3'末端寡核苷酸被封闭以使得它不能被 DNA聚合酶延伸;(2)使该5'加标签的ssDNA片段与该末端加标签寡核苷酸在一定条件下接触并且持续足够的时间,其中该末端加标签寡核苷酸与该5'加标签的ssDNA片段退火;并且(3)使与该末端加标签寡核苷酸退火的5'加标签的ssDNA片段与反应混合物中的DNA聚合酶接触并且处于DNA聚合条件下并且持续足够的时间,其中使用该末端加标签寡核苷酸作为模板延伸5'加标签的ssDNA片段的3'末端,从而将该第二标签接合至5' 加标签的ssDNA片段的3'末端并且产生5'和3'加标签的ssDNA片段。在一些实施方案中,使用半随机序列代替末端加标签寡核苷酸中的随机序 列。在该实施方案的一些变体中,末端加标签寡核苷酸包括脱氧核糖核苷酸或由脱氧核糖核苷酸构成。在该实施方案的一些变体中,末端加标签寡核苷酸包括核糖核苷酸或由核糖核苷酸构成,在这些实施方案中DNA聚合酶为依赖RNA的DNA聚合酶。在一些优选的实施方案中,末端加标签寡核苷酸的3'部分由七个随机核苷酸构成。在如下方法的一些优选的实施方案中所述方法使用末端加标签寡核苷酸来接合第二标签与5'加标签的ssDNA 片段,该第二标签不与该第一标签互补。細衣謝草_ (棚■)连漏禾口连·口fe糕浦■种伺龙力口双fe· DNA片段的加标签的DNA片段所述方法的一个优选的实施方案包括将体外转座反应中的靶DNA与至少一种转座体在一定条件下孵育并持续足够的时间以产生退火的5'加标签的DNA片段的群体;然后将退火的5'加标签的dsDNA片段的群体与依赖模板的(或同源的)DNA连接酶以及包括 3'部分和5'部分或由3'部分和5'部分构成的连接加标签寡脱氧核苷酸孵育,其中该 3'部分显示第二标签,该第二标签显示期望与退火的5'加标签的DNA片段的群体的3' 端接合的任何序列(例如,任意序列),并且该5'部分具有5'-单磷酸基团并且显示随机序列,所述孵育是在一定条件下进行并且持续足够的时间,其中该第二标签与该退火的5' 加标签的DNA片段接合,从而产生包括退火的加双标签的DNA片段的DNA片段的文库。在一些优选的实施方案中,所述方法还包括使包括退火的加双标签的DNA片段的DNA片段的文库变性的步骤(例如,通过加热到95°C并且快速冷却),从而产生包括加双标签的ssDNA 片段的DNA片段的文库。在一些优选的实施方案中,连接加标签寡核苷酸包括显示由大约三个到大约八个核苷酸构成的随机序列的5'部分。在一些优选的实施方案中,连接加标签寡核苷酸包括显示由四个核苷酸构成的随机序列的5'部分。在一些优选的实施方案中,依赖模板的连接酶是大肠杆菌DNA连接酶。在所述方法的这个实施方案的一个优选的形式中,包括加双标签的ssDNA片段的加标签的DNA片段的文库从单个管中的靶DNA中产生而没有进行任何介入纯化步骤。发夹转座子末端組合4勿禾Π依IM草板的连接Sl产牛甸J舌力时示签的环状DNA片段、扇尾形dsDNA片段或加双标签的DNA片段的加标签的DNA片段的文库在用于从体外转座反应的靶DNA中产生加标签的DNA片段文库的方法的一个优选实施方案中,该方法包括将靶DNA与一种或多种转座体组合物孵育,每种转座体组合物包括在转座酶和与该转座酶形成转座复合物的发夹转座子末端组合物之间的复合物,该发夹转座子末端组合物包括含5’ -磷酸的寡核苷酸或由其构成,所述含5’ -磷酸的寡核苷酸显示在5'端的非转移的转座子末端序列、在3'端的转移的转座子末端序列以及足够长的允许分子内茎-环形成的在该非转移的转座子末端序列与该转移的转座子末端序列之间的间插的任意标签序列;所述孵育在一定条件下进行并且持续足够的时间,其中发夹转座子末端组合物插入靶DNA中产生退火的5'加标签的DNA片段的群体;然后将退火的5'加标签的DNA片段的群体与一种或多种随机序列含5'-磷酸的寡核苷酸孵育,所述随机序列含5'-磷酸的寡核苷酸单独或组合在一起具有与体外转座反应后产生的退火的5'加标签的DNA片段中的单链缺口具有相同的长度,所述孵育在一定条件下进行并且持续足够的时间,其中通过随机序列寡核苷酸与靶DNA在单链缺口中的退火填充退火的5'加标签的 DNA片段的群体中的单链缺口 ;然后,将单链缺口已填充的退火的5'加标签的DNA片段的群体与依赖模板的连接酶在一定条件下孵育并且持续足够的时间,其中将退火的随机序列寡核苷酸彼此连接或与相邻的5'加标签的DNA片段的5'端连接,从而产生加标签的环状 DNA片段的文库。在用于从体外转座反应的靶DNA中产生加标签的DNA片段文库的方法的另一个优选实施方案中,该方法包括将该靶DNA与一种或多种转座体组合物孵育,每种转座体组合物包括在转座酶和与该转座酶形成转座复合物的发夹转座子末端组合物之间的复合物,该发夹转座子末端组合物包括含5’ -磷酸的寡核苷酸或由其构成,所述含5’ -磷酸的寡核苷酸显示在5'端的非转移的转座子末端序列、3'端的转移的转座子末端序列以及足够长的允许分子内茎-环形成的在该非转移的转座子末端序列与该转移的转座子末端序列之间的间插的任意标签序列;所述孵育在一定条件下进行并且持续足够的时间,其中发夹转座子末端组合物插入靶DNA中产生退火的5'加标签的DNA片段的群体;然后将退火的5'加标签的DNA片段的群体与缺乏5'-到-3'外切核酸酶活性和依赖结构的5'核酸酶活性以及链置换活性的DNA聚合酶孵育,所述孵育在一定条件下进行并且持续足够的时间,其中在体外转座反应后存在于退火的5'加标签的DNA片段的群体中的单链缺口通过DNA聚合酶对每个退火的5'加标签的DNA片段的3'端的延伸来填充;然后,将单链缺口已填充的退火的5'加标签的DNA片段的群体与依赖模板的连接酶在一定条件下孵育并且持续足够的时间,其中将退火的DNA聚合酶延伸产物的3'端与相邻退火的5'加标签的DNA片段的5'端连接,从而产生加标签的环状DNA片段的文库。在该方法的一些优选的实施方案中,DNA聚合酶和依赖模板的连接酶被提供在单一反应混合物中并且在该单一反应混合物中进行DNA聚合酶延伸和依赖模板的连接。在用于产生加标签的环状DNA片段的文库的这些方法中的任何一种的一些实施方案中,该方法在用依赖模板的连接酶孵育产生加标签的环状DNA片段的文库的步骤后面另外包括一个或多个除去未连接的线性ssDNA和dsDNA(例如,包括随机序列寡核苷酸,线性靶DNA和/或没有接合靶DNA的发夹转座子末端组合物)的步骤。在用于除去未连接的线性ssDNA和dsDNA的一个优选的实施方案中,所述方法另外包括用T5外切核酸酶处理含加标签的环状DNA片段的反应混合物。在用于产生加标签的环状DNA片段的文库的这些方法中的任何一种的一些优选的实施方案中,所述方法另外包括在衍生自发夹转座子末端组合物的每个环结构中切割加标签的环状DNA片段以产生扇尾形dsDNA片段,该扇尾形dsDNA片段的每条链其5 ‘端上具有标签的一部分以及在其3'端上具有标签的一部分。在一些实施方案中,在每个环结构中切割加标签的环状DNA片段的步骤包括使该加标签的环状DNA片段与切割酶组合物在一定条件下接触并持续足够的时间,其中该加标签的环状DNA片段在切割位点被切割以产生扇尾形dsDNA片段。在一些实施方案中,在每个环结构中切割加标签的环状DNA片段的步骤包括使与标签内的限制性位点吐火的寡脱氧核糖核苷酸与该加标签的环状DNA片段退火,然后与在双链的限制性位点切割的限制性内切核酸酶在一定条件下孵育并且持续足够时间以产生扇尾形dsDNA片段的文库。在一些优选的实施方案中,在每个环结构中切割加标签的环状DNA片段的步骤包括使该加标签的环状DNA片段与DNA糖基化酶和AP内切核酸酶接触,其中该DNA糖基化酶从存在于标签内的非规范核苷酸(例如,dUMP或8-氧代-dGMP)中除去核酸碱基,并且该AP内切核酸酶在得到的无碱基位点处切割该加标签的环状ssDNA片段;在一些实施方案中,该DNA糖基化酶选自尿嘧啶-N-糖基化酶和FPG蛋白,并且AP内切核酸酶选自大肠杆菌内切核酸酶III或内切核酸酶IV。在用于产生扇尾形dsDNA片段的文库的方法中的任何一种的一些优选的实施方案中,所述方法另外包括如下步骤使扇尾形dsDNA片段的文库变性以产生加双标签的线性ssDNA片段的文库。使用不依赖樽板的连接酶产牛包括加标签的环状ssDNA片段或加双标签的线件 ssDNA片段的加标签的DNA片段所述方法的一个优选的实施方案包括将体外转座反应中的靶DNA与至少一种转座体孵育,其中构成转座体的转移链的5'端具有5’ -磷酸基团,所述孵育在一定条件下进行足够时间以产生退火的5'加标签的DNA片段的群体;然后使该退火的5'加标签的 dsDNA片段变性以获得5'加标签的ssDNA片段(例如,通过加热到95°C并快速冷却);然后将连接反应中的5'加标签的ssDNA片段与不依赖模板的(或非同源的)连接酶在一定条件下孵育并持续足够的时间,其中5'加标签的ssDNA片段被分子内连接以产生加标签的环状ssDNA片段的文库,这些环状ssDNA片段中的每一个显示靶DNA的一部分的序列和标签序列。在所述方法的这个实施方案的一个优选的形式中,包括加标签的环状ssDNA片段的加标签的DNA片段的文库从单个管中的靶DNA中产生而没有进行任何介入纯化步骤。在一个优选的实施方案中,不依赖模板的连接酶选自噬菌体TS2U6热稳定的RNA连接酶和古细菌RNA连接酶(例如,嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum) RNA 连接酶1)。在一些优选的实施方案中,提供腺苷酸化形式的依赖模板的连接酶并且在不向连接反应添加ATP或NAD的情况下进行孵育5'加标签的ssDNA片段与不依赖模板的连接酶的步骤。在一些优选的实施方案中,所述方法还包括在标签内的位点切割加标签的环状 ssDNA片段,从而产生包括加双标签的线性ssDNA片段的加标签的DNA片段的文库。在一些实施方案中,切割的步骤包括使与加标签的环状ssDNA片段的标签内的单链限制性位点互补的寡脱氧核糖核苷酸退火,然后使用识别该限制性位点的限制性内切核酸酶在该限制性位点切割该加标签的环状ssDNA片段。在一些其他的实施方案中,切割的步骤包括使该加标签的环状ssDNA片段与DNA糖基化酶和内切核酸酶接触,其中该DNA糖基化酶从存在于标签内的非规范核苷酸(例如,dUMP或8-氧代-dGMP)中除去核酸碱基,并且该内切核酸酶在得到的无碱基位点处切割该加标签的环状ssDNA片段;在一些实施方案中,该DNA糖基化酶选自尿嘧啶-N-糖基化酶和FPG蛋白,并且AP内切核酸酶选自大肠杆菌内切核酸酶 III或内切核酸酶IV。在一些实施方案中,所述方法还包括扩增包括加标签的环状ssDNA片段或加双标签的ssDNA片段的加标签的DNA片段的文库的步骤,从而产生加标签的DNA片段的扩增文库。在一些优选的实施方案中,扩增加标签的DNA片段的文库的步骤包括进行聚合酶链反应(PCR),从而产生包括扩增的加双标签的DNA片段的加标签的DNA片段的扩增文库。在一些优选的实施方案中,使用第一 PCR引物和第二 PCR引物进行PCR反应,所述第一 PCR引物和第二 PCR引物各自具有3'部分和5'部分,其中该第一 PCR引物的3'部分与由加标签的DNA片段中的标签显示的序列互补并且该第二 PCR引物的3'部分与对该标签互补的序列互补,并且其中每个5'部分包括测序标签域,所述测序标签域包括允许使用所产生的扩增的加双标签的DNA片段作为利用特定的下一代测序平台的下一代测序的模板的适当的测序标签或由其构成(例如,Roche 454A和Roche 454B测序标签,ILLUMINA S0LEXA 测序标签 Applied Biosystems 的 SOLID 测序标签,Pacific Biosciences 的 SMRT 测序标签,Pollonator Polony 测序标签,或 Complete Genomics 测序标签)。■一輔革F, DNA歹丨丨代廉· DNA发明人观察到某些测序数据,这些测序数据指示来自包括dsDNA分子的具有小于 IOKb大小的靶DNA的末端的下一代序列数据的代表性比来自该靶DNA的中间的序列数据的代表性低。不希望受理论束缚,对于这种观察结果的一种可能的解释是找到具有以相反方向插入在线性dsDNA分子的末端的两种转座子末端组合物的DNA片段的可能性比找到具有以相反方向插入在该线性dsDNA分子的中间的两种转座子末端组合物的DNA的可能性低。 为了解决这个问题,发明人开发了另外的用于产生DNA片段文库的方法,其中存在对显示构成靶DNA的dsDNA分子的末端的序列的DNA片段的更好的代表性。一个优选的实施方案是用于产生其中存在对显示构成靶DNA的dsDNA分子的末端的序列的DNA片段的更好的代表性的DNA片段文库的方法,所述方法包括在体外转座反应中将靶DNA与包含至少一种转座酶和与该转座酶形成转座复合物的至少一种转座子末端组合物的至少一种转座体组合物在一定条件下孵育并持续足够的时间,所述转座子末端组合物包括转移链和非转移链,其中该转移链与该靶DNA接合,产生包括退火的5'加标签的 ssDNA片段的5'加标签的dsDNA片段,所述5'加标签的dsDNA片段中的每一个在5 ‘端具有包括转移链或由转移链构成的第一标签;使该5'加标签的dsDNA片段变性以释放5' 加标签的ssDNA片段;然后通过用连接ssDNA的不依赖模板的连接酶(例如,噬菌体TS2U6 RNA 连接酶;例如,CIRCLIGASE 热稳定的 ssDNA 连接酶,EPICENTRE, Madison, WI, USA)进行的分子内连接使5'加标签的ssDNA片段环化,从而产生加标签的环状ssDNA片段的文库。在一些实施方案中,将该至少一种转座酶和至少一种转座子末端组合物作为单独的组分而不是作为包括转座体组合物的单组分添加到反应中。在一些实施方案中,将加标签的环状ssDNA片段用作下一代测序模板,或者在标记后用作与阵列或微阵列上的探针退火的靶,或用于本文其他地方描述的其他应用。在一些其他的实施方案中,所述方法还包括在第一标签内使加标签的环状ssDNA片段线性化的步骤,从而产生加双标签的线性ssDNA片段。 在包括使加标签的环状ssDNA片段线性化的任何这些实施方案中的一些实施方案中,第一标签包括多个标签域,其中使该第一标签线性化的步骤导致该第一加标签的一部分在5' 端上和该第一加标签的另一部分在3'端上。例如,在一些实施方案中,转移的转座子末端组合物的转移链显示包括多个标签域(例如,Roche 454A和Roche 454B测序标签域)的第一标签,在所述多个标签域中,至少一个标签域与从加标签的环状ssDNA片段的线性化步骤中产生的加双标签的ssDNA片段的3'端接合。例如,在一些实施方案中,使用包含以下转移链的转座子末端组合物产生5 ‘加标签的DNA片段,所述转移链包含允许在核苷酸的位点切割的一个或多个核苷酸,并且在标签内使加标签的环状ssDNA片段线性化的步骤包括在所述一个或多个核苷酸处切割加标签的环状ssDNA片段。例如,在一些实施方案中, 转移链包含一个或多个脱氧尿苷核苷酸或者一个或多个8-氧鸟嘌呤核苷酸(例如,使用寡核苷酸合成仪合成的),并且在标签内使加标签的环状ssDNA片段线性化的步骤包括通过将该加标签的环状ssDNA片段分别与尿嘧啶-DNA糖基化酶或甲酰胺基嘧啶-DNA糖基化酶以及在无碱基位点切割DNA的内切核酸酶(例如,内切核酸酶IV)孵育来切割该加标签的环状ssDNA片段。例如,在一些其他的实施方案中,通过如下方式使加标签的环状ssDNA片段在标签内线性化使互补的寡核苷酸与该标签退火并使用识别双链标签内的限制性位点的限制性内切核酸酶进行线性化。在包括使加标签的环状ssDNA片段线性化的任何实施方案中的一些实施方案中,所述方法还包括纯化加双标签的ssDNA片段(例如,使用Qiagen PCR提纯柱);在这些实施方案中的一些实施方案中,加双标签的ssDNA片段用作下一代测序模板或者在标记后用作与阵列或微阵列上的探针退火的靶,或者用于本文其他地方描述的其他应用加标签的DNA片段的扩增和其他实施方案在用于产生加标签的DNA片段的文库的本发明的任何方法的一些实施方案中,所述方法还包括扩增包括加双标签的DNA片段、加标签的环状ssDNA片段或扇尾形DNA片段的加标签的DNA片段的文库。在这些方法中的任何一种方法的一些实施方案中,所述方法还包括如下步骤使用聚合酶链反应(PCR)扩增加双标签的线性ssDNA、加标签的环状DNA片段或扇尾形dsDNA 片段的文库。因此,在一些实施方案中,所述方法还包括(a)提供(i)第一 PCR引物和第二 PCR引物,其中该第一 PCR引物的至少3'端与加标签的环状DNA片段的标签序列的至少一部分互补或与接合扇尾形dsDNA片段的3'端的标签序列的至少一部分互补或与接合线性ssDNA片段的3'端的标签序列的至少一部分互补,并且其中该第二 PCR引物的至少 3'端与加标签的环状DNA片段的标签序列的互补序列的至少一部分互补(S卩,其中该第二 PCR引物的至少3'端显示与该标签序列的至少一部分相同的序列),或者其中该第二 PCR 引物的至少3'端与接合扇尾形dsDNA片段或加双标签的线性ssDNA片段的5'端的标签序列的互补序列的至少一部分互补(即,其中该第二 PCR引物的至少3'端显示与接合扇尾形dsDNA片段或加双标签的线性ssDNA片段的5'端的标签序列的至少一部分相同的序列),和(ii)可用于PCR的热稳定的DNA聚合酶;以及(b)将加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段与相应的第一 PCR引物和第二 PCR引物以及热稳定的DNA聚合酶在PCR扩增条件下孵育并持续足够的时间,其中产生扩增的加双标签的线性dsDNA片段。在其中所述方法包括使用PCR扩增加标签的环状DNA片段的一些实施方案中,该第一 PCR引物与插入加标签的环状DNA片段的靶DNA中的发夹转座子末端组合物的环结构的至少一部分中的标签序列互补和/或该第二 PCR引物显示与插入加标签的环状DNA片段的靶DNA中的发夹转座子末端组合物的环结构的至少一部分相同的序列。在一些实施方案中,第一 PCR引物与转移的转座子末端序列或非转移的转座子末端序列的至少一部分互补,而第二 PCR引物与转移的转座子末端序列或非转移的转座子末端序列的至少一部分相同。在一些实施方案中,该第一 PCR引物的5'部分或该第二 PCR引物的5'部分或该第一 PCR引物和该第二 PCR引物二者的5 ’部分分别包括第一测序标签或第二测序标签或者分别由第一测序标签或第二测序标签构成,以产生用于特定测序平台的下一代测序的模板(例如,用于如下平台的测序标签R0CHE 454A或ROCHE 454B测序平台;ILLUMINA SOLEXA 测序平台;APPLIED BIOSYSTEMS SOLID 测序平台;PACIFIC BIOSCIENCES 的 SMRT 测序平台;P0LL0NAT0R POLONY测序平台;HELIC0S测序平台;COMPLETE GENOMICS测序平台;INTELLIGENT BIOSYSTEMS测序平台;或任何其他测序平台)在一些实施方案中,该第一 PCR引物的5'部分或该第二PCR引物的5'部分另外包括地址标签域或用于特定目的的另一种标签域或者由其构成。在其他实施方案中,加标签的环状DNA片段的标签包括用于使用特定平台的下一代测序的测序标签。在其中使用具有5'核酸酶活性或链置换活性的DNA聚合酶产生包括加双标签的 DNA片段的加标签的DNA片段的文库的方法的实施方案中,扩增该文库的步骤包括只使用与第二标签互补的单个寡脱氧核糖核苷酸引物来通过PCR扩增加标签的DNA片段的文库。 在一些实施方案中,用于PCR的单引物显示转移的转座子末端序列的至少一部分。在一些其他的实施方案中,用于PCR的单引物显示转移的转座子末端寡核苷酸的5'部分的序列的至少一部分。在一些其他优选的实施方案中,使用单个寡核苷酸引物扩增包括加双标签的DNA片段的加标签的DNA片段的文库的步骤包括提供与加标签的DNA片段的3'端的第二标签互补的单个寡核苷酸引物和适合于PCR的热稳定的DNA聚合酶;并且将加标签的 DNA片段的文库与寡核苷酸引物和热稳定的DNA聚合酶在PCR扩增条件下孵育足够的时间, 其中加标签的DNA片段的文库被PCR扩增,产生扩增的加标签的DNA片段的文库。在其中包括加双标签的DNA片段的加标签的DNA片段的文库并非使用具有5‘核酸酶活性或链置换活性的DNA聚合酶产生的一些其他的实施方案中,扩增该文库的步骤包括进行聚合酶链反应(PCR),所述方法还包括(1)提供(a)第一 PCR引物和第二 PCR引物, 其中该第一 PCR引物的至少3'端与加双标签的DNA片段或扇尾形DNA片段的3'端的第一标签的至少一部分互补或与加标签的环状ssDNA片段中的标签的至少一部分互补,并且该第二 PCR引物的至少3'端与加双标签的DNA片段或扇尾形DNA片段的第二标签的互补序列的至少一部分互补或与加标签的环状ssDNA片段中的标签的互补序列的至少一部分互补,(b)适合于PCR的热稳定的DNA聚合酶;以及(2)将加标签的DNA片段的文库与PCR 引物和热稳定的DNA聚合酶在PCR扩增条件下孵育并持续足够的时间,其中扩增加标签的 DNA片段的文库以产生扩增的加标签的DNA片段的文库。在一些实施方案中,第一 PCR引物或第二 PCR引物包括5'部分和3'部分,其中该5'部分不与加标签的DNA片段中的相应的标签或其互补序列中的序列互补,并且该3'部分与相应标签或其互补序列的序列互补。在一些实施方案中,第一 PCR引物和第二 PCR引物的5'部分包括适当的第一测序标签和第二测序标签或者由其构成,所述适当的第一测序标签和第二测序标签允许使用它们来产生用于下一代测序的模板(例如,Roche 454A和Roche 454B测序标签或用于另一测序平台的适当的第一测序标签和第二测序标签;例如,不限于Illumina Solexa或Applied Biosystems Solid 平台)。 广泛种类的酶和试剂盒可用于通过PCR进行扩增反应。例如,在一些实施方案中, 使用来自 EPICENTRE Biotechnologies,Madison, WI 的 FAILSAFE PCR 系统或 MASTERAMP 超长PCR系统按制造商所述进行PCR扩增。这些系统允许对PCR反应条件的快速优化, 所述优化使用每个系统配有的一系列2XPCR PreMix来鉴定特定模板和引物对的优化的 PreMix。然而,本发明不限于使用用于扩增反应的那些产物或条件,并且可使用任何适宜的热稳定DNA聚合酶和允许扩增在与靶序列退火的引物和与转座子退火的引物之间的序列的反应混合物。本发明也不限于使用PCR来扩增加标签的DNA片段文库。扩增同一序列并产生适合的组成和量的扩增产物以用于预定目的的任何适宜的扩增方法(例如,滚环扩增、核糖核酸引物(riboprimer)扩增(例如,美国专利第7,413,857号)、ICAN、UCAN、ribospia、末端加标签(美国专利申请第20050153333号)、EberWine型RNA扩增或链置换扩增)可用于本发明的实施方案中。例如,可以使用的一些链置换方法描述于=Takara Shuzo Company, Kyoto, Japan 的 PCT 专利公布第 WO 02/16639 号;WO 00/56877 号;和 AU 00/29742 号; Becton Dickinson and Company 的美国专利第 5,523,204 号;5,536,649 号;5,624,825 号; 5,631,147 号;5,648,211 号;5,733,752 号;5,744,311 号;5,756,702 号;和 5,916,779 号; Nanogen/Becton Dickinson Partnership 的美国专利第 6,238,868 号;6,309,833 号;和 6,326,173 号;Bio Merieux 的美国专利第 5,849,547 号;5,874,260 号;和 6,218,151 号; Gen-Probe, Inc.的美国专利第 5,786,183 号;6, 087, 133 号;和 6,214,587 号;Wick 等人的美国专利第 6,063,604 号;Kurn 的 6,251,639 ;Eiken Kagaku Kabushiki Kaishi, Tokyo, Japan的美国专利第6,410,278号;和PCT公布第WO 0(V28082号;Auerbach的美国专利第 5,591,609 号;5,614,389 号;5,773,733 号;5,834,202 号;和 6,448,017 号;以及 Lizardi 的美国专利第6,124,120号;和6,280,949号。在本发明的优选实施方案中,没有必要按大小选择在体外转座反应中产生的5' 加标签的DNA片段的文库或加标签的DNA片段的最终文库。在大小选择或纯化对于某些应用而言是必要的情况下,可通过琼脂糖凝胶电泳按大小选择5'加标签的DNA片段(例如, 使用适当琼脂糖百分比的低熔解温度非变性琼脂糖凝胶用于期望大小范围的DNA片段), 并纯化它们(例如,除去未插入的转座子末端寡核苷酸、其他反应产物和琼脂糖凝胶;例如,通过用 EPICENTRE Biotechnologies, Madison, WI, USA 的 GELase 琼脂糖凝胶消化酶消化含期望大小范围的5'加标签的DNA片段的琼脂糖凝胶部分,接着是醇沉淀,以及根据 GEL酶产品说明书的其他提纯步骤,或使用本领域已知的任何其他纯化方法)。在一些实施方案中,包括聚乙二醇(PEG)沉淀的纯化步骤用于沉淀加标签的DNA片段的文库而不沉淀污染物质(例如,不限于,未连接的连接加标签寡核苷酸或其他反应组分)。在一些实施方案中,使用旋转柱(spin column)或本领域已知的任何其他纯化方法。
在一些实施方案中,加标签的环状DNA片段用作DNA测序的模板。在一些实施方案中,加标签的DNA片段用作DNA测序的模板。在一些实施方案中,加标签的DNA片段的文库用作扩增反应的模板(例如,使用与包括加双标签的DNA片段或扇尾形DNA片段的加标签的DNA片段的第一标签和第二标签互补或者与包括加标签的环状ssDNA片段的加标签的DNA片段的标签的互补的PCR引物的 PCR扩增反应)。在一些优选的实施方案中,所扩增的加标签的DNA片段的文库包括由靶 DNA显示的序列的大部分或近似全部。在其中靶DNA包括生物的基因组DNA的一些实施方案中,扩增反应是全基因组扩增反应。在包括扩增加标签的DNA片段的方法的一些实施方案中,通过在扩增方法(例如, PCR扩增反应方法)的一个或多个步骤过程中掺入标记的核苷酸对扩增物进行标记。在一些实施方案中,包含标记的扩增的加标签的DNA片段的文库用于检测或捕获或者用于检测和捕获包含标记的扩增的加标签的DNA片段用于特定应用。用于产生加标签的DNA片段(例如,加双标签的DNA片段)的文库的本发明的任何方法的一些实施方案包括产生“标记的”加标签的DNA片段的文库,所述“标记的”加标签的 DNA片段包含允许在表面上捕获标记的加标签的DNA片段的一个或多个部分(例如,一个或多个亲和性结合分子),或允许检测标记的加标签的DNA片段的一个或多个可检测部分 (例如,它与互补DNA诸如染色体中的互补DNA退火)。同样,包括还扩增加标签的DNA片段的文库的本发明的任何方法的一些实施方案包括产生“标记的”扩增的加标签的DNA片段的文库,所述“标记的”扩增的加标签的DNA片段包含允许在表面上捕获的一个或多个部分(例如,一个或多个亲和性结合分子),或允许检测标记的加标签的DNA片段的一个或多个可检测部分(例如,它与互补DNA诸如染色体中的互补DNA退火)。在一些实施方案中, 标记的加标签的DNA片段或标记的扩增的加标签的DNA片段的文库是通过使用至少一种标记的寡核苷酸(例如,标记的转移的转座子末端寡核苷酸,标记的连接加标签寡核苷酸,或至少一种标记的扩增引物,诸如至少一种(或多于一种)PCR引物)而产生。在一些其他的实施方案中,标记的扩增的加标签的DNA片段的文库是通过在扩增反应过程中包括掺入扩增产物中的标记的dNTP而产生。标记的dNTP可具有本领域已知的能够用于产生标记的扩增的加标签的DNA片段的任何标记,不论是通过直接加标记还是通过间接加标记。谈及“直接标记”,我们表示捕获部分或可检测标记与扩增的加标签的DNA片段直接相连而在该捕获部分或可检测部分与该加标签的DNA片段或扩增的加标签的DNA片段之间没有任何其他部分。谈及“间接加标记”,我们表示在捕获部分或可检测部分与加标签的DNA片段或扩增的加标签的DNA片段之间具有至少一个其他部分。直接标记的一个实例是将染料标记的核苷酸掺入加标签的DNA片段中,而间接标记的一个实例是将生物素标记的核苷酸掺入加标签的DNA片段中,然后通过与染料标记的抗生蛋白链菌素在一定条件下孵育用染料可检测部分标记加标签的DNA片段其中染料标记的抗生蛋白链菌素结合生物素标记的核苷酸。本发明包括使用任何合适的方法产生标记的加标签的DNA片段或标记的扩增的加标签的DNA 片段的文库,其中该标记随后用于捕获或检测。在一些其他的实施方案中,使用本发明的方法制备的文库中的加标签的DNA片段随后通过如下方式被直接或间接地标记使加标签的DNA片段的文库与反应性染料分子 (例如,来自Molecular Probes, Eugene, OR的含N-羟基琥珀酰亚胺基或“NHS”酯的反应性荧光染料中的任何一种)或与反应性亲和性结合分子(例如,反应性生物素化试剂,诸如来自Pierce Chemical Company,Rockford,IL的生物素-NHS化合物)接触。例如,在一些实施方案中,标记的扩增的加标签的DNA片段的文库是通过以下产生在扩增反应过程中掺入含氨基烯丙基-基团的dNTP,然后使含氨基烯丙基-的扩增的加标签的DNA片段的文库与标记的荧光染料-NHS酯或生物素-NHS酯接触分别产生荧光染料标记的扩增的加标签的DNA片段或生物素标记的扩增的加标签的DNA片段。具有本领域知识的技术人员将懂得或懂得如何寻找对扩增的加标签的DNA片段的文库进行标记的许多另外的具体方法和试剂,包括例如来自Molecular ftx)bes的试剂盒,以用于特定目的(例如,允许在表面上捕获或检测)。例如,实例包括具有以下的一种或多种修饰的核苷酸氨基烯丙基-基团、丙炔基-基团、生物素基团、荧光染料或其他可检测染料或任何其他可检测分子或本领域已知的分子的组合,包括量子点、酶(例如,磷酸酶、过氧化物酶或焦磷酸酶)或可检测蛋白(例如,藻胆蛋白、藻红蛋白)。在一些其他的实施方案中,标记的扩增的加标签的DNA片段的文库是通过在扩增反应过程中例如在PCR扩增反应过程中掺入用亲和性结合分子或可检测部分标记的一种或多种修饰的dNTP而产生,例如,通过掺入具有氨基烯丙基-基团、生物素基团、荧光染料或其他可检测染料或允许直接或在用任何其他可检测分子或本领域已知的分子的组合标记后间接被检测的另一部分的一种或多种修饰的核苷酸,所述本领域已知的分子包括与亲和性结合分子(例如,作为抗生蛋白链菌素,抗体)相连的量子点、或酶或可检测蛋白(例如,藻胆蛋白、藻红蛋白)。在一些实施方案中,加标签的DNA片段(例如,加双标签的DNA片段)用于制备与附于表面的探针杂交的加标签的DNA片段(例如,作为与阵列或微阵列上的DNA探针杂交的标记的靶DNA)。在一些实施方案中,加标签的DNA片段(例如,包括加双标签的DNA片段)用于与固定的细胞切片或组织切片中的染色体或染色体部分杂交(例如,荧光原位杂交或FISH)。在一些实施方案中,所述方法包括产生标记的加标签的DNA片段或标记的扩增的加标签的DNA片段(例如,标记的加双标签的DNA片段或标记的扩增的加双标签的DNA片段)以用于与染色体杂交(例如,其中标记的加标签的DNA片段是由包括来自一种或多种特定染色体的DNA的靶DNA而制备以用作“染色体涂料”(例如,用于与固定细胞切片或组织切片中的一种或多种染色体杂交,例如,使用荧光原位杂交或FISH以用于诸如染色体分型等应用,或用于研究、医学诊断、鉴定生物的性别,或其他细胞生物学应用)。在一些实施方案中,所述方法包括从包括染色体部分的靶DNA中产生标记的加标签的DNA片段或标记的扩增的加标签的DNA片段(例如,其中加标签的DNA片段是由编码一种或多种染色体的一个或多个特定基因或基因座的DNA制备(例如,用于与固定细胞切片或组织切片中的一种或多种染色体杂交,例如,使用荧光原位杂交或FISH,或用作体外测定应用诸如分析物特异性测定或用于医学、工业、环境或分子或细胞生物学研究应用的诊断测试中的基因特异性探针或基因座特异性探针)。在一些实施方案中,标记的加标签的DNA片段与表面(例如,阵列或微阵列,浸渍条(dipstick),量子点,珠子,或微流体装置中的微通道)上的探针的杂交用于检测、定量、 确定相对数量、或表征一种或多种DNA分子或其部分,所述DNA分子或部分处于或来自自然来源(例如,来自细胞的基因组DNA ;例如,用于评估拷贝数变异或“CNV”的人DNA,或来自为病原的致病的细菌、真菌、支原体、病毒或线虫细胞的DNA),或来自体外来源(例如,通过 RNA诸如mRNA或非编码RNA或病毒RNA的反转录制备的双链cDNA,所述RNA从自然来源分离或者使用核酸扩增方法诸如DNA或RNA扩增方法从自然来源扩增)。在其中所述方法包括扩增加标签的DNA片段的一些其他的实施方案中,所述方法包括通过在扩增反应过程中例如在PCR扩增反应过程中掺入具有亲和性结合分子或可检测部分的一种或多种修饰的dNTP而产生(例如,通过掺入具有氨基烯丙基-基团、生物素基团、荧光染料或其他可检测染料或允许直接或在用任何其他可检测分子或本领域已知的分子的组合标记后间接被检测的另一部分的一种或多种修饰的dNTP,所述本领域已知的分子包括与亲和性结合分子(例如,作为抗生蛋白链菌素,抗体)相连的量子点、或酶或可检测蛋白(例如,藻胆蛋白、藻红蛋白)。在一些其他的实施方案中,使用本发明的方法制备的加标签的DNA片段或扩增的加标签的DNA片段是标记的扩增的加标签的DNA片段的文库是通过在扩增反应过程中掺入具有亲和性结合分子或可检测部分的一种或多种修饰的dNTP而标记(例如,在相应的转录、RCR或PCR反应中,例如,通过掺入具有氨基烯丙基_基团、生物素基团、洋地黄毒苷基团、荧光染料或其他可检测染料或允许直接或在用任何其他可检测分子或本领域已知的分子的组合标记后间接被检测的另一部分的一种或多种修饰的dNTP,所述本领域已知的分子包括与亲和性结合分子(例如,作为抗生蛋白链菌素,抗体)相连的 量子点、或酶或可检测蛋白(例如,藻胆蛋白、藻红蛋白)。在一些实施方案中,相应的产物用于制备与附于表面的探针杂交的标记的核酸片段(例如,作为与阵列或微阵列上的DNA探针杂交的标记的靶核酸)。在一些实施方案中,相应的标记的产物用于与固定的细胞切片或组织切片中的染色体或染色体部分杂交(例如,荧光原位杂交或FISH)。在一些实施方案中,标记的产物与表面上的探针的杂交用于检测、定量、确定相对数量或表征靶DNA的一个或多个部分,所述靶 DNA来自自然来源(例如,来自细胞的基因组DNA;例如,用于评估拷贝数变异或“CNV”)或来自体外来源(例如,通过RNA诸如mRNA或非编码RNA (ncRNA)的反转录制备的双链cDNA, 所述双链cDNA从自然来源分离或者使用RNA扩增方法从自然来源扩增)。在包括产生加标签的环状DNA片段的文库的方法的一些实施方案中,转移的转座子末端寡核苷酸除了显示在3'部分中的转移的转座子末端的序列之外还显示在5'部分中的双链RNA聚合酶启动子的一条链的序列。在包括使用连接加标签寡核苷酸和依赖模板的连接酶产生加双标签的DNA片段的文库的方法的一些实施方案中,该连接加标签寡核苷酸显示在3'部分中的双链RNA聚合酶启动子的一条链的序列。在其中转移的转座子末端寡核苷酸或连接加标签寡核苷酸不显示RNA聚合酶启动子序列的方法的一些实施方案中, 所述方法还包括使用至少一种PCR引物PCR扩增加双标签的DNA片段,所述PCR引物为“启动子引物”。该启动子引物具有不与加双标签的DNA片段退火并且显示双链的RNA聚合酶启动子的一条链的序列的“5'-翼(5' -flap)”或“5'-尾”部分以及与5'和3'加标签的DNA片段或其互补序列的第一标签或第二标签退火的3'部分。在其中转移的转座子末端寡核苷酸、连接加标签寡核苷酸或PCR引物显示RNA聚合酶启动子序列的一些优选的实施方案中,该RNA聚合酶启动子是T7型RNA聚合酶启动子并且所述方法还包括使用识别该启动子的T7型RNA聚合酶在体外转录5'和3'加标签的 DNA片段的步骤。更优选地,从T7 RNAP、T3 RNAP和SP6 RNAP以及对应的同源启动子中选择RNA聚合酶和启动子。然而,本发明的方法的转录步骤可使用如下任何RNAP 对于所述 RNAP而言允许具有高特异性的转录的适合的启动子序列是已知的或者可被获得。用于体外转录的试剂盒和酶从许多卖家可商购获得并且用于执行包括体外转录的本发明的步骤的适当的反应混合物和条件可按制造商所述使用那些产品。例如,使用T7 RNAP的体外转录可按照产品资料所述使用来自 EPICENTRE Biotechnologies,Madison, WI 的 AMPLISCRIBE T7-FlaSh 转录试剂盒或AMPLISCRIBE T7高产量转录试剂盒。类似地,如果Τ3 RNAP或 SP6 RNAP在本发明的方法中用于体外转录,那么AMPLISCRIBE T3-FlaSh 高产量转录试剂盒或 AMPLISCRIBE SP6 高产量转录试剂盒(EPICENTRE Biotechnologies,Madison, WI) 分别可按照所述使用。在一些实施方案中,转移的转座子末端寡核苷酸、连接加标签寡核苷酸或PCR引物除了 RNA聚合酶启动子序列以外还显示用于翻译的另外序列,诸如但不限于核糖体结合位点和翻译起 始密码子(也称为“翻译起始信号”),并且所述方法另外包括翻译转录的 RNA0在这些实施方案中的一些实施方案中,所述方法还包括得到的RNA转录本的体外翻译步骤。用于RNA转录本的体外翻译的系统和试剂盒也可以从许多来源商购获得并且可用于本发明。通过举例但不限于,来自PROMEGA Corporation,Madison,WI的兔网织红细胞裂解物、小麦胚芽提取物和大肠杆菌S30提取物系统可用于本发明。更进一步,体外转录和体外翻译偶联的试剂盒也可以商购获得并且可被使用,诸如来自Promega的TNT 快速偶联的转录/翻译系统。在所述方法的一些优选的实施方案中,对从靶DNA产生的加双标签的DNA片段的文库进行PCR扩增,所述靶DNA包括来自细胞或生物的全基因组的DNA样品(即,所述方法包括用于全基因组扩增的方法或由其构成)。在一些实施方案中,使用全基因组扩增的方法来扩增来自单细胞的全基因组。在本文所述的全基因组扩增方法的一些优选的实施方案中,使用与第二标签互补的单个寡核苷酸引物(或PCR引物)对从DNA样品产生的加标签的DNA片段的文库进行PCR扩增,所述DNA样品来自细胞或生物的全基因组。在一些实施方案中,使用本发明的方法产生的加标签DNA片段是从靶DNA中产生, 所述靶DNA包括从存在于环境样品中的所有生物(例如,多种生物)的RNA制备的基因组和/或双链cDNA或由其构成(例如,用于宏基因组或宏转录组的应用,包括用于工业、医疗或研究应用)。在所述方法的一些其他的实施方案中,加标签的DNA片段的文库是从靶DNA产生, 所述靶DNA包括如下DNA 所述DNA包括单染色体或染色体的一部分或由其构成。在这些实施方案中的一些实施方案中,所述方法包括在一定条件下对从靶DNA产生的加标签的DNA 片段的文库进行PCR扩增,所述靶DNA包括单染色体或染色体的一部分的DNA或由其构成, 所述染色体的一部分包括含一个或多个基因或基因座的染色体的一部分,其中PCR扩增的产物用可检测部分标记(例如,荧光的、红外荧光的、化学发光的、可见的或其他可检测染料;例如,在PCR中使用染料标记的dNTP。在一些实施方案中,用可检测部分标记的PCR扩增的产物用于原位对固定细胞进行染色(例如,PCR扩增产物用作染色体涂料)。因此,在一些优选的实施方案中,所述方法包括用于制备染色体涂料或子染色体涂料或染色体标志的方法或由其构成。在一些实施方案中,使用所述方法产生的加标签的DNA片段或扩增的加标签的DNA片段用作使用本发明的方法的第二轮断裂和加标签的靶DNA。在一些实施方案中,在所述方法的第一轮和第二轮中使用相同的转座体。在一些实施方案中,另一不同的转座酶和不同的转座子末端用于第二轮。在一些实施方案中,将使用所述方法产生的加标签的DNA片段或扩增的加标签的DNA片段克隆在载体中(例如,在C0PYC0NTR0L F黏粒载体中,EPICENTRE Biotechnologies, Madison, WI,USA)。在其中所述方法还包括克隆加标签的DNA片段或扩增的加标签的DNA片段并且其中加标签的DNA片段或扩增的加标签的DNA片段(例如,PCR 扩增的加标签的DNA片段)显示RNA聚合酶启动子的一些实施方案中,所述方法还包括对克隆的加标签的DNA片段或扩增的加标签的DNA片段的至少一条链进行转录。在一些实施方案中,使用识别RNA聚合酶启动子的RNA聚合酶在体外对克隆的加标签的DNA片段或扩增的加标签的DNA片段进行转录。在一些实施方案中,在宿主细胞中对克隆的加标签的DNA 片段或扩增的加标签的DNA片段进行体内转录,所述宿主细胞能够诱导表达识别RNA聚合酶启动子的RNA聚合酶并然后对含RNA聚合酶结合的启动子的DNA模板进行转录(例如, PET系统被广泛用于由诱导的T7型RNA聚合酶在体内表达蛋白)。在一些优选的实施方案中,用于体外或体内表达的RNA聚合酶是T7型RNA聚合酶并且从相应的同源T7型RNAP启动子启动转录。在一些优选的实施方案中,T7型RNA聚合酶选自T7RNA聚合酶、T3 RNA聚合酶和SP6 RNA聚合酶。在所述方法的任何一种的一些实施方案中,转移的转座子末端寡核苷酸、连接加标签寡核苷酸或PCR引物包含亲和性分子或与亲和性分子(例如,生物素或洋地黄毒苷) 接合,并且所述方法另外包括如下步骤提供用亲和性结合物质共价或非共价包被的固体表面,所述亲和性结合物质能够与亲和性分子(例如,用于结合生物素的抗生蛋白链菌素或抗生物素蛋白,或用于结合洋地黄毒苷的抗体)特异性结合并形成特异性结合对;以及, 在涉及其的步骤之前或之后,在一定条件下接触使用与亲和性分子共价接合的转移的转座子末端寡核苷酸、连接加标签寡核苷酸或CPR引物产生的产物,其中亲和性分子与接合该固体表面的亲和性结合物质结合。本发明不限于特定的固体表面,它可以是有孔的或无孔的,以及具有适合于特定方法和应用的任何组成、大小或形状。通过举例,但不受限制,固体表面可以选自以下组成的组磁珠、包被的珠子、载玻片、微量滴定板的孔、管、以及由玻璃、塑料(例如胶乳或聚苯乙烯)、硅石、特氟隆或另外适合的材料构成的浸渍片。用亲和性结合物质包被的固体表面的目的是允许与亲和性分子接合的转移的转座子末端寡核苷酸、连接加标签寡核苷酸或 PCR引物的操作(例如,捕获或洗涤以便从反应混合物中的其他分子中除去)、分离和捕获, 或者是允许5'加标签的DNA片段、5'和3'加标签的DNA片段或自其产生的PCR产物的操作、分离和捕获。为了防止非特异性结合,在一些实施方案中,用选自以下组成的组的大量过剩物质处理固体支持体无DNA的tRNA ;蛋白(例如,BSA),多糖(例如,糖原、硫酸葡聚糖或肝素)。本发明还不限于特定亲和性分子或亲和性结合物质,只要它们能够特异性结合并形成特异性结合对。因此,在一些实施方案中,加标签的DNA片段或扩增的加标签的DNA通过结合固体表面在另一方法中被捕获、分离、纯化或使用,所述方法包括如下步骤使包含亲和性分子的加标签的DNA片段或扩增的加标签的DNA片段在存在试剂的情况下且在促进亲和性分子与附于固体表面的亲和性结合物质结合的条件下与固体表面接触,其中加标签的DNA片段或扩增的加标签的DNA片段与该表面结合。在一些优选的实施方案中,亲和性分子是生物素并且亲和性结合物质是抗生物素蛋白或抗生蛋白链菌素,或者其中亲和性分子是洋地黄毒苷并且亲和性结合物质是特异性结合洋地黄毒苷的抗体。如本文所用,术语“转座酶”和“DNA聚合酶”以及“连接酶”是指负责催化特异性化学反应和生物学反应的蛋白质分子或蛋白质分子聚集体。一般来说,本发明的方法、组合物或试剂盒不限于使用来自特定来源的特定的转座酶或DNA聚合酶。反之,本发明的方法、 组合物或试剂盒包括与根据特定方法、组合物或试剂盒的本文公开的特定酶具有等同酶活性的来自任何来源的任何转座酶或DNA聚合酶。更进一步,本发明的方法还包括如下实施方案其中在所述方法的步骤中提供和使用的任何一种特定的酶被两种或多种酶的组合取代,所述两种或多种酶在组合使用时,不论是以分步方式分别使用还是同时一起使用,反应混合物产生的结果与使用该一种特定的酶获得的结果相同。本文提供的方法、缓冲液和反应条件,包括在实施例中的方法、缓冲液和反应条件目前对于本发明的方法、组合物和试剂盒的实施方案是优选的。然而,使用本发明的一些酶的其他的酶储存缓冲液、反应缓冲液和反应条件是本领域已知的,其也可能适于在本发明中使用并且被包括在本文中。组合物和试剂盒实施方案本发明还包括用于本发明的方法的试剂盒和组合物。试剂盒是可用于执行本发明的方法的单独组合物的组合,其中将这些组合物优化以在该方法中一起使用。组合物包括用于本发明的方法的至少一个步骤的单独组分。本发明包括可由本发明的任两种新颖组合物或试剂盒的组合或者从试剂盒中使用的任何新颖组合物组装的任何试剂盒。在一些实施方案中,试剂盒或组合物包括处于任何适当的组合及出于任何理由的此处描述的任何试剂盒或组合物的子集由其构成,以提供使用者为特定目的或应用修改方法的灵活性,或允许使用者采用与包括该子集或由该子集构成的试剂盒或组合物一起的其他组合物。组合物实施方案本发明的组合物的一个实施方案是包括如下的转座体组合物(i)具有显示转移的转座子末端序列的3'部分和显示标签域的序列的5'部分的转移链,以及(ii)只显示非转移的转座子末端序列的含5'磷酸的非转移链,其中转座酶与转座子末端组合物形成在体外转座反应中有活性的复合物。在一些实施方案中,标签域是在下一代测序或扩增中使用的标签域。在一些实施方案中,标签域选自限制性位点域、捕获标签域、测序标签域、 检测标签域、地址标签域、扩增标签域和转录启动子域。本发明的一种其他组合物是转移的转座子末端组合物,其中转移链包括3'部分和5'部分,其中该3'部分显示转移的转座子末端序列并且该5'部分包括显示RNA聚合酶启动子序列的转录启动子域。本发明的另一种组合物是包括含5'-磷酸的寡核苷酸或由其构成的发夹转座子末端组合物,所述含5'-磷酸的寡核苷酸显示在5'端的非转移的转座子末端序列、在3' 端的转移的转座子末端序列,以及足够长的允许分子内茎-环形成的在该非转移的转座子末端序列与该转移的转座子末端序列之间的间插的任意标签序列。在一些优选的实施方案中,发夹转座子末端组合物包括显示高活性Tn5转座酶的转座子末端序列。在一些其他实施方案中,发夹转座子末端组合物在其5'端被腺苷酸化而不是具有5'-磷酸基团。本发明还包括用于执行所述方法的组合物。例如,本发明的一种组合物是包含3 ‘ 部分和5'部分的寡核苷酸,其中该3'部分显示转移的转座子末端序列并且该5'部分显示限制性位点域(例如,针对稀有切割的限制性内切核酸酶诸如NotI或AscI的,或者针对 II型内切核酸酶诸如i^okl的)。例如,本发明的一种其他组合物是包含3'部分和5'部分的寡核苷酸,其中该3'部分显示转移的转座子末端序列并且该5'部分显示RNA聚合酶启动子序列(例如,针对噬菌体T7、T3、SP6或N4 RNA聚合酶的)。在一些优选的实施方案中,RNA聚合酶启动子序列是这些RNA聚合酶中的任何一种的正义启动子序列。在一些其他的实施方案中,RNA聚合酶启动子序列是这些RNA聚合酶中的任何一种的反义启动子序列。本发明的一种其他组合物是包含3'部分和5'部分的寡核苷酸,其中该3'部分显示转移的转座子末端序列并且该5'部分显示标签域,所述标签域选自测序标签域、扩增标签域、捕获标签域、地址标签域、检测标签域以及限制位点标签域。在一些优选的实施方案中,转移的转座子末端序列是EZ-Tn5 转座酶 (EPICENTRE)的MEDS或pMEDS转移的转座子末端组合物。在一些优选的实施方案中,序列标签域显示适合于以下测序平台的测序标签ROCHE妨4测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BI0SYSTEMS的测序平台、或HELIC0S测序平台。试剂盒实施方案本发明的一个实施方案是用于产生在下一代或核酸扩增的模板制备中使用的5 ’ 加标签的DNA片段的文库的试剂盒,所述试剂盒包括包含转座酶和转座子末端组合物的转座体组合物,所述转座子末端组合物包括(i)具有显示转移的转座子末端序列的3'部分和显示在下一代测序反应或扩增反应中使用的标签域的序列的5'部分的转移链,以及 ( )只显示非转移的转座子末端序列的含5'-磷酸的非转移链,其中转座酶与转座子末端组合物形成在体外转座反应中有活性的复合物;和含有一定量二甲基甲酰胺的反应缓冲液,该量导致二甲基甲酰胺以10%的终浓度存在于体外转座反应中。在一些实施方案中,试剂盒另外包括选自以下的至少一种另外的酶组分具有 5'核酸酶活性或链置换活性的DNA聚合酶;缺乏5'核酸酶活性、依赖模板的NAD连接酶、 以及不依赖模板的连接酶。在一些实施方案中,至少一种另外的酶组分选自FAILSAFE DNA聚合酶混合物;Taq DNA聚合酶、Tfl DNA聚合酶、T4 DNA聚合酶、大肠杆菌DNA连接酶、 噬菌体TS2U6热稳定的RNA连接酶、Mth Rn 1热稳定的RNA连接酶、以及CIRCLIGASE 热稳定的ssDNA连接酶。在其中试剂盒中的至少一种酶是依赖模板的酶(例如,大肠杆菌DNA连接酶)的一些优选的实施方案中,高比例的连接酶分子被腺苷酸化并且在试剂盒中没有提供ATP。在其中试剂盒中的至少一种酶是依赖模板的酶(例如,大肠杆菌DNA连接酶)的一些实施方案中,试剂盒另外包括连接加标签寡核苷酸,所述连接加标签寡核苷酸包含3'部分和5' 部分,其中该3'部分显示标签域的序列,而该5'部分显示由大约三个到大约八个核苷酸构成的随机序列。在一些优选的实施方案中,连接加标签寡核苷酸包括显示由四个核苷酸构成的随机序列的5'部分。在其中试剂盒中的至少一种酶是依赖模板的酶的一些其他的实施方案中,试剂盒另外包括发夹转座子末端组合物。在其中发夹转座子末端组合物具有腺苷酸化的5'端的一些实施方案中,构成试剂盒中提供的依赖模板的核酸连接酶的分子的少于50%被腺苷酸化,并且在试剂盒中没有提供ATP或NAD。在其中试剂盒中的至少一种酶是选自噬菌体TS2U6热稳定的RNA连接酶、Mth Rn 1热稳定的RNA连接酶以及CIRCLIGASE 热稳定的ssDNA连接酶的不依赖模板的连接酶的一些优选的实施方案中,不依赖模板的连接酶以高腺苷酸化形式提供并且在试剂盒中没有提供ATP。在试剂盒的一个优选的实施方案中,转座体包括以如下浓度提供的野生型或高活性Tn5转座酶或MuA转座酶其中体外转座反应中的转座体的终浓度为至少250ηΜ。在一些其他的实施方案中,野生型或高活性Τη5转座体或MuA转座体的终浓度为至少500ηΜ。一个优选的实施方案是使用ΕΖ-Τη5 转座酶和大肠杆菌DNA连接酶产生加标签的环状ssDNA片段的试剂盒,该试剂盒包括(1)Τη5转座酶的野生型或突变形式(例如,ΕΖ-Τη5 转座酶);(2)用于ΕΖ-Τη5转座酶的由显示转移的转座子末端序列的转移链和显示非转移的转座子末端序列的非转移链构成的转座子末端组合物;C3)EZ-Tn5反应缓冲液;以及(4)能够在不存在连接模板的情况下催化ssDNA的分子内连接的不依赖模板的核酸连接酶(例如,选自热噬菌体(therm0phage)TS2U6的RNA连接酶(美国专利第 7,303, 901 号);CIRCLIGASE 热稳定的 ssDNA 连接酶(EPICENTRE Biotechnologies, Madison, WI,USA);以及Mth RNA连接酶1)。在一个优选的实施方案中,试剂盒中的转座酶为Tn5转座酶的野生型形式或突变形式(例如,ΕΖ-Τη5 转座酶),其浓度大于或等于每微升约5单位;每微升约10-20单位;每微升约20-40单位;每微升约40-60单位;每微升约 60-80单位;或者每微升约80-100单位。在包括ΕΖ-Τη5 转座酶和不依赖模板的连接酶的试剂盒的一个优选实施方案中,EZ-Tn5 pMEDS转座子末端组合物包括具有5'-单磷酸基团的EZ-Tn5 pMEDS转移链和具有5'-单磷酸基团的EZ_Tn5 pMENTS非转移链。在一个优选的实施方案中,试剂盒中的转座酶为Tn5转座酶的野生型形式或突变形式(例如,ΕΖ-Τη5 转座酶),其浓度大于或等于每微升约5单位;每微升约10-20单位; 每微升约20-40单位;每微升约40-60单位;每微升约60-80单位;或者每微升约80-100单位。在包括ΕΖ-Τη5 转座酶和不依赖模板的核酸连接酶的试剂盒的一个优选实施方案中, EZ-Tn5 pMEDS转座子末端组合物包括具有5 ‘-单磷酸基团的EZ_Tn5 METS转移链和具有 5'-单磷酸基团的EZ-Tn5 pMENTS非转移链。本发明的方法、组合物和试剂盒可用于从来自任何来源的靶DNA中产生加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段(及其扩增产物),以用于基因组分析、亚基因组分析、或宏基因组分析(例如,用于制备标记的靶以用于微阵列分析;例如,用于拷贝数变异的分析,用于单核苷酸多态性的检测和分析,以及用于从环境样品诸如土壤来源或水来源寻找基因)。这些方法可用于多种过程,包括用于以下的过程扩增一种或多种生物的全基因组(例如,全基因组扩增或WGA),所述生物包括培养条件或生长条件未知的一种或多种微生物或环境生物;实时PCR;乳液PCR;比较基因组杂交(CGH); 比较基因组测序(CGS);以及用于制备供应用如荧光原位杂交(FISH)用的DNA特异性探针 (例如,染色体特异性探针,例如染色体涂料)。在一些实施方案中,这些方法还可用于产生大规模平行的DNA测序(所谓的“下一代测序”)的模板。这些过程或应用中的每一种可用于研究目的和分子诊断目的。发明实施方案详 述本发明的示例性实施方案的详述在以下部分中提供I.使用转座酶和DNA聚合酶使DNA断裂并加双标签III.靶DNA的断裂、加标签和单引物扩增II.使用转座酶和连接酶使DNA断裂并加标签IV.使用转座酶和连接酶从Ds-靶DNA产生加标签的环状Ss-DNA片段V.通过发夹转座子末端组合物的体外转座使Ds-DNA断裂并加标签I.使用转座酶和DNA聚合酶使DNA断裂并加双标签本发明包括使用转座酶从包括一种或多种双链(dsDNA)分子或由一种或多种双链(dsDNA)分子构成的靶DNA中产生5'加标签的片段,然后将显示与第一标签不同的DNA 序列的第二标签与所述5'加标签的DNA片段的3'端接合的方法、组合物和试剂盒。第一标签显示由转座酶识别的转座子末端的转移链的序列,并且任选地还显示所述转移的转座子末端的序列5'-的一种或多种其他序列。使用DNA聚合酶将第二标签与5'加标签的 DNA片段的3'端在体外接合而无需进行PCR扩增反应。本发明的一种方法包括将转座酶和与其在体外转座反应中形成转座复合物的转座子末端与靶DNA在一定条件下孵育并持续足够的时间,其中转移的转座子末端与靶DNA 接合,产生在5'端具有第一标签的5'加标签的DNA片段;将该5'加标签的DNA片段与 DNA聚合酶在DNA聚合条件下孵育足够的时间,所述条件不包括热循环,其中显示不同于第一标签的序列的第二标签与5'加标签的DNA片段的3'端接合,产生5'和3'加标签的 DNA片段。在一些实施方案中,所述方法还包括使用DNA聚合酶和与第二标签互补的至少一种引物扩增5'和3'加标签的DNA片段的步骤。靶DNA可包括来自任何体内或体外来源的双链DNA或由其构成,所述双链DNA诸如基因组DNA、亚基因组DNA、质粒或其他附加体来源的DNA或其中的重组DNA,或通过RNA的反转录制备的双链cDNA。基因组DNA可包括来自生物来源或环境来源的一种或多种基因组或由其构成。因此,本发明的方法、组合物和试剂盒可用于产生5'和3'加标签的DNA片段并且任选地扩增由本领域已知的方法和应用中使用的来自任何来源的靶DNA产生的5'和3'加标签的DNA片段以用于基因组分析、亚基因组分析或宏基因组分析(例如,用于拷贝数变异的分析、单核苷酸多态性或其他方法的基因组分析)。所述方法可用于多种过程,包括但不限于包括培养条件或生长条件未知的一种或多种微生物或环境生物的一种或多种生物的基因组的宏基因组分析,实时PCR,乳液PCR,比较基因组杂交(CGH),比较基因组测序(CGS)。所述方法尤其可用于产生一些大规模平行的DNA测序(所谓的“下一代测序”)类型的模板。使用链置换DNA聚合酶和/或具有5 ‘核酸酶活性的DNA聚合酶产生具有显示不同的转座子末端的序列的5'和3'标签的DNA片段在一些优选的实施方案中,本发明提供了用于从包括一种或多种双链(dsDNA)分子或由其构成的靶DNA中产生包括5'和3'加标签的DNA片段的文库的方法,所述方法包括提供1.包括一种或多种双链(dsDNA)分子(例如,真核和/或原核基因组DNA或通过 RNA的反转录制备的双链cDNA)或由其构成的靶DNA,
2.转座酶(例如,野生型或突变的转座酶;例如野生型或突变的Tn5转座酶,例如,ΕΖ-Τη5 转座酶,或例如 HYPERMU MuA 转座酶,EPICENTRE Biotechnologies,Madison, WI,USA),以及3.在转座反应中能够与该转座酶形成功能复合物的转座子末端(例如,由野生型或突变的Tn5转座酶例如由ΕΖ-Τη5 转座酶识别的19_bp外端(“0E”)转座子末端,内端 (“IE”)转座子末端,或“嵌合端”(“ME”)转座子末端,或者例如由HYPERMU MuA转座酶识别的Rl和R2转座子末端),所述转座子末端包括由转移链和非转移链构成的双链DNA, 所述转移链和非转移链联合显示双链的转座子末端的序列,其中该转移链显示第一标签的序列;以及4. DNA聚合酶,所述DNA聚合酶链置换或消化与由所述DNA聚合酶延伸的DNA分子的3'端下游的模板链退火的DNA(S卩,具有链置换活性和/或5'核酸酶活性的DNA 聚合酶;例如,iTaq DNA聚合酶,Tfl DNA聚合酶,FAILSAFE DNA聚合酶混合物;phU9 DNA聚合酶,大肠杆菌DNA聚合酶I和DISPLACEACE DNA聚合酶,全部可从EPICENTRE Biotechnologies, Madison, WI,USA 商购获得);将靶DNA与转座酶和转座子末端在一定条件下进行孵育并持续足够的时间,其中转座酶催化的转座子末端插入靶DNA的两条链中产生5'加标签的DNA片段,所述5'加标签的DNA片段中的每一个在其5'端上具有第一标签(例如,图2);以及将体外转座反应中产生的5'加标签的DNA片段与DNA聚合酶在一定条件下孵育并持续足够的时间,其中该DNA聚合酶延伸该5'加标签的DNA片段,从而将显示非转移的转座子末端序列的至少一部分的第二标签与该5'加标签的DNA片段接合并产生5'和3' 加标签的DNA片段。在一些优选的实施方案中,转移链只显示转移的转座子末端序列,并且因此,存在于5'加标签的DNA片段中的第一标签只显示转移的转座子末端序列。在一些其他的实施方案中,转移链包括3'部分和5'部分或由其构成,其中该3'部分显示转移的转座子末端的序列,并且该5'部分显示任何其他期望的序列,在所述实施方案中,第一标签包括 3'部分和5'部分或由其构成。在其中转移链包括3'部分和5'部分或由其构成的实施方案中,非转移链可能但不必显示与转移链的5'部分互补的序列。在其中转移链包括3'部分和5'部分或由其构成的一些实施方案中,该5'部分显示测序标签(例如,Roche 454A测序标签;如在例如图10中所图示的),并且该3'部分显示转座子末端的转移链的序列。这产生具有第一标签的5'加标签的DNA片段,所述第一标签包括测序标签(例如,Roche 454A测序标签)或由测序标签构成。然后,DNA聚合酶用于将包括其他测序标签(例如,Roche 454B测序标签)或由其他测序标签构成的第二标签与5 ‘加标签的DNA片段接合,从而产生包含带有两种测序标签(例如,454A和454B ; 如在图10中以示意图显示的)的5'和3'加标签的DNA片段的DNA片段的文库。在期望的大小范围内的5'和3'加标签的DNA片段用作使用Roche妨4基因组测序仪FLX系统的下一代测序的模板。在其他的实施方案中,用适合作为使用任何其他的测序平台的下一代测序的测序标签的第一标签和第二标签产生文库中的5'和3'加标签的DNA片段(例如,使用 ROCHE 454测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0RPolony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BI0SYSTEMS 的测序平台、或 HELIC0S测序平台)。在一些实施方案中,使用一种特定转座酶的多个双链转座子末端或由不同的转座酶识别的多个不同的转座子末端。在其中使用链置换DNA聚合酶或具有5'核酸酶活性的DNA聚合酶的一些优选的实施方案中,两种不同的转座子末端彼此邻近地插入靶DNA的相反链中,然后DNA聚合酶使用相反链作为模板延伸该5'加标签的DNA片段的3'端,从而产生具有在3'端与5'端显示不同的转座子末端序列的标签的5'和3'加标签的DNA 片段(例如,其中第一转座子末端的转移链和第二转座子末端的转移链是不同的并且与靶 DNA的相反链接合(例如,图7))。因此,在一些实施方案中,所述方法另外包括另外提供5.识别与第一转座酶识别的转座子末端(在该实施方案中称为“第一转座酶”识别的“第一转座子末端”)不同的转座子末端的第二转座酶;以及6.能够在转座反应中与该第二转座酶形成功能复合物的第二转座子末端,所述转座子末端包括转移链和非转移链,所述转移链和非转移链联合显示双链的转座子末端的序列,其中转移链显示与第二标签显示的序列互补的序列;以及将靶DNA与第一转座酶和第一转座子末端以及第二转座酶和第二转座子末端在一定条件下孵育并持续足够的时间,其中该第一转座酶和第二转座酶催化的第一转座子末端和第二转座子末端插入靶DNA中产生DNA片段,所述DNA片段中的每一个显示在5 ‘端上的第一转座子末端或第二转座子末端的转移链的序列;以及将5 ‘加标签的DNA片段与DNA聚合酶在DNA聚合条件下孵育并持续足够的时间, 所述条件不包含dsDNA的变性或热循环,其中DNA聚合酶延伸5'加标签的DNA片段的3' 端,从而将第二标签与5'加标签的DNA片段接合并产生加标签的DNA片段(例如,5'和 3'加标签的DNA片段)的文库而无需进行扩增反应。在一些实施方案中,所述方法包括在同一反应混合物中将靶DNA与第一转座酶和第一转座子末端寡核苷酸以及第二转座酶和第二转座子末端寡核苷酸同时孵育。在一些其他的实施方案中,所述方法通过如下方式按顺序进行首先将靶DNA与第一转座酶和第一转座子末端寡核苷酸孵育,然后将来自该反应的产物与第二转座酶和第二转座子末端寡核苷酸孵育。在其中所述方法按顺序进行的一些实施方案中,在将来自靶DNA与第一转座酶和第一转座子末端寡核苷酸的反应的产物与第二转座酶和第二转座子末端寡核苷酸孵育之前,将这些产物纯化。在其中转移链包括3'部分和5'部分或者由其构成的方法的一些实施方案中, 该5'部分显示测序标签(例如,第一 Roche妨4测序标签,例如,Roche 454A)的序列并且该3'部分显示转座子末端的转移链的序列。如本文所用的“测序标签”表示与从靶DNA分子中产生的单链DNA片段的5'端或3'端接合的标签,所述标签为了促进所述DNA片段的测序的目的。例如,在一些实施方案中,测序标签提供了用于在表面上捕获所述DNA片段链和/或用于引发所述DNA片段和/或所述DNA片段的互补序列的DNA合成的位点(例如, 使用Roche妨4基因组测序仪FLX系统的Roche 454A和454B测序标签)。因此,当转移链的5'部分显示测序标签的序列时,5'加标签的DNA片段具有包括该测序标签(例如,Roche 454测序标签)或由该测序标签构成的第一标签。然后,DNA聚合酶将包括第二测序标签(例如,Roche 454B测序标签)或由第二测序标签构成的第二标签与5'加标签的DNA 片段接合,从而产生每端带有测序标签(例如,454A和454B测序标签)的5'和3'加标签的DNA片段的文库。在期望的大小范围内的文库内的5'和3'加标签的DNA片段用作使用Roche 454基因组测序仪FLX系统的下一代测序的模板。在其他的实施方案中,用为下一代测序的测序标签的第一标签和第二标签产生5'和3'加标签的DNA片段,所述下一代测序使用其他的测序平台(例如,使用ROCHE 454测序平台、ILLUMINA S0LEXA 测序平台、 LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony测序平台、COMPLETE GENOMICS测序平台、INTELLIGENT BIOSYSTEMS的测序平台、或HELIC0S测序平台)。
在一些实施方案中,不同的双链转座子末端的每一个都包含具有5'部分和3' 部分的不同的转移链,其中每个不同的转移链的5'部分显示不同的期望的标签序列并且该3'部分显示相应的转移的转座子末端序列。在一些实施方案中,例如,在图8提供的一个实例中所显示的,文库中的5'和3'加标签的DNA片段具有在其5'端中的第一标签和在其3'端中的第二标签。图8中显示的不同的转座子末端已在由同一转座酶催化的分别的体外转座事件过程中被插入在不同的位置中。然而,在一些其他的实施方案中, 使用与不同的转座子末端形成功能转座复合物的不同的转座酶。在每个转座子末端的转移链的5'部分中的不同标签能够显示用于任何期望目的的任何期望的序列。通过举例, 在一些实施方案中,5'和3'加标签的DNA片段的第一标签和第二标签显示Roche 454A 和Roche 454B测序标签的序列,并且在分离处于期望的大小范围内的片段后,被用作使用Roche 454基因组测序仪FLX系统的下一代的模板。类似地,在其他的实施方案中,5 ‘ 和3'加标签的DNA片段,在分离处于期望大小范围内的那些片段后,被用作使用另一测序平台的下一代的模板(例如,使用ROCHE 454测序平台、ILLUMINA S0LEXA 测序平台、 LIFE TECHNOLOGIES/APPLIED BIOSYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony测序平台、COMPLETE GENOMICS测序平台、INTELLIGENT BIOSYSTEMS的测序平台、或HELIC0S测序平台)。在一些优选的实施方案中,使用这种方法从包括细胞或生物的全基因组的靶DNA中产生5'和3'加标签的DNA片段。在一些实施方案中,用亲和性结合分子(例如,生物素)或用可检测的分子(例如,荧光染料)对第一转座子末端或第二转座子末端的转移链进行标记,所述亲和性结合分子或可检测的分子允许对5'端具有标签的DNA片段进行捕获(例如,使用抗生蛋白链菌素结合的表面捕获生物素化的分子)或检测,所述标签带有亲和性结合分子或可检测的分子。添加标签域至5'和3'加标签的DNA片段在一些实施方案中,使用DNA聚合酶和包括标签域的模板的寡核苷酸来添加标签域至加标签的DNA片段的文库中的5'和3' 加标签的DNA片段的3'端(例如,图19)。在一些实施方案中,用于添加标签域的DNA聚合酶是热稳定的DNA聚合酶并且寡核苷酸是PCR引物,并且通过进行PCR将标签域与第二标签接合。III.靶DNA的断裂、加标签和单引物扩增本发明的一种优选的方法包括在体外转座反应中将由转座酶和与其形成转座复合物的转座子末端构成的转座体复合物与靶DNA在一定条件下孵育并持续足够的时间,其中转移的转座子末端插入靶DNA的两条链中的多个位点;将该体外转座反应的产物与具有链置换活性和/或5'核酸酶活性的DNA聚合酶在一定条件下孵育并持续足够的时间,其中使用靶DNA的相反链作为模板延伸具有接合其5'端的转移的转座子末端的靶DNA的每条链的3'端,其中每次所述DNA聚合酶催化的延伸置换或消化与接合靶DNA的相反链的下一个相邻的转移的转座子末端退火的非转移的转座子末端,从而产生加双标签的DNA片段的文库,所述加双标签的DNA片段各自包含具有在其5'端上的转移链和在其3'端上的非转移链的靶DNA的不同部分,其中所有的加双标签的DNA片段的群体基本上代表从中产生它们的靶DNA的序列;并且将加双标签的DNA片段的文库与热稳定的DNA聚合酶以及显示转移的转座子末端序列的至少一部分的单引物在PCR热循环条件下孵育,从而产生加双标签的DNA片段的扩增文库。在一些优选的实施方案中,所述方法包括在存在用作热稳定的DNA 聚合酶的底物的一种或多种标记的dNTP的条件下产生加双标签的DNA片段的扩增文库,从而产生标记的加双标签的DNA片段的扩增文库。因此,本发明的一个实施方案是用于从靶DNA产生的DNA片段的单引物扩增的体外方法,所述方法包括在存在靶DNA的情况下以及在存在由显示转移的转座子末端序列的转移链和显示非转移的转座子末端序列的非转移链构成的转座子末端的情况下进行转座反应,所述转座反应导致包括使该转移的转座子末端与靶DNA的每条链接合的多次插入,从而产生对彼此退火的5'加标签的DNA片段,这些片段中的每一个在其5'端具有显示转移的转座子末端序列的第一标签;用具有链置换活性和/或5'核酸酶活性的DNA聚合酶延伸5'加标签的DNA片段的3'端,所述DNA聚合酶利用与5'加标签的DNA片段退火的相反链作为模板;并且使用显示转移的转座子末端序列的至少一部分的单引物、热稳定的DNA聚合酶以及用作该热稳定的DNA聚合酶的底物的至少一种标记的dNTP进行PCR 扩增反应,从而产生代表靶DNA的加双标签的DNA片段的扩增文库。在一些优选的实施方案中,靶DNA选自真核和/或原核的基因组DNA或通过RNA 的反转录制备的双链cDNA。在一些优选的实施方案中,转座体是选自以下的转座酶的野生型或高活性突变形式和与该转座酶形成在转座反应中有活性的复合物的转座子末端的复合物Tn5转座酶、 MuA转座酶、睡美人转座酶、Mariner转座酶、Tn7转座酶、TnlO转座酶、Tyl转座酶和Τη552 转座酶。在一些优选的实施方案中,单种酶或酶混合物用作具有链置换和5'核酸酶活性的DNA聚合酶和热稳定的DNA聚合酶,所述DNA聚合酶或混合物选自TAQ DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶和FAILSAFE DNA聚合酶混合物的野生型或重组形式。在一些优选的实施方案中,至少一种标记的dNTP包括如下标记例如,花菁(例如,Cy5. 5、Cy5、Cy3、Cy2),FITC,Alexa Fluor (例如,647、594),德克萨斯红,J0E,5_FAM, 6-FAM,VIC, HEX,6-R0X,罗丹明,丽丝胺,Cyan 500,等等(参见,例如,通过引用并入本文的 Handbook of Molecular Probes (分子探针手册),R. Haughland, Molecular Probe, Eugene, OR.)。在一些优选的实施方案中,使用这种方法产生的5'和3'加标签的DNA片段的文库或扩增文库来自包括细胞或生物的全基因组或由细胞或生物的全基因组构成的靶DNA。在一些实施方案中,使用这种方法产生的加双标签的DNA片段的文库或扩增文库来自如下靶DNA 所述靶DNA包括来自存在于环境样品(例如,用于宏基因组或宏转录组的研究或应用)中的所有生物(例如,多种生物)的基因组和/或双链cDNA或由其构成。在所述方法的一些优选的实施方案中,转移链只显示转移的转座子末端序列,并且因此,存在于5'加标签的DNA片段中的第一标签只显示转移的转座子末端序列。在一些其他的实施方案中,转移链包括3'部分和5'部分或由其构成,其中该3'部分显示转移的转座子末端序列,并且该5'部分显示任何其他期望的核苷酸或核苷酸序列,在所述实施方案中,第一标签包括3'部分和5'部分或由其构成。在其中转移链包括3'部分和5' 部分或由其构成的实施方案中,非转移链可能但不必显示与转移链的5'部分互补的序列。 在其中转移链包括3'部分和5'部分或由其构成的一些优选的实施方案中,该5'部分显示包括捕获域的至少一种核苷酸(例如,包括可被结合于表面的抗生蛋白链菌素部分捕获的生物素部分的核苷酸;或者,例如,另一亲和性结合分子)。II.使用转座酶和连接酶使DNA断裂并加标签本发明包括使用转座酶从包括一种或多种双链(dsDNA)分子或由一种或多种双链(dsDNA)分子构成的靶DNA中产生5'加标签的片段,然后将显示与第一标签不同的DNA 序列的第二标签与所述5'加标签的DNA片段的3'端接合的方法、组合物和试剂盒。第一标签显示由转座酶识别的转座子末端的转移链的序列,并且任选地还显示为所述转移的转座子末端的序列的5'-的一种或多种其他序列。使用核酸连接酶将第二标签与5'加标签的DNA片段的3'端在体外接合。本发明的一种方法包括将转座酶和与其在体外转座反应中形成转座复合物的转座子末端与靶DNA在一定条件下孵育并持续足够的时间,其中转移的转座子末端与靶DNA 接合,产生在5'端具有第一标签的5'加标签的DNA片段;将该5'加标签的DNA片段与核酸连接酶以及包括第二标签或由第二标签构成的连接加标签寡核苷酸在一定条件下孵育并持续足够的时间,其中该连接加标签寡核苷酸与5'加标签的DNA片段的3'端接合,产生5'和3'加标签的DNA片段的文库。在一些实施方案中,所述方法还包括使用DNA聚合酶和与第二标签互补的至少一种引物扩增5'和3'加标签的DNA片段的文库的步骤。在一些实施方案中,使用DNA聚合酶扩增5'和3'加标签的DNA片段的文库的步骤包括使用热稳定的DNA聚合酶、与第二标签互补的第一 PCR引物以及显示与第一标签显示的序列的至少一部分相同的序列的第二 PCR引物的PCR扩增。本发明的一个优选的实施方案是用于从包括一种或多种双链(dsDNA)分子或由其构成的靶DNA中产生包括5'和3'加标签的DNA片段的加标签的DNA片段的文库的方法,所述方法包括提供1.包括一种或多种双链(dsDNA)分子(例如,真核和/或原核基因组DNA或通过 RNA的反转录制备的双链cDNA)或由其构成的靶DNA,2.转座酶(例如,野生型或突变的转座酶;例如野生型或突变的Tn5转座酶,例如,ΕΖ-Τη5 转座酶,或例如 HYPERMU MuA 转座酶,EPICENTRE Biotechnologies,Madison, WI,USA),以及3.在转座反应中能够与该转座酶形成功能复合物的转座子末端(例如,由野生型或突变的Tn5转座酶例如由ΕΖ-Τη5 转座酶识别的19_bp外端(“0E”)转座子末端,内端(“IE”)转座子末端,或“嵌合端”(“ME”)转座子末端,或者例如由HYPERMU MuA转座酶识别的Rl和R2转座子末端),所述转座子末端包括由转移链和非转移链构成的双链DNA, 所述转移链和非转移链联合显示双链的转座子末端的序列,其中该转移链显示第一标签的序列,4.具有能够与DNA分子的3'羟基连接的5'端并显示第二标签的序列的连接加标签寡核苷酸,以及5.核酸连接酶;将靶DNA与转座酶和转座子末端在一定条件下孵育并持续足够的时间,其中转座酶催化的转座子末端插入靶DNA中产生5'加标签的DNA片段,所述5'加标签的DNA片段中的每一个在其5 ’端上具有第一标签;以及将该5 ‘加标签的DNA片段与核酸连接酶和连接加标签寡核苷酸在一定条件下孵育并持续足够的时间,其中该第二标签与5'加标签的DNA片段的3'端接合并产生5'和 3'加标签的DNA片段的文库,这些加标签的DNA片段中的每一个具有其5'端上的第一标签以及其3'端上的第二标签。在一些优选的实施方案中,转移链只显示转移的转座子末端序列,并且因此,存在于加标签的DNA片段中的第一标签只显示转移的转座子末端序列。在一些其他的实施方案中,转移链包括3'部分和5'部分或由其构成,其中该3'部分显示转移的转座子末端序列,并且该5'部分显示任何其他期望的序列,在所述实施方案中,第一标签包括3'部分和5'部分或由其构成。在其中转移链包括3'部分和5'部分或由其构成的实施方案中, 非转移链可能但不必显示与转移链的5'部分互补的序列。在一些实施方案中,其中转移链包括3'部分和5'部分或者由其构成,该5'部分显示测序标签(例如,第一 Roche妨4测序标签,例如,Roche 454A)的序列并且该3'部分显示转座子末端的转移链的序列。如本文所用的“测序标签”表示与从靶DNA分子中产生的单链DNA片段的5'端或3'端接合的标签,所述标签为了促进所述DNA片段的测序的目的。例如,在一些实施方案中,测序标签提供了用于在表面上捕获所述DNA片段链和/或用于引发所述DNA片段或所述DNA片段的互补序列的DNA合成的位点(例如,使用Roche 454 基因组测序仪FLX系统的Roche 454A和454B测序标签)。因此,当转移链的5'部分显示测序标签的序列时,5'加标签的DNA片段具有包括该测序标签(例如,Roche 4 测序标签)或由该测序标签构成的第一标签。然后,核酸连接酶将具有包括第二测序标签(例如, Roche 454B测序标签)或由第二测序标签构成的第二标签的连接加标签寡核苷酸与5'加标签的DNA片段连接,从而产生每端带有测序标签(例如,454A和Roche 454B测序标签) 的5'和3'加标签的DNA片段的文库。产生具有期望的大小范围的5'和3'加标签的 DNA片段用作使用Roche 4 基因组测序仪FLX系统的下一代测序的模板。在其他的实施方案中,产生了包括一定大小的加标签的DNA片段并且带有适合作为下一代测序的测序标签的第一标签和第二标签的5'和3'加标签的DNA片段,所述下一代测序使用另一种测序平台(例如,使用ROCHE妨4测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/ APPLIED BI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、 P0LL0NAT0R Polony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BI0SYSTEMS 的测序平台、或HELIC0S测序平台)。
第二标签的依赖模板的连接在一些优选的实施方案中,所述方法包括提供包括3'部分和5'部分或由其构成的连接加标签寡核苷酸,其中该3'部分显示第二标签并且该5'部分具有5'-单磷酸基团并在其5'端显示随机序列(例如,由大约三个到大约八个核苷酸构成的随机序列), 所述第二标签包括期望与5'加标签的DNA片段的3'端接合的任何序列(即任意序列) 或由其构成。在一些优选的实施方案中,连接加标签寡核苷酸具有显示四个核苷酸的随机序列的5'部分(例如,在本文所述的其中转座酶是野生型或突变的Tn5转座酶(例如, ΕΖ-Τη5 转座酶,或例如,HYPERMU MuA 转座酶,EPICENTRE Biotechnologies, Madison, WI, USA)并且核酸连接酶是大肠杆菌DNA连接酶的一些实施方案中)。本发明不限于具有显示由大约三个到大约八个核苷酸构成的随机序列的5'部分的连接加标签寡核苷酸。例如,本发明还包括其中连接加标签寡核苷酸具有以下5'部分的方法显示只由两个核苷酸构成的随机序列;显示由大于八个核苷酸构成的随机序列;显示半随机序列而不是完全随机序列;或者显示包括一个或多个简并核苷酸(例如,肌苷核苷酸)的序列而不是完全随机序列。然而,具有显示由大约三个到大约八个核苷酸构成的随机序列的5'部分的连接加标签寡核苷酸是优选的。在一些优选的实施方案中,连接加标签寡核苷酸与5'加标签的DNA片段的3' 端的连接只发生在存在DNA模板的情况下,所述DNA模板显示与连接接点精确互补的序列;在这些实施方案中,与被连接的两个核酸分子退火的模板在本文称为“连接模板”并且该连接称为“依赖模板的连接”。在其中连接只发生在存在连接模板的情况下的一些实施方案中,核酸连接酶为需要连接模板的DNA连接酶,并且在本文被称为“依赖模板的连接酶”(例如,NAD型依赖模板的DNA连接酶,诸如但不限于大肠杆菌DNA连接酶、Tth DNA连接酶、Tfl DNA连接酶、或AMPLIGASE, DNA连接酶,它们可从EPICENTRE Biotechnologies, MadiSOn,WI,USA商购获得)。在其中连接只发生在存在连接模板的情况下的一些其他的实施方案中,核酸连接酶为以下DNA连接酶,尽管该DNA连接酶不需要用于连接的连接模板, 但它在存在连接模板时比不存在连接模板时更有效地催化连接(例如,ATP型依赖模板的 DNA连接酶,诸如但不限于T4 DNA连接酶或FASTLINK DNA连接酶,它们可从EPICENTRE Biotechnologies, Madison, WI, USA商购获得)。如果连接发生在连接模板上,那么连接在本文被称为“依赖模板的连接”,即使该连接酶还可以催化不依赖模板的连接。在优选的实施方案中,连接加标签寡核苷酸的随机序列是短的,在这些实施方案中,在较低温度(例如,小于或等于大约40°C、小于或等于大约37°C、小于或等于大约30°C、小于或等于大约 25°C、或小于或等于大约20°C)催化依赖模板的连接酶的核酸是优选的。在一些优选的实施方案中,依赖模板的连接酶是大肠杆菌DNA连接酶。就所用的连接方法而言本发明不受限制,只是就包括依赖模板的连接的实施方案而言,连接应该在存在与连接加标签寡核苷酸和5'加标签的DNA片段连续地退火的靶序列的情况下有效地发生,并且连接在不存在靶序列的情况下应很少发生或根本不应发生。 如本文所用,“依赖模板的连接”是指用于分别接合连接加标签的寡核苷酸以及5'加标签的DNA片段的相邻5'端和3'端的任何适合的方法,这些片段当与靶序列退火时相邻或邻接或彼此接近。转座酶催化的转座子末端插入靶DNA的两条链中导致靶DNA的断裂、转移的转座子末端与靶DNA的每条链的接合、以及转移的转座子末端的接合的位点3'的单链靶DNA 的9碱基区域的产生,所述9碱基区域的产生造成靶DNA相反链中的缺口区域(例如,图 3)。转移的转座子末端下游的靶DNA的单链区域可充当用于使连接加标签寡核苷酸的随机部分退火的连接模板。在由5'中显示随机序列的连接加标签寡核苷酸所代表的所有序列 (其包括所有可能的序列)中,它们中的至少一个在其5'端显示能够与靶DNA中的每个单链区域退火的序列,以使得连接加标签寡核苷酸的5'磷酸化末端与互补于5'加标签的 DNA片段的靶DNA的3 ‘端相邻和接近,在这种情况下,核酸连接酶之后可催化连接加标签寡核苷酸与所述3'端的依赖模板的连接。在一些实施方案中,转座子末端的转移链在相对接近的两个位置被插入靶DNA的相反链中,产生如图2所示的两个5'加标签的DNA片段以及如图7所示的两个5'和3'加标签的DNA片段。在这两个5'和3'加标签的DNA 片段变性后,它们可用于多种应用,包括用于扩增(例如,通过使用与第二标签互补的第一 PCR引物和与第一标签互补的第二 PCR引物的PCR)。在包括使用核酸连接酶和依赖模板的连接使第二标签与5'加标签的DNA片段接合的方法的一些实施方案中,5'和3'加标签的DNA片段包括显示转座子末端序列的 5'第一标签和不显示转座子末端序列的3'第二标签(尽管连接加标签寡核苷酸的3' 部分可包括第二标签或由第二标签构成,所述第二标签显示任何期望的序列,如果期望的话,包括转座子末端序列)。例如,在一些实施方案中,连接加标签寡核苷酸的3'部分显示 Roche 454测序标签的序列或用于另一种测序平台的测序标签的序列(例如,使用ROCHE 454 测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BIOSYSTEMS 的测序平台、或 HELIC0S 测序平台)。通过另外的实例,在一些实施方案中,连接加标签寡核苷酸的3'部分中的第二标签显示RNA聚合酶启动子(例如,T7型RNA聚合酶启动子;例如,T7、T3、SP6或噬菌体N4 MINI-V RNA 聚合酶启动子;EPICENTRE Biotechnologies, Madison, WI, USA)的序列;一般地,如果RNA聚合酶需要双链RNA聚合酶启动子,这些实施方案中的第二标签显示“正义 RNA聚合酶启动子序列”,表示与由RNA聚合酶转录的模板DNA链的3 ‘端接合的RNA聚合酶启动子的序列,在这些实施方案中,互补的“反义RNA聚合酶启动子序列”还必须在方法的步骤过程中提供或合成,以产生将由RNA聚合酶识别的双链RNA聚合酶启动子。在一些实施方案中,连接加标签寡核苷酸的3'部分中的第二标签也显示“地址标签”的序列,表示允许识别特异性样品的序列(例如,通过使用显示对每个靶DNA样品不同的序列的连接加标签寡核苷酸中的地址标签)。在一些实施方案中,连接加标签寡核苷酸的3'部分还显示所述方法中用于特定目的的一种或多种其他标签的序列。在一些优选的实施方案中,连接加标签寡核苷酸的5'部分是能够与5'加标签的DNA片段的单链部分退火的一定长度的随机序列,所述5'加标签的DNA片段由转座酶催化的转座子末端插入靶DNA的两条链中而产生。在连接加标签寡核苷酸的5'部分中的随机序列与相邻于5'加标签的DNA片段的3'端的这种单链缺口区域退火,该随机序列充当进行连接加标签寡核苷酸与靶DNA的互补链的3'端的依赖模板的连接的连接模板。在使用EZ-Tn5 转座酶的实施方案中,19-bp EZ-Tn5 转座子末端寡核苷酸插入到靶DNA的两条链中产生显示9碱基缺口的5 ‘加标签的DNA片段,所述9碱基缺口由与转移的转座子末端插入位点相反的单链区域构成。然而,其中连接加标签寡核苷酸可与之退火的缺口的大小对于不同的转座酶而言是可变的。例如,MuA转座酶产生只有五个核苷酸的在转移的转座子末端的插入位点下游的靶DNA的单链区域。在一些实施方案中,连接加标签寡核苷酸的随机序列包括大约三个至大约八个随机核苷酸或由大约三个至大约八个随机核苷酸构成。然而,根据所产生的单链区域的大小和其他因素,诸如与相应核酸连接酶最有效连接的随机序列的长度和使用的连接条件,连接加标签寡核苷酸的随机序列部分的长度对于不同的转座酶来说可以是不同的。例如,申请人观察到,使用用EZ-Tn5 转座酶产生的5'加标签的DNA片段,具有由四个核苷酸的随机序列构成的5'部分的连接加标签的寡核苷酸用大肠杆菌DNA连接酶作为核酸连接酶产生良好产率的5'和3'加标签的DNA片段。然而, 具有由四个核苷酸的随机序列构成的5'部分的这种连接加标签的寡核苷酸在类似连接条件下没有被热稳定的依赖DNA的连接酶诸如AMPLIGASE 热稳定的连接酶有效连接。在优选的实施方案中,5'和3'加标签的DNA片段包括从DNA样品产生的所有DNA片段或由其构成。在一些实施方案中,用于依赖模板的连接的核酸连接酶是使用NAD作为辅因子的连接酶。在一些实施方案中,用于依赖模板的连接的核酸连接酶选自以下NAD型DNA连接酶大肠杆菌DNA连接酶、Tth DNA连接酶、TflDNA连接酶和Ampligase DNA连接酶 (全部购自 EPICENTRE Biotechnologies, Madison, WI, USA)以及 Tsc DNA 连接酶(Roche Applied Systems, Indianapolis, IN, USA)。在一些实施方案中,用于依赖模板的连接的核酸连接酶是ATP型DNA连接酶。在一些实施方案中,ATP型DNA连接酶选自T4 DNA连接酶和 FASTLINK DNA 连接酶(EPICENTRE Biotechnologies,Madison,WI,USA)。在一些优选的实施方案中,核酸连接酶选自大肠杆菌DNA连接酶或利用NAD作为辅因子的另一种嗜常温细菌DNA连接酶。在一些优选的实施方案中,对大小选择的5'加标签的DNA片段进行大小选择和纯化以改善使用依赖DNA模板的DNA连接酶(例如,大肠杆菌DNA连接酶)将连接加标签寡核苷酸与5'加标签的DNA片段连接的效率。第二标签的不依赖模板的连接在包括使用核酸连接酶使第二标签与5'加标签的DNA片段的3'端接合的方法的一些实施方案中,将显示第二标签的连接加标签寡核苷酸直接与5'加标签的DNA片段的3'端连接而无需使连接加标签寡核苷酸与相邻于5'加标签的DNA片段的3'端的连接模板退火。在这些实施方案中,连接加标签寡核苷酸不显示随机序列,而是只显示期望与5'加标签的DNA片段接合的第二标签的序列。在这些实施方案中,将连接加标签寡核苷酸直接与单链的5'加标签的DNA片段的3'端连接而不使用连接模板。在所述方法的这些实施方案中,核酸连接酶是能够在不存在与连接接点处的互补序列退火的情况下连接具有3'羟基基团的单链DNA分子与具有5'-单磷酸基团的单链DNA分子的核酸连接酶 (例如,选择T4 RNA连接酶1,T4 RNA连接酶2,噬菌体TS2U6热稳定的RNA连接酶,以及 CIRCLIGASE DNA 连接酶,EPICENTRE Biotechnologies, Madison, WI, USA);并且所述方法另外包括如下步骤使包括5'加标签的DNA片段的dsDNA变性,之后将该5'加标签的DNA 片段与核酸连接酶和连接加标签寡核苷酸孵育。本发明不限于特定的核酸连接酶,并且将理解包括将5'加标签的DNA片段与核酸连接酶在其中将第二标签与5'加标签的DNA片段的3'端接合并产生5'和3'加标签的DNA片段的文库的条件下孵育并持续足够的时间的方法还包括使用其他组合物代替核酸连接酶以用于依赖模板或不依赖模板的接合。通过举例,可使用其他连接方法,诸如但不限于包括拓扑异构酶部分的连接加标签寡核苷酸的使用,其中连接包括拓扑异构酶介导的连接(例如,通过引用并入本文的美国专利第5,766,891号),尽管拓扑异构酶介导的连接在大多数实施方案中不是优选的。IV.使用转座酶和连接酶从Ds-靶DNA产生加标签的环状&-DNA片段(30842)本发明包括用于从样品中的靶DNA产生包括加标签的环状ssDNA片段的群体的文库以用作DNA测序或核酸扩增反应中的模板的方法、组合物和试剂盒。一般地,文库中的每个加标签的环状ssDNA片段显示靶DNA的一部分的连续序列和标签的连续序列。简言之,在某些实施方案中,所述方法包括将一般为dsDNA的靶DNA与转座酶和转座子末端组合物在体外转座反应中孵育以使该靶DNA同时断裂并加标签,从而产生加标签的DNA片段的群体;然后使该加标签的DNA片段变性以产生5'加标签的ssDNA片段, 然后将该5'加标签的ssDNA片段与能够催化ssDNA的不依赖模板的分子内连接(即,环化)的不依赖模板的核酸连接酶或非同源的核酸连接酶孵育以产生加标签的环状ssDNA片段的文库。在一些实施方案中,通过如下方式使加标签的环状ssDNA片段线性化使与标签内的限制性位点退火的寡脱氧核糖核苷酸退火,然后用限制性内切核酸酶处理以产生在 5'端上具有标签的一部分并且在3'端上具有标签的剩余部分的线性ssDNA片段(这些线性ssDNA片段在本文被称为“加双标签的线性ssDNA片段”或简称为“加双标签的ssDNA 片段”)。在一些实施方案中,加标签的环状ssDNA片段或加双标签的线性ssDNA片段用作核酸扩增和/或DNA测序反应中的DNA模板。在一些实施方案中,所述方法还包括对加标签的环状ssDNA片段进行扩增和/或测序的步骤(例如,来扩增或确定靶DNA的序列)。在一些实施方案中,所述方法还包括对通过扩增加标签的环状ssDNA片段或加双标签的线性 ssDNA片段获得的与靶DNA互补的DNA进行测序的步骤。在一些实施方案中,使用DNA聚合酶和与标签互补的至少一种引物对加标签的环状ssDNA片段或加双标签的线性ssDNA片段的每一个中的靶DNA的至少一部分进行测序(例如,通过合成测序)。在一些实施方案中,使用依赖模板的连接酶连接与标签互补的至少一种寡脱氧核糖核苷酸和与靶序列的部分退火的至少另一种寡脱氧核糖核苷酸,对加标签的环状ssDNA片段或加双标签的线性ssDNA 片段中的每一个中的靶DNA的至少一部分进行测序(例如,通过连接测序)。在一些实施方案中,通过使与标签以及与靶序列的一部分退火或杂交的寡脱氧核糖核苷酸退火,对加标签的环状ssDNA片段或加双标签的线性ssDNA片段的每一个中的靶DNA的至少一部分进行测序(例如,通过杂交测序)。在一些实施方案中,利用通过合成测序、通过连接测序、或通过杂交测序,对与加标签的环状ssDNA片段或加双标签的线性ssDNA片段互补的DNA进行测序。因此,本发明的一个优选的实施方案是用于从样品中的靶DNA产生包括加标签的环状ssDNA片段的群体的文库用作DNA测序或核酸扩增反应中的模板的方法,所述加标签的环状ssDNA片段的每一个显示靶DNA的部分的序列以及与该靶序列的部分接合的标签的序列,所述方法包括
提供1.包括一种或多种双链(dsDNA)分子(例如,真核和/或原核基因组DNA或通过 RNA的反转录制备的双链cDNA,所述RNA的反转录利用依赖RNA的DNA聚合酶或反转录酶产生第一链cDNA,然后延伸与该第一链cDNA退火的引物以产生dsDNA)或由其构成的靶DNA,2.转座酶(例如,野生型或突变的转座酶;例如野生型或突变的Tn5转座酶,例如,ΕΖ-Τη5 转座酶,例如 HYPERMU MuA 转座酶,EPICENTRE Biotechnologies, Madison, WI,USA),以及3.在转座反应中能够与该转座酶形成功能复合物的转座子末端组合物(例如,包括由野生型或突变的Tn5转座酶例如由EZ-Tn5 转座酶识别的19_bp外端(“0E”)转座子末端,19-bp内端(“IE”)转座子末端,或19-bp “嵌合端”(“ME”)转座子末端或由其构成),所述转座子末端组合物包括转移链和非转移链或由其构成,所述转移链和非转移链联合显示双链的转座子末端的序列,其中该转移链显示标签的序列,4.能够对具有5'-单磷酸和3'-羟基基团的ssDNA进行不依赖模板的分子内连接或环化的不依赖模板的或非同源的核酸连接酶(例如,噬菌体TS2126热稳定的RNA连接酶,例如,其中高比例的RNA连接酶分子被腺苷酸化);将靶DNA与转座酶和转座子末端组合物在一定条件下孵育并持续足够的时间,其中转座酶催化的转移链插入靶DNA中产生5'加标签的DNA片段(例如,图2);以及使包括5'加标签的DNA片段的靶DNA变性以获得5'加标签的ssDNA片段;以及将5'加标签的ssDNA片段与核酸连接酶在一定条件下孵育并持续足够的时间, 其中该5'加标签的ssDNA片段被分子内连接以产生加标签的环状ssDNA片段的文库,所述加标签的环状ssDNA片段的每一个显示靶DNA的一部分的序列和标签的序列。在一些实施方案中,在连接步骤之前,所述方法另外包括除去在转座反应过程中未加标签的靶DNA和/或除去未与靶DNA接合的转座子末端组合物的组分的一个或多个步马聚ο在一些实施方案中,所述方法另外包括用外切核酸酶I处理包含加标签的环状 ssDNA片段的文库以除去未连接的线性ssDNA。在一些实施方案中,所述方法另外包括用外切核酸酶I和外切核酸酶III (EPICENTRE Biotechnologies,Madison, WI)处理反应混合物以除去未连接的线性ssDNA的步骤。外切核酸酶III通过消化从分子内退火或分子间退火产生的线性ssDNA分子的双链区域帮助除去一些线性ssDNA。在一些优选的实施方案中,所述方法另外包括用T5外切核酸酶(EPICENTRE Biotechnologies,Madison, WI)处理加标签的环状ssDNA片段的文库以除去未连接的线性ssDNA和dsDNA (例如,有切口的和/或包含单链区域的DNA片段)。在一些实施方案中,所述方法还包括通过转录扩增加标签的环状ssDNA片段或加双标签的线性ssDNA片段,所述方法包括(a)使显示互补的反义启动子序列的寡脱氧核糖核苷酸与正义启动子序列退火,或者使加标签的环状ssDNA片段或加双标签的线性ssDNA 片段和与其互补的引物退火,并且在其中合成双链的RNA聚合酶启动子的条件下用DNA聚合酶延伸该引物;以及(b)将dsDNA产物与结合RNA聚合酶启动子的RNA聚合酶在其中合成RNA的条件下孵育。在其中转移链或PCR引物显示RNA聚合酶启动子序列的一些优选的实施方案中,该RNA聚合酶启动子是T7型RNA聚合酶启动子并且所述方法还包括使用识别该启动子的 T7型RNA聚合酶在体外转录加标签的环状ssDNA片段的步骤。更优选地,从T7 RNAP, T3 RNAP和SP6 RNAP以及对应的同源启动子中选择RNA聚合酶和启动子。然而,本发明的方法的转录步骤可使用如下任何RNAP 对于所述RNAP而言允许具有高特异性的转录的适合的启动子序列是已知的或者可被获得。用于体外转录的试剂盒和酶从许多卖家可商购获得并且用于执行包括体外转录的本发明的步骤的适当的反应混合物和条件可按制造商所述使用那些产品。例如,使用T7 RNAP的体外转录可按照产品资料所述使用来自EPICENTRE Biotechnologies, Madison, WI 的 AMPLISCRIBE T7-FLASH 转录试剂盒或 AMPLISCRIBE T7高产量转录试剂盒。类似地,如果Τ3 RNAP或SP6 RNAP在本发明的方法中用于体外转录,那么AMPLISCRIBE T3-FLASH 高产量转录试剂盒或AMPLISCRIBE SP6高产量转录试剂盒(EPICENTRE Biotechnologies, Madison, WI)分别可按照所述使用。在一些实施方案中,转移链、连接加标签寡核苷酸或PCR引物除了 RNA聚合酶启动子序列以外还显示用于翻译的另外序列,诸如但不限于核糖体结合位点和翻译起始密码子 (也称为“翻译起始信号”),并且所述方法另外包括翻译转录的RNA。在这些实施方案中的一些实施方案中,所述方法还包括体外翻译得到的RNA转录本的步骤。用于RNA转录本的体外翻译的系统和试剂盒也可以从许多来源商购获得并且可用于本发明。例如,来自Promega Corporation,Madison, WI的兔网织红细胞裂解物、小麦胚芽提取物和大肠杆菌S30提取物系统可用于本发明。更进一步,体外转录和体外翻译偶联的试剂盒也可以商购获得并且可被使用,诸如来自Promega的TNT⑧快速偶联的转录/翻译系统。在一些其他的实施方案中,所述方法还包括使用DNA聚合酶和与标签互补的至少一种引物对加标签的环状ssDNA片段中的靶DNA进行扩增和/或测序的步骤。在一些实施方案中,使用DNA聚合酶扩增加标签的环状ssDNA片段的步骤包括滚环复制。在一些实施方案中,使用DNA聚合酶扩增加标签的环状ssDNA片段的步骤包括使用热稳定的DNA聚合酶以及与标签的至少一部分互补的第一 PCR引物和与标签的互补序列的至少一部分互补的第二 PCR引物的PCR扩增。在一些实施方案中,所述方法还包括使用RNA聚合酶扩增加标签的环状ssDNA片段的步骤。因此,在一些其他的实施方案中,所述方法还包括通过滚环复制(RCR)扩增加标签的环状ssDNA片段的步骤,所述方法包括(a)使与加标签的环状ssDNA片段互补的引物退火;以及(b)使用链置换DNA聚合酶(例如,phi29 DNA聚合酶或rBst DNA聚合酶大片段 (EPICENTRE)或DISPLACEACE DNA聚合酶(EPICENTRE))延伸与加标签的环状ssDNA片段退火的引物。在这些实施方案中,RCR扩增产物是与加标签的环状ssDNA片段互补的多联体 ssDNA分子。在其中加标签的环状ssDNA片段显示反义启动子序列的一些实施方案中,多联体RCR扩增产物显示正义启动子序列,并且所述方法还包括使RNA聚合酶启动子为双链的 (例如,通过使显示反义启动子序列的互补寡脱氧核糖核苷酸与正义启动子序列退火,然后使用结合双链RNA聚合酶启动子并自其启动转录的RNA聚合酶转录该多联体DNA。在一些优选的实施方案中,转座子末端组合物包括只显示转移的转座子末端序列的转移链,并因此,标签只显示转移的转座子末端序列。在一些其他的实施方案中,转座子末端组合物包括转移链,所述转移链包括3'部分和5'部分或由其构成,其中该3'部分显示转移的转座子末端序列,并且该5'部分显示任何其他期望的序列,在所述实施方案中,标签包括3'部分和5'部分或由其构成。在其中转座子末端组合物包括转移链,所述转移链包括3'部分和5'部分或由其构成的一些实施方案中,非转移链显示与转移链的 5'部分互补的序列。然而,在转座子末端组合物的一些优选的实施方案中,非转移链不显示与转移链的5'部分互补的序列。在一些优选的实施方案中,非转移链只显示非转移的转座子末端序列。在一些优选的实施方案中,非转移链显示不与非转移的转座子末端序列 3'-的转移链互补的序列。在以下任何方法的一些实施方案中,所述方法包括其中转座子末端组合物包括转移链,所述转移链包括5'部分和3'部分或由5'部分和3'部分构成,该5'部分显示测序标签域或捕获标签域(例如,Roche 454基因组测序仪FLX系统的测序标签域或捕获标签域,Roche 454A和Roche 454B标签用于使用Roche 454基因组测序仪FLX系统测序) 的序列并且该3'部分显示转移的转座子末端序列。因此,当转座子末端组合物包括具有测序标签域或捕获标签域的转移链时,加标签的环状ssDNA片段或加双标签的线性ssDNA 片段具有的标签包括测序标签域或捕获标签域(例如,用于利用Roche 454基因组测序仪 FLX系统测序的Roche 454A或Roche 454B标签)。产生的具有期望的大小范围的加标签的环状ssDNA片段或加双标签的线性ssDNA片段用作利用Roche 454基因组测序仪FLX系统的下一代测序的模板。在其他的实施方案中,产生包括一个或多个限制性位点域、测序标签域、捕获标签域、扩增标签域、检测标签域和/或地址标签域的加标签的环状ssDNA片段或加双标签的线性ssDNA片段以用于测序(例如,使用ROCHE 454测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/APPLIED BIOSYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BIOSYSTEMS的测序平台、或HELIC0S测序平台)。对哪些另外的序列用于转移链的5'部分或非转移链的3'部分中的一种或多种另外的序列没有限制,这些序列可用来完成任何期望的目的。在一些实施方案中,转移链的 5'部分或非转移链的3'部分显示一种或多种标签域序列。在一些实施方案中,所述方法还包括如下步骤使用缺乏链置换和5'到3'外切核酸酶活性的DNA聚合酶(例如,T4 DNA聚合酶,EPICENTRE)延伸包括在转座反应中产生的5'加标签的DNA片段的转移链,然后使用依赖模板的DNA连接酶(例如,大肠杆菌DNA 连接酶)利用相反链作为连接模板连接每个DNA延伸产物的3'端与包括加标签的DNA片段的非转移链的5'端;在这些实施方案中,转座子末端组合物的非转移链的5'端具有 5' _单磷酸基团。所述方法的这种实施方案产生加双标签的ssDNA片段。在本发明的实施方案的发展过程中开展的工作导致如下观察在dsDNA中发生转座。因此,在一些优选的实施方案中,转座子末端组合物包括只显示非转移的转座子末端序列的非转移链或由其构成,以使得转移链的5'部分为单链的(例如,为了使转移链在体外转座反应过程中插入本身的双链部分中的可能性或频率降到最低)。在其中非转移链显示与转移链的5'部分互补的3'部分的优选的实施方案中,使转移链的5'部分的大小最小化以使转移链在体外转座反应过程中插入本身中的可能性或频率降到最低。例如,在一些实施方案中,转移链的5'部分的大小(以及非转移链的互补3'部分的大小)小于大约 150个核苷酸、小于大约100个核苷酸、小于大约75个核苷酸、小于大约50个核苷酸、小于大约25个核苷酸或小于大约15个核苷酸。
在一些优选的实施方案中,转座子末端组合物的转移链的5'端具有5' _单磷酸基团。在一些优选的实施方案中,非转移链的5'端具有5' _单磷酸基团。在一些优选的实施方案中,转移链和非转移链都具有5' _单磷酸基团。在其中转移链不具有5'-单磷酸基团的实施方案中,所述方法还包括在该方法的连接步骤之前使转移的转座子末端寡核苷酸的5'端磷酸化的步骤(例如,使用多核苷酸激酶;例如,T4多核苷酸激酶)。转座酶催化的转座子末端插入靶DNA中导致该转移的转座子末端与靶DNA的一条链的5'端的接合以及该链在该转移的转座子末端序列与该靶DNA的接合位点处的破裂或断裂,伴随产生由于在靶DNA的相反链中的9碱基缺口区域所致的位于转移的转座子末端与靶DNA接合的位点的3'的单链靶DNA的9碱基区域。例如,图1显示转移的转座子末端到靶DNA的相反链中的两个独立插入事件。如图2所示,转移的转座子末端独立插入到靶 DNA的相反链中有时发生在靶DNA中相对接近的位置,产生两个5 ‘加标签的DNA片段。在变性后,释放两个5'加标签的ssDNA片段。5'加标签的ssDNA片段的不依赖模板的连接在一些实施方案中,不依赖模板的或非同源的核酸连接酶(例如,其进行具有 3'-羟基和5'-单磷酸基团的ssDNA的分子内连接,S卩,环化)被用在使5'加标签的线性ssDNA片段环化的本发明的方法中。在一些优选的实施方案中,核酸连接酶是热稳定的RNA连接酶,例如,选自噬菌体TS2126热稳定的RNA连接酶(美国专利第7,303,901 号和 Blondal 等人,Nucleic Acids Res 33 135-142,2005),CIRCLIGASE ssDNA 连接酶 (EPICENTRE Biotechnologies,Madison,WI,USA),以及古细菌RNA连接酶(例如,嗜热自养甲烷杆菌 RNA 连接酶 1 或“MthRnl ”;Torchia,C 等人,Nucleic Acids Res. 36 :6218_6227, 2008)。提及“不依赖模板的连接酶”或“非同源连接酶”,它表示在不存在互补序列与将被接合或连接的ssDNA的末端退火的情况下导致ssDNA的连接的连接酶(即,两个末端没有与互补序列退火来保持这两个末端在连接步骤过程中彼此相邻)。在这些实施方案中,所述方法包括如下步骤通过将5'加标签的线性ssDNA片段与核酸连接酶孵育使在体外转座反应中产生的退火的5'加标签的DNA片段变性。提及“分子内连接”,我们表示一个ssDNA 分子的两个末端彼此连接产生环状ssDNA片段,而不是与其他DNA分子的末端连接。在一些优选的实施方案中,非同源连接反应在“改进的连接反应混合物”中进行, 所述“改进的连接反应混合物”在本文表示包括如下的连接反应混合物a)加标签的线性 ssDNA片段;b)保持pH的缓冲液;b)Mn2+阳离子;以及c)热稳定的RNA连接酶分子组合物,其中高比例热稳定的RNA连接酶分子被腺苷酸化;其中腺苷酸化的热稳定的RNA连接酶分子的浓度至少等于线性ssDNA片段摩尔浓度,并且其中没有向该连接反应混合物中添加 ATP或Mg2+阳离子。提及语句“高比例热稳定RNA连接酶分子被腺苷酸化”,它表示在改进的连接反应混合物中所有热稳定的RNA连接酶分子的至少约50%被腺苷酸化。在改进的连接反应混合物的一些实施方案中,所有热稳定的RNA连接酶分子的大于约60%被腺苷酸化。在改进的连接反应混合物的一些实施方案中,所有热稳定的RNA连接酶分子的大于约70%被腺苷酸化。在改进的连接反应混合物的一些实施方案中,所有热稳定的RNA连接酶分子的大于约 80%被腺苷酸化。在改进的连接反应混合物的一些优选的实施方案中,所有热稳定的RNA 连接酶分子的大于约90%被腺苷酸化。在改进的连接反应混合物的一些优选的实施方案中,所有热稳定的RNA连接酶分子的大于约95%被腺苷酸化。在一些优选的实施方案中, 热稳定的RNA连接酶被腺苷酸化来制备如下组合物其中通过在纯化过程之中或之后将热稳定的RNA连接酶分子与ATP孵育将该酶腺苷酸化。例如,可用于使热稳定的RNA连接酶腺苷酸化的一个方案是在50°C下在包含50mM Tris-HCl,pH 8. 0、2mM MgCl2UOOmM NaCl以及0. 5mM ATP的溶液中孵育该酶15分钟;然后通过添加EDTA至5mM的终浓度终止反应; 然后通过透析或凝胶过滤除去反应组分。腺苷酸化的热稳定的RNA连接酶的百分比可通过 SDS-PAGE分析来估计。在一些优选的实施方案中,其中高比例热稳定的RNA连接酶分子被腺苷酸化的热稳定的RNA连接酶为噬菌体TS2U6热稳定的RNA连接酶。在改进的连接反应混合物的一些实施方案中,缓冲液将PH保持在pH8.0之间。在改进的连接反
应混合物的一些优选的实施方案中,缓冲液将PH保持在pH 7.0和pH 8.0之间。在改进的连接反应混合物的一些优选的实施方案中,将PH保持在pH 7.0和pH 8.0之间的缓冲液是 Tris缓冲液。在改进的连接反应混合物的一些实施方案中,Mn2+阳离子的浓度在0. 5mM和 IOmM之间。在改进的连接反应混合物的一些实施方案中,Mn2+阳离子的浓度在ImM和IOmM 之间。在改进的连接反应混合物的一些实施方案中,Mn2+阳离子的浓度在ImM和5mM之间。 在改进的连接反应混合物的一些优选的实施方案中,Mn2+阳离子的浓度为2. 5mM。在改进的连接反应混合物的一些优选的实施方案中,Mn2+阳离子作为MnCl2而提供。在一些实施方案中,在改进的连接反应混合物中的腺苷酸化的热稳定的RNA连接酶分子为线性ssDNA片段的摩尔浓度的至少两倍。在一些实施方案中,在改进的连接反应混合物中的腺苷酸化的热稳定的RNA连接酶分子为线性ssDNA片段的摩尔浓度的至少五倍。在一些实施方案中,在改进的连接反应混合物中的腺苷酸化的热稳定的RNA连接酶分子为线性ssDNA片段的摩尔浓度的至少十倍。在一些优选的实施方案中,改进的连接反应混合物另外包括盐,诸如氯化钾或醋酸钾(例如,浓度在大约50mM到大约IOOmM)。在一些优选的实施方案中,改进的连接反应混合物另外包括还原剂,诸如二硫苏糖醇(DTT)(例如,浓度在大约0. 5mM或ImM)。 在一些实施方案中,改进的连接反应混合物另外包括浓度在0. 25M到5. 2M之间的两性离子的三甲基甘氨酸(甜菜碱)。在一些实施方案中,改进的连接反应混合物另外包括浓度在 0.5M到2M之间的两性离子的三甲基甘氨酸(甜菜碱)。在一些实施方案中,改进的连接反应混合物另外包括大约IM浓度的两性离子的三甲基甘氨酸(甜菜碱)。在一些优选的实施方案中,改进的连接反应混合物包括a)具有5'-磷酰基和和 3'-羟基基团的线性ssDNA片段(例如,0. 5微摩尔);b)pH 7. 8的33mMTRIS乙酸;b) 2. 5mM Mn2+阳离子;以及c)热稳定的RNA连接酶分子的组合物,其中> 70%的热稳定的RNA连接酶分子被腺苷酸化;其中腺苷酸化的热稳定的RNA连接酶分子的浓度至少等于线性ssDNA 片段的摩尔浓度(例如,大约1微摩尔腺苷酸化的热稳定的RNA连接酶用于0. 5微摩尔加标签的线性ssDNA片段),并且其中没有向该连接反应混合物中添加ATP或Mg2+阳离子。在一些优选的实施方案中,腺苷酸化的热稳定的RNA连接酶分子的浓度为线性ssDNA片段的摩尔浓度的至少5倍、至少10倍或至少20倍(例如,大约2. 5微摩尔、大约5微摩尔或大约 10微摩尔的腺苷酸化的热稳定的RNA连接酶用于0. 5微摩尔的加标签的线性ssDNA片段)。 在一些优选的实施方案中,改进的连接反应混合物另外包括66mM醋酸钾和0. 5mM DTT0在一些优选的实施方案中,改进的连接反应混合物另外包括IM甜菜碱。在所述方法的一些优选的实施方案中,合成加标签的环状ssDNA片段的5'加标签的线性ssDNA片段的分子内连接在大约40°C到大约70°C之间的温度下在连接反应混合物中进行足够的时间(例如,从大约1小时到大约72小时),其中合成加标签的环状ssDNA 片段。在一些优选的实施方案中,分子内连接在大约60°C的反应温度下进行足够的时间,其中合成了环状ssDNA片段。本发明不仅限于本文所述的特定核酸连接酶。本领域技术人员将理解可使用具有与本文所述的活性相似的活性的任何核酸连接酶进行分子内连接,意味着该核酸连接酶导致具有3'-羟基和5' _单磷酸基团的ssDNA的非同源分子内连接。V.通过发夹转座子末端的体外转座使Ds-DNA断裂并加标签(30963)简言之,在一些实施方案中,所述方法包括将为dsDNA的靶DNA与转座酶和发夹转座子末端组合物在体外转座反应中孵育以使该靶DNA同时断裂和加标签,从而产生包括 5'加标签的DNA片段的群体的文库;然后使包括靶DNA的一条链的一部分的每个5'加标签的DNA片段的3'端与包括互补部分(即,靶DNA的相反链)的另一个5'加标签的DNA 片段的5'端接合,从而产生共价闭合的加标签的环状DNA片段(例如,其显示单链环状结构或哑铃形结构)的文库。在一些优选的实施方案中,接合的步骤包括用缺乏5'到3' 外切核酸酶(包括依赖结构的5'核酸酶)和链置换活性的DNA聚合酶延伸5'加标签的 DNA片段的3'端以产生5'加标签的DNA片段延伸产物,并且使用依赖模板的DNA连接酶 (例如,大肠杆菌DNA连接酶或来自嗜冷细菌或嗜冷噬菌体的依赖模板的DNA连接酶)连接所述5'加标签的DNA片段延伸产物中的每一个的3'端与互补的5'加标签的DNA片段延伸产物的5'端。在其他优选的实施方案中,接合的步骤包括将具有精确地填充从体外转座反应产生的单链缺口的一种或多种适合的大小(例如,用于填充从使用EZ-Tn5 转座酶的体外转座中产生的单链缺口的包括随机序列或半随机序列9-mer或随机序列4-mer以及随机序列5-mer或者由其构成的5'-单磷酸化的随机序列寡脱氧核糖核苷酸)的随机序列寡脱氧核糖核苷酸(例如,5'-单磷酸化或5'-腺苷酸化的随机序列或半随机序列寡脱氧核糖核苷酸)和依赖模板的DNA连接酶(例如,大肠杆菌DNA连接酶或来自嗜冷细菌或嗜冷噬菌体的依赖模板的DNA连接酶)与5'加标签的DNA片段在一定条件下孵育并持续足够的时间,其中该随机序列寡核苷酸退火以便填充5'加标签的DNA片段中的单链缺口并且被连接,从而产生加标签的环状DNA分子的群体。因此,本发明的一个优选的实施方案是用于从双链靶DNA产生包括加标签的环状 DNA片段的群体的文库用作DNA测序或核酸扩增反应中的模板的方法,所述加标签的环状 DNA片段的每一个显示靶DNA的部分的两条链的序列以及与标签的序列,所述方法包括提供1.包括一种或多种双链(dsDNA)分子(例如,来自真核细胞的基因组dsDNA、线粒体dsDNA、叶绿体dsDNA或其他dsDNA和/或来自原核细胞的基因组DNA或附加体DNA,或通过来自真核细胞和/或原核细胞的RNA的反转录产生第一链cDNA,然后延伸与该第一链 cDNA退火的引物而制备的双链cDNA)或由其构成的靶DNA ;2.转座酶(例如,野生型或突变的转座酶;例如野生型或突变的Tn5转座酶,例如,ΕΖ-Τη5 转座酶,例如 HYPERMU MuA 转座酶,EPICENTRE Biotechnologies, Madison, WI,USA);以及3.能够在转座反应中与转座酶形成功能复合物并且显示标签的序列的发夹转座子末端组合物,其中所述发夹转座子末端组合物包括含5'-磷酸的寡核苷酸或由其构成,所述含5'-磷酸的寡核苷酸显示在其5'端的非转移的转座子末端序列(例如,就 EZ-Tn5 非转移的转座子末端序列而言本文称为“MENTS” )、在其3'端的转移的转座子末端序列(例如,就ΕΖ-Τη5 转移的转座子末端序列而言本文称为“METS”)、以及足够长的允许分子内茎-环形成的在该非转移的转座子末端序列与该转移的转座子末端序列之间的间插序列(例如,为任何期望的目的,诸如提供标签),其中该茎显示与转座酶形成对于转座有功能的复合物的双链转座子末端的序列(例如,其中该茎显示由野生型或突变的Τη5 转座酶例如由ΕΖ-Τη5 转座酶识别的19-bp外端(“0E”)转座子末端、19_bp内端(“IE”) 转座子末端、或19-bp嵌合端(“ME”)转座子末端)(或者,例如,对于MuA转座酶而言的 Rl和R2 MuA转座子末端)并且该环显示可以为任意序列的间插序列;4. (a)缺乏5'核酸酶活性(包括外切核酸酶和依赖结构的5‘核酸酶活性)和链置换活性的DNA聚合酶(例如,T4 DNA聚合酶);或(b) —种或多种大小的随机序列寡核苷酸,它们单独或联合起来具有与在转座酶和发夹转座子末端组合物的转座反应后产生的 5'加标签的DNA片段中的单链缺口相同的长度;以及5.依赖模板的连接酶(例如,大肠杆菌DNA连接酶或来自嗜冷细菌或嗜冷噬菌体的依赖模板的连接酶);将体外转座反应中的靶DNA与转座酶和发夹转座子末端组合物在一定条件下孵育并且持续足够的时间,其中该发夹转座子末端组合物插入该靶DNA中产生5'加标签的 DNA片段的群体(参见,例如,图2和图3);在一定条件下孵育该5'加标签的DNA片段并且持续足够的时间,其中DNA片段中的单链缺口被填充并且每个5'加标签的DNA片段的3'端被延伸并接合包含该靶DNA的互补部分的另一 5'加标签的DNA片段的5'端,从而产生加标签的环状DNA片段的文库, 所述加标签的环状DNA片段中的每一个显示该靶DNA的一部分的两条链的序列和标签的序列。在所述方法的一些优选的实施方案中(如在例如图7和图8中所图示的),接合的步骤包括(1)将5'加标签的DNA片段与缺乏5'核酸酶活性的DNA聚合酶在一定条件下孵育,其中每个5'加标签的DNA片段的3'端被延伸产生5'加标签的DNA片段延伸产物的群体;以及⑵将5'加标签的DNA片段延伸产物与依赖模板的连接酶在一定条件下孵育并持续足够的时间,其中该5'加标签的DNA片段延伸产物被连接,从而产生加标签的环状DNA片段的文库。在一些实施方案中,在混合物中提供了缺乏5'核酸酶和链置换活性的 DNA聚合酶和依赖模板的连接酶并且在单一反应混合物中进行接合步骤。在所述方法的一些其他优选的实施方案中,接合的步骤包括将5'加标签的DNA 片段与一种或多种大小的随机序列寡核苷酸和依赖模板的连接酶在一定条件下孵育并持续足够的时间,其中该随机序列寡核苷酸与5'加标签的DNA片段中的单链缺口区域退火并填充它们并且其中所述退火的随机序列寡核苷酸彼此连接或者与相邻端的5'加标签的 DNA片段连接,从而产生加标签的环状DNA片段。在一些实施方案中,所述方法在连接步骤后另外包括一个或多个除去随机序列寡核苷酸、线性靶DNA和/或不与靶DNA接合的发夹转座子末端组合物。在一些优选的实施方案中,所述方法另外包括用T5外切核酸酶(EPICENTREBiotechnologies,Madison,WI)处理包含加标签的环状DNA片段的反应混合物以除去未连接的线性ssDNA和dsDNA (例如,有切口的和/或包含单链区域的DNA片段)。在一些实施方案中,所述方法另外包括在每个环结构中切割加标签的环状DNA 片段以产生线性双链DNA片段,所述DNA片段中的每条链在其5 ‘端具有标签的一部分并且在其3'端具有标签的一部分(所述线性DNA片段在本文称为“扇尾形加双标签的线性 dsDNA片段”或“扇尾形dsDNA片段”)。在一些实施方案中,切割的方法包括使与标签内的限制性位点退火的寡脱氧核糖核苷酸与该加标签的环状DNA片段退火,然后与在该双链限制性位点处切割的限制性内切核酸酶孵育产生扇尾形dsDNA片段。在一些其他的实施方案中,发夹转座子末端组合物具有可使用切割酶组合物切割的一个或多个可切割位点(例如,在环结构中)(例如,可使用包含尿嘧啶-N-糖基化酶和 AP内切核酸酶诸如大肠杆菌内切核酸酶III或内切核酸酶IV的切割酶组合物切割的由 dUMP残基构成的可切割位点;或者,例如,可使用包含FPG蛋白士AP内切核酸酶诸如大肠杆菌内切核酸酶III或内切核酸酶IV的切割酶组合物切割的由8-氧代-鸟嘌呤-2'-脱氧核糖核苷-单磷酸残基构成的可切割位点),并且切割方法包括将加标签的环状DNA片段与切割酶组合物在一定条件下孵育并持续足够的时间,其中该加标签的环状DNA片段在切割位点处被切割产生扇尾形dsDNA片段。在所述方法的一些实施方案中,使用不同的非规范核苷酸来提供切割位点并且在切割酶组合物中使用不同的N-糖基化酶。合成发夹转座子末端组合物(例如,使用寡核苷酸合成仪)以便在期望切割文库中的加标签的环状DNA 片段的一个或多个位点处(例如,其中期望切割加标签的环状DNA片段的位点是在插入加标签的环状DNA片段中的发夹转座子末端组合物的环结构内)包含由非规范的核苷酸代替规范的核苷酸(例如,当尿嘧啶-N-糖基化酶用作切割酶组合物的组分时dUMP为代替TMP 的非规范核苷酸,或者当FPG蛋白用作切割酶组合物的组分时8-氧代-GMP为代替GMP的非规范核苷酸)构成的切割位点。因此,在其中转座子末端组合物具有一个或多个切割位点的一些优选的实施方案中,切割酶组合物使用N-糖基化酶(或“DNA糖基化酶”)产生无碱基位点或无嘧啶位点/ 无嘌呤(AP)位点。如本文所用,“N-糖基化酶”是催化DNA的非规范核酸碱基和糖之间的键水解产生无碱基(AP)位点的酶。这些酶存在于许多物种中。来自大肠杆菌的一个实例是尿嘧啶N-糖基化酶(UNG),也称为尿嘧啶-DNA糖基化酶(UDG)。UNG催化来自DNA中的糖脱氧核糖的碱基尿嘧啶的切割(Lindahl, Prog. Nucl. Acid Res. Mol. Biol. 22 135-192, 1979),但是不催化来自游离dUTP、游离脱氧尿苷或RNA的尿嘧啶的切割(Duncan,在The Enzymes(酶),Boyer编,第565-586页,1981中)。可用作切割酶的N-糖基化酶的其他实例由 Demple 和 Harison (Annu. Rev. Biochem. 63 :915-48,1994)以及由 Duncan ( “ DNA Glycosylases (DNA 糖基化酶),〃在 The Enzymes,Boyer 编,第 565-586 页,1981 中)描述。提及“N-糖基化酶”或“DNA-糖基化酶”我们表示具有N-糖基化酶活性的酶,不论该酶被正式地称为糖基化酶还是具有与其他酶活性联合的糖基化酶活性。糖基化酶有时被称为“糖苷酶”,并且我们因此表示N-糖基化酶的定义覆盖N-糖苷酶。例如,FPG蛋白也是如本文所定义的N糖基化酶。FPG蛋白(甲酰胺基嘧啶DNA N-糖基化酶)是一种碱基切除修复酶,该酶识别不同的但结构上相关的修饰的核酸碱基诸如8-羟基鸟嘌呤(也称为7-氢-8-氧代鸟嘌呤或8-氧代鸟嘌呤,是指在生理PH下的有利的6,8- 二酮互变异构体)(Tchou,等人,Proc. Natl. Acad. Sci. USA 88 :4690_4694,1991)、分别称为 4,6-二氨基-5-甲酰胺基嘧啶和2,6-二氨基-4-羟基-5-甲酰胺基嘧啶的腺嘌呤或鸟嘌呤的咪唑环打开的衍生物(Chetsanga,等人,Biochemistry 20 :5201-5207,1981 ;以及 Breimer,Nucl. Acids Res. 12 :6359-6367,1984)、N7-甲基甲酰胺基嘧啶、5-羟基尿嘧啶和5-羟基胞嘧啶 (Hatahet,等人,J. Biol. Chem. 269 18814-18820,1994)并且催化 DNA 中在修饰的碱基与脱氧核糖-磷酸二酯骨架之间的N-糖基连接的切割,从而产生AP位点。此外,FPG蛋白还有用AP裂解酶活性。该酶的AP-裂解酶活性催化β、δ-消除反应,在DNA中留下单核苷酸缺口(Bailly,等人,Biochem. J.:707-713,1989) 已显示 FPG 蛋白和 8-羟基腺嘌呤 DNA 糖基化酶是相同的(Chung,MH等人,Mutation Research 254 :1-12,1991) 用亚甲基蓝加可见光(Floyd,等人,Arch Biohem Biophys 273:106-111,1989)或者用玫瑰红加紫外光 (Friedmann 禾口 Brown,Nucleic Acids Research 5 :615-622,1978)处理 DNA 诱导可被 FPG 蛋白切割的鸟嘌呤特异性修饰。其他特异性N-糖基化酶将是本领域技术人员可用且已知的。为了确定N-糖基化酶是否适合于本发明,首先将非规范的核苷酸产入DNA中并且确定该非规范的碱基是否能够以与尿嘧啶或8-氧代-鸟嘌呤分别被UNG和FPG蛋白除去相似的方式被候选N-糖基化酶特定地除去。一旦创建无碱基位点或AP位点,本领域已知多种方法切割该无碱基位点。热和/或碱性的条件可用于在无碱基位点处破坏DNA分子。例如, 可使用以下方案在70°C到95°C将除去非规范碱基后的含有无碱基(AP)位点的核酸在包含胺例如25mM Tris-HCl和1到5mM镁离子的缓冲溶液中加热持续10到30分钟时间。可选地,以下处理可用于在无碱基位点处破坏DNA 将1. OM的哌啶碱基添加到已用乙醇沉淀并真空干燥的DNA中。然后将溶液在90°C加热30分钟并冻干以除去哌啶。在一些优选的实施方案中,利用本领域已知的无嘌呤/无嘧啶的内切核酸酶(AP内切核酸酶)的酶处理 (Lindahl,Prog. Nucl. Acid Res. MoI. Biol. 22 135—192,1979 ;Demple and Harison Annu. Rev. Biochem. 63 =915-48,1994)用于在无碱基位点处破坏DNA聚合物。如本文所定义的, AP内切核酸酶是催化在无碱基(AP)位点处破坏DNA的任何酶。这些酶存在于许多物种中。 来自大肠杆菌的AP内切核酸酶的实例包括但不限于内切核酸酶III和内切核酸酶IV。同样,在存在钙离子的情况下,大肠杆菌外切核酸酶是AP内切核酸酶。在本发明中有用的实例包括具有AP内切核酸酶样活性的任何酶,不论它被命名为该名称或是某个其他名称。在一些优选的实施方案中,所述方法另外包括使扇尾形dsDNA片段变性产生加双标签的线性ssDNA片段的文库(例如,以用作DNA测序或DNA扩增的模板)。在一些实施方案中,在使用所述方法产生的文库中的加标签的环状DNA片段或加双标签的线性ssDNA片段用作核酸扩增和/或DNA测序反应中的DNA模板。在一些实施方案中,所述方法还包括对加标签的环状DNA片段或加双标签的线性ssDNA片段中的靶DNA 进行扩增和/或测序的步骤。在一些实施方案中,所述方法还包括对通过扩增加标签的环状DNA片段或加双标签的线性ssDNA片段获得的与靶DNA互补的DNA测序的步骤。在一些实施方案中,使用DNA聚合酶和与标签互补的至少一种引物对加标签的环状DNA片段或加双标签的线性ssDNA片段的每一个中的靶DNA的至少一部分测序(例如,通过合成测序)。 在一些实施方案中,使用依赖模板的连接酶连接与标签互补的至少一种寡脱氧核糖核苷酸和与靶序列的部分退火的至少另一种寡脱氧核糖核苷酸,对加标签的环状DNA片段或加双标签的线性ssDNA片段中的每一个中的靶DNA的至少一部分测序(例如,通过连接测序)。 在一些实施方案中,通过使与标签以及与靶序列的一部分退火或杂交的寡脱氧核糖核苷酸退火,对加标签的环状DNA片段或加双标签的线性ssDNA片段的每一个中的靶DNA的至少一部分进行测序(例如,通过杂交测序)。在一些实施方案中,利用通过合成测序、通过连接测序、或通过杂交测序,对与加标签的环状DNA片段或加双标签的线性ssDNA片段互补的 DNA进行测序。例如,在一些优选的实施方案中,由试剂盒中提供的或在本发明的方法中使用的发夹转座子末端组合物显示的转移的转座子末端序列是由Tn5转座酶识别的转移的转座子末端序列。在一些优选的实施方案中,转移的转座子末端序列是由ΕΖ-Τη5 转座酶 (EPICENTRE Biotechnologies, Madison, WI, USA)识别的序列。一般来说,使用本发明的方法中的发夹转座子末端组合物产生的加标签的环状 DNA片段、扇尾形dsDNA片段以及加双标签的线性ssDNA片段显示转移的转座子末端序列和非转移的转座子末端序列,以及包括或来源于发夹转座子末端组合物的非互补的环部分的另外的序列。因此,在一些实施方案中,发夹转座子末端组合物显示转移的转座子末端序列 5'-的和非转移的转座子末端序列3'-的一种或多种其他核苷酸序列,所述一种或多种其他核苷酸序列也由标签显示。因此,除了转座子末端序列之外,发夹转座子末端组合物的标签可具有一个或多个其他的标签部分或标签域。在其中发夹转座子末端组合物包括一个或多个限制性位点域的一些实施方案中, 所述方法还包括使与加标签的环状DNA片段的单链限制性位点互补的寡脱氧核糖核苷酸退火,然后使用识别该限制性位点的限制性内切核酸酶在该限制性位点处切割该加标签的环状DNA片段。因此,在一些实施方案中,所述方法包括使加标签的环状DNA片段线性化以产生扇尾形dsDNA片段或变性后的加双标签的线性ssDNA片段。在一些实施方案中,所述方法还包括连接限制性内切核酸酶切割的加标签的线性 ssDNA片段与一个或多个其他DNA分子的步骤(例如,用于接合标签)。因此,在一些实施方案中,所述方法还包括通过转录扩增加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段,所述方法包括(a)使显示互补的反义启动子序列的寡脱氧核糖核苷酸与正义启动子序列退火,或者使加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段和与其互补的引物退火,并且在其中合成包括双链RNA聚合酶启动子的dsDNA的条件下用DNA聚合酶延伸该引物;以及(b)将dsDNA 产物与结合RNA聚合酶启动子的RNA聚合酶在其中合成RNA的条件下孵育。在其中发夹转座子末端组合物或PCR引物显示RNA聚合酶启动子序列的一些优选的实施方案中,该RNA聚合酶启动子是T7型RNA聚合酶启动子并且所述方法还包括使用识别该启动子的T7型RNA聚合酶在体外转录加标签的环状DNA片段的步骤。更优选地,从T7 RNAP、T3 RNAP和SP6 RNAP以及对应的同源启动子中选择RNA聚合酶和启动子。然而,本发明的方法的转录步骤可使用如下任何RNAP 对于所述RNAP而言允许具有高特异性的转录的适合的启动子序列是已知的或者可被获得。用于体外转录的试剂盒和酶从许多卖家可商购获得并且用于执行包括体外转录的本发明的步骤的适当的反应混合物和条件可按制造商所述使用那些产品。通过举例,但使用T7 RNAP的体外转录可按照产品资料所述使用来自 EPICENTRE Biotechnologies, Madison, WI 的 AMPLISCRIBE T7-FLASH 转录试剂盒或AMPLISCRIBE T7高产量转录试剂盒。类似地,如果T3 RNAP或SP6 RNAP在本发明的方法中用于体外转录,那么AMPLISCRIBE T3-FLASH 高产量转录试剂盒或AMPLISCRIBE SP6 高产量转录试剂盒(EPICENTRE Biotechnologies, Madison, WI)分别可按照所述使用。在一些其他的实施方案中,所述方法还包括使用DNA聚合酶和与标签互补的至少一种引物对加标签的环状DNA片段中的靶DNA进行扩增和/或测序的步骤。在一些实施方案中,所述方法另外包括使用链置换DNA聚合酶通过滚环复制对加标签的环状DNA片段进行扩增。在一些其他的实施方案中,所述方法另外包括使用热稳定的DNA聚合酶、与标签的至少一部分互补的第一 PCR引物以及与标签的互补序列的至少一部分互补的第二 PCR引物通过PCR对加标签的环状DNA片段进行扩增。在一些实施方案中,所述方法还包括通过滚环复制(RCR)扩增加标签的环状DNA 片段,所述方法包括(a)使与加标签的环状DNA片段互补的引物退火;以及(b)使用链置换DNA聚合酶(例如,phi29 DNA聚合酶、rBst DNA聚合酶大片段或DISPLACEACE DNA聚合酶(EPICENTRE))延伸与加标签的环状DNA片段退火的引物。在这些实施方案中,RCR扩增产物是与加标签的环状DNA片段互补的多联体ssDNA分子。在其中加标签的环状DNA片段显示反义启动子序列的一些实施方案中,多联体RCR扩增产物显示正义启动子序列,并且所述方法还包括使RNA聚合酶启动子为双链的(例如,通过使显示反义启动子序列的互补寡脱氧核糖核苷酸与正义启动子序列退火,然后使用结合双链RNA聚合酶启动子并自其启动转录的RNA聚合酶转录该多联体DNA)。在一些优选的实施方案中,发夹启动子末端组合物的茎部分只显示转移的和非转移的转座子某些序列并且环是单链的(例如,为了使发夹转座子末端组合物在体外转座反应过程中插入本身的双链部分中的可能性或频率降到最低)。在一些其他的实施方案中,发夹转座子末端组合物的茎部分除了转移的和非转移的转座子末端序列之外还显示另外的序列,所述另外的序列紧接-转移的转座子末端序列的5'和紧接非转移的转座子末端序列的3'。然而,在这些实施方案中,将发夹转座子末端组合物的茎部分中的另外的序列的大小最小化以使该发夹转座子末端组合物在体外转座反应过程中插入本身的可能性或频率降到最低。例如,在一些实施方案中。发夹转座子末端组合物中的茎的长度为小于大约 75个核苷酸;小于大约50个核苷酸;或小于大约30个核苷酸。在一些实施方案中,发夹转座子末端组合物的环部分显示测序标签域或捕获标签域的序列(例如,Roche 454基因组测序仪FLX系统的测序标签域和/或捕获标签域,例如其显示用于使用Roche 454基因组测序仪FLX系统测序的Roche 454A和Roche 454B标签的测序标签域的序列)。在其中发夹转座子末端组合物具有测序标签域或捕获标签域的一些实施方案中,加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段具有的标签包括测序标签域和/或捕获标签域(例如,用于利用Roche 454基因组测序仪FLX系统测序的Roche 454A或Roche 454B标签)。在分离期望大小范围内的加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段后,它们用作利用Roche A454基因组测序仪FLX系统的下一代测序的模板。在其他的实施方案中,产生的加标签的环状DNA片段或扇尾形dsDNA片段或加双标签的线性ssDNA片段具有一个或多个限制性位点域、测序标签域、扩增标签域、捕获标签域、检测标签域和/或地址标签域以用于测序(例如,使用 ROCHE 454 测序平台、ILLUMINA S0LEXA 测序平台、LIFE TECHNOLOGIES/APPLIEDBI0SYSTEMS 的 SOLID 测序平台、PACIFIC BIOSCIENCES 的 SMRT 测序平台、P0LL0NAT0R Polony 测序平台、COMPLETE GENOMICS 测序平台、INTELLIGENT BIOSYSTEMS 的测序平台、或 HELICOS测序平台)。在一些实施方案中,发夹转座子末端组合物显示一个或多个标签域序列,所述序列可用来达成任何期望的目的。对哪些另外的序列用于发夹转座子末端组合物的环部分中的一种或多种另外的序列没有限制。在一些优选的实施方案中,发夹转座子末端组合物的5'端具有5'-单磷酸基团。在其中发夹转座子末端组合物不具有5'-单磷酸基团的实施方案中,所述方法还包括在该方法的连接步骤之前使发夹转座子末端组合物的5'端磷酸化的步骤(例如,使用多核苷酸激酶;例如,T4多核苷酸激酶)。转座酶催化的转座子末端插入靶中导致该转移的转座子末端序列的3'端与靶 DNA的一条链中的核苷酸的5'位接合,导致该链在该转移的转座子末端序列与该靶DNA的接合位点处的破裂或断裂,并且伴随产生由于在靶DNA的相反链中的9碱基缺口区域所致的位于转移的转座子末端与靶DNA接合的位点3'的单链靶DNA的9碱基区域。例如,图 16显示发夹转座子末端组合物到靶DNA中的两个独立插入事件的一个可能结果。如图16 所示,发夹转座子末端到靶DNA的相反链中的独立插入有时发生在靶DNA中的部位,产生如图16中所示的两个5'加标签的DNA片段。在接合后,产生了加标签的环状DNA片段。本发明不仅限于本文所述的特定核酸连接酶。本领域技术人员将理解具有与本文所述的酶相似的活性的任何依赖模板的核酸连接酶和使用这些酶用于依赖模板的连接的方法及条件是本领域已知且容易获得的。实验实施例在以下实施例中进一步定义了本发明。应当理解这些实施例虽然指出本发明的优选实施方案,但仅通过举例说明方式给出。从以上讨论和这些实施例,本领域熟练技术人员能够确定本发明的必要特征,并且在不背离本发明的精神和范围的情况下能够对本发明作出各种改变和变更以使其适合于各种运用和条件。使用的标准分子生物学技术是本领域公知的并且被Sambrook,J.,Fritsch, Ε. F.禾口 Maniatis,T. ,Molecular Cloning :A Laboratory Manual (分子克隆实验指南), 第二版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor,N. Y. (1989)描述。实施例中使用的定义、命名和缩写“pMETS”是指显示EZ-Tn5 转座子末端序列的19碱基的含5'-磷酸的单链转座子末端寡核苷酸5' pAGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)“METS”是指显示EZ-Tn5 转座子末端序列的19碱基的单链转座子末端寡核苷酸5' AGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)“pMENS”是指显示EZ-Tn5 转座子末端序列的19碱基的含5'-磷酸的单链转座子末端寡核苷酸5' pCTG TCT CTT ATA CAC ATCT 3' (SEQ ID NO 2)“pMEDS”是指其中两个5'端均包含磷酸的19碱基对的双链EZ-Tn5 转座子末端5' pAGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)3' TCT ACA CAT ATT CTC TGTCp 5' (SEQ ID NO :2)通过使pMETS转座子末端寡核苷酸与pMENTS转座子末端寡核苷酸退火制备pMEDS EZ-Tn5 转座子末端。“MEDS”是指其中只有非转移链(pMENTQ包含5 ‘-磷酸的19碱基对的双链 EZ-Tn5 转座子末端5' AGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)3' TCT ACA CAT ATT CTC TGTCp 5' (SEQ ID NO :2)通过使METS转座子末端寡核苷酸与pMENTS转座子末端寡核苷酸退火制备MEDS EZ-Tn5 转座子末端。"p454. IMETS”是指具有由显示以下序列的Roche 454测序标签构成的5'部分的 36碱基的含5'-磷酸的单链转移链,所述Roche 4 测序标签附加于标下划线的19碱基 EZ-Tn5 转移的转座子末端序列(pMETS)的5'端5' pGCC TTG CCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3' (SEQ ID NO 4)通过使p454. 1 METS 转移链(SEQ ID NO 4)与 pMENTS 非转移链(SEQ ID NO 2) 退火制备“p454. IMEDS ”EZ-Tn5 转座子末端组合物5' pGCC TTG CCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3'3' T CTA CAC ATA TTC TCT GTCp 5'"pc454. 1”是指p4M. IMETS的5'部分互补并且具有以下序列的18碱基的含 5'-磷酸的单链寡核苷酸5' pTGA GCG GGC TGG CAA GGC 3' (SEQ ID NO 5)“A-METS”是指具有由显示以下序列的Roche妨4测序标签构成的5'部分的38 碱基的单链转移链,所述Roche 4 测序标签附加于标下划线的19碱基EZ-Tn5 转移的转座子末端序列(METS)的5'端5' GCC TCC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 7)通过使A-METS转移链(SEQ ID NO 7)与pMENTS非转移链(SEQ ID NO 2)退火制备“ A-MEDS ” EZ-Tn5 转座子末端组合物5' GCC TCC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAC AG 3'3' TC TAC ACA TAT TCT CTG TCp 5'“B-METS”是指具有由显示以下序列的Roche妨4测序标签构成的5'部分的38 碱基的单链转移链,所述Roche 4 测序标签附加于标下划线的19碱基EZ-Tn5 转移的转座子末端序列(METS)的5'端5' GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 8)通过使B-METS转移链(SEQ ID NO 8)与pMENTS非转移链(SEQ ID NO 2)退火制备“B-IMEDS ” EZ-Tn5 转座子末端组合物5' GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAC AG 3'3' TC TAC ACA TAT TCT CTG TCp 5'“FLX-A”是指由显示以下序列的Roche 454测序标签构成的19碱基的单链寡核苷酸5' GCC TCC CTC GCG CCA TCA G 3' (SEQ ID NO 9)“FLX-B”是指由显示以下序列的Roche 454测序标签构成的19碱基的单链寡核苷酸5' GCC TTG CCA GCC CGC TCA G 3' (SEQ ID NO 10)“A-MID2-METS”是指具有由Roche妨4测序标签和显示以下序列的条码序列 (MID2,斜体)构成的5'部分的48碱基的单链转移链,所述条码序列附加于标下划线的19 碱基EZ-Tn5 转移的转座子末端序列(METQ的5'端5' GCC TCC CTC GCG CCA TCA G ΑΓ.ΠΓ.ΨΓ.Π Γ. AG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 11)“Ti A-METS”是指具有由显示以下序列的Roche妨4测序标签构成的5'部分的 49碱基的单链转移链,所述Roche 454测序标签附加于标下划线的19碱基EZ-Tn5 转移的转座子末端序列(METS)的5'端5' CCA TCT CAT CCC TGC GTG TCT CCG ACT CAG AGA TGT GTATAA GAG ACA G 3' (SEQ ID NO 12)“Ti B-METS”是指具有由显示以下序列的Roche妨4测序标签构成的5'部分的 49碱基的单链转移链,所述Roche 454测序标签附加于标下划线的19碱基EZ-Tn5 转移的转座子末端序列(METS)的5'端5' CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG AGA TGT GTA TAA GAG ACA G 3' (SEQ ID Ν0:13)“Ti Α”是指由显示以下序列的Roche妨4测序标签构成的沈碱基的单链寡核苷酸5' CCA TCT CAT CCC TGC GTG TCT CCG AC 3' (SEQ ID NO :14)“Ti B”是指由显示以下序列的Roche 454测序标签构成的沈碱基的单链寡核苷酸5' CCT ATC CCC TGT GTG CCT TGG CAG TC 3' (SEQ ID NO 15)“BP1-A”是指具有由显示以下序列的Illumina桥PCR标签构成的5'部分的48 碱基的单链寡核苷酸,所述Illumina桥PCR标签附加于FLX-A序列(下面标下划线的)5' AAT GAT ACG GCG ACC ACC GAG ATC TAC ACG CCT CCC TCG CGC CAT CAG 3' (SEQ ID NO 16)“BP2-B”是指具有由显示以下序列的Illumina桥PCR标签构成的5'部分的49 碱基的单链寡核苷酸,所述Illumina桥PCR标签附加于FLX-B序列(下面标下划线的) 5' CAA GCA GAA GAC GGC ATA CGA GAT CGG TCT GCC TTG CCA GCC CGC TCA G 3' (SEQ ID NO 17)“BP2-ID1-B”是指具有由Illumina桥PCR标签和显示以下序列的条码序列(ID2, 斜体)构成的5'部分的49碱基的单链寡核苷酸,所述Illumina桥PCR标签附加于FLX-B 序列(下面标下划线的)5' CAA GCA GAA GAC GGC ATA CGA GAT GCATGT CGG TCT GCCTTG CCA GCC CGC TCA G 3' (SEQ ID NO 18)
“BP 1”是指由显示以下序列的Illumina bPCR衔接子标签构成的20碱基的单链寡
核苷酸5' AAT GAT ACG GCG ACC ACC GA 3' (SEQ ID NO 19)“BP2”是指由显示以下序列的Illumina bPCR衔接子标签构成的21碱基的单链寡
核苷酸5' CAA GCA GAA GAC GGC ATA CGA 3' (SEQ ID NO 20)“pMETS-N-MENTS”是指包括如下组分或由其构成的发夹转座子末端组合物显示 5'端的EZ-Tn5 非转移的转座子末端序列和3'端的EZ-Tn5 转移的转座子末端序列的含5'-磷酸的寡核苷酸,所述非转移的转座子末端序列和转移的转座子末端序列通过由 “(N) χ”代表的间插的任意序列连接。在METS和MENTS之间的间插序列由足够数目的核苷酸构成以允许茎-环形成5' PCTGTCTCTTATACACATCT-(N)X-AGATGTGTATAAGAGACAG 3‘ (SEQ ID NO 3)pMETS-N-MENTS内pMETS转移的转座子末端序列与pMENTS非转移的转座子末端序列的分子内退火制备发夹EZ-Tn5 转座子末端组合物。例如,如果χ = 6 ;NNN AGATGTGTATAAGAGACAG 3'N TCTACACATATTCTCTGTCp 5' (SEQ ID NO 3)NN“TSase,,是指在 50mM Tris 氯化物 pH 7. 5、50%甘油、0. ImM EDTAUmM DTT、500mM 氯化钠、0. 5% ν/ν ΝΡ-40、0. 5% ν/ν 吐温-20 中的高活性 ΕΖ_Τη5 Τη5 转座酶(EPICENTRE Biotechnologies, Madison, WI, USA)。“转座体”是指与双链转座子DNA在支持非共价复合物形成的条件下孵育的高活性 EZ-Tn5 Τη5 转座酶(EPICENTRE Biotechnologies, Madison, WI, USA) 双链的转座子 DNA可由不限于Tn5 DNA、Tn5 DNA的部分、转座子末端组合物、转座子末端组合物的混合物或其他能够与高活性EZ-Tn5 转座酶相互作用的双链DNA构成。
权利要求
1.一种用于产生靶DNA的加标签的DNA片段的文库的方法,所述方法包括i)将所述靶DNA与转座酶和转座子末端或转座子末端组合物孵育,所述转座子末端或转座子末端组合物包含在其5'部分中具有标签域的转移链,所述孵育在其中所述转座酶催化转座反应的条件下进行,其中a)所述靶DNA被断裂产生多个靶DNA片段;和b)所述转座子末端或转座子末端组合物的转移链与多个所述靶DNA片段中的每一个片段的5'端接合产生多个5'加标签的靶DNA片段;和 )将所述多个5'加标签的靶DNA片段与至少一种核酸修饰酶孵育,所述孵育在其中 3'标签与所述5'加标签的靶DNA片段的3'端接合的条件下进行,以产生包含加双标签的靶DNA片段。
2.一种对靶DNA的片段加标签的方法,所述方法包括i)将靶DNA与转座酶和转座子末端或转座子末端组合物孵育,所述转座子末端或转座子末端组合物包含在其5'部分中包括标签域的转移链,所述孵育在其中所述转座酶催化转座反应的条件下进行,其中a)所述靶DNA被断裂;和b)所述转座子末端或转座子末端组合物的所述转移链与所述靶DNA的片段的5'端接合产生5'加标签的靶DNA片段;和ii)将所述5'加标签的靶DNA片段与核酸修饰酶孵育,所述孵育在其中3'标签与所述5'加标签的靶DNA片段的3'端接合的条件下进行,以产生加双标签的靶DNA片段。
3.如权利要求1所述的方法,其中所述核酸修饰酶为DNA聚合酶并且其中所述3'标签是通过所述5'加标签的靶DNA片段的所述3'端的延伸而形成,其中所述DNA聚合酶选自由依赖模板的DNA聚合酶和不依赖模板的DNA聚合酶组成的组。
4.如权利要求2所述的方法,其中所述依赖模板的DNA聚合酶具有链置换活性和/或 5'核酸酶活性。
5.如权利要求1或权利要求2所述的方法,其中所述核酸修饰酶为连接酶并且其中所述3'标签是通过寡核苷酸与所述5'加标签的靶DNA片段的所述3'端的连接而形成,并且其中所述连接酶选自由依赖模板的连接酶和不依赖模板的连接酶组成的组。
6.如权利要求1-5中任一项所述的方法,其中所述转移的末端包含标签域,所述标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。
7.如权利要求6所述的方法,其中所述标签域为测序标签域,所述测序标签域包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics 测序标签。
8.如权利要求1-7中任一项所述的方法,所述方法还包括扩增一种或多种5'加标签的靶DNA片段和/或加双标签的靶DNA片段。
9.如权利要求8所述的方法,其中所述扩增包括使用PCR扩增反应、链置换扩增反应、 滚环扩增反应、连接酶链反应、转录介导的扩增反应或环介导的扩增反应中的一种或多种。
10.如权利要求8所述的方法,其中所述扩增包括非选择性扩增构成DNA片段文库的 5'加标签的靶DNA片段或构成DNA片段文库的加双标签的靶DNA片段。
11.如权利要求8所述的方法,其中所述转座子末端组合物包含在核酸序列上具有至少一个核苷酸差异的多条转移链,并且其中所述扩增包括基于所述5'端标签或标签域的核酸序列选择性扩增加双标签的DNA片段。
12.如权利要求11所述的方法,其中所述选择性扩增包括选择性扩增包括具有至少一个核苷酸差异的5'端标签或标签域的加双标签的DNA片段。
13.如权利要求8所述的方法,其中所述扩增包括使用与所述加双标签的靶DNA片段的所述3'标签互补的单个寡核苷酸引物的聚合酶链反应。
14.如权利要求8所述的方法,其中所述扩增包括使用单个寡核苷酸引物的链置换扩增反应,其中所述寡核苷酸引物只由核糖核苷酸构成,或只由嘌呤核糖核苷酸和只由嘧啶 2' -F-2'-脱氧核糖核苷酸构成,其中所述链置换扩增反应包括链置换DNA聚合酶和核糖核酸酶H。
15.如权利要求8所述的方法,其中所述扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中所述第一 PCR引物的至少3'端部分与所述加双标签的靶DNA片段的所述3 ‘标签互补,并且其中所述第二 PCR引物的至少3 ‘ 端部分显示所述加双标签的靶DNA片段的5'标签或标签域的至少一部分的序列。
16.如权利要求15所述的方法,其中所述第一寡核苷酸引物或第二寡核苷酸引物包括 5'端部分,其中所述第一引物的至少所述5'端部分不与所述加双标签的靶DNA片段的所述3'标签互补,或者其中所述第二引物的所述5'部分不显示所述加双标签的靶DNA片段的5'标签或标签域的至少一部分的序列。
17.如权利要求15所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR引物的至少所述5'端部分不与所述加双标签的靶DNA 片段的所述3'标签互补,和/或其中所述第二 PCR引物的所述5'端部分不显示所述加双标签的靶DNA片段的5'标签域的至少一部分的序列。
18.—种从靶DNA产生加标签的环状单链DNA片段的群体的方法,所述方法包括i)将所述靶DNA与转座酶和转座子末端或转座子末端组合物孵育,所述转座子末端或转座子末端组合物包含在其5'部分中具有标签域且在其3'部分中具有转座子末端的转移链,所述孵育在其中所述转座酶催化转座反应的条件下进行,其中a)所述靶DNA被断裂产生多个靶DNA片段;和b)所述转座子末端或转座子末端组合物的所述转移链与所述多个所述靶DNA片段中的每一个片段的5'端接合产生5'加标签的靶DNA片段的群体; )使所述5'加标签的靶DNA片段变性产生单链的5'加标签的靶DNA片段;iii)将所述单链的5'加标签的靶DNA片段与核酸连接酶孵育,所述孵育在其中所述单链的5'加标签的靶DNA片段被分子内连接的条件下进行,以形成加标签的环状单链DNA 片段,每个所述加标签的环状单链DNA片段显示所述转移链的序列和所述靶DNA的一部分的序列。
19.如权利要求18所述的方法,其中所述标签域显示切割位点的序列,并且所述方法还包括将所述加标签的环状单链DNA片段与构成切割酶组合物的至少一种酶孵育,其中所述切割酶组合物切割所述加标签的环状单链DNA片段以产生加双标签的线性单链DNA片段。
20.如权利要求18所述的方法,其中所述标签域显示限制性位点的序列,并且所述方法还包括iv)使与所述标签域互补的寡核苷酸与所述加标签的环状单链DNA片段退火;ν)将所述加标签的环状单链DNA片段与识别所述限制性位点的限制性内切核酸酶孵育;其中所述限制性内切核酸酶切割所述加标签的环状单链DNA片段产生加双标签的线性单链DNA片段。
21.如权利要求18-20中任一项所述的方法,所述方法还包括扩增所述加标签的环状单链DNA片段和/或所述加双标签的线性单链DNA片段中的一种或多种。
22.如权利要求21所述的方法,其中所述扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中所述第一 PCR引物的至少3'端部分与所述加标签的环状单链DNA片段中或所述加双标签的线性单链DNA片段中的所述转移链的所述序列的至少一部分互补,并且其中所述第二 PCR引物的至少3'端部分与所述加标签的环状单链DNA片段中或所述加双标签的线性单链DNA片段中的所述转移链的互补序列的至少一部分互补。
23.如权利要求22所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中所述第一 PCR引物的所述5'端部分不与所述加标签的环状单链DNA 片段中或所述加双标签的线性单链DNA片段中的所述转移链的所述序列互补,并且其中所述第二 PCR引物的5'端部分不与所述加标签的环状单链DNA片段中或所述加双标签的线性单链DNA片段中的所述转移链的互补序列互补。
24.一种从靶DNA产生加标签的环状DNA片段的群体的方法,所述方法包括i)将靶DNA与转座酶和发夹转座子末端组合物孵育,所述发夹转座子末端组合物包含显示处于其5'端的非转移链序列、处于其3'端的转移链序列以及包含标签域的间插环序列的寡核苷酸,所述孵育在其中所述寡核苷酸可形成分子内茎-环,并且其中所述转座酶催化转座反应的条件下进行,其中a)所述靶DNA被断裂产生多个靶DNA片段;和b)所述发夹转座子末端组合物的所述寡核苷酸与所述多个靶DNA片段中的每一个片段的5'端接合产生5'加标签的靶DNA片段的群体; )将所述5'加标签的靶DNA片段的群体与依赖模板的连接酶以及以下一起孵育a)缺乏5'到3'外切核酸酶活性、3'到5'外切核酸酶活性以及链置换活性的DNA 聚合酶或b)一种或多种大小的随机序列寡核苷酸,所述一种或多种大小的随机序列寡核苷酸单独或组合在一起具有与用所述转座酶和所述发夹转座子末端组合物进行转座反应后产生的5'加标签的DNA片段中的单链缺口相同的长度;所述孵育在其中所述5'加标签的靶DNA片段中的单链缺口被填充并且每个5'加标签的DNA片段的3'端与包含所述靶DNA的互补部分的另一个5'加标签的DNA片段的5' 端接合的条件下进行,形成包含环结构中的所述标签域和所述靶DNA的一部分的两条链的加标签的环状DNA 片段。
25.如权利要求M所述的方法,其中步骤ii)的所述接合包括I)将来自步骤i)的所述5'加标签的DNA片段与所述DNA聚合酶孵育,所述孵育在其中每个5'加标签的DNA片段的3'端被延伸的条件下进行,以形成5'加标签的DNA片段延伸产物的群体;和II)将所述5'加标签的DNA片段延伸产物与所述依赖模板的连接酶孵育,所述孵育在其中所述5'加标签的DNA片段延伸产物被连接的条件下进行,从而产生所述加标签的环状DNA片段。
26.如权利要求25所述的方法,其中所述DNA聚合酶和所述连接酶在混合物中提供,并且其中步骤I)和步骤II)在单一反应混合物中进行。
27.如权利要求M所述的方法,其中步骤ii)的所述接合包括将来自步骤i)的所述 5'加标签的DNA片段与所述一种或多种大小的随机序列寡核苷酸以及所述依赖模板的连接酶孵育,所述孵育在其中所述随机序列寡核苷酸退火并填充单链缺口,并且被彼此连接或与5'加标签的DNA片段的相邻端连接的条件下进行,形成加标签的环状DNA片段。
28.如权利要求M所述的方法,所述方法还包括将所述加标签的环状DNA片段与线性 DNA、未连接的随机序列寡核苷酸和/或未与靶DNA接合的发夹转座子末端组合物分离。
29.如权利要求沈所述的方法,所述方法还包括用T5外切核酸酶处理包含所述加标签的环状DNA片段的反应混合物以除去线性DNA。
30.如权利要求M到四中任一项所述的方法,所述方法还包括如下步骤在每个所述环结构中切割所述加标签的环状DNA片段以产生扇尾形双链DNA片段,该扇尾形双链DNA 片段的每条链在其5'端上具有标签的一部分并且在其3'端上具有标签的一部分。
31.如权利要求30所述的方法,其中在所述环结构中的所述标签序列包括限制性位点,并且所述方法还包括iv)使与所述标签序列中的所述限制性位点互补的寡核苷酸与所述加标签的环状DNA 片段退火;ν)将所述加标签的环状DNA片段与识别所述限制性位点的限制性内切核酸酶孵育;其中所述限制性内切核酸酶切割所述加标签的环状DNA片段产生所述扇尾形双链DNA 片段。
32.如权利要求30所述的方法,其中所述环结构中的所述标签域包括可使用切割酶组合物切割的一个或多个位点,所述方法还包括将所述加标签的环状DNA片段与所述切割酶组合物孵育,所述孵育在其中所述加标签的环状DNA片段在所述切割位点处被切割的条件下进行,以产生所述扇尾形双链DNA片段。
33.如权利要求19或权利要求32所述的方法,其中所述切割酶组合物包括N-糖基化酶和AP内切核酸酶。
34.如权利要求33所述的方法,其中所述N-糖基化酶选自尿嘧啶-N-糖基化酶和AP 内切核酸酶及FPG蛋白,并且所述AP内切核酸酶选自大肠杆菌(E.coli)内切核酸酶III 或大肠杆菌内切核酸酶IV。
35.如权利要求30到34中任一项所述的方法,所述方法另外包括使所述扇尾形双链 DNA片段变性产生加双标签的线性单链DNA片段。
36.如权利要求M到35中任一项所述的方法,所述方法还包括在DNA测序方法或扩增反应中使用所述DNA片段作为模板。
37.如权利要求36所述的方法,所述方法还包括扩增加标签的环状DNA片段、扇尾形双链DNA片段和/或加双标签的线性单链DNA片段。
38.如权利要求37所述的方法,其中所述扩增包括使用PCR扩增反应、链置换扩增反应、滚环扩增反应、连接酶链反应、转录介导的扩增反应或环介导的扩增反应中的一种或多种。
39.如权利要求38所述的方法,其中所述扩增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶链反应,其中所述第一 PCR引物的至少3'端部分与所述标签域的至少一部分互补,并且其中所述第二 PCR引物的至少3'端部分显示所述标签域的至少一部分的序列。
40.如权利要求39所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中所述第一 PCR引物的所述5'端部分不与所述标签序列互补,并且其中所述第二 PCR引物的所述5'端部分不显示所述标签域的序列。
41.如权利要求16、17、23或40中任一项所述的方法,其中所述第一PCR引物和/或所述第二 PCR引物的所述5'端部分显示标签域。
42.如权利要求41所述的方法,其中所述标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。
43.如权利要求20所述的方法,其中所述标签域为测序标签域,所述测序标签域包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B 测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、 Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics测序标签。
44.一种对靶DNA的片段加标签的方法,所述方法包括i)将靶DNA与转座酶和转座子末端组合物孵育,该转座子末端组合物包含显示处于其 5'部分中的不为转座子末端的标签域的序列以及处于其3'部分中的所述转移的转座子末端的序列的转移链,其中a)所述靶DNA被断裂;和b)所述转座子末端组合物的所述转移链与所述靶DNA的片段的5'端接合产生5'加标签的靶DNA片段。
45.一种用于产生靶DNA的5'加标签的片段的文库的方法,所述方法包括i)将所述靶DNA与转座酶和转座子末端组合物孵育,该转座子末端组合物包含显示处于其5'部分中的一种或多种用于特定目的的标签域的序列以及处于其3'部分中的转移的转座子末端的序列的转移链,所述孵育在其中所述转座酶催化转座反应的条件下进行, 其中a)所述靶DNA被断裂;和b)所述转座子末端组合物的所述转移链与所述靶DNA的片段的5'端接合产生5'加标签的靶DNA片段;其中所述转座反应从所述靶DNA产生构成DNA片段文库的多个5'加标签的靶DNA片段。
46.一种组合物,所述组合物包含合成的核酸分子,所述合成的核酸分子具有含标签域的5'部分和含转座子末端的转移链的3'部分。
47.一种组合物,所述组合物包含多种合成的核酸分子,其中所述核酸分子含有包含具有至少一个核苷酸差异的标签域的5'部分和包含转座子末端的转移链的3'部分。
48.如权利要求46所述的组合物,其中至少所述3'部分为双链DNA。
49.如权利要求46所述的组合物,其中所述转座子末端为Tn5转座子末端。
50.如权利要求46所述的组合物,其中所述转座子末端为Mu转座子末端。
51.如权利要求46或权利要求47所述的组合物,其中所述标签域包括限制性位点域、 捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。
52.如权利要求55所述的组合物,其中所述标签域包括测序标签,所述测序标签包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B 测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、 Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics测序标签。
53.如权利要求46所述的组合物,所述组合物包含纯化的转座酶。
54.如权利要求46所述的组合物,其中所述转座酶选自Tn5转座酶和Mu转座酶。
55.如权利要求53所述的组合物,其中所述核酸分子和所述转座酶在混合物中提供。
56.如权利要求55所述的组合物,所述组合物还包含非离子洗涤剂。
57.如权利要求46所述的组合物,其中所述非离子洗涤剂包括NonidetΡ-40和/或吐温—20 ο
58.一种试剂盒,所述试剂盒包含权利要求46-61中任一项所述的组合物。
59.如权利要求58所述的试剂盒,所述试剂盒还包含DNA连接酶。
60.如权利要求58所述的试剂盒,所述试剂盒还包含DNA聚合酶。
61.如权利要求58所述的试剂盒,所述试剂盒还包括用于扩增反应的试剂。
62.如权利要求61所述的试剂盒,其中所述扩增反应为聚合酶链反应。
63.如权利要求62所述的试剂盒,其中所述用于扩增反应的试剂包括至少一种引物。
64.如权利要求63所述的试剂盒,其中至少一种引物包括含与所述核酸分子的所述 5'部分的所述标签域的互补序列互补的3'部分的引物。
65.如权利要求58所述的试剂盒,其中所述标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。
66.如权利要求69所述的试剂盒,其中所述标签域包括测序标签域,所述测序标签域包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B 测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics测序标签。
67.如权利要求65所述的试剂盒,所述试剂盒还包括用于DNA测序反应的试剂。
68.一种反应混合物,所述反应混合物包括双链靶DNA和权利要求46-57中任一项所述的组合物。
69.一种组合物,所述组合物包含纯化的转座酶和多种合成的转座子末端或转座子末端组合物。
70.如权利要求70所述的组合物,其中所述转座子末端组合物包含发夹转座子末端。
71.如权利要求70所述的组合物,其中所述合成的转座子末端或转座子末端组合物包括转移链和非转移链。
72.如权利要求70所述的组合物,其中所述转移链包含5'标签域。
73.如权利要求72所述的组合物,其中所述标签域包括限制性位点域、捕获标签域、测序标签域、扩增标签域、检测标签域、地址标签域和转录启动子域中的一种或多种。
74.如权利要求73所述的组合物,其中所述标签域包括测序标签,所述测序标签包括选自以下的测序标签或由选自以下的测序标签构成Roche 454A测序标签和Roche 454B 测序标签、ILLUMINA S0LEXA 测序标签、Applied Biosystems 的 SOLID 测序标签、 Pacific Biosciences 的 SMRT 测序标签、Pollonator Polony 测序标签、或 Complete Genomics测序标签。
75.如权利要求71所述的组合物,其中所述多种合成的转座子末端包括彼此具有至少一个核苷酸差异的至少两条转移链。
76.如权利要求71所述的组合物,其中所述转移链包含5'部分和3'部分,其中所述转移链的所述5'部分中的至少两个包含彼此具有至少一个核苷酸差异的标签,并且其中所述转移链的所述3'部分包含相同的转座子末端序列。
77.如权利要求69所述的组合物,其中所述转座子末端包括Mu转座子末端并且所述转座酶为Mu转座酶。
78.如权利要求75所述的组合物,其中所述转移链的所述3'部分包括来自Mu转座子末端的序列,并且其中所述转移链的所述5'部分不是来自Mu转座子。
79.如权利要求69所述的组合物,其中所述转座子末端包括Tn5转座子末端并且所述转座酶为Τη5转座酶。
80.如权利要求75所述的组合物,其中所述转移链的所述3'部分包括来自Τη5转座子末端的序列,并且其中所述转移链的所述5'部分不是来自Τη5转座子。
81.—种组合物,所述组合物包括DNA片段文库,其中所述DNA片段文库包括所述靶 DNA的片段,所述靶DNA的片段具有包含来自转座子末端或转座子末端组合物的转移链的序列的5'端。
82.如权利要求81所述的组合物,其中来自所述转移链的所述序列包含5'标签域。
83.如权利要求82所述的组合物,其中所述DNA片段文库包括所述靶DNA的双链片段。
84.如权利要求81所述的组合物,其中所述DNA片段文库包括含与转座子末端或转座子末端组合物的转移链互补的3'标签的靶DNA的片段。
85.一种组合物,所述组合物包括含如下部分的靶DNA的加标签的环状DNA片段所述部分包含处于所述部分的5'端的非转移链序列、处于所述部分的3'端的转移链序列、包含标签序列的间插的环序列、靶DNA的一部分的两条链的序列。
86.—种组合物,所述组合物包含靶DNA的加标签的环状单链DNA片段,所述加标签的环状单链DNA片段包含来自转座子末端或转座子末端组合物的转移链序列以及靶DNA的单链部分。
87.如权利要求86所述的组合物,其中所述转移链序列包括标签域。
88.一种组合物,所述组合物包含靶DNA的扇尾形双链DNA片段,所述扇尾形双链DNA 片段包含靶DNA的双链部分,其中每条链具有包含转移链序列的至少一部分的5'端和包含非转移链序列的至少一部分的3'端。
全文摘要
本发明提供了使用转座酶和转座子末端在体外产生双链靶DNA的广泛断裂和5′加标签、然后不经PCR扩增反应使用DNA聚合酶产生5′和3′加标签的单链DNA片段的方法,组合物和试剂盒,其中5′端上的第一标签显示转移的转座子末端的序列以及任选的另外的任意序列,并且3′端上的第二标签显示与第一标签显示的序列不同的序列。所述方法可用于产生5′和3′加标签的DNA片段以用于多种过程,包括用于环境样品中的DNA的宏基因组分析、DNA的拷贝数变异(CNV)分析以及包括大规模平行DNA测序(所谓的“下一代测序”)在内的比较基因组测序(CGS)的过程。
文档编号C07H21/00GK102264914SQ200980152461
公开日2011年11月30日 申请日期2009年10月24日 优先权日2008年10月24日
发明者加力·大鹿, 杰罗马·箭之撒, 海缨·李·格鲁内瓦德, 猊克拉士·铠如酋 申请人:阿霹震中科技公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1