核酸模板的分类的制作方法

文档序号:581622阅读:780来源:国知局
专利名称:核酸模板的分类的制作方法
核酸模板的分类相关专利申请的交叉引用本申请请求2008年12月11日提交的美国专利申请号61/201,551,2009年5月 21日提交的美国临时专利申请号61/180,350和2009年6月12日提交的美国临时专利申请号61/186,661的优先权,他们的全部内容通过引用纳入本文用于所有目的。
背景技术
开发各种所需应用的生物学过程分析试验。例如对关键生物学通路活性的监测可导致更好地了解这些系统的功能以及可能破坏这些系统正常功能的因素。事实上,由于特定生物学通路的运行或中断所引起的各种疾病是许多医学研究的焦点。通过对这些通路的了解,人们就可模拟出影响它们的方法来预防疾病发生或在其有所表现时减轻症状。开发生物学过程监测方法的一个老套例子存在于药学研究和开发领域。具体说, 为促进分析,常常在体外系统中重现或模拟这些通路中与治疗有关的生物学通路,或其中的各步骤或各步骤的某些亚组。通过观察存在和没有潜在治疗组合物,如药物组合物或其他物质时,这些步骤或整个通路的进程,人们可以鉴定这些组合物影响体外系统,和可能有益地影响正有通路在以有害方式发挥作用的生物体的能力。具体的例子有,甲基转移酶对胞嘧啶5’位点的可逆甲基化是最为广泛研究的外遗传修饰之一。在哺乳动物中,5-甲基胞嘧啶(5-MeC)常见于CpG 二核苷酸,后者常簇集存在于转录起始位点处或其附近被称为 CpG岛的区域内。CpG岛区内胞嘧啶的甲基化可干扰转录因子结合,并与转录抑制基因调节相关。此外,已知DNA甲基化是哺乳动物发育所必需,并且与癌症和其他疾病过程相关。 近来,在大脑的某些类型细胞中鉴定到新的5-羟甲基胞嘧啶外遗传标志,提示其在神经元功能的外遗传控制中具有作用(S. Kriaucionis 等,Science 2009,324(5929) :929-30, 全文通过引用纳入本文用于所有目的)。本技术领域的以下文献提供了关于胞嘧啶甲基化及其对基因调控、发育及疾病过程影响的进一步信息A. Bird,Genes Dev 2002,16,6 ; M-Gardiner-Garden等,J Mol Biol 1987,196,261 ;S. Saxonov等,Proc Natl Acad Sci U S A 2006,103,1412 ;R. Jaenisch 等,Nat Genet 2003,33 增刊,245 ;E. Li 等,Cell 1992,69, 915 ;Α· Razin 等,Hum Mol Genet 1995,4 特刊,1751 ;Ρ· A. Jones 等,Nat Rev Genet 2002, 3,415 ;P. A. Jones 等,Nat Genet 1999,21,163 禾口 K. D. Robertson,Nat Rev Genet 2005,6, 597,所有这些的全文通过引用纳入本文用于所有目的。人类基因甲基化绘图是比确定人类基因组更复杂的任务,因为甲基化状态在组织类型之间不同,随年龄变化,使甲基化状态有所不同,并被环境因素该变(P.A. Jones等, Cancer Res 2005,65,11M1,其全文通过引用纳入本文用于所有目的)。因为现有的DNA测序技术对样品制备的要求和短读取长度的特点,全面、高分辨率地分析给定样品的全基因组甲基化模式是很有难度的(K. R-Pomraning等,Methods 2009,47,142,其全文通过引用纳入本文用于所有目的)。亚硫酸氢盐测序法是现有单核苷酸分辨率的甲基化分析方法中的上选(S. Beck 等,Trends Genet 2008,24,231 和 S. J. Cokus 等,Nature 2008,452,215,它们的全文通过引用纳入本文用于所有目的)。用亚硫酸氢盐处理DNA可使甲基化胞嘧啶转变成尿嘧啶,但不转化 5-MeC(M. Frommer 等,Proc Natl Acad Sci U S A 1992,89,1827,其全文通过引用纳入本文用于所有目的)。然后扩增该DNA(将所有的尿嘧啶转变成胸腺嘧啶),再用各种方法分析,包括基于微阵列的技术(R. S. Gitan等,Genome Res 2002,12,158,其全文通过引用纳入本文用于所有目的)或第二代测序技术(K. H. Taylor等,Cancer Res 2007,67,8511 和R. Lister等,Cell 2008,133,523,二者的全文通过引用纳入本文用于所有目的)。虽然亚硫酸氢盐技术大大促进了甲基化DNA的分析,但它们也有几种缺点。首先,亚硫酸氢盐测序要求大量时间制备样品(K. R. Pomraning等,同上)。其次,使非甲基化胞嘧啶完全转变成尿嘧啶的苛刻反应条件可导致DNA降解(C. Grunau等,Nucleic Acids Res 2001,29, E65, 其全文通过引用纳入本文用于所有目的),因此,需要样品的起始用量很大,这对某些应用可能成为问题。此外,由于亚硫酸氢盐测序依赖于微阵列或第二代DNA测序技术来读取甲基化状态,它也有这些方法具有的相同局限性。对基于阵列的过程,亚硫酸氢盐导致的序列复杂性降低使得难于设计出进行全基因组分析所需的独特探针(S. Beck等,同上)。大多数第二代DNA测序技术采用短读取(short reads),因此难以对高度重复基因组区域进行排列比对(KUomraning等,同上)。因为许多CpG岛位于这种区域内,这就特别成问题。鉴于这些局限,亚硫酸氢盐测序也不太适合甲基化的从头分析(S. Beck等,同上)。另一广泛应用的技术,甲基化DNA免疫沉淀(MeDIP)技术中,采用抗5_MeC的抗体来富集甲基化DNA序列(M. Weber等,Nat Genet 2005,37,853,其全文通过引用纳入本文用于所有目的)。MeDIP对于全基因组甲基化状态的评估有许多优点,但它提供的碱基分辨率不如亚硫酸氢盐处理方法那样高。此外,它也受现有微阵列和第二代测序技术的相同局限的限制。旨在提高我们对于人类甲基化组认识的研究努力会极大地受益于新的、不再受限于上述局限的甲基化分析技术的开发。因此,存在对于核酸序列中的修饰,特别是核酸甲基化修饰的改进检测技术的需要。通常,模拟的生物学系统依赖于大宗反应确定生物反应的总体趋势并提供该大宗系统如何与不同效应器反应的指示。虽然这类系统可用作体内大宗反应的模型,但在对这些大宗反应结果进行平均时丢失了大量信息。具体说,个别分子复合体的活性和其所受影响的信息通常不能从这类大宗数据收集方法中得到。核酸合成的单分子实时分析已显示能提供胜过测序方法中常用的核酸合成监测法的有力优势。具体说,在监测核酸聚合酶复制核酸的同时监测其合成过程,可获得经数百万年进化而完善的系统的优点。特别是,天然的DNA合成过程能够在极短时间内以对于被复制模板的极高保真度复制全基因组。本发明涉及用于监测生物学反应的进程和效应的多种不同单分子实时分析,特别是检测核酸序列中的修饰。例如,本发明提供了基于对单个聚合酶分子动力学的实时、高多重性观察的直接甲基化测序技术。该技术将提供对快速、经济的甲基化模式分析,即使是基因组的重复区域。发明简述本发明一般涉及对修饰核酸序列的检测,特别是采用实时直接检测方法对核酸序列中甲基化碱基的检测。预期本发明将对旨在阐明DNA甲基化在人类健康中作用的研究有重大影响。在本发明的某些方面,提供鉴定核酸分子中修饰的方法。通常,提供包含所述修饰的模板核酸和能加工该模板的酶。使模板核酸与酶接触,然后监测酶对模板的加工。检测加工过程中的变化,这种变化是模板中存在修饰的指示。可用本发明方法检测的示范性修饰包括但不限于甲基化碱基(如5-甲基胞嘧啶、N6-甲基腺嘌呤等),假尿苷碱基,7,8-二氢-8-氧鸟嘌呤碱基,2’-0-甲基衍生碱基,缺口,脱嘌呤位点,脱嘧啶位点,嘧啶二聚体,顺式模板(cis-platen)交联产物,氧化损伤,水解损伤,大碱基加合(bulky base adducts), 胸腺嘧啶二聚体,光化学反应产物,链间交联产物,错配碱基,二级结构和结合试剂。在优选实施方式中,掺入酶合成的新生链中的核苷酸或其类似物被显著标记,使得能鉴定掺入特定核苷酸或核苷酸类似物的序列。在某些优选实施方式中,通过磷酸基团,如α磷酸基团以外的磷酸基团连接标记与核苷酸或核苷酸类似物。如此可在掺入新生链时从核苷酸或核苷酸类似物上除下标记。在一些实施方式中,模板核酸用酶加工前经过处理,例如改变其修饰。这种处理可以是化学或酶处理,包括,例如糖基化酶修饰、亚硫酸氢盐修饰、DMS修饰、胞嘧啶甲基转移酶修饰、TETl修饰和胞苷脱氨酶修饰。在一些实施方式中,通过酶将非天然核苷酸类似物 (如嵌二萘类似物)掺入到合成的新生链中。在一些实施方式中,所述方法包括处理模板和非天然核苷酸类似物掺入到新生链中。在一些实施方式中,非天然核苷酸类似物掺入新生链中的位置与模板的修饰配对。例如,模板中的甲基化胞嘧啶可与修饰的鸟嘌呤核苷酸类似物配对;模板修饰可与非天然核苷酸类似物配对以形成非天然碱基对,如异胞嘧啶与异鸟嘌呤;5-甲基异胞嘧啶与异鸟嘌呤;Im-N°与Ihi-On ;A*与f ;和8-oxoG与腺嘌呤。在一些实施方式中,非掺入性的核苷酸类似物与模板/酶复合体结合,但不掺入新生链中,这种 “无效臂合作用的检测作为模板中有修饰的指示。这种非掺入性的核苷酸类似物优选被显著标记以利于监测,并可选地,用以区分这种结合与含标记的可掺入核苷酸类似物的掺入。在某些实施方式中,模板核酸包含内部互补区(如双链部分)和至少一条单链部分,优选其修饰位于至少一个内部互补区中。在某些实施方式中,模板是环形模板。在某些实施方式中,模板是包含至少二个内部互补区的环形模板。在某些实施方式中,所述酶是聚合酶,如DNA聚合酶、RNA聚合酶、逆转录酶或它们的衍生物或变体。在优选实施方式中,所述酶是能链置换的聚合酶。在特定实施方式中,所述酶是Φ四聚合酶,可选地,包含至少一个以下位点的突变Κ392、Κ422、193、Μ188、Κ392、V399、Τ421、Κ422 ;S95、ΥΙΟΙ、Μ102 ;Q99、 L123、Κ124、Τ189、Α190 ;G191、S388 ;Ρ127、L384、Ν387、S388 和 L389、Υ390 及 G391。在本发明各种实施方式中所监测的酶加工模板过程中变化的例子包括但不限于 动力学、持续合成能力(processivity)、信号特征、差错度量(error metrics)、信号内容等。在一些实施方式中,改变只发生在修饰处,在其它实施方式中,改变发生在靠近修饰的一个或多个位置,也可包括修饰处。在某些方面,所述方法还包括绘制修饰图。在某些优选实施方式中,绘制修饰图包括在临检测加工中的改变之前,检测加工中的改变期间和/或刚检测加工中的改变之后所产生的一部分读取序列进行分析以确定与模板核酸互补的序列;测定与模板核酸互补序列的补体;绘制靠近与模板核酸互补序列的补体处的模板核酸位置上的修饰。在某些实施方式中,所述加工中可指示修饰的变化是加工过程中的动力学差异(如检测到脉冲间隔期(interpulse duration),脉冲宽度、持续合成能力等中的一个或多个改变)和/或差错度量的改变(如精确度、不导致掺入的结合事件的增加等)。加工过程中的改变可表明模板核酸中存在的修饰类型,因为不同类型的修饰对酶的活性和/或保真度有不同影响。在优选实施方式中,在酶加工模板过程中进行实时监测。在优选实施方式中,将模板核酸与酶形成的复合体固定在基板的反应位置,在更优选的实施方式中,将多个复合体固定在基板上光可分辨的反应位置,其中固定在反应位置之一处的一个复合体可与固定在其它反应位置的其它复合体光可分辨。在某些实施方式中,光可分辨的反应位置是基板中的纳米级孔,可以是光限制件,如零模式波导管。在优选实施方式中,所述模板核酸是监测期间彼此可光分辨的多种模板核酸。优选模板核酸在接触酶之前不经扩增。在一些实施方式中,所述修饰是模板核酸中的二级结构,如发夹环,所述修饰的变化是动力学变化,如脉冲间隔期延长或脉冲宽度增加。鉴定二级结构改变的某些方法通常包括暂停前和暂停后模板核酸的读取序列;鉴定暂停前产生的与暂停后所产生第二部分读取序列互补的第一部分读取序列;至少根据所述第一部分与第二部分的核苷酸组成,确定加工过程中模板核酸第一部分与第二部分退火形成发夹环的可能性。在本发明另一方面,提供检测单个核酸模板上试剂结合的方法。在某些实施方式中,这种方法通常包括提供单个核酸模板与聚合酶的复合体;将反应混合物引入该复合体,其中所述反应混合物包含所述试剂;监测聚合酶合成的多聚核苷酸,其中所述多聚核苷酸与所述单个核酸模板互补,合成中的变化可表明所述试剂与单个核酸模板结合。适用于这种方法的试剂的例子包括但不限于转录因子、聚合酶、逆转录酶、组蛋白、限制性酶、抗体、核酸结合蛋白和核酸结合剂。适用于这种方法的单个核酸模板的例子包括但不限于双链DNA、双链RNA、单链DNA、单链RNA、DNA/RNA杂交体,和包含双链与单链区的模板。在本发明的某些方面,测定了所述试剂的一致结合位点。这种测定包括,例如,在存在该试剂时对一组单个核酸模板进行多重合成测序反应产生一组受结合影响的新生多聚核苷酸序列;在缺少该试剂时对该组单个核酸模板进行多重合成测序反应产生一组全长新生多聚核苷酸序列;分析受结合影响的新生多聚核苷酸序列,以确定在存在所述试剂进行合成测序反应期间所述试剂与单个核酸模板结合的位置;和鉴定该位置处与全长新生多聚核苷酸序列的一致序列,从而鉴定所述试剂的一致结合位点。在某些实施方式中,所述受结合影响的新生多聚核苷酸序列是截短的新生多聚核苷酸序列;在其它实施方式中,所述受结合影响的新生多聚核苷酸序列是其合成在所述试剂结合位置处暂停的新生多聚核苷酸序列。在本发明还有一方面,提供检测合成测序反应期间单个核酸模板中修饰的方法。 例如,这种方法可包括提供单个核酸模板与聚合酶的复合体;将反应混合物引入该复合体,反应混合物中包含能特异性结合所述修饰的试剂;和监测聚合酶合成的多聚核苷酸,其中合成的多聚核苷酸与该单个核酸模板互补,并且该多聚核苷酸合成的暂停或中止表明所述试剂结合于所述单个核酸模板,从而得以检测所述单个核酸模板中的修饰。在某些实施方式中,所述修饰是8-氧鸟嘌呤损伤,和/或所述试剂选自下组hOGGl、FPG、yOGGl、AlkA、 Nth、Nei, MutY, UDG, SMUG、TDG, NEIL、抗8-氧鸟嘌呤的抗体、或其结合域。在其它实施方式中,所述修饰是甲基化碱基,和/或所述试剂是选自下组的蛋白质MECP2、MBDU MBD2、MBD4、UHRF1、抗甲基化碱基的抗体、或其结合域。在还有其它实施方式中,所述修饰是核酸模板中二级结构的形成。优选所述复合体被固定在光限制件中。所述模板可包括,例如,线形单链核酸、环形单链核酸、线形双链核酸、环形双链核酸、或它们的组合物。在某些实施方式中,模板核酸中的修饰可以通过例如合成测序反应中,在反应混合物中加入损伤修复机制所需组分,得以修复。在某些实施方式中,合成测序反应的序列读取长度比用所述单个核酸模板与聚合酶复合体但缺少所述试剂与损伤修复机制进行合成测序反应的更长,。在本发明另一方面,提供在合成测序反应期间绕过单个核酸模板中一个或多个修饰处的方法。某些示范性方法包括提供所述单个核酸模板与测序引擎的复合体;将反应混合物引入该复合体,所述反应混合物包含绕道聚合酶;启动合成测序反应,监测测序引擎合成多聚核苷酸,其中所述多聚核苷酸与单个核酸模板互补,多聚核苷酸合成的暂停或中止表明测序引擎遇到单个核酸模板的修饰处;随后监测绕道聚合酶合成的多聚核苷酸, 其表明该修饰处被绕过;每次遭遇到单个核酸模板中的下一修饰处时,重复此监测步骤, 从而在合成测序反应期间绕过单个核酸模板中的一个或多个修饰处。在某些实施方式中, 绕道聚合酶包含可检测标记,合成测序反应期间检测到该可检测标记的信号表明绕道聚合酶在活跃地合成多聚核苷酸。在优选实施方式中,合成测序反应的读取序列长度比采用单个核酸模板与聚合酶复合体但缺少绕道聚合酶进行的另外合成测序反应的更长。在特定实施方式中,所述反应混合物包含多个不同的绕道聚合酶和持续合成因子(processivity factor)。优选将单个核酸模板、测序引擎和绕道聚合酶中至少一种直接或间接地固定在光限制件中。例如,可通过与固定在光限制件中的寡核苷酸引物杂交固定所述模板。在某些实施方式中,用测序引擎在单个反应位点处多次加工单个核酸模板,进一步产生冗余的序列数据。用于本方法的核酸模板可以是环形和/或可包含感兴趣核酸区段的多个拷贝。此外,在某些实施方式中,合成测序反应产生的多聚核苷酸包含与所述感兴趣区段互补区段的多个拷贝,从而可进一步产生冗余的序列数据。在其他方面,提供了新型组合物。例如,在某些实施方式中,本发明的组合物包含基板,其上具有的反应位点能与基板上其它反应位点光可分辨;固定在该反应位点上的模板与测序引擎的单一复合体;可掺入核苷酸或核苷酸类似物的混合物;模板核酸含有至少一个修饰,模板的修饰处或修饰附近的加工与模板远离修饰处不同。在某些实施方式中,所述修饰是模板中的非天然碱基。修饰可位于模板核酸中与测序引擎合成的新生链互补的那条链中,或模板核酸中被测序引擎置换的那条链中。在某些优选实施方式中,模板核酸包含内部互补区域,可选地,所述修饰位于该内部互补区域之一中。某些实施方式还包括至少一种类型的非掺入性核苷酸类似物。某些实施方式包括至少一种类型的非天然可掺入性核苷酸类似物。优选本发明组合物中的一个或多个或所有的核苷酸或核苷酸类似物含有可将不同类型的核苷酸或核苷酸类似物彼此区分的不同标记。本发明的组合物也可包含测序引擎以外的能结合所述修饰和/或能化学或酶促改变所述修饰的试剂。优选本发明的组合物包含测序引擎产生的新生链,所述新生链与模板核酸互补,可选地,包含与模板核酸互补区域的多个拷贝。此外,某些组合物包含基板中的纳米级孔,反应位点安置在该纳米级孔中,如零模式波导管中。在本发明其它方面,提供了鉴定核酸模板中修饰的系统。在某些优选的实施方式中,本发明的系统包含固相支持物,其上(如在反应位点,如纳米级孔中,如零模式波导管中)安置有聚合酶复合体,所述聚合酶复合体包含含有修饰的核酸模板;接受固相支持物的固定平台;与该固相支持物至少一部分进行光通信以检测其发射信号的光系统;与固定平台或光系统操作性连接用于使光系统或固相支持物中的一方相对另一方移动的转换系统;和与光系统操作性连接的数据加工系统。所述聚合酶复合体优选包含具有加工核酸模板活性的聚合酶。所述聚合酶复合体更优选包含能通过模板指导的合成持续合成新生链的聚合酶。在优选的实施方式中,所述光系统能检测固相支持物在核酸模板加工期间发出的信号。在还有其他方面,本发明提供用于将反应数据转变成修饰检测数据的机器执行方法,其中反应数据代表了根据模板核酸的核苷酸序列合成新生链的合成测序反应期间的一系列活动,而修饰检测数据代表一个或多个修饰在模板核酸中的存在。优选通过在机器用户介面中实施该机器执行方法的一个或多个步骤,所述机器装有存储在机器可读介质中的指令和执行所述指令的处理器。在本发明的最后方面,提供了计算机程序产品。在某些实施方式中,转变反应数据的机器执行方法包括区分真正掺入与随机脉冲的分类器,基于隐马尔柯夫模型构架的分割算法,和/或根据条件随机场框架(conditional random field framework)的分割算法,进行分类。在某些特定实施方式中,所述方法可鉴定模板中随机脉冲密度高于真正掺入的区域。在某些特定实施方式中,所述方法可鉴定模板中IPD较高的区域。本发明的示范性计算机程序产品通常包括计算机可用介质,该介质中载有计算机可读程序代码,所述计算机可读程序代码适合于被运行以执行本发明的机器执行方法;和机器可读介质,用以储存所述机器执行方法的一个或多个步骤所得的结果。附图简要说明

图1提供了单分子核酸实时(SMRT )核酸测序的示范性说明。图2提供了各类脉冲跟踪反应数据的说明性示例。图3示意显示了相对DNA聚合酶活性位点位于其5'方向碱基上的5_MeC的结构模型。图4显示了 5-碱基DNA甲基化测序的示范性实施方式。图4A描述基因组DNA片段化以产生DNA模板。图4B显示DNA糖基化酶从模板上切去5_MeC。图5显示了反应的说明性实施方式,反应包含线形模板和能识别单链模板中损伤的损伤结合试剂。图6显示了本发明的一种实施方式,包含环形模板和能识别双链模板中损伤的损伤结合试剂。图7显示了对真正掺入(实线)与随机脉冲(虚线)观察随时间的变化。图8提供了用于测序跟踪期间划分暂停(P)状态与测序状态的简单隐马尔柯夫模型的说明性示例。图9提供了本发明系统的说明性示例。图IOA提供了本发明模板核酸的示范性示意图。图IOB提供如图IOA描述的模板核酸的脉冲间隔期的绘图。图11提供了含5-甲基胞嘧啶修饰的模板核酸中IPD比例对模板位置所作的图。图12提供了含5-甲基胞嘧啶修饰的模板核酸中IPD比例对模板位置所作的图。
图13A提供了本发明的示范性模板核酸的示意图。图1 提供了图13A描述的模板核酸的脉冲间隔期图。图13C提供了图1 中数据的ROC曲线。图14提供了包含N6-甲基腺嘌呤修饰的模板核酸中IPD比例对模板位置所作的图。图15提供了包含5-羟甲基胞嘧啶修饰的模板核酸中IPD比例对模板位置所作的图。图16提供了包含5-羟甲基胞嘧啶修饰的模板核酸中脉冲宽度比例对模板位置所作的图。图17提供了包含8-氧鸟嘌呤修饰的模板核酸中IPD比例对模板位置所作的图。图18提供了包含8-氧鸟嘌呤修饰的模板核酸中脉冲宽度比例对模板位置所作的图。发明详述I.概述本发明总体涉及用于检测核酸序列中修饰的方法、组合物和系统,在特别优选的方面,它们用于通过单分子核酸分析检测模板序列中的甲基化核苷酸。在核酸序列中检测出修饰的能力有助于绘制各种类型修饰和/或多组核酸序列,如跨越一组mRNA转录物、跨越感兴趣染色体区域或跨越全基因组的图谱。所绘制的修饰图谱然后可以与核酸的转录活性、核酸二级结构、siRNA活性、mRNA翻译动态、DNA和RNA结合蛋白的动力学和/或亲和力、及核酸(如DNA和/或RNA)代谢的其他方面相关联。虽然就单链DNA分子(如单链DNA模板)中的修饰核苷酸或其它修饰的检测对本发明的某些实施方式进行描述,但本发明的多种方面可应用于许多不同类型的核酸,包括, 例如单链和双链核酸,可包括 DNA、RNA (如 mRNA、siRNA、microRNA、rRNA、tRNA、snRNA 等)、 RNA-DNA杂交体、PNA、LNA、吗啉代与其它RNA和/或DNA模拟物及其衍生物、或上述的任意组合。本文提供的用于本方法的核酸、组合物和系统可以全部由天然核苷酸组成,或可以包含能与天然核苷酸配对或能与相同或不同的非天然碱基/核苷酸配对的非天然碱基/核苷酸(如合成的和/或工程改造的)。在某些优选的实施方式中,所述核酸包含单链与双链区域的组合,如2009年3月27日提交的U. S. S. N. 12/383,855和12/413,258中所述的模板, 它们的全文通过引用纳入本文用于所有目的。具体说,需要逆转录酶作PCR扩增的技术因为所作处理不能在扩增子中保留修饰,因此难以检测mRNA的修饰。本发明提供的方法不需要进行这种扩增而能分析mRNA分子的修饰。一般来说,本发明的方法包括监测分析反应以收集“反应数据”,此反应数据可表明反应的进展。反应数据包括直接收集的反应数据,以及对该直接收集数据作不同处理所得到的结果,它们的任何一种或组合可作为模板核酸中存在修饰的信号。例如,某些类型的数据是在反应过程中实时收集,例如与反应动力学相关的度量、持续合成能力、信号特征等。信号特征视所监测分析反应的类型而不同。例如,一些反应采用可检测标记来标记一种或多种反应组分,可检测标记的信号特征包括但不限于信号的类型(如波长、电荷等) 和信号的形状(如高度、宽度、曲线等)。另外,也可采用多种信号的信号特征(如瞬时靠近的信号),包括,例如,反应期间信号之间的距离、额外(如不与反应进程对应)信号的数目、内部互补性和局部信号内容(即给定信号之前和/或之后的一种或多种信号)。例如,模板引导的测序反应常常联合多个核苷酸掺入事件的信号数据以产生所合成新生链的序列读取,利用这种序列读取产生模板链序列,例如通过互补性。对实时反应数据作统计学分析,产生其它类型的反应数据,包括,例如,精确度、准确性、一致性等。在一些实施方式中, 也可利用所监测反应以外来源的数据。例如,可将核酸测序反应产生的序列读取与重复实验产生的序列读取作比较,或与来自相同或相关生物学来源的已知或产生的参比序列作比较。或者,或另外,可用未修饰的核苷酸扩增一部分模板核酸制品然后测序以提供实验参比序列,与没有扩增的原模板序列作比较。虽然本文详细描述了利用特定类型反应数据检测某种类型修饰的某些具体实施方式
,但应理解所述方法、组合物和系统不限于这些具体实施方式
。可综合不同类型的反应数据以检测各种修饰,在某些实施方式中,可在对单个模板的单次反应中检测和鉴定一种以上的修饰。基于本文提供的教导,对本发明详述实施方式的这些变化对本领域普通技术人员是显而易见的。在某些实施方式中,产生和分析冗余的序列信息以检测模板核酸中的一种或多种修饰。可用各种方法实现这种冗余度,包括用同一初始模板进行多次测序反应,例如采用阵列形式,如ZMW阵列。在一些实施方式中,不太可能在给定模板的所有拷贝中发生损伤,可综合所述多次反应产生的反应数据(如序列读取、动力学、信号特征、信号内容和/或进一步统计学分析的结果),进行统计学分析以确定模板的一致序列。以此方式,模板第一拷贝中某区域的反应数据可以用模板第二拷贝中同一区域的反应数据进行补充和/或校正。类似地,可扩增模板(如通过滚动循环扩增)产生含模板的多个拷贝的多联体,测定该多联体的序列,从而产生内在冗余的测序读取。如此,该多联体第一区段(对应于模板第一区)的序列数据可利用多联体也对应于模板第一区的第二区段的序列数据进行补充和/或校正。 或者,或另外,对模板进行重复测序反应以产生冗余的序列信息,可以分析该信息以更全面地鉴定模板中所存在的修饰。本文所用术语“修饰”不仅指核酸的化学修饰,而且指核酸构型的变化、试剂与核酸的相互作用(例如,与核酸结合)和与核酸相关的其它干扰。因此,修饰位置是在核酸内发生修饰的基因座(如单个核苷酸或多个毗连或不毗连的核苷酸)中。对于双链模板, 修饰可发生在与聚合酶加工模板合成的新生链互补的链中,或可发生在被置换链中。虽然本发明的某些具体实施方式
就5-甲基胞嘧啶的检测作了描述,但也考虑了其它类型的核苷酸修饰(例如,N6-甲基腺苷、N3-甲基腺苷、N7-甲基鸟苷、5-羟甲基胞苷、其它甲基化核苷、假尿苷、硫尿核苷、异鸟苷、异胞苷、二氢尿苷、辫苷、怀俄苷、肌苷、三唑、二氨基嘌呤、8-氧鸟苷、和腺苷、胞苷、鸟苷及尿苷的2’ -0-甲基衍生物)。本领域普通技术人员知晓这些和其它的修饰,它们的进一步描述可参见,例如Narayan P等(1987)Mol Cell Biol 7(4) :1572-5 ;Horowitz S 等(1984)Proc Natl Acad Sci U.S. Α. 81(18) :5667-71; "RNA' s Outfits :The nucleic acid has dozens of chemical costumes (RNA 的装备 核酸有几十种化学戏装)” (2009) C&EN ;87 (36) :65-68 ;Kriaucionis 等 Q009)kience 324(5929) :929-30 ;Tahiliani 等(2009)Science 324(5929) :930-35 ;Matray ^ (1999) Nature 399(6737) :704-8 ;Ooi 等(2008) Cell 133 :1145-8 ;Petersson等(2005) J Am Chem Soc. 127(5) :1424-30 Johnson 等(2004)32(6) :1937-41 ;Kimoto 等(2007) Nucleic Acids Res.35(16) :5360-9 ;Ahle 等(2005)Nucleic Acids Res 33(10) :3176 ;Krueger 等 Curr Opinions in Chem Biology 2007,11(6) :588) ;Krueger 等(2009)Chemistry & Biology16(3) 242 ;McCulIough 等(1999)Annual Rev of Biochem 68:255 和 Liu 等(2003) Science 302(5646) :868_71,它们的全文通过引用纳入本文用于所有目的。修饰还包括在模板核酸中存在非天然碱基对,包括但不限于羟基吡啶酮与吡啶并嘌呤的同质或异质碱基对、吡啶-2,6- 二羧酸与吡啶金属碱基对、吡啶-2,6- 二羧酰胺与吡啶金属碱基对、金属介导的嘧啶碱基对T-Hg(II)-T和C-Ag(I)-C、和2,6-双(乙基巯甲基)吡啶核苷碱基的金属-同质碱基对Spy,和嘌呤或嘧啶碱基的炔基、烯胺基、醇基、咪唑基、胍基和吡啶基置换产物(Wettig 等(2003) J Inorg Biochem 94 :94-99 ;Clever 等(2005) Angew Chem Int Ed 117 :7370-7374 ;Schlegel 等(2009) Org Biomol Chem 7(3) :476-82 ;Zimmerman 等(2004) Bioorg Chem 32(1) 13-25 ;Yanagida等(2007)Nucleic Acids Symp Ser(Oxf) 51 :179-80; Zimmerman(2002) J Am Chem Soc 124(46) :13684-5 ;Buncel 等(1985)Inorg Biochem 25 61-73 ;0no 等 Q004)Angew Chem 43 :4300-4302 ;Lee 等(1993)Biochem Cell Biol 71: 162-168 ;Loakes 等 U009),Chem Commun 4619-4631 和 Seo 等 U009)J Am Chem Soc 131 3246-3252,它们的全文通过引用纳入本文用于所有目的)。其它类型的修饰包括,例如,缺口、丢失碱基(如脱嘌呤或脱吡啶位点)、嘧啶二聚体(如胸腺嘧啶二聚体或环丁烷嘧啶二聚体)、顺钼交联、氧化损伤、水解损伤、其它甲基化碱基、大量DNA碱基加成、光化学反应产物、链间交联产物、错配碱基和其它类型的核苷酸“损伤”。如此,本文描述的某些实施方式指“损伤”,这种损伤也可视为本发明所述的核酸修饰。使DNA接触射线(如UV)、致癌化学物、交联剂(如甲醛)、某些酶(如切口酶、糖基化酶、核酸外切酶、甲基化酶和其它核酸酶等)、病毒、毒素和其它化学剂、热破坏剂等等可导致核苷酸修饰。在体内,DNA损伤是突变的主要原因,可导致各种疾病,包括癌症、心血管疾病和神经系统疾病(Lindahl,T. (1993) Nature 362(6422) :709_15,其全文通过引用纳入本文用于所有目的)。本文提供的方法和系统也可用于检测DNA的不同构型,具体可检测其二级结构,如发夹环、茎环、内部环、凸起、假结体、碱基三聚体等;也可用于检测试剂与该核酸的相互作用,如结合的蛋白或其它分子。 在某些方面,提供了在单分子测序中检测和/或逆转模板中修饰,以及确定核酸分子中它们所在位置(即作图)的方法、组合物和系统。在某些优选的实施方式中,采用高通量、实时、单分子、模板引导的测序试验,例如通过监测聚合酶加工模板时的推进和/或动力学,来检测损伤位点的存在和确定它们在DNA模板中的位置。例如,当聚合酶遇到DNA 模板中的某些类型损伤或其它修饰时,聚合酶的推进可能被暂时或永久阻断,如导致聚合酶停止推进或解离。如此,检测到新生链合成暂停或终止即表明存在这种损坏或损伤。通过分析合成中暂停或中止前的序列读取,以及替代或补充的,合成再启动后的序列读取,人们就可在模板上绘出损伤位点。因为不同类型的损伤对聚合酶在底物上的推进有不同的影响,在某些情况下,聚合酶在模板上的行为不仅告知何处有损伤,而且可告知存在何种类型损伤。此外,在某些实施方式中,通过掺入模板链损伤的非核苷酸结合伴侣可以绕过修饰位点。例如,脱碱基位点(如用糖基化酶产生的)可与嵌二萘(pyrenes)或其它相似的类似物“配对”(参见,例如Matray等(1999) Nature 399(6737) :704-8)。也可用能与反应混合物中的核苷酸上的标记光学区分的可检测标记来标记这种类似物,以便光检测其掺入。本发明的某些方面提供实时逆转这类修饰的方法,从而能再启动测序反应继续产生模板核酸的序列信息。这种方法还可用于研究各种试剂(如药物、化学剂、酶等)和反应条件对产生和/或修复这类损伤的影响。在以下描述和实施例中更加详细地说明了本发明的这些方面和其它方面的内容。II.单分子测序在本发明的某些方面,采用单分子实时测序系统,通过分析这类系统产生的序列和/或动力学数据来检测核酸模板的修饰。具体说,模板核酸链的修饰可以各种方式改变核酸聚合酶的酶活性,例如延长了使结合的核苷酸掺入的时间和/或延长掺入事件间的间隔时间。在某些实施方式中,用单分子核酸测序技术检测聚合酶的活性。在某些实施方式中,利用核酸测序技术实时检测新生链中核苷酸的掺入,来检测聚合酶活性。在优选的实施方式中,单分子核酸测序技术能实时检测核苷酸的掺入。本领域已知这些测序技术,包括, 例如SMRT 测序和纳米孔测序技术。关于纳米孔测序的更多信息可参见,例如美国专利号 5,795,782 ;Kasianowicz 等(1996)Proc Natl Acad Sci USA 93(24) :13770-3 ;Ashkenas 等(2005) Angew Chem Int Ed Engl 44(9) :1401-4 ;Howorka 等(2001) Nat Biotechnology 19(7) :636-9和六8衍61~等 Q006)J Am Chem Soc 128(5) 1705-10,它们的全文通过引用纳入本文用于所有目的。关于核酸测序,术语“模板”指引导新生链合成的核酸分子。模板可包括DNA、RNA、或它们的模拟物或衍生物。此外,模板可以是单链、双链,或可包含单链和双链二种区域。双链模板中的修饰可以位于与新合成的新生链互补的链中,或可以位于新合成链相同的链,即被聚合酶置换的链中。本文所述的优选直接甲基化测序技术通常可采用单分子实时测序系统来实施,即显示和观察各反应复合体随时间推移的变化,例如那些为SMRTtmDNA测序技术开发的(参见,例如P.M. Lundquist等,Optics Letters 2008,33,1026,其全文通过引用纳入本文用于所有目的)。上述SMRT 测序仪器通常能同时检测由数千种ZMW所组成阵列发出的荧光信号,产生高度并行操作。各ZMW与其它ZMW相隔几微米,各代表一个独立的测序室。单个分子或分子复合体的实时检测,例如在分析反应过程中,通常涉及直接或间接处理分析反应物使每种待检测的分子或分子复合体单独可辨。以此方式,可分别监测各分析反应物,即使单个基板上固定有多种这类反应。可通过一些机制实现各分析反应物的单独可辨设置,通常包括将反应的至少一种反应组分固定在反应位点上。本领域已知提供单独可辨设置的各种方法,例如,可参见Balasubramanian等的欧洲专利号11055 和已公开的国际专利申请号WO 2007/041394,它们的全文通过引用纳入本文用于所有目的。基板上的反应位点一般是基板上进行和监测单个分析反应的位置,监测优选是实时监测。反应位点可以在基板的平坦表面上,或可在基板表达的凹孔内,如孔、纳米孔或其它孔内。在优选实施方式中,这种孔是“纳米孔”,这种纳米级洞或孔能提供将感兴趣分析材料结构性限制在纳米级的直径内,例如 l-300nm。在一些实施方式中,这种孔具有光限制特征,如零模式波导特征(也是纳米级孔),其在本文中另有进一步描述。通常这种孔的观察容积(即发生反应检测的体积)为微微微升(10_w升)至毫微微微升(10_21升)规模,此容积适合单分子和单分子复合体的检测和分析。分析反应组分的固定可设计为各种方式。例如,可使酶(如聚合酶,逆转录酶、激酶等)结合在基板的反应位点,如光限制件或其它纳米孔内。在其它实施方式中,可使分析反应中的底物(例如,模板核酸,如DNA、RNA或它们的杂交体、类似物、及其模拟物,或激酶的靶分子)结合在基板的反应位点。例如,2009年9月18日提交的美国专利申请号12/562,690中提供了模板固定的某些实施方式,其全文通过引用纳入本文用于所有目的。 本领域技术人员知晓有许多方法可以共价或非共价地、通过接头部分或连接于固定部分将核酸和蛋白质固定在光限制件中。这些方法是固相合成和微阵列领域熟知的(Beier等, Nucleic Acids Res. 27 1970-1-977 (1999))。能使核酸或聚合酶附着于固相支持物的结合部分的非限制性例子包括链霉亲和素或亲和素/生物素连接、氨基甲酸酯连接、酯键,酰胺键、硫酯键、(N)-功能化硫脲键、功能化马来酰亚胺键、氨基、二硫键、酰胺键、腙键等。也可采用能特异性结合一种或多种反应组分的抗体作为结合部分。此外,可用本领域已知方法,通过甲硅烷基使核酸直接附着于基板如玻璃。在一些实施方式中,通过将包含互补区、能与模板杂交的引物的引物附着在反应位点,可将模板核酸固定在反应位点上(如光限制件中),使其位于适合监测的位置。在某些实施方式中,例如通过先固定酶,将酶复合体组装在光限制件中。在其它实施方式中, 先配制酶复合体溶液再固定。需要时,可修饰待固定的酶或其它蛋白反应组分使之含市售抗体特异性识别的一个或多个表位。此外,可修饰蛋白质使之含异源结构域,例如谷胱苷肽S-转移酶(GST)、麦芽糖-结合蛋白(MBP)、特异性结合肽区域(参见如美国专利号 5,723,584 ;5,874,239和5,932,433)或免疫球蛋白的Fc部分。这些结构域的各自结合试剂即谷胱苷肽、麦芽糖、和抗免疫球蛋白Fc部分的抗体可购得并可用于包被本发明光限制件的表面。所述结合部分或其固定的反应组分的试剂可采用本领域熟知常规化学技术施用于支持物。一般而言,这些方法涉及支持物表面的标准化学修饰,以不同温度在含有结合部分或试剂的不同介质中培育支持物,可能的后续步骤为洗涤和清洁。在一些实施方式中,基板包含用于监测多种生物学反应的反应位点阵列,每种反应在单个反应位点进行。本领域普通技术人员已知在阵列基板上加载多种生物学反应的各种方法,方法的进一步描述可参见如USSN 61/072,641,其全文通过引用纳入本文用于所有目的。例如,基本方法包括在反应位点处产生某反应组分的单个结合位点;通过催化或后继结合方法去除该反应位点处多余的结合位点;调整待固定反应组分的尺寸或电荷;将该反应组分包裹在粒子内(如病毒衣壳内)或与之结合,相应的反应位点可容纳一个粒子 (由于粒子的尺寸或电荷和/或观察容积);采用非扩散受限式加载法可控地加载反应组分(例如用微流体计或光或电控制);反应位点/观察容积内的尺寸筛分和电荷选择(如阵列中光限制件的尺寸)以控制哪一反应组分可容纳入(从空间或静电上)哪个反应位点 /观察容积中;迭代加载反应组分,例如通过在循环加载之间遮蔽活性位点;富集已加载反应组分的活性;利用自装配核酸进行空间控制加载;调整反应位点/观察容积的尺寸等等。 提供的这类方法和组合物可用各单独反应组分(如分子复合体)完全加载单分子阵列的反应位点(而非“泊松限制”加载法产生的约30%位点加载)。在优选方面,本文提供的方法、组合物和系统采用光限制件以促进分析反应的单分子分辨。在优选实施方式中,所述光限制件设置为提供密闭的光限制,反应混合物只有很小体积可供观察。这样的一些光限制件和其制作方法及应用的详述可参见,例如美国专利号 7, 302,146,7, 476,503,7, 313,308,7, 315,019,7, 170,050,6, 917,726,7, 013,054、 7,181,122 和 7,292,742、美国专利
发明者B·弗卢斯贝格, D·韦伯斯特, J·哈尼斯, J·李, J·科拉奇, J·索伦森, J·莱尔, K·特拉弗斯, S·特纳, 贾磊 申请人:加利福尼亚太平洋生物科学股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1