用于单个dna分子的直接测序的方法和系统的制作方法

文档序号:581615阅读:692来源:国知局
专利名称:用于单个dna分子的直接测序的方法和系统的制作方法
用于单个DNA分子的直接测序的方法和系统相关申请的交叉引用本申请要求于2008年12月11日提交的美国临时申请第61/121,809号的优先权, 通过引用将其全文并入本文。
背景技术
与利用Sanger双脱氧测序方法的传统的基于凝胶或毛细管的测序仪相比,通过大规模的平行化和小型化,DNA测序的处理能力已经大大提高了,而测序的成本却降低了几个数量级。数种出现的其它测序平台可以有效地提高处理能力,并且甚至可以将DNA测序的成本再降低两个数量级,有望为我们提供所谓的$1000基因组测序技术 (Rothberg, J. M. and Leamon, J. H. , Nat Biotechnol,26 ;1117-1124(2008) ;Schloss, JA., Nat Biotechnol,26 :1113-1115(2008) ;Shendure, J. and Ji, H. , Nat Biotechnol, 26 1135-1145(2008))。$1000基因组技术的可行性有望使基因组学走出主要的测序中心,并步入个体研究人员的实验室。这将显著改变生物医学研究,使基因组、转录组、遗传网络等的综合分析成为可能。尽管已经取得巨大进步,但是$1000基因组技术仍没有被攻克。在一系列综述中报道了基因组测序技术发展中的最新进展和巨大挑战 (Rothberg, J.M. and Leamon, J.H.,Nat Biotechnol,26 ; 1117-1124(2008) ;Schloss, J. Α. , Nat Biotechnol,26 :1113—1115(2008) ;Branton, D. et al. , Nat Biotechnol, 26 1146-1153(2008))。本发明提供了用于遗传物质测序的改进方法,例如,用于医学应用和生物医学研究。公开的方法可以用于快速个性化医学、遗传诊断、病原体鉴定和生物圈中任何物种的基因组测序。发明概述本发明提供了用于快速DNA测序的组合物、方法、试剂盒和系统。在某些实施方案中,将感应器设置到聚合酶分子的表面,用于监测伴随每种碱基类型的并入而发生的细微的、但不同的构象改变。利用F6rster共振能量转移(FRET)技术可以精确测定聚合酶1-10 埃的移动。位于聚合酶上重要残基处的多个FRET对(或网络)可用来实时监测构象改变 (比DNA合成速率快10倍)。感应器能提供关于聚合酶的动态结构的多个参数信息,这些信息随后提供并入的每种碱基类型的特有识别。按照公开的方法,还能检测到模板DNA上的化学修饰,例如甲基化。因此,本发明提供了标记的DNA聚合酶,其中所述DNA聚合酶包含至少一个FRET 供体和至少一个FRET受体,其中所述FRET供体和FRET受体在DNA聚合酶上的位置能使得对于被DNA聚合酶并入新DNA链的每种不同核苷酸都会产生不同的FRET信号。所述FRET 供体和受体在DNA聚合酶上的位置能使得当聚合酶将核苷酸添加到DNA新生链时,至少根据并入的碱基(A、C、G、T)而产生的不同的FRET信号。在某些实施方案中,当DNA聚合酶读取(遇到)模板DNA上甲基化的核苷酸时,产生不同的FRET信号。在某些实施方案中,FRET供体的位置距FRET受体的距离非常接近于Fikster半径(R0)。例如,当DNA聚合酶处于开放位置时,供体的位置距受体约1个F6rster半径(Rtl)或在例如10、5、2. 5或1埃的FSrster半径(Rq)内。在某些实施方案中,从DNA聚合酶的开放位置到关闭位置,FRET供体和FRET受体之间的距离改变至少1、2. 5、5、10或更多埃。在某些实施方案中,FRET供体和受体位于DNA聚合酶的溶剂可及表面上。在某些实施方案中,FRET供体和受体不干扰DNA聚合酶的活性。在某些实施方案中,FRET受体位于手指结构域上,例如位于手指结构域的溶剂可及表面上,并且FRET供体位于手掌或拇指结构域(或者在DNA合成过程中保持相对静止的另一结构域)上,例如位于聚合酶的溶剂可及表面上。在某些实施方案中,FRET受体位于DNA聚合酶的拇指或手掌结构域(或者在 DNA合成过程中保持相对静止的另一结构域)上,例如位于溶剂可及表面上,同时FRET供体位于手指结构域上,例如位于手指结构域的溶剂可及表面上。在某些实施方案中,DNA聚合酶来源选自噬菌体、细菌和酵母。在某些实施方案中,DNA聚合酶是诸如杂合体的基因工程化的酶或来自商业来源的DNA聚合酶(例如,T7 DNA聚合酶、2.0 版测序酶Gequenase version 2. 0 ))。在某些实施方案中,聚合酶是RT 或RNA聚合酶,例如T7RNA聚合酶。在某些实施方案中,聚合酶是天然的或工程化的逆转录酶,例如莫洛尼猴白血病病毒逆转录酶(MMLV-RT)或Superscript III 逆转录酶(Life Technologies)。DNA聚合酶的实例包括φ-29、Taq、T7、Klenow (大肠杆菌DNA聚合酶I大片段)和Bst大片段(来自嗜热脂肪芽胞杆菌(Bacillus stearothermophilus)DNA聚合酶)。在某些实施方案中,DNA聚合酶是φ-29,并且FRET供体和受体位于选自表1所公开的那些氨基酸位置,或位于表1所公开的氨基酸位置中的1、2、3、4或5个氨基酸中。在某些实施方案中,包括了多于一个表1所公开的FRET对。在某些实施方案中,DNA聚合酶不是φ-29,但是FRET供体和受体位于与表1中所公开的φ-29的FRET供体和受体位点同源的位点。可以通过最佳结构比对来确定所述同源位点,即DNA聚合酶结构的比较。在某些实施方案中,FRET供体和受体两者都包含荧光分子(例如,有机染料分子)。例如,供体和受体可以独立地选自荧光素、青色素、罗丹明和Alexa系列染料(Life Technologies)和Atto系列染料(Atto-Tec GmbH)。在某些实施方案中,FRET供体和受体两者都包含荧光量子纳米颗粒(例如,银或金纳米簇)。在某些实施方案中,标记的DNA聚合酶包含多于一个FRET供体、FRET受体或FRET 对(FRET供体和受体)。例如,可以将FRET网络设计成使单个FRET供体能激发至少两个 FRET受体,其中每个受体都非常接近FRET供体。在某些实施方案中,每个FRET对具有不同的标记组。本发明提供了制备本文所述的标记的DNA聚合酶的方法。本发明还包括制备如下所述的任何其它蛋白的方法其中用化学部分(例如,诸如荧光染料或生物素分子的标记, 或PNA)标记所选的位置处的至少一个残基,或用具有或不具有化学部分的非天然氨基酸取代至少一个残基。在某些实施方案中,所述方法包括以下步骤(i)鉴定(选择)DNA聚合酶上的至少一个第一位置用于FRET供体标记和DNA聚合酶上的至少一个第二位置用于 FRET受体标记;和(ii)在每个所鉴定的(或所选的)位置处引入非天然存在的氨基酸,从而制备标记的DNA聚合酶。在某些实施方案中,所述非天然存在的氨基酸在被并入时进行标记,而在其它实施方案中,所述非天然存在的氨基酸是在被并入蛋白之后进行标记。在某些实施方案中,所述第一位置处的非天然存在的氨基酸不同于所述第二位置处的非天然存在的氨基酸。在某些实施方案中,所述非天然存在的氨基酸是被标记的,例如用生物素、化学反应性基团(例如,与染料分子共价连接)或荧光染料进行标记。在某些实施方案中,所述非天然存在的氨基酸是通常不能在DNA聚合酶的该位置处发现的氨基酸, 即突变的氨基酸、取代的氨基酸或衍生氨基酸。在某些实施方案中,所述突变的氨基酸是具有反应性侧基的氨基酸,例如半胱氨酸或赖氨酸。在某些实施方案中,所述引入步骤包括体外(即无细胞)DNA聚合酶的翻译。在某些实施方案中,所述引入步骤包括DNA聚合酶的基于细胞的翻译。在某些实施方案中,所述非天然存在的氨基酸是在DNA聚合酶翻译之后用FRET供体或受体分子(例如荧光团)进行标记的,由此形成标记的DNA聚合酶。在某些实施方案中,所述非天然存在的氨基酸包含在翻译过程中直接引入DNA聚合酶中的FRET供体或FRET受体。在某些实施方案中,所述体外翻译反应包括以下步骤a)将编码标记的DNA聚合酶的多核苷酸序列(例如,mRNA)固定到基底上;b)在适于翻译的条件下,使所述固定的多核苷酸相继(分别)与两种或更多种不同的翻译反应混合物接触;c)在与每种不同的反应混合物接触的间隔,洗涤所述固定的多核苷酸;和d)重复步骤b)和c),直到翻译出DNA聚合酶。在某些实施方案中,所述体外翻译反应包括以下步骤a)将编码标记的DNA聚合酶的多核苷酸序列固定到基底上;b)在适于翻译的条件下,使所述固定的多核苷酸与至少一种第一体外翻译反应混合物接触;c)洗涤所述固定的多核苷酸;d)在适于翻译的条件下, 使所述固定的多核苷酸与至少一种第二体外翻译反应混合物接触,其中所述第一和第二体外翻译反应混合物是不同的;e)洗涤所述固定的多核苷酸;和f)重复步骤b)_e),直到翻译出DNA聚合酶。在某些实施方案中,将反应混合物的至少某些个体组分单独加至多核苷酸。在某些实施方案中,所述洗涤步骤能有效地从多核苷酸去除反应混合物的组分。在某些实施方案中,所述洗涤步骤能有效地从多核苷酸去除除了核糖体和tRNA之外的反应混合物组分,所述核糖体和tRNA带有与核糖体共价连接和结合(在P位点中)的新生多肽。在某些实施方案中,所述至少一种第一体外翻译反应混合物选自(i)包含非天然的氨基酸并且不包含其它氨基酸的反应混合物;和(ii)包含标记的DNA聚合酶序列中除了非天然存在的氨基酸之外的所有氨基酸的反应混合物。在某些实施方案中,所述至少一种第二体外翻译反应混合物选自(i)包含非天然的氨基酸并且不包含其它氨基酸的反应混合物;和(ii)包含标记的DNA聚合酶序列中除了非天然存在的氨基酸之外的所有氨基酸的反应混合物。在某些实施方案中,至少一种第一体外翻译混合物选自(i)包含用氨基酸或非天然存在的氨基酸(例如标记的或非天然的氨基酸)预载或活化(共价轭合)的仅一种 tRNA和体外翻译所必需的所有其它组分(例如核糖体、GTP、延伸因子、终止释放因子)的反应混合物;和(ii)包含用其它天然遗传编码的19种氨基酸预载或活化(共价轭合)的所有种类tRNA和体外翻译所必需的所有其它组分、但是不含(i)中氨基酸的tRNA分子的反应混合物。在某些实施方案中,至少一种第二体外翻译混合物选自(i)包含用氨基酸或非天然存在的氨基酸(例如标记的或非天然的氨基酸)预载或活化(共价轭合)的仅一种 tRNA和体外翻译所必需的所有其它组分(例如核糖体、GTP、延伸因子、终止释放因子)的反应混合物;和(ii)包含用其它天然遗传编码的19种氨基酸预载或活化(共价轭合)的所有种类的tRNA和体外翻译所必需的所有其它组分、但是不含(i)中氨基酸的tRNA分子的反应混合物。在某些实施方案中,利用自动化系统进行所述体外翻译。在某些实施方案中,所述系统包括含有基底的柱。在某些实施方案中,所述系统包括用于自动递送反应组分和洗涤溶液的管、泵和阀。本发明提供了 DNA分子测序方法,其中所述方法包括以下步骤(i)使标记的DNA 聚合酶与DNA模板接触,其中所述DNA模板与引物杂交;(ii)在适于DNA聚合的条件下,添加DNA测序(合成)反应混合物;和(iii)通过检测标记的DNA聚合酶所产生的FRET信号来检测并入DNA新链中的每个核苷酸的种类,进而对DNA分子进行测序。在某些实施方案中,DNA测序反应混合物中的至少某些个体组分是单独添加的。本发明提供了 DNA分子测序方法,其中所述方法包括以下步骤(i)使标记的RNA 聚合酶与DNA模板接触,其中RNA聚合酶的启动子序列被加入所述DNA模板中;(ii)在适于转录过程中RNA聚合的条件下,添加RNA测序(合成)反应混合物;和(iii)通过检测标记的RNA聚合酶所产生的FRET信号来检测并入RNA新链中的每个核苷酸的种类,进而对DNA 分子进行测序。在某些实施方案中,RNA测序反应混合物中的至少某些个体组分是单独添加的。本发明提供了 RNA分子测序方法,其中所述方法包括以下步骤(i)使标记的逆转录酶与RNA模板接触,其中所述RNA模板与引物杂交;(ii)在适于逆转录过程中RNA聚合的条件下,添加RNA测序(合成)反应混合物;和(iii)通过检测标记的RNA聚合酶所产生的FRET信号来检测并入RNA新链中的每个核苷酸的种类,进而对RNA分子进行测序。在某些实施方案中,RNA测序反应混合物中的至少某些个体组分是单独添加的。在某些实施方案中,所述标记的DNA聚合酶(或RNA聚合酶或逆转录酶)被固定在基底上,例如,以有序阵列固定在基底上。在某些实施方案中,所述DNA或RNA模板被固定在基底上,例如,以有序阵列固定在基底上。在某些实施方案中,引物包含修饰的核酸或核酸酶抵抗的肽核酸(PNA)。在某些实施方案中,DNA模板是环状分子。在某些实施方案中,所述DNA或RNA模板与基底在多于一个位点连接。例如,模板的每一端都可以与基底连接(即锚定)。在某些实施方案中,模板是伸展的,每一端都与基底连接。在某些实施方案中,多于一种标记的DNA聚合酶(或RNA聚合酶或逆转录酶)用于对DNA分子的全长进行测序。在某些实施方案中,所述方法还包括洗涤固定的DNA或RNA 模板,和重复步骤a)-c)。在某些情况下,在预定的时间之后(例如,在某些检测事件或某一时间长度之后),将第一标记的DNA聚合酶(或RNA聚合酶或逆转录酶)洗掉。在某些实施方案中,在DNA或RNA分子测序的过程中,使用、洗掉(去除)并更换数种标记的DNA聚合酶(或RNA聚合酶或逆转录酶)。本发明提供了用于实施所述公开方法的试剂盒和反应混合物。在某些实施方案中,将所述试剂盒设计用于DNA分子测序,并且所述试剂盒包含标记的DNA聚合酶并任选地包含用于测序的试剂(例如,核苷酸和缓冲液)。在某些实施方案中,所述标记的DNA聚合酶被固定在基底上。在某些实施方案中,所述试剂盒包括使用说明书。在某些实施方案中, 所述试剂盒包含DNA测序反应混合物或其成分(例如,dNTP、盐和缓冲液成分)。在某些实施方案中,将所述试剂盒设计用于RNA分子测序,并且所述试剂盒包含用于逆转录的标记的逆转录酶和试剂,例如核苷酸和缓冲液。在某些实施方案中,本发明提供了用于标记DNA聚合酶的试剂盒,所述试剂盒包括编码DNA聚合酶的多核苷酸和使用说明书。在某些实施方案中,所述多核苷酸被固定在基底上。在某些实施方案中,所述试剂盒还包含至少一种体外翻译混合物。在某些实施方案中,所述至少一种体外翻译混合物包含非天然存在的氨基酸并且不包含其它氨基酸。在某些实施方案中,所述至少一种体外翻译混合物包含除了非天然存在的氨基酸之外的所有氨基酸。在某些实施方案中,所述试剂盒还包含tRNA。在某些实施方案中,所述试剂盒还包含至少两种FRET染料。在某些实施方案中,所述FRET染料是在单独的、不透明的容器中, 以避免光褪色。本发明提供了用于实施本文所述方法的装置和系统。在某些实施方案中,所述系统包括标记的DNA聚合酶和能够检测来自单个分子(S卩,模板多核苷酸)的FRET信号的光学装置。在某些实施方案中,所述系统包括具有预制芯片的微加工的流通池、微流体技术、 温度控制和用于检测信号的成像窗口。在某些实施方案中,READS系统不包括标记的DNA 聚合酶,但是包括光学装置,并且任选地包括用于分析数据的计算机软件。在某些实施方案中,所述系统包括固定在基底(例如,玻璃盖玻片或硅酮阵列材料)上的标记的DNA聚合酶。在某些实施方案中,所述光学装置包括与具体FRET染料(例如,在所需波长内发射的 FRET染料)一起使用的激光器和滤色片。在某些实施方案中,所述光学装置包括落射荧光显微镜。在某些实施方案中,所述系统包括用于分析READS数据的计算机和/或计算机软件。附图简述

图1 左图在表面上具有FRET对/网络的工程化的DNA聚合酶。显示了两对,但可以使用更复杂的网络。右图通过实时监测DNA合成的化学机械过程来进行测序。假定的信号轨迹显示随着时间FRET对之间的距离改变。图2 ㈧具有手指、手掌和拇指亚结构域的右手型结构。(B)具有催化能力的三元复合体中的 RB69 聚合酶的晶体结构(Franklin et al. (2001)Cell 105:657-67)。(C) 小沟中聚合酶和引物/模板间的特异性相互作用作为分子尺,保证碱基对之间合适的间隔。(D)酶上的残基和模板/引物/核苷酸/活性位点中Mg2+之间的特异性相互作用。(E) 伴随核苷酸的结合和并入而发生的大的构象改变。除了(B),所有其它图均来自Stryer, Biochemistry 4- ed(生物化学,第四版).(1995) W. H. Freeman & Co。图3 =DNA聚合酶的催化机制。Conf.构象;Pol =DNA聚合酶;Pr 引物;Tpl =DNA 模板;dNTP 脱氧核糖核苷三磷酸(dATP、dCTP、dGTP或dTTP)中的一种;* 具有催化能力的转换态复合体;PPi 无机焦磷酸盐。在核苷酸并入的化学机械过程中发生不同构象间的动态转换。图4 用于对单个分子的高速复色荧光成像的、具有微流体技术和TIRF的自动化系统的示意图。物体不是按比例绘制的。所有组件都由具有定制软件包的计算机控制。图5 自动化高速成像软件的示意图。它是例如用C++编写的模块化设计。硬件是为了可移植性从实施中抽象出来的。图6 通过固相载体上的自动化循环式体外翻译将多个FRET对并入聚合酶中的方
9法。图7 与引物-模板DNA复合的CP-29DNA聚合酶的晶体结构。将以下亚结构域以简图模型展示手指、手掌、拇指、外切核酸酶、Trai和TPR2。以条形显示引物/模板DNA。利用程序 PyMOL (可在万维网的 pymol.org 获得)JfPDB ID:2PZS 文档(Berman et al. (2007) EMBO J. 26 =3494-3505)用于生成该图。图8 :cp-29DNA聚合酶的“开放”和“关闭”形式的比较。左图“开放”和“关闭”
形式的叠加。右图突出显示手指亚结构域中发现的Cd主链。图9 :φ-29 DNA聚合酶的天然半胱氨酸和溶剂可及表面。(A) 7个天然的半胱氨酸及它们的位置。(B) φ-29 DNA聚合酶的溶剂可及表面的正视图。(C) cp-29DNA聚合酶的溶剂可及表面的后视图。半胱氨酸残基显示在空间填充模型(A)中。利用ChemBio3D Ultra 11. O(CambridgeSoft)生成该结构。图10 用于标记CP-29DNA聚合酶的㈧手指、⑶拇指和(C)手掌亚结构域的候选残基。顶图和底图分别显示了正视图和后视图。以空间填充模型显示蛋白。用白色圆圈标出候选标记位点。标有星号的残基代表具有优选取向的标记位点。用PyMOL生成该结构。图11 =FRET的效率,表示为供体和受体间分离的函数。E = 1/[1+(R/R0)6] ;R0 供体-受体对在E= 时的F5rster半径。该图来自 Royet al (2008) Nat Methods 5:507-16。图12 可构建用于标记FRET对的tp-29DNA聚合酶突变体的代表。㈧突变体E375G’ K240C的标记位点分别位于手指和手掌亚结构域;⑶突变体E37K’K553e的标记位点分别位于手指和拇指亚结构域;(C)突变体E375e’ K553C的标记位点分别位于手指和拇指亚结构域;(D)突变体Ε375ε’κ·的标记位点分别位于手指和拇指亚结构域。以简图模型显示蛋白的开放和关闭形式,并以球形模型显示标记位点。用PyMOL生成图。图13 用于单个分子高速测序的系统。左具有化学机械纳米感应器的单个DNA 聚合酶的流通池和阵列。右具有4个照相机和4个激光器的成像系统。图14 用于长DNA分子的锚定和伸展的微加工装置。㈧总体设计。⑶用320V/ cm电场伸展的末端捕获的DNA分子的全EMCXD荧光图像。发明详述READS综述-第四代测序技术本发明提供单个DNA分子直接测序的方法。该方法被称为READS基因组技术 (READS 利用化学机械纳米感应器从单个分子进行实时DNA测序)。通过实时监测当每个碱基并入到从杂交到模板链上的引物延伸的新生链时DNA或RNA聚合酶的动态构象改变来确定DNA分子或RNA分子的序列。通过利用F5rster/荧光共振能量转移(FRET)技术监测一对荧光染料或纳米颗粒或荧光染料或纳米颗粒网络的动态相互作用,检测由于一种碱基的并入而引起的DNA或RNA聚合酶动态构象改变的独特标志。FRET染料分子被连接到聚合酶蛋白或蛋白复合体表面上合适的残基。这些残基可以是具有合适官能团的先存残基,所述官能团例如伯胺,羧酸酯或巯基,或可以通过蛋白质工程将这些残基引入聚合酶。利用配备了电子倍增电荷耦合装置(EMCCD)和激光激发器的全内反射显微镜可以高速平行检测来自个体聚合酶的FRET信号。可以通过多合电子束分裂器和滤色片分解不同波长的个体荧光信号并用两个或更多个照相机进行检测。本发明允许单个DNA分子的高速和精确测序。可以在约几分钟内对单个DNA分子中的数万个碱基进行有效地直接测序。本发明提供利用天然核苷酸的天然DNA聚合酶的速度和精确性。这是相对之前的技术的优势,之前的技术依赖于荧光核苷酸并且需要可以识别和并入标记的核苷酸的聚合酶。本发明平台联合了测序方法和高速成像系统,从而允许廉价且非常高速地对整个基因组进行测序。本发明的测序技术提供以下优势(1)快速实时测序;( 单个分子直接测序;(3) 长且精确的读取;(4)非常廉价和(5)能够检测基因组DNA上诸如甲基化的化学修饰,用于表观基因组测序。基本概念在图1中示出。本发明的READS(利用化学机械纳米感应器的实时DNA测序)包含以下概念(1)伴随每种碱基的结合和并入过程,DNA聚合酶经历特征性的和独特的动态构
象改变。(2)利用FRET对可以精确地监测并入过程中动态构象改变的小但独特的差异(距离改变1-10埃)。(3)利用现有成像技术,可以实时检测来自单个DNA聚合酶上FRET对的荧光信号 (比DNA合成速率快10倍)。FRET感应器可以提供关于伴随DNA合成的化学机械过程的聚合酶动态结构的多参数信息,提供了对于并入的每种碱基的独特标志。还可以检测模板DNA上诸如甲基化的化学修饰。通常,C是甲基化的核苷酸。本发明的标记的DNA聚合酶可以用于区别模板DNA链上未修饰的C和甲基化的C。读取Me-C 的DNA聚合酶和读取C的DNA聚合酶的构象的细微差异可以产生不同的FRET信号。定义READS技术是指利用标记的DNA聚合酶检测新生DNA链中每个核苷酸的并入而进行的实时DNA测序。 F0rster共振能量转移(F6rster resonance energy transfer)(缩写为 FRET),也称为荧光共振能量转移,是描述两个生色团之间能量转移的机理。最初处于电子激发态的供体生色团(FRET供体)通过非辐射偶极-偶极耦合可以将能量转移到通常距其IOnm以内的受体生色团(FRET受体)。当FRET供体和受体接近时(参见图11),转移到FRET受体的能量以光发射(能量)进行检测。因此,“FRET信号”是由来自受体的光发射产生的信号。"FRET对”是指FRET供体和FRET受体对。本文中,术语“荧光团”、“染料”、“荧光分子”、“荧光染料”、“FRET染料”和类似术语是同义使用。“标记的DNA聚合酶”是指包含至少一个FRET对的DNA聚合酶。FRET供体和受体分子通常共价连接到标记的DNA聚合酶表面上的氨基酸上。DNA聚合酶共享普遍的机理和结构,因此根据本发明可以设计和使用任意DNA聚合酶。DNA聚合酶沿3' —5'方向“读取”模板,并沿5' —3'方向将个体核苷酸(碱基)添加到新链。聚合酶需要引物的3' OH基团来起始新DNA链的延伸。根据图3所述的普遍机理添加个体核苷酸(dNTP或dATP、dCTP、dTTP、dGTP或A、C、Τ、G)。具体的碱基(A、 C、T或G)取决于模板DNA的序列,从而使得新碱基与模板链上的核苷酸通过Watson-Crick 相互作用杂交。DNA聚合酶在“开放”和“关闭”构象之间循环。DNA聚合酶与引物-模板 DNA复合体一起时处于开放位置。一旦进入的核苷酸到达活性位点,聚合酶循环到关闭位CN 102317471 A
说明书
8/31 页 置。本文所用的术语“非天然存在的氨基酸”是指连接到(标记有)FRET供体或受体的氨基酸,或连接到(标记有)用于连接所述FRET供体或受体的接头分子的氨基酸。该术语还指在DNA聚合酶的天然序列中在DNA聚合酶的指定位点非天然存在的氨基酸。例如, 非天然存在的氨基酸可以是具有反应性侧基的氨基酸,其取代了聚合酶上指定位点的天然的(天然存在的)氨基酸。在这种情况下,在单独的步骤中将FRET染料连接到非天然存在的(或取代的或突变的)氨基酸。术语“新生链”是指参与聚合的DNA(或RNA)的新链。DNA聚合酶以模板链依赖模式首先将第一个个体核苷酸(碱基)添加到引物上,将第二个个体核苷酸添加到第一个添加的碱基上,将第三个个体核苷酸添加到第二个添加的碱基上等。“新生”链或“新”链是指引物、延长链和由DNA聚合酶聚合的DNA链。术语“反应混合物”通常是指给定化学或生物过程所需的组分。例如,本领域技术人员应当认识到,“翻译反应混合物”包括氨基酸、tRNA、缓冲液等。同样,DNA合成反应混合物包括实施该反应所必需的个体核苷酸、缓冲液等。本领域技术人员应当理解,用于DNA 合成、转录和翻译的反应混合物是清楚表征的并且是可商购的。术语“DNA分子测序”指本文所述的READS技术。获得DNA模板以及新的和互补的 DNA链的序列信息。因此,本文语境中术语DNA分子是指模板链和新合成的链。本文所用的“核酸”、“寡核苷酸”或“多核苷酸”或语法等同词表示共价连接在一起的至少两个核苷酸(即,碱基)。术语“核苷酸”和“碱基”通常是指单个的单体(例如dNTP 或rNTP,包括腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤)。寡核苷酸长度通常为从约5、6、7、8、9、 10、12、15、25、30、40、50或更多个核苷酸任选地至约100个核苷酸。核酸和多核苷酸是任意长度的聚合物,包括更长的长度,例如200、300、500、1000、2000、3000、5000、7000、10,000 等。本发明的核酸通常包含磷酸二酯键,但是在一些情况下,还包括可以具有替代主链以及肽核酸主链和连接的核酸类似物,所述替代主链包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或0-甲基氨基磷酸酯连接(参见Eckstein,Oligonucleotides and Analogues A Practical Approach (寡核苷酸和类似物实践方法),Oxford University Press)。其他核酸类似物包括具有阳性主链、非离子主链和非核糖主链的那些核酸,包括描述于美国专利第 5,235,033 号和第 5,034,506 号以及 ASC Symposium Series 580,Carbohydrate Modifications in Antisense Research, Sanghui & Cook, eds.第 6 禾口 7 章的那些核酸。 包含一个或多个碳环糖的核酸也包括在核酸的定义中。因为多种原因可以进行核糖-磷酸主链的修饰,例如,为了增加这类分子在生理环境中或作为生物芯片上的探针时的稳定性和半寿期。可以产生天然存在的核酸和类似物的混合物;可选地,可以产生不同核酸类似物的混合物以及天然存在的核酸和类似物的混合物。 术语“多肽”、“肽”和“蛋白,,在本文可替换地使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,还适用于天然存在的氨基酸的聚合物、包含修饰的残基的那些聚合物以及非天然存在的氨基酸聚合物。 术语“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及与天然存在的氨基酸功能类似的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些
12氨基酸以及后续修饰的那些氨基酸,例如,羟脯氨酸、Y-羧基谷氨酸酯和0-磷酸丝氨酸。 氨基酸类似物是指与天然存在的氨基酸具有相同的基本化学机构的化合物,例如,与氢、羧基、氨基和R基结合的α碳,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这些类似物可以具有修饰的R基(例如,正亮氨酸)或修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学机构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构, 但与天然存在的氨基酸功能类似的化合物。在本文中,可以用氨基酸的公知的三字母标识或用IUPAC-IUB生物化学命名委员会所推荐的单字母符号表示氨基酸。同样地,可以用核苷酸的公认的单字母代码表示核苷酸。“保守型修饰的变体”适用于氨基酸序列和核酸序列。对于具体的核酸序列,保守型修饰的变体是指编码相同的或基本上相同的氨基酸序列的那些核酸,或如果所述核酸不编码氨基酸序列,则是指基本上相同或相关的(例如天然相邻的)序列。由于遗传密码的简并性,大量功能上相同的核酸编码大多数蛋白。例如,密码子GCA、GCC、GCG和GCU都编码丙氨酸。因此,在由密码子指定为丙氨酸的每个位置,可以将密码子改变为所述的另一对应密码子而不改变编码的多肽。这类核酸变异是“沉默变异”,其是保守型修饰变异中的一种。本文中,编码多肽的每个核酸序列也描述所述核酸的沉默变异。本领域技术人员应当认识到,在某些语境中,可以修饰核酸中每个密码子(除了 AUG和TGG,AUG通常是蛋氨酸的唯一密码子,TGG通常是色氨酸的唯一密码子)以产生功能上相同的分子。因此,通常,在涉及表达产物而不涉及实际探针序列的情况下,编码多肽的核酸的沉默变异隐含在所述序列中。对于氨基酸序列,本领域技术人员会认识到,在编码序列中改变、添加或缺失单个氨基酸或一小部分氨基酸而对核酸、肽、多肽或蛋白序列进行的个别取代、缺失或添加是 “保守型修饰的变体”,其中所述改变导致氨基酸被化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守型取代表是本领域公知的。这类保守型修饰的变体还包括并且不排除本发明的多态性变体、种间同系物和等位基因。以下氨基酸可以互相进行保守型取代1) 丙氨酸(A),甘氨酸(G) ;2)天冬氨酸(D),谷氨酸(E) ;3)天冬酰胺(N),谷氨酰胺(Q) ;4) 精氨酸(R),赖氨酸⑷;5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V) ;6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W) ;7)丝氨酸(S),苏氨酸(T);和8)半胱氨酸(C),蛋氨酸(M) (参见,例如,Creighton, Proteins (1984))。“标记”或“可检测的部分”是可通过光谱学、光化学、生物化学、免疫化学、化学或其他物理方法检测的组分。本文所用的术语标记通常是指荧光标记,例如,FRET供体或受体。标记还可以包括,例如,诸如生物素的亲和剂、化学反应性基团、电子致密剂、酶(例如, ELISA中常用的酶)或地高辛。可以使用本领域内任意已知的偶联标记的方法,例如,利用 Hermanson, Biocon.jugate Techniques (生物偶联技术)1996, Academic Press, Inc. , San Diego所描述的方法。“标记的氨基酸”通常是指连接到FRET染料(荧光分子)或连接到在单独的步骤中用于连接FRET染料的接头分子/连接物的氨基酸。短语“与…选择性(或特异性)杂交”是指例如,在高严紧性条件下,分子仅与特定核苷酸序列进行的结合、形成双链体或杂交,该分子对所述特定核苷酸序列的亲和力高于对其它核苷酸序列(例如,总胞内或文库DNA或RNA)的亲和力。本领域技术人员会意识到,核苷酸之间的特异性杂交通常依赖于互补核苷酸序列之间的Watson-Crick配对键合。本文所用的术语“探针”或“引物”被定义为如下所述的一个或多个核酸片段所述一个或多个核酸片段与样品的特异性杂交是可检测的。根据探针或引物将被用于的具体技术,其可以是任意长度的。例如,引发DNA聚合酶反应(例如,PCR)的引物长度通常为 10-40个核苷酸,而用于例如Southern印迹的核酸探针的长度可以是几百个核苷酸。引物可以是未标记的或如下所述进行标记的,从而可以检测其与靶标或模板的结合。固定在靶元件上的核酸的长度和复杂度对本发明不重要。本领域技术人员可以调整这些因素以提供最佳杂交条件。探针或引物还可以被固定在固相表面上(例如,硝化纤维、玻璃、石英、熔融石英载玻片),例如以阵列的形式。在某些实施方案中,探针可以是例如WO 96/17958中所述的核酸的阵列的一员。为此目的,还可以使用能够产生高密度阵列的技术(参见,例如,Fodor (1991) Science 767-773 Johnston (1998) Curr. Biol. 8 :R171-R174 ; Schummer(1997)Biotechniques 23 :1087-1092 ;Kern(1997)Biotechniques 23 :120-124 ; 美国专利第5,143,邪4号)。本领域技术人员应当认识到,可以将具体探针的确切序列修饰至一定程度,但仍保留与其所来源的探针相同的与同一靶标或样品特异性结合(即,特异性杂交)的能力。 “流动池”或“流动通道”是指可以容纳流体流或气体流的结构中的凹陷。“对照”样品或值是指作为用于与测试样品进行比较的参照(通常是已知参照)的样品。例如,测试样品可以是未知序列而对照是已知序列。在某些实施方案中,测试样品可以包括具有未测试的FRET对的聚合酶而对照聚合酶包含已知FRET对。本领域技术人员应当理解在给定的情况下哪种对照是有用的并且可以基于与对照值的比较来分析数据。对照可用于确定数据的显著性。例如,如果在对照中给定参数的值广泛变化,则测试样品中的变化将不会认为是显著的。基本重组方法本发明提供克隆多核苷酸(例如用于表达为蛋白)的常规方法。如下所述,本发明的多核苷酸序列包括编码DNA和RNA聚合酶的那些多核苷酸序列、模板多核苷酸序列(例如,待测序的基因组片段)、引物和接头分子。公开了重组遗传学领域内一般方法和技术 WSSlB-zPIf^ll Sambrook and Russell, Molecular Cloning, A Laboratory Manual ( ^ 子克隆实验手册)OOOl 年第 3 版);Kriegler, Gene Transfer and Expression :A Laboratory Manual (基因转移和表达实验手册)(1990);和 Ausubel et al,eds.,Current Protocols in Molecular Biology (现代分子生物学实验技术)(1994) ;Kriegler, Gene Transfer and Expression :A Laboratory Manual (基因转移和表达实验手册)(1990);和 Current Protocols in Molecular Biology (3 ^^^^^^ ^) (Ausubel et al., eds.,1994-1999)。通过体外扩增方法可以获得核酸,例如本文和Berger,Sambrook and Ausubel,以及 Mullis et al.,(1987)、美国专利第 4,683,202 号;PCR Protocols A Guide to Methods and Applications (PCR 流程方法和应用指南)Qnnis et al.,eds)所述的那些方法。本领域技术人员应当认识到,可以对本发明的聚合酶进行另外的修饰而不减弱它们的生物学活性。可以进行某些修饰来促进克隆、表达或结构域至融合蛋白的并入。这类修饰是本领域技术人员公知的,并包括例如,在编码结合结构域的多核苷酸的任一末端添加密码子,从而提供添加在氨基末端的蛋氨酸来提供起始位点,或提供位于任一末端的另外的氨基酸(例如,聚组氨酸)来方便地产生定位的限制性位点或终止密码子或纯化序列。可以采用任意已知的产生多肽的基因工程方法获得所需蛋白(例如,Morrison J. , J Bacteriology 1977,132 :349-51 ;Clark-Curtiss & Curtiss, Methods in Enzymology (eds. Wu et al.) 1983,101 :347-62)。例如,制备包含可表达形式(例如,与包括启动子在内的调节序列可操作地连接)的编码蛋白的多核苷酸的合适载体,将其转化到合适的宿主细胞中,然后培养所述宿主细胞来产生蛋白。可以利用任意常用的启动子,包括,例如SV40早期启动子(Rigby in Williamson(ed.), Genetic Engineering, vol. 3. Academic Press, London,1982,83-141)、 EF-α 启动子(Kim et al. ,Gene 1990,91 :217-23)、CAG启动子(Niwa et al. ,Gene 1991, 108 :193) ,RSV LTR 启动子(Cullen,Methods in Enzymology 1987,152 :684-704)、SR α 启动子(Takebe et al.,Mol Cell Biol 1988,8 :466)、CMV 即刻早期启动子(Seed et al., Proc Natl Acad Sci USA 1987,84 :3365-9)、SV40 晚期启动子(Gheysen et al.,J Mol Appl Genet 1982,1 :385-94)、腺病毒晚期启动子(Kaufman et al. ,MoI Cell Biol 1989, 9 :946)、HSV TK 启动子等。常见表达载体和宿主细胞是可商购的。根据本领域内已知的方法可以将表达载体引入到宿主细胞中以表达所需序列,所述方法例如电穿孔(Chu et al. ,Nucleic Acids Res 1987,15 :1311-26)、磷酸钙(Chen et al. ,Mol Cell Biol 1987,7 :2745-52)、DEAE 葡聚糖 (Lopata et al. ,Nucleic Acids Res 1984,12 :5707-17 ;Sussman et al. ,Mol Cell Biol 1985,4 :1641-3)、脂质体转染(Derijard B, Cell 1994,7 :1025-37 ;Lamb et al.,Nature Genetics 1993,5 :22-30 ;Rabindran et al.,Science 1993,259 :230-4)等。还可以采用体外翻译系统在体外产生蛋白(或其片段)。这类系统是本领域内已知的并是可商购的(例如,来自Ambion ^ Proteinscript II 或来自Invitrogen的 Expressway 或来自Promega的TNT⑧系统或来自Roche的RTS )。还可以使用利用修饰的tRNA分子和tRNA合成酶的基于细胞的方法。这类技术包括ReCodeTM(可从Ambryx Biotechnologies获得)并描述于,例如,美国专利第7,083,970号和第7,045,337号。
READS技术和FSrster共振能量转移(FRET)DNA聚合酶具有精密的3-D感应器,其具有的原子分辨力可以高保真且高速地合成非常长的DNA分子。精密的蛋白质工程技术比利用半导体技术的纳米构建更容易、更划算且更易行。READS不需要荧光标记的核苷酸。因此,荧光核苷酸所导致的背景不是问题。利用高性能的光学和成像技术,可以将剩余的背景(例如,因拉曼散射和瑞利散射而产生的背景)降低到几乎可忽略的水平。因此,对于在持续的时间对单个分子进行成像,如果需要可以计数每个单个光子。DNA聚合酶的DNA合成的常见催化机制在图3示出。在步骤1中,引发的DNA模板与聚合酶的结合是快速的。该过程开始于聚合酶的手掌区与引物/模板之间的特异性相互作用,随后是拇指亚结构域的大幅运动,包围引物/模板,并将引物上最后的3' -OH碱基置于聚合酶的活性位点(图2B、C、D)。在步骤2中,dNTP扩散到活性位点中并且随后的dNTP的结合触发了从开放位置的快速且巨大的构象改变。手指结构域转向活性位点,并形成封闭口袋,只有形状合适的碱基对适于容纳在该口袋中(图2E)。这是关闭构象。在步骤3中(限速步骤),聚合酶和引物/模板/dNTP/2Mg2+复合体之间的进一步相互作用促进该复合体进入具有催化能力的转换态(Rottiwell and Waksman, Adv Protein Chem, 71 :401-440(2005) ;Rothwell et al.,Mol Cell,19 :345-355(2005) ;Stengel et al., Biochemistry, 46 :12289-12297 (2007)) 在步骤4中,发生下述化学反应引物的3' -OH 基通过SN2反应攻击进入的dNTP的α磷酸基,导致新碱基的并入和焦磷酸盐的产生。在步骤5中,复合体经历另一大的构象改变。手指亚结构域转回到开放构象,同时释放焦磷酸盐,模板转位,并且3' -OH再生用于另一轮的合成(持续式合成)或聚合酶复合体的解离 (分配式合成)。高保真度的实现是部分取决于碱基对之间的结构互补性,除进入的碱基和模板碱基之间特异性的Watson-Crick氢键之外,酶活性位点起重要作用(McCulloch and Kunke 1, Cell Res, 18 :148-161(2008) ;Kool,Annu Rev Biochem,71 191-219 (2002)) 中间构象被证实为作为早期检查点,允许进入的dNTP预览模板,随后当碱基错配时快速排斥(Joyce et al.,Biochemistry, 47 :6103-6116 (2008)) 0根据动力学观点,合成的保真度由反应的 k3/KM决定(由于步骤3是限速步骤,所以k。at可以由1^3近似估计)(Tsai et al. , Anal Biochem(2008) ;Tsai and Johnson,Biochemistry,45 :9675_9687 (2006))。除了与过程相关的多种构象改变之外,每个步骤都有特征性的动力学性质 (krk5),在本测序方法中检测了这些性质。每种DNA聚合酶对4种dNTP中的每一种都具有不同的KM。每种碱基的并入速率(k3)也对于每种不同的碱基类型也是特有的。因此,通过精确测量并入速率,我们可以在碱基并入时鉴定每个碱基。给定碱基类型的速率极可能是序列依赖性的,并因此可能轻微地改变,但这种改变小于不同碱基类型之间的差异。通过监测每个碱基并入时伴随的动态构象改变可以获得整个过程的多参数信息。这会在由&决定的特有并入速率之外捕获到与每种碱基类型的并入相关的其它特有特征。例如,模板上的碱基和DNA聚合酶之间的相互作用是大量且特异性的(参见,例如,图2B)。例如由甲基化碱基的存在而引起的相互作用网络的小的波动可以改变聚合酶构象和进入的互补碱基的并入速率。自最初报道以来(Stryer and Haugland, Proc Natl Acad Sci USA, 58 719-726(1967) ;Haugland et al. ,Proc Natl Acad Sci USA,63 :23-30 (1969)),FRET 已经演变为测量纳米级别的生物分子和复合体的构象动力学相关的距离改变的非常强大的工具,所述构象动力学包括蛋白折叠和酶结构动力学。FRET和其他荧光技术可以用于监测DNA合成的构象改变和动力学(Stengel et al. , Biochemistry,46 :12289-12297(2007) ;Tsai et al. , Anal Biochem(2008) ;Tsai and Johnson, Biochemistry, 45 :9675-9687 (2006) ;Allen et al. , Protein Sci,17 401-408(2008) ;Rothwe 11 and Waksman, J Biol Chem, 282 :28884-28892 (2007)) 然而, 之前的测量是在大的分子组装上进行的。本技术依赖于单分子FRET。Eid et al. (Science 323 133-38 (2009))观察到每个不同的核苷酸的不同平均脉冲宽度(等同于 k3) :dATP :132 士 22ms ;dCTP :91 士 19ms ;dGTP :117 士 14ms ;dTTP
1696士 10ms。对于每种dNTP,它们脉冲宽度测量的改变是大的,可能是由于这样的事实DNA 合成反应是在非常低浓度的dNTP下进行的(<<KM)。根据本技术的DNA合成是在高浓度的核苷酸下进行的(等于或稍大于Km)。使用目前的衍射极限光学,包括EMCCD (电子倍增电荷耦合器件)、PMT (光学倍增管)、APD(雪崩光敏二极管)在内的成像感应器以及诸如共聚焦显微镜和全内反射(TIRF) 显微镜的成像技术,常规可以以高速和良好的信噪比对单个荧光分子进行成像(Walter et al.,Nat Methods, 5 :475-489 (2008)) 单分子 FRET 的首次试验展示由 Ha et al.,Proc Natl Acad Sci USA,93 :6洸4_6268 (1996)报道。现在,单分子FRET是应用的标准工具, 所述应用包括在单分子水平上研究蛋白折叠和酶构象动力学的构象改变(Schuler and Eaton, Curr Opin Struct Biol, 18 16-26 (2008) ;Tsai and Johnson, Biochemistry,45 9675-9687(2006) ;Hanson et al. , Proc Natl Acad Sci USA,104 18055-18060(2007); Haas, Chemphyschem,6 :858-870(2005))。大多数有机染料分子在它们最终被光褪色之前可以输出平均一百万至三百万个光子。深冷EMCCD照相机可以以良好的信噪比(S/N)检测约100个光子。如果成像系统的光子收集效率是约10%,在单个染料分子被光褪色之前可以以良好的S/N对其进行几千次的测量。单分子研究中非常需要具有良好光稳定性的染料分子。Alexa系列染料是可获得的最亮且光稳定性最高的有机染料中的一些。使用通过去除氧(例如使用葡萄糖氧化酶/ 过氧化氢酶系统)和防止闪烁(例如使用Trolox)来防止光褪色的合适步骤,使用最新技术的的光学技术和感应器可以对每个染料有效进行高达100,000次测量。噪音的主要来源是拉曼散射和其它散射,其可通过限制照射量来限制。分开距离为R的供体和受体染料之间的Fdrster共振能量转移的效率由E = I/ [1+(R/R0)6]给出,其中Rtl是供体-受体对的F5rster半径,这时E= 1/2。对于某些常用的染料对(例如,Cy3-Cy5),Rtl为约50-60 A。该距离相当于DNA聚合酶的尺寸。FRET信号随着距离的六次方而变化。如果供体-受体对位于Rtl附近,可以以最好的信噪比测量出 1 A-50 A的距离的小的改变。使用现有技术,可实现对多个单个FRET对的Ims平行成像或更快的平行成像。利用处于合适距离的一个或多个FRET对可以监测大的和小的构象改变,特别是手指亚结构域和拇指亚结构域的构象改变。此外,对于诸如Klenow和φ-29 DNA聚合酶的某些常见DNA聚合酶,体外DNA合成速率慢于100个碱基/秒,其中φ-29 DNA在32°C下的合成速率为约50-100个碱基/秒,而在4°C下低至5个碱基/秒。因此我们可将合成速率控制到50个碱基/秒,并使用2ms采集速率(500Hz)获得每个并入碱基的10个FRET数据点。使用2X2图像合并,1兆像素的 EMCCD照相机具有140幅/秒的读取速率。设置4个照相机,照相机的联合输出量会是560 幅/秒。这可以给出足够的FRET动力学信息以得到每种碱基类型的指纹谱。如果需要可以将DNA合成速率降到20个碱基/秒。即使使用这个速度,可以在10分钟之内对10,000 个碱基长的DNA进行测序。该技术将微阵列和纳米阵列用于高效成像,例如,每个模板9像素(Barbee and Huang, Anal Chem,80 :2149-2154(2008)) 有了这样的性能,可以在一个小时内对人类基因组[(1,000, 000/9)^20*3600 = 72亿个碱基]进行测序。READS中使用的聚合酶DNA (和RNA)聚合酶是指导从个体碱基/核苷酸以模板特异性的方式合成DNA (和RNA)的分子马达。结构和酶学机制属于几乎所有蛋白中表征最清楚的,并且经常用作酶催化和特异性的教科书范例。为简单起见,我们关注使用DNA聚合酶的DNA合成和测序。然而,本发明的方法可以扩展到使用RNA聚合酶或逆转录酶来检测序列,即,按照对于DNA聚合酶所描述的那样, 用FRET对标记RNA聚合酶或逆转录酶。所有DNA聚合酶具有由手指亚结构域、手掌亚结构域和拇指亚结构域组成的共有结构框架,有时还存在外切核酸酶亚结构域(参见图2)。尽管天然存在的多种DNA聚合酶的序列是多样的,但是结构和催化机制拥有共同的特征(Rottiwell,P. J. and Waksman, G., Adv Protein Chem,71 :401-440(2005) ;McCulloch, S. D. and Kunke1, Τ. Α.,Cell Res,18 148-161(2008))。DNA聚合酶的常见机制在上文解释并在图3中示出(Rottiwel 1,PJ. And Waksman,G.,Adv Protein Chern,71 :401-440(2005) ;McCulloch, S.D. and Kunke1, Τ.Α., Cell Res,18 148-161(2008)) 如上文所解释,DNA聚合酶按照普遍机制进行工作。因此,任意聚合酶都可用于本文的READS技术。理想情况下,所选择的聚合酶具有如下特征1.易于表达(例如,在大肠杆菌中和/或通过体外转录/翻译系统);2.具有强的链置换活性;3.具有高保真度和持续性;以及4.具有与引发的DNA模板的强结合亲和力(S卩,对于模板结合非常小的Km)。根据测定设计,错误校读活性(即,外切核酸酶活性)可以是不希望的。外切核酸酶活性可以作用于引物,从而使聚合的起始复杂化。有至少两种方式解决该问题(i)提供核酸酶抵抗的引物(例如,修饰的核酸或PNA)或(ii)使用具有降低的外切核酸酶活性的基因工程化的聚合酶。多种聚合酶可以用作本发明的标记的聚合酶的至少一部分。至少五个DNA依赖性的DNA聚合酶家族是已知的,尽管大多数属于A、B和C家族。大多数A家族聚合酶是单链蛋白,其可以包括多种酶学功能,包括聚合酶活性,3'至5'外切核酸酶活性和5'至3' 外切核酸酶活性。B家族聚合酶通常具有单一催化结构域以及辅助因子,所述催化结构域具有聚合酶活性和3'至5'外切核酸酶活性。C家族聚合酶通常是多亚基蛋白,其具有聚合活性和3'至5'外切核酸酶活性。在大肠杆菌中已经发现三种DNA聚合酶DNA聚合酶I、 II和III (分别相当于A、B和C家族)。在真核细胞中,三种不同的B家族聚合酶,即DNA 聚合酶α,δ和ε,参与核复制,而一种A家族聚合酶,即聚合酶Y,用于线粒体DNA复制。 其它类型的DNA聚合酶包括噬菌体聚合酶。这些聚合酶中的任意一个、这些聚合酶中所有或部分的组合以及这些聚合酶或其等同物中两个或更多个之间的嵌合体或杂合体可用于形成本发明的杂合聚合酶的聚合酶结构域的一部分或全部。可以使用的DNA聚合酶的实例包括但不限于φ-29、Taq, Τ7、大肠杆菌 Klenow(来自DNA聚合酶I)、大肠杆菌DNA聚合酶III和嗜热脂肪芽孢杆菌(Baccilus stearothermophilus) (Bst)DNA聚合酶。DNA聚合酶也可以是基因工程化的,例如,杂合体 (例如,融合DNA聚合酶,其中将具有强dsDNA结合亲和力的结构域融合到DNA聚合酶以增强持续性)。许多有用的DNA聚合酶是可商购的(例如,T7 DNA pol、2. 0 版测序酶)。高持续性聚合酶包括φ29和T7 DNA聚合酶和莫洛尼鼠白血病病毒(M-MLV)逆转录酶。本领域技术人员应当意识到,DNA聚合酶是结构上相似的,因此可以使用来自不同聚合酶的同源结构域将重组聚合酶和杂合聚合酶工程化。为方便起见,我们选择了还具有大量可获得的结构数据并且在其表面上有很少天然半胱氨酸残基的聚合酶。在蛋白数据库中(RCSB PDB),有780条DNA聚合酶和DNA聚合酶/底物复合体的高分辨率结构。此外,许多DNA聚合酶的机制已经被深入研究并详细地阐明。我们选择φ 29DNA聚合酶是因为其具有所需的标准。可获得伴有和不伴有引物/模板/核苷酸底物时该聚合酶的高分辨率X射线晶体结构(Berman et al. (2007)EMB0J. 26 3494-3505)。相对于其它常用DNA聚合酶,φ-29 DNA聚合酶具有非常高的保真度(一百万个碱基中少于1个错误)、强的链置换活性和高的持续性。φ 29 DNA聚合酶的DNA合成的化学机械过程中涉及的构象改变是已知的。Berman et al.解析了φ 29 DNA聚合酶复合体的四种晶体结构,包括(1)转位后状态中与引物-模板底物结合的聚合酶(二元复合体)(图 3f) ; (2)在下一个进入的核苷酸与聚合酶结合之前的状态中与引物-模板底物结合的聚合酶(二元复合体)(图北);(3)与具有互补的进入的核苷酸的两个不同引物-模板结构结合的聚合酶(三元结构)(图3c和/或图3d) ; (4)与单链DNA结合的聚合酶(图3g)。READS中使用的标记和染料多种染料可被用作FRET供体和受体(综述可参见Walter et al. (2008)Nat Methods 5 :475-89 ;Ha(2001)Methods 25 :78-86 ;Joo et al. , (2008)Ann. Rev. Biochem 77 :51-76 ;Roy et al.,(2008)Nat Methods 5 :507-16)。理想的染料是1.光稳定的;2.亮的(具有高的吸收消光系数和高发射量子产额);3.光化学上均勻的,在我们测量的时间尺度上显示极小的发射波动(不闪烁);4.小的(使结构干扰最小化);以及5.可以使用可获得的光源进行激发以及可以使用商购EMCCD照相机进行检测。可以使用多种染料,并且这些染料是本领域内已知的。最常用的染料是荧光素、花青素染料(Cy3至Cy7)、罗丹明染料(例如罗丹明6G)、Alexa系列染料(Alexa 405至Alexa 730)。这些染料中的一些已经用于FRET网络(具有多个供体和受体)。用于成像所有这些染料的光学技术需要从UV到接近顶的检测(例如Alex 405至Cy7)以及Atto系列染料(Atto-Tec GmbH)的检测。来自hvitrogen的Alexa系列染料覆盖全光谱范围。它们比其它染料更亮并且光稳定性更高。用于FRET标记的染料对的实例包括Alexa-405/Alex_488、Alexa-488/ Alexa-546、Alexa_532/Alexa_594、Alexa-594/Alexa_680、Alexa-594/Alexa_700、 Alexa-700/Alexa_790、Cy3/Cy5、Cy3. 5/Cy5. 5和罗丹明绿/罗丹明红等。还可以使用诸如银和金纳米簇的荧光金属纳米颗粒(Richards et al.,(2008) J Am Chem Soc 130 5038-39 ;Vosch et al. , (2007)Proc Natl Acad Sci USA 104 :12616-21 ;Petty and Dickson (2003) J Am Chem Soc 125 :7780-81)。尽管这些纳米粒具有良好的光稳定性,但它们比其它染料更大并且能干扰DNA聚合酶的功能。滤色片、二色镜、分色镜和激光器影响染料的选择。在我们的实例中,我们选择了 Alexa 405、Alexa 488、Alexa 532、Alexa 568 和 Alexa 680,开始时使用一对或两个独立的对。可以激发高效有机染料分子使其在被光褪色之前发射一百万至三百万个光子。因此单分子研究需要高度光稳定的染料。Alexa系列染料是可获得的最亮且光稳定性最高的染料中的一些。去除氧(例如使用葡萄糖氧化酶过氧化氢酶系统)和防止闪烁(例如使用 Trolox)会降低光褪色,从而可以获得约100,000次测量。标记位点的选择另一问题是选择聚合酶上用FRET染料标记的残基。在最简单的模型中,用一个 FRET对(即,一个供体和一个受体)标记聚合酶,但是改进的仪器可以允许另外的FRET对和更精密的检测。每个碱基的并入中涉及的5个步骤中的2个产生非常大的构象改变步骤2和 5(参见图;3)。其他步骤涉及蛋白结构中更细微的改变。在最简单的情况下,如果每种碱基具有可区别的构象改变动力学时,来自一个FRET对的实时信号(强度表示为与时间的函数,参见图1)足以解码四种不同碱基。例如,如果每种碱基的& (限速步骤)之间的差异足够大,则能观察到FRET对的信号轨迹中的特征性时段。如果与每中不同碱基相关的特征性构象改变是细微的和/或依赖于序列情况,则可以使用FRET对的多个网络。根据本文所述的标准,可以明确选择聚合酶上定位FRET对或网络的位置。为了使细微改变的检测最大化,FRET对的位置的距离可以大体上等于供体和受体之间的FGrster 半径。如图11所示,分开距离为R的供体和受体染料之间的FSrster共振能量转移的效率由E = i/[i+(RZR0)6]给出,其中Rtl是供体-受体对的Fdrster半径,这时E = 1/2。对于某些常用的染料对(例如,Cy3-Cy5),Rtl为约50-60 A。可以使用以下公式估算任意FRET对的Foster半径
F1Ilo6= 9 MO & If(K) ε (λ) X4 d λ
128m5 Naii4Na是阿伏伽德罗常数;η:折射率;FU)供体的荧光光谱,根据/ F(X)cU = 1 标准化;ε ( λ )受体的消光系数;λ 波长。因此,FRET信号按距离的六次方的函数反向变化。如图11所示,斜率在R = Rtl时最陡。因此,如果供体-受体对位于R0附近,可以以最大的FRET信号改变来测量出1 A至 10 A的距离的小的改变。每种DNA聚合酶对于四种不同的核苷三磷酸(dATP、dACTP、dGTP、dTTP)中的每一种具有不同的亲和力(即Km)和并入速率(由k3近似估计,图3中步骤3)。每种不同dNTP 的并入速率提供最有价值的特征性标志。因此,至少一个FRET对是设计用于以最大灵敏度监测并入速率。选择两个残基,其中在聚合酶的二级结构或亚结构域上各选择一个,使得当两个二级结构或亚结构域的构象处于开放状态和关闭状态中间时(例如图3中b和c之间或d和e之间),供体和受体之间的距离等于它们的F^rster半径。可以根据该依据来定位用于监测任意具体聚合酶上任意具体构象改变的FRET 对,从而提供最大的灵敏度和信噪比。遵循本文所述的原则,本领域技术人员可以鉴定突变和标记的可能靶点。可以至少通过以下标准确定待用FRET对标记的残基
1.位于蛋白的溶剂可及表面;2.侧链朝向溶剂的(从而确保标记的可及性并最小化对蛋白结构和活性的干扰);3.在DNA合成过程的步骤之间大幅运动;和4.相隔理想的距离从而给出FRET信号的最大改变。应当考虑染料的大小和连接物(如果存在的话)的长度来给出染料之间距离可能改变的近似值。如果使用接头将染料分子与蛋白连接,则可能需要微调距离以避免过大的转动或侧向移动。用于将染料与氨基酸连接的连接物是已知的且可商购。这类连接物包括简单的烷基改变(例如,丙基)、寡二醇(PEG)或具有诸如苯基或环己基的刚性更强的结构的连接物。连接的活性官能团包括但不限于用于与-SH基(例如,半胱氨酸上的)特异性反应的马来酰亚胺和用于与伯胺特异性反应的(例如,赖氨酸上的)NHS酯基。如果需要,可以利用常规分子生物学技术,通过位点特异性诱变来突变选择用于标记的位点,并且可以在蛋白表达和折叠之后进行标记。φ-29 DNA聚合酶的示例性FRET对和标记位点在实施例1中描述。。表1中公开的位置仅是实例,一些改变是可接受的。FRET供体和受体位点可以位于不同位置,只要它们大体上遵循本文公开的标准。例如,供体或受体的位置可以距表1中公开的位点1、2、3、4或 5个氨基酸。供体和受体位点也可以交换。本领域技术人员应当意识到,通过优化比对聚合酶结构,公开的用于标记φ-29 DNA聚合酶的位点可以用于其他DNA聚合酶。多种DNA聚合酶的结构数据是可获得的。本领域技术人员可以使用本文所述的标准来选择合适的标记位点(例如,溶剂可及的、活性位点外部等)。多种DNA聚合酶的详细结构信息可在NCBI结构数据库获得(MMDB和PDB,可在 NCBI N f^ikU, N Jat ^ ncbi. nlm. nih. gov/sites/entrez ? db = Structure&itool = toolbar)。例如,BST DNA聚合酶I的结构可见于NCBI结构数据库(PDB登录号3EZ5和 3EYZ) ο大肠杆菌DNA聚合酶I的Klenow片段的结构可见于PDB登录号1KFD、IDPUI^Z 和IZM。来自酿酒酵母(S. cerevisae)的高保真度DNA聚合酶δ的结构可见于PDB登录号3ΙΑΥ。Taq DNA聚合酶I的结构可见于PDB登录号4KTQ。Τ7 DNA聚合酶的结构可见于 PDB登录号2AJQ。使用这些结构数据,可以选择具体DNA聚合酶上的位置,例如,选择位置的溶剂可及性。使用已知结构,可以选择FRET供体和受体的位置使其互相接近(约1R。),在DNA合成时接近的程度具有可检测的改变。制备标记的聚合酶的方法可以按照常见的重组和标记方法来制备本发明的标记的聚合酶。例如,可以如上文所述将容易地连接(例如,直接连接、通过诸如生物素的第二标记连接或通过连接物连接)到染料分子上的氨基酸残基引入聚合酶的序列中。这类残基包括半胱氨酸、赖氨酸、精氨酸、天冬氨酸和谷氨酸。如本文所述,在翻译期间可以将标记的或修饰的氨基酸直接添加到聚合酶。可以使用基于细胞的或无细胞的表达系统转录和翻译聚合酶。在使用非天然存在的tRNA分子的基于细胞的转录/翻译系统中,可以将修饰的氨基酸直接引入到蛋白中。 这些修饰的tRNA识别特有的密码子并且可以加载所需的修饰的残基。将用于表达的细胞进行遗传修饰,使其表达特有的tRNA和tRNA合成酶。从而,通过引入具有一个特有密码子的编码序列,该细胞可以用于表达修饰的蛋白。这类技术包括ReCodeTM(可获自Ambryx Biotechnologies),并描述于,例如,美国专利第7,083,970号和第7,045,337号。可以直接并入非天然存在的荧光氨基酸来标记聚合酶分子。例如,Summerer et al. , ((2006)Proc. Natl. Acad. Sci USA 103-9785)描述了使用琥珀无义密码子在酿酒酵母中遗传编码的2-氨基-3-(5-( 二甲基氨基)萘-1-磺胺)丙酸(丹磺酰丙氨酸),以及相应的直系同源tRNA/氨酰-tRNA合成酶对。还可以使用大肠杆菌体外翻译系统来并入非天然的荧光标记的氨基酸(Hohsaka et al. ,2003 Nuc. Acids Symp. Series 3 :271)。体外转录/翻译系统也是可商购的,例如, RTS 系统(5Prime )、Proteinscript (Ambion )或 Expressway (Invitrogen )。实施例中描述了制备标记的φ-29聚合酶的无细胞方法的应用。半胱氨酸、赖氨酸或任何其它容易标记的氨基酸可以是并入DNA聚合酶中的非天然存在的氨基酸。在这种情况下,非天然的是指非自身的或突变的。可以利用标准方法并使用有机荧光染料分子来标记所选的残基。标准反应包括马来酰亚胺标记的染料分子和半胱氨酸的巯基之间的特异性反应;以及NHS标记的染料分子和Fmoc保护的赖氨酸上的胺基之间的反应。如果氨酰基tRNA合成酶不能活化具有相应的标记的氨基酸的半胱氨酸-tRNA 或赖氨酸-tRNA,则可以在利用tRNA合成酶将未标记的氨基酸加载至tRNA之后再进行标记。加载至同类tRNA分子的修饰的半胱氨酸和赖氨酸可以在体内或体外被核糖体有效并入延长的肽链中。该方法允许用所需荧光染料的任意组合、在任意所需位置简单地标记聚合酶。标记的聚合酶的固定可以将标记的聚合酶固定在基底上用于检测。在这种情况下,将模板多核苷酸添加到固定的聚合酶分子上。在某些实施方案中,用互补引物将模板DNA预先引发,然后添加至固定的聚合酶。还可以添加包含dNTP(dATP、dCTP、dTTP、dGTP)的反应混合物。待测序的模板可以是几乎任何形式,例如,剪切的基因组片段、单链或双链线性分子、或环状分子 (例如,质粒DNA)。例如,可以将固相基底安排为平面上的阵列、点阵列、或珠上。用于此目的的常见基底包括玻璃和石英载玻片。由于READS技术被设计为从多于一个DNA聚合酶同时收集测量结果,所以阵列形式是方便的。以阵列形式为例,可以利用各种捕获区域尺寸(用于捕获聚合酶分子的点)。基底可以包含预定尺寸和密度的孔和/或点尺寸,例如约50nl或更小的点尺寸。孔或点的图案可以提供诸如条形码信息的具体信息。基底还可以包含用于产生分析或信号读取的参考测量结果或对照信号的材料,或包含可以简单地用作基底上的定位装置的材料。通过使位于N末端或赖氨酸残基处的胺基、天冬氨酸和谷氨酸的侧链或位于聚合酶C末端的羧酸基与基底上的氨基或羧基反应从而形成共价肽键,可以将聚合酶固定。可以添加碳二亚胺来促进结合反应。可以生物素或抗生物素蛋白与聚合酶连接(例如,通过常规方法连接到特定氨基酸的侧链上),并且所述生物素或抗生物素蛋白与固定在基底上的抗生物素蛋白或生物素连接来实现结合。可以用于固定的官能团和反应包括 巯基-溴乙酰反应·巯基(在氧化、碱性条件下) 氨基-醛反应 巯基-醛反应 羟氨基-醛反应基底上的固定还可以依赖于物理吸附。在这种情况下,通过简单地使缓冲液中的聚合酶分子与基底接触来实现固定。例如,根据常规方法,可以在室温下持续15分钟-2小时,或在4 °C过夜来进行固定反应。本领域技术人员应当理解,这些方法中也可以使用中间连接分子。PEG通常用作连接物。还可以处理基底以提高连接物或反应性基团的结合。金和聚电解质多层是对固体基底所做处理的实例。在具体实例中,可以将具有链霉标签(Str印tag)或生物素标记的DNA聚合酶固定在包被有链霉亲和素的170 μ m玻璃盖玻片上,并组装在流动池内。基底的表面特性对单分子成像非常重要。例如,按照RCA流程(70°C下的1 1 5的NH4OH H2O2 H2O,然后用食人鱼洗液(piranha solution)清洁)清洁玻璃盖玻片基底,用氨基丙基三乙氧基硅烷进行衍生,然后用NHS-PEG500-生物素。然后将生物素化的盖玻片组装在流动池内。使链霉亲和素溶液流进流动池,从而用链霉亲和素将生物素化的表面浸湿。然后使标记的聚合物酶溶液流进流动池。用TIRF 实时监测固定以确保表面上聚合酶的合适密度。聚合酶应当良好地分离开(例如,平均间隔约500nm)以利于更好的光学解析。PEG5000可被用作长的连接物来使聚合酶与玻璃表面分离(约10_15歷)。在DNA 模板被加载到聚合酶之前获取图像。使与引物预杂交的DNA模板溶液流进流动池。孵育一段时间后,获取另一图像。由于聚合酶会与DNA结合并包围DNA,所以FRET强度会发生改变。最终,使dNTP溶液流进流动池以起始DNA合成。获取一系列图像来监测FRET信号。包含合成的120个碱基长的同聚物的测试模板可被用于确定与每种不同碱基相关的特征指纹谱。可以构建包含聚A、聚C、聚G和聚T区段的四种120个碱基长的单链DNA 模板并用于测定。如上文所述,这些测试模板可以与30个碱基长的引物预杂交并被加载到聚合酶。一旦确定每种特征指纹谱,则可以利用READS技术使用更复杂的模板,例如包括, 具有甲基化碱基的模板。固定的模板多核苷酸在某些实施方案中,模板多核苷酸是固定在基底上的。在某些实施方案中,在固定之前用互补寡核苷酸引发模板,而在某些实施方案中,是在固定之后才添加引物。在某些实施方案中,引物寡核苷酸可以执行双功能并被用作捕获探针以将模板固定在基底上。这类双功能寡核苷酸与基底的连接比较接近于所述寡核苷酸5'端,剩下可与模板杂交的3' 端和可以由标记的聚合物酶添加核苷酸碱基的3'羟基。如上文所述,引物可以包括修饰的、核酸酶抵抗的碱基或可以包括PNA分子。当模板多核苷酸被固定时,标记的DNA聚合酶分子被加载到模板分子上,并在适于DNA聚合的条件下与反应混合物混合。
将核酸与基底连接的方法是领域内已知的。使用多种技术可以将多核苷酸分子固定在基底上,包括共价连接和非共价连接。事实上,上文所述的固定聚合酶的相同技术中的很多都可以使用。在某些实施方案中,基底包含与多核苷酸分子杂交的捕获探针。还可以使用接头寡核苷酸,例如,在模板和捕获探针之间的接头寡核苷酸。在某些实施方案中,接头寡核苷酸与模板连接并与捕获探针杂交。在某些实施方案中,接头是可以用末端转移酶添加的多核苷酸(例如,聚A),并可与捕获探针杂交。在某些实施方案中,捕获探针可以包含与接头形成三链体的寡核苷酸夹或类似结构,如Gryaznov et al.,美国专利第5,473,060号所述。表面可以具有反应性官能团,其与多核苷酸上的互补官能团发生反应从而形成共价连接(参见,例如,Smirnov et al., (2004),Genes, Chromosomes & Cancer,40 :72-77 ; Beaucage (2001) ,Current Medicinal Chemistry,8 :1213-1244。长的 DNA 分子(几百个碱基)也可以与疏水表面有效连接,所述疏水表面例如具有较低浓度的诸如-OH基的反应性官能团的清洁的玻璃表面。多核苷酸分子可以被吸附至表面。在这种情况下,多核苷酸分子通过与表面的非特异性相互作用而被固定,或通过诸如氢键、范德华力等的非共价相互作用而被固定。连接还可以包括不同严紧度的洗涤步骤以去除不完全连接的单个分子或其他试剂。在具体实例中,我们利用磁场或电场组装了几乎完全有序的高密度阵列(例如, Barbee & Huang(2008) Anal Chem 80 =2149-54) 光刻法可用于在通过化学方法功能化的玻璃盖玻片上的光致抗蚀剂或SiO2层中产生微孔的圆片规模阵列。所述阵列被包围在微流体装置中,用于磁场或电场引导的将与DNA分子连接的微珠装配成非常高密度的阵列而基本上没有背景或缺陷。利用完善的大规模生产的制造工艺,这些方法可用于制造大规模的、高密度的、维度为数十纳米的阵列。这类低缺陷阵列没有背景并且兼容于自动化工艺、 微流体装置和常规显微术。当高度有序的阵列被适当地设定了大小并与给定CCD感应器对准时,还可以大大改善成像效率并降低成像过程的复杂度。我们已经证实,使每个特征成像仅需要少至3X3的像素。这些技术可以通过减少照射区域来提高我们的单分子阵列的效率并消除背景(因拉曼散射和其他散射)。DNA模板的单个分子可以与作为固定载体的小颗粒(例如,直径为约200nm的二氧化硅或DNA颗粒)连接。仪器本发明的某些实施方案涉及实施READS的装置、系统或仪器。所述系统可以是特别构建用于本方法的,或可以是一般用途的光学仪器,例如由计算机中存储的计算机程序选择性地启动和配置。上文所示的方法并非一定涉及任何特定的光学仪器或电脑装置。具有用于呈现样品的各种光学手段、校正算法和高灵敏度照相机的FRET成像系统是本领域内已知的(参见,例如,美国专利第6,661,909号,第6,456,734号,第 7,012,694号)。在某些实施方案中,该系统包括显微镜、检测相机、光源、落射荧光模块(例如,用于供体,受体和FRET),成像处理器和用于查看数据的图像输出装置中的一个或多个。在某些实施方案中,所述光学仪器包括至少一个照相机和显微镜。所述光学仪器还可以提供背景消减、谱重叠校正和来自三个通道的数据的转化。落射荧光模块包括滤色片(例如,激发光滤色片、发射光滤色片、分色镜),滤色片的选择取决于FRET染料的激发波长和发射波长。
在某些应用中,样品被固定在通过光学系统直接观察的基底上(例如,玻璃)。在某些实施方案中,样品被固定在流动通道里并且铸在芯片上。通过将芯片与封闭了通道的平坦基底(例如,玻璃盖玻片)粘结,可以形成通道。在这种情况下,合成通道的一侧由平坦基底提供。所述仪器可以包括存在多个通道的流动池整合系统,以及用于控制试剂流入和流出流动池的流体学组件(例如微泵、微阀和连接通道)。本发明的仪器可以利用以下描述的管道装置例如,Zdeblick et al.,A Microminiature Electric-to-Fluidic Valve, Proceedings of the 4th International Conference on Solid State Transducers and Actuators,1987 ;Shoji et al.,Proceedings of Transducers,San Francisco,1991 ; Vieider et al. , Proceedings of Transducers,Stockholm,1995。在某些实施方案中,所述仪器包括合成通道、阀、泵和连接通道。在某些实施方案中,流通池由通过具有预定图形的反应通道的硅橡胶垫组装在玻璃载玻片或不锈钢板上的玻璃盖玻片基底组成。玻璃载玻片或不锈钢板中钻有孔用于流体连接。在某些实施方案中,流动池被组装在具有精确温度控制和微流体技术以及用于有效荧光成像的窗口的仪器中。对于高速成像,可以按照图4组装用于对单个分子的复色灵敏成像的基于目标的TIRF系统。该系统由装备有TIRF插片(TIRF 3插片,Carl Zeiss)的落射荧光显微镜 (AxioObserver Zl显微镜,Carl Zeiss)组成,激光激发光通过所述TIRF插片被导入到目标中。利用由压力马达驱动的促动装置可以快速调整TIRF角度。NA为1.46的IOOX油物镜(Alpha planapo 100X/油物镜,Carl kiss)可以用于TIR激光激发和荧光检测。 所述系统具有四种用于激发的定制的直接二极管和二极管泵浦固态激光器G05nm、488nm、 532nm和660nm)。激光器是通过保偏振单模宽带光纤(KineFLEX,Point Source)与TIRF 插片连接。利用自动对焦系统(Definite Focus, Carl Zeiss)可以保持成像时光焦位置, 所述自动对焦系统使用从盖玻片的表面反射的835nm LED光作为对焦反馈。我们已经使用 TIRF显微镜来监测由DNA聚合酶将标记的核苷酸并入。使用了四波段光束分离器和发射光滤色片(Pinkel set, Semrock he.),使得获得4色荧光图像不需要机械切换。对于检测,使用了具有35兆像素/秒的高读取速度、 单光子敏感性和14位动态范围的非常灵敏的分幅转移EMCXD照相机(iXon Plus, Andor Technologies)。使用照相机上的像素合并要素,可以在低至1毫秒的曝光时间连续获得 6X6合并(每个要素36个像素)的完整图像。固态激光器的高功率(> IOOmW)和高调制率(> IOOkHz)与照相机的高读取速度结合在一起允许每个通道仅1毫秒曝光时间的高 SNR成像。该系统能够对单个分子进行实时成像。图5示出系统控制软件中一小部分的分级结构(例如,以C++或合适的编程语言编写)。使用模块式编程,可以减少从设计测序程序到实施的时间。此外,由于诸如EMCCDS 和固态激光器的领域内新技术的发展,从软件抽象出硬件允许容易地整合新装置。具有传统软件平台的另一益处是能够优化和同步从试剂递送到图像获取的测序流程,以达到最高的序列通量。使用从DAQ板(PCI6733,National Instruments)触发的TTL实现了激发源、 TIR角度和检测器的精确时控。这确保了荧光通道和每个图像中均勻光采集之间最小化的色度亮度干扰。控制软件提供了我们的成像系统的可扩展性和优化的核心框架。
所关注的一点是提高成像系统的速度和效率,因为这些因素决定了我们的成像系统的读取长度。如上文所解释,深冷EMCCD照相机可以以良好的信噪比(S/N)检测约100 个光子。如果成像系统的光子收集效率是10%,在染料分子光褪色之前可以以良好的S/N 对单个染料分子进行几千次的测量。由于拉曼散射和瑞利散射,良好S/N所需的光子数量可能更大,可以进行的测量数可能更低。可以使用高性能仪器以最小化这些影响,例如,使用具有非常高的QE(量子效率,高达90%)和高数据速率(IOMHz/像素、无合并)的两个背照射EMCCD照相机。使用两个照相机同时监测来自FRET对的供体和受体的信号,可以在DNA合成期间获取更多的DNA 聚合酶工作时的照片。对于单个Alexa染料分子,可以进行100,000次测量。如果我们假定需要10次快照来捕获每个碱基的指纹谱,则每个特写可以对高达10,000个碱基进行测序。使用具有非常高的光收集能力的物镜来达到最高的光子收集效率,例如,40 X /NAl. 3油物镜和20X/NA1.0水浸物镜。快速转换的高能激光器对于高速成像是理想的。如上文所解释,基于激光器的TIRF系统可以用于高速单分子成像(参见,图13)。我们开发了用于高速成像的软件包,其是通过对每个装置进行编程以实现硬件启动。原则上,DNA合成可以以较低速率进行(例如10个碱基/秒)以便更易于成像。降速的DNA合成可用于在碱基并入期间捕获更多的快照。事实上,Φ-290ΝΑ聚合酶的合成速率可以从4°C下的约5个碱基/秒到32°C下的 100个碱基/秒。对于每秒5个碱基的反应速率,例如,允许有高达200ms来获得由于碱基并入的化学机械过程所导致的FRET特征的一系列快照。将具有4个照相机和4个快速转换激光器(IMHz)的系统用于FRET对/网络的多参数测量会给予我们进行更复杂的激发模式和快速获得更多信息的能力。我们期望使用改进的仪器能在5ms或更少的曝光时间获得良好的S/N。使用改进的系统,可以检测到DNA合成其间化学机械过程中非常小的波动(例如,模板DNA上存在甲基化碱基)。试剂盒和反应混合物本发明提供用于实施READS技术的试剂盒和反应混合物。组分取决于READS被设计用于的具体方面(例如,制备标记的DNA聚合酶,利用固定的DNA聚合酶进行测序或利用固定的模板DNA进行测序)。试剂盒通常包括利用试剂盒的组分进行READS反应的使用说明。制备标记的DNA聚合酶的反应混合物可以包含编码聚合酶的多核苷酸,从而购买者可以操控该序列(例如,添加非天然存在的氨基酸的密码子)。在某些实施方案中,反应混合物不包含所述编码序列,所述编码序列是由购买者提供的,其在特定位置具有非天然存在的氨基酸的密码子。在某些实施方案中,反应混合物包含用于体外转录和翻译的组分。这类组分包括 RNA聚合酶、rNTP、多种tRNA合成酶、所有20种氨基酸的特异性tRNA、氨基酸以及各种缓冲液和盐。在某些实施方案中,对于每种非天然存在的氨基酸都有单独的反应混合物。在某些实施方案中,所有待并入的非天然存在的氨基酸和合适的tRNA及tRNA合成酶都包含在同一反应混合物中。在某些实施方案中,每种非天然存在的氨基酸都用FRET染料标记,或用用于连接FRET染料的接头分子标记。在某些实施方案中,非天然存在的氨基酸是未修饰的,并且在DNA聚合酶翻译之后被修饰(标记)。
制备标记的DNA聚合酶的试剂盒可以包含如上文所述的反应混合物。在某些实施方案中,所述试剂盒包含DNA聚合酶,所述DNA聚合酶任选地包含用于固定到基底上的接头序列(例如,生物素)。在某些实施方案中,DNA聚合酶已经包含可供购买者选择进行标记的多个非天然存在的核酸(例如,半胱氨酸)。根据所用的仪器的性能,可以包含和选择多种染料。在某些实施方案中,试剂盒包含编码标记的DNA聚合酶的核苷酸序列和用于体外或基于细胞的转录/翻译反应的试剂。核苷酸序列还可以被购买者进一步操控,例如,添加非天然存在的氨基酸的另外的密码子。在某些实施方案中,试剂盒包含用于翻译DNA聚合酶的数种反应混合物,从而在聚合酶表面上的特定靶位点引入非天然存在的氨基酸。在某些实施方案中,非天然存在的氨基酸是引入到非天然位置(产生突变DNA聚合酶)的容易标记的氨基酸。在某些实施方案中,用FRET染料标记非天然存在的氨基酸。在后一种情况下,还可以包含修饰的tRNA和tRNA合成酶。 从任选固定的模板DNA合成和测序的反应混合物可以包括dNTP (dATP、dGTP、 dTTP、dCTP),以及标记的聚合物酶所需的各种盐/缓冲液(例如,Mg、Mn和Si盐)。反应混合物还可以包含用于固定模板DNA的组分,例如,接头核苷酸、生物素或抗生物素蛋白等。设计用于使用固定的模板DNA进行测定的试剂盒可以包含本文所述的标记的DNA 聚合酶。在某些实施方案中,DNA聚合酶被包装而没有进行标记,并且包含用于标记聚合酶从而使其适用于购买者使用的光学仪器的说明和试剂。在某些实施方案中,包含寡核苷酸, 例如,捕获探针、引物寡核苷酸、和/或与模板DNA序列连接的寡核苷酸。在某些实施方案中,试剂盒包含例如如上所述的各种反应混合物,而在某些实施方案中,试剂盒不包含反应混合物,并且组分是单独包装的。在某些实施方案中,试剂盒包含合适的基底(例如,处理过的玻璃载玻片),所述基底任选地包含固定的对照序列。设计用于使用固定的标记的DNA聚合酶进行测序的试剂盒包含用于固定DNA聚合酶的试剂(如前所述)或包含具有已经连接的标记的DNA聚合酶的基底。用于测序/合成的试剂盒可以包含反应混合物的组分。典型的DNA聚合酶反应混合物可以包含dNTP、缓冲液(例如,Tris)、各种盐(例如,KC1、NaCl, (NH4)2SO4, MnCl2, Zn 盐、MgCl2),通常还包含稳定剂、去垢剂、DMSO和DTT。本发明的试剂盒包含用于增加聚合酶反应的特异性和效率的添加剂。应当意识到,本发明的试剂盒还包含上述组分的任意组合。说明书可以包含在本发明的试剂盒内。例如,使用固定的模板DNA进行测序的试剂盒的通常流程可以包括以下说明·制备模板DNA (例如,包括分离和去除污染物); 将接头寡核苷酸序列连接到模板DNA上(例如,与基底上的捕获探针杂交或与引物序列杂交);·将模板DNA固定到基底上; 添加引物寡核苷酸;·添加标记的DNA聚合酶和DNA聚合酶反应混合物;·在温度T下孵育(根据成像系统的性能和所需的反应速率给出温度范围);·检测由标记的聚合酶产生的FRET信号;
·任选地,通过洗去DNA聚合酶和反应混合物来终止聚合酶反应;·添加新的(非光褪色的)DNA聚合酶和DNA聚合酶反应混合物;·如前所述检测FRET信号。应当意识到,利用本领域公知的参数来优化DNA聚合酶活性的效率和特异性的条件,上述示例性的流程可以改变。例如,较长的靶核酸的合成可能需要更长的孵育时间和/ 或更高的温度来达到有效且特异性的扩增。应当理解,本文所述的实例和实施方案仅用作示例性目的,并且根据其进行的多种修饰和改变对本领域技术人员是显而易见的,并包括在本申请的实质和范围以及附加权利要求书的范围之内。通过引用将本文引用的所有出版物、网站、专利和专利申请整体并入本文用于所有目的。
实施例实施例1 标记的φ-29 DNA聚合酶的设计为了说明的目的,我们描述了我们对与不同底物复合的φ-29 DNA聚合酶的晶体结构的系统性检验。我们使用了基因工程化的、外切核酸酶缺陷的φ-29 DNA聚合酶(Berman et al.,EMBO J,26 :3494-3505 Q007))。参与去除外切核酸酶活性的突变不影响手指、拇指和手掌结构域上的活性位点或邻近位点。本领域技术人员应当理解,所公开的用于标记CP-29DNA聚合酶的位点可以用于其它DNA聚合酶。如上文所解释,DNA聚合酶的结构具有良好的保守性。因此,通过最佳结构比对(特定结构位置中存在的氨基酸的比对),本文所公开的位置可适用于宽范围的聚合酶。我们选择手指亚结构域上的残基作为荧光供体标记位点的候选者,并选择手掌或拇指亚结构域上的某些残基作为荧光受体标记位点的候选者。图7显示与引物/模板DNA复合的φ-29 DNA聚合酶。尽管在引发的DNA聚合酶中存在两个末端蛋白区(TPR)亚结构域,但是我们关注于由手指、手掌和拇指亚结构域所组成的聚合结构域上的构象和特定残基。φ-29 DNA聚合酶与引物-模板DNA复合的转位后二元复合体(PDB ID :2PZS)和聚合酶与引物-模板DNA和进入的核苷酸底物复合的三元复合体(PDB ID :2PYJ)分别被定义为“开放”和“关闭”构象。该术语反映核苷酸并入引起的构象改变。基于开放和关闭复合体间的手掌和拇指亚结构域的Cα链比对来比较构象转换 (图8)。这两个结构间的RMS(均方根)偏差是0.583 Α。当“开放”和“关闭”形式间的结构转换非常大时(在结合进入的dNTP之后,尖端区移动7.03人),手指亚结构域中的构象发生改变。我们选择半胱氨酸作为非天然存在的氨基酸,用于标记表面上的位点。对于翻译后标记,我们估计了天然的半胱氨酸对水性溶剂的可及性。聚合酶的溶剂可及表面显示在图9中;7个天然的半胱氨酸残基中没有一个位于φ-29 DNA聚合酶的溶剂可及表面上。因此,天然的半胱氨酸残基不会被用作荧光标记位点。不需要替换这些残基,因为它们被隐藏起来并且是标记反应不可及的。φ-29 DNA聚合酶上用作FRET对的候选残基显示在图10中。那些残基对的距离
28列于以下的表1中。在结合进入的核苷酸之前和之后,距离改变较大的FRET对是优选的, 因为这会产生更强的FRET信号。我们选择了 5对,包括突变体E375e’K24(C、突变体E375e’E236C, 突变体E375e’ κ·、突变体E375e’ K547C和突变体e·,它们的距离改变分别为
6.92 A、6.70 A、6.37 A, 7.02 A和6.97 A (图12)。完全溶剂可及的并对于简单且
大量的标记具有良好取向的那些位点在图10中用星号标记。为了防止显著的结构干扰和聚合酶活性丢失,聚合酶的结构和功能完整性所必需的重要残基不包括在内。在所选残基的Cd之间测定了 φ-29 DNA聚合酶从“开放”向“关闭”形式转换中候选残基至间的距离改变,并列于表1中。表1 靴残基、开放和关闭构象中手指和手掌/拇指亚结构域上残基间的距离和距
离的改变(以A为单位)
权利要求
1.标记的DNA聚合酶,其中所述DNA聚合酶包含至少一个FRET供体和至少一个FRET 受体,其中所述FRET供体和FRET受体位于在DNA聚合酶上的位置能使得当聚合酶将核苷酸添加到DNA新生链时,至少根据并入的碱基(A、C、G、T)而产生不同的FRET信号。
2.如权利要求1所述的标记的DNA聚合酶,其中当DNA聚合酶处于开放位置时,FRET 供体距FRET受体为10埃以内的Fdrster半径(Rq)。
3.如权利要求1所述的标记的DNA聚合酶,其中从DNA聚合酶的开放位置到关闭位置, FRET供体和FRET受体之间的F5rster半径改变至少2. 5埃。
4.如权利要求1所述的标记的DNA聚合酶,其中所述FRET供体和FRET受体与DNA聚合酶的溶剂可及表面上的氨基酸共价连接。
5.如权利要求1所述的标记的DNA聚合酶,其中所述DNA聚合酶来自噬菌体或细菌。
6.如权利要求5所述的标记的DNA聚合酶,其中所述噬菌体是φ-29。
7.如权利要求5所述的标记的DNA聚合酶,其中所述细菌是大肠杆菌(E.coli)。
8.如权利要求1所述的标记的DNA聚合酶,其中所述DNA聚合酶是经基因工程化的。
9.如权利要求1所述的标记的DNA聚合酶,还包含至少一个第二FRET供体。
10.如权利要求1所述的标记的DNA聚合酶,还包含至少一个第二FRET受体。
11.如权利要求1所述的标记的DNA聚合酶,还包含至少一个第二FRET供体和至少一个第二 FRET受体。
12.如权利要求1所述的标记的DNA聚合酶,其中所述FRET供体和FRET受体的位置能使得当DNA聚合酶读取模板DNA上甲基化的核苷酸时,产生不同的FRET信号。
13.如权利要求1所述的标记的DNA聚合酶,其中按照包括以下步骤的方法制备所述 DNA聚合酶选择DNA聚合酶上的至少一个第一位置用于FRET供体标记和DNA聚合酶上的至少一个第二位置用于FRET受体标记;和在每个所选的位置处引入非天然存在的氨基酸,从而制备标记的DNA聚合酶。
14.制备权利要求1所述的标记的DNA聚合酶的方法,所述方法包括以下步骤选择DNA聚合酶上的至少一个第一位置用于FRET供体标记和DNA聚合酶上的至少一个第二位置用于FRET受体标记;和在每个所选的位置处引入非天然存在的氨基酸,从而制备标记的DNA聚合酶。
15.如权利要求14所述的方法,所述第一位置处的非天然存在的氨基酸不同于所述第二位置处的非天然存在的氨基酸。
16.如权利要求14所述的方法,其中所述非天然存在的氨基酸是标记的氨基酸。
17.如权利要求14所述的方法,其中所述非天然存在的氨基酸是取代的氨基酸。
18.如权利要求17所述的方法,其中所述取代的氨基酸是半胱氨酸或赖氨酸。
19.如权利要求14所述的方法,其中所述引入步骤包括体外翻译反应。
20.如权利要求19所述的方法,其中所述体外翻译反应包括以下步骤a)将包含编码权利要求1所述的DNA聚合酶的序列的多核苷酸固定;b)在适于翻译的条件下,使所述固定的多核苷酸相继与两种或更多种不同的反应混合物接触;c)在与每种不同的反应混合物接触的间隔,洗涤所述固定的多核苷酸;和d)重复步骤c)和d),直到翻译出DNA聚合酶。
21.如权利要求19所述的方法,其中所述体外翻译反应包括以下步骤a)将包含编码权利要求1所述的DNA聚合酶的序列的多核苷酸固定;b)在适于翻译的条件下,使所述固定的多核苷酸与至少一种第一体外翻译反应混合物接触;c)洗涤所述固定的多核苷酸;d)在适于翻译的条件下,使所述固定的多核苷酸与至少一种第二体外翻译反应混合物接触,其中所述第一和第二体外翻译反应混合物是不同的;e)洗涤所述固定的多核苷酸;和f)重复步骤b)-e),直到翻译出DNA聚合酶。
22.如权利要求21所述的方法,其中所述至少一种第一体外翻译反应混合物选自(i) 包含非天然的氨基酸并且不包含其它氨基酸的反应混合物;和(ii)包含标记的DNA聚合酶序列中除了非天然存在的氨基酸之外的所有氨基酸的反应混合物。
23.如权利要求21所述的方法,其中所述至少一种第二体外翻译反应混合物选自(i) 包含非天然的氨基酸并且不包含其它氨基酸的反应混合物;和(ii)包含标记的DNA聚合酶序列中除了非天然存在的氨基酸之外的所有氨基酸的反应混合物。
24.如权利要求21所述的方法,其中利用自动化系统进行所述体外翻译反应。
25.DNA分子测序方法,所述方法包括以下步骤(a)使权利要求1所述的标记的DNA聚合酶与DNA模板接触,其中所述DNA模板与引物杂交;(b)在适于DNA聚合的条件下,添加DNA测序反应混合物;(c)通过检测标记的DNA聚合酶所产生的FRET信号来检测并入DNA新链中的每个核苷酸的种类,进而对DNA分子进行测序。
26.如权利要求25所述的方法,其中将所述DNA模板固定在基底上。
27.如权利要求25所述的方法,其中将所述DNA聚合酶固定在基底上。
28.如权利要求沈所述的方法,所述DNA模板与所述基底在多于一个位点处连接。
29.如权利要求沈所述的方法,还包括洗涤所述固定的DNA模板,和重复步骤a)-c)。
30.用于DNA分子测序的试剂盒,所述试剂盒包含权利要求1所述的标记的DNA聚合酶和用于蛋白测序的试剂。
31.如权利要求30所述的试剂盒,其中所述试剂盒包含DNA测序反应混合物。
32.如权利要求30所述的试剂盒,还包含dNTP。
33.如权利要求30所述的试剂盒,其中所述标记的DNA聚合酶被固定在基底上。
34.用于标记DNA聚合酶的试剂盒,所述试剂盒包含编码DNA聚合酶的多核苷酸和用于制备标记的DNA聚合酶的试剂。
35.如权利要求34所述的试剂盒,包含至少一种体外翻译反应混合物。
36.如权利要求34所述的试剂盒,还包含氨基酸和tRNA。
37.如权利要求34所述的试剂盒,还包含至少两种FRET染料。
38.如权利要求34所述的试剂盒,其中所述多核苷酸被固定在基底上。
39.DNA分子实时测序系统,包括权利要求1所述的标记的DNA聚合酶和能够检测来自单个分子的FRET信号的光学装置。
40.DNA分子实时测序系统,包括微加工的流通池、微流体技术、温度控制和成像窗口, 其中所述系统能够检测来自单个分子的FRET信号。
全文摘要
本发明提供了用于核酸测序的改进方法,例如,用于医学应用和生物医学研究。公开的方法可以用于快速个性化医学、遗传诊断、病原体鉴定和物种基因组测序。
文档编号C12Q1/48GK102317471SQ200980156620
公开日2012年1月11日 申请日期2009年12月11日 优先权日2008年12月11日
发明者黄晓华 申请人:加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1