通过展开进行高通量核酸测序的制作方法

文档序号:529931阅读:307来源:国知局
专利名称:通过展开进行高通量核酸测序的制作方法
技术领域
本发明主要涉及核酸测序,以及与之相关的方法和产物。相关技术描述核酸序列编码生物体发挥功能和繁殖所必需的信息,实质上是生命的基本信息 (blueprint)。因此测定这些序列在对生物体如何以及在何处存活的纯理论研究中,以及在 如药物研发的应用科学中,都是有用的方法。在医学中,测序方法可用于诊断以及研发多种 疾病的治疗方法,包括癌症、心脏病、自身免疫病症、多发性硬化或肥胖症。在工业中,测序 可用于设计改良的酶促方法或合成生物体。在生物学中,这种方法可以用于研究诸如生态 系统的健康状态,因此拥有广泛的应用。个体的独特DNA序列为他们对特定疾病的敏感性提供了有用的信息。序列可以 为病人提供机会来做早期检测的筛选以及获得预防性治疗。并且,如果获得一个病人的个 体基本信息,临床医生就可以实施个体化治疗来使药物效力最大化并使药物不良事件最小 化。同样,测定病原生物体的基本信息能够为传染性疾病带来新的治疗方法以及更有力的 病原体监测机制。全基因组DNA测序将为现代医学提供基础。DNA测序是测定给定DNA多聚体化学成分的排列顺序的方法。这些化学成分,称为 核苷酸,以四种普遍的形式存在于DNA中脱氧腺苷(A)、脱氧鸟苷(G)、脱氧胞苷(C)和脱 氧胸苷(T)。二倍体人类基因组的测序需要测定大约60亿个核苷酸的连续顺序。目前,大多数DNA测序是使用Frederick Sanger研发的链终止方法来进行的。这 种技术,称为Sanger测序,运用DNA合成的序列特异性终止和荧光修饰的核苷酸报道底物 来获得序列信息。这种方法通过用改良的聚合酶链式反应来测定靶核酸链的序列或读长, 可以达到1000个碱基。在这种改良的反应中,测序可以在选择的碱基类型处(A、C、G或T) 被随机打断,并且可以通过毛细管凝胶电泳测定打断的序列的长度。然后所得的长度可以 确定哪种类型的碱基位于那个长度上。产生了很多重叠的读长,并且使用数据处理将其序 列重叠从而测定最可靠的数据配合。这种产生序列读长的方法是非常费力和昂贵的并且正 在被效率更高的新方法取代。Sanger法曾用于提供人类基因组计划的大部分序列数据,该计划产生人类基因组 的首次完整序列。完成这项计划花费了 10年和将近30亿美元。考虑到巨大的通量和成本 限制,显然,DNA测序技术需要彻底的改善来达到科学界提出的规定的目标。为了达到这一目标,一些二代技术,其远远超越Sanger测序法的通量和每碱基成本的局限性,正占有越 来越多的测序市场。然而,这些“合成测序”法仍然达不到市场要求的通量、成本和质量目 标,例如用于个性化医疗的全基因组测序。例如,妨4 Life kiences公司正在生产可以在7. 5个小时内以200个核苷酸的平 均读长处理1亿个碱基的仪器(例如,基因组测序仪)。他们的方法是,用改变的聚合酶链 式反应(“PCR”)在珠子的表面产生均一的靶核酸的克隆,长度为数百个碱基。这一过程术 语上称为乳液PCR。然后将成千上万的珠子排列于“铬尖晶石平板”上。然后准备该平板用 于进一步的测序,从而使每个核酸碱基类型从平板上依次被漂洗下来。带有并入碱基的靶 标的珠子产生焦磷酸副产物,该副产物可用于催化随后被成像系统监测的光产生反应。Illumina公司也有相似的方法,该方法用可逆的终止核苷酸和荧光标记进行核酸 测序。Illumina的IG分析仪的平均读长少于40个核苷酸。不同于用乳液PCR来扩增序列 靶标,Illumina的方法是在阵列表面扩增PCR克隆。4M和Illumina公司的方法都用复杂 化的聚合酶扩增来增强信号强度,在有速度限制的序列延伸循环中进行碱基测定,并且由 于并入错误降低了与读长成比例的测量信噪比从而限制了读长。Applied Biosystem公司用可逆的终止连接而不是通过合成测序来阅读DNA。像 4M公司的基因组测序仪一样,该技术用基于珠子的乳液PCR来扩增样品。由于大部分的珠 子不承载PCR产物,于是研究人员接下来使用富集步骤选择包被有DNA的珠子。将生物素 包被的珠子涂布并固定于覆盖有链霉抗生物素的玻片阵列上。然后使固定的珠子经过与长 度为Smer (单元单体)的探针杂交(每个用4种不同的荧光染料标记)、连接和剪切(在第 5和第6个碱基之间剪切从而产生用于下一轮连接的位点)的处理过程。每个探针在第4 和第5个碱基位置用双碱基编码系统检测两个碱基,可由成像系统记录。与Illumina公司 的方法相似,Applied Biosystem公司的SOLID平台的平均读长也少于40个核苷酸。通过直接测定DNA单个分子来消除聚合酶扩增步骤的时间和费用的其他方法正 在研发之中。因所述碱基通过将第二种荧光团加入到改造的DNA聚合酶中并用lister共 振能量转移(FRET)来鉴定核苷酸而得以测序,Visigen Biotechnologies公司正在测定带 荧光标记的碱基。这种技术面临分辨碱基信号的难题,将这些碱基信号经由低于1纳米以 及经由聚合酶并入作用分辨出来,会带来很大的统计学偏差。Ling Vitae研发的一种方法可以测定插入到固定的质粒载体中的cDNA的序列。 该方法使用IIS类限制酶剪切靶核酸并将寡聚体连接到靶标上。通常,由限制酶产生的5’ 或3’末端突出端的一个或两个核苷酸决定了在连接混合物中哪种寡聚体文库会被加到靶 标的粘性切割末端。每个寡聚体含有“信号”序列,该序列特异性识别它所取代的核苷酸。 然后重复剪切和连接过程。接下来用各种寡聚体的特异性标签,对新的分子进行测序。该 方法的产物被称为“设计多聚体”并且总是由比其所取代核酸更长的核酸组成(例如,一个 二核苷酸靶序列被一个“放大”的多达100个碱基对的多核苷酸序列所取代)。该方法的优 势在于,如果需要,可以扩增双链体产物链。缺点在于该方法必须是循环的,并且如果同时 发生多个限制性切割,那么模板的连续性将会丢失。Kless的美国专利7,060, 440描述了一种测序方法,该方法包括用聚合酶的聚合 作用来并入寡聚体。改良的Sanger方法,以末端终止的寡聚体为底物,通过凝胶电泳或毛 细管层析法用于建立测序序列梯。虽然用末端连接使寡聚体耦合是众所周知的,但是在模板指导过程中用聚合酶耦合寡聚体以新的优势被应用。期望聚合反应技术能被大力发展,因为改良的聚合酶(和连接酶)可以通过基因 工程学和生物勘探方法获得,并通过聚合酶修饰去除核酸外切酶活性的方法也是已知的。 例如,Williams的已公开的美国专利申请2007/0048748描述了使用突变的聚合酶来并入 染料标记的和其他修饰的核苷酸。这些聚合酶的底物也包括Y-磷酸标记的核苷酸。发现 用嵌合的和突变的聚合酶可以提高并入速度以及降低错误率。此外,学术和工业团队都做了很大的努力利用非合成的方法来测定天然DNA的序 列。例如,Agilent Technologies公司与大学合作者正研发一种单分子检测方法,该方法使 DNA通过一个纳米孔,通过它穿过纳米孔来完成测定。跟Visigen和LingVitae —样,这种 方法必须克服有效地和准确地从由亚纳米尺寸所分离的个体核碱基获得清晰信号的问题, 以及研发相似大小的可再生孔径的问题。同样,在高通量过程中,还未实现通过检测DNA的 组成部分对其直接测序,因为链中的核苷酸小尺寸(大概4埃,中心对中心)以及相应的信 噪比和信号分辨率的限制。DNA的固有的二级结构使直接检测更加复杂,它并不轻易地延伸 成完美的线性多聚体。虽然DNA测序领域已做了重大的进步,但是该领域仍然需要新的改进的方法。本 发明满足了这些需要并提供了其他相关优势。发明概述总的而言,本发明公开了克服了现有高通量核酸测序技术表现出的空间分辨率 难题的方法和相应的设备及产物。这是通过编码在更易检测到的长度延伸的替代多聚 体上的核酸信息来实现的。替代多聚体(本文称为“Xpandomer”)通过模板指导合成 (template-directed synthesis)而形成,其保留了靶核酸的原始遗传信息,同时也提高了 序列数据个体元件的线性分离。在一个实施方案中,公开了一种用于靶核酸测序的方法,包括a)提供通过模 板指导合成所产生的子链,该子链包含耦合于序列中的多个亚基,该序列对应于全部或 部分靶核酸的连续核苷酸序列,其中个体亚基包含连接臂(tether)、至少一个探针或核 碱基(nucleobase)残基以及至少一个选择性可剪切键;b)剪切至少一个选择性可剪切 键,产生长度比子链的多个亚基更长的Xpandomer,该Xpandomer包含连接臂和报道元件 (reporterelement),该报道元件用于解析序列中的遗传信息,该序列对应于全部或部分靶 核酸的连续核苷酸序列;c)检测该Xpandomer的报道元件。在更具体的实施方案中,用于解析遗传信息的报道元件可以与Xpandomer的连接 臂、在至少一个选择性可剪切键剪切前与子链和/或在至少一个选择性可剪切键剪切后与 Xpandomer相连。Xpandomer还可以包含至少一个探针或核碱基残基的全部或部分,且用于 解析遗传信息的报道元件可以与至少一个探针或核碱基残基相连,或者可以是探针或核碱 基残基自身。另外,选择性可剪切键可以是共价键、连接臂内的键、子链的探针或核碱基残 基之间或之内的键,和/或子链的探针或核碱基残基和靶模板之间的键。在其他实施方案中,Xpandomer具有以下结构(I)-(X)结构(I)
权利要求
1.用于靶核酸测序的方法,包括a)提供通过模板指导合成所产生的子链,所述子链包含耦合于序列中的多个亚基,所 述序列对应于全部或部分所述靶核酸的连续核苷酸序列,其中个体亚基包含连接臂、至少 一个探针或核碱基残基,以及至少一个选择性可剪切键;b)剪切至少一个选择性可剪切键,产生长度比子链的多个亚基更长的XpandomerJ^ 述Xpandomer包含所述连接臂和用于解析序列中的遗传信息的报道元件,所述序列对应于 全部或部分所述靶核酸的连续核苷酸序列;以及c)检测所述Xpandomer的报道元件。
2.如权利要求1所述的方法,其中所述用于解析遗传信息的报道元件与所述 Xpandomer的连接臂相连。
3.如权利要求1所述的方法,其中所述用于解析遗传信息的报道元件在所述至少一个 选择性可剪切键剪切前与子链相连。
4.如权利要求1所述的方法,其中所述用于解析遗传信息的报道元件在所述至少一个 选择性可剪切键剪切后与Xpandomer相连。
5.如权利要求1所述的方法,其中所述Xpandomer还包含所述至少一个探针或核碱基 残基的全部或部分。
6.如权利要求5所述的方法,其中所述用于解析遗传信息的报道元件是所述至少一个 探针或核碱基残基或与所述至少一个探针或核碱基残基相连。
7.如权利要求1所述的方法,其中所述至少一个选择性可剪切键是共价键。
8.如权利要求1所述的方法,其中所述至少一个选择性可剪切键是连接臂内的键。
9.如权利要求1所述的方法,其中所述至少一个选择性可剪切键是在所述子链的探针 或核碱基残基之间或之内的键。
10.如权利要求1所述的方法,其中所述至少一个选择性可剪切键是在所述子链的探 针或核碱基残基和靶模板之间的键。
11.如权利要求1所述的方法,其中所述xpandomer包含以下结构ηαI-1-1 p1 p2.-iK其中T表示所述连接臂; P1表示第一探针部分; P2表示第二探针部分;K表示m个亚基的链中的第K个亚基,其中m是大于3的整数;以及 α表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息。
12.如权利要求11所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
13.如权利要求11所述的方法,其中所述子链由多个具有以下结构的寡聚体底物构建 体形成
14.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
15.如权利要求14所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
16.如权利要求14所述的方法,其中所述子链由多个具有以下结构的寡聚体底物构建 体形成
17.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
18.如权利要求17所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
19.如权利要求17所述的方法,其中所述子链由多个具有以下结构的寡聚体底物构建 体形成
20.如权利要求1所述的方法,其中所述Xpandomer包含以下结构其中T表示所述连接臂; P1表示第一探针部分; P2表示第二探针部分;
21.如权利要求20所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
22.如权利要求20所述的方法,其中所述子链由多个具有以下结构的寡聚体底物构建 体形成
23.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
24.如权利要求23所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体其中T表示所述连接臂; P1表示第一探针部分; P2表示第二探针部分; 表示所述至少一个选择性可剪切键;P1’表示与P1互补的模板链的至少一个核苷酸残基的连续核苷酸序列; P2’表示与P2互补的模板链的至少一个核苷酸残基的连续核苷酸序列; κ表示m个亚基的链中的第κ个亚基,其中m是大于3的整数; α表示选自亚基基序文库的亚基基序的类,其中每个所述种类都与部分所述靶核酸的 连续核苷酸序列互补;以及χ表示与相邻亚基的连接臂的键。
25.如权利要求23所述的方法,其中所述子链由多个具有以下结构的寡聚体底物构建 体形成
26.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
27.如权利要求沈所述的方法,其中所述子链在所述至少-前,包含具有以下结构的模板-子链双链体 -个选择性可剪切键剪切
28.如权利要求沈所述的方法,其中所述子链由多个具有以下结构的单体底物构建体 形成
29.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
30.如权利要求四所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
31.如权利要求四所述的方法,其中所述子链由多个具有以下结构的单体底物构建体 形成
32.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
33.如权利要求32所述的方法,其中所述子链在所述至少一个选择性可剪切键剪切 前,包含具有以下结构的模板-子链双链体
34.如权利要求32所述的方法,其中所述子链由多个具有以下结构的单体底物构建体 形成
35.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
36.如权利要求35所述的方法,其中所述子链在所述至少一个选择性可剪切键的剪切 之前,与模板链双链体化产生具有以下结构的双链体子链
37.如权利要求35所述的方法,其中所述子链由多个具有以下结构的单体底物构建体 形成
38.如权利要求1所述的方法,其中所述Xpandomer包含以下结构
39.如权利要求38所述的方法,其中所述子链在所述至少一个选择性可剪切键的剪切 之前,与模板链双链体化产生具有以下结构的双链体子链
40.如权利要求38所述的方法,其中所述子链由多个具有以下结构的单体底物构建体 形成
41.用于靶核酸测序的模板指导合成中所用的寡聚体底物构建体,包含连接于第二探 针部分上的第一探针部分和具有第一末端和第二末端的连接臂,所述第一和第二探针部分 的每一部分都具有适用于所述模板指导合成的末端基团,所述连接臂的至少第一末端连接 于所述第一和第二探针部分中至少之一,其中在用于所述模板指导合成时,所述寡聚体底 物构建体能够形成包含受约束的Xpandomer的子链,所述受约束的Xpandomer具有耦合于 序列中的多个亚基,所述序列对应于全部或部分所述靶核酸的连续核苷酸序列,其中个体 亚基包含连接臂、所述第一和第二探针部分以及至少一个选择性可剪切键。
42.如权利要求41所述的寡聚体底物构建体,具有以下结构
43.如权利要求41所述的寡聚体底物构建体,具有以下结构
44.如权利要求41所述的寡聚体底物构建体,具有以下结构δ “■....·ρε其中τ表示连接臂; P1表示第一探针部分; P2表示第二探针部分;R1和R2表示用于模板指导合成的相同或不同末端基团; ε表示第一连接基团; δ表示第二连接基团;以及 “一一 “表示可剪切的连接臂内的交联键。
45.如权利要求41所述的寡聚体底物构建体,具有以下结构
46.如权利要求41所述的寡聚体底物构建体,具有以下结构
47.用于靶核酸测序的模板指导合成中所用的单体底物构建体,包含带有适用于所述 末端指导合成的末端基团的核碱基残基,和具有第一末端和第二末端的连接臂,且所述连 接臂的至少第一末端连接于所述核碱基残基,其中在用于所述模板指导合成时,所述单体 底物构建体能够形成包含受约束的Xpandomer的子链,所述受约束的Xpandomer具有耦合 于序列中的多个亚基,所述序列对应于全部或部分所述靶核酸的连续核苷酸序列,其中个 体亚基包含连接臂、核碱基残基以及至少一个选择性可剪切键。
48.如权利要求47所述的单体底物构建体,具有以下结构
49.如权利要求47所述的单体底物构建体,具有以下结构
50.如权利要求47所述的单体底物构建体,具有以下结构
51.单体底物构建体,具有以下结构
52.如权利要求47所述的单体底物构建体,具有以下结构
53.用于靶核酸测序的模板指导合成中所用的双链体子链,包含与模板链双链体化的 子链,该子链包含受约束的Xpandomer并具有耦合于序列中的多个亚基,所述序列对应于 全部或部分所述靶核酸的连续核苷酸序列,其中个体亚基包含连接臂、至少一个探针或核 碱基残基以及至少一个选择性可剪切键。
54.如权利要求53所述的双链体子链,具有以下结构
55.如权利要求53所述的双链体子链,具有以下结构
56.如权利要求53所述的双链体子链,具有以下结构
57.如权利要求53所述的双链体子链,具有以下结构
58.如权利要求53所述的双链体子链,具有以下结构
59.如权利要求53所述的双链体子链,具有以下结构
60.如权利要求53所述的双链体子链,具有以下结构
61.如权利要求53所述的双链体子链,具有以下结构
62.如权利要求53所述的双链体子链,具有以下结构
63.如权利要求53所述的双链体子链,具有以下结构
64.用于靶核酸测序的模板指导合成中所用的Xpandomer,包含多个连接臂和用于解 析序列中的遗传信息的报道元件,所述序列对应于全部或部分所述靶核酸的连续核苷酸序 列。
65.如权利要求64所述的Xpandomer,具有以下结构
66.如权利要求64所述的Xpandomer,具有以下结构
67.如权利要求64所述的Xpandomer,具有以下结构
68.如权利要求64所述的Xpandomer,具有以下结构
69.如权利要求64所述的Xpandomer,具有以下结构
70.如权利要求64所述的Xpandomer,具有以下结构
71.如权利要求64所述的Xpandomer,具有以下结构
72.如权利要求64所述的Xpandomer,具有以下结构
73.如权利要求64所述的Xpandomer,具有以下结构
74.如权利要求64所述的Xpandomer,具有以下结构
全文摘要
本发明公开了核酸测序的方法与相关产物。用于靶核酸测序的方法包括,提供通过模板指导合成所产生的子链,该子链包含耦合于序列中的多个亚基,该序列对应于全部或部分靶核酸的连续核苷酸序列,其中个体亚基包含连接臂、至少一个探针或核碱基残基以及至少一个选择性可剪切键。剪切所述选择性可剪切键产生长度比子链的多个亚基更长的Xpandomer,该Xpandomer包含连接臂和报道元件,该报道元件用于解析序列中的遗传信息,该序列对应于全部或部分靶核酸的连续核苷酸序列。随后检测该Xpandomer的报道元件。还公开了相应的产物,包括Xpandomer以及寡聚底物构建体和单体底物构建体。
文档编号C12Q1/68GK102083998SQ200880102935
公开日2011年6月1日 申请日期2008年6月19日 优先权日2007年6月19日
发明者罗伯特·N·麦克卢尔, 马克·斯达马蒂奥斯·可可里斯 申请人:斯特拉托斯基因公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1