用于核酸测序的组合物和方法

文档序号:8539300阅读:551来源:国知局
用于核酸测序的组合物和方法
【专利说明】用于核酸测序的组合物和方法
[0001] 本申请是国际申请PCT/US2009/001926,国际申请日2009年3月27日,中国国家 阶段申请号200980115750. 0的发明专利申请的分案申请。
[0002] 相关申请的交叉参考
[0003] 本申请要求如下美国临时专利申请的权益:美国临时专利申请系列号 61/072, 160,申请日2008年3月28日,以及美国临时专利申请系列号61/099, 696,申请日 2008年9月24日,其内容已完整纳入本文作为参考。
[0004] 本申请还涉及美国临时专利申请系列号61/139, 402,申请日2008年12月19 日,美国专利申请系列号[未分配],申请日2009年3月27日(代理人备案系列号 01-007701)和美国专利申请系列号[未分配],申请日2009年3月27日(代理人备案系 列号01-005902),其完整内容已纳入本文作为参考。
[0005] 有关联邦资助的研宄的权利声明
[0006] 无 [0007] 发明背景
[0008] 遗传密码是所有生命构架的蓝图,对遗传密码了解的能力已经在无数领域产生了 巨大的进步。从诊断疾病的能力到鉴定进化联系和/或多样性的能力、操作遗传框架开发 新材料和组合物的能力,这种了解为我们取得不可胜数的进展开启了大门,这些进展已经 使人类获益良多,并且将继续受益。
[0009] 这些进步就整体而言是涉及阅读遗传密码和/或确定遗传密码特征的技术方面 的进步。例如,核酸测序技术的开发使我们能够以逐个碱基的方式确定核酸序列,并将遗传 密码定位到整个人类基因组上。其他方面的进展包括以快速阵列为基础的技术,该技术可 以使我们更合理地确定患者或其他生物样本的遗传模式。
[0010] 每一个技术进步都使我们有机会通过与那些先进领域有关的相关或辅助技术进 一步提高技术水平。例如,荧光染料化学的进展促进了遗传技术的许多进步,使我们能够对 生物反应及其产物进行简单的分析。另外,微流体技术的开发提高了液体和试剂操作的水 平,其达到的重复性水平是以前通过更常规的方式所无法达到的。
[0011] 本发明涉及遗传分析中所用的改良工艺、系统和组合物,这些工艺、系统和组合物 可以提高这些分析的精确度并使之更便于使用。
[0012] 发明概述
[0013] 本发明提供了改良的核酸模板构建物、组合物、试剂盒和包含这种构建物的系统 以及制备和使用这种构建物的方法。
[0014] 在第一方面,本发明提供了确定模板核酸区段中所含的共有核苷酸序列的方法。 该方法包括在一个毗连核酸分子中提供模板核酸区段的正义和反义链。然后利用聚合酶介 导的模板依赖的测序方法测定正义和反义链的序列,进而根据正义和反义链的序列确定靶 核酸区段的共有序列。
[0015] 在一个相关方面,本发明提供了测定核酸序列的方法,该方法包括提供一个包含 具有第一和第二末端的双链核酸区段的模板核酸。第一发卡寡核苷酸在第一末端与模板核 酸的两条链相连,第二发卡寡核苷酸在第二末端与模板核酸的两条链相连。然后利用模板 指导的聚合酶介导的核酸测序方法测定模板核酸至少一条链的核苷酸序列。
[0016] 在另一方面,本发明提供了测定核酸序列的方法,该方法包括提供一个包含具有 第一和第二末端的双链核酸区段的模板核酸,其中第一发卡寡核苷酸在第一末端与模板核 酸的两条链相连,然后利用模板指导的聚合酶介导的核酸测序方法测定模板核酸的核苷酸 序列。
[0017] 在其他方面,本发明提供了测定核酸区段序列的方法,该方法包括提供一个模板 核酸区段。片段包含第一和第二互补核酸链,第一链将连接第一核酸区段3'端的核酸连接 到第二核酸区段的5'端,第二链将连接第一核酸链5'端的核酸连接到第二核酸链的3'端。 然后模板核酸与引物序列接触,其中引物序列与模板核酸的至少一部分互补。然后通过监 测模板依赖的引物延伸反应确定模板核酸的核苷酸序列。
[0018] 在另一方面,本发明提供了测定核酸序列的方法,该方法包括提供一个包含双链 区段的模板核酸,其中双链区段包含第一和第二互补链以及至少一个将第一链3'端连接到 第二链的5'端的第一单链寡核苷酸区段;以及监测模板依赖的合成反应过程中掺入的核 苷酸来测定第一链、连接寡核苷酸区段和第二链的核苷酸序列。
[0019] 在其他优选方面,在上述一个或多个类似寡核苷酸或发卡寡核苷酸内提供对照序 列,如引物识别序列等。
[0020] 在相关的方面,本发明提供了测定模板核酸区段的共有核酸序列的方法,其中在 一个毗连核酸分子内提供模板核酸区段的正义和反义链。毗连核酸分子与引物序列接触和 /或形成复合物,其中引物序列与毗连核酸分子的至少一部分互补,在聚合酶、多种核苷酸 或核苷酸类似物存在的情况下形成核苷酸合成复合体,其中各个核酸合成复合体被沉淀到 底物上,这样就可以通过光学方法测定各个复合体。然后监测和/或检测核酸合成反应中 被各个复合体以模板依赖的方式掺入的核苷酸或核苷酸类似物的序列以确定正义和反义 链的核酸序列。然后利用或比较正义和反义链的核酸序列以确定模板核酸的共有序列。
[0021] 本发明还提供了混合样品测定方法。例如,在某些方面,本发明的方法包括从一群 不连续核酸样品的每一个样品中制备模板核酸区段,其中模板核酸区段包含核酸样品的双 链区段,双链区段的第一链通过连接寡核苷酸与双链区段的第二链连接,其中每一个不连 续核酸样品的连接寡核苷酸都具有独特的可鉴定的序列特征。然后将来自于一群不连续核 酸样品的模板核酸区段混合在一起,测定混合的模板核酸区段的序列以确定可鉴定的序列 特征,根据测序步骤鉴定的至少一部分独特的可鉴定序列特征就可以确定来自于不连续核 酸样品的核酸的序列。
[0022] 本发明还涉及用于上述方法的组合物。在一个方面,本发明提供了包含模板核酸 和至少一个第一连接寡核苷酸区段的组合物,其中模板核酸具有包含第一链区段和与第一 链区段基本互补的第二链区段的双链核酸区段,第一连接寡核苷酸区段将第一链区段的3' 端与第二链区段的5'端连接起来。组合物通常还包含能与模板核酸的至少一部分杂交并 启动聚合酶介导的核酸合成的一个或多个引物序列以及聚合酶。
[0023] 本发明还提供了用于实现本发明方法的模板制备试剂盒。这种试剂盒通常包含第 一连接寡核苷酸、与第一连接寡核苷酸的至少一部分互补的引物序列以及用于将第一连接 寡核苷酸连接到双链模板第一链的3'端和双链模板第二链的5'端的一种或多种连接试 剂。另外,这种试剂盒通常还包含说明书以及可选的用于将连接寡核苷酸连接到待分析样 品来源的双链靶核酸区段上的试剂。
[0024] 本发明还包括用于测定核酸模板序列的系统。系统通常包括反应混合物,该混合 物包含含有模板核酸、聚合酶以及与模板序列的至少一部分互补的引物序列的复合物,其 中模板序列包含具有正义和反义链的双链区段,以及将正义链的5'端连接到反义链的3' 端上的至少一个第一连接寡核苷酸,包含可检测标记基团的至少一个第一核苷酸或核苷酸 类似物,以及用于检测第一核苷酸或核苷酸类似物被聚合酶掺入到引物延伸产物内的检测 系统,
[0025] 尽管为了说明对本发明作了相对详细的描述,但是应当理解的是,本发明的各种 变体在本发明的范围内也可以实现。
[0026] 附图简述
[0027] 图IA以示意图的形式描述了单分子实时测序过程。图IB说明的是通过图IA所 示的过程进行序列阅读的典型短片段。
[0028] 图2说明的是用于本发明的模板构建物的两个典型实施方式。
[0029] 图3以示意图的形式描述了利用图2所示的构建物进行的丰富或共有序列测序过 程。
[0030] 图4说明的是其他模板构建物及其在测序过程中的应用。
[0031] 图5以示意图的形式描述了利用本发明的模板构建物进行共有序列测序的全过 程。
[0032] 图6以示意图的形式描述了利用本发明的模板构建物进行测序的另一种方法。
[0033] 图7以示意图的形式描述了本发明所用的模板构建物的典型装配过程。
[0034] 图8以示意图的形式描述了模板构建物的另一种装配过程。
[0035] 图9以示意图的形式描述了本发明的另一种模板制备过程。
[0036] 图10以示意图的形式描述了本发明的另一种模板制备过程。
[0037] 图11提供了本发明的一个模板构建物的序列读数。
[0038] 图12显示的是单核苷酸变体模板构建物的示意图。
[0039] 图13显示的是反应混合物中变体模板百分数与通过实验呼叫的变体百分数的曲 线。
[0040] 图14显示的是利用本发明的模板构建物对大肠杆菌完整基因组进行序列覆盖的 图。
[0041] 图15显示的是碱基数对大肠杆菌基因组覆盖深度的曲线,其中图A是偏离复制起 点的大肠杆菌基因组复位复制子的不正确测序结果,图B是正确结果。
[0042] 图16显示的是单个毗连模板构建物内测定的大肠杆菌的大重复插入片段的示意 图。
[0043] 发明详述
[0044] I.概论
[0045] 总体来说,本发明涉及用于核酸序列分析,特别是利用模板依赖的合成方法鉴定 靶核酸的核苷酸序列进行序列分析的改良方法、系统和组合物。利用模板依赖的合成方法 进行核酸序列分析可以在单个碱基或碱基群在模板介导的合成反应过程中被添加时确定 它们,例如引物延伸反应,其中碱基的一致性需要与模板序列互补,引物序列可在合成过程 中与模板序列杂交。其他这类过程包括连接驱动过程,其中寡核苷酸或多聚核苷酸与待分 析模板序列形成复合物,用于鉴定该序列内的核苷酸序列。一般来说,这种过程是核酸聚合 酶介导的酶催化过程,如DNA聚合酶、RNA聚合酶、反转录酶等或其他酶如连接驱动过程所 用的酶,例如连接酶。
[0046] 利用模板依赖的合成进行序列分析包括几个不同的过程。例如,现在到处都在使 用的四色桑格测序方法,其中模板分子群用于制备一群互补片段序列。在存在四种天然核 苷酸和一个亚群的染料标记的末端核苷酸如二脱氧核糖核苷酸存在的情况下进行引物延 伸,其中每一种类型的末端子(ddATP,ddGTP,ddTTP,ddCTP)包含一种不同的可检测标记 物。因此可产生一组同类的片段,其中片段终止于引物之外的序列内的每一个核苷酸上,并 且以可以鉴定末端核苷酸的方式被标记。然后根据片段大小对同类片段群进行分离,例如, 利用毛细管电泳,连接在不同大小片段上的标记物被鉴定出来后就可以确定末端核苷酸。 因此,当标记物的序列通过分离系统的检测器时就可以直接读出合成片段的序列信息,根 据互补性也就知道了待测模板的序列新型(参见,例如,美国专利系列号5, 171,534,本文 已完整纳入作为参考)。
[0047] 模板依赖的测序方法的其他例子包括通过合成过程测序,其中当每一个核苷酸在 被添加到正常延长的引物延伸产物内时就可以被反复确定出来。
[0048] 焦磷酸测序方法是一种通过鉴定核苷酸掺入的合成过程而进行的测序方法,其对 核苷酸掺入的鉴定是通过分析得到的合成混合物中是否存在测序反应副产物即焦磷酸盐 而完成的。特别是一种引物/模板/聚合酶复合物只与一种类型的核苷酸接触。如果该核 苷酸被掺入,那么聚会反应就会在三磷酸链的α和β磷酸之间裂解三磷酸核苷,释放出焦 磷酸。然后利用化学发光的酶报告系统鉴定释放出的焦磷酸,该系统可将焦磷酸和AMP转 化成ΑΤΡ,然后利用可产生可测量光信号的荧光素酶测定ΑΤΡ。当检测到光信号时说明有碱 基掺入,没有光信号则没有碱基掺入。经过合适的洗涤步骤以后,各种碱基与复合物循环接 触,顺序鉴定出模板序列内随后的碱基。参见,例如,美国专利系列号6, 210, 891,本文已完 整纳入作为参考)。
[0049] 在相关过程中,引物/模板/聚合酶复合物被固定在基质上,复合物与标记的核苷 酸接触。复合物的固定可通过引物序列、模板序列和/或聚合酶,可以是共价的或非共价 的。一般来说,优选的方面,特别是本发明的优选方面通过聚合酶或引物与基质表面之间的 连接物来固定复合物。各种类型的连接物都可用于这种连接,其中包括,例如,提供生物素 化的表面组分,利用如生物素-PEG-硅烷连接化学,然后生物素化待固定的分子,随后通过 如链亲和素桥连接。其他合成连接化学以及非特异性的蛋白吸附也可用于固定。在其他构 型中,核苷酸可以包含或不包含可去除的末端基团。一旦被掺入,标记物就会连接到复合物 上,因而可以被检测出来。如果使用包含末端基团的核苷酸,那么带有不同可检测标记物的 四种不同核苷酸都与复合物接触。标记的核苷酸的掺入可以使延伸终止,因为存在终止基 团,标记物添加到复合物上。然后从掺入的核苷酸上去掉标记物和终止基团,经过适当的洗 涤步骤以后,重复这个过程。对于不含终止基团来说,一种类型的标记核苷酸被添加到复合 物上以确定该核苷酸是否能被掺入,通过焦磷酸测序。在去除核苷酸上的标记基团并经过 合适的洗涤步骤以后,各种不同的核苷酸循环通过同一过程的反应混合物。参见,例如,美 国专利系列号6, 833, 246,本文已完整纳入作为参考。
[0050] 在另一种通过合成过程进行测序的方法中,不同标记核苷酸的掺入在模板依赖的 合成进行时可以实时观察到。更具体地说,在荧光标记的核苷酸被掺入时可以观察到固定 的各个引物/模板/聚合酶复合物,因此可以在每个碱基添加时实时鉴定之。在这个过程 中,标记物基团连接到在掺入过程中被裂解的核苷酸的部分。例如,通过将标记物基团连接 到掺入过程中被去除的磷酸链部分,即核苷多磷酸上的a、β、γ或其他末端磷酸基团,标 记物不会被掺入到新生链内,取而代之的是产生出天然DNA。各个分子的观察通常包括将复 合物光学禁锢在极小的光照空间内。通过光学禁锢复合物,可以得到一个监测区,随机弥散 的核苷酸在其中停留的时间极短,而掺入的核苷酸可以在观察空间内存在较长的时间,因 为它们已被掺入。这会产生出与掺入事件相关的特征性信号,信号模式的特征就是被掺入 碱基的特征。在相关的方面,相互作用的标记物组分如荧光能量共振转移(FRET)染料对在 有聚合酶或复合物的其他部分以及正在掺入的核苷酸存在的情况下提供,这样掺入事件可 以将标记组分放到相互作用的近处,结果产生特征性信号,也就是说被掺入的碱基的特征 (参见,例如,美国专利系列号 6, 056, 661、6, 917, 726、7, 033, 764、7, 052, 847、7, 056, 676、 7, 170, 050、7, 361,466、7, 416, 844以及出版的美国专利申请系列号2007-0134128,其全部 内容已完整纳入本文作为参考)。
[0051] 基于这种单分子实时(Single Molecule Real Time (SMRTtm))过程的一种典型测 序过程如图1的示意图所示。如图IA的图I所示,包含聚合酶102、模板序列104和与模板 序列104的一部分互补的引物序列106的核酸合成复合体被固定在一个狭窄光学空间(如 虚线108所示)内,例如,得自逐渐消失的光域,得自零点模式波导管100的光照,或者在内 部总反射荧光显微镜系统或上述其他光学禁锢系统内。
[0052] 复合体周围的反应混合物包含四种不同的核苷酸(A、G、T和C),每一种核苷酸用 光谱学上可区分的荧光标记物标记,通过其末端磷酸基团连接到核苷酸上。由于光学空间 如此之小,核苷酸及其相连的荧光标记物弥散进出光学空间的速度极快,因此只能产生极 短的荧光信号(如下文数据示意图中的短脉冲110所示)。当一个特定核苷酸在引物延伸 反应中被聚合酶掺入时,与核苷酸相连的荧光标记物可以在光照空间内停留较长时间(如 较长脉冲112所示)。一旦掺入以后,荧光标记物就通过聚合酶的作用从碱基上裂解下来, 标记物弥散消失。
[0053] 通过测定具有不同光谱特征的较长脉冲,人们可以实时测定每一个掺入碱基在掺 入时的特征。图IB提供了从这个过程读取的序列的短片段的典型曲线,其中含有根据其光 谱特征而鉴定出的掺入核苷酸及其上面列出的其各自的脉冲。与掺入无关的短脉冲都很 短,镜头难以捕捉到,而掺入产生的脉冲可提供更强的可检测脉冲,如图IB所示。
[0054] 虽然是以特异性SMRT?测序过程的术语描述的,但是应当理解的是,根据本发明 的测序组合物,核苷酸或核苷酸类似物也可以通过各种不同的机制来检测,其中包括是否 存在通过a、β、γ或其他多个远端磷酸基团连接到核苷酸上的荧光染料标记物。例如,如 上
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1