一种两轮信号耦合编码的dna连接测序方法

文档序号:492848阅读:234来源:国知局
一种两轮信号耦合编码的dna连接测序方法
【专利摘要】本发明公开了一种两轮信号耦合编码的DNA连接测序方法,该方法通过优化标记物的编码方式,从而实现在不增加标记物的前提下,利用简单的信号编码关系建立两轮信号之间的耦合关联,一轮测序反应中测定超过一位碱基信息,从而形成快速、准确、低成本和高通量的DNA序列测定方法。本发明方法通过对两轮测序信号的耦合,测定了3位碱基的信息,大大提高了测序速度,当连接效率一定时,测序读长增加了50%,同时测序成本也有一定幅度的降低,并且两轮测序信号之间形成了相互校验的作用,也有利于提升测序结果的准确性。
【专利说明】一种两轮信号耦合编码的DNA连接测序方法

【技术领域】
[0001] 本发明涉及一种采用信号耦合编码的DNA链接测序方法,是一种实现DNA序列分 析的方法,属于生物【技术领域】。 技术背景
[0002] 近年来,随着人类对基因的认识日渐深入,特别是千人基因组计划和各种生物基 因组不断被测序完成,生物学和医学的研究和应用方面产生了巨大的变革。越来越多的研 究和检测方法基于基因的水平上开展,包括对生命体之间差异、疾病的发生发展规律、药物 与生命体相互作用等研究。而这一切都有赖于基因检测手段的发展和进步,如何快速、高效 地检测和筛查基因与基因之间、基因组与基因组之间中的差异,成为后基因组时代的研究 热点之一。
[0003] 传统的基因序列检测方法主要有:Sanger DNA测序法、限制性酶切长度多态性、单 链构象多态性和基于基因芯片的寡核苷酸探针杂交法等。除了 Sanger DNA测序方法外,其 余的几种方法都仅能确定核酸序列中很少的一部分信息,如同管中窥豹一般抽样地获得序 列信息。而Sanger DNA测序方法尽管可以获得所测序列的全部信息,但存在通量低、成本 高、耗时长等不足。人类基因组计划即是通过Sanger测序法完成的,历时十多年,耗费约10 亿美元,这显然是与日益发展的序列信息需求是不相适应的。2005年,在生命科学研究进程 中具有划时代意义的高通量DNA测序技术出现,使得快速、准确、廉价、高通量地获得DNA序 列成为可能。经过近10年的发展,正在应用和研发的高通量DNA测序技术总体上可以分为 三类。第一类是延伸测序法,将信号标记的碱基加入到正在发生聚合反应的DNA链中进行 检测,或通过检测DNA聚合反应中产生的化学变化获得序列信息;第二类是连接测序法,将 信号标记的寡核苷酸片段加入到正在发生连接反应的DNA链中进行检测;第三类是分子影 像等一系列可以在单分子的水平上进行测序的技术,包括诱导DNA分子蜿蜒通过非常细微 的小孔,同时借助精密的电子学或者光学的方法对碱基进行判读的方法,也称为纳米孔道 测序技术。
[0004] 在用于全基因组水平应用的商品化的测序系统中,主要采用的是第一类和第二类 测序法,即延伸测序法和链接测序法。这些商品化的测序系统大幅度提高了 DNA的测序效 率,降低了 DNA的测序成本,然而依然无法满足生命科学研究和医疗检测对测序成本、通 量、速度和准确性方面的需求。究其主要原因,是在检测核酸信息是的信号标记方法单一、 效率不高,或者标记方案繁琐影响其他技术参数。例如,在DNA链接测序方法中,一般的方 案受标记物(如荧光基团)种类的限制,每次连接反应仅能确定一位碱基的信息,如需要在 一次连接反应中确定两位或两位以上的碱基信息,则所需的标记物种类呈指数增长;在一 些方案中,研究者发展了基于信号组合编码的连接测序方法,通过不同标记物状态的组合 进行二维或多维的编码,从而实现在不增加标记物数量的情况一次判读两位碱基,然而这 种编码方法需要至多在一个信号点判读4-5种标记物信号的有无,对测序装备的信号判读 能力要求很高,大幅提高了测序装备的成本,同时由于多种标记物之间的干扰,使得测序的 准确性有了一定的降低。因此,迫切需要发展一种更加有效、实用的信号编码方案,实现测 序位数和标记物编码复杂度之间的平衡,一方面提升单轮测序的测序位数,另一方面尽量 减少标记物数量的使用、降低标记物编码复杂度,减少同一位点标记物的使用种类。


【发明内容】

[0005] 发明目的:针对现有的DNA连接测序技术在检测核酸信号时的测序位数和标记物 编码复杂度之间的失衡,本发明提供一种试图通过优化标记物的编码方式,从而实现在不 增加标记物的前提下,利用简单的信号编码关系建立两轮信号之间的耦合关联,一轮测序 反应中测定超过一位碱基信息,形成快速、准确、低成本和高通量的DNA序列测定方法。


【发明内容】
[0006] :为解决上述技术问题,本发明所采用的技术手段为:
[0007] -种两轮信号耦合编码的DNA连接测序方法,具体包括如下步骤:
[0008] 步骤1,制备一套耦合编码的DNA测序探针:DNA测序探针共16种,分别对应两位 测序碱基的16种组合形式;用四种标记物中的1种标记物或任意2种标记物进行组合共构 成10种标记状态,选用10种标记状态中的8种对16种测序探针进打标记,每种标记状态 对应两种测序探针;
[0009] 步骤2,两轮测序信号耦合确定三位碱基序列信息:采用步骤1得到的一套测序探 针,先进行第一轮测序反应,通过对标记物信号的检测,可以判断待测位置所包含的两位待 测碱基与该标记物状态对应两种测序碱基中的一种互补配对;进行第二轮测序反应,第二 轮测序反应是测定与第一轮测序反应所测的待测碱基存在一位重叠的两位碱基,同样可以 确定这两位待测碱基与所检测到的标记物状态对应两种测序碱基中的一种互补配对;对两 轮测序反应分别确定的两种碱基组合进行全部可能性的判读,即可得到唯一确定的三位碱 基的序列信息;
[0010] 步骤3,连接测序:选取一条测序引物与待测的DNA模板依据碱基互补配对原理进 行杂交;向总的反应体系中加入步骤1的一套测序探针和DNA连接酶及其反应体系,进行 DNA连接反应;完成DNA连接反应后,检测四种标记物的信号状态,确定被测DNA模板上对 应位置两位碱基的两种可能信息;完成对标记物信号的检测后,移除DNA测序探针上的标 记物;重复连接-信号判读-标记物移除操作直至达到或超出待测DNA模板待测区域末端; 该测序引物与待测DNA模板变性分离,选取第二条测序引物,重复杂交及循环连接-信号判 读-标记物移除操作,直至全部未知DNA模板的待测区域的全部序列得以检测;利用测序结 果中每相邻两轮测序信号耦合分别确定不同位置的三位碱基,最终确定DNA模板待测区域 的全部序列信息。
[0011] 其中,步骤1中,所述DNA测序探针包含两位测序碱基和多位简并碱基或包含两位 测序喊基和非严格配对喊基。
[0012] 其中,步骤1中,所述DNA测序探针所包含的两位测序碱基可以是以连续的方式存 在,也可以是以不连续的方式存在。
[0013] 其中,步骤1中,所述标记DNA测序探针是指采用荧光基团通过化学或物理的方法 与DNA测序探针结合或利用测序探针本身化学或物理性质的改变。
[0014] 其中,步骤3中,所述测序引物是指一组只能和所有DNA模板的一段通用序列杂交 的寡核苷酸片段。一组测序引物中每两条在DNA模板上的杂交区域彼此相差一个或数个碱 基,能够使彼此对应轮的测序碱基存在一位重叠,一组测序引物能够在数轮测序反应中完 成对DNA模板全长的测序工作;测序模板上的通用序列,是在测序模板制备过程中通过连 接反应加入,或者在扩增过程中通过引物引入。
[0015] 其中,步骤3中,所述标记物的移除是指移除标记物本身或同时移除与标记物相 连或不相连的一个或多个碱基及相关基团,标记物的移除是标记基团通过化学或物理的方 法与DNA测序探针分离,或DNA测序探针本身化学或物理的性质恢复原有状态。
[0016] 其中,用四种标记物中的1种标记物或2种标记物组合构成的共10种标记状态中 的8种对16种测序探针进行标记,从10种标记状态中选取8种,可以优先选取四种标记物 中的1种标记物对应的4种标记状态,也可以优先选取四种标记物中的2种标记物组合对 应的6种标记状态,也可以随机从10种标记状态中选取8种。
[0017] 其中,用四种标记物中的1种标记物或2种标记物标记每种测序探针,其方案是对 同一 DNA测序探针分子同时标记一种或多种标记物,或者分别用不同的标记物标记同一种 DNA测序探针的不同分子,随后将上述不同测序探针分子混合。
[0018] 本发明的技术基础如下:
[0019] DNA连接测序,是众多边合成边测序方法中的一种,其基本步骤是:首先在待测 DNA模板上杂交一条与特定区域互补的引物;随后向反应器中加入一种或一组寡核苷酸测 序探针,测序探针一般由三部分组成:简并碱基或非严格配对碱基、标记物和测序碱基;简 并碱基或非严格配对碱基主要用于提高探针的适应性,降低整体的特异性,便于DNA连接 反应的发生以利于检测;测序碱基为一位或者多位信息确定的碱基,是测序探针中的特异 性信息,使得测序探针根据其序列的不同有选择性地与配对的测序模板-测序引物复合物 发生连接反应,测序碱基往往与标记物之前存在某种对应关系;测序反应完成后,利用技术 手段检测标记物信息,再利用测序方案中测序碱基和标记物之间存在的对应关系判读测序 模板中相应位置的碱基信息。
[0020] 完成一次连接测序反应后,测序模板-引物-探针复合物上的标记物被移除,以剩 余的测序探针作为新一次连接测序反应的起点,连续进行连接测序反应直至完成所需的测 序长度。这一系列测序反应完成后,测序引物与待测模板变性分离,之后在待测模板上杂交 一条与第一条测序引物序列平移一位或多位碱基的测序引物,重复进行新一轮多次连接反 应;完成后重复变性、杂交、连接过程直至所有位置的碱基信息均完成测定。
[0021] 本发明的技术原理如下:
[0022] 本发明采用与多数测序平台数量一致的四种标记物对测序探针进行标记,每种探 针通过1种或2种标记物进行标记,在四种标记物条件下,使用1种标记物的状态有4种 (分别为:甲、乙、丙、丁),使用两种标记物组合的状态有6种(分别为:甲乙、甲丙、甲丁、乙 丙、乙丁、丙丁),共计10种状态(详细见表1),选取上述10种状态中的8种对两位测序碱 基组成的16种测序碱基组合进行标记(分别为:AA、AC、AG、AT、CA、CC、CG、CT、GA、GC、GG、 61\了4、1'(:、了6、1'1'),每种标记物状态对应两种(详细见表2)。由上述方案可知,在进行一轮 测序反应后,通过检测标记物的状态,可以确定连续两位待测碱基序列为该标记物状态对 应的两种碱基组合中的一种。
[0023] 表1标记物和标记物组合构成的状态列表
[0024]

【权利要求】
1. 一种两轮信号耦合编码的DNA连接测序方法,其特征在于:具体包括如下步骤: 步骤1,制备一套耦合编码的DNA测序探针:DNA测序探针共16种,分别对应两位测序 碱基的16种组合形式;用四种标记物中的1种标记物或任意2种标记物进行组合共构成10 种标记状态,选用10种标记状态中的8种对16种测序探针进打标记,每种标记状态对应两 种测序探针; 步骤2,两轮测序信号耦合确定三位碱基序列信息:采用步骤1得到的一套测序探针, 先进行第一轮测序反应,通过对标记物信号的检测,可以判断待测位置所包含的两位待测 碱基与该标记物状态对应两种测序碱基中的一种互补配对;进行第二轮测序反应,第二轮 测序反应是测定与第一轮测序反应所测的待测碱基存在一位重叠的两位碱基,同样可以确 定这两位待测碱基与所检测到的标记物状态对应两种测序碱基中的一种互补配对;对两轮 测序反应分别确定的两种碱基组合进行全部可能性的判读,即可得到唯一确定的三位碱基 的序列信息; 步骤3,连接测序:选取一条测序引物与待测的DNA模板依据碱基互补配对原理进行杂 交;向总的反应体系中加入步骤1的一套测序探针和DNA连接酶及其反应体系,进行DNA连 接反应;完成DNA连接反应后,检测四种标记物的信号状态,确定被测DNA模板上对应位置 两位碱基的两种可能信息;完成对标记物信号的检测后,移除DNA测序探针上的标记物;重 复连接_信号判读-标记物移除操作直至达到或超出待测DNA模板待测区域末端;该测序 引物与待测DNA模板变性分离,选取第二条测序引物,重复杂交及循环连接-信号判读-标 记物移除操作,直至全部未知DNA模板的待测区域的全部序列得以检测;利用测序结果中 每相邻两轮测序信号耦合分别确定不同位置的三位碱基,最终确定DNA模板待测区域的全 部序列信息。
2. 根据权利要求1所述的两轮信号耦合编码的DNA连接测序方法,其特征在于:步骤1 中,所述DNA测序探针包含两位测序碱基和多位简并碱基或包含两位测序碱基和非严格配 对喊基。
3. 根据权利要求1所述的两轮信号耦合编码的DNA连接测序方法,其特征在于:步骤 1中,所述DNA测序探针所包含的两位测序碱基可以是以连续的方式存在,也可以是以不连 续的方式存在。
4. 根据权利要求1所述的两轮信号耦合编码的DNA连接测序方法,其特征在于:步骤1 中,所述标记DNA测序探针是指采用荧光基团通过化学或物理的方法与DNA测序探针结合 或利用测序探针本身化学或物理性质的改变。
5. 根据权利要求1所述的两轮信号耦合编码的DNA连接测序方法,其特征在于:步骤3 中,所述测序引物是指一组只能和所有DNA模板的一段通用序列杂交的寡核苷酸片段。
6. 根据权利要求1所述的两轮信号耦合编码的DNA连接测序方法,其特征在于:步骤3 中,所述标记物的移除是指移除标记物本身或同时移除与标记物相连或不相连的一个或多 个碱基及相关基团。
【文档编号】C12Q1/68GK104388546SQ201410599337
【公开日】2015年3月4日 申请日期:2014年10月30日 优先权日:2014年10月30日
【发明者】涂景, 陆祖宏, 李俊吉, 郭靖, 高珅, 梁福鹏 申请人:东南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1