一种锚定巢式多重PCR富集DNA目标区域的方法和试剂盒与流程

文档序号:11937917阅读:376来源:国知局
本发明涉及DNA的目标区域富集
技术领域
,尤其涉及一种锚定巢式多重PCR富集DNA目标区域的方法和试剂盒。
背景技术
:随着DNA测序技术的发展,高通量测序技术已被广泛地应用于生命科学研究的各个领域。尽管随着测序技术的不断更新与普及,测序技术的成本也越来越低,但全基因组测序技术本身的花费还是很昂贵。一个较好的解决这一问题的方案是将感兴趣的目标区域富集出来后再进行高通量测序。传统的序列捕获技术,通常是将高通量测序文库构建好后,利用探针进行目标区域的文库富集再测序。除此之外LifeTech公司基于多重PCR技术开发了一种称为Ampliseq的试剂盒,可以通过多重PCR的过程实现目标区域的富集,从而大大缩减了杂交捕获这个耗时的操作过程,可以称为区域捕获技术的一项革新。但是Ampliseq对于细胞游离DNA的目标区域富集却无能为力,因为细胞游离DNA具有片段小的特点,其长度甚至已经小于Ampliseq试剂盒PCR产物的长度;除此之外,基于Ampliseq的区域捕获技术只有在PCR后才能够实现样本之间的混合建库,这是一个比较耗时的过程。技术实现要素:本发明提供一种快速、低成本、高通量的锚定巢式多重PCR富集DNA目标区域的方法和试剂盒,能够实现包括细胞游离DNA的目标区域在内的目标区域富集。根据本发明的第一方面,本发明提供一种锚定巢式多重PCR富集DNA目标区域的方法,该方法包括:将待目标区域富集的DNA进行末端修复和接头序列的连接,其中上述接头序列包括互补的长序列和短序列,上述长序列在靠近连接端处与上述短序列互补,上述长序列的其它部分中包含一段标签序列;对连接上述接头序列的产物进行第一轮多重PCR反应,其中上游引物为锚定引物,下游引物为多重PCR引物组一,上述锚定引物的至少一部分与上述标签序列相同,上述多重PCR引物组一包括多条特异性结合到上述目标区域上的 序列;对上述第一轮多重PCR反应得到的产物进行第二轮多重PCR反应,其中上游引物为上述锚定引物,下游引物为多重PCR引物组二,该多重PCR引物组二包括多条5’-端具有测序引物序列、3’-端特异性结合到上述目标区域上的序列,最后得到两端分别具有上述标签序列和上述测序引物序列的目标区域文库。作为本发明的进一步改进的方案,上述多重PCR引物组一的序列与上述多重PCR引物组二的特异性结合到上述目标区域上的序列相同。作为本发明的进一步改进的方案,上述标签序列为5-10个碱基的序列,并且上述标签序列在不同样本间为不同序列。作为本发明的进一步改进的方案,上述末端修复后的DNA两端带有突出的A碱基,与上述接头序列的突出的T碱基形成粘末端连接。作为本发明的更进一步改进的方案,上述接头序列的长序列的3’-端具有上述T碱基、5’-端具有上述标签序列,上述短序列与上述长序列在靠近上述T碱基处互补。根据本发明的第二方面,本发明提供一种锚定巢式多重PCR富集DNA目标区域的试剂盒,该试剂盒包括如下组成部分:接头序列,该接头序列包括互补的长序列和短序列,上述长序列在靠近连接端处与上述短序列互补,上述长序列的其它部分中包含一段标签序列,上述接头序列用于连接到末端修复后的待目标区域富集的DNA两端;锚定引物,该锚定引物的至少一部分与上述标签序列相同,用于作为第一轮多重PCR反应和第二轮多重PCR反应的上游引物;多重PCR引物组一,该多重PCR引物组一包括多条特异性结合到上述目标区域上的序列,用于作为第一轮多重PCR反应的下游引物;多重PCR引物组二,该多重PCR引物组二包括多条5’-端具有测序引物序列、3’-端特异性结合到上述目标区域上的序列,用于作为第二轮多重PCR反应的下游引物。作为本发明的进一步改进的方案,上述多重PCR引物组一的序列与上述多重PCR引物组二的特异性结合到上述目标区域上的序列相同。作为本发明的进一步改进的方案,上述标签序列为5-10个碱基的序列,并且上述标签序列在不同样本间为不同序列。作为本发明的进一步改进的方案,上述接头序列具有突出的T碱基,与上 述末端修复后的DNA两端的突出的A碱基形成粘末端连接。作为本发明的更进一步改进的方案,上述接头序列的长序列的3’-端具有上述T碱基、5’-端具有上述标签序列,上述短序列与上述长序列在靠近上述T碱基处互补。本发明的方法和试剂盒采用锚定巢式多重PCR富集技术,大大缩短了杂交捕获带来的时间和成本的浪费,从而提升了目标区域富集技术的操作通量;将连接有标签序列的产物进行目标区域的锚定巢式多重指数扩增反应,实现细胞游离DNA这种短片段分子的区域捕获;通过对不同样本间进行不同标签序列的标记,减少建库的成本。附图说明图1为本发明一个实施方案的锚定巢式多重PCR富集DNA目标区域的方法原理流程示意图;图2为本发明一个实施例的最终扩增后产物纯化后进行Agilent2100检测结果图。具体实施方式下面通过具体实施方式结合附图对本发明作进一步详细说明。本发明一个实施方案的锚定巢式多重PCR富集DNA目标区域的方法,包括:将待目标区域富集的DNA进行末端修复和接头序列的连接,其中上述接头序列包括互补的长序列和短序列,上述长序列在靠近连接端处与上述短序列互补,上述长序列的其它部分中包含一段标签序列;对连接上述接头序列的产物进行第一轮多重PCR反应,其中上游引物为锚定引物,下游引物为多重PCR引物组一,上述锚定引物的至少一部分与上述标签序列相同,上述多重PCR引物组一包括多条特异性结合到上述目标区域上的序列;对上述第一轮多重PCR反应得到的产物进行第二轮多重PCR反应,其中上游引物为上述锚定引物,下游引物为多重PCR引物组二,该多重PCR引物组二包括多条5’-端具有测序引物序列、3’-端特异性结合到上述目标区域上的序列,最后得到两端分别具有上述标签序列和上述测序引物序列的目标区域文库。上述方案中,待目标区域富集的DNA是指将要通过本发明的上述实施方案的方法进行DNA的目标区域富集的DNA样本,包括任何DNA样本,如基因 组DNA样本、打断的基因组DNA样本和细胞游离DNA等,其中细胞游离DNA比如外周血肿瘤细胞样本DNA等,本发明的上述实施方案的方法特别适合于细胞游离DNA的目标区域富集,这是本发明显著优于现有的Ampliseq试剂盒的特征之一。上述方案中,末端修复主要是指对DNA进行末端补平等,还可能包括末端加A反应等。DNA与接头序列的连接可以采用平端连接或者黏端连接的方式,比如将补平末端的DNA直接与平末端的接头序列进行平端连接,或者将末端加A反应后带有突出A碱基的DNA与带有突出T碱基的黏末端的接头序列进行黏端连接。本发明一个实施例中,基于末端加A反应的易操作性和黏端连接的高效性,而采用黏端连接的方式实现DNA与接头序列的连接。上述方案中,接头序列包括互补的长序列和短序列,所谓长序列和短序列是相对而言的,并没有绝对的长度标准。由于接头序列是双链的,其中一条链较另一条链长,因此分别称为长序列和短序列,其中短序列一般在长序列的一端与其互补,而这一端也就是接头序列与DNA连接的一端,实际上就是平端连接的平端或黏端连接的黏端。上述方案中,长序列的其它部分中包含一段标签序列,是指长序列中除了与短序列互补的那一段以外,还有一段其它序列,而该段序列中包含一段标签序列。标签序列是用来区分不同样本的,不同样本具有不同的标签序列。由于本发明引入了标签序列,因此可以在多重PCR反应之前就将样本混合在一起,从而实现多样本之间的混合操作,这大大降低了样本处理的成本,并可以提高样本处理的通量。标签序列的长度没有严格的限制,可以在几个碱基至几十个碱基之间,一般地标签序列为5-10个碱基的序列,该长度的标签序列兼具区分不同样本和经济节约的特点。理论上,有N个碱基的标签序列可以标记区分4N种不同的样本,因此5-10个碱基的标签序列对于高通量的样本处理而言是足够的。标签序列在长序列上的位置没有严格限定,理论上可以在长序列上除了与短序列互补的那一段序列以外的其它任何位置,可以是长序列的一端或内部,在本发明一个实施例中标签序列位于长序列的一端,优选位于长序列的5’-端,当然在其它情况下也可能位于长序列的3’-端。上述方案中,锚定引物的至少一部分与所述标签序列相同,是指锚定引物的序列中应该有一部分序列能够完全与标签序列相同,只有这样才能在多重PCR反应中将不同样本之间的标签序列完整的保留下来,从而起到区分不同样 本的作用。一般而言,锚定引物应该完全覆盖标签序列,同时延伸到接头序列的长序列的其它部分,当然在某些情况下(比如接头序列的长序列不是很长的情况下)锚定引物完全覆盖接头序列的长序列也是可能的。锚定引物的5’-端可以多出一部分不与接头序列的长序列相同的序列,也可以与接头序列的长序列齐平。上述方案中,多重PCR引物组一包括多条特异性结合到所述目标区域上的序列,即多重PCR引物组一是一组引物序列而不是一条引物序列,这也就是将本发明中的PCR称为多重PCR的原因。多重PCR引物组一中的引物序列条数可以根据待捕获的目标区域的个数确定,一般只要是2条以上(比如2条、3条、5条、10条、20条、100条或1000条甚至更多)引物序列即可组成所谓的多重PCR引物组一。上述方案中,在进行第二轮多重PCR反应时,依然使用上述锚定引物作为上游引物,而使用多重PCR引物组二作为下游引物,该多重PCR引物组二也是多条PCR引物组成的一组引物序列而不是一条引物序列,该组多重PCR引物的特点在于,5’-端具有测序引物序列、3’-端特异性结合到目标区域上,这样通过第二轮多重PCR反应,最后得到两端分别具有标签序列和测序引物序列的目标区域文库。其中,测序引物序列即每个测序平台通用的测序引物序列。最终得到的文库可以直接在特定测序平台(如Hiseq、proton或CG平台)上进行测序。在本发明的一个优选的实施方案中,多重PCR引物组二的特异性结合到目标区域上的序列与多重PCR引物组一的序列相同,也就是说,多重PCR引物组二中的序列比相应的多重PCR引物组一的序列多出5’-端的测序引物序列。第二轮多重PCR反应的目的之一在于扩增目标区域的同时引入测序引物序列,便于后续直接进行测序。在本发明的一个优选的实施例中,如图1所示,末端修复后的DNA两端带有突出的A碱基,接头序列的长序列的3’-端具有突出的T碱基、5’-端具有标签序列,上述突出的A碱基与上述突出的T碱基形成粘末端连接,接头序列的短序列与长序列在靠近上述T碱基处互补,并且锚定引物的一部分与标签序列相同,同时锚定引物的5’-端多出一部分不与接头序列的长序列相同。这样在进行第一轮多重PCR反应时,首先多重PCR引物组一特异性结合到目标区域上,通过延伸生成互补链,然后锚定引物与互补链结合通过延伸生成另一条互补链,此后进行指数PCR扩增;在第二轮多重PCR反应时,锚定引物和多重PCR引 物组二分别作为上游引物和下游引物进行指数PCR扩增。需要说明的是,所谓“上游引物”和“下游引物”仅是相对而言,意在区分PCR反应中两个不同方向的引物,本发明并不特别限定。同时,所谓“多重PCR引物组一”和“多重PCR引物组二”,也可以分别称为“多重PCR第一引物组”和“多重PCR第二引物组”,并且其中“一”和“二”仅是为了区分对象的目的,没有技术上的含义。本发明的锚定巢式多重PCR富集DNA目标区域的方法,基于锚定巢式多重PCR富集技术,首先将连接有接头序列的产物进行目标区域的富集,然后通过特异引物和锚定引物将目标区域进行PCR富集,其中锚定引物与接头序列部分相同,从而使得多重PCR的技术不再受限于短片端核酸序列的影响。除此之外,连接有特定标签序列的产物可以在目标区域富集之前就实现多样本之间的混合操作,这大大降低了样本处理的成本,并可以提高样本处理的通量。本发明只需要通过标签序列的标记、靶区域巢式PCR扩增两个步骤即可实现细胞游离DNA的目标区域富集,富集后的PCR产物可以应用于后续高通量测序或其它分析平台。本发明的方法也同样可以应用于其它组织样本,甚至石蜡包埋甲醛固定的医学样本。同时本发明的方法对不同样本间进行不同标签序列的标记,能减少建库的成本。下面通过实施例更具体地说明本发明的特征、效果和优势,应当理解实施例仅是示例性的,用于说明本发明技术方案的可行性,并不构成对本发明保护范围的限制。实例一:外周血肿瘤细胞样本DNA目标区域的富集1.将外周血肿瘤细胞样本DNA(100ng,浓度10ng/μL)进行末端修复加A后,通过黏性末端方式连接特殊序列的接头,连接产物进行后续巢式多重PCR扩增。1.1末端修复反应体系如表1所示:表1组分用量(μL)片段化DNA10T4DNA聚合酶(NEB)5T4PNK(NEB)5dNTP混合物1.6T4PNKbuffer(NEB)10ddH2O余量总量100将上述末端修复反应体系在20℃下反应30min。1.2加A反应体系如表2所示:表2组分用量(μL)末端修复后DNA4310×bluebuffer(NEB)4.6dATP(5mM)1Klenowexo-(NEB)1ddH2O余量总量50将上述加A反应体系在37℃下反应30min。1.3接头连接反应体系如表3所示:表3组分用量(μL)末端修复加A后DNA33T4DNA连接酶(NEB)1T4DNA连接酶缓冲液(NEB)5接头序列10ddH2O余量总量50将上述接头连接反应体系在20℃下反应15min。2.针对连接产物,采用上游引物为锚定引物,下游引物为多重PCR引物组一进行第一轮多重PCR扩增。扩增体系和条件如表4所示:表43.将上一轮扩增产物再进行第二轮多重PCR,扩增引物的上游引物为锚定引物,下游引物为多重PCR引物组二。扩增体系和条件如表5所示:表5上述步骤所用的接头序列、引物序列如表6所示:表64.最终扩增后产物纯化后进行Agilent2100检测,检测结果如图2所示,236bp处出现三个尖峰,对应多重PCR引物组二中三条引物与锚定引物的扩增产物,说明本发明实施例一成功实现了外周血肿瘤细胞样本DNA富集。以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属
技术领域
的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1