一种适用于超微量DNA测序的接头及其应用的制作方法

文档序号:19014398发布日期:2019-11-01 19:27阅读:564来源:国知局
一种适用于超微量DNA测序的接头及其应用的制作方法

本申请涉及核酸序列领域,特别是涉及一种适合用于超微量DNA测序的接头及其应用。



背景技术:

21世纪,随着DNA技术水平的提高,人类基因工程以及千人基因组计划、癌症基因组计划、Meta-Hit计划等重大国际合作项目的相继开展,基因组研究日渐被推向高潮。二代测序以其高通量和高速度的优势占据目前测序行业的大部分市场。主要的二代测序平台有illumina、roche等。二代测序主要是边合成边测序的方法。目前使用的建库方法中,采用Y字形接头连接的方法引入待测DNA的两端,通过传统的PCR方法完成富集和扩增,这种传统的接头和连接扩增方法,容易造成二代测序额外错误率的发生。随着基因工程的日益发展,对测序准确性和灵敏度的要求也越来越高。

此外,1947年,Mandel和Metais在血液、滑膜液和脑脊液等体液中,发现了一种胞外DNA,主要以DNA蛋白质复合物或者游离DNA两种形式存在。到了80年代,Leon等人研究发现,肿瘤患者外周血清DNA水平大大高于正常人。且研究发现,在肿瘤患者的血浆和血清中检测到了与原发肿瘤一致的癌基因突变。这类存在在于肿瘤患者外周血清中的DNA被称为循环肿瘤DNA(circulating tumor DNA,缩写ctDNA)。ctDNA是肿瘤细胞体细胞DNA经脱落或者当细胞凋亡后释放进入循环系统,可以被定性、定量和追踪。因此,理论上只需要检测患者的外周血液血浆中的ctDNA,即可简单、方便的了解癌症患者早期的基因突变信息,从而为癌症的确诊以及靶向用药提供准确的参考信息。

但是,基于ctDNA的检测技术并没有得到广泛应用;其根本原因在于ctDNA在外周血液中的含量特别低。随着肿瘤的疾病进展,ctDNA在血液中的含量也随之升高。但是,就算对于晚期的癌症患者而言,其ctDNA的含量也仅占总数的1%;早期的癌症患者外周血中ctDNA的含量甚至少到0.01%。

目前的建库方法主要是连接Y型接头,Y型接头在与待测DNA的连接过程中,易发生自连,尤其是在待测DNA微量的情况下。这种干扰会降低目的片段的连接效率,不利于含量低的ctDNA的基因检测,影响检测的准确性和特异性。因此,亟需一种能够提高检测准确性和特异性的技术,以解决ctDNA捕获测序的技术壁垒。



技术实现要素:

本申请的目的是提供一种新的特别适用于超微量DNA测序的接头及其应用。

为了实现上述目的,本申请采用了以下技术方案:

本申请的一方面公开了一种适用于超微量DNA测序的接头,接头从5’端到3’端依序包括Tag序列、PolyN序列、第一发夹互补序列、第一发夹结构序列、dUTP、第二发夹结构序列和第二发夹互补序列;所述第二发夹互补序列为第一发夹互补序列的反向互补序列;并且,接头的5’端具有磷酸化标记。

其中,Tag序列用于进行定位,确定分子标记的起始位置,长度在3-4bp,所有接头或者一类接头中Tag序列都是相同的,固定不变;PolyN序列是一段6-12bp的随机序列,用于进行单分子编码,类似于接头的唯一识别码;第一发夹互补序列和第二发夹互补序列两者的序列是互补的,在退火时两者互补杂交,形成发夹结构;而第一发夹结构序列、dUTP和第二发夹结构序列则是发夹结构中的环形部位,在连接靶标DNA片段后,建库DNA扩增的引物就是针对第一发夹结构序列和第二发夹结构序列设计的;dUTP的引入则是为了方便对接头序列进行定位切割。

需要说明的是,本申请的接头,对其结构进行特别设计,使用时,预先对接头进行自身互补、延伸,形成发夹结构,将该发夹结构的接头与待测DNA进行连接,这样有效的避免了像Y型接头在与待测DNA连接时发生自连的问题,特别适合于对超微量DNA的连接,例如ctDNA。

还需要说明的是,只要本申请的接头含有以上结构即可达到本申请的效果,至于各部分序列之间,还可以增加若干个碱基的间隔序列,将各部分隔开,具体的间隔序列,可以根据不同的试验需求而定,在此不做具体限定。

优选的,第一发夹互补序列和第一发夹结构序列之间还具有第一索引序列。

优选的,第二发夹结构序列和第二发夹互补序列之间还具有第二索引序列。

需要说明的是,第一索引序列和第二索引序列,其作用都是为了区分不同个体之间的DNA,增加测序通量;也就是说,可以根据不同的索引序列,判断不同个体来源的DNA,因此,可以对多个个体同时进行测序,增加测序通量。可以理解,如果测序个体只有一个时,完全可以不需要索引序列;或者只要第一索引序列或第二索引序列,在此不做具体限定。

优选的,第一发夹结构序列为Seq ID No.1所示序列,第二发夹结构序列为Seq ID No.2所示序列,第一发夹互补序列为Seq ID No.3所示序列,第二发夹互补序列为Seq ID No.4所示序列;

Seq ID No.1:5’-ACACGTCTGAACTCCAGTCAC-3’

Seq ID No.2:

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-3’

Seq ID No.3:5’-AGATCGGAAGAGC-3’

Seq ID No.4:5’-GCTCTTCCGATCT-3’。

需要说明的是,本申请的接头序列中,第一发夹结构序列和第二发夹结构序列,是为了方便对文库进行PCR扩增富集,在接头连接了不同的待测DNA片段后,针对该区域设计引物就实现DNA片段的PCR扩增。可以理解,本申请的关键在于接头特殊结构的设计,至于Seq ID No.1所示序列、Seq ID No.2所示序列、Seq ID No.3所示序列和Seq ID No.4所示序列组成的接头,只是本申请的一种实现方式中的所采用的具体序列,并不作为本申请的唯一限定。

本申请的另一面公开了本申请的接头在测序文库构建中的应用,以及在二代测序中的应用。

可以理解,本申请的接头虽然是针对超微量DNA的测序或文库构建而设计的,但是,其并不只限用于超微量DNA,一般的测序文库构建和二代测序都可以采用本申请的接头。

本申请的再一面公开了一种ctDNA测序文库构建的方法,包括以下步骤,

(a)采用本申请的接头进行退火延伸,形成发夹结构;

(b)将步骤(a)的产物与提取的ctDNA样品进行连接;

(c)采用dUTP识别酶对步骤(b)的产物进行酶切;

(d)采用引物对酶切产物进行PCR扩增,获得ctDNA测序文库;

其中,引物为分别针对第一发夹结构序列和第二发夹结构序列设计的一对上游引物和下游引物。

优选的,上游引物为Seq ID No.5所示序列,下游引物为Seq ID No.6所示序列;

Seq ID No.5:5’-AATGATACGGCGACCACCGAGATCTACAC-3’

Seq ID No.6:5’-CAAGCAGAAGACGGCATACGTGACTGGAG-3’。

优选的,步骤(a)中,接头进行退火延伸的反应条件包括,先对接头进行退火,具体条件为,95℃10min、70℃10min、65℃10min、60℃10min、55℃10min、50℃10min、45℃10min、40℃10min、25℃10min,退火完成后,向其中加入dNTP、DNA聚合酶以及反应缓冲液,进行延伸,形成发夹结构。

本申请的再一面公开了采用本申请的方法构建的ctDNA测序文库。

本申请的再一面公开了一种微量ctDNA的测序方法,包括采用本申请的方法对样品进行测序文库构建,然后进行DNA测序。

由于采用以上技术方案,本申请的有益效果在于:

本申请的接头序列,在其中设计发夹结构,使用时,接头自身形成发夹结构,然后与待测DNA进行连接,这样有效的避免了接头在与待测DNA连接时的自连,从而避免了由此造成的连接效率低的问题。本申请的接头特别适用于超微量DNA的文库构建和测序,为ctDNA的准确检测奠定了基础。

附图说明

图1是本申请实施例中接头序列的结构示意图;

图2是本申请实施例中接头序列自身互补、延伸的示意图;

图3是本申请实施例中采用本申请的接头进行测序文库构建的示意图;

图4是本申请实施例中LC2014112样本cfDNA的突变检测结果图。

具体实施方式

本申请特别针对Y型接头在跟待测DNA连接时容易出现自连的问题,设计了一种全新结构的接头,该接头在使用时,预先进行退火延伸,自身形成发夹结构,然后再与待测DNA进行连接,有效的解决了接头自连的问题。这对于超微量的DNA来说,可以避免由于接头自连所带来的不利影响。因此,本申请的接头可以很好的适用于超微量DNA。本申请的一种实现方式中,就采用了本申请的接头,对ctDNA进行测序。

下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。

实施例

本例的接头设计如图1所示,接头从5’端到3’端依序包括Tag序列、PolyN序列、第一发夹互补序列、第一索引序列、第一发夹结构序列、dUTP、第二发夹结构序列、第二索引序列和第二发夹互补序列,第二发夹互补序列为第一发夹互补序列的反向互补序列,接头的5’端具有磷酸化标记。图1中,Rd1SP即第一发夹互补序列,Index1即第一索引序列,SP1即第一发夹结构序列,U即dUTP,SP2即第二发夹结构序列,Index2即第二索引序列,Rd2SP即第二发夹互补序列。

使用时预先对接头进行退火、延伸,使其自身形成发夹结构,如图2所示,然后再跟待测DNA连接。

本例以Illumina测序平台为例,按照本例的结构设计接头,接头序列如下所示,需要说明的是,本例由于只针对一个个体样本进行测序,所以接头序列中没有设计索引序列,即没有第一索引序列和第二索引序列。

本例的接头序列:

Tag序列 PolyN 第一发夹互补序列 第一发夹结构序列

dUTP 第二发夹结构序列

第二发夹互补序列

基于本例的接头的测序文库的构建方法,如图3所示,具体包括:第一步,将合成的接头互补配对成发夹状结构,单分子标记的Tag延伸;第二步,将发夹状接头连接到待测DNA的两端,形成闭合的环状结构;第三步,用特定的识别dUTP的User酶进行酶切成单链结构;第四步,针对第一发夹结构序列和第二发夹结构序列设计引物,PCR扩增富集待测的DNA分子。本例的PCR的合成酶,一般选用高保真的Klenow Fragment(DNA Polymerase I)、KAPA HiFi家族、高保真的Phusion家族以及高保真的Q5家族等。因此,在设计引物时,引物退火温度应当符合所选合成酶的活性温度。

试验1

本例以EGFR第17个外显子(exon 17th)作为插入DNA片段,进行试验,通过连接反应在插入DNA片段的两端加接头。EGFR第17个外显子的具体序列如Seq ID No.7所示:

Seq ID No.7:

(1)接头序列互补和延伸

本例针对Illunima平台进行测序设计的接头,即Seq ID No.7所示序列进行试验。

将100μM的接头各取20μL加入一个PCR管中,震荡混匀后离心,浓度为50μM,进行退火。

退火条件如下:

95℃10min降温梯度100%

70℃10min降温梯度5%

65℃10min降温梯度5%

60℃10min降温梯度5%

55℃10min降温梯度5%

50℃10min降温梯度5%

45℃10min降温梯度5%

40℃10min降温梯度5%

25℃10min降温梯度100%。

需要说明的是,本例采用梯度退火的方法,便于发夹结构的形成。比常规的室温退火延伸更高效、灵敏。

退火完成后进行延伸,延伸的反应的总体积为60μL,反应体系为:退火产物40μL、10×NEB buffer 6μL、10mM的dNTP 6μL、5U/μL的Klenowexo-6μL,以及ddH2O 2μL。延伸反应的条件为,37℃反应60分钟。

(2)接头部分与插入DNA片段连接

接头和插入DNA的连接,采用的是DNA连接酶,如T4连接酶,反应体系总计20μL,其中:插入DNA片段50ng、10×buffer 2μL、T4连接酶1μL,ddH2O补足至20μL。反应条件为,16℃过夜,连接效率最高。

此外,需要说明的是,本例采用的是exon 17th作为插入DNA片段,其片段较小可以直接与接头进行连接。同样的,检测来自血液中的游离循环DNA(即cf DNA),这部分cfDNA是游离的DNA片段,长度在160bp左右,在提取后也可以直接进行接连接反应。但是,对于基因组DNA,片段较长,采用连接的插入DNA需要进行片段化处理。例如,提取血液的基因组DNA,dsDNFragmentase,就需要进行片段化后才能与接头连接,片段化的反应体系是基因组gDNA 16μL、10×buffer 2μL、Fragment 2μL,总体系20μL。片段化的处理条件为,37℃反应30分钟。

(3)dUTP识别酶切

对连接产物进行dUTP识别酶切,在连接反应产物的DNA中加入NEBNext USER Enzyme 3μL,37℃孵育15分钟。

酶切反应结束后,进行DNA纯化。本例采用磁珠法对酶反应体系的DNA进行纯化。具体可以采用的磁珠包括:AMPure XP磁珠、OMEGA磁珠等。DNA与磁珠的孵育时间为10-15min,在孵育过程中每5min混合混匀,使得DNA充分与磁珠结合,并使用80%的乙醇清洗磁珠,使得小片段的DNA也能够结合到磁珠上,而不是被乙醇洗去。具体操作如下:

70μLDNA反应体系中加入120μL的磁珠,混匀之后,室温孵育15min,在孵育过程中每5min温和混匀。15min之后将装有DNA以及磁珠的离心管放到磁力架上,室温静置3~5min,等磁珠完全吸附到磁力架上之后,吸去上清,加入500μL 80%的新鲜乙醇,温和的上下颠倒磁力架7~10下,然后室温静置3min左右,吸去上清,重复用乙醇洗涤一次。尽可能的将所有液体吸取干净,将离心管管盖打开,将离心管放置在37℃金属浴上晾干,以磁珠表面没有光泽为止。向磁珠中加入22μL nuclease-free water,充分重悬磁珠,然后室温放置5min左右,使得DNA充分溶解于水中。将离心管放置到磁力架上,室温放置5min,将上清转移至新的EP管中,即获得纯化的DNA。

(4)文库构建

针对第一发夹结构序列和第二发夹结构序列设计引物,本例的引物上游引物为Seq ID No.5所示序列,下游引物为Seq ID No.6所示序列。

引物序列如下:

Seq ID No.5:5’-AATGATACGGCGACCACCGAGATCTACAC-3’

Seq ID No.6:5’-CAAGCAGAAGACGGCATACGTGACTGGAG-3’

本例以KAPA 2G Robust HotStart合成酶进行PCR扩增构建测序文库。PCR扩增反应体系为:2×KAPA 2G Robust HotStart ReadyMix 12.5μL、10μM的上游引物1.25μL、10μM的下游引物1.25μL、DNA模板1ng,补充水至25μL。

PCR反应条件为,95预变性3min,然后进入35个循环:95℃变性10s、63℃退火15s、72℃延伸10s,循环结束后72℃延伸5min,反应结束,4℃待机。

(5)测序

对PCR产物进行测序,本例的测序平台为Illunima平台。

采用本例的接头,并按照前述建库方法和测序平台,对LC2014112样本的cfDNA,进行了测序。LC2014112样本cfDNA的建库起始量为1ng,基因检测结果显示,该样本的EGFR 20号外显子发生了T790M的EGFR-TKI耐药突变,突变率为0.208%,突变检测结果如图4所示。图4的结果显示,在7号染色体的chr7:55249071位置,本身是碱基C,而LC2014112样本DNA中的这个位点存在C突变成T;该位点是EGFR-TKI耐药位点,突变引起EGFR-TKI耐药,该结果经临床验证,临床症状表现为耐药,与检测结果相符,可见本例的检测是正确的。

作为对比,本例采用同样的样本,即同样采用LC2014112样本的cfDNA,同样的建库起始量为1ng,按照传统的Y接头方法,进行建库、测序。结果显示,按照传统方法,并未检测到EGFR的T790M突变信息。

可见,本例的测序接头、建库、测序方法,检测灵敏度高、准确性强,更适合于游离循环DNA的检测。本例的方法有效避免了在DNA文库制备和测序过程中的DNA扩增引入的错误,高保真性还原了样本的DNA信息。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1