用于低频突变检测的二代测序文库的构建方法及试剂盒与流程

文档序号:12584431阅读:835来源:国知局

本发明涉及DNA低频突变检测方法、用于DNA低频突变检测的二代测序DNA文库构建方法及试剂盒,属于基因检测领域。



背景技术:

基因突变是指基因在结构上发生碱基对组成或排列顺序的改变。在自然状态下,基因发生突变的频率很低,而低频突变是指在DNA样本中突变DNA比例低于1%的突变。例如,目前已经证实孕妇血浆中存在胎儿游离DNA,癌症患者血浆中存在肿瘤特征的游离DNA(能够检测到肿瘤基因突变),艾滋病、肝炎等患者血浆中存在病毒DNA,即便是癌组织样本(如FFPE)中也存在片段化且比例很低的亚克隆突变。

低频突变DNA在样本中的含量微少,如通过二代测序方法检测DNA低频突变时,这些DNA低频突变往往无法与扩增错误或测序错误相区分,使得检测结果中存在较高的假阳性率。由于血浆游离DNA的片段化利用常规PCR靶向富集效率差,很难通过增加上机数据量,达到极高测序深度,故会浪费大量的测序数据。因此,这种DNA低频突变的检测成为难题。



技术实现要素:

鉴于上述现有技术中存在的问题,本发明的目的在于提供一种能有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费的DNA低频 突变检测方法、用于DNA低频突变检测的二代测序DNA文库构建方法及试剂盒。

即,本发明包括:

1.一种用于DNA低频突变检测的二代测序DNA文库的构建方法,其包括:

步骤A:将希望进行测序的包含低频DNA的样本中的DNA片段进行末端修复,得到平末端DNA片段;

步骤B:将平末端DNA片段进行3'端加A,得到3'端加A的DNA片段;

步骤C:将所述3'端加A的DNA片段进行加接头,得到加接头DNA片段;以及

步骤D:将所述加接头DNA片段进行PCR扩增,得到扩增产物;

其中,所述步骤C中使用核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA的退火产物作为所述接头;

所述步骤D中使用核苷酸序列如SEQ ID NO:3所示的单链DNA作为PCR扩增引物;且

该方法中仅在所述步骤D中进行一次PCR扩增。

2.根据项1所述的方法,其中,所述步骤D中还使用核苷酸序列如SEQ ID NO:4所示的单链DNA和核苷酸序列如SEQ ID NO:5所示的单链DNA作为PCR扩增引物。

3.根据项1或2所述的方法,其中,步骤A中的DNA片段的量为1~200ng。

4.根据项1~3中任一项所述的方法,其中,步骤A中的DNA片段的量为5~50ng。

5.根据项1~4中任一项所述的方法,其中,在所述步骤A与步骤B之间、所述步骤C与步骤D之间、和/或所述步骤D之后还包括对产物进行纯化的步骤。

6.一种用于构建用于DNA低频突变检测的二代DNA测序文库的试剂盒,其包含:

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA,或者它们的退火产物;以及

核苷酸序列如SEQ ID NO:3所示的单链DNA。

7.根据项6所述的试剂盒,其还包含选自下组中的一种或两种以上:T4DNA聚合酶、Klenow片段、Klenow缓冲液、DNA连接酶缓冲液、DNA连接酶、Taq酶、dNTP、T4多聚核苷酸激酶、以及T4多聚核苷酸激酶缓冲液。

8.根据项6或7所述的试剂盒,其用于实施项1~5中任一项所述的方法。

9.根据项6~8中任一项所述的试剂盒,其还包含核苷酸序列如SEQ ID NO:4所示的单链DNA、以及核苷酸序列如SEQ ID NO:5所示的单链DNA。

10.一种检测DNA低频突变的方法,其包括:

步骤A:将希望进行测序的包含低频DNA的样本中的DNA片段进行末端修复,得到平末端DNA片段;

步骤B:将平末端DNA片段进行3'端加A,得到3'端加A的DNA片段;

步骤C:将所述3'端加A的DNA片段进行加接头,得到加接头DNA片段;

步骤D:将所述加接头DNA片段进行PCR扩增,得到扩增产物;以及

步骤E:对所述扩增产物进行二代测序,并基于测序结果进行生物信息学分析;

其中,所述步骤C中使用核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA的退火产物作为所述接头;

所述步骤D中使用核苷酸序列如SEQ ID NO:3所示的单链DNA作为PCR扩增引物;且

该方法中仅在所述步骤D中进行一次PCR扩增。

11.根据项10所述的方法,其中,所述二代测序利用Illumina平台进行。

12.根据项10或11所述的方法,其中,所述步骤D中还使用核苷酸序列如SEQ ID NO:4所示的单链DNA和核苷酸序列如SEQ ID NO:5所示的单链DNA作为PCR扩增引物。

13.根据项10~12中任一项所述的方法,其中,步骤A中的DNA片段的量为1~200ng。

14.根据项10~13中任一项所述的方法,其中,步骤A中的DNA片段的量为5~50ng。

15.根据项10~14中任一项所述的方法,其中,在所述步骤A与步骤B之间、所述步骤C与步骤D之间、和/或所述步骤D之后还包括对产物进行纯化的步骤。

16.一种用于检测DNA低频突变的试剂盒,其包含:

用于构建二代测序DNA文库的试剂,以及

用于对二代测序DNA文库进行上机测序的试剂;

其中,所述用于构建二代DNA测序文库的试剂包括:

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA,或者它们的退火产物;以及

核苷酸序列如SEQ ID NO:3所示的单链DNA。

17.根据项16所述的试剂盒,其中,所述用于构建二代DNA测序文库的试剂还包括选自下组中的至少一种或两种以上:T4DNA聚合酶、Klenow 片段、Klenow缓冲液、DNA连接酶缓冲液、DNA连接酶、Taq酶、dNTP、T4多聚核苷酸激酶、以及T4多聚核苷酸激酶缓冲液。

18.根据项16或17所述的试剂盒,其中,所述对二代测序DNA文库进行上机测序的试剂包括选自下组中的至少一种或两种以上:再合成试剂、线性化P7接头、线性化P5接头、DNA聚合酶、dNTP、冲洗杂交液/缓冲液、100%甲酰胺(质量/体积)、用于测序的Read 2测序引物、Index i7测序引物、用于测序的Read 1测序引物、Hiseq Rapid PE Flow Cell、水、以及增强光感度/照相用试剂。

19.根据项16~18中任一项所述的试剂盒,其用于实施项10所述的方法。

20.根据项1~19中任一项6所述的试剂盒,其中,所述用于构建二代DNA测序文库的试剂还包含核苷酸序列如SEQ ID NO:4所示的单链DNA、以及核苷酸序列如SEQ ID NO:5所示的单链DNA。

发明效果

根据本发明,提供一种能有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费的DNA低频突变检测方法、用于DNA低频突变检测的二代测序DNA文库构建方法及试剂盒。

发明的具体实施方式

在一个方面中,本发明提供一种用于DNA低频突变检测的二代测序DNA文库的构建方法(本发明的建库方法),其包括:

步骤A:将希望进行测序的包含DNA低频突变的样本中的DNA片段进行末端修复,得到平末端DNA片段;

步骤B:将平末端DNA片段进行3'端加A,得到3'端加A的DNA片段;

步骤C:将所述3'端加A的DNA片段进行加接头,得到加接头DNA片段;以及

步骤D:将所述加接头DNA片段进行PCR扩增,得到扩增产物;

其中,所述步骤C中使用核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA的退火产物作为所述接头;

所述步骤D中使用核苷酸序列如SEQ ID NO:3所示的单链DNA作为PCR扩增引物;且

本发明的建库方法中仅在所述步骤D中进行一次PCR扩增。

所述步骤D中还使用核苷酸序列如SEQ ID NO:4所示的单链DNA和核苷酸序列如SEQ ID NO:5所示的单链DNA作为PCR扩增引物。

SEQ ID NO:1

5'-TACACTCTTTCCCTACACGACGCTCTTCCGATCT(N)nACGCAGAGTGACT-3'(其中,n为6~12的正整数,n个N彼此独立地选自A、T、C、G)

SEQ ID NO:2

5'-GTCACTCTGCGT-3'

SEQ ID NO:3

5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(N)n(X)m-3'(其中,n为6~12的正整数,n个N彼此独立地选自A、T、C、G;m为20-40的正整数,m个X被设计成与希望进行检测的位点附近(距离该位点1~50bp,例如2~20bp)的正义链序列互补)。

SEQ ID NO:4:

5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'

SEQ ID NO:5:

5'-CAAGCAGAAGACGGCATACGAGAT(N)8GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(其中,(N)8为标签序列,用于区分来自不同样本的测序数据。8个N彼此独立地选自A、T、C、G)。作为上述标签序列例如可以采用Illumina公司推荐的标签序列,但也可以自行设计,本领域技术人员知晓,标签的设计可考虑下述原则:(1)考虑到标签序列之间的可识 别性和识别率的问题,在设计标签时,保证了8bp标签中,碱基差异须大于或等于3个碱基;(2)考虑到序列合成或者测序中出现的错误率,因此在设计标签时避免标签8个碱基中出现3个或3个以上的连续相同碱基;(3)考虑到测序中,相同位置的ATGC 4种碱基的含量偏倚会影响到测序质量,在设计标签时,保证标签混合后每个位点的GT与AC碱基的平衡。

在本说明书中,低频突变是指在DNA样本中突变DNA比例低于1%的突变。作为所述低频突变DNA,可以列举出:孕妇血浆中的胎儿游离DNA,癌症患者血浆中的肿瘤特征的游离DNA(能够检测到肿瘤基因突变,艾滋病、肝炎等患者血浆中存在病毒DNA,即便是癌组织样本(如FFPE)中也存在片段化且比例很低的亚克隆突变。

本发明的建库方法中,对步骤A中的DNA片段的量没有特殊限制,但需要说明的是,本发明的建库方法可适用于微少量样本建库,因此,步骤A中的DNA片段的量可以为1~200ng,例如可以为5~50ng。

优选地,本发明的建库方法中,仅在所述步骤D中进行一次PCR扩增(可进行例如10~30个温度循环),除此之外不再包含对加接头DNA片段进行PCR扩增的步骤,这样可以减少因PCR扩增引入的错配,有效降低假阳性的发生。

优选地,在所述步骤A与步骤B之间、所述步骤C与步骤D之间、和/或所述步骤D之后还包括对产物进行纯化的步骤。所述纯化步骤可以按本技术领域通常采用的方法进行,例如进行磁珠纯化。对于例如FFPE样本,可以在步骤A之前将其片段化。

在另一个方面中,本发明提供一种检测DNA低频突变的方法(本发明的检测方法),该方法包括采用本发明的建库方法构建二代测序DNA文库,以及对所述二代测序DNA文库进行二代测序,并基于测序结果进行生物信息学分析。在所述生物信息学分析中,可以根据reads中的与所述SEQ ID NO: 3的(N)n对应的区域的序列,判别某一突变是扩增/测序错误还是真正的低频突变,从而降低检测结果的假阳性。

优选地,本发明的检测DNA低频突变的方法中的测序可以例如利用Illumina平台(例如HiSeq 2500或NextSeq 500)进行。

在另一方面中,本发明还提供一种用于构建二代测序DNA文库的试剂盒,其可用于实施本发明的建库方法,其包含用于构建二代测序DNA文库的试剂,所述用于构建二测序DNA文库的试剂包含:

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA,或者它们的退火产物;以及

核苷酸序列如SEQ ID NO:3所示的单链DNA作为下游引物。

优选地,所述用于构建二代DNA测序文库的试剂还包含选自下组中的一种或两种以上:T4DNA聚合酶、Klenow片段、Klenow缓冲液、DNA连接酶缓冲液、DNA连接酶、Taq酶、dNTP、T4多聚核苷酸激酶、以及T4多聚核苷酸激酶缓冲液。

优选地,所述用于构建二代测序DNA文库的试剂还包含核苷酸序列如SEQ ID NO:3所示的单链DNA。

在另一方面中,本发明还提供一种用于检测DNA低频突变的试剂盒,其可用于实施本发明的检测方法,其包含:

用于构建二代测序DNA文库的试剂,以及

用于对二代测序DNA文库进行上机测序的试剂;

其中,所述用于构建二代测序DNA文库的试剂包括:

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA,或者它们的退火产物;

核苷酸序列如SEQ ID NO:3所示的单链DNA;

核苷酸序列如SEQ ID NO:4所示的单链DNA;以及

核苷酸序列如SEQ ID NO:5所示的单链DNA。

优选地,所述用于构建二代DNA测序文库的试剂还包括选自下组中的至少一种或两种以上:T4DNA聚合酶、Klenow片段、Klenow缓冲液、DNA连接酶缓冲液、DNA连接酶、Taq酶、dNTP、T4多聚核苷酸激酶、以及T4多聚核苷酸激酶缓冲液。

优选地,所述对二代DNA测序文库进行上机测序的试剂包括选自下组中的至少一种或两种以上:再合成试剂、线性化P7接头、线性化P5接头、DNA聚合酶、dNTP、冲洗杂交液/缓冲液、100%甲酰胺(质量/体积)、用于测序的Read 2测序引物、Index i7测序引物、用于测序的Read 1测序引物、Hiseq Rapid PE Flow Cell、水、以及增强光感度/照相用试剂。

优选地,所述用于构建二代测序DNA文库的试剂还包含核苷酸序列如SEQ ID NO:4和5所示的单链DNA。

实施例

以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例是用于解释本发明,并非对本发明的限定。

实施例1采用本发明的建库方法构建二代测序DNA文库

1.特异引物设计

设计了如下的特异引物(相当于SEQ ID NO:3所示的单链DNA),其中,PAJ408可用于检测AKT1NM_001014431:c.A655C:p.T219P,PAJ410可用于检测TP53NM_001126115:c.A733C:p.T245P,PAJ412可用于检测PIK3CA NM_006218:c.A3140G:p.H1047R。

表1 特异引物序列

1.2DNA提取

选取两份血浆样本,采用磁珠法从2mL血浆中提取的游离DNA样本(DP13AN00374、DP13AN00375)并定量取10ng游离DNA建库,分别使用上述特异引物PAJ408、PAJ410、PAJ412来检测AKT1NM_001014431:c.A655C:p.T219P、TP53NM_001126115:c.A733C:p.T245P、PIK3CA NM_006218:c.A3140G:p.H1047R。对于上述的两个样本,除了步骤1.6中使用的Index不同之外,其他操作全部相同。

1.3末端修复

配制末端修复Mix:预先从-20℃保存的试剂盒中取出所需试剂,将其置于冰上化冻并充分混匀。单个样本配制量参见表2。

表2 末端修复反应体系

末端修复反应:向1.5mL离心管中分装9μL Mix,根据建库任务单向相应管中加入DNA样本。将反应体系置于Thermomixer中20℃温浴30分钟。 反应结束后使用1.8×Ampure磁珠回收纯化反应体系中的DNA,溶于32μL EB。

1.4末端加“A”(A-Tailing)

配制末端加“A”混合液:预先从-20℃保存的试剂盒中取出所需试剂,将其置于冰上化冻并充分混匀。单个样本配制量参见表3。

表3 末端加“A”反应体系

末端加“A”反应:向1.5mL的离心管中分装18μl Mix,根据建库任务单向相应管中加入DNA。将样本置于Thermomixer中37℃温浴30分钟。

1.5Adapter的连接(Adapter Ligation)

配制Adapter的连接Mix:预先从-20℃保存的试剂盒中取出所需试剂,将其置于冰上化冻并充分混匀。单个样本配制量参见表4。

表4 Adapter的连接反应体系

所述PE Index Adapter是SEQ ID NO:1所示的单链DNA与SEQ ID NO:2所示的单链DNA的退火产物。

Adapter的连接反应:向1.5mL的离心管中分装好32μL Mix,根据建库任务单向相应管中加入DNA。将样本置于Thermo mixer中20℃温浴15分钟。使用1.8×Ampure磁珠回收纯化反应体系中的DNA,溶于30μl EB中。1.6PCR反应

配制PCR反应体系:从-20℃保存的试剂盒中取出所需试剂,将其置于冰上化冻并充分混匀。在0.2mL的PCR管中配制PCR反应体系,单个样本配制量参见表5。

表5 PCR反应体系

Ann公共引物:

5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'

Index-41引物(对于DP13AN00374):

5'-CAAGCAGAAGACGGCATACGAGATCGTGATGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'

Index-42引物(对于DP13AN00375):

5'-CAAGCAGAAGACGGCATACGAGATGTCAGTCGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'

PCR反应:设置PCR程序,使用前需要与任务单再次核对。PCR反应的 程序如下,反应结束后,及时将样品取出放入4℃冰箱保存并按要求退出程序或关闭仪器。

1.7PCR产物的回收纯化

0.9×Ampure磁珠回收纯化反应体系中的PCR产物,溶于30μL EB中。

1.8文库定量

对文库进行2100Bioanalyzer(Agilent)/LabChip GX(Caliper)及QPCR检测,质检合格。

1.9构建好的文库用Illumina HiSeqTM2500进行PE100测序。

1.10最终获得的生物信息学数据如下表所示:

Rawdata:上机测序产出的总数据量;

Q20和Q30:基因高通量测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。Q20值是指的测序过程碱基识别(Base Calling)过程中,对所识别的碱基给出的错误概率是1%,即错误率1%,或者正确率是99%;Q30值是指的测序过程碱基识别(Base Calling)过程中,对所识别的碱基给出的错误概率是0.1%,即错误率0.1%,或者正确率是99.9%;

比对率:下机测序数据经低质量过滤后比对到参考基因组上的百分比;

靶向捕获效率:比对到目标区域的数据量除以比对到参考基因组的数据量*100%,或者描述为比对到目标区域的数据量占比对到参考基因组数据量的百分比。

实施例2

选取一份采用磁珠法从2mL血浆中提取的游离DNA样本(DP13AN00381),定量并分别取10ng游离DNA(分别命名为DP13AN00381-1、DP13AN00381-2、DP13AN00381-3)建库。

对于DP13AN00381-3,像上述实施例1那样进行操作,不同的是:步骤1.6中使用了下述Index-45来代替Index-41或Index-42。

Index-45:

5'-CAAGCAGAAGACGGCATACGAGATCAGTCGTAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'

对比例1

对于上述实施例2中获得的DP13AN00381-1,像上述实施例1那样进行操作,不同的是:

在步骤1.6中,先使用由PAJ413、PAJ414和PAJ415组成的特异引物池进行第一轮PCR,磁珠纯化后,再使用由PAJ416、PAJ417和PAJ418组成的特异引物池进行第二轮PCR。

第一轮PCR特异引物序列

第一轮PCR反应体系及条件:

PCR反应的程序如下,反应结束后,及时将样品取出放入4℃冰箱保存并按要求退出程序或关闭仪器。

0.9×Ampure磁珠回收纯化反应体系中的PCR产物,溶于20μL EB中。第二轮PCR反应体系及条件:

Ann公共引物:

5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'

Index-43:

5'-CAAGCAGAAGACGGCATACGAGATAGCTGCTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'

第二轮PCR反应程序如下:

对比例2

对于上述实施例2中获得的DP13AN00381-3,像上述对比例1那样进行操作,不同的是:

使用由PAJ408、PAJ410和PAJ412组成的特异引物池代替由PAJ416、PAJ417和PAJ418组成的特异引物池,且使用下述Index-44代替Index-43来进行第二轮PCR。

Index-44:

5'-CAAGCAGAAGACGGCATACGAGATCTGTCAGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'

对于实施例2及对比例1~2,最终获得的生物信息学数据如下表所示。可知:本发明的方法能够有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费。

还需要说明的是,在可实施且不明显违背本发明的主旨的前提下,在本说明书中作为某一技术方案的构成部分所描述的任一技术特征或技术特征的组合同样也可以适用于其它技术方案;并且,在可实施且不明显违背本发明的主旨的前提下,作为不同技术方案的构成部分所描述的技术特征之间也可以以任意方式进行组合,来构成其它技术方案。本发明也包含在上述情况下通过组合而得到的技术方案,并且这些技术方案相当于记载在本说明书中。

上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域技术人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

工业实用性

根据本发明,提供一种能有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费的DNA低频突变检测方法、用于DNA低频突变检测的二代测序DNA文库构建方法及试剂盒。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1