一种检测DNA聚合酶保真度的方法与流程

文档序号:12056543阅读:1626来源:国知局

本发明涉及一种检测DNA聚合酶保真度的方法,尤其涉及一种低成本、快速、准确、定量测定DNA聚合酶保真度的方法。



背景技术:

聚合酶链式反应(PCR)是一种用于放大扩增特定DNA片段的分子生物技术,能将微量的DNA大幅增加,从而用于DNA测序。目前PCR在疾病监测、法医物证检测、DNA合成等领域应用广泛。

但是,如果PCR的扩增产物需要准确无误,例如应用于基因克隆等,用于PCR扩增的DNA聚合酶的保真度就非常关键。DNA聚合酶的保真度往往用1000个碱基多少个错误或者每个碱基出现错误的概率来表示,另外,高保真程度的水平也可以以Taq酶来衡量,并Taq酶保真度的多少倍来表示。

如果DNA聚合酶含有3’至5’的外切酶活力的话,则可以对扩增过程中错误加入的碱基进行切除修复,并重新加入正确的碱基,因此属于高保真DNA聚合酶。而像Taq DNA聚合酶,由于不具备3’至5’的外切酶活力,因此不属于高保真DNA聚合酶,也很少被用来做基因克隆。

目前,多个生物技术公司研发了多种高保真DNA聚合酶,其中代表性的产品有Pfu(多个公司)、Phusion(NEB)、AccuPrimeTM Pfx(Life)、Q5高保真(NEB)和KOD(ToYoBo)等。不同来源的DNA聚合酶的DNA扩增保真度是有所差别的;值得注意的是,不同的生物技术公司往往都宣称自己产品的保真度最好,这给消费者带来了困惑。

目前,有多种方法可以被用来测定聚合酶的保真度。最早的方法是Thomas Kunkel等人开发的利用M13噬菌体中的lacZα基因来回补细菌,并结合蓝白斑筛选以评估DNA聚合酶的保真度(Kunkel,T.A.and Tindall,K.R.,1987,Biochemistry,27,6088–6013.)。William Thilly等人利用梯度凝胶电泳来检测含 有突变的PCR扩增产物(Ling,L.L.et al.,1991,Genome Research,1,63–69.)。后来,Wayne Barnes等人利用16个循环的PCR程序来扩增整个lacZ基因,并结合蓝白斑测试来评估PCR扩增的保真度(Kermekchiev,M.B.,Tzekov,A and Barnes,W.M.,2003,Nucl.Acids Res.31,6139–6147.),该方法和Kunkel等人开发的类似。上述方法不仅工作量大,而且精确度不高;特别是无法区分DNA的同义突变(不同的DNA序列,但是编码相同的蛋白序列)。

除了以上批量筛选的方法外,利用Sanger测序法理论上也可以用来测定PCR产物的正确率(即DNA聚合酶的保真度)。具体步骤是,克隆PCR产物,然后进行大规模DNA测序。但是,由于该方法的工作量和成本都非常的高,在现实生活中并没有见到哪家公司采用了这种方法来进行DNA聚合酶保真度的测定。

随着下一代测序技术(NGS,如454,Illumina,Ion Torrent等)的发展以及单分子测序技术(如PacBio RS)的出现,DNA测序的成本相比于Sanger测序法已经大幅度的降低。然而,上述仪器和技术的错误率较高,平台本身也会引入突变,而且像Illumina和Ion Torrent技术的读长都非常短,因此限制了上述技术在DNA聚合酶保真度测定方面的应用。

此外,除了引入错误的碱基外,DNA聚合酶的错误还实际上包括插入突变和删除突变等。



技术实现要素:

针对现有技术方案无法准确、快速、廉价地测定DNA聚合酶保真度的问题,本发明提供了一种新的检测DNA聚合酶保真度的方法。

本发明所提供的检测DNA聚合物保真度的方法,包括:

根据DNA模板设计PCR扩增引物;

利用DNA聚合物进行PCR扩增反应;

PCR产物利用NGS平台对每个DNA分子进行双向测定,

筛选正反两个方向都有效的数据,并选择在两个方向均测出相同突变的位置标记为一处突变,该突变属于DNA聚合酶扩增过程中引入的突变;如若存在只有一个方向测定出突变、而另一方向没有出现突变,或者两个方向突变不同,则表明 该处突变为测序平台引入的突变,不属于DNA聚合酶扩增过程中引入的突变;计算保真度和/或突变率,突变率=DNA聚合酶扩增过程中引入的突变/有效DNA测序量;计算保真度,保真度=1-突变率。

其中,本发明上述内容中,PCR扩增产物长度可以为0.1kb-50kb,更优选为0.5kb-40kb,更优选为1kb-20kb,更优选为2kb-15kb,如10kb、8kb、6kb、5kb、4kb、3kb等。

其中,本发明上述内容中,PCR扩增反应过程中,循环数优选为6-35次,更优选为10-30次,如15次、20次、25次等。

其中,本发明上述内容中,所述NGS平台可以是454、Illumina Hiseq、Illumina Miseq、Ion Torrent等平台中的任意一种或几种。

其中,本发明上述内容中,所述突变可以是选自碱基错误、插入突变和删除突变中的任意一种或几种。

在本发明的一种优选实施例中,所述PCR产物在测序之前进行打断、建库,打断后的DNA长度需等于或小于NGS平台的读长。

本发明上述内容中,所述碱基错误是指在该位置上错误的碱基取代了正确的碱基,所述插入突变是指在该位置上出现了多余的碱基,所述删除突变是指在该位置上缺失了本应存在的碱基。

在本发明中通过利用现有高通量测序平台的技术优势,并结合一套新的错误率计算方法,实现了DNA聚合酶保真度的准确测定。同时,该方法成本低、快速、灵敏、通用。

附图说明

图1为本发明检测DNA聚合物保真度的方法流程示意图。

具体实施方式

参照图1,本发明检测DNA聚合物保真度的方法包括如下步骤:

根据待扩增DNA的序列信息设计PCR扩增引物。

利用DNA聚合酶进行PCR扩增,纯化PCR产物,然后进行NGS测序。

PCR产物经过打断和建库等步骤后进行序列双向测定。其中打断的DNA长度应 等于或者小于测序平台的单向读长。

分析数据。筛选正反两个方向都有效的数据,然后选择在两个方向均测出相同突变的位置,并标记为DNA聚合酶扩增过程中引入的突变。若只有一个方向测定出突变,而另一方向没有出现突变(或者突变不同)的话,则表明该处突变为测序平台引入的突变,不属于DNA聚合酶扩增过程中引入的突变。

突变率计算:突变率=突变数目/有效的DNA测序量。

保真度计算:保真度=1-突变率。

本发明利用NGS平台来进行序列测定,极大地降低了测序成本,因此可在低成本条件下精确、快速测定DNA聚合酶的保真度。

下面将通过具体实施例对本发明检测DNA聚合物保真度的方法进行详细的介绍和描述,但是应当理解的是,下述实施例并不限制本发明范围。

选择pUC18质粒作为PCR扩增的载体,设计配对引物:

5’-CGCCAGGGTTTTCCCAGTCACGAC-3’;

5’-AGCGGATAACAATTTCACACAGGA-3’。

分别以Taq、Pfu、Q5聚合酶为例,PCR反应体系如下:

pUC18:100ng

10×PCR buffer:5μl(如果缓冲液为5×,则加10μl)

10mM dNTP:1μl

100mM M13F-47:0.5μl

100mM M13R-48:0.5μl

H2O:加至总体积为50μl

PCR扩增程序:

95℃,5min——(95℃,30s;60℃,30s;72℃,30s)30个循环——72℃,5min。

PCR产物经过纯化后直接Illumina建库试剂盒TruSeq DNA LT Sample Preparation Kit进行建库。然后利用Illumina HiSeq2500测序系统进行paired end 2x125 nt multiplex测序,并利用Illumina提供的data collection software 进行实时数据收集。

对原始数据fastq文件进行处理:(1)去除3’端低质量碱基;(2)去除reads 中所含有的接头序列;(3)去除含N碱基的reads;(4)去除长度小于125bp的reads及不成对的reads。

PCR的理论序列为:

cgccagggttttcccagtcacgacgttgtaaaacgacggccagtgccaagcttgcatgcctgcaggtcgactctagaggatccccgggtaccgagctcgaattcgtaatcatgtcatagctgtttcctgtgtgaaattgttatccgct

选择被正反两链测序覆盖的24位C至125位T之间的序列进行序列分析和错误率的计算。

表1,不同聚合酶错误率统计和保真度计算

以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1