基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用与流程

文档序号:14666281发布日期:2018-06-12 19:10阅读:454来源:国知局

本发明涉及生物技术领域,尤其涉及一种基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用。



背景技术:

二代测序通过文库构建,对目标DNA模板连接上接头序列,并通过富集扩增获得更多的目标DNA模板,然后将构建好的文库在二代测序平台进行深度测序。

以上测序平台的文库构建及平台测序时都使用DNA聚合酶,为保证检测的准确性,均使用高保真DNA聚合酶,该类DNA聚合酶的保真性高于10-9,即每合成109个碱基时会随机出现1个碱基的错误。因此,该技术的测序错误约0.1%。

因此,在使用以上技术进行低频碱基变异相关产品测序时,受到测序错误的影响无法有效识别真实低频突变信息。例如,肿瘤液体活检需要检测千分之一甚至万分之一的低频突变;微生物多样性的测序分析需要对种群丰度达到几千甚至上万的样品进行种群多样性分析或功能基因的多样性进行分析,需要分辨千分之一甚至万分之一的碱基差异。在技术测序错误达到0.1%时,真实突变被淹没在测序错误的假突变中而无法识别。

为降低测序错误,Swift Biosciences公司提供了解决方案,即Accel-NGS 2S Indexed Adapters。在文库构建时,在接头的P5端标签位置添加9个碱基的随机序列做标签,对原始模板的正链和负链分别进行标记。在对二代测序结果进行分析时,可以通过以上9个碱基的序列将原始模板的正链和负链分别识别出来,将重复序列进行合并,同时彼此校验。在原始模板上由富集扩增和测序带来的错误可以检测出来并矫正,以此降低测序错误。

同时,IDT公司也提供了解决方案,即Dual Index UMI Adapters。在文库构建时,在接头的P7端标签前另外增加9个碱基的随机序列做标签,对原始模板的正链和负链分别进行标记。在对二代测序结果进行分析时,可以通过以上9个碱基的序列将原始模板的正链和负链分别识别出来,将重复序列进行合并,同时彼此校验。在原始模板上由富集扩增和测序带来的错误可以检测出来并矫正,以此降低测序错误。

以上技术通过在接头的P5或P7的标签位置添加9个碱基的随机序列来降低测序错误,但由于来自同一条双链DNA的原始模板的正链和负链带有不同的标签,且该标签组合不确定,因此,无法将来自同一条双链DNA原始模板的正链和负链一一匹配的还原。因此,无法识别双链DNA原始模板中的不对称突变。

同时,在连接带有标签的接头后的富集扩增的第一轮扩增时,由于DNA聚合酶存在10e-9的扩增错误,该错误会造成该正链/负链原始模板的扩增产物存在不对称突变,在用P5或P7的标签位置的9个碱基的随机序列来降低测序错误时,正链/负链在错误位置会有2中碱基,无法有效分辨对错。

在Illumina测序平台进行二代测序时,若同时进行多个样本,则会发生样本标签序列漂移问题,即,1号样本的样本标签错误的变成了2号或其它样本的标签,造成其他样本中错误的带有了不属于它的序列,因此,会错误的引入的突变信息。Swift Biosciences公司和IDT公司的方法为双端样本标签,在双端样本标签测序模式下,可以有效的矫正样本标签漂移,但在单端样本标签测序模式下,则无法解决该问题。



技术实现要素:

针对上述技术问题,本发明提供了一种基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用,其中,所述测序方法包括如下步骤:

S1.针对不同样本,合成4-16种含有不同固定特异序列标签的接头的正链P5和反链P7,将各种接头的P5和P7进行退火,形成4-16种Y字型接头;

S2.将模板DNA进行末端补平,并在补平后的3’端添加A碱基;

S3.将4-16种Y字型接头连接到步骤S2处理后的模板DNA的两端;

S4.回收连接上接头的模板DNA,并用带有样本标签的接头引物对回收的模板DNA进行富集扩增;

S5.回收经步骤S4富集扩增的产物;

S6.对富集扩增产物进行二代测序。

所述的测序方法,其中,所述固定特异序列标签位于P5的3’端,所述固定特异序列标签的反向互补序列位于P7的5’端。

所述的测序方法,其中,所述4-16种含有不同固定特异序列标签的接头是等分子浓度混合,其中,所述固定特异序列标签由2-10个碱基组成。

所述的测序方法,每个样本含有特定的4-16种不同固定特意序列标签,各个样本间的固定特意序列标签是不同的。

所述的测序方法,其中,P5为如SEQ ID NO.1所示的脱氧核苷酸序列,所述P7为如SEQ ID NO.2所示的脱氧核苷酸序列。

所述的测序方法,其中,所述步骤S4中带有样本标签接头引物包括正向引物和反向引物,所述正向引物为如SEQ ID NO.3所示的脱氧核苷酸序列,所述反向引物为如SEQ ID NO.4所示的脱氧核苷酸序列。

本发明还提供一种实现如上所述的测序方法的试剂盒,其包括接头、接头连接试剂、扩增连接产物的接头引物、核酸富集磁珠。

所述的试剂盒,其中,所述接头为P5序列和P7序列退火形成,所述P5为如SEQ ID NO.1所示的脱氧核苷酸序列,所述P7为如SEQ ID NO.2所示的脱氧核苷酸序列。

所述的试剂盒,其中,扩增连接产物的接头引物包括正向引物和反向引物,所述正向引物为如SEQ ID NO.3所示的脱氧核苷酸序列,所述反向引物为如SEQ ID NO.4所示的脱氧核苷酸序列。

本发明还提供如上所述的测序方法的应用,其中,所述测序方法可单独或者与探针捕获技术结合应用于基因突变检测,或者应用于微生物多样性测序、种群多样性分析或功能基因的多样性分析。

相对于现有技术,本发明实施例具有以下优点:

1、本发明可以将来自同一条双链DNA原始模板的正链和负链的检测结果进行一一匹配,由此可以有效识别双链DNA原始模板中的突变,尤其是不对称突变。

2、可以有效识别从第一次富集扩增开始引入的扩增错误。

3、在Illumina单端和双端样本标签测序模式下,通过样本独有的4-16种接头的固定特异序列,可有效解决样本标签漂移的问题。

附图说明

图1为本发明实施例中含有分子标签的接头连接到模板DNA的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了一种基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用。

其中,基于分子标签技术和二代测序法降低测序错误的测序方法的构建方法:首先,在接头P5链的3’端加上2-10碱基的固定特异序列,在接头P7链的5’端加上前者固定特异序列反向互补端序列。将每种反向互补的接头单独退火,形成带有2-10碱基固定特异序列的Y字型接头。其次,在进行文库构建时,将4-16种接头等分子量浓度混合在一起,每个样本分别带有独特的4-16种接头。最后,在二代测序结果分析时,根据独特的固定特异序列为标记,将原始模板的正链或负链的重复合并,矫正富集扩增和测序错误;将来自同一条双链DNA的正链和负链合并,矫正富集扩增和测序错误。由于每个样本分别带有独特的接头,因此,在单端样本标签的测序模式下,也可以有效矫正样本标签漂移的问题。

具体地,所述测序方法包括如下步骤:

S1.针对不同样本,合成4-16种含有不同固定特异序列标签的接头的正链P5和反链P7,将各种接头的P5和P7进行退火,形成4-16种Y字型接头。

即在接头P5链的3’端加上2-10碱基的固定特异序列标签,在接头P7链的5’端加上前者特异序列反向互补端序列。将每种反向互补的接头单独退火,形成带有2-10碱基固定特异序列的Y字型接头。

针对每个样本,合成4-16种含有不同固定特异序列标签的接头,经过后续连接形成带有4-16中不同不同固定特异序列标签的模板DNA;而不同样本采用的固定特异序列标签的接头是不同的,这样便于同时进行不同样本的测序。

其中,正链P5为如SEQ ID NO.1所示的脱氧核苷酸序列,反链P7为如SEQ ID NO.2所示的脱氧核苷酸序列,具体序列如下:

P5:ACACTCTTTCCCTACACGACGCTCTTCCGATCT[NNNNNNNNNN]-s-T;P7:P-[NNNNNNNNNN]AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC。其中,x为四种碱基A、T、C和G中的一种;P5的3’端的T带有硫代修饰;而P7的5’端进行了磷酸化修饰。

S2.将模板DNA进行末端补平,并在补平后的3’端添加A碱基;

S3.将4-16种Y字型接头连接到步骤S2处理后的模板DNA的两端;

优选地,所述4-16种含有不同固定特异序列标签的接头是等分子浓度混合。即在进行文库构建时,将4-16种接头等分子量浓度混合在一起,使每个样本分别带有独特的4-16种接头。

S4.用核酸富集磁珠回收连接上接头的模板DNA,去掉剩余未连接的接头、酶、盐离子及其它有机试剂,之后用带有样本标签的接头引物对回收的模板DNA进行富集扩增;

所述步骤S4中带有样本标签的接头引物包括正向引物和反向引物,所述正向引物为如SEQ ID NO.3所示的脱氧核苷酸序列,所述反向引物为如SEQ ID NO.4所示的脱氧核苷酸序列,具体序列如下:

正向引物:

CAAGCAGAAGACGGCATACGAGAT[NNNNNNNN]GTGACTGGAGTTCAGACGTG-s-T;

反向引物:

AATGATACGGCGACCACCGAGATCTACAC[NNNNNNNN]ACACTCTTTCCCTACACGA-s-C。

其中,N为四种碱基A、T、C和G中的一种。

并且,所述正向引物的3’端T带有硫代修饰。

其中,正向引物中的NNNNNNNN序列为样本标签序列,反向引物中的NNNNNNNN是正向引物中样本标签序列的反向互补序列。

所述反向引物的3’C端带有硫代修饰。

S5.用核酸富集磁珠回收经步骤S4富集扩增的产物,去除引物二聚体、酶、盐离子及其它有机试剂。;

本实施例中,采用核酸富集磁珠回收以上富集扩增产物,这种回收方法效率高、速度快,可去除引物二聚体、酶、盐离子和其他杂质。

S6.对富集扩增产物进行二代测序。

其中,本发明所述的二代测序法采用的测序设备包括但不限于Roche/454、Illumina测序仪(Novaseq系列、NextSeq系列、Hiseq系列、MiSeq系列、X-Ten、X-Five,以及后续同原理测序仪系列)、BGI(华大公司,BGI500系列以及后续测序仪)的测序仪、LifeTech测序仪器(Ion,Proton以及后续测序仪器系列)。

本发明还提供实现如上所述的测序方法的试剂盒,其包括接头、接头连接试剂、扩增连接产物的接头引物、核酸富集磁珠。

其中,所述接头为P5序列和P7序列退火形成,所述P5为如SEQ ID NO.1所示的脱氧核苷酸序列,所述P7为如SEQ ID NO.2所示的脱氧核苷酸序列。

扩增连接产物的接头引物包括正向引物和反向引物,所述正向引物为如SEQ ID NO.3所示的脱氧核苷酸序列,所述反向引物为如SEQ ID NO.4所示的脱氧核苷酸序列。

本发明还提供如上所述的测序方法的应用,其中,所述测序方法可单独或者与探针捕获技术结合应用于基因突变检测,或者应用于微生物多样性测序、种群多样性分析或功能基因的多样性分析。

本发明中的具体操作参考相应采用的产品说明书提供的实验方法,在此不做详述。

验证试验

本发明使用标准品NA12878和NA24875进行验证,使用KAPA Hyperplus DNA library Kit进行文库构建,并在Illumina平台进行单端样本标签的测序。

生物信息分析结果显示,本发明可以有效的将来自同一个双链DNA模板的正链和负链匹配,并矫正其扩增错误和测序错误;可以有效的识别Illumina测序平台中单端样本标签测序模式下的样本标签漂移问题。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

序列表

<110> 深圳因合生物科技有限公司

<120> 基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用

<130> HZ1810064-SZW

<141> 2018-01-24

<160> 4

<170> SIPOSequenceListing 1.0

<210> 1

<211> 44

<212> DNA

<213> 人工合成序列(Synthetic sequence)

<220>

<221> misc_feature

<222> (34)..(43)

<223> n=a,t,c or g.

<400> 1

acactctttc cctacacgac gctcttccga tctnnnnnnn nnnt 44

<210> 2

<211> 44

<212> DNA

<213> 人工合成序列(Synthetic sequence)

<220>

<221> misc_feature

<222> (1)..(10)

<223> n=a,t,c or g.

<400> 2

nnnnnnnnnn agatcggaag agcacacgtc tgaactccag tcac 44

<210> 3

<211> 53

<212> DNA

<213> 人工合成序列(Synthetic sequence)

<220>

<221> misc_feature

<222> (25)..(32)

<223> n=a,t,c or g.

<400> 3

caagcagaag acggcatacg agatnnnnnn nngtgactgg agttcagacg tgt 53

<210> 4

<211> 57

<212> DNA

<213> 人工合成序列(Synthetic sequence)

<220>

<221> misc_feature

<222> (30)..(37)

<223> n=a,t,c or g.

<400> 4

aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgac 57

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1