平末端接头、试剂盒及测序文库构建方法

文档序号:37428234发布日期:2024-03-25 19:18阅读:9来源:国知局
平末端接头、试剂盒及测序文库构建方法

本发明属于测序文库构建,具体涉及一种平末端接头、试剂盒及测序文库构建方法。


背景技术:

1、随着测序技术的高速发展,拥有高通量的新一代测序技术为解析生物基因组的结构和功能提供了可行性,进而推动了生物医学研究、生物工程和生物技术等领域的发展。然而,无论采用何种平台的测序方式,均需在上机测序前进行一系列处理,将其转换为符合测序平台要求的标准样本,这个过程被称为文库构建。在文库构建过程中,各测序平台均需将已知的短核酸序列连接于未知的待测序片段的两端。由于只有双端都连接上接头的目的片段才能最终完成测序过程,因此接头的连接对文库构建至关重要。

2、目前,因为不同测序平台最后所需的上机文库类型不同(双链或单链环状,哑铃环状dna等),所以各平台测序接头的序列及结构也不相同。根据接头的末端结构可将接头分为平末端及3′端t突出两种类型。其中,平末端接头连接效率较好,但由于平末端接头易自连接形成接头二聚体,需添加额外的磁珠筛选步骤,以除去接头二聚体;另外,为避免形成靶标多聚体(靶标之间的连接)往往需要去磷酸化酶提前处理靶标后再进行接头连接或采用高浓度接头进行连接。多余的步骤不仅仅增加了实验的成本及操作难度,同时在多步操作过程中也提升了样本损失的风险。平末端无法避免的自连接这一问题限制了其在测序建库中的广泛应用,目前仅有三代pacbio平台在对长片段(>250bp)建库时才推荐使用平末端接头,而原本采用平末端接头的二代ton torrent平台也将接头优化为3′端t突出的接头。3′端t突出接头的优势时不易形成接头二聚体,但实际应用过程中其连接效率往往偏低,其中双边连接头的收率在20~60%(不同试剂盒);实际上,t接头的连接效率可能受到taqdna聚合酶对靶标片段3′端加a尾效率的影响。然而,接头的连接效率将直接影响测序文库的质量从而决定测序结果的好坏。

3、综上所述,目前构建测序文库采用的平末端及3′端t突出的两种类型的接头,并不能在保证连接效率的前提下,有效减少接头二聚体或靶标多聚物等副产物的出现。基于此,提出本发明。


技术实现思路

1、为解决平末端接头在连接过程中易自连接产生接头二聚体的问题,本发明提供了一种平末端接头、试剂盒及测序文库构建方法。本发明基于连接酶的结构特性,即连接酶对切口处3′羟基侧及5′磷酸侧的结合长度有差异性,根据结合长度差异设计了一种抑制接头自连接而不影响接头与靶标片段(待测序片段)连接的平末端接头结构。本发明通过设计平末端接头序列,使得接头无法满足连接酶对3′羟基侧的结合长度要求,从而达到抑制接头自连接的目的。由于靶标片段总是可以满足连接酶对3′羟基侧的结合长度要求,则可实现不影响靶标与接头的高效连接。而对于靶标自连的情况,可以采用去磷酸化后连的方式,或直接采用腺苷酸化的不易自连平末端接头在无atp条件下进行连接。

2、本发明具体通过以下技术方案实现:

3、本发明一方面提供一种平末端接头,所述平末端接头包括完全互补区和连续错配区,所述完全互补区的长度为4-6bp,所述连续错配区的上下两条单链的长度各为4-40nt,完全互补区的平末端侧用于连接待测序片段,所述完全互补区和连续错配区由单链形成,所述单链的5′端和3′端存在反向互补序列,所述反向互补序列配对形成完全互补区,反向互补序列之间的序列为连续错配区,连续错配区突出形成环;

4、或者,所述完全互补区和连续错配区由双链形成,双链的至少一端为完全互补区,与之紧邻的为连续错配区,所述连续错配区形成泡状结构或支架结构。

5、进一步的,所述错配区的单链长度为4-30nt,优选4-20nt,更优选4-10nt。

6、进一步的,所述平末端接头还包括拓展区,所述拓展区与连续错配区连接,所述拓展区为单链环或者不互补的多条单链。

7、进一步的,所述拓展区为长度1-80nt,优选4-60nt,更优选8-40nt。

8、进一步的,用于连接的5′端为磷酸化结构或腺苷酸二磷酸化结构。

9、进一步的,所述的平末端接头选自如下任意一组:

10、(1)seq id no:2;

11、(2)seq id no:3;

12、(3)seq id no:4;

13、(4)seq id no:5;

14、(5)seq id no:6;

15、(6)seq id no:7;

16、(7)seq id no:8;

17、(8)seq id no:9;

18、(9)seq id no:10;

19、(10)seq id no:12,seq id no:13;

20、(11)seq id no:22,seq id no:23;

21、(12)seq id no:24,seq id no:25。

22、本发明另一方面提供一种试剂盒,包含本发明所述的任意一种平末端接头。

23、本发明还提供一种测序文库构建方法,将待测序片段与本发明所述的任意一种平末端接头连接。

24、所述待测序片段为大于6bp双链,优选10-600bp,更优选20-300bp,再优选40-200bp。

25、进一步的,所述平末端接头的摩尔浓度为待测序片段的2-200倍,更优选5-50倍,再优选5-20倍。

26、进一步的,连接反应体系包括去离子水、dna连接酶、dna连接酶缓冲液、待测序片段及本发明所述的任意一种平末端接头,在16-40℃条件下反应,反应结束后灭活酶。

27、进一步的,在接头连接前进行退火处理,所述退火处理是先将接头序列在80-95℃条件下,反应1-5min,然后以0.1℃/s的梯度降温至20-28℃,保温,使接头序列充分杂交并形成稳定的连接端结构。

28、进一步的,所述dna连接酶为t4 dna连接酶或者t3 dna连接酶等其他符合条件的可连接平末端的连接酶。

29、进一步的,采用5′端为磷酸结构的接头时,反应体系中1×缓冲液包含0.5mm的atp;采用5′端为腺苷酸二磷酸结构的接头时,连接反应在不含atp的1×缓冲液进行,后续可补加atp封闭切口。

30、有益效果:

31、(1)本发明所设计的平末端接头可实现在连接反应中抑制接头二聚体生成,较t接头而言本方法可以提升连接效率。将本发明的方法应用于测序建库中,可以提升测序文库及数据质量。

32、(2)方法简单便捷、成本低。仅通过设计不易自连平末端接头的序列,无需特殊步骤或复杂处理,即可实现抑制接头自连接的发生。

33、(3)通用性和实用性强。对于各种测序平台的现有测序接头,可以通过添加或稍微改变序列以形成连接端,就可以得到本发明设计的接头序列结构,进而实现抑制接头自连接的效果。



技术特征:

1.一种平末端接头,其特征在于,所述平末端接头包括完全互补区和连续错配区,所述完全互补区的长度为4–6bp,所述连续错配区的上下两条单链的长度各为4–40nt,完全互补区的平末端侧用于连接待测序片段;所述完全互补区和连续错配区由单链形成,所述单链的5′ 端和3′ 端存在反向互补序列,所述反向互补序列配对形成完全互补区,反向互补序列之间的序列为连续错配区,连续错配区突出形成环;

2.根据权利要求1所述的平末端接头,其特征在于,用于连接的5′ 端为磷酸化结构或腺苷酸二磷酸化结构。

3.根据权利要求1所述的平末端接头,其特征在于,所述平末端接头还包括拓展区,所述拓展区与连续错配区连接,所述拓展区为单链环或者不互补的多条单链。

4.根据权利要求1所述的平末端接头,其特征在于,所述的平末端接头选自如下任意一组:

5.一种试剂盒,其特征在于,包含权利要求1-4任一项所述的平末端接头。

6.一种测序文库构建方法,其特征在于,将待测序片段与权利要求1-4任一项所述的平末端接头连接。

7.根据权利要求6所述的测序文库构建方法,其特征在于,所述平末端接头的摩尔浓度为待测序片段的摩尔浓度的2–200倍。

8.根据权利要求6所述的测序文库构建方法,其特征在于,连接反应体系包括去离子水、dna连接酶、dna连接酶缓冲液、待测序片段及权利要求1-4任一项所述的平末端接头,在16–40oc条件下反应,反应结束后灭活酶。

9. 根据权利要求6所述的测序文库构建方法,其特征在于,在接头连接前进行退火处理,所述退火处理是先将接头序列在80–95oc条件下,反应1–5 min,然后以0.1oc /s的梯度降温至20–28oc,保温,使接头序列充分杂交并形成稳定的连接端结构。

10. 根据权利要求6所述的测序文库构建方法,其特征在于,所述dna连接酶为t4 dna连接酶或者t3 dna连接酶。


技术总结
本发明属于测序文库构建技术领域。为解决平末端接头在连接过程中易自连接产生接头二聚体的问题,本发明提供一种平末端接头、试剂盒及测序文库构建方法。所述平末端接头包括完全互补区连续错配区,所述完全互补区和连续错配区由单链形成,所述单链的5′端和3′端存在反向互补序列,反向互补序列之间的序列为连续错配区,连续错配区突出形成环;或者所述完全互补区和连续错配区由双链形成,双链的至少一端为完全互补区,与之紧邻的为连续错配区,所述连续错配区形成泡状结构或支架结构。本发明提供的接头序列结构可有效抑制接头自连接,并且不影响待测序列与接头的高效连接,可广泛应用于各测序平台。

技术研发人员:梁兴国,胡坤灵,安然
受保护的技术使用者:中国海洋大学
技术研发日:
技术公布日:2024/3/24
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1