用于多重核酸测序的标签和引物的制作方法

文档序号:12346597阅读:415来源:国知局
用于多重核酸测序的标签和引物的制作方法与工艺
本发明涉及分子生物学
技术领域
,具体涉及用于多重核酸测序的标签和用于构建真菌ITS序列多重测序文库的PCR引物。
背景技术
:微生物多样性,尤其是真菌多样性和农业、医学、食品以及工业生产等诸多领域有密切联系。随着分子生物学技术的不断发展,微生物多样性研究方法也逐渐完善和成熟。在微生物进化过程中,核糖体RNA,具有一定的进化保守性,保守区序列为所有同类微生物所共有,在保守序列之间存在由于进化造成的物种之间序列差异的可变区域,因此被认为是最适合系统分类的基因之一。通过对这些序列可变区域的测定和比对,能够探究并揭示土壤中微生物物种和群落结构的多样性。随着基因测序技术的发展,高通量测序技术凭借其独特优势也被引入微生物多样性的研究技术中。高通量测序技术(High-throughputsequencing),又称“下一代”测序技术("Next-generation"sequencingtechnology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。随着高通量测序技术的不断发展,为了节约测序成本或研究需要发展出了多重测序(Multiplexedsequencing)技术,通常在构建测序文库时,借助PCR引物,用不同的标签(Index)标记不同样品后,将不同样品混合起来上机测序,测序结束后通过识别Index来区分同一条泳道(Lane)中的不同样品数据。多重测序技术极大程度的降低了测序成本,节约测序资源,并且给生物学研究提供的便利手段。例如,在进行实际的真菌多样性研究时,通常需要对数百个样品的多样性进行分析,若没有多重测序技术,科研成本和时间成本将大大增加。用于区分不同样品的标签(Index)实际上为一段核苷酸序列,一方面在实际应用中发现,测序反应对不同的Index序列具有一定的数据产出偏好性,造成检测插入片段时光强参数的波动,影响输出的数据质量和平衡性,即Index序列一定程度影响混合样品的测序数据的准确性,因此并非任何核苷酸序列都适合用作Index。鉴于目前已有的经过实际测序验证的对数据平衡性较好的Index数目并不多,因此提供更多的对数据产出平衡性影响较小的Index序列对多重核酸测序技术非常重要。另一方面,在真菌多样性研究早期常使用18SrRNA作为分类鉴定的遗传标记,随着分子生物学技术的不断发展,逐步采用ITS序列取代18SrRNA作为遗传标记。尽管目前已有多种ITS序列扩增的通用引物,但其用于不同种类的样品测序文库构建时,并不能都获得较好的扩增效果。比如用于土壤样品的测序文库构建时,由于土壤样品本身的复杂性,目前常规的ITS通用引物获得的PCR扩增产物弥散严重,扩增特异性相对较差。而扩增特异性直接影响分类鉴定的准确性,进而影响对样品中真菌多样性检测的准确性。因此,提供一组高特异性的、用于真菌多样性检测的ITS序列多重测序文库构建的PCR引物,能够有效的提高对样品中真菌多样性检测的准确性,进而对农业、医学、食品以及工业领域的相关应用提供更加科学有效的指导。再一方面,现有技术中仅有给细菌16SrRNA测序文库样品添加Index的试剂盒,Illunima公司的NexteraXTIndexKit和NexteraXTv2IndexKit;然而,目前并没有用于给真菌ITS序列多重测序文库样品添加Index的试剂盒。综上所述,提供一组测序数据平衡性相对更好的Index以及一组特异性更高的构建ITS序列多重测序文库的PCR引物以及给真菌ITS序列测序文库添加Index的试剂盒,能够使得多重核酸测序技术以及土壤真菌多样性研究工作更加高效便捷。技术实现要素:除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属
技术领域
的普通技术人员通常理解的相同意义。本发明中的术语“标签”也称为Index,具体指一段用于区分不同测序样品的核苷酸序列;术语“PCR”指聚合酶链式反应;术语“连接子”指任意一段和待测序的目的序列之间不存在超过连续5个碱基以上的特异性配对的核苷酸序列。用于区分不同样品的标签,也被称为Index,实际上为一段核苷酸序列,一方面在实际应用中发现,测序反应对不同的Index序列具有一定的数据产出偏好性,造成检测插入片段时光强参数的波动,影响输出的数据质量和平衡性,即Index序列一定程度影响混合样品的测序数据的准确性,因此并非任何核苷酸序列都适合用作Index,然而目前已有的经过实际测序验证的对数据平衡性较好的Index数目并不多。本发明同时考虑Index对PCR引物的扩增效率和数据产出的偏好性的影响,提供了一组用于标记待测序核酸样品的标签,所述的一组标签包含以下29个Index中的2个或多个:本发明还提供了上述Index用于测序文库的构建和/或用于测序的用途:将所述的Index包含在用于扩增待测序序列的PCR引物中,从而构成相对应的Index-PCR引物,通过PCR方法将上述Index引入待测序序列中;所述的Index-PCR引物用可以用作PCR的3’端引物或5’端引物,或同时用作3’端引物和5’端引物。其中,在所述的Index-PCR引物中,所述的Index通过或者不通过连接子与用于扩增待测序序列的PCR引物的5’端或3’端相连。其中,所述的待测序序列优选为真菌ITS序列。真菌ITS序列被用作真菌分类鉴定的重要遗传标记,目前常用的ITS区段为ITS1-ITS4,然而现有的用于扩增ITS1-ITS4这一区段的引物并不能对各种类型的样品进行高特异性扩增,比如复杂性相对较高的土壤样品。为解决这一技术问题,办发明还提供了一组用于构建ITS序列多重测序文库的PCR引物。所述的一组用于构建ITS序列多重测序文库的PCR引物包括正向引物组和反向引物组,所述的正向引物组和反向引物组中不能含有包含相同Index的引物。在使用时,所述的正向引物组中的任意一条引物和反向引物组中的任意一条引物两两配对组成引物对,通过PCR反应用于扩增样品中的ITS序列;获得的扩增产物的上游和下游各含有一个Index,这两个Index作为该样品的特异性标记,用于和其他待测序样品进行区分。所述的正向引物组由以下引物中的一条或多条组成:引物F1:包含本发明所述的Index1,其核苷酸序列如SEQIDNO:1所示;引物F2:包含本发明所述的Index2,其核苷酸序列如SEQIDNO:2所示;引物F3:包含本发明所述的Index3,其核苷酸序列如SEQIDNO:3所示;引物F4:包含本发明所述的Index4,其核苷酸序列如SEQIDNO:4所示;引物F5:包含本发明所述的Index5,其核苷酸序列如SEQIDNO:5所示;引物F6:包含本发明所述的Index6,其核苷酸序列如SEQIDNO:6所示;引物F7:包含本发明所述的Index7,其核苷酸序列如SEQIDNO:7所示;引物F8:包含本发明所述的Index8,其核苷酸序列如SEQIDNO:8所示;引物F9:包含本发明所述的Index9,其核苷酸序列如SEQIDNO:9所示;引物F10:包含本发明所述的Index10,其核苷酸序列如SEQIDNO:10所示;引物F11:包含本发明所述的Index11,其核苷酸序列如SEQIDNO:11所示;引物F12:包含本发明所述的Index12,其核苷酸序列如SEQIDNO:12所示;引物F13:包含本发明所述的Index13,其核苷酸序列如SEQIDNO:13所示;引物F14:包含本发明所述的Index14,其核苷酸序列如SEQIDNO:14所示;引物F15:包含本发明所述的Index15,其核苷酸序列如SEQIDNO:15所示;引物F16:包含本发明所述的Index16,其核苷酸序列如SEQIDNO:16所示;引物F17:包含本发明所述的Index17,其核苷酸序列如SEQIDNO:17所示;引物F18:包含本发明所述的Index18,其核苷酸序列如SEQIDNO:18所示;引物F19:包含本发明所述的Index19,其核苷酸序列如SEQIDNO:19所示;引物F20:包含本发明所述的Index20,其核苷酸序列如SEQIDNO:20所示;引物F21:包含本发明所述的Index21,其核苷酸序列如SEQIDNO:21所示;引物F22:包含本发明所述的Index22,其核苷酸序列如SEQIDNO:22所示;引物F23:包含本发明所述的Index23,其核苷酸序列如SEQIDNO:23所示;引物F24:包含本发明所述的Index24,其核苷酸序列如SEQIDNO:24所示;引物F25:包含本发明所述的Index25,其核苷酸序列如SEQIDNO:25所示;引物F26:包含本发明所述的Index26,其核苷酸序列如SEQIDNO:26所示;引物F27:包含本发明所述的Index27,其核苷酸序列如SEQIDNO:27所示;引物F28:包含本发明所述的Index28,其核苷酸序列如SEQIDNO:28所示;引物F29:包含本发明所述的Index29,其核苷酸序列如SEQIDNO:29所示。所述的反向引物组由以下引物中的一条或多条组成:引物R1:包含本发明所述的Index1,其核苷酸序列如SEQIDNO:30所示;引物R2:包含本发明所述的Index2,其核苷酸序列如SEQIDNO:31所示;引物R3:包含本发明所述的Index3,其核苷酸序列如SEQIDNO:32所示;引物R4:包含本发明所述的Index4,其核苷酸序列如SEQIDNO:33所示;引物R5:包含本发明所述的Index5,其核苷酸序列如SEQIDNO:34所示;引物R6:包含本发明所述的Index6,其核苷酸序列如SEQIDNO:35所示;引物R7:包含本发明所述的Index7,其核苷酸序列如SEQIDNO:36所示;引物R8:包含本发明所述的Index8,其核苷酸序列如SEQIDNO:37所示;引物R9:包含本发明所述的Index9,其核苷酸序列如SEQIDNO:38所示;引物R10:包含本发明所述的Index10,其核苷酸序列如SEQIDNO:39所示;引物R11:包含本发明所述的Index11,其核苷酸序列如SEQIDNO:40所示;引物R12:包含本发明所述的Index12,其核苷酸序列如SEQIDNO:41所示;引物R13:包含本发明所述的Index13,其核苷酸序列如SEQIDNO:42所示;引物R14:包含本发明所述的Index14,其核苷酸序列如SEQIDNO:43所示;引物R15:包含本发明所述的Index15,其核苷酸序列如SEQIDNO:44所示;引物R16:包含本发明所述的Index16,其核苷酸序列如SEQIDNO:45所示;引物R17:包含本发明所述的Index17,其核苷酸序列如SEQIDNO:46所示;引物R18:包含本发明所述的Index18,其核苷酸序列如SEQIDNO:47所示;引物R19:包含本发明所述的Index19,其核苷酸序列如SEQIDNO:48所示;引物R20:包含本发明所述的Index20,其核苷酸序列如SEQIDNO:49所示;引物R21:包含本发明所述的Index21,其核苷酸序列如SEQIDNO:50所示;引物R22:包含本发明所述的Index22,其核苷酸序列如SEQIDNO:51所示;引物R23:包含本发明所述的Index23,其核苷酸序列如SEQIDNO:52所示;引物R24:包含本发明所述的Index24,其核苷酸序列如SEQIDNO:53所示;引物R25:包含本发明所述的Index25,其核苷酸序列如SEQIDNO:54所示;引物R26:包含本发明所述的Index26,其核苷酸序列如SEQIDNO:55所示;引物R27:包含本发明所述的Index27,其核苷酸序列如SEQIDNO:56所示;引物R28:包含本发明所述的Index28,其核苷酸序列如SEQIDNO:57所示;引物R29:包含本发明所述的Index29,其核苷酸序列如SEQIDNO:58所示。所述的ITS序列指ITS1-ITS4这一区域的核酸序列。所述的样品包含但不限于以下类型:土壤样品,肠道样品,水体样品,淤泥样品,大曲样品。本发明还提供了一种ITS序列多重测序文库构建试剂盒,其特征在于,所述的试剂盒包含本发明所述的一组用于构建真菌ITS序列多重测序文库的PCR引物。上述一种ITS序列多重测序文库构建试剂盒还可以包含基因组DNA提取试剂、DNA聚合酶、ITS测序接头添加试剂。本发明还提供了上述一种ITS序列多重测序文库构建试剂盒在真菌多样性检测中的应用。与现有技术相比,本发明的有益效果为:(1)、本发明提供的Index充分考虑到索引标签之间的序列差异程度、碱基识别率以及测序反应对不同Index序列的数据产出偏好性。本发明提供的Index的序列避免了序列之间出现3或3个以上连续的相同碱基的出现,极大程度的降低了其序列合成或测序过程中可能出现的错误率;标签包含入建库或测序引物中后,尽可能地避免了出现发夹结构或与测序引物及其反向互补序列相同的现象。本发明提供的Index经过庞大数量的实际测序检验,将其包含于测序或建库引物后,混合测序反应得到的测序数据平衡性相对较好。(2)、本发明提供的用于构建真菌ITS序列多重测序文库的PCR引物用于扩增ITS序列中的ITS1-ITS4这一区段,这一区段对真菌分类鉴定的效果要明显好于18SrRNA或ITS1-ITS2区段;其中还包含有本发明提供的Index,使用上正向引物和反向引物构成的引物对通过1轮PCR反应在扩增ITS序列的同时对其引入两个Index,这两个Index作为该样品的特异性标签,用于和其他混合测序样品进行区分;由于其含有本发明提供的Index,在文库混合测序时数据产出的平衡性相对较好,进而能够更加真实可靠地反应样品中的真菌组成情况。(3)、本发明提供的用于构建真菌ITS序列多重测序文库的PCR引物比现有的常规ITS引物的特异性更高。常规用于扩增ITS1-ITS4的PCR引物在用于土壤、淤泥等复杂性较强的样品时,特异性不好,目的条带电泳弥散严重,往往可能导致测序结果不准确,无法获得可靠的分析结果,也就无法获得更加真实的样品中真菌组成情况,一定程度对食品、卫生、农业等领域的应用造成不良影响。本发明提供的用于构建真菌ITS序列多重测序文库的PCR引物不仅能够对动物肠道、水体以及大曲等复杂性相对较低的样品类型获得高特异的扩增产物;对土壤和淤泥等高复杂性的样品类型也具有较高的特异性,扩增产物特异性高、扩增条带清晰,无弥散现象,因此保障了后续测序结果的准确性,进而能够获得相对更加准确的分析结果和更加真实的真菌组成情况。附图说明图1为实验例1步骤(2)中的扩增产物的琼脂糖凝胶电泳图。图2为对比例1中的扩增产物的琼脂糖凝胶电泳图。具体实施方式以下实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。对所公开的实施例的下述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例中,而是可以应用于符合与本文所公开的原理和新颖特点相一致的更宽的范围。虽然在本发明的实施或测试中可以使用与本发明中所述相似或等价的任何方法和材料,本文在此处例举优选的方法和材料。除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属
技术领域
的普通技术人员通常理解的相同意义。本发明中的术语“ddH2O”指双蒸水。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。SoilDNAKit购自Omega公司;KOD-Plus-Neo购自TOYOBO公司;引物合成委托生工生物工程股份有限公司进行;100个不同来源的土壤样品由中科院北京基因组研究所提供。实施例1一组用于构建ITS序列多重测序文库的PCR引物由20条引物组成,其中正向引物组由以下10条引物组成:本发明所述的:引物F1,其核苷酸序列如SEQIDNO:1所示;引物F2,其核苷酸序列如SEQIDNO:2所示;引物F3,其核苷酸序列如SEQIDNO:3所示;引物F7,其核苷酸序列如SEQIDNO:7所示;引物F8,其核苷酸序列如SEQIDNO:8所示;引物F9,其核苷酸序列如SEQIDNO:9所示;引物F12,其核苷酸序列如SEQIDNO:12所示;引物F13,其核苷酸序列如SEQIDNO:13所示;引物F14,其核苷酸序列如SEQIDNO:14所示;引物F23,其核苷酸序列如SEQIDNO:23所示;其中反向引物组由以下10条引物组成:本发明所述的:引物R15,其核苷酸序列如SEQIDNO:44所示;引物R17,其核苷酸序列如SEQIDNO:46所示;引物R18,其核苷酸序列如SEQIDNO:47所示;引物R19,其核苷酸序列如SEQIDNO:48所示;引物R21,其核苷酸序列如SEQIDNO:50所示;引物R25,其核苷酸序列如SEQIDNO:54所示;引物R26,其核苷酸序列如SEQIDNO:55所示;引物R27,其核苷酸序列如SEQIDNO:56所示;引物R28,其核苷酸序列如SEQIDNO:57所示;引物R29,其核苷酸序列如SEQIDNO:58所示。实验例1真菌多样性检测应用对100个不同样品构建ITS序列多重测序文库实验样品:100个不同来源的土壤样品实验步骤:(1)、样品基因组DNA提取:用SoilDNAKit提取土壤样品中的基因组DNA,获得100个不同基因组DNA样品,提取步骤参见其产品说明书;(2)、PCR扩增ITS1-ITS4序列,同时利用PCR引物对每个文库样品添加2个Index:分别以步骤(1)得到的100个不同基因组DNA样品为模板,将本发明实施例1中提供的20条PCR引物两两配对,构成100个不同引物对,用于扩增模板中的ITS1-ITS4序列;PCR反应体系如下表所示:成分含量基因组DNA(10ng/μL)2μL引物(10μM)各0.75μLMgSO4(25mM)3μLdNTPs(2mM)5μL10×KOD-Plus-NeoBuffer5μLKOD-Plus-Neo1μLddH2O32.5μL共计50μLPCR程序如下表所示:对获得的100个不同扩增产物进行琼脂糖凝胶电泳,胶浓度0.8%,电泳结果显示采用本发明提供的引物获得的ITS1-ITS4扩增产物条带清晰,无弥散现象。由于样品数量较多,在此展示1-10号样品的电泳结果,如图1所示,目的条带清晰,无弥散现象;第11-100号样品的电泳结果和1-10号相同或相似。(3)、添加测序接头:以步骤(2)获得的扩增产物作为模板,利用以下引物对进行PCR扩增,以下引物对中含有IlluminaMiSeq测序平台的测序接头。5’-CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTG-3’5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-3’PCR反应体系如下表所示:成分含量步骤(2)的扩增产物(1ng/μL)2μL引物(10μM)各0.75μLMgSO4(25mM)3μLdNTPs(2mM)5μL10×KOD-Plus-NeoBuffer5μLKOD-Plus-Neo1μLddH2O32.5μL共计50μLPCR程序如下表所示:使用AgencourtAMPureXP磁珠纯化步骤(3)获得的100个扩增产物,纯化后的100个扩增产物混合后,即为100个不同来源的土壤样品的ITS序列多重测序文库。对比例1以下引物对为现有技术中常规使用的ITS1-ITS4序列的扩增引物:5’-TCCGTAGGTGAACCTGCGG-3’5’-TCCTCCGCTTATTGATATGC-3’利用上述引物对对本发明实验例1中使用的100个不同来源的土壤样品中的随机50个样品的ITS1-ITS4序列进行扩增:样品基因组DNA的提取方法同本发明实验例1步骤(1),PCR体系和PCR程序同本发明实验例1步骤(2)。将获得的50个不同扩增产物进行琼脂糖凝胶电泳,胶浓度和电泳条件同实验例1步骤(2)。由于样品数量较多,在此展示其中10个样品的扩增产物电泳结果,如图2所示,扩增产物目的条带不清晰,弥散严重;本对比例中其余样品的电泳结果与图2相同或相似,扩增产物目的条带不清晰,弥散严重。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1