一种双酶切简化基因组二代测序文库构建方法及配套试剂盒的制作方法

文档序号:9920006阅读:2271来源:国知局
一种双酶切简化基因组二代测序文库构建方法及配套试剂盒的制作方法
【技术领域】
[0001] 本发明属于生物技术领域,具体设及一种基于双酶切的简化基因组二代测序文库 构建方法及用于二代测序文库构建的配套试剂盒。
【背景技术】
[0002] 限制性酶切位点相关DNA(Res1:;riction-site Associated DNA,RAD)测序技术,即 RAD-seq技术是在二代测序基础上发展起来的一项基于全基因组酶切位点的简化基因组测 序技术(Baird N.J.,et al,2008)。该技术利用一种限制性内切酶对基因组进行单酶切,结 合物理方法将其打断产生一定大小的DNA片段并构建测序文库,从而可W实现对酶切位点 附近的序列进行高通量测序。由于RAD标记是全基因组范围的特异性酶切位点附近的DNA片 段,故它可W代表整个基因组的序列特征,因此通过RAD-seq能够在大多数物种种内获得成 千上万的单核巧酸多态性(Single nucleotide polymor地ism,SNP)标记及亲缘关系较近 物种种间的SNP标记。该技术不受模式生物和野生物种的限制,可W通过一次测序就可W获 得数万甚至数十万的SNP标记,大大降低了基因组标记的开发成本。目前,RAD-seq技术已成 功应用于大麦、玉米、茄子、竹子、棘鱼、果蛹及甲虫等多种动植物的SNP标记开发、高密度遗 传图谱的构建、数量性状基因定位、居群遗传学W及系统发育生物学等研究领域。但一方面 该技术流程比较复杂,如要利用Covaris超声破碎仪等比较贵重的仪器,因而它需要受过专 业培训的技术骨干人员才能掌握;另一方面该技术流程实施过程中用物理方法随机打断会 损失大量的DNA,从而导致最后上机测序产出的片度(Tag)数目不可控制。所W国内外多个 实验室对传统的RAD-seq方法进行了改进并衍生出多种简化基因组测序方法。目前,在RAD-seq 技术上发展起来的简化基因 组测序技术主要有分型测序 (Genotyping by sequencing, GBSKElshire et al.,2011)技术,双酶切RAD(Dout)Ie digest RAD,ddRAD)(F*eterson et al.,2012)测序技术W及IIB型限制性内切酶的RAD(IIB digest RAD,2b-RAD)(Wang et al. ,2012)测序技术等。运些技术都对RAD复杂的技术流程做了相应的改善,比如GBS技术的 出发点是简化建库流程,从而使文库构建实施起来更加容易,但低覆盖度测序易造成分型 错误;2b-RAD测序技术从选酶的角度较好地控制了不同个体测序片段的一致性,但序列长 度太短限制了可发现的SNP数目;而ddRAD测序技术一方面从选酶的角度控制测序片段的产 出,另一方面也简化了建库流程。ddRAD-seq技术与RAD-seq技术的区别在于,ddRAD-seq通 过一个稀有酶与一个常见酶相结合对基因组DNA进行双酶切,免去随机打断的过程,使酶切 片段具有方向性,便于进行目的片段的筛选。在第二端的酶切位点后通过PCR扩增引入 Index,从而使更多的样品能够混在一起进行测序。因此,ddRAD-seq技术是一种非常有前景 的简化基因组测序技术。
[0003] ddRAD测序文库构建的实验流程如下:
[0004] 1、提取目标物种的全基因组DNA; 2、使用两种限制性内切酶EcoRI和MspI (分别为 一种稀有碱基酶和一种常见碱基酶)对目标基因组进行酶切,将目标基因组切成长短不一 的具有粘性末端的DNA片段;3、使用Ampure XP磁珠纯化上述酶切产生的DNA片段并定量;4、 将人工合成的Oligo Pl接头正义链和反义链及Oligo P2接头正义链和反义链分别退火,审U 成双链的Pl接头和P2接头。在酶切后的基因组DNA片段两端分别连接Pl接头和P2接头;其 中,Pl接头为带有EcoRI酶切位点的粘性末端序列,且Pl接头上还具有高通量测序所需的其 他序列,比如条形码(barcode)序列W及readl测序引物序列;P2接头为带有MspI酶切位点 的粘性末端序列,且P2接头含有index测序引物序列W及read2测序引物序列。5、将来自不 同样品的上述连接片段按预先设定的体积比进行混合;6、对上述混合物使用Ampure XP磁 珠纯化,移除未连接接头及缓冲液成分;7、使用DNA片段自动回收仪器Pippin-Prep选择一 定范围长度的片段并回收,回收产物构成一个DNA混池;8、对上述加过接头的DNA混池进行 PCR扩增W富集所选的片段并连上和二代测序仪匹配的P5接头序列和P7接头序列。9、对上 述P C R产物使用A m P U r e X P磁珠纯化,移除P C R引物等成分;1 0、使用 AgilentsiOOBioanalyzer进行片段分布检查和定量;11、使用qPCR再次定量并上机测序。
[0005] ddRAD虽然在建库流程上相比RAD做了一定程度的简化,但仍然包括11步,因此实 验耗时较长。同时ddRAD通过一个稀有酶与一个常见酶相结合对基因组DNA进行双酶切,运 种组合方式是基于酶切产生片段数目的考虑,但它限制了酶的选择。另外,实验流程使用了 磁珠纯化DNAW及DNA片段自动回收仪器选择片段,磁珠纯化时需要使用的磁力架及DNA片 段自动回收仪Pippin-Pr邱都是较为贵重的试验耗材和仪器,普通的分子实验室难W配置。 此外,合成Pl接头和P2接头的寡核巧酸单链因需要使用高效液相色谱法化PLC)纯化及末端 憐酸化,仅合成Pl接头和P2接头的花费就会造成普通的实验室难W承受。进一步ddRAD技术 流程提供的48种barcode序列长度完全一致,运会造成酶切位点位置碱基严重不平衡,从而 导致该位置测序质量下降,无法根据质量值判断文库酶切是否完全W及是否出现了星号活 性。大量的时间消耗和相对高的建库费用严重制约了 ddRAD的广泛应用。因此,仍需要对现 有的ddRAD简化基因组测序文库构建方法进行改进,W克服现有方法选酶范围有限、使用仪 器复杂、流程繁琐、成本高昂W及酶切位点处碱基测序质量低的缺陷,改善测序效率并使文 库构建能在人数为5-10人资金并不充裕的中小型实验室得W顺利实施,而不需要依赖于大 型的区域仪器中屯、或测序中屯、。

【发明内容】

[0006] 本发明的主要目的在于提供一种双酶切简化基因组(Modified ddRAD,MiddRAD) 二代测序文库构建方法及配套试剂盒,W扩大简化基因组选酶范围,减少对贵重仪器的依 赖,简化建库流程,节约成本,改善测序效率,使之更容易的被科研人员掌握并能在仅具有 常规仪器的普通分子实验室中实现。与ddRAD-seq方法相比,MiddRAD-seq方法主要从W下 几个方面做了改进和优化:
[0007] (I)MiddRAD-Seq方法使用两种常见的限制性内切酶进行酶切组合,摆脱了必须依 靠一个稀有酶与一个常见酶相结合对基因组DNA进行双酶切的限制,扩大了选酶的范围;
[0008] (2)该方法将复杂的磁珠纯化优化为为简单的柱式纯化,从而摆脱了对磁力架的 依赖,将利用DNA片段自动回收仪选择片段优化为利用普通低烙点琼脂糖凝胶切胶回收选 择片段,从而摆脱了对贵重仪器Pippin-Pr邱的依赖,将使用Agilent2100 Bioanalyzer进 行片段分布检查优化为使用普通低烙点琼脂糖凝胶电泳检查,从而摆脱了对精密仪器 Agilent2100 Bioanalyzer的依赖;
[0009] (3)该方法同时减少了纯化酶切产物、连接前定量及混样后纯化连接产物的步骤, 简化了建库流程;
[0010] (4)该方法将Al接头(原流程为Pl接头)由37碱基简化为25碱基(barcode按5碱基 计算),大大降低了接头合成成本;
[0011 ] (5)该方法设计出一套新的barcode-adapter体系,含有20对长短不一的barcode, 可W整数倍(20*n)叠加使用,而不是原流程提供的48种等长的barcode,运不但增加了 barcode使用的灵活性,同时也提高了接头位置碱基测序的质量值,对于判断文库酶切是否 完全W及是否出现了星号活性提供了有力的保障。
[0012] 由于整个文库构建流程中间步骤尽可能地减少纯化步骤,酶切片段随机丢失也大 大减少,该高度简化的文库制备流程允许仅使用l(K)ng DNA即可完成文库构建。
[0013] 本发明的上述目的是通过W下技术方案加 W实现的:
[0014] -种双酶切简化基因组二代测序文库构建方法,该方法包括下述步骤:
[001引第1步、基因组DNA的提取:利用改良CTAB法提取基因组DNA,基因组DNA经过琼脂糖 凝胶电泳完整度检测及微量分光光度计纯度检测,且稀释成40~60ngAU;
[0016]第2步、基因组DNA的酶切:利用两种常见限制性内切酶对基因组DNA进行酶切消 化,得到限制性酶切片段;
[0017]第3步、使用T4DNA连接酶对限制性片段连接上DNA条形码接头Al接头和A2接头,得 到形如"Al接头-DNA插入片段-A2接头"的序列对;
[0018] 第4步、将来自不同个体的"Al接头-DNA-A2接头"的序列对按预先设定的任意体积 比进行混合;
[0019] 第5步、将混合物经琼脂糖凝胶电泳回收得到目标DNA片段;
[0020] 第6步、W回收的DNA片段作为模板进行PCR扩增W富集目标DNA片段;
[0021] 第7步、对PCR产物进行纯化;
[0022] 第8步、扩增后的产物使用低烙点琼脂糖凝胶电泳进行片段分布检查和文库评价;
[0023] 第9步、使用如bit2.0定量并使用二代测序平台上机测序。
[0024] 根据所述的方法,其中第2步所述的两种限制性内切酶为4-5碱基常见限制性内切 酶,且不含稀有碱基限制性内切酶。
[0025] 根据所述的方法,其中第3步所述的Al接头由正链和负链组成:
[00%]正链:5 ' TACACGACGCTCTTCCGATCTXXXXX3 ',
[0027]负链:5 'GWCYYYYYAGATCGGAAGAGCGTCGTGTA3 '。
[002引其中:正链中的XXXXX代表DNA条形码序列,负链中YYYYY代表与DNA条形码互补序 列,W代表碱基A或T,所述的DNA条形码由20个4-9碱基序列组成:AACAA、CCACC、TTGTT、 GGTGA、AACAGT、CCATGA、ATTGCC、TGGCTA、GAACATC、CCTAGCC、TTCGCAA、AGGTTCC、GAACATTA、 CCTAGAAT、TTCGCCTA、AGGATTCT、GAATAACAT、CCTCCTAGA、TTCTTCGCA、AGGAGGCTT。
[0029] 根据所述的方法,其中第3步所述的A2接头由正链和负链组成:
[0030] 正链:5 ' CGATAGATCGGAAGAGCCTCTTAGC3 ',
[0031] 负链:5 'GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAT3 '。
[0032] 根据所述的方法,其中第6步所述的PCR扩增中所采用的引物对由引物序列1.1和 引物序列2.1组成,其中:
[0033] 引物序列1.1为:
[0034] 5 ' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCC3 ',
[0035] 引物序列2.1为:
[0036] 5 ' CAAGCAGAAGACGGCATACGAGATNNNNNGTGACTGGAGTTCAGACGTGTGC3 ',
[0037] 其中:引物序列2.1中的NNNr^N代表index序列,用于区分不同的个体;index包括4 个序列:TTCAGT、GGAGTA、AAGCAC、CCTTCA。
[0038] 根据所述的方法,其中第7步所述的纯化方法为过柱纯化。
[0039] 根据所述的方法,其中第9步所述的二代测序平台为Illumina Hiseq2000、 化3692500、化3694000或化369。
[0040] 本发明的一种双酶切简化基因组二代测序文库构建方法,更具体地是包括下述步 骤:
[0041 ] 第1步、基因组DNA提取:
[0042] 采用改良CTAB法分别提取两种竹子的幼嫩叶
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1