一种基于illumina测序平台的大片段DNA文库的构建方法

文档序号:484410阅读:4086来源:国知局
一种基于illumina测序平台的大片段DNA文库的构建方法
【专利摘要】本发明涉及高通量测序【技术领域】,公开了一种基于illumina测序平台的大片段DNA文库的构建方法,包含以下步骤:(1)将基因组DNA随机打断;可交换先后顺序的(2)和(3):(2)末端补平,两端加生物素标记的环化接头;(3)分离DNA片段;(4)环化,并除去未环化的DNA片段;(5)随机打断环化的DNA;(6)分离带有生物素标记的DNA片段;(7)将带有生物素标记的DNA片段进行末端补平;(8)末端加A碱基;(9)连上测序接头;(10)PCR扩增富集,形成测序文库。本发明采用Cre重组酶系统环化DNA片段,环化时间只需1小时,大大缩短了文库的构建时间,成功构建了大片段DNA文库,使得测序中基因组的拼接达到精细图或完成图的标准。
【专利说明】-种基于i I lumina测序平台的大片段DNA文库的构建方法

【技术领域】
[0001] 本发明涉及高通量测序【技术领域】,特别涉及一种基于高通量测序平台的大片段 DNA文库的构建方法。

【背景技术】
[0002] 高通量测序(High-Throughput Sequencing)又名下一代测序(Next Generation Sequencing,NGS),是相对于传统的桑格测序(Sanger Sequencing)而言的。目前高通量测 序主要有三大平台:Roche的454测序仪,Illumina公司的Hiseq/Miseq测序仪和ABI的 SOLiD测序仪,应用最广泛的是illumina测序平台。虽然高通量测序的数据量大,单位数据 量的成本低,但其读长与桑格测序相比短。Illumina目前提供的Miseq和Hiseq最长读长分 别是2x300bp和2xl50bp。短读长使得从头测序(De Novo Sequencing)的组装变得困难, 特别是对于含有大量重复序列的复杂基因组。通过构建具有较大跨度的双末端配对文库和 利用illumina平台的双端测序特点可以得到较大跨度片段两端的部分序列。因为较大跨 度片段两端的序列及其间距已知,所以可将短片段文库拼接的Contigs组装成Scaffolds。 为了将不同距离的contigs组装起来,得到更完整的组装信息,需要构建具有不同跨度的 大片段文库(Mate Pair Library)。
[0003] Illumina 公司提供 Mate Pair Library V2 Kit 和 Nextera Mate Pair Library Kit两种大片段文库构建试剂盒,适用片段大小范围分别是2-10K和12K以下。复杂基 因组的从头测序有时需要更大跨度的文库,如20K,40K。Lucigen公司提供NxSeq TM40 kb Mate-Pair Cloning Kit,构建40kb插入片段的fosmid文库。另外,大片段文库的测序对 于发现染色体结构变异,如插入,缺失,倒位也很重要。
[0004] Mate Pair Library V2 Kit,先将基因组DNA机械打断到合适的大小,通过补平在 大片段DNA末端加上生物素标记的dNTP,其次采用平末端自身连接环化,除去未环化的DNA 片段,然后将环状DNA打断后分离出含有生物素标记的DNA片段,最后在这些片段两端加上 illumina的测序接头。但Mate Pair Library V2 Kit对起始基因组DNA的质量要求很高, DNA少量的降解,损伤都会影响生物素标记的dNTP特异性的加到DNA片段的末端,从而导致 后面文库的失败。该试剂盒所建文库,illumina推荐的测序长度只有2x36bp,如果测序太 长,一端的读长(read)可能会跨过环化点。
[0005] Nextera Mate Pair Library Kit,采用转座酶将其含有生物素标记的识别序列随 机插入基因组DNA中,使DNA片段打断至合适大小,补平后同样采用平末端自身环化,环化 后的步骤与 Mate Pair Library V2 Kit 类似。但 Nextera Mate Pair Library Kit 中米 用转座酶打断基因组DNA,其打断大小不好控制,且对一些纯度不高的基因组DNA打断效果 很差。其平末端环化时间较长,需要过夜环化。
[0006] NxSeq?40 kb Mate-Pair Cloning Kit 通过构建40K 的 fosmid文库,再米用 4bp 的 限制性内切酶切割插入片段后环化,最后测序得到其末端序列。但NXSeqTM40 kb Mate-Pair Cloning Kit需要构建fosmid文库,不仅成本高,周期长,且得到的克隆数有限,不利于大 规模文库的构建和测序。


【发明内容】

[0007] 本发明的一个目的在于提供一种大片段DNA文库的构建方法,能够有效增加 scaffold N50的长度,使得基因组的拼接达到精细图或者完成图的标准,且大大缩短了文 库的构建时间、提1? 了文库的成功率。
[0008] 本发明的另一个目的在于提供根据上述构建方法制备得到的一种大片段DNA文 库。
[0009] 为解决上述技术问题,本发明的实施方式提供了一种基于illumina测序平台的 大片段DNA文库的构建方法,包含以下步骤:
[0010] (1)将样本基因组DNA随机打断至3?25Kb的DNA片段;
[0011] 可交换先后顺序的(2)和(3):
[0012] (2)将打断的DNA片段进行末端补平,在补平的DNA片段两端加上生物素标记的环 化接头;
[0013] (3)分离3?25kb的DNA片段;
[0014] (4)将分离的DNA片段进行环化,得到环化的DNA,并除去未环化的DNA片段;
[0015] (5)随机打断环化的DNA至200?700bp左右的DNA片段;
[0016] (6)从步骤(5)得到的DNA片段中分离带有生物素标记的DNA片段;
[0017] (7)将带有生物素标记的DNA片段进行末端补平;
[0018] (8)对末端补平后的带生物素标记的DNA片段末端加 A碱基;
[0019] (9)在步骤⑶得到的DNA片段两侧连上illumina测序接头;
[0020] (10)将步骤(9)得到的DNA片段进行PCR扩增富集,形成测序文库。
[0021] 优选地,本发明的步骤(1)中,将样本基因组DNA打断至10?20kb的DNA片段, 步骤⑶中分离10?20kb的DNA片段。
[0022] 本发明的步骤(2)中,生物素标记的环化接头为生物素标记的LoxP序列接头。
[0023] 本发明的步骤(3)中,所采用的分离方法为凝胶电泳分离。
[0024] 本发明的步骤(4)中,使用Cre重组酶使分离的DNA片段进行环化。
[0025] 本发明的步骤⑷中,使用不降解质粒的ATP依赖性DNA酶和核酸外切酶I除去 未环化的DNA片段。
[0026] 本发明的步骤(5)中,优选将环化的DNA随机打断至400bp的片段。
[0027] 本发明的步骤(6)中,使用链霉亲和素偶联的磁珠分离带有生物素标记的DNA片 段。
[0028] 上述大片段DNA文库的构建方法的流程可参考附图4。
[0029] 在本发明的具体实施过程中:
[0030] 关于步骤(1),将样本基因组DNA随机打断至3?25Kb的DNA片段,优选地可以 打断至10?20Kb的DNA片段。本发明的方法可以实现从3k到20k不等的DNA片段文库 的构建。所构建文库的大小,主要取决于所测序物种的基因组大小和复杂度等。现有技术 中的illumina测序只能实现10kb以下文库的测序,本发明的文库构建方法可实现10kb? 20kb文库的illumina测序。
[0031] 本发明中的样本基因组DNA可以是任何物种的基因组DNA,例如:大菱鲆、蝙蝠、芒 草等,在本发明所列举的具体实施方案中,选用的是大菱鲆基因组DNA。对基因组DNA进行 随机打断的方法可为本领域内常用的物理打断方法,例如在本发明所列举的具体实施方案 中,采用的是HydroShear大刀头打断。
[0032] 关于由于经过物理打断的DNA片段,可能形成5'或3'端突出,因此需要进行末端 补平,本发明中对打断的DNA片段进行末端补平的方式可为本领域内常规方法,例如采用 Klenow酶、T4DNA聚合酶和T4多聚核苷酸激酶以及dNTP补平末端。
[0033] 关于步骤(2)、步骤⑶和步骤(4),涉及对分离出适宜长度的被打断的DNA,进 而对其进行末端补平、加环化接头和环化的操作。其中,分离操作既可在末端补平和加环 化接头操作之前;也可在末端补平和加环化接头操作之后,均可达到相同的效果。采用 Cre-LoxP重组酶系统完成DNA片段的环化,为本发明的核心。首先在补平的DNA片段两端 加上生物素标记的LoxP序列接头,然后再使用Cre重组酶使分离的DNA片段进行环化,环 化时间只需1小时,大大缩短了文库的构建时间,提高了文库的成功率。
[0034] Cre重组酶是细菌噬菌体P1的I型拓扑异构酶,能识别并催化ΙοχΡ位点间的DNA 进行位点特异性重组。Cre酶介导的重组很快在底物与反应产物之间达到平衡。ΙοχΡ是 由两个13bp反向重复序列和中间间隔的8bp序列共同组成,8bp的间隔序列同时也确定了 LoxP的方向,环化接头具体序列如下所示。其中,单下划线部分为13bp的反向重复序列,双 下划线部分为8bp的中间间隔序列,碱基I以生物素修饰。设计接头时在ΙοχΡ位点两侧有 保护碱基,且两个接头一端设计成粘性末端,可以有效避免接头自连。只有当DNA片段的两 端分别连上Cre-LoxP adapter 1和Cre-LoxP adapter 2时,才可能发生成环的重组。
[0035] Cre-LoxP adapter 1 :
[0036] 5-phosCGATAACTTCGTATA ATGTATGC TATACGAAGTTATTACG-3
[0037] 3-CCAGCTATTGAAGCATAT TACATACG ATATGCTTCAATAATGC-5
[0038] Cre-LoxP adapter 2 :
[0039] 5-TCGTATAACTTCGTATA ATGTATGC TATACGAAGTTATGCACC-3
[0040] 3-AGCATATTGAAGCATAT TACATACG ATATGCTTCAATACGphos-5
[0041] 如附图5所示,为本发明中Cre/ΙοχΡ位点特异性重组反应的示意图。重组产物根 据ΙοχΡ位点的位置和相对方向而不同,两个反向ΙοχΡ位点间的DNA序列将被翻转,而两个 正向重复ΙοχΡ位点间的DNA将以环状形式切割。本实验中用到的Cre重组酶属于图中第 二种情况:两个正向重复ΙοχΡ位点间的DNA将以环状形式切割。目前illumina提供的环 化方法都是平末端自身环化,主要是针对l〇k以下的文库,对10k以上的文库,环化率较差。 本实验中主要是采用Cre重组酶环化,将DNA片段的环化范围可以扩大至20K。
[0042] 值得说明的是,本发明的操作流程并不局限于【具体实施方式】所展示的步骤,操作 过程中可采用其他的方式,整体作用和流程不变。将Cre-LoxP重组酶系统运用到illumina 大片段DNA文库构建中的环化步骤,都应纳入本发明的保护范围内。
[0043] 在环化反应之后,本发明使用不降解质粒的ATP依赖性DNA酶和核酸外切酶I除 去未环化的DNA片段,不降解质粒的ATP依赖性DNA酶和核酸外切酶I分别用来降解线性 的双链DNA和单链DNA,两者同时使用可以更彻底地降解未成环的DNA。
[0044] 关于步骤(5),由于环状的DNA不能直接用于测序,因此需要通过片段化恢复成线 性的DNA,同时释放出末端序列。本发明中对于环状DNA的打断也可以采用现有技术中常用 的方法,例如在本发明所列举的具体实施方案中,采用的是Covaris超声波打断。本发明优 选将环状的DNA打断至400bp片段,更适用于illumina测序。
[0045] 关于步骤(6),从步骤(5)中得到的DNA片段中分离带有生物素标记的DNA片段, 可使用链霉亲和素偶联的磁珠来实现,链霉亲和素磁珠可以快速和特异性地捕获含生物素 标记的DNA片段,不含生物素结合的DNA片段被去除。
[0046] 关于步骤(7),将被捕获到磁珠上的带有生物素标记的DNA片段进行末端补平,同 样可采用本领域内常规方法,例如可采用Klenow聚合酶、T4DNA多聚核苷酸激酶以及dNTP 补平末端,以产生平端化的DNA,便于继续进行下一步的实验操作。
[0047] 关于步骤(8)、(9)和(10),对末端补平后的带生物素标记的DNA片段,利用 Klen〇w(3' -5')聚合酶和dATP,在DNA片段的3'端加上了一个A碱基;然后再利用T4DNA 连接酶将测序接头连接到DNA片段末端,利用接头末端的T碱基突出和DNA片段末端的A 碱基突出互补配对实现连接。本发明中,可选择的接头优选为illumina测序接头,以适应 illumina测序平台的应用;最后,本发明通过特异性引物PCR扩增富集配对末端片段,形成 测序文库。
[0048] 进一步地,本发明还提供根据上述方法制得的大片段DNA文库,该大片段DNA文库 可进一步用于进行illumina平台测序。
[0049] 相对于现有技术而言,本发明通过在打断的基因组DNA两端加上含有生物素标记 的接头序列,避免采用生物素标记的dNTP可能掺入到DNA片段的中间。环化后中间会产生 一段linker序列,在测序结果中很容易区分环化位置,测序的长度也可以提高到2xl00bp。 采用Cre重组酶系统环化DNA片段,环化时间只需lh,大大缩短了文库的构建时间,环化 的片段大小范围可以1?达l〇〇kb,有效的扩大了大片段文库的构建范围,提1?了文库的成功 率。此外,本发明通过构建20kb的大片段文库,测得其两端的部分序列,能够有效的增加 scaffold N50的长度,使得基因组的拼接达到精细图或者完成图的标准。

【专利附图】

【附图说明】
[0050] 图1是实施例中大菱鲆基因组DNA打断为约20kb的电泳图:各泳道上样如下:泳 道l:Quick-LoadlkbExtendDNALadder(NEB公司,货号N3239S) ;泳道2,3,4:速度参数 为 15,循环数为 20 的打断效果;泳道 5 :Quick_Load 1 kb Extend DNA Ladder ;
[0051] 图2是实施例中大菱鲆DNA加环化接头后分离回收约20kb片段的电泳图:各泳道 上样如下:泳道1 :Quick_Load 1 kb Extend DNA Ladder ;泳道2 :加环化接头后进行电泳 分离的 DNA ;泳道 5 :Quick_Load 1 kb Extend DNA Ladder ;
[0052] 图3是实施例中大菱鲆20k大片段文库PCR富集后的电泳图:各泳道上样如下:泳 道1 :DS2000(东盛生物,货号M1101);泳道2 :PCR富集后的电泳图;泳道3 :Marker 1(东 盛生物,货号M1081);
[0053] 图4是本发明的大片段DNA文库的构建方法的流程图;
[0054] 图5是本发明中Cre/loxP位点特异性重组反应的示意图。

【具体实施方式】
[0055] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实 施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中, 为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基 于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方 案。
[0056] 实施例1大菱鲆基因组DNA 20K大片段文库构建
[0057] 1.样品DNA打断:
[0058] 先取样品DNA约lug使用HydroShear大刀头打断(速度参数设为15),0· 5%的 琼脂糖胶检测片段大小是否在20K附近。如果片段大小不合适,则调节speed code重新试 验,直到选择到合适的打断条件。大菱鲆基因组DNA使用该打断条件,DNA片段集中在20K 附近,满足实验要求,继续使用该条件打断20ug DNA样品。
[0059] 2. DNA末端补平:
[0060] 1)在PCR管中配制如下混合液:
[0061]

【权利要求】
1. 一种基于illumina测序平台的大片段DNA文库的构建方法,其特征在于,包含下述 步骤: (1) 将样本基因组DNA随机打断至3?25Kb的DNA片段; 可交换先后顺序的(2)和(3): (2) 将打断的DNA片段进行末端补平,在补平的DNA片段两端加上生物素标记的环化接 头; ⑶分离3?25kb的DNA片段; (4) 将分离的DNA片段进行环化,得到环化的DNA,并除去未环化的DNA片段; (5) 随机打断环化的DNA至200?700bp的DNA片段; (6) 从步骤(5)得到的DNA片段中分离带有生物素标记的DNA片段; (7) 将带有生物素标记的DNA片段进行末端补平; (8) 对末端补平后的带生物素标记的DNA片段末端加 A碱基; (9) 在步骤(8)得到的DNA片段两侧连上illumina测序接头; (10) 将步骤(9)得到的DNA片段进行PCR扩增富集,形成测序文库。
2. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤(1)中将样本 基因组DNA打断至10?20kb的DNA片段,步骤(3)中分离10?20kb的DNA片段。
3. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤⑵中,所述 生物素标记的环化接头为生物素标记的LoxP序列接头。
4. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤⑶中,所述 分离的方法为凝胶电泳分离。
5. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤(4)中,使用 Cre重组酶使DNA片段进行环化。
6. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤(4)中,使用 不降解质粒的ATP依赖性DNA酶和核酸外切酶I除去未环化的DNA片段。
7. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤(5)中,优选 将环化的DNA随机打断至400bp的片段。
8. 根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤(6)中,使用 链霉亲和素偶联的磁珠分离带有生物素标记的DNA片段。
9. 一种大片段DNA文库,根据权利要求1至8任一项所述的方法制得。
10. 根据权利要求9所述的大片段DNA文库,其特征在于,所述大片段DNA文库应用于 illumina平台测序。
【文档编号】C12Q1/68GK104153003SQ201410389835
【公开日】2014年11月19日 申请日期:2014年8月8日 优先权日:2014年8月8日
【发明者】王真艳, 陈昌岳, 林爱萍, 李静, 张祥林, 胡秋萍, 陶晔 申请人:上海美吉生物医药科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1