一种高通量简化基因组测序文库的构建方法

文档序号:8376062阅读:820来源:国知局
一种高通量简化基因组测序文库的构建方法
【技术领域】
[0001] 本发明涉及生物技术领域,具体地说,涉及一种高通量简化基因组测序文库的构 建方法。
【背景技术】
[0002] 随着二代测序技术,特别是Illumina测序平台的发展和不断升级,群体遗传学 研宄发生了革命性的变化,利用二代测序可以获得数十万甚至是数百万的SNPs信息, 越来越多重要经济动物和经济作物定位到与重要经济性状紧密关联的候选区域。当 前,可用于群体遗传学研宄的二代测序文库构建方法主要有全基因重测序(WGR,Whole genome resequencing) > RAD-Seq (Restriction-site-association DNA sequencing)、 GBS(Genotyping-by-Sequencing)等,然而,这些方法各自存在着不同的问题,例如,WGR需 要有较高质量的参考基因组序列且建库成本高;RAD-seq虽然可用于没有参考基因组的物 种,但基因组DNA用量大、流程复杂且测序质量差,有将近一半的原始数据会因为测序错误 而被丢弃;GBS虽然步骤相对简单,但只能收集短的酶切片段且酶切片段偏少。

【发明内容】

[0003] 本发明的目的是提供一种高通量简化基因组测序文库构建方法。
[0004] 本发明提供的一种高通量简化基因组测序文库的构建方法,包括以下步骤:
[0005] (1)用限制性内切酶分别对不同样品的基因组DNA进行酶切,获得5'末端具有磷 酸化修饰的平末端DNA片段;
[0006] ⑵分别对不同样品的5'磷酸化平末端DNA片段的3'末端添加碱基A,获得具有 粘性末端A的DNA片段;
[0007] (3)分别将不同样品的具有5'磷酸化和3'粘性末端A的DNA片段与含有可以区 分样品的唯一条形码序列的接头相连,获得可以区分样品来源的连接产物;
[0008] (4)含有不同条形码的连接产物进行PCR扩增,获得含有不同条形码序列的扩增 产物,纯化,定量,根据实际需要将其混合;进行琼脂糖凝胶分离纯化,获得特定长度的片 段;
[0009] (5)对特定长度片段进行低循环PCR扩增,获得接头和接头二聚体比例大幅减少 的目的片段扩增产物;进行琼脂糖凝胶分离纯化,纯化产物构成高通量简化基因组测序文 库。本发明构建方法流程图见图11。
[0010] 本发明方法中,步骤(1)所述的基因组DNA浓度为20~100ng/ y L。所述基因组 DNA是经过琼脂糖凝胶电泳检测和紫外分光光度计法检测后再进行稀释的。
[0011] 所述限制性内切酶是一种或多种平末端限制性内切酶,其酶切产生的限制性片段 是具有5'末端磷酸化修饰的平末端DNA片段。
[0012] 本发明的高通量简化基因组测序文库的构建方法中,步骤(3)接头的序列含有8 碱基条形码序列的正链和8碱基条形码序列的负链。
[0013] 所述接头的序列为:
[0014]正链:
[0015] AATGATACGGCGACCACCGAGATCTACACXXXXXXXXACACTCTTTCCCTACACGACGCTCTTCCGAT CT;
[0016]负链:
[0017] P-GATCGGAAGAGCACACGTCTGAACTCCAGTCACYYYYYYYYATCTCGTATGCCGTCTTCTGCTTG;
[0018] 其中:正链中的XXXXXXXX代表正链条形码序列,负链中的YYYYYYYY代表负链条形 码序列。
[0019] 上述正、负链的条形码序列是A、T、C、G四种碱基的随机组合,可以根据本领域技 术人员的实际需要进行设计;正、负链的条形码序列需同时使用来区分样品,即区分样品的 识别序列为:YYYYYYYYXXXXXXXX。本申请实施例中所用的正、负链条形码序列见下表1,在 具体使用过程中,依据16个碱基中有3个碱基测序错误仍能正确区分样品的原则进行两两 随机组合。
[0020]表1
[0021]
【主权项】
1. 一种高通量简化基因组测序文库的构建方法,包括以下步骤: (1) 用限制性内切酶分别对不同样品的基因组DNA进行酶切,获得5'末端具有磷酸化 修饰的平末端DNA片段; (2) 分别对不同样品的5'磷酸化平末端DNA片段的3'末端添加碱基A,获得具有粘性 末端A的DNA片段; (3) 分别将不同样品的具有5'磷酸化和3'粘性末端A的DNA片段与含有可以区分样 品的唯一条形码序列的接头相连,获得可以区分样品来源的连接产物; (4) 含有不同条形码的连接产物进行PCR扩增,获得含有不同条形码序列的扩增产物, 纯化,定量,根据实际需要将其混合;进行琼脂糖凝胶分离纯化,获得特定长度的片段; (5) 对特定长度片段进行低循环PCR扩增,获得接头和接头二聚体比例大幅减少的目 的片段扩增产物;进行琼脂糖凝胶分离纯化,纯化产物构成高通量简化基因组测序文库。
2. 根据权利要求1所述的构建方法,其特征在于,步骤(1)所述的基因组DNA浓度为 20 ~lOOng/yL。
3. 根据权利要求1所述的构建方法,其特征在于,所述限制性内切酶是一种或多种平 末端限制性内切酶,其酶切产生的限制性片段是具有5'末端磷酸化修饰的平末端DNA片 段。
4. 根据权利要求1所述的构建方法,其特征在于,步骤(3)接头的序列含有8碱基条形 码序列的正链和8碱基条形码序列的负链。
5. 根据权利要求4所述的构建方法,其特征在于,所述接头的序列为: 正链: AATGATACGGCGACCACCGAGATCTACACXXXXXXXXAC ACTCTTTCCCTACACGACGCTCTTCCGATCT; 负链: P-GATCGGAAGAGCACACGTCTGAACTCCAGTCACYYYY YYYYATCTCGTATGCCGTCTTCTGCTTG; 其中:正链中的XXXXXXXX代表正链条形码序列,负链中的YYYYYYYY代表负链条形码序 列。
6. 根据权利要求5所述的构建方法,其特征在于,正链条形码序列XXXXXXXX和负链条 形码序列YYYYYYYY选择以下对应的任意一个条形码:
7. 根据权利要求1所述的构建方法,其特征在于,步骤⑷和步骤(5)中,PCR扩增所 用的引物序列为: 引物序列PI:CAAGCAGAAGACGGCATACG引物序列P2 :AATGATACGGCGACCACCGA。
8. 根据权利要求1所述的构建方法,其特征在于,纯化后扩增产物的定量检测方法可 以是紫外分光光度计法、核酸荧光定量法、琼脂糖凝胶电泳检测。
9. 根据权利要求1所述的构建方法,其特征在于,减少接头和接头二聚体比例的方法 是磁珠法纯化PCR扩增产物和对低循环PCR扩增产物进行琼脂糖凝胶分离纯化。
10. 根据权利要求1或9所述的,其特征在于,所述的低循环PCR扩增反应所用的循环 数不超过8个。
【专利摘要】本发明提供了一种高通量简化基因组测序文库的构建方法,用限制性内切酶对不同样品的基因组DNA酶切,获得5’末端具有磷酸化修饰的平末端DNA片段;3’末端添加碱基A,将不同样品的具有5’磷酸化和3’粘性末端A的DNA片段与含有不同条形码序列的接头相连,连接产物PCR,扩增产物纯化、混合,再进行低循环PCR扩增,获得接头和接头二聚体比例大幅减少的目的片段扩增产物;再分离纯化,纯化产物构成高通量简化基因组测序文库。该方法的优点在于通量高、成本低,产生的文库测序质量高,在实现高通量SNP检测及标记开发、遗传图谱绘制、功能基因定位等研究中具有非常广阔的应用前景。
【IPC分类】C12N15-10, C40B50-06, C12Q1-68
【公开号】CN104694635
【申请号】CN201510077218
【发明人】郑洪坤, 刘慧
【申请人】北京百迈客生物科技有限公司
【公开日】2015年6月10日
【申请日】2015年2月12日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1