一种适用于高通量全基因组测序的多样品混合文库的构建方法

文档序号：9448136阅读：725来源：国知局

一种适用于高通量全基因组测序的多样品混合文库的构建方法
【技术领域】
[0001] 本发明涉及生物信息学领域，具体地说，涉及一种适用于高通量测序的多样品混合测序文库的构建方法。
【背景技术】
[0002] 二代测序中，通常所用的Illumina、NEB或Vazyme试剂盒建库流程成熟稳定，样品打断完成后，后续进行的DNA链末端修复、3'端加碱基A步骤均不需要纯化，即可进行下一步反应，因此建库过程简便快捷，而且建库成功率高；但是针对多个样品建库，按照常规的试剂盒建库，则操作繁琐，尤其是后期的文库片段选择，需要将单个样品分别进行电泳切胶筛选片段或者利用磁珠筛选片段，导致建库成本昂贵，需要消耗大量的时间及建库费用。另外现有技术的高通量简化基因组测序文库构建方法主要针对没有参考基因组的样品，通过酶切预测进行酶切打断，构建文库，随机性不够好，再通过去除重复序列和其他冗余序列，将剩下的数据进行分析，得到相关关联区域，准确性不够高。

【发明内容】

[0003] 本发明的目的是提供一种适用于高通量全基因组测序的多样品混合测序文库的构建方法，以弥补现有技术中构建该类文库耗时较长、操作繁琐的不足。
[0004] 本发明提供的适用于高通量全基因组测序的多样品混合测序文库的构建方法，包括以下步骤：
[0005] (1)不同样品的基因组DNA打断，获得集中带分布在500bp的DNA片段；
[0006] (2)同时对打断后的样品DNA进行5'磷酸化平末端修复和3'末端添加碱基A，获得具有5'磷酸化和3'粘性末端A的DNA片段；
[0007] (3)分别将不同样品的具有5'磷酸化和3'粘性末端A的DNA片段与含有可以区分样品的唯一条形码序列的接头相连，获得可以区分样品来源的连接产物；
[0008] (4)对含有不同条形码的连接产物分别进行PCR扩增，获得含有不同条形码序列的扩增产物，纯化，定量，混样；混合后的PCR产物进行琼脂糖凝胶分离纯化，纯化产物构成适于高通量全基因组测序的多个样本混合测序文库。
[0009] 本发明方法中，步骤（1)所述的基因组DNA浓度为20~IOOng/μ L。所述基因组 DNA是经过琼脂糖凝胶电泳检测和紫外分光光度计法检测的。
[0010] 其中，步骤（1)的样品基因组DNA打断后还包括磁珠纯化步骤。
[0011] 本发明方法中，步骤（2)的反应体系为：
[0012]
[0013] 其中，步骤⑵的反应条件为：20°C 30min，65°C 30min。
[0014] 本发明方法中，步骤（3)接头的序列含有8碱基条形码序列的正链和8碱基条形码序列的负链。
[0015] 步骤（3)所述接头，其序列为：
[0016] 正链 5'-3'：
[0017] AATGATACGGCGACCACCGAGATCTACACXXXXXXXXTCTTTCCCTACACGACGCTCTTCCGATCT
[0018] 负链 5'-3'：
[0019] CAAGCAGAAGACGGCATACGAGATYYYYYYYYGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT ；
[0020] 其中：正链中的XXXXXXXX代表正链条形码序列，负链中的YYYYYYYY代表负链条形码序列。
[0021] 上述正、负链的条形码序列是A、T、C、G四种碱基的随机组合，可以根据本领域技术人员的实际需要进行设计；正、负链的条形码序列需同时使用来区分样品。
[0022] 步骤（4)中，PCR扩增所用的引物序列为：
[0023] P1:5 ' -3 ' ：AATGATACGGCGACCGAGATCTACAC
[0024] P2:5 ' -3 ' ：CAAGCAGAAGACGGCATACGAGAT 〇
[0025] 本发明方法中，步骤（4)的 PCR 反应程序为：95-98°C 3min ;95-98°C 10sec，65°C 30sec，72°C 30-40sec，共 10 个循环；72°C 5min〇
[0026] 步骤（4)混合后的PCR产物进行琼脂糖凝胶分离纯化是切取650bp上下边缘的片段进行纯化。
[0027] 本发明提供了上述构建方法在多样品基因组关联分析中的应用。
[0028] 本发明方法的步骤（4)中，纯化后扩增产物的定量检测方法可以是紫外分光光度计法、核酸荧光定量法、琼脂糖凝胶电泳检测。
[0029] 本发明方法是在Vazyme试剂盒建库方法上的改进，针对批量样品进行建库的方法，样品打断后进行磁珠纯化，之后DNA末端修复、3'端加碱基A步骤均于96孔板上操作，大大提高通量及效率，在连接接头时，同时加上可以识别不同样品的双端Index，PCR进行富集，然后将不同PCR扩增后的文库进行混合，最后通过电泳切胶进行文库片段选择。该方法与传统方法相比，96孔板批量操作可以大大提高通量，最终多个样品混样后成为一个文库，在后续的切胶选择片段步骤上节约大量试剂成本、人力成本及时间。该方法特别适用于基因组小的生物基因组重测序及测序深度低的基因组重测序。
[0030] 本发明的技术方案能够带来以下有益效果：
[0031] (1)样品起始量要求降低。在现有技术中，常规单个文库构建需要至少5 yg样品，因此对样品的需求量较高，导致部分稀有样品因为总量较少达不到建库标准，本发明建库流程中纯化步骤的减少，可以将起始量由原来的5 μ g降低至2. 5 μ g，此水平的DNA起始量，既降低了对样品的要求，同时也满足对后续数据的产出和分析，而起始量的降低同时使建库试剂成本降低；
[0032] (2)针对有参考基因组序列的样品，进行机械随机打断，构建文库，最终文库数据覆盖全基因组，随机性较好；将测序所得全部数据通过与参考基因组进行比对分析，因此对结果分析的SNP位点、Indel位点准确性更高；
[0033] (3)在混样之前，每个样品先进行PCR扩增，即得到PCR富集产物，再进行定量和混样，如果先进行混样，首先会由于不同样品的含量不同而导致混样不匀，而这种样品间的差异会被混样后的PCR过程进一步放大，因此对后期不同样品数据量的产出影响较大，而本发明先对每个样品进行PCR扩增，然后再进行混样，此操作会避免混样误差在PCR扩增后而被进一步放大，使样品的均一性较好；
[0034] (4)PCR扩增具有偏好性，在PCR扩增过程中，引物可能会偏向于结合基因组的某段区域，大量扩增此段区域，因此获得的产物会出现对基因组的覆盖不均匀，进而使测序数据出现冗余度高，所以，在实验过程中，为了避免后期数据冗余度过高而导致的对基因组的覆盖度降低，本发明将PCR扩增的循环数设计低于10个循环，这样，可以有效降低PCR扩增带来的偏好性，保证了数据分析的有效性；
[0035] (5)常规建库流程中单个样品需要分别切胶筛选片段，每一个样品从点样、电泳跑胶、染胶、切胶到纯化耗费时间长，针对多样品更是费时费力，而本设计方案将样品进行混合后进行切胶，例如，100个样品的切胶时间，完全可以利用本发明将所需时间降至1个样品的时间，因此大大降低了单个样品电泳切胶的时间与成本。
[0036] 针对100个样品的文库构建，按照常规方法建库，建库周期长达10个工作日，而利用本发明方法可将100个样品的建库周期缩短至4个工作日，大大节省了建库时间。另一方面，针对基因组小的生物基因组重测序及测序深度低的基因组重测序，根据现有常规技术单独构建文库，不仅对基因组DNA起始量要求比较高，而且建库试剂成本较高，利用本发明方法，降低了建库的DNA起始量，同时通过降低试剂使用量而使建库成本降低。
【附图说明】
[0037] 图1为本发明实施例1测序后数据分析插入片段的分布图。
[0038] 图2为本发明实施例2测序后数据分析插入片段的分布图。
[0039] 图3为本发明实施例3测序后数据分析插入片段的分布图。
[0040] 图4为本发明高通量测序的多样品混合测序文库构建的流程图。
【具体实施方式】
[0041] 以下实施例用

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑洪坤;刘慧;吕艳艳;
技术所有人：北京百迈客生物科技有限公司;
我是此专利的发明人

上一篇：一种针对特定大小rna片段的高通量测序文库构建方法
上一篇：一种用于单晶炉的两区加热器的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。