一种适用于高通量全基因组测序的多样品混合文库的构建方法

文档序号:9448136阅读:725来源:国知局
一种适用于高通量全基因组测序的多样品混合文库的构建方法
【技术领域】
[0001] 本发明涉及生物信息学领域,具体地说,涉及一种适用于高通量测序的多样品混 合测序文库的构建方法。
【背景技术】
[0002] 二代测序中,通常所用的Illumina、NEB或Vazyme试剂盒建库流程成熟稳定,样品 打断完成后,后续进行的DNA链末端修复、3'端加碱基A步骤均不需要纯化,即可进行下一 步反应,因此建库过程简便快捷,而且建库成功率高;但是针对多个样品建库,按照常规的 试剂盒建库,则操作繁琐,尤其是后期的文库片段选择,需要将单个样品分别进行电泳切胶 筛选片段或者利用磁珠筛选片段,导致建库成本昂贵,需要消耗大量的时间及建库费用。另 外现有技术的高通量简化基因组测序文库构建方法主要针对没有参考基因组的样品,通过 酶切预测进行酶切打断,构建文库,随机性不够好,再通过去除重复序列和其他冗余序列, 将剩下的数据进行分析,得到相关关联区域,准确性不够高。

【发明内容】

[0003] 本发明的目的是提供一种适用于高通量全基因组测序的多样品混合测序文库的 构建方法,以弥补现有技术中构建该类文库耗时较长、操作繁琐的不足。
[0004] 本发明提供的适用于高通量全基因组测序的多样品混合测序文库的构建方法,包 括以下步骤:
[0005] (1)不同样品的基因组DNA打断,获得集中带分布在500bp的DNA片段;
[0006] (2)同时对打断后的样品DNA进行5'磷酸化平末端修复和3'末端添加碱基A,获 得具有5'磷酸化和3'粘性末端A的DNA片段;
[0007] (3)分别将不同样品的具有5'磷酸化和3'粘性末端A的DNA片段与含有可以区 分样品的唯一条形码序列的接头相连,获得可以区分样品来源的连接产物;
[0008] (4)对含有不同条形码的连接产物分别进行PCR扩增,获得含有不同条形码序列 的扩增产物,纯化,定量,混样;混合后的PCR产物进行琼脂糖凝胶分离纯化,纯化产物构成 适于高通量全基因组测序的多个样本混合测序文库。
[0009] 本发明方法中,步骤(1)所述的基因组DNA浓度为20~IOOng/μ L。所述基因组 DNA是经过琼脂糖凝胶电泳检测和紫外分光光度计法检测的。
[0010] 其中,步骤(1)的样品基因组DNA打断后还包括磁珠纯化步骤。
[0011] 本发明方法中,步骤(2)的反应体系为:
[0012]
[0013] 其中,步骤⑵的反应条件为:20°C 30min,65°C 30min。
[0014] 本发明方法中,步骤(3)接头的序列含有8碱基条形码序列的正链和8碱基条形 码序列的负链。
[0015] 步骤(3)所述接头,其序列为:
[0016] 正链 5'-3':
[0017] AATGATACGGCGACCACCGAGATCTACACXXXXXXXXTCTTTCCCTACACGACGCTCTTCCGATCT
[0018] 负链 5'-3':
[0019] CAAGCAGAAGACGGCATACGAGATYYYYYYYYGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT ;
[0020] 其中:正链中的XXXXXXXX代表正链条形码序列,负链中的YYYYYYYY代表负链条形 码序列。
[0021] 上述正、负链的条形码序列是A、T、C、G四种碱基的随机组合,可以根据本领域技 术人员的实际需要进行设计;正、负链的条形码序列需同时使用来区分样品。
[0022] 步骤(4)中,PCR扩增所用的引物序列为:
[0023] P1:5 ' -3 ' :AATGATACGGCGACCGAGATCTACAC
[0024] P2:5 ' -3 ' :CAAGCAGAAGACGGCATACGAGAT 〇
[0025] 本发明方法中,步骤(4)的 PCR 反应程序为:95-98°C 3min ;95-98°C 10sec,65°C 30sec,72°C 30-40sec,共 10 个循环;72°C 5min〇
[0026] 步骤(4)混合后的PCR产物进行琼脂糖凝胶分离纯化是切取650bp上下边缘的片 段进行纯化。
[0027] 本发明提供了上述构建方法在多样品基因组关联分析中的应用。
[0028] 本发明方法的步骤(4)中,纯化后扩增产物的定量检测方法可以是紫外分光光度 计法、核酸荧光定量法、琼脂糖凝胶电泳检测。
[0029] 本发明方法是在Vazyme试剂盒建库方法上的改进,针对批量样品进行建库的方 法,样品打断后进行磁珠纯化,之后DNA末端修复、3'端加碱基A步骤均于96孔板上操作, 大大提高通量及效率,在连接接头时,同时加上可以识别不同样品的双端Index,PCR进行 富集,然后将不同PCR扩增后的文库进行混合,最后通过电泳切胶进行文库片段选择。该方 法与传统方法相比,96孔板批量操作可以大大提高通量,最终多个样品混样后成为一个文 库,在后续的切胶选择片段步骤上节约大量试剂成本、人力成本及时间。该方法特别适用于 基因组小的生物基因组重测序及测序深度低的基因组重测序。
[0030] 本发明的技术方案能够带来以下有益效果:
[0031] (1)样品起始量要求降低。在现有技术中,常规单个文库构建需要至少5 yg样 品,因此对样品的需求量较高,导致部分稀有样品因为总量较少达不到建库标准,本发明建 库流程中纯化步骤的减少,可以将起始量由原来的5 μ g降低至2. 5 μ g,此水平的DNA起始 量,既降低了对样品的要求,同时也满足对后续数据的产出和分析,而起始量的降低同时使 建库试剂成本降低;
[0032] (2)针对有参考基因组序列的样品,进行机械随机打断,构建文库,最终文库数据 覆盖全基因组,随机性较好;将测序所得全部数据通过与参考基因组进行比对分析,因此对 结果分析的SNP位点、Indel位点准确性更高;
[0033] (3)在混样之前,每个样品先进行PCR扩增,即得到PCR富集产物,再进行定量和混 样,如果先进行混样,首先会由于不同样品的含量不同而导致混样不匀,而这种样品间的差 异会被混样后的PCR过程进一步放大,因此对后期不同样品数据量的产出影响较大,而本 发明先对每个样品进行PCR扩增,然后再进行混样,此操作会避免混样误差在PCR扩增后而 被进一步放大,使样品的均一性较好;
[0034] (4)PCR扩增具有偏好性,在PCR扩增过程中,引物可能会偏向于结合基因组的某 段区域,大量扩增此段区域,因此获得的产物会出现对基因组的覆盖不均匀,进而使测序数 据出现冗余度高,所以,在实验过程中,为了避免后期数据冗余度过高而导致的对基因组的 覆盖度降低,本发明将PCR扩增的循环数设计低于10个循环,这样,可以有效降低PCR扩增 带来的偏好性,保证了数据分析的有效性;
[0035] (5)常规建库流程中单个样品需要分别切胶筛选片段,每一个样品从点样、电泳跑 胶、染胶、切胶到纯化耗费时间长,针对多样品更是费时费力,而本设计方案将样品进行混 合后进行切胶,例如,100个样品的切胶时间,完全可以利用本发明将所需时间降至1个样 品的时间,因此大大降低了单个样品电泳切胶的时间与成本。
[0036] 针对100个样品的文库构建,按照常规方法建库,建库周期长达10个工作日,而利 用本发明方法可将100个样品的建库周期缩短至4个工作日,大大节省了建库时间。另一 方面,针对基因组小的生物基因组重测序及测序深度低的基因组重测序,根据现有常规技 术单独构建文库,不仅对基因组DNA起始量要求比较高,而且建库试剂成本较高,利用本发 明方法,降低了建库的DNA起始量,同时通过降低试剂使用量而使建库成本降低。
【附图说明】
[0037] 图1为本发明实施例1测序后数据分析插入片段的分布图。
[0038] 图2为本发明实施例2测序后数据分析插入片段的分布图。
[0039] 图3为本发明实施例3测序后数据分析插入片段的分布图。
[0040] 图4为本发明高通量测序的多样品混合测序文库构建的流程图。
【具体实施方式】
[0041] 以下实施例用
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1