高通量测序文库及其构建方法

文档序号:8247183阅读:1632来源:国知局
高通量测序文库及其构建方法
【技术领域】
[0001] 本发明涉及高通量测序领域,具体而言,涉及一种高通量测序文库及其构建方法。
【背景技术】
[0002] 染色体是遗传物质的载体,其活性和功能是由其结构和空间构象所决定的。染色 体组成长期处于一种动态的平衡,即在整个细胞周期,乃至在不同类型的细胞中都是不同 的。这种不同组成及活性对于染色体的形态建成以及基因的表达调控和复制等方面具有重 要的作用。Job Dekker等在2002年最早发明了这种研宄染色体空间构象的方法,S卩染色体 构型捕捉(Chromosome Conformation Capture)方法,即3C方法,该方法可以用来研宄染 色体任意两个遗传位点相互作用频率。3C方法的原理是:首先分离待研宄物种细胞核,经 过甲醛处理最终使全基因组范围内具有物理上相互作用的DNA和其结合蛋白进行交联,通 过解交联和测序分析获得相对各个位点相对互作频率数据。全基因组范围内互作频率分析 即可反应出染色体的空间构象。
[0003] 基于高通量测序的染色体构型捕捉(Hi-C)方法是3C方法与新一代测序方法的完 美结合。该方法可以准确研宄染色体三维结构的折叠和长距离调控。与3C方法相比,该方 法可以更准确、无偏差,系统地在全基因范围内研宄染色体的折叠情况。3C方法聚焦于某个 位点,能进行两个区域间一一对应相互作用的分析。而Hi-C方法则是通过广泛撒网,聚焦 于分析整个基因组中一一对多,一多对多的相互作用。
[0004] Hi-C的方法原理是经过甲醛固定细胞后,DNA或蛋白间的连接体也同时固定,用 一种限制酶完全切割片段,再用连接酶连接、拆分交联体,最后将获得的DNA片段建库用于 新一代测序,进一步通过生物信息学分析,最终获得染色体的三维折叠结构。下面结合图1 对目前Hi-C方法的文库构建步骤做一个具体介绍:
[0005] (1)将2xl07?2. 5x10 7个哺乳动物的细胞用1 %甲醛进行固定,固定后用甘氨酸 终止反应,将固定后的细胞置于-80°C冰箱(可放置一年);
[0006] (2)将固定好的细胞使用裂解液进行裂解,裂解之后使用NEB Buffer 2进行重 悬,加入HindIII,37°C进行过夜酶切;
[0007] (3)将过夜酶切后的细胞,使用生物素标记的dCTP以及未生物素标记的dATP、 dTTP、dGTP进行末端修复,修复酶为klenow片段(klenow fragment);
[0008] (4)将修复后的细胞使用T4连接酶进行过夜连接,连接后将产生新的NlaIII酶切 位点;
[0009] (5)加入蛋白酶K过夜裂解,然后使用酚氯仿抽提进行DNA提取;
[0010] (6)从提取得到的DNA中取5ug进行去除片段未连接的但末端存在生物素 dCTP, 防止捕获时捕获到末端未连接但存在生物素的片段;
[0011] (7)将处理完的样品进行建库,使用covaris进行打断至300bp,并使用XP磁珠进 行片段选择,去掉过大或过小的片段;
[0012] (8)将上述打断的产物进行末端修复、加 A反应;
[0013] (9)使用链霉素亲和磁珠处理,对中间产物中带有生物素标记的片段进行捕获,得 到目的片段。
[0014] (10)将捕获到的目的片段连接illumina接头,使用P5、P7进行PCR扩增进行目 的片段富集。
[0015] (11)将富集到的产物使用XP磁珠纯化,去掉引物二聚体等,纯化完的产物即为构 建好的文库,使用NheI进行酶切检测文库质量。
[0016] (12)将构建完成的文库进行库捡,使用Hiseq 2500PE125进行测序,得到的数据 进行信息分析,将测序所得序列(reads)中含有NheI位点的数据作为有效数据进行后续信 息分析,该建库方法有效数据约为40-50%。
[0017] 因而,急需对对现有技术进行改进,以改善现有的基于高通量测序的染色体构型 捕捉方法所得到的有效数据少、建库效率低的缺陷。

【发明内容】

[0018] 本发明的主要目的在于提供一种高通量测序文库及其构建方法,以改善现有技术 中所构建的文库经测序后得到的有效数据量少、测序效率低的缺陷。
[0019] 为了实现上述目的,根据本发明的一个方面,提供了一种高通量测序文库的构建 方法,该方法包括以下步骤:S1,从DNA-蛋白交联复合体中获取DNA片段;S2,利用核酸外 切酶对DNA片段进行酶切;以及S3,对酶切后的DNA片段进行文库构建,得到高通量测序文 库;其中,核酸外切酶是指作用于双链DNA,具有3' 一5'核酸外切酶活性而不具有DNA聚 合酶活性的核酸酶。
[0020] 进一步地,在步骤S2中,核酸外切酶为核酸外切酶III ;更优选,利用8?12U的 核酸外切酶对每UgDNA片段进行酶切,进一步优选酶切的反应条件为35?39°C反应8? 12min,然后 70 ?74°C反应 18 ?25min。
[0021] 进一步地,步骤SI包括:S11,利用蛋白酶对DNA-蛋白交联复合体进行解交联,得 到DNA和蛋白的混合物;以及S12,对混合物进行DNA提取,得到DNA片段。
[0022] 进一步地,步骤Sll包括以下步骤:S111,利用核酸内切酶对DNA-蛋白交联复合体 进行酶切,得到酶切交联体片段;S112,对酶切交联体片段进行末端修复标记,得到标记交 联体片段;S113,对标交联体片段进行DNA连接,得到连接带标记交联体片段;以及S114,采 用蛋白酶K对连接带标记交联体片段进行解交联,得到DNA和蛋白的混合物。
[0023] 进一步地,步骤S112中,标记交联体片段上的标记为生物素标记。
[0024] 进一步地,步骤Sl 12步骤为:利用带生物素标记的dCTP及生物素未标记的dATP、 dTTP和dGTP在Klenow片段修复酶的作用下,对酶切交联体片段进行末端修复标记,得到标 记交联体片段。
[0025] 进一步地,步骤S3包括以下步骤:S31,对经酶切后的DNA片段进行随机打断,得到 片段化DNA ;S32,对片段化DNA进行亲和纯化,得到纯化DNA ;S33,对纯化DNA依次进行末端 修复、加"A"、接头连接,得到带接头DNA ;以及S34,对带接头DNA进行扩增富集,得到高通 量测序文库。
[0026] 进一步地,在步骤S32中,采用链霉素磁珠对片段化DNA进行亲和纯化,得到纯化 DNA0
[0027] 进一步地,在步骤SI之前,该方法还包括利用甲醛对DNA和蛋白进行交联,得到 DNA-蛋白交联复合体的步骤。
[0028] 进一步地,步骤Slll中的核酸内切酶为HindIII、MboI、EcoRI或DpnII。
[0029] 为了实现上述目的,根据本发明的另一个方面,提供了一种高通量测序文库,该高 通量测序文库采用上述任一种方法构建而成。
[0030] 应用本发明的技术方案,通过在从DNA-蛋白交联复合体中获取到DNA片段之后, 以及利用该DNA片段进行文库构建之前,用以双链DNA为底物且具有3' 一5'核酸外切酶 活性而不具有DNA聚合酶活性的核酸外切酶替代现有技术中的具有3' 一 5'核酸外切酶活 性且具有DNA聚合酶酶活性的klenow片段,能够将非目的DNA片段的末端碱基去除的更彻 底,使所得到的用于建库的DNA片段的纯度大大提高,进而提高所构建的文库测序所得数 据的有效量,大大减少了无效数据。
【附图说明】
[0031] 构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示 意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0032] 图1示出了现有技术中的高通量测序文库的构建方法流程示意图;
[0033] 图2示出了本发明一种典型的实施方式中高通量测序文库的构建方法流程示意 图;
[0034] 图3示出了本发明一种优选的实施例中高通量测序文库的构建方法的详细流程 不意图;以及
[0035] 图4示出了本发明与现有技术所构建的高通量测序文库的电泳结果比较图。
【具体实施方式】
[0036] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本发明。
[0037] 本发明中的核酸外切酶是指作用于双链DNA,具有3'一 5'核酸外切酶活性而不具 有DNA聚合酶活性的核酸酶。适用于本发明的核酸外切酶所具有的共同点是:都以双链DNA 为底物,且具有从3'-0H端将单个核苷酸逐一切除的活性而不具有DNA聚合酶的活性,满足 上述条件的核酸酶都在本发明的保护范围内,而且,除了具有上述活性之外,本发明的核酸 外切酶还可以具有其他相对较弱的核酸酶活性,比如,BAL-31核酸酶,除了具有3' 一 5'核 酸外切酶活性外,还具有核酸内切酶活性,但其3' 一 5'核酸外切酶活性比其核酸内切酶活 性强20倍。因此,适用于本发明的核酸外切酶可以是来源于大肠杆菌的核酸外切酶III和 核酸外切酶V,也可以是来源于埃氏交替单胞菌BAL-31培养物的BAL-31核酸外切酶
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1