一种新的基因组简化甲基化测序文库的制备方法_2

文档序号:9502289阅读:来源:国知局
成两个池(poolings)。将混合池样本 进行纯化,纯化后的产物进行琼脂糖凝胶电泳,电泳完成后切胶回收300~400bp范围的片 段,两端接头之间的插入片段为225~32化P。利用所设计的特异PCR引物(包含指示标签 (Index),与Illumina公司二代测序仪兼容),对回收后的片段进行PCR富集,PCR产物进行 琼脂糖凝胶电泳,切胶回收350~450bp范围的片段,即得到测序文库。检测文库DNA浓度 和DNA片段长度范围,将检测合格后的文库(浓度大于Ing/μL大小350~45化P)利用 Illumina公司的二代测序进行高通量测序。采用高通量测序技术,检测基因组甲基化敏感 区域具有较高的覆盖度和分辨率,免去了传统的PAGE电泳、PAGE显色W及差异胶带回收、 克隆和测序,提高了样品的数据可信度,非常适用于研究各种环境胁迫、生物胁迫W及各世 代间的基因印记等DNA甲基化相关的表观遗传学研究。
[0011] 新的基因组简化甲基化测序文库的制备方法,即甲基化敏感多态性测序 (MSAP-seq)文库的制备方法,其流程示意图如图1所示,具体包括W下步骤:
[0012] (1)提取同一物种不同组织或者相同组织不同发育时期的基因组DNA。
[0013] (2)分别选取EcoRI/MspI和EcoRI/化all两种双酶切组合对不同样品的基因组 DNA进行酶切;对酶切后的片段进行纯化。
[0014] (3)用T4DNA连接酶连接EcoRI接头、纯化的酶切片段、MspI(化日11)接头(MspI 与化all为同工酶,化an对甲基化敏感,接头一样)。EcoRI接头、MsplOlpall)接头的序 列如下:
[001引EcoR接头序列为:
[0016]F1 (5, -3,):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN,N为A、T、C或G,下同。
[0017]Rl(5, -3,):/5I%os/AATTNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT;
[0018]Mspl/Hpall接头序列为:
[0019] F2(5' -3' ) :GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,
[0020] R2(5' -3' ) :/5Phos/CGAGATCGGAAGAGCGAGAACAA。
[0021] 其中,EcoRI接头序列中的NNN順代表条码化arcode)序列,F1、R1引物中的NNNNN 为互补的序列,条码化arcode)用于标记不同样本,不同条码序列的接头用于连接不同酶 切样本。本发明总共公布了 48种不同条码的EcoRI接头引物,条码信息见表1,表1中条码 序列与F1上的NNN順五碱基序列相同,R1的NNN順序列与条码序列反向互补,引物合成时 需注意。此外,/5Phos/代表5'端起始碱基为憐酸基团(-P&)修饰。
[0022] (4)分别将EcoRI/MspI酶切连接组和EcoRlMpan酶切连接组连接产物混合成两 个池(poolings)。将两个池样本进行纯化,纯化后的样本进行琼脂糖凝胶电泳,电泳完成后 切胶回收片段大小约为300~40化P的DNA片段,DNA插入片段约为225~32化P。
[002引 妨利用含指示标签(Index)序列的PCR引物(包含指示标签序列,与Illumina公 司二代测序仪兼容)对回收的片段进行PCR富集,PCR产物通过琼脂糖凝胶电泳回收350~ 450bp的片段,回收的片段即为测序文库。
[0024]PCR引物序列为:
[00巧]F3(5' -3' ) :AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACG,
[0026] R3(5, -3,):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGC。
[0027] 其中,PCR引物R3序列中的NNNN順代表指示标签序列,指示标签用于标记不同池 文库,不同指示标签序列的引物用于扩增不同池文库。本发明总共设计了 24种不同指示标 签的EcoRI接头,指示标签信息见表1,注意表1中指示标签序列与R3引物中的NNNNNN六 碱基序列反向互补,引物合时需注意,运些标记主要为了方便安排上机测序。
[0028] 将检测合格后的文库利用Illumina公司的Hiseq或者Miseq二代测序进行高通 量测序,本发明设计的最大检测样本数为48X24 = 1152个(即48个条码和24个指示标 签组合所产生的最大样本数)。
[0029] 优选的,步骤(2)中酶切的体系为50μLEcoRI、MspI和HapII酶量分别为20U、 10U和10U;动物组织的酶切时间为化,植物组织的酶切时间为化;不同样品的酶切体系中 基因组DNA的起始量相同,起始量为100~500ng之间。
[0030] 优选的,步骤(3)中连接的体系为40μL两种接头终浓度均为1μM,T4DNA连接 酶终浓度为40U;不同样品的连接体系中酶切纯化后的DNA的起始量相同,起始量为100~ 500ng之间。
[0031] 步骤(3)中设计了特异的接头引物,可W与每种酶切后的样本的粘性进行连接, 并且每种样本的EcoRI接头上设计了 5个碱基的条码,用于标记每个样品。
[0032] 优选的,步骤(2)和(4)中的纯化为用磁珠进行纯化。
[0033] 优选的,步骤(4)和巧)中的琼脂糖凝胶电泳为2%琼脂糖凝胶电泳,电泳条件分 别为 120V化和 120V50min。
[0034] 表1.条码度arcode)和(指示标签)信息表
[0035]

[003引'本发明的甲基化敏感多态性测序基于MSAP法结合高通量测序,是全基因组甲基 化谱策略中性价比最高和最为切实可行的策略之一。它省略了包括PCR、聚丙締胺凝胶电 泳、硝酸银染色、克隆和测序在内的常规分子生物学技术繁琐的步骤,无需进行各种引物的 组合和电泳显色等,可W对大样本数和大基因组的样本进行简化甲基化测序,极大的提高 了MSAP的数据覆盖度和可信度。同时,DNA的投入量可少至l(K)ng,通过较少数据的高通 量测序,就可W实现数据极大化显示的要求。测序的数据可用于后续实验和分析,如BLAST 分析和亚硫酸氨钢法PCR验证等。基于MSAP结合高通量测序的策略是确实可行的,它优于 传统的MSAP技术,又不同于WGBS和RRBS法,因无需进行重亚硫酸盐处理,因此既适用于具 有已知参考基因组序列的物种,也适用于未知参考基因组序列的物种;既可用于检测已知 基因甲基化差异,也可用于发现未知的基因组甲基化的检测。MASP-seq技术通过DNA酶切 巧coRI+MspI或者化ρΠ双酶切组合)、接头连接W及混样回收后PCR富集等几个简单实验 流程,流程中对连接接头和PCR引物进行了改造,兼容了高通量测序仪,实现了大样本数目 的高通量测序。通过该方法极大的提高了传统的MSAP覆盖度,同时还克服了PAGE电泳、 PAGE显色W及差异胶带回收与测序等人为因素造成的误差。
[0037] 本发明与现有技术相比具有W下优点和效果:
[0038] 1、适用范围广。本发明适用于所有已知或者未知参考基因组的真核生物物种,不 受基因组大小和检测样本数目的限制,同时本方法发明适用于一般普通分子生物学实验室 义用。
[0039] 2、高通量。本发明设计兼容Illumina二代测序仪的引物,极大的提高了检测样本 的数目和数据覆盖度。
[0040] 3、结果可靠性高、实验可重复性好。本发明简化了传统MSAP技术,克服了PAGE电 泳、PAGE显色W及差异胶带回收与测序等人为因素造成的数据误差,从而使结果更加可信, 重复性好。
【附图说明】
[0041] 图1是MSAP-seq文库的构建流程简化示意图。(1)基因组DNA双酶切组合,DNA 双链用N序列表示,每份材料分别用EcoRI+MspI和ECORI+地all两个组合进行酶切;(2)将 酶切后样品进行连接,MspI和化all为共用接头,EcoRI接头根据条码化arcode)共设计 48种;(3)连接后的样品混样回收进行PCR反应,条码端的PCR引物F为共用引物;引物R 根据指示标签种类设计了 24种;(4)文库纯化,最终文库序列两端为已知序列,连续的N序 列表示DNA插入片段序列。
[0042] 图2是实施例1所制备文库利用安捷伦2100核酸分析仪进行毛细
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1