一种dna文库及其制备方法、一种dna测序方法和装置的制作方法

文档序号:3368034阅读:1077来源:国知局
专利名称:一种dna文库及其制备方法、一种dna测序方法和装置的制作方法
一种DNA文库及其制备方法、一种DNA测序方法和装置技术领域
本发明属于分子生物学领域,涉及一种DNA文库及其制备方法、一种DNA测序方法和装置。
背景技术
新一代测序技术(Next Generation kquencing,NGS)又称为高通量测序技术,可一次同时对数百万条DNA进行测序,是DNA测序技术的一次革命。目前应用较广泛的主要有Illumina公司的GenomeAnalyzer系统(即Solexa测序仪,后又发展为HKeq 2000系统)、ABI公司的SOLiD系统以及Roche 454公司的GS-FLX系统三大测序平台。
新一代测序技术产生的数据通量大,使得大规模基因组测序成为可能。但是目前高通量测序技术产生的序列读长与传统的Sanger法测序(如ABI 3730x1)比相对短很多, 只有不到200bp,这对基于鸟枪法(S1Otgim)测序的基因组组装来说是不利的。鸟枪法测序的原理是将基因组DNA片段化,产生一系列短的DNA片段,并对这些片段进行测序,获得序列信息后通过相互重叠关系将这些“碎片”序列组装成相对完整的序列。但是如果这些 “碎片”序列是由重复片段(串联重复或反向重复)组成,则会因无法精确定位到基因组的某一位置,对序列组装造成困难,如此便导致基因组组装过程中重复序列区域形成“空洞”, 更可能增加前后片段连接、组装的不确定性。
解决这一问题需要借助长片段测序。然而受测序技术所限,11Λ以上的长片段测序难以实现,但是可以利用新一代测序技术高通量的特点,通过构建具有较大跨度的末端配对文库来解决这一问题。这种文库的特点是测序得到的序列是由一段较长插入片段的两个末端的序列组成,其间距和方向均为已知,由于这两段末端序列在基因组上具有较大的跨度,可以跨过上述重复序列区域,从而辅助组装的进行。这种测序策略即为配对末端测序,这一类型文库称为末端配对测序文库(Michael W. Smith et al. ,Genomic sequence sampling -.a strategy for high resolution sequence-based physical mapping of complex genomes. Nature Genetics 1994,7 :40-47.)。末端配对文库对于短读长测序技术来说,其重要性在于能够有效将短的序列重叠群(contig)组装成较大的架构(scaffold), 这对于像人或果蝇这种相对较大而复杂的基因组组装来说是一关键突破(Myers Eff, et al :A whole-genome assembly of Drosophila. Science 2000,287 (5461) :2196-2204.)。
但是构建长插入片段,尤其是片段达到201Λ甚至401Λ以上时,末端配对文库的构建显得比较困难。一种方法是通过构建fosmid克隆,获得401Λ左右的插入片段,然后对其末端进行测序。Tuzim等人即是利用这种方法,从高密度fosmid文库得到的110万个配对末端序列(paired-end sequences)与人类参考基因组(human genome reference assembly)进行比对,在长度或方向上不一致的区域被确定为插入、缺失和倒置(Tuzim E et al,2005. Fine—scale structural variaton of the human genome. Nat Genet 37: 727-732.)。但是通过构建fosmid克隆实现这种大跨度序列的末端测序具有明显的局限性,宿主细胞中fosmid载体拷贝数很低,这将限制微生物宿主细胞中特定基因序列扩繁的合成,重置等,同时在高通量测序平台的背景下,完成数十万乃至上百万fosmid克隆的制备,耗时长、成本高,不利于大规模文库的制备和测序。
WO 2007 145612A1中公开了另一种大片段末端的测序方法,其利用IIS型内切酶 Mmel,在大片段末端产生出大约20个碱基的标签,环化之后,分离出含有双末端的片段,可以利用第二代测序技术进行测序。但是20个碱基对于复杂基因组来说太短,不能特异性的定位在基因组中,增加了数据处理的难度。
2007年,Korbel等人提出了一种新的大规模高通量的分析方法-配对末端图谱法 (paired end mapping,PEM),先将基因组DNA剪切成长度约为31Λ的片段,片段两端与生物素标记的接头连接后环化,对环化产物随机切割,通过亲和素筛选带有生物素的剪切片段, 该片段包括了原来31Λ片段的两个末端。然后采用罗氏GS FLX站4测序得到配对末端的序列信息(Kobel Kff et al. ,Paired-end mapping reveals extensive structure variation in the Human genome. Science2007, 318 :420-426.)。
但是上述方法对于构建插入片段达到201Λ甚至501Λ的文库来说难度大,较适合 IOkb以下的片段,而且借助酶切位点或带有生物素标记的中间接头,在酶切效率、接头连接效率等存在不确定因素,难以保证成功率。
WO 2010003316A1中公开了一种称为并列序列标签(GVTs)的方法,通过甲基化敏感的限制性内切酶切割不同位点产生不同的序列标签从而研究一个DNA种群的甲基化, 此时目标DNA种群要么随机片段化要么在特定位点打断,该发明生成的双向GVT是靠近一种或多种限制性内切酶的可切割位点的标签,片段目的DNA克隆到新型粘质粒载体中,如 pSLGVT-28, pSLGVT-35, pSLGVT-36, pSLGVT-37 或者 pSLGVT_38,用于双向 GVT 产物,使用新一代SOLEXA,SOLiD或者454DNA测序仪用决定序列的45-501Λ分离长度,但是这个方法会因为所使用的FspB I和Csp6 I的酶切位点并不是完全平均分布在基因组中,导致有一些含有特定区域的fosmid克隆的末端无法得到,另外也同时存在构建fosmid克隆所遇到的局限性。
illumina公司推出了配对末端文库构建试剂盒(Mate Pair Library Kit V2),但是该方法只适于构建5-101Λ插入片段的配对末端文库。发明内容
本发明的一个方面涉及一种DNA文库的制备方法,包括如下步骤
1)将样本基因组DNA随机打断为20-501Λ的DNA片段;
2)下述的步骤A或B:
A.将打断的DNA片段两个末端进行补平,并加上捕获标记,然后分离20-501Λ的 DNA片段;或
B.分离打断的20-501Λ的DNA片段,然后将DNA片段两个末端进行补平,并加上捕获标记;
3)将分离的DNA片段进行环化,得到环状DNA,并除去未环化的DNA片段;
4)将环状DNA打断为100-2,OOObp的DNA片段;
5)从步骤4)中得到的DNA片段中分离带有捕获标记的DNA片段,得到捕获片段;
优选地,还包括
6)将捕获片段进行末端补平;
优选地,还包括
7)将步骤6)中末端补平后的DNA片段进行末端加碱基A和连接测序接头的步骤;
优选地,还包括
8)将步骤7)中得到的DNA片段进行PCR扩增的步骤。
上述方法的流程可以参考图1。
在本发明的具体的实施方案中,
关于步骤1),
将基因组DNA打断为25-501Λ的DNA片段;具体地,可以打断为20-401Λ的DNA片段、30-501Λ 的 DNA 片段、35-501Λ 的 DNA 片段、40-501Λ 的 DNA 片段、或者 40-451Λ 的 DNA 片段。
样本基因组DNA可以是任意物种的基因组DNA,所述物种包括但不限于哺乳动物、 鸟类、或植物(如双子叶植物),具体地包括灵长目、企鹅目、或蔷薇目,更具体地包括人科、 企鹅科、或蔷薇科(如李属)。在本发明的一个实施方案中,所述样本基因组DNA为人、企鹅 (例如阿德里企鹅,即Pygoscelis adeliae)、或梅花(例如野梅花,即Prunus mume)的基因组DNA。
对基因组DNA进行物理方法打断,例如雾化、超声片或使用HydroShear仪,将基因组DNA打断为20-501Λ大小的片段。优选地,使用HydroShear仪进行打断,通过调节流过收缩孔的速度和收缩孔的孔径大小,可以控制基因组DNA被打断后的片段大小,使基因组DNA 被打断成大小较均一的片段。
在本发明的一个实施方案中,使用HydroShear仪进行打断进行打断,可以使用大片段打断配件,速度参数设置为14-16,循环数设置为30-40(根据片段大小选取不同数值),通过这一改变,可以将基因组DNA的打断片段范围提高至20-501Λ。
关于步骤2),
所述分离为凝胶电泳分离;具体地,为琼脂糖琼脂糖凝胶电泳分离,可采用普通琼脂糖凝胶电泳或者脉冲场凝胶电泳,利用切胶回收,将目的大小的DNA片段分离纯化出来。
所述捕获标记为生物素,并且步骤幻中所述分离通过使用带有链酶亲和素的磁珠进行。也可以选用基于类似抗体-抗原反应的结合系统。
由于经过物理打断的DNA片段,可能形成5’或3’端突出,需要进行末端补平,利用聚合酶如Klenow大片段酶、T4DNA聚合酶和T4多聚核苷酸激酶以及dNTP补平末端,以产生平端化的DNA。其中T4DNA聚合酶可以使3,突出末端平滑化,5,末端补平,Klenow大片段酶可以补平5’突出端或切除3’突出端,而T4多聚核苷酸激酶则是将5’端磷酸化并去除3’端磷酸基团,以便进行连接反应。
然后对这些末端补平的DNA片段进行生物素(Biotin)标记,标记的反应体系和条件与末端补平的反应相似,只是将普通dNTP换成Biotin-dNTP与普通dNTP的混合物,利用 Klenow大片段酶、T4DNA聚合酶所具有的3,-5,外切酶活性和5,-3,聚合酶活性,在DNA 片段的3’末端发生替换反应,将普通dNTP替换成Biotin-dNTP,从而在保证DNA片段维持平末端的条件下使其标记上生物素。
也可以直接利用标记有生物素的碱基进行末端补平。这些方法均在本领域技术人员的知识和技能之内。
关于步骤3),
对分离得到的目的大小的DNA片段进行环化,例如采用T4DNA连接酶及T3DNA连接酶联合作用的形式使目的片段DNA两个末端形成连接,使该片段成环。也可单独使用 T4DNA连接酶或T3DNA连接酶进行连接。但是优选使用T3DNA连接酶和T4DNA连接酶联合作用,取代单独使用T3DNA连接酶或T4DNA连接酶,例如,在含有PEG的连接缓冲液中,16°C 孵育16小时,这一改变使得环化效率(指片段化的线性DNA自连成环状DNA的比例)从 1% -3%提高至 5% -10%。
优选地,在进行环化反应之前,增加一步将DNA混合液置于50_75°C孵育1_30分钟后立即进行冰浴的步骤。这一步骤可以降低不同DNA片段连接在一起的几率,确保每个环化的DNA分子均为单一片段。具体地,所述孵育的温度为60-70°C,例如61、62、63、64、65、 66、67、68、69、或70°C ;具体地,所述孵育的时间为5-25分钟,更具体地,为10-20分钟,例如10、11、12、13、14、15、16、17、18、19、或20分钟。在本发明的一个实施方案中,在65°C孵育15分钟后立即冰浴。
未连接的片段化DNA需要去除,否则会影响配对末端文库的测序,采用已知的消化线性DNA的方法进行,例如使用不降解质粒的ATP依赖DNA酶(Plasmid-^ife ATP-dependent DNase)、或核酸外切酶I (Exonuclease I)等降解未成环的双链或单链DNA。 优选地,改变单一使用DNA核酸外切酶的方法(该方法只针对双链线性DNA),替换为不降解质粒的ATP依赖DNA酶(Plasmid-&ifeATP-d印endent DNase)和核酸外切酶 I (Exonuclease I),这一改变能够达到更彻底的消化双链线性DNA和单链线性DNA,使得未环化的线性DNA 对文库的影响降至最低。
本发明利用DNA片段平末端的高效自连接环化,省略了使用外来载体需要设计酶切位点或引入中间接头实现环化连接等步骤,配合随机打断使环状DNA片段化的操作,大大提高配对末端测序数据的可用度,因为使用酶切法打断如前文所述得到的配对末端序列读长太短(每一端仅得到25bp左右有效数据),而使用中间接头进行环化,在打断过程中容易因断裂位置处于中间接头区间而使得文库丢失某一端序列,无法形成配对末端,限制了其数据的丰富度。而本发明使用DNA片段的高效自连接,连接点两端即为基因组序列信息,不存在其他外来序列或中间接头,最大限度的利用数据信息(每一端有效数据可以达到IOObp或以上)。
关于步骤4),
将环状DNA打断为100-1,OOObp的DNA片段;优选地,打断为200_800bp的片段; 具体地,打断为200-700bp的片段,更具体地,打断为200-600bp的片段;进一步具体地,打断为200-500bp的片段。
由于环状DNA不能直接用于测序,需要通过片段化恢复成线性DNA,同时释放出配对末端序列。环状DNA的片段可以使用已知的各种打断方式,如雾化法、超声破碎法或 HydroShear等,在本发明中优选采用Covaris S2仪器超声打断法,将20-401Λ的环状DNA 打断成例如200-800bp的线性DNA片段。这些打断获得的线性DNA片段并非全部都是测序需要的配对末端片段。在步骤幻中进行的捕获标记(生物素标记),是对片段末端几个碱基进行替换标记,因此只有片段末端带有生物素,经过环化之后这些带有生物素标记的末端被连接起来,通过带有链霉亲和素的磁珠(Sti^ptavidin magnetic beads),可以将这些带有生物素标记的配对末端片段特异捕获,而那些不带生物素标记的中间片段则因无法与磁珠结合而被去除。
关于步骤6)-8),
被捕获到磁珠上的DNA片段需要经过末端补平,同样利用聚合酶如Klenow大片段酶、T4DNA聚合酶和T4多聚核苷酸激酶以及dNTP补平末端,以产生平端化的DNA,然后利用 Klenow (3,-5,exo)聚合酶和 dATP,在 DNA 片段 3,末端加上一个 A 碱基,Klenow (3,-5,exo, 聚合酶保留了 DNA聚合酶活性,但是失去了 5’ -3’和3’ -5’外切酶活性。加A之后再利用 T4DNA连接酶将测序接头连接到DNA片段末端,利用接头末端的T碱基突出和DNA片段末端的A碱基突出互补配对实现连接,接头可选择Illumina、SOLiD或妨4测序接头,以适应不同测序平台测序使用。之后通过特异引物PCR扩增富集配对末端片段,形成测序文库。
完成PCR扩增后生成测序文库,可以在IllumimuSOLiD或妨4等第二代测序平台上进行单向或双向测序,获得两个配对末端的序列信息后用于基因组图谱的组装或比对。
本发明的另一方面涉及一种DNA文库,其根据上述的任一项的制备方法制得。该 DNA文库为(配对)末端文库,可用于DNA测序或者DNA辅助测序。
本发明的再一方面涉及一种DNA测序方法,包括将本发明的DNA文库进行测序的步骤;优选地,使用高通量测序平台进行测序;具体地,所述高通量测序平台包括但不限于第二代测序平台或者是单分子测序平台。
所述第二代测序平台包括但不限于Illumina-Solexa测序平台、ABI-Solid测序平台、和Roche-454(焦磷酸测序)测序平台;所述单分子测序平台(技术)包括但不限于 Helicos公司的真实单分子测序平台、Pacific Biosciences公司的单分子实时测序平台、 以及Oxford Nanopore ^Technologies公司的纳米孔测序平台等。
具体地,所述测序方法为DNA末端测序方法。
本发明的再一方面涉及一种DNA测序方法,包括如下步骤
(1)使用本发明的DNA测序方法对样本基因组DNA进行测序;
(2)使用高通量测序技术对样本基因组进行测序;
(3)将步骤⑴和⑵中得到的测序结果进行组装和/或拼接。
本发明的再一方面涉及一种DNA测序装置,包括DNA文库制备单元和测序单元;具体地,所述DNA文库制备单元包括随机打断单元、补平标记单元、分离单元、环化单元,所述测序单元为高通量测序平台。所述DNA文库制备单元为制备本发明的DNA文库的单元。该 DNA测序装置能够实现本发明的DNA测序方法。
在本发明中,术语“高通量测序技术”和“高通量测序平台,,具有相同的含义,均指包括但不限于第二代测序平台或者是单分子测序平台。所述第二代测序平台(Metzker ML.Sequencing technologies-the next generation. Nat Rev Genet. 2010Jan ;11 (1) 31-46)包括但不限于 Illumina-Solexa 测序平台(GA , HiSeq2000 等)、ABI-Solid 测序平台、和Roche-454(焦磷酸测序)测序平台;单分子测序平台(技术)包括但不限于 Helicos 公司的真实单分子测序技术(True Single Molecule DNA sequencing)、Pacific Biosciences 公司单分子实时测序(single molecule real-time (SMRT ))、以及 Oxford Nanopore ^Technologies 公司的纳米孔测序技术等(Rusk,Nicole (2009-04-01). CheapThird-Generation Sequencing. Nature Methods 6(4) :244-245)。
在本发明中,关于术语“contig N50”或“scaffold N50” 在基因组图谱的绘制过程(或组装过程)中,scaffold N50是评价组装水平高低的一个重要指标,如前文所述,基因组组装首先通过相互重叠关系将DNA片段序列拼接成较长的序列,这些重叠群即为contig,若干个contig通过酶切位点信息或其他能够确定排列或顺序关系的“标记”信息而拼接,可以形成各个contig在染色体上的线性排列或是相对位置关系,即形成 scaffold。N50即覆盖50%所有核苷酸的最大序列重叠群长度,把contig或scaffold从大到小排序,并对其长度进行累加,当累加长度达到全部contig或scaffold长度一半时, 最后一个 contig 或 scaffold 长度即为 contig N50 或 scaffold N50。
发明的有益效果
本发明通过构建末端配对文库实现基因组上大跨度序列的末端测序,整个实验过程简单快速,一个文库的构建周期仅为3天,对比利用fosmid克隆末端测序具有十分明显的时间优势,避免了繁琐的实验步骤,降低文库构建失败的风险。通过对本发明所构建的20-501Λ插入长度的配对末端文库进行测序,得到的有效数据用于组装,能够有效增加 scaffold N50的长度,促进基因组组装水平达到精细图甚至完成图的标准。


图1 本发明的DNA文库制备方法的流程示意图。
图2 实施例1中企鹅基因组DNA打断为20-501Λ的电泳图。各泳道上样如下 泳道1:分子量标准λ-Hind III digest (Takara公司,货号D3403A);泳道2 原始基因组 DNA,上样150ng ;泳道3 分子量标准Low Range PFG Marker (NEB公司,货号M0350S);泳道 4 速度参数为14,循环数为40的打断效果,上样量200ng ;泳道5 速度参数为14,循环数为 30的打断效果,上样量200ng ;泳道6 分子量标准11Λ DNA Extension Ladder (Invitrogen 公司,货号10511-012);泳道7 速度参数为15,循环数为40的打断效果,上样量200ng ;泳道8 速度参数为15,循环数为30的打断效果,上样量200ng ;泳道9 分子量标准Low Range PFG Marker (NEB公司,货号M0350S);泳道10 速度参数为16,循环数为40的打断效果,上样量200ng ;泳道11 速度参数为16,循环数为30的打断效果,上样量200ng ;泳道12 分子量标准 Ikb DNA Extension Ladder (Invitrogen 公司,货号 10511-012);泳道 13:原始基因组 DNA,上样 150ng。
图3 实施例1中生物素标记后分离回收40-451Λ片段的电泳图。各泳道上样如下泳道1 分子量标准Ikb DNA Extension Ladder (Invitrogen公司,货号 10511-012);泳道2 进行电泳分离的DNA,上样约50 μ g ;泳道3 分子量标准11Λ DNA Extension Ladder (Invitrogen 公司,货号 10511-012);泳道 4 分子量标准 Low Range PFG Marker (NEB 公司,货号 M0350S)。
图4 实施例1中配对末端序列比对到基因组上的插入范围验证。
图5 实施例2中配对末端序列比对到基因组上的插入范围验证。
图6 实施例3中配对末端序列比对到基因组上的插入范围验证。
具体实施方式
CN 102534811 A
下面将结合实施例对本发明的实施方案进行详细描述。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著, 黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1 企鹅基因组的DNA文库构津和测序
1.企鹅基因组的DNA文库的构建
1)样品基因组DNA的随机打断
以阿德里企鹅(Pygoscelis adeliae)基因组DNA作为建库样品,按照50 μ g起始构建一个插入片段为40-451Λ的末端配对文库,使用标准Hydroshear仪(GeneMachine,San Carlos, CA.,USA)进行打断,设置打断参数为速度(speed code) 15,循环数(cycles) 30,打断反应体系为100 μ 1。
打断完成后回收到EP 管中,使用 Agencourt AMPure Beads (BECKMAN COULTER) 对打断后的DNA片段进行纯化,在打断反应体系中加入1. 8倍体积的Agencourt AMPure Beads,颠倒混勻,室温放置10分钟使DNA与磁珠充分结合,之后将EP管置于磁力架上静置2分钟使磁珠被充分吸附到管壁,去除上清,加入500 μ 1 70 %乙醇,颠倒数次,去除上清,再加入500 μ 1 70%乙醇,颠倒数次,去除上清,将EP管置于37°C干燥,直至磁珠出现干裂,加入200 μ 1 Elution Buffer (QIAGEN)重悬磁珠,室温放置10分钟使DNA充分溶解于Elution Buffer,将EP管置于磁力架上静置2分钟,将上清转入新的EP管,再原管中再加入185 μ 1 Elution Buffer重悬磁珠,同样室温放置10分钟使DNA充分溶解于Elution Buffer,将EP管置于磁力架上静置2分钟,将上清转入新的EP管,此举的目的是最大限度回收结合于磁珠上的DNA片段。
取部分打断片段进行电泳,电泳结果如图2所示,符合打断要求。
2)末端补平和生物素标记
向385 μ 1 DNA溶液中加入50 μ 1 10ΧΤ4多聚核苷酸激酶缓冲液,8 μ 1 25mM dNTP,25y 1 T4DNA 聚合酶(3000 单位/ml,Enzymatics, Beverly, MA.,USA), 5 μ 1 Klenow 聚合酶(5000单位/ml,Enzymatics)和25 μ 1 !"4多聚核苷酸激酶(10000单位/ml, Enzymatics),20°C温育30分钟,对片段化的DNA进行末端补平。
反应结束后同样使用Agencourt AMPure Beads进行纯化,得到345 μ 1 DNA,加入 50 μ 1 10ΧΤ4多聚核苷酸激酶缓冲液,50 μ IBiotin-dNTP, 25 μ 1 T4DNA聚合酶(3000单位 /ml,Enzymatics,Beverly,ΜΑ. ,USA), 5 μ 1 Klenow 聚合醇(5000 单位/ml,Enzymatics)禾口 25μ 1T4多聚核苷酸激酶(10000单位/ml,Enzymatics),20°C温育30分钟,进行末端生物素标记。
3)电泳分离
对生物素标记后的DNA进行电泳,在500 μ 1反应体系中加入5 μ 120 % SDS和 50 μ 1 10Χ溴酚蓝,混勻,65°C孵育10分钟,然后置于冰上冷却3分钟再上样电泳,使用 0. 6%的Megebase琼脂糖胶以电压3. 5V/CM, switch time I-IOs脉冲场电泳16小时,溴化乙啶(EB)染色后,在 Darkreader 下切取 40-45kb 片段(图 3),使用 QIAEX IIPurification Kit进行胶回收纯化。
4)环化
对回收的40-45kb DNA片段进行环化,在IOOOng DNA溶液中加入2000 μ 1 2X连接酶缓冲液、100 μ 1 T4DNA连接酶(400,000 单位/ml,NEB)、100 μ 1 T3DNA连接酶(300,000 单位/111^11巧111站化8),超纯水补平反应体系至細1,分装至8个1. 5ml EP管,每管500 μ 1, 使得反应体系中DNA浓度为0. 25ng/y 1,16°C温育18小时。
然后向每管500μ 1 体系中加入 5μ 1 IOOmM 的 ΑΤΡ,60 μ 110 X Plasmid-Saf e ATP-d印endent DNase 缓冲液,25 μ 1 Plasmid-SafeATP-dependent DNase (10,000 单位 / ml, Epicentre)和 15 μ IExonuclease I (20,000 单位/ml,NEB),将反应体系 37°C放置 30 分钟,消化去除没有环化的双链或单链线性DNA,然后在75°C放置20分钟使酶失活,冰浴3 分钟使DNA复性,可加入16 μ 1 0. 5Μ EDTA抑制酶活性。
5)打断成200_800bp的线性DNA片段
使用Covaris将环状DNA打断成200_800bp的线性DNA片段,使用QIAGEN Mini Elute PCR purification Kit 进行回收纯化,最后溶于 50 μ 1 Elution Buffer。取 20 μ 1 Dynabeads M-280Streptavidinmagnetic beads (Invitrogen) T Non-stick RNase-Free 1. 5ml Microfuge Tube (Ambion,AMl^5O 不粘管)中,置于磁力架上静置 1 分钟,去上清,用50 μ 1磁珠结合缓冲液(Bead Binding Buffer)洗涤磁珠两次。小心的重悬沉淀,将离心管放置在磁分离架上,等待1分钟,弃上清。重复此步骤一次。用50μ1磁珠结合缓冲液(Bead Binding Buffer)重悬磁珠。将纯化好的DNA与重悬的磁珠等体积混合均勻,20°C在Thermomixer上温浴15分钟(每2min震荡15s,500rpm)。此时带有Biotin 标记的配对末端片段被特异结合到磁珠上,而不带有Biotin标记的DNA片段则无法结合到磁珠上。将离心管放置在磁分离架上,静置1分钟,舍弃上清,用200 μ 1的磁珠洗涤缓冲液(Bead Wash Buffer I)洗涤磁珠,每次洗涤轻轻吹打重悬磁珠五次,去上清,再用Bead Wash Buffer I重复洗两次,将离心管放置在磁分离架上,静置1分钟,舍弃上清,用200 μ 1 的Elution Buffer洗涤磁珠两次,每次洗涤轻轻吹打重悬磁珠五次。移去最后一次洗涤的 Elution Buffer,力口入 50 μ 1 的 Elution Buffer 重悬磁珠。
6)末端序列捕获
50 μ 1重悬的磁珠DNA溶液中加入10 μ 1 10ΧΤ4多聚核苷酸激酶缓冲液,1.6μ 1 25mM dNTP, 5 μ 1 T4DNA 聚合酶(3000 单位 /ml,Enzymatics, Beverly, ΜΑ.,USA),1 μ 1 Klenow聚合酶(5000单位/ml,Enzymatics)和5 μ 1 Τ4多聚核苷酸激酶(10000单位/ ml, Enzymatics),20°C温育30分钟,对结合到磁珠的DNA进行末端补平。然后在磁分离架上用Bead Wash Buffer I和Elution Buffer对磁珠进行纯化,步骤同上,最后加入32 μ 1 的Elution Buffer重悬磁珠,转移到新的不粘管,加入5μ 1 IOXBlue BufferUOy 1 ImM dATP以及3 μ 1 Klenow (3‘ -5,exo-),混勻,置于37°C温育30分钟进行末端加A碱基。然后在磁分离架上用Bead Wash Buffer I和Elution Buffer对磁珠进行纯化,步骤同上,最后加入19μ 1的Elution Buffer重悬磁珠,转移到新的不粘管。
7)加接头和扩增
加入25μ1 2XRapid ligation BufferU μ 1 Illumina PE Adapter Oligo 以及5 μ 1 T4DNA连接酶(600,000单位/mL,Enzymatics),置于20°C温育15分钟进行测序接头连接,然后在磁分离架上用Bead Wash Buffer I和Elution Buffer对磁珠进行纯化,步骤同上,最后加入23μ 1的Elution Buffer重悬磁珠,转移到0. ^il PCR管,加入 25 μ IPhusion DNA Polymerase和上下游引物各1 μ 1,混勻,使用以下反应程序为进行PCR (a) 980C 30 秒;(b)98°C 10 秒;(c)65°C 30 秒;(d)72°C 40 秒;其中步骤(b)到(d)进行 18 个循环,(e)72°C 5分钟,此后将反应物保持在4°C。
2.上机测序
前面步骤7)中的PCR完成后将PCR管置于磁分离架上静置1分钟,取出上清转入新的1. 5ml EP管,使用2. 0%的Low Range Ultra琼脂糖胶以电压15V/CM电泳2小时,EB 染色后,在 Darkreader 下切取 400bp_700bp 片段大小的 DNA,使用 Qiagen MinElute Gel Purification Kit 进行纯化。对纯化后的产物在 Illumina GA(Solexa)或 Hiseq 2000 上机测序,50个循环。
3.测序结果及分析
对得到的企鹅末端配对DNA文库在Illumina HiSeq 2000测序平台上进行测序,得到插入片段为401Λ的配对末端序列信息,将这些数据用于企鹅基因组组装,使用 SOAPdenovo 软件(该软件可从例如 http://soap. genomics, org. cn/soapdenovo. html 下载),将这些数据比对到企鹅基因组序列上,验证该文库测序得到的配对末端序列距离跨度为401Λ,符合片段范围预期(图4)。使用SOAPdenovo软件进行企鹅基因组组装(例如可以参考 Li, R, et al. The sequence and de novo assembly of the giant panda genome. Nature 463,311-317(2010) ;Li, R, et al. De novo assembly of human genomes with massively parallel short read sequencing. Genome Res. 20 :265-272 (2010)),在 scaffoldN50达到8901Λ时,再结合使用企鹅401Λ末端配对DNA文库数据对组装的结果为scaffold N50显著提高到7500kb ;而在企鹅基因组组装scaffold N50达到5000kb时, 再结合使用企鹅401Λ末端配对DNA文库数据对组装的结果为scaffold N50显著提高到 12000kb。
实施例2 梅花基因组的DNA文库构建和测序
按照与实施例1中相同的方法进行野梅花(Primus mume)基因组的DNA文库构建和测序,除了所用基因组DNA样本为梅花的基因组DNA。得到梅花基因组的DNA文库(401Λ 末端配对DNA文库)序结果。
测序结果及分析
对得到的梅花末端配对DNA文库在Illumina HiSeq 2000测序平台上进行测序,得到插入片段为401Λ的配对末端序列信息,将这些数据用于梅花基因组组装,使用 SOAPdenovo软件,将这些数据比对到梅花基因组序列上,验证该文库测序得到的配对末端序列距离跨度为401Λ,符合片段范围预期(图幻。使用SOAPdenovo软件进行梅花基因组组装,在梅花基因组组装scaffold N50达到5701Λ时,再结合使用梅花401Λ末端配对DNA 文库数据对组装的结果为sCaffoldN50显著提高到9701Λ。
实施例3 人基因组的DNA文库构建和测序
按照与实施例1中相同的方法进行梅花基因组的DNA文库构建和测序,除了所用基因组DNA样本为人的基因组DNA。得到人基因组的DNA文库(401Λ末端配对DNA文库)序结果。
测序结果及分析
对得到的人末端配对DNA文库在Illumina HiSeq 2000测序平台上进行测序,得到插入片段为401Λ的配对末端序列信息,将这些数据用于人基因组组装,使用SOAPdenovo 软件,将这些数据比对到人基因组序列上,验证该文库测序得到的配对末端序列距离跨度为401Λ,符合片段范围预期(图6)。使用SOAPdenovo软件进行人基因组组装,在人基因组组装scaffold N50达到10001Λ时,再结合使用人401Λ末端配对DNA文库数据对组装的结果为scaffold N50显著提高到20001Λ。
尽管本发明的具体实施方式
已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
权利要求
1.一种DNA文库的制备方法,包括如下步骤1)将样本基因组DNA随机打断为20-501Λ的DNA片段;2)下述的步骤A或B:A.将打断的DNA片段两个末端进行补平,并加上捕获标记,然后分离20-501Λ的DNA片段;或B.分离打断的20-501Λ的DNA片段,然后将DNA片段两个末端进行补平,并加上捕获标记;3)将分离的DNA片段进行环化,得到环状DNA,并除去未环化的DNA片段;4)将环状DNA打断为100-2,OOObp的DNA片段;5)从步骤4)中得到的DNA片段中分离带有捕获标记的DNA片段,得到捕获片段;优选地,还包括6)将捕获片段进行末端补平;优选地,还包括7)将步骤6)中末端补平后的DNA片段进行末端加碱基A和连接测序接头的步骤;优选地,还包括8)将步骤7)中得到的DNA片段进行PCR扩增的步骤。
2.根据权利要求1所述的方法,其中,步骤1)中,将基因组DNA打断为25-501Λ的DNA 片段。
3.根据权利要求1所述的方法,其中,步骤2)中,所述分离为凝胶电泳分离。
4.根据权利要求1所述的方法,其中,步骤幻中,所述捕获标记为生物素,步骤幻中所述分离通过使用带有链酶亲和素的磁珠进行。
5.根据权利要求1所述的方法,其中,步骤3)中,在环化之前,将步骤2)中得到DNA样品置于50-75°C孵育1-30分钟后立即冰浴。
6.根据权利要求1所述的方法,其中,步骤幻中,联合使用T3DNA连接酶和T4DNA连接酶进行环化。
7.根据权利要求1所述的方法,其中,步骤幻中,通过使用不降解质粒的ATP依赖DNA 酶和/或核酸外切酶I除去未环化的DNA片段。
8.根据权利要求1所述的方法,其中,步骤4)中,将环状DNA打断为100-1,OOObp的 DNA片段;优选地,打断为200-800bp的片段。
9.一种DNA文库,其根据权利要求1至8中任一项所述的制备方法制得。
10.一种DNA测序方法,包括将权利要求9所述的DNA文库进行测序的步骤;优选地,使用高通量测序平台进行测序;具体地,所述高通量测序平台为第二代测序平台或者是单分子测序平台;更具体地,所述第二代测序平台选自Illumina-Solexa测序平台、ABI-Solid 测序平台、以及Roche-4M测序平台;所述单分子测序平台选自Helicos公司的真实单分子测序平台、Pacific Biosciences公司的单分子实时测序平台、以及Oxford Nanopore Technologies公司的纳米孔测序平台。
11.一种DNA测序方法,包括如下步骤(1)使用权利要求10所述的方法对样本基因组DNA进行测序;(2)使用高通量测序技术对样本基因组进行测序;(3)将步骤⑴和(2)中得到的测序结果进行组装和/或拼接。
12. —种DNA测序装置,包括DNA文库制备单元和测序单元;具体地,所述DNA文库制备单元包括随机打断单元、补平标记单元、分离单元、环化单元,所述测序单元为高通量测序平台。
全文摘要
本发明属于分子生物学领域,涉及一种DNA文库及其制备方法、一种DNA测序方法和装置。具体地,所述DNA文库的制备方法包括如下步骤一种DNA文库的制备方法,包括如下步骤1)将样本基因组DNA随机打断为20-50kb的DNA片段;2)下述的步骤A或BA.将打断的DNA片段两个末端进行补平,并加上捕获标记,然后分离20-50kb的DNA片段;或B.分离打断的20-50kb的DNA片段,然后将DNA片段两个末端进行补平,并加上捕获标记;3)将分离的DNA片段进行环化,得到环状DNA,并除去未环化的DNA片段;4)将环状DNA打断为100-2,000bp的DNA片段;5)从步骤4)中得到的DNA片段中分离带有捕获标记的DNA片段,得到捕获片段。本发明具有简单快速等优点。
文档编号C40B50/06GK102534811SQ201010591448
公开日2012年7月4日 申请日期2010年12月16日 优先权日2010年12月16日
发明者吴逵, 张秀清, 杨焕明, 耿春雨, 阿叁 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1