减少连接适配器的限制性片段中重复序列的方法

文档序号:581375阅读:291来源:国知局
专利名称:减少连接适配器的限制性片段中重复序列的方法
技术领域
本发明涉及一种降低基因组中重复序列数量的方法,本发明涉及富集低拷贝序列样本的方法。本发明进一步涉及基于复性动力学的分级在富集低拷贝序列的连接适配器的限制性片段中的应用。本发明进一步涉及双链特异的核酸酶(DSN)在富集低拷贝序列的连接适配器的限制性片段中的应用。本发明进一步涉及富含低拷贝片段的样本在指纹分析、 寻找SNP和标记开发中的应用。
背景技术
很多的基因组,特别是植物基因组,含有重复序列,即,DNA的部分,无论大小,在基因组的多处重复。特别是当基因组的尺寸增加时并且特别是植物基因组中,其中基因组可以具有很大的尺寸(例如,拟南芥(Arabidopsis thaliana)单倍体基因组为130Mb,水稻 (Oryza sativa)单倍体基因组为430Mb,玉米(Zea Mays)单倍体基因组为MOOMb,大麦单倍体基因组为5300Mb,洋葱单倍体基因组为15000Mb)。有些基因组如胡椒和玉米基因组被认为含有多达80%的重复序列。AFLP(EP534858,Vos等人1995)在技术上成功地开发了与特定的性状(trait)或 QTL相关的标记以及SNP的鉴定。为了随后开发这种AFLP标记或SNPs为PCR标记,所述PCR 标记为能够用于一般PCR分析的标记,不得不转换标记或SNP。这种转换是艰辛的过程,很多情况下并不成功(Brugmans 等人.Nucleic Acids Research 2003 31(10) :e55),特别是由于基因组中存在重复序列。重复序列并不能提供与性状或定量性状位点(Quantitative trait locus,QTL)相关的有用标记或SNP。其自身并不一定产生问题,但是重复序列的存在阻碍了后来的AFLP标记向PCR标记的转换。因此,有必要富集从DNA样本中得到的低拷贝序列的限制性片段混合物,因为这能增加成功转换至PCR标记的可能性,从而改善用于性状的基因标记开发的效能。

发明内容
本发明人现在发现了将AFLP技术、DNA再联合动力学和DSN标准化的要素结合起来提供一种有效的并且可靠的富集DNA样本低拷贝序列的方法。根据本发明,富集低拷贝的序列按如下方法实现使用第一种限制性内切酶从DNA样本中提供连接适配器的限制性片段,将所述连接适配器的限制性片段进行基于复性动力学的分级,将分级的部分暴露于 DSN,用第二种限制性内切酶限制性消化剩余的片段,将第二种适配器连接到限制性内切的片段上,从而得到初始DNA的富含低拷贝的部分。定义在以下的说明和实施例中,使用了一些术语。为了提供对说明书和权利要求书 (包括这些术语给予的范围)的清楚和一致的理解,提供了以下定义。除非此处特别定义, 本文使用的所有技术和科学术语与本发明所属的技术领域的一般技术人员一般理解的意思相同。所有公开出版物、专利申请、专利和其他参考文献的内容通过引用将其全文并入此处。AFLP =AFLP指一种选择性扩增核酸的方法,其基础是用一种或多种限制性内切酶消化核酸以产生限制性片段,将适配器与限制性片段连接,用至少一个引物扩增连接适配器的限制性片段,所述引物与适配器(部分)互补、与限制性内切酶的剩余部分(部分)互补且进一步在引物的3’末端含有至少一个随机选自A、C、T或G(或者有些情况下为U)的核苷。AFLP并不需要任何在先的序列信息,并且可在任何起始DNA上进行。一般而言,AFLP 包括以下步骤(a)用一种或多种特异的限制性内切酶消化核酸,特别是DNA或eDNA,将DNA片段化成一系列相应的限制性片段;(b)将因此获得的限制性片段与双链合成寡核苷酸适配器连接,该双链合成寡核苷酸适配器的一端与限制性片段的一端或两端相容,从而产生连接适配器的初始DNA的限制性片段;(C)在杂交条件下将连接适配器的限制性片段与一个或多个在其3’末端含有可选核苷的寡核苷酸引物接触;(d)通过PCR或类似的技术扩增与引物杂交的连接适配器的限制性片段,从而使杂交引物沿着被引物杂交的初始DNA的限制性片段延伸;以及(e)检测、鉴定或回收因此得到的被扩增或延长的DNA片段。因此,AFLP提供了可重现的连接适配器的片段亚类。AFLP在EP 534858, US 6045994 以及 Vos 等人 1995. AFLP :a new technique for DNA fingerprinting. Nucleic Acids Research 23(21) :4407-4414中被描述。关于AFLP进一步的详情参见这些文献。 AFLP通常被用作降低复杂性的技术以及DNA指纹技术。在AFLP作为指纹技术应用的情况下,开发了 AFLP标记的概念。AFLP标记AFLP标记是被扩增的连接适配器的限制性片段,其在使用AFLP(指纹)、使用引物的相同对扩增的两种样本间不同。这样,存在或不存在该被扩增的连接适配器的限制性片段可被用作与性状或表型相关的标记。通过应用传统的平板凝胶电泳,AFLP 标记在凝胶中显示为具有某种移动性的条带。其他的电泳技术如毛细管电泳也许不能称之为条带,但概念是相同的,即,具有某种长度和移动性的核酸。条带的存在或不存在可作为表型存在或不存在的指标(或相关联)。AFLP标记典型地在内切酶(1型)或可选择的核苷酸0型)的限制性位点包含多态性。偶尔的,AFLP标记在限制性片段中包含indel (插入-缺失突变)(3型)。可选择的碱基或可选择的核苷酸位于含有一个与适配器互补的部分和一个与限制性位点的剩余部分互补的引物的3’末端,可选择性的碱基随机地选自A、C、T或G(或者有些情况可以是U)。通过用可选择的碱基延长引物,接下来的扩增将仅仅提供可重现的连接适配器的限制性片段亚类,即,仅仅是能被带有可选择的碱基的引物扩增的片段。可选择的核苷酸可被加到引物的3’末端,数量是1到10之间。典型地,1-4个足够。两个引物都可含有不同数量的可选择的碱基。每加入一个可选择的碱基,亚类减少了亚类中被扩增的连接适配器的限制性片段的数量的因素大约为4。典型地,用于AFLP的可选择碱基的数量用+N/+M表示,其中一个引物带有N个可选择的核苷酸,另一个引物带有M个可选择的核苷酸。因此,EcoRI/Msel+l/+2AFLP是用EcoRI和Msel消化初始DNA,连接适当的适配器,用一个针对EcoRI限制性位点的带一个选择性碱基的引物和另一个针对Msel限制性位点的带有2个选择性核苷酸的引物扩增的速写。用于AFLP的在3’末端带有至少一个可选择的核苷酸的引物也被称为AFLP引物。在其3’末端不带可选择的核苷酸并且其实际上与适配器和限制性位点的剩余部分互补的引物有时被称为AFLP+0引物。术语可选择的核苷酸也被用于指位于临近适配器部分并已通过使用选择性引物识别从而使其核苷酸已知的靶序列的核苷酸。测序术语测序指测定核酸样本(例如DNA或RNA)中核苷酸的顺序(碱基序列)。 有很多技术可以应用,如Sanger测序以及高通量测序技术,如妨4技术(Roche Applied Science)、lllumina Inc.以及 AppliedBioSystems、Helicos 等提供的技术。限制性内切酶限制性内切酶或限制性酶是识别双链DNA分子中特定核苷酸序列 (靶位点)的酶,其在每个靶位点或接近每个靶位点切断DNA分子的双链,留下一个平末端或一个粘末端。常见的切酶或稀少的切酶限制性酶典型地识别具有3、4(如Msel)至6 (EcoRI) 甚至是S(Notl)个不同数量的核苷酸的序列。使用的限制性酶可以是常见的或稀少的切酶。术语‘常见的’在这方面典型地与术语‘稀少的’相关使用。常见的切割内切酶(aka常见的切酶)是具有相对短的识别序列的限制性内切酶。常见的切酶典型地识别和随后切断 3-5个核苷酸。因此,常见的切酶平均每64-512个核苷酸切一次DNA序列。稀少的切酶是具有相对长的识别序列的限制性内切酶。稀少的切酶典型地识别和随后切断6个或更多核苷酸。因此,一个稀少的6-切酶平均每IOM个核苷酸切一次DNA序列,产生较长的片段。再一次观察到常见的和稀少的定义是彼此相对的,意思是当使用一个4bp的限制性酶如MseI 和一个具有5位切酶如Avail时,Avail被视为稀少的切酶而MSeI被视为常见的切酶。限制性片段用限制性内切酶消化产生的DNA分子被称为限制性片段。任何指定的基因组(或核酸,不考虑其起源)都可被特定的限制性内切酶消化成分散的限制性片段组。通过限制性内切酶切割得到的DNA片段可进一步被用于各种技术中,例如,通过凝胶电泳被检测。连接在被连接酶催化的酶反应中双链DNA分子被共价连接起来,这被称为连接。 一般而言,DNA的两条链都被共价连接到一起,但也可以通过化学地或酶法修饰链的一个末端从而阻止两条链中的一条的连接。在那种情况下,共价连接仅发生在DNA双链中的一条。合成的寡核苷酸具有优选大约10至大约50个碱基的单链DNA分子,其可被化学合成,称为合成的寡核苷酸。虽然也可以合成在核苷酸序列中的特异位点具有不同的核苷酸组成的且具有相关序列的分子家族,通常,这些合成的DNA分子被设计成具有独特的或所要的核苷酸序列。术语合成的寡核苷酸被用于指具有设计的或所需的核苷酸序列的DNA 分子。适配器带有限定数量的碱基对的短双链DNA分子,例如,长度大约10至大约30 个碱基对,如此设计是为了其可被连接至限制性片段的末端。适配器通常由2个合成的寡核苷酸组成,其具有部分相互互补的核苷酸序列。当在适当的条件下在溶液中混合2种合成的寡核苷酸时,它们彼此退火以形成双链结构。退火后,适配器分子一端被设计以使其与限制性片段末端相容从而连接到其上;适配器的另一端也可以被设计以使其不能被连接, 但并不需要这样(双连接的适配器)。
连接适配器的限制性片段带上适配器帽子的限制性片段。弓丨物一般而言,术语引物指能起始DNA合成的合成DNA分子。没有引物,DNA聚合酶不能从新合成DNA 其仅能延长反应中存在的DNA,其中互补链被用作模板来指导被组装的核苷酸的顺序。我们把聚合酶链反应(PCR)中应用的合成的寡核苷酸分子称为引物。DNA扩增术语DNA扩增典型地被用于指通过应用提供双链DNA的PCR或提供单链DNA的如GenomiWii/R印IiG的其他扩增方法的DNA分子的体外扩增。应该注意还存在其他的扩增方法,其也可以不偏离本发明的要旨而被用于本发明。重复序列重复序列是在DNA或基因组中有多次、但至少是2次或更多次重复的序列。高重复序列高重复的序列是典型地在DNA或基因组中重复成百上千次的序列。例子如串联重复,如卫星DNA、小卫星以及微卫星,和散开的重复,如SINES (短散布元件)和 LINE (长散布元件),(反转录)转座子。低拷贝序列,低拷贝数的序列,独特的序列在基因组中仅发生有限拷贝数(或仅有一个拷贝)的序列,其可被用作与表型相关的标记。低拷贝部分其重复序列被减少因此富含低拷贝序列的DNA样本的部分,即,重复序列被去除的部分。DSN (双链特异的核酸酶)特异性切割双链DNA序列的核酸酶(Siagin等人2002 Genome Research 12 1935-1945,Zhulidov 等人 2004 NAR 32 3 e37)。基于复性动力学的分级在DNA样本中将低拷贝序列从高拷贝或重复序列中分离出来的技术。步骤包括加热基因组DNA样本至其变性为单链形式,然后将其慢慢冷却,使得链重新配对。在样本冷却的时候,可以测量在每一温度下有多少DNA碱基配对。通过减缓再组合的快速稀释样本、随后将DNA结合至氢氧磷灰石柱来测量单链和双链DNA的量。可洗脱柱,以先洗脱单链DNA、随后洗脱双链DNA。使用分光光度计测量这两种溶液中DNA的量。由于单链DNA序列需要找到其互补链以再形成双螺旋,一般序列比稀少序列复性更快。实际上,序列再结合的速率与DNA样本中的序列拷贝数成比例。具有高重复序列的样本复性快,而复杂序列复性慢。可是,并不是简单测量双链DNA对时间的百分比,通常相对于Qt值测量复性的量。Qt值是Ctl (起始DNA浓度)、t (以秒计的时间)和一个取决于缓冲液中阳离子浓度的常数的产物。重复DNA以低CJ值复性,而复杂和独特的DNA序列以高CJ值复性。C0t过滤=Qt过滤是应用DNA复性动力学的原理从“富含基因”的单/低拷贝序列中分离控制很多真核基因组的重复DNA序列的技术。这允许DNA测序,来浓缩最有信息性和最感兴趣的基因组的部分,其将加速发现新的基因并使方法更有效(Peterson DG, Wessler SR, Paterson AH(2002). “ Efficient capture of unique sequences from eukaryotic genomes 〃 . Trends Genet. 18(11) :547-50, LLamoureux D,Peterson DG, Li W, Fellers JP, Gill BS(2005). “ The efficacy of Cot-based gene enrichment in wheat(Triticum aestivum L.) “ . Genome 48(6) :1120-6.,Yuan Y,SanMiguel PJ, Bennetzen JL (2003). “ High-Cot sequence analysis of the maize genome“ . Plant J. 34(2) :249-55o


图1胡椒E33/M49和胡椒P14/M60的胡椒结果。
图2玉米E35/M48和玉米P12/M50的玉米结果。图 3CQt_DSN 方案。
具体实施例方式因此,发明的第一个具体实施方案涉及减少连接适配器的限制性片段中的重复序列(增加低拷贝序列的(相对)数量)的方法,其包括下列步骤a.用第一种限制性内切酶限制性消化样本中初始DNA,将第一适配器连接于限制性片段,来得到连接适配器的限制性片段;b.对步骤(a)中得到的连接适配器的限制性片段进行基于复性动力学的分级;c.将步骤(b)的复性部分加到双链特异的核酸酶(DSN)中;d.用第二种限制性内切酶限制性消化步骤(C)得到的限制性片段,将第二适配器连接至限制性片段;e.得到初始DNA的富含低拷贝的部分。根据本发明的方法结合了 AFLP的某些要素(使用限制性酶和适配器连接生成了连接适配器的限制性片段)和基于复性动力学的分级的某些要素(允许高拷贝序列复性以变成双链,但低拷贝序列仍保持单链),使用DSN去除双链序列,以及又一次的AFLP(用第二种限制性酶进一步生成连接适配器的限制性片段。结果是获得了富含低拷贝序列并降低了高的重复序列的数目的初始DNA部分。在根据本发明的方法的步骤(a)中,用限制性内切酶处理初始DNA。初始DNA可以是任何DNA,如基因组DNA、cDNA、BAC DNA、线粒体DNA、叶绿体DNA或含有线粒体和叶绿体 DNA的植物基因组DNA的混合物。第一限制性内切酶消化初始DNA以生成限制性片段。第一限制性内切酶优选稀少的切酶,如生成典型的尺寸范围为1-41Λ之间的限制性片段的六切酶,如EcoRI、EcoRII、BamHI、HindiII, Pstl,在如多数植物种的富含AT的有机体中使用如EcoRI (识别序列GAATTC)的富含AT内切酶。将第一适配器连接到这些限制性片段上以生成连接适配器的限制性片段。在根据本发明的方法的步骤(b)中,将连接适配器的限制性片段进行基于复性动力学的分级。因此,加热连接适配器的限制性片段直至其变性为单链形式,然后缓慢冷却, 这样链能重新配对在一起。由于使用了限制性内切酶,连接适配器的限制性片段典型地在相同的长度范围内,因此在可测定的时间内重复序列再退火而低拷贝序列能更长时间地保持单链。在冷却持续足够长的时间后,再退火性被停止,例如通过强制冷却。在本领域公开的基于复性动力学的分级中,通常通过减慢再组合的快速稀释样本、以及而后的将DNA结合至氢氧磷灰石柱上、然后洗脱单链和双链DNA部分来测量单链和双链DNA的量。在本发明一个优选的具体实施方案中,可通过在方法的步骤(C)中使用双链核酸酶(直接)处理样本避免使用柱和将获得实质上分别含有单链或双链DNA的部分的中间分离。双链核酸酶特异地切割双链DNA序列(Shagin等人2002 Genome Research 12 1935-1945,Zhulidov等人2004 NAR 32 3 e37)。由于大部分重复序列现在是双链形式的, 减少了样本中重复序列来源的连接适配器的限制性片段(或者增加了低拷贝或独特序列来源的连接适配器的限制性片段)。无论在可选的步骤(C)中是否用DSN处理,都对步骤(b)的复性部分进行本发明方法的步骤(d),以用限制性内切酶进行第二次消化,然后连接对应于内切酶的适配器。在一个优选的具体实施方案中,得到的连接适配器的限制性片段在限制性片段的每一端带有一个不同的适配器。因此本发明的方法的结果是得到了一组富含低拷贝DNA的连接适配器的限制性片段(或显著地降低了重复DNA的相对发生)。可将得到的连接适配器的限制性片段用于随后的指纹技术中,如AFLP,用于SNP 探测等。因此,在一个具体实施方案中,得到的低拷贝DNA样本可选择地被扩增和指纹化以得到更高质量的指纹。CQt方法学本身在cDNA库的标准化中是熟知的,也与DSN联合。典型地,以或多或少的随机的方式通过剪切或片段化DNA得到Qt片段。在CJ分析之前,通常选择片段的大小以减小不利于得到所需结果的大片段比小片段复性快的效果。现在,通过在Qt处理前的第一内切酶的限制性消化和适配器连接以及进一步的片段化,片段的大小更加可控并通常位于更加限定的大小范围。在另一方面,使用两种酶(因此2个适配器)进行内切酶限制性消化将导致太大的长度扩展(在900-50的区域)。通过执行具有第一限制性消化步骤、 然后的Qt处理以及随后的限制性消化步骤的方法,Qt处理在一组连接适配器的限制片段上进行,其比含有宽范围的巨大和小连接适配器的片段的片段混合物具有更均一的复性动力学。本发明的方法在增加AFLP标记(或其他标记)转换为例如PCR标记以及在发现可被用于全基因组DNA分析的有用SNP中的成功率中特别有用。实施例现在用下面的实施例解释本发明。应该明确本领域技术人员可能改变本方案而不偏离本发明的要旨。1、琼脂糖凝胶为了 DNA质量/完整性的检测,将5 μ 1 DNA(RNA酶处理过的!)加样于1 %琼脂糖凝胶。2、Nanodrop 定量为了精确定量DNA,如果必要,干燥并重悬/真空加速浓缩DNA至lOOOng/μ 1(最低浓度IHng/μ 1)。3、EcoRI DNA 消化(60 μ g DNA)
试剂
60μ§ DNA EcoRI
One-Phor-All
BSA
DTT
MilliQ 水
总体积
浓度 1000ng/pL 50 U/pL IOx 10 mg/pL 1 M
样本 60μ1 6 pL 60 μL 3 μ 3 μ . 在37°C下处理样本6小时
权利要求
1 一种降低连接适配器的限制性片段中重复序列(增加低拷贝序列的(相对)数量) 的方法,包括以下步骤a.用第一种限制性内切酶限制性消化样本中的初始DNA,将第一种适配器连接至限制性片段,以得到连接适配器的限制性片段;b.对步骤(a)中得到的连接适配器的限制性片段进行基于复性动力学的分级;c.选择地,将步骤(b)中的被复性的部分加于双链特异性核酸酶(DSN);d.用第二种限制性内切酶限制性消化步骤(b)或(c)得到的限制性片段,将第二种适配器连接至限制性片段;e.从初始DNA得到连接适配器的限制性片段的富含低拷贝部分。
2.根据权利要求1所述的方法,其中第一种限制性内切酶是稀少的切酶。
3.根据权利要求1或2所述的方法,其中第二种限制性内切酶是常见的切酶。
4.根据权利要求1-3所述的方法,其中基于复性动力学的分级是Qt。
5.根据权利要求4所述的方法,其中Qt的值是320。
6.根据权利要求1-5所述的方法,其中通过使用可选的在3’末端的具有1-10个选择性核苷酸的针对适配器的引物扩增从初始DNA得到的连接适配器的限制性片段的低拷贝部分。
7.根据上述权利要求任一项所述的方法,其中初始DNA是基因组DNA、cDAN、BACDNA、 线粒体DNA、叶绿体DNA或具有线粒体DNA和叶绿体DNA的植物基因组DNA的混合物。
8.根据上述权利要求任一项所述的方法,其中通过使用包括双链特异性核酸酶的处理进行DSN标准化。
9.根据权利要求1-8所述的方法在生成富含低拷贝序列的AFLP指纹中的应用。
10.根据权利要求1-8所述的方法作为标记转换或寻找SNP之前DNA样本的处理的应
全文摘要
本发明涉及一种减少DNA样本中重复序列(或者改善低拷贝序列)的方法,该方法组合了限制性内切酶处理、随后的适配器连接、基于复性动力学的分级以及任选地偶联的双链序列核酸酶及进一步的内切酶处理,以及随后的适配器连接。在进一步的DNA分析中可使用富集的低拷贝的部分。
文档编号C12N15/00GK102239258SQ200980148710
公开日2011年11月9日 申请日期2009年11月25日 优先权日2008年12月4日
发明者D·特雷比, M·J·T·范艾克 申请人:凯津公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1