酶促dna分子的制作方法

文档序号:452822阅读:872来源:国知局
专利名称:酶促dna分子的制作方法
技术领域
本发明涉及核酸酶或催化活性(酶促)DNA分子,它们能够切割其他核酸分子,尤其是RNA分子。本发明还涉及含有上述酶促DNA分子的组合物以及制备和使用所述酶和组合物的方法。
背景让催化剂在它们的天然范围之外仍能发挥活性或者使催化剂能催化非天然发生的反应,这种需要导致“酶工程”技术的发展。“酶工程”中常用的方法是“合理设计”方法,依靠对天然酶的理解来帮助构建新酶。不幸的是,对蛋白质结构和化学领域的熟悉程度还不足以能够设计出生产新生物催化剂的途径。
近来,一种不同的方法已经应用于发展新催化剂。这种方法包括构建一个异源的大分子库并将体外筛选方法用于从库中分离出能催化预期反应的分子。从大分子库中筛选催化剂不依赖对它们结构和化学特性的全面了解。因此,该方法被戏称为“无理设计”(Brenner et al.,Proc.Natl.Acad.Sci.USA,895381-5383,1992)。
迄今为止,在合理设计酶促活性RNA分子或核酶方面的大量努力还未设计出具有全新或催化功能得到根本改进的分子。然而,通过一种我们称为“引导的分子进化”或“体外进化”的方法把无理设计法投入应用就带来一种潜在的可能,即能够生产出一种具有期望的功能性特征的分子,上述“引导的分子进化”或“体外进化”是仿效达尔文的自然进化机制设计的。
这项技术已经应用于溶液中的RNA分子(参考,例如,Mills et al,Proc.Natl.Acad.Sci.USA,58217,1967;Green et al,Nature,347406,1990;Chowrira et al,Nature,354320,1991;Joyce,Gene,8283,1989;Beaudry et al,Science,257635-641,1992;Robertson et al,Nature,344467,1990)以及与吸附到一个固体载体上的配体结合的RNAs(Tuerk et al,Science,249505,1990;Ellington et al.Nature,346818,1990),并获得了不同程度的成功。另外,它还已经应用到被直接吸附到固体载体上的肽(Lam et al,Nature,35482,1991);以及表达在病毒核衣壳蛋白中多肽表位(Scottet al,Science,249386,1990;Devlin et al,Science,249249,1990;Cwirla et al,Proc.Natl.Acad.Sci.USA,876378,1990)。
从发现催化活性RNA(Kruger et al,Cell,31147-157,1982;Guerrier-Takada et al,Cell,35849-857,1983)至今已有十几年。已知的天然生成的核酶的数目在不断地增加((参见,RNA世界,Gesteland & Atkins(编著),pp.239-269,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1993);Pyle,Science,261709-714,1993;Symons,Curr.Opin.Struct.Biol.,4322-330,1994),近年来,通过体外进化方法得到的合成核酶使得该数目进一步扩增。(参见Joyce,Curr.Opin.Struct.Biol.,4331-336,1994;Breaker et al,Trends Biotech.,12268-275,1994;Chapman et al,Curr.Opin.Struct.Biol.,4618-622,1994)。
考虑到DNA含有许多与RNA相同的基团,所以认定DNA也具有酶促活性似乎是合理的。然而,除特定的病毒基因组和复制中间体外,即使排除了DNA采取复杂的二级及三级结构,生物机体中几乎所有DNA也都是以完整的双链体存在的。因此,实际上还未发现DNA酶也就不足为奇了。
本发明出现之前,能够切割核苷酸的催化活性DNA分子的设计、合成以及使用还未见公开或报道。因此,此处公开的发现和发明是十分重要的,因为它们强调了体外进化作为效率日益提高的催化活性分子的一种设计手段的可能性,所述催化活性分子包括能切割其他核酸的酶促DNA分子,尤其是RNA。
发明概述本发明描述了一种能够在特定切割位点切割底物核酸(NA)序列的合成或构建的(即非天然生成的)催化活性(或酶促)DNA分子。本发明还提供了一种具有内切核酸酶活性的酶促DNA分子。
一种优选的催化活性DNA分子的内切核酸酶活性,这种活性针对预先选定的底物核酸序列中被定义为切割位点的核苷酸序列具有特异性。该DNA分子具有第一和第二两个底物结合区域,位于核心区域的两侧,其中所述的第一底物结合区域有一段序列与上述预先选定的底物核酸序列的第一部分互补,而所述第二底物结合区域有一段序列与上述预先选定的底物核酸序列的第二部分互补。核心区域有一段根据下列通式所述的序列(I.)T(茎)’AGC(茎)”Z,其中(茎)’和(茎)”都是具有以下特征的一种三联核苷酸即当(茎)’(茎)”杂交配对时形成的3个碱基对中至少包括2个GC对,其中Z=WCGR或WCGAA,W=A或T且R=A或G。在一个优选实施例中,式I为SEQ ID NO 120(8-17)。
还提供了一种核心区域,其中含有一段下列通式代表的序列的(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中X=T、C或A,R=A或G。在一个优选实施例中,式I为SEQ ID NO121(10-23)。
在另一个实施例中,内切核酸酶活性是针对底物核酸序列中被定义为切割位点的核苷酸序列的,该切割位点包括单链核酸的。在另一个优选变化中,所述的切割位点是双链核酸。同样,底物核酸序列可能是单链、双链、部分单链或部分双链、成环或其任一组合。
在提供的另一个实施方案中,底物核酸序列包括一个或多个核苷类似物。在一个变化中,所述底物核酸序列是较大的分子的一部分或被吸附到较大分子上。
在各种实施方案中,这种较大的分子选自RNA、修饰后的RNA、DNA、修饰后的DNA、核苷酸类似物或其组合。在另一个实施例中,这种较大的分子包括由一种由核酸序列和非核酸序列形成的组合。
在另一个实施方案中,本发明提供了包括一个或多个核苷类似物的底物核酸序列。一个进一步的变化中,提供的单链核酸包括RNA、DNA、修饰后的RNA、修饰后的DNA、一个或多个核苷类似物或其任一组合体。本发明的一个实施方案中,内切核酸酶活性包括对切割位点上磷酸二酯键的水解切割。
在各种优选的实施方案中,本发明的催化活性DNA分子是全序列单链或部分单链。优选地,这些催化活性DNA分子可以假定为各种与它们的催化活性相吻合的形状。因此,在一个变化中,本发明的催化活性DNA分子包括一个或多个发夹环结构。在另一个变化中,催化活性DNA分子可以假定为一个类似“锤头”状核酶的结构。在另外的其他实施方案中,催化活性DNA分子可以假定为具有类似于嗜热四膜虫核酶的构象,例如源自I型内含子的核酶。
类似地,无论底物分子的方向如何,本发明优选的催化活性DNA分子都能表现出位点特异性的内切核酸酶活性。因此,在一个优选的实施方案中,本发明的酶促DNA分子能切割一个与该酶促分子分离的底物核酸序列——即未与该酶促DNA分子连接的底物核酸序列。在另—个优选实施方案中,酶促DNA分子能切割一个吸附的底物核酸序列——即它能完成一个类似于自身切割的反应。
本发明还期望酶促DNA分子(催化活性DNA分子、脱氧核酶或DNAzyme)具有内切核酸酶活性,由此该内切核酸酶活性需要二价阳离子的存在。在各种优选的替代实施方案中,该二价阳离子选自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。另一个变化中,期望内切核酸酶活性需要单价阳离子的存在。在这种替代实施方案中,该单价阳离子优选Na+、K+。
在本发明的各种优选实施例中,酶促DNA分子包括一段选自下列序列的核苷酸序列SEQ ID NO 3、SEQ ID NO 14、SEQ ID NO 15、SEQ IDNO 16、SEQ ID NO 17、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO 20、SEQ ID NO 21和SEQ ID NO 22。在其他优选的实施方案中,本发明的催化活性DNA分子包括一段选自下列序列的核苷酸序列SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQ ID NO 26、SEQ ID NO 27、SEQ IDNO 28、SEQ ID NO 29、SEQ ID NO 30、SEQ ID NO 31、SEQ ID NO 32、SEQ ID NO 33、SEQ ID NO 34、SEQ ID NO 35、SEQ ID NO 36、SEQ IDNO 37、SEQ ID NO 38和SEQ ID NO 39。
另一个优选的实施方案期望本发明的催化活性DNA分子包括一段选自SEQ ID NO 50和SEQ ID NO 51的核苷酸序列。另一个优选实施方案中,本发明的催化活性DNA分子包括一段选自SEQ ID NO 52~101的核苷酸序列。如此处公开的一样,本发明还提供了包含与本发明公开序列基本相似的序列的催化活性DNA分子。因此,为了生成多种其他有用的酶促DNA分子,可以采用多种取代、缺失、插入、复制和其他突变方法来制备属于公开范围内的分子;只要所述分子表现出了此处描述的位点特异性的切割活性,那么它们就属于本说明书的范围之内。
在本发明的进一步变化中,本发明的酶促DNA分子优选具有约1μM或更小的底物结合亲和力。另一个实施方案中,本发明的酶促DNA分子以小于约0.1μM的KD与底物结合。
本发明还公开了具有有效转换速度的酶促DNA分子。在一个实施方案,该转换速度小于5hr-1;在一个优选实施方案中,该速度小于约2hr-1;在一个较优选的实施方案中,该速度效率约1hr-1;在一个更优选的实施方案中,该转换速度约0.6hr-1或更小。
在另一个实施方案中,本发明的酶促DNA分子表现出有效的转换速度,其中Kobs小于1min-1,优选小于0.1min-1;较优选小于0.01min-1;更优选小于0.005min-1。在一个变化中,Kobs值约为0.002min-1或更小。
本发明还期望在实施方案中所公开的DNA酶的催化速度得到充分的优化。因此,在各种优选实施方案中,因Mg2+存在而优化的反应的Km约为0.5~20mM,优选约1~10mM,更优选约2~5mM。
本发明还提供了这样一个实施方案,其中定义为切割位点的核苷酸序列中包含至少1个核苷酸。在各种其他优选的实施方案中,本发明的催化活性DNA分子能识别和切割一段由2个或多个核苷酸组成的定义为切割位点的核苷酸序列。
在各种优选的实施方案中,本发明的酶促DNA分子包括一个保守的核心,以及位于核心两侧的一个或多个底物结合区域。在一个实施方案中,酶促DNA分子包括第一和第二两个底物结合区域。在一个实施方案中,酶促DNA分子包括2个或多个底物结合区域。
如上所述,本发明优选的催化活性DNA分子还可以包括一个保守的核心。在一个优选的实施方案中,所述的保守核心包括1个或多个保守区域。在其他优选的变化中,上述的保守区域包括一段选自下列序列的核苷酸序列CG;CGA;AGCG;AGCCG;CAGCGAT;CTTGTTT和CTTATTT(参见,例如图3)。
在本发明的一个实施方案中,本发明的酶促DNA分子进一步包括位于保守核心中保守区域之间的1个或多个可变或间隔核苷酸。在另一个实施方案中,本发明的酶促DNA分子进一步包括位于保守核心和底物结合区域之间的1个或多个可变或间隔核苷酸。
在一个变化中,第一底物结合区域优选包括一段选自下列序列的核苷酸序列CATCTCT;GCTCT;TTGCTTTTT;TGTCTTCTC;TTGCTGCT;GCCAGCTT(SEQ ID NO 40);CTCTATTTCT(SEQ ID NO 41);GTCGGCA;CATCTCTTC;及ACTTCT。在另一个优选的变化中,第二底物结合区域包括一段选自下列序列的核苷酸序列TATGTGACGCTA(SEQ ID NO 42);TATAGTCGTA(SEQ ID NO 43);ATAGCGTATTA(SEQ ID NO 44);ATAGTTACGTCAT(SEQ ID NO 45);AATAGTGAAGTGTT(SEQ ID NO 46);TATAGTGTA;ATAGTCGGT;ATAGGCCCGGT(SEQ ID NO 47);AATAGTGAGGCTTG(SEQ ID NO 48);及ATGNTG。
在本发明的各种实施方案中,底物结合区域的长度是可变的。因此,例如,底物结合区域可以包括1个到多个核苷酸。然而,应该理解的是,底物结合区域长度约3~25个核苷酸,优选约3~15个核苷酸,更优选3~10个核苷酸,这些长度的底物结合区域都是具体优选的。在各种实施方案中,底物结合区域中的单个核苷酸与底物分子中的核苷酸之间能形成互补碱基对;在其他实施方案中,形成的是非互补碱基对。互补碱基对和非互补碱基对的混合物也在本发明公开的实施方案的范围之内。
在另一个优选的实施方案中,本发明的催化活性DNA分子可以进一步包含一个第三底物结合区域。在一些优选实施方案中,第三底物结合区域包括一段选自下列序列的核苷酸序列TGTT、TGTTA和TGTTAG。本发明的另一个优选实施方案中,酶促DNA分子进一步包括位于1个或多个底物结合区域之间的可变或“间隔”区域。
在另一个公开的实施方案中,本发明期望一个与其他DNA分子及寡核苷酸分离的、纯化后的、合成酶促DNA分子,该酶促DNA分子具有内切核酸酶活性,其中所述的内切核酸酶活性针对底物序列中一段被定义为切割位点的核苷酸序列具有特异性,这段序列中包括有单链或双链核酸。在一个变化中,公开了一个具有内切核酸酶活性的合成(或构建)的酶促DNA分子,其中所述的内切核酸酶活性针对底物核酸序列中一段被定义为切割位点的核苷酸序列具有特异性,这段序列基本上由单链区域或双链区域组成。
在另一个实施方案中,本发明提供了一种包括有催化活性的脱氧核糖核苷聚合物的酶促DNA分子,这种活性能水解含核酸底物产生底物切割产物。在一个变化中,水解反应以点-特异性的方式发生。如上所述,该聚合物可以是单链、双链或二者的某一组合。
本发明进一步期望底物中包括一段核酸序列。在各种实施方案中,核酸序列底物包括RNA、修饰后的RNA、DNA、修饰后的DNA、1个或多个核苷类似物或其中任一个的组合体。一个实施方案期望底物包括一段单链节段;而另一个实施方案期望底物是双链的。
本发明还期望一个包括脱氧核糖核苷聚合物的酶促DNA分子,该脱氧核糖核苷聚合物能水解含核酸的底物产生切割产物因而具有催化活性。在一个变化中,酶促DNA分子与底物之间具有有效的结合亲和力,而对与切割产物之间却缺乏有效的结合亲和力。
在一个优选的实施方案中,本发明公开了一种非天然生成的酶促DNA分子,其中包括一段定义为保守核心的核酸序列,保守核心的两侧排列着识别区、可变区和间隔区。因此,在一个优选的实施方案中,该核酸序列定义为紧邻或紧靠该分子的5’端的是第一可变区,从此开始往3’端方向依次为第一识别区、第一间隔区、第一保守区、第二间隔区、第二保守区、第二识别区和第二可变区。
在另一个实施方案中,该核酸序列优选定义为紧邻或紧靠该分子的5’端的是第一可变区,从此开始往3’端方向依次为,第一识别区、第一间隔区、第一保守区、第二间隔区、第二保守区、第二识别区、第二可变区和第三识别区。
在上述实施方案的一个变化中,该分子包括一个保守的核心区,其两侧是两个底物结合区;在另一个变化中,保守的核心区包括1个或多个保守区域。在其他优选的实施方案中,保守的核心区中进一步包括1个或多个可变或间隔核苷酸。在另一个实施方案中,本发明的酶促DNA分子进一步包括1个或多个间隔区。
本发明进一步期望各种组合物。例如,其中包括一个上述公开和此处期望的酶促DNA分子的组合物。在一个替代实施方案中,根据本发明的组合物包括2个或多个上述的酶促分子,其中每个酶促分子各能切割一个底物中的不同的序列。在另一个变化中,组合物包括2个或多个上述的酶促分子,其中每个酶促分子都能识别一个不同的底物。在各种实施方案中,还优选的是组合物中包括1个单价或二价阳离子。
本发明进一步提供了生产、筛选和分离本发明的酶促DNA分子的方法。在一个变化中,一种筛选能在特定位点切割一段核酸序列(例如,RNA)的酶促分子的方法包括下列步骤(a)得到假定酶促DNA分子的一个群体——该序列是天然生成或合成的——而且优选它们是单链DNA分子;(b)将含核苷酸的底物序列与上述DNA分子混合形成混合物;(c)在预定的条件下,保持混合物充足的一段时间,使得上述群体中的DNA分子能够切割底物从而产生底物切割序列;(d)把上述群体中的DNA分子与底物序列和底物切割序列分开;(e)从上述DNA分子的群体中分离出能在特定位点切割底物核酸序列(例如,RNA)的DNA分子。
在上述方法的一种进一步的变化中,能在特定位点切割底物核酸序列的DNA分子用一种固定试剂标记。在一个实施例中,该试剂包括生物素。
在上述方法的另一种变化中,从筛选一段序列开始——例如,一段预定的“目标”核酸序列——即希望能被为此而构建的酶促DNA切割的序列。因此,在一个实施方案,通过把预选(预定)的“目标”序列吸附或“标记”到一段含有1段或多段随机序列或节段的脱氧核糖核酸序列上,从而生成一定数目的能在特定位点切割底物核酸序列的DNA分子。在一个变化中,上述随机序列长约40个核苷酸;在另一个变化中,上述随机序列长约50个核苷酸。长约1~40核苷酸、40~50核苷酸和50~100个核苷酸的随机序列也在本发明所期望的范围之内。
在本发明的一个实施方案中,用于生产酶促DNA分子群体的核苷酸序列选自SEQ ID NO 4、23、50和51。在另一个实施方案中,所述“目标”或“底物”核酸序列包括一段由1个或多个核糖核苷酸组成的序列——参见,例如,SEQ ID NO 4和SEQ ID NO 23的相应部分,以及SEQID NO 49。本发明还期望,一个有用的“目标”或“底物”核酸序列可以包括DNA、RNA或其组合。
本发明还期望上述方法,其中所述的分离步骤进一步包括把标记过的DNA分子暴露于一个其上连接有抗生物素蛋白的固体表面,从而使该标记过的DNA分子吸附到该固体表面上。如上所述,底物可以是RNA、DNA、二者的组合或者一种包括核酸序列的分子。
本发明还期望一种在特定切割位点特异地切割底物核酸序列的方法,其中包括下列步骤(a)提供一种能在特定切割位点切割底物核酸序列的酶促DNA分子;以及(b)让酶促DNA分子和底物核酸序列接触从而导致在切割位点对核酸序列进行特异性的切割。在一个变化中,所述的酶促DNA分子是非天然生成的(或合成的)DNA分子。在另一个变化中,所述的DNA分子是单链。
在上述方法的另一个变化中,所述底物包括一个核酸分子。在各种实施方案中,所述的底物核酸包括RNA、DNA、修饰后的DNA、1个或多个核苷酸类似物或其任一的组合体。在另一个实施方案中,所述的特异性切割是由酶促DNA分子的内切核酸酶活性引起的。反应条件的改变——例如,pH值、温度、阳离子百分比、酶的百分比、底物百分比以及产物百分比的调整——也是此处所期望的。
本发明还提供了一种切割磷酸二酯键的方法,其中包括(a)将能在特定切割位点切割底物核酸序列的酶促DNA分子与含磷酸二酯键的底物混合形成反应混合物;以及(b)在预定的条件下保持混合物,让酶促DNA分子切割磷酸二酯键以导致底物的切割,从而产生一定数目的底物产物。在一个实施方案中,酶促DNA分子能以位点特异性的方式切割磷酸二酯键。在另一个实施方案中,该方法进一步包括(c)把上述产物与催化活性DNA分子分开;以及(d)向酶促DNA分子补入底物形成新的反应混合物。
本发明还提供了构建能切割磷酸二酯键的酶促DNA分子的方法。一种典型的方法包括下列步骤(a)得到一个单链DNA分子的群体;(b)向上述群体中导入遗传学的变化从而生成一个变异的群体;(c)从上述变异群体中筛选出符合预定筛选标准的个体;(d)把筛选出的个体和上述变异群体的其余部分分开;以及(e)扩增上述筛选出的个体。
附图简述

图1给出了用于分离能够切割目标RNA磷酸酯的DNAs的选择扩增方案。如图所示,通过PCR扩增含50个随机核苷酸(在该分子顶部用“50N”标示)的双链DNA,使用的引物5’端经过生物素化,3’末端以腺嘌呤核糖核苷酸(rA)结尾。(生物素标记物用1个被圆圈包围的字母“B”表示)利用Taq DNA聚合酶延伸这种引物,得到含单个嵌入核糖核苷酸的DNA产物。把得到双链DNA固定到一种链霉亲和素基质上,用0.2N NaOH洗脱出未被生物素化的DNA链。用缓冲液将柱重新平衡后,用加有1mM PbOAc的同一溶液洗涤该柱。具有Pb2+依赖性自身切割性能的DNAs被从柱上释放出来,收集洗脱液,用PCR扩增。然后用PCR产物启动下面选择性扩增循环。
图2中给出的是Pb2+存在的条件下,DNA起始库(G0)以及第1轮到第5轮选择(G1~G5)后得到的群体的自身切割活性。符号Pre代表含108个核苷酸的前体DNA(SEQ ID NO 4);Clv代表含28个核苷酸的5,切割产物(SEQ ID NO 5);M代表引物3a(SEQ ID NO 6),其长度相当于5’切割产物。
图3给出的是从5轮选择后得到的群体中分离的单个突变体的序列对比。顶部给出的是固定的底物结构域,其中含有一个目标核糖腺苷酸,该目标核糖腺苷酸在图中用倒三角形标出。用竖框框起来的部分是共同参与了推定的碱基配对相互作用的底物核苷酸。将与50个初始随机核苷酸对应的序列与底物结构域进行反向平行比较。所有这些突变体3’末端都是一个固定序列5’-CGGTAAGCTTGGCAC-3’(未标出;SEQ ID NO 1)。在图的左右两边指示出的是位于初始随机区域中被推定与底物之间形成碱基对的核苷酸;每个显示出的序列中被单独框起来的部分是酶促DNA分子的推定碱基配对(或底物结合)结构域。居中的两个大框中给出的是保守区域。
图4A和4B给出了一个分子间反应中RNA磷酸酯的DNA-催化切割,该反应以催化转换开始。图4A是19聚体底物(3’-TCACTATrAGGAAGAGATGG-5’,SEQ ID NO 2)和38聚体DNA酶(5’-ACACATCTCTGAAGTAGCGCCGCCGTATAGTGACGCTA-3’,SEQ ID NO 3)之间形成的复合物的简图。底物中包括单个腺嘌呤核糖核苷酸(”rA”,紧靠箭头),其两侧是脱氧核糖核苷酸。合成DNA酶是图3中给出的最常发生的突变体的38核苷酸部分。位于推定催化结构域中的高度保守核苷酸被“框了起来”。如图所示,一个保守区域是“AGCG”,而另一个保守区域是“CG”(按5’-3’的方向阅读)。
图4B给出的是用于测定下列反应的Km(负斜率)和Vmax(y轴截距)的Eadie-Hoftstee曲线在与体外选择相同的条件下,DNA催化切割[5’-32P]标记的底物。测定反应的初始速度,该反应中包括5nM DNA以及0.125μM、0.5μM、1μM、2μM或4μM底物。
图5给出的是表现选择的催化活性DNAs的4个家族的特异性内切核糖核酸酶活性的聚丙烯酰胺凝胶照片。Pb2+依赖性家族分子的选择以并排的方式重复出现作为对照(第1组)。第2组中,使用的阳离子是Zn2+;第3组中,阳离子为Mn2+;第4组中,阳离子为Mg2+;凝胶上第5部分的位置处只有单独的切割产物作为对照。
如图所示,上述的4个组中每组都有3个泳道。在每组的3个泳道中,第1泳道显示的是在不含金属阳离子条件下选择的无活性群体,第2泳道显示的是金属阳离子存在条件下观察到的活性,第3泳道显示的无活性的起始库(GO)。
图6A和6B分别提供的是一个“原始”催化活性DNA分子和用本发明公开的选择扩增方法得到的几个催化活性DNA分子中的一个的二级结构的图象。图6A给出的是来自起始库的示范分子,该分子表现出了SEQ IDNO 23代表的分子的总体构象。如图所示,各种互补核苷酸位于随机区域(N40)的旁侧。图6B图中显示的是一个通过此处公开的方法产生的Mg2+依赖性催化活性DNA分子(或“DNAzymes”)。图6A和6B中,箭头指示出的是底物核酸中核糖核苷酸的位置。
图7给出的是基本上按照下面实施例5中描述的方法进行10轮体外选择扩增的结果中的一部分。如图所示,有两个位点和两个催化剂家族表现出对目标序列的最有效的切割。切割条件基本上同图7中的显示,就是,10mM Mg2+、pH7.5和37℃;图中显示的是反应进行2小时后收集的数据。相对于代次数目(此处为0~10)绘制出切割率(%)。垂直柱表示的是能够在指定位点切割底物中目标序列的催化活性DNA分子的数目/普遍性(prevalence),其中条纹柱显示的是在G↓UAACUAGAGAU处的切割,空白(无阴影)柱显示的是在GUAACUA↓GAGAU处的切割。
图8给出的是本发明的两个催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位点以及转换速度。反应条件如图所示,也就是,10mM Mg2+、pH7.5和37℃。左边是鉴定为克隆8-17的DNAzyme,箭头指示的是RNA底物的切割位点。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——与DNAzyme分离(即给出的是分子间切割)——如图标记。类似地,右边显示的是此处鉴定为克隆10-23的DNAzyme,箭头指示的是RNA底物的切割位点。再次列出底物序列。酶8-17的转换速度为约0.6hr-1;酶10-23的转换速度为约1hr-1。圆点(·)表示的是非互补的配对,而竖线(|)表示的是互补配对。
图9进一步给出了本发明的两个催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位点和转换速度。反应条件如图所示,也就是,10mM Mg2+、pH7.5和37℃。与图8中相同,左边给出的是鉴定为克隆8-17的DNAzyme,箭头指示的是RNA底物的切割位点。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——与DNAzyme分离(即给出的是分子间切割)——如图标记。类似地,右边显示的是此处鉴定为克隆10-23的DNAzyme,箭头指示的是RNA底物的切割位点。再次给出了底物序列。酶8-17的Kobs值为约0.002min-1;酶10-23的Kobs值为约0.01min-1。圆点(·)表示的是非互补的配对,而竖线(|)表示的是互补配对。
图10是表示催化活性基序8-17和10-23组成的简图。通过非特异的互补核苷酸(水平线)之间的互补性的Watson-Crick碱基对,DNA酶(下面的链)和RNA底物(上面的链)结合在一起。箭头指示出的是切割发生的位置,其中R=A或G,Y=U或C。
图11给出的是DNA酶10-23在多次转换情况下的催化活性,具体描述见实施例6。用反应起初10%的阶段测定反应初速度,其中使用的底物浓度是固定的(0.004nM),底物浓度是变化的(0.02~4nM)。用体外转录制备与HIV-1gag/聚合酶mRNA对应的17聚体RNA底物。反应条件2mM MgCl2、150mM NaCl、pH7.5、37℃。给出了来自两个独立实验的数据,这些数据满足Michaelis-Menten方程v=kcat[E]/(Km+[S])。
图12A和12B包括的两个板面中给出了本发明的DNA酶中底物结合臂长度变化的影响,具体描述见实施例6。如图所示,对于第一和第二底物结合区域(臂)来说,互补的底物结合区域的长度范围为4~13个核苷酸,测定催化活性并用kcat(min-1)和Km(纳摩尔[nM])表示出来。
图13给出了对DNA酶的核苷酸残基进行修饰的影响,具体描述见实施例6。37℃下将DNA温育在含10%热灭活后的胎牛血清的RPMI-1640培养基中,比较未经修饰的DNA(空心圆)、倒转的胸腺嘧啶(实心圆)、在每条臂上各有5个2’-O-甲基(空心正方形)、核心中含5个P=S残基(空心三角形)以及在每条臂上各有3个P=S残基(实心三角形)。
详述A.定义如此处使用的一样,“脱氧核酶”一词用于描述一种具有酶功能的含DNA核酸。在本说明书中,尽管具有内切脱氧核糖核酸酶活性的脱氧核酶是特别优选的,但是“脱氧核酶”一词可以包括内切核糖核酸酶和内切脱氧核糖核酸酶。此处能够和脱氧核酶互换使用的其他词是“酶促DNA分子”、“DNAzyme”或“催化活性DNA分子”,无论这些分子是通过合成制备的或者是来自有机体或其他来源,它们都应该被理解为包括其酶促活性部分。
“酶促分子”一词还包括在底物结合区与特定寡核苷酸目标或底物形成互补的DNA分子;这样的分子还具有酶促活性,这种活性有助于特异地切割寡核苷酸底物。在另一种形式中阐明的,酶促分子能以分子间的方式切割寡核苷酸底物。这种互补特性能使酶促DNA分子与底物寡核苷酸充分地杂交,从而在底物上发生分子间的切割。尽管100%的互补是优选的,但是75-100%的互补也是有效的,也是本发明所期望的。
替代地,本发明的酶促DNA分子可以描述为具有核酸酶或核糖核酸酶活性。此处这些词都可以互换使用。
尽管根据本发明的酶促DNA分子是特别优选的一类酶促活性分子,但是此处使用的“酶促核酸”一词可以包括酶促RNA分子或酶促DNA分子、酶促RNA-DNA聚合体、及其具有酶促活性的部分或衍生物。
此处使用的“内切脱氧核糖核酸酶”一词是指一种能切割主要由DNA组成的底物的酶。此处使用的“内切核糖核酸酶”一词是指一种能切割主要由RNA组成的底物的酶。
尽管知道罕见的A、T、C和G(以及U)的类似物可能有时会参与碱基的配对,但是正如此处使用的那样,“碱基对”(bp)一词通常是用来描述腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)之间的配对,或者胞嘧啶(C)和鸟嘌呤(G)之间的配对。当DNA或RNA采取双链构型时,通常配对的核苷酸在此也可以被称为“互补碱基对”。
通常“互补核苷酸序列”是指,DNA或RNA的单链分子或节段中的一段核苷酸序列与另一条寡核苷酸单链的序列充分地互补从而通过氢键特异性地杂合在一起。
“核苷酸”通常是指DNA或RNA的单体单元,它由一个糖残基(sugarmoiety)(戊糖)、一个磷酸基和一个含氮杂环碱基组成。碱基通过糖苷碳原子(戊糖的1’碳原子)与糖残基连接在一起,碱基和糖的结合体称为“核苷”。当核苷中含有一个结合到戊糖的3’或5’位上的磷酸基时,该核苷就成为核苷酸。一段任意连接的核苷酸序列在此典型地称为“碱基序列”或“核苷酸序列”,以及其他的同义词,在此用一个通式来表示,除另有特别说明外,该通式按照从左到右的方向,即习惯上的从5’端到3’端的方向。
“核苷酸类似物”通常是指结构上有别于A、T、C、G或U但相似程度足以在核酸分子中替代这些常见核苷酸的嘌呤或嘧啶。在此使用,“核苷酸类似物”包括变化的碱基、不同的或“罕见”的糖(即除“常见”戊糖之外的的糖),或二者的结合。下面C.部分中给出了一系列碱基改变了的典型类似物。
“寡核苷酸或多核苷酸”通常是指单链或双链的核苷酸聚合体。在此使用,“寡核苷酸”及其同义词包括所有的核酸。典型意义上,“寡核苷酸”是指一个由线型的核糖核酸链组成的核酸分子。确切的大小取决于许多的因素,接下来还取决于最终的使用条件,这一点是本领域技术人员所熟知的。
在此使用的,“生理条件”是指模仿哺乳动物体内,特别是人体内的条件建立的反应条件。温度、阳离子的获得程度以及pH范围等变量的变化情况会在下面做更详细地描述,“生理条件”通常包括35~40℃的温度范围,特别优选37℃;7.0~8.0的pH范围,特别优选7.5;以及进一步包括阳离子的获得程度,优选二价阳离子和/或单价阳离子,浓度为约2~15mM的Mg2+以及0~1.0mM的Na+是特别优选的。任选地,此处使用的“生理条件”可以包括游离的核苷辅因子的存在。如上所述,优选的条件将在下面做更详细地描述。
B.酶促DNA分子在各种实施方案中,本发明的酶促DNA分子中可能结合有包括添加、缺失或取代在内的一种或多种修饰或突变。在替代的技术方案中,可以用产生随机或特异突变或修饰的方法来产生这些突变或修饰。例如,这些突变可以是改变长度,或改变核苷酸序列、环、间区或识别序列(或结构域)。一个具有催化活性的酶促DNA分子中的一个或多个突变可以与第二个具有催化活性的酶促DNA分子中的突变结合从而产生一种把这两个分子的突变都包括在内的新的酶促DNA分子。
在其他的优选实施方案中,可以利用为本领域技术人员所熟知的各种方法将随机突变引入到本发明的酶促DNA分子中。例如,Cadwell等人在PCR方法及应用,228-33,1992一书中描述的方法特别优选用于本发明,下面的实施例中对其作了一些修改。(还参见Cadwell,et al,PCR方法及应用,3(Suppl.)S136-S140,1994)根据这种修饰后的PCR方法,可以将随机点突变导入克隆基因中。
例如,上述方法已经用于诱变核酶的编码基因,序列分析测定的结果表明每个位置上的突变机率为0.66%±0.13%(置信区间为95%),并且在碱基取代的类型上未发现任何强偏嗜。这使得可以在本发明的酶促DNA分子的任一位置上导入随机突变。
Joyce等人在Nucleic Acids Res.,17711-722,1989一文中公开了另一种导入特定或随机突变的方法。后面的这种方法包括切割双链DNA中的模板(编码)链,重构该模板链的同时将诱变的寡核苷酸包括进来,然后转录这种部分错配的模板。这使得通过在选定位置包括含有已知或随机核苷酸的寡核苷酸,从而在所述分子中的任一位置上导入特定的或随机的突变。
根据分子的类型和功能的不同,本发明的酶促DNA分子可以相应地具有不同的长度和折叠类型。例如,尽管为了避免因分子本身太长或难以操作使其治疗作用受到限制,而优选长度不超过250个核苷酸,但是酶促DNA分子可以长约15~约400个或更多个核苷酸。在各种优选的实施方案中,本发明的酶促DNA分子至少长约20个核苷酸,有效的分子长度可能超过100个核苷酸,但优选的分子的长度通常不多于100个核苷酸。
在各种治疗应用中,本发明的酶促DNA分子包括脱氧核酶的酶促活性部分。在各种实施方案中,本发明的酶促DNA分子优选包括不多于200个核苷酸。在其他实施方案中,本发明的脱氧核酶包括不超过100个核苷酸。还有其他优选的实施方案中,本发明的脱氧核酶的长度为约20~75个核苷酸,更优选约20~65个核苷酸。其他优选的酶促DNA分子长约10~50个核苷酸。
其他应用中,酶促DNA分子可能采取与“锤头”核酶类似的构型。这种酶促DNA分子的长度优选不超过约75~100个核苷酸,特别优选长约20~50个核苷酸。
通常,如果一个人要合成一个用于本发明的分子,那么酶促核酸分子越长,则合成的难度越大。本领域的技术人员当然能体会到此类合成的限制。然而无论怎样,这种更长的分子仍然属于本发明的范围之内。
还应该理解的是,本发明的酶促DNA分子可以包括脱氧核酶的酶促活性部分或者可以包括一种有一处或多处突变的脱氧核酶,例如,带有一段或多段碱基配对序列,或者间隔区缺失或经过修饰,只要这些缺失、添加或修饰不会反过来影响该分子的酶促活性。
典型地,本发明的酶促DNA分子的识别结构域包括位于催化结构域两侧的两段核酸序列,并且典型地包含一段至少约3~约30个碱基的序列,优选约6~约15个碱基,这些碱基能够与底物核酸中的一段互补的碱基杂交,这就赋予了酶促DNA分子高度的序列特异性。通过众所周知的方法对识别位点进行修饰或突变可以改变酶促核酸分子的序列特异性。(见Joyce et al,Nucleic Acids Res.,17711-712,1989.)本发明的酶促核酸分子还包括具有变化了的识别位点或识别结构域的分子。在各种实施方案中,这些变化了的识别结构域赋予包括这种识别结构域的酶促核酸分子独一无二的序列特异性。识别结构域中的确切核苷酸可以决定发生切割的碱基序列。底物核酸的切割发生在识别结构域中。这种切割在底物切割序列上留下一个2’、3’或2’,3’-环状磷酸基,在最初紧靠原始底物中底物切割序列3’端的核苷酸上留下一个5’羟基。通过改变出现在识别序列(内部指导序列)中的碱基,可以将切割重新定向到一个所选择的位点上。见Murphy et al,Proc.Natl.Acad.Sci.USA,869218-9222,1989。
而且,加入多胺有助于促进酶促DNA分子和它的底物之间的识别和结合。有效的多胺的实例包括亚精胺、腐胺或精胺。在具体实施方案中,亚精胺的有效浓度约为1mM,但是约0.1mM~约10mM浓度范围也是有作用的。
在各种替代的实施方案中,本发明的酶促DNA分子具有增强了的或优化了的切割核酸底物能力,优选切割RNA底物的能力。正如本领域技术人员理解的那样,通常,酶催化反应的速度随底物和酶浓度的改变而改变,在高的底物或酶浓度时这种速度达到水平不再升高。把这些效应考虑进去,就可以用下列定义该反应的术语来描述酶催化反应动力学。
在酶促DNA分子作用下,标记过的RNA底物的量会发生变化,用这种切割反应可以测定出本发明的酶促DNA分子的增强了的或优化了的切割RNA底物的能力。通常用催化速度(kcat)与米氏常数(KM)的比值定义切割底物的能力。符号kcat代表当底物达到一个饱和值的时候酶反应的最大速度。KM表示当酶反应速度达到最大反应速度一半时的底物浓度。
例如,本发明中KM和kcat值可以通过底物浓度[S]大于酶促DNA分子浓度[E]的实验来测定。对应于一定底物浓度范围的反应初速度可以从初始的直线阶段估算出来,该阶段通常为反应的前5%或更短部分。数据点通过最小二乘法都适合于下列方程给出的理论曲线v=-KM(v0/[S]+Vmax)。因此,用反应初速度v0和底物浓度[S]就能测定出kcat和KM。
在各种替代的实施方案中,本发明的酶促DNA分子具有增强了的或优化了的切割核酸底物的能力,优选切割RNA底物的能力。在优选实施方案中,酶促DNA分子的增强了的或优化了的切割RNA底物的能力表现出能使反应速度比未经催化的速度快10~109倍。在更优选实施方案中,本发明的酶促DNA分子能够以比原始反应类型快约103~107倍的速度切割RNA底物。在另一个更优选的实施方案中,增强了的或优化了的切割RNA底物的能力表现为反应速度比原始反应类型快104~106倍。本领域技术人员能体会到,酶促DNA分子的这种增强了的或优化了的切割核酸底物的能力会随着本发明体外进化法中的筛选限制(selectionconstraints)的变化而变化。
下面实施例1~3中进一步描述修饰本发明的脱氧核酶,其他酶促DNA分子以及核酸酶的各种优选方法。
C.核苷酸类似物如上所述,此处使用的“核苷酸类似物”一词通常是指结构上有别于A、T、C、G或U但相似程度足以在核酸分子中替代这些“正常”核苷酸的嘌呤或嘧啶。如此处使用的那样,“核苷酸类似物”包括改变了的碱基、不同的(或罕见的)糖、改变了的磷酸骨架或这些变体的任一组合。本发明中有用的核苷酸类似物的实例包括下表中列出的那些核苷酸类似物,列出的这些类似物中的大部分都属于37CFR§1.822的条件下认定的修饰后的碱基(在此引入作为参考)。
表1核苷酸类似物缩写 描述ac4c 4-乙酰胞苷chm5u5-(羧基羟基甲基)尿苷cm 2’-O-甲基胞苷cmnm5s2u 5-羧甲基氨甲基-2-硫尿苷d 二氢尿嘧啶核苷fm 2’-O-甲基假尿嘧啶核苷galq β,D-半乳糖基queosinegm 2’-O-甲基鸟苷I 次黄嘌呤核苷i6aN6-异戊烯腺苷mla1-甲基腺苷mlf1-甲基假尿嘧啶核苷mlg1-甲基鸟苷ml11-甲基次黄嘌呤苷m22g 2,2-二甲基鸟苷m2a2-甲基腺苷m2g2-甲基鸟苷m3c3-甲基胞苷m5c5-甲基胞苷m6aN6-甲基腺苷m7g7-甲基鸟苷mam5u 5-甲基氨甲基尿苷mam5s2u5-甲氧基氨甲基-2-硫尿核苷manq β,D-甘露糖基甲基尿苷mcm5s2u5-甲氧基羧基甲基尿苷mo5u 5-甲氧基尿苷ms2i6a 2-甲硫基-N6-异戊烯腺苷ms2t6a N-((9-β-D-呋喃核糖基-2-甲硫嘌呤-6-基)氨甲酰基)苏氨酸mt6a N-((9-β-D-呋喃核糖基嘌呤-6-基)N-甲基-氨甲酰基)苏氨酸mv 尿苷-5-氧乙酸甲酯o5u尿苷-5-氧乙酸(v)osyw wybutoxosinep 假尿苷q queosines2c2-巯基胞苷s2t5-甲基-2-硫尿核苷s2u2-硫尿核苷s4u4-硫尿核苷t 5-甲基尿苷t6aN-((9-β-D-呋喃核糖基嘌呤-6-基)氨甲酰基)苏氨酸tm 2’-O-甲基-5-甲基尿苷um 2’-O-甲基尿苷yw wybutosinex 3-(3-氨基-3-羧丙基)尿苷,(acp3)uaraU β,D-阿拉伯糖基araT β,D-阿拉伯糖基其他有用的类似物包括公开于国际申请WO92/20823中的类似物(该申请公开的内容在此引入作为参考)或者根据本发明公开的方法制备的类似物。根据本发明公开的内容,DeMesmaeker et al,Angew.Chem.Iht.Ed.Engl.,33226-229,1994;DeMesmaeker et al,Synlett 733-736(Oct.1993);Nielsen et al,Science,2541497-1500,1991;Idziak et al,和Tetrahedron Letters,345417-5420,1993这些文献中描述的类似物也是有用的,上述公开内容在此引入作为参考。
D.构建酶促DNA分子的方法本发明还提供了一种生产具有预定活性的核酸分子。在一个优选实施方案中,所述核酸分子是一个酶促DNA分子。在另一个实施方案中,所述活性是一种催化活性。
在一个实施方案中,本发明提供了合成随后能被“构建”成催化特定或预定反应的酶促DNA分子的方法。此处描述了合成制备酶促DNA分子的方法;见,例如,下面的实施例1~3。在其他实施方案中,可以将本发明的酶促DNA分子构建成能结合小分子或配体的形式,例如结合三磷酸腺苷(ATP)的形式(参见Sassanfar等,Nature,364550-553,1993。)。
在另一个实施方案中,本发明期望,一个酶促DNA分子群体经诱变处理产生一个突变酶促DNA分子的不同群体(替代地可以将其称为“脱氧核酶”或“DNAzymes”)。随后,将具有预期特性的酶促DNA分子从群体中筛选并且/或者分离出来,然后对其进行扩增。
替代地,可以通过改变酶促DNA分子识别结构域的长度来将突变导入酶促DNA分子中。酶促DNA分子的识别结构域与底物核酸序列中的互补碱基序列有关。改变识别结构域长度的方法是本领域的已知方法,包括PCR,例如;下面实施例中进一步描述了有用的技术。
改变酶促DNA分子识别结构域的长度可以对该酶促DNA分子的结合特异性产生预期的影响。例如,识别结构域长度的增加可以增强酶促DNA分子和底物中寡核苷酸的互补碱基序列之间的结合特异性,或者可以增强识别杂合底物中的特定序列的能力。另外,识别结构域长度的增加还可以增强该结构域结合底物的亲和力。在各种实施方案中,酶促DNA分子中的这些改变了的识别结构域能够增强该酶促DNA分子与其底物间结合的特异性和亲和力。
近来,引起注意的是一些寡核苷酸能结合具有互补序列的寡核苷酸之外的分子。这些寡核苷酸通常被称为“aptamers”。例如,Ellington等人描述的能结合各种有机颜料的RNA分子(Nature,346818-822,1990),Bock等人描述的结合人凝血酶的单链DNA分子(Nature,355564-566,1992)。同样,Jellinek等人描述了能够结合碱性成纤维细胞生长因子的RNA配体(Proc.Natl.Acad.Sci.USA,9011227-11231,1993)。因此,此处进一步期望,用本发明公开的方法可以构建本发明的具有催化活性的DNA酶使其表现出与多种典型的与aptamers相关的性能。
因此,本领域的技术人员应该理解,本发明的酶促DNA分子能够在任何一段核苷酸序列上被改变,例如识别结构域,通过此处公开的包括PCR和3SR(自动维持序列扩增见下面实施例1)的各种方法。例如,用包括附加核苷酸的引物能够在酶促DNA分子的5’端添加上附加的核苷酸。
通过使用定点诱变等方法,还可以更随机的方式制备或构建本发明的酶促DNA分子。例如,基本上可以按照Morinaga et al,Biotechnology,2636,1984,中描述的方法进行定点诱变,该方法按照本发明的描述改进后可以应用于脱氧核酶。下面实施例中将进一步描述用于构建酶促DNA分子的方法。
在一个公开的实施方案中,本发明的酶促DNA分子包括一个保守的核心及其两侧的两个底物结合(或识别)结构域或序列,这些结构域或序列和底物之间通过碱基配对相互作用。在各种实施方案中,保守核心包括一个或多个保守结构域或序列。在另一个变化中,酶促DNA分子进一步包括位于参与碱基配对的区域(或序列)之间的“间隔”区(序列)。还有另一个变化中,保守核心被一个或多个保守程度小得多的可变或“间隔”核苷酸在各种间隔上“间断”开。
在各种实施方案中,酶促DNA分子的群体由至少两种不同类型的脱氧核酶分子组成。例如,在一个变化中,这些分子具有不同的序列。在另一个变化中,这些脱氧核酶是一种具有一段能限定出识别结构域的核酸序列的核酸分子,限定出的结构域与该核苷酸序列5’末端相邻或相靠。在各种替代方案中,本发明的酶促DNA分子进一步包括一个或多个位于识别结构域3’端的间隔区,一个或多个位于识别结构域和/或间隔区3’端的环。在另一些变化中,本发明的脱氧核酶可以包括一个或多个能与同一分子的其他区域杂交的区域。本发明其他部分描述了根据本发明公开的方法生产的具有其他特征的酶促DNA分子。
其他实施方案中,诱变条件包括将特定的或随机的核苷酸替代物导入到酶促DNA分子中的条件。典型的诱变条件的实例包括在本说明书中其他部分描述的条件以及Joyce et al,Nucl.Acids.Res.,17711-722,1989;Joyce,Gene,8283-87,1989;和Beaudry et al,Science,257635-41,1992这些文献中描述的方法。
还有其他实施方案中,本发明的突变酶促核酸分子的变化群体中包括至少两个核苷酸序列不完全相同的核酸分子。在其他变化中,然后根据完成预定活性的能力,将具有预定活性的酶促DNA分子或其他酶促核酸从上述的变化群体中筛选出来。在各种实施方案中,预定活性包括,但不限于,增强了的催化活性、减小了的KM、增强了的底物结合能力、改变了的底物特异性等。
可以被认为是酶各方面性能的其他参数包括催化活性或催化能力、底物结合能力、酶转换速度、酶对反馈机制的敏感性等。在某些情况下,底物特异性可以被当作是酶性能的一个方面,具体地说是,在酶能识别和结合两个或多个竞争性底物的情况下,其中的每个竞争性底物都可以影响该酶与其他底物相互作用的性能。
此处使用的底物特异性可以指本发明的酶促核酸分子对一种具体底物的特异性,例如只包括核糖核苷酸的底物、只包括脱氧核糖核苷酸的底物或者二者的组合。底物分子也可以包括某些核苷酸类似物。在各种实施方案中,优选地,本发明的酶促核酸分子可以结合到杂合或非杂合底物的特定区域上。
此处确定的术语或参数“底物特异性”也可以包括序列特异性;即本发明的酶促核酸分子可以“识别”和结合到一种具有一段特定核酸序列的核酸底物上。例如,如果本发明的酶促核酸分子的底物识别结构域只结合具有一连串的一个或两个核糖核苷酸(例如,rA)的底物分子,那么不识别或结合缺乏这些序列的核酸底物分子。
关于筛选的方法,在各种实施方案中,筛选包括任何一种用物理学手段从突变酶促核酸的变化群体中把具有预定活性的突变酶促核酸分离出来。通常,筛选包括根据大小进行分离,根据有无催化活性进行分离,或者通过突变核酸与另一种核酸、多肽或或其他溶解于溶液中或吸附在固体基质上的分子的杂交来进行分离。
在各种实施方案中,所述预定活性能将其本身的效力赋予具有这种活性的突变酶促核酸。例如,预定活性可以是酶促DNA分子活性,这种活性能使具有这种活性的突变酶促核酸与其底物通过共价键连接在一起。然后通过共价键的效力将该突变酶促核酸筛选出来。
其他实施方案中,筛选具有预定活性的突变酶促核酸包括突变酶促核酸的扩增(见Joyce,Gene,8283-87,1989;Beaudry et al,Science,257635-41,1992)。实施例部分将描述对具有预定特性或活性的酶促核酸分子的筛选。
E.组合物本发明还提供了含有一种或多种类型或群体的本发明的酶促DNA分子的组合物;例如,不同类型或群体可以识别并切割不同的核苷酸序列。组合物可以进一步包括一种含核糖核酸的底物。如此处讨论的那样,根据本发明组合物可以进一步包括铅离子、镁离子或其他二价或单价阳离子。
优选地,酶促DNA分子的浓度为约0.05μM~约2μM。典型地,酶促DNA分子与底物之间的浓度比为约1∶5~约1∶50。更优选地,酶促DNA分子存在于该组合物中的浓度为约0.1μM~约1μM。还有更优选地,组合物中含酶促DNA分子的浓度为约0.1μM~约0.5μM。优选地,组合物中底物浓度为约0.5μM~约1000μM。
本领域技术人员应该理解,含核酸底物有多种来源,其中包括自然发生和合成途径。合适的底物来源包括,但不限于,各种病毒和反转录病毒,包括HIV-1、HIV-2、HTLV-I和HTLV-II。
其他合适的底物包括,但不限于,包含下列病毒的或由下列病毒产生的病毒剂和反转录病毒剂小RNA病毒、嗜肝病毒科病毒(例如,HBV、HCV)、乳头瘤病毒(例如,HPV)、伽马疱疹病毒科病毒(例如,EB病毒)、淋巴隐病毒(lymphocryptoviruses)、白血病病毒(例如,HTLV-I和HTLV-II)、黄病毒、披膜病毒、疱疹病毒(包括阿尔法疱疹病毒和贝塔疱疹病毒)、巨细胞病毒(CMV)、流感病毒以及引起免疫缺陷病和综合征的病毒和反转录病毒(例如,HIV-1和HIV-2)。此外,合适的底物包括感染非人灵长类动物和其他动物的病毒或反转录病毒,所述病毒包括但不限于,猿免疫缺陷病毒、猫免疫缺陷病毒以及牛白血病病毒。
如上所述,镁离子、铅离子或另外合适的单价或二价阳离子也可以约1~100mM的浓度范围存在于组合物中。更优选地,组合物中预定的离子浓度为约2mM~50mM,具体优选的浓度为约5mM。本领域技术人员会理解,离子浓度只受下列两种因素的限制离子来源(例如镁离子)在水溶液中的溶解极限以及保证酶促DNA分子以活性构型存在于该组合物中的愿望。
本发明还提供了包括本发明的酶促DNA分子、脱氧核糖核苷酸-核糖核苷酸杂合分子以及以上述浓度存在的镁离子或铅离子的组合物。如上所述,可以用其他单价或二价离子(例如,Ca2+)来取代镁离子。
本发明还提供了含有本发明的酶促DNA分子、含核酸底物(例如,RNA)以及预定浓度大于1毫摩尔的离子,其中所述底物的长度大于所述酶促DNA分子上的识别结构域。
在一个变化中,组合物包括酶促DNA分子-底物复合物,其中酶促DNA分子与其底物之间的碱基对是连续的。在另一个实施方案中,酶促DNA分子与其底物之间的碱基对被一个或多个非互补性的碱基对间断。在各种替代的实施方案中,本发明的组合物可以进一步包括单价阳离子、二价阳离子或二者的组合。
在另一个变化中,本发明的酶促DNA分子在二价阳离子存在或缺乏的条件下都能有效地发挥作用。在一个变化中,有二价阳离子存在,包括Pb2+、Mg2+、Mn2+、Zn2+或ca2+。替代地,本发明的酶促DNA分子在单价阳离子存在或缺乏的条件下都能有效地发挥作用。如此处公开的那样,可以预见浓度与此处公开的Pb2+或Mg2+近似的单价或二价阳离子都是有用的。
任选地,单价阳离子还可以与二价阳离子同时存在,或者作为二价阳离子的“替换物”存在。例如,钠(Na+)或钾(K+)等单价阳离子可以游离态离子或以NaCl或KCl等可解离化合物的形式存在。
在一个实施方案中,组合物中单价阳离子的浓度为0~1.0M。在另一个实施方案中,单价阳离子的浓度范围为约0~200mM。在其他实施方案中,单价阳离子的浓度范围为约1~100mM。替代地,单价阳离子浓度范围为约2mM~50mM。还有其他的实施方案中,浓度范围为约2mM~25mM。
F.使用酶促DNA分子的方法如此处描述的那样,使用酶促DNA分子的方法覆盖了现有的酶和/或反义寡聚核苷酸的本领域众所周知的多种不同用途。正如上述讨论的那样,能切割连接相邻核酸的键(例如,磷酸二酯键)的分子具有包括多种不同应用的大量用途。例如,具有所公开的性能、结构和/或功能的酶促DNA分子可以用于药用和医用产品(例如,用于伤口清创术、血凝块的溶解等),以及家居用品(例如,洗涤剂、牙齿清洁用品、肉致嫩剂)。为了灭活体外和体内的RNA等目标核酸序列。本发明所公开的化合物、组合物以及方法的工业用途也为本发明提供,并完全落在本发明的范围之内。
本发明还描述了用于切割任何单链、环状、部分双链或全长双链核酸的方法;这些方法中的多数都使用了本发明的新型酶促活性核酸分子。在各种实施方案中,底物的单链核酸节段或单链核酸部分包括DNA、修饰后的DNA、RNA、修饰后的RNA或其组合。优选地,核酸底物只需在靠近底物切割序列处为单链形式以便本发明的酶促核酸分子能通过该酶识别序列杂交到底物切割序列上。
能被本发明方法切割的核酸底物可以是化学合成的或酶促产生的,或者它可以是从下列来源分离得到的噬菌体、病毒、包括动物细胞、植物细胞、酵母细胞和细菌细胞等在内的原核细胞或者真核细胞。化学合成的单链或双链核酸可以从多种来源购买获得,包括但不限于,Research Genetics(Huntsville,AL)。
还可以根据厂商的提供的方法,利用应用生物系统(Foster City,CA)寡核苷酸合成仪来合成RNA底物。单链噬菌体也是核酸底物的一种来源。(见Messing et al,Proc.Natl.Acad.Sci.USA,743642~3646,1977,以及Yanisch-Perron et al,Gene,33103~119,1985)。含单链噬菌体的细菌细胞也是合适单链核酸底物的一种方便来源。
下列任一种RNA病毒提供都可以提供能被本发明的方法切割的单链RNA小RNA病毒、披膜病毒、正粘病毒、副粘病毒、弹状病毒、冠状病毒、沙粒病毒或反转录病毒等。如上所述,很多种原核细胞或真核细胞也可以是合适核酸底物的极好来源。
本发明的方法可以用于单链核酸或者环状核酸或双链核酸的单链部分,含有这些结构的细胞包括真核细胞、原核细胞、植物细胞、动物细胞、酵母细胞或细菌细胞。这些情况下,本发明的酶促核酸分子(例如,酶促DNA分子或脱氧核酶)可以发挥抗病毒剂或基因表达调节因子的作用。下面将进一步描述本发明的酶促DNA分子在这些用途中的实例。
本发明的多数方法中,单链核酸的切割发生在预先选定的碱基序列的3’端。典型地,该预定的碱基序列或底物切割序列包括1~10个核苷酸。在其他优选实施方案中,本发明的酶促DNA分子能识别切割位点上游或者上游及下游的核苷酸。在各种实施方案中,酶促DNA分子能识别切割位点上游的约2~10个核苷酸;在其他实施方案中,酶促DNA分子能识别识别位点上游的约2~10个核苷酸以及下游的约2~10个核苷酸。其他优选实施方案提供了一种能识别长度达到约30个核苷酸的核酸序列的酶促DNA分子,还更优选长度达到约20个核苷酸的核酸序列。
本发明公开的方法通过改变酶促DNA分子识别结构域的核苷酸序列,能使切割发生在任意的核苷酸序列上。这使得选定位置不含限制性内切酶位点的单链核酸也可以被切割。
通过在合适切割位点处的点特异性水解,可以把本发明的酶促DNA分子同单链核酸底物的任一部分中分离开,而底物仍保留有与这种酶促DNA分子结合的能力。把酶促DNA分子同底物(或“切割产物”)分离从而使得该酶促DNA分子能完成另外的切割反应。
通常,在适合核酸切割的条件下,优选在生理条件下,用有效量的本发明的酶促DNA分子处理核酸底物。如果核酸底物中包含DNA,那么切割条件可能包括以约2~10mM浓度存在的二价阳离子。
酶促DNA分子的有效量为切割单链核酸中预定碱基序列所需的量。优选地,酶促DNA分子以DNA分子与底物切割位点之间的摩尔比为1~20的量存在。在使用的具体核酸切割条件下,这个比例可以根据处理的长度和具体酶促DNA分子的效率调整。
因此,在一个优选实施方案中,处理过程典型地包括混合,在水溶液中,把含RNA的底物和酶混合形成切割混合物,然后把形成的切割混合物在RNA切割条件下保持足够长一段时间使得能够在RNA中的任一段预定的核苷酸序列上切割RNA底物。在各种的实施方案中,需要提供一种来源的离子——即单价或二价阳离子或二者的组合。
在本发明的一个实施方案中,酶促DNA分子切割单链核酸所需的时间已经被预先选定。时间的长短为1分钟到24小时,并可以根据反应物浓度和反应温度改变。通常,这段时间为约10分钟到2小时以使该酶促DNA分子可以在任意预定的核苷酸序列上切割单链核酸。
本发明进一步提供了核酸切割条件包括一种来源的浓度约2~100mM的二价阳离子(例如,PbOAc)。典型地,核酸切割条件包括浓度为约2mM~10mM二价阳离子,具体优选浓度约5mM。
通过测定在给定的阳离子浓度时被切割的单链核酸的量,能够测定出核酸切割条件应包括的最佳阳离子浓度。本领域技术人员应该理解,该最佳阳离子浓度可以根据使用的具体酶促DNA分子改变。
本发明进一步提供了核酸切割包括一种约6.0~9.0的pH值。一个优选实施方案中,pH值范围为约pH6.5~pH8.0。在另一个优选的实施方案中,pH值模拟生理条件,即pH值为约7.0~7.8,具体优选pH值为约7.5。
本领域技术人员可以理解的是,只要用于核酸切割的pH值能使酶促DNA分子保持活性构型,本发明的方法可以在一个宽的pH范围实施。通过在预定核苷酸序列切割单链核酸的能力,可以容易地检测到具有活性构型的酶促DNA分子。
在各种实施方案中,核酸切割条件还包括一个变化的温度范围。如上所述,尽管此处也提供了工业应用的温度范围,但是特别优选与生理条件一致的温度范围。在一个实施方案中,温度范围为约15℃~约60℃。另一个变化中,核酸切割条件包括约30℃~约56℃的浓度范围。还有另一个变化中,核酸切割条件包括约35℃~约50℃的浓度范围。在一个优选的实施方案中,核酸切割条件包括约37℃~约42℃的浓度范围。与核酸切割条件一致的温度范围只受期望的切割速度和该具体温度下该种具体酶促DNA分子的稳定性的限制。
在各种方法中,本发明提供了包括多胺存在的核酸切割条件。可用于实施本发明的多胺包括亚精胺、腐胺或精胺等。在一个变化中,多胺的浓度为约0.01mM~约10mM。在另一个变化中,多胺的浓度为约1mM~约10mM。核酸切割条件还可以包括以约2mM~约5mM存在的多胺。在各种优选实施方案中,多胺是亚精胺。
G.载体本发明的特征还在于表达载体,其中包含位于该载体中编码本发明的酶促DNA分子的一个核酸节段,优选地存在方式为能使该酶促DNA分子在目标细胞(例如,植物细胞或动物细胞)中表达。
因此,通常,根据本发明的载体优选包括质粒、粘粒、噬菌粒、病毒或噬菌体载体。优选,合适的载体包括单链DNA(ssDNA)——例如,环状噬菌粒ssDNA。还应该被理解到的是根据本发明有用的载体不需是环状的。
在一个变化中,优选地,在另外的酶促DNA分子编码序列的两侧都提供核酸序列,该序列可以被第一酶促DNA分子识别。该间插序列或旁侧序列优选包括至少1个核苷酸;更优选,间插序列或旁侧序列长度为约2~20个核苷酸,具体优选长度约5~10个核苷酸的序列。
根据本发明添加一个聚核苷酸尾,可用于保护酶促DNA分子的3’末端。这可以通过使用末端转移酶结合一个多聚体序列来提供。
根据本发明的一个载体包括两个或多个酶促DNA分子。在一个实施方案中,第一酶促DNA分子有分子内切割活性,能识别和切割核苷酸序列使其释放出其他酶促DNA序列;即能够从该载体中“释放”出其他酶促DNA分子。例如,优选构建这样一种载体以便当第一酶促DNA分子被表达时,该第一分子能切割编码第二酶促DNA分子、第三酶促DNA分子、依此类推的另外核苷酸序列的旁侧序列。假定说,第一酶促DNA分子(即,“释放”分子)能以分子内的方式切割寡核苷酸序列,另外的(例如,第二、第三、等等)酶促DNA分子(即“被释放”分子)不需要具备与“释放”分子相同的特征。例如,在一个实施方案中,“被释放”(即第二、第三、等等)酶促DNA分子能切割特定的RNA序列,第一(“释放”)酶促DNA分子具有的核酸酶活性使得它能够解放出那些“被释放”分子。在另一个实施方案中,“被释放”酶促DNA分子具有切割酰胺键活性,而第一(“释放”)酶促DNA分子具有核酸酶活性。
替代地,第一酶促DNA分子可以与第二(及第三、第四等)酶促DNA分子分别用一个单独的载体编码,并具有分子间切割活性。如此处所述,第一酶促DNA分子可能是自身切割酶促DNA分子(例如,脱氧核酶),第二酶促DNA分子可以是任一期望类型的酶促DNA分子。当一个载体被用来表达来自这些核酸序列的DNA时,在合适的条件下该DNA能切割每个旁侧区域,从而释放出一个或多个拷贝的第二酶促DNA分子。如果需要,也可以将几个不同的第二酶促DNA分子置于同一个细胞或携载体中生产不同的脱氧核酶。还提供了,任一个或多个载体包括以“释放”和“被释放”酶促核酸分子的任一组合方式存在的一个或多个核酶或脱氧核酶,只要这种组合可以达到预期的结果释放出能切割预定核酸序列的酶促核酸分子。
本发明还提供了分离和纯化酶促DNA分子的方法。除了此处描述的方法以外,也可以采用本领域技术人员知道的各种纯化方法(例如,使用HPLC的方法)和层析分离技术。参见,例如,公开的国际申请WO93/23569中描述的方法,本申请的公开的内容在此引入作为参考。
应该理解的是此处描述的实施方案的各种结合都被包括在本发明的范围内。从上述的描述、下面的实施例和权利要求书中可以清楚地得出本发明的其他特征和优点。
实施例下面实施例是用来说明,而并非限制本发明的。
1.酶促DNA分子的体外进化综述体外的筛选和分离技术使得能够在对新的催化剂的组成和结构无任何先验的了解时就能够分离到它们。用这些方法可以得到具有新的催化特性的RNA酶。例如,已经从tRNAPhe分子的一个随机库中得出了在铅离子存在的条件下具有自动切割功能的核酶(Pan et al,Biochemistry,313887-3895,1992)。已经分离到的第I类核酶突变体能切割DNA(Beaudry et al,Science,257635-641,1992)或者具有改变了的金属离子依赖性(Lehman et al,Nature,361182-185,1993)。从一个随机RNA序列库开始,已经得到能催化一种聚合酶样反应的分子(Bartel et al,Science,2611411-1418,1993)。本实施例中,描述了体外进化方法中通过改变选择性的限制精炼被进化的酶的特异催化性能。
达尔文进化论要求重复操作3个过程(a)遗传突变体的导入;(b)根据适应标准选择个体;以及(c)扩增被选择的个体。这些过程都能够在体外实现(Joyce,Gene,8283,1989)。基因诱变可以通过化学修饰、随机诱变寡脱氧核苷酸的引入、或聚合酶的不精确拷贝来实现。(参见Cadwell et al,PCR方法和应用,228-33,1992;Cadwellet al,PCR方法和应用,3(增补)S136-S140,1994;Chu et al,Virology,98168,1979;Shortle et al,Meth.Enzymol.,100457,1983;Myerset al,Science,229242,1985;Matteucci et al,Nucleic AcidsRes.,113113,1983;Wells et al,Gene,34315,1985;Mcneilet al,Mol.Cell.Biol.,53545,1985;Hutchison et al,Proc.Natl.Acad.Sci.USA,83710,1986;Derbyshire et al,Gene,46145,1986;Zakour et al,Nature,295708,1982;Lehtovaara etal,Protein Eng.,263,1988;Leung et al,Techique,111,1989;Zhouet al,Nucl.Acids Res.,196052,1991)。
这些基因产物可以被筛选,例如,通过其结合一个配体或完成一个化学反应的能力来筛选。(见,例如,Joyce,id.,1989;Robertson etal,Nature,344467,1990;Tuerk et al,Science,249505,1990)。与这些基因产物对应的基因可以通过交互引物(reciprocal primer)方法来扩增,例如通过聚合酶链反应(PCR)。(见Saiki et al,Science,2301350-54,1985;Saiki et al,Science,239487-491,1988)。
替代地,可以用自动维持序列复制(3SR)进行核酸扩增。(见Guatelli et al,proc.Natl.Acad.Sci USA,871874,1990,该文献的内容在此引入作为参考。)根据3SR方法,可以用以下3种反转录病毒不可缺少的酶在等温条件下体外指数扩增(复制)目标核酸序列(1)反转录酶,(2)核糖核酸酶H,以及(3)DNA依赖性的RNA聚合酶。通过模拟反转录病毒利用cDNA中间体复制RNA的策略,该反应积聚了初始目标的cDNA拷贝和RNA拷贝。
总而言之,如果要使一种酶促DNA分子群体进化,可以用一系列连续的反转录和转录反应通过cDNA中间体复制RNA目标序列。这种设计的关键因素有(a)寡聚核苷酸不但对目标具有特异性,而且含有编码T7RNA聚合酶结合位点的5,突出端,因此得到的这些cDNAs是活性转录模板;(b)由于核糖核酸酶H对中间的RNA-DNA杂合体中的RNA模板的降解,因此可以完成cDNA两条链的合成从而实现cDNA的合成;以及(c)反应产物(cDNA和RNA)可以作为随后步骤的模板,从而保证了指数复制。
如在这些实施例中公开的那样,如果涉及酶促DNA分子,这种设计的各种关键因素会有所不同。例如,(1)寡聚核苷酸对目标具有特异性,并优选以某种方式标记过——例如,通过生物素化——所以得到的活性模板链容易识别;以及(2)优选使用的体外筛选方法取决于最有利的释放机制。
实现达尔文体外进化的一个主要困难是需要将与基因组有关的突变和扩增同与表型相关的筛选有机地结合在一起。在使用核酸酶时,该酶的基因型和表型都体现在同一分子中,从而简化了该任务。
A.促DNA分子的设计众所周知,单链DNA能够采取令人感兴趣的三级结构。例如,“tDNA”的结构与相应的tRNA的结构非常相似。(参见Paquette et al,Eur.J.Biochem.,189259-265,1990)。而且,将锤头核酶中的35个核糖核苷酸取代多达31个后,而仍能至少保持一些催化活性,这一点已经能做到。(见Perreault et al,Nature,344565-567,1990;Williams et al,proc.Natl.Acad.Sci.USA,89918-921,1992;Yanget al,Biochemistry,315005-5009,1992)。
已经将体外筛选技术应用到随机序列DNA的大型群体,使得与目标配体以高度亲和活力结合的特异性DNA“aptamer”能够得以回收(Bocket al,Nature,355564-566,1992;Ellington et al Nature,355850-852,1992;Wyatt et al,Proc,Natl.Acad.Sci.USA,911356-1360,1994)。近来,有两个组进行了aptamer的第一NMR结构测定,15mer DNA形成了一种G-四合体结构,并能以高度亲和力结合凝血酶蛋白(Wang et al,Biochemistry,321899-1904,1993;Macaya etal,Proc.Natl.Acad.Sci.USA,903745-3749,1993)。X-射线晶体学分析确证了这些发现(Padmanabhan et al,J.Biol.Chem.,26817651-17654,1993)。
能够以高度的亲和力和特异性与底物分子结合是一种好的酶的必备条件。此外,酶还必须能利用本身的或辅因子中的位置恰当的(well-positioned)的官能团加速一种特异性的化学转化。而且,该酶还必须在反应过程中保持不变,并能实现催化转换。另外的一个要求是,酶应该是一种含有多个亚单位的信息大分子,这些亚单位的特异性排列方式决定催化活性。虽然这些标准在语义背景和化学背景两个方面都还存在着争议,但是可以用它们来区分化学速度加快的现象,这些现象包括从单一溶剂的影响到限制底物扩散时生物酶的作用。(Albery et al,Biochemistry,155631-5640,1976)。
如下面更详细描述的那样,我们努力发展了一种通用的方法,该方法能从随机序列开始,快速地获得DNA催化剂和DNA酶。作为初始目标,我们选择了一种我们认为DNA能够很好完成的反应在二价金属辅因子的帮助下,水解切割RNA磷酸二酯键。这与被各种包括锤头状和发夹状基元的自然生成的RNA酶催化的反应相同。(见,例如,Forster et al,Cell,49211-220,1987;Uhlenbeck,Nature,328596-600,1987;Hampel et al,Biochemistry,284929-4933,1989)。
近来表明从tRNA分子的随机文库开始,可以得到Pb2+依赖性核酶,这种酶在中性pH值条件下具有位点特异性磷酸酯酶活性(Pan et al,Biochemistry,313887-3895,1992;Pan et al,Nature,358560-563,1992)。这与酵母tRNAPhe的随机自身切割反应类似(Dirheimer et al,Biochemie,54127-144,1972),这种随机反应取决于Pb2+在tRNA的特定位点上的配位作用。(见Rubin et al,J.Biomol.Struct.Dgn.,1639-646,1983Brown et al,Biochemistry,244785-4801,1985)。
如此处公开的那样,我们的目标包括发展能在特定的RNA磷酸酯上实施Pb2+依赖性切割的DNAs,该磷酸酯最初存在于与这种DNA 5’末端相连的短的前导序列中,最后位于一个单独的分子内,该分子能被以具有快速催化反转特点的分子间方式切割。如下面所述,这些目标已成功实现。
关于DNA与目标磷酸酯及周围核苷酸间如何相互作用还没有任何设想。从一个50聚体随机序列的约1014的库开始,按常规方法进行体外筛选。在4天内进行了5次筛选后,该群体整体上都获得了切割目标磷酸酯的能力,在1mM Pb2+存在的条件下该切割反应的速度为约0.2min-1。这与同样反应条件下自发切割的速度相比快了约105倍。
从上述群体中分离出个体,测序,并分析其催化活性。根据这一信息,将反应改造成分子间方式,然后将其简化使得19聚体的底物能够被38聚体的DNA酶特异性地切割,该反应在23℃、pH7.0以及1mM PbOAc的条件下以1min-1的转换速度开始。
B.体外筛选方案制造一个含约1014个单链DNA分子的初始文库,其中所有的分子都含有一个5’端生物素组件,随后依次是一个含有单个核糖核苷酸的固定结构域、一个由50个随机脱氧核糖核苷酸组成的强的催化结构域,以及3’端的第二固定结构域(图1)。
从两侧带有引物结合位点的由50个随机核苷酸的组成的合成cDNA开始,利用巢式PCR(聚合酶链反应)技术构建上述文库。该巢式PCR使用的合成寡脱氧核苷酸引物的5’端经过生物素化,3’端带有1个腺嘌呤核糖核苷酸。核糖核苷酸结尾的寡核苷酸能够有效地引导PCR过程中的模板指导的延伸,这样就生成了含有单个嵌入核糖核苷酸的延伸产物。
图1给出了用于分离能够切割目标RNA磷酸酯的DNAs的选择性扩增方案。通过PCR扩增含有50个随机核苷酸的双链DNA,其中使用的引物5’端经过生物素化(例如,引物3——3a或3b),3’末端以腺嘌呤核糖核苷酸(用符号“N”或“rA”代表,其中N和rA都代表腺嘌呤核糖核苷酸)结尾。把得到双链DNA固定到一种链霉亲和素基质上,用0.2N NaOH洗脱出未被生物素化的DNA链。用缓冲液将柱重新平衡后,用加有1mM PbOAc的同一溶液洗涤该柱。具有Pb2+依赖性自身切割性能的DNAs被从柱上释放出来,收集洗脱液,用PCR扩增。然后用PCR产物启动下面选择性扩增循环。
让PCR产物通过链霉亲和素亲和基质,双链DNA中的5’端生物素化的链发生非共价结合。用0.2N NaOH粗洗,移去未被生物素化的DNA链,23℃下用含有0.5M NaCl、0.5M KCl、50mM MgCl2和50mM HEPES(pH7.0)的缓冲液平衡结合链。接着,在同种缓冲液种加入1mM PbOAc,使得在目标磷酸酯上发生Pb2+依赖性自身切割,从而从链霉亲和素基质中释放出DNAs的一个亚单位。原则上,单个DNA可以通过各种方式促进它自身释放,例如,破坏生物素与链霉亲和素之间的相互作用或者切断一个脱氧核糖核苷酸连接。根据这种连接的相对不稳定性,释放机制最大可能采用的是切断核糖核苷3’-O-P键,Pb2+依赖性水解切割使得释放能够以最快的速度地发生。然而,理论上讲,体外选择方法应该采用最佳释放机制,而且那些个体能最好地实施该机制。
把加入Pb2+时从基质上释放出的DNA分子收集在洗脱液中,乙醇沉淀浓缩,然后利用巢式PCR扩增。在构建分子的起始文库时,第一次PCR使用的是位于随机区域两侧的引物(引物1和2),第二次扩增时使用的是3’末端带有一个核糖腺苷酸5’端生物素化引物(引物3b),因此再次导入了目标RNA磷酸酯。选择性扩增反应全程需要3~4个小时。
该方法的每个循环中都通过下列3种途径来纯化这些分子第一,PCR扩增后,用酚抽提两次,用氯仿/异戊醇抽提一次,然后用乙醇沉淀;第二,将DNA结合到链霉亲和素上后,在强变性条件下洗去所有未生物素化的分子;以及第三,加Pb2+洗脱后,用乙醇沉淀。由于没有采用任何凝胶电泳纯化步骤,因此没有任何选择压力来把这些分子限制到一种特定长度。
C.选择催化活性DNA进行连续5轮体外选择,为了逐渐增强选择的严格性,加入Pb2+后逐渐缩短反应时间。在第1到第3轮中,反应时间是1小时,在第4轮中,反应时间是20分钟,在第5轮中,是1分钟。在与体外选择过程相同的条件下,将单链DNAs的起始库与每轮选择后得到的分子群体同时进行自身切割活性分析(图2)。
为了进行这种分析,用5’-32P代替5’生物素组件制备分子,这就使得对起始原料和5’切割产物二者都可以进行检测。温育5分钟后,初始库(G0)或第1轮和第2轮选择后得到的群体中都未检测到任何活性。第3轮(G3)后得到的DNAs表现出一般水平的活性;这种水平稳定增加,第5轮(G5)后得到的DNAs自身切割的比例达到大约50%。即使延长温育时间后,也只能在目标磷酸酯上检测到切割。
图2给出的是DNA起始库(G0)以及第1轮到第5轮选择(G1~G5)后得到的群体的自身切割活性。反应混合物包括50mM MgCl2、0.5M NaCl、0.5M KCl、和50mM HEPES(23℃下pH7.0),以及3nM[5’-32P]标记的DNA,在含或不含1mM PbOAc的条件下23℃温育5分钟。符号Pre代表含108个核苷酸的前体DNA(SEQ ID NO 4);Clv代表含28个核苷酸的5’切割产物(SEQ ID NO 5);M代表引物3a(SEQ ID NO 6),其长度相当于5’切割产物。
显示出的含28个核苷酸的5’切割产物优选具有下列序列5’-GGGACGAATTCTAATACGACTCACTATN-3’,其中“N”代表位于3’末端带有另外的2’,3’-环磷酸的腺苷核糖核苷酸(SEQ ID NO 5)。在替代实施方案中,“N”代表位于分子3’末端带有另外的2’磷酸或3’磷酸的腺苷核糖核苷酸。
图2中,“GO”一列中“Pre”条带包括一种含108个核苷酸的前体DNAs样品,其中每个分子中都包括50个随机核苷酸。因此,任何给定的“Pre”样品都含有各种前体DNAs,每个样品都可能与前面和后面的样品不同。“G1到“G5”列的“Pre”中富集的催化活性的DNA分子逐渐增加,但是仍含有大量的不同的DNA序列(即在50个核苷酸的随机结构域上不同)。图3给出了来自“G5 Pre”DNA的这些不同序列的一个样品。
利用鸟枪法克隆技术从G5群体中分离出个体;然后从这些亚克隆中取20个,测定完整的核苷酸序列(见图3)。(参见Cadwell et al,PCR方法和应用,228-33,1992;Cadwell et al,PCR方法和应用,3(增补)S136-S140,1994)。在这20个序列中,有5个是独一无二的,两个只发生了两次,1个发生了3次,以及1个发生了8次。在DNA的起始库中已经随机合成的50个核苷酸的区域中,所有这些单个的突变体都具有共同的序列单元。它们都含有两个假定的模板结构域,一个与紧靠切割位点上游的一些核苷酸互补,另一个与下游的至少4个核苷酸互补。在这两个假定的模板结构域之间有一个含1~11个核苷酸的可变结构域,接下来是固定序列5’-AGCG-3’,然后是含3~8个核苷酸的第二可变结构域,最后是固定序列5’-CG-3’或5’-CGA-3’。位于这两个假定结构域之外的核苷酸在序列和长度两个方面都是高度可变的。在所有被测序的克隆中,与50个初始-随机核苷酸对应的区域仍然保持着50个核苷酸的总长度。
图3给出的是从5轮选择后得到的群体中分离的单个突变体的序列对比。顶部给出的是固定的底物结构域 (5’-GGGACGAATTCTAATACGACTCACTATrAGGAAGAGATGGCGAC-3’,或5’-GGGACGAATTCTAATACGACTCACTATNGGAAGAGATGGCGAC-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 13)。其中带有一个用倒三角形标出的目标核糖腺苷酸。用竖框框起来的部分是共同参与了推定的碱基配对相互作用的底物核苷酸。将与50个初始随机核苷酸对应的序列与底物结构域进行反向平行比较。所有这些突变体3’末端都是一个固定序列5’-CGGTAAGCTTGGCAC-3’(SEQ ID NO 1)(“引物位点”;未显示)。图的左右两边指示出的是位于初始随机区域中被推定与底物之间形成碱基对的核苷酸;每个显示出的序列中被单独框起来的部分是酶促DNA分子的推定碱基配对(或底物结合)结构域。两个框型柱中显示的是推定催化结构域中的高度保守核苷酸。
当预见到另外的资料会有助于构建催化结构域的一种有意义的二级结构模型时,我们注意到,如同锤头核酶和发夹核酶一样,我们的酶促DNA分子的催化结构域似乎也包含一个两侧各夹有一个底物结合区域的保守核心,这些底物结合区域与底物之间通过碱基对相互作用。与锤头核酶和发夹核酶类似,催化活性DNAs似乎也需要一小段不配对的底物核苷酸——这种情况下是5’-CGA-3’——位于两个参与碱基配对的区域之间。
另一个有趣的现象是,注意到这9个不同的突变体表现出的与底物间假定互补形式都各不相同。一些个体中,碱基对是连续的,而另一些中碱基对被一个或多个非互补对间断。通常趋势是,与切割位点上游核苷酸之间的相互作用比同下游核苷酸之间的相互作用比更紧密。关于结合的研究和定点诱变分析应该能使我们能够更深入理解并进一步证实这种推测。
为了获得对催化功能所需序列的进一步了解,对上述9个突变体中的6个进行自身切割活性测试,并在本发明公开的选择条件下进化(见图3)。不出所料,这20种亚克隆中的8个中出现的序列被证明是最有活性的,一级速度稳定在1.4min-1。在自身切割测试中,所有这些受测的突变体都显示出活性,都产生了与切割目标RNA磷酸酯对应的单链5’端标记产物。
在不同的反应条件下,对优势亚克隆做进一步分析。它的自身切割活性是Pb2+依赖性的,但是如果从反应混合物中省去Mg2+该活性不受影响。还需要一种单价阳离子,可以用Na+和K+来满足。在0~1.0M(r=0.988)浓度范围内,反应速度随着单价阳离子浓度的增加呈线性增加。下面过程中将进一步评估其他可以影响反应的变化因素,例如pH、温度以及其他二价金属阳离子。
2.材料和方法A.寡核糖核苷酸和寡核糖核苷酸类似物合成的DNAs以及DNA类似物购自操纵子技术公司(OperonTechnology)。19个核苷酸的底物5’-pTCACTATrAGGAAGAGATGG-3’(或5’-pTCACTATNGGAAGAGATGG-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO7)是按照以前公开的方法(Breaker et al,Biochemistry,3311980-11986,1994),用5’-CCATCTCTTCCTATAGTGAGTCCGGCTGCA-3’作为模板,通过反转录酶催化5’-pTCACTATrA-3’(或5’-pTCACTATN-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 8)的延伸获得的。引物3,5’-GGGACGAATTCTAATACGACTCACTATrA-3’(或5’-GGGACGAATTCTAATACGACTCACTATN-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 6)用[γ-32P]ATP和T4聚核苷酸激酶进行5’-端标记(引物3a)或者用[γ-S]ATP和T4聚核苷酸激酶进行5’末端硫代磷酰化,然后用N-碘乙酰基-N’-生物素酰己烯二胺(biotinylhexylenediamine)生物素化(引物3b)。
B.DNA库的制备用下列合成引物通过PCR扩增制备DNA的起始库5’-GTGCCAAGCTTACCG-N50-GTCGCCATCTCTTCC-3’(SEQ ID NO 4),其中N为G、A、T和C的等摩尔混合物。把含有随机寡聚体500pM、引物1(5’-GTGCCAAGCTTACCG-3’,SEQ ID NO 10)1000pM、引物2(5’-CTGCAGAATTCTAATACGACTCACTATAGGAAGAGATGGCGAC-3’,SEQ ID NO 11)500pM、引物3b 500pM、[α-32P]ATP10 Ci以及Taq DNA聚合酶0.2Uμl-1的PCR反应物2ml加入到50mM KCl、1.5mM MgCl2、10mM Tris-HCl(23℃下pH8.3)、0.01%白明胶以及每种dNTP各0.2mM中,92℃温育1min,50℃温育1min,72℃温育2min,然后在下列条件下进行5个循环的扩增92℃、1min,50℃、1min,72℃温育1min。扩增得到的产物用酚抽提两次,氯仿/异戊醇抽提一次,然后用乙醇沉淀分离DNA。
C.体外选择将上述DNA的起始库重悬在500μL的缓冲液A(1M NaCl和50mMHEPES(23℃下pH7.0))中,并反复通过链霉亲和素柱(AffiniTip Strep20,Genosys,The Woodlands,TX)。用体积为100μL的缓冲液A洗涤5次,接着用体积为100μL的0.2N NaOH洗涤5次,然后用体积为100μL的缓冲液B(0.5M NaCl、0.5MKCl、50mM MgCl2和50mM HEPES(23℃下pH7.0))平衡5次。在1小时内,用加有1mM PbOAc的缓冲液B20μL洗脱被固定的单链DNA 3次。固定和洗脱的全过程均在23℃下完成。把洗脱成分收集在等体积的缓冲液C(50mM HEPES(23℃下pH7.0)和80mMEDTA)中,用乙醇沉淀DNA。
PCR扩增以上得到的DNA,100μL的反应混合物中含有20pM引物1、20pM引物2、Taq DNA聚合酶0.05Uμl-1、50mM KCl、1.5mM MgCl2、10mM Tris-HCl(23℃下pH8.3)、0.01%白明胶以及每种dNTP各0.2mM,在下列条件下扩增30个循环92℃、10sec,50℃、30sec,72℃、30sec。反应产物用酚抽提两次,氯仿/异戊醇抽提一次,然后用乙醇沉淀回收DNA。取上面扩增的DNA约4pM加入到第二轮、巢式PCR的100μL反应物中,该反应物中含有引物1100pM、引物3b 100pM、[α-32P]ATP20μCi、Taq DNA聚合酶0.1Uμl-1,将总体积200μL反应混合物在下列条件下扩增10个循环92℃、1min,50℃、1min,72℃温育1min。再一次抽提和沉淀PCR产物,将得到的DNA重悬于50μL的缓冲液A中,然后用其开始下一轮的选择。
除了第3轮结束时巢式PCR的反应体积为100μL外,按照上述方法进行第2轮和第3轮的扩增。在第4轮中,加入Pb2+后将洗脱时间缩短到20min(2个20μL的洗脱体积),只将回收到的DNA的一半用于第一次PCR,第一次PCR只进行15个温度循环。在第5轮的过程中,洗脱时间缩短到1min(2个20μL的洗脱体积),只将回收到的DNA的1/4用于第一次PCR,第一次PCR进行15个温度循环。按照上述方法(Tsang etal,Biochemistry,335966-5973,1994),将第5轮选择后得到的DNA进行亚克隆和测序。
D.催化活性DNAs的动力学分析在上述条件下,用5’-32P标记物在25μL的反应混合物中通过不对称PCR制备DNA群体和各种亚克隆个体,该反应混合物中含有引物3a 10pmol、加入的DNA 0.5pM以及Taq DNA聚合酶0.1Uμl-1,在下列条件下扩增10个循环92℃、1min,50℃、1min,72℃温育1min。将得到的[5’-32P]标记的扩增产物在10%聚丙烯酰胺/8M凝胶上电泳纯化。
将DNA置于缓冲液B中温育10min后,进行自身切割分析。通过加入终浓度为1mM的PbOAc来启动反应,通过加入等体积的缓冲液C终止反应。用10%聚丙烯酰胺/8M凝胶电泳分离反应产物。多次-转换情况的动力学分析在缓冲液B中进行,为了防止物质吸附到管壁上在该缓冲液中加入了50μg mL-1的BSA。将底物和酶分子分别置于不含Pb2+的缓冲液中预温育5min,然后合并,加入终浓度为1mM的PbOAc启动反应。
3.能够完成分子间切割的脱氧核酶的进化A.转变成分子间方式由于突变体的催化结构域和底物结构域之间推定的碱基配对相互作用是可变的,所以觉得将DNA催化的反应转变成分子间方式应该是相当简单的。在这种情况下,我们希望简化催化剂的底物结合区域,以便使其中的每个都能与底物之间形成连续的7~8个碱基对。此外,我们希望提供一种最小的底物,将该底物限制到含两个碱基配对区域和插入序列5’-GGA-3’(图4A)。
图4A和4B给出了一个分子间反应中RNA磷酸酯的DNA-催化切割,该反应以催化转换开始。图4A是19聚体底物和38聚体DNA酶之间形成的复合物的简图。底物中包括单个腺嘌呤核糖核苷酸(“rA”或“N”,紧靠箭头),其两侧是脱氧核糖核苷酸。合成DNA酶是图3中给出的最常发生的突变体的38核苷酸部分。位于推定催化结构域中的高度保守核苷酸被“框了起来”。如图所示,一个保守区域是“AGCG”,而另一个保守区域是“CG”(按5’-3’的方向阅读)。
图4B给出的是用于测定下列反应的Km(负斜率)和Vmax(y轴截距)的Eadie-Hoftstee曲线在与体外选择相同的条件下,DNA催化切割[5’-32P]标记的底物。测定反应的初始速度,该反应中包括5nM DNA以及0.125μM、0.5μM、1μM、2μM或4μM底物。
在设计催化结构域时,我们主要根据最有活性突变体的组成,在突变体的5’端截去2个核苷酸,3’端截去11个核苷酸。位于两个模板区域之间的15个核苷酸保持不变,在3’端模板区域中插入一个核苷酸形成能与底物之间碱基配对的一连串核苷酸。将底物简化成下列序列5’-TCACTATrA·GGAAGAGATGG-3’(或5’-TCACTATN·GGAAGAGATGG-3’,其中“N”代表腺苷核糖核苷酸)(SEQ ID NO 12),其中下划线部分的核苷酸是参与同催化活性DNA分子碱基配对的两个区域。
在简化反应系统中,使用全部由脱氧核糖核苷酸组成的38聚体催化活性DNA分子(催化剂)和包括一个其余全部DNA序列中插入单个核糖核苷酸的19聚体底物,这种简化的反应系统可以使高效的DNA-催化磷酸酯切割能迅速转换,该反应系统。在0.01μM催化剂和1μM底物存在的条件下温育90分钟后,46%的底物被切割,与催化剂的46次转换相对应。对该反应进行预先的动力学分析,在多次转换的条件下评估。DNA催化剂表现出Michaelis-Menten动力学特性,kcat和Km值分别为1min~1和2μM(见图4B)。Km值明显地大于基于watson-crick相互作用而预想的催化剂和底物之间的解离常数。在同样的反应条件下温育底物(但不含催化剂);得到的kuncat值为4×10-6min-1。这与在0.5mM Pb2+、pH7.0、37℃条件下水解更不稳定的1-硝基苯酚-1,2-丙二醇的报道数值5×10-3min-1(Breslow et al,Proc.Natl.Acad.Sci.USA,884080-4083,1991)一致。
现在,可以进行下述假定核糖核苷2’-羟基攻击邻近磷酸,通过这种水解机制启动磷酸酯切割反应,产生带有2‘(3’)-环磷酸末端的5’端产物以及末端为5’-羟基的3’端产物。支持这个机制的是,3’切割产物可以用T4寡聚核苷激酶和[γ-32P]ATP有效地磷酸化,这一点和自由的5’-羟基的可获得法相一致。
B.讨论5轮体外选择后,得到能够催化目标RNA磷酸酯的高效Pb2+依赖性切割反应的单链DNA分子的群体。根据这种群体中分离到的代表性个体的共同特征,构建了催化剂以及底物的简化型式,生成了分子间快速催化转换的一种示范。因此,上述38聚体催化结构域提供了DNA酶或者被称为“脱氧核酶”的一个实例。
一种信息大分子,它能够促进以快速转换起始并遵从Michaelis-Menten动力学的反应中的化学转化,基于这种事实可以把这种分子称为酶,但这可能不能满足每个人关于什么是酶的见解。有人可能根据定义坚持酶必须是一种多肽。但是,如果接受RNA酶这个概念,然后接受类似的关于DNA酶的观点似乎就是顺理成章的。如果考虑我们能以多快的速度地从随机序列DNAs库中生产出这种分子,我们预料在不远的将来会有许多其他的合成DNA分子的实例出现。
RNA磷酸酯的Pb2+依赖性切割简化了配合的Pb2+-羟基的确切定位的要求,从而促进与切割位点邻接的2’羟基的去质子化,由于RNA磷酸酯的Pb2+依赖性切割是这样一种简单的反应,所以选择它作为研究DNA催化的初始目标。(见Pan et al,in The RNA World,Gesteland & Atkins(eds.),pp.271-302,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY(1993)。)众所周知,Pb2+配合于嘌呤的N7位、鸟嘌呤的O6位、尿嘧啶的O4位和胞嘧啶的N3位(Brown et al,Nature,303543~546,1993)。因此,与RNA在糖组成和构象两方面的差异看来并不可能阻止DNA形成定义明确的Pb2+-结合口袋。
选择在其余全部DNA序列中含有单个核糖核苷酸的底物是由于它提供了一个用于切割的独一无二的优势位点,并且确保任何一种得到的催化活性都归DNA所独有。底物识别好象是依靠两个催化剂与底物之间碱基配对的区域。然而,位于这两个区域之间的未配对核苷酸5’-GGA-3’可能在底物识别、金属离子的配合或者催化功能的其他方面发挥重要的作用。
进一步还预料到了,所有的RNA分子、其他的RNA-DNA复合体以及含一个或多个核苷酸类似物的分子都可能是可接受的底物。如此处公开的那样,本发明描述的体外进化方法可以成功地用于生产具有期望特性的酶促DNA分子;现在正沿着这些线索进行进一步的分析。
此外,使用本发明描述的方法,测定酶与底物之间的碱基配对相互作用的产生是否与序列有关的研究也在进行当中。此处公开的Pb2+依赖性的脱氧核酶也可能是研究DNA的结构以及酶促活性时值得考虑的模型化合物。
本发明中用于快速生产DNA催化剂的方法有着相当的普遍性,这使得我们能够使用其他辅因子触发与潜在催化结构域相连的目标键的切割。在这一点上,发展能够在生理条件下特异性地切割目标RNAs的Mg2+依赖性DNA酶是有意义的,发展能够在其他阳离子存在的条件下发挥功能的DNA酶也同样如此(见实施例4)。这些分子将为传统上特异性灭活目标RNAs的反义方法和核酶方法提供替代方法。
因此,DNA可以与RNA及蛋白质一起加入到能够展现出酶促活性的生物大分子的行列中。DNA的催化能力的全部范围还有待探索,但是根据体外选择方法,例如本研究中使用的方法将会迅速地启动这些探索。
与其他大分子催化剂相比,DNA酶可以提供几种重要的特性。首先,它们易于制备,当今许多实验室都配备了自动DNA合成仪而且DNA亚磷酰胺的成本也很低。其次,与RNA相比,它们是很稳定的化合物,因此会加速它们在生物研究中的应用。第三,我们预料它们能够适合当前使用不具有切割RNA活性的反义DNAs的治疗领域。用DNA类似物也可以进行体外筛选,这些类似物包括具有核酸酶抗性的化合物,例如含有硫代磷酸酯的DNA,只要这些类似物能够被制备成脱氧核糖核苷5’-三磷酸,并且可以作为DNA依赖性DNA聚合酶的底物。最后,DNA酶为我们理解大分子催化功能的基础提供了一个新的窗口。例如,对催化同一化学转化的以蛋白质为基础的酶、以RNA为基础的酶以及以DNA为基础的酶进行比较分析是有意义的。
4.催化活性DNAs其他家族除了DNA的起始库由包括40个随机核苷酸的分子组成以外,基本上按照上面实施例2.B.中描述的方法通过PCR制备DNA起始库。因此,此处描述的DNA起始库是利用下列合成寡聚体通过PCR制备而成5’-GGG ACG AAT TCT AAT ACG ACT CAC TAT rA GG AAG AGA TGG CGA CATCTC N40GT GAC GGT AAG CTT GGC AC-3’(SEQ ID NO 23),其中N是G、A、T、C的等摩尔混合物,选择能够沿着目标rA切割磷酸酯的DNA分子。(见图6A)。
分别在Pb2+、Zn2+、Mn2+或Mg2+四者之一存在的条件下进行选择扩增,因此生产出了至少4个家族的催化活性DNA分子。正如图5中给出的那样,在不同的阳离子存在的条件下产生的催化活性DNA分子表现出了特异性的活性。
图5给出的是表现选择的催化活性DNAs的4个家族的特异性内切核糖核酸酶活性的聚丙烯酰胺凝胶照片。Pb2+依赖性家族分子的选择以并排的方式重复出现作为对照。在每组的3个泳道中,第1泳道显示的是在不含金属阳离子条件下选择的无活性群体,第2泳道显示的是金属阳离子存在条件下观察到的活性,第3泳道显示的无活性的起始库(GO)。现在,观察到的反应活性顺序是Pb2+>Zn2+>Mn2+>Mg2+,反映了相应金属氢氧化物的pKa。
在预先选择的二价离子存在的情况下进行5轮(G5)或6轮(G6)选择性扩增,就可获得期望的内切核酸酶活性。对Mg2+存在的情况下进行的选择性扩增的如下描述是用来例举的。
除用1mM Mg2+代替1mM Pb2+作为二价金属阳离子外,按照上述实施例2中描述的方法进行6轮体外选择性扩增。(参见Breaker et al,Chem. & Biol.,1223-229,1994),在此引入作为参考,这些文献基本上描述的是同一种方法。)6轮以后分离单个克隆,并从这些克隆中取出24个测定核苷酸序列。所有这些序列均以下列序列起始5’-GGG ACG AAT TCT AAT ACG ACTCAC TAT rA GG AAG AGA TGG CGA CA(SEQ ID NO 23的1~44位),以下列序列终止CGG TAA GCT TGG CAC 3’(SEQ ID NO 23的93~107位)。
起始库中的TCTC N40GTGA(SEQ ID NO 23的45~92位)的中间节段具有下列变化形式(13) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGCTC TTG TTA GTA T(SEQ ID NO 24)(5) TCT CTT CAG CGA TGC ACG CTT GTT TTA ATG TTG CACCCA TGT TAG TGA(SEQ ID NO 25)(2) TCT CAT CAG CGA TTG AAC CAC TTG GTG GAC AGA CCCATG TTA GTG A(SEQ ID NO 26)(1) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGTTC TTG TTA GTA T(SEQ ID NO 27)(1) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGCTC TCG TTA GTA T(SEQ ID NO 28)(1) TCT CAG ACT TAG TCC ATC ACA CTC TGT GCA TAT GCCTGC TTG ATG TGA(SEQ ID NO 29)(1) -CT CTC ATC TGC TAG CAC GCT CGA ATA GTG TCA GTCGAT GTG A(SEQ ID NO 30).
括号中的数目表示具有特定序列的克隆的数目。注意到一些突变(粗体字高亮显示)发生在初始随机之外的位置上。
24个克隆中有5个具有上面列出的第二个序列(即SEQ ID NO 25),选择该序列作为领导(即主要)化合物用于进一步的研究。在pH7.0、23℃以及含有浓度为1mM的下列各种二价金属离子和1M NaCl的条件下,测量切割活性金属离子 kobs不含 未做Mg2+2.3×10-3Mn2+6.8×10-3Zn2+4.2×10-2Pb2+1.1×10-2因此,虽然该领导化合物是在Mg2+存在的条件下筛选得到的,但是在所有4种二价全属离子存在的条件下该领导化合物也具有活性。相反,Mn2+、Zn2+或Pb2+存在条件下筛选出的DNA分子在Mg2+存在条件下却不表现出任何活性。
此外,在制备全部含硫代磷酸酯DNA类似物时候,Mg2+存在条件下6轮体外选择得到的DNAs群体表现出Mg2+依赖性的切割活性,观察到的速度为~10-3min-1。含硫代磷酸酯类似物是酶促制备而成的,所以在每个立体核心(stereocenter)都有Rρ构型。与未经修饰的DNA相比,这种化合物对细胞核酸酶具有一定的抗性。
该领导化合物在40个核苷酸位置(下划线部分)上是重随机(re-randomized)的,导入了机率为15%的突变(这3个可能的碱基取代中的每个都是5%。)。对该重随机群体进行另外7轮体外选择。在后4轮中,从群体中移去Pb2+存在条件下表现活性的分子以后,让其余部分接受1mMMg2+存在条件下的反应。在第7轮以后分离单个克隆,并取出这些克隆中的14个测定核苷酸序列。所有这些序列均以下列序列起始5’-GGGACG AAT TCT AAT ACG ACT CAC TAT rA GG AAG AGA TGG CGA CAT CTC(SEQ ID NO 23的1~48位),以下列序列终止GTG ACG GTA AGC TTGGCA C3’(SEQ ID NO 23的89~107位)。
与40部分随机位置(N40,SEQ ID NO 23的49~88位)对应的中间节段可以下列方式变化(4) TAC AGC GAT TCA CCC TTG TTT AAG GGT TAC ACC CATGTT A(SEQ ID NO 31)(2) ATC AGC GAT TAA CGC TTG TTT CAA TGT TAC ACC CATGTT A(SEQ ID NO 32)(2) TTC AGC GAT TAA CGC TTA TTT TAG CGT TAC ACC CATGTT A(SEQ ID NO 33)(1) ATC AGC GAT TCA CCC TTG TTT TAA GGT TGC ACC CATGTT A(SEQ ID NO 34)(1) ATC AGC GAT TCA CCC TTG TTT AAG CGT TAC ACC CATGTT G(SEQ ID NO 35)(1) ATC AGC GAT TCA CCC TTG TTT TAA GGT TAC ACC CATGTT A(SEQ ID NO 36)(1) ATC AGC GAT TAA CGC TTA TTT TAG CGT TAC ACC CATGTT A(SEQ ID NO 37)(1) ATC AGC GAT TAA CGC TTG TTT TAG TGT TGC ACC CATGTT A(SEQ ID NO 38)(1) ATC AGC GAT TAA CGC TTA TTT TAG CAT TAC ACC CATGTT A(SEQ ID NO 39).
括号中的数目表示具有那种具体序列的克隆的数目。粗体显示的是那些与领导化合物相比不同的核苷酸。
这些克隆的切割活性的正式分析正在进行。该群体整体上表现出了Mg2+依赖性的切割活性,观察到的速度为~10-2min-1,与Pb2+存在条件下表现出活性的活性相当。
图6A和6B分别提供的是一个“原始”催化活性DNA分子和用本发明公开的选择扩增方法得到的几个催化活性DNA分子中的一个的二级结构的图象。图6A给出的是来自起始库的示范分子,该分子表现出了SEQ IDNO 23代表的分子的总体构象。如图所示,各种互补核苷酸位于随机区域(N40)的旁侧。
图6B图中显示的是一个通过此处公开的方法产生的Mg2+依赖性催化活性DNA分子(或“DNAzymes”)。箭头指示出的是底物核酸中核糖核苷酸的位置。(所显示的分子包括此处定名为SEQ ID NO 25的序列,以及SEQ ID NO 23的“起始”序列和“终止”序列。)如此处公开的那样,上述通过体外选择得到的“家族”的每个成员中的内切核酸酶活性持续增强,所以可以预料用此处公开的原则可以成功地生产出期望特异性逐渐增强的酶促DNA分子。
5.较大的RNA序列的切割作为上述研究的延续,我们已经发展了能够切割全部由RNA组成的底物的DNA酶,而不是如上所述的在其余全部DNA中插入单个核糖核苷酸的底物。(参见Breaker et al,Chem. & Biol.,1223-229,1994);Breaker et al,Chem. & Biol.,2655-660,1994)。作为目标序列,我们选择HIV-1 RNA的U5长末端重复序列(LTR)中的共12个高度保守的核苷酸,其序列为5’GUAACUAGAGAU 3’(SEQ ID NO 49)。
根据上述实施例中描述的方法,我们生成了一个1014个具有下列组成的DNA分子的库5’-GGAAAA r(GUAACUAGAGAU)GGAAGAGATGGCGAC N50CGGTAAGCTTGGCAC-3’(SEQ ID NO 50),此处N是脱氧核糖核苷酸G、A、T和C的等摩尔混合物,鉴定为“r(GUAACUAGAGAU)”的序列由脱氧核糖核苷酸组成。(任选地,可以改变序列起始5’端核苷酸,例如,通过在5’末端核糖核苷酸部分之前的序列中加入1个另外的dA残基,因此生成了阅读为“GGAAAAA”的起始序列,并生成了长度为99个残基的SEQ ID NO 50。显然,如此处详细描述的那样,这仅仅是为了构建特异性的酶促DNA分子而可能做的修饰中的一个实例。)通过以100pmol的5’-GTGCCAAGCTTACCG-N50-GTCGCCATCTCTTCC-3’(N=G、A、T或C)为模板对5’-生物素-d(GGAAAAA)r(GUAACUAGAGAU)d(GGAAGAGATGGCGAC)-3’进行模板-指导延伸来生产起始库,50μL的反应混合物中包含Superscript II反转录酶(RT;Gibco BRL)10Uμl-1、3mM MgCl2、75mM KCl、50mM Tris*HCl(pH8.3)以及每种dNTP各0.2mM。向反应混合物中加入微量的[5’-32P]标记的引物使得延伸效率能得到监察。合并除RT之外的所有成分,在65℃温育5min,然后在10min中内冷却到45℃。加入RT,然后将混合物在45℃温育45min,然后加入Na2EDTA终止反应。加入终浓度为1M的NaCl,通过让延伸产物重复通过4个链霉亲和素亲和柱(Genosys)而使其固定。
用体积为100μL的洗涤缓冲液(1M NaCl、50mM Tris*HCl(pH7.5)、0.1mM Na2EDTA)洗涤柱5次,接着用体积为100μL的0.1N NaOH洗涤5次,然后用体积为100μL的洗涤缓冲液在37℃下洗涤5次,然后在37℃下1小时内用20μL等量反应缓冲液(10mM MgCl2、1MNaCl、50mM Tris*HCl(pH7.5))洗脱3次。回收洗脱下来的分子,并使用引物5’-生物素-GGAAGAGATGGCGAC-3’和5’-GTGCCAAGCTTACCG-3’进行PCR扩增。按照上述方法,将PCR产物固定在链霉亲和素亲和柱上,用体积为100μL的洗涤缓冲液洗涤5次,用体积为40μL的0.1N NaOH洗脱得到未生物素化的链。乙醇沉淀分离到的DNAs,并将其用做引物延伸反应中的模板开始下一轮选择。除了延伸反应规模减小了5倍和PCR规模减小了2倍外,第2~10轮按照上述方法进行。
根据切割位于插入的RNA目标序列中的磷酸酯的能力,对因此而产生的酶促DNA分子进行筛选。基于酶促DNA分子在10mM MgCl2、pH7.5和37℃的条件下的活性,进行10轮体外选择扩增。在选择过程中,竞选其中“优选的”切割位点以及在所有这些优选位点都能进行切割的“最佳”催化剂。两个位点和两个催化剂家族表现出最有效的切割能力(见图7)。
图7给出的是基本上按照此处描述的方法进行10轮体外选择扩增得到的结果中的一部分。如图所示,两个位点和两个催化剂家族表现出对目标序列的最有效的切割。切割条件基本上同图7中的显示,就是,10mM Mg2+、pH7.5和37℃;图中显示的是反应进行2小时后收集的数据。相对于代次数目(此处为0~10)绘制出切割率(%)。垂直柱表示的是能够在指定位点切割底物中目标序列的催化活性DNA分子的数目/普遍性,其中条纹柱显示的是在G↓UAACUAGAGAU处的切割,空白(无阴影)柱显示的是在GUAACUA↓GAGAU处的切割。与此处一致,图7中,箭头指示的是两个相邻核苷酸之间发生切割的位点。
对来自第8轮和第10轮选择扩增得到的群体的各种个体进行了克隆。然后,对来自第8轮的29个个体和来自第10轮的32个个体测定核苷酸序列(分别见表2和3)。
表2和表3中,标题“核苷酸序列”下方给出的是所有鉴定的克隆中与起始库中随机的50个核苷酸(即N50)相对应的部分;因此,通常,一个给定克隆的全长核苷酸序列包括“N50”节段之前,之后的序列以及包括该节段的序列,如果和底物连接在一起,就没有发生自身切割。例如,(非自身切割)克隆的全序列通常可能包括SEQ ID NO 50的第1~33位残基,接着是代表随机N50区域的残基,再接着是SEQ ID NO 50的第84~98位残基,或者SEQ ID NO 51的第1~34位残基,接着是代表随机N50区域的残基,再接着是SEQ ID NO 51的第85~99位残基。然而,可以相信的是,每个克隆的N50(或N40)区域——或其一部分——在确定特定酶促DNA分子的特异性和/或活性中都是特别重要的。在底物与DNAzyme各自为独立分子的反应中,这一点尤其明显(见,例如,图8和图9)。
第8轮或第10轮后得到的个体分别被定名为8-x或10-x。SEQ ID NOS也被列出,与每个克隆的“N50”区域对应。
表2来自第8轮扩增的克隆个体克隆编号 SEQ ID NO “N50”核苷酸序列(5’-3’)8-2 52 CCA ATA GTG CTA CTG TGT ATC TCA ATG CTGGAA ACA CGG GTT ATC TCC CG8-4 53 CCA AAA CAG TGG AGC ATT ATA TCT ACT CCACAA AGA CCA CTT TTC TCC CG8-5154 ATC CGT ACT AGC ATG CAG ACA GTC TGT CTGCTT TTT CAT TAC TCA CTC CC8-14 55 CAA TTC ATG ATG ACC AAC TCT GTC AAC ACGCGA ACT TTT AAC ACT 6GC A8-17256 CTT CCA CCT TCC GAG CCG GAC GAA GTT ACTTTT TAT CAC ACT ACG TAT TG8-3 57 GGC AAG AGA TGG CAT ATA TTC AGG TAA CTGTGG AGA TAC CCT GTC TGC CA8-6 58 CTA GAC CAT TCA CGT TTA CCA AGC TAT GGTAAG AAC TAG AAT CAC GCG TA8-8 59 CGT ACA CGT GGA AAA GCT ATA AGT CAA GTTCTC ATC ATG TAC CTG ACC GC8-10 60 CAG TGA TAC ATG AGT GCA CCG CTA CGA CTAAGT CTG TAA CTT ATT CTA CC8-22 61 ACC GAA TTA AAC TAC CGA ATA GTG TGG TTTCTA TGC TTC TTC TTC CCT GA8-11 62 CAG GTA GAT ATA ATG CGT CAC CGT GCT TACACT CGT TTT ATT AGT ATG TC8-21 63 CCC TAC AAC ACC ACT GGG CCC AAT TAG ATTAAC GCT ATT TTA TAA CTC G8-12 64 CCA AAC GGT TAT AAG ACT GAA AAC TCA ATC
AAT AGC CCA ATC CTC GCC C8-13 65 CAC ATG TAT ACC TAA GAA ATT GGT CCC GTAGAC GTC ACA GAC TTA CGC CA8-23 66 CAC AAC GAA AAC AAT CTT CCT TGG CAT ACTGGG GAG AAA GTC TGT TGT CC8-40 67 CAC ACG AAC ATG TCC ATT AAA TGG CAT TCCGTT TTT CGT TCT ACA TAT GC8-24 68 CAG AAC GAG GGT CTT GTA AGA CTA CAC CTCCTC AGT GAC AAT AAT CCT G8-26 69 CAC TAC AGC CTG ATA TAT ATG AAG AAC AGGCAA CAA GCT TAT GCA CTG G8-27 70 GGG TAC ATT TAT GAT TCT CTT ATA AAG AGAATA TCG TAC TCT TTT CCC CA8-28 71 CCA AAG TAC ATT CCA ACC CCT TAT ACG TGAAAC TTC CAG TAG TTT CCT A8-29 72 CTT GAA GAT CCT CAT AAG ACG ATT AAA CAATCC ACT GGA TAT AAT CCG GA8-34 73 CGA ATA GTG TCC ATG ATT ACA CCA ATA ACTGCC TGC CTA TCA TGT TTA TG8-35 74 CCA AGA GAG TAT CGG ATA CAC TTG GAA CATAGC TAA CTC GAA CTG TAC CA8-36 75 CCA CTG ATA AAT AGG TAA CTG TCT CAT ATCTGC CAA TCA TAT GCC GTA8-37 76 CCC AAA TTA TAA ACA ATT TAA CAC AAG CAAAAG GAG GTT CAT TGC TCC GC8-39 77 CAA TAA ACT GGT GCT AAA CCT AAT ACC TTGTAT CCA AGT TAT CCT CCC CC1与10-4、10-40相同2与8-20、8-32、8-38、10-1、10-34相同;10-11的1个突变;10-29的3个突变表3来自第8轮扩增的克隆个体克隆编号 SEQ ID NO “N50”核苷酸序列(5’-3’)10-3378 CCG AAT GAC ATC CGT AGT GGA ACC TTG CTTTTG ACA CTA AGA AGC TAC AC10-10 79 CCA TAA CAA ATA CCA TAG TAA AGA TCT GCATTA TAT TAT ATC GGT CCA CC10-12 80 CAG AAC AAA GAT CAG TAG CTA AAC ATA TGGTAC AAA CAT ACC ATC TCG CA10-14 81 CCT TTA GTT AGG CTA GCT ACA ACG ATT TTTCCC TGC TTG GCA ACG ACA C10-15 82 CTC CCT ACG TTA CAC CAG CGG TAC GAA TTTTCC ACG AGA GGT AAT CCG CA10-19 83 CGG CAC CTC TAG TTA GAC ACT CCG GAA TTTTTC CCC10-39 84 CGG CAC CTC TAG TTA GAC ACT CCG GAA TTTTAG CCT ACC ATA GTC CGG T10-23 85 CCC TTT GGT TAG GCT AGC TAC AAC GAT TTTTCC CTG CTT GAA TTG TA10-27486 CCC TTT GGT TAG GCT AGC TAC AAC GAT TTTTCC CTG CTT GAC CTG TTA CGA10-31 87 CCT TTA GTT AGG CTA GCT ACA ACG ATT TTTCCC TGC TTG GAA CGA CAC10-18 88 CAT GGC TTA ATC ATC CTC AAT AGA AGA CTACAA GTC GAA TAT GTC CCC CC10-20 89 CAA CAG AGC GAG TAT CAC CCC CTG TCA ATAGTC GTA TGA AAC ATT GGG CC10-6 90 TAC CGA CAA GGG GAA TTA AAA GCT AGC TGGTTA TGC AAC CCT TTT CGC A10-7 91 CTC GAA ACA GTG ATA TTC TGA ACA AAC GGGTAC TAC GTG TTC AGC CCC C10-8 92 CCA ATA ACG TAA CCC GGT TAG ATA AGC ACTTAG CTA AGA TGT TTA TCC TG10-16 93 CAA TAC AAT CGG TAC GAA TCC AGA AAC ATAACG TTG TTT CAG AAT GGT CC10-21 94 GCA ACA ACA AGA ACC AAG TTA CAT ACA CGTTCA TCT ATA CTG AAC CCC CA10-24 95 CCT TTG AGT TCC TAA ATG CCG CAC GGT AAGCTT GGC ACA CTT TGA CTG TA10-28 96 CAA AGA TCT CAC TTT GGA AAT GCG AAA TATGTA TAT TCG CCC TGT CTG C10-33 97 CCA CGT AGA ATT ATC TGA TTT ATA ACA TAACGC AGG ATA ACT CTC GCC CA10-35 98 CAC AAG AAA GTG TCG TCT CCA GAT ATT TGAGTA CAA GAA ACT ACG CCC10-36 99 CAT GAA GAA ATA GGA CAT TCT ACA GGC TGGACC GTT ACT ATG CCT GTA GG10-37 100 CAT AGG ATA ATC ATG GCG ATG CTT ATG ACGTGT ACA TCT ATA CCT T10-38 101 CAG ATG ATC TTC CTT TAA AGA CTA CCC TTTAAA GAA ACA TAA GGT ACC CC310-5的1个突变410-30的1个突变随后测量了各种克隆的自身切割活性。发现克隆8-5、8-17和10-3在5’GUAACU↓AGAGAU 3’位点能有效地切割,而克隆10-14、10-19和10-27在5’G↓UAACUAGAGAU 3’位点能有效地切割。当将分子的RNA部分延伸成序列5’GGAAAAAGUAACUAGAGAUGGAAG 3’(SEQ ID NO 51的第1~24位残基)时,克隆8-17、10-14和10-27保留了全部活性,而克隆8-5、10-3和10-19表现出的活性减弱。随后,发现克隆10-23在涉及延伸后的RNA结构域的自身切割反应中表现出高水平的活性。
还应该提到的是,如果相关领域的技术人员的兴趣有所不同,为了生产出有特定特异性的酶促DNA分子,可以对根据本发明公开的方法构建的聚核苷酸分子中“N50”节段之前的序列或之后的序列,即“N50”区域旁侧的底物结合区域采取多种形式的变化,例如改变长度、核苷酸序列、核酸类型等等。例如,尽管此处将SEQ ID NO 51的第1~24位残基描述为RNA核苷酸,替代地它们可以包括DNA、RNA或其组合。(因此,例如,可以容易地将SEQ ID NO 51改变成第1~7位核酸残基包括DNA,第8~19为残基包括RNA,第20~99位残基包括DNA,等等。)类似地,“N50”区域之前的核苷酸可以包括RNA、DNA或其组合。如此处公开的那样,“N50”(或“N40”——见实施例4)之前或之后区域的长度也可以改变。而且,N50或N40区域之前的或之后的序列可以被截短、延长或整个缺失。
而且,如上所述,在实施例描述的方法中我们选用HIV RNA的特定区域作为目标序列;这种序列不是可以选做目标的唯一序列。显然,相关领域的技术人员可以根据我们的教导构建和设计出对于其他目标序列具有特异性的酶促DNA分子。如此处公开的那样,如SEQ ID NO 50和51显示的那样,这样的目标序列可以被构建成或插入到含有DNA、RNA或其组合的较大序列中。
通过把酶和底物区域分离到单独的分子中,可以容易地将自身切割反应转变成分子间切割反应。选择克隆8-17和10-23作为原型分子。在以多次转换起始的反应中,二者均表现出能够作为DNA酶切割单独的全部-RNA底物(图8)。随后,将划分出切割位点的未配对核苷酸每一侧的底物结合臂缩短到7个碱基对(图9)。
图8给出的是本发明的两个催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位点以及转换速度。反应条件如图所示,也就是,10mM Mg2+、pH7.5和37℃。左边是鉴定为克隆8-17的DNAzyme,箭头指示的是RNA底物的切割位点。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——与DNAzyme分离(即给出的是分子间切割)——如图标记。类似地,右边显示的是此处鉴定为克隆10-23的DNAzyme,箭头指示的是RNA底物的切割位点。再次列出底物序列。酶8-17的转换速度为约0.6hr-1;酶10-23的转换速度为约1hr-1。
如图8中所示,能切割单个底物分子的克隆8-17催化活性DNA分子的核苷酸序列如下列所示5’-CTTCCACCTTCCGAGCCGGACGAAGTTACTTTTT-3’(SEQ ID NO 56的1~34位残基)。在同一图中,能切割单个底物分子的克隆10-23催化活性DNA分子的核苷酸序列如下列所示5’-CTTTGGTTAGGCTAGCTACAACGATTTTTCC-3’(SEQ ID NO 85的3~33位残基)。
图9进一步给出了本发明的两个催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位点和转换速度。反应条件如图所示,也就是,10mM Mg2+、pH7.5和37℃。与图8中相同,左边给出的是鉴定为克隆8-17的DNAzyme,箭头指示的是RNA底物的切割位点。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——与DNAzyme分离(即给出的是分子间切割)——如图标记。类似地,右边显示的是此处鉴定为克隆10-23的DNAzyme,箭头指示的是RNA底物的切割位点。再次给出了底物序列。酶8-17的Kobs值为约0.002min-1;酶10-23的Kobs值为约0.01min-1。
如图9所示,能切割单个底物分子的克隆8-17催化活性DNA分子的核苷酸序列如下列所示5’-CCACCTTCCGAGCCGGACGAAGTTACT-3’(SEQID NO 56的4~30位残基)。在同一图中,能切割单个底物分子的克隆10-23催化活性DNA分子的核苷酸序列如下列所示5’-CTAGTTAGGCTAGCTACAACGATTTTTCC-3’(SEQ ID NO 85的5~33位残基,在5’末端用“CTA”取代了“TTG”)。
切割RNA的DNA酶的催化速度还没有被完全优化。如上述公开的以及以前研究中报道的那样,通过对原型分子进行部分随机化以及进行附加轮的选择扩增,我们已经能够提高催化速度。但是,我们发现在pH7.5和37℃的条件下,8-17和10-23这两种DNA分子在Mg2+存在时的Km值分别为约5mM和2mM;这确实与分子内切割的情况一致。
6.通用底物酶的制备上述内容表明,本发明的酶能够催化切割含有预先选定序列的目标核酸。而且,给出了的酶能够切割纯粹为DNA的核酸,或在脱氧核糖核苷酸(即DNA)序列中插入了核糖核苷酸(即RNA组分)的核酸,或纯粹为RNA的核酸。另外,底物可以更换,而制备出来的酶可以切割此底物。
根据本发明,提供了一种能够在生理条件下以高效和特异的动力学方式切割任一目标底物的酶,即包含一段预先选定的长约10~30个核苷酸的核苷酸序列的任一底物。这种酶易于制备且成本低廉,可以用于目标RNA的灭活,具体为信使RNA(mRNA)的灭活,也可以用于探测结构RNA以及用于重组RNA的处理,例如作为序列特异性的内切核糖核酸酶。
就灭活RNAs而言,该酶可以具体地用于目标细胞RNAs的灭活,例如“反义”寡脱氧核糖核苷酸能够用于阻断mRNA功能。但是,由于本发明的酶提供了识别和催化两种功能,所以本发明的酶优于反义反应物,能够进行催化转换,而反义分子仅仅提供了等摩尔方式的识别(即非催化方式),而且还必须依靠其他细胞酶来进行RNA灭活反应。
下面部分描述了在上述“10-23”和“8-17”基序的基础上改进了的酶的制备。这些改进了的酶是通用型的酶,能够切割任一预先选定的目标序列,正如此处进一步描述的那样,这种目标特异性只依赖于该酶的底物结合区域序列。
按照上述实施例5中描述的方法,在连续数轮的选择扩增过程中,对定名为“10-23”和“8-17”的两个基序进行鉴定,再塑造使其成为分子问切割反应,并且表现出在这种方式下的高效运行。
用如图9中所示的产生对单个底物分子位点特异性催化切割的反应(即分子间切割)在下列类似生理条件下进行进一步的研究2mMMgCl2、150mM KCl、pH7.5和37℃,速度为约kcat=O.01min-1。
沿着底物的一个未配对的嘌呤核苷酸发生了切割,该核苷酸的旁侧是与酶互补的寡核苷酸。5’端和3’端切割产物分别带有一个2’(3’)环磷酸和5’羟基,表示着涉及攻击邻近磷酸上的2 羟基的反应机制。对于8-17和10-23这两个基序酶而言,只要酶的底物结合臂以互补的方式改变,就能做到改变底物序列而不丧失催化活性。酶8-17对于位于紧靠切割位点的下游处的rG-dt“摆动”配对有着特异性地需求。在这个位置上用Waston-Crick碱基对取代时催化活性消失。酶10-23的底物结合臂与底物之间完全是通过Waston-Crick配对而相互作用的。基序酶8-17和10-23的催化核心位于两个底物结合臂之间,分别含有13和15个脱氧核苷酸。
为了更精确地定义催化核心的序列要求,每种基序都构建了一个1014个突变体的文库,在整个核心中的每个核苷酸位置上都导入了机率为25%的突变。每个文库都用6种不同的体外选择方法进行处理,包括共52轮的选择性扩增。为了对与这两种原型分子有关的序列进行一次彻底的测试,对筛选方法和严紧性都进行了改变。对来自所选择群体的个体进行了克隆,测序,并测定了催化活性。该方法具体操作如下。
在酶8-17和10-23基础上的重选择包括对每种基序的6个不同的系统。每个系统需要5~21轮体外筛选,在筛选操作和反应时间上相同。所有切割反应均在下列条件下进行2mM MgCl2、150M NaCl、50mMTris*HCl(pH7.5),37℃。反应时间从早期轮次的60min变化到晚期轮次的1min。模板的每个起始库都建立在与原型互补序列的基础之上,该原型分子带有每个都是7个核苷酸的固定的结合臂和一个每个核苷酸位置上都有机率为25%的随机性的催化核心。对于基序8-17和10-23而言,模板分别具有以下序列5’-gtgccaagcttaccgagtaactTCG-TCCGGCTCGGRagatgggtcgtctgtccttccATCTCTAGTTACTTTTTC-3’和5’-gttgccaagcttaccg-ggaaaaaTCGTTGTAGCTAGCCtaactaggtcgtctgtccttccATCTCTAGTTACTTTTTC-3’(PCR引物位点用小写字母表示;下划线部分是底物结合臂;斜体部分是随机位置)。该模板引导的延伸中使用的引物的序列如下5’-生物素-r(GGAAAAA-GUAACUAGAGAUGG)d(AAGAGATGGCGAC)-3’。以8-17为基础的筛选所用的引物为5’-GTGCCAAGCTTACCGAGTAACT-3’和5’-d(GGAAGGACAGACGACC-CATC)rU,以10-23为基础的筛选所用的引物为5’-GTGCCAAGCTTACCGGGAAAAA-3’和5’-d(GGAAGGACAGACGACCTAGTT)rA。PCR引物中包括结合臂,因此固定了这些序列。每套引物其中1个含有1个3’末端核糖核苷酸,这就使得能够通过非模板链的碱性水解以及随后的聚丙烯酰胺凝胶电泳纯化分离,把模板链从双链PCR产物中分离出来。上述系统中的一些使用了以凝胶为基础的筛选方案。在这些情况下,PCR引物为5’-生物素-GTGCCAAGCTTACCG-3’和5’-GAAAAAGTAACTAG-AGATGGAAGGACAGACGACC-3’,延伸反应是利用引物5’-r(GGAAAAAGUAACUAGAGAUGGAAG)-3’在固体载体上进行的。向反应混合物中加入微量的[α-32P]-dATP标记延伸产物,用碱洗脱延伸产物,并用变性聚丙烯酰胺凝胶纯化方法进行了纯化,然后用电洗脱回收。然后让这些分子反应,凝胶电泳分离切割后的分子。
如上所述,初始筛选的第8轮和第10轮以后,对单个分子进行克隆和测序。来自第8轮的第17个克隆(8-17)和来自第10轮的第23个克隆(10-23)分别具有以下序列5’-cacggttcga-atggcGTTATGCATCACACTATTTTTCATTGAAGCAGGCCGAGCCTT CCACCTTCcagcggtag-agaagg-3’和5’-cacggttcgaatggcATGTTAAGTTCGTCCCTTTTTAGCAACATCGATCGGATT-GGTTTCCCcagcggtagagaagg-3’(小写字母部分为PCR引物位点;下划线部分是底物结合臂)。对于分子间反应来说,合成的寡脱氧核苷酸是在上述克隆序列的基础上制备而成的,但不含底物结合臂之外的区域。它们可以用于切割与构建初始文库所使用的引物序列相同的的全部-RNA的底物(见上述内容)。随后,DNA酶的底物结合臂被缩短到每个只含7个核苷酸,并且与RNA底物完美地互补。
就酶8-17而言,克隆个体中序列变化表明,催化活性核心由一个内在的短茎-环结构与紧随其后的含4-5个核苷酸的不配对区域组成(图10)。茎部分总是包含3个核苷酸,至少其中有2个是G-C。环部分是固定不变的,序列为5’-AGC-3’。茎延长或环序列改变的合成结构都没有表现出催化活性。不配对区域把茎的3’端的半段与下游底物结合结构域连接起来,该不配对区域的序列为5’-WCGR-3’或5’-WCGAA-3’(W=A或T;R=A或G)。这个区域中序列为5’-TCGAA-3’的突变体表现出的催化活性最强,但是这种在酶8-17适用的改良不适用于其他底物序列。
尽管酶基序10-23的催化核心的第8位核苷酸是T时(原型中就是如此)提供了最高水平的活性,但是该位置上的核苷酸可以变化为T、C或A。对RNA底物与相应的互补DNA酶形成的大量不同的组合的测试发现基序10-23可以适应任一底物序列。
然后,用多次转换反应测量基序10-23和8-17的突变体的催化活性,典型地,不同的日子进行的同一实验表现出<20%的偏差。在1次转换和多次转换实验得到的动力学数值是近似的;用合成的RNA底物得到的数值比用体外转录的底物得到的数值稍差。从Kobs vs.Kobs/[S]的改良Eadie-Hofstee曲线的最佳拟合线的y轴截距和负斜率中分别测定了kcat和Km的报道值。在持续的Km的[S]范围内,每条曲线由10个数据点组成,[S]相对于[E]过量10倍。典型地,Kobs值建立在从反应起初的10%阶段得到5个数据点的基础之上。将底物和酶单独在反应缓冲液中预温育10min,然后合并启动反应。为了防止物质吸附到管壁上,所有反应中均加有0.01%十二烷基硫酸钠。加入50mM 4-(2-羟乙基)-哌嗪-1-丙磺酸。动力学数值不依赖于缓冲液的同一性。用20%的聚丙烯酰胺凝胶电泳分离反应产物,用磷光计(phosphorimager)定量。
切割发生在1个单个未配对核苷酸的3’端一侧,优选地该核苷酸是1个后面接1个嘧啶的嘌呤。由A和U围成的目标位点的切割效率最高,在类似生理条件下的催化速度为约0.1min-1。
一个在A*U位点切割切割RNA的DNA酶能够被用于以任一mRNA起始密码子(A*U)为目标。作为实验,制备了对应于HIV-1 gag/聚合酶(gag/pol)mRNA(5’-GGAGAGAGA*UGGGUGCG)的17mer的合成版本和体外转录版本。在一个类似生理条件下进行的以kcat为0.15min-1、Km为0.47nM起始的反应中,这两种版本的底物都在期望位置被相应的DNA酶10-23切割(催化效率,kcat/Km=3.2×108M-1min-1)(图11)。在1~250mM的浓度范围内,催化速度随着MgCl2浓度的增加而加快,pH7.5和37℃的条件下Mg2+的表观Km值为180mM。在7.0~8.5的pH范围内,催化速度以近似对数方式随着pH的升高而加快,这与被切割的磷酸酯邻接处的2’羟基的去质子化一致。pH8.0、37℃以及50mM MgCl2存在的条件可以用于RNA的实验室操作,这种条件下,kcat为3.4min-1且Km为0.76nM。与已知的切割RNA的RNA酶相比,DNA酶10-23的催化效率在生理条件和实验条件下都有利。与蛋白质酶核糖核酸酶A相比,该DNA酶的kcat降低了104倍而Km优化了105倍。
酶10-23能够被用于切割各种生物学上相关RNAs。我们制备了与HIV-1的gag/聚合酶、env、vpr、tat、nef IGF-R和E100连接酶的mRNA起始位点周围的15-17个核苷酸相对应的合成RNA底物。上述每种底物都在预期的位置被合成的DNA酶切割,该酶中包含10-23催化核心及其旁侧的每个都由7~12个核苷酸组成的底物结合臂(表4)。类似生理条件下,上述所有情况的催化速度都是约0.1min-1。然而,Km值随着底物核苷酸组成的不同而不同。对于富含鸟嘌呤核苷的gag/聚合酶底物,当使用的是7个核苷酸的底物结合臂或7个核苷酸的底物结合臂时,Km<1nM。当使用的是7个核苷酸的底物结合臂时,env和vpr底物以效率低得多的Km切割,但是当这些底物结合臂每个上的核苷酸数目增至8个时Km得到充分的优化。
表4类似生理条件下各种RNA底物的DNA-催化下的切割基因SEQ ID N0 目标序列臂长 kcat(min-1) Km(nM)HIV-1gag 102 GGAGAGAGA*UGGGUGCG 8+8 0.10.7gag 103 GAGAGAGA*UGGGUGC 7+7 0.10.9env 104 CAGUGGCAA*UGAGAGUG 8+8 0.04 9env 105 AGUGGCAA*UGAGAGU 7+7 0.03 900vDr 106 GAGGAUAGA*UGGAACAA 8+8 0.120vDr 107 AGGAUAGA*UGGAACA 7+7 0.08 500tat 108 GCAAGAAA*UGGAGCC 7+7 0.04 300nef 109 CUAUAAGA*UGGGUGA 7+7 0.05 900FIVgag 110 UACAGCAACA*UGGGGAAUGG9+100.005 8gag 111 CAUGGGGAA*UGGACAGGG 8+9 0.006 5IGF-R112 CAAAUAAAAGGGA*UGAAGUCUGG 12+10 0.02 20113 AAGGAAUGAAG*UCUGGCUCCG 10+10 0.350114 AUACCGCAAAG*UCUUUGAGAAUU 10+12 0.130115 AAGUCUUUGAGAG*UUUCCUGCAC 12+10 0.05 21116 AACACCACCA*UGUCCAGCC 9+9 0.06 2117 GGCCUUUCACA*UUGUACCGC10+90.110118 UUGUACCGCA*UCGAUAUCCAC 9+110.06 1E100 连接酶119 GAACAUUACAUUA*UAGUGACCAG 12+10 1.080表4中测定并给出的动力学数值是在多次转换条件下得到的,合成的RNA底物比合成的DNA酶过量10倍以上,使用的反应条件如下2mMMgCl2、150mM NaCl、pH7.5、37℃,在25mM MgCl2存在下得到的。
作为对本发明的DNA酶能够提供的底物结合区域(臂)的突变体的进一步说明,这些臂的长度系统的变化范围为4~13个核苷酸残基,使用表4中所示的HIV-1gag基因起始密码子目标核苷酸序列。除了臂长进行如图13所示的变化外,上述制备的每种DNA酶结构的反应都是单独进行的。与以前一样,催化活性DNA酶的动力学特性在以下条件下测定的2mM Mg2+、150M NaCl、pH7.5、37℃,并测定了酶的多次转换。对基序10-23修饰使其能与HIV-1gag基因互补结合后,测量Kcat(min-1)和Km(nM),并显示于图13中。
这些结果表明,每个底物结合区域的每个臂中的核苷酸在5~13的全部范围内观察到的催化速度都是有效的,而在7~10个核苷酸的优选范围内是特别有效的。这些结果还表明,对于5~13个核苷酸的臂长而言,达到最大催化速度一半(half maximal cataylsis)时酶的有效浓度为100~0.05纳摩尔(nM),7~13个核苷酸的长度特别优选。
把多种修饰掺入到DNA酶10-23中,并测试其在10%的胎牛血清中的稳定性(图13)。这些修饰包括1)该DNA的3’末端的1个“倒转的”(3’,3’-连接)胸腺嘧啶;2)两个底物结合臂的远端一侧的5个2’-O-甲基残基;3)在两个底物结合臂的所有位置上的2’-O-甲基残基;4)催化核心中的5个嘌呤-嘌呤位点上的硫代磷酸酯位点;5)两个底物结合臂远端侧上的3个硫代磷酸酯。倒转的胸苷酸提供的保护最好(t1/2>60min)。除核心上的那5个P=S取代以外,与未修饰的DNA相比,所有其他修饰都导致了血清稳定性的增强。所有修饰后的DNA酶都保持了催化活性。
因此,本发明描述了一种具有位点特异性内切核酸酶活性的催化活性DNA分子,该分子可以设计成切割任一预先选定的底物核酸序列。该DNA分子(酶)具有位于核心区域旁侧的第一和第二两个底物结合区域(臂),每个臂上都有一段与目标底物核酸序列中的部分互补的序列,因此第一和第二臂一起限定出了被切割的底物核酸序列。互补意味着底物结合区域与目标序列通过常规的Waston-Crick碱基配对方式结合在一起。
上述臂可以有多种长度。但是,因为看到长度能够影响催化速度(kcat)和酶的有效浓度(Km),所以优选的臂长为每个臂有5~13核苷酸互补,优选约6~11个核苷酸,更优选长度约7~10个核苷酸。
核心区域具有以下列通式为基础的多种序列(I.)T(茎)’AGC(茎)”Z,其中所述的(茎)’和(茎)”都是3个连续的核苷酸,以(茎)’∶(茎)”配对杂交时,其中应包括至少2个G∶C对,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G。这种茎结构如图10所示,显示了3个互补的碱基对。具体优选的是图10所示的基序8-17的核心区域的原型结构,“TCCGAGCCGGACGA”(SEQ ID NO 120)。
在另一个实施方案中,该核心区域能够具有根据下列通式的序列(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。具体优选的是图10所示的基序10-23的核心区域的原型结构,“RGGCTAGCTACAACGA”(SEQ ID NO121)。
如图12所示,上述设计的DNA酶能够根据臂的长度不同表现出一定范围的有用的催化速度和有效催化浓度。生理条件下,典型地,根据基序8-17或10-23的本发明的DNA酶具有约0.005~0.1min-1的催化转换速度(Kcat),优选约0.01~0.1min-1,更优选约0.03~0.1min-1。一种具体优选的酶的速度为约0.1min-1。在生理条件下,本发明的根据基序8-17或10-23的DNA酶也具有约0.05~1000纳摩尔(nM)的催化半数最大有效浓度(half maximal effective concentration)(Km),优选约0.7~900nM,更优选低于约1.0微摩尔(μM),最优选约0.1(μM)。
上述内容还说明,一种优选的DNA酶具有的核苷酸修饰能稳定该DNA酶使其能在生理条件下使用。只要该酶按照此处定义和测量的那样能保持它的催化活性,那么多种修饰中的任一种都可以选用,因此本发明不只限于一种具体的稳定修饰。优选的修饰能使目标DNA对外源或内源溶核消化(nucleolytic digestion)的敏感性减弱。在一个实施方案中,所述修饰包括掺入1个或多个核苷硫代磷酸酯残基,这种描述见Zhang etal,Biochem.Pharmacol.,50545-556(1995)或Stein,C.A.,TrendsBiotechnol.,14147-149(1996)。硫代磷酸酯可以出现在臂中或核心中,在一个实施方案中可包括位于核心中的1个二联嘧啶(dipyrimidine)上的1个残基。众所周知并如上述Zhang等人描述的那样,另一种修饰包括糖核苷酸的核糖或脱氧核糖成分的2’位置上的O-甲基的取代。另外一种修饰是把1个插入的末端核苷酸连接到DNA分子的3’末端上,从而封闭了该3’末端,如同1个自由的5’末端。这种结构能够阻断3’内切核酸酶,可以通过在3’末端形成1个3’-3’连接的核苷酸(即一个倒转的核苷酸)。在3’末端制备1个3’插入核苷酸是众所周知的,利用寡核苷酸合成中的修饰后的固体载体,该载体以插入的末端3’残基为起始原料的。一种优选的用于该目的的固体载体材料是Dt-5’-CPG 500,可从Glen Research(标准成分,VA),是一种带有修饰后残基的经修饰的可控制孔(Controlled pore)的玻璃树脂。
上述包括特定的实施方案和实施例的说明书是用来说明本发明的,而并非对本发明的限制。不脱离本发明的实际精神和范围可以得出大量其他的变化和修改。
序列表(1)一般信息(i)申请人The Scripps Research Institute(ii)发明名称酶促DNA分子(iii)序列数101(iv)通讯地址(A)收件人The Scripps Research Institute(B)街道10666 North Torrey Pines Road,TPC-8(C)城市La Jolla(D)州加利弗尼亚(E)国家美国(f)邮政编码92037(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC可兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.25(vi)当前申请资料(A)申请号PCT/US95/(B)申请日01-DEC-1995(C)分类号(vii)在先申请资料(A)申请号US 08/472,194
(B)中请日1995-6-07(vii)在先申请资料(A)申请号US 08/349,023(B)申请日1994-12-2(viii)律师/代理人资料(A)姓名Logan,April C.
(B)登记号33,950(C)资料/文档号463.2 PC(ix)通讯资料(A)电话(619)554-2937(B)传真(619)554-6312(2)SEQ ID NO1的资料(i)序列特征(A)长度15个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO1CGGTAAGCTT GGCAC 15(2)SEQ ID NO2的资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ii)分子类型DNA(基因组)(ix)特征
(A)名称/关键词misc_差异(B)位置取代(8,″″)(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO2TCACTATNAG GAAGAGATGG 20(2)SEQ ID NO3的资料(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO3ACACATCTCT GAAGTAGCGC CGCCGTATAG TGACGCTA 38(2)SEQ ID NO4的资料(i)序列特征(A)长度80个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO4GTGCCAAGCT TACCGNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNGTCGC CATCTCTTCC 80(2)SEQ ID NO5的资料(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征
(A)名称/关键词misc_特征(B)位置28(D)其它资料/标准名=“2’3’环磷酸”(ix)特征(A)名称/关键词misc-差异(B)位置取代(28,””)(C)其他资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO5GGGACGAATT CTAATACGAC TCACTATN 28(2)SEQ ID NO6的资料(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_差异(B)位置取代(28,″″)(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO6GGGACGAATT CTAATACGAC TCACTATN 28(2)SEQ ID NO7的资料(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_差异(B)位置取代(8,″″)
(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO7TCACTATNGG AAGAGATGG 19(2)SEQ ID NO8的资料(i)序列特征(A)长度8个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_差异(B)位置取代(8,″″)(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO8TCACTATN 8(2)SEQ ID NO9的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO9CCATCTCTTC CTATAGTGAG TCCGGCTGCA 30(2)SEQ ID NO10的资料(i)序列特征(A)长度15个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)
(xi)序列描述SEQ ID NO10GTGCCAAGCT TACCG 15(2)SEQ ID NO11的资料(i)序列特征(A)长度43个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO11CTGCAGAATT CTAATACGAC TCACTATAGG AAGAGATGGC GAC 43(2)SEQ ID NO12的资料(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_差异(B)位置取代(8,″″)(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO12TCACTATNGG AAGAGATGG 19(2)SEQ ID NO13的资料(i)序列特征(A)长度43个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征
(A)名称/关键词misc_差异(B)位置取代(28,″″)(D)其它资料/标准名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO13GGGACGAATT CTAATACGAC TCACTATNGG AAGAGATGGC GAC 43(2)SEQ ID NO14的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO14TCACACATCT CTGAAGTAGC GCCGCCGTAT GTGACGCTAG GGGTTCGCCT50(2)SEQ ID NO15的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO15GGGGGGAACG CCGTAACAAG CTCTGAACTA GCGGTTGCGA TATAGTCGTA50(2)SEQ ID NO16的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO16CGGGACTCCG TAGCCCATTG CTTTTTGCAG CGTCAACGAA TAGCGTATTA50
(2)SEQ ID NO17的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO17CCACCATGTC TTCTCGAGCC GAACCGATAC TTACGTCATA CCTCCCGTAT50(2)SEQ ID NO18的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO18GCCAGATTGC TGCTACCAGC GGTACGAAAT AGTGAAGTGT TCGTGACTAT50(2)SEQ ID NO19的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO19ATAGGCCATG CTTTGGCTAG CGGCACCGTA TAGTGTACCT GCCCTTATCG50(2)SEQ ID NO20的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO20TCTGCTCTCC TCTATTCTAG CAGTGCAGCG AAATATGTCG AATAGTCGGT50(2)SEQ ID NO21的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO21TTGCCCAGCA TAGTCGGCAG ACGTGGTGTT AGCGACACGA TAGGCCCGGT50(2)SEQ ID NO22的资科(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO22TTGCTAGCTC GGCTGAACTT CTGTAGCGCA ACCGAAATAG TGAGGCTTGA50(2)SEQ ID NO23的资料(i)序列特征(A)长度107个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_差异(B)位置取代(28,″″)
(D)其它资料/标准名=“腺苷核糖核苷酸”/标记物=rA(xi)序列描述SEQ ID NO23GGGACGAATT CTAATACGAC TCACTATNGG AAGAGATGGC GACATCTCNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNNNNNNGT GACGGTAAGC TTGGCAC 107(2)SEQ ID NO24的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO24CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGCTCT TGTTAGTAT 49(2)SEQ ID NO25的资料(i)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO25TCTCTTCAGC GATGCACGCT TGTTTTAATG TTGCACCCAT GTTAGTGA 48(2)SEQ ID NO26的资料(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO26TCTCATCAGC GATTGAACCACTTGGTGGAC AGACCCATGT TAGTGA 46
(2)SEQ ID NO27的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO27CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGTTCT TGTTAGTAT 49(2)SEQ ID NO28的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO28CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGCTCT CGTTAGTAT 49(2)SEQ ID NO29的资料(i)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO29TCTCAGACTT AGTCCATCAC ACTCTGTGCA TATGCCTGCT TGATGTGA 48(2)SEQ ID NO30的资料(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO30CTCTCATCTG CTAGCACGCT CGAATAGTGT CAGTCGATGT GA42(2)SEQ ID NO31的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO31TACAGCGATT CACCCTTGTT TAAGGGTTAC ACCCATGTTA 40(2)SEQ ID NO32的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO32ATCAGCGATT AACGCTTGTT TCAATGTTAC ACCCATGTTA 40(2)SEQ ID NO33的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO33TTCAGCGATT AACGCTTATT TTAGCGTTAC ACCCATGTTA 40(2)SEQ ID NO34的资料
(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO34ATCAGCGATT CACCCTTGTT TTAAGGTTGC ACCCATGTTA 40(2)SEQ ID NO35的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO35ATCAGCGATT CACCCTTGTT TAAGCGTTAC ACCCATGTTG 40(2)SEQ ID NO36的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO36ATCAGCGATT CACCCTTGTT TTAAGGTTAC ACCCATGTTA 40(2)SEQ ID NO37的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO37ATCAGCGATT AACGCTTATT TTAGCGTTAC ACCCATGTTA 40(2)SEQ ID NO38的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO38ATCAGCGATT AACGCTTGTT TTAGTGTTGC ACCCATGTTA 40(2)SEQ ID NO39的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO39ATCAGCGATT AACGCTTATT TTAGCATTAC ACCCATGTTA 40(2)SEQ ID NO40的资料(i)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO40GCCATGCTTT10(2)SEQ ID NO41的资料(i)序列特征
(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO41CTCTATTTCT10(2)SEQ ID NO42的资料(i)序列特征(A)长度12个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO42TATGTGACGC TA 12(2)SEQ ID NO43的资料(i)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO43TATAGTCGTA10(2)SEQ ID NO44的资料(i)序列特征(A)长度11个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)
(xi)序列描述SEQ ID NO44ATAGCGTATT A 11(2)SEQ ID NO45的资料(i)序列特征(A)长度13个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO45ATAGTTACGT CAT13(2)SEQ ID NO46的资料(i)序列特征(A)长度14个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO46AATAGTGAAG TGTT 14(2)SEQ ID NO47的资料(i)序列特征(A)长度11个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO47ATAGGCCCGG T 11(2)SEQ ID NO48的资料(i)序列特征(A)长度14个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO48AATAGTGAGG CTTG 14(2)SEQ ID NO49的资料(i)序列特征(A)长度12个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型RNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO49GUAACUAGAG AU 12(2)SEQ ID NO50的资料(i)序列特征(A)长度98个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(ix)特征(A)名称/关键词misc差异(B)位置7..18(D)其它资料/注意=“第7~18位是RNA;序列其余部分为DNA”(xi)序列描述SEQ ID NO50GGAAAAGUAA CUAGAGAUGG AAGAGATGGC GACNNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNCGGTAAG CTTGGCAC 98(2)SEQ ID NO51的资料(i)序列特征(A)长度99个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(ix)特征(A)名称/关键词misc_差异(B)位置1..24(D)其它资料/注意=“第1~24位是RNA;序列其余部分为DNA”(xi)序列描述SEQ ID NO51GGAAAAAGUA ACUAGAGAUG GAAGAGATGG CGACNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNNCGGTAA GCTTGGCAC99(2)SEQ ID NO52的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO52CCAATAGTGC TACTGTGTAT CTCAATGCTG GAAACACGGG TTATCTCCCG50(2)SEQ ID NO53的资料(i)序列特征
(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO53CCAAAACAGT GGAGCATTAT ATCTACTCCA CAAAGACCAC TTTCTCCCG 50(2)SEQ ID NO54的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO54ATCCGTACTA GCATGCAGAC AGTCTGTCTG CTTTTTCATT ACTCACTCCC50(2)SEQ ID NO55的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO55CAATTCATGA TGACCAACTC TGTCAACACG CGAACTTTTA ACACTGGCA 49(2)SEQ ID NO56的资料
(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO56CTTCCACCTT CCGAGCCGGA CGAAGTTACT TTTTATCACA CTACGTATTG50(2)SEQ ID NO57的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO57GGCAAGAGAT GGCATATATT CAGGTAACTG TGGAGATACC CTGTCTGCCA50(2)SEQ ID NO58的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO58CTAGACCATT CACGTTTACC AAGCTATGGT AAGAACTAGA ATCACGCGTA50
(2)SEQ ID NO59的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO59CGTACACGTG GAAAAGCTAT AAGTCAAGTT CTCATCATGT ACCTGACCGC50(2)SEQ ID NO60的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO60CAGTGATACA TGAGTGCACC GCTACGACTA AGTCTGTAAC TTATTCTACC50(2)SEQ ID NO61的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO61ACCGAATTAA ACTACCGAAT AGTGTGGTTT CTATGCTTCT TCTTCCCTGA50(2)SEQ ID NO62的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO62CAGGTAGATA TAATGCGTCA CCGTGCTTAC ACTCGTTTTA TTAGTATGTC50(2)SEQ ID NO63的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO63CCCTACAACA CCACTGGGCC CAATTAGATT AACGCTATTT TATAACTCG 49(2)SEQ ID NO64的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无
(xi)序列描述SEQ ID NO64CCAAACGGTT ATAAGACTGA AAACTCAATC AATAGCCCAA TCCTCGCCC 49(2)SEQ ID NO65的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO65CACATGTATA CCTAAGAAAT TGGTCCCGTA GACGTCACAG ACTTACGCCA50(2)SEQ ID NO66的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO66CACAACGAAA ACAATCTTCC TTGGCATACT GGGGAGAAAG TCTGTTGTCC50(2)SEQ ID NO67的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无
(iv)反义无(xi)序列描述SEQ ID NO67CACACGAACA TGTCCATTAA ATGGCATTCC GTTTTTCGTT CTACATATGC50(2)SEQ ID NO68的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO68CAGAACGAGG GTCTTGTAAG ACTACACCTC CTCAGTGACA ATAATCCTG 49(2)SEQ ID NO69的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO69CACTACAGCC TGATATATAT GAAGAACAGG CAACAAGCTT ATGCACTGG 49(2)SEQ ID NO70的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)
(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO70GGGTACATTT ATGATTCTCT TATAAAGAGA ATATCGTACT CTTTTCCCCA50(2)SEQ ID NO71的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO71CCAAAGTACA TTCCAACCCCTT ATACGTGA AACTTCCAGT AGTTTCCTA 49(2)SEQ ID NO72的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO72CTTGAAGATC CTCATAAGAC GATTAAACAA TCCACTGGAT ATAATCCGGA50(2)SEQ ID NO73的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO73CGAATAGTGT CCATGATTAC ACCAATAACT GCCTGCCTAT CATGTTTATG50(2)SEQ ID NO74的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO74CCAAGAGAGT ATCGGATACA CTTGGAACAT AGCTAACTCG AACTGTACCA50(2)SEQ ID NO75的资料(i)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO75CCACTGATAA ATAGGTAACT GTCTCATATC TGCCAATCAT ATGCCGTA 48(2)SEQ ID NO76的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO76CCCAAATTAT AAACAATTTA ACACAAGCAA AAGGAGGTTC ATTGCTCCGC50(2)SEQ ID NO77的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO77CAATAAACTG GTGCTAAACC TAATACCTTG TATCCAAGTT ATCCTCCCCC50(2)SEQ ID NO78的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO78CCGAATGACA TCCGTAGTGG AACCTTGCTT TTGACACTAA GAAGCTACAC50(2)SEQ ID NO79的资料(i)序列特征(A)长度50个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO79CCATAACAAA TACCATAGTA AAGATCTGCA TTATATTATA TCGGTCCACC50(2)SEQ ID NO80的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO80CAGAACAAAG ATCAGTAGCT AAACATATGG TACAAACATA CCATCTCGCA50(2)SEQ ID NO81的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO81CCTTTAGTTA GGCTAGCTAC AACGATTTTT CCCTGCTTGG CAACGACAC 49(2)SEQ ID NO82的资料(i)序列特征(A)长度50个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO82CTCCCTACGT TACACCAGCG GTACGAATTT TCCACGAGAG GTAATCCGCA50(2)SEQ ID NO83的资料(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO83CGGCACCTCT AGTTAGACAC TCCGGAATTT TTCCCC 36(2)SEQ ID NO84的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO84CGGCACCTCT AGTTAGACAC TCCGGAATTT TAGCCTACCA TAGTCCGGT 49(2)SEQ ID NO85的资料(i)序列特征
(A)长度47个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO85CCCTTTGGTT AGGCTAGCTA CAACGATTTT TCCCTGCTTG AATTGTA 47(2)SEQ ID NO86的资料(i)序列特征(A)长度51个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO86CCCTTTGGTT AGGCTAGCTA CAACGATTTT TCCCTGCTTG ACCTGTTACG A 51(2)SEQ ID NO87的资料(i)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO87CCTTTAGTTA GGCTAGCTAC AACGATTTTT CCCTGCTTGG AACGACAC 48(2)SEQ ID NO88的资料
(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO88CATGGCTTAA TCATCCTCAA TAGAAGACTA CAAGTCGAAT ATGTCCCCC 50(2)SEQ ID NO89的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO89CAACAGAGCG AGTATCACCC CCTGTCAATA GTCGTATGAA ACATTGGGCC50(2)SEQ ID NO90的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO90TACCGACAAG GGGAATTAAA AGCTAGCTGG TTATGCAACC CTTTTCGCA 49
(2)SEQ ID NO91的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO91CTCGAAACAG TGATATTCTG AACAAACGGG TACTACGTGT TCAGCCCCC 49(2)SEQ ID NO92的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO92CCAATAACGT AACCCGGTTA GATAAGCACT TAGCTAAGAT GTTTATCCTG50(2)SEQ ID NO93的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO93CAATACAATC GGTACGAATC CAGAAACATA ACGTTGTTTC AGAATGGTCC50(2)SEQ ID NO94的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO94GCAACAACAA GAACCAAGTT ACATACACGT TCATCTATAC TGAACCCCCA50(2)SEQ ID NO95的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO95CCTTTGAGTT CCTAAATGCC GCACGGTAAG CTTGGCACAC TTTGACTGTA50(2)SEQ ID NO96的资料(i)序列特征(A)长度49个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无
(xi)序列描述SEQ ID NO96CAAAGATCTC ACTTTGGAAA TGCGAAATAT GTATATTCGC CCTGTCTGC 49(2)SEQ ID NO97的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO97CCACGTAGAA TTATCTGATT TATAACATAA CGCAGGATAA CTCTCGCCCA50(2)SEQ ID NO98的资料(i)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO98CACAAGAAAG TGTCGTCTCC AGATATTTGA GTACAAGGAA CTACGCCC 48(2)SEQ ID NO99的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无
(iv)反义无(xi)序列描述SEQ ID NO99CATGAAGAAA TAGGACATTC TACAGGCTGG ACCGTTACTA TGCCTGTAGG50(2)SEQ ID NO100的资料(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO100CATAGGATAA TCATGGCGAT GCTTATGACG TGTACATCTA TACCTT46(2)SEQ ID NO101的资料(i)序列特征(A)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iv)反义无(xi)序列描述SEQ ID NO101CAGATGATCT TCCTTTAAAG ACTACCCTTT AAAGAAACAT AAGGTACCCC50
权利要求
1.一种具有位点特异性内切核酸酶活性的催化活性DNA分子,这种活性针对预先选定的底物核酸序列中被定义为切割位点的核苷酸序列具有特异性,所述分子具有位于核心区域旁侧的第一和第二两个底物结合区域,其中所述的第一底物结合区域有一段序列与所述预先选定的底物核酸序列中的第一部分互补,所述的第二底物结合区域有一段序列与所述预先选定的底物核酸序列中的第二部分互补,所述核心区域有一段根据下列通式的序列(I.)T(茎)’AGC(茎)”Z,其中(茎)’和(茎)”都是具有以下特征的一种三联核苷酸即当(茎)’(茎)”杂交配对时形成的3个碱基对中至少包括2个GC对,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G;或(II)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。
2.权利要求1中的分子,其中所述的通式I为SEQ ID NO 120(8-17)。
3.权利要求1中的分子,其中所述的通式II为SEQ ID NO 121(10-23)。
4.权利要求1中的分子,其中所述的第一或第二底物结合区域的长度为5~13个核苷酸。
5.权利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括脱氧核糖核苷酸(DNA)、修饰后的DNA、核苷酸类似物或其组合。
6.权利要求1中的催化活性DNA分子,其中所述的底物核酸包括RNA、DNA、修饰后的RNA、修饰后的DNA、核苷酸类似物或其组合。
7.权利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括一段具有5’和3’末端的单链脱氧核糖核酸,其中所述的末端经过具有外切核酸酶抗性的核苷酸的修饰。
8.权利要求7中的催化活性DNA分子,其中所述的具有外切核酸酶抗性的核苷酸包括核苷硫代磷酸酯。
9.权利要求1中的催化活性DNA分子,其中所述的第一或第二底物结合区域包括至少2个硫代磷酸酯核苷。
10.权利要求1中的催化活性DNA分子,其中所述的核心区域包括在所述核心中的二联嘧啶上有1个硫代磷酸酯核苷。
11.权利要求7中的催化活性DNA分子,其中所述的3’末端包括1个倒转的(3’,3’-连接)核苷酸。
12.权利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括1个2’O-甲基核糖核苷酸。
13.权利要求1中的催化活性DNA分子,其中所述的第一和第二底物结合区域包括一段与选自SEQ ID NOs 102~119的序列互补的核苷酸序列。
14.权利要求1中的催化活性DNA分子,其中所述的分子能够催化Km值约0.05~1000nM的反应。
15.权利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子以低于约1.0微摩尔的Km与所述底物结合。
16.权利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子以低于约0.1纳摩尔的Km与所述底物结合。
17.权利要求1中的催化活性DNA分子,其中所述的分子具有的催化反应转换速度(kcat)为约0.005~0.1min-1。
18.权利要求1中的催化活性DNA分子,其中所述的内切核酸酶活性因二价阳离子的存在而增强。
19.权利要求18中的催化活性DNA分子,其中所述的二价阳离子选自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。
20.权利要求18中的催化活性DNA分子,其中所述的内切核酸酶活性因Mg2+存在而增强。
21.权利要求1中的催化活性DNA分子,其中所述的内切核酸酶活性因单价阳离子的存在而增强。
22.权利要求21中的催化活性DNA分子,其中所述的单价阳离子选自Na+和K+。
23.一种组合物,其中包括根据权利要求1的催化活性DNA分子的两种或多种群体,其中每种群体中的催化活性DNA分子能切割同一底物中的不同的核苷酸序列。
24.一种组合物,其中包括根据权利要求1的催化活性DNA分子的两种或多种群体,其中每种群体中的催化活性DNA分子能识别不同的底物。
25.一种切割目标核酸分子的方法,包括a)将根据权利要求1的催化活性DNA分子和具有一段由所述的第一和第二废物结合区域预筛的底物核酸序列的目标核酸分子混合,形成反应混合物;以及b)在预定的反应条件下,保持所述的混合物使得所述DNA分子能够切割所述目标核酸分子,从而产生一定数目的底物产物。
26.权利要求25中的方法,其中所述的底物包括RNA。
27.权利要求25中的方法,其中所述的预定的反应条件包括有单价阳离子、二价阳离子或二者的存在。
28.权利要求25中的方法,其中所述的混合包括把所述催化活性DNA分子导入到含目标核酸分子的细胞中。
29.一种构建催化活性DNA分子的方法,该分子能够切割目标核酸分子中的预定的底物核酸序列,该方法包括以下步骤a)从目标核酸分子中筛选一段长度为10~26个核苷酸的底物核酸序列;以及b)合成一种包括位于核心区域旁侧的第一和第二两个底物结合区域的脱氧核糖核酸分子,其中所述的第一底物结合区域有一段序列与所述预先选定的底物核酸序列中的第一部分互补,所述的第二底物结合区域有一段序列与所述预先选定的底物核酸序列中的第二部分互补,所述核心区域有一段根据下列通式的序列(I.)T(茎)’AGC(茎)”Z,其中(茎)’和(茎)”都是具有以下特征的一种三联核苷酸即当(茎)’(茎)”杂交配对时形成的3个碱基对中至少包括2个GC对,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G;或(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。
30.权利要求29中的方法,其中所述的通式I为SEQ ID NO 120(8-17)。
31.权利要求29中的方法,其中所述的通式II为SEQ ID NO 121(10-23)。
32.权利要求29中的方法,其中所述的第一或第二底物结合区域的长度为5~13个核苷酸。
33.权利要求29中的方法,其中所述的催化活性DNA分子包括脱氧核糖核苷酸(DNA)、修饰后的DNA、核苷酸类似物或其组合体。
34.权利要求29中的方法,其中所述的催化活性DNA分子包括一段具有5’和3’末端的单链脱氧核糖核酸,其中所述的末端经过具有外切核酸酶抗性的核苷酸的修饰。
35.权利要求29中的方法,其中所述的具有外切核酸酶抗性的核苷酸包括核苷硫代磷酸酯。
36.权利要求29中的方法,其中所述的第一或第二底物结合区域包括至少2个硫代磷酸酯核苷。
37.权利要求29中的方法,其中所述的核心区域包括在所述核心中的二联嘧啶上有1个硫代磷酸酯核苷。
38.权利要求34中的方法,其中所述的3’末端包括1个倒转的(3’,3’-连接)核苷酸。
39.权利要求29中的方法,其中所述的催化活性DNA分子包括1个2’O-甲基核糖核苷酸。
40.权利要求29中的方法,其中所述的第一和第二底物结合区域包括一段与选自SEQ ID NOs 102~119的序列互补的核苷酸序列。
41.权利要求29中的方法,其中所述的分子能够催化Km值为约0.05~1000nM的反应。
42.权利要求29中的方法,其中所述的分子具有的催化反应转换速度(kcat)为约0.005~0.1min-1。
43.权利要求29中的方法,其中所述的内切核酸酶活性因二价阳离子的存在而增强。
44.权利要求43中的方法,,其中所述的二价阳离子选自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。
45.权利要求29中的方法,其中所述的内切核酸酶活性因单价阳离子的存在而增强。
46.权利要求45中的方法,其中所述的单价阳离子选自Na+和K+。
全文摘要
本发明公开了一种脱氧核糖核酸酶——催化活性DNA分子或酶促DNA分子——这种酶能够以位点特异性的方式切割核酸序列或核酸分子,尤其是RNA分子,并且还公开了含有这种酶的组合物。本发明还公开了制备及使用本发明中的酶和组合物的方法。
文档编号C12N9/22GK1261920SQ98806724
公开日2000年8月2日 申请日期1998年4月29日 优先权日1997年4月29日
发明者G·F·乔伊斯, R·R·布雷克 申请人:斯克里普斯研究学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1