专利名称:一种建立非随机Ribozyme库和非随机DNAzyme库的方法
技术领域:
本发明涉及后基因组时代的基因结构、基因功能及基因型和表型相关性等方面的研究;具体地说,本发明提供了一种简单实用的技术原理和技术方法,在这些原理和方法的基础上,可以建立针对任意来源的基因序列建立非随机的Ribozyme库和非随机的DNAzyme库,而后者则为对相应的基因的表达水平的操纵提供了有效的工具;本发明提供的方法,为基因结构和功能相关性的研究乃至基因型和表型的相互关系的研究,构成了新的有效的手段。
背景技术:
在包括人类基因组在内的多个物种的基因组序列的测定工作取得重大进展之后,生命科学面临的一个重大的挑战,就是对基因组序列所含有的基因的功能进行研究。而在所有基因功能研究相关的手段中,Ribozyme和DNAzyme被证明是一种非常行之有效的工具(Breaker RR et al,2003;Sun LQ et al,2000)。Ribozyme是一类具有特殊功能的RNA分子,DNAzyme则是一类根据Ribozyme分子的作用机制而在实验室里设计出来的DNA分子,Ribozyme分子和DNAzyme分子都可以通过对目标RNA分子的特异性识别并对目标RNA分子进行特异性的切割,显然,当目标RNA分子属于mRNA分子时,Ribozyme分子和DNAzyme分子则可以在转录的水平上降低甚至阻断相应基因的表达(Breaker RR et al,2003;Sun LQ et al,2000)。Ribozyme在许多基因的功能确定的过程中发挥了重要的作用,近来DNAzyme也发挥了类似的作用。然而,在生命科学发展到后基因组时代的今天,如何使得Ribozyme相关的方法适应于全基因组范围对基因功能的系统研究,就成了一个最值得关注的方向。Ribozyme库显然是可以满足这一需求的工具(Suyama E et al,2003;Rhoades K et al 2003)。
目前已报导的Ribozyme库,主要是通过随机合成的方法构建的,即将对应于Ribozyme分子中具有特异识别功能的碱基序列用随机序列代替;这样,至少在理论上,由此得到的Ribozyme库可以和任意可能的作为底物的目标序列结合并产生切割作用(Suyama E et al,2003;Rhoades K et al 2003);但是,具有随机序列的Ribozyme库却有两个基本点固有的局限其一,效率较低;例如,一个Hammerhead类型的Ribozyme库,其中含有的用于特异性识别的随机序列部分的总的长度,如果需要达到15个碱基,这就意味着一个完整的随机库所代表的不同序列的总和,应是415,即大于1.6×109,而对大多数的研究目的而言,随机库中的相当数量的分子是毫无用处的,这就在无形中增加了无效工作的比例;其二,较难构建含有更长随机序列的Ribozyme库;Ribozyme分子中的特异识别序列的长度,事实上可以有很大的变化,在一些情况下,含有较长特异识别序列的Ribozyme,可能更为有效;但随机序列的总长度的延长,即意味着随机库容量的加大,这就必将给库的维持和应用带来困难。正是由于随机Ribozyme库固有的局限,其在后基因组时代的应用空间也被大大的压缩了。
为消除随机Ribozyme库在应用上存在的诸多限制,本发明提供了一种直接从目标序列中截取一定长度的片段并以此为基础构建Ribozyme库的方法,利用本发明提供的方法得到的Ribozyme库的所有对应的Ribozyme分子,都可以特异性的识别目标序列的某个序列片段;例如,当目标序列是人类基因组表达的所有mRNA分子时,则即使根据目前对人类基因组所含有的基因总数的最大胆的估计,也不会超过十万个,那么,对一个代表量为107的Ribozyme库而言,就达到100∶1的(库容∶底物)比。本发明提供的方法,无疑在避免了随机库的缺陷的基础上,大大提高了后基因组时代Ribozyme作为一种基因功能研究工具的应用空间。
发明概述本发明所依据的原理,是利用具备一定特征的外源序列的功能,从任意已知或者未知目标序列中,截取一定长度的短的序列片段,然后对被截取的序列片段加以改造,使之成为能够产生和目标序列中被截取的片段相对应的,即可以对含有被截取片段同样的序列的RNA分子作特异性识别的Ribozyme分子的结构。图1所示,是本发明所依据的原理的一般说明。
通常情况下,Ribozyme的作用对象,是RNA分子,特殊情况下,一些在Ribozyme基础上开发出来的分子,例如DNAzyme,也可以作用于DNA分子,但在常规的分子生物学操作的意义上,RNA分子显然可以被转换成DNA分子并在此基础上进行操作,例如可以利用非常一般的分子生物学手段,将mRNA转换成cDNA进行操作。图1对本发明所依据的原理的一般说明,即在DNA的水平上进行。其所示意的研究目标是从目标序列中截取一定长度的序列片段(图1中位于A、B之间的序列片段),并通过后续手段,对被截取的序列片段进行删除、插入等操作,并最终将之克隆到含有合适的外周序列结构的环境中去。而这个过程,大体是通过以下的功能性步骤实现的第一步,在目标序列中A点的外侧,引入一段具备一定特征的外源序列,该外源序列至少含有一个SRE位点。SRE位点是一类能够和特殊的识别和催化体系进行作用的序列或者结构。本发明中常用的SRE位点,是一类特殊的限制性内切酶的识别位点,其中比较典型的如Type IIS限制性内切酶等,例如BbsI,BseRI,SapI等(Aggarwal AK et al,1998;Richard JR et al,2003);第二步,利用和外源序列含有的SRE位点对应的识别和催化体系,例如与外源序列中含有的特异识别位点对应的Type IIS限制性内切酶的作用,在目标序列中A、B之间的某个点上形成双链的酶切,同时利用酶切留下的末端将另一段外源序列引入该酶切点,显然,利用这个在A、B之间新引入的外源序列中含有的SRE位点,就可以在目标序列中再引入一级外源序列,对图示所要达到的研究目的来说,类似的过程的重复进行,就是最终在目标序列中A、B序列片段的B点的外侧,引入一段非典型的外源序列,这里所说的非典型的外源序列的含义是在最后B点外侧的含有的外源序列中,可以根据具体的实验,可以含有SRE位点,但也可以不含SRE位点。这样,在经过对各级外源序列及其所含有的SRE位点的功能的连续使用,就可以最终在目标序列的A、B序列片段的B点的外侧形成一个插入。当然,在具体的操作中,图1的示意中位于目标序列的A、B两点之间的所有外源序列将被彻底删除,并在删除的同时,使原来的序列得到完全的恢复;第三步,在第二步工作的基础上,将目标序列中A、B之间的序列片段克隆出来;第四步,对第三步中通过克隆手段截取出来的位于目标序列中A、B之间的序列片段作进一步修饰,根据具体的研究目的,这种修饰可以包括对被克隆的片段两侧或者中间的序列进行的包括删除和/或插入在内的实验所需要的修饰;在图1的示意中,最终得到的,将是含有满足要求的上游序列、中间序列和下游序列的序列片段。
值得强调指出的是,图1所示,只是对本发明所依据的原理的概要性说明,而针对不同研究需要的具体的实验过程,将会复杂得多。
显然,对应于非随机Ribozyme库的构建而言,将有必要对从目标序列中截取的序列片段作有针对性的修饰。图2所示,是对非随机Ribozyme库构建过程中所作的修饰的概要性说明1,从目标序列中截取一定长度的序列片段;通常情况下,将来源于同一目标序列的不同区域,或者不同目标序列的被截取的序列片段收集在一起,就形成了一个具有一定长度的序列片段的混合体(pool);
2,在以上得到的具有一定长度的序列片段的混合体中,选择具有一定特征的序列片段;图2的示意中,则象征性的表示为选择在两个斜体N指示的碱基位置上具备一定特征的序列片段;图2中以两个斜体的X指示被选择的序列片段的特征;3,对被选择出来的序列片段进行修饰;其实施的途径之一可以是在以上被选择出来的序列片段的合适位置上插入一段外源序列,并在后续的步骤中,借助这段外源序列将被选择出来的序列片段中不必要的碱基删除,同时引入必要的新的碱基序列;图2的示意中,则是象征性指示为外源序列F的插入,以及在后续的步骤中,借助外源序列F,将被选择出来的序列片段中斜体指示的XXN删除,并代之以新的碱基序列,即图2的示意中以小写的nnnn指示的部分;4,将修饰得到的序列片段,克隆到合适的序列环境中去;;通常情况下,是将之克隆到合适的载体中去;作为对图2所描述的过程的进一步说明,图3所示是属于Hammerhead类的针对特定的目标序列的Ribozyme库的构建的示意,其大致的过程是这里假定目标序列是来自任意mRNA序列的双链cDNA序列,图3示意中的目标序列的上部的正义链的序列和作为序列来源的mRNA序列一致。以此为基础的Hammerhead Ribozyme库的构建,将需要首先从目标序列中截取一定长度的序列片段,图3的示意中,是截取长度为17个碱基的序列片段;后续的步骤中,则是将第8和第9位置上的碱基分别为T和H的序列片段选择出来,这里,T=A,T,C;H=A,T,G;而紧接着的修饰过程中,则将选择出来的序列片段中第9碱基位置上的H删除,同时在原来H的位置上插入一段形成Hammerhead ribozyme分子所必须的核心序列,即图3示意的HH Rz Core序列,而在多种的可能性中,这段序列可以是5’ttcgtcctcacggactcatcag 3’;最后,则需要将修饰好的片段按合适的方向,克隆到合适的载体中去,图3的示意中,则是将之按图中示意的方向,克隆到含有合适的PolIII启动子及相应的转录终止信号的载体中去,由此得到的新的载体,则可以在合适的条件下,例如当导入真核细胞体系时,表达具有Hammerhead ribozyme特征的RNA分子。
作为对图2所描述的原理的又一个说明,图4所示意的是属于Hairpin类的针对特定目标序列的Ribozyme库的构建的示意,其大致的过程是这里假定目标序列是同样来自任意mRNA序列的双链cDNA序列,图3示意中的目标序列的上部的正义链的序列和作为序列来源的mRNA序列一致。以此为基础的Hairpin Ribozyme库的构建,将需要首先从目标序列中截取一定长度的序列片段,图4的示意中,是截取长度为16个碱基的序列片段;后续的步骤中,则是将第6、第7和第8位置上的碱基分别为G、T和C的序列片段选择出来;而紧接着的修饰过程中,则将选择出来的序列片段中第5、第6、第7和第8碱基位置上的碱基删除,同时在原来的位置上分别插入T、T、C和T;然后再于图4所示意的被选择出来的序列片段的上游端插入一段形成Hairpinribozyme分子所必须的核心序列,即图4示意的HP Rz Core序列,而在多种的可能性中,这段序列可以是5’tacca ggtaa tatac cacaa cgtgt gtttc tctgg t 3’;最后,则需要将修饰好的片段按合适的方向,克隆到合适的载体中去,图4的示意中,则是将之按图中示意的方向,克隆到含有合适的PolIII启动子及相应的转录终止信号的载体中去,由此得到的新的载体,则可以在合适的条件下,例如当导入真核细胞体系时,表达具有Hairpin ribozyme特征的RNA分子。
虽然不同类型的Ribozyme甚至DNAzyme分别具有各自不同的序列特征,但是,仅就针对特殊目标序列的非随机Ribozyme甚至DNAzyme库的构建而言,都可以通过以上所描述的原理来实施。鉴于Ribozyme乃至DNAzyme在基因功能研究方面的特殊作用,本发明则为后基因组时代基因功能的研究提供了重要的工具。
发明详述所谓的Ribozyme或者DNAzyme,是一类具有催化活性的核酸小分子,前者属于RNA性质,后者属于DNA性质;Ribozyme和DNAzyme通过序列特异的方式,与特定的目标序列相结合并发挥其催化活性,例如对作为其作用底物的目标序列的剪切等。
就结构而言,Ribozyme和DNAzyme都可以看着是通过以下方式形成的,即从目标序列中截取具有一定长度的序列片段,然后,再在所截取的序列片段的中间的某个位置上插入一段外源序列,同时,在必要的情况下,还应对插入点附近的某些碱基进行修饰,接着,就可以利用经过以上改造获得的序列结构的基础上,通过进一步的实验,生成相应的核酸小分子;当然,不同类型的核酸小分子,在结构上也会有各自的特点,例如有些类型的Ribozyme分子的结构,则相当于从目标序列中截取具有一定长度的目标序列的片段之后,再在所截取的序列片段的外侧引入一段外源序列,不过,就本发明的实施而言,完全可以将类似的情况看着是一种实验方法上的常规的变化,因此,在后续的描述中,将不在对此类情况做特别的强调。
本发明提供的,是一种建立非随机的Ribozyme库和非随机的DNAzyme库、或者其它具有Ribozyme库或者DNAzyme库的结构特点的核酸分子库的方法;这里所说的Ribozyme库和DNAzyme库的结构特点,应是以下的形式如图5所示意,假定所研究的目标序列是双链DNA序列或者其它任意可以被转化为双链DNA序列的核酸序列,例如,不同来源的基因组序列,不同来源的RNA序列等等;在图5的示意中,以连续的N代表目标序列中含有的碱基片段,这里首先从目标序列中截取一定长度的序列片段,在图5的示意中,是17bp长的序列片段;由于在实验操作的意义上,通常被截取出来的来自目标序列的序列片段都会被置于一定的外周序列环境例如某个载体体系中,这里按图5的示意,将位于被截取出来的序列片段两侧的外周序列分为上游和下游两个部分;接着,就是在被截取的序列片段的中间的某个位置上插入一段外源序列,而在一些情况下,还可能需要在被截取的序列片段的中间的具有一定的碱基组成的位置上,在图5的示意中,以连续的n表示,同时,在必要的情况下,还应对插入点附近的来源于目标序列的碱基进行修饰,在图5的示意中,则是假定删除了两个碱基;在经过以上的操作之后,就形成了一种基本的结构,而后续的工作,则是在这种基本的结构的基础上,制备能够生成相应的核酸分子的载体结构。
在实验操作的意义上,本发明所提供的建立非随机的Ribozyme库和DNAzyme库、或者其它具有Ribozyme库或者DNAzyme库的结构特点也就是图5所示意的基本结构特点的核酸分子库的方法,是包括了以下的几个方面的任务1,从所研究的目标序列中截取一定长度的序列片段;2,将外源序列插入被截取的具有一定长度的序列片段的中间的某个位置上;3,同时,在必要的情况下,对插入点附近的来自目标序列的序列片段的碱基进行修饰;4,最后再在以上的基础上制备能够生成相应的核酸分子的载体结构。
从这里不难看出,就这几个方面的任务而言,第2、3项是最为核心的部分,也是难点所在,而这主要是由以下的因素决定的其一,要想在被截取的序列片段的中间的某个位置上插入外源序列,通常需要在实验操作的水平上,在被截取的序列片段的中间的相应的位置上,形成一个断裂点,然后,在将外源序列连入该断裂点,这里继续以双链DNA的情形为例,一般情况下,无论是通过酶切还是其它的途径,都很难要求所形成的断裂点处的两个末端有可以被控制的差异,这就导致了一个后果,即,较难使外源序列以定向的方式连入来自目标序列的序列片段之中;其二,在建立满足本发明要求的许多核酸分子库的过程中,通常需要对外源序列的插入位置的碱基组成作一定的选择,而这也就无形中也给相关的实验操作带来了困难;
其三,在建立满足本发明要求的许多类型的核酸分子库的过程中,经常需要对外源序列的插入位置附近的某些碱基做修饰,例如删除或者置换等等,这在实验操作上具备一定的难度;其四,无论是对于以上那种类型的核酸分子库而言,在实验操作的过程中,之所以要在被截取的序列片段的中间的位置上引入外源序列,是因为需要逐步在此位置上形成与所要建立的核酸分子库对应的核酸分子的功能所必须的特定的序列结构,由于通常在实验操作中很难将与所说的核酸分子的功能对应的特定的序列结构一次引入,因此,就需要将此分成一个以上的步骤,即在最初所引入的结构的基础上进行必要的修饰,而这一修饰的过程,也实验中的一个要点。
本发明所提供的建立以上所说的不同类型的核酸分子库的方法,为解决以上的核心问题、同时也是实验中的难点提供了有效的途径;不过,值得特别强调的是,本发明提供的方法,应可以是针对任意数量的所说的核酸分子的操作,但后面的描述,将主要以针对一个以上的核酸分子的操作进行,但以下的描述方式的选择,不应被视作是对本发明的任何意义上的限制。
本发明所提供的建立非随机的Ribozyme库和非随机的DNAzyme库、或者其它具有Ribozyme库或者DNAzyme库的结构特点的核酸分子库的方法的特征是利用了以下所列的任意一个或者一个以上的手段1,至少利用一个SRE酶来确保在来自目标序列的序列片段的中间所引入的外源序列的方向;2,至少依赖一个SRE酶来对外源序列的插入点所在位置的碱基组成做选择;3,至少利用一个SRE酶对所说的外源序列的插入点附近的来自目标序列的碱基做修饰;4,至少利用一个SRE酶对所引入的外源序列进行修饰。
以下通过具体的实验步骤对以上所提供的方法做进一步的描述。
本发明所说的目标序列,可以是任意的核酸序列,不过,为描述的方便,这里假定目标序列是双链DNA序列,或者其它任意可以被转化为双链DNA序列的序列;以下是本发明提供的方法所涉及的具体的实验操作,而图6的示意则是相关的实验操作的基本过程首先,是从目标序列中截取一定长度的序列片段并将之克隆到合适的序列环境中去;本发明所说的核酸序列库,在概念上应含有一个以上的针对不同的目标序列和/或针对同一目标序列的不同序列区域的核酸分子相关的序列结构;而一般情况下,所说的核酸分子库是含有多个针对不同的目标序列和/或同一目标序列的不同序列区域的核酸分子相关的序列结构的集合,而在实验操作的意义上,如果要提高本发明所要建立的核酸分子库的效率,就需要从所研究的目标序列中截取更多的序列片段,而这个任务可以通过许多常规的手段实现,在众多的可能性中,以下是几种可能的选择其一,是利用SRE酶的作用;这是一种得到广泛应用的方法,例如在SAGE相关的实验中,就是利用SRE酶的作用从所研究的目标序列中截取一定长度的序列片段,此外,类似的手段也被用来从所研究的目标序列中截取一定长度的序列片段并用进行RNAi相关的研究;其二,可以通过随机断裂的方法,例如DNaseI的随机作用,将所研究的目标序列降解成小的序列片段,然后可以通过常规的PAGE电泳,将在特定的长度范围的序列片段回收回来;其三是利用核酸外切酶的作用,将所研究的目标序列降解成小的序列片段;其四是不同的方法的综合运用,例如将核酸内切酶和核酸外切酶的活性的综合使用,从而将所研究的目标序列降解成小的序列片段;当然,除了以上的选择之外,也可以应用其它任意能够达到这里的实验目的的手段;通常情况下,在从目标序列中获得一定长度的小的序列片段之后,并在必要的情况下,对所获得的序列片段的末端进行修饰,就可以将之克隆到合适的序列环境中,例如合适的载体中,以方便进行后续的操作;第二,是在以上操作的基础上,在所说的序列片段的中间的某个位置上形成一个断裂点,然后,再在该断裂点处连入外源序列1;可以利用不同的方式在来自目标序列的序列片段的中间的某个位置上形成一个断裂点,但一种较为常用的办法,则是利用SRE酶的作用;在图6的示意中,是事先在属于外周序列的上游区域设置一个合适的SRE位点,当然,类似的SRE位点可以被设置在属于外周序列的上游和/或下游的任意合适的位置上;在图6的示意中,以将SRE1位点设置在属于外周序列的上游区域来进行说明;不过,应该强调的是,除非有特别的说明,在本发明的描述中,在SRE后面附加的阿拉伯数字,例如SRE1、SRE2、SRE3、SRE4等,通常只是出于它们相互之间的区分的需要,而不代表具体的SRE的选择的限制在这里的SRE1位点的设定上,使得与之对应的SRE1的酶切位点刚好落在实验所要求的以上的序列片段的中间的某个位置上,这样,就可以利用SRE1酶在相应的位置形成一个断裂,而在此基础上,就可以将如图所示意的外源序列1连入来自目标序列的序列片段中,这里的连入,是指分子生物学的常规意义上的连接反应,其基本的要求是用于连接的末端必须相匹配,这里具体分析如下对于不同的SRE、即图6的示意中所标注的SRE1而言,其酶切可能产生的末端不外三种常见的形式齐头末端,5’突出的末端和3’突出的末端;对于齐头性质的末端而言,显然只需在外源序列1的末端是齐头性质的就可以了,而对于两种突出性质的末端而言,则可以用不同的办法其一是利用相互匹配的末端,这里的相互匹配的含义除了末端的5’突出或3’突出的性质和长度相同外,还需要突出的部分的碱基能够互相对应,由于在本发明中,经常可能遇到末端的突出的部分的碱基出现多种可能的情形,那么,就需要同样在外源序列1的末端的设置上,也考虑到各种不同的可能性;其二是将具有突出性质的末端转化为齐头的末端,例如,对于具有5’突出性质的末端而言,可以利用合适的DNA聚合酶的作用将其补齐,而对于具有3’突出性质的末端,则可以借助合适的核酸外切酶的作用;总之,就外源序列1在断裂位点的连入,可以通过常规的分子生物学手段实现;不过,就外源序列1的连入而言,如果能在连接的过程中,确定实验所需要的连接方向,则无疑是非常有帮助的;作为若干可能的确定这里的外源序列的连接方向的方法,本发明也提供了几种途径,其中值得一提的,是利用SRE位点来实现的;第三,是以上步骤所获得的产物的进一步修饰,根据不同的情况,可以是以下的一种或者几种其一,对外源序列1的插入位点所在位置的碱基组成做选择;在本发明提供的方法中,可以利用SRE酶的作用来完成;其二,对外源序列1的插入位点附近的属于目标序列的碱基做修饰;同样,在本发明提供的方法中,也可以借助SRE酶的作用来完成;其三,对外源序列1做修饰;在本发明提供的方法中,也可以利用SRE酶的作用来实现;当以上的修饰完成之后,则将来自于目标序列的序列片段作了必要的改造,除了可能的对来自目标序列的序列片段所含有的碱基的修饰外,也将以上的外源序列1修饰成了外源序列2;显然,这里的修饰则为后续的实验奠定了基础;第四,在以上的操作的基础上,制备可以生成相应的核酸分子的序列结构;这里所谓的“制备可以生成相应的核酸分子的序列结构”,显然是需要针对不同类型的核酸分子而言的,例如,对于Ribozyme分子而言,所需要的是能够将DNA转录为RNA的表达结构,而对于DNAzyme分子而言,则是能够获得单链性质的DNA分子;显然,这些也只需要和特定类型的核酸分子对应的常规的分子生物学技术,故不再赘述。
以上是本发明所涉及的一些具体的实验操作,这里将对本发明所提供的方法的特征,作进一步的阐明其一,对“至少利用一个SRE酶来确保在来自目标序列的序列片段的中间所引入的外源序列的方向”的进一步阐明;事实上,本发明首先提供的,是一种通用的确保在双链DNA的一个断裂点上含有的两个相同的末端处引入的外源序列的方向的方法;本发明为此提供了两种选择,其中的一种选择是将一个完整的基因表达结构、即表达启动子,表达框架和转录终止信号进行不同形式的拆分,并使外源序列中仅含有完整的基因表达结构之中的一部分,同时在设计上使得只有当外源序列按特定的方向插入时,才能是表达框架得到正确的转录,关于这一部分的内容,将在本发明后面的描述中,作详细的描述,而这里所要描述的,是所说的在SRE酶的基础上形成的方法,该方法的基本原理是至少利用一种SRE酶的作用,将在双链DNA断裂处的两个末端转变为可以进行定向连接的末端;以下是具体的描述一般情况下,在双链DNA上的某个断裂,无非是通过核酸内切酶例如限制性内切酶的作用,或者其它的手段产生,这样就在断裂处形成两个末端,在多数情况下,很难在实验操作的水平上对这两个末端进行区分,例如在某一个限制性内切酶的作用下产生的断裂点,其留下的两个末端,是完全一样的,而通过其它的手段产生的断裂点,即使能够出现有差异的末端的情况,例如一些随机断裂,但由于这一类的差异是很难预期的,所以,在实验操作的过程中,也需要经过处理,将断裂点处的两个末端转变为相同性质的末端、例如将这两个末端均转变为齐头末端,显然,无论是上面的那种情况,如果直接将双链DNA的某个断裂处含有的两个末端直接用于定向连接,是很难实现的,而本发明提供的方法,则是利用至少一种SRE酶的作用,通过将双链DNA的某个断裂点处的两个末端转变为有可以预期的差别的末端,从而为后续的定向连接创造条件;图7所示意的,是这里提供的方法的基本的过程;实验首先在图示的序列片段处形成一个断裂,这里的断裂点处含有两个相同的末端,然后,再将初级序列引入,在一般的情况下,初级序列将可能分别出现两个方向的插入,而后续的步骤,则是在此基础上,通过SRE酶的作用,将位于断裂点处的初级序列转变为两个有可以预期的差别的末端,以为后续的定向连接创造条件;本发明在这里提供的将以上位于断裂点处的初级序列转变为两个有可以预期的差别的末端的具体的方法,可以是以下几种模式基本模式一,分别在属于外周序列的上游和下游的适当的位置,分别至少设置一个SRE位点,即图8的示意中的SRE1和SRE2,而在不同的具体的设计中,这里的SRE1和SRE2可以相同也可以不同;在图8的示意中的A1、A2、B1、B2分别是一些具体的设计;在A1和A2所示意的具体的设计中,SRE1和SRE2分别为BseRI和BsgI,则当将如图所示意的初级序列连入断裂点时,将出现两个可能的连接方向,如果人为规定A1所示意的方向为+向的话,则A2所示意的方向就为-向,实验同时用BseRI和BsgI做酶切反应,就可以在A1的情形下形成两个不同的末端,而针对A2的情形,也可以形成另一对不同的末端,而后续的实验,就可以利用这些末端实现定向的连接;在B1和B2所示意的具体的设计中,SRE1和SRE2均为FokI,则当将如图所示意的初级序列连入断裂点时,则无论是按哪一个方向连入,也可以借助FokI各自形成一对不同的末端,显然,这同样为后续的定向连接创造了条件;在以上的A1、A2、B1、B2所描述的情形中,由于处于初级序列的SRE1的酶切位点和SRE2的酶切位点之间的序列将被删除,因此,对接着的可以用于能够用于定向连接的末端的形成而言,主要的起决定作用的,还是位于初级序列的自身的两侧的一级序列结构,而所谓的初级序列的连接的方向,在很大的程度上,也是基于位于初级序列的自身的两侧的序列的方向而言的,显然,如果位于初级序列的自身的两侧的序列是具有左右对称的性质,则就有可能给具有的实验操作带来一定的变化;事实上,这种情况的出现,一个可能是人为的设计的结果,而另外的一个潜在的可能性则来自具体的实验过程,例如,当以上的初级序列以多拷贝串联的形式连入的时候,则就有可能出现这种情况,以下则是对这里提及的情形的描述;在C1和C2所示意的具体的设计中,在断裂点处连入的初级序列的自身的两侧所含有的一级序列的某个区域,是具有左右对称的性质的,这样,当在C1所示意的情况下,借助BseRI和FokI的共同作用,就可以形成两个可以用于定向连接的末端,而与此相类似,在C2所示意的情况下,则只需要BseRI的作用,就可以形成可以用于定向连接的末端;基本模式二,只选择在外周序列的上游或者下游的一侧的适当的位置上,至少设置一个SRE位点;本发明在这里的描述中,将以在外周序列的上游的一侧设置至少一个SRE位点的情形为例进行描述,但显然这种描述方式的选择,不应被视作是对本发明的任何意义上的限制;在图9所示意的设计中,SRE1位点是位于外周序列的上游的合适的位置上,而这里与SRE1位点对应的SRE1酶的酶切活性的作用下,将在初级序列上提供一个末端,而另一个不同的末端,则有初级序列自身所含有的一个普通意义上的限制性内切酶位点、即图9中所示意的RE2来提供,图9中的A、B、C1、C2和D分别是一些具体的设计;在A所示意的具体的设计中,SRE1为FokI,而RE2则为BbsI,当初级序列按如图所示意的方向连入时,则利用FokI和BbsI的共同作用,就可以形成两个不同的末端,而当初级序列是按另一个方向连入时,则以上两个不同的末端就不可能出现,显然,这就可以为后面的定向连接创造了条件;在B所示意的具体的设计中,只是相当于将A所示意的设计中的BbsI位点置换为NotI位点,其它的部分则是相同的;在C1和C2所示意的设计中,则是相当于将A所示意的设计中的初级序列置换为如图所示意的一级序列结构,在这里的初级序列的自身的两端的一级序列中,分别含有一个SapI位点和一个BbsI位点,按照如图所示意的设计,则针对两种可能的连接方向,均可以用分步酶切的方法,即首先用FokI处理,待反应完全后,再继续利用SapI和BbsI处理,这样就可以各获得一对不同的可以用于定向连接的末端,从而为下面的反应提供条件;在D所示意的设计中,则是相当于将前面的设计中的初级序列置换为一个其自身的两端含有的部分区域具有左右对称性质的序列,在这样的情况下,同样可以用分步酶切的方法,即首先利用FokI处理,待反应完备后,再继续利用BbsI进行处理,这样,无论是在哪一个连接方向上,通过以上的处理所获得两个不同的末端则是完全一样的,无疑,这也为接下来的定向连接反应创造了条件;当然,在以上的属于基本模式二的各种不同的具体的设计中,都是在外周序列的上游设计了一个SRE位点,事实上,根据不同的具体实验的情况,也可以在外周序列的上游或者下游设置两个SRE位点,并使与这两个SRE位点对应的SRE酶的酶切位点落在初级序列中的不同的位置,这里不妨假定是在外周序列的上游设置了两个SRE位点,分别为SRE1位点和SRE2位点,那么,在实验中也可以通过分步酶切的办法,其原则是首先使用的那个SRE酶的处理,不会对另一个SRE酶在初级序列上的酶反应及其末端的形成发生破坏,这样,就可以通过这两个SRE酶的处理,最终在初级序列上形成两个不同的可以作定向连接的末端,从而为后面的反应创造条件;以上在对基本模式一以及基本模式二进行阐述时,列举了一些具体的设计,不过,值得强调的是,提供这些具体的设计,仅是为了对基本模式一以及基本模式二做进一步的说明,事实上,利用相同的原理,根据不同的研究任务的情况,完全可以形成更多的变化,不过,由于这些变化通常只涉及常规意义上的分子生物学的知识,因此,本发明将不再一一赘述,但显然,这并不构成对本发明的任何意义上的限制;在上文的相关部分的描述中,事实上是将初级序列作为一个完整的片段连入中间序列上的断裂位点的,但由于这里的初级序列的引入的最终的目的,是试图将断裂点处的两个末端转变为两个不同的可以被用于做定向连接的末端,因此,从前面的描述中也可以看到,在初级序列的设计中,通常只是其中一部分的序列,例如前面的设计中的位于初级序列自身的两端的序列,是对最后的两个可以被用来作定向连接的不同的末端起关键的作用,而其它部分的序列,有很大一部分却并非如此重要,而本发明在这里要提供的,则是通过对连入序列片段中的断裂点的初级序列做改变而形成的方法,其具体的途径是在图7的序列片段所含有的断裂点处,连入一个特殊的适应子即Adaptor,这里的适应子的特征是,具有两个不同的末端,其中一个可以和断裂点处的末端相匹配并在合适的条件下发生连接,而另一个末端则为不可连接末端,也就是说,其在具体的设计上的特点使其既不能和适应子本身含有的任何一个末端相连,同时也不能和断裂点处的末端相连,例如,可以在设计上使这里所说的另一个末端即不可连接的末端的一条链上的5’端脱磷酸化和/或对其拥有的突出的性质和长度作适当的修饰,已达到这个目的。
在前面的关于“至少利用一个SRE酶来确保在来自目标序列的序列片段的中间所引入的外源序列的方向”的方法,就其原理而言,是通过将位于序列片段的中间的断裂点处的两个末端转化为两个不同的可以用来作定向连接的末端而实现的,然而,作为一种选择,也可以利用至少一个被设置在初级序列中的SRE位点,并使得和该SRE位点对应的SRE酶的酶作用位点落在外周序列的合适的位置上,以便形成一种将来自目标序列的序列片段、其中也包含在断裂点处连入的初级序列分离出来并使其含有两个不同性质的末端,这样,就可以将分离出来的DNA片段按定向的方式克隆到合适的载体环境中去,显然,只要经过适当的设计,针对初级序列的不同的插入方向,那么,其中所含有的SRE位点对应的SRE酶的酶作用位点也将分别落在外周序列的上游或者外周序列的下游,并在不同的方向上形成不同的末端,而这就意味着,利用被分离出来的DNA片段的末端的性质,就可以了解到其中所含有的初级序列的方向,这无疑也就给后续的实验提供了条件;相对于前面所描述的基本模式一和基本模式二,本发明在图10的示意中则通过修饰模式一和修饰模式二做进一步的说明修饰模式一;如图10中所示意的,其中的初级序列中含有两个SRE位点,即SRE1和SRE2,它们分别位于初级序列自身的两端,而当初级序列按不同的方向被引入断裂位点时,那么,这两个SRE位点的相对的位置就可以发生对调,这是只要这两个SRE位点的相对的位置发生对调时,能使与之对应的SRE酶在外周序列中的酶切作用能形成不同的末端,那么,就可以将酶切所产生的位于两个SRE酶的作用位点之间的序列片段分离出来,并在后续的步骤中,连到与之相匹配的末端的序列环境中,这样,也可以分别针对不同情况下的连接产物进行其它的操作了;修饰模式二;如图10中所示意的,在这里的设计中,初级序列只在其自身序列的一端含有一个SRE位点,即如图中所示意的SRE1,这样,当初级序列处于不同的方向上时,那么,其中所含有的SRE1位点也就处于相对与外周序列的不同的位置上了,这样,在不同的方向上,与初级序列中含有的SRE1位点所对应的SRE1酶可以和设置在属于外周序列的一侧的位置上的在一般意义上的限制性内切酶配合,例如,可以借助SRE1和RE1的配合,也可以借助SRE1和RE2的配合,而由此产生的不同末端,就可以为后续的定向连接提供了条件。
其二,对“至少依赖一个SRE酶来对外源序列的插入点所在位置的碱基组成做选择”的进一步阐明;如前提及,在本发明所定义的核酸分子库的结构中,除了在来自目标序列的序列片段的某个中间位置引入外源序列外,也常常需要对外源序列的插入点所在位置的碱基组成做选择,例如,当这里的核酸分子库是Hammerhead类的Ribozyme分子库时,在优选的情况下,就应该考虑将外源序列的插入点落在目标序列所含有的具有5’----NTH-------3’的结构特征的区域,在本发明的具体实施中,怎样对外源序列的插入点所在位置的碱基组成做选择,就成了一个非常重要的问题,本发明在这里所提供的实现这一目的的途径是至少利用一种SRE酶的作用,并使该SRE酶的酶切位点落在来自目标序列的序列片段中的作为外源序列的插入点所在的位置区域,这样,就可以在该区域形成酶切末端,而对潜在的碱基组成的选择,则可以通过后续的连接反应中,对该酶切末端的选择而实现;图11所示意的,是进一步的解释;图11的示意中,假定从目标序列中,截取了一定长度的序列片段,然后,利用一个SRE位点对应的SRE酶的作用,在序列片段的某个位置形成一个断裂,在这里的示意中,这个SRE位点被设置在属于外周序列的上游,但根据本发明在上文中的描述,这里的SRE位点显然也可以被设置在属于外周序列的下游,在图11的示意中,SRE酶切后形成具有两个碱基的3’端突出的末端,不过,同样根据上文的描述,对于不同的SRE酶而言,这里可能形成的末端的形式也是有多种可能的,在SRE酶的酶切作用产生的末端的基础上,可以连入DNA片段,而这里的DNA片段的性质,既可以是一个可以同时和处于断裂点的两个末端连接即将被SRE酶的酶切作用分离开的来自目标序列的序列片段重新连接的一个相当于连接子的作用,也可以是只能和SRE酶的酶切作用形成的两个末端分别连接的适应子,而在这里的方法中,利用这里的连接反应对外源序列的插入点所在的位置上的碱基组成做选择,可以在以下的两个阶段的时间点上一步或者分步完成一是利用这里的SRE酶的作用所产生的末端,而另一个则是在外源序列被连入后,再利用被设置在外周序列或引入到插入位点的外源序列上的SRE位点对应的SRE酶的酶切作用在所需要的位置区域所产生的末端;另一方面,利用这里的连接反应对相应的区域所含有的碱基组成做选择的具体的方式也有两种一是利用可以产生粘性末端的SRE酶,并使待选择的碱基位点落在该粘性末端的单链突出的部分,然后,在通过后续的连接反应中所用的DNA片段的不同的末端的设置,以对SRE酶的酶切作用产生的末端中的单链突出部分的碱基组成做选择,二是在SRE酶的酶切作用产生的末端处连入含有特定的序列结构的DNA片段,而待选择位点具有特定的碱基组成时,才能在连接反应之后,和特定的序列结构一起构成能被某种相应的机制所识别的序列位点,例如,某个限制性内切酶的识别位点等;在图11所做的示意中,假定实验的目的是对所截取的序列片段的第5、第6位的碱基的组成作选择;在图11的示意中,是在属于外周序列的上游设置了一个SRE位点,与该SRE位点所对应的SRE酶,可以导致待选择的碱基位点上位于如图所示意的末端的单链突出的位置上,例如当以上的SRE位点为BseRI位点时,则与之对应的BseRI就可以产生如此性质的末端;接着,可以在SRE酶产生的断裂点处引入DNA片段,这里引入的DNA片段含有与前面所用的SRE酶的酶切作用所产生的同样突出性质和长度的末端,但由于该DNA片段所含有的末端的单链突出部分的碱基组成是可以按照实验的需要设计的,因此,可以利用所要引入的DNA片段的末端对SRE酶的酶切作用产生的末端的单链突出部分的碱基组成做选择;如图所示意的DNA片段含有两个末端,其中一个末端的单链突出部分为5’X1X23’,另一个末端的单链突出部分为5’X4X33’,这里的X代表任意人为所设定的碱基,显然,就所要引入的DNA片段所含有的末端的性质而言,这两个末端是可以不同的,但在如图所示意的具体的情形里,X1和X4是一致的,X2和X3是一致的;不过,如前提及,以上的DNA片段,也可以是分别和SRE酶的酶切作用后产生的末端连接的适应子;在图12所做的示意中,是一个在来自目标序列的序列片段中引入初级序列之后再对插入点所在的位置区域的碱基组成做选择的例子;图12的示意中,是将来自目标序列的序列片段中的顶部链的N8、N9、N10的位置上分别为G、T、C的那一族选择出来;如图所示意的相关的实验步骤如下在属于外周序列的上游的合适的位置上,设置一个FokI位点,实验中利用FokI作处理,由此产生的末端用Klenow补齐,然后再将具有如图所示意的序列结构的初级序列连入该末端,可用本发明在前面的描述中所提供的方法确定初级序列的连入方向,接着,再利用BbsI和SapI对这里所形成的连接产物做酶切,这样就将含有一部分初级序列的酶切片段去除,而在由此留下的末端上,则连入如图所示意的次级序列,显然,只有当N8、N9、N10的位置上分别为G、T、C的情况下,才能成功地进行连接反应;以上在图11和图12的示意中所提供的,是本发明所提供的相关的原理的基础上的不同的变化形式,而在同样的原理上的其它的潜在的变化形式还有许多,本发明将不再一一列举,但显然这不应被视作是对本发明的任何意义上的限制;其三,对“至少利用一个SRE酶对所说的外源序列的插入点附近的来自目标序列的碱基做修饰”的进一步阐明;在本发明所定义的不同类型的核酸分子库的相关的实验中,除了在来自目标序列的序列片段中的合适的位置上引入外源序列外,有时也需要对外源序列的插入点附近的来自目标序列的碱基做修饰,例如删除某些碱基等;本发明在这里提供了一种利用SRE酶的酶切作用完成这一任务的方法;本发明在这里的描述中,将主要以所做的修饰是删除某些碱基为例,但这并不能被视为是对本发明的任何意义上的限制;在图13的示意中,为建立本发明所定义的核酸序列库通常会涉及的一般步骤;首先是在来自目标序列的序列片段中的某个位置制造一个断裂点,在图13的示意中,是假定由和属于外周序列的上游含有的SRE位点所对应的SRE酶的酶切作用所产生的断裂点,然后,再在该断裂点处引入初级序列,而在这里的方法中,对外源序列的插入点附近的来自目标序列的碱基的修饰,则可以在图13所示意的相关实验步骤中一次或者分次进行当实验在来自目标序列的序列片段中形成断裂点时,就可以立刻做修饰;例如,在图13的示意中,当和外周序列中所含有的一个SRE点所对应的SRE酶的酶切作用产生了如图所示意的断裂点之后,若能预先在外周序列中设置另一个SRE位点,并使得与该SRE位点所对应的SRE酶的酶作用位点在来自目标序列的序列片段中另一个合适的位置上产生又一个断裂点,则位于这两个断裂点之间的序列就可以被删除,不过,由于在一般的情况下,只有当与这里的两个SRE位点所对应的SRE酶的酶作用位点之间存在足够的距离时,才能保证后一个SRE酶的酶切的效率,因此,在建立本发明所定义的核酸分子库的过程中,这种在前一个SRE酶的酶作用所产生的断裂点的基础上,再利用另一个SRE酶的酶作用以形成第二个断裂点的方法,并不能常见;针对图13的示意中,当和外周序列中所含有的一个SRE位点对应的SRE酶的酶切作用产生了如图所示意的断裂点中所含有的两个末端为粘性末端时,则也可以用另一种方法对断裂点的位置区域的碱基做修饰,这里提供的方法是利用合适的核酸外切酶的作用,将粘性末端中的单链突出部分消除;但需要强调的是,由于使用核酸外切酶常常会导致对底物的过度降解,因此,在实验的过程中也就应该非常地谨慎;而在本发明中,这里的“至少利用一种SRE酶对所说的外源序列的插入点附近的来自目标序列的碱基的修饰”中的“利用一种SRE酶”不包括利用与外周序列中的SRE位点对应的SRE酶对来自目标序列的序列片段的第一次酶切;在优选的情况下,可以在如图13所示意的初级序列被引入以上的断裂位点之后,再对插入点附近的来自目标序列的碱基进行修饰,而本发明所提供的相关的方法的原理则至少利用了一种SRE酶在待修饰区域的酶切作用;图14所示意的,是对此所作的进一步的解释;在图14的示意的上方,是在以上的相关的实验步骤后形成的一种在来自目标序列的序列片段中的某个位置引入初级序列之后出现的基本的结构,当然,这里的初级序列可以是在相应的断裂点上通过一个或者一个以上的步骤被引入的任意的DNA序列;根据图14所示意的基本结构,假定这里的实验的目的是对初级序列的一侧的和/或另一侧的来自目标序列的以字母“X”所指示的碱基做修饰;在具体的设计中,可以将SRE位点设置在外周序列和/或初级序列的任意合适的区域,而在此基础上可以形成不同的修饰的方法,但在优选的情况下,是利用一个SRE酶的酶切作用产生一个断裂点,此外,再利用其它任意的方式、通常是借助一般意义上的限制性内切酶的酶切作用产生另一个断裂点,这样,就可以将位于两个断裂点之间的序列删除,从而达到对以字母“X”所指示的一个或一个以上的碱基进行修饰的目的;图14的示意中,分别列举了几种可能的设计类型在图14中的A中所示意的设计类型中,其中一个断裂点由和与外周序列中含有的一个SRE位点对应的SRE酶的酶切作用所产生的,而另一个断裂点是与初级序列中含有的一个一般意义上的限制性内切酶位点、当然也包括不同的SRE位点对应的限制性内切酶的酶切作用所产生的,位于这两个断裂点之间的序列则可以被删除并置换为其它的序列;而图14中的B中所示意的设计和图14中的A中所示意的设计基本一致,只是其中的一个断裂点是由初级序列中所含有的一个SRE位点对应的SRE酶的酶切作用产生的;在图14中的C中所示意的设计类型中,则是利用了和两个SRE位点对应的SRE酶的酶切作用,从而同时对位于初级序列的以字母“X”所指示的区域进行修饰,不过,在图的示意中,其中一个SRE位点被设置在外周序列中,而另一个SRE位点被设置在初级序列中,可事实上,这里的两个SRE位点可以被设置在外周序列和/或初级序列的任意合适的位置;在图14中的D中所示意的,是利用一个被设置在初级序列中的SRE位点,与该SRE位点对应的SRE酶可以对SRE位点所在位置的两侧的特定的区域进行作用,因此,只要将该SRE位点设置在合适的位置上,就可以用来对初级序列两侧的来自目标序列的以字母“X”所指示的区域同时进行修饰;针对图14中所示意的A、B、C和D的不同的设计,这里通过图15的示意,分别给出了一个具体的例子,在这些具体的例子中的两个断裂点的产生的方式如下在图14所作的示意中,分别对应于图13的示意的A、B、C和D的具体的例子是A,SRE1为FokI,RE1为PmeI;B,SRE1为BbsI,RE1为PmeI;C,SRE1为BseRI,SRE2为BbsI;D,SRE为BsaXI;不过,值得强调的是,这里的具体的例子,只是对本发明所提供的相关的方法的一种说明,故不应被视作是对本发明的任何意义上的限制;其四,对“至少利用一个SRE酶对所引入的外源序列进行修饰”的进一步阐明;如前提及,在本发明所要建立的不同类型的核酸分子库的结构中,常常需要在来自目标序列的序列片段的某个合适的位点,引入一段对相应的核酸分子的功能非常重要的特殊序列,不过,就具体的实验操作而言,一般很难仅仅通过一步反应就可以将对相应的核酸分子的功能非常重要的特殊序列引入,较为常见的情形是,需要对开始引入来自目标序列的序列片段的某个合适的位点的第一级外源序列逐步加以修饰,以使之最终转变为具有功能意义的序列;而本发明在这里所提供的,就是一种对被引入到来自目标序列的序列片段的某个合适位点的不同的外源序列进行修饰的方法,其基本的原理是利用至少一个SRE酶的酶切作用,并通过其它必要的分子生物学的辅助手段,对不同的外源序列进行置换;就相关的实验设计而言,本发明在这里提供的方法中的实验设计,与图14和图15所示意的基本一致,两者仅有的区别是在这里的方法中的实验设计中,与外周序列和/或外源序列中的SRE位点对应的SRE酶的酶作用位点,是落在外源序列之内,在图16的示意中,即是针对这一区别,对图14的设计作简单的变动形成的设计;而在图17的示意中,则是一个对被引入来自目标序列的序列片段中的外源序列做连续的修饰的例子,其中所示意的第一次修饰是利用与SRE1位点和SRE2位点对应的SRE1酶和SRE2酶进行的,而在将位于SRE1位点和SRE2位点之间的核酸片段分离出去之后,则在新连入的DNA片段中再次设置两个SRE位点,即图17中所示意的SRE3位点和SRE4位点,这样,就可以继续利用SRE3和SRE4的酶切作用对外源序列作进一步的修饰;依据本发明在这里所提供的原理,还可以形成多种不同的变化,这里就不再一一赘述了,但显然,这并不应被视作是对本发明的任何意义上的限制。
以上对本发明所提供的建立非随机的Ribozyme库和非随机的DNAzyme库、或者其它具有Ribozyme库或者DNAzyme库的结构特点的核酸分子库的方法所涉及的一般实验步骤及其特征做了阐述,不过,在本发明所提供的方法的原理下,再根据不同情形下的具体的研究任务,是可以形成多种形式的变化的,例如,在本发明所提供的方法中,既可以在从目标序列中截取所需要的一定长度的序列片段之后再在该来自目标序列的序列片段中制造断裂点并引入外源序列,也可以通过在目标序列中确定所要截取的序列片段的一端,然后在接近已经被确定的一端的属于目标序列的某个合适的位点上制造一个断裂点并在该断裂点处引入外源序列,下面再利用在外源序列中设置的SRE位点对应的SRE酶的酶切作用,从另一侧的目标序列中再完成整个所需要的长度的片段;对于类似的属于常规的分子生物学意义上的变化,本发明在后面的描述中,还将具体涉及。
本发明提供的方法所依据的原理,是在原有的母发明《一种通过外源序列操作目标序列的方法》的基础上形成的(中国专利申请号03136136.6),因此,本发明应该被视作是对母发明的自然延伸的本发明和母技术之间的关系应被视作是相互补充和相互说明的关系系有鉴于此有原来的描述中提及的所有概念,方法及其它相关的变化和修饰手段,将被同样运用到这里来,同样,本发明所作的任何延伸,也都应被视作是母发明本身的某种程度的延伸。
所谓的外源序列是针对作为实验研究相象的目标序列而言的。这里所说的作为研究对象的目标序列可以是任意核酸序列、包括任意的DNA序列或者RNA序列,或者具有核酸性质的序列,然而,由于通常情况下,在常规的分子生物学操作的意义上,DNA序列和RNA序列可以很方便的相互转换,因此,本发明中的具体描述,在许多场合,将以目标序列是DNA序列为基础来说明,但显然,这并不构成对本发明的任何意义上的限制。
相对于目标序列的外源序列,同样也是任意核酸序列、包括任意的DNA序列或者RNA序列,或者具备核酸性质的序列,然而,本发明的描述中,基于RNA性质的序列可以被转化为DNA序列后再进行后续操作的事实,将主要以目标序列是DNA序列来说明,但显然这是为了描述的方便,所以,并不能被视作对本发明的任何意义的限制。
本发明所说的外源序列经常是至少含有一个被特异的识别和催化体系识别的位点,或者在特殊的情况下,含有被决定特异的识别和催化体系所识别的位点的必不可少的组成部分;这里所说的特异的识别和催化体系的特征是其能够对任意核酸或者具备核酸性质的序列中的特异的位点进行特异性的识别和结合,并能特异性识别的基础上,对识别位点以外的序列发生催化作用;这里所说的可以被特异的识别和催化体系识别的位点,可以是由特定的碱基序列组成并作为特征的,也可以是附着在碱基上的其它化学结构体,在本发明的定义中,外源序列中至少必须含有决定特异的识别和催化体系的识别位点的必不可少的一部分。
在优选的情况下,本发明所说的识别和催化体系,是指所有满足要求的酶体系,其特征是能够识别核酸序列或者具备核酸性质的序列中含有的识别位点,并能够在此基础上,对识别位点以外的序列发生酶修饰作用。
在更优选的情况下,本发明所说的特异的识别和催化体系,是指一类限制行内切酶,其特征是能识别核酸序列中含有的特异的识别位点,并对特异性识别位点以外的某个位置上的序列产生酶切作用;在这里的定义中,满足要求的限制性内切酶,应包括所有识别位点和酶切位点不重迭或者至少是不完全重迭的限制性内切酶;这里所说的“识别位点和酶切位点不完全重迭“的含义是至少在一条核酸链上有一个酶切位点,落在特异识别序列之外的位置上;显然,在众多满足这里的定义要求的限制性内切酶中,TypeII类的限制性内切酶中,例如TypeIIS类型的,是非常重要的一组(Aggarwal AK et al,1998;Richard JR et al,2003)。
在本发明的描述中,将主要以特异的识别和催化体系是满足以上定义要求的限制性内切酶进行的,在本发明的图示中,则将所有的与满足定义要求的识别和催化体系相对应的特异性识别位点标注为SRE位点;在本发明的描述的大多数情况下,则是将满足定义要求的识别和催化体系特征的限制性内切酶的识别位点标注为SRE位点;不过,SRE位点和SRE的酶作用位点是不同的概念;然而,值得强调的是,这里对描述方式的选择,不应被视作是对本发明的任何意义上的限制。
对非随机Ribozyme库的构建所依据的原理而言,事实上就相当于一个利用外源序列从目标序列中截取一定长度的序列片段,并对获得的具有一定长度的序列片段进行选择及修饰,再最终将之克隆到合适的序列环境中去的过程;在前面的描述中,主要依据于实验的开始就从目标序列中截取所需要的长度的序列片段然后再进行其它的操作,对本发明涉及的一般的实验步骤进行了阐述,但同样是在前面的描述中,也提及了可能出现的不同的变化形式,在以下的描述中,则以目标序列是双链DNA为例,对一种变化形式进行说明步骤一,如图18所示,是第一级外源序列在目标序列中的插入;外源序列在目标序列中的插入,可以通过多种方式插入,具体的途径可以使用所有可能的物理的、化学的和生物化学包括分子生物学的手段,就在不同研究目的下的外源序列在目标序列中的插入的性质而言,可分为以下的几种情形1,随机插入;例如目标序列在不同的物理或者化学手段的作用下发生随机断裂,其形成的末端在经过适当的修饰后可以和外源序列相连接;目标序列也可以在不同的核酸酶的作用下发生随即断裂或者随机降解;外源序列被设计在合适的Transposon结构中,并在合适的条件下,在目标序列中形成随机的整合;当然,还可以包括其它手段;2,定点插入;这通常是在目标序列的序列结构已经清楚的前提下实现的,其可能的实现定点插入大方式也同样是多种,例如,可以利用序列结构中的限制性内切酶的位点,将外源序列导入;或者利用序列特异的引物并借助其它的手段,将外源序列导入;等等;3,介于随机插入和定点插入之间的一些手段;在目标序列的序列结构并不清楚的情况下,利用可能出现的限制性内切酶位点来将外源序列引入;当然,也可以利用部分随机的引物对外源序列在目标序列中的可能的插入位置做一定的选择;利用一些Transposon在插入位点上的一定的选择性;等等。就外源序列在目标序列中的插入而言,本发明并不对所可能使用的方法做任何的限制;而就外源序列在目标序列形成插入后,根据具体的研究目的的不同,位于外源序列一侧的序列,可以保留,也可以被丢弃;在图18的示意中,外源序列F1的插入位置落在目标序列中A点的上游;步骤二,如图19所示,以第一级外源序列为基础,并利用后续的外源序列在目标序列中的连续跳跃,最后在目标序列特定的位置上形成插入;根据以上的定义,第一级外源序列中至少含有一个满足上文定义要求的限制性内切酶的识别位点,即图示中的SRE位点;由于对任意满足要求的SRE位点而言,其相应的限制性内切酶SRE的酶切位点落在其特异性的识别位点之外,例如,当SRE位点是TypeIIS类的限制性内切酶的识别位点时,在合适的设计下,对应的SRE将在图19所示的SRE位点的下游,发生酶切作用,并形成一个酶切末端,这就为第二级外源序列的插入创造了条件;显然,SRE作用下形成的酶切末端的位置,是由具体的SRE决定的,而只要外源序列中SRE的选择得当,同时SRE位点所处的位置设计合适,那么,就可以使得相应的SRE的酶作用位点落在目标序列的某个位置上,这就意味着,可以通过外源序列中所含的SRE的选择以及相应的SRE位点所处位置的选择,为第二级的外源序列在目标序列中的特定位置中的插入创造条件;在图19的示意中,利用外源序列F1中SRE位点的设计,就可以达到在目标序列的A、B之间的某一个位置上插入第二级外源序列的目的,在图19的示意中,则将第二级外源序列指示为F2,显然,利用第二级外源序列中含有的SRE位点的设计,完全可以在目标序列上插入新的外源序列,而将类似的过程循环进行,就可以在目标序列中形成连续的插入,直到使插入点落在具体实验需要的位置或者区域内;在图19的示意中,则是使最终的插入点落在目标序列中B点的下游的一侧;然而,为了描述的方便,图19的示意中,即假定第三级外源序列的插入位点就已经落在了图示中B的下游的一侧;但显然,这并不构成对本发明的任何限制;在这里描述的外源序列在目标序列的连续的插入的实验中,除了第一级的外源序列和最后的位置上形成的插入外,其它的各级外源序列通常需要被完全地删除,并同时使相应的插入点位置上的目标序列得到完全的恢复,为达到这一目的,就需要对将被删除的起中间过渡作用的外源序列作特殊的设计;如图19所示,则是对最后被删除的第二级外源序列F2做特殊的设计,使得F2可以在后续的阶段能被完全删除,并同时使目标序列中A、B之间的序列被完全恢复;在这里的描述中,则将能够在后续的步骤中被完全删除并使相应的插入点位置的目标序列得到完全恢复的外源序列称为完全删除外源序列;以下是对这一类外源序列的设计特点的详细说明显然,对目标序列中任何外源序列的删除,都和最初该外源序列在目标序列中的插入方式有关,图20所示,是外源序列在目标序列中的插入依赖前一级外源序列中的SRE点位点而实现的情形;根据前一级外源序列中所含的SRE位点的不同,在相应的SRE的作用下,其为下一级外源序列的插入形成的末端也基本可以被分为三类1,形成5’突出的粘性末端;例如,BsaI,BsmBI,FokI,PleI等酶切后留下的末端;外源序列在5’突出末端的插入,也可以选择不同的分子生物学手段,这里仅就两种常用的方式进行说明,即1)用合适的聚合酶例如Klenow等将末端补齐,然后将外源序列以平端的形式连入,在图20的示意中,是将包含有两个以斜体的N表示的5’突出的末端补齐,然后将齐头的外源序列连入,这样,最后形成的产物除了连入的外源序列外,同时还造成了对应原来的5’突出部分的序列的重复;2)不作末端补齐,即将外源序列以对应的粘末端的形式连接进去,显然,当对这里的5’突出的末端的具体碱基序列不清楚的情况下,需要考虑各种可能的末端,例如,在图20的示意中,对于有两个碱基突出的末端,则存在4*4共16种可能的末端,而原则上,每增加一个碱基的突出,其可能的末端数目就增加到原来的4倍,在这里即意味着需要制备含有相应数量的不同末端的外源序列并将之用于连接反应,由此得到的产物,依然是造成了对应于原来的5’端突出部分的序列的重复;2,形成3’突出的粘性末端;例如,BmrI,BpmI,BsgI,HphI等酶切后留下的末端;外源序列在3’突出末端的插入,也可以选择不同的分子生物学手段,不过显然也可以采取将外源序列以对应的粘末端的形式连接进去,显然,当对这里的3’突出的末端的具体碱基序列不清楚的情况下,需要考虑各种可能的末端,例如,在图20的示意中,对于有两个碱基突出的末端,则存在4*4共16种可能的末端,而原则上,每增加一个碱基的突出,其可能的末端数目就增加到原来的4倍,在这里即意味着需要制备含有相应数量的不同末端的外源序列并将之用于连接反应,由此得到的产物,依然是造成了对应于原来的3’端突出部分的序列的重复;4,形成平末端,例如MlyI等酶切后留下的末端;显然,对于这一类情形,只要将外源序列同样以平端的形式连接进来就可以了;本发明将所有DNA双链底物裂解后产生大相同长度的5’单链突出的裂解末端、或者相同长度的3’单链突出的裂解末端、或者均产生齐头末端,都分别称为具备相同性质的末端,显然,在常规的连接反应的意义上,只要具备相同性质的末端含有的单链突出的碱基序列能够相互匹配,相同性质的末端就形成了可连接末端,当然,所有的产生齐头末端的具备相同性质的末端自动形成可连接的末端;
通过以上方式对不同末端情况下外源序列连接方式的处理,可以得到两种形式的连接产物,即原来的末端的5’或者3’单链突出部分得到一次复制的连接产物,以及在末端是平端的情况下,没有产生类似复制的连接产物;以下即针对这两种连接产物的情况,对如何在后续的步骤中将新插入的外源序列删除并使相应插入位置上的原来的目标序列得到完全恢复的原则进行说明总的原则是任何可以将整合在目标序列中的外源序列得到完全删除的方法,都可以被用到本发明中来;而以下描述的,则是利用对整合进目标序列的一个或者多个外源序列的序列结构的设计,从而使得后续的对某个整合在目标序列中的外源序列做完全的删除并使得相应的整合位点的外源序列得到完全的恢复;以下描述的,是几种可能的选择首先是针对在新的外源序列插入后,原来的末端的5’或者3’单链突出部分对应的序列得到一次复制的产物来进行删除;如图21所示,是几种可能得到较多运用的选择,图示中以斜体的N指示得到一次复制的序列;其中假定第一级外源序列F1中的SRE1位点,为辅助第二级外源序列F2的插入的位点,那么,在图示的A、B两种情形下,则可以将F2的结构设计成这样的模式含有一个SRE2位点,其可用来辅助可能的第三级外源序列的插入,而同时又在F2中设计一个和F1中含有的SRE1相同性质的SRE位点,图中也指示为SRE1’、但它所代表的“和F1中含有的SRE1相同性质的SRE位点”的涵义是它们可以是完全相同的SRE位点,即也可以是不同的SRE位点,但它们的性质相同,即可以在相应的SRE的酶作用下,产生相同性质的末端;这样,在图21所示的A、B两种情况下,只要F2中SRE1’的位置设计合适,那么,就可以在后续的步骤中,借助F1和F2中这两个具备这里所定义的相同性质的SRE位点,分别得到图示的产物1和产物2,而只要将产物1和产物2中的末端分别作常规的连接,就可以使原来的F2插入位置的序列得到完全的恢复;图21的示意中,删除第二级外源序列F2,也可以如C、D两种情形下,通过在F2中设计两个SRE,位点,其特点是具有相同的性质,即它们对应的SRE酶能够产生相同的末端,只要F2中这两个SRE,的位置设计得当,那么,就可以在后续的步骤中,借助这两个SRE’位点,最终得到图21示意的产物1或者产物2,并进一步通过常规的连接反应,使原来F2插入位置的目标序列得到完全的恢复;这里的含有两个SRE’位点的F2的设计可以根据具体实验的不同而在设计上有所不同,例如,可以SRE位点固有的方向性进行设计,其具体的原则是根据本发明的定义,满足要求的限制性内切酶由于酶识别位点和酶切位点不完全重迭,因此,除了一些可以对识别位点两侧对称的位点同时发生酶切作用的特殊情况外,例如BcgI等,其它的酶,许多就有了方向性,即根据特异识别序列在核酸链上分布的不同,在经典的以DNA双链为底物的酶切反应而言,相对于DNA双链中的一条而言,该酶的特异识别序列就可以出现两种分布形式,而基于这两种分布形式,就又可以出现两种方向的酶切反应堆‘这里以FokI的酶切反应为例,对一条DNA双链中的FokI而言,以下是一种方向的酶切形式-------→5’-------NNNNNNNNNNNNNNNGGATGNNNNNNNNNNNNNNNNNNN---------3’3’-------NNNNNNNNNNNNNNNCCTACNNNNNNNNNNNNNNNNNNN---------5’显然,在不改变DNA双链任何其它序列,而只改变FokI特异识别序列在两条链的分布形式的情况下,就可以将其酶切方向转变成以下的形式←-----5’-------NNNNNNNNNNNNNNNCATCCNNNNNNNNNNNNNNNNNNN---------3’3’-------NNNNNNNNNNNNNNNGTAGGNNNNNNNNNNNNNNNNNNN---------5’在图21C和D的设计中,即利用了SRE酶具有的方向性的特点,图21C和D中的第二级外源序列就被设计成以下的模式
←--- ----→5’-------SRE’ SRE2 SRE’---------3’这里的设计模式里含有的所有SRE位点的相对位置可以根据具体实验设计的不同而发生变化。显然,这种设计模式里的两个SRE’位点,可以是以下两种情况中的一种1,两个SRE’位点可以被同一种酶识别,仍以FokI为例,以下是与图21C或D中的第二级外源序列F2的设计相对应的设计模式←-------------→5’---------NNNNNNNNNNNNNNCATCCNNNNNNNGGATGNNNNNNNNNNNNN-------3’3’---------NNNNNNNNNNNNNNGTAGGNNNNNNNCCTACNNNNNNNNNNNNN--------5’在这种设计模式下,FokI的处理,显然可以导致两个方向上的酶切;2,两个SRE’位点分别为不同的酶识别,但它们可以产生相同性质的末端;这里所说的相同性质,是指在相应的酶的作用下,它们可以产生相同长度的5’突出,或者相同长度的3’突出,或者都产生齐头的末端,例如,BseRI和BsgI就属于满足这里定义的可以产生性质末端的酶;显然,只要第二级外源序列F2中两个SRE’位点的位置设计适当,就可以被用来产生图21所示意的产物1或者产物2;在图21及其相关的描述中,对完全删除插入目标序列的外源序列的原则及可能的方式进行了说明,但显然,作为不同的选择,则可以利用外源序列中SRE的不同设计,形成其它的能够被用来达到在后续的步骤中完全删除相应的外源序列的目的;以下是对这些可能的替代性方法的说明图22所示,是可能的替代性方法中的两种。在图22A的示意中,利用第二级外源序列F2中SRE’和SRE”的设计,产生两个不同性质的末端,其中一个是5’突出的末端,另一个是齐头末端,然后只要在后续的步骤中将以上5’突出的末端补齐,并将补齐的末端与另一个齐头末端连接,就可以使原来的第二级外源序列F2插入位置的序列得到完全的恢复;而在图22B的示意中,利用第二级外源序列F2中SRE’和SRE”的设计,产生两个不同性质的末端,其中一个是3’突出的末端,另一个是5’突出的末端,然后只要在后续的步骤中利用合适的核酸外切酶将以上3’突出的末端削平,并将5’突出的末端补齐,就可以将这两个末端都可以转换成齐头,而只要将这两个转换成的齐头末端相互连接,就可以使原来的第二级外源序列F2插入位置的序列得到完全的恢复;图22的示意中,无论是图22A还是图22B的替代方法,都是多种可能的方法的两种设计模式,事实上,利用对外源序列中的不同SRE位点的选择,并借助合适的核酸外切酶、聚合酶的处理以及其它的常规的分子生物学手段对不同性质的末端进行处理,那么,就完全可以达到将相应的外源序列完全删除的目的,然而,由于这些变化只涉及常规的分子生物学的设计和手段,这里将不对所有的变化一一做出说明,但显然,这并不能被视作对本发明的任何意义上的限制。
在图21、图22及其相关的描述中,并未涉及图20及其相关的描述中提及的一种情形,即外源序列的插入,并未导致插入点位置上任何目标序列的复制,事实上,对这一类外源序列的完全删除,原则上只需要对图21和图22及其相关的描述中提供的原则和方法作简单的修饰,如图23所示,可以利用对图示中第二级外源序列F2中含有的不同SRE位点的设计,分别为后续步骤中齐头末端、或者5’突出末端的制备创造条件,而在其后的操作中,将可能出现的5’突出的末端补齐再将最后获得的齐头末端作连接,就可以使插入点位置上的目标序列得到完全的恢复。
值得再次强调的是,以上从图18至图23所描述的所有的原理和方法,都应该被视作对母发明的自然延伸或者进一步的说明,而利用母发明以及以上提供的原理和方法,则可以针对不同的具体的研究目的,产生不同的具体的应用形式,然而,由于这些具体的应用形式只涉及常规意义上的分子生物设计的变化,因此,这里将不再对这些变化一一作出说明,而只是通过以下两个例子为代表对此做一些解释。
图24所示的变化,是一种只利用较少的SRE位点实现外源序列在目标序列中的连续插入的方法;如图所示的具体的实施途径是首先将外源序列F1插入到目标序列中去,其特点是其中在合适的位置上包含一个SRE位点,而这个SRE位点可以被广义的,即通常分子生物意义上的限制性内切酶所释放;图示中被指示为RE1;利用与F1中含有的SRE位点对应的SRE的酶切作用,将第二级外源序列F2插入到F1下游,这里的F2以及其后的各级外源序列具备和F1相类似的特点,即其中在合适的位置上包含与F1中相同的一个SRE位点,而这个SRE位点可以被广义的,即通常分子生物意义上的限制性内切酶所释放;不过,需要强调的是,不同级的外源序列中含有不同的用于释放相应的SRE位点的广义的、即通常分子生物学意义上的限制性内切酶的位点,例如,在F2中被标记为RE2;利用RE1释放F1中含有的SRE,再利用F2中含有的SRE位点及相应的SRE的酶切作用,在目标序列中引入F3,同样,F3中含有可以帮助释放其中含有的SRE位点的RE3;利用RE2释放F2中含有SRE位点,在利用F3中含有的SRE位点及相应的SRE的酶切作用,在目标序列中引入F4,同样,F4中含有可以帮助释放其中含有的SRE位点的RE4;显然,以上的过程可以重复进行;而当需要将各级外源序列删除时,则可以利用其中含有的在释放SRE位点后留下的RE位点,将新的序列插入,而在新的序列插入后,可以和原来的外源序列的剩余部分,共同组成一个可以在后续的步骤被完全删除的外源序列;图中仅以新的序列在F2的插入作为说明;显然,如上所说,利用原来的说明以及本发明在图18至图23及其相关的描述中提供的原理和方法,再借助其它常规的分子生物学手段,即可以为多种不同的研究目的提供有效的工具;以下的描述,则是这些原理和方法在后基因组时代基因结构和功能方面的一些重要的应用。
本发明在以上的描述中提及的原理和方法的一个直接的功能,就是从任意来源的目标序列中,包括具体序列结构不清楚的目标序列中,截取任意长度的序列片段;由于在既有的以从目标序列中截取一定长度的序列片段为基础的研究手段中,基本是以TypeIIS类的限制性内切酶的一次性作用实现的,而由此带来的限制是在以TypeIIS类的限制性内切酶的一次性作用下,通常只能截取有限长度的序列片段,这就为此后的研究中对这些片段的分析造成了困扰;而本发明的描述中提供的原理和方法,则可以利用外源序列在目标序列中的连续插入,以及在后续的步骤中对不必要的过度性外源序列的完全删除和相应的插入点位置上的目标序列的完全恢复,从而达到在目标序列中截取任意长度的序列片段的目的,这就为对这些从目标序列中截取下来的序列片段的进一步分析提供了方便;本发明的描述中提供的原理和方法所具备的这一功能可以在后基因组时代的分子生物学研究中形成多方面的应用;以下是一些具体的说明第一,从任意来源的mRNA或者相应的cDNA中,截取一定长度的序列片段,并将之用作不同的研究目的;图25所示,是利用本发明提及的原理和方法,利用外源序列在mRNA来源的目标序列中的插入,截取一定长度的序列片段,并将之用于EST,即Expression Sequence Tag的方法;1.在图25A的示意中,目标序列是任意来源的mRNA,在利用常规的分子生物学手段将之转化为cDNA的过程中,或者在mRNA被转化为cDNA之后,并通过定向克隆的方式连进合适的载体之后,就可以将外源序列F1插入到cDNA克隆的一端,然后,再将后续的外源序列插入,直到能在距离第一级外源序列的一定距离上形成一个插入点;图25A的示意中,则假定经过两次跳跃,即F2之后,就可以在需要的位置上形成插入,图中指示为F3;不过,这里需要特别强调的是,在这里的描述中或者本发明其它地方的描述中,通常在连续的插入中,在最后一个插入位置上引进的序列,如图25A中示意的F3,通常可以是满足本发明定义的外源序列,也可以不必是本发明所定义的外源序列,因为除非有特别的实验上的要求,也可以不必在最后一个插入位点上引进的序列中设置SRE位点,但为了描述的方便,本发明将不给予其它的称谓,同时对此也不再加以更多的强调;如图25A所示,在F3被引入目标序列后,F2的过度作用就已经完成,因此就在后续的步骤中被删除以使得相应的插入点位置上的目标序列得以完全恢复,这样就可以得到在F1和F3之间含有所需要长度的目标序列的序列片段;而由于对应于所有作为目标序列来源的mRNA分子,原则上都可以被相应的被截取下来的特定长度的序列片段所代表,因此就可以将通过以上步骤得到的位于F1和F3之间的特定长度的序列片段作为对作为目标序列的来源的mRNA分子进行分析的间接的手段,而从以上的描述中可以发现,当实验从cDNA的5’端截取特定长度的序列片段时,就可以得到关于作为目标序列来源的所有mRNA分子的5’EST,当实验从cDNA的3’端截取特定长度的序列片段时,就可以得到关于作为目标序列来源的所有mRNA分子的3’EST,而如图25A所示,如果需要对所截取的序列片段做进一步的分析,通常可以对位于载体的第一级外源序列(在图31A是示意中是F1)和最后一级外源序列(在图31的示意中是F3)之间的序列片段进行直接的分析,或者如图25A所示意的那样,利用常规的分子生物学手段,将之克隆下来,并对克隆产物作进一步的研究,例如,可以在如图25A所示的F1的下游端和F3的上游端,分别设计一个可以产生相同性质的末端的限制性内切酶的识别位点,这样,就可以在将位于F1和F3之间的序列片段克隆出来,并利用相应的限制性内切酶的作用,将克隆产物两侧的位于以上两个限制性内切酶位点外侧的属于F1和F3的序列去除,而将位于两个限制性内切酶位点之间的序列回收并使之相互连接形成串连的较长的片段,再将所得到的片段用类似SAGE的手段进行分析(Liang P,2002;Boon K et al,2002;Saha S et al,2002);将图25A及其相关的描述中所提供的原理和方法和其它常规的分子生物学手段结合起来,就可以针对不同的研究任务形成不同的具体的研究方法;以下是对图25A所提供的原理的方法与既有的方法相结合的具体的例子图25B所示意,这里所提供的原理和方法和其它的常规的分子生物学手段形成的一种可以替代常规的SAGE的手段的方法;如图25B所示意这里的目标序列的来源是任意来源的mRNA;实验首先是利用附着在固体的Bead的3’端含有多聚dT的引物,其序列结构是5’(N)n1 GCGGCCGC(T)n2,该引物被用来捕获mRNA的3’端含有的Poly(A)的结构;此后的步骤则是利用常规的分子生物学手段在Bead的表面合成第一条cDNA链,再在第一条cDNA链的基础上合成第二条cDNA链,这样就可以得到附着在Bead表面的双链cDNA;其后的步骤则就在这里得到的双链cDNA的基础上进行利用后面不同级别的外源序列中将要使用的不同的SRE酶对双链DNA进行处理,然后再利用NlaIII对经不同的SRE酶处理后依然附着在Bead上的双链DNA进行处理,然后再利用NotI对经NlaIII处理后依然附着在Bead上的双链DNA进行处理,从而释放出一端为NlaIII酶切后留下的末端另一端为NotI酶切后留下的末端的片段,该片段最后被用定向连接的方式克隆进合适的载体中去,而作为一种选择,该片段可以被直接以定向的方式克隆到载体中含有的第一级外源序列F1的下游,例如可以在F1的下游的位置上设计一个SphI位点,而在更下游的某个位置上设计一个NotI位点,这样,只要载体的其它位置上不含有同样的SphI位点和NotI位点,那么,就可以满足这里的定向克隆的要求;在定向克隆的步骤完成后,就可以利用载体中含有的第一级外源序列F1中带有的SRE1位点实现第二级外源序列F2的插入,同样,第二级外源序列F2中带有的SRE2位点则可以为第三级外源序列的插入提供基础,而这样的过程可以循环进行,直到能够在预期的位置上形成一个插入点以容纳最后一级外源序列(在图25B的示意中是Fi),而作为一种选择,可以将Fi的结构设计成如图25B所示的模式5’N1 N2 N3 N4 C A T G---------------3’,这样在删除了中间过度性的各级外源序列之后,就可以通过一些常规的分子生物学手段,将位于第一级外源序列F1和最后一级外源序列Fi之间的序列片段克隆出来,而如果用NlaIII对克隆产物进行处理,并将两个NlaIII之间的序列片段回收回来,再使被回收回来的序列片段相互连接形成串连的较长的片段,再将所得到的片段用类似SAGE的手段进行分析(PatinoWD et al,2002;91565);而在相应的序列分析的过程中,对应于不同的mRNA分子的序列片段的方向则由一侧的5’CATG3’和另一侧的5’N1 N2 N3 N4 C A T G 3’来判断;而值得指出的是,在图25B及其相应的描述中提级的方法中,由于在得到附着于Bead之上的双链cDNA之后,将首先用后续的步骤中将会用到的不同的SRE酶来处理,因此将可能导致一些丢失,即如果在不同的SRE酶处理之后依然附着在Bead上的双链cDNA将可能失去任何潜在的NlaIII位点,而相应的mRNA或者cDNA分子相关的序列将不可能在后续的利用到NlaIII位点的克隆过程中被体现出来,这里提供的解决这一问题的办法是设计一个并行的但使用不同的SRE位点的实验,这样就可以和前一个实验形成互补;
第二,针对任意来源的目标序列,从其中所含有的具备某种特征的序列结构的位置区域,例如某种限制性内切酶位点的位置区域,截取一定长度的序列片段,并将之用于不同的研究目的;显然,类似的实验只需要对本发明在前面的描述中所提及的原理和方法做非常常规的修饰就可以实现;以下是一个具体的说明如图26所示意,假定目标序列是双链的DNA序列,而研究的具体目的是从目标序列中含有的某种限制性内切酶(图中指示为RE)的位置区域截取特定长度的序列片段,那么,具体的实验步骤就是1,利用后续步骤中将会场使用的SRE酶对目标序列进行处理;2,如有必要,可以选择不同于图26中所指示的RE的其它的限制性内切酶对经SRE处理后的目标序列进行进一步的处理;3,将经过以上处理后所得到的产物的末端修饰成齐头末端;4,用图26所指示的特定的RE进行处理;5,将所得到的一侧含有RE处理后留下的末端、一侧为齐头末端的产物以定向的方式连进合适的含有所需要的第一级外源序列F1的载体中去,其中经4的处理所得到的产物的含有RE处理后留下的末端连在载体中所含有的第一级外源序列F1的一侧,当然,另外一个齐头末端则最终落在距离第一级外源序列F1更下游的位置上;6,利用第一级外源序列F1中所含有的SRE,实现第二级外源序列F2的插入,然后,再利用第二级外源序列F2中含有的SRE位点实现第三级外源序列F3的插入虽然类似的过程还可以循环进行,直到在预期的位置上形成插入,但为了描述的方便,在图26的示意中,则假定第三级外源序列F3即是最后一级外源序列;7,删除过度性的外源序列,在图26的示意中,则是删除第二级外源序列F2在经过前面7个步骤的处理后,就已经实现了从目标序列的某种特定的某种特定的限制性内切酶(即图26中所标注的RE)位点的位置区域,截取了特定长度的序列片段,而后续的步骤,则可以利用本发明在前面的描述中提及的方法以及具体的研究任务而需要作具体不同的设计;总之,无论是从目标序列中截取特定长度的片段,还是从目标序列的某个具有特征性的序列结构的位置区域截取这样的特定长度的片段,其所得到的产物,除了以上提及的用途外,还可以有许多其它重要的用途,例如作为特定的杂交探针、作为Differential Display的辅助工具之一、作为不同体内或者体外体系相关的基因表达或者基因组结构和功能分析的辅助手段之一,等等;由于利用本发明的描述中提供的原理和方法,可以较任何既有的手段从目标序列中截取更长的序列片段,其在各种基因分析中所具有的优势是不言而喻的(Liang P,2002;Saha S et al,2002)。
在原来的以及本发明上文的所有描述中,其所提供的原理和方式,在本质上可以被看着是实现两个方面的功能1,从任意目标序列的任意位置或者区域截取任意特定长度的序列片段;2,针对任意序列包括以上从目标序列中截取的序列片段进行任意性质的包括置换、删除和插入在内的遗传操作;而正是这两个方面的功能,构成了以下构建非随机Ribozyme库的基础。
Ribozyme是一类具有催化作用的小RNA分子,一般情况下,Ribozyme的催化活性依赖其对自身或者其它底物分子的核酸序列的特异性识别(Sun LQ et al,2000);具有Ribozyme特性的RNA小分子的种类很多,其中包括hammerhead ribozyme,hairpin ribozyme,group I introns(有时亦被称为groupI ribozyme),the group II intron(有时亦被称为group II ribozyme),the RNA component of RNasse P(RNase P ribozyme)和hepatitis delta virus ribozyme(即HDV ribozyme)等等;除了各种自然出现的和人工制造的各种Ribozyme分子之外,一类纯粹是在实验室条件下人工制造的具有不同催化活性的DNAzyme,其特征和作用方式也颇为类似(Takagi Y et al,2001);不过,虽然不同的Ribozyme和DNAzyme的具体序列特征可以有很大的变化,但从分子生物学操作的角度讲,却都可以在基本的结构上被分成两个部分,即1,用作对作用底物作特异性识别的识别序列部分,其功能是通过碱基配对的原理对现在的底物进行特异性的识别;2,除识别序列以外的所有其它的所有与Ribozyme分子、DNAzyme分子的催化活性相关的序列部分;通常对同一Ribozyme分子,也包括对同一种的DNAzyme分子而言,只需对决定作用底物的特异性的识别序列部分作变动,就可以使之作用于不同的底物分子;所谓的随机Ribozyme库的构建,即是用人工合成的随机序列作为Ribozyme分子上的识别序列,这样至少在理论上,由此构成的Ribozyme库即含有可以作用于所有潜在的底物的Ribozyme分子(Suyama E et al 2003);但如前所言,不同类型的随机Ribozyme库,基本都存在两个方面的缺陷其一,效率较低;例如,一个Hammerhead类型的Ribozyme库,其中含有的用于特异性识别的随机序列部分的总的长度,通常需要达到15个碱基,这就意味着一个完整的随机库所代表的不同序列的总和,应是415,即大于1.6×109,而对大多数的研究目的而言,随机库中的相当数量的分子是毫无用处的,这就在无形中增加了无效工作的比例;其二,较难构建含有更长随机序列的Ribozyme库;Ribozyme分子中的特异识别序列的长度,事实上可以有很大的变化,在一些情况下,含有较长特异识别序列的Ribozyme,可能更为有效;但随机序列的总长度的延长,即意味着随机库容量的加大,这就必然给库的维持和使用带来困难。为避免随机Ribozyme库的局限,本发明在以上所描述的原理和方法的基础上,提供了一种构建非随机Ribozyme库的方法,即从目标序列中截取一定长度的序列片段,然后在此基础上,通过对该被截取的序列片段的实验改造,制备具有特异的序列识别功能的Ribozyme体系;而利用同样的手段,也可以制备类似的DNAzyme体系;显然,由此得到的Ribozyme体系和DNAzyme体系,因为具有了明显的针对性,其效率必然会得到很大程度的提高,同时也消除了以上提及的其它方面的困扰。
在实验操作的意义上,本发明所说的非随机Ribozyme库的构建,事实上可以被理解成一个从目标序列中截取一定长度的序列片段并对所截取的来源于目标序列的序列片段进行特殊的修饰的过程,而以下的描述,同时参照图2、图3、图4及相关的描述,则是对非随机Ribozyme库或非随机DNAzyme的构建过程的一般原理和方法的说明如图27所示意,是非随机Ribozyme库或DNAzyme库的构建的实施的功能性步骤,这里所说的“功能性步骤”的含义是以下所列举的操作步骤,只代表对与非随机Ribozyme库或DNAzyme库的构建所需要完成的操作的性质的功能性拆解,而并不一定代表对具体的实验设计和操作程序的严格限制;以下是具体的描述第一步按照本发明在前文中描述的方法,或者其它任意的手段,从目标序列中截取一定长度的序列片段。通常情况下,这里的目标序列的来源,较多的是从不同类型的RNA分子转换成相应的DNA分子,例如,某个来源的mRNA分子的总和(pool),当然,也可以是其它任意根据具体的研究任务确定的其它形式来源的适合作目标序列的分子;如图27所示,将所截取的序列片段的长度假定为17个碱基,但显然,这只是为了描述的简便,事实上,从截取的目标序列的长度,将完全可以根据不同的严加研究任务而确定,或者即使对同样的研究任务,从目标序列中所截取的序列片段的长度,也可以有不同的选择,因此,这里以及本发明其它地方在具体的图示中对从目标序列中截取的序列长度的设定,都不应被视做是对本发明的任何形式的限制;第二步从以上第一步得到的产物中选择出具备一定特征的序列片段;这里所说的“具备一定特征的序列片段”的含义是在该序列片段的一个或者一个以上的位置上各自的碱基组成,至少有一种碱基的出现是不允许的;一般情况下,通过第一步的操作,将可以得到具备不同序列特征的序列片段,而就非随机Ribozyme库或非随机DNAzyme库的构建而言,针对不同类型的Ribozyme体系或者DNAzyme体系,就出现了以下两种可能的选择其一,直接将所截取的序列片段,用于后续步骤中非随机Ribozyme库或非随机DNAzyme库的构建;其二,选择具备一定特征的序列片段并将之用于后续的步骤;由于在大多数情况下,能被不同类型的Ribozyme分子或DNAzyme识别和作用的底物序列,通常都具备一定的特征(SunLQ et al,2000),因此,在这些情况下,为了提高这里所要建立的库的针对性和效率,也有必要选择具备一定特征的序列片段用于后续的步骤;有鉴于此,在后面的相关步骤的描述中,将主要以需要选择具备一定特征的序列片段的情形为基础来进行,显然,对于那些直接将所截取的序列片段,则完全可以被看着是那些需要选择性的步骤的情形下的一个特例,因此,本发明的这种描述方式,也不应被视为是对本发明的任何意义上的限制;在图27的示意中,则是假定从被截取的片段中筛选出在第8、第9和第10位的碱基具备某种特征的序列片段,图27的示意中以三个斜体的XXX作标记,这里所说的具备一定特征的序列片段,其含义是至少在该序列片段的某些位置上,其碱基的组成,必须满足一定的要求,例如,作为Hammerhead类的Ribozyme分子的底物序列,通常倾向于需要在这些底物序列的中间的特定的位置上,含有5’---NUH------3’的碱基的组成,在本发明的所有描述中,N=A,T(U),G,C;H=A,T(U),C;而作为Hairpin类的Ribozyme分子的底物序列,也较多的倾向于需要在这些底物序列的中间的特定的位置上,含有5’---GUC------3’的碱基的组成;同样,作为10-23类的DNAzyme分子的底物序列,也倾向于需要在这些底物序列的中间的特定的位置上,含有5’---NRY------3’的碱基的组成,在本发明的所有描述中,N=A,T(U),G,C;R=A,G;Y=T(U),C;显然,图27中的示意中对序列特征的假设,只是为了描述的方便,而不应被视做是对本发明的任何意义的限制;第三步对以上得到的序列片段作进一步修饰;在实验操作的意义上,这里所说的对序列片段的修饰即相当于不同形式的突变处理,例如,针对序列片段所含有的碱基的删除、置换或者新的碱基序列的插入等;显然,根据不同情况下的实验要求,以上的突变处理可以发生在序列片段的任意有必要的碱基位置上,但在图27的描述中,则是针对和Hammerhead类的非随机Ribozyme库的构建以及和Hairpin类的非随机Ribozyme库的构建相关的情况下的可能的具体形式的一种加以说明,但值得在次强调的是,采取这样的方式,只是为了更清晰的对相关的步骤加以说明,而不是对本发明的任何意义的限制;在图27的示意中,Hammerhead类的非随机Ribozyme库的构建相关的对序列片段的修饰的方式中,通常涉及以下的操作,即将序列片段中间的一个或者一个以上的碱基删除,图27的示意中,则假定是将作为特征序列的第8、第9和第10位的碱基中的后两个位置上的斜体标示的XX删除,然后在相应的位置上,插入一段和最后的Hammerhead类的Ribozyme的催化活性相关的序列,在图27的示意中,以大写的CORE来标示;Hairpin类的非随机Ribozyme库的构建相关的对序列片段的修饰的方式中,通常涉及以下的操作,即将序列片段中间的一个或者一个以上的碱基删除并在相应的位置上插入其它新的碱基或者碱基序列,图27的示意中,也假定是将作为特征序列的第7、第8、第9和第10位的碱基置换为其它的四个碱基,图示中以四个小写的nnnn来指示,然后在图示的序列片段的上游端,插入一段和最后的Hairpin类的Ribozyme的催化活性相关的序列,在图27的示意中,以大写的CORE来标示第四步将经修饰后得到的序列片段按合适的方向克隆到合适的外周序列环境中去;这里所说的外周序列环境,是相对修饰后的序列片段而言的;很显然,作为分子生物学的一种毋须强调的常识,除了极为特殊的具体实验条件,以上各步骤的实验操作,通常都是在相应地载体环境中进行的,因此,在具体地实验操作的意义上,这里所说的“将经修饰后得到的序列片段按合适的方向克隆到合适的外周序列环境中去”,也就意味着,将在一个载体环境中经修饰的序列片段,克隆到一个新的序列环境,例如新的载体环境中去;这种克隆过程的目的,是为了针对不同类型的Ribozyme库或DNAzyme库的构建,使最终的功能性的Ribozyme分子或DNAzyme分子的产生成为可能;不妨分别以上游序列和下游序列指称相对于经修饰的序列片段的外周环境;在图27的示意中,在将经过以上的步骤修饰的序列片段按图中示意的方向克隆到新的满足要求的序列环境中之后,则被克隆的经过以上第三步骤修饰的序列片段就有了新的上游序列和下游序列;在如图所示的最终产生功能性的Hammerhead类的Ribozyme分子或者Hairpin类的Ribozyme分子而言,满足要求的上游序列和下游序列的一种配置是上游序列是合适的启动子,例如,适合细胞内表达的PolIII启动子,而下游序列则是相应的能够和上游的启动子匹配的转录终止信号(Medina MF et al 1999);显然,针对不同的研究目的,将需要有不同的外周序列的设计,例如,对一些DNAzyme库的构建而言,一种合适的外周序列环境可以仅是合适的引物结合区;由于针对不同类型的Ribozyme库或DNAzyme库的构建,或者针对同一类型的Ribozyme库或DNAzyme库的不同研究目的下的不同的任务,所有在上游序列和下游序列上的设计的变化,通常只涉及常规意义上的分子生物学设计的变化,因此,这里就不再对各种不同的潜在的变化形式一一作出描述,但显然,这并不应被视作是对本发明的任何意义的限制。
图27及其相关的描述中提供的,是对非随机Ribozyme库或非随机DNAzyme的构建过程的主要实施步骤;然而,值得强调的是这里非随机Ribozyme库或非随机DNAzyme的构建过程的主要实施步骤的划分,只是为了清楚地对本发明的相关内容进行说明,而不意味着对本发明的任何意义上的限制,事实上,在本发明提供的原理和方法的基础上,同时结合常规的分子生物学意义上的变化,就可以针对不同的研究目的,产生许多具体的实施途径的变化;例如,在某些情况下的实验设计中,以上所说的第一步和第二步的实施,即从目标序列中截取一定长度的序列片段和对具备一定特征的序列片段进行筛选,完全可以在一个步骤中完成;不过,虽然步骤的划分并不构成对本发明的原理和方法的具体实施形式的约束,但为了描述的简便,以下将继续延用这里的对本发明的相关内容的实施过程对步骤的划分;在以下的描述中,则是对与这些主要步骤相关的一些具体细节的说明一,对图27及其相关的描述的第一步骤和第二步骤提及的“选择特征性的序列片段”的方法的进一步说明;显然,对本发明的实现而言,可以使用各种能够实现这一目的的手段,而这里进一步提供的,是两种可能的途径1.引物介导的筛选;这里所说的引物介导的筛选,是指将需要选择的特征性的碱基包含在引物序列的设计中,优选的情况下,是将需要选择的特征性的碱基设计在引物的3’端,并利用引物对潜在的结合底物的序列的选择,以达到对目标序列的序列片段进行选择的目的;本发明将这里所说的服务于引物介导的选择的含有特征性碱基的引物称为特征性引物;针对非随机Ribozyme库或者非随机DNAzyme库的构建而言,所谓的特征性的碱基,既可能位于被截取的序列片段的中间位置上,也可以位于被截取的序列片段一端的位置上,下面分别加以描述1)针对特征性的碱基位于被截取的序列片段的中间位置的情形;优选的情况下,这种情形下特征引物的基本结构应含有两个基本的区域,即位于5’端的随机序列区和位于3’端的特征性的碱基序列区;显然,这里的随机序列区的长度将不能低于序列片段中被特征引物结合的一侧的非特征碱基的长度;而作为在不同实验设计下的一种选择,可以在以上特征引物基本结构的上游,加上一段常规意义上的完全非随机序列,以用作另一个常规的引物结合区域;显然,在合适的反应条件下,以上特征引物将可以和目标序列中、或者被截取出来的序列片段中潜在的含有相应的特征序列的亚群结合,而对具备这些相应的特征序列的亚群的进一步选择,则可以有多种不同的方法,例如,可以利用聚合酶的作用从特征引物的3’端进行链的延伸,再通过后续的步骤将含有特征性的组成的序列片段筛选出来;而在特征引物中含有以上所说的常规引物结合区的情况下,则可以利用相应的常规引物,同时根据具体的实验对象,设计另一个配对的引物,从而利用PCR反应,将所需的特征性的序列片段扩增出来;如图28所示,是一个具体的说明假定需要从目标序列中截取长度为17个碱基的序列片段,在从中选择出在第8、第9、第10位的碱基分别为X1、X2和X3的亚群,这里的X1、X2和X3分别代表了具备一定特征的碱基;则如图所示意的分别针对两个不同方向的特征引物的设计是引物A的结构5’(引物1的结合区)(随机序列区)(特征碱基序列区)3’;在图28的示意中,其结构是5’(引物1)NNNNNNN X’3X’2X’13’;这里的X’是指和X配对的碱基;引物B的结构5’(引物2的结合区)(随机序列区)(特征碱基序列区)3’;在图28的示意中,其结构是5’(引物2)NNNNNNN X1 X2 X3 3’;图示中的引物A’或者引物B’,通常是根据引物A或者引物B结合区的上游或者下游的已知序列设计的;例如,当目标序列或者从目标序列中截取出来的序列片段是位于某个载体序列中时,就可以利用合适的限制性内切酶,将目标序列或者从目标序列中截取出来的序列片段两同两侧的部分载体序列一同释放出来,而被释放出来的两侧的载体序列,就可以被用作引物A’或者引物B’的结合区;如图所示意的利用引物A的筛选方法是利用引物A和目标序列或者从目标序列中截取的序列片段结合,然后利用聚合酶的作用使引物A得到延伸,然后,再在此基础上,利用引物1和引物A’作PCR反应,这样,就可以将特征性的序列片段克隆到PCR产物的一侧;而进一步的实验中,如果有必要,则可以从引物1的一侧,利用外源序列的连续插入,将合适长度的序列片段截取出来;如图所示意的利用引物B的筛选方法是利用引物A和目标序列或者从目标序列中截取的序列片段结合,然后利用聚合酶的作用使引物A得到延伸,然后,再在此基础上,利用引物2和引物B’作PCR反应,这样,就可以将特征性的序列片段克隆到PCR产物的一侧;而进一步的实验中,如果有必要,则可以从引物2的一侧,利用外源序列的连续插入,将合适长度的序列片段截取出来;事实上,利用特征引物和潜在的底物的结合和链的延伸,还可以形成其它类型的后续的筛选手段,例如,作为一种选择,可以将特征引物附着在固体颗粒的表面,这样,就可以借助引物和被截取出来的序列片段的结合以及合适反应条件下的链的延伸反应,将序列片段固定在固体颗粒的表面,以为后续的筛选提供基础显然,在图28A及其相关的描述中,如果利用特征引物与目标序列的潜在区域的结合直接进行筛选,那么,图27及其相关的描述中所提及的第一个步骤和第二个步骤的界限取消了;但由于类似的变化并不违背本发明所提供的基本原理和方法,所以并不应被看着是本发明的例外;2)针对特征性的碱基位于被截取的序列片段的一端的位置的情形;在这种情况下,特征引物的设计将会出现一些变化,当特征引物用于对目标序列中的潜在区域直接结合是,其结构也可以用以上1)中所提及的结构形式,但其中的随机序列区的长度,将可以根据具体的研究需要确定;而当特征引物用于对已经截取出来的序列片段进行筛选时,其结构的确定,除了优选条件下在3’端的特征碱基外,其它的序列则可以根据外周的序列环境确定;而在特征引物的变化确定后,其它的过程则与1)中的描述相似,因此不再赘述;2.连接介导的筛选;这里所说的连接介导的筛选,是利用连接反应中相互匹配的末端的连接效率较高的特点,对含有特征性碱基的序列片段进行筛选;在具体的操作上,则是将序列片段潜在的特征性碱基位置经酶切等手段暴露于由此而来产生的末端的位置上,然后再利用其与含有和特征性碱基想匹配的末端的DNA片段的连接反应将所需要的相应的序列片段筛选出来;显然,在各种可能的通过酶切反应将序列片段中特定位置上的碱基暴露于末端的手段中,在母发明的说明中以及本发明的描述中提及的在外源序列中含有的SRE位点及其所有相关的手段,都可以被用到这里来;图29所示意,是假定需要从图示的序列片段中选择出对应于顶部DNA链的第7、第8、第9和第10位的碱基位置上分别含有A、A、T、A的序列片段亚群;在图29的示意中,是利用位于序列片段一侧的FokI位点,当然也通过相应的酶切反应,将待选择的序列片段中以上位置上的碱基暴露到末端中,而后续的步骤中,则是如图所示,通过连接反应将所需要的序列片段的亚群筛选出来;当然,如果将新连接进的片段设计成可以在后续的步骤中被完全删除的外源序列的形式,则就可以在必要的时候将以上经连接插入的片段完全删除。
二,当需要将一个DNA序列以定向的方式整合进另一个DNA序列时,对所得到的整合产物的方向性的选择;很明显,在图27的示意及其相关的描述中所提及的第二步、第三步和第四步都可能遇到需要对整合后得到的产物的方向进行筛选;例如,在图27的示意及其相关的描述中,当需要用连接介导的方式对来自于目标序列的序列片段的亚群进行筛选时,通常需要借助其它的DNA片段的末端,而由于通常情况下,这些被借助的所谓“其它的DNA的片段”的序列在功能上是不对称的,因而需要按照特定的方向连接进去,因此,对连接方向的确定就成了很重要的环节;一般情况下,比较常用的保证连接方向的分子生物学方法,是通过对用于连接的末端的设计来实现的,例如,利用不同的限制性内切酶制备不同的末端等,但显然这种方法不能满足所有的连接反应;本发明在这里提供的,是一种更为实用的保证连接方向的方法;图30的示意,是对这种方法的具体说明在图30的示意中,是将一段图示的插入序列整合到图示的载体序列中去;这里所说的插入序列可以任意的用于整合实验的DNA序列,这里所说的载体序列,通常情况下是任意的针对不同的研究目的的载体,例如,分子生物学常用的质粒载体等,当然也可以是其它类型的在铁的事实面前,这里所说的“插入序列整合到图示的载体序列中去”的过程,可以是任意可以用于将插入序列导入载体序列的方法,例如,连接反应,PCR反应,突变手段,利用转座子的手段等;图30A所示意,是一种可以通过基因的表达以直接或者间接的方式为插入序列和载体序列的整合提供筛选信号的方法;在图30A的插入序列的设计中,包含了一个转录单位,这里所说的转录单位的含义是能够保证一个基因在一定的条件下得到表达所需要的结构的总和,通常情况下,有三个部分组成启动子、在图示中以P标注;基因编码序列,而当基因是一个蛋白编码序列时,则是一个含有合适的转译起始信号的开发阅读框架,图示中为简明起见,则不再对基因编码序列的性质作具体的区分而直接都标注为ORF;转录终止信号,图示中标注为A;这里将所有用作“通过基因的表达以直接或者间接的方式为插入序列和载体序列的整合提供筛选信号”的目的的基因编码序列都称为筛选基因;显然,满足这里的定义要求的潜在的筛选基因的类型很多,通常情况下可能得到较多的使用的,是编码特殊的抗性分子的基因,例如编码氨变青霉素抗性分子的基因(Amp-R),编码卡那霉素抗性分子的基因(Kan-R)等;本发明在这里提供的用于确定插入序列在载体序列中的整合方向的方法,是通过对图30A及其相关的描述中提到的方法进行修饰形成的,其具体的实施途径是将图30A及其相关的描述中所提及的筛选基因的转录单位拆解成两个或者两个以上的部分,其中任意一部分都不能单独完成基因表达的功能,然后,再将拆解后形成的不同的部分分别设计到插入序列和载体序列中去,而这样的设计所产生的效果是只有当插入序列以一定的方向整合到载体序列中时,才能使筛选基因的转录单位得到恢复,而借助筛选基因的表达,则为阳性克隆的筛选提供了信号;以下是几种可能的设计形式图30B所示意,是将转录单位的启动子(P)置于载体序列上,而基因编码序列(ORF)和转录终止信号(A)置于插入序列中,这样,只有当插入序列以图示的方向整合进载体序列中时,才能为筛选基因的表达成为可能;图30C所示意,是将插入序列的整合位点设计在载体序列的一个启动子(P)和一个基因编码序列(ORF2)及其后的转录终止信号(A)共同组成的ORF2 A结构之间;而在插入序列中则含有一个由基因编码序列(ORF1)和一个转录终止信号(A)共同组成的ORF1A的结构;这样,只有当插入序列以图示的方向整合进载体序列时,才能为筛选基因ORF1的表达成为可能,与此同时,由于插入序列的整合而导致的ORF2相对应的基因的表达被灭活,则可以为阳性克隆的筛选提供进一步的手段;图30D所示意,是将启动子部分置于插入序列上,这样,就可以利用启动子作用的方向性确定插入序列的整合方向;图30E所示意的设计和图30B所示意的情形有类似之处,唯一变化是在插入序列中含有两个方向相对的基因编码序列及其后的转录终止信号共同组成的ORFA结构,即图示中方向相对的ORF1A结构和ORF2A结构;这样,如图30E1和图30E2所示意,当插入序列分别以不同的方向整合进载体序列时,则分别为不同基因的表达提供了可能;这里的设计,可用于在同一个实验中同时对两个整合方向进行筛选,而当这两个筛选基因中的一个是负筛选信号的编码基因时,则就可以被用来对不需要的方向上的整合产物进行筛选;显然,利用图30及其相关的描述中提供的原则,可以形成多种不同的设计形式,由于在以上原则下的不同设计将只涉及常规的分子生物学手段,因此,为了描述的简明,将不再赘述,但显然这不应被看作是对本发明的任何意义上的限制。
图30的示意及其相关的描述中所提供的,是一种利用在插入序列中设置和筛选基因的表达相关的序列并在后续的步骤中利用筛选基因的表达来确定插入序列在载体序列中的整合的方向的方法,不过,在通过这种方法得到阳性克隆之后,就可能遇到需要将插入序列中和筛选基因的表达相关的序列删除的情形;对于那些不需要对插入序列中和筛选基因的表达相关的序列作完全删除的情况,通常可以用常规的分子生物学手段来实现,例如,可以利用合适的限制性内切酶来实现,当然,无论是不完全删除,还是完全删除,都可以利用母发明的描述以及本发明的描述中提供的各种原理和方法来实现,例如,当和筛选基因的表达相关的序列被设置在外源序列中时,就可以将外源序列中含有的这些和筛选基因的表达相关的序列设计成完全删除子的形式,即相当于在外源序列设计成一个嵌套的具备完全自我删除功能的外源序列的形式,那么,就可以在利用筛选基因的表达得到阳性克隆之后,在必要的时候,将嵌套的具备完全自我删除功能的外源序列删除;图31所示意,是利用构建非随机Ribozyme库或者非随机DNAzyme库的过程中经常需要进行的操作,对外源序列中含有的和筛选基因的表达相关的序列做完全删除的具体应用做一个说明如图31所示意,假定这里的实验的目的是将来自目标序列的长度为17个碱基的序列片段的第8、第9、第10和第11位置上的碱基并在同样的位置上插入一段新的修饰序列;图31的示意中,是假定已经在该序列片段的合适位置上插入了一段外源序列,显然,在该外源序列的插入过程中,导致了所需要删除的位置上的碱基的一个复制;这里的外源序列的结构是SRE1----ORF1 A----SRE2;而同样如图31所示意,在含有这里所说的来自目标序列的序列片段的载体中,带有一个如图所示的启动子,显然,这个启动子可以和外源序列中含有的ORF1A结构一起,为外源序列的插入方向提供筛选信号;在图31的示意中,利用SRE1和SRE2的作用下,可以将外源序列及其需要删除的碱基一起分离出去,然后再根据SRE1和SRE2留下的末端的特点,将新的含有修饰序列的外源序列连接进来,而在新连接进来的新的外源序列中则包含了一个嵌套的具备完全自我删除功能的含有和筛选基因的表达相关的序列的外源序列、其结构是SRE3----ORF2A----SRE4,其中含有的ORF2A为阳性克隆的筛选提供了基础,同时,在SRE3和SRE4的作用下,就可以嵌套的外源序列完全删除并留下必要的修饰序列部分;显然,在原来的描述和本发明的以上的描述中,所有的插入序列、包括具备本发明所定义的外源序列性质的插入序列,其可能的来源无非是两个其一,人工合成;其二,从其它的序列中释放出来;而对于图30和图31的示意及其相关的描述中提及的在插入序列中含有和筛选基因的表达相关的序列的情况,由于插入序列的长度太大,因而并不合适通过人工合成的办法,而针对这种情况的另一种可能的制备插入序列的办法是利用限制性内切酶或者其它手段从其它序列中获得满足要求的插入序列;本发明在这里提供的是一种和SRE酶的作用下产生的末端相关的制备插入序列的方法这首先提供的是一种载体,即如图32所示意的pDonor,该载体的特征是含有一段满足不同的研究要求的插入序列,在插入序列的两侧的合适的位置上(这里所说的插入序列的两侧可以是插入序列的上游端和/或下游端、或者插入序列的上游端和/或下游端的外侧的载体序列上),至少有一侧含有一个SRE位点;因此,含有此特征的pDonor,其具体的设计和相应的插入序列的释放形式,可以是以下情形中的任意一种1,在插入序列的两侧的合适位置上分别含有一个相同的或者不同的SRE位点,而在相应的SRE酶作用下释放出来的插入序列,则分别含有一个和各自的SRE位点及其相应的SRE酶对应的末端;2,在插入序列的一侧的合适位置上含有一个SRE位点,同时在对应的另一侧含有一个常规意义的限制性内切酶位点,而在相应的SRE酶和相应的常规意义上的限制性内切酶的作用下释放出来的插入序列,则分别在一侧含有一个和SRE位点及其相应的SRE酶对应的末端,而在另一侧含有一个和常规的限制性内切酶位点及相应的常规意义上的限制性内切酶对应的末端;显然,通过对pDonor中含有的不同SRE位点和/或常规意义的限制性内切酶位点的设计,以及不同的对切后产生的末端的修饰手段,就可以得到满足不同的连接反应的末端需求的插入片段;当然,作为一种选择,对pDonor的设计,除了上面提及的形式外,也可以在两侧同时分别含有一个合适的常规意义上的限制性内切酶位点,而在此基础上被释放出来的插入序列的末末端,也可以直接或者在经过适当的修饰后被用于不同的连接反应中去;如图32所示意,是一个具体的说明;这里假定实验的目的是长度为17个碱基的序列片段的集合中,选择出在图示的第7、第8、第9和第10位的碱基位置上含有特定的序列组成的亚群,图中将这四个位置上所需要选择出来的特征以XXXX表示,同时将与之互补的序列以X’X’X’X’表示;这样,按照上面提供的对pDonor的设计原则,可以用位于合适的位置上的FokI位点并在相应的FokI酶的作用下将待选择的序列片段中含有的第7、第8、第9和第10位的碱基暴露到酶切末端上,而同时,可以如图所示,将两个作用方向相对的FokI位点设计到对应的pDonor中去,这样,只要对FokI酶切位置上的序列作适当的设计,就可以为得到满足要求的酶切末端提供条件,例如可以通过适当的设计,使经FokI酶切作用下释放的末端成为如图所示意的形式并将之用于对序列片段的连接介导的选择;显然,在连接介导的筛选步骤完成后,插入序列中可能含有的和筛选基因的表达相关的序列,也可以;利用以上提供的方法被删除。
三,在图27的示意及其相关的描述中提及的关于非随机Ribozyme库或非随机DNAzyme库的构建的一般程序中,曾经提及在第四步中,可能需要将修饰后的序列片段克隆到新的序列环境中去;显然,就这一步骤的实施而言,针对不同的实验过程,可能产生不同的办法;而为了对这个步骤的具体实施做进一步的说明,以下则为经修饰后形成的序列片段的后续的克隆过程提供一个可以作为选择的方式如图33所示意的实验目的,是将含有修饰序列的序列片段克隆到新的序列环境中去、即图示的新的载体中去;为实现这一目的,可以利用各种可能的方法、其中包括原来的描述以及本发明在以上的描述中提供的方法,将两个相同的或者不同的SRE位点并利用相应的SRE的作用将经修饰后的序列片段释放出来,当然,其所含有的末端可以是在相应的SRE酶的作用下直接产生的,也可以是将SRE酶的作用下产生的末端被进一步修饰后形成的;而与此同时,可以在另一个含有所需要的序列环境的载体(不妨称之为pAcceptor)中的合适位置上设计类似的相同的或者不同的SRE位点,其特征是可以在相应的SRE酶的作用下,或者在SRE酶的作用后被进一步修饰后,形成和以上被释放的经修饰的序列片段的末端相匹配的可以在适当的条件先进行连接反映的末端,最后形成如图33所示意的pAcceptor-final;根据不同的研究需要,含有修饰序列的序片段,可以被克隆到任意新的序列环境中,以下是几中可能的选择1,常规的质粒载体;2,病毒载体,例如反转录载体载体,腺病毒载体等等;3,特殊的可在真核细胞的染色体外复制的载体;而在相关的非随机的Ribozyme库或者非随机的DNAzyme库完成之后,也可以运用到不同的体系中去,例如细胞外的实验体系或者不同的细胞体系乃至动物体系等等;对于不同的具体的研究任务,可以选择将以上含有修饰序列的序片段克隆不同的载体环境中去,以及在不同的具体研究任务中,将已经完成的库转入不同的实验体系中,然而,由于在实验操作的意义上,这类不同的载体和体系的选择,只涉及常规的分子生物学的实验手段,因此,为了描述的简明,就不再一一叙述了,但显然,这并不应被视做是对本发明的任何意义上的限制。
以上所提供的,是关于非随机Ribozyme库和非随机DNAzyme库的构建相关的原理、方法和一般的实施步骤的说明;显然,针对不同的研究目的和实验背景的不同,在具体的应用中,将可能在这里形成的原理、方法和一般步骤的基础上形成许多常规分子生物学意义上的变化,而为了描述的简便起见,这里将不对所有可能的常规分子生物学意义上的变化一一进行说明,但显然,这一点并不能被视为是对本发明的任何意义上的限制。
在以下的描述中,将通过Hammerhead类的Ribozyme库和Hairpin类的Ribozyme库的构建,对本发明所提供的原理、方法和一般的实施步骤作进一步的说明;不过,值得强调的是,在以下的对Hammerhead类的Ribozyme库和Hairpin类的Ribozyme库的构建过程的描述中所涉及的一些对具体前提的假设和具体的实施方法的选择,都不应被视作是对本发明的任何意义上的限制。
一,Hammerhead类的Ribozyme库的构建假定本实验的目的是针对作为目标序列来源的某种细胞的mRNA的总和,完成Hammerhead类的非随机Ribozyme库的构建;图34所示意,是一种比较常见的Hammerhead类的Ribozyme分子及其作用底物的序列结构;如图所示的顶部的mRNA链中的序列结构,即5’--------NNNNNNNU H NNNNNNNN---------3’,是被Ribozyme分子识别并作用的部分,而底部的则是一个Ribozyme分子的结构;而在Ribozyme分子的作用下,就可以在顶部的识别序列的H的下游产生断裂并因而导致mRNA分子的断裂;虽然Hammerhead类的Ribozyme分子有多种可能的序列结构的形式,而与不同的Hammerhead类的Ribozyme分子相对应的底物中的识别序列的特征也可能有不同的变化,然而,就实验操作的角度,由于对具有不同的结构特征的Hammerhead类的Ribozyme库的构建通常只涉及常规意义的分子生物学实验手段的变化,因此,这里将主要依据图34所示意的比较常见的Hammerhead类的Ribozyme分子的序列结构对Hammerhead类的非随机Ribozyme库的构建过程进行说明,显然,这不应被视为是对本发明的任何意义的限制;图34所示意的Hammerhead类的Ribozyme分子,当其与合适的底物序列结合后,将产生如图所示的通过Ribozyme分子和底物的序列结构之间的碱基配对形成的两个Helix结构,即图示的HelixI和HelixIII;本发明在此后的描述中,也将直接将Ribozyme分子和底物中含有的与HelixI和HelixIII对应的序列称为HelixI部分和HelixIII部分;图示中将Hammerhead类的Ribozyme分子中含有的催化核心(Catalytic core),即5’cugaugaguccgugaggacgaa 3’中含有的另一个如图所示意的Helix结构称为HelixII;理论上,具备图34所示意的催化核心结构的Ribozyme分子可以被设计用来作用于任意含有5’-NUH-3’序列特征的底物RNA分子,虽然在不同的Hammerhead类的Ribozyme相关的研究中,这里的5’-NUH-3’序列特征可以被其它的、例如一种更广谱的5’-NHH-3’序列特征所替代,但在这里的描述中,则主要在如图所示的5’-NUH-3’的特征的基础上进行;另一方面,在如图所示的结构中,HelixI和HelixIII的长度可以有不同的变化,而在这里的描述中,则分别将HelixI和HelixIII的长度设定为8个碱基和7个碱基,但显然,这种设定只是为了描述的简便,同样也不应被视做是对本发明的任何意义上的限制;在以上的说明及其相关的设定的基础上,这里就可以将非随机的Hammerhead类的Ribozyme库的构建过程具体为以下的实施方案如图35所示意,这里的目标序列的来源是一个mRNA集合(mRNA pool);而实验的第一步是通过常规的手段将mRNA转变为相应的第一条cDNA链(the first strand cDNA);而第二条cDNA链的合成是利用一个随机引物实现的,如图35所示意的随机引物的结构是Primer15’biotin------GCGGCCGCNNNNNNNNN 3’由图示可见,该引物的下游端的9个碱基是随即序列区,而这里将除随机序列区以外的部分称为Primer1区域,随机引物的上游端标记有Biotin(图示中以黑色填充的小圆圈表示);显然,在合适的反应条件下,通过随机引物的随机区与第一条cDNA链的结合,就可以合成第二条cDNA链,由此得到的DNA双链的集合被分成五个等份,然后分别用AluI、BstUI、Har III、HpyCH4V和RsaI酶切,所得到的产物经Streptavidin Magnetic Beads吸附,而被吸附于Beads表面的产物的游离的一端是以上酶切留下的齐头末端,紧接着的步骤则是在该齐头末端连接上一个Adaptor,该Adaptor中的序列结构中含有一个Primer2的结合区域,这就为利用Primer1和Primer2来扩增吸附在Streptavidin Magnetic Beads表面的产物提供了条件;在经过以Primer1和Primer2为引物的PCR扩增的步骤后,后面接着的则是一个可以根据研究者的意愿选择的步骤,即利用AcuI、BbsI和SapI对PCR反应所得到的产物进行酶切作用并在酶切反应后利用常规的手段将酶切留下的末端修齐;无论是否经过这个可以根据研究者的意愿选择的步骤,后续的操作则是相同的;如图36所示,以上所得的产物则经过NotI的酶切作用,由此得到的产物的两侧的末端则分别为NotI酶切留下的末端和一个齐头末端,这就为后续的定向克隆提供了条件;显然,这里的2nd Strand cDNA的合成,用了一个随机引物,不过,在具体的实验过程中,有可能出现相应的随机区域与底物之间在不完全配对的情况下发生结合的情况,而这会对所要建立的Hammerhead类的Ribozyme库的效率产生影响,所以,如果想避免这一方面的可能的干扰,也可以采取其它的方法来完成图35的示意中的任务,例如,可以通过常规的手段,以mRNA为模板,逐步合成双链cDNA,然后,在利用DNaseI对双链cDNA进行有控制的处理,再利用T4 DNA polymerase的活性,将反应体系中的末端修齐,接下来再收集反应体系中的核酸片段,并将之与一个具有以下结构的适应子相连接5’-------------TCCAAC 3’3’-------------AGGTTC 5’
在这里的适应子中,底部链的5’是磷酸的,所以,可以用于连接反应;该适应子中含有一个MmeI位点,当连接反应完成后,则利用MmeI对连接产物进行酶切,这样就可以从目标序列中截取到足够长度的序列片段并用于后续的实验,当然,在相关的设计中,也应该作一些属于常规的分子生物学意义上的调整;后续的步骤则是将前一步骤得到的产物克隆到一个合适的载体中,这里所说的合适的载体的含义是载体所具备的特征,允许所有后续操作的进行;如图36所示,这里所说的合适的载体可以在经过相关的处理后产生两个末端,即一个能和以上的经过NotI酶切留下的末端在连接的意义上想匹配的末端,而另一个末端则是齐头末端,在此基础上,则可以将以上得到的片段连接到载体中去,图36所示意的是由此形成的连接产物中含有的和后续的操作直接相关的部分的序列结构,按图示的上游至下游的方向是一个原核启动子P(Goldstein MA et al,1995),一个限制性内切酶SbfI的位点,原来的载体和连接进去的片段的上游接头处的序列结构是5’-------CTGAAGCGGCCGCNNNNNNNNN-------3’显然,这段序列中含有一个AcuI位点和一个NotI位点,而这两个位点后面的9个被标记为N的碱基则是对应于图35及其相关的描述中所提及的随机引物的随机序列区;在这里所列出的接头处的序列结构的后面,是来自目标序列的序列结构,然后,在如图所示的连接产物的下游,则是来自原来的载体的序列结构,其中在合适的位置上,含有一个I-CeuI位点;在得到这个连接产物以后,紧接着的操作如下用AcuI对连接产物进行酶切,再用常规的手段、例如3’-5’核酸外切酶活性的温和作用,必要的时候,还可以同时借助5’-3’DNA聚合酶的作用,将AcuI酶切留下的末端修齐,在完成修齐任务后,则再对所得到的产物用SbfI酶切,而通过这里的操作,就可以将这里所提及的两个酶作用位点间的序列结构删除,同时为后续的一个外源序列的定向克隆创造条件按如图所示的上游至下游的方向,新克隆进来的外源序列的结构是上游端的一个和SbfI酶切后留下的末端相匹配的3’单链突出的粘性末端,在其后的一长方形小块指示的序列结构中,则含有一个NotI位点,而在该新的外源序列的下游端,则是如下序列结构5’----------CTGAAGCGGCCGC3’显然,这里的下游端的序列结构中含有一个AcuI位点和一个NotI位点;同时,如图所示,这个新的外源序列的下游端是一个齐头末端;而将新的外源序列连入以后,就形成如图所示的连接产物;图35的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;后续的操作步骤则在这里得到的连接产物的基础上进行如图37所示意,对以上得到的连接产物,先用AcuI进行酶切,然后利用酶切留下的末端在载体中连入一段图示的插入序列,该插入序列的序列结构是两端是分别含有两个3’单链突出的碱基的粘性末端,在图37的示意中则将之表示为以下的形式5’------------------------------------TH3’3’AD------------------------------------5’这里的末端可能的组合形式共有以下三种5’------------------------------------TA3’3’AT------------------------------------5’
或者5’------------------------------------TT3’3’AA------------------------------------5’或者5’------------------------------------TC3’3’AG------------------------------------5’对这里的将要连入的插入序列而言,除了末端的部分外,其它的序列结构则是完全相同的,在图37的示意中,这里的插入序列的锄末端外的序列结构是5’AGTCTTC------------(ORF1A)------------CTGAAGAAGAC3’这里的结构的上游端含有一个BbsI位点,在中间的位置上则含有一个在图30、图31及其相关的描述中提及的和筛选基因的表达相关的序列结构ORF1A,不妨假定这里的ORF1是含有一个合适的原核转译起始信号的Kanamycin抗性基因的阅读框架;由于在插入序列中设计了ORF1A的序列结构,这就为插入序列的定向克隆提供了条件;图37的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;后续的操作步骤则在这里得到的连接产物的基础上进行利用NotI对这里所得到的连接产物进行酶切,再将酶切得到的小的序列片段分离开去以后,留下的载体部分再经过自我连接而重新闭合;而后续的步骤则又在这里的自连得到的载体的基础上进行的如图38所示意,先利用AcuI对载体进行酶切,然后再利用常规的手段将酶切产生的末端修齐,在完成AcuI酶切和修齐的步骤之后,则再利用I-CeuI作进一步的酶切,而再将两个酶切点之间的序列分离之后,留下的载体部分就含有了如图所示的一个齐头末端和另一个I-CeuI作用后留下的末端,而新的插入序列就是利用这两个末端以定向的方式被连接进来;按如图所示意的方向,这里的新的插入序列的上游端的序列结构是5’GGAAGAGC--------3’,新的插入片段通过定向克隆的方式被连接进来,图38的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;这里得到的新的连接产物又构成了后续实验的基础先用BbsI对以上得到的连接产物进行酶切,然后利用DNA聚合酶将载体中BbsI留下的末端补齐,由此得到含有两个齐头末端的线性载体序列结构,然后再利用这两个齐头末端,将如图所示的新的含有和Hammerhead类的Ribozyme的催化活性相关的催化核心序列的序列的新的插入片段,按如图所示意的方向,这里所说的新的插入片段的序列结构是5’Ttcg tcctcacg(atgtcttc-ORF2 A---gaagacaa)gactcatcag3’这里所示意的序列结构可以被分为两个功能性的部分其一是5’端和3’端底部被横划线标注的序列,它们将在后续的步骤中,构成催化核心序列的组成部分;其二是括号以内的序列,在它的上游和下游分别含有一个BbsI位点,而在它的中间的位置上则含有一个在图30、图31及其相关的描述中提及的和筛选基因的表达相关的序列结构ORF2A,不妨假定这里的ORF2是含有一个合适的原核转译信号的Chloramphenicol抗性基因的阅读框架;由于在插入序列中设计了ORF2A的序列结构,这就为插入序列的定向克隆提供了条件;图38的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;后续的操作步骤则在这里得到的连接产物的基础上进行如图39所示意,先利用Sap I对以上得到的连接产物作酶切反应,在SapI酶的作用下得到的末端则通过合适的DNA聚合酶的作用补齐,在完成这里的酶切和补齐的步骤后,再利用NotI的作用对所得到的产物作酶切反应,由此将从这里所说的连接产物中释放出一个具有图39所示意的特征的序列片段,而这里的序列片段则被进一步克隆进一个在经过相应的处理后可以得到合适的末端的载体中去,而由此得到的连接产物则在后续的步骤经过BbsI的酶切作用后,再利用合适的DNA聚合酶的作用将BbsI作用后在载体上留下的末端补齐,最后再将载体自连,就得到如图所示的最终的产物,而根据具体研究目的的不同以及服务于不同研究目的的最终的载体的选择和设计的不同,就可以得到可以满足不同的研究需要的Hammerhead类的Ribozyme库,如图39所示意,A、B和C分别代表了具备不同特征的Hammerhead类的Ribozyme库A,依赖如图所示的上游的属于PolymeraseIII类型的启动子以及其它相应的序列结构(Paule MR et al 2000),可以在真核体系中表达产生具备Hammerhead类的Ribozyme特征的小分子;B,基本与A的情形类似,但是在与Hammerhead类的Ribozyme对应的基因序列的下游,融合有一个CTE结构(Warashina M et al 2001)或者A60结构(Suyama E et al,2003;Kawasaki H et al,2002),由此形成的杂交形式的Hammerhead类的Ribozyme,至少在接近靶序列方面较具优越性;C,在如图所示的T7启动子,当然也可以是同类的噬菌体来源的例如SP6或其它启动子的作用下,可以实现体外表达的目的;总之,通过对不同的最终的载体环境的选择,就可以制备具备不同的功能特征的Hammerhead类的Ribozyme库,并进而分别允许在不同的体系中表达产生具备Hammerhead类的Ribozyme特征的小分子;然而,需要指出的是,图39所列举的情形,并不意味着对其它的可能的选择的限制。
二,Hairpin类的Ribozyme库的构建假定本实验的目的是针对作为目标序列来源的某种细胞的mRNA的集合相对应的被克隆在某种质粒载体中的cDNA文库,完成Hairpin类的非随机Ribozyme库的构建;图40所示意,是一种比较常见的Hairpin类的Ribozyme分子及其作用底物的序列结构;如图所示的顶部的mRNA链中的序列结构,即5’----------NNNNNGUC NNNNNNNN---------3’,是被Ribozyme分子识别并作用的部分,而底部的则是一个Hairpin类的Ribozyme分子的结构;而在Ribozyme分子的作用下,就可以在如图所示的顶部的mRNA链中含有的识别序列中的G的5’一侧产生断裂并因而导致mRNA分子的断裂;一般情况下,Hairpin类的Ribozyme分子有多种可能的序列结构的形式,对于不同类型的Hairpin类的Ribozyme分子而言,其在序列结构上的主要的变化通常会落在两个区域一是落在如图所示的CATALYTIC CORE区域;另一个和图示的5’---------AGAANN----------3’的序列结构对应的区域;与不同类型的Hairpin类的Ribozyme分子相对应的底物中的识别序列的特征也可能有不同的变化,然而,就实验操作的角度,由于对具有不同的结构特征的Hairpin类的Ribozyme库的构建通常只涉及常规意义的分子生物学实验手段的变化,因此,这里将主要依据图40所示意的比较常见的Hairpin类的Ribozyme分子的序列结构的非随机Ribozyme库的构建过程进行说明,显然,这不应被视为是对本发明的任何意义的限制;图40所示意的Hairpin类的Ribozyme分子,当其与合适的底物序列结合后,将产生如图所示的通过Ribozyme分子和底物的序列结构之间的碱基配对形成的两个Helix结构,即图示的Helix1和Helix2;本发明在此后的描述中,也将直接将Ribozyme分子和底物中含有的与Helix1和Helix2对应的序列称为Helix1部分和Helix2部分;图示中将Hairpin类的Ribozyme分子中含有的催化核心(Catalytic core),即5’accag agaaacacacguugugguauauuac cuggu a 3’中含有的另外两个如图所示意的Helix结构,即Helix3和Helix4;就Hairpin类的非随机Ribozyme库的构建而言,通常需要对以下的相关的序列结构进行确定1,如图所示的CATALYTIC CORE的序列结构,在许多相关的研究报道中,这一部分的序列结构的改变,可以对相应的Hairpin类的Ribozyme的性质和效率产生影响;2,是以上已经提及的位于如图40所示意的Hairpin类的Ribozyme分子中的5’--------AGAANN--------3’的序列结构,根据相关的研究报道,这一部分的序列结构也可以有不同的变化,例如,在一些研究报道中,则可以将之变换成5’--------NGAAGY--------3’的形式;3,是如图所示的作为Hairpin类的Ribozyme的作用底物的位于mRNA分子中的被识别的序列结构中共性特征的变化,即图中所示意的以下序列结构的变化5’------------NNNGUC----------3’;在不同研究中,这一部分的序列结构也可以有较大的变化,与之相对应的,则是意味着可以作为不同的Hairpin类的Ribozyme分子的潜在的作用底物的序列有较多的可能(Perez-Ruiz M et al,1999),然而,无论是那种变化形式,以上的序列结构中含有的G是高度保守的(Pinard R et al,1999),有鉴于此,在本发明的相关的设计中,在所有已经报道的关于Hairpin类的Ribozyme分子的潜在作用的底物的共性特征的可能的选择之外,提供一个更为广谱的选择,即将以上的5’--------NNNGUC------3’变换为5’--------NNNGWN--------3’,显然,这种选择将可以把更多的潜在的底物包括进来;4,是如图所示的Helix1和Helix2的长度;图示中的Helix1的长度为4个碱基对,Helix2的长度为9个碱基对;通常情况下,在相关的研究中,Helix1的长度的变化较大,而Helix2的长度的变化较小;然而,在以下的描述中,为了简明起见,则对这里的Hairpin类的Ribozyme库的相关的设计具体为图40所示意的特征,但显然,这种为描述的简便而作的具体的选择,并不应被视做是对本发明的任何意义上的限制;在以上的说明及其相关的设定的基础上,这里就可以将非随机的Hairpin类的Ribozyme库的构建过程具体为以下的实施方案,不过,需要强调的是,以下的具体实施方案的步骤与图27及其相关的描述中提及的功能性步骤并没有对应的关系;以下是对这里的具体的实施方案的描述1,如图41所示意,利用位于载体中含有的cDNA序列的上游端含有的一个单一的NotI位点,并通过相应的NotI的作用,将载体切成线性的状态,而同时可以利用另一个保护性的限制性内切酶kpnI作酶切然后,再利用ExonucleaseIII等或者类似的核酸外切酶的作用,从图示的上游端对cDNA进行系列的降解,而在最后的步骤,则可以利用常规的手段,例如Mung Bean Nuclease的作用将以上经过降解后得到的末端修齐,然后再用SbfI酶切,再将由此所得的载体片段回收后,再进一步在此基础上,将一个经过适当的设计的适应子(Adaptor)按照如图所示的方式连接到如图所示的经过了不同程度的核酸外切酶降解的cDNA的上游末端,如图所示,该适应子(Adaptor)具备以下的序列结构的特征5’------GCGGCCGC--GGATCC---GGATGGATCC3’显然,这里的序列结构中按如图所示的上游至下游的顺序,依此含有以下几个限制性内切酶包括SRE类的限制性内切酶的位点上游-------NotI-----BamHI-----FokI BamHI下游;在图41的示意中,这里的适应子在如图所示的上游端的碱基被Biotin标记了;在完成如图所示的适应子的连接之后,所得到的产物则被经过了以下的处理将所得到的产物分成几个等份,并分别用AluI、BstUI、HarIII、HpyCH4V和RsaI酶切,由此得到的产物被用Streptavidin Magnetic Beads吸附回收,然后再将Beads的表面的DNA分子用NotI酶的作用释放下来,这些被释放下来的产物则成为后续实验的基础;2,如图42所示意,将1中所得到的产物以定向克隆的形式连接到一合适的经过相应的处理后含有相匹配的连接末端的载体中去,显然,这里所用的载体必须具备的一个条件是将允许所有的后续操作步骤的实施;图42所示意的是由此形成的连接产物中含有的和后续的操作直接相关的部分的序列结构,按图示的上游至下游的方向是一个原核启动子P,新插入的来自1的具有相同的上游端(其中含有和以上的适应子对应的序列结构)但不同的cDNA的插入片段,而在如图所示的连接产物的主要序列结构的下游,则是来自原来的载体的序列结构,其中在合适的位置上,含有一个I-CeuI位点;在得到这个连接产物以后,紧接着的操作如下用FokI对连接产物进行酶切,然后再利用酶切留下的末端将一个新的插入序列连接进来;如图所示意,这里所说的新的插入序列,两侧各含有一个5’突出的粘性末端,其性质是可以对如图所示的5’------N5N6 N7 N8------3’这几个位置上的碱基序列进行筛选,而最终能够成功地通过连接介导的筛选方式得到的亚群是在对应的位置上具备5’------NGTC-------3’序列结构特征的克隆;而新的插入序列的除了粘性末端之外的按如图所示的方向的序列结构的特征如下5’NNNNNCATCC-------(ORF1A)-----------------GGATGTGCAG3’显然,这里的序列结构里含有以下的SRE位点,即两个作用方向不同的FokI位点和一个BsgI位点;而和上文中提及的相关的情形类似的是,这里的ORF1A的序列结构,具备帮助筛选特定方向的插入的作用;图42的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;后续的操作步骤则在这里得到的连接产物的基础上进行
利用BanHI的酶切作用,将位于两个BamHI位点间的小的序列片段删除,然后再使载体作自身连接反应,由此形成的自连产物将被用作后续实验的基础;3,如图43所示意,对以上通过2最后得到的连接产物,先用BsgI进行酶切,然后在通过一些常规的分子生物学手段,将BsgI酶切留下的两个处于3’单链突出状态的碱基删除,接着再利用I-CeuI进行酶切反应,这样,就在载体上形成了两个末端,其中一个是齐头末端,另一个是I-CeuI酶切后留下的粘性末端,这两个末端的形成则为如图所示意的一个适应子的连入创造了条件;按图43的示意的该适应子的序列结构是上游含有一个齐头末端,下游含有一个3’突出的5’CTAA3’末端,而除了末端之外的该适应子的其它部分的序列结构的特征是按如图所示意的方向为5’GGAAGAGC--------3’;显然,在如图所示意的方向的适应子的上游端,含有一个SapI位点;在这个连接反应中得到的阳性克隆,将被用做后续的操作的基础先用FokI酶切,然后再用Klenow将FokI酶切留下的末端补齐,然后将反应体系中的载体部分纯化出来,再将一个外源序列连接进去;如图所示意的该外源序列的序列结构的特征是含有两个齐头末端,按如图所示意的方向的序列结构的组成为5’TT AAGTCTTC---------(ORF2 A A ORF1)-----------GAAGACGG CT 3’显然,这里所示意的序列结构中,含有两个酶切方向相反的BbsI位点,而这里的ORF2A结构,则为阳性克隆的筛选提供了方便,但这里的ORF1A结构,则是为后续步骤中的实验服务的;无疑,这里得到的阳性克隆就构成了进一步实验的基础;5,利用限制性内切酶NotI和BamHI对3中所得到的产物进行反应,这样就在载体上形成两个末端,即图示的NotI酶切留下的末端和BamHI酶切留下的末端,而一个新的外源序列就利用这两个末端被连接进来;这里的新的外源序列的序列结构的特征,除了如图所示意的两个末端的位置上的单链突出的部分外,还含有如下的序列结构5’GC----(ORF1A)----GGATG AACGG 3’;显然,在这里所示的序列结构的下游含有一个FokI位点,这里的ORF1A的作用是可以进一步帮助对阳性克隆作筛选;图44的示意中,垂直的双向箭头所指示的,是所得到的同一连接产物的不同的图示方式;这里得到的新的连接产物又构成了后续实验的基础利用FokI和SapI对以上的连接反应中得到的产物进行酶切,然后再用Klenow将酶切形成的末端补齐,接着再将反应体系从FokI酶的作用位点至SapI酶的作用位点之间的序列片段回收并用于紧接着的连接反应,即将这里得到的片段连入一个合适的载体,在图44的示意中,则是将该片段连入具备以下特征的载体按如图所示意的方向,是上游的原核启动子,用于调控如图所示意的ORF1A的表达,POLIII类的启动子,作为一种选择,可以使用tRNA基因的启动子等,用于调控Ribozyme的表达,被连接进来的片段,属于Hairpin类的Ribozyme的催化核心相关的序列、即图中所示意的HP Rz CORE部分,图示中位于下游的与POLIII启动子相匹配的转录终止信号;而这里的Hairpin类的非随机Ribozyme库的最后成型,则仅需要如图所示的最后一步的操作,即利用BbsI作酶切,接着利用Klenow将酶切后形成的末端补齐,最后再使载体作自身连接反应,这样,就得到了本项实验所需要的Hairpin类的Ribozyme库而和以上Hammerhead类的Ribozyme库的情形相似,可以通过最终的不同的载体的选择,来建立满足不同研究的需要的Hairpin类的Ribozyme库;以上通过对两类在实验室中得到较多注意的非随机Ribozyme库的构建过程的具体描述,对本发明所提供的原理和方法作了进一步的说明,而正如本发明在前面的描述中多次强调的那样,利用本发明提供的原理和方法,可以完成各种不同的类型的非随机Ribozyme库的构建,以及不同类型的非随机DNAzyme库的构建,而更进一步,作为一种潜在的变化,利用本发明提供的原理和方法,还可以完成半随机的Ribozyme库或者DNAzyme库的构建,这里所说的半随机的Ribozyme库或者半随机的DNAzyme库的含义是其所包含的与相应的Ribozyme分子或者DNAzyme分子中所含有的通过碱基配对的原理对底物进行识别的序列相对应的序列结构,或者简称为与相应的Ribozyme分子或者DNAzyme分子中含有的底物识别序列相对应的序列结构,其中的一部分是由随机序列构成的;然而,由于所有这些非随机的、或者半随机的库的构建,通常只需要将本发明提供的原理和方法作常规的分子生物学意义的变动,因此,为描述的简明,这里将不再对它们一一描述,但显然,这并不能被视为是对本发明的任何意义上的限制虽然以上对本发明的原理和方法的描述和具体运用形式的说明,多数多是针对一个含有多种不同的潜在的目标序列分子组成的集合(pool)来说明的,但是,作为一种潜在的选择,本发明则可以被用于对单一的或者少数几个潜在的目标序列分子的含有不同可以被Ribozyme分子或者DNAzyme分子所作用的区域的分析、例如对与某种mRNA分子对应的Ribozyme分子的最佳识别位点的实验选择,等等;如前所述及,通过对不同的外周序列环境的选择,例如通过对不同的载体体系的设计和选择,就可以将在本发明提供的原理和方法的基础上建立的Ribozyme库或者DNAzyme库运用于细胞内或者细胞内的不同的实验体系,而就本发明的实现而言,这些外周序列环境的选择,通常也只涉及常规的分子生物学的设计的变化,例如,作为一种选择,可以用不同的病毒载体作为这里所提及的不同的Ribozyme库或者DNAzyme库的载体,或者利用不同的可在真核细胞染色体上或者染色体外存在的载体作为Ribozyme库或者DNAzyme库的载体;对于所有这些在常规的意义上可能的变化,这里也不再对所有潜在的变化和设计形式一一描述,同样,这也不应被视做是对本发明的任何意义的限制,但显然,本发明的内容,将覆盖所有利用本发明所提供的原理和方法所建立的Ribozyme库或者DNAzyme库、以及运用这些库的所有载体或者实验体系。
参考文献Boon K,et al An anatomy of normal and malignant gene expression PNAS,2002,vol.99,No.1711287-11292Breaker RR,Emilsson GM,Lazarev D,Nakamura S,Puskarz IJ,Roth A,Sudarsan N.A commonspeed limit for RNA-cleaving ribozymes and deoxyribozymes.RNA.2003 Aug;9(8)949-57.Goldstein MA,Doi RH.Prokaryotic promoters in biotechnology.Biotechnol Annu Rev.1995;1105-28.
Kawasaki H,Taira K.Identification of genes by hybrid ribozymes that couple cleavage activitywith the unwinding activity of an endogenous RNA helicase.EMBO Rep.2002May;3(5)443-50.Epub2002 Apr 18.
Liang P,SAGE GenieA suite with panoramic view of gene expression PNAS,2002,vol.99,No.1811547-11548Medina MF,Joshi S.RNA-polymerase III-driven expression cassettes in human gene therapy.Curr Opin Mol Ther.1999 Oct;1(5)580-94.
Paule MR,White RJ.Survey and summarytranscription by RNA polymerases I and III.NucleicAcids Res.2000 Mar 15;28(6)1283-98.
Perez-Ruiz M,Barroso-DelJesus A,Berzal-Herranz A.Specificity of the hairpin ribozyme.Sequence requirements surrounding the cleavage site.J Biol Chem.1999 Oct 8;274(41)29376-80Pinard R,Lambert D,Walter NG,Heckman JE,Major F,Burke JM.Structural basis for theguanosine requirement of the hairpin ribozyme.Biochemistry.1999 Dec 7;38(49)16035-9.
Rhoades K,Wong-Staal F.Inverse Genomics as a powerful tool to identify novel targets forthe treatment of neurodegenerative diseases.Mech Ageing Dev.2003 Jan124(1)125-32.
Roberts RJ et al SURVEY AND SUMMARYA nomenclature for restriction enzymes,DNAmethyltransferases,homing endonucleases and their genes Nucleic Acids Res.2003 April 131(7)1805-1812Roeder T.Solid-phase cDNA library construction,a versatile approach.Nucleic Acids Res.1998 Jul 15;26(14)3451-2.
Saha S et al,Using the transcriptome to annotate the genome Nature Biotechnology May 2002Volume 20 Number 5pp 508-512Sun LQ,Cairns MJ,Saravolac EG,Baker A,Gerlach WL.Catalytic nucleic acidsfrom lab toapplications.Pharmacol Rev.2000 Sep;52(3)325-47.
Suyama E,Kawasaki H,Nakajima M,Taira K.Identification of genes involved in cell invasionby using a library of randomized hybrid ribozymes.Proc Natl Acad Sci U S A.2003 May13;100(10)5516-21.Epub 2003 Apr 28.
Takagi Y,Warashina M,Stec WJ,Yoshinari K,Taira K.Recent advances in the elucidation ofthe mechanisms of action of ribozymes.Nucleic Acids Res.2001 May 1;29(9)1815-34.
Willmar D.Patino,Omar Y.Mian,Paul M.Hwang Serial Analysis of Gene Expression TechnicalConsiderations and Applications to Cardiovascular Biology Circulation Research.2002;91565Warashina M,Kuwabara T,Kato Y,Sano M,Taira K.RNA-protein hybrid ribozymes thatefficiently cleave any mRNA independently of the structure of the target RNA.Proc Natl AcadSci U S A.2001 May 8;98(10)5572-7.
Powell J.Enhanced concatemer cloning-a modification to the SAGE(Serial Analysis of GeneExpression)technique.Nucleic Acids Res.1998 Jul 15;26(14)3445-6.
图1利用外源序列的插入对目标序列的特定区域的序列结构进行修饰的原理的示意;图2非随机Ribozyme库的构建所需要的功能性步骤的简要说明;图3属于Hammerhead类非随机Ribozyme库的构建所需要的功能性步骤的简要说明;图4属于Hairpin类的非随机Ribozyme库的构建所需要的功能性步骤的简要说明;图5建立本发明所定义的核酸分子库的实验步骤;图6与本发明所定义的核酸分子库相关的实验操作过程;图7利用至少一种SRE酶来确保在来自目标序列的序列片段的中间所引入的外源序列的方法;图8至图10确定在来自目标序列的序列片段中的某个位置上引入的外源序列的不同方法;图11至图12至少依赖一个SRE酶来对外源序列的插入点所在位置的碱基组成做选择;图13至图15至少利用一个SRE酶对所说的外源序列的插入点附近的来自目标序列的碱基做修饰;图16至图17至少利用一个SRE酶对所引入的外源序列进行修饰;图18将外源序列引入目标序列的几种可能的途径的示意;图19利用外源序列在目标序列中的跳跃,最后目标序列的任意序列两个位点的两侧形成插入;图20利用已经引入目标序列的外源序列中含有的SRE位点,在目标序列中形成新的插入;
图21将引入目标序列中的外源序列删除的几种途经;图22将引入目标序列中的外源序列删除的几种替代性的途径;图23将引入目标序列中的外源序列删除的另一种途径;图24利用较少的SRE位点实现外源序列在目标序列中的连续插入;图25利用外源序列在mRNA来源的目标序列中的插入,并从中截取一定长度的序列片段并将之用于序列分析;图26利用外源序列的插入,在双链DNA含有的任意特定的限制性内切酶位点所在位置,截取一定长度的序列片段;图27非随机的Ribozyme库和非随机的DNAzyme库的构建所需要的功能性步骤的示意;图28对目标序列来源的序列片段的引物介导的选择的方法的示意;图29对目标序列来源的序列片段的连接介导的选择的方法的示意;图30利用对完整的转录单位的不同组成的拆解形成的定向克隆的方法的示意;图31对外源序列中含有的和筛选基因的表达相关的序列进行删除的方法的示意;图32对pDonor载体的构成和作用的简要示意;图33对经修饰的序列片段最终被克隆到含有合适的序列环境的pAcceptor载体的过程的简要示意;图34一种属于Hammerhead类的Ribozyme分子的结构图;图35至图39对属于Hammerhead类的非随机的Ribozyme库的构建过程的具体说明;图40一种属于Hairpin类的Ribozyme分子的结构图;图41至图44对属于Hairpin类的非随机的Ribozyme库的构建过程的具体说明;图45至图47利用外源序列在目标序列中的插入从来源于mRNA的目标序列的特定位置截取特定的长度的序列片段并将之用于序列分析的一个具体实验的示意;图48至图52对一个属于Hairpin类的非随机Ribozyme库的构建的实验的示意。
具体实施例方式以下是两个实施例,然而,需要强调的是,以下的实施例,只是对本发明的进一步的说明,而不应被视做到是对本发明的任何意义上的限制。
实施例一从Hela细胞的mRNA分子中,截取位于最3’端的限制性内切酶Nla III位点及其下游的长度为23bp的序列片段,并通过后续的手段,将被截取出来的片段用于SAGE分析。
以下是具体的操作过程如图45所示,是利用Hela细胞中的mRNA为模板,合成单链cDNA,再将单链cDNA转换成双链cDNA,然后再在双链cDNA的基础上,进行酶切、adaptor的连接以及后续的酶切等处理;具体的实验条件则参照已有的工作(Roeder T.1998),这里简要叙述如下第一条cDNA链的合成;其具体的方法是用DNA合成仪,合成一条DNA寡聚链,其序列结构为SEQ ID NO15’biotin-GTAGACAATCGGTCGACGCCGGCGTTTTTTTTTTTTTTTTV 3’(SEQ ID NO1)该DNA寡聚链被吸附到Streptavidin Magnetic Beads即Streptavidin-Dynabeads的表面,接着,用reversetranscriptase合成第一条cDNA链,在利用E.coli DNA polymerase合成第二条cDNA链,再分别用FokI、BsgI、NlaIII对所得到的双链DNA作酶切,酶切后,将依然吸附于Streptavidin-Dynabeads表面的产物纯化,这时的纯化产物则是一端固定在Streptavidin-Dynabeads的表面,另一端处于游离状态,接着,则将一个adaptor连接在这里的纯化的产物的游离端,这里的adaptor是由以下两条人工合成的DNA寡聚链组成,它们的序列结构是SEQ ID NO25’gaatc acgct cttta attaa gaga cggat gcatg 3’(SEQ ID NO2)以及SEQ ID NO35’phosphorylated-catcc gtctc ttaat taaag agcgt gattc 3’(SEQ ID NO3)由这两条人工合成的DNA寡聚链通过互补配对的原理形成的adaptor被用于图中所示意的连接反应,连接反应完成后,则再次纯化吸附于Streptavidin-Dynabeads表面的连接产物,接着,用限制性内切酶NotI对纯化所得到的产物进行作用,又一次将吸附于Streptavidin-Dynabeads表面的酶切产物纯化,然后,再将这里的纯化得到的产物用限制性内切酶NotI进行处理,从而将被吸附的来自双链cDNA的位于3’端的片段释放出来,再对这里释放出来的片段利用常规的手段作去磷酸化处理(在这里以及后续的描述中,对常规的操作将不作详细的说明,由于有关的常规操作均是参照Molecular Cloning手册Molecular CloningA Laboratory Manual(3-Volume Set)(Author(s)Joseph Sambrook,David W.Russell,Joe Sambrook,Release Date5 January,2001,ManufacturerCold Spring Harbor Laboratory)进行的,所以,这里将不再对相关的常规性的操作作重复性的介绍),再将去磷酸化处理得到的产物回收后,用于后续的连接反应;2,如图46所示意,将以上的经过去磷酸化处理的片段,用于一个连接反应;这里的pM1的序列结构是SEQ ID NO4在该载体序列中所含有的三个连续的NNN,为引入的随机突变,在突变后只是选择出了所有具备氨变青霉素抗性的克隆,本实验则是利用所有阳性克隆中含有的质粒的集合(pool)。
在如图46所示意的结构示意图中,可见pM1中含有一个原核启动子,即图示中标注的P,在该原核启动子的下游,有两个限制性内切酶位点,即PacI和NotI;这里用PacI和NotI对pM1做酶切反应,所得到的载体部分经回收后则用于图示中的连接反应将以上得到的经去磷酸化处理的片段,连入经这里的酶切反应后得到的载体;这个连接反应中得到的所有的阳性克隆中含有的质粒载体,将被用于以下的操作利用FokI进行酶切反应,然后利用大片段酶即Klenow酶将酶切产生的末端补齐,接着再利用被补齐的末端连入一个具外源序列特征的插入序列,即图示意中提及的插入序列1;插入序列是由另一个载体pD-Kana-R1提供的,该载体的序列结构是该载体先经过SapI酶的作用,由此产生的末端则利用大片段酶即Klenow补齐,随后再利用PvuII进行酶切,经过这样的处理后,就可以从载体上释放出含有Kan-RA结构的长约1.16kb的片段,即图46的示意所说的插入序列1;这里的连接反应中所得到的所有具备kanamycin抗性的克隆,将被用于后续的操作;3,在图46的示意中及其以上2中得到的所有具备Kanamycin抗性的克隆,其中所含有的质粒被提取出来用于图47所示意的操作利用BsgI对质粒作酶切,然后再利用Mung Bean Nuctease的作用将酶切得到的末端修齐,将所得到的产物纯化后,再利用SapI进行酶切,由此留下的末端则利用大片段酶补齐;在经过这些处理后,则使所得到的线性质粒作自连反应,然后再利用FokI对由这里的自连反应得到的产物做酶切,将位于两个FokI位点间的部分分离出去后,再使留下的载体部分做自连,在经过这样的操作后,如图所示,则就得到这样的载体,其中含有来自于目标序列的包括一个NlaIII位点的序列在内的长度为23个碱基的片段;以上自连得到的产物中含有的来源于目标序列的长度为23bp的序列片段,被通过PCR反应扩增出来;这里的PCR反应所用的引物是引物15’biotin-atcag cgtag taccc atcta tccat ctagg ctatt gacc 3’(SEQ ID NO6)引物25’biotin-atatc gtcag gacaa gctta cgcgt cacta gtact gctc 3’(SEQ ID NO7)这里的PCR反应的温度循环条件是95℃ 1分钟,67.5℃ 1分钟,72℃ 1分钟;反应共进行25个循环;在获得PCR产物后,后续的操作则是参考被报道的方法进行的(Powell J.,1998),这里对后续的步骤做简要的描述利用Nla III对经过纯化的PCR产物做酶切反应,然后利用Streptavidin Magnetic Beads吸附所有含有以上引物1和引物2的片段,未被吸附的片段则被进一步用乙醇沉淀回收后,再将所得到的片段用于连接反应;将连接所得到的产物用浓度为2%的Agarose胶进行回收,所有大致位于500bp至1000bp的片段被回收回来,并连接进pZer0-1载体进行测序;最后的测序结果则显示被截取的序列片段的长度有时不是严格的23bp,即在测序中发现少量长度为21bp和22bp的序列片段,这些小于23bp的片段的出现,显然是由于Mung Bean Nuclease过度作用的结果,不过,由于如图47所示意,对PCR产物做酶切后得到的序列片段,在其下游都含有一个序列标记,即5’----GTCTACATG-----3’,因此,较短的序列片段的出现,并未影响对测序结果的分析。
实施例二针对以Hela细胞中提取的mRNA为基础构建的位于质粒载体中的cDNA文库,建立具备以下特征的属于Hairpin类的Ribozyme库如图48所示,是Ribozyme分子的结构特征及作为Ribozyme的作用底物的mRNA中含有的序列片段的特征;以下是具体的实验操作过程如图49的示意中,其顶部的质粒载体是这里所说的cDNA文库的基本框架图,其具体的序列结构是背景载体(SEQ ID NO6),2369bp,5’→3’在该cDNA文库的构建过程中,cDNA分子是以定向克隆的方式连接进载体的NotI位点和EcoRV位点之间,这就为后续步骤的完成提供了条件,在图49的示意中,则是将对应于mRNA的5’端的序列置于图示的上游,同时将对应于mRNA的3’端的序列至于图示的下游,以这里的来源于Hela细胞的mRNA的cDNA文库为基础建立属于hairpin类的非随机ribozyme库的操作过程如下1,如图49所示意,分别用BseRI、BsgI、FokI、BbsI、NotI和KpnI进行酶切,然后,利用常规的ExonucleaseIII和Mung bean nuclease的综合运用对底物进行处理,由此得到系列的删除产物,即将图示中的cDNA从5’端开始逐步删除,这样的删除产物即相当于,将cDNA文库中含有的不同的cDNA从中间任意的位置截断;通过这里的处理,即在载体上形成了两个末端一是在ExonucleaseIII的作用后,再通过Mung bean nuclease的作用留下的齐头末端;另一个是KpnI酶切后形成的末端;将这里得到的含有一个齐头末端和一个KpnI酶切留下的末端的线性状态的质粒做进一步的处理,即如图所示的利用SbfI进行酶切处理,由此得到的线性载体中的KpnI酶切留下的末端则被SbfI酶切后留下的末端代替,而另一端的齐头末端则没有发生变化;将SbfI酶切后得到的线性质粒分离纯化后,再使之与一个人工合成的适应子即Adaptor相连;这里的adaptor是由以下两个寡聚DNA链通过碱基配对的原则结合组成的
5’GGAGG TCTAC TGGAG AGCTC GCGGC CGCGA GGAGC TC 3’(SEQ ID NO7)5’GAGCT CCTCG CGGCC GCGAG CTCTC CAGTA GACCT CCTGC A 3’(SEQ ID NO8)这是一个定向的连接反应,而在该连接反应中得到的所有的阳性克隆中含有的以质粒形式存在的连接产物则被用于后续的步骤;2,如图50所示意,利用BseRI的作用对以上1中得到的连接产物进行酶切;在图示中则是将紧接在新连接进来的Adaptor后面的属于cDNA来源的序列标记为N1、N2、N3、N4、----等等,这样,BseRI的酶切作用,就在载体上留下两个3’突出的末端,其中一个是5’-----N6 N7 3’单链突出,而另一个自然是与之互补的序列的单链突出;显然,N6N7的所有的可能的序列组合共有16种,而本实验中则是将N6N7为GW的亚群选择了出来;如图所示意,GW的所有可能的组合只有两种,即GA和GT;实验中是将特定的插入序列连接进了这里的BseRI酶切后留下的末端;这里所使用的插入序列的来源是以下的载体、即pD-Kana-R2(SEQ ID NO9)事实上,在本实验中应用的载体有两个,一个是在W的位置上是A的载体,另一个是在W的位置上是T的载体,不过,具体的实验中,这两个载体是被混合在一起使用的;在具体的实验中,则是利用BseRI的酶切作用将这里的插入序列释放了出来,然后则如图50所示意,将被释放出来的序列片段用于连接反应;插入序列中的Kana-RA的存在,为阳性克隆的选择提供了方便;这里的连接反应所得到的产物则被用于后续的步骤;3,如图51所示,将2中得到的整合有插入序列的连接产物做如下的处理用BsgI酶切,然后用Mungbean nuclease将BsgI酶切后留下的末端修齐,接着再用I-CeuI进行酶切,经过如此处理的载体经回收后则用于一个连接反应,即将另一个Adaptor连入;该Adaptor是由以下两个人工合成寡聚DNA链通过碱基配对的原理组成的5’GAAG AGCGT CTGAT CGTCC TAA 3’(SEQ ID NO10)5’GAC GATCA GACGC TCTTC 3’(SEQ ID NO11)在将这里的adaptor连进载体之后,则是将所得到的连接产物做了如下的处理FokI酶切,然后用大片段酶即Klenow将FokI酶切留下的末端补齐,然后则将另一个插入序列连接进去;该插入序列是由以下的载体pD-Cm-R(SEQ ID NO12)中得到的这里来自以上载体的插入序列被通过SapI的作用释放出来,SapI酶切留下的末端则是利用大片段酶即Klenow补齐,由此得到的含有ORF2 A,这里的ORF2是Cm-R,即chloramphenicol抗性基因的表达框架;如图51所示,将该插入片段连入载体,同时利用ORF2所编码的Chloramphenicol抗性基因作为筛选标记,则就得到了新的含有定向连接的插入序列的阳性克隆,而所有这些阳性克隆中所含有的质粒,则被用于后续的操作;4,如图52所示意,将3中最后得到的连接产物、即阳性克隆中的质粒,作如下的处理先用SapI进行酶切,然后将酶切产生的末端用Klenow补齐;接着再用BsgI酶切,由此将含有如图所示的来自目标序列的序列片段的片段释放出来,再用常规的分离手段回收后,则将之连入最后的表达载体,这里所说的最后的表达载体ptRNA-val-LIB(SEQ ID NO13)的序列结构是为这里的连接反应的需要,实验中对其做了如下的处理利用SapI做酶切,然后用Klenow将酶切产生的末端补齐,接着再用BseRI做酶切,这样得到的线性载体就含有以下的两个末端,即一个齐头末端,另一个则是BseRI酶切后留下的含有如图所示的3’单链突出的末端;如图52所示,将这里的序列片段和载体按定向的方式连接起来,就得到了一个新的载体;而本实验的最后一步,则是利用BbsI对新的载体进行酶切,再利用Klenow将BbsI酶切留下的末端补齐,接着在利用常规的手段将载体部分回收后,使线性载体通过自连环化,由此得到的所有的阳性克隆中含有的质粒载体则就构成了本实验所要建立的属于Hairpi类型的非随机Ribozyme库。为鉴定所建立的库的质量,本实验还随机选择二十个阳性克隆,并对从中提取的质粒从两个方向进行测序,这里所使用的两个测序引物的序列结构是
5’CCGTA GTGTA GTGGT TATCA CGTTC GC 3’(SEQ ID NO14);5’CAGGA AACAG CTATG ACCAT GATTA CGCC 3’(SEQ ID NO15);对以上随机选择的20个克隆的测序的结果表明,所有克隆中含有的质粒,都被证明具备预期结果的与属于Hairpin类的Ribozyme分子对应的序列结构,但是,其中有四个克隆含有的质粒中,其和属于Hairpin类的Ribozyme分子对应的序列结构中HelixI相关的序列结构,不是预期的10个碱基,而是9个碱基,然而,由于属于Hairpin类的Ribozyme分子,其对HelixI的长度并没有非常严格的限制,因此,这个结果并不影响库的质量和使用。
序列表<160>15<210>1<211>41<212>DNA<213>人工序列<220>
<223>
<400>1gtagacaatc ggtcgacgcc ggcgtttttt tttttttttt v 41<210>2<211>34<212>DNA<213>人工序列<220>
<223>
<400>2gaatcacgct ctttaattaa gagacggatg catg 34<210>3<211>30<212>DNA<213>人工序列<220>
<223>
<400>3catccgtctc ttaattaaag agcgtgattc 30<210>4<211>2415
<212>DNA<213>人工序列<220>
<221>misc_feature<222>(1233,1234,1235)<223>n=a或t或c或g<400>4atcagcgtag tacccatcta tccatctagg ctattgaccg gatcctagta agccacgttg60tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatcc tgaacaataa120aactgtctgc ttacataaac agttaattaa agcgtcagtc agtggcagtg gcagtctgcg180gccgcatagt agactgaccc agtcagttac cggctcttca gtctacatgg agcagtacta240gtgacgcgta agcttgtcct gacgatatgc ctggcggcag tagcgcggtg gtcccacctg300accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc360atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg420gccttgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt480caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac540attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa600aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat660tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc720agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga780gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg840cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc900agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacagat ggcatgacag960taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc1020tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg1080taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg1140acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac1200ttactctagc ttcccggcaa caattaatag acnnnatgga ggcggataaa gttgcaggac1260cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg1320agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg1380tagttatcta cacgacgggg agtcaggcaa ctatggacga acgaaataga cagatcgctg1440agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac1500tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg1560ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg1620tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc1680aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc1740tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt1800agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc1860
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 1920caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 1980agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2040aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2100gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2160tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2220gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2280ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2340ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2400aggaagcgga agatt 2415<210>5<211>4264<212>DNA<213>人工序列<220>
<223>
<400>5ctggccacgg gtgcgcatga tcgtgctcct gtcgttgagg acccggctag gctggcgggg 60ttgccttact ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg 120ctgcaaaacg tctgcgacct gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta 180aagtctggaa acgcggaagt cagcgccctg caccattatg ttccggatct atgtcgggtg 240cggagaaaga ggtaatgaaa tggcagatcc aacatgtgag caaaaggcca gcaaaaggcc 300aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 360catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 420caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 480ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 540aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 600gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 660cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 720ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 780tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 840tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 900cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 960tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 1020tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1080tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1140cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1200
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta1260tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc1320gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat1380agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt1440atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg1500tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca1560gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta1620agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg1680cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact1740ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg1800ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt1860actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga1920ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc1980atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa2040caaatagggg atctatgtcg ggtgcggaga aagaggtaat gaaatggcat ccggatctgc2100atcgcaggat gctgctggct accctgtgga acacctacat ctgtattaac gaagcgctgg2160cattgaccct gagtgatttt tctctggtcc cgccgcatcc ataccgccag ttgtttaccc2220tcacaacgtt ccagtaaccg ggcatgttca tcatcagtaa cccgtatcgt gagcatcctc2280tctcgtttca tcggtatcat tacccccatg aacagaaatc ccccttacac ggaggcatca2340gtgaccaaac aggaaaaaac cgcccttaac atggcccgct ttatcagaag ccagacatta2400acgcttctgg agaaactcaa cgagctggac gcggatgaac aggcagagct cttactgtca2460tgccatccgt atgtgggcgg acaataaagt cttaaactga acaaaataga tctaaactat2520gacaataaag tcttaaacta gacagaatag ttgtaaactg aaatcagtcc agttatgctg2580tgaaaaagca tactggactt ttgttatggc taaagcaaac tcttcatttt ctgaagtgca2640aattgcccgt cgtattaaag aggggcgtgg ggtcgacgcg gccgctaact ataacggtcc2700taaggtagcg agtttaaacg ctcttcactg cactaacatc cgatatcgga tccggccgcc2760gctgaggtct gcctcgtgaa gaaggtgttg ctgactcata ccaggcctga atcgccccat2820tatccagcca gaaagtgagg gagccacggt tgatgagagc tttgttgtag gtggaccagt2880tggtgatttt gaacttttgc tttgccacgg aacggtctgc gttgtcggga agatgcgtga2940tctgatcctt caactcagca aaagttcgat ttattcaaca aagccgccgt cccgtcaagt3000cagcgtaatg ctctgccagt gttacaacca attaaccaat tctgattaga aaaactcatc3060gagcatcaaa tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa3120aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc3180ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc3240gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa3300tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc3360atcaaaatca ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg3420aaatacgcga tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag3480gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg3540gaatgctgtt ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat3600
aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc 3660atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc 3720gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca 3780tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg agcaagacgt 3840ttcccgttga atatggctca tatgttattc ctccttattt aatcgataca ttattaatac 3900cctccagctg aacacccctt gtattactgt ttatgtaagc agacagtttt attgttcatg 3960atgatatatt tttatcttgt gcaatgtaac atcagagatt ttgagacaca acgtggctta 4020ctaggatccg atatcattta aatctaggga taacagggta atactagtgt cgaccaacca 4080gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga 4140cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca 4200tttccacccc tcccagttcc caactatttt gtccgcccac accgtaagat gcttttctgt 4260gact 4264<210>6<211>2369<212>DNA<213>人工序列<220>
<221>misc_feature<222>(1187,1188,1189)<223>n=a或t或c或g<400>6ggatcctagt aagccacgtt gtgtctcaaa atctctgatg ttacattgca caagataaaa 60atatatcatc atgaacaata aaactgtctg cttacataaa cagcctgcag ggtcaggtca 120ggtcagcgat cgttactcta agtagcggta ccgcggccgc gatatcgttt aaacatatca 180gtacgtagtc atgtcataac tataacggtc ctaaggtagc gagcctggcg gcagtagcgc 240ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 300tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 360agtcgaaaga ctgggccttg tgatacgcct atttttatag gttaatgtca tgataataat 420ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 480atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 540tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 600cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 660agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 720taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 780tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 840catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 900
agatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc960ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa1020catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc1080aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt1140aactggcgaa ctacttactc tagcttcccg gcaacaatta atagacnnna tggaggcgga1200taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa1260atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa1320gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg acgaacgaaa1380tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt1440ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt1500gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg1560agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt1620aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca1680agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac1740tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac1800atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct1860taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg1920gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca1980gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt2040aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta2100tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc2160gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc2220cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa2280ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag2340cgagtcagtg agcgaggaag cggaagatt 2369<210>7<211>37<212>DNA<213>人工序列<220>
<223>
<400>7ggaggtctac tggagagctc gcggccgcga ggagctc 37<210>8<211>41<212>DNA
<213>人工序列<220>
<223>
<400>8gagctcctcg cggccgcgag ctctccagta gacctcctgc a41<210>9<211>4390<212>DNA<213>人工序列<220>
<223>
<400>9ggtaccctgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct60ccagcagccg cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga120tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga180atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct240gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt300cagcgccctg caccattatg ttccggatct atgtcgggtg cggagaaaga ggtaatgaaa360tggcagatcc aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc420gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc480aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag540ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct600cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta660ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc720cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc780agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt840gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct900gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc960tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca1020agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta1080agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa1140atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg1200cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg1260actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc1320
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc1380cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa1440ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc1500cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg1560ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc1620cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat1680ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg1740tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc1800ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg1860aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat1920gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg1980gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg2040ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct2100catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg atctatgtcg2160ggtgcggaga aagaggtaat gaaatggcat ccggatctgc atcgcaggat gctgctggct2220accctgtgga acacctacat ctgtattaac gaagcgctgg cattgaccct gagtgatttt2280tctctggtcc cgccgcatcc ataccgccag ttgtttaccc tcacaacgtt ccagtaaccg2340ggcatgttca tcatcagtaa cccgtatcgt gagcatcctc tctcgtttca tcggtatcat2400tacccccatg aacagaaatc ccccttacac ggaggcatca gtgaccaaac aggaaaaaac2460cgcccttaac atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa2520cgagctggac gcggatgaac aggcagagct cttactgtca tgccatccgt atgtgggcgg2580acaataaagt cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta2640gacagaatag ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt2700ttgttatggc taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag2760aggggcgtgg ggtcgacgcg gccgctaact ataacggtcc taaggtagcg agtttaaacg2820aggagtcgcg actwcctgca ccatccgata tcggatccgg ccgccgctga ggtctgcctc2880gtgaagaagg tgttgctgac tcataccagg cctgaatcgc cccattatcc agccagaaag2940tgagggagcc acggttgatg agagctttgt tgtaggtgga ccagttggtg attttgaact3000tttgctttgc cacggaacgg tctgcgttgt cgggaagatg cgtgatctga tccttcaact3060cagcaaaagt tcgatttatt caacaaagcc gccgtcccgt caagtcagcg taatgctctg3120ccagtgttac aaccaattaa ccaattctga ttagaaaaac tcatcgagca tcaaatgaaa3180ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa3240tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc3300gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt3360atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg3420catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc3480atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct3540gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc3600atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc3660ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt3720
cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt 3780ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa 3840tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa 3900atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg 3960gctcatatgt tattcctcct tatttaatcg atacattatt aataccctcg gatgtctagt 4020wcgtactact ctcctcaaca ccccttgtat tactgtttat gtaagcagac agttttattg 4080ttcatgatga tatattttta tcttgtgcaa tgtaacatca gagattttga gacacaacgt 4140ggcttactag gatccgatat catttaaatc tagggataac agggtaatac tagtgtcgac 4200caaccagata agtgaaatct agttccaaac tattttgtca tttttaattt tcgtattagc 4260ttacgacgct acacccagtt cccatctatt ttgtcactct tccctaaata atccttaaaa 4320actccatttc cacccctccc agttcccaac tattttgtcc gcccacaccg taagatgctt 4380ttctgtgact 4390<210>10<211>22<212>DNA<213>人工序列<220>
<223>
<400>10gaagagcgtc tgatcgtcct aa 22<210>11<211>18<212>DNA<213>人工序列<220>
<223>
<400>11gacgatcaga cgctcttc18<210>12<211>4611<212>DNA<213>人工序列
<220>
<223>
<400>12ggtaccctgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct60ccagcagccg cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga120tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga180atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct240gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt300cagcgccctg caccattatg ttccggatct atgtcgggtg cggagaaaga ggtaatgaaa360tggcagatcc ctggcttgtt gtccacaacc gttaaacctt aaaagcttta aaagccttat420atattctttt ttttcttata aaacttaaaa ccttagaggc tatttaagtt gctgatttat480attaatttta ttgttcaaac atgagagctt agtacgtgaa acatgagagc ttagtacgtt540agccatgaga gcttagtacg ttagccatga gggtttagtt cgttaaacat gagagcttag600tacgttaaac atgagagctt agtacgtgaa acatgagagc ttagtacgta ctatcaacag660gttgaactgc tgatcttcgg atctatgtcg ggtgcggaga aagaggtaat gaaatggcag720atccctggct tgttgtccac aaccgttaaa ccttaaaagc tttaaaagcc ttatatattc780ttttttttct tataaaactt aaaaccttag aggctattta agttgctgat ttatattaat840tttattgttc aaacatgaga gcttagtacg tgaaacatga gagcttagta cgttagccat900gagagcttag tacgttagcc atgagggttt agttcgttaa acatgagagc ttagtacgtt960aaacatgaga gcttagtacg tgaaacatga gagcttagta cgtactatca acaggttgaa1020ctgctgatct tcggatctat gtcgggtgcg gagaaagagg taatgaaatg gcatccggat1080ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagca1140ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta1200gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta1260agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg1320tcttcaagaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat1380cacagttaaa ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg1440tcatcctcgg caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc1500cgggcctctt gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc1560tagcgctata tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc1620gctttggccg ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga1680tcatggcgac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca1740ccggcgccac aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc1800gggctcgcca cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg1860tggccggggg actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc1920tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc1980gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca2040tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc2100
cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg2160gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc2220ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc2280tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc2340ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag2400atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga2460tcattggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt2520tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg2580catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac2640cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc2700ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg2760cagcgttggg tcctgggctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc2820cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta2880acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat2940cccccttaca cggaggcatc agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc3000tttatcagaa gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa3060caggcagagc tcttactgtc atgccatccg tatgtgggcg gacaataaag tcttaaactg3120aacaaaatag atctaaacta tgacaataaa gtcttaaact agacagaata gttgtaaact3180gaaatcagtc cagttatgct gtgaaaaagc atactggact tttgttatgg ctaaagcaaa3240ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa gaggggcgtg gctcttctag3300ccgtcttcaa aaaaaaggct ccaaaaggag cctttaatgg gtcgacgcgg ccgctaacta3360taacggtcct aaggtagcga gtttaaacga tatcggatcc aggcgtttaa gggcaccaat3420aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat3480taagcattct gccgacatgg aagccatcac aaacggcatg atgaacctga atcgccagcg3540gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga3600agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg3660agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac3720acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc3780agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat3840cccatatcac cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca3900ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct3960ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact4020gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag4080tgattttttt ctccatatgt tattcctcct tatttaatcg atacattatt aataccctcc4140agctggagca ggaagactta aggaagagct ttagcttcct tagctcctga aaatctcgat4200aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt4260acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca4320gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat ggatccgata4380tcatttaaat ctagggataa cagggtaata ctagtgtcga ccaaccagat aagtgaaatc4440tagttccaaa ctattttgtc atttttaatt ttcgtattag cttacgacgc tacacccagt4500
tcccatctat tttgtcactc ttccctaaat aatccttaaa aactccattt ccacccctcc 4560cagttcccaa ctattttgtc cgcccacacc gtaagatgct tttctgtgac t4611<210>13<211>2915<212>DNA<213>人工序列<220>
<223>
<400>13tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt caggactagt cttttaggtc420aaaaagaaga agctttgtaa ccgttggttt ccgtagtgta gtggttatca cgttcgccta480acacgcgaaa ggtccccggt tcgagaagag cagatctaag gatatcgagg ccgcctcgag540attacttacc tgaggaggac taggcaccag agaaacacac gacgtaagtc gtggtacatt600acctgtaacg cgtcgggcac ccggggaata taacctcgag cgcttttttt ctatcgcgtc660gacctgcagg catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg720ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg780tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc840gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt900gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct960gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga1020taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc1080cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg1140ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg1200aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt1260tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt1320gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg1380cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact1440ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt1500cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct1560gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac1620cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc1680
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg1740ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta1800aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca1860atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc1920ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc1980tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc2040agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat2100taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt2160tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc2220cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag2280ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt2340tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac2400tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg2460cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat2520tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc2580gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc2640tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa2700atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg2760tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg2820cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac2880ctataaaaat aggcgtatca cgaggccctt tcgtc 2915<210>14<211>27<212>DNA<213>人工序列<220>
<223>
<400>14ccgtagtgta gtggttatca cgttcgc 27<210>15<211>29<212>DNA<213>人工序列<220>
<223>
<400>15caggaaacag ctatgaccat gattacgcc29
权利要求
1,本发明提供了一种操作目标序列的方法,其特征是1)利用一个或者一个以上的与位于外周序列中的SRE位点对应的SRE酶的酶切作用在目标序列中制造一个断裂点,并在所制造的断裂点的位置上引入一段外源序列;2)至少利用一种SRE酶的酶切作用对所引入的外源序列和/或外源序列周围的目标序列做修饰,其中包括对序列的任意部分的删除和/或置换等。
2,根据权利要求1的方法,所形成的一种建立核酸分子库的方法;与这里的“建立核酸分子库”相关的实验操作主要包括以下步骤,即从目标序列中截取一定长度的序列片段、利用与外周序列中的SRE位点对应的SRE酶的酶切作用在所截取的序列片段中的某个位置上制造一个断裂点并在该断裂点处引入外源序列、对所引入的外源序列和/或周围的来自目标序列的序列片段上的碱基做修饰、制备能够生成相应的核酸分子的序列结构;而本发明所提供的建立核酸分子库的特征是是利用了以下所列的任意一个或者一个以上的手段1),至少利用一个SRE酶来确保在来自目标序列的序列片段的中间所引入的外源序列的方向;2),至少依赖一个SRE酶来对外源序列的插入点所在位置的碱基组成做选择;3),至少利用一个SRE酶对所说的外源序列的插入点附近的来自目标序列的碱基做修饰;4),至少利用一个SRE酶对所引入的外源序列进行修饰。
3,根据权利要求2的方法,所说的核酸分子库是Ribozyme库或DNAzyme库。
4,根据权利要求3的方法,所说的Ribozyme库是Hammerhead类的Ribozyme库或Hairpin类的Ribozyme库。
5,根据权利要求1的方法,所形成的一种从目标序列中截取一定长度的序列片段的方法,其特征是利用与在目标序列中引入的外源序列中含有的SRE位点对应的SRE酶的酶切作用,在与其它的SRE位点对应的SRE酶无法覆盖的区域制造断裂点并在该断裂点上引入下一级的外源序列,以此在目标序列中引入两个或者两个以上的外源序列,接着,将过渡性的外源序列彻底删除,则就将位于外周序列和任意保留的外源序列之间、或者将位于任意两个保留的外源序列之间的目标序列分离出来。
6,根据权利要求5的方法,将从目标序列中截取的一定长度的序列片段用于SAGE分析。
7,根据权利要求5的方法,从目标序列中的特定的限制性内切酶位点附近截取一定长度的序列片段。
全文摘要
本发明提供了一种建立非随机Ribozyme库和非随机DNAzyme库的方法;这种方法的实施包括以下功能性的步骤的1的从任意目标序列中截取一定长度的序列片段片2片在实验需要的情况下,从1中选择出具备一定序列特征的序列片段的亚群;3,对被截取的序列片段进行修饰,其中包括删除不必要的碱基、插入和Ribozyme分子或者DNAzyme分子的构建相关的碱基序列;4,将经过改造的来自于目标序列的序列片段,克隆进合适的序列环境例如合适的载体体系中,得到可以产生Ribozyme分子或DNAzyme分子体系例如合适的表达载体等;由此完成针对任意目标序列的非随机Ribozyme库和非随机DNAzyme库的构建,而不同特点的非随机Ribozyme库和非随机DNAzyme库则可以被用到不同的具体实验研究中去。本发明对所提供的方法所依据的原理以及方法的具体实施过程做了详细的说明。
文档编号C12N15/00GK1629287SQ200410080329
公开日2005年6月22日 申请日期2004年9月29日 优先权日2003年9月29日
发明者万海粟 申请人:万海粟