Dna构建体和使用这些dna构建体合成蛋白质的方法

文档序号:451319阅读:379来源:国知局
专利名称:Dna构建体和使用这些dna构建体合成蛋白质的方法
技术领域
本发明提供包含位于核糖体rRNA基因重复序列之间的基因间隔区DNA片段的DNA构建体,同时也提供在真核细胞,尤其在植物细胞中使用这些DNA构建体合成蛋白质的方法及增加拷贝数或表达的方法。
背景技术
高等真核生物体基因组的重要部分在于核糖体DNA。许多转录单位(以拟南芥为例,约为600个)一个紧接着一个串联排列。在细胞遗传学上,这些单位形成核仁组织区,并且它们定位在有限数量染色体(例如拟南芥的染色体2和染色体4)的端粒附近。RNA聚合酶Ⅰ特异地负责核糖体RNA(rRNA)基因的转录。由于它们的高拷贝数,核糖体RNA基因是第一个得到分子分析的基因。这些基因的重复性质已经相当大地阻碍了对它们的进一步分析。
了解核糖体DNA转录的进展主要使用源自动物细胞的体外系统获得。在植物中,已经研究了许多属转录单位之间(基因间)区域,但是对功能的解释主要基于序列比较。
转录的调控元件位于基因间隔区(intergenic region,IGR),也称为基因间隔区(intergenic spacer,IGS)。IGR是位于前一个rRNA基因单位的25S RNA编码区和后一个rRNA基因单位的18S RNA编码区之间的DNA区域。它一般由3’外转录区(从前一个rRNA基因单位的编码成熟25S RNA区域末端延伸至的转录终止位点)和5’外转录区(从下一个rRNA基因单位的转录起始位点延伸至编码成熟18S RNA区域的起始处)以及这两个区域之间的非转录区组成。对于高等植物,在大多数情况下,IGR包含重复序列元件。既然这些元件的精确碱基序列在相关种系间大多只有较少或没有序列相似性,那么它们可能在低选择压力下。这与IGR的另一部分即转录起始处周围区域的良好保守相反。
最近使用拟南芥的瞬间表达系统,在核糖体转录认识上得到相当大的进展(Doellling,J.H.和Pikaard,C.S.(1995)“拟南芥的最小核糖体RNA基因启动子在转录起始位点包含重要元件”,植物学杂志,8,683-692;Doellling,J.H.,Gaudino,R.J.和Pikaard,C.S.(1993)“在体内并通过瞬间表达对拟南芥核糖体RNA基因和间隔区启动子进行功能分析”,美国国家科学院院报,90,7528-7532)。另外,也得到了菜豆和烟草的体外转录系统(Yamashita,J.,Nakajima,T.,Tanifuji,5.和Kato,A.(1993)“蚕豆rDNA在胚轴的全细胞提取物中的正确转录起始”,植物学杂志,3,187-190;Fan,H.,Yankura,K.,Miyanishi,M.,Sugita,M.和Sugiura,M.(1995)“植物RNA聚合酶Ⅰ-依赖的rRNA基因的体外转录是种特异的”,植物学杂志,8,295-298)。
发明概述根据本发明,提供DNA构建体,包含如下可操作相连的DNA片段-包含核糖体DNA序列的DNA片段,优选地来源于植物,优选地来源于植物核糖体DNA的基因间隔区;具体地是包含拟南芥核糖体DNA的基因间隔区的上游SalⅠ重复序列,或另一种植物的相似区域;-包含可表达的启动子区的片段,尤其是植物-可表达的启动子区,优选由RNA聚合酶Ⅱ识别的启动子;-异源编码区;并且选择性地-转录终止和多聚腺苷酸化区域,优选在植物细胞中有活性的区域。
特别优选的核糖体DNA序列包含选自以下DNA序列的DNA序列从SEQID NO:1的486位核苷酸至5212位核苷酸的DNA序列,从SEQ ID NO:1的1263位核苷酸至3003位核苷酸的DNA序列,从SEQ ID NO:1的569位核苷酸至2862位核苷酸的DNA序列,从SEQ ID NO:1的1263位核苷酸至2862位核苷酸的DNA序列,从SEQ ID NO:1的486位核苷酸至5212位核苷酸的DNA序列,从SEQ ID NO:1的596位核苷酸至5373位核苷酸的DNA序列。
也提供合成蛋白质的方法,包括如下步骤-将根据本发明所述的DNA构建体导入适当的宿主生物体内;-在允许结构基因编码的蛋白质表达的条件下培养宿主生物体;并且-收获表达的蛋白质。
此外,提供在植物中增加转基因稳定性、拷贝数或表达的方法,包括如下步骤-将根据本发明所述的DNA构建体导入植物细胞中;-从转化的植物细胞再生植物。
同样根据本发明,提供包含整合于它们核基因组中的根据本发明所述的DNA构建体的宿主生物体,特别是植物和植物细胞。
附图简述

图1拟南芥核糖体DNA的限制性图谱;图2(A)插入序列导入前(左)和后(右)的拟南芥25S rRNA V1区域的序列(B)用于检测25S rRNA的寡聚核苷酸序列;图3转基因整合分析;图4用于检测转基因rRNA的引物延伸分析;图5拟南芥25S rRNA 5’末端的测定;图6含转化基因R4的细胞的连续银染切片;图7异位核糖体基因转录分析;图8(a)-(e)二元载体R4至R8;图9-A/B在嵌合CaMV35S-gus基因前包含或缺乏上游Sal Ⅰ重复序列的二元载体的图示。
发明详述本发明的一方面是提供使真核细胞尤其植物细胞中外源蛋白质表达得到改善的DNA构建体。根据本发明所述的DNA构建体在阅读方向包含如下可操作连接的DNA片段-包含核糖体DNA序列的DNA片段,其优选地来源于植物;
-包含可表达的启动子区的片段,尤其是植物-可表达的启动子区,-异源编码区;并且选择性地-转录终止和多聚腺苷酸化区域,优选在植物细胞中有活性的区域。
令人惊奇的是使用这样的构建体可以得到更高数量的转化子,更高拷贝数的转化基因,以及转基因增强的稳定性和增强的表达。既然本领域技术人员没有预料到,通过将在RNA聚合酶Ⅰ识别和/或转录起始中有作用的DNA片段(核糖体DNA)与一般由RNA聚合酶Ⅱ转录的DNA片段结合可以获得更有效的表达系统,那么这甚至是更无法预料的。
尽管根据本发明所述的重组DNA中的启动子区优选地是由RNA聚合酶Ⅱ识别的启动子,但是启动子也可包含在核糖体DNA中,这可以使根据本发明所述的重组DNA的构建更容易。如此处所用的,术语“植物-可表达的启动子区”表示能在植物细胞中启动转录的启动子。它包括任何起源于植物的启动子,但也包括任何能在植物细胞中指导转录的非植物起源的启动子,即某些病毒或细菌起源的启动子如CaMV35S或T-DNA基因启动子,以及源于噬菌体并且可由特异性单一亚单位RNA聚合酶识别的启动子区如T7或T3 RNA聚合酶特异的启动子。在后一种情况下,宿主细胞必须包含识别特异性启动子的功能性RNA聚合酶。
这并不是说,当提到核糖体DNA应来源于植物时,就意味着那个核糖体DNA片段的序列应与植物中所发现的序列相同或相似。当然,DNA片段可以在中间生物体如大肠杆菌中得到克隆,或完全或部分地得到合成。
对本发明适合的核糖体DNA片段能够指导染色质结构,方法是将整合到核基因组中的根据本发明所述的DNA构建体定位在核仁的邻近或转化基因整合其中的基因组区域,采用与核仁中所发现的染色质结构相似的染色质结构。确定细胞中DNA片段空间定位的方法为本领域技术人员所知,并且在实施例中详细说明了一种这样的方法。测定染色质结构特征,尤其是DNA与相互作用分子互相作用的容易程度的方法,也为本领域技术人员所知〔例如,通过测定对微球菌核酸酶的易感性或通过染色体蛋白质的交联(Ausubel等(1994)〕。参见如下,Dammann等(1995)“酵母rRNA基因位点的转录活性侧翼调控序列的分布”,分子与细胞生物学,15,5294-5303。
在优选的实施方案中,特别选择适合于根据本发明所述的重组DNA将要导入其中的宿主生物体的核糖体DNA;例如源自那个宿主生物体或亲缘关系很近的种的核糖体DNA。
核糖体DNA优选来自核糖体DNA的基因间隔区。以拟南芥为例(此处来自品种Co10的基因间隔区具有从SEQ ID NO:1的486位核苷酸至5212位核苷酸的DNA序列),尤其优选的是包含来自拟南芥核糖体DNA基因间隔区的“上游SalⅠ重复序列”的DNA片段。这些上游SalⅠ重复序列排列成三个模块[所谓的SalⅠ元件盒1(从SEQ ID NO:1的1263位核苷酸至1557位核苷酸),SalⅠ元件盒2(从SEQ ID NO:1的1883位核苷酸至2177位核苷酸)和SalⅠ元件盒3(从SEQ ID NO:1的2503位核苷酸至3003位核苷酸)],并且认为包含含有这些SalⅠ重复序列的DNA片段(例如,含有从SEQ ID NO:1263核苷酸位至3003核苷酸位的DNA序列的片段)足以得到根据本发明所述的效果。事实上,不需要完整的第三个SalⅠ重复序列的存在,因为可以使用只包含SalⅠ元件盒3向上至EcoRⅠ位点的部分的片段(含有从SEQ ID NO:1的569位核苷酸至2862位核苷酸的DNA序列)来达到相似效果。因此,在优选的实施方案中,核糖体DNA包含具有从SEQ ID NO:1的1263位核苷酸至2862位核苷酸的DNA序列的片段。此外,可以使用包含上游SalⅠ重复序列的更大的片段,比如包含完整基因间隔区的片段(具有从SEQ ID NO:1的486位核苷酸至5212位核苷酸的DNA序列),或者甚至包含部分编码rRNA转录物,尤其是18S转录物的编码区域的片段(如具有从SEQ ID NO:1的596位核苷酸至5373位核苷酸的DNA序列的片段)。此外,也可能使用包含完整核糖体基因单位的片段(其DNA序列可以通过将从EMBL数据库录入号X16077、X52320和X15550得到的重叠DNA序列合并获得),尽管当使用这种DNA构建体时,可能由于屏蔽效应使本发明所述的效果可能更不明显。
对于其它宿主植物,特别合适的DNA片段包含对应于拟南芥中那些结构域的核糖体DNA的那些结构域,尤其是源于它们本身的那些结构域。优选的是包含位于编码25S和18S区域的DNA区域之间的基因间隔区的DNA片段,特别是包含位于前一个rRNA基因单位的转录终止位点和后一个rRNA基因单位的转录起始位点之间的非转录的基因间隔区的DNA片段。在本领域中,至少对于玉米[McMullen等,核酸研究,14:4953-4968(1986);Toloczyki和Feix,核酸研究,14:4969-4986(1986)],黑麦[Appels等,加拿大细胞遗传学杂志,28:673-685(1986)],小麦[Barker等,分子生物学杂志,201:1-17(1988)],萝卜[Delcasso-Tremousaygue等,欧洲生物化学杂志,172:767-776(1988)],水稻[Takaiwa等,植物分子生物学,15:933-935(1990)],绿豆[Gerstner等,基因组,30:723-733(1988),Schiebel等,分子遗传学和普通遗传学,218:302-307(1989)],马铃薯[Borisjuk和Hemleben,植物分子生物学,21:381-384(1993)],番茄[Schmidt-Puchta等,植物分子生物学,13:251-253(1989)],蚕豆[Kato等,植物分子生物学,14:983-993(1990)],豌豆[Kato等,同上,(1990)]和大麦[Procunier等,植物分子生物学,15:661-663(1990)]的其它rRNA基因间隔区是已知。而且使用对应于保守的25S成熟rRNA编码区的3’末端和保守的18S成熟rRNA编码区的5’末端的寡核苷酸,可以在PCR反应中简单地从植物中扩增基因间隔区。
已有报道(Gruendler等,1991,分子生物学杂志221,1209-1222),上游SalⅠ重复序列的数目可能在不同种或相同种的不同分离物(以拟南芥为例)间有所不同。本发明也包括这种变异。
也可能使用通过变异、插入或缺失而源于原始核糖体DNA的修饰的核糖体DNA,只要核糖体DNA基本功能特征特别是相关的(例如对于诸如聚合酶的DNA结合蛋白质)或至少是基本拓扑学特性没有因修饰而丢失。
如此处所用的,“编码区”或“编码序列”是指当提供适当调控区域,尤其是启动子区时可以转录成具有生物活性的RNA的DNA区域,即它能与另一个核酸如反义RNA或核酶相互作用或能翻译成具有生物活性的多肽或蛋白质。
如此处所用的,关于编码区的术语“异源的”是指任何与根据本发明所述的嵌合DNA所用的核糖体DNA片段天然结合的rRNA编码区不同的编码区。
对于编码区,可以使用所有已知的天然或修饰的编码区,此编码区与宿主生物体相容,换句话说,表达产物以这样一种方式表达,即特别是导致显著表达时在收集产物前,如果收集的话,产物对宿主没有太大毒性。尤其是,编码区可能编码疫苗,抗体,治疗蛋白,杀昆虫蛋白如Bt毒素或其最小毒性片段,食品技术中所用的蛋白质,反义RNA或核酶。
DNA构建体可以按照适应于特定宿主或转化系统的方式制备。在优选的实施方案中,根据本发明所述的DNA构建体是以载体形式。具体地,DNA构建体是T-DNA载体。
尽管在根据本发明所述的DNA构建体中,核糖体DNA片段优选地位于启动子区和异源编码区之前,但是预期当核糖体DNA片段位于可操作连接的启动子区和编码区的下游时,将获得相似的效果。
另一方面,本发明也提供合成蛋白质的方法,包括如下步骤-将根据本发明所述的DNA构建体导入适合的宿主生物体中,-在允许结构基因编码的蛋白质表达的条件下培养宿主生物体,-选择性地,收集表达的蛋白质。
另一方面,本发明提供尤其在植物中增强转化基因稳定性,拷贝数和/或表达的方法,包括如下步骤-将根据本发明所述的DNA构建体导入细胞,优选植物细胞,-从转化的细胞再生生物体,优选植物。
本发明的方法尤其适合于增强重组基因的稳定性和表达,此重组基因至少与宿主细胞,尤其植物细胞中存在的序列有部分同源性,如多拷贝的转化基因或包含相似序列如相同启动子的不同转化基团。已知这样的转化基因常常有同源重组以及通过例如甲基化作用或共抑制事件减少表达的倾向。尽管,并没有故意将本发明限制为一种作用模式,但是已认为由根据本发明所述的DNA构建体转化导致的转化基因于核仁中或核仁邻近的定位或转化基因整合其中的染色体区上的核仁样染色质结构的加强减少了同源序列之间的重组(因此增强了稳定性)、甲基化作用和引起这样的转化基因表达减少的任何事件。
可以通过使用熟练技术人员掌握的任何方法或方式和不同技术,依赖于所用的宿主生物体导入DNA。特别优选的导入DNA的方法是T-DNA转化、电穿孔或粒子轰击,以及质粒或病毒转化。
最佳培养条件依赖于所用宿主生物体和表达的蛋白的性质。这些条件也为本领域技术人员所了解(对于已知的宿主生物体)和/或可以很容易地使用已知的生物技术方法确定或优化。
蛋白质收集也优选地按照对于相关宿主生物体的标准方法进行,并且也依赖于表达蛋白质的方式(例如,蛋白质是分泌或排泄至培养基,还是在宿主生物体内积累,或包含在特异的空隙内,等等)。与培养步骤一样,在此处不用过多的实验,本领域技术人员就可以确定和/或优化对于特定宿主/结构蛋白系统的收集条件。
优选的宿主生物,特别是植物是众所周知并具很好特性的系统,比如拟南芥或重要经济作物如烟草、玉米、小麦、马铃薯、水稻、大豆、大麦、黑麦、甘蓝蔬菜、甜菜种类或木薯。
本发明也提供包含本发明DNA构建体的宿主生物体。优选地,此宿主生物体是真核细胞,特别是植物细胞,以及包含这些细胞的生物体或从这些细胞再生的生物体。
在另一方面,本发明提供包含含有根据本发明所述的DNA构建体的细胞的繁殖材料,尤其是植物繁殖材料。
本发明及其优势在非限制性的实施例和附图中得到进一步说明。
在本发明的实施例和描述中,参考序列表的如下序列SEQ ID No.1拟南芥rRNA基因重复序列之基因间隔区的DNA序列
SEQ ID No.2寡聚核苷酸SEQ ID No.3寡聚核苷酸SEQ ID No.4寡聚核苷酸ESEQ ID No.5寡聚核苷酸QSEQ ID No.6拟南芥在5.8S rDNA 3’末端和25S rDNA 5’末端之间区域的DNA序列实验除非在实施例中另有说明,所有的重组DNA技术都按照在Sambrook等(1989)分子克隆实验指南,第二版,冷泉港实验室出版,NY和Ausubel等(1994)分子生物学常用方法,第一卷和第二卷,常用方法,USA中所述的标准方法进行。植物分子工作的标准材料和方法在R.D.D.所著的植物分子生物学Labfax(1993),BIOS科学出版物有限责任公司(UK)和Blackwell科学出版物(UK)联合出版中描述。这些出版物也包括解释常用缩写的目录。1.载体构建将来自λ噬菌体ATR3的SalⅠ片段[Grundler,P.,Unfried,I.,Pointner,R.和Schweizer,D.(1989)“拟南芥25S-18S核糖体基因间隔区的核苷酸序列”,核酸研究,17,6395-6395;Unfried,I.,Stocker,U.和Grundler,P.(1989)“来自拟南芥Col-0的18S rRNA基因的核苷酸序列”,核酸研究,17,7513;Unfried,I.,和Grundler,P.(1990)“拟南芥25S和18S rRNA基因和内部转录间隔区的核苷酸序列”,核酸研究,18,4011],从载体插入边界(序列X16077的1400位核苷酸)延伸至序列X15550的1263位核苷酸处的SalⅠ限制性位点,插入二元载体pBIB Hyg[Becker,D.(1990)“允许植物选择标记和报告基因交换的二元载体”,核酸研究,18,203]的SalⅠ限制性位点中。插入方向是18S基因位置靠近Asp718限制性位点。所得的载体R2用Asp718酶切,用Klenow酶处理,然后用SfiⅠ部分酶切。将来自ATR3的(补平的)XhoⅠ限制性位点(序列X15550的569位核苷酸)延伸至SfiⅠ限制性位点(序列X16077的1490位)的片段插入并且在载体R3中完成核糖体转录单位的序列。
为了插入寡聚核苷酸,首先将从位于序列X16077的305位的SalⅠ限制性位点至位于序列X52320的1425位的PstⅠ限制性位点的包含18SrDNA序列的最大部分和25S rDNA序列5’端的片段克隆入pSK+(质粒pBlu/SP)中。用XbaⅠ和SrfⅠ酶切后,用Klenow酶补平粘末端并连接,连接产物用XhoⅠ和EcoNⅠ酶切,用Klenow酶处理并且再连接。现在形成的载体中有单一的AatⅡ限制性位点。使寡聚核苷酸CCAAGGTAACCTTCGACGT(SEQ ID NO 2)和CGAAGGTTACCTTGGACGT(SEQID NO 3)退火并插入AatⅡ限制性位点。在测定序列后,将BamHⅠ/BstBⅠ片段转入载体pBlu/SP(载体pBlu/SP+E)。将来自载体pBlu/SP+E的sfiⅠ/srfⅠ片段插入载体R3(载体R4;图8a)。2.植物转化除了使用潮霉素选择之外,按照在Valvekens,D.,Van Montagu,M.和Van Lijsebettens,M.(1988)“通过使用卡那霉素选择进行根瘤土壤杆菌介导的拟南芥根外植体的转化”,美国国家科学院院报,85,5536-5540中所述的进行植物转化。实施例1和实施例2中所用的质粒中的选择标记实际上是潮霉素磷酸转移酶。3.DNA分离按照在(Dellaporta,S.L.,Wood,J.和Hicks,J.B.(1983)“少量制备植物DNA的方法Ⅱ”,植物分子生物学报告,1,19-21)中所述的进行DNA分离,并有如下修饰在酚抽提后,向DNA溶液中加入1/10体积的溴化乙锭(10g/l)和CsCl(0.9g/ml)。将溶液在冰上放置30分钟。离心(5分钟,5000RPM)后,上清液用CsCl将密度调节至1.6g/ml,在Beckman NVT90转子中于80000RPM离心3小时。使用标准方法从梯度收集DNA[Ausubel,F.M,Brent,R.,Kingston,R.F.,Moore,D.O.,Seidman,J.G.,Smith,J.A.和Struhl,K.(编辑),(1987),分子生物学常用方法,John Wiley & Sons公司,纽约]。4.通过凝胶印迹进行DNA分析来自愈伤组织材料的纯化DNA用限制性酶如BstEⅡ消化并用来进行凝胶印迹分析(Ausubel等,1987)。5.RNA制备按照在Logemann,J.,Schell,J.和Willmitzer,L.(1987)“从植物组织中分离RNA的改进方法”生物化学分析,163,16-20)中所述的方法制备RNA,并有如下修饰在液氮中磨碎愈伤组织材料,每克愈伤组织材料与2ml抽提缓冲液(8M氯化胍,20mM MES,20mM EDTA,50mM 2-巯基乙醇,0.5%十二烷基肌氨酸钠,pH约为3)混合。将融化的悬浊液转移至离心管,用一倍体积的酚/氯仿/异戊醇(50∶49∶1)抽提。剧烈振荡后,将混合物在冰上放置约15分钟并于10000g离心10分钟。将水相移到新管内并加入1/10体积的乙酸钠(1M)和一倍体积乙醇以沉淀核酸。将溶液混合后于10000g离心。用3M乙酸钠和70%乙醇洗涤沉淀。在残余酒精挥发后,将沉淀溶于水,于60-65℃温育3小时。6.引物延伸分析将25ng寡聚核苷酸E[GAAGACGTCGAAGGTTACCTTGG(SEQ ID NO 4);专一结合具有19个核苷酸插入的rRNA的寡聚核苷酸]或寡聚核苷酸Q[CCCGGTTCGCTCGCCGTTACTAAG(SEQ ID NO 5);序列X52320的非编码链的核苷酸950至核苷酸927,能与拟南芥的所有25SRNA分子结合]在10μl体积中用10μCi32P-γ-ATP磷酸化90分钟,加入1mg tRNA后,用酚/氯仿抽提,然后用乙酸钠和酒精沉淀。将寡聚核苷酸与11μl水中的2.5μg拟南芥总RNA一起温育以使之杂交,从90℃冷却至63℃,然后在约一个半小时的时间范围内冷却至52℃。对于延伸反应,加入5μl5×RT缓冲液(由酶生产厂家提供),2μl dNTPs(2mM)和0.5μl(12单位)AMV逆转录酶(宝灵曼)。38℃温育一小时后,加入1μl无RNA酶A的DNA酶(5mg/ml;宝灵曼),将混合物于37℃进一步温育30分钟。将反应混合物在DNA测序所用的变性聚丙烯酰胺凝胶中分离。7.细胞切片和染色愈伤组织材料用含2.5%多聚甲醛和0.5%戊二醛的0.1M磷酸缓冲液固定并包埋在LR White Harz中。使用Reichert Ultracut E显微切片机以800nm厚度进行连续随动切片(每个细胞核大约生成5-6张切片)。用Richardson染料对切片进行染色并用Leitz Dialux显微镜进行分析。实施例实施例1将DNA构建体导入拟南芥并分析转化细胞来自不同种的核糖体RNA的序列比较揭示了一些具高度可变性区域的存在。在许多情况下,可变区域具有发夹结构,此发夹结构或者长一些或者短一些或者甚至完全缺失。大rRNA中的一种这样的可变区(称为V1)可用于插入特异核酸序列。此区域离成熟25S rRNA的起始处足够近,这样可以进行延伸实验。
将有时含有多于一个重复序列单位(转录单位)的rDNA的DNA片段插入二元载体pBIB Hyg(Becker,D.,1990)。此构建体在重复序列单位两端包含推测的转录终止信号。此构建体(称为R4)的结构和拟南芥核糖体重复序列单位的限制性图谱在图1和图8(a)表示。
表示为18S,5.8S和25S的空心框代表编码3个核糖体RNA的区域。“上游SalⅠ重复序列”表示基因间隔区中重复DNA的三个模块,其中包含许多SalⅠ限制性位点。图表两端的粗线表示载体DNA。通过核苷酸插入导入的BstEⅡ限制酶切位点用“B”表示。载体R5和载体R4的不同之处是“上游SalⅠ重复序列”的缺失以及在核糖体单位的边界有KpnⅠ限制性位点(K)。B,BstEⅡ;E,EcoRⅠ;F,FspⅠ;H,HindⅢ;K,KpnⅠ;P,PstⅠ;Pc,PacⅠ;S,SalⅠ;Sc,ScaⅠ;Sf,SfiⅠ;Sr,SrfⅠ;X,XbaⅠ;Xh,XhoⅠ。
此区域的核酸序列可从EMBL数据库录入号X16077,X52320和X15550得到。也可从EMBL数据库录入号X52631,X52637和X52636得到部分的核糖体DNA的变体[Griundler等,1989;Unfried等,1989;Unfried等,1990;Griundler,P.,Unfried,I.,asch,R.和Schweizer,D.(1991)拟南芥rDNA基因间隔区结构分析,种间变异和功能含义。分子生物学杂志,221:1209-1222]。
如上所述,为了能特异性地识别它并将它与存在于基因组中的其它核糖体基因单位区分开,用小的核苷酸插入在大(25S)核糖体RNA上以标记核糖体基因单位(图1)。图2表示核苷酸插入和允许检测此(标记的)核糖体基因单位转录的寡聚核苷酸。插入序列有BatEⅡ限制性位点,此位点可以用于特异识别基因单位(a),寡聚核苷酸序列插入的前面(左)和后面(右)的拟南芥25S rRNA V1区域的序列。插入片段的二级结构是假设的,仅仅是为了与没有插入时的结构相比较。插入序列在DNA(b),允许通过逆转录对25S核糖体RNA进行检测和定量的寡聚核苷酸序列中有BstEⅡ限制性位点。
称为R5的进一步的构建体[见图8(b)]与R4不同之处是已去除“上游SalⅠ重复序列”。
使用根瘤土壤杆菌将构建体R4和R5导入拟南芥植物的根外植体。基因定位于核糖体单位附近,由RNA聚合酶Ⅱ转录,并具有对潮霉素B的抗性(潮霉素磷酸转移酶基因;Becker,D.,1990)。根据它们对潮霉素的抗性,选择转化的细胞/愈伤组织。将来自这些愈伤组织的DNA用于进行DNA印迹实验。
图3表示,核糖体转化基因的拷贝和邻近的标记基因可以整合在基因组的不同位置。为了消化基因组DNA,使用BstEⅡ酶,此酶不在拟南芥生态型Col-0的核糖体基因中切割。因此,可看到核糖体DNA为高分子量条带或者甚至部分地滞留在凝胶槽中。相反,由于在整合位置附近的基因组区域,BstEⅡ限制性位点应以统计学的随机方式存在,所以未在天然核糖体DNA重复序列之间整合的核糖体转化基因会产生小的条带。在分析的愈伤组织中能够准确地看到后一种结果。
图3表示的DNA杂交实验证明至少在大多数情况下,转化基因的整合并没有发生在核糖体DNA区域。源自愈伤组织材料的DNA用BstEⅡ酶切,并在琼脂糖凝胶上按大小分级分离后转移至尼龙膜上。泳道1和泳道2分别含有来自未转化的愈伤组织材料的DNA和来自用DNA构建体R4转化的愈伤组织材料的DNA。用潮霉素磷酸转移酶基因的DNA作为探针。检测的片段一端有定位于25S rRNA转化基因的BstEⅡ限制性位点,在另一端有位于DNA整合位置的BstEⅡ限制性位点。既然内源rDNA并不包含BstEⅡ限制性位点,那么这种限制性位点在紧邻转化基因的宿主DNA中的存在构成转化基因在核糖体DNA外整合的证据。泳道3和泳道4表示与泳道1和泳道2相同的消化DNA,但是这里用核糖体DNA作为探针。源自愈伤组织的DNA或者留在凝胶槽中,或者作为高分子DNA在凝胶分离能力的限制下移动。泳道5-泳道8包含来自三个进一步独立转化的愈伤组织的DNA,其中泳道8已经与核糖体探针杂交。
从转化的愈伤组织制备RNA,并且用作引物延伸分析。因此,设计与可变区V1中插入片段结合但不与不含此插入的RNA结合的寡聚核苷酸。在图2中表示为寡聚核苷酸E的合成DNA片段是特别合适的。在转化的愈伤组织中得到使用此寡聚核苷酸作为引物的逆转录产物,但在未转化的愈伤组织中无法得到。在大多数情况下,可以检测到核糖体转化基因的活性(图4)。
用寡聚核苷酸E作为引物进行逆转录反应产生约为150个碱基(用星号表示)的产物。收集几种愈伤组织以制备RNA[(a)泳道1没有用核糖体转化基因DNA转化的愈伤组织材料;泳道2用核糖体转化基因R4转化的愈伤组织材料;(b)凝胶槽(用箭头指示)和分子量大小标记物;在许多实验中可见到具有较高分子量(星号2或星号3)的前体;泳道1分子量大小标记物;泳道2同(a)中泳道1;泳道3同(a)中泳道2)。
从选择模式得到,在所有情况下,邻近的潮霉素抗性基因都是有活性的。
核糖体转化基因的加工可与天然核糖体基因相同,在其中能够确定相同的25S rRNA的5’端(图5)使用寡聚核苷酸Q测定正常基因组25SrRNA的5’末端,使用寡聚核苷酸E测定用插入序列标记的转化基因的5’末端。测序条带的比较证实为相同末端。而且,RNA末端与到目前为止推测的不同,其中25S rRNA比到目前为止所认同的要长一些(图5)。同样,也可检测到25SrRNA的加工中间体,再一次表明未改变的rRNA和含有插入序列的rRNA的加工相似。
在图5中表示拟南芥25S rRNA 5’末端的确定。图5(a)显示使用寡聚核苷酸Q进行的引物延伸分析,此寡聚核苷酸Q可以结合所有的25SrRNA转录物。右侧表示使用相同寡聚核苷酸作为引物所得到的测序条带。图5(b)显示使用寡聚核苷酸E进行的逆转录,此寡聚核苷酸E对转基因核糖体拷贝特异。左侧表示使用相同寡聚核苷酸作为引物所得到的测序条带。星号标记反转录物的最后碱基。转基因的和内源的核糖体25S rRNA具有相同的5’末端。图5(c)与图4(b)的泳道3相似,但带有测序阶梯。用25S rRNA的5’末端作指示,图5(d)(和SEQ IDNO 6)表示核糖体DNA的序列,带有25S rRNA 5’末端和前体的指示(分别用一个星号和两个星号来表示)。点代表以前推测的5’末端。黑体表示分别存在于25S和5.8S RNA的部分。
转基因的和天然的核糖体RNA相同的加工表明这种过程(一般发生在核仁中)所必须的成分可以到达异位整合基因。进一步分析天然核糖体RNA的加工是定位在核仁中,还是定位在核仁附近。阳性结果与果蝇(Karpen,G.H.,Schaefer,J.E.和Laird,C.D.(1988)“在转录和核仁形成时,定位于常染色质的果蝇rRNA基因是有活性的”,基因发展,2,1745-1763)中发现的情况相符,阴性结果与发面酵母中发现的情况相似。银染转基因拟南芥细胞核并制备连续薄切片。图6和表1显示,包含前述的转化基因的拟南芥细胞平均具有一个额外的核仁。
表1R4转化的愈伤组织细胞和未转化的对照细胞中的平均核仁数(在每种情况下,如图6所示,通过连续切片分析25个细胞)。
平均核仁数R4转基因细胞2.8±0.5对照细胞2.0±0.3
这些穿过含转化基因R4的细胞的连续切片和银染显示了额外核仁的存在[(a)至(j)穿过没有异位核糖体DNA的拟南芥愈伤组织细胞的切片;(k)至(t),如(a)至(j),但是用含有异位核糖体DNA的拟南芥愈伤组织材料(用星号指出明显的细胞);在(k)至(t)中可见额外的核仁。]。
经选择的愈伤组织细胞核平均有3个核仁,而在未转化的愈伤组织材料中是2个左右;不能由3个核仁的大小来说明它们中的一个仅包含异位拷贝。同样可以假设,有效活性核糖体基因分在所有的3个拷贝中。进一步的实验表明编码潮霉素抗性的基因定位在至少邻近核仁的位置。
在进一步的一系列实验中,分析缺乏上游SalⅠ重复序列的构建体R5是否也得到转录以及其转录水平是否与构建体R4的转录水平不同。
因此,对只用载体序列(图7两块板中的泳道1),或用缺乏上游SalⅠ重复序列的核糖体拷贝(两块板中的泳道2)或用完整核糖体拷贝(两块板中的泳道3)转化的植物材料进行逆转录和分析。在图7(a)中,使用寡聚核苷酸E(对转基因拷贝特异);在图7(b)中,使用可结合所有25S rRNA分子的寡聚核苷酸Q(作为相似数量RNA的对照)。
图7显示没有检测到任何区别。为了排除一些整合的转化基因上的位置效应,使用几种独立转化的愈伤组织的混合物作为起始材料。而且看来rRNA加工不受上游SalⅠ重复序列缺失的影响。因此看来,源自所谓“上游SalⅠ重复序列”(见图1)的序列对新鲜转化愈伤组织材料中核糖体基因单位表达水平没有明显影响。图7显示对核糖体基因单位基因表达的定量评估。
然而,已证实,包含“上游SalⅠ重复序列”的DNA片段对导入的DNA的稳定性有影响。图8(a)至(e)显示互相比较的构建体[R4-R8为具有RK2复制起点的大肠杆菌-土壤杆菌穿梭载体,其中“Br”和“Bl”分别表示T-DNA的左和右边界;(a)二元载体R4包含与潮霉素抗性基因(HPT)相邻的拟南芥的完整核糖体单位;(b)二元载体R5与R4相似,没有“上游SalⅠ重复序列”(缺乏从SEQ ID NO:1的1269位核苷酸至3002位核苷酸的DNA序列);(c)二元载体R6只包含邻近潮霉素抗性基因的核糖体DNA的基因间隔区(通过将具有SEQ ID NO:1的596至5373位序列的DNA片段插入pBIB Hyg中得到构建);(d)二元载体R7与R6相似,但缺乏“上游SalⅠ重复序列”(缺失从SEQ ID NO:1的1269至3002位核苷酸的DNA序列的);(e)二元载体R8仅包含邻近抗性基因的编码部分核糖体DNA的RNA(与R1相似,但没有从SEQ IDNO:1的1269至5075位核苷酸的DNA序列)]。质粒的大小是约(按碱基对)23810(R4),21810(R5),16010(R6),14010(R7),19960(R8)。
根据本发明所述的所有构建体使转化基因稳定化,此稳定化表现为更高拷贝数和/或更高转化效率的存在,特别是结构基因尤其诸如潮霉素磷酸转移酶基因的标记基因更稳定的表达。
解释这种效果的假说是,此序列保护核糖体重复序列免受重组和/或甲基化。此序列也负责核糖体DNA在核(核仁)的特殊亚区域中的定位。既然实验表明通过RNA聚合酶Ⅱ转录的邻近基因允许定位于核仁邻近区域并证实了活性,那么可得出结论,即稳定效果可扩大到此类基因。实施例2根据本发明所述的构建体(含“上游SalⅠ重复序列”,USR)与传统构建体(不含“上游SalⅠ重复序列”,USR)的比较,尤其是关于转基因的拷贝数和表达水平。
2.1如实验部分所述,从转化的愈伤组织材料制备DNA并用限制性内切酶BamHⅠ和HindⅡ消化。两种酶都在转移的DNA内切割,这样,当用凝胶电泳进行大小分离时,整合至基因组的所有拷贝泳动跑成单一条带。通过Southern杂交,使用潮霉素耐药基因作为探针,通过借助于Phospho成象仪比较杂交带强度来确定不同愈伤组织中转基因拷贝的相对数目。作为对照,使用已知在基因组(chlorata 42)中以两个拷贝数存在的DNA作为探针对DNA印迹进行杂交。如上所述测定条带相对强度,用于估计不同泳道中DNA的数量。通过两种探针的条带强度比较,可以确定所分析的转化基因以如下的拷贝数存在
构建体图8-A(含USR;根据本发明所述;目前申请人认为此构建是实施本发明的最好模式)和构建图8-B(不含USR;现有技术)的比较含USR的构建体在6个例子中每单倍体基因组的拷贝数为7;5.5;0.5;3.5;3;0.5,得到平均3.3±2.7个拷贝。
不含USR的构建体在5个例子中每单倍体基因组的拷贝数为2;1;2;1.5;1.5,得到平均1.6±0.5个拷贝。
构建体图8-C(含USR;根据本发明所述)和构建体图8-D(不含USR;现有技术)的比较含USR的构建在4个例子中每单倍体基因组的拷贝数为1.5;1;2.5;2,得到平均1.8±1.2个拷贝。
不含USR的构建在5个例子中每单倍体基因组的拷贝数为2;1;1;1.5;0.5,得到平均1.2±0.5个拷贝。
应该提到,含USR的构建体的分散度明显更高。这说明可以保证转化基因的表达以充足的方式以更宽的转基因构型范围例如也以相当高或相当低的拷贝数存在。
也已证实,用根据本发明所述的构建体,特别是当它们以适当位置整合到基因组中时,可以实现拷贝数的增加(见构建体8-A的结果)。
2.2构建两个DNA构建体,这两个DNA在充分鉴定的CaMV35S启动子的控制下表达报告基因β-葡糖苷酸酶基因(gus)。另外邻近此基因,USR序列或者存在或者缺失(见图9A和B)。
图9B中所示的载体通过在pBIB Hyg的nos终止子和(Becker等,1990)hyg基因之间的多聚核苷酸接头中导入含有源于pRTgus[Topfer等(1993)“在双子叶植物和单子叶植物中高水平表达基因的表达载体”,酶学方法,217,66-78)的嵌合CaMV35S-gus基因的DNA片段得到构建。构建图9A中所示的载体通过将含有从SEQ ID NO1的596至2862位核苷酸的DNA序列的EcoRⅠ-SalⅠDNA片段导入图9B中的载体得到构建,插入方式是最初定位PolⅠ启动子邻近的核糖体DNA片段的末端现在定位于CaMV35S启动子附近。
对转基因愈伤组织材料中转化基因编码的酶活性进行评估,将转基因愈伤组织材料(2至25mg)在200μl抽提缓冲液[50mM硫酸钠(PH7),10mM 2-巯基乙醇,10mM EDTA,0.1%SDS,0.1%Triton X-100]中匀浆。离心(10分钟,4℃,18000rpm)后,测定活性。然后,加入对-氨基苯-β-葡萄糖醛酸(pNPG;2mM)并于37℃,温育10至30分钟。通过加入0.2M碳酸钠终止反应(Gallagher编,GUS方案,AcademicPress,1992的修饰方案)。
含USR和不含USR的构建体的比较(用每克鲜重的转化愈伤组织的相对酶单位表示)含USR的构建体测量的活性为2.3;6.9;11.2;0.3;1.2;0.3;1.0;2.3;2.0;平均3.1±2.8。
不含USR的构建体测量的活性为0.1;1.6;0.0;1.1;0.6;0.2;0.6;1.5;0.8;平均0.7±0.4。
非常明显,含USR不仅活性的平均水平更高(差异因子4),而且活性的分散度也更大。进一步而言,用含USR的构建体没有出现表现极低活性水平的(例如0.0或0.1)愈伤组织。由此得出结论,可以以稳定的方式得到更大范围的转基因活性。
在此也已证明,通过根据本发明所述的构建体在某一位置的整合可以达到更高的表达水平(根据图9A,见含USR构建体的活性从6.9到11.2)。这种明显增强的活性可能是因为r-DNA为转录创造了满意的染色质环境。
转基因构型的更宽范围稳定并允许基因表达的另一原因明显是以下事实,即r-DNA阻碍了染色质例如通过同源区域配对抑制、同源重组抑制、常染色质中存在的甲基化抑制的正常调控机制。
当一些单位以串联重复序列存在或在基因组上一些位点存在时,在核糖体DNA的某些序列存在的情况下,可以保证转基因活性以更高的拷贝数导致更高的表达。实施例3对用根据本发明所述的DNA构建体转化的玉米植物进行分析使用对应于保守的25S成熟rRNA编码区的3’末端和保守的18S成熟rRNA编码区的5’末端的寡聚核苷酸(使用可从EMBL数据库录入号X03990得到的序列),通过PCR扩增玉米的rRNA基因间隔区。设计寡聚核苷酸以在扩增片段的末端包含适当的限制性位点。
正如WO92/09696中所述的,将片段克隆到与编码膦丝菌素乙酰转移酶(bar编码的PAT)的区域可操作连接的CaMV35S启动子区上游,方向是邻近成熟18S rRNA编码区的基因间隔区现在邻近嵌合的bar基因。将含基因间rDNA和嵌合的bar基因的DNA构建体插入到T-DNA载体pGSV5的边界间(在WO97/13865中描述)。
然后按照WO92/09696或EP0469273中所述的方法将DNA构建体整合入玉米核基因组中。
对转基因玉米种系进行表达水平(通过PAT活性水平的测定)和转基因拷贝数(通过Southem杂交)分析。用含基因间重复序列的DNA构建体所转化的种系的平均拷贝数和嵌合bar基因的平均表达水平高于用不含基因间重复序列的DNA构建体所转化的对照种系。实施例4对用根据本发明所述的DNA构建体转化的油籽油菜植物进行分析使用对应于保守的25S成熟rRNA编码区的3’末端和保守的18S成熟rRNA编码区的5’末端的寡聚核苷酸(使用相关种系的序列如一个可从EMBL数据库录入号X60324得到的序列),通过PCR扩增油籽油菜rRNA基因间隔区。设计寡聚核苷酸以在扩增片段的末端包含适当的限制性位点。
正如WO92/09696中所述的,将片段克隆到与编码膦丝菌素乙酰转移酶(bar编码的PAT)的区域可操作连接的CaMV35S启动子区上游,方向是邻近成熟18S rRNA编码区的基因间隔区现在邻近嵌合的bar基因。将含基因间rDNA和嵌合的bar基因的DNA构建体插入到T-DNA载体pGSV5的边界间(在WO97/13865中描述)。
然后按照WO97/13865中所述的方法将DNA构建体整合入籽油油菜核基因组中。
对转基因油籽油菜种系进行表达水平(通过PAT活性水平的测定)和转基因拷贝数(通过Southern杂交)分析。用含基因间重复序列的DNA构建体所转化的种系的平均拷贝数和嵌合bar基因的平均表达水平高于不含基因间重复序列的DNA构建体所转化的对照种系。
序列表(1)基本信息(ⅰ)申请人(A)名称Plant Genetic System N.V.
(B)街名Jozef Plateaustraat 22(C)城市Gent(D)国家比利时(E)邮政编码(ZIP):B-9000(F)电话32-9-2358454(G)传真32-9-2231923(ⅱ)发明名称DNA构建体和使用这些DNA构建体合成蛋白质的方法(ⅲ)序列数目6(ⅳ)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release #1.0,版本#1.30(EPO)(2)关于SEQ ID NO:1的信息(ⅰ)序列特征(A)长度5373个碱基对(B)类型核酸(C)链型双链(D)拓扑结构线形(ⅱ)分子类型DNA(基因组)(ⅲ)假设无(ⅳ)反义无
(ⅵ)原始来源(A)生物拟南芥(ⅸ)特征(A)名称/关键-(B)位置1..485(D)其它信息/备注=“25S rDNA 3’末端”(ⅸ)特征(A)名称/关键-(B)位置486..5211(D)其它信息/备注=“基因间隔区”(ⅸ)特征(A)名称/关键-(B)位置1263..1557(D)其它信息/备注=“SalⅠ元件盒1”(ⅸ)特征(A)名称/关键-(B)位置1883..2177(D)其它信息/备注=“SalⅠ元件盒2”(ⅸ)特征(A)名称/关键-(B)位置2503..3003(D)其它信息/备注=“SalⅠ元件盒3”(ⅸ)特征(A)名称/关键-(B)位置5212..5373(D)其它信息/备注=“18S rDNA 5’末端”(ⅹⅰ)序列描述SEQ ID NO:1:GAATTCACCA AGTGTTGGAT TGTTCACCCA CCAATAGGGA ACGTGAGCTG GGTTTAGACC 60GTCGTGAGAC AGGTTAGTTT TACCCTACTG ATGCCCGCGT CGCGATAGTA ATTCAACCTA 120GTACGAGAGG AACCGTTGAT TCGCACAATT GGTCATCGCG CTTGGTTGAA AAGCCAGTGG 180CGCGAAGCTA CCGTGCGCTG GATTATGACT GAACGCCTCT AAGTCAGAAT CCGGGCTAGA 240AGCGACGCAT GCGCCCGCCG CCCGATTGCC GACCCTCAGT AGGAGCTTAG GCTCCAAAGG 300CACGTGTCGT TGGCTAAGTC CGTTCGGCGG AACGGTCGTT CGGACCGCCT TGAATTATAA 360TTACCACCGA GCGGCGGGTA GAATCCTTTG CAGACGACTT AAATACGCGA CGGGGTATTG 420TAAGTGGCAG AGTGGCCTTG CTGCCACGAT CCACTGAGAT TCAGCCCTTT GTCGCTAAGA 480TTCGACCCTC CCCTAAATCA CTCCAAAAAA AACAATCCCC AATTCTACAC AAGTGTTTCT 540ACACTAACAA AGCAACAGCT CCTTAACGAA TTCCCAACTT TACACGAGCT CGTCTCTCGA 600GGTTAAATGT TATTACTTGG TAAGATTCCG GACCTCGCCA AGTGTTTTGA AAACCCGCAA 660CGCTCGCAAA GGTGGATAGT GAGAATAATA AGTGAAGAGA CAGACTTGTC CAAAACGCCC 720ACCACGAAGG TGCATAGTGA GAAGAGTAAG TCAAGAGATA GACTTGTCCA AAAAGAAACG 780GAAGAGAAAG CGTGGGGAGA CGCTCACGAA GGTGCATAGT GAGAAGAGTA AGTCAAGAGA 840CAGACTTGTT CGAAAAGAAA CAGAAGAGAA TGCTTGGGGT TACACTCACG AAGGTGCATA 900GTGAGAAGAG TAAGTCAAGA GACAGACTTG TTCGAAAAGA AACAAAAGAG AATGCTTGGG 960GAGATAGAAG TGTGAGATAG TTCTCAAGcT AAGAAAGTTG TAAAAGCTAA GAACTAGCAT 1020CAAATGATGG ATGAAACACA AGGTAGTTGT TGAAAAGTCA AACACTTGGT GATATGAACA 1080CAAACGTTCA ATATGACAAA CCCATGCCAA GTAAAGAGAA AATGAAAACT GGTGATTGTT 1140GCGGAAATCG TCCAGGATTC CTCGACCAGG ACTTGAAATC GTCGAGGGGA AAAAATCGGT 1200TCCGAGGAAT CGTCGATCCG GACTTGGAAT CGTCGAGAAA AGTTTACCGG GTCCGAGGAT 1260TTGTCGACCA GGAGTGGAAA TCGTCGAGAA AAATCTATCG GGTCCGAGGA ATCGTCGACC 1320AGGACGAGGA ATCGTCGACC GGGTCCGAGG ATTTGTCGAC CAGGGGTTGA AATCGTCGAC 1380CAGGTCCGAG ACTTCATCGA CCGGGTCCGA GGATTCGTCG ACCAGGAGTG GAAATCGTCG 1440AGAAAAATCT ATCGGGTCCG AGGAATCGTC GACCAGGACG AGGAATCGTC GACCGGGTCC 1500GAGGATTTGT CGACCAGGTC CGAGACTTCA TCGACCGGGT CCGAGGATTC GTCGACCAGG 1560TCCGAGACTT CATCGACCGG GTCCAAGTAT TTGATTTTAT TTTGGAACCG GTGTCTCCTC 1620AGACATTTCA ATGTATGTTG GTGCCAAGAG GGAAAAGGGC TATAAAGCTA TATAGGGGTG 1680GGTGTGTGTA GTGGGAATTT TGCCCGCACG CGCGCGCGCG AATAAGAATA AGAATAAGTA 1740ATAAGAATAA GAATAAGAAA AAGAAAAAAA AAAAAAAAAA AAAAAAACAA AAACTCCATA 1800GAGTTGTTTT CTCAATCGGG TCCGAGGAAT CGTCGATCTG GACTTGGAAT CGTCGAGAAA 1860AGTTTACCGG GTCCGAAAAT TTGTCGACCA GGAGTGGAAA TCGTCGAGAA AAATCTATCG 1920GGTCCGAGGA ATCGTCGACC AGGACGAGGA ATCGTCGACC GGGTCCGAGG ATTTGTCGAC 1980CAGGGGTTGA AATAGTCGAC CAGGTCCGAG ACTTCATCGA CCGGGTCCGA GGAATCGTCG 2040ACCAGGAGTG GAAATCGTCG AGAAAA TCT ATCGGGTCCG AGGAATCGTC GACCAGGACG 2100AGGAATCGTC GACCGGGTCC GAGGATTTGT CGACCAGGTC CGAGACTTCA TCGACCGGGT 2160CCGAGGATTC GTCGACCAGG TCCGAGACTT CATCGACCGG GTCCAAGTAT TTGATTTTAT 2220TTTGGAACCG GTGTCTCCTC AGACATTTCA ATGTATGTTG GTGCCAAGAG GGAAAAGGGC 2280TATAAAGCTA TATAGGGGTG GGTGTGTGTA GTGGGAATTT TGCCCGCACG CGCGCGCGCG 2340ATAAGAATAA GAATAAGTAA TAAGAATAAG AATAAGAAAA AGAAAAAAAA AAAAAAAAAA 2400ACAAAAACAA AAACTCCATA GAGTTGTTTT CTCAATCGGG TCCGAGGAAT CGTCGATCTG 2460GACTTGGAAT CGTCGAGAAA AGTTTACCGG GTCCGAAAAT TTGTCGACCA GGAGTGGAAA 2520TCGTCGAGAA AAATCTATCG GGTCCGAGGA ATCGTCGACC AGGACGAGGA ATCGTCGACC 2580GGGTCCGAGG ATTTGTCGAC CAGGGGTTGA AATCGTCGAC CAGGTCCGAG ACTTCATCGA 2640CCGGGTCCGA GGAATCGTCG ACCAGGACGA TGAATGGTCG ATGAAAATCT ATCGGGTTCG 2700AGGAATGGTC GACCAGGGGT TGAAATCGTC GACCAGGTCC GAGACTTCAT CGACCGTGTC 2760CGAGGAGTGG TCGAGGGTTT GTCGACCAGG ACGAGGAATC GTCGACCGGG TCCGAGGATT 2820TGTCGACCAG GGGTTGAAAT CGTCGACCAG GACCGAGAAT TCGTCGACCA GGACGGCGGA 2880ACCCTCGACC AGGACGATGA ATGGGCGATG AAAATCTATC GGGTTCGAGG AATGGTCGAC 2940CAGGGGTTGA AATCGTCGAC CAGGTCCGAG ACTTCATCGA CCGGGTCCGA GGATTCGTCG 3000ACCAGGACGG CCGGATGTCC GAGAAAAAAA AATGTTGCCG AATAACTTTC GAAAATCATT 3060GGATATGATG CAATGTTTTG TGATCGAATC TCTTAAAATA CATCAATAAA GAGTTTAGGA 3120TGTCAAGTTT GCATCAAATA TGCCCACGGA GCCCCAACTA GACCATGAAA ATCCGATGTT 3180GTATCAGGTC AAATGACCTA GCTAGAGGTG TCAAAAAATT ATGAAAATTT ACCAGAAAAT 3240AGGATTTAGT ATCCTTATGA TGCATGCCAA AAAGAATTTT CAAATTCCAA GTATTTCTTT 3300TTTCTTGGCA CCGGTGTCTC CTCAGACATT TCAATGTCTG TTGGTGCCAA GAGGGAAAAG 3360GGCTATTAAG CTATATAGGG GGGTGGGTGT TGAGGGAGTC TGGGCAGTCC GTGGGGAACC 3420CCCTTTTTCG GTTCGGACTT GGGTAGCGAT CGAGGGATGG TATCGGATAT CGGCACGAGG 3480AATGACCGAC CGTCCGGCCG CCGGGATTTT CGCCGGAAAA CTTTTCCGGG CACTTTTCCG 3540GCGATCGGTT TTGTTGCCTT TTTCCGAGTT TTCTCAGCAG TTCTCGGACA AAAACTGCTG 3600AATCGTCGAG GAGAATGGGC TTGCTTGCGT GGGCTGCCAT TAGTTCTTCG AGGCGTTAGG 3660GTGGCGGCGG TATAAAAGTG TCGGAGTTTT TTCAGCAGTT CTCGGACAAA AATTGCTGAG 3720TGGCCGAGAA GAATGGGCGT GTCATGCGTG GGCTGACATG GATTCTTCGA GGCCTAGGGG 3780TGGCGGTATA TAACTTGTTC GCATGATATT ACCGAGATGT CCCCACGGGC ATCTTTTCAC 3840CTCGTCGCCG AAGAGAATGG GCGTGTCATG GCATGGGCTG ACATGGATTC TCCTAGGCCG 3900TTTGGGTGGC GGTATAGTCG TCTTGCGCAC GAAATACCGA GATGTCCCCA TGGGCATCGA 3960TTCCACCCGC CTAGGTTGGA TGGGCGTGCT TCGTCGGAAA GCATGGATCC GCCTAGGCTG 4020TCCCGAGTGT GAGCGAGGTG TGAGTGTCGC CCATGGGCAT CGACACCTTG CGGCTAGGAA 4080CTGGAACGAG ACGGGTGGCA AAGATTTCGA GTAGCACTTC ATACTACCGT GGGTTTTTTA 4140AACCTTCCGA GTTTTGTTGA TGTTATTCCG AGAATTAGCA AACCGTAACG AAGATGTTCT 4200TGGCAACCAT CTTTTGATGG GAGTCCGGCT GTTCGATAGC CGGCCAAGGG TGATGAACGA 4260AATGTGAACC CTTGTCTCGC CTAGGTTGGA TGGGCGTGCT TCGTTGGAAA GCATGGATCC 4320GCCTAGGCTG TCCCGAGTGT GAGCGAGGTG TGAGTGTCGC CCATGGGCAT CGACACCTTG 4380CGGCTAGGAA CTGGAACGAG ACGGGTAGCA AAGATTTCGA GTAGCACTTC ATACTACCGT 4440GGGTTTTTTA AACCTTCCTA GTTTTGTTGA TGTTATTCCG AGAATTAGCA AACCGTAACG 4500AAGATGTTCT TGGCAACCAT CTTTTGATGG GAGTCCGGCT GTTCGAAAGC CGGCCAAGGG 4560TGATGAACGA AATGTGAACC CTTGTCTCGC CTAGGTTGGA TGGGCGTGCT TCGTTGGAAA 4620GCATGGATCC GCCTAGGCTG TCCCGAAGTA TCTCGCGCTT GTACGGCTTT GGCTCGGATT 4680CGTCCGTCTT CTTTCTTCTT AGCCGAGTAC TTCGGTAGAT TAGTTGGAAC GATTGATGAT 4740TTTGAGTTAA TTGAACGTTC GGCGTATGAG TGGTGATCGG ATAGCTAGTG TTCGTAGGCT 4800CCATGCTCGC GCATCGAACT ACCTACCACC TATCCTTCTC AGTTAATTCA CGGGCGATGT 4860TACGCTCGAT GATGAGTTCC GGGGCCTGTG TTTCGTACCT AATTTGAAGG AATTGTTGAG 4920TTTGGTTTAC ACCTTTGCCC GCGGCTTCTC CTTCGTGGGG AAGTCGTGGG CTCAAACATC 4980GGCGCTTGTT CACCTCTCGT CATCGCATTT GTTGCCTTGC TCGCATTGGT GAATGAGTTG 5040CGGGTTGAAA TCTCGGATGC GGAAAAGTTG TCGACGGTGA CTCGAAGTGA TTCAGTCCCG 5100CCAAAGCTCA TCCGTCCTTC GGGCAAAAGA TGACGGTCAA GACCTCGTCC TTTCTCTCTT 5160TCCATTGCGT TTGAGAGGAT GTGGCGGGGA ATTGCCGTGA TCGATGAATG CTACCTGGTT 5220GATCCTGCCA GTAGTCATAT GCTTGTCTCA AAGATTAAGC CATGCATGTG TAAGTATGAA 5280CGAATTCAGA CTGTGAAACT GCGAATGGCT CATTAAATCA GTTATAGTTT GTTTGATGGT 5340AACTACTACT CGGATAACCG TAGTAATTCT AGA 5373(2)关于SEQ ID NO:2的信息(ⅰ)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ⅱ)分子类型其它核酸(A)描述/描述=“寡聚核苷酸”(ⅹⅰ)序列描述SEQ ID NO:2:CCAAGGTAAC CTTCGACGT 19(2)关于SEQ ID NO:3的信息(ⅰ)序列特征
(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ⅱ)分子类型其它核酸(A)描述/描述=“寡聚核苷酸”(ⅹⅰ)序列描述SEQ ID NO:3:CGAAGGTTAC CTTGGACGT 19(2)关于SEQ ID NO:4的信息(ⅰ)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ⅱ)分子类型其它核酸(A)描述/描述=“寡聚核苷酸E”(ⅹⅰ)序列描述SEQ ID NO:4:GAAGACGTCG AAGGTTACCT TGG 23(2)关于SEQ ID NO:5的信息(ⅰ)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ⅱ)分子类型其它核酸
(A)描述/描述=“寡聚核苷酸Q”(ⅹⅰ)序列描述SEQ ID NO:5:CCCGGTTCGC TCGCCGTTAC TAAG24(2)关于SEQ ID NO:6的信息(ⅰ)序列特征(A)长度236个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线形(ⅱ)分子类型其它核酸(A)描述/描述=“拟南芥25S rDNA的5’末端”(ⅸ)特征(A)名称/关键-(B)位置1..10(D)其它信息/备注=“5S rDNA的3’末端”(ⅸ)特征(A)名称/关键-(B)位置198..236(D)其它信息/备注=“25S rDNA的3’末端”(ⅸ)特征(A)名称/关键-(B)位置220(D)其它信息/备注=“以前推测的25S rDNA的5’末端”(ⅹⅰ)序列描述SEQ ID NO:6:GGTGTCACAA ATCGTCGTCC CTCACCATCC TTTGCTGATG CGGGACGGAA GCTGGTCTCC 60CGTGTGTTAC CGCACGCGTT GGCCTAAATC CGAGCCAAGG ACGCCTGGAG CGTACCGACA 120TGCGGTGGTG AACTTGATCC ATTACATTTT ATCGGTCGCT CTTGTCCGGA AGCTGTAGAT 180GACCCAAAGT CCATATAGCG ACCCCAGGTC AGGCGGGATT ACCCGCTGAG TTTAAG 23权利要求
1.一种DNA构建体,该构建体包含下述可操作相连的DNA片段-包含核糖体DNA序列的DNA片段,优选地来源于植物;-包含可表达的启动子区的片段,尤其是植物-可表达的启动子区;-异源编码区;选择性地-转录终止和多聚腺苷酸化区域,优选在植物细胞中有活性的区域。
2.根据权利要求1所述的DNA构建体,其中所述的植物-可表达的启动子区是由RNA聚合酶Ⅱ识别的启动子。
3.根据权利要求1所述的DNA构建体,其中所述的核糖体DNA包含启动子。
4.根据权利要求1到3中任意一项所述的DNA构建体,其中所述的核糖体DNA序列来源于包含DNA构建体的植物。
5.根据权利要求1到4中任意一项所述的DNA构建体,其中所述的核糖体DNA序列来源于核糖体DNA的基因间隔区。
6.根据权利要求5所述的DNA构建体,其中所述的核糖体DNA序列包含来自拟南芥核糖体DNA基因间隔区的上游SalⅠ重复序列或来自其它植物的相似区域。
7.根据权利要求1到4中任意一项所述的DNA构建体,其中所述的核糖体DNA序列所包括的DNA序列选自从SEQ ID NO:1的486位核苷酸至5212位核苷酸的DNA序列,从SEQ ID NO:1的1263位核苷酸至3003位核苷酸的DNA序列,从SEQ ID NO:1的569位核苷酸至2862位核苷酸的DNA序列,从SEQ ID NO:1的1263位核苷酸至2862位核苷酸的DNA序列,从SEQ ID NO:1的486位核苷酸至5212位核苷酸的DNA序列,从SEQ IDNO:1的596位核苷酸至5373位核苷酸的DNA序列。
8.根据权利要求1到7中任意一项所述的DNA构建体,其中所述的异源编码区编码疫苗、抗体、治疗蛋白、杀昆虫蛋白如Bt毒素或其最小毒性片段、用于食品技术的蛋白、反义RNA或核酶。
9.根据权利要求1所述的DNA构建体,其中DNA构建体包含在T-DNA转化载体中。
10.一种合成蛋白质的方法,包括如下步骤-将权利要求1到9中任意一项所述的DNA构建体导入适合的宿主生物体;-在允许异源编码区编码的蛋白表达的条件下培养宿主生物体;并且-收集表达的蛋白质。
11.一种特别是在植物细胞中增强转化基因的稳定性、拷贝数或表达的方法,包括如下步骤-将权利要求1到9中任意一项所述的DNA构建体导入细胞,优选地植物细胞中;并且-从转化的细胞再生生物体,优选植物。
12.根据权利要求11所述的方法,其中所述的植物选自拟南芥、马铃薯、玉米、小麦、番茄、水稻、大豆、大麦、黑麦、芸苔属种类、甜菜属种类或木薯。
13.一种包含整合在核基因组中的根据权利要求1到9中任意一项所述的DNA构建体的细胞,优选植物细胞。
14.根据权利要求13所述的植物细胞,其中所述的植物细胞来源于拟南芥、烟草、玉米、小麦、马铃薯、水稻、大豆、大麦、黑麦、芸苔属蔬菜、甜菜属种类或木薯。
15.一种含有根据权利要求13所述的细胞的植物。
16.包含植物核糖体DNA基因间隔区的DNA片段的用途,用于增强植物中转化基因的稳定性、拷贝数或表达。
全文摘要
提供了包含如下片段的DNA构建体:核糖体DNA、启动子区和异源编码区;使用这些DNA构建体合成蛋白质和增加拷贝数和表达的方法;和包含这些构建体的宿主生物体,特别是植物。
文档编号C12N5/10GK1231698SQ97198212
公开日1999年10月13日 申请日期1997年9月23日 优先权日1996年9月24日
发明者A·巴赫迈尔, D·施瓦泽 申请人:植物遗传系统公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1