合成杀虫的晶状蛋白质基因的制作方法

文档序号:3551319阅读:490来源:国知局
专利名称:合成杀虫的晶状蛋白质基因的制作方法
本申请是1989年9月9日提交的CN 89107153.9的分案申请。
本发明涉及细菌分子生物学,更具体地说,涉及采用重组技术的基因工程,以防止植物遭受虫害。这里所揭示的是源自苏云金杆菌tenebrionis变种(Btt)的经修饰的晶状蛋白质基因的化学合成,以及这一合成的杀虫基因的选择性表达。还揭示了将经克隆的合成基因转移到一个宿主微生物中,所提到的生物体能够在经改进的表达水平上生产一种对昆虫具有毒性的蛋白质。本发明使通过细菌和植物的基因工程,获得所需要的具有农业价值的新型毒素的表达水平。
苏云金杆菌(Bt)是唯一能在孢子形成过程中产生蛋白质晶状内涵物,后者被认为对于几种农业上重要的害虫具有很高的毒性。不同的Bt菌株的晶状蛋白质具有相当窄的宿主范围,因此在商业上被用作为选择性严格的生物杀虫剂。许多Bt菌株对于鳞翅目昆虫和双翅目昆虫是有毒的。最近报导了Bt的两个亚种(或变种)是鞘翅目昆虫的至病菌tenebrionis变种(Krieg等人(1983)Z.Angew,Entomol.96500-508)和san diego变种(Herrnstadt等人(1986)Biotechnol.4305-308)。两种菌株产生扁平,矩形的晶状内涵物并具有64-68KDa(千道尔顿)的主要晶体组分(Herrnstadt等人,上述;Bernhard(1986)FEMS Microbioc.Lett.33261-265)。
已克隆了Bt的几个亚种的毒素基因,且发现重组的克隆对鳞翅目昆虫的幼虫具有毒性。两种对鞘翅目昆虫具有活性的毒素基因也已被分离和表达。Herrnstadt等人(上述)克隆了一个5.8Kb(千碱基对)的Bt san digeo变种DNA的Bam HI片段。在E.Coli中表达的蛋白质对P.Luteola(榆木叶甲虫)有毒性,其分子量约为83KDa。从san diego变种基因中得到的这种83KDa的毒素产物比从Bt san diego变种细胞中分离出来的64KDa晶状蛋白质大,表明Bt san diego变种晶状蛋白质在形成一个晶体前被合成为一个较大的前体分子,它是由Bt san diego变种而不是E.Coli加工完成的。
Sekar等人(1987)在Proc.Nat.Acad.Sci.USA847036-7040;美国专利申请第108,285号(1987年10月13日提出)中从Btt中分离得到晶状蛋白质基因并测定了核苷酸顺序。该晶状蛋白质含有一个5.9Kb的Bam HI片段(pN SBF 544)。含有源自pN SBF 544的3Kb Hind III片段的亚克隆被构建。该Hind III片段含有一个编码约73KDa的644个氨基酸多肽的开放式阅读框架(ORF)。两种亚克隆的提取物对科罗拉多土豆甲虫(Leptinotarsa decemlineata,一种鞘翅目昆虫)的幼虫有毒性。与抗tenebrionis变种蛋白质的抗血清有交叉反应的73-和65KDa的肽在E.Coli中表达产生。孢子形成的tenebrions变种细胞含有与pN SBP 544的ORF的产物相应的免疫反应性73KDa肽。但是,所分离的晶体主要包含65KDa组分。当晶状蛋白质基因的N-末端区被缩短时,所得到的主要的蛋白质产物是65KDa肽。缺失衍生物p544 Pst-Met5系用酶从5.9Kb BamH I片段的N-末端移去46个氨基酸残基而衍生得到的。N-末端缺失衍生物p544Pst-Met5的表达导致几乎全部产生65KDa蛋白质。最近,Me Pherson等人(1988)在Biotechnology 661-66中证明了Btt基因在同一个阅读框架中含有两个功能性转译启始密码子,导致全长蛋白质和N-末端截短的形式均被产生。
从几个Bt菌株中得到的嵌合毒素基因已在植物中表达。在土壤杆菌TR-DNA的2’启动子的控制下的得自berliber变种1715的四种经修饰的Bt2基因被转移至烟草植物中(Vaeck等人(1987)Nature 32833-37)。当截短的基因在基因转移的植物中表达时,毒素产生了杀虫能力。但是,在基因转移的植物中稳定状态mRNA浓度是如此之低,以至它们不能用Northern印迹分析法而可靠地检测,因此要采用核糖核酸酶保护实验进行定量。在产生最高水平蛋白质的植物中Bt mRNA的水平与约0.0001%的poly(A)+mRNA相当。
在Vaeck等人(1987)(上述)的报导中,将含有完整Bt2编码顺序的嵌合基因的表达与含有截短的Bt2基因的表达进行比较。此外,一些T-DNA结构包括可在植物中用作选择性标记的嵌合NPTII基因,而其它结构则携带Bt2和NPTII基因片段之间的转译融合物。当截短的Bt2基因或融合结构在基因转移的植物中表达时,毒素的杀虫力就产生了。暖房生长的植物产生0.02%的总可溶性蛋白质作为毒素,或每克新鲜叶组织中有约3μg毒素,甚至比该浓度低5倍,在六天喂饲测试中显示了100%的死亡率。但是,尽管由相同的启动子指导表达,采用完整的Bt2编码顺序不能获得明显的杀虫活性。在基因转移的植物叶子中完整的Bt2蛋白质和RNA产量比截短的Bt2多肽或融合蛋白的低10-50倍。
Barton等人(1987)在Plant Physiol.851103-1109中显示了在包含一个35S启动子,一个病毒(TMV)前导顺序,Bt HD-14.5Kb基因(编码两个脯氨酸残基前的645个氨基酸的蛋白质)和兰曙红合成酶(nos)聚腺苷酸顺序的系统中,一个Bt蛋白质进行表达。在这些条件下,可观察到Bt mRNA的表达水平高达47Pg/20μg RNA和12ng/mg植物蛋白质。在植物组织中这个数量的Bt蛋白质2开内可产生100%的死亡率。这一表达水平仍表示了一个低的水平的mRNA(2.5×10-4%)和蛋白质(1.2×10-3%)。
各种杂交蛋白质,含有与NPTII融合的长度增加的Bt2蛋白质的N-末端片段,由Hofte等人[(1988)FEBS Lett.226364-370]在E.coli中制得。含有Bt2的最前面607个氨基酸的融合蛋白显示出杀虫活性;不含有这个最少的N-末端片段的融合蛋白则无毒性。NPTII活性的表现不依赖杀虫活性的存在;但是,Bt2多肽的结构对于融合的NPTII蛋白质的酶活性有重要的影响。该研究表明Bt2多肽的球形3-D结构在截短的多肽中受到干扰。
一些研究者试图在酵母(Neill等人(1987)Gene 55303-317’Rothstein等人(1987)Gene 55353-356;Coraggio等人(1986)EMBO J.5459-465]和E.Coli[Fuzakawa等人(1987)FEBS Lett.224125-127;Vies等人(1986)EMBO J.52439-2444;Gatenby等人(1987)Eur.J.Biochem.168227-231]中表达植物基因。
就小麦α-醇溶蛋白[Neill等人(1987),supra)、α-淀粉酶基因(Rothstein等人(1987),supra)和玉米醇溶蛋白基因(Coraggio等人(1986)supra)来说,已报导了其在酵母中的低水平表达。Neill等人提出α-醇溶蛋白在酵母中的低水平表达部分原因可归咎于密码子使用不当,因为α-酵溶蛋白编码Phe、Leu.Ser,Gly,Tyr尤其是Glu的密码子与大量的酵母同功tRNAs并不十分相关。但是,在E.Coli中,大豆球蛋白A2(Fuzakawa等人(1987),(上述)和小麦Ru BRC SSU(Vies等人(1986),(上述);Gatenby等人(1987),(上述)可被充分表达。
对植物中tRNA群的组成并不了解得很多。Viotti等人(1987)]在Biochem.Biopys,Acta 517125-132中报导了玉米胚乳能有效地合成玉米醇溶蛋白,后者是富含谷氨酰胺,亮氨酸和丙氨酸的贮藏蛋白,玉米胚乳tRNA的特点是其接受这三种氨基酸的能力比玉米胚胎tRNAs更强。这可能表明特定的植物的tRNA群可能适合于高表达的蛋白质,如玉米醇溶蛋白的最佳转译。据我们所知,尚未有人用实验方法改变在高表达的植物基因中的密码子的优先选择,以确定其对植物中蛋白质转译的可能影响,并检查其对表达水平的影响。
本发明的总的目的是提供一种防止植物遭受虫害的方法。这里所揭示的本发明包括一种能编码其功能与天然Bt杀虫蛋白质相关的杀虫蛋白质的化学合成的基因。该合成的基因可在植物中以比天然Bt基因更高的水平表达。较好的是,合成基因可在这里所定义的植物中高表达。合成基因以与Bt的杀虫蛋白质基因至少约有85%同源为佳。
本发明的一个特别的目的是提供一种编码杀虫蛋白质的合成的结构基因,该基因来自具有例如

图1中所表示的核苷酸顺序和1-1793的核苷酸或功能相当的1-1883的核苷酸的Btt。
在设计本发明的用于增加在植物中的表达的合成Btt基因时,天然Btt结构基因的DNA顺序被修饰,其目的是使其含有高表达植物基因所需要的密码子,获得与植物中存在的核苷酸碱基组成中相应的A+T含量,以形成一个植物启始顺序,删除引起DNA不稳定,不适当的多聚腺苷酸化,降解和终止的顺序为佳,避免构成二级发夹结构和RNA剪接位点的顺序。在合成基因中,用以编码一个所给的氨基酸的密码子是根据在高表达的植物基因中所采用的编码该氨基酸的密码子使用的分布频率而选择的。如该领域的技术人员所欣赏的,在合成基因中所用的密码子使用的分布频率是表达水平的决定因素。因此,所设计的合成基因其密码子使用的分布频率以与高表达的植物基因的分布频率的偏差不大于25%为佳,不大于约10%则更佳。此外,需要考虑简并的第三个碱基的G+C的百分含量(单子叶植物在该位置上偏向于G+C,而双子叶植物则不然)。业已认识到,XCG核苷酸是双子叶植物中最不利的密码子,而XTA密码子在单子叶和双子叶植物中均没有。本发明的合成基因较好的是还具有CG和TA二联体空缺指数,如在选择宿主植物的详细说明中所指出的,这些空缺与宿主指数极为相似。更佳地是,这些指数与宿主的指数的偏差不大于约10-15%。
本发明的Bt基因的装配是采用该领域中已知的标准技术来进行的。为了增强在某个特定的具体化的植物中的表达,Btt结构基因是采用酶用来自化学合成的寡核苷酸双螺旋片段在一个DNA载体中装配的。然后将合成的Bt基因引入植物宿主细胞并通过该领域已知的方法进行表达。在植物中的合成Bt基因表达而产生的杀虫蛋白质与对同种的昆虫具有毒性的天然Bt晶状蛋白质具有相当的功效。
图1显示了合成Btt基因的核苷酸顺序。与其不同的,存在于p544 Pst-Mef 5中的天然顺序如上所显示。在合成的顺序中,氨基酸有所改变(下划线),用丙氨酸置换2号位残基的苏氨酸,用亮氨酸置换596号位残基的终止子(stop),在C-末端接上13个氨基酸。
图2表示用于构建合成Btt基因的简单方法。片段A到M表示退火的寡核苷酸片段,它们连接起来形成具有独一剪接位点的DNA双螺旋,以便采用特定的酶装配DNA片段而获得所需要的基因。
图3是表示在构建合成的Btt基因时寡核苷酸片段的装配的示意图。每一个片段(A-M)都是用不同大小的寡核苷酸构建的,经退火和连接形成所需要的DNA片段。
下面所给出的定义是为了更清楚地说明它们在说明书和权利要求书中使用的含义和范围。
表达是指结构基因转录和转译而产生所编码的蛋白质。本发明的合成Bt基因在植物中比相应的天然Bt基因具有更高的表达水平。令该领域的技术人员欣赏的是,结构基因的表达水平受到所用的DNA调节顺序(启动子、多聚腺苷酸化位点,增强子等)和结构基因在其中表达的宿主细胞的影响。合成Bt基因和天然Bt基因的表达的比较必须采用类似的调节顺序并在相同的宿主细胞中进行。很显然,在这种比较中还必须采用类似的方法测定基因表达水平。
启动子系指在结构基因的5’末端的核苷酸顺序,它指导转录的启始。为了驱动下游基因的表达,启动子顺序是必须的,但不总是充分的。在原核生物中,启动子通过提供RNA聚合酶和其它启始和活化因子的结合位点而驱动转录。通常,启动子优先驱动下游区的转录,尽管当基因置于启动子的上游时,也有启动的活性(在低表达水平上)。转录水平通过启动子顺序而调节。因此,在构建异源启动子/结构基因的组合时。结构基因被置于启动子的调节控制下,这样,基因的表达由启动子顺序控制。启动子较佳的位置是在结构基因的上游,与转录启始位点的距离接近于自然状态下启动子和基因的距离。如该领域中所已知的,在该距离中可以存在一些变异,但不失去启动子的功能。
基因是指在合成一个蛋白质中的完整DNA部分。一个基因包括结构基因或从5’末端的转录启始密码子(通常为ATG)开始并延伸至3’末端的终止密码子(TAG、TGA或TAA)的编码部分。它还包括一个通常位于5’端或结构基因上游的启动子区,它启始和调节结构基因的表达。基因中还包括3’末端和末尾多聚腺苷酸顺序。
结构基因是一个基因的部分,包括编码蛋白质、多肽或其中一部分的DNA片段,它不包括驱动转录启始的5’端顺序。结构基因通常可以在细胞中发现或通常不在其被引入的细胞位置上,在这种情况下,它被称为异源基因。异源基因可以全部地或部分地来自该领域已知的任何来源,包括细菌基因组或附加体、真核、核或质粒DNA、cDNA、病毒DNA或化学合成的DNA。结构基因在编码区或非转译区有一个或多个修饰,它们能影响表达产物的生物活性或化学结构,表达率或表达控制的方式。这些修饰包括(但不局限于)突变、插入、缺失和一个或多个核苷酸的置换。结构基因可构成一个连续的编码顺序或它可能含有1个或多个内含子,通过适当的剪切连续。结构基因可以是来自自然存在的或合成的等多种来源的片段的组合物。结构基因也可编码融合蛋白。
合成基因是指一个结构基因的DNA顺序,其编码区的全部或大部分是化学合成的。如这里所列举的,寡核苷酸片段是采用该领域的技术人员熟知的过程合成的,经连接和退火而形成基因片段,然后用酶装配基因片段构建完整基因。如该领域的技术人员所知的,与这里所描述的合成基因的功能和结构相当的基因可采用该领域中所用的定点突变或其它有关的方法来制备。
转化是指稳定地将携带功能基因的一个DNA片段引入一个先前不含有该基因的生物体。
植物组织包括植物分化的或未分化的组织,包括(但不限于)根、芽、叶子、花粉、种子、肿瘤组织和在培养基中的各种形式的细胞,例如单细胞、原生质体、胚和胼胝组织。植物组织可以在植物本身中或在器官、组织或细胞培养基中。
植物细胞,这里所使用的植物细胞包括在植物本身中的植物细胞和在培养基中的植物细胞和原生质体。
同源性是指核苷酸或氨基酸顺序一致或接近一致。如该领域所知的,核苷酸错配可以发生在密码子的第三个或摇摆的碱基上而不引起最终多肽顺序中氨基酸的置换。同样,在基因顺序中某些区域发生少数核苷酸修饰(如置换、插入或缺失),当这类修饰所引起的氨基酸顺序的改变不改变最终产物的功能时,这些修饰是可被接受,并认为是没有意义的。业已显示出,基因顺序的全部或部分化学合成拷贝可以代替天然基因中相应的区域而不丧失基因功能。特定的DNA顺序的同源性可以由该领域的技术人员采用核酸交叉杂交试验,在该领域熟知的严格的条件下进行鉴定[如Hams和Higgens(eds)(1985)在Nucleic Acid Hybridization,IRL Press,Oxford,UK中所描述的]。同源性的程度通常用所比较的顺序间的一致性的百分数来表示。
功能相当是指功能相同或接近相同。一种合成基因产物,其对各种昆虫的毒性至少有一种与天然Bt蛋白质相同,就被认为与天然Bt蛋白质功能相当。如这里所列举的,天然和合成的Btt基因均编码65KDa,具有基本相同的氨基酸顺序和对鞘翅目昆虫具有毒性的杀虫蛋白质。本发明的合成Bt基因不与天然Bt基因功能相当,因为它们在植物中比天然的Bt基因具有更高的表达水平。
优先密码子使用的频率是指一个特定的宿主细胞使用核苷酸密码子编码一个给定的氨基酸时所表现的优先选择。为了测定特定的密码子在基因中的使用频率,以基因中该码密子出现的次数被编码基因中相同的氨基酸的所有密码子出现的次数除。例如,表1给出了Bt基因的密码子使用的频率,它是通过分析4种已知顺序的Bt基因而得到的。与其相似,宿主细胞的优先密码子使用的频率可以通过在宿主细胞表达的大量基因中优先密码子使用的平均频率而计算。这种分析局限于宿主细胞高表达的基因时则较好。例如,表1中给出了在双子叶植物和单子叶植物中高表达的基因的密码子使用的频率。双子叶植物中密码子使用是用得自列于表1中的Genbank(基因库)的154个高表达的编码顺序而计算的。单子叶植物中密码子使用是采用得自表1中的Genbank的53个单子叶核基因编码顺序而计算的(表1在实例1中)。
当为提高宿主细胞中的表达而合成一个基因时,把该基因设计成其密码子的使用频率接近宿主细胞的优先密码子使用的频率。
一个合成基因的优先密码子使用的频率与宿主细胞所采用的频率偏差百分数是这样来计算的,首先测定单个密码子使用的频率与宿主细胞使用频率的偏差百分比,然后得到全部密码子的平均偏差。如这里所定义的,该计算中包括单一密码子(即ATG和TGG)。表1中给出了合成的Btt基因(其顺序在图1中给出)的优先密码子使用的频率。在合成基因(0.10)中编码缬氨酸的优先密码子‘GTA’的使用频率与双子叶(0.12)的优先密码子的使用频率的偏差为0.02/0.12=0.167或16.7%。Btt合成基因的全部氨基酸密码子使用与双子叶植物的密码子使用的平均偏差是7.8%。通常,合成基因的密码子使用与宿主细胞的密码子使用的总平均偏差采用下列方程式计算n=1-ZXn-YnXn×100Z]]>其中Xn=在宿主细胞中密码子n的使用频率;Yn=在合成基因中密码子n的使用频率。n代表编码一个氨基酸的单个密码子,Z是密码子总数,在一个较佳的实例中它是61。所有氨基酸密码子使用的频率的总偏差以小于约25%为佳,以小于约10%则更佳。
衍生用于说明从一个来源中取得、获得、接受到、少量获得、复制得或遗传得到(用化学和/或生物方法)。衍生物可以从其初始来源通过化学或生物处理(包括但不局限于置换、添加、插入、缺失、提取、分离、突变和复制)而得到。
化学合成,涉及DNA顺序时,是指核苷酸组分在体外进行装配。DNA的标准化学合成可采用已建立的方法来完成(Caruthers,M.(1983),Methodology of DNA and RNA Sequencing,Weissman(ed),Praeger Publishers New York,Chapter I),或采用一种商店里可购的机器进行自动化学合成。
这里所用的术语设计来用于高表达是指所设计的基因的表达水平,其特定的mRNA转录本的量足以用Norther印迹定量分析,这样,它就表示相当于大于或等于约0.0001%多聚腺苷酸mRNA的特定mRNA的表达水平。迄今为止,天然Bt基因的转录水平为,其中特定mRNA的转录量不足以用Norther印迹分析来测定,但是,在本发明中,所设计的用于高表达的合成Bt基因的转录不仅可以对特定mRNA的转录本进行定量,还导致了转译产物表达的提高,它可在杀虫生物分析中测定。
晶状蛋白质或杀虫晶状蛋白质或晶状毒素是指在Bt菌株中所形成的类芽孢晶体的主要蛋白质组分。这种蛋白质对于不同种的昆虫有选择致病性。从类芽孢晶体中分离出来的主要蛋白质的分子大小因来源的Bt菌株而异。已报导了分子量约132、65、和28KDa的晶状蛋白质。已经发现,约132KDa的蛋白质是一种原毒素,它可裂解而形成约65KDa的毒素。
晶状蛋白质基因是指编码根据基因来源的Bt菌株不同而以全长原毒素或毒素形式存在的杀虫晶状蛋白质的DNA顺序。
本发明的作者观察到Bt晶状蛋白质mRNA在植物中的表达水平低,不能以常规的Norther印迹分析测得,这种低水平的Bt晶状蛋白质表达与低水平的mRNA表达相应。Bt基因在植物细胞中表达水平的提高,Bt mRNA在植物中的稳定性的增加,就可以把这些基因用作潜在的生物学控制方法。这将累积更大量的Bt mRNA并将导致植物组织中杀虫蛋白量的增加。这对于控制对Bt蛋白质有相当抗性的昆虫是必须的。
因此,本发明是基于认识到在基因转移的植物中所设计的重组杀虫蛋白质的表达水平可以通过增加稳定的mRNA转录本的表达而提高;相反地,检测这些稳定的RNA转录本可用于测定转译产物(蛋白质)的表达。本发明通过用编码来自Bt的杀虫晶状蛋白质的经改进的合成基因提供了解决杀虫蛋白质RNA在植物中低水平表达以及由此产生的低的蛋白质表达的问题。
提高Bt基因在植物中表达水平的试验集中于一些评价参数的比较研究,这些参数是基因型、基因长度、启动子的选择、植物病毒非转译RNA前导顺序的添加、内含子顺序的添加和启始密码子ATG周围的核苷酸的修饰,迄今为止,这些参数的变化尚未导致Bt蛋白质在植物中表达的明显提高。申请人出人意外地发现,基因编码区的修饰对于在植物中以所需要的水平表达Bt基因是有效的。可以采用定点突变,即用含有预期要改变的核苷酸的合成DNA双螺旋代替限制性片段而研究结构一功能关系。(Lo等人(1984),Proc,Natl,Acad.Sci,812285-2289)。但是,重组DNA技术上的最新进展,可以进行化学合成为得到所需要的功能而专门设计的一个完整的基因。因此,Btt编码区被化学合成并加以修饰以提高其在植物中的表达。基因合成还提供了设计基因的机会,使其能通过结合入许多位置的合适的限制内切酶位点而使随后的诱变变得容易。
本发明提供了一个对昆虫有毒的晶状蛋白质的合成Bt基因。如这里所列举的,该蛋白质对于鞘翅目昆虫是有毒性的。关于提高该杀虫的蛋白质在植物中的表达的最后,本发明还提供了与Btt结构基因同源的DNA片段,如这里所列举的,它与p554 Pst-Met5中的Btt结构基因有约85%的同源性。在这个具体例中,编码Btt杀虫蛋白质的结构基因是通过编码区的化学合成而得到的。在这个具体例中采用了化学合成的基因,因为它能够最容易和最有效地调节提高交叉表达水平所需要的核苷酸顺序的修饰。
如今,化学合成通常是获得所需要的经修饰的基因的较佳的方法。但是,迄今为止,尚未化学合成过植物蛋白质基因,也没有任何编码细菌蛋白的合成基因在植物中表达过。在本发明中用于合成基因的方法包括设计一个改进的编码区核苷酸顺序和装配从化学合成的寡核苷酸片段得到的基因。在设计基因时,编码对鞘翅目昆虫有毒性的65KDa多肽的天然基因编码区以从Btt亚克隆p544 Pst-Met5中得到为佳,检查这些编码区,以观察引起合成基因在植物中表达提高的可能的修饰。例如,为了有最佳的转译效率,要采用在宿主细胞中高表达的蛋白的优先密码子。
在一个单一物种的基因中密码子的优先选择与该基因编码的蛋白质的表达水平有关。在E.coli和酵母的高表达蛋白中密码子选择的倾向是最严重的。在这些生物体中,大量的同功tRNA种类和有利的同义密码子之间已被报导有很强的正相关。在一组在酵母中高表达的蛋白质中,96%以上的氨基酸仅由61个可得到的密码子中的25个所编码(Bennetzen and Hall(1982),J.Biol.Chem,2573026-3031)。这25个密码子在所有已测序的酵母基因中是优先的,但是其优先的程度随基因的表达水平而异。最近,Hoekema及其同事(1987)在Mol.Cell.Biol.72914-2924中报导了在高表达的酵母基因PGK1的5’末端,用少量密码子代替这25个优先的密码子,结果引起蛋白质和mRNA的水平降低。它们推断在高表达的基因中优先密码子选择可提高转译并且是维持酵母中mRNA的稳定性所需要的。毋容置疑,当在酵母和其它系统中建立异源基因的高表达时,密码子选择偏向的程度是要考虑的一个重要因素。
从点突变和缺失分析中所得到的实验数据表明在真核基因中特定的顺序与转录后加工、RNA不稳定、转译终止、内含子剪接等有关。这些被较好地用于本发明的合成基因中。在设计一个在植物中表达的细菌基因时,影响基因表达效率的顺序被删除。
在设计一个合成基因时,要对编码区的核苷酸顺序进行修饰,以更改合成基因的DNA碱基组成中A+T的含量,从而反映出在宿主细胞天然高表达的蛋白质的基因中所通常有的A+T含量。合成基因的A+T含量以与所说的高表达的蛋白质的基因的A+T含量相等为佳。在编码高表达的植物蛋白质的基因中,A+T含量约为55%。合成基因中A+T含量接近这个值是较佳的,它还未高到会引起RNA的不稳定并因此而降低蛋白质表达水平。A+T含量不大于约60%更佳,约55%则最佳。而且,为了最终在植物中表达,对合成基因的核苷酸顺序进行较佳的修饰,在编码区5′末端形成一个植物启始顺序。此外,尤其要加以注意的是要保证独一的限制位点在有意义的位置上,以便在合成基因的构建过程中有效地装配寡核苷酸片段以及使随后的核苷酸修饰变得容易。对天然Bt基因的编码区进行修饰的结果表明,与在天然Bt结构基因中所观察到的结果进行比较,发现较佳的合成基因在植物中的表达水平提高。
在特例中,本发明的合成Bt基因编码一个对鞘翅目昆虫有毒的Btt蛋白质。较佳的毒性肽约有598个氨基酸长,它至少与Btt多肽有75%同源性,而且如这里所列举的,它除了在2号残基处用丙氨酸置换苏氨酸外,与p544Pst-Met5所编码的蛋白质基本相同。该氨基酸的置换必然是在编码顺序的+4号位引入一个鸟嘌呤碱基的结果。
在设计本发明的合成基因时,检查编码对鞘翅目昆虫有毒的65KDa多肽的得自Btt亚克隆p544Pst-Met5的编码区,以寻找引起合成基因在植物中表达提高的可能的修饰。例如,在较佳的实例中,合成杀虫蛋白质在双子叶植物,如烟草、番茄、棉花等中表达很强,因此,在这些条件下的合成基因被设计成含有被高表达双子叶蛋白质优先使用的优选密码子。在需要在单子叶植物中提高杀虫蛋白质的表达的实例中,在设计合成基因时,要采用被高表达单子叶植物蛋白质所优先使用的密码子(在表1中给出)。
通常,在一个分类组中,不管这些基因的功能如何,基因在密码子选择上具有相似性。这样,估计一个分类组使用的所有基因密码子可通过将其所有经测序的基因的密码子频率加起来而得到。在本发明中,通过208个植物基因的分析,报导了这种种特异性密码子选择。单子叶和双子叶植物被分别进行测定以确定这些较大的分类组是否具有不同模式的同义密码子优先选择。在密码子分析中,208个植物基因编码具有广范围功能的蛋白质,它们代表6种单子叶和36种双子叶植物。这些蛋白质以不同的表达水平存在于不同的植物细胞中。
本发明中已显示了单子叶和双子叶植物同义密码子的有关使用不同。通常,在区别单子叶和双子叶植物的密码子使用模式时最重要的因素是简并的第三碱基的G+C的百分含量。在单子叶植物中,18个氨基酸中的16个在这个位置上偏向于G+C,而双子叶植物中,18个氨基酸中仅有7个在这个位置上偏向于G+C。
编码Thr、Pro、Ala和Ser的以G结尾的密码子在单子叶和双子叶植物中是要避免的,因为它们在密码子位置II上含有C。CG二核苷酸在植物中要极力地避免[Boudraa(1987)Genet.Sel.Evol.19143-154),在其它真核生物中也要极力地避免[Grantham等人(1985).Bull.Inst.Pasteur 8395-148),可能是由于包括甲基化在内的调节作用。在双子叶植物中,XCG总是最不利的密码子,而在单子叶植物中则不是这样。在大多数真核生物中,二联体TA在密码子位置II和III是要避免的,对于单子叶植物和双子叶植物均是如此。
Grantham及其同事(1986)在Oxford Surveys in Evol.Biol,348-81中提出了两种密码子选择指数来测定CG和TA二联体在密码子位置II和III中的空缺。XCG/XCC是以C作为II位碱基,以G结尾与以C结尾的三联体密码的比例,而XTA/XTT是以T作为第二个碱基,以A结尾与以T结尾的三联体的比例。这些指数已被计算后用作植物数据,见表2,并且支持了这样的结论,即单子叶和双子叶植物对这些双核苷酸的使用是不同的。
表2CG和TA二联体在密码子位置II-III上的空缺,XCG/XCC和XTA/XTT值×100分组植物 双子叶 单子叶 玉米 大豆 Ru BPC CABSSUXCG/4030 61 67 3718 22XCCXTA/3735 47 43 419 13XTTRu BPC SSU=1,5二磷酸核酮糖小亚基CAB=叶绿素a/b结合蛋白质此外,对于大豆和玉米两个品种来说,已计算了种特异性密码子使用的情况(未显示)。玉米密码子使用的模式通常与单子叶植物的相似,因为这些顺序代表了一半以上有效的单子叶顺序。玉米标本的一部分其密码子在密码子位置III上对G+C的优先倾向更为显著,另一方面,大豆密码子使用模式基本上与一般的双子叶模式相同,尽管它只表示整个双子叶标本的很小一部分。
为了确定一些高表达基因,如1,5-二磷酸核酮糖小亚基(Ru BPC SSU)和叶绿素a/b结合蛋白质(CAB)的编码方式是否比通常的植物基因的编码方式具有更大的偏向性,计算了这些基因的部分(分别为19个和17个顺序)的密码子使用情况(未显示)。RuBPC SSU和CAB库的样品的特征在于它比较大的单子叶和双子叶植物样品具有更严重的密码子XCG和XTA空缺(表2)。尽管在这些标本的一部分中,大多数基因源于双子叶(17/19和15/17),它们的密码子情况与单子叶的相同,即在简并碱基III中采用G+C。
运用所有收集的高表达基因的数据可能引起对种特异性密码子选择模式鉴别的混淆。因此,把Ru BPC SSU和CAB单个基因的密码子选择列成表。玉米和小麦基因的Ru BPC SSU和CAB的优先密码子的选择通常比双子叶植物优先密码子的选择更为严格。这是与Matsuoka等人[(1987)J.Biochem,102673-676]的结果是一致的,Motsuoka等人注意到玉米Ru BPC SSU基因以及在玉米叶中的其它两种高表达基因、CAB和磷酸烯醇式丙酮酸羧激酶有极为严重的密码子偏向性。这些基因几乎完全避免在密码子位置III上使用A+T,尽管这种密码子偏向性不象在非叶蛋白,如乙醇脱氢酶、玉米醇溶蛋白22KDa亚基、蔗糖合成酶和ATP/ADP易位体中那样显著。因为小麦SSU和CAB基因具有相似的密码子优先模式,这可能反映了一般单子叶植物叶子中这些高表达基因的模型。Lemna的CAB基因和Chlamdomonas(衣藻属)的Ru BPCSSU基因都具有对于密码子位置III上的G+C的极大的倾向性。但是,在双子叶CAB基因中,一些同义密码子(例如编码Ala的GCT、编码Leu的CTT、编码Gly的GGA和GGT)倾向于A+T简并碱基。通常,双子叶植物中Ru BPC SSU和CAB基因的G+C优先选择不如单子叶中的显著。
在设计一个在植物中表达的合成基因时,进行了删除一些影响基因表达效率的顺序的试验。如植物多聚腺苷酸化信号区(如AATAAA)、聚合酶II终止顺序(如CAN(7-9)(AGTNNAA、UCUUCGG发夹环)和植物一致剪接位点等顺序是尤其主要的,如果它们存在于天然Btt编码顺序中,则将它们修饰以删除潜在的不利顺序。
最好对Btt编码区的核苷酸顺序进行修饰以减少DNA碱基组成中A+D的含量。Btt编码区的A+T含量为64%,它比典型的植物编码区中的约高10%。因为A+T富集区往往是植物基因的间隔区和植物调节区,减少A+T含量需慎重。合成Btt基因被设计为A+T含量为55%,与在植物中通常的值一致。
在一个较佳实例中,对Btt编码顺序的第四个核苷酸位置进行了单一修饰(以鸟嘌呤置换腺嘌呤)以形成一段顺序,它与被确信在表达最佳时其功能为植物启动顺序的顺序相一致。(Taylor等人(1987)Mol.Gen.Genet,210572-577)。此外,在本发明的实例中,在合成基因的编码区加入39个核苷酸(13个密码子),以使初级转录本稳定。但是,业已发现,没有这个含39个核苷酸的延长多肽时,也能得到同样稳定的转录本。
为提高表达而构建合成Bt基因时,并不是所有上述的天然Bt基因修饰都必须进行的。例如,除了提高表达外,合成基因还可以为其它目的而合成。在这些情况下,天然Bt基因的原始顺序可以保留在一个DNA片段内,这一片段相应于一个或多个(但不是全部)用于构建合成基因的片段。根据基因的设计目的,修饰可能包括用一个天然Bt顺序的相应区来置换一个或多个(但不是全部)用于构建合成基因的寡核苷酸片段。
如在合成基因领域中的技术人员所共知的(Mandecki等人(1985)Proc.Natl.Acad.Sci.823543-3547;Feretti等人(1986)Proc.Natl.Acad.Sci.83599-603),合成的DNA顺序可以被分成几个长度的片段,这些片段可以被方便地,而不过分复杂地合成。如这里所列举的,在制备合成的Btt基因时,编码区被分成13个片段(A-M)。每一个片段在粘性末端都具有单一的限制性顺序。例如,片段A的长度为228个碱基对,它由6个各含有约75个碱基的寡核苷酸片段构成。单链寡核苷酸退火并连接而形成DNA片段。在互补寡核苷酸片段中凸出的粘性末端的长度是4-5个残基。在发展的基因合成方法中,所设计的用于连接寡核苷酸片段和DNA片段的位点不同于基因中的限制性位点。
在一个特例中,每一个DNA片段都被克隆入一个pIC-20载体中进行DNA扩增。在这个阶段,每一个片段的核苷酸顺序都通过双脱氧法,以重组噬菌体DNA为模板、经选择的合成寡核苷酸为引物而进行测定。
如这里所列举的和图3、4中所示的,每一个独立的片段(如片段M)在侧面限制性位点被从克隆载体中切下并被拼接到含有片段A的载体中。为了增加效率,常常以加入成对的片段来代替加入单个片段。这样,在载有片段A的原始质粒中构建了完整的基因。测定完整基因的核苷酸顺序,发现其与图1中所显示的顺序完全对应。
在较佳的实例中,与天然Btt结构基因相比,合成Btt基因在植物中表达水平提高。要达到那样的结果,合成的结构基因要与植物中的功能启动子相结合,结构基因和启动区互相之间要处于这样的位置与取向,即结构基因可以在一个细胞中表达,而启动子区在该细胞中又是有活性的,由此可形成一个功能基因。启动子区包括(但不局限于)细菌和植物启动子区。为了表达启动子区/结构基因的组合,细胞中要包含携带该组合的DNA片段。植物细胞中含有包括植物启动区在内的组合,它们也可依次包含于植物或种子中。细菌,如Bt或E.Coli中含有包括细菌启动区在内的组合。该领域的技术人员将认识到,在除细菌外的几类微生物中的表达在一些情况下可能是合意的,容易的,而不需要复杂的实验,可得到目前的结果。
携带一个合成结构基因的重组DNA分子在启动子控制下可通过该领域的技术人员已知的任何方法引入植物组织。用于一给定的植物品种或特定类型的植物组织的技术取决于已知的成功技术。随着用于将外来基因稳定地插入植物细胞和操纵经修饰的细胞的新方法的发展,技术人员能够从已知的方法中选择能达到所需要的结果的方法。用于将重组DNA引入植物组织的方法包括(但不局限于)直接DNA摄入[Paszkowski,J.等人(1984).EMBO J 32717)、电刺激(electroporation)[Fromm,M等人(1985),Prov.Natl.Acad.Sci.USA 825824)、微量注射[Crossway,A.等人(1986),Mol.Gen.Genet.202179),或从Agrobacterium tume-faciens(土壤杆菌肿瘤)到植物组织的T-DNA介质转移。已发现T-DNA转化土壤杆菌属的天然宿主并无十分重要的限制。业已报导了单子叶[Hooykaas-Van Slogteren,G.等人(1984),Nature 311763)、裸子植物(Dandekar,A.等人(1987),Biotechnology 5587)和藻类(Ausich,R,EPO申请第108,580号)中成功的T-DNA介质转化。下面的参考文献中描述了典型的T-DNA载体系统An,G,等人(1985)EMBO J.4277;Herrera-Estrella.L.等人(1983),Nature 303209;Herrera-Estrella,L.等人(1983)EMBO J·2987;Herrera-Estrella,L.等人(1985)“Plant Genetic Engineering,”New YorkCambridg Uuiversity Press,P.63。一旦引入植物组织后,结构基因的表达可以通过该领域已知的任何方法进行测定,可用mRNA转录或蛋白质合成的量来测定表达水平。有关体外培养植物组织和在一些情况下,回到整个植物中再生的技术已经了解。将引入的表达复合体转移到商业化裁培品种中的方法是该领域的技术人员已知的。
在这里所揭示的本发明的一个较佳实例中包括一个合成的杀虫结构基因在一个植物中可表达的启动子的控制下,在植物细胞中表达,也就是说,采用已知的方法,将杀虫结构基因插入T-DNA中,使其在植物可表达的启动子的控制之下,将含有插入体的T-DNA引入植物细胞。一旦得到在植物可表达的启动子控制下可表达合成的杀虫结构基因的植物细胞,就可以采用该领域熟知的方法和技术从中再生植物组织和整个植物。然后用传统的方法再生产经再生的植物,通过传统的植物育种技术可以将引入的基因转移到其它株和栽培品种中。
杀虫蛋白的合成的结构基因的引入和表达可被用于防止作物遭受普通虫害的感染。本发明的其它用途,即了解被引入到其它植物种中的其它杀虫的结晶基因的性能对于该领域的技术人员将是极为显而易见的。原则上,本发明可用于将任何合成的杀虫结构基因引入任何品种的植物,在这些植物种中,外源DNA(在一个较佳实例中是T-DNA)可以被引入,且在其中,DNA可以保持稳定地复制。通常,这些类群包括(但不局限于)裸子植物和双子叶植物,例如向日葵((Compositeae族)、烟草(Solanaceae族)、紫花苜蓿、大豆和其它豆科牧草(Leguminoseae族)、棉花(Malvaceae族)和大部分蔬菜以及单子叶植物。一个组织中含有表达水平提高的杀虫蛋白质的植物可以控制那些不太敏感型的昆虫,由此优于现在使用的Bt杀虫基因。通过将杀虫蛋白质掺入植物组织中,本发明还在能排除施用不均匀的情况、免去购买费用以及在大田里施用杀虫剂成品等方面优于目前使用的杀虫剂。本发明不需要严格控制这类制剂应用的时间,因为幼虫对于杀虫蛋白质是最敏感的,而蛋白质是一直存在的,也不需要仔细地减少作物的损伤,因损伤是预先施用杀幼虫剂引起的。
本发明将这里所揭示的特殊的技术与该领域已知的各种技术和手段相结合。手段的选择取决于可变项,例如Bt菌中杀虫蛋白质的选择、在优先的密码子使用中修饰的程度、被认为对于RNA不稳定的顺序或过早终止转录的顺序的处理、为了以后的核苷酸修饰,在设计的合成基因中限制位点的插入、在合成的结构基因的5’和/或3’末端,内含子或增强子的顺序的加入、启动子区、启动区/结构基因组合在其中表达的宿主,等等。随着新型的杀虫蛋白质和毒性多肽的发现,和随着能够提高交叉表达(在一个给定宿主中一个外来结构基因的表达)的顺序被阐明,普通的技术人员能够在这些因素中作出选择,从而产生“改进的”合成基因以得到所需要的具有农业价值的蛋白。本发明的基本特征是具有合成一个新型的编码杀虫蛋白质的基因的能力,这样,所设计的蛋白质能在植物中以提高的水平表达,并保留其固有的对昆虫的毒性和保留或增加它的特别的杀虫活性。
实例以下的实施例可用作本发明的具体方案,它们不限制本发明的范围,范围是由权利要求书决定的。
E.coli MC 1061是质粒转化中的一个很好的宿主,由Casadaban报导。M.J.and Cohen,S,N(1980)J.Mol.Biol138179-207。实施例1合成的杀虫晶状蛋白基因的设计(i)Btt基因的毒性亚克隆的制备构建、分离及鉴定PNSB544由Sekar报导V.et al.(1987)Proc.Natl.Acad,Sci.USA 847036-7040,和Seker,V.和Adang,M.J,美国专利申请系列号108,285,在1987年10月13日提交申请,这里作为参考。一个3.0kbp携带PNSB544晶状蛋白基因的Hind III片段插入到PIC-20H(Marsh,J.L.etal.(1984)Gene 32481-485)的Hind III位点,由此产生一个质粒称为P544一Hind III,该质粒在保藏中。在E.coli中表达产生一个73KDa的晶状蛋白,另外还有从Btt分离物中得到的(65KDa)种特异性晶状蛋白。
一个5.9kbp带晶状蛋白基因的BamH I片段从PNSB544上切下来,然后插入BamH I线性排列的PIC-2OH DNA上。产生的质粒P405/44-7,用Bgl II酶切并重新连结,去掉与结晶蛋白基因3’端相连结的芽孢杆菌(Bacillus)顺序。由此产生的质粒P405/54-12,用Pst I酶切并重新连结,去掉与结晶蛋白5’端相连接的芽孢杆菌(Bacillus)顺序,离晶状蛋白的结构基因5’端大约是150bp。由此产生的质粒P405/81-4,用Sph I及Pst I酶切,然后与一个合成的人工接头混合并与之连接,接头为以下结构。
SDMetThrAla5′CAGGATCCAACAATGACTGCA3′3′GTACGTCCTAGGTTGTTACTG5′SphI PstI
(SD表示Shine-Dalgarno原核生物的核糖体结合位点。)由此产生的质粒P544 PstMet5,包含编码一个蛋白质的结构基因,此蛋白质与PNSB544编码的蛋白质相同,仅在氨基酸未端少了47个氨基酸残基。P544-PstMet5中Btt编码区的核苷酸序列在图1中列出。经生物检测(Sekar和Adang,美国专利申请系列号108,285,(上述),PNSB544中全长Btt基因编码的蛋白质与N-末端缺失衍生物P544 PstMet5编码的蛋白质有相同等的毒性。所有以上提到的质粒中的结晶蛋白基因,均与载体中lac Z基因的方向一致。
(ii)优先密码子使用的修饰表1显示了密码子使用频率,(A)双子叶蛋白,(B)Bt蛋白,(C)合成Btt基因和(D)单子叶蛋白。虽然有些为一个特定氨基酸编码的密码子,在双子叶植物和Bt蛋白质中几乎有差不多的运用,(例丝氨酸的密码子),从大部分来看,双子叶植物和Bt蛋白中的密码子频率分布有显著的差异,如同表1中A栏和B栏中所显示的。
表1密码子使用频率分配分数氨基酸 密码子(A)双子叶(B)Bt基因(C)合成Btt(D)单子叶植物基因 基因 基因Gly GGG 0.12 0.08 0.13 0.21Gly GGA 0.37 0.53 0.37 0.18Gly GGT 0.35 0.24 0.34 0.21Gly GGC 0.16 0.16 0.16 0.40Glu GAG 0.52 0.13 0.52 0.77Glu GAA 0.48 0.87 0.48 0.23Asp GAT 0.57 0.68 0.56 0.31Asp GAC 0.43 0.32 0.44 0.69Val GTG 0.30 0.15 0.30 0.38Val GTA 0.12 0.32 0.10 0.07Val GTT 0.38 0.29 0.35 0.20Val GTC 0.20 0.24 0.25 0.34Ala GCG 0.05 0.12 0.06 0.20Ala GCA 0.26 0.50 0.24 0.16Ala GCT 0.42 0.32 0.41 0.28Ala GCC 0.28 0.06 0.29 0.36Lys AAG 0.61 0.13 0.58 0.87Lys AAA 0.39 0.87 0.42 0.13Asn AAT 0.45 0.79 0.44 0.23Asn AAC 0.55 0.21 0.56 0.77Met ATG 1.00 1.00 1.00 1.00Ile ATA 0.19 0.30 0.20 0.09Ile ATT 0.44 0.57 0.43 0.27Ile ATC 0.36 0.13 0.37 0.64Thr ACG 0.07 0.14 0.07 0.18Thr ACA 0.27 0.68 0.27 0.14Thr ACT 0.36 0.14 0.34 0.22Thr ACC 0.31 0.05 0.32 0.47Trp TGG 1.00 1.00 1.00 1.00End TGA 0.46 0.00 0.00 0.34Cys TGT 0.43 0.33 0.33 0.27Cys TGC 0.57 0.67 0.67 0.73End TAG 0.18 0.00 0.00 0.44End TAA 0.37 1.00 1.00 0.22Tyr TAT 0.42 0.81 0.43 0.19Tyr TAC 0.58 0.19 0.57 0.81表1(续)分配分数氨基酸 密码子 (A)双子叶 (B)Bt基因 (C)合成Btt (D)单子叶植物基因基因基因Phe TTT 0.450.75 0.440.28Phe TTC 0.550.25 0.560.72Ser AGT 0.140.25 0.130.07Ser AGC 0.180.13 0.190.25Ser TCG 0.050.08 0.060.13Ser TCA 0.180.19 0.170.13Ser TCT 0.260.25 0.270.18Ser TCC 0.190.10 0.170.24Arg AGG 0.220.09 0.230.28Arg AGA 0.310.50 0.320.08Arg CGG 0.040.14 0.050.14Arg CGA 0.090.14 0.090.04Arg CGT 0.230.09 0.230.11Arg CGC 0.110.05 0.090.36Gln CAG 0.380.18 0.390.43Gln CAA 0.620.82 0.610.57His CAT 0.520.90 0.500.38His CAC 0.480.10 0.500.62Leu TTG 0.260.08 0.270.15Leu TTA 0.100.46 0.120.04Leu CTG 0.090.04 0.100.27Leu CTA 0.080.21 0.100.11Leu CTT 0.290.15 0.180.16Leu CTC 0.190.06 0.220.27Pro CCG 0.070.20 0.080.20Pro CCA 0.440.56 0.440.39Pro CCT 0.320.24 0.320.19Pro CCC 0.160.00 0.160.22Bt编码顺序已众所周知,双子叶植物核基因的88个编码顺序组成了密码子使用表。双子叶植物编码顺序库从基因库(Genbank)得到,有表1(续属/种 基因库 蛋白质 参考资料Antirrtinum majus AMACHS Chalcone synthetaseArabidopsis thaliana ATHADH Alcohol dehydrogenaseATHH3GA Histone 3 gene 1ATHH3GB Histone 3 gene 2ATH4GA Histone 4 gene 1ATHLHCP1CABATHTUBA α-tubulin5-enolpyruvyl4hifate3-phosphate synthetase 1Bertholletia excelsa High methionine storage 2proteinBrassica campestrisAcyl carrier protein3Brassica napus BNANAP NapinBrassica oleacea BOLSLSGRS-locus specific glycoproteinCanavalia ensiformis CENCONA Concanavalin ACarica papaya CPAPAP PapainChlamdomonasreinbardtiiCREC552 PreapocytochromeCRERBCS1RuBPC small subunit gene 1CRERBCS2RuBPC small subunit gene 2Cucurbita pepo CUCPHT PhytochromeCucumis sativusCUSGMS Glyoxosomal malate synthetaseGUSLHCPACABCUSSSU RuBPC small subunitDaucus carota DAREXT ExtensinDAREXTR 33KD extensin related proteinDolichos biflorus DBILECS seed lectinFlaveia trincrvia FTRBCR RuBPc small subunitlycine max SOY7SAA 7s storage proteinSOYACTIGActin 1SOYCIIPICII protease inhibitorSOYGLYALA Glycinin Ala BxsubunitsSOYGLYAAB Glycinin A5A4B3 subunitsSOYGLYABGlycinin A3/b4 subunitsSOYGLYR Glycinin A2B1a subunitsSOYHSP175 Low M W heat shock proteinsSOYLGBI LeghemoglobinSOYLEA LectinSOYLOX Lipoxygenase 1SOYNOD20G 20KDa nodulinSOYNOD23G 23KDa nodulinSOYNOD24H 24KDa nodulinSOYNOD26B 26KDa nodulinSOYNOD26R 26KDa nodulinSOYNOD27R 27KDa nodulinSOYNOD35M 35KDa nodulinSOYNOD7575KDa nodulinSOYNODR1Nodulin C5SOYNODR2Nodulin E27SOYPRP1 Proline rich proteinSOYRUBP RuBPG small subunitSOYURA UreaseSOYHSP26A Heat shock protein 26A表1(续)属/种基因库蛋白质 参考资料Nuclear-encoded chloroplast4heat shock protein22KDa nodulin 5β1 tubulin6β2 tubulin6Gossypium hirsutum Seed globulin (vicilin)7Seed globulin (vicilin)7Helianthus annus HNNRUBCS RuBPC small subunit2S albumin seed storageprotein8Ipomoca batatasWound-induced catalase 9Lemna gibba LGIAB19 CABLGIR5BPC RuBPC small subunitLupinus luetus LUPLBRleghemoglobin ILycopersiconesculentum TOMBIOBR Biotin binding proteinTOMETHYBR Ethylene biosynthesis proteinTOMPG2AR Polygalacturonase-2aTOMPSITomato photosystem I proteinTOMRBCSA RuBPC small subunitTOMRBCSB RuBPC small subunitTOMRBCSC RuBPC small subunitTOMRBCSD RuBPC small subunitTOMRRDRipening related proteinTOMWIPIG Wound induced proteinaseinhibitor ITOMWIPII Wound induced proteinaseinhibitor IICAB1A 10CAB1B 10CAB3C 10CAB4 11CAB5 11Medicago sativa ALFLB3R Leghemoglobin IIIMessmbryanthemunicrstallinumRuBPC small subunit12Nicotianaplumbaginifolia TOBATP21 Mitochondrial ATP synthaseβsubunit 13Nitrate reductase 13Glutamine synthetase 14Nicotiana tabacumTOBECHEndochitinaseTOBGAPA A subunit of chloroplast G3PDTOBGAPB B subunit of chloroplast G3PDTOBGAPC C subunit of chloroplast G3PDTOBPR1AR Pathogenesis related protein 1aTOBPR1CR Pathogenesis-related protein 1cTOBPRPR Pathogenesis related protein 1bTOBPXDLF PeroxidaseTOBRBPCO RuBPC small subunitTOBTHAUR TMV-induced protein homologousto thaumatinPercus amcricana AVOCELCellulasePetroselinum表1(续)属/种 基因库蛋白质 参考资料hortense PIIOCHL Chalcone synthasePetunia sp, PETCAB13 CAB13PETCAB22L CAB22LPETCAB22R CAB22RPETCAB25 CAB25PETCAB37 CAB37PETCAB91R CAB91RPETCHSR Chalcone synthasePETGCR1 Glycine-rich proteinPETRBCS08 RuBPC small subunitPETRBCS11 RuBPC small subunit70 KDa heat shock protein 15Phascolus vulgarisPHVCHMChitinasePHVDLECA Phytohemagglutinin EPHVDLECB Phytohemagglutinin LPHVGSR1 Glutamine synthetase 1PHVGSR2 Glutamine synthetase 2PHVLBALeghemoglobinPHVLECT LectinPHVPALPhenytalanine ammonia lyasePHVPHASAR α phaseolinPHVPASBR β phaseolinArcelin seed protein 16Chalcone synthase 17Pisum sativum PEAALB2 Seed albuminPEACAB80 CABPEAGSR1 Glutamine synthetase(nodule)PEALECA LectinPEALEGA LeguminPEARUBPS RuBPC small subunitPEAVIG2 VicilinPEAVIC4 VicilinPEAVIC7 VicilinAlchol dehydrogenase 118Glutamine synthetase(leaf)19Glutamine synthetase(root)19Histone 1 20Nuclear encoded chloroplast 4heat shock proteinRaphanus sativusRuBPC small subunit 21Ricinus communis RCCAGGAgglutininRCCRICIN RicinRCCICL4 Isocitrate lyaseSitene pratensis SIPFDXFerrodoxin precursorSIPPCYPlastocyanin precursorSinapis alba SALGAPDH Nuclear gene for G3PDSolanum tuberosum POTPATPatatinPOTINHWI Wound-induced proteinaseinhibitorPOTLS1G Light-inducible tissue specificST-LS1 GENEPOTP12G Wound-induced proteinaseinhibitor IIPOTRBCS RuBPC small subunit表1(续)属/种 基因库 蛋白质 参考资料Sucrose synthetase 22Spinacia cleracea SPIACPI Acyl carrier protein ISPIOEC1616KDa photosyntheticoxygen-evolving proteinSPIOEC2323KDa photosyntheticoxygen-evolving proteinSPIPCG PlastocyaninSPIPS33 33KDa photosynthetic wateroxidation complex precursorGlycolate oxidase 23Vicia faba VFALBA LeghemoglobinVFALEB4 Legumin BVicillin 24Avena sativaASTAP3R Phytochrome 3Hordeum vulgare BLYALR AleurainBLYAMY1 amylase 1BLYAMY2 amylase 2BLYCHORD1 Hordein CBLYGLUCB glucanaseBLYHORB B1 hordeinBLYPAPI Amylase/protease inhibitorBLYTH1ARToxin hordothioninBLYUBIQRUbiquitinHistone 3 25Leaf specific thionin 126Leaf specific thionin 226Plastocyanin 27Oryza sativaRICGLUTGGlutelinGlutelin 28Triticum aestivum WHTAMYAamylaseWHTCAB CABWHTEMR Em proteinWHTGIR gibberellin responsive proteinWHTGLGBgliadinWHTGLIABA/ gliadin Class AIIWHTGLUT1High MW gluteninWHTH3 Histone 3WHTH4091Histone 4WHTRBCB RuBPC small subunitSecale cereale RYESECGSR secalinZea maysMZEA1G 40.1 KD A1 protein(NADPH-dependent reductase)MZEACTIGActinMZEADH11F Alcohol dehydrogenase 1MZEADH2NR Alcohol dehydrogenase 2MZEALD AldolaseMZEANT ATP/ADP translocatorMZEEG2R Glutelin 2MZEGGST3B Glutathione S transferase表1(续)属/种基因库 蛋白质 参考资料MZEH3C2 Histone 3MZEH4C14 Histon 4MZEHSP70170KD Heat shock protein,exon 1MZEHSP70270KD Heat shock protein,exon 2MZELHCP CABMZEMP13 Lipid body surface protein L3MZEPEPCR Phosphoenolyruvate carboxylaseMZERBCS RuBPC small subunitMZESUSYSGSucrose synthetaseMZETP12 Triosephosphate isomerase 1MZEZEA20M19KD zeinMZEZEA30M19KD zeinMZEZE15A315KD zeinMZEZE16 16KD zeinMZEZE19A 19KD zeinMZEZE22A 22KD zeinMZEZE22B 22KD zeinCatalase 229Regulatory C1 locus 30Bt密码子是从对下列基因的编码顺序分析中得Bt var.kuratakiHD-73,6.6kb Hind III fragment(Kronstad et al.(1983)J.Bacteriol.154419-428);Bt var,Kurataki HD-1,5.3kb fragment(Adang et al.(1987)in Biotechnology in Invertenrare Pathology and Cell Culture,K.Maramorosh\(ed.),Academic Press,Inc.New York,pp.85-99);Btvar.kurstaki HD-1,4.5kb fragment(Schnepf and Whiteley(1985)J.Biol.Chem.2606273-6280);and Bt var.tenebrionis,3.0kb Hind III fradment(Sekar e al.(1987)Proc.Natl.Acad.Sci.847036-7040).
参考资料1.Klee,H.J.et al.(1987)Mol.Gen.Genet.210437-442.
2.Altenbach,S.B.et al.(1987)Plant Mol.Biol.8239-250.
3.Rose,R.E.et al.(1987)Nucl.AcidsRes.157197.
4.Vierling,E.et al.(1988)EMBO J.7575-581.
5.Sandal,N.N.et al.(1987)Nucl.Acids Res.151507-1519.
6.Tingey,S.V.et al.(1987)EMBO J.61-9.
7.Chlan,C.A.et al.(1987)Plant Mol.Biol.9533-546.
8.Allen,R.D.et al.(1987)Mol.Gen.Genet.210211-218.
9.Sakajo,S.et al.(1987)Eur.J.Biochem.165437-442.
10.Pirersku,E.et al.(1987)Plant Mol.Biol.9109-120.
11.Ray,J.et al.(1987)Nucl.Acids.1510587.
12.De Rocjer,E.j.et al.(1987)Nucl.AcidsRes.156301.
13.Cslza,R.et al.(1987)Mol.Gen.Genet.209552-562.
14.Tingey,S.V.and Coruzzi,G.M.(1987)Plant Phys.84366-373.
15.Winter,J.et al.(1988)Mil.Gen.Genet.211315-319.
16.Osborn,T.C.et al.(1988)Science 240207-210.Genet.207446-454.
17.Pyder,T.B.et al.(1987)Mol.Gen.Genet.210219-233.
18.Llewellyn,D.J.et al.(1987)J.Mol.Biol.195115-123.
19.Tingey,S.V.et al.(1987)EMBO J.61-9.
20.Gantt,J.S.and Key,J.L.(1987)Eur.J.Biochem.166119-125.
21.Guidet,F.and Fourcroy,P.(1988)Nucl.Acids Res.162336.
22.Salanoubat,M.and Belliard,G.(1987)Gene 6047-56.
23.Volokita,M.and Somerville,C.R.(1987)J.Biol.Chem.26215825-15828.
24.Bassner,R.et al.(1987)Nucl.Acids Res.159609.
25.Chojecki,J.(1986)Carlsberg Res.Commun.51211-217.
26.Bohlmann,H.and Apel,K.(1987)Mol.Gen.
27.Nielsen,P.S.and Gausing,K.(1987)FEBS-3558.Lett.225-159-162.
28.Higuchi,W.and Fukazawa,C.(1987)Gene 55245-253.
29.Bethards,L.A.et al.(1987)Proc.Natl.Acad.Sci.USA 846830-6834.
30 Paz-Ares,J.et al.(1987)EMBO J.63553-3558.
举例来说,双子叶植物用AAG密码子编码赖氨酸的频率是61%,用AAA密码子的频率为39%,相反,在Bt蛋白中赖氨酸密码子AAG和AAA使用频率分别是13%和87%。本领域的人都知道很少使用的密码子对那个系统常常是不利的,必须避免或谨慎地使用。因此,在设计编码Btt晶状蛋白的合成基因时,改变原先Btt基因中的单个氨基酸密码子,可反映双子叶植物基因编码一个特定氨基酸的优先密码子。但是,必须注意保持基因编码区域中每个氨基酸密码子的总体上分布。举例来说,就丙氨酸而言,从表1可见GCD密码子在Bt蛋白质中使用的频率是50%,而密码子GCT在双子叶植物蛋白质中是优选密码子。在设计合成Btt基因中,不是所有的在原先Btt基因中编码丙氨酸密码子均被GCT代替,而只是一部分密码子换成GCT,另外的则用不同的丙氨酸密码子代换,以保持在双子叶植物蛋白质中编码丙氨酸的密码子的总体分布。表1中的C栏证明这个目标达到了,双子叶植物蛋白质中密码子使用频率(A栏)与合成的Btt基因中所使用的非常相近(C栏)。
用类似的方法可以使编码杀虫晶状蛋白的合成基因达到最佳,以提高在单子叶植物中的表达。表1中,D栏显示了在高表达的单子叶植物的密码子使用频率。
由于基因密码的简并性,只有部分基因中的变化可在此蛋白质中表达。很明显,简并碱基频率中的变化不是一个无偏向性的现象,因为已报导在细菌、酵母及哺乳类基因中有系统性密码子优选。对大量的植物基因顺序的分析表明同义密码子在单子叶和双子叶植物中有不同的使用。这些模式与报道的大肠杆菌、酵母和人类中的也不同。
总的来说,植物密码子使用模式类似于人类及其它高级真核生物而不是单细胞生物,因为在密码子第三位上G+C含量总体上是优选的。在这个样品中,单子叶植物与人类基因样品中的报导(Grantham et al.1986,上述)一样共有18个最常用的氨基酸密码子中的13个,尽管双子叶植物在最常用人类18个氨基酸密码子中只利用7个。
关于植物密码子使用的讨论集中在植物核基因及叶绿体中密码子使用的区别。叶绿体与高级植物的不同是它只编码30种tRNA。因为叶绿体限制了它的tRNA基因,叶绿体编码的蛋白对优选密码子的使用显得更加严重。然而,编码一个给定氨基酸的同功tRNA水平上与这个密码子在叶绿体基因组中使用的频率已报道呈正相关。(Pfitzinger et al.(1987)Nucl.Acids Res.151377-1386)。
我们对植物基因样品的分析证实了早先的报道,即植物中核及叶绿体基因组具有不同的编码方式。在这个样品中,单子叶植物中所用密码同叶绿体中所用的显著不同,仅共享最常用的18个氨基酸密码子中的一个。双子叶植物在这个样品中只共享叶绿体最常用18个氨基酸密码子中的4个,总的来说,叶绿体密码子的外形与单细胞生物的更相似,有强的倾向于在简并的第三个碱基上选用A+T。
在单细胞生物中,高表达的基因与低表达力的基因相比选用更少部分的密码子,虽然优先密码子在有些情况下显著不同。Sharp和Li(1986)Nucl.Acids Res.147734-7749报道在165个大肠杆菌基因中密码子的使用,显示在高表达力和增强的密码子偏向性间有一个正相关。Bennetzen和Hall(1982)(上述)描述了酵母中密码子使用有类似的倾向。在这些高表达的基因中的密码子使用与在酵母和大肠杆菌中具有丰富的同功tRNA有关。可能是与丰富的同功受体tRNA相适应的丰富的酵母及大肠杆菌mRNA密码子使用保证了这些蛋白质的高翻译水平和高稳定状态。这点有力地表明,植物基因在酵母和大肠杆菌中高水平表达的潜力受到它们的密码子使用的限制。Hoekema et al.(1987)(上述)报道在高表达基因PGK15’端用很少用的密码子置换25个最常使用的酵母密码子后,导致DNA和蛋白产量的降低。这些结果表明,在酵母及其它系统中建立高表达的外源基因时,需强调密码子选择的偏向性。
(iii)在Btt编码区中的顺序有潜在的使不稳定的影响。
对Btt基因的分析显示A+T含量占编码区中DNA碱基组成的64%,这个A+T水平比在典型植物编码区中发现的要高大约10%。通常,高A+T区域存在于基因间隔区中,另外,许多植物调节顺序也被发现是高AT区。从这个现象中得到这样一个结论,即在Btt编码区中提高A+T的含量,可能引起植物中的低表达水平。因而,在设计合成Btt基因时,把A+T含量降低到更接近于植物中的A+T水平。如表3所示的,A+T含量被降低,使其与在植物核基因中编码顺序中的保持一致。本发明的合成Btt基因的A+T含量为55%。
表3 Btt编码区的A+T含量碱基 G+C% A+T%编码区 G A T C天然Btt基因 341 633 514 30636 64合成Btt基因 392 530 483 42845 55除此之外,检查天然Btt基因中的Btt RNA有潜在的不稳定影响的顺序。这些顺序在天然Btt基因中鉴定出后,通过核苷酸顺序修饰而去除。属于这组具有潜在的不稳定影响的顺序有(a)植物多聚腺苷化(polyadenylation)信号区(如Joshi(1987)Nucl.Acids Res 159627-9640所描述)。在真核生物中,核基因的初级转录本被广泛地进行加工(包括5’加帽,内含子剪接,多聚腺苷化),形成成熟的可翻译的mRNA。在较高级植物中,多聚腺苷化包括在polyA位点处核苷酸基的内切,接着在被切末端加上几个腺嘌呤残基。polyA位点的选择被认为是顺式调控的。当Bt蛋白及RNA在不同的植物中表达时,本发明人观察到从这些表达系统中分离得到的多聚腺苷化mRNA不是全长度的,而是被截短或降解的。由此,在本发明中,决定通过去除合成Btt基因编码区中的潜在性多聚腺苷化信号区来减少RNA可能的不稳定性。当检查无错配的顺序时,植物多聚腺苷化信号区包含AATAAA、AATGAA、AATAAT、AATATT、GATAAA、GATAAA、及AATAAG型不在Btt基因中出现。
(b)多聚酶II终止顺序CAN7-9AGTNNAA这个顺序(Vankan and Filipowicz(1988)(EMBO.J7791-799)与Arabidopsis thaliana的Sn RNA基因编码区3’端邻接,并且被相信对转录终止3’端加工是很重要的。
(c)CUUCGG发夹结构,与在各种各样生化加工中极为稳定的RNA二级结构有关。(Tuerk et al.(1988)Proc.Natl.Acad.Sci 851364-1368)。CUUCGG发夹的特殊的稳定性意味着它具有不寻常的结构,并且可能在对复杂RNA结构作适当的折叠中起作用。在Btt编码区中,没有发现CUUCGG发夹状顺序有一个错配现象。
(d)植物一致剪接位点,5’=AAGGTAAGT和3’=TTTT(Pu)TTT(Pu)T(Pu)T(Pu)T(Pu)TGCAGC,如Brown et al.(1986)EMBO。J.52749-2758所描述的。5’和3’剪接处的一致顺序是分别来自20和30个植物内含子顺序。虽然有Bt基因中似乎不存在这种潜在的剪接顺序,已开始在合成Bt基因中寻找类似于植物一致剪接位点的顺序。对于5’剪接位点,离它最近的匹配有三个错配点。这就得到12个顺序,其中两个有GGT。只有在948处有改变,因为1323处有在重新构建时需要的KpnI位点,3’剪接位点在合成Btt基因中没有发现。
因此,通过对潜在性的使RNA不稳定的顺序的进行着重处理,在合成Btt基因的设计中去除了影响RNA合成及加工的已知真核生物调控顺序。
实施例2,一个经修饰的Btt结构基因的化学合成(i)合成方法在图2中简要示意了合成在Btt中编码晶状蛋白的线性双链DNA顺序的一般方法。最佳DNA编码顺序(图1)被分成十三个片段(A-M片段),每段单独合成,分离和纯化。如图2中所表示的,一般方法一开始是用酶把A片段和M片段连结起来形成AM片段,然后接到BL片段上形成ABLM片段,然后用酶把片段CK接到片段ABCKLM上,通过依次加上片段DJ、EI,最后给出总片段ABCDEFGHIJKLM,代表了Btt基因的整个编码区域。
图3更详尽地概括了把单独的DNA片段连结起来的方法,以合成一个其独一的限制性位点,被整合到一个特定的核苷酸顺序上的基因。十三个片段(A-M)中的每一个片段在两端均具有独一的限制性位点,使得各片段能按计划地剪接到一个不断增长的DNA多聚体上。同样,在基因的每个末端加上独一位点,可使它容易地从一个载体转移到另一个载体上。
十三个用来构建合成基因的片段(A-M)在大小上不同。大致有75个核苷酸组成的寡核苷酸对被用来构建大约有225个核苷酸对的更大的片段。图3证明了每个片段中所含碱基对的数目,并且详细说明了邻接每个片段的独一的限制性位点。在图3中还详述了把这些特定的片段结合在合适的剪接位点上的总的方法。
(ii)寡聚脱氧核苷酸的制备制备用于合成包含Btt基因的DNA顺序的寡聚核苷酸是按照一般步骤进行的,如Matteucci et al.(1981)J.Am.Chem.Soc.1033185-3192和Beaucage et al.(1981)Tetrahedron Lett.221859-1862所描述的。所有的寡聚核苷酸是通过固相磷酰胺三酯偶联法制各的,使用应用生化系统样品380A DNA合成剂。(Applied Biosystems Model 380A DNA Synthesizer)。按标准步骤将寡聚体从固相支持物上去保护及裂解,粗制寡聚核苷酸混合物用寡聚核苷酸纯化柱进行纯化,如Mc-Bride et al.所描述(1988)Biotechniques 6362-367。
寡聚核苷酸的5’磷酸化用T4多聚核苷酸激酶进行。反应包含2微克(μg)的寡聚核苷酸及18.2单位的多聚核苷酸激酶(Pharmacia),在接头激酶缓冲液中进行(Maniatis(1982)Cloning Manual,Fritsch and Sambrood(eds.)Cold Spring HarbourLaboratory Cold Spring Harbour,NY)。该反应在37℃孵育1小时。
寡聚核苷酸的退火是先加热到95℃ 5分钟,然后使互补的碱基对慢慢冷却到室温。退火形成的碱基对再加热到65℃,和溶液一起,然后慢慢冷却到室温,保存在冰上,直到使用。连接起来的混合物可以用4%的Nusieve琼脂糖凝胶电泳纯化,切下连接的双螺旋的相应电泳带,从琼脂糖中抽提出DNA,用乙醇沉淀。
连接反应的进行如以M片段为例说明的将M片段DNA在65℃放置25分钟,加入所需载体,整个反应混合物在65℃孵育15分钟,反应在1-1/2小时内慢慢冷却到室温,加入0.5mMATP及3.5单位的T4RNA连接酶盐(Ligase salts),反应混合物在室温下孵育2小时,然后在15℃过夜。次日晨,未连在M片段DNA上的载体用EcoR I酶切线性化去除,与M片段DNA相连接的载体用来转化大肠杆菌MC1061。含有插入片段的菌落通过与以32P标记的寡聚核苷酸为探针的菌落杂交来鉴定。通过分离质粒DNA并用Sanger等人(1977)Proc.Natl.Acad.Sci.745463-5467双脱氧测序法来证实DNA片段的顺序。
(iii)AM片段的合成将三个寡聚核苷酸对(A1及它的互补链A1C,A2及A2C,A3及A3C)组装起来,象上所描述的一样连接形成片段A,片段A的核苷酸顺序如下表4 片段A的核苷酸顺序BamHIXhoII PstI| |AATTGGGATCCAACAATGGCTGCAGACAACAACACGGAGGCCCTCGATAGCTCTACCACC1 ---------+---------+---------+---------+---------+---------+ 6CCCTAGGTTGTTACCGACGTCTGTTGTTGTGCCTCCGGGAGCTATCGAGATGGTGGEcoR1-末端 M A A D N N T E A L D S S T T
在表4中,粗线区列开单独的寡聚核苷酸片段,A1含71个碱基,A1C有76个碱基,A2有75个碱基,A2C有76个碱基,A3有82个碱基,A3C有76个碱基。总的来说,片段A由228个碱基对组成,包含在EcoR I限制性内切酶位点及一被破坏的EcoR I位点(5’)J之间。(片段A中其它的限制性内切酶位点已标明)。EcoR I单链粘性末端使片段A可通过退火然后与经EcoR I酶切的克隆载体PIC20K相连结。
片段M由3个寡聚核苷酸对组成M1,80个碱基;M1C,86个碱基;M287个碱基;M2C,87个碱基;M3,85个碱基;M3C,79个碱基。单独的寡聚核苷酸依上所描述那样退火并连接。片段M的所有核苷酸顺序如下
表5 片段M的核苷酸顺序
在表5中,粗线区分开单独的寡聚核苷酸。片段M包含252个碱基对,两端为破坏了的EcoR I限制性位点(M片段中其余的限制性位点被标明)。片段M在一个EcoR I限制性位点插入载体PIC20K中,并且被克隆。
如图3中所显示,片段M在它被包含的质粒中与片段A连结。片段M在测面限制性位点处从克隆载体上切除,通过Hind III随后是Bgl II剪接入载有片段A的PIC20K中,所得到的PIC20K载体含有与片段M连结的片段A,在剪接位点上有一个Hind III位点(见图3)PIC20K质粒是通过从PIC20K上去除SCa I-Nde IDNA片段,插入一个含NPTI编码区的Hind II片段而得到的。所得的4.4Kb质粒使大肠杆菌对卡那霉素产生抗性。
实施例3,在细菌系统中合成晶状蛋白基因的表达。
合成Btt基因被设计成能在它所构建的PIC20R-Kan载体中表达。此表达利用PIC20K的LacZ蛋白的启始甲硫氨酸产生。通过这种方式表达的野生型Btt晶状蛋白顺序具有完全的杀虫活性。另外,此合成基因被设计成在启始甲硫氨酸密码邻近的5’端含一BamHI位点。末尾TAG翻译终止密码子3’端有一Bgl II位点,这样可使杀虫晶状蛋白编码区克隆进细菌表达载体如PDR540(Russelland Bennett,1982)变得容易。质粒PDR540含有TAC启动子,在受控制的条件下可使包括Btt晶状蛋白在内的蛋白产量达到整个细菌蛋白质产量的10%。在许多革兰氏阴性细菌包括大肠杆菌及假单孢菌(Pseudomonas)中这个启动子都起作用。在细菌中从合成基因产生的Bt杀虫晶状蛋白证明产生的蛋白对鞘翅目昆虫(coleopterahinsects)具有预期的毒性。这些重组细菌本身具有潜在的作为微生物杀虫剂即合成基因的产物的价值。
实施例4在植物中合成晶状蛋白基因的表达合成Btt晶状蛋白基因被设计成可使之容易地克隆进表达盒(expression cassettes),它利用了合成基因侧面与BamH I及Bgl II限制性位点一致的位点。表达盒中使用了包括Ca M V35.5,Ca M V19s的植物启动子和来自T-DNA的ORF24启动子,这些表达盒提供了对植物中蛋白质表达非常重要的识别信号,这些表达盒被用在微小Ti质粒如PH575中。由植物表达信号指导的包含合成Btt基因的质粒如PH575,在去臂(disarmed)Agrobacteriumtumefaciens中应用,将合成基因引入植物基因组DNA中。这个系统以前曾被Adang等人(1987)描述过,用来表达在烟草植物中的BtKrustaki变种晶状蛋白。这些烟草植物对以烟草为食的天蛾科幼虫(hornworm)有毒。
实施例5,杀虫活性的检测生物检测主要如Sekal,V.et al.(上述所描述,毒性是通过估计LD50来确定的。质粒在大肠杆菌JM105中生长(Yanisch-Perron,C.et al.(1985)Gene 33103-119)。经检测,在克分子水平上(molar basis),由P544 Pst-Met5,P544-Hind III,及PNSBP544编码的晶状蛋白的毒性没有显著性差异。在完全相同的条件下在植物中表达时,包含由合成基因编码的蛋白质的细胞经观察比含有由天然Btt基因编码的蛋白质的细胞毒性更大,细胞培养物的免疫印迹(Westernblots)显示那些毒性更强的细胞具有更多的晶状蛋白抗原。与天然Btt基因的表达相关的合成Btt基因的提高的表达可以用在Northern印迹检测中,对合成Btt基因表达物中的特定的mRNA转录本进行定量的能力来表示。
权利要求
1.一种产生抗害虫的转基因植物的方法,其特征在于,它包括步骤将结构性杆菌属基因引入植物细胞,从而使该基因在转基因的植物细胞中表达;和将转化的植物细胞再生成有繁殖力的、转基因的、抗害虫的植物,其改进包括在引入步骤之前修饰结构性杆菌属基因,使密码子频率更接近植物细胞中的密码子使用频率,从而增加杆菌属基因的表达。
2.如权利要求1所述的改进方法,其特征在于,对结构性杆菌属基因的修饰包括替换至少一个核苷酸。
3.如权利要求1所述的改进方法,其特征在于,修饰步骤包括修饰结构性杆菌属基因使A+T碱基含量低于60%。
4.如权利要求1所述的改进方法,其特征在于,修饰步骤还包括修饰结构性杆菌属基因,以删除CUUCGG发夹(环)。
5.如权利要求1所述的改进方法,其特征在于,修饰步骤还包括修饰结构性杆菌属基因,使其CG和TA二联体空缺指数更接近植物细胞的空缺指数。
6.如权利要求1所述的改进方法,其特征在于,修饰步骤还包括修饰结构性杆菌属基因,以删除植物多聚腺苷酸化信号区。
7.一种设计合成的杆菌属基因使其在植物中更高水平地表达的方法,其特征在于,它包括步骤(a)分析来自杆菌属的某基因的编码顺序,该基因编码杀虫性蛋白质毒素;(b)修饰该编码顺序的一部分,以产生修饰顺序,该修饰顺序含有更多数目的、被植物宿主优选而不是被该编码顺序所优选的密码子;(c)将该修饰顺序插入植物细胞的基因组;和(d)在适合允许该植物细胞复制的条件下,维持该植物细胞以产生额外的植物细胞,该额外植物细胞的基因组中该修饰顺序,其中该合成的杆菌属基因被表达以产生杀虫性蛋白质毒素。
8.一种设计合成的杆菌属基因使其在植物中更高水平地表达的方法,其特征在于,它包括步骤(a)分析来自杆菌属的某基因的编码顺序,该基因编码杀虫性蛋白质毒素;(b)修饰该编码顺序的一部分,以产生修饰顺序,该修饰顺序的密码子使用频率更接近于将要表达它的植物的密码子使用频率;(c)将该修饰的蛋白质编码顺序插入植物细胞的基因组;和(d)在适合允许该修饰顺序转录和翻译从而在该植物细胞及其子代中产生杀虫性蛋白质毒素的条件下,维持该植物细胞及其子代。
9.一种设计合成的杆菌属基因使其在植物中更高水平地表达的方法,其特征在于,它包括步骤(a)分析来自杆菌属的某基因的编码顺序,该基因编码杀虫性蛋白质毒素;(b)修饰该编码顺序的一部分,以产生修饰顺序,该修饰顺序的密码子使用频率更接近于将要表达它的植物的密码子使用频率;(c)将该修饰顺序插入植物细胞的基因组;和(d)在适合允许该植物细胞复制的条件下,维持该植物细胞以产生额外的植物细胞,该额外植物细胞的基因组中该修饰顺序,其中该合成的杆菌属基因被表达以产生杀虫性蛋白质毒素。
全文摘要
本发明提供了经设计的在植物中以比天然存在的Bt基因更高水平表达的合成的苏云金杆菌毒素基因。这些基因采用了在高表达的单子叶或双子叶植物蛋白质中优选的密码子。
文档编号C07K14/325GK1263946SQ99127489
公开日2000年8月23日 申请日期1989年9月7日 优先权日1988年9月9日
发明者迈克尔·J·阿丹, 汤姆斯·A·罗克尔洛, 唐纳德·J·梅洛, 伊丽莎白·E·默里 申请人:卢布里绍尔遗传学股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1