通过旁路代谢途径的耐受除草剂的植物的制作方法

文档序号:349786阅读:1692来源:国知局
专利名称:通过旁路代谢途径的耐受除草剂的植物的制作方法
技术领域
本发明涉及一种使植物耐受除草剂的新方法,具体地说是耐受HPPD-抑制性除草剂,还涉及可用于本方法的编码酶的核酸序列、含有它们的表达盒以及含有至少一个这种表达盒的转基因植物。
羟苯基丙酮酸过氧化物酶是催化对羟苯基丙酮酸(HPP)向尿黑酸转化的酶。该反应在有铁离子(Fe2+)和氧气存在的条件下发生(N.P.Crouch等,Tetrahedron,53,20,6993-7010,1997)。
另外,已知一些抑制这种酶的分子附着在酶上从而抑制HPP向尿黑酸转化。由于在植物中对反应的抑制导致受到处理的植物叶子发黄并使所述植物死亡,发现这些分子中有些可用作除草剂(K.E.Pallett等,1997,Pestic.Sci.5083-84)。这种将HPPD作为靶标的除草剂,描述于本领域的文献中,具体的是异噁唑(EP 418 175,EP 470 856,EP 487 352,EP 527 036,EP 560 482,EP 682 659,US 5424276),特别是异噁唑草酮(isoxaflutole),一种玉米的选择性除草剂,二酮腈(EP486630,EP496631),具体是2-氰基-3-环丙基-1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-3-环丙基-1-(2-SO2CH3-4-2,3-Cl2苯基)丙烷-1,3-二酮和三酮(EP625505,EP625508,US5,506,195),特别是硫康三酮(sulcotrione)或内消旋三酮,或其它吡唑(pyrazolinates)。
证实HPPD实际上是二酮腈(DKNS)的靶标和证实HPPD(至少在一定剂量下)是二酮腈的唯一靶标的实验在实验室中、体外无菌条件下、通过在3种类型的培养基上使拟南芥(Arabidopsis)种子发芽进行1、Murashige和Skoog培养基(T.Murashige和F.Skoog,1962,一种用于烟草组织培养的快速生长和生物测定的改良培养基Physiol.Plant.15,473-479),发芽对照实验。
2、MS培养基加1ppm剂量的DKN3、MS培养基加相同剂量的DKN+浓度为5mM的尿黑酸非常清楚,在培养基1上,正常发芽,每一胚芽发育出两个子叶,该子叶呈现清楚的绿色。然后继续正常发育。在培养基2上,发芽了,但出现的胚芽是白色的,两片子叶未着色。几天后胚芽死亡。培养基3中,发芽正常出现,胚芽呈现清楚的绿色,植物发育,但很快培养基中尿黑酸的量减少,出现最初的发黄症状,植物生长停止,如在2号培养基中进行的实验一样它们以死亡告终。
这可以证实植物中HPPD明显的是DKN的靶标,而且是唯一的靶标。这还显示出尿黑酸从培养基转运到细胞位点,在那里它对于细胞的正常机能和植物的存活是必须的。
目前可以使用三种策略使植物耐受除草剂,(1)用酶解毒除草剂,该酶将除草剂或其活性代谢物转化为无毒的降解产物,如耐受溴苯腈的酶(EP242236,EP337899)(2)目标酶转变成为对除草剂不太敏感的功能酶或其活性代谢物,如对草甘膦耐受的酶(EP293356,S.R.Padgette等,J.Biol.Chem.266,33,1991);或(3)敏感酶过量表达以在植物中产生大量的目标酶,该酶足以满足其作为杀虫剂之目的酶动力学常数,从而即使在其抑制剂存在的情况下也能产生足量的功能酶。
有人描述了成功获得耐受HPPD抑制因子的植物的第三种策略(WO96/38567),它第一次被理解,敏感(未突变的)目标酶的简单过量表达的策略成功地用于赋予植物在农学水平上耐受除草剂。在C-末端部分突变的HPPD的鉴定显示对HPPD抑制因子耐受能力的改善,使采用第二种策略改进植物的耐受能力成为可能(WO99/24585)。
本发明包括使植物对除草剂产生耐受的一种新方法,该方法使用新的或第四种除草剂耐受策略,这一新的策略包括新辟由所述除草剂抑制的旁路代谢途径。该代谢旁路可总结如下 例如一种除草剂“H”具有抑制酶“E”的活力的活性,所述的酶“E”转化底物“S”为产物“P”,所述产物“P”及其代谢物对植物的生存是必需的, 所述代谢旁路存在于植物表达中,该植物中至少具有一种新的异源酶“NE”对允许“S”向一种中间产物“I”转化的“H”不敏感,然后其产物通过植物的自然生物合成途径或者通过也对“H”不敏感的至少一种其它的异源酶“OE”的表达转化为“P”, 代谢旁路还存在于允许“I”向“P”转化的对“H”不敏感的至少一种其它的异源酶“OE”的表达中,“I”作为一种中间产物或者为植物自然生产或者通过允许“S”向“I”转化的对“H”不敏感的至少一种新的异源酶“NE”的表达得到。
本发明更具体地涉及使植物对HPPD抑制因子耐受的一种新的方法,所述方法包括HPPD的代谢旁路。
至今在植物中没有代谢旁路途径的描述。
从文献中已知HPP向尿黑酸的转化可以通过用一种抑制HPP氧化酶活性的酶提取物首先进行HPP向4-苯乙醇酸(4-HPA)的转化,随后通过抑制4-HPA 1-水解酶活性的酶提取物将4-HPA转化成尿黑酸(WO99/34008)。


图1描述了这种旁路途径。
文献研究揭示了构建HPPD旁路途径所需的酶活于七十年代在细菌粗提物上得以表征。因此在球形节杆菌(Arthrobacter globiformis)(Blakley,1977)和食酸假单胞菌(Pseudomonas acidovorana)(Hareland等,1975)中分别鉴别到HPP氧化酶(HPPO,E.C.1.2.3.-)和4-HPA 1-水解酶(HPAH,E.C.1.14.13.18)的活性。从那以后,Suemori等只纯化了HPAH(1996),但是既没有公开蛋白质序列也没有公开核酸序列。因此,需要鉴别编码这些酶活的基因。
在旁路途径中,通过4-HPA使HPP发生向HGA的转化。现在,4-HPA是一种在植物中很少鉴别到的化合物。它存在于落新妇(Astilbe chinensis)(Kindl,1969),车前草(Plantago sp.)(Swiatek,1977),蒲公英(Taraxacum officinale;Dey和Harborne,1977),艾(Artemisia)(Swiatek等,1998),连翘(Forsythiasuspensa)果实(Liu等,1998),和最后存在于海洋藻类石莼(Ulva lactuca)(Flodin等,1999)中。几乎没有关于其来源的资料。它似乎可以来源于酪氨酸、莽草酸、或酪胺。也没有关于它结果怎样或在植物中的作用的资料。Kindl(1969)显示了它经3,4-二苯乙醇酸的降解,而Flocin等(1999)证实它通过4-羟基扁桃酸转化为2,4,6-三溴苯酚,后者累积于绿藻石莼中。Gross(1975)提出4-PHA可能是一些高等植物中的生长调节因子,Abe等(1974)认为它是藻类中的植物生长素类似物。
为了进行HPPD的代谢旁路途径,需要事先鉴别和分离编码负责上述两种活性的酶的基因和核酸序列。
发明中的定义“核酸序列”一个核苷酸或多核苷酸序列,它可以是DNA或RNA型,较佳的是DNA型,具体是双链的。核酸序列可以是天然来源的,具体是基因组DNA或RNA,或者是合成的或半合成的序列,核酸包括选择的核酸序列,该序列或者用于优化作为宿主有机体功能的编码序列的密码子(在宿主中该核酸序列将被表达),或者用于引入或消除一个或多个限制位点。制备合成和半合成核酸序列的方法是本领域熟练的技术人员所熟知的。
“能选择性杂交的序列”核酸序列与参考核酸序列在明显大于背景噪声的水平上杂交。背景噪声可与其它存在的DNA序列的杂交联合,特别是存在于cDNA文库中的其它cDNA。能选择性杂交的序列和上述根据本发明由序列ID定义的序列间的相互作用产生的信号水平通常10倍、较佳的100倍大于产生背景噪声的其它DNA序列的相互作用的信号水平。相互作用的水平可以测定,例如通过用如32P的放射性元素标记探针。通常通过使用非常严格的培养基条件(例如O.03M NaCl和O.03M柠檬酸钠在约50℃-60℃)得到选择性杂交。当然可根据本领域通常的方法进行杂交(具体是Sambrook等,1989,分子克隆实验手册)。
“核酸序列的同系物”核酸序列与参考序列相比显示出一个或多个序列修饰。可根据突变常用技术得到这些修饰,或者通过选择用于杂交制备所述序列的合成寡核苷酸得到。关于可产生相同氨基酸表达的核酸的多重结合,根据本发明的参考序列和相应的同系物之间的差别可能是相当大的。较佳的,同源的程度与参考序列相比将至少为60%,较佳的至少70%,更佳的至少80%,甚至更佳的至少90%。这些修饰通常和较佳地为中性,也就是说,对于一个编码序列,它们不影响所编码的蛋白质或肽的初级序列。但是,可引入非沉默修饰、或突变,与参考序列相比这不影响核酸序列的功能。测定和鉴别核酸序列间同源性的方法是本领域熟练的技术人员熟知的。例如可使用PILEUP或BLAST程序(具体是Altschul等,1993,J.Mol.Evol.36290-300;Altschul等1990,J.Mol.Biol.215403-10)。
“片段”参考核酸或多肽序列的片段,其中一部分缺失但保存了所述参考序列的功能。
“异源物”与在天然有机体中具有相同功能的核酸序列不同的核酸序列。一个异源序列可包括在自然环境中原位修饰的核酸序列。它也可以是分离于其自然有机体然后再引入到同一有机体的核酸序列。它还可以是与另一个核酸序列异源的核酸序列,如序列与另一序列连接,这种连接不会自然发生。这是一个表达盒的具体例子,该表达盒包括通常不会自然连接的各种核酸序列。
“蛋白质序列的异源序列”蛋白质序列中的初级序列与参考蛋白质的初级序列不同,但是它与参考序列执行相同的功能。测定和鉴别多肽和蛋白质间的同源性的方法也是本领域熟练的技术人员熟知的。例如可使用UWGCG成套试剂和BESTFITT程序计算同源性(Denerexu等,1984,Nucleic Acid res.12,387-395)。
“表达盒”在宿主有机体中包括表达编码序列所需的各种功能元件的核酸序列。这些功能元件包括,在转录方向上的调节启动子序列,也称作启动子,功能性连接于编码序列和调节终止子序列,也称作终止子或终止。表达盒还可包括在调节启动子序列和编码序列之间的调节元件如转录催化剂、或增强剂、和/或内含子。
“宿主有机体”根据本发明这主要是指的普通植物细胞或植物。对于克隆载体,宿主有机体还可以是细菌、真菌或酵母。
“植物细胞”来自植物的细胞,它可以组成未分化的组织如愈伤组织,分化的组织如胚芽、植物的各部分、植物或种子。
“植物”能够光合作用的分化的多细胞有机体,具体是单子叶植物或双子叶植物,更具体的是可以或不可以用作动物或人的食物的农作物,如水稻、玉米、小麦、大麦、甘蔗、油菜籽、大豆、甜菜根、土豆、烟草、棉花、苜蓿、菌丝、或观赏植物如矮牵牛、或其它芭蕉属植物、葡萄树、树莓、草莓、番茄、生菜植物等。
“调节启动子序列”作为植物中的调节启动子序列,可以使用在植物中自然表达的基因的任何调节启动子序列,具体地说特别是在植物叶子中表达的启动子,例如,来源于细菌、病毒或植物的“组成型”启动子、或其它“光-依赖型”启动子如植物核酮糖-二羧化酶/加氧酶(RuBisCO)基因的启动子、或者可使用的任何已知的适合的启动子。在来源于植物的启动子中,组蛋白启动子的叙述描述于申请EP0507698,或者水稻肌动蛋白启动子描述于(US 5641876)中。植物病毒基因的启动子中,涉及了菜花花叶病毒(CAMV 19S或35S)或CsVMV(US…)的启动子,或圈状病毒(circovirus)启动子(AU 689311)。还使用了对植物的具体区域或组织具有特异性的调节启动子序列,更具体的是种子-特异性启动子([22]R.Datla等,Biotechnology Ann.Rev.(1997)3,269-296),特别是芜青蛋白(napin)(EP255378)、菜豆蛋白、麦谷蛋白、半日花蛋白(heliantinin)(WO 92/17580)、白蛋白(WO 98/45460)、油质蛋白(WO 98/45461)、ATS1或ATS3(PCT/US98/06978,提交于1998年10月20日,本文引入用作参考)的启动子。还使用了可诱导的启动子,这些启动子方便地选自苯丙氨酸氨裂解酶(PAL)启动子、HMG-CoA还原酶(HMG)启动子、几丁质酶启动子、葡聚糖酶启动子、蛋白质酶抑制因子(PI)启动子,PR1家族基因启动子、胭脂氨酸合成酶(nos)或vspB基因(US569349,表3)启动子、HMG2启动子(US5670349)、苹果β-半乳糖苷酶(ABG1)启动子或苹果氨基环丙烷羧化物合成酶(ACC合成酶)启动子(WO98/45445)。
“转录激活剂(增强子)”叙述了例如烟草花叶病毒(TMV)的增强子,描述于申请WO87/07644中,或Carrington和Freed描述的烟草蚀刻病毒(TEV)的增强子。
“内含子”未翻译的核酸序列。将叙述如描述于专利申请WO97/04114中的用于在双子叶植物中表达的拟南芥组蛋白基因的内含子1,描述于专利申请WO99/34005中的水稻肌动蛋白第一内含子,或在单子叶植物中用于表达玉米adh1内含子。
“编码序列”翻译的核酸序列。它包括编码感兴趣的蛋白质或多肽的序列,任选地融合于5’或3’位点,具有编码信号肽或用于定向特异细胞区室的肽。
“信号肽或定向肽”肽在其N-或C-末端部分与感兴趣的蛋白质或肽融合,为用于感兴趣的蛋白质或肽定向到具体的细胞区室的细胞机制识别。具体地说它们是用于指引感兴趣的蛋白质或肽进入叶绿体的叶绿体转运肽,或进入各个细胞区室的信号肽,例如液泡、线粒体、粗面内质网、高尔基体等。具体描述于评论《植物分子生物学》(Plant moleular Biology)第38期的这种蛋白质序列的作用主要是转移蛋白质进入植物细胞的各个区室(《分选蛋白质进入植物细胞的液泡》Soring of proteins to vacuoles in plant cells,127-144页;核膜孔复合体,145-162页;蛋白质转运进入和穿过叶绿体包膜,91-207页;叶绿体中用于类囊体蛋白质的导向的多种途径,209-221页;植物中线粒体蛋白质的输入,311-338页)。
“叶绿体转运肽”叶绿体转运肽是由核酸序列编码的,核酸序列的5’位置编码感兴趣的蛋白质或肽,以允许感兴趣的融合蛋白的转运肽/蛋白质(肽)的表达。转运肽能够指引感兴趣的蛋白质或肽进入细胞器,更具体的是叶绿体,当融合蛋白穿过细胞器膜时,它在转运蛋白和感兴趣的蛋白或肽间被酶切。转运肽可以是单独的,如EPSPS转运肽(US5,188,642)或者来自植物的核酮糖-二羧化酶/加氧酶小亚基(RuBisCO ssu)的转运肽,任选地包括成熟RuBisCO ssu的N-末端部分的一些氨基酸(EP 189707),或者包括与位于色素体上的成熟蛋白质N-末端序列的部分融合的第一种植物的转运肽的一个多转运肽,与第二种植物转运肽融合(如专利EP 508 909所描述),更具体的是,优化的转运肽包括一种向日葵RuBisCO ssu的转运肽,该肽与玉米RuBisCO ssu的N-末端的22个氨基酸融合,与玉米RuBisCO ssu转运肽融合及其编码序列在专利EP 508 909中描述。
“信号肽”这些肽序列具体描述于《植物分子生物学》评论第38期(1998),主要用于转移蛋白质进入植物细胞的各个区室(《分选蛋白质进入植物细胞的液泡》Soring of proteins to vacuoles in plant cells,127-144页;核膜孔复合体,145-162页;蛋白质转运进入和穿过叶绿体包膜,91-207页;叶绿体中用于类囊体蛋白质的导向的多种途径,209-221页;植物中线粒体蛋白质的输入,311-338页)。用于定向进入液泡的肽广泛描述于文献中(J.M.Neuhaus和J.C.Rogers分选蛋白质进入植物细胞的液泡,植物分子生物学38127-144,1998)。较佳的,液泡中的肽是与感兴趣的蛋白质或肽的C-末端部分融合的蛋白质的液泡肽(J.M.Ferullo等描述,植物分子生物学,33625-633,1997)。
“调节终止子序列”还包括聚腺苷酸化序列,这是指在植物细胞或植物中具有功能的普通的任何序列,或者起源于细菌的,如根癌农杆菌终止子,病毒起源的如CaMV 35S终止子,或其它植物起源的,如专利申请EP 0 633 317中描述的组蛋白终止子。
“载体”用于宿主有机体转化的、含有至少一个表达盒的克隆和/或表达载体。该载体包括,除表达盒外,至少一个复制起点。载体可包括质粒、粘粒、噬菌体或病毒,通过引入表达盒转化。这种转化载体作为宿主有机体转化的一个功能,是本领域熟练的技术人员熟知的并广泛描述于文献中。对于植物细胞或植物的转化具体的将是病毒,该病毒可用于转化发育了的植物并且它还含有其自身的复制和表达元件。
优选地,转化植物细胞或植物的载体是质粒。
HPP氧化酶本发明的第一个主题是关于编码HPP氧化酶的核酸序列,以及相应的多肽。优选地,HPP氧化酶对HPPD抑制因子不敏感,具体对于异噁唑如异唑草酮和它们的二酮腈,具体如上所述。HPP氧化酶具体的是一种来自细菌的HPP氧化酶,例如来自节杆菌属,具体是球形节杆菌。HPP氧化酶优选的是一种蛋白质,其初级氨基酸序列是由标识为No.2(SEQ ID No.2)的序列以及与之同源的序列及其片段表示的。
与SEQ ID No.2同源的HPP氧化酶的蛋白质序列具体是由与之同源的序列及其片段SEQ ID No.4和6表示的。
由SEQ ID No.4表示的HPP氧化酶对应于SEQ ID No.2的HPP氧化酶,其中甘氨酸被丙氨酸所取代。
本发明还涉及如上所述的编码HPP氧化酶的核酸序列。
较佳地,编码HPP氧化酶的序列是DNA序列,特别是基因组DNA或cDNA,具体的是异源或分离的序列。
根据本发明编码HPP氧化酶的序列具体选自由SEQ ID No.1,2,3,5或15表示的DNA序列的编码序列及与之同源的序列、片段以及可选择的与SEQ ID 1,3,5或15杂交的序列。
SEQ ID No.5的编码序列具有SEQ ID No.1在463、602和1511位置的3个突变,这些突变是沉默的,即它不引入相应多肽的改变。
4-HPA 1-羟化酶本发明的第二个主题是4-HPA 1-羟化酶表达所需的方法。与从关于一些蛋白提取物的活性的文献所预期的相反,注意到4-HPA 1-羟化酶在细菌(具体的是假单胞菌)中的活性来自两种酶活性的总和,以下称作HPAH和HPAC。
HPAHHPAH允许HPA转化为中间代谢产物,下文称作代谢物Z,其结构尚未确定。可以观察到HPAH使HPA的芳环羟化,代谢物Z稳定为酮的形式,酶活性的假设描述于图2中。
因此本发明的第二个主题涉及编码HPAH和相应多肽的序列核酸。较佳的,HPAH对HPPD抑制因子不敏感,具体对异噁唑如异噁唑草酮及其二酮腈,特别是上面描述的。HPAH具体是来源于细菌的HPAH,例如来自假单胞菌,特别是来自食酸假单胞菌。HPAH较佳地是一种蛋白质,其初级氨基酸序列是由序列标识为No.8和18(SEQ ID No.8和SEQ ID No.18)的序列及与之同源的序列及其片段表示的。
本发明还涉及如上述定义的编码HPAH的核酸序列。
较佳地,编码HPAH的序列是DNA序列,特别是基因组DNA或cDNA,具体的是同源的或分离的序列。
根据本发明,编码HPAH的序列具体选自由SEQ ID No.7或17表示的序列的编码区域及与之同源的序列和其片段,及可选择地与SEQ ID No.7或17杂交的序列。
HPACHPAC是使代谢物Z向尿黑酸转化的第二种酶。
因此本发明的第三个主题涉及编码HPAC和相应多肽的核酸序列。较佳地,HPAC对HPPD抑制因子,特别是对异噁唑如异噁唑草酮及其二酮腈,尤其是上文所述的不敏感。HPAH具体是来源于细菌的HPAC,例如来自假单胞菌,具体是来自食酸假单胞菌。HPAH较佳地是一种蛋白质,其初级氨基酸序列是由序列标识为No.10(SEQID No.10)的序列及与之同源的序列及其片段表示的。
与SEQ ID No.10同源的HPAC的蛋白质序列,具体是由SEQ ID No.12,14和20,其同源序列和其片段表示的。
本发明还涉及如上述定义的编码HPAC的核酸序列。
较佳地,编码HPAC的序列是DNA序列,特别是基因组DNA或cDNA,特别是同源的或分离的序列。
根据本发明,编码HPAC的序列具体选自SEQ ID No.9、11、13或19表示的序列的编码区域及与之同源的序列和其片段,及可选择地与SEQ ID No.7或17杂交的序列。
表达盒本发明还涉及表达盒,其编码序列包括选自编码如上所述的HGA氧化酶、HGAH或HGAC的核酸序列的核酸序列。
该编码序列还可包括,在5’或3’位点,编码信号肽或转运肽的序列。较佳地,编码序列包括,编码HGA氧化酶、HGAH或HGAC的序列的5’位置,和编码用于叶绿体定向的转运肽的序列,具体是多转运肽,更具体的是优化的转运肽。
因此本发明还涉及转运肽/HGA氧化酶,转运肽/HGAH或转运肽/HGAC融合蛋白,上面描述的转运肽序列,具体是专利申请EP 508 909中描述的优化的转运肽。
较佳的,调节启动子序列选自允许编码序列的组成型表达的调节启动子序列。这些具体是CaMV35S、CsVMV、水稻肌动蛋白或组蛋白启动子的序列。
根据本发明它还可以选择在与产生旁路代谢的基因表达水平接近的表达水平上表达编码序列。根据本发明在表达盒中可使用选自植物HPPD的调节启动子序列的调节启动子序列。
对于在同一植物中HPP氧化酶、HGAH、HGAC三种酶的表达,可以选择相应编码序列的表达盒,根据它们的长度和/或它们在植物各个功能器官中位置,不同的调节启动子序列显示出不同的表达特点。
可以选择允许的表达梯度为HGAC>HGAH>HPP氧化酶(或反之亦然)的调节启动子序列。
对于HPP氧化酶、HGAH和HGAC的表达,调节启动子序列较佳地选自植物HPPD、组蛋白H3或H4的启动子,特别是选自假单胞菌或玉米的启动子,具体是专利申请EP507 698中描述的,以及植物RuBisCO SSU的启动子,具体选自如专利申请WO 99/25842描述的向日葵或玉米,CaMV 35S启动子或CsVMV启动子以及它们的组合,具体是组蛋白/35S混合启动子(如专利申请EP 507 698的实施例中所描述的)。对于单子叶植物中的表达,这些调节启动子序列较佳地与水稻肌动蛋白的第一内含子结合。
根据本发明的一个实施例,编码HPP氧化酶的表达盒包括组蛋白启动子、编码HPP氧化酶的序列和组蛋白终止子(
图12;SEQ ID No.15)。
根据本发明的另一个实施例,编码HPAH的表达盒包括CaMV 35S启动子、编码HPAH的序列和NOS终止子(
图11;SEQ ID No.17)。
根据本发明的另一个实施例,编码HPAC的表达盒包括CsVMV启动子、编码HPAC的序列和NOS终止子(
图10;SEQ ID No.19)。
载体本发明还涉及克隆和/或表达载体,该载体含有至少一个本发明的表达盒。
根据本发明的第一个实施例,载体包括根据本发明的仅一个表达盒,该表达盒选自含有如上述定义的HPP氧化酶、HGAH、或HGAC的编码序列的表达盒。
根据本发明的第二个实施例,载体包括根据本发明的两个表达盒,该表达盒选自含有如上述定义的HPP氧化酶、HGAH、或HGAC的编码序列的表达盒,在同一载体中成对结合HPP氧化酶和HGAH,HPP氧化酶和HGAC,HGAH和HGAC。
含有编码HPAH的表达盒和编码另一个HPAC的表达盒的载体可以是上述两个表达盒的组合(SEQ ID No.17和19)。
图13和SEQ ID No.21中描述了这种表达盒。
根据本发明第三个实施例,载体含有根据本发明的三个表达盒,第一个表达盒用于HPP氧化酶,第二个表达盒用于HGAH以及第三个表达盒用于HGAC。这种表达盒可以包括上述三种表达盒的组合(SEQ ID No.15,17和19)。在
图14和SEQID No.22中描述了这种载体。
根据本发明,如上所述的载体还可包括其它感兴趣的蛋白质或肽的表达盒。
当载体包含几个表达盒时,这些表达盒可以相互成对地具有各种取向,共线性的、趋异的或趋同的。
其它感兴趣的蛋白质或肽的表达盒包括编码不同于上述HPP氧化酶、HGAH和HGAC的感兴趣的蛋白质或肽的核酸序列。
可具有编码选择性标记的基因序列,如基因赋予转化植物以新的农学特性,或者基因改良了转化植物的农学特性。
选择性标记在编码选择性标记的基因中,将涉及抗抗生素的基因,耐受除草剂的基因(双丙氨酰膦、草甘膦或异噁唑),编码易于识别的报道酶如GUS酶的基因,编码在转化细胞中调节色素生产的色素或酶的基因。这种选择性标记基因具体描述于专利申请EP 242 236,EP 242 246,GB 2 197 653,WO 91/02071,WO 95/06128,WO 96/38567或WO 97/04103。
感兴趣的基因在赋予转化的植物新的农学特性的基因中,涉及某些耐受除草剂的基因,某些耐受昆虫的基因,某些耐受疾病的基因等。这些基因具体描述于专利申请WO91/02071和WO/06128。
除草剂耐受性本发明具体适用于赋予转化的单子叶植物和植物细胞对一些除草剂的耐受性的基因的表达。在赋予对某些除草剂耐受性的基因中,将涉及对双丙氨酰膦耐受的Bar基因,该基因编码适合的EPSPS,该EPSPS赋予对以EPSPS为靶标的除草剂的抗性,如草甘膦及其盐(US 4,535,060,US 4,769,061,US 5,094,945,US4,940,835,US 5,188,642,US 4,971,908,US 5,145,783,US 5,310,667,US5,312,910,US 5,627,061,US 5,633,435,FR 2 736 926),该基因编码甘草膦氧化还原酶(US 5,463,175),或者编码HPPD的基因以HPPD为靶标赋予对除草剂的耐受性,例如异噁唑,具体是异噁唑草酮(FR 95 06800,FR 95 13570),二酮腈(EP496 630,EP 496 631)或三酮,具体是硫康三酮(EP 625 505,EP 625 508,US5,506,195)。这些编码HPPD的基因以HPPD为靶标赋予对除草剂的耐受性描述于专利申请WO 96/38567中。
在编码以EPSPS为靶标赋予对除草剂抗性的适合的EPSPS的基因中,将更具体地涉及编码植物EPSPS的基因,具体来自玉米,显示102和106两个突变,描述于专利申请FR 2 736 926,下文称作EPSPS双重突变型,或者编码分离自土壤杆菌的EPSPS的基因,由美国专利5,633,435的序列ID 2和ID 3描述,下文称作CP4。
在编码以HPPD为靶标赋予对除草剂耐受性的HPPD基因中,将更具体的涉及来自假单胞菌和来自拟南芥的HPPD,描述于专利申请WO 96/38567中。
在编码EPSPS或HPPD的基因情况下,更具体是的编码上述基因的情况下,编码转运肽的序列较佳地位于编码这些酶的序列之前,具体地说在美国专利5,510,471或5,633,448中编码转运肽被称作“优化转运肽”。
对昆虫的抗性在赋予新的抗昆虫特性的感兴趣的蛋白质中,将更具体地涉及Bt蛋白质,该蛋白质广泛描述于文献中,并是本领域熟练的技术人员熟知的。还将涉及提取于细菌如光杆状菌的蛋白质(WO 97/17432和WO 98/08932)。
对疾病的抗性在赋予新的抗疾病特性的感兴趣的蛋白质或肽中,将具体涉及几丁质酶、葡聚糖酶、草酸氧化酶,所有这些蛋白质及其编码序列广泛描述于文献中,或者其它抗细菌和/或抗真菌的肽,具体是少于100个氨基酸的富含半胱氨酸的肽,如植物硫堇或防卫素,更具体的是在半胱氨酸和具有基本氨基酸的区域之间包括一个或多个二硫键的所有起源的溶解肽,具体如下溶解肽雄蝎素(androctonin)(WO97/30082和PCT/FR98/01814,提交于1998年8月18日)或嗜露霉素(drosomycin)(PCT/FR98/01462,提交于1998年6月8日)。
根据本发明一个具体的实施例,感兴趣的蛋白质或多肽选自真菌引起的肽,具体是诱导素(elicitin)(Kamoun等,1993;Panabieres等,1995)。
质量的改变还将涉及修饰改变的植物的组成的基因,具体的是一些必需脂肪酸的含量和质量(EP 666918)或蛋白质的含量和质量,具体是存在于所述植物的叶和/或种子中。还将具体涉及编码富含含硫氨基酸的蛋白质的基因(A.A.Korit等,Eur.J.Biochem.(1991)195,329-334;WO 98/20133;WO 97/41239;WO 95/31554;WO 94/20828;WO 92/14822)。这些富含含硫氨基酸的蛋白质还具有捕捉和储藏过量半胱氨酸和/或甲硫氨酸的功能,这可以避免由于诱捕它们造成的含硫氨基酸的过量生产可能产生的毒性问题。还将涉及编码富含含硫氨基酸的肽的基因,更具体的是半胱氨酸,所述的肽还具有抗细菌和/或抗真菌的活性。还将更具体地涉及植物防卫素,以及任何起源的溶解肽雄蝎素(WO 97/30082和PCT/FR98/01814,提交于1998年8月18日)或嗜露霉素(PCT/FR98/01462,提交于1998年6月6日)。
植物细胞和转基因植物本发明还涉及转化的植物细胞和含有上述HPP氧化酶、HGAH或HGAC的至少一种表达盒的植物。
根据本发明的第一个实施例,植物细胞或植物仅含有根据本发明的一个表达盒,该表达盒选自含有上述HPP氧化酶、HGAH或HGAC的编码序列的表达盒。
根据本发明的第二个实施例,植物细胞或植物含有根据本发明的两个表达盒,该表达盒选自含有上述HPP氧化酶、HGAH或HGAC的编码序列的表达盒,在相同载体中成对结合HPP氧化酶和HGAH、HPP氧化酶和HGAC、HGAH和HGAC。
根据本发明的第三个实施例,植物细胞或植物含有根据本发明的三个表达盒,第一个表达盒用于HPP氧化酶,第二个表达盒用于HGAH和第三个表达盒用于HGAC。
根据上述本发明的植物细胞或植物还可含有上述感兴趣的其它蛋白质或肽的表达盒。
较佳地,表达盒被稳定地整合入植物细胞或植物的基因组。更佳地,根据本发明所述植物是可结实的,根据本发明所述的表达盒被转移到它们的后代。
本发明还涉及上述转基因植物的种子,该种子含有根据本发明编码HPP氧化酶、HGAH或HGAC的表达盒。
根据本发明转化植物中的各种表达盒可起源于相同转化的亲本植物,在这种情况下,植物是从用包含于相同载体中的各种表达盒进行的单一的转化/再生过程得来的,或者用几个载体转化得来。也可通过杂交亲本植物得到,该亲本植物各个含有根据本发明的至少一个表达盒。
植物细胞和植物的转化本发明的另一个主题是通过引入根据上述本发明的至少一个核酸序列或表达盒转化植物细胞和植物的方法,该转化可通过任何适合的已知方法获得,这些方法广泛描述于专门文献和具体地在本发明引用的参考文献中,更具体地用根据本发明的载体转化植物细胞和植物的方法。
一系列的方法包括轰击细胞、原胚胞或具有DNA序列附着的颗粒的组织。另一系列的方法包括作为转移进入植物的方法,使用嵌合的基因插入根癌农杆菌Ti质粒或毛根农杆菌Ri质粒。可使用其它的方法,如微注射或电穿孔,或使用PEG直接沉淀。本领域熟练的技术人员通过适当的方法选择有功能的天然宿主有机体,尤其是植物细胞或植物。
当要求引入一些核酸序列或表达盒时,可以使用根据本发明的具有各种表达盒的单一载体进行。它们也可使用几个载体(每个载体含有至少一个表达盒)通过共转化引入宿主有机体。
一般而言,根据本发明,通过植物细胞的转化和而后从转化的细胞植物(较佳的是可结实的)的再生得到转基因植物。通过任何适当的方法获得再生,它依赖于种类的特性,例如上述参考文献中描述的。对于转化植物细胞和再生植物的方法将在如下专利和专利申请中具体涉及US 4,459,355,US 4,536,475,US5,464,763,US 5,177,010,US 5,187,073,EP 267,159,EP 604 662,EP 672 752,US 4,945,050,US 5,036,006,US 5,100,792,US 5,371,014,US 5,478,744,US5,179,022,US 5,565,346,US 5,484,956,US 5,508,468,US 5,538,877,US5,554,798,US 5,489,520,US 5,510,318,US 5,204,253,US 5,405,765,EP 442174,EP 486 233,EP 486 234,EP 539 563,EP 674 725,WO 91/02071和WO 95/06128。
选择性除草本发明的一个主题还涉及使用HPPD抑制因子,特别是上述除草剂,对植物,具体是农作物选择性除草的方法,特征是该除草剂用于根据本发明的转化植物,在农作物播种前、发芽前和发芽后是一样的。
本发明还涉及在含有根据本发明的种子或转化植物的田间的一片区域除草的方法,该方法包括在所述田间的区域施用一定剂量的HPPD-抑制除草剂,该剂量对杂草有毒,而基本不会影响根据本发明的种子或转化植物。
本发明还涉及栽培根据本发明的转化植物的方法,该方法包括在适合所述植物生长的田间的一片区域内播下所述转化植物的种子,在杂草存在的情况下,对所述田间的所述区域施用一个剂量的如上所述的以HPPD作为靶标的除草剂,该除草剂对杂草有毒,基本上不影响所述的种子和所述的转化植物,当它们达到所需的成熟,收割该植物,从收获的植物中随意地分离种子。
根据本发明,“基本不影响所述种子或所述转化植物”的表达是指根据本发明的转化植物在施用一个剂量的对杂草有毒的除草剂时显示出轻微的或零植物毒性。根据本发明,“对杂草有毒的剂量”的表述是指除草剂施用的剂量杀死了杂草。根据本发明,术语“轻微的植物毒性”是指发黄叶子的百分数少于25%,较佳地少于10%,更佳地少于5%。还应理解根据本发明对另外一种可比较的但未转化(即它不含有至少一个根据本发明的表达盒)的植物施用相同的毒性剂量,将导致观察到的所述植物的植物毒性症状比根据本发明的转化植物上观察到的症状严重。
在上述两个方法中,以HPPD作为靶标的除草剂的施用可根据本发明进行,在农作物播种前、发芽前和发芽后是一样的。
为了本发明的目的,术语“除草剂”是指具有除草活性的物质自身或与一种改变其效果的添加剂结合,例如,一种增强活性的(增效剂)或限制活性的(安全剂)试剂。预先具体描述了HPPD-抑制除草剂。当然,对于它们实际的应用,上述除草剂用本来已知的方式与农业化学中常规使用的制剂的佐剂相结合使用。
当根据本发明的转化植物含有另一个耐受另外一种除草剂的基因(如编码EPSPS的基因,它可能突变或未突变,赋予植物对草甘膦的耐受性),或者当转化植物对另一种除草剂天然不敏感,根据本发明的方法可包括HPPD抑制剂与所述的除草剂(如草甘膦)结合同时施用或在不同的时间施用。
通过以下的实施例将更加清楚地理解本发明的各个方面。
通过举例的形式给出下文实施例中描述的所有方法和操作以及相应的选择,通过各种方法可得到相同的结果。这个选择与结果的质量无关,因此,本领域熟练的技术人员可使用任何适合的方法来得到相同的结果。操纵DNA片段的大多数方法描述于Coligan等(1995),Ausubel等,(1995);Maniatis等(1982)和Sambrook等。
上述引用的目录参考将作为文献结合入本专利申请,具体的是定义编码天然、嵌合或突变的HPPD的核酸序列任选地与信号肽或转运肽结合的目录参考。
实施例I编码来自球形节杆菌的HPP氧化酶的基因的鉴别HPP氧化酶(HPPO)通过脱羧反应将HPP转化为4-HPA。由此该酶催化构建新辟HPPD旁路代谢途径所需的第一酶活性。HPP氧化酶活性的特征是存在于红串红球菌(Rhodococcus erythropolis)S1的粗提物中(Suemoti等,1995)或或存在于球形节杆菌的部分纯化的提取物中(Blakley,1977)。根据我们的知识,蛋白质未被纯化。为了能够引入该酶活性进入植物,需要鉴别它们的基因,可是使用各种方法(1)插入诱变和因此通过酶活性的缺失鉴别基因,(2)使用基因组文库进行微生物功能的互补,(3)为了找回核酸序列进行蛋白质的纯化。
使用了三种方法。由于这些技术不能鉴别HPPO基因,功能互补和插入突变使用得相对较少。
I.1材料和方法I.1.1-培养条件I.1.1.1-丰富培养基Luria-Bertani(LB;Bio101销售)培养基用于在分子生物学实验中培养细菌(大肠杆菌,荧光假单胞菌(P.fluorescens))。为了培养球形节杆菌,较佳地使用5%的绵羊红(Biomerieux)强化的Columbia-ANC培养基。该强化的培养基含有两种抑制革兰氏阴性微生物的抗生素(萘啶酸和结肠霉素)。尽管在丰富培养基中三种细菌在37℃的条件下生长,球形节杆菌和荧光假单胞菌通常培养于29℃。
I.1.1.2-MAg培养基Blakley(1997)描述的培养基发生沉淀,因此在使用前需要过滤。为了获得最佳的“最低限度”的培养基,我们通常改变培养基。考虑的因素包括球形节杆菌的生长率和HPPO的酶活性。选择的培养基(MAg)是M9培养基(Maniatis等,1982),将它稍做改动Na2HPO4·12H2O(6g/L);KH2PO4(3g/L);NH4Cl(1g/L);NaCl(0.5g/L);CaCl2(6mg/L);FeSO47H2O(6mg/L);酵母提取物(20mg/L);和最后,浓度为1g/L的底物(HPP或酪氨酸或的柠檬酸盐)。该培养基是高压蒸汽灭菌的。使用前,1mL灭菌的1M MgSO4加入每升培养基中。
该最低限度的培养基还用于培养荧光假单胞菌。
I.1.2-构建球形节杆菌基因文库没有用于制备完整的细菌cDNA文库的可靠方法。因此我们决定建立球形节杆菌基因文库。为建立此基因文库,我们选择粘粒系统。制备该粘粒文库用于功能互补实验,而后用于寻找含有hppO基因的粘粒。
I.1.2.1-粘粒载体pLAFR5I.1.2.1.1-载体的描述我们选择偶联的粘粒载体pLAFR5(Keen等,1988),它可以接受约20kb的插入。具有转移起点和具有广谱革兰氏阴性宿主的复制起点,它可通过三肠胃外偶联,转移到其它的细菌种类中,用于在各个细菌种类中检测功能的互补。它具有对四环素的抗性。
I.1.2.1.2-载体的制备使用碱性裂解方法纯化质粒pLAFR5(Maniatis等,1982),用RNA酶处理然后用Bam HI和Sca I消化。用Bam HI消化使它能够打开位点,在该位点中“连接”用Sau3A消化的基因组DNA的插入片段。用Sca I消化使它能够释放允许包膜的cos位点。经用苯酚然后氯仿提取后,DNA用乙醇沉淀。干燥DNA溶于水。这样制备的载体贮藏于-20℃。
I.1.2.2.-球形节杆菌基因组DNA的制备Blakley(1997)描述的在培养基(200mL)中制备的一种24-小时培养物(200mL,180rpm,29℃)在3000g、4℃离心15分钟。用10mL的溶解溶液(TE ph8;0.5%SDS;1mg蛋白酶K)溶解的细胞颗粒在37℃水浴中培养,并每20分钟轻微摇动一次。90分钟后,溶解细胞的悬浮液到灌入聚丙烯JA-20管中。然后加入10mL苯酚/氯仿/异戊基醇(25/24/1),随后在4℃下6000g离心15分钟。然后上清液转移到一个新的JA-20管中,其中加入1.8mL的10M醋酸铵和10mL的异丙醇。4℃下20,000g离心20分钟后,用70%的乙醇洗涤沉淀。干燥的沉淀用1mL TE(pH8)溶解,然后转移到2mL的Eppendorf管,其中加入10μLRNA酶(10mg/mL)。37℃下30分钟后,加入800μL苯酚/氯仿/异戊基醇。离心后上清液转移到新的Eppendorf管中并用0.8mL的氯仿提取。上清液然后转移到最后一个Eppendorf管中,其中加入200μL10M的醋酸铵和800μL异丙醇。离心后,用70%的乙醇洗涤沉淀,一旦干燥用500μL的水溶解。然后基因组DNA在20℃贮存。
I.1.2.3-球形节杆菌基因组DNA的受控消化只有40-45kb的粘粒可以被包膜。因为该载体是21.5kb,球形节杆菌基因组DNA的插入片段应在19-22kb大小之间。通过进行球形节杆菌基因组DNA的受控消化得到这些片段。为了确定受控消化的最佳条件,球形节杆菌基因组DNA的消化用各个量的Sau 3A限制酶进行。它显示最佳的消化条件是在37℃,使用0.08Sau3A酶单位30分钟。这样消化的基因组DNA大小在15-22kb之间。这样消化的基因组DNA用苯酚然后用氯仿提取,最后用乙醇沉淀。
I.1.2.4-球形节杆菌基因组DNA连接进入粘粒载体在最终10μL的体积中进行连接反应,该体积中含有500ng用Bam HI和Sca I消化的pLAFR-5,650ng用Sau 3A消化的基因组DNA,320单位的T4DNA连接酶(N.E.B)和5mM的ATP。在12℃下过夜进行连接反应(约16小时)。5mM的ATP可避免平头末端(Sca I)间的连接(Feretti和Sgaramella,1981),这样不具有插入片段的载体二聚体在λ噬菌体的头部不被包膜。
I.1.2.5-粘粒的包膜和粘粒文库的扩增使用GIGAPACK II XL试剂盒(Stratagene)根据厂商的说明进行粘粒的包膜,提供了比用常规转化技术得到的转染效率更高的效率。为了扩增粘粒文库,Keen等(1988)建议使用大肠杆菌DH-1和HB101。具体地,当菌株在麦芽糖上培养,它们产生膜结合蛋白,它能使噬菌体更好地附着从而使粘粒的转染更有效。根据Stratagene的建议扩增的该文库贮存于-80℃。为了评价该粘粒文库,从大约30个克隆分离的质粒DNA用Apa I或Eco RI消化。限制性特性保留于0.8%的琼脂糖凝胶上。
I.1.3-HPP氧化酶的纯化I.1.3.1-HPP氧化酶活性的比色测定为了能够控制纯化步骤,使用Blakley(1977)描述的比色测定方法测定HPP氧化酶的活性。通过在2M HCl溶液中加入2,4-二硝基苯肼(2,4-DNPH)停止该酶反应。在羧基功能的α位点2,4-DNPH与酮功能反应(例如HPP)。这样形成了一种腙,它可以通过碱化培养基显示。在酶反应过程中当HPP完全转化为4-HPA,腙不能形成,因此在碱性培养基中得到2,4-DNPH的特征性黄色。如果在酶反应过程中HPP没有完全转化为4-HPA,腙的形成是可能的。在碱性培养基中这些腙的颜色是棕色的。作为HPP消耗量的函数得到这两个极端间的颜色变化。在445或450nm处进行吸收测定。为了使该测定更易于操作,我们使用96-孔微平板形式。该反应混合物包括GSH(900μM);HPP(135μM);YPP(1.8mM);MgCl2(4.5mM);FAD(4μM);磷酸钾缓冲溶液(90mM)pH7.4。该混合物放置于冰上。50μL的测定部分和150μL的反应混合物放入每个孔中。在30℃20分钟后,用13μL的2,4-DNPH溶液(0.1%在2M HCl中)停止酶反应。混合物在环境温度下反应20分钟。通过加入13μL的10M NaOH溶液显示腙的形成。为了制备标准范围,制备了具有各种HPP浓度的反应混合物。用50μL的蛋白质提取物缓冲溶液取代50μL的蛋白质部分。作出每个2,4-DNPH的新溶液的标准曲线(2,4-DNPH溶液在黑暗中稳定6个月)。该测定的优越性是它的迅速性和简易性,但它具有测试底物消失而并非产物出现的缺陷性。另外,具有假阳性存在的可能性酪氨酸氨基转换酶活性将给出与HPPO活性相同的结果。特别是,在两个例子中,酮的功能消失了。因此我们开发了一个迅速而敏感的HPLC方法,该方法能够证实4-HPA的生产。
I.1. 3.2-用HPLC分析活性测定使用小Spherisorb ODS2柱(50×4.4mm,颗粒大小3μM)开发了一种HPLC的方法。在等度条件A90%、B10%下(其中缓冲液A水,0.1%TFA和缓冲液B乙腈)进行层析,流速为0.8mL/min,随后在230nm处进行洗提。在这些条件下,注入5分钟后可以分离4-HPA、HGA、3,4-DHPA和HPP。柱是由Merck定做的。
I.1.3.3-蛋白质的纯化在建立这一方法的过程中寻求简易的方法。
I.1.3.3.1-初步测定初步测定的目的是确定混合物(NaCl、KCl、1-丙醇、己二醇等)的影响以及pH对酶活的影响。用培养于含有酪氨酸作为唯一碳源(MAg-酪氨酸)的MAg培养基中的球形节杆菌的粗提物进行反应。检验的混合物加入反应培养基中。为测定pH对HPPO酶活的影响,制备各种磷酸盐缓冲溶液。
I.1.3.3.2-纯化方法将球形节杆菌菌株在LB琼脂培养基或Columbia-ANC琼脂培养基上铺板。29℃培养16小时后,菌落移出接种于5mL的LB培养基中,在生长条件下29℃、180rpm培养8小时。然后50μL的这种预培养物接种于1.5L的MAg-酪氨酸或MAg-HPP培养基中,然后在具有细棒的锥形瓶中以29℃、180rpm进行培养。培养48小时后,通过4℃、5000g离心15分钟收集细胞。然后该细胞重悬浮于50mM pH7.4的Tris-HCl缓冲溶液中,再如前述进行离心。沉淀溶解在2mL的50mM pH7.4的Tris-HCl缓冲溶液中。细胞在冰浴中超声处理(Vibra Cell,Sonic MaterialsINC.,Connecticut,USA)15分钟,功率4,30%脉冲。不能溶解的碎片经4℃、20 000g离心25分钟除去。回收上清液,该上清液含有“粗提物”。将该上清液在液氮中冰冻然后贮存于-80℃(6个月内不会明显地损失活性)。将没有预先脱盐的粗提物填充到在pH7.4的50mM的磷酸盐缓冲液中平衡的“EMD/DEAE 650S”弱阴离子交换柱(Merck)中。通过使用NaCl浓度梯度得到洗脱的酶活性(在pH7.4的50mM的磷酸盐缓冲溶液中)。集中包含酶活性的部分。得到的蛋白质溶液用pH7.4的50mM的磷酸盐缓冲溶液稀释2.7倍。然后蛋白质填充到“source Q”强阴离子交换柱(XK16,Pharmacia)(30mL,Pharmacia)中,该柱用pH7.4的50mM的磷酸盐缓冲溶液预平衡。集中经酶活性鉴别的蛋白质部分的值,然后通过UVIKON 10kDa膜浓缩。然后得到的蛋白质提取物使用在pH7.4的10mM的磷酸盐缓冲溶液中平衡的“PD10”柱(Pharmacial)经凝胶过滤技术脱盐,并用相同的缓冲液洗提。然后将蛋白质填充到用pH7.4的10mM的磷酸盐缓冲溶液平衡的羟磷灰石柱(XK9/15,Pharmacia)(2mL;羟磷灰石DNA级Bio-Gel?HTP凝胶;Bio-Rad)上。通过使用磷酸盐梯度洗提酶活性。集中并浓缩含有酶活性的部分。当蛋白质的浓度大于1mg/mL通过加入FAD、GSH和甘油保存活性蛋白质以获得如下最终浓度27μMFAD,110μMGSH、0.8%的甘油。这样制备的蛋白质可以贮存于-80℃至少6个月。
I.1.3.3.3-蛋白质的测定根据Bradford方法(1976)使用标准?-球蛋白测定蛋白质。
I.1.3.3.4-蛋白质凝胶的染色根据Laemmli方法(1970)在10%聚丙烯酰胺凝胶上测定蛋白质部分。迁移后凝胶中的蛋白质可使用考马斯兰方法(Chua,1980)或使用硝酸银方法(Schoenle等,1984)进行染色。
I.1.4-N-末端和内部肽的蛋白质微量测序蛋白质的微量测序使用Edman方法(Laursen,1971)进行。为了在测序中得到最好的结果,在同一天制备凝胶。
I.1.4.1-制备丙烯酰胺凝胶及其电泳根据Laemmi方法(1970)使用Hoefer?微型凝胶系统制备凝胶(8.5%、10%、12%)。用“变性的加样蓝”(denaturing loading blue)溶液(150mM Tris-HCl、pH6.8、4%SDS、2%(v/v)β-巯基乙醇、3.3%(v/v)甘油、0.03%溴苯酚蓝、qs 10mL的milliQ水)将蛋白质稀释到1/3。煮沸5分钟后蛋白质填充到丙烯酰胺凝胶上。使用变性的迁移缓冲液(25Mm Tris基底;250mM甘氨酸;0.014%(v/v)β-巯基乙醇;0.1%SDS)在环境温度下进行迁移,每胶施以15mA的电流强度。
I.1.4.2-N-末端测序的制备为了能够进行N-末端的测序,使用半-干转移技术将凝胶转移到PVDF膜(PROBLOTT-Applied Biosystems)上。使用“半干电印迹仪”设备(Bio-Rad)(300mA)和在CAPS-基底的培养基(转移缓冲液10mM CAPS,Ph11.0;10%(v/v)甲醇)中进行多肽的电转移30分钟。转移缓冲溶液不含有甘氨酸,它具有“污染”测序的危险。转移后,用milliQ水冲洗膜几秒钟。然后在以胺黑为基底的染色溶液中浸泡几秒钟(Aldrich;ref.19.524-3)。该溶液含有45%(v/v)的甲醇、1%(v/v)乙酸、0.1%(m/v)的胺黑和63.9%(v/v)的水。当看到对应于感兴趣的蛋白质的带,膜用milliQ水彻底冲洗,然后在空气中晾干。将含有感兴趣的蛋白质的膜的部分(kDa)切下,用于测序。
I.1.4.3-关于内部肽测序的制备为了在凝胶中显示出蛋白质,使用胺黑染色方法,该方法与用于染色PVDF膜的方法稍有不同。迁移后,用包括50%甲醇、10%乙酸、40%milliQ水的溶液固定凝胶30分钟2次。用含有45%甲醇、10%乙酸、45%水和0.003%(w/v)胺黑的溶液进行染色。蛋白质渐渐出现。当染色足以确定蛋白质的位置,用milliQ水彻底冲洗凝胶。剪下感兴趣的带,然后在真空离心蒸发浓缩器(Savant)中脱水。失去了约1/3长度的凝胶带用于测序。用Lys-C内切蛋白酶(测序级,Boehringer)消化蛋白质后得到内部肽。聚丙烯酰胺凝胶中的蛋白质在150μL的含有0.03%SDS、pH8.6的Tris-HCl缓冲溶液(0.1M)中消化,在35℃、0.4?g的Lys-C内切蛋白酶存在的情况下消化18小时。消化的蛋白质注入DEAE-C18 HPLC柱(直径为1mm);用含有1%TFA的乙腈梯度(从2-75%)洗提肽。Lys-C内切蛋白酶特异性地在赖氨酸的羧基端切割多肽。
I.1.5.1-使用球形节杆菌MndD基因理论的确认MndD基因的一部分(867bp)使用引物“OZ-MndD-S711”ACGTCACCGAAGAGGATGAA AAC和“OZ-MndD-AS1578”ACGGCCATTT CGGACTTTTC经PCR扩增。使用如下步骤进行PCR扩增95℃5分钟;25个循环95℃45秒,56℃45秒,72℃1分钟,72℃5分钟;保持4℃。该反应混合物在最终的50μL体积中含有200-500μM的dNTP、20-200ng的粘粒或基因组DNA和100pmol的各个引物。
I.1.5.2-通过PCR鉴别编码HPP氧化酶的基因部分使用“Advantage-GC基因组PCR”试剂盒(Clontech)进行PCR。该试剂盒包括一个“GC-溶解(GC-melt)”三甲铵乙内酯-基的佐剂和耐热聚合酶混合物和其它组分-主要是具有嗜热栖热菌(Thermus thermophilus)(Tth)。扩增在球形节杆菌基因组DNA上进行,使用如下的步骤94℃5分钟;30个循环94℃20秒,60℃30秒,72℃3分钟,72℃6分钟;保持4℃。该反应条件是50μL的反应体积中包括400μM的dNTP、50ng的基因组DNA、100pmol的各个引物和1X“GC-溶解”。在这些条件下,我们扩增937bp的带,我们称之为Z2。
还可使用Epicentre Tth或Tbr(Thermus brockianus-Finnzyme)进行PCR扩增。Tbr是唯一检验的可以进行PCR而不需要添加剂(DMSO,甘油、三甲铵乙内酯)的耐热聚合酶;它还是一个高度保真的酶。
I.1.6-粘粒文库的筛选使用洋地黄毒苷-标记冷探针技术筛选粘粒文库(Boehringer Mannheim,1995)。
I.1.6.1-Z2-Dig探针的的制备在50μL的最终体积中通过PCR用洋地黄毒苷标记探针,在段落II.5.2中描述的条件下,除dNTP混合物以外,该混合物还含有90μMdUTP-Dig;135μMdTTP;225μMdATP;225μMdCTP;225μMdGTP。扩增的探针通过装载3μL的反应物到0.8%的琼脂糖凝胶上确定其数量。一种轻微的背景噪声出现,即PCR不是十分专一的。为了避免所有后续问题,整个PCR装载到凝胶上,使用Qiaex II试剂盒(Qiagan)提取感兴趣的带。
I.1.6.2-转移粘粒文库到杂交N膜(Hybond N membrane)上使用在大肠杆菌HB101中制备的粘粒文库的甘油原液接种2mL的LBT15培养基。生长8小时后,测定其OD600;为了在每个培养皿(144cm2)中得到约1000个克隆,制备了血清稀释液。在37℃生长16小时后,根据Boehringer Mannheim的建议(1995),细菌转移到Hybond N膜上(Amersham)并溶解。释放的DNA通过暴露于紫外线(45秒传递120mJ-Stratalinker;Strategene)固定在膜上。如Boehringer Mannheim(1995)建议的,通过进行蛋白质酶K的处理,将细胞碎片从膜上除去。
I.1.6.3-预杂交-杂交-检测通过使用洋地黄毒苷标记探针(Boehringer Mannheim(1995))的杂交技术,在一个放置于摇动平台的袋中进行预杂交和杂交步骤。预杂交(5?SSC;0.5%SDS;0.1%N-月桂基肌氨酸;1%封阻剂;(Boehringer Mannheim,参考文献1096 176);100?g/mL超声处理和变性的大麻哈鱼精液)在65℃进行4小时。膜的杂交在68℃进行过夜(含有20ng/mL的洋地黄毒苷标记探针的新鲜预杂交培养基在100℃变性5分钟)。第二天,用缓冲液A(0.5?SSC;0.1%SDS,65℃)洗涤4次除去过量的探针和具体的杂交产物。然后在环境温度下缓冲溶液B(138mM苹果酸,142mM NaCl,用NaOH调节pH为7.5,0.3%的Tween 20)中平衡该膜5分钟,然后它们用封阻剂饱和30分钟(Boehringer Mannheim),杂交前在新鲜的封阻剂溶液中用碱性偶联的磷酸酶抗-洋地黄毒苷抗体(“抗-洋地黄毒苷-AP,Fab片段”;Boehringer Mannheim)稀释到1/10 000。30分钟后在缓冲溶液B中冲洗膜15分钟2次,然后在碱性磷酸酶反应缓冲溶液(0.1M Tris;0.1M NaCl;0.05M MgCl2,pH9.5)中平衡5分钟。用1ml的准备-使用的CSPD覆盖该膜,然后在37℃下培养15分钟。在37℃下的这一步骤使碱性磷酸酶迅速活化与抗体偶联。通过暴露HyperfilmECL 1-15分钟培育该膜。
I.1.6.4-通过DNA印迹(Southern)和PCR分析阳性粘粒在膜上杂交中鉴别的粘粒通过PCR和Southern技术证实。在这个例子中,通过碱溶解纯化的粘粒DNA为限制酶所消化,然后在0.8%的琼脂糖凝胶中分离。经Southern技术在20?SSC中将凝胶转移到Hybond N+膜上(Amersham)(Ausubel等,1995)。转移后,用2?SSC冲洗膜,然后使用紫外线(45秒内传递120mJ-Stratalinker;Stratagene)将DNA固定在膜上。然后使用前面描述的冷探针技术培育膜。
I.1.7-克隆载体和宿主细菌PCR-扩增的DNA序列通常克隆入质粒p-GEMT-easy(Promega),它允许使用“蓝-白”技术进行筛选。对于过量表达,使用质粒Pkk223-3(Pharmacia),它将基因置于tac启动子的控制下。通常使用大肠杆菌DH5(New England Biolabs)或大肠杆菌XLl Blue(Stratagene)进行克隆。对于过量克隆,大肠杆菌BL21(DE3)是优选的。
I.1.8己酰乳酸合成酶的酶活己酰乳酸合成酶(ALS)的活性使用Chang和Duggleby(1997)描述的比色法测定。在总体积为250μL的微量培养板中进行反应。对于各个反应,在37℃,225μL的反应培养基中培育25μL的酶30分钟,该培养基包括50mM Kpi,PH7.0;50mM丙酮酸钠;1mM TPP;10mM MgCl2;10μM FAD。通过加入25μL的10%的硫酸反应停止。然后60℃培养微量培养板15分钟。然后加入在4M NaOH中的250μL的0.5%肌氨酸和250μL 5%的?-萘酚(?-萘酚溶液应在使用前10分钟制备)。然后60℃培养微量培养板15分钟,然后在室温下培养15分钟。一种樱桃红出现。在525nm进行读数(λM=22 700M-1cm-1)。
I.2-结果-讨论根据文中建立HPPD旁路代谢途径,HPP氧化酶是我们希望引入植物的第一种酶活性。为了能够识别编码HPP氧化酶的活性的基因,使用了各种方法(1)插入突变因此通过酶活性的缺失识别基因,(2)使用基因文库进行微生物的功能性互补,(3)为了找回核酸序列纯化蛋白质。第三种方法是优选的。
I.2.1-HPPO的纯化I.2.1.1-培养条件的优化开始纯化蛋白质前,确定允许在细菌中表达的培养条件是有用的。培养条件最优化的结果显示,当球形节杆菌的生长依赖于碳源如琥珀酸盐、延胡索酸盐或葡萄糖时检测不到HPP氧化酶活性。另一方面,当使用HPP、酪氨酸或苯丙氨酸作为唯一的碳源培养球形节杆菌时检测到HPP氧化酶活性。如果酵母提取物的量增加(例如200mg.L-1代替20mg.L-1),观察到产生的酶活的下降。在这些观察的基础上确定MAg培养基。最后,观察到高-密度的培养物(在最初的稳定期;OD600-1)比培养物在指数生长期内(OD600~0.4)表现出较弱的HPP氧化酶活性。
I.2.1.2-初步的分析我们已经确定了用于HPPO生产的最适的培养基,我们现在寻找在纯化过程中不会削弱HPP氧化酶稳定性的条件。由于色谱法包括阴离子交换树脂,并且色谱法作为pH的一个功能,了解酶对pH和对盐的敏感性是重要的。我们观察到如Blakley(1997)所证实的最适的pH在pH7.0-7.8之间。由于要观察到酶活性的下降需要大于750mM的浓度,显示出酶对于盐(NaCl和KCL)相对不敏感。我们现在知道酶活良好表达的条件并且我们已确定在纯化过程中HPP氧化酶活性对可能干预的因子的敏感性,因此HPPO的纯化可以开始了。
I.2.2.3-HPPO的纯化为纯化HPPO,使用上面描述的方法。用150-200mM NaCl溶液,在50mM磷酸缓冲溶液(pH7.4)中,从DEAE EMD 650S洗提酶活。收集含有酶活的片段并在4℃保存过夜。在这一步,冰冻事实上会导致活性的损失。然后蛋白质装载到SourceQ树脂上。然后用150-200mM NaCl溶液,在50mM磷酸缓冲溶液(pH7.4)中洗提酶活性。收集含有酶活的片段,然后集中于UVIKON 10kDa膜,在4℃保存过夜。最后,通过对羟基磷灰石圆柱使用磷酸盐梯度,在第三个步骤中纯化HPPO。酶活通过浓度为30mM左右的磷酸盐洗脱。在羟基磷灰石圆柱出口、含有HPP氧化酶酶活的部分在用硝酸银染色的SDS-8.5%的PAGE凝胶上分析。凝胶上显示产生两个蛋白带。通过酶活性分布图和蛋白质洗脱分布图之间的比较我们认为HPPO符合高分子蛋白质的特征(约60kDa)。在进行的实验中,开始用1.5g的提取自球形节杆菌的溶解蛋白质进行纯化,我们回收了150μg蛋白质混合物(包括约70μg HPPO),没有测定到有关特异性活性的纯化因子。结果,我们使用了全部反应条件以洗脱酶活性。此外,该问题还在于蛋白的鉴别,而不在于纯化方法的改进。HPLC分析在每一个纯化步骤的结束时进行的反应,显示与4-HPA标准(SIGMA)具有相同存留时间的产物的出现。将包含在丙烯酰胺凝胶中的40pmol的HPPO蛋白(60kDa)转移到PVDF膜上用于测序。蛋白质转移到膜上用于测定N-末端序列,而蛋白质包含于凝胶中用于测定内部肽的序列。
I.2.2.4-HPPO测序的结果用Lys-C内切蛋白酶消化HPPO后,在HPLC出口处得到几个内部肽。这一结果表明该蛋白质含有不多的赖氨酸;具体地说,Lys-C内切蛋白酶在赖氨酸之后进行酶切。如果赖氨酸相对稀少,用内肽酶K消化产生长肽片段,该片段仍然吸附在柱里,甚至使用完全疏水的条件也不能被洗提。基于层析峰的形状和表观量,选定了三种肽然后测序。以它们离开HPLC柱的次序命名它们肽No.4,肽No.6,肽No.11。其序列分别是(A)WWAEALK,AAAGRILRLL DDAAGANASK,XDNRFTAVDF XT(其中X是一个未确定的氨基酸)。以40%的起始产率得到最初30个N-末端氨基酸序列TSLTVSGRVA QVLSSYVSD VFGVMGNGNV Y。没有发现对应于起始密码子(ATG或GTG)的氨基酸(甲硫氨酸或缬氨酸)。得到的最初产量(等量的15pmol BSA)与得到的内部肽的产量相比较(等量的30-35pmol BSA)说明一些蛋白质在N-末端被阻断。得到的N-末端序列和内部序列在基本数据上没有显示同源性。基于得到的肽序列,合成简并的寡核苷酸以使用PCR鉴别HPPO基因。
I.2.3-PCR技术的确定和hppo基因部分的鉴别I.2.3.1-PCR技术的确定节杆菌(Arthrobacter sp.)基因组DNA的主要部分鸟嘌呤和胞嘧啶碱基的含量(GC%)在59%和66%之间;然而对于活泼节杆菌(A.agilis)(前面所述的活泼微球菌(Micrococcus agilis))其鸟嘌呤和胞嘧啶碱基的含量为67-69%(Koch等,1995),对于黑蓝节杆菌(A.atrocyaneus)是70%(Jones等,1991)和对于鉴定于北极冰上的节杆菌是73%(Junge等,1998)。这些高含量的鸟嘌呤和胞嘧啶可使其更难以进行PCR。因此,我们使用基因编码球形节杆菌“锰依赖的过氧化物酶”(MndD)确定我们的PCR方法(基因组DNA、聚合酶等)(Boldt等1995)。该HPP酶的降解途径催化3,4-二羟苯乙酸的芳香环的打开。为了控制MndD基因的扩增,我们测试了购买自几个供应商的水生栖热菌(Thermophilus aquaticus)(Taq)耐热聚合酶(Perkin Elmer,ATGC,Appligene,Qiagen,Sigma)。在所有的情况下,得到MndD基因的扩增。然而,在相同的条件下,使用简并的引物编码HPPO肽,即使使用添加剂(DMSO、甘油)也没有得到hppo基因的扩增。
I.2.3.2-用PCR技术鉴别hppo基因的N-末端部分我们具体扩增了936bp的DNA序列,该序列可能对应于hppo基因的N-末端部分。首先使用简并的引物0x3TTNGCNCCNG CNGCRTCRTC和OZ10NGAYGTNTTYGGNGTNATGGG NAAYGG分别对应于肽No.6的部分和N-末端肽序列的部分,其次,使用“先进的GC基因组PCR”试剂盒(Clontech)扩增。该Clontech试剂盒设计用于在富含GC碱基的基因组上进行PCR。它含有耐热聚合酶(包括Tth)和内铵盐基的添加剂的混合物。Tth是一种纯化于嗜热栖热菌的耐热聚合酶。每个引物的简并性是1024,即在1024中有一个引物显示正在寻找的基因的核酸序列。简并性起源于一种氨基酸可以被几个密码子编码的事实,例如,丙胺酸被4个密码子编码(GCA、GCC、GCG、CGT)。用于引物的简并密码限定如下N=A或T或G或C;R=A或G;Y=T或C。理论杂交温度分别是55.4℃和57.6℃。尽管PCR中使用60℃的杂交温度,单独的0X3引物允许非特异性扩增。我们使用两个简并的引物,通过PCR具体扩增了936bp的DNA片段。我们必须确定该扩增的DNA正确对应于寻找的hppo基因。
I.2.4-936bp的DNA片段的特征用PCR扩增的936bp的DNA片段在琼脂糖凝胶上纯化。然后根据厂商的说明方便地将该片段克隆入pGEM-T,然后测序。当得到的核酸序列被翻译,观察到在两个末端该序列编码完全的肽No.6和大部分的N-末端序列。因此我们确信扩增了编码纯化的和微量测序的蛋白质HPPO的基因部分。该核酸序列含有73%的鸟嘌呤(G)和胞嘧啶(C)碱基;还注意到在信使RNA的最初250个碱基可能形成次级“茎-环”结构。这种高含量的G和C碱基以及次级结构的存在可部分解释在获得该基因部分的PCR扩增中遇到的困难。936bp的核酸序列以及相应的蛋白质序列与基础数据中记录的序列不显示同源性。我们现在得到了来自内部肽No.6的N-末端的936bp的序列。由于蛋白质约60kDa,寻找约1650bp的基因。因此还剩余约700bp有待鉴定。为此,我们将筛选在粘粒pLAFR中生产并在大肠杆菌HB101中扩增的球形节杆菌基因组文库。
I.2.5-筛选球形节杆菌粘粒文库制备的基因组文库转移到膜上然后使用以洋地黄毒苷标记的936bp DNA片段作为探针进行筛选。标准方法适合“常规的”DNA(60%AT),而该936bp片段显示23%ATD的估计比例。如果我们保持如常规DNA情况下相同的dUTP-Dig/dTTP比率,我们得到一个弱标记探针以及因此而得到不敏感的检测。所以我们优化dUTP-Dig/dTTP比例以适合于标记探针的需要(段落II.7.1)。基因组文库的筛选使之能够鉴别具有不同限制特性的4种粘粒(Cos1A、Cos2A、Cos4A Cos17A1)。将使用粘粒获得的Southern杂交的结果与使用球形节杆菌基因组DNA获得的结果进行比较,我们选择粘粒2A。
图14以用Not I限制性酶消化粘粒作为例子描述了使用的方法。首先观察到用Not I消化的粘粒载体没有Z2-Dig探针杂交。另外,观察到粘粒1A显示在2.3kb的单一的杂交带,而粘粒2A、4A和Cos17A在4.3和2.3kb的两个杂交带。现在,用Not I消化球形节杆菌基因组产生4.3和2.3kb的两个带;因此,我们认为粘粒1A不含有所找寻的全部信息。基于其它的限制和使用相同的方法除去粘粒4A和17A。然后在Z2-Dig探针的中部鉴定的Not I位点的两边约3kb的距离测定粘粒2A的序列。基因组DNA的杂交结果还显示基因存在于单一的拷贝中。我们鉴定了粘粒2A,我们测定其序列大于6.2kb。现在我们可以分析衍生自球形节杆菌基因组的DNA序列。
I.2.6-6.2kb的球形节杆菌基因组DNA的全面分析使用载体Nti软件,从经粘粒2A的测序得到6255bp的核酸序列确定潜在的基因位置。发现通过PCR鉴定的936bp序列是潜在基因的一部分。因此该潜在基因可能相当于hppO基因。通过BLASTX算法进行同源性搜索鉴定了4个潜在的基因A、B、C、D(图3)。基因A将编码氨基酸转运蛋白,基因B将编码磷酸组氨醇胺转移酶;然而,以前的研究显示该酶在革兰氏阳性菌枯草芽孢杆菌中具有酪氨酸氨基转移酶的活性(Nester和Montoya,1976),基因C将编码转录调节基因,而基因D将编码操纵子调节基因。
I.2.7-hppO基因的分析I.2.7.1-概述在得到的6256bp序列上,hppO基因(绿色)界定在位置3143上的ATG起始密码子的5’端和位置4823上的终止密码子TAG(红色)的3’端之间。因此该基因具有1680bp的实际长度。它显示具有高含量的G和C碱基(71.4%)。在核酸序列中寻找同源性(BLASTN)没有得到鉴定。为了更全面地表征该基因,寻找转录和翻译的特异性元件。
I.2.7.2-表征hppO基因转录和翻译的元件鉴定了潜在的转录启动子盒(图4)。称作“Pribnow盒”的盒“-10”位于3082到3088之间(AAAAATA),盒“-35”位于3055到3059之间(TTGCA)。这样确定的这些盒与规范序列(分别为TATAAT和TTGACA;Singer和Berg,1992)稍有不同。这可反映允许组成性转录的因子间的弱相互作用或不同的转录因子间所需的相互作用。在位置3096的腺嘌呤可能是转录起始碱基。最后,在位置3068到3072之间(TGTGA)鉴定到相当于CAP蛋白质(分解代谢基因活化蛋白)结合位点的序列。发现该CAP蛋白结合位点与在优化的培养条件中得到的结果是一致的。总之,hppO基因的转录可能在弱启动子的控制下,具体地为葡萄糖所调节。Shine-Dalgarno序列(Singer和Berg,1992)允许核糖体小亚基的结合。根据AGGA共有序列类推,在翻译起始密码子(ATG)上游12个碱基处鉴定到Shine-Dalgarno序列(GACGAT;在位置3131-3136)。还观察到信使RNA 5’端部分(约250个碱基)能够形成茎-环结构。现在,在启动子ATG区域内的该mRNA区域的次级结构影响翻译的起始步骤。因此,当启动子ATG或Shine-Dalgarno序列在细胞间配对,起始是零或相对无效。因此可提出这样的问题是否观察到的茎-环结构在调节翻译中可能起作用。
I.2.7.3-在tac启动子的控制下HPPO的表达HPPO的过量表达有利于确定动力学特征,以允许抗体的生产,还有利于结构分析的目的。在两个阶段,基因被克隆进入载体pKK223-3。在确定用于鉴别hppO基因的条件下和使用引物HPP-C-sense(CATGACTTCA CTTACAGTGT CC)和HPP-C-term(CAAACTGAGT AGCAGCTCAGG)通过PCR扩增的基因被克隆进入载体pGEMT-easy。选择在1ac启动子反义方向上显示hppO基因的克隆。然后用Eco RI消化。通过这样做恢复hppO基因,并将其插入到用Eco RI消化的载体pKK223-3中。选择在tac启动子控制下显示hppO基因的克隆pKK3-2。当通过加入IPTG诱导克隆pKK3-2的表达时,可检测到HPP氧化酶的活性。然而在变性的丙烯酰胺凝胶上分离的粗提物中没有检测到过量表达的蛋白质(57.4kDa)。因此过量表达的方法尚待改进。为了便于过量表达的蛋白质的纯化我们还设想克隆HPPO作为与Tag序列的融合(GST、聚组胺酸、蛋白质A等)。我们刚刚确定地显示鉴定的编码HPP氧化酶活性的基因。然而在蛋白质序列水平上进行同源序列的寻找(BLASTX或BLASTP),观察到HPPO蛋白质与乙酰乳酸合成酶(ALS)、丙酮酸氧化酶(POX)、丙酮酸脱氢酶(PDH)显示出25%以上的同一性。因此可能鉴别非常保守的基序,如有关TPP协同因子结合的基序(图5)。另外,HPPO的疏水特征与ALS得到的疏水性(未显示)很接近。为了确定坚定的基因确实编码HPPO而不是具有HPP氧化酶类型的次级活性的ALS、POX或PDH,我们决定测试HPPO的次级活性。
I.2.8-HPPO对ALS蛋白质同源性的找寻显示HPPO显示出ALS具有25%以上的同一性。这一结果,尽管起初让人吃惊,具有一定的逻辑性。具体地说,这两种酶使用FAD和TPP作为反应协同因子。它们都进行脱羧作用。而且,ALS的一种底物是丙酮酸;现在,我们的底物是?-取代的丙酮酸羟苯基丙酮酸。因此可能活性位点的结构接近,从而这些蛋白质共有酶活性。为了在HPPO中寻找ALS的活性,我们使用重组的大亚基和从拟南芥(Arabidopsis thaliana)(Chang和Duggleby,1997)和大肠杆菌(Hill和Duggleby,1998)中纯化ALS作为我们进行的实验中的阳性对照。得到的结果显示HPPO没有显示任何ALS的活性。在这种情况下,我们显示测定的两种ALS不具有HPP氧化酶的活性。最后,我们观察到HPPO不被115ppm的imazapyr(ALS抑制因子,氨腈)显示。这些结果明确地显示,尽管具有共同点(蛋白质序列和疏水性),ALS和HPPO是明显不同的酶,它们不具有次级酶活性。
实施例2编码4-HPA 1-羟化酶的基因的鉴定4-HPA 1-羟化酶(HPAH)通过羟化反应伴随乙酰基链的置换将4-HPA转化为HGA。该酶的活性已在红串红球菌S1(Suemori等,1995)的粗提物上或食酸假单胞菌(Hareland,1975)部分纯化的提取物上表征。Suemori等将其纯化(1996),但是该蛋白质和基因序列没有公开。为了能够向植物中引入这种酶的活性,需要鉴定该基因。
可以预想各种方法(1)使用基因组文库的表型的和/或功能的互补,(2)插入突变和因此通过酶活性的丢失鉴定基因,(3)为了找回核酸序列纯化蛋白质。因为在假单胞菌的各个种类和菌株上已证实了许多分子生物学方法的效率,所以我们选择食酸假单胞菌进行这三种方法。通过举例,将涉及小-Tn5转座子(De Lorenzo等,1990),广宿主谱载体如pBBR1MCS(Kovach等,1994,1995;D’Souza等,2000),和通过偶联转移的技术。小-Tn5转座子可用于扰乱基因(de Lorenzo等,1990;Fedi等,1996;Campos-Garcia等,2000)或引导基因进入细菌的基因组(Prieto等,1999)。我们通过表性互补开始我们的方法,因为该方法似乎最迅速和最简洁。随后同时进行其它两种方法。然而,这里我们不进行插入突变的方法,因为后面不使用该方法。
II.1-材料和方法II.1.1-在大肠杆菌中构建食酸假单胞菌基因组文库我们使用粘粒pLAFR5和食酸假单胞菌的基因组DNA构建该文库。我们使用宿主菌株大肠杆菌HB101。
II.1.2-4-HPA 1-羟化酶的纯化II.1.2.1-分光光度活性测定在Hareland等(1975)描述的由4-HPA 1-羟化酶催化的反应中,消耗了分子氧、NADH、H+。我们选择在NADH、H+氧化成NAD+后测定酶活性。反应成分包括300μMNADH、H+;6.7μM FAD;100mM Kpi;1mM DDT;10-50?g的蛋白质。通过加入底物1mM 4-HPA引发反应。随后在340nm或292nm反应进行2-10分钟。具体地说,NADH、H+的消耗使得在340nm处吸光率下降,而尿黑酸的生产使在292nm处的吸光率增加。分光光度测定非常迅速,常规是在纯化步骤中蛋白质洗提后使用。
II.1.2.2-HPLC活性测定用HPLC分析酶反应可以证实HGA的生产(保留时间、紫外光谱)。在与上述相同的条件下进行酶的测定。然而,通过加入1/3体积的20%高氯酸停止反应。然后使用90%的相A和10%的相B或92%的相A和8%的相B等度洗脱用HPLC分析反应。相A是含有0.1%的三氟乙酸(TFA)的milliQ水,相B相当于乙腈。在90%-10%的等度洗脱中,HGA洗脱1.2分钟,而在92%-8%的等度洗脱中,HGA洗脱1.4分钟。洗脱通常在230nm记录。Van den Tweel等(1986)使用2,2’-二吡啶(非血红素铁蛋白抑制因子)抑制尿黑酸过氧化酶并因此允许HGA的累积。为此,2mM的2,2’-二吡啶加入一些反应基质。在这些色谱分析条件下,可以鉴定4-HPA和HGA。HPLC系统包括Alliance 2690 HPLC(Waters)和996二极管数组检测器(Waters)。
II.1.2.3-HPAH蛋白质的纯化在含有4-HPA作为唯一碳源的M63培养基上,在29℃、220rpm培养食酸假单胞菌48小时。6℃下3000g离心细菌15分钟(Beckmann J2/21 M/E离心)。在超声处理的缓冲液(0.1M Kpi,pH7.2,1mM MgSO4;1mM DTT;1mM盐酸苯甲脒;5mM的己酸)中提取细菌沉淀。盐酸苯甲脒和己酸是蛋白酶抑制因子。超声处理进行9分钟,超声处理每40秒在功率5进行20秒(Vibra Cell,Sonic MaterialsINC.,Connecticut,USA)。在超声处理过程中,样品在冰溶解的温度保存。超声处理的提取物4℃、15000g离心15分钟。回收的上清液用1%的硫酸链霉素沉淀。在4℃、15000g离心15分钟除去沉淀。上清液在PD10柱(Pharmacia)上脱盐,然后装载到在缓冲液A(20mM Kpi,pH7.2,10%的甘油,1mM MgSO4;1mM DTT)中平衡的DEAE/EMD 650S柱上。使用缓冲液B(缓冲液A;1M KCl;100μM FAD)进行洗脱。KCl浓度在150mM的区域内4-HPA 1-羟化酶的活性被洗脱。活性片段,通过UVIKON 10kDa膜浓缩,然后在PD10柱上脱盐,再装载到在缓冲液A(上述)中平衡的Red亲和柱(Red 120琼脂糖型3000CL,SIGMA Ref R-0503)。在两相中进行洗脱。首先是使用增加了FAD使最终浓度为50μM的缓冲液A洗涤Red柱。其次,洗脱蛋白质;为此缓冲液A在FAD(3mM)和在NADH、H+(10mM)中强化。收集含有感兴趣的蛋白质的片段,浓缩并在-80℃冷冻。
II.1.3-N-末端和内部肽的蛋白质微量测序运用在HPP氧化酶中所述的方法对该纯化蛋白进行测序。但是,为了生产内部肽,用胰岛素代替Lys-C肽链内切酶消化蛋白质。胰蛋白酶在赖氨酸和精氨酸之后进行酶切。用胰蛋白酶消化通常导致产生的片段比用Lys-C肽链内切酶消化得到的片段小。为了能够精确地测定回收肽的序列,有时需要用HPLC再次纯化回收的肽。
II.1.4-通过简并PCR鉴定编码HPAH的基因部分在43页上给出的简并性密码[最初的]用于简并性引物的合成。在200μL的试管,最终体积为50μL中进行PCR。该反应溶液含有Perkin Elmer缓冲液,250μMdNTP,50ng的食酸假单胞菌基因组DNA,和2个酶单位的AmpliTaq(PerkinElmer)。使用“Hybaid Touchdown”热循环94℃ 3分钟,然后45个循环94℃ 30秒,50℃ 1分钟,72℃ 1分钟30秒,随后在回到4℃前,在72℃最终延长5分钟。装载10μL到1%的琼脂糖凝胶后评价PCR。在这种条件下鉴定到536bp的带。
II.1.5-筛选食酸假单胞菌粘粒文库粘粒文库铺板于LBT15培养基,并在37℃下培养16个小时。然后该培养皿转移到4℃。1小时后,根据Grunstein和Hogness的方法(1975),集落转移到HybondN膜上(Amersham)。使用以前鉴定和纯化的536bp PCR片段杂交膜。用32p进行检测。使用“DNA Ready to Go”试剂盒(Pharmacia)标记探针。在小瓶中进行预杂交、杂交和洗涤。将膜在含有5×SSC、6%Denhardt’s和0.5%SDS的溶液中,68℃预杂交4小时。68℃杂交16小时。在65℃下,2?SSC、0.1%SDS中进行洗涤。通过暴露于Kodak或Amersham胶片显影。
II.1.6-恶臭假单胞菌生长培养基在Luria-Bertani(LB)或含有100?g/mL利福平的2YT丰富培养基上培养恶臭假单胞菌(Pseudomonas putida)。根据需要加入其它的抗生素(例如15μg/mL四环素)。含有1.5g/L的4-HPA作为唯一碳源的基本培养基M63用于测试功能的互补。在这种情况下,略去抗生素。所有的培养物在29℃制备。
II.1.7-通过电穿孔转化恶臭假单胞菌将在29℃,180rpm生长约16小时的恶臭假单胞菌培养物接种于1L的LB利福平(100μg/mL)培养基。当OD600在1.2的区域内,在4℃下、3000g离心15分钟收集细胞。除去培养基,细胞在4℃下用400mL的10%的甘油提取。该细胞在在4℃下、3000g再离心20分钟。在4℃下进一步分别用200和100mL的10%的甘油进行两次洗涤。最后,细菌用3-10mL的10%的甘油提取,然后分布到100μL的等分试样中并立即冷冻到液氮中。这样制备的细菌在-80℃至少保存6个月。在制备过程中,观察到由于细胞溶解损失了细菌。粘粒(TetR)DNA通过电穿孔引入恶臭假单胞菌(RifR)。80ng的粘粒DNA电穿孔(Bio-Rad Gene PulserTM)进入100μL的电感受态的恶臭假单胞菌是在2mm的电穿孔杯中,0.9伏特的电压下,用200电阻的电穿孔仪进行。约为4.5毫秒。电震荡以后,细胞用900μL的LB提取,并在29℃、180rpm培养1小时30分钟。转化的恶臭假单胞菌在LB Rif100Tet15琼脂培养基上挑选。
II.1.8-广谱宿主载体pBBR1MCS-GmR的修饰我们使用广谱革兰氏阴性宿主载体pBBR1MCS系列(Kovach等,1994,1995)。这些具有支气管包特菌(Bordetella bronchiseptica)复制起始的质粒在大肠杆菌中每个细胞复制约20-30个拷贝。它们含有两个Not I位点。为了方便随后的克隆,存在于质粒pBBR1MCS-GmR上多克隆位点(MCS)外的Not I位点被除去。为此,用Sfi I(50℃)分解质粒,然后为了得到平头末端用T4 DNA聚合酶处理。然后质粒自身重新连接(T4 DNA连接酶-New England Biolab)。连接后(16小时、16℃),为了除去可能的“野生型”质粒用Sfi I进行消化,然后电穿孔大肠杆菌DH5。从在LB Gm20培养基上选择的克隆分离质粒DNA。质粒DNA具有两次消化的特征Not I和Not I/Bgl II。选择了一个克隆pBBR1MCS-Gm-Not-U。
I I.1.9-pBBR1MCS-Gm-U中Ccos8的亚克隆用Not I限制粘粒Ccos8,然后将其填充到琼脂糖凝胶上。迁移后,观察到6个DNA带1.7;3;4;5;8;10kbp。该带用Quiaex II纯化。并且,用Not I限制性酶切pBBR1MCS-Gm-U,使用虾碱性磷酸酶(SAP)脱去磷酸。然后使用变化的“插入/载体“比率将各个带连接进入载体(T4 DNA连接酶,16小时,16℃)。用连接产物转化大肠杆菌DHα 5。
II.1.10-大肠杆菌和恶臭假单胞菌间的三亲株接合为了从大肠杆菌DHα 5转移各个Ccos8(GmR)亚克隆进入恶臭假单胞菌(RifR),使用De Lorenzo等(1990)描述的方法在滤器上进行三亲株接合。回收的细菌铺板于LB Rif100Gm20和具有4-HPA作为唯一碳源的M63上。
II.1.11-质粒p5kbc的消除为了快速消除恶臭假单胞菌的质粒p5kbc,使用不匹配的复制原点策略,p5kbc的消除还必须使用抗生素。与质粒p5kbc(GmR)互补的恶臭假单胞菌(Rif100)用pBBR1MCS-KnR转化。检验得到的克隆(Rif100GmRKnR)的互补活性。然后该克隆培养于两种培养基上LB Rif100Kn150Gm20和LB Rif100Kn150。在进行过程中,保持用于p5kbc和pBBR1MCS-KnR仅用于或pBBR1MCS-KnR的选择的压力。在29℃进行生长。每三天进行传代培养。在第八次传代培养时,不论其最初的培养基是什么,集落传代培养于4种不同的培养基上(M63,M63+4-HPA,LB Rif100Kn150Gm20和LBRif100Kn150)。2天和7天后记录其状态生长。
II.1.12-用于测试酶活性的蛋白鉴定。
II.1.12.1-恶臭假单胞菌的粗提物的制备两种恶臭假单胞菌克隆在LB Gm20上培养24小时。第一种含有质粒pBBR1MCS-Gm-Not-U,而第二种含有互补质粒p5kbc。在缓冲液(0.1M Kpi;1mMMgSO4;1mM DTT;1mM盐酸苯甲脒;5mM己酸)中超声处理后,然后在4℃下、20 000g离心10分钟,使用测定酶活性的两种方法检验上清液的4-HPA 1-羟化酶活性。还用SDS-10%PAGE分析了粗提物。
II.1.12.2-转移到膜上,N端测序如实施例I进行测序。
II.1.12.3-S75凝胶过滤使用10K MacrosepTM(Pall Filtron)在4℃下浓缩2小时,将洗脱液(5mL)浓缩10倍。浓缩的500μL洗脱液以0.7mL/min的流速注入用700mL的缓冲液(0.02MKpi;pH7.2;10%甘油;1mM MgSO4;1mM DTT;4℃)预平衡的SuperdexTM 75预备级凝胶过滤柱(Hiload 16/60,Pharmacia)。在4℃下以1mL/min的流速进行色谱分析。每分钟收集片段并在4℃贮存。
II.1.12.4-pBBR1MCS FT12?1的构建为了构建质粒pBBR1MCS FT12?1,使用两步克隆的策略。用Nsi I和Not I消化质粒p5kbc。获得的插入序列,编码基因1、hpaH和3,克隆到用Psi I和NotI消化的pBBR1MCS-Gm-Not-U中。得到的克隆,称作pBBR1MCS FT12,用Hind III和Asc I酶切,然后形成平头末端,最后再连接。在这样做的过程中,基因1和3被破坏,hpaH基因在原始载体lac启动子的作用下。这样得到了质粒pBBR1MCSFT12?1(图6)。
II.1.12.5-PL1la2的构建实验室拥有一种称作“克隆L”的质粒。该构建相当于克隆荧光假单胞菌HPPD基因启动子进入载体pBBR1MCS-KnR。该HPPD基因启动子在恶臭假单胞菌和大肠杆菌中发挥功能。质粒“克隆L”为Bam HI和Hind III所消化,这使得可以恢复包含启动子和荧光假单胞菌的HPPD基因的插入片段。然后该插入片段连接进入经Bam HI和Hind III消化的载体pBBR1MCS-GmR。得到的克隆称作pBBRG-L-HPPD。得到的质粒,用Nco I消化以除去编码HPPD的基因,与用PCR扩增和用AflIII消化的hpaC基因连接。得到的构建物称作pBBRG-L-ORF1。为了用PCR扩增hpaC基因,使用在基因的起始和末尾能够引入Afl III位点的引物(Afl III位点与NotI位点相容)。使用的引物是位于基因的5’GCAGGATGCA CATGTCCACC AAGAC和位于基因的3’CGGACGCCGA CATGTATCAG CCTTC。使用1单位的KlenTaq聚合酶(Sigma)、250μM的Dntp、200nM的各个引物和50ng的质粒p5kbc进行PCR。PCR在Perkin Elmer9600上进行的程序如下95℃3分钟;然后20个循环94℃1分钟,60℃30秒,68℃3分钟;最后进行最后一步68℃10分钟。先前得到的质粒pBBR1MCS FT12?1用Ssp I和Not I酶切。用Pfu处理使Not I位点成为平头末端。含有由lac启动子控制的hpaH基因的恢复的片段(2468bp),连接进入Ssp I消化的pBBRG-L-ORF1。选择在反义方向含有hpaC基因和hpaH基因的克隆并称之为pL1lac2。所有这些克隆在大肠杆菌DH5α中进行。
II.2-结果可以预想用于鉴定编码食酸假单胞菌的4-HPA 1-羟化酶活性的基因的各种方法。我们最初决定使用表型染色的方法。该方法看来简单而快速。事实上,我们实验室拥有用于检测HGA生产的表型筛选工具。现在,寻找转化4-HPA为HGA的酶。
II.2.1-表型染色方法在实验室中我们观察到使用酪氨酸或4-HPA作为唯一碳源大肠杆菌K12不能生长。另外,我们知道大肠杆菌K12含有允许从HPP合成酪氨酸的酪氨酸氨基转移酶活性。该酶活性是可逆的,因此细胞可以从酪氨酸生产HPP。如果丰富培养基在酪氨酸(1g/L)中强化,酪氨酸被引入细菌,在细菌中积累然后根据HPP和酪氨酸间转换反应的平衡常数转变为HPP。在实验室中,我们已经观察到,如果我们引导荧光假单胞菌HPPD进入大肠杆菌K12,然后在酪氨酸脱氨基过程中生产的HPP转化为尿黑酸(HGA)。由于有HPPD催化的反应是可逆的,HGA在细胞中累积,在那里它被氧化然后自发地聚合形成褐黄色素,其颜色是棕色的。因此这给了我们检测HGA生产的方法。寻找的4-HPA 1-羟化酶转化4-HPA为HGA。因此含有食酸假单胞菌基因组文库的大肠杆菌HB101在4-HPA强化的2YT琼脂培养基上铺板。两天后,两个菌落变成棕色因此它们生产尿黑酸。然而,在这两个菌落的粗提物上检测到的酶活型揭示HPPD型的酶活性,而寻找的4-HPA 1-羟化酶的活性是不连续的,或甚至是不存在的。优先该方法可以选择克隆,其粘粒含有编码食酸假单胞菌HPPD而不是4-HPA 1-羟化酶的基因。对食酸假单胞菌粗提物的体外初步研究中,没有鉴别到HPPD的活性。可以认为当细菌在丰富培养基上培养时食酸假单胞菌的HPPD活性可以被表达,而当4-HPA是唯一碳源时4-HPA 1-羟化酶的活性将被表达。既然这一方法不能鉴别4-HPA 1-羟化酶,我们决定纯化该酶。一旦鉴别到该蛋白质,就可以找回相应的基因。
II.2.2-4-HPA 1-羟化酶的纯化为了进行蛋白质的纯化,分析了其4-HPA依赖的NADH、H+氧化酶活性。通过使用上述的纯化方法,蛋白质被纯化形成实际的匀质性。特异性NADH、H+氧化酶活性的富集因子通常依赖于制剂在50和100之间。在SDS-PAGE上,蛋白质具有60kDa的明显的分子量。事实上,观察到NADH、H+氧化酶活性和HGA的生产在离去的DEAE/EMD 650S上可以看到。另一方面,当离开一个亲和性柱,很难检测到HGA的生产;然而由于4-HPA加入到反应基质中,NADH、H+氧化酶的活性保留。如果将该酶是单体的假说作为基础,允许HGA生产的的催化活性的损失可以通过假设在其通过Red柱传代的过程中一部分蛋白质被破坏(例如丢失了强联合的协同因子)得到解释。催化NADH、H+的氧化的位点将不被影响。也可假设找寻的酶是一种异二聚体。催化活性的丢失可通过HGA生产的单体的丢失解释。在文献中已鉴定了许多异二聚体黄素单加氧酶,在不同的细菌种类中它们都具有一个芳香的底物,(Adachi等,1964;Arunachalam等,1992,1994;Prieto等,1993;Prieto和Garcia,1994;Arunachalam和Massey,1994;Takizawa等,1995;Xun,1996;Xun和Sandvik,2000)。然而,有两个假说解释这些异二聚体酶的功能(1)Arunachalam等(1992,1994)提出恶臭假单胞菌的4-羟苯乙酸3羟化酶包括65kDa的同二聚体黄素蛋白以及38.5kDa的偶联蛋白。单独的黄素蛋白能够在不依赖4-HPA存在的情况下氧化NADH、H+。NADH、H+的氧化使之能够更新NAD+“库”,但以化学计量比生产H2O2。如果加入偶联蛋白质,该蛋白质复合物变得能够羟基化4-HPA为3,4-二羟苯乙酸。因此,NADH、H+的氧化不是多余的并允许代谢物的合成。单独的偶联蛋白质不具有酶活性。
(2)Prieto等(1993,1994)和Xun和Sandvik(2000)提出大肠杆菌W(ATCC11105)的4-HPA 3-羟化酶被认为是两种成分的黄素可扩散的单加氧酶(TC-FDM)的新成员。这两种成分是第一,由HpaB基因编码的59kDa的单体酶4-羟苯乙酸3-羟化酶,第二,19kDa的单体黄素由HpaC基因编码的NADH氧化还原酶。在这种情况下,经黄素消耗NADH、H+FAD被还原NADH、H+氧化还原酶。然后FADH2被加氧酶所利用以允许使用分子氧氧化底物。
我们纯化的酶强烈地氧化NADH、H+,但是生产出非常少的尿黑酸。另外,NADH、H+的氧化依赖于4-HPA的加入。这表明我们具有Prieto等描述的类型的酶。因此,我们认为该纯化的酶是所找寻4-HPA 1-羟化酶(HPAH)。随后可能为了优化酶活性需要鉴定偶联蛋白质。所以用纯化的蛋白质继续进行生化方法。
II.2.3-内部肽和N-端序列的生产纯化的蛋白质送到Pasteur研究所进行微量测序。这样获得了N-端序列SHPAISLQAL RGSGADIQSI HIPYER和分别以它们离开柱(ATDFITPK、LGVGQPMVDK、VVFAGDSAHG VSPFX、VTALEPQAEG AL、IDFQLGWDAD PEEEK、LSVPATLHGS)的次序的函数命名的肽No.11C、12D、20A、22B、23和24的6个内部肽。在N-端序列没有发现通常对应于基因的起始密码子(ATG或GTG)的氨基酸(甲硫氨酸或缬氨酸)。在蛋白质的基础上使用BLASTP算法分析同源性没能鉴定出同源蛋白质。在获得的蛋白质序列的基础上,合成相应的变性的寡核苷酸。为了鉴定编码纯化的和部分测序的HPAH蛋白质的基因部分,在PCR反应中使用了这些寡核苷酸。
II.2.4-PCR片段的生产使用分别编码肽23和12D的简并的引物Hy4RTCYTCNGGRT CNGCRTCCCA和Hy5FGGNGTNGGNC ARCCNATGGT获得编码4-HPA 1-羟化酶的扩增的基因部分(536bp)。这些引物的杂交温度为55.4℃,并分别显示128和512的简并性。克隆该扩增的序列进入载体pGEMT-easy然后测序。分析得到的序列使之可以找到除了编码肽Hy4R和Hy5F的序列外还有编码内部肽22B的核酸序列。后面的元件可以证实我们确实扩增了编码纯化HPAH蛋白质的基因部分。在这一阶段,使用BLASTX算法在蛋白质基础上搜索同源性提出羟化酶、氧化酶和单加氧酶具有弱的同源性。为了寻找完全具有完全基因的粘粒使用536bp PCR-扩增序列,我们能够筛选出食酸假单胞菌粘粒文库。
II.2.5-食酸假单胞菌粘粒文库的筛选筛选粘粒文库,使用上述得到的序列作为探针,可以鉴定通过Southern技术转移后在其限制性和杂交特点基础上不同的4组粘粒。粘粒1、2、和6号形成第一组,粘粒3、7和9号形成第二组,而粘粒5和8号形成第三组。最后一组是由粘粒4号呈递的。另外杂交结果表明搜寻的hpaH在食酸假单胞菌基因组中作为单一的拷贝存在。我们鉴定含有至少一部分编码纯化的HPAH蛋白质的基因粘粒。同时,我们观察到恶臭假单胞菌在4-HPA 1上不能生长,但使用HGA作为唯一碳源可以生长。因此这给了我们一个功能互补的极好的筛选方法;这样我们可以确定这些粘粒中哪一个具有编码4-HPA 1-羟化酶活性的功能性基因。
II.2.6-与粘粒的功能性互补使用电穿孔将前面鉴定的9个粘粒引入恶臭假单胞菌。然后得到的克隆在含有4-HPA作为唯一碳源的M63培养基上再培养。7-8天后,只有含有8号粘粒的细菌成功生长;也就是说,只有粘粒8号含有可为恶臭假单胞菌所利用的允许4-HPA向HGA转化的全部表达信息。该粘粒称作Ccos8。重复进行用所有粘粒的转化。一定时期后(6-10天)总是粘粒8允许互补。为了能够继续我们的方法确定表达4-HPA 1-羟化酶活性的最小DNA片段,需要亚克隆Ccos8。通过功能性互补筛选选择感兴趣的亚克隆。
II.2.7-通过功能性互补进行亚克隆用Not I消化粘粒可以得到大小在1.7和10kb之间的6个DNA片段。这些片段亚克隆进入pBBR1MCS-Gm-Not-U。得到Ccos8的5个亚克隆。限制性分析显示4和10kb的片段没有亚克隆。另一方面,我们观察到最初观察到的5kb的带实际上是5.1和5.2kb的两个带。这些克隆通过三亲株接合从大肠杆菌传递到恶臭假单胞菌。5天后,只有恶臭假单胞菌含有对应于生长在以4-HPA作为唯一碳源的M63上的粘粒Ccos8的5.2带亚克隆。所以我们就鉴定出含有4-HPA 1-羟化酶活性的最小片段。对应于5.2kb的克隆被称作5kbC。为了证实功能性互补的结果,我们使用不匹配的复制原点策略消除质粒p5kbc,并且在使用的抗生素选择压力下强制消除该质粒p5kbc。我们观察到当恶臭假单胞菌失去了质粒p5kbc时它也失去了在以4-HPA作为唯一碳源的培养基上生长的能力。据此我们得出结论质粒p5kbc明显地携带4-HPA 1-羟化酶活性。因此我们能够测定5.2kb的插入序列,这使我们能够鉴定功能性hapH基因。
II.2.8-5.2kb序列的分析测定质粒p5kbc的5.2kb的插入序列。这样核酸同源性的搜索(BLASTN)使之可以鉴定插入序列的3个部分。在碱基1和1465之间的第一部分与质粒BirminghamIncP-alpha的一部分完全同源。因此可能该序列衍生自pLAFR5。在碱基1466和1695之间的第二核酸部分显示与克隆质粒M13mp8/pUC的一部分完全同源。因此该序列也是pLAFR5的一部分;具体地说,pLAFR5的多克隆位点起源于Puc8(Keen等,1988)。因此,分别位于1689和1695的Eco RI和Sma I位点(图7)可能是pLAFR5的克隆位点。碱基1696和5264间(即3568bp)的第三部分没有显示任何强烈的同源性。这一部分的DNA起源于食酸假单胞菌基因组。当使用BLASTX算法分析5.2kb序列鉴定出可能的蛋白质(图7)。这样,由基因1编码的蛋白质与β-内酰胺酶、脱水酶和环化酶显示出弱的同源性。由于前面得到了编码内部肽的序列发现该纯化的蛋白质由基因2所编码;因此它可能就是4-HPA 1-羟化酶。该蛋白质的序列表明该蛋白质与加氧酶和羟化酶显示一些同源性。由基因3编码的潜在的蛋白质在基本数据上显示没有同源性。最后,基因4可能编码一个操纵子调节基因。
现在将进行更详细的hpaH基因的分析。根据得到的N-末端蛋白质序列,4-HPA1-羟化酶蛋白质的ATG起始密码子实际上是ATG相的GTG起始密码子下游的78bp。发现允许核糖体结合的Shine-Dalgarno序列AGGA在起始密码子ATG的上游但不是GTG起始密码子的上游,这证实编码区开始于ATG起始密码子。GTG和ATG密码子之间的部分可能不对应于前蛋白质。这样确定hpaH基因有1737bp长并以TGA终止密码子结束。该基因含有70.9%的GC碱基。
现在我们精确测定了hpaH基因的界限,将对其翻译产物HPAH蛋白质进行分析。
II.2.9-HPAH蛋白质的分析使用通用密码系统翻译hpaH序列。这样得到563个氨基酸的蛋白质,它具有62.2kDa的分子量。蛋白质同源性的搜索(BLASTP)表明HPAH显示与革兰氏阳性生物的蛋白质基本上约15-25%的同一性,酶活的编码与所搜索的非常不同。这样,粘土链霉菌(Streptomyces argillaceus)加氧酶、大肠杆菌3-(3-羟苯基)丙酸酯羟化酶(EC 1.14.13.-),鞘氨醇单胞菌(Sphingomonas sp) 2,4-二水杨酸单加氧酶,该酶催化金霉素链霉菌(Streptomyces aureofaciens)的四环素的6-羟基化作用,并发现潜在的弗式链霉菌(Streptomyces fradiae)加氧酶。事实上,HPAH显示与酚单加氧酶(pheA)家族和2,4-二氯苯酚羟化酶(tfdB)家族的蛋白质同源。使用ClustalW算法对上述蛋白质进行排序对比(图8)。这可以显示非常保守的序列框。此外还注意到用FAD相互作用的三个单元。对应于?-?-?结构单元的第一个单元(GXGXXG)允许FAD的ADP成分与蛋白质相互作用。第二个单元,(A/C)DG,与FAD结合,而第三个单元,G(R)VXX(A)GD(A)XH,允许与FAD的黄素成分相互作用。尽管酶使用NADH、H+,没有鉴别到相应的结合位点(GDH)。这种NADH、H+结合位点的缺乏是在其它FAD单加氧酶中经常观察到的特征。最后,观察到一个单元(DXXXLXWKLX XXXXXXXXXX LLXXYXXER),该单元在其它的羟化酶中也有发现(Ferranez等,1997),但是不明白它的意义。尽管大肠杆菌的3-(3-羟苯基)丙酸酯羟化酶催化结构上接近4-HPA的培养基上的羟基化反应,该生物信息分析所需的信息不能确定我们已经确实鉴定到了4-HPA 1-羟化酶。要做到这一点唯一的方法是表达hpaH基因并研究其酶活性。
II.2.10-包含4-HPA 1-羟化酶活性的蛋白质的鉴定II.2.10.1-编码4-HPA 1-羟化酶的hpaH基因的表达为了证实hpaH基因编码4-HPA 1-羟化酶的活性,需要表达该基因。为了这样做,使用两步克隆策略,使之可以消除基因1和3并将hpaH基因置于起始载体pBBR1MCS-Gm-Not-U的lac启动子的控制下。得到的质粒称作pBBRIMCS FT12?1。在丰富培养基上,从用该质粒转化的恶臭假单胞菌培养物生产粗提物。使用分光光度法找寻酶的活性(在340和292nm)显示该克隆明确地具有由加入4-HPA诱导的NADH、H+氧化酶的活性,但不具有从4-HPA合成尿黑酸的能力。另一方面,具有与HGA非常接近的保留时间(tr=1.2分钟对比1.4分钟)但UV光谱极为不同的分子Z出现。我们提出HPAH氧化NADH、H+以减少其协同因子FAD的假设。由于发动反应的4-HPA的加入发生破坏4-HPA的FAD的再氧化。因此4-HPA转化为代谢物Z。该代谢物的UV光谱表明其环不再是芳香族的环,但是可能未饱和。图2描述了代谢物Z的结构假说。该实验显示在缺乏IPTG诱发物的恶臭假单胞菌中lac启动子是功能性的,它表明lac I抑制蛋白在恶臭假单胞菌中自然条件下是不存在的。我们还证实最初纯化的蛋白质(HPAH)确实是依赖4-HPA的NADH、H+氧化酶,该酶转化4-HPA为代谢物Z。HPAH不产生HGA。因此需要鉴定依赖于4-HPA的该NADH、H+氧化酶的配偶体蛋白,加入它可以恢复4-HPA 1-羟化酶活性。
II.2.10.2-通过凝胶过滤鉴定HPAC蛋白质我们已经看到在红色亲和柱上HPAH纯化的过程中4-HPA 1-羟化酶的活性消失。我们因此提出这样的假说,即4-HPA-依赖性NADH、H+氧化酶的配偶体蛋白质没有与红色120琼脂糖亲和树脂亲合并因此在流动相中被回收的假说。因此我们决定纯化流动相并寻找当加入到HPAH中能够恢复4-HPA 1-羟化酶活性的蛋白质。为了做到这一点,经超滤浓缩流动相(10K MacrosepTM),然后填充到S75凝胶过滤柱上。使用1mL/min的流速并收集1mL的片段。然后在正常的反应条件下进行酶反应,在红色柱上混合50μL的各个片段和10μL事先纯化的HPAH。然后用HPLC分析停止的反应。观察到当加入HPAH蛋白质片段90-108能够产生更多的代谢物Z。在没有引入HPAH的同样的片段中检测到代谢物Z的生产。并且,在对应于这些片段的丙烯酰胺凝胶上,我们观察到与HPAH分子量相等的蛋白质。我们得出结论流动相还含有少量的蛋白质。当片段109-143加入到HPAH蛋白质中观察到HGA的生产。HGA生产得越多,代谢物Z的生产越弱。尿黑酸的最大产量在116-128部分获得。将95和145间的部分装载到丙烯酰胺凝胶上显示在109-143部分蛋白质被高度富集,即该蛋白质的色谱分布图与HGA生产的分布图一致。我们决定称该蛋白质为HPAC。该HPAC蛋白质从凝胶上分离然后在N-端微量测序。得到的序列,MTTKTFA,显示该蛋白质由基因1编码(图7),今后我们称之为hpaC。该实验显示4-HPA 1-羟化酶活性存在于HPAH和HPAC两种蛋白质中。然而我们还没有弄清这两种蛋白质间的相互作用的特性(1)HPAH和HPAC都是酶,或者(2)HPAH具有酶活性,作为与HPAC相互作用的一项功能该酶活性是可改变的。
II.2.10.3-HPAH和HPAC间相互作用的特性前面的实验证实HPAH和HPAC蛋白质是还原4-HPA 1-羟化酶活性所必需的。提出了解释这些蛋白质各自作用的两种假说。在本段中,我们提出的结果表明HPAC本身是一种酶。收集来自凝胶过滤的片段100、101和102。它们含有HPAH,即NADH、H+氧化酶活性,该酶活性使之可以从4-HPA产生代谢物Z。此外,收集来自凝胶过滤的片段123、124和125。它们含有HPAC。使用HPAH和/或HPAC进行各种酶反应。这些反应分两步进行。第一步反应用HPAH进行(或分别用HPAC),30分钟后经加热处理(100℃,10分钟)停止反应。然后加入HPAC(或分别为HPAH)继续反应30分钟。最后加入高氯酸停止反应。还进行了用水替代其中一种酶的反应。最后,经10kD NanosepTM(Pall Filtron)过滤反应物而不煮沸它们进行相同的实验。
表1 概括得到的结果
我们观察到产生HGA的唯一途径是同时具有HPAH和HPAC两种蛋白质或者以此顺序相继加入这两种蛋白质。当只有HPAH时,或当HPAC在HPAH前引入时,仅检测到代谢物Z。最终,HPAC蛋白质对4-HPA不具有酶活性。这些结果表明代谢物Z是反应中间体。HPAH将4-HPA转化为代谢物Z,该反应允许NADH、H+的氧化。然后代谢物Z由HPAC转化为HGA。由于加入HPAC前通过过滤HPAH蛋白质可以被变性或除去,两种蛋白质间的物理的相互作用似乎不必要。我们已经显示在体外4-HPA 1-羟化酶的活性依赖于HPAC和HPAH蛋白质。然而,HPAC蛋白质在离开凝胶过滤时是不纯的,它仅仅被富集。因此它保留了这样的可能性,事实上,在这个富集的提取物中含有另一种将代谢物Z转化为HGA的蛋白质。为了除去该可以物质,我们决定在相同的载体上克隆两个基因(hpaC和hpaH);在这种情况下,我们将产生4-HPA 1-羟化酶活性并因此能够使恶臭假单胞菌在含有4-HPA作为唯一碳源的基本培养基上生长。
II.2.10.4-用hpaC和hpaH进行恶臭假单胞菌的功能的互补质粒pL1lac2(图9)是一个载体pBBR1MCS-GMR,该载体含有在荧光假单胞菌HPPD启动子控制下的hpaC基因,和在相反的方向,在lac启动子的控制下的hpaH基因。使用电穿孔将质粒引入恶臭假单胞菌。然后细菌在含有或不含有作为唯一碳源的4-HPA的基本培养基上铺板。5天后,仅在含有4-HPA作为唯一碳源的培养皿上看到菌落。8天后,菌落具有一定大小。从这些菌落中提取质粒DNA证实全质粒pL1lac2的存在。而且,当用含有hpaC基因或hpaH基因的载体pBBR1MCS-GMR转化细菌时,恶臭假单胞菌不能在4-HPA上生长。在本实验中得到的功能性互补证实hpaC和hpaH基因是启动4-HPA 1-羟化酶活性所必需的,并足以启动所搜索的4-HPA 1-羟化酶的活性。
实施例III各种胞质表达盒的构建III.1-HPACHPAC基因是在从基因组DNA粘粒文库衍生得到的质粒上(p5kbC)使用PCR从食酸假单胞菌分离得到的,使用如下寡核苷酸起始ORF1(Af1III)GCAGGATGCA CATGTCCACC AAGACORF1 Fin(HindIII)CGGACGCAAG CTTGCATCAG CCTTC根据标准条件进行反应。扩增的片段,大小为993bp,依据供应商的方法亚克隆进入质粒pGEMT-easy(Promega)。这样得到的质粒pOZ进行测序。通过EcoRI+SpeI消化得到的表达盒克隆进入用相同的酶打开的质粒pBluescriptII-KS+,得到质粒pEPA13。CsVMV启动子分离自质粒pCH27,该质粒衍生自含有在CsVMV控制下的除草剂耐受基因表达盒的质粒pUC19。对此,用产生平头末端的Pfu聚合酶在热循环仪上进行标准PCR在95℃5分钟一个循环,30个循环[95℃30秒、57℃30秒、72℃1分钟],72℃3分钟。使用的引物是N-CsVMVGCCCTCGAGG TCGACGGTAT TGATCAGCTT CC引导XhoI和BclI位点C-CsVMVCGCTCTAGAA TTCAGATCTA CAAAC(EcoRI)产生的565bp的片段在插入事先用XhoI+EcoRI消化的质粒pEPA13前用XhoI+EcoRI消化;得到质粒pEPA14。Nos终止子从质粒pRD11分离得到,该质粒衍生自pBluescriptII-SK(-),其中Nos终止子经HindII+NotI消化被克隆。得到的292bp的片段克隆进入用相同的酶打开的质粒pEPA14,得到pEPA15。
pEPA15表达盒=CsVMV启动子-hpa C-Nos终止子(
图10;SEQID No.19)。
III.2.HPAHHPAH基因是在从基因组DNA粘粒文库衍生得到的质粒上(p5kbC)使用PCR从食酸假单胞菌分离得到的,使用如下寡核苷酸起始ORF2(Af1III)CAGAGGACGA ACAACATGTC CCACCORF2 Fin3(HindIII)CTGTGGATGA AGCTTAAGAG GTTCAGGC根据标准条件进行反应。扩增的片段,大小为1729bp,以平头末端亚克隆进入用EcoRV消化的质粒pBluescriptII SK。这样得到的质粒pEPA16进行测序。CaMV35S启动子从质粒pCH14分离得到,该质粒衍生自含有GUS表达盒的质粒pBI 121CaMV 35S启动子-GUS-Nos终止子。对此,用产生平头末端的Pfu聚合酶在热循环仪上进行标准PCR在95℃5分钟一个循环,30个循环[95℃30秒、63℃30秒、72℃1分钟],72℃3分钟。使用的引物是N-CaMVGCATGCCTCG AGCCCACAGA TGG引导XhoI位点C-CaMVCCACCCGGGG ATCCTCTAGA G引导BamHI位点产生的839bp的片段在插入事先用XhoI+BclI消化的质粒pEPA16前用XhoI+BamHI消化这样得到质粒pEPA17。在如前述相同的条件下使用PCR从质粒pRD11分离得到Nos终止子,该条件是95℃5分钟一个循环,30个循环[95℃30秒、57℃30秒、72℃1分钟],72℃3分钟。使用的引物是N-NosCAAGCTTATC GATACCGTCG ACG引导Hind IIIC-NosGSSTTGCGGC CGCAATTCCC GACCTAGGA ACATAG引导Not I和AvrII。
得到的305bp的片段在克隆进入用相同的酶打开的质粒pEPA17前用Not I+Hind III消化,得到pEPA18。
pEPA18表达盒=CaMV 35S启动子-hpaH-Nos终止子(
图11;SEQ ID No.17)。
III.3.HPPOHPPO基因是在从基因组DNA粘粒文库衍生得到的粘粒2A上使用PCR从球形节杆菌分离得到的,使用如下寡核苷酸N-term-HPPO-ScaIGAATTCAGTA CTTCACTTAC AGTGTCCGGC引导EcoRI和ScaI限制性位点;C-term-HPPO-AsuII-XhoIGAATTCTCGA GTTCGAACAA ACTGAGTAGC AGCTCA引导EcoRI、XhoI和AsuII位点。
根据标准条件进行反应。得到的1800bp的片段依据供应商的方法克隆进入载体pGEMT-easy(Promega)。这样得到的质粒pOZ151进行测序。通过用SphI+XhoI消化得到的表达盒克隆进入用相同的酶打开的质粒pBBR1-MCS(Gm),得到质粒pEPA20。组蛋白简单启动子分离自质粒pCH9,该质粒衍生自含有EPSPS表达盒的质粒pUC组蛋白简单启动子-内含子2-OTP-EPSPS-组蛋白终止子。对此,用产生平头末端的Pfu聚合酶进行标准PCR在95℃5分钟一个循环,5个循环[95℃30秒、45℃30秒、72℃1分钟],72℃3分钟。使用的引物是N-SHGCTTGCATGC CTAGGTCGAG GAGAAATATG引导SphI和AvrII位点C-SHCATGAGGGGT TCGAAATCGA TAAGC产生的970bp的片段在插入事先用SphI+ScaI消化的质粒pEPA20前用SphI消化;在得到的质粒pEPA21中,在简单组蛋白启动子的后面重复HPPO基因的起始ATG。在如前述相同的条件下,通过PCR组蛋白终止子分离自相同的质粒pCH9,该条件是在95℃5分钟一个循环,35个循环[95℃30秒、55℃30秒、72℃1分钟],72℃3分钟,使用如下引物N-HisterCTAGACCTAG GGGATCCCCC GATC引导AvrIIC-HisterCCCACTAGTG TTTAAATGAT CAGTCAGGCC GAAT引导SpeI和BclI。
得到的726bp的片段在克隆进入用SpeI打开的质粒pEPA21前用SpeI+AvrII消化,得到pEPA22。
pEPA22表达盒=组蛋白简单启动子-hppO-组蛋白终止子(
图12;SEQ IDNo.15)。
III.4.基因的联合含有HPAC基因的表达盒从pEPA15用NotI消化提取并克隆进入pEPA18(NotI+Bsp120I)以形成pEPA19
图13;SEQ ID No.21)。后者用AvrII消化以克隆提取的表达盒进入pEPA22的AvrII+SpeI位点。含有3个构建物的质粒是pEPA23(
图14;SEQ ID No.22)。
III.5.二元载体为了用土壤杆菌转化植物,可以用BclI提取三种构建物,以将该构建物引入土壤杆菌的二元载体。
缩写3,4-DHPA 3,4-二羟苯乙酸4-HPA 4-羟苯乙酸DNA脱氧核糖核酸ApcI 气压化学电离RNA核糖核酸mRNA 信使核糖核酸ETB溴乙锭BLAST 碱基局部对比搜索方法BSA牛血清清蛋白C100羧苄青霉素(100μg/ml)CRLDLa Dargoire研究中心Da 道尔顿DKN异噁唑草酮二酮腈DMSO 甲基亚砜dATP 2’-脱氧腺苷5’-三磷酸dCTP 2’-脱氧胞苷5’-三磷酸dGTP 2’-脱氧鸟苷5’-三磷酸dNTP 2’-脱氧核苷5’-三磷酸dTTP 2’-脱氧胸苷5’-三磷酸DTE二硫赤藓糖醇DTT1,4-二硫赤藓糖醇EDTA 乙二胺四乙酸FAD黄素腺嘌呤二核苷酸
FPLC 快速蛋白质液体色谱Gm20庆大霉素(20μg/mL)HGA尿黑酸HPLC 高效液相层析HPP羟苯丙酮酸HPPD 羟苯丙酮酸过氧化酶HPPO 羟苯丙酮酸氧化酶IFT异噁唑草酮IPTG 异丙基-β-硫代半乳糖吡喃糖苷Kn50卡那霉素(50μg/mL)Kb 千碱基Km 米-曼氏常数L-DOPA 3,4-羟苯丙氨酸LB Luria Bertani培养基Min分钟MJ 毫焦耳MNDD 锰依赖性过氧化酶MndD 编码MNDD的基因NAD+(H,H+) 烟酰胺腺嘌呤二核苷酸,辅酶1(氧化型/还原型)GMO基因修饰生物OTP优化的转移酶Bp 碱基对pBBR1MCS-Gm耐受庆大霉素的质粒pBBR1MCSPCR聚合酶链反应ppm百万分之一PVDF 聚偏氟乙烯qs 数量足以Q.r. 呼吸系数Rif100利福平NMR核磁共振SDS十二烷基硫酸钠Sec秒
TBE 三羟甲基硼酸盐EDTATEV 烟草蚀刻病毒TFA 三氟乙酸TrEMBL 翻译的核苷酸序列资料库Tris三羟甲基氨基甲烷U.V.紫外线vs 对比X-gal 5-溴-4-氯-3-吲哚-β-D-半乳糖吡喃糖苷参考文献Abe,H.;Uchiyama,M.;Sato,R.(1974)从裙带菜(Undaria pinnatifida)分离苯乙酸及作为生长素样的物质对羟基衍生物。Agric.Biol.Chem.38897-898Adachi,K.;Takeda,Y.;Senoh,S.;Kita,(1964)卵形假单胞杆菌(Pseudomonasovalis)中的对羟基苯乙酸的代谢。Biochem.Biophys.Acta 93483-493Appert,C.;Logemann,E.;Hahlbrock,K.;Schmid,J.;Amrhein,N.;(1994)欧芹(Petroselinum crispum Nym)的四种苯丙氨酸脱氨酶同工酶的结构和催化特性;Eur.J.Biochem.;225491-499Arunachalam,U.;Massey,V.;Vaidyanathan,C.S.(1992)对羟苯乙酸3羟化酶。J.Biol.Chem.26725848-25855Arunachalam,U.;Massey,V.(1994)对羟苯乙酸3羟化酶氧化半反应的研究。J.Biol.Chem.26911795-11801Arunachalam,U.;Massey,V.;Miller,S.M.(1994)对羟苯乙酸3羟化酶的机制。J.Biol.Chem.269150-155Aubert,S.(1994)甘油对不含叶绿素的植物细胞代谢的多重影响。论文。University Joseph Fourier-Grenoble-FranceAubert,S.;Gout,E.;Bligny,R.;Marty-Mazars,D.;Barrieu,F.;Alabouvette,J;Marty,F.;Douce,R.(1996a)在失去碳的情况下高等植物细胞自噬的超微结构和生化特征提供呼吸底物给线粒体进行控制。J.Cell Biol.1331251-1263Aubert,S.;Alban,C.;Bligny,R.;Douce,R.(1996b)在缺乏碳水化合物的高等植物细胞中β-甲基巴豆酰-辅酶A羧化酶的诱导亮氨酸代谢中MCC酶作用的证据。FEBS Lett.383175-180
Aubert,S.;Bligny,R.;Douce,R.(1996c)细胞悬浮液和组织培养物中代谢的NMR研究,“植物生理学中的核磁共振”(Y.Shachar-Hill和P.Pfeffer,编)109-154页,美国植物生理学家协会,Rockville,USA。
Aubert,S.;Bligny,R.;Day,D.A.;Whelan,J.;Douce,R.1997.通过除草剂抑制支链氨基酸合成诱导选择性的氧化酶合成。Plant J.11649-657Aubert,S.;Curien,G.;Bligny,R.;Gout,E.;Douce,R.(1998)高等植物细胞中高丝氨酸的转运、区室化和代谢。碳-13和磷-31-核磁共振研究。PlantPhysiol.116547-557Aubert,S.;Pallett,K.(2000)结合使用13C和19F-NMR分析氟化物除草剂异噁唑草酮的作用和代谢模式。Plant Physiol.Biochem.,38517-523Ausubel,F.M.;Brent,R.;Kingston,R.E.;Moore,D.D.;Seidman,J.G.;Smith,J.A.;Struhl,K.(1995)当前使用的分子生物学方法(1-4卷)。Wiley编,Massachusetts General Hoslital和Harward Medical School。
Bate.,N.J.;Orr,J.;Ni,W.;Meromi,A.;Nadler-Hassar,T.;Doerner,P.W.;Dixon,R.A.;Lamb,C.J.;Elkind,Y.(1994)在转基因烟草中苯丙氨酸脱氨酶水平和苯丙酸累积的数量关系确定自然产物合成中的定速步骤。Proc.Natl.Acad.Sci.USA 917608-12Battersby,A.R.;Chrystal,E.J.;Staunton,J.(1980)酶介反应的研究。12篇。经微生物、哺乳动物和植物系统将(2S)-酪氨酸脱羧成为酪胺的立体化学过程。J.Chem.Soc.131-42。
Bickel,H.;Palme,L.;Schultz,G.(1978)将shikimate和其它前体掺入分离的菠菜叶绿体的芳族氨基酸和异戊二烯基苯醌。Phytochemistry.17119-124Bickel,H.;Buchholz,G.;Schultz,G.(1979)高等植物中芳族氨基酸和异戊二烯基苯醌的生物合成的区室作用。摘自植物脂类生物化学和生理的进展。Appelqvist,L.A.Liljenberg,C.,编Elsevier,Amsterdam 369-375页Biswas,I.;Gruss,A.;Ehrlich,S.D.;Maguin,E.(1993)革兰氏阳性菌的高效基因失活和替代系统。J.Bacteriol.1753628-3635Blakley,E.R.(1977)用Arthrobacter sp.分解代谢L-酪氨酸。Can.J.Microbiol.231128-1139Bligny,R.;Leguay,J.J.(1987)细胞培养技术。Meth. Enzymol.1483-16Boehringer Mannheim(1995)用于过滤杂交的DIG系统用户指南
Boldt,Y.R.;Sadowsky,M.J.;Ellis,L.B.M.;Que,L.;Wackett,L.P.(1995)来自球形节杆菌CM-2的锰依赖性加双氧酶属于主要外二醇加双氧酶家族。J.Bacteriol.1771225-1232Borresen,T;Klausen,N.K.;Larsen,L.M.;Sorensen,H.(1989)酪氨酸脱羧酶和芳族-L-氨基酸脱羧酶的纯化和特征。Biochem.Biophys.Acta 993108-115Bradford,M.M.(1976)一种使用蛋白质染色结合原理量化蛋白质的微克量的快速和敏感的方法。Anal.Biochem.72248-254Brouquisse,R.;James,F.;Pradet,A.;Raymond,P.(1992)在糖缺乏的玉米根尖中蛋白质降解过程中天冬酰胺的代谢和氮的分布。Planta.188384-395Callis,J.(1995)蛋白质降解的调节。Plant Cell.7845-857Campos-Garcia J.,Najera R.,Camarena L.,Soberon-Chavez G.(2000)铜绿假单胞菌(Pseudomonas aeruginosa)motR基因涉及细菌活动性的调节。FEMSMicrobiol Lett.18457-62Chan,M.T.;Chao,Y.C.;Yu,S.M.(1994)基于由碳水化合物缺乏诱导的α-淀粉酶启动子的植物细胞的新的基因表达系统。J.Biol.Chem.26917635-17641Chang,A.K.;Duggleby,R.G.(1997)拟南芥乙酰羟基酸合成酶的表达、纯化和特征。Biochem.J.327161-169Chevalier,C.;Bourgeois,E.;Just,D.;Raumond,P.;(1996)玉米(Zeamays L)根尖中天冬酰胺合成酶基因表达的代谢调节。Plant J.91-11Chua,N.H.(1980)叶绿体蛋白质的电泳分析。Methods Enzymol.69434-446Coligan,J.E.;Dunn,B.M.;Ploegh,H.L.;Speicher,Speicher,D.W.;Wingfield,P.T.蛋白质科学当前使用的方法。Wiley编Coligan,J.E.(1997)11章《蛋白质科学当前使用的方法》中的化学分析。Coligan,J.E.;Dunn,B.M.;Ploegh,H.L.;Speicher,Speicher,D.W.;Wingfield,P.T.(编)Wiley.第1卷David,C.;Daro,A.;Szalai,E.;Atarhouch,T.;Mergeay,M.(1996)细菌存在时聚合色素的形成及与化学氧化的偶联-II的比较。经真养产碱菌(Alcaligenes eutrophus)CH34和突变体分解代谢酪氨酸和羟苯乙酸。Eur.Polym.J.,32669-679De Lorenzo V.,Herrero M.,Jakubzik U.,Timmis K.N.(1990)用于插入诱变的Mini-Tn5转座子衍生物、启动子探测、和革兰氏阴性菌中克隆DNA的染色体插入。J Bacteriol.1726568-6572D’Souza LM,Willson RC,Fox GE(2000)恶臭假单胞菌中标记RNA的表达。Curr Microbiol.4091-95Despeghel,J.P.;Delrot,S.(1983)蚕豆(Vicia faba)叶组织吸收氨基酸的能量学。Plant Physiol.711-6Dey和Harborne(1997)植物生化,389页,P.M.Dey和J.B.Harborne编,Academic PressFedi S.,Brazil D.,Dowling D.N.,O’Gara F.(1996)修饰的mini-Tn5 lacZY非抗生素标记表达盒的构建lacZY标记甜菜根区假单胞菌菌株的生态学评价。FEMS Microbiol Lett.135251-257Feretti,L.;Sgaramella,V.(1981)T4 DNA连接酶的平头末端连接活性的特异和反向抑制。Nucleic Acid Res.93695-3705Ferrandez,A.;Garcia,J.L.;Diaz,E.(1997)大肠杆菌K12的3-(3-羟苯)丙酸的分解代谢途径的异源宿主中的基因特性和表达。J.Bacteriol.1792573-2581Filleur,S.;Daniel-Vedele,F.(1999)使用差异显示表达分析分离自拟南芥的高亲和性硝酸盐转座运蛋白。Planta 207461-469Flodin,C.;Whitfield,F.B.(1999)4-羟苯甲酸一个石莼中的2,4,6-三溴苯酚可能的前体。Phytochemistry.51249-255Flugge,U.-I.(1998)质体中的代谢转运蛋白。Curr.Opinion PlantBiotech.,1201-206Folch,J.;Lees,M.;Sloane-Stanley,G.H.(1957)从动物组织中分离和纯化脂类的简单方法。J.Biol.Chem.226497-509Frommer,W.B.;Kwart,M.;Hirner,B.;Fischer,W.N.;Hummel,S.;Ninnemann,O.(1994)植物中含氮成分的转运蛋白。Plant Mol.Biol.261651-1670Gaines,C.G.;Byng,G.S.;Whitaker,R.J.;Jensen,R.A.(1982)在悬浮培养的西尔维氏烟草(Nicotiana silvestri)speg细胞中通过精氨酸(argenate)脱氢酶调节L-酪氨酸和生物合成。Planta,156233-240Galan,B.;Diaz,E.;Prieto,M.A.(2000)大肠杆菌W的4-羟苯乙酸3-单加氧酶的小组分的功能分析一种新黄素的原型NAD(P)H还原酶亚家族。J.Bacteriol.182627-636Garcia,I.;Rodgers,M.;Lenne,C.;Rolland,A.;Sailland,A.;Matringe,M.(1997)来自培养的胡萝卜细胞的对羟苯丙酮酸加双氧酶的亚细胞定位和纯化以及相应cDNA的特性。Biochem.J.;325761Garcia,I.;Rodgers,M.;Pepin,R.;Ksieh,T.-F.,Matringe,M.(1999)转基因的烟草中拟南芥重组4-羟苯丙酮酸加双氧酶的特性和亚细胞区室作用。Plant Physiol.1191507-1516Gazzarini,S.;Lejay,L.;Gojon,A.;Ninnemann,O.;Frommer,W.B.;von Wiren,N.(1999)用于构成的、调节白天活动的三个功能转运蛋白以及饥饿诱导的铵吸收进入拟南芥根。Plant Cell.11937-948Genix,P.;Bligny,R.;Martin,J.B.;Douce,R.(1990)在蔗糖缺乏很长一段时间后美国梧桐细胞中天冬氨酸的瞬时积累。Plant Physiol.94717-722Georgalaki,M.D.;Sarantinopoulos,P.;Ferreira,E.S.;De Vuyat,L.;Kalantzopoulos,G.;Tsakalidou,E.(2000)从希腊Kasseri乳酪分离的macedonicus链球菌(Streptococcus macedonicus)菌株的生化特性。J.Appl.Microbiol.88817-825Goodchild,J.A.;Givan,C.V.(1990)铵和外部pH对欧亚槭(Acerpseudoplatanus)悬浮培养的细胞的氨基和有机酸含量的影响。L.Physiol.plant7829-37Goodwin和Mercer(1988)植物生化导论,第二版,Pergamon Press 356页Gout,E.;Bligny,R.;Genix,P.;Tissut,M.;Douce,R.(1992)草甘瞵对植物细胞代谢的影响。31P和13C NMR研究。Biochimie.74875-882Greenberg,D.M.()代谢途径。氨基酸和四吡咯,第三版,Academic Press,III卷148页Gross,D.(1975)植物起源的生长调节物质。Phytochemistry.142105-2112Grunstein,M.;Hogness,D.S.(1975)集落杂交含有特异性基因的克隆DNA的分离方法。Proc.Natl.Acad.Sci.U.S.A.723961-3965Hahlbrock,K.;Scheel,D.;(1989)苯丙酸代谢的生理和分子生物学。Ann.Rev.Plant Physiol.Plant Mol.Biol.;40347-369Hareland,W.A.;Crawford,R.L.;Chapman,P.J.;Dagley,S.(1975)来自食酸假单胞菌的4-羟苯乙酸1-羟化酶的代谢功能和特性。J.Bacteriol.,121272-285Hess,J.L.(1993)维生素E,α-生育酚。高等植物中的抗氧化剂。Alscher,R.;Hess,J.;Boca RatonCRC111-134页
Hill,C.M.;Duggleby,R.G.(1998)大肠杆菌乙酰羟酸合成酶同工酶II的突变和三种除草剂-不敏感型的特征。Biochem.J.335653-661Homeyer,U.;Litek,K.;Huchzermeyer,B.;Schultz,G.(1989)由液泡膜腺苷三磷酸和焦磷酸驱动的分离的大麦液泡吸收苯丙氨酸。Plant Physiol.891388-1393Jones,D.;Keddie,R.M.(1991)节杆菌属。摘自原核生物(Balows,A.;Truper,H.G.;Dworkin,M;Harder,W.;Schleifer,K.H.,编)第二版,Springer-Verlag,New-YorkJournet E.P.,Bligny R.,Douce R.(1986)高等植物细胞中蔗糖失去的过程中生化的改变。J.Biol.Chem.2623193-3199Junge,K.;Gosink,J.J.;Hoppe,H.-G.;Staley,J.T.(1998)从南极海洋的冰盐水中鉴定到的节杆菌、短状杆菌和动性球菌的分离物。麦氏动性球菌新型亚种(Planococcus mcmeekinii,sp.nov)的描述…System.Appl.Microbiol.,21306-314Kaiser,G.;Martinoia,E.;Wiemken,A.(1982)使用一种新的快速的方法从大麦叶肉原生质体分离的液泡中光合作用产物的迅速出现。Z.Pflanzenphysiol.107103-113Keen,N.T.,Tamaki,S.Kobayashi,D.,Trollinger,D.,(1988)革兰氏阴性菌中用于DNA克隆改良的广范围宿主质粒,Gene,70191-197Kindl,H.(1969)高等植物中的羟苯乙酸的生物合成和代谢。Eur.J.Biochem.7340-347Koch,C.;Schumann,P.;Stackebrandt,E.(1995)将活泼微球菌(Micrococcusagilis)(Ali-Cohen 1889)重新分类为活泼节杆菌(Arthrobacter agiliscomb.nov.)进入节杆菌属,和节杆菌属的修订。Int.J.Syst.Bacteriol.45837-839Kovach ME,Phillips RW,Elzer PH,Roop RM 2nd,PetersonKM(1994)pBBR1MCS广范围宿主克隆载体。Biotechniques 16800-802Kovach ME,Elzer PH,Hill DS,Robertson GT,Farris MA,Roop RM 2nd,Peterson KM(1995)广范围宿主克隆载体pBBR1MCS的携带不同的抗生素-抗性表达盒的四种新的衍生物。Gene 166175-176Kruk,J.;Strzalka,K.(1998)使用反相高效液相色谱鉴定菠菜和枫树叶中的质体醌-C。Phytochemistry 492267-2271
Laemmli,U.K.(1970)在装配噬菌体T4头的过程中结构蛋白的酶切。Nature.227680-683Lamport,D.T.A.;Northxote,D.H.(1960)高等植物初生细胞壁中的羟脯氨酸。Nature188665-666Laursen,R.A.(1971)固相Edman降解。一种自动肽测序仪。Eur.J.Biochem.2089-102Li,Z.-C;Bush,D.R.(1990).pH依赖性氨基酸转运到分离自甜菜叶的原生质膜小泡。I.载体介导的、通过多重转运系统的生电通量的证据。PlantPhysiol.94268-277Li,Z.-C;Bush,D.R.(1990).pH依赖性氨基酸转运到分离自甜菜(Betavulgaris L)叶的原生质膜小泡。II.多脂肪族的、中性氨基酸同相转移的证据。Plant Physiol.961338-1344Liu,D.-L.;Xu,S.-X.;Wang,W.-F.(1998)来自连翘的一种新木脂体葡糖苷。J.Chin.Pharmaceut.Sci.749-51Loffelhardt,W.(1977)蓝-绿藻组囊藻(Anacystis nidulans)中的苯乙酸的生物合成具有类囊体结合L-氨基酸氧化酶的证据。Z.Naturforsch.32345-350Luscombe,B.M.;Palett,K.E.;Loubierre,P.;Millet,J.-C.;Melgarejo,J.;Vrabel,T.E.(1995)在玉米和甘蔗中控制阔叶和杂草的一种新的除草剂RPA201772。Proc.Brighton Crop Prot.Conf.Weeds,135Luscombe,B.M.;Palett,K.E.;(1996)玉米中异噁唑草酮用于杂草控制,Pesticide Outlook,11月,29Lutterbach,R.;Stockigt,J.(1994)使用自然丰度13C-NMR光谱学的方法体内研究植物细胞代谢。Helv.Chim.Acta,772153-2161Lutterbach,R.;Stockigt,J.(1995)植物细胞中体内使用没有标记的13C-NMR的甲恶苏平(methylursubin)的生物合成动力学。Phytochemistry.40801-806MacLaughlin,P.J.;Weihrauch,J.L.(1979)食物中的维生素E含量。J.Am.Diet.Assoc.75647-665Maniatis,T.;Fritsch,E.F.;Sambrook,J.(1982)分子克隆-实验室手册,Cold Spring Harbor Laboratory编Martin,M.;Gibello,A.;Fernandez,J.;Ferrer,E.;Garrido-Pertierra,A.(1991)用肺炎克雷伯氏菌(Klebsiella pneumoniae)进行3-和4-羟苯乙酸的分解代谢。J.Gen.Microbiol.132621-628Mayer,M.P.;Beyer,P.;Kleinig,H.(1990)醌化合物可替代分子氧作为黄水仙(Narcissus pseudonarcissus L.)的色素母细胞中的八氢番茄红素去饱和过程中的末端电子受体。Eur.J.Biochem.191359-363Mayer,M.P.;Nievelstein,V.;Beyer,P.(1992)来自黄水仙的色素母细胞的NADPH依赖性氧化还原酶的纯化和特征氧化还原作用介质可能涉及胡萝卜素的去饱和。Plant Physiol.Biochem.30389-398Mazelis M.(1980)氨基酸代谢。摘自“植物生化”(Stumpf,PK,Conn,E.E;编)第5卷氨基酸和衍生物。Academic Press,London,New York,1-55页Michal,G.-编-(1999)生物化学途径,生物化学和分子生物学图谱,Wiley和Spektrum编,60页Miflin,B.J.;Lea,P.J.(1982)铵的同化作用和氨基酸的代谢摘自A.B.Boulter,B.Parthiers编的植物生理百科全书,14卷,植物中的核酸和蛋白质1.Springer Verlag,Berlin,5-64页Moreno-Arribas,V.;Lonvaud-Funel,A.(1999)从葡萄酒和乳酸杆菌ATCC367分离得到的乳酸杆菌IOEB9809的酪氨酸脱羧酶活性。FEMS MicrobiologyLetters.18055-60Moreno-Arribas,V.;Torlois,S.;Joyeux,A.;Bertrand,A.;Lonvaud-Funel,A.(2000)来自葡萄酒的生产酪胺的乳酸菌的分离、特性和行为。J.Appl.Microbiol.88584-593Morot-Gaudry,J.F.(1997)Assimilation de l’azote chez plantes.Aspectsphysiologique,biochimique et moleculaire.INRA版。
Mouillon,J.M.;Aubert,S.;Bourguignon,J.;Gout,E.;Douce,B.;Rebeille,F.(1999)在非光合作用高等植物细胞中的甘氨酸和丝氨酸的分解代谢它们在C1代谢中的作用。Plant J.20197-205Murashige,T.;Skoog(1962)具有烟草组织培养物的用于快速生长和生物测定的一种修正的培养基。Physiol.Plant.15473Negrel,J.;Javelle,F.;(1995)果胶酶或链霉蛋白酶中苯丙醇酸和酪胺代谢的诱导产生烟草(Nicotiana tabacum)的细胞悬浮培养物PhysiologiaPlantarum,95569-574Nester,E.W.;Montoya,A.L.(1976)在枯草芽孢杆菌中组氨酸和芳香族氨基酸的生物合成共有的酶。J.Bacteriol.126699-705
Norris,S.R,;Barette,T.R.;DellaPenna,D.(1995)拟南芥中类胡萝卜素合成的遗传分析确定质体醌是八氢番茄红素去饱和的重要成分。Plant Cell 72139-2149Pallett,K.E.;Little,I.P.;Sheekey,M.;Veerasekaran,P.(1998)异噁唑草酮的作用模式。I.生理效果,代谢和选择性。Pestic.Biochem.Physiol.62113-124Prieto,M.A.;Perez-Randa,A.;Garcia,J.L.(1993)具有广范围基质的大肠杆菌芳香族羟化酶的特征。J.Bacteriol.1752162-2167Prieto,M.A.;Garcia,J.L.(1994)大肠杆菌的4-羟苯乙酸3-羟化酶的分子特征。J.Biol.Chem.26922823-22829Prieto,M.A.;Diaz,E.;Garcia,J.L.(1996)大肠杆菌W的4-羟苯乙酸分解代谢途径的分子特征基因改造移动的芳香族降解丛。J.Bacteriol.178111-120Prieto,M.A.;Kellerhals M.B.,Bozzato G.B.,Radnovic D.,Witholt B.,Kessler B.(1999)用于生产手性培养基链长聚3-羟基烷酸盐的稳定重组细菌的基因工程。Appl Environ Microbiol.653265-3271Roberts,J.K.M.(2000)植物代谢路径中的NMR冒险。Trends Plant Sci.530-34Roby,C.;Martin,J.B.;Bligny,R.;Douce,(1987)高等植物细胞中失去蔗糖过程中生化的改变。磷-31核磁共振研究。J.Biol.Chem.2625000-5007Sailland,A.;Matringe,M.;Rolland,A.;Pallett,K.(1995)羟苯丙酮酸加双氧酶基因和含有这种基因的抗除草剂植物的生产。WO 96/385567Sailland,A.;Derose,R.(1999)尿黑酸酶活制备的方法。WO9934008 A19990708Sambrook;Fritsch;Maniatis.分子克隆,实验手册,第二版Schroeder,C.;Sommer,J.;Humpfer,E.;Stockigt,J.(1997)通过植物细胞培养未标记的香兰素代谢后体内NMR作为探针反向相关的1H-13C。Tetrahedron,53927-934Schoenle,E.J.;Adams,L.D.;Sammons,D.W.(1984)脂肪细胞原生质膜中的主要蛋白质的胰岛素-诱导的快速减少。J.Biol.Chem.25912112-12116Shachar-Hill,Y.;Pfeffer,P.E.;Germann,M.W.(1996)体内或抽提物中的植物代谢后进行异核二维核磁共振光谱。Analytic.Biochem.,243110-118
Singer,M;Berg,P.(1992)基因和基因组。VIGOT编,ParisSparnins,V.L.;Dagley,S.(1975)食酸假单胞菌和恶臭假单胞菌中芳香族的分解代谢的其它途径五倍子酸作为底物以及加双氧酶的抑制因子。J.Bacteriol.1241374-1381Stafford,H.A.;(1994)花青素和甜菜红碱相互独立途径的进展。PlantSci.;10191-98Suemori,A.;Nakajima,K.;Kurane,R.;Nakamura,Y.(1995)红串红球菌中L-苯丙氨酸和L-酪氨酸的降解途径。Report Nat.Inst.Biosci.Hum.Tech.333-36Suemori,A.;Nakajima,K.;Kurane,R.;Nakamura,Y.(1996)来自红串红球菌的o-羟苯乙酸5-羟化酶、m羟苯乙酸6-羟化酶、p-羟苯乙酸1-羟化酶的纯化和特征。Journal of Fermentation and Bioengineering,81133-137Swiatek,L.;Graias,B.;Kalemba,D.(1998)艾属的一些药用植物中的酚酸。Pharm.Pharmacol.Lett.4158-160Swiatek,L.(1977)kwasy fenolowe I Glukozydy irydoidowe w niektorychkrajowych gatunkach leczniczych z rodzaju Plantago.Herba PolonciaXXIII(3)201-209Takizawa,N.;Yokoyama,H.;Yanagihara,K.;Hatta,T.;Kiyohara,H.(1995)编码具有羟化酶活性的2,4,6-三氯苯酚4-脱氯酶的皮氏伯克霍尔德氏菌(Pseudomonas pickettii)DTP0602的基因座位以及由酶产生的各种氯酚的羟化作用。J.Ferment.Bioeng.80318-326Trieu-Cuot,P.;Carlier,C.;Poyart-Salmeron,C.;Courvalin,P.(1991)一个整合的载体利用Tn1545的转座特性用于插入诱变并从革兰氏阳性菌中克隆基因。Gene 10621-27Tseng,T.C.;Tsai,T.H.;Lue,M.Y.;Lee,H.T.(1995)使用Mrna差异显示在培养的水稻细胞中蔗糖调节基因的鉴别。Gene.161179-1782Vertes,A.;Asai,Y.;Inui,M.;Kobayashi,M.;Kurusu,Y.;Yukawa,H.,(1994)棒状杆菌的转座子诱变,Mol.Gen.Genet.245,397-405Vierstra,R.D.(1993)植物中的蛋白质降解。Ann.Rev.Plant Physiol.Plant Mol.Biol.44385-410Viviani,F.;Little,J.;Pallett,K.E.(1998)异噁唑草酮的作用方式-2-由异噁唑草酮的衍生物二酮腈产生的胡萝卜4-羟苯丙酮酸加双氧酶的抑制特性,Pestic.Biochem.Physiol.62125-134Whistance,G.R.;Threlfall,D.R.(1970)植物苯醌的生物合成。尿黑酸在高等植物、绿藻和蓝-绿藻中的质体醌、生育酚和Q生育醌的前体。Biochem.J.117593-600Xun,L.Y.(1996)来自洋葱伯克霍尔德氏菌(Burkholderia cepacia)AC1100.的氯苯酚4-单加氧酶的纯化和特征。J.Bacteriol.1782645-2649Xun,L.和Sandvik,E.R.(2000)大肠杆菌4-羟苯乙酸3-羟化酶(HpaB)作为一个还原的利用黄素腺嘌呤二核苷酸的单加氧酶的特征。Appl.Env.Microbiol.66481-486。
序 列 表<110>阿方蒂农科股份有限公司(Aventis cropscience S.A.)<120>通过旁路代谢途径的耐受除草剂的植物<130>钝端基因<140>
<141>
<160>22<170>PatentIn Ver.2.1<210>1<211>1683<212>DNA<213>球形节杆菌(Arthrobacter globiformis)<220>
<221>CDS<222>(1)..(1683)<400>1atg act tca ctt aca gtg tcc ggc cgg gtg gcg cag gtc ctc agc agc 48Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser Ser1 5 10 15tat gtc agc gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc 96Tyr Val Set Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe20 25 30ctg gac gcc gcc gag aag gag ggc ctc cgc ttc acg gcc gta cgc cat 144Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His35 40 45gaa ggt gcc gcc atc gcg gcg gcg gac gcc tac tat cgg gca tcc ggg 192Glu Gly Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly50 55 60cgc ctg gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac gcc 240Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala65 70 75 80ctg acg gcc ctc gcc gag gcg gtc cag gcg cag atc ccc gtg gtg ctc 288Leu Thr Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu85 90 95gtc acc ggg gac gcc ccg agc agc ggc gcc cgg cct tgg gac gtg gac 336Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp100 105 110cag gcc gcg atc gcc gcc ggg ctg ggg gcg gcg acc ttc acg gtc acc 384Gln Ala Ala Ile Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr115 120 125cgt gaa gcc gca ggc tcc atc acg cag gaa gcg gtg gag tac gca ctt 432Arg Glu Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu130 135 140gcc cgg cgg acc gcc gtc gtg atc gcc gtt cca tac gac ctg tcg gcc 480Ala Arg Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala145 150 155 160ctt gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc tcg gtt 528Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val
165 170 175ccg gac gcc atc ggc ggc gga ctc gga cgg gcg gcc gaa gtg cgg gcg 576Pro Asp Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala180 185 190gcc gaa ttg ctg gcg ggc gcg aag cgg ccg ctc atc ctt gcc ggc cgc 624Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg195 200 205ggt gcg cac ctc gca gga gcc ggc ccc gaa ctc cgg gaa ctc gcc gac 672Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp210 215 220cgc ctc ggc gcg ctc acg gcc ggc acc gca ctg gcg ctg aac ctg ctg 720Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu225 230 235 240cag ggc gag ggg tac ctc ggc gtc gcg ggc ggc ttc ggc acg gat acc 768Gln Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr245 250 255gcc gcc ggg ctc atg ggc gag gcg gac gtg gtg ctc gtg gcg gga gcc 816Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala260 265 270agc ctg acc ccc ttc acc atg cgc ttc ggc cac ctg atc ggc ccg gac 864Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp275 280 285gcc acc gtg atc cag atc gac acc gcc atg gag ccg acg gac ccg cgg 912Ala Thr Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg290 295 300gtg gac ctg ttt gtc agt gcg gac gcg aag gcc gct gcc ggc cgg atc 960Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile305 310 315 320ctc cgg ctg ctg gat gac gcc gcc ggg gcc aat gcg tcg aag gcc tgg 1008Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp325 330 335cgc gcg gaa gca ctc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc 1056Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro340 345 350ggc acc gca gag acc acg gac ggc cgc ctt gac ccc cgg gcg ctt gct 1104Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala355 360 365tcg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac 1152Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp370 375 380ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc atc ccc cgt 1200Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg385 390 395 400cct cag gac ctg gtc atg gtg ggg acc gcg tac cag tcg atc ggg ctt 1248Pro Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu405 410 415ggc ctg gcc agc gcc gtg ggg gcg tcc cgg gcc gtg gac gac ggc aat 1296Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn420 425 430atc ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tcc 1344Ile Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser
435 440 445gac ctg gaa tcg ctc gtg ggc gcg gcg agc agc gcc gtc gtg gtg atc 1392Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile450 455 460tac aac gac gcc gcc tac ggg gcc gag atc cat cag tac ggc tca cgg 1440Tyr Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg465 470 475 480ggg ctc acc gaa aag ccc atg ctg atc ccc gaa gtg gac ttc agc ggg 1488Gly Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly485 490 495att gcc cgc gcg atc ggg gcg gaa tcc gca atc atc cgc aag ctg tcg 1536Ile Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser500 505 510gac ctc tcc gcg ctc acg gac tgg atc gag gcc ggc gcc agg gga acc 1584Asp Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr515 520 525ttc gtg gcc gac tgc cgc atc acc tca agc gtc cgg gcc ccg tgg ctg 1632Phe Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu530 535 540agc gaa tgg atg agg gcc tcg caa gcg gcg aag gag gcg gtg gcg ggc 1680Ser Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly545 550 555 560tag 1683<210>2<211>56l<212>
<213>球形节杆菌(Arthrobacter globiformis)<400>2Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser Ser1 5 10 15Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe20 25 30Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His35 40 45Glu Gly Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly50 55 60Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala65 70 75 80Leu Thr Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu85 90 95Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp100 105 110Gln Ala Ala Ile Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr115 120 125Arg Glu Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu130 135 140Ala Arg Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala
145 150 155 160Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val165 170 175Pro Asp Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala180 185 190Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg195 200 205Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp210 215 220Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu225 230 235 240Gln Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr245 250 255Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala260 265 270Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp275 280 285Ala Thr Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg290 295 300Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile305 310 315 320Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp325 330 335Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro340 345 350Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala355 360 365Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp370 375 380Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg385 390 395 400Pro Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu405 410 415Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn420 425 430Ile Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser435 440 445Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile450 455 460Tyr Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg465 470 475 480Gly Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly485 490 495Ile Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser500 505 510
Asp Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr515 520 525Phe Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu530 535 540Ser Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala545 550 555 560Gly<210>3<21l>1944<212>DNA<213>人工序列<220>
<223>人工序列的描述球形节杆菌(Arthrobacter globiformis)HPPO突变体<220>
<22l>CDS<222>(55)..(1737)<400>3ccgacgtcgc atgctcccgg ccgccatggc ggccgcggga attcgattga attc atg 57Met1act tca ctt aca gtg tcc ggc cgg gtg gcg cag gtc ctc agc agc tat 105Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser Ser Tyr5 10 15gtc agc gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc ctg 153Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu20 25 30gac gcc gcc gag aag gag ggc ctc cgc ttc acg gcc gta cgc cat gaa 201Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu35 40 45ggt gcc gcc atc gcg gcg gcg gac gcc tac tat cgg gca tcc ggg cgc 249Gly Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg50 55 60 65ctg gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac gcc ctg 297Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu70 75 80acg gcc ctc gcc gag gcg gtc cag gcg cag atc ccc gtg gtg ctc gtc 345Thr Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu Val85 90 95acc ggg gac gcc ccg agc agc ggc gcc cgg cct tgg gac gtg gac cag 393Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gln100 105 110gcc gcg atc gcc gcc ggg ctg ggg gcg gcg acc ttc acg gtc acc cgt 441Ala Ala Ile Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg115 120 125gaa gcc gca ggc tcc atc acg cag gaa gcg gtg gag tac gca ctt gcc 489Glu Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu Ala130 135 140 145cgg cgg acc gcc gtc gtg atc gcc gtt cca tac gac ctg tcg gcc ctt 537Arg Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala Leu
150 155 160gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc tcg gtt ccg 585Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro165 170 175gac gcc atc ggc ggc gga ctc gga cgg gcg gcc gaa gtg cgg gcg gcc 633Asp Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala180 185 190gaa ttg ctg gcg ggc gcg aag cgg ccg ctc atc ctt gcc ggc cgc ggt 681Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg Gly195 200 205gcg cac ctc gca gga acc ggc ccc gaa ctc cgg gaa ctc gcc gac cgc 729Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg210 215 220 225ctc ggc gcg ctc acg gcc ggc acc gca ctg gcg ctg aac ctg ctg cag 777Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gln230 235 240ggc gag ggg tac ctc ggc gtc gcg ggc ggc ttc ggc acg gat acc gcc 825Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala245 250 255gcc ggg ctc atg ggc gag gcg gac gtg gtg ctc gtg gcg gga gcc agc 873Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser260 265 270ctg acc ccc ttc acc atg cgc ttc ggc cac ctg atc ggc ccg gac gcc 921Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp Ala275 280 285acc gtg atc cag atc gac acc gcc atg gag ccg acg gac ccg cgg gtg 969Thr Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val290 295 300 305gac ctg ttt gtc agt gcg gac gcg aag gcc gct gcc ggc cgg atc ctc 1017Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile Leu310 315 320cgg ctg ctg gat gac gcc gcc ggg gcc aat gcg tcg aag gcc tgg cgc 1065Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg325 330 335gcg gaa gca ctc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc ggc 1113Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly340 345 350acc gca gag acc acg gac ggc cgc ctt gac ccc cgg gcg ctt gct tcg 1161Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser355 360 365gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc 1209Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp Gly370 375 380 385ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc atc ccc cgt cct 1257Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg Pro390 395 400cag gac ctg gtc atg gtg ggg acc gcg tac cag tcg atc ggg ctt ggc 1305Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu Gly405 410 415ctg gcc agc gcc gtg ggg gcg tcc cgg gcc gtg gac gac ggc aat atc 1353Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn Ile
420 425 430ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tcc gac 1401Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp435 440 445ctg gaa tcg ctc gtg ggc gcg gcg agc agc gcc gtc gtg gtg atc tac 1449Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile Tyr450 455 460 465aac gac gcc gcc tac ggg gcc gag atc cat cag tac ggc tca cgg ggg 1497Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg Gly470 475 480ctc acc gaa aag ccc atg ctg atc ccc gaa gtg gac ttc agc ggg att 1545Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly Ile485 490 495gcc cgc gcg atc ggg gcg gaa tcc gca atc atc cgc aag ctg tcg gac 1593Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser Asp500 505 510ctc tcc gcg ctc acg gac tgg atc gag gcc ggc gcc agg gga acc ttc 1641Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr Phe515 520 525gtg gcc gac tgc cgc atc acc tca agc gtc cgg gcc ccg tgg ctg agc 1689Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu Ser530 535 540 545gaa tgg atg agg gcc tcg caa gcg gcg aag gag gcg gtg gcg ggc tag 1737Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly550 555 560ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc1797agggctggga acgccctgag ctgctactca tttgttcgaa ctcgagaatt caatcactag1857tgaattcgcg gccgcctgca ggtcgaccat atgggagagc tcccaacgcg ttggatgcat1917agcttgagta ttctatagtg tcaccta1944<210>4<211>S61<212>
<213>人工序列<223>人工序列的描述球形节杆菌(Arthrobacter globiformis)HPPO突变体<400>4Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser Ser1 5 10 15Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe20 25 30Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His35 40 45Glu Gly Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly50 55 60Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala65 70 75 80Leu Thr Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu85 90 95
Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp100 105 110Gln Ala Ala Ile Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr115 120 125Arg Glu Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu130 135 140Ala Arg Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala145 150 155 160Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val165 170 175Pro Asp Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala180 185 190Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg195 200 205Gly Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala Asp210 215 220Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu225 230 235 240Gln Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr245 250 255Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala260 265 270Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp275 280 285Ala Thr Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg290 295 300Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile305 310 315 320Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp325 330 335Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro340 345 350Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala355 360 365Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp370 375 380Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg385 390 395 400Pro Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu405 410 415Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn420 425 430Ile Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser435 440 445Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile
450 455 460Tyr Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg465 470 475 480Gly Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly485 490 495Ile Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser500 505 510Asp Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr515 520 525Phe Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu530 535 540Ser Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly545 550 555 560<210>5<211>1962<212>DNA<213>人工序列<220>
<223>人工序列的描述球形节杆菌(Arthrobacter globiformis)HPPO突变体<220>
<221>CDS<222>(111)..(1793)<400>5aggtgacact atagaatact caagctatgc atccaacgcg ttgggagctc tcccatatgg60tcgacctgca ggcggccgcg aattcactag tgattggaag gatccggtgc atg act 116Met Thr1tca ctt aca gtg tcc ggc cgg gtg gcg cag gtc ctc agc agc tat gtc 164Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser Ser Tyr Val5 10 15agc gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc ctg gac 212Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Asp20 25 30gcc gcc gag aag gag ggc ctc cgc ttc acg gcc gta cgc cat gaa ggt 260Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu Gly35 40 45 50gcc gcc atc gcg gcg gcg gac gcc tac tat cgg gca tcc ggg cgc ctg 308Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg Leu55 60 65gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac gcc ctg acg 356Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu Thr70 75 80gcc ctc gcc gag gcg gtc cag gcg cag atc ccc gtg gtg ctc gtc acc 404Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu Val Thr85 90 95ggg gac gcc ccg agc agc ggc gcc cgg cct tgg gac gtg gac cag gcc 452
Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gln Ala100 105 110gcg atc gcc ggc ggg ctg ggg gcg gcg acc ttc acg gtc acc cgt gaa 500Ala Ile Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg Glu115 120 125 130gcc gca ggc tcc atc acg cag gaa gcg gtg gag tac gca ctt gcc cgg 548Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu Ala Arg135 140 145cgg acc gcc gtc gtg atc gcc gtt cca tac gac ctg tcg gcc ctt gag 596Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu150 155 160gcg gca gag gaa gat ctt ccc gtg ccg ccg gcg gcc tcg gtt ccg gac 644Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp165 170 175gcc atc ggc ggc gga ctc gga cgg gcg gcc gaa gtg cgg gcg gcc gaa 692Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu180 185 190ttg ctg gcg ggc gcg aag cgg ccg ctc atc ctt gcc ggc cgc ggt gcg 740Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg Gly Ala195 200 205 210cac ctc gca gga gcc ggc ccc gaa ctc cgg gaa ctc gcc gac cgc ctc 788His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu215 220 225ggc gcg ctc acg gcc ggc acc gca ctg gcg ctg aac ctg ctg cag ggc 836Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gln Gly230 235 240gag ggg tac ctc ggc gtc gcg ggc ggc ttc ggc acg gat acc gcc gcc 884Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala245 250 255ggg ctc atg ggc gag gcg gac gtg gtg ctc gtg gcg gga gcc agc ctg 932Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser Leu260 265 270acc ccc ttc acc atg cgc ttc ggc cac ctg atc ggc ccg gac gcc acc 980Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp Ala Thr275 280 285 290gtg atc cag atc gac acc gcc atg gag ccg acg gac ccg cgg gtg gac 1028Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp295 300 305ctg ttt gtc agt gcg gac gcg aag gcc gct gcc ggc cgg atc ctc cgg 1076Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile Leu Arg310 315 320ctg ctg gat gac gcc gcc ggg gcc aat gcg tcg aag gcc tgg cgc gcg 1124Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala325 330 335gaa gca ctc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc ggc acc 1172Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr340 345 350gca gag acc acg gac ggc cgc ctt gac ccc cgg gcg ctt gct tcg gca 1220Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala355 360 365 370ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc ggg 1268
Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp Gly Gly375 380 385cac ttc ctg ggc tgg gca ccc atg tac tgg cgc atc ccc cgt cct cag 1316His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg Pro Gln390 395 400gac ctg gtc atg gtg ggg acc gcg tac cag tcg atc ggg ctt ggc ctg 1364Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu Gly Leu405 410 415gcc agc gcc gtg ggg gcg tcc cgg gcc gtg gac gac ggc aat atc ctg 1412Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn Ile Leu420 425 430gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tcc gac ctg 1460Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu435 440 445 450gaa tcg ctc gtg ggc gcg gcg agc agc gcc gtc gtg gtg atc tac aac 1508Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile Tyr Asn455 460 465gat gcc gcc tac ggg gcc gag atc cat cag tac ggc tca cgg ggg ctc 1556Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg Gly Leu470 475 480acc gaa aag ccc atg ctg atc ccc gaa gtg gac ttc agc ggg att gcc 1604Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly Ile Ala485 490 495cgc gcg atc ggg gcg gaa tcc gca atc atc cgc aag ctg tcg gac ctc 1652Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser Asp Leu500 505 510tcc gcg ctc acg gac tgg atc gag gcc ggc gcc agg gga acc ttc gtg 1700Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr Phe Val515 520 525 530gcc gac tgc cgc atc acc tca agc gtc cgg gcc ccg tgg ctg agc gaa 1748Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu Ser Glu535 540 545tgg atg agg gcc tcg caa gcg gcg aag gag gcg gtg gcg ggc tag 1793Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly550 555 560ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc1853agggctggga acgccctgag ctgctactca gtttgttcga actcgagaat tcaatcgaat1913tcccgcggcc gccatggcgg ccgggagcat gcgacgtcgg gcccattcg1962<210>6<211>541<212>
<213>人工序列<223>人工序列的描述球形节杆菌(Arthrobacter globiformis)HPPO突变体<400>6Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Asp Ala Ala1 5 10 15Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu Gly Ala Ala20 25 30
Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg Leu Ala Ala35 40 45Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu Thr Ala Leu50 55 60Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val Leu Val Thr Gly Asp65 70 75 80Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gln Ala Ala Ile85 90 95Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg Glu Ala Ala100 105 110Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala Leu Ala Arg Arg Thr115 120 125Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu Ala Ala130 135 140Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp Ala Ile145 150 155 160Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu Leu Leu165 170 175Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly Arg Gly Ala His Leu180 185 190Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu Gly Ala195 200 205Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gln Gly Glu Gly210 215 220Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala Gly Leu225 230 235 240Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser Leu Thr Pro245 250 255Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro Asp Ala Thr Val Ile260 265 270Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp Leu Phe275 280 285Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg Ile Leu Arg Leu Leu290 295 300Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala Glu Ala305 310 315 320Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr Ala Glu325 330 335Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala Leu Asp340 345 350Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp Gly Gly His Phe355 360 365Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg Pro Gln Asp Leu370 375 380Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu Gly Leu Ala Ser385 390 395 400
Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn Ile Leu Val Leu405 410 415Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu Glu Ser420 425 430Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile Tyr Asn Asp Ala435 440 445Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg Gly Leu Thr Glu450 455 460Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly Ile Ala Arg Ala465 470 475 480Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser Asp Leu Ser Ala485 490 495Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr Phe Val Ala Asp500 505 510 Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu Ser Glu Trp Met515 520 525Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly530 535 540<210>7<211>1692<212>DNA<213>食酸假单胞菌(Pseudomonas acidovorana)<220>
<221>CDS<222>(1)..(1692)<400>7atg tcc cac ccc gcc atc tcc ctg caa gcg ctg cgc ggc agc ggc gca 48Met Ser His Pro Ala Ile Ser Leu Gln Ala Leu Arg Gly Ser Gly Ala1 5 10 15gac ata cag tcc atc cac atc ccc tac gag cgc cat gcc gac cag gac 96Asp Ile Gln Ser Ile His Ile Pro Tyr Glu Arg His Ala Asp Gln Asp20 25 30gcc ggt gcg gac acg ccc gcc cgg cat ccc gtc gtc atc gtc ggc gcc 144Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val Ile Val Gly Ala35 40 45ggc ccc gtg ggc ctg tcg ctg gcc atc gac ctg gcc cag cgc ggc cag 192Gly Pro Val Gly Leu Ser Leu Ala Ile Asp Leu Ala Gln Arg Gly Gln50 55 60cgc gtg gtg ctg ctg gac aac gac tgc cgg ctg tcc acg ggc tcg cgc 240Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly Ser Arg65 70 75 80gcc atc tgc ttt tcc aag cgc acg ctg gag atc tgg gac cgc ctg ggc 288Ala Ile Cys Phe Ser Lys Arg Thr Leu Glu Ile Trp Asp Arg Leu Gly85 90 95gtg ggc cag ccc atg gtg gac aag ggc gtg tcc tgg aac ctg ggc aag 336Val Gly Gln Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu Gly Lys100 105 110gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg ctg ccc gag 384
Val Phe Phe Lys Asp Gln Pro Leu Tyr Arg Phe Asp Leu Leu Pro Glu115 120 125gac ggc cac gag cgc ccg gcc ttc atc aac ctg cag cag tac tac gcc 432Asp Gly His Glu Arg Pro Ala Phe Ile Asn Leu Gln Gln Tyr Tyr Ala130 135 140gag gcc tat ctg gtc gag cgc gca ctg cag ctg ccg ctg atc gac ctg 480Glu Ala Tyr Leu Val Glu Arg Ala Leu Gln Leu Pro Leu Ile Asp Leu145 150 155 160cgc tgg cac agc aag gtc acg gca ctg gag ccg cag gcc gag ggc gcg 528Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gln Ala Glu Gly Ala165 170 175ctg ctg acc gtg gag acg cct gac ggc agc tac cgc atc gat gcg caa 576Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg Ile Asp Ala Gln180 185 190tgg gtc ctg gcc tgc gat ggc tcg cgc tcg ccg ctg cgc ggc ctg ctg 624Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly Leu Leu195 200 205ggc cag gaa agc cat ggc cgc atc ttc cgc gac cgc ttc ctg atc gcc 672Gly Gln Glu Ser His Gly Arg Ile Phe Arg Asp Arg Phe Leu Ile Ala210 215 220gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc tgg ttc 720Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe Trp Phe225 230 235 240gac ccg ccc ttc cac ccg ggc cag agc gtg ctg ctg cac cgc cag ccc 768Asp Pro Pro Phe His Pro Gly Gln Ssr Val Leu Leu His Arg Gln Pro245 250 255gac gat gtc tgg cgc atc gac ttc cag ctg ggc tgg gac gcg gac ccc 816Asp Asp Val Trp Arg Ile Asp Phe Gln Leu Gly Trp Asp Ala Asp Pro260 265 270gag gaa gag aaa aag ccc gag aac atc gtg ccg cgc atc cgc gcc ctg 864Glu Glu Glu Lys Lys Pro Glu Asn Ile Val Pro Arg Ile Arg Ala Leu275 280 285ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc agc gtc tac acc 912Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val Tyr Thr290 295 300ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg gtc ttt 960Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val Val Phe305 310 315 320gcg ggc gac agc gcc cac ggc gtc tcg ccg ttt ggc gca cgc ggc gcc 1008Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg Gly Ala325 330 335aac agc ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg gac cgc 1056Asn Ser Gly Val Gln Asp Ala Glu Asn Leu Ala Trp Lys Leu Asp Arg340 345 350gtg ctg cgc ggc cag gcc gat gcc tcg ctg atc gcc acc tac ggc gcc 1104Val Leu Arg Gly Gln Ala Asp Ala Ser Leu Ile Ala Thr Tyr Gly Ala355 360 365gag cgc gaa tac gcg gcc gac gag aac atc cgc aac tcc acg cgc gcc 1152Glu Arg Glu Tyr Ala Ala Asp Glu Asn Ile Arg Asn Ser Thr Arg Ala370 375 380acc gac ttc atc acg ccc aag agc gag atc agc cgc ctg ttt cgc gac 1200
Thr Asp Phe Ile Thr Pro Lys Ser Glu Ile Ser Arg Leu Phe Arg Asp385 390 395 400gcc gtg ctg gac ctg gcg cgc gac cat gaa ttc gcg cgc cgc atc gtc 1248Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg Ile Val405 410 415aac agc ggg cgg ctg tcc gtg ccg gcc acg ctg cac ggc tcc gcg ctc 1296Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser Ala Leu420 425 430aac acg cct gac acc gac acc ttc gac gga acg cag ctg ccc ggc gcc 1344Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gln Leu Pro Gly Ala435 440 445gtg ctg gcc gat gcg ccc atg cgc cgg ccc ggc gca gac ggc acg gcc 1392Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly Thr Ala450 455 460tgg ctg ctg cgc gca ctg gga ccg gac ttc acg ctg ctg cac ttc gac 1440Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His Phe Asp465 470 475 480ccc acg ccc gcc tgg gcg cag gcg ctg ccc ggc gtg ctc aac ctg tcc 1488Pro Thr Pro Ala Trp Ala Gln Ala Leu Pro Gly Val Leu Ash Leu Ser485 490 495atc gcg gcc gag ggc gag gcc cat gcg cca gac gcc gac ctc atc gat 1536Ile Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu Ile Asp500 505 510gcg cgc ggc ctg gcg gcc aaa cgc ctg gat gca cgc ccc ggc acc agc 1584Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser515 520 525tac ctg ctg cgg cct gac cag cat gtc tgc gcg cgc tgg cgc cgc ccc 1632Tyr Leu Leu Arg Pro Asp Gln His Val Cys Ala Arg Trp Arg Arg Pro530 535 540gac gaa gcc agc gtg cgc gcc gcg ctg caa aga gcc tgc ggc gcc gcc 1680Asp Glu Ala Ser Val Arg Ala Ala Leu Gln Arg Ala Cys Gly Ala Ala545 550 555 560gcc acg gcc tga 1692Ala Thr Ala<210>8<211>564<212>
<213>食酸假单胞菌(Pseudomonas acidovorana)<400>8Met Ser His Pro Ala Ile Ser Leu Gln Ala Leu Arg Gly Ser Gly Alal 5 10 15Asp Ile Gln Ser Ile His Ile Pro Tyr Glu Arg His Ala Asp Gln Asp20 25 30Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val Ile Val Gly Ala35 40 45Gly Pro Val Gly Leu Ser Leu Ala Ile Asp Leu Ala Gln Arg Gly Gln50 55 60Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly Ser Arg65 70 75 80
Ala Ile Cys Phe Ser Lys Arg Thr Leu Glu Ile Trp Asp Arg Leu Gly85 90 95Val Gly Gln Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu Gly Lys100 105 110Val Phe Phe Lys Asp Gln Pro Leu Tyr Arg Phe Asp Leu Leu Pro Glu115 120 125Asp Gly His Glu Arg Pro Ala Phe Ile Asn Leu Gln Gln Tyr Tyr Ala130 135 140Glu Ala Tyr Leu Val Glu Arg Ala Leu Gln Leu Pro Leu Ile Asp Leu145 150 155 160Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gln Ala Glu Gly Ala165 170 175Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg Ile Asp Ala Gln180 185 190Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly Leu Leu195 200 205Gly Gln Glu Ser His Gly Arg Ile Phe Arg Asp Arg Phe Leu Ile Ala210 215 220Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe Trp Phe225 230 235 240Asp Pro Pro Phe His Pro Gly Gln Ser Val Leu Leu His Arg Gln Pro245 250 255Asp Asp Val Trp Arg Ile Asp Phe Gln Leu Gly Trp Asp Ala Asp Pro260 265 270Glu Glu Glu Lys Lys Pro Glu Asn Ile Val Pro Arg Ile Arg Ala Leu275 280 285Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val Tyr Thr290 295 300Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val Val Phe305 310 315 320Ala Gly Asp ser Ala His Gly Val Ser Pro Phe Gly Ala Arg Gly Ala325 330 335Asn Ser Gly Val Gln Asp Ala Glu Asn Leu Ala Trp Lys Leu Asp Arg340 345 350Val Leu Arg Gly Gln Ala Asp Ala Ser Leu Ile Ala Thr Tyr Gly Ala355 360 365Glu Arg Glu Tyr Ala Ala Asp Glu Asn Ile Arg Asn Ser Thr Arg Ala370 375 380Thr Asp Phe Ile Thr Pro Lys Ser Glu Ile Ser Arg Leu Phe Arg Asp385 390 395 400Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg Ile Val405 410 415Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser Ala Leu420 425 430Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gln Leu Pro Gly Ala435 440 445
Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly Thr Ala450 455 460Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His Phe Asp465 470 475 480Pro Thr Pro Ala Trp Ala Gln Ala Leu Pro Gly Val Leu Asn Leu Ser485 490 495Ile Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu Ile Asp500 505 510Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser515 520 525Tyr Leu Leu Arg Pro Asp Gln His Val Cys Ala Arg Trp Arg Arg Pro530 535 540Asp Glu Ala Ser Val Arg Ala Ala Leu Gln Arg Ala Cys Gly Ala Ala545 550 555 560Ala Thr Ala<210>9<211>966<212>DNA<213>食酸假单胞菌(Pseudomonas acidovorana)<220>
<221>CDS<222>(1)..(966)<400>9atg acc acc aag acc ttt gcc tcc gcc gcc gac crc gaa atc aag cag 48Met Thr Thr Lys Thr Phs Ala Ser Ala Ala Asp Leu Glu Ile Lys Glnl 5 10 15gtc agc ttc gac aag ctc tcc gag cac gcc tat gcc tac acg gcc gaa 96Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30ggc gac ccc aac acc ggc atc atc att ggc gac gac gcg gtg atg gtg 144Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45atc gac acc cag gcc acg ccc gtc atg gcc cag gac gtg atc cgc cgc 192Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60atc cgt gag gtc acg gac aag ccc atc aag tac gtg acg ctg tcg cac 240Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His65 70 75 80tac cac gcg gtg cgc gtg ctg ggc gcc tcg gcc ttc ttc gcg gaa ggc 288Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95gcc gaa cac atc att gcc agc cag gac acc tac gac ctc atc gtg gag 336Ala Glu His Ile Ile Ala Ser Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110cgc ggc gag cag gac aag gcc agc gag atc ggc cgc ttt ccc cgc ctg 384Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125ttc cag aac gtg gaa agc gtg ccc gat ggc atg acc tgg ccc acc ctc 432
Phe Gln Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160atc ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175ctg ccc cag gac aag gtg ctg ttc agc ggc gac ctg gtg gag ttc ggc 576Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190gcc acg ccc tat gcg ggc gat gcc tac ttc cag gac tgg ccg cac acg 624Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro Mis Thr195 200 205ctg gac gcc atc gcc gcc ctg cag ccc gaa aag ctc gtg ccc ggc cgg 672Leu Asp Ala Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220ggc gcc gcg ctg cag acg ccg gcc gag gtg cag gcc ggc ctg gcc ggc 720Gly Ala Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240acg cgc gac ttc atc agc gac ctg tgg acc gag gtc aag gcc ggc gcc 768Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala245 250 255gat gcc cag cag gac ctg cgc aag gtc tac gag gcc gcc ttc gcc aag 816Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270ctg cag ccc aag tac ggc cag tgg gtg atc ttc aac cac tgc atg ccc 864Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro275 280 285ttc gat gtg acc cgc gcc tat gac gag gca tcg ggc cac gcc gac cca 912Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300cgc atc tgg acc gcc gag cgc gac cgc cag atg tgg ctg gcg ctc gaa 960Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320ggc tga 966Gly<210>10<211>322<212>
<213>食酸假单胞菌(Pseudomonas acidovorana)<400>10Met Thr Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu Ile Lys Gln1 5 10 15Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60
Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His65 70 75 80Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95Ala Glu His Ile Ile Ala Ser Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125Phe Gln Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr195 200 205Leu Asp Ala Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220Gly Ala Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala245 250 255Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phs Ash His Cys Met Pro275 280 285Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320Gly<210>1l<211>966<212>DNA<213>人工序列<220>
<223>人工序列的描述食酸假单胞菌(Pseudomonas acidovorana)HPAC突变体<220>
<221>CDS<222>(1)..(966)<400>11atg tcc acc aag acc ttt gcc tcc gcc gcc gac ctc gaa atc aag cag 48Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu Ile Lys Gln
1 5 10 15gtc agc ttc gac aag ctc tcc gag cac gcc tat gcc tac acg gcc gaa 96Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30ggc gac ccc aac acc ggc atc atc att ggc gac gac gcg gtg atg gtg 144Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45atc gac acc cag gcc acg ccc gtc atg gcc cag gac gtg atc cgc cgc 192Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60atc cgt gag gtc acg gac aag ccc atc aag tac gtg acg ctg tcg cac 240Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His65 70 75 80tac cac gcg gtg cgc gtg ctg ggc gcc tcg gcc ttc ttc gcg gaa ggc 288Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95gcc gaa cac atc att gcc agc cag gac acc tac gac ctc atc gtg gag 336Ala Glu His Ile Ile Ala Set Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110cgc ggc gag cag gac aag gcc agc gag atc ggc cgc ttt ccc cgc ctg 384Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125ttc cag aac gtg gaa agc gtg ccc gat ggc atg acc tgg ccc acc ctc 432Phe Gln Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160atc ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175ctg ccc cag gac aag gtg ctg ttc agc ggc gac ctg gtg gag ttc ggc 576Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190gcc acg ccc tat gcg ggc gat gcc tac ttc cag gac tgg ccg cac acg 624Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr195 200 205ctg gac acc atc gcc gcc ctg cag ccc gaa aag ctc gtg ccc ggc cgg 672Leu Asp Thr Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220ggc gcc gcg ctg cag acg ccg gcc gag gtg cag gcc ggc ctg gcc ggc 720Gly Ala Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240acg cgc gac ttc atc agc gac ctg tgg acc gag gtc aag gcc ggc gcc 768Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala245 250 255gat gcc cag cag gac ctg cgc aag gtc tac gag gcc gcc ttc gcc aag 816Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270ctg cag ccc aag tac ggc cag tgg gtg atc ttc aac cac tgc atg ccc 864Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro
275 280 285ttc gat gtg acc cgc gcc tat gac gag gca tcg ggc cac gcc gac cca 912Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300cgc atc tgg acc gcc gag cgc gac cgc cag atg tgg ctg gcg ctc gaa 960Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320ggc tga 966Gly<210>12<211>322<212>
<213>人工序列<223>人工序列的描述食酸假单胞菌(Pseudomonas acidovorana)HPAC突变体<400>12Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu Ile Lys Gln1 5 10 15Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His65 70 75 80Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95Ala Glu His Ile Ile Ala Ser Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125Phe Gln Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr195 200 205Leu Asp Thr Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220Gly Ata Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala
245 250 255Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro275 280 285Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320Gly<210>13<211>966<212>DNA<213>人工序列<220>
<223>人工序列的描述食酸假单胞菌(Pseudomonas acidovorana)HPAC突变体<220>
<221>CDS<222>(1)..(966)<400>13atg tcc acc aag acc ttt gcc tcc gcc gcc gac ctc gaa atc aag cag 48Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu Ile Lys Gln1 5 10 15gtc agc ttc gac aag ctc tcc gag cac gcc tat gcc tac acg gcc gaa 96Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30ggc gac ccc aac acc ggc atc atc att ggc gac gac gcg gtg atg gtg 144Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45atc gac acc cag gcc acg ccc gtc atg gcc cag gac gtg atc cgc cgc 192Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60atc cgt gag gtc acg gac aag ccc atc aag tac gtg acg ctg tcg cac 240Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His65 70 75 80tac cac gcg gtg cgc gtg ctg ggc gcc tcg gcc ttc ttc gcg gaa ggc 288Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95gcc gaa cac atc att gcc agc cag gac acc tac gac ctc atc gtg gag 336Ala Glu His Ile Ile Ala Set Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110cgc ggc gag cag gac aag gcc agc gag atc ggc cgc ttt ccc cgc ctg 384Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125ttc cag aac gtg gaa agc gtg ccc gat ggc atg acc tgg ccc acc ctc 432Phe Gln Asn Val Glu Set Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480
Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160atc ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175ctg ccc cag gac aag gtg ctg ttc agc ggc gac ctg gtg gag ttc ggc 576Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190gcc acg ccc tat gcg ggc gat gcc tac ttc cag gac tgg ccg cac acg 624Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr195 200 205ctg gac gcc atc gcc gcc ctg cag ccc gaa aag ctc gtg ccc ggc cgg 672Leu Asp Ala Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220ggc gcc gcg ctg cag acg ccg gcc gag gtg cag gcc ggc ctg gcc ggc 720Gly Ala Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240acg cgc gac ttc atc agc gac ctg tgg acc gag gtc aag gcc ggc gcc 768Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala245 250 255gat gcc cag cag gac ctg cgc aag gtc tac gag gcc gcc ttc gcc aag 816Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270ctg cag ccc aag tac ggc cag tgg gtg atc ttc aac cac tgc atg ccc 864Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro275 280 285ttc gat gtg acc cgc gcc tat gac gag gca tcg ggc cac gcc gac cca 912Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300cgc atc tgg acc gcc gag cgc gac cgc cag atg tgg ctg gcg ctc gaa 960Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320ggc tga 966Gly<210>14<211>322<212>人工序列<213>
<223>人工序列的描述食酸假单胞菌(Pseudomonas acidovorana)HPAC突变体<400>14Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu Ile Lys Gln1 5 10 15Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu20 25 30Gly Asp Pro Asn Thr Gly Ile Ile Ile Gly Asp Asp Ala Val Met Val35 40 45Ile Asp Thr Gln Ala Thr Pro Val Met Ala Gln Asp Val Ile Arg Arg50 55 60Ile Arg Glu Val Thr Asp Lys Pro Ile Lys Tyr Val Thr Leu Ser His
65 70 75 80Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly85 90 95Ala Glu His Ile Ile Ala Ser Gln Asp Thr Tyr Asp Leu Ile Val Glu100 105 110Arg Gly Glu Gln Asp Lys Ala Ser Glu Ile Gly Arg Phe Pro Arg Leu115 120 125Phe Gln Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu130 135 140Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gln145 150 155 160Ile Leu Gln Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp165 170 175Leu Pro Gln Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly180 185 190Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr195 200 205Leu Asp Ala Ile Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg210 215 220Gly Ala Ala Leu Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly225 230 235 240Thr Arg Asp Phe Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala245 250 255Asp Ala Gln Gln Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys260 265 270Leu Gln Pro Lys Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro275 280 285Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro290 295 300Arg Ile Trp Thr Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu305 310 315 320Gly<210>15<211>3549<212>DNA<213>人工序列<220>
<223>人工序列的描述表达盒<220>
<221>启动子<222>(1)..(928)<220>
<221>CDS<222>(965)..(2647)<220>
<221>终止子<222>(2811)..(3549)<400>15tgcatgccta ggtcgaggag aaatatgagt cgaggcatgg atacactaag ttcccctgaa60gtgagcatga tctttgatgc tgagatgatt cccagagcaa gatagtttgt gctgcaagtg120acacaattgt aatgaaacca ccactcaacg aatttacttg tggctttgac atgtcgtgtg180ctctgtttgt atttgtgagt gccggttggt aattattttt gttaatgtga ttttaaaacc240tcttatgtaa atagttactt tatctattga agtgtgttct tgtggtctat agtttctcaa300agggaaatta aaatgttgac atcccattta caattgataa cttggtatac acaaactttg360taaatttggt gatatttatg gtcgaaagaa ggcaataccc attgtatgtt ccaatatcaa420tatcaatacg ataacttgat aatactaaca tatgattgtc attgtttttc cagtatcaat480atacattaag ctactacaaa attagtataa atcactatat tataaatctt tttcggttgt540aacttgtaat tcgtgggttt ttaaaataaa agcatgtgaa aattttcaaa taatgtgatg600gcgcaatttt attttccgag ttccaaaata ttgccgcttc attaccctaa tttgtggcgc660cacatgtaaa acaaaagacg attcttagtg gctatcactg ccatcacgcg gatcactaat720atgaaccgtc gattaaaaca gatcgacggt ttatacatca ttttattgta cacacggatc780gatatctcag ccgttagatt taatatgcga tctgattgct caaaaaatag actctccgtc840tttgcctata aaaacaattt cacatctttc tcacccaaat ctactcttaa ccgttcttct900tcttctacag acatcaattt ctctcgactc tagaggatcc aagcttatcg atttcgaacc960cctc atg act tca ctt aca gtg tcc ggc cgg gtg gcg cag gtc ctc agc 1009Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gln Val Leu Ser1 5 10 15agc tat gtc agc gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac 1057Ser Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr20 25 30ttc ctg gac gcc gcc gag aag gag ggc ctc cgc ttc acg gcc gta cgc 1105Phe Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg35 40 45cat gaa ggt gcc gcc atc gcg gcg gcg gac gcc tac tat cgg gca tcc 1153His Glu Gly Ala Ala Ile Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser50 55 60ggg cgc ctg gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac 1201Gly Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn65 70 75gcc ctg acg gcc ctc gcc gag gcg gtc cag gcg cag atc ccc gtg gtg 1249Ala Leu Thr Ala Leu Ala Glu Ala Val Gln Ala Gln Ile Pro Val Val80 85 90 95ctc gtc acc ggg gac gcc ccg agc agc ggc gcc cgg cct tgg gac gtg 1297Leu Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val100 105 110gac cag gcc gcg atc gcc gcc ggg ctg ggg gcg gcg acc ttc acg gtc 1345Asp Gln Ala Ala Ile Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val115 120 125
acc cgt gaa gcc gca ggc tcc atc acg cag gaa gcg gtg gag tac gca 1393Thr Arg Glu Ala Ala Gly Ser Ile Thr Gln Glu Ala Val Glu Tyr Ala130 135 140ctt gcc cgg cgg acc gcc gtc gtg atc gcc gtt cca tac gac ctg tcg 1441Leu Ala Arg Arg Thr Ala Val Val Ile Ala Val Pro Tyr Asp Leu Ser145 150 155gcc ctt gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc tcg 1489Ala Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser160 165 170 175gtt ccg gac gcc atc ggc ggc gga ctc gga cgg gcg gcc gaa gtg cgg 1537Val Pro Asp Ala Ile Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg180 185 190gcg gcc gaa ttg ctg gcg ggc gcg aag cgg ccg ctc atc ctt gcc ggc 1585Ala Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu Ile Leu Ala Gly195 200 205cgc ggt gcg cac ctc gca gga acc ggc ccc gaa ctc cgg gaa ctc gcc 1633Arg Gly Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala210 215 220gac cgc ctc ggc gcg ctc acg gcc ggc acc gca ctg gcg ctg aac ctg 1681Asp Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu225 230 235ctg cag ggc gag ggg tac ctc ggc gtc gcg ggc ggc ttc ggc acg gat 1729Leu Gln Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp240 245 250 255acc gcc gcc ggg ctc atg ggc gag gcg gac gtg gtg ctc gtg gcg gga 1777Thr Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly260 265 270gcc agc ctg acc ccc ttc acc atg cgc ttc ggc cac ctg atc ggc ccg 1825Ala Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu Ile Gly Pro275 280 285gac gcc acc gtg atc cag atc gac acc gcc atg gag ccg acg gac ccg 1873Asp Ala Thr Val Ile Gln Ile Asp Thr Ala Met Glu Pro Thr Asp Pro290 295 300cgg gtg gac ctg ttt gtc agt gcg gac gcg aag gcc gct gcc ggc cgg 1921Arg Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg305 310 315atc ctc cgg ctg ctg gat gac gcc gcc ggg gcc aat gcg tcg aag gcc 1969Ile Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala320 325 330 335tgg cgc gcg gaa gca ctc aag cgt ctg gcc gaa gga ccc tgc cac cac 2017Trp Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His340 345 350ccc ggc acc gca gag acc acg gac ggc cgc ctt gac ccc cgg gcg ctt 2065Pro Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu355 360 365gct tcg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag 2113Ala Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln370 375 380gac ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc atc ccc 2161Asp Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro385 390 395
cgt cct cag gac ctg gtc atg gtg ggg acc gcg tac cag tcg atc ggg 2209Arg Pro Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly400 405 410 415ctt ggc ctg gcc agc gcc gtg ggg gcg tcc cgg gcc gtg gac gac ggc 2257Leu Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly420 425 430aat atc ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg 2305Asn Ile Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu435 440 445tcc gac ctg gaa tcg ctc gtg ggc gcg gcg agc agc gcc gtc gtg gtg 2353Ser Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val450 455 460atc tac aac gac gcc gcc tac ggg gcc gag atc cat cag tac ggc tca 2401Ile Tyr Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser465 470 475cgg ggg ctc acc gaa aag ccc atg ctg atc ccc gaa gtg gac ttc agc 2449Arg Gly Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser480 485 490 495ggg att gcc cgc gcg atc ggg gcg gaa tcc gca atc atc cgc aag ctg 2497Gly Ile Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu500 505 510tcg gac ctc tcc gcg ctc acg gac tgg atc gag gcc ggc gcc agg gga 2545Ser Asp Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly515 520 525acc ttc gtg gcc gac tgc cgc atc acc tca agc gtc cgg gcc ccg tgg 2593Thr Phe Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp530 535 540ctg agc gaa tgg atg agg gcc tcg caa gcg gcg aag gag gcg gtg gcg 2641Leu Ser Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala545 550 555ggc tag ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca 2697Gly560gggcgttctc agggctggga acgccctgag ctgctactca tttgttcgaa ctcgaggtcg2757acggtatcga taagcttgat atcgaattcc tgcagcccgg gggatccact aggggatccc2817ccgatccgcg tttgtgtttt ctgggtttct cacttaagcg tctgcgtttt acttttgtat2877tgggtttggc gtttagtagt ttgcggtagc gttcttgtta tgtgtaatta cgctttttct2937tcttgcttca gcagtttcgg ttgaaatata aatcgaatca agtttcactt tatcagcgtt2997gttttaaatt ttggcattaa attggtgaaa attgcttcaa ttttgtatct aaatagaaga3057gacaacatga aattcgactt ttgacctcaa atcttcgaac atttatttcc tgatttcacg3117atggatgagg ataacgaaag ggcggttcct atgtccggga aagttcccgt agaagacaat3177gagcaaagct actgaaacgc ggacacgacg tcgcattggt acggatatga gttaaaccga3237ctcaattcct ttattaagac ataaaccgat tttggttaaa gtgtaacagt gagctgatat3297aaaaccgaaa caaaccggta caagtttgat tgagcaactt gatgacaaac ttcagaattt3357tggttattga atgaaaatca tagtctaatc gtaaaaaatg tacagaagaa aagctagagc3417
agaacaaaga ttctatattc tggttccaat ttatcatcgc tttaacgtcc ctcagatttg3477atcgggctgc aggaattcgg cctgactgat catttaaaca ctagttctag agcggccgcc3537accgcggtgg ag3549<210>16<211>241<212>
<213>人工序列<223>人工序列的描述,表达盒<400>16Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp1 5 10 15Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro20 25 30Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala35 40 45Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gln Asp50 55 60Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg Ile Pro Arg65 70 75 80Pro Gln Asp Leu Val Met Val Gly Thr Ala Tyr Gln Ser Ile Gly Leu85 90 95Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn100 105 110Ile Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser115 120 125Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val Ile130 135 140Tyr Asn Asp Ala Ala Tyr Gly Ala Glu Ile His Gln Tyr Gly Ser Arg145 150 155 160Gly Leu Thr Glu Lys Pro Met Leu Ile Pro Glu Val Asp Phe Ser Gly165 170 175Ile Ala Arg Ala Ile Gly Ala Glu Ser Ala Ile Ile Arg Lys Leu Ser180 185 190Asp Leu Ser Ala Leu Thr Asp Trp Ile Glu Ala Gly Ala Arg Gly Thr195 200 205Phe Val Ala Asp Cys Arg Ile Thr Ser Ser Val Arg Ala Pro Trp Leu210 215 220Ser Glu Trp Met Arg Ala Ser Gln Ala Ala Lys Glu Ala Val Ala Gly225 230 235 240<210>17<211>2838<212>DNA<213>人工序列<220>
<223>人工序列的描述表达盒
<220>
<221>启动子<222>(1)..(807)<220>
<221>CDS<222>(847)..(2538)<220>
<221>终止子<222>(2539)..(2838)<400>17ggccccccct cgagcccaca gatggttaga gaggcttacg cagcaggtct catcaagacg60atctacccga gcaataatct ccaggaaatc aaataccttc ccaagaaggt taaagatgca120gtcaaaagat tcaggactaa ctgcatcaag aacacagaga aagatatatt tctcaagatc180agaagtacta ttccagtatg gacgattcaa ggcttgcttc acaaaccaag gcaagtaata240gagattggag tctctaaaaa ggtagttccc actgaatcaa aggccatgga gtcaaagatt300caaatagagg acctaacaga actcgccgta aagactggcg aacagttcat acagagtctc360ttacgactca atgacaagaa gaaaatcttc gtcaacatgg tggagcacga cacacttgtc420tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa480caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt540gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag600gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg660agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat720atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct780atataaggaa gttcatttca tttggagaga acacggggga ctctagagga tcagaggacg840aacaac atg tcc cac ccc gcc atc tcc ctg caa gcg ctg cgc ggc agc 888Met Ser His Pro Ala Ile Ser Leu Gln Ala Leu Arg Gly Ser1 5 10ggc gca gac ata cag tcc atc cac atc ccc tac gag cgc cat gcc gac 936Gly Ala Asp Ile Gln Ser Ile His Ile Pro Tyr Glu Arg His Ala Asp15 20 25 30cag gac gcc ggt gcg gac acg ccc gcc cgg cat ccc gtc gtc atc gtc 984Gln Asp Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val Ile Val35 40 45ggc gcc ggc ccc gtg ggc ctg tcg ctg gcc atc gac ctg gcc cag cgc 1032Gly Ala Gly Pro Val Gly Leu Ser Leu Ala Ile Asp Leu Ala Gln Arg50 55 60ggc cag cgc gtg gtg ctg ctg gac aac gac tgc cgg ctg tcc acg ggc 1080Gly Gln Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly65 70 75tcg cgc gcc atc tgc ttt tcc aag cgc acg ctg gag atc tgg gac cgc 1128Ser Arg Ala Ile Cys Phe Ser Lys Arg Thr Leu Glu Ile Trp Asp Arg80 85 90ctg ggc gtg ggc cag ccc atg gtg gac aag ggc gtg tcc tgg aac ctg 1176
Leu Gly Val Gly Gln Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu95 100 105 110ggc aag gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg ctg 1224Gly Lys Val Phe Phe Lys Asp Gln Pro Leu Tyr Arg Phe Asp Leu Leu115 120 125ccc gag gac ggc cac gag cgc ccg gcc ttc atc aac ctg cag cag tac 1272Pro Glu Asp Gly His Glu Arg Pro Ala Phe Ile Asn Leu Gln Gln Tyr130 135 140tac gcc gag gcc tat ctg gtc gag cgc gca ctg cag ctg ccg ctg atc 1320Tyr Ala Glu Ala Tyr Leu Val Glu Arg Ala Leu Gln Leu Pro Leu Ile145 150 155gac ctg cgc tgg cac agc aag gtc acg gca ctg gag ccg cag gcc gag 1368Asp Leu Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gln Ala Glu160 165 170ggc gcg ctg ctg acc gtg gag acg cct gac ggc agc tac cgc atc gat 1416Gly Ala Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg Ile Asp175 180 185 190gcg caa tgg gtc ctg gcc tgc gat ggc tcg cgc tcg ccg ctg cgc ggc 1464Ala Gln Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly195 200 205ctg ctg ggc cag gaa agc cat ggc cgc atc ttc cgc gac cgc ttc ctg 1512Leu Leu Gly Gln Glu Set His Gly Arg Ile Phe Arg Asp Arg Phe Leu210 215 220atc gcc gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc 1560Ile Ala Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe225 230 235tgg ttc gac ccg ccc ttc cac ccg ggc cag agc gtg ctg ctg cac cgc 1608Trp Phe Asp Pro Pro Phe His Pro Gly Gln Ser Val Leu Leu His Arg240 245 250cag ccc gac gat gtc tgg cgc atc gac ttc cag ctg ggc tgg gac gcg 1656Gln Pro Asp Asp Val Trp Arg Ile Asp Phe Gln Leu Gly Trp Asp Ala255 260 265 270gac ccc gag gaa gag aaa aag ccc gag aac atc gtg ccg cgc atc cgc 1704Asp Pro Glu Glu Glu Lys Lys Pro Glu Asn Ile Val Pro Arg Ile Arg275 280 285gcc ctg ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc agc gtc 1752Ala Leu Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val290 295 300tac acc ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg 1800Tyr Thr Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val305 310 315gtc ttt gcg ggc gac agc gcc cac ggc gtc tcg ccg ttt ggc gca cgc 1848Val Phe Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg320 325 330ggc gcc aac agc ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg 1896Gly Ala Asn Ser Gly Val Gln Asp Ala Glu Asn Leu Ala Trp Lys Leu335 340 345 350gac cgc gtg ctg cgc ggc cag gcc gat gcc tcg ctg atc gcc acc tac 1944Asp Arg Val Leu Arg Gly Gln Ala Asp Ala Ser Leu Ile Ala Thr Tyr355 360 365ggc gcc gag cgc gaa tac gcg gcc gac gag aac atc cgc aac tcc acg 1992
Gly Ala Glu Arg Glu Tyr Ala Ala Asp Glu Asn Ile Arg Asn Ser Thr370 375 380cgc gcc acc gac ttc atc acg ccc aag agc gag atc agc cgc ctg ttt 2040Arg Ala Thr Asp Phe Ile Thr Pro Lys Ser Glu Ile Ser Arg Leu Phe385 390 395cgc gac gcc gtg ctg gac ctg gcg cgc gac cat gaa ttc gcg cgc cgc 2088Arg Asp Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg400 405 410atc gtc aac agc ggg cgg ctg tcc gtg ccg gcc acg ctg cac ggc tcc 2136Ile Val Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser415 420 425 430gcg ctc aac acg cct gac acc gac acc ttc gac gga acg cag ctg ccc 2184Ala Leu Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gln Leu Pro435 440 445ggc gcc gtg ctg gcc gat gcg ccc atg cgc cgg ccc ggc gca gac ggc 2232Gly Ala Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly450 455 460acg gcc tgg ctg ctg cgc gca ctg gga ccg gac ttc acg ctg ctg cac 2280Thr Ala Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His465 470 475ttc gac ccc acg ccc gcc tgg gcg cag gcg ctg ccc ggc gtg ctc aac 2328Phe Asp Pro Thr Pro Ala Trp Ala Gln Ala Leu Pro Gly Val Leu Asn480 485 490ctg tcc atc gcg gcc gag ggc gag gcc cat gcg cca gac gcc gac ctc 2376Leu Ser Ile Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu495 500 505 510atc gat gcg cgc ggc ctg gcg gcc aaa cgc ctg gat gca cgc ccc ggc 2424Ile Asp Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly515 520 525acc agc tac ctg ctg cgg cct gac cag cat gtc tgc gcg cgc tgg cgc 2472Thr Ser Tyr Leu Leu Arg Pro Asp Gln His Val Cys Ala Arg Trp Arg530 535 540cgc ccc gac gaa gcc agc gtg cgc gcc gcg ctg caa aga gcc tgc ggc 2520Arg Pro Asp Glu Ala Ser Val Arg Ala Ala Leu Gln Arg Ala Cys Gly545 550 555gcc gcc gcc acg gcc tga acctcttaag cttatcgata ccgtcgacga 2568Ala Ala Ala Thr Ala560atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg2628gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta ataattaaca2688tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca2748tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg2808tgtcatctat gttcctaggt cgggaattgc 2838<210>18<211>284<212>
<213>人工序列<223>人工序列的描述表达盒
<400>18Ile Val Pro Arg Ile Arg Ala Leu Leu Gly Lys Asp Ala Pro Phe Glu1 5 10 15Leu Glu Trp Ala Ser Val Tyr Thr Phe Ala Cys Leu Arg Met Asp Arg20 25 30Phe Val His Gly Arg Val Val Phe Ala Gly Asp Ser Ala His Gly Val35 40 45Ser Pro Phe Gly Ala Arg Gly Ala Asn Ser Gly Val Gln Asp Ala Glu50 55 60Asn Leu Ala Trp Lys Leu Asp Arg Val Leu Arg Gly Gln Ala Asp Ala65 70 75 80Ser Leu Ile Ala Thr Tyr Gly Ala Glu Arg Glu Tyr Ala Ala Asp Glu85 90 95Asn Ile Arg Asn Ser Thr Arg Ala Thr Asp Phe Ile Thr Pro Lys Ser100 105 110Glu Ile Ser Arg Leu Phe Arg Asp Ala Val Leu Asp Leu Ala Arg Asp115 120 125His Glu Phe Ala Arg Arg Ile Val Asn Ser Gly Arg Leu Ser Val Pro130 135 140Ala Thr Leu His Gly Ser Ala Leu Asn Thr Pro Asp Thr Asp Thr Phe145 150 155 160Asp Gly Thr Gln Leu Pro Gly Ala Val Leu Ala Asp Ala Pro Met Arg165 170 175Arg Pro Gly Ala Asp Gly Thr Ala Trp Leu Leu Arg Ala Leu Gly Pro180 185 190Asp Phe Thr Leu Leu His Phe Asp Pro Thr Pro Ala Trp Ala Gln Ala195 200 205Leu Pro Gly Val Leu Asn Leu Ser Ile Ala Ala Glu GIy Glu Ala His210 215 220Ala Pro Asp Ala Asp Leu Ile Asp Ala Arg Gly Leu Ala Ala Lys Arg225 230 235 240Leu Asp Ala Arg Pro Gly Thr Ser Tyr Leu Leu Arg Pro Asp Gln His245 250 255Val Cys Ala Arg Trp Arg Arg Pro Asp Glu Ala Ser Val Arg Ala Ala260 265 270Leu Gln Arg Ala Cys Gly Ala Ala Ala Thr Ala275 280<210>19<211>1839<212>DNA<213>人工序列<220>
<223>人工序列的描述表达盒<220>
<221>启动子
<222>(1)..(547)<220>
<221>CDS<222>(574)..(1539)<220>
<221>终止子<222>(1540)..(1839)<400>19ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat60caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca120gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga180tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga240agaaaagaat cttgaagacg taagcactga cgacaacaat gaaaagaaga agataaggtc300ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt360aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca420tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa480aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta540agtttgtaga tctgaattcg atgcaggatg cac atg tcc acc aag acc ttt gcc 594Met Ser Thr Lys Thr Phe Alal 5tcc gcc gcc gac ctc gaa atc aag cag gtc agc ttc gac aag ctc tcc 642Ser Ala Ala Asp Leu Glu Ile Lys Gln Val Ser Phe Asp Lys Leu Ser10 15 20gag cac gcc tat gcc tac acg gcc gaa ggc gac ccc aac acc ggc atc 690Glu His Ala Tyr Ala Tyr Thr Ala Glu Gly Asp Pro Asn Thr Gly Ile25 30 35atc att ggc gac gac gcg gtg atg gtg atc gac acc cag gcc acg ccc 738Ile Ile Gly Asp Asp Ala Val Met Val Ile Asp Thr Gln Ala Thr Pro40 45 50 55gtc atg gcc cag gac gtg atc cgc cgc atc cgt gag gtc acg gac aag 786Val Met Ala Gln Asp Val Ile Arg Arg Ile Arg Glu Val Thr Asp Lys60 65 70ccc atc aag tac gtg acg ctg tcg cac tac cac gcg gtg cgc gtg ctg 834Pro Ile Lys Tyr Val Thr Leu Set His Tyr His Ala Val Arg Val Leu75 80 85ggc gcc tcg gcc ttc ttc gcg gaa ggc gcc gaa cac atc att gcc agc 882Gly Ala Ser Ala Phe Phe Ala Glu Gly Ala Glu His Ile Ile Ala Ser90 95 100cag gac acc tac gac ctc atc gtg gag cgc ggc gag cag gac aag gcc 930Gln Asp Thr Tyr Asp Leu Ile Val Glu Arg Gly Glu Gln Asp Lys Ala105 110 115agc gag atc ggc cgc ttt ccc cgc ctg ttc cag aac gtg gaa agc gtg 978Ser Glu Ile Gly Arg Phe Pro Arg Leu Phe Gln Asn Val Glu Ser Val120 125 130 135ccc gat ggc atg acc tgg ccc acc ctc acc ttc acc ggc aag atg acg 1026Pro Asp Gly Met Thr Trp Pro Thr Leu Thr Phe Thr Gly Lys Met Thr140 145 150
ctg tgg ctg ggc aag ctg gaa gtg cag atc ctg cag ctg ggc cgc ggc 1074Leu Trp Leu Gly Lys Leu Glu Val Gln Ile Leu Gln Leu Gly Arg Gly155 160 165cac acc aag ggc gac acc gtg gtc tgg ctg ccc cag gac aag gtg ctg 1122His Thr Lys Gly Asp Thr Val Val Trp Leu Pro Gln Asp Lys Val Leu170 175 180ttc agc ggc gac ctg gtg gag ttc ggc gcc acg ccc tat gcg ggc gat 1170Phe Set Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr Ala Gly Asp185 190 195gcc tac ttc cag gac tgg ccg cac acg ctg gac gcc atc gcc gcc ctg 1218Ala Tyr Phe Gln Asp Trp Pro His Thr Leu Asp Ala Ile Ala Ala Leu200 205 210 215cag ccc gaa aag ctc gtg ccc ggc cgg ggc gcc gcg ctg cag acg ccg 1266Gln Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu Gln Thr Pro220 225 230gcc gag gtg cag gcc ggc ctg gcc ggc acg cgc gac ttc atc agc gac 1314Ala Glu Val Gln Ala Gly Leu Ala Gly Thr Arg Asp Phe Ile Ser Asp235 240 245ctg tgg acc gag gtc aag gcc ggc gcc gat gcc cag cag gac ctg cgc 1362Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gln Gln Asp Leu Arg250 255 260aag gtc tac gag gcc gcc ttc gcc aag ctg cag ccc aag tac ggc cag 1410Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gln Pro Lys Tyr Gly Gln265 270 275tgg gtg atc ttc aac cac tgc atg ccc ttc gat gtg acc cgc gcc tat 1458Trp Val Ile Phe Asn His Cys Met Pro Phe Asp Val Thr Arg Ala Tyr280 285 290 295gac gag gca tcg ggc cac gcc gac cca cgc atc tgg acc gcc gag cgc 1506Asp Glu Ala Ser Gly His Ala Asp Pro Arg Ile Trp Thr Ala Glu Arg300 305 310gac cgc cag atg tgg ctg gcg ctc gaa ggc tga tgcaagctta tcgataccgt1559Asp Arg Gln Met Trp Leu Ala Leu Glu Gly315 320cgacgaattt ccccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg1619ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa1679ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat1739tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc1799gcgcggtgtc atctatgtta ctagatcggg aattgcggcc 1839<210>20<211>142<212>
<213>人工序列<223>人工序列的描述表达盒<400> 20Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr1 5 10 15Ala Gly Asp Ala Tyr Phe Gln Asp Trp Pro His Thr Leu Asp Ala Ile
20 25 30Ala Ala Leu Gln Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu35 40 45Gln Thr Pro Ala Glu Val Gln Ala Gly Leu Ala Gly Thr Arg Asp Phe50 55 60Ile Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gln Gln65 70 75 80Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gln Pro Lys85 90 95Tyr Gly Gln Trp Val Ile Phe Asn His Cys Met Pro Phe Asp Val Thr100 105 110Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro Arg Ile Trp Thr115 120 125Ala Glu Arg Asp Arg Gln Met Trp Leu Ala Leu Glu Gly130 135 140<210>21<211>4677<212>DNA<213>人工序列<220>
<223>人工序列的描述表达盒<400>21ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat60caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca120gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga180tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga240agaaaagaat cttgaagacg taagcactga cgacaacaat gaaaagaaga agataaggtc300ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt360aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca420tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa480aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta540agtttgtaga tctgaattcg atgcaggatg cacatgtcca ccaagacctt tgcctccgcc600gccgacctcg aaatcaagca ggtcagcttc gacaagctct ccgagcacgc ctatgcctac660acggccgaag gcgaccccaa caccggcatc atcattggcg acgacgcggt gatggtgatc720gacacccagg ccacgcccgt catggcccag gacgtgatcc gccgcatccg tgaggtcacg780gacaagccca tcaagtacgt gacgctgtcg cactaccacg cggtgcgcgt gctgggcgcc840tcggccttct tcgcggaagg cgccgaacac atcattgcca gccaggacac ctacgacctc900atcgtggagc gcggcgagca ggacaaggcc agcgagatcg gccgctttcc ccgcctgttc960cagaacgtgg aaagcgtgcc cgatggcatg acctggccca ccctcacctt caccggcaag1020
atgacgctgt ggctgggcaa gctggaagtg cagatcctgc agctgggccg cggccacacc1080aagggcgaca ccgtggtctg gctgccccag gacaaggtgc tgttcagcgg cgacctggtg1140gagttcggcg ccacgcccta tgcgggcgat gcctacttcc aggactggcc gcacacgctg1200gacgccatcg ccgccctgca gcccgaaaag ctcgtgcccg gccggggcgc cgcgctgcag1260acgccggccg aggtgcaggc cggcctggcc ggcacgcgcg acttcatcag cgacctgtgg1320accgaggtca aggccggcgc cgatgcccag caggacctgc gcaaggtcta cgaggccgcc1380ttcgccaagc tgcagcccaa gtacggccag tgggtgatct tcaaccactg catgcccttc1440gatgtgaccc gcgcctatga cgaggcatcg ggccacgccg acccacgcat ctggaccgcc1500gagcgcgacc gccagatgtg gctggcgctc gaaggctgat gcaagcttat cgataccgtc1560gacgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt1620tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat1680taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt1740atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg1800cgcggtgtca tctatgttac tagatcggga attgcggccc cccctcgagc ccacagatgg1860ttagagaggc ttacgcagca ggtctcatca agacgatcta cccgagcaat aatctccagg1920aaatcaaata ccttcccaag aaggttaaag atgcagtcaa aagattcagg actaactgca1980tcaagaacac agagaaagat atatttctca agatcagaag tactattcca gtatggacga2040ttcaaggctt gcttcacaaa ccaaggcaag taatagagat tggagtctct aaaaaggtag2100ttcccactga atcaaaggcc atggagtcaa agattcaaat agaggaccta acagaactcg2160ccgtaaagac tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa2220tcttcgtcaa catggtggag cacgacacac ttgtctactc caaaaatatc aaagatacag2280tctcagaaga ccaaagggca attgagactt ttcaacaaag ggtaatatcc ggaaacctcc2340tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg2400gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg2460acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc2520caaccacgtc ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg2580cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg2640agagaacacg ggggactcta gaggatcaga ggacgaacaa catgtcccac cccgccatct2700ccctgcaagc gctgcgcggc agcggcgcag acatacagtc catccacatc ccctacgagc2760gccatgccga ccaggacgcc ggtgcggaca cgcccgcccg gcatcccgtc gtcatcgtcg2820gcgccggccc cgtgggcctg tcgctggcca tcgacctggc ccagcgcggc cagcgcgtgg2880tgctgctgga caacgactgc cggctgtcca cgggctcgcg cgccatctgc ttttccaagc2940gcacgctgga gatctgggac cgcctgggcg tgggccagcc catggtggac aagggcgtgt3000cctggaacct gggcaaggtc ttcttcaagg accagccgct gtaccgcttc gacctgctgc3060
ccgaggacgg ccacgagcgc ccggccttca tcaacctgca gcagtactac gccgaggcct3120atctggtcga gcgcgcactg cagctgccgc tgatcgacct gcgctggcac agcaaggtca3180cggcactgga gccgcaggcc gagggcgcgc tgctgaccgc ggagacgcct gacggcagct3240accgcatcga tgcgcaatgg gtcctggcct gcgatggctc gcgctcgccg ctgcgcggcc3300tgctgggcca ggaaagccat ggccgcatct tccgcgaccg cttcctgatc gccgacgtga3360agatgcacgc cgaattcccc accgagcgct ggttctggtt cgacccgccc ttccacccgg3420gccagagcgt gctgctgcac cgccagcccg acgatgtctg gcgcatcgac ttccagctgg3480gctgggacgc ggaccccgag gaagagaaaa agcccgagaa catcgtgccg cgcatccgcg3540ccctgctggg caaggacgcg cccttcgagc tggaatgggc cagcgtctac accttcgcct3600gcctgcgcat ggaccgcttc gtccatggcc gcgtggtctt tgcgggcgac agcgcccacg3660gcgtctcgcc gtttggcgca cgcggcgcca acagcggcgt gcaggatgcc gagaacctgg3720catggaagct ggaccgcgtg ctgcgcggcc aggccgatgc ctcgctgatc gccacctacg3780gcgccgagcg cgaatacgcg gccgacgaga acatccgcaa ctccacgcgc gccaccgact3840tcatcacgcc caagagcgag atcagccgcc tgtttcgcga cgccgtgctg gacctggcgc3900gcgaccatga attcgcgcgc cgcatcgtca acagcgggcg gctgtccgtg ccggccacgc3960tgcacggctc cgcgctcaac acgcctgaca ccgacacctt cgacggaacg cagctgcccg4020gcgccgtgct ggccgatgcg cccatgcgcc ggcccggcgc agacggcacg gcctggctgc4080tgcgcgcact gggaccggac ttcacgctgc tgcacttcga ccccacgccc gcctgggcgc4140aggcgctgcc cggcgtgctc aacctgtcca tcgcggccga gggcgaggcc catgcgccag4200acgccgacct catcgatgcg cgcggcctgg cggccaaacg cctggatgca cgccccggca4260ccagctacct gctgcggcct gaccagcatg tctgcgcgcg ctggcgccgc cccgacgaag4320ccagcgtgcg cgccgcgctg caaagagcct gcggcgccgc cgccacggcc tgaacctctt4380aagcttatcg ataccgtcga cgaatttccc cgatcgttca aacatttggc aataaagttt4440cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta4500cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat4560gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa4620ctaggataaa ttatcgcgcg cggtgtcatc tatgttccta ggtcgggaat tgcggcc 4677<210>22<211>8187<212>DNA<213>人工序列<220>
<223>人工序列的描述表达盒<400>22ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat60caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca120
gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga180tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga240agaaaagaat cttgaagacg taagcactga cgacaacaat gaaaagaaga agataaggtc300ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt360aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca420tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa480aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta540agtttgtaga tctgaattcg atgcaggatg cacatgtcca ccaagacctt tgcctccgcc600gccgacctcg aaatcaagca ggtcagcttc gacaagctct ccgagcacgc ctatgcctac660acggccgaag gcgaccccaa caccggcatc atcattggcg acgacgcggt gatggtgatc720gacacccagg ccacgcccgt catggcccag gacgtgatcc gccgcatccg tgaggtcacg780gacaagccca tcaagtacgt gacgctgtcg cactaccacg cggtgcgcgt gctgggcgcc840tcggccttct tcgcggaagg cgccgaacac atcattgcca gccaggacac ctacgacctc900atcgtggagc gcggcgagca ggacaaggcc agcgagatcg gccgctttcc ccgcctgttc960cagaacgtgg aaagcgtgcc cgatggcatg acctggccca ccctcacctt caccggcaag1020atgacgctgt ggctgggcaa gctggaagtg cagatcctgc agctgggccg cggccacacc1080aagggcgaca ccgtggtctg gctgccccag gacaaggtgc tgttcagcgg cgacctggtg1140gagttcggcg ccacgcccta tgcgggcgat gcctacttcc aggactggcc gcacacgctg1200gacgccatcg ccgccctgca gcccgaaaag ctcgtgcccg gccggggcgc cgcgctgcag1260acgccggccg aggtgcaggc cggcctggcc ggcacgcgcg acttcatcag cgacctgtgg1320accgaggtca aggccggcgc cgatgcccag caggacctgc gcaaggtcta cgaggccgcc1380ttcgccaagc tgcagcccaa gtacggccag tgggtgatct tcaaccactg catgcccttc1440gatgtgaccc gcgcctatga cgaggcatcg ggccacgccg acccacgcat ctggaccgcc1500gagcgcgacc gccagatgtg gctggcgctc gaaggctgat gcaagcttat cgataccgtc1560gacgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt1620tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat1680taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt1740atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg1800cgcggtgtca tctatgttac tagatcggga attgcggccc cccctcgagc ccacagatgg1860ttagagaggc ttacgcagca ggtctcatca agacgatcta cccgagcaat aatctccagg1920aaatcaaata ccttcccaag aaggttaaag atgcagtcaa aagattcagg actaactgca1980tcaagaacac agagaaagat atatttctca agatcagaag tactattcca gtatggacga2040ttcaaggctt gcttcacaaa ccaaggcaag taatagagat tggagtctct aaaaaggtag2100ttcccactga atcaaaggcc atggagtcaa agattcaaat agaggaccta acagaactcg2160
ccgtaaagac tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa2220tcttcgtcaa catggtggag cacgacacac ttgtctactc caaaaatatc aaagatacag2280tctcagaaga ccaaagggca attgagactt ttcaacaaag ggtaatatcc ggaaacctcc2340tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg2400gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg2460acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc2520caaccacgtc ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg2580cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg2640agagaacacg ggggactcta gaggatcaga ggacgaacaa catgtcccac cccgccatct2700ccctgcaagc gctgcgcggc agcggcgcag acatacagtc catccacatc ccctacgagc2760gccatgccga ccaggacgcc ggtgcggaca cgcccgcccg gcatcccgtc gtcatcgtcg2820gcgccggccc cgtgggcctg tcgctggcca tcgacctggc ccagcgcggc cagcgcgtgg2880tgctgctgga caacgactgc cggctgtcca cgggctcgcg cgccatctgc ttttccaagc2940gcacgctgga gatctgggac cgcctgggcg tgggccagcc catggtggac aagggcgtgt3000cctggaacct gggcaaggtc ttcttcaagg accagccgct gtaccgcttc gacctgctgc3060ccgaggacgg ccacgagcgc ccggccttca tcaacctgca gcagtactac gccgaggcct3120atctggtcga gcgcgcactg cagctgccgc tgatcgacct gcgctggcac agcaaggtca3180cggcactgga gccgcaggcc gagggcgcgc tgctgaccgt ggagacgcct gacggcagct3240accgcatcga tgcgcaatgg gtcctggcct gcgatggctc gcgctcgccg ctgcgcggcc3300tgctgggcca ggaaagccat ggccgcatct tccgcgaccg cttcctgatc gccgacgtga3360agatgcacgc cgaattcccc accgagcgct ggttctggtt cgacccgccc ttccacccgg3420gccagagcgt gctgctgcac cgccagcccg acgatgtctg gcgcatcgac ttccagctgg3480gctgggacgc ggaccccgag gaagagaaaa agcccgagaa catcgtgccg cgcatccgcg3540ccctgctggg caaggacgcg cccttcgagc tggaatgggc cagcgtctac accttcgcct3600gcctgcgcat ggaccgcttc gtccatggcc gcgtggtctt tgcgggcgac agcgcccacg3660gcgtctcgcc gtttggcgca cgcggcgcca acagcggcgt gcaggatgcc gagaacctgg3720catggaagct ggaccgcgtg ctgcgcggcc aggccgatgc ctcgctgatc gccacctacg3780gcgccgagcg cgaatacgcg gccgacgaga acatccgcaa ctccacgcgc gccaccgact3840tcatcacgcc caagagcgag atcagccgcc tgtttcgcga cgccgtgctg gacctggcgc3900gcgaccatga attcgcgcgc cgcatcgtca acagcgggcg gctgtccgtg ccggccacgc3960tgcacggctc cgcgctcaac acgcctgaca ccgacacctt cgacggaacg cagctgcccg4020gcgccgtgct ggccgatgcg cccatgcgcc ggcccggcgc agacggcacg gcctggctgc4080tgcgcgcact gggaccggac ttcacgctgc tgcacttcga ccccacgccc gcctgggcgc4140aggcgctgcc cggcgtgctc aacctgtcca tcgcggccga gggcgaggcc catgcgccag4200
acgccgacct catcgatgcg cgcggcctgg cggccaaacg cctggatgca cgccccggca4260ccagctacct gctgcggcct gaccagcatg tctgcgcgcg ctggcgccgc cccgacgaag4320ccagcgtgcg cgccgcgctg caaagagcct gcggcgccgc cgccacggcc tgaacctctt4380aagcttatcg ataccgtcga cgaatttccc cgatcgttca aacatttggc aataaagttt4440cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta4500cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat4560gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa4620ctaggataaa ttatcgcgcg cggtgtcatc tatgttccta ggtcgaggag aaatatgagt4680cgaggcatgg atacactaag ttcccctgaa gtgagcatga tctttgatgc tgagatgatt4740cccagagcaa gatagtttgt gctgcaagtg acacaattgt aatgaaacca ccactcaacg4800aatttacttg tggctttgac atgtcgtgtg ctctgtttgt atttgtgagt gccggttggt4860aattattttt gttaatgtga ttttaaaacc tcttatgtaa atagttactt tatctattga4920agtgtgttct tgtggtctat agtttctcaa agggaaatta aaatgttgac atcccattta4980caattgataa cttggtatac acaaactttg taaatttggt gatatttatg gtcgaaagaa5040ggcaataccc attgtatgtt ccaatatcaa tatcaatacg ataacttgat aatactaaca5100tatgattgtc attgtttttc cagtatcaat atacattaag ctactacaaa attagtataa5160atcactatat tataaatctt tttcggttgt aacttgtaat tcgtgggttt ttaaaataaa5220agcatgtgaa aattttcaaa taatgtgatg gcgcaatttt attttccgag ttccaaaata5280ttgccgcttc attaccctaa tttgtggcgc cacatgtaaa acaaaagacg attcttagtg5340gctatcactg ccatcacgcg gatcactaat atgaaccgtc gattaaaaca gatcgacggt5400ttatacatca ttttattgta cacacggatc gatatctcag ccgttagatt taatatgcga5460tctgattgct caaaaaatag actctccgtc tttgcctata aaaacaattt cacatctttc5520tcacccaaat ctactcttaa ccgttcttct tcttctacag acatcaattt ctctcgactc5580tagaggatcc aagcttatcg atttcgaacc cctcatgact tcacttacag tgtccggccg5640ggtggcgcag gtcctcagca gctatgtcag cgatgtgttc ggtgtgatgg gcaacggaaa5700cgtctacttc ctggacgccg ccgagaagga gggcctccgc ttcacggccg tacgccatga5760aggtgccgcc atcgcggcgg cggacgccta ctatcgggca tccgggcgcc tggcggcggg5820gaccaccacc tacggccccg gttacaccaa cgccctgacg gccctcgccg aggcggtcca5880ggcgcagatc cccgtggtgc tcgtcaccgg ggacgccccg agcagcggcg cccggccttg5940ggacgtggac caggccgcga tcgccgccgg gctgggggcg gcgaccttca cggtcacccg6000tgaagccgca ggctccatca cgcaggaagc ggtggagtac gcacttgccc ggcggaccgc6060cgtcgtgatc gccgttccat acgacctgtc ggcccttgag gcggcggagg aagatcttcc6120cgtgccgccg gcggcctcgg ttccggacgc catcggcggc ggactcggac gggcggccga6180agtgcgggcg gccgaattgc tggcgggcgc gaagcggccg ctcatccttg ccggccgcgg6240
tgcgcacctc gcaggaaccg gccccgaact ccgggaactc gccgaccgcc tcggcgcgct6300cacggccggc accgcactgg cgctgaacct gctgcagggc gaggggtacc tcggcgtcgc6360gggcggcttc ggcacggata ccgccgccgg gctcatgggc gaggcggacg tggtgctcgt6420ggcgggagcc agcctgaccc ccttcaccat gcgcttcggc cacctgatcg gcccggacgc6480caccgtgatc cagatcgaca ccgccatgga gccgacggac ccgcgggtgg acctgtttgt6540cagtgcggac gcgaaggccg ctgccggccg gatcctccgg ctgctggatg acgccgccgg6600ggccaatgcg tcgaaggcct ggcgcgcgga agcactcaag cgtctggccg aaggaccctg6660ccaccacccc ggcaccgcag agaccacgga cggccgcctt gacccccggg cgcttgcttc6720ggcactggat gccgtcctgc cggaacgccg caccgtggtc caggacggcg ggcacttcct6780gggctgggca cccatgtact ggcgcatccc ccgtcctcag gacctggtca tggtggggac6840cgcgtaccag tcgatcgggc ttggcctggc cagcgccgtg ggggcgtccc gggccgtgga6900cgacggcaat atcctggtgc tggcggcggg cgacggcgga ttcctgatgg gcctgtccga6960cctggaatcg ctcgtgggcg cggcgagcag cgccgtcgtg gtgatctaca acgacgccgc7020ctacggggcc gagatccatc agtacggctc acgggggctc accgaaaagc ccatgctgat7080ccccgaagtg gacttcagcg ggattgcccg cgcgatcggg gcggaatccg caatcatccg7140caagctgtcg gacctctccg cgctcacgga ctggatcgag gccggcgcca ggggaacctt7200cgtggccgac tgccgcatca cctcaagcgt ccgggccccg tggctgagcg aatggatgag7260ggcctcgcaa gcggcgaagg aggcggtggc gggctagggc cggcctcgtc gaaatgccgc7320cctccaaccc aactcagtac cagctcaggg cgttctcagg gctgggaacg ccctgagctg7380ctactcattt gttcgaactc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc7440agcccggggg atccactagg ggatcccccg atccgcgttt gtgttttctg ggtttctcac7500ttaagcgtct gcgttttact tttgtattgg gtttggcgtt tagtagtttg cggtagcgtt7560cttgttatgt gtaattacgc tttttcttct tgcttcagca gtttcggttg aaatataaat7620cgaatcaagt ttcactttat cagcgttgtt ttaaattttg gcattaaatt ggtgaaaatt7680gcttcaattt tgtatctaaa tagaagagac aacatgaaat tcgacttttg acctcaaatc7740ttcgaacatt tatttcctga tttcacgatg gatgaggata acgaaagggc ggttcctatg7800tccgggaaag ttcccgtaga agacaatgag caaagctact gaaacgcgga cacgacgtcg7860cattggtacg gatatgagtt aaaccgactc aattccttta ttaagacata aaccgatttt7920ggttaaagtg taacagtgag ctgatataaa accgaaacaa accggtacaa gtttgattga7980gcaacttgat gacaaacttc agaattttgg ttattgaatg aaaatcatag tctaatcgta8040aaaaatgtac agaagaaaag ctagagcaga acaaagattc tatattctgg ttccaattta8100tcatcgcttt aacgtccctc agatttgatc gggctgcagg aattcggcct gactgatcat8160ttaaacacta ggtcgggaat tgcggcc818权利要求
1.一种使植物对一种除草剂耐受的方法,其特征在于,在所述植物中表达至少一种酶,该酶能够绕过所述除草剂抑制的旁路代谢途径。
2.如权利要求1所述的方法,其特征在于,所述除草剂是HPPD抑制剂。
3.如权利要求2所述的方法,其特征在于,在植物中表达HPP氧化酶和/或HPAH和/或HPAC。
4.一种多肽,其特征在于,该多肽具有HPP氧化酶的活性。
5.如权利要求4所述的多肽,其特征在于,所述多肽对HPPD抑制剂不敏感。
6.如权利要求4或5所述的多肽,其特征在于,所述多肽含有SEQ ID No.2的氨基酸序列,其片段以及与之同源的序列。
7.如权利要求6所述的多肽,其特征在于,所述多肽含有选自SEQ ID No.4和SEQ ID No.6的氨基酸序列,其片段以及与之同源的序列。
8.一种多肽,其特征在于,所述多肽具有HPAH的活性。
9.如权利要求8所述的多肽,其特征在于,所述多肽对HPPD抑制剂不敏感。
10.如权利要求8或9所述的多肽,其特征在于,所述多肽含有SEQ ID No.8的氨基酸序列,其片段以及与其同源的序列。
11.一种多肽,其特征在于,所述多肽具有HPAC的活性。
12.如权利要求11所述的多肽,其特征在于,所述多肽对HPPD抑制剂不敏感。
13.如权利要求11或12所述的多肽,其特征在于,所述多肽含有SEQ ID No.10的氨基酸序列,及其片段以及与之同源的序列。
14.如权利要求13所述的多肽,其特征在于,所述多肽含有选自SEQ ID No.12和SEQ ID No.14的氨基酸序列,其片段以及与之同源的序列。
15.一种核酸序列,其特征在于,该核酸编码如权利要求4-14任一所述的肽。
16.一种编码HPP氧化酶的核酸序列,其特征在于,该核酸序列是一种核酸序列,选自SEQ ID No.1、SEQ ID No.3、SEQ ID No.5或SEQ ID No.15的编码序列,与之同源的序列,其片段以及能够与所述SEQ ID No.1、3、5或15选择性杂交的序列。
17.一种编码HPAH的核酸序列,其特征在于,它含有选自编码序列SEQ IDNo.7或SEQ ID No.17的核酸序列、与之同源的序列,其片段以及能够与所述SEQID No.7或17选择性杂交的序列。
18.一种编码HPAC的核酸序列,其特征在于,它含有选自编码序列SEQ ID No.9、SEQ ID No.11、SEQ ID No.13或SEQ ID No.19的核酸序列、与之同源的序列,及其片段以及能够与所述SEQ ID No.9、11、13或19选择性杂交的序列。
19.一种包含编码序列的表达盒,其特征在于,所述编码序列含有如权利要求15-18任一所述的核酸序列。
20.一种克隆和/或表达载体,其特征在于,所述载体含有至少一个如权利要求19所述的表达盒。
21.一种转化的植物细胞,其特征在于,所述植物细胞含有至少一个如权利要求19所述的表达盒。
22.一种转化的植物,其特征在于,所述植物含有至少一个如权利要求19所述的表达盒。
23.权利要求22所述的转化植物的种子,其特征在于,所述种子含有至少一个如权利要求19所述的表达盒。
24.一种转化植物的方法,其特征在于,将至少一个权利要求19所述的表达盒引入植物的基因组。
25.一种用HPPD抑制剂对植物,特别是农作物选择性除草的方法,其特征在于,该除草剂施用于权利要求22所述的转化植物。
26.一种在具有如权利要求23所述的种子或如权利要求22所述的转化植物的田间的一片区域内除草的方法,其特征在于,所述方法包括在所述的田间的区域内施用一个剂量的HPPD-抑制性除草剂,该剂量对所述的杂草是有毒的,而基本上不影响根据本发明的种子或转化的植物。
27.一种培育如权利要求22所述的转化植物的方法,其特征在于,所述方法包括在适合培育所述植物的田间的一片区域内播种如权利要求23所述的种子,在杂草存在的情况下,对所述田间的所述区域施用一个剂量的以HPPD为靶标的除草剂,该剂量对所述的杂草是有毒的,而基本上不影响所述的种子或所述的转化植物,然后当植物达到期望的成熟度收割植物,任选地从收获的植物中分离种子。
28.如权利要求25-27任一所述的方法,其特征在于,所述除草剂在出芽前和/或出芽后施用。
全文摘要
本发明涉及一种制备耐受除草剂的植物的新方法,具体地是HPPD抑制除草剂、编码在所述的植物中能够使用的酶的核酸序列,含有所述核酸序列的表达盒以及含有至少一种所述表达盒的转基因植物。
文档编号A01H5/00GK1636065SQ01818096
公开日2005年7月6日 申请日期2001年10月30日 优先权日2000年10月30日
发明者O·津克, E·佩吉特, A·罗兰, A·萨利安德, G·弗雷西内 申请人:拜尔农科股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1