转基因的高色氨酸植物的制作方法

文档序号：449962阅读：708来源：国知局

专利名称：转基因的高色氨酸植物的制作方法
本申请要求于2002年5月3日提交的，美国临时申请系列号为60/377,727的权利。
许多重要的农作物，包括大豆和玉米的种子不包含营养完全的充足数量的几种氨基酸。这些氨基酸包括但不限于色氨酸、异亮氨酸、缬氨酸、精氨酸、赖氨酸、甲硫氨酸和苏氨酸。因此，这些氨基酸的生物合成途径，和/或进入那些途径的代谢产物的生物合成途径，是用于增加这些植物的氨基酸含量的潜在的操作目标。
邻氨基苯甲酸合酶(AS，EC4.1.3.27)催化植物、真菌和细菌中从芳香氨基酸途径到生物合成色氨酸分出支路的第一反应。
邻氨基苯甲酸合酶(例如玉米邻氨基苯甲酸合酶)的最普遍形式是由2个亚基，α或TrpE亚基和β或TrpG亚基组成的异四聚体酶。2个α-亚基和2个β-亚基装配形成异四聚体的邻氨基苯甲酸合酶。也已经发现″单体″形式的AS包括具有TrpE和TrpG亚基活性的单个多肽链(例如苜蓿中华根瘤菌(Rhizobium meliloti))。当单体的邻氨基苯甲酸合酶只包括一类多肽时，单体邻氨基苯甲酸合酶的酶促活性形式一般是由2个这种单体多肽的同型二聚体组成的。异四聚体和单体的邻氨基苯甲酸合酶都在利用谷氨酰胺和分支酸的反应中催化形成邻氨基苯甲酸。在α-亚基(在此指″α-结构域″)上发现的结构域结合分支酸并除去烯醇丙酮酸侧链，而在β-亚基(在此指″β-结构域″)上发现的结构域将氨基从谷氨酰胺传递到羧酸和烯醇丙酮酸部分间的分支酸苯基环上的位置。
合成色氨酸的下一个反应是将磷酸核糖焦磷酸的磷酸核糖基部分传递到邻氨基苯甲酸上。吲哚环在2个步骤形成，包括将核糖基团异构转化为核酮糖，然后是环化反应以产生吲哚磷酸甘油。该途径中的最后反应由可能包含1个或2个亚基的单个酶催化。该反应实现吲哚甘油醛-3-磷酸的切割和吲哚基团与丝氨酸的缩合(Umbarger，Ann.Rev.Biochem.，47555(1978))。
在较高等的植物和微生物中流入色氨酸途径的代谢产物显然受到色氨酸的邻氨基苯甲酸合酶反馈抑制的调节。色氨酸可阻断需要活化β-结构域和产生相对于α-结构域活性部位的氨通道途径的构像重排。这种色氨酸的反馈抑制被认为降低了经邻氨基苯甲酸合酶的色氨酸的生产。参见Li J.和Last，R.L.，拟南芥(Arabidopsis thaliana)trp5突变株具有抗反馈的邻氨基苯甲酸合酶和升高的可溶解色氨酸The Arabidopsis thaliana trp5 mutant has afeedback-resistant anthranilate synthase and elevated soluble tryptophan(植物生理学Plant Physiol.，11051-59(1996))。
已经鉴定几个氨基酸残基涉及来自鼠伤寒沙门氏菌(Salmonellatyphimurium)的邻氨基苯甲酸合酶复合物的反馈调节。这种信息提供了氨基末端调节位点的证据(生物化学杂志J.Biol.Chem.，2668328-8335(1991))。Niyogi等人已经使用分子的方法进一步表征来自某些植物的邻氨基苯甲酸合酶。参见，Niyogi和Fink，植物细胞Plant Cell，4721(1992)和Niyogi等人，植物细胞Plant Cell，51011(1993)。他们发现拟南芥邻氨基苯甲酸合酶的α-亚基是由2个紧密相关的、分别调节的非等位基因编码的。这些α-亚基基因中的一个，ASA1，是由创伤和细菌性病原体浸润诱导的，暗示其涉及防御反应，而另一个α-亚基基因，ASA2是以组成性的基础水平表达的。两种预测的蛋白质共用与细菌和真菌的邻氨基苯甲酸合酶蛋白质同源的区域，并且在已经被证明描述涉及细菌中色氨酸反馈抑制的位置包含保守的氨基酸残基(Caligiuri等人，生物化学杂志J.Biol.Chem.，2668328(1991))。
色氨酸的氨基酸类似物和色氨酸生物合成途径中的中间体的类似物(例如5-甲基色氨酸、4-甲基色氨酸、5-氟基色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚基乙酸、3-甲基邻氨基苯甲酸)已经显示抑制原核和真核生物的生长。可对植物细胞培养物进行抗这些氨基酸类似物的筛选。例如，已经选择抗5-甲基色氨酸(5-MT)、色氨酸的氨基酸类似物的生长抑制所培养的烟草、胡萝卜、马铃薯、谷物和毛曼陀罗(Datura innoxia)细胞系，其生长抑制是由于表达改变的邻氨基苯甲酸合酶。
Ranch等人，植物生理学Plant Physiol.71136(1983)在双子叶植物杂草，毛曼陀罗的细胞培养物中选择5-MT抗性，并且报道抗性的细胞培养物包含增加的色氨酸水平(比野生型水平高出8-30倍)并具有对色氨酸反馈抑制灵敏度较小的邻氨基苯甲酸合酶。再生的植物也是对5-MT有抗性的，包含改变的邻氨基苯甲酸合酶，并且在叶片中具有比对照植物的叶片更大的游离色氨酸浓度(4-44倍)。与在烟草(N.tabacum)中的研究相比，改变的酶不在从抗性细胞系再生的植物中表达，这些结果表明氨基酸过量产生的表型可在细胞水平选择并且在从毛曼陀罗中所选择的细胞再生的完整植株中表达。
Hibberd等人(美国专利号4,581,847)描述了5-MT抗性的玉米细胞系包含比野生型的邻氨基苯甲酸合酶对反馈抑制较少敏感的邻氨基苯甲酸合酶。一种5-MT抗性细胞系比非转化的细胞系积聚大于几乎二十倍水平的游离色氨酸。
P.C.Anderson等人(美国专利号6,118,047)公开了利用来自C28玉米的邻氨基苯甲酸合酶的色氨酸不敏感的α-结构域在转基因中制备显示种子中游离色氨酸水平升高的转基因玉米植株(玉米(Zea mays))。
虽然有可能在某些细胞培养物和植物中选择5-MT抗性，这些特性不一定与完整植株中过量生产的游离色氨酸相关。另外，再生自5-MT抗性系的植物经常不表达酶的改变形式。也不能预测该特性将在一段时间内稳定并且将会作为可遗传的性状延续下去。还已经从高等植物的细胞培养物的粗提物中部分地纯化邻氨基苯甲酸合酶(Hankins等人，植物生理学Plant Physiol.，57101(1976)；Widholm，Biochim.Biophys.Acta，320217(1973))。然而，发现它是很不稳定的。因此，必须提供具有可增加植物色氨酸含量的邻氨基苯甲酸合酶源的植物。
发明概述本发明提供编码可用于产生转基因植物的邻氨基苯甲酸合酶(AS)的核酸。当这种邻氨基苯甲酸合酶在转基因植物中表达时，可在植物细胞内获得升高水平的色氨酸。在一个实施方案中，本发明涉及编码单体邻氨基苯甲酸合酶的DNA分子，其中这种单体的邻氨基苯甲酸合酶是天然的或是邻氨基苯甲酸合酶的α-和β-结构域的遗传工程嵌合融合体。来自几个种属(例如，一些细菌及其他微生物)的邻氨基苯甲酸合酶基因，天然地产生组成单个多肽链的单体邻氨基苯甲酸合酶。然而，大多种属具有由在分开亚基上发现的2个α和2个β结构域组成的异四聚体邻氨基苯甲酸合酶。本发明也预期形成包括连接任何β-结构域的任何邻氨基苯甲酸合酶α-结构域的嵌合邻氨基苯甲酸合酶的融合蛋白质。
通常，天然存在的单体邻氨基苯甲酸合酶与多数植物的邻氨基苯甲酸合酶序列的同一性是相当低的。然而，根据本发明，尽管与植物内源的邻氨基苯甲酸合酶的序列同一性很低，当在植物中表达时，这种单体邻氨基苯甲酸合酶可提供高水平的色氨酸。因此，本发明提供可具有差异(divergent)的序列而且能够在植物宿主中有效提供高水平的色氨酸的单体邻氨基苯甲酸合酶。例如，包含单体根瘤农杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸合酶的转基因的大豆植株可在种子中产生达到大约10,000-大约12,000ppm的色氨酸，而平均的trp水平范围达到大约7,000-大约8,000ppm。相反，非转基因的大豆植株通常在种子中只具有达到大约100-大约200ppm的色氨酸。
因此，本发明提供编码单体邻氨基苯甲酸合酶的分离的DNA序列，其中单体的邻氨基苯甲酸合酶具有邻氨基苯甲酸α-结构域和邻氨基苯甲酸β-结构域，并且其中单体的邻氨基苯甲酸合酶是在植物中表达的。这种表达可提高植物中L-色氨酸的水平。
单体的邻氨基苯甲酸合酶可以是天然单体的。可从中分离天然单体邻氨基苯甲酸合酶核酸的生物体的实例，包括但不限于例如根瘤农杆菌、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、Mesorhizobium loti(例如，Genbank登记号GI 13472468)、马尔他布鲁氏菌(Brucella melitensis)(例如，Genbank登记号GI 17982357)、念珠藻属(Nostoc sp.)PCC7120(例如，Genbank登记号GI 17227910或GI 17230725)、巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号GI1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI152445)的生物体。在一些实施方案中，分离的DNA编码具有例如，SEQ ID NO4的氨基酸序列或SEQ ID NOs1或75中任何一个核苷酸序列的根瘤农杆菌邻氨基苯甲酸合酶。
可选地，单体的邻氨基苯甲酸合酶可以是任何适用的邻氨基苯甲酸合酶的α和β结构域的融合体。这种α和β结构域可来源于玉米、芸香(Rutagraveolens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌(Serratia marcescens)、大肠杆菌(Escherichia coli)、根瘤农杆菌、拟南芥、苜蓿中华根瘤菌(例如，Genbank登记号GI 95177)、百脉根根瘤菌(Mesorhizobiun loti)(例如，Genbank登记号GI 13472468)、马尔他布鲁氏菌(例如，Genbank登记号GI 17982357)、念珠藻属PCC7120(例如，Genbank登记号GI17227910或GI 17230725)、巴西固氮螺菌(例如，Genbank登记号GI 1174156)和鱼腥藻属(Anabaena)M22983(例如，Genbank登记号GI 152445)、大豆、稻、棉花、小麦、烟草或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。例如，编码α或β结构域的核酸可利用任何SEQ ID NOs1-70，75-113和116-137中的序列信息获得。
在另一个实施方案中，本发明提供编码来自玉米(Zea mays)的邻氨基苯甲酸合酶的α结构域，包括SEQ ID NOs5或66的分离DNA。这种分离的DNA可具有核苷酸序列SEQ ID NOs2，67或68。可将分离的DNA可操作地连接启动子，并且当在植物中表达时可在植物中提供升高水平的L-色氨酸。
在另一实施方案中，本发明提供编码邻氨基苯甲酸合酶的分离的DNA分子，其中DNA分子编码基本上与由SEQ ID NOs66，108-111，133和137所例证说明的邻氨基苯甲酸合酶蛋白质同源的蛋白质。编码邻氨基苯甲酸合酶的分离DNA包括基本上与由SEQ ID NOs67，68，104-107和134-136所例证说明的DNA分子同源的DNA分子。
在另一个实施方案中，本发明提供包括表达盒的DNA构建体，其中该可操作连接的表达盒包括(i)异源启动子；(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子，其中单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽，以及(iii)转录终止子。单体的邻氨基苯甲酸合酶蛋白质可包括与由SEQ ID NOs4，7，43，57，77-82和130-132所例证说明的蛋白质基本上同源的蛋白质。DNA分子可包括与由SEQ ID NOs1，75，76，83和121-129所例证说明的DNA分子基本上同源的DNA分子。
在进一步的实施方案中，本发明提供包括第一表达盒的DNA构建体，其中第一表达盒可操作的连接，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子和(iii)转录终止子。
上述的DNA构建体可进一步包括第二表达盒，包括可操作的连接(i)异源启动子；(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子和(iii)转录终止子。DNA构建体可包括与由SEQ ID NOs5，6，8，44，45，66，99，100，101，102，103，108，109，110，111，117，118，133或137所例证说明的蛋白质基本上同源的α-结构域或β-结构域蛋白质。编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子可包括与由SEQ ID NOs2，3，67，94，95，96，97，98，104，105，106，112，116，119，120，134，135或136所例证说明的DNA分子基本上同源的DNA分子。具体的实例包括其中α-结构域邻氨基苯甲酸合酶蛋白质是SEQ ID NO66和β-结构域蛋白质是SEQ ID NO118的DNA构建体。
分离的DNA也可编码突变的邻氨基苯甲酸合酶或突变的邻氨基苯甲酸合酶结构域。这种突变的邻氨基苯甲酸合酶或其结构域可具有一种或多种突变。本领域的技术人员已知，突变可以是沉默的，可产生具有与野生型类似的酶活性的变异基因产物，或可产生具有改变的酶活性的衍生基因产物。本发明包括所有这类的突变。
可在体外或体内从野生型邻氨基苯甲酸合酶核酸产生突变的分离DNA，并且可编码例如，一种或多种氨基酸的取代、缺失或插入。产生具有增加活性的、更大稳定性的或对色氨酸或色氨酸类似物的反馈抑制较少灵敏性的突变邻氨基苯甲酸合酶的突变的分离DNAs是合乎需要的。在一个实施方案中，邻氨基苯甲酸合酶或其结构域抗内源L-色氨酸或色氨酸类似物的抑制。例如，邻氨基苯甲酸合酶可在色氨酸-结合袋或减少邻氨基苯甲酸合酶灵敏性的其它地方，或其对于色氨酸抑制的结构域具有一种或多种突变。预期用于突变的氨基酸残基是例如在大约48，51，52，293，和298位置的残基。例如，突变可以是
a)在大约48位用Phe替换Val；b)在大约48位用Tyr替换Val；c)在大约51位用Phe替换Ser；d)在大约51位用Cys替换Ser；e)在大约52位用Phe替换Asn；f)在大约293位用Ala替换Pro；g)在大约293位用Gly替换Pro；或h)在大约298位用Trp替换Phe；其中突变的位置由所选择的邻氨基苯甲酸合酶的氨基酸序列与根瘤农杆菌邻氨基苯甲酸合酶氨基酸序列的序列对比决定。具有这种突变的邻氨基苯甲酸合酶的实例包括具有SEQ ID NOs58-65，69，70和84-94的邻氨基苯甲酸合酶。
分离的DNA可编码其他元件和功能。本领域的技术人员所预期的任何元件或功能都可包括在内。例如，分离的DNA也可包括在植物细胞中有功能的启动子，其可操作地连接到编码邻氨基苯甲酸合酶的DNA上。分离的DNA可进一步编码质体运输肽。分离的DNA也可编码选择性的标记或报道基因。这种选择性的标记可赋予所述植物细胞除草剂抗性、高蛋白含量、高含油量、高赖氨酸含量、高异亮氨酸含量、高生育酚含量等。DNA序列也可包括编码一种或多种来源于苏云金杆菌(Bacillus thuringiensis)的杀虫剂蛋白质的序列。
本发明进一步提供包括本发明的分离DNA的载体。这种载体可用于在原核和真核细胞中表达邻氨基苯甲酸合酶多肽，用于转化植物细胞并产生转基因植物。
本发明也提供包括本发明的分离DNA的转基因植物。这些分离DNAs在转基因植物中的表达可导致转基因植物，例如植物的种子或其他部分中的L-色氨酸，优选游离的L-色氨酸水平的升高。该水平增至高于不同于转基因大豆植物的，缺乏该DNA的，例如相应的未转化细胞或具有相同遗传背景的未转化植株的植物细胞中L-色氨酸的水平。DNA优选是可遗传的，其优选通过可繁殖植物的完全正常的生殖周期传递给其后代以及进一步传给下一代。
可具有这种分离的DNA的转基因植物包括双子叶植物(双子叶)，例如大豆或Canola。可选地，转基因植物可以是单子叶植物(单子叶)，例如玉米、稻、小麦、大麦或高粱。
本发明也提供包含任何本发明的分离DNAs、邻氨基苯甲酸合酶多肽、转基因或载体的任何转基因植物的种子。
本发明进一步提供包含具有本发明的分离DNA或DNA构建体的植物的至少一部分的动物饲料或人的食品。可被归入动物饲料或人食品的植物的部分包括例如，种子、叶片、茎、根、块茎或果实。所需要的植物部分具有由本发明的分离DNA编码的邻氨基苯甲酸合酶表达所提供的增加的色氨酸水平。
本发明进一步提供通过将本发明的分离DNA导入植物的可再生细胞用于改变、优选增加植物(双子叶植物或单子叶植物)中色氨酸含量的方法。优选地，DNA序列可操作地连接至少一种在植物细胞中可操作的启动子。鉴定或选择转化的细胞，然后再生以产生包括可表达功能性的邻氨基苯甲酸合酶多肽的植物。在一些实施方案中，编码邻氨基苯甲酸合酶或其结构域的DNA是突变的DNA。导入的DNA优选是可遗传的并且该植物优选是可繁殖的植物。例如，导入的DNA优选可通过完全的性周期传递给子代植株，并且可赋予子代的后代高色氨酸的表型。
编码邻氨基苯甲酸合酶的DNAs，优选整合到也可包括编码运输肽、例如质体运输肽的DNA序列和选择性标记或报道基因的，可操作地连接一种或多种在靶植物细胞中有功能的启动子的载体或″转化基因″中。启动子可以是例如，可诱导的启动子、组织特异的启动子、强启动子或弱启动子。其他的转录本或翻译调控元件，例如增强子或终止子，也可功能性地连接编码邻氨基苯甲酸合酶的DNA片段。
悬浮培养物中的细胞或胚胎、完整的组织或器官可通过多种转化技术转化，例如通过微粒子轰击、电穿孔和根瘤农杆菌介导的转化，及其他本领域适用的方法。
因此，转化植物的细胞，包括天然的邻氨基苯甲酸合酶基因和转化基因或其他编码外源邻氨基苯甲酸合酶的DNA片段。植物细胞中外源邻氨基苯甲酸合酶的表达可导致色氨酸及其次级代谢产物的水平增加。在一些实施方案中，这种表达赋予对一定数量的内源L-色氨酸类似物的耐受性，例如比具有野生型或色氨酸敏感的邻氨基苯甲酸合酶的植物细胞存在至少大约10％多的邻氨基苯甲酸合酶活性。
本发明也提供用于改变植物中色氨酸含量的方法，包括(a)将包括可操作地连接到在植物细胞中有功能的启动子上、编码邻氨基苯甲酸合酶结构域和质体运输肽的分离DNA的转化基因导入植物的可再生细胞；以及(b)从所述的转化植物细胞再生转化植株，其中植物的细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于同样遗传背景的未转化植物中的色氨酸含量，该合酶表达的数量有效增加了所述植物中的色氨酸含量。结构域可以是邻氨基苯甲酸合酶α-结构域。邻氨基苯甲酸合酶结构域可具有一种或多种突变，例如，减少结构域对色氨酸抑制的灵敏性的突变。这种突变可以是例如在色氨酸结合袋(pocket)中。这种结构域可以是，例如，来自根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻(Euglena gracilis)、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、大豆、稻、棉花或玉米的邻氨基苯甲酸合酶结构域。芸香具有它自己的叶绿体转运序列，其可与邻氨基苯甲酸合酶转基因一起使用。因此，当利用芸香DNA时，本领域的技术人员不必增加质体转运序列。
本发明也提供包括编码单体邻氨基苯甲酸合酶或其结构域的DNA的，新的分离和纯化的DNA分子。当在植物内表达时，这种邻氨基苯甲酸合酶DNA可提供高水平的色氨酸。在一些实施方案中，邻氨基苯甲酸合酶基本上抗游离的L-色氨酸或其类似物的抑制。本发明包括的新的DNA序列的实例包括但不限于，从根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌；大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞(Rhodopseudomonas palustris)、深红红螺菌(Rhodospirillum rubrum)、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(Sorghum bicolor)、硫磺矿硫化叶菌、Thermobifida fusca或玉米(Zea mays王蜀黍)或其他邻氨基苯甲酸合酶分离的DNA分子。
这些DNA序列包括具有在单个多肽链上连接至少另一个邻氨基苯甲酸合酶结构域的邻氨基苯甲酸合酶α-结构域的，合成的或天然存在的单体形式的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶可以例如，是邻氨基苯甲酸合酶α或β结构域的融合体。这种邻氨基苯甲酸合酶α或β结构域可来源于根瘤农杆菌、鱼腥藻M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、百脉根根瘤菌、念珠藻属PCC7120、苜蓿中华根瘤菌、芸香、血色红假单胞菌、深红红螺菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、高粱(sorghum bicolor)、硫磺矿硫化叶菌、Thermobifidafusca、高粱属(sorghum)、大豆、稻、棉花、小麦、烟草或玉米(王蜀黍)，或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因。这种邻氨基苯甲酸合酶及其结构域在此也由分离自根瘤农杆菌，(SEQ ID NOs175或84-94)、玉米，(SEQ ID NOs2，67，68，96，116或136)、芸香(SEQ ID NO3)、鱼腥藻M22983、拟南芥(SEQ ID NO45)、巴西固氮螺菌(SEQ ID NO122)、马尔他布鲁氏菌(SEQ ID NO123)、百脉根根瘤菌(SEQ ID NO121)、念珠藻属PCC7120(SEQ ID NOs124或125)、苜蓿中华根瘤菌、血色红假单胞菌(SEQID NO126)、硫磺矿硫化叶菌、稻(SEQ ID NOs94，95，119或120)、小麦(SEQID NO97)、烟草(SEQ ID NO98)、陆地棉(Gossypium hirsutum)(SEQ ID NOs104或105)、大豆(Glycine max)(SEQ ID NOs106，107，112或113)、大豆慢生根瘤菌(SEQ ID NO127)、深红红螺菌(SEQ ID NO128)、Thermobifidafusca(SEQ ID NO129)或高粱(SEQ ID NOs134或135)的邻氨基苯甲酸合酶的核酸例证说明。这些核苷酸序列从根瘤农杆菌(SEQ ID NOs4，58-65，69或70)；玉米(SEQ ID NOs5，66，101，118或137)和芸香(SEQ ID NO6)，鱼腥藻M22983、巴西固氮螺菌(SEQ ID NO78)、马尔他布鲁氏菌(SEQ ID NO79)、百脉根根瘤菌(SEQ ID NO77)、念珠藻属PCC7120(SEQ ID NOs80或81)、苜蓿中华根瘤菌(SEQ ID NOs7或43)、血色红假单胞菌(SEQ ID NOs57或82)、硫磺矿硫化叶菌(SEQ ID NOs8或44)、稻(SEQ ID NOs99，100或117)、小麦(SEQ ID NO102)、烟草(SEQ ID NO103)、陆地棉(SEQ ID NOs108或109)、大豆(SEQ ID NOs110或111)、大豆慢生根瘤菌(SEQ ID NO130)、深红红螺菌(SEQ ID NO131)、Thermobifida fusca(SEQ ID NO132)或高粱(SEQ IDNO133)编码邻氨基苯甲酸合酶或其α-结构域或β结构域。
本发明也提供包括编码具有酶活性的根瘤农杆菌邻氨基苯甲酸合酶或其结构域的DNA序列的分离DNA分子。这种DNA分子可编码具有SEQ IDNOs4，58-65，69或70的邻氨基苯甲酸合酶，具有邻氨基苯甲酸合酶活性的结构域或其变体。DNA分子也可具有包括SEQ ID NOs1，75或84-93，或其结构域或变体的序列。在此所提供的任何DNA的编码区也可被优化，用于在所选择的生物体，例如所选择的植物或微生物中表达。具有用于所选择植物的优化密码子的DNA分子的实例是具有SEQ ID NO75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。
本发明也提供包括编码玉米邻氨基苯甲酸合酶结构域的DNA序列的分离和纯化的DNA分子。这种DNA分子可编码具有SEQ ID NOs5或66的邻氨基苯甲酸合酶结构域，或具有邻氨基苯甲酸合酶活性的其变体或衍生物。DNA分子也可具有包括SEQ ID NOs2，67，或68的序列，或其结构域或变体。
本发明进一步提供与包括SEQ ID NOs1，75或84-94中的任何一个的互补DNA分子在严谨条件下杂交的，至少8个核苷酸的分离的DNA分子。这种DNA分子可以是探针或引物、例如具有SEQ ID NOs9-42，47-56或138-143中任何一个的核酸。可选地，DNA可包括所选择的邻氨基苯甲酸合酶或其结构域的全部编码区。这种DNA也可包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体运输肽的DNA序列。本发明进一步涉及用于在植物和/或微生物中转化和表达这类DNA分子的载体。
与在此所明确描述的DNA序列和氨基酸序列显示50％、优选60％、更优选70％、更优选80％、最优选90％，例如95％-99％的序列同一性的，功能性的邻氨基苯甲酸合酶DNA序列和功能性的邻氨基苯甲酸合酶多肽也在本发明的范畴内。例如85％同一性，指当2个序列对比进行最大匹配时，85％的氨基酸是相同的。在最大化匹配中容许缺口(gap)(在任何一个待匹配的2个序列中)；5个或较少的间隙(gap)长度是优选的，而2个或更少是更优选的。
可选地和优选地，如在此所使用的术语，如果当利用具有突变数据矩阵以及6分或更大的缺口罚分的ALIGN程序时，它们具有大于5的序列对比积分(alignmentscore)(在标准偏差单位中)，则这2种多肽序列是同源的。参见Dayhoff，M.O.，″蛋白质序列和结构的图谱Atlas of Protein Sequence andStructure″，1972，第5卷，国家生物医学研究基金会，pp.101-110，以及该卷的增刊2，pp.1-10。更优选地当利用ALIGN程序进行优化序列对比时，如果它们的氨基酸大于或等于50％相同，则2个序列或其部分是同源的。本发明进一步提供用于产生具有高种子水平的色氨酸的转基因植物的载体，包括编码单体邻氨基苯甲酸合酶的分离DNA序列，其中包含连接有邻氨基苯甲酸合酶β-结构域和质体运输肽，并可操作地连接在植物细胞中有功能的启动子的邻氨基苯甲酸合酶α-结构域。这种单体的邻氨基苯甲酸合酶可例如是，根瘤农杆菌，苜蓿中华根瘤菌、百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌，深红红螺菌或Thermobifida fusca的邻氨基苯甲酸合酶。单体的邻氨基苯甲酸合酶也可来源于根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌、百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆慢生根瘤菌，深红红螺菌，Thermobifida fusca，高粱，大豆，稻，棉花，小麦，烟草，玉米或编码邻氨基苯甲酸合酶的亚基或结构域的任何基因的邻氨基苯甲酸合酶α-和β-结构域的融合体。
提供增加水平的色氨酸的，分离和纯化的邻氨基苯甲酸合酶DNA的转化可在分子水平评估，例如，Southern或Northern印迹分析，基于PCR的方法学，邻氨基苯甲酸合酶的生物化学或免疫学检测，或通过表型分析，即，转化后代的细胞是否可在存在抑制未转化植物细胞生长的大量色氨酸的氨基酸类似物时生长。
本发明也提供在原核或真核宿主细胞，例如酵母、昆虫细胞或细菌中生产邻氨基苯甲酸合酶的方法，其可以是培养物，优选是商业规模的。该方法包括将包含编码邻氨基苯甲酸合酶或其结构域，例如单体邻氨基苯甲酸合酶，至少包括α和β邻氨基苯甲酸合酶的结构域，或其功能性变体的DNA片段的转化基因导入宿主细胞，并在宿主细胞中表达邻氨基苯甲酸合酶，以产生功能性的邻氨基苯甲酸合酶或其结构域的步骤。转化基因通常包括转录本和翻译调控元件，例如在真核或原核起源的宿主细胞中有功能的启动子。优选地，转基因被导入已知可用于生产重组蛋白质的，例如大肠杆菌的原核细胞，或例如酵母或昆虫细胞的真核细胞。培养转化细胞可导致增加色氨酸及其衍生物的生产，可从细胞或培养基中回收该产物。色氨酸的累积也可导致在微生物和植物中增加次级代谢产物的生产，例如包含吲哚的代谢产物，例如植物中的单个的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷(glucosinalates)。
对色氨酸不敏感的邻氨基苯甲酸合酶具有增加多种分支酸衍生代谢产物的潜能，包括来自由于色氨酸通过分支酸变位酶刺激苯基丙氨酸所合成的苯基丙氨酸。参见Siehl，D.来自植物氨基酸的分支酸的色氨酸、酪氨酸和苯丙氨酸的生物合成生物化学和生物工艺学，(The biosynthesis of tryptophan，tyrosine and phenylalanine from chorismate in Plant Amino AcidsBiochemistryand Biotechnology)，ed.BK Singh，第171-204页。当反馈不敏感的邻氨基苯甲酸合酶存在时，可能增加的其他分支酸衍生的代谢产物包括，苯丙酮(phenylpropanoid)、类黄酮和异类黄酮，以及来源于邻氨基苯甲酸的代谢产物，例如吲哚、吲哚生物碱和吲哚异硫氰酸盐。许多化合物是重要的植物激素、植物防御化合物、各种健康状况的化学保护剂(chemopreventive agents)、和/或药物学活性的化合物。这些化合物的合成可能由于邻氨基苯甲酸合酶的表达而增加，其范围取决于表达邻氨基苯甲酸合酶的生物体。本发明涉及在多种原核和真核细胞或生物体，包括植物细胞、微生物、真菌、酵母、细菌、昆虫细胞和哺乳动物细胞中的色氨酸及其他有用化合物的合成。
因此，本发明提供用于生产色氨酸的方法，包括在足够表达由该分离DNA编码的单体邻氨基苯甲酸合酶的条件下，培养包括分离的DNA的原核或真核的宿主细胞，其中单体的邻氨基苯甲酸合酶包括邻氨基苯甲酸合酶α结构域和邻氨基苯甲酸合酶β结构域，并且其中足够表达单体的邻氨基苯甲酸合酶的条件包括，宿主细胞足以利用单体的邻氨基苯甲酸合酶合成色氨酸的养分和前体。
可在多种宿主细胞和/或生物体中表达产生的有用化合物的实例包括，吲哚乙酸及其他生长素；对心血管健康重要的、存在于大豆中的异类黄酮化合物；在玉米中对食草昆虫的天敌起信号作用的挥发性的吲哚化合物；抗癌剂，例如在十字花科植物家族中发现的吲哚芥子油苷(吲哚-3-甲醇)；以及吲哚生物碱，例如由某些种属的真菌生产的麦角化合物。(Barnes等人，Adv Exp MedBiol.，40187(1996)；Frey等人，Proc Natl Acad.Sci.，9714801(2000)；Muller等人，生物化学Biol.Chem.，381679(2000)；Mantegani等人，Farmaco，54288(1999)；Zeligs，医药食品杂志J Med Food，167(1998)；Mash等人，AnnNY Acad Sci.，844274(1998)；Melanson等人，Proc Natl Acad.Sci.，9413345(1997)；Broadbent等人，Curr Med Chem.，5469(1998))。
本发明也提供在中度以及优选高严谨条件下，与编码邻氨基苯甲酸合酶的DNA分子的互补序列杂交的、至少7个核苷酸碱基的分离和纯化的DNA分子。这种分离和纯化的DNA分子包括编码邻氨基苯甲酸合酶或其结构域或突变体的新的DNA片段。突变的DNA可编码基本上抗游离L-色氨酸或色氨酸的氨基酸类似物抑制的邻氨基苯甲酸合酶。这种邻氨基苯甲酸合酶DNA分子可与例如，根瘤农杆菌、血色红假单胞菌或芸香的邻氨基苯甲酸合酶，或其α-结构域，包括其功能性的突变体杂交。当这些DNA分子编码功能性的邻氨基苯甲酸合酶或邻氨基苯甲酸合酶结构域时，它们定义为编码邻氨基苯甲酸合酶、邻氨基苯甲酸合酶结构域或其突变体的主要DNA分子的″变体″。较短的DNA分子或寡聚核苷酸可用作PCR扩增靶DNA序列的引物，或作为合成全长基因的中间产物。
也提供杂交探针，包括至少7个核苷酸碱基的新的分离和纯化的DNA片段，其被可检测地标记或结合可检测的标记物，该DNA片段在中度或优选高严谨条件下，与包括编码邻氨基苯甲酸合酶，例如编码单体的邻氨基苯甲酸合酶或其结构域，例如α-结构域，包括基本上抗色氨酸的氨基酸类似物抑制的、其功能性突变体的DNA片段的DNA分子的非编码链杂交。中度和严谨杂交条件是本领域已知的，参见，例如Sambrook等人，分子克隆实验指南Molecular CloningA Laboratory Manual，第2版(1989)；也参见，Sambrook和Russell，分子克隆实验室指南，第3版(2001年1月15日)的第0.47-9.51节。例如，严谨条件是(1)使用低离子强度和高温进行洗涤，例如，50℃，0.015MNaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，或(2)在杂交期间使用例如甲酰胺的变性剂，例如，在42℃，50％甲酰胺和0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/含750mM NaCl，75mM柠檬酸钠的50mM pH6.5的磷酸钠缓冲液。另一个使用的实例是，在42℃，50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声处理的鲑鱼精DNA(50μg/ml)，0.1％十二烷基磺酸钠SDS)，和10％葡聚糖硫酸酯，并在42℃，0.2×SSC和0.1％SDS中洗涤。
附图简述

图1是质粒pMON61600的限制性图谱。
图2表明根瘤农杆菌邻氨基苯甲酸合酶DNA序列(上面的序列)(SEQ IDNO4)的翻译序列和苜蓿中华根瘤菌的邻氨基苯甲酸合酶DNA序列(下面的序列)(SEQ ID NO7)的翻译序列。
图3是质粒pMON34692的限制性图谱。
图4是质粒pMON34697的限制性图谱。
图5是质粒pMON34705的限制性图谱。
图6A-B表明比较根瘤农杆菌α-结构域序列(SEQ ID NO4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO8)的邻氨基苯甲酸合酶氨基酸序列的序列对比。
图7A-B表明用于突变SEQ ID NO1的34个引物的序列(SEQ ID NOs9-42)。突变密码子是加下划线的，而变化的碱基是小写字体的。
图8表明质粒pMON13773的限制性图谱。
图9表明质粒pMON58044的限制性图谱。
图10表明质粒pMON53084的限制性图谱。
图11表明质粒pMON58045的限制性图谱。
图12表明质粒pMON58046的限制性图谱。
图13表明质粒pMON38207的限制性图谱。
图14表明质粒pMON58030的限制性图谱。
图15表明质粒pMON58006的限制性图谱。
图16表明质粒pMON58041的限制性图谱。
图17表明质粒pMON58028的限制性图谱。
图18表明质粒pMON58042的限制性图谱。
图19表明质粒pMON58029的限制性图谱。
图20表明质粒pMON58043的限制性图谱。
图21A-D表明具有SEQ ID NOs4和43(分别来源于根瘤农杆菌和苜蓿中华根瘤菌)的单体″TrpEG″邻氨基苯甲酸合酶，与来自硫磺矿硫化叶菌(SEQID NO44)和拟南芥(SEQ ID NO45)的异四聚体邻氨基苯甲酸合酶的TrpE(α)和TrpG(β)结构域的多重序列对比。接头区域是加下划线的。
图22是质粒pMON52214的限制性图谱。
图23是质粒pMON53901的限制性图谱。
图24是质粒pMON39324的限制性图谱。
图25是质粒pMON39322的限制性图谱。
图26是质粒pMON39325的限制性图谱。
图27是表明用pMON39325转化的大豆种子中游离的色氨酸水平的图表。存在5个来自各事件的观察结果。NT表示非转基因的大豆种子。
图28是质粒pMON25997的限制性图谱。
图29是质粒pMON62000的限制性图谱。
图30表明大肠杆菌EMG2(K-12 wt F+)的截短的trpE基因序列(SEQ IDNO46)。该trpE核酸的最初30bp和最后的150bp通过EcoRI限制酶切位点连接。该trpG基因的开始部分紧随trpE的终止密码子。
图31图解表明大肠杆菌trpE基因中框内缺失的构建体。
图32A-C表明分离自根瘤农杆菌的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO1)和氨基酸(SEQ ID NO4)序列。
图33A-C表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的DNA(SEQ ID NO2)序列。图33D表明分离自玉米的邻氨基苯甲酸合酶基因的α-结构域的氨基酸(SEQ ID NO5)序列。
图34是质粒pMON58120的限制性图谱。
图35A-E提供来自根瘤农杆菌(AgrTu_15889565)(SEQ ID NO4)、苜蓿中华根瘤菌(RhiMe_136328)(SEQ ID NO7)、百脉根根瘤菌(MesLo_13472468)(SEQ ID NO77)、巴西固氮螺菌(AzoBr-1717765)(SEQ IDNO78)、马尔他布鲁氏菌(BruMe_17986732)(SEQ ID NO79)、念珠藻属(Nostoc_17227910)(SEQ ID NO80)、念珠藻属(Nostoc_17230725)(SEQ IDNO81)和血色红假单胞菌(RhoPa_TrpEG)(SEQ ID NO82)的邻氨基苯甲酸合酶氨基酸序列的序列比较。
图36A-B提供用于根瘤农杆菌邻氨基苯甲酸合酶的优化核苷酸序列(SEQ ID NO75)。
图37A-C提供野生型(上面的链)和优化的(下面的链)根瘤农杆菌邻氨基苯甲酸合酶核苷酸序列(SEQ ID NOs1和75)的序列对比。这2个序列由中间的链证明是94％相同的。
图38是质粒pMON66877的限制性图谱。
图39是质粒pMON66878的限制性图谱。
图40是质粒pMON66879的限制性图谱。
图41是质粒pMON66595的限制性图谱。
图42是质粒pMON66599的限制性图谱。
图43是质粒pMON66598的限制性图谱。
图44是质粒pMON66596的限制性图谱。
图45是质粒pMON79951的限制性图谱。
图46是质粒pMON79955的限制性图谱。
图47是质粒pMON79956的限制性图谱。
图48是质粒pMON36524的限制性图谱。
图49是质粒pMON30167的限制性图谱。
发明详述本发明提供分离的DNAs，载体，宿主细胞和含有编码能够在植物中表达高水平的色氨酸的邻氨基苯甲酸合酶的分离核酸的转基因植物。在一个实施方案中，分离的核酸编码单体邻氨基苯甲酸合酶(AS)。在另一个实施方案中，分离的核酸编码邻氨基苯甲酸合酶，或其结构域，其基本上抗游离的L-色氨酸或色氨酸的氨基酸类似物的抑制。邻氨基苯甲酸合酶或其结构域的表达，可以提高色氨酸例如种子中游离色氨酸的水平，而超过在缺乏这种表达的植物中的水平。
提供生产含有增强的邻氨基苯甲酸合酶活性的相关核酸的转基因植物的方法，和生产培养细胞，植物组织，植物，植物部分和产生高水平色氨酸的种子。这种转基因植物将产生高水平色氨酸的能力优先地性传递给其后代。也描述了产生编码突变邻氨基苯甲酸合酶的分离DNAs，和细胞培养物的筛选技术以挑选出过量表达色氨酸和/或对色氨酸类似物有抗性作用的新表型。例如，产生能够生产高水平色氨酸的大豆品系，制备和表征含有至少一种本发明的分离核酸的转基因大豆细胞，然后在植物中再生。其中一些分离的DNAs对色氨酸类似物的生长抑制有抗性作用。本发明也提供用于在双子叶植物，例如其他的豆类，以及例如谷粒的单子叶植物中产生升高的游离色氨酸水平的方法。
定义如在此所用的，转化植物、植物组织、植物部分或植物细胞中的色氨酸的“改变”水平是相应于未转化的植物、植物组织、植物部分或植物细胞增强或减少的水平。
正如在此所用的“α-结构域”是结合分支酸和消除烯醇丙酮酸侧链的酶或酶复合物的一部分。TrpE基因编码这种α-结构域。在一些情况中，α-结构域是只具有结合分支酸和消除分支酸的烯醇丙酮酸侧链功能的单个多肽。在其他情况中，α-结构域是除了结合分支酸和消除分支酸的烯醇丙酮酸侧链外，还可执行其他酶功能的较大多肽的一部分。
术语“β-结构域”是指将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环的位置的酶或酶复合物的一部分。TrpG基因编码这种β-结构域。在一些情况中，β-结构域是只具有将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支环位置的功能的单个多肽。在其他情况中，β-结构域是除了将谷氨酸的氨基传递到羧酸酯和烯醇丙酮酸部分之间的分支酸环位置外，还可执行其他酶功能的较大多肽的一部分。
正如在此所用的，“色氨酸的氨基酸类似物”是指结构上与色氨酸相关的氨基酸，并且可以与野生型邻氨基苯甲酸合酶的色氨酸结合位点结合。这些类似物包括但不限于，6-甲基苯甲酸甲酯、5-甲基色氨酸、4-甲基色氨酸、5-氟色氨酸、5-羟色氨酸、7-氮杂色氨酸、3β-吲哚丙烯酸、3-甲基邻氨基苯甲酸等。
术语“基本上由...组成”与涉及出现的DNA分子、序列或片段一起使用，是指编码邻氨基苯甲酸合酶的DNA分子、序列或片段的主要部分。除非另有注明，DNA分子、序列或片段只编码邻氨基苯甲酸合酶。
在此使用的术语“互补”指能与参照的核苷酸序列的全部、或部分杂交的核酸链的序列。例如，核苷酸序列“TATAC”具有与参照序列5′-TATAC-3′100％的相同性，但也与参照序列5′-GTATA-3′100％互补。
正如在此所用的，“外源的”邻氨基苯甲酸合酶是由导入到宿主细胞中的分离DNA编码的邻氨基苯甲酸合酶，优选地与天然的未转化状态的细胞中的任何DNA序列都不相同。“内源的”或“天然的”邻氨基苯甲酸合酶是天然存在于宿主细胞或生物体内的邻氨基苯甲酸合酶。
正如在此所用的，植物细胞、植物组织、植物一部分或植物中游离L-色氨酸“增强的”或“升高的”水平与未转化的植物细胞、植物组织、植物部分或植物，即未由存在外源的邻氨基苯甲酸合酶核酸或其结构域而改变基因组的植物中的水平相比大约是2-200倍，优选为5-150倍，更优选为10-100倍。例如，在转化的植物种子中游离色氨酸的水平与未转化的植物种子(“起始材料”)相比较。
编码邻氨基苯甲酸合酶的DNA分子和编码运输肽的DNA分子或标记/报道基因是从天然来源中“分离的”，不再存在于其通常存在的细胞中。这样分离的DNA分子至少是部分制备或在体外操作的，例如，从其通常发现的细胞中分离，纯化和扩增。这样分离的DNA分子也可以是“重组的”，将其与外源DNA分子或片段结合。例如，重组的DNA可以是将分离的DNA可操作地连接外源启动子，或连接对宿主细胞来说是内源的启动子。
在此与邻氨基苯甲酸合酶相关使用的术语“单体”指两个或更多个邻氨基苯甲酸合酶结构域结合形成单个多肽链的功能形式。单体邻氨基苯甲酸合酶可在体内组装成二聚体形式。单体邻氨基苯甲酸合酶核酸和多肽可分离自各种生物体，例如根瘤农杆菌，鱼腥藻M22983，巴西固氮螺菌，马尔他布鲁氏菌，薄肌眼虫藻，百脉根根瘤菌，念珠藻属PCC7120或苜蓿中华根瘤菌。可选地，可将选自任何方便的单体或多聚体邻氨基苯甲酸合酶基因的结构域结合，构建单体邻氨基苯甲酸合酶的核酸和多肽。这种生物体包括，例如，根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因。编码所选择区域的核酸可以重组连接。例如，编码α-结构域的C端的核酸可通过形成磷酸二酯键与编码β-结构域的N端的核酸连接。或者，这种多肽的单个结构域可化学连接。例如α-结构域C端通过形成肽键与β-结构域的N端相连，或者相反。
正如在此所用的，“天然的”基因指在体外没有改变，也就是说在体外没有突变的“野生型”基因。
术语“质体”值得是植物细胞器类型，包括造粉体，叶绿体，色质体，油质体，eoplast，黄化质体，白色体和前质体。这些细胞器可自我复制，含有通常称为“叶绿体基因组”的，根据植物的种类大小为大约120-大约217kb的环状DNA分子，其通常含有反向的重复区域。
正如在此所用的，“多肽”指除了分别具有氨基和羧基，而不用肽键连接的N端和C端外，通过肽键连接的所有氨基酸的连续链。多肽可以是任何长度的，并且可进行例如糖基化或磷酸化的翻译后修饰，。
正如在此所用的，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物，是在L-色氨酸类似物存在时与相应的野生型的邻氨基苯甲酸合酶相比，至少含有约10％多的邻氨基苯甲酸合酶活性的植物细胞，植物组织或植物。通常，“对色氨酸的氨基酸类似物的抑制有抗性或耐受的”植物细胞，植物组织或植物可在一定数量的色氨酸的氨基酸类似物下生长，而该数量通常可抑制未转化的植物细胞，植物组织或植物的生长，这可通过本领域已知的方法确定。例如，用编码基本上抗或耐受色氨酸的氨基酸类似物的抑制的邻氨基苯甲酸合酶的DNA分子转化的，同型纯合回交转变的近交植物生长在一定数量的色氨酸的氨基酸类似物下，而该数量的类似物抑制相应的，即基本上等基因的轮回的近交植物的生长。
正如在此所用的，当耐受/抗性的和野生型的邻氨基苯甲酸合酶处于等量的色氨酸或色氨酸的氨基酸类似物时，“对色氨酸或色氨酸的氨基酸类似物的抑制有抗性或耐受的”邻氨基苯甲酸合酶保持比相应的野生型或天然易感的邻氨基苯甲酸合酶的活性高出大约10％多。优选地，抗性或耐受性的邻氨基苯甲酸合酶比相应于野生型的或天然易感型的邻氨基苯甲酸合酶，保持大于20％多的活性。
在此使用的涉及邻氨基苯甲酸合酶的术语“其结构域”包括全长邻氨基苯甲酸合酶的结构或功能性片段。结构区域包括邻氨基苯甲酸合酶内已鉴定的结构。结构区域的一个实例包括α螺旋，β折叠，活性位点，底物或抑制剂结合位点等。功能区域包括具有确定功能的邻氨基苯甲酸合酶的片段，例如色氨酸结合袋，活性位点或底物或抑制剂结合位点。邻氨基苯甲酸合酶的功能性结构域包括可催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸合酶部分。例如，α-结构域是由TrpE编码的区域，可将NH3传递到分支酸上而形成氨基苯甲酸。β-结构域是由TrpG编码的区域，可除去谷氨酸的氨基而形成氨。因此，功能结构域包括邻氨基苯甲酸合酶的酶活性片段和结构域。也包括邻氨基苯甲酸合酶的突变结构域。用于制备突变结构域的野生型邻氨基苯甲酸合酶的核酸包括，例如，编码根瘤农杆菌，鱼腥藻M22983，拟南芥，巴西固氮螺菌，马尔他布鲁氏菌，百脉根根瘤菌，念珠藻属PCC7120，苜蓿中华根瘤菌，血色红假单胞菌，芸香，硫磺矿硫化叶菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，大豆，稻，棉花，玉米的结构域的任何核酸，或任何编码邻氨基苯甲酸合酶的亚基或结构域的基因，其可在编码区包含至少一个氨基酸的取代。突变或相连的、以形成具有增强的色氨酸生物合成活性，更好的稳定性，降低对色氨酸或其类似物的敏感性等的单体邻氨基苯甲酸合酶的结构域，是特别感兴趣的。
术语“5′UTR”指DNA上游未翻译的区域，或基因编码区的5′未翻译的区域。
术语“3′UTR”指DNA下游未翻译的区域，或基因编码区的3′未翻译的区域。
术语“基本上同源”指两个序列在序列上至少90％相同，其通过(Version10；Genetics Computer Group，Inc.，University of Wiconsin BiotechnologyCenter，Madison，WI)中所描述的BestFit程序，使用默认的参数进行测定。
序列相同性的百分数优选使用″Best Fit″或″Gap″序列分析软件包的程序(Version 10；Genetics Computer Group，Inc.，University of WisconsinBiotechnology Center，Madison，WI)测定。″Gap″使用Needleman和Wunsch(1970)算法，以发现两个序列的序列对比中最大的匹配数和最小的缺口(gap)。
″Best Fit″在两个序列间对相似性最好的片段进行优化的序列对比，并且利用Smith和Waterman(Smith and Waterman，1981；Smith等人，1983)的同源性算法插入缺口(gap)以最大化匹配的数目。优选使用默认参数的″Best Fit″程序测定同一性的百分数。在此使用的术语“可操作地连接”指启动子与编码区是以通过启动子来控制和调节编码区翻译的方式连接。可操作地连接启动子和编码区的方法是本领域已知的。
通用概念本发明涉及用于获得产生升高水平的游离L-色氨酸的植物的新的核酸和方法。过量生产是由于导入和表达编码邻氨基苯甲酸合酶或其结构域的核酸。这种邻氨基苯甲酸合酶核酸包括邻氨基苯甲酸合酶的野生型或突变的α-结构域，或单体形式。邻氨基苯甲酸合酶的单体形式在单个多肽链上含有至少两个邻氨基苯甲酸合酶区域，例如，α-结构域连接β-结构域。
天然植物的邻氨基苯甲酸合酶通常对L-色氨酸和其类似物的抑制反馈敏感。这种抑制构成调控色氨酸合成途径的关键机制。因此，邻氨基苯甲酸合酶或其结构域是高度活性的、更加有效的或较少程度地受到色氨酸或其类似物的抑制，从而可能产生升高水平的色氨酸。根据本发明，根瘤农杆菌邻氨基苯甲酸合酶对于产生高水平的色氨酸特别有用。
为了在植物或所选择的宿主细胞中产生高水平色氨酸，分离所选择的邻氨基苯甲酸合酶核酸，并可在体外操作，以包括在植物细胞或其他细胞类型中基因表达所需的调控信号。因为报道植物中的色氨酸合成途径在质体中进行，可将外源邻氨基苯甲酸合酶的核酸导入质体中或通过加上编码质体运输肽的氨基末端的核酸片段进行修饰。这种质体运输肽可直接引导邻氨基苯甲酸合酶基因产物进入质体。在一些情况中邻氨基苯甲酸合酶已经含有质体运输序列，这样就没有必要增加片段了。
为了改变色氨酸的生物合成，编码邻氨基苯甲酸合酶活性的核酸必须导入植物细胞或其他宿主细胞，然后直接或间接地验证这些转化细胞。可使用完整的邻氨基苯甲酸合酶或其有用的部分或结构域。邻氨基苯甲酸合酶稳定地整合在植物细胞基因组上。控制邻氨基苯甲酸合酶表达的转录信号必须在植物细胞或其他宿主细胞内被识别并发挥作用。也就是说邻氨基苯甲酸合酶必须转录成信使RNA(mRNA)，而mRNA必须在植物细胞核中稳定、完整地运输到细胞质中翻译。邻氨基苯甲酸合酶mRNA必须含有可被植物细胞核糖体识别和合适翻译的合适的翻译信号。多肽基因产物必须基本上逃脱细胞质内蛋白水解的攻击，而被转运到正确的细胞内部分(例如，质体)，并且能够呈现赋予酶活性的三维构像。邻氨基苯甲酸合酶必须进一步能够在色氨酸和其衍生物的生物合成中发挥作用；也就是说，必须定位在催化生物合成中旁侧步骤的天然植物酶的附近(大概在质体中)，以获得所需要的底物并传递合适的产物。
即使满足所有的条件，色氨酸的成功过量产生也不是一个可以预料的事情。一些转基因的表达可能受到附近染色体元件的负影响，如果通过突变减少反馈抑制而获得高水平的色氨酸，存在其他的控制机制来补偿邻氨基苯甲酸合酶步骤减少的调控。可能有提高所蓄积氨基酸降解率的机制。色氨酸和相关氨基酸的过量表达的水平也不能对植物有毒性。最后，导入性状必须是稳定的和可以遗传的，以提供商业上的发展和使用。
编码邻氨基苯甲酸合酶的DNA的分离和鉴定可通过标准的方法鉴定和分离编码邻氨基苯甲酸合酶的核酸，例如，如Sambrook等在“分子克隆实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆实验指南”，第三版(2001.1.15)中所描述的。例如，编码邻氨基苯甲酸合酶或其结构域的DNA序列可以通过筛选来源于特定细胞种类、细胞系、初级细胞或组织的核酸所产生的DNA或cDNA文库而鉴定。用于鉴定和分离邻氨基苯甲酸合酶的文库的实例包括，但不限于，来源于根瘤农杆菌菌株A348，玉米自交系B73(Stratagene，La Jolla，加利福尼亚，Cat.#937005，Clontech，Palo Alto，加利福尼亚，Cat.#FL1032a，#FL1032b，和FL1032n)的cDNA文库，来源于玉米自交系Mo17(Stratagene，Cat.#946102)的基因组文库，来源于玉米自交系B73(Clontech，Cat.#FL1032d)的基因组文库，来源于鱼腥藻M22983(例如，Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(GI17982357)，大肠杆菌，薄肌眼虫藻(Euglena gracilis)，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)，或其他种类的基因组DNA。而且，可采用分离自任何这些种类的基因组DNA，mRNA或cDNA，通过核酸扩增方法分离邻氨基苯甲酸合酶核酸。
筛选编码邻氨基苯甲酸合酶的全长或其部分序列的DNA片段可通过筛选与来源于从其他生物体的邻氨基苯甲酸合酶基因探针杂交的基因组或cDNA文库的噬菌斑，或筛选与特异性识别邻氨基苯甲酸合酶的抗体结合的cDNA表达文库的噬菌斑而实现。将与来自其他生物体的邻氨基苯甲酸合酶探针杂交的DNA片段和/或携带邻氨基苯甲酸合酶抗体免疫活性的DNA片段的噬菌斑亚克隆到载体中，并进行测序和/或作为探针用于鉴定编码所需要的邻氨基苯甲酸合酶基因的全长或部分的其他cDNA或基因组序列。用于筛选玉米或植物文库的优选cDNA探针可从质粒克隆pDPG600或pDPG602获得。
cDNA文库可例如，通过随机寡引物或寡dT引物引发制备。含有DNA片段的噬菌斑可以用特异于邻氨基苯甲酸合酶的探针或抗体筛选。将编码邻氨基苯甲酸合酶基因部分的DNA片段亚克隆，并测序，以及用作鉴定基因组邻氨基苯甲酸合酶基因的探针。编码细菌或植物邻氨基苯甲酸合酶的DNA片段可通过确定与其他已知的邻氨基苯甲酸合酶基因的同源性而验证，或通过与邻氨基苯甲酸合酶特异的信使RNA杂交而验证。一旦获得编码邻氨基苯甲酸合酶的5′，中间和3′端部分的cDNA片段，则可将其作为探针，从基因组文库中鉴定和克隆完整的邻氨基苯甲酸合酶基因的基因组拷贝。
对部分基因组拷贝或邻氨基苯甲酸合酶基因的拷贝测序，并通过标准方法鉴定基因的5′端，包括通过与其他邻氨基苯甲酸合酶基因的DNA序列同源或RNA酶保护分析，例如，Sambrook等在“分子克隆实验指南”，第二版(1989)；Sambrook和Russell，在“分子克隆实验指南”，第三版(2001.1.15)中所描述的。靶基因的3′和5′端可通过利用已知的AS编码区计算机搜索基因组序列数据库来定位。一旦鉴定基因的5′端，邻氨基苯甲酸合酶基因的完整拷贝可通过标准方法获得，包括克隆或利用与基因DNA序列的5′末端互补的寡核苷引物的聚合酶链式反应(PCR)。分离的邻氨基苯甲酸合酶基因的全长拷贝的存在可通过杂交，部分序列分析或通过表达玉米邻氨基苯甲酸合酶来验证。
本发明例证性分离的DNAs包括具有下面核苷酸SEQ ID NO的DNAsSEQ ID NO1根瘤农杆菌(野生型)SEQ ID NO2玉米(野生型，α2)SEQ ID NO3芸香SEQ ID NO46大肠杆菌EMG2(K-12 wt F+)的截短的TrpE基因SEQ ID NO67玉米(C28突变)SEQ ID NO68玉米(C28+终止子)SEQ ID NO71叶绿体靶肽(g)SEQ ID NO73叶绿体靶肽(a)SEQ ID NO75根瘤农杆菌(优化的)SEQ ID NO76血色红假单胞菌SEQ ID NO83血色红假单胞菌(RhoPa_TrpEG)SEQ ID NO84根瘤农杆菌V48F突变体SEQ ID NO85根瘤农杆菌V48Y突变体SEQ ID NO86根瘤农杆菌S51F突变体SEQ ID NO87根瘤农杆菌S51C突变体SEQ ID NO88根瘤农杆菌N52F突变体SEQ ID NO89根瘤农杆菌P293A突变体SEQ ID NO90根瘤农杆菌P293G突变体SEQ ID NO91根瘤农杆菌F298W突变体SEQ ID NO92根瘤农杆菌S50K突变体SEQ ID NO93根瘤农杆菌F298A突变体SEQ ID NO94稻
SEQ ID NO95稻的同功酶SEQ ID NO96玉米(Anderson的美国专利No.6,118,047)SEQ ID NO97小麦SEQ ID NO98烟草SEQ ID NO104陆地棉(Gossypium hirsutum)(α)SEQ ID NO105陆地棉(β)SEQ ID NO106大豆(Glycine max)(α)SEQ ID NO107大豆(β)SEQ ID NO112具有5′和3′UTRs的大豆(α)SEQ ID NO113具有5′和3′UTRs的大豆(β)SEQ ID NO116玉米(β)SEQ ID NO119稻(Oryza sativa)(β1)SEQ ID NO120稻(β2)SEQ ID NO121百脉根根瘤菌SEQ ID NO122巴西固氮螺菌SEQ ID NO123马尔他布鲁氏菌SEQ ID NO124念珠藻属SEQ ID NO125念珠藻属SEQ ID NO126血色红假单胞菌SEQ ID NO127大豆慢生根瘤菌SEQ ID NO128深红红螺菌SEQ ID NO129 Thermobifida fuscaSEQ ID NO134高粱(Sorghum bicolor)(β1)SEQ ID NO135高粱(β2)SEQ ID NO136玉米(α1)某些引物也可以用于实现本发明，例如具有SEQ ID NOs9-42，47-56，或138-143的引物。
本发明也包括编码具有例如下述任何氨基酸序列的邻氨基苯甲酸合酶的任何分离核酸。
SEQ ID NO4根瘤农杆菌(野生型)SEQ ID NO5玉米(野生型)
SEQ ID NO6芸香SEQ ID NO7苜蓿中华根瘤菌SEQ ID NO8硫磺矿硫化叶菌SEQ ID NO43苜蓿中华根瘤菌SEQ ID NO44硫磺矿硫化叶菌SEQ ID NO45拟南芥SEQ ID NO57血色红假单胞菌SEQ ID NO58根瘤农杆菌V48F突变体SEQ ID NO59根瘤农杆菌V48Y突变体SEQ ID NO60根瘤农杆菌S51F突变体SEQ ID NO61根瘤农杆菌S51C突变体SEQ ID NO62根瘤农杆菌N52F突变体SEQ ID NO63根瘤农杆菌P293A突变体SEQ ID NO64根瘤农杆菌P293G突变体SEQ ID NO65根瘤农杆菌F298W突变体SEQ ID NO66玉米C28突变体SEQ ID NO69根瘤农杆菌S50K突变体SEQ ID NO70根瘤农杆菌F298A突变体SEQ ID NO74叶绿体靶肽(a)SEQ ID NO72叶绿体靶肽(g)SEQ ID NO77百脉根根瘤菌(MesLo_13472468)SEQ ID NO78巴西固氮螺菌(AzoBr_1717765)SEQ ID NO79马尔他布鲁氏菌(BruMe_17986732)SEQ ID NO80念珠藻属(Nostoc_17227910)SEQ ID NO81念珠藻属(Nostoc_17230725)SEQ ID NO82血色红假单胞菌RhoPa_TrpEGSEQ ID NO99稻SEQ ID NO100稻的同功酶SEQ ID NO101玉米(Anderson的美国专利No.6,118,047)SEQ ID NO102小麦SEQ ID NO103烟草
SEQ ID NO108陆地棉(α)SEQ ID NO109陆地棉(β)SEQ ID NO110大豆(α)SEQ ID NO111大豆(β)SEQ ID NO114玉米(ASα2)叶绿体靶肽SEQ ID NO115玉米(ASα1)叶绿体靶肽SEQ ID NO117稻(β)SEQ ID NO118玉米(β)SEQ ID NO130大豆慢生根瘤菌SEQ ID NO131深红红螺菌SEQ ID NO132 Thermobifida fuscaSEQ ID NO133高粱(β)SEQ ID NO137玉米(ASα1)任何这些核酸和多肽以及其任何突变体，变异体或衍生物都可用于实现本发明。
单体的邻氨基苯甲酸合酶根据本发明，来源于植物和非植物类的单体邻氨基苯甲酸合酶在植物中都有可以提供高水平色氨酸的功能。出乎意料的是非植物类来源的单体邻氨基苯甲酸合酶在植物中有很好的作用效果，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。例如，成功使用来源于如细菌，原生生物和微生物一样多样的物种的单体邻氨基苯甲酸合酶。特别是来源于下述细菌类的单体邻氨基苯甲酸合酶根瘤农杆菌，苜蓿中华根瘤菌，百脉根根瘤菌，马尔他布鲁氏菌，念珠藻属PCC7120，巴西固氮螺菌，鱼腥藻M22983，大豆慢生根瘤菌(Bradyrhizobium janonicum)，深红红螺菌，和Thermobidfida fusca，在植物中都有提供高水平色氨酸的功能，尽管这些单体邻氨基苯甲酸合酶序列与大多数植物邻氨基苯甲酸合酶的同源性很低。
包含例如野生型单体根瘤农杆菌邻氨基苯甲酸合酶的转基因植物可以在种子中产生高达约10,000-约12,000ppm的色氨酸，平均的trp水平为约7,000-约8,000ppm。非转基因大豆植物的种子中通常只能达到约100-约200ppm的色氨酸。比较含有添加突变的玉米α-结构域的转基因植物产生较低水平的色氨酸(例如，平均达到约3000-约4000ppm)。
单体酶相对于多聚酶具有一些优点。例如，虽然本发明并不仅限于特定的机制，单体酶可以提供更好的稳定性，协同表达等。当在体内合成异源的四聚体邻氨基苯甲酸合酶的结构域或亚基时，这些结构域/亚基必须在酶具有活性之前就适当地组装成异源四聚体形式。通过转基因方法在植物中增加单个的邻氨基苯甲酸合酶结构域不能提供过量产生的异源四聚体酶，因为没有足够的内源非转基因结构域来从实质上增强功能四聚体的水平。因此，编码单体邻氨基苯甲酸合酶的核酸、载体和酶可有利地用于过量产生邻氨基苯甲酸合酶的所有酶功能。
根据本发明，当在植物细胞、植物组织或种子中表达时，可融合或连接来源于天然产生异源四聚体邻氨基苯甲酸合酶的种属的邻氨基苯甲酸合酶结构域，以提供能产生高水平色氨酸的单体邻氨基苯甲酸合酶。例如，单体邻氨基苯甲酸合酶可通过融合或连接邻氨基苯甲酸合酶的α和β-结构域，以使得α-β融合体与天然单体的邻氨基苯甲酸合酶的序列排列比对而制备。单体和四聚体邻氨基苯甲酸合酶的序列排列的实例如图21和35所示。采用这种序列排列，可以调整邻氨基苯甲酸合酶结构域的间隔和定位或修饰，以从异源四聚体区域产生任选地与天然邻氨基苯甲酸合酶的排列比对的单体邻氨基苯甲酸合酶结构。这种融合蛋白可用于升高植物组织中的色氨酸水平。
异源四聚体邻氨基苯甲酸合酶，例如硫磺矿硫化叶菌邻氨基苯甲酸合酶(例如，Genbank登录号GI 1004323)，与其他植物或微生物的异源四聚体邻氨基苯甲酸合酶的同源性大约为30％-87％。单体邻氨基苯甲酸合酶，例如根瘤农杆菌邻氨基苯甲酸合酶与其他单体酶，例如苜蓿中华根瘤菌(Genbank登录号GI 15966140)和巴西固氮螺菌(Genbank登录号1717765)的同源性分别为大约83％和约52％。Bae等人，苜蓿中华根瘤菌邻氨基苯甲酸合酶基因克隆，测序和在大肠杆菌中表达，细菌学杂志J.Bacteriol.，1713471-3478(1989)；De Troch等人，分离和纯化巴西固氮螺菌trpE(G)基因，编码邻氨基苯甲酸合酶.Curr.Microbiol.，3427-32(1997)。
然而，全序列与天然单体和天然四聚体邻氨基苯甲酸合酶的同源性可以小于30％。因此，不是计算机产生的排列而是视觉排列，以优化排列单体和四聚体的邻氨基苯甲酸合酶。邻氨基苯甲酸合酶内的界标(landmark)结构和序列有助于序列排列。例如，基序″LLES″是形成邻氨基苯甲酸合酶的色氨酸结合袋的β-夹层的β-折叠的一部分。这种界标序列可用于更加确信地排列差异的邻氨基苯甲酸合酶序列，特别是用于确定涉及色氨酸结合的关键残基。
为了实现邻氨基苯甲酸合酶结构域的融合或连接，所选择的TrpE或α-结构域的C末端与TrpG结构域或β-结构域的N末端连接。在一些方案中，可在结构域间使用接头肽，以提供合适的间隔和/或灵活性。通过单体和四聚体邻氨基苯甲酸合酶的序列对比来鉴定合适的接头序列。
例如通过杂交，PCR扩增或如Anderson等人在美国专利No.6,118,047中所描述的，克隆所选择的β-结构域。质体传递肽序列可通过标准方法与邻氨基苯甲酸合酶编码区连接。例如可以使用拟南芥小亚基(SSU)的叶绿体靶肽(CTP，SEQ ID NOs71-74)。也参见Stark等人，科学Science，258287(1992)。然后可将融合的基因插入在此所描述的用于转化植物的合适载体中。
邻氨基苯甲酸合酶的突变体本发明所包括的突变的邻氨基苯甲酸合酶，可具有任何类型的突变，包括例如，氨基酸取代、缺失、和/或重排。这种突变体可以是邻氨基苯甲酸合酶核酸和在此所特异性鉴定的多肽的衍生物或变异体。突变的邻氨基苯甲酸合酶也可从任何可得到的种类中获得，包括没有在此明确鉴定的种类。突变体、衍生物和变异体可具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137序列中任何一个的氨基酸位点至少约30％的同一性，并且具有邻氨基苯甲酸合酶活性。在优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约50％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约60％的同一性，并且具有邻氨基苯甲酸合酶活性。在更优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约70％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约80％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约90％的同一性，并且具有邻氨基苯甲酸合酶活性。在更加优选的实施方案中，多肽衍生物和变异体的氨基酸具有与SEQ ID NOs4-8，43-45，57-66，69-70，77-82，99-111，117-118，130-133，和137中任何一个的氨基酸位点至少约95％的同一性，并且具有邻氨基苯甲酸合酶活性。
在一个实施方案中，邻氨基苯甲酸合酶突变体、变异体和衍生物可通过将SEQ ID NOs1-3，9-42，46，47-56，67-68，75-76，83-98，104-107，112，113，116，119-129，134-136，和138-143，或其片段或引物中任何一个，在中等的或优选高严谨条件下与所选择的核酸源杂交来鉴定。杂交的中等或严谨条件在本领域是已知的，参见，例如Sambrook等人，分子克隆实验指南，第二版(1989)的第0.47-9.51节；也参见Sambrook和Russell，“分子克隆实验指南，第三版(2001.1.15)。例如，严谨条件是(1)采用低离子强度和高温洗涤，例如0.015M NaCl/0.0015M柠檬酸钠(SSC)；0.1％十二烷基硫酸钠(SDS)，于50℃，或(2)杂交过程中使用例如甲酰胺的变性试剂，例如，50％甲酰胺，0.1％小牛血清/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液pH6.5和750mM NaCl，75mM柠檬酸钠，于42℃。另外一个实例是采用50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH6.8)，0.1％焦磷酸钠，5×Denhardt′s溶液，超声的鲑精DNA(50μg/ml)，0.1％十二烷基硫酸钠(SDS)，和10％葡聚糖硫酸酯于42℃，和在42℃下用0.2×SSC和0.1％SDS洗涤。
本发明进一步提供杂交探针和包含至少7个核苷酸碱基的新分离和纯化的DNA片段的引物，其可被可检测地标记或结合可检测的标记。这种杂交探针或引物可在中等或高严谨条件下与编码邻氨基苯甲酸合酶的DNA分子的任何一条链杂交。这种杂交探针和引物的实例包括SEQ ID NOs9-42，47-56，和138-143中的任何一个。
邻氨基苯甲酸合酶可以是任何邻氨基苯甲酸合酶，或其突变体或结构域，例如α-结构域。邻氨基苯甲酸合酶可以是单体邻氨基苯甲酸合酶。功能性的突变体是优先的，特别是那些能够在植物中产生高水平色氨酸的突变体，例如，对色氨酸的氨基酸类似物的抑制有基本抗性的突变体。
产生编码突变的邻氨基苯甲酸合酶的核酸可产生自任何方便的种类，例如，编码根瘤农杆菌，鱼腥藻M22983(例如Genbank登录号GI 152445)，拟南芥，巴西固氮螺菌(例如，Genbank登录号GI 1174156)，马尔他布鲁氏菌(例如，Genbank登录号GI 17982357)，大肠杆菌，薄肌眼虫藻，百脉根根瘤菌(例如，Genbank登录号GI 13472468)，念珠藻属PCC7120(例如，Genbank登录号GI 17227910或GI 17230725)，苜蓿中华根瘤菌(例如，Genbank登录号GI 95177)，芸香，血色红假单胞菌，鼠伤寒沙门氏菌，粘质沙雷氏杆菌，硫磺矿硫化叶菌，大豆慢生根瘤菌，深红红螺菌，Thermobifidafusca，Sorghum bicolor，大豆，稻，棉花，小麦，烟草，玉米(玉蜀黍)的任何结构域，或编码邻氨基苯甲酸合酶亚基或区域的任何基因的核酸。
所需要的突变包括升高邻氨基苯甲酸合酶的活性，减少对色氨酸或其类似物的反馈抑制的敏感性，和/或在植物中产生升高量的色氨酸。这种突变在其显示的活性的水平或类型上具有功能性改变，并且有时被称为在此所提供的邻氨基苯甲酸合酶核酸和多肽的“衍生物”。
然而，本发明也包括邻氨基苯甲酸合酶变异体和带“沉默”突变的邻氨基苯甲酸合酶。正如在此所用的，沉默突变是一种改变邻氨基苯甲酸合酶核苷酸序列但并不改变邻氨基苯甲酸合酶编码的氨基酸序列的突变。突变核酸编码变异体邻氨基苯甲酸合酶，与相应的野生型邻氨基苯甲酸合酶相比，变异体具有一个或更多个氨基酸的改变但并没有从基本上改变它的活性。本发明指所有这种衍生物、变异体和带有沉默突变的邻氨基苯甲酸合酶核酸。
可通过几种方法获得编码对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变的邻氨基苯甲酸合酶的DNA。该方法包括但不限于1.培养物中的自发变异和直接的突变筛选；2.任何细胞种类或组织，种子或植物的组织培养物中的直接或间接的突变方法；3.通过下述方法突变所克隆的邻氨基苯甲酸合酶基因，例如通过化学突变；特异性点或定点诱变(Sambrook等人，在前引用的)，转位子介导的突变(Berg等人，生物技术Biotechnology，1417(1983))，和缺失突变(Mitra等人，Molec.Gen.Genetic.，215294(1989))；4.在关键残基中设计合理的突变；以及5.DNA移码以将感兴趣的突变整合到多种邻氨基苯甲酸合酶核酸中。
例如，可使用能够得到的邻氨基苯甲酸合酶蛋白的蛋白结构信息合理地设计可能具有增强的活性，或减少对色氨酸或色氨酸类似物敏感性的邻氨基苯甲酸合酶突变。这种蛋白结构信息是可以得到的，例如，从硫磺矿硫化叶菌(solfulobus solfataricus)邻氨基苯甲酸合酶(Knochel等人，Proc.Natl.Acad.Sci.(U.S.A.)，969479-9484(1999))。合理设计的突变可以通过对所选择的邻氨基苯甲酸合酶氨基酸与已知结构的，如硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现。参见附图6、21和35。通过结合结构信息和序列同源性的知识来预测邻氨基苯甲酸合酶蛋白的色氨酸结合和催化区域。例如，确定色氨酸结合袋的残基可作为突变的候选物来改变酶对色氨酸反馈抑制的抗性。使用这种结构信息，在涉及色氨酸结合的位点或区域，合理设计几种根瘤农杆菌邻氨基苯甲酸合酶的突变体。
使用这种序列和结构分析，与单体根瘤农杆菌邻氨基苯甲酸合酶在大约25-60或200-225或290-300或370-375位类似的区域，可在单体根瘤农杆菌邻氨基苯甲酸合酶中，作为产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变而鉴定出来。更具体地，与单体根瘤农杆菌邻氨基苯甲酸合酶中的P29，E30，S31，I32，S42，V43，V48，S50，S51，N52，N204，P205，M209，F210，G221，N292，P293，F298，和A373类似的氨基酸是产生具有对色氨酸反馈抑制敏感性降低的活性的邻氨基苯甲酸合酶的潜在的有用突变残基。本发明包括在这些位点的任何氨基酸的取代或插入。可选地，任何这些位点的氨基酸也可被缺失。
定点诱变可用于在各种位点产生氨基酸取代、缺失和插入。在根瘤农杆菌邻氨基苯甲酸合酶编码区内的具体突变实例包括下列在大约48位用Phe替换Val(见例如，SEQ ID NO58)；在大约48位用Tyr替换Val(见例如，SEQ ID NO59)；在大约51位用Phe替换Ser(见例如，SEQ ID NO60)；在大约51位用Cys替换Ser(见例如，SEQ ID NO61)；在大约52位用Phe替换Asn(见例如，SEQ ID NO62)；在大约293位用Ala替换Pro(见例如，SEQ ID NO63)；在大约293位用Gly替换Pro(见例如，SEQ ID NO64)；或在大约298位用Trp替换Phe(见例如，SEQ ID NO65)。
通过对比待突变的邻氨基苯甲酸合酶的氨基酸序列和根瘤农杆菌邻氨基苯甲酸合酶的氨基酸序列，可在任何邻氨基苯甲酸合酶的类似位置产生相似的突变。可用于序列对比的根瘤农杆菌邻氨基苯甲酸合酶的一个实例是SEQ ID NO4。
可通过经典的突变和遗传筛选鉴定有用的突变体。通过将酶暴露在游离的L-色氨酸或色氨酸的氨基酸类似物下，测定基因编码的酶的活性来检测功能性变化，或通过限制性酶切图谱或DNA序列分析检测DNA分子中的变化。
例如，编码基本上耐受5-甲基色氨酸(5-MT)的邻氨基苯甲酸合酶的基因可以从5-甲基色氨酸耐受细胞系中分离。见美国专利No.4,581,847，其所公开的内容在此引入作为参考。简而言之，使部分分化的植物细胞培养物生长，并暴露于连续低水平的5-甲基色氨酸进行继代培养。然后在几次继代培养的期间逐步增加5-甲基色氨酸的浓度。在通常有毒性的5-甲基色氨酸水平存在下生长的细胞或组织，在5-甲基色氨酸存在下重复地传代培养和表征。所培养细胞的耐受5-甲基色氨酸性特性的稳定性可通过使所选择的细胞系在不含5-甲基色氨酸时生长不同的时间段，然后将组织暴露于5-甲基色氨酸后分析其生长来评估。由于邻氨基苯甲酸合酶改变而具有耐受性优点的细胞系可通过在通常有毒性的，即生长抑制剂水平的5-甲基色氨酸下鉴定具有酶活性的细胞系而选择出来。
从5-MT-或6-甲基邻氨基苯甲酸(6-MA)-抗性的细胞系中克隆的邻氨基苯甲酸合酶基因可以用标准方法评估对5-MY，6-MA，或色氨酸的其他氨基酸类似物的耐受性，如美国专利No.4,581,847所描述的，其所公开的内容在此引入作为参考。
对5-甲基色氨酸抑制的敏感性降低的邻氨基苯甲酸合酶的细胞系可以用于分离5-甲基色氨酸-抗性的邻氨基苯甲酸合酶。可从耐受5-甲基色氨酸的细胞系产生DNA文库，并且编码邻氨基苯甲酸合酶基因的全长或部分DNA片段可通过与编码邻氨基苯甲酸合酶基因的cDNA探针杂交而鉴定。改变基因的完整拷贝可通过克隆和连接或利用合适引物的PCT获得。编码邻氨基苯甲酸合酶的改变基因的分离可在转化的植物细胞中通过测定表达的邻氨基苯甲酸合酶在通常有毒性的5-甲基色氨酸水平下是否保留酶活性而验证。见Anderson等人，美国专利号6,118,047。
可优化在此提供的任何DNA分子的编码区，用于在所选择的生物体中例如，所选择的植物或其他宿主细胞类型中表达。对于所选择的植物具有优化的密码子使用的DNA分子的实例是具有SEQ ID NO75的根瘤农杆菌邻氨基苯甲酸合酶的DNA分子。该优化的根瘤农杆菌邻氨基苯甲酸合酶DNA(SEQ ID NO75)与SEQ ID NO1有94％的同一性。
转基因和载体一旦获得和扩增编码邻氨基苯甲酸合酶或其结构域的核酸，就可以可操作地与启动子，任选地与其他元件结合形成转基因。
大多数基因具有已知作为启动子并调控基因表达的DNA序列的区域。在真核和原核细胞中，通常在编码序列上游的DNA序列侧翼找到启动子区域。启动子序列提供对下游基因序列转录的调控，一般包括约50-约2,000个核苷酸碱基对。启动子序列也包含调控序列，例如可影响基因表达水平的增强子序列。一些分离的启动子序列可提供外源基因的基因表达，即不同于天然或同源基因的基因表达。已知启动子序列可以是强的或弱的或可诱导的。强启动子可以提供高水平的基因表达，而弱启动子提供低水平的基因表达。可诱导的启动子是对于外源所加的试剂或对于环境或发育的刺激可打开或关闭基因表达的启动子。启动子可以提供组织特异性或发育的调控。对于异源基因是强启动子的分离启动子是有利的，因为它提供足够水平的基因表达以便容易检测和筛选出转化细胞，在需要时提供高水平的基因表达。
可提供本发明的转基因中的启动子用于从编码邻氨基苯甲酸合酶的DNA序列表达邻氨基苯甲酸合酶。优选地，编码序列的表达导致植物组织，例如植物种子中色氨酸水平的增强。在另一个实施方案中，编码序列的表达导致对色氨酸的氨基酸类似物的反馈抑制或生长抑制的耐受性增强或导致细胞中色氨酸总量的增加。也可诱导启动子以使得基因表达可以在加入外源试剂时开放或关闭。例如，如Ptac启动子的细菌启动子可根据加入到转化的细菌细胞中的异硫丙基半乳糖苷的水平被诱导而改变基因表达的水平。也可优选结合具有提供在植物中组织特异性表达或发育地调控基因表达的启动子的基因。用于实现本发明的许多启动子对本领域技术人员来说是可获得的。
优选的启动子一般包括但不限于，在细菌、细菌噬菌体、质体或植物细胞中起作用的启动子。有用的启动子包括CaMV 35S启动子(Odell等人，自然Nature，313810(1985))，CaMV 19S(Lawton等人，Plant Mol.Biol.，931F(1987))，nos(Ebert等人，Proc.Nat.Acad.Sci.(U.S.A.)，845745(1987))，Adh(Walker等人，Proc.Nat.Acad.Sci.(U.S.A.)，846624(1987))，蔗糖合酶(Yang等人，Proc.Nat.Acad Sci.(U.S.A.)，874144(1990))，α-微管蛋白，napin，肌动蛋白(Wang等人，Mol.Cell.Biol.，123399(1992))，cab(Sullivan等人，Mol.Gen.Genet.，215431(1989))，PEPCase启动子(Hudspeth等人，Plant Mol.Biol.，12579(1989))，7S-α′-大豆伴球蛋白启动子(Beachy等人，EMBO J，43047(1985))或与R基因复合物相关的启动子(Chandler等人，The Plant Cell，11175(1989))。其他有用的启动子包括噬菌体SP6，T3，和T7启动子。
也可使用质体启动子。大多数的质体基因含有可用于多亚基质体编码的RNA聚合酶(PEP)以及单亚基核编码的RNA聚合酶的启动子。核编码的聚合酶(NEP)启动子的共有序列和几种天然质体基因的特异性启动子序列的列表可在Hajdukiewicz等人，EMBO J.，164041-4048，(1997)中找到，在此将其全部引入作为参考。
可使用的质体启动子的实例包括玉米质体RRN(ZMRRN)启动子。ZMRRN启动子在拟南芥质体RNA聚合酶存在时可驱使基因表达。可用于本发明的相似启动子有甘氨酸最大质体RRN(SOYRRN)和烟草(Nicotianatabacum)质体RRN(NTRRN)启动子。所有这三种启动子都可被拟南芥(Arabidopsis)质体RNA聚合酶识别。RRN启动子的普遍特征在Hajdukiewicz等人和美国专利6,218,145中有描述。
而且，来源于特定启动子的转录增强子或复制增强子也可用于增强表达。这种增强子的实例包括但不限于，来源于CaMV 35S启动子和章鱼氨酸(octopine)合酶基因(Last等人，美国专利5,290,924)的元件。例如，根据本发明可构建包括ocs增强子元件的载体。这个元件首次是从农杆菌属(Ellis等人，EMBO J.，63203(1987))的章鱼氨酸合酶(ocs)基因中确定的16bp回文(palindromic)增强子，并且存在至少10个其他的启动子(Bouchez等人，EMBOJ.，84197(1989))。当在单子叶植物转化中使用时，建议使用增强子元件，例如ocs元件和特别是多拷贝的元件，将有助于增强邻近启动子的转录水平。组织特异性启动子，包括但不限于，根细胞启动子(Conkling等人，PlantPhysiol.，931203(1990))，并且也包括特别有用的组织特异性增强子(Fromm等人，The Plant Cell，1977(1989))，以及例如ABA-和膨压诱导的启动子等的可诱导的启动子。
转录起始位点和编码序列起始之间的DNA序列，即未翻译的前导序列可影响基因表达，也希望采用特定的前导序列。可采用本领域技术人员可获得的任何前导序列。优选的前导序列直接优化所连接基因的表达水平，例如，通过增强或维持mRNA的稳定性和/或防止不合适的翻译起始(Joshi，Nucl.Acid Res.，156643(1987))。本领域技术人员谨慎考虑选择这种序列。也可以考虑使用来源于在双子叶植物，特别是大豆中高表达基因的序列。
在一些情况下，不必要极端高表达邻氨基苯甲酸合酶或其结构域。例如，使用本发明的方法可产生这种高水平的邻氨基苯甲酸合酶，可产生的底物而不是酶可能限制色氨酸产生的水平。在这种时候，本领域的技术人员可采用更加适度或调控水平的表达。这样技术人员可容易地调节和调控表达的水平，例如，通过使用弱启动子或发育调控或组织特异性的启动子。
编码感兴趣的邻氨基苯甲酸合酶的核酸也包括质体运输肽(例如SEQ IDNOs72，74，114，或115)，有助于运输邻氨基苯甲酸合酶多肽进入质体，例如，进入叶绿体。通常编码所选择的质体运输肽(例如，SEQ ID NOs71或73)的核酸在框内与编码邻氨基苯甲酸合酶的序列连接。然而，质体运输肽也可位于邻氨基苯甲酸合酶的N末端或C末端。
构建体也包括感兴趣的核酸(例如编码邻氨基苯甲酸合酶的DNA)和作为转录终止信号和允许所得mRNA的多聚腺苷酸化的核酸序列。这种转录终止信号位于感兴趣的编码区的3′或下游。优选的转录终止信号包括来源于根瘤农杆菌胭脂氨酸合酶基因的转录终止信号(Bevan等人，Nucl.AcidRes.，11369(1983))，来源于根瘤农杆菌章鱼氨酸(octopine)合酶的终止子，和马铃薯和番茄中编码蛋白酶抑制剂I和II的3′末端基因，尽管也可以使用其他本领域技术人员已知的转录终止信号。根据需要进一步包括调控元件，例如Adh内含子1(Callis等人，Genes Develop.，11183(1987))，蔗糖合酶内含子(Vasil等人，Plant Physiol.，915175(1989))或TMVω元件(Gallie等人，ThePlant Cell，1301(1989))。可以根据An，Methods in Enzymology，153292(1987)描述的方法获得这些3′非翻译的调控序列，或已经存在可从商业上，例如Clontech，(Palo Alto，加利福尼亚)获得的质体上。3′非翻译的调控序列可按标准方法可操作地与邻氨基苯甲酸合酶基因的3末端相连。本发明也可以使用其他本领域技术人员已知的调控元件。
DNA构建体可包含第一表达盒，包括，可操作地连接，异源启动子，编码邻氨基苯甲酸合酶α-结构域蛋白的DNA分子和转录终止子。这种DNA构建体可进一步包含可操作连接的第二表达盒，其包括异源启动子，编码邻氨基苯甲酸合酶β-结构域蛋白的DNA分子和转录终止子。
在本发明中也使用可选择的标记基因或报道基因。这种基因可赋予表达标记基因的细胞明显的表型，这样可以在没有标记的细胞中区分出转化细胞。可选择的标记基因赋予一个可通过化学方法，即通过使用选择性试剂(例如，杀虫剂，抗生素等)进行“选择”的性状。报道基因或可筛选的基因赋予可通过观察或检测确定的性状，即通过“筛选”(例如，R-基因座性状)。当然，本领域已知许多合适标记基因的实例，都可用于实现本发明。
本发明中涉及使用的可选择标记包括但不限于，编码新霉素抗性的neo基因(Potrykus等人，Mol Gen.Genet.，199183(1985))，可用卡那霉素，G418等选择；编码bialaphos抗性的bar基因；编码改变的DPSP合酶蛋白的基因(Hinchee等人，Biotech.，6915(1988))可赋予草甘膦抗性；腈水解酶基因，例如来源于臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn，可赋予bromoxynil抗性(Stalker等人，Science，242419(1988))；突变的乙酰乳酸合酶基因(ALS)可赋予咪唑啉酮、磺酰尿或其他ALS-抑制化学试剂(EP 154 204(1985))的抗性；氨甲喋呤抗性DHFR基因(Thillet等人，J.Biol.Chem.，26312500(1988))；茅草枯(dalapon)脱卤素酶基因可赋予对杀虫剂茅草枯的抗性；或突变的邻氨基苯甲酸合酶基因可赋予对5-甲基色氨酸的抗性。使用突变的EPSP合酶基因时，通过整合合适的质体运输肽(CTP)可实现额外的益处。
能够在选择转化体的系统中使用的可选择标记基因的说明性的实施方案是编码phosphinothricin乙酰基转移酶的基因，例如来源于吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来源于绿色产色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利5,550,318，其在此引入作为参考)。Phosphinothricin乙酰基转移酶(PAT)使杀虫剂bialaphos，phosphinothricin(PPT)中的活性成分失活。PPT抑制谷氨酰胺合酶，(Murakami等人，Mol.Gen.Genet.，20542(1986)；Twell等人，Plant Physiol.，911270(1989))导致氨的迅速积累和细胞死亡。
可使用的选择性标记包括但不限于，β-葡醛糖酸糖苷酶或uidA基因(GUS)，已知其编码各种发色底物的酶；R-基因座基因，其编码的产物调控植物组织中花色素苷色素(红色)的产量(Dellaporta等人，染色体结构和功能，第263-282页(1988))；β-内酰胺酶基因(Sutcliffe，Proc.Nat.Acad.Sci.(U.S.A.)，753737(1978))，已知其编码各种发色底物的酶(例如，PADAC，生色的头孢菌素)；xylE基因(Zukowsky等人，Proc.Nat.Acad.Sci.(U.S.A.)，801101(1983))编码儿茶酚双加氧酶可转换生色的儿茶酚；α-淀粉酶基因(Ikuta等人，Biotech.，8241(1990))；酪氨酸酶基因(Katz等人，J.Gen.Microbiol.，1292703(1983))，其编码的酶可以氧化酪氨酸为DOPA和多巴醌，其依次可浓缩形成易检测的化合物黑色素；β-半乳糖苷酶基因，已知其编码各种发色底物的酶；萤光素酶(lux)基因(Ow等人，Science，234856(1986))，其可用生物发光检测；或甚至是水母发光蛋白质基因(Prasher等人，Biochem.Biophys.Res.Comm.，1261259(1985))，它可用于钙敏感的生物发光检测，或绿色荧光蛋白基因(Niedz等人，Plant Cell Reports，14403(1995))。转化细胞中lux基因的存在可使用例如X射线胶片，闪烁计数，荧光分光光度测定法，低光视频照相机，光子计数照相机，或多维发光仪(multiwell luminometry)检测。预想也可发展这个系统以用于生物发光的群体筛选，例如在组织培养平板上，或甚至在整个植株中筛选。
另外，也可构建转基因，用于提供将基因产物导向植物细胞内的胞内部分或指导蛋白进入胞外环境。这通常通过连接编码运输或信号肽的DNA序列和编码特定基因的序列而实现。所得的运输或信号肽将分别把蛋白运输到特定的细胞内或细胞外的目的地，并且可在翻译后除去。运输或信号肽有助于运输蛋白通过细胞内的膜，例如，液泡、小泡、质体和线粒体膜，而信号肽指导蛋白通过胞外膜。通过协助蛋白进入细胞内或细胞外的区室，这些序列增强了基因产物的积累。
这种用法的特定实例是关于指导邻氨基苯甲酸合酶进入，例如质体而非细胞质的特定的细胞器。使用拟南芥SSU 1A运输肽赋予蛋白特异性导向质体作为例证性说明。可选地，转基因也可包括编码质体运输肽的DNA序列或编码rbcS(RuBISCO)运输肽的DNA序列，其可操作地连接启动子和编码邻氨基苯甲酸合酶的DNA序列。(关于质体导向肽的综述，见Heijne等人，Eur.J.Biochem.，180535(1989)；Keegstra等人，Ann.Rev.Plant Physiol.PlantMol.Biol.，40471(1989))。如果转基因被导入植物细胞，转基因也可包含植物转录终止和多聚腺苷酸化信号和翻译信号，以及连接植物邻氨基苯甲酸合酶基因的3′末端的翻译信号。
可以使用外源质体运输肽，其不在天然的植物邻氨基苯甲酸合酶基因内被编码。质体运输肽一般长度为40-70个氨基酸，功能是翻译后指导蛋白进入质体。运输肽在进入质体产生成熟蛋白的过程中或之后切除。编码植物邻氨基苯甲酸合酶的基因的完整拷贝含有质体运输肽。那种情况下，就没必要将外源获得的质体运输肽序列结合到转基因中。
可以从各种植物核基因中获得外源运输肽编码序列，只要基因的产物表达为含有氨基端运输肽的前蛋白并运输到质体中。已知的植物基因产物的实例包括这种运输肽序列，包括但不限于，核酮糖二磷酸羧化酶的小亚基，叶绿素a/b结合蛋白，由核基因编码的质体核糖体蛋白，某些热休克蛋白，氨基酸生物合酶，例如乙酰乳酸合酶，3-烯醇丙酮磷酸莽草盐(3-enolpyruvylphosphos hikimate)合酶，二氢吡啶二羧酸合酶，邻氨基苯甲酸合酶等的氨基酸。在一些情况中，质体运输肽蛋白可能在感兴趣的邻氨基苯甲酸合酶基因中编码，其中就不必要添加这种质体运输序列。可选地，编码运输肽的DNA片段可从例如上面所列出的运输肽的已知序列整个地或部分地化学合成，。
不管编码运输肽的DNA片段的来源，它必须包括例如ATG密码子的翻译起始密码子，和表达在宿主植物的质体中可识别的和发挥合适作用的氨基酸序列。也必须关注运输肽和邻氨基苯甲酸合酶之间连接的氨基酸序列，其可切除产生成熟的酶。已经鉴别了一些保守的氨基酸序列，并可作为指导路线。运输肽编码序列和邻氨基苯甲酸合酶编码序列的精确融合可能需要处理一个或两个DNA序列以引入，例如方便的限制性酶切位点。这可通过定点突变，化学合成的寡核苷接头的插入等方法实现。
编码质体运输肽的核酸的精确融合是不必要的，只要编码质体运输肽的序列在编码邻氨基苯甲酸合酶的序列框内。例如，经常可以包括附加的肽或氨基酸而对感兴趣的蛋白的表达或定位无反作用。
一旦获得质体运输肽序列，可适宜地与启动子和邻氨基苯甲酸合酶编码区根据标准方法在转基因中连接。可构建在植物细胞中起作用和在下游具有多克隆位点的质粒或从商业来源获得。采用限制性酶将质体运输肽序列插入启动子的下游。邻氨基苯甲酸合酶的编码区可在翻译后融合或立即插入质体运输肽序列的3′末端的下游和框架内。因此，质体运输肽优先与邻氨基苯甲酸合酶的氨基端连接。一旦形成，将转基因亚克隆到其他的质粒或载体中。
除了核植物转化以外，本发明也提供植物质体基因组的转化。因此，将基因产物导向植物细胞内的胞内区室，可通过指导基因进入胞内部分获得。质体基因组的直接转化比核转化更好。例如，直接的质体转化邻氨基苯甲酸合酶相对于核转化消除了对质体靶肽和翻译后的运输以及前体蛋白的处理过程的需要。在P.Maliga，Current Opinion in Plant Biology，5164-172(2002)，P.B.Heifetz，Biochimie，82655-666(2000)，R.Bock.，J.Mol.Biol.，312425-438(2001)，和H.Daniell等人，Trends in Plant Science，784-91(2002)中描述了植物的质体转化，在此作为参考。
构建了含有邻氨基苯甲酸合酶基因的转基因后，将盒导入植物细胞中。根据植物细胞的类型，基因表达的水平和基因编码酶的活性，将编码邻氨基苯甲酸合酶的DNA导入植物细胞可导致色氨酸的过量产生，赋予对色氨酸的氨基酸类似物，例如5-甲基色氨酸或6-甲基邻氨基苯甲酸的耐受性，和/或另外改变植物细胞中的色氨酸含量。
宿主细胞的转化将包含邻氨基苯甲酸合酶基因的转基因亚克隆到已知的表达载体中，检测和/或定量AS的表达。这种筛选方法对于鉴定提供邻氨基苯甲酸合酶基因的表达的转基因，和邻氨基苯甲酸合酶在转化植物细胞的质体中的表达是有用的。
质粒载体包括附加的DNA序列，其提供简便的筛选，扩增和在原核和真核细胞中转化转基因，例如，pUC-衍生载体，pSK-衍生载体，pGEM-衍生载体，pSP-衍生载体，或pBS-衍生载体。附加的DNA序列包括提供载体自我复制的复制原点，可选择的标记基因，优选编码抗生素或杀虫剂抗性，提供多位点以便在转基因中插入DNA序列或编码的基因的独特的多克隆位点，以及增强原核和真核细胞转化的序列。
可用于植物和原核细胞中表达的另外的载体是二元的Ti质粒(如在Schilperoort等人，美国专利4,940,838中所公开的)，以载体pGA582例证说明。二元的Ti质粒已经被在前引用的An鉴定。二元的Ti质粒可在原核细菌，例如大肠杆菌和农杆菌中复制。衣杆菌质粒载体可用于传递转基因进入植物细胞中。二元的Ti载体优选包括提供有效的植物细胞转化的胭脂氨酸TDNA的左右边界，可选择标记基因，T边界区独特的多克隆位点，colE1复制原点和野生型宿主区域的复制子。携带本发明的转基因的二元Ti载体可用于原核和真核细胞的转化，但优选用于转化植物细胞。参见例如，Glassman等人，美国专利5,258,300。
通过适用的方法将表达载体导入原核或真核细胞。对于单子叶和双子叶植物特别有效的转化方法，包括但不限于，微粒轰击未成熟胚胎(美国专利5,990,390)或II型胚胎发生的愈伤组织细胞，如W.J.Gordon-Kamm等人(Plant Cell，2603(1990))，M.E.Fromm等人Bio/Technology，8833(1990))和D.A.Walters等人(Plant Molecular Biology，18189(1992))所描述的，或电穿孔I型胚胎发生的愈伤组织，如D′Halluin等人(The Plant Cell，41495(1992))，或Krzyzek(美国专利5,384,253)所描述的。通过与DNA包被的钨须漩涡转化植物细胞(Coffee等人，美国专利5,302,523)和使用含有DNA的脂质体转化细胞。
所选择的邻氨基苯甲酸合酶构建体转化细胞后，宿主细胞可用于由转基因的邻氨基苯甲酸合酶结合宿主酶促机制产生有用产物的生产。培养转化细胞导致升高的色氨酸产量和其他有用的化合物，其可以从细胞或培养基中获得。在各种宿主细胞和/或生物体中表达产生的有用化合物的实例，包括色氨酸，吲哚乙酸和其他植物激素，在大豆中发现的对心血管健康很重要的异类黄酮化合物，玉米中作为食草昆虫天敌的信号的挥发性吲哚，抗癌剂，例如十字花科(cruciferae)植物家族中的吲哚芥子油苷(glucosinolate)(吲哚-3-甲醇)，和吲哚生物碱，例如某些真菌产生的麦角化合物。(Barnes等人，Adv ExpMed Biol，40187(1996)；Frey等人，Proc Natl Acad. Sci.，9714801(2000)；Muller等人，Biol.Chem.，381679(2000)；Mantegani等人，Farmaco，54288(1999)；Zeligs，J Med Food，167(1998)；Mash等人，Ann NY Acad Sci.，844274(1998)；Melanson等人，Proc Natl Acad.Sci.，9413345(1997)；Broadbent等人，Curr Med Chem.，5469(1998))。
色氨酸的积累导致微生物和植物中次级代谢产物增加，例如，含有例如植物中简单的吲哚，吲哚共轭物，吲哚生物碱，吲哚植物抗毒素和吲哚芥子油苷的代谢产物的吲哚。
对色氨酸不敏感的邻氨基苯甲酸合酶有可能由于色氨酸经分支酸变位酶刺激合成苯基丙氨酸，而增加各种分支酸衍生的代谢物，包括那些衍生自苯基丙氨酸的代谢物。参见Siehl，D.来自分支酸的色氨酸、酪氨酸和苯基丙氨酸的生物合成，″植物氨基酸生物化学和生物技术″，BK Singh编辑，第171-204页。当存在反馈不敏感的邻氨基苯甲酸合酶时，其他分支酸衍生的代谢物可能增加，包括苯丙醇，类黄酮和异类黄酮，以及衍生自邻氨基苯甲酸的代谢物，例如吲哚，吲哚生物碱和吲哚芥子油苷。这些化合物中的许多种是重要的植物激素，植物防御化合物，各种健康状态的化学防护试剂，和/或药物活性的化合物。
由于邻氨基苯甲酸合酶的表达而增强合成的这些化合物的范围依赖于表达邻氨基苯甲酸合酶的生物体。本领域的技术人员可轻易地评估哪种和/或测定生物体和宿主细胞可用于产生所需要的化合物。本发明也包括在各种生物体，包括植物，微生物，真菌，酵母，细菌，昆虫细胞和哺乳动物细胞中合成色氨酸和其他有用的化合物。
筛选色氨酸过量产生的细胞系的策略利用组织培养技术对所需要的色氨酸类似物抗性，色氨酸过量产生的变异体的有效筛选，需要仔细的确定筛选的条件。优化这些条件以容许在培养物中生长和积累色氨酸类似物抗性的、色氨酸过量产生的细胞，同时抑制大量细胞群的生长。由于个体细胞在种群中的存活力高度依赖于邻近细胞的存活力，这使得情况变得复杂。
通过化合物与组织相互作用的特征确定细胞培养物暴露于色氨酸类似物下的状况。要考虑例如毒性的程度和抑制的速率这类因素。培养物中细胞化合物的积累，培养基和细胞中化合物的持续和稳定，都需要同吸收和传递给所需要的细胞部分的程度一起考虑。可选地，测定加入色氨酸是否逆转化合物的作用也很重要。
要仔细评价类似物对于培养物的存活力和形态学的影响。特别重要的是选择对培养的植物再生能力没有影响的暴露于类似物的条件。对类似物暴露条件的选择也受到类似物是否杀死细胞或只是抑制细胞分化的影响。
筛选方案的选择依赖于上面提到的考虑因素。下面简要描述的方案可用于筛选过程。例如，为了选择对色氨酸类似物的生长抑制有抗性的细胞，将在培养物的悬浮液中很好分化的细胞在短时间内暴露在高水平的色氨酸类似物下。回收和蓄积存活的细胞，并随后再暴露更长时间。可选地，有组织的部分分化的细胞培养物伴随连续的暴露在最初低水平的色氨酸类似物下生长和传代培养。经过几次传代培养间隔后浓度逐渐增加。在筛选过程中使用这些方案时，本发明并不仅限于这些过程。
植物修饰的基因如上所描述的，在本发明的转基因，载体和植物中，作为可选择的标记基因和报道基因的基因可操作地与编码邻氨基苯甲酸合酶或其结构域的DNA序列连接。另外，可以将其他农艺学的性状加到本发明的转基因，载体和植物中。这些性状包括但不限于，昆虫抗性或耐受性；疾病抗性或耐受性(病毒，细菌，真菌，线虫类)；胁迫抗性或耐受性，例证说明的有抗或耐受干旱，热，冷，冰冻，过量潮湿，盐胁迫，氧化胁迫，增加的产量，食物含量和组成，物理表现，雄性不育，干燥，群从能力(standability)，繁殖力，淀粉特性，油的数量和质量等。可整合一个或多个赋予本发明的植物这些性状的基因。
昆虫抗性或耐受性苏云金芽孢杆菌(Bacillus thuringiensis或″Bt″)包括近20种已知亚类的细菌，其产生的内毒素多肽被多种昆虫摄入时是有毒的。内毒素蛋白(Bt蛋白)和相应的基因(Bt基因)的生物学和分子生物学在H.R.Whitely等人，Ann.Rev.Microbiol.，40549(1986)和H.Hofte等人，Microbiol.Rev.，53242(1989)中有评述。已经克隆和测序了各种Bt蛋白的编码基因。Bt多肽的片段对于各种鳞翅目(Lepidoptera)害虫的毒性是本质上的，并占大约Bt多肽分子首要(first)的50％。因此，截短的Bt基因编码的截短的Bt多肽在多数时候保留了对多种鳞翅目昆虫的毒性。例如HD73和HD1 Bt多肽显示对美国植物中的重要鳞翅类害虫幼虫的毒性，例如欧洲玉米螟(borer)，切根虫(cut worms)和螟蛉(earworms)。M.Geiser等人，Gene，48109(1986)和M.J.Adang等人，Gene，36289(1985)各自克隆和测序了编码HD73和HD1 Bt多肽的编码基因，其可从采用标准方法收集的培养物(例如，Bacillus Genetic Stock Center，Columbus，OH or USDA Bt stock collection Peoria，IL)中获得的HD73和HD1菌株中克隆。例如在美国专利6,329,574；6,303,364；6,320,100和6,331,655中描述了Bt基因和多肽。
编码新的、以前未表征的Bt毒素的DNA可从宿主芽孢杆菌(Bacillus)生物体中采用以前克隆Bt基因的步骤克隆得到，也可以产生Bt毒素的新的合成形式。
用于本发明的Bt基因包括5′DNA序列，其含有在植物中允许下游的Bt序列转录和翻译起始的DNA序列。Bt基因也包含3′DNA序列，它包括来源于可在感兴趣植物中表达的基因的3′非编码区的序列。Bt基因也包括编码苏云金芽孢杆菌产生的毒性Bt多肽或其毒性部分或具有的基本氨基序列的同源物的DNA序列。Bt编码序列可包括(i)编码与Bt内毒素基本上同源的杀虫剂蛋白的DNA序列，它对感兴趣植物的有害昆虫有活性，例如HD73或HD1 Bt序列；(ii)编码Bt内毒素多肽的杀虫剂活性的片段的序列，例如杀虫剂活性的HD73或HD1多肽的从羧基和/或氨基端截短的形式；和/或(iii)在框内与编码提供附加优点的多肽融合的截短的Bt序列，所附加的优点例如(a)可选择的基因，例如，赋予抗生素或杀虫剂抗性的基因，(b)其产物易检测和分析的报道基因，例如，荧光蛋白或β-葡萄糖苷酶；(c)编码具有一些附加用途的多肽序列的DNA序列，该附加用途是稳定Bt蛋白不被降解或增强Bt蛋白对昆虫的有效性，例如蛋白酶抑制剂；和(d)协助指导Bt蛋白进入植物细胞特定的部分内或外的序列，例如信号序列。
为了在植物中获得Bt蛋白的优化合成，也可以适当调节Bt基因的DNA序列，使基因在感兴趣的植物中更加有效的表达。由于Bt基因的密码子使用与感兴趣植物中表达的基因所使用的不同，可以通过使用在植物中，例如经常在感兴趣的植物中使用的(见E.Murray等人，Nucl Acids Res.，l7477(1989))更加有效表达的密码子来取代这些密码子而增加Bt基因在植物细胞中的表达。这种密码子取代需要取代碱基但不改变最终Bt多肽的序列。Bt多肽序列可与细菌基因或其片段相同。含有比原始细菌的基因更加优选的密码子的完整的Bt编码序列或其部分，可通过采用标准的化学合成方法合成，并且采用标准方法导入或组装Bt基因，例如定点突变或DNA聚合和连接等。
蛋白酶抑制剂可提供昆虫抗性。例如，使用来源于马铃薯或番茄的蛋白酶抑制剂II基因，pinII是非常有用的。组合使用pinII基因和Bt毒素基因也是有好处的。编码昆虫消化系统抑制剂的其他基因，或编码酶或有助于抑制剂产生的辅助因子的基因也很有用。这包括例如来源于小麦和大麦的水稻半胱氨酸蛋白酶(oryzacystatin)抑制剂和淀粉酶抑制剂。
编码凝集素的基因可赋予附加的或备选的杀虫剂特性。(Murdock等，Phytochemistry，29 85(1990)；Czapla和Lang，J.Econ.Entomol.，832480(1990)。也包括有用的外源凝集素基因，例如，大麦和小麦的胚凝集素(WGA)以及稻的外源凝集素(Gatehouse等人，J Sci Food Agric.，35373(1984))。
当被导入有害昆虫时，控制针对昆虫的大的或小的活性多肽，例如溶解酶的肽，肽激素和毒素和毒液的产量的基因都是很有用的。例如，保幼激素酯酶的表达直接导向特异性的有害昆虫，也可导致杀虫剂活性，或可导致变态的停止(Hammock等人，Nature，344458(1990))。
表达编码影响昆虫外皮(cutide)完整性的基因的转基因植物也是有用的。这些基因包括编码几丁质酶，蛋白酶，脂肪酶和产生三国霉素的基因。编码影响昆虫蜕皮活性的基因，如影响蜕皮素UDP-葡萄糖基转移酶产量的基因也是有用的。
编码促进减少植物对有害昆虫的营养品质的化合物的生产的酶的基因也是有用的。通过改变固醇成分可例如赋予植物杀虫剂活性。本发明进一步的实施方案涉及具有增强的脂肪氧化酶活性的转基因植物。
本发明也提供用于改变次级代谢物的方法和化合物。一个实例涉及改变植物产生DIMBOA，预期其可赋予对欧洲玉米螟，根虫和几种其他有害昆虫的抗性。参见例如，美国专利6,331,880。DIMBOA来源于吲哚相关的化合物。本发明提供的方法用于增强植物细胞和组织内类似色氨酸的吲哚相关地化合物含量。因此，根据本发明在此提供的方法也可增加DIMBOA的水平，因而增强对昆虫的抗性。
导入调控玉米可凝性球蛋白(maysin)产生的基因和涉及高粱中蜀黍苷产生的基因，都可分别用于促进对有害幼虫(earworm)和根虫的抗性。
也可使用编码具有潜在的杀虫剂活性的蛋白的更多基因。这种基因包括，例如，可用作根虫抑制剂的豇豆胰蛋白酶抑制剂(CpTI；Hilder等人，Nature，330160(1987))；证实可用于玉米根虫抑制剂(deterrent)的编码除虫菌素的基因(除虫菌素和阿巴美丁(Abamectin)，Campbell，W.C.，编辑.，1989；Ikeda等人，J Bacteriol，1695615 1987)；核糖体灭活蛋白基因；和调控植物结构的基因。转基因植物包括抗昆虫抗体基因和编码可将植物外用为非毒性杀虫剂(前杀虫剂)转化为植物内杀虫剂的酶的基因。
环境或胁迫抗性或耐受性可通过基因的表达影响植物对各种环境胁迫的耐受能力的提高。例如，对霜冻温度的增强抗性可通过导入“抗冻”蛋白，例如美洲拟鲽(WinterFlounder)(Cutler等人，J Plant Physiol.，135351(1989))或合成其基因衍生物而赋予。改善质体中甘油-3-磷酸乙酰基转移酶的表达可赋予增强的耐寒性(Wolter等人，The EMBO J.，114685(1992))。超氧化物歧化酶的表达可赋予对氧化胁迫的抗性(Gupta等人，Proc.Natl.Acad.Sci(U.S.A.)，901629(1993))，谷胱甘肽还原酶可改善对氧化胁迫的抗性(Bowler等人，Ann Rev.Plant Physiol.，4383(1992))。
预期影响植物的含水量，总的水压，渗透压和膨压的基因的表达增强植物对干旱的耐受性，并因此将是有用的。建议使用例如，编码用于渗透压活性溶质的生物合成的基因的表达可赋予抗干旱的保护。这类基因中有编码甘露醇脱氢酶(Lee和Saier，J.Bacteriol.，258，10761(1982))和海藻糖-6-磷酸合酶(Kaasen等人，J.Bacteriology，174889(1992))的基因。
类似地，其他代谢产物也可保护酶的功能或膜的完整性(Loomis等人，J.Expt.Zoology，2529(1989))，因此编码用于这些化合物的生物合成的基因可赋予以类似或补充甘露醇的方式的干旱抗性。天然产生的其他代谢物的实例是渗透压活性的，和/或在干旱和/或脱水过程中提供一些直接保护作用的，包括果糖，赤藓糖醇，山梨醇，卫矛醇，葡糖基甘油，蔗糖，水苏糖，棉子糖，脯氨酸，甘氨酸，甜菜碱，ononitol和松醇。参见例如，美国专利6,281,411。
根据结构的相似性可分为三种后期胚胎发生蛋白(见Dure等人，PlantMolecular Biology，12475(1989))。所有三种LEA组的结构基因的表达可赋予干旱耐受性。水胁迫过程中诱导的其他类型的蛋白可能是有用的，包括硫醇蛋白酶，醛缩酶和跨膜运输蛋白，在干旱胁迫中其可赋予各种保护性和/或修复功能。参见例如，PCT/CA99/00219(Na+/H+交换多肽基因)。影响脂质生物合成的基因也可用于赋予干旱抗性。
涉及特异的形态学性状，容许从干燥的土壤中增强水的提取的基因表达也是有用的。在胁迫过程中增强复制适应性的基因表达也是有用的。建议在胁迫过程中最小化核发育不全的基因表达将提高所收获的谷物的数量，因此是有价值的。
即使当土壤中的水不受限制时，通过导入和表达基因可使植物更有效地利用水从而增加总的产量。通过导入基因提高植物最大化利用水的能力，可克服涉及水的可获得性的所有胁迫范围，也可实现产量性能的稳定性或产量的连续性。
疾病抗性或耐受性可通过表达基因产生对病毒的抗性。例如，表达针对基本的病毒功能的反义基因或表达编码病毒外壳蛋白的基因可赋予对病毒的抗性。
通过导入基因赋予对细菌和真菌导致的疾病的抗性。例如，编码称作“肽抗生素”的基因，编码病原相关(PR)蛋白，毒素抗性和影响宿主病原体相互作用，例如形态学特征的蛋白的基因都是有用的。
真菌毒素的减少/消除由植物相关的真菌产生的真菌毒素，包括黄曲霉毒素和烟曲霉毒素(fumonisin)，是使得谷粒无用的一个重要因素。抑制这些真菌的生长可减少毒素物质的合成，从而减少由于真菌毒素污染造成的谷粒损失。可在植物中导入基因抑制真菌毒素的合成而不妨碍真菌的生长。此外，为了获得减少真菌毒素污染的谷粒，表达编码使得真菌毒素无毒性的酶的新基因也是有用的。
植物组合物或品质可以改变植物组合物，例如，通过各种方式改善氨基酸的平衡，包括增加天然蛋白的表达，降低不良组合物的表达，改变天然蛋白的组成，或导入编码完整的具有优越组成的新蛋白的基因。参见例如，美国专利6,160,208(种子储存蛋白表达的改变)。导入基因改变植物中油的含量是有价值的。参见例如，美国专利6,069,289和6,268,550(ACCase基因)。导入的基因可例如通过增加分枝的程度，通过延迟代谢导致母牛中增加对淀粉的利用，从而增强植物中淀粉含量的营养价值，。
植物农艺学的性状决定植物在何处生长的两个因素是生长季节过程中的平均日温度和霜冻间的时间长短。表达涉及调控植物发育的基因也许是有用的，例如，已经在谷物(corn)中鉴定的非舌叶(liguleless)和粗糙鞘基因。
导入玉米的基因将增强站立性和其他植物的生长特性。赋予更强壮的茎，改善的根系或防止或减少抽穗的额外损耗的基因表达对于农民来说都是有价值的。
营养利用利用可获得营养的能力是植物生长的一个限制因素。通过导入基因可改变营养的吸收，耐受pH的极限，植物中的流动，储存库，和代谢活动的有效性。这些修饰使得植物更加有效利用可获得的营养。例如，通常存在于植物中并涉及营养利用的酶的活性的增强可增强营养的有用性。这种酶的一个实例是植酸酶。
雄性不育雄性不育在生产杂交中有用，雄性不育可通过表达基因产生。可通过转化导入TURF-13而从疾病敏感性中分离出雄性不育。参见Levings，Science，250942-947，(1990)。对于育种的目的，有必要恢复雄性不育，可导入编码恢复雄性不育的基因。
抗性细胞系的筛选和表征当细胞或组织恢复到在通常的色氨酸类似物水平抑制存在下观察到生长良好就可以进行筛选。这些细胞“系”在色氨酸类似物存在下传代培养几次以去除非抗性细胞，然后进行表征。通过比较在各种浓度的色氨酸类似物存在下这些细胞系和未筛选细胞或组织的生长可确定所获得的抗性量。将所筛选的细胞系在没有色氨酸类似物存在下，简单培养不同的时间阶段，然后分析将组织再暴露在色氨酸类似物下的生长就可以评估培养细胞抗性的稳定性。也可以使用体外化学研究评估抗性细胞系来证实改变类似物的作用位点可形成对色氨酸类似物抑制的较少的敏感性。
在转化细胞中可测定和定量邻氨基苯甲酸合酶的瞬时表达。基因表达可通过RT-PCR分析，使用克隆的邻氨基苯甲酸合酶特异性抗体的Western印迹或通过检测在色氨酸或色氨酸的氨基酸类似物存在下酶的活性而定量。测定克隆的邻氨基苯甲酸合酶的组织和亚细胞定位可通过使用克隆的邻氨基苯甲酸合酶特异性抗体的免疫化学染色法或亚细胞的分级以及随后的生物化学和/或免疫学分析。也可以评估克隆的邻氨基苯甲酸合酶对试剂的敏感性。提供邻氨基苯甲酸合酶的表达或邻氨基苯甲酸合酶对色氨酸的氨基酸类似物或游离的L-色氨酸的抑制的耐受性的转基因可用于转化单子叶和/或双子叶植物组织细胞并产生转化的植物和种子。转化细胞可通过检测选择性标记基因或报道基因的存在，例如，通过检测选择性的除草剂抗性标记而筛选。邻氨基苯甲酸合酶基因在转基因的胚胎发生愈伤组织中的瞬时表达可使用对邻氨基苯甲酸合酶特异性的抗体或通过RT-PCR分析来检测。
植物再生和种子的生产转化的胚胎发生愈伤组织，分生组织，胚，叶盘等都可用于产生显示转化的邻氨基苯甲酸合酶基因稳定遗传的转基因植物。显示对色氨酸的氨基酸类似物的令人满意水平耐受性的植物细胞系可通过本领域已知的方法实行植物再生方案以获得成熟植物和表达耐受性性状的种子(例如，参见美国专利5,990,390和5,489,520；和Laursen等人，Plant Mol.Biol.，2451(1994))。植物再生方案可使体细胞胚发育并随后生长成根和苗。为了确定耐受性性状在植物分化器官中，而不仅只是在未分化的细胞培养物中表达，可分析再生植物相对于再生的非转化植物的植物各个部分的色氨酸存在水平。转基因植物和种子可从采用标准的方法显示出色氨酸含量或对色氨酸类似物的抗性变化的细胞和组织中产生。尤其优选色氨酸含量增强的叶片和种子。在抑制量的色氨酸或其类似物的存在下，酶特定活性的变化可通过检测转化细胞中的酶活性来测定，如Widholm，Biochimica et Biophysica Acta，27948(1972)中所描述的。通过如Jones等人，Analyst，106968(1981)所描述的标准方法检查总色氨酸含量的变化。
从已知表达性状的细胞系获得成熟的植物。如果可能的话，使再生植物自花授粉。另外，将来源于再生植物的花粉与具有农艺学上重要的自交系的种子所生长的植物进行杂交。在一些情况中，使用来源于自交系的花粉给再生植物授粉。通过评价第一代和后代的性状分离来遗传表征该性状。如果该性状是商业上有用的，组织培养物中所选择的植物性状的遗传可能性和表达是特别重要的。
如果各种不同杂交组合都可以得到的话，色氨酸过量产生的大豆，谷类和其他植物的商业价值是巨大的。农民一般根据成熟度，站立性或其他农艺学性状的差异种植多种杂交品种。另外，由于成熟度，疾病，和昆虫抗性的性状的差异，适应一部分地区的杂种并不适于其他部分。因此，有必要培育色氨酸过量产生的大量的亲本自交系以产生许多杂交组合。
通过杂交原始过量产生的品系与正常的原种品系以及将杂交后代与正常的亲本回交来进行转换过程(回交)。这种杂交的后代将进行分离以至于携带基因的植物负责过量生产，而另外一些则没有。携带这种基因的植物再次与正常的亲本杂交，导致在后代中再次分离出过量产生和正常产量的性状。不停重复直到原始正常的亲本转变成过量产生的品系，也具有在正常亲本中原始就有的其他重要的特性。对于每种原种品系都实现分离的回交方案，则可将其转换成色氨酸过量生产的品系。
回交后，新的过量产生的品系和合适品系的组合是具有很好的商业价值的杂种，评价其过量生产和其他一系列重要的农艺学性状。生产过量产生的品系和杂种，其是原始正常品系和杂种的纯种类型。这需要在一系列环境条件中评估哪些品系或杂种通常将用于大规模地生长。对于高水平色氨酸大豆的产生，需要杂种种子的两个亲本是纯合的高色氨酸的特征。增加表现令人满意的杂种的亲本品系并采用标准的杂种种子生产试验用于杂种的制备。
预计在此产生的转基因植物有益于各种商业和研究目的。可产生转基因植物用于传统的农艺学以具有对从植物中收获的谷粒的消费者有利的性状(例如，在人食物或动物饲料中增加营养含量)。在这种用途中，植物通常是为了人或动物食物中的谷物的用途而生长。然而，植物的其他部分，例如茎，外壳，营养性部分等都是有用的，包括用作动物饲料，发酵饲料，生物催化的一部分或观赏性的用途。
转基因植物也可用于商业上的蛋白或其他分子的生产，其中从植物部分，种子等中提取或纯化感兴趣的分子。也可体外培养、生长植物的细胞或组织，或发酵制备这种分子。
转基因植物也可用于商业上的育种项目，或杂交或培育相关农作物种类的植株。可以传递重组DNA编码的改进，例如，通过原生质体融合从大豆细胞传递到其他种类的细胞。
在一个实施方案中，含有玉米邻氨基苯甲酸α-结构域的转基因分离自对5-MT耐受的玉米品系，与35S CaMV启动子连接并且采用微粒轰击的方法导入5-MT敏感的单子叶或双子叶组织中。筛选出转化的胚胎或分生组织用于产生转基因植物。评估转化的愈伤组织和转基因的植物对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。
下面的实施例进一步阐述了本发明，但并不是为了限制本发明。
实施例1来自根瘤农杆菌的邻氨基苯甲酸合酶的分离和大肠杆菌表达该实施例描述了来自根瘤农杆菌的邻氨基苯甲酸合酶的分离及其在大肠杆菌中的表达。
根瘤农杆菌AS的克隆使用来自苜蓿中华根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸合酶编码区的核苷酸和氨基酸序列(GenBank登录号P15395)检索根瘤农杆菌C58基因组序列数据库(Goodner等人，科学Science，2942323-2328(2001))。该检索由利用blosum62矩阵的tblastn组成(Altschul等人，核酸研究Nucleic Acid Res.，253389-3402(1997))。
在根瘤农杆菌C58基因组序列数据库中鉴定的AS同系物，通过利用来自根瘤农杆菌菌株C58(ATCCNo.33970)的基因组DNA作为模板的PCR克隆。初级的PCR反应利用下列引物进行5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO47)；和5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO48)。
基因扩增参数如下(a)95℃变性30秒，(b)50℃退火30秒，以及(c)根据制造商的指导，利用扩展高保真PCR(Roche Biochemicals)在72℃延伸2分钟。
附加一轮的PCR扩增产生大约2.3Kb长度的产物，该反应利用上述的扩增模板和下列成套引物5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO49)；和5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO50)。
将纯化的PCR产物连接到pGEM-Teasy(Promega Biotech)中从而得到质粒pMON61600(图1)。pMON61600利用标准的测序方法测序。正确序列的确认是通过与苜蓿中华根瘤菌邻氨基苯甲酸合酶的序列(图2)比较而获得的。来自分离克隆的翻译的氨基酸序列(SEQ ID NO4)与苜蓿中华根瘤菌酶(SEQID NO7)(图2)享有88％的同一性。缩写″AgroAS″或根瘤农杆菌AS有时在此用于指根瘤农杆菌的邻氨基苯甲酸合酶。
根瘤农杆菌AS的大肠杆菌表达构建下列载体以便于将根瘤农杆菌AS基因亚克隆到合适的表达载体中。
利用pMON61600作为模板和下列引物产生2215碱基对的PCR片段5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′(SEQ ID NO51)；和5′-AAAAGAATTCTTATCACGCGGCCTTGGTCTTCGCC-3′(SEQ ID NO52)。
质粒pMON61600用限制性内切酶NcoI和RsrII消化。另外，将409bp的片段(通过用NcoI和RsrII消化2215碱基对的PCR产物产生)随后连接到消化的pMON61600质粒中，从而替换NcoI/RsrII片段，并在具有根瘤农杆菌AS翻译起始密码子(ATG)的框内得到NcoI位点，以产生质粒pMON34692(图3)。
碱基T7大肠杆菌表达质粒，pMON34697(图4)，是通过用SphI和BamHI限制性消化pET30a(NoVogen公司)而产生的。纯化所得到的4,969bp片段并用来自pET11d(NoVogen公司)的338bp的SphI和BamHI片段亚克隆。
质粒pMON34705(图5)通过用NcoI和SacI限制性消化pMON34697而产生。然后纯化所得到的5,263bp片段并连接来自包含根瘤农杆菌AS的pMON34692的2,256bp的NcoI和SacI片段。
根据制造商的指导说明(Novogen公司)，将质粒pMON34705转化入大肠杆菌BL21(DE3)(F-ompTHsdSb(rB-mB-)gal dcm(DE3))。DE3是包含受控制于异丙基-1-硫代-D-半乳糖苷(IPTG)诱导的lacUV5的T7 RNA聚合酶的染色体拷贝的λDE3的宿主溶菌原。
在已经于37℃培养过夜(10小时)的卡那霉素平板上筛选转化细胞。将单克隆转入2ml的LB(Luria液体培养基；每升10g胰蛋白胨，5g酵母提取物，10gNaCl，和1g葡萄糖(任选的))或2×-YT液体培养基(每升16g胰蛋白胨，10g酵母提取物，5gNaCl)，然后放入37℃的培养箱中在225rpm摇动3小时。移出细胞并在培养物中加入4μL的100mM IPTG，再放回37℃培养箱补充培养2-3小时。移出1mL等分的细胞，并在超声缓冲液(50mM磷酸钾(pH7.3)，10％甘油，10mM 2-巯基乙醇和10mM MgCl2)中超声处理。所得到的裂解细胞提取物是用于如下所述的标准AS分析的原材料。结果证实以质粒pMON34705为基础的表达体系能够生产可溶解的和酶促活性的根瘤农杆菌AS蛋白质，其数量是总的可溶解的提取蛋白质的大约50％。
实施例2通过用野生型的农杆菌邻氨基苯甲酸合酶转化植物获得高Trp种子水平。
表达载体pMON58120载体pMON58120(图34)编码264碱基对的拟南芥小亚基(SSU)叶绿体靶肽(CTP，SEQ ID NO71)和2187碱基对的野生型农杆菌(Agrobacterium)邻氨基苯甲酸合酶(AgroAS)开放阅读框(SEQ ID NO1)间的融合体。参见，Stark等人，(1992)科学Science，258287。开放阅读框的表达是由大豆7Sα初级(7Sα′)启动子驱动的。
当在细胞质核糖体上翻译时，融合体(不成熟的蛋白质)进入到叶绿体中，其中除去了叶绿体靶序列。在CTP1中存在2个切割位点。第一个位点是CDS起始(C/M)上游的30个碱基对，而另一个是起始的甲硫氨酸(C/M)。第二切割位点看来不进行有效地加工。预测该切割产生通过酶活性数据和trp效能数据所显示的具有AS活性的大约70Kd的成熟蛋白质。
AS基因用赋予草甘膦抗性的合成CP4基因转化，然而CP4基因是从AS基因单独加工出来的。CP4基因的表达由FMV启动子驱动，该启动子是来自玄参(Figwort)花叶病毒的35S启动子。草甘膦抗性提供了转化植物的筛选。
AS蛋白质的Western分析分析pMON58120的35个转化事件中AgroAS蛋白质的存在。AgroAS蛋白质用兔抗纯化的His标记的AgroAS激发的多克隆抗体检测。使用His-标记的全长Agro-AS多肽作为抗原，由CoCalico Biological公司在兔中产生多克隆抗体群。将重组His标记的Agro-AS DNA置入pMON34701(pet-30a-agroAS)表达载体。His-AgroAS融合蛋白质在大肠杆菌BL21(DE3)中表达，并通过Ni-NTA树脂系统(Qiagen方法)纯化。对于western分析，使用1∶5,000稀释的兔抗-AgroAS初级抗体。其次使用1∶5,000稀释的山羊抗-兔碱性磷酸酶-共轭的抗体。在携带7Sα′-Agro AS基因的转基因品系中，western印迹分析一致显示存在特异地与抗-AgroAS抗体交叉反应的单个条带。没有在非转基因的对照品系中检测到该条带。
大豆和拟南芥种子的游离氨基酸分析氨基酸提取将大约50mg碾碎的大豆种子(5mg拟南芥)材料置于各自的离心管中。将1毫升的5％三氯乙酸加入各个样品(对于拟南芥为100μl)。涡旋样品，并在室温下搁置搅动15分钟。然后在14000rpm微离心15分钟。除去一些上清液，放入HPLC管并密封。样品在4℃保存有待排列分析。
氨基酸分析用于氨基酸分析的试剂包括硼酸盐缓冲液(水中0.4N，pH10.2)中的OPA试剂(含邻苯二醛和3-巯基丙酸的硼酸盐缓冲液Hewlett-Packard，PN 5061-3335))。利用如2000年3月17日的Agilent技术出版物，″利用Zorbax Eclipse-AAA柱和Agilent 1100系列HPLC的氨基酸分析″所描述的Agilent 1100系列HPLC系统进行分析。最初，用10μl硼酸盐缓冲液中的2.5μl OPA试剂诱导(derivatized)0.5μl的样品。其次，将该诱导衍生物用1.2ml/min的流速注射到Eclipse XDB-C18 5μm，4.6×150mm柱上。利用在340nm激发，在450nm发射的荧光测量氨基酸浓度。用HPLC缓冲液A和B的梯度根据表A进行洗提，其中HPLC缓冲液A是40mM Na2HPO4，pH＝7.8，而HPLC缓冲液B是9∶9∶2∷甲醇∶乙腈∶水。
表A氨基酸洗提
从干的化学药品，利用感兴趣的所有氨基酸制备氨基酸标准。脯氨酸分析需要使用9-芴甲基-氯甲酸酯(FMOC)的附加衍生步骤。氨基酸标准有时也以0-100μg/ml的浓度范围购买。样品以μg/g的种子粉末报告。
野生型农杆菌邻氨基苯甲酸合酶在拟南芥中的表达将载体pMON58120通过次级荧光的真空渗入转化拟南芥植株，并且容许植株产生转基因的种子。收集种子并以存在可选择的标记物(草甘膦抗性)进行筛选。草甘膦抗性植物生长成熟并且从各个植物收集种子，其中该植株指明为转化事件，并且分析色氨酸含量(表B)。如表B所示，也在成熟种子中通过Western印迹分析，分析所选择转化事件中表达农杆菌邻氨基苯甲酸合酶蛋白质的存在。
表B转化体的分析
野生型农杆菌邻氨基苯甲酸合酶在大豆(Glycine Max)中的表达分析35个大豆转化事件中，33个具有增加的种子trp水平，例如，从上述的500ppm达到12,000ppm。在非转基因的大豆种子中，trp水平小于200ppm。包含高数量trp的所有种子通过western印迹证明邻氨基苯甲酸合酶蛋白质的表达。表C显示包含高trp水平以及通过western印迹分析邻氨基苯甲酸合酶蛋白质，同时也为邻氨基苯甲酸合酶阳性的19个大豆事件的数据。
表C具有pMON58120的19个大豆转基因事件中AgroAS蛋白质的存在和色氨酸水平之间的相关性
Agro AS的酶测定在携带pMON58120构建体的11个转化事件中测量邻氨基苯甲酸合酶的特异活性。利用基于HPLC的终点分析根据C.Paulsen(J.Chromatogr.，547155-160(1991))所描述的方法分析个别的大豆未成熟种子。简要地，从碾磨缓冲液(100mM Tris pH7.5，10％甘油，1mM EDTA，1mM DTT)中的单个种子产生脱盐提取物并用反应缓冲液(100mM tris pH7.5，1mM分支酸，20mM谷氨酰胺和10mM MgCl2)培育30分钟。在存在或缺少25mM trp时测量AgroAS活性。反应用磷酸终止并且通过HPLC利用设置在340nm/激发和410nm/发射的荧光检测器定量所形成的邻氨基苯甲酸的数值。
不成熟的分离的转基因种子中AS的特异活性与非转基因对照相比，增加1.5倍到70倍，达到高达6,000pmoles/mg/min。如表D的最后一列所示，转基因植物中的邻氨基苯甲酸合酶活性是抗色氨酸抑制的(参见表D)。
表D转基因事件20576中的Agro AS酶活性
实施例3用包含玉米邻氨基苯甲酸合酶α-亚基基因的载体转化大豆玉米邻氨基苯甲酸合酶α-亚基的编码序列通过用XbaI组合部分的NcoI消化而从pMON52214(图22)分离(参见Anderson等人，美国专利号6,118,047)。所得到的表示邻氨基苯甲酸合酶α编码区的1952bp的DNA片段用凝胶纯化，并制备成平末端。质粒pMON53901(图23)用BglII和EcoRI消化，以产生6.8Kb的片段。分离后，使6.8Kb片段的末端钝化并脱磷酸化。然后将包含ASα基因的1952Kb的片段连接平末端的6.8Kbp的MON53901片段以产生pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR表达载体(图24)。
该pMON39324，玉米7S启动子-玉米ASα-NOS3′UTR盒，随后用BamHI消化获得包含7S启动子和玉米ASα编码序列的2.84Kb的DNA片段。质粒pMON39322(图25)用BamHI消化获得5.88kb的DNA片段。然后将这2个片段连接在一起以产生pMON39325(图26)，亚克隆成为pMON39322的包含7S启动子-玉米ASα-NOS3′UTR盒的转化载体。
利用类似的方法，从USP启动子的下游克隆玉米邻氨基苯甲酸合酶α-亚基的编码序列，以产生pMON58130表达载体，从Arc5启动子的下游克隆产生pMON69662表达载体，从Lea9启动子下游克隆产生pMON69650表达载体，以及从Per1启动子的下游克隆产生pMON69651表达载体。这些表达载体的列表如表E所示。
表EC28-玉米邻氨基苯甲酸合酶的构建体
这些载体用于植物转化和繁殖实验。如在此所描述的，大豆植株用包含玉米AS的载体利用微粒子轰击技术转化。对于每种类型的载体分别建立几个转基因的大豆品系，并且通过表E中所标明的世代数目来繁殖。
例如，建立3个携带pMON39325的7Sα′-玉米AS转化基因的纯合系。这3个系在2个不同的场所随机分组设计生长。产生成熟的种子并且分析游离氨基酸的含量。包括对照以建立基线的trp水平，即3个相应阴性的等值线和非转基因的对照。
表F提供pMON39325转化体和对照系的R4种子中ppm的色氨酸，显示非转基因大豆平均包含大约100-200μg色氨酸种子粉末，而pMON39325转化体基本上包含更多的Trp。也参见，图27。
表F用C28玉米突变体(pMON39325)转化的大豆植株种子中的色氨酸水平
用在5个不同启动子的控制下表达C28玉米邻氨基苯甲酸合酶的5个其他构建体转化大豆(表E)，并获得转基因植株。各个构建体都产生高trp的结果。由Per1-C28玉米邻氨基苯甲酸合酶产生的实施例说明的结果显示在表G和H中。
表G3个具有Per1-C28玉米AS(pMON69651)的转基因事件中C28玉米AS蛋白质表达与增加的Trp水平相关
表H说明用pMON69651表达载体转化大豆植株，R1种子中C28玉米AS的酶活性。
表HpMON69651转化体的R1种子中C28玉米AS的特异活性
这些结果表明当大豆植物组织用C28玉米AS基因转化时，色氨酸有显著的增加。
表G中显示的高色氨酸水平与AS蛋白质的存在和转基因酶的增加的特异活性(比非转基因对照中高2.5倍)有关(表H)。如表H所示-以及根据C28玉米AS酶的生物化学特性所预测的-转基因事件的特异活性是色氨酸-抗性的。
实施例4根瘤农杆菌邻氨基苯甲酸合酶色氨酸反馈不敏感的突变体的合理设计该实施例描述包含对色氨酸或色氨酸类似物的反馈抑制具有各种灵敏度或不敏感的突变的根瘤农杆菌邻氨基苯甲酸合酶的载体。
根瘤农杆菌突变的邻氨基苯甲酸合酶基因的产生利用硫磺矿硫化叶菌(Solfulobus solfataricus)的邻氨基苯甲酸合酶蛋白质结构信息作为指导(Knochel等人，Proc.Natl.Acad.Sci.(美国)，969479-9484(1999))，利用蛋白质信息学确信指定几个涉及色氨酸结合的残基，合理设计几个根瘤农杆菌邻氨基苯甲酸合酶突变体。这通过将根瘤农杆菌邻氨基苯甲酸合酶基因与硫磺矿硫化叶菌的邻氨基苯甲酸合酶氨基酸序列进行序列对比而实现(图6)。根瘤农杆菌假定的色氨酸结合和催化域是通过结合对序列同源性的结构信息的认识而指定的。确定结合袋中的残基是可用于改变以提供对色氨酸反馈抑制的抗性的潜在候选物。
根据硫磺矿硫化叶菌邻氨基苯甲酸合酶的结构分析，表明氨基酸E30，S31，I32，S42，V43，N204，P205，M209，F210，G221和A373涉及色氨酸结合。根据成对地序列对比，硫磺矿硫化叶菌的N204，P205和F210在单体的根瘤农杆菌邻氨基苯甲酸合酶中分别为残基N292，P293和F298，也是保守的。
然而，由于多重插入和缺失，硫磺矿硫化叶菌和根瘤农杆菌酶的N-末端区是高度离散的。因此，必须在根瘤农杆菌邻氨基苯甲酸合酶涉及色氨酸调控的N-末端区域人工指定残基(图6)。结构分析表明基序″LLES″在色氨酸结合袋中形成β折叠(β-sheet)。该结构在异四聚体酶中看来似乎是高度保守的。然后将已知的单体酶利用″LLES″基序作为界标人工序列对比于硫磺矿硫化叶菌序列(图21)。根据蛋白质信息学分析，根瘤农杆菌AS中的氨基酸残基V48，S50，S51和N52也可能涉及色氨酸结合。
随着在根瘤农杆菌单体的酶中指定假定的色氨酸结合残基，合理化几个独特策略以用于减少该酶对色氨酸抑制的敏感性。这些置换包括例如，扩大色氨酸-结合袋(F298A)，窄化结合袋(V48F，V48Y，S51F，S51C，N52F，F298W)，增加结合袋的极性(S50K)，或通过改变蛋白质主链的构象扭曲结合袋的形状(P293A，P29G)。
根瘤农杆菌AS的定点诱变使用定点诱变产生10个单一氨基酸置换的6个位点。利用QuikChangeTM定点诱变试剂盒(Stratagene)将突变导入pMON34705中的根瘤农杆菌AS。用于定点诱变的引物是SEQ ID NOs9-42(图7；F＝正向，R＝反向)。每个引物序列特异地用于在序列中的特异位点改变核酸，并因此改变编码的密码子，用于编码新的氨基酸。例如，S51C指明在根瘤农杆菌AS肽序列51位的氨基酸，从丝氨酸变化为半胱氨酸。
诱变后再确认全部基因的序列并且表达变体以及如下列用于野生型酶所描述的，从大肠杆菌纯化。将所得到的包括突变的根瘤农杆菌AS的质粒利用如实施例1所描述的T7表达系统，合适地克隆到用于过量生产蛋白质的质粒中。
根瘤农杆菌AS蛋白质的表达和纯化如实施例中所描述的，在大肠杆菌中表达根瘤农杆菌AS野生型和突变的酶。所有的根瘤农杆菌AS酶，包括野生型和其突变体的纯化，在4℃进行。将细胞(大约1g湿重)悬浮在20ml的纯化缓冲液(50mM磷酸钾，pH7.3，10mMMgCl2，10mM2-巯基乙醇，10％甘油)中，并且通过超声处理(Branson SonifierCell Disruptor，W185)裂解。匀浆物在20,000×g离心15分钟后收集上清液。上清液进行硫酸铵分级分离(30-65％饱和)。在20,000×g离心15分钟后收集沉淀物，并溶于3ml的纯化缓冲液，然后整个地加载到用相同的缓冲液预平衡的Econo-Pac 10DG脱盐柱上。通过进一步分析检测包含酶的级分并加以收集。将收集的酶(4.3mls)加载到用相同的缓冲液平衡的10ml DEAESephacel(Pharmacia Biotech)柱(1.5×7.5cm)上。该柱用30ml的纯化缓冲液洗涤并且用相同缓冲液中的30ml的50mM NaCl洗提酶。收集包含高AS活性的级分并且通过65％的硫酸铵饱和液沉淀，以及如上所述分离和脱盐。收集包含酶的级分并贮藏在-80℃。
邻氨基苯甲酸合酶的酶测定和动力学分析根瘤农杆菌AS的标准分析于25℃，在包含100mM磷酸钾，pH7.0，10mMMgCl2，1mM二硫苏糖醇，200μM分支酸和10mM L-谷氨酰胺的分析缓冲液中进行。通过将30μl的酶加入反应混合物并混合而开始反应。邻氨基苯甲酸的形成直接通过320m处3分钟的吸光率增加而监测。根据吸光率对反应时间变化的斜率，以每秒增加的单位吸光率计算反应的初速度。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl2，1mM二硫苏糖醇和10mM L-谷氨酰胺，并且分支酸浓度在2.5-100μM分支酸之间变化的分析缓冲液中确定分支酸的Km(KmCho)。在总体积为1ml的包含100mM磷酸钾，pH7.0，10mM MgCl2，1mM二硫苏糖醇和200μM分支酸，并且L-谷氨酰胺浓度在0.1-2mM L-谷氨酰胺之间变化的分析缓冲液中确定谷氨酰胺的Km(KmGln)。在总体积为1ml，包含100mM磷酸钾，pH7.0，10mM MgCl2，1mM二硫苏糖醇，10mM L-谷氨酰胺，200μM分支酸，并且L-色氨酸的浓度在0.1-10mM色氨酸之间变化的分析缓冲液中确定色氨酸的IC50(IC50Trp)。在使数据适合非线性回归程序(GraFit)后计算AS的动力学参数和IC50。
几个突变体证明对色氨酸抑制的敏感性降低，同时与野生型酶相比仍然保持酶活性(表I)。这些结果表明可例如通过在邻氨基苯甲酸合酶的色氨酸结合袋中突变氨基酸和通过优化证明为反馈不敏感的突变来减少对色氨酸抑制的灵敏性的程度。
表I邻氨基苯甲酸合酶活性以及色氨酸对根瘤农杆菌AS突变体的作用
实施例5随机诱变根瘤农杆菌AS以产生色氨酸反馈不敏感的突变体除在实施例4中所描述的合理设计方法外，其他产生邻氨基苯甲酸合酶的反馈不敏感突变体的策略包括但不限于随机诱变。根瘤农杆菌AS的随机诱变，可例如通过化学诱变(分离的DNA或完整的生物体)、易错PCR和DNA移码实现。该实施例描述化学诱变及其后的遗传选择的使用。遗传选择方法也对选择来源于其他诱变方法的所需要的突变体有用。
包含根瘤农杆菌AS的大肠杆菌表达质粒的产生通过利用包含正向引物5′末端上的Ncol位点和反向引物3′末端上的XbaI位点的引物，PCR扩增来自根瘤农杆菌AS克隆pMON61600(在实施例1中所描述的(SEQ ID NO1)的开放阅读框5′-CATCCCATGGATGGTAACGATCATTCAGGAT-3′(SEQ ID NO55)；和5′-GATGTCTAGAGACACTATAGAATACTCAAGC-3′(SEQ ID NO56)。
将所得到的PCR产物连接到pMON25997(图28)中，pMON25997用BspH1和Xba1消化除去bktB开放阅读框(Slater等人，细菌学杂志J.Bact.，1801979-1987(1998))而得到质粒pMON62000(图29)。pMON62000是用于诱变和互补色氨酸营养缺陷型(EMG2ΔtrpE)的基础质粒。
大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的产生大肠杆菌菌株Ec-8(EMG2ΔtrpE)利用自杀载体pKO3构建，以从大肠杆菌菌株EMG2(K-12 wt F+)(大肠杆菌遗传原种中心)的染色体的trpE基因缺失1,383个碱基对。PCR扩增大肠杆菌基因组DNA的2个扩增子。第一个扩增子大约1.5kb，并在3′末端包含trpE ORF的前30bp。该扩增子在5′末端包含BamHI位点，并且在3’末端包含EcoR1位点。第二个扩增子大约1kb，并且在5’末端包含trpE ORF的最后150bp。该扩增子在5’末端包含EcoR1位点，并且在3’末端包含Sal1位点。2个扩增子用适当的酶消化，并且在EcoR1位点连接在一起以产生trpE的框内缺失。图30显示所得到的截短基因的序列(SEQ IDNO46)。将trpE缺失扩增子在BamH1和Sal1位点连接到pKO3中。如A.J.Link等人，J.Bacteriol.，1796228(1997)所描述的进行基因断裂。
大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE与pMON62000的互补用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且接种在M9基本培养基上以确定缺失是否通过加入pMON62000而互补。对照质粒(减去根瘤农杆菌AS插入)和对照菌株Ec-8也接种在M9基本培养基和具有40μg/ml色氨酸的M9基本培养基上。观察到在没有色氨酸的M9上生长用pMON62000转化的菌株Ec-8，而对照都没有观察到有生长，表明菌株Ec-8中trpE缺失通过pMON62000互补。
pMON62000的羟胺诱变和突变体的遗传选择为了产生邻氨基苯甲酸合酶的突变体，pMON62000用化学诱变剂羟胺突变。将下列成分在eppendorf管中化合20μg pMON62000质粒DNA和40μl2.5M羟胺，pH6.0。用0.1M NaH2PO4，pH6.0+5mM EDTA，pH6.0使体积变为200μl。该试管在70℃孵育。1.5小时后，将100μl的反应混合物在浮于大约500ml H2O上的硝酸纤维素滤膜上透析。15分钟后，利用Qiagen PCR纯化试剂盒浓缩DNA。3小时后，将剩余的100μl反应混合物移出并以同样的方式纯化。
然后大肠杆菌菌株Ec-8用已经用羟胺诱变处理1.5或3小时的100ngpMON62000通过电穿孔转化。对于各个时间点进行2种转化方法。容许转化细胞在SOC介质(20g/L细菌用胰化胨(Bacto-Tryptone)，5g/L细菌用酵母提取物，10ml/L 1M NaCl，2.5ml/L 1M KCl，18g葡萄糖)中恢复4或6小时。
制备2个245mm正方形的生物检测平板，包含M9基本培养基，加2％琼脂和50μg/ml 5-甲基-DL-色氨酸(5-MT)。将一等分的900μl 1.5小时诱变处理的转化混合物接种到1个50μg/ml 5-MT的平板上。将剩余的100μl接种到M9对照平板上。对于包含3.0小时诱变处理的质粒的转化混合物进行相同的步骤。
然后平板在37℃孵育大约2.5天。从5-MT平板分离抗性克隆并接种到LB-卡那霉素(50μg/ml)平板上以验证质粒的存在。所有选择的集落都在这些平板上生长。将来自每一抗性克隆的个别克隆分成两份以分离质粒。进行限制性消化和PCR并且证实所有的克隆都包含所需的根瘤农杆菌AS插入。
然后将挽救质粒转化回菌株Ec-8。通过划线接种到新的LB-卡那霉素平板上纯化来自每个转化子的一个克隆。为了证实对5-MT的抗性，将个别纯化的克隆接种到包含M9加50μg/ml 5-MT和2％琼脂的平板上，然后在37℃生长3天。大部分克隆证实有抗性。为了确定抗性突变体是否在5-MT的更高浓度保持抗性，将它们接种到M9加300μg/ml 5-MT和2％琼脂上。大多数克隆证明在此高浓度也有抗性。
分离来自所有抗性克隆的质粒并对两条链都测序。这个实验的一些突变体在表J中进行图解。
表J5-MT抗性克隆中根瘤农杆菌trpEG序列的变化。
如表J中的数据所表明的，几个突变体对突变酶的Kmcho和IC50trp的作用很小，表明这些突变可能不是抗色氨酸反馈抑制的来源。例如，在核苷酸35位的C到T的突变，它将氨基酸12位的苏氨酸残基变化为异亮氨酸(Thr12Ile)，而在Kmcho和IC50trp值中产生微小的变化。类似地，核苷酸2068位的C到T的变化，将脯氨酸变化为丝氨酸，也在Kmcho和IC50trp值中产生微小的变化。这些突变可能因此，也许是产生具有如同野生型酶特性的变体基因产物的″沉默的″突变。
实施例6高色氨酸转基因的大豆植物。
该实施例说明由用来自根瘤农杆菌的邻氨基苯甲酸合酶的色氨酸反馈不敏感突变体转化产生的，具有升高的色氨酸水平的转基因大豆植物的制备。
载体构建质粒pMON34711，具有来自根瘤农杆菌的，包含在实施例4中所描述的F298W突变的邻氨基苯甲酸合酶克隆，将其用限制性内切酶NotI消化。使所得到片段的末端钝化，然后用NcoI消化。然后质粒pMON13773(图8)用限制性内切酶EcoRI消化，使末端钝化，然后用NcoI消化。将所得到片段连接质粒pMON58044，该质粒包含在7S启动子和NOS3′UTR控制下的AS基因(图9)。
然后用限制性内切酶BglII和NcoI切割质粒pMON58044，并连接通过用BglII和NcoI消化pMON53084(图10)所产生的片段。所得到的片段命名为pMON58045(图11)并且包含用于拟南芥SSU1A运输肽的序列。
最后，通过连接由用限制性内切酶NotI消化pMON58045(图11)和pMON38207(图13)所产生的片段构建质粒pMON58046(图12)。这产生了用于大豆转化的pMON58046载体(图12)。
经微粒子轰击的大豆转化对于粒子轰击转化法，将市场上可买到的大豆种子(即，Asgrow A3244，A4922)发芽大约18-24小时过夜，并切下分生组织外植体。移去初生叶暴露分生组织并将外植体置于目标培养基中，同时分生组织垂直于粒子递送的方向。
将如上所述的pMON58046转化载体用CaCl2和亚精胺沉淀到显微的金粒子上，并且随后再悬浮在乙醇中。将悬浮液包涂到Mylar片层上，然后放置到放电装置上。将颗粒以大约60％的电容经放电加速进入植物组织。
轰击后，将外植体置于选择性培养基(WPM+0.075mM草甘膦)(WPM＝木本植物(woody plant)培养基(McCown和Lloyd，Proc.International PlantPropagation Soc.，30421，(1981)minus BAP))中5-7周，以供选择和生长转基因苗用。轰击大约5-7周后收获表型阳性的苗，并且放入选择性的根培养基中(BPM+0.025mM草甘膦)(参见，下列用于BRM的配方)2-3周。将产根苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2周。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记物的表达。在标准温室条件下保持植株直到收获R1种子。
用于豆生根培养基的配方(BRM)提供如下。
*SBRM/TSG激素原液(每1L的BRM)3.0ml IAA(0.033mg/ml)，2.0ml无菌蒸馏水。原液在4℃避光储存。
**SBRM维生素原液(每1L的原液)甘氨酸(1.0g)，烟酸(0.25g)，吡哆醇HCl(0.25g)，硫胺HCl(0.25g)。
***3×MInorMS盐(每1L原液)H2BO3(1.86g)，MnSO4(5.07g)，ZnSO4-H2O(2.58g)，KI(0.249g)，7.5ul NaMoO-2H2O(1.0mg/ml)，7.5ulCoSO4-5H2O(1.0mg/ml)，7.5ulCoCl2-6H2O(1.0mg/ml)。
每次加入并溶解1个成分，用无菌蒸馏水使体积达到1升，并且该溶液保存在箔覆盖的瓶子中，在冰箱中保存不超过1个月。
利用根瘤农杆菌转化大豆对于农杆菌转化法，将市场上可买到的大豆种子(Asgrow A3244，A4922)发芽过夜(大约10-12小时)，并且切下分生组织外植体。可移去或不移去初生叶暴露分生组织并且将外植体置于创伤导管中。
使包含感兴趣质粒的农杆菌菌株ABI生长到对数期。通过离心收获细胞并且再悬浮在含有诱导物的接种培养基中。从种子开始萌芽和利用超声处理创伤以来不迟于14小时，混合大豆外植体和诱导的农杆菌培养物。
创伤后，在农杆菌中培养外植体大约1个小时。该接种步骤后，通过移液管移出农杆菌并且将外植体置于共培养2-4天。此时，将它们转入选择性培养基(WPM+0.075mM草甘膦+抗生素以控制农杆菌过度生长)5-7周以容许选择并生长转基因的苗。
轰击后大约5-7周后，收获表型阳性的苗并置于选择性的根培养基中(BRM+0.025mM草甘膦)2-3周。将产生根的苗转入温室并盆栽到土壤中。将在选择中保持健康，但不生根的苗转入非选择性的根培养基中(无草甘膦的BRM)附加培养2星期。在转入温室并盆栽到土壤中之前，检测来自任何不在选定区域生根的苗的根中，植物选择性标记草甘膦抗性的表达。在标准温室条件下保持植株直到收获R1种子。
R1种子的氨基酸含量的分析生产成熟的R1种子并且利用如Agilent Technologies Technical BulletinREV14所描述的荧光检测分析游离氨基酸的含量。从每个事件选择5个种子用于单个种子分析。表达AgroAS F298W，AgroAS S51F，AgroAS V48F，AgroAS V48Y或AgroAS S51C的突变体蛋白质的大豆种子产生高数量的色氨酸。最高水平的色氨酸对萌芽具有负影响。结果显示在表K，L和M中。
表K用pMON58046转化的种子中蛋白质的表达
表LAS蛋白质表达与pMON58123转化相关
表M携带下列AgroAS等位基因中的一个的大豆中，平均和最大的色氨酸水平V48F(pMON66877)、V48Y(pMON66878)和S51C(pMON66879)。
用AgroAS转化的R1种子中的AS酶活性生产成熟的R1种子并且分析邻氨基苯甲酸合酶活性。在携带AgroASF298W(SEQ ID NOs65或91)或AgroAS S51F(SEQ ID NOs60或86)突变体等位基因的R1大豆种子中确定邻氨基苯甲酸合酶的酶活性。观察到非常高水平的色氨酸-抗性邻氨基苯甲酸合酶活性，与由这些种子所产生的高数量的色氨酸一致。结果显示在表N和O中。
表N用pMON58046转化的R1种子中AS的特异活性
表O用pMON58123转化的R1种子中AS的特异活性
实施例7包括芸香邻氨基苯甲酸合酶α-亚基的转化载体的制备来自芸香(Ruta graveolens)的邻氨基苯甲酸合酶α基因(Genbank登记号GI960291)提供另一个对本发明有用的邻氨基苯甲酸合酶结构域(Bohlmann，J等人，Plant Phys.，111507-514(1996))。存在于芸香基因组中的邻氨基苯甲酸合酶的一个同工酶显示对L-色氨酸的反馈抑制的敏感度较低。该等位基因也可用于本发明以提高转基因植物中游离的L-色氨酸的水平。载体pMON58030(图14)包含对色氨酸抑制较少敏感的芸香邻氨基苯甲酸合酶α-亚基。从pMON58030 PCR扩增芸香的邻氨基苯甲酸合酶α基因，以提供在芸香邻氨基苯甲酸合酶α基因片段的5′末端的BamHI位点和在3末端的BglII位点，其中利用包含这2个限制性内切酶位点的引物5′-CAAAAGCTGGATCCCCACC-3′(SEQ ID NO53)；和
5′-CCTATCCGAGATCTCTCAACTCC-3′(SEQ ID NO54)。
纯化PCR片段，用分别的限制性内切酶消化以形成pMON58041，其中包含芸香ASα至napin启动子的转录融合体。产生农杆菌介导的植物转化质粒，pMON58043，包括napin启动子，芸香AS，NOS终止子，草甘膦抗性(CP4)可选择的标记和适合于所述盒的固有染色体整合的边界。使用所得到的植物转化载体利用如实施例2，3和6中所描述的标准的植物转化技术转化植物。
实施例8转化多个多肽邻氨基苯甲酸合酶成为单体的单个多肽邻氨基苯甲酸合酶需要通过融合所选择的多亚基酶产生单体的邻氨基苯甲酸合酶，例如为了优化催化的效率，为了稳定酶，为了获得例如包括TrpE和TrpG活性的亚基，以及2个亚基间有效传递的协同表达。在有些情况下，可能对使用植物或微生物来源的TrpE或α-亚基有用，其中该植物或微生物通过标准诱变方法或通过如前文的实施例，例如实施例4中所描述的合理设计而不受有关反馈抑制的调控。在其他情况下，使用植物或微生物来源的野生型TrpE或α-亚基。
所选择的TrpE或α-亚基的C-末端连接TrpG亚基或β-亚基的N-末端，优选使用肽接头连接。可合理设计接头以提供合适的间隔和使两个亚基适当定位排列的灵活性。可选地接头可通过单体的和异四聚体的邻氨基苯甲酸合酶的序列对比确定。单体的和异四聚体的邻氨基苯甲酸合酶所形成的序列对比的实例显示在图21和35中。也可设想可能必须产生包括异源亚基的单体邻氨基苯甲酸合酶以便优化效益。例如，α-亚基可从例如大肠杆菌的细菌来源获得，并与例如拟南芥的植物来源的β-亚基融合。
可将产生的新蛋白质导入植物，例如如实施例2，3或6中所描述的。本发明不限于所显示和描述的精确细节，因为应该理解可在保持在权利要求所定义的本发明的精神和范围内的同时，产生许多变化和改进。
实施例9来自基因组序列数据库的邻氨基苯甲酸合酶的鉴定。
对本发明有用的单体邻氨基苯甲酸合酶以及α和β结构域可经生物信息分析，通过利用BLAST(www.ncbi.nlm.nih.gov/blast/)搜索例如genbank和/或swisprot数据库鉴定。鉴定单体邻氨基苯甲酸合酶的有用的查询序列包括，例如邻氨基苯甲酸合酶的结构域，例如硫磺矿硫化叶菌的α-结构域(GI1004323)或β-结构域(GI 1004324)，或单体的邻氨基苯甲酸合酶，例如根瘤农杆菌AS(GI 15889565)。推定的单体邻氨基苯甲酸合酶将具有与询问序列50％和100％之间的同源性，并且应最低限度地包含700个氨基酸。如果使用AS-α-结构域查询基因组数据库，除鉴定推定的邻氨基苯甲酸合酶基因外，它也可能鉴定涉及PABA合成，例如4-氨基-4-脱氧分支酸(ADC)合酶的基因。单体的ADC合酶基因可根据观察ADC合酶的酰胺转移酶结构域(β-结构域)存在于蛋白质的N-末端，而AS的酰胺转移酶结构域(β-结构域)存在于C-末端，从而将推定的单体AS基因轻易地鉴定出来。对本发明有用的单体邻氨基苯甲酸合酶通过生物信息分析鉴定，包括但不限于，例如苜蓿中华根瘤菌(Rhizobiummeliloti)(GI 95177)，百脉根根瘤菌(Mesorhizo biumloti)(GI 13472468)，马尔他布鲁氏菌(Brwella melitensis)(GI 17982357)，念珠藻属(NostoaSP.)PCC7120(GI 17227910，GI 17230725)，巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156)，血色红假单胞菌(Rhodopseudomonas palustris)，鱼腥藻(Anabaena)M22983(GI 152445)。图21是本发明中所使用的2个单体邻氨基苯甲酸合酶(根瘤农杆菌和苜蓿中华根瘤菌)与2个异四聚体邻氨基苯甲酸合酶(硫磺矿硫化叶菌和拟南芥)的序列对比的实例。图35是几个单体的邻氨基苯甲酸合酶与血色红假单胞菌异四聚体邻氨基苯甲酸合酶的序列对比的实例。
实施例10优化密码子的使用该实施例说明通过优化密码子的使用改进植物种子中邻氨基苯甲酸合酶基因表达的方法。
检验野生型根瘤农杆菌的邻氨基苯甲酸合酶(AS)基因的核苷酸序列(SEQ ID NO1)中存在的不表达密码子。为了鉴定低表达的密码子，从谷物和大豆中寻找高度表达的种子蛋白质的序列以获得相对的密码子频率。相对的密码子使用频率显示在表P中，表示为预期值的形式。预期值形式可例证说明如下假定存在4个编码给定氨基酸的密码子，并且假定它们同样使用，然后预期每个密码子占氨基酸25％(0.25)的频率。然而，由于冗余，将0.25规范化到1.0，以对每个密码子相比较于编码该氨基酸的密码子产生相对的积分。对于这个分析，如果该密码子比另一个对于给定的氨基酸选择更占优势，则它受到大于1.0的计数。相应地，如果密码子是较少占优势的，它受到小于1.0的计数。对于这个研究，如果其相对的密码子使用频率低于0.5，则认为该特定的密码子未被充分表示。
利用表P所产生的结果，在谷物和大豆中，野生型农杆菌AS序列的紧密检查显示认为125个密码子未被充分表示(低于0.5的阈值)(表Q)。这些未被充分表示的密码子被如上所定义的更占优势的密码子替代。改变的核苷酸序列显示在图36中。利用生物信息工具，装配所得到的序列并且通过翻译以及与相应的野生型AS序列的核苷酸和蛋白质的序列对比分析完整性。虽然未改变蛋白质序列，但优化序列的核苷酸序列与野生型的农杆菌AS序列(图37)具有94％的同一性。分别利用Lasergene EditSeq(DNASTAR公司，Madison，WI)和Grail2(国立橡树岭实验室，OakRidge，TN)分析优化的核苷酸序列中隐藏的多聚腺苷酸化信号(AATAAA，AATAAT)和隐藏的内含子的缺乏。没有发现隐藏的信号。
改变的核苷酸序列利用本领域中公知的技术或由例如EgeaBiosciencesces公司(SanDiego，加利福尼亚)的商业供应者合成。将所得到的核苷酸克隆到适当的表达载体中，并且利用本说明书的上述实施例中所详细记载的方法，测试在谷物，大豆和拟南芥中的效能。
表P玉米和大豆种子-表达基因1中相对的密码子使用频率。
1相对的密码子频率以预期值的形式表示。这指如果存在4个编码给定氨基酸的密码子，并且它们是同样使用的，预期每个密码子占25％(0.25)。由于冗余，将0.25规格化为1，以对于每个密码子相比较于所有编码该氨基酸的密码子产生相对的积分。如果密码子比另一个对于给定的氨基酸选择更占优势，则它将得到＞1的计数。而如果它比另一个对于该氨基酸较少优选，它将得到＜1的计数。
表Q未被充分表示的AgroAS密码子和用于改善种子表达2的改进
2标题为″作物中未充分表示″栏表明作物(玉米或大豆)中特定的密码子是未被充分表示的。
实施例11包括单体的苜蓿中华根瘤菌邻氨基苯甲酸合酶的转化载体的制备。
苜蓿中华根瘤菌的基因克隆使用获得自ATCC的苜蓿中华根瘤菌1021的穿刺培养物，接种到YM培养基(每1L含10g甘露醇，0.5g K2HPO4，0.2g MgSO4-7H2O，1.0g酵母提取物，0.2g NaCl，88mg FeCl3-6H2O，15g琼脂)平板上。该平板在30℃生长2天。使用单个克隆接种到1升的YM培养基中。该培养物在30℃生长过夜。在5,000×g旋转10分钟沉下细胞颗粒并且在-20℃冷冻。使用Qiagen Genomic-tip DNA试剂盒(Qiagen公司，Valencia，加利福尼亚)根据1999年8月的Qiagen基因组DNA手册(第42页)提取基因组DNA。
使用PCR反应扩增基因。所使用的引物是Rhizo F2ATGGCAGCGGTAATTCTGGAAG(SEQ ID NO138)和Rhizo R8
TCAGGCTGCCTTGGTCTTC(SEQ ID NO139)。
将所得到的PCR片段克隆到pGEM(Promega公司，Madison，WI.)载体中。
最后，利用PCR扩增pGEM中的PCR产物，使用下列引物Rhizo NcoI ACTGACTCCATGGCAGCGGTAATTCTGGAA(SEQ ID NO140)和Rhizo SpeICTGACTAGTTCAGGCTGCTT(SEQ ID NO141)，并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen公司，Grand Island，N.Y.)。
载体构建用SpeI消化在TOPO 2.1载体中包含根瘤菌基因的载体，并且进行klenow反应以使该位点钝化。PCR纯化DNA(Qiagen PCR纯化试剂盒和MinElute手册，2001)，然后用NcoI消化。将该片段克隆到pET30a的EcoRV和NcoI位点，从而产生pMON66595(图41)。
通过几个步骤产生拟南芥转化载体，最初用NcoI/EcoRI消化pMON13773(图8)以产生骨架片段。用NcoI和EcoRI消化pMON66595并除去根瘤菌AS基因的较大的部分(大约2000碱基对)。然后将两段连接在一起。用EcoRI消化阳性克隆并用小牛肠磷酸酶(CIP)处理。通过用EcoRI消化pMON66595除去根瘤菌基因的第二个片段，并且保持大约200碱基对的片段。将2个片段连接在一起，并且对所合成的克隆测序以检查根瘤菌小片段的正确方向。
用BglII和NcoI消化具有正确的序列和方向的上述一个克隆。然后用BglII和NcoI消化pMON58046(图12)，并且除去CTP2运输肽片段。将这些片段连接在一起以完成该盒。
连接片段用NotI消化以移出该盒。然后在CIP处理的NotI位点将它们连接成为pMON36524(图48)。消化这些克隆以发现以与NPTII基因产生pMON66599(图42)相同的方向插入的盒。
然后将载体pMON66599转化农杆菌并用于转化拟南芥。该实验中的对照构建体是pMON66598(图43)，其与pMON66599所描述的盒插入方式相同，只是包含农杆菌AS野生型基因。
互补分析用BamHI和NcoI切下来自pMON66595的根瘤菌AS基因，并克隆到pSE280载体(Invitrogen)的相应位点，产生pMON66596(图44)。然后将pMON66596转化突变的大肠杆菌菌株，EMG2ΔtrpE(产生自EMG菌株WTK12，F+，获得自ATCC)显示同数的基因互补于trp-菌株的基因组。
活性分析将pMON66596转化BL-21细胞并用IPTG诱导表达蛋白质。通过HPLC分析粗细胞提取物，并发现具有活性和大约10μM trp的IC50(Poulson，色谱法杂志Journal of Chromatography，547155-160(1991))。
蛋白质表达和纯化通过用IPTG诱导His-标记的蛋白质表达。利用QIAexpressionist 2002手册和镍树脂(Ni-NTA Spin手册，2000)中所列出的天然条件完成蛋白质纯化。兔血清显示识别纯化的蛋白质。
如在实施例2，3和6中，用包含根瘤菌邻氨基苯甲酸合酶基因的载体转化植物，并且在种子中显示升高的色氨酸水平。
实施例12用包含玉米邻氨基苯甲酸合酶α-亚基基因和玉米邻氨基苯甲酸合酶β-亚基基因的载体转化谷物。
为了产生包含玉米邻氨基苯甲酸合酶α-亚基的编码序列的穿梭载体，用EcoRI和SacII消化pMON65150。凝胶纯化所得到的6195碱基对的片段，然后脱磷酸化。质粒pMON66604用EcoRI和SacII消化，以产生凝胶纯化的1077碱基对的片段。然后将1077碱基对的片段连接包含玉米ASα编码序列的粘末端的6195碱基对片段，以产生pMON67149，玉米L3(油质蛋白)启动子-玉米hsp70内含子-玉米ASα-Tr7 3′UTR表达载体。随后用XhoI消化这个载体，产生包含玉米油质蛋白启动子、玉米热休克蛋白70内含子、玉米邻氨基苯甲酸α-亚基编码序列和Tr7 3’UTR的4364碱基对的DNA片段。
用XhoI消化质粒pMON30167，产生8.89Kb的DNA片段。然后将这个片段连接4964碱基对的片段以产生pMON79951(图45)，转化载体包含L3启动子-zmhsp70内含子-玉米ASα-Tr7 3′UTR。
通过PCR从Monsanto所有的cDNA文库分离玉米邻氨基苯甲酸合酶β-亚基的编码序列，其中利用下列引物5′引物5″TGCTGACCATGGCCTGCTCCCACATCGTCG3′(SEQ ID NO142)，其包含NcoI限制酶切位点(以粗体显示)，和3′引物5′CAGTGAATTCCTACGAACGCTGCTTCTCCAGTTC3′
(SEQ ID NO143)，其包含EcoRI限制酶切位点(以粗体显示)。
所使用的PCR参数是，2°/秒到95°；95°5分钟；2°/秒到95；95°30秒；2°/秒到55°；55°45秒；2°/秒到72°；72°55秒；循环25次，在第三步开始；2°/秒到72°；72°10分钟；2°/秒到4°保持。(所有的温度显示为℃，除非另作说明)。PCR混合物包含1μl从pMON79952小量制备(Qiagen方法)的DNA，1.5μl的各种引物(10μM原液)5μl含氯化镁的Roche 10×PCR缓冲液，2μl 10mM dNTP混合物，1μL高保真(Hi-Fi)Taq混合物(Roche扩展高保真PCR系统#1732650)和水，总体积为50μl。所得到的PCR产物连接到pGEM-T载体(Promega pGEM-T载体系统I#A3600)中。对上述片段测序显示其丢失限制性酶切位点。利用pGEM克隆作为模板再进行PCR，并且将产物克隆到TOPO 2.1 PCR载体中(Invitrogen TOPO TA克隆试剂盒pCR2.1-TOPO载体#45-0641)。该克隆通过测序证实。所得到的包含玉米ASβ的载体称为pMON66592。然后用NcoI和EcoRI消化该载体，以产生850碱基对(bp)的片段。分离后，钝化850bp片段的末端并脱去磷酸。用BamHI和SmaI消化质粒pMON79953，以产生5353bp的片段。分离后，钝化5353bp片段的末端。然后将包含ASβ基因的850bp片段连接到平末端的5353bppMON79953片段中以产生pMON79954，玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR载体。
随后用XhoI消化载体pMON79954以产生包含玉米油质蛋白启动子，玉米hsp70内含子，玉米ASβ编码序列和Tr7 3′UTR的2907碱基对的DNA片段。质粒pMON30167(图49)用XhoI消化以产生8.89Kb的片段。将2个片段连接在一起以产生pMON79955(图46)，转化载体包含L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR。
为了产生玉米ASα和ASβ叠加(stacking)载体，用HindIII消化pMON79955以产生16.57Kb的片段。产生钝化的片段并且脱去磷酸。质粒pMON67149用XhoI消化，以产生4364碱基对的DNA片段，随后变为平末端。将2个片段连接在一起以产生pMON79956(图47)，最后的转化载体包含玉米L3启动子-zmhsp70内含子-玉米ASα-Tr73′UTR，与玉米L3启动子-zmhsp70内含子-玉米ASβ-Tr7 3′UTR叠加。
利用根瘤农杆菌转化玉米玉米植株(自交系LH198/Hi11)在标准实验下生长在温室中。当胚为1.5-2.0mm长度，通常在授粉后10-15天收获植物的穗。通过喷雾或渗入80％的乙醇对穗进行表面杀菌。
利用本领域技术人员公知的方法从个体的种仁分离不成熟的胚胎。转化前，将不成熟的胚胎在包含16.9mg/L AgNO3(指定为培养基2112V)的培养基211(N6盐，2％蔗糖，1mg/l 2，4-二氯苯氧乙酸(2，4-D)，0.5mg/L烟酸，1.0mg/L硫胺HCl，0.91g/L L-天冬酰胺，100mg/L肌醇，0.5g/L MES，100mg/L酪蛋白水解物，1.6g/L MgCl2，0.69g/L L-脯氨酸，2g/L GELGRO tm，pH5.8)上培养3-6天。
农杆菌介导的转化玉米细胞及其他单子叶植物的方法是已知的(美国专利号5,591,616和5,981,840；以及EP0 672 752)。使用农杆菌菌株ABI和根瘤农杆菌二元载体系统进行转化。
在与玉米胚胎细胞共培养前，农杆菌细胞生长在28℃，包含大约50μg/ml卡那霉素和100μg/ml壮观霉素的LB(DIFCO)液体培养基中，以选择保持改变的Ti质粒和二元载体。在接种玉米细胞前，农杆菌细胞在室温下，在包括用于保持质粒的适当抗生素和200μM乙酰丁香酮的AB培养基(Chilton等人，Proc.Nat.Acad.Sci.(美国)，713672-3676(1974))中生长过夜。在马上接种前，农杆菌细胞通过离心沉淀，在包含200μM乙酰丁香酮的1/2 MSVI培养基(2.2g/L GIBCO MS(Murashige和Skoog，Physiol.Plant 15473-497(1962)基本(basal)盐，2mg/L甘氨酸，0.5g/L烟酸，0.5g/LL-吡哆醇-HCl，0.1mg/L硫胺，115g/L L-脯氨酸，10g/L D-葡萄糖和10g/L蔗糖，pH5.4)中洗涤。
切下不成熟的玉米胚，浸于1/2MSPL培养基的农杆菌悬浮液中并且在室温下与农杆菌培养大约5分钟。
农杆菌感染和共培养后，将胚转入类型II的延迟培养基中5-7天并且在27℃黑暗培养。延迟培养基由包含2.0mg/L 2，4-D(GIBCO)，100mg/L-酪蛋白氨基酸，12mM脯氨酸，500mg/L羧苄青霉素和20μM硫代硫酸银的MS基础盐组成。所有的培养基化学试剂是组织培养级的。一旦从不成熟的胚胎观察到类型II的愈伤组织开始的标志，正如Selman等人，在玉米手册The MaizeHandbook，Freeling和Walbot编辑，Springer Verlag，第672页(1994)中所定义的，从胚胎除去胚芽鞘。然后将胚胎转入包含2.0mg/L 2，4-D，12mM脯氨酸，20μM硫代硫酸银，500mg/L羧苄青霉素和0.5mM草甘膦(Monsanto公司，St.Louis，Mo.)的MS培养基并且在27℃黑暗培养2周。
如上所述将胚形成的愈伤组织转入MS培养基，但是培养基另外包含1.0mM草甘膦。然后培养物在黑暗中于27℃培养2周。然后将仍然具有愈伤组织的胚转入包含3.0mM草甘膦的MS培养基另外培养2周。
通过将愈伤组织转入包含0.1mg/L 2，4-D和0.1μM脱落酸(ABA)的MS培养基2周，然后转入包含6％蔗糖而无2，4-D的MS培养基再培养2周实现植物再生。培育在黑暗中于27℃进行以容许体细胞胚成熟并在再生过程中转化。
将准备发芽的体细胞胚转入无激素的MS培养基，并且在光照下培养直到产生附着根的苗。大约2-3周后，产生小植株。
然后将小植株转入温室并且在标准温室条件下生长。
R1种子氨基酸含量的分析对于各个载体建立几个转基因谷物的品系并通过世代的数目繁殖。这些品系是生长的，并且自花受粉以产生纯合系。在各个世代，利用在未成熟种子上进行western印迹分析确定转化基因的表达，产生成熟的R1种子并利用如Agilent Technologies Technical Bulletin REV14所描述的荧光检测分析游离氨基酸的含量。表达ASα蛋白质的玉米种子相对于基线水平(相当于阴性等值线和非转基因对照)产生升高数量的色氨酸。谷物的基线游离色氨酸水平的范围是从大约5-大约25ppm。
所有的出版物和专利在此引入作为参考，并且逐一地引入作为参考。本发明不限于所显示和描述的精确细节，因为应该理解在保持在由权利要求所定义的本发明的精神和范围之内的同时可产生许多变化和改进。
序列表<110>孟山都技术公司(Monsanto Technology，LLC)Weaver，LisaOulmassov，TimVaduva，GabrielaLiang，JihongVaragona，RitaVenkatesh，Tyamagondlu<120>转基因的高色氨酸植物<130>51857R<160>143<170>PatentIn version 3.1<210>1<211>2190<212>DNA<213>根瘤农杆菌(Agrobacterium tumefaciens)<400>1atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga 2190<210>2<211>1815<212>DNA<213>玉米(Zea mays)<400>2atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080aatcctagcc catacatggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatag 1815<210>3<211>1993<212>DNA<213>芸香(Ruta graveolens)<400>3aaaaaatctg tctgtttttc gtgtttggac atttcagcgg cactgggtgc catcagttga 60ttcgactcat ttgatttatt ttgtttgttg gccatgagtg cagcggcaac gtcgatgcaa 120tcccttaaat tctccaaccg tctggtccca cccagtcgcc gtctgtctcc ggttccgaac 180aatgtcacct gcaataacct ccccaagtct gcagctcccg tccggacagt caaatgctgc 240gcttcttcct ggaacagtac catcaacggc gcggccgcca cgaccaacgg tgcgtccgcc 300gccagtaacg gcgcatccac gaccaccact acatatgtta gtgatgcaac cagatttatc 360gactcttcta aaagggcaaa tctagtgcca ttataccgtt gcatattcgc ggatcatctc 420acgccggtgc ttgcctatag atgtttggtt caagaagacg ataaagagac tccaagtttt 480
ttattcgaat cagtagagcc gggtcggatt tctactgttg ggaggtatag tgtggttgga 540gctcatcccg tgatggaagt tatagctaaa gataatatgg ttacggtgat ggatcatgag 600aaagggagct tagttgagga ggtggtcgat gatcccatgg agattcctag aagaatttcc 660gaggattgga agcctcaaat aatcgatgat cttcctgaag ctttttgcgg tggttgggtt 720ggtttcttct catacgatac agttcgatat gtggagaaga aaaagttacc attctcaaag 780gcacctcagg atgataggaa tcttgcagat atgcatctag gtctctataa cgatgttatt 840gtgtttgatc atgtggaaaa gaaagtatat gttattcatt gggtgaggct aaatcaacag 900tcttctgaag aaaaagcata tgccgagggt ctggaacact tggagagact agtatccaga 960gtacaggatg agaacacgcc aaggctcgcc ccaggttcca tagacttaca cactggtcat 1020tttggacctc cattaaaaaa gtcaaacatg acatgtgaag aatacaaaat ggctgtacta 1080gcggcaaaag aacatattca ggctggggat atttttcaaa tcgtactaag ccaacgtttt 1140gaacgtcgaa catttgctga tccatttgaa gtttataggg cactgagagt tgttaatccg 1200agtccctata tgacgtatat gcaggcaaga gggtgtgttc tggtagcttc aagtccagaa 1260attcttactc gagtaaagaa gaataagatt gtgaatcgac ctttggctgg aacagcccga 1320agagggagga ctactgaaga agatgagatg ttggaaacac agttgctaaa agacgcaaag 1380caatgtgctg agcatgttat gctggtcgat ttgggacgga atgatgttgg caaggtttca 1440aaatctggtt ctgtgaaagt ggaaaagctg atgaatgttg aacgatattc acatgttatg 1500cacataagct ctacggtcac aggtgagttg caagataatc tcagttgctg ggatgccctg 1560cgtgctgcac tgcctgtcgg gactgttagt ggagcaccaa aggtgaaggc aatggagtta 1620atcgatgaat tggaggtaaa tagacgtggc ccctacagtg gtgggtttgg cggtatctcc 1680ttcaccggag atatggacat tgccctggct ctaaggacca ttgttttcca aaccggtaca 1740cgctatgaca caatgtactc gtacaagaat gctaccaaac gccggcagtg ggtggcatac 1800cttcaagccg gggctggcat tgttgctgat agtgatccag acgacgagca tcgtgagtgc 1860cagaacaaag ccgccggact ggcccgtgcc atcgacctag ctgagtctgc ttttgtgaac 1920aaatcaagta gctaaagttt tggatttgga agtggagttg agtctcggat aggatttaga 1980gtaaaaaaag agg 1993<210>4<211>729<212>PRT<213>根瘤农杆菌(Agrobacterium tumefaciens)<400>4Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>5<211>604<212>PRT<213>玉米(Zea mays)<400>5
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 15Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala35 40 45Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala50 55 60Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala65 70 75 80Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val85 90 95Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu100 105 110Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly115 120 125Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His130 135 140Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp145 150 155 160His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln165 170 175Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu180 185 190Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp195 200 205Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro210 215 220Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp225 230 235 240Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp245 250 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly260 265 270Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val275 280 285Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly290 295 300Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala305 310 315 320Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile325 330 335Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu340 345 350Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala Tyr355 360 365Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu370 375 380Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr385 390 395 400Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln405 410 415Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp420 425 430Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys435 440 445Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile450 455 460Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp465 470 475 480Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys485 490 495Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
500 505 510Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln515 520 525Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His530 535 540Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val545 550 555 560Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp565 570 575Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala580 585 590Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600<210>6<211>613<212>PRT<213>芸香(Ruta graveolens)<400>6Met Ser Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg1 5 10 15Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr20 25 30Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys35 40 45Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr50 55 60Asn Gly Ala Ser Ala Ala Ser Asn Gly Ala Ser Thr Thr Thr Thr Thr65 70 75 80Tyr Val Ser Asp Ala Thr Arg Phe Ile Asp Ser Ser Lys Arg Ala Asn85 90 95Leu Val Pro Leu Tyr Arg Cys Ile Phe Ala Asp His Leu Thr Pro Val100 105 110Leu Ala Tyr Arg Cys Leu Val Gln Glu Asp Asp Lys Glu Thr Pro Ser
115 120 125Phe Leu Phe Glu Ser Val Glu Pro Gly Arg Ile Ser Thr Val Gly Arg130 135 140Tyr Ser Val Val Gly Ala His Pro Val Met Glu Val Ile Ala Lys Asp145 150 155 160Asn Met Val Thr Val Met Asp His Glu Lys Gly Ser Leu Val Glu Glu165 170 175Val Val Asp Asp Pro Met Glu Ile Pro Arg Arg Ile Ser Glu Asp Trp180 185 190Lys Pro Gln Ile Ile Asp Asp Leu Pro Glu Ala Phe Cys Gly Gly Trp195 200 205Val Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys210 215 220Leu Pro Phe Ser Lys Ala Pro Gln Asp Asp Arg Asn Leu Ala Asp Met225 230 235 240His Leu Gly Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys245 250 255Lys Val Tyr Val Ile His Trp Val Arg Leu Asn Gln Gln Ser Ser Glu260 265 270Glu Lys Ala Tyr Ala Glu Gly Leu Glu His Leu Glu Arg Leu Val Ser275 280 285Arg Val Gln Asp Glu Asn Thr Pro Arg Leu Ala Pro Gly Ser Ile Asp290 295 300Leu His Thr Gly His Phe Gly Pro Pro Leu Lys Lys Ser Asn Met Thr305 310 315 320Cys Glu Glu Tyr Lys Met Ala Val Leu Ala Ala Lys Glu His Ile Gln325 330 335Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg340 345 350Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Val Val Asn335 360365
Pro Ser Pro Tyr Met Thr Tyr Met Gln Ala Arg Gly Cys Val Leu Val370 375 380Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val385 390 395 400Asn Arg Pro Leu Ala Gly Thr Ala Arg Arg Gly Arg Thr Thr Glu Glu405 410 415Asp Glu Met Leu Glu Thr Gln Leu Leu Lys Asp Ala Lys Gln Cys Ala420 425 430Glu His Val Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val435 440 445Ser Lys Ser Gly Ser Val Lys Val Glu Lys Leu Met Asn Val Glu Arg450 455 460Tyr Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln465 470 475 480Asp Asn Leu Ser Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly485 490 495Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu500 505 510Leu Glu Val Asn Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile515 520 525Ser Phe Thr Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val530 535 540Phe Gln Thr Gly Thr Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Asn Ala545 550 555 560Thr Lys Arg Arg Gln Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Ile565 570 575Val Ala Asp Ser Asp Pro Asp Asp Glu His Arg Glu Cys Gln Asn Lys580 585 590Ala Ala Gly Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val595 600 605Asn Lys Ser Ser Ser610
<210>7<211>729<212>PRT<213>苜蓿中华根瘤菌(Rhizobium meliloti)<400>7Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys1 5 10 15Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp20 25 30Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu65 70 75 80Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile85 90 95Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala100 105 110Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala130 135 140Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu165 170 175Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala210 215 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg370 375380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465 470 475 480Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr485 490495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser500 505 510Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu610 615 620Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu705 710 715 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala725<210>8<211>421<212>PRT<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)<400>8Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe1 5 10 15Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile20 25 30Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr35 40 45Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly50 55 60Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly65 70 75 80Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys85 90 95Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe100 105 110Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val115 120 125Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly130 135 140Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr145 150 155 160Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile165 170 175Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp180 185 190Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr195 200 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro210 215 220Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile225 230 235 240Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu245 250 255Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met260 265 270Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly275 280 285Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val290 295 300Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn305 310 315 320Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly325 330 335Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr340 345 350Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly355 360 365Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu370 375 380Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro385 390 395 400Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr405 410 415Ala Ile Gly Val Arg420<210>9<211>32<212>DNA<213>人工序列<220>
<223>引物.
<400>9ccatcgcggc gcgttttttt cgtccaacta tg 32<210>10<211>32<212>DNA<213>人工序列<220>
<223>引物.
<400>10catagttgga cgaaaaaaac gcgccgcgat gg 32<210>11<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>11ccatcgcggc gcgtattttt cgtccaacta tgaatatcc 39<210>12<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>12ggatattcat agttggacga aaaatacgcg ccgcgatgg 39<210>13<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>13ccatcgcggc gcgtggtttt cgtccaacta tgaatatcc 39<210>14<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>14
ggatattcat agttggacga aaaccacgcg ccgcgatgg 39<210>15<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>15ccatcgcggc gcggttttta agtccaacta tgaatatcc 39<210>16<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>16ggatattcat agttggactt aaaaaccgcg ccgcgatgg 39<210>17<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>17gcgcggtttt ttcgtgcaac tatgaatatc cggg34<210>18<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>18cccggatatt catagttgca cgaaaaaacc gcgc34<210>19<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>19cgcggttttt tcgttcaact atgaatatcc gggc34
<210>20<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>20gcccggatat tcatagttga acgaaaaaac cgcg34<210>21<211>37<212>DNA<213>人工序列<220>
<223>引物.
<400>21cggcgcggtt ttttcgatca actatgaata tccgggc 37<210>22<211>37<212>DNA<213>人工序列<220>
<223>引物.
<400>22gcccggatat tcatagttga tcgaaaaaac cgcgccg 37<210>23<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>23ggcgcggttt tttcgctcaa ctatgaatat ccgggc 36<210>24<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>24gcccggatat tcatagttga gcgaaaaaac cgcgcc 36<210>25<211>39
<212>DNA<213>人工序列<220>
<223>引物.
<400>25cggcgcggtt ttttcgatga actatgaata tccgggccg 39<210>26<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>26cggcccggat attcatagtt catcgaaaaa accgcgccg 39<210>27<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>27cgcggttttt tcgaccaact atgaatatcc gggc34<210>28<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>28gcccggatat tcatagttgg tcgaaaaaac cgcg34<210>29<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>29ggcgcggttt tttcggtcaa ctatgaatat ccgggc 36<210>30<211>36<212>DNA<213>人工序列
<220>
<223>引物.
<400>30gcccggatat tcatagttga ccgaaaaaac cgcgcc 36<210>31<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>31gcgcggtttt ttcgtacaac tatgaatatc cgggc 35<210>32<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>32gcccggatat tcatagttgt acgaaaaaac cgcgc 35<210>33<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>33cggcgcggtt ttttcgtcct tctatgaata tccggg 36<210>34<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>34cccggatatt catagaagga cgaaaaaacc gcgccg 36<210>35<211>29<212>DNA<213>人工序列<220>
<223>引物.
<400>35ctgaaggcga tcaacgcgtc gccctattc 29<210>36<211>29<212>DNA<213>人工序列<220>
<223>引物.
<400>36gaatagggcg acgcgttgat cgccttcag 29<210>37<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>37cctgaaggcg atcaacgggt cgccctattc c 31<210>38<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>38ggaatagggc gacccgttga tcgccttcag g 31<210>39<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>39cgtcgcccta ttccgccttc atcaatctcg gcg33<210>40<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>40cgccgagatt gatgaaggcg gaatagggcg acg 33
<210>41<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>41cgtcgcccta ttcctggttc atcaatctcg gcg 33<210>42<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>42cgccgagatt gatgaaccag gaatagggcg acg 33<210>43<211>729<212>PRT<213>苜蓿中华根瘤菌(Rhizobium meliloti)<400>43Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys1 5 10 15Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp20 25 30Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu65 70 75 80Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile85 90 95Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala100 105 110Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr115 120 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala130 135 140Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu165 170 175Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala210 215 220Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425430Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser500 505 510Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu610 615 620Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625 630 635 640Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys675 680685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu705 710 715 720Ala Lys Arg Ala Lys Thr Lys Ala Ala725<210>44<211>616<212>PRT<213>硫磺矿硫化叶菌(Sulfolobus solfataricus)<400> 44Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe1 5 10 15Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile20 25 30Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr35 40 45Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly50 55 60Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly65 70 75 80Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys85 90 95Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe100 105 110Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
115 120 125Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly130 135 140Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr145 150 155 160Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile165 170 175Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp180 185 190Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr195 200 205Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro210 215 220Glu Leu Leu Phe Arg Val Gin Asp Asn Ile Val Glu Thr Tyr Pro Ile225 230 235 240Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu245 250 255Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met260 265 270Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly275 280 285Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val290 295 300Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn305 310 315 320Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly325 330 335Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr340 345 350Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly355 360 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu370 375 380Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro385 390 395 400Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr405 410 415Ala Ile Gly Val Arg Met Asp Leu Thr Leu Ile Ile Asp Asn Tyr Asp420 425 430Ser Phe Val Tyr Asn Ile Ala Gln Ile Val Gly Glu Leu Gly Ser Tyr435 440 445Pro Ile Val Ile Arg Asn Asp Glu Ile Ser Ile Lys Gly Ile Glu Arg450 455 460Ile Asp Pro Asp Arg Leu Ile Ile Ser Pro Gly Pro Gly Thr Pro Glu465 470 475 480Lys Arg Glu Asp Ile Gly Val Ser Leu Asp Val Ile Lys Tyr Leu Gly485 490 495Lys Arg Thr Pro Ile Leu Gly Val Cys Leu Gly His Gln Ala Ile Gly500 505 510Tyr Ala Phe Gly Ala Lys Ile Arg Arg Ala Arg Lys Val Phe His Gly515 520 525Lys Ile Ser Asn Ile Ile Leu Val Asn Asn Ser Pro Leu Ser Leu Tyr530 535 540Tyr Gly Ile Ala Lys Glu Phe Lys Ala Thr Arg Tyr His Ser Leu Val545 550 555 560Val Asp Glu Val His Arg Pro Leu Ile Val Asp Ala Ile Ser Ala Glu565 570 575Asp Asn Glu Ile Met Ala Ile His His Glu Glu Tyr Pro Ile Tyr Gly580 585 590Val Gln Phe His Pro Glu Ser Val Gly Thr Ser Leu Gly Tyr Lys Ile595 600 605Leu Tyr Asn Phe Leu Asn Arg Val610 615
<210>45<211>897<212>PRT<213>拟南芥(Arabidopsis thaliana)<400> 45Met Ser Ala Val Ser Ile Ser Ala Val Lys Ser Asp Phe Phe Thr Val1 5 10 15Glu Ala Ile Ala Val Thr His His Arg Thr Pro His Pro Pro His Phe20 25 30Pro Ser Leu Arg Phe Pro Leu Ser Leu Lys Ser Pro Pro Ala Thr Ser35 40 45Leu Asn Leu Val Ala Gly Ser Lys Leu Leu His Phe Ser Arg Arg Leu50 55 60Pro Ser Ile Lys Cys Ser Tyr Thr Pro Ser Leu Asp Leu Ser Glu Glu65 70 75 80Gln Phe Thr Lys Phe Lys Lys Ala Ser Glu Lys Gly Asn Leu Val Pro85 90 95Leu Phe Arg Cys Val Phe Ser Asp His Leu Thr Pro Ile Leu Ala Tyr100 105 110Arg Cys Leu Val Lys Glu Asp Asp Arg Asp Ala Pro Ser Phe Leu Phe115 120 125Glu Ser Val Glu Pro Gly Ser Gln Ser Ser Asn Ile Gly Arg Tyr Ser130135 140Val Val Gly Ala Gln Pro Thr Ile Glu Ile Val Ala Lys Gly Asn Val145 150 155 160Val Thr Val Met Asp His Gly Ala Ser Leu Arg Thr Glu Glu Glu Val165 170 175Asp Asp Pro Met Met Val Pro Gln Lys Ile Met Glu Glu Trp Asn Pro180 185 190Gln Gly Ile Asp Glu Leu Pro Glu Ala Phe Cys Gly Gly Trp Val Gly195 200 205Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro210 215 220
Phe Ser Asn Ala Pro Glu Asp Asp Arg Ser Leu Pro Asp Val Asn Leu225 230 235240Gly Leu Tyr Asp Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala245 250 255Tyr Val Ile His Trp Val Arg Ile Asp Lys Asp Arg Ser Val Glu Glu260 265 270Asn Phe Arg Glu Gly Met Asn Arg Leu Glu Ser Leu Thr Ser Arg Ile275 280 285Gln Asp Gln Lys Pro Pro Lys Met Pro Thr Gly Phe Ile Lys Leu Arg290 295 300Thr Gln Leu Phe Gly Pro Lys Leu Glu Lys Ser Thr Met Thr Ser Glu305 310 315 320Ala Tyr Lys Glu Ala Val Val Glu Ala Lys Glu His Ile Leu Ala Gly325 330 335Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe340 345350Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser355 360 365Pro Tyr Met Ala Tyr Leu Gln Val Arg Gly Cys Ile Leu Val Ala Ser370 375 380Ser Pro Glu Ile Leu Leu Arg Ser Lys Asn Arg Lys Ile Thr Asn Arg385 390 395 400Pro Leu Ala Gly Thr Val Arg Arg Gly Lys Thr Pro Lys Glu Asp Leu405 410415Met Leu Glu Lys Glu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His420 425 430Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys435 440 445Pro Gly Ser Val Glu Val Lys Lys Leu Lys Asp Ile Glu Trp Phe Ser450 455 460His Val Met His Ile Ser Ser Thr Val Val Gly Glu Leu Leu Asp His
465 470 475 480Leu Thr Ser Trp Asp Ala Leu Arg Ala Val Leu Pro Val Gly Thr Val485 490 495Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu500 505 510Val Thr Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe515 520 525Asn Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro530 535 540Thr Asn Thr Arg Tyr Asp Thr Leu Tyr Ser Tyr Lys His Pro Gln Arg545 550 555 560Arg Arg Glu Trp Ile Ala His Ile Gln Ala Gly Ala Gly Ile Val Ala565 570 575Asp Ser Asn Pro Asp Asp Glu His Arg Glu Cys Glu Asn Lys Ala Ala580 585 590Ala Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ser Phe Leu Glu Ala595 600 605Pro Glu Phe Thr Thr Ile Thr Pro His Ile Asn Asn Ile Met Ala Ala610 615 620Ser Thr Leu Tyr Lys Ser Cys Leu Leu Gln Pro Lys Ser Gly Ser Thr625 630 635 640Thr Arg Arg Leu Asn Pro Ser Leu Val Asn Pro Leu Thr Asn Pro Thr645 650 655Arg Val Ser Val Leu Gly Lys Ser Arg Arg Asp Val Phe Ala Lys Ala660 665 670Ser Ile Glu Met Ala Glu Ser Asn Ser Ile Pro Ser Val Val Val Asn675 680 685Ser Ser Lys Gln His Gly Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser690 695 700Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Leu Gly Cys His Phe705 710 715 720
Glu Val Tyr Arg Asn Asp Glu Leu Thr Val Glu Glu Leu Lys Lys Lys725 730 735Asn Pro Arg Gly Val Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp740 745 750Ser Gly Ile Ser Leu Gln Thr Val Leu Glu Leu Gly Pro Leu Val Pro755 760 765Leu Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly770 775 780Gly Lys Ile Val Arg Ser Pro Phe Gly Val Met His Gly Lys Ser Ser785 790 795 800Met Val His Tyr Asp Glu Lys Gly Glu Glu Gly Leu Phe Ser Gly Leu805 810 815Ser Asn Pro Phe Ile Val Gly Arg Tyr His Ser Leu Val Ile Glu Lys820 825 830Asp Thr Phe Pro Ser Asp Glu Leu Glu Val Thr Ala Trp Thr Glu Asp835 840 845Gly Leu Val Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly850 855 860Val Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Lys Thr Ile865 870 875 880Val Arg Asn Phe Ile Lys Ile Val Glu Lys Lys Glu Ser Glu Lys Leu885 890 895Thr<210>46<211>252<212>DNA<213>人工序列<220>
<223>截短的基因<400>46atgcaaacac aaaaaccgac tctcgaactg gaattcctgg tggaaaacgg tatcgccacc 60gtgcaagcgg gtgctggtgt agtccttgat tctgttccgc agtcggaagc cgacgaaacc 120cgtaacaaag cccgcgctgt actgcgcgct attgccaccg cgcatcatgc acaggagact 180
ttctgatggc tgacattctg ctgctcgata atatcgactc ttttacgtac aacctggcag 240atcagttgcg ca 252<210>47<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>47ttatgccgcc tgtcatcg 18<210>48<211>19<212>DNA<213>人工序列<220>
<223>引物.
<400>48ataggcttaa tggtaaccg 19<210>49<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>49ctgaacaaca gaagtacg 18<210>50<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>50taaccgtgtc atcgagcg 18<210>51<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>51
aaaaagatct ccatggtaac gatcattcag g 31<210>52<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>52aaaagaattc ttatcacgcg gccttggtct tcgcc 35<210>53<211>19<212>DNA<213>人工序列<220>
<223>引物.
<400>53caaaagctgg atccccacc 19<210>54<211>23<212>DNA<213>人工序列<220>
<223>引物.
<400>54cctatccgag atctctcaac tcc23<210>55<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>55catcccatgg atggtaacga tcattcagga t 31<210>56<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>56gatgtcraga gacactatag aatactcaag c 31
<210>57<211>719<212>PRT<213>血色红假单胞菌(Rhodopseudomonas palustris)<400>57Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr1 5 10 15Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly20 25 30Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val35 40 45Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp50 55 60Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys65 70 75 80Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe85 90 95Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys100 105 110Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp115 120 125Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala130 135 140Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln165 170 175Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro180 185 190Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile195 200 205Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn210 215 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala225 230 235 240Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala245 250 255Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe260 265 270Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys275 280 285Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly290 295 300Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly305 310 315 320Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val325 330335Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu340 345 350Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp355 360 365Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg370 375 380Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu385 390 395 400Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His405 410 415Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln420 425 430Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala435 440 445Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile450 455 460Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala465 470 475 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln485 490 495Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys500 505 510Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val515 520 525Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr530 535 540Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly545 550 555 560Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro565 570 575Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala580 585 590Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln595 600 605Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro610 615 620Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met625 630 635 640Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr Hi s Ser Leu Tyr645 650 655Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr660 665 670Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly675 680 685Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val690 695 700Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala705 710 715<210>58<211>729
<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>58Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Phe35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 15 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>59<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>59Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Tyr35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>60<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>60Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Phe Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720ThrArg Lys Ala Lys Thr Lys Ala Ala725<210>61<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>61Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Cys Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser ILe Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>62<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>62Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Phe Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>63<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>63Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Ala Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Aa Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>64<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>64Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Gly Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>65<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>65Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Trp Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu Hi s Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val Hi s Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>66<211>604<212>PRT<213>人工序列<220>
<223>玉米突变体.
<400>66Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 l5Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
35 40 45Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala50 55 60Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala65 70 75 80Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val85 90 95Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu100 105 110Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly115 120 125Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His130 135 140Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp145 150 155 160His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln165 170 175Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu180 185 190Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp195 200 205Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro210 215 220Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp225 230 235 240Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp245 250 255Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly260 265 270Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val275 280 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly290 295 300Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala305 310 315 320Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile325 330 335Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu340 345 350Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Lys Ala Tyr355 360 365Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu370 375 380Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr385 390 395 400Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln405 410 415Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp420 425 430Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys435 440 445Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile450 455 460Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp465 470 475 480Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys485 490 495Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly500 505 510Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln515 520 525Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His530 535 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val545 550 555 560Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp565 570 575Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala580 585 590Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600<210>67<211>1815<212>DNA<213>人工序列<220>
<223>玉米突变体.
<400>67atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga l20accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatag 1815<210>68<211>2204<212>DNA<213>人工序列<220>
<223>玉米突变体.
<400>68atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga l560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatagtgtgc tatggttatc gtttagttct tgttcatgtt tcttttaccc 1860actttccgtt aaaaaaagat gtcattagtg ggtggagaaa agcaataaga ctgttctcta 1920gaattcgagc tcggtaccgg atccaattcc cgatcgttca aacatttggc aataaagttt 1980cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta 2040cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat 2100gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa 2160ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc 2204<210>69<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400> 69Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Lys Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>70<211>729<212>PRT<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>70
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Ala Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>71<211>264<212>DNA
<213>人工序列<220>
<223>CTP的序列.
<400>71atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240ggtcgcgtca actgcatgca ggcc 264<210>72<211>88<212>PRT<213>人工序列<220>
<223>CTP的序列.
<400>72Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly65 70 75 80Gly Arg Val Asn Cys Met Gln Ala85<210>73<211>264<212>DNA<213>人工序列<220>
<223>CTP的序列.
<400>73atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg 60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180ccgattgaaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240ggtcgcgtca actgcatgca ggcc 264<210>74<211>88<212>PRT<213>人工序列<220>
<223>CTP的序列.
<400>74Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly65 70 75 80Gly Arg Val Asn Cys Met Gln Ala85<210>75<211>2190<212>DNA<213>人工序列<220>
<223>优化的根瘤农杆菌(An optimized A.tumefaciens.)<400>75atggtgacca tcattcagga tgacggtgcc gagacctacg agaccaaggg cggcatccag 60gtgagccgca agcgccgccc caccgattac gccaacgcca tcgataacta catcgaaaag 120cttgattccc atcgcggtgc cgtgttctcc tccaactacg aatacccagg ccgctacacc 180cgctgggata ccgccatcgt cgatccacca ctcggcattt cctgcttcgg ccgcaagatg 240tggatcgaag cctacaacgg ccgcggcgaa gtgctgctcg atttcattac cgaaaagctg 300aaggccacac ccgatctcac cctcggcgct tcctccaccc gccgcctcga tcttaccgtc 360
aacgaaccag accgcgtctt caccgaagaa gaacgctcca aaatcccaac cgtcttcacc420gctctcaggg ccatcgtcga cctcttctac tccagcgccg attccgccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcca tcaagctttc cctggcccgc540ccagaagacc agcgcgacat ggtgctgttc ctgcccgatg aaatcctcgt cgttgatcac600tactccgcca aggcctggat cgaccgctac gatttcgaga aggacggcat gaccaccgac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccacccaag720ggcgatcacc gccccggcga atactccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgctg cgaaagcaac840ccatccgcca tttcccgccg cctgaaggcc atcaacccat ccccctactc cttcttcatc900aacctcggcg atcaggaata cctggtcggc gcctccccag aaatgttcgt gcgcgtctcc960ggccgccgca tcgagacctg cccaatctca ggcaccatca agcgcggcga cgatccaatt 1020gccgacagcg agcagatttt gaaactgctc aactccaaaa aggacgaatc cgaactgacc 1080atgtgctccg acgtggaccg caacgacaag agccgcgtct gcgagccagg ttccgtgaag 1140gtcattggcc gccgccagat cgagatgtac tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc ttcgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccacgcg cctggtacgg cggtgccatc ggcatggtcg gcttcaacgg cgacatgaac 1380accggcctga ccctgcgcac catccgcatc aaggacggta ttgccgaagt gcgcgccggc 1440gccaccctgc tcaacgattc caacccacag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tctcagccat tcgcgacgca aaaggcacca actctgccgc caccaagcgc 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacaccc tggccaacta cttccgccag accggcgcca ccgtctccac cgtcaggtca 1680ccagtcgcag ccgacgtgtt cgatcgcttc cagccagacc tcgttgtcct gtcccccggt 1740cccggcagcc caaccgattt cgactgcaag gcaaccatca aggccgcccg cgcccgcgat 1800ctgccaatct tcggcgtttg cctcggtctg caggcattgg cagaagccta cggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttccc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcaccgtcg gtcgctacca ttccatcttc 1980gccgatcccg ccaccctgcc acgcgatttc atcatcaccg cagaaagcga ggacggcacc 2040atcatgggca tcgaacacgc caaggaacca gtggccgccg ttcagttcca cccagaatcc 2100atcatgaccc tcggtcagga cgccggcatg cgcatgatcg agaacgtcgt ggtgcatctg 2160acccgcaagg ccaagaccaa ggccgcctga2190
<210>76<211>2160<212>DNA<213>血色红假单胞菌(Rhodopseudomonas palustris)<400>76atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat 120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac 180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa 240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag 300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc 360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc 420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac 480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc 540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc 600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc 660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc 720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc 780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg 840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat 900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc 960cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>77<211>733<212>PRT<213>百脉根根瘤菌(Mesorhizobium loti)<400>77Met Glu Thr Ala Met Thr Met Lys Val Leu Glu Asn Gly Ala Glu Ser1 5 10 15Phe Val Thr Ala Gly Gly Ile Thr Ile Thr Arg Glu Arg His Asp Arg20 25 30Pro Tyr Ala Gly Ala Ile Asp Ala Tyr Val Asp Gly Leu Asn Ser Arg35 40 45Arg Gly Ala Val Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr50 55 60Arg Trp Asp Thr Ala Ile Ile Asp Pro Pro Leu Val Ile Ser Ala Arg65 70 75 80Gly Arg Ala Met Arg Ile Glu Ala Leu Asn Arg Arg Gly Glu Ala Leu85 90 95Leu Pro Val Ile Gly Lys Thr Leu Gly Gly Leu Ala Asp Ile Thr Ile100 105 110Ala Glu Thr Thr Lys Thr Leu Ile Arg Leu Asp Val Ala Lys Pro Gly115 120 125Arg Val Phe Thr Glu Glu Glu Arg Ser Arg Val Pro Ser Val Phe Thr130 135 140Val Leu Arg Ala Ile Thr Ala Leu Phe Lys Thr Asp Glu Asp Ala Asn145 150 155 160
Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ser Phe Gln Phe Asp165170 175Pro Val Asp Tyr Lys Leu Glu Arg Lys Pro Ser Gln Arg Asp Leu Val180 185 190Leu Phe Leu Pro Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys195 200 205Ala Trp Thr Asp Arg Tyr Asp Tyr Ser Gly Glu Gly Phe Ser Thr Glu210 215 220Gly Leu Pro Arg Asp Ala Ile Ala Glu Pro Phe Lys Thr Ala Asp Arg225 230 235 240Ile Pro Pro Arg Gly Asp His Glu Pro Gly Glu Tyr Ala Asn Leu Val245 250 255Arg Arg Ala Met Asp Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val260 265 270Pro Gly Gln Met Phe Tyr Glu Arg Cys Glu Thr Gln Pro Ser Asp Ile275 280 285Ser Arg Lys Leu Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile290 295 300Asn Leu Gly Glu Asn Glu Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe305 310 315 320Val Arg Val Asn Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr325 330 335Ile Lys Arg Gly Asp Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys340 345 350Leu Leu Asn Ser Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp355 360 365Val Asp Arg Asn Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg370 375 380Val Ile Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr385 390 395 400Val Asp His Ile Glu Gly Arg Leu Arg Glu Gly Met Asp Ala Phe Asp405 410 415
Ala Phe Leu Ser His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys420 425 430Leu Trp Ala Met Arg Phe Ile Glu Gln Asn Glu Lys Ser Pro Arg Ala435 440 445Trp Tyr Gly Gly Ala Ile Gly Met Val Asn Phe Asn Gly Asp Met Asn450 455 460Thr Gly Leu Thr Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu465 470 475 480Val Arg Ala Gly Ala Thr Leu Leu Phe Asp Ser Ile Pro Glu Glu Glu485 490 495Glu Ala Glu Thr Glu Leu Lys Ala Ser Ala Met Leu Ser Ala Ile Arg500 505 510Asp Ala Lys Thr Gly Asn Ser Ala Ser Thr Glu Arg Thr Thr Ala Arg515 520 525Val Gly Asp Gly Val Asn Ile Leu Leu Val Asp His Glu Asp Ser Phe530 535 540Val His Thr Leu Ala Asn Tyr Phe Arg Gln Thr Gly Ala Asn Val Ser545 550 555 560Thr Val Arg Thr Pro Val Pro Asp Glu Val Phe Glu Arg Leu Lys Pro565 570 575Asp Leu Val Val Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp580 585 590Cys Ala Ala Thr Ile Arg Arg Ala Arg Ala Arg Asp Leu Pro Ile Phe595 600 605Gly Val Cys Leu Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu610 615 620Leu Arg Gln Leu His Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg625 630 635 640Val Ser Lys Pro Gly Ile Ile Phe Ser Gly Leu Pro Lys Glu Val Thr645 650 655Val Gly Arg Tyr His Ser Ile Phe Ala Asp Pro Val Arg Leu Pro Asp
660 665 670Asp Phe Ile Val Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe675 680 685Glu His Arg Lys Glu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser690 695 700Ile Met Thr Leu Gly His Asn Ala Gly Met Arg Ile Ile Glu Asn Ile705 710 715 720Val Ala His Leu Pro Arg Lys Ala Lys Glu Lys Ala Ala725 730<210>78<211>732<212>PRT<213>巴西固氮螺菌(Azospirillum brasilense)<400>78Met Tyr Pro Ala Asp Leu Leu Ala Ser Pro Asp Leu Leu Glu Pro Leu1 5 10 15Arg Phe Gln Thr Arg Gly Gly Val Thr Val Thr Arg Arg Ala Thr Ala20 25 30Leu Asp Pro Arg Thr Ala Leu Asp Pro Val Ile Asp Ala Leu Asp Arg35 40 45Arg Arg Gly Leu Leu Leu Ser Ser Gly Val Glu Ala Pro Gly Arg Tyr50 55 60Arg Arg His Ala Leu Gly Phe Thr Asp Pro Ala Val Ala Leu Thr Ala65 70 75 80Arg Gly Arg Thr Leu Arg Ile Asp Ala Leu Asn Gly Arg Gly Gln Val85 90 95Leu Leu Pro Ala Val Ala Glu Ala Leu Arg Gly Leu Glu Ala Leu Ala100 105 110Gly Leu Glu Glu Ala Pro Ser Arg Val Thr Ala Ser Ser Ala Ser Pro115 120 125Ala Pro Leu Pro Gly Glu Glu Arg Ser Arg Gln Pro Ser Val Phe Ser130 135 140
Val Leu Arg Ala Val Leu Asp Leu Phe Ala Ala Pro Asp Asp Pro Leu145 150 155 160Leu Gly Leu Tyr Gly Ala Phe Ala Tyr Asp Leu Ala Phe Gln Phe Glu165 170 175Pro Ile Arg Gln Arg Leu Glu Arg Pro Asp Asp Gln Arg Asp Leu Leu180 185 190Leu Tyr Leu Pro Asp Arg Leu Val Ala Leu Asp Pro Ile Ala Gly Leu195 200 205Ala Arg Leu Val Ala Tyr Glu Phe Ile Thr Ala Ala Gly Ser Thr Glu210 215 220Gly Leu Glu Cys Gly Gly Arg Asp His Pro Tyr Arg Pro Asp Thr Asn225 230 235 240Ala Glu Ala Gly Cys Asp His Ala Pro Gly Asp Tyr Gln Arg Val Val245 250 255Glu Ser Ala Lys Ala Ala Phe Arg Arg Gly Asp Leu Phe Glu Val Val260 265 270Pro Gly Gln Thr Phe Ala Glu Pro Cys Ala Asp Ala Pro Ser Ser Val275 280 285Phe Arg Arg Leu Arg Ala Ala Asn Pro Ala Pro Tyr Glu Ala Phe Val290 295 300Asn Leu Gly Arg Gly Glu Phe Leu Val Ala Ala Ser Pro Glu Met Tyr305 310 315 320Val Arg Val Ala Gly Gly Arg Val Glu Thr Cys Pro Ile Ser Gly Thr325 330 335Val Ala Arg Gly Ala Asp Ala Leu Gly Asp Ala Ala Gln Val Leu Arg340 345 350Leu Leu Thr Ser Ala Lys Asp Ala Ala Glu Leu Thr Met Cys Thr Asp355 360 365Val Asp Arg Asn Asp Lys Ala Arg Val Cys Glu Pro Gly Ser Val Arg370 375 380Val Ile Gly Arg Arg Met Ile Glu Leu Tyr Ser Arg Leu Ile His Thr385 390 395 400
Val Asp His Val Glu Gly Arg Leu Arg Ser Gly Met Asp Ala Leu Asp405 410 415Ala Phe Leu Thr His Ser Trp Ala Val Thr Val Thr Gly Ala Pro Lys420 425 430Arg Trp Ala Met Gln Phe Leu Glu Asp Thr Glu Gln Ser Pro Arg Arg435 440 445Trp Tyr Gly Gly Ala Phe Gly Arg Leu Gly Phe Asp Gly Gly Met Asp450 455 460Thr Gly Leu Thr Leu Arg Thr Ile Arg Met Ala Glu Gly Val Ala Tyr465 470 475 480Val Arg Ala Gly Ala Thr Leu Leu Ser Asp Ser Asp Pro Asp Ala Glu485 490 495Asp Ala Glu Cys Arg Leu Lys Ala Ala Ala Phe Arg Asp Ala Ile Arg500 505 510Gly Thr Ala Ala Gly Ala Ala Pro Thr Leu Pro Ala Ala Pro Arg Gly515 520 525Gly Glu Gly Arg Arg Val Leu Leu Val Asp His Asp Asp Ser Phe Val530 535 540His Thr Leu Ala Asp Tyr Leu Arg Gln Thr Gly Ala Ser Val Thr Thr545 550 555 560Leu Arg His Ser His Ala Arg Ala Ala Leu Ala Glu Arg Arg Pro Asp565 570 575Leu Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ala Asp Phe Asp Val580 585 590Ala Gly Thr Ile Asp Ala Ala Leu Ala Leu Gly Leu Pro Val Phe Gly595 600 605Val Cys Leu Gly Leu Gln Gly Met Val Glu Arg Phe Gly Gly Ala Leu610 615 620Asp Val Leu Pro Glu Pro Val His Gly Lys Ala Thr Glu Val Arg Val625 630 635 640Leu Gly Gly Ala Leu Phe Ala Gly Leu Pro Glu Arg Leu Thr Val Gly
645 650 655Arg Tyr His Ser Leu Val Ala Arg Arg Asp Arg Leu Pro Ala Asp Leu660 665 670Thr Val Thr Ala Glu Thr Ala Asp Gly Leu Val Met Ala Val Glu His675 680 685Arg Arg Leu Pro Leu Ala Ala Val Gln Phe His Pro Glu Ser Ile Leu690 695 700Ser Leu Asp Gly Gly Ala Gly Leu Ala Leu Leu Gly Asn Val Met Asp705 710 715 720Arg Leu Ala Ala Gly Ala Leu Thr Asp Ala Ala Ala725 730<210>79<211>731<212>PRT<213>马尔他布鲁氏菌(Brucella melitensis)<400>79Met Asn Ala Lys Thr Ala Asp Ser Glu Ile Phe Gln His Glu Thr Ala1 5 10 15Gly Gly Ile Ile Val Glu Arg Val Arg His Leu Thr Ala Tyr Lys Gly20 25 30Ala Ile Glu Ser Tyr Ile Asp Val Leu Asn Glu Trp Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Val Val Ile Thr Ser Arg Ala Arg Thr Met65 70 75 80Arg Ile Glu Ala Leu Asn Ala Arg Gly Val Ile Leu Leu Arg Pro Ile85 90 95Leu Asp Thr Val Lys Ala Leu Ser Glu Val Lys Ile Asp Gln Ser Gly100 105 110Glu Asn Arg Ile Asp Leu Thr Ile Val Glu Pro Val Gly Thr Phe Thr115 120 125
Glu Glu Glu Arg Ser Arg Met Pro Ser Val Phe Thr Val Leu Arg Ala130 135 140Ile Val Gly Leu Phe Phe Ser Glu Glu Asp Ala Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Pro Ile Gln Tyr165 170 175Lys Leu Lys Arg Pro Asp Asp Gln Arg Asp Leu Val Leu Phe Ile Pro180 185 190Asp Glu Ile Phe Val Ala Asp His Tyr Ala Ala Arg Ala Trp Val Asp195 200 205Arg Tyr Glu Phe Arg Cys Gly Gly Ser Ser Thr His Gly Leu Asp Arg210 215 220Ala Thr Pro Val Val Pro Phe Lys Pro Ser Glu Arg Lys Leu Ala Arg225 230 235 240Gly Asp His Asn Pro Gly Glu Tyr Ala Arg Leu Val Glu Arg Ala Lys245 250 255Glu Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Thr260 265 270Phe Tyr Glu Arg Cys His Thr Ala Pro Ser Glu Ile Phe Arg Arg Leu275 280 285Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Glu290 295 300Ser Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Asn305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Glu Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Gly Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Leu Glu Glu Asn Glu Arg Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Met His Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Val Ala Glu Ile Arg Ala Gly465 470 475 480Ala Thr Leu Leu Phe Asp Ser Asn Pro Asp Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Val Arg Asp Ala Gln Lys500 505 510Ser Asn Gln Ile Ala Glu Glu Ser Val Ala Ala Lys Val Gly Glu Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Lys Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Asn Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Gln Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Asp Lys Ala Arg Lys Arg Gln Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Ala Leu Arg Gln Leu610 615 620Arg Val Pro Val His Gly Lys Pro Ser Arg Ile Arg Val Ser Lys Pro
625 630 635 640Glu Arg Ile Phe Ser Gly Leu Pro Glu Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Glu Arg Leu Pro Asp Asp Phe Leu Val660 665 670Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe Glu His Lys His675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly His Asn Ala Gly Met Arg Met Ile Glu Asn Ile Val Thr His Leu705 710 715 720Ala Gly Lys His Lys Ala Arg Arg Thr Asn Tyr725 730<210>80<211>735<212>PRT<213>念珠藻属(Nostoc sp.)<400>80Met Ile Ala Asp Ser His Ser Tyr Arg Thr Asn Gly Asn Val Arg Val1 5 10 15Ser Arg Ser Ile Thr Gln Val Lys Met Glu Thr Ala Leu Glu Glu Ile20 25 30Leu Phe Tyr Leu Asn Ser Gln Arg Gly Gly Leu Leu Thr Ser Ser Tyr35 40 45Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe Val Asn Pro50 55 60Pro Val Glu Leu Ser Thr Ser Gly Asn Thr Phe Thr Leu Thr Ala Leu65 70 75 80Asn Glu Arg Gly Tyr Val Leu Leu Pro Val Ile Phe Glu Cys Leu Ser85 90 95Lys Ser Glu Gln Leu Gln Lys Leu Thr Glu His His His Lys Ile Thr100 105 110Gly Leu Val Lys Ser Thr Pro Glu Phe Phe Ala Glu Glu Glu Arg Ser
115 120 125Lys Gln Pro Ser Thr Phe Thr Val Ile Arg Glu Ile Leu His Ile Phe130 135 140Ser Ser Gln Glu Asp Glu His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr145 150 155 160Asp Leu Val Phe Gln Phe Glu Gln Ile Thr Gln Cys Leu Glu Arg Pro165 170 175Gln Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu Leu Ile Val180 185 190Val Asp Tyr Tyr Gln Gln Gln Ala Phe Arg Leu Glu Tyr Asp Phe Ile195 200 205Thr Ala His Gly Ser Thr Tyr Asp Leu Pro Arg Thr Gly Glu Ser Val210 215 220Asp Tyr Arg Gly Gln Cys Leu Thr Pro Pro Gln Asn Ala Asp His Lys225 230 235 240Ile Gly Glu Tyr Ala Lys Leu Val Glu Phe Ala Leu Asp Tyr Phe Arg245 250 255Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe Phe Thr Ala260 265 270Cys Glu Ala Pro Pro Ser G1n Leu Phe Glu Thr Leu Lys Gln Ile Asn275 280 285Pro Ser Pro Tyr Gly Phe Ile Phe Asn Leu Gly Gly Glu Tyr Ile Ile290 295 300Gly Ala Ser Pro Glu Met Phe Val Arg Val Glu Gly Arg Arg Val Glu305 310 315 320Thr Cys Pro Ile Ser Gly Thr Ile Thr Arg Gly His Asp Ala Ile Asp325 330 335Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys Asp Glu Ala340 345 350Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys Ser Arg Ile355 360 365
Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg Arg Gln Ile Glu Leu370 375 380Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly Ile Leu Arg385 390 395 400Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr Trp Ala Val405 410 415Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Ile Gln Phe Ile Glu Lys420 425 430Asn Glu Arg Ser Val Arg Arg Trp Tyr Gly Gly Ala Val Gly Tyr Leu435 440 445Asn Phe Asn Gly Asn Leu Asn Thr Gly Leu Ile Leu Arg Thr Ile Arg450 455 460Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr Leu Leu Tyr465 470 475 480Asp Ser Ile Pro Gln Ala Glu Glu Gln Glu Thr Ile Thr Lys Ala Ala485 490 495Ala Ala Phe Glu Thr Ile Arg Arg Ala Lys Gln Ile Asp Pro Gln Ile500 505 510Glu Glu Ser Ser Thr Arg Lys Leu Ser Lys Tyr Leu Pro Asp Gly Gln515 520 525Ser Gly Lys His Ile Leu Leu Ile Asp His Glu Asp Ser Phe Val His530 535 540Thr Leu Ala Asn Tyr Ile Arg Ser Thr Gly Ala Thr Val Thr Thr Leu545 550 555 560Arg His Gly Phe Ser Glu Ser Leu Phe Asp Thr Glu Arg Pro Asp Leu565 570 575Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ser Glu Phe Lys Val Gln580 585 590Glu Thr Val Ala Ala Cys Val Arg Arg Gln Ile Pro Leu Phe Gly Val595 600 605Cys Leu Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly610 615 620
Val Leu Asn Tyr Pro Gln His Gly Lys Ser Ser Arg Ile Phe Val Thr625 630 635 640Ala Pro Asp Ser Val Met Phe Gln Asp Leu Pro Glu Ser Phe Thr Val645 650655Gly Arg Tyr His Ser Leu Phe Ala Leu Ser Gln Arg Leu Pro Lys Glu660 665 670Leu Lys Val Thr Ala Ile Ser Asp Asp Glu Val Ile Met Ala Ile Glu675 680 685His Gln Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile690 695 700Met Thr Leu Ala Gly Glu Val Gly Leu Met Met Ile Lys Asn Val Val705 710 715 720Gln Lys Tyr Thr Gln Ser Gln Gln Ser Thr Val Pro Ile Tyr Asp725 730 735<210>81<211>715<212>PRT<213>念珠藻属(Nostoc sp.)<400>81Met Arg Val Ser Arg Ser Thr Thr Glu Val Lys Met Asp Thr Ala Leu1 5 10 15Asp Glu Ile Leu Phe His Leu Asn Gln Val Arg Gly Gly Leu Leu Thr20 25 30Ser Ser Tyr Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe35 40 45Ile Asn Pro Pro Leu Gln Leu Thr Thr Arg Glu Asn Ala Phe Thr Ile50 55 60Ser Ser Leu Asn Pro Arg Gly Gln Val Leu Leu Pro Thr Leu Phe Gln65 70 75 80His Leu Ser Ala Gln Ser Gln Leu Gln Gln Ile Ser Leu Asn His Asp85 90 95Tyr Ile Thr Gly Glu Ile Arg Pro Thr Lys Gln Leu Phe Thr Glu Glu100 105 110
Gln Arg Ser Lys Gln Pro Ser Ala Phe Thr Val Ile Arg Glu Ile Leu115 120 125Gln Ile Phe Ala Ser Asp Glu Asp Glu His Leu Gly Leu Tyr Gly Ala130 135 140Phe Gly Tyr Asp Leu Val Phe Gln Phe Glu Pro Ile Pro Gln Lys Ile145 150 155 160Ala Arg Pro Ala Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu165 170 175Leu Ile Val Val Asp Tyr Tyr Leu Gln Lys Ala Tyr Arg His Gln Tyr180 185 190Glu Phe Ala Thr Glu His Gly Asn Thr Glu His Leu Pro Arg Thr Gly195 200 205Gln Ser Ile Asp Tyr Gln Gly Lys His Leu Leu Pro Asn Gln Thr Ala210 215 220Asp His Gln Pro Gly Glu Tyr Ala Asn Leu Val Glu Gln Ala Leu Asp225 230 235 240Tyr Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe245 250 255Phe Thr Ala Cys Glu Gln Ser Pro Ser Gln Leu Phe Gln Thr Leu Arg260 265 270Gln Ile Asn Pro Ser Pro Tyr Gly Phe Leu Leu Asn Leu Gly Gly Glu275 280 285Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Asp Gly Arg290 295 300Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Arg Arg Gly Glu Asp305 310 315 320Ala Leu Gly Asp Ala Val Gln Ile Arg Gln Leu Leu Ash Ser His Lys325 330 335Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys340 345 350Ser Arg Ile Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg Arg Gln355 360 365
Ile Glu Leu Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly370 375 380Ile Leu Arg Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr385 390 395 400Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met Gln Phe405 410 415Ile Glu Gln His Glu Arg Ser Ala Arg Arg Trp Tyr Gly Gly Ala Val420 425 430Gly Tyr Leu Gly Phe Asn Gly Asn Leu Asn Thr Gly Leu Thr Leu Arg435 440 445Thr Ile Arg Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr450 455 460Val Leu Tyr Asp Ser Ile Pro Ser Ala Glu Glu Glu Glu Thr Ile Thr465 470 475 480Lys Ala Thr Ala Leu Phe Glu Thr Ile Arg Arg His Thr Thr Ala Asn485 490 495Lys Thr Gln Gly Asn Asp Ser His Arg Pro Gly Asp Ile Ala His Asn500 505 510Lys Arg Ile Leu Leu Ile Asp Tyr Glu Asp Ser Phe Val His Thr Leu515 520 525Ala Asn Tyr Ile Arg Thr Thr Gly Ala Thr Val Thr Thr Leu Arg His530 535 540Gly Phe Ala Glu Ser Tyr Phe Asp Ala Glu Arg Pro Asp Leu Val Val545 550 555 560Leu Ser Pro Gly Pro Gly Arg Pro Ser Asp Phe Arg Val Pro Gln Thr565 570 575Val Ala Ala Leu Val Gly Arg Glu Ile Pro Ile Phe Gly Val Cys Leu580 585 590Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly Val Leu595 600 605
Asp Tyr Pro Gln His Gly Lys Pro Ala Arg Ile Ser Val Thr Ala Pro610 615 620Asp Ser Val Leu Phe Gln Asn Leu Pro Ala Ser Phe Ile Val Gly Arg625 630 635 640Tyr His Ser Leu Phe Ala Gln Pro Gln Thr Ile Pro Gly Glu Leu Lys645 650 655Val Thr Ala Ile Ser Glu Asp Asn Val Ile Met Ala Ile Glu His Gln660 665 670Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr675 680 685Leu Ala Gly Glu Val Gly Gln Thr Ile Ile Lys Asn Val Val Gln Thr690 695 700Tyr Thr Gln Thr Leu Glu Thr Ser Ile Tyr Ser705 710 715<210>82<211>719<212>PRT<213>血色红假单胞菌(Rhodopseudomonas palustris)<400>82Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr1 5 10 15Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly20 25 30Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val35 40 45Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp50 55 60Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys65 70 75 80Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe85 90 95Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys100 105 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp115 120 125Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala130 135 140Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln165 170 175Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro180 185 190Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile195 200 205Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn210 215 220Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala225 230 235 240Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala245 250 255Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe260 265 270Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys275 280 285Arg Ile Ash Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly290 295 300Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly305 310 315 320Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val325 330 335Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu340 345 350Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp355 360 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg370 375 380Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu385 390 395 400Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His405 410 415Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln420 425 430Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala435 440 445Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile450 455 460Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala465 470 475 480Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln485 490 495Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys500 505 510Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val515 520 525Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr530 535 540Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly545 550 555 560Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro565 570 575Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala580 585 590Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln595 600 605Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro610 615 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met625 630 635 640Arg Gly Leu Pro Ash Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr645 650 655Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr660 665 670Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly675 680 685Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val690 695 700Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala705 710 715<210>83<211>2160<212>DNA<213>血色红假单胞菌(Rhodopseudomonas palustris)<400>83atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>84<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>84atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc gtttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>85<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>85atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc gtatttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>86<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>86atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg ttcaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>87<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>87atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tgcaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>88<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>88atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccttctatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>89<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>89atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacgcgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>90<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>90atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacgggt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>91<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>91atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc ctggttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>92<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>92atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggtttttaag tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>93<211>2190<212>DNA<213>人工序列<220>
<223>根瘤农杆菌突变体.
<400>93atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cgccttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>94<211>1821<212>DNA<213>稻(0ryza sativa)<400>94atggagtcca tcgccgccgc cacgttcacg ccctcgcgcc tcgccgcccg ccccgccact 60ccggcggcgg cggcggcccc ggttagagcg agggcggcgg tagcggcagg agggaggagg120aggacgagta ggcgcggcgg cgtgaggtgc tccgcgggga agccagaggc aagcgcggtg180atcaacggga gcgcggcggc gcgggcggcg gaggaggaca ggaggcgctt cttcgaggcg240gcggagcgtg ggagcgggaa gggcaacctg gtgcccatgt gggagtgcat cgtctccgac300cacctcaccc ccgtgctcgc ctaccgctgc ctcgtccccg aggacaacat ggagacgccc360agcttcctct tcgagtccgt cgagcagggg cccgagggca ccaccaacgt cggtcgctat420agcatggtgg gagcccaccc agtgatggag gtcgtggcaa aggagcacaa ggtcacaatc480atggaccacg agaagggcaa ggtgacggag caggtcgtgg atgatcctat gcagatcccc540aggagcatga tggaaggatg gcacccgcag cagatcgatc agctccccga ttccttcacc600ggtggatggg tcgggttctt ttcctatgat acagtccgtt atgttgaaaa gaagaagctg660cccttctccg gtgctcccca ggacgatagg aaccttcctg atgttcacct tgggctttat720gatgatgttc tcgtcttcga caatgtcgag aagaaagtat atgtcatcca ttgggtaaat780cttgatcggc atgcaaccac cgaggatgca ttccaagatg gcaagtcccg gctgaacctg840ttgctatcta aagtgcacaa ttcaaatgta cccaagcttt ctccaggatt tgtaaagtta900cacactcggc agtttggtac acctttgaac aaatcaacca tgacaagtga tgagtacaag960aatgctgtta tgcaggctaa ggagcatatt atggctggtg atattttcca gattgtttta 1020agccagaggt ttgagaggca gacatacgcc aatccatttg aagtctatcg agctttacga 1080attgtgaacc caagtccata catggcatat gtacaggcaa gaggctgtgt cctggtagca 1140tctagtccag aaattcttac tcgtgtgagg aagggtaaaa ttattaaccg tccacttgct 1200gggactgttc gaaggggcaa gacagagaag gaagatgaaa tgcaagagca acaactacta 1260agtgatgaaa aacagtgtgc tgaacatatt atgcttgtag atttgggaag gaatgatgtt 1320ggaaaggtct ccaaacctgg atctgtgaag gtggagaaat taatgaacat tgaacgctac 1380tcccatgtca tgcacatcag ttccacggtg agtggagagt tggatgatca tctccaaagt 1440tgggatgccc tgcgagccgc gttgcctgtt ggaacagtta gtggagcacc aaaggtgaaa 1500gccatggagc tgatagacga gctagaggtc acaagacgag gaccatacag tggcggcctt 1560ggagggatat catttgacgg ggacatgctt atcgctcttg cactccgcac cattgtgttc 1620tcaacagcgc caagccacaa cacgatgtac tcatacaaag acaccgagag gcgccgggag 1680tgggtcgctc accttcaggc tggtgctggc attgtcgctg atagcagccc agacgacgag 1740
caacgtgaat gcgagaacaa ggcagccgct ctggctcgag ccatcgatct tgctgaatca 1800gctttcgtag acaaggaata g 1821<210>95<211>1498<212>DNA<213>稻(Oryza sativa)<400>95gaattcaaat tttttatata gagtatttct atacatgaat ttttctaact ttttgttttt 60taaaaaaaat ttgtgtggtg tactgtaata ggaagagaag aaggggagga ggaaggaggg120agaagaggga ggagtatatg gggagggggg gatgaactga tcgcccagcg tgatagctgg180cgatcgagca cccattagaa gggcccaata aaccctggat aattgtcatt gagtggcacc240tttcattgag aagacgttat taggaattgt agaagtggat aattatgcta tctgttgtat300tgagtgtcac tgtcaccgat aaagctttgc tggttaatgc attgtatttc tccatcaacg360cttcatgata caatggtatt tggacgtgtt tataaaataa tatacgtata atgtgggtgg420cctagcggcg gccggttaca catagcagcg atcggtccga tgctagtctt cattcattca480ggtatgtatt caggtatcag tgtgtgggtg atagtttttt tttttcgttt ttctagttac540gatatctcat atctcatagt tgtgatctta taaacttttt catgtttatc aatataaatt600tcgtgttatc tagtcgttaa aagaaccgta taatgtggca aaaaaaatgt ataatgtgtc660agagtttgca cgtgtttatc ttgctgcccc gaaacgatta attcagtgat ttggcaacaa720caaaatgtcg tggcggataa gcatatccgt cccaaaagga aaaaaagaaa aggaaaaata780atctttagaa ataaagccct tactttttcc aagaagcaga ggtaaccgta gctggtattc840cgcggctaac tcaatccctt tctctggagt cttggagcgg cacggcggct gcgcacccga900cctcgcccac cacctgctcg gcgaaacgcc cggctcggcc gcgacgtgtc ccaccgcacc960gcgcgcgcac ccgcgcgccc cgagcccctc gccgcctccg cgcgggcgcc gcacctattt 1020aaatgcggcc ccgatcccgc attctctcaa ctgcactagt ccccaccaac ggctcggtcc 1080agtagagttt atcccccacc tatggccagc ctcgtgctct ccctgcgcat cgcccgttcc 1140acgccgccgc tggggctggg cggggggcga ttccgcggcc gacgaggggc cgtcgcctgc 1200cgcgccgcca cgttccagca gctcgacgcc gtcggtgagt ctccgtatca aatgtggggg 1260ggcatgtctt ggtttgcgga ttggtgggtt gatttgaatg tgtgttctcg tggccgcagc 1320ggtgagggag gaggagtcca agttcaaggc gggggcggcg gagggttgca acatcctgcc 1380gctcaagcga tgcatcttct ccgaccacct cacgccggtg ctcgcgtacc gctgcctcgt 1440cagggaggac gaccgcgagg cgcccagctt cctgtttgag tccgtcgagc agggatcc 1498
<210>96<211>2073<212>DNA<213>玉米(Zea mays)<400>96gaattccgcc aaatcgggct atagatcaaa cgctgcactg tagggagcgt gaagccagcg 60gcgaatggaa tccctagccg ccacctccgt gttcgcgccc tcccgcgtcg ccgtcccggc120ggcgcgggcc ctggttaggg cggggacggt ggtaccaacc aggcggacga gcagccggag180cggaaccagc ggggtgaaat gctctgctgc cgtgacgccg caggcgagcc cagtgattag240caggagcgct gcggcggcga aggcggcgga ggaggacaag aggcggttct tcgaggcggc300ggcgcggggg agcgggaagg ggaacctggt gcccatgtgg gagtgcatca aggggaacct360ggtgcccatg tgggagtgca tcgtgtcgga ccatctcacc cccgtgctcg cctaccgctg420cctcgtcccc gaggacaacg tcgacgcccc cagcttcctc ttcgagtccg tcgagcaggg480gccccagggc accaccaacg tcggccgcta tagcatggtg ggagcccacc cagtgatgga540gattgtggcc aaagaccaca aggttacgat catggaccac gagaagagcc aagtgacaga600gcaggtagtg gacgacccga tgcagatccc gaggaccatg atggagggat ggcacccaca660gcagatcgac gagctccctg aatccttctc cggtggatgg gttgggttct tttcctatga720tacggttagg tatgttgaga agaagaagct accgttctcc agtgctcctc aggacgatag780gaaccttcct gatgtgcact tgggactcta tgatgatgtt ctagtcttcg ataatgttga840gaagaaagta tatgttatcc attgggtcaa tgtggaccgg catgcatctg ttgaggaagc900ataccaagat ggcaggtccc gactaaacat gttgctatct aaagtgcaca attccaatgt960ccccacactc tctcctggat ttgtgaagct gcacacacgc aagtttggta cacctttgaa 1020caagtcgacc atgacaagtg atgagtataa gaatgctgtt ctgcaggcta aggaacatat 1080tatggctggg gatatcttcc agattgtttt aagccagagg ttcgagagac gaacatatgc 1140caacccattt gaggtttatc gagcattacg gattgtgaat cctagcccat acatggcgta 1200tgtacaggca agaggctgtg tattggttgc gtctagtcct gaaattctta cacgagtcag 1260taaggggaag attattaatc gaccacttgc tggaactgtt cgaaggggca agacagagaa 1320ggaagatcaa atgcaagagc agcaactgtt aagtgatgaa aaacagtgtg ccgagcacat 1380aatgcttgtg gacttgggaa ggaatgatgt tggcaaggta tccaaaccag gaggatcagt 1440gaaggtggag aagttgatta ttgagagata ctcccatgtt atgcacataa gctcaacggt 1500tagtggacag ttggatgatc atctccagag ttgggatgcc ttgagagctg ccttgcccgt 1560tggaacagtc agtggtgcac caaaggtgaa ggccatggag ttgattgata agttggaagt 1620tacgaggcga ggaccatata gtggtggtct aggaggaata tcgtttgatg gtgacatgca 1680aattgcactt tctctccgca ccatcgtatt ctcaacagcg ccgagccaca acacgatgta 1740
ctcatacaaa gacgcagata ggcgtcggga gtgggtcgct catcttcagg ctggtgcagg 1800cattgttgcc gacagtagcc cagatgacga acaacgtgaa tgcgagaata aggctgctgc 1860actagctcgg gccatcgatc ttgcagagtc agcttttgtg aacaaagaat agtgtgctat 1920ggttatcgtt tagttcttgt tcatgtttct tttacccact ttccgttaaa aaaagatgtc 1980attagtgggt ggagaaaagc aataagactg ttctctagag aaccgaagaa atatggaaat 2040tgaggttatg gccggaattc ctgcagcccg ggg2073<210>97<211>504<212>DNA<213>小麦(Triticum aestivum)<400>97cccaaacagt ggtggcttag gagggatatc atttgatggt gacatgctta tcgctcttgc 60tctccgcacc attgtgtttt caacagctcc aagccccaat aggatgtact catacaaaag120ctcagatagg ccccgagagt gggttgctca tcttcaggct ggtgcgggca ttgttgctga180tagtatccca gacgatgagc aaaaagaatt tgagaataag gcggctgccc tagctcgggc240aattgatctt gcagagtcgg cttttttaga caaagaatag agtgtctatt aaattatttt300ttttagttgt tcatcatttt tcacccagtt cattttggaa agttgttcat cgttttttca360ccgagttcat attggggaaa aaaagcaata ccgttttgtt gtcctttgaa atgaataaat420ttgagctata ataagatgta ttttgctcat cgggcaaaaa aaaaaaaaaa aatataaaaa480aaaaaaaaaa aaaaaaaaaa aata 504<210>98<211>2161<212>DNA<213>烟草(Nicotiana tabacum)<400>98gtcaaaaatc cccatttcac cgtttcctcg tttctcctcc tcactaattt tgtctctttc 60tcttggtttg ctattgtgct cttgtaggaa tgcagtcgtt acctatctca taccggttgt120ttccggccac ccaccggaaa gttctgccat tcgccgtcat ttctagccgg agctcaactt180ctgcacttgc gcttcgtgtc cgtacactac aatgccgctg ccttcactct tcatctctag240ttatggatga ggacaggttc attgaagctt ctaaaagcgg gaacttgatt ccgctgcaca300aaaccatttt ttctgatcat ctgactccgg tgctggctta ccggtgtttg gtgaaagaag360acgaccgtga agctccaagc tttctctttg aatccgttga acctggtttt cgaggttcta420gtgttggtcg ctacagcgtg gtgggggctc aaccatctat ggaaattgtg gctaaggaac480acaatgtgac tatattggac caccacactg gaaaattgac ccagaagact gtccaagatc540
ccatgacgat tccgaggagt atttctgagg gatggaagcc cagactcatt gatgaacttc600ctgatacctt ttgtggtgga tgggttggtt atttctcata tgacacagtt cggtatgtag660agaacaggaa gttgccattc ctaagggctc cagaggatga ccggaacctt gcagatattc720aattaggact atacgaagat gtcattgtgt ttgatcatgt tgagaagaaa gcacatgtga780ttcactgggt gcagttggat cagtattcat ctcttcctga ggcatatctt gatgggaaga840aacgcttgga aatattagtg tctagagtac aaggaattga gtctccaagg ttatctcccg900gttctgtgga tttctgtact catgcttttg gaccttcatt aaccaaggga aacatgacaa960gtgaggagta caagaatgct gtcttacaag caaaggagca cattgctgca ggagacatat 1020ttcaaatcgt tttaagtcaa cgctttgaga gaagaacatt tgctgaccca tttgaagtgt 1080acagagcatt aagaattgtg aatccaagcc catatatgac ttacatacaa gccagaggct 1140gtattttagt tgcatcgagc ccagaaattt tgacacgtgt gaagaagaga agaattgtta 1200atcgaccact ggctgggaca agcagaagag ggaagacacc tgatgaggat gtgatgttgg 1260aaatgcagat gttaaaagat gagaaacaac gcgcagagca catcatgctg gttgatttag 1320gacgaaatga tgtaggaaag gtgtcaaaac ctggttctgt gaatgtcgaa aagctcatga 1380gcgttgagcg gtattcccat gtgatgcaca taagctccac ggtctctgga gagttgcttg 1440atcatttaac ctgttgggat gcactacgtg ctgcattgcc tgttgggacc gtcagtggag 1500caccaaaggt aaaggccatg gagttgattg atcagctaga agtagctcgg agagggcctt 1560acagtggtgg gtttggaggc atttcctttt caggtgacat ggacatcgca ctagctctaa 1620ggacgatggt attcctcaat ggagctcgtt atgacacaat gtattcatat acagatgcca 1680gcaagcgtca ggaatgggtt gctcatctcc aatccggggc tggaattgtg gctgatagta 1740atcctgatga ggaacagata gaatgcgaga ataaagtagc cggtctgtgc cgagccattg 1800acttggccga gtcagctttt gtaaagggaa gacacaaacc gtcagtcaag ataaatggtt 1860ctgtgccaaa tctattttca agggtacaac gtcaaacatc tgttatgtcg aaggacagag 1920tacatgagaa aagaaactag cgaatatgaa gatgtacata aattctaaag tggttttctt 1980gttcagttta atcttttact ggattgagac tgtagttgct gaagatagtt gtttagaatg 2040accttcattt tggtgttcct gaaaggacag tgcacatata tagcaaattg atcaaatgtt 2100taatccttgt atgcgggtga gaatcaatgc catcagcaat ttggaaaaaa aaaaaaaaaa 2160a 2161<210>99<211>606<212>PRT<213>稻(Oryza sativa)
<400>99Met Glu Ser Ile Ala Ala Ala Thr Phe Thr Pro Ser Arg Leu Ala Ala1 5 10 15Arg Pro Ala Thr Pro Ala Ala Ala Ala Ala Pro Val Arg Ala Arg Ala20 25 30Ala Val Ala Ala Gly Gly Arg Arg Arg Thr Ser Arg Arg Gly Gly Val35 40 45Arg Cys Ser Ala Gly Lys Pro Glu Ala Ser Ala Val Ile Asn Gly Ser50 55 60Ala Ala Ala Arg Ala Ala Glu Glu Asp Arg Arg Arg Phe Phe Glu Ala65 70 75 80Ala Glu Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys85 90 95Ile Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val100 105 110Pro Glu Asp Asn Met Glu Thr Pro Ser Phe Leu Phe Glu Ser Val Glu115 120 125Gln Gly Pro Glu Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly130 135 140Ala His Pro Val Met Glu Val Val Ala Lys Glu His Lys Val Thr Ile145 150 155 160Met Asp His Glu Lys Gly Lys Val Thr Glu Gln Val Val Asp Asp Pro165 170 175Met Gln Ile Pro Arg Ser Met Met Glu Gly Trp His Pro Gln Gln Ile180 185 190Asp Gln Leu Pro Asp Ser Phe Thr Gly Gly Trp Val Gly Phe Phe Ser195 200 205Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Gly210 215 220Ala Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr225 230 235 240Asp Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile
245 250 255His Trp Val Asn Leu Asp Arg His Ala Thr Thr Glu Asp Ala Phe Gln260 265 270Asp Gly Lys Ser Arg Leu Ash Leu Leu Leu Ser Lys Val His Asn Ser275 280 285Asn Val Pro Lys Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Gln290 295 300Phe Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys305 310 315 320Asn Ala Val Met Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe325 330 335Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Gln Thr Tyr Ala Asn Pro340 345 350Phe Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met355 360 365Ala Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu370 375 380Ile Leu Thr Arg Val Arg Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala385 390 395 400Gly Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Glu Met Gln Glu405 410 415Gln Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu420 425 430Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser435 440 445Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met450 455 460His Ile Ser Ser Thr Val Ser Gly Glu Leu Asp Asp His Leu Gln Ser465 470 475 480Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala485 490 495
Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val Thr Arg500 505 510Arg Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp515 520 525Met Leu Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro530 535 540Ser His Asn Thr Met Tyr Ser Tyr Lys Asp Thr Glu Arg Arg Arg Glu545 550 555 560Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser565 570 575Pro Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala580 585 590Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600 605<210>100<211>67<212>PRT<213>稻(Oryza sativa)<400>100Met Cys Val Leu Val Ala Ala Ala Val Arg Glu Glu Glu Ser Lys Phe1 5 10 15Lys Ala Gly Ala Ala Glu Gly Cys Asn Ile Leu Pro Leu Lys Arg Cys20 25 30Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val35 40 45Arg Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu Ser Val Glu50 55 60Gln Gly Ser65<210>101<211>525<212>PRT<213>玉米(Zea mays)<400>101Met Trp Glu Cys Ile Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile
1 5 10 15Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro20 25 30Glu Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln35 40 45Gly Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala50 55 60His Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met65 70 75 80Asp His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met85 90 95Gln Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp100 105 110Glu Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr115 120 125Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala130 135 140Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp145 150 155 160Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His165 170 175Trp Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp180 185 190Gly Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn195 200 205Val Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe210 215 220Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn225 230 235 240Ala Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln245 250 255
Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe260 265 270Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala275 280 285Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile290 295 300Leu Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly305 310 315 320Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln325 330 335Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val340 345 350Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Gly Ser355 360 365Val Lys Val Glu Lys Leu Ile Ile Glu Arg Tyr Ser His Val Met His370 375 380Ile Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp385 390 395 400Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro405 410 415Lys Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg420 425 430Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met435 440 445Gln Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser450 455 460His Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp465 470 475 480Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro485 490 495Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg500 505 510
Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asn Lys Glu515 520 525<210>102<211>92<212>PRT<213>小麦(Triticum aestivum)<400>102Pro Asn Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Leu1 5 10 15Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser Pro20 25 30Asn Arg Met Tyr Ser Tyr Lys Ser Ser Asp Arg Pro Arg Glu Trp Val35 40 45Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ile Pro Asp50 55 60Asp Glu Gln Lys Glu Phe Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala65 70 75 80Ile Asp Leu Ala Glu Ser Ala Phe Leu Asp Lys Glu85 90<210>103<211>616<212>PRT<213>烟草(Nicotiana tabacum)<400>103Met Gln Ser Leu Pro Ile Ser Tyr Arg Leu Phe Pro Ala Thr His Arg1 5 10 15Lys Val Leu Pro Phe Ala Val Ile Ser Ser Arg Ser Ser Thr Ser Ala20 25 30Leu Ala Leu Arg Val Arg Thr Leu Gln Cys Arg Cys Leu His Ser Ser35 40 45Ser Leu Val Met Asp Glu Asp Arg Phe Ile Glu Ala Ser Lys Ser Gly50 55 60Asn Leu Ile Pro Leu His Lys Thr Ile Phe Ser Asp His Leu Thr Pro65 70 75 80
Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro85 90 95Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Phe Arg Gly Ser Ser Val100 105 110Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Ser Met Glu Ile Val Ala115 120 125Lys Glu His Asn Val Thr Ile Leu Asp His His Thr Gly Lys Leu Thr130 135 140Gln Lys Thr Val Gln Asp Pro Met Thr Ile Pro Arg Ser Ile Ser Glu145 150 155 160Gly Trp Lys Pro Arg Leu Ile Asp Glu Leu Pro Asp Thr Phe Cys Gly165 170 175Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Asn180 185 190Arg Lys Leu Pro Phe Leu Arg Ala Pro Glu Asp Asp Arg Asn Leu Ala195 200 205Asp Ile Gln Leu Gly Leu Tyr Glu Asp Val Ile Val Phe Asp His Val210 215 220Glu Lys Lys Ala His Val Ile His Trp Val Gln Leu Asp Gln Tyr Ser225 230 235 240Ser Leu Pro Glu Ala Tyr Leu Asp Gly Lys Lys Arg Leu Glu Ile Leu245 250 255Val Ser Arg Val Gln Gly Ile Glu Ser Pro Arg Leu Ser Pro Gly Ser260 265 270Val Asp Phe Cys Thr His Ala Phe Gly Pro Ser Leu Thr Lys Gly Asn275 280 285Met Thr Ser Glu Glu Tyr Lys Asn Ala Val Leu Gln Ala Lys Glu His290 295 300Ile Ala Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu305 310 315 320Arg Arg Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Ile325 330 335
Val Asn Pro Ser Pro Tyr Met Thr Tyr Ile Gln Ala Arg Gly Cys Ile340 345 350Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Arg Arg355 360 365Ile Val Asn Arg Pro Leu Ala Gly Thr Ser Arg Arg Gly Lys Thr Pro370 375 380Asp Glu Asp Val Met Leu Glu Met Gln Met Leu Lys Asp Glu Lys Gln385 390 395 400Arg Ala Glu His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly405 410 415Lys Val Ser Lys Pro Gly Ser Val Asn Val Glu Lys Leu Met Ser Val420 425 430Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val Ser Gly Glu435 440 445Leu Leu Asp His Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro450 455 460Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile465 470 475 480Asp Gln Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly485 490 495Gly Ile Ser Phe Ser Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr500 505 510Met Val Phe Leu Asn Gly Ala Arg Tyr Asp Thr Met Tyr Ser Tyr Thr515 520 525Asp Ala Ser Lys Arg Gln Glu Trp Val Ala His Leu Gln Ser Gly Ala530 535 540Gly Ile Val Ala Asp Ser Asn Pro Asp Glu Glu Gln Ile Glu Cys Glu545 550 555 560Asn Lys Val Ala Gly Leu Cys Arg Ala Ile Asp Leu Ala Glu Ser Ala565 570 575Phe Val Lys Gly Arg His Lys Pro Ser Val Lys Ile Asn Gly Ser Val
580 585 590Pro Asn Leu Phe Ser Arg Val Gln Arg Gln Thr Ser Val Met Ser Lys595 600 605Asp Arg Val His Glu Lys Arg Asn610 615<210>104<211>1776<212>DNA<213>陆地棉(Gossypium hirsutum)<220>
<221>misc_feature<223>α亚基.
<400>104atgcaggcat ccatgtcggt tacctcgacg aactccacat taccaatgcc agtgcaaagc 60agccttggat tctctcaccg cttccttcct tcatctcatc ggttttctca acttccgatc120acccgctttt ctcccgctcc tacttcactc aaatgcaggg gctctctttc aagctttcca180cttgttaatg atgaaaagaa gtttgtggag gcggccaaaa aagcaaattt agtccccctt240tatcgttgca ttttctctga tcaactgact ccagtgcttg cataccggtg tttggttaaa300gaagatgata gagaggctcc aagttttctc tttgagtcag tggagcctgg ttctcgggtt360tctagtgttg gtcgatatag cgtggttgga gctcaaccga caatggaaat tgtggcaaaa420gaaaacaaag ttatgattat ggatcatgag gcagggaatt tgactgagga ggtcgttgag480gatccgatgt gtattcccaa gagaatctca gagacttgga aaccccgact tgttgaagat540cttcctgatg cgttttgtgg tggatgggtt ggttatttct cctatgatac agttcgttat600gtggagaaga aaaagcttcc gttcactaag gcaccacgtg atgacagaaa cctgccagat660atacatctag gactctacaa cgacgtgatt gtatttgatc atgtggaaaa gaaagcatat720ataattcact gggtgaggct agataaacac tcgtctgttg agaaagctta taatgaagga780gttgaacacc tagagaaatt ggtagctaga gtacaagatg ttgagctacc aaagctatct840ccaggctctg tagcattaca aacccatcac tttggccctt ctttaaagaa ctcaaatatg900gaaaaggaag agttcaagaa agctgtactg aaagcgaaag agcatattct ggcaggggat960attttccaga ttgtattaag ccaacgtttt gaacggagaa catttgctga cccctttgaa 1020atatatagag ctttgcgagt tgtgaatcca agtccatata tggcctactt gcaagctaga 1080ggaagtattc tagttgcttc aagtcccgaa attcttacca gggtaaagaa gaataagatt 1140gtgaataggc cattggctgg aacaacaagg agaggaaaga ctcaggctga agatgagctg 1200gcagaaaagc tattgctaag taatgaaaag gaatgtgcag aacacatcat gcttgttgat 1260
ttgggtcgca atgatgttgg aaaggtctcc aaatatggtt ctgtaaaggt ggagaagctg 1320atgaatattg aacgatattc ccatgtgatg cacataagct ccacggttac tggtgagttg 1380caggatcatc tcactagttg ggatgtcctc cgtgctgcac ttcccgttgg aactgttagt 1440ggagcaccaa aggtgaaggc gatggagcta atcgatgagt tagaggtgtc aagacgaggt 1500ccttatagcg gaggatttgg gggcatttcc ttcactgggg atatggatat tgcgttggct 1560ctcaggacca tggtattccc tacaggtagc cgctatgaca caatgtactc atacaaaggt 1620tccagcagac gccaagaatg ggtagcttat cttcaagccg gcgctggtgt agttgcagac 1680agtgatcctg atgccgagca cctcgaatgt caaaacaaag ctgctggcct tgctcgttcc 1740attgacctag cggaggctgc attcgttcat aaatga 1776<210>105<211>843<212>DNA<213>陆地棉(Gossypium hirsutum)<220>
<221>misc_feature<223>β亚基.
<400>105atggcagcta atattataac ccaatcatct ctgcttcagc caaaacctgc actttctgct 60aaaacccttc aaatcccatc tctgcatcgc ttatccggcc tccctcctcc atcaagggtt120ggcttttttc tggaaaagaa aacggggatt gttggaaaag ctccattaaa atcggctgta180tcggactcaa cctcgtcagt tttggagaac aagaaaaaca gcaagaatcc cattgtcgtc240attgacaatt acgacagttt cacttacaat ctttgccagt atattggaga gcttggatgt300tacttcgagg tttttcgaaa tgacgaatta actgtagaag acttaaaaat gaaaaaccct360aggggagtgc ttatctctcc tggtccagga acaccccaag attccggaat atcactgcag420actgttttgg aacttggacc tactgtacct ttgtttggtg tttgtatggg tttgcagtgc480attggtgagg cttttggagg aaagatagtg cgttctccct atggtgttat gcatggcaaa540agttcccctg tatattatga cgaaaagggg gaagacggtt tgttatctgg attgtcaaac600cctttcaatg ctggcagata tcatagcctc gtgattgaaa aggacagttt ccctgaggaa660gcacttgagg ttactgcttg gacagaagat ggactgataa tggctgctag gcacaaagtt720tataagcatc tgcagggtgt tcaattccat ccagagagca tcataacctc tgaaggaaaa780acaattgttc ggaatttcat caaactaatc gagagaaagg aggtggcagg atccaagaat840tag 843
<210>106<211>1704<212>DNA<213>大豆(Glycine max)<220>
<221>misc_feature<223>α亚基.
<400>106atggcgactg ttccgcaccc attatccctc gcaagtgtag gttttgctaa ccgaacctcc 60tccatctcca gatccactct caaatgctgc gctcaatctc cttctccttc actagttgac120aacgcccaga agtttctcga agcttccaag aaggggaacg tcattcctct cttccgctgc180atattttccg atcacctcac tccggtgctt gcgtaccggt gcctggttaa ggaggacgag240agagatgctc cgagttttct ctttgaatcg gtcgagccag gccaaatttc tagcatcgga300cggtacagtg tggttggagc acagccgtgt atggaaattg tggcgaaaga gaacgtggtt360actattatgg accacgtgga agggcgcagg agtgaggaaa ttgtagagga tcctctggtg420attcctcgta ggatcatgga gaagtggacg cctcaactct tagatgaact tcctgaagcg480ttttgtggtg gttgggtagg gtatttctct tatgatacaa tgcgctatgt agaaaagaag540aaacttccat tttctaatgc cccagtagat gacagaaacc ttcctgatgt tcatctgggc600ctttatgaca gtgtgattgt gtttgatcat gttgaaaaga aagcatatgt gattcattgg660gttcgggtgg atcgatattc ttcagctgag gaggccttcg aagatggaag gaaccggctg720gaaactctag tatctcgggt gcatgatata attaccccaa ggctgcctac aggttcgata780aagttataca ctcgtctctt tggtcctaaa ctggagatgt caaacatgac aaatgaggag840tataagaggg cagtattgaa ggctaaagag cacatacggg ctggtgatat ttttcaaatt900gtactaagtc aacgttttga acagagaact tttgcagacc catttgaaat ctacagagca960ttgaggattg ttaatcctag tccatatatg acttatttac aggccagagg aagtattttg 1020gttgcttcaa gtccagaaat tcttacacgg gtgaagaaga gaaagatcac caatcggccc 1080cttgctggta ctgttagaag aggaaaaaca ccaaaagaag atatcatgtt ggagaaacaa 1140cttttgaatg atgaaaagca atgtgcagag cacgtaatgc tagttgattt ggggagaaat 1200gatgttggaa aggtctccaa accgggttct gttcaagttg aaaagcttat gaatattgag 1260cgctattccc atgttatgca catcagctca acagtcacag gggagttatt agatcactta 1320acaagctggg atgcattgcg tgctgcttta cctgttggta cagttagcgg agcaccgaag 1380gtcaaagcca tgcagttgat tgatgagttg gaagtcgcaa gaagggggcc ctatagtggg 1440ggatttggag gtatatcatt caatggcgat atggacatag cccttgctct gaggaccata 1500gttttcccta caaatgctcg ttatgacaca atgtactcct acaaggataa gaacaaacgc 1560
agagaatggg ttgcccatct ccaggctgga gcgggaattg tggctgacag tgatcctgct 1620gatgaacaaa gagagtgcga gaacaaagct gcagctcttg ctcgtgccat tgatcttgca 1680gaatcttcat ttgttgataa ataa 1704<210>107<21l>837<212>DNA<213>大豆(Glycine max)<220>
<221>misc_feature<223>β亚基.
<400>107atggctgcca cattcttctc tcacttgtcg cttcttcaat ccaacaacaa cccttctctc 60tctcacacac cctctcgctt ccctcattct ctcaccaacc gtgtcaaacc ctccctcggt120gtggtatctg tggccaaaag ggtaagtgga gtggtgccaa aggccaattt gaatgccttg180gaggccaatt cgggtttccc catttcggct aagaagtcca acaacaaccc cattgttgtt240attgacaact atgacagttt cacctataat ctttgccagt atatggggga gttagggttt300cactttgagg tctaccgcaa tgatgagttg acagtggagg agttaagaag gaaaaatccc360agaggagtgc tgatatcacc tgggccagga gaacctcaag attcaggcat atctttgcaa420acggttttgg aacttggacc aactgtgcca ttgtttggtg tgtgcatggg tttgcaatgc480attggagagg cttttggagg gaagattgtt cgttctcctc atggtgttat gcatggaaaa540agctctatgg tttactatga tgagaaagga gaagatggat tacttgctgg actatcaaat600cctttcttgg ctggtagata tcacagcctt gtaattgaaa aagagagctt tcctcatgat660gaacttgagg caacagcatg gacagaagat ggtcttataa tggctgctcg tcataagaaa720tataagcatc tacagggtgt tcagtttcat ccagagagca tcataacccc agaaggcaag780acaattgtcc gtaattttgt caagcttatc gagaaaaggg aggctggtgg ctcttga 837<210>108<211>591<212>PRT<213>陆地棉(Gossypium hirsutum)<220>
<221>MISC_FEATURE<223>α亚基.
<400>108Met Gln Ala Ser Met Ser Val Thr Ser Thr Asn Ser Thr Leu Pro Met1 5 10 15
Pro Val Gln Ser Ser Leu Gly Phe Ser His Arg Phe Leu Pro Ser Ser20 25 30His Arg Phe Ser Gln Leu Pro Ile Thr Arg Phe Ser Pro Ala Pro Thr35 40 45Ser Leu Lys Cys Arg Gly Ser Leu Ser Ser Phe Pro Leu Val Asn Asp50 55 60Glu Lys Lys Phe Val Glu Ala Ala Lys Lys Ala Asn Leu Val Pro Leu65 70 75 80Tyr Arg Cys Ile Phe Ser Asp Gln Leu Thr Pro Val Leu Ala Tyr Arg85 90 95Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu100 105 110Ser Val Glu Pro Gly Ser Arg Val Ser Ser Val Gly Arg Tyr Ser Val115 120 125Val Gly Ala Gln Pro Thr Met Glu Ile Val Ala Lys Glu Asn Lys Val130 135 140Met Ile Met Asp His Glu Ala Gly Asn Leu Thr Glu Glu Val Val Glu145 150 155 160Asp Pro Met Cys Ile Pro Lys Arg Ile Ser Glu Thr Trp Lys Pro Arg165 170 175Leu Val Glu Asp Leu Pro Asp Ala Phe Cys Gly Gly Trp Val Gly Tyr180 185 190Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe195 200 205Thr Lys Ala Pro Arg Asp Asp Arg Asn Leu Pro Asp Ile His Leu Gly210 215 220Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala Tyr225 230 235 240Ile Ile His Trp Val Arg Leu Asp Lys His Ser Ser Val Glu Lys Ala245 250 255Tyr Asn Glu Gly Val Glu His Leu Glu Lys Leu Val Ala Arg Val Gln260 265 270
Asp Val Glu Leu Pro Lys Leu Ser Pro Gly Ser Val Ala Leu Gln Thr275 280 285His His Phe Gly Pro Ser Leu Lys Asn Ser Asn Met Glu Lys Glu Glu290 295 300Phe Lys Lys Ala Val Leu Lys Ala Lys Glu His Ile Leu Ala Gly Asp305 310 315 320Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe Ala325 330 335Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Val Val Asn Pro Ser Pro340 345 350Tyr Met Ala Tyr Leu Gln Ala Arg Gly Ser Ile Leu Val Ala Ser Ser355 360 365Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val Asn Arg Pro370 375 380Leu Ala Gly Thr Thr Arg Arg Gly Lys Thr Gln Ala Glu Asp Glu Leu385 390 395 400Ala Glu Lys Leu Leu Leu Ser Asn Glu Lys Glu Cys Ala Glu His Ile405 410 415Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Tyr420 425 430Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His435 440 445Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln Asp His Leu450 455 460Thr Ser Trp Asp Val Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser465 470 475 480Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val485 490 495Ser Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe Thr500 505 510Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro Thr515 520 525
Gly Ser Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Gly Ser Ser Arg Arg530 535 540Gln Glu Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Val Val Ala Asp545 550 555 560Ser Asp Pro Asp Ala Glu His Leu Glu Cys Gln Asn Lys Ala Ala Gly565 570 575Leu Ala Arg Ser Ile Asp Leu Ala Glu Ala Ala Phe Val His Lys580 585 590<210>109<211>280<212>PRT<213>陆地棉(Gossypium hirsutum)<220>
<221>MISC_FEATURE<223>β亚基.
<400>109Met Ala Ala Asn Ile Ile Thr Gln Ser Ser Leu Leu Gln Pro Lys Pro1 5 10 15Ala Leu Ser Ala Lys Thr Leu Gln Ile Pro Ser Leu His Arg Leu Ser20 25 30Gly Leu Pro Pro Pro Ser Arg Val Gly Phe Phe Leu Glu Lys Lys Thr35 40 45Gly Ile Val Gly Lys Ala Pro Leu Lys Ser Ala Val Ser Asp Ser Thr50 55 60Ser Ser Val Leu Glu Asn Lys Lys Asn Ser Lys Asn Pro Ile Val Val65 70 75 80Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Ile Gly85 90 95Glu Leu Gly Cys Tyr Phe Glu Val Phe Arg Asn Asp Glu Leu Thr Val100 105 110Glu Asp Leu Lys Met Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly115 120 125Pro Gly Thr Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu
130 135 140Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys145 150 155 160Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro Tyr Gly Val165 170 175Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Lys Gly Glu Asp180 185 190Gly Leu Leu Ser Gly Leu Ser Asn Pro Phe Asn Ala Gly Arg Tyr His195 200 205Ser Leu Val Ile Glu Lys Asp Ser Phe Pro Glu Glu Ala Leu Glu Val210 215 220Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Val225 230 235 240Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr245 250 255Ser Glu Gly Lys Thr Ile Val Arg Asn Phe Ile Lys Leu Ile Glu Arg260 265 270Lys Glu Val Ala Gly Ser Lys Asn275 280<210>110<211>567<212>PRT<213>大豆(Glycine max)<220>
<221>MISC_FEATURE<223>α亚基.
<400>110Met Ala Thr Val Pro His Pro Leu Ser Leu Ala Ser Val Gly Phe Ala1 5 10 15Asn Arg Thr Ser Ser Ile Ser Arg Ser Thr Leu Lys Cys Cys Ala Gln20 25 30Ser Pro Ser Pro Ser Leu Val Asp Asn Ala Gln Lys Phe Leu Glu Ala35 40 45
Ser Lys Lys Gly Asn Val Ile Pro Leu Phe Arg Cys Ile Phe Ser Asp50 55 60His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Glu65 70 75 80Arg Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Gln Ile85 90 95Ser Ser Ile Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Cys Met Glu100 105 110Ile Val Ala Lys Glu Asn Val Val Thr Ile Met Asp His Val Glu Gly115 120 125Arg Arg Ser Glu Glu Ile Val Glu Asp Pro Leu Val Ile Pro Arg Arg130 135 140Ile Met Glu Lys Trp Thr Pro Gln Leu Leu Asp Glu Leu Pro Glu Ala145 150 155 160Phe Cys Gly Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Met Arg Tyr165 170 175Val Glu Lys Lys Lys Leu Pro Phe Ser Asn Ala Pro Val Asp Asp Arg180 185 190Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Ser Val Ile Val Phe195 200 205Asp His Val Glu Lys Lys Ala Tyr Val Ile His Trp Val Arg Val Asp210 215 220Arg Tyr Ser Ser Ala Glu Glu Ala Phe Glu Asp Gly Arg Asn Arg Leu225 230 235 240Glu Thr Leu Val Ser Arg Val His Asp Ile Ile Thr Pro Arg Leu Pro245 250 255Thr Gly Ser Ile Lys Leu Tyr Thr Arg Leu Phe Gly Pro Lys Leu Glu260 265 270Met Ser Asn Met Thr Asn Glu Glu Tyr Lys Arg Ala Val Leu Lys Ala275 280 285Lys Glu His Ile Arg Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln290 295 300
Arg Phe Glu Gln Arg Thr Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala305 310 315 320Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Thr Tyr Leu Gln Ala Arg325 330 335Gly Ser Ile Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys340 345 350Lys Arg Lys Ile Thr Asn Arg Pro Leu Ala Gly Thr Val Arg Arg Gly355 360 365Lys Thr Pro Lys Glu Asp Ile Met Leu Glu Lys Gln Leu Leu Asn Asp370 375 380Glu Lys Gln Cys Ala Glu His Val Met Leu Val Asp Leu Gly Arg Asn385 390 395 400Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Gln Val Glu Lys Leu405 410 415Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val420 425 430Thr Gly Glu Leu Leu Asp His Leu Thr Ser Trp Asp Ala Leu Arg Ala435 440 445Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met450 455 460Gln Leu Ile Asp Glu Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly465 470 475 480Gly Phe Gly Gly Ile Ser Phe Asn Gly Asp Met Asp Ile Ala Leu Ala485 490 495Leu Arg Thr Ile Val Phe Pro Thr Asn Ala Arg Tyr Asp Thr Met Tyr500 505 510Ser Tyr Lys Asp Lys Asn Lys Arg Arg Glu Trp Val Ala His Leu Gln515 520 525Ala Gly Ala Gly Ile Val Ala Asp Ser Asp Pro Ala Asp Glu Gln Arg530 535 540Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala Ile Asp Leu Ala545 550 555 560
Glu Ser Ser Phe Val Asp Lys565<210>111<211>278<212>PRT<213>大豆(Glycine max)<220>
<221>MISC_FEATURE<223>β亚基.
<400>111Met Ala Ala Thr Phe Phe Ser His Leu Ser Leu Leu Gln Ser Asn Asn1 5 10 15Asn Pro Ser Leu Ser His Thr Pro Ser Arg Phe Pro His Ser Leu Thr20 25 30Asn Arg Val Lys Pro Ser Leu Gly Val Val Ser Val Ala Lys Arg Val35 40 45Ser Gly Val Val Pro Lys Ala Asn Leu Asn Ala Leu Glu Ala Asn Ser50 55 60Gly Phe Pro Ile Ser Ala Lys Lys Ser Asn Asn Asn Pro Ile Val Val65 70 75 80Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly85 90 95Glu Leu Gly Phe His Phe Glu Val Tyr Arg Asn Asp Glu Leu Thr Val100 105 110Glu Glu Leu Arg Arg Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly115 120 125Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu130 135 140Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys145 150 155 160Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro His Gly Val165 170 175Met His Gly Lys Ser Ser Met Val Tyr Tyr Asp Glu Lys Gly Glu Asp
180 185 190Gly Leu Leu Ala Gly Leu Ser Asn Pro Phe Leu Ala Gly Arg Tyr His195 200 205Ser Leu Val Ile Glu Lys Glu Ser Phe Pro His Asp Glu Leu Glu Ala210 215 220Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Lys225 230 235 240Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr245 250 255Pro Glu Gly Lys Thr Ile Val Arg Asn Phe Val Lys Leu Ile Glu Lys260 265 270Arg Glu Ala Gly Gly Ser275<210>112<211>2210<212>DNA<213>大豆(Glycine max)<220>
<221>3′UTR<222>(1919)..(2210)<223>
<220>
<221>misc_feature<223>α亚基.
<220>
<221>5′UTR<222>(1)..(214)<223>
<400>112aaagaaatga cctgaagtct ctatatattc caggtaacga agaccttagc aacccaatga 60acgcgtcccc atgaacggca cgtgtagcgg agtactaggc cgccgttaca cgctactgct120gtccgtcgtc accgtttgaa ttacccaccg ctactttgtc gtcattcttc ttcttcttcc180cttttcattg accttttcct tccttcgtcc tccaatggcg actgttccgc acccattatc240cctcgcaagt gtaggttttg ctaaccgaac ctcctccatc tccagatcca ctctcaaatg300ctgcgctcaa tctccttctc cttcactagt tgacaacgcc cagaagtttc tcgaagcttc360caagaagggg aacgtcattc ctctcttccg ctgcatattt tccgatcacc tcactccggt420gcttgcgtac cggtgcctgg ttaaggagga cgagagagat gctccgagtt ttctctttga480
atcggtcgag ccaggccaaa tttctagcat cggacggtac agtgtggttg gagcacagcc540gtgtatggaa attgtggcga aagagaacgt ggttactatt atggaccacg tggaagggcg600caggagtgag gaaattgtag aggatcctct ggtgattcct cgtaggatca tggagaagtg660gacgcctcaa ctcttagatg aacttcctga agcgttttgt ggtggttggg tagggtattt720ctcttatgat acaatgcgct atgtagaaaa gaagaaactt ccattttcta atgccccagt780agatgacaga aaccttcctg atgttcatct gggcctttat gacagtgtga ttgtgtttga840tcatgttgaa aagaaagcat atgtgattca ttgggttcgg gtggatcgat attcttcagc900tgaggaggcc ttcgaagatg gaaggaaccg gctggaaact ctagtatctc gggtgcatga960tataattacc ccaaggctgc ctacaggttc gataaagtta tacactcgtc tctttggtcc 1020taaactggag atgtcaaaca tgacaaatga ggagtataag agggcagtat tgaaggctaa 1080agagcacata cgggctggtg atatttttca aattgtacta agtcaacgtt ttgaacagag 1140aacttttgca gacccatttg aaatctacag agcattgagg attgttaatc ctagtccata 1200tatgacttat ttacaggcca gaggaagtat tttggttgct tcaagtccag aaattcttac 1260acgggtgaag aagagaaaga tcaccaatcg gccccttgct ggtactgtta gaagaggaaa 1320aacaccaaaa gaagatatca tgttggagaa acaacttttg aatgatgaaa agcaatgtgc 1380agagcacgta atgctagttg atttggggag aaatgatgtt ggaaaggtct ccaaaccggg 1440ttctgttcaa gttgaaaagc ttatgaatat tgagcgctat tcccatgtta tgcacatcag 1500ctcaacagtc acaggggagt tattagatca cttaacaagc tgggatgcat tgcgtgctgc 1560tttacctgtt ggtacagtta gcggagcacc gaaggtcaaa gccatgcagt tgattgatga 1620gttggaagtc gcaagaaggg ggccctatag tgggggattt ggaggtatat cattcaatgg 1680cgatatggac atagcccttg ctctgaggac catagttttc cctacaaatg ctcgttatga 1740cacaatgtac tcctacaagg ataagaacaa acgcagagaa tgggttgccc atctccaggc 1800tggagcggga attgtggctg acagtgatcc tgctgatgaa caaagagagt gcgagaacaa 1860agctgcagct cttgctcgtg ccattgatct tgcagaatct tcatttgttg ataaataatt 1920tggattgatc catcatcagt gatgctcctt gataactgag gggcatcctt tttaaatggt 1980agagaggaag tttgtggtgt gggcagatga taggggatat gaattacgga gaatctgaaa 2040ctttgataat gttatgacag aagtgatgaa cataataagg tatttaatga taatgacagc 2100tttgtgactt tagttaagtc gtcgtttaag agacttcaat agccatttcc gtcggtccat 2160cttaaaccaa agaaaggtgc ctttgacgga gtttcttttg ctatcataaa 2210<210>113<211>988<212>DNA
<213>大豆(Glycine max)<220>
<221>3′UTR<222>(926)..(988)<223>
<220>
<221>misc_feature<223>β亚基.
<220>
<221>5′UTR<222>(1)..(88)<223>
<400>113actcggctat gcatccaacg cgttgggagc tctcccatat ggtcgacctg caggcggccg 60cgaattcact agtgattaac atttgaacat ggctgccaca ttcttctctc acttgtcgct120tcttcaatcc aacaacaacc cttctctctc tcacacaccc tctcgcttcc ctcattctct180caccaaccgt gtcaaaccct ccctcggtgt ggtatctgtg gccaaaaggg taagtggagt240ggtgccaaag gccaatttga atgccttgga ggccaattcg ggtttcccca tttcggctaa300gaagtccaac aacaacccca ttgttgttat tgacaactat gacagtttca cctataatct360ttgccagtat atgggggagt tagggtttca ctttgaggtc taccgcaatg atgagttgac420agtggaggag ttaagaagga aaaatcccag aggagtgctg atatcacctg ggccaggaga480acctcaagat tcaggcatat ctttgcaaac ggttttggaa cttggaccaa ctgtgccatt540gtttggtgtg tgcatgggtt tgcaatgcat tggagaggct tttggaggga agattgttcg600ttctcctcat ggtgttatgc atggaaaaag ctctatggtt tactatgatg agaaaggaga660agatggatta cttgctggac tatcaaatcc tttcttggct ggtagatatc acagccttgt720aattgaaaaa gagagctttc ctcatgatga acttgaggca acagcatgga cagaagatgg780tcttataatg gctgctcgtc ataagaaata taagcatcta cagggtgttc agtttcatcc840agagagcatc ataaccccag aaggcaagac aattgtccgt aattttgtca agcttatcga900gaaaagggag gctggtggct cttgaaaatc gaattcccgc ggccgccatg gcggccggga960gcatgcgacg tcgggccbaw kcggmgtt 988<210>114<211>47<212>PRT<213>玉米(Zea mays)<220>
<221>misc_feature<223>CTP的序列.
<400>114Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 15Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser35 40 45<210>115<211>32<212>PRT<213>玉米(Zea mays)<220>
<221>misc_feature<223>CTP的序列.
<400>115Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Ser Ser1 5 10 15Arg Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg20 25 30<210>116<211>849<212>DNA<213>玉米(Zea mays)<400>116atggcctgct cccacatcgt cgccgccgcg ggggtctcct cccccgccgc agcggcggct 60cgttccccgg cgcattctcc cgctgccgcc ttcgcgcgcc tccggtcgac gcctcgtttc120gcgagcgctg gcttgtcggt taagggaaac ggagcggcgt tcccgttggt cgccgccgcg180gggccggccg cggcggcacc ggtggccgac ctggacggcc gcccggccac ggagaagcag240cccatcatcg tcatcgacaa ctacgacagc ttcacataca acctctgcca gtatatgggg300gagcttggat tgaacttcga agtataccgc aatgatgaac tgaccataga agatgtgaga360aggaagaacc caaggggaat acttatttct ccaggacctg gtgaaccaca agattcggga420atatcattgc agactgttct tgaattaggc ccaaccatcc caatttttgg agtttgcatg480ggtctgcaat gcattggaga ggcatttgga ggaaagatta tccgtgctcc ttctggagtg540atgcatggga aaagctctcc agtttattac gatgaggaat taggaaaggc attgttcaat600ggcttgccaa acccttttac tgccgcgagg taccacagct tggtcattga gcaagaaacc660
ttcccacatg atgctttgga ggctactgca tggactgaag atggacttat catggctgct720cgccacaaga agtacaaaca catccagggt gtccaattcc acccggagag catcatcacc780cctgaaggca agaaaatcat cctcaacttt gtcagattca ttgaggaact ggagaagcag840cgttcgtag849<210>117<211>273<212>PRT<213>稻(0ryza sativa)<400>117Met Ala Thr Ala Ala Arg Leu Leu Pro Lys Ile Gln Ser Pro Ala Ser1 5 10 15Pro Ala Val Ala Glu Ala Arg Arg Arg Arg Pro Ser Ser Leu Arg Leu20 25 30Gly Val Thr Ser Gly Pro Ala Arg Thr Leu Lys Gln Lys Leu Val Ala35 40 45Lys Ser Ala Val Ser Val Val Glu Gly Glu Asn Ala Phe Asp Gly Val50 55 60Lys Gln Asp Thr Arg Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe65 70 75 80Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Val Gly Ala Asn Phe Glu85 90 95Val Tyr Arg Asn Asp Asp Ile Thr Val Glu Glu Ile Lys Lys Ile Ser100 105 110Pro Arg Gly Ile Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp Ser115 120 125Gly Ile Ser Leu Gln Thr Val Gln Asp Leu Gly Pro Ser Thr Pro Leu130 135 140Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly145 150 155 160Lys Val Val Arg Ser Pro Tyr Gly Val Val His Gly Lys Gly Ser Leu165 170 175Val His Tyr Glu Glu Lys Leu Asp Gly Thr Leu Phe Ser Gly Leu Pro180 185 190
Asn Pro Phe Gln Ala Gly Arg Tyr His Ser Leu Val Ile Glu Lys Asp195 200 205Ser Phe Pro His Asp Ala Leu Glu Ile Thr Ala Trp Thr Asp Asp Gly210 215 220Leu Ile Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly Val225 230 235 240Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Arg Leu Met Val245 250 255Lys Asn Phe Ile Lys Ile Ile Glu Gly Tyr Glu Ala Leu Asn Cys Leu260 265 270Pro<210>118<211>282<212>PRT<213>玉米(Zea mays)<400>118Met Ala Cys Ser His Ile Val Ala Ala Ala Gly Val Ser Ser Pro Ala1 5 10 15Ala Ala Ala Ala Arg Ser Pro Ala His Ser Pro Ala Ala Ala Phe Ala20 25 30Arg Leu Arg Ser Thr Pro Arg Phe Ala Ser Ala Gly Leu Ser Val Lys35 40 45Gly Asn Gly Ala Ala Phe Pro Leu Val Ala Ala Ala Gly Pro Ala Ala50 55 60Ala Ala Pro Val Ala Asp Leu Asp Gly Arg Pro Ala Thr Glu Lys Gln65 70 75 80Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys85 90 95Gln Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp100 105 110Glu Leu Thr Ile Glu Asp Val Arg Arg Lys Asn Pro Arg Gly Ile Leu
115 120 125Ile Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln130 135 140Thr Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met145 150 155 160Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala165 170 175Pro Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu180 185 190Glu Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala195 200 205Ala Arg Tyr His Ser Leu Val Ile Glu Gln Glu Thr Phe Pro His Asp210 215 220Ala Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala225 230 235 240Arg His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu245 250 255Ser Ile Ile Thr Pro Glu Gly Lys Lys Ile Ile Leu Asn Phe Val Arg260 265 270Phe Ile Glu Glu Leu Glu Lys Gln Arg Ser275 280<210>119<211>822<212>DNA<213>稻(Oryza sativa)<400>119atggccaccg ccgcgcggct cctccccaag atccagtccc ccgcctcccc ggccgtcgcg 60gaggcgcgga ggcgccgccc ctccagtctc cgattaggag ttactagtgg acccgcaaga120actctgaagc aaaagcttgt tgctaagagt gctgtttctg tggtggaagg tgaaaacgca180tttgatggag taaagcaaga tactagacca atcatagtta tagataacta cgatagcttc240acgtataatt tatgccagta catgggtgag gtgggagcta actttgaggt gtaccgcaat300gatgatatca ccgtggaaga aattaagaag atttctccta gaggaatact catctcccct360ggccctggca cacctcaaga ttcaggaata tcattgcaaa cagttcaaga tcttggacct420
tctacacctt tgtttggggt ttgcatgggt ttgcagtgta ttggggaggc atttggaggg480aaggttgttc gttctcctta tggagttgtg catgggaaag gatcccttgt tcactatgag540gagaaacttg atggaacact gttttctggt ctcccaaacc cattccaagc gggaagatac600cacagccttg taattgagaa ggatagcttc ccacatgatg ccctggaaat tactgcttgg660acagacgatg ggctgatcat ggctgctcgc cacaggaagt acaaacatat acagggtgtg720cagttccatc cagagagcat cataacaaca gaagggaggc tcatggtcaa gaatttcatc780aagattattg aaggctacga ggccttgaat tgcttaccgt ga 822<210>120<211>867<212>DNA<213>稻(Oryza sativa)<400>120atggcgtgct cccacctggc cgccgccgcc gccgcggcct ccccggcggc cgcgcgttca 60ccggcggcct ccagcgccgc aaccgcgagc gccttcgcgc gcctctcggc gacgccccgg120gtcgcgagcg gcgggttggc cgttaggggc cagaggggtg tagccgctgt tgtcgccgcc180gccgccgggg ccgccgcggc gacgcccgtg gccgacatcg aggaacgccg ggccaccgag240aagcagccca tcattgtcat cgataactac gacagcttta cctacaacct ctgccagtat300atgggggagc ttggattgaa ctttgaggta tatcgcaatg atgaacttac catagaggat360gtaaagagga agaacccaag aggaatactt atttctccag ggcctggtga gccacaagat420tcaggtatat cattgcagac tgttctggaa cttggaccta ccatcccaat ttttggtgtc480tgcatgggtc tgcagtgtat cggggaagct tttggaggaa agattatccg tgctccttct540ggtgtcatgc atggaaaaag ctctccagtt cgctacgatg aggagctagg gaaggccttg600ttcaatggct tgccaaaccc atttaccgct gcaagatacc atagcttggt gatcgagcag660gagaccttcc cccatgacgc tctggaagcc accgcgtgga ctgaagatgg ccttatcatg720gctgctcgcc acaagaagta caggcacatc cagggagtcc aattccaccc agagagcatc780atcaccccag aaggcaagag gatcattctc aacttcgtga ggttcatcga ggagctggag840aagcagcgtg ccggagagaa gaactag867<210>121<211>2202<212>DNA<213>百脉根根瘤菌(Mesorhizobium loti)<400>121atggagacgg caatgacgat gaaggttctg gaaaacggcg ctgaaagctt cgtgaccgcg 60ggtggcatca ccattacgcg tgagcgccac gaccggccct atgcgggtgc gatcgacgct120tatgtcgatg gcttgaactc gcgccgcggc gcggtgtttt cctccaacta cgaatatccc180
ggccgctata cgcgctggga caccgccatc atcgatccgc cgctggtcat ttccgcgcgg240ggccgcgcca tgcgcatcga agcgctgaac cgccgcggcg aggcgctgtt gccggtgatc300ggcaaaacgc tgggcggcct tgccgacatc accatcgccg agacgacgaa gacgctcatc360cgcctcgacg tcgccaagcc cggccgcgtc ttcacggagg aagagcgcag ccgcgtgccc420tcggtcttca ccgtgctgcg cgccatcacc gctttgttca aaaccgacga ggacgccaat480ctcggcctct atggcgcctt cggctacgac ctctccttcc agttcgaccc ggtcgactac540aagctcgagc gcaagcccag ccagcgcgac ctcgtgctgt tcctgcccga cgagatcctg600gtcgtcgacc actattccgc caaagcctgg accgaccgct acgactattc gggcgaagga660ttttcgaccg aaggtctgcc gcgcgacgca atcgccgagc cgttcaagac cgccgaccgc720atcccgccgc gcggtgacca tgagccgggc gaatacgcta atctggtgcg gcgtgccatg780gactcgttca agcgcggcga cctgttcgag gtcgtgcccg gccagatgtt ctacgagcgc840tgcgagacgc agccctccga catttcgcgc aagctgaaat cgatcaaccc ctcgccttat900tcgttcttca tcaacctcgg cgaaaacgaa tatctgatcg gcgcctcgcc cgaaatgttc960gtgcgcgtca atggccgccg cgtcgaaacc tgcccgattt cgggcaccat caaacgcggc 1020gacgacgcca tttccgatag cgagcagatc ctgaagctgc tcaattcgaa gaaggacgaa 1080tccgagctca caatgtgctc ggacgtcgac cgcaacgaca agtcgcgggt ctgcgagccc 1140ggctcggtgc gcgtcatcgg ccgccgccag atcgagatgt attcgcgcct catccacacc 1200gtcgatcaca tcgaaggccg gctgcgcgaa ggcatggacg ctttcgacgc cttcctgtcg 1260catgcctggg cggtcactgt caccggcgcg ccgaaactgt gggccatgcg cttcatcgag 1320cagaacgaga agagcccgcg cgcctggtat ggcggcgcaa tcggcatggt caacttcaac 1380ggcgacatga acaccggcct gacgctgcgc accatccgca tcaaggacgg cattgccgaa 1440gtgcgggccg gcgcgacatt gctgttcgac agcattcccg aggaagaaga agccgaaacc 1500gaactgaagg catccgccat gctctccgcc atccgcgacg ccaagacggg caactccgcc 1560agcaccgagc gcaccaccgc gcgggtcggc gacggcgtca acatcctgct cgtcgaccac 1620gaggactctt tcgtccacac gctggccaac tacttccgcc agaccggcgc caatgtctcg 1680accgtgcgca cgccggtgcc ggacgaagtg ttcgagcggc tgaagccgga ccttgtcgtg 1740ctctcacccg gaccgggtac gccgaaggat ttcgattgcg ccgcgaccat cagacgagcg 1800cgcgcccgcg acctgccgat cttcggcgtc tgcctaggcc tgcaggcgct ggccgaggcc 1860tatggcgggg aactgcgcca gctgcatatt cccatgcacg gcaagccctc gcgcatccgc 1920gtctccaagc ccggcatcat cttctccggc ctgcccaagg aagtcactgt cggccgttac 1980cactcgatct tcgccgatcc ggtgcgcttg cccgatgatt tcattgtcac ggcagagact 2040
gaggacggca tcatcatggc tttcgagcac cgcaaggagc cgatcgcggc ggtgcagttc 2100cacccggaat cgatcatgac gctcggccac aatgccggca tgcgcatcat cgagaacatc 2160gtcgcccatt tgccgcgcaa ggccaaggaa aaggcagcct ga 2202<210>122<211>2199<212>DNA<213>巴西固氮螺菌(Azospirillum brasilense)<400>122atgtaccccg ccgaccttct tgcctcgccc gacctcctcg aaccgctgcg tttccagacg 60cgcggcggcg tcaccgtcac gcggcgggcg acggcgctcg acccgcggac cgccctcgac120ccggtgatcg acgcgctgga ccgccgccgc ggcctgctgc tgtccagcgg ggtggaggcg180ccgggccgct accgccgtca cgcgctgggc ttcaccgacc ccgcggtggc gctcacggcg240cgtgggcgga cgctgcgcat cgacgcgctg aacgggcggg ggcaagtgct gctgcccgcc300gtcgccgagg ccctgcgtgg cctggaggcc ctggccggtc tagaggaggc gccgtcgcgg360gtcactgcct cgtccgcaag cccagcaccc cttcccggag aggagcggag ccgccagccc420tccgttttct cggtcctgcg ggcggtgctg gatctgtttg ccgcccccga cgacccgttg480ctcgggctct acggggcctt cgcctacgac ctcgccttcc agttcgagcc gatccgccag540cggttggagc ggcccgacga ccagcgcgat ctgctgctct acctgccgga ccggctcgtc600gcgctggacc ccatcgcagg actcgcccgg ctcgtcgcgt atgagttcat cacggcggcg660ggcagcaccg aggggctgga gtgcggcggg cgcgaccacc cctaccgtcc cgacaccaac720gccgaggccg gctgcgacca cgcgcccggt gactatcagc gcgtcgtcga gagcgccaag780gccgccttcc gccgcggcga cctgttcgag gtggtgcccg gccagacctt cgccgagccc840tgcgccgacg cgccttcgtc ggtgttccgg cggctgcgcg ccgccaaccc ggcgccttac900gaggccttcg tcaacctcgg gcggggcgag ttcctcgtcg ccgccagccc ggagatgtat960gtgcgggtgg cgggcgggcg ggtggaaacc tgcccgatct ccggcaccgt ggcgcgcggg 1020gccgacgcgc tgggcgacgc cgcgcaggtc ctgcgcctgc tgacctcggc caaggacgcg 1080gcggagctga ccatgtgcac cgacgtggac cgcaacgaca aggcgcgggt gtgcgagccg 1140ggatccgtcc gggtgatcgg gcggcggatg atcgagctgt actcccgtct gatccacacg 1200gtggaccatg tggagggacg gctgcggtcc ggaatggacg cgctggacgc cttcctcacc 1260cacagctggg cggtgacggt gaccggcgcg cccaagcgct gggccatgca gttcctggag 1320gatacggagc aatcgccgcg ccgctggtac ggcggggcct tcggccggct gggcttcgac 1380ggcgggatgg acaccggcct gaccctgcgc accatccgca tggccgaggg cgttgcctac 1440gtgcgggcgg gggcgacgct gctgtccgac agcgatccgg acgcggagga cgcggagtgc 1500
cgcctgaagg ccgccgcctt ccgcgacgcc atccgcggga cggcggcggg tgcggcgccc 1560acgctgccgg cggctccccg tggcggggag ggcaggcggg tgctgctggt ggatcacgac 1620gacagcttcg tccacacgct ggccgactat ctgcgccaga cgggcgcttc ggtgacgacg 1680ctgcgtcaca gtcacgcacg ggcggcgctg gcggagcgga ggccggatct ggtcgtgctg 1740tcccccggtc cggggcgccc ggcggatttc gacgtggcgg gcaccatcga cgcggcgctg 1800gcgctcggcc tgccggtgtt cggcgtctgc ctgggcctgc aagggatggt ggagcgcttc 1860ggcggcgcgc tggacgtgct gccggagccc gtccacggca aggcgacgga ggtccgggtg 1920ctgggcggcg cgctgttcgc cggcctgccg gagcggctga cggtcgggcg ctaccactct 1980ctggtggccc ggcgcgaccg gctgccggcg gacctcacgg tgaccgcgga gaccgccgac 2040ggtctggtga tggcggtcga gcaccggcgg cttccgctcg ccgccgtgca gttccacccc 2100gagtcgatcc tgtcgctcga cggtggggcc ggtcttgccc tgctgggcaa cgtgatggac 2160cggctggccg ccggcgccct gacggacgct gcggcttga 2199<210>123<211>2196<212>DNA<213>马尔他布鲁氏菌(Brucella melitensis)<400>123atgaatgcga agactgcgga tagcgagata ttccagcacg aaacggcagg cggtatcatc 60gtcgagcggg tgcgccacct cacggcctat aagggcgcca ttgaaagcta tatcgatgtg120ctgaacgaat ggcgcggtgc ggtgttctcg tccaattacg aatatccggg ccgctatacg180cgatgggata ccgcaattgt cgatccgccg gtcgtcatca cgtcgcgtgc ccgcacgatg240cgcatcgagg cgctgaacgc gcgcggcgtc atcctgcttc ggcccattct ggataccgtc300aaggcgcttt cggaagtaaa gatcgaccag tccggcgaaa accgtatcga tctgacgatt360gtggaaccgg tcggcacctt cacggaagaa gaacgctcgc gcatgccctc ggtctttacg420gtgctgcgcg ccatagtcgg gcttttcttc tcggaggagg atgccaatct cggcctttat480ggcgcctttg gctatgatct ggcgttccag ttcgatccca tccagtacaa gctgaagcgc540ccggacgacc agcgtgacct cgtgctgttc attcccgacg aaatcttcgt cgccgaccat600tatgcggcgc gcgcctgggt ggaccgttat gaatttcgct gcggcggttc gtccacgcac660ggtcttgatc gcgcgacgcc ggtggtgcct ttcaagccat cggagcgcaa gcttgcgcgc720ggcgatcata atccgggtga atatgccagg cttgtcgagc gcgccaagga aagcttcaag780cgcggcgacc tgttcgaggt tgtgccgggc cagaccttct atgagcgctg ccacacggcg840ccgtcggaga ttttccgccg gctgaagtcg atcaatcctt cgccctattc ctttttcatc900aatctgggcg agagcgaata tctggtcggc gcatcgccgg aaatgtttgt gcgcgtcaat960
gggcggcgca tcgagacctg cccgatttcc ggcaccatca agcgcggtga agatgcaatt 1020tcggattctg agcagatatt gaaactgctt aattccaaga aggacgaatc cgagctgacc 1080atgtgttcgg atgtggaccg caacgacaag agccgcgttt gcgagccggg ttcggtgcgt 1140gttatcggtc gccgccagat cgagatgtat tcccgcctga tccatacggt cgatcatatc 1200gaaggccgcc tgcgtgacgg catggatgcg tttgacggct tcctcagcca tgcatgggct 1260gtgacggtga caggcgcgcc gaagctgtgg gcaatgcgct ttcttgagga aaacgaacgc 1320agcccgcgcg catggtatgg cggcgcgatc ggcatgatgc atttcaatgg cgatatgaat 1380acagggctga cgctgcgcac catccgcatc aaggatggtg tggcggaaat ccgtgcaggg 1440gcgacgcttc tgttcgattc caaccctgac gaggaagaag ccgagaccga attgaaggca 1500tcggccatga ttgcggctgt gcgggacgca cagaagagca atcagatcgc ggaagaaagt 1560gtggcggcaa aggtgggtga gggggtttcg atcctgctgg tcgatcacga ggattccttc 1620gtccatacgc ttgccaatta tttccgccag acgggcgcca aggtttccac cgtgcgttca 1680ccggtggcag aggagatatt cgaccgcgtc aatcccgatc tggtggtgtt atcgccggga 1740ccgggctcgc cgcaggattt cgattgcaag gcgaccatcg ataaggcgcg caagcgccag 1800cttccgattt ttggcgtctg cctcggcctt caggccctgg cggaagccta tggcggggcg 1860ttgcgccagc ttcgcgttcc ggtgcatggc aagccttcac gcatccgcgt atcaaagccg 1920gagcgcattt tctccggctt gccggaggaa gtgacggtgg ggcgttatca ttcgatcttc 1980gccgatcctg aacgcctgcc ggatgatttt ctcgtcacag ccgaaacgga agacgggatc 2040atcatggctt ttgaacataa acatgaaccg gtggcagccg ttcaattcca tcccgaatcc 2100atcatgacgc ttggccataa tgccggtatg cgcatgatcg agaatatcgt gacgcatctt 2160gcaggcaagc acaaggcgcg ccgcaccaac tattga 2196<210>124<211>2148<212>DNA<213>念珠藻属(Nostoc sp.)<400>124gtgcgcgtat ctcgtagcac aaccgaggtg aagatggaca ctgcactaga tgaaattctc 60tttcacctaa atcaagtacg tggaggtttg ttaaccagta gttacgaata tccagggcga120tacaaaagat gggcgattgg attcattaat cccccattac aactgacaac aagagagaac180gcatttacca tctcttcact caatcctcgc ggacaggtgc tactaccaac cttgttccag240catctatcag cccagtcgca actacaacaa atcagcctca atcatgacta catcacaggt300gaaattcgac ccacaaaaca gttattcaca gaagaacaac ggagtaaaca accgtcagcc360tttacagtca tccgcgaaat tctccagatt tttgcgagtg atgaagacga gcatttaggg420
ttatatggtg catttggtta cgacttagta tttcaatttg aaccaattcc ccaaaaaatt480gctcgtcccg cagaccaacg ggatttagtc ctgtatctac ccgatgaact catagttgta540gattactatc tacaaaaagc atatcgtcac cagtatgaat ttgccacaga acatggcaac600accgagcatc ttccacggac aggccagtcc atcgactacc agggtaaaca tcttctacca660aaccaaactg ctgaccatca accaggagaa tatgccaacc tagttgagca agcactcgac720tacttccgcc ggggtgactt atttgaagta gttcctagtc aaaacttttt tacagcctgt780gaacaatcac ccagtcaact attccagacc ttaaggcaaa ttaatcctag tccttatgga840tttctgttga atttgggtgg tgaatatctc ataggtgcat caccagaaat gtttgtgcga900gttgatggta ggcgagtgga aacctgtccc attagtggca ctattagacg gggagaagat960gctttaggcg acgctgtaca aattcgtcag ttgcttaact cccataaaga tgaagccgag 1020ttaacaatgt gtactgacgt agaccgcaac gataaatcgc ggatttgtga acccggttca 1080gtcagggtga ttggtcgtcg ccagattgaa ctgtacagcc acctcattca tacagtagac 1140catgtagaag ggatactgag gccggaattt gacgctttag atgccttctt gagtcatact 1200tgggcagtta cagtcacagg cgcacccaaa cgagccgcca tgcagttcat cgaacagcat 1260gaacgcagcg cccgtcgttg gtatggggga gcagttggtt atttaggctt taatggtaac 1320ttgaataccg gattaacctt gcggacaatt cgtttacaag actccatcgc cgaagtgcga 1380gttggtgcaa cagtccttta cgactccatt ccgtcagccg aagaagagga aacaattact 1440aaagcgactg cattatttga gaccattcgc cgtcatacca ctgccaataa aactcaagga 1500aacgatagtc atcgccctgg ggatatcgcc cacaataagc gtatcctcct catcgactac 1560gaagattcat ttgttcacac attagccaat tacatccgca ccaccggcgc aaccgtcacc 1620accctacgtc atggttttgc tgaatcatat tttgatgcag aacgcccaga cttagtggta 1680ttgtctcccg gccctggtag acccagtgac ttccgagttc cccaaacggt tgcagccttg 1740gtaggtcgag aaatccccat ttttggcgtt tgtctgggat tacaaggcat agtggaagct 1800tttggcggag aattaggcgt gcttgattat ccccaacacg gtaaacccgc acggatttca 1860gtgactgcac ctgattctgt gctgtttcaa aatttaccag catccttcat cgtgggtaga 1920taccattcct tatttgccca accccaaact atacccggtg aactcaaagt cacagcgatt 1980tctgaggaca atgtaattat ggcaattgaa caccaaacac tacctatagc cgccgtccaa 2040tttcatccag agtcaatcat gaccctagca ggagaagttg gtcagacaat cattaaaaat 2100gtggtgcaga catataccca aactttagaa acatcaattt actcttag2148<210>125<211>2208<212>DNA
<213>念珠藻属(Nostoc sp.)<400>125atgattgccg attcccacag ctacagaact aatggtaacg tgcgtgtctc tcgctccatc 60acacaagtta aaatggagac agctttagaa gagattcttt tctacttaaa ctctcagcgt120ggtggattgc tgactagtag ctatgaatat ccaggaagat ataaaagatg ggcaattggt180tttgttaatc cacctgtaga attatccaca agcggaaata cttttactct cacagcatta240aatgagcgtg gctatgtact tttaccagtg atctttgagt gtttatcaaa atcagaacaa300ctccagaaac tcactgaaca tcatcataaa attactggat tagttaaatc tacaccagaa360ttttttgccg aagaagaacg tagtaaacaa ccttctacat ttacggttat tcgggaaata420ctacatatct tctctagtca agaagacgaa catttaggat tatatggtgc gtttggttat480gacttagttt tccaatttga gcaaataacc caatgcttag aacgtccaca agaccaacga540gatttagttc tatatttacc cgacgaattg atagttgtag actactatca acaacaagca600tttcggctag agtatgactt catcacagcg catggtagta cttatgattt gccccgcacg660ggagaatctg ttgattatcg aggtcaatgt ttaacacctc ctcaaaatgc tgaccataaa720ataggtgagt atgccaaact agtagaattt gcccttgatt atttccgtcg gggtgactta780tttgaagtgg ttcccagtca gaattttttc acagcttgcg aagcaccacc aagccaacta840tttgaaactt taaaacaaat aaatcctagt ccctatggat ttatttttaa tcttggtgga900gaatacatca ttggcgcttc accagaaatg tttgtacggg tggaaggtag gcgtgtagaa960acttgtccta ttagtggcac tattactaga gggcatgatg ctatagatga tgctgtgcag 1020attcgtcagt tactcaactc ccacaaagac gaagcagagt tgactatgtg tactgacgta 1080gaccgtaacg ataagtctcg catctgtgaa cccggttcag tcaaggtgat tggtcgccgg 1140caaattgaat tatatagcca cttaattcat acggtagacc atgtagaagg cattctccga 1200ccagagtttg atgctttaga tgctttcctc agtcacactt gggctgttac agtcacaggc 1260gcaccgaaaa gggctgctat tcaattcatc gaaaagaacg aacgcagcgt cagacgttgg 1320tatggtggcg cggttgggta tttgaatttt aacgggaatt taaatactgg gttaatttta 1380aggacaatca gattgcaaga ctcaattgct gaagtgcgag ttggtgctac tctactgtat 1440gactccatac cccaagcaga agaacaagaa accatcacta aagctgcggc tgcttttgaa 1500acgattcggc gtgctaaaca aatagaccca cagattgaag aatctagtac tagaaagtta 1560agcaaatatc ttcccgatgg acaatcaggt aaacacatct tactaattga ccatgaagac 1620tcatttgttc ataccctagc taactacatc cgttccactg gtgcaactgt caccacactg 1680cgtcacggct tctcagaatc cctatttgat acagaacgcc cagacttagt agtattatct 1740cctggccccg gtagaccgag tgaatttaaa gtacaggaaa ccgtcgccgc ctgcgtccgt 1800
cgccaaatac ctctgtttgg tgtctgttta ggactgcaag gtattgtgga agctttcggt 1860ggagaattgg gagtattgaa ttatccccaa catggtaaat cttcgcggat ttttgttaca 1920gcacccgatt ctgtgatgtt tcaagatttg cccgaatctt ttacagtcgg gagatatcat 1980tcattatttg cactatcaca acgcttacca aaagaactga aggtgacagc gatttctgat 2040gatgaggtga ttatggcgat tgaacatcag acactaccta tcgccgccgt ccagtttcat 2100ccagaatcaa tcatgactct agctggagaa gttggtttaa tgatgatcaa aaatgtggtg 2160caaaaatata cacaaagtca acagtcaaca gttcccatct atgactaa2208<210>126<211>2160<212>DNA<213>血色红假单胞菌(Rhodopseudomonas palustris)<400>126atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc960cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>127<211>2166<212>DNA<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)<400>127atgaacagga cagtctttgc cctcccggcc agaagcgatt acgtgacccg cggcggtctc 60gcgatcacgc gcgtggcgga gcagtttacc ggcggcgcga gccggctcga cgatctcgtc120aacctgctcg accgccgccg cggcgtggtg ctgtcctcgg gcacgaccgt gccgggccgc180tacgagagct tcgacctcgg cttctccgat ccgccgctca agctcgagac cacaggcgtc240aatttcaagc tggaagccct gaacgagcgc ggccaggtgc tgatcgcctt ccttgccgat300gtcctgcgcg agccctgcgt ggtgatatcc gaaaagaccg cttcgcgcct cgccggccac360atcatccgcg gcgatgcccc ggtcgaggaa gaccagcgca cccggcgcgc cagcgtggtg420tcgctggtgc gcgacctcgt cgccgccttc tccgccaatg acgacgggct gctcggcctg480ttcggcgcct tcgcctacga tctcgtgttc cagatcgagg atctcgtgca gaagcgcgcg540cgcgagagcg accagcgcga catcgtgctc tacgttcccg atcgcctgct ggcctatgac600cgcgccaccg gccgcggcgt cgtgctcagc tacgacttca cgtggaaggg cagatccacc660gagggcctgc cgcgcgagac cgccgacagc ccgtacatga agacaccgcg ccagggcttt720gccgatcatg cgcccggcga ataccaggcc accgtcgaga ccgcgcgcgc ggcctttgcc780
cgcggcgatc tgttcgaggc cgtgccgggc cagctgttcg ccgagccctg cgatcgttct840ccggcggaag tgttccagcg cctctgtgtc atcaacccgt cgccctacgg cgcgctgatg900aatctcggcg acggcgagtt tctcgtctcc gcctcgcccg agatgttcgt gcgttcggac960ggccgccgcg tcgagacctg cccgatctcg ggcaccatcg cgcgcggcac cgatgcgatc 1020ggcgatgccg agcagatccg ccagctcctg aattcggaga aggacgagtt cgagctcaac 1080atgtgcaccg acgttgatcg caacgacaag gcgcgcgtct gcgtccccgg caccatcaag 1140gtgctggcgc gccggcagat cgagacctac tcaaaactgt tccacaccgt cgaccacgtc 1200gagggcatgc tgcgtcccgg cttcgacgcg ctcgatgcct tcctcaccca tgcctgggcc 1260gtcaccgtga caggtgcgcc gaagctctgg gcgatgcagt tcgtcgagga tcacgagcgg 1320tcgccgcggc gctggtatgc gggtgcgatc ggcgcggtga atttcgacgg cagcatcaat 1380accggcctca ccatccgcac catccgcatg aaggatggtc tcgccgaggt gcgcgtcggc 1440gccacctgcc tgttcgattc cgatcccgct gccgaggacc gcgaatgcca ggtcaaggcg 1500gcggcgctgt tccaggcgct gcgcggcgat ccgccaaaac cgctctcgac ctttgcgccc 1560gatgcgaccg gaagcggcaa gcgggtgctg ctgatcgacc acgacgacag cttcgtgcac 1620atgctcgccg actatttccg ccaggtcggc gccagcgtca ccgtggtccg ctatgtgcat 1680gcgctcgaca tgctcaagca gaagaggtgg gatttgctgg tgctgtcgcc cggcccgggc 1740aggcccgaag atttcgggat caggaagacg atcgatgcgg cgctggagaa caagctgccg 1800gtgttcggcg tctgcctcgg cgtgcaggcg atcggcgaat attttggcgg cgagctcggc 1860cagctcacgc atcccgccca cggccggccc tcgcgggtgc aggtgcgcgg cggccgcctg 1920atgcgcaatt tgccgagcga gatcgtgatc ggccgctatc actcgctcta tgtcgagcgc 1980gacagcatgc cggaggtttt gtccgtcacc gccagcaccg aggacggcgt cgctatggcg 2040ctggagcaca agaccctgcc ggtcgcgggc gtgcaattcc acccggagtc gctgatgtcg 2100ctcggcggcg aggtgggctt gaggattgtc gagaacgcgt tccggctgga tgcgcgtgtt 2160gattga 2166<210>128<211>2187<212>DNA<213>深红红螺菌(Rhodospirillum rubrum)<400>128atgcaaacat cgaccttcac caccgccggc ggttttacca tcagcagttg cctacgcccg 60cttgccgggg cggatggcgc cttcgaggcg ctgatcgacc gactcgatcg ccatcgcggc120atggtgatcg cctcgaccta tgagtatccc ggccgctatc gccgccacgc cctggggttt180tgcgatccgc cgctggtgct ggagggcaag gggcgcgagg cccatctgct ggcgctcaat240
cgccgggggc gggccctgct gccggccctg gccgttggct tggagggggc ggccgggctg300gagggcctgc gccgcgaggc cgaccggctg gtcttgcgtg tcaaggccat ggcgccctgg360ttccccgagg aggagcgctc gcgccaaccc tcgctgatgt cggtggtgcg cgccctcgcc420gggctgttcg ccgccgaaaa cgacccgttt ttcgggcttg tcggcgcctt tggctatgac480ctgggcttgg ctttcgagcg cctgccccat gcccggccgc gatcggccga tcaccgcgat540ctggtgcttt acctgcccga ccgtctgctg atcgacgatc ccgaagccgg cggccttgcc600gaacgccttt acgacatcac cgcggccgat ggggcaagca ccgccggctt ggcgcgggaa660accgccgctt acaccgccga ccaccccgcc ggcggcgtgc cgatcgagga tgatatgccc720ccgggcgctt acggggcgat cgtccgtggg ctgaaggagg ccttcgccgc cggggatctg780ttcgaggcgg tgccctcgcg cgccctgcgc cggccttgcg ccgaggcgcc gagccgtttg840taccggcggc tgcgcgcggc caatccggcg ccctatctgt tcctggccaa tctgggggcg900ggcgaacatc tgatcggcgc ctcgcccgaa atgttcgtgc gcgtcggtgg agcgccgggg960gcgcggcggg tggaaacctg cccgatctcg ggcaccatcg cccgggggcc cgacgccctg 1020ggcgatgccg aggccatccg caccctgctc aattcgacca aggacgaggc cgaattgacc 1080atgtgcaccg atgtcgaccg caacgacaag gcgcgggtct gcgtggccgg cagcgttacc 1140gtcatcggtc gccgccagat cgagctatat tcccggctga tccacacggt cgaccatgtg 1200gagggccggc tgcgccccga gcttgacgcc cttgacgcct ttctcagcca ctgctgggcg 1260gtgacggtga ccggagcgcc caagcgcgcc gccatggccg ccgtcgaagc cgtggagcgg 1320gcgccgcgcg cctggtatgg cggcgccatc ggccgcctgg gcttcgacgg taccctcgac 1380accggactgg tgctgcgcac catccgcctg cgtcacggcg tcgccgaggt gcgggtgggg 1440gcgacgctgc tccaccgttc cgatcccgag gaggaggagg ccgaaaccct gctcaaggcc 1500tcggccctgc tcgccctgct cgatgccacc accccggcca agccgaatgc cccgcatctt 1560ccgttgcgcg gccgggcgcc gcgcgtgctg gtcatcgacc acgaggacag cttcgtccat 1620accctggcgt cttatctgcg caatgccggg gccgagacca ccgtgctgcg ctgggacgtg 1680ccggcggcgg tgcgcgccgg cgtcgaggcc gatctgctgg tgctgtcgcc gggaccgggc 1740acgccgtcgc gcttcgccct gggggccagc ctggactggg cggtggcgcg cggcttgccg 1800gtcttcggcg tctgcctggg gctgcagggc atcgtcgaac aggccggggg ccgccttgcc 1860cggctggcgg ttcccgccca tggcatggcc tcgacgctgc ggctggtcgc ccccggggac 1920ccgctgttcg ccggcctgcc cacgaccatg agagtgggcc gctaccacag cctgcacgcc 1980gagcgcgcca gcctgcccga cagcctggag atcctggccg aaagcgacga cggggtgatc 2040atggcgctgc gccaccgcct gctgcccttc agcgccgtgc aattccaccc cgaaagcctg 2100
atgaccctgg acggcggcgc cggaccccga ttgatcgcca atcttctgga aaccctaagc 2160gtcccgcgaa cgcgccacgc cgcctaa 2187<210>129<211>2181<212>DNA<213>Thermobifida fusca<400>129gtggacgaca actcctacac caccagtggt ggtatcaccg tgcaccgcac ggcagtgccg 60tgcgatcccc gtgcgctcgc cgatctgacg gtcaacgtgg aacagcgccg aggcggcgtg120ctctcctccg ggatggagta tcccggccgc tacagccgtt ggcatttggg atacgtggac180ccgtgcctgg aagttgtcgc gcgcggccgc acgatcgggg cgacggccct caacgaccgc240ggccgtgtcc tgctgcccgc ggtagcccgg gcgctcaccg cgcacggcgc ggtggtggag300cacaccgacg acacggtcgc tgtcacggtc cctgaaccgg atcccaccga gttcttcact360gaggaagagc gcagccgccg gctcagtgtt ttttctgcgc tccgcgccct cgtgggcgtg420ttcttccacg cggaagaacc ccacctgggg ttgtacgggg cgttcggcta cgatctggcg480ttccagttcg aaccgatcga gcaggtgctg ccgcgcgacc cggaggaccg ggacctggtg540ttgcacctgc ccgacgagat catcgtccac gaccggaaac gggagatctg ccagcgctac600tcctacgact tcacgctgcc ggaggagttg cgcggcccgg caggggcgac cacgcggggc660ctgccacgcc acaccgagcc cacacccccg gtgaccccgg ctgccgaggt gccgccgcag720ccggaacccg ggtcgtatgc gcggatcgtg gctgaggcca aggagcggtt ccgccgcggc780gacttgttcg aagtggtgcc cagccaccgc ttgtacgcgc cgtgtgcgtc gcctgcgcgg840ttctacgagc ggctgcggga acgcaaccct gccccgtacg agttcttcct caacctgggg900gagggcgagt acctggtcgg cgcgtccccg gaaatgtttg tgcgggtcac gggccgtccc960ggagaggggc agcgggtgga gacctgcccg atctccggca cgatcaagcg tggcgcggac 1020gcggtcggcg acgcggagaa catcaaggag ctgctgtcgt ccgcgaagga agagtcggag 1080ctgaccatgt gcaccgacgt ggaccgcaac gacaagtccc gggtgtgcgt gccaggcagt 1140gtgcgggtga tcggccgccg gcagatcgaa atgtacagtc ggctcatcca cacggtcgac 1200cacattgagg ggattctgcg ccccgagttg gacgctattg acgcgttcct cacccacatg 1260tgggcggtga ccgtgacggg ggcgccgaag acgtgggcga tgcggttcat cgaacagcat 1320gagagttcgc cgcgccgctg gtatgggggc gcggtcggtg tcatcaattt tgatggttcg 1380atgaacaccg ggttgacgtt gcggaccgcg cacatccggg acggggtggc gacggtgcgg 1440gcgggcgcca cactgctgta cgactctgat ccggaagctg aagagcggga gactttcctc 1500aaagcccgtg ccctgttgga gaccctcacc gacgagggtg aggaaacctc caaggctgcg 1560
cctgcggtgg agcaggtggg ggcggggatg cgggtgctgc tcgtcgacca cgaagactcg 1620ttcgtcaaca cgctcgcgga ctacgtccgg cggcacggcg ccgaggtcac cacggtgcgc 1680tacgggttcg acccggccct gctcgaccag atgcgtcccg acctggtggt gctctccccg 1740gggccggggc tgcccgccga tttcgcgatg agcgcgctgt tgaaggagtt ggacgcgcgc 1800ggcctgcctg tgttcggggt gtgcctgggg ctgcaggcga tggtggagta cgcgggcggg 1860gagctgctca ctttggacac gccggtgcac ggtaaacccg gccgggttcg ggtcaccggg 1920ggcgcgctgc tggctgggct gggagaggac ggggagttca ccgcggcccg ctaccactcc 1980gtgtacgcga ccccggaccg ggtgaaaggg ttcgaggtga cggcggtgac ggaggacgac 2040ggtttccccg tggtcatggc gatcgagaat gctgaggcgc ggcggtgggc ggtccagttc 2100caccccgagt cgatcctcac cggccgggtg ggggagcaga tcgtggcgaa cgtgctgcgc 2160ttggccaggg agagcagctg a 2181<210>130<211>721<212>PRT<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)<400>130Met Asn Arg Thr Val Phe Ala Leu Pro Ala Arg Ser Asp Tyr Val Thr1 5 10 15Arg Gly Gly Leu Ala Ile Thr Arg Val Ala Glu Gln Phe Thr Gly Gly20 25 30Ala Ser Arg Leu Asp Asp Leu Val Asn Leu Leu Asp Arg Arg Arg Gly35 40 45Val Val Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe50 55 60Asp Leu Gly Phe Ser Asp Pro Pro Leu Lys Leu Glu Thr Thr Gly Val65 70 75 80Asn Phe Lys Leu Glu Ala Leu Asn Glu Arg Gly Gln Val Leu Ile Ala85 90 95Phe Leu Ala Asp Val Leu Arg Glu Pro Cys Val Val Ile Ser Glu Lys100 105 110Thr Ala Ser Arg Leu Ala Gly His Ile Ile Arg Gly Asp Ala Pro Val115 120 125Glu Glu Asp Gln Arg Thr Arg Arg Ala Ser Val Val Ser Leu Val Arg
130 135 140Asp Leu Val Ala Ala Phe Ser Ala Asn Asp Asp Gly Leu Leu Gly Leu145 150 155 160Phe Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Ile Glu Asp Leu Val165 170 175Gln Lys Arg Ala Arg Glu Ser Asp Gln Arg Asp Ile Val Leu Tyr Val180 185 190Pro Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Val195 200 205Leu Ser Tyr Asp Phe Thr Trp Lys Gly Arg Ser Thr Glu Gly Leu Pro210 215 220Arg Glu Thr Ala Asp Ser Pro Tyr Met Lys Thr Pro Arg Gln Gly Phe225 230 235 240Ala Asp His Ala Pro Gly Glu Tyr Gln Ala Thr Val Glu Thr Ala Arg245 250 255Ala Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu260 265 270Phe Ala Glu Pro Cys Asp Arg Ser Pro Ala Glu Val Phe Gln Arg Leu275 280 285Cys Val Ile Asn Pro Ser Pro Tyr Gly Ala Leu Met Asn Leu Gly Asp290 295 300Gly Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp305 310 315 320Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly325 330 335Thr Asp Ala Ile Gly Asp Ala Glu Gln Ile Arg Gln Leu Leu Asn Ser340 345 350Glu Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn355 360 365Asp Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg370 375 380
Arg Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val385 390 395 400Glu Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Gln Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly435 440 445Ala Ile Gly Ala Val Asn Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr450 455 460Ile Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly465 470 475 480Ala Thr Cys Leu Phe Asp Ser Asp Pro Ala Ala Glu Asp Arg Glu Cys485 490 495Gln Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Pro500 505 510Lys Pro Leu Ser Thr Phe Ala Pro Asp Ala Thr Gly Ser Gly Lys Arg515 520 525Val Leu Leu Ile Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp530 535 540Tyr Phe Arg Gln Val Gly Ala Ser Val Thr Val Val Arg Tyr Val His545 550 555 560Ala Leu Asp Met Leu Lys Gln Lys Arg Trp Asp Leu Leu Val Leu Ser565 570 575Pro Gly Pro Gly Arg Pro Glu Asp Phe Gly Ile Arg Lys Thr Ile Asp580 585 590Ala Ala Leu Glu Asn Lys Leu Pro Val Phe Gly Val Cys Leu Gly Val595 600 605Gln Ala Ile Gly Glu Tyr Phe Gly Gly Glu Leu Gly Gln Leu Thr His610 615 620Pro Ala His Gly Arg Pro Ser Arg Val Gln Val Arg Gly Gly Arg Leu625 630 635 640
Met Arg Asn Leu Pro Ser Glu Ile Val Ile Gly Arg Tyr His Ser Leu645 650 655Tyr Val Glu Arg Asp Ser Met Pro Glu Val Leu Ser Val Thr Ala Ser660 665 670Thr Glu Asp Gly Val Ala Met Ala Leu Glu His Lys Thr Leu Pro Val675 680 685Ala Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu690 695 700Val Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Asp Ala Arg Val705 710 715 720Asp<210>131<211>728<212>PRT<213>深红红螺菌(Rhodospirillum rubrum)<400>131Met Gln Thr Ser Thr Phe Thr Thr Ala Gly Gly Phe Thr Ile Ser Ser1 5 10 15Cys Leu Arg Pro Leu Ala Gly Ala Asp Gly Ala Phe Glu Ala Leu Ile20 25 30Asp Arg Leu Asp Arg His Arg Gly Met Val Ile Ala Ser Thr Tyr Glu35 40 45Tyr Pro Gly Arg Tyr Arg Arg His Ala Leu Gly Phe Cys Asp Pro Pro50 55 60Leu Val Leu Glu Gly Lys Gly Arg Glu Ala His Leu Leu Ala Leu Asn65 70 75 80Arg Arg Gly Arg Ala Leu Leu Pro Ala Leu Ala Val Gly Leu Glu Gly85 90 95Ala Ala Gly Leu Glu Gly Leu Arg Arg Glu Ala Asp Arg Leu Val Leu100 105 110Arg Val Lys Ala Met Ala Pro Trp Phe Pro Glu Glu Glu Arg Ser Arg115 120 125
Gln Pro Ser Leu Met Ser Val Val Arg Ala Leu Ala Gly Leu Phe Ala130 135 140Ala Glu Asn Asp Pro Phe Phe Gly Leu Val Gly Ala Phe Gly Tyr Asp145 150 155 160Leu Gly Leu Ala Phe Glu Arg Leu Pro His Ala Arg Pro Arg Ser Ala165 170 175Asp His Arg Asp Leu Val Leu Tyr Leu Pro Asp Arg Leu Leu Ile Asp180 185 190Asp Pro Glu Ala Gly Gly Leu Ala Glu Arg Leu Tyr Asp Ile Thr Ala195 200 205Ala Asp Gly Ala Ser Thr Ala Gly Leu Ala Arg Glu Thr Ala Ala Tyr210 215 220Thr Ala Asp His Pro Ala Gly Gly Val Pro Ile Glu Asp Asp Met Pro225 230 235 240Pro Gly Ala Tyr Gly Ala Ile Val Arg Gly Leu Lys Glu Ala Phe Ala245 250 255Ala Gly Asp Leu Phe Glu Ala Val Pro Ser Arg Ala Leu Arg Arg Pro260 265 270Cys Ala Glu Ala Pro Ser Arg Leu Tyr Arg Arg Leu Arg Ala Ala Asn275 280 285Pro Ala Pro Tyr Leu Phe Leu Ala Asn Leu Gly Ala Gly Glu His Leu290 295 300Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Gly Gly Ala Pro Gly305 310 315 320Ala Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly325 330 335Pro Asp Ala Leu Gly Asp Ala Glu Ala Ile Arg Thr Leu Leu Asn Ser340 345 350Thr Lys Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn355 360 365Asp Lys Ala Arg Val Cys Val Ala Gly Ser Val Thr Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Leu Tyr Ser Arg Leu Ile His Thr Val Asp His Val385 390 395 400Glu Gly Arg Leu Arg Pro Glu Leu Asp Ala Leu Asp Ala Phe Leu Ser405 410 415His Cys Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met420 425 430Ala Ala Val Glu Ala Val Glu Arg Ala Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Arg Leu Gly Phe Asp Gly Thr Leu Asp Thr Gly Leu Val450 455 460Leu Arg Thr Ile Arg Leu Arg His Gly Val Ala Glu Val Arg Val Gly465 470 475 480Ala Thr Leu Leu His Arg Ser Asp Pro Glu Glu Glu Glu Ala Glu Thr485 490 495Leu Leu Lys Ala Ser Ala Leu Leu Ala Leu Leu Asp Ala Thr Thr Pro500 505 510Ala Lys Pro Asn Ala Pro His Leu Pro Leu Arg Gly Arg Ala Pro Arg515 520 525Val Leu Val Ile Asp His Glu Asp Ser Phe Val His Thr Leu Ala Ser530 535 540Tyr Leu Arg Asn Ala Gly Ala Glu Thr Thr Val Leu Arg Trp Asp Val545 550 555 560Pro Ala Ala Val Arg Ala Gly Val Glu Ala Asp Leu Leu Val Leu Ser565 570 575Pro Gly Pro Gly Thr Pro Ser Arg Phe Ala Leu Gly Ala Ser Leu Asp580 585 590Trp Ala Val Ala Arg Gly Leu Pro Val Phe Gly Val Cys Leu Gly Leu595 600 605Gln Gly Ile Val Glu Gln Ala Gly Gly Arg Leu Ala Arg Leu Ala Val610 615 620Pro Ala His Gly Met Ala Ser Thr Leu Arg Leu Val Ala Pro Gly Asp
625 630 635 640Pro Leu Phe Ala Gly Leu Pro Thr Thr Met Arg Val Gly Arg Tyr His645 650 655Ser Leu His Ala Glu Arg Ala Ser Leu Pro Asp Ser Leu Glu Ile Leu660 665 670Ala Glu Ser Asp Asp Gly Val Ile Met Ala Leu Arg His Arg Leu Leu675 680 685Pro Phe Ser Ala Val Gln Phe His Pro Glu Ser Leu Met Thr Leu Asp690 695 700Gly Gly Ala Gly Pro Arg Leu Ile Ala Asn Leu Leu Glu Thr Leu Ser705 710 715 720Val Pro Arg Thr Arg His Ala Ala725<210>132<211>726<212>PRT<213>Thermobifida fusca<400>132Val Asp Asp Asn Ser Tyr Thr Thr Ser Gly Gly Ile Thr Val His Arg1 5 10 15Thr Ala Val Pro Cys Asp Pro Arg Ala Leu Ala Asp Leu Thr Val Asn20 25 30Val Glu Gln Arg Arg Gly Gly Val Leu Ser Ser Gly Met Glu Tyr Pro35 40 45Gly Arg Tyr Ser Arg Trp His Leu Gly Tyr Val Asp Pro Cys Leu Glu50 55 60Val Val Ala Arg Gly Arg Thr Ile Gly Ala Thr Ala Leu Asn Asp Arg65 70 75 80Gly Arg Val Leu Leu Pro Ala Val Ala Arg Ala Leu Thr Ala His Gly85 90 95Ala Val Val Glu His Thr Asp Asp Thr Val Ala Val Thr Val Pro Glu100 105 110Pro Asp Pro Thr Glu Phe Phe Thr Glu Glu Glu Arg Ser Arg Arg Leu
115 120 125Ser Val Phe Ser Ala Leu Arg Ala Leu Val Gly Val Phe Phe His Ala130 135 140Glu Glu Pro His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ala145 150 155 160Phe Gln Phe Glu Pro Ile Glu Gln Val Leu Pro Arg Asp Pro Glu Asp165 170 175Arg Asp Leu Val Leu His Leu Pro Asp Glu Ile Ile Val His Asp Arg180 185 190Lys Arg Glu Ile Cys Gln Arg Tyr Ser Tyr Asp Phe Thr Leu Pro Glu195 200 205Glu Leu Arg Gly Pro Ala Gly Ala Thr Thr Arg Gly Leu Pro Arg His210 215 220Thr Glu Pro Thr Pro Pro Val Thr Pro Ala Ala Glu Val Pro Pro Gln225 230 235 240Pro Glu Pro Gly Ser Tyr Ala Arg Ile Val Ala Glu Ala Lys Glu Arg245 250 255Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser His Arg Leu Tyr260 265 270Ala Pro Cys Ala Ser Pro Ala Arg Phe Tyr Glu Arg Leu Arg Glu Arg275 280 285Asn Pro Ala Pro Tyr Glu Phe Phe Leu Asn Leu Gly Glu Gly Glu Tyr290 295 300Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Thr Gly Arg Pro305 310 315 320Gly Glu Gly Gln Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys325 330 335Arg Gly Ala Asp Ala Val Gly Asp Ala Glu Asn Ile Lys Glu Leu Leu340 345 350Ser Ser Ala Lys Glu Glu Ser Glu Leu Thr Met Cys Thr Asp Val Asp355 360 365
Arg Asn Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Arg Val Ile370 375 380Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp385 390 395 400His Ile Glu Gly Ile Leu Arg Pro Glu Leu Asp Ala Ile Asp Ala Phe405 410 415Leu Thr His Met Trp Ala Val Thr Val Thr Gly Ala Pro Lys Thr Trp420 425 430Ala Met Arg Phe Ile Glu Gln His Glu Ser Ser Pro Arg Arg Trp Tyr435 440 445Gly Gly Ala Val Gly Val Ile Asn Phe Asp Gly Ser Met Asn Thr Gly450 455 460Leu Thr Leu Arg Thr Ala His Ile Arg Asp Gly Val Ala Thr Val Arg465 470 475 480Ala Gly Ala Thr Leu Leu Tyr Asp Ser Asp Pro Glu Ala Glu Glu Arg485 490 495Glu Thr Phe Leu Lys Ala Arg Ala Leu Leu Glu Thr Leu Thr Asp Glu500 505 510Gly Glu Glu Thr Ser Lys Ala Ala Pro Ala Val Glu Gln Val Gly Ala515 520 525Gly Met Arg Val Leu Leu Val Asp His Glu Asp Ser Phe Val Asn Thr530 535 540Leu Ala Asp Tyr Val Arg Arg His Gly Ala Glu Val Thr Thr Val Arg545 550 555 560Tyr Gly Phe Asp Pro Ala Leu Leu Asp Gln Met Arg Pro Asp Leu Val565 570 575Val Leu Ser Pro Gly Pro Gly Leu Pro Ala Asp Phe Ala Met Ser Ala580 585 590Leu Leu Lys Glu Leu Asp Ala Arg Gly Leu Pro Val Phe Gly Val Cys595 600 605Leu Gly Leu Gln Ala Met Val Glu Tyr Ala Gly Gly Glu Leu Leu Thr610 615 620
Leu Asp Thr Pro Val His Gly Lys Pro Gly Arg Val Arg Val Thr Gly625 630 635 640Gly Ala Leu Leu Ala Gly Leu Gly Glu Asp Gly Glu Phe Thr Ala Ala645 650 655Arg Tyr His Ser Val Tyr Ala Thr Pro Asp Arg Val Lys Gly Phe Glu660 665 670Val Thr Ala Val Thr Glu Asp Asp Gly Phe Pro Val Val Met Ala Ile675 680 685Glu Asn Ala Glu Ala Arg Arg Trp Ala Val Gln Phe His Pro Glu Ser690 695 700Ile Leu Thr Gly Arg Val Gly Glu Gln Ile Val Ala Asn Val Leu Arg705 710 715 720Leu Ala Arg Glu Ser Ser725<210>133<211>281<212>PRT<213>高粱(Sorghum bicolor)<400>133Met Val Cys Ser Gln Leu Thr Ala Ala Gly Ala Ser Ser Leu Ala Ala1 5 10 15Ala Ala Val Arg Ser Arg Ala His Ser Pro Ala Ala Ala Phe Ala Gln20 25 30Leu Arg Ser Thr Pro Arg Ile Ala Ser Ala Gly Leu Ser Val Lys Gly35 40 45Asn Arg Ala Ala Leu Pro Leu Val Ala Ala Ala Gly Pro Ala Ala Ala50 55 60Ala Pro Val Ala Asp Leu Asp Gly Pro Pro Ala Thr Glu Lys Gln Pro65 70 75 80Ile lle Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Ash Leu Cys Gln85 90 95Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp Glu100 105 110
Leu Thr Ile Glu Asp Val Lys Arg Lys Asn Pro Arg Gly Ile Leu Ile115 120 125Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Ala130 135 140Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met Gly145 150 155 160Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala Pro165 170 175Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Glu180 185 190Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala Ala195 200 205Arg Tyr His Ser Leu Val Ile Glu Glu Glu Thr Phe Pro His Asp Ala210 215 220Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg225 230 235 240His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu Ser245 250 255Ile Ile Thr Pro Asp Gly Lys Lys Ile Ile Leu Asn Phe Val Arg Phe260 265 270Ile Glu Glu Leu Glu Lys Gln Arg Ser275 280<210>134<211>1122<212>DNA<213>高粱(Sorghum bicolor)<400>134gtcgacccac gcgtccgccg cctccccacc ctcgctccct ctcaccgccc gccaccgccg 60agatggtctg ctcccagctc accgccgcgg gggcctcctc cctcgccgcc gcagcggttc120gttcccgggc gcattcccca gccgccgcct tcgcgcaact acggtcgacg cctcgcattg180cgagcgctgg cttgtcggtt aagggaaaca gggcggctct tccgttggtc gccgccgcgg240ggccggccgc ggcggcgccg gtggccgacc tggacggccc cccggccacg gagaagcagc300ccatcattgt catcgataac tacgacagct tcacctacaa cctctgccag tatatggggg360
agcttggatt gaactttgaa gtataccgca atgatgaact gaccatagaa gatgtaaaga420ggaagaaccc aagaggaata cttatttctc cagggcctgg tgaaccacaa gattcaggaa480tatcattgca ggctgttctt gaattaggcc caaccatccc aatttttgga gtttgcatgg540gcctgcagtg cattggggag gcatttgggg gaaagattat ccgtgctcct tctggagtga600tgcatgggaa aagctctcca gtttattacg acgaggaatt aggaaaggcc ttattcaatg660gcttgccaaa cccttttacc gctgcgaggt accacagctt ggtcattgag gaagaaacct720tcccgcatga tgctttagag gccactgcat ggactgaaga tggacttatc atggctgctc780gccacaagaa gtacaaacac atccagggtg tccaattcca cccggagagc atcatcaccc840ctgacggcaa gaaaatcatc ctcaatttcg tcagattcat tgaggaactg gagaagcagc900gttcctaggg aggtagatgc caccggtggc ttcatagatc agtcagaagc agagacaaag960gcgcttgaag ctgcgtagta ccgggtctgg cagtggaagt tagctaggaa acagcctttt 1020tcctccctta attcgttgtg ctcgtggtaa tataatctgt gtggactgaa tttcgaataa 1080agtccagctg ttcaaataaa aaaaaaaaaa aagggcggcc gc 1122<210>135<211>1934<212>DNA<213>高粱(Sorghum bicolor)<400>135gtcgacccac gcgtccgcgt gacaccccgc gcggcacctc cgcctcccca ccctcgctcc 60ctctcaccgc ccgccaccgc cgagatggtc tgctcccagc tcaccgccgc gggggcctcc120tccctcgccg ccgcagcggt tcgttcccgg gcgcattccc cagccgccgc cttcgcgcaa180ctacggtcga cgcctcgcat tgcgagcgct ggcttgtcgg ttaagggaaa cagggcggct240cttccgttgg tcgccgccgc ggggccggcc gcggcggcgc cggtggccga cctggacggc300cccccggcca cggagaagca gcccatcatt gtcatcgata actacgacag cttcacctac360aacctctgcc agtatatggg ggagcttgga ttgaactttg aagtataccg caatgatgaa420ctgaccatag aagatgtaaa gaggaagaac ccaagaggaa tacttatttc tccagggcct480ggtgaaccac aagattcagg aatatcattg caggctgttc ttgaattagg cccaaccatc540ccaatttttg gagtttgcat gggcctgcag tgcattgggg aggcatttgg gggaaagatt600atccgtgctc cttctggagt gatgcatggg aaaagctctc cagtttatta cgacgaggaa660ttaggaaagg ccttattcaa tggcttgcca aaccctttta ccgctgcgag gtaccacagc720ttggtcattg aggaagaaac cttcccgcat gatgctttag aggccactgc atggactgaa780gatggactta tcatggctgc tcgccacaag aagtacaaac acatccaggg tgtccaattc840cacccggaga gcatcatcac ccctgacggc aagaaaatca tcctcaattt cgtcagattc900
attgaggaac tggagaagca gcgttcctag ggaggtagat gccaccggtg gcttcataga960tcagtcagaa gcagagacaa aggcgcttga agctgcgtag taccgggtct ggcagtggaa 1020gttagctagg aaacagcctt tttcctccct taattcgttg tgctcgtggt aatataatct 1080gtgtggactg aatttcgaat aaagtccagc tgttcaaata aaaaaaaaaa aaaagggcgg 1140ccgctaccct cgaggccggc cgggccggga agccgcgatg ttaaatgtgt ggtccttagc 1200aatcaaatct gcgtacaaga tggaatctct attattttca gcgaaaccaa gggattccgt 1260gagcgcatcc gagggaggaa ggtgggcgta cctttaggct tctttccgac ctccgggaag 1320tgcggcgagg gtttcatggc gatgttggcg gctgcaaggc cggcgcgccg gatagaggcg 1380ggggcagggg aactgacaag ggtttaacta cgcgaacgcg cactgcagga atggacgagc 1440tcgctctctc aaatcggccg aatgcgctcg tcccaccgag acgccgtctt gctccgtctc 1500cctgtctcgc tcacgcggac gctccacgcg agcagggcag gccgaggagg gcgacggcgc 1560agccgggcga cggcgcgagg agagcgatgg cgcgaagagt gcagaacgcg cggctcggcg 1620gcggcgcagc tgtgcggcgg cgcggttggg ccgcggtggc ggagaacggt gaacggaaga 1680acgaagaaga aagggaaaga agcctttgta tgacacgtgg gtcccgcagt tagaagggtt 1740aaatctgttg tctcatccat cacgtagtct taattttttt ttcactagtc tgtgttaatg 1800ctacgatctt aagaagccag cgacaataag agtagctcta ataaaaaaaa aaaaaaaaag 1860aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacaaaaa aaaaaaaaaa aaaggcccct 1920agggccctcg agct 1934<210>136<211>2055<212>DNA<213>玉米(Zea mays)<400>136ggccggccgg gactccactc cactccactc gcccgcgccc gccgcccgcg tgctcctccc 60tcgcgcccgc cccgccccgc tccgccccta tctatatcca ttcccgctcg tccccctcaa120caaccctcct cacggcgcac tcgtgttcgt gtcatcccgc ccgcaggccg cagtccatgg180ccaccgccag cctcgcgctc tcgctgcgcc tcgcgccgta ctcgcacccg ctgagcctcc240gccgccgggg ggccgccggc gtcacctgcc gcgccaccac cgccacgttc caccagcttg300acgccgtcgc ggtgagggag gaggagtcca ggttccggac ggcggcggcg gagggccgca360acctgctgcc gctcacgagg tgcatcttct ccgatcacct cacgcccgtg ctcgcctacc420gctgcctcgt caaggaggac gaacgcgagg cgcccagctt tctattcgag tctgtcgagc480aggggtccga gggcaccaat gtggggaggt acagcgtggt cggggcgcag ccttctatgg540aggtcgtggc caaggctaac catgtgacgg tcatggacca tgagatgaag tcgaggaggg600
agcacttcgt gcctgatccc atgaggatcc ccaggacaat catggagcag tggaacccgc660agattgctga cagcctccct gatgcatttt gtggaggatg ggttggattc ttctcatatg720atacagtgcg ttatgttgaa acaaagaagc ttcctttcag taaggcacca catgatgata780ggaaccttcc tgatattcat ttaggcctct atagtgacgt cattgtgttt gatcatgttg840aaaagaaaac acatgttatt cattgggtga ggacagactg ctatcgttct gttgatgaag900catatgaaga tggaagaaat cggcttgaag ctttgttatc aagattacat tgcctcaatg960tcccaacact ttcttctggt tctataaaac tcaatgttga aaactttggc ccagtaatgc 1020aaaaatcaac gatgtcaagc gaagaatata aaaatatcgt tgtccaagct aaagaacaca 1080tcttggccgg tgacattttc caagttgttt taagccagcg ttttgagaga cggacattcg 1140ccgacccctt tgaaatctat cgtgcattgc gcatcgtaaa tcctagtcca tatatggcct 1200atctacaggc acgaggttgt attctcgtgg catcgagtcc tgaaattctt acccgggtac 1260aaaagaggac aataatcaat cgtccgcttg ctggaaccat aagaagaggc aaaacaaaag 1320cagaagacaa aactttagaa caattgcttt tgagtgacga aaagcagtgt gctgaacata 1380ttatgctagt agatcttggc cgaaatgatg ttgggaaggt gtccaaacca ggttcagtaa 1440aggtagagaa attgatgaat atcgaacgat attctcatgt catgcacatc agctcaacag 1500taactggaga gctacgcgat gatcttacgt gttgggatgc gctacgagcc gcattgccag 1560ttggaaccgt tagtggcgct ccaaaggtga gagcaatgga gttgattgat cagctagaag 1620tgagtatgcg tgggccgtat agtggtggct ttggagggat ttcctttcgc ggcgacatgg 1680acattgcact ggctcttcgc actatcgtct tccccaccgc atctcggttt gataccatgt 1740actcgtacac agacagtaag tcccgacagg agtgggtggc tcacctccag gccggagctg 1800gcatagttgc tgatagcaaa ccggatgacg agcaccaaga gtgtataaac aaggctgcag 1860gtgttgctcg tgccattgac cttgctgaat ctacatttct tgaagactag tctagtctaa 1920tgaaggaaat gtatgtttaa gttctctgta caattatgga ttgtcctaga aaacaggctt 1980tcttaggccg aataaaaact caattgtaat aaagttaata aatggacaac tttagctaaa 2040aaaaaaaaaa aaaaa2055<210>137<211>577<212>PRT<213>玉米(Zea mays)<400>137Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Tyr Ser1 5 10 15His Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg
20 25 30Ala Thr Thr Ala Thr Phe His Gln Leu Asp Ala Val Ala Val Arg Glu35 40 45Glu Glu Ser Arg Phe Arg Thr Ala Ala Ala Glu Gly Arg Asn Leu Leu50 55 60Pro Leu Thr Arg Cys Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala65 70 75 80Tyr Arg Cys Leu Val Lys Glu Asp Glu Arg Glu Ala Pro Ser Phe Leu85 90 95Phe Glu Ser Val Glu Gln Gly Ser Glu Gly Thr Asn Val Gly Arg Tyr100 105 110Ser Val Val Gly Ala Gln Pro Ser Met Glu Val Val Ala Lys Ala Asn115 120 125His Val Thr Val Met Asp His Glu Met Lys Ser Arg Arg Glu His Phe130 135 140Val Pro Asp Pro Met Arg Ile Pro Arg Thr Ile Met Glu Gln Trp Asn145 150 155 160Pro Gln Ile Ala Asp Ser Leu Pro Asp Ala Phe Cys Gly Gly Trp Val165 170 175Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Thr Lys Lys Leu180 185 190Pro Phe Ser Lys Ala Pro His Asp Asp Arg Asn Leu Pro Asp Ile His195 200 205Leu Gly Leu Tyr Ser Asp Val Ile Val Phe Asp His Val Glu Lys Lys210 215 220Thr His Val Ile His Trp Val Arg Thr Asp Cys Tyr Arg Ser Val Asp225 230 235 240Glu Ala Tyr Glu Asp Gly Arg Asn Arg Leu Glu Ala Leu Leu Ser Arg245 250 255Leu His Cys Leu Ash Val Pro Thr Leu Ser Ser Gly Ser Ile Lys Leu260 265 270
Asn Val Glu Asn Phe Gly Pro Val Met Gln Lys Ser Thr Met Ser Ser275 280 285Glu Glu Tyr Lys Asn Ile Val Val Gln Ala Lys Glu His Ile Leu Ala290 295 300Gly Asp Ile Phe Gln Val Val Leu Ser Gln Arg Phe Glu Arg Arg Thr305 310 315 320Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro325 330 335Ser Pro Tyr Met Ala Tyr Leu Gln Ala Arg Gly Cys Ile Leu Val Ala340 345 350Ser Ser Pro Glu Ile Leu Thr Arg Val Gln Lys Arg Thr Ile Ile Asn355 360 365Arg Pro Leu Ala Gly Thr Ile Arg Arg Gly Lys Thr Lys Ala Glu Asp370 375 380Lys Thr Leu Glu Gln Leu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu385 390 395 400His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser405 410 415Lys Pro Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr420 425 430Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Arg Asp435 440 445Asp Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr450 455 460Val Ser Gly Ala Pro Lys Val Arg Ala Met Glu Leu Ile Asp Gln Leu465 470 475 480Glu Val Ser Met Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser485 490 495Phe Arg Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val Phe500 505 510Pro Thr Ala Ser Arg Phe Asp Thr Met Tyr Ser Tyr Thr Asp Ser Lys515 520 525
Ser Arg Gln Glu Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val530 535 540Ala Asp Ser Lys Pro Asp Asp Glu His Gln Glu Cys Ile Asn Lys Ala545 550 555 560Ala Gly Val Ala Arg Ala Ile Asp Leu Ala Glu Ser Thr Phe Leu Glu565 570 575Asp<210>138<211>22<212>DNA<213>人工的<220>
<223>引物.
<400>138atggcagcgg taattctgga ag 22<210>139<211>19<212>DNA<213>人工的<220>
<223>引物.
<400>139tcaggctgcc ttggtcttc 19<210>140<211>30<212>DNA<213>人工的<220>
<223>引物.
<400>140actgactcca tggcagcggt aattctggaa 30<210>141<211>20<212>DNA<213>人工的<220>
<223>引物.
<400>141ctgactagtt caggctgctt20
<210>142<211>30<212>DNA<213>人工的<220>
<223>引物.
<400>142tgctgaccat ggcctgctcc cacatcgtcg 30<210>143<211>34<212>DNA<213>人工的<220>
<223>引物.
<400>143cagtgaattc ctacgaacgc tgcttctcca gttc3权利要求
1.编码邻氨基苯甲酸合酶的分离的DNA分子，其中该DNA分子编码与选自SEQ ID NOs66、108、109、110、111、133或137的蛋白质基本上同源的蛋白质。
2.权利要求1的分离的DNA分子，其中该DNA分子与选自SEQ ID NOs67、68、104、105、106、107、134、135或136的DNA分子基本上同源。
3.包括表达盒的DNA构建体，其中该可操作连接的表达盒包括(i)异源启动子；(ii)编码单体邻氨基苯甲酸合酶蛋白质的DNA分子，其中该单体的邻氨基苯甲酸合酶包括包含邻氨基苯甲酸合酶α-结构域和邻氨基苯甲酸合酶β-结构域的单个多肽；和(iii)转录终止子。
4.权利要求3的DNA构建体，其中单体的邻氨基苯甲酸合酶蛋白质是与选自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132的蛋白质基本上同源的。
5.权利要求3的DNA构建体，其中该蛋白质是SEQ ID NO4。
6.权利要求3的DNA构建体，其中该DNA分子是与选自SEQ ID NOs1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的。
7.权利要求3的DNA构建体，其中该表达盒进一步编码质体运输肽。
8.权利要求7的DNA构建体，其中该质体运输肽选自SEQ ID NOs72、74、114或115。
9.包括第一表达盒的DNA构建体，其中可操作连接的第一表达盒，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶α-结构域蛋白质的DNA分子；和(iii)转录终止子。
10.权利要求9的DNA构建体，进一步包括可操作连接的第二表达盒，包括(i)异源启动子；(ii)编码邻氨基苯甲酸合酶β-结构域蛋白质的DNA分子；和iii)转录终止子。
11.权利要求10的DNA构建体，其中该α-结构域或β-结构域蛋白质是与选自SEQ ID NOs5、6、8、44、45、66、99、100、101、102、103、108、109、110、111、117、118、133或137的蛋白质基本上同源的。
12.权利要求10的DNA构建体，其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子是与选自SEQ ID NOs2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136的DNA分子基本上同源的。
13.权利要求10的DNA构建体，其中编码邻氨基苯甲酸合酶α-结构域或β-结构域蛋白质的DNA分子选自SEQ ID NOs2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136。
14.权利要求10的DNA构建体，其中α-结构域蛋白质是SEQ ID NO66，而β-结构域蛋白质是SEQ ID NO118。
15.用于改变植物中色氨酸含量的方法，包括a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA编码的邻氨基苯甲酸合酶，相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。
16.权利要求15的方法，其中邻氨基苯甲酸合酶是与选自根瘤农杆菌(Agrobacterium tumefaciens)、鱼腥藻属(Anabaena)M22983、巴西固氮螺菌(Azospirillum brasilense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、马尔他布鲁氏菌(Brucella melitensis)、Mesorhizobium loti、念珠藻属的种(Nostocsp.)PCC7120、苜蓿中华根瘤菌(Rhizobium meliloti)、深红红螺菌(Rhodospirillum rubrum)、血色红假单胞菌(Rhodopseudomonas palustris)或Thermobifida fusca的单体邻氨基苯甲酸合酶基本上同源的。
17.权利要求15的方法，其中邻氨基苯甲酸合酶选自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132。
18.权利要求15的方法，其中邻氨基苯甲酸合酶是由与选自SEQ ID NOs1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的DNA分子编码的。
19.权利要求15的方法，其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶，其包括第一种属的邻氨基苯甲酸合酶α-结构域和来自第二种属的邻氨基苯甲酸合酶β-结构域的融合体，其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥(Arabidopsis thaliana)、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌(Escherichia coli)、薄肌眼虫藻(Euglena gracilis)、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香(Ruta graveolens)、血色红假单胞菌、鼠伤寒沙门氏菌(Salmonella typhimurium)、粘质沙雷氏杆菌(Serratia marcescens)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。
20.权利要求19的方法，其中α-结构域或β-结构域至少是部分的SEQ IDNOs4、5、6、7、8、43、44、45、57、66、77、78、79、80、81、82、99、100、101、102、103、108、109、110、111、117、118、130、131、132、133或137。
21.权利要求15的方法，其中DNA分子进一步编码质体运输肽。
22.权利要求21的方法，其中该质体运输肽选自SEQ ID NOs72、74、114或115。
23.权利要求15的方法，其中植物是双子叶植物。
24.权利要求33的方法，其中双子叶植物选自大豆、棉花或canola。
25.权利要求20的方法，其中植物是单子叶植物。
26.权利要求25的方法，其中单子叶植物选自玉米、稻、小麦、大麦或高粱。
27.用于制备动物饲料或人食品的方法，包括a.将包括编码邻氨基苯甲酸合酶的分离DNA分子的转基因导入可再生的植物细胞，其中该分离的DNA分子被可操作地连接到在植物细胞中有功能的启动子上，以产生转化的植物细胞；以及b.从转化的植物细胞再生植物，其中该植物细胞表达由分离的DNA分子编码的邻氨基苯甲酸合酶，相对于不包括转化基因的具有相同或相似遗传背景的第二植物中的色氨酸含量，该合酶的数量有效增加了该植物中的色氨酸含量。
28.权利要求27的方法，其中邻氨基苯甲酸合酶选自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132。
29.权利要求27的方法，其中邻氨基苯甲酸合酶包括嵌合的单体邻氨基苯甲酸合酶，其包括第一种属的邻氨基苯甲酸合酶α-结构域和第二种属的邻氨基苯甲酸合酶β-结构域的融合体，其中第一种属和第二种属选自根瘤农杆菌、鱼腥藻属M22983、拟南芥、巴西固氮螺菌、大豆慢生根瘤菌、马尔他布鲁氏菌、大肠杆菌、薄肌眼虫藻、Mesorhizobium loti、念珠藻属的种PCC7120、苜蓿中华根瘤菌、深红红螺菌、芸香、血色红假单胞菌、鼠伤寒沙门氏菌、粘质沙雷氏杆菌、硫磺矿硫化叶菌、Thermobifida fusca、高粱、大豆、稻、棉花、小麦、烟草或玉米。
30.通过权利要求27的方法所制备的动物饲料或人食品。
31.包括权利要求10的DNA构建体的动物饲料或人食品。
32.通过权利要求27的方法所制备的转基因植物。
33.包括权利要求10的DNA构建体的转基因植物。
全文摘要
本发明提供通过在植物细胞中导入和表达编码邻氨基苯甲酸合酶的分离DNA片段来改变植物的色氨酸含量的方法。也提供用编码邻氨基苯甲酸合酶的分离DNA片段转化的转基因植物，以及来源于这些植物的人或动物的食物、种子和后代。
文档编号C12N15/82GK1852975SQ03815614
公开日2006年10月25日申请日期2003年5月5日优先权日2002年5月3日
发明者莉萨·M·韦弗, 蒂姆·N·奥尔马索夫, 加布里拉·瓦杜瓦, 梁继红, 玛格丽特·J·瓦拉戈纳, 蒂亚马冈德鲁·V·文卡蒂什, 西瓦林加纳·曼朱纳思申请人:孟山都技术公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：莉萨.M.韦弗;蒂姆.N.奥尔马索夫;加布里拉.瓦杜瓦;梁继红;玛格丽特.J.瓦拉戈纳;蒂亚马冈德鲁.V.文卡蒂什;西瓦林加纳.曼朱纳思
技术所有人：孟山都技术公司
我是此专利的发明人

上一篇：具有类酚氧化酶活性的培养物的制作方法
上一篇：培养皿和生物反应器系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。