合成抗病原体物质的基因的制作方法

文档序号:449045阅读:703来源:国知局
专利名称:合成抗病原体物质的基因的制作方法
技术领域
本发明总的来说涉及保护宿主生物体使其免受病原体侵害的方法,更具体地说,本发明涉及保护植物使其免受植物病原体侵害的方法。本发明一方面提供了具有增强的植物病原体抗性的转基因植物和具有增强的生物防治性质的生物防治生物体。本发明进一步提供了保护植物使其免受植物病原体侵害的方法和产生抗病原体物质的方法。
植物通常被真菌和细菌感染,许多微生物种类已被用于由生长的植物提供的不同小境。某些植物病原体感染叶片表面,并且通过空气、经植物与植物的接触或经各种载体扩散,而另一些植物病原体是土传病原体,喜欢感染根和新发芽的籽苗。除了被真菌和细菌感染之外,许多植物病害由土传的感染根的线虫引起,当连续的年份在相同的土壤区域种植相同的作物时,这种病害一般导致严重的损失。
植物病害年年引起相当大的作物损失,导致世界上许多地区农民经济困难和当地居民的营养不足。杀真菌剂的广泛使用已给出了抗植物病原体攻击的相当大的安全性,但在杀真菌剂上花费10亿美元,1981年世界作物损失量约达作物价值的10%(James,种子科学和技术。9679-685(1981))。病害损害的严重程度取决于植物病原体的入侵性和宿主的反应,大多数植物种植方案的一个目标是增加宿主植物对病害的抗性。由于植物病原体的快速进化克服抗性基因,新开发的抵抗病害基因源和组合物一般只能成功地用于许多作物-病原体系统有限的一段时间。此外,有几个真菌菌株进化抵抗特定的杀真菌剂的文献记载的例子。早在1981年,Fletcher和Wolfe(1981英国作物保护会议会刊。(1981))报道,24%的春大麦的白粉菌和53%的冬大麦的白粉菌种群对杀真菌剂triadimenold的反应表现出相对的变化,这些种群的分布随大麦品种的不同而变化,最敏感的品种也给出较低敏感性的真菌类别的最高的发生率。也有文献报道下列真菌对杀真菌剂的敏感性的类似的变化小麦霉(也对唑菌醇)、葡萄孢属(对苯菌灵)、核腔菌属(对有机汞)、Pseudocercosporella(对MBC-型杀真菌剂)、Mycosphaerella fiiiensis(对刚提到的三唑)(Jones和Clifford;谷类病害,John Wiley,1983)。由线虫引起的病害也已成功地被杀虫剂的使用所防治。而大多数杀真菌剂对哺乳动物相对无害,其使用存在的问题是靶标真菌的抗性发展,使用杀线虫剂主要的问题是对哺乳动物相对高的毒性。大多数用于防治土壤线虫的杀线虫剂是氨基甲酸酯的,有机氯的或有机磷的,并且必须特别小心地施用到土壤中。
在某些作物品种中,生物防治生物体的使用已发展成为保护作物的另一种替换性方式。生物防治生物体具有能够移生和保护常规杀真菌剂不能进入的植物部分的优点。所发展的这一实际应用是基于认识到生长在某些土壤中的作物天然具有对某些真菌植物病原体的抗性和高压处理后这些土壤的抑制特性丧失。此外,人们还认识到易于发生某些病害的土壤可以通过添加少量来源于抑制性田块的土壤获得抑制性(Scher等人,植物病理70412-417(1980))。后来的研究说明,根移生细菌在这一现象中起决定作用,现在称作生物病害防治(Baker等人,植物病原体的生物控制,Freeman出版社,旧金山,1974)。在许多情况下,大多数有效的生物病害防治细菌菌株是荧光假单胞菌类(Weller等人,植物病理73463-469(1983);Kloepper等人,植物病理711020-1024(1981))。已被种子接种有效防治的重要的植物病原体包括Gaemannomyces graminis(小麦主要的病原体)(Cook等人,土壤生物化学8269-273(1976))和腐霉属丝核菌属和丝核菌属植物病原体(与棉花腐烂有关)(Howell等人植物病理69480-482(1979))。几种生物病害防治假单胞菌菌株产生抑制真菌植物病原体生长的抗生素(Howell等人,植物病理69480-482(1979);Howell等人,植物病理70712-715(1980)),它们已用于在根际防治真菌植物病原体。尽管生物防治起初被认为作为广泛用于病害防治的方法很有希望,但人们发现其最成功的用途主要是在温室作物环境防治土传植物病原体。由于微生物生产(它们常常慢速生长)、分配(它们常常短期存活)和价格(这两个问题产生的结果)的限制,还没有证实大规模田间使用天然产生的微生物的可能性。此外,生物防治方法也受到天然产生菌株的鉴别的极大的限制,所说菌株可能具有有限的效能谱。某些使用的最初的方法也被用于防治线虫植物病原体。尽管这些方法仍然在开发,但已报道某些链霉菌的种被用于防治根群线虫(Meliodogynespp.)(WO93/18135,研究合作技术),并且,来源于某些苏云金杆菌菌株(例如israeliensis)的毒素已显示出具有广泛的抗线虫活性,由此孢子和菌体制剂提供合适的生物防治机会(EP0352052,Mycogen;WO93/19604,研究合作技术)。
保护作物抵抗病害的传统方法包括种植病害抗性植物和连续开发杀真菌剂,近来生物防治生物体的鉴别已获得成功。可是,很明显,科学家必须不但研究保护作物抵抗病害的新方法。本发明提供了保护植物使其抵抗植物病原体侵害的新方法。
本发明揭示了特定微生物经多基因生物合成途径产生物质的遗传基础,所述物质对植物病原体繁殖和生长具有有害作用。这些物质包括含碳水化合物抗生素(如氨基甙)、肽抗生素、核苷衍生物、含氮和/或氧杂环抗生素、聚酮化合物、大环内酯和醌。
本发明提供了在宿主生物体中重组产生特定的抗病原体物质所需的整套基因。本发明还提供了操作APS基因使其在转基因植物中表达的方法。如此修饰的转基因植物对植物病原体的攻击具有增强的抗性。本发明提供了细胞靶引APS基因产物以保证对所需底物的可获得性来说所说的基因产物具有合适的空间位置的方法。本发明还提供了经APS代谢途径通过超量表达和过度产生编码底物前体的基因提高产量的方法。
本发明还提供了鉴别和分离宿主生物体中生物合成任何特定的APS所牵涉的基因的新方法。本发明也描述了改善的生物防治菌株,该菌株产生异源APS并且在宿主通常范围之外有效防治土传和苗期植物病原体。
由此,本发明提供了保护植物使其抵抗植物病原体侵害防治的方法。这些方法涉及使用表达APS生物合成基因的转基因植物和使用表达APS基因的生物防治生物体。
本发明还提供了以足以使APS分离和用于农用制剂中的量产生APS的方法。这一产生方法特别的优点是所产生的分子具有相同手性;转基因生物体中的产生避免了产生外消旋混合物(某些对映体在其中可能具有降低的活性)。
定义如本申请所使用的,下列术语具有下面所给出的含义。
抗病原体物质一种物质,该物质必需具有对植物的一种或多种非内源性酶促活性,产生于一种宿主(在其中抗病原体物质不是天然产生的),这一物质对病原体的繁殖和生长具有有害作用。“非内源性酶促活性”意指在宿主(在其中抗病原体物质不能天然产生)中不能天然产生的酶促活性。病原体可以是真菌、细菌、线虫、病毒、类病毒、昆虫或其组合体。并且可以是宿主生物体中的直接或间接病原体。抗病原体物质可以阻止植物病原体的繁殖或生长或者可以杀死植物病原体。抗病原体物质可以从宿主中天然产生的底物合成。另外抗病原体物质也可以从提供给给宿主必需的非内源性酶促活性的底物合成。抗病原体物质可以是含碳水化合物抗生素、肽抗生素、含氮杂环抗生素、含氧杂环抗生素、含氮和氧杂环抗生素、聚酮化合物、大环内酯和醌。本申请全文将抗病原体物质缩写为“APS”。
抗植物病原体物质如本文所定义的对植物病原体的繁殖或生长具有有毒作用的抗病原体物质。
生物防治生物体一种生物体,该生物体能够影响病原体的生长,以使病原体引起病害的能力降低。用于植物的生物防治生物体包括能够移生于植物或根际的微生物。这种生物防治生物体包括革兰氏阴性微生物(例如假单胞菌属、肠杆菌属和沙雷氏菌属)、革兰氏阳性微生物芽孢杆菌属和真菌木霉属和胶霉属。生物体可以以其天然状态或者按照本发明经基因工程操作后作为生物防治生物体起作用。
病原体一种生物体,该生物体产生在合适的条件下对选择的宿主的毒害作用。在本发明的范围中,术语病原体意于包括真菌、细菌、线虫、病毒、类病毒和昆虫。
启动子或调节DNA序列一种未翻译的DNA序列,该序列有助于增强或以其它方式影响编码蛋白质或其它DNA产物之相关结构DNA序列的转录、翻译或表达。启动子DNA序列通常位于翻译DNA序列的5’末端,典型地位于从翻译起始位点5’末端起的20和100个核苷酸之间。
编码DNA序列一种在生物体中翻译产生蛋白质的DNA序列。
操作连接到/相关于“相关的”或“操作连接的”两个DNA序列是物理或功能相关的。例如,如果两个序列是可操作连接的或位质上使调节DNA序列影响编码或结构DNA序列的表达水平,则启动子或调节DNA序列被说成是“相关于”编码RNA或蛋白质的DNA序列。
嵌合构建体/融合DNA序列一种重组DNA序列,其中,启动子或调节DNA序列操作连接到或相关于编码mRNA的DNA序列或者作为蛋白质被表达的DNA序列上,以便调节DNA序列能够调节相关DNA序列的转录或表达。在天然发现的中,嵌合构建体的调节DNA序列通常不是操作连接到相关DNA序列上的。术语“异源的”或“非同源的”用于指一种重组DNA序列,其中启动子或调节DNA序列和相关DNA序列是从不同种或属的生物体分离的。
附图简要说明

图1得自携带吡咯尼群生物合成基因区的荧光假单胞菌的粘粒克隆pCIB169的限制图。用kbp表示了酶EcoRI、HindIII、KpnI、SphI和XbaI限制位点以及核苷酸位置。
图2MOCG134的硝吡咯菌素基因区功能图,为鉴别吡咯尼群生物合成基因,表示出了沿pCIB169长度的30个独立的Tn5插入物的插入位点。EcoRI限制位点用E表示,Notl位点用N表示。Tn5插入物在prn产生上的作用用+或-表示,其中+表示prn产生者,-表示prn非产生者。
图3在吡咯尼群生物合成中涉及的克隆pCIB169的9.7kb MOCG134Prn基因区的限制图。EcoRI限制位点用E表示,Notl位点用N表示,HindIII位点用H表示。用kbp表示出核苷酸位置。
图4得自为序列测定目的分离的pCIB169的各亚克隆的位置。
图54个对菌株MOCG134中吡咯尼群生物合成起作用的开放读框(ORF1-4)在包含Prn基因区的pCIB169的~6kb Xbal/Notl片段上的定位。
图6MOCG134吡咯尼群基因簇ORF1-4中缺失的片段的位置。缺失的片段用填充的盒状体表示。
图7得自携带soraphen生物合成基因区的纤维堆囊菌的粘粒克隆p98/1的限制图。顶上的线描绘了p98/1的限制图并显示了限制位点位置和其以千碱基表示的距左边的距离。所显示的限制位点包括B,BamHI;Bg,BglII;E,EcoRI;H,HindIII;Pv,PvuI;Sm,SmaI。限制图下面的盒状体描绘了生物合成组件的位置。按以下表示各组件中的活性区β-酮脂酰合成酶(KS)、酰基转移酶(AT)、酮基还原酶(KR)、酰基载体蛋白(ACP)、脱水酶(DH)、烯脂酰还原酶(ER)和硫酯酶(TE)。
图8从pSUP2021构建pCIB132。
图9包含在5.7kb EcoRI-HindIII片段上的吩嗪生物合成基因簇的限制性内切核酸酶图谱。6个开放读框的取向和大约位置在限制图下面给出。ORF1(5.7kb片段内没有完全给出)编码具有与植物DAHP合成酶的明显同源性的产物。ORF2(0.65kb)、ORF3(0.75kb)和ORF4(1.15kb)分别具有同源于异分支酸酶(isochorismatase)、氨茴酸酯合成酶大亚单位和氨茴酸酯合成酶小亚单位。ORF5(0.7kb)表现出与数据库序列无同源性。ORF6(0.65kb)产物具有与大肠杆菌中编码吡咯尼群5’-膦酸酯氧化酶之基因的末端对末端的同源性。
序列表中序列的简要描述SEQ ID NO1----吡咯尼群基因簇序列SEQ ID NO2----吡咯尼群基因簇ORF1的蛋白质序列SEQ ID NO3----吡咯尼群基因簇ORF2的蛋白质序列SEQ ID NO4----吡咯尼群基因簇ORF3的蛋白质序列SEQ ID NO5----吡咯尼群基因簇ORF4的蛋白质序列SEQ ID NO6----soraphen基因簇序列SEQ ID NO7----植物共有翻译起始区序列(Clontech)SEQ ID NO8----植物共有翻译起始区序列(Joshi)SEQ ID NO9----用于分子衔接子的寡核苷酸序列SEQ ID NO10----用于分子衔接子的寡核苷酸序列SEQ ID NO11----用于分子衔接子的寡核苷酸序列SEQ ID NO12----用于分子衔接子的寡核苷酸序列SEQ ID NO13----用于分子衔接子的寡核苷酸序列SEQ ID NO14----用于分子衔接子的寡核苷酸序列
SEQ ID NO15----用于改变限制位点的寡核苷酸SEQ ID NO16----用于改变限制位点的寡核苷酸SEQ ID NO17----吩嗪基因簇的序列SEQ ID NO18----吩嗪基因簇phz1的蛋白质序列SEQ ID NO19----吩嗪基因簇phz2的蛋白质序列SEQ ID NO20----吩嗪基因簇phz3的蛋白质序列SEQ ID NO21----吩嗪基因簇phz4的DNA序列SEQ ID NO22----吩嗪基因簇phz4的蛋白质序列保藏克隆 保藏号保藏日pJL3 NRRL B-212541994年5月20日P98/1 NRRL B-212551994年5月20日pCIB169NRRL B-212561994年5月20日pCIB3350 NRRL B-212571994年5月20日pCIB3351 NRRL B-212581994年5月20日微生物产生抗病原体物质许多生物体产生次级代谢物,其中某些抑制其它生物体。自青霉素的发现后,已发现了大量具有抗生活性的化合物,随着筛选的不断进行,其数量不断增加。抗生活性代谢物包括宽范围的化学结构。大多数重要的包括氨基甙(如链霉素)和其它含碳水化合物的抗生素(如β-lactAPS、rhizocticin(参见Rapp,C.等人,Liebigs化学年鉴655-661(1988))、核苷衍生物(如杀稻瘟素S)、其它含氮(如吩嗪和吡咯尼群)和/或氧的杂环抗生素、聚酮化合物(如soraphen)、大环内酯(如红霉素)和醌(如四环素)。
氨基甙和其它含碳水化合物的抗生素氨基甙是由经糖苷键与其它氨基糖连接的氨基环己醇部分组成的寡糖。链霉素(该组中研究得最多的一种)是由灰色链霉菌产生的。这一化合物的生物化学和生物合成是复杂的(综述参见Mansouri等人,见工业微生物的遗传及分子生物学ed.Hershberger等人),美国微生物学会,华盛顿,D.C.pp61-67(1989)),涉及到25-30个基因,迄今已分析了其中的19个(Retzlaff等人,见工业微生物基础及应用遗传学(ed.Baltz等人),美国微生物学会,华盛顿,D.C.pp183-194(1993))。链霉素和许多其它氨基甙在靶标生物体中抑制蛋白质合成。
肽抗生素肽抗生素可分成两类一类是无核糖体器官参与的经酶系统合成的那些,另一类是需要核糖体介导的mRNA翻译提供抗生素前体的那些。
不经核糖体合成的肽抗生素是由激活、修饰、聚合和在某些情况下环化亚单位氨基酸形成肽链的大的多功能酶装配而成的。也掺合进了其它酸(Katz和Demain,细菌学评述41259-289(1987)),所说的酸例如氨基己二酸、二氨基丁酸、二氨基丙酸、二羟氨基酸、异丝氨酸、二羟苯甲酸、羟基异戊酸、(4R)-4-[(E)-2-丁烯基-4,N-二甲基-L-苏氨酸和鸟氨酸。产物不由mRNA编码,核糖体不直接参与合成。按照其总的结构,不经核糖体合成的肽抗生素依次可分成线性的、环状的、内酯、支链环肽和depsipeptide类别(Klernkauf和von Dohren,欧洲生物化学杂志1921-15(1990))。抗生素的这些不同类别是由修饰和环化酶的作用产生的。基本的聚合组合对它们所有的都是常见的。不经核糖体合成的肽抗生素是由细菌和真菌两者产生的,包括得自短芽孢杆菌的伊短菌素、线性短杆菌肽、短杆菌酪肽和短杆菌肽S;得自枯草芽孢杆菌的霉菌杆菌素;得自多粘霉芽孢杆菌的多粘菌素;得自灰色链霉菌的宜他霉素;得自多刺链霉菌的刺霉素;得自节棒链霉菌的放线菌素;得自大肠埃希氏杆菌的enterochelin;得自构巢曲霉的γ-(α-L-氨基己二酰)-L-半胱氨酸-D-缬氨酸(ACV);得自绿色木霉的alamethicine;得自Metarhizium anisolpliae的腐败菌素;得自尖孢镰孢的恩镰孢菌素;得自蚕白僵菌的beauvericin。在原核和真核系统之间存在广泛的功能和结构类似性,表明两者的共同来源。肽抗生素的活性类似地广泛,不同肽抗生素在动物、植物和真菌中的毒性作用是已知的(Hansen,细菌学评述47535-564(1983);Katz和Demain,细菌学评述41449-474(1977);Kleinkauf和von Dohren,微生物年鉴41259-289(1987);Kleinkauf和von Dohren,欧洲生物化学杂志1921-15(1990);Kolter和Moreno,微生物年46141-163(1992))。
经核糖体合成的肽抗生素以存在抗生素自身的结构基因为特征,所述基因编码被特定酶修饰产生成熟分子的前体。肽抗生素合成的总的蛋白质合成器官的使用给出了制备更长的聚合物的可能性,尽管这些肽抗生素不必特别长。除了结构基因外,胞外分泌和免疫需要其它基因,人们相信这些基因靠近结构基因,在大多数情况下很可能在相同的操纵子上。在核糖体上制造的两种主要的肽抗生素是稀有氨基酸羊毛硫氨酸的那些和不含这一氨基酸的那些。含羊毛硫氨酸的抗生素(羊毛硫抗生素)由革兰氏阳性菌(包括乳球菌属、葡萄球菌属、链球菌属、芽孢杆菌属、和链霉菌属的种)产生。线性羊毛硫抗生素(例如乳链菌肽、枯草菌素、表皮纤维和gallidermin)和环状羊毛硫抗生素(例如耐久霉素和肉桂霉素)是已知的(Hansen,微生物学年鉴46535-564(1993);Kolter和Mwreno,微生物学年鉴46141-163(1992))。羊毛硫抗生素通常包含其它特征性修饰残基,例如脱氢丙氨酸(DHA)和dehydrobutyrine(DHB),分别得自丝氨酸和苏氨酸的脱水。半胱氨酸的巯基与DHA反应产生羊毛硫氨酸,与DHB反应产生β-甲基羊毛硫氨酸。不含有羊毛硫氨酸的肽抗生素可以包含其它修饰物,或者它们仅由用于肽合成中的普通氨基酸组成。不包含羊毛硫氨酸的肽抗生素由革兰氏阳性菌和革兰氏阴性菌两者(包括乳芽孢杆菌属、乳球菌属、片球菌属、肠球菌属和埃希氏杆菌属)产生。这一类别中的抗生素包括lactacins、lactocins、sakacin A、pediocins、双球菌素、lactococcins和小菌素(Hansen,同上;Kolter和Moreno,同上)。
核苷衍生物和其它含氮和/或氧的杂环抗生素这些化合物均含有杂环,但有其它结构差异,如下面的例子所说明的,它们具有不同的生物学活性。
多氧菌素和nikkomycins是核苷类似物,结构上类似UDP-N-乙酰葡糖胺,是壳多糖合成酶的底物。它们已被鉴别为壳多糖的竞争性抑制剂(Gooday,见真菌细胞及细胞膜生物化学(ed.Kuhn等人),Springer-Verlag,Berlin p.61(1990))。多氧菌素由可可链霉菌产生,nikkomycins由唐德链霉菌产生。
吩嗪是具有普通的平面芳香三杂环结构的含氮杂环化合物。已鉴别的天然产生的吩嗪超过50种,在基本环结构上各自的取代基不同。这组化合物被发现天然地仅由细菌特别是链霉菌、堆囊粘菌属和假单胞菌)产生(综述常见Turner和Messenger,微生物生理学进展27211-275(1986))。近来已分离到变金色假单胞菌菌株的吩嗪生物合成基因(Pierson和Thomashow MPMI 5330-339(1992))。由于其平面芳香结构,人们已提出吩嗪可以与DNA形成嵌入复合物(Hollstein和van Gemert,生物化学10497(1971)),并由此干扰DNA代谢。吩嗪堆囊粘菌素N表现出嵌入DNA(Hollstein和butler,生物化学111345(1972)),吩嗪洛蒙真菌素表现出在酵母中抑制RNA合成(Cannon和Jiminez,生物化学杂志142457(1974);Ruet等人,生物化学144651(1975))。
吡咯尼群是具有强的抗生活性的苯基吡咯衍生物,并显示出抑制宽范围的真菌(Homma.21723-728(1989);Nishida等人,抗菌素杂志续刊A,18211-219(1965))。它最初是从吡咯假单胞菌分离到的(Arima等人,抗菌素杂志续刊A,18201-204(1965)),现在已从假单胞菌属的几个其它的种和粘球菌属的种分离(Gertg et aK,抗菌素杂志351101-1103(1982))。已报道该化合物抑制真菌呼吸电子转移(Tripathi和Gottlieb,细菌杂志.100310-318(1969))和解偶氧化磷酸化(Lambowitz和Slayman,细菌杂志.1121020-1022(1972))。也已提出吡咯尼群导致产生的脂蛋白膜损坏(Nose和Arima,抗菌素杂志,续刊A 22135-143(1969);Carlone和Scannerini,Mycopahtologia et Mycologia Applicata 53111-123(1974))。吡咯尼群是从色氨酸生物合成的(Chang等人,抗菌素杂志34555-566)得自荧光假单胞菌的生物合成基因现在已被克隆(参见实施例C部分)。因此,本发明的一个实施方案涉及到分离的DNA分子,该分子编码一种或多种用于异源宿主中生物合成吡咯尼群的多肽,这一分子可用于经基因工程产生表达所说抗病原体物质的宿主生物体。本发明的其它实施方案是生物合成吡咯尼群所需的分离的多肽。
聚酮化合物合成酶尽管表现出结构上的差异,许多抗生素具有共同的生物合成模式。分子由两个构成部件构成,其β-碳总是携带一个酮基,因此称为聚酮化合物。大的结构差异来自聚酮化合物的不同的长度和引入的不同侧链(两者作为碳构成部件的部分)或者在聚酮化合物结构形成之后。酮基可被还原成羟基或者一起被除去。以类似于脂肪酸生物合成的方式由称作聚酮化合物合成酶(PKS)的酶复合物完成每次两个碳原子的添加。增加聚酮化合物抗生素数量的生物合成基因已被分离和测序。非常明显,PKS基因是结构保守的。所编码的蛋白质一般分成两类一型蛋白质是多功能的,具有几个经共价键连接在一起的进行不同酶促步骤的酶促区(如红霉素、soraphen和除虫菌素的PKS(Joaua等人,质粒28157-165(1992);MacNeil等人,见工业微生物基础及应用分子遗传学(编辑Baltz等人),美国微生物学会,华盛顿pp.245-256(1993));而二型蛋白质是单功能的(Hutchinson等人,见工业微生物基础及应用分子遗传学,(编辑Baltz等人),美国微生物学会,华盛顿pp.203-216(1993))。就较简单的聚酮化合物抗生素如放线紫素(由天蓝色链霉菌产生)而言,几次两个碳原子的添加反复由一套PKS基因编码的PKS酶进行。相反,更复杂的化合物如红霉素和soraphen(参见实施例E部分)的合成涉及组织成组件的PKS基因组,各组件完成一次两个碳原子添加(综述参见Hopwood等人,见工业微生物基础及应用分子遗传学(编辑Baltz等人),美国微生物学会,华盛顿pp.267-275(1993))。本发明提供了堆囊粘菌属soraphen生物合成基因(参见实施例E部分)。因此,本发明的另一实施方案涉及分离的DNA分子,该分子编码一种或多种在异源宿主中生物合成soraphen的多肽,这一分子可用于经基因工程产生表达抗病原体物质的宿主生物体。本发明的另一实施方案是生物合成soraphen所需的分离的多肽。
大环内酯这一组化合物都存在具有各种环取代基的大内酯环。依据环大小和其它特征,这组化合物可进一步分成亚组。例如,大环内酯含有12-,14-,16-或17-员内酯环,该环经糖苷键连接一个或多个氨基糖和/或脱氧糖。它们是蛋白质合成的抑制剂,抗革兰氏阴性菌特别有效。红霉素A(一种充分研究过的红色糖多孢菌产生的大环内酯)含有连接两个脱氧糖的14-员内酯环。许多所说的生物合成基因已被克隆,所有的都位于红色糖多孢菌染色体的60kb区段内。至少22个紧密连接的开放读框已被鉴别为很可能涉及红霉素的生物合成(Donadio等人,见工业微生物基础及应用分子遗传学,(编辑Baltz等人),美国微生物学会,华盛顿pp.257-265(1993))。
醌醌是在完整的不饱和环上有两个羰基的芳香化合物。按照存在的芳香环的数目,这些化合物可广义地分成亚类,例如苯醌,蒽醌等。充分研究的一组是四环素,它含有具有不同取代基的并四苯环。四环素是蛋白质合成抑制剂,抗革兰氏阳性菌和革兰氏阴性菌两者以及立克次氏体、支原体和螺旋体均有效。四环素中的芳香环源于聚酮化合物分子。涉及氧四环素(龟裂链霉菌产生)生物合成的基因已被克隆和在变青链霉菌中表达(Binnie等人,细菌杂志171887-895(1989))。PKS基因具有与放线紫素基因的同源性,因此编码II型(单功能)PKS蛋白质(Hopewood和Sherman,遗传学年鉴2437-66(1990))。
其它类型APS已鉴别了几种其它类型的APS。其中之一是由假单胞菌属的某菌株产生的抗生素2-羟基-5-丙基-间苯二酚。它首先从假单胞菌菌株B-9004分离(Kanda等人,抗生素杂志28935-942(1975)),是1,3-二羟基的二烷基取代衍生物。它已表现出具有抗革兰氏阳性菌(特别是棍状杆菌属的种)、分枝杆菌和真菌的抗病原菌活性。
另一种类型的APS是甲氧基丙烯酸酯,例如strobilurin B。strobilurinB是由担子菌产生的,具有宽谱抗真菌活性(Anke,T.等人,抗菌素杂志(Tokyo)30806-810(1977))。具体所来,strobilurin B是由真菌Bolinialutea产生的。作为其抑制依赖电子转移的细胞色素b从而抑制呼吸的能力的结果,strobilurin B表现出具有抗真菌活性(Becker,W.等人,欧洲生物化学学会联合会通讯132329-333(1981))。
大多数抗生素已从细菌、放线菌和真菌分离。在宿主生物体生物学中的作用常常是未知的,但许多已很成功地用于医药和农业中控制微生物病原体。已用于农业的抗生素是用于防治稻瘟(pyricularia oryzae)的杀稻瘟素和春日霉素;用于防治茄属丝核菌的有效霉素;用于防治葡萄孢属和核盘菌属的种的普鲁霉素;用于以及防治霉病的灭粉霉素。
迄今,抗生素在植物保护中的使用涉及到经化学合成或发酵产生化合物和施用于种子、植物部分或土壤。本发明描述了大量抗病原体物质生物合成基因的鉴别和分离方法,还描述了这些基因在产生具有增强的病害抗性特征的转基因植物上的用途,也描述了产生移生宿主植物或根际在生物体中表达分离的基因的改进的生物防治菌株的方法。而且,这些基因的可获得性提供了产生APS以便分离和用于抗病原体配方中的方法。
克隆抗病原体物质基因的方法按照本发明可以用各种技术克隆编码生物合成基因的基因。克隆APS基因最简单的方法需要从被鉴别为产生APS的生物体克隆基因组DNA,将在合适的质粒或载体上克隆的DNA转移到不产生APS的宿主生物体中,接着鉴别已具有产生APS能力之转化的宿主克隆。用λ∷Tn5转座子诱变(de Bruijn和Lupski,基因27131-149(1984))之类的技术可以更准确地限定转化的赋予产生APS能力之DNA的准确区域。另外,转化的赋予产生APS能力之DNA可以裂解成较小的片段,保留赋予产生APS能力的最小的片段可进一步确定特征。而缺乏产生APS能力的生物体可以是不同于产生APS的生物体的物种,这一技术的变化涉及将宿主DNA转化进其产-APS能力已被诱变破坏的相同的宿主中。在这一方法中,诱变产APS生物体,分离不产APS突变体,这些被产APS母体菌株的克隆的基因组DNA补充。用于克隆APS生物合成基因所需之基因的标准技术的另一个实施例是采用转座子诱变以产生产APS生物体(诱变后不产生APS)的突变体。因此,决定APS产生的宿主基因组区是转座子的靶,可以容易地重获并用作从母体菌株分离天然基因的探针。利用其与已知化合物生物合成基因的同源性,生物合成APS所需的和类似于已知的APS化合物的APS生物合成基因可以是可克隆的。适于同源克隆的技术包括标准的DNA杂交文库筛选。
本发明也描述了分离APS生物合成基因的新技术,该技术可以用于克隆任何APS基因,在克隆用任何上述技术可能是不易克隆的APS生物合成基因上特别有用。为什么存在不易克隆的一个原因是以上描述的标准技术(除同源克隆外)可能偏向于导致APS生物合成调节物的分离。然而,一旦这种调节物被鉴别,在克隆的调节物的控制下采用这种新技术分离生物合成基因它就可以使用。在这一方法中,在微生物菌株中转座子插入物突变体文库被产生,所述菌株缺乏调节物或调节物基因已被常规基因破坏技术毁坏。所使用的插入物转座子携带无启动子报道基因(如lacZ)。一旦插入物文库被构建,调节物基因的功能性拷贝就被转移到细胞文库(如经接合或电穿孔),并且平板接种的细胞就报道基因的表达被选择。在调节物基因转移之前和之后测定细胞。仅在调节基因存在下表达报道基因的菌落是邻近于被调节物调节之基因启动子的插入物。假定调节物在其APS生物合成基因的调节中是特异性的,则这一方法的基因靶将是APS生物合成基因。在一个优选的实施方案中,克隆的调节物基因是PCT申请WO94/01561中描述的gafA基因,该基因调节吡咯尼群生物合成基因的表达。因此,这一方法是克隆吡咯尼群生物合成基因的较好的方法。另一种从微生物鉴别和分离生物合成抗病原体物质(APS)所需之基因的方法(其中所说基因的表达在所说APS生物合成调节物的控制下)包括(a)将所说微生物的基因片段文库克隆到载体中邻近无启动子报道基因,以便仅在由克隆片段提供启动子功能时才可以发生所说报道基因的表达;(b)将步骤(a)产生的载体转化进合适的宿主中;(c)鉴别仅在所说调节物存在下表达所说报道基因的步骤(b)的那些转化体;和(d)鉴别和分离可操作连接到存在于步骤(c)中鉴别的转化体中的所说微生物的基因片段上的DNA片段;其中步骤(d)中分离和鉴别的所说DNA片段编码一种或多种生物合成所说APS所需之多肽。
为了克隆用于转基因表达中的APS基因,鉴别和克隆从特定代谢物合成所需的所有基因是重要的。使用以上所述的所有的技术或其组合,这对任何已知的APS都是可能的。由于大多数APS生物合成基因群集在微生物中,通常由单个操纵子编码,因此从鉴别产APS微生物中单个基因座鉴别所有基因是可能的。此外,因为相信APS生物合成基因调节物调节整个途径,所以经其调节物克隆生物合成基因是克隆这些基因特别有吸引力的方法。在许多情况下调节物会控制单个完整操纵子的转录,由此有利于用这一策略克隆基因。
用本申请所述的方法,可以从微生物克隆任何APS生物合成基因。包含分离的DNA分子的表达载体可用于转化异源宿主,所说的DNA分子编码生物合成抗病原体物质(例如吡咯尼群和soraphen)的一种或多种多肽。合适的异源宿主是细菌、真菌、酵母和植物。在本发明一个优选的实施方案中,转化的宿主可以合成在其中不能天然产生的抗病原体物质。所说的宿主可以在允许产生所说抗病原体序列(其可从宿主收集)之条件下生长。采用本说明书描述的基因操作和转基因植物产生方法,可在转基因植物中修饰和表达APS生物合成基因。合适的APS生物合成基因包括在这一部分开始描述的那些,即,氨基甙和其它含碳水化合物的抗生素(如链霉素)、肽抗生素(不经核糖体和经核糖体合成的两类)、核苷衍生物和其它含氮和/或氧的杂环抗生素(如多氧菌素、nikkomycins、吩嗪和吡咯尼群)、聚酮化合物、大环内酯和醌(如soraphen、红霉素和四环素)。在转基因植物中的表达在合适的启动子的控制下,并牵涉合适的细胞靶引(考虑到所考虑的特定APS所需的可能的前体)。而本发明意欲包括可用本说明书描述的方法分离的任何APS基因在转基因植物中的表达,特别优选的包括吡咯尼群、soraphen、吩嗪和肽抗生素短杆菌肽和表皮纤维。为了在生物体中赋予和增强生物防治效能,克隆的生物合成基因也可以在土传和植物移生生物体中表达。为这一目的特别优选的APS基因是编码吡咯尼群、soraphen、吩嗪和肽抗生素的那些。
在异源微生物宿主中产生抗病原体物质克隆的APS基因可以在异源细菌或真菌宿主中表达,能够以比天然宿主可能的效率更高的效率产生APS。对不同可获得的宿主的基因操作技术是特异性的并且是本领域已知的。例如,表达载体pKK223-3和pKK223-2可以用于在大肠杆菌中表达(在tac或trc启动子后在转录或翻译融合体)外源基因。为表达编码多个OFR的操纵子,最简单的方法是将操纵子插入到载体如pKK223-3中(在转录融合体中),使得外源基因的相关核糖体结合位点可以使用。在革兰氏阳性物种(如芽孢杆菌)中超量表达的技术是本领域已知的,并且可以用于本发明中(Quax等人,见工业微生物基础及应用分子遗传学,编辑Baltz等人,美国微生物学会,华盛顿(1993))。超量表达的替换系统依赖酵母载体,包括使用毕赤酵母属、糖酵母属保加利亚克鲁维氏酵母属(Sreekrishna,见工业微生物基础及应用分子遗传学,Baltz,Hegeman和Skatrud编辑,美国微生物学会,华盛顿(1993);Dequin和Barre,生物技术12173-177(1994);Van den等人,生物技术8135-139(1990))。
克隆的APS基因也可以在异源细菌和真菌宿主中表达,帮助这些细菌和真菌宿主生物防治菌株增加效率。由此,保护植物使其抵抗植物病原体侵害的方法是用生物防治生物体处理所说的植物,所说的生物防治生物体已用能够以抑制所说植物病原体的量共同表达产生抗病原体物质所需之全部多肽的一个或多个载体转化。适于外源超量表达APS基因的微生物是能够移生植物或根际的所有微生物。这样,它们与植物病原体真菌、细菌和线虫接触导致其生长抑制。这些微生物包括革兰氏阴性微生物(假单胞菌属、肠杆菌属和沙雷氏菌属)、革兰氏阳性微生物(芽孢杆菌属)和真菌(木霉属和胶霉属)。特别优选的异源宿主是荧光假单胞菌、恶臭假单胞菌、葱头假单胞菌。致金色假单胞菌、桔黄假单胞菌、阴沟肠杆菌、沙雷氏菌属、枯草芽孢杆菌、蜡状芽孢杆菌、绿色木霉、Trichoderma harzianum和绿粘帚藻。在本发明优选的实施方案中,吡咯尼群、soraphen、吩嗪和/或肽抗生素的生物合成基因转移进以上所列特别优选的外源宿主中。在特别优选的实施方案中,吩嗪和/或soraphen生物合成基因转移进荧光假单胞菌菌株CGA267356(在出版的申请EP 0472494中描述)并在其中表达,由于产生吡咯尼群(但不产生吩嗪)所述菌株已有生物防治用途。在另一个优选的实施方案中,吡咯尼群和/或soraphen生物合成基因转移进致金色假单胞菌菌株30-48,该菌株具有产生吩嗪的生物防治特征。在异源生物防治菌株中的表达需要选择适于在所选择的宿主中复制的植物病原体和适宜的启动子选择。在革兰氏阳性菌和革兰氏阴性菌以及真菌中表达的技术是本领域熟知的,在本申请中其它地方有描述。
在植物中表达抗病原体物质基因保护植物使其抵抗植物病原体侵害的方法是用生物防治生物体处理所说的植物,所说的生物防治生物体已用能够以抑制所说植物病原体的量共同表达产生抗病原体物质所需之全部多肽的一个或多个载体转化。当在转基因植物中表达时,本发明的APS生物合成基因引起选择的APS在转基因植物中生物合成。在这种方法中产生具有增强的对植物病原体真菌、细菌和线虫的抗性的转基因植物。为了其在转基因植物中表达,所说的APS基因和邻近的序列可能需要修饰和优化。
尽管在许多情况下,不经修饰,微生物生物体的基因可以在植物中高水平地表达,在转基因植物中的低表达可能出现在具有植物中非优选的密码子的APS基因上。本领域已知所有生物体都具有特异性优先密码子使用,APS基因密码子可以改变成与植物优先采用的一致,同时保留编码的氨基酸。而且,在植物中的高表达被从具有至少35%(优选地大于45%)GC含量的编码序列很好地获得。由于存在可以使信息去稳定之ATTTA基序和导致不合适的聚腺苷酸化之AATAAA基序,具有低GC含量的微生物基因在植物中可能具有很差的表达,此外,就引起信息截短的非常规剪接位点的存在可以筛选潜在的APS生物合成基因。在APS编码序列内需要进行的所有变化(例如以上描述的那些)都可以用采用出版的专利申请欧洲专利0385962(Monsanto)、EP 0359472(Lubrizol)和WO93/07278(Ciba-Geigy)中所述方法的位点定向诱变、PCR和合成基因构建技术来进行。优选的APS生物合成基因可以是未修饰的基因(这些应在靶标转基因植物物种中高水平地表达),或者也可以是经除去去稳定化和不合适聚腺苷酸化和非常规剪接位点进行修饰,并进一步由掺合植物优选的密码子和植物中表达优选的GC含量修饰的基因。尽管优选的基因序列可以在单子叶植物和双子叶植物物种中充分地表达。考虑到单子叶植物和双子叶植物的特异性密码子优先和GC含量优先(这些优先已显示出不同)(Murray等人,核酸研究17477-498(1989)),这些序列可被修饰。
为有效地起始翻译,邻近起始蛋氨酸的序列可能需要修饰。关联于选择的APS基因的序列可以在植物中有效地起始翻译,或者也可以无效。在它们无效的情况下,它们可以经包含进已知在植物中有效的序列来修饰。Joshi已提出合适的植物共有序列(核酸研究156643-6653(1987);SEQ IDNO8),Clontech提出了另外的共有序列翻译起始子(1993/1994目录,210页;SEQ ID NO7)。这些共有序列适于与本发明的APS生物合成基因一起使用。所述序列掺合进APS基因构建体,适于和包括ATG基因(而留下未修饰APS基因的第二氨基酸),或者适于和包括ATG后的GTC(具有修饰转基因的第二氨基酸的可能性)。
转基因植物中APS基因的表达在表现出在植物中为功能性的启动子控制下。启动子的选择随表达的时间和空间需要而变,也随靶标物种而变。为保护植物使其抵抗叶病原体侵害,在叶中表达是优选的;为保护植物使其抵抗穗病原体侵害,在花(例如穗、圆锥花絮、园块等)中表达是优选的;为保护植物使其抵抗根病原体侵害,在根中表达是优选的;为保护籽苗使其抵抗叶病原体侵害,在根和/或籽苗中表达是优选的。然而,在许多情况下,将寻求抗一种类型以上的植物病原体,因此,在多种组织中的表达是所需的。尽管许多双子叶植物的启动子已表现出在单子叶植物中起作用并且反过来也是如此,但理想的双子叶植物启动子选择来用于在双子叶植物中的表达,单子叶植物启动子选择来用于在单子叶植物中的表达。然而,对选择的启动子的起源没有限制;它们能在驱动APS生物合成基因的表达中起作用就足够了。在某些情况下,APS在植物中的表达可以提供针对昆虫害虫的保护。APS白僵菌素(从蚕白僵菌分离)的生物合成基因的转基因表达可以提供例如针对作物昆虫害虫的保护。
组成型表达的优选的启动子包括CaMV 35S和19S启动子以及得自编码肌动蛋白或遍在蛋白基因的启动子。其它优选的组成型启动子是来源于12(4-28)、CP21、CP24、CP38和CP29基因(本发明提供了其cDNA)的那些。
本发明的APS基因也可以在化学调节启动子的调节下表达。这使得仅在用包括化学品在内处理作物时合成APS,APS生物合成接着下降。化学诱导基因表达优选的技术在出版的欧洲专利申请EP0332104(Ciba-Geigy)(一并在本文中参考)中有详细描述。化学诱导优选的启动子是烟草PR-1a启动子。
优选的启动子类别是创伤诱导(wound inducible)的那些。在创伤位点和也在植物病原体感染位点表达的许多启动子已有描述。这些启动子适于表达APS基因,因为APS生物合成是被植物病原体感染截短的,因而APS仅在感染发生时积累。理想地是这种启动子应仅在感染位点局部是活性的,以这种方式APS仅在需要合成APS杀灭侵入植物病原体的细胞中积累。这些类型的优选的启动子包括以下文献描述的那些Stanford等人,分子基因遗传215200-208(1989);Xu等人,植物分子生物学22573-588(1993);Logemann等人,植物细胞1151-158(1989);Rogrmeier和Lehle,等人,植物分子生物学22783-792(1993);Firek等人,植物分子生物学22129-142(1993)和Warner等人,植物杂志3191-201(1993)。
优选的组织特异性表达模式包括绿色组织特异性、根特异性、茎特异性和花特异性。适于在绿色组织中表达的启动子包括调节牵涉植物合成的基因的许多启动子,其中许多已从单子叶植物和双子叶植物克隆。优选的启动子是磷酸烯醇羧激酶基因的玉米PEPC启动子(Gudspeth和Grula,植物分子生物学12579-589(1989))。用于根特异性表达的优选的启动子是由de Framond(欧洲生物化学学会联合会290103-106(1991);欧洲专利0452269(Ciba-Geigy)描述的那些,更优选的根特异性启动子是本发明提供的T-1基因的启动子。优选的茎特异性启动子是在专利申请WO93/07278(Ciba-Geigy)中描述的启动子,该启动子驱动玉米trpA基因的表达。
本发明优选的实施方案是以根特异性方式表达APS生物合成基因的转基因植物。在本发明的一个特别优选的实施方案中,吡咯尼群生物合成基因在根特异性启动子控制下表达,以保护转基因植物使其抵抗植物病原体丝核菌属的侵害。在本发明的另一个特别优选的实施方案中,吩嗪生物合成基因在根特异性启动子控制下表达,以保护转基因植物使其抵抗植物病原体Gaeumannomyces framinis的侵害。另外的优选的实施方案是以创伤诱导或病原体感染诱导方式表达APS生物合成基因的转基因植物。例如,一个优选的实施方案涉及在创伤诱导或病原体诱导启动子控制下表达soraphen生物合成基因,以防治叶病原体。
除了选择合适的启动子外,用于植物中APS表达的构建体需要连接到异源APS基因下游的合适的转录终止子。几种这样的终止子是可获得的并且是本领域已知的(例如CaMV的tm1,rbcS的E9)。任何可获得的已知在植物中起作用的终止子都可以用于本发明中。
许多其它序列可以掺合进APS基因的表达盒中。这些序列包括已表现出增强表达的序列,例如内含子序列(如来源于Adh1和bronze1的)和病毒前导序列(如来源于TMV、MCMV和AMV的)。
在植物中超量表达APS需要途径中编码第一步的APS生物合成基因具接近途径底物。对各单个APS和涉及的途径来说,这一底物很可能不同,在植物中有许多不同的细胞定位。在许多情况下,底物可以位于胞质溶胶中,而在其它情况下,它可以位于某些亚细胞细胞器上。由于许多植物中生物合成活性出现在叶绿体中,底物常常可以位于叶绿体上,因而这一途径的APS生物合成基因产物被最好地靶引到合适的细胞器(如叶绿体)。编码酶的转基因的亚细胞定位可以用本领域熟知的技术进行。典型地,编码靶标肽(已知的细胞器靶引基因产物)的DNA被操作和融合所需APS基因上游。许多这种靶标序列对叶绿体是已知的,其在异源构建中的功能已显示出。在本发明优选的实施方案中,吡咯尼群生物合成基因被靶引到叶绿体,因为途径底物色氨酸在叶绿体中合成。
在某些情况下,APS基因的超量表达可能缺失特定途径底物的细胞可获得性,这在细胞中可能具有有害的作用。在这种情况下,通过编码生物合成底物的酶的基因的超量表达来增加可获得的底物的量是合乎需要的。在色氨酸(吡咯尼群生物合成的底物)的情况下,这可以由超量表达trpA和trpB基因以及邻氨基苯甲酸酯合成酶亚单位获得。类似的,分支酸酯合成酶(例如DAHP合成酶)的超量表达将在产生吡咯尼群产生中所需之前体中有效。另一种产生更多可获得的底物的方法是关闭采用特异性底物的已知途径(倘若这样做无有害的副作用的话)。在这一方式中,合成的底物朝向APS而不朝向其它化合物的生物合成。
本说明书中其它地方描述了适于植物转化的载体。就土壤杆菌属介导的转化而言,二元载体或携带至少一个T-DNA边缘序列的载体是合适的,而对直接基因转移,任何载体都是合适的,仅含有目标构建体的线性DNA可以是优选的。在直接基因转移的情况下,可以使用用单个DNA物种的转化或共转化(Schocher等人,生物技术41093-1096(1986))。在直接基因转移和土壤杆菌属介导的转移而言,通常(但不是必需)进行具有选择标记的转化,所述标记可以提供抗生素(卡拉霉素、潮霉素或methatrexate)或除草剂(basta)抗性。然而,选择标记的选择对本发明不是关键的。
APS在转基因植物中的合成经常需要同时超量表达多种编码APS生物合成酶的基因。这可以通过将单个APS生物合成基因分别转化进不同的植物系然后杂交所形成的植物系来获得。如果各种转化构建体采用不同的选择标记,则会有利于选择和保持携带多个基因的植物系。其中聚集了所需之APS生物合成基因的植物系合成APS,而其它植物系不合成。这一方法可以适于其中最终的杂种需要两个亲本之间的杂交的杂种作物(如玉米)。具有不同APS基因的不同近交系的保持也可以处于有利的地位,其中特定的APS途径可以导致产生多种APS产物,各种都具有用途。通过在途径的后面的步骤采用携带不同替换基因的不同系使一种杂种与携带所有保持的所需之基因的系杂交,产生携带不同的选择的APS(它们可以具有不同的用途)的不同杂种是可能的。产生携带多种基因的植物系的替换方法包括用APS基因或多个APS基因再转化存在的已转化的系(和用不同标记选择),也可以用携带多个APS基因(各个都在合适的调节控制(即启动子,终止子等)下)的单个转化载体。假定易于进行DNA构建,操作克隆载体以携带多个APS基因是优选的方法。
在植物繁殖材料(果实、块茎、谷粒、种子)特别是种子作为市售产品销售之前,习惯上用保护剂包覆处理,所说的保护剂包括除草剂、杀虫剂、杀真菌剂、杀细菌剂、杀线虫剂、灭螺剂或这些化合物的几种的混合物。如果需要,将这些化合物与本领域配方中常用的载体、表面活性剂或应用增效佐剂配制在一起,提供针对细菌、真菌或动物害虫引起的损害的保护作用。
为了处理种子,可以通过用液体制剂浸泡块茎或谷粒或者用组合的湿或干制剂包覆它们进行种子的包覆处理。在特殊情况下,其它应用于植物的方法例如在芽和果实上直接处理是可能的。按照本发明的种子包含编码产生抗病原体物质的DNA序列,可以用种子保护剂包覆处理,所述的保护剂包括种子处理化合物,例如克菌丹、萎锈灵、福美双(TMTD)、methalaxyl(Apron)、甲基基虫螨磷(Actellic)和常用于种子处理的其它一些。因此,本发明的另一个目的是提供编码产生抗病原体物质的植物繁殖材料(特别是种子),该材料用常用于种子处理的保护剂包覆。
在异源宿主中产生抗病原体物质本发明也提供了获得APS的方法。这些APS可以有效地抑制微生物特别是植物病原体微生物的生长。所说的APS可以从其中APS基因已超量表达的生物体大量产生。合适的这类生物体包括革兰氏阴性菌、革兰氏阳性菌、酵母和植物。为APS产生目的,选择宿主生物体的主要标准是容易操作、快速生长(在微生物时经发酵)和缺乏对超量产生的APS的敏感性。在本发明优选的实施方案中,在一种宿主中合成增加量的抗病原体物质所说的抗病原体物质在所说宿主中天然产生,该宿主用共同编码合成所说抗病原体物质所需的完整的一套多肽的一个或多个DNA分子转化过。这些APS产生方法具有超过常用于制备APS(如抗生素)的化学合成技术的的明显优点。这些优点是便宜的产生价格和能够合成较高生物学活性的对映体化合物,而不是有机合成中不可避免地产生的外消旋混合物。对具有许多手性活性碳原子的分子来说,产生立体化学上合适的化合物特别重要。异源宿主产生的PAS可以用于医学(即控制病原体和/或感染性疾病)和农业用途中。
抗病原体组合物配方本发明还包括抗真菌组合物制剂,其中活性成分是由本发明的重组生物防治生物体产生的抗生素物质或者是微生物的悬液或浓缩物。活性成分与本文描述的一种或多种化合物或化合物组均匀混合。本发明也涉及保护植物使其抵抗植物病原体侵害的方法,该方法包括以抑制所说植物病原体有效的量向植物施用活性成分或含有活性成分的抗真菌组合物。
本发明的活性成分通常以组合物的形式施用,可以用于作物区域或待处理的植物上,与其它化合物同时或先后施用。这些化合物可以是肥料或微量营养物供体或影响植物生长的其它制剂。它们也可以是选择的除草剂、杀虫剂、杀真菌剂、杀细菌剂、杀线虫剂、灭螺剂或几种这些制剂的混合物,如果需要,将这些化合物与本领域配方中常用的载体、表面活性剂或应用增效佐剂配制在一起。合适的载体和佐剂可以是固体或液体并相应于配方技术中通常采用的物质,例如天然的或再生的矿物质、溶剂、分散剂、润湿剂、增稠剂、赋形剂或肥料。
施用本发明的活性成分或包含至少一种活性成分的农业化学组合物的优选的方法是叶面施用。施用量和施用比率取决于被相应植物病原体(真菌型)感染的程度。然而,活性成分也可以由用液体组合物灌输植物所在地或者向土壤施用固体形式(如颗粒形式)的化合物经土壤通过根渗透植物(系统作用)。也可以通过用包含活性成分的液体制剂浸泡种子和用固体制剂包覆种子将活性成分施用于种子。在特殊情况下,其它类型的施用也是可能的,例如选择性处理植物茎或芽。所说的活性成分以未修饰的形式施用,或者优选的与本领域配方中常用的佐剂一起,以已知的方法配制成可乳化的浓缩物、可包覆的膏状物、可直接喷雾或可稀释的溶液、稀释乳剂、可湿性粉剂、可溶性粉剂、粉末、颗粒或者例如聚合物中的浓缩物的形式施用。依据组合物的性质,根据预期的目标和存在的环境选择施用方法,例如喷射、喷雾、喷粉、散布和灌注。有利的施用比率通常每公顷50-5公斤活性成分(a.i.),优选的是100g-5kg a.i./ha,最优选的是200g-500ga.i./ha。
用已知的方法制备所说的包含活性成分的配方、组合物或制剂以及需要时的固体和液体佐剂,例如通过将活性成分与添加物(如溶剂、固体载体和需要时的表面活性化合物(表面活性剂))一起均匀混合和/或研磨。
合适的溶剂包括芳香族碳氢化合物(优选所组份具有8-12个碳原子,例如二甲苯混合物或取代萘、邻苯二甲酸酯(如二丁基邻苯二甲酸酯或二辛基邻苯二甲酸酯)、脂肪碳氢化合物(例如环己烷和烷属烃)、醇和二醇以及它们的醚和酯(如乙醇、乙二醇单甲基或单乙基醚)、酮(如环己酮)、强极性溶剂(如N-甲基-2-吡咯烷酮、二甲亚砜或二甲基甲酰胺)以及环氧化植物油(如环氧化椰子油或豆油)或水。
用于例如粉末和可分散粉剂的固体载体通常是天然的矿物填料,如,方解石、滑石、陶土、蒙脱石或attapulgit。为了改善物理性质,加入高分散硅酸和高分散吸收聚合物也是可能的。合适的颗粒吸附载体是多孔型的例如,浮石、碎砖、海泡石或膨润土;合适的非吸附载体是象方解石或砂子之类的材料。此外,可以使用许多无机或有机预制颗粒材料,例如特别是大理石或粉碎的植物残渣。根据配方中使用的活性成分的性质,合适的表面活性化合物可以是具有良好的乳化、分散和润湿性质的非离子的阳离子的和/或阴离子的表面活性剂。术语“表面活性剂”应理解为包括表面活性剂的混合物。
合适的阴离子表面活性剂可以是水溶性的肥皂和水溶性的合成表面活性化合物两者。
合适的肥皂是高级脂肪酸(10-22个碳原子的链)的碱金属盐、碱土金属盐或未取代的或取代的铵盐,例如油酸或硬脂酸或者天然脂肪酸混合物(可从例如椰子油或牛脂油获得)的钠或钾盐。也可以使用甲基硫磺酸盐。
然而,更常见地是使用所谓的合成表面活性剂,特别是脂肪磺酸盐、脂肪硫酸盐、磺化的苯并咪唑衍生物或烷芳基磺酸盐。
脂肪磺酸盐和硫酸盐通常是碱金属盐、碱土金属盐或未取代的或取代的铵盐形式,具有8-22个碳原子的烷基基团(包括烷基基团的烷基部分),例如,木纤维质磺酸、十二烷基硫酸的钠或钙盐,或从天然脂肪酸获得的脂肪醇硫酸酯的混合物。这些化合物也包括脂肪醇/乙烯氧化物加合物的硫酸酯和磺酸的盐。优选的磺化的苯并咪唑衍生物含有两个磺酸基和含8-22个碳原子的脂肪酸基。烷芳基磺酸盐的例子是十二烷基苯磺酸、二丁基萘磺酸、或萘磺酸/甲醛缩合产物的钠、钙或三乙醇胺盐。相应的磷酸盐也是合适的,例如,p-壬基酚与4-14mol乙烯氧化物加合物的磷酸脂的盐。
非离子表面活性剂优选的是脂肪族或脂环族醇,或饱和的或不饱和的脂肪酸和烷基酚的聚二醇衍生物。所说的衍生物在(脂肪族)碳氢化合物部分含有3-39个二醇醚基团和8-20个碳原子,在烷基酚烷基部分含有6-18个碳原子。
其它合适的非离子表面活性剂是聚乙烯氧化物与聚丙二醇、乙烯二胺丙二醇和烷基丙二醇(在烷基链中含有1-10个碳原子)的水溶性加合物,这些加合物含有20-250个乙二醇醚基团和10-100个丙二醇醚基团。这些化合物通常含有1-5个乙二醇单位/1个丙二醇单位。
非离子表面活性剂的代表性例子是壬基酚聚乙氧基乙醇、蓖麻油聚二醇醚、聚丙烯/聚乙烯氧化物加合物、三丁基酚氧基聚乙氧基乙醇、聚乙二醇和辛基酚氧基聚乙氧基乙醇。聚氧乙烯山梨聚糖的脂肪酸酯和聚氧乙烯山梨聚糖三油酸酯也是合适的非离子表面活性剂。
阳离子表面活性剂优选的是季铵盐,该盐具有(作为N-取代基的)至少一个C8-C22烷基和(作为其它取代基的)低级的未取代的或卤化的烷基。苯基或低级羟烷基。卤化物、甲基硫酸盐或乙基硫酸盐形式的盐是优选的,例如,氯化硬脂基三甲铵或溴化苯基二(2-氯乙基)乙铵。
在例如“McCutcheon’s洗涤剂及乳化剂年鉴”,MC出版公司,新泽西,1979,和Sisely和Wood,“表面活性剂百科全书,化学出版公司,纽约,1980中描述了本领域配方中常用的表面活性剂。
农业化学组合物通常包含约0.1-约99%,优选地约0.1-约95%,最优选地约3-约90%的活性成分;约1-约99.9%,优选地约1-约99%,最优选地约5-约95%的固体或液体佐剂;约0-约25%,优选地约0.1-约25%,最优选地约0.1-约20%的表面活性剂。
而市售产品优选地配制成浓缩物,最终的使用者通常使用稀释配方。
实施例下列实施例用来进一步描述本发明和实施本发明的方法,无意于用它们来限制本发明,仅作为如何实施本发明的指导。
A.产生抗病原体物质之微生物的鉴别可以从许多来源分离微生物,据它们体外抑制真菌或细菌生长的能力进行筛选。典型地是将微生物稀释,并平板接种到培养基上,该培养基上已引入了真菌孢子或菌丝体片段或者细菌。因此,在新分离细菌菌落周围的透明带指示抗病原体活性。
实施例1从土壤分离具有抗丝核菌属性质的微生物将1克土壤(约含有106-108个细菌)悬浮在10毫升无菌水中。充分混合后,使土壤颗粒沉淀。进行合适的稀释,将等分样平板接种到琼脂平板(或其它合适的培养基)上,以获得每板50-100个菌落。经混合使新培养的丝核菌属菌丝体成为片段,在细菌菌落生长至刚刚可见时,将真菌片段悬液喷布到琼脂板上。由进一步平板培养后其周围无真菌的带可以识别具有抗真菌活性的细菌分离物。
通过用培养滤液代替上述平板试验中的活菌落证实这种分离物产生生物活性代谢物。这种生物测定也可以用来监测代谢物的纯化。纯化可以从有机溶剂抽提步骤开始,依据活性成分是抽提到有机相中还是保留在水相中,接着采用不同的色谱步骤。这些色谱步骤是本领域熟知的。最终用光谱学方法测定纯度和化学特性。
B.从微生物克隆抗病原体生物合成基因实施例2从其天然来源鸟枪法克隆抗病原体生物合成基因相关的生物合成基因一般在微生物中相互接近,一个以上的开放读框常常由多个操纵子编码。因此,克隆编码单个生物合成途径中酶的基因的一种方法是从包含所说途径的微生物将基因组片段转移到不含所说途径的微生物中,接着据所说途径赋予的表型筛选。
在编码引起产生抗病原体物质(APS)的酶的生物合成基因的情况下,分离抗病原体物质产生微生物的基因组DNA,用限制性内切核酸酶(如Sau3A)消化,经大小分级分离分离所选择的大小的片段(所选择的大小取决于所用的载体),将所选择的大小的片段克隆经载体(例如粘粒载体的BamHI位点),用于转移进大肠杆菌。然后,筛选所形成的大肠杆菌克隆,筛选出产生抗病原体物质的那些。这种筛选可以基于直接检测抗病原体物质,例如生物化学测定。
另外,这种筛选也可以基于与抗病原体物质相关的对靶标病原体的毒副作用。在这些筛选中,依据其杀灭或延缓靶标病原体生长的能力选择产生抗病原体物质的克隆。这种抑制活性形成了本领域熟知的标准筛选试验的基础,例如,根据在加有靶标病原体(例如在靶标病原体是真菌时为孢子,在靶标病原体是细菌时为细胞)的细菌平板上产生透明带的能力筛选。可以用适于特定的抗病原体物质的标准的化学和生物学技术进一步分析据其抗病原体活性选择的克隆,以证实抗病原体物质的存在。
按以下所述进一步确定编码抗病原体物质生物合成酶的基因的特征和鉴别它们。分离阳性识别的大肠杆菌克隆的DNA插入物,进一步消化成较小的片段。然后将较小的片段再克隆进载体和再插入到大肠杆菌中,并接着再试验抗病原体表型。另外,也可以用本领域熟知的技术(例如de Bruijn和Lupski,基因27131-149(1984))对阳性识别克隆进行λ∷Tn5转座子诱变。采用这一方法,大量破裂的转座子插入物被引入到表现出引起APS产生的DNA中,使得能够勾画出对APS产生起决定作用的DNA的准确区域。接着,表现出赋予大肠杆菌抗病原体物质产生能力的最小插入物序列的确定揭示出APS产生所需的开放读框。最终破裂这些开放读框(参见下述)以证实它们在抗病原体物质生物合成中的角色。
在所描述的将本领域已知的合适的克隆载体用于宿主的技术中,各种宿主生物体(如芽孢杆菌)和酵母可以替换大肠杆菌。宿主生物体的选择只有一个限制它不应对抗病原体物质(为此而克隆生物合成基因)敏感。
实施例3用转座子诱变克隆抗病原体物质的生物合成基因在许多已知产生抗病原体物质的微生物中,转座子诱变是用于产生插入突变体的常规技术。其中该技术已成功地用于假单胞菌属中(例如,Lam等人,质粒13200-204(1985))、葡萄球菌属(例如,Pattee,细菌学杂志145479-488(1981))和链霉菌属(例如,Schauer等人,细菌学杂志1735060-5067(1991))。这一技术的主要要求是引入转座子包含质粒到微生物使转座子在其基因组随机位置插入的能力。通过引入转座子携带质粒到大量微生物中产生插入突变体的大文库。可以用合适的标准技术(例如,接合、直接基因转移技术如电穿孔)将质粒引入到微生物中。
一旦以上述方式构建了转座子文库,就测定转座子插入突变体对PAS的产生。作为转座子插入到APS生物合成所需之基因序列中的结果,预期不产生APS的突变体的出现占优势。因此选择这些突变体进一步分析。
然后,用标准技术克隆邻近于转座子插入物的选择突变体的DNA。例如,邻近于转座子插入物的宿主DNA可以作为从选择突变体基因组DNA制得的DNA文库的一部分被克隆。接着用所述转座子作为DNA探针从文库鉴别这一邻近的宿主DNA。另外,如果使用的转座子包含合适的抗生素抗性基因,则可用限制性内切核酸酶(预测其在这一基因序列内或其序列与宿主插入位点之间不切割)消化插入突变体DNA,随后将如此产生的片段克隆进微生物(如,大肠杆菌),该微生物可以用选择的抗生素进行选择。
插入转座子之外的DNA测序揭示出邻近的宿主序列。邻近序列依次可以用作杂交探针用非突变宿主文库再克隆未破裂的宿主DNA。确定如此从非突变体分离的DNA的特征,用于弥补突变体的APS缺陷表型。弥补的DNA可以包含APS生物合成基因或调节全部或部分APS生物合成途径的基因。为了确证分离的序列编码生物合成基因,将其转移进不产生APS和对APS不敏感的异源宿主(例如大肠杆菌)中。通过转移较小的和较小片段的分离的DNA和测序最小的有效片段,可以鉴别APS基因。另外,也可以用本领域熟知的技术(例如de Bruijn和Lupski,基因27131-149(1984))对阳性识别克隆进行λ∷Tn5转座子诱变。采用这一方法,大量破裂的转座子插入物被引入到表现出引起APS产生的DNA中,,使得能够勾画出对APS产生起决定作用的DNA的准确区域。以类似于实施例1描述的方式进行这些较后的步骤。为了避免由于其外源宿主启动子的非功能性引起的克隆基因不被表达的可能性,可以将克隆的基因转移进表达载体,在其中这些基因将融合进已知在异源宿主中起作用的启动子中。在大肠杆菌的情况下,合适表达载体的一个例子是采用tac启动子的pKK223。类似的合适表达载体也存在于其它宿主(例如酵母)中,并且是本领域已知的。一般来说,这种融合易于进行,这是因为微生物中操纵子-型组织和APS生物合成所需生物合成酶在仅需要单个启动子融合的单个转录上被编码。
实施例4用诱变和互补克隆抗病原体生物合成基因一种与以上所述类似的方法涉及非插入诱变技术(例如化学诱变和辐射诱变)与互补作用结合。将APS产生微生物进行非插入诱变,丧失产生APS能力的突变体选择来进一步分析。从母体APS产生菌株制备一个基因文库。一种合适的方法是将20-30kb片段连接进载体如pVK100(Dnauf等人,质粒845-54(1982)),转移进具有tra+质粒pRK2013的大肠杆菌中,其能够经三亲本接合转回到选择的APS阴性突变体(Ditta等人,自然科学学会汇刊,美国777247-7351(1980))。另一种合适的方法是经电穿孔转回到基因文库突变体。在各种情况下,接着就APS的产生进行选择。通过用较小的互补DNA片段再转化APS-阴性突变体进一步确定选择的克隆的特征,以识别最小的成功互补片段,然后将其进行序列分析。与实施例2一样,由这种方法分离的具有可以是生物合成基因或调节全部或部分APS生物合成途径的基因。为了确证分离的序列编码生物合成基因,将其转移进不产生APS和对APS不敏感的异源宿主(例如大肠杆菌)中。以类似于实施例2描述的方式进行这些较后的步骤。
实施例5利用控制生物合成基因表达的调节物克隆抗病原体生物合成基因克隆APS生物合成基因的另一种方法基于使用控制这些生物合成基因表达的调节物。在缺乏调节物或调节物基因已被常规基因破坏技术毁坏的微生物菌株中产生转座子插入突变体文库。所使用的插入物转座子携带无启动子报道基因(如lacZ)。一旦插入物文库被构建,调节物基因的功能性拷贝就被转移到细胞文库(如经接合或电穿孔),并且平板接种的细胞就报道基因的表达被选择。在调节物基因转移之前和之后测定细胞。仅在调节基因存在下表达报道基因的菌落是邻近于被调节物调节之基因启动子的插入物。假定调节物在其APS生物合成基因的调节中是特异性的,则这一方法的基因靶将是APS生物合成基因。然后可以用实施例2中描述的技术克隆这些基因并进一步确定其特征。
实施例6由同源性克隆抗病原体生物合成基因利用其与已知基因的同源性,可以用标准的DNA进行克隆新的抗病原体生物合成基因。制备目标微生物的DNA文库,然后用得自不同生物体APS生物合成基因的放射性标记DNA探查。确定新分离的基因的特征,测序并引入到异源微生物或天然微生物的突变体APS-阴性菌株,以说明其获得的产生APS的能力。
C从假单胞菌属克隆吡咯尼群生物合成基因吡咯尼群是由荧光假单胞菌的各种菌株产生的苯基吡咯(phenylpyrole)化合物。产生吡咯尼群的荧光假单胞菌菌株是抗丝核菌属和腐霉属病原菌有效的生物防治菌株(WO 94/01561)。吡咯尼群的生物合成被假定从色氨酸开始(Chang等人,抗生素34555-566(1981))。
实施例7gafA调节物基因在从假单胞菌属分离吡咯尼群生物合成基因上的用途用以上实施例5中描述的基本原理分离编码吡咯尼群生物防治酶基因簇。这一方法中使用的调节物基因是得自荧光假单胞菌的gafA基因,已知它是假单胞菌属中控制某些生物防治基因的两组份调节系统的一部分。WO 94/01561(其全文一并被本文参考)详细描述了所述的gafA基因。Gaffney等(分子植物-微生物互作7455-463 1994,其全文也一并被本文参考)进一步描述了gafA基因,其中它被称作“ORF5”。gafA基因表现出调节吡咯尼群生物合成、壳多糖酶、明胶酶和氰化物产生。缺乏gafA基因或低水平表达该基因(相应地也低水平表达gafA调节的基因)的菌株适用于这一分离技术。
实施例8分离假单胞菌属吡咯尼群生物合成基因MOCG 134的gafA基因向密切相关的不产生吡咯尼群之荧光假单胞菌野生型菌株的转移导致这些菌株具有产生吡咯尼群的能力(Gaffney等人,MPLI(1994);也参见Hill等人,应用及环境微生物学60 78-85(1994))。这表明这些密切相关的菌株具有吡咯尼群生物合成所需的结构基因,但无gafA基因激活时不能产生该化合物。一种这样的密切相关的菌株MOCG133被用来鉴别吡咯尼群生物合成基因。转座子TnCIB116(Lam,生物控制的新方向控制农业病虫害的新方案,PP 767-778,Alan R.Liss,公司,(1990))用于诱变MOCG133。这一转座子(Tn5衍生物)编码卡拉霉素抗性,并包含靠近一末端的无启动子lacZ报道基因。所述转座子也被用质粒载体pCIB116(其可移动到MOCG133)经接合引入到MOCG133(Lam,生物控制的新方向控制农业病虫害的新方案,PP 767-778,Alan R.Liss,公司。(1990)),但不能在那种生物体中复制。因此大多数(如果不是全部的话)卡拉霉素抗性转接合体是TnCIB116向MOCG133不同位点转座的结果。当转座子整合进染色体活性启动子后时,lacZ报道基因被激活。这种基因激活作用可以通过采用X-gal由肉眼监测,lacZ基因产物裂解时释放出一种可溶性蓝色产物。收集卡拉霉素抗性转接合物,排列到大盘上,然后将其复制性平板接种到大肠杆菌菌株S17-1(Simon等人,生物/技术1784-791(1983))菌苔上,所述菌株已用携带宽宿主范围的复制源、四环素选择基因和gafA基因的质粒转化过。大肠杆菌菌株S17-1包含质粒接合转移的染色体整合的tra基因。由此,插入转座子突变体复制性平板接种到S17-1/gafA大肠杆菌菌苔上导致gafA携带质粒向插入转座子突变体转移,并使其具有在gafA调节物存在下测定的lacZ基因活性(宿主gafA的表达不足以引起lacZ表达,在多拷贝质粒上的gafA的引入更有效)。鉴别仅在gafA存在下具有“蓝色”表型(即lacZ活性)的插入突变体。在这些突变体中,转座子已整合进其表达由gafA调节的基因中。测定这些突变体(引入了gafA)产生氰化物、壳多糖酶和吡咯尼群的能力(如Gaffney等人,1994 MPMI,待出版的描述)---已知是由gafA调节的活性(Gaffney等人,1994 MPMI,待出版)。一种突变体不产生吡咯尼群但的确产生氰化物和壳多糖酶,表明转座子插入到仅涉及吡咯尼群生物合成的基因区。侧翼于转座子一端的DNA序列用以下方法克隆用Xhol消化从选择的插入突变体分离的染色体DNA,将得自这一消化的片段连接进pSP72(Promega,cat.#P2191)的XhoI位点,在卡拉霉素上选择用这一产物转化的大肠杆菌。在转座子内的唯一的Xhol位点在卡拉霉素抗性基因外断裂,使得得自母体MOCG133菌株的侧翼区在相同的XhoI片段上同时分离。事实上,发现侧翼序列的XhoI位点位于转座子末端约1kb远处。然后,将唯一得自~1kb侧翼序列的克隆的XhoI片段的亚片段用于从菌株MOCG134粘粒文库分离天然(即非破裂的)基因区。粘粒文库从部分Sau3A消化的MOCG134 DNA制备,选择30-40kb大小的片段,克隆进为c2XB衍生物的粘粒载体pCIB119(Bates和Sweft,基因26137-146(1983))和pRK290(Ditta等人,美国自然科学学会汇刊777247-7351(1980))的唯一BamHI位点。pCIB119是双-cos位点粘粒载体,其具有宽宿主范围RK2复制源,因此能够在假单胞菌属以及大肠杆菌中复制。用~1kb侧翼序列为杂交探针从MOCG134粘粒克隆文库分离几个克隆。在这些中,发现一个克隆使转座子插入突变体(已丧失其产生吡咯尼群能力)恢复产生吡咯尼群。这一克隆具有~32kb的插入物,用pCIB169消化。包含粘粒克隆pCIB169的大肠杆菌DH5α的活细胞培养物已于1994年5月20日以保藏号NRRL-21256保藏在农业研究培养物保藏中心(NRRL)(1815N,University Street,Peoria,Illinois 61604美国)。
实施例9pCIB169的作图和Tn5诱变将pCIB169的32kb插入片段亚克隆进大肠杆菌中的pCIB189(包含唯一NotI克隆位点的pBR322的衍生物)中。在32kb内的方便的NotI位点以及NotI位点侧翼的BamHI克隆位点的存在允许14和18kb的片段亚克隆进pCIB189中。这些克隆两者都由限制性消化作图,图1显示了这一结果。使用本领域熟知的技术(例如de Bruijn和Lupski,基因27131-149(1984))进行14和18kb两者的λTn5诱变。赋予卡拉霉素抗性的λTn5噬菌体用于转染以上所述的14和18kb亚克隆两者。以0.1感染复数进行λTn5转染,接着在卡拉霉素上选择。此后制备诱变质粒DNA,再转化进大肠杆菌HB101,用卡拉霉素选择,使得能够分离携带Tn5插入物的质粒克隆。总共30个独立的Tn5插入物沿32kb插入片段长度被作图(参见图2)。经双同源重组将各插入物杂交进MOCG134,用Tn5序列和pCIB189为杂交探针经Southern杂交证实,以说明双同源重组的出现(即野生型MOCG134基因由Tn5-插入基因取代)。对杂交进MOCG134的各插入物进行吡咯尼群测定,鉴别出涉及吡咯尼群产生的约6kb基因区(参见图3和5)。发现这一区位于pCIB169中央,易于以XbaI/NotI片段亚克隆进pBluescript II KS(Promega)。XbaI/NotI亚克隆指定为pPRN5.9X/N(参见图4)。
实施例10克隆基因区的开放读框的鉴别将涉及吡咯尼群产生的基因区亚克隆进6个片段,以在载体pBluescriptII KS中测序(参见图4)。这些片段跨越以上所述的~6kb XbaI/NotI片段,从图4左侧的EcoRI位点延伸至右侧的HindIII位点(参见图4)。用TaqDyeDeoxy末端循环测序试剂盒(由应用生物系统公司,Foster City,CA.供给)按制造者提供的方案测定克隆pPRN1.77E、pPRN1.01 E、pPRN1.24E、pPRN2.18E、pPRN0.8H/N和pPRN2.7H的插入序列。在应用生物系统373A自动DNA测序仪上进行测序反应,用“INHERIT”软件包(也来源于应用生物系统公司)装配和编辑原始DNA序列。获得相应于图3的EcoRI/HindIII片段并与图4中EcoRI位点#2和HindIII位点#2连接的9.7kb毗连的DNA序列。
用来源于遗传计算机集团公司,Madison,WI.的GCG软件包在9.7kb毗连的DNA序列上进行DNA序列分析。模式识别程序“FRAMES”用于研究所有6个DNA序列翻译框中的开放读框(ORF)。用这一程序和原来已出版过(WO94/05793;图5)的gafA基因区OFR2密码子频率表识别出4个开放读框。这些ORF完全位于实施例9提到的~6kb XbaI/NotI片段内(图4),包含在SEQ ID NO1公开的序列内。比较gafA区MOCG134DNA序列与这4个开放读框的密码子频率使用表,很少稀有密码子被使用,表明在这些基因区两者中密码子使用是类似的。这有力地说明这4个开放读框是真实的。在第4读框的3’位发现许多p-不依赖性茎环结构表明转录可以终止的区。因此,很明显,所有4个ORF都是从单个转录物翻译的。从这4个识别的ORF外的区获得的序列数据揭示出第5个开放读框,基于大肠杆菌表达研究接着确定了该读框不涉及吡咯尼群合成。
由于存在符合读框的起始密码子(ATG或GTG)和核糖体结合位点,吡咯尼群基因簇中的各开放读框(OFR)被识别出多个推定的翻译起始位点。用一种互补方法鉴别各基因实际的翻译起始位点。合成PCR引物以扩增推定的核糖体结合位点上游到终止密码子下游的各prn基因区段(表1)。质粒pPRN18Not(1506CIP3,图4)用作PCR反应模板。将PCR产物在载体pRK(KK223-3MCS)中克隆,所述质粒包含pKK223-3(Pharmacia)和pRK290骨架的Ptac启动子和rrs终止子。通过采用大肠杆菌HB101中的辅助质粒pKR290经三亲本交配按实施例12的描述将包含各构建体的质粒转移到各自的MOCG134 ORF缺失突变体中。通过在补充了30mg/l四环素的假单胞菌属基本培养基上平板接种选择转接合体。经质粒DNA抽提、限制性消化和琼脂糖凝胶电泳证实所说质粒的存在和插入的PCR产物的正确取向。如实施例11所述,经抽提和TLC试验测定吡咯尼群的产生。判断各prn基因最短的恢复吡咯尼群产生(即弥补ORF缺失)克隆含有实际的翻译起始位点。因此,鉴别的起始密码子如下ORF1-ATG在核苷酸位置423、ORF2-GTG在核苷酸位置2026、ORF3-ATG在核苷酸位置3166、ORF4-ATG在核苷酸位置4894。用于鉴别开放读框的模式“FRAMES”计算机程序仅识别出ATG起始密码子。用本文描述的互补方法确定了ORF2实际起始于核苷酸位置2039上的GTG密码子,长于由“FRAMES”程序识别的开放读框。
表1用于识别吡咯尼群基因簇中翻译起始位点的DNA构建体和宿主a构建体 扩增片段 推定的起始 终止 扩增片段 宿主 吡咯尼群起始点 密码子b密码子c终止点菌株d产生ORF1-12943572039 2056ORF1D +ORF1-23964232039 2056ORF1D +ORF1-34384772039 2056ORF1D -ORF1-12026 2039 3076 3166ORF2D +ORF1-22145 2162 3076 3166ORF2D -ORF1-32249 2215 3076 3166ORF2D -ORF1-13130 3166 4869 4904ORF3D +ORF1-23207 3235 4869 4904ORF3D -ORF1-33329 3355 4869 4904ORF3D -ORF1-14851 4894 5985 6122ORF4D +ORF1-24967 4990 5985 6122ORF4D -ORF1-35014 5086 5985 6122ORF4D -a所有核苷酸位置编号均参照SEQ ID NO1中给出的吡咯尼群基因簇序列的编号。
b推定的起始密码子的第一个碱基c终止密码子的最后一个碱基d ORF缺失突变体在实施例12中描述实施例11吡咯尼群生物合成基因在大肠杆菌中的表达为了确定吡咯尼群产生仅需要4个基因,将这些基因转移进大肠杆菌,然后测定吡咯尼群的产生。表达载体pKK223-3用于在大肠杆菌中超量表达克隆的操纵子(Brosius和Holy,美国自然科学学会汇刊8l6929(1984))。pKK223-3含有强tac启动子,该启动子在合适的宿主中被lac阻抑物调节,并由向细菌生长培养基中加入异丙基-β-D-硫代半乳糖苷(IPTG)诱导。这一载体由将其它有用的限制性位点添加到存在的多克隆位点中修饰,以利于~6kb XbaI/NotI片段(参见实施例7和图4)和10kb XbaI/KpnI片段的表达研究。在各自情况下,克隆判断都在大肠杆菌tac启动子(由IPTG诱导)下,但被在转录融合物中克隆,以便所使用的核糖体结合位点得自假单胞菌。将各克隆转化进大肠杆菌XL1-蓝宿主细胞,在用薄层层析测定吡咯尼群前,用2.5mMIPTG诱导。在IPTG诱导后,在快速搅拌下于37℃使培养物在10毫升发酵肉汤中生长24小时。回收有机相,真空浓缩,将残渣溶解进20μl甲醇。将10μl抽提物上样到硅胶薄层层析(TLC)板上,以甲苯为流动相展开。使板干燥,喷布van Urk’s试剂显色。Urk’s试剂包含50毫升36%盐酸和50毫升95%乙醇中的1克二甲氨基苯甲醛。在这些条件下,吡咯尼群在TLC板上显示出紫色斑点。这一试验证实了在两种表达构建体中吡咯尼群的存在。HPLC和质谱分析进一步证实了在两种抽提物中存在吡咯尼群。可以直接在再溶于甲醇(在这种情况下样品再溶于55%甲醇中)后用规格为100×2.1mm的Hewlett Packard Hypersil ODS柱(5μM)进行HPLC分析,吡咯尼群在约14分钟后洗脱。
实施例11a在组成型启动子控制下具有吡咯尼群生物合成基因的菌株MOCG134cPrn的构建吡咯尼群生物合成基因的转录被gafA控制。因此,在后对数生长期和稳定生长期之前转录和吡咯尼群产生都达不到高水平。为了在较早生长期中增加吡咯尼群生物合成,用强组成型大肠杆菌tac启动子替换内源启动子。如以上实施例,Prn基因在tac启动子和前终止子序列之间克隆。将所形成的合成操纵子插入到基因组克隆,该克隆已缺失Prn生物合成基因,但具有插入位点上游和下游同源序列。将这一克隆移至菌株MOCG134 prn(一种基因Prn A-D缺失突变体)。经双同源重组Prn基因在组成型tac微电子控制下插入到细菌染色体中。所形成的菌株MOCG134cPrn表现出比野生型菌株产生吡咯尼群更早的能力。
在各种时间点(14、17、20、23和26小时生长)测定野生型菌株MOCG134、菌株MOCG134cPrn和包含携带有PRN基因之质粒的菌株在tac启动子控制下从吡咯尼群产生。用稳定期培养物的1/10,000稀释物接种培养物,用乙酸乙酯抽提吡咯尼群,通过加合由HPLC于212nm测得的吡咯尼群峰区测定吡咯尼群的量。示于表3中的结果明显说明包含tac启动子控制下的Prn基因的菌株产生吡咯尼群比野生型MOCG134菌株早得多。所说新菌株产生吡咯尼群不依赖于gafA,是有用的新生物防治菌株。
表3不同菌株在不同时间点的吡咯尼群产生量生长时间(小时)吡咯尼群产生量(峰面积)MOCG134MOCG134Prn MOCG134pPm1412507100 1830017350014600 2670020960016600 321002317500 18900 310002625000 22500 33500实施例12吡咯尼群基因缺失突变体的构建为了进一步说明吡咯尼群生物合成中涉及4个ORF,产生各ORF不依赖性缺失,经同源重组转回到荧光假单胞菌菌株MOCG134。图4描绘了用于产生缺失的质粒,缺失位置示于图6中。在SEQ ID NO1公开的序列中鉴别了各ORF。
ORF1(SEQ ID NO2)用Mlu1消化质粒pPRN1.77E,产生出78bp ORF1内的片段,回收剩下的4.66kb载体包含片段,用T4 DNA连接酶连接,并转化进大肠杆菌宿主菌株DH5α。用Mlu1使这一新质粒线性化,用DNA聚合酶I克列诺大片段产生平端(Maniatis等人,分子克隆,冷泉港实验室(1992))。经末端连接将pUC4K(Pharmacia)新霉素磷酸转移酶II(NPTII)基因盒连接进质粒,将pBS(ORF1Δ)消化的新构建体转化进DH5α。这一构建体包含ORF1的78bp缺失,在这一位置上,插入了赋予卡拉霉素抗性的NPTII基因。然后从pBluesctipt II KS载体用EcoRI切下这一质粒的插入物(即具有NPTII插入物的ORF1),连接进载体pBR322的EcoRI位点,并转化进大肠杆菌宿主菌株HB101。经限制性酶消化证实新质粒,并指定为pBR322(ORF1Δ)。
ORF2(SEQ ID NO3)用EcoRI和XhoI双消化包含跨越ORF2的毗连EcoRI片段的质粒pPRN1.24E和pPRN1.01E。回收pPRN1.24E的1.09kb片段和pPRN1.01E的0.69kb片段,一起连接进pBR322的EcoRI位点。将所形成的质粒转化进宿主菌株DH5α,用限制性酶消化和电泳证实构建体。然后质粒用XhoI线性化,插入pUC4K的NPTII基因盒,将新构建体(指定为pBR(ORF2Δ))转化进HB101。用限制性酶消化和琼脂糖凝胶电泳证实构建体,该构建体包含在472bp ORF2基因缺失内的NPTII。
ORF3(SEQ ID NO4)用PstI消化质粒pPRN2.56Sph,产生出350bp片段,回收剩下的2.22kb载体包含片段,将pUC4K的NPTII基因盒连接进PstI位点。将这一中间质粒((指定为pUC(ORF3Δ)))转化进DH5α并用限制性酶消化和琼脂糖凝胶电泳证实。用SphI从pUC切下基因缺失构建体,连接进pBR322的SphI位点。用限制性酶消化和琼脂糖凝胶电泳证实新质粒(指定为pBR(ORF5Δ)),该质粒包含在350bp ORF3基因缺失内的NPTII基因。
ORF4(SEQ ID NO5)用AatII消化质粒pPRN2.18E/N,产生出156bp片段,回收剩下的2.0kb载体包含片段,连接并转化进DH5α,用限制性酶消化和电泳证实。用AatII使这一新质粒线性化,用T4 DNA聚合酶产生平端。经平端连接将NPTII基因盒连接进质粒,将这一新构建体((指定为pBS(ORF4Δ)))转化进DH5α。从pBluesctipt II KS载体用EcoRI切下插入物,连接进载体pBR322的EcoRI位点,并转化进大肠杆菌宿主菌株HB101。用限制性酶消化和琼脂糖凝胶电泳证实新质粒(指定为pBR(ORF4Δ)),该质粒包含在264 bp ORF3基因缺失内的NPTII基因。
KmR控制为了控制卡拉霉素抗性标记可能的作用,将pUC4K的NPTII基因盒插入吡咯尼群基因区上游。用PstI使质粒pPRN2.5S(pPRN7.2E的亚克隆)线性化,将NPTII基因盒连接进PstI位点。将这一中间质粒转化进DH5α,用限制性酶消化和琼脂糖凝胶电泳证实。用SphI从pUC切下基因插入构建体,连接进pBR322的SphI位点。用限制性酶消化和琼脂糖凝胶电泳证实新质粒(指定为pBR(2.5 SphI KmR)),该质粒包含插入吡咯尼群基因区上游的NPTII区。
采用大肠杆菌HB101中的辅助质粒pKR2013经三亲本交配将各基因缺失构建体转移进MOCG134中。通过在补充了50μg/ml卡拉霉素的假单胞菌属基本培养基上平板接种选择基因取代突变体并且在补充有30μg/ml四环素的PMM上反选择。经用pPRN18Not,pBR322和从pUC4K(Pharmacia 1994目录 no.27-4958-01)获得的NPTII盒由Southern杂交证实推定的完全取代突变体。通过不杂交到pBR322上,pPRN18Not杂交到合适的大小改变的EcoRI片段上(反映NPTII的缺失和插入),NPTII探针杂交到改变带和相应于缺失片段的带的消失明显证实完全杂交。
证实后,试验缺失突变体对吡咯尼群、2-羟基-5-丙基-间苯二酚、氰化物和壳多糖酶的产生。缺失任一ORF就失去产生吡咯尼群的能力,但不影响其它物质的产生。在KmR控制中NPTII基因盒的存在对吡咯尼群、2-羟基-5-丙基-间苯二酚、氰化物和壳多糖酶的产生没有影响。这些实验说明吡咯尼群产生需要4个PRF的每一个。
实施例12a克隆在植物中表达的编码区ORF1、2、3和4的编码区分别指定为prnA、prnB、prnC和prnD。设计引物从起始密码子到终止密码子或其之外扩增各prn基因编码区(如表2所示)。此外,设计引物以添加限制性位点到编码区末端,在prnB的情况下,将prnB起始密码子GTG改为ATG。质粒pPRN18Not(图4)用作PCR反应的模板。PCR产物克隆进pPEH14用于功能性试验。质粒pPEH14是pRK(KK223-3)的修饰物,含有克隆的PCR产物起始密码子上游11到14个碱基的合成核糖体结合位点。用如以上描述的三亲本交配将构建体转移到各自的ORF缺失突变体中。经质粒DNA抽提、限制性消化和琼脂糖凝胶电泳证实各质粒的存在和插入的PCR产物的正确取向。按实施例11的描述证实互补突变体对吡咯尼群的产生。
在证实各编码区表达功能性蛋白质后(即,说明了ORF缺失突变体恢复产生吡咯尼群的能力),测序克隆并比较吡咯尼群基因簇(1506CIP3)的序列。prnA、prnB和prnC扩增的编码区的序列与原始基因簇序列相同。prnD在核苷酸位5605有一个碱基变化,原始序列中的G改变为扩增编码区中的A。这一碱基变化引起推断的氨基酸序列中甘氨酸改变成丝氨酸,但按照以上描述的互补试验不影响基因产物的功能。
表2prn基因的编码区a编码区扩增片段起始 终止扩增片段起始点密码子密码子终止点prnA423 423 2039 2055prnB2039 2039 3076 3081prnC3166 3166 4869 4075prnD3894 4894 5985 5985a所有核苷酸位置编号均参照SEQ ID NO1中给出的编号b起始密码子的第一个碱基c密码子的最后一个碱基实施例12bprn基因在植物中的表达将以上实施例12a中描述的各prn基因编码区亚克隆进植物表达盒,该盒包含CaMV 35S启动子和前导序列以及侧翼于XbaI限制位点的CaMV35S终止子。包含启动子、编码区和终止子的各构建体用XbaI消化,亚克隆进二元转化载体,然后转化进Agrobacterium tumifaciens宿主菌株A136。按Horsch等人,科学2271229-1231,1985的描述进行烟草转化。按Lloyd等人,科学234464-466,1986的描述进行arabidopsis转化。选择小植株,在含有100mg/l卡拉霉素和500mg/l羧苄青霉素的培养基上再生。
从可疑存在转化的单个植物收获烟草叶组织。从10个独立的可疑存在转化的植物收集arabidopsis叶组织用作转化的基因构建体。经苯酚氯仿抽提纯化RNA,在印迹到尼龙膜上前经甲醛凝胶分级分离。用随机引物标记方法制备探针。按Sambrook等人,分子克隆第2版,冷泉港实验室,1989的描述于42℃下在50%甲酰胺中进行杂交。
对各基因,鉴别出转基因烟草植物,该植物产生RNA带,所述带与合适的prn基因探针强烈杂交,并显示出从相关prn基因转录之mRNA预期的大小。在从Arabidopsis组织收集的样品抽提的RNA中也观察到类似的带。数据说明mRNA编码的吡咯尼群生物合成途径酶在转基因植物中积累。
D.克隆假单胞菌间苯二酚生物合成基因2-己基-5-丙基-间苯二酚是由假单胞菌的某些菌株产生的另一种APS,表现出抗革兰氏阳性菌(特别是棍状杆菌属)、分枝杆菌和真菌的抗病原体活性。
实施例13编码间苯二酚的基因的分离分离到两个转座子插入突变体,它们缺乏产生抗病原体物质2-己基-5-丙基-间苯二酚的能力,所说物质是已知在荧光假单胞菌中gafA基因全局调节下的另一种物质(WO 94/01561)。插入转座子TnCIB116用于在MOCG134和MOCG134 gafA-衍生物(BL1826)中产生突变体文库。就体外抑制真菌的变化筛选前者,就在质粒上引入gafA后gafA调节的基因筛选后者(参见C部分)。选择的突变体用HPLC确定特征,以测定对已知化合物吡咯尼群和2-己基-5-丙基-间苯二酚的产生。HPLC测定使得能够比较新突变体和野生型亲本菌株。在各种情况下,相应于2-己基-5-丙基-间苯二酚的HPLC峰在突变体中消失。得自MOCG134的突变体指定为BL1846。存在BL1826的突变体指定为BL1911。除了在20分钟在柱上使用100%甲醇洗脱间苯二酚外,用与用于吡咯尼群的相同的方法(参见实施例11)进行间苯二酚的HPLC。
可以用以下方式从以上鉴别的突变体克隆间苯二酚生物合成基因。通过选择卡拉霉素抗性克隆(卡拉霉素抗性由转座子编码)获得包含转座子插入物和邻近假单胞菌序列的克隆。将克隆的假单胞菌序列用作探针,鉴别源于荧光假单胞菌MOCG134基因组文库的天然序列。
E.从堆囊菌属克隆soraphen生物合成基因soraphen是由粘细菌纤维堆囊菌产生的聚酮化合物抗生素。这一化合物具有宽的抗真菌活性,这使其在农业用途中有用。具体地说,soraphen具有抗广谱叶面真菌的活性。
实施例14soraphen基因簇的分离从纤维堆囊菌分离基因组DNA,并用Sau3A部分消化。按大小选择30和40kb之间的片段,克隆进粘粒载体pHC79(Hohn和Collins,基因11291-298(1980)),该载体已事先用BamHI消化和用碱性磷酸酯酶处理(以防自连接)。用含有紫红链霉菌菌株Tu22的gral区的4.6kb片段探查如此制备的粘粒文库,所述gral区编码负责紫红链霉菌中榴菌素生物合成从ORF1-4。鉴别杂交到gral探针上的粘粒克隆,经限制性消化和进一步杂交制备用于分析的DNA。鉴别出粘粒p98/1含有与gral区强烈杂交的1.8kb SalI片段,该片段位于p98/1的~40kb插入物中的较大的6.5kb片段内。1.8kbSalI插入物的部分序列测定揭示出与红霉素合成所需的乙酰转移酶的同源性。进行粘粒p98/1的限制性作图,所产生的图绘于图7中。包含粘粒克隆98/1的大肠杆菌HB101的活细胞培养物已于1994年5月20日以保藏号NRRL-21255保藏在农业研究培养物保藏中心(NRRL)(1815N,University Street,Peoria,Illinois 61604美国)。SEQ ID NO6公开了soraphen基因簇的DNA序列。
实施例15soraphen基因簇的功能性分析经基因破坏实验鉴别编码在soraphen生物合成中起作用的蛋白质的p98/1内的基因区。开始时从粘粒p98/1用PvuI限制性消化产生DNA片段,克隆进宽宿主范围质粒pSUP2021(Simon等人,见细菌-植物互作的分子遗传学(ed.A Puhler),Springer Verlag,Berlin PP 98-106(1983))的单一PvuI克隆位点(其在氨苄青霉素抗性基因内)。就对氯霉素有抗性对氨苄青霉素敏感选择转化的大肠杆菌HB101。将选择的携带合适的插入物的集落用出版的申请EP 0501921(Ciba-Geigy)所述的方法经接合转移进纤维堆囊菌。把质粒转移进携带有辅助质粒pUZ8(Hedges和Mathew,质粒2269-278(1979))的大肠杆菌ED8767,基本上按EP 0501921(实施例5)和EP的较后申请(实施例2)所述将供体细胞和来源于稳定期培养物的纤维堆囊菌SJ3细胞一起培养,以便接合转移。在卡拉霉素、腐草霉素和链霉素上选择。已确定没有试验的质粒能够在纤维堆囊菌中自主复制,但是以低频率在一个克隆片段内位点上出现由同源重组产生的全质粒整合进染色体。这些结果可由质粒上的抗生素抗性标记选择。在给定位点的质粒整合导致在这一现象中质粒插入进染色体和这一基因的伴随裂解。因此,可由估计给定的兴趣表型(即,吡咯尼群产生),表型的破坏表明克隆进质粒的DNA区必定在这一表型的测定中起作用。
选择到具有大小约6.5kb(pSN105/7),10kb(pSN120/10),3.8kb(pSN120/43-39)和4.0kb(pSN120-46)的PvuI插入物的重组pSUP2021克隆。图7中所示的这些PvuI插入物的作图位置是pSN105/7-25.0-31.7,pSN120/10-2.5-14.5,pSN120/43-39-16.1-20.0和pSN120-46-20.0-24.0。经用PvuI和SalI消化,pSN105/7表现出含有以上实施例11中提到的1.8kb片段。具有3.8,4.0,6.5和10kb片段的裂解均导致不产生soraphen。这些结果表明所有这些片段都含有在产生这一化合物中起作用的基因或基因片段。
接着用得自粘粒p98/1的两个BglII片段进行基因破坏实验。所说片段的大小为3.2kb(图7中作图位置为32.4-35.6)和2.9kb(图7中作图位置为35.6-38.5)。按照图8把这些片段克隆进源于pSUP2021的质粒pCIB132的BamHI位点。切下pSUP2021的约5kbNotI片段并转化,接着除去约3kbBamHI片段。单用上述方法再引入到堆囊菌属中时,这些BglII片段都不能破坏soraphen产生。这说明这些片段的DNA在soraphen生物合成中不起作用。DNA序列测定表明,存在朝5’但接近32.4位置上的BglII位点的硫代酸酯酶区。此外,紧接着硫代酸酯酶后面有转录终止密码子,其很可能界定ORF1编码区末端。由于2.9和3.2kbBglII片段就在这些序列的右边,因此在ORF1下游很可能没有涉及soraphen生物合成的其它基因。勾画生物合成区左端的轮廓需要分离两个其它粘粒克隆(pJL1和pJL2),其在左端与p98/1重叠但包含更多的p98/1左侧DNA。通过用p98/1顶末端上的1.3kbBamHI片段(作图位置0.0-1.3)杂交进纤维堆囊菌文库分离它们。应当注意,在0.0上的BamHI位点不存在于纤维堆囊菌染色体中,但作为一种人工产物从得自纤维堆囊菌基因组的Sau3A限制片段连接进pHC79 BamHI克隆位点上形成。与1.3kbBamHI片段的Southern杂交说明pJL1和pJL3各包含一个约12.5kb的BamHI片段,该片段含有与1.3kb片段共同的序列,因为这一片段事实上由1.3位置上的BamHI位点所描述。包含粘粒克隆pJL3大肠杆菌HB101的活细胞培养物已于1994年5月20日以保藏号NRRL-21254保藏在农业研究培养物保藏中心(NRRL)(1815N,University Street,Peoria,Illinois 61604美国)。用12.5kbBamHI片段进行的基因破坏实验表明这一片段含有牵涉到soraphen生物合成的序列。用较小的EcoRV片段进行的基因破坏实验表明soraphen生物合成需要这一区。例如,当用于基因破坏实验中时,邻近于12.5kb片段左端远侧BamHI位点的3.4和1.1kb的两个EcoRV片段导致soraphen生物合成的还原。
实施例16soraphen基因簇的序列分析用Taq DyeDeoxy末端循环测序试剂盒(由应用生物系统公司,FosterCity,CA.供给)按制造者提供的方案测定从2.5位上PvuI位点到32.4位上BglII位点(参见图7)的soraphen基因簇的DNA序列。在应用生物系统373A自动DNA测序仪上进行测序反应,用“INHERIT”软件包(也来源于应用生物系统公司)装配和编辑原始DNA序列。模式识别程序“FRAMES”用于研究所有6个DNA序列翻译框中的开放读框(ORF)。总共约30kb毗连DNA被装配,这相应于实施例12描述的破坏实验中确定的为soraphen生物合成关键的区。这一序列编码两个ORF,它们的结构如下述。
ORF1SRF1大小约25.5kb,编码5个与红色糖多孢菌(Donadio等人,科学252675-679(1991))的红霉素生物合成基因中发现的组件有同源性的5个生物合成组件。各组件包含β-酮脂酰合成酶(KS)、酰基转移酶(AT)、酮基还原酶(KR)、酰基载体蛋白(ACP)区以及β-酮加工区,该区可包括脱水酶(DH)和/或烯脂酰还原酶(ER)。在聚酮化合物结构的生物合成中,各组件直接掺合新的两碳延伸单位并修正加工β-酮碳。
ORF2除了ORF1外,得自跨越2.5kb上的PvuI位点到6.2kb上SmaI位点p98/1片段的DNA序列数据说明紧靠ORF1的另一个ORF(ORF2)。该DNA序列说明存在典型的生物合成组件,其显示出在ORF(5’末端还未被测序,离左端有些距离)上被编码。与其它聚酮化合物生物合成基因单位和碳原子数比较,为合成17碳分子soraphen很可能有总共8个组件。因为在以上描述的ORF1中有5个组件,预计ORF2含有其它3个,这些将延伸到粘粒p98/1的左端之外(图7位置0)。这与实施例12的基因描述完全一致。可推测延伸到p98/1的左端之外的粘粒克隆pJL1和pJL3携带编码soraphen生物合成所需其它组件的序列。
实施例17soraphen对甲基化的需要聚酮化合物合成的第一步典型地需要起始单位(通常是乙酸酯)和延伸单位(丙二酸酯)缩合,失去一个碳原子形成二氧化碳,产生三碳链。所有后续添加导致两碳单位加到聚酮化合物环上(Donadio等人,科学252675-679(1991))。因为soraphen具有17碳环,很可能有其合成所需的8个生物合成组件。5个组件在ORF1中编码,6个在ORF2的3’末端。如以上解释的,很可能剩下的两个组件也由ORF2在得自pJL1和pJL3的15kbBamHI片段(还未测定其序列)中的区中被编码。
存在于纤维堆囊菌中模式生物合成器官需要产生化合物soraphen C,它没有抗病原体活性。除了soraphen A中O-甲基在6、7位且环的14位是羟基外,这一化合物的结构与抗病原体的soraphen A相同。这些被特异性甲基转移酶甲基化形成活性化合物soraphenA。类似的情形存在于红色糖多孢菌中的红霉素生物合成中。这一分子的最后步骤是甲基转移酶引起的3个羟基的甲基化(Haydock等人,分子基因遗传学,230120-128(1991))。因此很可能在soraphenA(soraphenC是未甲基化的,soraphenB是部分甲基化的)的生物合成中一种类似的甲基转移酶(或者可能多于一种)起作用。在迄今测试过的所有聚酮化合物生物合成系统中,所有生物合成基因和相关甲基酶都簇集在一起(Summers等人,细菌学杂志1741810-1820(1992))。因此,类似的情形也很可能存在于soraphen操纵子中,编码转化soraphenB和C成soraphenA所需的甲基转移酶的基因位置上接近编码聚酮化合物合成酶的ORF1和ORF2。以上描述的基因破坏实验的结果表明这一基因不在紧靠ORF13’末端的下游,很可能位于包含在pJL1和pJL3中的DNA中的ORF2上游。因此,采用本领域标准技术,可以克隆和测序甲基转移酶基因。
soraphen测定在含有交换树脂XAD-5(Rohm和Haas)(5%w/v)的液体生长培养基中培养纤维堆囊菌细胞。细胞产生的soraphenA加合到树脂上,经聚酯滤器(Sartorius B 420-47-N)过滤收集,于30℃用50毫升异丙醇抽提1小时,从树脂上释放出soraphen。收集含有soraphenA的异丙醇,经干燥浓缩至体积约1毫升。小份这样的样品由HPLC在210nm分析检测和定量soraphenA。这一试验方法是对soraphenA(完全甲基化的)特异性的。部分和非甲基化的soraphen形式具有不同的R,不被这一方法检测出。这一方法用于在基因破坏后试验soraphenA的产生。
F.致金色假单胞菌吩嗪生物合成基因的克隆和特征确定吩嗪抗生素是作为偏离莽草酸途径的次级代谢物由许多假单胞菌和链霉菌的种产生的。已假设两个分支酸分子沿来源于谷氨酰胺的两个氮缩合形成三环吩嗪途径前体吩嗪-1,6-二羧酸酯。然而,也有遗传证据说明邻氨基苯甲酸酯是分支酸酯和吩嗪-1,6-二羧酸酯之间的媒介物(Essar等人,细菌学杂志172853-866(1990))。在致金色假单胞菌30-84中,产生三种吩嗪抗生素(吩嗪-1-羧酸、2-羟基吩嗪-1-羧酸和2-羟基吩嗪)是作用的主要方式,菌株通过这一方式保护小麦使其抵抗真菌病原体禾顶囊壳tritici变种侵害(Pierson和Thomashow,MPMI 5330-339(1992))。同样,在荧光假单胞菌2-79中,吩嗪产生是防治禾顶囊壳tritici变种的主要因素(Thomashow和Weller,等人,细菌学杂志,1703499-3508(1988))。
实施例18分离PS生物合成基因Pierson和Thomashow(同上)以前已描述了在致金色假单胞菌菌株30-84转座子插入突变体上克隆赋予吩嗪生物合成表型的粘粒的方法,所述菌株合成吩嗪抗生素的能力被破坏。经与大肠杆菌S17-1(pSUP1021)接合制备菌株30-84的突变体文库,选择不能产生吩嗪抗生素的突变体。所选择的突变体不能产生吩嗪羧酸、2-羟基吩嗪和2-羟基吩嗪羧酸。用菌株30-84的粘粒基因组文库转化这些突变体,使得分离粘粒pLSP259,该粘粒具有由合成吩嗪羧酸、2-羟基吩嗪和2-羟基吩嗪羧酸弥补吩嗪突变体的能力。用Bruijn和Lupski(基因27131-149(1984))描述的λ∷Tn5转座子诱变进一步确定pLSP259的特征。由此,鉴别出约2.8kbDNA区段决定着吩嗪互补表型;这一2.8kb区段位于pLSP259的较大9.2kbEcoRl片段内。在lacZ启动子的控制下,将9.2kbEcoRI片段和其各种缺失衍生物转移进大肠杆菌,测定大肠杆菌对吩嗪的产生。发现赋予大肠杆菌所有三种吩嗪化合物生物合成能力的最短的缺失衍生物含有约6kb的插入物,指定为pLSP18-6H3del3。这一质粒含有以前鉴别为在宿主30-84菌株中生物合成吩嗪的关键的2.8kb区段,由Dr LS Pierson(植物病理学研究室,U Arzona,Tucson,Az)提供序列特征。前体缺失衍生物能够使大肠杆菌产生吩嗪羧酸,不能伴随产生2-羟基吩嗪和2-羟基吩嗪羧酸,说明至少两个基因可能涉及到吩嗪和其羟基衍生物的合成。
SEQ ID NO17中公开了包含吩嗪生物合成基因的DNA序列。质粒pCIB3350包含吩嗪基因簇的PstI-HindIII片段,并于1994年5月20日以保藏号NRRL-21257保藏在农业研究培养物保藏中心(NRRL)(1815N,University Street,Peoria,Illinois 61604美国)。质粒pCIB3351包含吩嗪基因簇的PstI-HindIII片段,并于1994年5月20日以保藏号NRRL-21258保藏在农业研究培养物保藏中心(NRRL)(1815N,University Street,Peoria,Illinois 61604美国)。pCIB3350与pCIB3351一起包含SEQ ID NO17的完整的吩嗪基因。pLSP18-6H3del3插入物的DNA序列的测定揭示出在关键的2.8kb区段内和其邻近处存在4个ORF。ORF1(SEQ ID NO18)指定为phz1、ORF2(SEQ ID NO19)指定为phz2、ORF3(SEQ ID NO20)指定为phz3和ORF4(SEQ ID NO22)指定为phz4。phz4的DNA序列示于SEQ ID NO21中。phz1大小约1.35kb,在5’末端具有与编码isochorismatase的大肠杆菌entB基因的同源性。phz2大小约1.15kb,在3’末端具有与编码邻氨基苯甲酸合成酶β亚单位的trpG基因的某些同源性。phz3大小约0.85kb。phz4大小约0.65kb,同源于编码吡哆胺5’-磷酸脂氧化酶的大肠杆菌pdxH基因。
吩嗪测定Thomashow等(应用环境微生物学56908-912(1990))描述了分离吩嗪的方法。该方法包括用盐酸酸化培养物至pH2.0,并用苯抽提。苯组份用硫酸钠脱水,蒸发至干。残渣再溶于5%碳酸氢钠水溶液中,用等体积的苯再抽提,酸化,分配到苯中,并再干燥。在按Thomashow等(同上)的描述由反向HPLC分级分离后测定吩嗪的浓度。
G.克隆肽抗病原体基因这组物质有差异,可以分成两组(1)无核糖体器官参与的经酶系统合成的那些,(2)需要核糖体介导mRNA翻译以提供该抗生素前体的那些。
不经核糖体合成的肽抗生素不经核糖体合成的肽抗生素是由激活、修饰、聚合和在某些情况下环化亚单位氨基酸形成肽链的大的多功能酶装配而成的。也掺合进了其它酸(Katz和Demain,细菌学评述41259-289(1987)),所说的酸例如氨基己二酸、二氨基丁酸、二氨基丙酸、二羟氨基酸、异丝氨酸、二羟苯甲酸、羟基异戊酸、(4R)-4-[(E)-2-丁烯基-4,N-二甲基-L-苏氨酸和鸟氨酸。产物不由mRNA编码,核糖体不直接参与合成。按照其总的结构,不经核糖体合成的肽抗生素依次可分成线性的、环状的、内酯、支链环肽和depsipeptide类别(Klernkauf和yon Dohren,欧洲生物化学杂志1921-15(1990))。抗生素的这些不同类别是由修饰和环化酶的作用产生的。基本的聚合组合对它们所有的都是常见的。不经核糖体合成的肽抗生素是由细菌和真菌两者产生的,包括得自短芽孢杆菌的伊短菌素、线性短杆菌肽、短杆菌酪肽和短杆菌肽S;得自枯草芽孢杆菌的霉菌杆菌素;得自多粘霉芽孢杆菌的多粘菌素;得自灰色链霉菌的宜他霉素;得自多剌链霉菌的刺霉素;得自节棒链霉菌的放线菌素;得自大肠埃希氏杆菌的enterochelin;得自构巢曲霉的γ-(α-L-氨基己二酰)-L-半胱氨酸-D-缬氨酸(ACV);得自绿色木霉的alamethicine;得自Metarhizium anisolpliae的腐败菌素;得自尖孢镰孢的恩镰孢菌素;得自蚕白僵菌的beauvericin。在原核和真核系统之间存在广泛的功能和结构类似性,表明两者的共同来源。肽抗生素的活性类似地广泛,不同肽抗生素在动物、植物和真菌中的毒性作用是已知的(Hansen微生物年鉴47535-564(1983);Katz和Demain,细菌学评述41449-474(1977);Kleinkauf和von Dohren,微生物年鉴41259-289(1987);Kleinkauf和von Dohren,欧洲生物化学杂志1921-15(1990);Kolter和Moreno,微生物年鉴46141-163(1992))。
氨基酸由ATP水解活化形成腺苷酸化氨基或羟基酸,类似于由氨酰基-tRNA合成酶进行的荷电反应,然后在氨基酸和酶之间(在特异性半胱氨酸残基或泛酰巯基乙胺提供的硫醇上)形成共价硫代酸酯。ATP的氨基酸依赖性水解常常用于测定肽抗生素酶复合物(Ishihara,等人,细菌学杂志,1711705-1711(1989))。一旦结合到酶上,激活的氨基酸就可以在掺合进多肽中之前被修饰。最普通的修饰是L-氨基酸向D-型的差向异构化、N-酰基化、环化和N-甲基化。由泛酰巯基乙胺辅因子参与发生聚合,使得激活的亚单位接着添加到多肽链上。在测定产物所属的结构类别中,肽从酶复合物释放的机制很重要。水解或硫代酸酯的游离胺的氨解产生(为修饰的或末端氨化的)肽(例如伊短菌素);硫代酸酯被肽本身的氨基氨解给出环状(末端胺进攻)(例如短杆菌肽S)或支链(侧链胺进攻)(例如杆菌肽)肽。末端或侧链羟基的内酯化作用给出内酯(例如,腐败菌素)、支链内酯或cyclodepsipeptide(例如beauvericin)。
进行这些反应的酶是大的多功能蛋白质,具有随其所起的作用而变化的分子量。例如,短杆菌肽合成酶1和2分别为120和280kDa;ACV合成酶是230kDa;恩镰孢菌素合成酶为250kDa;杆菌肽合成酶1,2,3分别是350,240和380(Katz和Demain,细菌学评述41449-474(1977);Kleindauf和yon Dohren,细菌学年鉴41259-289(1987);Kleindauf和von Dohren,欧洲生物化学杂志1921-15(1990))。这些蛋白质的大小和复杂性意味着相对很少的基因必须被克隆,以便能够被转移进行完整的非核糖体合成肽。另外,细菌和真核生物合成系统之间的结构和功能类似性表明肽抗生素的任何来源的基因都可用可获得的序列信息、当前的功能信息和常规的微生物学方法克隆。考虑到农业害虫的抗性,在植物中杀真菌、杀虫或杀细菌肽抗生素预期会出现优点。
实施例19克隆短杆菌肽S生物合成基因短杆菌肽S是一种环状抗生素肽,已表现出抑制真菌孢子萌芽(Murray,等人,应用微生物学通讯35-7(1986)),并由此可用于保护植物抵抗真菌性病害。已克隆和测序短芽孢杆菌ATCC 9999的短杆菌肽S生物合成操纵子(grs),包括短杆菌肽合成酶1的完整的编码序列(GS1,grsA)、在操纵子上的未知功能的另一个基因(grsT)和GS2(grsB)(Kratzschmar,等人,细菌学杂志1715422-5429(1989);Krause等人,细菌学杂志1621120-1125(1985))。用本领域熟知的方法,从出版的DNA序列设计PCR引物对,所述引物对适于以分离的短杆菌ATCC 9999 DNA为模板扩增grs操纵子的约500碱基对的区段。被扩增的片段是(1)在grsB编码区3’末端,跨越终止密码子;(2)在grsB编码区5’末端,包括起始密码子;(3)在grsA编码区3’末端,包括终止密码子;(4)在grsA编码区5’末端,包括起始密码子;(5)在grsT编码区3’末端,包括终止密码子;(6)在grsT编码区5’末端,包括起始密码子。扩增的片段是用本领域公知的方法放射性或非放射性标记的,用于筛选构建在载体(例如λEMBL3)中的短杆菌ATCC 9999 DNA的基因组文库。6个扩增片段成对使用,以分离基因组DNA的克隆片段,该片段包含3个生物合成基因的完整的编码序列。杂交到探针1和2上的克隆包含完整的grsB基因;杂交到探针3和4上的克隆包含完整的grsA基因;杂交到探针5和6上的克隆包含完整的grsT基因;将克隆的grsA引入到大肠杆菌,用本领域的方法经裂解制备抽提物,在用凝胶过滤色谱除去小于120kDa的蛋白质后,经测定苯丙氨酸依赖性ATP-Ppi交换()试验其活性。通过测定转化的细菌的凝胶过滤抽提物的脯氨酸、缬氨酸、鸟氨酸和亮氨酸经测定苯丙氨酸依赖性ATP-Ppi交换类似地试验grsB。
实施例20克隆青霉素生物合成基因产黄青霉基因组DNA的38kb片段使通常不产生青霉素的真菌(黑曲霉和粗糙脉孢菌)具有合成青霉素的能力(Smith等人,生物/技术839-41(1990))。决定δ-(L-α-氨基己二酰)-L-半胱氨酰-D-缬氨酸合成酶、异青霉素N合成酶和异青霉素N酰基转移酶的基因已单个地从产黄青霉和构巢曲霉克隆,它们的序列也已被测定(Ramon,等人,基因57171-181(1987);Smith等人,欧洲分子生物学组织杂志92743-2750(1990);Tobin等人,细菌杂志1725908-5914(1990))。按照以上描述的基于PCR的方法完成这些基因的克隆,以获得约500碱基对的探针,其来源于产黄青霉(例如菌株AS-P-78,抗生素,S.A.,Leon,西班牙)或构巢曲霉(例如菌株G69)基因组DNA。其整体性的功能可以通过转化以上列出的不产生的真菌和以上所述测定抗生素的产生和各自的酶活性(Smith等人,生物/技术839-41(1990))来考查。
实施例21克隆杆菌肽A生物合成基因杆菌肽A是一种环状肽抗生素,具有增强对细菌植物病原体病害抗性的潜能。它由地衣芽孢杆菌ATCC 10716产生,其合成需要三种多功能酶杆菌肽合成酶(BA)1、2和3。BA1、BA2和BA3的分子量分别为335kDa、240kDa和380kDa。编码BA2蛋白质和BA3蛋白质一部分的地衣芽孢杆菌DNA的32kb片段说明至少这两个基因是相连的(Ishihara,等人,细菌学杂志1711705-1711(1989))。短杆菌肽S、青霉素和surfactin生物合成操纵子的证据说明途径中的第一种蛋白质BA1由相对靠近BA2和BA3的一个基因编码。BA3是用公开的方法纯化的,用于在兔中增加抗体(Ishihara,等人,同上)。将地衣芽孢杆菌DNA的基因组文库转化进大肠杆菌,用本领域公知的方法测定表达与BA3相关的抗原决定簇的克隆。由于BA1、BA2和BA3是抗原相关的,检测方法将适用于编码三种酶某一种的克隆。通过试验大肠杆菌抽提物的合适的氨基酸依赖性ATP-Ppi交换证实各克隆。编码BA1的克隆表现出亮氨酸、谷氨酸和异亮氨酸依赖性交换,编码BA2的克隆表现出赖氨酸和鸟氨酸依赖性交换,编码BA3的克隆表现出异亮氨酸、苯丙氨酸、组氨酸、天冬氨酸和天冬酰胺依赖性交换。如果用这种方法获得一种或两种基因,则用本领域已知的方法“步行(walking)”或“染色体步行”技术分离其它基因(Sambrook等人,见分子克隆实验室手册,冷泉港实验室出版社1989)。
实施例22克隆beauvericin和腐败菌素生物合成基因beauvericin是由真菌球孢白僵菌(Klernkauf和von Dohren,欧洲生物化学杂志1921-15(1990))产生的杀虫hexadepsipeptide,它保护植物抵抗昆虫害虫。腐败菌素是由真菌绿僵菌(James,等人,昆虫生理学杂志39797-804(1993))产生的杀虫内酯肽。针对恩镰孢菌素生物合成酶复合物(决定激活氨基酸的N甲基化)的单克隆抗体与beauvericin和腐败菌素的生物合成酶交叉反应,说明它们的结构相关(Klernkauf和von Dohren,欧洲生物化学杂志1921-15(1990))。鹿草镰孢的恩镰孢菌素生物防治酶基因(esyn1)已被克隆和测序(Haese,等人,分子微生物学7905-914(1993)),序列信息用于进行以上描述的beauvericin合成酶和腐败菌素合成酶基因的克隆策略确定。beauvericin合成酶(BE)基因和腐败菌素合成酶(DXS)基因的探针是通过用寡聚体(其序列取自恩镰孢菌素合成酶序列)为引物扩增球孢白僵菌基因组DNA和绿僵菌基因组DNA的特异区产生的。选择两对PCR引物,一对能够引起跨越起始密码子的BE基因区段的扩增,另一对能够引起跨越起始密码子的BE基因区段的扩增。各对导致产生大小约500碱基对的DNA片段。球孢白僵菌和绿僵菌基因组DNA文库用标记的片段和杂交到所选择的两者上的克隆探查。beauvericin合成酶完整的编码序列导致出现合适宿主中苯丙氨酸依赖性ATP-PPi交换,腐败菌素合成酶完整的编码序列导致出现缬氨酸、异亮氨酸和丙氨酸依赖性ATP-PPi交换。也将这些转化的生物体的抽提物分别进行beauvericin和腐败菌素的无细胞生物合成。
实施例23克隆生物合成未知肽抗生素的基因通过使用在编码区内的保守区克隆任何肽抗生素的基因。所有肽抗生素合成酶共同的功能(即氨基酸激活,ATP和pantotheine结合)反映在重复区结构(其中各区跨越约600个氨基酸)。在所述的区中,高度保守的序列是已知的,不考虑其来源,预计相关区存在于任何肽抗生素合成酶基因中。比较了肽合成酶基因的出版的DNA序列并识别了单个的重复区,所述序列包括短杆菌肽合成酶1和2(Hori,等人,生物化学杂志106639-645(1989);Krarse,等人,细菌学杂志1621120-1125(1985);Turgay,等人,分子微生物学6529-546(1992));短杆菌酪肽合成酶1和2(Wedkermann,等人,核酸研究1611841(1988));ACV合成酶(MacCabe,等人,生物化学杂志26612646-12654(1991));恩镰孢菌素合成酶(Haese,等分,分子微生物学7905-914(1993))和surfactin合成酶(Fuma等人,核酸研究2193-97(1993);Grandi,等人,第7届国际孢子会议(1992))。所有合成酶的区作为一组进行比较,识别最高度保守的区。从这些保守序列设计适于杂交到所有观察到的序列变体上的DNA寡聚物,另一种DNA序列(位于例如第一DNA序列0.1-2kb远处)用于设计另一种DNA寡聚物。按照PCR扩增方法,经组合未知基因插入区段与从产生抗生素的生物体制备的基因组DNA,将这些DNA寡聚物引物对用于PCR扩增所述区段。产生的DNA片段经测序证实,自身用作杂交探针,而不是PCR反应的引物,鉴别出枯草杆菌ATCC21332(Borchert等人,FEMS微生物学通讯92175-180(1992))的surfactin合成酶基因的一部分。用“步行”方法获得完整的编码序列。这种“步行”方法也获得所述肽抗生素害虫所需的其它基因,因为已知它们是簇集的。
获得编码新肽抗生素合成酶的基因的另一种方法是经检测在异源宿主中表达的抗原决定簇,所述宿主已用合适的产生抗生素的生物体的DNA基因组文库转化。预期合成酶的共同的结构特征经与针对不同合成酶蛋白质的增加的抗体的交叉反应会找到证据。这种抗体抗肽合成酶(用已知方法从产生抗生素的已知生物体纯化的)是增强的(Ishihara,等人,细菌学杂志1711705-1711(1989))。用本领域已知方法就抗原决定簇的存在试验携带有未知肽抗生素产生者基因组DNA片段的转化的生物体,所述抗原决定簇被抗肽合成酶抗血清识别。回收和测序由抗血清识别的细胞携带的克隆的基因组DNA。将以上描述的“步行”技术用于获得完整的编码序列和其它生物合成基因两者。
另一种获得编码未知肽抗生素合成酶的基因的方法是纯化具有合适的肽合成酶特征的蛋白质并确定其全部或部分氨基酸序列。存在于抗生素中的氨基酸可以通过首先从抗生素产生生物体的氯仿提取物纯化(例如,经C18柱上的乙醇-水混合物中的反向色谱)进行测定。纯化的化合物的组成经质谱、NMR和酸水解产物分析测定。当添加到产生抗生素的生物体的包含肽合成酶的抽提物中时,存在于肽抗生素中的氨基或羟基酸将产生ATP-PPi交换。这一反应用于一种试验方法中在蛋白质纯化方案(如本领域已知的方案)的实施过程中测定肽合成酶的存在。基本上纯化的肽合成酶制剂用于测定其氨基酸序列,可通过完整蛋白质的直接测序获得N末端氨基酸序列,或者通过经特异性蛋白分解酶从完整肽合成酶衍生的肽的产生、纯化和测序,这些是本领域公知的。DNA序列是从合成酶的氨基酸序列推断的,设计可以与这样的编码序列杂交的DNA寡聚体。该寡聚体用于探查从产生抗生素的生物体制备的基因组文库。测序选择的克隆以鉴别它们,用“步行”技术获得肽生物合成所需的完整的编码序列和相关的基因。当供给所需的氨基或羟基酸、ATP和泛酰巯基乙胺时,用完全互补的肽生物合成基因转化的生物体(例如细菌或真菌)从提取物将产生肽抗生素。
在实施例B部分描述了适于克隆合成不经核糖体的肽抗生素所需的基因的其它方法。
经核糖体合成的肽抗生素经核糖体合成的肽抗生素以存在抗生素自身的结构基因为特征,所述基因编码被特定酶修饰产生成熟分子的前体。肽抗生素合成的总的蛋白质合成器官的使用给出了制备更长的聚合物的可能性,尽管这些肽抗生素不必特别长。除了结构基因外,胞外分泌和免疫需要其它基因,人们相信这些基因靠近结构基因,在大多数情况下很可能在相同的操纵子上。在核糖体上制造的两种主要的肽抗生素是稀有氨基酸羊毛硫氨酸的那些和不含这一氨基酸的那些。含羊毛硫氨酸的抗生素(羊毛硫抗生素)由革兰氏阳性菌(包括乳球菌属、葡萄球菌属、链球菌属、芽孢杆菌属、和链霉菌属的种)产生。线性羊毛硫抗生素(例如乳链菌肽、枯草菌素、表皮纤维和gallidermin)和环状羊毛硫抗生素(例如耐久霉素和肉桂霉素)是已知的(Hansen,微生物学年鉴46535-564(1993);Kolter和Mwreno,微生物学年鉴46141-163(1992))。羊毛硫抗生素通常包含其它特征性修饰残基,例如脱氢丙氨酸(DHA)和dehydrobutyrine(DHB),分别得自丝氨酸和苏氨酸的脱水。半胱氨酸的巯基与DHA反应产生羊毛硫氨酸,与DHB反应产生β-甲基羊毛硫氨酸。不含有羊毛硫氨酸的肽抗生素可以包含其它修饰物,或者它们仅由用于肽合成中的普通氨基酸组成。不包含羊毛硫氨酸的肽抗生素由革兰氏阳性菌和革兰氏阴性菌两者(包括乳芽孢杆菌属、乳球菌属、片球菌属、肠球菌属和埃希氏杆菌属)产生。这一类别中的抗生素包括lactacins、lactocins、sakacin A、pediocins、双球菌素、lactococcins和小菌素(Hansen,同上;Kolter和Moreno,同上)。一般来说,从核糖体开始其合成的肽抗生素经过几种类型的翻译后加工(包括蛋白分解酶裂解和氨基酸侧链修饰),并需要存在特定的转运和/或免疫机制。对这些抗生素保护的需要与不经核糖体合成的肽抗生素的缺乏这样的系统完全相反。这可以从考虑许多经核糖体合成的肽抗生素的活性针对窄范围的与产生生物体非常相关的细菌得到合理的解释。在这种情况下,需要辨别产生者和竞争者的特别的方法,否则会丧失优点。作为抗生素,这一性质限制了其在需要宽范围的活性的情形下的用途,但在非常有限范围的活性有利时其吸引力就增加。在已知对任何这类肽抗生素敏感的真核系统中,不清楚经核糖体合成的肽抗生素的产生是否需要一种这样的转运系统,或者是否转运出细胞是将抗生素置于遇见可能的病原体的较好位置的仅有的一件事情。如以下实施例所示,这一问题可以由实验说明。
实施例24克隆羊毛硫抗生素生物合成基因连接到羊毛硫抗生素乳链菌肽、枯草菌素和表皮纤维结构基因上的基因的测定显示出几个具有序列同源性的开放读框,预测的氨基酸说明了所述抗生素成熟和转运所需的功能。枯草芽孢杆菌ATCC 6633的spa基因(包括spaS),即编码枯草菌素前体的结构基因已被测序(Chung和hansen细菌学杂志1746699-6702(1992);Chung,等人,细菌学杂志1741417-1422(1992);Klein,等人,应用及环境微生物学58132-142(1992))。开放读框仅发现在spaS上游至少1-2kb距离内。几个开放读框显示出部分相同的转录单位,spaE、spaD、spaB和spaC,具有推定的spaE启动子上游。编码599个氨基酸的蛋白质的spaB和编码177个氨基酸的蛋白质的spaD具有与转运hemolysin所需的基因(分别编码HylB和HlyD蛋白质)的同源性。编码851个氨基酸的spaE同源于nisB,该基因是连接到乳链菌肽结构基因上的基因,其功能不清楚。spaC编码未知功能的442个氨基酸的蛋白质,但其裂解就不能产生枯草菌素。这些基因包含在一个大小约7kb的基因组DNA区段上(Chung和Hansen细菌学杂志1746699-6702(1992);Chung,等人,细菌学杂志1741417-1422(1992);Klein,等人,应用及环境微生物学58132-142(1992))。还没有完全阐明这些基因赋予产生枯草菌素的能力完全足够。包含表皮纤维结构基因(epiA)的表皮葡萄球菌Tu3298质粒Tu32的13.5kb片段也含有5个开放读框epiA、epiB、epiC、epiD、epiQ和epiP。基因epiBC同源于基因spaBC,而epiQ表现出涉及操纵子的表达,epiP可能编码在原表皮纤维向表皮纤维成熟期间起作用的一种蛋白酶。epiD编码一种结合辅酶黄素类单核苷酸的181个氨基酸的蛋白质,被认为在原表皮纤维的后翻译修饰中起作用(Kupke,等人,细菌学杂志174(1992);Peschel等人,分子生物学931-39(1993);Schnell,等人,欧洲生物化学杂志20457-68(1992))。预期大多数(如果不是全部的话)生物合成羊毛硫抗生素所需的基因是簇集的,物理位置上紧靠在基因组DNA或一个质粒上,使一个定位必需基因靠近在发现和克隆其它基因中是有用的。通过基于从羊毛硫抗生素本身的基本上纯化的制剂测定的氨基酸序列设计寡核苷酸探针克隆羊毛硫抗生素结构基因,这已用得自乳乳球菌亚种lactis CNRZ 481(Piard,等人,生物化学杂志26816361-16368(1993))的羊毛硫抗生素lacticin 481、得自酿脓链球菌FF22(Hynes,等人,应用及环境微生物学591969-1971(1993))的streptoccccin A-FF22和得自唾液链球菌203P(Ross,等人,应用及环境微生物学592014-2021(1993))的salivaricin A进行。克隆和测序包含结构基因的大小约10-20kb的细菌DNA片段,以确定与spa、epi和nis操纵子中特征性基因同源的区。用本领域已知的技术单个克隆与任何这些基因有同源性的或者在相同的转录单位内(因开放读框与任何这些基因有同源性)的开放读框。将包含所有相关读框并无其它的的DNA片段转化进非产生性菌株,例如大肠杆菌,分析产生的羊毛硫抗生素,以说明存在所有所需的基因。
实施例25克隆不含羊毛硫氨酸的经核糖体合成的肽抗生素的生物合成基因羊毛硫抗生素中存在的广泛修饰的缺乏预期降低全合成肽抗生素(由lactacin F、sakacin A、lactococcin A和helveticin J例证)所需基因的数量。在下列生物体中发现了涉及抗生素生物合成的簇集基因在约氏乳杆菌VPI11088中发现了lactacin F的(Fremaux,等人,应用及环境微生物学593906-3915(1993))、在清酒乳杆菌Lb706中发现了sakacin A的(Axelxxon,等人,应用及环境微生物学59;2868-2875(1993))、在乳乳球菌中发现了lactococcin A的(Stoccard,等人,应用及环境微生物学581952-1961(1992))、在乳酸片球菌中发现了pediocin PA-1的(Marugg,等人,应用及环境微生物学582360-2376(1992))。通过首先确定基本上纯化的抗生素制剂的氨基酸序列,然后基于氨基酸序列设计DNA寡聚物,再探查从产生细菌基因组或质粒DNA构建的DNA文库来克隆生物合成新的不含羊毛硫氨酸的肽抗生素所需的基因。克隆和测序包含所述抗生素结构基因的5-10kb DNA片段。用本领域已知的方法单个克隆同源于清酒乳杆菌的sakB或约氏乳杆菌的lafX、ORFY或ORFZ的,或者作为所述抗生素结构基因或同源于以前提到的那些基因的基因的为相同转录单位的一部分的开放读框。将包含所有相关读框并无其它的的DNA片段转化进非产生性菌株,例如大肠杆菌,分析产生的羊毛硫抗生素,以说明存在所有所需的基因。
H.抗生素生物合成基因在微生物宿主中的表达实施例26用典型的发酵技术超量表达APS生物合成基因以超量表达APS为了以比其在天然宿主中可能的量更大的量产生的目的,可以在异源生物体中表达本发明的APS生物合成基因。异源表达的一个合适的宿主是大肠杆菌,大肠杆菌中基因表达的技术是熟知的。例如,克隆的APS基因可以用实施例11描述的表达载体pKK223在大肠杆菌中表达。克隆的基因可以融合进转录融合物,以便使用与异源基因相关的可获得的核糖体结合位点。这一方法有利于表达编码一个以上的开放读框的操纵子,因为单个ORF的翻译依赖于其相关的核糖体结合位点信号。另一种方法是将APS基因融合进载体ATG(例如作为一种NcoI融合物)以利用大肠杆菌核糖体结合位点。对多个ORF(例如,在具有多个ORF的操纵子的情况下)在大肠杆菌中的表达,这种类型的构建体需要不同的启动子融合进各ORF。然而,如果可能,APS操纵子的第一ATG融合进大肠杆菌核糖体结合位点,同时需要其它ORF利用其相关的核糖体结合位点。这些在大肠杆菌中超量表达基因的构建体类型在本领域是熟知的。合适的细菌启动子包括lac启动子、tac(trp/lac)启动子和来源于噬菌体λ的Pλ启动子。合适的市售载体包括例如pKK223-3、pKK233-2、pDR540、pDR720、pYEJ001和pPL-λ(来源于Pharmacia,Piscataway,NJ)。
类似地,革兰氏阳性菌(常见的芽孢杆菌,特别是地衣芽孢杆菌)用于商业规模地产生异源蛋白质,可用来表达APS生物合成基因(例如 Quax等人,见工业微生物基础及应用分子遗传学,编辑Baltz等人,美国微生物学会,华盛顿(1993))。高度表达的芽孢杆菌基因(例如,淀粉酶启动子,Quax等,同上)的调节信号用于产生与APS生物合成基因的转录融合物。
在某些情况下,用酵母系统已获得了细菌基因的高水平表达,例如用甲基营养酵母巴斯德毕赤酵母(Sreekrishna,见工业微生物基础及应用分子遗传学,Baltz,hegeman,和Skatrud eds.,等人,美国微生物学会,华盛顿(1993))。在载体例如pHIL-D1和pHIL-D2(Sreekrishna,同上)中,目的APS基因位于毕赤酵母属醇氧化酶基因5’调节序列的后面。这些载体用于转化毕赤酵母属并且将异源DNA引入到酵母基因组中。同样,酿酒酵母已用于异源细菌基因(例如,Dequin和Barre,生物技术12173-177(1994))。乳酸克鲁维酵母也是异源基因表达的合适的宿主(例如,vanden Berg等人,生物技术8135-139(1990))。
APS基因在生物体(例如,已知为快速生长和繁殖的大肠杆菌、芽孢杆菌和酵母)中的超量表达使得可以经发酵产生较大量的APS。生物体的选择可能限制在生物体对所要超量表达的APS的可能的敏感性上;然而,可能的敏感性可以由J部分描述的方法测定。可以从这些培养物中分离和纯化APS(参见“G”),用于防治微生物,例如真菌和细菌。
I.为生物防治目的在微生物宿主中表达抗生素生物合成基因本发明的可能的APS生物防治基因可以用于增加各种微生物生物防治菌株的效力。一种可能性是将特定APS基因转回到其天然宿主,在较强的转录控制下引起产生较大量的APS。另一种可能性是将基因转移到异源宿主中,引起在异源宿主中产生该宿主通常不产生的APS。
适于异源超量表达APS基因的微生物是所有能够移生植物或根际的微生物。如此,使它们与植物病原真菌接触,导致对病原体的生长抑制。这些微生物包括革兰氏阴性微生物,例如假单胞菌属、肠杆菌属和沙雷氏菌属;革兰氏阳性微生物芽孢杆菌属和链霉菌属;和真菌木霉属和粘帚霉属。特别优选的异源宿主是荧光假单胞菌、恶臭假单胞菌、葱头假单胞菌、致金色假单胞菌、桔黄假单胞菌、阴沟肠杆菌、Serratia marscesens、枯草芽孢杆菌、蜡状芽孢杆菌、绿色木霉、Trichoderma harzianum和绿粘帚藻。
实施例27APS生物合成基因在大肠杆菌和其它革兰氏阴性菌中的表达许多基因已以异源方式在革兰氏阴性菌中表达。实施例11描述了用表达载体pKK223-3(Pharmacia目录#27-4935-01)在大肠杆菌中表达吡咯尼群生物合成基因。这一载体具有被lac阻抑物调节和被IPTG诱导的强tac启动子(Brosius,J.等人,吡咯尼群AS 81)。许多其它表达系统已开发来用于大肠杆菌,某些在实施例14-17中有详细阐述。热诱导表达载体pPL(Pharmacia#27-4946-01)使用一个紧密调节噬菌体λ启动子,使得蛋白质高水平的表达。lac启动子提供了另一种表达方法,但不能以与tac启动子一样高的水平表达。由添加宽宿主范围的复制子到某些表达系统载体中,使抗真菌化合物在密切相关的革兰氏阴性菌(如假单胞菌属、肠杆菌属、沙雷氏菌属和欧文氏菌属)中产生是可能的。例如,pLRKD211(Kaiser和Kroos,吡咯尼群AS 815816-5820(1984))含有宽宿主范围的允许在许多革兰氏阴性菌中复制的复制子oriT。
在大肠杆菌中,tac(即trp-lac)启动子的表达需要IPTG诱导。当这一相同的启动子(例如,在宽宿主范围质粒pLRKD211上)引入到假单胞菌属中时,无IPTG诱导它是组成性活性的。为了表达组成型表达某一基因,这一trp-lac启动子可被置于在假单胞菌属或任何其它密切相关的细菌中表达的任何基因和兴趣复制子前面。如果兴趣操纵子包含生物合成APS的信息,则其它生物防治阴性革兰氏阴性菌菌株可能能够保护植物抵抗各种真菌病害。这样,抗真菌化合物基因可置于强启动子后,转移到细菌中将其变成有效的生物防治菌株,所述细菌通常不产生抗真菌产物,但具有植物或根际移生性。其它可能的启动子可以用于在革兰氏阴性菌中组成型表达APS基因。这些启动子包括例如假单胞菌属调节基因gafA和lemA(WO94/01561)和萨氏假单胞菌IAA操纵子启动子(Gaffney等人,细菌学杂志1725593-5601(1990))。
将实施例11a描述的具有tac启动子的合成Prn操纵子插入到在宽范围的革兰氏阴性菌中复制的宽宿主范围载体中。第一载体pRK290(Ditta等人,吡咯尼群AS 77(12)pp.7347-7351)是低拷贝数的质粒,第二载体pBBR1MCS(Kovach等人,1994,生物技术16(5)800-802)是中等拷贝数的质粒。将包含Prn基因的两种载体的构建体引入到大量革兰氏阴性菌菌株中,用TLC和HPLC测定吡咯尼群的产生。所述革兰氏阴性菌包括大肠杆菌假单胞菌属的种(MOCG133、MOCG380、MOCG382、BL897、BL1889、BL2595)和Enterobacter taylorae(MOCG206)。
实施例28APS生物合成基因在革兰氏阳性菌中的表达编码APS的基因在革兰氏阳性菌中的异源表达是产生新生物防治菌株的另一种方法。芽孢杆菌属和链霉菌属表达系统的特征完全被确定。得自肺炎链球菌的红霉素抗性基因(ermR)的启动子在革兰氏阳性需氧菌和厌氧菌以及大肠杆菌中已表现出活性(Trieu-Cuot等人,核酸研究183360(1989))。硫链丝菌素基因的另一个抗生素抗性启动子已用于链霉菌属克隆载体(Bibb,分子基因遗传学19926-36(1985))。穿梭载体pHT3 101在芽孢杆菌属中表达也是合适的(Lereclus,FEMS微生物通讯60211-218(1989))。通过在ermR或其它启动子的控制下表达操纵子(例如吡咯尼群操纵子)或单个APS基因,将土壤杆菌转变成能够保护植物抵抗微生物病害的菌株是可能的。这种方法的一个明显的优点是许多革兰氏阳性菌产生可用于配方的孢子,由此能生产具有较长存放期的生物防治产品。芽孢杆菌属和链霉菌属的种是土壤侵入性移生者。事实上,两者都产生次级代谢物,包括具有抗宽谱生物体活性的抗生素。异源抗真菌基因(包括编码吡咯尼群、soraphen、吩嗪和环状肽的基因)添加进革兰氏阳性菌可以使这些生物体成为更有效的生物防治菌株。
实施例29APS生物合成基因在真菌中的表达Trichoderma hsrzianum和Glioclacium virens已表现出在田间提供各种水平的生物防治作用(美国6165928和美国4996157,Cornell研究基金会)。这些生物防治生物体的成功的使用将由引入APS基因开发改进的菌株极大地提高。这可以由本领域已知的许多方法完成。一种是经PEG或电穿孔介导技术引起的真菌的原生质体介导转化。另外,粒子弹可用于转化具有发育成再生成熟结构的原生质体或其它真菌细胞。原来开发来用于曲霉属转化的载体pAN7-1现在广泛用于真菌转化(Curragh等人,菌类学研究97(3)313-317(1992);Tooley等人,流行遗传学2155-60(1992);Punt等人,基因56117-124(1987)),经基因工程操作,它含有吡咯尼群操纵子或任何其它APS生物合成基因。这一质粒含有侧翼于构巢曲霉gpd启动子和trpC终止子的大肠杆菌潮霉素B抗性基因(Punt等人,基因56117-124(1987))。
J.抗植物病原体物质的体外抗植物病原体活性实施例30检测抗真菌活性的生物测定方法可以用许多方式测定潜在的抗真菌剂引起的真菌生长抑制作用。常用的目测方法包括琼脂扩散测定(Dhingra和Sinclair,基础植物病理学方法,CRC Press,Boca Raton,FLA(1985)))和液体培养基中的测定(Broekaert等人,FEMS微生物通讯6955-60(1990))。两种类型的测定都用真菌孢子或菌丝体为接种物完成。按标准的真菌学方法保持真菌材料。经用盐水或缓冲液冲洗平板表面从成熟平板收获生测的孢子。通过把得自平板的真菌置于搅拌器中匀化至菌落分散制备菌丝体悬液。用几层粗棉布过滤匀化物,除去较大颗粒。通过离心和用新鲜缓冲液代替上清液洗涤通过粗棉布的悬液。经试验用于生测中的悬液,凭经验调节菌丝体悬液的浓度。
可以通过将孢子或菌丝体片段悬浮到固体试验培养基上,在点上施用抗真菌剂,从该点扩散来完成琼脂扩散测定。可以通过将孢子或菌丝体加到融化的生长培养基上,然后把混合物倒入无菌皿中使其胶凝来进行。把无菌滤纸置于培养基表面,将抗真菌剂溶液加到滤纸上。在液体被滤纸吸收后,使平板在合适的温度下培养(通常是1-2天)。在滤纸周围孢子不发芽或者菌丝体不生长的带的出现指示有生长抑制作用。所述生物防治剂的杀真菌效能(以最低有效剂量表示)可由以下方法定量把系列稀释的生物防治剂加到滤纸上,测定给出可观察的抑制带的最低剂量。另一种琼脂扩散测定可按以下完成在固化的真菌生长培养基上挖孔,将抗真菌剂溶液放入其中。在离所有孔等距离的点上(通常在平板的中央),用小份孢子或菌丝体悬液或者直接从真菌贮存培养平板切下的菌丝体接种平板。将平板培养几天直至生长的菌丝体接近各孔,可观察到生长抑制信号。真菌菌落生长通常的基本的圆形出现变形指示出抑制作用。具体地说,如果菌丝体前面相对于平板的未抑制部分变平甚至凹进,则发生了生长抑制。可以通过试验生物防治生物体的稀释的溶液找出可检测出作用的最低浓度来确定最小有效浓度。
用在液体真菌生长培养基而不是固体培养基中培养的孢子或菌丝体悬液进行液体培养基的生测。将真菌接种物、培养基和抗真菌剂在96孔微滴板的孔中混合,在真菌生长后接着用分光光度计测定培养物的浊度。浊度增加相应于生物量增加,是真菌生长的一种量度。通过比较存在和不存在抗真菌剂下真菌的生长确定生长抑制作用。经试验抗真菌抑制剂的不同稀释度的溶液,可以确定最小抑制浓度或EC50。
实施例31检测抗细菌活性的生测方法许多生测方法可用于测定未知化合物的抗细菌活性。在固体培养基上细菌生长的抑制作用可以通过将细菌培养物接种物分散在融化的培养基上并在无菌培养皿底部均匀散布悬液来估测。在培养基胶凝后,把无菌滤纸片置于其表面,将小份试验物质加到其上。使板在合适的温度下培养过夜,在滤纸周围细菌不生长或其中的生长比附近区域的生长降低的区域的出现说明有生长抑制作用。可以经测定最小有效剂量(给出抑制生长带的物质的最小量)说明纯的化合物的特征。在液体培养基中,可以使用两种其它方法。可以通过测量培养物的光密度(实际上是入射光的散射)监测培养物的生长。将等量的的接种物接种到等量体积中,其中一种培养物包含已知量的潜在的抗细菌剂。在待试细菌所需的合适的温度和通气条件下培养后,比较培养物的光密度。用于比较的合适的波长为600nm。可以经测定最小有效剂量(产生光密度降低的物质的最小量)或者经测定EC50(使试验培养物的生长为对照的一半时的浓度)说明抗细菌剂的特征。上述生测不区分抑菌和杀菌作用。可以进行确定药剂杀菌活性的另一种测定。通过将所述细菌和活性药剂在液体培养基中和在药剂足以发挥其作用的条件下一起培养一段时间来进行这一测定。在这一培养完成后,细菌可以经离心和再悬浮洗涤或者用新鲜培养基稀释。在两种情况下,将抗细菌剂的浓度降到其不再具有明显的活性的点。将细菌平板接种和散布到固体培养基上,在合适的生长温度下使板培养过夜。计数出现在平板上的菌落数,将包含抗细菌剂的混合物出现的菌落数与不含抗细菌剂的混合物出现的菌落数比较。菌落形成单位的降低是所述药剂的杀细菌活性的一种量度。杀细菌活性可以用以上描述的最小有效浓度或EC50定量。用于这些测定中的细菌包括土壤杆菌属、欧文氏菌属、棍状杆菌属和黄单胞菌属的种。
实施例32APS抗病原体活性的测定用以上实施例30和31的方法测定APS,以鉴别其抗真菌和细菌有活性的范围。可以从通常产生它的宿主生物体细胞和培养基分离APS,或者也可以从已经基因工程操作变得能产生APS的异源宿主分离。另一种可能性是化学合成已知结构的APS或其衍生物。
实施例33吡咯尼群抗病原体活性的测定a)观察到吡咯尼群的氟化的3-氰基-衍生物(指定为CGA1 73506)抗玉米真菌病原体Diplodia maydis、Colletetrichum graminicola和Gibberellazeae-maydis的抗植物病原体活性。收获真菌孢子并悬浮到水中。将约1000个孢子接种到适于平板读数的96孔微滴板孔中的总体积100微升的马铃薯葡萄糖培养基和CGA173506或水中。化合物CGA173506以50%可湿性粉剂获得,用无菌水以10mg/ml的浓度制备原料悬液。这一原料悬液用无菌水稀释得到试验中使用的173506。混合孢子、培养基和173606后,在平板计数器中读取600nm的吸收值测定孔中的浊度。这一浊度用作基底浊度,从后面读取的值中减去。培养46小时后,测定出1微克/毫升173506的存在抑制Diplodia maydis生长的64%,120小时后,相同浓度的173506抑制Colletetrichum graminicola生长的50%,培养40小时后,0.5微克/毫升173506的存在给出Gibberella zeae-maydis的100%抑制。
b)试验吡咯尼群在各种玉米真菌病原体生长上的作用和抑制Bipolarismaydis、Colletetrichum graminicola、Diplodia maydis、Fusarirmmoniliforme、玉蜀黍赤霉和Rhizoctania solani生长上的作用。
为测定生长抑制,将高压灭菌的滤纸(0.25英寸,得自Schleicher和Schuell)置于靠近ADA(DIFCO)板的周边。把溶液滴加到这些滤纸上。将2.5微克(25微升)吡咯尼群置于一个滤纸片上,25微升63%的乙醇置于另一滤纸片上。将各种真菌接种到一个平板上。使真菌生长,在合适的时间记录抑制作用。以上指出的真菌抑制作用是目测的。
K.抗生素生物合成基因在转基因植物中的表达实施例34克隆序列和邻近序列的修饰在这一应用中描述的克隆的APS生物合成基因可经修饰用于在转基因植物宿主中表达。其目标是从转基因植物产生可抽提量的APS(即与以上E部分描述的那些原因类似),或者目标也可以是表达可在植物组织中积累APS以对宿主植物提供抗病原体的保护作用。表达APS生物合成基因的和在其细胞中产生APS的宿主植物将具有对植物病原体侵害增强的抗性,由此能较好地抵抗与这种侵害相关的损失。
得自微生物源的基因在植物中的转基因表达可能需要修饰这些基因,以取得和优化它们在植物中的表达。具体地说,编码不同的酶但在天然微生物中由相同的转录物编码的细菌ORF在植物中不同的转录物上得到最好的表达。为获得这一表达,单个分离各微生物ORF,在盒内克隆,给出在ORF5’末端的植物启动子序列和在ORF3’末端的转录终止子序列。分离的ORF序列最好包含起始ATG密码子和终止STOP密码子,但在起始ATG和STOP密码子之外可以包含附加序列。此外,所述ORF可以是截短的,但仍保留所需的活性;对特定长度的ORF,保留活性的截短的形式在转基因生物体中表达可能是优选的。“植物启动子”和“植物转录终止子”意指在植物细胞内起作用的启动子和转录终止子。它包括可以是得自非植物源例如病毒(一个例子是花椰菜花叶病毒)的启动子和转录终止子。
在某些情况下,修饰ORF编码序列和邻近序列是不需要的,分离包含兴趣ORF的片段并插入到植物启动子下游就足够了。例如Gattney等(科学261754-756(1993))已在CaMV 35S启动子和CaMV tml终止子控制下,成功地在转基因植物中表达了假单胞菌属nahG基因,该基因编码序列未经修饰且连接有56bpATG上游的假单胞菌属基因,并且STOP密码子下游165bp片段仍连接在nahG ORF上。优选的,小的邻近微生物序列应在ATG上游和STOP密码子下游左侧连接。实际上,这种构建可能依赖于限制位点的可获得性。
在其它情况下,得自微生物源的基因的表达可能在表达中出现问题。本领域已完全说明了这些问题的特征,用得自某些源(例如芽孢杆菌属)的基因这些问题特别普遍。这些问题可能适合于本发明的生物合成基因,可以用目前本领域熟知的技术进行这些基因的修饰。下列问题可能遇到(1)密码子使用 植物中优选的密码子使用不同于某些微生物中优选的密码子使用。将克隆微生物ORF内的密码子使用与植物基因(特别是靶标植物基因)比较使得可以识别在ORF内的应优先改变的密码子。典型的单子叶植物进化倾向于在第三碱基上强烈地选择核苷酸C和G,而双子叶植物常常在这一位置上使用A或T。通过对特定的转基因物种修饰基因掺入优选的密码子使用以下描述的有关GC/AT含量和非常规剪接的许多问题都将被克服。
(2)GC/AT含量 植物基因一般具有高于35%的GC含量。富含A和T核苷酸的ORF会在植物中产生几个问题。首先,ATTTA基序被认为引起信息去稳定,在许多短寿mRNA的3’末端被发现。其次,聚腺苷酸化信号(例如在不适当位置上的AATAAA)的出现被认为引起转录前成熟截短。此外,单子叶植物可以识别富AT序列为剪接位点(参见下述)。
(3)邻近起始蛋氨酸的序列 植物不同于微生物在于其信息不具有确定的核糖体结合位点。另外,人们相信,核糖体结合到信息5’末端,扫描在其上开始翻译的第一个可获得的ATG。然而,人们相信邻近于ATG的某些核苷酸是有利的,微生物基因的表达可被在ATG上包含原核共有翻译起始物增强。Clontech(1993/1994 目录210页)已提出序列GTCGACCATGGTC(SEQ ID NO7)为在植物中表达大肠杆菌uidA基因的共有翻译起始物。此外,Joshi(核酸研究156643-6653(1987)比较了许多邻近于ATG的植物序列,提出了共有序列TAAACAATGGCT(SEQ IDNO8)。在植物中表达微生物ORF时遇到困难的情形下,在起始ATG包含一种这样的序列会改善翻译。在这种情况下,由于其第二AA残基的修饰,至少三个共有序列的核苷酸不适于包含在修饰的序列中。在不同的植物物种中,邻近于起始蛋氨酸的优选的序列可以不同。对GenBank数据库中14种玉米基因的分析得到下列结果14种玉米基因中在起始ATG前的位置-10 -9-8-7-6-5-4-3-2-1C38 4 6 2 5 6 010 7T30 3 4 3 2 1 1 1 0A23 1 4 3 2 3 7 2 3G63 6 0 6 5 4 6 1 5可以对掺入APS基因的所需植物物种和邻近ATG由掺入优选的核苷酸的序列进行这一分析。
(4)除去非常规剪接位点 从非植物源克隆的或未对在植物中表达优化的基因也包含可在植物中作为5’或3’剪接位点被识别并被切割(由此产生截短的或缺失的信息)的基序。
修饰编码序列和邻近序列的技术是本领域熟知的。在微生物ORF起始表达低,被认为适于按以上所述改变序列的情况下,可按照本领域熟知的方法完成合成基因的构建。这些方法是例如公开专利说明书EP 0 385 962(Monsanto)、EP 0 359 472(Lubrizol)、W/O 93/07278(Ciba-Geigy)。在许多情况下,在转移进转基因植物之前用瞬时测定方案(其是本领域熟知的)测定基因构建体的表达是优选的。
实施例35构建植物转化载体对植物转化,许多转化载体是可获得的,本发明的基因可用于任何这种载体连接。所使用的载体的选择取决于优选的转化技术和被转化的靶标物种。对某些靶标物种,不同的抗生素或除草剂选择标记可能是优选的。转化中通常使用的选择标记包括赋予卡拉霉素和相关抗生素抗性的nptII基因(Messing和Bierra,基因19259-268(1982);Bevan等人,自然304184-187(1983))、赋予除草剂phosphinothricin抗性的bar基因(White等人,核酸研究181062(1990);Spencer等人,理论应用遗传学79625-631(1990))、赋予抗生素潮霉素抗性的hph基因(Blochinger &和Diggelmann,分子细胞生物学42929-2931)和赋予甲氨蝶呤抗性的dhfr基因(Bourouis等人,欧洲分子生物学组织杂志(7)1099-1104(1983))。
1.构建适于土壤杆菌转化的载体对用根癌土壤杆菌进行转化,许多载体是可获得的。它们一般携带至少一个T-DNA边缘序列并包含载体如pBIN19(Bevan核酸研究(1984))。以下描述了两种典型载体的构建。
pCIB200和pCIB2001的构建二元载体pCIB200和pCIB2001用来构建与土壤杆菌一起使用的重组载体,按以下方法构建。经NarI消化pTJS75(Schmidhauser和Helinski,J细菌164446-455(1985))切除四环素抗性基因产生pTJS75kan,接着插入携带NPTII的pUC4K(Messing和Vierra,基因19259-268(1982;Bevan等人,自然304184-187(1983);McBride 14266-276(1990))的AccI片段。将XhoI接头连接到包含左和右T-DNA边缘,一种植物选择嵌合基因和pUC多接头的pCIB7(Rothstern等人,基因53153-161(1987))的EcoRV片段上,把XhoI消化的片段克隆进SalI消化的pTJS75kan,产生pCIB200(也参见EP 0332104,实施例19)。pCIB200含有单独的多接头限制位点EcoRI、SstI、KpnI、BglII、XbaI和SalI。pCIB2001是经插入附加限制位点到多接头中产生的pCIB200的衍生物。在pCIB2001多接头中的单独的限制位点是EcoRI、SstI、KpnI、BglII、XbaI、SalI、NluI、BclI、AvrII、ApaI、HpaI和StuI。除了包含这些单独的限制位点外,pCIB2001也具有植物和细菌卡拉霉素选择、土壤杆菌介导转化的左和右T-DNA边缘、在大肠杆菌和其它宿主之间移动的RK2衍生的trfA功能以及也是来源于RK2的OriT和OriV功能。pCIB2001多接头适于克隆包含其自身调节信号的植物表达盒。
构建pCIB10和其潮霉素选择衍生物二元载体pCIB10含有编码选择植物的卡拉霉素抗性的基因,T-DNA右和左边缘序列,将其掺入到得自宽宿主范围质粒pRK252的序列,使其在大肠杆菌和土壤杆菌两者中复制。Rothstein等(基因53153-161(1987))描述了其构建。已构建了掺入Gritz等(基因25179-188(1983))描述的潮霉素B磷酸转移酶基因的pCIB的各种衍生物。这些衍生物使得可以仅在潮霉素上(pCIB743)或潮霉素和卡拉霉素上(pCIB715、pCIB717)选择转基因植物细胞。
2.构建适于非土壤杆菌转化的载体不使用根癌土壤杆菌转化绕过了选择转化载体中对T-DNA序列的的需要,因此,除了以上描述的包含T-DNA序列的载体外,缺乏这些序列的载体也可使用。不依赖土壤杆菌的转化技术包括经粒子轰击、原生质体摄入(PEG和电穿孔)和微注射转化。载体的选择很大程度上取决于优选的被转化物种。以下描述了某些类型的载体的构建。
构建pCIB3064pCIB3064是适用于与用除草剂basta(或phosphinothricin)选择一起使用的直接基因转移技术的pUC衍生物。pCIB246包含操作融合进大肠杆菌GUS基因中的CaMV 35S启动子和CaMV 35S转录终止子,在PCT公开申请WO93/07278中有描述。这一载体的35S启动子包含两个ATG序列的起始位点5’。以除去ATG产生限制位点SspI和PvuII的方式用标准的PCR技术突变这些位点。新限制位点距单独的salI位点96和37bp,距实际起始位点101和42bp。所形成的pCIB246衍生物指定为pCIB3025。经用SalI和SacI消化从pCIB3025切下GUS基因,使末端成平端,再连接产生质粒pCIB3060。从John Innes中心,Norwich获得质粒pJIT82,切下包含绿色产色链霉菌bar基因的400bp SmaI片段,插入到pCIB3060的HpaI位点(Thompson等人,欧洲分子生物学组织杂志J 62519-2523(1987))。由此产生了pCIB3064,它包含在CaMV 35S启动子和除草剂选择终止子控制下的bar基因、氨苄青霉素抗性基因(为在大肠杆菌中选择)和具有单独位点SphI、PstI、HindIII和BamHI的多接头。这一载体适于克隆包含其自身调节信号的植物表达盒。
构建pSOG19和SOG35pSOG35是用大肠杆菌基因二氢叶酸还原酶(DHFR)作为选择标记赋予甲氨蝶呤抗性的转化载体。将PCR用于扩增35S启动子(约800bp)、玉米Adh1基因内含子6(约550bp)和pSOG10的18bpGUS未翻译前导序列。也用PCR扩增编码大肠杆菌二氢叶酸还原酶II型基因的250bp片段,把这些PCR片段与包含pUC19载体骨架和胭脂氨酸合成酶终止子的pBI221(Clontech)的SacI-PstI片段一起装配。装配这些片段产生了pSOG19,它含有与内含子6序列融合中的35S启动子、GUS前导物、DHFR基因和胭脂氨酸合成酶终止子。用得自玉米Chlorotic Mottle病毒(MCMV)的前导序列取代pSOG19中的GUS前导物产生载体pSOG35。pSOG19和pSOG35携带pUC氨苄青霉素抗性基因并具有克隆外源序列可获得的HindIII、SphI、PstI和EcoRI位点。
实施例36对构建植物表达盒的需要待在转基因植物中表达之基因序列首先要装配进在合适的启动子后面和在合适的转录终止子上游的表达盒。然后这些表达盒可以容易地转移进以上实施例2-6中描述的转化载体中。
启动子选择用于表达盒中的启动子的选择决定了转基因植物中转基因的空间和时间表达模式。选择的启动子将在特定的细胞类型(例如叶表皮细胞、meosphyll细胞、根外皮细胞)和在特定的组织或器官(例如根、叶或花)中表达转基因,这种选择会反映出生物合成APS所需位置。另外,选择的启动子也可以驱动在光诱导或其它时序调节启动子控制下的基因。另一种替换是选择的启动子是化学调节的。这将给出仅在需要时诱导出诱导作用的可能性和引起用化学诱导剂处理。
转录终止子可获得用于表达盒的各种转录终止子。这些终止子决定转基因之外的转录终止和其正确的聚腺苷酸化。合适的转录终止子是已知在植物中起作用的那些,包括CaMV 35S终止子、tml终止子、胭脂氨酸合成酶终止子、豌豆rbcS E9终止子。这些可以用于单子叶植物和双子叶植物两者中。
增强或调节表达的序列已发现许多序列增强基因表达(从转录单位内),这些序列可用于与本发明的基因一起增加所述基因在转基因植物中的表达。
许多内含子序列已表现出增强表达,特别是在单子叶植物细胞中。例如,已发现,当引入到玉米细胞中时,玉米Adh1基因内含子明显增强受相关启动子控制的野生型基因的表达。发现内含子1部分有效,并增强在与氯霉素乙酰转移酶基因的融合构建体中的表达(Callis等人,基因进展11183-1200(1987))。在类似的实验系统中,玉米bronze1基因内含子在增强表达中具有类似的作用(Callis等人,同上)。已时常将内含子掺入到植物转化载体中,典型地是未翻译的前导物内。
也已知得自病毒的大量未翻译前导序列增强表达,这些在双子叶植物细胞中特别有效。具体地说,烟草花叶病毒(TMV,“Ω-序列”)、玉米ChloroticMottle病毒(MCMV)和苜蓿花叶病毒(AMV)的前导序列已表现出在增强表达中有效(例如,Gallie等人,核酸研究158693-8711(1987);Skuzeski等人,植物分子生物学1565-79(1990))。
细胞内基因产物的靶引已知靶引基因产物的各种机制存在于植物中,已以某种程度详细地确定了控制这些机制起作用的序列的特征。例如,基因产物靶引到叶绿体由在各种蛋白质的氨基末端发现的信号序列控制,该序列在叶绿体运送成熟蛋白质期间断裂掉(例如,Comai等人,生物化学杂志26315104-15109(1988))。这些信号序列可融合异源基因产物影响转运异源产物到叶绿体中(van den Broeck等人,自然313358-363(1985))。编码合适的信号序列的DNA可以从编码RUBISCO蛋白质、CAB蛋白质、EPSP合成酶、GS2蛋白质和已知定位于叶绿体的许多其它蛋白质的cDNA的5’末端分离。
其它基因产物定位于其它细胞器,例如线粒体和过氧化物酶体(如Unger等人,植物分子生物学13411-418(1989))。编码这些产物的cDNA可经操作影响异源基因产物靶引到这些细胞器。这些序列的例子是线粒体的核编码的ATP酶和特异性天冬氨酸氨基转移酶。Rogers等(自然科学研究汇刊,美国826512-6516(1985))描述了靶引到细胞蛋白体。
此外,已确定了导致基因产物靶引到其它细胞区室的序列的特征。氨基末端序列决定靶引到ER、质外体和糊粉细胞胞外分泌(Koehler和Ho,植物细胞2769-783(1990))。另外,氨基末端与羧基末端一起决定基因产物的液泡靶引(Shinshi等人,植物分子生物学14357-368(1990))。
通过将以上描述的合适的靶引序列融合进兴趣转基因序列,引导转基因产物到任何细胞器或细胞区室是可能的。例如,就叶绿体靶引,RUBISCO基因、CAB基因、EPSP合成酶基因或GS2基因融合进转基因氨基末端ATG的读框。选择的信号序列应包括已知的切割位点,融合体构建应考虑需要切割的切割位点后的任何氨基酸。在某些情况下,这一要求可以通过在切割位点和转基因ATG间添加少量氨基酸或者通过在转基因序列内取代某些氨基酸来满足。可以用文献(Bartl等人,见Edelmann等人(编辑),叶绿体分子生物学方法,Elsevier.pp1081-1091(1982);Wasmann等人,分子基因遗传学205446-453(1986))描述的技术经体外转录构建体的体外翻译,接着进行体外叶绿体摄入来试验就叶绿体运输构建的融合体的叶绿体摄入效率。这些构建技术是本领域公知的,同样适用于线粒体和过氧化物酶体。APS生物合成基因可能需要的靶引的选择依赖于需要作为给定途径起始点的前体的细胞定位。尽管在某些情况下是线粒体的和过氧化物酶体的,但这常常是胞质的和叶绿体的。APS生物合成基因的基因产物通常不需要靶引到ER、质外体或液泡。
上述细胞靶引机制不仅可以与其相关启动子而且可以与异源启动子一起使用,以便在具有不同于产生靶引信号的启动子的不同表达模式的启动子的转录调节下作用于特定的靶引目标。
实施例37表达盒构建的实施例本发明包括在任何启动子的调节下表达编码APS的基因,不论启动子的来源,该基因是在植物中可表达的。
此外,本发明包括与表达APS基因所需的或选择的任何其它序列一起使用任何植物可表达的启动子。所述的序列包括但不限于转录终止子、增强表达的外源序列(例如,内含子(如Adh内含子1)、病毒序列(如TMV-Ω))和意在靶引基因产物到特定细胞器和细胞区室的序列。
组成型表达CaMV 35S启动子公开专利申请EP 0392225中描述了质粒pCGN1761的构建(实施例23)。pCGN1761含有“双”35S启动子和tml转录终止子(在所述的启动子和所述的终止子之间有单一EcoRI位点)并具有pUC型骨架。构建了pCGN1761的一个衍生物,该衍生物具有包含除EcoRI位点外的NotI和XhoI位点的修饰的多接头。这一衍生物指定为pCGN1761 ENX。pCGN1761ENX在为了在转基因植物中在35S启动子控制下表达的目的多接头内克隆cDNA序列或基因序列(包括微生物ORF序列)中有用。为了转移到转化载体中(例如以上实施例35描述的那些),可由启动子5’的HindIII、SphI、SalI和XbaI位点以及终止子3’的XbaI、BamHI和BglI位点。另外,为了用另一启动子取代,可以经用HindIII、SphI、SalI、XbaI或PstI 5’切除和用任何多接头限制位点(EcoRI、NotI或XhoI)3’切除除去双35S启动子片段。
经翻译起始位点优化修饰pCGN1761ENX对这一部分描述的任何构建体来说,围绕克隆位点的修饰可由引入可增强翻译的序列来进行。当得自微生物的具有待引入到植物表达盒时,这一方法特别有用,因为这些基因不包含邻近于其起始蛋氨酸的序列,该序列可能适于在植物中起始翻译得自微生物的基因待在其ATG克隆进植物表达盒的情况下,修饰插入位点以优化其表达可能是有用的。以举例的方式描述了掺合进几个优化的植物表达序列之一的pCGN1761ENX的修饰(例如Joshi,核酸研究156643-6653(1987))。
用SphI切割pCGN1761ENX,用T4 DNA聚合酶处理并连接,由此消除位于双35S启动子5’的SphI。
这一过程产生了载体pCGN1761ENX/Sph-。用EcoRI切割pCGN1761ENX/Sph-,并连接到序列 5’-AATTCTAAAGCATGCCGATCGG-3’(SEQ ID NO9)/5’-AATTCCGATCGGCATGCTTTA-3’(SEQ ID NO10)的退火的分子衔接子上。由此产生载体pCGNSENX,该载体掺入邻近ATG的quasi-优化的植物翻译起始序列TAAA-C,它是适于在起始蛋氨酸克隆异源基因从SphI位点自身的部分。SphI位点下游、EcoRI、NotI和XhoI位点被保留。构建一种采用起始ATG NcoI位点的替换载体。该载体指定为pCGN1761NENX,是经在pCGN1761ENX EcoRI位点插入序列5’-AATTCTAAACCATGGCGATCGG-3’(SEQ ID NO11)/5’-AATTCCGATCGCCATGGTTTA-3’(SEQ ID NO12)的退火的分子衔接子(序列识别号14和15)制备的。因此,该载体包含在NcoI位点内邻近起始ATG的quasi-优化序列TAAACC。然而,在这一操作之前用与以上有关SphI的类似的技术或者用“内外”(“inside-outside”)PCR(Innes等人,PCR方案方法及应用指南,学术出版社,纽约(1990);参见实施例41)消除pCGN1761ENX载体内的NcoI位点(在5’35S启动子单元的上游位置)。可以通过将任何植物cDNA或报道基因质粒插入到克隆位点接着进行植物中的常规表达分析试验这一操作任何可能的有害作用。
在化学调节启动子控制下表达这一部分描述了用任何选择的启动子替换pCGN1761ENX中双35S启动子,以举例的方式描述了化学调节的PR-1a启动子。该选择的启动子最好经限制酶从其源切下,也可以用携带合适的末端限制位点的引物由PCR扩增获得。应进行PCR扩增反应,在靶标载体中克隆扩增的启动子后应再测序启动子以检查扩增错误。从质粒pCIB1004(参见EP 0332104,实施例21有关其构建)切下化学调节烟草PR-1a启动子,转移进质粒pCGN1761 ENX。用NcoI切割pCIB1004,用T4 DNA聚合酶处理使所形成的线性化片段的3’突出端成为平端。然后用HindIII切割片段,所形成的包含PR-1a启动子的片段用凝胶纯化,并克隆进pCGN1761ENX,由此,双35S启动子已被除去。这通过用XhoI切割,用T4聚合酶平端化,接着用HindIII切割,分离较大的载体终止子包含片段(pCIB1004启动子片段克隆到其中)进行。这样产生了一种pCGN1761ENX衍生物,该衍生物带有PR-1a启动子、tml终止子和具有单一EcoRI和NotI位点的一个间插多接头。选择的APS基因可以插入进这一载体,融合产物(即,启动子-基因-终止子)可被接着转移进任何选择的转化载体,包括本申请描述的那些。
组成型表达肌动蛋白启动子已知肌动蛋白的几种异型在大多数细胞类型中表达,因而肌动蛋白启动子是组成型启动子的最好的选择。特别地,水稻Act1基因的启动子已被克隆和确定特征(McElroy等人,植物细胞2163-171(1990))。发现该启动子的一个1.3kb片段含有所有的在水稻原生质体中表达所需的调节元件。而且,已构建许多基于Act1启动子的表达载体特异性用于单子叶植物中(McElroy等人,分子基因遗传231150-160(1991))。这些掺入Act1-内含子1、Adh1 5’侧翼序列和Adh1-内含子(来自玉米醇脱氢酶基因)以及得自CaMV 35S启动子的序列。表现出最高表达的载体是35S和Act1内含子或Act1 5’侧翼序列和Act1内含子的融合物。起始ATG(GUS报道基因的)周围的序列的优化也增强表达。McElroy等(分子基因遗传231150-160(1991))描述的启动子表达盒可被容易地修饰来表达APS生物合成基因,并特别适用于单子叶植物宿主。例如,包含启动子的片段可从McElroy构建体移出,用于取代pCGN1761ENX中的双35S启动子,在特定的基因序列插入中它是可用的。如此构建的融合基因然后可转移到合适的转化载体中。在一个不同的报道中,已发现具有其第一内含子的Act1启动子指导培养的大麦细胞中的高表达(Chibbar等人,植物细胞繁殖12506-509(1993))。
组成型表达遍在蛋白启动子遍在蛋白是另一种已知在许多细胞类型中积累的基因产物,其启动子已从几个物种克隆用于转基因植物中(如,向日葵-Binet等人,植物科学7987-94(1991);玉米-Christensen等人,植物分子生物学12619-632(1989))。玉米遍在蛋白启动子已在转基因单子叶植物系统中开发,其质粒和构建来用于单子叶植物转化的载体在专利申请EP 0342926中公开。另外,Taylor等(植物细胞繁殖12491-495(1993))描述了包含玉米遍在蛋白启动子和第一内含子的载体(pAHC25)和其在经微粒轰击引入后在许多单子叶植物细胞悬液中的高活性。遍在蛋白启动子明显适于在转基因植物(特别是单子叶植物)中表达APS生物合成基因。合适的载体是pAHC25或本申请描述的任何转化载体经引入合适的遍在蛋白启动子和/或内含子序列修饰的衍生物。
根特异性表达本发明的APS表达的优选的模式是根表达。根表达对防治产生于土壤的植物病原体(例如,丝核菌属和腐霉属)特别有用。仅在根组织中的APS表达具有防治根侵入植物病原体,无APS在叶和花组织和种子中的伴随性积累的优点。合适的根启动子是de Framond(欧洲生物化学学会联合会290103-106(1991))中和公开专利申请EP 0452269(Ciba-Geigy)描述的启动子。将这一启动子转移进供插入兴趣APS基因并接下来转移完整的启动子-基因-终止子盒到兴趣转化载体中的合适的载体(例如pCGN1761ENX)中。
创伤诱导启动子创伤诱导启动子特别适于表达APS生物合成基因,这是因为它们不仅在创伤诱导上,而且在植物病原体感染位点上典型地是活性的。许多这类启动子已被描述(例如Xu等人,植物分子生物学22573-588(1993);Logemann等人,植物细胞1151-158(1989);Rohrmeier和Lehle,植物分子生物学22783-792(1993);Firec等人,植物分子生物学22129-142(1993);Warner等人,植物杂志3191-201(1993)),所有这些都适用于本发明。Logemann等(同上)描述了双子叶植物马铃薯wun1基因的5’上游序列。Xu等(同上)指出双子叶植物马铃薯的创伤诱导启动子(pin2)在单子叶植物水稻中是活性的。此外,Rohrmeier&Lehle(同上)描述了玉米Wip1cDNA(其是创伤诱导的,可用于经标准技术分离关联启动子)的克隆。类似地,Firek等(同上)和Warner等描述了在局部创伤和病原体侵入位点表达的单子叶植物Asparagus officinalis的创伤诱导基因。采用本领域熟知的克隆技术,可将这些启动子转移进合适的载体,融合进本发明的APS基因,并用于在植物病原体感染位点表达这些基因。
木髓优先表达专利申请WO 93/07278(Ciba-Geigy)描述了在木髓细胞中优先表达的玉米trpA基因。给出了从转录起始点延伸到核苷酸-1726的基因序列和启动子。采用标准的分子生物学技术,可将这一启动子或其部分转移进载体(例如pCGN1761)中(在载体中它可以取代35S启动子),并用于驱动外源基因以木髓优先方式表达。事实上,包含木髓优先启动子或其部分的片段可被转移进任何载体或被修饰以用于转基因植物中。
花粉特异性表达专利申请WO 93/07278(Ciba-Geigy)进一步描述了在花粉细胞中表达的玉米钙依赖性蛋白激酶(CDPK)基因的分离。这一基因序列和启动子从转录起始点延伸至1400bp。采用标准的分子生物学技术,可将这一启动子或其部分转移进载体(例如pCGN1761)中(在载体中它可以取代35S启动子),并用于驱动外源基因以花粉特异性方式表达。事实上,包含花粉特异性启动子或其部分的片段可被转移进任何载体或被修饰以用于转基因植物中。
叶特异性表达Hudspeth和Grula(植物分子生物学12579-589(1989))描述了编码烯醇磷酸羧激酶(PEPC)的玉米基因。采用标准的分子生物学技术,可将这一基因的启动子用于在转基因植物中以叶特异性方式驱动任何基因的表达。
用叶绿体转运表达Chen和Jagendorf(生物化学杂志2682363-2367(1993))描述了成功地使用异源转基因引入中的叶绿体转运肽。所使用的这种肽是Nicotianaplumbaginifolia rbcS基因的转运肽(Poulsen等人,分子基因遗传205193-200(1986))。采用限制酶DraI和SphI或者Tsp509I和SphI,可以从质粒prbcS-8B(Poulsen et al.,同上)切下编码这一转运肽的基因,并用以上描述的任何构建方法操作。DraI-SphI片段从相对起始prbcS ATG-58位延伸至(并包括)紧接在引入切割位点后的成熟肽的第一氨基酸(也是蛋氨酸),而Tsp509I-SphI片段从相对起始prbcS ATG-8位延伸至(并包括)紧接在引入切割位点后的成熟肽的第一氨基酸。因此,这些片段可以适于插入进任何选择的表达盒的接头,产生与未翻译的选择启动子(例如,35S、PR-1a、肌动蛋白、ubiquitin等)的前导序列的转录融合物,从而使得所需APS基因以正确的融合方式插入进转运肽下游。这类构建在本领域是常规的。例如,鉴于Dral末端已成平端,可以用T4聚合酶处理使5’Tsp509I位点成为平端,或者也可以连接到接头或衔接子序列,以促进其与选择的启动子的融合。3’SphI位点可如此保留,或者也可以连接到衔接子或接头序列,以利于以使可获得后续选择的APS基因插入的合适的限制位点的方式插入到选择的载体中。理想的是SphI位点的ATG被保留,并包含这些的APS基因的第一ATG。Chen和Jagendorf(同上)提出了叶绿体引入的理想切割的共有序列,在各种情况下蛋氨酸在成熟蛋白质第一位置是优选的。在接下来的位置有更多的变化并且氨基酸可以不是很关键的。在任何情况下,可以用Bartlett等(见Edelmann等人,(Eds.)叶绿体分子生物学方法,Elsevier.pp 1081-1091(1982))和Wasmann等(分子基因遗传205446-453(1986))描述的方法估测融合构建体体外引入的效率。典型的,最好的方法可以是采用在氨基末端无修饰的选择的APS基因产生融合体,并且只在这种融合体明显是非高效率叶绿体引入的时掺合修饰,在这种情况下,修饰可以按照已有文献(Chen & Jagendorf,同上;Wasman等人,如上述;Ko和Ko,生物化学杂志26713910-13916(1992))所述的方法进行。
通过将prbcS-8B的DraI-SphI转运肽编码片段转移到克隆载体pCGN1761ENX/Sph-构建优选的载体。用EcoRI切割这一质粒,用T4 DNA聚合酶处理使末端成平端。用SphI切割质粒prbcS-8B,连接到序列5’-CCAGCTGGAATTCCG-3’(SEQ ID NO13)/ 5’-CGGAATTCCAGCTGGCATG-3’(SEQ ID NO14)的退火的分子衔接子上。经T4激酶处理使所形成的产物5’末端磷酸化。接着用DraI切割释放转移肽编码片段,将该片段连接进以上所述的修饰载体的平端ex-EcoRI位点。由测序鉴别以插入物的5’末端邻近35S启动子3’末端取向的克隆。这些克隆携带35S前导序列和rbcS-8A启动子-转运肽序列的DNA融合物,从相对rbcS ATG的-58位延伸至成熟肽的ATG,并包括单一的SphI位点,新产生的EcoRI位点以及pCGN1761ENX的存在的NotI和XhoI位点。这一新载体指定为pCGN1761/CT。经采用PCR技术扩增,在扩增的ATG的SphI、NsphI或NlaIII位点掺入,在用合适的酶限制性酶切后连接进SphI切割的pCGN1761/CT的方式将DNA序列转移到pCGN1761/CT读框中。为了有利于构建,可能需要改变克隆基因的第二氨基酸,然而,在几乎所有的情况下,围绕切割位点和成熟肽的第一蛋氨酸,采用PCR以及标准的位点定向诱变技术能够构建任何所需的序列。
经用prbcS-8A的BamHI-SphI片段取代pCGN1761ENX的35S启动子构建另一个优选的载体,所述BamHI-SphI片段包含从核苷酸-1038(相对于转录起始位点)到成熟蛋白质地一蛋氨酸的全长轻调节rbcS-8A启动子。用PstI和EcoRI切割消除了SphI位点的修饰的Pcgn1761,用T4聚合酶处理使末端成为平端。用SphI切割prbcS-8A,连接到以上描述序列的退火的分子衔接子上,经T4激酶处理使所形成的产物5’末端磷酸化。接着用BamHI切割释放包含启动子-转运肽的片段,用T4 DNA聚合酶处理该片段使BamHI末端成为平端。将如此产生的启动子-转运肽片段克隆进制备的pCGN1761CNX载体,产生包含rbcS-8A启动子和具有位于插入异源基因的切割位点的SphI位点的转运肽基因的构建体。另外,SphI位点下游有EcoRI(产生的)、NotI和XhoI克隆位点。这一构建体指定为pCGN1761 rbcS/CT。
可用得自其它源(单子叶植物和双子叶植物)和其它基因的其它GS2叶绿体转运肽编码序列进行类似的操作。此外,可用按类似的方法取得靶引到其它亚细胞室,例如,线粒体。
实施例38分离适于表达APS基因的新启动子的技术采用标准的分子生物学技术(包括以下描述的任何技术)分离新启动子。一旦分离到,就将它们融合进报道基因(例如GUS或LUC),并分析它们在转基因植物中的表达模式(Jefferson等人,欧洲分子生物学组织杂志63901-3907(1987);Ow等人,科学234856-859(1986))。把表现出所需表达模式的启动子融合进APS基因,用于植物中表达。
扣除cDNA克隆扣除cDNA克隆技术对严生特定mRNA群体富集cDNA文库有用(例如,Hara等人,核酸研究191097-7104(1991))。近来已描述了构建少量组织扣除文库的技术(Sharma等人,生物技术15610-612(1993))。这些技术适于增强组织特异性信息,所述信息可能只可在少量组织(例如,紧靠创伤和病原体感染位点的组织)中获得。
标准加/减技术示差筛选将携带得自不同RNA群(即根对整个植物,茎特异性对整个植物,局部病原体感染点对整个植物等)的cDNA的λ噬菌体以低密度平板接种到两组杂交滤纸上(不同筛选技术的综述参见Calvet,Pediatr.Nephrol.5751-757(1991))。得自“选择”RNA群的cDNA杂交到第一组滤纸上,得自整个植物RNA的cDNA杂交到第二组滤纸上。选择与第一探针杂交但不与第二探针杂交的噬斑进一步估价。收集噬斑,其cDNA用于筛选“选择”RNA对来源于各种其它组织和来源的RNA的Northern印迹。表现出所需表达模式的克隆用于从基因组文库克隆基因序列,使得能够分离关联启动子。将500-5000bp之间的克隆的启动子融合到报道基因(例如GUS,LUC)上,并再引入到转基因植物中供表达分析。
示差显示示差筛选从不同的源(即选择的源)和整个植物(作为对照)分离RNA,用Liang和Pardee(科学257967-971(1992))的示差显示技术处理。凝胶纯化扩增的选择RNA中出现的片段(而不是对照),用作携带以上描述的不同RNA样品的Northern印迹上的探针。克隆选择性杂交到所需RNA上的片段,用作探针以分离cDNA以及可从其中分离启动子的基因组DNA片段。将分离的启动子融合到以上描述的GUS或LUC报道基因上,估测其在转基因植物中的表达模式。
用“启动子阱(Promoter Trap)”技术分离启动子无启动子报道基因插入到转基因植物可用于鉴别宿主植物中的序列,所述序列驱动宿主在所需细胞类型中或以所需长度表达。Ott和Chua(分子基因遗传223169-179(1990))和Kertbundit等(自然科学研究汇刊,美国885212-5216(1991))描述了这一技术的变化。在标准的转基因实验中相同的原理可用于鉴别宿主基因组中的增强子元件(此时特定的转基因可以以特别高的水平表达)。
实施例39双子叶植物的转化用于转化双子叶植物的技术是本领域公知的,包括基于土壤杆菌属的技术和不需要土壤杆菌属的技术。非-土壤杆菌属技术涉及直接由原生质体或细胞摄入外源遗传物质,这可经PEG或电穿孔介导摄入、粒子轰击介导传递或微注射完成。以下文献描述了这些技术的例子Paszkowski等人,欧洲分子生物学组织杂志32717-2712(1984);Potrykus等人,分子基因遗传199169-177(1985);Reich等人,生物技术41001-1004(1986)和Klein等人,自然32770-73(1987)。在各种情况下,用本领域标准技术使转化细胞再生为整个植物。
土壤杆菌属介导的转化是转化双子叶植物优选的技术,这是因为其高转化效力和许多不同物种的宽的利用性。通常可被土壤杆菌属转化的许多作物品种包括烟草、西红柿、向日葵、棉花、油菜、马铃薯、大豆、苜蓿和白杨(EP 0317511(棉花)、EP 0249433(西红柿,Calgene)、WO87/07299(芥属,Calgene)、US 4795855(白杨))。土壤杆菌转化典型地包括携带外源兴趣DNA的二元载体(例如pCIB200或pCIB2001)向合适土壤杆菌菌株属的转移,所述菌株可以取决于在共存Ti质粒上或染色体上的宿主土壤杆菌属菌株携带的vir基因的互补(例如,pCIB200和pCIB2001的菌株CIB524(Uknes等人,植物细胞5159-169(1993))。重组二元载体向土壤杆菌的转移经采用携带重组二元载体的大肠杆菌的三亲本交配方法完成,所说的大肠杆菌是一种携带质粒(例如pRK2013)并且能够转移二元载体到靶标土壤杆菌菌株的辅助大肠杆菌菌株。另外,也可以经DNA转化将二元载体转移进土壤杆菌中(Hofgen和Willmitzer,核酸研究169877(1988))。
经重组土壤杆菌的靶标植物品种的转化通常涉及土壤杆菌与植物外植物病原体的共培养,且通常按本领域公知的方案进行。转化的组织在带有在二元质粒T-DNA边缘存在的抗生素或除草剂抗性标记的选择培养基上再生。
实施例40单子叶植物的转化大多数单子叶植物品种的转化现已常规化。优选的技术包括用PEG或电穿孔技术将基因直接转移进原生质体和经粒子轰击转移进愈合组织。转化可以用单DNA物种或多DNA物种(即共转化)进行,这两类技术都适用于本发明中。共转化可以具有避免复合载体构建和产生具有未连接的兴趣基因基因座和选择标记的转基因植物的优点,能够在后续产生步骤中除去选择标记,这应被认为是所需要的。然而,使用共转化的缺点是不同DNA物种以低于100%频率整合进基因组(Schocher等人,生物技术41093-1096(1986))。
专利申请EP 0292495(Ciba-Geigy)、EP0392225(Ciba-Geigy)和WO93/07278(Ciba-Geigy)描述了从玉米elite同系繁殖系制备愈伤组织和原生质体,用PEG或电穿孔转化原生质体和从转化的原生质体产生玉米植物的技术。Gordon-Kamm等(植物细胞2603-618(1990))和Fromm等(生物技术8833-839(1990))已公开了用粒子轰击转化A188衍生的玉米系的技术。此外,专利申请WO 93/07278(Ciba-Geigy)和Koziel等(生物技术11194-200(1993))描述了经粒子轰击转化玉米elite同系繁殖系的技术。这些技术采用从授粉后早期14-15天的玉米切下的1.5-2.5mm长未成熟胚芽和供轰击用的PDS-1000He Biolistics装置。
也可以用采用原生质体的直接基因转移技术或粒子轰击进行水稻的转化。已描述Japonica型和Indica型原生质体介导的转化(zhang等人,植物细胞繁殖7379-384(1988);Shimamoto等人,自然338274-277(1989);Datta等人,生物技术8736-740(1990))。两种类型也可以用粒子轰击常规转化(Christou等人,生物技术9957-962(1991))。
专利申请EP 0332581(Ciba-Geigy)描述了产生、转化和再生Pooideae原生质体的技术。这些技术可以转化Dactylis和小麦。另外,Vasil等((生物技术10667-674(1992))描述了用粒子轰击进C型长期再生愈合组织细胞,Vasil等((生物技术111553-1558(1993))和Weeks等(植物生理1021077-1084(1993))描述了用粒子轰击未成熟胚芽和得自未成熟胚芽的愈合组织进行小麦转化的方法。然而,一种小麦转化优选的技术涉及经粒子轰击未成熟胚芽转化小麦,并包含在基因传递前的一个高蔗糖或高麦芽糖步骤。在轰击前,将任何数量的胚芽(长0.75-1mm)平板接种到具有3%蔗糖(Murash)和3mg/l 2,4-D的BS培养基中,用于在暗处诱导体胚芽。在选择轰击的当天,从诱导培养基移去胚芽,置于到渗透培养基(osmoticum)上(即,具有以所需浓度(一般是15%)添加的蔗糖或麦芽糖的诱导培养基)。使胚芽胞质皱缩2-3小时,然后轰击。每个靶板20个胚芽是典型的(尽管不是关键的)。用标准技术将合适的携带基因的质粒(例如pCIB3064或pSG35)沉淀到微米级金粒上。用标准80网屏(mesh screen)以~1000psi爆发压由DuPont Biolistics氦装置射击各胚芽盘。轰击后,将胚芽置回暗处恢复约24小时(仍在渗透培养基上)。24小时后,将胚芽从渗透培养基移回到诱导培养基中,在再生前置于其中约1个月。约1个月后将具有发育的胚胎发生愈合组织的胚芽外植物病原体转移到还包括合适的选择剂(在pCIB3064的情况下是10mg/l basta,在pSOG35的情况下是2mg/l甲氨蝶呤)的再生培养基(MS+1mg/l NAA,5mg/lGA)上。约1个约后,将发育的芽转移到称作“GA7s”之较大的无菌容器中,该容器含有一半浓度的MS、2%蔗糖和相同浓度的选择剂。专利申请WO 94/13822描述了小麦转化的方法,一并在此参考。
实施例41吡咯尼群在转基因植物中的表达所有四个吡咯尼群ORF的GC含量在62和68%之间,因此就其在植物中的表达预期不存在AT-含量相关问题。然而,修饰基因使其包含在合适的靶标植物品种中优选的密码子可能是有利的。以下描述的种类的融合可以用于任何所需的修饰(例如为在植物中优化转录起始或增强表达)的或未修饰的启动子。
在35S启动子后表达将4种吡咯尼群ORF的每一种转移进pBluescrpt KS II供进一步的操作。这由采用PCR扩增的引物进行,所述引物同源于各基因的各末端,还包含有利于将扩增片段转移进pBluescrpt载体的限制位点。对ORF1来说,氨基末端引物包含SalI位点,羧基末端引物包含NotI位点;类似地,对ORF2来说,氨基末端引物包含SalI位点,羧基末端引物包含NotI;对ORF3来说,氨基末端引物包含NotI位点,羧基末端引物包含XhoI位点;类似地,对ORF4来说,氨基末端引物包含NotI位点,羧基末端引物包含XhoI位点;
由此,用合适的限制酶(选择性的,因为它们不在ORF内切割)切割扩增的片段,然后连接进pBluescrpt,也相应地进行酶切。在pBluescrpt中克隆单个ORF有利于其后续操作。用“内外”PCR(Innes等人,PCR方案方法与应用指南,学术出版社,纽约,(1990)进行进一步构建所需的内部限制位点破坏。单一的限制位点位于被消除的位点的两边(理想的是从被消除位点100-500bp之间),进行两种不同的修饰。一种从被消除位点左侧单一位点延伸,由扩增跨越所述位点的寡核苷酸扩增DNA至被消除位点,并掺入合适的碱基变化。第二种扩增从被消除位点延伸至被消除位点右边的单一位点。在第二反应中跨越被消除位点的寡核苷酸掺入与第一扩增中相同的碱基变化,理想的是与第一反应的寡核苷酸重叠10-25个核苷酸。由此,两个反应的产物共有在相应于各扩增中产生的限制位点上掺入相同碱基变化的重叠。两种扩增后,凝胶纯化(除去使用的4种寡核苷酸引物),混合在一起,用跨越单一限制位点的两种引物经PCR再扩增。在这一最终PCR反应中,两种扩增片段之间的重叠给出了第一圈合成的引发的必要性。这一反应产物从左边单一限制位点延伸至右边单一限制位点,并包括位于内部的修饰的限制位点。可以在单一限制位点切割该产物,插入到未修饰基因的合适位置上,取代野生型片段。
为了使ORF首先从两个内SphI位点游离,设计跨越和同源于单一XmaI和EspI的寡核苷酸。XmaI寡核苷酸与跨越第一SphI位点的寡核苷酸一起用于PCR反应中,它包含序列…CCCCCTCATGC…(下面的链,SEQID NO15),由此将碱基变化引入到SphI位点。第二PCR反应采用跨越SphI位点的寡核苷酸(上面的链),它包含序列…GCATGAGGGGG…(SEQ ID NO16),与跨越EspI位点的寡核苷酸一起使用。凝胶分离两种产物,用XmaI和EspI-跨越寡核苷酸扩增其自身,所形成的片段用XmaI和EspI切割,用于取代ORF1克隆中的天然片段。按照以上描述,修饰的SphI位点是GCATGA,并且不引起密码子改变。在这一位点上不破坏氨基酸完整性的其它改变是可能的(即,第二核苷酸改变为G、T或A)。
类似的策略用于消除ORF1中的第二SphI位点。在这种情况下,EspI是位于左边的限制位点,位于右边的限制位点是PstI(位置上靠近基因的3’末端),或者也可以是SstI(不出现在PRF序列中,但紧靠pBluescript接头)。在这种情况下,合适的寡核苷酸是跨越这一位点的一种寡核苷酸,或者是可获得pBluescript序列引物的一种寡核苷酸。这一SphI位点被修饰为GAATGC或GCATGT或GAATGT。这些改变都消除所述位点而不引起密码子改变。
用类似的方法使ORF2游离于其单个SphI位点。左边的限制位点由PstI或MluI提供,合适的右边限制位点由pBluescript接头中的SstI提供。在这种情况下,所述位点改变为GCTTGC、GCATGC或GCTTGT;这些改变保持氨基酸的完整性。
ORF3无内SphI位点。
在ORF4的情况下,PstI提供了右边的单一位点,但在被改变的SphI位点的左边无合适的位点。在这种情况下,在pBluescript接头中的限制位点可以起到与以上所述相同的作用。SphI位点被修饰成GGATGC、GTATGC、GAATGC或GCATGT等。
按以上所述从吡咯尼群生物合成基因除去SphI位点有利于其经扩增转移进pCGN1761SENX载体,所述的扩增采用在ATG掺入SphI位点的氨基末端寡核苷酸引物和掺入在被扩增基因中未发现的限制位点的羧基末端引物。用SphI和限制酶切割所形成的扩增片段,切掉羧基末端序列,并克隆进pCGN1761ENX。掺入羧基末端引物的合适的限制酶位点是NotI(对所有三种PRF)、XhoI(对PRF3和ORF4)和EcoTI(对ORF4)。假定需要在SphI识别位点内6位的核苷酸C,在某些情况下,ORF的第二密码子可能需要改变以便从核苷酸C开始。这一构建使在其ATG上的各ORF以可操作连接双35S启动子的方式融合进翻译优化载体pCGN1761SENX的SphI位点。构建完成后,再测序最终的基因插入物和融合点,以证实没有发生不希望的碱基变化。
通过采用在其ATG掺入NcoI位点替代SphI位点的氨基末端寡核苷酸引物,可以容易地将ORF1-4克隆进翻译优化载体pCGN1761NENX。4个吡咯尼群生物合成基因ORF都不携带NcoI位点,因此,在这种情况下不需要消除内限制位点。按以上所述设计基因的羧基末端引物,以类似的融合进行克隆。假定需要在NcoI识别位点内6位的核苷酸G,在某些情况下,ORF的第二密码子可能需要改变以便从核苷酸G开始。这一构建使在其ATG上的各ORF以可操作连接双35S启动子的方式融合进载体pCGN1761NENX的NcoI位点。
将合适pCGN1761衍生载体的表达盒转移进转化载体。这里将可能的多表达盒转移进单转化载体,以降低植物转化的数量和转化体之间的杂交,所述转化体可能需要用来产生表达所有4个ORF的植物并由此产生吡咯尼群。
具有叶绿体靶引的在35S控制下表达用在其氨基末端携带SphI位点的寡核苷酸扩增吡咯尼群ORF1-4,并克隆进35S-叶绿体靶引载体pCGN1761/CT。在位于rbcS转运肽切割位点的SphI位点进行融合。将如此产生的表达盒转移进合适的转化载体(见上述)并用于产生转基因植物。吡咯尼群生物合成的前体色氨酸是在叶绿体中合成的,在叶绿体中表达吡咯尼群生物合成基因以保证底物供应是有利的。表达所有4种ORF的转基因植物靶引所有4种基因产物到叶绿体,由此在叶绿体中合成吡咯尼群。
具有叶绿体靶引的在rbcS控制下表达用在其氨基末端携带SphI位点的寡核苷酸扩增吡咯尼群ORF1-4,并克隆进rbcS-叶绿体靶引载体pCGN1761rbcS/CT。在位于rbcS转运肽切割位点的SphI位点进行融合。将如此产生的表达盒转移进合适的转化载体(见上述)并用于产生转基因植物。吡咯尼群生物合成的前体色氨酸是在叶绿体中合成的,在叶绿体中表达吡咯尼群生物合成基因以保证底物供应是有利的。表达所有4种ORF的转基因植物靶引所有4种基因产物到叶绿体,由此在叶绿体中合成吡咯尼群。然而,4种ORF的表达被轻度诱导。
实施例42soraphen在转基因植物中的表达克隆p98/1包含编码soraphen生物合成的5个组件的完整的soraphen生物合成基因ORF1。部分测序的ORF2包含剩下的3个组件,soraphen生物合成还需要的是位于相同操纵子上的soraphen甲基化酶。
为了在转基因植物中表达,以下列方式操作soraphen ORF1。以p98/1为模板,用PCR从ORF1氨基末端扩增DNA片段。5’寡核苷酸引物包括ATG上的分别用于克隆pCGN1761SENX或pCGNNENX的SphI位点或NcoI位点。而且,5’寡核苷酸包括紧靠在ATG后的碱基C(供Sphi克隆)或碱基G(供NcoI克隆),由此蛋白质的第二氨基酸改变成组氨酸或天冬酰胺(可以通过另外改变第二密码子的其它碱基选择物质2上的其它氨基酸)。供扩增的3’寡核苷酸位于ORF的第一BglII位点,并掺入了远侧EcoRI位点(使扩增片段能被SphI(或NcoI)和EcoRI切割),然后克隆进pCGN1761SENX(或pCGN1761NENX)。为了有利于扩增片段的切割,各寡核苷酸在其5’末端包含几个附加碱基。除了所需的限制位点和附加序列外,所述的寡核苷酸最好具有同源于ORF1模板的12-30bp。这一操作将其ATG上的ORF1氨基末端~112氨基酸以连接到双35S启动子上的方式融合进翻译优化载体pCGN1761SENX或pCGN1761NENX的SphI或NcoI位点。剩下的ORF1携带在3个BglII片段上,这些片段可依次克隆进以上详述的构建体的单一BglII位点。这些片段的第一次引入不成问题,只需要用BglII切割氨基末端构建体,接着第一次引入这些片段。对第二次剩余片段的引入来说,需要氨基末端构建体的部分消化(因为这些构建体具有了附加BglII位点),接着引入下一个BglII片段。因此,以操作融合进35S启动子的方式构建包含完整的~25kb soraphen ORF1的载体是可能的。
通过融合系列限制片段构建吡咯尼群ORF1的另一个方法是用PCR扩增全ORF。Bames(自然科学研究汇刊,美国912216-2220(1994))最近描述了用PCR高保真扩增长达35kb片段的技术,这些技术可用于ORF1。将对ORF1各末端特异性的具有添加的合适的限制位点的寡核苷酸用于扩增全编码区,然后克隆进合适载体(例如pCGN1761或其衍生物)的合适位点。典型地在PCR后,需要再测序以证实在扩增序列中没有出现碱基改变。另外可以在转基因植物中直接进行功能性测定。
另一种在转基因植物中表达聚酮化合物(例如soraphen)生物合成基因的方法是构建在植物中表达的转录单位,它包含少于常规的组件补体,在另一个转录单位上提供剩下的组件。由于人们相信聚酮化合物抗生素(例如soraphen)的生物合成是一个需要特定组件的顺序活性的过程,并且对特定分子的合成来说这些活性应以特定的顺序提供,因此很可能不同转基因在携带不同组件的植物中表达可以导致新聚酮化合物分子的生物合成,因为野生型基因的顺序酶促性质由其在单个分子上的构型决定。假定5个soraphen生物合成组件在ORF1上的定位是soraphen生物合成的决定性因素,在一个转基因上的三个组件混合在另一个转基因上的其它两个组件与ORF2的一起表达可能一起具有不同分子结构和可能具有不同抗病原体活性的聚酮化合物的生物合成。本发明包含所有这些组件表达的偏向,其可能引起新聚酮化合物在转基因生物体中的生物合成。
尽管以上就ORF1给出了特定构建的详细说明,但类似的技术也用于在转基因植物中表达ORF2和soraphen甲基化酶。就在植物中的功能性soraphen表达来说,预期所有三种基因都必须表达,本说明书详细描述了这一点。
以上描述的种类的融合可以用于任何所需的修饰(例如为在植物中优化转录起始或增强表达)的或未修饰的启动子。因为soraphen生物合成的鉴别的ORF约70%GC丰度,因此预计编码序列需要修饰以增加GC含量以优化在植物中的表达。然而,修饰基因使其包含在合适的靶标植物品种中优选的密码子可能是有利的。
实施例43吩嗪在转基因植物中的表达所有编码吩嗪合成的生物合成酶的基因的GC含量在58和65%之间,因此就其在植物中的表达预期不存在AT-含量相关问题(尽管修饰基因使其包含在合适的靶标植物品种中优选的密码子可能是有利的)。以下描述的种类的融合可以用于任何所需的修饰(例如为在植物中优化转录起始或增强表达)的或未修饰的启动子。
在35S启动子控制下表达将3种吩嗪ORF的每一种转移进pBluescrpt KS II供进一步的操作。转移作为EcoRI-BglII片段从包含全吩嗪操纵子的质粒pLSP18-6H3del3克隆的的phzB ORF。将这一片段转移进pBluescrpt KS II的EcoRI-BamHI位点。phzC ORF作为XhoI-ScaI片段从pLSP18-6H3del3转移,克隆进pBluescrpt KS II的XhoI-SmaI位点。phzD ORF作为BglII-HindIII片段从pLSP18-6H3del3转移,克隆进pBluescrpt KS II的BamHI-HindIII位点。
用“内外”PCR(Innes等人,PCR方案方法及应用指南,学术出版社,纽约,(1990)进行进一步构建所需的内部限制位点破坏。在phzB ORF的情况下消除两个SphI位点(位于ORF上游的一个位点是左边完整的)。其首先是用单一限制位点EcoRI(被消除的SphI位点的左边)和BclI(SphI位点的右边)消除。为成功地进行这一操作,必须在dam-minus大肠杆菌宿主例如SCS110(Stratagene)中产生内外PCR产物最终装配的BclI切割的DNA。对第二phzB SphI位点,选择的单一限制位点是PstI和SpeI,后者在pBluescrpt接头中的phzB ORF之外。phzC ORF无内SphI位点,对phzC不需要这一方法。然而,phzD ORF具有单个SphI位点,可用单一限制位点XmaI和HindIII消除(由于在BamHI和HindIII间插入ORF,pBluescrpt接头的XmaI/SmaI位点不再存在)。
按以上所述从吩嗪生物合成基因除去SphI位点有利于其经扩增转移进pCGN1761SENX载体,所述的扩增采用在ATG掺入SphI位点的氨基末端寡核苷酸引物和掺入在被扩增基因中未发现的限制位点的羧基末端引物。用SphI和限制酶切割所形成的扩增片段,切掉羧基末端序列,并克隆进pCGN1761ENX。掺入羧基末端引物的合适的限制酶位点是EcoRI和NotI(对所有三种ORF,当序列完全时,需要检查NotI)和XhoI(对phzB和phzD)。假定需要在SphI识别位点内6位的核苷酸C,在某些情况下,ORF的第二密码子可能需要改变以便从核苷酸C开始。这一构建使在其ATG上的各ORF以可操作连接双35S启动子的方式融合进翻译优化载体pCGN1761SENX的SphI位点。构建完成后,再测序最终的基因插入物和融合点,以证实没有发生不希望的碱基变化。
通过采用在其ATG掺入NcoI位点替代SphI位点的氨基末端寡核苷酸引物,可以容易地将三种phz ORF克隆进翻译优化载体pCGN1761NENX。3个吩嗪生物合成基因ORF都不携带NcoI位点,因此,在这种情况下不需要消除内限制位点。按以上所连设计基因的羧基末端引物,以类似的融合进行克隆。假定需要在NcoI识别位点内6位的核苷酸G,在某些情况下,ORF的第二密码子可能需要改变以便从核苷酸G开始。这一构建使在其ATG上的各ORF以可操作连接双35S启动子的方式融合进载体pCGN1761NENX的NcoI位点。
将合适pCGN1761衍生载体的表达盒转移进转化载体。这里将可能的多表达盒转移进单个转化载体,以降低植物转化的数量和转化体之间的杂交,所述转化体可能需要用来产生表达所有4个ORF并由此产生吩嗪。
具有绿体靶引的在35S控制下表达用在其氨基末端携带SphI位点的寡核苷酸扩增吩嗪ORF,并克隆进35S-叶绿体靶引载体pCGN1761/CT。在位于rbcS转运肽切割位点的SphI位点进行融合。将如此产生的表达盒转移进合适的转化载体(见上述)并用于产生转基因植物。吩嗪生物合成很可能的前体分支酸酯(chorismate)是在叶绿体中合成的,在叶绿体中表达吩嗪生物合成基因以保证底物供应是有利的。表达所有3种ORF的转基因植物靶引所有3种基因产物到叶绿体,由此在叶绿体中合成吩嗪。
具有叶绿体靶引的在rbcS控制下表达用在其氨基末端携带SphI位点的寡核苷酸扩增吩嗪ORF1-4,并克隆进rbcS-叶绿体靶引载体pCGN1761rbcS/CT。在位于rbcS转运肽切割位点的SphI位点进行融合。将如此产生的表达盒转移进合适的转化载体(见上述)并用于产生转基因植物。吩嗪生物合成很可能的前体分支酸酯是在叶绿体中合成的,在叶绿体中表达吩嗪生物合成基因以保证底物供应是有利的。表达所有3种ORF的转基因植物靶引所有3种基因产物到叶绿体,由此在叶绿体中合成吩嗪。然而,3种ORF的表达被轻度诱导。
实施例44不经核糖体合成的肽抗生素短杆菌肽在转基因植物中的表达先前已克隆和测序三种短芽孢杆菌短杆菌肽生物合成基因grsA、gysB和grsT(Turgay等人,分子微生物6529-546(1992);Kraetzschmar等人,细菌杂志1715422-5429(1989))。它们长度分别为3296、13358和770bp。这些序列也以GenBank登记号X61658和M29703出版。可以用公众可获得的Turgay等(同上)和Kraetzschmar等(同上)公开的克隆或者也可以从按本文的描述由短芽孢杆菌新分离的克隆进行本文所述的操作。
用跨越全编码序列的寡核苷酸PCR扩增三种ORF grsA、gysB和grsT的各种。向左(上游)寡核苷酸包含SstI位点,向右(下游)寡核苷酸包含XhoI位点。这些限制位点在任何三种编码序列中未出现,使得能够扩增供插入到pBluescrpt II SK相应位点的由SstI和XhoI切割的产物。这一过程产生克隆pBL-GRSa、pBL-GRSb和pBL-GRSt。这些基因的CG含量在35-28%之间。理想地是用K部分提到的技术再制备编码三种基因的编码序列,然而,未修饰的基因在转基因植物中高水平表达而不遇到问题(由于其AT含量)是可能的。在任何情况下,修饰基因使其包含在转基因植物品种中优选的密码子是有利的。
ORF grsA不含有SphI位点和NcoI位点。因此这一基因可以从pBLGSRa用在ATG掺入SphI位点和NcoI位点的氨基末端寡核苷酸和掺入XhoI位点的羧基末端寡核苷酸扩增,由此使得扩增产物可以直接克隆进双35S启动子后的pCGN1761SENX或pCGN1761NENX。
ORF grsB不含有NcoI位点,因此,这一基因可以以与以上有关ORFgrsA的描述中相同的方式用含有NcoI位点的氨基末端寡核苷酸扩增,用NcoI和XhoI切割扩增的片段并连接进pCGN1761NENX。然而,grsBORF含有三个SphI位点,要除去它们以利于后续克隆步骤。用以上描述的“内外”PCR技术消除这些位点。在grsB基因内但不是在pBluescrpt IISK内发现的单一克隆位点是EcoN1、PflM1和RsrII。EcoN1或PflM1可以与RsrII一起用来除去在先的两个位点,RsrII可以与pBluescript接头的ApaI位点一起用来除去第三个位点。一旦除去这些位点(不引起氨基酸的改变),完整的grsB ORF就可以用在ATG上包含SphI位点的氨基末端寡核苷酸和掺入XhoI位点的羧基末端寡核苷酸扩增。将所形成的片段克隆进pCGN1761SENX。为了成功地PCR扩增这样大小的片段,修改Barnes(1994,Proc.Natl.Acad.Sci USA 912216-2220(1994))(其描述了大DNA片段的高保真扩增)的扩增方案。将grsB转移进pCGN1761SENX而没有必要破坏三个SphI位点替换性方法是通过从基因的ATG扩增转移grsB氨基末端片段的pCGN1761SENX的SphI和XhoI克隆位点,扩增中采用了在ATG掺入SphI位点的氨基末端寡核苷酸和邻近ORF中PflM1位点3’并包含XhoI位点的第二寡核苷酸。用SphI和XhoI切割氨基末端扩增片段,克隆进pCGN1761SENX。接着用PnM1和XhoI(其在pBluescript接头中切割)从pBLGRSb切下grsB基因的剩余部分,克隆进用PflM1和XhoI切割的携带氨基末端的构建体,以再构基因。
ORF grsT不包含SphI位点和NcoI位点。因而这一基因可以从pBLGSRt用从在起始密码子(为在植物中表达其已从GTG改变成ATG)上掺入了SphI位点或NcoI位点的氨基末端寡核苷酸和掺入了XhoI位点的第二羧基末端寡核苷酸扩增。由此使得扩增产物可以直接克隆进双35S启动子后的pCGN1761SENX或pCGN1761NENX。
假定需要在SphI识别位点内6位的核苷酸C和需要在NcoI识别位点内6位的核苷酸G,在某些情况下,ORF的第二密码子可能需要改变以便从合适的核苷酸开始。
按本说明书其它地方的描述产生表达所有三种短杆菌肽生物合成基因的转基因植物。表达所有三种基因的转基因植物合成短杆菌肽。
实施例45经核糖体合成的肽抗生素表皮纤维在转基因植物中的表达epiA ORF编码表皮纤维生物合成从结构单位,长度约为420bp(GenBank登记号X07840;Schnell等人,自然333276-278(1988))。这一基因可以经PCR技术用携带末端限制位点BamHI(5’)和PstI(3’)的寡核苷酸从质粒pTu32亚克隆进pBluescript SK II。epiA基因序列具有27%的GC含量,其可由本说明书中其它地方所述的基因合成技术提高,然而,为保证在植物中高水平表达,这种序列修饰可以不是必需的。接着,经基因的PCR扩增将epiA ORF转移进克隆载体pCGN1761SENX或pCGN1761NENX,扩增中采用跨越起始蛋氨酸并携带SphI位点(用于克隆进pCGN1761SENX)或NcoI位点(用于克隆进pCGN1761NENX)的氨基末端寡核苷酸以及携带用于克隆进pCGN1761SENX或pCGN1761NENX的EcoRI、NotI和XhoI位点的羧基末端寡核苷酸。假定需要在SphI识别位点内6位的核苷酸C和需要在NcoI识别位点内6位的核苷酸G,在某些情况下,ORF的第二密码子可能需要改变以便从合适的核苷酸开始。
采用本说明书中描述的技术或本领域公知的技术将epi操纵子剩下的基因(即epiB、epiC、epiD、epiQ和epiP)从质粒pTu32亚克隆进pBluescript SK II。这些基因决定epiA编码结构单位的修饰和聚合,在Kupke等人,细菌杂志1745354-5361(1992)和Schnell等人,欧洲生物化学杂志20457-68(1992)中有描述。按以上的描述操作亚克隆的ORF用于转移进pCGN1761-衍生载体。这里将可能的多表达盒转移进单转化载体,以降低植物转化的数量和转化体之间的杂交,所述转化体可能需要用来产生表达所有需要的ORF的植物并由此产生表皮纤维。
L转基因植物积累APS的分析实施例46APS基因表达分析可由用标准的Northern印迹技术估测APS mRNA在组织中积累的量来分析APS基因在转基因植物中的表达。另外,经Western分析用抗血清由APS生物合成基因产物的提高来估测APS基因产物的量。抗血清可以用常规技术和导致APS基因在宿主(例如大肠杆菌)中的表达的蛋白质提高。为避免抗血清由来源于表达多个APS基因的大肠杆菌从多个ORF操纵子表达的多基因产物的提高可以在大肠杆菌中多个表达APS生物合成基因。此外,抗血清也可以由设计为同源于或相同于已知APS生物合成预测氨基酸序列的合成多肽提高。这些技术是本领域已知的。
实施例47转基因植物中APS产生的分析对各APS,用已知的方案检测APS在转基因植物组织中的产生。这些方案在合适的有关APS的文献中是可得到的。对吡咯尼群,使用实施例11描述的方法,对soraphen,使用实施例17描述的方法。对吩嗪的检测,可以使用实施例17描述的方法。对不经核糖体合成的肽抗生素(例如短杆菌肽S),合适的一般性技术是测定ATP-PPi交换。在短杆菌肽的情况下,grsA基因可由苯丙氨酸-依赖性ATP-PPi交换测定,grsB基因可由脯氨酸、缬氨酸、鸟氨酸或亮氨酸-依赖性ATP-PPi交换测定。Gause和Brazhnikova(Lancet 247715(1994))描述了替换性技术。对经核糖体合成的肽抗生素,可以按Allgaier等(欧洲生物化学杂志1609-12(1986))有关表皮纤维的描述经丁醇抽提、在甲醇和乙醚中溶解、接着进行层析进行分离。对许多APS(例如吡咯尼群、短杆菌肽、吩嗪),Merck Index(Merk和Rahway,NJ(1989))提供了合适的技术。
M.转基因植物中病害抗性测定采用植物病理学已知的技术测定表达APS生物合成基因的转基因植物对植物病原体的抗性。对叶病原体,使植物生长在温室中,在发育的合适阶段以合适的方式引入目标植物病原体。对从天然产生的植物病原体,通常在种子播种前或在其同时将病原体引入土壤。对引入基因的种植的植物的选择应已考虑相对植物病原体敏感性。因此,选择的种植植物会是对大多数目的植物病原体敏感的,使得可以确定增加的抗性。
对叶植物病原体抗性的测定实施例48对烟草叶植物病原体的病害抗性Phytophthora parasitica/Black shank对Phytophthora parasitica抗性的测定而言,按Alexaneder等人,自然科学学术汇刊,美国907327-7331描述的方法在6周龄植物上生长black shank病原体。给植物浇水,使其排水良好,然后用10ml孢子囊悬液(300孢子囊/ml)接种到土壤中。接种的植物保持在温室中,温室保持23-25℃白天温度和20-22℃夜间温度。用于测定中的枯萎指数如下0=无症状;1=枯萎的某些征兆,具有降低的紧涨度;2=明显枯萎症状,但不腐烂或发育迟缓;3=带有发育迟缓的明显枯萎症状,但无明显茎腐烂;4=严重枯萎,具有可见的茎腐烂和对根系统的损害;5=与4同,但植物接近死亡或死亡,并具有根系统的严重的降低。所有测定都在随机设计中排列的植物上评分。
丁香假单胞菌 以106或3×106/ml(在水中)浓度将丁香假单胞菌pv.tabaci(菌株#551)注射进6-7周龄植物的两片较低的叶片上。在各时间点估价6个单独的植物。烟草假单胞菌感染的植物与5级病害严重程度相关,5=100%死亡组织,0=无症状。在估价的各天进行T-测定(LSD),在获得平均病害等级值后分组。在估价的当天跟着相同的字母的值无统计学上明显不同。
烟草尾孢将烟草尾孢(ATCC#18366)孢子悬液(每毫升100000-150000个孢子)喷射到叶片表面。使植物保持100%湿度5天。此后每天向植物喷水5-10次。在每个时间点估价6个单独的植物。确定表示病害症状基础的烟草尾孢%叶片区比率。在估价的各天进行T-测定(LSD),在获得平均病害等级值后分组。在估价的当天跟着相同的字母的值无统计学上明显不同。
统计学分析所有的试验包括非转基因植物(每次测定6个植物,或者相同转基因系的种植物)(Alexander等人,自然科学学术汇刊,美国907327-7331)。在各额定的天成对进行T-试验以比较不同基因型和处理组。
对土传植物病原体的抗性测定实施例49对立枯丝核菌的抗性通过种植或移植种子或种苗到天然或人工感染的土壤中进行确定对立枯丝核菌抗性的植物试验。为产生人工感染的土壤,首先用水润湿小米、水稻、燕麦或其它类似的种子,然后高压灭菌,用取自琼脂板的真菌病原体块接种。当种子完全长满植物病原体时,将其晾干并研成粉。该粉末以实验确定的引起病害的比率混合进土壤。通过比较生长在感染土壤中的转基因和非转基因植物的未倒优数量、根损害级别和发芽率以及根重量估价病害。病害程度也可以与在相同条件下但无植物病原体加入到土壤的情况下生长的植物的级别比较。
实施例50对Pseudomonas solancearum的抗性通过种植或移植种子或种苗到天然或人工感染的土壤中进行确定对立枯丝核菌抗性的植物试验。为产生人工感染的土壤,使细菌在摇瓶培养物中生长,以实验确定的引起病害的比率混合进土壤。植物的根可能需要轻微创伤,以保证病害发展。通过比较生长在感染土壤中的转基因和非转基因植物的未倒优数量、根损害级别和发芽率以及根重量估价病害。病害程度也可以与在相同条件下但无植物病原体加入到土壤的情况下生长的植物的级别比较。
实施例51对病毒传播媒体的土传的真菌的抗性许多土传多粘霉属、油壶菌属和粉痂菌属的种的微生物是病毒传播的媒体。这些包括1.传播Beet Necrotic Yellow Vein Virus(rhizomania病害的病原体)至甜菜的Polymyxa batae;2.传播小麦土传花叶病毒到小麦,大麦黄花叶病毒和大麦温和(mild)花叶病毒到大麦的多粘霉;3.传播烟草坏死病毒到烟草的芸苔油壶菌;和4.传播Potato Mop Top Virus到马铃薯的马铃薯粉痂菌。将在其根中表达(例如组成型或根特异性表达下)APS的种子或植物播种或移植到无菌土壤中,把携带目标病毒的真菌接种物引入到土壤。在合适的时间期限后,经ELISA和Northern印迹测定转基因植物的病毒症状和病毒积累。对照实验包括不接种和用不携带所研究的病毒的真菌接种。所分析的转基因植物应是对所述病毒敏感的,以便测定基于APS保护的效率。在被多粘霉属传播和可机械传播的病毒(例如大麦温和(mild)花叶病毒)的情况下,经成功地机械引入病毒到植物(其由在根中表达APS得到抗土壤感染保护)中提供另外的对照。
由此,由APS表达给出的对病毒传播真菌的抗性阻止靶标作物的病毒感染,从而改善植物健康状况和产量。
实施例52对线虫的抗性分析表达APS的转基因植物对线虫的抗性。将在其根中表达(例如组成型或根特异性表达下)APS的种子或植物播种或移植到无菌土壤中,把携带线虫的接种物引入到土壤。在合适的时间点估测线虫损害。将根结群线虫(例如Meloidogyne spp.)引入到表达APS的烟草和西红柿中。将包囊线虫(例如Heterodera spp.)引入到转基因谷物、马铃薯和甜菜中。将损害线虫(例如Rotylenchulus spp.)引入到转基因大豆、苜蓿或谷类中。将Ditylenchusspp.引入到转基因苜蓿中。Starr(Ed.;植物种类抗植物寄生性线虫的评估方法,线虫学家学会,Maryland(1990))提供了筛选对线虫抗性的详细技术。
农作物品种中重要的植物病原体的例子实施例53玉米中病害抗性将表达APS基因并表现出产生APS化合物的转基因玉米植物进行下列病害试验。按照标准的植物病理学方法进行对各植物病原体的试验。
叶病害和茎腐病1.玉米大斑病(大斑病长蠕孢,异名Exserohilum turcicum)2.玉米炭疽病(Colletotrichum graminicola,与茎腐病的相同)
3.玉米小斑病(Helminthospotium maydis,异名Bipolaris maydis)4.玉米眼斑病(玉蜀黍球梗孢)5.玉米叶锈病(玉米柄锈)6.Southern Rust(多堆柄锈)7.玉米紫斑病(Cercospora zeae-maydis和Cercospora sorghi)8.茎腐病(下列病原体的两种或多种的复合物--瓜果腐霉-早期,菊欧文氏菌-zeae-早期,禾生刺盘孢,Diplodia maydis,大孢色二孢,玉蜀黍赤霉,串珠镰孢,Macrophomina phaseolina,顶头孢)9.Goss’Disease(Clavibacter nebraskanense)重要的穗霉病1.Gibberella Ear Rot(玉蜀黍赤霉 -与茎腐病的相同)黄曲霉,寄生曲霉黄曲霉毒素2.Diplodia Ear Rot(Diplodia maydis 和大孢色二孢-与茎腐病相同的生物体)3.玉米丝黑穗病(丝轴黑粉菌,异名Ustilago reiliana)实施例54小麦中的病害抗性将表达APS基因并表现出产生APS化合物的转基因小麦植物进行下列病害试验。按照标准的植物病理学方法进行对各植物病原体的试验。
1.小麦叶枯病(小麦壳针孢、颖枯壳针孢)2.小麦白粉病(禾白粉菌)3.小麦条锈病(条形柄锈)4.小麦叶锈病(小麦叶锈、大麦柄锈)5.其它-Brown Foot Rot/小麦苗立枯病(黄色镰孢和粉红镰孢),小麦眼斑病(pseudocercosporella herpotrichoides),麦类全蚀病(禾顶囊壳)6.病毒(大麦黄花叶病毒、大麦黄矮病毒、小麦黄花叶病毒)。
N.表达APS基因的微生物菌株的生物防治效率实施例55对棉花抵抗立枯丝核菌的保护作用通过将用生物防治菌株处理的种子种植到天然或人工感染的土壤中进行确定对棉花抵抗立枯丝核菌的保护作用的试验。为产生人工感染的土壤,首先用水润湿小米、水稻、燕麦或其它类似的种子,然后高压灭菌,用取自琼脂板的真菌病原体块接种。当种子完全长满植物病原体时,将其晾干并研成粉。该粉末以实验确定的引起病害的比率混合进土壤。将这种感染的土壤置于盆中,把种子置于1.5cm深的沟中。使生物防治菌株在实验室摇瓶生长。离心收集细胞,再悬浮于水中,然后浸透种子。对照植物仅用水浸透。通过比较处理的和未处理的种苗的未倒优数和根病变级别可以在14天后估测病害。病害的级别也可以与在相同条件下但无植物病原体加入到土壤的情况下生长的种苗的级别比较。
实施例56对马铃薯抵抗Claviceps michiganese subsp.speedonicum的保护作用Claviceps michiganese subsp.speedonicum是马铃薯轮纹病的病原菌,并且当“种子”马铃薯块茎被切开产生更多的繁植材料时,通常在种植前扩散。病原体在刀口表面的传播导致整批“种子”被接种。通过用病原体和生物防治菌株两者接种马铃薯种子块进行确定对马铃薯抵抗所述病原菌的保护作用的试验。经首先切开天然感染的块茎引入病原菌,然后切开其它块茎使其成为种子块。接着,用生物防治菌株悬液或水(对照)处理种子块。通过估价植物活力、产量和由麦角菌属微生物感染的块茎的数量在生长末期估价病害。
O.从表达克隆基因的生物体分离APS实施例57分离APS的提取方法活性APS可以从产生APS的野生型或转化菌株的细胞或生长培养基分离。这可以采用分离已知特征的分子的已知方案进行。
例如,对包含多个苯环的APS(吡咯尼群和soraphen),在合适的温度下于10ml L发酵液中生长培养物24小时,然后用等体积的乙酸乙酯抽提。回收有机相,使其在真空下蒸发,将残渣溶解于20μl甲醇中。
在吡咯尼群的情况下,就从产生这一抗生素的转化菌株的生长培养基提取活性抗病原体化合物而言,已成功地使用了其它方法。这可以通过用80%丙酮抽提发酵液,接着蒸发除去丙酮和用乙醚第二次提取来完成。蒸发除去乙醚,将干提取物重悬于小体积的水中。将小份抗生素抽提物加到置于琼脂平板上的小无菌滤纸片上,抑制立枯丝核菌的生长就表明存在活性抗生素化合物。
Thomashow等(应用环境微生物学56908-912(1990))描述了一种分离吩嗪的优选的方法。该方法包括用盐酸酸化培养液至pH2.0并用苯抽提。用硫酸钠使苯组份脱水,蒸发至干。将残渣再溶于5%碳酸氢钠水溶液中,用等体积的苯再抽提,酸化,分配到水中并干燥。
对肽抗生素(其为典型的疏水性的),采用丁醇、甲醇、氯仿或环己烷的抽提技术是合适的。在短杆菌肽的情况下,可以按照Gause和Brazhnikova(Lancet 247715(1994))描述的方法进行分离。对表皮纤维,Allgaier等(欧洲生物化学杂志1609-22(1986))描述的有关表皮纤维的方法是合适的,该方法包括丁醇抽提,在甲醇和乙醚中溶解。对许多APS(例如吡咯尼群、短杆菌肽、吩嗪),Merck Index(Merk和Rahway,NJ(1989))提供了合适的技术。
P.分离的抗生素的制剂和使用可以用活性成分制备抗真菌制剂,所述活性成分包含分离的APS或者产生APS的细胞的悬液或浓缩物。可以以液态或固态形式制备制剂。
实施例58抗真菌组合物液态制剂在下列实施例中,组合物的百分比以重量百分比给出1.可乳化的浓缩物a b c活性成分 20% 40% 50%十二烷基苯磺酸钙 5% 8%6%蓖麻油聚乙二醇醚 5%- -(36mol环氧乙烷)三丁基酚聚乙二醇醚- 12%4%(30mol环氧乙烷)环己酮- 15%20%
二甲苯混合物70% 25% 20%通过用水稀释这些浓缩物可以产生任何所需浓度的乳剂。
2.溶液a b c d活性成分 80%10% 5%95%乙二醇单甲基醚 20% - - -聚乙二醇400 - 70%- -N-甲基-2-吡咯烷酮- 20%- -环氧椰子油 - - 1% 5%石油馏出液 - - 94%-(沸点范围160-190℃)这些溶液适于以微滴形式施用。
3.颗粒a b活性成分 5%10%陶土 94%-高分散硅酸 1% -硅镁土(attapulgit)-90%将活性成分溶解到二氯甲烷中,把该溶液喷射到载体上,接着在真空中蒸发掉溶剂。
4.粉末 a b活性成分 2%5%高分散硅酸 1%5%滑石 97%-陶土 -90%通过将载体和活性成分均匀混合获得可直接施用的粉末。
实施例59抗真菌组合物固态制剂在下列实施例中,组合物的百分比以重量百分比给出1.可湿性粉剂abc
活性成分20% 60% 75%木素磺化钠 5%5%-十二烷基硫酸钠 3%- 5%二异丁基萘磺酸钠- 6%10辛酚聚乙二醇醚 - 2%-(7-8mol环氧乙烷)高分散硅酸 5%27% 10%陶土67% - -将活性成分与佐剂充分混合,在合适的磨中充分研磨,产生可由水稀释给出所需浓度悬液的可湿性粉剂。
2.可乳化浓缩物活性成分10%辛酚聚乙二醇醚 3%(7-8mol环氧乙烷)十二烷基苯磺酸钙3%蓖麻油聚乙二醇醚4%(36mol环氧乙烷)环己酮 30%二甲苯混合物50%通过用水稀释这些浓缩物可以产生任何所需浓度的乳剂。
3.粉末ab活性成分 5% 8%滑石 95% -陶土 -92%通过将载体和活性成分均匀混合并在合适的磨中研磨混合物获得可直接施用的粉末。
4.挤压颗粒活性成分10%木素磺化钠 2%羧甲基纤维素1%
陶土 87%将活性成分与佐剂混合,接着用水润湿混合物。挤压混合物,在空气流中干燥。
5.包覆颗粒活性成分 3%聚乙二醇200 3%陶土 94%将充分研磨的活性成分与由聚乙二醇润湿的陶土在混合器中均匀混合。以这种方式获得非粉末包覆颗粒。
6.悬浮浓缩物活性成分 40%乙二醇 10%壬基酚聚乙二醇 6%(15mol环氧乙烷)木素磺化钠 10%羧甲基纤维素 1%37%甲醛水溶液 0.2%硅油(75%含水乳剂) 0.8%水 32%将充分研磨的活性成分与佐剂充分混合,给出悬浮浓缩物,经用水稀释可由此获得任何所需浓度的悬液。
尽管参照其特定的实施方案描述了本发明,但可以预料许多变化、修改和实施方案是可能的。因此,所有这些变化、修改和实施方案应被认为在本发明的精神和范围内。
序列表(1)一般信息(i)申请人(A)姓名CIBA-GEIGY AG(B)街Klybeckstr.141(C)城市Basel(E)国家Switzerland(F)邮区代码(ZIP)4002(G)电话+41 61 69 11 11(H)传真+41 61 696 79 76(I)电报962 991(ii)发明名称合成抗病原体物质的基因(iii)序列数22(iv)计算机可读形式(D)介质类型软盘(E)计算机IBM PC兼容型(F)操作系统PC-DOS/MS-DOS(G)软件PatentIn Release #1.0,Version#1.25(EPO)(2)SEQ ID NO1信息(i)序列特征(A)长度7000个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(vi)原始来源(F)菌株单(ii)特征(I)名称/关键词CDS(J)位置357…2039(K)其它信息/标记=ORF1(ix)特征(I)名称/关键词CDS(J)位置2249…3076(K)其它信息/标记=ORF2(ix)特征(I)名称/关键词CDS(J)位置3166…4869(K)其它信息/标记=ORF3(ix)特征(i)名称/关键词CDS
(J)位置4894…5985(K)其它信息/标记=ORF4(xi)序列描述SEQ ID NO1GAATTCCGAC AACGCCGAAG AAGCGCGGAA CCGCTGAAAG AGGAGCAGGA ACTGGAGCAA 60ACGCTGTCCC AGGTGATCGA CAGCCTGCCA CTGCGCATCG AGGGCCGATG AACAGCATTG 120GCAAAAGCTG GCGGTGCGCA GTGCGCGAGT GATCCGATCA TTTTTGATCG GCTCGCCTCT 180TCAAAATCGG CGGTGGATGA AGTCGACGGC GGACTGATCA GGCGCAAAAG AACATGCGCC 240AAAACCTTCT TTTATAGCGA ATACCTTTGC ACTTCAGAAT GTTAATTCGG AAACGGAATT 300TGCATCGCTT TTCCGGCAGT CTAGAGTCTC TAACAGCACA TTGATGTGCC TCTTGC 356ATG GAT GCA CGA AGA CTG GCG GCC TCC CCT CGT CAC AGG CGG CCC GCC 404Met Asp Ala Arg Arg Leu Ala Ala Ser Pro Arg His Arg Arg Pro Ala1 5 10 15TTT GAC ACA AGG AGT GTT ATG AAC AAG CCG ATC AAG AAT ATC GTC ATC 452Phe Asp Thr Arg Ser Val Met Asn Lys Pro Ile Lys Asn Ile Val Ile20 25 30GTG GGC GGC GGT ACT GCG GGC TGG ATG GCC GCC TCG TAC CTC GTC CGG 500Val Gly Gly Gly Thr Ala Gly Trp Met Ala Ala Ser Tyr Leu Val Arg35 40 45GCC CTC CAA CAG CAG GCG AAC ATT ACG CTC ATC GAA TCT GCG GCG ATC 548Ala Leu Gln Gln Gln Ala Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile50 55 60CCT CGG ATC GGC GTG GGC GAA GCG ACC ATC CCA AGT TTG CAG AAG GTG 596Pro Arg Ile Gly Val Gly Glu Ala Thr Ile Pro Ser Leu Gln Lys Val65 70 75 80TTC TTC GAT TTC CTC GGG ATA CCG GAG CGG GAA TGG ATG CCC CAA GTG 644Phe Phe Asp Phe Leu Gly Ile Pro Glu Arg Glu Trp Met Pro Gln Val85 90 95AAC GGC GCG TTC AAG GCC GCG ATC AAG TTC GTG AAT TGG AGA AAG TCT 692Asn Gly Ala Phe Lys Ala Ala Ile Lys Phe Val Asn Trp Arg Lys Ser100 105 110CCC GAC CCC TCG CGC GAC GAT CAC TTC TAC CAT TTG TTC GGC AAC GTG 740Pro Asp Pro Ser Arg Asp Asp His Phe Tyr His Leu Phe Gly Asn Val
115 120 125CCG AAC TGC GAC GGC GTG CCG CTT ACC CAC TAC TGG CTG CGC AAG CGC 788Pro Asn Cys Asp Gly Val Pro Leu Thr His Tyr Trp Leu Arg Lys Arg130 135 140GAA CAG GGC TTC CAG CAG CCG ATG GAG TAC GCG TGC TAC CCG CAG CCC 836Glu Gln Gly Phe Gln Gln Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro145 150 155 160GGG GCA CTC GAC GGC AAG CTG GCA CCG TGC CTG TCC GAC GGC ACC CGC 884Gly Ala Leu Asp Gly Lys Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg165 170 175CAG ATG TCC CAC GCG TGG CAC TTC GAC GCG CAC CTG GTG GCC GAC TTC 932Gln Met Ser His Ala Trp His Phe Asp Ala His Leu Val Ala Asp Phe180 185 190TTG AAG CGC TGG GCC GTC GAG CGC GGG GTG AAC CGC GTG GTC GAT GAG 980Leu Lys Arg Trp Ala Val Glu Arg Gly Val Asn Arg Val Val Asp Glu195 200 205GTG GTG GAC GTT CGC CTG AAC AAC CGC GGC TAC ATC TCC AAC CTG CTC 1028Val Val Asp Val Arg Leu Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu210 215 220ACC AAG GAG GGG CGG ACG CTG GAG GCG GAC CTG TTC ATC GAC TGC TCC 1076Thr Lys Glu Gly Arg Thr Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser225 230 235240GGC ATG CGG GGG CTC CTG ATC AAT CAG GCG CTG AAG GAA CCC TTC ATC 1124Gly Met Arg Gly Leu Leu Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile245 250 255GAC ATG TCC GAC TAC CTG CTG TGC GAC AGC GCG GTC GCC AGC GCC GTG 1172Asp Met Ser Asp Tyr Leu Leu Cys Asp Ser Ala Val Ala Ser Ala Val260 265 270CCC AAC GAC GAC GCG CGC GAT GGG GTC GAG CCG TAC ACC TCC TCG ATC 1220Pro Asn Asp Asp Ala Arg Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile275 280 285GCC ATG AAC TCG GGA TGG ACC TGG AAG ATT CCG ATG CTG GGC CGG TTC 1268Ala Met Asn Ser Gly Trp Thr Trp Lys Ile Pro Met Leu Gly Arg Phe290 295 300GGC AGC GGC TAC GTC TTC TCG AGC CAT TTC ACC TCG CGC GAC CAG GCC 1316Gly Ser Gly Tyr Val Phe Ser Ser His Phe Thr Ser Arg Asp Gln Ala305 310 315 320ACC GCC GAC TTC CTC AAA CTC TGG GGC CTC TCG GAC AAT CAG CCG CTC 1364Thr Ala Asp Phe Leu Lys Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu325 330 335AAC CAG ATC AAG TTC CGG GTC GGG CGC AAC AAG CGG GCG TGG GTC AAC 1412Asn Gln Ile Lys Phe Arg Val Gly Arg Asn Lys Arg Ala Trp Val Asn340 345 350AAC TGC GTC TCG ATC GGG CTG TCG TCG TGC TTT CTG GAG CCC CTG GAA 1460Asn Cys Val Ser Ile Gly Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu355 360 365TCG ACG GGG ATC TAC TTC ATC TAC GCG GCG CTT TAC CAG CTC GTG AAG 1508Ser Thr Gly Ile Tyr Phe Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys370 375 380CAC TTC CCC GAC ACC TCG TTC GAC CCG CGG CTG AGC GAC GCT TTC AAC 1556His Phe Pro Asp Thr Ser Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn385 390 395 400GCC GAG ATC GTC CAC ATG TTC GAC GAC TGC CGG GAT TTC GTC CAA GCG 1604Ala Glu Ile Val His Met Phe Asp Asp Cys Arg Asp Phe Val Gln Ala405 410 415CAC TAT TTC ACC ACG TCG CGC GAT GAC ACG CCG TTC TGG CTC GCG AAC 1652His Tyr Phe Thr Thr Ser Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn420 425 430CGG CAC GAC CTG CGG CTC TCG GAC GCC ATC AAA GAG AAG GTT CAG CGC 1700Arg His Asp Leu Arg Leu Ser Asp Ala Ile Lys Glu Lys Val Gln Arg435 440 445TAC AAG GCG GGG CTG CCG CTG ACC ACC ACG TCG TTC GAC GAT TCC ACG 1748Tyr Lys Ala Gly Leu Pro Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr450 455 460TAC TAC GAG ACC TTC GAC TAC GAA TTC AAG AAT TTC TGG TTG AAC GGC 1796Tyr Tyr Glu Thr Phe Asp Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly465 470 475 480AAC TAC TAC TGC ATC TTT GCC GGC TTG GGC ATG CTG CCC GAC CGG TCG 1844Asn Tyr Tyr Cys Ile Phe Ala Gly Leu Gly Met Leu Pro Asp Arg Ser485 490 495CTG CCG CTG TTG CAG CAC CGA CCG GAG TCG ATC GAG AAA GCC GAG GCG 1892Leu Pro Leu Leu Gln His Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala500 505 510ATG TTC GCC AGC ATC CGG CGC GAG GCC GAG CGT CTG CGC ACC AGC CTG 1940Met Phe Ala Ser Ile Arg Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu515 520 525CCG ACA AAC TAC GAC TAC CTG CGG TCG CTG CGT GAC GGC GAC GCG GGG 1988Pro Thr Asn Tyr Asp Tyr Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly530 535 540CTG TCG CGC GGC CAG CGT GGG CCG AAG CTC GCA GCG CAG GAA AGC CTG 2036Leu Ser Arg Gly Gln Arg Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu545 550 555 560TAGTGGAACG CACCTTGGAC CGGGTAGGCG TATTCGCGGC CACCCACGCT GCCGTGGCGG 2096CCTGCGATCC GCTGCAGGCG CGCGCGCTCG TTCTGCAACT GCCGGGCCTG AACCGTAACA 2156AGGACGTGCC CGGTATCGTC GGCCTGCTGC GCGAGTTCCT TCCGGTGCGC GGCCTGCCCT 2216GCGGCTGGGG TTTCGTCGAA GCCGCCGCCG CG ATG CGG GAC ATC GGG TTC TTC 2269Met Arg Asp Ile Gly Phe Phe1 5CTG GGG TCG CTC AAG CGC CAC GGA CAT GAG CCC GCG GAG GTG GTG CCC 2317Leu Gly Ser Leu Lys Arg His Gly His Glu Pro Ala Glu Val Val Pro10 15 20GGG CTT GAG CCG GTG CTG CTC GAC CTG GCA CGC GCG ACC AAC CTG CCG 2365Gly Leu Glu Pro Val Leu Leu Asp Leu Ala Arg Ala Thr Asn Leu Pro25 30 35CCG CGC GAG ACG CTC CTG CAT GTG ACG GTC TGG AAC CCC ACG GCG GCC 2413Pro Arg Glu Thr Leu Leu His Val Thr Val Trp Asn Pro Thr Ala Ala40 45 50 55GAC GCG CAG CGC AGC TAC ACC GGG CTG CCC GAC GAA GCG CAC CTG CTC 2461Asp Ala Gln Arg Ser Tyr Thr Gly Leu Pro Asp Glu Ala His Leu Leu60 65 70GAG AGC GTG CGC ATC TCG ATG GCG GCC CTC GAG GCG GCC ATC GCG TTG 2509Glu Ser Val Arg Ile Ser Met Ala Ala Leu Glu Ala Ala Ile Ala Leu75 80 85ACC GTC GAG CTG TTC GAT GTG TCC CTG CGG TCG CCC GAG TTC GCG CAA 2557Thr Val Glu Leu Phe Asp Val Ser Leu Arg Ser Pro Glu Phe Ala Gln90 95 100AGG TGC GAC GAG CTG GAA GCC TAT CTG CAG AAA ATG GTC GAA TCG ATC 2605Arg Cys Asp Glu Leu Glu Ala Tyr Leu Gln Lys Met Val Glu Ser Ile105 110 115GTC TAC GCG TAC CGC TTC ATC TCG CCG CAG GTC TTC TAC GAT GAG CTG 2653Val Tyr Ala Tyr Arg Phe Ile Ser Pro Gln Val Phe Tyr Asp Glu Leu120 125 130 135CGC CCC TTC TAC GAA CCG ATT CGA GTC GGG GGC CAG AGC TAC CTC GGC 2701Arg Pro Phe Tyr Glu Pro Ile Arg Val Gly Gly Gln Ser Tyr Leu Gly140 145 150CCC GGT GCC GTA GAG ATG CCC CTC TTC GTG CTG GAG CAC GTC CTC TGG 2749Pro Gly Ala Val Glu Met Pro Leu Phe Val Leu Glu His Val Leu Trp155 160 165GGC TCG CAA TCG GAC GAC CAA ACT TAT CGA GAA TTC AAA GAG ACG TAC 2797Gly Ser Gln Ser Asp Asp Gln Thr Tyr Arg Glu Phe Lys Glu Thr Tyr170 175 180CTG CCC TAT GTG CTT CCC GCG TAC AGG GCG GTC TAC GCT CGG TTC TCC 2845Leu Pro Tyr Val Leu Pro Ala Tyr Arg Ala Val Tyr Ala Arg Phe Ser185 190 195GGG GAG CCG GCG CTC ATC GAC CGC GCG CTC GAC GAG GCG CGA GCG GTC 2893Gly Glu Pro Ala Leu Ile Asp Arg Ala Leu Asp Glu Ala Arg Ala Val200 205 210 215GGT ACG CGG GAC GAG CAC GTC CGG GCT GGG CTG ACA GCC CTC GAG CGG 2941Gly Thr Arg Asp Glu His Val Arg Ala Gly Leu Thr Ala Leu Glu Arg220 225 230GTC TTC AAG GTC CTG CTG CGC TTC CGG GCG CCT CAC CTC AAA TTG GCG 2989Val Phe Lys Val Leu Leu Arg Phe Arg Ala Pro His Leu Lys Leu Ala235 240 245GAG CGG GCG TAC GAA GTC GGG CAA AGC GGC CCG AAA TCG GCA GCG GGG 3037Glu Arg Ala Tyr Glu Val Gly Gln Ser Gly Pro Lys Ser Ala Ala Gly250 255 260GGT ACG CGC CCA GCA TGC TCG GTG AGC TGC TCA CGC TGACGTATGGC 3083Gly Thr Arg Pro Ala Cys Ser Val Ser Cys Ser Arg265 270 275CGCGCGGTCC CGCGTCCGCG CCGCGCTCGA CGAATCCTGA TGGCGCGCGAC CCAGTGTTAT 3143CTCACAAGGA GAGTTTGCC CC ATG ACT CAG AAG AGC CCC GCG AAC GAA CAC 3195Met Thr Gln Lys Ser Pro Ala Asn Glu His1 5 10GAT AGC AAT CAC TTC GAC GTA ATC ATC CTC GGC TCG GGC ATG TCC GGC 3243Asp Ser Asn His Phe Asp Val Ile Ile Leu Gly Ser Gly Met Ser Gly15 20 25ACC CAG ATG GGG GCC ATC TTG GCC AAA CAA CAG TTT CGC GTG CTG ATC 3291Thr Gln Met Gly Ala Ile Leu Ala Lys Gln Gln Phe Arg Val Leu Ile30 35 40ATC GAG GAG TCG TCG CAC CCG CGG TTC ACG ATC GGC GAA TCG TCG ATC 3339Ile Glu Glu Ser Ser His Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile45 50 55CCC GAG ACG TCT CTT ATG AAC CGC ATC ATC GCT GAT CGC TAC GGC ATT 3387Pro Glu Thr Ser Leu Met Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile60 65 70CCG GAG CTC GAC CAC ATC ACG TCG TTT TAT TCG ACG CAA CGT TAC GTC 3435Pro Glu Leu Asp His Ile Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val75 80 85 90GCG TCG AGC ACG GGC ATT AAG CGC AAC TTC GGC TTC GTG TTC CAC AAG 3483Ala Ser Ser Thr Gly Ile Lys Arg Asn Phe Gly Phe Val Phe His Lys95 100 105CCC GGC CAG GAG CAC GAC CCG AAG GAG TTC ACC CAG TGC GTC ATT CCC 3531Pro Gly Gln Glu His Asp Pro Lys Glu Phe Thr Gln Cys Val Ile Pro
110 115 120GAG CTG CCG TGG GGG CCG GAG AGC CAT TAT TAC CGG CAA GAC GTC GAC 3579Glu Leu Pro Trp Gly Pro Glu Ser His Tyr Tyr Arg Gln Asp Val Asp125 130 135GCC TAC TTG TTG CAA GCC GCC ATT AAA TAC GGC TGC AAG GTC CAC CAG 3627Ala Tyr Leu Leu Gln Ala Ala Ile Lys Tyr Gly Cys Lys Val His Gln140 145 150AAA ACT ACC GTG ACC GAA TAC CAC GCC GAT AAA GAC GGC GTC GCG GTG 3675Lys Thr Thr Val Thr Glu Tyr His Ala Asp Lys Asp Gly Val Ala Val155 160 165 170ACC ACC GCC CAG GGC GAA CGG TTC ACC GGC CGG TAC ATG ATC GAC TGC 3723Thr Thr Ala Gln Gly Glu Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys175 180 185GGA GGA CCT CGC GCG CCG CTC GCG ACC AAG TTC AAG CTC CGC GAA GAA 3771Gly Gly Pro Arg Ala Pro Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu190 195 200CCG TGT CGC TTC AAG ACG CAC TCG CGC AGC CTC TAC ACG CAC ATG CTC 3819Pro Cys Arg Phe Lys Thr His Ser Arg Ser Leu Tyr Thr His Met Leu205 210 215GGG GTC AAG CCG TTC GAC GAC ATC TTC AAG GTC AAG GGG CAG CGC TGG 3867Gly Val Lys Pro Phe Asp Asp Ile Phe Lys Val Lys Gly Gln Arg Trp220 225 230CGC TGG CAC GAG GGG ACC TTG CAC CAC ATG TTC GAG GGC GGC TGG CTC 3915Arg Trp His Glu Gly Thr Leu His His Met Phe Glu Gly Gly Trp Leu235 240 245 250TGG GTG ATT CCG TTC AAC AAC CAC CCG CGG TCG ACC AAC AAC CTG GTG 3963Trp Val Ile Pro Phe Asn Asn His Pro Arg Ser Thr Asn Asn Leu Val255 260 265AGC GTC GGC CTG CAG CTC GAC CCG CGT GTC TAC CCG AAA ACC GAC ATC 4011Ser Val Gly Leu Gln Leu Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile270 275 280TCC GCA CAG CAG GAA TTC GAT GAG TTC CTC GCG CGG TTC CCG AGC ATC 4059Ser Ala Gln Gln Glu Phe Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile285 290 295GGG GCT CAG TTC CGG GAC GCC GTG CCG GTG CGC GAC TGG GTC AAG ACC 4107Gly Ala Gln Phe Arg Asp Ala Val Pro Val Arg Asp Trp Val Lys Thr300 305 310GAC CGC CTG CAA TTC TCG TCG AAC GCC TGC GTC GGC GAC CGC TAC TGC 4155Asp Arg Leu Gln Phe Ser Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys315 320 325 330CTG ATG CTG CAC GCG AAC GGC TTC ATC GAC CCG CTC TTC TCC CGG GGG 4203Leu Met Leu His Ala Asn Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly335 340 345CTG GAA AAC ACC GCG GTG ACC ATC CAC GCG CTC GCG GCG CGC CTC ATC 4251Leu Glu Asn Thr Ala Val Thr Ile His Ala Leu Ala Ala Arg Leu Ile350 355 360AAG GCG CTG CGC GAC GAC GAC TTC TCC CCC GAG CGC TTC GAG TAC ATC 4299Lys Ala Leu Arg Asp Asp Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile365 370 375GAG CGC CTG CAG CAA AAG CTT TTG GAC CAC AAC GAC GAC TTC GTC AGC 4347Glu Arg Leu Gln Gln Lys Leu Leu Asp His Asn Asp Asp Phe Val Ser380 385 390TGC TGC TAC ACG GCG TTC TCG GAC TTC CGC CTA TGG GAC GCG TTC CAC 4395Cys Cys Tyr Thr Ala Phe Ser Asp Phe Arg Leu Trp Asp Ala Phe His395 400 405 410AGG CTG TGG GCG GTC GGC ACC ATC CTC GGG CAG TTC CGG CTC GTG CAG 4443Arg Leu Trp Ala Val Gly Thr Ile Leu Gly Gln Phe Arg Leu Val Gln415 420 425GCC CAC GCG AGG TTC CGC GCG TCG CGC AAC GAG GGC GAC CTC GAT CAC 4491Ala His Ala Arg Phe Arg Ala Ser Arg Asn Glu Gly Asp Leu Asp His430 435 440CTC GAC AAC GAC CCT CCG TAT CTC GGA TAC CTG TGC GCG GAC ATG GAG 4539Leu Asp Asn Asp Pro Pro Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu445 450 455GAG TAC TAC CAG TTG TTC AAC GAC GCC AAA GCC GAG GTC GAG GCC GTG 4587Glu Tyr Tyr Gln Leu Phe Asn Asp Ala Lys Ala Glu Val Glu Ala Val460 465 470AGT GCC GGG CGC AAG CCG GCC GAT GAG GCC GCG GCG CGG ATT CAC GCC 4635Ser Ala Gly Arg Lys Pro Ala Asp Glu Ala Ala Ala Arg Ile His Ala475 480 485 490CTC ATT GAC GAA CGA GAC TTC GCC AAG CCG ATG TTC GGC TTC GGG TAC 4683Leu Ile Asp Glu Arg Asp Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr495 500 505TGC ATC ACC GGG GAC AAG CCG CAG CTC AAC AAC TCG AAG TAC AGC CTG 4731Cys Ile Thr Gly Asp Lys Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu510 515 520CTG CCG GCG ATG CGG CTG ATG TAC TGG ACG CAA ACC CGC GCG CCG GCA 4779Leu Pro Ala Met Arg Leu Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala525 530 535GAG GTG AAA AAG TAC TTC GAC TAC AAC CCG ATG TTC GCG CTG CTC AAG 4827Glu Val Lys Lys Tyr Phe Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys540 545 550GCG TAC ATC ACG ACC CGC ATC GGC CTG GCG CTG AAG AAG TAGCCGCTCG 4876Ala Tyr Ile Thr Thr Arg Ile Gly Leu Ala Leu Lys Lys555 560 565ACGACGACAT AAAAACG ATG AAC GAC ATT CAA TTG GAT CAA GCG AGC GTC 4926Met Asn Asp Ile Gln Leu Asp Gln Ala Ser Val1 5 10AAG AAG CGT CCC TCG GGC GCG TAC GAC GCA ACC ACG CGC CTG GCC GCG 4974Lys Lys Arg Pro Ser Gly Ala Tyr Asp Ala Thr Thr Arg Leu Ala Ala15 20 25AGC TGG TAC GTC GCG ATG CGC TCC AAC GAG CTC AAG GAC AAG CCG ACC 5022Ser Trp Tyr Val Ala Met Arg Ser Asn Glu Leu Lys Asp Lys Pro Thr30 35 40GAG TTG ACG CTC TTC GGC CGT CCG TGC GTG GCG TGG CGC GGA GCC ACG 5070Glu Leu Thr Leu Phe Gly Arg Pro Cys Val Ala Trp Arg Gly Ala Thr45 50 55GGG CGG GCC GTG GTG ATG GAC CGC CAC TGC TCG CAC CTG GGC GCG AAC 5118Gly Arg Ala Val Val Met Asp Arg His Cys Ser His Leu Gly Ala Asn60 65 70 75CTG GCT GAC GGG CGG ATC AAG GAC GGG TGC ATC CAG TGC CCG TTT CAC 5166Leu Ala Asp Gly Arg Ile Lys Asp Gly Cys Ile Gln Cys Pro Phe His80 85 90CAC TGG CGG TAC GAC GAA CAG GGC CAG TGC GTT CAC ATC CCC GGC CAT 5214His Trp Arg Tyr Asp Glu Gln Gly Gln Cys Val His Ile Pro Gly His95 100 105AAC CAG GCG GTGCGC CAG CTG GAG CCG GTG CCG CGC GGG GCG CGT CAG 5262Asn Gln Ala Val Arg Gln Leu Glu Pro Val Pro Arg Gly Ala Arg Gln110 115 120CCG ACG TTG GTC ACC GCC GAG CGA TAC GGC TAC GTG TGG GTC TGG TAC 5310Pro Thr Leu Val Thr Ala Glu Arg Tyr Gly Tyr Val Trp Val Trp Tyr125 130 135GGC TCC CCG CTG CCG CTG CAC CCG CTG CCC GAA ATC TCC GCG GCC GAT 5358Gly Ser Pro Leu Pro Leu His Pro Leu Pro Glu Ile Ser Ala Ala Asp140 145 150 155GTC GAC AAC GGC GAC TTT ATG CAC CTG CAC TTC GCG TTC GAG ACG ACC 5406Val Asp Asn Gly Asp Phe Met His Leu His Phe Ala Phe Glu Thr Thr160 165 170ACG GCG GTC TTG CGG ATC GTC GAG AAC TTC TAC GAC GCG CAG CAC GCA 5454Thr Ala Val Leu Arg Ile Val Glu Asn Phe Tyr Asp Ala Gln His Ala175 180 185ACC CCG GTG CAC GCA CTC CCG ATC TCG GCC TTC GAA CTC AAG CTC TTC 5502Thr Pro Val His Ala Leu Pro Ile Ser Ala Phe Glu Leu Lys Leu Phe190 195 200GAC GAT TGG CGC CAG TGG CCG GAG GTT GAG TCG CTG GCC CTG GCG GGC 5550Asp Asp Trp Arg Gln Trp Pro Glu Val Glu Ser Leu Ala Leu Ala Gly205 210 215GCG TGG TTC GGT GCC GGG ATC GAC TTC ACC GTG GAC CGG TAC TTC GGC 5598Ala Trp Phe Gly Ala Gly Ile Asp Phe Thr Val Asp Arg Tyr Phe Gly220 225 230 235CCC CTC GGC ATG CTG TCA CGC GCG CTC GGC CTG AAC ATG TCG CAG ATG 5646Pro Leu Gly Met Leu Ser Arg Ala Leu Gly Leu Asn Met Ser Gln Met240 245 250AAC CTG CAC TTC GAT GGC TAC CCC GGC GGG TGC GTC ATG ACC GTC GCC 5694Asn Leu His Phe Asp Gly Tyr Pro Gly Gly Cys Val Met Thr Val Ala255 260 265CTG GAC GGA GAC GTC AAA TAC AAG CTG CTC CAG TGT GTG ACG CCG GTG 5742Leu Asp Gly Asp Val Lys Tyr Lys Leu Leu Gln Cys Val Thr Pro Val270 275 280AGC GAA GGC AAG AAC GTC ATG CAC ATG CTC ATC TCG ATC AAG AAG GTG 5790Ser Glu Gly Lys Asn Val Met His Met Leu Ile Ser Ile Lys Lys Val285 290 295GGC GGC ATC CTG CTC CGC GCG ACC GAC TTC GTG CTG TTC GGG CTG CAG 5838Gly Gly Ile Leu Leu Arg Ala Thr Asp Phe Val Leu Phe Gly Leu Gln300 305 310 315ACC AGG CAG GCC GCG GGG TAC GAC GTC AAA ATC TGG AAC GGA ATG AAG 5886Thr Arg Gln Ala Ala Gly Tyr Asp Val Lys Ile Trp Asn Gly Met Lys320 325 330CCG GAC GGC GGC GGC GCG TAC AGC AAG TAC GAC AAG CTC GTG CTC AAG 5934Pro Asp Gly Gly Gly Ala Tyr Ser Lys Tyr Asp Lys Leu Val Leu Lys335 340 345TAC CGG GCG TTC TAT CGA GGC TGG GTC GAC CGC GTC GCA AGT GAG CGG 5982Tyr Arg Ala Phe Tyr Arg Gly Trp Val Asp Arg Val Ala Ser Glu Arg350 355 360TGATGCGTGA AGCCGAGCCG CTCTCGACCG CGTCGCTGCG CCAGGCGCTC GCGAACCTGG 6042CGAGCGGCGT GACGATCACG GCCTACGGCG CGCCGGGCCC GCTTGGGCTC GCGGCCACCA 6102GCTTCGTGTC GGAGTCGCTC TTTGCGAGGT ATTCATGACT ATCTGGCTGT TGCAACTCGT 6162GCTGGTAGTC GCGCTCTGCA ACGTCTGCGG CCGCATTGCC GAACGGCTCG GCCAGTGCGC 6222GGTCATCGGC GAGATCGCGG CCGGTTTGCT GTTGGGGCCG TCGCTGTTCG GCGTGATCGC 6282ACCGAGTTTC TACGACCTGT TGTTCGGCCC CCAGGTGCTG TCAGCGATGG CGCAAGTCAG 6342CGAAGTCGGC CTGGTACTGC TGATGTTCCA GGTCGGCCTG CATATGGAGT TGGGCGAGAC 6402GCTGCGCGAC AAGCGCTGGC GCATGCCCGT CGCGATCGCA GCGGGCGGGC TCGTCGCACC 6462GGCCGCGATC GGCATGATCG TCGCCATCGT TTCGAAAGGC ACGCTCGCCA GCGACGCGCC 6522GGCGCTGCCC TATGTGCTCT TCTGCGGTGT CGCACTTGCG GTATCGGCGG TGCCGGTGAT 6582GGCGCGCATC ATCGACGACC TGGACCTCAG CGCCATGGTG GGCGCGCGGC ACGCAATGTC 6642TGCCGCGATG CTGACGGATG CGCTCGGATG GATGCTGCTT GCAACGATTG CCTCGCTATC 6702GAGCGGGCCC GGCTGGGCAT TTGCGCGCAT GCTCGTCAGC CTGCTCGCGT ATCTGGTGCT 6762GTGCGCGCTG CTGGTGCGCT TCGTGGTTCG ACCGACCCTT GCGCGGCTCG CGTCGACCGC 6822GCATGCGACG CGCGACCGCT TGGCCGTGTT GTTCTGCTTC GTAATGTTGT CGGCACTCGC 6882GACGTCGCTG ATCGGATTCC ATAGCGCTTT TGGCGCACTT GCCGCGGCGC TGTTCGTGCG 6942CCGGGTGCCC GGCGTCGCGA AGGAGTGGCG CGACAACGTC GAAGGTTTCG TCAAGCTT 7000(2)SEQ ID NO2信息(i)序列特征(A)长度560个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Asp Ala Arg Arg Leu Ala Ala Ser Pro Arg His Arg Arg Pro Ala1 5 10 15Phe Asp Thr Arg Ser Val Met Asn Lys Pro Ile Lys Asn Ile Val Ile20 25 30Val Gly Gly Gly Thr Ala Gly Trp Met Ala Ala Ser Tyr Leu Val Arg35 40 45Ala Leu Gln Gln Gln Ala Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile50 55 60Pro Arg Ile Gly Val Gly Glu Ala Thr Ile Pro Ser Leu Gln Lys Val65 70 75 80Phe Phe Asp Phe Leu Gly Ile Pro Glu Arg Glu Trp Met Pro Gln Val85 90 95Asn Gly Ala Phe Lys Ala Ala Ile Lys Phe Val Asn Trp Arg Lys Ser100 105 110Pro Asp Pro Ser Arg Asp Asp His Phe Tyr His Leu Phe Gly Asn Val115 120 125Pro Asn Cys Asp Gly Val Pro Leu Thr His Tyr Trp Leu Arg Lys Arg130 135 140Glu Gln Gly Phe Gln Gln Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro145 150 155 160Gly Ala Leu Asp Gly Lys Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg165 170 175Gln Met Ser His Ala Trp His Phe Asp Ala His Leu Val Ala Asp Phe180 185 190Leu Lys Arg Trp Ala Val Glu Arg Gly Val Asn Arg Val Val Asp Glu195 200 205Val Val Asp Val Arg Leu Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu210 215 220Thr Lys Glu Gly Arg Thr Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser225 230 235 240Gly Met Arg Gly Leu Leu Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile245 250 255Asp Met Ser Asp Tyr Leu Leu Cys Asp Ser Ala Val Ala Ser Ala Val260 265 270Pro Asn Asp Asp Ala Arg Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile275 280 285Ala Met Asn Ser Gly Trp Thr Trp Lys Ile Pro Met Leu Gly Arg Phe290 295 300Gly Ser Gly Tyr Val Phe Ser Ser His Phe Thr Ser Arg Asp Gln Ala305 310 315 320Thr Ala Asp Phe Leu Lys Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu325 330 335Asn Gln Ile Lys Phe Arg Val Gly Arg Asn Lys Arg Ala Trp Val Asn340 345 350Asn Cys Val Ser Ile Gly Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu355 360 365Ser Thr Gly Ile Tyr Phe Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys370 375 380His Phe Pro Asp Thr Ser Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn385 390 395 400Ala Glu Ile Val His Met Phe Asp Asp Cys Arg Asp Phe Val Gln Ala405 410 415His Tyr Phe Thr Thr Ser Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn420 425 430Arg His Asp Leu Arg Leu Ser Asp Ala Ile Lys Glu Lys Val Gln Arg435 440 445Tyr Lys Ala Gly Leu Pro Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr450 455 460Tyr Tyr Glu Thr Phe Asp Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly465 470 475 480Asn Tyr Tyr Cys Ile Phe Ala Gly Leu Gly Met Leu Pro Asp Arg Ser485 490 495Leu Pro Leu Leu Gln His Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala500 505 510Met Phe Ala Ser Ile Arg Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu515 520 525Pro Thr Asn Tyr Asp Tyr Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly530 535 540Leu Ser Arg Gly Gln Arg Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu545 550 555 560(2)SEQ ID NO3信息(i)序列特征(A)长度275个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO3Met Arg Asp Ile Gly Phe Phe Leu Gly Ser Leu Lys Arg His Gly His1 5 10 15Glu Pro Ala Glu Val Val Pro Gly Leu Glu Pro Val Leu Leu Asp Leu20 25 30Ala Arg Ala Thr Asn Leu Pro Pro Arg Glu Thr Leu Leu His Val Thr35 40 45Val Trp Asn Pro Thr Ala Ala Asp Ala Gln Arg Ser Tyr Thr Gly Leu50 55 60Pro Asp Glu Ala His Leu Leu Glu Ser Val Arg Ile Ser Met Ala Ala65 70 75 80Leu Glu Ala Ala Ile Ala Leu Thr Val Glu Leu Phe Asp Val Ser Leu
85 90 95Arg Ser Pro Glu Phe Ala Gln Arg Cys Asp Glu Leu Glu Ala Tyr Leu100 105 110Gln Lys Met Val Glu Ser Ile Val Tyr Ala Tyr Arg Phe Ile Ser Pro115 120 125Gln Val Phe Tyr Asp Glu Leu Arg Pro Phe Tyr Glu Pro Ile Arg Val130 135 140Gly Gly Gln Ser Tyr Leu Gly Pro Gly Ala Val Glu Met Pro Leu Phe145 150 155 160Val Leu Glu His Val Leu Trp Gly Ser Gln Ser Asp Asp Gln Thr Tyr165 170 175Arg Glu Phe Lys Glu Thr Tyr Leu Pro Tyr Val Leu Pro Ala Tyr Arg180 185 190Ala Val Tyr Ala Arg Phe Ser Gly Glu Pro Ala Leu Ile Asp Arg Ala195 200 205Leu Asp Glu Ala Arg Ala Val Gly Thr Arg Asp Glu His Val Arg Ala210 215 220Gly Leu Thr Ala Leu Glu Arg Val Phe Lys Val Leu Leu Arg Phe Arg225 230 235 240Ala Pro His Leu Lys Leu Ala Glu Arg Ala Tyr Glu Val Gly Gln Ser245 250 255Gly Pro Lys Ser Ala Ala Gly Gly Thr Arg Pro Ala Cys Ser Val Ser260 265 270Cys Ser Arg275(2)SEQ ID NO4信息(i)序列特征(A)长度567个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp1 5 10 15Val Ile Ile Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala Ile20 25 30Leu Ala Lys Gln Gln Phe Arg Val Leu Ile Ile Glu Glu Ser Ser His35 40 45Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile Pro Glu Thr Ser Leu Met50 55 60Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile Pro Glu Leu Asp His Ile65 70 75 80Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly Ile85 90 95Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp100 105 110Pro Lys Glu Phe Thr Gln Cys Val Ile Pro Glu Leu Pro Trp Gly Pro115 120 125Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala130 135 140Ala Ile Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu145 150 155 160Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu165 170 175Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys Gly Gly Pro Arg Ala Pro180 185 190Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr195 200 205His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp210 215 220Asp Ile Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr225 230 235 240Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val Ile Pro Phe Asn245 250 255Asn His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu260 265 270Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile Ser Ala Gln Gln Glu Phe275 280 285Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile Gly Ala Gln Phe Arg Asp290 295 300Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser305 310 315 320Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn325 330 335Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val340 345 350Thr Ile His Ala Leu Ala Ala Arg Leu Ile Lys Ala Leu Arg Asp Asp355 360 365Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile Glu Arg Leu Gln Gln Lys370 375 380Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe385 390 395 400Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly405 410 415Thr Ile Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg420 425 430Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro435 440 445Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe450 455 460Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro465 470 475 480Ala Asp Glu Ala Ala Ala Arg Ile His Ala Leu Ile Asp Glu Arg Asp485 490 495Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys Ile Thr Gly Asp Lys500 505 510Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu515 520 525Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe530 535 540Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr Ile Thr Thr Arg545 550 555 560Ile Gly Leu Ala Leu Lys Lys565(2)SEQ ID NO5信息(i)序列特征(A)长度363个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO5Met Asn Asp Ile Gln Leu Asp Gln Ala Ser Val Lys Lys Arg Pro Ser1 5 10 15Gly Ala Tyr Asp Ala Thr Thr Arg Leu Ala Ala Ser Trp Tyr Val Ala20 25 30Met Arg Ser Asn Glu Leu Lys Asp Lys Pro Thr Glu Leu Thr Leu Phe35 40 45Gly Arg Pro Cys Val Ala Trp Arg Gly Ala Thr Gly Arg Ala Val Val50 55 60Met Asp Arg His Cys Ser His Leu Gly Ala Asn Leu Ala Asp Gly Arg65 70 75 80Ile Lys Asp Gly Cys Ile Gln Cys Pro Phe His His Trp Arg Tyr Asp85 90 95Glu Gln Gly Gln Cys Val His Ile Pro Gly His Asn Gln Ala Val Arg100 105 110Gln Leu Glu Pro Val Pro Arg Gly Ala Arg Gln Pro Thr Leu Val Thr115 120 125Ala Glu Arg Tyr Gly Tyr Val Trp Val Trp Tyr Gly Ser Pro Leu Pro130 135 140Leu His Pro Leu Pro Glu Ile Ser Ala Ala Asp Val Asp Asn Gly Asp145 150 155 160Phe Met His Leu His Phe Ala Phe Glu Thr Thr Thr Ala Val Leu Arg165 170 175Ile Val Glu Asn Phe Tyr Asp Ala Gln His Ala Thr Pro Val His Ala180 185 190Leu Pro Ile Ser Ala Phe Glu Leu Lys Leu Phe Asp Asp Trp Arg Gln195 200 205Trp Pro Glu Val Glu Ser Leu Ala Leu Ala Gly Ala Trp Phe Gly Ala210 215 220Gly Ile Asp Phe Thr Val Asp Arg Tyr Phe Gly Pro Leu Gly Met Leu225 230 235 240Ser Arg Ala Leu Gly Leu Asn Met Ser Gln Met Asn Leu His Phe Asp245 250 255Gly Tyr Pro Gly Gly Cys Val Met Thr Val Ala Leu Asp Gly Asp Val260 265 270Lys Tyr Lys Leu Leu Gln Cys Val Thr Pro Val Ser Glu Gly Lys Asn275 280 285Val Met His Met Leu Ile Ser Ile Lys Lys Val Gly Gly Ile Leu Leu290 295 300Arg Ala Thr Asp Phe Val Leu Phe Gly Leu Gln Thr Arg Gln Ala Ala305 310 315 320Gly Tyr Asp Val Lys Ile Trp Asn Gly Met Lys Pro Asp Gly Gly Gly325 330 335Ala Tyr Ser Lys Tyr Asp Lys Leu Val Leu Lys Tyr Arg Ala Phe Tyr340 345 350Arg Gly Trp Val Asp Arg Val Ala Ser Glu Arg355 360(2)SEQ ID NO6信息(i)序列特征(A)长度28958个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(xi)序列描述SEQ ID NO6CGATCGCGTC GGCCTCGACA CCGTCGAAGA GGTCACGCTC GAAGCTCCCC TOGCTCTCCC60CTCTCAAGGC ACCATTCTCA TCCAGGTCTC CGTCGGACCC ATGGACGAGG CGGGACGAAG 120GTCGCTCTCC CTCCATGGCC GGACCGAGGA CGCTCCTCAG GACGCCCCTT GGACGCGCCA 180CGCGAGCGGG TCGCTCGCTA AAGCTGCCCC CTCCCTCTCC TTCGATCTTC ACGAATGGGC 240TCCTCCGGGG GGCACGCCGG TGGACACCCA AGGCTCTTAC GCAGGCCTCG AAAGCGGGGG 300GCTCGCCTAT GGGCCTCAGT TCCAGGGACT TCGCTCCGTC TGGAAGCGCG GCGACGAGCT 360CTTCGCCGAG GCCAAGCTCC CGGACGCAGG CGCCAAGGAT GCCGCTCGGT TCGCCCTCCA 420CCCCGCCCTG TTCGACAGCG CCCTGCACGC GCTTGTCCTT GAAGACGAGC GGACGCCGGG 480CGTCGCTCTG CCCTTCTCGT GGAGAGGAGT CTCGCTGCGC TCCGTCGGCG CCACCACCCT 540GCGCGTGCGC TTCCATCGTC CGAATGGCAA GTCCTCCGTG TCGCTCCTCC TCGGCGACGC 600CGCAGGCGAG CCCCTCGCCT CGGTCCAAGC GCTCGCCACG CGCATCACGT CCCAGGAGCA660GCTCCGCACC CAGGGAGCTT CCCTCCACGA TGCTCTCTTC CGGGTTGTCT GGAGAGATCT720GCCCAGCCCT ACGTCGCTCT CTGAGGCCCC GAAGGGTGTC CTCCTAGAGA CAGGGGGTCT780CGACCTCGCG CTGCAGGCGT CTCTCGCCCG CTACGACGGT CTCGCTGCCC TCCGGAGCGC840GCTCGACCAA GGCGCTTCGC CTCCGGGCCT CGTCGTCGTC CCCTTCATCG ATTCGCCCTC900TGGCGACCTC ATAGAGAGCG CTCACAACTC CACCGCGCGC GCCCTCGCCT TGCTGCAAGC960GTGGCTTGAC GACGAACGCC TCGCCTCCTC GCGCCTCGTC CTGCTCACCC GACAGGCCAT 1020CGCAACCCAC CCCGACGAGG ACGTCCTCGA CCTCCCTCAC GCTCCTCTCT GGGGCCTTGT 1080GCGCACCGCG CAAAGCGAAC ACCCGGAGCT CCCTCTCTTC CTCGTCGACC TGGACCTCGG 1140TCAGGCCTCG GAGCGCGCCC TGCTCGGCGC GCTCGACACA GGAGAGCGTC AGCTCGCTCT 1200CCGCCATGGA AAATGCCTCG TCCCGAGGTT GGTGAATGCA CGCTCGACAG AGGCGCTCAT 1260CGCGCCGAAC GTATCCACGT GGAGCCTTCA TATCCCGACC AAAGGCACCT TCGACTCGCT 1320CGCCCTCGTC GACGCTCCTC TAGCCCGTGC GCCCCTCGCA CAAGGCCAAG TCCGCGTCGC 1380CGTGCACGCG GCAGGTCTCA ACTTCCGCGA TGTCCTCAAC ACCCTTGGCA TGCTTCCGGA 1440CAACGCGGGG CCGCTCGGCG GCGAAGGCGC GGGCATTGTC ACCGAAGTCG GCCCAGGTGT 1500TTCCCGATAC ACTGTAGGCG ACCGGGTGAT GGGCATCTTC CGCGGAGGCT TTGGCCCCAC 1560GGTCGTCGCC GACGCCCGCA TGATCTGCCC CATCCCCGAT GCCTGGTCCT TCGTCCAAGC 1620CGCCAGCGTC CCCGTCGTCT TTCTCACCGC CTACTATGGA CTCGTCGATG TCGGGCATCT 1680CAAGCCCAAT CAACGTGTCC TCATCCATGC GGCCGCAGGC GGCGTCGGTA CTGCCGCCGT 1740CCAGCTCGCG CGCCACCTCG GCGCCGAAGT CTTCGCCACC GCCAGTCCAG GGAAGTGGGA 1800CGCTCTGCGC GCGCTCGGCT TCGACGATGC GCACCTCGCG TCCTCACGTG ACCTGGAATT 1860CGAGCAGCAT TTCCTGCGCT CCACACGAGG GCGCGGCATG GATGTCGTCC TCAACGCCTT 1920GGCGCGCGAG TTCGTCGACG CTTCGCTGCG TCTCCTGCCG AGCGGTGGAA GCTTTGTCGA 1980GATGGGCAAG ACGGATATCC GCGAGCCCGA CGCCGTAGGC CTCGCCTACC CCGGCGTCGT 2040TTACCGCGCC TTCGATCTCT TGGAGGCTGG ACCGGATCGA ATTCAAGAGA TGCTCGCAGA 2100GCTGCTCGAC CTGTTCGAGC GCGGCGTGCT TCGTCCGCCG CCCATCACGT CCTGGGACAT 2160CCGGCATGCC CCCCAGGCGT TCCGCGCGCT CGCTCAGGCG CGGCATATTG GAAAGTTCGT 2220CCTCACCGTT CCCGTCCCAT CGATCCCCGA AGGCACCATC CTCGTCACGG GAGGCACCGG 2280CACGCTCGGC GCGCTCATCG CGCGCCACCT CGTCGCCAAT CGCGGCGACA AGCACCTGCT 2340CCTCACCTCG CGAAAGGGTG CGAGCGCTCC GGGGGCCGAG GCATTGCGGA GCGAGCTCGA 2400AGCTCTGGGG GCTGCGGTCA CGCTCGCCCG GTGCGACGCG GCCGATCCAC GCGCGCTCCA 2460AGCCCTCTTG GACAGCATCC CGAGCGCTCA CCCGCTCACG GCCGTCGTGC ACGCCGCCGG 2520CGCCCTTGAC GATGGGCTGA TCAGCGACAT GAGCCCCGAG CGCATCGACC GCGTCTTTGC 2580TCCCAAGCTC GACGCCGCTT GGCACTTGCA TCAGCTCACC CAGGACAAGG CCGCTCGGGG 2640CTTCGTCCTC TTCTCGTCCG CCTCCGGCGT CCTCGGCGGT ATGGGTCAAT CCAACTACGC 2700GGGGGGCAAT GCGTTCCTTG ACGCGCTCGC GCATCACCGA CGCGTCCATG GGCTCCCAGG 2760CTCCTCGCTC GCATGGGGCC ATTGGGCCGA GCGCAGCGGA ATGACCCGAC AACCTCAGCG 2820GCGTCGATAC CGCTCGCATG AGGCGCGCGG TCTCCGATCC ATCGCCTCGG ACGAGGGTCT 2880CGCCCTCTTC GATATGGCGC TCGGGCGCCC GGAGCCCGCG CTGGTCCCCG CCCGCTTCGA 2940CATGAACGCG CTCGGCGCGA AGGCCGACGG GCTACCCTCG ATGTTCCAGG GTCTCGTCCG 3000CGCTCGCGTC GCGCGCAAGG TCGCCAGCAA TAATGCCCTG GCCGCGTCGC TCACCCAGCG 3060CCTCGCCTCC CTCCCGCCCT CCGACCGCGA GCGCATGCTG CTCGATCTCG TCCGCGCCGA 3120AGCCGCCATC GTCCTCGGCC TCGCCTCGTT CGAATCGCTC GATCCCCGTC GCCCTCTTCA 3180AGAGCTCGGT CTCGATTCCC TCATGGCCAT CGAGCTCCGA AATCGACTCG CCGCCGCCAC 3240AGGCTTGCGA CTCCAAGCCA CCCTCCTCTT CGACCACCCG ACGCCCGCCG CGCTCGCGAC 3300CCTGCTGCTC GGGAAGCTCC TCCAGCATGA AGCTGCCGAT CCTCGCCCCT TGGCCGCAGA 3360GCTCGACAGG CTAGAGGCCA CTCTCTCCGC GATAGCCGTG GACGCTCAAG CACGCCCGAA 3420GATCATATTA CGCCTGCAAT CCTGGTTGTC GAAGTGGAGC GACGCTCAGG CTGCCGACGC 3480TGGACCGATT CTCGGCAAGG ATTTCAAGTC TGCTACGAAG GAAGAGCTCT TCGCTGCTTG 3540TGACGAAGCG TTCGGAGGCC TGGGTAAATG AATAACGACG AGAAGCTTGT CTCCTACCTA 3600CAGCAGGCGA TGAATGAGCT TCAGCGTGCT CATCAGCCCC TCCGCGCGGT CGAAGAGAAG 3660GAGCACGAGC CCATCGCCAT CGTGGCGATG AGCTGCCGCT TCCCGGGCGA CGTGCGCACG 3720CCCGAGGATC TCTGGAAGCT CTTGCTCGAT GGGAAAGATG CTATCTCCGA CCTTCCCCCA 3780AACCGTGGTT GGAAGCTCGA CGCGCTCGAC GTCCACGGTC GCTCCCCAGT CCGAGAGGGA 3840GGCTTCTTCT ACGACGCAGA CGCCTTCGAT CCGGCCTTCT TCGGGATCAG CCCACGCGAG 3900GCGCTCGCCA TCGATCCCCA GCAGCGGCTC CTCCTCGAGA TCTCATGGGA AGCCTTCGAG 3960CGTGCGGGCA TCGACCCTGC CTCGCTCCAA GGGAGCCAAA GCGGCGTCTT CGTCGGCGTG 4020ATACACAACG ACTACGACGC ATTGCTGGAG AACGCAGCTG GCGAACACAA AGGATTCGTT 4080TCCACCGGCA GCACAGCGAG CGTCGCCTCC GGCCGGATCG CGTATACATT CGGCTTTCAA 4140GGGCCCGCCA TCAGCGTGGA CACGGCGTGC AGCTCCTCGC TCGTCGCGGT TCACCTCGCC 4200TGCCAGGCCC TGCGCCGTGG CGAATGCTCC CTGGCGCTCG CCGGCGGCGT GACCGTCATG 4260GCCACGCCAG CAGTCTTCGT CGCGTTCGAT TCCGAGAGCG CGGGCGCCCC CGATGGTCGC 4320TGCAAGTCGT TCTCGGTGGA GGCCAACGGT TCGGGCTGGG CCGAGGGCGC CGGGATGCTC 4380CTGCTCGAGC GCCTCTCCGA TGCCGTCCAA AACGGTCATC CCGTCCTCGC CGTCCTTCGA 4440GGCTCCGCCG TCAACCAGGA CGGCCGGAGC CAAGGCCTCA CCGCGCCCAA TGGCCCTGCC 4500CAAGAGCGCG TCATCCGGCA AGCGCTCGAC AGCGCGCGGC TCACTCCAAA GGACGTCGAC 4560GTCGTCGAGG CTCACGGCAC GGGAACCACC CTCGGAGACC CCATCGAGGC ACAGGCCATT 4620CTTGCCACCT ATGGCGAGGC CCATTCCCAA GACAGACCCC TCTGGCTTGG AAGTCTCAAG 4680TCCAACCTGG GACATGCTCA GGCCGCGGCC GGCGTGGGAA GCGTCATCAA GATGGTGCTC 4740GCGTTGCAGC AAGGCCTCTT GCCCAAGACC CTCCATGCCC AGAATCCCTC CCCCCACATC 4800GACTGGTCTC CGGGCACGGT AAAGCTCCTG AACGAGCCCG TCGTCTGGAC GACCAACGGG 4860CATCCTCGCC ACGCCGGCGT CTCCGCCTTC GGCATCTCCG GCACCAACGC CCACGTCATC 4920CTCGAAGAGG CCCCCGCCAT CGCCCGGGTC GAGCCCGCAG CGTCACAGCC CGCGTCCGAG 4980CCGCTTCCCG CAGCGTGGCC CGTGCTCCTG TCGGCCAAGA GCGAGGCGGC CGTGCGCGCC 5040CAGGCAAAGC GGCTCCGCGA CCACCTCCTC GCCAAAAGCG AGCTCGCCCT CGCCGATGTG 5100GCCTATTCGC TCGCGACCAC GCGCGCCCAC TTCGAGCAGC GCGCCGCTCT CCTCGTCAAA 5160GGCCGCGACG AGCTCCTCTC CGCCCTCGAT GCGCTGGCCC AAGGACATTC CGCCGCCGTG 5220CTCGGACGAA GCGGGGCCCC AGGAAAGCTC GCCGTCCTCT TCACGGGGCA AGGAAGCCAG 5280CGGCCCACCA TGGGCCGCGG CCTCTACGAC GTTTTCCCCC TCTTCCGGGA CGCCCTCGAC 5340ACCGTCGGCG CCCACCTCGA CCGCGAGCTC GACCGCCCCC TGCGCGACGT CCTCTTCGCT 5400CCCGACGGCT CCGAGCAGGC CGCGCGCCTC GAGCAAACCG CCTTCACCCA GCCGGCCCTG 5460TTTGCCCTCG AAGTCGCCCT CTTTCAGCTT CTACAATCCT TCGGTCTGAA GCCCGCTCTC 5520CTCCTCGGAC ACTCCATTGG CGAGCTCGTC GCCGCCCACG TCGCCGCCGT CCTTTCTCTC 5580CAGGACGGCT GCACCCTCGT CGCCGCCCGC GCAAAGCTCA TGCAAGCGCT CCCACAAGGC 5640GGCGCCATGG TCACCCTCCG AGCCTCCGAG GAGGAAGTCC GCGACCTTCT CCAGCCCTAC 5700GAAGGCCGAG CTAGCCTCGC CGCCCTCAAT GGGCCTCTCT CCACCGTCGT CGCTGGCGAT 5760GAAGACGCGG TGGTGGAGAT CGCCCGCCAG GCCGAAGCCC TCGGACGAAA GACCACACGC 5820CTGCGCGTCA GCCACGCCTT CCATTCCCCG CACATGGACG GAATGCTCGA CGACTTCCGC 5880CGCGTCGCCC AGAGCCTCAC CTACCATCCC GCACGCATCC CCATCATCTC CAACGTCACC 5940GGCGCGCGCG CCACGGACCA CGAGCTCGCC TCGCCCGACT ACTGGGTCCG CCACGTTCGC 6000CACACCGTCC GCTTCCTCGA CGGCGTACGT GCCCTTCACG CCGAAGGGGC ACGTGTCTTT 6060CTCGAGCTCG GGCCTCACGC TGTCCTCTCC GCCCTTGCGC AAGACGCCCT CGGACAGGAC 6120GAAGGCACGT CGCCATGCGC CTTCCTTCCC ACCCTCCGCA AGGGACGCGA CGACGCCGAG 6180GCGTTCACCG CCGCGCTCGG CGCTCTCCAC TCCGCAGGCA TCACACCCGA CTGGAGCGCT 6240TTCTTCGCCC CCTTCGCTCC ACGCAAGGTC TCCCTCCCCA CCTATGCCTT CCAGCGCGAG 6300CGCTTCTGGC CCGACGCCTC CAAGGCACCC GGCGCCGACG TCAGCCACCT TGCTCCGCTC 6360GAGGGGGGGC TCTGGCAAGC CATCGAGCGC GGGGACCTCG ATGCGCTCAG CGGTCAGCTC 6420CACGTGGACG GCGACGAGCG GCGCGCCGCG CTCGCCCTGC TCCTTCCCAC CCTCTCGAGC 6480TTTCGCCACG AGCGGCAAGA GCAGAGCACG GTCGACGCCT GGCGCTACCG TATCACCTGG 6540AAGCCTCTGA CCACCGCCGA AACACCCGCC GACCTCGCCG GCACCTGGCT CGTCGTCGTG 6600CCGGCCGCTC TGGACGACGA CGCGCTCCCC TCCGCGCTCA CCGAGGCGCT CACCCGGCGC 6660GGCGCGCGCG TCCTCGCCTT GCGCCTGAGC CAGGCCCACC TGGACCGCGA GGCTCTCGCC 6720GAGCATCTGC GCCAGGCTTG CGCCGAGACC GCCCCGATTC GCGGCGTGCT CTCGCTCCTC 6780GCCCTCGACG AGCGCCCCCT CGCAGACCGT CCTGCCCTGC CCGCCGGACT CGCCCTCTCG 6840CTTTCTCTCG CTCAAGCCCT CGGCGACCTC GACCTCGAGG CGCCCTTGTG GTTCTTCACG 6900CGCGGCGCCG TCTCCATTGG ACACTCTGAC CCCCTCGCCC ATCCCGCCCA GGCCATGACC 6960TGGGGCTTGG GCCGCGTCAT CGGCCTCGAG CACCCCGACC GGTGGGGAGG TCTCGTCGAC 7020GTCTGCGCTG GGGTCGACGA GAGCGCCGTG GGCCGCTTGC TGCCGGCCCT CGCCGAGCGC 7080CACGACGAAG ACCAGCTCGC TCTCCGCCCG GCCGGACTCT ACGCTCGCCG CATCGTCCGC 7140GCCCCGCTCG GCGATGCGCC TCCCGCGCGC GACTTCACGC CCGGAGGCAC CATTCTCATC 7200ACCGGCGGCA CCGGCGCCAT TGGCGCTCAC GTCGCCCGAT GGCTCGCTCG AAGAGGCGCT 7260CAGCACCTCG TCCTCATCAG CCGCCGAGGC GCCGAGGCCC CTGGCGCCTC GGAGCTCCAC 7320GACGAGCTCT CGGCCCTCGG CGCGCGCACC ACCCTCGCCG CGTGCGATGT CGCCGACCGG 7380AATGCTGTCG CCACGCTTCT TGAGCAGCTC GACGCCGAAG GGTCGCAGGT CCGCGCCGTG 7440TTCCACGCGA GCGGCATCGA ACACCACGCT CCGCTCGACG CCACCTCTTT CAGGGATCTC 7500GCCGAGGTTG TCTCCGGCAA GGTCGAAGGT GCAAAGCACC TCCACGACCT GCTCGGCTCT 7560CGACCCCTCG ACGCCTTTGT TCTCTTTTCG TCCGGCGCGG CCGTCTGGGG CGGCGGACAG 7620CAAGGCGGCT ACGCGGCCGC AAACGCCTTC CTCGACGCCC TTGCCGAGCA TCGGCGCAGC 7680GCTGGATTGA CAGCGACGTC GGTGGCCTGG GGCGCGTGGG GCGGCGGCGG CATGGCCACC 7740GATCAGGCGG CAGCCCACCT CCAACAGCGC GGTCTGTCGC GGATGGCCCC CTCGCTTGCC 7800CTGGCGGCGC TCGCGCTGGC TCTGGAGCAC GACGAGACCA CCGTCACCGT CGCCGACATC 7860GACTGGGCGC GCTTTGCGCC TTCGTTCAGC GCCGCTCGCC CCCGCCCGCT CCTGCGCGAT 7920TTGCCCGAGG CGCAGCGCGC TCTCGAGACC AGCGAAGGCG CGTCCTCCGA GCATGGCCCG 7980GCCCCCGACC TCCTCGACAA GCTCCGGAGC CGCTCGGAGA GCGAGCAGCT TCGTCTGCTC 8040GTCTCGCTGG TGCGCGACGA GACGGCCCTC GTCCTCGGCC ACGAAGGCGC CTCCCATGTC 8100GACCCCGACA AGGGCTTCCT CGATCTCGGT CTCGATTCGC TCATGGCCGT CGAGCTTCGC 8160CGGCGCTTGC AACAGGCCAC CGGCATCAAG CTCCCGGCCA CCCTCGCCTT CGACCATCCC 8220TCTCCTCATC GAGTCGCGCT CTTCTTGCGC GACTCGCTCG CCCACGCCCT CGGCACGAGG 8280CTCTCCGTCG AGCCCGACGC CGCCGCGCTC CCGGCGCTTC GCGCCGCGAC CGACGAGCCC 8340ATCGCCATCG TCGGCATGGC CCTCCGCCTG CCGGGCGGCG TCGGCGATGT CGACGCTCTT 8400TGGGAGTTCC TGGCCCAGGG ACGCGACGGC GTCGAGCCCA TTCCAAAGGC CCGATGGGAT 8460GCCGCTGCGC TCTACGACCC CGACCCCGAC GCCAAGACCA AGAGCTTCGT CCGGCATGCC 8520GCCATGCTCG ACCAGGTCGA CCTCTTCGAC CCTGCCTTCT TTGGCATCAG CCCCCGGGAG 8580GCCAAACACC TCGACCCCCA GCACCGCCTG CTCCTCGAAT CTGCCTGGCA GGCCCTCGAA 8640GACGCCGGCA TCGTCCCCCC CACCCTCAAG GATTCCCCCA CCGGCGTCTT CGTCGGCATC 8700GGCGCCAGCG AATACGCATT GCGAGAGGCG ATTCCGACGC ATTCCGACGC TTATGCCCTC 8760CAAGGCACCG CCGGGTCCTT TGCCGCGGGG CGCTTGGCCT ACACGCTCGG CCTGCAAGGG 8820CCCGCGCTCT CGGTCGACAC CGCCTGCTCC TCCTCGCTCG TCGCCCTCCA CCTCGCCTGC 8880CAAGCCCTCC GACAGGGCGA GTGCAACCTC GCCCTCGCCG CGGGCGTCTC CGTCATGGCC 8940TCCCCCGAGG GCTTCGTCCT CCTTTCCCGC CTGCGCGCCT TGGCGCCCGA CGGCCGCTCC 9000AAGACCTTCT CGGCCAACGC CGACGGCTAC GGACGCGGAG AAGGCGTCAT CGTCCTTGCC 9060CTCGAGCGGC TCGGTGACGC CCTCGCCCGA GGACACCGCG TCCTCGCCCT CGTCCGCGGC 9120ACCGCCATCA ACCACGACGG CGCGTCGAGC GGTATCACCG CCCCCAACGG CACCTCCCAG 9180CAGAAGGTCC TCCGCGCCGC GCTCCACGAC GCCCGCATCA CCCCCGCCGA CGTCGACGTC 9240GTCGAGTGCC ATGGCACCGG CACCTCCTTG GGAGACCCCA TCGAGGTGCA AGCCCTGGCC 9300GCCGTCTACG CCGACGGCAG CCCGGCTGAA AAGCCTCTCC TTCTCGGCGC GCTCAAGACC 9360AACATCGGCC ATCTCGAGGC CGCCTCCGGC CTCGCGGGCG TCGCCAAGAT CGTCGCCTCC 9420CTCCGCCATG ACGCCCTGCC CCCCACCCTC CACACGGGCC CGCGCAATCC CTTGATTGAT 9480TGGGATACAC TCGCCATCGA CGTCGTTGAT ACCCCGAGGT CTTGGGCCCG CCACGAAGAT 9540AGCAGTCCCC GCCGCGCCGG CGTCTCCGCC TTGCCACTCT CCGGCACCAA CGCCCACGTC 9600ATCCTCGAGG AGGCTCCCGC CGCCCTGTCG GGCGAGCCCG CCACCTCACA GACGGCGTCG 9660CGACCGCTCC CCGCGGCGTG TGCCGTGCTC CTGTCGGCCA GGAGCGAGGC CGCCGTCCGC 9720GCCCAGGCGA AGCGGCTCCG CGACCACCTC CTCGCCCACG ACGACCTCGC CCTTATCGAT 9780GTGGCCTATT CGCAGGCCAC CACCCGCGCC CACTTCGAGC ACCGCGCCGC TCTCCTGGCC 9840CGCGACCGCG ACGAGCTCCT CTCCGCGCTC GACTCGCTCG CCCAGGACAA GCCCGCCCCG 9900AGCACCGTTC TCGGCCGGAG CGGAAGCCAC GGCAAGGTCG TCTTCGTCTT TCCTGGGCAA 9960GGCTCGCAGT GGGAAGGGAT GGCCCTCTCC CTGCTCGACT CCTCGCCGGT CTTCCGCGCT 10020CAGCTCGAAG CATGCGACGC CGCGCTCGCT CCTCACGTCG AGTGGAGCCT GCTCGCCGTC 10080CTGCGCCGCG ACGAGGGCGC CCCCTCCCTC GACCGCGTCG ACGTCGTACA GCCCGCCCTC 10140TTTGCCGTCA TGGTCTCCCT GGCCGCCCTC TGGCGCTCGC TCGGCGTCGA GCCCGCCGCC 10200GTCGTCGGCC ACAGCCAGGG CGAGATCGCC GCCGCCTTCG TCGCAGGCGC TCTCTCCCTC 10260GAGGACGCGG CGCGCATCGC CGCCCTGCGC AGGAAAGCGC TCACCACCGT CGGCGGCAAC 10320GGCGGCATGG CCGCCGTCGA GCTCGGCGCC TCCGACCTCC AGACCTACCT CGCTCCCTGG 10380GGCGACAGGC TCTCCACCGC CGCCGTCAAC AGCCCCAGGG CTACCCTCGT ATCCGGCGAG 10440CCCGCCGCCG TCGACGCGCT GCTCGACGTC CTCACCGCCA CCAAGGTGTT CGCCCGCAAG 10500ATCCGCGTCG ACTACGCCTC CCACTCCGCC CAGATGGACG CCGTCCAAGA CGAGCTCGCC 10560GCAGGTCTAG CCAACATCGC TCCTCGGACG TGCGAGCTCC CTCTTTATTC GACCGTCACC 10620GGCACCAGGC TCGACGGCTC CGAGCTCGAC GGCGCGTACT GGTATCGAAA CCTCCGGCAA 10680ACCGTCCTGT TCTCGAGCGC GACCGAGCGG CTCCTCGACG ATGGGCATCG CTTCTCCGTC 10740GAGGTCAGCC CCCATCCCGT GCTCACGCTC GCCCTCCGCG AGACCTGCGA GCGCTCACCG 10800CTCGATCCCG TCGTCGTCGG CTCCATTCGA CGAGAAGAAG GCCACCTCGC CCGCCTGCTC 10860CTCTCCTGGG CGGAGCTCTC TACCCGAGGC CTCGCGCTCG ACTGGAAGGA CTTCTTCGCG 10920CCCTACGCTC CCCGCAAGGA CTCCCTCCCC ACCTACCCCT TCCAGCGGAGA GCGGTTCTGG 10980CTCGACGTCT CCACGGACGA ACGCTTCCGA CGTCGCCTCC GCAGGCCTGA CCTCGGCCGA 11040CCAATCCCGC TGCTCGGCGC CGCCGTCGCC TTCGCCGACC GCGGTGGCTT TCTCTTTACA 11100GGGCGGCTCT CCCTCGCAGA GCACCCGTGG CTCGAAGGCC ATGCCGTCTT CGGCACACCC 11160ATCCTACCGG GCACCGGCTT TCTCGAGCTC GCCCTGCACG TCGCCCACCG CGTCGGCCTC 11220GACACCGTCG AAGAGCTCAC GCTCGAGGCC CCTCTCGCTC TCCCATCGCA GGACACCGTC 11280CTCCTCCAGA TCTCCGTCGG GCCCGTGGAC GACGCAGGAC GAAGGGCGCT CTCTTTCCAT 11340AGCCGACAAG AGGACGCGCT TCAGGATGGC CCCTGGACTC GCCACGCCAG CGGCTCTCTC 11400TCGCCGGCGA CCCCATCCCT CTCCGCCGAT CTCCACGAGT GGCCTCCCTC GAGTGCCATC 11460CCGGTGGACC TCGAAGGCCT CTACGCAACC CTCGCCAACC TCGGGCTTGC CTACGGCCCC 11520GAGTTCCAGG GCCTCCGCTC CGTCTACAAG CGCGGCGACG AGCTCTTTGC CGAAGCCAAG 11580CTCCCGGAAG CGGCCGAAAA GGATGCCGCC CGGTTTGCCC TCCACCCTGC GCTGCTCGAC 11640AGCGCCCTGC ATGCACTGGC CTTTGAGGAC GAGCAGAGAG GGACGGTCGC TCTGCCCTTC 11700TCGTGGAGCG GAGTCTCGCT GCGCTCCGTC GGTGCCACCA CCTTGCGCGT GCGCTTCCAC 11760CGTCCCAAGG GTGAATCCTC CGTCTCGATC GTCCTGGCCG ACGCCGCAGG TGACCCTCTT 11820GCCTCGGTGC AAGCGCTCGC CATGCGGACG ACGTCCGCCG CGCAGCTCCG CACCCCGGCA 11880GCTTCCCACC ATGATGCGCT CTTCCGCGTC GACTGGAGCG AGCTCCAAAG CCCCACTTCA 11940CCGCCTGCCG CCCCGAGCGG CGTCCTTCTC GGCACAGGCG GCCACGATCT CGCGCTCGAC 12000GCCCCGCTCG CCCGCTACGC CGACCTCGCT GCCCTCCGAA GCGCCCTCGA CCAGGGCGCT 12060TCGCCTCCCG GCCTCGTCGT CGCCCCCTTC ATCGATCGAC CGGCAGGCGA CCTCGTCCCG 12120AGCGCCCACG AGGCCACCGC GCTCGCACTC GCCCTCTTGC AAGCCTGGCT CGCCGACGAA 12180CGCCTCGCCT CGTCGCGCCT CGTCCTCGTC ACCCGACGCG CCGTCGCCAC CCACACCGAA 12240GACGACGTCA AGGACCTCGC TCACGCGCCG CTCTGGGGGC TCGCGCGCTC CGCGCAAAGT 12300GAGCACCCAG ACCTCCCGCT CTTCCTCGTC GACATCGACC TCAGCGAGGC CTCCCAGCAG 12360GCCCTGCTAG GCGCGCTCGA CACAGGAGAA CGCCAGCTCG CCCTCCGCAA CGGGAAACCC 12420CTCATCCCGA GGTTGGCGCA ACCACGCTCG ACGGACGCGC TCATCCCGCC GCAAGCACCC 12480ACGTGGCGCC TCCATATTCC GACCAAAGGC ACCTTCGACG CGCTCGCCCT CGTCGACGCC 12540CCCGAGGCCC AGGCGCCCCT CGCACACGGC CAAGTCCGCA TCGCCGTGCA CGCGGCAGGG 12600CTCAACTTCC GCGATGTCGT CGACACCCTT GGCATGTATC CGGGCGACGC GCCGCCGCTC 12660GGAGGCGAAG GCGCGGGCAT CGTTACTGAA GTCGGTCCAG GTGTCTCCCG ATACACCGTA 12720GGCGACCGGG TGATGGGGGT CTTCGGCGCA GCCTTTGGTC CCACGGCCAT CGCCGACGCC 12780CGCATGATCT GCCCCATCCC CCACGCCTGG TCCTTCGCCC AAGCCGCCAG CGTCCCCATC 12840ATCTATCTCA CCGCCTACTA TGGACTCGTC GATCTCGGGC ATCTGAAACC CAATCAACGT 12900GTCCTCATCC ATGCGGCCGC CGGCGGCGTC GGGACGGCCG CCGTTCAGCT CGCACGCCAC 12960CTCGGCGCCG AGGTCTTTGC CACCGCCAGT CCAGGGAAGT GGAGCGCTCT CCGCGCGCTC 13020GGCTTCGACG ATGCGCACCT CGCGTCCTCA CGTGACCTGG GCTTCGAGCA GCACTTCCTG 13080CGCTCCACGC ATGGGCGCGG CATGGATGTC GTCCTCGACT GTCTGGCACG CGAGTTCGTC 13140GACGCCTCGC TGCGCCTCAT GCCGAGCGGT GGACGCTTCA TCGAGATGGG AAAGACGGAC 13200ATCCGTGAGC CCGACGCGAT CGGCCTCGCC TACCCTGGCG TCGTTTACCG CGCCTTCGAC 13260GTCACAGAGG CCGGACCGGA TCGAATTGGG CAGATGCTCG CAGAGCTGCT CAGCCTCTTC 13320GAGCGCGGTG TGCTTCGTCT GCCACCCATC ACATCCTGGG ACATCCGTCA TGCCCCCCAC 13380GCCTTCCGCG CGCTCGCCCA GGCGCGGCAT GTTGGGAAGT TCGTCCTCAC CATTCCCCGT 13440CCGATCGATC CCGAGGGGAC CGTCCTCATC ACGGGAGGCA CCGGGACGCT AGGAGTCCTG 13500GTCGCACGCC ACCTCGTCGC GAAACACAGC GCCAAACACC TGCTCCTCAC CTCGAGGAAG 13560GGCGCGCGTG CTCCGGGCGC GGAGGCTCTG CGAAGCGAGC TCGAAGCGCT GGGGGCCTCG 13620GTCACCCTCG TCGCGTGCGA CGTGGCCGAC CCACGCGCCC TCCGGACCCT CCTGGACAGC 13680ATCCCGAGGG ATCATCCGAT CACGGCCGTC GTGCACGCCG CCGGCGCCCT CGACGACGGG 13740CCGCTCGGTA GCATGAGCGC CGAGCGCATC GCTCGCGTCT TTGACCCCAA GCTCGATGCC 13800GCTTGGTACT TGCATGAGCT CACCCAGGAC GAGCCGGTCG CGGCCTTCGT CCTCTTCTCG 13860GCCGCCTCCG GCGTCCTTGG TGGTCCAGGT CAGTCGAACT ACGCCGCTGC CAATGCCTTC 13920CTCGATGCGC TCGCACATCA CCGGCGCGCC CAAGGACTCC CAGCCGCTTC GCTCGCCTGG 13980GGCTACTGGG CCGAGCGCAG TGGGATGACC CGGCACCTCA GCGCCGCCGA CGCCGCTCGC 14040ATGAGGCGCG CCGGCGTCCG GCCCCTCGAC ACTGACGAGG CGCTCTCCCT CTTCGATGTG 14100GCTCTCTTGC GACCCGAGCC CGCTCTGGTC CCCGCCCCCT TCGACTACAA CGTGCTCAGC 14160ACGAGTGCCG ACGGCGTGCC CCCGCTGTTC CAGCGTCTCG TCCGCGCTCG CATCGCGCGC 14220AAGGCCGCCA GCAATACTGC CCTCGCCTCG TCGCTTGCAG AGCACCTCTC CTCCCTCCCG 14280CCCGCCGAAC GCGAGCGCGT CCTCCTCGAT CTCGTCCGCA CCGAAGCCGC CTCCGTCCTC 14340GGCCTCGCCT CGTTCGAATC GCTCGATCCC CATCGCCCTC TACAAGAGCT CGGCCTCGAT 14400TCCCTCATGG CCCTCGAGCT CCGAAATCGA CTCGCCGCCG CCGCCGGGCT GCGGCTCCAG 14460GCTACTCTCC TCTTCGACTA TCCAACCCCG ACTGCGCTCT CACGCTTTTT CACGACGCAT 14520CTCTTCGGGG GAACCACCCA CCGCCCCGGC GTACCGCTCA CCCCGGGGGG GAGCGAAGAC 14580CCTATCGCCA TCGTGGCGAT GAGCTGCCGC TTCCCGGGCG ACGTGCGCAC GCCCGAGGAT 14640CTCTGGAAGC TCTTGCTCGA CGGACAAGAT GCCATCTCCG GCTTTCCCCA AAATCGCGGC 14700TGGAGTCTCG ATGCGCTCGA CGCCCCCGGT CGCTTCCCAG TCCGGGAGGG GGGCTTCGTC 14760TACGACGCAG ACGCCTTCGA TCCGGCCTTC TTCGGGATCA GTCCACGTGA AGCGCTCGCC 14820GTTGATCCCC AACAGCGCAT TTTGCTCGAG ATCACATGGG AAGCCTTCGA GCGTGCAGGC 14880ATCGACCCGG CCTCCCTCCA AGGAAGCCAA AGCGGGGTCT TCGTTGGCGT ATGGCAGAGC 14940GACTACCAAT GCATCGCTGG TGAACGCGAC TGGCGAATAC AAGGACTCGT TGCCACCGGT 15000AGCGCAGCGC GTCCGTCCGG CCGAATCGCA TACACGTTCG GACTTCAAGG GCCCGCCATC 15060AGCGTGGAGA CGGCGTGCAG CTTCCTCGTC GCGGTTCACC TCGCCTGCCA GGCCCCCCCC 15120CACGGCGAAT ACTCCCTGGC GCTCGCTGGC GGCGTGACCA TCATGGCCAC GCCAGCCATA 15180TTCATCGCGT TCGACTCCGA GAGCGCGGGT GCCCCCGACG GTCGCTGCAA GGCCTTCTCG 15240CCGGAAGCCG ACGGTTCGGG CTGGGCCGAA GGCGCCGGGA TGCTCCTGCT CGAGCGCCTC 15300TCCGATGCCG TCCAAAACGG TCATCCCGTC CTCGCCGTCC TTCGAGGCTG CGCCGTCAAC 15360CAGGACGGCC GGAGCCAAGG CCTCACCGCG CCCAATGGCC CTGCCCAGGA GCGCGTCATC 15420CGGCAAGCGC TCGACAGCGC GCGGCTCACT CCAAAGGACG TCGACGTCGT CGAGGCTCAC 15480GGCACGGGAA CCACCCTCGG AGACCCCATC GAGGCACAGG CCGTTTTTGC CACCTATGGC 15540GAGGCCCATT CCCAAGACAG ACCCCTCTGG CTTGGAAGCC TCAAGTCCAA CCTGGGACAT 15600ACTCAGGCCG CGGCCGGCGT CGGCGGCATC ATCAAGATGG TGCTCGCGTT CCAGCACGGT 15660CTCTTGCCCA AGACCCTCCA TGCCCAGAAT CCCTCCCCCC ACATCGACTG GTCTCCAGGC 15720ATCGTAAAGC TCCTGAACGA GGCCGTCGCC TGGACGACCA GCGGACATCC TCGCCGCGCC 15780GGTGTTTCCT CGTTCGGCGT CTCCGGCACC AACGCCCATG TCATCCTCGA AGAGGCTCCC 15840GCCGCCACGC GGGCCGAGTC AGGCGCTTCA CAGCCTGCAT CGCAGCCGCT CCCCGCGGCG 15900TGGCCCGTCG TCCTGTCGGC CAGGAGCGAG GCCGCCGTCC GCGCCCAGGC TCAAAGGCTC 15960CGCGAGCACC TGCTCGCCCA AGGCGACCTC ACCCTCGCCG ATGTGGCCTA TTCGCTGGCC 16020ACCACCCGCG CCCACTTCGA GCACCGCGCC GCTCTCGTAG CCCACGACCG CGACGAGCTC 16080CTCTCCGCGC TCGACTCGCT CGCCCAGGAC AAGCCCGCAC CGAGCACCGT CCTCGGACGG 16140AGCGGAAGCC ACGGCAAGGT CGTCTTCGTC TTTCCTGGGC AAGGCTCGCA GTGGGAAGGG 16200ATGGCCCTCT CCCTGCTCGA CTCCTCGCCC GTCTTCCGCA CACAGCTCGA AGCATGCGAG 16260CGCGCGCTCC GTCCTCACGT CGAGTGGAGC CTGCTCGCCG TCCTGCGCCG CGACGAGGGC 16320GCCCCCTCCC TCGACCGCGT CGACGTCGTG CAGCCCGCCC TCTTTGCCGT CATGGTCTCC 16380CTGGCCGCCC TCTGGCGCTC GCTCGGCGTC GAGCCCGCCG CCGTCGTCGG CCACAGCCAG 16440GGCGAGATAG CCGCCGCCTT CGTCGCAGGC GCTCTCTCCC TCGAGGACGC GGCCCGCATC 16500GCCGCCCTGC GCAGCAAAGC GTCACCACCG TCGCCGGCAA CGGGCATGGC CGCCGTCGAG 16560CTCGGCGCCT CCGACCTCCA GACCTACCTC GCTCCCTGGG GCGACAGGCT CTCCATCGCC 16620GCCGTCAACA GCCCCAGGGC CACGCTCGTA TCCGGCGAGC CCGCCGCCGT CGACGCGCTG 16680ATCGACTCGC TCACCGCAGC GCAGGTCTTC GCCCGAAGAG TCCGCGTCGA CTACGCCTCC 16740CACTCAGCCC AGATGGACGC CGTCCAAGAC GAGCTCGCCG CAGGTCTAGC CAACATCGCT 16800CCTCGGACGT GCGAGCTCCC TCTTTATTCG ACCGTCACCG GCACCAGGCT CGACGGCTCC 16860GAGCTCGACG GCGCGTACTG GTATCGAAAC CTCCGGCAAA CCGTCCTGTT CTCGAGCGCG 16920ACCGAGCGGC TCCTCGACGA TGGGCATCGC TTCTTCGTCG AGGTCAGCCC TCATCCCGTG 16980CTCACGCTCG CCCTCCGCGA GACCTGCGAG CGCTCACCGC TCGATCCCGT CGTCGTCGGC 17040TCCATTCGAC GCGACGAAGG CCACCTCCCC CGTCTCCTTG CTCTCTTGGG CCGAGCTCTA 17100TGGCCGGGCC TCACGCCCGA GTGGAAGGCC TTCTTCGCGC CCTTCGCTCC CCGCAAGGTC 17160TCACTCCCCA CCTACGCCTT CCAGCGCGGG CGTTTCTGGC TCGACGCCCC CAACGCACAC 17220CCCGAAGGCG TCGCTCCCGC TGCGCCGATC GATGGGCGGT TTTGGCAAGC CATCGAACGC 17280GGGGACCTCG ACGCGCTCAG CGGCCAGCTC CACGCGGACG GCGACGAGCA GCGCGCCGCC 17340CTCGCCCTGC TCCTTCCCAC CCTCTCGAGC TTTCACCACC AGCGCCAAGA GCAGAGCACG 17400GTCGACACCT GGCGCTACCG CATCACGTGG AGGCCTCTGA CCACCGCCGC CACGCCCGCC 17460GACCTCGCCG GCACCTGGCT CCTCGTCGTG CCGTCCGCGC TCGGCGACGA CGCGCTCCCT 17520GCCACGCTCA CCGATGCGCT TACCCGGCGC GGCGCGCGTG TCCTCGCGCT GCGCCTGAGC 17580CAGGTTCACA TAGGCCGCGC GGCTCTCACC GAGCACCTGC GCGAGGCTGT TGCCGAGACT 17640GCCCCGATTC GCGGCGTGCT CTCCCTCCTC GCCCTCGACG AGCGCCCCCT CGCGGACCAT 17700GCCGCCCTGC CCGCGGGCCT TGCCCTCTCG CTCGCCCTCG TCCAAGCCCT CGGCGACCTC 17760GCCCTCGAGG CTCCCTTGTG GCTCTTCACG CGCGGCGCCG TCTCGATTGG ACACTCCGAC 17820CCACTCGCCC ATCCCACCCA GGCCATGATC TGGGGCTTGG GCCGCGTCGT CGGCCTCGAG 17880CACCCCGAGC GGTGGGGCGG GCTCGTCGAC CTCGGCGCAG CGCTCGACGC GAGCGCCGCA 17940GGCCGCTTGC TCCCGGCCCT CGCCCAGCGC CACGACGAAG ACCAGCTCGC GCTGCGCCCG 18000GCCGGCCTCT ACGCACGCCG CTTCGTCCGC GCCCCGCTCG GCGATGCGCC TGCCGCTCGC 18060GGCTTCATGC CCCGAGGCAC CATCCTCATC ACCGGTGGTA CCGGCGCCAT TGGCGCTCAC 18120GTCGCCCGAT GGCTCGCTCG AAAAGGCGCT GAGCACCTCG TCCTCATCAG CCGACGAGGG 18180GCCCAGGCCG AAGGCGCCGT GGAGCTCCAC GCCGAGCTCA CCGCCCTCGG CGCGCGCGTC 18240ACCTTCGCCG CGTGCGATGT CGCCGACAGG AGCGCTGTCG CCACGCTTCT CGAGCAGCTC 18300GACGCCGGAG GGCCACAGGT GAGCGCCGTG TTCCACGCGG GCGGCATCCA GCCCCACGCT 18360CCGCTCGCCG CCACCTCCAT GGAGGATCTC GCCGAGGTTG TCTCCGGCAA GGTACAAGGT 18420GCAAGACACC TCCACGACCT GCTCGGCTCT CGACCCCTCG ACGCCTTTGT TCTCTTCTCG 18480TCCGGCGCGG TCGTCTGGGG CGGCGGACAA CAAGGCGGCT ATGCCGCTGC GAACGCCTTC 18540CTCGATGCCC TGGCCGAGCA GCGGCGCAGC CTTGGGCTGA CGGCGACATC GGTGGCCTGG 18600GGCGTGTGGG GCGGCGGCGG CATGGCTACC GGGCTCCTGG CAGCCCAGCT AGAGCAACGC 18660GGTCTGTCGC CGATGGCCCC CTCGCTGGCC GTGGCGACGC TCGCGCTGGC GCTGGAGCAC 18720GACGAGACCA CCCTCACCGT CGCCGACATC GACTGGGCGC GCTTTGCGCC TTCGTTCAGC 18780GCCGCTCGCT CCCGCCCGCT CCTGCGCGAT TTGCCCGAGG CGCAGCGCGC TCTCGAAGCC 18840AGCGCCGATG CGTCCTCCGA GCAAGACGGG GCCACAGGCC TCCTCGACAA GCTCCGAAAC 18900CGCTCGGAGA GCGAGCAGAT CCACCTGCTC TCCTCGCTGG TGCGCCACGA AGCGGCCCTC 18960GTCCTGGGCC ATACCGACGC CTCCCAGGTC GACCCCCACA AGGGCTTCAT GGACCTCGGC 19020CTCGATTCGC TCATGACCGT CGAGCTTCGT CGGCGCTTGC AGCAGGCCAC CGGCATCAAG 19080CTCCCGGCCA CCCTCGCCTT CGACCATCCC TCTCCTCATC GCGTCGCGCT CTTCTTGCGC 19140GACTCGCTCG CCCACGCCCT CGGCGCGAGG CTCTCCGTCG AGCGCGACGC CGCCGCGCTC 19200CCGGCGCTTC GCTCGGCGAG CGACGAGCCC ATCGCCATCG TCGGCATGGC CCTCCGCTTG 19260CCGGGCGGCA TCGGCGATGT CGACGCTCTT TGGGAGTTCC TCGCCCAAGG ACGCGACGCC 19320GTCGAGCCCA TTCCCCATGC CCGATGGGAT GCCGGTGCCC TCTACGACCC CGACCCCGAC 19380GCCAAGGCCA AGAGCTACGT CCGGCATGCC GCCATGCTCG ACCAGGTCGA CCTCTTCGAT 19440CCTGCCTTCT TTGGCATCAG CCCTCGCGAG GCCAAATACC TCGACCCCCA GCACCGCCTG 19500CTCCTCGAAT CTGCCTGGCT GGCCCTCGAG GACGCCGGCA TCGTCCCCTC CACCCTCAAG 19560GATTCTCCCA CCGGCGTCTT CGTCGGCATC GGCGCCAGCG AATACGCACT GCGAAACACG 19620AGCTCCGAAG AGGTCGAAGC GTATGCCCTC CAAGGCACCG CCGGGTCCTT TGCCGCGGGG 19680CGCTTGGCCT ACACGCTCGG CCTGCAAGGG CCCGCGCTCT CGGTCGACAC CGCCTGCTCC 19740TCCTCGCTCG TCGCCCTCCA CCTCGCCTGC CAAGCCCTCC GACAGGGCGA GTGCAACCTC 19800GCCCTCGCCG CGGGCGTCTC CGTCATGGCC TCCCCCGGGC TCTTCGTCGT CCTTTCCCGC 19860ATGCGTGCTT TGGCGCCCGA TGGCCGCTCC AAGACCTTCT CGACCAACGC CGACGGCTAC 19920GGACGCGGAG AGGGCGTCGT CGTCCTTGCC CTCGAGCGGC TCGGCGACGC CCTCGCCCGA 19980GGACACCGCG TCCTCGCCCT CGTCCGCGGC ACCGCCATGA ACCATGACGG CGCGTCGAGC 20040GGCATCACCG CCCCCAATGG CACCTCCCAC CAGAAGGTCC TCCGCGCCGC GCTCCACGAC 20100GCCCATATCG GCCCTGCCGA CGTCGACGTC GTCGAATGCC ATGGCACCGG CACCTCCTTG 20160GGAGACCCCA TCGAGGTGCA AGCCCTGGCC GCCGTCTACG CCGATGGCAG ACCCGCTGAA 20220AAGCCTCTCC TTCTCGGCGC ACTCAAGACC AACATTGGCC ATCTCGAGGC CGCCTCCGGC 20280CTCGCGGGCG TCGCCAAGAT CGTCGCCTCC CTCCGCCATG ACGCCCTGCC CCCCACCCTC 20340CACACGACCC CGCGCAATCC CCTGATCGAG TGGGATGCGC TCGCCATCGA CGTCGTCGAT 20400GCCACGAGGG CGTGGGCCCG CCACGAAGAT GGCAGTCCCC GCCGCGCCGG CGTCTCCGCC 20460TTCGGACTCT CCGGCACCAA CGCCCACGTT ATCCTCGAAG AGGCTCCCGC GATCCCGCAC 20520GCCGAGCCCA CCGCGGCACA GCTCGCGTCG CAGCCGCTTC CCGCAGCCTG GCCCGTGCTC 20580CTGTCGGCCA GGAGCGAGCC GGCCGTGCGC GCCCAGGCCC AGAGGCTCCG CGACCACCTC 20640CTCGCCCACG ACGACCTCGC CCTGGCCGAT GTAGCCTACT CGCTCGCCAC CACCCGGGCT 20700ACCTTCGAGC ACCGTGCCGC TCTCGTGGTC CACGACCGCG AAGAGCTCCT CTCCGCGCTC 20760GATTCGCTCG CCCAGGGAAG GCCCGCCCCG AGCACCGTCG TCGAACGAAG CGGAAGCCAC 20820GGCAAGGTCG TCTTCGTCTT TCCTGGGCAA GGCTCGCAGT GGGAAGGGAT GGCCCTCTCC 20880CTGCTCGATA CCTCGCCGGT CTTCCGGGCA CAGCTCGAAG CGTGCGAGCG CGCCCTCGCG 20940CCCCACGTGG ACTGGTCGCT GCTCGCGGTG CTCCGCGGCG AGGAGGGCGC GCCCCCGCTC 21000GACCGGGTCG ACGTGGTCCA GCCCGCGCTG TTCTCGATGA TGGTCTCGCT GGCCGCCCTG 21060TGGCGCTCCA TGGGCGTCGA GCCCGACGCC GTGGTCGGCC ATAGCCAGGG CGAGATCGCC 21120GCGGCCTGTG TGGCGGGCGC GCTGTCGCTC GAGGACGCTG CCAAGCTGGT GGCGCTGCGC 21180AGCCGTGCGC TCGTGGAGCT CGCCGGCCAG GGGGCCAAGG CCGCGGTGGA GCTGCCGGAG 21240GCCGAGGTCG CACGGCGCCT CCAGCGCTAT GGCGATCGGC TCTCCATCGG GGCGATCAAC 21300AGCCCTCGTT TCACGACGAT CTCCGGCGAG CCCCCTGCCG TCGCCGCCCT GCTCCGCGAT 21360CTGGAGTCCG AGGGCGTCTT CGCCCTCAAG CTGAGTTACG ACTTCGCCTC CCACTCCGCG 21420CAGGTCGAGT CGATTCGCGA CGAGCTCCTC GATCTCCTGT CGTGGCTCGA GCCGCGCTCG 21480ACGGCGGTCC CGTTCTACTC CACGGTGAGC GGCGCCGCGA TCGACGGGAC CGAGCTCGAC 21540GCCGCCTACT GGTACCGGAA CCTCCGGCAG CCGGTCCGCT TCGCAGACGC TGTGCAAGGC 21600CTCCTTGCCG GAGAACATCG CTTCTTCGTG GAGGTGAGCC CCAGTCCTGT GCTGACCTTG 21660GCCTTGCAGC AGCTCCTCGA AGCGTCGGAG CGCTCGGCGG CGGTGGTCGG CTCTCTGTGG 21720AGCGACGAAG GGGATCTACG GCGCTTCCTC GTCTCGCTCT CCGAGCTCTA CGTCAACGGC 21780TTCGCCCTGG ATTGGACGAC GATCCTGCCC CCCGGGAAGC GGGTGCCGCT GCCCACCTAC 21840CCCTTCCAGC GCGAGCGCTT CTGGCTCGAC GCCTCCACGG CACCCGCCGC CGGCGTCAAC 21900CACCTTGCTC CGCTCGAGGG GCGGTTCTGG CAGGCCATCG AGAGCGGGAA TATCGACGCG 21960CTCAGCGGCC AGCTCCACGT GGACGGCGAC GAGCAGCGCG CCGCCCTTGC CCTGCTCCTT 22020CCCACCCTCG CGAGCTTTCG CCACGAGCGG CAAGAGCAGG GCACGGTCGA CGCCTGGCGC 22080TACCGCATCA CGTGGAAGCC TCTGACCACC GCCACCACGC CCGCCGACCT GGCCGGCACC 22140TGGCTCCTCG TCGTGCCGGC CGCTCTGGAC GACGACGCGC TCCCCTCCGC GCTCACCGAG 22200GCGCTCGCCC GGCGCGGCGC GCGCGTCCTC GCCGTGCGCC TGAGCCAGGC CCACCTGGAC 22260CGCGAGGCTC TCGCCGAGCA CCTGCGCCAG GCTTGCGCCG AGACCGCGCC GCCTCGCGGC 22320GTGCTCTCGC TCCTCGCCCT CGACGAAAGT CCCCTCGCCG ACCATGCCGC CGTGCCCGCG 22380GGACTCGCCT TCTCGCTCAC CCTCGTCCAA GCCCTCGGCG ACATCGCCCT CGACGCGCCC 22440TTGTGGCTCT TCACCCGCGG CGCCGTCTCC GTCGGACACT CCGACCCCAT CGCCCATCCG 22500ACGCAGGCGA TGACCTGGGG CCTGGGCCGC GTCGTCGGCC TCGAGCACCC CGAGCGCTGG 22560GGAGGGCTCG TCGACGTCGG CGCAGCGATC GACGCGAGCG CCGTGGGCCG CTTGCTCCCG 22620GTCCTCGCCC TGCGCAACGA TGAGGACCAG CTCGCTCTCC GCCCGGCCGG GTTCTACGCT 22680CGCCGCCTCG TCCGCGCTCC GCTCGGCGAC GCGCCGCCCG CACGTACCTT CAAGCCCCGA 22740GGCACCCTCC TCATCACCGG AGGCACCGGC GCCGCTGGCG CTCACGTCGC CCGATGGCTC 22800GCTCGAGAAG GCGCAGAGCA CCTCGTCCTC ATCAGCCGCC GAGGGGCCCA GGCCGAGGGC 22860GCCTCGGAGC TCCACGCCGA GCTCACGGCC CTGGGCGCGC GCGTCACCTT CGCCGCGTGT 22920GATGTCGCCG ACAGGAGCGC TGTCGCCACG CTTCTCGAGC AGCTCGACGC CGAAGGGTCG 22980CAGGTCCGCG CCGTGTTCCA CGCGGGCGGC ATCGGGCGCC ACGCTCCGCT CGCCGCCACC 23040TCTCTCATGG AGCTCGCCGA CGTTGTCTCT GCCAAGGTCC TAGGCGCAGG GAACCTCCAC 23100GACCTGCTCG GTCCTCGACC CCTCGACGCC TTCGTCCTTT TCTCGTCCAT CGCAGGCGTC 23160TGGGGCGGCG GACAACAAGC CGGATACGCC GCCGGAAACG CCTTCCTCGA CGCCCTGGCC 23220GACCAGCGGC GCAGTCTTGG ACAGCCGGAC ACGTCCGTGG TGTGGGGCGC GTGGGGCGGC 23280GGCGGTGGTA TATTCACGGG GCCCCTGGCA GCCCAGCTGG AGCAACGTCG TCTGTCGCCG 23340ATGGCCCCTT CGCTGGCCGT GGCGGCGCTC GCGCAAGCCC TGGAGCACGA CGAGACCACC 23400GTCACCGTCG CCGACATCGA CTGGGCGCGC TTTGCGCCTT CGATCAGCGT CGCTCGCTCC 23460CGCCGCTCCT GCGCGACTTG CCCGAGCAGC GCGCCCTCGA AGACAGAGAA GGCGCGTCCT 23520CCTCCGAGCA CGGCCCGGCC CCCCGACCTC CTCGACAAGC TCCGGAGCCG CTCGGAGAGC 23580GAGCAGCTCC GTCTGCTCGC CGCGCTGGTG TGCGACGAGA CGGCCCTCGT CCTCGGCCAC 23640GAAGGCCGCT TCCCAGCTCG ACCCCGACAA GGCTTCTTCG ACCTCGGTCT CGATTCGATC 23700ATGACCGTCG AGCTTCGTCG GCGCTTGCAA CAGGCCACCG GCATCAAGCT CCCGGCCACC 23760CTCGCCTTCG ACCATCCCTC TCCTCATCGC GTCGCGCTCT TCATGCGCGA CTCGCTCGCC 23820CACGCCCTCG GCACGAGGCT CTCCGCCGAG GCGACGCCGC CGCGCTCCGG CCGCGCCTCG 23880AGCGACGAGC CCATCGCCAT CGTCGGCATG GCCCTGCGCC TGCCGGGCGG CGTCGGCGAT 23940GTCGACGCTC TTTGGGAGTT CCTCCACCAA GGGCGCGACG CGGTCGAGCC CATTCCACAG 24000AGCCGCTGGG ACGCCGGTGC CCTCTACGAC CCCGACCCCG ACGCCGACGC CAAGAGCTAC 24060GTCCGGCATG CCGCGATGCT CGACCAGATC GACCTCTTCG ACCCTGCCTT CTTCGGCATC 24120AGCCCCCGGG AGGCCAAACA CCTCGACCCC CAGCACCGCC TGCTCCTCGA ATCTGCCTGG 24180CTGGCCCTCG AGGACGCCGG CATCGTCCCC ACCTCCCTCA AGGACTCCCT CACCGGCGTC 24240TTCGTCGGCA TCTGCGCCGG CGAATACGCG ATGCAAGAGG CGAGCTCGGA AGGTTCCGAG 24300CTTTACTTCA TCCAAGGCAC TTCCGCGTCC TTTGGCGCGG GGGGCTTGGC CTATACGCTC 24360GGGCTCCAGG GGCCGCGATC TTCGGTCGAC ACCGCCTGCT CCTCCTCGCT CGTCTCCCTC 24420CACCTCGCCT GCCAAGCCCT CCGACAGGGC GAGTGCAACC TCGCCCTCGC CGCGGGCGTG 24480TCGCTCATGG TCTCCCCCCA GACCTTCGTC ATCCTTTCCC GTCTGCGCGC CTTGGCGCCC 24540GACGGCCGCT CCAAGACCTT CTCGGACAAC GCCGACGGCT ACGGACGCGG AGAAGGCGTC 24600GTCGTCCTTG CCCTCGAGCG GATCGGCGAC GCCCTCGCCC GGAGACACCG CGTCCTCGTC 24660CTCGTCCGCG GCACCGCCAT CAACCACGAC GGCGCGTCGA GCGGTATCAG CGCCCCCAAC 24720GGCACCTCCC AGCAGAAGGT CCTCCGGGCC GCGCTCCACG ACGCCCGCAT CACCCCCGCC 24780GACGTCGACG TCGTCGAGTG CCATGGCACC GGCACCTCGC TGGGAGACCC CATCGAGGTG 24840CAAGCCCTGG CCGCCGTCTA CGCCGACGGC AGACCCGCTG AAAAGCCTCT CCTTCTCGGC 24900GCGCTCAAGA CCAACATCGG CCATCTCGAG GCCGCCTCCG GCCTCGCGGG CGTCGCCAAG 24960ATGGTCGCCT CGCTCCGCCA CGACGCCCTG CCCCCCACCC TCCACGCGAC CCCACGCAAT 25020CCCCTCATCG AGTGGGAGGC GCTCGCCATC GACGTCGTCG ATACCCCGAG GCCTTGGCCC 25080CGCCACGAAG ATGGCAGTCC CCGCCGCGCC GGCATCTCCG CCTTCGGATT CTCGGGCACC 25140AACGCCCACG TCATCCTCGA AGAGGCTCCC GCCGCCCTGC CGGCCGAGCC CGCCACCTCA 25200CAGCCGGCGT CGCAAGCCGC TCCCGCGGCG TGGCCCGTGC TCCTGTCGGC CAGGAGCGAG 25260GCCGCCGTCC GCGCCCAGGC GAAGCGGCTC CGCGACCGAA TCGTCGCCCA CGACGACCTC 25320ACCCTCGCGG ATGTGGCCTA TTCGCTGGCC ACCACCCGCG CCCACTTCGA GCACCGCGCC 25380GCTCTCGTAG CCCACAACCG CGACGAGCTC CTCTCCGCGC TCGACTCGCT CGCCCAGGAC 25440AAGCCCGCCC CGAGCACCGT CCTCGGACGG AGCGGAAGCC ACGGCAAGCT CGTCTTCGTC 25500TTTCCTGGGC AAGGCTCGCA GTGGGAAGGG ATGGCCCTCT CGCTGCTCGA CTCCTCGCCC 25560GTCTTCCGCG CTCAGCTCGA AGCATGCGAG CGCGCGCTCG CTCCTCACGT CGAGTGGAGC 25620CTGCTCGCCG TCCTGCGCCG CGACGAGGGC GCCCCCTCCC TCGACCGCGT CGACGTCGTA 25680CAGCCCGCCC TCTTTGCCGT CATGGTCTCC CTGGCGGCCC TCTGGCGCTT GCTCGGCGTA 25740GAGCCCGCCG CCGTCGTCGG CCACAGTCAG GGCAAGATCG CCGCCGCCTT CGTCGCAGGC 25800GCTCTCTCCC TCGAGGACGC GGCCCGCATC GCCGCCCTGC GCAGCAAAGC GCTCACCACC 25860GTCGCCGGCA ACGGGGCCAT GGCCGCCGTC GAGCTCGGCG CCTCCGACCT CCAGACCTAC 25920CTCGCTCCCT GGGGCGACAG GCTCTCCATC GCCGCCGTCA ACAGCCCCAG GGCCACGCTC 25980GTGTCCGGCG AGCCCGCCGC CATCGACGCG CTGATCGACT CGCTCACCGC AGCGCAGGTC 26040TTCGCCCGAA AAGTCCGCGT CGACTACGCC TCCCACTCCG CCCAGATGGA CGCCGTCCAA 26100GACGAGCTCG CCGCAGGTCT AGCCAACATC GCTCCTCGGA CGTGCGAGCT CCCTCTTTAT 26160TCGACCGTCA CCGGCACCAG GCTCGACGGC TCCGAGCTCG ACGGCGCGTA CTGGTATCGA 26220AACCTCCGGC AAACCGTCCT GTTCTCGAGC GCGACCGAGC GGCTCCTCGA CGATGGGCAT 26280CGCTTCTTCG TCGAGGTCAG CCCCCATCCC GTGCTCACGC TCGCCCTCCG CGAGACCTGC 26340GAGCGCTCAC CGCTCGATCC CGTCGTCGTC GGCTCCATTC GACGCGACGA AGGCCACCTC 26400GCCCGCCTGC TCCTCTCCTG GGCGGAGCTC TCTACCCGAG GCCTCGCGCT CGACTGGAAC 26460GCCTTCTTCG CGCCCTTCGC TCCCCGCAAG GTCTCCCTCC CCACCTACCC CTTCCAACGC 26520GAGCGCTTCT GGCTCGACGC CTCCACGGCG CACGCTGCCG ACGTCGCCTC CGCAGGCCTG 26580ACCTCGGCCG ACCACCCGCT GCTCGGCGCC GCCGTCGCCC TCGCCGACCG CGATGGCTTT 26640GTCTTCACAG GACGGCTCTC CCTCGCAGAG CACCCGTGGC TCGAAGACCA CGTCGTCTTC 26700GGCATACCCT GTCCTGCCAG GCGCCGCCTC CTCGAGCTCG CCCTGCATGT CGCCCATCTC 26760GTCGGCCTCG ACACCGTCGA AGACGTCACG CTCGACCCCC CCCTCGCTCT CCCATCGCAG 26820GGCGCCGTCC TCCTCCAGAT CTCCGTCGGG CCCGCGGACG GTGCTGGACG AAGGGCGCTC 26880TCCGTTCATA GCCGGCGCCA CGACGCGCTT CAGGATGGCC CCTGGACTCG CCACGCCAGC 26940GGCTCTCTCG CGCAAGCTAG CCCGTCCCAT TGCCTTCGAT GCTCCGCGAA TGGCCCCCCC 27000TCGGGCGCCA CCCAGGTGGA CACCCAAGGT TTCTACGCAG CCCTCGAGAG CGCTGGGCTT 27060GCTTATGGCC CCGAGTTCCA GGGCCTCCGC CGCCGTCTAC AAGCGCGGCG ACGAGCTCTT 27120CGCCGAAGCC AAGCTCCCGG ACGCCGCCGA AGAGGACGCC GCTCGTTTTG CCCTCCACCC 27180CGCCCTGCTC GACAGCGCCT TGCAGGCGCT CGCCTTTGTA GACGACCAGG CAAAGGCCTT 27240CAGGATGCCC TTCTCGTGGA GCGGAGTATC GCTGCGCTCC GGTCGGAGCC ACCACCCTGC 27300GCGTGCGTTT CCACCGTCCT GAGGGCGAAT CCTCGCGCTC GCTCCTCCTC GCCGACGCCA 27360GAGGCGAACC CATCGCCTCG GTGCAAGCGC TCGCCATGCG CGCCGCGTCC GCCGAGCAGC 27420TCCGCAGACC CGGGAGCGTC CCACCTCGAT GCCCTCTTCC GCATCGACTG GAGCGAGCTG 27480GAAAGCCCCA CCTCACCGCC CATCGCCCCG AGCGGTGCCC TCCTCGGCAC AGAAGGTCTC 27540GACCTCGGGA CCAGGGTGCC TCTCGACCGC TATACCGACC TTGCTGCTCT ACGCAGCGCC 27600CTCGACCAGG GCGCTTCGCC TCCAAGCCTC GTCATCGCCC CCTTCATCGC TCTGCCCGAA 27660GGCCACCTCA TCGCGAGCGC CCGCGAGACC ACCGCGCACG CGCTCGCCCT CTTGCAAGCC 27720TGGCTCGCCG ACGAGCGCCT CGCCTCCTCG CGCCTCGCCC TCGTCACCCG ACGCGCCGTC 27780GCCACCCACG CTGAAGAAGA CGTCAAGGGC CTCGCTCACG CGCCTCTCTG GGGTCTCGCT 27840CGCTCCGCGC AGAGCGAGCA CCCAGAGCGC CCTCTCGTCC TCGTCGACCT CGACGACAGC 27900GAGGCCTCCC AGCACGCCCT GCTCGGCGCG CTCGACGCAA GAGAGCCAGA GATCGCCCTC 27960CGCAACGGCA AACCCCTCGT TCCAAGGCTC TCACGCCTGC CCCAGGCGCC CACGGACACA 28020GCGTCCCCCG CAGGCCTCGG AGGCACCGTC CTCATCACGG GAGGCACCGG CACGCTCGGC 28080GCCCTGGTCG CGCGCCGCCT CGTCGTAAAC CACGACGCCA AGCACCTCGT CCTCACCTCG 28140CGCCAGGGCG CGAGCGCTCC GGGTGCTGAT GTCTTGCGAA GCGAGCTCGA AGCTCTGGGG 28200GCTTCGGTCA CCCTCGCCGC GTGCGACGTG GCCGATCCAC GCGCTCTAAA GGACCTTCTG 28260GATAACATTC CGAGCGCTCA CCCGGTCGCC GCCGTCGTGC ATGCCGCCAG CGTCCTCGAC 28320GGCGATCTGC TCGGCGCCAT GAGCCTCGAG CGGATCGACC GCGTCTTCGC CCCCAAGATC 28380GATGCCGCCT GGCACTTGCA TCAGCTCACC CAAGATAAGC CCCTTGCCGC CTTCATCCTC 28440TTCTCGTCCG TCGCCGGCGT CCTCGGCAGC TCAGGTCACT CCAACTACGC CGCTGCGAGC 28500GCCTTCCTCG ATGCGCTTGC GCACCACCGG CGCGCGCAAG GGCTCCCTGC CTCATCGCTC 28560GCGTGGAGCC ACTGGGCCGA GCGCAGCGCA ATGACAGAGC ACGTCAGCGC CGCCGGCGCC 28620CCTCGCATGG AGCGCGCCGG CCTTCCCTCG ACCTCTGAGG AGAGGCTCGC CCTCTTCGAT 28680GCGGCGCTCT TCCGAACCGA GACCGCCCTG GTCCCCGCGC GCTTCGACTT GAGCGCGCTC 28740AGGGCGAACG CCGGCAGCGT CCCCCCGTTG TTCCAACGTC TCGTCCGCGC TCGCACCGTA 28800CGCAAGGCCG CCAGCAACAC CGCCCAGGCC TCGTCGCTTA CAGAGCGCCT CTCAGCCCTC 28860CCGCCCGCCG AACGCGAGCG TGCCCTGCTC GATCTCATCC GCACCGAAGC CGCCGCCGTC 28920CTCGGCCTCG CCTCCTTCGA ATCGCTCGAT CCCGATCG 28958(2)SEQ ID NO7信息(i)序列特征(A)长度13个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…13(K)其它信息/注=“植物共有翻译起始物序列(Clontech)”(xi)序列描述SEQ ID NO7GTCGACCATG GTC 13(2)SEQ ID NO8信息(i)序列特征(A)长度12个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…12(K)其它信息/注=“植物共有翻译起始物序列(Joshi)”(xi)序列描述SEQ ID NO8TAAACAATGG CT 12(2)SEQ ID NO9信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否
(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…22(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”(xi)序列描述SEQ ID NO9AATTCTAAAG CATGCCGATC GG22(2)SEQ ID NO10信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…21(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”
(xi)序列描述SEQ ID NO10AATTCCGATC GGCATGCTTT A 21(2)SEQ ID NO11信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(v)特征(I)名称/关键词misc_特征(J)位置1…22(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”(xi)序列描述SEQ ID NO11AATTCTAAAC CATGGCGATC GG 22(2)SEQ ID NO12信息(i)序列特征
(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…21(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”(xi)序列描述SEQ ID NO12AATTCCGATC GCCATGGTTT A 21(2)SEQ ID NO13信息(i)序列特征(A)长度15个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸
(iii)假设否(iv)反义否(ix)特征(I)名称/关键词misc_特征(J)位置1…15(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”(xi)序列描述SEQ ID NO13CCAGCTGAA TTCG 15(2)SEQ ID NO14信息(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(v)特征(I)名称/关键词misc_特征(J)位置1…19
(K)其它信息/注=“用于分子衔接子的寡核苷酸序列”(xi)序列描述SEQ ID NO14CGGAATTCCA GCTGGCATG 19(2)SEQ ID NO15信息(i)序列特征(A)长度11个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(v)特征(I)名称/关键词misc_特征(J)位置1…11(K)其它信息/注=“用于将碱基变化引入吡咯尼群基因簇ORF1的SphI位点的寡核苷酸”(xi)序列描述SEQ ID NO15CCCCTCATG C 11(2)SEQ ID NO16信息(i)序列特征(A)长度11个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型其它核酸(iii)假设否(iv)反义否(v)特征(I)名称/关键词misc_特征(J)位置1…11(K)其它信息/注=“用于将碱基变化引入吡咯尼群基因簇ORF1的SphI位点的寡核苷酸”(xi)序列描述SEQ ID NO16GCATGAGGGG G 11(2)SEQ ID NO17信息(i)序列特征(A)长度4603个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线型(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(v)特征(I)名称/关键词CDS(J)位置230…1597(K)其它信息/基因=“phz1”/标记=ORF1(ix)特征(I)名称/关键词CDS(J)位置1598…2761(K)其它信息/基因=“phz2”/标记=ORF2(ix)特征(I)名称/关键词CDS(J)位置2764…3600(K)其它信息/基因=“phz3”/标记=ORF3(ix)特征(I)名称/关键词misc_特征(J)位置3597…4265(K)其它信息/标记=ORF4
(xi)序列描述SEQ ID NO17GCATGCCGTG ACCTCCGCCG GTGGCGTGGC CGCOGGCCTG CACCTGGAAA CCACCCCTGA60CGACGTCAGC GAGTGCGCTT CCGATGCCGC CGGCCTGCAT CAGGTCGCCA GCCGCTACAA 120AAGCCTGTGC GACCCGCGCC TGAACCCCTG GCAAGCCATT ACTGCGGTGA TGGCCTGGAA 180AAACCAGCCC TCTTCAACCC TTGCCTCCTT TTGACTGGAG TTTGTCGTC ATG ACC 235Met Thr1GGC ATT CCA TCG ATC GTC CCT TAC GCC TTG CCT ACC AAC CGC GAC CTG 283Gly Ile Pro Ser Ile Val Pro Tyr Ala Leu Pro Thr Asn Arg Asp Leu5 10 15CCC GTC AAC CTC GCG CAA TGG AGC ATC GAC CCC GAG CGT GCC GTG CTG 331Pro Val Asn Leu Ala Gln Trp Ser Ile Asp Pro Glu Arg Ala Val Leu20 25 30CTG GTG CAT GAC ATG CAG CGC TAC TTC CTG CGG CCC TTG CCC GAC GCC 379Leu Val His Asp Met Gln Arg Tyr Phe Leu Arg Pro Leu Pro Asp Ala35 40 45 50CTG CGT GAC GAA GTC GTG AGC AAT GCC GCG CGC ATT CGC CAG TGG GCT 427Leu Arg Asp Glu Val Val Ser Asn Ala Ala Arg Ile Arg Gln Trp Ala55 60 65GCC GAC AAC GGC GTT CCG GTG GCC TAC ACC GCC CAG CCC GGC AGC ATG 475Ala Asp Asn Gly Val Pro Val Ala Tyr Thr Ala Gln Pro Gly Ser Met70 75 80AGC GAG GAG CAA CGC GGG CTG CTC AAG GAC TTC TGG GGC CCG GGC ATG 523Ser Glu Glu Gln Arg Gly Leu Leu Lys Asp Phe Trp Gly Pro Gly Met85 90 95AAG GCC AGC CCC GCC GAC CGC GAG GTG GTC GGC GCC CTG ACG CCC AAG 571Lys Ala Ser Pro Ala Asp Arg Glu Val Val Gly Ala Leu Thr Pro Lys100 105 110CCC GGC GAC TGG CTG CTG ACC AAG TGG CGC TAC AGC GCG TTC TTC AAC 619Pro Gly Asp Trp Leu Leu Thr Lys Trp Arg Tyr Ser Ala Phe Phe Asn115 120 125 130TCC GAC CTG CTG GAA CGC ATG CGC GCC AAC GGG CGC GAT CAG TTG ATC 667Ser Asp Leu Leu Glu Arg Met Arg Ala Asn Gly Arg Asp Gln Leu Ile135 140 145CTG TGC GGG GTG TAC GCC CAT GTC GGG GTA CTG ATT TCC ACC GTG GAT 715Leu Cys Gly Val Tyr Ala His Val Gly Val Leu Ile Ser Thr Val Asp150 155 160GCC TAC TCC AAC GAT ATC CAG CCG TTC CTC GTT GCC GAC GCG ATC GCC 763Ala Tyr Ser Asn Asp Ile Gln Pro Phe Leu Val Ala Asp Ala Ile Ala165 170 175GAC TTC AGC AAA GAG CAC CAC TGG ATG CCA TCG AAT ACG CCG CCA GCC 811Asp Phe Ser Lys Glu His His Trp Met Pro Ser Asn Thr Pro Pro Ala180 185 190GTT GCG CCA TGT CAT CAC CAC CGA CGA GGT GGT GCT ATG AGC CAG ACC 859Val Ala Pro Cys His His His Arg Arg Gly Gly Ala Met Ser Gln Thr195 200 205 210GCA GCC CAC CTC ATG GAA CGC ATC CTG CAA CCG GCT CCC GAG CCG TTT 907Ala Ala His Leu Met Glu Arg Ile Leu Gln Pro Ala Pro Glu Pro Phe215 220 225GCC CTG TTG TAC CGC CCG GAA TCC AGT GGC CCC GGC CTG CTG GAC GTG 955Ala Leu Leu Tyr Arg Pro Glu Ser Ser Gly Pro Gly Leu Leu Asp Val230 235 240CTG ATC GGC GAA ATG TCG GAA CCG CAG GTC CTG GCC GAT ATC GAC TTG 1003Leu Ile Gly Glu Met Ser Glu Pro Gln Val Leu Ala Asp Ile Asp Leu245 250 255CCT GCC ACC TCG ATC GGC GCG CCT CGC CTG GAT GTA CTG GCG CTG ATC 1051Pro Ala Thr Ser Ile Gly Ala Pro Arg Leu Asp Val Leu Ala Leu Ile260 265 270CCC TAC CGC CAG ATC GCC GAA CGC GGT TTC GAG GCG GTG GAC GAT GAG 1099Pro Tyr Arg Gln Ile Ala Glu Arg Gly Phe Glu Ala Val Asp Asp Glu275 280 285 290TCG CCG CTG CTG GCG ATG AAC ATC ACC GAG CAG CAA TCC ATC AGC ATC 1147Ser Pro Leu Leu Ala Met Asn Ile Thr Glu Gln Gln Ser Ile Ser Ile295 300 305GAG CGC TTG CTG GGA ATG CTG CCC AAC GTG CCG ATC CAG TTG AAC AGC 1195Glu Arg Leu Leu Gly Met Leu Pro Asn Val Pro Ile Gln Leu Asn Ser310 315 320GAA CGC TTC GAC CTC AGC GAC GCG AGC TAC GCC GAG ATC GTC AGC CAG 1243Glu Arg Phe Asp Leu Ser Asp Ala Ser Tyr Ala Glu Ile Val Ser Gln325 330 335GTG ATC GCC AAT GAA ATC GGC TCC GGG GAA GGC GCC AAC TTC GTC ATC 1291Val Ile Ala Asn Glu Ile Gly Ser Gly Glu Gly Ala Asn Phe Val Ile340 345 350AAA CGC ACC TTC CTG GCC GAG ATC AGC GAA TAC GGC CCG GCC AGT GCG 1339Lys Arg Thr Phe Leu Ala Glu Ile Ser Glu Tyr Gly Pro Ala Ser Ala355 360 365 370CTG TCG TTC TTT CGC CAT CTG CTG GAA CGG GAG AAA GGC GCC TAC TGG 1387Leu Ser Phe Phe Arg His Leu Leu Glu Arg Glu Lys Gly Ala Tyr Trp375 380 385ACG TTC ATC ATC CAC ACC GGC AGC CGT ACC TTC GTG GGT GCG TCC CCC 1435Thr Phe Ile Ile His Thr Gly Ser Arg Thr Phe Val Gly Ala Ser Pro390 395 400GAG CGC CAC ATC AGC ATC AAG GAT GGG CTC TCG GTG ATG AAC CCC ATC 1483Glu Arg His Ile Ser Ile Lys Asp Gly Leu Ser Val Met Asn Pro Ile405 410 415AGC GGC ACT TAC CGC TAT CCG CCC GCC GGC CCC AAC CTG TCG GAA GTC 1531Ser Gly Thr Tyr Arg Tyr Pro Pro Ala Gly Pro Asn Leu Ser Glu Val420 425 430ATG GAC TTC CTG GCG GAT CGC AAG GAA GCC GAC GAG CTC TAC ATG GTG 1579Met Asp Phe Leu Ala Asp Arg Lys Glu Ala Asp Glu Leu Tyr Met Val435 440 445 450GTG GAT GAA GAG CTG TAA ATG ATG GCG CGC ATT TGT GAG GAC GGC GGC 1627Val Asp Glu Glu Leu * Met Met Ala Arg Ile Cys Glu Asp Gly Gly455 1 5 10CAC GTC CTC GGC CCT TAC CTC AAG GAA ATG GCG CAC CTG GCC CAC ACC 1675His Val Leu Gly Pro Tyr Leu Lys Glu Met Ala His Leu Ala His Thr15 20 25GAG TAC TTC ATC GAA GGC AAG ACC CAT CGC GAT GTA CGG GAA ATC CTG 1723Glu Tyr Phe Ile Glu Gly Lys Thr His Arg Asp Val Arg Glu Ile Leu30 35 40CGC GAA ACC CTG TTT GCG CCC ACC GTC ACC GGC AGC CCA CTG GAA AGC 1771Arg Glu Thr Leu Phe Ala Pro Thr Val Thr Gly Ser Pro Leu Glu Ser45 50 55GCC TGC CGG GTC ATC CAG CGC TAT GAN CCG CAA GGC CGC GCG TAC TAC 1819Ala Cys Arg Val Ile Gln Arg Tyr Xaa Pro Gln Gly Arg Ala Tyr Tyr60 65 70AGC GGC ATG GCT GCG CTG ATC GGC AGC GAT GGC AAG GGC GGG CGT TCC 1867Ser Gly Met Ala Ala Leu Ile Gly Ser Asp Gly Lys Gly Gly Arg Ser75 80 85 90CTG GAC TCC GCG ATC CTG ATT CGT ACC GCC GAC ATC GAT AAC AGC GGC 1915Leu Asp Ser Ala Ile Leu Ile Arg Thr Ala Asp Ile Asp Asn Ser Gly95 100 105GAG GTG CGG ATC AGC GTG GGC TCG ACC ATC GTG CGC CAT TCC GAC CCG 1963Glu Val Arg Ile Ser Val Gly Ser Thr Ile Val Arg His Ser Asp Pro110 115 120ATG ACC GAG GCT GCC GAA AGC CGG GCC AAG GCC ACT GGC CTG ATC AGC 2011Met Thr Glu Ala Ala Glu Ser Arg Ala Lys Ala Thr Gly Leu Ile Ser125 130 135GCA CTG AAA AAC CAG GCG CCC TCG CGC TTC GGC AAT CAC CTG CAA GTG 2059Ala Leu Lys Asn Gln Ala Pro Ser Arg Phe Gly Asn His Leu Gln Val140 145 150CGC GCC GCA TTG GCC AGC CGC AAT GCC TAC GTC TCG GAC TTC TGG CTG 2107Arg Ala Ala Leu Ala Ser Arg Asn Ala Tyr Val Ser Asp Phe Trp Leu155 160 165 170ATG GAC AGC CAG CAG CGG GAG CAG ATC CAG GCC GAC TTC AGT GGG CGC 2155Met Asp Ser Gln Gln Arg Glu Gln Ile Gln Ala Asp Phe Ser Gly Arg175 180 185CAG GTG CTG ATC GTC GAC GCC GAA GAC ACC TTC ACC TCG ATG ATC GCC 2203Gln Val Leu Ile Val Asp Ala Glu Asp Thr Phe Thr Ser Met Ile Ala190 195 200AAG CAA CTG CGG GCC CTG GGC CTG GTA GTG ACG GTG TGC AGC TTC AGC 2251Lys Gln Leu Arg Ala Leu Gly Leu Val Val Thr Val Cys Ser Phe Ser205 210 215GAC GAA TAC AGC TTT GAA GGC TAC GAC CTG GTC ATC ATG GGC CCC GGC 2299Asp Glu Tyr Ser Phe Glu Gly Tyr Asp Leu Val Ile Met Gly Pro Gly
220 225 230CCC GGC AAC CCG AGC GAA GTC CAA CAG CCG AAA ATC AAC CAC CTG CAC 2347Pro Gly Asn Pro Ser Glu Val Gln Gln Pro Lys Ile Asn His Leu His235 240 245 250GTG GCC ATC CGC TCC TTG CTC AGC CAG CAG CGG CCA TTC CTC GCG GTG 2395Val Ala Ile Arg Ser Leu Leu Ser Gln Gln Arg Pro Phe Leu Ala Val255 260 265TGC CTG AGC CAT CAG GTG CTG AGC CTG TGC CTG GGC CTG GAA CTG CAG 2443Cys Leu Ser His Gln Val Leu Ser Leu Cys Leu Gly Leu Glu Leu Gln270 275 280CGC AAA GCC ATT CCC AAC CAG GGC GTG CAA AAA CAG ATC GAC CTG TTT 2491Arg Lys Ala Ile Pro Asn Gln Gly Val Gln Lys Gln Ile Asp Leu Phe285 290 295GGC AAT GTC GAA CGG GTG GGT TTC TAC AAC ACC TTC GCC GCC CAG AGC 2539Gly Asn Val Glu Arg Val Gly Phe Tyr Asn Thr Phe Ala Ala Gln Ser300 305 310TCG AGT GAC CGC CTG GAC ATC GAC GGC ATC GGC ACC GTC GAA ATC AGC 2587Ser Ser Asp Arg Leu Asp Ile Asp Gly Ile Gly Thr Val Glu Ile Ser315 320 325 330CGC GAC AGC GAG ACC GGC GAG GTG CAT GCC CTG CGT GGC CCC TCG TTC 2635Arg Asp Ser Glu Thr Gly Glu Val His Ala Leu Arg Gly Pro Ser Phe335 340 345GCC TCC ATG CAG TTT CAT GCC GAG TCG CTG CTG ACC CAG GAA GGT CCG 2683Ala Ser Met Gln Phe His Ala Glu Ser Leu Leu Thr Gln Glu Gly Pro350 355 360CGC ATC ATC GCC GAC CTG CTG CGG CAC GCC CTG ATC CAC ACA CCT GTC 2731Arg Ile Ile Ala Asp Leu Leu Arg His Ala Leu Ile His Thr Pro Val365 370 375GAG AAC AAC GCT TCG GCC GCC GGG AGA TAA CC ATG CAC CAT TAC GTC 2778Glu Asn Asn Ala Ser Ala Ala Gly Arg * Met His His Tyr Val380 385 1 5ATC ATC GAC GCC TTT GCC AGC GTC CCG CTG GAA GGC AAT CCG GTC GCG 2826Ile Ile Asp Ala Phe Ala Ser Val Pro Leu Glu Gly Asn Pro Val Ala10 15 20GTG TTC TTT GAC GCC GAT GAC TTG TCG GCC GAG CAA ATG CAA CGC ATT 2874Val Phe Phe Asp Ala Asp Asp Leu Ser Ala Glu Gln Met Gln Arg Ile25 30 35GCC CGG GAG ATG AAC CTG TCG GAA ACC ACT TTC GTG CTC AAG CCA CGT 2922Ala Arg Glu Met Asn Leu Ser Glu Thr Thr Phe Val Leu Lys Pro Arg40 45 50AAC TGC GGC GAT GCG CTG ATC CGG ATC TTC ACC CCG GTC AAC GAA CTG 2970Asn Cys Gly Asp Ala Leu Ile Arg Ile Phe Thr Pro Val Asn Glu Leu55 60 65CCC TTC GCC GGG CAC CCG TTG CTG GGC ACG GAC ATT GCC CTG GGT GCG 3018Pro Phe Ala Gly His Pro Leu Leu Gly Thr Asp Ile Ala Leu Gly Ala70 75 80 85CGC ACC GAC AAT CAC CGG CTG TTC CTG GAA ACC CAG ATG GGC ACC ATC 3066Arg Thr Asp Asn His Arg Leu Phe Leu Glu Thr Gln Met Gly Thr Ile90 95 100GCC TTT GAG CTG GAG CGC CAG AAC GGC AGC GTC ATC GCC GCC AGC ATG 3114Ala Phe Glu Leu Glu Arg Gln Asn Gly Ser Val Ile Ala Ala Ser Met105 110 115GAC CAG CCG ATA CCG ACC TGG ACG GCC CTG GGG CGC GAC GCC GAG TTG 3162Asp Gln Pro Ile Pro Thr Trp Thr Ala Leu Gly Arg Asp Ala Glu Leu120 125 130CTC AAG GCC CTG GGC ATC AGC GAC TCG ACC TTT CCC ATC GAG ATC TAT 3210Leu Lys Ala Leu Gly Ile Ser Asp Ser Thr Phe Pro Ile Glu Ile Tyr135 140 145CAC AAC GGC CCG CGT CAT GTG TTT GTC GGC CTG CCA AGC ATC GCC GCG 3258His Asn Gly Pro Arg His Val Phe Val Gly Leu Pro Ser Ile Ala Ala150 155 160 165CTG TCG GCC CTG CAC CCC GAC CAC CGT GCC CTG TAC AGC TTC CAC GAC 3306Leu Ser Ala Leu His Pro Asp His Arg Ala Leu Tyr Ser Phe His Asp170 175 180ATG GCC ATC AAC TGT TTT GCC GGT GCG GGA CGG CGC TGG CGC AGC CGG 3354Met Ala Ile Asn Cys Phe Ala Gly Ala Gly Arg Arg Trp Arg Ser Arg185 190 195ATG TTC TCG CCG GCC TAT GGG GTG GTC GAG GAT GCG NCC ACG GGC TCC 3402Met Phe Ser Pro Ala Tyr Gly Val Val Glu Asp Ala Xaa Thr Gly Ser200 205 210GCT GCC GGG CCC TTG GCG ATC CAT CTG GCG CGG CAT GGC CAG ATC GAG 3450Ala Ala Gly Pro Leu Ala Ile His Leu Ala Arg His Gly Gln Ile Glu215 220 225TTC GGC CAG CAG ATC GAA ATT CTT CAG GGC GTG GAA ATC GGC CGC CCC 3498Phe Gly Gln Gln Ile Glu Ile Leu Gln Gly Val Glu Ile Gly Arg Pro230 235 240 245TCA CTC ATG TTC GCC CGG GCC GAG GGC CGC GCC GAT CAA CTG ACG CGG 3546Ser Leu Met Phe Ala Arg Ala Glu Gly Arg Ala Asp Gln Leu Thr Arg250 255 260GTC GAA GTA TCA GGC AAT GGC ATC ACC TTC GGA CGG GGG ACC ATC GTT 3594Val Glu Val Ser Gly Asn Gly Ile Thr Phe Gly Arg Gly Thr Ile Val265 270 275CTA TGA ACAGTTCAGT ACTAGGCAAG CCGCTGTTGG GTAAAGGCAT GTCGGAATCG 3650Leu *CTGACCGGCA CACTGGATGC GCCGTTCCCC GAGTACCAGA AGCCGCCTGC CGATCCCATG 3710AGCGTGCTGC ACAACTGGCT CGAACGCGCA CGCCGCGTGG GCATCCGCGA ACCCCGTGCG 3770CTGGCGCTGG CCACGGCTGA CAGCCAGGGC CGGCCTTCGA CACGCATCGT GGTGATCAGT 3830GAGATCAGTG ACACCGGGGT GCTGTTCAGC ACCCATGCCG GAAGCCAGAA AGGCCGCGAA 3890CTGACAGAGA ACCCCTGGGC CTCGGGGACG CTGTATTGGC GCGAAACCAG CCAGCAGATC 3950ATCCTCAATG GCCAGGCCGT GCGCATGCCG GATGCCAAGG CTGACGAGGC CTGGTTGAAG 4010CGCCCTTATG CCACGCATCC GATGTCATCG GTGTCTCGCC AGAGTGAAGA ACTCAAGGAT 4070GTTCAAGCCA TGCGCAACGC CGCCAGGGAA CTGGCCGAGG TTCAAGGTCC GCTGCCGCGT 4130CCCGAGGGTT ATTGCGTGTT TGAGTTACGG CTTGAATCGC TGGAGTTCTG GGGTAACGGC 4190GAGGAGCGCC TGCATGAACG CTTGCGCTAT GACCGCAGCG CTGAAGGCTG GAAACATCGC 4250CGGTTACAGC CATAGGGTCC CGCGATAAAC ATGCTTTGAA GTGCCTGGCT GCTCCAGCTT 4310CGAACTCATT GCGCAAACTT CAACACTTAT GACACCCGGT CAACATGAGA AAAGTCCAGA 4370TGCGAAAGAA CGCGTATTCG AAATACCAAA CAGAGAGTCC GGATCACCAA AGTGTGTAAC 4430GACATTAACT CCTATCTGAA TTTTATAGTT GCTCTAGAAC GTTGTCCTTG ACCCAGCGAT 4490AGACATCGGG CCAGAACCTA CATAAACAAA GTCAGACATT ACTGAGGCTG CTACCATGCT 4550AGATTTTCAA AACAAGCGTA AATATCTGAA AAGTGCAGAA TCCTTCAAAG CTT 4603(11)SEQ ID NO18信息(i)序列特征(A)长度456个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO18Met Thr Gly Ile Pro Ser Ile Val Pro Tyr Ala Leu Pro Thr Asn Arg1 5 10 15Asp Leu Pro Val Asn Leu Ala Gln Trp Ser Ile Asp Pro Glu Arg Ala20 25 30Val Leu Leu Val His Asp Met Gln Arg Tyr Phe Leu Arg Pro Leu Pro
35 40 45Asp Ala Leu Arg Asp Glu Val Val Ser Asn Ala Ala Arg Ile Arg Gln50 55 60Trp Ala Ala Asp Asn Gly Val Pro Val Ala Tyr Thr Ala Gln Pro Gly65 70 75 80Ser Met Ser Glu Glu Gln Arg Gly Leu Leu Lys Asp Phe Trp Gly Pro85 90 95Gly Met Lys Ala Ser Pro Ala Asp Arg Glu Val Val Gly Ala Leu Thr100 105 110Pro Lys Pro Gly Asp Trp Leu Leu Thr Lys Trp Arg Tyr Ser Ala Phe115 120 125Phe Asn Ser Asp Leu Leu Glu Arg Met Arg Ala Asn Gly Arg Asp Gln130 135 140Leu Ile Leu Cys Gly Val Tyr Ala His Val Gly Val Leu Ile Ser Thr145 150 155160Val Asp Ala Tyr Ser Asn Asp Ile Gln Pro Phe Leu Val Ala Asp Ala165 170 175Ile Ala Asp Phe Ser Lys Glu His His Trp Met Pro Ser Asn Thr Pro180 185 190Pro Ala Val Ala Pro Cys His His His Arg Arg Gly Gly Ala Met Ser195 200 205Gln Thr Ala Ala His Leu Met Glu Arg Ile Leu Gln Pro Ala Pro Glu210 215 220Pro Phe Ala Leu Leu Tyr Arg Pro Glu Ser Ser Gly Pro Gly Leu Leu225 230 235 240Asp Val Leu Ile Gly Glu Met Ser Glu Pro Gln Val Leu Ala Asp Ile245 250 255Asp Leu Pro Ala Thr Ser Ile Gly Ala Pro Arg Leu Asp Val Leu Ala260 265 270Leu Ile Pro Tyr Arg Gln Ile Ala Glu Arg Gly Phe Glu Ala Val Asp275 280 285Asp Glu Ser Pro Leu Leu Ala Met Asn Ile Thr Glu Gln Gln Ser Ile290 295 300Ser Ile Glu Arg Leu Leu Gly Met Leu Pro Asn Val Pro Ile Gln Leu305 310 315 320Asn Ser Glu Arg Phe Asp Leu Ser Asp Ala Ser Tyr Ala Glu Ile Val325 330 335Ser Gln Val Ile Ala Asn Glu Ile Gly Ser Gly Glu Gly Ala Asn Phe340 345 350Val Ile Lys Arg Thr Phe Leu Ala Glu Ile Ser Glu Tyr Gly Pro Ala355 360 365Ser Ala Leu Ser Phe Phe Arg His Leu Leu Glu Arg Glu Lys Gly Ala370 375 380Tyr Trp Thr Phe Ile Ile His Thr Gly Ser Arg Thr Phe Val Gly Ala385 390395 400Ser Pro Glu Arg His Ile Ser Ile Lys Asp Gly Leu Ser Val Met Asn405 410 415Pro Ile Ser Gly Thr Tyr Arg Tyr Pro Pro Ala Gly Pro Asn Leu Ser420 425 430Glu Val Met Asp Phe Leu Ala Asp Arg Lys Glu Ala Asp Glu Leu Tyr435 440 445Met Val Val Asp Glu Glu Leu *450 455(2)SEQ ID NO19信息(i)序列特征(A)长度388个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO19Met Met Ala Arg Ile Cys Glu Asp Gly Gly His Val Leu Gly Pro Tyr1 5 10 15Leu Lys Glu Met Ala His Leu Ala His Thr Glu Tyr Phe Ile Glu Gly20 25 30Lys Thr His Arg Asp Val Arg Glu Ile Leu Arg Glu Thr Leu Phe Ala35 40 45Pro Thr Val Thr Gly Ser Pro Leu Glu Ser Ala Cys Arg Val Ile Gln50 55 60Arg Tyr Xaa Pro Gln Gly Arg Ala Tyr Tyr Ser Gly Met Ala Ala Leu65 70 75 80Ile Gly Ser Asp Gly Lys Gly Gly Arg Ser Leu Asp Ser Ala Ile Leu85 90 95Ile Arg Thr Ala Asp Ile Asp Asn Ser Gly Glu Val Arg Ile Ser Val100 105 110Gly Ser Thr Ile Val Arg His Ser Asp Pro Met Thr Glu Ala Ala Glu115 120 125Ser Arg Ala Lys Ala Thr Gly Leu Ile Ser Ala Leu Lys Asn Gln Ala130 135 140Pro Ser Arg Phe Gly Asn His Leu Gln Val Arg Ala Ala Leu Ala Ser145 150 155 160Arg Asn Ala Tyr Val Ser Asp Phe Trp Leu Met Asp Ser Gln Gln Arg165 170 175Glu Gln Ile Gln Ala Asp Phe Ser Gly Arg Gln Val Leu Ile Val Asp180 185 190Ala Glu Asp Thr Phe Thr Ser Met Ile Ala Lys Gln Leu Arg Ala Leu195 200 205Gly Leu Val Val Thr Val Cys Ser Phe Ser Asp Glu Tyr Ser Phe Glu210 215 220Gly Tyr Asp Leu Val Ile Met Gly Pro Gly Pro Gly Asn Pro Ser Glu225 230 235 240Val Gln Gln Pro Lys Ile Asn His Leu His Val Ala Ile Arg Ser Leu245 250 255Leu Ser Gln Gln Arg Pro Phe Leu Ala Val Cys Leu Ser His Gln Val260 265 270Leu Ser Leu Cys Leu Gly Leu Glu Leu Gln Arg Lys Ala Ile Pro Asn275 280 285Gln Gly Val Gln Lys Gln Ile Asp Leu Phe Gly Asn Val Glu Arg Val290 295 300Gly Phe Tyr Asn Thr Phe Ala Ala Gln Ser Ser Ser Asp Arg Leu Asp305 310 315 320Ile Asp Gly Ile Gly Thr Val Glu Ile Ser Arg Asp Ser Glu Thr Gly325 330 335Glu Val His Ala Leu Arg Gly Pro Ser Phe Ala Ser Met Gln Phe His340 345 350Ala Glu Ser Leu Leu Thr Gln Glu Gly Pro Arg Ile Ile Ala Asp Leu355 360 365Leu Arg His Ala Leu Ile His Thr Pro Val Glu Asn Asn Ala Ser Ala370 375 380Ala Gly Arg *(2)SEQ ID NO20信息(i)序列特征(A)长度279个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO20Met His His Tyr Val Ile Ile Asp Ala Phe Ala Ser Val Pro Leu Glu1 5 10 15Gly Asn Pro Val Ala Val Phe Phe Asp Ala Asp Asp Leu Ser Ala Glu20 25 30Gln Met Gln Arg Ile Ala Arg Glu Met Asn Leu Ser Glu Thr Thr Phe35 40 45Val Leu Lys Pro Arg Asn Cys Gly Asp Ala Leu Ile Arg Ile Phe Thr50 55 60Pro Val Asn Glu Leu Pro Phe Ala Gly His Pro Leu Leu Gly Thr Asp65 70 75 80Ile Ala Leu Gly Ala Arg Thr Asp Asn His Arg Leu Phe Leu Glu Thr85 90 95Gln Met Gly Thr Ile Ala Phe Glu Leu Glu Arg Gln Asn Gly Ser Val100 105 110Ile Ala Ala Ser Met Asp Gln Pro Ile Pro Thr Trp Thr Ala Leu Gly115 120 125Arg Asp Ala Glu Leu Leu Lys Ala Leu Gly Ile Ser Asp Ser Thr Phe130 135 140Pro Ile Glu Ile Tyr His Asn Gly Pro Arg His Val Phe Val Gly Leu145 150 155 160Pro Ser Ile Ala Ala Leu Ser Ala Leu His Pro Asp His Arg Ala Leu165 170 175Tyr Ser Phe His Asp Met Ala Ile Asn Cys Phe Ala Gly Ala Gly Arg180 185 190Arg Trp Arg Ser Arg Met Phe Ser Pro Ala Tyr Gly Val Val Glu Asp195 200 205Ala Xaa Thr Gly Ser Ala Ala Gly Pro Leu Ala Ile His Leu Ala Arg210 215 220His Gly Gln Ile Glu Phe Gly Gln Gln Ile Glu Ile Leu Gln Gly Val225 230 235 240Glu Ile Gly Arg Pro Ser Leu Met Phe Ala Arg Ala Glu Gly Arg Ala245 250 255Asp Gln Leu Thr Arg Val Glu Val Ser Gly Asn Gly Ile Thr Phe Gly260 265 270Arg Gly Thr Ile Val Leu *275(11)SEQ ID NO21信息(i)序列特征(A)长度1007个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(v)特征(I)名称/关键词CDS(J)位置1…669(K)其它信息/基因=“phz4”/标记=ORF4/注=“这一DNA序列从SEQ ID NO17重复,以便重叠ORF4可被分别翻译”(xi)序列描述SEQ ID NO21ATG AAC AGT TCA GTA CTA GGC AAG CCG CTG TTG GGT AAA GGC ATG TCG 48Met Asn Ser Ser Val Leu Gly Lys Pro Leu Leu Gly Lys Gly Met Ser1 5 10 15GAA TCG CTG ACC GGC ACA CTG GAT GCG CCG TTC CCC GAG TAC CAG AAG 96Glu Ser Leu Thr Gly Thr Leu Asp Ala Pro Phe Pro Glu Tyr Gln Lys20 25 30CCG CCT GCC GAT CCC ATG AGC GTG CTG CAC AAC TGG CTC GAA CGC GCA144Pro Pro Ala Asp Pro Met Ser Val Leu His Asn Trp Leu Glu Arg Ala35 40 45CGC CGC GTG GGC ATC CGC GAA CCC CGT GCG CTG GCG CTG GCC ACG GCT192Arg Arg Val Gly Ile Arg Glu Pro Arg Ala Leu Ala Leu Ala Thr Ala
50 55 60GAC AGC CAG GGC CGG CCT TCG ACA CGC ATC GTG GTG ATC AGT GAG ATC 240Asp Ser Gln Gly Arg Pro Ser Thr Arg Ile Val Val Ile Ser Glu Ile65 70 75 80AGT GAC ACC GGG GTG CTG TTC AGC ACC CAT GCC GGA AGC CAG AAA GGC 288Ser Asp Thr Gly Val Leu Phe Ser Thr His Ala Gly Ser Gln Lys Gly85 90 95CGC GAA CTG ACA GAG AAC CCC TGG GCC TCG GGG ACG CTG TAT TGG CGC 336Arg Glu Leu Thr Glu Asn Pro Trp Ala Ser Gly Thr Leu Tyr Trp Arg100 105 110GAA ACC AGC CAG CAG ATC ATC CTC AAT GGC CAG GCC GTG CGC ATG CCG 384Glu Thr Ser Gln Gln Ile Ile Leu Asn Gly Gln Ala Val Arg Met Pro115 120 125GAT GCC AAG GCT GAC GAG GCC TGG TTG AAG CGC CCT TAT GCC ACG CAT 432Asp Ala Lys Ala Asp Glu Ala Trp Leu Lys Arg Pro Tyr Ala Thr His130 135 140CCG ATG TCA TCG GTG TCT CGC CAG AGT GAA GAA CTC AAG GAT GTT CAA 480Pro Met Ser Ser Val Ser Arg Gln Ser Glu Glu Leu Lys Asp Val Gln145 150 155 160GCC ATG CGC AAC GCC GCC AGG GAA CTG GCC GAG GTT CAA GGT CCG CTG 528Ala Met Arg Asn Ala Ala Arg Glu Leu Ala Glu Val Gln Gly Pro Leu165 170 175CCG CGT CCC GAG GGT TAT TGC GTG TTT GAG TTA CGG CTT GAA TCG CTG 576Pro Arg Pro Glu Gly Tyr Cys Val Phe Glu Leu Arg Leu Glu Ser Leu180 185 190GAG TTC TGG GGT AAC GGC GAG GAG CGC CTG CAT GAA CGC TTG CGC TAT 624Glu Phe Trp Gly Asn Gly Glu Glu Arg Leu His Glu Arg Leu Arg Tyr195 200 205GAC CGC AGC GCT GAA GGC TGG AAA CAT CGC CGG TTA CAG CCA TAGGGTCCCG676Asp Arg Ser Ala Glu Gly Trp Lys His Arg Arg Leu Gln Pro210 215 220CGATAAACAT GCTTTGAAGT GCCTGGCTGC TCCAGCTTCG AACTCATTGC GCAAACTTCA 736ACACTTATGA CACCCGGTCA ACATGAGAAA AGTCCAGATG CGAAAGAACG CGTATTCGAA 796ATACCAAACA GAGAGTCCGG ATCACCAAAG TGTGTAACGA CATTAACTCC TATCTGAATT 856TTATAGTTGC TCTAGAACGT TGTCCTTGAC CCAGCGATAG ACATCGGGCC AGAACCTACA 916TAAACAAAGT CAGACATTAC TGAGGCTGCT ACCATGCTAG ATTTTCAAAA CAAGCGTAAA 976TATCTGAAAA GTGCAGAATC CTTCAAAGCT T1007(2)SEQ ID NO22信息(i)序列特征(A)长度222个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO22Met Asn Ser Ser Val Leu Gly Lys Pro Leu Leu Gly Lys Gly Met Ser1 5 10 15Glu Ser Leu Thr Gly Thr Leu Asp Ala Pro Phe Pro Glu Tyr Gln Lys20 25 30Pro Pro Ala Asp Pro Met Ser Val Leu His Asn Trp Leu Glu Arg Ala35 40 45Arg Arg Val Gly Ile Arg Glu Pro Arg Ala Leu Ala Leu Ala Thr Ala50 55 60Asp Ser Gln Gly Arg Pro Ser Thr Arg Ile Val Val Ile Ser Glu Ile65 70 75 80Ser Asp Thr Gly Val Leu Phe Ser Thr His Ala Gly Ser Gln Lys Gly85 90 95Arg Glu Leu Thr Glu Asn Pro Trp Ala Ser Gly Thr Leu Tyr Trp Arg100 105 110Glu Thr Ser Gln Gln Ile Ile Leu Asn Gly Gln Ala Val Arg Met Pro115 120 125Asp Ala Lys Ala Asp Glu Ala Trp Leu Lys Arg Pro Tyr Ala Thr His130 135 140Pro Met Ser Ser Val Ser Arg Gln Ser Glu Glu Leu Lys Asp Val Gln145 150 155 160Ala Met Arg Asn Ala Ala Arg Glu Leu Ala Glu Val Gln Gly Pro Leu165 170 175Pro Arg Pro Glu Gly Tyr Cys Val Phe Glu Leu Arg Leu Glu Ser Leu180 185 190Glu Phe Trp Gly Asn Gly Glu Glu Arg Leu His Glu Arg Leu Arg Tyr195 200 205Asp Arg Ser Ala Glu Gly Trp Lys His Arg Arg Leu Gln Pro210 215 220
权利要求
1.需之多肽的分离的DNA分子,其中所说的APS选自吡咯尼群和soraphen。
2.权利要求1的分离的DNA分子,其中所说的APS是吡咯尼群,所说的多肽选自SEQ ID NO.1-SEQ ID NO.5。
3.权利要求1的分离的DNA分子,其中所说的APS是吡咯尼群,所说的DNA分子具有SEQ ID NO.1所示的序列。
4.权利要求1的分离的DNA分子,其中所说的APS是吡咯尼群,所说的DNA分子具有SEQ ID NO.6所示的序列。
5.按照权利要求1-4任一之DNA分子,该分子经基因工程操作形成植物基因组的一部分。
6.一种含有权利要求1的分离的DNA分子的表达载体,其中所说的载体能够在宿主细胞中表达一种或多种所说DNA分子编码的多肽。
7.一种由含有权利要求1的分离的DNA分子的表达载体转化的异源宿主,其中所说的宿主选自细菌、真菌、酵母和植物。
8.权利要求7的异源细胞,其中所说的宿主是植物。
9.一种能够合成抗病原体物质的宿主,所说的抗病原体物质在所说的宿主中不能天然产生。
10.权利要求9的宿主,其中所说的抗病原体物质选自含碳水化合物抗生素、肽抗生素、含氮杂环抗生素、含氧杂环抗生素、含氮和氧杂环抗生素、聚酮化合物、大环内酯和醌。
11.权利要求10的宿主,其中所说的肽抗生素是rhizocticin。
12.权利要求10的宿主,其中所说的含碳水化合物抗生素是氨基苷。
13.权利要求10的宿主,其中所说的抗病原体物质是含氮杂环抗生素。
14.权利要求13的宿主,其中所说的含氮杂环抗生素选自吩嗪和吡咯尼群。
15.权利要求10的宿主,其中所说的抗病原体物质是聚酮化合物。
16.权利要求15的宿主,其中所说的聚酮化合物是soraphen。
17.权利要求9的宿主,其中所说的抗病原体物质是间苯二酚。
18.权利要求9的宿主,其中所说的抗病原体物质是甲氧基丙烯酸盐。
19.权利要求18的宿主,其中所说的甲氧基丙烯酸盐是strobilurin B。
20.权利要求9的宿主,其中所说的宿主选自植物、细菌和真菌。
21.权利要求20的宿主,其中所说的宿主是植物。
22.权利要求21的宿主,其中所说的宿主是杂种植物。
23.用保护剂包覆的按照权利要求21或22之宿主的繁殖材料。
24.按照权利要求23的繁殖材料,该繁殖材料包含选自除草剂、杀虫剂、杀真菌剂、杀细菌剂、杀线虫剂、灭螺剂或它们的混合物的制剂。
25.按照权利要求23或24的繁殖材料,其特征在于该繁殖材料包括种子。
26.权利要求20的宿主,其中所说的宿主是生物防治剂。
27.权利要求20的宿主,其中所说的宿主是植物移生生物体。
28.权利要求20的宿主,其中所说的宿主适于产生大量的所说APS。
29.一种宿主,该宿主能够在其中合成提高量的其天然产生的抗病原体物质,所说宿主被一种或多种DNA分子转化过,所说DNA分子共同(collectively)编码合成所说的抗病原体物质所需的全部多肽。
30.一种保护植物使其抵抗植物病原体侵害的方法,该方法包括用一种或多种载体转化所说的植物,所说载体能够共同表达在所说植物中以抑制所说植物病原体有效的量产生抗植物病原体物质所需的全部多肽。
31.一种保护植物使其抵抗植物病原体侵害的方法,该方法包括用由一种或多种载体转化的生物防治生物体处理所说的植物,所说载体能够共同表达在所说植物中以抑制所说植物病原体有效的量产生抗植物病原物质所需的全部多肽。
32.一种保护植物使其抵抗植物病原体侵害的方法,该方法包括向所说植物施用包含所说植物病原体抑制量之抗植物病原体物质的组合物,其中所说的抗植物病原体物质是从权利要求28的宿主获得的。
33.一种大量产生均质相同手性之抗病原体物质(APS)的方法,该方法包括(a)用一种或多种载体转化宿主,所说载体能够共同表达在所说宿主中产生所说APS所需的全部多肽;(b)在允许产生所说APS的条件下培养所说的宿主;和(c)从所说的宿主收集所说的APS。
34.一种组合物,该组合物包含由权利要求33的方法产生的相同手性的抗病原体物质(APS)。
35.一种从生物合成抗病原体物质(APS)所需之微生物鉴别和分离基因的方法,其中所说基因的表达在生物合成所说APS之调节物控制下,该方法包括(a)将所说微生物的基因片段之文库克隆进载体,邻近于载体中无启动子报道基因,以便仅在启动子功能由克隆片段提供时才出现所说报道基因的表达;(b)将步骤(a)产生的载体转化进合适的宿主中;(c)鉴别仅在所说调节物存在下表达所说报道基因的步骤(b)的那些转化体;和(d)鉴别和分离可操作连接到存在于步骤(c)中鉴别的转化体中的所说微生物的基因片段上的DNA片段;其中步骤(d)中分离和鉴别的所说DNA片段编码一种或多种生物合成所说APS所需之多肽。
36.一种分离的多肽,所说多肽是在异源细胞中生物合成抗病原体物质(APS)所需的,其中所说的APS选自吡咯尼群和soraphen。
37.权利要求36的多肽,其中所说的APS是吡咯尼群,所说的多肽选自SEQID NO.2-SEQ ID NO.5。
38.权利要求36的多肽,其中所说的APS是吡咯尼群,所说的多肽由SEQID NO.1所示的核苷酸序列编码。
39.权利要求36的多肽,其中所说的APS是soraphen,所说的多肽由SEQID NO.6所示的核苷酸序列编码。
40.按照权利要求1的DNA在遗传操作宿主生物体以表达所说抗病原体物质上的用途。
41.按照权利要求40的用途,其中所说的宿主选自植物、细菌、酵母和真菌。
42.按照权利要求40的用途,其中表达的所说抗病原体物质不是所说宿主中天然产生的。
43.按照权利要求40的用途,其中产生增加量的所说宿主中天然产生的抗病原体物质。
44.按照权利要求7的宿主在保护植物使其抵抗植物病原体侵害上的用途。
45.按照权利要求34的组合物在保护植物使其抵抗植物病原体侵害上的用途。
46.按照权利要求5的DNA在亲本植物向其子代转移表达抗病原体物质分子之能力上的用途。
全文摘要
本发明涉及经重组表达生物合成抗病原体物质(APS)所需的多肽在宿主中产生APS的方法。本发明提供了编码产生特定的抗病原体物质必需之多肽的基因,以及鉴别和分离重组生物合成任何所需APS需要的基因的方法。克隆的基因可被转化和在所需的宿主有机体中表达,以便按照本发明为各种用途产生APS,包括保护宿主使其抵抗病原体侵害,开发用作生物防治生物体的宿主和产生大量均质的APS。
文档编号C12N15/31GK1152941SQ95194139
公开日1997年6月25日 申请日期1995年5月30日 优先权日1994年6月8日
发明者J·M·利冈, T·舒普, J·J·拜克, D·S·海尔, J·A·里亚尔斯, T·D·加福尼, S·T·拉姆, P·E·哈莫尔, S·J·尤克尼斯 申请人:希巴-盖吉股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1