适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶的制作方法

文档序号:426726阅读:581来源:国知局
专利名称:适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶的制作方法
技术领域
本发明是生物技术领域。更具体地,本发明设计鉴定编码Δ12脂肪酸去饱和酶的核酸片段,所述酶可用于破坏或者增强油质微生物,如油质酵母中多不饱和脂肪酸的产生。
背景技术
很久就认识到某些多不饱和脂肪酸,或者PUFA,是健康细胞的重要生物组分。例如,认识到此类PUFA为·“必需”脂肪酶,其不能在哺乳动物中从头合成,必须在食物中获得或者通过亚油酸(LA)或者α-亚麻酸(ALA)的进一步去饱和和延长得到;·细胞的质膜成分,其中他们可以以诸如磷脂或者甘油三酯的形式发现;·对于本身发育,尤其在正发育的婴儿脑中,和对于组织形成和修复是必须的;和·在哺乳动物中重要的一些生物活性类花生酸的前体,包括前列环素、类花生酸、白三烯和前列腺素。
在20世纪70年代,Greenland Eskimos的观察将心脏病的低发病率和长链ω-3 PUFAs的大量摄入联系起来(Dyerberg,J.等人,Amer.J.Clin Nutr.28958-966(1975);Dyerberg,J.等人,Lancet 2(8081)117-119(July 15,1978))。更近的研究已经证实了ω-3 PUFAs的心血管保护作用(Shimokawa,H.,World Rev NutrDiet,88100-108(2001);von Schacky,C.,和Dyerberg,J.,World Rev Nutr Diet,8890-99(2001))。此外,已经发现一些病症响应ω-3脂肪酸的治疗,所述病症为诸如血管成形术后再狭窄率、炎症和类风湿性关节炎、哮喘、银屑病和湿疹的症状。已经表明γ-亚麻酸(GLA,一种ω-6 PUFA)降低与压力相关的血压升高和改善算术测验的表现。已经表明GLA和二同型-γ-亚麻酸(DGLA,另一种ω-6 PUFA)抑制血小板聚集、导致血管舒张、降低胆固醇水平和抑制血管壁平滑肌和纤维组织的增殖(Brenner等人,Adv.Exp.Med.Biol.8385-101(1976))。已经表明GLA或者DGLA单独或者与二十碳五烯酸(EPA,一种ω-3 PUFA)联合施用减少或者预防非甾体抗炎药导致的胃肠道出血和其他副作用(U.S.4,666,701)。此外,已经表明GLA和DGLA预防或者治疗子宫内膜异位和月经前期综合征(U.S.4,758,592)和治疗病毒感染后的肌痛性脑脊髓炎和慢性疲劳(U.S.5,116,871)。其他证据表明PUFAs可能涉及钙代谢的调节,提示它们可用于治疗或者预防骨质疏松和肾和尿道结石。最后,PUFAs可以用于治疗癌症和糖尿病(U.S.4,826,877;Horrobin等人,Am.J.Clin.Nutr.57(Suppl.)732S-737S(1993))。
PUFAs通常分成两种主要类别(由ω-6和ω-3脂肪酸组成),所述类别通过必需脂肪酸LA和ALA的去饱和和延长得到。尽管存在来自天然途径的多种通过商业途径可以获得的PUFAs[例如,月见草、琉璃苣和黑加仑的种子;丝状真菌(被孢霉属,Mortierella),Porphyridium(红藻),鱼油和海洋浮游生物(Cyclotella,Nitzschia,Crypthecodinium)],但是这些生产方法具有一些缺点。首先,天然来源如鱼和植物倾向于具有高度异质的油组分。因此,从这些来源得到的油需要多方面纯化以分离或者富集一种或多种所希望的PUFAs。天然来源在有效性方面也受到不可控制的波动性(例如,由于天然、痰病或者对于鱼原料,由于过度捕捞);并且,产生PUFAs的作物通常与开发用于食物生产的杂交作物在经济上没有竞争性。天然产生PUFAs的一些生物(例如,Porphyridium,被孢霉属)的大规模发酵也可能是昂贵和/或难以在商业规模上培养。
由于上述限制,已经进行了大量工作以1)开发容易经济生产的PUFAs的重组来源;和2)修饰脂肪酸生物合成途径以能够产生所希望的PUFAs。例如,在过去几年里已经在分离、克隆和操作来自多种生物的脂肪酸去饱和酶和延伸酶(elongase)基因中取得了进展。这些基因序列的知识提供了在不天然产生PUFAs的新的宿主生物中产生所希望的脂肪酸和/或脂肪酸组合物的前景。文献报导了在酿酒酵母(Saccharomyces cerevisiae)中的许多实例,如Domergue,F.,等人(Eur.J.Biochem.2694105-4113(2002)),其中,将来自海洋硅藻(Phaeodactylum tricornutum)的两种去饱和酶克隆到酿酒酵母中,导致产生EPA;Beaudoin F.,等人(Proc.Natl.Acad.Sci.U.S.A.97(12)6421-6(2000)),其中使用来自秀丽隐杆线虫(Caenorhabditis elegans)的基因,在酿酒酵母中重构ω-3和ω-6PUFA生物合成途径;Dyer,J.M.,等人(Appl.Eniv.Microbiol.,59224-230(2002)),其中在酿酒酵母中表达植物脂肪酸去饱和酶(FAD2和FAD3),和U.S.6,136,574(Knutzon等人,AbbottLaboratories),其中将来自Brassica napus的一种去饱和酶和来自真菌Mortierella alpina的两种去饱和酶克隆到酿酒酵母中,导致产生LA、GLA、ALA和STA。然而,仍然需要适宜的微生物系统,在所述系统中可以表达这些类型的基因以提供一种或多种PUFAs的经济量的商业生产。此外,需要富含特定PUFAs的油,特别是EPA和DHA。
以前未调查作为PUFAs的生产平台的一类微生物是油质酵母。这些生物积累高达它们的干细胞重量的80%的油。生长具有高油含量的油质酵母的技术是成熟的(例如,见EP 0 005 277Bl;Ratledge,C.,Prog.Ind.Microbiol.16119-206(1982)),并且与商业微藻发酵生产ω-3-或ω-6 PUFAs相比可以提供成本优势。完整酵母细胞还可以代表封装富含ω-3或ω-6 PUFA的油用于功能性食物和动物饲料补充物的方便的方法。
尽管具有上述优点,但是多数油质酵母天然缺乏ω-3和ω-6PUFA,因为这些生物中天然产生的PUFAs通常局限于18:2脂肪酸(较不常见地;18:3脂肪酸)。从而,待解决的问题是开发积累富含ω-3和/或ω-6脂肪酸的油。为此,不仅必需引入允许在油质酵母中合成和积累ω-3和/或ω-6脂肪酸的所需要的去饱和酶和延伸酶,而且必需增加18:2底物(即,LA)的有效性。通常,该底物的有效性受到Δ12去饱和酶的活性的控制,Δ12去饱和酶催化油酸向LA的转化。
在公共文献中公开了多种已知的Δ12去饱和酶,它们的一些来自真菌来源(例如,高山被孢霉(Mortierella alpina)、Emericellanidulans、鲁西毛霉(Mucor rouxii))。还未知这些去饱和酶可以有效改变油质酵母中的脂肪酸组成,尽管例如,高山被孢霉去饱和酶以前已经在非油质酵母酿酒酵母中表达并且能够积累18:2(Sakuradani E.,等人,Eur J Biochem.261(3)812-20(1999))。WO 2003/099216描述了来自粗糙脉孢霉(Neurosporacrassa)和灰葡萄孢(Botrytis cinerea)的Δ12去饱和酶。在酿酒酵母中的随后表达证实了粗糙脉孢霉能够将油酸转化成18:2;然而,该反应的百分数底物转化为仅68%(计算为([18:2]/[18:1+18:2])*100)。从而,需要鉴定和分离编码Δ12去饱和酶的基因,所述Δ12去饱和酶能够支持在产油宿主生物(例如,油质酵母)中产生高水平18:2(LA)以用于生产PUFAs。
通过从真菌串珠镰孢(Fusarium moniliforme)分离编码Δ12去饱和酶的基因并阐明当在油质酵母中表达是将油酸转化成18:2(LA)的令人惊奇的有效转化,申请人解决了所陈述的问题。此外,在构巢曲霉(Aspergillus nidulans)、黄曲霉(Aspergillus flavus)、烟曲霉(Aspergillus fumigatus)、Magnaporthe grisea,粗糙脉孢霉和禾本科镰孢(Fusarium graminearium)中已经鉴定了该Δ12去饱和酶的直向同源物(ortholog)。
发明概述本发明涉及从镰孢菌(Fusarium)分离的编码Δ12去饱和酶的基因,其用于操作生物化学途径,导致产生ω-3和ω-6脂肪酸。因此,本发明提供了编码真菌Δ12去饱和酶的分离的核酸片段,其选自由(a)分离的核酸片段,其编码如SEQ ID NO4中给出的氨基酸序列;(b)分离的核酸片段,其与(a)在下面的条件下杂交0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗涤;或者(c)分离的核酸片段,其与(a)或者(b)互补,构成的组。
在一个特定实施方案中,本发明提供了分离的核酸片段,其包含第一种核苷酸序列,该核苷酸序列编码Δ12去饱和酶,基于Clustal比对方法与具有SEQ ID NO3中给出的序列的核酸片段比较时具有至少89.2%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
类似地,本发明提供了分离的核酸片段,其包含编码至少477个氨基酸的Δ12去饱和酶的第一种核苷酸序列,所述Δ12去饱和酶基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少95%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
类似地,本发明提供了本发明的分离的核酸编码的多肽以及这些核酸的遗传嵌合体和包含该遗传嵌合体的经转化的宿主细胞。
在另一实施方案中,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)用本发明的核酸序列探测基因组文库;(b)鉴定与本发明的核酸片段杂交的DNA克隆;和(c)对包含步骤(b)中鉴定的基因组片段测序,其中所测序的基因组片段编码Δ12去饱和酶。
类似地,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)合成对应于SEQ ID NOs4,8,12,16,20,21和22中给出的序列的部分的至少一种寡核苷酸引物;和(b)使用步骤(a)的寡核苷酸引物扩增克隆载体中存在的插入片段;其中所扩增的插入片段编码Δ12去饱和酶的氨基酸序列的一部分。
在另一实施方案中,本发明提供了产生亚油酸的方法,其包括a)提供油质酵母,其包含(i)编码具有Δ12去饱和酶活性的真菌多肽的分离的核酸,所述多肽当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)油酸来源;b)在其中嵌合去饱和酶基因表达并且油酸转化成亚油酸的条件下生长步骤(a)的酵母;和c)任选回收步骤(b)的亚油酸。
类似地,本发明提供了产生ω-3或ω-6多不饱和脂肪酸的方法,其包括a)提供油质酵母,其包含
(i)编码具有Δ12去饱和酶活性的蛋白质的分离的核酸片段,所述蛋白质当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)编码功能ω-3/ω-6脂肪酸生物合成途径的基因;b)提供包含油酸的去饱和酶底物的来源;和c)将(a)的油质酵母与(b)的去饱和酶底物在其中产生多不饱和脂肪酸的条件下接触;和d)任选回收步骤(c)的多不饱和脂肪酸。
此外,本发明提供了通过本发明的方法产生的微生物油。
附图简述和序列描述

图1显示了油质酵母中脂质积累的生物化学机制的示意图。
图2阐明了ω-3和ω-6脂肪酸生物合成途径。
图3阐明了构建用于在Yarrowia lipolytica中基因表达的质粒载体pY5。
图4显示了使用Megalign DNASTAR软件产生的来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质的系统树。
图5显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质之间的逐对比较(%同一性)。
图6显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌的与Yarrowia lipolytica Δ12去饱和酶具有同源性的蛋白质和来自一些其他真菌和非真菌物种的Δ12去饱和酶蛋白质之间的逐对比较(%同一性)。
图7提供了pKUNF12T6E的质粒图。
从下面的详细描述和所附序列描述可以更完全地理解本发明,所述序列描述形成本申请的一部分。
下面的序列符合37C.F.R.§1.821-1.825(“Requirements forPatent Applications Containing Nucleotide Sequences and/orAmino Acid Sequence Disclosures-the Sequence Rules”)并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列表要求(5.2和49.5(a-bis)条,和Section 208和Annex C of theAdministrative Instructions)一致。用于核苷酸和氨基酸序列数据的符号和格式符合37C.F.R.§1.822中给出的条例。
SEQ ID NOs1-22,51和52是表1中鉴定的ORFs编码基因或者蛋白质。
表1去饱和酶基因和蛋白质SEQ ID号概述
表1(续)
SEQ ID NOs23和24分别是引物TEF 5’和TEF 3’,它们用于分离TEF启动子。
SEQ ID NOs25和26分别是用于分离XPR2转录终止子的引物XPR5’和XPR 3’。
SEQ ID NOs27-38对应于用于质粒构造的引物YL5、YL6、YL9、YL10、YL7、YL8、YL3、YL4、YL1、YL2、YL61和YL62。
SEQ ID NOs39和41分别是用于分离Yarrowia lipolytica Δ12去饱和酶基因的鉴定为P73和P76的简并引物。
SEQ ID NOs40和42分别是对应于简并引物P73和P76的简并引物P73和P76的氨基酸共有序列。
SEQ ID NOs43-46分别对应于用于天然Yarrowia lipolyticaΔ12去饱和酶基因的定向破坏的引物P99、P100、P101和P102。
SEQ ID NOs47-50分别对应于筛选所破坏的Y.lipolytica Δ12去饱和酶基因的定向整合的引物P119、P120、P121和P122。
SEQ ID NOs53和54分别对应于扩增全长Y.lipolytica Δ12去饱和酶编码区的引物P147和P148。
SEQ ID NOs55和56分别对应于扩增全长串珠镰孢Δ12去饱和酶编码区的引物P194和P195。
SEQ ID NO57提供了质粒pKUNF12T6E的DNA序列。
SEQ ID NO58对应于Yarrowia lipolytica FBAIN启动子区。
SEQ ID NO59是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的延伸酶1基因的957bp核苷酸序列,而SEQ IDNO60是对应的318个氨基酸的序列。
SEQ ID NO61是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的Δ6去饱和酶基因的1374bp核苷酸序列,而SEQ ID NO62是对应的457个氨基酸的序列。
SEQ ID NO63对应于Yarrowia lipolytica FBA启动子区。
SEQ ID NO64是经密码子优化用于在Y.lipolytica中表达的来自Thraustochytrium aureum的合成的延伸酶2基因的819bp核苷酸序列,而SEQ ID NO65是对应的272个氨基酸的序列。
SEQ ID NO66对应于最适在Yarrowia sp中表达的密码子优化的翻译起始位点。
发明详述根据主题发明,申请人已经分离并证实了编码Δ12去饱和酶的串珠镰孢(Fusarium moniliforme)基因的身份并鉴定了它的在其他真菌中的直向同源物。此外,提供了允许修饰长链多不饱和脂肪酸(PUFA)含量和油质酵母如Yarrowia lipolytica的组分的方法和组合物。
本发明涉及新的Δ12去饱和酶和其编码基因,所述基因可以用于操作用于产生健康PUFAs的生物化学途径。从而,主题发明发现了许多应用。通过本文公开的方法产生的PUFAs或者其衍生物可以用作饮食替代品或者补充物,尤其婴儿配方,用于经历静脉内营养法的患者或者用于预防或者治疗营养不良。备选地,所纯化的PUFAs(或者其衍生物)可以掺入到所配制的烹调油、脂肪或者人造黄油中,从而在正常使用中,受者将接受所希望量的饮食补充。PUFAs还可以掺入到婴儿配方、营养补充品或者其他食品中并且可以用作抗炎剂或者胆固醇降低剂。任选地,组合物可以用于药物用途(人或者兽)。在该情况中,PUFAs通常经口施用但是可以通过任意途径施用,只要通过所述途径PUFAs可以被成功地吸收,所述途径为例如肠胃外(例如,皮下、肌内或者静脉内)、直肠、阴道或者局部(例如,作为皮肤软膏剂或者洗剂)。
用通过重组方法产生的PUFAs补充人或者动物可以导致所加入的PUFAs以及它们的代谢物的水平增加。例如,用花生四烯酸治疗不仅导致ARA水平增加,而且导致ARA的下游产物,如前列腺素的水平增加。复杂调节机制使得希望组合多种PUFAs,或者加入PUFAs的不同缀合物,以便防止、控制或者克服此类机制以实现个体中特定PUFAs的所希望的水平。
定义在本公开中,使用了许多术语和缩写。提供了下面的定义。
“可该框”缩写为ORF。
“聚合酶链式反应”缩写为PCR。
“美国典型培养物保藏中心”缩写为ATCC。
“多不饱和脂肪酸”缩写为PUFA(s)。
术语“串珠镰孢”与“Fusarium verticillioides”同义。
术语“脂肪酸”指约C12到C22的不同链长的长链脂族酸(链烷酸)(尽管更长和更短的链长是已知的)。主要的链长为C16到C22。脂肪酸的结构由简单标记系统“X:Y”代表,其中X是特定脂肪酸中碳原子总数,Y是双键数。
通常,将脂肪酸分类为饱和或不饱和的。术语“饱和脂肪酸”指在它们的碳主链之间没有“双键”。相比,“不饱和脂肪酸”具有“双键”以及它们的碳主链(其最通常为顺式构型)。“单不饱和脂肪酸”沿着碳主链具有仅一个“双键”(例如,对于棕榈油酸(16:1)和油酸(18:1)通常在第9个和第10个碳原子之间),而“多不饱和脂肪酸”(或者“PUFAs”)沿着碳主链具有至少两个双键(例如,对于亚油酸(18:2)为第9和第10个和第12和第13个碳原子之间);对于α-亚麻酸(18:3)为第9和第10、第12和第13和第15和第16个碳原子之间)。
可以将“PUFAs”分类成两个主要家族(根据最接近脂肪酸碳链的甲基末端的第一个双键的位置(n))。从而,“ω-6脂肪酸”(ω-6或n-6)具有距离该分子的ω(甲基)末端6个碳原子的第一个不饱和的双键和额外具有共两个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。相比,“ω-3脂肪酸”(ω-3或n-3)具有距离分子的ω末端三个碳原子的第一个不饱和双键并且额外具有共三个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。
对于本发明,将使用ω参照系统指出碳原子数、双键数目和与ω碳最接近的双键的位置,从ω碳(其对于该目的编号为1)的计数。该命名在下面的表2中标题为“Shorthand Notation”的列中显示。该表达剩余内容总结了ω-3和ω-6脂肪酸的普通名、将用于说明书全文的缩写和每种化合物的“化学名”。
表2多不饱和脂肪酸的命名
术语“基本上脂肪酸”指特定PUFA,个体为了生存必须摄入该PUFA,不能从头合成该特定必需脂肪酸。亚油酸(18:2,ω-6)和亚麻酸(18:3,ω-3)脂肪酸是“必需脂肪酸”,因为人不能合成它们并且必须从他们的饮食得到它们。
术语“脂肪”指在25℃为固体并且通常是饱和的脂类物质。
术语“油”指在25℃为液态并且通常是不饱和的脂类物质。在一些藻类、油质酵母和丝状真菌的油中发现了PUFA。“微生物油”或者“单细胞油”为由微生物在它们的寿命中天然产生的油。此类油可以含有长链PUFA。
术语“PUFA生物合成途径酶”指与PUFA的生物合成相关的下列酶的任一种(和编码所述酶的基因),包括Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、aΔ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶。
术语“ω-3/ω-6脂肪酸生物合成途径”指一组基因,其当在适当条件下表达是编码催化产生ω-3和ω-6脂肪酸的一种或两种的酶。通常,涉及ω-3/ω-6脂肪酸生物合成途径的基因编码一些或者所有下面的酶Δ12去饱和酶、Δ6去饱和酶,延伸酶、Δ5去饱和酶、Δ17去饱和酶,Δ15去饱和酶、Δ9去饱和酶、Δ8去饱和酶和Δ4去饱和酶。代表性途径在图2中阐明,提供了油酸通过多种中间物向DHA的转化,该图阐明了怎样可以从普通来源产生ω-3和ω-6脂肪酸。该途径自然地分成两个部分,其中一个部分将产生ω-3脂肪酸和其他部分,另一部分仅产生ω-6脂肪酸。仅产生ω-3脂肪酸的部分将在本文中称作ω-3脂肪酸生物合成途径,而仅产生ω-6脂肪酸的部分将在本文中称作ω-6脂肪酸生物合成途径。
本文所用术语“功能的”在ω-3/ω-6脂肪酸生物合成途径的上下文中表示该途径中一些(或者所有)基因表达活性酶。将理解“ω-3/ω-6脂肪酸生物合成途径”或者“功能ω-3/ω-6脂肪酸生物合成途径”不暗含上面段落中所列的所有基因都是需要的,因为许多脂肪酸产物将仅需要表达该途径基因的亚组。
术语“去饱和酶”指在一种或多种脂肪酸中去饱和,即引入双键以产生单-或者多不饱和脂肪酸的多肽。尽管在说明书全文中参考特定脂肪酸时使用ω参照系统,但是使用Δ系统通过从底物的羧基末端计数指出去饱和酶的活性更加方便。本文中尤其重要的是Δ12去饱和酶,其去饱和从分子的羧基末端编号的第12到第13个碳原子之间的脂肪酸并且催化油酸向LA的转化。与本公开相关的其他去饱和酶包括Δ15去饱和酶,其催化LA向ALA的转化;Δ17去饱和酶,其催化DGLA向ETA和/或ARA向EPA的转化;Δ6去饱和酶,其催化LA向GLA和/或ALA向STA的转化;Δ5去饱和酶,其催化DGLA向ARA和/或ETA向EPA的转化;Δ4去饱和酶,其催化DPA向DHA的转化;Δ8去饱和酶,其催化EDA向DGLA和/或ETrA向ETA的转化;和Δ9去饱和酶,其催化棕榈酸向棕榈油酸(16:1)和/或硬脂酸向油酸(18:1)转化。在本领域中,Δ15和Δ17去饱和酶还偶然称作“omega-3去饱和酶”,“w-3去饱和酶”,和/或“ω-3去饱和酶”。一些去饱和酶对两种或多种底物(例如,Saprolegnia diclina Δ17去饱和酶的底物,包括ARA和DGLA,而秀丽隐杆线虫ω-3去饱和酶的底物包括LA和GLA)。
术语“具有与Yarrowia lipolytica.Δ12去饱和酶同源性的蛋白质”指在本文中鉴定为SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22并且具有与本文中鉴定为SEQ ID NO52(在共同待决的美国专利申请10/840325中表征,此处将该专利完整引入作为参考)的Y.lipolytica去饱和酶具有同源性的蛋白质。系统进化分析法确定,这些蛋白质(即,SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22)聚簇成两种不同的亚家族,在本文中称作“亚家族1”和“亚家族2”。特别地,亚家族1蛋白质似乎编码Δ15去饱和酶(即,SEQ ID NOs2、6、10、14和18;见共同待决的美国临时申请60/519191,将其完整引入本文作为参考)。相比,亚家族2蛋白质编码如此处表征的具有Δ12去饱和酶活性(即,SEQ ID NOs4、8、12、16、20、21和22)的蛋白质。
术语“转化效率”和“底物转化百分数”指特定酶(例如,去饱和酶或延伸酶)可以将底物转化成产物的效率。根据下面的公式测量转化效率([产物]/[底物+产物])*100,其中,“产物”包括直接产物和该产物所来源的途径中的所有产物。在本申请中,希望鉴定特征是当在油质酵母宿主中表达时具有高底物转化百分数的那些Δ12去饱和酶;从而,例如,优选向LA的转化效率为至少70%,至少80%的向LA的转化效率是尤其适宜的,至少85%的向LA的转化效率是最优选的。
术语“延伸酶”指可以延伸脂肪酸碳链以产生酸的多肽,所述酸比延伸酶所作用的脂肪酸底物长2个碳。该延伸过程以多步机制与脂肪酸合酶联合作用,其中CoA是酰基载体(Lassner等人,The PlantCell 8281-292(1996))。简言之,丙二酸单酰辅酶A与长链酰基辅酶A缩合产生CO2和β-酮酰基-CoA(其中酰基部分已经被延长2个碳原子)。随后反应包括还原成β-羟基酰基-CoA,脱水成烯酰辅酶A,和再次还原产生延伸的酰基-CoA。延伸酶催化的反应的实例是GLA向DGLA,STA向ETA,和EPA向DPA的转化。因此,延伸酶可以具有不同特异性。例如,C16/18延伸酶将优选为C16底物,C18/20延伸酶将优选C18底物,C20/22延伸酶将优选C20底物。以相似的方式,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。
术语“油质的”指倾向于以脂质的形式保存它们的能源的那些生物(Weete,InFungal Lipid Biochemistry,2nded.,Plenum,1980)。这些包括油料种子植物(例如,大豆、玉米、红花、向日葵、芸苔、油菜籽、亚麻、玉米和报春花)和微生物(例如,破囊壶菌(Thraustochytrium sp.,)、Schizochytrium sp.,被孢霉(Mortierella sp.)和某些油质酵母)。
术语“油质酵母”指分类为可以产油的酵母的那些微生物。通常,油质微生物的细胞油或者甘油三酯含量遵循S形曲线,其中脂质浓度增加直到晚对数或者早静止生长期的最大值,然后在晚静止和死亡期期间逐渐减少(Yongmanitchai和Ward,Appl.Environ.Microbiol.57419-25(1991))。油质微生物积累超过它们的干重的约25%的油是常见的。油质酵母的实例包括,但不限于下面的属Yarrowia,假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球菌属(Cryptococcus)、毛孢子菌属(Trichosporon)和油脂酵母属(Lipomyces)。
术语“可发酵的碳底物”指微生物将代谢以产生能量的碳源。本发明的典型的碳底物包括,但不限于单糖、寡糖、多糖、烃类、脂肪酸、脂肪酸酯、甘油单酯、二氧化碳、甲醇、甲醛、甲酸和含碳胺。
术语“密码子优化的”当涉及用于转化多种宿主的核酸片段的基因或者编码区时,指改变核酸分子的基因或者编码区中的密码子以反映宿主生物的典型的密码子选择而不改变DNA编码的多肽。
本文所用的“分离的核酸片段”是单链或者双链RNA或者DNA聚合物,其任选含有合成的、非天然或者改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包含cDNA、基因组DNA或者合成DNA的一个或多个片段。
当核酸片段的单链形式能够与另一种核酸片段在适宜的温度和溶液离子强度条件下退火时,所述核酸片段与所述另一种核酸片段,如cDNA、基因组DNA或者RNA分子是“可杂交的”。杂交和洗涤条件是公知的并且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular CloningA Laboratory Manual,2nded.,Cold SpringHarbor LaboratoryCold Spring Harbor,NY(1989),尤其第11章和表11.1中例证。温度条件和离子强度的条件决定杂交的“严格性”。可以调节严格条件以从中等相似的片段(如来自远相关生物的同源序列)筛选高度相似的片段(如来自近相关生物的一式两份的功能酶)。杂交后洗涤决定严格条件。一组优选条件使用一些列洗涤,其以6X SSC,0.5%SDS在室温下15分钟开始,然后用0.2X SSC,0.5%SDS在50℃30分钟重复两次。一组更优选的严格条件使用更高的温度,其中洗涤与上面的相同,只是最后两次在0.2X SSC,0.5%SDS30分钟洗涤的温度增加到60℃。另一组优选的高度严格条件使用在0.1X SSC,0.1%SDS中65℃下最后两次洗涤。额外组的严格条件包括例如,在0.1X SSC,0.1%SDS,65℃杂交和用2X SSC,0.1%SDS然后用0.1X SSC,0.1%SDS洗涤。
杂交需要两种核酸含有互补序列,尽管取决于杂交的严格性,但是碱基之间的错配是可能的。杂交的核酸分子的适宜严格性取决于核酸的长度和互补程度——本领域公知的变量。两种核酸序列之间相似性或者同源性程度越大,具有那些序列的核酸的杂交分子的Tm值越大。核酸杂交的相对稳定性(对应于较高的Tm)以下面的顺序减小RNA:RNA,DNA:RNA,DNA:DNA。对于长度大于100个核苷酸的杂交分子,已经推导了计算Tm的方程(见Sambrook等人,上文,9.50-9.51)。对于与较短核酸,即寡核苷酸的杂交,错配的位置变得重要,并且寡核苷酸的长度决定了它的特异性(见,Sambrook等人,上文,11.7-11.8)。在一个实施方案中,可杂交的核酸的长度为至少约10个核苷酸。优选地,可杂交的核酸的最小长度为至少约15个核苷酸,更优选至少约20个核苷酸;最优选地,长度为至少约30个核苷酸。此外,技术人员将认识到如必要,可以根据诸如探针长度的因子调节温度和洗涤溶液盐浓度。
氨基酸或者核苷酸序列的“实质部分”是包含包含多肽的氨基酸序列或者基因的核苷酸序列的足够部分的部分,推定所述部分鉴定该多肽或者基因,所述鉴定可以通过由本领域技术人员通过序列的手工评价或者通过计算机自动化的序列比较进行和使用诸如BLAST(BasicLocal Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993))的算法鉴定。通常,为了假定鉴定与已知蛋白质或者基因同源的多肽或者核酸序列,10或更多连续氨基酸或者30或更多核苷酸的序列是必要的。此外,关于核苷酸序列,包含20-30个连续核苷酸的基因特异的寡核苷酸探针可以用于基因鉴定(例如,DNA杂交)和分离(例如,细菌菌落或者噬菌体噬菌斑的原位杂交)的依赖序列的方法。此外,12-15个碱基的短寡核苷酸可以用作PCR中的扩增引物以便得到包含引物的特定核酸片段。因此,核苷酸序列的“实质部分”包含足够序列以特异鉴定和/或分离包含所述序列的核酸片段。本说明书教导了编码特定真菌蛋白质的完整氨基酸和核苷酸序列。技术人员拥有本文所报导的益处,现在可以为了本领域技术人员已知的目的使用所公开序列的所有或者实质部分。因此,本发明包含如所附序列表中报导的完整序列,以及如上面定义的那些序列的实质部分。
术语“互补的”用于描述能够相互杂交的核苷酸碱基之间的关系。例如,关于DNA,腺苷与胸苷互补,胞苷与鸟苷互补。因此,本发明还包括与所附序列表中报导的完整序列互补的分离的核酸片段,以及那些实质上相似的核酸序列。
如本领域已知的术语“同一性百分数”是如通过比较序列确定的两种或多种多肽序列或者两种或多种多核苷酸序列之间的关系。在本领域中,“同一性”还指多肽或者多核苷酸序列之间的序列相关性程度,根据具体情况而定,如通过此类序列的字符串之间的匹配决定。“同一性”和“相似性”可以通过已知方法容易地计算,所述方法包括但不限于如下文献中描述的1.)Computational MolecularBiology(Lesk,A.M.,Ed.)Oxford UniversityNY(1988);2.)BiocomputingInformatics and Genome Projects(Smith,D.W.,Ed.)AcademicNY(1993);3.)Computer Analysis ofSequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,Eds.)HumaniaNJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.,Ed.)Academic(1987);and 5.)SequenceAnalysis Primet(Gribskov,M.and Devereux,J.,Eds.)StocktonNY(1991)。设计确定同一性的优选方法以得到所测试序列之间的最佳匹配。确定同一性和相似性的方法在公众可利用的计算机程序中编码。序列比对和同一性百分数计算可以用LASERGENE生物信息学计算套件(DNASTAR Inc.,Madison,WI)的Megalign程序进行。除非另外说明,序列的多重比对使用Clustal比对方法(Higgins和Sharp,CABIOS.5151-153(1989)),使用默认参数(GAP PENALTY=10,GAPLENGTH PENALTY=10)进行。使用Clustal方法进行逐对比对的默认参数为KTUPLE 1,GAP PENALTY=3,WINDOW=5和DIAGONALS SAVED=5。
适宜的核酸片段(本发明的分离的多核苷酸)编码与本文报导的氨基酸序列具有至少约70%同一性,优选约75%同一性,更优选约80%同一性的多肽。优选的核酸片段编码与本文报导的氨基酸序列具有约85%同一性的氨基酸序列。更优选的核酸片段编码与本文报导的氨基酸序列具有约90%同一性的氨基酸序列。更优选的为编码与本文报导的氨基酸序列具有约95%同一性的氨基酸序列。适宜的核酸片段不仅具有上面的同源性而且通常编码具有至少50个氨基酸,优选至少100个氨基酸,更优选至少150个氨基酸,更优选至少200个氨基酸,最优选至少250个氨基酸的多肽。
术语“同源性”指序列之间的关系,所述序列中存在一定程度的相似,其通常是由于从共同的祖先序列演化。同源序列可以具有基因的、结构的、功能的和/或行为的性质而具有同源性。术语“直向同源物”或者“直向同源序列”在本文指其中物种形成后序列趋异的关系(即,不同物种中的同源序列从物种形成期间的共同祖先基因产生)。相比,术语“共生同源的”指一个物种内由于基因复制引起的同源序列。本领域技术人员将熟悉鉴定同源、直向同源和共生同源序列所需的技术。
“密码子简并”指遗传密码中的性质,其允许改变核苷酸序列而不影响所编码的多肽的氨基酸序列。本领域技术人员熟知核苷酸密码子选择中特定宿主细胞显示出的“密码子偏爱”以指定给定氨基酸。因此,当合成用于在宿主细胞中提高表达的基因时,希望设计该基因使得它的密码子选择频率接近该宿主细胞的优选密码子选择的频率。
“化学合成的”当涉及DNA序列时,指在体外装配组分核苷酸。DNA的手工化学合成可以使用成熟的方法完成;或者自动化化学合成可以使用许多通过商业途径可获得的机器来进行。使用本领域技术人员公知的步骤,可以从化学合成的寡核苷酸构件装配“合成基因”。这些构件连接并退火形成基因片段,其然后酶促装配以构造完整基因。因此,可以基于核苷酸序列的优化以反映宿主细胞的密码子偏爱来定制基因用于最佳基因表达。技术人员明白如果密码子选择偏向宿主喜爱的那些密码子,那么可能进行成功的基因表达。可以基于来自宿主的基因的考察确定优选的密码子,其中所述基因的序列信息是可得的。
“基因”指表达特定蛋白质的核酸片段,并且可以指仅编码区或者可以包括编码序列前(5’-非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”指在自然中发现的基因与其自己的调节序列。“嵌合基因”指不是天然基因的任意基因,其包含未在自然界中发现在一起的调节序列和编码序列。因此,嵌合基因可以包含不同的来源的调节序列和编码序列,或者来自相同来源,但是以不同于在自然中发现的方式排列的调节序列和编码序列。“内源基因”指位于生物的基因组中它的天然位置中的天然基因。“外源”基因指通过基因转移导入宿主生物的基因。外源基因可以包含导入非天然生物的天然基因、导入天然宿主内的新位置的天然基因,或者嵌合基因。“转基因”是通过转化方法导入基因组中的基因。“密码子优化的基因”是这样的基因,将其密码子选择频率设计成模拟宿主细胞的优选密码子选择的频率。
“编码序列”指编码特定氨基酸序列的DNA序列。“适宜的调节序列”指位于编码序列的上游(5’非编码序列)、内部或者下游(3’非编码序列)并且影响相关编码序列的转录、RNA加工或者稳定性,或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。
“启动子”指能够控制编码序列或者功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3’。启动子可以完整地来自天然基因,或者可以由来自自然界中发现的不同启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域技术人员发现不同启动子可以指导基因在不同组织或者细胞类型,或者在不同发育阶段中,或者应答不同环境或者生理条件表达。导致基因在多数细胞类型中在多数时间表达的启动子通常称作“组成型启动子”。还认识到因为在多数情况中,调节序列的确切边界还没有被完全限定,所以不同长度的DNA片段可能具有相同启动子活性。
术语“3’非编码序列”和“转录终止子”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常的特征是影响多腺苷酸序列向mRNA前体的3’末端的加入。3’区可以影响相关编码序列的转录、mRNA加工或稳定性,或者翻译。
“RNA转录物”指DNA的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列完全互补拷贝时,它称作初级转录物,或者它可以是来自初级转录物的转录后加工的RNA序列并且称作成熟RNA。“信使RNA”或者“mRNA”指没有内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补或者来自mRNA的双链DNA。“有义”RNA指包括mRNA并且可以因此由细胞翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或者mRNA的所有或者部分互补并且阻断靶基因的表达的RNA转录物(U.S.5,107,065;WO 99/28508)。反义RNA的互补性可以是与特定基因转录物的任意部分,即在5’非编码序列、3’非编码序列或者编码序列处互补。“功能RNA”指没有翻译然而对细胞过程具有影响的反义RNA、核酶RNA或者其他RNA。
术语“可操作地连接”指一个核酸片段上核酸序列的结合使得一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,编码序列处于启动子的转录控制下)时,启动子可操作地连接编码序列。编码序列可以以有义或者反义方向可操作地连接调节序列。
本文所用术语“表达”指来自本发明的核酸片段的有义(mRNA)或者反义RNA的转录和稳定积累。表达还可以指mRNA翻译成多肽。
“成熟”蛋白质指翻译后加工的多肽;即已经从初级转录产物除去任何前肽的多肽。“前体”蛋白质指mRNA翻译的初级产物;即仍然存在前肽。前肽可以是(但是不限于)细胞内定位信号。
“转化”指将核酸片段转移到宿主生物,导致基因稳定的遗传。核酸片段可以是例如自主复制的质粒;或者它可以整合到宿主生物的基因组中。含有所转化的核酸片段的宿主生物称作“转基因的”或者“重组的”或者“转化的”生物。
术语“质粒”、“载体”和“盒”指染色体外元件,其通常携带不是细胞的中心代谢部分的基因,并且通常为环形双链DNA片段的形式。此类元件可以是来自任意来源的线性或环状的单链或者双链DNA或者RNA的自主复制的序列、基因组整合序列、噬菌体或者核苷酸序列,其中许多核苷酸序列已经连接或者重组成独特的结构,其能够例如,将启动子片段和所选基因产物的DNA序列以及合适的3’非翻译序列导入细胞中。“转化盒”指特定载体,其含有外源基因并且具有除了外源基因之外的元件,所述元件方便转化特定宿主细胞。“表达盒”指特定载体,其含有外源基因和除了该外源基因之外的元件,所述元件允许该基因在外来宿主中增强的表达。
术语“同源重组”指两个DNA分子之间DNA片段的交换(在交换期间)。被交换的片段的侧翼是两个DNA分子之间相同核苷酸序列的位点(即,“同源区”)。术语“同源区”指核酸片段上的核苷酸序列段,其参与相互同源的核酸片段的同源重组。当同源区具有至少约10bp长度,优选具有至少约50bp长度时,通常将发生同源重组。通常,意在用于重组的片段含有至少两个同源区,其中希望靶基因破坏和替换。
术语“序列分析软件”指可用于分析核苷酸或者氨基酸序列的任意计算机算法或者软件程序。“序列分析软件”可以通过商业途径获得或者独立开发。通常,序列分析软件将包括,但不限于1)GCG程序套包(Wisconsin Package版本9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.215403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(Gene Codes Corporation,AnnArbor,MI);和5.)FASTA程序,其整合Smith-Waterman算法(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s)Suhai,Sandor.PlenumNew York,NY)。在本申请的上下文内,将理解除非另外指出,当使用序列分析软件进行分析时,分析的结果将基于所参考程序的“默认值”。本文所用的“默认值”将指当软件首次初始化时最初加载的任何一组值或者参数。
用于本文的标准重组DNA和分子克隆技术是本领域公知的并且由Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular CloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1989)(下文中,“Maniatis”);Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1984);和Ausubel,F.M.等人,Current Protocols inMolecular Biology,published by Greene Publishing Assoc.andWiley-Interscience(1987)描述。
脂肪酸的微生物生物合成通常,油质微生物中脂质积累由对生长培养基中存在的总的碳氮比率引发(图1)。当细胞耗尽可利用的氮供应(例如,当碳氮比率大于约40)时,细胞腺苷一磷酸(AMP)的耗尽导致线粒体中AMP-依赖的异柠檬酸脱氢酶活性的停止,将柠檬酸转运到胞质溶胶中,和随后由ATP-柠檬酸裂合酶切割以产生乙酰辅酶A。乙酰辅酶A是脂肪酸的从头生物合成的基本构件。尽管可以有效代谢以产生乙酰辅酶A的任意化合物都可以用作脂肪酸的前体,但是葡萄糖是该类型反应中的主要来源(图1)。葡萄糖通过糖酵解转化成丙酮酸,丙酮酸然后被转运到线粒体中,在线粒体中丙酮酸可以由丙酮酸脱氢酶(“PD”)转化成乙酰辅酶A。因为乙酰辅酶A不能通过线粒体膜直接转运到细胞质中,所以来自乙酰辅酶A的两个碳与草酰乙酸缩合产生柠檬酸(由柠檬酸合成酶催化)。柠檬酸直接转运到细胞质中,在细胞质中它被ATP-柠檬酸裂合酶切割以再生乙酰辅酶A和草酰乙酸。草酰乙酸通过转化成苹果酸再次进入三羧酸循环。
丙二酸单酰辅酶A的合成是脂肪酸生物合成的首先进行的步骤,它发生在细胞质中。由乙酰辅酶A羧化酶(“ACC”)对乙酰辅酶A的羧化产生丙二酸单酰辅酶A。脂肪酸合成由多酶脂肪酸合成酶复合体(“FAS”)催化并且通过8个二碳片段(来自乙酰辅酶A的乙酰基)的缩合形成16碳饱和脂肪酸棕榈酸。更具体地,FAS催化一系列7次反应,其包括下面的(Smith,S.FASEB J.,8(15)1248-59(1994))1.乙酰辅酶A和丙二酸单酰辅酶A转移到FAS的酰基载体蛋白质(ACP)。然后乙酰基转移到丙二酰基,形成β-酮丁酰基-ACP并释放CO2。
2.β-酮丁酰基-ACP经历还原(通过β-酮酰基还原酶)和脱水(通过β-羟基酰基脱水酶)形成反式-单不饱和的脂肪酰基。
3.双键由NADPH还原,产生比最初的饱和脂肪酰基长2个碳的饱和脂肪酰基。然后再生该丁酰基与新的丙二酰基缩合和重复延伸步骤的能力。
4.当脂肪酰基变成长16个碳时,硫酯酶活性将其水解,释放游离棕榈酸。
棕榈酸(16:0)是更长链饱和和不饱和脂肪酸(例如,硬脂酸(18:0),棕榈油酸(16:1)和油酸(18:1))通过内质网膜中存在的延伸酶和去饱和酶的作用的前体。棕榈酸和硬脂酸(作为辅酶A和/和ACP酯)通过Δ9去饱和酶的作用分别转化成它们的不饱和衍生物棕榈油酸(16:1)和油酸(18:1)。
通过两分子的乙酰辅酶A与甘油-3-磷酸的酯化产生1,2-二酰基甘油磷酸(通常称作磷脂酸)形成三酰基甘油(脂肪酸的主要储存单位)(图1)。然后由磷脂酸磷酸酶除去磷酸产生1,2-二酰基甘油。当加入第三种脂肪酸,例如,通过二酰基甘油-酰基转移酶的作用形成三酰基甘油。
ω脂肪酸的生物合成简言之,将LA转化成GLA、DGLA和ARA(ω-6途径)和将ALA转化成STA、ETA、EPA、DPA和DHA(ω-3途径)的代谢过程包括通过加入两个碳单位和通过加入双健对分子去饱和延伸碳链(图2)。这序列存在于内质网膜中的一系列专门的去饱和和延伸酶。
ω-6脂肪酸油酸通过Δ12去饱和酶的作用首先转化成ω-6脂肪酸。随后ω-6脂肪酸如下产生1)LA通过Δ6去饱和酶转化成GLA;2)GLA通过延伸酶的作用转化成DGLA;和3)DGLA通过Δ5去饱和酶的作用转化成ARA。
ω-3脂肪酸亚油酸(LA)通过Δ15去饱和酶的作用首先转化成ω-3脂肪酸。随后,ω-3脂肪酸以相似于ω-6脂肪酸的一系列步骤产生。特别地1)ALA通过Δ6去饱和酶的活性转化成STA;2)STA通过延伸酶的活性转化成ETA;和3)ETA通过Δ5去饱和酶的活性转化成EPA。备选地,可以通过Δ17去饱和酶的活性分别从DGLA和ARA产生ETA和EPA。EPA可以通过延伸酶和Δ4去饱和酶的活性进一步转化成DHA。
在备选实施方案中,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。Δ8去饱和酶然后将这些产物分别转化成DGLA和ETA。
参与ω脂肪酸产生的基因许多微生物,包括藻类、细菌、霉和酵母可以在细胞代谢的普通过程中合成PUFAs和ω脂肪酸。尤其充分研究的是真菌,包括Schizochytrium aggregatm,破囊壶菌属的种和Morteriellaalpin。此外,许多甲藻(甲藻纲)天然产生高浓度PUFA。同样的,通过遗传方法已经鉴定了参与油产生的多种基因并且这些基因的一些的DNA序列可以公开得到(非限制性实例在下表3中显示)
表3参与PUFA产生的一些可公开得到的基因
表3续参与PUFA产生的一些可公开得到的基因
表3续参与PUFA产生的一些可公开得到的基因
此外,专利文献提供了许多参与油产生的基因的额外的DNA序列(和/或关于一些上面基因的细节和它们的分离方法)。见,例如,U.S.5,968,809(Δ6去饱和酶s);U.S.5,972,664和U.S.6,075,183(Δ5去饱和酶s);WO 91/13972和U.S.5,057,419(Δ9去饱和酶s);U.S.2003/0196217A1(Δ17去饱和酶s);WO 02/090493(Δ4去饱和酶s);WO 93/11245和WO 03/099216(Δ15去饱和酶s);WO 00/12720和U.S.2002/0139974A1(延伸酶)。这些专利和申请的每一个都完整引入本文作为参考。
本文中尤其重要的是Δ12去饱和酶,更具体地,适于在油质酵母(例如,Yarrowia lipolytica)中异源表达的Δ12去饱和酶。一些Δ12去饱和酶(即,Glycine max、Brassica napus、拟南芥、蓖麻(Ricinus communis)、玉米(Zea mays);粗糙脉孢霉、灰葡萄孢)的序列在WO 94/11516和WO 03/099216中公开。
此外,最近分离和表征了天然Yarrowia lipolytica Δ12脂肪酸去饱和酶(见,共同待决的美国专利申请10/840325,将其完整引入作为参考;也参加本文的实施例2和3,和SEQ ID NOs51和52)。简言之,使用简并PCR引物通过PCR从Yarrowia lipolytica克隆了部分推定的Δ12去饱和酶DNA片段。使用所产生的片段对内源Yarrowialipolytica Δ12去饱和酶基因的定向破坏在所破坏的菌株中产生水平增加的18:1和没有可检测的18:2,从而证实除去了天然Δ12去饱和酶活性。随后,使用质粒拯救分离的所整合质粒侧翼的基因组DNA序列并装配了全长Yarrowia lipolytica Δ12去饱和酶基因(SEQ IDNO51)。该序列包括1257个碱基的可该框(SEQ ID NO51的核苷酸+283到+1539),而所推导的编码氨基酸序列长为419个残基(SEQ IDNO52)。该Δ12去饱和酶的过表达适于增加油酸向LA的底物转化百分数(计算为([18:2]/[18:1+18:2])*100),从而它从野生型细胞中的59%增加到所转化的宿主细胞中的74%。尽管这些宿主细胞内LA的增加的可用性,但是希望得到甚至更大的底物库,其适于能够在Y.lipolytica转化细胞中高水平产生多种ω-3和/或ω-6 PUFAs。从而,具有高水平Δ12去饱和酶活性的异源蛋白质的表达在工程化生物的途径中是有益的。
许多因素影响具有Δ12去饱和酶活性的特定多肽的选择,所述多肽将在宿主细胞中表达以产生PUFAs(任选联合其他去饱和酶和延伸酶)。取决于宿主细胞,底物的有效性,和目的终产物、一些多肽是重要的;然而,对选择具有去饱和酶活性的特定多肽的考虑包括所述多肽的底物特异性,而不管所述多肽或者其组分是限速酶,该去饱和酶是所希望的PUFA的合成必需的,和/或该多肽需要辅因子。所表达的多肽优选具有于它在宿主细胞中的位置的生物化学环境相容。例如,所述多肽可以必须与宿主细胞中的其他酶竞争底物。因此,在确定给定多肽用于修饰给定宿主细胞中PUFA产生的适宜性中,考虑所述多肽的KM和比活的分析。用于具体宿主细胞的多肽是在目的宿主细胞中存在的生物化学条件下有功能的多肽,但是另外可以是具有能够修饰所希望的脂肪酸(即,油酸)的Δ12去饱和酶活性的任意多肽。从而,所述序列可以来自任意来源,例如,从天然来源分离(来自细菌、藻类、真菌、植物、动物等等),通过半合成途径产生或者从头合成。
对于本发明,然而,最希望具有Δ12去饱和酶活性的多肽当在所希望的宿主细胞中表达时具有至少约70%的转化效率,其中至少约80%的转化效率尤其合适,至少约85%的转化效率是最优选的。
鉴定新的真菌Δ12去饱和酶使用Yarrowia lipolytica Δ12去饱和酶蛋白质序列(SEQ IDNO52)作为查询序列,通过序列比较在本文中鉴定了来自串珠镰孢的新的Δ12去饱和酶。特别地,用Yarrowia查询序列搜索串珠镰孢菌株M-8114的专有的DuPont已表达序列标志(EST)文库(E.I.du Pont deNemours and Co.,Inc.,Wilmington,DE)的推定的编码的蛋白质序列。这导致鉴定了两种同源序列Fm1(SEQ ID NO2)和Fm2(SEQ IDNO4),它们分别由核苷酸序列SEQ ID NOs1和3编码。
还将Yarrowia Δ12去饱和酶序列用作针对一些丝状真菌的公共数据库的查询序列;特别地,在构巢曲霉(SEQ ID NOs6 and 8)、Magnaporthe grisea(SEQ ID NOs10和12)、粗糙脉孢霉(SEQ IDNOs14和16)、禾本科镰孢(SEQ ID NOs18和20)、烟曲霉(SEQ IDNO21)和黄曲霉(SEQ ID NO22)中鉴定了同源蛋白质序列。使用Clustal W(slow,accurate,Gonnet option;Thompson等人Nucleic Acids Res.224673-4680(1994))的方法,基于这些序列(即,SEQ ID NOs2,4,6,8,10,12,14,16,18,20,21和22)的比较的随后的种系发生和同源性分析揭示具有与Yarrowia Δ12去饱和酶的同源性的蛋白质的两个不同的“亚家族”。特别地,“亚家族1”的所有蛋白质(SEQ ID NOs2,6,10,14和18)相互具有至少46.2%同一性,并且与“亚家族2”的蛋白质(SEQ ID NOs4,8,12,16,20,21和22)具有小于39.6%的同一性(图4和5;Clustal比对方法(上文))。亚家族2的蛋白质相互具有至少56.3%同一性(见实施例4)。
因为Yarrowia仅能合成18:2(但不是18:3),而多数上述丝状真菌可以合成18:2和ALA,并且因为Yarrowia具有一种Δ12去饱和酶而多数丝状真菌具有与Yarrowia Δ12去饱和酶的两种同源物,所以本申请人推测这些生物中去饱和酶的亚家族之一代表Δ12去饱和酶,另一个亚家族代表Δ15去饱和酶。通过使用表达分析测定了两个亚家族的每一个内代表性蛋白质的活性检验了该假说。特别地,Fm1和Mg1在Yarrowia lipolytica中表达并且发现它们编码Δ15去饱和酶(见共同待决的美国临时申请60/519191);类似地,2003年12月4日的公开WO 03/099216提示本文鉴定的序列,因为亚家族1粗糙脉孢霉和构巢曲霉序列具有Δ15去饱和酶活性。相比,Fm2如本文描述的在Y.lipolytica中表达并且经表征为Δ12去饱和酶。亚家族2粗糙脉孢霉序列的Δ12去饱和酶活性在WO 03/099216中类似地得到证实。
使用Clustal比对方法(Thompson等人,Nucleic Acids Res.224673-4680(1994))将串珠镰孢Δ12去饱和酶推导的氨基酸序列(SEQ ID NO4)与公共数据库序列比较。从而,串珠镰孢Δ12去饱和酶氨基酸序列基于百分数同一性最相似于本文中以SEQ ID NO20提供的禾本科镰孢Δ12去饱和酶(在477个氨基酸长度上95%同一性)。更优选的氨基酸片段与本文的序列至少约96%同一,而97%-98%同一的那些序列是尤其适宜的,最优选约99%同一的那些序列。
以相似方式,使用Clustal比对方法,将串珠镰孢Δ12去饱和酶核苷酸碱基序列与公共数据库的比较揭示最相似的已知核酸序列(禾本科镰孢基因组计划中的重叠群1.233;本文的SEQ ID NO19)与本文报导的串珠镰孢Δ12去饱和酶的核酸序列(SEQ ID NO3)至少89.2%同一。对应于当前ORF的优选Δ12去饱和酶编码核酸序列为编码活性蛋白质并且与编码本文报导的串珠镰孢Δ12去饱和酶的核酸序列具有至少约89%-90%同一性的那些序列,其中具有91%-95%同一性的那些序列尤其合适,具有大于95%同一性的那些序列最优选。
同源物的鉴定和分离本发明的Δ12去饱和酶核酸片段可以用于鉴定和分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。
鉴定技术例如,本文描述的串珠镰孢Δ12去饱和酶的氨基酸或者核苷酸序列的实质部分可以用于推定性鉴定相关的多肽或者基因,可以通过本领域技术人员对序列的手工评估,或者通过使用诸如BLAST的算法(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993))和ClustalW(DNASTAR软件的Megalign程序)的计算机自动化序列比较和鉴定来进行所述鉴定。如上所述,使用Yarrowia lipolytica Δ12去饱和酶(SEQ ID NO52)允许鉴定一组真菌去饱和酶,其当分析时,聚簇为蛋白质的两个不同的亚家族(即,亚家族1和亚家族2)。亚家族2包含上述串珠镰孢Δ12去饱和酶以及这样的蛋白质,其编码DNA序列在下列内容中发现·构巢曲霉基因组计划(Center for Genome Research(CGR),Cambridge,MA发起)中的重叠群1.15(scaffold 1)(AAG36933)(SEQ ID NO8);·Magnaporthe grisea基因组计划(CGR and International RiceBlast Genome Consortium发起)中重叠群中的基因座MG01985.1(SEQ ID NO12);·GenBank检索号AABX01000374(粗糙脉孢霉)(SEQ ID NO16);·禾本科镰孢 基因组计划(the CGR and the InternationalGibberella zeae Genomics Consortium(IGGR)发起)中的重叠群1.233(SEQ ID NO20);·烟曲霉基因组计划(Sanger Institute发起,the Universityof Manchester and The Institute of Genome Research(TIGR)合作)中的AFA.344248345586(反相)(SEQ ID NO21);和,·GenBank检索号AY280867(黄曲霉)(SEQ ID NO22)。
假设上面的蛋白质的每一种都编码Δ12去饱和酶。该假设在WO03/099216对粗糙脉孢霉进行了证实。
对上面蛋白质的分析揭示,根据Clustal比对方法(上文),这些蛋白质与串珠镰孢Δ12去饱和酶(SEQ ID NO4)具有至少56.3%序列同一性(图5)。此外,将本发明中亚家族2的Δ12去饱和酶与其他已知的Δ12去饱和酶比较;然而,此处亚家族2的Δ12去饱和酶与Yarrowia lipolytica Δ12去饱和酶(51.6%同一性;图6)比与任意其他已知的Δ12去饱和酶的同源性更高。本领域技术人员将能够使用相似的方法鉴定将在亚家族2中聚簇的其他直向同源蛋白质(在此处鉴定为Δ12去饱和酶)。
备选地,本发明去饱和酶序列的任一种(即,SEQ ID NOs3,4,7,8,11,12,15,16,19,20,21和22)可以用作同源物鉴定中的杂交试剂。核酸杂交试验的基本成分包括探针、怀疑含有目的基因或基因片段的样品和特定杂交方法。本发明的探针通常是单链核酸序列,其与待检测的核酸序列互补。探针与待检测的核酸序列是“可杂交的”。探针长度可以从5个碱基到数万碱基不等,并且将取决于所进行的特定试验。通常,约15个碱基到约30个碱基的探针长度是合适的。仅部分探针分子需要与待检测的核酸序列互补。此外,探针和靶序列之间的互补性不必是完全的。在不完全互补的分子之间发生杂交,结果杂交区中的一部分碱基不与适当的互补碱基配对。
杂交方法是成熟的。通常,探针和样品必须在将允许核酸杂交的条件下混合。这包括在无机或者有机盐存在下在适当的浓度和温度条件下将探针和样品接触。探针和样品核酸必须接触足够长的时间使得可以发生探针和样品核酸之间发生任何可能的杂交。混合物中探针或者靶标的浓度将决定发生杂交所必要的时间。探针或者靶标浓度越高,需要的杂交孵育时间越短。任选地,可以加入离液剂。离液剂通过抑制核酸酶活性稳定核酸。此外,离液剂允许室温下短寡核苷酸探针的灵敏和严格杂交(Van Ness和Chen,Nucl.Acids Res.195143-5151(1991))。适宜的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯代乙酸锂、高氯酸钠、四氯代乙酸铷、碘化钾和三氟乙酸铯,等等。通常,离液剂将以约3M的终浓度存在。如果希望,可以将甲酰胺加入到杂交混合物,浓度通常为30-50%(v/v)。
可以使用多种杂交溶液。通常,这些包含约20到60%体积,优选30%的极性有机溶剂。常用的杂交溶液使用约30-50%v/v甲酰胺,约0.15到1M氯化钠,约0.05到0.1M缓冲液(例如,柠檬酸钠,Tris-HCl,PIPES或HEPES(pH范围约6-9)),约0.05到0.2%去污剂(例如,十二烷基硫酸钠),或0.5-20mM EDTA,FICOLL(PharmaciaInc.)(约300-500kdal),聚乙烯吡咯酮(约250-500kdal),和血清白蛋白。典型杂交溶液中还包括的将是约0.1到5mg/mL未标记的载体核酸、片段化核DNA(例如,小牛胸腺或鲑精DNA,或酵母RNA),和任选约0.5到2%wt/vol甘氨酸。还可以包括其他添加剂,如体积排阻剂,其包括多种极性水溶性或者膨胀剂(例如,聚乙二醇),阴离子聚合物(例如,聚丙烯酸酯或者聚异丁烯酸酯)和阴离子糖类聚合物(例如,硫酸葡聚糖)。
核酸杂交适于多种测定形式。一种最适宜的是夹层测定形式。夹层测定尤其适于在非变性条件下杂交。夹层型测定的主要成分是固相支持体。固相支持体已经在其上吸附或者偶联了固定化核酸探针,其是未标记的或者与序列的一部分互补。
分离方法本发明的串珠镰孢Δ12去饱和酶核酸片段(或者本文鉴定的任意Δ12去饱和酶[SEQ ID NOs7,8,11,12,15,16,和19-22])可以用于分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。使用序列依赖性方案分离同源基因是本领域公知的。
序列依赖性方案的实例包括,但不限于1)核酸杂交方法;2)DNA和RNA扩增方法,如通过核酸扩增技术的多种用途例证[例如,聚合酶链式反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反(LCR),Tabor,S.等人,Proc.Acad.Sci.USA 821074(1985);或者链置换扩增(SDA),Walker,等人,Proc.Natl.Acad.Sci.U.S.A.,89392(1992)];和3)文库构建和通过互补作用筛选的方法。
例如,使用本领域技术人员公知的方法,通过用本发明核酸片段的全部或者一部分作为DNA杂交探针筛选来自任意希望的酵母或者真菌的文库,可以直接分离编码与本文描述的去饱和酶相似的蛋白质或者多肽的基因(其中将优选产生LA[或者LA衍生物]的那些酵母或者真菌)。通过本领域已知的方法(Maniatis,上文)可以设计和合成基于本发明核酸序列的特异寡核苷酸探针。此外,完整序列可以直接用于由技术人员合成DNA探针(例如,随机引物DNA标记、缺口翻译或者末端标记技术),或者使用可利用的体外RNA转录系统合成RNA探针。此外,可以设计并使用特异引物扩增本发明序列的部分(或者全长序列)。所得扩增产物可以在扩增反应期间直接标记或者在扩增反应后标记,并用作探针在适宜严格性的条件下分离全长DNA片段。
通常,在PCR型扩增技术中,引物具有不同序列并且不相互互补。取决于所希望的测试条件,应该设计引物的序列以提供靶核酸的有效和可靠的复制。PCR引物设计方法是本领域常见和公知的(Thein和Wallace,“The use of oligonucleotide as specifichybridization probes in the Diagnosis of Genetic Disorders”,in Human Genetic DiseasesA Practical Approach,K.E.DavisEd.,(1986)pp 33-50,IRLHerndon,VA;and Rychlik,W.,InMethods in Molecular Biology,White,B.A.Ed.,(1993)Vol.15,pp 31-39,PCR ProtocolsCurrent Methods andApplications.HumaniaTotowa,NJ)。
通常本发明序列的两种短片段可以用于聚合酶链式反应方案中来从DNA或者RNA扩增编码同源基因的更长的核酸片段。还可以对所克隆的核酸片段文库进行聚合酶链式反应,其中一种引物的序列来自本发明核酸片段,另一种引物的序列利用了编码微生物基因的mRNA前体的3,末端的聚腺苷酸序列。
备选地,第二种引物序列可以基于来自克隆载体的序列。例如,技术人员可以通过使用PCR扩增转录物的单个点和3’或5’末端之间区域的拷贝,按照RACE方案(Frohman等人,PNAS USA 858998(1988))来产生cDNA。可以从本发明序列设计3’和5’方向取向的引物。使用通过商业途径可获得的3’RACE或5’RACE系统(Gibco/BRL,Gaithersburg,MD),可以分离特定3’或5’cDNA片段(Ohara等人,PNAS USA 865673(1989);Loh等人,Science 243217(1989))。
本发明核苷酸和推导的氨基酸序列的有效性方便了DNA表达文库的免疫学筛选。可以合成代表本发明氨基酸序列的部分的合成肽。这些肽可以用于免疫动物以产生对包含所述氨基酸序列的肽或者蛋白质具有特异性的多克隆或者单克隆抗体。这些抗体可以用于筛选DNA表达文库来分离全长目的DNA克隆(Lerner,R.A.Adv.Immunol.361(1984);Maniatis,上文)。
用于提高异源表达的基因优化多种技术可用于提高特定目的Δ12去饱和酶在备选宿主中的表达。两种此类技术包括密码子优化和基因诱变。
密码子优化对于一些实施方案,可能希望修饰例如,编码具有Δ12去饱和酶活性的多肽的密码子的部分,以便增强编码这些多肽的基因在备选宿主(即,油质酵母)中的表达。
通常,通过检查蛋白质(优选以录大量表达的那些蛋白质)的密码子选择并确定那些密码子以最高频率使用可以确定特定目的宿主物种中的宿主优选的密码子。然后,可以使用该宿主物种中优选的密码子完整或者部分合成具有去饱和酶活性的目的多肽的编码序列。还可以合成DNA的全部(或者部分)以除去将在所转录的mRNA中存在的任何不稳定序列或者二级结构区。可以合成DNA的全部(或者部分)以将碱基组成改变成所希望的宿主细胞中更优选的碱基组成。
在本发明的优选实施方案中,来自例如串珠镰孢,构巢曲霉,Magnaporthe grisea,粗糙脉孢霉,禾本科镰孢,烟曲霉和黄曲霉的Δ12去饱和酶可以经密码子优化后在异源油质酵母宿主,例如Yarrowia lipolytica中表达。
诱变合成序列并将序列聚集的方法是文献中非常确实的。例如,体外诱变和选择、定点诱变、易错PCR(Melnikov等人,Nucleic AcidsResearch,27(4)1056-1062(February 15,1999)),“基因改组”(U.S.5,605,793;U.S.5,811,238;U.S.5,830,721;和U.S.5,837,458)或者其他方法可以用于得到天然发生的去饱和酶,如本文描述的Δ12去饱和酶的基因的突变。这将允许在体内产生具有去饱和酶活性的多肽,其具有在宿主中发挥功能所需的多种所希望的物理和动力学参数(例如,更长的半寿期或者产生所希望的PUFA的更高速率)。
如果希望,可以通过常规诱变、所得突变多肽的表达和确定它们的活性可以确定对于酶活性重要的去饱和酶多肽的区域。突变体可以包括缺失、插入和点突变,或者其组合。典型的功能分析以缺失诱变开始,该缺失诱变用于确定所述蛋白质的功能必需的N-和C-末端界限,然后产生内部缺失、插入或者点突变体以进一步确定功能必需的区域。还可以使用其他技术,如盒诱变或者总合成。例如,通过使用外切核酸酶以顺序除去5’或者3’编码区可以完成缺失诱变。此类技术可以使用试剂盒。缺失后,通过将含有起始或者终止密码子的寡核苷酸连接到分别5’或3’缺失后缺失的编码区,可以完成编码区。备选地,通过包括定点诱变、诱变PCR的多种方法或者通过连接到消化的DNA的现有的限制性位点上可以将编码起始或者终止密码子的寡核苷酸插入到编码区。通过多种方法可以进行相似的内部插入,所述方法包括使用DNA中的现有限制性位点,通过使用诱变引物经定点诱变或者诱变PCR。通过诸如接头分区诱变、定点诱变或者诱变PCR的技术可以进行点突变。化学诱变也可以用于鉴定对于活性重要的去饱和酶多肽区。表达突变构建体,并测定所得改变的蛋白质发挥去饱和酶功能的能力。此类结构-功能分析可以确定可以缺失哪些区,那些区耐受插入,和那些点突变允许突变蛋白质以与天然去饱和酶基本相同的方式发挥功能。来自本文描述的去饱和酶基因的所有此类突变蛋白质和编码它们的核苷酸序列都在本发明范围内。
从而,本发明包含如在所附序列表中报导的Δ12去饱和酶基因的完整序列、那些完整序列的互补序列、那些序列的实质性部分、源于它们的密码子优化的去饱和酶,和与它们基本上同源的那些序列。
ω-3和/或ω-6脂肪酸的微生物生产ω-3和/或ω-6脂肪酸的微生物生产与从天然来源如鱼或者植物纯化相比具有一些优点。例如1.)与高级生物相比,已知许多微生物具有极大简化的油组成,使得所希望的组分的纯化更容易;2.)微生物生产不受外部变量,如天气或者食物供应导致的波动;3.)微生物产物的油基本上无环境污染物的污染;4.)微生物可以提供特定形式的PUFA,其可以具有特定用途;和
5.)通过控制培养调节,特别是通过提供用于微生物表达的酶的特定底物,或者通过加入化合物或者用基因工程方法抑制不希望的生物化学途径,可以操控微生物油生产。
除了这些优点,从重组微生物生产ω-3和/或ω-6脂肪酸提供了改变天然产生的微生物脂肪酸图的能力,通过改变宿主中新的生物合成经,或者通过抑制不希望的途径,从而增加所希望的PUFA的水平(或者其缀合形式)和降低不希望的PUFA的水平(见,共同待决的美国专利申请10/840579,这里完整引入作为参考)可以实现所述目睹。
产生多种ω-3和/或ω-6脂肪酸的方法预计引入处于适当启动子控制下的编码本文描述的Δ12去饱和酶的嵌合基因将导致所转化的宿主生物中LA的产生增加。同样地,本发明包括指导PUFA产生的方法,其包括将脂肪酸底物(即,油酸)暴露于此处描述的PUFA酶(例如,串珠镰孢Δ12去饱和酶),从而底物转化成所希望的脂肪酸产物(即,LA)。更特别地,本发明的一个目的是提供在油质酵母中产生LA的方法,其中为所述油质酵母提供了(a)编码具有Δ12去饱和酶活性的真菌蛋白质的分离的核酸片段,当基于Clustal比对方法将所述蛋白质与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(b)由油酸组成的去饱和酶底物来源;其中酵母在一定条件下生长,使得嵌合去饱和酶基因表达并且油酸转化成LA,并且其中任选回收LA。从而,该方法最少包括使用下面的Δ12去饱和酶如本文描述的SEQ ID NOs4、8、12、16、20、21和22。
备选地,每种PUFA基因和其相应的在本文描述的酶产物可以间接用于产生ω-3和/或ω-6 PUFA。发生PUFA的间接产生,其中脂肪酸底物通过中间步骤或者中间途径间接转化成目的脂肪酸产物。从而,预期本文描述的Δ12去饱和酶与编码其他酶的一种或多种基因一起表达,从而发生一系列反应以产生所希望的产物。在优选实施方案中,例如,宿主生物可以用包含编码PUFA生物合成途径的酶的基因以导致更高水平地产生ω-3和/或ω-6脂肪酸(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)。特别地,例如,可以希望在宿主细胞中表达任一种本文描述的Δ12去饱和酶,所述宿主细胞还表达1)编码用于过量产生GLA的Δ6去饱和酶的基因;2)表达盒,其包含编码用于过量产生DGLA的Δ6去饱和酶和高亲和性延伸酶的基因;3)编码用于过量产生ARA的Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因;或4)编码用于过量产生EPA的Δ6去饱和酶、高亲和性延伸酶、Δ5去饱和酶和Δ17去饱和酶的基因。在备选实施方案中,例如,可以希望在细胞中过量表达如本文描述的Δ12去饱和酶,所述细胞还表达1)编码用于过量产生ALA的Δ15去饱和酶的基因2)编码用于过量产生STA的Δ15去饱和酶和Δ6去饱和酶的基因;3)编码用于过量产生ETA的Δ15去饱和酶、Δ6去饱和酶和高亲和性延伸酶的基因;4)编码用于过量产生EPA的Δ15去饱和酶、Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因。如本领域技术人公知的,下面酶活性的多种其他组合可以用于在宿主中与本文的去饱和酶一起表达Δ15去饱和酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶(图2)。在特定表达盒中包括的特定基因将取决于宿主细胞(和它的PUFA图和/或去饱和酶图)、底物的可用性,和所希望的终产物。
在备选实施方案中,有用的是基于本文描述的完整序列、那些完整序列的互补序列、那些序列的实质性部分、来源于所述序列的密码子优化的去饱和酶和与所述序列基本上同源的那些序列,可以破坏宿主生物的天然Δ12去饱和酶。例如,宿主生物中Δ12去饱和酶的定向那破坏产生不能合成LA的突变菌株。
表达系统、盒和载体可以在异源微生物细胞,尤其在油质酵母(例如,Yarrowialipolytica)的细胞中产生本文描述的本发明序列的基因和基因产物。重组微生物宿主中的表达可以用于产生多种PUFA途径中间产物,或者用于调节宿主中现有的PUFA途径用以合成迄今使用该宿主不可能合成的新产物。
含有指导外源蛋白质的高水平表达的调节序列的微生物表达系统和表达载体是本领域技术人员公知的。这些表达系统和表达载体的任一种都可以用于构建嵌合基因用来产生本发明序列的基因产物的任一种。这些嵌合基因可以然后通过转化导入适宜的微生物以提供所编码酶的高水平表达。
用于转化适宜的宿主细胞的载体或者DNA盒是本领域公知的。构建体中存在的序列的特定选择取决于所希望的表达产物(上文)、宿主细胞的性质和所建议的分离转化细胞与未转化细胞的方法。然而,通常,载体或者表达盒含有指导相关基因转录和翻译的序列、选择性标记和允许自主复制或者染色体整合的序列。适宜的载体包含控制转录起始的基因5’区和控制转录终止的DNA片段3’区。当两个控制区都来自所转化的宿主细胞的基因时是最优选的,尽管将理解此类控制区不必来自选择生产宿主的特定物种天然的基因。
用于驱动本发明ORF在所希望的宿主细胞中表达的起始控制区或者启动子有许多并且是本领域技术人员熟悉的。几乎能够指导这些基因在所选宿主细胞中表达的任何启动子都适于本发明。可以以瞬时或者稳定的方式完整宿主细胞中的表达。通过诱导与目的基因可操作地连接的可调节的启动子的活性可以完成瞬时表达。通过使用与目的基因可操作地连接的组成型启动子可以实现稳定表达。作为实例,当宿主细胞是酵母时,提供了在酵母细胞中有功能的转录和翻译区,尤其来自宿主物种的转录和翻译区。例如可以从如下得到转录起始调节区1)糖酵解途径中的基因,如醇脱氢酶、甘油醛-3-磷酸-脱氢酶(见美国专利申请号10/869630)、磷酸甘油酸变位酶(见美国专利申请号10/869630)、果糖二磷酸醛缩酶(见美国专利申请号60/519971)、磷酸葡萄糖异构酶、磷酸甘油酸酯激酶、甘油-3-磷酸O-酰基转移酶(见美国专利申请号60/610060),等等;或者2)可调节的基因,如酸性磷酸酶、乳糖酶、金属硫蛋白、葡萄糖淀粉酶、翻译延伸因子EF1-α(TEF)蛋白质(U.S.6,265,185)、核糖体蛋白质S7(U.S.6,265,185)等等。可以使用多种调节序列的任一种,这取决于希望组成型还是诱导型转录、启动子在表达目的ORF中的效率、构建的容易性,等等。
已经发现翻译起始密码子ATG周围的核苷酸序列影响酵母细胞中的表达。如果本发明Δ12去饱和酶的任一种在酵母中表达很弱,那么可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列从而得到最佳的基因表达。为了在酵母中表达,这可以通过无效表达的基因的定点诱变来进行,通过将所述基因融合在内源酵母基因,优选高度表达的基因的框内来进行所述定点诱变。备选地,可以确定宿主中共有翻译起始序列并将该序列改造成异源基因用于它们在目的宿主中的最佳表达(关于可应用于Yarrowia lipolytica的特定教导见,例如,美国专利申请号10/840478)。
终止区可以来自基因的3’区,其中起始区从所述基因得到或者来自不同的基因。多种终止序列是已知的并且在多种宿主中令人满意地发挥功能(当用于与它们所来源的相同或不同的属和种时)。通常选择终止区更多是由于方便而不是因为任何具体性质。优选地,终止区来自酵母基因,尤其酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、Yarrowia或者克鲁维酵母属(Kluyveromyces)。还已知编码γ-干扰素和α-2干扰素的哺乳动物基因的3’区在酵母中有功能。终止控制区还可以来自优选宿主天然的多种基因。任选地,终止位点可以是不必要的;然而,最优选包括终止位点。
如本领域技术人员已知的,仅将基因插入到克隆载体不能确保它将以所需的水平成功地表达。响应更高表达率的需要,通过操作许多不同的遗传元件已经产生了许多专门的表达载体,所述遗传元件控制转录、翻译、蛋白质稳定性、氧限制、和从宿主细胞的分泌。更特别地,已经操作用以控制基因表达的一些分子特征包括1)相关转录启动子和终止子序列的性质;2)所克隆的基因拷贝数和该基因是包含在质粒中还是整合到宿主的染色体中;3)所合成的外源蛋白质的最终细胞定位;4)宿主生物中翻译效率;5)宿主细胞内所克隆的基因蛋白质的内在稳定性;和6)所克隆基因内的密码子选择,从而它的频率接近宿主细胞的优选密码子选择的频率。这些类型修饰的每一种都包括在本发明中,作为进一步优化本文所述的Δ12去饱和酶的表达的方式。
微生物宿主的转化一旦已经得到了编码适于在油质酵母中表达的多肽的DNA,就将它置于能够在宿主细胞中自主复制的质粒载体中,或者它直接整合到宿主细胞的基因组中。表达盒的整合可以在宿主基因组内随机发生或者可以通过使用含有与宿主基因的同源性区的构建体靶定,所述同源性足够与宿主基因座的靶定重组。当构建体靶向内源基因座时,通过内源基因座可以提供所有或者一些转录和翻译调节区。
当从分开的复制载体表达两种和多种基因时,希望每种载体具有不同的分泌方式并且应该缺少与其他载体的同源性从而保持稳定表达和防止构建体间元件的再分布。可以通过实验确定调节区的慎重选择、选择方法和增殖方法,从而所有导入的基因以提供目的产物合成必要的水平表达。
包含目的基因的构建体可以通过标准技术导入宿主细胞。这些技术包括转化(例如,乙酸锂转化[Methods in Enzymology,194186-187(1991)])、原生质体融合、生物射弹轰击(biolisticimpact)、电穿孔、微注射或者将目的基因导入宿主细胞的任意其他方法。适于油质酵母(即,Yarrowia lipolytica)的更特别的教导包括美国专利号4,880,741和5,071,764和Chen,D.C.等人(ApplMicrobiol Biotechnol.48(2)232-235-(1997))。
为了方便,已经通过任意方法操作以吸收DNA序列(例如,表达盒)的宿主细胞将在本文称作“转化的”或者“重组的”。所转化的宿主将具有表达构建体的至少一个拷贝并且可以具有两个或多个拷贝,这取决于所述基因整合到基因组、扩增,还是存在于具有多个拷贝数的染色体外元件上。通过选择所导入的构建体上含有的标记可以鉴定转化的宿主细胞。备选地,可以有目的构建体共同转化单独的标记构建体,因为许多转化技术向宿主细胞导入许多DNA分子。通常,对转化的宿主选择它们在选择性培养基上生长的能力。选择性培养基可以掺入抗生素或者缺少未转化的宿主的生长必需的因子,如营养物或者生长因子。所导入的标记基因可以赋予抗生素抗性,或者编码必需生长因子或者酶,从而当在所转化的宿主中表达时允许在选择性培养基上生长。当可以直接或者间接检测表达的标记蛋白质时,也可以发生经转化的宿主细胞的选择。标记蛋白质可以单独或者作为与另一种蛋白质的融合蛋白表达。标记蛋白质可以通过如下检测1)它的酶促活性(例如,β半乳糖苷酶可以将底物X-gal[5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷]转化成有色产物;萤光素酶可以萤光素转化成发光产物);或者2)它的光产生或者修饰特征(例如,Aequorea victoria的绿色荧光蛋白当用蓝光照射时发荧光)。备选地,可以用抗生素检测例如,目的蛋白质上的标记蛋白质或者分子标签。可以例如,通过视觉或者通过诸如FACS或者使用抗体淘选可以选择表达标记蛋白质或者标签的细胞。对于酵母转化株的选择,可以使用在酵母中有功能的任意标记。理想地,对卡那霉素、潮霉素和氨基糖苷G418的抗性是重要的以及在缺少尿嘧啶或者亮氨酸的培养基上生长的能力。
转化后,适于本发明Δ12去饱和酶(和任选地在宿主细胞内共表达的其他PUFA酶)的底物可以由宿主天然地或者转基因地产生,或者它们可以外源地提供。
微生物中ω-3和/或ω-6脂肪酸生物合成的代谢工程化本发明Δ12去饱和酶的序列的知识将可以用于操作油质酵母,尤其Yarrowia lipolytica中ω-3和/或ω-6脂肪酸生物合成。这可能需要PUFA生物合成途径内的直接代谢工程化或者对PUFA生物合成途径贡献碳的途径的额外操作。用于操作生物化学途径的方法是本领域技术人员公知的。
用于上调所希望的生物合成途径的技术可以将去饱和酶(任选延伸酶)的额外拷贝导入宿主中以增加ω-3和/或ω-6脂肪酸生物合成途径的输出,通常通过使用多拷贝质粒。去饱和酶和延伸酶基因的表达也可以通过使用更强的启动子(受调节的或者组成型的)在转录水平上增加,以导致增加的表达,通过从所述mRNA或者编码的蛋白质除去/缺失区去稳定序列,或者通过向所述mRNA加入稳定序列(U.S.4,910,141)也可以增加所述表达。增加异源去饱和酶或者延伸酶基因的表达的再一种方法是通过将天然基因中的密码子用用于在所选宿主微生物中最佳基因表达的密码子代替来增加所编码mRNA的翻译效率。
下调不希望的生物合成途径的技术相反地,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或者碳的生物化学途径,或者干扰特定PUFA终产物的产生的天然PUFA生物合成途径酶可以通过基因破坏消除或者通过其他方法(例如,反义mRNA)下调。对于基因破坏,将外源DNA片段(通常选择性标记基因)插入到待破坏的结构基因中以便中断它的编码序列并从而功能地失活所述基因。将破坏盒转化到宿主细胞导致通过与非功能破坏的基因的同源重组代替功能的天然基因(见,例如Hamilton等人J.Bacteriol.1714617-4622(1989);Balbas等人Gene 136211-213(1993);Gueldener等人Nucleic Acids Res.242519-2524(1996);和Smith等人Methods Mol.Cell.Biol.5270-277(1996))。
反义技术是当已知靶基因的序列时下调基因的另一种方法。为了完成该目的,将来自所希望的基因的核酸片段克隆并可操作地连接启动子从而将转录RNA的反义链。然后将该构建体导入宿主细胞并产生RNA的反义链。反义RNA通过防止编码目的蛋白质的mRNA的积累抑制基因表达。本领域技术人员将知道特定考虑与反义技术的用途结合以便减小具体基因的表达。例如,反义基因表达的适宜水平可以需要使用不同的嵌合基因,利用技术人员已知的不同调节元件。
尽管靶定基因破坏和反义技术提供了当已知序列时下调基因的有效方法,但是已经开发了不是基于序列的特异性较低的方法。例如,可以将细胞暴露于紫外照射然后筛选所希望的表型。用化学剂诱变对于产生突变体也是有效的并且是常用的物质,包括影响非复制的DNA的化学品(例如,HNO2和NH2OH),以及影响正复制的DNA的试剂(例如,吖啶类染料,已知其导致移码突变)。使用辐射或者化学试剂产生突变体的特定方法在本领域中详细记载。参加,例如Thomas D.Brock inBiotechnologyA Textbook of IndustrialMicrobiology,2nded.(1989)Sinauer AssociatesSunderland,MA;or Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992)。
基因破坏的另一种非特异方法是使用转座元件或者转座子。转座子是随机插入DNA但是可以基于序列确定发生插入的位置在以后恢复的遗传元件。体内和体外转座方法都是已知的。两种方法包括使用转座元件联合转座酶。当转座元件或者转座子在转座酶存在下与核酸片段接触时,转座元件将随机插入到该核酸片段中。该技术用于随机诱变和基因分离,因为可以基于转座元件的序列鉴定所破坏的基因。用于体外转座的试剂盒可以通过商业途径获得[见,例如1)PrimerIsland Transposition试剂盒,其可以从Perkin Elmer AppliedBiosystems,Branchburg,NJ得到,基于酵母Ty1元件;2)GenomePriming System,其可以从New England Biolabs,Beverly,MA得到,基于细菌转座子Tn7;和3)EZ::TN Transposon InsertionSystems,其可以从Epicentre Technologies,Madison,WI获得,基于Tn5细菌转座元件]。
在本发明上下文中,有用的是通过上述方法之一调节脂肪酸生物合成途径的表达。例如,本发明提供了编码所述生物合成途径中的关键酶的基因(即,Δ12去饱和酶),导致产生ω-3和/或ω-6脂肪酸。尤其有用的是在油质酵母中表达产生不足量的18:2脂肪酸的这些基因,和使用用于宿主生物的代谢工程化的多种方法调节这种和其他PUFA生物合成基因的表达以最大化优选PUFA产物的产生。同样地,为了最大化这些基因的PUFA产生,有必要破坏竞争指向PUFA生物合成的碳流的途径。
在备选实施方案中,可能希望破坏本文的Δ12去饱和酶,以防止ω-3和/或ω-6脂肪酸的合成。在另一备选实施方案中,可能通过将任一种本发明的Δ12去饱和酶基因置于可诱导的或者受调节的启动子控制下调节ω-3和/或ω-6脂肪酸的产生。
用于重组表达Δ12去饱和酶的优选微生物宿主用于表达本发明基因和核酸片段的宿主细胞可以包括在多种原料,包括简单和复杂糖类、有机酸和醇,和/或烃上在宽范围的温度和pH值下生长的微生物宿主。尽管已经分离了用于在油质酵母,尤其Yarrowia lipolytica中表达的本发明中描述的基因,但是预计因为转录、翻译和蛋白质生物合成装置是高度保守的,所以任意细菌、酵母、藻类和/或丝状真菌将是用于表达本发明核酸片段的适宜的宿主。
优选的宿主是油质生物,如油质酵母。这些油质生物天然地能够进行油合成和积累,其中油可以占细胞干重的约25%以上,或者优选细胞干重的约30%以上,最优选细胞干重的约40%以上。通常鉴定为油质酵母的属包括,但不限于Yarrowia、假丝酵母属、红酵母属、红冬孢酵母属、隐球菌属、毛孢子菌属和油脂酵母属。更特别地,阐明性油合成酵母包括Rhodosporidium toruloides,Lipomycesstarkeyii,L.lipoferus,Candida revkaufi,C.pulcherrima,C.tropicalis,C.utilis,Trichosporon pullans,T.cutaneum,Rhodotorula glutinus,R.graminis和Yarrowia lipolytica以前分类为Candida lipolytica)。最优选地是油质酵母Yarrowialipolytica;在另一实施方案中,最优选称作ATCC #76982、ATCC#20362、ATCC #8862、ATCC #18944和/或LGAM S(7)1的Yarrowialipolytica菌株(Papanikolaou S.,和Aggelis G.,Bioresour.Technol.82(1)43-9(2002))。
其他优选的微生物宿主包括油质细菌、藻类和其他真菌(例如,Thraustochytrium sp.,Schizochytrium sp.和Mortierellasp.)。
用于PUFA生产的发酵方法所转化的微生物宿主细胞在优化脂肪酸生物合成基因活性和产生最大和最经济的脂肪酸产率(例如,LA,其可以又增加多种ω-3和/或ω-6脂肪酸的产生)的条件下生长。通常,可以优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳-氮比率、氧水平、生长温度、pH、生物量生产期的长度、油积累期的长度和细胞收获的时间。目的微生物,如油质酵母生长在复杂培养基(例如,酵母提取物-蛋白胨-葡萄糖培养基(YPD)或者缺少生长必需组分的确定的基本培养基并从而强迫选择所希望的表达盒(例如,Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI))。
本发明中的发酵培养基必须含有适宜的碳源。适宜的碳源可以包括,但不限于单糖(例如,葡萄糖、果糖),二糖(例如,乳糖或蔗糖),寡糖,多糖(例如,淀粉、纤维素或者其混合物),糖醇(例如,甘油)或者来自可更新的原料的混合物(例如,干酪乳清渗透物、玉米浆、甜菜糖蜜、大麦麦芽)。此外,碳源可以包括烃类、脂肪酸、脂肪酸酯、甘油一酯、甘油二酯、甘油三酯、磷脂和脂肪酸的多种商业来源,包括植物油(例如,大豆油)和动物脂肪。此外,碳底物可以包括一碳底物(例如,二氧化碳或者甲醇),已经为所述底物阐明了向关键生物化学中间物的代谢转化。因此,预计用于本发明的碳源可以包括多种含碳底物并且将仅受到宿主生物的选择的限制。尽管预计所有上述碳底物和其混合物将适于本发明,但是优选的碳底物为糖和/或脂肪酸。最优选的是葡萄糖和/或含有10-22个碳的脂肪酸。可以从无机(例如,(NH4)2SO4)或者有机来源(例如,尿素或者谷氨酸)提供氮。除了适宜的碳和氮源,发酵培养基必须还含有适宜的矿物质、盐、辅因子、缓冲剂、维生素、和本领域已知的其他组分,它们适于微生物的生长和促进PUFA产生必要的酶途径。特别注意处理脂类和PUFA合成的一些金属离子(例如,Mn+2,Co+2,Zn+2,Mg+2)(Nakahara,T.等人Ind.Appl.Single Cell Oils,D.J.Kyle and R.Colin,eds.pp 61-97(1992))。
本发明中优选的生长培养基是通常商业制备的培养基,如YeastNitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他限定的或者合成生长培养基并且用于生长特定微生物的适宜培养基将是微生物学或者发酵科学领域技术人员已知的。用于发酵的适宜的pH范围通常为约pH4.0到pH8.0,其中pH 5.5到pH 7.0优选为最初生长条件的范围。发酵可以在需氧或者厌氧条件下进行,其中优选微需氧条件。
通常油质微生物中PUFA的高水平积累需要两阶段方法,因为代谢状态必须在生长或者脂肪的合成/贮存之间“平衡”。从而,最优选地,两阶段发酵方法是在油质酵母中产生PUFA必需的。在该方法中,发酵的第一阶段致力于产生和积累细胞量并且特征是快速细胞生长和细胞分裂。在发酵第二阶段中,优选建立培养物中氮消除条件以促进高水平脂质积累。该氮消除的影响将是减小细胞中AMP的有效浓度,从而减小线粒体的NAD依赖性异柠檬酸脱氢酶的活性。当这发生时,柠檬酸将积累,从而形成细胞质中乙酰辅酶A的大量库并引发脂肪酸合成。从而,该阶段的特征是细胞分裂的停止,接着是合成脂肪酸和积累油。
尽管细胞通常在约30℃生长,但是一些研究已经显示在较低温度下不饱和脂肪酸的合成增加(Yongmanitchai和Ward,Appl.Environ.Microbiol.57419-25(1991))。基于方法经济性,两阶段的第一阶段后可能发生该温度变动,此时已经发生了大量生物生长。
预计可以应哟个多种发酵方法设计,其中希望使用本发明Δ12去饱和酶基因进行ω脂肪酸的商业生产。例如,通过分批、补料分批和连续发酵方法可以产生从重组微生物宿主商业生产PUFA。
批发酵过程是一种密闭系统,其中培养基组分在该过程的开始设定并且除了为在该过程期间保持pH和氧气水平,不进行其他加入。从而,在培养过程的开始,对培养基接种所希望的生物并允许生长或者代谢活性而不向培养基加入额外底物(即,碳源和氮源)。在批过程中,系统的代谢物和生物量组分不断改变直到培养结束的时间。在典型的分批过程中,细胞通过静止滞后期温和发展到高生长对数期并最后发展到稳定期,其中生长速率减小或者停止。如果不处理,稳定期的细胞将最终死亡。标准分批方法的变通方法是补料分配方法,其中在发酵过程中向发酵罐不断加入底物。补料分配方法也适于本发明。当分解代谢物抑制易于抑制细胞的代谢或者当希望任何时刻在培养基中有有效量的底物时,补料分配方法是有用的。测量补料分批系统中底物浓度是困难的并因此可以基于可测量的因素如pH、溶解氧和废气的部分压强(例如,CO2)来估计。分批和补料分批培养方法是本领域常见和公知的并且实例可以见Thomas D.Brock,BiotechnologyATextbook of Industrial Microbiology,2nded.,(1989)SinauerAssociatesSunderland,MA;或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992),将它们引入作为参考。
通过连续发酵方法也可以完成使用本发明Δ12去饱和酶进行ω脂肪酸的商业生产,在所述连续发酵方法中,将确定成分培养基连续加到生物反应器中而同时取出等量培养体积用于产品回收。连续培养通常以恒定的细胞密度保持细胞处于对数生长期。连续或者半连续培养方法允许调节影响细胞生长或者终产物浓度的一种因素或者任意多种因素。例如,一种方法可以限制碳源和允许所有其他参数来缓和代谢。在其他系统中,可以连续改变影响生长的许多因素而通过培养基浊度测量的细胞浓度保持恒定。连续系统力争保持稳态生长从而细胞生长速率必须和由于从培养基分离培养物导致的损失之间保持平衡。调节连续培养方法的营养物和生长因子,以及最大化产生形成速率的技术是工业微生物学领域公知的并且Brock,上文中详述了多种方法。
PUFAs的纯化PUFA可以在宿主微生物中作为游离脂肪酸或者以酯化形式如酰基甘油、磷脂、硫脂或者糖脂形式发现,并且可以通过本领域公知的多种方法从宿主细胞提取出来。酵母脂质的提取技术、质量分析和可接受性标准的一个综述为Z.Jacobs(Critical Reviews inBiotechnology 12(5/6)463-491(1992))的综述。下游加工的简要综述见A.Singh和O.Ward(Adv.Appl.Microbiol.45271-312(1997))。
通常,纯化PUFA的方法可以包括用有机溶剂提取、超生处理、超临界流体提取(例如,使用二氧化碳)、皂化和物理方法,如压力,或者它们的组合。尤其重要的是在水存在下用甲醇和氯仿提取(E.G.Bligh & W.J.Dyer,Can.J.Biochem.Physiol.37911-917(1959))。希望时,可以将含水层酸化以质子化带负电的部分和从而增加所希望的产物向有机层的分配。提取后,可以在氮气流下蒸发除去有机溶剂。当以缀合形式分离时,可以用酶或者化学切割产物以释放游离脂肪酸或者较不复杂的目的缀合物,并且可以进行进一步操作以产生目的终产物。理想地,用氢氧化钾断裂脂肪酸的缀合形式。
如果需要进一步纯化,可以使用标准方法。此类方法可以包括提取、用尿素处理、分步结晶、HPLC、分馏、硅胶层析、高速离心或者蒸馏,或者这些技术的组合。反应基,如酸性或者链烯基的保护可以通过已知技术(例如,烷基化或者碘化)在任意步骤进行。所用的方法包括脂肪酸的甲基化以产生甲酯。类似地,可以在任意步骤除去保护基。理想地,含有GLA、STA、ARA、DHA和EPA的级分的纯化可以通过用尿素处理和/和级分蒸馏完成。
优选实施方案描述本文描述的工作的最终目的是开发积累富含ω-3和/或ω-6 PUFAs的油的油质酵母。为此,必须鉴定在油质酵母中有功能的去饱和酶,使得能够在这些宿主中合成和大量积累优选的PUFA。对于探作宿主细胞中产生的ω-3与ω-6 PUFAs比率,也有必要鉴定有效的去饱和酶。
在以前工作中,申请人已经分离了天然Yarrowia lipolyticaΔ12去饱和酶并且过表达了该蛋白质,导致相对于野生型油酸向LA的转化增加(美国专利申请10/840325,将其完整引入作为参考;也参见本文实施例2和SEQ ID NOs51和52)。特别地,底物转化百分数(测量为([18:2]/[18:1+18:2])*100)在所转化细胞中为74%,相比在野生型Yarrowia中底物转化百分数为仅59%。尽管观察到这些宿主细胞内LA可用性增加,然而,希望鉴定编码具有Δ12去饱和酶活性的蛋白质的基因,所述基因将使得能够产生油酸向LA的更大转化。这将允许在Y.lipolytica转化的细胞中LA作为用于高水平合成多种ω-3和/或ω-6 PUFAs(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)的有效性增加。从而,具有高水平Δ12去饱和酶活性的异源蛋白质的表达在生物的途径改造中是有利的。
为了实现该目标,在本发明中,申请人已经从串珠镰孢分离和克隆了编码Δ12去饱和酶(SEQ ID NOs3和4)的DNA片段。该基因作为Δ12去饱和酶的活性的证实基于1)当在破坏天然Δ12去饱和酶基因的Yarrowia lipolytica菌株中表达串珠镰孢基因时恢复了LA生物合成(通过互补);和2)在表达串珠镰孢基因的野生型Y.lipolytica细胞中过量产生LA(实施例6)。
然而,上述实验导致令人惊奇的发现,其中串珠镰孢Δ12去饱和酶比Yarrowia lipolytica Δ12去饱和酶在Yarrowia lipolytica中产生18:2更有效(见实施例6,表11)。特别地,确定了Yarrowialipolytica中TEF启动子控制下的串珠镰孢Δ12去饱和酶的表达产生比以前通过表达处于TEF启动子控制下的编码YarrowialipolyticaΔ12去饱和酶的嵌合基因可以得到的(LA的59%产物积累)更高水平的18:2(LA的68%产物积累)。这对应于底物转化百分数(以([18:2]/[18:1+18:2])*100计算)中的差异分别为85%和74%。此外,串珠镰孢Δ12去饱和酶比以前报导的任何已知的Δ12去饱和酶更有效地发挥功能(例如,当在酿酒酵母中过表达粗糙脉孢霉Δ12去饱和酶时实现油酸向18:2的仅68%的底物转化[WO 2003/099216])。
基于这些结果,本发明真菌串珠镰孢Δ12去饱和酶的表达比其他已知Δ12去饱和酶优选作为工程化积累富含ω-3和/或ω-6 PUFAs的油的油质酵母的方法(然而,本领域技术人员将预计例如,密码子优化后可以增强Yarrowia lipolytica中串珠镰孢Δ12去饱和酶的活性)。
此外,申请人还从上述构巢曲霉、Magnaporthe grisea、粗糙脉孢霉、禾本科镰孢、烟曲霉和黄曲霉鉴定了与上述串珠镰孢蛋白质直向同源的一组Δ12去饱和酶(即,SEQ ID NOs8、12、16、20、21和22)。这些蛋白质(包括串珠镰孢Δ12去饱和酶(SEQ ID NO4))在不同的蛋白质亚家族(本文称作“亚家族2”)中聚簇,所述亚家族蛋白质与“亚家族1”内聚簇的蛋白质明显不同(即,SEQ ID NOs2,6,10,14和18,在共同待决的美国临时申请60/519191中鉴定为Δ15去饱和酶),尽管所有蛋白质均与本文鉴定为SEQ ID NO52(在共同待决的美国专利申请10/840325中表征)的Y.lipolyticaΔ12去饱和酶同源。亚家族2的蛋白质(在本文鉴定为Δ12去饱和酶并且受到WO 03/099216中将所述粗糙脉孢霉功能表征为Δ12去饱和酶的指出)代表相互具有至少56.3%同一性的一组蛋白质(实施例4)并且它们通过与以前描述的Δ12去饱和酶的序列同源性而显著区分。
预期该独特类别的真菌Δ12去饱和酶将可以用于在油质酵母(例如,Yarrowia lipolytica)中表达作为改变脂肪酸组成的方法,这是基于它们将以高效率发挥功能的预期(即,底物转化百分数,其中至少约70%的油酸向LA的底物转化%是优选的,而至少约80%的油酸向LA的底物转化%是尤其适宜的,至少约85%的油酸向LA的底物转化%是最优选的)。从而,本发明的一个实施方案是改变幼稚酵母中脂肪酸分布图的方法,其中亚家族2的Δ12去饱和酶单独表达或者与其他脂肪酸生物合成基因(例如,Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶)联合表达。
实施例在下面实施例中进一步限定本发明。将理解这些实施例尽管指出本发明的优选实施方案,但是仅作为例证给出。从上面的讨论和这些实施例,本领域技术人员可以确定本发明的基本特征,并且不背离本发明的精神和范围,可以对本发明做出多种改变和修改使其适于多种用法和条件。
一般方法实施例中使用的标准重组DNA和分子克隆技术是本领域公知的并且由1.)Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular CloningA Laboratory Manual;Cold Spring HarborLaboratoryCold Spring Harbor,NY(1989)(Maniatis);2.)T.J.Silhavy,M.L.Bennan,和L.W.Enquist,Experiments withGene Fusions;Cold Spring Harbor LaboratoryCold SpringHarbor,NY(1984);和3.)Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience出版(1987)描述。
适于维持和生长细胞培养物的材料和方法是本领域公知的。适于用于下面的实施例的技术可以见Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg andG.Briggs Phillips,Eds),American Society for MicrobiologyWashington,D.C.(1994));或Thomas D.Brock inBiotechnologyA Textbook of Industrial Microbiology,2nded.,SinauerAssociatesSunderland,MA(1989)。除非另外指出,用于生长和维持细菌细胞的所有试剂、限制酶和材料都从Aldrich Chemicals(Milwaukee,WI),DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),或Sigma Chemical Company(St.Louis,MO)得到。
大肠杆菌(E.coli)TOP10细胞和大肠杆菌Electromax DH10B细胞从Invitrogen(Carlsbad,CA)得到。大肠杆菌DH5α的MaxEfficiency感受态细胞从GIBCO/BRL(Gaithersburg,MD)得到。大肠杆菌(XL1-Blue)感受态细胞从Stratagene Company(San Diego,CA)购买。所有大肠杆菌细胞通常在37℃生长在Luria Bertani(LB)板上。
根据标准方法(Sambrook等人,上文)进行常规分子克隆。由Sigma-Genosys(Spring,TX)合成寡核苷酸。将PCR产物克隆到Promega的pGEM-T-easy载体(Madison,WI)。
使用染料终止剂技术(U.S.5,366,860;EP 272,007),用载体和插入片段特异引物的联合在ABI自动测序仪上产生DNA序列。用Sequencher(Gene Codes Corporation,Ann Arbor,MI)进行序列编辑。所有序列代表两个方向至少两倍的盖度。用DNASTAR软件(DNASTAR Inc.,Madison,WI)完成基因序列的比较。
缩写的含义如下“sec”表示秒;“min”表示分钟;“h”表示小时,“d”表示天,“μl”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔/升,“mM”表示毫摩尔/升,“M”表示摩尔/升,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对,“kB”表示千碱基。
Yarrowia lipolytica的培养Yarrowia lipolytica菌株ATCC #76982和ATCC #90812从美国典型培养物保藏中心(American Type Culture Collection)(Rockville,MD)购买。Y.lipolytica菌株在28℃生长在YPD琼脂(1%酵母提取物,2%细菌用蛋白胨,2%葡萄糖,2%琼脂)上。对于转化选择,使用基本培养基(0.17%酵母氮碱基(DIFCO Laboratories,Detroit,MI),其没有硫酸铵并且没有氨基酸,2%葡萄糖,0.1%脯氨酸,pH6.1)。适当补加腺嘌呤、亮氨酸、赖氨酸和/或尿嘧啶至0.01%的终浓度。
Yarrowia lipolytica的脂肪酸分析对于脂肪酸分析,通过离心收集细胞,并如Bligh,E.G.& Dyer,W.J.(Can.J.Biochem.Physiol.37911-917(1959))中描述的提取脂质。通过用甲氧基钠进行脂提取物的转酯作用(Roughan,G.,and Nishida I.Arch Biochem Biophys.276(1)38-46(1990))制备脂肪酸甲酯并随后用安装30-m X 0.25mm(i.d.)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC分析。烘箱温度以3.5℃/min从170℃(25min保持)升高到185℃。
对于直接碱基转酯,收获Yarrowia培养物(3mL),将其用蒸馏水洗涤一次,并在Speed-Vac中真空干燥5-10分钟。向样品中加入甲氧基钠(100μl,1%),然后涡旋样品并摇动20min。加入3滴1MNaCl和400μl己烷后,涡旋并离心样品。除去上层并如上述通过GC分析。
实施例1构建Yarrowia表达载体本发明描述了质粒pY5,pY5-13(包含嵌合的TEF启动子::XPR终止子基因),和pY5-20(包含嵌合的潮霉素抗性基因)的构建。
构建质粒pY5构建质粒pY5用于在Yarrowia lipolytica中表达异源基因(图3),质粒pY5是pINA532(Claude Gaillardin博士,InsitutNational Agronomics,Centre de biotechnologie Agro-Industrielle,laboratoire de Genetique Moleculaire etCellularie INRA-CNRS,F-78850Thiverval-Grignon,France馈赠)的衍生物。
首先,将含有ARS18序列和pINA532的LEU2基因的部分消化的3598bp EcoRI片段亚克隆到pBluescript(Strategene,San Diego,CA)的EcoRI位点产生pY2。通过PCR使用TEF5’(SEQ ID NO23)和TEF3’(SEQ ID NO24)作为引物从Yarrowia lipolytica基因组DNA扩增TEF启动子(Muller S.,等人Yeast,141267-1283(1998))。在50μl总体积中进行PCR扩增,所述总体积含有100ng Yarrowia基因组DNA,含有10mM KCl,10mM(NH4)2SO4,20mM Tris-HCl(pH8.75),2mM MgSO4,0.1%Triton X-100,100μg/mL BSA(终浓度),200μM每种脱氧核糖核酸三磷酸的PCR缓冲液,10pmole每种引物和1μl PfuTurbo DNA聚合酶(Stratagene,San Diego,CA)。如下进行扩增95℃ 3min的最初变性,然后35个如下95℃ 1min,56℃ 30sec,72℃ 1min循环。进行72℃ 10min的最终延伸循环,然后在4℃结束反应。将418bp PCR产物连接到pCR-Blunt以产生pIP-tef。将pIP-tef的BamHI/EcoRV片段亚克隆到pY2的BamHI/SmaI位点产生pY4。
通过PCR使用pINA532作为模板和XPR5’(SEQ ID NO25)和XPR3’(SEQ ID NO26)作为引物扩增XPR2转录终止子。使用上述组分和条件在50μl总体积中进行PCR扩增。将179bp PCR产物用SacII消化然后连接到pY4的SacII位点以产生pY5。从而,pY5(图3中显示)可用作Yarrowia-大肠杆菌穿梭载体,其含有1.)Yarrowia自主复制序列(ARS18);2.)ColE1质粒复制起点;3.)氨苄青霉素抗性基因(AmpR),其用于大肠杆菌中的选择;4.)Yarrowia LEU2基因,其用于Yarrowia中的选择;5.)翻译延伸启动子(TEF P),其用于在Yarrowia中表达异源基因;和6.)细胞外蛋白酶基因终止子(XPR2),其用于Yarrowia中异源基因表达的转录终止。
质粒pY5-13和pY5-20的构建将pY5-13和pY5-20构建为pY5的衍生物以方便在Yarrowialipolytica中的亚克隆和异源基因表达。
特别地,使用pY5作为模板,通过6轮定点诱变构建pY5-13。使用寡核苷酸YL5和YL6(SEQ ID NOs27和28)通过定点诱变从pY5除去SalI和ClaI位点产生pY5-5。使用寡核苷酸YL9和YL10(SEQ IDNOs29和30)通过定点诱变在Leu2基因和TEF启动子之间引入SalI位点产生pY5-6。使用寡核苷酸YL7和YL8(SEQ ID NOs31和32)将PacI位点导入pY5-6中LEU2基因和ARS18之间以产生pY5-8。使用寡核苷酸YL3和YL4(SEQ ID NOs33和34)在pY5-8中TEF的翻译起始密码子的周围引入NcoI位点以产生pY5-9。用YL1和YL2寡核苷酸(SEQ ID NOs35和36)除去pY5-9的Leu2基因内的NcoI位点以产生pY5-12。最后,使用寡核苷酸YL61和YL62(SEQ ID NOs37和38)在pY5-12的ColEI和XPR区之间引入BsiWI位点以产生pY5-13。
质粒pY5-20是pY5的衍生物。通过将含有嵌合的潮霉素抗性基因的Not I片段插入到pY5的Not I位点构建pY5-20。所述嵌合基因具有处于Yarrowia lipolytica TEF启动子控制下的潮霉素抗性ORF。
实施例2克隆Yarrowia lipolytica Δ12去饱和酶和破坏内源Δ12去饱和酶基因基于Yarrowia lipolytica(ATCC #76982)的脂肪酸组成(其阐明该生物可以产生LA(18:2)但不是ALA(18:3)),假定Y.lipolytica将可能含有具有Δ12去饱和酶活性但没有Δ15去饱和酶活性的基因。从而,本实施例描述了使用简并PCR引物分离Yarrowialipolytica Δ12去饱和酶的部分编码序列,使用该部分序列破坏Yarrowia lipolytica中的天然基因,和随后克隆全长基因。
使用简并PCR引物通过PCR从Yarrowia lipolytica克隆部分推定的Δ12去饱和酶序列使用DNeasy Tissue试剂盒(Qiagen,Catalog #69504)从Yarrowia lipolytica(ATCC #76982)分离基因组DNA并将其以0.5μg/μl的DNA浓度重悬浮在试剂盒缓冲液AE中。用基因组DNA作为模板和根据在不同Δ12去饱和酶之间保守的氨基酸序列制备的几组简并引物进行PCR扩增。用一组上游和下游引物(分别是P73和P76)得到了最佳结果,如下表所示。
表4用于扩增部分推定的Δ12去饱和酶的简并引物 在Eppendorf Mastercycler Gradient循环变温器中根据生产商的推荐进行PCR。如下进行扩增95℃ 1min的最初变性,接着是30个95℃ 30sec变性,58℃ 1min退火,和72℃ 1min延伸的循环。进行72℃ 10min的最后延伸循环,然后在4℃结束反应。
将预期(约740bp)大小的PCR产物通过琼脂糖凝胶电泳检测,分离,纯化并克隆到pTA载体(Invitrogen),和测序。基于BLAST程序分析(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993)),所得序列与已知的Δ12去饱和酶具有同源性。
Yarrowia lipolytica Δ12去饱和酶基因的定向破坏用称作pY23D12的靶定盒对Δ12去饱和酶基因进行同源重组介导的替换,进行Yarrowia lipolytica ATCC #76982中Δ12去饱和酶基因的定向破坏。pY23D12来自质粒pY20(实施例1)。
特别地,将Hind III/Eco RI片段插入到相似线性化的pY20产生pY23D12。该642bp片段由(5’到3’方向)从+718到+1031位的3’同源序列(SEQ ID NO51中的编码序列(ORF))、Bgl II限制位点,和从+403到+717位的5’同源序列(SEQ ID NO51中的编码序列(ORF))组成。分别使用PCR引物组P99和P100(SEQ ID NOs43和44)和P101和P102(SEQ ID NOs45和46)从642bp PCR产物PCR扩增3’和5’序列制备所述片段。
将pY23D12通过Bgl II限制性消化线性化并通过乙酸锂方法根据Chen,D.C.等人(Appl Microbiol Biotechnol.48(2)232-235(1997))的方法转化到对数中期Y.lipolytica ATCC #76982细胞。简言之,将Y.lipolytica在YPD板上划线并在30℃生长约18小时。从平板刮除一些大的菌环量细胞并将其重悬浮在1ml转化缓冲液中,该缓冲液含有2.25mL 50%PEG,平均MW 3350;0.125mL 2M乙酸锂,pH6.0;0.125mL 2M DTT;和50μg剪切的鲑精DNA。
将约500ng质粒DNA在100μl重悬浮的细胞中孵育,并在39℃保持1小时,用涡旋以15分钟间隔混合。将细胞接种在YPD潮霉素选择平板上并在30℃保持2到3天。
分裂了四个潮霉素抗性菌落并通过PCR筛选定向破坏。设计一组PCR引物(P119[SEQ ID NO47]和P120[SEQ ID NO48])用于扩增同源重组后的特定连接片段。设计另一组PCR引物(P121[SEQ IDNO49]和P122[SEQ ID NO50])用于检测天然基因。四个潮霉素抗性菌落中的3个对于连接片段呈阳性并且对于天然片段呈阴性,从而证实了定向整合。
确定Δ12去饱和酶-破坏的菌株中脂肪酸分布图通过称作Q-d12D的一个被破坏的菌株中总脂质的GC分析进一步证实天然Δ12去饱和酶基因的破坏。野生型(ATCC #76982)和Q-d12D的单个菌落每个生长在3ml基本培养基(成分/L20g葡萄糖,1.7g酵母氮碱基,1g L-脯氨酸,0.1g L-腺嘌呤,0.1g L-赖氨酸,pH6.1)中30℃下直到OD600~1.0。收获细胞,将其用蒸馏水洗涤,speedvacuum干燥并进行直接转酯作用和GC分析(如一般方法中描述)。
在下表5中显示了野生型Yarrowia和包含破坏的Δ12去饱和酶的转化株Q-d12D的脂肪酸分布图。鉴定脂肪酸为16:0(棕榈酸),16:1(p棕榈油酸),18:0,18:1(油酸)和18:2(LA)并且每种脂肪酸的成分以总脂肪酸的%表示。
表5野生型和转化体Yarrowia lipolytica中脂肪酸成分(总脂肪酸的%)
*nd=不可检测结果表明Q-d12D菌株中天然Δ12去饱和酶基因被失活。从而,可以推断在仅一种基因编码Yarrowia lipolytica ATCC #76982中功能Δ12去饱和酶。
Yarrowia liDolytica Δ12去饱和酶基因的质粒拯救因为插入也含有大肠杆菌氨苄青霉素抗性基因和大肠杆菌ori的完整pY23D12载体破坏了Δ12去饱和酶基因,所以可能拯救大肠杆菌中的侧翼序列。为此,用DNeasy Tissue Kit分离Yarrowia lipolytica菌株Q-d12D的基因组DNA。特别地,在200μl的反应体积中用50μl限制酶Age I,Avr II,Nhe I和Sph I消化10μg基因组DNA。将所消化的DNA用酚氯仿萃取并重悬浮在40μl去离子水中。所消化的DNA(10μl)在含有3U T4 DNA连接酶的200μl连接混合物中自连接。在16℃进行连接12小时。用酚氯仿萃取所连接的DNA并将其重悬浮在40μl去离子水中。最后,用1μl重悬浮的经连接的DNA通过电穿孔转化大肠杆菌并接种在含有氨苄青霉素(Ap)的LB板上。分离Ap-抗性菌落并通过小量制备分析质粒的存在。在回收或拯救的质粒中发现了下面的插入片段大小(表6)
表6所回收质粒的插入片段大小,根据限制酶
用测序引物P99(SEQ ID NO43)和P102(SEQ ID NO46)开始质粒测序。
基于测序结果,装配编码Yarrowia lipolytica Δ12去饱和酶基因的全长基因(1936bp;SEQ ID NO51)。特别地,所述序列编码1257个碱基(SEQ ID NO51的核苷酸+283到+1539)的可读框,而所推导的序列长为419个残基(SEQ ID NO52)。该基因也在“Yeastproject Genolevures”(Center for Bioinformatics,LaBRI,Talence Cedex,France)的公开Y.lipolytica蛋白质数据库中公开为YALI-CDS3053.1(也参见Dujon,B.等人,Nature 430(6995)35-44(2004))。
实施例3处于异源Yarrowia启动子控制下的Yarrowia lipolytica Δ12去饱和酶ORF的表达本实施例描述了处于异源(非-Δ12去饱和酶)Yarrowia启动子控制下的嵌合基因中Y.lipolytica Δ12去饱和酶ORF(来自实施例2)的表达。这使得能够互补Δ12去饱和酶-破坏的突变体和在野生型Y.lipolytica菌株中过量产生LA。
特别地,用上游引物P147(SEQ ID NO53)和下游引物P148(SEQID NO54)从Y.lipolytica ATCC #76982的基因组DNA用PCR扩增编码Y.lipolytica Δ12去饱和酶的ORF。将正确大小(1260bp)的片段分离、纯化、用Nco I和Not I消化并克隆到NcoI-Not I切割的pY5-13载体(实施例1),从而该基因处于TEF启动子控制下。通过小量制备分析证实正确的转化株并将所得质粒命名为pY25-d12d。
用实施例2中描述的转化方法将质粒pY5-13(“对照”)和pY25-d12d每个单独转化到Y.lipolytica ATCC#76982野生型(WT)和Δ12-破坏的菌株(Q-d12D)。在Bio101 DOB/CSM-Leu板上选择阳性转化株。
转化株的单个菌落长大并如一般方法中描述的分析GC。结果在下面的表中显示。将脂肪酸鉴定为16:0(棕榈酸),16:1(棕榈油酸),18:0,18:1(油酸)和18:2(LA);每种脂肪酸的组分代表为总脂肪酸的%。根据下面的公式计算“D12d SC”([18:2]/[18:1+18:2])*100并且代表底物转化百分数(SC)。
表7用Yarrowia lipolytica Δ12去饱和酶基因转化的Yarrowia的脂肪酸组成(总脂肪酸%)
*nd=不可检测结果表明使用TEF启动子表达Y.lipolytica Δ12去饱和酶恢复了在内源基因破坏的菌株中18:2的产生。
此外,结果表明野生型细胞中Y.lipolytica Δ12去饱和酶的过表达导致LA产生(18:2)的水平增加。特别地,LA的%产物积累从野生型细胞中的47%增加到转化的细胞中59%(代表底物转化百分数[“D12d SC”]从野生型中的59%改变为用嵌合Δ12去饱和酶转化的那些细胞中的74%)。
实施例4从丝状真菌鉴定Δ12去饱和酶本实施例描述了多种丝状真菌中Δ12去饱和酶的鉴定。基于与Yarrowia lipolytica Δ12去饱和酶的同源性鉴定这些序列(实施例2);并且,来自每个物种的序列根据系统进化分析法落入两个“亚家族”之一。
使用Δ12去饱和酶蛋白质序列(SEQ ID NO52)作为针对丝状真菌的可利用的序列数据库的查询序列进行BLAST搜索(Basic LocalAlignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993)),所述数据库包括1)粗糙脉孢霉,Magnaporthegrisea,构巢曲霉和禾本科镰孢的公共数据库;和2)串珠镰孢菌株M-8114的DuPont EST文库(E.I.du Pont de Nemours和Co.,Inc.,Wilmington,DE)(串珠镰孢菌株M-8114可以从Fusarium ResearchCenter,University Park,PA得到;也参见Plant Disease 81(2)211-216(1997))。这些BLAST搜索鉴定了每种生物内与Yarrowialipolytica Δ12去饱和酶蛋白质的两种同源物。下表概述了关于这些同源物的每一种的细节。
表8与Yarrowia lipolytica Δ12去饱和酶具有同源性的ORF的描述
*注释奇数SEQ ID NOs指ORF核苷酸序列,偶数SEQ ID NOs指所推导的氨基酸序列。
所有同源物为未注解的或者有注解的Δ12去饱和酶或脂肪酸去饱和酶。此外,来自禾本科镰孢的核苷酸序列为具有推定的内含子序列的基因组序列;申请人进行了所推定氨基酸的试验性装备以比较来自其他同源物的氨基酸序列。
使用LASERGENE生物信息学计算套件(Windows 32 Megalign 5.061993-2003;DNASTAR Inc.,Madison,WI)的Megalign程序对Δ12去饱和酶的系统树分析出乎意料地揭示了两个亚家族。如图4中所示,Nc1,Mg1,Fg1,Fm1和An1在与Yarrowia lipolytica Δ12去饱和酶具有同源性的蛋白质的“亚家族1”中聚簇,而Fg2,Fm2,Mg2,Nc2和An2在Yarrowia lipolytica Δ12去饱和酶蛋白质同源物的“亚家族2”内聚簇。
随后,在两种额外生物的公共序列数据库中也鉴定了一种Δ12去饱和酶同源物,如下面的表9中所示。
表9与Yarrowia lipolytica Δ12去饱和酶具有同源性的额外ORFs
这些额外序列在Yarrowia lipolytica Δ12去饱和酶蛋白质同源物的亚家族2内聚簇。
然后使用DNASTAR软件的Megalign程序的Clustal W方法(slow,accurate,Gonnet选项;Thompson等人,Nucleic Acids Res.224673-4680(1994))对与Yarrowia lipolytica Δ12去饱和酶具有同源性的每种蛋白质进行比对。通过该方法揭示的百分数同一性用于确定所述蛋白质是否是直向同源物(图5)。此外,将所述同源物与表10中所示的已知的Δ12去饱和酶比较。
表10用于Clustal W分析的已知的Δ12去饱和酶
亚家族1的蛋白质(SEQ ID NOs2,6,10,14和18;图5)相互至少46.2%同一并且与亚家族2的蛋白质(SEQ ID NOs4,8,12,16,20;图5)具有小于45.2%的同一性。此外,亚家族2的蛋白质(SEQ IDNOs4,8,12,16,20;图5)相互具有至少56.3%同一性。亚家族2的蛋白质和来自S.platensis、秀丽隐杆线虫、C.reinhardtii、普通小球藻、拟南芥、Y.lipolytica、D.hansenii、M.alpina、鲁西毛霉,和P.augusta的Δ12去饱和酶之间的最大同一性为51.6%(图6)。
尽管未在图5或图6中显示,但是使用Clustal W方法(上文)类似地比较了黄曲霉Δ12去饱和酶同源物(SEQ ID NO22)和亚家族2的其他蛋白质(SEQ ID NOs4、8、12、16、20和21)。得到了下面的结果黄曲霉相对A.fumigatus的蛋白质同一性为79%,相对粗糙脉孢霉的蛋白质同一性为68.5%,相对禾本科镰孢的蛋白质同一性为60.9%,相对串珠镰孢的蛋白质同一性为61.8%,相对M.grisea的蛋白质同一性为66.1%,相对构巢曲霉的蛋白质同一性为76%。从而,基于图5和6中的同源性和上面给出的同源性,根据串珠镰孢和M.grisea蛋白质序列之间的同源性,串珠镰孢Δ12去饱和酶(SEQ ID NO4)与亚家族2的剩余Δ12去饱和酶蛋白质的同一性为至少56.3%(这里定义为SEQ ID NOs4、8、12、16、20、21和22)。
上面的分析清除地区分了与Yarrowia lipolytica Δ12去饱和酶(SEQ ID NO52)具有同源性的两个亚家族蛋白质。此外,已知酵母,如Y.lipolytica只能合成18:2(但是不能合成18:3),而5种丝状真菌每一种都能合成18:2和18:3。此外,从Yarrowia分离了一种Δ12去饱和酶,而多数真菌与Yarrowia Δ12去饱和酶具有两种同源物。从而,申请人推测这些生物中去饱和酶的亚家族之一代表a Δ12去饱和酶(允许油酸向LA(18:2)的转化)并且另一种代表Δ15去饱和酶(允许LA向ALA(18:3)转化)。
实施例5构建包含亚家族2的串珠镰孢去饱和酶的表达质粒pY35(TEF::Fm2)(编码推定的Δ12去饱和酶)本实施例描述了构建包括实施例4中鉴定的亚家族2的串珠镰孢Δ12去饱和酶(“Fm2”或“Fm d12”)的表达质粒。特别地,产生了嵌合基因,使得推定的Δ12去饱和酶将在Yarrowia TEF启动子的控制下表达。这将使得能够随后测定Yarrowia lipolytica中所述蛋白质的活性,这可以通过测试表达ORF在野生型菌株中产生LA和互补Δ12去饱和酶-破坏的突变株的能力来实现(下文,实施例6)。
使用含有全长cDNA的cDNA克隆ffm2c.pK007.g13和ffm2c.pk001.p18作为模板并使用上游和下游引物P194(SEQ IDNO55)和P195(SEQ ID NO56)通过PCR扩增编码串珠镰孢Δ12去饱和酶的ORF。使用TA Taq和pfu聚合酶,按照生产商的推荐,在Eppendorf Mastercycler Gradient Cycler中进行PCR。如下进行扩增95℃1分钟的最初变性;然后是30个循环的95℃ 30秒变性,58℃ 1分钟退火;和72℃ 1分钟的延伸,接着在4℃反应结束。
从两种模板都得到正确大小(约1441bp)的片段。使用Qiagen DNA纯化试剂盒从琼脂糖凝胶纯化片段,用NcoI和NotI消化并克隆到NcoI和NotI切割的pY25-d12d(实施例3),从而代替TEF::Y1D12d嵌合基因中的Yarrowia Δ12去饱和酶ORF。这导致产生称作pY35的8571bp质粒,其含有TEF::Fm2嵌合基因(与Yarrowia Δ12去饱和酶相反)。质粒pY35还含有大肠杆菌复制起点、细菌氨苄青霉素抗性基因、Yarrowia Leu 2基因和Yarrowia自主复制序列(ARS)。
实施例6包含亚家族2的串珠镰孢去饱和酶的质粒pY35(TEF::Fm2)(编码推定的Δ12去饱和酶)在Yarrowia lipolytica中的表达串珠镰孢去饱和酶Of亚家族2本实施例描述了质粒pY35(包含嵌合的TEF::Fm2基因;来自实施例5)在Yarrowia lipolytica中的表达。特别地,测试了包含推定的Δ12去饱和酶的所表达的串珠镰孢ORF赋予在Y.lipolytica的野生型菌株中产生LA和互补Δ12去饱和酶-破坏的突变株(来自实施例2)的能力。
使用实施例2中描述的转化方法,将质粒pY5(仅载体对照,来自实施例1),pY25-d12d(TEF::Y1D12d,来自实施例3的“阳性对照”),和pY35(TEF::Fm2)每一种单独转化到Yarrowia lipolytica ATCC#76892的野生型(WT)和Δ12去饱和酶-破坏的(Q-d12D)菌株中。在Bio101 DOB/CSM-Leu板上选择转化细胞。
如实施例2和一般方法中描述的,在3mL基本培养基中生长每种野生型和转化细胞的单个菌落,将其收获、洗涤、干燥并分析。
在下面的表11中显示了野生型Yarrowia和每种转化株的脂肪酸分布图。脂肪酸经鉴定为16:0(棕榈酸),16:1(棕榈油酸),18:0,18:1(油酸),18:2(LA)和18:3(ALA)并且每种脂肪酸的组成以总脂肪酸的%给出。根据下面的公式计算“d12d SC”([18:2]/[18:1+18:2])*100并且“d12d SC”代表底物向18:2转化的百分数。
表11当在Yarrowia lipolytica中表达时证实串珠镰孢Fm2ORF’s Δ12去饱和酶活性
上面的结果表明,本文中称作Fm2并且鉴定为与YarrowialipolyticaΔ12去饱和酶具有同源性的那些蛋白质的亚家族2内的蛋白质的串珠镰孢ORF是Δ12去饱和酶。基于该证实,申请人预测亚家族2的所有其他成员(SEQ ID NOs8,12,16,20,21和22)将也具有Δ12去饱和酶功能性。
此外,所述结果表明,串珠镰孢Δ12去饱和酶(Fm2)在Yarrowia中的活性出乎意料地高于天然Y.lipolyticaΔ12去饱和酶的活性。特别地,比较表11和表7中的数据(实施例3)揭示在WT+TEF::Fm2细胞中的底物转化百分数(SC)为85%,而在WT+TEF::Y1 D12d细胞中仅为74%。同样地,Q-d12D+TEF::Fm2细胞中底物转化百分数为67%,而在Q-d12D+TEF::Y1 D12d细胞中底物转化百分数仅为57%。从而,预计串珠镰孢Δ12去饱和酶联合PUFA生物合成的其他基因(例如,Δ6去饱和酶,延伸酶、Δ5去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ4去饱和酶、Δ8去饱和酶、Δ15去饱和酶)的表达产生的ω-3和ω-6 PUFAs将高于使用天然Y.lipolytica Δ12去饱和酶产生ω-3和ω-6 PUFAs的产量。
实施例7使用用串珠镰孢Δ12去饱和酶构建的嵌合基因在Yarrowialipolytica中产生DGLA产生构建体pKUNF12T6E(图7;SEQ ID NO57)将4种嵌合基因(包含串珠镰孢Δ12去饱和酶、Δ6去饱和酶和2种延伸酶)整合到野生型Yarrowia菌株ATCC #20362的Ura3基因座,从而使得能够产生DGLA。pKUNF12T6E质粒含有下面的组分
表12质粒pKUNF12T6E(SEQ ID NO57)的描述
表12续质粒pKUNF12T6E(SEQ ID NO57)的描述
将pKUNF12T6E质粒用AscI/SphI消化,然后用于转化野生型Y.lipolytica ATCC #20362(如实施例2中描述)。所转化的细胞在5-氟尿嘧啶-6-羧酸一水合物(“FOA”)选择培养基平板(0.17%酵母氮碱基(DIFCO Laboratories,Detroit,MI),没有硫酸铵或者氨基酸,2%葡萄糖,0.1%脯氨酸,75mg/L尿嘧啶,75mg/L尿苷,20g/琼脂和800mg/L FOA(Zymo Research Corp.,Orange,CA92867))上接种并保持在30℃ 2到3天。挑选FOA抗性菌落并在包含基本培养基((20g/L葡萄糖,1.7g/L酵母氮碱基(无氨基酸),1g/L L-脯氨酸,0.1g/L L-腺嘌呤,0.1g/L L-赖氨酸,pH 6.1)或者基本培养基加上0.01%尿嘧啶(“MMU”)的选择平板上划线。选择可以在MMU板上生长但是不在基本培养基板上生长的菌落作为Ura-菌株。然后将Ura-菌株的单个菌落接种到30℃液态MMU中并以250转/分钟摇动2天。
GC分析(如一般方法中描述)表明在含有DKUNF12T6E的4种嵌合基因中存在DGLA,但是在野生型Yarrowia时照菌株中不存在DGLA。多数选择的32Ura-菌株产生约6%DGLA总脂类。有两个菌株产生总脂类的约8%DGLA。
实施例8合成密码子优化的Δ12去饱和酶基因用于在Yarrowialipolytica中表达_基于串珠镰孢DNA序列(SEQ ID NO3),根据Yarrowia密码子选择模式,ATG翻译起始密码子周围的共有序列,和RNA稳定性的一般规律(Guhaniyogi,G.和J.Brewer,Gene 265(1-2)11-23(2001)),将设计密码子优化的Δ12去饱和酶基因。
确定Yarrowia lipolytica中优选的密码子选择Yarrowia lipolytica中的密码子选择在表13中显示。它是基于National Center for Biotechnology Information公共数据库中发现的Y.lipolytica的约100种基因的编码区。将这些基因的编码区(包含121,167bp)通过DNAStar的Editseq程序翻译成对应的40,389个氨基酸并列表显示以确定图13种显示的Y.lipolytica密码子选择分布图。列标题“No.”指40,389个氨基酸的样品中编码特定氨基酸的给定密码子的次数。列标题“%”指编码特定氨基酸的给定密码子的频率。以粗体显示的条目代表在Yarrowia lipolytica中占优势的密码子。
表13Yarrowia lipolytica中的密码子选择
通过本领域技术人员公知的方法产生合成的、密码子优化的Δ12去饱和酶。
为了进一步优化Y.lipolytica中的基因表达,检查了79种基因的“ATG”起始密码子周围的共有序列。所分析的基因的77%都在-3位具有‘A’(翻译起始密码子(ATG)的第一个‘A’标记位+1,表明在该位置强烈偏爱‘A’。在-4,-2和-1位也偏爱‘A’或‘C’,在+5位偏爱‘A’,‘C’或‘T’,在+6位偏爱‘G’或‘C’。从而,用于基因在Y.lipolytica中最佳表达的密码子优化的翻译起始位点的优选共有序列是‘MAMMATGNHS’(SEQ ID NO66),其中所用的核酸简并密码如下M=A/C;S=C/G;H=A/C/T;和N=A/C/G/T。
本领域技术人员将容易地能够使用上面提供的信息,基于本文提供的串珠镰孢Δ12去饱和酶序列合成密码子优化的Δ12去饱和酶基因。
序列表<110>E.I.du Pont de Nemours and Co.,Inc.Yadav,Narendra<120>适于改变油质酵母中多不饱和脂肪酸水平的Δ12去饱和酶<130>CL2502<150>US 60/570679<151>2004-05-13<160>66<170>PatentIn version 3.3<210>1<211>1209<212>DNA<213>Fusarium monoliforme<400>1atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact 60cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc120gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc180atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc240ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc300tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat360gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct420caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag480actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt540gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag600gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact660ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc720aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg780tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac840ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc900cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt960gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac 1020catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc 1080gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc 1140ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac 1200aaggactag 1209<210>2<211>402
<212>PRT<213>Fusarium monoliforme<400>2Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu1 5 10 15Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile20 25 30Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu35 40 45Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala50 55 60Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr65 70 75 80Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe85 90 95Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe100 105 110Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser115 120 125Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His130 135 140His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys145 150 155 160Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val165 170 175Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile180 185 190Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser195 200 205Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys210 215 220Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro225 230 235 240Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met245 250 255
Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile260 265 270Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val275 280 285Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr290 295 300Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg305 310 315 320Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys325 330 335His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp340 345 350Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His355 360 365Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu370 375 380Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn385 390 395 400Lys Asp<210>3<211>1434<212>DNA<213>Fusarium monoliforme<400>3atggcgtcca cttcggctct gcccaagcag aaccctgcgc ttagacgcac cgtcacctca 60actactgtga cggattctga gtctgccgcc gtctctcctt cagactctcc ccgccactcg120gcctcttcca catcgctctc gtccatgtcc gaggttgata tcgccaagcc caagtccgag180tatggtgtca tgctcgacac ctacggcaac cagttcgagg ttcccgactt taccatcaag240gacatctaca atgccatccc taagcactgc ttcaagcgct ccgctctcaa gggatacggt300tatatcctcc gcgacattgt cctcctgact accactttca gcatctggta caactttgtg360acccccgaat atatcccctc cacccccgcc cgcgctggtc tgtgggccgt gtacaccgtt420cttcagggtc ttttcggtac tggtctctgg gttattgccc atgagtgcgg tcacggtgct480ttctccgatt ctcgcatcat caacgacatt actggctggg ttcttcactc ttccctcctt540gtcccctact tcagctggca aatctcccac cgaaagcacc acaaggccac tggcaacatg600gagcgtgaca tggtcttcgt tccccgaacc cgcgagcagc aggctactcg tctcggaaag660
atgacccacg agctcgctca tcttactgag gagacccccg ctttcactct tctcatgctc720gtccttcagc agctcgttgg ctggcccaac tacctcatca ccaatgttac cggccacaac780taccacgagc gccagcgtga gggtcgcggc aagggcaagc ataacggcct cggcggtggt840gttaaccact tcgatccccg cagccctctg tacgagaaca gtgacgctaa gctcatcgtc900ctcagcgata ttggtatcgg tctgatggcc actgctctgt acttcctcgt tcagaagttc960ggtttctaca acatggccat ctggtacttt gttccctacc tctgggttaa ccactggctc 1020gttgccatca ccttcctcca gcacaccgac cctacccttc cccactacac caacgacgag 1080tggaacttcg tccgtggtgc cgctgctacc attgaccgtg agatgggctt catcggccgc 1140caccttctcc acggcatcat cgagactcat gtcctccacc actacgtcag cagcatcccc 1200ttctacaacg cggacgaggc caccgaggcc attaagccca tcatgggcaa gcactaccgg 1260gctgatgtcc aggatggtcc tcgtggcttc atccgcgcca tgtaccgcag tgcgcgtatg 1320tgccagtggg ttgagcccag cgctggtgcc gagggtgctg gtaagggtgt tctgttcttc 1380cgcaaccgca acaacgtggg cacccccccc gctgttatca agcccgttgc ttaa 1434<210>4<211>477<212>PRT<213>Fusarium monoliforme<400>4Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg1 5 10 15Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser20 25 30Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser35 40 45Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met50 55 60Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys65 70 75 80Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu85 90 95Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr100 105 110Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr115 120 125Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu
130 135 140Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala145 150 155 160Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His165 170 175Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys180 185 190His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro195 200 205Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu210 215 220Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu225 230 235 240Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val245 250 255Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly260 265 270Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser275 280 285Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile290 295 300Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe305 310 315 320Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val325 330 335Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr340 345 350Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala355 360 365Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His370 375 380Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro385 390 395 400Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly
405 410 415Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg420 425 430Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala435 440 445Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn450 455 460Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala465 470 475<210>5<211>1206<212>DNA<213>Aspergillus nidulans<400>5atggctgcaa ctgcaacaac cctagcagag attgaaaaga aaaaagaaga aataactctg 60cagacaatca aaaatgcgat tcccaaacac tgcttcaacc gctctctcct catttcctct120gcctacgtcg tccgcgatct cctctacgcc tccgtcctct tctactttgc cctgcacatt180gacaccctct tttcctcgca actcctccgc atcctcgcct ggaccgccta cggtttcatg240caaggctgcg tcggcaccgg aatctggatc ctcgcacacg aatgcggcca tggagctttc300tccccatacc aaacgtggaa cgatgtcgtc ggatggacat tgcactccct cctgatggtc360ccgtatttca gctggaagat cacgcacgct cgacaccacc ggtacacaaa caacacagag420cgagatacag catttgtccc ctggacagag aaggaatacg acactcgccc gcgctacttc480cctgcctggt ttgagatgtt tgaggacacg cccgtctaca accttattag cctactggcg540catcagatcg caggatggca gatgtatctc tgtttttacg ttagcgccgg cgcaaagagt600aagcctgtac cgcagggaaa acagagcggg tggtttggag gccagcagag cgccagccac660tttgatccgg gcagttcgct gtggacggaa aaccagcggc atctgattgc gatttcggac720ctggggttgc tgcttgttgc ggcggcaaat tggtaccttg cgcagcaagt gggcgtgctc780cgcatggtgc tgatctatgt tgtgccgtac ttctgggtgc accattggct tgtggcgatc840acgtacctcc accacacaca cccctcgatc ccgcactaca ctgatagcac ctggacgttc900accaaaggcg ctctgtccac cgtcgaccgc gacttcggtt tcatcgggcg gcatttcttc960caccatatca ttgaccacca tgtcgtgcat cacttgttta accggatccc gttctaccat 1020gccgaggagg cgactaatgc cattattccc gtactcgggg acatgtatca tcgcgaagag 1080accggcttct tgtggagttt aatggagacg tacaagaact gtcggtttgt aggcgttgaa 1140aatgatgttg gaaaggaggg cgttttgcat tgggtttttg aggagaagaa gggtgccaaa 1200gcggaa 1206
<210>6<211>401<212>PRT<213>Aspergillus nidulans<400>6Met Ala Ala Thr Ala Thr Thr Leu Ala Glu Ile Glu Lys Lys Lys Glu1 5 10 15Glu Ile Thr Leu Gln Thr Ile Lys Asn Ala Ile Pro Lys His Cys Phe20 25 30Asn Arg Ser Leu Leu Ile Ser Ser Ala Tyr Val Val Arg Asp Leu Leu35 40 45Tyr Ala Ser Val Leu Phe Tyr Phe Ala Leu His Ile Asp Thr Leu Phe50 55 60Ser Ser Gln Leu Leu Arg Ile Leu Ala Trp Thr Ala Tyr Gly Phe Met65 70 75 80Gln Gly Cys Val Gly Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly85 90 95His Gly Ala Phe Ser Pro Tyr Gln Thr Trp Asn Asp Val Val Gly Trp100 105 110Thr Leu His Ser Leu Leu Met Val Pro Tyr Phe Ser Trp Lys Ile Thr115 120 125His Ala Arg His His Arg Tyr Thr Asn Asn Thr Glu Arg Asp Thr Ala130 135 140Phe Val Pro Trp Thr Glu Lys Glu Tyr Asp Thr Arg Pro Arg Tyr Phe145 150 155 160Pro Ala Trp Phe Glu Met Phe Glu Asp Thr Pro Val Tyr Asn Leu Ile165 170 175Ser Leu Leu Ala His Gln Ile Ala Gly Trp Gln Met Tyr Leu Cys Phe180 185 190Tyr Val Ser Ala Gly Ala Lys Ser Lys Pro Val Pro Gln Gly Lys Gln195 200 205Ser Gly Trp Phe Gly Gly Gln Gln Ser Ala Ser His Phe Asp Pro Gly210 215 220Ser Ser Leu Trp Thr Glu Asn Gln Arg His Leu Ile Ala Ile Ser Asp225 230 235 240Leu Gly Leu Leu Leu Val Ala Ala Ala Asn Trp Tyr Leu Ala Gln Gln
245 250 255Val Gly Val Leu Arg Met Val Leu Ile Tyr Val Val Pro Tyr Phe Trp260 265 270Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Pro275 280 285Ser Ile Pro His Tyr Thr Asp Ser Thr Trp Thr Phe Thr Lys Gly Ala290 295 300Leu Ser Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Arg His Phe Phe305 310 315 320His His Ile Ile Asp His His Val Val His His Leu Phe Asn Arg Ile325 330 335Pro Phe Tyr His Ala Glu Glu Ala Thr Asn Ala Ile Ile Pro Val Leu340 345 350Gly Asp Met Tyr His Arg Glu Glu Thr Gly Phe Leu Trp Ser Leu Met355 360 365Glu Thr Tyr Lys Asn Cys Arg Phe Val Gly Val Glu Asn Asp Val Gly370 375 380Lys Glu Gly Val Leu His Trp Val Phe Glu Glu Lys Lys Gly Ala Lys385 390 395 400Ala<210>7<211>1416<212>DNA<213>Aspergillus nidulans<400>7atgtcgtcta ctgccctccc gaagcgcgtt gcgctgcatc gcaacccgac taccgactct 60tcggtcccca gctccgtctc ggtctccccg ctggactcgc cccgtcagtc tccgtcgtcg120acttcgctct cgtcaatggc ctcggatgcg ggcaagggag acttgggcaa gatgctcgac180acctatggca atgagttcaa gatccccgac tacaccatca aggatatccg tgatgccatt240ccgtcccact gctacaaccg gtctgctatc aggagtctgt cctatgtctt ccgtgatctc300gccgtcctcg cttccgtctt ctacgtcttc cacaaatacg tgaccccgga gaccgtccct360tcgtacccgg cgcgtgttgc gctgtggact ctctacactg tcgtccaggg tctgttcggt420accggtattt gggttcttgc tcacgagtgt ggacaccagg cgttctctac ttccaaggtg480ctcaacgaca ctgttggctg gatcctgcat tcggctctgc tggtccccta tttctcgtgg540aagatctctc acggcaagca ccacaaggcc accggtaacc tggctcgtga catggtcttc600
gtccccaaga cccgcgaggt gtacgcctcc cgcatcaaga agaccatcta cgacctgaac660gaggtgatgg aggagacccc cttggccact gccacccact ccatcctgca gcagctgttc720ggctggccct tgtacctgct caccaacgtt accggtcacg acaaccacga gcgccagcct780gaaggccgcg gcaagggcaa gcgtaacggc tacttcaccg gcgtcaacca cttcaacccc840aacagccctc tgttcgaggc caaggacgcc aagctcatca ttctgagtga tatcggcctc900gccatcaccg ccagcatcct gtacctgatc ggctccaagt tcggctggat gaacttgctc960gtctggtacg gtatccccta cctctgggtg aaccactggc ttgttgccat cacctacctc 1020cagcacaccg accccactct cccccactac cagcccgagt cctggacctt cgcccgcggt 1080gccgctgcca ccattgaccg cgagttcggc ttcatcggcc gtcacattct ccacggcatc 1140atcgagaccc acgtcctcca ccactacgtc agcaccatcc ccttctacca cgccgacgag 1200gccagcgagg ctatcaagaa ggtcatgggc tcgcactacc gcagcgaggc acacaccggt 1260cctctgggct tcctcaaggc tctctggacc agcgcccgtg tctgccactg ggtcgagccc 1320accgaaggca ccaagggcga gaacgctggt gtcttgttct tccgcaacac caacggcatc 1380ggtgttcctc ccattaagct gaccaagcct aactaa 1416<210>8<211>471<212>PRT<213>Aspergillus nidulans<400>8Met Ser Ser Thr Ala Leu Pro Lys Arg Val Ala Leu His Arg Asn Pro1 5 10 15Thr Thr Asp Ser Ser Val Pro Ser Ser Val Ser Val Ser Pro Leu Asp20 25 30Ser Pro Arg Gln Ser Pro Ser Ser Thr Ser Leu Ser Ser Met Ala Ser35 40 45Asp Ala Gly Lys Gly Asp Leu Gly Lys Met Leu Asp Thr Tyr Gly Asn50 55 60Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Asp Ile Arg Asp Ala Ile65 70 75 80Pro Ser His Cys Tyr Asn Arg Ser Ala Ile Arg Ser Leu Ser Tyr Val85 90 95Phe Arg Asp Leu Ala Val Leu Ala Ser Val Phe Tyr Val Phe His Lys100 105 110Tyr Val Thr Pro Glu Thr Val Pro Ser Tyr Pro Ala Arg Val Ala Leu115 120 125
Trp Thr Leu Tyr Thr Val Val Gln Gly Leu Phe Gly Thr Gly Ile Trp130 135 140Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser Lys Val145 150 155 160Leu Asn Asp Thr Val Gly Trp Ile Leu His Ser Ala Leu Leu Val Pro165 170 175Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly180 185 190Asn Leu Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Val Tyr195 200 205Ala Ser Arg Ile Lys Lys Thr Ile Tyr Asp Leu Asn Glu Val Met Glu210 215 220Glu Thr Pro Leu Ala Thr Ala Thr His Ser Ile Leu Gln Gln Leu Phe225 230 235 240Gly Trp Pro Leu Tyr Leu Leu Thr Asn Val Thr Gly His Asp Asn His245 250 255Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe260 265 270Thr Gly Val Asn His Phe Asn Pro Asn Ser Pro Leu Phe Glu Ala Lys275 280 285Asp Ala Lys Leu Ile Ile Leu Ser Asp Ile Gly Leu Ala Ile Thr Ala290 295 300Ser Ile Leu Tyr Leu Ile Gly Ser Lys Phe Gly Trp Met Asn Leu Leu305 310 315 320Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala325 330 335Ile Thr Tyr Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro340 345 350Glu Ser Trp Thr Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu355 360 365Phe Gly Phe Ile Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His370 375 380Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu385 390 395 400
Ala Ser Glu Ala Ile Lys Lys Val Met Gly Ser His Tyr Arg Ser Glu405 410 415Ala His Thr Gly Pro Leu Gly Phe Leu Lys Ala Leu Trp Thr Ser Ala420 425 430Arg Val Cys His Trp Val Glu Pro Thr Glu Gly Thr Lys Gly Glu Asn435 440 445Ala Gly Val Leu Phe Phe Arg Asn Thr Asn Gly Ile Gly Val Pro Pro450 455 460Ile Lys Leu Thr Lys Pro Asn465 470<210>9<211>1185<212>DNA<213>Magnaporthe grisea<400>9atgtccacca ccgtcactca gcggccgggc gccgctagcc gcgctgaagc caagcccaag 60gagcagcaat ttccagacat caacaccatc aggaatgcta tccccgcaca ctgttttgag120gcatctctgg tgacttcagt tggttacttg gtgcgagatg tggccctcat caccgctctc180ggctgggccg ccttgaccta cattccccaa attccggatt cgactttgcg ctggaccgcc240tgggccgctt acggctttgt tcagggtctc tttggcaccg gtctctggat tctggcccac300gagtgcggcc acggtgcttt cagcaagcac acgcgcatta acaacattct tggctgggcc360gcccactcgg ccctgctggt accgtacttc agctggaagt tctctcacca ccgccaccac420aacttcaccg gccacatgga gaaggacatg gcctttgtgc ccccccaggc tgccgaccgc480gagtcccgcg ccagcttgct gtcccgcttc ggcatcgacc tcgaggtctt tgaggatacc540cccatctttc agcttgctcg cctcgtgagc caccagctct tcggctggca gacttacctg600ctcttcaacg ccacctgcgg caaggagtct ctgcagaaca agggtgccgc gtggttccgc660cagagccact ttgagcccac ctctgccgtc ttccgctcca gcgaggccct ctacatcgcc720atctctgaca ttggcctggc catcgttgcc gccgccatct actggggctc caccaaggtc780ggcgccggca ccatgttcct cctctacgcc gttccctaca tgtgggttca ccactggctc840gtcgccatca cctaccttca ccacaccaac aaggaggtgc accactacga ggccgacagc900tggacctttg tcaagggtgc cgtcgccact gtcgaccgtg actttggttt cattgaccgc960cacctgttcc acggtatcat tggaacccac gtcgcccacc atctgttccc tcgcattccc 1020ttttacaagg cagaggaggc caccgaggcc atcaagcctg tcctcggaga cctttaccac 1080agcgacaatc gccccttcat gcaggctctg tggagcaact tcaccacctg caagtacgtc 1140gagaaggacc ccaaggttcc cggcgccatg aggtgggccg attga 1185
<210>10<211>394<212>PRT<213>Magnaporthe grisea<400>10Met Ser Thr Thr Val Thr Gln Arg Pro Gly Ala Ala Ser Arg Ala Glu1 5 10 15Ala Lys Pro Lys Glu Gln Gln Phe Pro Asp Ile Asn Thr Ile Arg Asn20 25 30Ala Ile Pro Ala His Cys Phe Glu Ala Ser Leu Val Thr Ser Val Gly35 40 45Tyr Leu Val Arg Asp Val Ala Leu Ile Thr Ala Leu Gly Trp Ala Ala50 55 60Leu Thr Tyr Ile Pro Gln Ile Pro Asp Ser Thr Leu Arg Trp Thr Ala65 70 75 80Trp Ala Ala Tyr Gly Phe Val Gln Gly Leu Phe Gly Thr Gly Leu Trp85 90 95Tle Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys His Thr Arg100 105 110Ile Asn Asn Ile Leu Gly Trp Ala Ala His Ser Ala Leu Leu Val Pro115 120 125Tyr Phe Ser Trp Lys Phe Ser His His Arg His His Asn Phe Thr Gly130 135 140His Met Glu Lys Asp Met Ala Phe Val Pro Pro Gln Ala Ala Asp Arg145 150 155 160Glu Ser Arg Ala Ser Leu Leu Ser Arg Phe Gly Ile Asp Leu Glu Val165 170 175Phe Glu Asp Thr Pro Ile Phe Gln Leu Ala Arg Leu Val Ser His Gln180 185 190Leu Phe Gly Trp Gln Thr Tyr Leu Leu Phe Asn Ala Thr Cys Gly Lys195 200 205Glu Ser Leu Gln Asn Lys Gly Ala Ala Trp Phe Arg Gln Ser His Phe210 215 220Glu Pro Thr Ser Ala Val Phe Arg Ser Ser Glu Ala Leu Tyr Ile Ala225 230 235 240Ile Ser Asp Ile Gly Leu Ala Ile Val Ala Ala Ala Ile Tyr Trp Gly
245 250 255Ser Thr Lys Val Gly Ala Gly Thr Met Phe Leu Leu Tyr Ala Val Pro260 265 270Tyr Met Trp Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His275 280 285Thr Asn Lys Glu Val His His Tyr Glu Ala Asp Ser Trp Thr Phe Val290 295 300Lys Gly Ala Val Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Asp Arg305 310 315 320His Leu Phe His Gly Ile Ile Gly Thr His Val Ala His His Leu Phe325 330 335Pro Arg Ile Pro Phe Tyr Lys Ala Glu Glu Ala Thr Glu Ala Ile Lys340 345 350Pro Val Leu Gly Asp Leu Tyr His Ser Asp Asn Arg Pro Phe Met Gln355 360 365Ala Leu Trp Ser Asn Phe Thr Thr Cys Lys Tyr Val Glu Lys Asp Pro370 375 380Lys Val Pro Gly Ala Met Arg Trp Ala Asp385 390<210>11<211>1656<212>DNA<213>Magnaporthe grisea<400>11atgccttcca ccagatcgac cacatcgggc attgcccagg agaagactcc tatgaggcga 60acgaccacct cggccactgt cgaatcggac gtctcagctc cgggaaccgc tgttcagtcg120cctatggact cgccccgcca ctctgcctcg tccacctcac tctcttcact ctcttccgtt180gatgcggcgg ccgagaagaa atccaacgag tctgtcggca aactcgtcga cacgtacggc240aacacctttg agatccctga cttcaccatc aaggacatcc acgatgccat tccaaagcac300tgctttgaac gctctgctat tcgtagcttg agctacgtcg cccgtgatat ggtcctcctg360gcgacgacct tctacgtgtt ccacaactac gtgacaccag agtacattcc ctcgaagccg420gctcgtgctg gtctgtgggc catttacacg gtgctccagg gcctcttcgg caccggaatc480tgggttcttg cccatgagtg tggccactag gctttctcgc cttccaagac catcaacaac540acggttggct ggattctcca ctcgtctctg ctggttccgt acttcagctg gcagatgtca600cacagcaagc accacaaggc cactggccat attgagcgcg acatggtctt tgtgccccgc660acccgggagg agcacgctag caggatcggc cgcatggtcc acgagctgtc ggagttgacc720
gaggagacgc ctattgccac ccttatccac ttggttgggc agcagctgat cggctggcct780ctgtacatca tcactaacaa gaccggtcac aactaccacg agcgccagcg tgagggccgt840ggcaagggca agaagaacgg tcttttcact ggcgtcaacc acttcaaccc cagcagccct900ctgtacgaga acaaggacgc cggaaaggtg cttctcagcg acctgggtgt cggccttgtt960atcgctggcc tcgtgtacct ttgccaaact ttcggcaccc agaacatgct ggtttggtac 1020tttatcccct acctctgggt gaaccactgg ctcgttgcca ttacattcct tcagcacacc 1080gacccctcgc ttccgcacta tactgccgag gaatggaact tcgtccgagg tgccgctgcc 1140acgatcgatc gcgagtttgg cttcgtcggc cgccacctgc ttcacggtat cattgagacc 1200cacgtcctgc accactatgt cagcacgatc cccttttaca acgccgacga ggctactgat 1260gccatcaaga aggtgatggg caagcactac cgcagcgaca ctgccggcgg ccctgctggc 1320ttccttaagt cactctggac gagtagccgc atgtgccaat gggttgagcc cagcgccgag 1380gctgagggta gtggcaaggg tgtcctgttc ttccgcaacc acaacaagat cggcactcct 1440cctatcaaga tgtctgctca gaaaattaga ctatgcaatg accttcttgg catgcataag 1500ggaaagaatc aaatgaatgg atcaagggag cgccgcggcg gacaaagtag tttaaagagg 1560gtgagaaatc agcgatcgac aaatatgaac gaatcacaca tgacggtgtt ccgggcattc 1620cgaacttgga gctcatgcac gcgcgcgtcc acatga 1656<210>12<211>551<212>PRT<213>Magnaporthe grisea<400>12Met Pro Ser Thr Arg Ser Thr Thr Ser Gly Ile Ala Gln Glu Lys Thr1 5 10 15Pro Met Arg Arg Thr Thr Thr Ser Ala Thr Val Glu Ser Asp Val Ser20 25 30Ala Pro Gly Thr Ala Val Gln Ser Pro Met Asp Ser Pro Arg His Ser35 40 45Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Ser Val Asp Ala Ala Ala50 55 60Glu Lys Lys Ser Asn Glu Ser Val Gly Lys Leu Val Asp Thr Tyr Gly65 70 75 80Asn Thr Phe Glu Ile Pro Asp Phe Thr Ile Lys Asp Ile His Asp Ala85 90 95Ile Pro Lys His Cys Phe Glu Arg Ser Ala Ile Arg Ser Leu Ser Tyr100 105 110
Val Ala Arg Asp Met Val Leu Leu Ala Thr Thr Phe Tyr Val Phe His115 120 125Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Lys Pro Ala Arg Ala Gly130 135 140Leu Trp Ala Ile Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr Gly Ile145 150 155 160Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys165 170 175Thr Ile Asn Asn Thr Val Gly Trp Ile Leu His Ser Ser Leu Leu Val180 185 190Pro Tyr Phe Ser Trp Gln Met Ser His Ser Lys His His Lys Ala Thr195 200 205Gly His Ile Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg Glu Glu210 215 220His Ala Ser Arg Ile Gly Arg Met Val His Glu Leu Ser Glu Leu Thr225 230 235 240Glu Glu Thr Pro Ile Ala Thr Leu Ile His Leu Val Gly Gln Gln Leu245 250 255Ile Gly Trp Pro Leu Tyr Ile Ile Thr Asn Lys Thr Gly His Asn Tyr260 265 270His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly Lys Lys Asn Gly Leu275 280 285Phe Thr Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Asn290 295 300Lys Asp Ala Gly Lys Val Leu Leu Ser Asp Leu Gly Val Gly Leu Val305 310 315 320Ile Ala Gly Leu Val Tyr Leu Cys Gln Thr Phe Gly Thr Gln Asn Met325 330 335Leu Val Trp Tyr Phe Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val340 345 350Ala Ile Thr Phe Leu Gln His Thr Asp Pro Ser Leu Pro His Tyr Thr355 360 365Ala Glu Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile Asp Arg370 375 380
Glu Phe Gly Phe Val Gly Arg His Leu Leu His Gly Ile Ile Glu Thr385 390 395 400His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr Asn Ala Asp405 410 415Glu Ala Thr Asp Ala Ile Lys Lys Val Met Gly Lys His Tyr Arg Ser420 425 430Asp Thr Ala Gly Gly Pro Ala Gly Phe Leu Lys Ser Leu Trp Thr Ser435 440 445Ser Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu Gly Ser450 455 460Gly Lys Gly Val Leu Phe Phe Arg Asn His Asn Lys Ile Gly Thr Pro465 470 475 480Pro Ile Lys Met Ser Ala Gln Lys Ile Arg Leu Cys Asn Asp Leu Leu485 490 495Gly Met His Lys Gly Lys Asn Gln Met Asn Gly Ser Arg Glu Arg Arg500 505 510Gly Gly Gln Ser Ser Leu Lys Arg Val Arg Asn Gln Arg Ser Thr Asn515 520 525Met Asn Glu Ser His Met Thr Val Phe Arg Ala Phe Arg Thr Trp Ser530 535 540Ser Cys Thr Arg Ala Ser Thr545 550<210>13<211>1290<212>DNA<213>Neurospora crassa<400>13atgacggtca ccacccgcag ccacaaggcc gcggccgcca ccgagcccga ggttgtcagc 60accggcgttg acgccgtctc tgctgctgct ccctcctcct cctcctcctc ttccagccaa120aagtcggccg agcccatcga ataccccgac atcaagacca tccgcgacgc catccccgac180cactgcttcc gcccgcgcgt ctggatctcc atggcctact tcatccgcga cttcgccatg240gcctttggcc tcggctacct cgcctggcag tacatccccc tgatcgcctc caccccgctc300cgctacggcg cctgggctct gtacggctac ctccagggtc tcgtctgcac gggcatctgg360attctggcgc acgagtgcgg ccacggcgcc ttctcgaggc acacgtggtt caacaacgtc420atggggtgga ttggccactc cttcctcttg gtcccttact tcagctggaa gttcagccac480catcgccacc atcgcttcac cggccacatg gagaaggaca tggcgtttgt gcctgccacc540
gaggctgatc gcaaccagag gaagctggcc aacttgtaca tggacaagga gacggccgag600atgtttgagg atgtgcccat tgtccagctc gtcaagctca tcgcccacca gctggccggc660tggcagatgt acctcctctt caacgtctcc gccggtaagg gcagcaagca gtgggagact720ggcaagggcg gcatgggctg gttgagggtt agccactttg agccttcctc tgctgtgttc780cgcaactccg aggccatcta cattgccctg tccgatcttg gtctcatgat catgggctat840atcctctacc aggccgcgca ggttgttggc tggcagatgg taggtctgct gtacttccag900cagtacttct gggttcacca ttggttggtc gccatcactt acctccacca cacccacgag960gaagtccacc actttgacgc cgactcgtgg accttcgtca agggcgctct cgccaccgtc1020gaccgcgatt ttggcttcat tggcaagcac ctcttccaca acattatcga ccaccacgtc1080gtccaccact tgttccctcg catccccttc tactacgccg aagaagccac caactcgatc1140cgccccatgc tcggccccct ctaccaccgc gacgaccgct ccttcatggg ccagctgtgg1200tacaacttca cccactgcaa gtgggtcgtt ccggaccccc aggtccccgg cgcgcttatt1260tgggcgcaca ccgttcagag cacccagtaa 1290<210>14<211>429<212>PRT<213>Neurospora crassa<400>14Met Thr Val Thr Thr Arg Ser His Lys Ala Ala Ala Ala Thr Glu Pro1 5 10 15Glu Val Val Ser Thr Gly Val Asp Ala Val Ser Ala Ala Ala Pro Ser20 25 30Ser Ser Ser Ser Ser Ser Ser Gln Lys Ser Ala Glu Pro Ile Glu Tyr35 40 45Pro Asp Ile Lys Thr Ile Arg Asp Ala Ile Pro Asp His Cys Phe Arg50 55 60Pro Arg Val Trp Ile Ser Met Ala Tyr Phe Ile Arg Asp Phe Ala Met65 70 75 80Ala Phe Gly Leu Gly Tyr Leu Ala Trp Gln Tyr Ile Pro Leu Ile Ala85 90 95Ser Thr Pro Leu Arg Tyr Gly Ala Trp Ala Leu Tyr Gly Tyr Leu Gln100 105 110Gly Leu Val Cys Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly His115 120 125Gly Ala Phe Ser Arg His Thr Trp Phe Asn Asn Val Met Gly Trp Ile
130 135 140Gly His Ser Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe Ser His145 150 155 160His Arg His His Arg Phe Thr Gly His Met Glu Lys Asp Met Ala Phe165 170 175Val Pro Ala Thr Glu Ala Asp Arg Asn Gln Arg Lys Leu Ala Asn Leu180 185 190Tyr Met Asp Lys Glu Thr Ala Glu Met Phe Glu Asp Val Pro Ile Val195 200 205Gln Leu Val Lys Leu Ile Ala His Gln Leu Ala Gly Trp Gln Met Tyr210 215 220Leu Leu Phe Asn Val Ser Ala Gly Lys Gly Ser Lys Gln Trp Glu Thr225 230 235 240Gly Lys Gly Gly Met Gly Trp Leu Arg Val Ser His Phe Glu Pro Ser245 250 255Ser Ala Val Phe Arg Asn Ser Glu Ala Ile Tyr Ile Ala Leu Ser Asp260 265 270Leu Gly Leu Met Ile Met Gly Tyr Ile Leu Tyr Gln Ala Ala Gln Val275 280 285Val Gly Trp Gln Met Val Gly Leu Leu Tyr Phe Gln Gln Tyr Phe Trp290 295 300Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Glu305 310 315 320Glu Val His His Phe Asp Ala Asp Ser Trp Thr Phe Val Lys Gly Ala325 330 335Leu Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Lys His Leu Phe340 345 350His Asn Ile Ile Asp His His Val Val His His Leu Phe Pro Arg Ile355 360 365Pro Phe Tyr Tyr Ala Glu Glu Ala Thr Asn Ser Ile Arg Pro Met Leu370 375 380Gly Pro Leu Tyr His Arg Asp Asp Arg Ser Phe Met Gly Gln Leu Trp385 390 395 400Tyr Asn Phe Thr His Cys Lys Trp Val Val Pro Asp Pro Gln Val Pro
405 410 415Gly Ala Leu Ile Trp Ala His Thr Val Gln Ser Thr Gln420 425<210>15<211>1446<212>DNA<213>Neurospora crassa<400>15atggcgtccg tctcctctgc ccttcccgag ggcaacaagc ctgccctgcg caggacccaa60accgaggcca cctccgactc ataccctggt accgctgatg cctctccctt cgactctccc120cttgagcgct cggcctccaa cacctcgctt tcttcccagg cctctgacaa cgtcaagacc180gacaaggccg agttcggcaa gctgctcgac acgtatggca acgagttcga ggtccccgac240ttcaccatca aggacatccg cgatgccatc cccgcccact gctttgagcg ttcggctctt300cacagcttgg cgcacgtcgt ccgcgacatc atttacctca ccgtcacttt ttacgtctgg360aacaagtatg tcactcccga gtacatcccc atgaaggctg cccgtgtcgt cctctggggt420ctgtacacct tcatgcaggg ccttttcggc accggtctct gggttcttgc ccatgagtgc480ggtcaccagg ctttctcccc gtccaggttg atcaacgaca ccgtcggctg ggtcctccac540tctgcccttc tcgtccccta cttctcgtgg aagttctccc acagcaagca ccacaaggcc600accggcaaca tcgagcgtga catggtcttc gttcctcgga cccgcgagca gtttgcgtct660cgcatcggcc gtttcgtcca tgagatttcc gagttgaccg aggagacccc catctacacc720ttgatccacc ttatcggtca gcagctcatc ggctggccca actacctcat gaccaacgtc780accggccaca acttccacga gaggcagcgc gagggtcgtg gcaagggcaa gaagaacggc840tggttcactg gtgtcaacca cttcaacccc agctctcccc tctatgagga gcgtgaggcc900ccctggatca tcgtctccga catcggtatc gctatcgccg ccaccgccct catctacctc960ggcaacacct tcggctggtc caacatgttc gtctggtact tccttcccta cctctgggtc1020aaccactggc ttgttgccat cacctacctc cagcacaccg acccctcgct cccccactac1080acccctgatc agtggaactt tgtccgtggt gccgccgcga ctattgaccg cgagttcggc1140ttcatcggcc gtcacctcct ccacggcatt atcgagaccc acgttctcca ccactacgtc1200agcaccattc ccttttacca cgccgacgag gcctccgagg ccatcaagaa ggtcatgggc1260cgtcactacc gcgctgacgt ccaagatggc cccatcggtt tcatcaaggc catgtggaag1320gctgctcgtt ggtgccagtg ggttgagcct accgagggcg ctgagggtaa gggcaagggc1380gtcttgttct accgcaacca gaacggtctc ggtgtcaagc ctgccaagct ccccaaaacc1440aactaa 1446<210>16<211>481<212>PRT<213>Neurospora crassa
<400>16Met Ala Ser Val Ser Ser Ala Leu Pro Glu Gly Asn Lys Pro Ala Leu1 5 10 15Arg Arg Thr Gln Thr Glu Ala Thr Ser Asp Ser Tyr Pro Gly Thr Ala20 25 30Asp Ala Ser Pro Phe Asp Ser Pro Leu Glu Arg Ser Ala Ser Asn Thr35 40 45Ser Leu Ser Ser Gln Ala Ser Asp Asn Val Lys Thr Asp Lys Ala Glu50 55 60Phe Gly Lys Leu Leu Asp Thr Tyr Gly Asn Glu Phe Glu Val Pro Asp65 70 75 80Phe Thr Ile Lys Asp Ile Arg Asp Ala Ile Pro Ala His Cys Phe Glu85 90 95Arg Ser Ala Leu His Ser Leu Ala His Val Val Arg Asp Ile Ile Tyr100 105 110Leu Thr Val Thr Phe Tyr Val Trp Asn Lys Tyr Val Thr Pro Glu Tyr115 120 125Ile Pro Met Lys Ala Ala Arg Val Val Leu Trp Gly Leu Tyr Thr Phe130 135 140Met Gln Gly Leu Phe Gly Thr Gly Leu Trp Val Leu Ala His Glu Cys145 150 155 160Gly His Gln Ala Phe Ser Pro Ser Arg Leu Ile Asn Asp Thr Val Gly165 170 175Trp Val Leu His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe180 185 190Ser His Ser Lys His His Lys Ala Thr Gly Asn Ile Glu Arg Asp Met195 200 205Val Phe Val Pro Arg Thr Arg Glu Gln Phe Ala Ser Arg Ile Gly Arg210 215 220Phe Val His Glu Ile Ser Glu Leu Thr Glu Glu Thr Pro Ile Tyr Thr225 230 235 240Leu Ile His Leu Ile Gly Gln Gln Leu Ile Gly Trp Pro Asn Tyr Leu245 250 255Met Thr Asn Val Thr Gly His Asn Phe His Glu Arg Gln Arg Glu Gly
260 265 270Arg Gly Lys Gly Lys Lys Asn Gly Trp Phe Thr Gly Val Asn His Phe275 280 285Asn Pro Ser Ser Pro Leu Tyr Glu Glu Arg Glu Ala Pro Trp Ile Ile290 295 300Val Ser Asp Ile Gly Ile Ala Ile Ala Ala Thr Ala Leu Ile Tyr Leu305 310 315 320Gly Asn Thr Phe Gly Trp Ser Asn Met Phe Val Trp Tyr Phe Leu Pro325 330 335Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His340 345 350Thr Asp Pro Ser Leu Pro His Tyr Thr Pro Asp Gln Trp Asn Phe Val355 360 365Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Arg370 375 380His Leu Leu His Gly Ile Ile Glu Thr His Val Leu His His Tyr Val385 390 395 400Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu Ala Ile Lys405 410 415Lys Val Met Gly Arg His Tyr Arg Ala Asp Val Gln Asp Gly Pro Ile420 425 430Gly Phe Ile Lys Ala Met Trp Lys Ala Ala Arg Trp Cys Gln Trp Val435 440 445Glu Pro Thr Glu Gly Ala Glu Gly Lys Gly Lys Gly Val Leu Phe Tyr450 455 460Arg Asn Gln Asn Gly Leu Gly Val Lys Pro Ala Lys Leu Pro Lys Thr465 470 475 480Asn<210>17<211>1212<212>DNA<213>Fusarium graminearium<400>17atggccacca gacagcgaac tgccaccact gttgtggtcg agaaggacct gcccaaggtc60actctcgagg ccacttctca gcctcaattc cccgacatca agaccatcaa ggatgccatc120
cccgcccact gcttccagcc ctcgctcatc acctcatact actatgtcgt ccgcgacttc180gccatggtcg gctccctcgt ctgggccgcc ctcacctaca tccccggcat tgaggaccag240tacctccgcg tcgccgcctg gatggcctac ggcttcctcc agggtctctt ctgcaccgga300atctggattc tcggtcatga gtgcggccac ggtgccttct ctacccacag caagctcaac360aatgtgaccg gctggttcct ccactcgttc ctcatggtcc cctatttcag ctggaagtac420tctcaccacc gtcaccaccg cttcaccggc cacatggatc tcgacatggc ctttgtcccc480cgcacttcgc ccaagccttc tttgtctttc cgcattgctg gtatggacgt cgctgagctg540attgaggaca cccccattgc ccaggccgtc aagctcatct tccaccagct cttcggatgg600caggtgtaca ccttcttcaa cgccagctct ggcaagggta gcaagcagtg ggagcccaag660agcggcttgg ccagctggtt ccgcgtcagc cacttcgagc ccaccagcgc tgtcttccgc720cccgccgagg ctcctttcat cctcatctcc gacattggtc tcgccctcac tggaactgct780ctgtactttg cttccaagga ggtcggcgtt tccaccgttc tctacctcta cctcgtcccc840tacctctggg tccaccactg gctcgtcgcc atcacctacc tccaccacca ccacaccgag900cttccccact acaccgccga gggctggacc tacgtcaagg gtgctctcgc tactgttgac960cgcgagtttg gcttcattgg caagcacctt ttccacggca tcattgagaa gcacgtcatt1020caccacctgt tccctaagat ccccttctac aaggctgacg aggccaccga ggccatcaag1080cccatcatcg gcgaccacta ctgccacgac gaccgcagct tccttggcca gctctggacc1140atctttggca gcctcaagta cgtcgagcac gaccccgccg tccctggtgc catgcgctgg1200gccaaggagt ag1212<210>18<211>403<212>PRT<213>Fusarium graminearium<400>18Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Lys Asp1 5 10 15Leu Pro Lys Val Thr Leu Glu Ala Thr Ser Gln Pro Gln Phe Pro Asp20 25 30Ile Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser35 40 45Leu Ile Thr Ser Tyr Tyr Tyr Val Val Arg Asp Phe Ala Met Val Gly50 55 60Ser Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Gly Ile Glu Asp Gln65 70 75 80Tyr Leu Arg Val Ala Ala Trp Met Ala Tyr Gly Phe Leu Gln Gly Leu
85 90 95Phe Cys Thr Gly Ile Trp Ile Leu Gly His Glu Cys Gly His Gly Ala100 105 110Phe Ser Thr His Ser Lys Leu Asn Asn Val Thr Gly Trp Phe Leu His115 120 125Ser Phe Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg130 135 140His His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro145 150 155 160Arg Thr Ser Pro Lys Pro Ser Leu Ser Phe Arg Ile Ala Gly Met Asp165 170 175Val Ala Glu Leu Ile Glu Asp Thr Pro Ile Ala Gln Ala Val Lys Leu180 185 190Ile Phe His Gln Leu Phe Gly Trp Gln Val Tyr Thr Phe Phe Asn Ala195 200 205Ser Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Ser Gly Leu Ala210 215 220Ser Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg225 230 235 240Pro Ala Glu Ala Pro Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu245 250 255Thr Gly Thr Ala Leu Tyr Phe Ala Ser Lys Glu Val Gly Val Ser Thr260 265 270Val Leu Tyr Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu275 280 285Val Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr290 295 300Thr Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp305 310 315 320Arg Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu325 330 335Lys His Val Ile His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala340 345 350Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Ile Gly Asp His Tyr Cys
355 360 365His Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Ser370 375 380Leu Lys Tyr Val Glu His Asp Pro Ala Val Pro Gly Ala Met Arg Trp385 390 395 400Ala Lys Glu<210>19<211>1371<212>DNA<213>Fusarium graminearium<400>19tcaaccacgg cgacggatac tgagtctgct gccgtttctc cttcagactc tccccgccat60tcggcctctt ccacctcgct ctcgtctctt tccgagattg atatcgccaa gcccaaggcc120gaatatggtg ttatgcttga cacctatggc aacaagttcg aggttcccga cttcaccatc180aaggagatct acaatgccat ccccaagcac tgcttccagc gctccgctct caagggatac240ggatacatcc tccgcgacat tgtccttctt gctaccacct ttagcatctg gtacaactat300gtgacccccg agtacatccc tagcactccc gcccgcgctg gtctctgggc tgtctacact360gttctccagg gtcttttcgg taccggtctc tgggtcatcg ctcacgagtg tggccacggt420gctttctccg actctcgcct tatcaacgac atcaccggct gggtcctcca ctcttctctc480ctcgtcccct acttcagctg gcaaatctcc caccgaaagc accacaaggc taccggaaac540atggagcgtg acatggtctt tgttccccga actcgcgagc agcaggctac tcgtctcggc600aagatgaccc acgagcttgc tcacctcact gaggagaccc ccgtcttcac tctgatcatg660cttgttctcc agcagctcgt cggctggccc aactacctca tgaccaacgt tactggccac720aactaccacg agcgtcagaa ggagggccgt ggcaagggca agcacaacgg tctcggcggc780ggtgtcaacc actttgatcc ccgcagccct ctttacgagc acagcgatgc taagctcatt840gtcttgagtg atattggtat cggtctgatg ggtaccgctc tgtacttcct cgtccagaag900tttggctttt acaacatggc catctggtac tttgtccctt acctttgggt caaccactgg960ctcgtcgcca ttactttcct ccagcacacc gaccctaccc ttccccacta caccaacgac1020gagtggaact ttgtccgcgg tgctgctgct accatcgatc gtgagatggg tttcattggc1080cgacacctcc tccacggtat catcgagact cacgtcctcc accactacgt cagcagcatc1140cccttctaca acgccgacga ggctaccgag gctatcaagc ctgtcatggg caagcactac1200cgtgccgacg tccaggatgg tccccgtggt ttcattcgtg ccatgtaccg cagtgcccgt1260atgtgccagt gggttgagcc cagcgctgag gccgagggtg ctggcaaggg tgttctgttc1320ttccgcaacc gcaacaaggt tggcactgct cctgccgtcc tcaaggctta g 1371
<210>20<211>456<212>PRT<213>Fusarium graminearium<400>20Ser Thr Thr Ala Thr Asp Thr Glu Ser Ala Ala Val Ser Pro Ser Asp1 5 10 15Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Glu20 25 30Ile Asp Ile Ala Lys Pro Lys Ala Glu Tyr Gly Val Met Leu Asp Thr35 40 45Tyr Gly Asn Lys Phe Glu Val Pro Asp Phe Thr Ile Lys Glu Ile Tyr50 55 60Asn Ala Ile Pro Lys His Cys Phe Gln Arg Ser Ala Leu Lys Gly Tyr65 70 75 80Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Ala Thr Thr Phe Ser Ile85 90 95Trp Tyr Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Thr Pro Ala Arg100 105 110Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr115 120 125Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala Phe Ser Asp130 135 140Ser Arg Leu Ile Ash Asp Ile Thr Gly Trp Val Leu His Ser Ser Leu145 150 155 160Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys His His Lys165 170 175Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg180 185 190Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu Leu Ala His195 200 205Leu Thr Glu Glu Thr Pro Val Phe Thr Leu Ile Met Leu Val Leu Gln210 215 220Gln Leu Val Gly Trp Pro Asn Tyr Leu Met Thr Asn Val Thr Gly His225 230 235 240Asn Tyr His Glu Arg Gln Lys Glu Gly Arg Gly Lys Gly Lys His Asn
245 250 255Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser Pro Leu Tyr260 265 270Glu His Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile Gly Tle Gly275 280 285Leu Met Gly Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe Gly Phe Tyr290 295 300Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val Asn His Trp305 310 315 320Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His325 330 335Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile340 345 350Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His Gly Ile Ile355 360 365Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro Phe Tyr Asn370 375 380Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Val Met Gly Lys His Tyr385 390 395 400Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg Ala Met Tyr405 410 415Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu420 425 430Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn Lys Val Gly435 440 445Thr Ala Pro Ala Val Leu Lys Ala450 455<210>21<211>424<212>PRT<213>Aspergillus fumigatus<400>21Met Ala Ser Asp Ala Glu Lys Thr Ser Ser Lys Met Ile Asp Thr Tyr1 5 10 15Gly Asn Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp20 25 30
Ala Ile Pro Ala His Cys Tyr Gln Arg Ser Ala Ala Thr Ser Leu Tyr35 40 45Tyr Val Phe Arg Asp Met Ala Ile Leu Ala Ser Val Phe Tyr Val Phe50 55 60His Asn Tyr Val Thr Pro Glu Thr Val Pro Ser Met Pro Val Arg Val65 70 75 80Val Leu Trp Thr Ile Tyr Thr Val Val Gln Gly Leu Val Gly Thr Gly85 90 95Val Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser100 105 110Lys Val Leu Asn Asp Thr Val Gly Trp Ile Cys His Ser Leu Leu Leu115 120 125Val Pro Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala130 135 140Thr Gly Asn Ile Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu145 150 155 160Glu Tyr Ala Thr Arg Ile Gly Arg Ala Ala His Glu Leu Ser Glu Leu165 170 175Met Glu Glu Thr Pro Ile Leu Thr Ala Thr Asn Leu Val Leu Gln Gln180 185 190Leu Phe Gly Trp Pro Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn195 200 205Asn His Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly210 215 220Tyr Phe Gly Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu225 230 235 240Ala Lys Asp Ala Lys Leu Ile Val Leu Ser Asp Leu Gly Leu Phe Leu245 250 255Val Gly Ser Leu Leu Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn260 265 270Leu Leu Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu275 280 285Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr290 295 300
Gln Pro Glu Ala Trp Asp Phe Thr Arg Gly Ala Ala Ala Thr Ile Asp305 310 315 320Arg Asp Phe Gly Phe Val Gly Arg His Ile Phe His Gly Ile Ile Glu325 330 335Thr His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala340 345 350Asp Glu Ala Ser Glu Ala Ile Gln Lys Val Met Gly Pro His Tyr Arg355 360 365Ser Glu Ala His Thr Gly Trp Thr Gly Phe Leu Lys Ala Leu Trp Thr370 375 380Ser Ala Arg Thr Cys Gln Trp Val Glu Pro Thr Glu Gly Ala Lys Gly385 390 395 400Glu Ser Gln Tyr Val Leu Phe Tyr Arg Asn Ile Asn Gly Ile Gly Val405 410 415Pro Pro Ala Lys Ile Pro Ala Lys420<210>22<211>466<212>PRT<213>Aspergillus flavus<400>22Met Ser Ser Thr Ala Ile Pro Lys Arg Met Ala Leu Asn Arg Asn Pro1 5 10 15Gly Thr Asp Ser Ser Val Pro Ser Val Ser Val Ser Pro Phe Asp Ser20 25 30Pro Arg His Ser Pro Ser Ser Thr Ser Leu Ser Ser Leu Ala Ser Glu35 40 45Ser Glu Asn Lys Gly Lys Met Leu Asp Thr Tyr Gly Asn Glu Phe Lys50 55 60Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp Ala Ile Pro Ala His65 70 75 80Cys Tyr Glu Arg Lys Ala Leu Thr Ser Leu Tyr Tyr Val Phe Arg Asp85 90 95Ile Ala Met Leu Gly Ser Ile Phe Tyr Val Phe His Asn Tyr Val Thr100105110
Pro Glu Thr Val Pro Ser Phe Pro Ala Arg Val Ala Leu Trp Ser Leu115 120 125Tyr Thr Val Val Gln Gly Leu Ile Ala Thr Gly Val Trp Val Leu Ala130 135 140His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys Val Leu Asn Asp145 150 155 160Thr Val Gly Trp Ile cys His Ser Ala Leu Leu Val Pro Tyr Phe Ser165 170 175Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly Asn Ile Ala180 185 190Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Glu Tyr Ala Ser Arg195 200 205Ile Gly Lys Thr Ile His Asp Leu Asn Glu Leu Met Glu Glu Thr Pro210 215 220Ile Ala Thr Val Thr Asn Leu Ile Leu Gln Gln Leu Phe Gly Trp Pro225 230 235 240Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn Asn His Glu Arg Gln245 250 255Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe Gly Gly Val260 265 270Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Ala Lys Asp Ala Lys275 280 285Leu Ile Val Leu Ser Asp Leu Gly Leu Ala Ile Thr Gly Ser Val Leu290 295 300Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn Leu Leu Val Trp Tyr305 310 315 320Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr325 330 335Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro Glu Val Trp340 345 350Asn Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Asp Phe Gly Phe355 360 365Val Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His Val Leu His370 375 380
His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu385 390 395 400Ala Ile Gln Lys Val Met Gly Ser His Tyr Arg Thr Glu Ala His Thr405 410 415Gly Trp Thr Gly Phe Phe Lys Ala Leu Phe Thr Ser Ala Arg Val Cys420 425 430His Trp Val Glu Pro Thr Glu Gly Ala Arg Gly Glu Ser Glu Gly Val435 440 445Leu Phe Tyr Arg Asn Thr Asn Gly Ile Gly Val Pro Pro Ala Lys Leu450 455 460Ser Lys465<210>23<211>19<212>DNA<213>人工序列<220>
<223>引物TEF5′<400>23agagaccggg ttggcggcg19<210>24<211>30<212>DNA<213>人工序列<220>
<223>引物TEF3′<400>24ttggatcctt tgaatgattc ttatactcag30<210>25<211>29<212>DNA<213>人工序列<220>
<223>引物XPR5′<400>25tttccgcggc ccgagattcc ggcctcttc 29<210>26<211>31<212>DNA<213>人工序列<220>
<223>引物XPR3′
<400>26tttccgcgga cacaatatct ggtcaaattt c 31<210>27<211>39<212>DNA<213>人工序列<220>
<223>引物YL5<400>27cccccctcga ggtcgatggt gtcgataagc ttgatatcg 39<210>28<211>39<212>DNA<213>人工序列<220>
<223>引物YL6<400>28cgatatcaag cttatcgaca ccatcgacct cgagggggg 39<210>29<211>35<212>DNA<213>人工序列<220>
<223>引物YL9<400>29tggtaaataa atgatgtcga ctcaggcgac gacgg 35<210>30<21>35<212>DNA<213>人工序列<220>
<223>引物YL10<400>30ccgtcgtcgc ctgagtcgac atcatttatt tacca 35<210>31<211>37<212>DNA<213>人工序列<220>
<223>引物YL7<400>31caaccgattt cgacagttaa ttaataattt gaatcga37<210>32<21>37<212>DNA
<213>人工序列<220>
<223>引物YL8<400>32tcgattcaaa ttattaatta actgtcgaaa tcggttg37<210>33<211>36<212>DNA<213>人工序列<220>
<223>引物YL3<400>33gtataagaat cattcaccat ggatccacta gttcta 36<210>34<211>36<212>DNA<213>人工序列<220>
<223>引物YL4<400>34tagaactagt ggatccatgg tgaatgattc ttatac 36<210>35<211>30<212>DNA<213>人工序列<220>
<223>引物YL1<400>35cagtgccaaa agccaaggca ctgagctcgt30<210>36<211>31<212>DNA<213>人工序列<220>
<223>引物YL2<400>36gacgagctca gtgccttggc ttttggcact g 31<210>37<211>33<212>DNA<213>人工序列<220>
<223>引物YL61<400>37acaattccac acaacgtacg agccggaagc ata33
<210>38<211>33<212>DNA<213>人工序列<220>
<223>引物YL62<400>38tatgcttccg gctcgtacgt tgtgtggaat tgt33<210>39<211>26<212>DNA<213>人工序列<220>
<223>简并引物P73<220>
<221>misc_feature<222>(24)..(24)<223>n is a,c,g,or t<400>39tgggtcctgg gccaygartg yggnca26<210>40<211>9<212>PRT<213>人工序列<220>
<223>Δ12去饱和酶中的共有序列<400>40Trp Val Leu Gly His Glu cys Gly His1 5<210>41<211>30<212>DNA<213>人工序列<220>
<223>简并引物P76<220>
<221>misc_feature<222>(25)..(25)<223>n is a,c,g,or t<220>
<221>misc_feature<222>(28)..(28)<223>n is a,c,g,or t<400>41ggtggcctcc tcggcgtgrt araanggnat30
<210>42<211>10<212>PRT<213>人工序列<220>
<223>Δ12去饱和酶中的共有序列<220>
<221>MISC_FEATURE<222>(1)..(1)<223>Xaa=Met or Ile<400>42Xaa Pro Phe Val His Ala Glu Glu Ala Thr1 5 10<210>43<211>29<212>DNA<213>人工序列<220>
<223>引物P99<400>43ggcaagctta acgccccgct gtttgagaa 29<210>44<211>36<212>DNA<213>人工序列<220>
<223>引物P100<400>44tgacgttgtt agatctacgt gggtctcgat gatgtc36<210>45<211>35<212>DNA<213>人工序列<220>
<223>引物P101<400>45gacccacgta gatctaacaa cgtcaccgga tgggt 35<210>46<21>29<212>DNA<213>人工序列<220>
<223>引物P102<400>46cgggaattcg gggttgaagt ggttgacag 29
<210>47<211>16<212>DNA<213>人工序列<220>
<223>引物P119<400>47taataacgcc agggtt 16<210>48<211>22<212>DNA<213>人工序列<220>
<223>引物P120<400>48gtagaagggc attcgagaca cg22<210>49<211>22<212>DNA<213>人工序列<220>
<223>引物P121<400>49tgtgcccaag gaccgaaagg ag22<210>50<211>28<212>DNA<213>人工序列<220>
<223>引物P122<400>50tgcaggtagg tgatggccac gagttggg 28<210>51<211>1936<212>DNA<213>Yarrowia lioplytica<400>51cgtagttata tacaagaggt agatgcgtgc tggtgttaga ggggctctca ggattaggag 60gaaaatttga cattggccct caacatataa cctcgggtgt gcctctgttt accctcagct120tttgcttgtc cccaagtcag tcacgccagg ccaaaaaggt tggtggattg acagggagaa180aaaaaaaagc ctagtgggtt taaactcgag gtaagacatt gaaatatata ccggtcggca240tcctgagtcc ctttctcgta ttccaacaga ccgaccatag aaatggattc gaccacgcag300accaacaccg gcaccggcaa ggtggccgtg cagcccccca cggccttcat taagcccatt360gagaaggtgt ccgagcccgt ctacgacacc tttggcaacg agttcactcc tccagactac420
tctatcaagg atattctgga tgccattccc caggagtgct acaagcggtc ctacgttaag480tcctactcgt acgtggcccg agactgcttc tttatcgccg tttttgccta catggcctac540gcgtacctgc ctcttattcc ctcggcttcc ggccgagctg tggcctgggc catgtactcc600attgtccagg gtctgtttgg caccggtctg tgggttcttg cccacgagtg tggccactct660gctttctccg actctaacac cgtcaacaac gtcaccggat gggttctgca ctcctccatg720ctggtccctt actacgcctg gaagctgacc cactccatgc accacaagtc cactggtcac780ctcacccgtg atatggtgtt tgtgcccaag gaccgaaagg agtttatgga gaaccgaggc840gcccatgact ggtctgagct tgctgaggac gctcccctca tgaccctcta cggcctcatc900acccagcagg tgtttggatg gcctctgtat ctgctgtctt acgttaccgg acagaagtac960cccaagctca acaaatgggc tgtcaaccac ttcaacccca acgccccgct gtttgagaag 1020aaggactggt tcaacatctg gatctctaac gtcggtattg gtatcaccat gtccgtcatc 1080gcatactcca tcaaccgatg gggcctggct tccgtcaccc tctactacct gatcccctac 1140ctgtgggtca accactggct cgtggccatc acctacctgc agcacaccga ccccactctg 1200ccccactacc acgccgacca gtggaacttc acccgaggag ccgccgccac catcgaccga 1260gagtttggct tcatcggctc cttctgcttc catgacatca tcgagaccca cgttctgcac 1320cactacgtgt ctcgaattcc cttctacaac gcccgaatcg ccactgagaa gatcaagaag 1380gtcatgggca agcactaccg acacgacgac accaacttca tcaagtctct ttacactgtc 1440gcccgaacct gccagtttgt tgaaggtaag gaaggcattc agatgtttag aaacgtcaat 1500ggagtcggag ttgctcctga cggcctgcct tctaaaaagt agagctagaa atgttatttg 1560attgtgtttt aactgaacag caccgagccc gaggctaagc caagcgaagc cgaggggttg 1620tgtagtccat ggacgtaacg agtaggcgat atcaccgcac tcggcactgc gtgtctgcgt 1680tcatgggcga agtcacatta cgctgacaac cgttgtagtt tccctttagt atcaatactg 1740ttacaagtac cggtctcgta ctcgtactga tacgaatctg tgggaagaag tcacccttat 1800cagaccttca tactgatgtt tcggatatca atagaactgg catagagccg ttaaagaagt 1860ttcacttaat cactccaacc ctcctacttg tagattcaag cagatcgata agatggattt 1920gatggtcagt gctagc 1936<210>52<211>419<212>PRT<213>Yarrowia lipolytica<400>52Met Asp Ser Thr Thr Gln Thr Asn Thr Gly Thr Gly Lys Val Ala Val1 5 10 15Gln Pro Pro Thr Ala Phe Ile Lys Pro Ile Glu Lys Val Ser Glu Pro20 25 30
Val Tyr Asp Thr Phe Gly Asn Glu Phe Thr Pro Pro Asp Tyr Ser Ile35 40 45Lys Asp Ile Leu Asp Ala Ile Pro Gln Glu Cys Tyr Lys Arg Ser Tyr50 55 60Val Lys Ser Tyr Ser Tyr Val Ala Arg Asp Cys Phe Phe Ile Ala Val65 70 75 80Phe Ala Tyr Met Ala Tyr Ala Tyr Leu Pro Leu Ile Pro Ser Ala Ser85 90 95Gly Arg Ala Val Ala Trp Ala Met Tyr Ser Ile Val Gln Gly Leu Phe100 105 110Gly Thr Gly Leu Trp Val Leu Ala His Glu cys Gly His Ser Ala Phe115 120 125Ser Asp Ser Asn Thr Val Asn Asn Val Thr Gly Trp Val Leu His Ser130 135 140Ser Met Leu Val Pro Tyr Tyr Ala Trp Lys Leu Thr His Ser Met His145 150 155 160His Lys Ser Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro Lys165 170 175Asp Arg Lys Glu Phe Met Glu Asn Arg Gly Ala His Asp Trp Ser Glu180 185 190Leu Ala Glu Asp Ala Pro Leu Met Thr Leu Tyr Gly Leu Ile Thr Gln195 200 205Gln Val Phe Gly Trp Pro Leu Tyr Leu Leu Ser Tyr Val Thr Gly Gln210 215 220Lys Tyr Pro Lys Leu Asn Lys Trp Ala Val Asn His Phe Asn Pro Asn225 230 235 240Ala Pro Leu Phe Glu Lys Lys Asp Trp Phe Asn Ile Trp Ile Ser Asn245 250 255Val Gly Ile Gly Ile Thr Met Ser Val Ile Ala Tyr Ser Ile Asn Arg260 265 270Trp Gly Leu Ala Ser Val Thr Leu Tyr Tyr Leu Ile Pro Tyr Leu Trp275 280 285Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His Thr Asp Pro290 295 300
Thr Leu Pro His Tyr His Ala Asp Gln Trp Asn Phe Thr Arg Gly Ala305 310 315 320Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Ser Phe Cys Phe325 330 335His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile340 345 350Pro Phe Tyr Asn Ala Arg Ile Ala Thr Glu Lys Ile Lys Lys Val Met355 360 365Gly Lys His Tyr Arg His Asp Asp Thr Asn Phe Ile Lys Ser Leu Tyr370 375 380Thr Val Ala Arg Thr Cys Gln Phe Val Glu Gly Lys Glu Gly Ile Gln385 390 395 400Met Phe Arg Asn Val Asn Gly Val Gly Val Ala Pro Asp Gly Leu Pro405 410 415Ser Lys Lys<210>53<211>25<212>DNA<213>人工序列<220>
<223>引物P147<400>53tcatgccatg gattcgacca cgcag 25<210>54<211>26<212>DNA<213>人工序列<220>
<223>引物P148<400>54acatgcggcc gcctactttt tagaag26<210>55<211>37<212>DNA<213>人工序列<220>
<223>引物P194<400>55agactccatg gcgtccactt cggctctgcc caagcag37
<210>56<211>44<212>DNA<213>人工序列<220>
<223>引物P195<400>56tttatagcgg ccgcctactt aagcaacggg cttgataaca gcgg44<210>57<211>12649<212>DNA<213>人工序列<220>
<223>质粒pKUNF12T6E<220>
<221>misc_feature<222>(2507)..(2507)<223>n is a,c,g,or t<220>
<221>misc_feature<222>(2512)..(2515)<223>n is a,c,g,or t<400>57taaccctcac taaagggaac aaaagctgga gctccaccgc ggacacaata tctggtcaaa 60tttcagtttc gttacataaa tcgttatgtc aaaggagtgt gggaggttaa gagaattatc120accggcaaac tatctgttaa ttgctaggta cctctagacg tccacccggg tcgcttggcg180gccgaagagg ccggaatctc gggccgcggt ggcggccgct tagttggtct tggacttctt240gggcttcttc aggtaggact ggacaaagaa gttgccgaac agagcgagca gggtgatcat300gtacacgccg agcagctgga ccagagcctg agggtagtcg caggggaaga ggtagtcgta360cagggactgc accagcatag ccatgaactg ggtcatctgc agagtggtga tgtagggctt420gatgggcttg acgaagccga agccctgaga ggaaaagaag tagtaggcgt acatgacggt480gtggacgaag gagttgagga tgacggagaa gtaggcgtcg ccaccaggag cgtacttggc540aatagcccac cagatggcga agatggtggc atggtggtac acgtgcagga aggagacctg600gttgaacttc ttgcacagga tcatgatagc ggtgtccagg aactcgtagg ccttggagac660gtagaacacg tagacgattc gggacatgcc ctgagcgtgg gactcgttgc ccttctccat720gtcgttgccg aagaccttgt agccacccag gatagcctgt cggatggtct cgacgcacat780gtagagggac agtccgaaga ggaacaggtt gtggagcagc ttgatggtct tcagctcgaa840gggcttctcc atctgcttca tgatgggaat gccgaagagc agcatggcca tgtagccgac900ctcgaaggcg agcatggtgg agacgtccat catgggcaga ccgtcggtca gagcgtaggg960cttagctccg tccatccact ggtcgacacc ggtctcgact cgtccgacca cgtcgtccca 1020gacagaggag ttggccatgg tgaatgattc ttatactcag aaggaaatgc ttaacgattt 1080
cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg gggacggtgg1140tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca gtagtctatt1200ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa agtctgaaca1260agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg aaccggggga1320ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac tgggtcaatt1380tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg ccaacccggt1440ctctcctgaa ttctgcatcg atcgaggaag aggacaagcg gctgcttctt aagtttgtga1500catcagtatc caaggcacca ttgcaaggat tcaaggcttt gaacccgtca tttgccattc1560gtaacgctgg tagacaggtt gatcggttcc ctacggcctc cacctgtgtc aatcttctca1620agctgcctga ctatcaggac attgatcaac ttcggaagaa acttttgtat gccattcgat1680cacatgctgg tttcgatttg tcttagagga acgcatatac agtaatcata gagaataaac1740gatattcatt tattaaagta gatagttgag gtagaagttg taaagagtga taaatagcgg1800ccgcgcctac ttaagcaacg ggcttgataa cagcgggggg ggtgcccacg ttgttgcggt1860tgcggaagaa cagaacaccc ttaccagcac cctcggcacc agcgctgggc tcaacccact1920ggcacatacg cgcactgcgg tacatggcgc ggatgaagcc acgaggacca tcctggacat1980cagcccggta gtgcttgccc atgatgggct taatggcctc ggtggcctcg tccgcgttgt2040agaaggggat gctgctgacg tagtggtgga ggacatgagt ctcgatgatg ccgtggagaa2100ggtggcggcc gatgaagccc atctcacggt caatggtagc agcggcacca cggacgaagt2160tccactcgtc gttggtgtag tggggaaggg tagggtcggt gtgctggagg aaggtgatgg2220caacgagcca gtggttaacc cagaggtagg gaacaaagta ccagatggcc atgttgtaga2280aaccgaactt ctgaacgagg aagtacagag cagtggccat cagaccgata ccaatatcgc2340tgaggacgat gagcttagcg tcactgttct cgtacagagg gctgcgggga tcgaagtggt2400taacaccacc gccgaggccg ttatgcttgc ccttgccgcg accctcacgc tggcgctcgt2460ggtagttgtg gccggtaaca ttggtgatga ggtagttggg ccagccnacg annnnctcag2520taagatgagc gagctcgtgg gtcatctttc cgagacgagt agcctgctgc tcgcgggttc2580ggggaacgaa gaccatgtca cgctccatgt tgccagtggc cttgtggtgc tttcggtggg2640agatttgcca gctgaagtag gggacaagga gggaagagtg aagaacccag ccagtaatgt2700cgttgatgat gcgagaatcg gagaaagcac cgtgaccgca ctcatgggca ataacccaga2760gaccagtacc gaaaagaccc tgaagaacgg tgtacacggc ccacagacca gcgcgggcgg2820gggtggaggg gatatattcg ggggtcacaa agttgtacca gatgctgaaa gtggtagtca2880ggaggacaat gtcgcggagg atataaccgt atcccttgag agcggagcgc ttgaagcagt2940gcttagggat ggcattgtag atgtccttga tggtaaagtc gggaacctcg aactggttgc3000cgtaggtgtc gagcatgaca ccatactcgg acttgggctt ggcgatatca acctcggaca3060tggacgagag cgatgtggaa gaggccgagt ggcggggaga gtctgaagga gagacggcgg3120
cagactcaga atccgtcaca gtagttgagg tgacggtgcg tctaagcgca gggttctgct3180tgggcagagc cgaagtggac gccatggaga gctgggttag tttgtgtaga gagtgtgtgt3240tgctagcgac tttcggattg tgtcattaca caaaacgcgt cgtctcgaca ctgatcttgt3300cgtggatact cacggctcgg acatcgtcgc cgacgatgac accggacttt cgcttaagga3360cgtcagtaac aggcattgtg tgatgtgtag tttagatttc gaatctgtgg ggaaagaaag3420gaaaaaagag actggcaacc gattgggaga gccactgttt atatataccc tagacaagcc3480ccccgcttgt aagatgttgg tcaatgtaaa ccagtattaa ggttggcaag tgcaggagaa3540gcaaggtgtg ggtaccgagc aatggaaatg tgcggaaggc aaaaaaatga ggccacggcc3600tattgtcggg gctatatcca gggggcgatt gaagtacact aacatgacat gtgtccacag3660accctcaatc tggcctgatg agccaaatcc atacgcgctt tcgcagctct aaaggctata3720acaagtcaca ccaccctgct cgacctcagc gccctcactt tttgttaaga caaactgtac3780acgctgttcc agcgttttct gcctgcacct ggtgggacat ttggtgcaac ctaaagtgct3840cggaacctct gtggtgtcca gatcagcgca gcagttccga ggtagttttg aggcccttag3900atgatgcaat ggtgtcagtc gctggatcac gagtcttaat ggcagtattc gttcttattt3960gtgccattga gccccgttat cctcgtatct tctacccccc atcccatccc tttgttggtg4020caaccctacc catttattgt tgggtgcagc ccaaccgacg tggagagctt ggcttggcca4080tataaaaagg ccccccccta gtggcaatgg cagaaagtca gctgtgagtt gttgaatttg4140tcatctaggc ggcctggccg tcttctccgg ggcaattgtt cctctatagt actgcgtaca4200ctgtttaaac agtgtacgca gatctgcgac gacggaattc ctgcagccca tctgcagaat4260tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccaa4320ttgaccccaa attgacccag tagcgggccc aaccccggcg agagccccct tcaccccaca4380tatcaaacct cccccggttc ccacacttgc cgttaagggc gtagggtact gcagtctgga4440atctacgctt gttcagactt tgtactagtt tctttgtctg gccatccggg taacccatgc4500cggacgcaaa atagactact gaaaattttt ttgctttgtg gttgggactt tagccaaggg4560tataaaagac caccgtcccc gaattacctt tcctcttctt ttctctctct ccttgtcaac4620tcacacccga aatcgttaag catttccttc tgagtataag aatcattcac catggctgcc4680gctccctctg tgcgaacctt tacccgagcc gaggttctga acgctgaggc tctgaacgag4740ggcaagaagg acgctgaggc tcccttcctg atgatcatcg acaacaaggt gtacgacgtc4800cgagagttcg tccctgacca tcctggaggc tccgtgattc tcacccacgt tggcaaggac4860ggcaccgacg tctttgacac ctttcatccc gaggctgctt gggagactct cgccaacttc4920tacgttggag acattgacga gtccgaccga gacatcaaga acgatgactt tgccgctgag4980gtccgaaagc tgcgaaccct gttccagtct ctcggctact acgactcctc taaggcctac5040tacgccttca aggtctcctt caacctctgc atctggggac tgtccaccgt cattgtggcc5100aagtggggtc agacctccac cctcgccaac gtgctctctg ctgccctgct cggcctgttc5160
tggcagcagt gcggatggct ggctcacgac tttctgcacc accaggtctt ccaggaccga5220ttctggggtg atctcttcgg agccttcctg ggaggtgtct gccagggctt ctcctcttcc5280tggtggaagg acaagcacaa cactcaccat gccgctccca acgtgcatgg cgaggatcct5340gacattgaca cccaccctct cctgacctgg tccgagcacg ctctggagat gttctccgac5400gtccccgatg aggagctgac ccgaatgtgg tctcgattca tggtcctgaa ccagacctgg5460ttctacttcc ccattctctc cttcgctcga ctgtcttggt gcctccagtc cattctcttt5520gtgctgccca acggtcaggc tcacaagccc tccggagctc gagtgcccat ctccctggtc5580gagcagctgt ccctcgccat gcactggacc tggtacctcg ctaccatgtt cctgttcatc5640aaggatcctg tcaacatgct cgtgtacttc ctggtgtctc aggctgtgtg cggaaacctg5700ctcgccatcg tgttctccct caaccacaac ggtatgcctg tgatctccaa ggaggaggct5760gtcgacatgg atttctttac caagcagatc atcactggtc gagatgtcca tcctggactg5820ttcgccaact ggttcaccgg tggcctgaac taccagatcg agcatcacct gttcccttcc5880atgcctcgac acaacttctc caagatccag cctgccgtcg agaccctgtg caagaagtac5940aacgtccgat accacaccac tggtatgatc gagggaactg ccgaggtctt ctcccgactg6000aacgaggtct ccaaggccac ctccaagatg ggcaaggctc agtaagcggc cgcatgagaa6060gataaatata taaatacatt gagatattaa atgcgctaga ttagagagcc tcatactgct6120cggagagaag ccaagacgag tactcaaagg ggattacacc atccatatcc acagacacaa6180gctggggaaa ggttctatat acactttccg gaataccgta gtttccgatg ttatcaatgg6240gggcagccag gatttcaggc acttcggtgt ctcggggtga aatggcgttc ttggcctcca6300tcaagtcgta ccatgtcttc atttgcctgt caaagtaaaa cagaagcaga tgaagaatga6360acttgaagtg aaggaattta aattgccccg gagaagacgg ccaggccgcc tagatgacaa6420attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct ttttatatgg6480ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt agggttgcac6540caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca atggcacaaa6600taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt gcatcatcta6660agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc6720actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta6780cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat6840agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg6900tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc6960cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc7020tcctgcactt gccaacctta atactggttt acattgacca acatcttaca agcggggggc7080ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt7140tctttcccca cagattcgaa atctaaacta cacatcacac aatgcctgtt actgacgtcc7200
ttaagcgaaa gtccggtgtc atcgtcggcg acgatgtccg agccgtgagt atccacgaca7260agatcagtgt cgagacgacg cgttttgtgt aatgacacaa tccgaaagtc gctagcaaca7320cacactctct acacaaacta acccagctct ccatggagtc cattgctccc ttcctgccct7380ccaagatgcc tcaggacctg ttcatggacc tcgccagcgc tatcggtgtc cgagctgctc7440cctacgtcga tcccctggag gctgccctgg ttgcccaggc cgagaagtac attcccacca7500ttgtccatca cactcgaggc ttcctggttg ccgtggagtc tcccctggct cgagagctgc7560ctctgatgaa ccccttccac gtgctcctga tcgtgctcgc ctacctggtc accgtgtttg7620tgggtatgca gatcatgaag aactttgaac gattcgaggt caagaccttc tccctcctgc7680acaacttctg tctggtctcc atctccgcct acatgtgcgg tggcatcctg tacgaggctt7740atcaggccaa ctatggactg tttgagaacg ctgccgatca caccttcaag ggtctcccta7800tggctaagat gatctggctc ttctacttct ccaagatcat ggagtttgtc gacaccatga7860tcatggtcct caagaagaac aaccgacaga tttcctttct gcacgtgtac caccactctt7920ccatcttcac catctggtgg ctggtcacct tcgttgctcc caacggtgaa gcctacttct7980ctgctgccct gaactccttc atccacgtca tcatgtacgg ctactacttt ctgtctgccc8040tgggcttcaa gcaggtgtcg ttcatcaagt tctacatcac tcgatcccag atgacccagt8100tctgcatgat gtctgtccag tcttcctggg acatgtacgc catgaaggtc cttggccgac8160ctggataccc cttcttcatc accgctctgc tctggttcta catgtggacc atgctcggtc8220tcttctacaa cttttaccga aagaacgcca agctcgccaa gcaggccaag gctgacgctg8280ccaaggagaa ggccagaaag ctccagtaag cggccgcaag tgtggatggg gaagtgagtg8340cccggttctg tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc8400gagctacgtg gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt8460acgatacaag cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc8520cgggcaacgg tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac8580tgcgtatcat agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgaagtcgt8640caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct8700caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg8760ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt8820aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta8880tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa8940cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc9000tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc9060agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca9120acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag9180gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc accaccgtca9240
gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg atagcagaat9300atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg cagaagaagt9360atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga tcagtttggc9420gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg9480ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt9540atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa9600gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc9660gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag9720gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt9780gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg9840aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg9900ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg9960taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 10020tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 10080gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 10140taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 10200tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 10260tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 10320ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 10380taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 10440tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 10500cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 10560gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 10620cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 10680ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 10740aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 10800atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 10860tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 10920gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 10980aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 11040acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 11100ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 11160tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 11220aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 11280
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 11340atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 11400aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 11460tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 11520ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 11580cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 11640ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 11700accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 11760gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 11820gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 11880caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc attcaggctg 11940cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 12000gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 12060tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg 12120tcgcatgcag tggtggtatt gtgactgggg atgtagttga gaataagtca tacacaagtc 12180agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca 12240tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt 12300tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa 12360gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc 12420tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct 12480caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg 12540tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa 12600gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaat 12649<210>58<211>973<212>DNA<213>Yarrowia lipolytica<220>
<221>misc_feature<223>启动子FBAIN<400>58aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat360gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa420gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa480gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag540tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc600cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt660aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa720acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga780aatctaaact acacatcaca caatgcctgt tactgacgtc cttaagcgaa agtccggtgt840catcgtcggc gacgatgtcc gagccgtgag tatccacgac aagatcagtg tcgagacgac900gcgttttgtg taatgacaca atccgaaagt cgctagcaac acacactctc tacacaaact960aacccagctc tcc 973<210>59<211>957<212>DNA<213>Mortierella alpina<400>59atggagtcca ttgctccctt cctgccctcc aagatgcctc aggacctgtt catggacctc 60gccagcgcta tcggtgtccg agctgctccc tacgtcgatc ccctggaggc tgccctggtt120gcccaggccg agaagtacat tcccaccatt gtccatcaca ctcgaggctt cctggttgcc180gtggagtctc ccctggctcg agagctgcct ctgatgaacc ccttccacgt gctcctgatc240gtgctcgcct acctggtcac cgtgtttgtg ggtatgcaga tcatgaagaa ctttgaacga300ttcgaggtca agaccttctc cctcctgcac aacttctgtc tggtctccat ctccgcctac360atgtgcggtg gcatcctgta cgaggcttat caggccaact atggactgtt tgagaacgct420gccgatcaca ccttcaaggg tctccctatg gctaagatga tctggctctt ctacttctcc480aagatcatgg agtttgtcga caccatgatc atggtcctca agaagaacaa ccgacagatt540tcctttctgc acgtgtacca ccactcttcc atcttcacca tctggtggct ggtcaccttc600gttgctccca acggtgaagc ctacttctct gctgccctga actccttcat ccacgtcatc660atgtacggct actactttct gtctgccctg ggcttcaagc aggtgtcgtt catcaagttc720tacatcactc gatcccagat gacccagttc tgcatgatgt ctgtccagtc ttcctgggac780atgtacgcca tgaaggtcct tggccgacct ggatacccct tcttcatcac cgctctgctc840tggttctaca tgtggaccat gctcggtctc ttctacaact tttaccgaaa gaacgccaag900ctcgccaagc aggccaaggc tgacgctgcc aaggagaagg ccagaaagct ccagtaa 957<210>60<211>318<212>PRT<213>Mortierella alpina(GenBank Accession No.AX464731)
<400>60Met Glu Ser Ile Ala Pro Phe Leu Pro Ser Lys Met Pro Gln Asp Leu1 5 10 15Phe Met Asp Leu Ala Thr Ala Ile Gly Val Arg Ala Ala Pro Tyr Val20 25 30Asp Pro Leu Glu Ala Ala Leu Val Ala Gln Ala Glu Lys Tyr Ile Pro35 40 45Thr Ile Val His His Thr Arg Gly Phe Leu Val Ala Val Glu Ser Pro50 55 60Leu Ala Arg Glu Leu Pro Leu Met Asn Pro Phe His Val Leu Leu Ile65 70 75 80Val Leu Ala Tyr Leu Val Thr Val Phe Val Gly Met Gln Ile Met Lys85 90 95Asn Phe Glu Arg Phe Glu Val Lys Thr Phe Ser Leu Leu His Asn Phe100 105 110Cys Leu Val Ser Ile Ser Ala Tyr Met Cys Gly Gly Ile Leu Tyr Glu115 120 125Ala Tyr Gln Ala Asn Tyr Gly Leu Phe Glu Asn Ala Ala Asp His Thr130 135 140Phe Lys Gly Leu Pro Met Ala Lys Met Ile Trp Leu Phe Tyr Phe Ser145 150 155 160Lys Ile Met Glu Phe Val Asp Thr Net Ile Met Val Leu Lys Lys Asn165 170 175Asn Arg Gln Ile Ser Phe Leu His Val Tyr His His Ser Ser Ile Phe180 185 190Thr Ile Trp Trp Leu Val Thr Phe Val Ala Pro Asn Gly Glu Ala Tyr195 200 205Phe Ser Ala Ala Leu Asn Ser Phe Ile His Val Ile Met Tyr Gly Tyr210 215 220Tyr Phe Leu Ser Ala Leu Gly Phe Lys Gln Val Ser Phe Ile Lys Phe225 230 235 240Tyr Ile Thr Arg Ser Gln Met Thr Gln Phe cys Met Met Ser Val Gln245 250 255Ser Ser Trp Asp Met Tyr Ala Met Lys Val Leu Gly Arg Pro Gly Tyr
260 265 270Pro Phe Phe Ile Thr Ala Leu Leu Trp Phe Tyr Met Trp Thr Met Leu275 280 285Gly Leu Phe Tyr Asn Phe Tyr Arg Lys Asn Ala Lys Leu Ala Lys Gln290 295 300Ala Lys Ala Asp Ala Ala Lys Glu Lys Ala Arg Lys Leu Gln305 310 315<210>61<211>1374<212>DNA<213>Mortierella alpina<400>61atggctgccg ctccctctgt gcgaaccttt acccgagccg aggttctgaa cgctgaggct 60ctgaacgagg gcaagaagga cgctgaggct cccttcctga tgatcatcga caacaaggtg120tacgacgtcc gagagttcgt ccctgaccat cctggaggct ccgtgattct cacccacgtt180ggcaaggacg gcaccgacgt ctttgacacc tttcatcccg aggctgcttg ggagactctc240gccaacttct acgttggaga cattgacgag tccgaccgag acatcaagaa cgatgacttt300gccgctgagg tccgaaagct gcgaaccctg ttccagtctc tcggctacta cgactcctct360aaggcctact acgccttcaa ggtctccttc aacctctgca tctggggact gtccaccgtc420attgtggcca agtggggtca gacctccacc ctcgccaacg tgctctctgc tgccctgctc480ggcctgttct ggcagcagtg cggatggctg gctcacgact ttctgcacca ccaggtcttc540caggaccgat tctggggtga tctcttcgga gccttcctgg gaggtgtctg ccagggcttc600tcctcttcct ggtggaagga caagcacaac actcaccatg ccgctcccaa cgtgcatggc660gaggatcctg acattgacac ccaccctctc ctgacctggt ccgagcacgc tctggagatg720ttctccgacg tccccgatga ggagctgacc cgaatgtggt ctcgattcat ggtcctgaac780cagacctggt tctacttccc cattctctcc ttcgctcgac tgtcttggtg cctccagtcc840attctctttg tgctgcccaa cggtcaggct cacaagccct ccggagctcg agtgcccatc900tccctggtcg agcagctgtc cctcgccatg cactggacct ggtacctcgc taccatgttc960ctgttcatca aggatcctgt caacatgctc gtgtacttcc tggtgtctca ggctgtgtgc 1020ggaaacctgc tcgccatcgt gttctccctc aaccacaacg gtatgcctgt gatctccaag 1080gaggaggctg tcgacatgga tttctttacc aagcagatca tcactggtcg agatgtccat 1140cctggactgt tcgccaactg gttcaccggt ggcctgaact accagatcga gcatcacctg 1200ttcccttcca tgcctcgaca caacttctcc aagatccagc ctgccgtcga gaccctgtgc 1260aagaagtaca acgtccgata ccacaccact ggtatgatcg agggaactgc cgaggtcttc 1320tcccgactga acgaggtctc caaggccacc tccaagatgg gcaaggctca gtaa 1374
<210>62<211>457<212>PRT<213>Mortierella alpina(GenBank Accession No.AF465281)<400>62Met Ala Ala Ala Pro Ser Val Arg Thr Phe Thr Arg Ala Glu Val Leu1 5 10 15Asn Ala Glu Ala Leu Asn Glu Gly Lys Lys Asp Ala Glu Ala Pro Phe20 25 30Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Val Pro35 40 45Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp Gly50 55 60Thr Asp Val Phe Asp Thr Phe His Pro Glu Ala Ala Trp Glu Thr Leu65 70 75 80Ala Asn Phe Tyr Val Gly Asp Ile Asp Glu Ser Asp Arg Asp Ile Lys85 90 95Asn Asp Asp Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe Gln100 105 110Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Ala Tyr Tyr Ala Phe Lys Val115 120 125Ser Phe Asn Leu Cys Tle Trp Gly Leu Ser Thr Val Ile Val Ala Lys130 135 140Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Leu Ser Ala Ala Leu Leu145 150 155 160Gly Leu Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu His165 170 175His Gln Val Phe Gln Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala Phe180 185 190Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp Lys195 200 205His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro Asp210 215 220Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu Met225 230 235 240Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Arg Met Trp Ser Arg Phe
245 250 255Met Val Leu Asn Gln Thr Trp Phe Tyr Phe Pro Ile Leu Ser Phe Ala260 265 270Arg Leu Ser Trp Cys Leu Gln Ser Ile Leu Phe Val Leu Pro Asn Gly275 280 285Gln Ala His Lys Pro Ser Gly Ala Arg Val Pro Ile Ser Leu Val Glu290 295 300Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met Phe305 310 315 320Leu Phe Ile Lys Asp Pro Val Asn Met Leu Val Tyr Phe Leu Val Ser325 330 335Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn His340 345 350Asn Gly Met Pro Val Ile Ser Lys Glu Glu Ala Val Asp Met Asp Phe355 360 365Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val His Pro Gly Leu Phe370 375 380Ala Asn Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu385 390 395 400Phe Pro Ser Met Pro Arg His Asn Phe Ser Lys Ile Gln Pro Ala Val405 410 415Glu Thr Leu Cys Lys Lys Tyr Asn Val Arg Tyr His Thr Thr Gly Met420 425 430Ile Glu Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser Lys435 440 445Ala Thr Ser Lys Met Gly Lys Ala Gln450 455<210>63<211>1001<212>DNA<213>Yarrowia lipolytica<220>
<22>misc_feature<223>Promoter FBA<400>63taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc60
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag ggggggcctt120tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta180gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa240tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg300catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag360gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa420cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg480acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt540gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg600acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca660ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa720gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct780tttttccttt ctttccccac agattcgaaa tctaaactac acatcacaca atgcctgtta840ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga cgatgtccga gccgtgagta900tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat ccgaaagtcg960ctagcaacac acactctcta cacaaactaa cccagctctc c 1001<210>64<211>819<213>Thraustochytrium aureum<400>64atggccaact cctctgtctg ggacgacgtg gtcggacgag tcgagaccgg tgtcgaccag 60tggatggacg gagctaagcc ctacgctctg accgacggtc tgcccatgat ggacgtctcc120accatgctcg ccttcgaggt cggctacatg gccatgctgc tcttcggcat tcccatcatg180aagcagatgg agaagccctt cgagctgaag accatcaagc tgctccacaa cctgttcctc240ttcggactgt ccctctacat gtgcgtcgag accatccgac aggctatcct gggtggctac300aaggtcttcg gcaacgacat ggagaagggc aacgagtccc acgctcaggg catgtcccga360atcgtctacg tgttctacgt ctccaaggcc tacgagttcc tggacaccgc tatcatgatc420ctgtgcaaga agttcaacca ggtctccttc ctgcacgtgt accaccatgc caccatcttc480gccatctggt gggctattgc caagtacgct cctggtggcg acgcctactt ctccgtcatc540ctcaactcct tcgtccacac cgtcatgtac gcctactact tcttttcctc tcagggcttc600ggcttcgtca agcccatcaa gccctacatc accactctgc agatgaccca gttcatggct660atgctggtgc agtccctgta cgactacctc ttcccctgcg actaccctca ggctctggtc720cagctgctcg gcgtgtacat gatcaccctg ctcgctctgt tcggcaactt ctttgtccag780tcctacctga agaagcccaa gaagtccaag accaactaa 819
<210>65<211>272<212>PRT<213>Thraustochytrium aureum<400>65Met Ala Asn Ser Ser Val Trp Asp Asp Val Val Gly Arg Val Glu Thr1 5 10 15Gly Val Asp Gln Trp Met Asp Gly Ala Lys Pro Tyr Ala Leu Thr Asp20 25 30Gly Leu Pro Met Met Asp Val Ser Thr Met Leu Ala Phe Glu Val Gly35 40 45Tyr Met Ala Met Leu Leu Phe Gly Ile Pro Ile Met Lys Gln Met Glu50 55 60Lys Pro Phe Glu Leu Lys Thr Ile Lys Leu Leu His Asn Leu Phe Leu70 75 80Phe Gly Leu Ser Leu Tyr Met Cys Val Glu Thr Ile Arg Gln Ala Ile85 90 95Leu Gly Gly Tyr Lys Val Phe Gly Asn Asp Met Glu Lys Gly Asn Glu100 105 110Ser His Ala Gln Gly Met Ser Arg Ile Val Tyr Val Phe Tyr Val Ser115 120 125Lys Ala Tyr Glu Phe Leu Asp Thr Ala Ile Met Ile Leu Cys Lys Lys130 135 140Phe Asn Gln Val Ser Phe Leu His Val Tyr His His Ala Thr Ile Phe145 150 155 160Ala Ile Trp Trp Ala Ile Ala Lys Tyr Ala Pro Gly Gly Asp Ala Tyr165 170 175Phe Ser Val Ile Leu Asn Ser Phe Val His Thr Val Met Tyr Ala Tyr180 185 190Tyr Phe Phe Ser Ser Gln Gly Phe Gly Phe Val Lys Pro Ile Lys Pro195 200 205Tyr Ile Thr Thr Leu Gln Met Thr Gln Phe Met Ala Met Leu Val Gln210 215 220Ser Leu Tyr Asp Tyr Leu Phe Pro Cys Asp Tyr Pro Gln Ala Leu Val225 230 235 240Gln Leu Leu Gly Val Tyr Met Ile Thr Leu Leu Ala Leu Phe Gly Asn
245 250 255Phe Phe Val Gln Ser Tyr Leu Lys Lys Pro Lys Lys Ser Lys Thr Asn260 265 270<210>66<211>10<212>DNA<213>Yarrowia lipolytica<220>
<221>misc_feature<222>(8)..(8)<223>n is a,c,g,or t<400>66mammatgnhs 10
权利要求
1.编码真菌Δ12去饱和酶的分离的核酸片段,其选自由(a)分离的核酸片段,其编码如SEQ ID NO4中给出的氨基酸序列;(b)分离的核酸片段,其与(a)在下面的条件下杂交0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗涤;或者(c)分离的核酸片段,其与(a)或者(b)互补,构成的组。
2.权利要求1的分离的核酸片段,其如SEQ ID NO3中给出。
3.权利要求1的分离的核酸片段,其从串珠镰孢分离。
4.分离的核酸片段,其包含第一种核苷酸序列,该核苷酸序列编码Δ12去饱和酶,基于Clustal比对方法与具有SEQ ID NO3中给出的序列的核酸片段比较时具有至少89.2%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
5.分离的核酸片段,其包含编码至少477个氨基酸的Δ12去饱和酶的第一种核苷酸序列,所述Δ12去饱和酶基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少95%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
6.嵌合基因,其包含与适宜的调节序列有效连接的权利要求1-4任一项的分离的核酸片段。
7.经转化的宿主细胞,其包含权利要求1-4任一项的分离的核酸片段。
8.根据权利要求7的经转化的宿主细胞,其选自由细菌、植物、藻类、真菌和酵母构成的组。
9.根据权利要求8的经转化的宿主细胞,其中所述酵母是油质酵母。
10.根据权利要求9的经转化的宿主细胞,其中所述油质酵母选自由Yarrowia、假丝酵母属、红酵母属、红冬孢酵母属、隐球菌属、毛孢子菌属和油脂酵母属构成的组。
11.根据权利要求10的经转化的宿主细胞,其中Yarrowia选自由Yarrowia lipolytica ATCC #20362,Yarrowia lipolytica ATCC#8862,Yarrowia lipolytica ATCC #18944,Yarrowia lipolyticaATCC #76982和Yarrowia lipolytica LGAM S(7)1构成的组。
12.产生亚油酸的方法,其包括a)提供油质酵母,其包含(i)编码具有Δ12去饱和酶活性的多肽的分离的核酸,所述多肽当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)油酸来源;b)在其中编码具有Δ12去饱和酶活性的多肽的分离的核酸片段表达并且油酸转化成亚油酸的条件下生长步骤(a)的酵母;和c)任选回收步骤(b)的亚油酸。
13.根据权利要求12的方法,其中编码具有Δ12去饱和酶活性的多肽的分离的核酸片段分离自选自由构巢曲霉、黄曲霉、烟曲霉、Magnaporthe grisea、粗糙脉孢霉、禾本科镰孢和串珠镰孢构成的组的真菌。
14.根据权利要求13的方法,其中具有Δ12去饱和酶活性的多肽的分离的核酸片段编码选自SEQ ID NOs4、8、12、16、20、21和22的氨基酸序列。
15.根据权利要求12的方法,其中具有Δ12去饱和酶活性的多肽导致油酸向亚油酸的至少约70%的底物转化百分数。
16.根据权利要求12的方法,其中具有Δ12去饱和酶活性的多肽导致油酸向亚油酸的至少约80%的底物转化百分数。
17.具有Δ12去饱和酶活性的多肽导致油酸向亚油酸的至少约85%的底物转化百分数。
18.产生不饱和脂肪酸的方法,其包括a)提供油质酵母,其包含(i)编码具有Δ12去饱和酶活性的多肽的分离的核酸片段,所述多肽当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)编码功能ω-3/ω-6脂肪酸生物合成途径的基因;b)提供包含油酸的去饱和酶底物的来源;和c)将(a)的油质酵母与(b)的去饱和酶底物在其中产生多不饱和脂肪酸的条件下接触;和d)任选回收步骤(c)的多不饱和脂肪酸。
19.根据权利要求18的方法,其中所述多不饱和脂肪酸选自ω-3和ω-6脂肪酸。
20.根据权利要求18的方法,其中编码具有Δ12去饱和酶活性的多肽的分离的核酸片段由权利要求1-5任一项的核酸片段编码。
21.根据权利要求18的方法,其中编码具有Δ12去饱和酶活性的多肽的分离的核酸片段编码具有选自SEQ ID NOs4,8,12,16,20,21和22构成的组的氨基酸序列。
22.根据权利要求18的方法,其中编码功能ω-3/ω-6脂肪酸脂肪酸生物合成途径的基因编码选自由Δ6去饱和酶、延伸酶、Δ5去饱和酶、Δ4去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ8去饱和酶、Δ9延伸酶和Δ17a去饱和酶构成的组的酶。
23.根据权利要求18的方法,其中ω-3和ω-6脂肪酸选自亚油酸、γ-亚麻酸、二十碳二烯酸、二同型-γ-亚麻酸、花生四烯酸、α-亚麻酸、十八碳四烯酸、二十碳三烯酸、二十碳四烯酸、二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸。
24.根据权利要求12或18的方法,其中油质酵母选自由Yarrowia sp.、假丝酵母属、红酵母属、红冬孢酵母属、隐球菌、毛孢子菌和油脂酵母属构成的组。
25.根据权利要求24的方法,其中Yarrowia sp.选自由Yarrowia lipolytica ATCC #20362,Yarrowia lipolytica ATCC#8862,Yarrowia lipolytica ATCC #18944,Yarrowia lipolyticaATCC #76982和Yarrowia lipolytica LGAM S(7)1构成的组。
26.通过权利要求12或18的方法产生的微生物油。
27.得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)用权利要求1的核酸片段探测基因组文库;(b)鉴定与权利要求1的核酸片段杂交的DNA克隆;和(c)对包含步骤(b)中鉴定的基因组片段测序,其中所测序的基因组片段编码Δ12去饱和酶。
28.得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)合成对应于SEQ ID NOs3中给出的序列的部分的至少一种寡核苷酸引物;和(b)使用步骤(a)的寡核苷酸引物扩增克隆载体中存在的插入片段;其中所扩增的插入片段编码Δ12去饱和酶的氨基酸序列的一部分。
全文摘要
本发明涉及能够催化油酸向亚油酸(LA;18:2)转化的真菌Δ12脂肪酸去饱和酶。描述了编码所述去饱和酶的核酸序列、与其杂交的DNA构建体,和表达水平增加的所述去饱和酶的重组宿主微生物。本文还描述了通过过表达Δ12脂肪酸去饱和酶增加产生特定ω-3和ω-6脂肪酸的方法。
文档编号C12P7/64GK1878785SQ200480033338
公开日2006年12月13日 申请日期2004年11月12日 优先权日2003年11月12日
发明者N·S·亚达夫, Q·Q·朱, H·张 申请人:纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1