用微生物高水平生产长链二羧酸的制作方法

文档序号:14645367发布日期:2018-06-08 20:54阅读:230来源:国知局
用微生物高水平生产长链二羧酸的制作方法

技术领域

本披露属于分子生物学领域。例如,本披露涉及被基因工程化以从含有脂肪酸的底物生产长链二羧酸(LCDA)的微生物(例如酵母)。

以电子方式提交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为“CL6467WOPCT_SequenceListing_ST25”,创建于2016年7月18日,且具有480千字节大小,并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用结合在此。



背景技术:

包含十个或更多个碳原子的二羧酸可以被称为长链二羧酸(LCDA)。LCDA可用作各种合成材料(例如聚酰胺(尼龙)、聚氨酯、和聚酯)的组成单体。LCDA的其他用途包括,例如生产某些聚碳酸酯、粉末涂料、芳香剂、个人护理用品、食品添加剂、溶剂、清洁添加剂、热熔粘合剂、润滑剂、杀昆虫剂和杀真菌剂。例如,还可以将LCDA用作工程塑料的增塑剂和用作金属加工技术中的缓蚀剂。

通常在自然界未发现许多适合于执行诸如上文所述的商业应用的LCDA。某些LCDA(例如十二烷二酸(DDDA))可以经由各种合成过程进行制备。然而,生物过程(例如微生物发酵)还可以用于生产LCDA。含有油或游离脂肪酸的原料,例如可能适合用作发酵LCDA产物的底物。已经进行了用酵母生物催化剂发酵LCDA的努力(美国专利申请公开号2004/0146999、2010/0041115、2013/0267012、2014/0228586)。

脂肪酸可以在酵母中被活化用于β-氧化和其他下游途径,从而将脂肪酸从ω-氧化的途径中带走。因此,已经将一些酵母生物催化剂进行修饰以展示降低的脂肪酸活化,例如通过下调长链脂肪酰基辅酶A合成酶的表达,从而经由ω-氧化增加LCDA产物的发酵(例如,参见美国专利申请公开号2014/0228586和2013/0267012)。

尽管有上述披露内容,现在已经令人惊讶地发现,通过上调长链脂肪酰基辅酶A合成酶来增加酵母中的脂肪酸活化允许高LCDA生产。因此,本文披露了将微生物生物催化剂工程化用于高水平的LCDA生产。



技术实现要素:

在一个实施例中,本披露涉及包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,其中该微生物细胞能够从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)。

另一个实施例涉及重组微生物细胞,该重组微生物细胞包括:

(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调和/或编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,

(ii)编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,和

(iii)下调编码过氧化物酶体生物合成因子-3的内源多核苷酸序列,

其中该微生物细胞能够从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)产物。

另一种实施例涉及生产长链二羧酸(LCDA)的方法。该方法包括:a)使如在本文中披露的重组微生物细胞与含有长链脂肪酸的底物接触,其中该微生物细胞从该底物合成LCDA;并且b)任选地回收步骤(a)的LCDA。

附图和序列的简述

图1:描绘了脂质代谢途径,包括脂质代谢的脂肪酸β-氧化和ω-氧化方面。虚线/箭头表示解脂耶氏酵母(Y.lipolytica)的低或弱活性。

图2:显示用于工程化解脂耶氏酵母以从油、油衍生的脂肪酸、和/或脂肪酸酯生产LCDA的策略。

图3:来自酿酒酵母(S.cerevisiae)、解脂耶氏酵母(Y.lipolytica)和热带假丝酵母(C.tropicalis)的候选酰基辅酶A合成酶的系统树。在该图中使用的某些缩写:FAA1和FAA2分别表示酿酒酵母Faa1p和Faa2p。YA-1表示YlFaa1p。“YA-”表示“YlACoS-”。参考实例1。

图4:由菌株D0145在烧瓶试验中生产LCDA。DCA,二羧酸。参考实例2。

图5A:质粒构建体pZP2-YlACoS-3Ps(SEQ ID NO:63)。

图5B:质粒构建体pZP2-YlACoS-5Ps(SEQ ID NO:64)。

图5C:质粒构建体pZP2-YlACoS-6Ps(SEQ ID NO:65)。

图5D:质粒构建体pZP2-YlACoS-10Ps(SEQ ID NO:66)。

图5E:质粒构建体pZKL7A-FYlFAAs(SEQ ID NO:67)。

图5F:质粒构建体pZP2-YlACoS-5PS3s(SEQ ID NO:68)。

图6A:转化以过表达推定的脂肪酰基辅酶A合成酶的大肠杆菌细胞的可溶性和不可溶性部分的SDS-PAGE分析。泳道1、2、3、4、5、6:分别来自过表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、YlFAA(SEQ ID NO:36)、或YlACoS-5PS3(SEQ ID NO:56)的大肠杆菌细胞的样品。泳道C:来自用单独的pET23d载体转化的大肠杆菌细胞的样品(阴性对照)。泳道M:蛋白质标记。参考实例5。

图6B:在推定的脂肪酰基辅酶A合成酶的IPTG-诱导的过表达之前和之后大肠杆菌细胞的裂解物的SDS-PAGE。泳道1、2、3、4:分别来自过表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、或YlACoS-10P(SEQ ID NO:49)的大肠杆菌细胞的样品。泳道C:来自用单独的pET23d载体转化的大肠杆菌细胞的样品(阴性对照)。泳道M:蛋白质标记。参考实例5。

图7A:显示了描绘在表7中列出的某些菌株谱系的图。参考实例6。

图7B:显示了描绘在本文披露的某些菌株谱系的图。

图8A:质粒构建体p12_3-B-Pex3del1(SEQ ID NO:76)。

图8B:质粒构建体p70_Pox2::Leu2(SEQ ID NO:77)。

图9A:质粒构建体pZKLY-FCtR17U(SEQ ID NO:82)。

图9B:质粒构建体pZKADn-C2F1U(SEQ ID NO:87)。

图10:在2-L发酵实验中由耶氏酵母属(Yarrowia)菌株D1308生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。菱形表示在时间进程中测量的总LCDA量,并且正方形表示C16:0 LCDA的量。参考实例8。

图11A:质粒构建体pYRH213(SEQ ID NO:92)。

图11B:质粒构建体pZSCPn-3FAOBU(SEQ ID NO:98)。

图12:在2-L发酵实验中由耶氏酵母属菌株D2300生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。正方形表示在时间进程中测量的总LCDA量,并且圆圈表示C16:0 LCDA的量。参考实例9。

图13.在5-L补料分批发酵实验中由耶氏酵母属菌株D3928生产LCDA的时间进程。将棕榈酸乙酯用作LCDA生产的底物。正方形表示在时间进程中测量的总LCDA量,并且菱形表示C16:0 LCDA的量。参考实例12。

表1.核酸和蛋白质SEQ ID号的汇总

具体实施方式

本文引用的所有专利和非专利文献的披露内容以其全文通过引用结合在此。

除非另有披露,否则如本文所使用的术语“一个/一种”旨在涵盖参考特征的一个/一种或多个/多种(即至少一个/一种)。

在存在的情况下,所有范围是包含性的和可组合的,除非另有说明。例如,当列举“1至5”的范围时,所列举的范围应解释为包括“1至4”、“1至3”、“1至2”、“1至2和4至5”、“1至3和5”等范围。

本文中,术语“长链酰基辅酶A合成酶”、“长链脂肪酰基辅酶A合成酶”、“长链脂肪酸辅酶A连接酶”等可互换地使用,并且可以被缩写为“ACoS”。使用由ATP提供的能量,本文中具有EC条目6.2.1.3的ACoS酶可以催化长脂肪酸链活化为脂肪酰基辅酶A。具体地,由ACoS酶催化的反应如下(“ACoS活性”):ATP+长链羧酸酯+CoA(辅酶A)→AMP+二磷酸(PPi)+酰基辅酶A。通常,在真核细胞中ACoS酶是过氧化物酶体蛋白质。本文中编码ACoS酶的多核苷酸序列的上调导致提高量的ACoS酶的表达,该表达反过来又可用于将提高量的长链脂肪酸活化为长链酰基辅酶A。本文中ACoS酶不是“脂肪-酰基辅酶A合酶”,其具有EC条目2.3.1.86。

术语“细胞色素P450单加氧酶”,“CYP酶”等在本文中可互换地使用。本文中CYP酶可以催化二原子氧(O2)的原子转移到有机底物(通常产生醇基)上,然而其他氧原子被还原为水。CYP酶具有酶学委员会(EC)条目1.14.14.1。可以将CYP酶包含在ω-羟化酶复合物内(下文)。本文中通常将CYP酶分类为II类P450酶,其利用CPR酶用于电子传递。通常,CYP酶是膜结合的。总体上,CYP酶描述于Urlacher和Girhard(Cell[细胞]30:26-36)以及van Bogaert等人(欧洲生物化学联合会杂志(FEBS dournal)278:206-221),将其通过引用结合在此。本文中编码CYP酶的多核苷酸序列的上调导致提高量的CYP酶的表达,该表达反过来可用于形成提高量的ω-羟化酶复合物。

术语“细胞色素P450还原酶”、“NADPH-细胞色素P450还原酶”、“CPR酶”、“NADPH-高铁血红蛋白还原酶(NADPH-ferrihemoprotein reductase)”等在本文中可互换地使用。CPR酶,经由FAD(黄素腺嘌呤二核苷酸)和FMN(黄素单核苷酸)氧化还原辅因子,通过对其转移电子可以催化细胞色素P450单加氧酶中亚铁血红素-硫醇盐部分的还原。CPR酶具有EC条目1.6.2.4。可以将CPR酶包含在ω-羟化酶复合物(下文)中。通常,CPR酶是膜结合的。总体上,CPR酶功能描述于Porter和Kasper(Biochemistry[生物化学]25:1682-1687)以及Elmore和Porter(J.Biol.Chem.[生物化学杂志]277:48960-48964)中,将其通过引用结合在此。本文中编码CPR酶的多核苷酸序列的上调导致提高量的CPR酶的表达,该表达反过来可用于形成提高量的ω-羟化酶复合物。

术语“ω-羟化酶复合物”、“羟化酶复合物”、“羟化酶的酶复合物”、“CPR-P450系统”等在本文中可互换地使用。本文中ω-羟化酶复合物包含CYP酶和CPR酶,并且可以执行某些有机底物(例如烷烃、脂肪醇、脂肪醛、和脂肪酸)的ω-羟化。通常,ω-羟化酶复合物是膜结合的。在酵母的内质网(ER)膜中发生的ω-羟化典型地是ω-氧化的第一步。

术语“脂肪醇氧化酶”(FAO)、“长链脂肪酸氧化酶”、“长链醇氧化酶”、“FAO酶”等在本文中可互换地使用。FAO酶具有EC条目1.1.3.20。本文中FAO酶可以催化以下反应:脂肪醇+O2→脂肪醛+H2O2,其中脂肪醇优选地是ω-羟基长链脂肪酸,并且脂肪醛优选地是ω-醛长链脂肪酸,各自具有至少10(例如,10-24个碳)的碳链长度。通常,FAO酶是酵母细胞中的过氧化物酶体蛋白质。

术语“脂肪醇脱氢酶”(FADH)、“长链脂肪酸脱氢酶”、“ADH酶”、“FADH酶”等在本文中可互换地使用。FADH酶具有EC条目1.1.1.1。本文中FADH酶可以催化以下反应:脂肪醇+NAD+→脂肪醛+NADH,其中脂肪醇优选地是ω-羟基长链脂肪酸,并且脂肪醛优选地是ω-醛长链脂肪酸,各自具有至少10(例如,10-24个碳)的碳链长度。通常,FADH酶是酵母细胞中的内质网膜蛋白。FADH酶典型地使用Zn2+或Fe阳离子作为辅因子。

术语“脂肪醛脱氢酶”(FALDH)、“长链醛脱氢酶”、“FALDH酶”等在本文中可互换地使用。FALDH酶具有EC条目1.2.1.48。本文中FALDH酶可以催化以下反应:脂肪醛+NAD++H2O→LCDA+NADH+2H+,其中脂肪醛优选地是具有碳链长度为至少10(例如,10-24个碳)的ω-醛长链脂肪酸(在本文中进一步披露了优选的LCDA)。通常,FALDH酶是酵母细胞中的过氧化物酶体蛋白质和/或内质网膜蛋白。

本文中“工程化的LCDA生产途径”可以包括,例如:

(i)编码ACoS酶的多核苷酸序列的上调,和

(ii)编码CYP酶和/或CPR酶的多核苷酸序列的上调(即,ω-羟化酶的上调)。例如,这样的途径可以生产来自含有长链脂肪酸的底物的LCDA产物。

如本文中所使用,术语“ω-氧化”是指其中ω碳(距离脂肪酸的羧基基团最远的碳)被氧化为羧基基团的脂肪酸代谢途径(参考图1)。通过ω-羟化酶复合物进行ω-氧化的第一步,该复合物催化向ω碳中添加羟基(OH)基团,从而产生ω-羟基脂肪酸。ω-氧化的下一步包括通过脂肪醇氧化酶(例如,EC条目1.1.3.20)或脂肪醇脱氢酶(例如,EC条目1.1.1.66、1.1.1.192)将ω-羟基基团氧化为醛(C=O)基团,从而产生ω-醛脂肪酸。ω-氧化的最后一步包括通过脂肪醛脱氢酶(例如,EC条目1.2.1.3、1.2.1.48)将醛基团氧化为羧基(COOH)基团(羧酸基团),从而产生二羧酸。长链脂肪酸的ω-氧化的产物是长链二羧酸(LCDA)。

本文中术语“β-氧化”是指其中通过从脂肪酸的羧基端一次去除两个碳而分解代谢脂肪酸的过程。β-氧化典型地仅仅发生在酵母的过氧化物酶体中。过氧化物酶体是膜封闭的,是含有多种氧化还原酶的细胞质细胞器。阻断本文中脂肪酸的β-氧化可以例如通过破坏过氧化物酶体发育和/或下调一种或多种β-氧化途径酶的表达来实现。

术语“过氧化物酶体蛋白质”、“过氧化物酶体相关的蛋白质”等在本文中可互换地使用。过氧化物酶体蛋白质是参与过氧化物酶体发育和/或位于过氧化物酶体中的蛋白质,在过氧化物酶体中该蛋白质参与维持过氧化物酶体结构和/或代谢功能(例如,β-氧化途径)。本文中过氧化物酶体蛋白质的实例包括Pex蛋白质和Pox蛋白质。

术语“过氧化物酶体生物合成因子”、“过氧化物酶体生物合成因子蛋白质”、“过氧化物酶体生成蛋白(peroxin)”、“Pex蛋白质”等在本文中可互换地使用,并且是指参与过氧化物酶体生物合成和/或参与将细胞蛋白质输入过氧化物酶体中的过程的蛋白质。例如,编码Pex蛋白质的多核苷酸序列(例如基因或可读框)的缩写可以被称为“PEX”或“PEX多核苷酸”或“PEX基因”。由Distel等人(J.Cell Biol.[细胞生物学杂志]135:1-3)描述了PEX序列命名的系统。迄今为止已经在多种真核生物有机体中鉴定了至少32种不同的PEX序列。Kiel等人(Traffic[运输]7:1291-1303)鉴定了以下真菌Pex蛋白质:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex1Op、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p类和Pex26p。Hong等人(美国专利申请公开号2009/0117253)披露了在酵母中的某些PEX序列的下调增强了脂质和脂肪酸的积累。

本文中术语“PEX3”是指编码过氧化物酶体生物合成因子-3(Pex3蛋白[“Pex3p”])的多核苷酸序列。Pex3蛋白质是过氧化物酶体膜内在蛋白质,被认为在过氧化物酶体生物合成过程中在过氧化物酶体膜形成中发挥作用(例如,Baerends等人,J.Biol.Chem.[生物化学杂志]271:8887-8894;Bascom等人,Mol.Biol.Cell[细胞的分子生物学]14:939-957)。

术语“过氧化物酶体酰基辅酶A氧化酶”、“Pox蛋白质”、“Aox蛋白质”等在本文中可互换地使用,并且是指包含在过氧化物酶体中发生的β-氧化途径中的蛋白质。本文中属于EC条目EC:1.3.3.6的Pox蛋白质典型地催化以下反应:脂肪酰基辅酶A+O2→反式-2,3-脱氢酰基辅酶A+H2O2。编码Pox蛋白质的多核苷酸序列(例如基因或可读框)的缩写可以被称为例如“POX”、“POX多核苷酸”、或“POX基因”(例如,POX4)。Pox蛋白质的实例是Pox-1、-2、-3、-4、-5和-6。

术语“二酰基甘油酰基转移酶”、“酰基辅酶A:二酰基甘油酰基转移酶”、“二酰基甘油O-酰基转移酶”、“DGAT”、“DAGAT”等在本文中可互换地使用。DGAT酶具有EC条目2.3.1.20,并且将酰基辅酶A和1,2-二酰基甘油(DAG)转化为三酰基甘油(TAG)和辅酶A(从而参与TAG生物合成的最终步骤)。DGAT1和DGAT2是本文中DGATS的实例。DGAT1酶与酰基辅酶A:胆固醇酰基转移酶共享同源性(Lardizabal等人,J.Biol.Chem.[生物化学杂志]276:38862-38869)。

术语“香豆酰辅酶A合成酶”、“4-香豆酰辅酶A合成酶”、“4-香豆酸辅酶A连接酶”等在本文中可互换地使用。本文中具有EC条目6.2.1.12的香豆酰辅酶A合成酶可以催化以下反应(“香豆酰辅酶A合成酶活性”):ATP+4-香豆酸+辅酶A→AMP+二磷酸+4-香豆酰辅酶A。

如本文中所使用,术语“长链”是指至少10个碳原子的直链,并且典型地高达24个碳原子。例如,“长链脂肪酸”可以具有长度为10至24个碳原子的链。在长链脂肪酸的碳链中的碳原子数目由其脂肪族碳(CH3-、-CH2-、和=CH-(如果存在))和羧基基团碳(COOH)组成。

术语“长链二羧酸”(LCDA)、“长链二酸”、“长链二元酸”、“长链α,ω-二羧酸”、“长链脂肪二羧酸”等在本文中可互换地使用。LCDA由长链脂肪酸的完整的ω-氧化产生,并且因此具有α和ω羧酸基团(即,COOH在碳链的每个末端)。例如,本文中LCDA可以具有长度为10至24个碳原子的链。在LCDA的碳链中的碳原子数目由其脂肪族碳(-CH2-、和=CH-(如果存在))和两个羧基基团的碳组成。举例而言,C18:0 LCDA(18个碳的链长度,无双键)具有16个CH2和2个羧基基团;并且C18:1 LCDA(18个碳的链长度,1个双键)具有14个CH2、2个CH、和2个羧基基团。本文中LCDA优选地是线性的而没有任何脂肪族碳的有机侧链。

本文中“长链酰基辅酶A”或“长链脂肪酰基辅酶A”是指其中长链脂肪酸是在与辅酶A(CoA)的硫酯键中的化合物。长链酰基辅酶A是长链酰基辅酶A合成酶活性在长链脂肪酸底物上的产物。本文中“长链脂肪酸活化”是指经由长链酰基辅酶A合成酶活性在细胞中将长链脂肪酸转化为长链酰基辅酶A的过程。

术语“含有长链脂肪酸的底物”(long-chain fatty acid-comprising substrate、substrate comprising a long-chain fatty acid)、“含有长链脂肪酸的原料”等在本文中可互换地使用。如果需要,可以将本文中从生物来源或生物衍生来源获得的任何包含长链脂肪酸的底物表征为“可再生的”或“生物可再生的”。例如,含有长链脂肪酸的底物可以包含“游离的长链脂肪酸”(例如,非酯化的或非酰胺连接的长链脂肪酸)或“连接的长链脂肪酸”(例如,酯化的或酰胺连接的长链脂肪酸)。

本文中游离的长链脂肪酸的COOH基团不涉及键,例如酯键(即,游离的长链脂肪酸是非酯化的)或酰胺键(即,游离的长链脂肪酸不是酰胺连接的)。

例如,连接的长链脂肪酸可以是“酯化的长链脂肪酸”或“酰胺连接的长链脂肪酸”。

长链脂肪酸的结构可以由“X:Y”的简单的记法系统表示,其中X是脂肪酸中碳(C)原子的总数,并且Y是双键数目(如果有的话)。例如,在美国专利号7238482中提供了关于“饱和的脂肪酸”与“不饱和的脂肪酸”、“单不饱和的脂肪酸”与“多不饱和的脂肪酸”(PUFA)、以及“ω-6脂肪酸”与“ω-3脂肪酸”之间的差异的另外的信息,将该专利通过引用结合在此。

本文中“甘油酯分子”或“甘油酯”是指分别包含一个、两个、或三个脂肪酸、与甘油(分别可替代地被称为单酰基甘油、二酰基甘油、和/或三酰基甘油)酯化的单-、二-和/或三酸甘油酯。甘油酯分子是中性脂质的实例。

本文中“脂肪酸烷基酯”是指由脂肪酸的羧基基团和烷基醇的羟基基团之间的酯键形成的酯。举例而言,本文中脂肪酸烷基酯可以是脂肪酸甲基酯,例如,该脂肪酸甲基酯通过将脂肪酸与甲醇酯化而产生。脂肪酸烷基酯是脂肪酯的实例。

如本文中所使用,“酯基”是指具有与醚键邻近的羰基基团(C=O)的有机部分。酯基的通式是:

关于酯化的长链脂肪酸,在酯的上式中的R包含酯化的脂肪酸的脂肪族碳原子的直链。例如,R’基团是指烷基基团、芳基基团、或其他有机基团。酯基的实例发现于分别包含一个、两个、或三个脂肪酸、与甘油酯化的单-、二-、和三酸甘油酯。关于上式,单酸甘油酯的R’基团将是指该分子的甘油部分;二酸甘油酯或三酸甘油酯的R’基团将是指分别分别进一步与一个或两个其他脂肪酸酯连接的甘油部分。

如本文中所使用,术语“脂质”是指脂溶性的(即,亲脂性的)分子。在美国专利申请公开号2009/0093543(参见其中的表2)中提供了脂质的总体概述,将该专利通过引用结合在此。在本文中可用作含有长链脂肪酸的底物的脂质的实例包括甘油酯(例如,单-、二-和三酰基甘油);脂肪酰基(例如,脂肪酯、脂肪酰胺);甘油磷脂(例如,磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酸);鞘脂(例如,神经酰胺、磷酸-鞘脂(例如鞘磷脂)、鞘糖脂(例如神经节苷脂和脑苷脂));以及糖脂(其中脂肪酸直接连接至糖主链的化合物)(例如,酰基氨基-糖、酰基氨基-聚醣、酰基海藻糖)。含有脂肪酸的底物可以被表征(如果需要)为含有脂肪酸的脂质。

如本文中所使用,术语“油”是指在25℃为液体的脂质;油是疏水性的,并且可溶于有机溶剂。油典型地主要由三酰基甘油组成,但是还可能含有其他中性脂质,以及磷脂和游离的脂肪酸。

如本文中所使用,术语“脂肪酸馏出物”、“油的脂肪酸馏出物”等是指包含特定类型油的脂肪酸的组合物。例如,棕榈脂肪酸馏出物包含存在于棕榈油中的脂肪酸。脂肪酸馏出物通常是植物油精炼过程的副产物。

本文中的术语“细胞”是指任何类型的细胞,例如原核细胞或真核细胞。真核细胞具有细胞核和其他膜封闭的结构(细胞器),而原核细胞缺乏细胞核。本文中的“微生物细胞”(微生物)可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如,藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌细胞。本文中的原核细胞典型地是指细菌细胞。

本文中的术语“酵母”是指主要以单细胞形式存在的真菌物种。可替代地,酵母可以被称为“酵母细胞”。本文中的酵母可以被表征为例如常规酵母或非常规酵母。

本文中的术语“常规酵母”(“模式酵母”)通常是指酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)酵母物种。在某些实施例中,常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。

本文中的术语“非常规酵母”是指不是酵母属或裂殖酵母属酵母物种的任何酵母。非常规酵母描述于Non-ConventionalYeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols[遗传学、生物化学和生物技术中的非常规酵母:实践方案](K.Wolf、K.D.Breunig、G.Barth,编辑,Springer-Verlag,Berlin,Germany[德国柏林施普林格出版社],2003)以及Spencer等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]58:147-156)中,将这些文献通过引用结合在此。非常规酵母的一些菌株可能另外地(或可替代地)是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。按照这些原则,非常规酵母的定义-偏好NHEJ超过HR-被Chen等人(PLoS ONE 8:e57952,其通过引用结合在此)进一步披露。本文中优选的非常规酵母是耶氏酵母属的那些(例如解脂耶氏酵母)。

当用于描述基因或多核苷酸序列的表达时,术语“下调的”、“下调”、“破坏”、“抑制”、“失活”和“沉默”等在本文中可互换地使用,是指当多核苷酸序列的转录被降低或消除时的情况。这导致来自多核苷酸序列的RNA转录物的降低或消除,其引起源自于该多核苷酸序列的蛋白质表达的降低或消除(如果该基因包含ORF)。可替代地,下调可能是指从由多核苷酸序列产生的转录物的蛋白质翻译被降低或消除的情况。可替代地,下调可能是指由多核苷酸序列表达的蛋白质具有降低的活性的情况。在细胞中任何上述过程(转录、翻译、蛋白质活性)的降低可以是相对于合适的对照细胞中的对应过程的至少约20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。例如,下调可以由靶向事件(例如,插入缺失、敲除、敲入)引起或由使用反义或RNAi技术引起。

术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”等在本文中可互换地使用。本文中的DNA靶向可以是在特定的DNA序列(例如细胞的染色体)中引入插入缺失、敲除或敲入。在微生物细胞中靶向的方式(例如,同源重组(HR))在本领域中是已知的,并且可以相应地应用。可以在酵母细胞中进行的各种HR程序,例如披露于DNA Recombination:Methods and Protocols:1st Edition[DNA重组:方法与方案(第1版)](H.Tsubouchi,编辑,Springer-Verlag,New York[纽约施普林格出版社],2011)中,将其通过引用结合在此。可以将HR过程用于在DNA靶位点处引入例如插入缺失、敲除或敲入。

术语“敲除”、“基因敲除”、“遗传敲除”、“破坏”等在本文中可互换地使用。敲除表示已经通过DNA靶向使得本文中细胞的DNA序列部分或完全无效;例如,这样的DNA序列在敲除之前可能已编码氨基酸序列,或可能已具有调节功能(例如启动子)。例如,敲除表示用于提供DNA序列缺失的特定方式。敲除可以例如通过诱变过程(例如导致插入缺失形成)或通过特异性去除序列(例如通过HR)产生,并且减少或完全破坏DNA序列(例如编码蛋白质和/或其调节序列的多核苷酸)的功能。本文中敲除的DNA多核苷酸序列还可以被表征为被部分或完全破坏了或被部分或完全下调了。

术语“敲入”、“基因敲入”、“遗传敲入”等在本文中可互换地使用。敲入表示通过DNA靶向在细胞中的特定DNA序列上DNA序列的置换或插入。敲入的实例包括将异源性氨基酸编码序列特异性插入多核苷酸序列和/或其调节序列的蛋白质编码区中。例如,这样的插入可能导致靶向的序列的下调。例如,敲入可能通过序列的特异性插入(例如,通过HR)产生。

本文中的术语“插入缺失”是指在靶DNA序列中插入或缺失一个或多个核苷酸碱基。这样的插入或缺失可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中,插入缺失可以甚至更大,至少约20、30、40、50、60、70、80、90或100个碱基。如果在基因的可读框(ORF)中引入插入缺失,通常该插入缺失会通过产生移码突变来破坏由ORF编码的蛋白质的野生型表达。例如,使用诱变过程可以产生插入缺失。

术语“体积百分比”(percent by volume和volume percent)、“vol%”、“v/v%”等在本文中可互换地使用。在溶液中溶质的体积百分比可以使用以下公式确定:[(溶质体积)/(溶液体积)]×100%。

术语“重量百分比”(percent by weight)、“重量百分比(weight percentage,wt%)”、“重量-重量百分比(%w/w)”等在本文中可互换地使用。重量百分比是指当包含在组合物、混合物或溶液中时,材料在质量基础上的百分比。

术语“多核苷酸”、“多核苷酸序列”、“核酸序列”等在本文中可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物,其任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段组成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以按单字母名称简称如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸(分别用于RNA或DNA),“G”表示鸟苷酸或脱氧鸟苷酸(分别用于RNA或DNA),“U”表示尿苷酸(用于RNA),“T”表示脱氧胸苷酸(用于DNA),“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“W”表示A或T,并且“N”表示任何核苷酸(例如,如果提及DNA序列,N可以是A、C、T或G;如果提及RNA序列,N可以是A、C、U或G)。

如本文中所使用,术语“基因”是指从编码区表达RNA(RNA从DNA多核苷酸序列转录)的DNA多核苷酸序列,该RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA。基因可以是指单独的编码区,或者可以包括编码区上游和/或下游的调节序列(例如启动子、5’-非翻译区、3’-转录终止子区)。可替代地,编码蛋白质的编码区在本文中可以被称为“可读框”(ORF)。“天然”或“内源”的基因是指自然界中发现的具有其自身调节序列的基因;这样的基因位于宿主细胞基因组中的天然位置。“嵌合”基因是指不是天然基因的任何基因,该基因包括在自然界中未一起发现的调节序列和编码序列(即,调节区和编码区彼此是异源的)。因此,嵌合基因可以包含源自于不同来源的调节序列和编码序列,或者包含源自于同一来源但以不同于天然存在的方式排列的调节序列和编码序列。“外来”或“异源”的基因是指通过基因转移引入宿主生物体的基因。外来/异源基因可以包含插入非天然生物体内的天然基因、引入天然宿主内的新位置的天然基因、或嵌合基因。在某些实施例中本文披露的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如,转化)已经引入基因组中的基因。“密码子优化的”可读框的密码子使用频率被设计为模拟宿主细胞的优选密码子使用的频率。

本文中包含在细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会发生在这样的细胞或生物体的天然的(自然的)对应物中。

如本文中所使用,“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5’非翻译区、内含子和3’非编码区,并且该调节序列可能影响转录、加工或稳定性、和/或从该基因转录的RNA的翻译。本文中,调节序列可以包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及调节基因表达的其他元件。本文中的一个或多个调节元件可以与本文中的编码区异源。

如本文中所使用的“启动子”是指能够控制从基因转录RNA的DNA序列。通常,启动子序列位于基因的转录起始位点的上游。启动子可以全部来源于天然基因,或者由源自于在自然界发现的不同启动子的不同元件构成,或者甚至包含合成的DNA区段。在所有情况下在多数时候引起基因在细胞中表达的启动子通常称为“组成型启动子”。本文中的一个或多个启动子可以与本文中的编码区异源。

如本文中所使用,“诱导型启动子”是指在某些特定条件下(即,通过生物或非生物因子的存在或不存在)能够控制从基因转录RNA的启动子。这些类型的启动子在诱导条件不存在的条件下典型地不具有或具有非常低的活性。

如本文中所使用的“强启动子”是指可以指导每单位时间相对大量的生产性启动的启动子,和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。

如本文中所使用,术语“3’非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。

术语“盒”、“表达盒”、“基因盒”等在本文中可互换地使用。盒可以是指启动子有效地连接至编码蛋白质编码RNA或非蛋白质编码RNA的DNA序列。盒可以任选地有效地连接至3′非编码序列。本文中盒的结构可以任选地由“X::Y::Z”的简单的记法系统来表示。具体地,X描述启动子,Y描述编码序列,并且Z描述终止子(任选的);X有效地连接至Y,并且Y有效地连接至Z。

如本文中所使用,术语“表达”是指(i)从编码区转录RNA(例如,mRNA或非蛋白质编码RNA),和/或(ii)从mRNA翻译多肽。在某些实施例中,多核苷酸序列的编码区的表达可以被上调或下调。

如本文中所使用,术语“有效地连接”是指两个或更多个核酸序列的缔合,这样使得一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达时,该启动子与该编码序列有效地连接。即,编码序列处于启动子的转录控制下。例如,编码序列可以与一个(例如,启动子)或多个(例如,启动子和终止子)调节序列有效地连接。

当本文中用于表征DNA序列例如质粒、载体或构建体时,术语“重组”是指例如通过化学合成和/或通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。本文中用于制备重组构建体/载体的方法可以遵循标准的重组DNA和分子克隆技术,如由J.Sambrook和D.Raroell(Molecular Cloning:A Laboratorv Manual[分子克隆:实验手册],第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY[纽约冷泉港冷泉港实验室出版社],2001);T.J.Silhavy等人(Experiments with GeneFusions[使用基因融合的实验],冷泉港实验室出版社:冷泉港,纽约州,1984);以及F.M.Ausubel等人(Short Protocols in Molecular Biology[简明分子生物学试验方案],第5版,Current Protocols[当前试验方案],John Wiley and Sons,Inc.,NY[纽约州约翰威利父子公司],2002)描述的。

如本文中所使用,术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中披露了适合于转化的核酸分子的非限制性实例,例如质粒和线性DNA分子。本文中含有转化核酸序列的宿主生物体/细胞可以被称为例如“转基因的”、“重组的”、“转化的”、“工程化的”、被称为“转化体”、和/或被称为“被修饰用于外源基因表达”。

可以通过任何标准技术将包含本文所述的多核苷酸的构建体或载体引入细胞中。这些技术包括例如转化(例如,乙酸锂转化[Methods in Enzymology[酶学方法],194:186-187(1991)])、基因枪冲击、电穿孔和显微注射。作为一个实例,美国专利号4880741和5071764,以及Chen等人(1997,Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]48:232-235),披露了基于DNA的线性化片段针对解脂耶氏酵母的整合技术。

术语“对照细胞”和“合适的对照细胞”在本文中可互换地使用,并且可以关于已经进行了特定修饰(例如,多核苷酸的过表达、多核苷酸的下调)的细胞(即,“实验细胞”)进行参比。对照细胞可以是不具有或不表达实验细胞的特定修饰的任何细胞。因此,对照细胞可以是未转化的野生型细胞,或者可以进行遗传转化但不表达特定修饰。例如,对照细胞可以是实验细胞的直接亲本,该直接亲本细胞不具有在实验细胞中的特定修饰。可替代地,对照细胞可以是通过一个或多个世代移除的实验细胞的亲本。仍可替代地,对照细胞可以是实验细胞的同胞,该同胞不包括存在于实验细胞中的特定修饰。对照细胞可以任选地被表征为在修饰成为实验细胞之前存在的细胞。

如本文中所使用,关于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。因此,“序列同一性百分比”或“百分比同一性”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将该结果乘以100以产生序列同一性百分比。应当理解,当计算DNA序列和RNA序列之间的序列同一性时,DNA序列的T残基与RNA序列的U残基比对,并且可以被认为与其“同一”。出于确定第一和第二多核苷酸的百分比互补性的目的,可以通过确定(i)第一多核苷酸和第二多核苷酸的互补序列之间的百分比同一性(或反之亦然),例如和/或(ii)将产生规范的沃森和克里克碱基对的第一和第二多核苷酸之间的碱基百分比来获得。

可以使用在美国国家生物技术信息中心(NCRI)网站上在线获得的基本局部比对搜索工具(BLAST),例如,来测量在两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的百分比同一性。可替代地,使用Clustal算法(例如,ClustalW、ClustalV或Clustal-欧米加)可以进行序列之间的百分比同一性比对。对于使用Clustal比对方法的多重比对,默认值可以对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以是KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数可以是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。仍可替代地,序列之间的百分比同一性可以使用BLOSUM矩阵(例如,BLOSUM62),使用具有参数例如空位开始(GAP OPEN)=10、空位延伸(GAP EXTEND)=0.5、最终空位罚分(END GAP PENALTY)=错误(false)、最终空位开始(END GAP OPEN)=10、最终空位延伸(END GAP EXTEND)=0.5的EMBOSS算法(例如,needle)来执行。

本文中,与第二序列“互补”的第一序列可替代地可以被称为处于第二序列的“反义”取向。

作为某些实施例的特征,本文披露了各种多肽氨基酸序列和多核苷酸序列。可以使用或引用与本文披露的序列具有至少约70%-85%、85%-90%、或90%-95%同一性的这些序列的变体。可替代地,变体氨基酸序列或多核苷酸序列可以与本文披露的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列具有所披露的序列的相同功能/活性,或具有所披露的序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的功能/活性。典型地,本文披露的不以甲硫氨酸开始的任何多肽氨基酸序列可以在氨基酸序列的N-末端进一步包含至少一个起始甲硫氨酸。

在本文披露的蛋白质的每个氨基酸位置处的所有氨基酸残基都是实例。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即,保守的),本文中蛋白质的每个位置处的氨基酸可以是如所披露的序列中提供的或被如下保守的氨基酸残基取代(“保守的氨基酸取代”):

1.以下小脂肪族的、非极性的或轻微极性的残基可以相互取代:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);

2.以下极性的、带负电荷的残基和它们的酰胺可以相互取代:Asp(D)、Asn(N)、Glu(E)、Gln(Q);

3.以下极性的、带正电荷的残基可以相互取代:His(H)、Arg(R)、Lys(K);

4.以下脂肪族的、非极性的残基可以相互取代:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);和

5.以下大的芳香族残基可以相互取代:Phe(F)、Tyr(Y)、Trp(W)。

如本文中所使用,术语“分离的”是指已经从其天然来源完全或部分纯化的多核苷酸或多肽分子。在一些情况下,分离的多核苷酸或多肽分子是更大的组合物、缓冲系统或试剂混合物的一部分。例如,分离的多核苷酸或多肽分子能以异源方式包含在细胞或生物体内。在自然界中不会出现这样的含有异源组分和/或一种或多种遗传缺失的细胞或生物体。本文中“分离的”还可以表征合成的/人造的,和/或具有非天然存在的性质的实施例。

如本文中所使用的术语“增加”可以是指比该增加的量或活性与之进行比较的量或活性多至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、50%、100%、或200%的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”、“改进的”等在本文中可互换地使用。例如,可以将这些术语用于表征编码蛋白质的多核苷酸的“过表达”或“上调”。

具有增强的LCDA发酵能力的新的微生物生物催化剂是令人希望的。因此,本文披露的一些实施例涉及包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调。值得注意的是,这样的微生物细胞可以从含有长链脂肪酸的底物产生一种或多种长链二羧酸(LCDA)产物。

本文披露的一些实施例涉及重组微生物细胞(例如酵母细胞),包括:

(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调和/或编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,

(ii)编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,和

(iii)下调编码过氧化物酶体生物合成因子-3的内源多核苷酸序列。

值得注意的是,这样的微生物细胞可以从含有长链脂肪酸的底物产生一种或多种长链二羧酸(LCDA)产物。

通过编码该酶的多核苷酸的上调对本文中重组细胞中的ACoS酶进行上调被认为导致细胞中的长链酰基辅酶A的水平增加。此代谢产物的这样的增加反映出细胞中长链脂肪酸活化的水平增加。

在本文的某些方面,对ACoS酶的上调可以通过上调编码ACoS酶的多核苷酸序列来进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致ACoS酶的过表达。例如,可以将编码ACoS的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(将这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。应当理解,与以瞬时方式提供的多核苷酸序列相比,以稳定方式提供的多核苷酸序列典型地具有较低拷贝数。作为另一个实例,通过有效地连接至组成型启动子、强启动子、或诱导型启动子(这些启动子中的任一个可以是异源的)可以上调编码ACoS的多核苷酸序列。

可以任选地考虑,相对于合适的对照细胞,本文中的细胞中的ACoS酶的上调(例如,过表达)。例如,在本文中细胞中的ACoS酶的水平增加可以被表征为高于合适的对照细胞中的ACoS酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的ACoS酶表达之前存在的细胞(例如亲本细胞)。

例如,本文中的ACoS酶对细胞而言可以是异源的。异源的ACoS酶的实例可以是来源于与其中ACoS酶被上调的细胞的物种或菌株不同的物种或菌株的那种。

可替代地,在细胞中被上调的ACoS酶对细胞而言可以是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式,可以对天然的ACoS酶进行上调。例如,可以将对细胞而言是天然的编码该酶的多核苷酸序列(有效地连接至启动子序列[例如,异源启动子])以稳定的或瞬时的方式提供给细胞(但多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将天然存在于细胞基因组中的编码ACoS酶的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如,通过修饰含有编码ACoS酶的多核苷酸序列的基因的一种或多种调节元件(例如,启动子)实现。

在本文中的细胞中通过提供两组、三组、四组、或更多组(拷贝)编码一种或多种ACoS酶的多核苷酸序列,可以任选地将一种、两种、三种、四种、或更多种ACoS酶进行上调。例如,通过引入(i)编码相同ACoS酶的多核苷酸序列的多个拷贝,和/或(ii)编码不同ACoS酶的多核苷酸序列(例如,过表达酵母属ACoS和耶氏酵母属ACoS二者)可以将ACoS酶提供给细胞。

本文中的ACoS酶可以来源于真核生物,例如像,如下披露的任何真核生物:本文中的真核生物可以是动物、植物、真菌、或原生生物。本文中的动物可以是例如哺乳动物、鸟类、两栖动物、爬行动物、鱼类或无脊椎动物(例如,昆虫、甲壳动物、软体动物、线虫)。本文中的哺乳动物可以是例如人类或啮齿动物(例如小鼠、大鼠)。本文中的植物可以是例如单子叶植物或双子叶植物。本文中的单子叶植物的实例包括玉米、水稻、黑麦、高粱、粟、小麦、甘蔗、燕麦、大麦和柳枝稷。本文中的双子叶植物的实例包括大豆、低芥酸菜籽、苜蓿、烟草、拟南芥属(例如,拟南芥(A.thaliana)、琴叶拟南芥(A.lyrata))、向日葵、棉花、花生、番茄、马铃薯和巢菜(common vetch)(例如,箭舌豌豆)。本文中的真菌可以是例如担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)真菌。在某些实施例中真菌可以是酵母或丝状真菌。酵母的实例包括以下披露的那些物种中的任一个(例如,耶氏酵母属物种,例如解脂耶氏酵母;假丝酵母属物种,例如热带假丝酵母;酵母属物种,例如酿酒酵母),在本文的某些方面,可以将这些物种用于制备重组酵母细胞。本文中的丝状真菌的实例包括以下属的那些物种:支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、线黑粉菌属(Filibasidium)、镰孢霉属(Fusarium)、赤霉菌属(Gibberella)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梨囊鞭菌属(Piromyces)、柱顶孢霉属(Scytalidium)、裂褶菌属(Schizophyllum)、侧孢霉属(Sporotrtchum)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、和木霉属(Trichoderma)。本文中的原生生物的实例包括藻类细胞(例如,绿藻、褐藻、红藻)以及纤毛纲(Ciliata)、鞭毛纲(Mastigophora)亚门(鞭毛虫)、植鞭毛纲(Phytomastigophorea)、动鞭纲(Zoomastigophorea)、根足纲(Rhizopoda)总纲、叶足纲(Lobosea)、和真胶丝菌纲(Eumycetozoea)的原生生物。

在某些实施例中,ACoS酶可以来源于原核生物,例如像,如下披露的任何原核生物:本文中的原核生物可以是例如细菌或古细菌。细菌的实例包括那些是革兰氏阴性和革兰氏阳性的细菌。细菌的仍其他的实例包括以下属的那些:无色杆菌属(Achromobacter)、氨基酸球菌属(Acidaminococcus)、不动杆菌属(Acinetobacter)、放线杆菌属(Actinobacillus)、马杜拉放线菌属(Actinomadura)、放线菌属(Actinomyces)、气球菌属(Aerococcus)、气单胞菌属(Aeromonas)、阿菲波菌属(Afipia)、农杆菌属(Agrobacterium)、产碱杆菌属(Alcaligenes)、隐秘杆菌属(Arcanobacterium)、弓形杆菌属(Arcobacter)、芽孢杆菌属(Bacillus)(例如,枯草芽孢杆菌(B.subtilis)、巨大芽孢杆菌(B.megaterium))、拟杆菌属(Bacteroides)、巴尔通氏体属(Bartonella)、双歧杆菌属(Bifidobacterium)、嗜胆菌属(Bilophila)、博代氏杆菌属(Bordetella)、包柔氏螺旋体属(Borrelia)、布鲁氏菌属(Brucella)、鞘杆菌属(Calymmatobacterium)、弯曲菌属(Campylobacter)、心杆菌属(Cardiobacterium)、衣原体(Chlamydiae)、单胞菌属(Chryseomonas)、柠檬酸杆菌属(Citrobacter)、梭菌属(Clostridium)、丛毛单胞菌属(Comamonas)、粪球菌属(Coprococcus)、柯克斯氏体属(Coxiella)、棒状杆菌属(Corynebacterium)、爱德华菌属(Edwardsiella)、埃立克体属(Ehrlichia)、艾肯菌属(Eikenella)、肠杆菌属(Enterobacter)、肠球菌属(Enterococcus)、丹毒丝菌属(Erysipelothrix)、埃希氏杆菌属(Escherichia)(例如,大肠杆菌(E.coli))、真细菌属(Eubacterium)、爱文氏菌属(Ewingella)、黄色单胞菌属(Flavimonas)、黄杆菌属(Flavobacterium)、弗朗西斯氏菌属(Franciesella)、梭菌属(Fusobacterium)、加德纳菌属(Gardnerella)、孪生菌属(Gemella)、嗜血杆菌属(Haemophilus)、哈夫尼菌属(Hafnia)、螺杆菌属(Helicobacter)(例如,幽门螺杆菌(H.pylori))、克雷伯菌属(Klebsiella)、克吕沃氏菌属(Kluyvera)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、军团菌属(Legionella)、钩端螺旋体属(Leptospira)、纤毛菌属(Leptotrichia)、明串珠菌属(Leuconostoc)、李斯特菌属(Listeria)、巨型球菌属(Megasphaera)、分支杆菌属(Mycobacterium)、微球菌属(Micrococcus)、小多孢菌属(Micropolysporas)、动弯杆菌属(Mobiluncus)、莫拉克斯氏菌属(Moraxella)、摩根氏菌属(Morganella)、支原体(Mycoplasma)、奈瑟氏菌属(Neisseria)、诺卡氏菌(Norcardia)、拟诺卡氏菌属(Norcardiopsis)、寡源杆菌属(Oligella)、巴斯德菌属(Pasteurella)、片球菌属(Pedicoccus)、消化球菌属(Peptococcus)、消化链球菌属(Peptostreptococcus)、动性球菌属(Planococcus)、毗邻单胞菌属(Plessiomonas)、卟啉单胞菌属(Porphyromonas)、普氏菌属(Prevotella)、变形杆菌属(Proteus)、普罗维登斯菌属(Providencia)、丙酸菌属(Propionibacterium)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)、立克次氏体(Rickettsia)、罗沙利马体属(Rochalimaea)、罗氏菌属(Rothia)、瘤胃球菌属(Ruminococcus)、Sarcinia、沙门氏菌属(Salmonella)、希瓦氏菌属(Shewanella)、志贺氏菌属(Shigella)、沙雷氏菌属(Serratia)、螺菌属(Spirillum)、葡萄球菌属(Staphylococcus)、口腔球菌属(Stomatococcus)、链杆菌属(Streptobacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、高温放线菌属(Thermoactinomycetes)、密螺旋体属(Treponema)、脲原体属(Ureaplasma)、韦荣氏球菌属(Veillonella)、弧菌属(Vibrio)、威克斯氏菌属(Weeksella)、沃廉菌属(Wolinella)、黄单胞菌属(Xanthomonas)、或耶尔森氏菌属(Yersinia)。

在一些实施例中,ACoS酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。

本文中的ACoS酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的任一个氨基酸序列:XP_503862.1、XP_503608.1、XP_502959.1、AJT71734.1、NP_014962.3、AJU13255.1、NP_010931.3、EWG91402.1、EJT42092.1、NP_001153101.1、NP_001273637.1、XP_001146361.1、XP_003829365.1、XP_004033324.1、NP_001125625.1、XP_003266954.1、XP_001363547.2、XP_007422758.1、XP_002880290.1、NP_631034.1、O14975.2、CAH21295.1、CAL20709.1、AEV18827.1、CEM58466.1、CBA20954.1、BAK25224.1、AIU33175.1、CBJ51928.1、CAL93650.1、CAL09544.1、CEE01548.1、GAE33988.1、AAY81441.1、BAH81064.1、CCA89166.1、KJX89569.1、WP_023306469.1、EAZ59428.1、EFH75916.1、EFG64803.1、EFF13066.1、AIE60968.1、KJF31148.1、WP_023290211.1、AGC43083.1、GAL05408.1、KGM65079.1、CEE01549.1、KDL77549.1、BAO70678.1、EPY53810.1、EEB08740.1、GAF10677.1、CCG43904.1、WP_042268578.1、KGG85769.1、CNO88241.1、KKE73357.1、WP_001055160.1、WP_003239466.1、WP_028742371.1、WP_027325346.1、和KBA42642.1,将这些登录号通过引用结合在此。可以使用这些ACoS氨基酸序列中任一个的变体,但应当具有相应的非变体ACoS酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体ACoS酶可以包含与相应的非变体ACoS酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文的某些方面,ACoS酶可以包含SEQ ID NO:44(解脂耶氏酵母ACoS)、SEQ ID NO:49(解脂耶氏酵母ACoS)、SEQ ID NO:36(解脂耶氏酵母ACoS)、SEQ ID NO:33(酿酒酵母ACoS)、或SEQ ID NO:34(酿酒酵母ACoS)的氨基酸序列。据信,在一些其他方面,包含在表2和3(下文)中所列出的任一个氨基酸序列的蛋白质作为ACoS酶可能是有用的。可替代地,例如本文中的ACoS酶可以包含与前述ACoS酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体ACoS酶应当具有相应的非变体ACoS酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。本领域中可用的(例如,Galton和Fraser,Analytical Biochemistry[分析生物化学]28:59-64,通过引用结合在此),或如在以下实例5中披露的测量ACoS酶活性的方法可以在本文中相应地应用。

在某些实施例中,本文中的ACoS酶具有长链酰基辅酶A合成酶活性和香豆酰辅酶A合成酶活性两者。如目前披露的这样的ACoS酶的实例包含与SEQ ID NO:44或49具有至少90%同一性的氨基酸序列。

本文中的重组细胞可以任选地被表征为包括工程化的LCDA生产途径,该LCDA生产途径包含至少一种上调的ACoS酶。在一些方面,进一步包括:(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调,和/或(ii)编码细胞色素P450还原酶(CPR酶)的多核苷酸序列工程化的LCDA生产途径的上调。预期这些上调([i]和/或[ii])中的任一者或者两者导致ω-羟化酶上调。在一些其他实施例中,工程化的LCDA生产途径进一步包括(任选地除了上调[i]和/或[ii])以下各项中的至少一种:(iii)编码脂肪醇氧化酶(FAO酶)的多核苷酸序列的上调,(iv)编码脂肪醇脱氢酶(FADH酶)的多核苷酸序列的上调,和/或(v)编码脂肪醛脱氢酶(FALDH酶)的多核苷酸序列的上调。

例如,在某些实施例中重组细胞可以具有上调的CYP酶和CPR酶两者。可替代地,CYP酶可以被上调,或CPR酶可以被上调。在CYP酶被上调、但CPR酶在野生型水平上表达的实施例中,上调的ω-羟化酶复合物可能由于CYP酶上调而产生。在CPR酶被上调、但CYP酶在野生型水平上表达的实施例中,上调的ω-羟化酶复合物可能由于CPR酶上调而产生。

在本文的某些方面,CYP酶和/或CPR酶的上调可以通过编码CYP酶的多核苷酸序列的上调和/或编码CPR酶的多核苷酸序列的上调进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致CYP酶和/或CPR酶过表达。例如,可以将编码CYP的多核苷酸和/或编码CYP酶的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。应当理解,与以瞬时方式提供的多核苷酸序列相比,以稳定方式提供的多核苷酸序列典型地具有较低拷贝数。作为另一个实例,通过有效地连接至组成型启动子、强启动子、或诱导型启动子(这些启动子中的任一个可以是异源的),可以对编码CYP酶的多核苷酸序列和/或编码CPR酶的多核苷酸进行上调。

在某些实施例中,编码CYP酶的多核苷酸序列和编码CPR酶的多核苷酸序列都被上调;例如,遵循本文披露的一种过表达策略或过表达策略的组合,可以进行此上调。例如,可以使用单独的多核苷酸(例如,载体,如质粒)-一种编码CYP酶并且另一种编码CPR酶。作为另一个实例,可以使用单个多核苷酸(例如,载体,如质粒),包含每个CYP和CPR编码序列;例如,可以将每个编码序列包含在其自身的表达盒中(例如,启动子--编码序列--终止子)或包含在二顺反子表达盒内。

可以任选地考虑相对于合适的对照细胞,细胞中的CYP酶和/或CPR酶的上调(例如,过表达)。例如,在本文中细胞中的CYP酶和/或CPR酶的水平增加可以被表征为高于合适的对照细胞中的CYP酶和/或CPR酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的CYP酶和/或CPR酶表达之前存在的细胞(例如亲本细胞)。

例如,CYP酶和/或CPR酶对细胞而言可以是异源的。异源CYP酶(和/或CPR酶)的实例可以是来源于与其中CYP酶(和/或CPR酶)被上调的细胞的物种或菌株不同的物种或菌株的那种。在某些方面,CYP酶和CPR酶两者对细胞而言是异源的。细胞中的CYP酶和/或CPR酶的异源表达可以任选地被表征为向细胞提供异源ω-羟化酶复合物。异源ω-羟化酶复合物包含异源CYP酶或CPR酶中的一种、或两种。

可替代地,在细胞中被上调的CYP酶和/或CPR酶对于细胞而言可能是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式,可以对天然的CYP酶和/或CPR酶进行上调。例如,可以将对细胞而言是天然的编码这些酶的各自的多核苷酸序列(有效地连接至启动子序列)以稳定的或瞬时的方式提供给细胞(但一种或多种多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将编码如天然存在于细胞的基因组中的CYP酶和/或CPR酶的各自的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如通过修饰含有编码CYP酶或CPR酶的多核苷酸序列的一种或多种基因的一种或多种调节元件(例如,启动子)实现。

在本文中的细胞中通过分别提供两组、三组、四组、或更多组(例如拷贝)的编码CYP和/或CPR酶的多核苷酸序列,可以任选地将两种、三种、四种、或更多种ω-羟化酶复合物进行上调。例如,通过引入(i)多个拷贝的编码CYP和/或CPR酶(例如,用两个拷贝的编码CYP/CPR的序列转化酵母细胞)的多核苷酸序列以过表达相同的ω-羟化酶,和/或(ii)多组的编码不同ω-羟化酶(例如,鼠科动物和植物ω-羟化酶二者的过表达)的CYP和/或CPR酶的多核苷酸序列,可以将多种ω-羟化酶提供给细胞。在一些实施例中,本文中的细胞包含两个、或至少两个上调的编码CYP和CPR的多核苷酸序列(例如,VsCYP和VsCPR)。

在其中本文中的细胞中CYP酶和CPR酶二者被上调的实施例中,编码这些酶的多核苷酸序列可以来源于相同的物种/来源。可替代地,编码这些酶的多核苷酸序列可以来源于不同的物种/来源。实例是这样的实施例,其中CYP酶由哺乳动物序列编码,并且CPR酶由植物序列编码。另一个实例是这样的实施例,其中这些酶中的一种(例如,CYP)对细胞而言可以是异源的,并且另一种酶(例如,CPR)对细胞而言是天然的。在这些后面的实施例类型中,其中编码CYP和CPR酶的多核苷酸序列来源于不同的物种/来源,所得的ω-羟化酶(含有不同来源的CYP和CPR酶组分)可以任选地被表征为嵌合的ω-羟化酶复合物。

例如,本文中的CYP酶和/或CPR酶可以来源于真核生物或原核生物。关于ACoS酶的衍生物,上文披露了此类真核生物和原核生物的实例。在一些方面,本文中可用的具有CYP和CPR活性两者的CYP酶可以来源于原核生物。在一些实施例中,CYP酶和/或CPR酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。

在其中ω-羟化酶复合物具有来源于相同物种或菌株(例如,本文披露的任何物种/菌株,例如小鼠、大鼠、人类、植物、拟南芥属(Arabidopsis)、巢菜、酵母、假丝酵母属)的CYP和CPR酶组分的那些实施例中,这样的ω-羟化酶复合物可以任选地被表征为来自那个物种或菌株。例如,含有小鼠CYP和CPR酶组分的ω-羟化酶复合物可以任选地被表征为小鼠ω-羟化酶复合物。同样,本文中的某些ω-羟化酶复合物可以分别被表征为例如大鼠、人类、植物、拟南芥属、巢菜、或假丝酵母属ω-羟化酶复合物。

在某些实施例中,CYP酶可以来自特定的CYP酶亚家族。例如,CYP酶可以来自以下亚家族:CYP4(例如,哺乳动物CYP4(例如CYP4A1和CYP4A10))、CYP86(例如,植物CYP86)、CYP94(例如,植物CYP94(例如CYP94A1))、CYP96(例如,植物CYP96(例如CYP96A4))、CYP52(例如,酵母CYP52(例如CYP52A4和CYP52A1))、或CYP102(例如,细菌CYP102)。

本文中的CYP酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的CYP氨基酸序列中的任一个:BAA31435、BAA31437、BAA31439、P16496、P16141、Q12586、EEQ43763、P10615、P30609、P30610、AAO73952、AAO73953、AAO73954、AAO73955、AAO73958、AAO73959、NP_200694、NM_100042、NP_182121、DQ099538、AAD10204、P98188、Q9FMV7、Q9SMP5、Q9ZUX1、NP_200045、XP_002865907、NM_175837、P20816、NP_786936、AAH81771、NP_034141、和Q02928,将这些登录号通过引用结合在此。可以使用这些CYP氨基酸序列中任一个的变体,但应具有相应的非变体CYP酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体CYP酶可以包含与相应的非变体CYP酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文的某些方面,CYP酶可以包含SEQ ID NO:84(热带假丝酵母CYP)或SEQ ID NO:94(箭舌豌豆CYP)的氨基酸序列。可替代地,例如,本文中的CYP酶可以包含与前述CYP酶氨基酸序列的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体CYP酶应具有相应的非变体CYP酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。

本文中的CPR酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的CPR氨基酸序列中的任一个:X76226、P37201、X66016、X66017、NM_008898、M12516、和Z26252,将这些登录号通过引用结合在此。可以使用这些CPR氨基酸序列中任一个的变体,但应具有相应的非变体CPR酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体CPR酶可以包含与相应的非变体CPR酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文的某些方面,CPR酶可以包含SEQ ID NO:86(热带假丝酵母CPR)或SEQ ID NO:96(箭舌豌豆CPR)的氨基酸序列。可替代地,例如,本文中的CPR酶可以包含与前述CPR酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体CPR酶应具有相应的非变体CPR酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。

在本文中的一些方面,重组细胞可以包含(1)脂肪醇氧化酶(FAO酶)的上调,和/或(2)脂肪醇脱氢酶(FADH酶)的上调,和/或(3)脂肪醛脱氢酶(FALDH酶)的上调。FAO和/或FADH的上调提供了在长链脂肪酸ω-氧化途径中将ω-羟基脂肪酸上调地转化为ω-醛脂肪酸(图1和2)。FALDH的上调提供了在长链脂肪酸ω-氧化途径中将ω-醛脂肪酸上调地转化为LCDA(图1和2)。

在本文中的重组细胞中的FAO、FADH、和/或FALDH酶的上调可以是如下,例如:

(i)至少一种FAO酶被上调,

(ii)至少一种FADH酶被上调,

(iii)至少一种FALDH酶被上调,

(iv)至少一种FAO和至少一种FADH酶被上调,

(v)至少一种FAO和至少一种FALDH酶被上调,

(vi)至少一种FADH和至少一种FALDH酶被上调,或

(vii)至少一种FAO、至少一种FADH、和至少一种FALDH酶被上调。

在本文的某些方面,FAO、FADH、和/或FALDH酶的上调可以通过(1)编码FAO酶的多核苷酸序列的上调,(2)编码FADH酶的多核苷酸序列的上调,和/或(3)编码FALDH酶的多核苷酸序列的上调进行。可以通过各种方法中的一种或多种来完成这样的上调,该上调导致FAO、FADH、和/或FALDH酶过表达。例如,可以将编码FAO、FADH、和/或FALDH的多核苷酸以多拷贝瞬时地或稳定地提供给细胞(这样的多核苷酸序列有效地连接至启动子序列[例如,异源启动子])。通过向细胞提供一个或多个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、或50个拷贝)的多核苷酸可以实现以多拷贝提供多核苷酸序列。作为另一个实例,通过有效地连接至组成型启动子或强启动子(这些启动子中的任一个可以是异源的)可以对编码FAO、FADH、和/或FALDH的多核苷酸序列进行上调。在上述(i)-(vii)中所列出的任何FAO、FADH和/或FALDH酶的上调可以经由一种或多种多核苷酸序列的上调。

例如,遵循本文披露的一种过表达策略或过表达策略的组合可以进行多核苷酸序列的上调。例如,可以使用编码FAO、FADH、或FALDH酶的单独的多核苷酸(例如,载体,例如质粒)。作为另一个实例,可以使用包含两种或更多种FAO、FADH、或FALDH编码序列的单个多核苷酸(例如,载体,例如质粒);例如,可以将每个编码序列包含在其自身的表达盒中(例如,启动子--编码序列--终止子)或包含在二顺反子表达盒内。

可以任选地考虑相对于合适的对照细胞,本文中的细胞中的FAO、FADH、和/或FALDH酶的上调(例如,过表达)。例如,在本文中的细胞中的FAO、FADH、和/或FALDH酶的水平增加可以被表征为高于合适的对照细胞中的FAO、FADH、和/或FALDH酶的表达至少约5%、10%、20%、30%、40%、50%、60%、75%、80%、90%、100%、150%、200%、500%、或1000%。合适的对照细胞的实例是在其被修饰以具有上调的FAO、FADH、和/或FALDH酶表达之前存在的细胞(例如亲本细胞)。

例如,FAO、FADH、和/或FALDH酶对细胞而言可以是异源的。异源FAO、FADH、或FALDH酶的实例可以是来源于与其中FAO、FADH、和/或FALDH酶被上调的细胞的物种或菌株不同的物种或菌株的那种。在某些方面,FAO、FADH、和FALDH酶中的至少一种、两种、或全部对细胞而言是异源的(例如,在上述(i)-(vii)中所列出的任何上调)。

可替代地,在细胞中被上调的FAO、FADH、和FALDH酶对细胞而言可以是天然的。例如,使用上文关于多核苷酸序列上调所披露的任何方式可以对天然的FAO、FADH、和FALDH酶进行上调。例如,可以将对细胞而言是天然的编码这些酶的各自的多核苷酸序列(有效地连接至启动子序列[例如,异源启动子])以稳定的或瞬时的方式提供给细胞(但一种或多种多核苷酸序列的位置将位于非天然位点[即,异源位点])。作为另一个实例,可以将编码天然存在于细胞的基因组中的FAO、FADH、和/或FALDH酶的各自的多核苷酸序列进行修饰,这样使得一种或多种天然多核苷酸序列过表达。这可以例如通过修饰含有编码FAO、FADH、和/或FALDH酶的多核苷酸序列的一种或多种基因的一种或多种调节元件(例如,启动子)实现。

在本文中的细胞中通过分别提供一组、两组、三组、四组、或更多组(例如拷贝)的编码FAO、FADH、和/或FALDH酶的多核苷酸序列,可以任选地将一种、两种、三种、四种、或更多种FAO、FADH、和/或FALDH酶进行上调。例如通过引入(i)多个拷贝的编码FAO、FADH、和/或FALDH酶的多核苷酸序列(例如,用两个拷贝的编码FAO、FADH、和/或FALDH的序列转化细胞)以过表达相同的FAO、FADH、和/或FALDH酶,和/或(ii)多组编码不同的FAO、FADH、和/或FALDH酶的多核苷酸序列(例如,鼠科动物FAO和植物FAO二者的过表达)可以将多个FAO、FADH、和/或FALDH酶提供给细胞。在一些实施例中,本文中的细胞包含三种、或至少三种不同的上调的编码FAO的多核苷酸序列(例如,CtFAO1M、CcFAO1、和CcFAO2)。

例如,本文中的FAO、FADH、和/或FALDH酶可以来源于真核生物或原核生物。关于ACoS酶的衍生物,上文披露了此类真核生物和原核生物的实例。在一些实施例中,FAO、FADH、和/或FALDH酶可以被表征为是微生物的(即,来源于:细菌细胞;原生生物细胞(例如藻类细胞);真菌细胞(例如酵母细胞);眼虫藻细胞;原生藻菌(stramenopile)细胞;或卵菌细胞)。

FAO、FADH、和/或FALDH酶可以来自特定的酶家族或亚家族。例如,FAO酶可以是FAO1、FAO2、FAO3、或FAO4酶。例如,FADH酶可以是ADH、ADH1、ADH2、ADH3、FADH1、FADH2、或FADH3酶。例如,FALDH酶可以是FALDH1、FALDH2、FALDH3、或FALDH4酶。

本文中的FAO酶的氨基酸序列包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:XP_001389382、XP_002867943、Q9ZWB9、CAA18625、AEE76762.1、AEE84174、AEE85508、XP_007158083、XP_007132926、XP_003540021、XP_003554295、XP_003534338、XP_009102621、EAK93199、CAB75351、CAB75352、XP_002422236、CCG23291、CCG23293、CCE42799、CCE42800、AAS46878、AAS46879、AAS46880、CAB75353、EGV61357、XP_459506、EFX04185、JX879776、XP_001525361、CAP15762.1、KEH23950、EGW33941、和XP_001386087,将这些登录号通过引用结合在此。可以使用这些FAO氨基酸序列中任一个的变体,但应具有相应的非变体FAO酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FAO酶可以包含与相应的非变体FAO酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文的某些方面,FAO酶可以包含SEQ ID NO:100(热带假丝酵母FAO)、SEQ ID NO:102(阴沟假丝酵母FAO)、或SEQ ID NO:104(阴沟假丝酵母FAO)的氨基酸序列。可替代地,例如,本文中的FAO酶可以包含与前述FAO酶氨基酸序列中的任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体FAO酶应具有相应的非变体FAO酶参考序列的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。

本文中的FADH(ADH)酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:NP_982625、EEQ46516、EEQ42383、XM_712556、BAD12482、CD36_07850、ABD60084、ABD60084、XP_002619012、ADM08005、ADM08008、XP_003870523、AFD29185、XP_006683745、XP_002546635、XP-002550829、GU056282、GU056283、GU056286、GU056287、XP_460537、WP_024173607、AHC53987、AAP51040、XP_001524974、AAP51047、AAP51048、AAP51049、XP_001485610、ESW95881、AFH35136、KGK40277、EJS44121、AAP51043、EHN00693、EJT43588、XP_007377163、AGO10074、CAA73690、XP_001382922、XP_003686595、XP_001642939、CCH41227、XP_503282、F2Z678、XP_500127、XP_500087、和XP_503672,将这些登录号通过引用结合在此。可以使用这些氨基酸序列中任一个的变体,但应具有相应的非变体FADH(ADH)酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FADH(ADH)酶可以包含与相应的非变体FADH(ADH)酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

本文中的FALDH酶的氨基酸序列可以包含,例如,在以下基因库登录号中披露的氨基酸序列中的任一个:XP_719028、KGQ84508、KGQ98444、XP_002421401、EMG46594、EMG47675、XP_003868193、XP_002550173、XP_002550712、XP_505802、XP_500380、XP_503981、BAP82457、XP_500179、和CCH41136,将这些登录号通过引用结合在此。可以使用这些FALDH氨基酸序列中任一个的变体,但应具有相应的非变体FALDH酶参考序列的一些(例如,至少30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。这样的变体FALDH酶可以包含与相应的非变体FALDH酶参考序列的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文的某些方面,FALDH酶可以包含SEQ ID NO:91(热带假丝酵母FALDH)的氨基酸序列,或与SEQ ID NO:91具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。这样的变体FALDH酶应具有SEQ ID NO:91的FALDH酶的一些(例如,至少约30%、40%、50%、60%、70%、80%、或90%)或全部的酶活性(参见上述定义)。

在一些实施例中,重组细胞可以包括对过氧化物酶体生物合成因子(Pex蛋白质)的下调。例如,重组细胞可以包括对编码过氧化物酶体生物合成因子-3(Pex3蛋白质)的内源多核苷酸序列的下调。尽管不旨在受任何具体的理论或机制约束,但是预期Pex蛋白质下调由于损害正常的过氧化物酶体功能(例如过氧化物酶体膜功能)而导致重组细胞中的β-氧化水平被阻断或降低。预期阻断或降低的β-氧化水平导致将脂肪酸重新定向到ω-氧化途径,在该ω-氧化途径中脂肪酸用作LCDA合成的底物(参见图1和2)。在某些实施例中,可以下调一种或多种以下Pex蛋白质的表达:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p类、和Pex26p。

可以例如通过下调编码这样的蛋白质的多核苷酸序列被下调的Pex3蛋白质的实例披露于以下基因库登录号中:CAG78565(解脂耶氏酵母,本文中还披露为SEQ ID NO:107)、NP_010616.3(酿酒酵母S288)、AHY75303.1(酿酒酵母YJM993)、EWH19033.1(酿酒酵母P283)、EWG96624.1(酿酒酵母R103)、EWG87344.1(酿酒酵母R008)、EGA75546.1(酿酒酵母AWRI796)、CAB10141(粟酒裂殖酵母(S.pombe))、EKD00377.1(阿氏丝孢酵母(Trichosporon asahii))、AAC49471(多形汉逊酵母(Hansenula polymorpha))、XP_569751.1(新型隐球菌(Cryptococcus neoformans))、XP_003193133.1(格特隐球菌(Cryptococcus gattii))、XP_713871.1(白色念珠菌(Candida albicans))、CCG21168.1(拟平滑念珠菌(Candida orthopsilosis))、CAX44998.1(杜氏假丝酵母(Candida dubliniensis))、CCA39066.1(巴斯德驹田氏酵母(Komagataella pastoris))、Q6BK00.1(汉逊德巴利酵母(Debaryomyces hansenii))、O94227.1(乳酸克鲁维酵母(Kluyveromyces lactis))、Q01497.1(Ogataea angusta)、ABN67699.2(Scheffersomyces stipitis)、AAS52217.1(棉阿舒囊霉(Ashbya gossypii))、和CCH44061.1(Wickerhamomyces ciferrii),将这些登录号通过引用结合在此。应当理解,这些Pex3蛋白质中的每一种都将被靶向在表达Pex3蛋白质的相应细胞中进行下调(例如酿酒酵母Pex3蛋白质将在酿酒酵母中被下调)。

在其他实施例的细胞中,可以下调例如包含与前述Pex3蛋白质中的任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的Pex3蛋白质。例如,可以将表达Pex3蛋白质的耶氏酵母属细胞或本文中任何其他类型的酵母细胞进行修饰以具有这样的Pex3蛋白质的下调的表达,该Pex3蛋白质包含与SEQ ID NO:107具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在一些实施例中,例如使用耶氏酵母属细胞,下调的内源多核苷酸序列可能编码包含与SEQ ID NO:107具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的Pex3蛋白质。在某些其他实施例中,下调的编码Pex3蛋白质的内源多核苷酸序列包含与SEQ ID NO:106具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。

在本文的某些方面,编码Pex蛋白质(例如Pex3)的内源多核苷酸序列的下调可能归因于多核苷酸序列的突变。例如,这样的突变可以是取代、缺失、或插入。

例如,缺失可以去除(i)来自编码Pex蛋白质的可读框(即,PEX可读框)的一个或多个核苷酸,和/或(ii)位于编码Pex蛋白质的可读框的5’-端的500或1000个碱基对内的非蛋白质编码序列的一个或多个核苷酸。在某些实施例中,插入可以发生在(i)编码Pex蛋白质的可读框,或(ii)位于编码Pex蛋白质的可读框的5’-端的500或1000个碱基对内的非蛋白质编码序列中。如果需要,还可以将其他类型的突变用于下调编码Pex蛋白质的内源多核苷酸序列。例如,可以相应地使用将单个核苷酸交换为另一个(即,核苷酸取代)的一个或多个点突变。

实例6披露了缺失解脂耶氏酵母中编码Pex3蛋白质的内源多核苷酸序列。在这项工作的一个方面,通过基于同源重组的靶向去除PEX3可读框,并且将其用合适的供体DNA用URA3盒替换。此替换致使下调的(破坏的、或敲除的)包含SEQ ID NO:71的序列,该序列包含在LoxP-侧翼的URA3盒侧翼的5’-和3’-非编码PEX3同源臂序列(每个100-bp)部分。这项工作的另一个方面涉及通过表达Cre重组酶(LoxP序列之间被刺激的重组,留下一个LoxP序列)去除URA3盒,以致使下调的(破坏的、或敲除的)包含SEQ ID NO:72的序列。SEQ ID NO:72包含在一个LoxP序列侧翼的5’-和3’-非编码PEX3同源臂序列(每个100-bp)的部分。因此,本文中的某些实施例涉及包含下调的编码Pex3蛋白质的内源多核苷酸序列的重组耶氏酵母属酵母细胞,其中该下调是由于编码Pex3蛋白质的内源多核苷酸序列的破坏(敲除);此破坏(敲除)包含SEQ ID NO:71或72,或与SEQ ID NO:71或72具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。

不改变由密码子(即,沉默突变)编码的氨基酸的PEX可读框的密码子中的突变典型地不是如本文所述的下调PEX多核苷酸的突变。典型地,也不是将由密码子编码的氨基酸改变为相关氨基酸的突变,该相关氨基酸不改变Pex蛋白质的野生型功能(例如,保守性突变)。在某些实施例中,相关氨基酸具有共享结构和/或电荷的侧基,并且可以如下分组:脂肪族(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸);芳香族(苯丙氨酸、酪氨酸、色氨酸);含羟基基团(丝氨酸、苏氨酸);含硫基团(sulfur group)(半胱氨酸、甲硫氨酸);含羧酸基团(天冬氨酸、谷氨酸);含酰胺基团(天冬酰胺、谷氨酰胺)和含氨基基团(组氨酸、赖氨酸、精氨酸)。然而,下调PEX多核苷酸的转录和/或翻译(例如,通过抑制反式激活转录和/或翻译因子)的此类突变中的任一种(沉默突变或保守突变)在本文中典型地被认为是下调PEX多核苷酸的突变。

本领域普通技术人员应当理解的是,通过参考在合适的对照细胞中相应的内源Pex蛋白质编码序列,可以确定任何针对编码Pex蛋白质的内源多核苷酸序列所披露的突变可以以构成下调的突变。例如,可以将经修饰的细胞中的PEX多核苷酸序列与从中衍生出修饰的细胞的对应细胞(例如亲本细胞)的内源相应PEX多核苷酸序列进行比较。

在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码Pex蛋白质的多核苷酸序列的转录和/或翻译,编码Pex蛋白质的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的Pex蛋白质的功能,编码Pex蛋白质的内源多核苷酸序列的下调通过编码的Pex蛋白质的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。

尽管不旨在受任何具体的理论或机制约束,但是预期下调本文中的重组细胞中编码Pex蛋白质的多核苷酸序列由于损害正常的过氧化物酶体功能(例如,过氧化物酶体膜功能)导致重组细胞中阻断或降低的β-氧化水平。例如,与合适的对照细胞(例如没有经历下调的亲本细胞)相比,在包含下调的编码Pex蛋白质的多核苷酸序列的细胞中,β-氧化可以被降低至少约40%、50%、60%、70%、80%、90%、95%、或100%。

在本文的某些方面,下调编码Pex3蛋白质(例如,SEQ ID NO:107)、但不编码Pex10蛋白质(例如,SEQ ID NO:108)或Pex16蛋白质(例如,SEQ ID NO:109)的多核苷酸适合用于制备可以从含有长链脂肪酸的底物产生一种或多种LCDA产物的重组酵母细胞(例如,解脂耶氏酵母,参考实例14)。因此,在一些实施例中,酵母细胞不包含下调的编码Pex10蛋白质的多核苷酸、编码Pex16蛋白质的多核苷酸、和/或下调的编码Pex-1、-2、-4、-5、-6、-7、-8、-12、-13、-14、-15、-17、-18、-19、-20、-21、-22、或-26蛋白质的多核苷酸。本文中Pex10蛋白质或Pex16蛋白质的实例分别包含SEQ ID NO:108或SEQ ID NO:109,或与SEQ ID NO:108或SEQ ID NO:109具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在一些实施例中,编码Pex3蛋白质的多核苷酸序列的下调可以是对重组酵母细胞产生LCDA产物必需的编码过氧化物酶体蛋白质的多核苷酸序列的唯一修饰。实际上,以下实例14证明了仅具有下调的PEX3多核苷酸、但直接参与过氧化物酶体功能(例如,过氧化物酶体发育和/或维持;代谢途径,例如在过氧化物酶体中发生的β-氧化)的任何其他蛋白质不下调的重组酵母能够从含有脂肪酸的底物生产LCDA。因此,本文披露的某些实施例涉及重组酵母细胞,其中下调的PEX3多核苷酸是对编码过氧化物酶体蛋白质的多核苷酸的唯一修饰。

在某些方面,过氧化物酶体蛋白质可以是在发育和/或维持过氧化物酶体结构/功能中发挥作用的那种,例如Pex蛋白质(例如,Pex-1、-2、-3、-4、-5、-6、-7、-8、-12、-13、-14、-15、-16、-17、-18、-19、-20、-21、-22、和/或-26蛋白质)。本文中的过氧化物酶体蛋白质的另一个实例是在过氧化物酶体中进行的代谢活动(例如β-氧化)中发挥作用的那种。涉及β-氧化的过氧化物酶体蛋白质的实例包括Pox蛋白质(例如,Pox-1、-2、-3、-4、-5、-6)。在本文的一些方面,酵母细胞不具有Pex蛋白质(除了Pex3)的下调的表达,和/或Pox蛋白质的下调的表达。在一些其他方面,酵母细胞不具有以下各项的下调的表达:(i)Pox-1、-2、-3、-4、-5和-6蛋白质;(ii)Pox-1、-2、-3、-4和-5蛋白质;(iii)Pox-2、-3、-4和-5蛋白质;(iv)Pox-2、-3和-5蛋白质;或(v)Pox-4和-5蛋白质。

尽管预期Pex3蛋白质是在本文中的重组酵母细胞中下调的唯一Pex蛋白质,一种或多种另外的Pex蛋白质可以任选地被下调。本文中所列出的任何Pex-蛋白质,例如,可以被下调;这样的其他Pex蛋白质的具体实例列于美国专利申请公开号2009/0117253的表4中,该申请通过引用结合在此。例如,除了下调Pex3蛋白质之外,Pex10和/或Pex16蛋白质可以被下调。

在一些实施例中,如目前披露的重组细胞可以包括编码过氧化物酶体酰基辅酶A氧化酶(Pox蛋白质)的内源多核苷酸序列的下调。例如,Pox-1、-2、-3、-4、-5、或-6中的一种或多种可能适合用于下调。根据需要,可以使用下调这些Pox蛋白质中的任何一种、两种、三种、四种、五种或六种、或其任何组合。本文中用于下调的Pox蛋白质的组合的实例包括:(i)Pox-2、-3、-4;(ii)Pox-2、-3、-4、-5;(iii)Pox-1、-2、-3、-4、-5;(iv)Pox-1、-2、-3、-4、-5、-6;(v)Pox-1、-2、-3、-4;以及(vi)Pox-2、-3、-4、-5、-6。作为另外的实例,重组细胞可以包括酰基辅酶A氧化酶-2、-3、和/或-4酶的下调。本文中一种或多种Pox蛋白的下调可以使用目前披露的任何策略进行,该策略用于下调例如Pex3蛋白质表达(例如缺失、插入、其他类型的突变)。而且,这样的下调的水平和确定下调的方式可以遵循上文关于下调Pex3蛋白质表达所披露的相关实施例。在一些方面,重组细胞任选地不包括Pox蛋白质的下调。

本文中任何前述Pox蛋白质可以被下调,例如通过下调一种或多种编码内源Pox蛋白质的多核苷酸序列。在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码Pox蛋白质的多核苷酸序列的转录和/或翻译,编码Pox蛋白质的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的Pox蛋白质的功能,编码Pox蛋白质的内源多核苷酸序列的下调通过编码的Pox蛋白质的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。

本文中可以被下调的Pox4蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例披露于以下基因库登录号中:CAG80078(解脂耶氏酵母(Y.lipolytica),本文中还披露为SEQ ID NO:111)、P06598(热带假丝酵母(Candida tropicalis))、P05335(麦芽糖假丝酵母(Candida maltosa))、KHC52040(白色念珠菌(Candida albicans))、EIF46613(布鲁塞尔酒香酵母(Brettanomyces bruxellensis))、XP_007376225(Spathaspora passalidarum)、XP_001526373(长孢洛德酵母(Lodderomyces elongisporus))、XP_001387042(Scheffersomyces stipitis)、XP_011276972(Wickerhamomyces ciferrii)、以及ENH66703(尖孢镰刀菌(Fusarium oxysporum)),将这些登录号通过引用结合在此。应当理解,这些Pox4蛋白质中的每一种都将被靶向在表达Pox4蛋白质的相应细胞中进行下调(例如,热带假丝酵母Pox4蛋白质将在热带假丝酵母中下调)。

在某些实施例中,在细胞中可以下调包含与前述Pox4蛋白质中任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性、并且具有Pox4活性的的氨基酸序列的Pox4蛋白质。例如,可以将表达Pox4蛋白质的耶氏酵母属细胞或本文中任何其他类型的细胞进行修饰以具有这样的Pox4蛋白质的下调的表达,该Pox4蛋白质包含与SEQ ID NO:111具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

实例6披露了缺失解脂耶氏酵母中编码Pox4蛋白质的内源多核苷酸序列。在这项工作的一个方面,通过基于同源重组的靶向去除POX4可读框。该靶向致使下调的(破坏的、或敲除的)包含SEQ ID NO:74的序列,该序列包含5’和3’POX4同源臂序列的某些部分。具体地,SEQ ID NO:74的碱基位置1-455和464-957分别与某些5’和3’POx4基因序列对应。因此,本文中的某些实施例涉及包含下调的编码Pox4蛋白质的内源多核苷酸序列的重组耶氏酵母属酵母细胞,其中该下调是由于编码Pox4蛋白质的内源多核苷酸序列的破坏(敲除);此破坏(敲除)包含SEQ ID NO:74,或与SEQ ID NO:74具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的核苷酸序列。

本文中可以被下调的Pox2蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例披露于以下基因库登录号中:Q00468.1(麦芽糖假丝酵母(Candida maltosa))、P11356.3(热带假丝酵母(Candida tropicalis))、O74935.1(解脂耶氏酵母(Y.lipolytica),本文还披露为SEQ ID NO:79)、CCA37459.1(巴斯德驹田氏酵母(Komagataella pastoris))、CAX42707.1(杜氏假丝酵母(Candida dubliniensis))、和XP_721613.1(白色念珠菌(Candida albicans)),将这些登录号通过引用结合在此。应当理解,这些Pox2蛋白质中的每一种都将被靶向在表达Pox2蛋白质的相应细胞中进行下调。

在某些实施例中,在细胞中可以下调包含与前述Pox2蛋白质中任一个具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性、并且具有Pox2活性的氨基酸序列的Pox2蛋白质。例如,可以将表达Pox2蛋白质的耶氏酵母属细胞或本文中任何其他类型的细胞进行修饰以具有这样的Pox2蛋白质的下调的表达,该Pox2蛋白质包含与SEQ ID NO:79具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本文中可以被下调的Pox3蛋白质(例如通过下调编码这样的蛋白质的多核苷酸序列)的实例包含与SEQ ID NO:81具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。

在本披露的某些方面,重组细胞可以具有降低的脂质(油)合成和/或储存能力。例如(与合适的对照细胞(例如亲本细胞)相比),脂质合成和/或储存能力可以被降低至少约40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%。可以使用本领域已知的任何数量的手段,例如细胞脂质含量的色谱分析(例如气相色谱)和/或某些视觉分析(例如,脂质体的显微评估)来确定细胞中降低的脂质合成和/或储存。

具有降低的脂质合成和/或储存能力的重组细胞可以具有例如低于作为干细胞重量(DCW)百分比测量的约50%、25%、10%、5%、4%、3%、2.5%、2.0%、1.5%、或1.0%总脂质。

在一些实施例中,将二酰基甘油(DAG)转化成三酰基甘油(TAG)的内源活性可以被降低以实现脂质合成和/或储存能力的降低。这反映出TAG通常代表细胞中主要的脂质储存分子。降低TAG合成的实例可以是通过下调至少一种编码二酰基甘油酰基转移酶(DGAT)的内源多核苷酸序列。本文中用于下调的DGAT的实例包括DGAT1和DGAT2。在本文的一些方面,DGAT1和DGAT2中的任一者或二者可以被下调。可以使用本文披露的可用于下调Pex3蛋白质表达的任何策略(例如,缺失、插入、其他类型的突变)来进行DGAT1和/或DGAT2的下调。而且,这样的下调的水平和确定下调的方式可以遵循上文关于下调Pex3蛋白质表达所披露的相关实施例。

在本文中可以被下调的DGAT1酶的实例是SEQ ID NO:113,其代表解脂耶氏酵母DGATl酶。可以将表达包含与SEQ ID NO:113具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的DGAT1酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT1酶的下调的表达。作为另一个实例,可以将表达具有SEQ ID NO:113的DGAT1的至少80%、90%、95%、或100%活性的酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT1酶的下调的表达。

在本文中可以被下调的DGAT2酶的实例是SEQ ID NO:115,其代表解脂耶氏酵母DGAT2酶。可以将表达包含与SEQ ID NO:115具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列的DGAT2酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT2酶的下调的表达。作为另一个实例,可以将表达具有SEQ ID NO:115的DGAT2的至少80%、90%、95%、或100%活性的酶的耶氏酵母属细胞或本文中任何其他细胞进行修饰以具有这样的DGAT2酶的下调的表达。

本文中的DGAT酶可以被下调,例如,通过下调一种或多种编码内源DGAT的多核苷酸序列。在某些实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的编码DGAT的多核苷酸序列的转录和/或翻译,编码DGAT的内源多核苷酸序列的下调是内源多核苷酸序列的转录和/或翻译降低了至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%。在其他实施例中,相对于在合适的对照细胞(例如,亲本细胞)中对应的DGAT的功能,编码DGAT的内源多核苷酸序列的下调通过编码的DGAT的功能(例如,蛋白质定位和/或活性)降低至少约20%、30%、40%、50%、60%、70%、80%、90%、95%、或100%来反映。

如果需要,在本文的重组细胞中可以下调其他类型的酰基转移酶以实现脂质合成和/或储存能力的降低。这样的下调可以是独立于下调DGAT1和/或DGAT2酶,或者可以是除了下调DGAT1和/或DGAT2酶之外的。可以任选地被靶向用于下调的其他酰基转移酶包括卵磷脂-胆固醇酰基转移酶(EC 2.3.1.43;还被称为磷脂酰胆碱-固醇O-酰基转移酶)和磷脂:二酰基甘油酰基转移酶(PDAT,EC 2.3.1.158),这二者可以通常催化磷脂和DAG向溶血磷脂和TAG的转化。

本文中的重组微生物细胞可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如,藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌细胞。本文中的原核细胞可以是指例如细菌细胞或古细菌细胞。酵母细胞可以是如目前披露的任何酵母。例如,酵母可以是耶氏酵母属(例如,解脂耶氏酵母)、假丝酵母属(例如,热带假丝酵母)、德巴利酵母属(例如,汉逊德巴利酵母(D.hansenii))、酵母属(例如,酿酒酵母)、裂殖酵母属(例如,粟酒裂殖酵母(S.pombe))、或毕赤酵母属(Pichia)(例如,巴斯德毕赤酵母(P.pastoris))酵母物种。

本文中的真菌细胞可以是酵母(例如,下文)或任何其他真菌类型例如丝状真菌。例如,本文中的真菌可以是担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)。本文中的丝状真菌的实例包括以下属的那些:木霉属(Trichoderma)(例如,里氏木霉(T.reesei));金孢子菌属(Chrysosporium);梭孢壳属(Thielavia);脉孢菌属(Neurospora)(例如,粗糙脉孢菌(N.crassa)、好食脉孢霉(N.sitophila));丛赤壳属(Cryphonectria)(例如,栗丛赤壳菌(C.parasitica));短梗霉属(Aureobasidium)(例如,出芽短梗霉菌(A.pullulans));黑粉酵母属(Filibasidium);瘤胃壶菌属(Piromyces);隐球菌属(Cryplococcus);枝顶孢属(Acremonium);弯颈霉属(Toypocladium);柱顶孢霉(Scytalidium);裂褶菌属(Schizophyllum);侧孢霉属(Sporotrichum);青霉属(Penicillium)(例如,P.bilaiae、沙门柏干酪青霉(P.camemberti)、白青霉(P.candidum)、产黄青霉(P.chrysogenum)、扩展青霉(P.expansum)、绳状青霉(P.funiculosum)、灰绿青霉(P.glaucum)、马尔尼菲青霉(P.marneffei)、娄地青霉(P.roqueforti)、疣孢青霉(P.verrucosum)、鲜绿青霉(P.viridicatum));赤霉菌属(Gibberella)(例如,G.acuminata、燕麦赤霉菌(G.avenacea)、G.baccata、G.circinata、G.cyanogena、藤仓赤霉(G.fujikuroi)、错综赤霉(G.intricans)、虱状赤霉(G.pulicaris)、G.stilboides、G.tricmcta、玉米赤霉(G.zeae));毁丝霉属(Myceltophthora);毛霉属(Mucor)(例如,鲁西氏毛霉菌(M.rouxii)、卷枝毛霉(M.circinelloides);曲霉属(Aspergillus)(例如,黑曲霉(A.niger)、米曲霉(A.oryzae)、构巢曲霉(A.nidulans)、黄曲霉(A.flavus)、A.lentulus、土曲霉(A.terreus)、棒曲霉(A.clavatus)、烟曲霉(A.fumigatus));镰刀菌属(Fusarium)(例如,禾谷镰刀菌(F.graminearum)、尖孢镰刀菌(F.oxysporum)、F.bubigenum、腐皮镰刀菌(F.solani)、尖孢镰刀菌(F.oxysporum)、轮枝镰刀菌(F.verticillioides)、层生镰刀菌(F.proliferatum)、镶片镰刀菌(F.venenatum));以及腐质霉属(Humicola),及其无性型和有性型。必要时,可以通过Barnett和Hunter(Illustrated Genera of Imperfect Fungi,3rdEdition,Burgess Publishing Company,1972[不完全真菌的示例性属(第3版),伯吉斯出版公司,1972)]中披露通过形态来定义本文中的真菌的属和物种。

在某些方面,本文中的酵母可以是无性生殖(无性型)或有性生殖(有性型)的酵母。虽然本文中的酵母通常以单细胞形式存在,但是某些类型的这些酵母可任选地能够形成假菌丝(连接的芽殖细胞的串)。在仍另外的方面,酵母可以是单倍体或二倍体,和/或可以具有以这些倍性形式中的任一者存在的能力。

本文中酵母的实例包括常规酵母和非常规酵母。例如,本文中的常规酵母包括以下属的物种:酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae),其也被称为芽殖酵母、烘焙酵母、和/或啤酒酵母;贝酵母(S.bayanus);布拉酵母(S.boulardii);S.bulderi;S.cariocanus;S.cariocus;薛瓦酵母(S.chevalieri);S.dairenensis;葡萄酒酵母(S.ellipsoideus);真贝酵母(S.eubayanus);少孢酵母(S.exiguus);S.florentinus;克鲁弗酵母(S.kluyveri);S.martiniae;S.monacensis;S.norbensis;奇异酵母(S.paradoxus);巴氏酵母(S.pastorianus);S.spencerorum;S.turicensis;单孢酵母(S.unisporus);葡萄汁酵母(S.uvarum);S.zonatus)以及裂殖酵母属(Schizosaccharomyces)(例如,粟酒裂殖酵母(S.pombe),其也被称为裂殖酵母;S.cryophilus;S.japonicus;八孢裂殖酵母(S.octosporus))。

本文中的非常规酵母不是常规酵母,例如酵母属(例如酿酒酵母)或裂殖酵母属(例如粟酒裂殖酵母)物种。本文中的非常规酵母可以按照本领域已知的任何手段进行培兼,这些手段是例如在以下文献中所描述的:Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:PracticalProtocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer-Verlag,Berlin,Germany,2003)[遗传学、生物化学和生物技术中的非常规酵母:实践方案(K.Wolf、K.D.Breunig、G.Barth,编辑,德国柏林施普林格出版社,2003)],Yeasts in Natural and Artificial Habitats(J.F.T.Spencer,D.M.Spencer,Eds.,Springer-Verlag,Berlin,Germany,1997)[在天然和人工栖息地的酵母(J.F.T.Spencer、D.M.Spencer,编辑,德国柏林施普林格出版社,1997)]和/或Yeast Biotechnology:Diversity and Applications(T.Satyanarayana,G.Kunze,Eds.,Springer,2009)[酵母生物技术:多样性与应用(T.Satyanarayana、G.Kunze,编辑,施普林格出版社,2009)],其全部通过引用结合在此。

本文中的非常规酵母的非限制性实例包括以下属的酵母:耶氏酵母属(Yarrowia)、毕赤酵母属(Pichia)、许旺酵母属(Schwanniomyces)、克鲁维酵母属(Kluyveromyces)、Arxula、毛孢子菌属(Trichosporon)、假丝酵母属(Candida)、黑粉菌属(Ustilago)、球拟酵母属(Torulopsis)、接合酵母属(Zygosaccharomyces)、三角酵母属(Trigonopsis)、隐球菌属(Cryptococcus)、红酵母属(Rhodotorula)、法夫酵母属(Phaffia)、掷孢酵母属(Sporobolomyces)、管囊酵母属(Pachysolen)、和小丛梗孢属(Moniliella)。耶氏酵母属(Yarrowia)物种的合适的实例是解脂耶氏酵母(Y.lipolytica)。毕赤酵母属(Pichia)物种的合适的实例包括巴斯德毕赤酵母(P.pastoris)(还被称为巴斯德驹田氏酵母(Komagataella pastoris))、甲醇毕赤酵母(P.methanolica)、树干毕赤酵母(P.stipitis)、异常毕赤酵母(P.anomala)和安格斯毕赤酵母(P.angusta)(还被称为多形汉逊酵母(Hansenula polymorpha))。许旺酵母属(Schwanniomyces)物种的合适的实例包括S.castellii、S.alluvius、S.hominis、S.occidentalis、S.capriottii、S.etchellsii、多形许旺酵母(S.polymorphus)、假多形许旺酵母(S.pseudopolymorphus)、S.vanrijiae和S.yamadae。克鲁维酵母属(Kluyveromyces)物种的合适的实例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆弱克鲁维酵母(K.fragilis)、K.drosophilarum、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、K.vanudenii、K.waltii、非洲克鲁维酵母(K.africanus)和多孔克鲁维酵母(K.polysporus)。Arxula物种的合适的实例包括A.adeninivorans和A.terrestre。毛孢子菌属(Trichosporon)物种的合适的实例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capitatum)、墨汁丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适的实例包括白色念珠菌(C.albicans)、C.ascalaphidarum、C.amphixiae、南极洲假丝酵母(C.antarctica)、蜂生假丝酵母(C.apicola)、C.argentea、大西洋假丝酵母(C.atlantica)、大气假丝酵母(C.atmosphaerica)、C.blattae、C.bromeliacearum、C.carpophila、C.carvajalis、C.cerambycidarum、C.chauliodes、C.corydali、C.dosseyi、杜氏假丝酵母(C.dubliniensis)、C.ergatensis、果实假丝酵母(C.fructus)、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙念珠菌(C.guilliermondii)、希木龙假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中间假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、海洋假丝酵母(C.marina)、膜醭假丝酵母(C.membranifaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、C.oleophila、C.oregonensis、近平滑念珠菌(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶念珠菌(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.sheharea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带假丝酵母(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、C.sojae、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和C.zemplinina。黑粉菌属(Ustilago)物种的合适的实例包括燕麦散黑粉菌(U.avenae)、茭白黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉蜀黍黑粉菌(U.maydis)、裸黑粉(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适的实例包括T.geochares、T.azyma、光滑球拟酵母(T.glabrata)和白色球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适的实例包括拜耳接合酵母(Z.bailii)、双孢接合酵母(Z.bisporus)、Z.cidri、发酵型结合酵母(Z.fermentati)、Z.florentinus、Z.kombuchaensis、Z.lentus、Z.mellis、Z.microellipsoides、Z.mrakii、Z.pseudorouxii和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适的实例包括变异三角酵母(T.variabilis)。隐球菌属(Cryptococcus)物种的合适的实例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球菌(C.neoformans)、格特隐球菌(C.gattii)、单咽隐球菌(C.unlguttulatus)、C.adeliensis、C.aerius、C.albidosimilis、C.antarcticus、C.aquaticus、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球菌(C.curvatus)、C.phenolicus、C.skinneri、地生隐球酵母(C.terreus)和C.vishniacci。红酵母属(Rhodotorula)物种的合适的实例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、北美红酵母(R.americana)、R.araucariae、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、R.auriculariae、高产酵母菌株(R.bacarum)、海洋红酵母(R.benthica)、R.biourgei、R.bogoriensis、支气管红酵母(R.bronchialis)、R.buffonii、R.calyptogenae、R.chungnamensis、R.cladiensis、珊瑚藻红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、分流红酵母(R.diffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、R.fujisanensis、R.futronensis、胶状红酵母(R.gelatinosa)、冰河红酵母(R.glacialis)、粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、牧草红酵母(R.granunis)、R.grinbergsii、R.himalayensis、R.hinnulea、落组织红酵母(R.histolytica)、袋唇兰红酵母(R.hylophila)、肉色红酵母(R.incarnata)、R.ingeniosa、R.javanica、R.koishikawensis、R.lactosa、R.lamellibrachiae、喉小囊红酵母(R.laryngis)、嗜木红酵母(R.lignophila)、R.lini、R.longissima、R.ludwigii、R.lysinophila、海洋红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、粘质红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、稻红酵母(R.oryzae)、太平洋红酵母(R.pacifica)、浅红酵母(R.pallida)、R.peneaus、R.philyla、R.phylloplana、R.pilatii、果蝇红酵母(R.pilimanae)、R.pinicola、褶皱红酵母(R.plicata)、多形红酵母(R.polymorpha)、R.psychrophenolica、嗜冷红酵母(R.psychrophila)、R.pustula、R.retinophila、R.rosacea、R.rosulata、发红红酵母(R.rubefaciens)、R.rubella、变红红酵母(R.rubescens)、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、血红色红酵母(R.sanguinea)、R.sanniei、R.sartoryi、R.silvestris、R.simplex、R.sinensis、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、土地红酵母(R.terrea)、R.texensis、东京红酵母(R.tokyoensis)、R.ulzamae、香草红酵母(R.vanillica)、R.vuilleminii、欧蓍草红酵母(R.yarrowii)、R.yunnanensis和R.zsoltii。法夫酵母属(Phaffia)物种的合适的实例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适的实例包括S.alborubescens、S.bannaensis、北京掷孢酵母(S.beijingensis)、S.bischofiae、S.clavatus、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、S.elongatus、S.gracilis、S.inositophilus、S.johnsonii、S.koalae、S.magnisporus、S.novozealandicus、香掷孢酵母(S.odorus)、S.patagonicus、长生蜿掷孢酵母(S.productus)、玫瑰掷孢酵母(S.roseus)、(S.sasicola)、S.shibatanus、S.singularis、(S.subbrunneus)、匀称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、S.tsugae、克桑托斯掷孢酵母(S.xanthus)和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)和小丛梗孢属(Moniliella)物种的合适的实例分别包括嗜鞣管囊酵母(P.tannophilus)和丛梗孢酵母(M.pollinis)。本文中的非常规酵母的其他实例还包括Pseudozyma属物种(例如,S.antarctica)、Thodotorula属物种(例如,T.bogoriensis)、Wickerhamiella属物种(例如,W.domercqiae)、Starmerella属物种(例如,S.bombicola)、Debaryomyces属物种(例如,D.hansenii)、Ogataea属物种(例如,O.angusta)、和阿舒囊霉属(Ashbya)属物种(例如,棉阿舒囊霉(A.gossypii))。

在某些实施例中,酵母是耶氏酵母属酵母(例如解脂耶氏酵母)。合适的解脂耶氏酵母的实例包括可获得自美国典型培养物保藏中心(American Type Culture Collection)(ATCC,弗吉尼亚州马纳萨斯)的以下分离株:菌株名称ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。

在某些实施例中,微生物细胞是藻类细胞。例如,藻类细胞可以来自以下各项中的任一种:绿藻门(Chlorophyta)(绿藻)、红藻门(Rhodophyta)(红藻)、褐藻纲(Phaeophyceae)(褐藻)、硅藻纲(Bacillariophycaeae)(矽藻)和涡鞭藻(Dinoflagellata)(鞭毛藻类)。在其他方面,藻类细胞可以是微藻类(例如,浮游植物、微小植物、或浮游藻类)或大型藻类(巨藻、海草)。作为另外的实例,本文中的藻类细胞可以是以下属的物种:衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.reinhardtii));紫菜属(Porphyra)(紫菜);第三腕板属(Palmaria)(例如,掌形藻(P.palmata)[掌状红皮藻]);节旋藻属(Arthrospira)(例如,钝顶节旋藻(A.platensis)[螺旋藻属(spirulina)]);小球藻属(Chlorella)(例如,原始小球藻(C.protothecoides),小球藻(C.vulgaris));角叉菜属(Chondrus)(例如,皱波角叉菜(C.crispus)[爱尔兰藓]);丝囊藻属(Aphanizomenon);马尾藻属(Sargassum);海茸属(Cochayuyo);葡萄藻属(Botryococcus)(例如,布朗葡萄藻(B.braunii));杜氏藻属(Dunaliella)(例如,杜氏盐藻(D.tertiolecta)、盐生杜氏藻(D.salina));江蓠属(Gracilaria);Pleurochrysis(例如,P.carterae);纤维藻属(Ankistrodesmus);小环藻属(Cyclotella);菱板藻属(Hantzschia);微球藻属(Nannochloris);微拟球藻属(Nannochloropsis);菱形藻属(Nitzschia);褐指藻属(Phaeodactylum)(例如,三角褐指藻(P.tricornutum));栅列藻属(Scenedesmus)(例如,斜生栅藻(S.obliquus));裂丝藻属(Stichococcus);扁藻属(Tetraselmis)(例如,T.suecica);海链藻属(Thalassiosira)(例如,假微型海链藻(T.pseudonana));隐甲藻属(Crypthecodinium)(例如,寇氏隐甲藻(C.cohnii));新绿藻属(Neochloris)(例如,富油新绿藻(N.oleoabundans));或Schiochytrium。可以如例如在Thompson(Algal CellCulture.Encvclopedia of Life Support System(EOLSS),Biotechnology Vol 1[藻类细胞培养,生命支持系统百科全书(EOLSS),生物技术,第1卷],可获自eolss.net/sample-chapters互联网网站)(其通过引用结合在此)中所述的培养和/或操作藻类物种。

在某些实施例中,细菌细胞可以是球菌、杆菌、螺旋体、原生质球、原生质体等形式的细菌细胞。细菌的仍其他非限制性实例包括以下属中的那些:沙门氏菌属(Salmonella)(例如,伤寒沙门氏菌(S.typhi)、肠炎沙门氏菌(S.enteritidis))、志贺氏菌属(Shigella)(例如,痢疾志贺氏菌(S.dysenteriae))、埃希氏菌属(Fscherichia)(例如,大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、沙雷氏菌属(Serratia)、变形杆菌属(Proteus)、柠檬酸杆菌属(Citrobacter)、爱德华菌属(Edwardsiella)、普罗维登斯菌属(Providencia)、克雷伯菌属(Klebsiella)、哈夫尼菌属(Hafnia)、爱文菌属(Ewingella)、克吕沃氏菌属(Kluyvera)、摩根氏菌属(Morganella)、动性球菌属(Planococcus)、口腔球菌属(Stomatococcus)、微球菌属(Micrococcus)、葡萄球菌属(Staphylococcus)(例如,金黄色葡萄球菌(S.aureus))、弧菌属(Vibrio)(例如,霍乱弧菌(V.cholerae))、气单胞菌属(Aeromonas)、毗邻单胞菌属(Plessiomonas)、嗜血杆菌属(Actinobacillus)、巴斯德氏菌属(Pasteurella)、脲原体属(Ureaplasma)、柯克斯氏体属(Coxiella)、罗沙利马体属(Rochalimaea)、埃立克体属(Ehrlichia)、链球菌属(Streptococcus)(例如,化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、肺炎链球菌(S.pneumoniae))、肠球菌属(Enterococcus)(例如,粪肠球菌(E.faecalis))、气球菌属(Aerococcus)、兼性双球菌属(Gemella)、乳球菌属(Lactococcus)(例如,乳酸乳球菌(L.lactis))、明串珠菌属(Leuconostoc)(例如,肠膜明串珠菌(L.mesenteroides))、片球菌属(Pedicoccus)、芽孢杆菌属(Bacillus)(例如,蜡样芽孢杆菌(B.cereus)、枯草芽孢杆菌(B.subtilis)、苏云金芽孢杆菌(B.thuringiensis))、棒状杆菌属(Corynebacterium)(例如,白喉棒状杆菌(C.diphtheriae))、隐秘杆菌属(Arcanobacterium)、放线菌属(Actinomyces)、红球菌属(Rhodococcus)、李斯特菌属(Listeria)(例如,单核细胞增生李斯特菌(L.monocytogenes))、丹毒杆菌属(Erysipelothrix)、加德纳菌属(Gardnerella)、弯曲菌属(Campylobacter)、弓形杆菌属(Arcobacter)、沃廉菌属(Wolinella)、无色杆菌属(Achromobacter)、不动杆菌属(Acinetobacter)、农杆菌属(Agrobacterium)(例如,根癌农杆菌(A.tumefaciens))、产碱杆菌属(Alcaligenes)、华丽单胞菌属(Chryseomonas)、丛毛单胞菌属(Comamonas)、埃肯菌属(Eikenella)、黄色单胞菌(Flavimonas)、黄杆菌属(Flavobacterium)、摩拉克氏菌属(Moraxella)、寡源杆菌属(Oligella)、假单胞菌属(Pseudomonas)(例如,铜绿假单胞菌(P.aeruginosa))、希瓦氏菌属(Shewanella)、威克氏菌(Weeksella)、黄单胞杆菌属(Xanthomonas)、弗朗西斯氏菌属(Franciesella)、阿菲波菌属(Afipia)、巴尔通氏体属(Bartonella)、荚膜菌属(Calymmatobacterium)、心杆菌属(Cardiobacterium)、链杆菌属(Streptobacillus)、螺旋状菌属(Spirillum)、消化链球菌属(Peptostreptococcus)、消化球菌(Peptococcus)、Sarcinia、粪球菌属(Coprococcus)、瘤胃球菌属(Ruminococcus)、丙酸杆菌属(Propionibacterium)、动弯杆菌属(Mobiluncus)、双歧杆菌属(Bifidobacterium)、真细菌属(Eubacterium)、乳杆菌属(Lactobacillus)(例如,乳酸乳杆菌(L.lactis)、嗜酸乳杆菌(L.acidophilus))、罗思氏菌属(Rothia)、梭菌属(Clostridium)(例如,肉毒梭菌(C.botulinum)、产气荚膜梭菌(C.perfringens))、多形杆状菌属(Bacteroides)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、梭形杆菌属(Fusobacterium)、嗜胆菌属(Bilophila)、纤毛菌属(Leptotrichia)、沃林氏菌属(Wolinella)、氨基酸球菌属(Acidaminococcus)、巨球型菌属(Megasphaera)、韦荣氏球菌属(Veilonella)、诺卡氏菌属(Norcardia)、马杜拉放线菌属(Actinomadura)、拟诺卡氏菌属(Norcardiopsis)、链霉菌属(Streptomyces)、小多孢菌属(Micropolysporas)、高温放线菌属(Thermoactinomycetes)、密螺旋体属(Treponema)、细螺旋体属(Leptospira)、和衣原体(Chlamydiae)。

本文中的重组细胞可以从含有长链脂肪酸的底物产生一种或多种LCDA产物。例如,如目前披露的可由细胞在一定体积的培养基中产生的LCDA的总量可以是约或至少约10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L、110g/L、或120g/L(或者在5g/L与120g/L之间的任何整数)。如与合适的对照细胞(例如,亲本细胞)相比,当在相同的发酵条件下生长时,本披露的重组细胞的实例可以表现出在LCDA生产中至少10倍至1000倍的增加。例如,这样的增加可以是约或至少约10倍、25倍、50倍、75倍、100倍、150倍、200倍、250倍、300倍、400倍、500倍、750倍、或1000倍。

通过本文中的细胞产生的LCDA的同质性或异质性的程度典型地取决于向细胞供给的含有长链脂肪酸的底物的性质。例如,用包含一种类型的长链脂肪酸的底物(含有同质的脂肪酸的底物)生长的细胞可以典型地生产主要含有(例如,至少50wt%、55wt%、60wt%、65wt%、70wt%、或75wt%)与底物中的脂肪酸具有相同的碳链长度的LCDA的LCDA产物。举例而言,在一些方面,在具有仅含有棕榈酸(C16:0)或油酸(C18:1)的底物的培养基中生长的细胞典型地可以生产含有至少50wt%的分别具有碳链长度为16或18的LCDA产物的LCDA。

在一些方面,用包含超过一种类型的长链脂肪酸的底物(含有异质的脂肪酸的底物)生长的细胞可以典型地生产具有通常与底物中脂肪酸的对应的碳链长度成比例的碳链长度的LCDA产物分布。例如,本文中与大豆油生长的细胞可以生产主要含有(例如,至少50wt%、55wt%、60wt%、65wt%、70wt%、或75wt%)具有碳链长度为18的LCDA产物,该大豆油典型地包含约7%α-亚麻酸(C18:3)、约55%亚油酸(C18:2)、约23%油酸(C18:1)、约4%硬脂酸(C18:0)、和约11%棕榈酸(C16:0)的脂肪酸(因此,约89%的脂肪酸是C18,并且约11%是C16)。

例如,在本文中的LCDA可以具有10至24的碳链长度。例如,LCDA可以是C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、或C24LCDA。在一些实施例中,LCDA可以具有10-22、12-22、14-22、16-22、18-22、20-22、16-18、16-20、或16-22个碳原子的链长度。在某些方面,LCDA产物的实例是饱和的(其碳链不包含任何双键),并且在表A中列出。

表A

LCDA产物的实例

本文中的LCDA产物的仍其他的实例是不饱和的。不饱和的LCDA可以包含例如具有1、2、3、4、5、或6个双键的脂肪族碳链。本文中的不饱和的LCDA的实例包括C16:1、C16:2、C18:1、C18:2、C18:3、C18:4、C20:1、C20:2、C20:3、C20:4、C20:5、C22:1、C22:2、C22:3、C22:4、C22:5和C22:6。可以例如通过用包含具有相应的链长度和饱和/不饱和分布的脂肪酸的底物使目前披露的重组细胞生长来生产任何前述LCDA。在LCDA产物的碳链中不饱和的一个或多个位置可以对应于例如用于制备LCDA的包含脂肪酸的底物中不饱和的一个或多个位置。

例如,如在本文中含有长链脂肪酸的底物中提供的长链脂肪酸可以具有至少10的碳链长度,或10至24个碳原子的长度。长链脂肪酸可以是例如C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、或C24长链脂肪酸。在一些实施例中,长链脂肪酸可以具有10-24、12-24、14-24、16-24、18-24、20-24、10-22、12-22、14-22、16-22、18-22、20-22、16-18、16-20、或16-22个碳原子的链长度。尽管目前披露的底物包含具有碳链长度为至少10或在10至24个碳原子范围的脂肪酸,但是如果需要,底物中还可以存在其他类型的脂肪酸。例如,底物可以进一步包含一种或多种类型的具有碳链长度小于10的脂肪酸。

本文中的长链脂肪酸可以是饱和的或不饱和的。不饱和的长链脂肪酸的实例是单不饱和的脂肪酸(MUFA)(如果脂肪酸碳链中仅存在一个双键)、和多不饱和的脂肪酸(PUFA)(如果该脂肪酸碳链具有两个或更多个双键)。本文中的长链脂肪酸的实例提供在表B中。

表B

可以被包含在底物中的长链脂肪酸的实例

在一些情况下,长链脂肪酸可以是经取代的脂肪酸,只要该脂肪酸对细胞是无毒的或仅展示出低毒性。例如,脂肪酸的脂肪族链中的一个或多个氢可以任选地被卤素、乙酰基、OR、NR2、或SR基团取代,其中R独立地是H或C1-C8烷基基团。本文中经取代的脂肪酸的某些实例包括具有ω-醇或ω-醛基团的脂肪酸。

在本文的一些方面,如目前披露的含有长链脂肪酸的底物可以包含游离的长链脂肪酸。这样的脂肪酸可以任选地被表征为非酯化的长链脂肪酸或非连接的长链脂肪酸。例如,本文披露的任何长链脂肪酸(例如,如在表B中列出)可以包含在这样的底物中。含有游离的长链脂肪酸的底物的其他实例包括油的脂肪酸馏出物。脂肪酸馏出物可以是本文披露的任何油,例如植物油(例如,棕榈油脂肪酸馏出物[PFAD])。

在一些方面,如目前披露的含有长链脂肪酸的底物可以包含酯化的长链脂肪酸。例如,本文披露的任何长链脂肪酸(例如,如在表B中列出)可以包含在这样的底物中。本文中酯化的长链脂肪酸的一些实例包括长链脂肪酸,该长链脂肪酸包括在甘油酯分子或脂肪酸烷基酯内。

本文中的甘油酯分子可以是单-、二-、或三酸甘油酯、或其混合物。在那些实施例中,其中含有长链脂肪酸的底物包含二-和/或三酸甘油酯,并非其所有酯化的脂肪酸必需是长链脂肪酸。在一些实施例中,将本文中的甘油酯分子典型地作为油提供,尽管还可以将该分子作为脂肪提供。因此,含有长链脂肪酸的底物可以任选地被表征为含有一种或多种类型的油和/或脂肪。

在本文中适合使用的油(或脂肪)的实例可以来源于植物、微生物、酵母、真菌、细菌、藻类、眼虫藻、原生藻菌、动物、家禽和鱼。植物油(蔬菜油)的实例包括低芥酸菜籽油、玉米油、棕榈仁油、cheru籽油、野生杏仁油、芝麻油、高粱油、大豆油、油菜籽油、黄豆油、菜籽油、妥尔油、向日葵油、大麻籽油、橄榄油、亚麻籽油、椰子油、蓖麻油、花生油、棕榈油、芥子油、棉籽油、亚麻籽油、麻疯果油和海甘蓝油。本文中的油和脂肪的其他实例包括提炼的脂肪和油;餐厅油脂;黄色和棕色油脂;废工业炸油;牛脂;猪油;鲸油;奶中的脂肪;鱼油;藻油;酵母油;微生物油;来自酵母生物质、微生物生物质、污泥的油/脂肪;以及磷脂(例如,如在皂料中提供的)。在本文中可使用的油的仍其他实例包括(i)化石燃料衍生的油(例如来自石油基产品的油)、废机油和工业润滑剂、煤衍生的液体;(ii)作为来自石化和化学工艺的副产物产生的合成油;和(iii)来自工业废物和/或农业废物的油。

例如本文中的脂肪酸烷基酯可以包括C1-C10烷基基团,例如分别是甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基或癸基基团。实例包括脂肪酸甲基酯和脂肪酸乙基酯。然而本文中披露的任何长链脂肪酸可以被包括在脂肪酸烷基酯中,一些实例包括C16(例如,棕榈酸)和C18(例如,油酸)脂肪酸。可以将脂肪酸烷基酯的一种或其混合物与本文中的细胞一起使用用于LCDA生产。在一些方面,使用本领域中已知的任何适当的方法,可以通过本文披露的任何油或脂肪(即,脂质)与醇(例如,甲醇或乙醇)进行化学反应提供脂肪酸烷基酯的混合物来产生脂肪酸酯。这样的混合物的实例是生物柴油,该生物柴油典型地来源于蔬菜油或动物油脂(例如,牛脂)。

在一些方面,如目前披露的含有长链脂肪酸的底物可以包含酰胺连接的长链脂肪酸。本文中酰胺连接的长链脂肪酸的实例包括脂肪酰胺、酰基氨基-糖和酰基氨基-聚糖。例如,可以将本文披露的任何长链脂肪酸(例如,如在表B中列出)作为酰胺连接的长链脂肪酸提供。

据信本文中的细胞,尽管描述为从含有长链脂肪酸的底物生产LCDA,还能够从其他有机底物(例如烷烃、脂肪醇、和/或脂肪醛)生产LCDA。这样的其他底物可以具有如本文披露的针对含有长链脂肪酸的底物的相同的碳链长度。

本披露还涉及产生一种或多种长链二羧酸(LCDA)的方法。此方法包括使如本文披露的重组细胞(例如,微生物细胞,例如酵母细胞)与含有长链脂肪酸的底物接触,其中该细胞从底物合成LCDA。此方法进一步包括回收由细胞合成的LCDA的任选的步骤。

例如,可以使用上文披露的实施例或下文实例的一种或多种特征中的任一种(例如,与细胞类型有关的特征;ACoS酶序列;CYP和/或CPR酶序列;FAO、FADH、和/或FALDH酶序列;Pex3蛋白质序列等)来实践该方法。因此,可以适当地使用在上文或实例中披露的任何特征或这些特征的任意组合来表征本文的LCDA生产方法的实施例。以下的方法特征是另外的实例。

如目前披露的LCDA生产方法包括使重组细胞与含有长链脂肪酸的底物接触的步骤,其中该细胞从底物合成LCDA。这样的接触步骤可以任选地被表征为在包含含有脂肪酸的底物的培养基中孵育、培养重组细胞、和/或使重组细胞生长。如果需要,此接触步骤还可以被表征为发酵步骤(例如,从含有长链脂肪酸的底物发酵LCDA)(例如,LCDA发酵方法)。

例如,用于发酵本文中的LCDA的合适的pH(例如,使细胞与含有长链脂肪酸的底物接触的培养基的pH)是在约pH 4.0至9.0之间。在此范围的合适的pH可以是例如,约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0。在一些其他方面,可以使用在约pH 7.5至8.5的范围内的pH。有时可以将约5.5至7.5的pH用于初始生长条件。

用于发酵本文的LCDA的合适的温度(例如,使细胞与含有长链脂肪酸的底物接触的培养基的温度)可以是本文中的重组细胞展示出最佳生长的温度。合适的温度的实例包括约15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、或35℃。在一些情况下,可以使用的合适的温度范围包括25℃-32℃、28℃-32℃、和28℃-30℃。

用一种或多种含有长链脂肪酸的底物使重组细胞生长用于发酵一种或多种LCDA的时间的量可以是约或至少约36、48、60、72、84、96、108、120、132、144、156、168、180、192、204、216、228、或240小时。在某些其他实施例中,发酵时间段可以是约3-7、4-6、或5天。在与一种或多种含有长链脂肪酸的底物初始接触之前,可以任选地使细胞生长约12-24小时。

在使本文的重组微生物细胞与一种或多种这样的底物接触的培养基中,一种或多种含有长链脂肪酸的底物的浓度可以是例如约或至少约1g/L、3g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L、45g/L、50g/L、55g/L、60g/L、65g/L、70g/L、75g/L、80g/L、85g/L、90g/L、95g/L、或100g/L(或者在1g/L至100g/L之间的任何整数)。在某些其他实施例中,这样的浓度可以是约3g/L-30g/L或5g/L-20g/L。这些浓度中的任一种都可以是初始浓度(起始浓度),该浓度是刚添加到用微生物细胞发酵LCDA的培养基中之后存在的底物的浓度。例如,初始的含有长链脂肪酸的底物浓度可以任选地表征在脉冲进料或连续进料开始时的浓度。

在一些实施例中,可以使用分批、补料分批、或连续发酵过程进行LCDA发酵方法。分批发酵方法典型地包括封闭系统,其中将培养基(包括含有长链脂肪酸的底物)在过程开始时固定,并且除了在发酵期间维持pH和/或氧气水平可能需要的那些以外不进行进一步的添加/修改。本文中的补料分批过程类似于分批过程,除了对该过程进行除了在发酵期间维持pH和/或氧气水平可能需要的那些以外的一种或多种添加/修改。例如,在该过程期间可以将含有长链脂肪酸的底物添加至该系统中;这样的添加可以是交错的/周期性的或连续的。分批和补料分批培养方法在本领域中是已知的(例如,Brock,Biotechnology:A Textbook of Industrial Microbiology[生物技术:工业微生物学的教科书],第2版,(Sinauer协会:桑德兰,马萨诸塞州(Sunderland,Mass),1989;Deshpande,Appl.Biochem.Biotechnol.[应用生物化学与生物技术]36:227-234)。本文中的连续发酵过程通常可以通过向发酵容器连续添加限定的培养基来进行,同时去除等量的用于LCDA产物回收的培养体积。Brock披露了连续发酵方法。

还可以任选地应用其他培养条件来执行本文的LCDA生产方法。例如,重组细胞可以在需氧(例如微氧)或厌氧条件下培养,其中前者在一些情况下是优选的。可以向培养物任选地应用处于摇动或旋转形式的搅动,例如以约100rpm、150rpm、200rpm、300rpm、500rpm、800rpm、1000rpm、1200rpm、1500rpm、1800rpm、或2000rpm的速率。在另一个实例中,可以使用两阶段过程,其中第一阶段促进细胞增殖,并且第二阶段促进LCDA生产。在又其他实例中,可以使用如目前披露的两种、三种、四种或更多种不同类型的重组细胞(优选相同的物种、属或科)。

例如,如目前披露的LCDA生产方法中生产的一种或多种LCDA的总量可以是约或至少约10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L、110g/L、或120g/L(或者在5g/L至120g/L之间的任何整数)。这些浓度可以是如在使本文的微生物细胞与含有长链脂肪酸的底物接触的培养基中和在任何上文披露的生长阶段测量的。在本文中的某些LCDA生产方法中LCDA生产的速率可以是约或至少约0.10g/L/小时、0.15g/L/小时、0.20g/L/小时、0.25g/L/小时、0.30g/L/小时、0.35g/L/小时、0.40g/L/小时、0.45g/L/小时、0.50g/L/小时、0.55g/L/小时、0.60g/L/小时、0.65g/L/小时、0.70g/L/小时、0.75g/L/小时、0.80g/L/小时、0.85g/L/小时、0.90g/L/小时、0.95g/L/小时、1.00g/L/小时、1.05g/L/小时、1.10g/L/小时、1.15g/L/小时、或1.20g/L/小时。在某些方面,导致任何LCDA输出量的这些测量的微生物细胞的起始量可以是以下实例中测试的那些量中的任何量。

可以任选地分离在本文中的LCDA生产方法中由细胞合成的一种或多种LCDA产物。可以应用用于从发酵液中分离LCDA的在本领域中已知的任何方法,例如像在美国专利申请公开号2014/0228587和2012/0253069中披露的方法,将这些申请通过引用结合在此。而且,例如可以使用在以下实例中披露的任何LCDA分离方法。

在本文中的LCDA合成方法期间,一种或多种ω-羟基长链脂肪酸和/或ω-醛长链脂肪酸作为中间物产生(参考图1和2)。因此,在本披露的某些可替代的实施例中,可以将合成LCDA的方法任选地表征为生产ω-羟基长链脂肪酸和/或ω-醛长链脂肪酸的方法。例如,这样的一种或多种LCDA代谢产物可以具有对应于任何目前披露的LCDA和长链脂肪酸的碳数目。

本文披露的组合物和方法的非限制性实例包括:

1.一种包括工程化的LCDA生产途径的重组微生物细胞,该LCDA生产途径包括编码长链酰基辅酶A合成酶(ACoS酶)的多核苷酸序列的上调,其中该微生物细胞可以从含有长链脂肪酸的底物生产一种或多种长链二羧酸(LCDA)。

2.如实施例1所述的重组微生物细胞,其中该ACoS酶包含与SEQ ID NO:44、49、36、33、或34具有至少90%同一性的氨基酸序列。

3.如实施例1或2所述的重组微生物细胞,其中该ACoS酶具有长链酰基辅酶A合成酶活性和香豆酰辅酶A合成酶活性两者。

4.如实施例3所述的重组微生物细胞,其中该ACoS酶包含与SEQ ID NO:44或49具有至少90%同一性的氨基酸序列。

5.如实施例1、2、3、或4所述的重组微生物细胞,其中该工程化的LCDA生产途径进一步包括以下特征中的一种或多种:

(i)编码细胞色素P450单加氧酶(CYP酶)的多核苷酸序列的上调,

(ii)编码细胞色素P450还原酶(CPR酶)的多核苷酸序列的上调,

(iii)编码脂肪醇氧化酶(FAO酶)的多核苷酸序列的上调,

(iv)编码脂肪醇脱氢酶(FADH酶)的多核苷酸序列的上调,和/或

(v)编码脂肪醛脱氢酶(FALDH酶)的多核苷酸序列的上调。

6.如实施例5所述的重组微生物细胞,其中编码该CYP酶的多核苷酸序列和编码该CPR酶的多核苷酸序列之一或两者被上调。

7.如实施例1、2、3、4、5、或6所述的重组微生物细胞,其中该微生物细胞进一步包括编码过氧化物酶体生物合成因子的内源多核苷酸序列的下调。

8.如实施例7所述的重组微生物细胞,其中该过氧化物酶体生物合成因子是过氧化物酶体生物合成因子-3。

9.如实施例1、2、3、4、5、6、7、或8所述的重组微生物细胞,其中该微生物细胞进一步包括编码过氧化物酶体酰基辅酶A氧化酶的内源多核苷酸序列的下调。

10.如实施例9所述的重组微生物细胞,其中该过氧化物酶体酰基辅酶A氧化酶是过氧化物酶体酰基辅酶A氧化酶-2、-3、和/或-4。

11.如实施例1、2、3、4、5、6、7、8、9、或10所述的重组微生物细胞,其中该微生物细胞具有降低的脂质合成和/或储存能力。

12.如实施例11所述的重组微生物细胞,其中该降低的脂质合成和储存能力是由于编码二酰基甘油酰基转移酶(DGAT酶)的至少一种内源多核苷酸序列的下调。

13.如实施例1、2、3、4、5、6、7、8、9、10、11、或12所述的重组微生物细胞,其中该微生物细胞是酵母细胞。

14.如实施例13所述的重组微生物细胞,其中该酵母细胞是耶氏酵母属细胞。

15.如实施例1、2、3、4、5、6、7、8、9、10、11、12、13、或14所述的重组微生物细胞,其中该LCDA产物具有10至24个碳原子的链长度,和/或该含有长链脂肪酸的底物包含游离的长链脂肪酸或酯化的长链脂肪酸。

16.一种生产长链二羧酸(LCDA)的方法,该方法包括:a)使实施例1、2、3、4、5、6、7、8、9、10、11、12、13、14、或15所述的重组微生物细胞与含有长链脂肪酸的底物接触,其中该微生物细胞从该底物合成LCDA;并且b)任选地回收步骤(a)的LCDA。

17.如实施例16所述的方法,其中该微生物细胞是酵母细胞,并且任选地其中该酵母细胞是耶氏酵母属细胞。

实例

本披露在以下实例中进一步示例。应该理解,这些实例尽管说明了本文的某些优选方面,但仅是以例证的方式给出的。从上述论述和这些实例中,本领域的技术人员可确定所披露的实施例的必要特征,并且在不脱离其精神和范围的情况下,可进行各种变化和修改以使所披露的实施例适应多种用途和条件。

一般方法

在实例中使用的标准重组DNA和分子克隆技术是在本领域中熟知的,并且由例如:1)J.Sambrook和D.Russell(Molecular Cloning:A LaboratoryManual[分子克隆:实验室手册],第3版,冷泉港实验室出版社:冷泉港,纽约州,2001);2)T.J.Silhavy等人(Experiments with Gene Fusions[使用基因融合的实验],冷泉港实验室出版社:冷泉港,纽约州,1984);以及3)F.M.Ausubel等人(Short Protocols in Molecular Biology[简明分子生物学试验方案],第5版,Current Protocols[当前试验方案],John Wiley and Sons,Inc.,NY[纽约州约翰威利父子公司],2002)进行了描述。

适合用于微生物培养物的维持和生长的材料和方法是本领域熟知的。如在例如Manual of Methods for General Bacteriology[普通细菌学的方法手册](P.Gerhardt、R.G.E.Murray、R.N.Costilow、E.W.Nester、W.A.Wood、N.R.Krieg和G.B.Phillips,编辑,美国微生物学会:华盛顿,1994);和/或Thomas D.Brock,在Biotechnology:A Textbook of Industrial Microbiology[生物技术:工业微生物学的教科书],第2版(Sinauer协会:桑德兰,马萨诸塞州(Sunderland,MA),1989)中列出的可以发现在以下实例中适合使用的技术。除非另外说明,所有的试剂、限制性内切酶和细胞生长材料获得自DIFCO实验室(底特律,密歇根州)、新英格兰生物学实验室有限公司(New England Biolabs,Inc.)(贝弗利,马萨诸塞州)、GIBCO/BRL(盖瑟斯堡,马里兰州)、或西格玛奥德里奇公司(Sigma-Aldrich)(圣路易斯,密苏里州)。使大肠杆菌菌株典型地在Luria Bertani(LB)平板上在37℃生长。

根据标准方法(例如,Sambrook和Russell)来进行一般的分子克隆。由西格玛-吉诺思公司(Sigma-Genosys)(斯普林,德克萨斯州(Spring,TX))合成寡核苷酸。除非另外说明,将单独的PCR扩增反应在50-μl总体积中进行,包括:PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH 8.75)、2mM MgSO4、0.1%Triton X-100)、100μg/mL BSA、200μM的每种脱氧核糖核苷三磷酸、10pmole的每种引物、以及1μl的Pfu DNA聚合酶(安捷伦科技公司(Agilent Technologies),圣克拉拉,加利福尼亚州)。使用安捷伦科技公司的定点诱变试剂盒,按照制造商的说明书进行定点诱变。当PCR或定点诱变涉及亚克隆时,对构建体进行测序以确认未将错配引入序列。将PCR产物克隆到-T简单载体(普洛麦格公司(Promega),麦迪逊,威斯康星州)和/或4-载体(英杰公司(Invitrogen),卡尔斯巴德,加利福尼亚州)中。由金斯瑞公司(GenScript)(皮斯卡塔韦,新泽西州)合成所有的密码子优化的基因。

使用染料终止子技术,使用载体-和插入-特异性引物的组合在ABI自动测序仪上产生DNA序列。使用SEQUENCHER软件(基因编码公司(Gene Codes Corporation),安阿伯市,密歇根州)进行序列编辑和分析。使用DNASTAR软件(DNA Star,Inc.)实现基因序列的比较。可替代地,使用获得自生命技术公司(LifeTechnologies)(格兰德岛,纽约州)的Vector NTI10程序实现基因序列的操纵。

根据百分比同一性、百分比相似性、和/或期望(E)值报道了概括与查询序列具有最大相似性的序列的比对比较的结果。“期望值”估计匹配的统计显著性,指定匹配数目,具有给定分数,这是在绝对偶然地搜索这种大小的数据库中预期的。

本文中使用的某些缩写的含义如下:“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”微摩尔、“g”意指克、“μg”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、“kb”意指千碱基、“DCW”意指干细胞重量、并且“TFA”意指总脂肪酸。

解脂耶氏酵母的培养和转化

解脂耶氏酵母菌株ATCC#20362和#ATCC 90812购自美国典型培养物保藏中心(罗克维尔,马里兰州)。根据下文所示的配方,常规地将解脂耶氏酵母菌株在若干个培养基中在28℃-30℃生长。通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。

YPD琼脂培养基(每升):10g酵母提取物(DIFCO)、20g BactoTM蛋白胨(DIFCO)、20g葡萄糖。

基本培养基(MM)(每升):20g葡萄糖、1.7g无氨基酸的酵母氮源、1.0g脯氨酸、pH 6.1(未调节的)。

基本培养基+尿嘧啶(MM+尿嘧啶或MMU)(每升):如上制备MM培养基,并且添加0.1g尿嘧啶和0.1g尿苷。

基本培养基+尿嘧啶+磺酰脲(MMU+SU)(每升):如上制备MMU培养基,并且添加280mg磺酰脲。

基本培养基+亮氨酸+赖氨酸(MMLeuLys)(每升):如上制备MM培养基,并且添加0.1g亮氨酸和0.1g赖氨酸。

基本培养基+5-氟乳清酸(MM+5-FOA)(每升):20g葡萄糖、6.7g酵母氮源、75mg尿嘧啶、75mg尿苷和适当量的FOA(加利福尼亚州橙市Zymo研究公司(Zymo Research Corp.,Orange,CA)),基于针对从100mg/L至1000mg/L的浓度范围测试的FOA活性(因为在从供应商处接收的每个批次内发生变化)。

MF培养基(每升):14.3g酵母提取物、7.15g蛋白胨、0.82g KH2PO4、16.37g K2HPO4、20g葡萄糖、1.2mL微量金属(100X)、3mL MgSO4(1M)、0.6mL硫胺素HCl(1.5g/L)。

MF缓冲液1培养基(每升):150g葡萄糖、100.12g KHCO3、4.29g尿素。

YM培养基:0.5%蛋白胨、0.3%酵母提取物、0.3%麦芽糖提取物。

YNB培养基(每升):20g葡萄糖、1.7g无氨基酸的酵母氮源、20g琼脂、pH 6.1(未调节的)。

YPD2-B培养基:10g酵母提取物、10g蛋白胨、20g葡萄糖、94mL K2HPO4(1M)、6mL KH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/ml)、1mL MgSO4-7H2O(12.5g/100mL)。

YPD4-B培养基:10g酵母提取物、10g蛋白胨、40g葡萄糖、94ml K2HPO4(1M)、6mL KH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/mL)、1mL MgSO4-7H2O(12.5g/100mL)。

Y2P1D2-B培养基:20g酵母提取物、10g蛋白胨、20g葡萄糖、94ml K2HPO4(1M)、6mL KH2PO4(1M)、200μL微量金属(100X)、1mL硫胺素-HCl(75mg/mL)、1mL MgSO4-7H2O(12.5g/100mL)。

微量金属配方(100X):10.0g/L柠檬酸、1.5g/L CaCl2·2H2O、10.0g/L FeSO4·7H2O、0.39g/L ZnSO4·7H2O、0.38g/L CuSO4·5H2O、0.20g/L CoCl2·6H2O、0.30g/L MnCl2·4H2O。

耶氏酵母属转化

除非另外说明,否则解脂耶氏酵母的转化根据Chen等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]48:232-235)的方法进行。简言之,将耶氏酵母属划线到YPD平板上,并在30℃生长大约18h。将几大环量的细胞从平板上刮下并重悬浮于含有2.25mL 50%PEG(平均MW 3350)、0.125mL 2M乙酸锂、pH 6.0和0.125mL 2M DTT的1mL转化缓冲液中。然后,将大约500ng线性.化的质粒DNA在100μL重悬浮的细胞中孵育,并且在39℃下维持1h,同时以15min间隔进行涡旋混合。将这些细胞接种在选择培养基平板上并在30℃下维持2至3天。

用于长链二羧酸(LCDA)生产的烧瓶培养物:

将一环量新鲜划线的耶氏酵母属细胞接种到在15-mL FalconTM培养管的3mL MM培养基中,并在30℃伴随摇动(250rpm)生长过夜(约20小时)。将过夜培养的细胞用于在250-mL带挡板的烧瓶中接种50mL的液体Y2P1D2-B培养基,并以250rpm在30℃摇动。24小时后,通过添加2.0mL的1M NaHCO3和1.0mL葡萄糖溶液(200g/L)将培养物调节至pH 8.0。然后,将1.5mL棕榈酸乙酯(底物)直接添加至培养基中至终浓度为23mg mL-1,并将该培养物以250rpm在30℃摇动4天。将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。

用于LCDA生产的微量发酵:

使用于微发酵罐分析的菌株在YPD琼脂平板上从冷冻原液生长成单菌落。将单菌落接种到15-mL FALCON培养管中的3mL基本培养基上,并在30℃以250rpm生长过夜。从这些培养物中,用1mL种子培养物和1mL50%甘油原液构建发酵小瓶,并储存在-80℃。将发酵小瓶解冻并将200μL培养物用于在24孔盒的每个孔中接种4mL MF培养基。在30℃、700rpm下操作微发酵罐,其中DO为20持续最初的24小时,并且DO为75持续运行72小时。在24小时(200μL)、32小时(150μL)、48小时(150μL)、56小时(150μL)、和72小时(50μL)将MF缓冲液1培养基添加至每个孔中。在24小时(20μL)、32小时(30μL)、48小时(20μL)、56小时(30μL)、72小时(20μL)、和80小时(30μL)将棕榈酸乙酯底物添加至每个孔中。在96小时时收获微发酵罐培养物,并且取等分试样用于LCDA分析。

从250-mL烧瓶培养物中进行LCDA提取和分析:

将全发酵液样品(1.0mL)收获在具有TEFLON隔膜的螺旋盖玻璃小瓶中。通过添加1M HCl将样品酸化至pH为3.0,并然后用含有5.0mg/mL肉豆蔻酸内部标准品的1.0mL叔丁基甲基醚(MTBE,西格玛-奥德里奇公司(Sigma-Aldrich))萃取一次。将样品涡旋,其后通过以4500rpm离心5-min将水相和有机相分离。将等分试样(0.5mL)的有机、MTBE相(含有LCDA)转移至新的小瓶中,并且通过添加0.5mL甲醇的H2SO4(5%v/v)来进行具有甲基基团的LCDA产物的衍生化,并在80℃加热1小时。衍生化之后,添加在水中的1M NaCl(0.5mL),将样品涡旋,并且在静止时分离相。收集含有甲基-衍生的LCDA产物的上层MTBE有机层用于通过气相色谱(GC)与火焰离子化检测器(FID)进行分析。将化合物停留时间和质谱数据与针对来自商业标准品的甲基酯(Ultra Scientific公司,北金斯敦,罗德岛州)测量的那些数据进行比较。使用配备有320融合的二氧化硅毛细管柱(30m x 0.32mm x 0.25μm)(Supelco公司,贝尔丰特,宾夕法尼亚州)的7890GC(安捷伦科技公司(Agilent Technologies),圣克拉拉,加利福尼亚州)进行GC分析。将氢气用作以5.5mL min-1恒流的气体载体,其中分传比为10∶1,并且进气压为18.0psi。将烘箱温度最初程序控制在200℃,并且然后以25℃min-1立即增加至240℃;检测器是在260℃。

从2-L发酵样品中进行LCDA提取和分析:

该方法涉及将100μL全发酵液样品转移至反应小瓶中。使用分析天平测量样品重量并记录为±0.1mg。转移后立即通过添加100μL的20mg/mL肉豆蔻酸内部标准(在甲苯中提供)和2.0mL甲醇的H2SO4(5%v/v)和在80℃加热反应小瓶1小时来进行具有甲基基团的LCDA产物的衍生化。衍生化之后,通过向反应混合物中添加在水中的2.0mL的1M NaCl和2.0mL己烷来进行溶剂萃取。收集含有衍生的产物的上层己烷有机层用于通过GC和FID进行分析。将化合物停留时间和质谱数据与针对来自商业标准品的甲基酯(Ultra Scientific公司,北金斯敦,罗德岛州)测量的那些数据进行比较。关于肉豆蔻酸内部标准计算样品中LCDA产物的浓度。使用配备有320融合的二氧化硅毛细管柱(30m x 0.32mm x 0.25μm)(Supelco公司)的6890GC(安捷伦科技公司)进行GC分析。将氦气用作以2.8mL min-1恒流的气体载体,其中分传比为20∶1,并且进气压为18.0psi。将烘箱温度最初程序控制在160℃,并然后以5℃min-1立即增加至200℃,以10℃min-1增加至240℃,并保持4min。检测器是在260℃。

工程化耶氏酵母属酵母从基于植物油的底物生产LCDA的策略

当在用葡萄糖作为碳源的氮限制的条件下生长时,解脂耶氏酵母是以超过25%干细胞重量(DCW)生产脂质的非常规的产油酵母。因为解脂耶氏酵母具有强的β-氧化能力,该酵母可以容易地使用疏水性底物(例如正烷烃、油、脂肪、和脂肪酸)作为唯一的碳源。当向解脂耶氏酵母供给脂肪酸或脂肪酸酯时,该解脂耶氏酵母可以以超过40%DCW生产脂质。向耶氏酵母属供给的大多数脂肪酸和/或脂肪酸酯以三酰基甘油的形式储存。

图1描绘了包括脂肪酸β-氧化和ω-氧化方面的脂质代谢途径。解脂耶氏酵母具有非常弱的ω-氧化能力(在图1中用虚线表示)。因为该低活性,当向酵母(野生型)供给植物油、植物油衍生的脂肪酸、或脂肪酸酯时,不存在可检测的LCDA。用于工程化解脂耶氏酵母以将植物油、植物油衍生的脂肪酸、和/或脂肪酸酯转化为LCDA的策略在图2中阐明,并且包括:(1)通过敲除编码二酰基甘油酰基转移酶1(DGAT1)、二酰基甘油酰基转移酶2(DGAT2)、和磷脂二酰基甘油酰基转移酶(PDAT)的基因来降低储存脂质;(2)通过敲除编码一种或多种过氧化物酶体生物合成因子蛋白质(PEX)的基因来降低或消除过氧化物酶体中的β-氧化;(3)通过过表达细胞色素P450单加氧酶(CYP)和细胞色素P450还原酶(CPR)基因来增强ω-氧化。

另外,如在图1和2中描绘的,据信,由于脂肪酸转运蛋白和长链脂肪酰基辅酶A合成酶活性,脂肪酸跨过细胞膜转运至细胞质的速度和程度影响工程化解脂耶氏酵母细胞中LCDA的生产。实际上,如下文披露的,发现长链脂肪酰基辅酶A合成酶上调增加工程化耶氏酵母属细胞中的LCDA生产。

实例1

编码来自解脂耶氏酵母的推定的长链脂肪酰基辅酶A合成酶的基因

该实例描述了鉴定解脂耶氏酵母中长链酰基辅酶A合成酶的候选序列,用于在微生物中生产长链酰基辅酶A代谢产物。

脂肪酸必须通过酯化被活化才能被运输到细胞中。长链脂肪酰基辅酶A合成酶的酶通过将脂肪酸轭合至辅酶A催化该活化步骤,从而形成脂肪酰基辅酶A。存在四种在酿酒酵母中编码对中链和长链脂肪酸具有特异性的酰基辅酶A合成酶的的基因(FAA-1、-2、-3、-4)。例如,FAA1编码优选具有C12至C16的链长度的脂肪酸的酰基辅酶A合成酶ScFaalp(SEQ ID NO:33),并且FAA2编码优选具有C9至C13的链长度的脂肪酸的酶ScFaa2p(SEQ ID NO:34)(J.Cell Biol.[细胞生物学杂志]127:751-762;Biochim.Biophys.Acta[生物化学与生物物理学学报]1486:18-27)。

为了鉴定解脂耶氏酵母中的FAA同系物,将由解脂耶氏酵母基因组数据库(www.genolevures.org/yali.html)中的预测可读框(ORF)序列编码的氨基酸序列与酿酒酵母Faalp(SEQ ID NO:33)和Faa2p(SEQ ID NO:34)的预测的氨基酸序列进行比对。通过这些BLAST分析鉴定十五种解脂耶氏酵母ORF(表2)。由这些ORF编码的十五种Faa1p和Faa2p同系物中,预测其中十二种是过氧化物酶体(含有过氧化物酶体定位信号),然而其中三种具有未知的细胞定位信息。

表2

解脂耶氏酵母中的长链脂肪酰基辅酶A合成酶候选者

分别地,将酿酒酵母Faalp(SEQ ID NO:33)和Faa2p(SEQ ID NO:34)氨基酸序列与由热带假丝酵母基因组(www.candidagenome.org/cgi-bin/compute/blast_clade.pl#Select_Target_Organisms)编码的氨基酸序列进行比对。鉴定了总共六种候选ORF。这些ORF中的其中三种编码含有推定的过氧化物酶体定位信号的氨基酸序列,并因此被预测编码过氧化物酶体蛋白质。表3列出了这些候选序列中的每一种。

表3

在热带假丝酵母(Candida tropicalis)中的长链脂肪酰基辅酶A合成酶候选者

使用VECTOR NTI软件,比对了酿酒酵母Faa1p(SEQ ID NO:33)和Faa2p(SEQ ID NO:34)、十五种解脂耶氏酵母长链酰基辅酶A合成酶候选者、和六种热带假丝酵母长链酰基辅酶A合成酶候选者的氨基酸序列。将从该比对得到的系统树显示在图3中。将耶氏酵母属候选者YlAcoS-2P(SEQ ID NO:37)、-3P(SEQ ID NO:39)、-4P(SEQ ID NO:40)、-5P(SEQ IDNO:42)、-6P(SEQ ID NO:44)、-7P(SEQ ID NO:45)、-9P(SEQ ID NO:47)、-10P(SEQ ID NO:49)、-11P(SEQ ID NO:50)和-12P(SEQ ID NO:51)聚集在一起形成一组。将所有的这些序列预测为过氧化物酶体蛋白质。将六种假丝酵母属长链酰基辅酶A合成酶候选者和耶氏酵母属长链酰基辅酶A合成酶候选者YlFaa1(SEQ ID NO:36)、YlAcoS-8(SEQ ID NO:46)、-13P(SEQ ID NO:52)、-14(SEQ ID NO:53)、-15P(SEQ ID NO:54)与两种酿酒酵母酰基辅酶A合成酶聚集在一起。ScFaa1(SEQ ID NO:33)与CA-1(SEQ ID NO:57)和YlFaal(SEQ ID NO:36,在图3中“YA-1”)密切相关。ScFaa2(SEQ ID NO:34)和CA-2至-6形成一组,并且YlAcoS-8(SEQ ID NO:46)、-13P(SEQ ID NO:52)、-14(SEQ ID NO:53)和-15P(SEQ ID NO:54)形成第三组。

因此,鉴定了在解脂耶氏酵母中的候选者长链脂肪酰基辅酶A合成酶的序列。

实例2

在工程化解脂耶氏酵母细胞中候选者长链脂肪酰基辅酶A合成酶的表达模式

该实例描述了通过qRT-PCR筛选实例1中鉴定的解脂耶氏酵母长链酰基辅酶A合成酶候选者,以鉴定在底物添加至培养基的条件下诱导的序列。其表达由含有脂肪酸的底物诱导的任何长链酰基辅酶A合成酶序列可以是用于促进底物输入的候选酶。

使生产LCDA的解脂耶氏酵母菌株D0145(下面实例13描述了此菌株的构建)按一式三份在具有Y2P2D2生长培养基(20g/L酵母提取物;20g/L BACTO-PEPTONE;20g/L葡萄糖)的250-mL烧瓶中的50mL培养物中在30℃、以起始OD600 0.15、摇动速度250rpm进行生长。24小时后,收集0.5mL和1mL的“第0天”培养物样品分别用于RNA提取和LCDA定量。对于剩余的培养物,添加1M NaHCO3将pH调节至8.0,其后添加棕榈酸乙酯底物至终浓度3%。添加底物后24小时,收集0.5mL和1mL的“第1天”样品分别用于RNA提取和LCDA定量。图4显示在不同的时间点由菌株D0145生产的LCDA。在向培养基中添加棕榈酸乙酯之前没有LCDA生产,但是在底物添加之后有这样的生产,该生产以稳定的速率增加到大约第2天(图4)。

为了制备RNA样品,通过在13,000x g下离心1min收获在第0天和第1天来自每个培养物的0.5-mL等分试样。将细胞沉淀物立即冷冻并储存在-80℃下。使用TRIzolTM试剂(生命技术公司(Life Technologies),卡尔斯巴德,加利福尼亚州)从每种细胞沉淀物中制备总RNA。使用MINI-BEADBEATER-8(BSP,巴特尔斯维尔,俄克拉何马州)进行细胞破碎。然后,使用Qiagen RNeasyTM试剂盒将从每个样品提取的总RNA进行纯化。为了去除任何残余的基因组DNA,用无RNA酶活性的DNA酶(凯杰公司(Qiagen),希尔登,德国)处理3μg的总RNA。然后,通过添加1mM EDTA并加热至75℃持续5分钟将DNA酶灭活。使用大容量cDNA逆转录试剂盒(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州),按照制造商的说明书,然后将1μg DNA酶处理的RNA转化为互补DNA(cDNA)。然后将cDNA以1:10稀释在不含RNA酶的水中用于定量PCR(qPCR)分析。

进行qPCR来检测在表4中列出的靶基因的表达。利用PRIMER EXPRESS v 3.0.1软件(应用生物系统公司(Applied Biosystems))设计在表4中列出的所有引物。通过针对解脂耶氏酵母Genolevures数据库(genolevures.org/yali.html)的BLAST分析评估引物的特异性,并使用基因组DNA验证定量(未显示数据)。具有PCR效率在0.85-1.15之间的引物被验证用于定量。使用Green一式三份地进行所有的qPCR反应,该Green用于在ABI 7900 SDS仪器(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州)上进行检测。使用数据辅助软件v3.01和ΔΔCt方法(应用生物系统公司,福斯特城,加利福尼亚州)计算相对表达(RQ)。通过软件将编码18S rRNA的基因鉴定为最佳内源对照基因,并用于数据归一化。然后,通过将在第1天每个基因的表达与其被设置为1.0的第0天的表达比较,计算在第1天每个基因的相对表达。

表4

用于qPCR分析的引物

表5(下文)显示qRT-PCR分析的结果。针对每个第0天(D0)和第1天(D1)样品的表达测量(SYBR)是相对于被设置为1.00的样品第0-1天(‘D0-1’)的测量。通过三种独立的PCR反应运行每个数据点并将其归一化至耶氏酵母属18S rRNA表达。“SYBR SD”值是PCR反应的每个三件套(trio)的标准偏差。与第0天的表达(在表5中用灰色小格表示)相比,编码YlAcoS-10P(SEQ ID NO:49)、YlAcoS-6P(SEQ ID NO:44)、和YlAcoS-3P(SEQ ID NO:39)长链酰基辅酶A合成酶的转录物表现出相对于第1天的表达超过4倍的增加。

基于在表5中的数据,用含有长链脂肪酸的底物处理时,在解脂耶氏酵母中诱导YlAcoS-10P(SEQ ID NO:49)、YlAcoS-6P(SEQ ID NO:44)、和YlAcoS-3P(SEQ ID NO:39)推定的长链酰基辅酶A合成酶的表达。这些长链酰基辅酶A合成酶可能因此可用于促进含有长链脂肪酸的底物的输入。

实例3

对编码推定的长链酰基辅酶A合成酶的多核苷酸序列进行密码子优化用于在解脂耶氏酵母中表达

根据在美国专利号7125672(将该专利通过引用结合在此)中披露的方法学,将编码长链酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、和YlFAA(SEQ ID NO:36)的DNA可读框进行密码子优化用于在解脂耶氏酵母中高表达。因此,制备多核苷酸序列YlACoS-3Ps(SEQ ID NO:38)、YlACoS-5Ps(SEQ ID NO:41)、YlACoS-6Ps(SEQ ID NO:43)、YlACoS-10Ps(SEQ ID NO:48)、和YlFAA1s(SEQ ID NO:35),这些多核苷酸序列分别编码YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、和YlFaa1(SEQ ID NO:36)。将每个密码子优化的DNA序列单独地合成并通过金斯瑞公司(GenScript)(皮斯卡塔韦,新泽西州(Piscataway,NJ))克隆进表达载体中以产生pZP2-YlACoS-3Ps(SEQ ID NO:63)、pZP2-YlACoS-5Ps(SEQ ID NO:64)、pZP2-YlACoS-6Ps(SEQ ID NO:65)、pZP2-YlACoS-10Ps(SEQ ID NO:66)、和pZKL7A-FYlFAAs(SEQ ID NO:67)(分别在图5A-E中)。还制备了另一种载体pZP2-YlACoS-5PS3s(SEQ ID NO:68,图5F),该载体允许表达YlACoS-5PS3(SEQ ID NO:56),其是YlAcoS-5P(SEQ ID NO:42)的截短版本(六个氨基酸C-末端截短)。

可以将以上构建体用于过表达耶氏酵母属中的长链酰基辅酶A合成酶候选者。

实例4

长链酰基辅酶A合成酶候选者在大肠杆菌中的表达

此实例披露了在大肠杆菌(Escherichia coli)中T7诱导型启动子下过表达酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-6P(SEQ ID NO:44)、YlACoS-10P(SEQ ID NO:49)、YlACoS-5PS3(SEQ ID NO:56,YlACoS-5P的六个氨基酸C-末端截短的版本)和YlFAA(SEQ ID NO:36)。

首先,使用NcoI/NotI限制性内切核酸酶将YlACoS-3Ps(SEQ ID NO:38)、YlACoS-5Ps(SEQ ID NO:41)、YlACoS-6Ps(SEQ ID NO:43)、YlACoS-10Ps(SEQ ID NO:48)、YlACoS-5PS3s(SEQ ID NO:55)和YlFAAs(SEQ ID NO:35)(将每一种进行密码子优化用于在耶氏酵母属中表达)的多核苷酸序列分别从pZP2-YlACoS-3Ps(SEQ ID NO:63)、pZP2-YlACoS-5Ps(SEQ ID NO:64)、pZP2-YlACoS-6Ps(SEQ ID NO:65)、pZP2-YlACoS-10Ps(SEQ ID NO:66)、pZP2-YlACoS-5PS3s(SEQ ID NO:68)、和pZKL7A-FYlFAAs(SEQ ID NO:67)(图5A-F)切除,并且单独地连接至在NcoI/NotI内切核酸酶位点处的pET23d载体(SEQ ID NO:69)(Novagen公司,麦迪逊,威斯康星州)中。限制性分析用于证实每个连接(数据未显示)。

为了过表达每个推定的长链酰基辅酶A合成酶,用合适的基于pET23d的质粒转化并在LBAMP培养基(AMP:氨苄西林,终浓度为100μg/mL)中生长的大肠杆菌BL(DE3)的8小时培养物在500-mL烧瓶中的100mL相同的培养基中按1∶50稀释。在37℃将每个培养物摇动直到在600nm下的光密度达到0.8-0.9,其后将烧瓶置于18℃培养箱中保持约20分钟,然后添加异丙硫基-β-D-半乳糖苷(IPTG)至终浓度为100μM。然后,在18℃将每个培养物另外摇动10-12小时。通过离心收集细胞(来自15mL培养物的约100mg湿重量),用磷酸盐缓冲的盐水溶液(PBS)(pH 7.4)洗涤一次,然后重悬浮于400μL的裂解缓冲液(BUGBUSTER HT,含有25%甘油、0.5mg/mL来自Pierce的溶菌酶和蛋白酶抑制剂混合物)中,并在摇动平台上在室温孵育20分钟。通过在4℃以12,000x g离心30分钟去除细胞碎片。为了从上清液中除去可能干扰下述酶测定的小分子,将该上清液置于10-KDa分子量截止(MWCO)离心装置中并在4℃以12,000x g离心30分钟。将保留的蛋白质溶液(约50μL-100μL)重悬浮于400μL(终体积)缓冲液(0.1M KPi、20%甘油,pH 7.5)中并通过在MWCO装置上在4℃以12,000x g离心30分钟再次浓缩一次。将浓缩的蛋白质溶液重悬浮于0.1M KPi、20%甘油,pH 7.5的终体积为约200μL中,转移至新的离心管中,并以最大速度短暂离心以去除任何沉淀的蛋白质。将用于SDS-PAGE分析、蛋白质浓度的测定、和酶测定的澄清的上清液储存在-80℃下。如在图6A和B中所示,所有六种酰基辅酶A合成酶候选者成功地在大肠杆菌中过表达,并且除了YlACoS-3P(SEQ ID NO:39)以外都被发现于大肠杆菌细胞裂解物中的可溶性部分中。

实例5

长链酰基辅酶A合成酶候选者的比活性的确定

此实例披露了长链酰基辅酶A合成酶候选者比活性的分析。具体地,使用棕榈酸或对香豆酸作为底物,测试存在于可溶的大肠杆菌部分(在实例4中产生)中的酰基辅酶A合成酶候选者的活性。

将每种长链酰基辅酶A合成酶候选者对棕榈酸底物的比活性确定如下。如在以下方案(1→4)中的描绘的,在磷酸烯醇丙酮酸盐(PEP)、NADH、肌激酶和丙酮酸激酶的存在下,在澄清的上清液(实例4)中由推定的酰基辅酶A合成酶形成腺苷一磷酸(AMP)与通过乳酸脱氢酶(由340nm处的吸光度监测)氧化NADH偶联:

1.

2.

3. 2 ADP+2 PEP→2 ATP+2丙酮酸(丙酮酸激酶催化的)。

4. 2丙酮酸+2 NADH→2乳酸+2 NAD+(乳酸脱氢酶催化的)。

具体地,在30℃进行每个测定(300μL终体积),并且包含:在100mM Tris-Cl、50mM NaCl、10mM MgCl2、pH 7.2中的1mM棕榈酸(从在DMSO中制得的10mM储备溶液稀释)、4mM ATP、1.5mM CoASH、1mM PEP、5单位的丙酮酸激酶、5单位的乳酸脱氢酶、6单位的肌激酶。通过添加适当量的含有候选者长链脂肪酰基辅酶A合成酶的细胞裂解物(实例4)引发该反应过程。添加细胞提取物之后,使用Cary-100 UV-Vis分光光度计(安捷伦公司(Agilent))监测340 nm处NADH的氧化(氧化为NAD+)持续5分钟。通过减去在其中棕榈酸底物被DMSO替代的酶测定中观察到的背景活性来计算初始斜率。

将如上文针对棕榈酸底物测量的推定的长链酰基辅酶A合成酶的比活性汇总在下表6中。以mU/mg提供比活性测量,其中一个单位对应于在1mM棕榈酸、4mM ATP和1.5mM CoA的存在下,在30℃和pH 7.2下每分钟生产1.0μmole棕榈酰辅酶A的酶量;NADH的吸光系数=6,220 M-1cm-1。在从对照细胞(用空pET23d载体转化)制备的上清液和在从表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)和YlACoS-5PS3(SEQ ID NO:56)的细胞制备的上清液中未检测到(在表6中表示为“n.d.”)高于背景水平的活性。

因为与酰基辅酶A合成酶候选者YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、和YlACoS-10P(SEQ ID NO:49)有关的序列在NCBI基因库数据库中被注释为推定的4-香豆酸-辅酶A连接酶,然而YlFAA(SEQ ID NO:36)显示出与Faa1p(SEQ ID NO:33)(来自酿酒酵母优选C12:0-C16:0脂肪酸的表征良好的长链脂肪酰基辅酶A合成酶)的50%同一性,使用对香豆酸(pCA)作为底物还测试了上述提及的酶的比活性。将每种长链酰基辅酶A合成酶候选者对pCA底物的比活性确定如下。在30℃进行每个测定(250μL终体积),并且包含:在100mM Tris-C1、50mM NaCl、10mM MgCl2、pH7.2中的1mM对香豆酸(从在DMSO中制得的10mM储备溶液稀释)、4mM ATP、1.5mM CoASH。通过添加适当量的含有候选者长链脂肪酰基辅酶A合成酶的细胞裂解物(实例4)引发该反应。添加细胞提取物后,使用Cary-100UV-Vis分光光度计(安捷伦公司(Agilent))监测340nm处吸光度的增加(由于对香豆酰辅酶A的形成)持续10min。通过减去在其中pCA被DMSO替代的酶测定中观察到的背景活性来计算初始斜率。

将如上文针对pCA底物测量的推定的长链酰基辅酶A合成酶的比活性汇总在下表6中。以mU/mg提供比活性测量,其中一个单位对应于在1mM对香豆酸、4mM ATP和1.5mM辅酶A的存在下,在30℃和pH 7.2下每分钟生产1.0μmole对香豆酰辅酶A的酶量;香豆酰辅酶A的吸光系数=21,000M-1cm-1。在从对照细胞(用空pET23d载体转化)制备的上清液和在从表达YlACoS-3P(SEQ ID NO:39)、YlACoS-5P(SEQ ID NO:42)、YlACoS-5PS3(SEQ ID NO:56)和YlFAA(SEQ ID NO:36)的细胞制备的上清液中未检测到(在表6中表示为“n.d.”)高于背景水平的活性。

表6

长链酰基辅酶A合成酶候选者在不同底物上的比活性

an.a.(未检测出)。

这些结果支持YlACoS-6P(SEQ ID NO:44)和YlACoS-10P(SEQ ID NO:49)可以接受芳香族羧酸和长链脂肪酸二者作为底物的见解。相反,YlFAA1(SEQ ID NO:36)似乎对棕榈酸具有特异性。在限定的反应条件下,YlACoS-3P(SEQ ID NO:39)和YlACoS-5P(SEQ ID NO:42)均未显示出对两种底物的活性。

实例6

产生从基于植物油的底物生产LCDA的高级解脂耶氏酵母亲本菌株

此实例披露了适于另外的基因工程的解脂耶氏酵母菌株,从而产生可生产大量LCDA的菌株。

如上所述,可以预期解脂耶氏酵母可能需要被工程化以降低或消除脂质储存和β-氧化,从而有效地从植物油、植物油衍生的脂肪酸或脂肪酸酯生产LCDA。还可能的是不同的遗传背景可能有利于LCDA生产。如在表7中所示,一系列解脂耶氏酵母菌株产生自野生型菌株ATCC编号20362和90812。这些菌株中的一些具有降低的脂质储存能力和降低的β-氧化功能。图7A图解了这些菌株中的一些相对于彼此的谱系。

表7

用于LCDA生产的解脂耶氏酵母亲本菌株

a将每一者通过引用结合在此。

具体地,通过敲除菌株L183中的PEX3基因(编码过氧化物酶体生物合成因子3蛋白质[Pex3p])产生菌株D0004。通过同源重组,用质粒pY157(SEQ ID NO:70,参见美国专利中请号62/140,681中图4A)的含有URA3的AscI/SphI片段转化菌株L183(命名为D0003)以敲除PEX3基因。通过实时PCR将转化体之一(命名为菌株T1876)鉴定为pex3-(即,Δpex3)。预期菌株T1876的PEX3敲除位点包含SEQ ID NO:71(代替野生型PEX3基因座序列)(关于SEQ ID NO:71的描述,参考表1)。用质粒pY117(披露于美国专利申请公开号2012/0142082的表20中,将该申请通过引用结合在此)转化菌株T1876以表达Cre重组酶从而切除LoxP-侧翼的URA3基因(由敲除PEX3的pY157的片段引入)。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D0004(dgat1-、dgat2-、pex3-、ura3-)。预期菌株D0004的PEX3敲除位点包含SEQ ID NO:72(代替野生型PEX3基因座序列)(关于SEQ ID NO:72的描述,参考表1)。

通过“弹入/弹出”(pop-in/pop-out)方法(对于有关此类型敲除策略的更多细节,参见美国专利申请公开号2014/0220645,将该申请通过引用结合在此)通过敲除POX4基因(编码过氧化物酶体酰基辅酶A氧化酶-4[Pox4酶,基因库登录号CAG80078])从菌株D0004产生菌株D0015。简言之,用经XbaI消化的质粒pYRH146-Pox4KO(SEQ ID NO:73,参见美国专利申请号62/140,681中的图4C)转化菌株D0004。总共28个转化体在MM平板上生长。PCR分析检测了两个转化体(#7和#17),其中第一杂交(弹入)是在天然POX4基因和构建体pYRH146-Pox4KO的同源3’-臂序列之间。挑出#7转化体,使其在液体YPD培养基中生长,并然后接种在FOA600平板上(以选择导致ura3-的弹出事件)。PCR分析检测了在FOA600平板上生长的28个菌株中的13个菌株中的第二杂交(在对应的5’-同源臂序列之间)。将这13个菌株之一命名为D0015,该D0015菌株被确定为具有POX4基因的敲除。D0015具有以下基因型:dgat1-、dgat2-、pex3-、pox4-、ura3-。预期POX4敲除位点包含SEQ ID NO:74(代替野生型POX4基因座序列)(关于SEQ ID NO:74的描述,参考表1)。

通过用质粒pYRH72的含有URA3的EcoRI/ClaI片段(SEQ ID NO:75)转化菌株ATCC编号90812来产生菌株W101。

通过将W101与D0004杂交来产生二倍体菌株(1D2373)。

使菌株1D2373形成孢子,并且通过实时PCR将其子代之一(菌株2373I-6)确定为具有交配型B基因型的单倍体。菌株2373I-6不能在SC-1eu培养基上生长,并将该菌株重命名为菌株1B24791。

通过将1B24791与D0004杂交产生二倍体菌株(2D2519)。

使菌株2D2519形成孢子,并且通过实时PCR将其子代之一(菌株2519I-1)确定为具有交配型B基因型的单倍体。菌株2519I-1不能在SC-leu培养基上生长,并将该菌株重命名为菌株2B25831。

通过将2B25831与D0004杂交产生二倍体菌株(3D2653)。

使菌株3D2653形成孢子,并且通过实时PCR将其子代之一(菌株2653I-19)确定为具有基因型dgat2-、MATB的单倍体。菌株2653I-19不能在SC-leu培养基上生长,并将该菌株重命名为菌株3B27021。

将菌株D0015与菌株3B27021杂交以产生二倍体菌株4D2738。

使菌株4D2738形成孢子,并且通过实时PCR将其子代之一(菌株2738Y-14)确定为具有基因型为dgat1-、dgat2-、pox4-、pex3-和MATA的单倍体。菌株2738Y-14不能在MM培养基上生长,并将该菌株命名为D0017。

使菌株4D2738形成孢子,并且通过实时PCR将其子代之一(菌株2738Y-45)确定为具有基因型dgat1-、dgat2-、pox4-和pex3-的单倍体。菌株2738Y-45不能在SC-ura或SC-leu平板上生长。因此,菌株2738Y-45具有基因型:MATA、dgat1-、dgat2-、pex3-、pox4-、ura3-和leu2-。

经由一步骤方法通过从2738Y-45缺失POX3基因产生菌株77T5-5。将菌株2738Y-45用质粒p12_3-B-Pex3del1的AscI/SphI片段(图8A,SEQ ID NO:76)转化。通过实时PCR将转化体中的一种鉴定为pox3-。此转化体被命名为77T5-5(MATA、dgat1-、dgat2-、leu2-、pex3-、pox3-、pox4-、Ura3+)。

经由一步骤方法通过从77T5-5首先缺失POX2基因来产生菌株D0031。将菌株77T5-5用质粒p70_Pox2::Leu(图8B,SEQ ID NO:77)的AscI/SphI片段转化。通过实时PCR将转化体118T1-14中的一种鉴定为pox2-。反过来用质粒pY117(披露于美国专利申请公开号2012/0142082的表20中,将该申请通过引用结合在此)转化菌株118T1-14(MATA、dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+)以表达Cre重组酶从而切除LoxP-侧翼的URA3基因(在先前的步骤中由p12_3-B-Pex3del1引入)。转化体之一118T1-14-7-1U不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;该转化体被命名为菌株D0031(MATA、dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、ura3-)。

因此,产生了某些解脂耶氏酵母菌株,包括缺少功能的PEX3(pex3-)、POX2(pox2-)、POX3(pox3-)和POX4(pox4-)基因的一些菌株。这些菌株适合进行另外的基因工程,从而产生可以生产显著量的LCDA的菌株(以下实例)。

实例7

通过过表达CYP和CPR酶产生用于LCDA生产的解脂耶氏酵母菌株D1017此实例披露了通过在菌株D0031中表达编码热带假丝酵母CYP和CPR酶的密码子优化的序列来构建耶氏酵母属菌株D1017。菌株D1017是用于开发菌株D3928的中间体菌株(图7B)。

构建体pZKLY-FCtR17U(图9A,SEQ ID NO:82)包含来自热带假丝酵母的密码子优化的CYP52A17(CtCYPA17s,基因库登录号AAO73958,编码SEQ ID NO:84的SEQ ID NO:83)和CPR(CtCPRs,基因库登录号P37201,编码SEQ ID NO:86的SEQ ID NO:85)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码CtCYPA17或CtCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZKLY-FCtR17U质粒(SEQ ID NO:82)的组分进一步在表8中描述。

表8

质粒pZKLY-FCtR17U(SEQ ID NO:82)的描述

用AscI/SphI消化质粒pZKLY-FCtR17U(SEQ ID NO:82),并且然后根据一般方法用于转化菌株D0031。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于接种在250-mL烧瓶中的25mL的液体YPD4-B培养基,然后将其在30℃以180rpm摇动。40小时后,添加2.0mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯(W245100,西格玛奥德里奇公司(Sigma-Aldrich))直接添加至培养基中至终浓度8mg mL-1。然后在30℃,以180rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。

GC分析显示在亲本菌株D0031中没有检测到十六烷二酸(C16:0 LCDA)。然而,亲本菌株D0031的大多数转化体生产超过8g/L C16:0 LCDA。转化体#6、#8、#10和#11分别生产9.5g/L、9.5g/L、12.1g/L和9.1g/L C16:0 LCDA。这四个菌株分别被命名为菌株D1015、D1016、D1017和D1018。

随后进行菌株D1015、D1016和D1017的烧瓶分析。具体地,将D1015、D1016和D1017菌株各自置于250-mL带挡板的烧瓶中的50-mL培养物中,其中添加棕榈酸乙酯至终浓度16mg mL-1。在30℃以180rpm将这些培养物摇动4天。菌株D1015、D1016和D1017分别以约7.4g/L、7.6g/L和9.3g/L产生C16:0 LCDA。

通过微发酵分析还分析了菌株D1017。而对照菌株(D0285,数据未显示)以6.4g/L生产C16:0 LCDA,菌株D1017以约7.4g/L生产C16:0 LCDA。

应注意的是用于转化D0031以产生菌株D1017和其同族的pZKLY-FCtR17U(SEQ ID NO:82)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。D1017和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、来知1-、FBA::CtCPRs::Lip1、FBAINm1::CtCyPA17s::Pex20。

因此,产生耶氏酵母属菌株D1017,当在烧瓶测定中供给含有长链脂肪酸的底物时该菌株可以生产大于5g/L的LCDA产物。

实例8

通过过表达脂肪醇氧化酶和脂肪醛脱氢酶产生用于LCDA生产的解脂耶氏酵母菌株D1308

此实例披露了通过表达编码阴沟假丝酵母脂肪醇氧化酶(FAO)和热带假丝酵母脂肪醛脱氢酶(FALDH)的密码子优化的序列构建耶氏酵母属菌株D1308。菌株D1308是用于开发菌株D3928的中间体菌株(图7B)。

首先,从菌株D1017开发菌株D1017U。将质粒pY117用于暂时表达Cre重组酶以切除菌株D1017内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D1017U。

接下来,用线性化质粒构建体pZKADn-C2F1U(图9B,SEQ ID NO:87)转化菌株D1017U。此片段包含两种表达盒,一种用于过表达密码子优化的编码FAO酶的序列(CcFAO1s,基因库登录号CAB75351,编码SEQ ID NO:89的SEQ ID NO:88),并且另一种用于过表达密码子优化的编码FALDH酶的序列(CtFALDH2s,基因库登录号XP_002550712,编码SEQ ID NO:91的SEQ ID NO:90)。将pZKADn-C2F1U质粒(SEQ ID NO:87)的组分进一步在表9中描述。

表9

质粒pZKADn-C2F1U(SEO ID NO:87)的描述

用AscI消化质粒pZKADn-C2F1U(SEQ ID NO:87),并然后根据一般方法用于转化菌株D1017U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。

GC分析显示菌株D1017U的三种转化体生产超过10g/L C16:0 LCDA。具体地,转化体#2、#5、和#10分别生产10.2g/L、14.5g/L、和10.8g/L C16:0 LCDA。将这三种菌株分别命名为菌株D1307、D1308、和D1309。

通过微发酵分析还分析了菌株D1307和D1308。而对照菌株(D0285,数据未显示)以约6.0g/L生产C16:0 LCDA,菌株D1307和D1308分别以约9.7g/L和10.8g/L生产C16:0 LCDA。

使用2-L发酵实验进一步测试菌株D1308。如在表10和图10中所示,发酵162小时后,菌株D1308生产LCDA的总量为约50.9g/L,其中约42.6g/L是C16:0 LCDA。

表10

由在用棕榈酸乙酯作为底物的2-L发酵中生长的菌株D1308生产的LCDA

应注意的是用于转化D1017U以产生菌株D1308和其同族的pZKADn-C2F1U(SEQ ID NO:87)DNA可以潜在地敲除醇脱氢酶3基因座(基因库登录号AF175273)。然而,在这些菌株中这样的敲除没有被证实。D1308和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、FBA::CtCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBAlL::CcFAOls::Aco。

因此,产生耶氏酵母属菌株D1308,当供给含有长链脂肪酸的底物时该菌株可以生产大于50g/L的LCDA产物。

实例9

产生用于生产高于70g/L的LCDA的解脂耶氏酵母菌株D2300

此实例披露了通过在菌株D1308中表达编码箭舌豌豆CYP和CPR酶的密码子优化的序列构建耶氏酵母属菌株D2300。菌株D2300是用于开发菌株D3928的中间体菌株(图7B)。

首先,从菌株D1308开发菌株D1308U。将质粒构建体pY117用于暂时表达Cre重组酶以切除菌株D1308内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D1308U。

接下来,用来自质粒构建体pYRH213(图11A,SEQ ID NO:92)的DNA片段转化菌株D1308U。此片段包含两种表达盒,一种用于过表达密码子优化的编码CYP酶的序列(VsCYP94A1s,来源于箭舌豌豆,基因库登录号AAD10204,编码SEQ ID NO:94的SEQ ID NO:93),并且另一种用于过表达密码子优化的编码CPR酶的序列(VsCPRs,来源于箭舌豌豆,基因库登录号Z26252,编码SEQ ID NO:96的SEQ ID NO:95)。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码VsCYP或VsCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pYRH213质粒(SEQ ID NO:92)的组分进一步在表11中描述。

表11

质粒pYRH213(SEQ ID NO:92)的描述

用AscI/SphI消化质粒pYRH213(SEQ ID NO:92),并然后根据一般方法用于转化菌株D1308U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上。使用烧瓶测定,直接分析两种菌株的LCDA生产。具体地,将单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。

GC分析显示菌株D1308U的两种转化体各自分别生产8.2g/L和12.6g/L C16:0 LCDA。将生产12.6g/L C16:0 LCDA的菌株命名为菌株D2300。

使用2-L发酵实验进一步测试菌株D2300。如在表12和图12中所示,发酵163小时后,菌株D2300生产LCDA的总量为约72.7g/L,其中约64.6g/L是C16:0 LCDA。

表12

由在用棕榈酸乙酯作为底物的2-L发酵中生长的菌株D2300生产的LCDA

应注意的是用于转化D1308U以产生菌株D2300和其同族的pYRH213(SEQ ID NO:92)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。菌株D2300和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco。

因此,产生耶氏酵母属菌株D2300,当供给含有长链脂肪酸的底物时该菌株可以生产大于70g/L的LCDA产物。

实例10

产生用于LCDA生产的解脂耶氏酵母菌株D2882

此实例披露了通过在菌株D2300中表达编码脂肪醇氧化酶(FAO)酶的三种密码子优化的序列构建耶氏酵母属菌株D2882。菌株D2300是用于开发菌株D3928的中间体菌株(图7B)。

首先,由于被pYRH213(SEQ ID NO:92)DNA转化(参见实例9)而为Ura3+的菌株D2300被表现为ura3-。具体地,用质粒pZKUM转化D2300从而将ura3-突变序列整合到完整的URA3序列中。已经描述了构建和使用质粒pZKUM以获得ura-解脂耶氏酵母细胞(美国专利申请公开号2009/0093543,参见其中的表15,将该申请通过引用结合在此)。简言之,用SalI/PacI消化质粒pZKUM,并然后根据一般方法转化到菌株D2300中。转化后,将细胞接种在MM+5-FOA平板上并在30℃维持2-3天。挑出在MM+5-FOA平板上生长的总共8种转化体,并分别再次划线到MM平板和MM+5-FOA平板上。所有的这8种转化体具有ura-表型(即,细胞可以在MM+5-FOA平板上生长,但不能在MM平板上生长)。转化体#1、#2、和#3被命名为D2300U1、D2300U2、和D2300U3,它们被共同命名为D2300U。

为了产生菌株D2882,用来自构建体pZSCPn-3FAOBU(图11B,SEQ ID NO:98)的DNA片段转化菌株D2300U1,该构建体包含三种表达盒以过表达编码FAO酶(CtFAO1、CcFAO1、CcFAO2)的密码子优化的序列。具体地,这些表达盒包含以下序列:(i)CtFAO1Ms(编码SEQ ID NO:100的SEQ ID NO:99,其是基因库登录号AAS46878的CtFAO1的突变形式)(与野生型CtFAO1相比,CtFAO1M包含在氨基酸位置359处的组氨酸残基而不是酪氨酸残基),(ii)CcFAO1s(编码SEQ ID NO:102的SEQ ID NO:101),和(iii)CcFAO2s(编码SEQ ID NO:104的SEQ ID NO:103)。分别将NcoI和NotI位点添加在编码前述FAO酶的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZSCPn-3FAOBU质粒(SEQ ID NO:98)的组分进一步在表13中描述。

表13

质粒pZSCPn-3FAOBU(SEQ ID NO:98)的描述

用AscI/SphI消化质粒pZSCPn-3FAOBU(SEQ ID NO:98),并然后根据一般方法用于转化菌株D2300U1。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。然后,添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。

将与pZSCPn-3FAOBU(SEQ ID NO:98)各自引起菌株D2300U1的转化的二十四种菌株进行培养并通过GC进行分析。二十四种转化体中的五种以超过10.6g/L生产C16:0 LCDA。具体地,转化体#11、#14、#18、和#21分别以12.1g/L、12.0g/L、12.4g/L、和10.6g/L生产C16:0 LCDA。将这四种菌株分别命名为菌株D2882、D2883、D2884、和D2885。

根据一般方法,通过烧瓶测定还分析了菌株D2882、D2883、D2884和D2885的LCDA生产。如在表14中所示,菌株D2882、D2883、D2884和D2885分别以约15.1g/L、13.2g/L、15.0g/L和15.5g/L生产C16:0 LCDA。

表14

在用棕榈酸乙酯作为底物的烧瓶测定中通过菌株D2882和其同族的LCDA生产

根据一般方法,通过微发酵分析进一步分析菌株D2882和D2885的LCDA生产。如在表15中所示,菌株D2882和D2885分别以约23.4g/L和21.0g/L生产C16:0 LCDA。

表15

在用棕榈酸乙酯作为底物的微发酵测定中通过菌株D2882和D2885的LCDA生产

应注意的是用于转化D2300U1以产生菌株D2882和其同族的pZSCPn-3FAOBU(SEQ ID NO:98)DNA可以潜在地敲除解脂耶氏酵母SCP2(固醇载体蛋白)基因座(基因库登录号AJ431362,YALI0E01298g)。然而,在这些菌株中这样的敲除没有被证实。菌株D2882和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgat2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、未知4-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco;;YAT::CtFAO1sM::Pex20、FBA::CcFAO1s::Lip1、ALK2LM-C::CcFAO2s::Aco3。

实例11

通过过表达长链酰基辅酶A合成酶产生解脂耶氏酵母菌株D3928

此实例披露了通过表达编码长链酰基辅酶A合成酶(YLACoS-6P,SEQID NO:44,参见实例5)的密码子优化的序列构建耶氏酵母属菌株D3982。如在实例12中所示,此菌株能够以超过100g/L生产LCDA。

如下,从菌株D2882产生菌株D3928(图7B)。

首先,由于被pZSCPn-3FAOBU(SEQ ID NO:98)DNA转化(参见实例10)而为Ura3+的菌株D2882被表现为ura3-。具体地,将D2882用质粒pY117转化用于暂时表达Cre重组酶以切除菌株D2882内的LoxP-侧翼的URA3基因。pY117转化体不能在MM上生长,但可以在MMU上生长,表明该转化体缺少URA3基因;此转化体被命名为菌株D2882U。

为了产生菌株D3928,用来自构建体pzP2-YlACoS-6Ps(图5C,SEQ ID NO:65)的DNA片段转化菌株D2882U,该构建体包含一个表达盒以过表达编码YLACoS-6P酶(SEQ ID NO:44)的密码子优化的序列。具体地,该表达盒包含编码SEQ ID NO:44的长链酰基辅酶A合成酶序列YLACoS-6Ps(SEQ ID NO:43)。分别将NcoI和NotI位点添加在编码YLACoS-6P(SEQ ID NO:44)的合成序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZP2-YLACoS-6Ps质粒(SEQ ID NO:65)的组分进一步在表16中描述。

表16

质粒pZP2-YLACoS-6Ps(SEQ ID NO:65)的描述

用AscI/SphI消化质粒pZP2-YLACoS-6Ps(SEQ ID NO:65),并然后根据一般方法用于转化菌株D2882U。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后接种到24孔块中的液体YPD2-B培养基中,然后将其在30℃和以375rpm摇动20小时。然后,添加0.12mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度23mg mL-1。然后在30℃,以375rpm将这些培养物再摇动4天,其后根据一般方法将来自每个培养物的全发酵液样品进行LCDA分析。

将与pZP2-YLACoS-6Ps(SEQ ID NO:65)各自引起菌株D2882U的转化的二十四种菌株进行培养并通过GC进行分析。二十四种转化体中的九种以超过14.5g/L生产C16:0 LCDA。具体地,转化体#6、#7、#8、#9、#10、#11、#12、#13和#20分别以14.8g/L、17.7g/L、18.7g/L、18.3g/L、20.6g/L、17.8g/L、15.4g/L、17.1g/L和14.5g/L生产C16:0 LCDA。将这些转化体分别被命名为菌株D3924、D3925、D3926、D3927、D3928、D3929、D3930、D3931和D3932。

根据一般方法通过微发酵分析进一步分析菌株D3928、D3931和D3932的LCDA生产。如在表17中所示,菌株D3928、D3931和D3932分别以约23.0g/L、21.2g/L和22.7g/L生产C16:0 LCDA。

表17

在用棕榈酸乙酯作为底物的微发酵测定中通过菌株D3928、D3931和D3932的LCDA生产

应注意的是用于转化D2882U以产生菌株D3928和其同族的pZP2-YLACoS-6Ps(SEQ ID NO:65)DNA可以潜在地敲除Pox2基因(基因库登录号AJ001300)。然而,在这些菌株中这样的敲除没有被证实。菌株D3928和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是dgat1-、dgdt2-、Leu2+、pex3-、pox2-、pox3-、pox4-、Ura3+、未知1-、未知2-、未知3-、未知4-、未知5-、FBA::CtCPRs::Lip1、FBA::VsCPRs::Lip1、FBAINm1::CtCYPA17s::Pex20、CPR1::VsCYP94A1s::Pex20、DG2Pro-715::CtALDH2s::Lip1、FBA1L::CcFAO1s::Aco;YAT::CtFAO1sM::Pex20、FBA::CcFAO1s::Lip1、ALK2LM-C::CcFAO2s::Aco3、FBAINm::YlAcoS-6Ps::Pex20。

因此,产生过表达长链酰基辅酶A合成酶的耶氏酵母属菌株,当供给含有长链脂肪酸的底物时该菌株可以合成显著量的LCDA产物。

实例12

在补料分批发酵条件下通过过表达长链酰基辅酶A合成酶的耶氏酵母属的LCDA生

此实例披露了当在补料分批发酵中生长时,过表达长链酰基辅酶A合成酶的耶氏酵母属可以生产大于100g/L的LCDA产物。具体地,在约143小时发酵后,菌株D3928能够以109g/L生产C16:0 LCDA和以119g/L生产总LCDA(表18,图13)。

种子培养方案:将储存在-80℃的工程化耶氏酵母属菌株D3928划线到YPD平板上并在30℃孵育约24小时。将单菌落接种到含有5mL复合培养基(6.7g/L无氨基酸的酵母氮源、5g/L酵母提取物、20g/L D-葡萄糖、6g/L KH2PO4、3.3g/L Na2HPO4·12H2O)的14-mL FALCON管(科宁公司(Corning),纽约州)中。在30℃、以约250-300rpm摇动,使试管培养物生长约24小时。将此培养物的一部分(0.2-5.0mL)转移至含有50mL复合培养基(上述)的250-mL烧瓶中并在30℃另外孵育约20小时至OD600为大约5.0-10.0。将此培养物用作种子培养物以按体积计约3%接种5-L发酵罐。

5-L发酵方案:将以上制备的摇瓶种子培养物转移至5-L发酵罐中(Sartorius BBI,BioStat B plus)以开始发酵(t=0h)。发酵培养基包含50g/L D-葡萄糖、6g/L KH2PO4、3.3g/L Na2HPO4·12H2O、8mL/L微量金属(100X)、40g/L BactoTM酵母提取物、20g/L BactoTM蛋白胨、20mM MgSO4、6mg/L硫胺素·HCl、和15g/L(NH4)2SO4。微量金属(100X)由10g/L柠檬酸、1.5g/L CaCl2·2H2O、10g/L FeSO4·7H2O、0.39g/L 10g/L ZnSO4·7H2O、0.38g/L CuSO4·5H2O、0.2g/L CoCl2·6H2O、和MnCl2·4H2O组成。初始工作体积是3.0L。对于最初的26小时,通过将搅拌速度在300rpm至1200rpm之间级联,将溶解氧水平(pO2)控制在空气饱和度的约20%。在t=26h后,将搅拌速度固定在1200rpm,并然后通过仅与纯氧补充剂级联,将pO2控制在空气饱和度的60%。制备含有700g/L葡萄糖和15-25g/L尿素的葡萄糖补料;当初始加入的葡萄糖被消耗时,在约18小时开始葡萄糖补料。葡萄糖补料速率开始高达20mL/hr,并然后逐渐在发酵结束时(约144小时)降至10mL/hr。贯穿运行过程,将通气速率控制在1.5-2.5L/min,并将温度维持在30℃。对于最初的26小时将pH值控制在6.0,并然后通过KOH补料在运行的剩余部分中将pH增至7.5。从t=28h开始,将棕榈酸乙酯补料至发酵罐中以控制其残余浓度在1-20g/L内。一天取两次发酵样品(在每个时间点处约25mL)以分析OD600、发酵培养基中的残余葡萄糖、残余棕榈酸乙酯和LCDA。

5-L发酵结果:在发酵143.4小时后,产生约119g/L的LCDA。大多数的LCDA产物是十六烷二酸(C16:0二酸)(表18和图13)。

表18

在用棕榈酸乙酯作为底物的5-L补料分批发酵中通过菌株D3928生产的LCDA

因此,当供给含有长链脂肪酸的底物时,过表达长链酰基辅酶A合成酶的耶氏酵母属可以合成显著量的LCDA产物。

实例13

产生解脂耶氏酵母菌株D0145作为LCDA生产的阳性对照

此实例披露了通过表达编码某些箭舌豌豆(Vicia sativa)(巢菜)CYP和CPR酶的密码子优化的序列构建各种耶氏酵母属菌株。包括菌株D0145的这些菌株中的大多数能够生产LCDA。

产生构建体pZKLY-VsCPR&CYP(SEQ ID NO:105)以整合密码子优化的巢菜CYP(VsCYP94A1s,来源于箭舌豌豆,基因库登录号AAD10204,编码SEQ ID NO:94的SEQ ID NO:93)和CPR(VsCPRs,来源于箭舌豌豆,基因库登录号Z26252,编码SEQ ID NO:96的SEQ ID NO:95)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码VsCYP或VsCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZKLY-VsCPR&CYP(SEQ ID NO:105)质粒的组分进一步在表19中描述。

表19

质粒pZKLY-VsCPR&CYP(SEO ID NO:105)的描述

用AscI/SphI消化质粒pZKLY-VsCPR&CYP(SEQ ID NO:105),并然后根据一般方法用于转化菌株D0004(dgat1-、dgat2-、pex3-、ura3-)(参考表7)。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于在250-mL带挡板的烧瓶中接种50mL的液体YPD2-B培养基,然后在30℃以250rpm摇动。24小时后,添加2.0mL的1M NaHCO3将这些培养物调节至pH 8.0,其后将棕榈酸乙酯直接添加至培养基中至终浓度16mg mL-1。然后在30℃,以250rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。

将每一种都从用pZKLY-VsCPR&CYP(SEQ ID NO:105)转化亲本菌株D0004产生的四十八种菌株进行培养并通过GC进行分析。几乎所有的48种菌株以超过3g/L生产C16:0 LCDA。例如,转化体#12、#15、#20、#23、#28、#29、#31、#37、#39、#44和#48分别以5.0g/L、5.1g/L、5.1g/L、5.0g/L、5.2g/L、4.9g/L、5.5g/L、4.8g/L、5.5g/L、5.0g/L和4.8g/L生产C16:0 LCDA。分别将这十一种转化体命名为菌株D0138、D0139、D0140、D0141、D0142、D0143、D0144、D0145、D0146、D0147和D0148。

应注意的是用于转化D0004以产生菌株D0145和其同族的pZKLY-VsCPR&CYP(SEQ ID NO:105)DNA可以潜在地敲除脂肪酶Y基因座(基因库登录号AJ549519)。然而,在这些菌株中这样的敲除没有被证实。菌株D0145和其同族相对于野生型解脂耶氏酵母ATCC#20362的基因型是Ura3+、dgat1-、dgat2-、pex3-、未知1-、FBA::VsCPRs::Lip1、FBAINm::VsCYP94A1s::Pex16。

因此,具有上调的羟化酶复合物表达和下调的PEX3表达的酵母(例如,耶氏酵母属)可以从含有脂肪酸的底物生产LCDA。

实例14

pex3-耶氏酵母属可以生产LCDA

此实例披露了通过表达编码热带假丝酵母CYP和CPR酶的密码子优化的序列构建耶氏酵母属菌株D0101。而且,此实例披露了pex3-菌株可以生产LCDA,而PEX3+菌株(例如,不具有PEX基因破坏,或该基因是pex10-或pex16-的菌株)不具有此能力。

产生构建体pZP2N-FCtA1R以整合来自热带假丝酵母的密码子优化的CYP(CtALK1s,基因库登录号P10615)和CPR(CtCPRs,基因库登录号P37201)编码序列的每一个的一个拷贝。每个编码序列是在异源启动子和3’-终止序列的控制之下。分别将NcoI和NotI内切核酸酶位点添加在编码CtALK1或CtCPR的每个密码子优化的序列的翻译起始密码子(ATG)附近和终止密码子之后。将pZP2N-FCtA1R质粒的组分进一步在表12中描述。

表20

质粒pZP2N-FCtA1R的描述

用AscI/SphI消化质粒pZP2N-FCtA1R,并且然后根据一般方法用于转化菌株Y2224、D0003、D0004和D0009。将转化体细胞接种在MM平板上并在30℃维持2天。将来自每次转化的单个菌落再次划线到MM平板上,并然后在30℃接种到液体MM中,并以250rpm摇动1天。将过夜培养的细胞用于接种在250-mL烧瓶中的25mL的液体YPD4-B培养基,然后将其在30℃以180rpm摇动。40小时后,添加2.0mL 1M NaHCO3将这些培养物调节至pH 8.0,之后将棕榈酸乙酯(W245100,西格玛奥德里奇公司(Sigma-Aldrich))直接添加至培养基中至终浓度为8mg mL-1。然后在30℃,以180rpm将这些培养物再摇动4天,其后根据一般方法将来自每个烧瓶培养物的全发酵液样品进行LCDA分析。

从用pZP2N-FCtA1R转化每个亲本菌株(Y2224、D0003、D0004、D0009)产生的菌株通过GC进行分析。在亲本菌株Y2224、D0003、或D0009的转化体中未检测到十六烷二酸(C16:0 LCDA)。然而,亲本菌株D0004的转化体生产超过1g/L的C16:0 LCDA。将生产1.24g/L C16:0 LCDA的一个D0004-转化体命名为菌株D0101。

随后进行菌株D0101的烧瓶分析。具体地,将D0101置于250-mL带挡板的烧瓶中的25-mL培养物中,其中添加棕榈酸乙酯至终浓度16mg mL-1。在30℃以180rpm将培养物摇动4天。该培养物以约5g/L生产C16:0 LCDA。

应注意的是用于转化D0004以产生菌株D0101的pZP2N-FCtA1R DNA可以潜在地敲除Pox2基因(基因库登录号AJ001300)。然而,在D0101中这样的敲除没有被证实。菌株D0101相对于野生型解脂耶氏酵母ATCC#20362的基因型是Ura3+、dgat1-、dgat2-、pex3-、未知1-、FBA1::CtALK1s::Pex20、FBAINm::CtCPRs::Pex16。

值得注意的是亲本菌株D0004(dgat1-、dgat2-、pex3-、urα3-)的转化体(例如,菌株D0101)生产LCDA,而亲本菌株D0009(dgat1-、dgat2-、pex10-、ura3-)的转化体不具有此能力。尽管两种类型的转化体具有(i)下调的PEX基因(导致受损的过氧化物酶体功能和阻断的β-氧化),和(ii)在其他条件下相同的基因型(包括导致降低的油储存的下调的DGAT基因),仅具有下调的PEX3的酵母能够生产LCDA。与pex10-菌株类似,pex16-菌株还缺少生产LCDA的能力(数据未显示)。因此,阻断过氧化物酶体功能和β-氧化的方式对从含有脂肪酸的底物生产LCDA具有显著的影响。

因此,具有下调的PEX3表达的酵母(例如,耶氏酵母属)可以从含有脂肪酸的底物生产LCDA。

序列表

<110> E. I.内穆尔杜邦公司

Zhu, Quinn

<120> 用微生物高水平生产长链二羧酸

<130> CL6467

<150> US 62/195,340

<151> 2015-07-22

<150> US 62/195,338

<151> 2015-07-22

<160> 115

<170> PatentIn版本3.5

<210> 1

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物17864-900F

<400> 1

cacagaccgg cttctcaact t 21

<210> 2

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物17864-967R

<400> 2

aggtgaccat ctcgaacaca aa 22

<210> 3

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物5885-1034F

<400> 3

cttctccctg cgtcactctg t 21

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物5885-1097R

<400> 4

ttgccacaag ccttgatgtg 20

<210> 5

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物14234-1341F

<400> 5

ggctccggct gagattga 18

<210> 6

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物14234-1404R

<400> 6

aatgacagcg acatccttta cca 23

<210> 7

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物11979-1248F

<400> 7

tcagctcaaa ctcgacgact tg 22

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物11979-1315R

<400> 8

ccacaggcag aggctcatct 20

<210> 9

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物7755-282F

<400> 9

ttacagctcg ttgccctacc a 21

<210> 10

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 引物7755-343R

<400> 10

tggcgggcga aatgg 15

<210> 11

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物12419-1677F

<400> 11

tgctggcatc gtggtgat 18

<210> 12

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物12419-1744R

<400> 12

gcaacaatcg tcgcagaatc t 21

<210> 13

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物 20405-626F

<400> 13

ccgtggagct cacccatt 18

<210> 14

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物20405-691R

<400> 14

ggttaggtgc attctttgct gtct 24

<210> 15

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物5456-1758F

<400> 15

ctctgctgct atggttgtcg at 22

<210> 16

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物5456-1825R

<400> 16

tgcaaccctc atcaccagtt c 21

<210> 17

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物15103-516F

<400> 17

caaggccgtg cgtgtca 17

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物15103-588R

<400> 18

gagatcggga gccacaattg 20

<210> 19

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物5951-327F

<400> 19

gcattttgcc gcacttgat 19

<210> 20

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物5951-399R

<400> 20

gacgagctcc gccacagt 18

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物17314-47F

<400> 21

tgttctgtgg caacattgca 20

<210> 22

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物17314-112R

<400> 22

cacttgtttt ggagctcttg ga 22

<210> 23

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物6556-1321F

<400> 23

gcgttcgaag aggcttctga 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物6556-1384R

<400> 24

ttcgcaacca tcgtttcttg 20

<210> 25

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物12859-1002

<400> 25

ccagattctg ctgaacacaa aga 23

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物12859-1071

<400> 26

cgaagagcac gatcgaatga 20

<210> 27

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物9284-924F

<400> 27

tctgcttgtt gacgaccgaa t 21

<210> 28

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物9284-995R

<400> 28

gggttgttca ccagcatgtt g 21

<210> 29

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物16016-1393F

<400> 29

atgggccgat acggtaagct 20

<210> 30

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物/探针16016-1422T

<400> 30

catcctggcc acccgacaga cc 22

<210> 31

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物YL-18S-329F

<400> 31

cctgagaaac ggctaccaca tc 22

<210> 32

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物YL-18S-395R

<400> 32

ccctgtgtca ggattgggta a 21

<210> 33

<211> 700

<212> PRT

<213> 酿酒酵母

<400> 33

Met Val Ala Gln Tyr Thr Val Pro Val Gly Lys Ala Ala Asn Glu His

1 5 10 15

Glu Thr Ala Pro Arg Arg Asn Tyr Gln Cys Arg Glu Lys Pro Leu Val

20 25 30

Arg Pro Pro Asn Thr Lys Cys Ser Thr Val Tyr Glu Phe Val Leu Glu

35 40 45

Cys Phe Gln Lys Asn Lys Asn Ser Asn Ala Met Gly Trp Arg Asp Val

50 55 60

Lys Glu Ile His Glu Glu Ser Lys Ser Val Met Lys Lys Val Asp Gly

65 70 75 80

Lys Glu Thr Ser Val Glu Lys Lys Trp Met Tyr Tyr Glu Leu Ser His

85 90 95

Tyr His Tyr Asn Ser Phe Asp Gln Leu Thr Asp Ile Met His Glu Ile

100 105 110

Gly Arg Gly Leu Val Lys Ile Gly Leu Lys Pro Asn Asp Asp Asp Lys

115 120 125

Leu His Leu Tyr Ala Ala Thr Ser His Lys Trp Met Lys Met Phe Leu

130 135 140

Gly Ala Gln Ser Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu

145 150 155 160

Gly Glu Lys Gly Leu Ile His Ser Leu Val Gln Thr Gly Ser Lys Ala

165 170 175

Ile Phe Thr Asp Asn Ser Leu Leu Pro Ser Leu Ile Lys Pro Val Gln

180 185 190

Ala Ala Gln Asp Val Lys Tyr Ile Ile His Phe Asp Ser Ile Ser Ser

195 200 205

Glu Asp Arg Arg Gln Ser Gly Lys Ile Tyr Gln Ser Ala His Asp Ala

210 215 220

Ile Asn Arg Ile Lys Glu Val Arg Pro Asp Ile Lys Thr Phe Ser Phe

225 230 235 240

Asp Asp Ile Leu Lys Leu Gly Lys Glu Ser Cys Asn Glu Ile Asp Val

245 250 255

His Pro Pro Gly Lys Asp Asp Leu Cys Cys Ile Met Tyr Thr Ser Gly

260 265 270

Ser Thr Gly Glu Pro Lys Gly Val Val Leu Lys His Ser Asn Val Val

275 280 285

Ala Gly Val Gly Gly Ala Ser Leu Asn Val Leu Lys Phe Val Gly Asn

290 295 300

Thr Asp Arg Val Ile Cys Phe Leu Pro Leu Ala His Ile Phe Glu Leu

305 310 315 320

Val Phe Glu Leu Leu Ser Phe Tyr Trp Gly Ala Cys Ile Gly Tyr Ala

325 330 335

Thr Val Lys Thr Leu Thr Ser Ser Ser Val Arg Asn Cys Gln Gly Asp

340 345 350

Leu Gln Glu Phe Lys Pro Thr Ile Met Val Gly Val Ala Ala Val Trp

355 360 365

Glu Thr Val Arg Lys Gly Ile Leu Asn Gln Ile Asp Asn Leu Pro Phe

370 375 380

Leu Thr Lys Lys Ile Phe Trp Thr Ala Tyr Asn Thr Lys Leu Asn Met

385 390 395 400

Gln Arg Leu His Ile Pro Gly Gly Gly Ala Leu Gly Asn Leu Val Phe

405 410 415

Lys Lys Ile Arg Thr Ala Thr Gly Gly Gln Leu Arg Tyr Leu Leu Asn

420 425 430

Gly Gly Ser Pro Ile Ser Arg Asp Ala Gln Glu Phe Ile Thr Asn Leu

435 440 445

Ile Cys Pro Met Leu Ile Gly Tyr Gly Leu Thr Glu Thr Cys Ala Ser

450 455 460

Thr Thr Ile Leu Asp Pro Ala Asn Phe Glu Leu Gly Val Ala Gly Asp

465 470 475 480

Leu Thr Gly Cys Val Thr Val Lys Leu Val Asp Val Glu Glu Leu Gly

485 490 495

Tyr Phe Ala Lys Asn Asn Gln Gly Glu Val Trp Ile Thr Gly Ala Asn

500 505 510

Val Thr Pro Glu Tyr Tyr Lys Asn Glu Glu Glu Thr Ser Gln Ala Leu

515 520 525

Thr Ser Asp Gly Trp Phe Lys Thr Gly Asp Ile Gly Glu Trp Glu Ala

530 535 540

Asn Gly His Leu Lys Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr

545 550 555 560

Met Asn Gly Glu Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg

565 570 575

Ser Asn Glu Tyr Val Ala Asn Ile Cys Val Tyr Ala Asp Gln Ser Lys

580 585 590

Thr Lys Pro Val Gly Ile Ile Val Pro Asn His Ala Pro Leu Thr Lys

595 600 605

Leu Ala Lys Lys Leu Gly Ile Met Glu Gln Lys Asp Ser Ser Ile Asn

610 615 620

Ile Glu Asn Tyr Leu Glu Asp Ala Lys Leu Ile Lys Ala Val Tyr Ser

625 630 635 640

Asp Leu Leu Lys Thr Gly Lys Asp Gln Gly Leu Val Gly Ile Glu Leu

645 650 655

Leu Ala Gly Ile Val Phe Phe Asp Gly Glu Trp Thr Pro Gln Asn Gly

660 665 670

Phe Val Thr Ser Ala Gln Lys Leu Lys Arg Lys Asp Ile Leu Asn Ala

675 680 685

Val Lys Asp Lys Val Asp Ala Val Tyr Ser Ser Ser

690 695 700

<210> 34

<211> 744

<212> PRT

<213> 酿酒酵母

<400> 34

Met Ala Ala Pro Asp Tyr Ala Leu Thr Asp Leu Ile Glu Ser Asp Pro

1 5 10 15

Arg Phe Glu Ser Leu Lys Thr Arg Leu Ala Gly Tyr Thr Lys Gly Ser

20 25 30

Asp Glu Tyr Ile Glu Glu Leu Tyr Ser Gln Leu Pro Leu Thr Ser Tyr

35 40 45

Pro Arg Tyr Lys Thr Phe Leu Lys Lys Gln Ala Val Ala Ile Ser Asn

50 55 60

Pro Asp Asn Glu Ala Gly Phe Ser Ser Ile Tyr Arg Ser Ser Leu Ser

65 70 75 80

Ser Glu Asn Leu Val Ser Cys Val Asp Lys Asn Leu Arg Thr Ala Tyr

85 90 95

Asp His Phe Met Phe Ser Ala Arg Arg Trp Pro Gln Arg Asp Cys Leu

100 105 110

Gly Ser Arg Pro Ile Asp Lys Ala Thr Gly Thr Trp Glu Glu Thr Phe

115 120 125

Arg Phe Glu Ser Tyr Ser Thr Val Ser Lys Arg Cys His Asn Ile Gly

130 135 140

Ser Gly Ile Leu Ser Leu Val Asn Thr Lys Arg Lys Arg Pro Leu Glu

145 150 155 160

Ala Asn Asp Phe Val Val Ala Ile Leu Ser His Asn Asn Pro Glu Trp

165 170 175

Ile Leu Thr Asp Leu Ala Cys Gln Ala Tyr Ser Leu Thr Asn Thr Ala

180 185 190

Leu Tyr Glu Thr Leu Gly Pro Asn Thr Ser Glu Tyr Ile Leu Asn Leu

195 200 205

Thr Glu Ala Pro Ile Leu Ile Phe Ala Lys Ser Asn Met Tyr His Val

210 215 220

Leu Lys Met Val Pro Asp Met Lys Phe Val Asn Thr Leu Val Cys Met

225 230 235 240

Asp Glu Leu Thr His Asp Glu Leu Arg Met Leu Asn Glu Ser Leu Leu

245 250 255

Pro Val Lys Cys Asn Ser Leu Asn Glu Lys Ile Thr Phe Phe Ser Leu

260 265 270

Glu Gln Val Glu Gln Val Gly Cys Phe Asn Lys Ile Pro Ala Ile Pro

275 280 285

Pro Thr Pro Asp Ser Leu Tyr Thr Ile Ser Phe Thr Ser Gly Thr Thr

290 295 300

Gly Leu Pro Lys Gly Val Glu Met Ser His Arg Asn Ile Ala Ser Gly

305 310 315 320

Ile Ala Phe Ala Phe Ser Thr Phe Arg Ile Pro Pro Asp Lys Arg Asn

325 330 335

Gln Gln Leu Tyr Asp Met Cys Phe Leu Pro Leu Ala His Ile Phe Glu

340 345 350

Arg Met Val Ile Ala Tyr Asp Leu Ala Ile Gly Phe Gly Ile Gly Phe

355 360 365

Leu His Lys Pro Asp Pro Thr Val Leu Val Glu Asp Leu Lys Ile Leu

370 375 380

Lys Pro Tyr Ala Val Ala Leu Val Pro Arg Ile Leu Thr Arg Phe Glu

385 390 395 400

Ala Gly Ile Lys Asn Ala Leu Asp Lys Ser Thr Val Gln Arg Asn Val

405 410 415

Ala Asn Thr Ile Leu Asp Ser Lys Ser Ala Arg Phe Thr Ala Arg Gly

420 425 430

Gly Pro Asp Lys Ser Ile Met Asn Phe Leu Val Tyr His Arg Val Leu

435 440 445

Ile Asp Lys Ile Arg Asp Ser Leu Gly Leu Ser Asn Asn Ser Phe Ile

450 455 460

Ile Thr Gly Ser Ala Pro Ile Ser Lys Asp Thr Leu Leu Phe Leu Arg

465 470 475 480

Ser Ala Leu Asp Ile Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr

485 490 495

Phe Ala Gly Val Cys Leu Ser Glu Pro Phe Glu Lys Asp Val Gly Ser

500 505 510

Cys Gly Ala Ile Gly Ile Ser Ala Glu Cys Arg Leu Lys Ser Val Pro

515 520 525

Glu Met Gly Tyr His Ala Asp Lys Asp Leu Lys Gly Glu Leu Gln Ile

530 535 540

Arg Gly Pro Gln Val Phe Glu Arg Tyr Phe Lys Asn Pro Asn Glu Thr

545 550 555 560

Ser Lys Ala Val Asp Gln Asp Gly Trp Phe Ser Thr Gly Asp Val Ala

565 570 575

Phe Ile Asp Gly Lys Gly Arg Ile Ser Val Ile Asp Arg Val Lys Asn

580 585 590

Phe Phe Lys Leu Ala His Gly Glu Tyr Ile Ala Pro Glu Lys Ile Glu

595 600 605

Asn Ile Tyr Leu Ser Ser Cys Pro Tyr Ile Thr Gln Ile Phe Val Phe

610 615 620

Gly Asp Pro Leu Lys Thr Phe Leu Val Gly Ile Val Gly Val Asp Val

625 630 635 640

Asp Ala Ala Gln Pro Ile Leu Ala Ala Lys His Pro Glu Val Lys Thr

645 650 655

Trp Thr Lys Glu Val Leu Val Glu Asn Leu Asn Arg Asn Lys Lys Leu

660 665 670

Arg Lys Glu Phe Leu Asn Lys Ile Asn Lys Cys Thr Asp Gly Leu Gln

675 680 685

Gly Phe Glu Lys Leu His Asn Ile Lys Val Gly Leu Glu Pro Leu Thr

690 695 700

Leu Glu Asp Asp Val Val Thr Pro Thr Phe Lys Ile Lys Arg Ala Lys

705 710 715 720

Ala Ser Lys Phe Phe Lys Asp Thr Leu Asp Gln Leu Tyr Ala Glu Gly

725 730 735

Ser Leu Val Lys Thr Glu Lys Leu

740

<210> 35

<211> 2076

<212> DNA

<213> 人工序列

<220>

<223> YlFaa1

<400> 35

atggtcggat acaccatctc ctcgaagccc gtgtccgtcg aggttggccc cgccaagcct 60

ggcgagactg ctccccgacg gaacgtcatt gccaaggacg ctcctgtggt cttccccgac 120

aacgattcgt ccctcaccac tgtctacaag ctgttcaaaa agtacgccga gatcaactcc 180

gaacgaaagg ctatgggatg gcgagacacc atcgacattc acgtggagac caagcaggtc 240

acaaaggtgg tcgacggcgt ggagaagaaa gtgcccaagg aatggaagta cttcgagatg 300

ggtccttaca agtggctgtc ctacaaggag gccctcaagc tggttcacga ttatggagct 360

ggtcttcgac atctcggcat caagcccaaa gagaagatgc acatttacgc acagacctct 420

caccgatgga tgctttccgg actggcctct ctctcgcagg gcattcccat cgtcactgcc 480

tacgacaccc ttggagagga aggtctcaca cgatctctgc aggagaccaa ctccgtcatc 540

atgttcacgg acaaggctct tctgtcgtct ctcaaggtgt ccctcaaaaa gggcaccgat 600

ctgcgaatca ttatctacgg aggcgacctg actcccgatg acaagaaagc cggaaacacc 660

gagatcgacg ccatcaagga gattgttcca gacatgaaga tctacactat ggacgaggtt 720

gtcgctctcg gtcgagagca tcctcacccc gtggaagagg tcgactacga ggatctggcc 780

ttcatcatgt acacctctgg ctccacagga gttcccaagg gtgtcgtgct gcagcacaag 840

cagatcctcg cctctgtggc cggtgtcacc aagattatcg acagatccat tatcggcaat 900

acagatcgac tgctcaactt tcttcccctc gcacacatct tcgagtttgt gttcgagatg 960

gtcaccttct ggtggggtgc ctctctgggc tacggaactg tcaagaccat ttccgacctg 1020

tcgatgaaga actgcaaggg agacatccga gagctcaagc ccaccatcat ggtcggcgtt 1080

ccagctgtct gggaacccat gcggaagggt attcttggca aaatcaagga gctgtctcct 1140

ctcatgcagc gagtcttctg ggcctccttt gctgccaagc aacgtctcga cgagaacgga 1200

cttcccggtg gctctattct ggattcgctc atcttcaaga aagtcaagga cgccactgga 1260

ggctgtctcc gatacgtgtg caacggaggt gctccagttt ccgtcgacac ccagaagttc 1320

attactaccc ttatctgtcc catgctcatt ggatgcggtc tgaccgagac tacagccaac 1380

accactatca tgtctcccaa gtcctatgcc tttggcacca ttggagagcc tactgcagcc 1440

gtcaccctca agcttatcga cgtgcccgaa gctggctact tcgccgagaa caatcaggga 1500

gagctgtgca tcaagggcaa cgtggtcatg aaggagtatt acaagaacga ggaagagacc 1560

aagaaagcgt tctccgacga tggctacttt ctcaccggag acattgccga gtggactgcc 1620

aatggtcagc ttcgaattat cgacagacga aagaacctcg tcaagaccca gaacggagag 1680

tacattgctc tggagaagct cgaaacacag taccgatcgt cttcctacgt tgccaacctg 1740

tgcgtctacg ccgaccagaa ccgagtcaag cccatcgctc tggtcattcc caacgagggt 1800

cctaccaaaa agcttgccca gagcttgggc gtggattccg acgactggga tgccgtctgt 1860

tccaacaaga aagtggtcaa ggctgttctc aaggacatgc tggataccgg acgatctctc 1920

ggtctgtccg gcatcgagct gctgcaagga atcgtgttgc tgcctggcga gtggactccc 1980

cagaacagct acctcaccgc tgcccagaag ctcaaccgaa agaagattgt cgatgacaac 2040

aaaaaggaga tcgacgagtg ctacgagcag tcctaa 2076

<210> 36

<211> 691

<212> PRT

<213> 解脂耶氏酵母

<400> 36

Met Val Gly Tyr Thr Ile Ser Ser Lys Pro Val Ser Val Glu Val Gly

1 5 10 15

Pro Ala Lys Pro Gly Glu Thr Ala Pro Arg Arg Asn Val Ile Ala Lys

20 25 30

Asp Ala Pro Val Val Phe Pro Asp Asn Asp Ser Ser Leu Thr Thr Val

35 40 45

Tyr Lys Leu Phe Lys Lys Tyr Ala Glu Ile Asn Ser Glu Arg Lys Ala

50 55 60

Met Gly Trp Arg Asp Thr Ile Asp Ile His Val Glu Thr Lys Gln Val

65 70 75 80

Thr Lys Val Val Asp Gly Val Glu Lys Lys Val Pro Lys Glu Trp Lys

85 90 95

Tyr Phe Glu Met Gly Pro Tyr Lys Trp Leu Ser Tyr Lys Glu Ala Leu

100 105 110

Lys Leu Val His Asp Tyr Gly Ala Gly Leu Arg His Leu Gly Ile Lys

115 120 125

Pro Lys Glu Lys Met His Ile Tyr Ala Gln Thr Ser His Arg Trp Met

130 135 140

Leu Ser Gly Leu Ala Ser Leu Ser Gln Gly Ile Pro Ile Val Thr Ala

145 150 155 160

Tyr Asp Thr Leu Gly Glu Glu Gly Leu Thr Arg Ser Leu Gln Glu Thr

165 170 175

Asn Ser Val Ile Met Phe Thr Asp Lys Ala Leu Leu Ser Ser Leu Lys

180 185 190

Val Ser Leu Lys Lys Gly Thr Asp Leu Arg Ile Ile Ile Tyr Gly Gly

195 200 205

Asp Leu Thr Pro Asp Asp Lys Lys Ala Gly Asn Thr Glu Ile Asp Ala

210 215 220

Ile Lys Glu Ile Val Pro Asp Met Lys Ile Tyr Thr Met Asp Glu Val

225 230 235 240

Val Ala Leu Gly Arg Glu His Pro His Pro Val Glu Glu Val Asp Tyr

245 250 255

Glu Asp Leu Ala Phe Ile Met Tyr Thr Ser Gly Ser Thr Gly Val Pro

260 265 270

Lys Gly Val Val Leu Gln His Lys Gln Ile Leu Ala Ser Val Ala Gly

275 280 285

Val Thr Lys Ile Ile Asp Arg Ser Ile Ile Gly Asn Thr Asp Arg Leu

290 295 300

Leu Asn Phe Leu Pro Leu Ala His Ile Phe Glu Phe Val Phe Glu Met

305 310 315 320

Val Thr Phe Trp Trp Gly Ala Ser Leu Gly Tyr Gly Thr Val Lys Thr

325 330 335

Ile Ser Asp Leu Ser Met Lys Asn Cys Lys Gly Asp Ile Arg Glu Leu

340 345 350

Lys Pro Thr Ile Met Val Gly Val Pro Ala Val Trp Glu Pro Met Arg

355 360 365

Lys Gly Ile Leu Gly Lys Ile Lys Glu Leu Ser Pro Leu Met Gln Arg

370 375 380

Val Phe Trp Ala Ser Phe Ala Ala Lys Gln Arg Leu Asp Glu Asn Gly

385 390 395 400

Leu Pro Gly Gly Ser Ile Leu Asp Ser Leu Ile Phe Lys Lys Val Lys

405 410 415

Asp Ala Thr Gly Gly Cys Leu Arg Tyr Val Cys Asn Gly Gly Ala Pro

420 425 430

Val Ser Val Asp Thr Gln Lys Phe Ile Thr Thr Leu Ile Cys Pro Met

435 440 445

Leu Ile Gly Cys Gly Leu Thr Glu Thr Thr Ala Asn Thr Thr Ile Met

450 455 460

Ser Pro Lys Ser Tyr Ala Phe Gly Thr Ile Gly Glu Pro Thr Ala Ala

465 470 475 480

Val Thr Leu Lys Leu Ile Asp Val Pro Glu Ala Gly Tyr Phe Ala Glu

485 490 495

Asn Asn Gln Gly Glu Leu Cys Ile Lys Gly Asn Val Val Met Lys Glu

500 505 510

Tyr Tyr Lys Asn Glu Glu Glu Thr Lys Lys Ala Phe Ser Asp Asp Gly

515 520 525

Tyr Phe Leu Thr Gly Asp Ile Ala Glu Trp Thr Ala Asn Gly Gln Leu

530 535 540

Arg Ile Ile Asp Arg Arg Lys Asn Leu Val Lys Thr Gln Asn Gly Glu

545 550 555 560

Tyr Ile Ala Leu Glu Lys Leu Glu Thr Gln Tyr Arg Ser Ser Ser Tyr

565 570 575

Val Ala Asn Leu Cys Val Tyr Ala Asp Gln Asn Arg Val Lys Pro Ile

580 585 590

Ala Leu Val Ile Pro Asn Glu Gly Pro Thr Lys Lys Leu Ala Gln Ser

595 600 605

Leu Gly Val Asp Ser Asp Asp Trp Asp Ala Val Cys Ser Asn Lys Lys

610 615 620

Val Val Lys Ala Val Leu Lys Asp Met Leu Asp Thr Gly Arg Ser Leu

625 630 635 640

Gly Leu Ser Gly Ile Glu Leu Leu Gln Gly Ile Val Leu Leu Pro Gly

645 650 655

Glu Trp Thr Pro Gln Asn Ser Tyr Leu Thr Ala Ala Gln Lys Leu Asn

660 665 670

Arg Lys Lys Ile Val Asp Asp Asn Lys Lys Glu Ile Asp Glu Cys Tyr

675 680 685

Glu Gln Ser

690

<210> 37

<211> 574

<212> PRT

<213> 解脂耶氏酵母

<400> 37

Met Thr Thr Ile Ile His Lys Ser Thr Phe Pro Asp Ile Glu Leu Phe

1 5 10 15

Gln Gly Ser Ile Thr Asp Phe Ile Arg Thr Gly Ala Tyr Ala Glu Asp

20 25 30

Asp Tyr Lys Pro Cys Met Ile Asp Ala Glu Thr Gly Glu Gln Leu Thr

35 40 45

Gln Lys Gln Ile Leu Asp Cys Ala Asp Gln Phe Arg Ser Leu Leu Tyr

50 55 60

Gln His Gly Val Gln Lys Thr Pro Asn Arg Asp Glu Arg Ile Gly Asp

65 70 75 80

Val Val Ile Pro Phe Ile Asp Asn Asn Ile Tyr Leu Pro Ala Ile His

85 90 95

Tyr Ala Cys Leu Glu Leu Gly Cys Cys Met Asn Pro Ala Ser Thr Gln

100 105 110

Gln Thr Pro Leu Glu Leu Ser Lys Gln Ile Arg Val Thr Asp Pro Lys

115 120 125

Val Ile Ile Tyr Gln Arg Lys Tyr Arg Lys Thr Val Met His Ala Ile

130 135 140

Asp Leu Val Cys Tyr Thr Asn Phe Pro Ile Val Ile Glu Phe Glu Thr

145 150 155 160

Met Leu Phe Leu Arg Asn Ser Val Pro Pro Pro Pro Lys Lys Ala Lys

165 170 175

Phe His Ile Thr Ser Thr Glu Gln Ala Arg Lys Arg Ile Ala Tyr Leu

180 185 190

Gly Met Ser Ser Gly Thr Ser Gly Lys Ser Lys Ala Val Arg Leu Ser

195 200 205

His His Asn Ile Val Ala Cys Ser Gln Val Ser Gln Val Thr Phe Pro

210 215 220

Ala Leu Tyr Lys Ala Ser Asn Val Cys Val Ala Val Leu Pro Ser Cys

225 230 235 240

His Val Phe Gly Leu Tyr Ile Phe Phe Met Val Leu Pro Arg Ser Gly

245 250 255

Gly Thr Thr Ile Met His Thr Lys Phe Asp Leu Lys Gln Leu Leu Glu

260 265 270

Ser Gln Lys Lys Tyr Lys Ala Asn Phe Leu Pro Leu Val Pro Pro Ile

275 280 285

Ala Val Gln Leu Ala Lys Asn Pro Met Val Lys Asn Tyr Ala Asp Ser

290 295 300

Leu Lys Gln Val Lys Leu Ile Met Ser Ala Ala Ala Pro Leu Gly Ala

305 310 315 320

Glu Val Thr Gln Ser Leu Ile Lys Ala Ile Gly Pro Gln Val Arg Val

325 330 335

Val Gln Gly Tyr Gly Met Thr Glu Thr Ser Pro Cys Val Thr Leu Phe

340 345 350

Asp Pro Ala Asp Pro His Leu His Ile Lys Ala Cys Gly Lys Leu Val

355 360 365

Pro Asn Cys Glu Val Arg Ile Val Ala Asp Gly Val Asp Gln Pro Ala

370 375 380

Tyr Ser Gly Ser Val Ser Asp Val Ala Lys Asn Lys Thr Asp Asn Leu

385 390 395 400

Pro Val Gly Glu Ile Trp Val Arg Gly Pro Gln Val Met Asp Gly Tyr

405 410 415

His Lys Asn Lys Ser Ala Thr Ser Glu Ala Phe Val Glu Ala Asn Asp

420 425 430

Ser Ser Val Cys Tyr Asn Thr Lys Trp Leu Arg Thr Gly Asp Val Gly

435 440 445

Leu Val Asp Ser Leu Gly Arg Phe Met Ile Val Asp Arg Thr Lys Glu

450 455 460

Met Ile Lys Ser Met Ser Lys Gln Val Ala Pro Ala Glu Leu Glu Asp

465 470 475 480

Met Leu Leu Ala His Ala Asp Val Ser Asp Ala Ala Val Ile Gly Val

485 490 495

Glu Asn Glu Ala Lys Gly Thr Glu Gln Ile Arg Ala Phe Leu Val Leu

500 505 510

Lys Lys Gly Gly Asp Ala Leu Glu Val Lys Lys Trp Met Asp Ser Lys

515 520 525

Leu Pro Lys Tyr Lys Gln Leu His Gly Gly Val Val Val Ile Asp Gln

530 535 540

Ile Pro Lys Ser Gln Ala Gly Lys Ile Leu Arg Arg Met Leu Arg Leu

545 550 555 560

Arg Gln Asp Asp Val Val Leu Gly Thr Asp Gln Ala Lys Leu

565 570

<210> 38

<211> 1647

<212> DNA

<213> 人工序列

<220>

<223> YlACoS-3P

<400> 38

atggccatca tccactccac cggaactctg cccatcttca acggtaccgt caccgattac 60

ctgcgaacaa agccttctta ctcgtccaca gatccagcct acatcgacgt ggttacaggc 120

aactctatca gctactccga ggtctggaag cttgccgacc gactctcctc tgctctgtac 180

aacgactacg gactcaccga cgccaagccc gacgagaatg tgggtcctgt tgtcatgctg 240

cacgctgtca attcgcctct cctggcatct gttcactacg ctcttctgga tctgggcgtc 300

acaatcactc ccgcagctgc cacctacgag gctggcgatc tcgcacatca aatcaaggtg 360

tgctctccgt ccctggtcat ttgcaaccag cagttcgaac ccaaggtcaa atctgcctcc 420

agcaacacca agctcatttt catcgaggat ctgctcaaaa cccagtcgtc tgctccctgg 480

aaaaagttca ctacctccaa ccccaaccga gttgcctacc tgggcatgtc cagtggaacc 540

tctggtctcc ccaaggcggt tcaacagacc cacatcaaca tgtcgtcttc caccgaagcc 600

gtcatttcct ctcagaccat cttcagcgct cgaaagaacg tcaccgcagc cattgtgccc 660

atgactcatg tctacggact caccaagttt gttttccact ctgtcgcagg ctcaatgacc 720

accgttgtgt tccccaagtt ctccctggtc gacctcctgg aggcccagat caagtacaag 780

atcaacattc tgtatctggt tcctccagtg gtcttggctc tggccaagga ctctcgtgta 840

cagccctaca tcaagtccat ttgcgagctc accactctga ttgccactgg tgcggctccc 900

cttcctccca ctgcaggcga cgcccttctg gagcgactta cgggcaacaa agagggaaac 960

agagacaacg gtatggatcc cttggttctc atccagggct acggactcac agagactctc 1020

caggtgtctg tcttcaagcc agaggatccc gaacgagatc tcaagaccgt gggcaaactg 1080

cttcccaaca ccgaggttcg aattgtcggc gagaagggag atgttccgcg ttccaaatgg 1140

tcgtttgtca ctcctccaac cggcgaaatc tacattcgag gtccccacgt gactcctggt 1200

tacttcaaca acgactctgc caactctgag tcctttgacg gcgagtggct caagaccggc 1260

gatatcggat acatggacct ggaaggtcga ctcaccattg tggaccgaaa caaggagatg 1320

atcaaggtca acggacgtca ggttgctcct gccgagatcg aatctgtgct gctgggtcat 1380

cctatggtca aggatgtggc cgtcattgga gtcaccaatc ccgacagagg cacggagtct 1440

gctcgggcgt ttcttgttac tgaagctcga gctctccctg tcatcaagca gtggtttgac 1500

cgtcgagttc cctcctacaa gcgactttac ggaggcattg tggttgtcga tgccattccc 1560

aagtctgcct cgggcaagat tctgcgacgg gtcctcagag agcgaaaggg cgactccgtg 1620

tttggagagt atgtcgagga agtctaa 1647

<210> 39

<211> 548

<212> PRT

<213> 人工序列

<220>

<223> YlACoS-3P蛋白质

<400> 39

Met Ala Ile Ile His Ser Thr Gly Thr Leu Pro Ile Phe Asn Gly Thr

1 5 10 15

Val Thr Asp Tyr Leu Arg Thr Lys Pro Ser Tyr Ser Ser Thr Asp Pro

20 25 30

Ala Tyr Ile Asp Val Val Thr Gly Asn Ser Ile Ser Tyr Ser Glu Val

35 40 45

Trp Lys Leu Ala Asp Arg Leu Ser Ser Ala Leu Tyr Asn Asp Tyr Gly

50 55 60

Leu Thr Asp Ala Lys Pro Asp Glu Asn Val Gly Pro Val Val Met Leu

65 70 75 80

His Ala Val Asn Ser Pro Leu Leu Ala Ser Val His Tyr Ala Leu Leu

85 90 95

Asp Leu Gly Val Thr Ile Thr Pro Ala Ala Ala Thr Tyr Glu Ala Gly

100 105 110

Asp Leu Ala His Gln Ile Lys Val Cys Ser Pro Ser Leu Val Ile Cys

115 120 125

Asn Gln Gln Phe Glu Pro Lys Val Lys Ser Ala Ser Ser Asn Thr Lys

130 135 140

Leu Ile Phe Ile Glu Asp Leu Leu Lys Thr Gln Ser Ser Ala Pro Trp

145 150 155 160

Lys Lys Phe Thr Thr Ser Asn Pro Asn Arg Val Ala Tyr Leu Gly Met

165 170 175

Ser Ser Gly Thr Ser Gly Leu Pro Lys Ala Val Gln Gln Thr His Ile

180 185 190

Asn Met Ser Ser Ser Thr Glu Ala Val Ile Ser Ser Gln Thr Ile Phe

195 200 205

Ser Ala Arg Lys Asn Val Thr Ala Ala Ile Val Pro Met Thr His Val

210 215 220

Tyr Gly Leu Thr Lys Phe Val Phe His Ser Val Ala Gly Ser Met Thr

225 230 235 240

Thr Val Val Phe Pro Lys Phe Ser Leu Val Asp Leu Leu Glu Ala Gln

245 250 255

Ile Lys Tyr Lys Ile Asn Ile Leu Tyr Leu Val Pro Pro Val Val Leu

260 265 270

Ala Leu Ala Lys Asp Ser Arg Val Gln Pro Tyr Ile Lys Ser Ile Cys

275 280 285

Glu Leu Thr Thr Leu Ile Ala Thr Gly Ala Ala Pro Leu Pro Pro Thr

290 295 300

Ala Gly Asp Ala Leu Leu Glu Arg Leu Thr Gly Asn Lys Glu Gly Asn

305 310 315 320

Arg Asp Asn Gly Met Asp Pro Leu Val Leu Ile Gln Gly Tyr Gly Leu

325 330 335

Thr Glu Thr Leu Gln Val Ser Val Phe Lys Pro Glu Asp Pro Glu Arg

340 345 350

Asp Leu Lys Thr Val Gly Lys Leu Leu Pro Asn Thr Glu Val Arg Ile

355 360 365

Val Gly Glu Lys Gly Asp Val Pro Arg Ser Lys Trp Ser Phe Val Thr

370 375 380

Pro Pro Thr Gly Glu Ile Tyr Ile Arg Gly Pro His Val Thr Pro Gly

385 390 395 400

Tyr Phe Asn Asn Asp Ser Ala Asn Ser Glu Ser Phe Asp Gly Glu Trp

405 410 415

Leu Lys Thr Gly Asp Ile Gly Tyr Met Asp Leu Glu Gly Arg Leu Thr

420 425 430

Ile Val Asp Arg Asn Lys Glu Met Ile Lys Val Asn Gly Arg Gln Val

435 440 445

Ala Pro Ala Glu Ile Glu Ser Val Leu Leu Gly His Pro Met Val Lys

450 455 460

Asp Val Ala Val Ile Gly Val Thr Asn Pro Asp Arg Gly Thr Glu Ser

465 470 475 480

Ala Arg Ala Phe Leu Val Thr Glu Ala Arg Ala Leu Pro Val Ile Lys

485 490 495

Gln Trp Phe Asp Arg Arg Val Pro Ser Tyr Lys Arg Leu Tyr Gly Gly

500 505 510

Ile Val Val Val Asp Ala Ile Pro Lys Ser Ala Ser Gly Lys Ile Leu

515 520 525

Arg Arg Val Leu Arg Glu Arg Lys Gly Asp Ser Val Phe Gly Glu Tyr

530 535 540

Val Glu Glu Val

545

<210> 40

<211> 616

<212> PRT

<213> 解脂耶氏酵母

<400> 40

Met Pro Gln Ile Ile His Lys Ser Ala Trp Gly Asp Ile Pro Leu Ser

1 5 10 15

Thr Phe Phe Tyr Gly Asn Val Thr Asp Tyr Leu Arg Ser Lys Lys Ser

20 25 30

Phe Gly Ser Asp Lys Ile Gly Tyr Ile Asp Ala Glu Thr Gly Glu Gly

35 40 45

Ile Thr Tyr Lys Gln Leu Trp Lys Leu Ala Asn Gly Ile Ser Ala Val

50 55 60

Leu Tyr His His Tyr Gly Ile Gly His Ala Arg Ala Pro Val Ala Ser

65 70 75 80

Asp His Thr Leu Gly Asp Val Val Met Leu His Ala Pro Asn Ser Arg

85 90 95

Phe Phe Pro Ser Leu His Tyr Gly Met Leu Asp Met Gly Cys Thr Ile

100 105 110

Thr Ser Ala Ser Val Ser Tyr Asp Val Ala Asp Leu Ala His Gln Leu

115 120 125

Arg Val Thr Asp Ala Ser Leu Val Leu Cys Tyr Gln Glu Lys Glu Asn

130 135 140

Asn Val Arg Gln Ala Ile Lys Glu Ala Gln Lys Asp Ala Ala Phe Pro

145 150 155 160

Gly Ile Thr His Pro Val Arg Ile Leu Leu Ile Glu Asn Leu Leu Thr

165 170 175

Met Ala Cys Asn Ile Ser Glu Glu Lys Ile Asn Ser Ala Met Ala Arg

180 185 190

Lys Phe Glu Tyr Ser Pro Gln Glu Cys Thr Lys Arg Ile Ala Tyr Leu

195 200 205

Ser Met Ser Ser Gly Thr Thr Gly Gly Ile Pro Lys Ala Val Arg Leu

210 215 220

Thr His Phe Asn Met Ser Ser Cys Asp Thr Leu Gly Thr Leu Ser Thr

225 230 235 240

Pro Ser Phe Ser Thr Gly Asp Asp Ile Arg Val Ala Ala Ile Val Pro

245 250 255

Met Thr His Gln Tyr Gly Leu Thr Lys Phe Ile Phe Asn Met Cys Ser

260 265 270

Ser His Ala Thr Thr Val Val His Arg Gln Phe Asp Leu Val Lys Leu

275 280 285

Leu Glu Ser Gln Lys Lys Tyr Lys Leu Asn Arg Leu Met Leu Val Pro

290 295 300

Pro Val Ile Val Lys Met Ala Lys Asp Pro Ala Val Glu Pro Tyr Ile

305 310 315 320

Pro Ser Leu Tyr Glu His Val Asp Phe Ile Thr Thr Gly Ala Ala Pro

325 330 335

Leu Pro Gly Ser Ala Val Thr Asn Leu Leu Thr Arg Ile Thr Gly Asn

340 345 350

Pro Gln Gly Ile Arg His Ser Gln Ser Gly Arg Pro Pro Leu Thr Ile

355 360 365

Ser Gln Gly Tyr Gly Leu Thr Glu Thr Ser Pro Leu Cys Ala Val Phe

370 375 380

Asp Pro Leu Asp Pro Asp Val Asp Phe Arg Ser Ala Gly Lys Ala Thr

385 390 395 400

Ser His Val Glu Ile Arg Ile Val Ser Glu Asp Gly Val Asp Gln Pro

405 410 415

Gln Leu Lys Leu Asp Asp Leu Ser His Leu Asp Gly Met Leu Lys Arg

420 425 430

Asp Glu Pro Leu Pro Val Gly Glu Val Leu Ile Arg Gly Pro Met Ile

435 440 445

Met Asp Gly Tyr His Lys Asn Arg Gln Ser Ser Glu Glu Ser Phe Asp

450 455 460

Arg Ser Gln Glu Asp Pro Lys Thr Leu Ile His Trp Gln Asp Lys Trp

465 470 475 480

Leu Lys Thr Gly Asp Ile Gly Met Val Asp Gln Lys Gly Arg Leu Met

485 490 495

Ile Val Asp Arg Asn Lys Glu Met Ile Lys Ser Met Ser Lys Gln Val

500 505 510

Ala Pro Ala Glu Leu Glu Ser Leu Leu Leu Asn His Asp Gln Val Ile

515 520 525

Asp Cys Ala Val Ile Gly Val Asn Ser Glu Ala Lys Ala Thr Glu Ser

530 535 540

Ala Arg Ala Phe Leu Val Leu Lys Asp Pro Ser Tyr Asp Ala Val Lys

545 550 555 560

Ile Lys Ala Trp Leu Asp Gly Gln Val Pro Ser Tyr Lys Arg Leu Tyr

565 570 575

Gly Gly Val Val Val Leu Lys Asn Glu Gln Ile Pro Lys Asn Pro Ser

580 585 590

Gly Lys Ile Leu Arg Arg Ile Leu Arg Thr Arg Lys Asp Asp Phe Ile

595 600 605

Gln Gly Ile Asp Val Ser Lys Leu

610 615

<210> 41

<211> 1800

<212> DNA

<213> 人工序列

<220>

<223> YlACoS-5P

<400> 41

atggcctcaa tcattcacaa gtctcctgtg cccgacgttc agctgttcta cggttcctgg 60

ccagatctca tgcgaacctc tcctcatgcc cacaacgact ccaaacccgt ggtctttgac 120

ttcgatacca agcagcaact tacttggaag caggtctggc aactcagcgc tcgactcaga 180

gcccagctgt accacaagta cggaatcggc aaacccggtg ctcttgcacc tttccacaac 240

gatccctctc tcggagacgt ggtcatcttc tacactccca acacctacag ctcgttgccc 300

tatcatctgg ctcttcacga tctcggagcc accatttctc ctgcctccac atcttacgac 360

gtcaaggaca tttgccatca gatcgttact accgatgcgg tcgtggttgt cgctgcagcc 420

gagaaatccg agattgctcg agaggccgtt cagctgtctg gtcgagacgt cagagttgtg 480

gtcatggagg acctcatcaa caatgctccc accgttgcgc agaacgatat cgactcggca 540

cctcatgtgt ccctgtctcg ggaccaggct cgagccaaga ttgcatacct gggcatgtct 600

tccggtacgt ctggcggact tcccaaggct gttcgtctca ctcacttcaa cgttacctcg 660

aactgtctgc aggtctccgc tgccgcaccc aaccttgccc agaacgtggt tgccagcgcc 720

gtcattccaa ccactcacat ctacggtctc accatgtttc tgtcggttct tccctacaac 780

ggttccgtgg tcattcatca caagcaattc aacttgcgag atctgctcga ggctcagaag 840

acatacaagg tctctctgtg gattctcgtt cctcccgtca tcgtgcagct tgccaagaac 900

cctatggtcg acgagtacct ggactccatt cgagcccatg tgcggtgcat cgtctctgga 960

gctgctcctc tcggtggcaa tgtcgtggat caggtttcgg ttcgtcttac cggcaacaag 1020

gaaggcattc tgcccaacgg agacaagctc gtcattcatc aagcctacgg tcttaccgag 1080

tcctctccca tcgttggaat gctcgatcct ctgtcggacc acatcgacgt catgactgtg 1140

ggctgtctca tgcccaatac cgaggctcga attgtcgacg aagagggaaa cgatcagcca 1200

gcagtccacg ttaccgacac acgaggcatc ggtgccgctg tcaagcgagg cgagaagatt 1260

ccctccggag aactctggat tcgaggtcct cagatcatgg acggatacca caagaacccc 1320

gagtcgtctc gtgagtccct ggaacccagc acagagacct acggtctgca acatttccag 1380

gacagatggc ttcgaactgg agacgttgct gtcatcgaca ccttcggacg agtcatggtt 1440

gtggatcgaa ccaaggagct catcaagtcc atgtctcgac aggttgctcc tgccgagctc 1500

gaagctcttc tgctcaacca tccttccgtc aacgatgtgg ctgtcgttgg cgtccacaac 1560

gacgataatg gcacagagtc agcacgagcg tttgtcgttc ttcaaccagg cgacgcctgt 1620

gatcctacta ccatcaagca ctggatggac cagcaagttc cctcctacaa gcggctgtac 1680

ggaggcattg tggtcatcga cactgttccc aagaatgcct ctggcaagat tctgcgaaga 1740

ctgcttcgac agcggagaga cgatcgagtc tggggtctgg ccaaggttgc caagctctaa 1800

<210> 42

<211> 599

<212> PRT

<213> 人工序列

<220>

<223> YlACoS-5P蛋白质

<400> 42

Met Ala Ser Ile Ile His Lys Ser Pro Val Pro Asp Val Gln Leu Phe

1 5 10 15

Tyr Gly Ser Trp Pro Asp Leu Met Arg Thr Ser Pro His Ala His Asn

20 25 30

Asp Ser Lys Pro Val Val Phe Asp Phe Asp Thr Lys Gln Gln Leu Thr

35 40 45

Trp Lys Gln Val Trp Gln Leu Ser Ala Arg Leu Arg Ala Gln Leu Tyr

50 55 60

His Lys Tyr Gly Ile Gly Lys Pro Gly Ala Leu Ala Pro Phe His Asn

65 70 75 80

Asp Pro Ser Leu Gly Asp Val Val Ile Phe Tyr Thr Pro Asn Thr Tyr

85 90 95

Ser Ser Leu Pro Tyr His Leu Ala Leu His Asp Leu Gly Ala Thr Ile

100 105 110

Ser Pro Ala Ser Thr Ser Tyr Asp Val Lys Asp Ile Cys His Gln Ile

115 120 125

Val Thr Thr Asp Ala Val Val Val Val Ala Ala Ala Glu Lys Ser Glu

130 135 140

Ile Ala Arg Glu Ala Val Gln Leu Ser Gly Arg Asp Val Arg Val Val

145 150 155 160

Val Met Glu Asp Leu Ile Asn Asn Ala Pro Thr Val Ala Gln Asn Asp

165 170 175

Ile Asp Ser Ala Pro His Val Ser Leu Ser Arg Asp Gln Ala Arg Ala

180 185 190

Lys Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Leu Pro

195 200 205

Lys Ala Val Arg Leu Thr His Phe Asn Val Thr Ser Asn Cys Leu Gln

210 215 220

Val Ser Ala Ala Ala Pro Asn Leu Ala Gln Asn Val Val Ala Ser Ala

225 230 235 240

Val Ile Pro Thr Thr His Ile Tyr Gly Leu Thr Met Phe Leu Ser Val

245 250 255

Leu Pro Tyr Asn Gly Ser Val Val Ile His His Lys Gln Phe Asn Leu

260 265 270

Arg Asp Leu Leu Glu Ala Gln Lys Thr Tyr Lys Val Ser Leu Trp Ile

275 280 285

Leu Val Pro Pro Val Ile Val Gln Leu Ala Lys Asn Pro Met Val Asp

290 295 300

Glu Tyr Leu Asp Ser Ile Arg Ala His Val Arg Cys Ile Val Ser Gly

305 310 315 320

Ala Ala Pro Leu Gly Gly Asn Val Val Asp Gln Val Ser Val Arg Leu

325 330 335

Thr Gly Asn Lys Glu Gly Ile Leu Pro Asn Gly Asp Lys Leu Val Ile

340 345 350

His Gln Ala Tyr Gly Leu Thr Glu Ser Ser Pro Ile Val Gly Met Leu

355 360 365

Asp Pro Leu Ser Asp His Ile Asp Val Met Thr Val Gly Cys Leu Met

370 375 380

Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Glu Gly Asn Asp Gln Pro

385 390 395 400

Ala Val His Val Thr Asp Thr Arg Gly Ile Gly Ala Ala Val Lys Arg

405 410 415

Gly Glu Lys Ile Pro Ser Gly Glu Leu Trp Ile Arg Gly Pro Gln Ile

420 425 430

Met Asp Gly Tyr His Lys Asn Pro Glu Ser Ser Arg Glu Ser Leu Glu

435 440 445

Pro Ser Thr Glu Thr Tyr Gly Leu Gln His Phe Gln Asp Arg Trp Leu

450 455 460

Arg Thr Gly Asp Val Ala Val Ile Asp Thr Phe Gly Arg Val Met Val

465 470 475 480

Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Arg Gln Val Ala

485 490 495

Pro Ala Glu Leu Glu Ala Leu Leu Leu Asn His Pro Ser Val Asn Asp

500 505 510

Val Ala Val Val Gly Val His Asn Asp Asp Asn Gly Thr Glu Ser Ala

515 520 525

Arg Ala Phe Val Val Leu Gln Pro Gly Asp Ala Cys Asp Pro Thr Thr

530 535 540

Ile Lys His Trp Met Asp Gln Gln Val Pro Ser Tyr Lys Arg Leu Tyr

545 550 555 560

Gly Gly Ile Val Val Ile Asp Thr Val Pro Lys Asn Ala Ser Gly Lys

565 570 575

Ile Leu Arg Arg Leu Leu Arg Gln Arg Arg Asp Asp Arg Val Trp Gly

580 585 590

Leu Ala Lys Val Ala Lys Leu

595

<210> 43

<211> 1788

<212> DNA

<213> 人工序列

<220>

<223> YlACoS-6P

<400> 43

atggccacac agattatcca caacgccacc atccccaata tccccgtcga ccagctctac 60

gacggcaaga tcaccgactt cattcgatcc ggaggccact ccaacgaaac caagccttct 120

gtcatcgacg ccaagacagg ccagactctc tcccaggcgg aaatgtggca gctgtcggac 180

aagtacgcgg cacttctcag ctctcagtac ggtctgtgcc gacacagaga caacgagctg 240

gacccatcta tgggagatgt gctcatcacc ttctttggaa acgttatcct cgctcctgtg 300

gtccattggg ctgccctcga cctcggagca accatttctc ctggatccac aggctactct 360

gcccaggatc tcgctcacca gttccgagtc accactccca aggtcgttgt gtacgccaag 420

gcgttcaagg atgtggtgga cgaggctacg aagctgtaca actccccaaa ccctccagca 480

cttgtcgagc tcgaggcgct ggacaagcag gcccgaatgg ttggaaacca caaggtcgaa 540

cacacccgaa agatcaagct ggctcctcac gagtcccgaa ctcggatcgc gtaccttggc 600

atgtcttcag gtacctccgg tggagtttca aaggctgtcc gactcaccca ttccaatctc 660

acgtcgtgtt ccgaaatctc gaacaaagcc tccgagtctc tcgcaactga ccagcagatc 720

gctgccgcca tcattcccgt gagtcatctg tttggactgt ccaagttcct cattggcaac 780

cctcacgccg gagccaccac tgtctatcac aatggcttcg atctgatcga ggtgctggag 840

gcacagaaga aatacaaagt caactcgtgg accctggttc ctcccatcat tgtcctgctc 900

accaaacacc ccattgtcga gaagtacatt ccttctctcc gtgcccacat gcgagccatc 960

ctctccggag ctgctcctct gggtgccaat gtcacagagg ctcttctcac ccgagtcact 1020

ggcaacaagt ttggcgagtc tcccgagggc ggtctgcgaa tcgttcaggg ctacggactt 1080

acagagacgt ctcccgttgc cactctgttt gaccccgaag acaaggaacg acacattcgg 1140

tcgtgtggaa agctcgtgcc caactctcag gttcgaattg tcaacgaaga cggcgtggat 1200

cagcctgcct acgatgtgga ccccaacgag ctggacgagg ccatcaaaca gggcactctg 1260

ccagtcggag agctttggat cagaggtccc caggttatgg acggctacca taacaacccc 1320

gaggccaacg aagcctgttt cgtcaaggct gacgatgctg aagcagatac tgcctactac 1380

aacagacact ggttccgaac cggagacgtt gctctggtcg acaagcaggg cagatacatg 1440

attgtggacc gaaccaagga gatgatcaag agtcagggta agcaggttgc tcctgccgag 1500

ctcgaagaca tgctcctggg acacgcacag gtggcagata ccgcagtcat cggtattcag 1560

gacgtggaga agggtaacga ggctcctcga gcttttgttg tgctcaagga cccgaagtac 1620

gacgctgtgg agatcaagac atggctggac aagcagcttc ccaagtacaa gcagcttcat 1680

gctggcatcg tggtcattga tgccattccc aagaacgcca gtggcaagat tctgcgacgt 1740

ctgttgcgtg ctagaaagga cgatgttgtt ctgggtctca acaagtaa 1788

<210> 44

<211> 595

<212> PRT

<213> 人工序列

<220>

<223> YlACoS-6P蛋白质

<400> 44

Met Ala Thr Gln Ile Ile His Asn Ala Thr Ile Pro Asn Ile Pro Val

1 5 10 15

Asp Gln Leu Tyr Asp Gly Lys Ile Thr Asp Phe Ile Arg Ser Gly Gly

20 25 30

His Ser Asn Glu Thr Lys Pro Ser Val Ile Asp Ala Lys Thr Gly Gln

35 40 45

Thr Leu Ser Gln Ala Glu Met Trp Gln Leu Ser Asp Lys Tyr Ala Ala

50 55 60

Leu Leu Ser Ser Gln Tyr Gly Leu Cys Arg His Arg Asp Asn Glu Leu

65 70 75 80

Asp Pro Ser Met Gly Asp Val Leu Ile Thr Phe Phe Gly Asn Val Ile

85 90 95

Leu Ala Pro Val Val His Trp Ala Ala Leu Asp Leu Gly Ala Thr Ile

100 105 110

Ser Pro Gly Ser Thr Gly Tyr Ser Ala Gln Asp Leu Ala His Gln Phe

115 120 125

Arg Val Thr Thr Pro Lys Val Val Val Tyr Ala Lys Ala Phe Lys Asp

130 135 140

Val Val Asp Glu Ala Thr Lys Leu Tyr Asn Ser Pro Asn Pro Pro Ala

145 150 155 160

Leu Val Glu Leu Glu Ala Leu Asp Lys Gln Ala Arg Met Val Gly Asn

165 170 175

His Lys Val Glu His Thr Arg Lys Ile Lys Leu Ala Pro His Glu Ser

180 185 190

Arg Thr Arg Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly

195 200 205

Val Ser Lys Ala Val Arg Leu Thr His Ser Asn Leu Thr Ser Cys Ser

210 215 220

Glu Ile Ser Asn Lys Ala Ser Glu Ser Leu Ala Thr Asp Gln Gln Ile

225 230 235 240

Ala Ala Ala Ile Ile Pro Val Ser His Leu Phe Gly Leu Ser Lys Phe

245 250 255

Leu Ile Gly Asn Pro His Ala Gly Ala Thr Thr Val Tyr His Asn Gly

260 265 270

Phe Asp Leu Ile Glu Val Leu Glu Ala Gln Lys Lys Tyr Lys Val Asn

275 280 285

Ser Trp Thr Leu Val Pro Pro Ile Ile Val Leu Leu Thr Lys His Pro

290 295 300

Ile Val Glu Lys Tyr Ile Pro Ser Leu Arg Ala His Met Arg Ala Ile

305 310 315 320

Leu Ser Gly Ala Ala Pro Leu Gly Ala Asn Val Thr Glu Ala Leu Leu

325 330 335

Thr Arg Val Thr Gly Asn Lys Phe Gly Glu Ser Pro Glu Gly Gly Leu

340 345 350

Arg Ile Val Gln Gly Tyr Gly Leu Thr Glu Thr Ser Pro Val Ala Thr

355 360 365

Leu Phe Asp Pro Glu Asp Lys Glu Arg His Ile Arg Ser Cys Gly Lys

370 375 380

Leu Val Pro Asn Ser Gln Val Arg Ile Val Asn Glu Asp Gly Val Asp

385 390 395 400

Gln Pro Ala Tyr Asp Val Asp Pro Asn Glu Leu Asp Glu Ala Ile Lys

405 410 415

Gln Gly Thr Leu Pro Val Gly Glu Leu Trp Ile Arg Gly Pro Gln Val

420 425 430

Met Asp Gly Tyr His Asn Asn Pro Glu Ala Asn Glu Ala Cys Phe Val

435 440 445

Lys Ala Asp Asp Ala Glu Ala Asp Thr Ala Tyr Tyr Asn Arg His Trp

450 455 460

Phe Arg Thr Gly Asp Val Ala Leu Val Asp Lys Gln Gly Arg Tyr Met

465 470 475 480

Ile Val Asp Arg Thr Lys Glu Met Ile Lys Ser Gln Gly Lys Gln Val

485 490 495

Ala Pro Ala Glu Leu Glu Asp Met Leu Leu Gly His Ala Gln Val Ala

500 505 510

Asp Thr Ala Val Ile Gly Ile Gln Asp Val Glu Lys Gly Asn Glu Ala

515 520 525

Pro Arg Ala Phe Val Val Leu Lys Asp Pro Lys Tyr Asp Ala Val Glu

530 535 540

Ile Lys Thr Trp Leu Asp Lys Gln Leu Pro Lys Tyr Lys Gln Leu His

545 550 555 560

Ala Gly Ile Val Val Ile Asp Ala Ile Pro Lys Asn Ala Ser Gly Lys

565 570 575

Ile Leu Arg Arg Leu Leu Arg Ala Arg Lys Asp Asp Val Val Leu Gly

580 585 590

Leu Asn Lys

595

<210> 45

<211> 598

<212> PRT

<213> 解脂耶氏酵母

<400> 45

Met Val Gln Ile Ile His Lys Ala Pro Leu Gly Asp Met Ala Glu Ser

1 5 10 15

Glu Leu Phe Tyr Gly Ser Ile Pro Asp Phe Met Arg Ser Ser Arg Phe

20 25 30

Ala Asp Asp Asp Thr Arg Ile Ser Val Val Asp Tyr Asp Thr Asp Lys

35 40 45

Ala Met Thr Leu Ala Arg Val Phe Lys Val Ser Gly Met Leu Arg Ala

50 55 60

Gln Phe Phe His Thr Tyr Asp Val Gly Lys Lys Lys Asp Gly Asp Ala

65 70 75 80

Asn Pro Lys Val Ile Phe Tyr Val Gly Asn Thr Ala Asp Asn Leu Ala

85 90 95

Cys His Ile Ala Leu His Asp Leu Gly Ala Ile Ile Ser Pro Ala Ser

100 105 110

Thr Ala Tyr Asp Val Asn Asp Leu Leu His Gln Ile Asn Val Val Asp

115 120 125

Ala Ala Leu Ile Val Ala Glu Ala Ala Arg Ala Asp Val Ala Arg Glu

130 135 140

Ala Val Ala Lys Ala Gly Asp Lys Phe Lys His Val Lys Val Val Val

145 150 155 160

Phe Glu Glu Leu Leu Glu Gln Asn Arg Arg Val Arg Pro Asn Leu Ile

165 170 175

Arg Val Ala Pro Ile Val His Leu Ser Lys Glu Gln Ala Tyr Thr Thr

180 185 190

Leu Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Val Pro Lys

195 200 205

Ala Val Glu Leu Thr His Phe Ala Met Thr Ser Asn Val Gln Gln Thr

210 215 220

Ala Lys Asn Ala Pro Asn Leu Val Asp Asp Asp Thr Val Cys Ser Ala

225 230 235 240

Val Ile Pro Thr Ser His Ile Tyr Gly Leu Ala Leu Phe Met Leu His

245 250 255

Met Pro Phe Leu Gly Ala Lys Val Val Tyr His Lys Lys Phe Asp Leu

260 265 270

Val Glu Met Leu Glu Gly Gln Lys Lys His Gly Val Asn Tyr Trp Val

275 280 285

Leu Val Pro Pro Ile Ile Val Ala Leu Ala Lys His Pro Ile Ile Asp

290 295 300

Arg Tyr Leu Asp Ser Ile Arg Ala Asn Leu Lys Thr Ile Thr Ser Gly

305 310 315 320

Ala Ala Pro Leu Gly Gly Asn Val Val Asp Ala Val Gln Thr Arg Phe

325 330 335

Thr Gly Asn Thr Arg Gly Thr Leu Pro Asn Asn Arg Arg Ile Val Ile

340 345 350

Tyr Gln Gly Tyr Gly Leu Thr Glu Thr Ala Pro Ile Ala Cys Leu Cys

355 360 365

Asp Pro Leu Trp Asp Asn Leu Asn Val Val Thr Val Gly Thr Leu Val

370 375 380

Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Asn Gly Asp Asp Gln Pro

385 390 395 400

Ala Phe Glu Val Thr Asp Ala Arg Ala Leu Gly Asp Ala Val Arg Arg

405 410 415

Gly Asp Lys Ile Pro Ser Gly Glu Leu Tyr Leu Arg Gly Pro Gln Ile

420 425 430

Met Ser Gly Tyr His Lys Asn Pro Lys Ser Thr Glu Glu Ser Phe Glu

435 440 445

Tyr Val Asp Tyr Lys Ala Glu Gly Leu Arg His Tyr Gln Asp Arg Trp

450 455 460

Leu Lys Thr Gly Asp Val Ala Val Ile Asp Asn Phe Gly Arg Ile Gln

465 470 475 480

Ile Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Lys Gln Val

485 490 495

Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Ser His Pro Asp Val Val

500 505 510

Asp Val Ala Val Ile Gly Val Trp Gln Glu Glu Lys Ala Thr Glu Ser

515 520 525

Ala Arg Ala Phe Leu Val Val Arg Asp Pro Lys Val Asp Val Val Ala

530 535 540

Ile Lys Lys Trp Met Asp Glu Gln Val Pro Ser Tyr Lys Arg Leu Tyr

545 550 555 560

Gly Gly Val Val Val Ile Asp Ala Ile Pro Lys Asn Pro Ser Gly Lys

565 570 575

Ile Leu Arg Arg Leu Leu Arg Gln Arg Lys Asp Asp Val Val Gln Gly

580 585 590

Leu Asp Gln Ala Lys Leu

595

<210> 46

<211> 741

<212> PRT

<213> 解脂耶氏酵母

<400> 46

Met Leu Arg Pro Arg Ala Pro Ser Thr Leu Arg Arg Ala Ser Thr Gln

1 5 10 15

Leu Ser Ala Arg Pro Gln Gly Ile Thr Gly Pro Gln Arg Ser Phe His

20 25 30

Leu Ala Cys Ser Arg Pro Thr Arg Ser Thr Thr Ser Glu Glu Asp Arg

35 40 45

Pro Lys Trp Leu Thr Pro Arg Asn Val Arg Leu Gly Ser Leu Pro Phe

50 55 60

Ser Arg Leu Leu Gln Gly His Ser Gln Arg Leu Tyr Ser Gly Leu Ser

65 70 75 80

Thr Pro Gly Ile Ser Glu Val Thr Gly Cys Ser Ser Pro Ala Leu Ile

85 90 95

Glu Ser His Ser Trp Asp Tyr Tyr Thr Thr Pro Ala Gln Arg Glu Leu

100 105 110

Trp Gly Ser Lys Gly Glu Tyr Pro Ala Leu Ile Ser Ala Tyr Gln Gln

115 120 125

Pro Asp Ile Ala Asn Ala Ile Leu Asp Arg Thr Ser Asp Tyr Thr Asn

130 135 140

Glu Thr His Leu Ser Phe Ser Glu Leu Leu Lys Leu Ser Asn Leu Phe

145 150 155 160

Ala Asp Ser Leu Tyr Ala His Ala Arg Glu Gln Gly Leu Val Phe Lys

165 170 175

Ser Gly Asp Ser Val Ala Val Cys Gly Gly Asn Val Trp Glu Tyr Thr

180 185 190

Ala Leu Gln Met Gly Leu Ser Lys Leu Gly Leu Val Leu Val Pro Leu

195 200 205

Asn Pro Ala Phe Thr Ala Asn Gln Phe Ala Ala Ala Leu Ala Ala Thr

210 215 220

Glu Ala Lys Ala Leu Ile Met Thr Ser His Leu Pro Gly Gly Lys Asp

225 230 235 240

Lys Ala Thr Gly Lys Met Thr Leu Lys Ser Ala Ala Pro Ile Cys Gln

245 250 255

Glu Val Ile Asp Asn Leu Asn Ala Ser Gly Lys Ser Lys Leu Lys Leu

260 265 270

Leu Ile Asn Leu Ala Ser Gly Glu Thr Pro Gly Ala Asp Thr Ile Lys

275 280 285

Asp Val Lys Phe Gln Gly Ser Gln Ser Asp Met His Glu Ile Val Phe

290 295 300

Gln His Lys Lys Ala Val Ala Asn Gly Thr Leu Pro Ala Ser Val Pro

305 310 315 320

Thr Glu Ile Arg Arg Leu Thr Ala Thr Val Asn Pro Asp Asp Ile Thr

325 330 335

Asn Met Gln Phe Thr Ser Gly Thr Thr Ser Gln Pro Lys Val Ser Cys

340 345 350

Leu Thr His Arg Asn Leu Leu Asn Asn Gly His Leu Ile Gly Thr Arg

355 360 365

Met Gly Leu Lys Pro Ala Thr Gly Pro Ala Val Asn Gly Ile Ala Pro

370 375 380

Asn Gln Asp Arg Leu Cys Ile Pro Val Pro Met Phe His Cys Phe Gly

385 390 395 400

Leu Val Leu Ser Asn Leu Ala Ala Leu Thr Thr Gly Ala Ala Leu Val

405 410 415

Tyr Pro Ser Glu Trp Phe Cys Ala Arg Ser Ala Ile Asp Asn Val Arg

420 425 430

Lys Tyr Lys Cys Thr Gly Leu His Gly Val Pro Thr Met Tyr Val Ala

435 440 445

Glu Leu Glu Tyr Leu Lys Asp Leu Glu Leu Lys Glu Ala Lys Ala Pro

450 455 460

Gly Gln Asn Phe Leu Pro Gly Phe Glu Leu Leu Arg Thr Gly Ile Ala

465 470 475 480

Ala Gly Ser Ala Val Pro Gly Glu Leu Met Thr Lys Leu Gly Gln Ser

485 490 495

Met Asn Leu Lys Ala Leu Thr Ile Cys Tyr Gly Met Thr Glu Thr Ala

500 505 510

Pro Val Thr Phe Met Thr Arg Pro Asp Asp Pro Val Glu Lys Arg Val

515 520 525

Glu Thr Val Gly Gln Ile Met Pro His Thr Ser Cys Arg Ile Ile Lys

530 535 540

Ser Gln Gln Glu Asp Leu Ser Glu Ser Glu Leu Asp Phe Thr Pro Leu

545 550 555 560

Ala Thr Gly Gln Lys Gly Glu Ile Ile Thr Ser Gly Tyr Ala Leu Gln

565 570 575

Lys Tyr Tyr Lys Asp Asp Pro Lys Lys Thr Ser Ala Ala Met Val Val

580 585 590

Asp Pro Ala Thr Gly Val Arg Trp Met Arg Thr Gly Asp Glu Gly Cys

595 600 605

Met Asp Asn Glu Gly Phe Leu Lys Val Thr Gly Arg Leu Lys Asp Leu

610 615 620

Ile Ile Arg Gly Gly Glu Asn Ile His Pro Leu Glu Ile Glu Asn Val

625 630 635 640

Leu Phe Ala His Asp Lys Ile Ala Gln Ala Ser Val Val Gly Val Lys

645 650 655

Asp Pro Lys Tyr Gly Glu Ala Val Cys Ala Phe Val Thr Pro His Ala

660 665 670

Phe Phe His Lys Gly His Gln His Val Lys His Asp Asp Ser Asp Lys

675 680 685

Leu Thr Ile Glu Gln Val Gln Glu Trp Val Arg Asn Lys Leu Gly His

690 695 700

Tyr Met Val Pro Lys Tyr Val Phe Phe Val Gly Asp Tyr Pro Lys Thr

705 710 715 720

Ala Ser Gly Lys Ile Arg Lys Val Asp Leu Arg Lys Thr Ala Glu Ser

725 730 735

Gln Leu Gly Leu Cys

740

<210> 47

<211> 554

<212> PRT

<213> 解脂耶氏酵母

<400> 47

Met Ala Pro Ser Gln Gly Asp Lys Lys Met Phe Ile Ser Ala Glu Thr

1 5 10 15

Gly Glu Ser Leu Thr Thr Ala Gln Gln Trp Ala Thr Val Glu Leu Phe

20 25 30

Ala Ser Lys Leu Tyr Gln Leu Gly Ile Gly His Ser Leu Arg Pro Asn

35 40 45

Ser Asp Ala His Leu Gly Asp Val Val Leu Leu Tyr Val Lys Asn Ser

50 55 60

Ile Tyr Ile Pro Ala Ala His Trp Ala Leu Leu Asp Leu Gly Ala Thr

65 70 75 80

Val Ala Pro Ala Ala Ala Val Tyr Lys Ala Arg Asp Leu Val His Gln

85 90 95

Ile Glu Leu Val Lys Pro Lys Leu Ile Val Cys Asp Ala Asp Leu Lys

100 105 110

Ser Glu Ala Val Glu Ala Leu Lys Ile Leu Ser Lys Lys Met Pro Ile

115 120 125

Val Thr Met Glu Glu Leu Arg Gln Pro Val Lys Lys Leu Lys Gln Arg

130 135 140

Gln Arg Phe Arg Leu Ser Arg Pro Glu Ala Ala Lys Arg Val Ala Ala

145 150 155 160

Leu Val Met Ser Ser Gly Thr Ser Gly Gly Leu Pro Lys Ala Val Arg

165 170 175

Val Thr His His Val Val Thr Ser Asn Ala Gln Cys Ser Ala Ile Val

180 185 190

Ala Pro Asp Leu Phe Asp Asp Pro Thr Asn Val Ile Ser Ala Val Leu

195 200 205

Pro Met Ser His Ile Tyr Gly Tyr Phe Lys Phe Leu Phe Ala Cys Phe

210 215 220

Tyr Thr Gly Glu Thr Cys Val Val His Gln Ser Phe Asp Leu Lys Ala

225 230 235 240

Val Leu Asp Ala Gln Gln Lys Tyr Gly Ile Thr Ser Phe Phe Met Val

245 250 255

Pro Pro Ile Ile Ile Ala Leu Ala Lys Ser Pro Ile Val Asp Glu Tyr

260 265 270

Ile Pro Ser Leu Gln Lys Leu Arg Phe Ile Thr Ser Gly Ala Ala Pro

275 280 285

Leu Gly Gly Asn Val Ile Glu Asp Val Lys Arg Arg Leu Gly Ser His

290 295 300

Ile Ala Val Thr Gln Met Tyr Gly Met Thr Glu Ser Ile Leu Ser Thr

305 310 315 320

Cys Phe Asn Pro Ser Asp Ala Asp Val Ala Ser Arg Ser Val Gly Lys

325 330 335

Leu Cys Gly Asn Ile Glu Ala Arg Ile Val Gly His Asp Gly Val Asp

340 345 350

Gln Pro Ala Tyr Asn Glu Thr Asp Pro Asp Lys Ile Asp Ala Ala Phe

355 360 365

Lys Arg Gly Asp Ala Leu Pro Ser Gly Glu Leu Trp Leu Arg Gly Pro

370 375 380

Ala Ile Met Ala Gly Tyr His Gly Asn Cys Leu Ala Asn Glu Glu Ser

385 390 395 400

Phe Val Asp Ala Ser Asp Ala Ala Thr Val Pro His Tyr His Arg Lys

405 410 415

Trp Leu Arg Thr Gly Asp Val Ala Val Ile Asp Val Lys Gly Arg Ile

420 425 430

Val Ile Val Asp Arg Thr Lys Glu Met Ile Lys Ser Met Gly Arg Ala

435 440 445

Val Ala Pro Ala Glu Ile Glu Ala Leu Leu Leu Ser His Pro Gln Val

450 455 460

Met Asp Cys Ala Val Ile Gly Val His Val Pro Glu Lys Gly Thr Glu

465 470 475 480

Ala Ala Arg Ala Phe Leu Val Leu Arg Asp Ala Gln Ala Ser Val Ala

485 490 495

Arg Asp Val Ala Ala Trp Leu Asn Asp Gln Val Pro Ser Tyr Lys Arg

500 505 510

Leu His Gly Gly Val Val Val Phe Arg Gly Glu Val Ile Pro Lys Asn

515 520 525

Ala Ser Gly Lys Ile Leu Arg Arg Leu Leu Arg Gln Arg Lys Gly Asp

530 535 540

Glu Val Val Phe Pro Glu Arg Ala Lys Leu

545 550

<210> 48

<211> 1812

<212> DNA

<213> 人工序列

<220>

<223> YlACoS-10P

<400> 48

atggcctccg tcgctccatc ttccaacccc aatccgatcc accatctgtc gcgagtcgaa 60

gacgttcctc tctcccagac gttccgaggc aacattaccg actttgtgcg atctggaggc 120

tttgccgacg acgactccaa gccctgttgc atcgacgcga agactggcca acaacttaca 180

cagaagcaag tctgggacta cgccgacaag ttcagagcac tgctccatca cgacaacaat 240

ctgtgtcctt tcaatgccaa caccaccgat ccagctcttg gagacgtcat gatcaccctc 300

gtgcccaacc atctgttcat tacgtcgctg cactttgccg cactcgatct gggtgcgaca 360

gtttctcctg gctcggctgg atacactgtg gccgagctcg tcaaccagat caatcttacc 420

ggagcttctc tcatcgtgta cactcgaccc gtcttcaagg ttgtgcgaga ggcgcttgct 480

cagatcgtgg taccagtcaa gatcgtggag ttcgagggtc tcatcgaacg agccgagttt 540

gttcagagcc acaagattca gtccacaaag aaagtcacac tttctcctga ggagtcctac 600

tcgagaatcg cctacctggg catgtcttca ggcacctccg gaggtcttcc taaggccgtt 660

cgattgtcgc acttcaacat ggcgagttct gccgagctct ccaagcgagc tgcaccttcg 720

attgccggat ccgagcagat cgcaggtgcc attatccctg tcaaccatgt gtatggtctg 780

gccaagttcc tcattgccat gccaaagtcc ggagccacca cagtcttcca ctccaagttc 840

gacctcatcg agatcctcga ggctcaacag aagtacaagg tcaacatgta cgcccttgtt 900

cctcccatca ttgtcgttct ggccaagcat cctgctgttg agaagtacat cccttcgctg 960

cgagaacacc ttcgatacgt gtcctctgga gctgcacccc tgggtgccaa cgtcatcgag 1020

gcttgcaaca agcgtcttgc cggaactgct tctggcgaga acgagtttgg aggtctcaag 1080

attgttcagg gctacggtct cactgaaacc tcccctgtgg tctccacttt cgatcccaac 1140

gatcctgagc gacacgctcg gtcctgtggc aagctggttc ccaacaccca ggcacgaatc 1200

gtgtcggagg acggagtcga tcagcctgcc tacgagctca aggacctgtc tcagttggag 1260

gccgagctca aaaagggcaa ccttcccacc ggtgagttgt ggcttcgagg tccccagatc 1320

atggatggct accacaagaa cgacgaggcc aacgctgagt cgtttgtcga cgccactgac 1380

tacacttcca acatgccctt ctacatgaag cggtggttcc gaactggcga tgttgctctc 1440

gtcgatactc tgggcagata catgattgtc gatcgaacca aagagatgat caagagcatg 1500

agtaagcagg ttgctcctgc cgagctggag gacatcctgc ttggccatcc ccaggtagcc 1560

gatgctgctg tcatcggtgt tcagcaggtg gagaagggca ctgaggctcc ccgagcgttc 1620

gtggtgcttc gagatcccaa gttcgatgca gtggagatca aaaagtggat ggacgcccag 1680

gtgcccaagt acaaacaact tcatggaggt gtcgtggttc tggatgctgt tcccaagaat 1740

gccagcggca agattctcag acgactgctc cgtcagcgag agaatgacgt cgttcttgga 1800

ctcgacaagt aa 1812

<210> 49

<211> 603

<212> PRT

<213> 人工序列

<220>

<223> YlACoS-10P蛋白质

<400> 49

Met Ala Ser Val Ala Pro Ser Ser Asn Pro Asn Pro Ile His His Leu

1 5 10 15

Ser Arg Val Glu Asp Val Pro Leu Ser Gln Thr Phe Arg Gly Asn Ile

20 25 30

Thr Asp Phe Val Arg Ser Gly Gly Phe Ala Asp Asp Asp Ser Lys Pro

35 40 45

Cys Cys Ile Asp Ala Lys Thr Gly Gln Gln Leu Thr Gln Lys Gln Val

50 55 60

Trp Asp Tyr Ala Asp Lys Phe Arg Ala Leu Leu His His Asp Asn Asn

65 70 75 80

Leu Cys Pro Phe Asn Ala Asn Thr Thr Asp Pro Ala Leu Gly Asp Val

85 90 95

Met Ile Thr Leu Val Pro Asn His Leu Phe Ile Thr Ser Leu His Phe

100 105 110

Ala Ala Leu Asp Leu Gly Ala Thr Val Ser Pro Gly Ser Ala Gly Tyr

115 120 125

Thr Val Ala Glu Leu Val Asn Gln Ile Asn Leu Thr Gly Ala Ser Leu

130 135 140

Ile Val Tyr Thr Arg Pro Val Phe Lys Val Val Arg Glu Ala Leu Ala

145 150 155 160

Gln Ile Val Val Pro Val Lys Ile Val Glu Phe Glu Gly Leu Ile Glu

165 170 175

Arg Ala Glu Phe Val Gln Ser His Lys Ile Gln Ser Thr Lys Lys Val

180 185 190

Thr Leu Ser Pro Glu Glu Ser Tyr Ser Arg Ile Ala Tyr Leu Gly Met

195 200 205

Ser Ser Gly Thr Ser Gly Gly Leu Pro Lys Ala Val Arg Leu Ser His

210 215 220

Phe Asn Met Ala Ser Ser Ala Glu Leu Ser Lys Arg Ala Ala Pro Ser

225 230 235 240

Ile Ala Gly Ser Glu Gln Ile Ala Gly Ala Ile Ile Pro Val Asn His

245 250 255

Val Tyr Gly Leu Ala Lys Phe Leu Ile Ala Met Pro Lys Ser Gly Ala

260 265 270

Thr Thr Val Phe His Ser Lys Phe Asp Leu Ile Glu Ile Leu Glu Ala

275 280 285

Gln Gln Lys Tyr Lys Val Asn Met Tyr Ala Leu Val Pro Pro Ile Ile

290 295 300

Val Val Leu Ala Lys His Pro Ala Val Glu Lys Tyr Ile Pro Ser Leu

305 310 315 320

Arg Glu His Leu Arg Tyr Val Ser Ser Gly Ala Ala Pro Leu Gly Ala

325 330 335

Asn Val Ile Glu Ala Cys Asn Lys Arg Leu Ala Gly Thr Ala Ser Gly

340 345 350

Glu Asn Glu Phe Gly Gly Leu Lys Ile Val Gln Gly Tyr Gly Leu Thr

355 360 365

Glu Thr Ser Pro Val Val Ser Thr Phe Asp Pro Asn Asp Pro Glu Arg

370 375 380

His Ala Arg Ser Cys Gly Lys Leu Val Pro Asn Thr Gln Ala Arg Ile

385 390 395 400

Val Ser Glu Asp Gly Val Asp Gln Pro Ala Tyr Glu Leu Lys Asp Leu

405 410 415

Ser Gln Leu Glu Ala Glu Leu Lys Lys Gly Asn Leu Pro Thr Gly Glu

420 425 430

Leu Trp Leu Arg Gly Pro Gln Ile Met Asp Gly Tyr His Lys Asn Asp

435 440 445

Glu Ala Asn Ala Glu Ser Phe Val Asp Ala Thr Asp Tyr Thr Ser Asn

450 455 460

Met Pro Phe Tyr Met Lys Arg Trp Phe Arg Thr Gly Asp Val Ala Leu

465 470 475 480

Val Asp Thr Leu Gly Arg Tyr Met Ile Val Asp Arg Thr Lys Glu Met

485 490 495

Ile Lys Ser Met Ser Lys Gln Val Ala Pro Ala Glu Leu Glu Asp Ile

500 505 510

Leu Leu Gly His Pro Gln Val Ala Asp Ala Ala Val Ile Gly Val Gln

515 520 525

Gln Val Glu Lys Gly Thr Glu Ala Pro Arg Ala Phe Val Val Leu Arg

530 535 540

Asp Pro Lys Phe Asp Ala Val Glu Ile Lys Lys Trp Met Asp Ala Gln

545 550 555 560

Val Pro Lys Tyr Lys Gln Leu His Gly Gly Val Val Val Leu Asp Ala

565 570 575

Val Pro Lys Asn Ala Ser Gly Lys Ile Leu Arg Arg Leu Leu Arg Gln

580 585 590

Arg Glu Asn Asp Val Val Leu Gly Leu Asp Lys

595 600

<210> 50

<211> 627

<212> PRT

<213> 解脂耶氏酵母

<400> 50

Met Ile Ile His Thr Ser Asp Thr Ser Ser Ile Arg Val Asn Asp Leu

1 5 10 15

Phe Cys Gly Asn Ile Ala Asp Phe Ile Val Lys Gly Gly His Ser Lys

20 25 30

Ser Ser Lys Thr Ser Ala Ile Asp Ala Ala Thr Gly Glu Ser Leu Ser

35 40 45

His Val Asn Gln His Ile Leu Ser Arg Gln Ile Ala Ser Ile Leu Thr

50 55 60

Glu Ser Gly Tyr Glu Pro Asn Phe Asp Pro Lys Ser His Ile Gly Asp

65 70 75 80

Val Leu Val Thr Leu Phe Pro Asn Ser Ile Tyr Ser Ser Pro Val His

85 90 95

Trp Ala Ala Leu Ile Arg Gly Gly Thr Val Ser Pro Ala Ser Val Ser

100 105 110

Tyr Thr Leu Asn Glu Leu Ala His Gln Val Arg Thr Val Arg Pro Lys

115 120 125

Val Ile Val Ala Cys Lys Ser Lys Val Ser Leu Ala Lys Lys Ala Val

130 135 140

Leu Met Ala Arg Val Lys Thr Ala Val Leu Glu Leu Glu His Val Ile

145 150 155 160

Ser Asn Ala Pro Lys Tyr Pro Glu Ser Asp Ser Val Lys Phe Asn Lys

165 170 175

Asn Ser Gly Tyr Arg Arg Val Ala Tyr Leu Ala Met Ser Ser Gly Thr

180 185 190

Ser Gly Gly Ile Phe Lys Ala Val Lys Ile Thr His Phe Asn Ile Thr

195 200 205

Ser Cys Ile Gln Val Cys Gln Lys Ser Ala Pro Asn Arg Asp Thr Ala

210 215 220

Ser Gln Ile Ala Ser Ala Val Ile Pro Val Ser His Leu Tyr Gly Leu

225 230 235 240

Ser Lys Phe Leu Ile Met Ala Pro Tyr Val Gly Ser Thr Thr Val Phe

245 250 255

His Glu Lys Phe Glu Ile Lys Glu Phe Leu Glu Ala Gln Lys Gln Phe

260 265 270

Gln Val Asn Ser Trp Pro Ile Val Pro Pro Leu Val Val Leu Leu Thr

275 280 285

Asn His Pro Leu Val Lys Glu Phe Ser Glu Ser Leu Arg Ala His Leu

290 295 300

Arg Ile Val Cys Cys Gly Ala Ala Pro Leu Gly Glu Lys Ala Ala Arg

305 310 315 320

Asp Phe Leu Thr Ala Ile Thr Gly Ser Pro Asp Gly Ile Ile Gln Pro

325 330 335

Thr Ile Thr Ser Arg Asp Lys Ser Lys Ser Arg Asp Ser Gly Phe Phe

340 345 350

Ser Ser Ile Arg Ala His Val Ala Asp Pro Ala Ala Ala Gly Ile Thr

355 360 365

Ser Ala Asn Thr Ala Glu Ser Ala Gly Gln Ser Arg Asp Ala Pro Arg

370 375 380

Leu Gln Ile Ile Gln Gly Trp Gly Leu Thr Glu Thr Ser Pro Thr Cys

385 390 395 400

Thr Thr Phe Asp Pro Leu Asp Pro Asp Leu His Ile Lys Ala Cys Gly

405 410 415

Lys Ile Val Ala Asn Thr Glu Ile Arg Ile Arg Gly Gln Gly Gln Asp

420 425 430

Leu Gln Lys Ala Pro Ile Leu Ile Glu Asn Tyr Asp Ala Tyr Pro Ser

435 440 445

Lys Glu Thr Leu Pro Ile Gly Asp Ile Tyr Val Arg Gly Pro Gln Val

450 455 460

Thr Leu Gly Tyr Leu Asn Asp Asp His Ala Asp Ser Val Ser Phe Glu

465 470 475 480

Gln Cys Tyr Asp Pro His Val Pro Trp Phe His Leu Lys Trp Phe Lys

485 490 495

Thr Gly Asp Val Gly Phe Ile Asp Ala Lys Gly Arg Val Met Val Val

500 505 510

Asp Arg Thr Lys Glu Met Ile Lys Ser Met Gly Lys Gln Val Ala Pro

515 520 525

Ala Glu Ile Glu Asp Leu Leu Leu Ser His Glu Leu Val Ala Asp Ala

530 535 540

Ala Val Ile Gly Val Ser Asn Glu Lys Leu Gly Thr Glu Ser Pro Arg

545 550 555 560

Ala Phe Val Val Pro Lys Ser Gly Phe Lys Ala Ala Glu Leu Arg Ser

565 570 575

Trp Thr Asp Ser Gln Leu Pro Lys His Lys Gln Leu His Gly Gly Ile

580 585 590

Val Leu Val Asp Lys Val Pro Lys Asn Ala Ser Gly Lys Ile Leu Arg

595 600 605

Arg Val Leu Arg Glu Arg Arg Gly Asp Leu Val Glu Gly Val Lys Leu

610 615 620

Ser Lys Leu

625

<210> 51

<211> 593

<212> PRT

<213> 解脂耶氏酵母

<400> 51

Met Ile Ile His Thr Ser Leu Asn Gln Pro Ile Asp Asp Arg Glu Phe

1 5 10 15

Phe Asp Gly Thr Ile Pro Asp Phe Ile Arg Thr Ser Pro Phe Val Asn

20 25 30

Asp Thr Thr Pro Phe Phe Ile Asp Ala Ala Thr Gly Glu Gln Leu Ser

35 40 45

Gln Arg Gln Leu Trp Lys Met Ser Asn Asp Phe Leu Thr Ile Phe Arg

50 55 60

Gln His Gly Leu Gly Asn Ala Arg Asp Asn Val Ser Asp Pro Ser Met

65 70 75 80

Gly Asp Val Phe Ile Thr Leu Phe Pro Asn Cys Ile Trp Ala Gly Pro

85 90 95

Val His Trp Ala Ala Leu Asp Ala Gly Ala Thr Leu Ser Pro Ala Ser

100 105 110

Cys Ser Tyr Thr Val Gln Glu Phe Ala His Gln Leu Gln Leu Val Val

115 120 125

Pro Lys Met Val Val Tyr Ser Glu Pro Phe Lys Gln Leu Leu Glu Asp

130 135 140

Ala Ile Ile Val Ser Lys Thr Asn Pro Thr Ile Leu Ser Leu Glu Gln

145 150 155 160

Leu Ile Glu Asp Ser Glu Arg Val Pro Leu Ala Gln Ala Asn Phe Gln

165 170 175

Phe Ala Asn Arg Leu Gln Leu Arg Pro Lys Glu Ser Ile Thr Arg Val

180 185 190

Ala Tyr Leu Ala Met Ser Ser Gly Thr Ser Gly Gly Leu Phe Lys Ala

195 200 205

Val Arg Ile Thr His Gly Asn Ile Thr Ser Asn Ala Ile Met Ser Thr

210 215 220

Lys Ser Ser Asn Ala Leu Leu Lys Thr Asn Gln Val Ala Ser Ala Ile

225 230 235 240

Ile Pro Val Ser His Leu Tyr Gly Leu Ala Gln Phe Leu Val Phe Gly

245 250 255

Val His Arg Gly Thr Ala Ala Val Phe His Lys Gly Phe Asp Phe Ile

260 265 270

Glu Phe Leu Asp Ala Ala Val Lys Tyr Lys Val Asn Ile Phe Pro Leu

275 280 285

Val Pro Pro Ile Ile Ile Leu Leu Ala Lys His Pro Phe Thr Gln Lys

290 295 300

Tyr Val Pro Asp Leu Lys Arg Asn Leu Thr Thr Val Leu Ser Gly Ala

305 310 315 320

Ala Pro Leu Gly Val Lys Ala Thr Glu Glu Phe Leu Glu Arg Ile Thr

325 330 335

Gly Arg Lys Asp Gly Val Ser Glu Tyr Gly Thr Leu Arg Val Ile Gln

340 345 350

Gly Trp Gly Met Thr Glu Thr Ser Pro Val Cys Thr Leu Phe Asp Pro

355 360 365

Glu Val Pro Val Ala His Ile Arg Ser Val Gly Lys Leu Val Ser Asn

370 375 380

Thr Glu Ala Arg Val Val Ser Glu Gly Val Asp Gln Pro Ala Cys Asp

385 390 395 400

Val Asp Pro Ala Ser Leu Asp Ala Ala Ile Lys Ala Gly Gly Leu Pro

405 410 415

Thr Gly Glu Ile Leu Ile Arg Gly Pro His Val Met Asp Gly Tyr His

420 425 430

Lys Asn Pro Ser Ala Asn Ala Asp Ala Phe Glu Glu Ala Ser Asp Trp

435 440 445

Thr Pro Asp Met Pro Trp Tyr Lys Lys Arg Trp Leu Arg Thr Gly Asp

450 455 460

Val Gly Phe Phe Asp Leu Gln Gly Arg Val Met Ile Val Asp Arg Thr

465 470 475 480

Lys Glu Leu Ile Lys Ser Met Gly Lys Gln Val Ala Pro Ala Glu Leu

485 490 495

Glu Asp Ala Leu Leu Ala Asn Pro Leu Val Ala Asp Cys Ala Val Ile

500 505 510

Gly Val Met Asp Val Asp Lys Gly Thr Glu Ser Pro Arg Ala Phe Val

515 520 525

Val Leu Arg Asp Pro Lys Ala Asp Ala Val Gly Ile Leu Lys Ser Leu

530 535 540

Asn Ser Gln Met Pro Lys Tyr Lys Asn Leu His Gly Gly Ile Val Val

545 550 555 560

Val Glu Ala Val Pro Arg Asn Pro Ser Gly Lys Val Leu Arg Arg Leu

565 570 575

Leu Arg Asp Arg Lys Asp Asp Val Val Leu Gly Leu Asp Val Ser Lys

580 585 590

Leu

<210> 52

<211> 583

<212> PRT

<213> 解脂耶氏酵母

<400> 52

Met His Arg Arg Pro Asn Cys Pro Val Leu Phe Tyr Thr Ser Ser Ala

1 5 10 15

Ser Tyr Asp Ile Ala Leu Leu Val Leu Asn Thr Leu Ala Leu Pro Leu

20 25 30

Phe Leu Pro Gly Arg Thr Pro Leu Arg Cys Ile Val Phe Arg Leu Pro

35 40 45

Arg Asn Arg Ser Ala Phe Ile Thr His Leu Tyr Ile Thr Pro Leu Ser

50 55 60

Thr Pro Ser Ser His Asp Thr Thr Ser Ile His Thr Met Ala Thr Leu

65 70 75 80

Gln Lys Thr Ile Ser Lys Thr Gly Ala Gly Ile Phe Ile Pro Gly Ala

85 90 95

Gln Glu Leu Thr Tyr Ser Gln Phe Phe Asp Leu Ile Gly Asp Phe Gln

100 105 110

Lys Gln Leu Ala Gln Val Gly Leu Pro Pro Gln Ser Ala Val Ser Ile

115 120 125

Ala Ile Pro Asn Ser Leu Glu Phe Ala Val Thr Phe Leu Ala Val Thr

130 135 140

Phe Ser Arg Tyr Ile Ala Ala Pro Leu Asn Ser Ala Tyr Lys Lys Ser

145 150 155 160

Glu Phe Glu Phe Tyr Ile Asp Asp Leu Lys Ser Lys Leu Val Leu Val

165 170 175

Pro Lys Gly Ala Val Ala Gln Asn Leu Ala Ser Val Gln Ala Ala Arg

180 185 190

Thr Phe Asn Ala Ala Ile Ala Glu Val Tyr Trp Asp Asp Gln Lys Lys

195 200 205

Arg Ile Val Met Asp Ile Lys Glu Gly Pro Thr Asn Pro Pro Val Ala

210 215 220

Val Pro Thr Pro Asp Glu Val Ser Pro Glu Asp Val Ala Leu Val Leu

225 230 235 240

His Thr Ser Gly Thr Thr Gly Arg Pro Lys Ala Val Pro Leu Thr Gln

245 250 255

Arg Asn Leu Cys Arg Thr Met His Asn Ile Val Asp Thr Tyr Lys Leu

260 265 270

Thr Ser Lys Asp Thr Thr Tyr Leu Val Met Pro Leu Phe His Val His

275 280 285

Gly Leu Leu Cys Ala Phe Leu Ala Pro Leu Ala Ser Gly Gly Gly Ile

290 295 300

Val Ile Pro Ser Lys Phe Ser Ala Ser Gln Phe Trp Asp Asp Phe Val

305 310 315 320

Lys Tyr Lys Cys Asn Trp Tyr Thr Ala Val Pro Thr Ile His Gln Ile

325 330 335

Leu Leu Asn Thr Lys Ile Pro Gln Pro Leu Pro Glu Ile Arg Phe Ile

340 345 350

Arg Ser Cys Ser Ser Ala Leu Ala Pro Ala Thr Phe His Gln Ile Glu

355 360 365

Lys Ala Phe Lys Ala Pro Val Leu Glu Ala Tyr Ala Met Thr Glu Ala

370 375 380

Ala His Gln Met Thr Ser Asn Asn Leu Pro Pro Gly Gln Arg Lys Pro

385 390 395 400

Gly Thr Val Gly Val Gly Gln Gly Val Glu Val Ala Ile Leu Asp Asp

405 410 415

Asn Gly Asp Glu Val Pro Gln Gly Lys Ile Ala Glu Ile Cys Ile Arg

420 425 430

Gly Glu Asn Val Thr Lys Gly Tyr Ile Asn Asn Pro Glu Ala Asn Lys

435 440 445

Ser Ser Phe Thr Lys Ser Gly Phe Phe Arg Thr Gly Asp Gln Gly Phe

450 455 460

Leu Asp Lys Asp Gly Phe Val Asn Ile Thr Gly Arg Ile Lys Glu Leu

465 470 475 480

Ile Asn Arg Gly Gly Glu Lys Ile Ser Pro Ile Glu Leu Asp Gly Val

485 490 495

Met Leu Glu His Pro Ala Val Ala Glu Ala Val Cys Phe Gly Ala Pro

500 505 510

Asp Glu Met Tyr Gly Gln Gln Val Asn Ala Ala Ile Val Leu Lys Lys

515 520 525

Asp Ala Lys Ala Thr Glu Gln Asp Ile Lys Asp Phe Met Ala Asp Lys

530 535 540

Val Ala Lys Phe Lys Ile Pro Ala Arg Val Phe Phe Thr Asp Ile Met

545 550 555 560

Pro Lys Thr Ala Thr Gly Lys Ile Gln Arg Arg Phe Val Ala Gln Lys

565 570 575

Phe Leu Asp Lys Ala Lys Leu

580

<210> 53

<211> 585

<212> PRT

<213> 解脂耶氏酵母

<400> 53

Met Ala Lys Gly Lys Leu Ser Ser Gly Gly Val Lys Ser Ser Val Ala

1 5 10 15

Asp Lys Thr Thr Ala Ala Ala Ile His Thr Leu Pro Arg Ile Gln Gly

20 25 30

Asp Asp Thr Val Tyr Val Pro Asp Lys Val Asn Arg His Asn Met Asn

35 40 45

Pro Thr Tyr Phe Leu Pro Arg Ala Ala Glu Ile Glu Pro Asn Ala Lys

50 55 60

Ala Tyr Ile His Lys Gly Ala Asp Gly Val Arg Val Glu Arg Thr Tyr

65 70 75 80

Gly Glu Met Ala Asp Arg Val Leu Gly Leu Ala Thr Tyr Phe Lys Ser

85 90 95

Lys Glu Phe Lys Arg Val Ala Ile Cys Gly Pro Asn Thr Pro Ala His

100 105 110

Leu Glu Thr Met Phe Gly Ala Val Ala Ala Gly Ala Tyr Val Leu Gly

115 120 125

Leu Asn Tyr Arg Leu Thr Met Gly Glu Ile Thr Tyr Lys Met Glu Leu

130 135 140

Gly Asp Ala Asp Cys Val Val Val Asp Arg Glu Phe Val His Leu Ile

145 150 155 160

Ser Pro Glu Ile Arg Ala Lys Cys Gln Val Ile Val Asp Asp Asp Val

165 170 175

Ser Gly Ala Ser Lys Pro Gln Gln Pro Gly Glu Ile Leu Tyr Ser Asn

180 185 190

Val Val Gln Gln Gly Met Gln Leu Ala Lys Glu Gln Lys Thr Thr Trp

195 200 205

Asp Asn Leu His Val Gln Asn Glu Asp Glu Asp Glu Ile Leu Gly Leu

210 215 220

Phe Tyr Thr Ser Gly Thr Thr Gly Lys Pro Lys Ala Val Glu Tyr Thr

225 230 235 240

His Arg Ser Val Tyr Leu Cys Ala Met Ser Asn Ile Ile Glu Ala Gly

245 250 255

Leu Asn Cys Glu Thr Val Asp Gly His Asn Arg Cys His Tyr Leu Trp

260 265 270

Thr Leu Pro Leu Phe His Ala Ala Gly Trp Thr Phe Pro Tyr Ser Val

275 280 285

Thr Ala Val Arg Gly Thr His Val Leu Leu Arg Lys Ile Glu Pro Asp

290 295 300

Tyr Ile Trp Asp Leu Leu Val Asp Asp Arg Ile Thr His Phe Asn Ala

305 310 315 320

Ala Pro Thr Val Asn Asn Met Leu Val Asn Asn Pro Lys Ala Arg Arg

325 330 335

Leu Pro Gln Thr Val Arg Val Thr Val Ala Ala Ser Pro Pro Ser Ala

340 345 350

Ala Leu Phe Asn Lys Met Phe Asp Met Asn Leu His Pro Val His Met

355 360 365

Tyr Gly Leu Thr Glu Ser Tyr Gly Pro Phe Val Arg Asn Tyr Phe Leu

370 375 380

Gln Asp Trp His Gly Ala Thr Gly Asp Glu Arg Tyr Ala Leu Met Ala

385 390 395 400

Arg Gln Gly Phe Ala Phe Val Gly Ser Gln Ser Val Gln Val Ile Ala

405 410 415

Asn Asn Asp Ile Asn Gln Pro Val Pro Arg Asn Gly Gln Glu Ile Gly

420 425 430

Glu Ile Val Cys Arg Gly Asn Ala Val Met Ala Arg Tyr His Lys Asp

435 440 445

Pro Glu Ala Thr Ala Lys Ala Phe Glu Gln Gly Trp Phe His Thr Gly

450 455 460

Asp Leu Ala Val Val Asn Pro Asp Gly Ser Ile Lys Ile Leu Asp Arg

465 470 475 480

Lys Lys Asp Ile Ile Ile Ser Gly Gly Glu Asn Ile Ser Ser Val Ala

485 490 495

Val Glu Gly Ile Ile Cys Lys Tyr Asp Asn Val Leu Glu Val Ala Val

500 505 510

Val Gly Ile Pro Asp Glu Lys Tyr Gly Glu Val Pro Lys Ala Phe Leu

515 520 525

Ile Leu Lys Asp Lys Ser Lys Pro Phe Asp Thr Asp Lys Met Ile Ala

530 535 540

Trp Met Arg Glu Arg Met Gly Ala Tyr Gln Ile Pro Arg Gln Val Ser

545 550 555 560

Val Val Asp Asp Leu Pro Arg Thr Ser Thr Gly Lys Ile Lys Lys Asn

565 570 575

Val Leu Arg Asp Ser Val Gln Ala Ala

580 585

<210> 54

<211> 712

<212> PRT

<213> 解脂耶氏酵母

<400> 54

Met Lys Thr Ile Leu Lys Ile Thr Lys Ser Glu Asn Gln Asn Ala Leu

1 5 10 15

Phe Lys Asn Pro Ile Ser Pro Pro His Pro Pro Gln Thr Arg Thr Pro

20 25 30

Ser Leu Lys Ile Lys Val Gln Pro Gln Ile Pro His Phe Phe His Ala

35 40 45

Gly Pro Tyr Ile Asn Arg Gly Cys Pro Phe Leu Ser Pro Leu Leu His

50 55 60

Tyr His Leu Val Glu Ile Pro Thr Thr Met Thr Ala Gly Leu Val Ala

65 70 75 80

Ala Ala Ala Ile Gly Ala Ala Tyr Leu Glu Ala Lys Thr Leu Ile Ser

85 90 95

Glu Asp Ala Tyr Met Ile Arg Gly Ala Met Thr Asn Gly Leu Asp Phe

100 105 110

Phe Tyr Asn Ala Trp Lys Gly Arg Val Gln Tyr Trp Tyr Ala Phe Glu

115 120 125

Asp Ala Val Lys Lys Tyr Pro Asn Asn Pro Ala Ile Val Tyr Pro Lys

130 135 140

Pro Ile Glu Gly Lys Lys Pro Ser Gly Asp Ser Tyr Asp Asp Leu Phe

145 150 155 160

Asp Val Glu Thr Phe Thr Tyr Gln Gln Leu Tyr Asp Glu Val Leu Lys

165 170 175

Met Ser His Leu Leu Arg Asn Lys Tyr Gly Val Thr Ala Asn Asp Thr

180 185 190

Ile Ala Leu Asn Ala Met Asn Ser Pro Leu Phe Ile Ile Val Trp Phe

195 200 205

Ala Ile Trp Asn Leu Gly Ala Thr Pro Ala Phe Ile Asn Tyr Asn Leu

210 215 220

Ala Asp Lys Ser Leu Leu His Cys Leu Lys Val Gly His Ala Ser Ile

225 230 235 240

Met Phe Val Asp Thr Glu Val Glu Gly Asn Val Arg Pro Ser Leu Ala

245 250 255

Glu Ile Lys Ser Glu Ala Lys Cys Asp Thr Val Phe Met Asp Asp Asp

260 265 270

Phe Leu Ala Ala Tyr Ala Ala Ser Pro Ala Tyr Arg Ala Pro Asp Tyr

275 280 285

Glu Arg His Pro Glu Gln Lys Asp Tyr Asp Thr Ala Val Leu Ile Tyr

290 295 300

Thr Ser Gly Thr Thr Gly Leu Pro Lys Pro Ala Ile Met Ser Trp Lys

305 310 315 320

Lys Ala Lys Leu Met Ser Ser Leu Tyr Gly His Ser Ile Arg Leu Lys

325 330 335

Asn Asn Gly Val Val Tyr Ser Ala Met Pro Leu Tyr His Ser Thr Ala

340 345 350

Ala Ile Leu Gly Cys Leu Pro Cys Leu Asn Arg Gly Ala Ala Tyr Ala

355 360 365

Pro Gly Arg Lys Phe Ser Thr Thr Thr Phe Trp Thr Gln Ala Lys Leu

370 375 380

Thr Asn Ala Thr His Ile Gln Tyr Val Gly Glu Thr Cys Arg Tyr Leu

385 390 395 400

Ile Asn Ala Pro Pro Ser Pro Asp Glu Lys Ser His Gln Ile Lys Val

405 410 415

Ala Phe Gly Asn Gly Met Arg Arg Asp Ile Trp Val Lys Phe Lys Glu

420 425 430

Arg Phe Asn Ile Pro Ala Ile Gly Glu Phe Tyr Ala Ala Thr Glu Gly

435 440 445

Pro Leu Gly Thr Asn Asn Phe Gln Gln Gly Glu Ile Gly Ile Gly Ala

450 455 460

Met Gly Arg Tyr Gly Lys Leu Leu Ala Ala Ile Leu Ala Thr Arg Gln

465 470 475 480

Thr Ile Val Pro Val Asp Pro Glu Asp Glu Thr Glu Leu Trp Arg Asp

485 490 495

Pro Glu Thr Gly Phe Cys Arg Val Ala Gln Ser Asp Glu Pro Gly Glu

500 505 510

Phe Ile Gln Lys Ile Pro Asn Pro Glu Lys Val His Glu Thr Phe Gln

515 520 525

Gly Tyr Leu Gly Asn Asp Lys Ala Thr Asn Ser Lys Ile Met Arg Asp

530 535 540

Val Phe Lys Lys Gly Asp Ala Tyr Tyr Arg Thr Gly Asp Leu Val Arg

545 550 555 560

Leu Asn Asp Glu Gln Cys Tyr Tyr Phe Val Asp Arg Leu Gly Asp Thr

565 570 575

Phe Arg Trp Lys Ser Glu Asn Val Ser Thr Ser Glu Val Glu Glu His

580 585 590

Val Gly Ala Ser Asp Pro Asn Ile Glu Gln Val Val Cys Val Gly Val

595 600 605

Lys Val Pro Glu His Glu Gly Arg Ala Gly Phe Ala Val Val Lys Leu

610 615 620

Lys Asp Ala Ser Val Lys Pro Asn Leu Asp Gln Ile Ala Glu Tyr Ser

625 630 635 640

Leu Lys Gln Leu Pro Lys Tyr Ala Val Pro Leu Phe Ile Lys Phe Val

645 650 655

Asp Glu Ile Glu Arg Thr Gly Asn Asn Lys Val Gln Lys Val Lys Tyr

660 665 670

Lys Asn Gln Lys Met Pro His Glu Glu Gly Glu Ser Pro Ile Tyr Trp

675 680 685

Leu Lys Gly Asn Lys Tyr Val Glu Leu Asp Ala Gly Asp Trp Ala Ser

690 695 700

Leu Gly Ser Gly Lys Ile Lys Leu

705 710

<210> 55

<211> 1782

<212> DNA

<213> 人工序列

<220>

<223> YlACoS-5PS3

<400> 55

atggcctcaa tcattcacaa gtctcctgtg cccgacgttc agctgttcta cggttcctgg 60

ccagatctca tgcgaacctc tcctcatgcc cacaacgact ccaaacccgt ggtctttgac 120

ttcgatacca agcagcaact tacttggaag caggtctggc aactcagcgc tcgactcaga 180

gcccagctgt accacaagta cggaatcggc aaacccggtg ctcttgcacc tttccacaac 240

gatccctctc tcggagacgt ggtcatcttc tacactccca acacctacag ctcgttgccc 300

tatcatctgg ctcttcacga tctcggagcc accatttctc ctgcctccac atcttacgac 360

gtcaaggaca tttgccatca gatcgttact accgatgcgg tcgtggttgt cgctgcagcc 420

gagaaatccg agattgctcg agaggccgtt cagctgtctg gtcgagacgt cagagttgtg 480

gtcatggagg acctcatcaa caatgctccc accgttgcgc agaacgatat cgactcggca 540

cctcatgtgt ccctgtctcg ggaccaggct cgagccaaga ttgcatacct gggcatgtct 600

tccggtacgt ctggcggact tcccaaggct gttcgtctca ctcacttcaa cgttacctcg 660

aactgtctgc aggtctccgc tgccgcaccc aaccttgccc agaacgtggt tgccagcgcc 720

gtcattccaa ccactcacat ctacggtctc accatgtttc tgtcggttct tccctacaac 780

ggttccgtgg tcattcatca caagcaattc aacttgcgag atctgctcga ggctcagaag 840

acatacaagg tctctctgtg gattctcgtt cctcccgtca tcgtgcagct tgccaagaac 900

cctatggtcg acgagtacct ggactccatt cgagcccatg tgcggtgcat cgtctctgga 960

gctgctcctc tcggtggcaa tgtcgtggat caggtttcgg ttcgtcttac cggcaacaag 1020

gaaggcattc tgcccaacgg agacaagctc gtcattcatc aagcctacgg tcttaccgag 1080

tcctctccca tcgttggaat gctcgatcct ctgtcggacc acatcgacgt catgactgtg 1140

ggctgtctca tgcccaatac cgaggctcga attgtcgacg aagagggaaa cgatcagcca 1200

gcagtccacg ttaccgacac acgaggcatc ggtgccgctg tcaagcgagg cgagaagatt 1260

ccctccggag aactctggat tcgaggtcct cagatcatgg acggatacca caagaacccc 1320

gagtcgtctc gtgagtccct ggaacccagc acagagacct acggtctgca acatttccag 1380

gacagatggc ttcgaactgg agacgttgct gtcatcgaca ccttcggacg agtcatggtt 1440

gtggatcgaa ccaaggagct catcaagtcc atgtctcgac aggttgctcc tgccgagctc 1500

gaagctcttc tgctcaacca tccttccgtc aacgatgtgg ctgtcgttgg cgtccacaac 1560

gacgataatg gcacagagtc agcacgagcg tttgtcgttc ttcaaccagg cgacgcctgt 1620

gatcctacta ccatcaagca ctggatggac cagcaagttc cctcctacaa gcggctgtac 1680

ggaggcattg tggtcatcga cactgttccc aagaatgcct ctggcaagat tctgcgaaga 1740

ctgcttcgac agcggagaga cgatcgagtc tggggtctgt aa 1782

<210> 56

<211> 593

<212> PRT

<213> 人工序列

<220>

<223> YlACoS-5PS3蛋白质

<400> 56

Met Ala Ser Ile Ile His Lys Ser Pro Val Pro Asp Val Gln Leu Phe

1 5 10 15

Tyr Gly Ser Trp Pro Asp Leu Met Arg Thr Ser Pro His Ala His Asn

20 25 30

Asp Ser Lys Pro Val Val Phe Asp Phe Asp Thr Lys Gln Gln Leu Thr

35 40 45

Trp Lys Gln Val Trp Gln Leu Ser Ala Arg Leu Arg Ala Gln Leu Tyr

50 55 60

His Lys Tyr Gly Ile Gly Lys Pro Gly Ala Leu Ala Pro Phe His Asn

65 70 75 80

Asp Pro Ser Leu Gly Asp Val Val Ile Phe Tyr Thr Pro Asn Thr Tyr

85 90 95

Ser Ser Leu Pro Tyr His Leu Ala Leu His Asp Leu Gly Ala Thr Ile

100 105 110

Ser Pro Ala Ser Thr Ser Tyr Asp Val Lys Asp Ile Cys His Gln Ile

115 120 125

Val Thr Thr Asp Ala Val Val Val Val Ala Ala Ala Glu Lys Ser Glu

130 135 140

Ile Ala Arg Glu Ala Val Gln Leu Ser Gly Arg Asp Val Arg Val Val

145 150 155 160

Val Met Glu Asp Leu Ile Asn Asn Ala Pro Thr Val Ala Gln Asn Asp

165 170 175

Ile Asp Ser Ala Pro His Val Ser Leu Ser Arg Asp Gln Ala Arg Ala

180 185 190

Lys Ile Ala Tyr Leu Gly Met Ser Ser Gly Thr Ser Gly Gly Leu Pro

195 200 205

Lys Ala Val Arg Leu Thr His Phe Asn Val Thr Ser Asn Cys Leu Gln

210 215 220

Val Ser Ala Ala Ala Pro Asn Leu Ala Gln Asn Val Val Ala Ser Ala

225 230 235 240

Val Ile Pro Thr Thr His Ile Tyr Gly Leu Thr Met Phe Leu Ser Val

245 250 255

Leu Pro Tyr Asn Gly Ser Val Val Ile His His Lys Gln Phe Asn Leu

260 265 270

Arg Asp Leu Leu Glu Ala Gln Lys Thr Tyr Lys Val Ser Leu Trp Ile

275 280 285

Leu Val Pro Pro Val Ile Val Gln Leu Ala Lys Asn Pro Met Val Asp

290 295 300

Glu Tyr Leu Asp Ser Ile Arg Ala His Val Arg Cys Ile Val Ser Gly

305 310 315 320

Ala Ala Pro Leu Gly Gly Asn Val Val Asp Gln Val Ser Val Arg Leu

325 330 335

Thr Gly Asn Lys Glu Gly Ile Leu Pro Asn Gly Asp Lys Leu Val Ile

340 345 350

His Gln Ala Tyr Gly Leu Thr Glu Ser Ser Pro Ile Val Gly Met Leu

355 360 365

Asp Pro Leu Ser Asp His Ile Asp Val Met Thr Val Gly Cys Leu Met

370 375 380

Pro Asn Thr Glu Ala Arg Ile Val Asp Glu Glu Gly Asn Asp Gln Pro

385 390 395 400

Ala Val His Val Thr Asp Thr Arg Gly Ile Gly Ala Ala Val Lys Arg

405 410 415

Gly Glu Lys Ile Pro Ser Gly Glu Leu Trp Ile Arg Gly Pro Gln Ile

420 425 430

Met Asp Gly Tyr His Lys Asn Pro Glu Ser Ser Arg Glu Ser Leu Glu

435 440 445

Pro Ser Thr Glu Thr Tyr Gly Leu Gln His Phe Gln Asp Arg Trp Leu

450 455 460

Arg Thr Gly Asp Val Ala Val Ile Asp Thr Phe Gly Arg Val Met Val

465 470 475 480

Val Asp Arg Thr Lys Glu Leu Ile Lys Ser Met Ser Arg Gln Val Ala

485 490 495

Pro Ala Glu Leu Glu Ala Leu Leu Leu Asn His Pro Ser Val Asn Asp

500 505 510

Val Ala Val Val Gly Val His Asn Asp Asp Asn Gly Thr Glu Ser Ala

515 520 525

Arg Ala Phe Val Val Leu Gln Pro Gly Asp Ala Cys Asp Pro Thr Thr

530 535 540

Ile Lys His Trp Met Asp Gln Gln Val Pro Ser Tyr Lys Arg Leu Tyr

545 550 555 560

Gly Gly Ile Val Val Ile Asp Thr Val Pro Lys Asn Ala Ser Gly Lys

565 570 575

Ile Leu Arg Arg Leu Leu Arg Gln Arg Arg Asp Asp Arg Val Trp Gly

580 585 590

Leu

<210> 57

<211> 696

<212> PRT

<213> 热带假丝酵母

<400> 57

Met Gly Ala Pro Leu Thr Val Ala Val Gly Glu Ala Lys Pro Gly Glu

1 5 10 15

Thr Ala Pro Arg Arg Lys Ala Ser Gln Lys Leu Ala Pro Val Glu Arg

20 25 30

Pro Thr Asp Ser Lys Ala Thr Thr Leu Pro Glu Phe Ile Glu Glu Cys

35 40 45

Phe Thr Arg Asn Gly Asn Arg Asp Ala Met Ala Trp Arg Asp Leu Leu

50 55 60

Glu Val His Val Glu Thr Lys Lys Val Thr Lys Ile Ile Asp Gly Glu

65 70 75 80

Gln Lys Lys Val Asp Lys Glu Trp Ile Tyr Tyr Glu Met Gly Pro Tyr

85 90 95

Asn Tyr Ile Ser Tyr Pro Lys Leu Leu Gln Leu Val Lys Asn Tyr Ser

100 105 110

Lys Gly Leu Leu Glu Leu Gly Leu Leu Pro Asp Gln Gln Ser Lys Leu

115 120 125

Met Ile Phe Ala Ser Thr Ser His Lys Trp Met Gln Thr Phe Leu Ala

130 135 140

Ser Ser Phe Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu Gly

145 150 155 160

Glu Ser Gly Leu Thr His Ser Leu Val Gln Thr Glu Ser Asp Ala Ile

165 170 175

Phe Thr Asp Asn Gln Leu Leu Gly Ser Leu Ile Arg Pro Leu Glu Lys

180 185 190

Ala Thr Ala Ile Lys Tyr Ile Ile His Gly Glu Lys Ile Asp Pro Asn

195 200 205

Asp Lys Arg Gln Gly Gly Lys Ile Tyr Gln Asp Ala Glu Lys Ala Lys

210 215 220

Glu Lys Ile Leu Gln Ile Arg Pro Asp Ile Lys Phe Ile Ser Tyr Asn

225 230 235 240

Glu Val Ile Ala Leu Gly Glu Lys Ser Ser Lys Glu Leu His Tyr Pro

245 250 255

Lys Pro Glu Asp Ser Ile Cys Ile Met Tyr Thr Ser Gly Ser Thr Gly

260 265 270

Asp Pro Lys Gly Val Val Ile Thr Asn His Asn Ile Val Ala Ala Val

275 280 285

Gly Gly Ile Ser Thr Asn Ala Thr Arg Asp Leu Val Arg Pro Ser Asp

290 295 300

Lys Val Val Ala Phe Leu Pro Leu Ala His Ile Phe Glu Leu Ala Phe

305 310 315 320

Glu Leu Ile Thr Phe Trp Trp Gly Ala Pro Leu Gly Tyr Ala Asn Val

325 330 335

Lys Thr Leu Thr Asp Ala Ser Cys Arg Asn Cys Gln Pro Asp Leu Ile

340 345 350

Glu Phe Lys Pro Thr Ile Met Val Gly Val Ala Ala Val Trp Glu Ser

355 360 365

Val Arg Lys Gly Val Leu Ser Lys Leu Lys Gln Ala Ser Pro Leu Gln

370 375 380

Gln Lys Ile Phe Trp Ala Ala Phe Lys Ala Lys Ser Thr Leu Asn His

385 390 395 400

Phe Gly Leu Pro Gly Gly Gly Met Phe Asp Val Ile Phe Lys Lys Val

405 410 415

Lys Ala Ala Thr Gly Gly Gln Leu Arg Tyr Val Leu Asn Gly Gly Ser

420 425 430

Pro Ile Ser Ile Asp Ala Gln Val Phe Ile Ser Thr Leu Leu Ala Pro

435 440 445

Met Leu Leu Gly Tyr Gly Leu Thr Glu Thr Cys Ala Asn Thr Thr Ile

450 455 460

Thr Glu His Thr Arg Phe Gln Ile Gly Thr Leu Gly Ala Leu Val Gly

465 470 475 480

Ser Val Thr Ala Lys Leu Val Asp Val Ala Asp Ala Gly Tyr Phe Ala

485 490 495

Lys Asn Asn Gln Gly Glu Ile Trp Leu Lys Gly Gly Pro Val Val Lys

500 505 510

Glu Tyr Tyr Lys Asn Glu Glu Glu Thr Lys Ala Ala Phe Thr Asp Asp

515 520 525

Gly Trp Phe Lys Thr Gly Asp Ile Gly Glu Trp Thr Ser Glu Gly Gly

530 535 540

Leu Asn Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr Leu Asn Gly

545 550 555 560

Glu Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg Ser Asn His

565 570 575

Leu Val Met Asn Leu Cys Val Tyr Ala Asp Gln Thr Lys Val Lys Pro

580 585 590

Ile Ala Ile Val Leu Pro Ile Glu Ala Asn Leu Lys Thr Met Leu Lys

595 600 605

Asp Glu Lys Val Val Pro Asp Ala Asp Thr Gln Glu Leu Ser His Leu

610 615 620

Val His Asn Lys Lys Val Val Gln Ala Val Leu Arg His Leu Leu Gln

625 630 635 640

Thr Gly Lys Gln Gln Gly Leu Lys Gly Ile Glu Leu Leu Gln Asn Ile

645 650 655

Val Leu Leu Asp Glu Glu Trp Thr Pro Gln Asn Gly Phe Val Thr Ser

660 665 670

Ala Gln Lys Leu Gln Arg Lys Lys Ile Leu Glu Ser Cys Arg Lys Glu

675 680 685

Val Asp Glu Ala Tyr Lys Ser Ser

690 695

<210> 58

<211> 718

<212> PRT

<213> 热带假丝酵母

<400> 58

Met Pro Ala Leu Phe Lys Glu Ser Ala Lys His Ile Leu Asp Thr Ile

1 5 10 15

Ala Ala Asp Leu Pro Leu Asp Gln Lys Leu Ala Ser Ile Ala Val Pro

20 25 30

Leu Glu Asn Ser Glu Glu Pro Gly Phe Ser Ala Ile Tyr Arg Asn Lys

35 40 45

Tyr Ser Leu Asp Lys Leu Ile Asp Thr Pro Tyr Pro Gly Val Asp Thr

50 55 60

Leu Tyr Lys Leu Phe Glu Val Ala Thr Glu Ala Tyr Gly Asp Lys Pro

65 70 75 80

Cys Leu Gly Ala Arg Val Lys Asn Gln Asp Gly Thr Phe Gly Glu Tyr

85 90 95

Lys Phe Gln Asp Tyr Asn Thr Ile Arg Gln Arg Arg Asn Asn Leu Gly

100 105 110

Ser Gly Ile Phe Phe Val Leu Gln Asn Asn Pro Tyr Lys Thr Ser Ser

115 120 125

Glu Ala His Ser Lys Leu Lys Tyr Asp Pro Ala Ser Lys Asp Ser Phe

130 135 140

Ile Leu Thr Ile Phe Ser His Asn Arg Pro Glu Trp Glu Leu Cys Asp

145 150 155 160

Leu Thr Ser Val Ala Tyr Ser Ile Thr Asn Thr Ala Leu Tyr Asp Thr

165 170 175

Leu Gly Pro Asp Thr Ser Lys Tyr Ile Leu Gly Leu Thr Glu Ser Pro

180 185 190

Ile Val Ile Cys Ser Lys Asp Lys Ile Lys Gly Leu Ile Asp Leu Lys

195 200 205

Lys Ser Asn Pro Glu Glu Leu Ser Asn Leu Ile Val Leu Val Ser Met

210 215 220

Asp Asp Leu Thr Thr Ala Asp Ser Ser Leu Lys Asn Tyr Gly His Glu

225 230 235 240

His Asn Val Thr Val Phe Asp Met Lys Gln Val Glu Lys Leu Gly Glu

245 250 255

Ile Asn Pro Leu Asp Pro Ile Glu Pro Thr Pro Asp Thr Asp Phe Thr

260 265 270

Ile Thr Phe Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val

275 280 285

Leu Asn His Arg Asn Ala Val Ala Gly Val Thr Phe Ile Leu Ser Arg

290 295 300

Tyr Asp Gly Lys Phe Asn Pro Arg Ala Tyr Ser Phe Leu Pro Leu Ala

305 310 315 320

His Ile Tyr Glu Arg Ala Ser Ile Gln Phe Ala Leu Ser Ile Gly Ser

325 330 335

Ala Ile Gly Phe Pro Gln Gly Pro Ser Pro Leu Thr Leu Leu Glu Asp

340 345 350

Val Lys Val Leu Gln Pro Asp Gly Leu Ala Leu Val Pro Arg Val Leu

355 360 365

Thr Lys Leu Glu Ala Ala Ile Arg Ser Gln Thr Ile Asn Asn Asp Glu

370 375 380

Lys Pro Leu Val Lys Ser Val Phe Ser Thr Val Ile Asn Ala Lys Met

385 390 395 400

Asp Leu Gln Thr Lys Asp Glu Asn Glu Asn Val Asn Pro Ser Leu Leu

405 410 415

Val Tyr Asp Arg Leu Leu Asn Met Leu Arg Lys Lys Ile Gly Met Gln

420 425 430

Asn Val Gln Tyr Ile Ser Thr Gly Ser Ala Pro Ile Ala Pro Ser Thr

435 440 445

Ile Gln Phe Leu Lys Ala Ala Leu Asn Val Gly Ile Met Gln Gly Tyr

450 455 460

Gly Leu Ser Glu Ser Phe Ala Gly Cys Met Ala Ser Ser Lys Phe Glu

465 470 475 480

Pro Glu Ala Ala Thr Cys Gly Ala Thr Ser Ile Thr Thr Glu Val Lys

485 490 495

Leu Lys Asp Leu Val Glu Met Gly Tyr Thr Ser Lys Asp Glu Gly Gly

500 505 510

Pro Arg Gly Glu Leu Leu Leu Arg Gly Pro Gln Ile Phe Arg Glu Tyr

515 520 525

Tyr Lys Asn Pro Glu Glu Thr Ala Lys Ala Ile Asp Glu Asp Gly Trp

530 535 540

Phe His Thr Gly Asp Val Ala Lys Ile Asn Ser Lys Gly Arg Ile Ser

545 550 555 560

Ile Ile Asp Arg Ala Lys Asn Phe Phe Lys Leu Ala Gln Gly Glu Tyr

565 570 575

Val Thr Pro Glu Lys Ile Glu Gly Leu Tyr Leu Ser Lys Phe Pro Tyr

580 585 590

Ile Ala Gln Leu Phe Val His Gly Asp Ser Lys Glu Ser Phe Leu Val

595 600 605

Ala Val Val Gly Leu Asp Pro Ile Ala Ala Lys Gln Tyr Met Glu His

610 615 620

Arg Phe His Asp Lys Ile Val Lys Glu Asp Asp Ile Val Glu Phe Phe

625 630 635 640

Lys Ser Pro Arg Asn Arg Lys Ile Leu Leu Gln Asp Met Asn Lys Ser

645 650 655

Ile Ala Asp Gln Leu Gln Gly Phe Glu Lys Leu His Asn Ile Tyr Val

660 665 670

Asp Phe Glu Pro Leu Thr Val Asp Arg Gly Val Ile Thr Pro Thr Met

675 680 685

Lys Ile Arg Arg Pro Ile Ala Val Lys Phe Phe Gln Asp Gln Ile Asp

690 695 700

Gly Met Tyr Asn Glu Gly Ser Leu Val Lys Asn Gly Ser Leu

705 710 715

<210> 59

<211> 718

<212> PRT

<213> 热带假丝酵母

<400> 59

Met Pro Ala Leu Phe Lys Glu Ser Pro Gln Gln Ile Ser Gln Ser Leu

1 5 10 15

Lys Ala Lys Phe Ser Asp Pro Tyr Gln Phe Ala Thr Ser Val Pro Leu

20 25 30

Ser Asp Thr Lys Glu Pro Gly Tyr Ser His Ile Tyr Arg Asn Ser Tyr

35 40 45

Asp Pro Thr Thr Leu Ala Thr Cys Pro His Pro Glu Leu Asp Thr Leu

50 55 60

His Lys Ile Phe Glu Phe Ser Asn Thr Ile Tyr Ser Asp Ser Pro Phe

65 70 75 80

Leu Gly His Arg Val Lys Asn Pro Asp Gly Thr Phe Gly Glu Tyr Lys

85 90 95

Phe Gln Thr Tyr Arg Gln Ile Tyr Lys Arg Arg Asn Asp Phe Gly Ser

100 105 110

Gly Ile Tyr Tyr Val Leu Glu Asn Asn Pro Tyr Lys Thr Ser Ser Glu

115 120 125

Ala His Ser Lys Leu Lys Tyr Asp Pro Thr Asn Lys Asp Pro Phe Ile

130 135 140

Leu Ala Val Phe Ser His Asn Arg Pro Glu Trp Ala Leu Cys Asp Leu

145 150 155 160

Thr Thr Asn Ser Phe Gly Ile Ile Asn Thr Ala Leu Tyr Ser Thr Leu

165 170 175

Gly Pro Asp Thr Ser Arg Tyr Ile Leu Gly Val Thr Asp Cys Pro Ile

180 185 190

Val Val Thr Thr Lys Asp Lys Val Lys Gly Ile Ile Ser Leu Lys Asn

195 200 205

Ser Asn Gln Lys Glu Leu Ala Ser Leu Ile Thr Ile Val Ser Met Asp

210 215 220

Glu Leu Thr Glu Glu Asp Lys Glu Leu Arg Ser Phe Gly His Glu Asn

225 230 235 240

Asn Ile Thr Val Tyr Asp Ile Lys Glu Val Glu Asn Phe Gly Glu Lys

245 250 255

Asn Pro Leu Lys Pro Ile Glu Pro Thr Pro Asp Thr Ile Phe Thr Ile

260 265 270

Ser Phe Thr Ser Gly Thr Thr Gly Ala Ala Pro Lys Gly Val Val Leu

275 280 285

Thr Asn Arg Ile Leu Val Ser Gly Ile Thr Thr His Cys Thr Ile Leu

290 295 300

Ser Phe Gly Pro Glu Arg Val His Tyr Ser Phe Leu Pro Leu Ala His

305 310 315 320

Ile Tyr Glu Arg Met Leu Leu Gln Phe Gly Ile Leu Ala Gly Val Lys

325 330 335

Ile Gly Tyr Pro Gln Gly Pro Leu Pro Thr Thr Leu Phe Asp Asp Val

340 345 350

Lys Tyr Leu Gln Pro Thr Phe Leu Cys Leu Val Pro Arg Val Phe Thr

355 360 365

Lys Ile Glu Ala Ala Ile Lys Ala Gln Thr Val Glu Asn Asp Ala Asn

370 375 380

Pro Lys Ile Lys Thr Leu Phe Gln Asn Ile Val Asp Lys Lys Leu Lys

385 390 395 400

Leu Gln Gln Gln Glu Asp Phe Thr Asn Pro Ser Phe Pro Glu Gly Asp

405 410 415

Lys Val Leu Leu Gln Leu Arg Glu Lys Leu Gly Phe Gly Lys Ile Ala

420 425 430

Phe Met Asn Thr Gly Ser Ala Pro Leu Ser Glu Glu Thr Tyr Arg Phe

435 440 445

Leu Gln Ala Ile Leu Asn Leu Pro Asp Gly Phe Arg Ser Gly Tyr Gly

450 455 460

Leu Thr Glu Ser Ala Ser Gly Val Cys Ile Ser Pro Ala Tyr Ala Asn

465 470 475 480

Glu Phe Ser Cys Gly Pro Ile Ser Val Thr Thr Glu Phe Lys Leu Arg

485 490 495

Asp Ile Glu Glu Met Gly Tyr Thr Ser Ser Asp Lys Asp Gly Pro Arg

500 505 510

Gly Glu Leu Leu Leu Arg Gly Pro Gln Ile Phe Pro Tyr Tyr Tyr Lys

515 520 525

Asn Pro Glu Glu Thr Ala Lys Val Ile Asp Lys Asp Gly Trp Phe Tyr

530 535 540

Thr Gly Asp Val Ala Val Val Ser Pro Gln His Gly Asn Arg Leu Gln

545 550 555 560

Ile Ile Asp Arg Val Lys Asn Phe Phe Lys Leu Ser Gln Gly Glu Tyr

565 570 575

Val Ser Pro Glu Lys Ile Glu Asn Val Tyr Leu Ser Gln Phe Pro Tyr

580 585 590

Ile Ser Gln Leu Phe Ala His Gly Asp Ser Thr Glu Ser Tyr Leu Val

595 600 605

Gly Val Val Gly Ile Asp Lys Ala Ser Ile Asp Pro Tyr Leu Lys Lys

610 615 620

Arg Phe Asn Val Ser Ile Glu Lys Gln Ala Asp Ile Val Lys Tyr Phe

625 630 635 640

Glu Asn Pro Lys Asn Arg Arg Ala Leu Leu His Asp Met Asn Glu Ala

645 650 655

Ile Glu Gly Gln Leu Gln Gly Phe Glu Lys Leu His Asn Val Phe Val

660 665 670

Asp Phe Glu Pro Leu Thr Leu Glu Arg Glu Val Ile Thr Pro Thr Ile

675 680 685

Lys Ile Arg Arg Pro Val Ala Val Lys Phe Phe Lys Glu Gln Ile Glu

690 695 700

Asn Met Tyr Arg Glu Gly Ser Leu Ile Lys Gly Ser Asn Leu

705 710 715

<210> 60

<211> 741

<212> PRT

<213> 热带假丝酵母

<400> 60

Met Thr Thr Leu Pro Ser Ile Ser Glu Thr Asp Ile Val Tyr Ala Thr

1 5 10 15

Asp Asp Lys Pro Tyr Val Phe Glu Asn Pro Asn Asp Leu Pro Val Glu

20 25 30

Thr Leu Val Asn His Ile Leu Pro Phe Pro Gln Glu Val Ala Gly Glu

35 40 45

Ser Ile Lys Ile Pro Gly Thr Ala Val Glu Gly Phe Ser Glu Ile Tyr

50 55 60

Arg Asn Ala Ala Thr Pro Asn Gly Ile Lys Ala Ser Leu Ile Lys Gly

65 70 75 80

Leu Asp Thr Tyr His Asp Ile Phe Glu Arg Ser Ala Asp Cys Tyr Ala

85 90 95

Asp Glu Pro Cys Leu Ala Phe His Glu Tyr Asp Tyr Glu Asn Ser Gln

100 105 110

His Leu Glu Arg Tyr Ala Thr Ile Ser Tyr Lys Glu Val Arg Gln Arg

115 120 125

Lys Asp Asp Phe Ala Ala Gly Leu Phe Phe Leu Leu Lys Ser Asn Pro

130 135 140

Phe Lys Asn Asn Ser Leu Glu Ser His Gln Lys Ile Asp Asn His Glu

145 150 155 160

Ala Asn Tyr Lys Ser Tyr Asn Ser Asp Asp Met Ser Phe Ile Ala Thr

165 170 175

Phe Tyr Ala Gly Asn Arg Val Glu Trp Ile Leu Ser Asp Leu Ala Cys

180 185 190

Ser Ser Asn Ser Ile Thr Ser Thr Ala Leu Tyr Asp Thr Leu Gly Pro

195 200 205

Glu Thr Ser Lys Tyr Ile Leu Glu Thr Thr Gln Ser Pro Val Ile Ile

210 215 220

Ser Ser Lys Asp His Ile Arg Gly Leu Ile Glu Leu Lys Arg Lys Tyr

225 230 235 240

Pro Glu Ala Leu Glu Ser Ile Ile Leu Ile Ile Ser Met Asp Pro Leu

245 250 255

Thr Lys Ser Asp Val Gly Leu Val Gln Leu Ala Glu Lys Ser Asn Ile

260 265 270

Lys Leu Tyr Asp Phe Ser Gln Val Glu Arg Thr Gly Ala Ile Phe Pro

275 280 285

His Glu Thr Asn Pro Pro Asn Ser Glu Thr Val Phe Thr Ile Thr Phe

290 295 300

Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val Leu Pro Gln

305 310 315 320

Arg Cys Ala Ala Ser Ala Met Leu Ala Tyr Ser Leu Leu Met Pro His

325 330 335

His Arg Gly Thr Arg Glu Phe Ala Phe Leu Pro Leu Ala His Ile Phe

340 345 350

Glu Arg Gln Met Val Ala Ser Met Phe Leu Phe Gly Gly Ser Ser Ala

355 360 365

Phe Pro Arg Leu Gly Gly Thr Pro Leu Thr Leu Val Glu Asp Leu Lys

370 375 380

Leu Trp Lys Pro Asn Phe Met Ala Asn Val Pro Arg Ile Phe Thr Lys

385 390 395 400

Ile Glu Ala Gly Ile Lys Ala Ser Thr Ile Asp Ser Thr Ser Gly Leu

405 410 415

Thr Arg Ser Leu Tyr Gly Arg Ala Ile Glu Ala Lys Arg Val Lys Gln

420 425 430

Ile Lys Asn Asp Asp Ser Gly Asp His Phe Ile Tyr Asp Lys Leu Leu

435 440 445

Ile Gln Lys Leu Arg Asn Ala Ile Gly Tyr Asp Lys Leu Glu Phe Cys

450 455 460

Val Thr Gly Ser Ala Pro Ile Ala Pro Glu Thr Ile Lys Phe Leu Lys

465 470 475 480

Ala Ser Leu Gly Ile Gly Phe Ala Gln Gly Tyr Gly Ser Ser Glu Ser

485 490 495

Phe Ala Gly Met Leu Phe Ala Leu Pro Phe Lys Thr Ser Ser Val Gly

500 505 510

Thr Cys Gly Val Ile Ala Pro Thr Met Glu Ala Arg Leu Arg Glu Leu

515 520 525

Pro Asp Met Gly Tyr Met Leu Asp Asp Ala Asn Gly Pro Arg Gly Glu

530 535 540

Leu Gln Ile Arg Gly Ala Gln Leu Phe Thr Lys Tyr Phe Lys Asn Asp

545 550 555 560

Glu Glu Thr Ala Lys Ser Ile Asp Glu Asp Gly Trp Phe Ser Thr Gly

565 570 575

Asp Val Ala Glu Ile Gly Ala Lys Asp Gly Tyr Phe Arg Ile Ile Asp

580 585 590

Arg Val Lys Asn Phe Tyr Lys Leu Ala Gln Gly Glu Tyr Val Ser Pro

595 600 605

Glu Lys Ile Glu Ser Leu Tyr Leu Ser Leu Asn Ser Thr Ile Ser Gln

610 615 620

Leu Phe Val His Gly Asp Ser Thr Lys Ser Tyr Leu Val Gly Val Val

625 630 635 640

Gly Leu Gln Pro Asp Val Ala Ser Lys Tyr Val Asp Leu Ser Ser Gly

645 650 655

Asp Lys Val Val Gln Glu Leu Asn Lys Pro Glu Leu Arg Lys Gln Ile

660 665 670

Leu Ser Asp Leu Asn Gly Lys Val Asn Gly Lys Leu Gln Gly Phe Glu

675 680 685

Lys Leu His Asn Ile Phe Ile Asp Ile Glu Pro Leu Thr Leu Glu Arg

690 695 700

Asn Val Val Thr Pro Thr Met Lys Leu Lys Arg His Phe Ala Ala Lys

705 710 715 720

Phe Phe Arg Ala Gln Ile Asp Ser Met Tyr Glu Glu Gly Ser Ile Val

725 730 735

Ala Asp Tyr Lys Leu

740

<210> 61

<211> 741

<212> PRT

<213> 热带假丝酵母

<400> 61

Met Thr Thr Leu Pro Ser Ile Ser Glu Thr Asp Ile Val Tyr Ala Thr

1 5 10 15

Asp Asp Lys Pro Tyr Val Phe Glu Asn Pro Asn Asp Leu Pro Val Glu

20 25 30

Thr Leu Val Asn His Ile Leu Pro Phe Pro Gln Glu Val Ala Gly Glu

35 40 45

Ser Ile Lys Ile Pro Gly Thr Ala Val Glu Gly Phe Ser Glu Ile Tyr

50 55 60

Arg Asn Ala Ala Thr Pro Asn Gly Ile Lys Ala Ser Leu Ile Lys Gly

65 70 75 80

Leu Asp Thr Tyr His Asp Ile Phe Glu Arg Ser Ala Asp Cys Tyr Ala

85 90 95

Asp Glu Pro Cys Leu Ala Phe His Glu Tyr Asp Tyr Glu Asn Ser Gln

100 105 110

His Leu Glu Arg Tyr Ala Thr Ile Ser Tyr Lys Glu Val Arg Gln Arg

115 120 125

Lys Asp Asp Phe Ala Ala Gly Leu Phe Phe Leu Leu Lys Ser Asn Pro

130 135 140

Phe Lys Asn Asn Ser Leu Glu Ser His Gln Lys Ile Asp Asn His Glu

145 150 155 160

Ala Asn Tyr Lys Ser Tyr Asn Ser Asp Asp Met Ser Phe Ile Ala Thr

165 170 175

Phe Tyr Ala Gly Asn Arg Val Glu Trp Ile Leu Ser Asp Leu Ala Cys

180 185 190

Ser Ser Asn Ser Ile Thr Ser Thr Ala Leu Tyr Asp Thr Leu Gly Pro

195 200 205

Gly Thr Ser Lys Tyr Ile Leu Glu Ala Thr Gln Ser Pro Val Ile Ile

210 215 220

Thr Ser Lys Asp His Ile Lys Gly Leu Ile Glu Leu Lys Arg Lys Tyr

225 230 235 240

Pro Glu Ala Leu Glu Ser Ile Ile Leu Ile Ile Ser Met Asp Pro Leu

245 250 255

Thr Lys Ser Asp Val Gly Leu Val Gln Leu Ala Glu Asn Ser Asn Ile

260 265 270

Lys Leu Tyr Asp Phe Ser Gln Val Glu Arg Ala Gly Ala Ile Phe Pro

275 280 285

His Glu Thr Asn Pro Pro Asn Arg Glu Thr Val Phe Thr Ile Thr Phe

290 295 300

Thr Ser Gly Thr Thr Gly Ala Asn Pro Lys Gly Val Val Leu Ser Gln

305 310 315 320

Gly Ser Ala Ala Ser Ala Ser Phe Val Tyr Ser Leu Leu Met Pro His

325 330 335

Arg Arg Gly Ala Arg Asp Phe Ala Phe Leu Pro Leu Ala His Ile Phe

340 345 350

Gln Arg Gln Met Val Ala Ser Thr Leu Phe Phe Gly Gly Ser Ser Ala

355 360 365

Phe Pro Arg Leu Gly Gly Thr Pro Leu Thr Leu Val Glu Asp Leu Lys

370 375 380

Leu Trp Lys Pro Asn Phe Met Ala Asn Val Pro Arg Ile Phe Thr Lys

385 390 395 400

Ile Glu Ala Gly Ile Lys Ala Ser Thr Ile Asp Ser Thr Ser Gly Leu

405 410 415

Thr Arg Ser Leu Tyr Gly Arg Ala Ile Glu Ala Lys Arg Val Lys Gln

420 425 430

Ile Lys Asn Asp Asp Ser Gly Asp His Phe Ile Tyr Asp Lys Leu Leu

435 440 445

Ile Gln Lys Leu Arg Asn Ala Ile Gly Tyr Asp Lys Leu Glu Phe Leu

450 455 460

Leu Thr Gly Ser Ala Pro Ile Ser Pro Glu Thr Ile Lys Phe Leu Lys

465 470 475 480

Ser Ser Leu Gly Ile Gly Phe Gly Gln Gly Tyr Gly Ser Ser Glu Ser

485 490 495

Phe Gly Gly Ile Leu Phe Ala Leu Pro Phe Lys Asn Ser Ser Leu Gly

500 505 510

Thr Cys Gly Val Ile Ala Pro Thr Met Glu Ala Arg Leu Arg Glu Leu

515 520 525

Pro Asp Met Gly Tyr Met Leu Asp Asp Ala Asn Gly Pro Arg Gly Glu

530 535 540

Leu Gln Ile Arg Gly Ala Gln Leu Phe Ala Lys Tyr Phe Lys Asn Asp

545 550 555 560

Glu Glu Thr Ala Lys Ser Ile Asp Glu Asp Gly Trp Phe Ser Thr Gly

565 570 575

Asp Val Ala Glu Ile Gly Ala Lys Asp Gly Tyr Phe Arg Ile Ile Asp

580 585 590

Arg Val Lys Asn Phe Tyr Lys Leu Ala Gln Gly Glu Tyr Val Ser Pro

595 600 605

Glu Lys Ile Glu Asn Leu Tyr Leu Ser Leu Asn Ser Thr Ile Ser Gln

610 615 620

Leu Phe Ile His Gly Asp Ser Thr Lys Ser Tyr Leu Val Gly Val Val

625 630 635 640

Gly Leu Gln Pro Asp Val Ala Ser Lys Tyr Val Asp Leu Ser Ser Gly

645 650 655

Asp Lys Val Val Gln Glu Leu Asn Lys Pro Glu Leu Arg Lys Gln Ile

660 665 670

Leu Leu Asp Leu Asn Gly Lys Val Asn Gly Lys Leu Gln Gly Phe Glu

675 680 685

Lys Leu His Asn Ile Phe Ile Asp Ile Glu Pro Leu Thr Leu Glu Arg

690 695 700

Asn Val Val Thr Pro Thr Met Lys Leu Lys Arg His Phe Ala Ala Lys

705 710 715 720

Phe Phe Arg Ala Gln Ile Asp Ser Met Tyr Glu Glu Gly Ser Ile Ile

725 730 735

Ala Asp Tyr Lys Leu

740

<210> 62

<211> 749

<212> PRT

<213> 热带假丝酵母

<400> 62

Met Ile Glu Ser Lys Ser Ile Phe Ser Gly Glu Lys Tyr Thr Lys Gln

1 5 10 15

Glu Ala Leu Ser Gln Leu Pro Phe Gly Ser Asp Val Glu Asn Ala Val

20 25 30

Met Ile Asp Glu Pro Val Thr Asn Val Lys Tyr Ser Pro Ile Phe Arg

35 40 45

Asn Lys Ala His Leu Asp Gly Leu Ile Gln Asn Val His Pro Asp Leu

50 55 60

Asn Thr His Tyr Lys Leu Phe Asn Asn Ala Ala Glu Met Tyr His Asp

65 70 75 80

Arg Pro Cys Leu Gly Lys Arg Pro Tyr Asn Tyr Thr Thr His Gln Ser

85 90 95

Asp Asp Tyr Phe Ser His Trp Thr Tyr Gly Glu Val Phe Thr Lys Lys

100 105 110

Asn Asn Leu Gly Ala Gly Phe Ile Arg Ala Leu Leu Glu Asn Pro Phe

115 120 125

Leu Asp Val Gln Leu Glu Ser His Arg Lys Val Val Asn His Leu Arg

130 135 140

Asp Trp Ser Asn Phe Gly Ile Asn Lys Leu Pro Arg Asp Asn Leu Asn

145 150 155 160

Cys Glu Ile Glu Lys Asn Cys Ser Phe Ile Leu Thr Ile Phe Ala Val

165 170 175

Asn Arg Ala Glu Trp Ile Leu Thr Asp Leu Ala Cys Ser Ser Tyr Gly

180 185 190

Ile Thr Asn Thr Ala Leu Tyr Asp Thr Leu Gly Pro Asp Val Ser Gln

195 200 205

Tyr Ile Leu Asn Leu Thr Glu Ser Pro Ile Val Val Cys Thr His Asp

210 215 220

Lys Ile Gln Val Leu Ile Asn Leu Lys Lys Lys Tyr Pro Gln Gln Thr

225 230 235 240

Lys Asn Leu Ile Ser Ile Val Ser Met Asp Pro Ile Asp Leu Val Thr

245 250 255

Gln Gly Thr Ile Glu Asp Ala Tyr Glu Leu Gly Ile Thr Ile Gln Gly

260 265 270

Leu Asn Gln Ile Glu Lys Ile Gly Ala Lys Asn Pro Ile His Gln Leu

275 280 285

Glu Thr Asn Pro Glu Ala Leu Phe Thr Ile Ser Phe Thr Ser Gly Thr

290 295 300

Thr Gly Ser Lys Pro Lys Gly Val Met Ile Ser Gln Gly Gly Ala Ala

305 310 315 320

Ala Tyr Ile Thr Tyr Leu Leu Cys Cys Glu Pro Gln Ala Lys Pro Gly

325 330 335

Asp Lys Ala Phe Ile Phe Leu Pro Leu Thr His Leu Tyr Glu Arg Gln

340 345 350

Thr Cys Gly Phe Ala Phe Ser Ser Gly Tyr Tyr Leu Gly Phe Pro Gln

355 360 365

Val Asn Leu Gly Lys Lys Lys Ile Asn Pro Phe Glu Asn Leu Leu Ala

370 375 380

Asp Leu Arg Ile Phe Lys Pro Thr Tyr Met Ser Met Val Pro Arg Leu

385 390 395 400

Leu Thr Arg Leu Glu Ala Leu Ile Lys Ser Lys Ile Lys Glu Leu Pro

405 410 415

Val Gln Glu Gln Glu Lys Val Asn Ser Ile Ile Glu Ala Lys Ile Lys

420 425 430

Lys Gln Ser Lys Gln Asp Gly Ser Thr Gly Phe Asp Ala Thr Leu Asp

435 440 445

Asn Asp Pro Thr Tyr Lys Ser Leu Ala Gln Phe Val Gly Tyr Asp Asn

450 455 460

Met Arg Trp Val Gln Thr Ala Ser Ala Pro Ile Ala Pro Thr Thr Leu

465 470 475 480

Ile Tyr Leu Lys Ala Ser Leu Asn Ile Gly Thr Arg Gln Gln Tyr Gly

485 490 495

Leu Thr Glu Ser Gly Ala Ala Ile Thr Ser Thr Gly Glu Tyr Glu Ala

500 505 510

Ser Pro Gly Ser Cys Gly Val Ile Leu Pro Thr Gly Gln Tyr Arg Leu

515 520 525

Tyr Ser Val Ser Glu Met Gly Tyr Asp Leu Asn Lys Leu Glu Gly Glu

530 535 540

Val Met Leu Gln Gly Pro Gln Met Phe Lys Gly Tyr Tyr Tyr Asn Tyr

545 550 555 560

Glu Glu Thr Ile Asn Ala Val Thr Glu Asp Gly Trp Phe His Ser Gly

565 570 575

Asp Ile Ala Arg Val Asp Ser Lys Thr Gly Arg Val Thr Ile Ile Asp

580 585 590

Arg Val Lys His Phe Phe Lys Leu Ala Gln Gly Glu Tyr Ile Ser Pro

595 600 605

Glu Arg Ile Glu Asn Arg Tyr Leu Ser Ser Asn Pro Asp Ile Cys Gln

610 615 620

Leu Trp Val His Gly Asp Ser Lys Glu His Tyr Leu Ile Gly Ile Val

625 630 635 640

Gly Val Glu Tyr Glu Lys Gly Leu Lys Phe Ile Asn Thr Glu Phe Gly

645 650 655

Tyr Asn Lys Ile Asp Met Pro Pro Gly Asp Leu Leu Asp Ile Leu Asn

660 665 670

Ser Pro Glu Val Lys Ser Lys Phe Leu Thr Lys Met Asn Gln Ser Val

675 680 685

Arg Asp Lys Leu Asn Gly Phe Glu Ile Leu His Asn Ile Phe Ile Glu

690 695 700

Phe Glu Pro Leu Thr Val Gln Arg Glu Val Val Thr Pro Thr Phe Lys

705 710 715 720

Ile Arg Arg Pro Ile Cys Arg Lys Phe Phe Lys Ser Gln Leu Asp Ala

725 730 735

Met Tyr Asn Glu Gly Ser Leu Ile Asn Asn Ala Lys Leu

740 745

<210> 63

<211> 8902

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZP2-YlACoS-3Ps

<400> 63

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500

acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560

cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620

cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680

tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740

tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800

gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860

gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920

tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980

ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040

ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100

cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160

tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220

ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280

attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340

tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400

taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460

ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520

gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580

gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640

gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700

cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760

acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820

gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880

cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940

tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000

cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060

ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120

tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180

cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240

gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300

agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcca 7260

tcatccactc caccggaact ctgcccatct tcaacggtac cgtcaccgat tacctgcgaa 7320

caaagccttc ttactcgtcc acagatccag cctacatcga cgtggttaca ggcaactcta 7380

tcagctactc cgaggtctgg aagcttgccg accgactctc ctctgctctg tacaacgact 7440

acggactcac cgacgccaag cccgacgaga atgtgggtcc tgttgtcatg ctgcacgctg 7500

tcaattcgcc tctcctggca tctgttcact acgctcttct ggatctgggc gtcacaatca 7560

ctcccgcagc tgccacctac gaggctggcg atctcgcaca tcaaatcaag gtgtgctctc 7620

cgtccctggt catttgcaac cagcagttcg aacccaaggt caaatctgcc tccagcaaca 7680

ccaagctcat tttcatcgag gatctgctca aaacccagtc gtctgctccc tggaaaaagt 7740

tcactacctc caaccccaac cgagttgcct acctgggcat gtccagtgga acctctggtc 7800

tccccaaggc ggttcaacag acccacatca acatgtcgtc ttccaccgaa gccgtcattt 7860

cctctcagac catcttcagc gctcgaaaga acgtcaccgc agccattgtg cccatgactc 7920

atgtctacgg actcaccaag tttgttttcc actctgtcgc aggctcaatg accaccgttg 7980

tgttccccaa gttctccctg gtcgacctcc tggaggccca gatcaagtac aagatcaaca 8040

ttctgtatct ggttcctcca gtggtcttgg ctctggccaa ggactctcgt gtacagccct 8100

acatcaagtc catttgcgag ctcaccactc tgattgccac tggtgcggct ccccttcctc 8160

ccactgcagg cgacgccctt ctggagcgac ttacgggcaa caaagaggga aacagagaca 8220

acggtatgga tcccttggtt ctcatccagg gctacggact cacagagact ctccaggtgt 8280

ctgtcttcaa gccagaggat cccgaacgag atctcaagac cgtgggcaaa ctgcttccca 8340

acaccgaggt tcgaattgtc ggcgagaagg gagatgttcc gcgttccaaa tggtcgtttg 8400

tcactcctcc aaccggcgaa atctacattc gaggtcccca cgtgactcct ggttacttca 8460

acaacgactc tgccaactct gagtcctttg acggcgagtg gctcaagacc ggcgatatcg 8520

gatacatgga cctggaaggt cgactcacca ttgtggaccg aaacaaggag atgatcaagg 8580

tcaacggacg tcaggttgct cctgccgaga tcgaatctgt gctgctgggt catcctatgg 8640

tcaaggatgt ggccgtcatt ggagtcacca atcccgacag aggcacggag tctgctcggg 8700

cgtttcttgt tactgaagct cgagctctcc ctgtcatcaa gcagtggttt gaccgtcgag 8760

ttccctccta caagcgactt tacggaggca ttgtggttgt cgatgccatt cccaagtctg 8820

cctcgggcaa gattctgcga cgggtcctca gagagcgaaa gggcgactcc gtgtttggag 8880

agtatgtcga ggaagtctaa gc 8902

<210> 64

<211> 9055

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZP2-YlACoS-5Ps

<400> 64

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500

acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560

cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620

cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680

tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740

tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800

gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860

gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920

tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980

ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040

ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100

cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160

tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220

ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280

attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340

tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400

taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460

ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520

gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580

gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640

gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700

cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760

acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820

gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880

cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940

tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000

cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060

ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120

tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180

cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240

gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300

agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260

caatcattca caagtctcct gtgcccgacg ttcagctgtt ctacggttcc tggccagatc 7320

tcatgcgaac ctctcctcat gcccacaacg actccaaacc cgtggtcttt gacttcgata 7380

ccaagcagca acttacttgg aagcaggtct ggcaactcag cgctcgactc agagcccagc 7440

tgtaccacaa gtacggaatc ggcaaacccg gtgctcttgc acctttccac aacgatccct 7500

ctctcggaga cgtggtcatc ttctacactc ccaacaccta cagctcgttg ccctatcatc 7560

tggctcttca cgatctcgga gccaccattt ctcctgcctc cacatcttac gacgtcaagg 7620

acatttgcca tcagatcgtt actaccgatg cggtcgtggt tgtcgctgca gccgagaaat 7680

ccgagattgc tcgagaggcc gttcagctgt ctggtcgaga cgtcagagtt gtggtcatgg 7740

aggacctcat caacaatgct cccaccgttg cgcagaacga tatcgactcg gcacctcatg 7800

tgtccctgtc tcgggaccag gctcgagcca agattgcata cctgggcatg tcttccggta 7860

cgtctggcgg acttcccaag gctgttcgtc tcactcactt caacgttacc tcgaactgtc 7920

tgcaggtctc cgctgccgca cccaaccttg cccagaacgt ggttgccagc gccgtcattc 7980

caaccactca catctacggt ctcaccatgt ttctgtcggt tcttccctac aacggttccg 8040

tggtcattca tcacaagcaa ttcaacttgc gagatctgct cgaggctcag aagacataca 8100

aggtctctct gtggattctc gttcctcccg tcatcgtgca gcttgccaag aaccctatgg 8160

tcgacgagta cctggactcc attcgagccc atgtgcggtg catcgtctct ggagctgctc 8220

ctctcggtgg caatgtcgtg gatcaggttt cggttcgtct taccggcaac aaggaaggca 8280

ttctgcccaa cggagacaag ctcgtcattc atcaagccta cggtcttacc gagtcctctc 8340

ccatcgttgg aatgctcgat cctctgtcgg accacatcga cgtcatgact gtgggctgtc 8400

tcatgcccaa taccgaggct cgaattgtcg acgaagaggg aaacgatcag ccagcagtcc 8460

acgttaccga cacacgaggc atcggtgccg ctgtcaagcg aggcgagaag attccctccg 8520

gagaactctg gattcgaggt cctcagatca tggacggata ccacaagaac cccgagtcgt 8580

ctcgtgagtc cctggaaccc agcacagaga cctacggtct gcaacatttc caggacagat 8640

ggcttcgaac tggagacgtt gctgtcatcg acaccttcgg acgagtcatg gttgtggatc 8700

gaaccaagga gctcatcaag tccatgtctc gacaggttgc tcctgccgag ctcgaagctc 8760

ttctgctcaa ccatccttcc gtcaacgatg tggctgtcgt tggcgtccac aacgacgata 8820

atggcacaga gtcagcacga gcgtttgtcg ttcttcaacc aggcgacgcc tgtgatccta 8880

ctaccatcaa gcactggatg gaccagcaag ttccctccta caagcggctg tacggaggca 8940

ttgtggtcat cgacactgtt cccaagaatg cctctggcaa gattctgcga agactgcttc 9000

gacagcggag agacgatcga gtctggggtc tggccaaggt tgccaagctc taagc 9055

<210> 65

<211> 9043

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZP2-YlACoS-6Ps

<400> 65

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500

acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560

cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620

cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680

tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740

tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800

gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860

gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920

tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980

ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040

ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100

cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160

tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220

ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280

attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340

tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400

taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460

ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520

gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580

gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640

gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700

cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760

acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820

gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880

cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940

tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000

cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060

ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120

tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180

cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240

gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300

agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcca 7260

cacagattat ccacaacgcc accatcccca atatccccgt cgaccagctc tacgacggca 7320

agatcaccga cttcattcga tccggaggcc actccaacga aaccaagcct tctgtcatcg 7380

acgccaagac aggccagact ctctcccagg cggaaatgtg gcagctgtcg gacaagtacg 7440

cggcacttct cagctctcag tacggtctgt gccgacacag agacaacgag ctggacccat 7500

ctatgggaga tgtgctcatc accttctttg gaaacgttat cctcgctcct gtggtccatt 7560

gggctgccct cgacctcgga gcaaccattt ctcctggatc cacaggctac tctgcccagg 7620

atctcgctca ccagttccga gtcaccactc ccaaggtcgt tgtgtacgcc aaggcgttca 7680

aggatgtggt ggacgaggct acgaagctgt acaactcccc aaaccctcca gcacttgtcg 7740

agctcgaggc gctggacaag caggcccgaa tggttggaaa ccacaaggtc gaacacaccc 7800

gaaagatcaa gctggctcct cacgagtccc gaactcggat cgcgtacctt ggcatgtctt 7860

caggtacctc cggtggagtt tcaaaggctg tccgactcac ccattccaat ctcacgtcgt 7920

gttccgaaat ctcgaacaaa gcctccgagt ctctcgcaac tgaccagcag atcgctgccg 7980

ccatcattcc cgtgagtcat ctgtttggac tgtccaagtt cctcattggc aaccctcacg 8040

ccggagccac cactgtctat cacaatggct tcgatctgat cgaggtgctg gaggcacaga 8100

agaaatacaa agtcaactcg tggaccctgg ttcctcccat cattgtcctg ctcaccaaac 8160

accccattgt cgagaagtac attccttctc tccgtgccca catgcgagcc atcctctccg 8220

gagctgctcc tctgggtgcc aatgtcacag aggctcttct cacccgagtc actggcaaca 8280

agtttggcga gtctcccgag ggcggtctgc gaatcgttca gggctacgga cttacagaga 8340

cgtctcccgt tgccactctg tttgaccccg aagacaagga acgacacatt cggtcgtgtg 8400

gaaagctcgt gcccaactct caggttcgaa ttgtcaacga agacggcgtg gatcagcctg 8460

cctacgatgt ggaccccaac gagctggacg aggccatcaa acagggcact ctgccagtcg 8520

gagagctttg gatcagaggt ccccaggtta tggacggcta ccataacaac cccgaggcca 8580

acgaagcctg tttcgtcaag gctgacgatg ctgaagcaga tactgcctac tacaacagac 8640

actggttccg aaccggagac gttgctctgg tcgacaagca gggcagatac atgattgtgg 8700

accgaaccaa ggagatgatc aagagtcagg gtaagcaggt tgctcctgcc gagctcgaag 8760

acatgctcct gggacacgca caggtggcag ataccgcagt catcggtatt caggacgtgg 8820

agaagggtaa cgaggctcct cgagcttttg ttgtgctcaa ggacccgaag tacgacgctg 8880

tggagatcaa gacatggctg gacaagcagc ttcccaagta caagcagctt catgctggca 8940

tcgtggtcat tgatgccatt cccaagaacg ccagtggcaa gattctgcga cgtctgttgc 9000

gtgctagaaa ggacgatgtt gttctgggtc tcaacaagta agc 9043

<210> 66

<211> 9067

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZP2-YlACoS-10Ps

<400> 66

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500

acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560

cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620

cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680

tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740

tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800

gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860

gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920

tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980

ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040

ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100

cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160

tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220

ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280

attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340

tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400

taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460

ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520

gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580

gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640

gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700

cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760

acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820

gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880

cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940

tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000

cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060

ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120

tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180

cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240

gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300

agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260

ccgtcgctcc atcttccaac cccaatccga tccaccatct gtcgcgagtc gaagacgttc 7320

ctctctccca gacgttccga ggcaacatta ccgactttgt gcgatctgga ggctttgccg 7380

acgacgactc caagccctgt tgcatcgacg cgaagactgg ccaacaactt acacagaagc 7440

aagtctggga ctacgccgac aagttcagag cactgctcca tcacgacaac aatctgtgtc 7500

ctttcaatgc caacaccacc gatccagctc ttggagacgt catgatcacc ctcgtgccca 7560

accatctgtt cattacgtcg ctgcactttg ccgcactcga tctgggtgcg acagtttctc 7620

ctggctcggc tggatacact gtggccgagc tcgtcaacca gatcaatctt accggagctt 7680

ctctcatcgt gtacactcga cccgtcttca aggttgtgcg agaggcgctt gctcagatcg 7740

tggtaccagt caagatcgtg gagttcgagg gtctcatcga acgagccgag tttgttcaga 7800

gccacaagat tcagtccaca aagaaagtca cactttctcc tgaggagtcc tactcgagaa 7860

tcgcctacct gggcatgtct tcaggcacct ccggaggtct tcctaaggcc gttcgattgt 7920

cgcacttcaa catggcgagt tctgccgagc tctccaagcg agctgcacct tcgattgccg 7980

gatccgagca gatcgcaggt gccattatcc ctgtcaacca tgtgtatggt ctggccaagt 8040

tcctcattgc catgccaaag tccggagcca ccacagtctt ccactccaag ttcgacctca 8100

tcgagatcct cgaggctcaa cagaagtaca aggtcaacat gtacgccctt gttcctccca 8160

tcattgtcgt tctggccaag catcctgctg ttgagaagta catcccttcg ctgcgagaac 8220

accttcgata cgtgtcctct ggagctgcac ccctgggtgc caacgtcatc gaggcttgca 8280

acaagcgtct tgccggaact gcttctggcg agaacgagtt tggaggtctc aagattgttc 8340

agggctacgg tctcactgaa acctcccctg tggtctccac tttcgatccc aacgatcctg 8400

agcgacacgc tcggtcctgt ggcaagctgg ttcccaacac ccaggcacga atcgtgtcgg 8460

aggacggagt cgatcagcct gcctacgagc tcaaggacct gtctcagttg gaggccgagc 8520

tcaaaaaggg caaccttccc accggtgagt tgtggcttcg aggtccccag atcatggatg 8580

gctaccacaa gaacgacgag gccaacgctg agtcgtttgt cgacgccact gactacactt 8640

ccaacatgcc cttctacatg aagcggtggt tccgaactgg cgatgttgct ctcgtcgata 8700

ctctgggcag atacatgatt gtcgatcgaa ccaaagagat gatcaagagc atgagtaagc 8760

aggttgctcc tgccgagctg gaggacatcc tgcttggcca tccccaggta gccgatgctg 8820

ctgtcatcgg tgttcagcag gtggagaagg gcactgaggc tccccgagcg ttcgtggtgc 8880

ttcgagatcc caagttcgat gcagtggaga tcaaaaagtg gatggacgcc caggtgccca 8940

agtacaaaca acttcatgga ggtgtcgtgg ttctggatgc tgttcccaag aatgccagcg 9000

gcaagattct cagacgactg ctccgtcagc gagagaatga cgtcgttctt ggactcgaca 9060

agtaagc 9067

<210> 67

<211> 10109

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZKL7A-FYlFAAs

<400> 67

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgattt aaatgtaacg aaactgaaca caagcttcca cacaacgtac 360

gatgtattta tacttgacag tgcgggtcgg aggaagttcg gttcgggcca ggtctgccaa 420

gttgactgtt actacgctaa tgcaatcata aggagaactg tagctaattc accgttgcag 480

ttagatctct cgaaggtgtc acgaaccatt atcatgtatg ctattgtaca ctgccctctg 540

tcctggtaag tgtgttattc caagtaagag ctcttcaatc atcctggaaa tgttcaaaga 600

agaaaaaacc ccgatatatt caactattct tgaaaggaaa tcatgaggga ggcaatgccc 660

actcgatttt gtgcttaaat gacagtgtcg tgcatcagtg tgatcctaac catatacagt 720

aattgtgtca agtgtcaggc ccctttcgtg cttgtacaag cctccaacag aagtaccgag 780

tcgcaaaatg gggtcaattg atgttctcac atgttggtcc tatgactctc ggtttcttca 840

acgagactac cctaagaagc gttacatgtg tggtcagggt ggtgtgtcat gtatagatac 900

agagcgagca cgactcacat ggagaacaac ttctgtaaga gcagagaaac cttaacagga 960

taataataaa taaatcgact cttcttgtga tgtcttttcg cttgttgtac cccacatttg 1020

tgatctgacg taaaagtggg cctgtgcttt gttatcgaga atcacatttc acactaatta 1080

gtgcacgact agtagcacgc agagttgcat gtcagtagtt attgtggatc ccgactactg 1140

tacggtatgt agttatgagc gacttatcat gaactagttt gctcgttatg gcgcgccagc 1200

tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 1260

cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 1320

actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 1380

gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 1440

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 1500

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 1560

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 1620

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1680

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1740

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1800

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1860

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1920

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1980

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2040

tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2100

gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2160

tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 2220

ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 2280

taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 2340

cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 2400

gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 2460

gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 2520

tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 2580

gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 2640

ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 2700

ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 2760

cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 2820

ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 2880

gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 2940

ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3000

ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3060

tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3120

ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 3180

cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggaaa 3240

ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 3300

ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 3360

ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 3420

tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcaccctaat 3480

caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 3540

gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 3600

aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 3660

ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc tgcgcaactg 3720

ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 3780

tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 3840

gacggccagt gaattgtaat acgactcact atagggcgaa ttgggcccga cgtcgcatgc 3900

tcaaatttca agactcatat cgagtctagt cggaacaggc gcgccagagt tgggttgggg 3960

acgatgtatg tccaggtacc ctgctcatac aagtacagta tatcctaggt gcaaaaaaag 4020

aaggtatttg tcttatatac cggtactagc acatgtgaat ctatgtttag tctcaagtat 4080

attcattaac atgccctcaa tcgtttctgt ttactttcag atactccttt ggtgcctatg 4140

gttccacaga atccacaatg atactgtaga aggggactac gtgaagtaga ataaaaccag 4200

cttttctgga aacttgtctg ttctatcacc tgttggtcat gtcagtttcc gcgttcttca 4260

cacccacccc cctaataata caacacaata aaatcattga aacaagagcg atgcgaccct 4320

cagtccagca aaccactctg gaaatattga gaaacaaaag acctacagta atacaattgt 4380

ggcatctata gaataggaaa tttaatatgt gcaactgtcc attctctcga cctgtacttc 4440

tacacgattg tcaaaagata ttatcatagt ctacagtaat ttatacagat tgaaagaggg 4500

tcattcaaat atggaagctg gtggtcaaag atcatcccca gtcactctct tctaccttct 4560

aaaagatggt ggaaccgttg gcaagacctc cgtagagcca agtaccttca aacttgcgcc 4620

ctctctccag atctcgacgt ccaatattga gagtgcataa agagatccag tcaaagtagg 4680

ccaggtggtt cttgacaatg tctaaccgag caagagcgtt aaagtccttt ctgtaacagc 4740

tcatactctt aattaagttg cgacacatgt cttgatagta tcttgaattc tctctcttga 4800

gcttttccat aacaagttct tctgcctcca ggaagtccat cggtggtttg atcatggttt 4860

tggtgtagtg gtagtgcagt ggtggtattg tgactgggga tgtagttgag aataagtcat 4920

acacaagtca gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg 4980

tacccagcat ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga 5040

tacacaggtt gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa 5100

gctgaacaag cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat 5160

agtctaacct ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct 5220

tggcctcctc aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat 5280

ccgttccggt agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct 5340

tgtcgtcaag acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc 5400

ggttctgggc aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct 5460

gcttggagta ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca 5520

gacctctggc cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct 5580

cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca 5640

ggccagcaat gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg 5700

cgattcggtg acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt 5760

cctcgaacag gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg 5820

cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga 5880

ccttatcggc aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt 5940

tggttttctt ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt 6000

tagctcgagc ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt 6060

ctgcagaact ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt 6120

tacgagttag ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa 6180

gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc 6240

cagcaatgac gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca 6300

gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg 6360

agtcgtactc caaaggcggc aatgacgagt cagacagata ctcgtcgacc ttttccttgg 6420

gaaccaccac cgtcagccct tctgactcac gtattgtagc caccgacaca ggcaacagtc 6480

cgtggatagc agaatatgtc ttgtcggtcc atttctcacc aactttaggc gtcaagtgaa 6540

tgttgcagaa gaagtatgtg ccttcattga gaatcggtgt tgctgatttc aataaagtct 6600

tgagatcagt ttggccagtc atgttgtggg gggtaattgg attgagttat cgcctacagt 6660

ctgtacaggt atactcgctg cccactttat actttttgat tccgctgcac ttgaagcaat 6720

gtcgtttacc aaaagtgaga atgctccaca gaacacaccc cagggtatgg ttgagcaaaa 6780

aataaacact ccgatacggg gaatcgaacc ccggtctcca cggttctcaa gaagtattct 6840

tgatgagagc gtatcgatga gcctaaaatg aacccgagta tatctcataa aattctcggt 6900

gagaggtctg tgactgtcag tacaaggtgc cttcattatg ccctcaacct taccatacct 6960

cactgaatgt agtgtacctc taaaaatgaa atacagtgcc aaaagccaag gcactgagct 7020

cgtctaacgg acttgatata caaccaatta aaacaaatga aaagaaatac agttctttgt 7080

atcatttgta acaattaccc tgtacaaact aaggtattga aatcccacaa tattcccaaa 7140

gtccacccct ttccaaattg tcatgcctac aactcatata ccaagcacta acctaccgtt 7200

taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc 7260

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 7320

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 7380

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 7440

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 7500

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 7560

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 7620

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 7680

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 7740

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 7800

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 7860

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7920

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7980

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacac catggtcgga 8040

tacaccatct cctcgaagcc cgtgtccgtc gaggttggcc ccgccaagcc tggcgagact 8100

gctccccgac ggaacgtcat tgccaaggac gctcctgtgg tcttccccga caacgattcg 8160

tccctcacca ctgtctacaa gctgttcaaa aagtacgccg agatcaactc cgaacgaaag 8220

gctatgggat ggcgagacac catcgacatt cacgtggaga ccaagcaggt cacaaaggtg 8280

gtcgacggcg tggagaagaa agtgcccaag gaatggaagt acttcgagat gggtccttac 8340

aagtggctgt cctacaagga ggccctcaag ctggttcacg attatggagc tggtcttcga 8400

catctcggca tcaagcccaa agagaagatg cacatttacg cacagacctc tcaccgatgg 8460

atgctttccg gactggcctc tctctcgcag ggcattccca tcgtcactgc ctacgacacc 8520

cttggagagg aaggtctcac acgatctctg caggagacca actccgtcat catgttcacg 8580

gacaaggctc ttctgtcgtc tctcaaggtg tccctcaaaa agggcaccga tctgcgaatc 8640

attatctacg gaggcgacct gactcccgat gacaagaaag ccggaaacac cgagatcgac 8700

gccatcaagg agattgttcc agacatgaag atctacacta tggacgaggt tgtcgctctc 8760

ggtcgagagc atcctcaccc cgtggaagag gtcgactacg aggatctggc cttcatcatg 8820

tacacctctg gctccacagg agttcccaag ggtgtcgtgc tgcagcacaa gcagatcctc 8880

gcctctgtgg ccggtgtcac caagattatc gacagatcca ttatcggcaa tacagatcga 8940

ctgctcaact ttcttcccct cgcacacatc ttcgagtttg tgttcgagat ggtcaccttc 9000

tggtggggtg cctctctggg ctacggaact gtcaagacca tttccgacct gtcgatgaag 9060

aactgcaagg gagacatccg agagctcaag cccaccatca tggtcggcgt tccagctgtc 9120

tgggaaccca tgcggaaggg tattcttggc aaaatcaagg agctgtctcc tctcatgcag 9180

cgagtcttct gggcctcctt tgctgccaag caacgtctcg acgagaacgg acttcccggt 9240

ggctctattc tggattcgct catcttcaag aaagtcaagg acgccactgg aggctgtctc 9300

cgatacgtgt gcaacggagg tgctccagtt tccgtcgaca cccagaagtt cattactacc 9360

cttatctgtc ccatgctcat tggatgcggt ctgaccgaga ctacagccaa caccactatc 9420

atgtctccca agtcctatgc ctttggcacc attggagagc ctactgcagc cgtcaccctc 9480

aagcttatcg acgtgcccga agctggctac ttcgccgaga acaatcaggg agagctgtgc 9540

atcaagggca acgtggtcat gaaggagtat tacaagaacg aggaagagac caagaaagcg 9600

ttctccgacg atggctactt tctcaccgga gacattgccg agtggactgc caatggtcag 9660

cttcgaatta tcgacagacg aaagaacctc gtcaagaccc agaacggaga gtacattgct 9720

ctggagaagc tcgaaacaca gtaccgatcg tcttcctacg ttgccaacct gtgcgtctac 9780

gccgaccaga accgagtcaa gcccatcgct ctggtcattc ccaacgaggg tcctaccaaa 9840

aagcttgccc agagcttggg cgtggattcc gacgactggg atgccgtctg ttccaacaag 9900

aaagtggtca aggctgttct caaggacatg ctggataccg gacgatctct cggtctgtcc 9960

ggcatcgagc tgctgcaagg aatcgtgttg ctgcctggcg agtggactcc ccagaacagc 10020

tacctcaccg ctgcccagaa gctcaaccga aagaagattg tcgatgacaa caaaaaggag 10080

atcgacgagt gctacgagca gtcctaagc 10109

<210> 68

<211> 9037

<212> DNA

<213> 人工序列

<220>

<223> 质粒pZP2-YlACoS-5PS3s

<400> 68

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagtcatac 4500

acaagtcagc tttcttcgag cctcatataa gtataagtag ttcaacgtat tagcactgta 4560

cccagcatct ccgtatcgag aaacacaaca acatgcccca ttggacagat catgcggata 4620

cacaggttgt gcagtatcat acatactcga tcagacaggt cgtctgacca tcatacaagc 4680

tgaacaagcg ctccatactt gcacgctctc tatatacaca gttaaattac atatccatag 4740

tctaacctct aacagttaat cttctggtaa gcctcccagc cagccttctg gtatcgcttg 4800

gcctcctcaa taggatctcg gttctggccg tacagacctc ggccgacaat tatgatatcc 4860

gttccggtag acatgacatc ctcaacagtt cggtactgct gtccgagagc gtctcccttg 4920

tcgtcaagac ccaccccggg ggtcagaata agccagtcct cagagtcgcc cttaggtcgg 4980

ttctgggcaa tgaagccaac cacaaactcg gggtcggatc gggcaagctc aatggtctgc 5040

ttggagtact cgccagtggc cagagagccc ttgcaagaca gctcggccag catgagcaga 5100

cctctggcca gcttctcgtt gggagagggg actaggaact ccttgtactg ggagttctcg 5160

tagtcagaga cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg 5220

ccagcaatga ttccggttcc gggtacaccg tgggcgttgg tgatatcgga ccactcggcg 5280

attcggtgac accggtactg gtgcttgaca gtgttgccaa tatctgcgaa ctttctgtcc 5340

tcgaacagga agaaaccgtg cttaagagca agttccttga gggggagcac agtgccggcg 5400

taggtgaagt cgtcaatgat gtcgatatgg gttttgatca tgcacacata aggtccgacc 5460

ttatcggcaa gctcaatgag ctccttggtg gtggtaacat ccagagaagc acacaggttg 5520

gttttcttgg ctgccacgag cttgagcact cgagcggcaa aggcggactt gtggacgtta 5580

gctcgagctt cgtaggaggg cattttggtg gtgaagagga gactgaaata aatttagtct 5640

gcagaacttt ttatcggaac cttatctggg gcagtgaagt atatgttatg gtaatagtta 5700

cgagttagtt gaacttatag atagactgga ctatacggct atcggtccaa attagaaaga 5760

acgtcaatgg ctctctgggc gtcgcctttg ccgacaaaaa tgtgatcatg atgaaagcca 5820

gcaatgacgt tgcagctgat attgttgtcg gccaaccgcg ccgaaaacgc agctgtcaga 5880

cccacagcct ccaacgaaga atgtatcgtc aaagtgatcc aagcacactc atagttggag 5940

tcgtactcca aaggcggcaa tgacgagtca gacagatact cgtcaaacgg taggttagtg 6000

cttggtatat gagttgtagg catgacaatt tggaaagggg tggactttgg gaatattgtg 6060

ggatttcaat accttagttt gtacagggta attgttacaa atgatacaaa gaactgtatt 6120

tcttttcatt tgttttaatt ggttgtatat caagtccgtt agacgagctc agtgccttgg 6180

cttttggcac tgtatttcat ttttagaggt acactacatt cagtgaggta tggtaaggtt 6240

gagggcataa tgaaggcacc ttgtactgac agtcacagac ctctcaccga gaattttatg 6300

agatatactc gggttcattt taggctcatc gattgccccg gagaagacgg ccaggccgcc 6360

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 6420

ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 6480

agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 6540

atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 6600

gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 6660

ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 6720

acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 6780

gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 6840

tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 6900

gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac 6960

accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 7020

agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 7080

ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 7140

cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 7200

gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt accatggcct 7260

caatcattca caagtctcct gtgcccgacg ttcagctgtt ctacggttcc tggccagatc 7320

tcatgcgaac ctctcctcat gcccacaacg actccaaacc cgtggtcttt gacttcgata 7380

ccaagcagca acttacttgg aagcaggtct ggcaactcag cgctcgactc agagcccagc 7440

tgtaccacaa gtacggaatc ggcaaacccg gtgctcttgc acctttccac aacgatccct 7500

ctctcggaga cgtggtcatc ttctacactc ccaacaccta cagctcgttg ccctatcatc 7560

tggctcttca cgatctcgga gccaccattt ctcctgcctc cacatcttac gacgtcaagg 7620

acatttgcca tcagatcgtt actaccgatg cggtcgtggt tgtcgctgca gccgagaaat 7680

ccgagattgc tcgagaggcc gttcagctgt ctggtcgaga cgtcagagtt gtggtcatgg 7740

aggacctcat caacaatgct cccaccgttg cgcagaacga tatcgactcg gcacctcatg 7800

tgtccctgtc tcgggaccag gctcgagcca agattgcata cctgggcatg tcttccggta 7860

cgtctggcgg acttcccaag gctgttcgtc tcactcactt caacgttacc tcgaactgtc 7920

tgcaggtctc cgctgccgca cccaaccttg cccagaacgt ggttgccagc gccgtcattc 7980

caaccactca catctacggt ctcaccatgt ttctgtcggt tcttccctac aacggttccg 8040

tggtcattca tcacaagcaa ttcaacttgc gagatctgct cgaggctcag aagacataca 8100

aggtctctct gtggattctc gttcctcccg tcatcgtgca gcttgccaag aaccctatgg 8160

tcgacgagta cctggactcc attcgagccc atgtgcggtg catcgtctct ggagctgctc 8220

ctctcggtgg caatgtcgtg gatcaggttt cggttcgtct taccggcaac aaggaaggca 8280

ttctgcccaa cggagacaag ctcgtcattc atcaagccta cggtcttacc gagtcctctc 8340

ccatcgttgg aatgctcgat cctctgtcgg accacatcga cgtcatgact gtgggctgtc 8400

tcatgcccaa taccgaggct cgaattgtcg acgaagaggg aaacgatcag ccagcagtcc 8460

acgttaccga cacacgaggc atcggtgccg ctgtcaagcg aggcgagaag attccctccg 8520

gagaactctg gattcgaggt cctcagatca tggacggata ccacaagaac cccgagtcgt 8580

ctcgtgagtc cctggaaccc agcacagaga cctacggtct gcaacatttc caggacagat 8640

ggcttcgaac tggagacgtt gctgtcatcg acaccttcgg acgagtcatg gttgtggatc 8700

gaaccaagga gctcatcaag tccatgtctc gacaggttgc tcctgccgag ctcgaagctc 8760

ttctgctcaa ccatccttcc gtcaacgatg tggctgtcgt tggcgtccac aacgacgata 8820

atggcacaga gtcagcacga gcgtttgtcg ttcttcaacc aggcgacgcc tgtgatccta 8880

ctaccatcaa gcactggatg gaccagcaag ttccctccta caagcggctg tacggaggca 8940

ttgtggtcat cgacactgtt cccaagaatg cctctggcaa gattctgcga agactgcttc 9000

gacagcggag agacgatcga gtctggggtc tgtaagc 9037

<210> 69

<211> 3663

<212> DNA

<213> 人工序列

<220>

<223> pET23d质粒

<400> 69

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60

ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120

tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180

cgacggagct cgaattcgga tccgacccat ttgctgtcca ccagtcatgc tagccatggt 240

atatctcctt cttaaagtta aacaaaatta tttctagagg gaaaccgttg tggtctccct 300

atagtgagtc gtattaattt cgcgggatcg agatctcggg cagcgttggg tcctggccac 360

gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg ggttgcctta 420

ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa 480

cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg 540

aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca ggatgctgct 600

ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ccctgagtga 660

tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa cgttccagta 720

accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt ttcatcggta 780

tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc aaacaggaaa 840

aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac 900

tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg 960

atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 1020

tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 1080

gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 1140

gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 1200

gcaccatata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 1260

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 1320

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 1380

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 1440

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 1500

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 1560

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 1620

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 1680

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 1740

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 1800

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 1860

tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 1920

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 1980

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 2040

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 2100

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 2160

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 2220

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 2280

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 2340

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 2400

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 2460

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 2520

gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 2580

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 2640

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 2700

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 2760

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 2820

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 2880

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 2940

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 3000

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 3060

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 3120

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 3180

cgaaaagtgc cacctgaaat tgtaaacgtt aatattttgt taaaattcgc gttaaatttt 3240

tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 3300

aaagaataga ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 3360

aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 3420

cgtgaaccat caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 3480

aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 3540

aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg 3600

ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtcccattcg 3660

cca 3663

<210> 70

<211> 12712

<212> DNA

<213> 人工序列

<220>

<223> pY157质粒

<400> 70

ttgagaagcc cattgtatat tattaggatc gtagcattat tgtggcaaaa aatattcaag 60

tgctcatgtg aattgacacg atcacgtaaa tacctggtga aattgctagt attcgtgatg 120

ttctaataca actctgttca atatttccgg cgctctcttg tatacaagag cacaagacat 180

gcaccccaca ttaaccgagg tcaagtgttt atgtatgaaa agtgacataa atcgtccaaa 240

aaaaagtagc acatagttgt atggctgtaa gttatgtgat tgtcagttct tcggccttcc 300

aactcctatg caccgtcttc aatcatctac ccccgtgccc cacaccccgc actattagag 360

tttatcacag tcagctaaac tgcttgcaca tctacacctc tgactacacc accatggatt 420

tcttcagacg gcaccagaaa aaggtgctgg cactggtagg tgtggcgctg agttcctacc 480

tgtttatcga ctatgtgaag aaaaagttct tcgagatcca gggtcgtttg agctcggagc 540

gaaccgctaa acagaatctc cggcgccgat ttgaacagaa ccagcaggat gcagatttta 600

caatcatggc tctgctatcc agcttgacga caccggtaat ggagcgttac cccgtcgacc 660

agatcaaggc agagttacag agcaagagac gccccacaga ccgggttttg gctctcgaga 720

gctccacctc gtcctcagct accgcacaaa ccgtgcccac catgacaagt ggcgccacag 780

aggagggcga gaagttaatt aactttggcc ggcctttacc tgcaggataa cttcgtataa 840

tgtatgctat acgaagttat gaattctctc tcttgagctt ttccataaca agttcttctg 900

cctccaggaa gtccatgggt ggtttgatca tggttttggt gtagtggtag tgcagtggtg 960

gtattgtgac tggggatgta gttgagaata agtcatacac aagtcagctt tcttcgagcc 1020

tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 1080

acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 1140

atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 1200

acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 1260

tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 1320

tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 1380

caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 1440

tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 1500

caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 1560

gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 1620

gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 1680

tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 1740

gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 1800

gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 1860

taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 1920

cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 1980

ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 2040

tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 2100

ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 2160

tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 2220

agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 2280

cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 2340

tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 2400

gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 2460

acgagtcaga cagatactcg tcgactcatc gatataactt cgtataatgt atgctatacg 2520

aagttatcct aggtatagat cttgcacttc ttattttctt cacgcgtttg cagctcaaca 2580

ttctaggacg acgaaactac gtcaacagtg ttgtcgctct ggcgcagcag ggccgagagg 2640

gtaatgccga gggtcgagtg gcgccctcgt ttggtgatct tgcagatatg ggctatttcg 2700

gcgacctttc aggctcgtcc agcttcggag aaactattgt cgatcccgat ctggacgaac 2760

agtaccttac cttttcgtgg tggctgctga acgagggatg ggtgtcgctg agcgagcgag 2820

tggaggaagc ggttcgtcga gtgtgggacc ccgtgtcacc caaggccgaa cttggatttg 2880

acgagttgtc ggaactcatt ggacgaacac agatgctcat tgatcgacct ctcaatccct 2940

cgtcgccact caactttctg agccagctgc tgccaccacg ggagcaggag gagtacgtgc 3000

ttgcccagaa ccccagcgat actgctgccc ccattgtagg acctaccctc cgacggcttc 3060

tggacgagac tgccgacttc atcgagtccc ctaatgccgc agaggtgatt gagcgacttg 3120

ttcactccgg tctctctgtg ttcatggaca agctggctgt cacgtttgga gccacacctg 3180

ctgattcggg ttcgccttat cctgtggtgc tgcctactgc aaaggtcaag ctgccctcca 3240

ttcttgccaa catggctcga caggctggag gcatggccca gggatcgccg ggcgtggaaa 3300

acgagtacat tgacgtgatg aaccaagtgc aggagctgac ctcctttagt gctgtggtct 3360

attcatcttt tgattgggct ctctagaggc tcattcacga aagacacgaa gaacgaagat 3420

ggggactgaa tacagcgctc tcatttgtac acaaatgatt tatgacagag taacttgtac 3480

atcatgtaga gcatacatac tgaaggtgtg atctcacggg atatcttgaa gaccactcgt 3540

agctggaggc ataggtagtg ctagtacgga tacttgcacc gtatccaaca taagtagagg 3600

agcctcctag tggctattgg tacaccgata aagatacaca tacatggcgc gccagctgca 3660

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 3720

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 3780

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 3840

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 3900

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 3960

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 4020

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 4080

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 4140

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 4200

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 4260

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 4320

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 4380

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 4440

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 4500

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 4560

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 4620

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 4680

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 4740

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 4800

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 4860

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 4920

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 4980

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 5040

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 5100

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 5160

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 5220

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 5280

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 5340

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 5400

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 5460

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 5520

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 5580

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 5640

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 5700

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 5760

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 5820

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 5880

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 5940

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 6000

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 6060

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 6120

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 6180

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 6240

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 6300

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcttga 6360

gaagcccatt gtatattatt aggatcgtag cattattgtg gcaaaaaata ttcaagtgct 6420

catgtgaatt gacacgatca cgtaaatacc tggtgaaatt gctagtattc gtgatgttct 6480

aatacaactc tgttcaatat ttccggcgct ctcttgtata caagagcaca agacatgcac 6540

cccacattaa ccgaggtcaa gtgtttatgt atgaaaagtg acataaatcg tccaaaaaaa 6600

agtagcacat agttgtatgg ctgtaagtta tgtgattgtc agttcttcgg ccttccaact 6660

cctatgcacc gtcttcaatc atctaccccc gtgccccaca ccccgcacta ttagagttta 6720

tcacagtcag ctaaactgct tgcacatcta cacctctgac tacaccacca tggatttctt 6780

cagacggcac cagaaaaagg tgctggcact ggtaggtgtg gcgctgagtt cctacctgtt 6840

tatcgactat gtgaagaaaa agttcttcga gatccagggt cgtttgagct cggagcgaac 6900

cgctaaacag aatctccggc gccgatttga acagaaccag caggatgcag attttacaat 6960

catggctctg ctatccagct tgacgacacc ggtaatggag cgttaccccg tcgaccagat 7020

caaggcagag ttacagagca agagacgccc cacagaccgg gttttggctc tcgagagctc 7080

cacctcgtcc tcagctaccg cacaaaccgt gcccaccatg acaagtggcg ccacagagga 7140

gggcgagaag ttaattaact ttggccggcc tttacctgca ggataacttc gtataatgta 7200

tgctatacga agttatgaat tctctctctt gagcttttcc ataacaagtt cttctgcctc 7260

caggaagtcc atgggtggtt tgatcatggt tttggtgtag tggtagtgca gtggtggtat 7320

tgtgactggg gatgtagttg agaataagtc atacacaagt cagctttctt cgagcctcat 7380

ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat cgagaaacac 7440

aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta tcatacatac 7500

tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat acttgcacgc 7560

tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt taatcttctg 7620

gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat ctcggttctg 7680

gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga catcctcaac 7740

agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc cgggggtcag 7800

aataagccag tcctcagagt cgcccttagg tcggttctgg gcaatgaagc caaccacaaa 7860

ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag tactcgccag tggccagaga 7920

gcccttgcaa gacagctcgg ccagcatgag cagacctctg gccagcttct cgttgggaga 7980

ggggactagg aactccttgt actgggagtt ctcgtagtca gagacgtcct ccttcttctg 8040

ttcagagaca gtttcctcgg caccagctcg caggccagca atgattccgg ttccgggtac 8100

accgtgggcg ttggtgatat cggaccactc ggcgattcgg tgacaccggt actggtgctt 8160

gacagtgttg ccaatatctg cgaactttct gtcctcgaac aggaagaaac cgtgcttaag 8220

agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg aagtcgtcaa tgatgtcgat 8280

atgggttttg atcatgcaca cataaggtcc gaccttatcg gcaagctcaa tgagctcctt 8340

ggtggtggta acatccagag aagcacacag gttggttttc ttggctgcca cgagcttgag 8400

cactcgagcg gcaaaggcgg acttgtggac gttagctcga gcttcgtagg agggcatttt 8460

ggtggtgaag aggagactga aataaattta gtctgcagaa ctttttatcg gaaccttatc 8520

tggggcagtg aagtatatgt tatggtaata gttacgagtt agttgaactt atagatagac 8580

tggactatac ggctatcggt ccaaattaga aagaacgtca atggctctct gggcgtcgcc 8640

tttgccgaca aaaatgtgat catgatgaaa gccagcaatg acgttgcagc tgatattgtt 8700

gtcggccaac cgcgccgaaa acgcagctgt cagacccaca gcctccaacg aagaatgtat 8760

cgtcaaagtg atccaagcac actcatagtt ggagtcgtac tccaaaggcg gcaatgacga 8820

gtcagacaga tactcgtcga ctcatcgata taacttcgta taatgtatgc tatacgaagt 8880

tatcctaggt atagatcttg cacttcttat tttcttcacg cgtttgcagc tcaacattct 8940

aggacgacga aactacgtca acagtgttgt cgctctggcg cagcagggcc gagagggtaa 9000

tgccgagggt cgagtggcgc cctcgtttgg tgatcttgca gatatgggct atttcggcga 9060

cctttcaggc tcgtccagct tcggagaaac tattgtcgat cccgatctgg acgaacagta 9120

ccttaccttt tcgtggtggc tgctgaacga gggatgggtg tcgctgagcg agcgagtgga 9180

ggaagcggtt cgtcgagtgt gggaccccgt gtcacccaag gccgaacttg gatttgacga 9240

gttgtcggaa ctcattggac gaacacagat gctcattgat cgacctctca atccctcgtc 9300

gccactcaac tttctgagcc agctgctgcc accacgggag caggaggagt acgtgcttgc 9360

ccagaacccc agcgatactg ctgcccccat tgtaggacct accctccgac ggcttctgga 9420

cgagactgcc gacttcatcg agtcccctaa tgccgcagag gtgattgagc gacttgttca 9480

ctccggtctc tctgtgttca tggacaagct ggctgtcacg tttggagcca cacctgctga 9540

ttcgggttcg ccttatcctg tggtgctgcc tactgcaaag gtcaagctgc cctccattct 9600

tgccaacatg gctcgacagg ctggaggcat ggcccaggga tcgccgggcg tggaaaacga 9660

gtacattgac gtgatgaacc aagtgcagga gctgacctcc tttagtgctg tggtctattc 9720

atcttttgat tgggctctct agaggctcat tcacgaaaga cacgaagaac gaagatgggg 9780

actgaataca gcgctctcat ttgtacacaa atgatttatg acagagtaac ttgtacatca 9840

tgtagagcat acatactgaa ggtgtgatct cacgggatat cttgaagacc actcgtagct 9900

ggaggcatag gtagtgctag tacggatact tgcaccgtat ccaacataag tagaggagcc 9960

tcctagtggc tattggtaca ccgataaaga tacacataca tggcgcgcca gctgcattaa 10020

tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 10080

ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 10140

gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 10200

ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 10260

cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 10320

ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 10380

accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 10440

catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 10500

gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 10560

tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 10620

agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 10680

actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 10740

gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 10800

aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 10860

gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 10920

aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 10980

atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 11040

gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 11100

atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 11160

ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 11220

cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 11280

agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 11340

cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 11400

tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 11460

agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 11520

gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 11580

gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 11640

ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 11700

tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 11760

tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 11820

gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 11880

caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 11940

atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgat 12000

gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcagga aattgtaagc 12060

gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa 12120

taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat agggttgagt 12180

gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 12240

cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt 12300

ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 12360

gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 12420

ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg 12480

cttaatgcgc cgctacaggg cgcgtccatt cgccattcag gctgcgcaac tgttgggaag 12540

ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 12600

ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 12660

gtgaattgta atacgactca ctatagggcg aattgggccc gacgtcgcat gc 12712

<210> 71

<211> 1947

<212> DNA

<213> 人工序列

<220>

<223> PEX3敲除位点,包括LoxP侧翼的URA3

<400> 71

acagaccggg ttttggctct cgagagctcc acctcgtcct cagctaccgc acaaaccgtg 60

cccaccatga caagtggcgc cacagaggag ggcgagaagt taattaactt tggccggcct 120

ttacctgcag gataacttcg tataatgtat gctatacgaa gttatgaatt ctctctcttg 180

agcttttcca taacaagttc ttctgcctcc aggaagtcca tgggtggttt gatcatggtt 240

ttggtgtagt ggtagtgcag tggtggtatt gtgactgggg atgtagttga gaataagtca 300

tacacaagtc agctttcttc gagcctcata taagtataag tagttcaacg tattagcact 360

gtacccagca tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg 420

atacacaggt tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca 480

agctgaacaa gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca 540

tagtctaacc tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc 600

ttggcctcct caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata 660

tccgttccgg tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc 720

ttgtcgtcaa gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaggt 780

cggttctggg caatgaagcc aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc 840

tgcttggagt actcgccagt ggccagagag cccttgcaag acagctcggc cagcatgagc 900

agacctctgg ccagcttctc gttgggagag gggactagga actccttgta ctgggagttc 960

tcgtagtcag agacgtcctc cttcttctgt tcagagacag tttcctcggc accagctcgc 1020

aggccagcaa tgattccggt tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg 1080

gcgattcggt gacaccggta ctggtgcttg acagtgttgc caatatctgc gaactttctg 1140

tcctcgaaca ggaagaaacc gtgcttaaga gcaagttcct tgagggggag cacagtgccg 1200

gcgtaggtga agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg 1260

accttatcgg caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg 1320

ttggttttct tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg 1380

ttagctcgag cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag 1440

tctgcagaac tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag 1500

ttacgagtta gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa 1560

agaacgtcaa tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag 1620

ccagcaatga cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc 1680

agacccacag cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg 1740

gagtcgtact ccaaaggcgg caatgacgag tcagacagat actcgtcgac tcatcgatat 1800

aacttcgtat aatgtatgct atacgaagtt atcctaggta tagatcttgc acttcttatt 1860

ttcttcacgc gtttgcagct caacattcta ggacgacgaa actacgtcaa cagtgttgtc 1920

gctctggcgc agcagggccg agagggt 1947

<210> 72

<211> 280

<212> DNA

<213> 人工序列

<220>

<223> PEX3敲除位点,包括单个LoxP (URA3被去除)

<400> 72

acagaccggg ttttggctct cgagagctcc acctcgtcct cagctaccgc acaaaccgtg 60

cccaccatga caagtggcgc cacagaggag ggcgagaagt taattaactt tggccggcct 120

ttacctgcag gataacttcg tataatgtat gctatacgaa gttatcctag gtatagatct 180

tgcacttctt attttcttca cgcgtttgca gctcaacatt ctaggacgac gaaactacgt 240

caacagtgtt gtcgctctgg cgcagcaggg ccgagagggt 280

<210> 73

<211> 5164

<212> DNA

<213> 人工序列

<220>

<223> pYRH146-Pox4KO质粒

<400> 73

cgcgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 60

gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 120

tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 180

agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 240

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 300

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 360

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 420

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 480

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 540

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 600

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 660

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 720

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 780

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 840

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 900

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 960

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 1020

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1080

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 1140

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1200

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1260

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1320

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1380

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1440

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1500

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1560

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1620

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1680

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1740

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1800

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1860

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1920

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1980

gaaaagtgcc acctgatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 2040

atcaggaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 2100

gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 2160

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 2220

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 2280

caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 2340

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 2400

agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 2460

ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtccattcgc cattcaggct 2520

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 2580

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 2640

ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggcccgac 2700

gtcgcgatcg cgagtatctg tctgactcgt cattgccgcc tttggagtac gactccaact 2760

atgagtgtgc ttggatcact ttgacgatac attcttcgtt ggaggctgtg ggtctgacag 2820

ctgcgttttc ggcgcggttg gccgacaaca atatcagctg caacgtcatt gctggctttc 2880

atcatgatca catttttgtc ggcaaaggcg acgcccagag agccattgac gttctttcta 2940

atttggaccg atagccgtat agtccagtct atctataagt tcaactaact cgtaactatt 3000

accataacat atacttcact gccccagata aggttccgat aaaaagttct gcagactaaa 3060

tttatttcag tctcctcttc accaccaaaa tgccctccta cgaagctcga gctaacgtcc 3120

acaagtccgc ctttgccgct cgagtgctca agctcgtggc agccaagaaa accaacctgt 3180

gtgcttctct ggatgttacc accaccaagg agctcattga gcttgccgat aaggtcggac 3240

cttatgtgtg catgatcaaa acccatatcg acatcattga cgacttcacc tacgccggca 3300

ctgtgctccc cctcaaggaa cttgctctta agcacggttt cttcctgttc gaggacagaa 3360

agttcgcaga tattggcaac actgtcaagc accagtaccg gtgtcaccga atcgccgagt 3420

ggtccgatat caccaacgcc cacggtgtac ccggaaccgg aatcattgct ggcctgcgag 3480

ctggtgccga ggaaactgtc tctgaacaga agaaggagga cgtctctgac tacgagaact 3540

cccagtacaa ggagttccta gtcccctctc ccaacgagaa gctggccaga ggtctgctca 3600

tgctggccga gctgtcttgc aagggctctc tggccactgg cgagtactcc aagcagacca 3660

ttgagcttgc ccgatccgac cccgagtttg tggttggctt cattgcccag aaccgaccta 3720

agggcgactc tgaggactgg cttattctga cccccggggt gggtcttgac gacaagggag 3780

acgctctcgg acagcagtac cgaactgttg aggatgtcat gtctaccgga acggatatca 3840

taattgtcgg ccgaggtctg tacggccaga accgagatcc tattgaggag gccaagcgat 3900

accagaaggc tggctgggag gcttaccaga agattaactg ttagaggtta gactatggat 3960

atgtaattta actgtgtata tagagagcgt gcaagtatgg agcgcttgtt cagcttgtat 4020

gatggtcaga cgacctgtct gatcgagtat gtatgatact gcacaacctg tgtatccgca 4080

tgatctgtcc aatggggcat gttgttgtgt ttctcgatac ggagatgctg ggtacagtgc 4140

taatacgttg aactacttat acttatatga ggctcgaaga aagctgactt gtgtatgacg 4200

catgcttgag cgattgggag agttggttgt gtacaattat tttaatacct cttctgattg 4260

ttttctattg ccttccattt ctatctttac ctgccatctc acgtcgtgtg taccatcccc 4320

acatacggaa ccagtaggtc ttttaggctc tgaacgtgca aatgagtttg gtggggtagg 4380

cagagatcgc atagagacgg gtagaatgag cagttaaaag ctgtgttgag tggtaaaaat 4440

ttacaataag tgttcctcaa ggcatcaagg agacgaaata agccattatg gacacgaacc 4500

aacagtccca ccacgttcta aacacattcc tccactgcca ctcccaaaca ccacgtccca 4560

cataaacttc taccccacat tttgacaagc ctattcgttt aataatcacc ccgaggagac 4620

agaaagccta acagctggag ccactatata gttgcagtgg ttaattaagg agttgtgtgt 4680

aacttgtaca ggtacaccta catactgtac tgtaggtcca aagataggta cactgtggca 4740

ataattatgc gagtacttgt accgtcatcg tagctgctgt aaagagatca gacacaggca 4800

cttttcccca ccatgagatc accactcgtc gtccgagtac ttctatggca cagccacaat 4860

cacatgtact tgtgcatgcc aatgtgtgac atcatcatct agagctatca tcatattccc 4920

gctgcaaatg gtctacgtat tactattaag cagggggggg ggaggaatta tgacgacatt 4980

gtacgtgtac tcgtaccggt acttgtagca cgccgaactg cggtattact gtgcactgta 5040

atttcggacc cctcttatag ccccaagttg gtctatacat ctgaaccggt gcagactcac 5100

tattaaaagt gcggcagcta attttgctga cacagccttg tcgataaaag tagctacttg 5160

tagg 5164

<210> 74

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> POX4敲除位点

<400> 74

ttgagcgatt gggagagttg gttgtgtaca attattttaa tacctcttct gattgttttc 60

tattgccttc catttctatc tttacctgcc atctcacgtc gtgtgtacca tccccacata 120

cggaaccagt aggtctttta ggctctgaac gtgcaaatga gtttggtggg gtaggcagag 180

atcgcataga gacgggtaga atgagcagtt aaaagctgtg ttgagtggta aaaatttaca 240

ataagtgttc ctcaaggcat caaggagacg aaataagcca ttatggacac gaaccaacag 300

tcccaccacg ttctaaacac attcctccac tgccactccc aaacaccacg tcccacataa 360

acttctaccc cacattttga caagcctatt cgtttaataa tcaccccgag gagacagaaa 420

gcctaacagc tggagccact atatagttgc agtggttaat taaggagttg tgtgtaactt 480

gtacaggtac acctacatac tgtactgtag gtccaaagat aggtacactg tggcaataat 540

tatgcgagta cttgtaccgt catcgtagct gctgtaaaga gatcagacac aggcactttt 600

ccccaccatg agatcaccac tcgtcgtccg agtacttcta tggcacagcc acaatcacat 660

gtacttgtgc atgccaatgt gtgacatcat catctagagc tatcatcata ttcccgctgc 720

aaatggtcta cgtattacta ttaagcaggg gggggggagg aattatgacg acattgtacg 780

tgtactcgta ccggtacttg tagcacgccg aactgcggta ttactgtgca ctgtaatttc 840

ggacccctct tatagcccca agttggtcta tacatctgaa ccggtgcaga ctcactatta 900

aaagtgcggc agctaatttt gctgacacag ccttgtcgat aaaagtagct acttgta 957

<210> 75

<211> 6853

<212> DNA

<213> 人工序列

<220>

<223> pYRH72质粒

<400> 75

gcatgcgacg tcgggcccaa ttcgccctat agtgagtcgt attacaattc actggccgtc 60

gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 120

catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 180

cagttgcgca gcctgaatgg cgaatggacg cgccctgtag cggcgcatta agcgcggcgg 240

gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 300

tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 360

gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 420

attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 480

cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 540

ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 600

aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa 660

tttcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatcaggtg 720

gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 780

atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 840

agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 900

ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 960

gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 1020

gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 1080

tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 1140

acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 1200

aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 1260

cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 1320

gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 1380

cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 1440

tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 1500

tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 1560

ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 1620

tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 1680

gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 1740

ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1800

tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1860

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1920

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1980

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 2040

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 2100

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 2160

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 2220

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 2280

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 2340

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 2400

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 2460

ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 2520

acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 2580

gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 2640

cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 2700

gctggcgcgc caccatcatt gagaacctca gtaagctcaa gtgggataag accgccatcc 2760

acatccgtgc caccaaacag gcccatgctg gtgccattgt gcgtcatcca gacccgtcct 2820

tctatgaagg taagaccgtt gtcaagcact ggattgacaa caaggcccgt ctttgagagc 2880

agcctgactc ggcctttgta gagcaaggcc attattgatt tatagacatt ataccgggaa 2940

atactaaaca caagaacctt cggcgtgatt atctgcactt gtaccacgct gcagtaagtt 3000

agtaatcgga attcaactgc cattagacat tatttacctg cagacccaat tcgtccagca 3060

acggaggaat gaacgttggg ggttcgggtc taaagatgcg tcctgtaagt gggggcgttg 3120

gtctacgagt agggtcctgc tttagtgtgg aaaatttatc tctttatgtg tttccattgg 3180

ctggtgcgtt ttgttgtttt cctttattca gccaatcaga atgcgtgaga atacctgtta 3240

tgttttcctc acaatatttt tttccaccgc cattttggag agccgccgga aaccagagtg 3300

ccgaaaggct atcttttggg ctggaattat atatcctaag ccagacacaa tcctgactca 3360

ctaaccttgg agtagataga gaaagagcaa gaagctctgt gagtcagaga ggaagaggga 3420

ggcacataat gtgggagtta taggggtatc gtacgttgtg tggaagcttg tgagcggata 3480

acaatttcac acaggaaaca gctatgacca tgattacgcc aagctcgaaa ttaaccctca 3540

ctaaagggaa caaaagctgg agctccaccg cggacacaat atctggtcaa atttcagttt 3600

cgttacattt aaacggtagg ttagtgcttg gtatatgagt tgtaggcatg acaatttgga 3660

aaggggtgga ctttgggaat attgtgggat ttcaatacct tagtttgtac agggtaattg 3720

ttacaaatga tacaaagaac tgtatttctt ttcatttgtt ttaattggtt gtatatcaag 3780

tccgttagac gagctcagtg ccttggcttt tggcactgta tttcattttt agaggtacac 3840

tacattcagt gaggtatggt aaggttgagg gcataatgaa ggcaccttgt actgacagtc 3900

acagacctct caccgagaat tttatgagat atactcgggt tcattttagg ctcatcgata 3960

cgctctcatc aagaatactt cttgagaacc gtggagaccg gggttcgatt ccccgtatcg 4020

gagtgtttat tttttgctca accataccct ggggtgtgtt ctgtggagca ttctcacttt 4080

tggtaaacga cattgcttca agtgcagcgg aatcaaaaag tataaagtgg gcagcgagta 4140

tacctgtaca gactgtaggc gataactcaa tccaattacc ccccacaaca tgactggcca 4200

aactgatctc aagactttat tgaaatcagc aacaccgatt ctcaatgaag gcacatactt 4260

cttctgcaac attcacttga cgcctaaagt tggtgagaaa tggaccgaca agacatattc 4320

tgctatccac ggactgttgc ctgtgtcggt ggctacaata cgtgagtcag aagggctgac 4380

ggtggtggtt cccaaggaaa aggtcgacga gtatctgtct gactcgtcat tgccgccttt 4440

ggagtacgac tccaactatg agtgtgcttg gatcactttg acgatacatt cttcgttgga 4500

ggctgtgggt ctgacagctg cgttttcggc gcggttggcc gacaacaata tcagctgcaa 4560

cgtcattgct ggctttcatc atgatcacat ttttgtcggc aaaggcgacg cccagagagc 4620

cattgacgtt ctttctaatt tggaccgata gccgtatagt ccagtctatc tataagttca 4680

actaactcgt aactattacc ataacatata cttcactgcc ccagataagg ttccgataaa 4740

aagttctgca gactaaattt atttcagtct cctcttcacc accaaaatgc cctcctacga 4800

agctcgagct aacgtccaca agtccgcctt tgccgctcga gtgctcaagc tcgtggcagc 4860

caagaaaacc aacctgtgtg cttctctgga tgttaccacc accaaggagc tcattgagct 4920

tgccgataag gtcggacctt atgtgtgcat gatcaaaacc catatcgaca tcattgacga 4980

cttcacctac gccggcactg tgctccccct caaggaactt gctcttaagc acggtttctt 5040

cctgttcgag gacagaaagt tcgcagatat tggcaacact gtcaagcacc agtaccggtg 5100

tcaccgaatc gccgagtggt ccgatatcac caacgcccac ggtgtacccg gaaccggaat 5160

cattgctggc ctgcgagctg gtgccgagga aactgtctct gaacagaaga aggaggacgt 5220

ctctgactac gagaactccc agtacaagga gttcctagtc ccctctccca acgagaagct 5280

ggccagaggt ctgctcatgc tggccgagct gtcttgcaag ggctctctgg ccactggcga 5340

gtactccaag cagaccattg agcttgcccg atccgacccc gagtttgtgg ttggcttcat 5400

tgcccagaac cgacctaagg gcgactctga ggactggctt attctgaccc ccggggtggg 5460

tcttgacgac aagggagacg ctctcggaca gcagtaccga actgttgagg atgtcatgtc 5520

taccggaacg gatatcataa ttgtcggccg aggtctgtac ggccagaacc gagatcctat 5580

tgaggaggcc aagcgatacc agaaggctgg ctgggaggct taccagaaga ttaactgtta 5640

gaggttagac tatggatatg taatttaact gtgtatatag agagcgtgca agtatggagc 5700

gcttgttcag cttgtatgat ggtcagacga cctgtctgat cgagtatgta tgatactgca 5760

caacctgtgt atccgcatga tctgtccaat ggggcatgtt gttgtgtttc tcgatacgga 5820

gatgctgggt acagtgctaa tacgttgaac tacttatact tatatgaggc tcgaagaaag 5880

ctgacttgtg tatgacttat tctcaactac atccccagtc acaataccac cactgcacta 5940

ccactacacc aaaaccatga tcaaaccacc catggacttc ctggaggcag aagaacttgt 6000

tatggaaaag ctcaagagag agaattcaag atactatcaa gacatgtgtc gcaacttaat 6060

taatgtatct atacctaatc gacatggact gcaccgcatt cgttatctta tcgtagtcct 6120

gcttactttg atccgtatca cattcgtgta tcgcgataag aagtaaacat tgctgcaagt 6180

ataaatcagg tctcaaatct cttcttgaag atagttttaa gctcaccgtg aactgaacgt 6240

gaacactacg agtacgattt tcaatattat taccgtcgat ataacaacca tgcaatttct 6300

atatacatat atacattccc tcattcgtct gtgctgtttg gttcactgca gcaaatcaaa 6360

cagcttttcg tactttctgt gctgcgaatg tttgttacta tccgcgtgca ttctttgcag 6420

cttttgagat cccgtatagt ccttccacac gttggcactc gcctttttcg tcgtcgattg 6480

cagcttcata atcaacttgt cattgtccag cttggccccc tggacctcca tcatcacaat 6540

cttgtctctg tggtgtttga tagacgagtc gttcacttca caggtagcca caacgccgat 6600

gcaagcagct tttgtgcgct gatcatccac aatacgtgct ggtaacatgg gatttgccat 6660

gactccgtta cgagatgtgt gtagcgatcc cttggggaag taggacggtc cagccacggg 6720

tttcgtggat attgagtccc acggaccgaa tttttgtgtt gcagcgtact ctttggcaag 6780

ctggatgaga tactcgccgt ccagagcgct gcgcttgacg cctcggtcgt tgcaccactt 6840

gatgaaggcg taa 6853

<210> 76

<211> 6512

<212> DNA

<213> 人工序列

<220>

<223> p12_3-B-Pex3del1质粒

<400> 76

gtacgataac ttcgtatagc atacattata cgaagttatc gcgtcgacga gtatctgtct 60

gactcgtcat tgccgccttt ggagtacgac tccaactatg agtgtgcttg gatcactttg 120

acgatacatt cttcgttgga ggctgtgggt ctgacagctg cgttttcggc gcggttggcc 180

gacaacaata tcagctgcaa cgtcattgct ggctttcatc atgatcacat ttttgtcggc 240

aaaggcgacg cccagagagc cattgacgtt ctttctaatt tggaccgata gccgtatagt 300

ccagtctatc tataagttca actaactcgt aactattacc ataacatata cttcactgcc 360

ccagataagg ttccgataaa aagttctgca gactaaattt atttcagtct cctcttcacc 420

accaaaatgc cctcctacga agctcgagct aacgtccaca agtccgcctt tgccgctcga 480

gtgctcaagc tcgtggcagc caagaaaacc aacctgtgtg cttctctgga tgttaccacc 540

accaaggagc tcattgagct tgccgataag gtcggacctt atgtgtgcat gatcaaaacc 600

catatcgaca tcattgacga cttcacctac gccggcactg tgctccccct caaggaactt 660

gctcttaagc acggtttctt cctgttcgag gacagaaagt tcgcagatat tggcaacact 720

gtcaagcacc agtaccggtg tcaccgaatc gccgagtggt ccgatatcac caacgcccac 780

ggtgtacccg gaaccggaat cattgctggc ctgcgagctg gtgccgagga aactgtctct 840

gaacagaaga aggaggacgt ctctgactac gagaactccc agtacaagga gttcctagtc 900

ccctctccca acgagaagct ggccagaggt ctgctcatgc tggccgagct gtcttgcaag 960

ggctctctgg ccactggcga gtactccaag cagaccattg agcttgcccg atccgacccc 1020

gagtttgtgg ttggcttcat tgcccagaac cgacctaagg gcgactctga ggactggctt 1080

attctgaccc ccggggtggg tcttgacgac aagggagacg ctctcggaca gcagtaccga 1140

actgttgagg atgtcatgtc taccggaacg gatatcataa ttgtcggccg aggtctgtac 1200

ggccagaacc gagatcctat tgaggaggcc aagcgatacc agaaggctgg ctgggaggct 1260

taccagaaga ttaactgtta gaggttagac tatggatatg taatttaact gtgtatatag 1320

agagcgtgca agtatggagc gcttgttcag cttgtatgat ggtcagacga cctgtctgat 1380

cgagtatgta tgatactgca caacctgtgt atccgcatga tctgtccaat ggggcatgtt 1440

gttgtgtttc tcgatacgga gatgctgggt acagtgctaa tacgttgaac tacttatact 1500

tatatgaggc tcgaagaaag ctgacttgtg tatgacttat tctcaactac atccccagtc 1560

acaataccac cactgcacta ccactacacc aaaaccatga tcaaaccacc catggacttc 1620

ctggaggcag aagaacttgt tatggaaaag ctcaagagag agatcataac ttcgtatagc 1680

atacattata cgaagttatc ctgcaggtaa aggaattcag gagagaccgg gttggcggcg 1740

tatttgtgtc ccaaaaaaca gccccaattg ccccaattga ccccaaattg acccagtagc 1800

gggcccaacc ccggcgagag cccccttcac cccacatatc aaacctcccc cggttcccac 1860

acttgccgtt aagggcgtag ggtactgcag tctggaatct acgcttgttc agactttgta 1920

ctagtttctt tgtctggcca tccgggtaac ccatgccgga cgcaaaatag actactgaaa 1980

atttttttgc tttgtggttg ggactttagc caagggtata aaagaccacc gtccccgaat 2040

tacctttcct cttcttttct ctctctcctt gtcaactcac acccgaaatc gttaagcatt 2100

tccttctgag tataagaatc attcaccatg gacttcctgg aggcagaaga acttgttatg 2160

gaaaagctca agagagagaa gccaagatac tatcaagaca tgtgtcgcaa cttaattaag 2220

atgacgacat ttgcgagctg gacgaggaat agatggagcg tgtgttctga gtcgatgttt 2280

tctatggagt tgtgagtgtt agtagacatg atgggtttat atatgatgaa tgaatagatg 2340

tgattttgat ttgcacgatg gaattgagaa ctttgtaaac gtacatggga atgtatgaat 2400

gtgggggttt tgtgactgga taactgacgg tcagtggacg ccgttgttca aatatccaag 2460

agatgcgaga aactttgggt caagtgaaca tgtcctctct gttcaagtaa accatcaact 2520

atgggtagta tatttagtaa ggacaagagt tgagattctt tggagtccta gaaacgtatt 2580

ttcgcgttcc aagatcaaat tagtagagta atacgggcac gggaatccat tcatagtctc 2640

aattttccca taggtgtgct acaaggtgtt gagatgtggt acagtaccac catgattcga 2700

ggtaaagagc ccagaagtca ttgatgaggt caagaaatac acagatctac agctcaatac 2760

aatgaatatc ttctttcata ttcttcaggt gacaccaagg gtgtctattt tccccagaaa 2820

tgcgtgaaaa ggcgcgtgtg tagcgtggag tatgggttcg gttggcgtat ccttcatata 2880

tcgacgaaat agtagggcaa gagatgacaa aaagtatcta tatgtagaca gcgtagaata 2940

tggatttgat tggtataaat tcatttattg cgtgtctcac aaatactctc gataagttgg 3000

ggttaaactg gagatggaac aatgtcgata tctcgacgca tgcgacgtcg ggcccaattc 3060

gccctatagt gagtcgtatt acaattcact ggccgtcgtt ttacaacgtc gtgactggga 3120

aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg 3180

taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga 3240

atggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 3300

accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 3360

gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 3420

tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 3480

gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3540

agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3600

ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3660

tttaacgcga attttaacaa aatattaacg cttacaattt cctgatgcgg tattttctcc 3720

ttacgcatct gtgcggtatt tcacaccgca tcaggtggca cttttcgggg aaatgtgcgc 3780

ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 3840

taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 3900

cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 3960

acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4020

ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4080

atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 4140

gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 4200

acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 4260

atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 4320

accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 4380

ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 4440

acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 4500

gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 4560

tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 4620

ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 4680

actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 4740

taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 4800

tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4860

gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4920

cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4980

gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5040

gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac 5100

tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5160

ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5220

cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5280

gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5340

gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5400

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5460

cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5520

tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5580

cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5640

cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 5700

ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcgcgccac caatcacaat 5760

tctgaaaagc acatcttgat ctcctcattg cggggagtcc aacggtggtc ttattccccc 5820

gaatttcccg ctcaatctcg ttccagaccg acccggacac agtgcttaac gccgttccga 5880

aactctaccg cagatatgct ccaacggact gggctgcata gatgtgatcc tcggcttgga 5940

gaaatggata aaagccggcc aaaaaaaaag cggaaaaaag cggaaaaaaa gagaaaaaaa 6000

atcgcaaaat ttgaaaaata gggggaaaag acgcaaaaac gcaaggaggg gggagtatat 6060

gacactgata agcaagctca caacggttcc tcttattttt ttcctcatct tctgcctagg 6120

ttcccaaaat cccagatgct tctctccagt gccaaaagta agtaccccac aggttttcgg 6180

ccgaaaattc cacgtgcagc aacgtcgtgt ggggtgttaa aatgtggggg gggggaacca 6240

ggacaagagg ctcttgtggg agccgaatga gagcacaaag cgggcgggtg tgataagggc 6300

atttttgccc attttccctt ctcctgtctc tccgacggtg atggcgttgt gcgtcctcta 6360

tttcttttta tttctttttg ttttatttct ctgactaccg atttggtttg atttcctcaa 6420

ccccacacaa ataagctcgg gccgaggaat atatatatac acggacacag tcgccctgtg 6480

gacaacacgt cactacctct acgatacaca cc 6512

<210> 77

<211> 6906

<212> DNA

<213> 人工序列

<220>

<223> p70_Pox2::Leu2质粒

<400> 77

cgatagttgg agcaagggag aaatgtttgt acgggcgtcg ttgcttgtgt gatttttgag 60

gacccatccc tttggtatat aagtatactc tggggttaag gttgcccgtg tagtctaggt 120

tatagttttc atgtgaaata ccgagagccg agggagaata aacgggggta tttggacttg 180

tttttttcgc ggaaaagcgt cgaatcaacc ctgcgggcct tgcaccatgt ccacgacgtg 240

tttctcgccc caattcgccc cttgcacgtc aaaattaggc ctccatctag acccctccat 300

aacatgtgac tgtggggaaa agtataaggg aaaccatgca accatagacg acgtgaaaga 360

cggggaggaa ccaatggagg ccaaagaaat ggggtagcaa cagtccagga gacagacaag 420

gagacaagga gagggcgccc gaaagatcgg aaaaacaaac atgtccaatt ggggcagtga 480

cggaaacgac acggacactt cagtacaatg gaccgaccat ctccaagcca gggttattcc 540

ggtatcacct tggccgtaac ctcccgctgg tacctgatat tgtacacgtt cacattcaat 600

atactttcag ctacaataag agaggctgtt tgtcgggcat gtgtgtccgt cgtatggggt 660

gatgtccgag ggcgaaattc gctacaagct taactctggc gcttgtccag tatgaataga 720

caagtcaaga ccagtggtgc catgattgac agggaggtac aagacttcga tactcgagca 780

ttactcggac ttgtggcgat tgaacagacg ggcgatcgct tctcccccgt attgccggcg 840

cgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 900

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 960

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 1020

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 1080

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 1140

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 1200

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 1260

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 1320

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 1380

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 1440

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 1500

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 1560

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 1620

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 1680

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 1740

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 1800

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 1860

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1920

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1980

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 2040

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 2100

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 2160

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 2220

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 2280

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 2340

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 2400

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 2460

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 2520

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 2580

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 2640

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2700

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2760

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 2820

aaagtgccac ctgatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 2880

caggaaattg taagcgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc 2940

tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc 3000

gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 3060

tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 3120

ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 3180

agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 3240

aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 3300

accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt ccattcgcca ttcaggctgc 3360

gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 3420

ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 3480

gtaaaacgac ggccagtgaa ttgtaatacg actcactata gggcgaattg ggcccgacgt 3540

cgcatgcgct gatgacactt tggtctgaaa gagatgcatt ttgaatccca aacttgcagt 3600

gcccaagtga catacatctc cgcgttttgg aaaatgttca gaaacagttg attgtgttgg 3660

aatggggaat ggggaatgga aaaatgactc aagtatcaat tccaaaaact tctctggctg 3720

gcagtaccta ctgtccatac tactgcattt tctccagtca ggccactcta tactcgacga 3780

cacagtagta aaacccagat aatttcgaca taaacaagaa aacagaccca ataatattta 3840

tatatagtca gccgtttgtc cagttcagac tgtaatagcc gaaaaaaaat ccaaagtttc 3900

tattctagga aaatatattc caatattttt aattcttaat ctcatttatt ttattctagc 3960

gaaatacatt tcagctactt gagacatgtg atacccacaa atcggattcg gactcggttg 4020

ttcagaagag catatggcat tcgtgctcgc ttgttcacgt attcttcctg ttccatctct 4080

tggccgacaa tcacacaaaa atggggtttt ttttttaatt ctaatgattc attacagcaa 4140

aattgagata tagcagacca cgtattccat aatcaccaag gaagttcttg ggcgtcttaa 4200

ttaagttgcg acacatgtct tgatagtatc ttggcttctc tctcttgagc ttttccataa 4260

caagttcttc tgcctccagg aagtccatgg tgaatgattc ttatactcag aaggaaatgc 4320

ttaacgattt cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg 4380

gggacggtgg tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca 4440

gtagtctatt ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa 4500

agtctgaaca agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg 4560

aaccggggga ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac 4620

tgggtcaatt tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg 4680

ccaacccggt ctctcctgaa ttctgcagat gggctgcagg aattccgtcg tcgcctgagt 4740

cgacatcatt tatttaccag ttggccacaa acccttgacg atctcgtatg tcccctccga 4800

catactcccg gccggctggg gtacgttcga tagcgctatc ggcatcgaca aggtttgggt 4860

ccctagccga taccgcacta cctgagtcac aatcttcgga ggtttagtct tccacatagc 4920

acgggcaaaa gtgcgtatat atacaagagc gtttgccagc cacagatttt cactccacac 4980

accacatcac acatacaacc acacacatcc acaatggaac ccgaaactaa gaagaccaag 5040

actgactcca agaagattgt tcttctcggc ggcgacttct gtggccccga ggtgattgcc 5100

gaggccgtca aggtgctcaa gtctgttgct gaggcctccg gcaccgagtt tgtgtttgag 5160

gaccgactca ttggaggagc tgccattgag aaggagggcg agcccatcac cgacgctact 5220

ctcgacatct gccgaaaggc tgactctatt atgctcggtg ctgtcggagg cgctgccaac 5280

accgtatgga ccactcccga cggacgaacc gacgtgcgac ccgagcaggg tctcctcaag 5340

ctgcgaaagg acctgaacct gtacgccaac ctgcgaccct gccagctgct gtcgcccaag 5400

ctcgccgatc tctcccccat ccgaaacgtt gagggcaccg acttcatcat tgtccgagag 5460

ctcgtcggag gtatctactt tggagagcga aaggaggatg acggatctgg cgtcgcttcc 5520

gacaccgaga cctactccgt tcctgaggtt gagcgaattg cccgaatggc cgccttcctg 5580

gcccttcagc acaacccccc tcttcccgtg tggtctcttg acaaggccaa cgtgctggcc 5640

tcctctcgac tttggcgaaa gactgtcact cgagtcctca aggacgaatt cccccagctc 5700

gagctcaacc accagctgat cgactcggcc gccatgatcc tcatcaagca gccctccaag 5760

atgaatggta tcatcatcac caccaacatg tttggcgata tcatctccga cgaggcctcc 5820

gtcatccccg gttctctggg tctgctgccc tccgcctctc tggcttctct gcccgacacc 5880

aacgaggcgt tcggtctgta cgagccctgt cacggatctg cccccgatct cggcaagcag 5940

aaggtcaacc ccattgccac cattctgtct gccgccatga tgctcaagtt ctctcttaac 6000

atgaagcccg ccggtgacgc tgttgaggct gccgtcaagg agtccgtcga ggctggtatc 6060

actaccgccg atatcggagg ctcttcctcc acctccgagg tcggagactt gttgccaaca 6120

aggtcaagga gctgctcaag aaggagtaag tcgtttctac gacgcattga tggaaggagc 6180

aaactgacgc gcctgcgggt tggtctaccg gcagggtccg ctagtgtata agactctata 6240

aaaagggccc tgccctgcta atgaaatgat gatttataat ttaccggtgt agcaaccttg 6300

actagaagaa gcagattggg tgtgtttgta gtggaggaca gtggtacgtt ttggaaacag 6360

tcttcttgaa agtgtcttgt ctacagtata ttcactcata acctcaatag ccaagggtgt 6420

agtcggttta ttaaaggaag ggagttgtgg ctgatgtgga tagatatctt taagctggcg 6480

actgcaccca acgagtgtgg tggtagcttg ttagatctgt atattcggta agatatattt 6540

tgtggggttt tagtggtgtt taaacggtag gttagtgctt ggtatatgag ttgtaggcat 6600

gacaatttgg aaaggggtgg actttgggaa tattgtggga tttcaatacc ttagtttgta 6660

cagggtaatt gttacaaatg atacaaagaa ctgtatttct tttcatttgt tttaattggt 6720

tgtatatcaa gtccgttaga cgagctcagt gccttggctt ttggcactgt atttcatttt 6780

tagaggtaca ctacattcag tgaggtatgg taaggttgag ggcataatga aggcaccttg 6840

tactgacagt cacagacctc tcaccgagaa ttttatgaga tatactcggg ttcattttag 6900

gctcat 6906

<210> 78

<211> 2103

<212> DNA

<213> 解脂耶氏酵母

<400> 78

atgaacccca acaacactgg caccattgaa atcaacggta aggagtacaa caccttcacc 60

gagccccccg tggccatggc tcaggagcga gccaagacct ccttccccgt gcgagagatg 120

acctacttcc tcgacggtgg cgagaagaac accctcaaaa acgagcagat catggaggag 180

attgagcgag accctctttt caacaacgac aactactacg atctcaacaa ggagcagatc 240

cgagagctca ccatggagcg agtcgccaag ctgtctctgt ttgtgcgtga tcagcccgag 300

gacgacatca agaagcgatt tgctctcatt ggtatcgccg atatgggaac ctacacccga 360

cttggtgtcc actacggcct cttctttggc gccgtccgag gtaccggaac tgccgagcag 420

tttggccact ggatctccaa gggagccgga gacctgcgaa agttctacgg atgtttctcc 480

atgaccgagc tgggccatgg ctccaacctg gctggtctcg agaccaccgc catctacgat 540

gaggagaccg acgagttcat catcaacacc cctcacattg ccgccaccaa gtggtggatt 600

ggaggagccg cccacaccgc cacccacact gtcgtgttcg cccgactcat tgtcaagggc 660

aaggactacg gtgtcaagac ctttgttgtc cagctgcgaa acatcaacga ccacagcctc 720

aaggtcggta tctctattgg tgatatcgga aagaagatgg gccgagacgg tatcgataac 780

ggatggatcc agttcaccaa cgtgcgaatc ccccgacaga acctgctcat gaagtacaca 840

aaggtcgacc gagagggtaa cgtgacccag cctcctctgg ctcagcttac ctacggttct 900

cttatcactg gtcgagtctc catggcctct gattctcacc aggtcggaaa gcgattcatc 960

accattgctc tgcgatacgc ctgcattcga cgacagttct ccaccacccc cggccagccc 1020

gagaccaaga tcatcgacta cccctaccat cagcgacgac ttctgcctct tctggcctat 1080

gtctatgctc ttaagatgac tgccgatgag gttggagctc tcttctcccg aaccatgctt 1140

aagatggacg acctcaagcc cgacgacaag gccggcctca atgaggttgt ttccgacgtc 1200

aaggagctct tctccgtctc cgccggtctc aaggccttct ccacctgggc ttgtgccgac 1260

gtcattgaca agacccgaca ggcttgcggt ggccacggtt actctggata caacggtttc 1320

ggccaggcct acgccgactg ggttgtccag tgcacctggg agggtgacaa caacattctc 1380

accctttctg ccggccgagc tcttatccag tctgccgttg ctctgcgaaa gggcgagcct 1440

gttggtaacg ccgtttctta cctgaagcga tacaaggatc tggccaacgc taagctcaat 1500

ggccgatctc tcaccgaccc caaggtcctc gtcgaggcct gggaggttgc tgccggtaac 1560

atcatcaacc gagccaccga ccagtacgag aagctcattg gcgagggtct taacgccgac 1620

caggcctttg aggttctgtc tcagcagcga ttccaggccg ccaaggtcca cacacgacga 1680

cacctcattg ccgctttctt ctcccgaatt gacaccgagg ctggcgaggc catcaagcag 1740

cccctgctta acctggctct gctgtttgcc ctgtggtcca tcgaagagga ctctggtctg 1800

ttcctgcgag agggcttcct cgagcccaag gatatcgaca ccgtcaccga gctcgtcaac 1860

aagtactgca ccactgtgcg agaggaggtc attggctaca ccgatgcctt caacctgtcc 1920

gactacttca tcaacgctcc tattggatgc tacgatggtg acgcttaccg acactacttc 1980

cagaaggtca acgagcagaa ccctgcccga gacccccgac ctccttacta cgcctctact 2040

ctcaagccct tccttttccg agaggaggag gatgatgaca tttgcgagct tgatgaggaa 2100

tag 2103

<210> 79

<211> 700

<212> PRT

<213> 解脂耶氏酵母

<400> 79

Met Asn Pro Asn Asn Thr Gly Thr Ile Glu Ile Asn Gly Lys Glu Tyr

1 5 10 15

Asn Thr Phe Thr Glu Pro Pro Val Ala Met Ala Gln Glu Arg Ala Lys

20 25 30

Thr Ser Phe Pro Val Arg Glu Met Thr Tyr Phe Leu Asp Gly Gly Glu

35 40 45

Lys Asn Thr Leu Lys Asn Glu Gln Ile Met Glu Glu Ile Glu Arg Asp

50 55 60

Pro Leu Phe Asn Asn Asp Asn Tyr Tyr Asp Leu Asn Lys Glu Gln Ile

65 70 75 80

Arg Glu Leu Thr Met Glu Arg Val Ala Lys Leu Ser Leu Phe Val Arg

85 90 95

Asp Gln Pro Glu Asp Asp Ile Lys Lys Arg Phe Ala Leu Ile Gly Ile

100 105 110

Ala Asp Met Gly Thr Tyr Thr Arg Leu Gly Val His Tyr Gly Leu Phe

115 120 125

Phe Gly Ala Val Arg Gly Thr Gly Thr Ala Glu Gln Phe Gly His Trp

130 135 140

Ile Ser Lys Gly Ala Gly Asp Leu Arg Lys Phe Tyr Gly Cys Phe Ser

145 150 155 160

Met Thr Glu Leu Gly His Gly Ser Asn Leu Ala Gly Leu Glu Thr Thr

165 170 175

Ala Ile Tyr Asp Glu Glu Thr Asp Glu Phe Ile Ile Asn Thr Pro His

180 185 190

Ile Ala Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Thr Ala Thr

195 200 205

His Thr Val Val Phe Ala Arg Leu Ile Val Lys Gly Lys Asp Tyr Gly

210 215 220

Val Lys Thr Phe Val Val Gln Leu Arg Asn Ile Asn Asp His Ser Leu

225 230 235 240

Lys Val Gly Ile Ser Ile Gly Asp Ile Gly Lys Lys Met Gly Arg Asp

245 250 255

Gly Ile Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Ile Pro Arg

260 265 270

Gln Asn Leu Leu Met Lys Tyr Thr Lys Val Asp Arg Glu Gly Asn Val

275 280 285

Thr Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ser Leu Ile Thr Gly

290 295 300

Arg Val Ser Met Ala Ser Asp Ser His Gln Val Gly Lys Arg Phe Ile

305 310 315 320

Thr Ile Ala Leu Arg Tyr Ala Cys Ile Arg Arg Gln Phe Ser Thr Thr

325 330 335

Pro Gly Gln Pro Glu Thr Lys Ile Ile Asp Tyr Pro Tyr His Gln Arg

340 345 350

Arg Leu Leu Pro Leu Leu Ala Tyr Val Tyr Ala Leu Lys Met Thr Ala

355 360 365

Asp Glu Val Gly Ala Leu Phe Ser Arg Thr Met Leu Lys Met Asp Asp

370 375 380

Leu Lys Pro Asp Asp Lys Ala Gly Leu Asn Glu Val Val Ser Asp Val

385 390 395 400

Lys Glu Leu Phe Ser Val Ser Ala Gly Leu Lys Ala Phe Ser Thr Trp

405 410 415

Ala Cys Ala Asp Val Ile Asp Lys Thr Arg Gln Ala Cys Gly Gly His

420 425 430

Gly Tyr Ser Gly Tyr Asn Gly Phe Gly Gln Ala Tyr Ala Asp Trp Val

435 440 445

Val Gln Cys Thr Trp Glu Gly Asp Asn Asn Ile Leu Thr Leu Ser Ala

450 455 460

Gly Arg Ala Leu Ile Gln Ser Ala Val Ala Leu Arg Lys Gly Glu Pro

465 470 475 480

Val Gly Asn Ala Val Ser Tyr Leu Lys Arg Tyr Lys Asp Leu Ala Asn

485 490 495

Ala Lys Leu Asn Gly Arg Ser Leu Thr Asp Pro Lys Val Leu Val Glu

500 505 510

Ala Trp Glu Val Ala Ala Gly Asn Ile Ile Asn Arg Ala Thr Asp Gln

515 520 525

Tyr Glu Lys Leu Ile Gly Glu Gly Leu Asn Ala Asp Gln Ala Phe Glu

530 535 540

Val Leu Ser Gln Gln Arg Phe Gln Ala Ala Lys Val His Thr Arg Arg

545 550 555 560

His Leu Ile Ala Ala Phe Phe Ser Arg Ile Asp Thr Glu Ala Gly Glu

565 570 575

Ala Ile Lys Gln Pro Leu Leu Asn Leu Ala Leu Leu Phe Ala Leu Trp

580 585 590

Ser Ile Glu Glu Asp Ser Gly Leu Phe Leu Arg Glu Gly Phe Leu Glu

595 600 605

Pro Lys Asp Ile Asp Thr Val Thr Glu Leu Val Asn Lys Tyr Cys Thr

610 615 620

Thr Val Arg Glu Glu Val Ile Gly Tyr Thr Asp Ala Phe Asn Leu Ser

625 630 635 640

Asp Tyr Phe Ile Asn Ala Pro Ile Gly Cys Tyr Asp Gly Asp Ala Tyr

645 650 655

Arg His Tyr Phe Gln Lys Val Asn Glu Gln Asn Pro Ala Arg Asp Pro

660 665 670

Arg Pro Pro Tyr Tyr Ala Ser Thr Leu Lys Pro Phe Leu Phe Arg Glu

675 680 685

Glu Glu Asp Asp Asp Ile Cys Glu Leu Asp Glu Glu

690 695 700

<210> 80

<211> 2103

<212> DNA

<213> 解脂耶氏酵母

<400> 80

atgatctccc ccaacctcac agctaacgtc gagattgacg gcaagcagta caacaccttc 60

acagagccac ccaaggcgct cgccggcgag cgagccaagg tcaagttccc catcaaggac 120

atgacggagt ttctgcacgg tggcgaggag aacgtgacca tgatcgagcg actgatgacg 180

gagctcgagc gagaccccgt gctcaacgtg tcgggcgact acgacatgcc caaggagcag 240

ctgcgagaga cggccgtggc gcgaattgcg gcgctgtccg gccactggaa gaaggacaca 300

gaaaaggagg cgctgctgcg gtcccagctg cacggcattg tggacatggg cacccgaatc 360

cgactcggtg tgcacacggg cctgttcatg ggcgccatcc ggggttccgg caccaaggag 420

cagtacgact actgggtgcg aaagggcgcc gcggacgtca agggcttcta cggctgcttt 480

gctatgaccg agctgggcca tggctccaac gtggccggtc ttgagaccac cgccacctac 540

atccaggaca cggacgagtt catcatcaac acccccaaca ctggagccac caagtggtgg 600

attggaggag ccgcccactc ggccacccac accgcctgct ttgctcgtct gcttgtcgac 660

ggcaaggact acggcgtcaa gatctttgtt gtccagctgc gagacgtctc ttctcactct 720

ctcatgcccg gcatcgctct cggcgacatt ggaaagaaga tgggccgaga cgccatcgac 780

aacggctgga tccagttcac caatgtgcga atcccccgac agaacatgct catgaagtac 840

gccaaggtct cgtctaccgg caaggtgtcg cagcctcctc tggcccagct cacctacggc 900

gctctcattg gcggccgagt caccatgatt gccgactcct tctttgtctc ccagcgattc 960

atcaccattg ctctgcgata cgcctgtgtg cgacgacagt ttggcaccac ccccggccag 1020

cccgagacta agatcatcga ctacccctac catcagcgac gtctgctgcc tcttctggcc 1080

ttcacctacg ccatgaagat ggccgccgac cagtcccaga ttcagtacga tcagaccacc 1140

gatctgctgc agaccatcga ccctaaggac aagggcgctc tgggcaaggc cattgtcgac 1200

ctcaaggagc tgtttgcctc ttctgctggt ctcaaggcct tcaccacctg gacctgtgcc 1260

aacatcattg accagtgccg acaggcctgc ggtggccacg gctactctgg ctacaacggc 1320

tttggccagg cctacgccga ctgggttgtc cagtgcacct gggagggtga caacaacgtc 1380

ctgtgtctgt ccatgggccg aggtctcatc cagtcgtgtc tgggccaccg aaagggtaag 1440

cctctgggct cttctgtcgg ctacctggct aacaagggtc ttgagcaggc tactctgagc 1500

ggccgagacc tcaaggaccc caaggttctc atcgaggcct gggagaaggt cgccaacggc 1560

gccatccagc gggccactga caaatttgtc gagctcacca agggcggcct ctctcctgac 1620

caggcctttg aggagctgtc gcagcagcga ttccagtgtg ccaagatcca cacccgaaag 1680

cacctggtga ctgccttcta cgagcgaatc aacgcctctg cgaaggccga cgtcaagcct 1740

tacctcatca acctcgccaa cctcttcact ctgtggtcca ttgaggagga ctctggtctc 1800

ttcctgcgag agggtttcct gcagcccaag gacattgacc aggtgactga gctggtgaac 1860

cactactgca aggaggttcg agaccaggtt gccggctaca ccgatgcctt tggtctgtct 1920

gactggttca tcaacgctcc cattggaaac tacgatggtg acgtttacaa gcattacttt 1980

gccaaggtta accagcagaa ccctgctcag aacccccgac ctccttacta tgagagcact 2040

cttcgacctt tcctgttccg agaggatgag gatgacgaca tttgcgagct ggacgaggaa 2100

tag 2103

<210> 81

<211> 700

<212> PRT

<213> 解脂耶氏酵母

<400> 81

Met Ile Ser Pro Asn Leu Thr Ala Asn Val Glu Ile Asp Gly Lys Gln

1 5 10 15

Tyr Asn Thr Phe Thr Glu Pro Pro Lys Ala Leu Ala Gly Glu Arg Ala

20 25 30

Lys Val Lys Phe Pro Ile Lys Asp Met Thr Glu Phe Leu His Gly Gly

35 40 45

Glu Glu Asn Val Thr Met Ile Glu Arg Leu Met Thr Glu Leu Glu Arg

50 55 60

Asp Pro Val Leu Asn Val Ser Gly Asp Tyr Asp Met Pro Lys Glu Gln

65 70 75 80

Leu Arg Glu Thr Ala Val Ala Arg Ile Ala Ala Leu Ser Gly His Trp

85 90 95

Lys Lys Asp Thr Glu Lys Glu Ala Leu Leu Arg Ser Gln Leu His Gly

100 105 110

Ile Val Asp Met Gly Thr Arg Ile Arg Leu Gly Val His Thr Gly Leu

115 120 125

Phe Met Gly Ala Ile Arg Gly Ser Gly Thr Lys Glu Gln Tyr Asp Tyr

130 135 140

Trp Val Arg Lys Gly Ala Ala Asp Val Lys Gly Phe Tyr Gly Cys Phe

145 150 155 160

Ala Met Thr Glu Leu Gly His Gly Ser Asn Val Ala Gly Leu Glu Thr

165 170 175

Thr Ala Thr Tyr Ile Gln Asp Thr Asp Glu Phe Ile Ile Asn Thr Pro

180 185 190

Asn Thr Gly Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Ser Ala

195 200 205

Thr His Thr Ala Cys Phe Ala Arg Leu Leu Val Asp Gly Lys Asp Tyr

210 215 220

Gly Val Lys Ile Phe Val Val Gln Leu Arg Asp Val Ser Ser His Ser

225 230 235 240

Leu Met Pro Gly Ile Ala Leu Gly Asp Ile Gly Lys Lys Met Gly Arg

245 250 255

Asp Ala Ile Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Ile Pro

260 265 270

Arg Gln Asn Met Leu Met Lys Tyr Ala Lys Val Ser Ser Thr Gly Lys

275 280 285

Val Ser Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ala Leu Ile Gly

290 295 300

Gly Arg Val Thr Met Ile Ala Asp Ser Phe Phe Val Ser Gln Arg Phe

305 310 315 320

Ile Thr Ile Ala Leu Arg Tyr Ala Cys Val Arg Arg Gln Phe Gly Thr

325 330 335

Thr Pro Gly Gln Pro Glu Thr Lys Ile Ile Asp Tyr Pro Tyr His Gln

340 345 350

Arg Arg Leu Leu Pro Leu Leu Ala Phe Thr Tyr Ala Met Lys Met Ala

355 360 365

Ala Asp Gln Ser Gln Ile Gln Tyr Asp Gln Thr Thr Asp Leu Leu Gln

370 375 380

Thr Ile Asp Pro Lys Asp Lys Gly Ala Leu Gly Lys Ala Ile Val Asp

385 390 395 400

Leu Lys Glu Leu Phe Ala Ser Ser Ala Gly Leu Lys Ala Phe Thr Thr

405 410 415

Trp Thr Cys Ala Asn Ile Ile Asp Gln Cys Arg Gln Ala Cys Gly Gly

420 425 430

His Gly Tyr Ser Gly Tyr Asn Gly Phe Gly Gln Ala Tyr Ala Asp Trp

435 440 445

Val Val Gln Cys Thr Trp Glu Gly Asp Asn Asn Val Leu Cys Leu Ser

450 455 460

Met Gly Arg Gly Leu Ile Gln Ser Cys Leu Gly His Arg Lys Gly Lys

465 470 475 480

Pro Leu Gly Ser Ser Val Gly Tyr Leu Ala Asn Lys Gly Leu Glu Gln

485 490 495

Ala Thr Leu Ser Gly Arg Asp Leu Lys Asp Pro Lys Val Leu Ile Glu

500 505 510

Ala Trp Glu Lys Val Ala Asn Gly Ala Ile Gln Arg Ala Thr Asp Lys

515 520 525

Phe Val Glu Leu Thr Lys Gly Gly Leu Ser Pro Asp Gln Ala Phe Glu

530 535 540

Glu Leu Ser Gln Gln Arg Phe Gln Cys Ala Lys Ile His Thr Arg Lys

545 550 555 560

His Leu Val Thr Ala Phe Tyr Glu Arg Ile Asn Ala Ser Ala Lys Ala

565 570 575

Asp Val Lys Pro Tyr Leu Ile Asn Leu Ala Asn Leu Phe Thr Leu Trp

580 585 590

Ser Ile Glu Glu Asp Ser Gly Leu Phe Leu Arg Glu Gly Phe Leu Gln

595 600 605

Pro Lys Asp Ile Asp Gln Val Thr Glu Leu Val Asn His Tyr Cys Lys

610 615 620

Glu Val Arg Asp Gln Val Ala Gly Tyr Thr Asp Ala Phe Gly Leu Ser

625 630 635 640

Asp Trp Phe Ile Asn Ala Pro Ile Gly Asn Tyr Asp Gly Asp Val Tyr

645 650 655

Lys His Tyr Phe Ala Lys Val Asn Gln Gln Asn Pro Ala Gln Asn Pro

660 665 670

Arg Pro Pro Tyr Tyr Glu Ser Thr Leu Arg Pro Phe Leu Phe Arg Glu

675 680 685

Asp Glu Asp Asp Asp Ile Cys Glu Leu Asp Glu Glu

690 695 700

<210> 82

<211> 12355

<212> DNA

<213> 人工序列

<220>

<223> pZKLY-FCtR17U质粒

<400> 82

cgatgagcct aaaatgaacc cgagtatatc tcataaaatt ctcggtgaga ggtctgtgac 60

tgtcagtaca aggtgccttc attatgccct caaccttacc atacctcact gaatgtagtg 120

tacctctaaa aatgaaatac agtgccaaaa gccaaggcac tgagctcgtc taacggactt 180

gatatacaac caattaaaac aaatgaaaag aaatacagtt ctttgtatca tttgtaacaa 240

ttaccctgta caaactaagg tattgaaatc ccacaatatt cccaaagtcc acccctttcc 300

aaattgtcat gcctacaact catataccaa gcactaacct accgtttaaa cagtgtacgc 360

agtactatag aggaacaatt gccccggaga agacggccag gccgcctaga tgacaaattc 420

aacaactcac agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa 480

gccaagctct ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac 540

aaagggatgg gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag 600

aacgaatact gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg 660

cctcaaaact acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt 720

taggttgcac caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt 780

ttgtcttaac aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc 840

tttagagctg cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga 900

cacatgtcat gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg 960

gcctcatttt tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct 1020

gcacttgcca accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt 1080

ctagggtata tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt 1140

tccccacaga ttcgaaatct aaactacaca tcacacaatt ccgagccgtg agtatccacg 1200

acaagatcag tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca 1260

acacacactc tctacacaaa ctaacccagc tctccatggc catcgagcag ctgctcgagt 1320

actggtacgt cgttgtgccc gtcctgtaca ttatcaagca gctccttgcc tacaccaaga 1380

ctcgagtgct gatgaaaaag ctcggagccg ctcccgtcac caacaagctg tacgacaacg 1440

ccttcggtat cgtcaacggc tggaaggctc ttcagttcaa gaaagagggc cgagctcagg 1500

aatacaacga ctacaagttc gatcactcca agaatccttc tgtgggaacc tacgtctcca 1560

ttctgtttgg cactcgaatc gtggttacca aggatcccga gaacatcaag gccattctcg 1620

caacccagtt cggagacttt tcgctgggca agcgacacac tctcttcaag cccttgctgg 1680

gagacggtat cttcacactc gatggagaag gctggaagca ttccagagct atgctgcgac 1740

ctcagtttgc ccgagagcaa gttgctcacg tcaccagcct cgaaccacac ttccagctgc 1800

tcaagaaaca tatcctcaag cacaagggcg agtacttcga cattcaggag ctgttctttc 1860

gattcaccgt ggactctgcc acggagtttc tgttcggcga gtccgttcac tctctcaagg 1920

acgagtcgat tggaatcaac caggacgata tcgacttcgc tggtcggaag gactttgccg 1980

agtccttcaa caaggcacag gaatacttgg ccattcgaac tctggtgcag accttctact 2040

ggctcgtcaa caacaaggag tttcgagact gcaccaagct ggttcacaag ttcaccaact 2100

actatgtcca gaaggctctc gatgcatctc ccgaggaact tgagaagcaa agcggctacg 2160

tgttcctgta cgagcttgtc aagcagacca gagatcccaa cgtgctgcga gaccagtccc 2220

tcaacatctt gctggccgga cgagacacca ctgctggcct cctgtcgttt gcagtcttcg 2280

agttggctcg tcatcccgag atctgggcca agctgcgaga ggaaatcgag caacagttcg 2340

gacttggcga ggactctcgt gtcgaagaga ttaccttcga gagcctcaag cgatgcgagt 2400

acctcaaggc ctttctcaac gaaaccctgc ggatctaccc ttccgttcct cgaaacttca 2460

gaatcgctac caagaacaca acccttcccc gaggcggtgg atcggacggt acttctccaa 2520

tcctcattca gaagggcgag gccgtgtcct acggtatcaa ttctactcat ctggatcctg 2580

tctattacgg acccgacgct gccgagtttc gacccgagcg atggttcgaa ccttcgacca 2640

aaaagctcgg ctgggcctac cttcccttca acggaggtcc acgaatctgt ctgggccaac 2700

agtttgccct caccgaggct ggctacgtgc tggtcagact cgttcaggag ttctcccacg 2760

tccgatccga tcccgacgag gtgtaccctc ccaagcgact tacaaacctg accatgtgtc 2820

tccaggacgg tgccattgtc aagttcgact aagcggccgc aagtgtggat ggggaagtga 2880

gtgcccggtt ctgtgtgcac aattggcaat ccaagatgga tggattcaac acagggatat 2940

agcgagctac gtggtggtgc gaggatatag caacggatat ttatgtttga cacttgagaa 3000

tgtacgatac aagcactgtc caagtacaat actaaacata ctgtacatac tcatactcgt 3060

acccgggcaa cggtttcact tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa 3120

tactgcgtat catagtcttt gatgtatatc gtattcattc atgttagttg atttaaacca 3180

tcatctaagg gcctcaaaac tacctcggaa ctgctgcgct gatctggaca ccacagaggt 3240

tccgagcact ttaggttgca ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca 3300

gcgtgtacag tttgtcttaa caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac 3360

ttgttatagc ctttagagct gcgaaagcgc gtatggattt ggctcatcag gccagattga 3420

gggtctgtgg acacatgtca tgttagtgta cttcaatcgc cccctggata tagccccgac 3480

aataggccgt ggcctcattt ttttgccttc cgcacatttc cattgctcgg tacccacacc 3540

ttgcttctcc tgcacttgcc aaccttaata ctggtttaca ttgaccaaca tcttacaagc 3600

ggggggcttg tctagggtat atataaacag tggctctccc aatcggttgc cagtctcttt 3660

tttcctttct ttccccacag attcgaaatc taaactacac atcacaccat ggccctggac 3720

aagctcgacc tgtacgtcat cattaccctc gtggttgcta tcgccgctta cttcgccaag 3780

aaccagttcc tggatcagca acaggacact ggctttctca acaccgactc cggagatggc 3840

aactctcgag acatccttca ggctctcaag aaaaacaata agaacaccct gcttctcttc 3900

ggttcccaga ctggcacagc cgaggactac gccaacaagt tgtcgcgaga gctgcactcc 3960

cgatttggct tgaagactat ggtcgcagat ttcgccgatt acgacttcga gaactttgga 4020

gacattaccg aggacatcct cgtgttcttt atcgttgcta cctacggcga aggcgagccc 4080

accgacaatg ccgacgagtt tcacacttgg ctgaccgagg aagcagatac cctgtctaca 4140

ctcaagtata ccgtcttcgg tctgggtaac tccacctacg agtttttcaa cgccatcggt 4200

cgaaagttcg acagactgct cggagagaag ggtggcgacc gatttgccga gtacggcgaa 4260

ggagacgatg gtactggcac tctcgacgag gatttcctgg cttggaagga caacgtgttc 4320

gattctctca agaacgacct gaatttcgaa gagaaggagc tcaaatacga acccaacgtc 4380

aagttgaccg agcgggacga tctgtctggc aacgatcccg acgtttcgct gggcgagcca 4440

aacgtcaagt acatcaagtc cgagggtgtt gaccttacca agggaccttt cgatcacact 4500

catccctttc tggcccgaat cgtcaagacc aaagagctct ttacttccga ggacagacac 4560

tgcgtgcacg tcgagttcga cattagcgag tccaacctca agtatactac cggagatcat 4620

cttgctatct ggccctccaa ttcggacgag aacatcaagc agtttgccaa gtgctttggc 4680

ctggaggaca agctcgatac cgtcatcgag ctgaaggctc tcgattccac ttactccatt 4740

ccatttccca atccaatcac ctacggagcc gtcattcgtc accatttgga gatctctggt 4800

cctgtgtcgc gacagttctt tctgtccatt gccggatttg ctcccgacga agagaccaaa 4860

aagtccttca ctcgaatcgg tggcgacaag caagagttcg ccagcaaggt cacccgtcga 4920

aagttcaaca ttgccgatgc tcttctgttt gcctccaaca atcgaccctg gtccgacgtt 4980

cccttcgagt tccttatcga gaacgtccag catctcactc ctcggtacta ttccatttct 5040

tcgtcctctc tcagcgagaa gcagaccatc aacgttactg ctgtggtcga agccgaggaa 5100

gaggccgatg gacgacccgt tactggtgtc gttaccaacc tgctcaagaa catcgagatt 5160

gaacagaaca agactggcga gacaccaatg gtccactacg acctcaatgg tcccagaggc 5220

aagttctcca agtttcgact gcccgtgcac gtcagacgat ccaacttcaa acttcccaag 5280

aactctacta cccctgtcat cctgattggt ccaggcaccg gtgttgctcc cctgcgaggc 5340

tttgtccggg agcgagtgca gcaagtcaag aacggagtca acgttggtaa gactgtgctg 5400

ttctacggct gtcgaaattc cgaacaggac tttctctaca aacaggagtg gagcgagtat 5460

gcctccgtcc tgggagagaa cttcgaaatg ttcaacgcct tttctcgaca ggaccctacc 5520

aagaaagtgt acgttcaaga caagatcctc gagaactctg ctcttgtcga cgagctcctg 5580

tccagcggtg caattatcta cgtttgcgga gatgcctctc gaatggctcg agacgtgcag 5640

gctgcaattg ccaagatcgt tgccaagtcc cgagacatcc acgaggacaa ggctgccgag 5700

ctggtcaagt cttggaaggt gcagaaccga taccaggagg atgtctggta agcggccgca 5760

tgagaagata aatatataaa tacattgaga tattaaatgc gctagattag agagcctcat 5820

actgctcgga gagaagccaa gacgagtact caaaggggat tacaccatcc atatccacag 5880

acacaagctg gggaaaggtt ctatatacac tttccggaat accgtagttt ccgatgttat 5940

caatgggggc agccaggatt tcaggcactt cggtgtctcg gggtgaaatg gcgttcttgg 6000

cctccatcaa gtcgtaccat gtcttcattt gcctgtcaaa gtaaaacaga agcagatgaa 6060

gaatgaactt gaagtgaagg aatttaaatg taacgaaact gaaatttgac cagatattgt 6120

gtccgcggtg gagctccagc ttttgttccc tttagtgagg gttaatttcg agcttggcgt 6180

aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaagc ttccacacaa 6240

cgtacgttga ttgaggtgga gccagatggg ctattgtttc atatatagac tggcagccac 6300

ctctttggcc cagcatgttt gtatacctgg aagggaaaac taaagaagct ggctagttta 6360

gtttgattat tatagtagat gtcctaatca ctagagatta gaatgtcttg gcgatgatta 6420

gtcgtcgtcc cctgtatcat gtctagacca actgtgtcat gaagttggtg ctggtgtttt 6480

acctgtgtac tacaagtagg tgtcctagat ctagtgtaca gagccgttta gacccatgtg 6540

gacttcacca ttaacgatgg aaaatgttca ttatatgaca gtatattaca atggacttgc 6600

tccatttctt ccttgcatca catgttctcc acctccatag ttgatcaaca catcatagta 6660

gctaaggctg ctgctctccc actacagtcc accacaagtt aagtagcacc gtcagtacag 6720

ctaaaagtac acgtctagta cgtttcataa ctagtcaagt agcccctatt acagatatca 6780

gcactatcac gcacgagttt ttctctgtgc tatctaatca acttgccaag tattcggaga 6840

agatacactt tcttggcatc aggtatacga gggagcctat cagatgaaaa agggtatatt 6900

ggatccattc atatccacct acacgttgtc ataatctcct cattcacgtg attcatttcg 6960

tgacactagt ttctcacttt cccccccgca cctatagtca acttggcgga cacgctactt 7020

gtagctgacg ttgatttata gacccaatca aagcgggtta tcggtcaggt agcacttatc 7080

attcatcgtt catactacga tgagcaatct cgggcatgtc cggaaaagtg tcgggcgcgc 7140

cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 7200

tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 7260

gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 7320

atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 7380

ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 7440

cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 7500

tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 7560

gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 7620

aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 7680

tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 7740

aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 7800

aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 7860

ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 7920

ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 7980

atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 8040

atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 8100

tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 8160

gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 8220

tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 8280

gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 8340

cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 8400

gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 8460

atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 8520

aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 8580

atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 8640

aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 8700

aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 8760

gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 8820

gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 8880

gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 8940

ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 9000

ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 9060

atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 9120

gtgccacctg atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 9180

gaaattgtaa gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca 9240

ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag 9300

atagggttga gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc 9360

aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc 9420

taatcaagtt ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc 9480

ccccgattta gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa 9540

gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc 9600

acacccgccg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca 9660

actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 9720

gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 9780

aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggc ccgacgtcgc 9840

atgcattccg acagcagcga ctgggcacca tgatcaagcg aaacaccttc ccccagctgc 9900

cctggcaaac catcaagaac cctactttca tcaagtgcaa gaacggttct actcttctca 9960

cctccggtgt ctacggctgg tgccgaaagc ctaactacac cgctgatttc atcatgtgcc 10020

tcacctgggc tctcatgtgc ggtgttgctt ctcccctgcc ttacttctac ccggtcttct 10080

tcttcctggt gctcatccac cgagcttacc gagactttga gcgactggag cgaaagtacg 10140

gtgaggacta ccaggagttc aagcgacagg tcccttggat cttcatccct tatgttttct 10200

aaacgataag cttagtgagc gaatggtgag gttacttaat tgagtggcca gcctatggga 10260

ttgtataaca gacagtcaat atattactga aaagactgaa cagccagacg gagtgaggtt 10320

gtgagtgaat cgtagagggc ggctattaca gcaagtctac tctacagtgt actaacacag 10380

cagagaacaa atacaggtgt gcattcggct atctgagaat tagttggaga gctcgagacc 10440

ctcggcgata aactgctcct cggttttgtg tccatacttg tacggaccat tgtaatgggg 10500

caagtcgttg agttctcgtc gtccgacgtt cagagcacag aaaccaatgt aatcaatgta 10560

gcagagatgg ttctgcaaaa gattgatttg tgcgagcagg ttaattaact ttggccggaa 10620

ttcctttacc tgcaggataa cttcgtataa tgtatgctat acgaagttat gatctctctc 10680

ttgagctttt ccataacaag ttcttctgcc tccaggaagt ccatgggtgg tttgatcatg 10740

gttttggtgt agtggtagtg cagtggtggt attgtgactg gggatgtagt tgagaataag 10800

tcatacacaa gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc 10860

actgtaccca gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg 10920

cggatacaca ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat 10980

acaagctgaa caagcgctcc atacttgcac gctctctata tacacagtta aattacatat 11040

ccatagtcta acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat 11100

cgcttggcct cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg 11160

atatccgttc cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct 11220

cccttgtcgt caagacccac cccgggggtc agaataagcc agtcctcaga gtcgccctta 11280

ggtcggttct gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg 11340

gtctgcttgg agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg 11400

agcagacctc tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag 11460

ttctcgtagt cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct 11520

cgcaggccag caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac 11580

tcggcgattc ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt 11640

ctgtcctcga acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg 11700

ccggcgtagg tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt 11760

ccgaccttat cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac 11820

aggttggttt tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg 11880

acgttagctc gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt 11940

tagtctgcag aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa 12000

tagttacgag ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta 12060

gaaagaacgt caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga 12120

aagccagcaa tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct 12180

gtcagaccca cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag 12240

ttggagtcgt actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgcgataa 12300

cttcgtataa tgtatgctat acgaagttat cgtacgatag ttagtagaca acaat 12355

<210> 83

<211> 1557

<212> DNA

<213> 人工序列

<220>

<223> CtCYPs(52A17)

<400> 83

atggccatcg agcagctgct cgagtactgg tacgtcgttg tgcccgtcct gtacattatc 60

aagcagctcc ttgcctacac caagactcga gtgctgatga aaaagctcgg agccgctccc 120

gtcaccaaca agctgtacga caacgccttc ggtatcgtca acggctggaa ggctcttcag 180

ttcaagaaag agggccgagc tcaggaatac aacgactaca agttcgatca ctccaagaat 240

ccttctgtgg gaacctacgt ctccattctg tttggcactc gaatcgtggt taccaaggat 300

cccgagaaca tcaaggccat tctcgcaacc cagttcggag acttttcgct gggcaagcga 360

cacactctct tcaagccctt gctgggagac ggtatcttca cactcgatgg agaaggctgg 420

aagcattcca gagctatgct gcgacctcag tttgcccgag agcaagttgc tcacgtcacc 480

agcctcgaac cacacttcca gctgctcaag aaacatatcc tcaagcacaa gggcgagtac 540

ttcgacattc aggagctgtt ctttcgattc accgtggact ctgccacgga gtttctgttc 600

ggcgagtccg ttcactctct caaggacgag tcgattggaa tcaaccagga cgatatcgac 660

ttcgctggtc ggaaggactt tgccgagtcc ttcaacaagg cacaggaata cttggccatt 720

cgaactctgg tgcagacctt ctactggctc gtcaacaaca aggagtttcg agactgcacc 780

aagctggttc acaagttcac caactactat gtccagaagg ctctcgatgc atctcccgag 840

gaacttgaga agcaaagcgg ctacgtgttc ctgtacgagc ttgtcaagca gaccagagat 900

cccaacgtgc tgcgagacca gtccctcaac atcttgctgg ccggacgaga caccactgct 960

ggcctcctgt cgtttgcagt cttcgagttg gctcgtcatc ccgagatctg ggccaagctg 1020

cgagaggaaa tcgagcaaca gttcggactt ggcgaggact ctcgtgtcga agagattacc 1080

ttcgagagcc tcaagcgatg cgagtacctc aaggcctttc tcaacgaaac cctgcggatc 1140

tacccttccg ttcctcgaaa cttcagaatc gctaccaaga acacaaccct tccccgaggc 1200

ggtggatcgg acggtacttc tccaatcctc attcagaagg gcgaggccgt gtcctacggt 1260

atcaattcta ctcatctgga tcctgtctat tacggacccg acgctgccga gtttcgaccc 1320

gagcgatggt tcgaaccttc gaccaaaaag ctcggctggg cctaccttcc cttcaacgga 1380

ggtccacgaa tctgtctggg ccaacagttt gccctcaccg aggctggcta cgtgctggtc 1440

agactcgttc aggagttctc ccacgtccga tccgatcccg acgaggtgta ccctcccaag 1500

cgacttacaa acctgaccat gtgtctccag gacggtgcca ttgtcaagtt cgactaa 1557

<210> 84

<211> 518

<212> PRT

<213> 人工序列

<220>

<223> CtCYPs(52A17)蛋白质

<400> 84

Met Ala Ile Glu Gln Leu Leu Glu Tyr Trp Tyr Val Val Val Pro Val

1 5 10 15

Leu Tyr Ile Ile Lys Gln Leu Leu Ala Tyr Thr Lys Thr Arg Val Leu

20 25 30

Met Lys Lys Leu Gly Ala Ala Pro Val Thr Asn Lys Leu Tyr Asp Asn

35 40 45

Ala Phe Gly Ile Val Asn Gly Trp Lys Ala Leu Gln Phe Lys Lys Glu

50 55 60

Gly Arg Ala Gln Glu Tyr Asn Asp Tyr Lys Phe Asp His Ser Lys Asn

65 70 75 80

Pro Ser Val Gly Thr Tyr Val Ser Ile Leu Phe Gly Thr Arg Ile Val

85 90 95

Val Thr Lys Asp Pro Glu Asn Ile Lys Ala Ile Leu Ala Thr Gln Phe

100 105 110

Gly Asp Phe Ser Leu Gly Lys Arg His Thr Leu Phe Lys Pro Leu Leu

115 120 125

Gly Asp Gly Ile Phe Thr Leu Asp Gly Glu Gly Trp Lys His Ser Arg

130 135 140

Ala Met Leu Arg Pro Gln Phe Ala Arg Glu Gln Val Ala His Val Thr

145 150 155 160

Ser Leu Glu Pro His Phe Gln Leu Leu Lys Lys His Ile Leu Lys His

165 170 175

Lys Gly Glu Tyr Phe Asp Ile Gln Glu Leu Phe Phe Arg Phe Thr Val

180 185 190

Asp Ser Ala Thr Glu Phe Leu Phe Gly Glu Ser Val His Ser Leu Lys

195 200 205

Asp Glu Ser Ile Gly Ile Asn Gln Asp Asp Ile Asp Phe Ala Gly Arg

210 215 220

Lys Asp Phe Ala Glu Ser Phe Asn Lys Ala Gln Glu Tyr Leu Ala Ile

225 230 235 240

Arg Thr Leu Val Gln Thr Phe Tyr Trp Leu Val Asn Asn Lys Glu Phe

245 250 255

Arg Asp Cys Thr Lys Leu Val His Lys Phe Thr Asn Tyr Tyr Val Gln

260 265 270

Lys Ala Leu Asp Ala Ser Pro Glu Glu Leu Glu Lys Gln Ser Gly Tyr

275 280 285

Val Phe Leu Tyr Glu Leu Val Lys Gln Thr Arg Asp Pro Asn Val Leu

290 295 300

Arg Asp Gln Ser Leu Asn Ile Leu Leu Ala Gly Arg Asp Thr Thr Ala

305 310 315 320

Gly Leu Leu Ser Phe Ala Val Phe Glu Leu Ala Arg His Pro Glu Ile

325 330 335

Trp Ala Lys Leu Arg Glu Glu Ile Glu Gln Gln Phe Gly Leu Gly Glu

340 345 350

Asp Ser Arg Val Glu Glu Ile Thr Phe Glu Ser Leu Lys Arg Cys Glu

355 360 365

Tyr Leu Lys Ala Phe Leu Asn Glu Thr Leu Arg Ile Tyr Pro Ser Val

370 375 380

Pro Arg Asn Phe Arg Ile Ala Thr Lys Asn Thr Thr Leu Pro Arg Gly

385 390 395 400

Gly Gly Ser Asp Gly Thr Ser Pro Ile Leu Ile Gln Lys Gly Glu Ala

405 410 415

Val Ser Tyr Gly Ile Asn Ser Thr His Leu Asp Pro Val Tyr Tyr Gly

420 425 430

Pro Asp Ala Ala Glu Phe Arg Pro Glu Arg Trp Phe Glu Pro Ser Thr

435 440 445

Lys Lys Leu Gly Trp Ala Tyr Leu Pro Phe Asn Gly Gly Pro Arg Ile

450 455 460

Cys Leu Gly Gln Gln Phe Ala Leu Thr Glu Ala Gly Tyr Val Leu Val

465 470 475 480

Arg Leu Val Gln Glu Phe Ser His Val Arg Ser Asp Pro Asp Glu Val

485 490 495

Tyr Pro Pro Lys Arg Leu Thr Asn Leu Thr Met Cys Leu Gln Asp Gly

500 505 510

Ala Ile Val Lys Phe Asp

515

<210> 85

<211> 2043

<212> DNA

<213> 人工序列

<220>

<223> CtCPRs (CPR)

<400> 85

atggccctgg acaagctcga cctgtacgtc atcattaccc tcgtggttgc tatcgccgct 60

tacttcgcca agaaccagtt cctggatcag caacaggaca ctggctttct caacaccgac 120

tccggagatg gcaactctcg agacatcctt caggctctca agaaaaacaa taagaacacc 180

ctgcttctct tcggttccca gactggcaca gccgaggact acgccaacaa gttgtcgcga 240

gagctgcact cccgatttgg cttgaagact atggtcgcag atttcgccga ttacgacttc 300

gagaactttg gagacattac cgaggacatc ctcgtgttct ttatcgttgc tacctacggc 360

gaaggcgagc ccaccgacaa tgccgacgag tttcacactt ggctgaccga ggaagcagat 420

accctgtcta cactcaagta taccgtcttc ggtctgggta actccaccta cgagtttttc 480

aacgccatcg gtcgaaagtt cgacagactg ctcggagaga agggtggcga ccgatttgcc 540

gagtacggcg aaggagacga tggtactggc actctcgacg aggatttcct ggcttggaag 600

gacaacgtgt tcgattctct caagaacgac ctgaatttcg aagagaagga gctcaaatac 660

gaacccaacg tcaagttgac cgagcgggac gatctgtctg gcaacgatcc cgacgtttcg 720

ctgggcgagc caaacgtcaa gtacatcaag tccgagggtg ttgaccttac caagggacct 780

ttcgatcaca ctcatccctt tctggcccga atcgtcaaga ccaaagagct ctttacttcc 840

gaggacagac actgcgtgca cgtcgagttc gacattagcg agtccaacct caagtatact 900

accggagatc atcttgctat ctggccctcc aattcggacg agaacatcaa gcagtttgcc 960

aagtgctttg gcctggagga caagctcgat accgtcatcg agctgaaggc tctcgattcc 1020

acttactcca ttccatttcc caatccaatc acctacggag ccgtcattcg tcaccatttg 1080

gagatctctg gtcctgtgtc gcgacagttc tttctgtcca ttgccggatt tgctcccgac 1140

gaagagacca aaaagtcctt cactcgaatc ggtggcgaca agcaagagtt cgccagcaag 1200

gtcacccgtc gaaagttcaa cattgccgat gctcttctgt ttgcctccaa caatcgaccc 1260

tggtccgacg ttcccttcga gttccttatc gagaacgtcc agcatctcac tcctcggtac 1320

tattccattt cttcgtcctc tctcagcgag aagcagacca tcaacgttac tgctgtggtc 1380

gaagccgagg aagaggccga tggacgaccc gttactggtg tcgttaccaa cctgctcaag 1440

aacatcgaga ttgaacagaa caagactggc gagacaccaa tggtccacta cgacctcaat 1500

ggtcccagag gcaagttctc caagtttcga ctgcccgtgc acgtcagacg atccaacttc 1560

aaacttccca agaactctac tacccctgtc atcctgattg gtccaggcac cggtgttgct 1620

cccctgcgag gctttgtccg ggagcgagtg cagcaagtca agaacggagt caacgttggt 1680

aagactgtgc tgttctacgg ctgtcgaaat tccgaacagg actttctcta caaacaggag 1740

tggagcgagt atgcctccgt cctgggagag aacttcgaaa tgttcaacgc cttttctcga 1800

caggacccta ccaagaaagt gtacgttcaa gacaagatcc tcgagaactc tgctcttgtc 1860

gacgagctcc tgtccagcgg tgcaattatc tacgtttgcg gagatgcctc tcgaatggct 1920

cgagacgtgc aggctgcaat tgccaagatc gttgccaagt cccgagacat ccacgaggac 1980

aaggctgccg agctggtcaa gtcttggaag gtgcagaacc gataccagga ggatgtctgg 2040

taa 2043

<210> 86

<211> 680

<212> PRT

<213> 热带假丝酵母

<400> 86

Met Ala Leu Asp Lys Leu Asp Leu Tyr Val Ile Ile Thr Leu Val Val

1 5 10 15

Ala Ile Ala Ala Tyr Phe Ala Lys Asn Gln Phe Leu Asp Gln Gln Gln

20 25 30

Asp Thr Gly Phe Leu Asn Thr Asp Ser Gly Asp Gly Asn Ser Arg Asp

35 40 45

Ile Leu Gln Ala Leu Lys Lys Asn Asn Lys Asn Thr Leu Leu Leu Phe

50 55 60

Gly Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Asn Lys Leu Ser Arg

65 70 75 80

Glu Leu His Ser Arg Phe Gly Leu Lys Thr Met Val Ala Asp Phe Ala

85 90 95

Asp Tyr Asp Phe Glu Asn Phe Gly Asp Ile Thr Glu Asp Ile Leu Val

100 105 110

Phe Phe Ile Val Ala Thr Tyr Gly Glu Gly Glu Pro Thr Asp Asn Ala

115 120 125

Asp Glu Phe His Thr Trp Leu Thr Glu Glu Ala Asp Thr Leu Ser Thr

130 135 140

Leu Lys Tyr Thr Val Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe Phe

145 150 155 160

Asn Ala Ile Gly Arg Lys Phe Asp Arg Leu Leu Gly Glu Lys Gly Gly

165 170 175

Asp Arg Phe Ala Glu Tyr Gly Glu Gly Asp Asp Gly Thr Gly Thr Leu

180 185 190

Asp Glu Asp Phe Leu Ala Trp Lys Asp Asn Val Phe Asp Ser Leu Lys

195 200 205

Asn Asp Leu Asn Phe Glu Glu Lys Glu Leu Lys Tyr Glu Pro Asn Val

210 215 220

Lys Leu Thr Glu Arg Asp Asp Leu Ser Gly Asn Asp Pro Asp Val Ser

225 230 235 240

Leu Gly Glu Pro Asn Val Lys Tyr Ile Lys Ser Glu Gly Val Asp Leu

245 250 255

Thr Lys Gly Pro Phe Asp His Thr His Pro Phe Leu Ala Arg Ile Val

260 265 270

Lys Thr Lys Glu Leu Phe Thr Ser Glu Asp Arg His Cys Val His Val

275 280 285

Glu Phe Asp Ile Ser Glu Ser Asn Leu Lys Tyr Thr Thr Gly Asp His

290 295 300

Leu Ala Ile Trp Pro Ser Asn Ser Asp Glu Asn Ile Lys Gln Phe Ala

305 310 315 320

Lys Cys Phe Gly Leu Glu Asp Lys Leu Asp Thr Val Ile Glu Leu Lys

325 330 335

Ala Leu Asp Ser Thr Tyr Ser Ile Pro Phe Pro Asn Pro Ile Thr Tyr

340 345 350

Gly Ala Val Ile Arg His His Leu Glu Ile Ser Gly Pro Val Ser Arg

355 360 365

Gln Phe Phe Leu Ser Ile Ala Gly Phe Ala Pro Asp Glu Glu Thr Lys

370 375 380

Lys Ser Phe Thr Arg Ile Gly Gly Asp Lys Gln Glu Phe Ala Ser Lys

385 390 395 400

Val Thr Arg Arg Lys Phe Asn Ile Ala Asp Ala Leu Leu Phe Ala Ser

405 410 415

Asn Asn Arg Pro Trp Ser Asp Val Pro Phe Glu Phe Leu Ile Glu Asn

420 425 430

Val Gln His Leu Thr Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Ser Leu

435 440 445

Ser Glu Lys Gln Thr Ile Asn Val Thr Ala Val Val Glu Ala Glu Glu

450 455 460

Glu Ala Asp Gly Arg Pro Val Thr Gly Val Val Thr Asn Leu Leu Lys

465 470 475 480

Asn Ile Glu Ile Glu Gln Asn Lys Thr Gly Glu Thr Pro Met Val His

485 490 495

Tyr Asp Leu Asn Gly Pro Arg Gly Lys Phe Ser Lys Phe Arg Leu Pro

500 505 510

Val His Val Arg Arg Ser Asn Phe Lys Leu Pro Lys Asn Ser Thr Thr

515 520 525

Pro Val Ile Leu Ile Gly Pro Gly Thr Gly Val Ala Pro Leu Arg Gly

530 535 540

Phe Val Arg Glu Arg Val Gln Gln Val Lys Asn Gly Val Asn Val Gly

545 550 555 560

Lys Thr Val Leu Phe Tyr Gly Cys Arg Asn Ser Glu Gln Asp Phe Leu

565 570 575

Tyr Lys Gln Glu Trp Ser Glu Tyr Ala Ser Val Leu Gly Glu Asn Phe

580 585 590

Glu Met Phe Asn Ala Phe Ser Arg Gln Asp Pro Thr Lys Lys Val Tyr

595 600 605

Val Gln Asp Lys Ile Leu Glu Asn Ser Ala Leu Val Asp Glu Leu Leu

610 615 620

Ser Ser Gly Ala Ile Ile Tyr Val Cys Gly Asp Ala Ser Arg Met Ala

625 630 635 640

Arg Asp Val Gln Ala Ala Ile Ala Lys Ile Val Ala Lys Ser Arg Asp

645 650 655

Ile His Glu Asp Lys Ala Ala Glu Leu Val Lys Ser Trp Lys Val Gln

660 665 670

Asn Arg Tyr Gln Glu Asp Val Trp

675 680

<210> 87

<211> 12573

<212> DNA

<213> 人工序列

<220>

<223> pZKADn-C2F1U质粒

<400> 87

cgatagtgta cgcagtacta tagaggaaca attgccccgg agaagacggc caggccgcct 60

agatgacaaa ttcaacaact cacagctgac tttctgccat tgccactagg ggggggcctt 120

tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta 180

gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa 240

tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg 300

catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag 360

gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa 420

cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg 480

acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt 540

gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg 600

acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca 660

ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa 720

gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct 780

tttttccttt ctttccccac agattcgaaa tctaaactac acatcacacc atggcctccc 840

accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct gttctccacg 900

agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag gacaagatcg 960

aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga cagtgtgcca 1020

agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac ttgaccactg 1080

ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg atcagagaca 1140

tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca ctgactgcca 1200

agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac aagctcggaa 1260

ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc cagattcaag 1320

actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac gagggacatg 1380

aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt gcaggcgtgg 1440

tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag ggcaagtact 1500

ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg ttcgaaagcg 1560

gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct acttttggtg 1620

gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt cgaaaggagt 1680

ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat tgcatggact 1740

acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct gcaaatgccg 1800

tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag cagaacaccg 1860

gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt atcaagcagg 1920

gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc atggagcagg 1980

tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc tgcagagata 2040

ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg tccggtggct 2100

ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac attggagcca 2160

acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag gtggacttcg 2220

aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat ctggacggca 2280

aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact gctcccttct 2340

atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag cagaccgtgc 2400

ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac aaacagaagc 2460

cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc atcctgcagg 2520

gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt ctgtctcccc 2580

aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc atcaaggacg 2640

aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc tacggctcgc 2700

cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga cccggatacg 2760

gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt gcagacgcct 2820

ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc tttgcacgac 2880

acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa gcggccgcat 2940

ggagcgtgtg ttctgagtcg atgttttcta tggagttgtg agtgttagta gacatgatgg 3000

gtttatatat gatgaatgaa tagatgtgat tttgatttgc acgatggaat tgagaacttt 3060

gtaaacgtac atgggaatgt atgaatgtgg gggttttgtg actggataac tgacggtcag 3120

tggacgccgt tgttcaaata tccaagagat gcgagaaact ttgggtcaag tgaacatgtc 3180

ctctctgttc aagtaaacca tcaactatgg gtagtatatt tagtaaggac aagagttgag 3240

attctttgga gtcctagaaa cgtattttcg cgttccaaga tcaaattagt agagtaatac 3300

gggcacggga atccattcat agtctcaagt ttaaaccacg ccaactgata tccccttacg 3360

ttaccccctc atcacctggt gaggcaaaac tgtaaggtga aagctaaaaa tgacatctca 3420

gctgcacgaa ggaccggggc ttaaaagacg ggctggtgct tgtgatttaa aactggacaa 3480

atctcagctt gcttgaaatt ttggtctcca actgtttccg agcgaatcgc acacaaaccg 3540

ggcttctctc tgcagaccac gcccccgaaa ctctttctcc caccaccacc aacactccct 3600

ttccattccc acaccgttcc tctctcatcc ttgcgcaatc atcttcgtct gcgacatatt 3660

gtacgacata cagtaccacg gaacgtttca gaccgtcgac gtgaacacat cttaggaaca 3720

gcaacctgag ctacagaaat ctatctatag gcggataaaa aaacgcaccc actgctcgtc 3780

ctccttgctc ctcgaaaccg actcctctac acacgtcaaa tccgaggttg aaatcttccc 3840

cacatttggc agccaaacca gcacatccca gcaacctcgc acagcgccga aatcgacctg 3900

tcgacttggc cacaaaaaaa agcaccggct ctgcaacagt tctcacgacc aattacgtac 3960

aagtacgaaa tcgttcgtgg accgtgactg ataagctccc actttttctt ctaacaacag 4020

gcaacagaca agtcacacaa aacaaaagcc atggccaagt cctacaagct gcccaagcct 4080

tccaagatcg ctcccatcat tcgaggcaag acctctgcca agaccaaagg ctccactcag 4140

cctcccgagt ctccacctgc ctcggctaag atcacagctc cccagctcga acccgtcgag 4200

cccaccagcg actccgagat tccttctacc aaggtctccg ttcgacgtac atcgaccact 4260

tccagcaaga ccatcacgga cgattccatc tctgccactt ccaccgacca gatgaagtcg 4320

agcaccaacg aagccgagat tccaaacccc aagccagagt ccgtggttgc ccctatgacc 4380

aagcccgtcg aggacgataa actcgaggac cacaccaagc tggagactgc cgaatcgtac 4440

atcaacgttc agaaggaagc tgcaattcct ggcgagacca agagcgtcgt ttcctcgaag 4500

actgcttctg tgctcgagta cacacctctt tccgagatct ctggcggagt caagaaagtg 4560

gtcgacggtt tccacaccgg caagacgcat cccctggagt tcagactcaa gcagcttcga 4620

aacctgtact ttgctatgaa ggacaatcag gaggccatct gcgaagcgct tgccaaggac 4680

tttcaccgag ccccttccga gactcgaaac tacgagctgg tcacaggtct caacgagctg 4740

ctctacacca tgactcaact gcacaagtgg tccaagcccc ttcctgtgga cgcgctgccc 4800

atcaacctca agaccaatcc cgtctacatc gagcggattc cagtcggaac cgttctcgtc 4860

atttctgcct tcaactatcc cttctttgtc tccgtgtctc ccatcgcagg tgctattgcc 4920

gcaggcaact ccgtcgtgtt caagccgtcg gagcttacac cccactttac caagctgttc 4980

acagagttgc tcaccaaggc tctggatccc gagatcttct acgtggtcaa cggtgccgtt 5040

tccgagacta ccgaactgct caaccagaag ttcgacaaga tcgtctacac tggcagcgac 5100

attgtcggca agatcattgc caagaaagca gcggagaccc ttactccagt catcttggag 5160

ctcggtggca agtctcctgc tttcgtgctg gacgatgtct cggacaagga tcttcccgtc 5220

atcgctcgac gtatcgcctg gggacgatac gccaacgctg gtcaaacctg cattggcgtc 5280

gactacgttc tcgtggccga gtccaagcac gagaagttca ttcaggctct gcggaatgtc 5340

atcgaaaacg agttctttcc caacatcgac cagaactcca actttaccca catgatccac 5400

gagcgagcct tcctcaagat gaaaaagatc ctggatacca ctgccggaga gatcattatc 5460

ggtggcaagc tcgacagcga gtccaactac gtgtctccca ccgtcatcga caatgcttcg 5520

tgggacgatt cctcgatgaa ggaggaaatc ttcggtccta ttcttcccat cattacttac 5580

accgacctca agcaggcctg caacgaggtc atttctcatc atgacactcc ccttgctcag 5640

tacatcttca cgtctggctc cacctcgcga aagtacaact ctcagatcaa cacaatctcc 5700

accatgattc gatcgggtgg actggtcatc aacgacgttc tcatgcatat ctcccttcat 5760

aacgctccct tcggtggcgt gggaaagtcc ggctacggtg cctatcacgg agagttctcc 5820

tacagagcct ttacccacga gcgaaccgtc ctcgagcagc atctgtggaa cgattggatt 5880

atcaactctc ggtatcctcc ctactccaac aagaaagaac gactggtggc ctccagccag 5940

tccaactacg gtggcagagt ctggtttggt cgaaagggcg acgttcgaat cgagggaccc 6000

actaccttct tcagcgcctg gaccaacgtg ctcggcgttg ctgccgtcgt tcgagacttc 6060

atcggtgctt ccatgtaagc ggccgcatga gaagataaat atataaatac attgagatat 6120

taaatgcgct agattagaga gcctcatact gctcggagag aagccaagac gagtactcaa 6180

aggggattac accatccata tccacagaca caagctgggg aaaggttcta tatacacttt 6240

ccggaatacc gtagtttccg atgttatcaa tgggggcagc caggatttca ggcacttcgg 6300

tgtctcgggg tgaaatggcg ttcttggcct ccatcaagtc gtaccatgtc ttcatttgcc 6360

tgtcaaagta aaacagaagc agatgaagaa tgaacttgaa gtgaaggaat ttaaatgtaa 6420

cgaaactgaa atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt 6480

agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 6540

gttatccgct cacaagcttc cacacaacgt acgaacgcac ggtatcggag catcggatac 6600

cccacattga gccaacctac tttgtagtgt acatactgta gagaagaggg acgcttcgac 6660

atgattggcc gatgtgggca tgtagaaaca cgatatatgg tgcttactaa tggacacttg 6720

cacaaccatt tctcttctag ggtaacctcg acagtgacag ccgttttttc tgcgctagcg 6780

tgtcgtcgta tttttggttt cgacatgtta agatttgtgg ggcaatcgag cgacattaag 6840

gtgcatcgga tcatcggccc aagggagagt cactggagtc tcgtagggtg gaggaaaaga 6900

gcaatttggg acgatttggg gcgatttgaa gacggattgg ggcaggtgtt tgtcacgtga 6960

ctgtggtatt actattacta atcgtcattg ttcgaaagtc ctgtcaattg tatcactttg 7020

gtgggtctac caaaacactg gtcaaatcta cgccacatga aaatataaag tttcacatta 7080

gccacattga ggggtaccct tagttggaat ctacaaggag ggatgcagtg aaaaatgttc 7140

ctttgatcct tcagagatga aaatgccatt gaccaatcac agcgggttta aagagtggcg 7200

aaaagagccc cttttttgca ccggttggcc cagcagccac gtgactggcc ccttccccat 7260

cccactcaac tgttgaggag gtgggatgcc aagatgcacc gtcaatgtac ttccgtgtat 7320

ccttctgcaa ttgatccgag ataggcgcgc cagctgcatt aatgaatcgg ccaacgcgcg 7380

gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 7440

tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 7500

acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 7560

aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 7620

cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 7680

gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 7740

tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7800

tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7860

cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7920

gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7980

ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 8040

ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 8100

ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 8160

agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 8220

aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 8280

atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 8340

tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 8400

tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 8460

tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 8520

gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 8580

tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 8640

ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 8700

gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 8760

aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 8820

ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 8880

tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 8940

ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 9000

aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 9060

ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 9120

ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 9180

agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 9240

tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 9300

ataggggttc cgcgcacatt tccccgaaaa gtgccacctg atgcggtgtg aaataccgca 9360

cagatgcgta aggagaaaat accgcatcag gaaattgtaa gcgttaatat tttgttaaaa 9420

ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 9480

atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 9540

aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 9600

ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 9660

aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 9720

gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 9780

agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 9840

ggcgcgtcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 9900

cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 9960

cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact 10020

cactataggg cgaattgggc ccgacgtcgc atgctacaag tatcgcacca tacttttgct 10080

gacggcgcgc cttcttgcag tgatataatc ggtttcttgg agctgatggg gtgagcatca 10140

tacaagtatg agtacgagaa gtcgcacttg tactccaagt acaaatgccc ggaatggcag 10200

acacacaagt cctacgggtg ttcagagact actgactgga gattgcaact acaagtactg 10260

tacacacagt acaacacaca agttaactca tcattcataa ttatcataaa ctagacggcc 10320

aaaaagtcgt ggccgctcct cagcgtcaat agccgcgctt acttggagca gtccagaacg 10380

tatcgaccgg caatcttgcc ctcctccatg agcttgtaga cggattcgag ctcggagaga 10440

ccaacaataa tgatggggga cttgaccagt cctcgggcaa agaactcaat ggcctcctgg 10500

gagtcggctc ggtttccgac gtaagagccc ttgatctgaa tagatcgagc aacctgctgg 10560

aagatgggcg acttgcagac ggcaccggcg ggcagaccga ccagaacaac ggttcccagg 10620

gttcgcacgt actcaacaga ctggttgacg gcaaactcgg agacagacac gttgatgacg 10680

gcgtggggtc cgcccttggt ggcctcctgg acgtccttga ccagatcctt ggacttggca 10740

aagtcgatga agacctcggc gccgagctcc ttgcacatct tctccttgtc agcgccagtg 10800

tcaatggcca gcactcggtt aattaacttt ggccggaatt cctttacctg caggataact 10860

tcgtataatg tatgctatac gaagttatga tctctctctt gagcttttcc ataacaagtt 10920

cttctgcctc caggaagtcc atgggtggtt tgatcatggt tttggtgtag tggtagtgca 10980

gtggtggtat tgtgactggg gatgtagttg agaataagtc atacacaagt cagctttctt 11040

cgagcctcat ataagtataa gtagttcaac gtattagcac tgtacccagc atctccgtat 11100

cgagaaacac aacaacatgc cccattggac agatcatgcg gatacacagg ttgtgcagta 11160

tcatacatac tcgatcagac aggtcgtctg accatcatac aagctgaaca agcgctccat 11220

acttgcacgc tctctatata cacagttaaa ttacatatcc atagtctaac ctctaacagt 11280

taatcttctg gtaagcctcc cagccagcct tctggtatcg cttggcctcc tcaataggat 11340

ctcggttctg gccgtacaga cctcggccga caattatgat atccgttccg gtagacatga 11400

catcctcaac agttcggtac tgctgtccga gagcgtctcc cttgtcgtca agacccaccc 11460

cgggggtcag aataagccag tcctcagagt cgcccttagg tcggttctgg gcaatgaagc 11520

caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag tactcgccag 11580

tggccagaga gcccttgcaa gacagctcgg ccagcatgag cagacctctg gccagcttct 11640

cgttgggaga ggggactagg aactccttgt actgggagtt ctcgtagtca gagacgtcct 11700

ccttcttctg ttcagagaca gtttcctcgg caccagctcg caggccagca atgattccgg 11760

ttccgggtac accgtgggcg ttggtgatat cggaccactc ggcgattcgg tgacaccggt 11820

actggtgctt gacagtgttg ccaatatctg cgaactttct gtcctcgaac aggaagaaac 11880

cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg aagtcgtcaa 11940

tgatgtcgat atgggttttg atcatgcaca cataaggtcc gaccttatcg gcaagctcaa 12000

tgagctcctt ggtggtggta acatccagag aagcacacag gttggttttc ttggctgcca 12060

cgagcttgag cactcgagcg gcaaaggcgg acttgtggac gttagctcga gcttcgtagg 12120

agggcatttt ggtggtgaag aggagactga aataaattta gtctgcagaa ctttttatcg 12180

gaaccttatc tggggcagtg aagtatatgt tatggtaata gttacgagtt agttgaactt 12240

atagatagac tggactatac ggctatcggt ccaaattaga aagaacgtca atggctctct 12300

gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa gccagcaatg acgttgcagc 12360

tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt cagacccaca gcctccaacg 12420

aagaatgtat cgtcaaagtg atccaagcac actcatagtt ggagtcgtac tccaaaggcg 12480

gcaatgacga gtcagacaga tactcgtcga cgcgataact tcgtataatg tatgctatac 12540

gaagttatcg tacgatagtt agtagacaac aat 12573

<210> 88

<211> 2100

<212> DNA

<213> 人工序列

<220>

<223> CcFAO1s (FAO)

<400> 88

atggcctccc accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct 60

gttctccacg agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag 120

gacaagatcg aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga 180

cagtgtgcca agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac 240

ttgaccactg ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg 300

atcagagaca tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca 360

ctgactgcca agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac 420

aagctcggaa ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc 480

cagattcaag actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac 540

gagggacatg aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt 600

gcaggcgtgg tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag 660

ggcaagtact ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg 720

ttcgaaagcg gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct 780

acttttggtg gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt 840

cgaaaggagt ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat 900

tgcatggact acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct 960

gcaaatgccg tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag 1020

cagaacaccg gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt 1080

atcaagcagg gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc 1140

atggagcagg tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc 1200

tgcagagata ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg 1260

tccggtggct ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac 1320

attggagcca acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag 1380

gtggacttcg aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat 1440

ctggacggca aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact 1500

gctcccttct atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag 1560

cagaccgtgc ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac 1620

aaacagaagc cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc 1680

atcctgcagg gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt 1740

ctgtctcccc aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc 1800

atcaaggacg aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc 1860

tacggctcgc cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga 1920

cccggatacg gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt 1980

gcagacgcct ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc 2040

tttgcacgac acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa 2100

<210> 89

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> CcFAO1s (FAO)蛋白质

<400> 89

Met Ala Ser His Gln Val Glu Asp His Asp Leu Asp Val Phe Cys Leu

1 5 10 15

Leu Ala Asp Ala Val Leu His Glu Ile Pro Pro Ser Glu Ile Val Glu

20 25 30

Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Ile Glu Glu Tyr Leu Thr

35 40 45

Gly Phe Ser Arg Pro Ser Ala Val Pro Gln Phe Arg Gln Cys Ala Lys

50 55 60

Lys Leu Ile Asn Arg Gly Ser Glu Leu Ser Ile Lys Leu Phe Leu Tyr

65 70 75 80

Leu Thr Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn

85 90 95

Ser Leu Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu

100 105 110

Leu Arg Ser Trp Arg Asp Ser Pro Leu Thr Ala Lys Arg Arg Leu Phe

115 120 125

Arg Val Tyr Ala Ser Phe Thr Leu Ser Thr Phe Asn Lys Leu Gly Thr

130 135 140

Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr

145 150 155 160

Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Ser Phe Met Glu

165 170 175

Lys Leu Lys His Glu Gly His Glu Leu Phe Leu Pro Asp Ile Asp Val

180 185 190

Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu

195 200 205

Thr Glu Ser Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe

210 215 220

Ala Ser Glu Glu Leu Cys Met Thr Asp Leu Asp Gly Asn Glu Ala Leu

225 230 235 240

Phe Glu Ser Gly Gly Thr Ile Pro Ser Thr Asn Gln Gln Leu Phe Met

245 250 255

Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala

260 265 270

Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asp Phe

275 280 285

Gly Leu Asp Phe Val Ala Thr Gln Gln Tyr Asp Asp Cys Met Asp Tyr

290 295 300

Val Trp Lys Lys Met Gly Ala Ser Thr Glu His Ile Glu His Ser Ala

305 310 315 320

Ala Asn Ala Val Ile Met Asp Gly Ala Ala Lys Leu Gly Tyr Ala His

325 330 335

Arg Ala Leu Glu Gln Asn Thr Gly Gly His Val His Asp Cys Gly Met

340 345 350

Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Gly Val Asn Cys

355 360 365

Trp Phe Arg Glu Pro Ser Glu Lys Gly Ser Lys Phe Met Glu Gln Val

370 375 380

Val Val Glu Lys Ile Leu Gln His Lys Gly Lys Ala Thr Gly Ile Leu

385 390 395 400

Cys Arg Asp Thr Glu Ser Gly Ile Lys Phe Lys Ile Thr Gly Pro Lys

405 410 415

Lys Tyr Val Val Ser Gly Gly Ser Leu Gln Thr Pro Val Leu Leu Gln

420 425 430

Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His

435 440 445

Pro Val Ser Val Ala Leu Gly Asp Phe Gly Asn Glu Val Asp Phe Glu

450 455 460

Ala Tyr Lys Arg Pro Leu Met Thr Ala Val Cys Asn Ala Val Asp Asp

465 470 475 480

Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Ile Leu His Ala

485 490 495

Pro Tyr Val Thr Ala Pro Phe Tyr Pro Trp Gln Ser Gly Ala Gln Ala

500 505 510

Arg Lys Asn Leu Leu Lys Tyr Lys Gln Thr Val Pro Leu Leu Leu Leu

515 520 525

Ser Arg Asp Thr Ser Ser Gly Thr Val Thr Tyr Asp Lys Gln Lys Pro

530 535 540

Asp Val Leu Val Val Asp Tyr Thr Val Asn Lys Phe Asp Arg Asn Ser

545 550 555 560

Ile Leu Gln Gly Phe Leu Val Ala Ser Asp Ile Leu Tyr Ile Glu Gly

565 570 575

Ala Lys Glu Ile Leu Ser Pro Gln Ala Trp Val Pro Thr Phe Lys Ser

580 585 590

Asn Lys Pro Lys His Ala Arg Ser Ile Lys Asp Glu Asp Tyr Val Lys

595 600 605

Trp Arg Glu Thr Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser Pro

610 615 620

Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg Met Ser Gly Lys Gly

625 630 635 640

Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Arg Leu Phe Glu Cys Asn

645 650 655

Asn Val Tyr Val Ala Asp Ala Ser Val Met Pro Thr Ala Ser Gly Val

660 665 670

Asn Pro Met Ile Thr Thr Met Ala Phe Ala Arg His Val Ala Leu Cys

675 680 685

Leu Ala Lys Asp Leu Gln Pro Gln Thr Lys Leu

690 695

<210> 90

<211> 2028

<212> DNA

<213> 人工序列

<220>

<223> CtFALDH2s (FALDH)

<400> 90

atggccaagt cctacaagct gcccaagcct tccaagatcg ctcccatcat tcgaggcaag 60

acctctgcca agaccaaagg ctccactcag cctcccgagt ctccacctgc ctcggctaag 120

atcacagctc cccagctcga acccgtcgag cccaccagcg actccgagat tccttctacc 180

aaggtctccg ttcgacgtac atcgaccact tccagcaaga ccatcacgga cgattccatc 240

tctgccactt ccaccgacca gatgaagtcg agcaccaacg aagccgagat tccaaacccc 300

aagccagagt ccgtggttgc ccctatgacc aagcccgtcg aggacgataa actcgaggac 360

cacaccaagc tggagactgc cgaatcgtac atcaacgttc agaaggaagc tgcaattcct 420

ggcgagacca agagcgtcgt ttcctcgaag actgcttctg tgctcgagta cacacctctt 480

tccgagatct ctggcggagt caagaaagtg gtcgacggtt tccacaccgg caagacgcat 540

cccctggagt tcagactcaa gcagcttcga aacctgtact ttgctatgaa ggacaatcag 600

gaggccatct gcgaagcgct tgccaaggac tttcaccgag ccccttccga gactcgaaac 660

tacgagctgg tcacaggtct caacgagctg ctctacacca tgactcaact gcacaagtgg 720

tccaagcccc ttcctgtgga cgcgctgccc atcaacctca agaccaatcc cgtctacatc 780

gagcggattc cagtcggaac cgttctcgtc atttctgcct tcaactatcc cttctttgtc 840

tccgtgtctc ccatcgcagg tgctattgcc gcaggcaact ccgtcgtgtt caagccgtcg 900

gagcttacac cccactttac caagctgttc acagagttgc tcaccaaggc tctggatccc 960

gagatcttct acgtggtcaa cggtgccgtt tccgagacta ccgaactgct caaccagaag 1020

ttcgacaaga tcgtctacac tggcagcgac attgtcggca agatcattgc caagaaagca 1080

gcggagaccc ttactccagt catcttggag ctcggtggca agtctcctgc tttcgtgctg 1140

gacgatgtct cggacaagga tcttcccgtc atcgctcgac gtatcgcctg gggacgatac 1200

gccaacgctg gtcaaacctg cattggcgtc gactacgttc tcgtggccga gtccaagcac 1260

gagaagttca ttcaggctct gcggaatgtc atcgaaaacg agttctttcc caacatcgac 1320

cagaactcca actttaccca catgatccac gagcgagcct tcctcaagat gaaaaagatc 1380

ctggatacca ctgccggaga gatcattatc ggtggcaagc tcgacagcga gtccaactac 1440

gtgtctccca ccgtcatcga caatgcttcg tgggacgatt cctcgatgaa ggaggaaatc 1500

ttcggtccta ttcttcccat cattacttac accgacctca agcaggcctg caacgaggtc 1560

atttctcatc atgacactcc ccttgctcag tacatcttca cgtctggctc cacctcgcga 1620

aagtacaact ctcagatcaa cacaatctcc accatgattc gatcgggtgg actggtcatc 1680

aacgacgttc tcatgcatat ctcccttcat aacgctccct tcggtggcgt gggaaagtcc 1740

ggctacggtg cctatcacgg agagttctcc tacagagcct ttacccacga gcgaaccgtc 1800

ctcgagcagc atctgtggaa cgattggatt atcaactctc ggtatcctcc ctactccaac 1860

aagaaagaac gactggtggc ctccagccag tccaactacg gtggcagagt ctggtttggt 1920

cgaaagggcg acgttcgaat cgagggaccc actaccttct tcagcgcctg gaccaacgtg 1980

ctcggcgttg ctgccgtcgt tcgagacttc atcggtgctt ccatgtaa 2028

<210> 91

<211> 675

<212> PRT

<213> 热带假丝酵母

<400> 91

Met Ala Lys Ser Tyr Lys Leu Pro Lys Pro Ser Lys Ile Ala Pro Ile

1 5 10 15

Ile Arg Gly Lys Thr Ser Ala Lys Thr Lys Gly Ser Thr Gln Pro Pro

20 25 30

Glu Ser Pro Pro Ala Ser Ala Lys Ile Thr Ala Pro Gln Leu Glu Pro

35 40 45

Val Glu Pro Thr Ser Asp Ser Glu Ile Pro Ser Thr Lys Val Ser Val

50 55 60

Arg Arg Thr Ser Thr Thr Ser Ser Lys Thr Ile Thr Asp Asp Ser Ile

65 70 75 80

Ser Ala Thr Ser Thr Asp Gln Met Lys Ser Ser Thr Asn Glu Ala Glu

85 90 95

Ile Pro Asn Pro Lys Pro Glu Ser Val Val Ala Pro Met Thr Lys Pro

100 105 110

Val Glu Asp Asp Lys Leu Glu Asp His Thr Lys Leu Glu Thr Ala Glu

115 120 125

Ser Tyr Ile Asn Val Gln Lys Glu Ala Ala Ile Pro Gly Glu Thr Lys

130 135 140

Ser Val Val Ser Ser Lys Thr Ala Ser Val Leu Glu Tyr Thr Pro Leu

145 150 155 160

Ser Glu Ile Ser Gly Gly Val Lys Lys Val Val Asp Gly Phe His Thr

165 170 175

Gly Lys Thr His Pro Leu Glu Phe Arg Leu Lys Gln Leu Arg Asn Leu

180 185 190

Tyr Phe Ala Met Lys Asp Asn Gln Glu Ala Ile Cys Glu Ala Leu Ala

195 200 205

Lys Asp Phe His Arg Ala Pro Ser Glu Thr Arg Asn Tyr Glu Leu Val

210 215 220

Thr Gly Leu Asn Glu Leu Leu Tyr Thr Met Thr Gln Leu His Lys Trp

225 230 235 240

Ser Lys Pro Leu Pro Val Asp Ala Leu Pro Ile Asn Leu Lys Thr Asn

245 250 255

Pro Val Tyr Ile Glu Arg Ile Pro Val Gly Thr Val Leu Val Ile Ser

260 265 270

Ala Phe Asn Tyr Pro Phe Phe Val Ser Val Ser Pro Ile Ala Gly Ala

275 280 285

Ile Ala Ala Gly Asn Ser Val Val Phe Lys Pro Ser Glu Leu Thr Pro

290 295 300

His Phe Thr Lys Leu Phe Thr Glu Leu Leu Thr Lys Ala Leu Asp Pro

305 310 315 320

Glu Ile Phe Tyr Val Val Asn Gly Ala Val Ser Glu Thr Thr Glu Leu

325 330 335

Leu Asn Gln Lys Phe Asp Lys Ile Val Tyr Thr Gly Ser Asp Ile Val

340 345 350

Gly Lys Ile Ile Ala Lys Lys Ala Ala Glu Thr Leu Thr Pro Val Ile

355 360 365

Leu Glu Leu Gly Gly Lys Ser Pro Ala Phe Val Leu Asp Asp Val Ser

370 375 380

Asp Lys Asp Leu Pro Val Ile Ala Arg Arg Ile Ala Trp Gly Arg Tyr

385 390 395 400

Ala Asn Ala Gly Gln Thr Cys Ile Gly Val Asp Tyr Val Leu Val Ala

405 410 415

Glu Ser Lys His Glu Lys Phe Ile Gln Ala Leu Arg Asn Val Ile Glu

420 425 430

Asn Glu Phe Phe Pro Asn Ile Asp Gln Asn Ser Asn Phe Thr His Met

435 440 445

Ile His Glu Arg Ala Phe Leu Lys Met Lys Lys Ile Leu Asp Thr Thr

450 455 460

Ala Gly Glu Ile Ile Ile Gly Gly Lys Leu Asp Ser Glu Ser Asn Tyr

465 470 475 480

Val Ser Pro Thr Val Ile Asp Asn Ala Ser Trp Asp Asp Ser Ser Met

485 490 495

Lys Glu Glu Ile Phe Gly Pro Ile Leu Pro Ile Ile Thr Tyr Thr Asp

500 505 510

Leu Lys Gln Ala Cys Asn Glu Val Ile Ser His His Asp Thr Pro Leu

515 520 525

Ala Gln Tyr Ile Phe Thr Ser Gly Ser Thr Ser Arg Lys Tyr Asn Ser

530 535 540

Gln Ile Asn Thr Ile Ser Thr Met Ile Arg Ser Gly Gly Leu Val Ile

545 550 555 560

Asn Asp Val Leu Met His Ile Ser Leu His Asn Ala Pro Phe Gly Gly

565 570 575

Val Gly Lys Ser Gly Tyr Gly Ala Tyr His Gly Glu Phe Ser Tyr Arg

580 585 590

Ala Phe Thr His Glu Arg Thr Val Leu Glu Gln His Leu Trp Asn Asp

595 600 605

Trp Ile Ile Asn Ser Arg Tyr Pro Pro Tyr Ser Asn Lys Lys Glu Arg

610 615 620

Leu Val Ala Ser Ser Gln Ser Asn Tyr Gly Gly Arg Val Trp Phe Gly

625 630 635 640

Arg Lys Gly Asp Val Arg Ile Glu Gly Pro Thr Thr Phe Phe Ser Ala

645 650 655

Trp Thr Asn Val Leu Gly Val Ala Ala Val Val Arg Asp Phe Ile Gly

660 665 670

Ala Ser Met

675

<210> 92

<211> 12572

<212> DNA

<213> 人工序列

<220>

<223> pYRH213质粒

<400> 92

aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540

acctcctcta actccgacct ggtccgaacc atcgagtccg ccctcggcat ttctctcggc 600

gacagcgtgt ccgattctgt cgttatcatt gccaccactt ctgctgccgt catcattgga 660

cttctggtct tcctctggcg aaagtctccc gacagatcgc gagagctgcg tcctgtcatt 720

gtgcccaagt ttaccgttaa gcacgaggac gatgaagtcg aggtggaccg aggcaaaacc 780

aaggttacag ttttctacgg aactcagacc ggtactgccg agggctttgc aaaggccctt 840

gcggaggaaa tcaaggccag atacgagaag gccgttgtca aggtggttga catggatgac 900

tacgctattg acgatgacca gtacgaggaa aagctcaaaa aggagaccct ggtcttcttt 960

atgcttgcca cctatggaga cggcgaaccc accgataacg ctgcacgatt ctacaagtgg 1020

tttaccgagg gcaaggagga acgaggaacc tggctgcagc aactcactta cggtgtgttc 1080

gccttgggca accgacagta cgagcatttc aacaagatcg gcaagattgt cgacgaggat 1140

cttaccgagc agggagccaa gcgtctggtt cccgtcggtc tcggcgacga tgaccagtcc 1200

atcgaggacg atttcaacgc ttggaaggaa accttgtggc cagagctgga ccaacttctc 1260

cgagacgagg atgacgtcaa cactgcttcg accccttaca ctgccgctat ctccgagtat 1320

cgtgtcgtta tccacgatcc taccgtgtct ccctcctacg agaaccattt caatgttgcc 1380

aacggtggag cagtgttcga cattcaccat ccctgtcgag tcaacgttgc cgtgcgacgg 1440

gaacttcaca agccccagtc cgaccgatct tgcattcacc tggagtttga tctctccggt 1500

actggcgtta catacgagac tggcgaccac gtcggagtgt acgccgagaa ctgcgacgaa 1560

actgtcgagg aagctggcaa gctgctcggt cagtcgctgg atcttctctt ttctctgcat 1620

accgacaagg aggatggcac aagccttggt ggatctctgc tccctccatt tcctggaccc 1680

tgtaccgttc gaactgccct cgcttgctac gccgaccttc ttaatcctcc acggaaagcc 1740

gctatcgtgg cacttgctgc ccatgcttcc gagcccagcg aggccgaacg actcaagttt 1800

ctttcttcgc ctcagggcaa ggacgagtac tccaagtggg tcgttggatc tcagcgatcg 1860

ctgctcgaag tcatggccga ttttccctcc gccaagcctc cactgggagt gttctttgct 1920

gccattgcac ctcgactgca gcctcgatac tattctatct cctcttcgcc cagaccagct 1980

ccccagcgag tgcacgttac ctgtgccctt gtcgagggac ccactcctac cggtcggatt 2040

cacaagggtg tgtgctccac ctggatgaag tctgctactc ccttggagaa gtctcacgac 2100

tgttcccgag cacctatctt cattcgaccc tccaacttca agcttcctgc cgaccattcg 2160

attcccatta tcatggtcgg acctggtaca ggtctggctc cctttcgagg attcctccag 2220

gaacgacttg ccctcaagga ggatggagtt cagcttggac ctgccctgct cttctttggt 2280

tgccgaaaca gacagatgga cttcatctac gaggacgaac tcaacaattt cgttcagcaa 2340

ggtgccattt ccgagctcat cgttgcgttt tctcgagagg gcccagaaaa ggagtacgtg 2400

cagcacaaga tgatggacaa ggccgagtat ctgtggtctc tcatttcgca gggaggctac 2460

ctgtacgtct gtggtgatgc caaaggcatg gctcgagacg tgcaccgatc ccttcatacc 2520

attgttcagc aacaggagaa cgcagattct tcgaaggctg aggccactgt caagaaactc 2580

cagatggacg gaagatacct gcgagacgtg tggtaagcgg ccgcatgaga agataaatat 2640

ataaatacat tgagatatta aatgcgctag attagagagc ctcatactgc tcggagagaa 2700

gccaagacga gtactcaaag gggattacac catccatatc cacagacaca agctggggaa 2760

aggttctata tacactttcc ggaataccgt agtttccgat gttatcaatg ggggcagcca 2820

ggatttcagg cacttcggtg tctcggggtg aaatggcgtt cttggcctcc atcaagtcgt 2880

accatgtctt catttgcctg tcaaagtaaa acagaagcag atgaagaatg aacttgaagt 2940

gaaggaattt aaatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct 3000

ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 3060

tgtttcctgt gtgaaattgt tatccgctca caagcttcca cacaacgtac gttgattgag 3120

gtggagccag atgggctatt gtttcatata tagactggca gccacctctt tggcccagca 3180

tgtttgtata cctggaaggg aaaactaaag aagctggcta gtttagtttg attattatag 3240

tagatgtcct aatcactaga gattagaatg tcttggcgat gattagtcgt cgtcccctgt 3300

atcatgtcta gaccaactgt gtcatgaagt tggtgctggt gttttacctg tgtactacaa 3360

gtaggtgtcc tagatctagt gtacagagcc gtttagaccc atgtggactt caccattaac 3420

gatggaaaat gttcattata tgacagtata ttacaatgga cttgctccat ttcttccttg 3480

catcacatgt tctccacctc catagttgat caacacatca tagtagctaa ggctgctgct 3540

ctcccactac agtccaccac aagttaagta gcaccgtcag tacagctaaa agtacacgtc 3600

tagtacgttt cataactagt caagtagccc ctattacaga tatcagcact atcacgcacg 3660

agtttttctc tgtgctatct aatcaacttg ccaagtattc ggagaagata cactttcttg 3720

gcatcaggta tacgagggag cctatcagat gaaaaagggt atattggatc cattcatatc 3780

cacctacacg ttgtcataat ctcctcattc acgtgattca tttcgtgaca ctagtttctc 3840

actttccccc ccgcacctat agtcaacttg gcggacacgc tacttgtagc tgacgttgat 3900

ttatagaccc aatcaaagcg ggttatcggt caggtagcac ttatcattca tcgttcatac 3960

tacgatgagc aatctcgggc atgtccggaa aagtgtcggg cgcgccagct gcattaatga 4020

atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4080

actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4140

gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4200

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4260

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4320

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4380

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4440

agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4500

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4560

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4620

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4680

agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4740

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4800

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4860

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4920

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4980

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5040

atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5100

cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5160

gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5220

gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5280

tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5340

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5400

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5460

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5520

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5580

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5640

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5700

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5760

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5820

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5880

tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5940

tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg 6000

gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 6060

aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 6120

gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 6180

gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 6240

aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 6300

gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 6360

tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 6420

gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 6480

aatgcgccgc tacagggcgc gtccattcgc cattcaggct gcgcaactgt tgggaagggc 6540

gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 6600

gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 6660

aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgca ttccgacagc 6720

agcgactggg caccatgatc aagcgaaaca ccttccccca gctgccctgg caaaccatca 6780

agaaccctac tttcatcaag tgcaagaacg gttctactct tctcacctcc ggtgtctacg 6840

gctggtgccg aaagcctaac tacaccgctg atttcatcat gtgcctcacc tgggctctca 6900

tgtgcggtgt tgcttctccc ctgccttact tctacccggt cttcttcttc ctggtgctca 6960

tccaccgagc ttaccgagac tttgagcgac tggagcgaaa gtacggtgag gactaccagg 7020

agttcaagcg acaggtccct tggatcttca tcccttatgt tttctaaacg ataagcttag 7080

tgagcgaatg gtgaggttac ttaattgagt ggccagccta tgggattgta taacagacag 7140

tcaatatatt actgaaaaga ctgaacagcc agacggagtg aggttgtgag tgaatcgtag 7200

agggcggcta ttacagcaag tctactctac agtgtactaa cacagcagag aacaaataca 7260

ggtgtgcatt cggctatctg agaattagtt ggagagctcg agaccctcgg cgataaactg 7320

ctcctcggtt ttgtgtccat acttgtacgg accattgtaa tggggcaagt cgttgagttc 7380

tcgtcgtccg acgttcagag cacagaaacc aatgtaatca atgtagcaga gatggttctg 7440

caaaagattg atttgtgcga gcaggttaat taagttgcga cacatgtctt gatagtatct 7500

tgaattctct ctcttgagct tttccataac aagttcttct gcctccagga agtccatggg 7560

tggtttgatc atggttttgg tgtagtggta gtgcagtggt ggtattgtga ctggggatgt 7620

agttgagaat aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 7680

tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 7740

tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 7800

gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 7860

ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 7920

agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 7980

gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 8040

tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 8100

agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 8160

ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 8220

ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 8280

cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 8340

ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 8400

gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 8460

atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 8520

ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 8580

gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 8640

cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 8700

ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 8760

actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 8820

tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 8880

tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 8940

gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 9000

cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 9060

agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 9120

gtcgaccttt tccttgggaa ccaccaccgt cagcccttct gactcacgta ttgtagccac 9180

cgacacaggc aacagtccgt ggatagcaga atatgtcttg tcggtccatt tctcaccaac 9240

tttaggcgtc aagtgaatgt tgcagaagaa gtatgtgcct tcattgagaa tcggtgttgc 9300

tgatttcaat aaagtcttga gatcagtttg gccagtcatg ttgtgggggg taattggatt 9360

gagttatcgc ctacagtctg tacaggtata ctcgctgccc actttatact ttttgattcc 9420

gctgcacttg aagcaatgtc gtttaccaaa agtgagaatg ctccacagaa cacaccccag 9480

ggtatggttg agcaaaaaat aaacactccg atacggggaa tcgaaccccg gtctccacgg 9540

ttctcaagaa gtattcttga tgagagcgta tcgatgagcc taaaatgaac ccgagtatat 9600

ctcataaaat tctcggtgag aggtctgtga ctgtcagtac aaggtgcctt cattatgccc 9660

tcaaccttac catacctcac tgaatgtagt gtacctctaa aaatgaaata cagtgccaaa 9720

agccaaggca ctgagctcgt ctaacggact tgatatacaa ccaattaaaa caaatgaaaa 9780

gaaatacagt tctttgtatc atttgtaaca attaccctgt acaaactaag gtattgaaat 9840

cccacaatat tcccaaagtc cacccctttc caaattgtca tgcctacaac tcatatacca 9900

agcactaacc taccgtttaa acgagaatcg tacagagttg tttctgaacc atttcgaagc 9960

cgttcagagt cgtttaaccg cagtttgagt cgtttcagag cggttctcag tcgtttttga 10020

tccatctctg aatgattcag agccgcctaa ctccttgtga gccgttaaat cgcgaattga 10080

gccactctga gccgttgatt cttccatttg tggccccttc accatctcct catctccttc 10140

ctctcgtcgc catctccttt tctcctctcg cacctcgcac tactccaaac caactcactg 10200

actacatccc aacagcgatc taaccaacgc cgcgcaagca aacagacaca aaaacaacgt 10260

ccgcgccgcc gaccacgtca gcagatcccg ctctcctggg ttttgtcgtc gtttgccgcc 10320

ttttgccgcc gctatttgca acgccgccac actcaatggc cgagccatga tgccgtcgtc 10380

gtgtcttttc ccaaatagga aaccgggcac caaccctagc cccacaactg gagtactcaa 10440

ctcggcgaaa aatgggccaa tcgccgcggg agaaacgaca atcggcttgt tttgactcaa 10500

ttacctcacc aagcgcccct tcgtcgccgc catacctccg caacaccccc tcaccgtccc 10560

tccctccgcc cctctggaaa ctcatagaac cccaaacctt atttccgatg accgcaaact 10620

ttagactata caggcgaatc tgggtggtgg caccaaccct tcctcttctc catcaccccc 10680

ccctcaatct ctttttctca ccatggcctt ccagtttcac ctggaggtcc tcctgcccta 10740

cctccttcct ctgcttctgc tcatcctgcc caccactatc ttctttctca ccaagcccaa 10800

caataaggtg tcctctactt ccaccaacaa taacatcatt acactgccca agtcgtaccc 10860

tctcattggc tcctaccttt cgttccgaaa gaacctgcat cgacggatcc agtggctctc 10920

cgacattgtt cagatctctc cctccgctac cttccagctc gacggaaccc tgggcaagcg 10980

acagatcatt actggcaacc cttctaccgt ccagcacatt ctcaagaacc agttctccaa 11040

ctatcagaag ggcaccacat tcaccaacac tctgtccgac tttctcggaa caggcatctt 11100

caacaccaac ggtcccaact ggaagtttca acgacaggtt gcctctcacg agttcaacac 11160

caagtccatt cggaacttcg tcgagcacat cgtggatacc gaactcacca accgattgat 11220

tcccatcctc acttcgagca cccagacaaa caatatcctg gacttccagg atattctgca 11280

gcgatttacc ttcgacaaca tctgcaacat tgccttcgga tacgatcccg agtacctcac 11340

tccctcgacc aatcgttcca agttcgcgga ggcctacgaa gacgctaccg agatctccag 11400

caagcgattc agactgcctc ttcccatcat ttggaagatc aaaaagtact tcaacattgg 11460

ctccgagaag cgactcaagg aagccgtcac cgaggtccga tcctttgcca agaaactggt 11520

ccgagagaag aaacgggagc tcgaagagaa gtcttcgctg gagaccgaag acatgctttc 11580

tcgatttctg tccagcggtc actcggacga ggatttcgtt gccgacattg tcatctcctt 11640

cattctcgca ggcaaggaca ctacctctgc cgctcttacc tggtttttct ggctgctctg 11700

gaagaaccct cgagtggagg aagagatcgt caacgagctg tccaagaaat cggagcttat 11760

ggtgtacgac gaggtcaagg aaatggtcta cacccatgct gcgctgtccg agtcgatgag 11820

actctaccct cccgttccaa tggattccaa ggaggccgtc aacgacgatg tgctgcccga 11880

cggctgggtg gtcaagaaag gtacaatcgt cacctaccat gtctacgcta tgggtcgaat 11940

gaagtctctc tggggagacg attgggcaga gtttcgacca gaacggtggc tcgagaagga 12000

cgaggtcaac ggcaagtggg tgttcgtcgg acgagacagc tactcctatc ctgtgttcca 12060

ggctggtccc agagtctgcc tgggaaagga gatggccttc atgcagatga agcgaattgt 12120

ggctggcatc gtcggaaagt tcaaggtggt tcccgaagcc cacttggctc aggagccagg 12180

attcatttcc tttctgtcgt ctcagatgga gggtggattt cccgtcacta tccagaagcg 12240

agactcctaa gcggccgcaa gtgtggatgg ggaagtgagt gcccggttct gtgtgcacaa 12300

ttggcaatcc aagatggatg gattcaacac agggatatag cgagctacgt ggtggtgcga 12360

ggatatagca acggatattt atgtttgaca cttgagaatg tacgatacaa gcactgtcca 12420

agtacaatac taaacatact gtacatactc atactcgtac ccgggcaacg gtttcacttg 12480

agtgcagtgg ctagtgctct tactcgtaca gtgtgcaata ctgcgtatca tagtctttga 12540

tgtatatcgt attcattcat gttagttgat tt 12572

<210> 93

<211> 1548

<212> DNA

<213> 人工序列

<220>

<223> VsCYP94A1s (CYP)

<400> 93

atggccttcc agtttcacct ggaggtcctc ctgccctacc tccttcctct gcttctgctc 60

atcctgccca ccactatctt ctttctcacc aagcccaaca ataaggtgtc ctctacttcc 120

accaacaata acatcattac actgcccaag tcgtaccctc tcattggctc ctacctttcg 180

ttccgaaaga acctgcatcg acggatccag tggctctccg acattgttca gatctctccc 240

tccgctacct tccagctcga cggaaccctg ggcaagcgac agatcattac tggcaaccct 300

tctaccgtcc agcacattct caagaaccag ttctccaact atcagaaggg caccacattc 360

accaacactc tgtccgactt tctcggaaca ggcatcttca acaccaacgg tcccaactgg 420

aagtttcaac gacaggttgc ctctcacgag ttcaacacca agtccattcg gaacttcgtc 480

gagcacatcg tggataccga actcaccaac cgattgattc ccatcctcac ttcgagcacc 540

cagacaaaca atatcctgga cttccaggat attctgcagc gatttacctt cgacaacatc 600

tgcaacattg ccttcggata cgatcccgag tacctcactc cctcgaccaa tcgttccaag 660

ttcgcggagg cctacgaaga cgctaccgag atctccagca agcgattcag actgcctctt 720

cccatcattt ggaagatcaa aaagtacttc aacattggct ccgagaagcg actcaaggaa 780

gccgtcaccg aggtccgatc ctttgccaag aaactggtcc gagagaagaa acgggagctc 840

gaagagaagt cttcgctgga gaccgaagac atgctttctc gatttctgtc cagcggtcac 900

tcggacgagg atttcgttgc cgacattgtc atctccttca ttctcgcagg caaggacact 960

acctctgccg ctcttacctg gtttttctgg ctgctctgga agaaccctcg agtggaggaa 1020

gagatcgtca acgagctgtc caagaaatcg gagcttatgg tgtacgacga ggtcaaggaa 1080

atggtctaca cccatgctgc gctgtccgag tcgatgagac tctaccctcc cgttccaatg 1140

gattccaagg aggccgtcaa cgacgatgtg ctgcccgacg gctgggtggt caagaaaggt 1200

acaatcgtca cctaccatgt ctacgctatg ggtcgaatga agtctctctg gggagacgat 1260

tgggcagagt ttcgaccaga acggtggctc gagaaggacg aggtcaacgg caagtgggtg 1320

ttcgtcggac gagacagcta ctcctatcct gtgttccagg ctggtcccag agtctgcctg 1380

ggaaaggaga tggccttcat gcagatgaag cgaattgtgg ctggcatcgt cggaaagttc 1440

aaggtggttc ccgaagccca cttggctcag gagccaggat tcatttcctt tctgtcgtct 1500

cagatggagg gtggatttcc cgtcactatc cagaagcgag actcctaa 1548

<210> 94

<211> 515

<212> PRT

<213> 人工序列

<220>

<223> VsCYP94A1s (CYP)蛋白质

<400> 94

Met Ala Phe Gln Phe His Leu Glu Val Leu Leu Pro Tyr Leu Leu Pro

1 5 10 15

Leu Leu Leu Leu Ile Leu Pro Thr Thr Ile Phe Phe Leu Thr Lys Pro

20 25 30

Asn Asn Lys Val Ser Ser Thr Ser Thr Asn Asn Asn Ile Ile Thr Leu

35 40 45

Pro Lys Ser Tyr Pro Leu Ile Gly Ser Tyr Leu Ser Phe Arg Lys Asn

50 55 60

Leu His Arg Arg Ile Gln Trp Leu Ser Asp Ile Val Gln Ile Ser Pro

65 70 75 80

Ser Ala Thr Phe Gln Leu Asp Gly Thr Leu Gly Lys Arg Gln Ile Ile

85 90 95

Thr Gly Asn Pro Ser Thr Val Gln His Ile Leu Lys Asn Gln Phe Ser

100 105 110

Asn Tyr Gln Lys Gly Thr Thr Phe Thr Asn Thr Leu Ser Asp Phe Leu

115 120 125

Gly Thr Gly Ile Phe Asn Thr Asn Gly Pro Asn Trp Lys Phe Gln Arg

130 135 140

Gln Val Ala Ser His Glu Phe Asn Thr Lys Ser Ile Arg Asn Phe Val

145 150 155 160

Glu His Ile Val Asp Thr Glu Leu Thr Asn Arg Leu Ile Pro Ile Leu

165 170 175

Thr Ser Ser Thr Gln Thr Asn Asn Ile Leu Asp Phe Gln Asp Ile Leu

180 185 190

Gln Arg Phe Thr Phe Asp Asn Ile Cys Asn Ile Ala Phe Gly Tyr Asp

195 200 205

Pro Glu Tyr Leu Thr Pro Ser Thr Asn Arg Ser Lys Phe Ala Glu Ala

210 215 220

Tyr Glu Asp Ala Thr Glu Ile Ser Ser Lys Arg Phe Arg Leu Pro Leu

225 230 235 240

Pro Ile Ile Trp Lys Ile Lys Lys Tyr Phe Asn Ile Gly Ser Glu Lys

245 250 255

Arg Leu Lys Glu Ala Val Thr Glu Val Arg Ser Phe Ala Lys Lys Leu

260 265 270

Val Arg Glu Lys Lys Arg Glu Leu Glu Glu Lys Ser Ser Leu Glu Thr

275 280 285

Glu Asp Met Leu Ser Arg Phe Leu Ser Ser Gly His Ser Asp Glu Asp

290 295 300

Phe Val Ala Asp Ile Val Ile Ser Phe Ile Leu Ala Gly Lys Asp Thr

305 310 315 320

Thr Ser Ala Ala Leu Thr Trp Phe Phe Trp Leu Leu Trp Lys Asn Pro

325 330 335

Arg Val Glu Glu Glu Ile Val Asn Glu Leu Ser Lys Lys Ser Glu Leu

340 345 350

Met Val Tyr Asp Glu Val Lys Glu Met Val Tyr Thr His Ala Ala Leu

355 360 365

Ser Glu Ser Met Arg Leu Tyr Pro Pro Val Pro Met Asp Ser Lys Glu

370 375 380

Ala Val Asn Asp Asp Val Leu Pro Asp Gly Trp Val Val Lys Lys Gly

385 390 395 400

Thr Ile Val Thr Tyr His Val Tyr Ala Met Gly Arg Met Lys Ser Leu

405 410 415

Trp Gly Asp Asp Trp Ala Glu Phe Arg Pro Glu Arg Trp Leu Glu Lys

420 425 430

Asp Glu Val Asn Gly Lys Trp Val Phe Val Gly Arg Asp Ser Tyr Ser

435 440 445

Tyr Pro Val Phe Gln Ala Gly Pro Arg Val Cys Leu Gly Lys Glu Met

450 455 460

Ala Phe Met Gln Met Lys Arg Ile Val Ala Gly Ile Val Gly Lys Phe

465 470 475 480

Lys Val Val Pro Glu Ala His Leu Ala Gln Glu Pro Gly Phe Ile Ser

485 490 495

Phe Leu Ser Ser Gln Met Glu Gly Gly Phe Pro Val Thr Ile Gln Lys

500 505 510

Arg Asp Ser

515

<210> 95

<211> 2082

<212> DNA

<213> 人工序列

<220>

<223> VsCPRs (CPR)

<400> 95

atggccacct cctctaactc cgacctggtc cgaaccatcg agtccgccct cggcatttct 60

ctcggcgaca gcgtgtccga ttctgtcgtt atcattgcca ccacttctgc tgccgtcatc 120

attggacttc tggtcttcct ctggcgaaag tctcccgaca gatcgcgaga gctgcgtcct 180

gtcattgtgc ccaagtttac cgttaagcac gaggacgatg aagtcgaggt ggaccgaggc 240

aaaaccaagg ttacagtttt ctacggaact cagaccggta ctgccgaggg ctttgcaaag 300

gcccttgcgg aggaaatcaa ggccagatac gagaaggccg ttgtcaaggt ggttgacatg 360

gatgactacg ctattgacga tgaccagtac gaggaaaagc tcaaaaagga gaccctggtc 420

ttctttatgc ttgccaccta tggagacggc gaacccaccg ataacgctgc acgattctac 480

aagtggttta ccgagggcaa ggaggaacga ggaacctggc tgcagcaact cacttacggt 540

gtgttcgcct tgggcaaccg acagtacgag catttcaaca agatcggcaa gattgtcgac 600

gaggatctta ccgagcaggg agccaagcgt ctggttcccg tcggtctcgg cgacgatgac 660

cagtccatcg aggacgattt caacgcttgg aaggaaacct tgtggccaga gctggaccaa 720

cttctccgag acgaggatga cgtcaacact gcttcgaccc cttacactgc cgctatctcc 780

gagtatcgtg tcgttatcca cgatcctacc gtgtctccct cctacgagaa ccatttcaat 840

gttgccaacg gtggagcagt gttcgacatt caccatccct gtcgagtcaa cgttgccgtg 900

cgacgggaac ttcacaagcc ccagtccgac cgatcttgca ttcacctgga gtttgatctc 960

tccggtactg gcgttacata cgagactggc gaccacgtcg gagtgtacgc cgagaactgc 1020

gacgaaactg tcgaggaagc tggcaagctg ctcggtcagt cgctggatct tctcttttct 1080

ctgcataccg acaaggagga tggcacaagc cttggtggat ctctgctccc tccatttcct 1140

ggaccctgta ccgttcgaac tgccctcgct tgctacgccg accttcttaa tcctccacgg 1200

aaagccgcta tcgtggcact tgctgcccat gcttccgagc ccagcgaggc cgaacgactc 1260

aagtttcttt cttcgcctca gggcaaggac gagtactcca agtgggtcgt tggatctcag 1320

cgatcgctgc tcgaagtcat ggccgatttt ccctccgcca agcctccact gggagtgttc 1380

tttgctgcca ttgcacctcg actgcagcct cgatactatt ctatctcctc ttcgcccaga 1440

ccagctcccc agcgagtgca cgttacctgt gcccttgtcg agggacccac tcctaccggt 1500

cggattcaca agggtgtgtg ctccacctgg atgaagtctg ctactccctt ggagaagtct 1560

cacgactgtt cccgagcacc tatcttcatt cgaccctcca acttcaagct tcctgccgac 1620

cattcgattc ccattatcat ggtcggacct ggtacaggtc tggctccctt tcgaggattc 1680

ctccaggaac gacttgccct caaggaggat ggagttcagc ttggacctgc cctgctcttc 1740

tttggttgcc gaaacagaca gatggacttc atctacgagg acgaactcaa caatttcgtt 1800

cagcaaggtg ccatttccga gctcatcgtt gcgttttctc gagagggccc agaaaaggag 1860

tacgtgcagc acaagatgat ggacaaggcc gagtatctgt ggtctctcat ttcgcaggga 1920

ggctacctgt acgtctgtgg tgatgccaaa ggcatggctc gagacgtgca ccgatccctt 1980

cataccattg ttcagcaaca ggagaacgca gattcttcga aggctgaggc cactgtcaag 2040

aaactccaga tggacggaag atacctgcga gacgtgtggt aa 2082

<210> 96

<211> 693

<212> PRT

<213> 人工序列

<220>

<223> VsCPRs (CPR)蛋白质

<400> 96

Met Ala Thr Ser Ser Asn Ser Asp Leu Val Arg Thr Ile Glu Ser Ala

1 5 10 15

Leu Gly Ile Ser Leu Gly Asp Ser Val Ser Asp Ser Val Val Ile Ile

20 25 30

Ala Thr Thr Ser Ala Ala Val Ile Ile Gly Leu Leu Val Phe Leu Trp

35 40 45

Arg Lys Ser Pro Asp Arg Ser Arg Glu Leu Arg Pro Val Ile Val Pro

50 55 60

Lys Phe Thr Val Lys His Glu Asp Asp Glu Val Glu Val Asp Arg Gly

65 70 75 80

Lys Thr Lys Val Thr Val Phe Tyr Gly Thr Gln Thr Gly Thr Ala Glu

85 90 95

Gly Phe Ala Lys Ala Leu Ala Glu Glu Ile Lys Ala Arg Tyr Glu Lys

100 105 110

Ala Val Val Lys Val Val Asp Met Asp Asp Tyr Ala Ile Asp Asp Asp

115 120 125

Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Val Phe Phe Met Leu

130 135 140

Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr

145 150 155 160

Lys Trp Phe Thr Glu Gly Lys Glu Glu Arg Gly Thr Trp Leu Gln Gln

165 170 175

Leu Thr Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His Phe

180 185 190

Asn Lys Ile Gly Lys Ile Val Asp Glu Asp Leu Thr Glu Gln Gly Ala

195 200 205

Lys Arg Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Ser Ile Glu

210 215 220

Asp Asp Phe Asn Ala Trp Lys Glu Thr Leu Trp Pro Glu Leu Asp Gln

225 230 235 240

Leu Leu Arg Asp Glu Asp Asp Val Asn Thr Ala Ser Thr Pro Tyr Thr

245 250 255

Ala Ala Ile Ser Glu Tyr Arg Val Val Ile His Asp Pro Thr Val Ser

260 265 270

Pro Ser Tyr Glu Asn His Phe Asn Val Ala Asn Gly Gly Ala Val Phe

275 280 285

Asp Ile His His Pro Cys Arg Val Asn Val Ala Val Arg Arg Glu Leu

290 295 300

His Lys Pro Gln Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Leu

305 310 315 320

Ser Gly Thr Gly Val Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr

325 330 335

Ala Glu Asn Cys Asp Glu Thr Val Glu Glu Ala Gly Lys Leu Leu Gly

340 345 350

Gln Ser Leu Asp Leu Leu Phe Ser Leu His Thr Asp Lys Glu Asp Gly

355 360 365

Thr Ser Leu Gly Gly Ser Leu Leu Pro Pro Phe Pro Gly Pro Cys Thr

370 375 380

Val Arg Thr Ala Leu Ala Cys Tyr Ala Asp Leu Leu Asn Pro Pro Arg

385 390 395 400

Lys Ala Ala Ile Val Ala Leu Ala Ala His Ala Ser Glu Pro Ser Glu

405 410 415

Ala Glu Arg Leu Lys Phe Leu Ser Ser Pro Gln Gly Lys Asp Glu Tyr

420 425 430

Ser Lys Trp Val Val Gly Ser Gln Arg Ser Leu Leu Glu Val Met Ala

435 440 445

Asp Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile

450 455 460

Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg

465 470 475 480

Pro Ala Pro Gln Arg Val His Val Thr Cys Ala Leu Val Glu Gly Pro

485 490 495

Thr Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys

500 505 510

Ser Ala Thr Pro Leu Glu Lys Ser His Asp Cys Ser Arg Ala Pro Ile

515 520 525

Phe Ile Arg Pro Ser Asn Phe Lys Leu Pro Ala Asp His Ser Ile Pro

530 535 540

Ile Ile Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe

545 550 555 560

Leu Gln Glu Arg Leu Ala Leu Lys Glu Asp Gly Val Gln Leu Gly Pro

565 570 575

Ala Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr

580 585 590

Glu Asp Glu Leu Asn Asn Phe Val Gln Gln Gly Ala Ile Ser Glu Leu

595 600 605

Ile Val Ala Phe Ser Arg Glu Gly Pro Glu Lys Glu Tyr Val Gln His

610 615 620

Lys Met Met Asp Lys Ala Glu Tyr Leu Trp Ser Leu Ile Ser Gln Gly

625 630 635 640

Gly Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val

645 650 655

His Arg Ser Leu His Thr Ile Val Gln Gln Gln Glu Asn Ala Asp Ser

660 665 670

Ser Lys Ala Glu Ala Thr Val Lys Lys Leu Gln Met Asp Gly Arg Tyr

675 680 685

Leu Arg Asp Val Trp

690

<210> 97

<211> 783

<212> DNA

<213> 解脂耶氏酵母

<400> 97

aaacgagaat cgtacagagt tgtttctgaa ccatttcgaa gccgttcaga gtcgtttaac 60

cgcagtttga gtcgtttcag agcggttctc agtcgttttt gatccatctc tgaatgattc 120

agagccgcct aactccttgt gagccgttaa atcgcgaatt gagccactct gagccgttga 180

ttcttccatt tgtggcccct tcaccatctc ctcatctcct tcctctcgtc gccatctcct 240

tttctcctct cgcacctcgc actactccaa accaactcac tgactacatc ccaacagcga 300

tctaaccaac gccgcgcaag caaacagaca caaaaacaac gtccgcgccg ccgaccacgt 360

cagcagatcc cgctctcctg ggttttgtcg tcgtttgccg ccttttgccg ccgctatttg 420

caacgccgcc acactcaatg gccgagccat gatgccgtcg tcgtgtcttt tcccaaatag 480

gaaaccgggc accaacccta gccccacaac tggagtactc aactcggcga aaaatgggcc 540

aatcgccgcg ggagaaacga caatcggctt gttttgactc aattacctca ccaagcgccc 600

cttcgtcgcc gccatacctc cgcaacaccc cctcaccgtc cctccctccg cccctctgga 660

aactcataga accccaaacc ttatttccga tgaccgcaaa ctttagacta tacaggcgaa 720

tctgggtggt ggcaccaacc cttcctcttc tccatcaccc ccccctcaat ctctttttct 780

cac 783

<210> 98

<211> 17083

<212> DNA

<213> 人工序列

<220>

<223> pZSCPn-3FAOBU质粒

<400> 98

cgattcgaga ttttacagat atttctcgca gtttttcacg tccccttgtc cttgtcctat 60

tgtttcaaat aaactctcgt ctactgattt cacatggaac ctttgctatt tcggggataa 120

ccccctttgc cattgcacga tggacgtggc aaaagaaaga tcgccctgcg gggatactta 180

tcatgtggtc acatgctgtg attagaaata aagaaaaagg tgcttttttg gcgctgtgat 240

taacatctcg tctgccgtgc tctactagtc gcaatagcaa aaactcgctt aatagtgtgc 300

atagtgcggg gtagcaggat actgaactac agtacgattt gcttgctact gcttgtagca 360

attaccttta ctgtagggac cacacctcct ggtttcaatg tctttcctcg cctcgacaaa 420

gcaaaactgt cacccaatca caccttgttc atattcatta gtgcatccgt taaccttgac 480

atgacacttc tcatactagt gatagggctg tagttgagac aagttgattc acacggatac 540

atacaaagcc tcagagagca aatgttatat actcagggac cgaccaatca aaaaaacaca 600

ctcctaataa ccaccatttc catctacgcg tactcactct gtcagctgcc ccacattgcc 660

caatgcacaa tgcacaatga tgtgtgcaaa caacgcaatc aaaagtctat ggatgctgac 720

caaactctga tcaccaagtt gcgaacatga aaaagaagac ctgtgtatat ataagtaagg 780

gggagagccc taactagatc tttcgaaaac cccccgacct tcaccttcca caaccatggc 840

caaccccgtc gtggaggact cccatctgga cgtcttctgc ctccttgccg atgctgtggt 900

tcacgagatt cctccctccg agatcgtcga gtacctgcat cctgactttc ccaaggacaa 960

ggtcgaagag taccttgccg agttctctca tccctccgct attccagagt tccgagaggt 1020

tgccaagcga atcattaaca agggcaccgt gctgtcgatc aagctctttc tgctcttggc 1080

cactgctctg gattctcgaa tccttgctcc tgccttgacc aactccacta cactcatccg 1140

agacatggat ctttctcagc gggaggaact cctgagatcc tggcgagact ctcccttcac 1200

taccaaacga aagctgttcc gagtctacaa ctcgtttacc ctcaacgcct tcagcaagac 1260

tgctaccgac cttcacttca aggccctggg ataccctggt cgagagctcc gtactcagat 1320

tcaggactac gaggtcgatc cctttcgata cacgttcctg gagaagcctc agcaagacgg 1380

acaggagctc cactttcccg acattgatgt gctcattatc ggatctggct ccggtgcagg 1440

cgtcgttgct cagactcttt cggagaacgg actcaagtct ctggtgctcg agaagggcaa 1500

atacttttcc aacgacgagc tgaccatgaa cgacctcgaa ggttccgagg ccctgttcga 1560

aaacggaggt gctctctcct ctaccaatca acagatcttt atcattgccg gatcgacttt 1620

cggtggcgga tccacagtca actggtctgc ctgtctcaag actcccttca aggtgcgaaa 1680

ggagtggtac gacaactttg gactggattt cgttgctacc cagtattacg aggactgtat 1740

ggactacgtc tggaagaaaa tgggtgcctc caacgagaat atcgaccatt ctggagccaa 1800

ctcggtcatt ctggaaggtt ccaagaaact tggctaccct caccgtgccg tggaacagaa 1860

caatggaggc aagattcacg actgtggtat gtgccacctc ggatgtcgat ttggcatcaa 1920

gcagggatcg gtcaactgct ggtttcgtgg tccctccgag aacggctcga agttcatgca 1980

gcaagttctc gtggacaaga tcctgcagcg agatggcaag gctgtcggtg ttctctgtag 2040

agacgtggtt accggagtca agttcaagat cactggaccc aagaaaatcg tcgtgttctg 2100

gtggttcttt gccaactccg gatttgttac caagtctggt ttcaagaaca agcacatcgg 2160

tgcaaacctc aagctgcatc ccgtcagcct tacgctcggc gactttggta acaatgtgga 2220

tttcgaggcc taccgaaagc caatcatgac ctccatttgt aacaaggtcg aggacctgga 2280

tggaaaggct cacggcactc gaatcgaggc catgctcaat gctccctacg gtgttgctcc 2340

attctttccc tggaagtctg gcgcagagtc ccgaaaggac ctcctgcgat acaagcagac 2400

tgtgcccatt ctcctgcttt ccagagacac cacttctgga tccgtcacct acgacaaaca 2460

gaagcccgat gccttggtga tcgactacct gctcaacaag ttcgaccgaa actccatcct 2520

gcagggcttt ctcattgctt cggatcttct gtacatcgag ggtgccagcc gagaccatgt 2580

tacctacaag cttggatacc agtggttcaa gtcttccaag cccaagcacg ctcgatccat 2640

cgaagacgag gactacgtca actggagagc caaggttgca aagattccct ttgattccta 2700

tggatctcct tacggttcgg ctcaccagat gtccacttgc agaatgtctg gcaagggacc 2760

aggctacgga gcctgcgaca ccaagggcaa actcttcgag tgcagcaacg tgtacgtcgc 2820

cgatgcttcc actctgccca ccgcatctgg tgccaaccct atggtctcta ccatgtcctt 2880

tgcccgacac gtgtcgcttg gcatcgtcaa ggagctgcag caatccaagc tctaagcggc 2940

cgcatggagc gtgtgttctg agtcgatgtt ttctatggag ttgtgagtgt tagtagacat 3000

gatgggttta tatatgatga atgaatagat gtgattttga tttgcacgat ggaattgaga 3060

actttgtaaa cgtacatggg aatgtatgaa tgtgggggtt ttgtgactgg ataactgacg 3120

gtcagtggac gccgttgttc aaatatccaa gagatgcgag aaactttggg tcaagtgaac 3180

atgtcctctc tgttcaagta aaccatcaac tatgggtagt atatttagta aggacaagag 3240

ttgagattct ttggagtcct agaaacgtat tttcgcgttc caagatcaaa ttagtagagt 3300

aatacgggca cgggaatcca ttcatagtct caagtttaaa ccatcatcta agggcctcaa 3360

aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc actttaggtt 3420

gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta cagtttgtct 3480

taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat agcctttaga 3540

gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg tggacacatg 3600

tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc cgtggcctca 3660

tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc tcctgcactt 3720

gccaacctta atactggttt acattgacca acatcttaca agcggggggc ttgtctaggg 3780

tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt tctttcccca 3840

cagattcgaa atctaaacta cacatcacac catggcctcc caccaggtcg aggaccacga 3900

tctggacgtg ttctgcctcc tggccgacgc tgttctccac gagattcctc cctccgaaat 3960

cgtcgagtac cttcatcccg atttccccaa ggacaagatc gaagagtacc tgaccggctt 4020

ttctcgaccc tccgccgttc ctcagttccg acagtgtgcc aagaaactca tcaaccgagg 4080

ttccgagctg tcgatcaagc tcttccttta cttgaccact gctctggact ctcgaatcct 4140

tgcaccagcc ctgaccaact cgctcactct gatcagagac atggatcttt cccagcgaga 4200

ggaactgttg cggtcctggc gagattctcc actgactgcc aagcgaagac tctttcgagt 4260

ctacgcctcc tttaccctgt ctacattcaa caagctcgga accgacttgc acttcaaggc 4320

cctgggctac cctggtcgag agctccggac ccagattcaa gactacgagg tcgatccctt 4380

tcgatactcg ttcatggaga agctcaaaca cgagggacat gaactgttcc ttcccgatat 4440

cgacgttctg atcattggct ctggatccgg tgcaggcgtg gtcgctcaga ctcttaccga 4500

gagcggactc aagtctctgg ttctcgagaa gggcaagtac tttgcctccg aagagctgtg 4560

catgaccgat ctcgacggaa acgaggccct gttcgaaagc ggtggcacta ttccttccac 4620

caatcaacag ttgttcatga tcgctggatc tacttttggt ggaggctcca ccgtcaactg 4680

gtctgcctgt ctcaagactc ccttcaaggt tcgaaaggag tggtacgacg atttcggact 4740

ggactttgtg gctacccagc aatacgacga ttgcatggac tacgtgtgga agaaaatggg 4800

tgcctcgacc gagcacatcg agcattctgc tgcaaatgcc gtcatcatgg acggagctgc 4860

caagcttggc tacgctcacc gagccctcga gcagaacacc ggtggccatg ttcacgactg 4920

tggaatgtgc cacctgggct gtcgattcgg tatcaagcag ggaggcgtca actgctggtt 4980

tcgagaaccc tccgagaagg gttccaagtt catggagcag gtcgttgtcg agaagattct 5040

gcagcacaag ggcaaggcca ctggaattct ctgcagagat accgagtctg gcatcaagtt 5100

caagattact ggacccaaga aatacgtcgt gtccggtggc tctttgcaga cccctgttct 5160

ccttcagaag tctggcttca agaacaagca cattggagcc aacctcaagc tgcatcccgt 5220

ctcggttgct cttggcgact ttggtaacga ggtggacttc gaagcctaca agcgacccct 5280

catgaccgca gtctgcaatg ccgtggacga tctggacggc aaggctcacg gaacacgaat 5340

cgaggccatt ctgcacgctc cttacgtcac tgctcccttc tatccctggc agtccggtgc 5400

ccaggctcgg aagaacttgc tcaaatacaa gcagaccgtg cctctgctcc ttctgtctcg 5460

agacacctcc tcgggtaccg ttacatacga caaacagaag ccagatgtct tggtggtcga 5520

ctacactgtc aacaagttcg atcgaaactc catcctgcag ggatttctcg ttgcttccga 5580

cattttgtac atcgagggtg ccaaggagat tctgtctccc caggcttggg tgcccacctt 5640

caagagcaac aagcccaagc acgccagatc catcaaggac gaggactacg tcaagtggcg 5700

agaaaccgtg gccaagattc cctttgattc ctacggctcg ccttacggtt ctgctcatca 5760

gatgtcctcg tgtcgaatgt ctggcaaggg acccggatac ggtgcctgcg ataccaaggg 5820

acgactcttc gagtgcaaca atgtgtacgt tgcagacgcc tccgtcatgc ctactgcttc 5880

tggagtcaac cccatgatta ccacaatggc ctttgcacga cacgttgctc tctgtctggc 5940

caaggacctt caaccccaga ccaagctgta agcggccgca tgagaagata aatatataaa 6000

tacattgaga tattaaatgc gctagattag agagcctcat actgctcgga gagaagccaa 6060

gacgagtact caaaggggat tacaccatcc atatccacag acacaagctg gggaaaggtt 6120

ctatatacac tttccggaat accgtagttt ccgatgttat caatgggggc agccaggatt 6180

tcaggcactt cggtgtctcg gggtgaaatg gcgttcttgg cctccatcaa gtcgtaccat 6240

gtcttcattt gcctgtcaaa gtaaaacaga agcagatgaa gaatgaactt gaagtgaagg 6300

aatttaaata agtttgcaaa aagatcgtat tatagttgga gcaagggaga aatgtagagt 6360

gtgaaagact cactatggtc cgggcttatc tcgaccaata gccaaagtct ggagtttctg 6420

agagaaaaag gcaagatacg tatgtaacaa agcgacgcat ggtacaataa taccggaggc 6480

atgtatcata gagagttagt ggttcgatga tggcactggt gcctggtatg actttatacg 6540

gctgactaca tatttgtcct cagacataca attacagtca agcacttacc cttggacatc 6600

tgtaggtacc ccccggccaa gacgatctca gcgtgtcgta tgtcggattg gcgtagctcc 6660

ctcgctcgtc aattggctcc catctacttt cttctgcttg gctacaccca gcatgtctgc 6720

tatggctcgt tttcgtgcct tatctatcct cccagtatta ccaactctaa atgacatgat 6780

gtgattgggt ctacactttc atatcagaga taaggagtag cacagttgca taaaaagccc 6840

aactctaatc agcttcttcc tttcttgtaa ttagtacaaa ggtgattagc gaaatctgga 6900

agcttagttg gccctaaaaa aatcaaaaaa agcaaaaaac gaaaaacgaa aaaccacagt 6960

tttgagaaca gggaggtaac gaaggatcgt atatatatat atatatatat atacccacgg 7020

atcccgagac cggcctttga ttcttcccta caaccaacca ttctcaccac cctaattcac 7080

aaccatggct cccttcctgc ccgaccaggt cgactacaag cacgtcgata ccctcatgct 7140

gctgtgcgac ggcatcattc acgagactac cgtggacgag atcaaggatg tcattgctcc 7200

tgactttcca gccgacaagt acgaggaata cgttcgaacc ttcacaaagc cctccgagac 7260

tcccggtttc cgagagaccg tgtacaacac cgtcaatgcc aacactatgg atgccatcca 7320

tcagttcatt atcctgacca acgttctcgg atctcgagtc cttgctcctg ccctgaccaa 7380

ctccttgact cccatcaagg acatgtctct cgaagaccgg gagaagctgc ttgcctcgtg 7440

gcgagattct cccattgctg ccaagcggaa gctgttcaga ctcgtgtcca cgcttactct 7500

ggtcaccttt acacgacttg ccaacgagtt gcatctcaag gccattcact atccaggacg 7560

agaagaccga gagaaggctt acgagaccca ggagatcgac cccttcaagt accagtttct 7620

ggagaaaccc aagttctacg gcgcagagct gtacctccca gacattgatg tcatcattat 7680

cggatctggt gccggagctg gtgtcgttgc ccatactctc accaacgacg gcttcaagtc 7740

cctggttctc gaaaagggca gatactttag caactccgag ctcaacttcg acgataagga 7800

cggtgttcag gagctgtacc aatctggagg taccttgact accgtcaatc agcaactctt 7860

cgtgcttgct ggttccactt ttggaggtgg cactaccgtc aactggtctg cctgtctcaa 7920

gacgcccttc aaggtgcgga aggagtggta cgacgagttc ggcgtcgatt ttgctgccga 7980

cgaagcctac gacaaggcac aggattacgt gtggcagcaa atgggagcct cgaccgaagg 8040

catcactcac tccttggcca acgagatcat tatcgaaggt ggcaagaaac tcggatacaa 8100

ggccaaggtc ctggaccaga actctggtgg acatcctcat caccgatgcg gcttctgtca 8160

cctcggttgc aagcacggaa tcaagcaggg ctccgtcaac aattggtttc gagacgcagc 8220

tgcccacgga tcgcagttca tgcaacaggt gcgagttctg cagattctca acaagaaagg 8280

catcgcctac ggtatcttgt gcgaggatgt cgttaccgga gccaagttta ccattactgg 8340

tcccaaaaag ttcgtggtcg ctgcaggagc cctcaacact cccagcgtgc tggtcaactc 8400

cggattcaag aacaaaaaca ttggcaagaa ccttaccttg catcccgttt ctgtcgtgtt 8460

tggcgacttc ggaaaggacg tgcaggccga tcactttcac aattccatca tgactgctct 8520

gtgttcggaa gccgctgacc tcgacggcaa gggtcatgga tgccgaattg agaccatcct 8580

gaacgcaccc ttcattcagg cttcctttct tccttggcga ggttccaacg aggccagacg 8640

agacctcctg cgatacaaca atatggtcgc gatgctgctt ctctctcgag atacaacctc 8700

gggttccgtg tcttcccatc ccaccaaacc agaagccctg gttgtcgagt acgacgtcaa 8760

caagtttgat cgaaactcca tcttgcaggc cctgcttgtc actgcagacc tgctctacat 8820

tcagggagcc aagcgaatcc tttctcctca gccctgggtg ccaatcttcg agtccgacaa 8880

gcccaaggac aagcgatcta tcaaggacga ggattacgtc gaatggcgag ccaaggttgc 8940

caagattccc ttcgacacct acggctctcc ttatggttcg gctcaccaga tgtcttcctg 9000

tcgtatgagc ggcaagggtc ccaagtacgg agccgtcgat accgacggtc gactgtttga 9060

gtgctcgaac gtgtacgttg ccgacgcttc ccttctgccc actgctagcg gtgccaaccc 9120

tatggtcaca accatgactc tcgctcgaca cgttgccctc ggcttggcag actccctgaa 9180

gaccaaagcc aagctctaag cggccgcaag tgtggatggg gaagtgagtg cccggttctg 9240

tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc gagctacgtg 9300

gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt acgatacaag 9360

cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc cgggcaacgg 9420

tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac tgcgtatcat 9480

agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgacccctc tcaggccaag 9540

cagaaggctg agtccatcaa gaaggccaac gctatcattg tcttcaacct caagaacaag 9600

gctggcaaga ccgagtcttg gtaccttgac ctcaagaacg acggtgacgt cggcaagggc 9660

aacaagtccc ccaagggtga tgctgacatc cagctcactc tctctgacga ccacttccag 9720

cagctcgttg agggtaaggc taacgcccag cgactcttca tgaccggcaa gctcaaggtt 9780

aagggcaacg tcatgaaggc tgccgccatt gagggtatcc tcaagaacgc tcagaacaac 9840

ctctaagcgc atcatttatt gattaattga tgatttacta tattgatttc gcaactgtag 9900

tgtgattgta tgtgatctgg ctcgtaggct tcagtaaata ctagacgggt atcctacgta 9960

gttgtatcat acatcgagcc tgtggttact tgtacaataa ttcgtaatgt agagataccc 10020

cttgatccat tgcctgtttc taacatacaa tgatctccac gcaataatcc cactcttgac 10080

taaaagttgc tactcttgca cggttacctc ggcatagtca cgcctctctt gtctcgtctc 10140

gaacgcacaa agtcaattga caacgccact cactcgagtg tgccccaaca gggcaccata 10200

tcgactaatt tgaggccaac tagggtgatt ttggatggaa tttgatcgga aaaaatagct 10260

gcagaaattc ctggagagaa aaattgaccg catccacatg gtttgaccaa aaaatcgtct 10320

ccatctctgt gctcaactct cctgacgaga tatgcgcgcg cacccccaca tgatgtgatt 10380

gatctcaaca aacttcaccc agacccttat ctttccggga aacttactgt ataagtggtc 10440

gtgcgaacag aaagtgtgcg cactttaggt gtctagatcc gattgttctc gttctgataa 10500

tgagccagcc ccgcgaggca atgtttttta caattgaaaa cttcgttaac cactcacatt 10560

accgtttttg ccccatattt accctctggt acactccctc ttgcatacac acacactgca 10620

gtgaaaatgc actccgttag caccgttgtg attggttcag ggcacgagtt tggtggttta 10680

aggcgcaact acatcaatat gaaaacagga gacgctgaaa aggggtaata tcggactgct 10740

gctatgttgt atgtactgca tgacgaattg gtgttattca agaccgtggc acaggttgct 10800

gcggtacgag acctggtagc ttctctaaac ggcatgtcta ggtggcgcgc cagctgcatt 10860

aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 10920

cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 10980

aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 11040

aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 11100

tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 11160

caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 11220

cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 11280

ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 11340

gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 11400

agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 11460

gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 11520

acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 11580

gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 11640

gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 11700

cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 11760

caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 11820

gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 11880

cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 11940

cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 12000

caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 12060

gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 12120

gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 12180

cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 12240

catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 12300

gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 12360

ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 12420

gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 12480

cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 12540

tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 12600

gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 12660

atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 12720

ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 12780

gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 12840

atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gaaattgtaa 12900

gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc 12960

aataggccga aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga 13020

gtgttgttcc agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag 13080

ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt 13140

ttttggggtc gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta 13200

gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag 13260

cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 13320

cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca actgttggga 13380

agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 13440

aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 13500

cagtgaattg taatacgact cactataggg cgaattgggc ccgacgtcgc atgcgtcact 13560

aatcaaggat acctaccatg ccactatgat gtttgcagga ggtgtacctc ggcagtcatc 13620

aaaaaatgga actactggct ttagatcttg ttgtatggca tcgcgcctaa aaaagaaacc 13680

cccttccagc gagctactac aagtagttgt agttgcgggc gttggatacc gaaagtcaca 13740

agcacatgtc gaagctctca tctgaaacac cgacagtcgt ctgcaccccg caagtctcgg 13800

ttcgtaccag caccaatgtt aggcagaact atacacaaga gggcggacga tcacttcggc 13860

gttaggcaac tgaaggctat tttcggctgg tactgtaggg gacagaggaa acgcaagtga 13920

ttagtaaatc ggataatagg cctgttagtt taccgaaatg gtgggggagg ggttccgtgg 13980

atatcttgaa gttatggagg ctgatcgtta tttgtgggga tggatatcat tgtatggaca 14040

tactgtagct actgtataaa caacggatct tacacctgcc tcttgtatgc ccattgcttg 14100

atcatctatc gtgttactgt acatatacaa tagatatagg gaagaaaagc cggaagtaga 14160

gaccatagtc tggcagaagt aacggcctcg ggtcgagaga actataacaa agtccaacgg 14220

cgggtcttag aatagcccca aggatcacac agttccgcaa tccagtttca catgttccgt 14280

tgcatggact tttgcatgtc tactgttgct acgattcccc cattgcaacc acagtttggg 14340

gttaccccgc attatattag catgattacg aaagagataa gtatcatatg gaacatgtga 14400

agggtagtat gcaggtccgg cggagaaaga gaatgacgtt ttcattaagc gattcgcttg 14460

gcggcttgtg ggggatgtga cgatacttac ggtaaagacc ctgtgtgaga gctggtactc 14520

gctcgttact tcgctgatct gttgggccgt caatcgaatc tcgtggaact tgcattcttc 14580

ttaactgtgt ctatacaaga cacctaatga aacatacaag ctaccgaaat cattttactc 14640

gtactgaccg gtacggtact tgcacaagta gtgaaacttc cgaaaatagc cagcctcatg 14700

catcatcgct tcaccccttc tgttgacctc aaaagcattc caacggtaaa aaattataac 14760

gccgccaact ggatggttgt gacggcgttg accaccaatg tgtgggggct ggcggtagga 14820

ccgagcttat tcgtcccaat aagctctttg gatttgattc tttggggtgt gtggtaaaat 14880

tcacatgggg aagaacacgg tggcagtttg aggcagaggc ccagcgtgta gttcctaggg 14940

catgaatata ccgaactcat ggcgcagaat tgagctgaat gcgcaaaaag ctacaggatc 15000

aaccgcgtta gaaatgccgc aaatgtccac taattccccg gactgttcca aatgattctg 15060

tggggataaa tctcaaactg ggttaggctt tgtcacgttt ctttgtgtcg tgtcggttcg 15120

tccggggcaa tgtgcccacg cttggctgtc tccctacacc tcggtaaaaa ctatcacatg 15180

ctgcccctct cgagcaagca ttaaatgcat atagtcaatc taacgacata tatataggta 15240

gggtgcatcc tccggtttag ctccccagaa tatctcttat tcattacaca aaaacaacaa 15300

tgtctctcaa ggtcgacggc ttcacttctt aattaacttt ggccggaatt cctttacctg 15360

caggataact tcgtataatg tatgctatac gaagttatga tctctctctt gagcttttcc 15420

ataacaagtt cttctgcctc caggaagtcc atgggtggtt tgatcatggt tttggtgtag 15480

tggtagtgca gtggtggtat tgtgactggg gatgtagttg agaataagtc atacacaagt 15540

cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac tgtacccagc 15600

atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg gatacacagg 15660

ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac aagctgaaca 15720

agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc atagtctaac 15780

ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg cttggcctcc 15840

tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat atccgttccg 15900

gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc cttgtcgtca 15960

agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg tcggttctgg 16020

gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt ctgcttggag 16080

tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag cagacctctg 16140

gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt ctcgtagtca 16200

gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg caggccagca 16260

atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc ggcgattcgg 16320

tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct gtcctcgaac 16380

aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc ggcgtaggtg 16440

aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc gaccttatcg 16500

gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag gttggttttc 16560

ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac gttagctcga 16620

gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta gtctgcagaa 16680

ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata gttacgagtt 16740

agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga aagaacgtca 16800

atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa gccagcaatg 16860

acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt cagacccaca 16920

gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt ggagtcgtac 16980

tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgcgataact tcgtataatg 17040

tatgctatac gaagttatcg tacgatagtt agtagacaac aat 17083

<210> 99

<211> 2115

<212> DNA

<213> 人工序列

<220>

<223> CtFAO1M (FAO)

<400> 99

atggctccct tcctgcccga ccaggtcgac tacaagcacg tcgataccct catgctgctg 60

tgcgacggca tcattcacga gactaccgtg gacgagatca aggatgtcat tgctcctgac 120

tttccagccg acaagtacga ggaatacgtt cgaaccttca caaagccctc cgagactccc 180

ggtttccgag agaccgtgta caacaccgtc aatgccaaca ctatggatgc catccatcag 240

ttcattatcc tgaccaacgt tctcggatct cgagtccttg ctcctgccct gaccaactcc 300

ttgactccca tcaaggacat gtctctcgaa gaccgggaga agctgcttgc ctcgtggcga 360

gattctccca ttgctgccaa gcggaagctg ttcagactcg tgtccacgct tactctggtc 420

acctttacac gacttgccaa cgagttgcat ctcaaggcca ttcactatcc aggacgagaa 480

gaccgagaga aggcttacga gacccaggag atcgacccct tcaagtacca gtttctggag 540

aaacccaagt tctacggcgc agagctgtac ctcccagaca ttgatgtcat cattatcgga 600

tctggtgccg gagctggtgt cgttgcccat actctcacca acgacggctt caagtccctg 660

gttctcgaaa agggcagata ctttagcaac tccgagctca acttcgacga taaggacggt 720

gttcaggagc tgtaccaatc tggaggtacc ttgactaccg tcaatcagca actcttcgtg 780

cttgctggtt ccacttttgg aggtggcact accgtcaact ggtctgcctg tctcaagacg 840

cccttcaagg tgcggaagga gtggtacgac gagttcggcg tcgattttgc tgccgacgaa 900

gcctacgaca aggcacagga ttacgtgtgg cagcaaatgg gagcctcgac cgaaggcatc 960

actcactcct tggccaacga gatcattatc gaaggtggca agaaactcgg atacaaggcc 1020

aaggtcctgg accagaactc tggtggacat cctcatcacc gatgcggctt ctgtcacctc 1080

ggttgcaagc acggaatcaa gcagggctcc gtcaacaatt ggtttcgaga cgcagctgcc 1140

cacggatcgc agttcatgca acaggtgcga gttctgcaga ttctcaacaa gaaaggcatc 1200

gcctacggta tcttgtgcga ggatgtcgtt accggagcca agtttaccat tactggtccc 1260

aaaaagttcg tggtcgctgc aggagccctc aacactccca gcgtgctggt caactccgga 1320

ttcaagaaca aaaacattgg caagaacctt accttgcatc ccgtttctgt cgtgtttggc 1380

gacttcggaa aggacgtgca ggccgatcac tttcacaatt ccatcatgac tgctctgtgt 1440

tcggaagccg ctgacctcga cggcaagggt catggatgcc gaattgagac catcctgaac 1500

gcacccttca ttcaggcttc ctttcttcct tggcgaggtt ccaacgaggc cagacgagac 1560

ctcctgcgat acaacaatat ggtcgcgatg ctgcttctct ctcgagatac aacctcgggt 1620

tccgtgtctt cccatcccac caaaccagaa gccctggttg tcgagtacga cgtcaacaag 1680

tttgatcgaa actccatctt gcaggccctg cttgtcactg cagacctgct ctacattcag 1740

ggagccaagc gaatcctttc tcctcagccc tgggtgccaa tcttcgagtc cgacaagccc 1800

aaggacaagc gatctatcaa ggacgaggat tacgtcgaat ggcgagccaa ggttgccaag 1860

attcccttcg acacctacgg ctctccttat ggttcggctc accagatgtc ttcctgtcgt 1920

atgagcggca agggtcccaa gtacggagcc gtcgataccg acggtcgact gtttgagtgc 1980

tcgaacgtgt acgttgccga cgcttccctt ctgcccactg ctagcggtgc caaccctatg 2040

gtcacaacca tgactctcgc tcgacacgtt gccctcggct tggcagactc cctgaagacc 2100

aaagccaagc tctaa 2115

<210> 100

<211> 704

<212> PRT

<213> 人工序列

<220>

<223> CtFAO1M (FAO)蛋白质

<400> 100

Met Ala Pro Phe Leu Pro Asp Gln Val Asp Tyr Lys His Val Asp Thr

1 5 10 15

Leu Met Leu Leu Cys Asp Gly Ile Ile His Glu Thr Thr Val Asp Glu

20 25 30

Ile Lys Asp Val Ile Ala Pro Asp Phe Pro Ala Asp Lys Tyr Glu Glu

35 40 45

Tyr Val Arg Thr Phe Thr Lys Pro Ser Glu Thr Pro Gly Phe Arg Glu

50 55 60

Thr Val Tyr Asn Thr Val Asn Ala Asn Thr Met Asp Ala Ile His Gln

65 70 75 80

Phe Ile Ile Leu Thr Asn Val Leu Gly Ser Arg Val Leu Ala Pro Ala

85 90 95

Leu Thr Asn Ser Leu Thr Pro Ile Lys Asp Met Ser Leu Glu Asp Arg

100 105 110

Glu Lys Leu Leu Ala Ser Trp Arg Asp Ser Pro Ile Ala Ala Lys Arg

115 120 125

Lys Leu Phe Arg Leu Val Ser Thr Leu Thr Leu Val Thr Phe Thr Arg

130 135 140

Leu Ala Asn Glu Leu His Leu Lys Ala Ile His Tyr Pro Gly Arg Glu

145 150 155 160

Asp Arg Glu Lys Ala Tyr Glu Thr Gln Glu Ile Asp Pro Phe Lys Tyr

165 170 175

Gln Phe Leu Glu Lys Pro Lys Phe Tyr Gly Ala Glu Leu Tyr Leu Pro

180 185 190

Asp Ile Asp Val Ile Ile Ile Gly Ser Gly Ala Gly Ala Gly Val Val

195 200 205

Ala His Thr Leu Thr Asn Asp Gly Phe Lys Ser Leu Val Leu Glu Lys

210 215 220

Gly Arg Tyr Phe Ser Asn Ser Glu Leu Asn Phe Asp Asp Lys Asp Gly

225 230 235 240

Val Gln Glu Leu Tyr Gln Ser Gly Gly Thr Leu Thr Thr Val Asn Gln

245 250 255

Gln Leu Phe Val Leu Ala Gly Ser Thr Phe Gly Gly Gly Thr Thr Val

260 265 270

Asn Trp Ser Ala Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp

275 280 285

Tyr Asp Glu Phe Gly Val Asp Phe Ala Ala Asp Glu Ala Tyr Asp Lys

290 295 300

Ala Gln Asp Tyr Val Trp Gln Gln Met Gly Ala Ser Thr Glu Gly Ile

305 310 315 320

Thr His Ser Leu Ala Asn Glu Ile Ile Ile Glu Gly Gly Lys Lys Leu

325 330 335

Gly Tyr Lys Ala Lys Val Leu Asp Gln Asn Ser Gly Gly His Pro His

340 345 350

His Arg Cys Gly Phe Cys His Leu Gly Cys Lys His Gly Ile Lys Gln

355 360 365

Gly Ser Val Asn Asn Trp Phe Arg Asp Ala Ala Ala His Gly Ser Gln

370 375 380

Phe Met Gln Gln Val Arg Val Leu Gln Ile Leu Asn Lys Lys Gly Ile

385 390 395 400

Ala Tyr Gly Ile Leu Cys Glu Asp Val Val Thr Gly Ala Lys Phe Thr

405 410 415

Ile Thr Gly Pro Lys Lys Phe Val Val Ala Ala Gly Ala Leu Asn Thr

420 425 430

Pro Ser Val Leu Val Asn Ser Gly Phe Lys Asn Lys Asn Ile Gly Lys

435 440 445

Asn Leu Thr Leu His Pro Val Ser Val Val Phe Gly Asp Phe Gly Lys

450 455 460

Asp Val Gln Ala Asp His Phe His Asn Ser Ile Met Thr Ala Leu Cys

465 470 475 480

Ser Glu Ala Ala Asp Leu Asp Gly Lys Gly His Gly Cys Arg Ile Glu

485 490 495

Thr Ile Leu Asn Ala Pro Phe Ile Gln Ala Ser Phe Leu Pro Trp Arg

500 505 510

Gly Ser Asn Glu Ala Arg Arg Asp Leu Leu Arg Tyr Asn Asn Met Val

515 520 525

Ala Met Leu Leu Leu Ser Arg Asp Thr Thr Ser Gly Ser Val Ser Ser

530 535 540

His Pro Thr Lys Pro Glu Ala Leu Val Val Glu Tyr Asp Val Asn Lys

545 550 555 560

Phe Asp Arg Asn Ser Ile Leu Gln Ala Leu Leu Val Thr Ala Asp Leu

565 570 575

Leu Tyr Ile Gln Gly Ala Lys Arg Ile Leu Ser Pro Gln Pro Trp Val

580 585 590

Pro Ile Phe Glu Ser Asp Lys Pro Lys Asp Lys Arg Ser Ile Lys Asp

595 600 605

Glu Asp Tyr Val Glu Trp Arg Ala Lys Val Ala Lys Ile Pro Phe Asp

610 615 620

Thr Tyr Gly Ser Pro Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg

625 630 635 640

Met Ser Gly Lys Gly Pro Lys Tyr Gly Ala Val Asp Thr Asp Gly Arg

645 650 655

Leu Phe Glu Cys Ser Asn Val Tyr Val Ala Asp Ala Ser Leu Leu Pro

660 665 670

Thr Ala Ser Gly Ala Asn Pro Met Val Thr Thr Met Thr Leu Ala Arg

675 680 685

His Val Ala Leu Gly Leu Ala Asp Ser Leu Lys Thr Lys Ala Lys Leu

690 695 700

<210> 101

<211> 2100

<212> DNA

<213> 人工序列

<220>

<223> CcFAO1 (FAO)

<400> 101

atggcctccc accaggtcga ggaccacgat ctggacgtgt tctgcctcct ggccgacgct 60

gttctccacg agattcctcc ctccgaaatc gtcgagtacc ttcatcccga tttccccaag 120

gacaagatcg aagagtacct gaccggcttt tctcgaccct ccgccgttcc tcagttccga 180

cagtgtgcca agaaactcat caaccgaggt tccgagctgt cgatcaagct cttcctttac 240

ttgaccactg ctctggactc tcgaatcctt gcaccagccc tgaccaactc gctcactctg 300

atcagagaca tggatctttc ccagcgagag gaactgttgc ggtcctggcg agattctcca 360

ctgactgcca agcgaagact ctttcgagtc tacgcctcct ttaccctgtc tacattcaac 420

aagctcggaa ccgacttgca cttcaaggcc ctgggctacc ctggtcgaga gctccggacc 480

cagattcaag actacgaggt cgatcccttt cgatactcgt tcatggagaa gctcaaacac 540

gagggacatg aactgttcct tcccgatatc gacgttctga tcattggctc tggatccggt 600

gcaggcgtgg tcgctcagac tcttaccgag agcggactca agtctctggt tctcgagaag 660

ggcaagtact ttgcctccga agagctgtgc atgaccgatc tcgacggaaa cgaggccctg 720

ttcgaaagcg gtggcactat tccttccacc aatcaacagt tgttcatgat cgctggatct 780

acttttggtg gaggctccac cgtcaactgg tctgcctgtc tcaagactcc cttcaaggtt 840

cgaaaggagt ggtacgacga tttcggactg gactttgtgg ctacccagca atacgacgat 900

tgcatggact acgtgtggaa gaaaatgggt gcctcgaccg agcacatcga gcattctgct 960

gcaaatgccg tcatcatgga cggagctgcc aagcttggct acgctcaccg agccctcgag 1020

cagaacaccg gtggccatgt tcacgactgt ggaatgtgcc acctgggctg tcgattcggt 1080

atcaagcagg gaggcgtcaa ctgctggttt cgagaaccct ccgagaaggg ttccaagttc 1140

atggagcagg tcgttgtcga gaagattctg cagcacaagg gcaaggccac tggaattctc 1200

tgcagagata ccgagtctgg catcaagttc aagattactg gacccaagaa atacgtcgtg 1260

tccggtggct ctttgcagac ccctgttctc cttcagaagt ctggcttcaa gaacaagcac 1320

attggagcca acctcaagct gcatcccgtc tcggttgctc ttggcgactt tggtaacgag 1380

gtggacttcg aagcctacaa gcgacccctc atgaccgcag tctgcaatgc cgtggacgat 1440

ctggacggca aggctcacgg aacacgaatc gaggccattc tgcacgctcc ttacgtcact 1500

gctcccttct atccctggca gtccggtgcc caggctcgga agaacttgct caaatacaag 1560

cagaccgtgc ctctgctcct tctgtctcga gacacctcct cgggtaccgt tacatacgac 1620

aaacagaagc cagatgtctt ggtggtcgac tacactgtca acaagttcga tcgaaactcc 1680

atcctgcagg gatttctcgt tgcttccgac attttgtaca tcgagggtgc caaggagatt 1740

ctgtctcccc aggcttgggt gcccaccttc aagagcaaca agcccaagca cgccagatcc 1800

atcaaggacg aggactacgt caagtggcga gaaaccgtgg ccaagattcc ctttgattcc 1860

tacggctcgc cttacggttc tgctcatcag atgtcctcgt gtcgaatgtc tggcaaggga 1920

cccggatacg gtgcctgcga taccaaggga cgactcttcg agtgcaacaa tgtgtacgtt 1980

gcagacgcct ccgtcatgcc tactgcttct ggagtcaacc ccatgattac cacaatggcc 2040

tttgcacgac acgttgctct ctgtctggcc aaggaccttc aaccccagac caagctgtaa 2100

<210> 102

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> CcFAO1 (FAO)蛋白质

<400> 102

Met Ala Ser His Gln Val Glu Asp His Asp Leu Asp Val Phe Cys Leu

1 5 10 15

Leu Ala Asp Ala Val Leu His Glu Ile Pro Pro Ser Glu Ile Val Glu

20 25 30

Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Ile Glu Glu Tyr Leu Thr

35 40 45

Gly Phe Ser Arg Pro Ser Ala Val Pro Gln Phe Arg Gln Cys Ala Lys

50 55 60

Lys Leu Ile Asn Arg Gly Ser Glu Leu Ser Ile Lys Leu Phe Leu Tyr

65 70 75 80

Leu Thr Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn

85 90 95

Ser Leu Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu

100 105 110

Leu Arg Ser Trp Arg Asp Ser Pro Leu Thr Ala Lys Arg Arg Leu Phe

115 120 125

Arg Val Tyr Ala Ser Phe Thr Leu Ser Thr Phe Asn Lys Leu Gly Thr

130 135 140

Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr

145 150 155 160

Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Ser Phe Met Glu

165 170 175

Lys Leu Lys His Glu Gly His Glu Leu Phe Leu Pro Asp Ile Asp Val

180 185 190

Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu

195 200 205

Thr Glu Ser Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe

210 215 220

Ala Ser Glu Glu Leu Cys Met Thr Asp Leu Asp Gly Asn Glu Ala Leu

225 230 235 240

Phe Glu Ser Gly Gly Thr Ile Pro Ser Thr Asn Gln Gln Leu Phe Met

245 250 255

Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala

260 265 270

Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asp Phe

275 280 285

Gly Leu Asp Phe Val Ala Thr Gln Gln Tyr Asp Asp Cys Met Asp Tyr

290 295 300

Val Trp Lys Lys Met Gly Ala Ser Thr Glu His Ile Glu His Ser Ala

305 310 315 320

Ala Asn Ala Val Ile Met Asp Gly Ala Ala Lys Leu Gly Tyr Ala His

325 330 335

Arg Ala Leu Glu Gln Asn Thr Gly Gly His Val His Asp Cys Gly Met

340 345 350

Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Gly Val Asn Cys

355 360 365

Trp Phe Arg Glu Pro Ser Glu Lys Gly Ser Lys Phe Met Glu Gln Val

370 375 380

Val Val Glu Lys Ile Leu Gln His Lys Gly Lys Ala Thr Gly Ile Leu

385 390 395 400

Cys Arg Asp Thr Glu Ser Gly Ile Lys Phe Lys Ile Thr Gly Pro Lys

405 410 415

Lys Tyr Val Val Ser Gly Gly Ser Leu Gln Thr Pro Val Leu Leu Gln

420 425 430

Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His

435 440 445

Pro Val Ser Val Ala Leu Gly Asp Phe Gly Asn Glu Val Asp Phe Glu

450 455 460

Ala Tyr Lys Arg Pro Leu Met Thr Ala Val Cys Asn Ala Val Asp Asp

465 470 475 480

Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Ile Leu His Ala

485 490 495

Pro Tyr Val Thr Ala Pro Phe Tyr Pro Trp Gln Ser Gly Ala Gln Ala

500 505 510

Arg Lys Asn Leu Leu Lys Tyr Lys Gln Thr Val Pro Leu Leu Leu Leu

515 520 525

Ser Arg Asp Thr Ser Ser Gly Thr Val Thr Tyr Asp Lys Gln Lys Pro

530 535 540

Asp Val Leu Val Val Asp Tyr Thr Val Asn Lys Phe Asp Arg Asn Ser

545 550 555 560

Ile Leu Gln Gly Phe Leu Val Ala Ser Asp Ile Leu Tyr Ile Glu Gly

565 570 575

Ala Lys Glu Ile Leu Ser Pro Gln Ala Trp Val Pro Thr Phe Lys Ser

580 585 590

Asn Lys Pro Lys His Ala Arg Ser Ile Lys Asp Glu Asp Tyr Val Lys

595 600 605

Trp Arg Glu Thr Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser Pro

610 615 620

Tyr Gly Ser Ala His Gln Met Ser Ser Cys Arg Met Ser Gly Lys Gly

625 630 635 640

Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Arg Leu Phe Glu Cys Asn

645 650 655

Asn Val Tyr Val Ala Asp Ala Ser Val Met Pro Thr Ala Ser Gly Val

660 665 670

Asn Pro Met Ile Thr Thr Met Ala Phe Ala Arg His Val Ala Leu Cys

675 680 685

Leu Ala Lys Asp Leu Gln Pro Gln Thr Lys Leu

690 695

<210> 103

<211> 2100

<212> DNA

<213> 人工序列

<220>

<223> CcFAO2 (FAO)

<400> 103

atggccaacc ccgtcgtgga ggactcccat ctggacgtct tctgcctcct tgccgatgct 60

gtggttcacg agattcctcc ctccgagatc gtcgagtacc tgcatcctga ctttcccaag 120

gacaaggtcg aagagtacct tgccgagttc tctcatccct ccgctattcc agagttccga 180

gaggttgcca agcgaatcat taacaagggc accgtgctgt cgatcaagct ctttctgctc 240

ttggccactg ctctggattc tcgaatcctt gctcctgcct tgaccaactc cactacactc 300

atccgagaca tggatctttc tcagcgggag gaactcctga gatcctggcg agactctccc 360

ttcactacca aacgaaagct gttccgagtc tacaactcgt ttaccctcaa cgccttcagc 420

aagactgcta ccgaccttca cttcaaggcc ctgggatacc ctggtcgaga gctccgtact 480

cagattcagg actacgaggt cgatcccttt cgatacacgt tcctggagaa gcctcagcaa 540

gacggacagg agctccactt tcccgacatt gatgtgctca ttatcggatc tggctccggt 600

gcaggcgtcg ttgctcagac tctttcggag aacggactca agtctctggt gctcgagaag 660

ggcaaatact tttccaacga cgagctgacc atgaacgacc tcgaaggttc cgaggccctg 720

ttcgaaaacg gaggtgctct ctcctctacc aatcaacaga tctttatcat tgccggatcg 780

actttcggtg gcggatccac agtcaactgg tctgcctgtc tcaagactcc cttcaaggtg 840

cgaaaggagt ggtacgacaa ctttggactg gatttcgttg ctacccagta ttacgaggac 900

tgtatggact acgtctggaa gaaaatgggt gcctccaacg agaatatcga ccattctgga 960

gccaactcgg tcattctgga aggttccaag aaacttggct accctcaccg tgccgtggaa 1020

cagaacaatg gaggcaagat tcacgactgt ggtatgtgcc acctcggatg tcgatttggc 1080

atcaagcagg gatcggtcaa ctgctggttt cgtggtccct ccgagaacgg ctcgaagttc 1140

atgcagcaag ttctcgtgga caagatcctg cagcgagatg gcaaggctgt cggtgttctc 1200

tgtagagacg tggttaccgg agtcaagttc aagatcactg gacccaagaa aatcgtcgtg 1260

ttctggtggt tctttgccaa ctccggattt gttaccaagt ctggtttcaa gaacaagcac 1320

atcggtgcaa acctcaagct gcatcccgtc agccttacgc tcggcgactt tggtaacaat 1380

gtggatttcg aggcctaccg aaagccaatc atgacctcca tttgtaacaa ggtcgaggac 1440

ctggatggaa aggctcacgg cactcgaatc gaggccatgc tcaatgctcc ctacggtgtt 1500

gctccattct ttccctggaa gtctggcgca gagtcccgaa aggacctcct gcgatacaag 1560

cagactgtgc ccattctcct gctttccaga gacaccactt ctggatccgt cacctacgac 1620

aaacagaagc ccgatgcctt ggtgatcgac tacctgctca acaagttcga ccgaaactcc 1680

atcctgcagg gctttctcat tgcttcggat cttctgtaca tcgagggtgc cagccgagac 1740

catgttacct acaagcttgg ataccagtgg ttcaagtctt ccaagcccaa gcacgctcga 1800

tccatcgaag acgaggacta cgtcaactgg agagccaagg ttgcaaagat tccctttgat 1860

tcctatggat ctccttacgg ttcggctcac cagatgtcca cttgcagaat gtctggcaag 1920

ggaccaggct acggagcctg cgacaccaag ggcaaactct tcgagtgcag caacgtgtac 1980

gtcgccgatg cttccactct gcccaccgca tctggtgcca accctatggt ctctaccatg 2040

tcctttgccc gacacgtgtc gcttggcatc gtcaaggagc tgcagcaatc caagctctaa 2100

<210> 104

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> CcFAO2 (FAO)蛋白质

<400> 104

Met Ala Asn Pro Val Val Glu Asp Ser His Leu Asp Val Phe Cys Leu

1 5 10 15

Leu Ala Asp Ala Val Val His Glu Ile Pro Pro Ser Glu Ile Val Glu

20 25 30

Tyr Leu His Pro Asp Phe Pro Lys Asp Lys Val Glu Glu Tyr Leu Ala

35 40 45

Glu Phe Ser His Pro Ser Ala Ile Pro Glu Phe Arg Glu Val Ala Lys

50 55 60

Arg Ile Ile Asn Lys Gly Thr Val Leu Ser Ile Lys Leu Phe Leu Leu

65 70 75 80

Leu Ala Thr Ala Leu Asp Ser Arg Ile Leu Ala Pro Ala Leu Thr Asn

85 90 95

Ser Thr Thr Leu Ile Arg Asp Met Asp Leu Ser Gln Arg Glu Glu Leu

100 105 110

Leu Arg Ser Trp Arg Asp Ser Pro Phe Thr Thr Lys Arg Lys Leu Phe

115 120 125

Arg Val Tyr Asn Ser Phe Thr Leu Asn Ala Phe Ser Lys Thr Ala Thr

130 135 140

Asp Leu His Phe Lys Ala Leu Gly Tyr Pro Gly Arg Glu Leu Arg Thr

145 150 155 160

Gln Ile Gln Asp Tyr Glu Val Asp Pro Phe Arg Tyr Thr Phe Leu Glu

165 170 175

Lys Pro Gln Gln Asp Gly Gln Glu Leu His Phe Pro Asp Ile Asp Val

180 185 190

Leu Ile Ile Gly Ser Gly Ser Gly Ala Gly Val Val Ala Gln Thr Leu

195 200 205

Ser Glu Asn Gly Leu Lys Ser Leu Val Leu Glu Lys Gly Lys Tyr Phe

210 215 220

Ser Asn Asp Glu Leu Thr Met Asn Asp Leu Glu Gly Ser Glu Ala Leu

225 230 235 240

Phe Glu Asn Gly Gly Ala Leu Ser Ser Thr Asn Gln Gln Ile Phe Ile

245 250 255

Ile Ala Gly Ser Thr Phe Gly Gly Gly Ser Thr Val Asn Trp Ser Ala

260 265 270

Cys Leu Lys Thr Pro Phe Lys Val Arg Lys Glu Trp Tyr Asp Asn Phe

275 280 285

Gly Leu Asp Phe Val Ala Thr Gln Tyr Tyr Glu Asp Cys Met Asp Tyr

290 295 300

Val Trp Lys Lys Met Gly Ala Ser Asn Glu Asn Ile Asp His Ser Gly

305 310 315 320

Ala Asn Ser Val Ile Leu Glu Gly Ser Lys Lys Leu Gly Tyr Pro His

325 330 335

Arg Ala Val Glu Gln Asn Asn Gly Gly Lys Ile His Asp Cys Gly Met

340 345 350

Cys His Leu Gly Cys Arg Phe Gly Ile Lys Gln Gly Ser Val Asn Cys

355 360 365

Trp Phe Arg Gly Pro Ser Glu Asn Gly Ser Lys Phe Met Gln Gln Val

370 375 380

Leu Val Asp Lys Ile Leu Gln Arg Asp Gly Lys Ala Val Gly Val Leu

385 390 395 400

Cys Arg Asp Val Val Thr Gly Val Lys Phe Lys Ile Thr Gly Pro Lys

405 410 415

Lys Ile Val Val Phe Trp Trp Phe Phe Ala Asn Ser Gly Phe Val Thr

420 425 430

Lys Ser Gly Phe Lys Asn Lys His Ile Gly Ala Asn Leu Lys Leu His

435 440 445

Pro Val Ser Leu Thr Leu Gly Asp Phe Gly Asn Asn Val Asp Phe Glu

450 455 460

Ala Tyr Arg Lys Pro Ile Met Thr Ser Ile Cys Asn Lys Val Glu Asp

465 470 475 480

Leu Asp Gly Lys Ala His Gly Thr Arg Ile Glu Ala Met Leu Asn Ala

485 490 495

Pro Tyr Gly Val Ala Pro Phe Phe Pro Trp Lys Ser Gly Ala Glu Ser

500 505 510

Arg Lys Asp Leu Leu Arg Tyr Lys Gln Thr Val Pro Ile Leu Leu Leu

515 520 525

Ser Arg Asp Thr Thr Ser Gly Ser Val Thr Tyr Asp Lys Gln Lys Pro

530 535 540

Asp Ala Leu Val Ile Asp Tyr Leu Leu Asn Lys Phe Asp Arg Asn Ser

545 550 555 560

Ile Leu Gln Gly Phe Leu Ile Ala Ser Asp Leu Leu Tyr Ile Glu Gly

565 570 575

Ala Ser Arg Asp His Val Thr Tyr Lys Leu Gly Tyr Gln Trp Phe Lys

580 585 590

Ser Ser Lys Pro Lys His Ala Arg Ser Ile Glu Asp Glu Asp Tyr Val

595 600 605

Asn Trp Arg Ala Lys Val Ala Lys Ile Pro Phe Asp Ser Tyr Gly Ser

610 615 620

Pro Tyr Gly Ser Ala His Gln Met Ser Thr Cys Arg Met Ser Gly Lys

625 630 635 640

Gly Pro Gly Tyr Gly Ala Cys Asp Thr Lys Gly Lys Leu Phe Glu Cys

645 650 655

Ser Asn Val Tyr Val Ala Asp Ala Ser Thr Leu Pro Thr Ala Ser Gly

660 665 670

Ala Asn Pro Met Val Ser Thr Met Ser Phe Ala Arg His Val Ser Leu

675 680 685

Gly Ile Val Lys Glu Leu Gln Gln Ser Lys Leu

690 695

<210> 105

<211> 12358

<212> DNA

<213> 人工序列

<220>

<223> pZKLY-VsCPR&CYP质粒

&lt;400&gt; 105

aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540

acctcctcta actccgacct ggtccgaacc atcgagtccg ccctcggcat ttctctcggc 600

gacagcgtgt ccgattctgt cgttatcatt gccaccactt ctgctgccgt catcattgga 660

cttctggtct tcctctggcg aaagtctccc gacagatcgc gagagctgcg tcctgtcatt 720

gtgcccaagt ttaccgttaa gcacgaggac gatgaagtcg aggtggaccg aggcaaaacc 780

aaggttacag ttttctacgg aactcagacc ggtactgccg agggctttgc aaaggccctt 840

gcggaggaaa tcaaggccag atacgagaag gccgttgtca aggtggttga catggatgac 900

tacgctattg acgatgacca gtacgaggaa aagctcaaaa aggagaccct ggtcttcttt 960

atgcttgcca cctatggaga cggcgaaccc accgataacg ctgcacgatt ctacaagtgg 1020

tttaccgagg gcaaggagga acgaggaacc tggctgcagc aactcactta cggtgtgttc 1080

gccttgggca accgacagta cgagcatttc aacaagatcg gcaagattgt cgacgaggat 1140

cttaccgagc agggagccaa gcgtctggtt cccgtcggtc tcggcgacga tgaccagtcc 1200

atcgaggacg atttcaacgc ttggaaggaa accttgtggc cagagctgga ccaacttctc 1260

cgagacgagg atgacgtcaa cactgcttcg accccttaca ctgccgctat ctccgagtat 1320

cgtgtcgtta tccacgatcc taccgtgtct ccctcctacg agaaccattt caatgttgcc 1380

aacggtggag cagtgttcga cattcaccat ccctgtcgag tcaacgttgc cgtgcgacgg 1440

gaacttcaca agccccagtc cgaccgatct tgcattcacc tggagtttga tctctccggt 1500

actggcgtta catacgagac tggcgaccac gtcggagtgt acgccgagaa ctgcgacgaa 1560

actgtcgagg aagctggcaa gctgctcggt cagtcgctgg atcttctctt ttctctgcat 1620

accgacaagg aggatggcac aagccttggt ggatctctgc tccctccatt tcctggaccc 1680

tgtaccgttc gaactgccct cgcttgctac gccgaccttc ttaatcctcc acggaaagcc 1740

gctatcgtgg cacttgctgc ccatgcttcc gagcccagcg aggccgaacg actcaagttt 1800

ctttcttcgc ctcagggcaa ggacgagtac tccaagtggg tcgttggatc tcagcgatcg 1860

ctgctcgaag tcatggccga ttttccctcc gccaagcctc cactgggagt gttctttgct 1920

gccattgcac ctcgactgca gcctcgatac tattctatct cctcttcgcc cagaccagct 1980

ccccagcgag tgcacgttac ctgtgccctt gtcgagggac ccactcctac cggtcggatt 2040

cacaagggtg tgtgctccac ctggatgaag tctgctactc ccttggagaa gtctcacgac 2100

tgttcccgag cacctatctt cattcgaccc tccaacttca agcttcctgc cgaccattcg 2160

attcccatta tcatggtcgg acctggtaca ggtctggctc cctttcgagg attcctccag 2220

gaacgacttg ccctcaagga ggatggagtt cagcttggac ctgccctgct cttctttggt 2280

tgccgaaaca gacagatgga cttcatctac gaggacgaac tcaacaattt cgttcagcaa 2340

ggtgccattt ccgagctcat cgttgcgttt tctcgagagg gcccagaaaa ggagtacgtg 2400

cagcacaaga tgatggacaa ggccgagtat ctgtggtctc tcatttcgca gggaggctac 2460

ctgtacgtct gtggtgatgc caaaggcatg gctcgagacg tgcaccgatc ccttcatacc 2520

attgttcagc aacaggagaa cgcagattct tcgaaggctg aggccactgt caagaaactc 2580

cagatggacg gaagatacct gcgagacgtg tggtaagcgg ccgcatgaga agataaatat 2640

ataaatacat tgagatatta aatgcgctag attagagagc ctcatactgc tcggagagaa 2700

gccaagacga gtactcaaag gggattacac catccatatc cacagacaca agctggggaa 2760

aggttctata tacactttcc ggaataccgt agtttccgat gttatcaatg ggggcagcca 2820

ggatttcagg cacttcggtg tctcggggtg aaatggcgtt cttggcctcc atcaagtcgt 2880

accatgtctt catttgcctg tcaaagtaaa acagaagcag atgaagaatg aacttgaagt 2940

gaaggaattt aaatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct 3000

ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 3060

tgtttcctgt gtgaaattgt tatccgctca caagcttcca cacaacgtac gttgattgag 3120

gtggagccag atgggctatt gtttcatata tagactggca gccacctctt tggcccagca 3180

tgtttgtata cctggaaggg aaaactaaag aagctggcta gtttagtttg attattatag 3240

tagatgtcct aatcactaga gattagaatg tcttggcgat gattagtcgt cgtcccctgt 3300

atcatgtcta gaccaactgt gtcatgaagt tggtgctggt gttttacctg tgtactacaa 3360

gtaggtgtcc tagatctagt gtacagagcc gtttagaccc atgtggactt caccattaac 3420

gatggaaaat gttcattata tgacagtata ttacaatgga cttgctccat ttcttccttg 3480

catcacatgt tctccacctc catagttgat caacacatca tagtagctaa ggctgctgct 3540

ctcccactac agtccaccac aagttaagta gcaccgtcag tacagctaaa agtacacgtc 3600

tagtacgttt cataactagt caagtagccc ctattacaga tatcagcact atcacgcacg 3660

agtttttctc tgtgctatct aatcaacttg ccaagtattc ggagaagata cactttcttg 3720

gcatcaggta tacgagggag cctatcagat gaaaaagggt atattggatc cattcatatc 3780

cacctacacg ttgtcataat ctcctcattc acgtgattca tttcgtgaca ctagtttctc 3840

actttccccc ccgcacctat agtcaacttg gcggacacgc tacttgtagc tgacgttgat 3900

ttatagaccc aatcaaagcg ggttatcggt caggtagcac ttatcattca tcgttcatac 3960

tacgatgagc aatctcgggc atgtccggaa aagtgtcggg cgcgccagct gcattaatga 4020

atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 4080

actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4140

gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4200

cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4260

ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4320

ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4380

ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4440

agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4500

cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4560

aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4620

gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4680

agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4740

ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4800

cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4860

tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4920

aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4980

tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5040

atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5100

cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5160

gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5220

gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5280

tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5340

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5400

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5460

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5520

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5580

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5640

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5700

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5760

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5820

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5880

tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5940

tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg 6000

gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 6060

aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 6120

gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 6180

gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 6240

aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 6300

gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct 6360

tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc 6420

gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt 6480

aatgcgccgc tacagggcgc gtccattcgc cattcaggct gcgcaactgt tgggaagggc 6540

gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 6600

gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 6660

aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgca ttccgacagc 6720

agcgactggg caccatgatc aagcgaaaca ccttccccca gctgccctgg caaaccatca 6780

agaaccctac tttcatcaag tgcaagaacg gttctactct tctcacctcc ggtgtctacg 6840

gctggtgccg aaagcctaac tacaccgctg atttcatcat gtgcctcacc tgggctctca 6900

tgtgcggtgt tgcttctccc ctgccttact tctacccggt cttcttcttc ctggtgctca 6960

tccaccgagc ttaccgagac tttgagcgac tggagcgaaa gtacggtgag gactaccagg 7020

agttcaagcg acaggtccct tggatcttca tcccttatgt tttctaaacg ataagcttag 7080

tgagcgaatg gtgaggttac ttaattgagt ggccagccta tgggattgta taacagacag 7140

tcaatatatt actgaaaaga ctgaacagcc agacggagtg aggttgtgag tgaatcgtag 7200

agggcggcta ttacagcaag tctactctac agtgtactaa cacagcagag aacaaataca 7260

ggtgtgcatt cggctatctg agaattagtt ggagagctcg agaccctcgg cgataaactg 7320

ctcctcggtt ttgtgtccat acttgtacgg accattgtaa tggggcaagt cgttgagttc 7380

tcgtcgtccg acgttcagag cacagaaacc aatgtaatca atgtagcaga gatggttctg 7440

caaaagattg atttgtgcga gcaggttaat taagttgcga cacatgtctt gatagtatct 7500

tgaattctct ctcttgagct tttccataac aagttcttct gcctccagga agtccatggg 7560

tggtttgatc atggttttgg tgtagtggta gtgcagtggt ggtattgtga ctggggatgt 7620

agttgagaat aagtcataca caagtcagct ttcttcgagc ctcatataag tataagtagt 7680

tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa catgccccat 7740

tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat cagacaggtc 7800

gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct atatacacag 7860

ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag cctcccagcc 7920

agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt acagacctcg 7980

gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc ggtactgctg 8040

tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa gccagtcctc 8100

agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg ggtcggatcg 8160

ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct tgcaagacag 8220

ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga ctaggaactc 8280

cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag agacagtttc 8340

ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt gggcgttggt 8400

gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag tgttgccaat 8460

atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa gttccttgag 8520

ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg ttttgatcat 8580

gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg tggtaacatc 8640

cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc gagcggcaaa 8700

ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg tgaagaggag 8760

actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg cagtgaagta 8820

tatgttatgg taatagttac gagttagttg aacttataga tagactggac tatacggcta 8880

tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc cgacaaaaat 8940

gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg ccaaccgcgc 9000

cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca aagtgatcca 9060

agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag acagatactc 9120

gtcgaccttt tccttgggaa ccaccaccgt cagcccttct gactcacgta ttgtagccac 9180

cgacacaggc aacagtccgt ggatagcaga atatgtcttg tcggtccatt tctcaccaac 9240

tttaggcgtc aagtgaatgt tgcagaagaa gtatgtgcct tcattgagaa tcggtgttgc 9300

tgatttcaat aaagtcttga gatcagtttg gccagtcatg ttgtgggggg taattggatt 9360

gagttatcgc ctacagtctg tacaggtata ctcgctgccc actttatact ttttgattcc 9420

gctgcacttg aagcaatgtc gtttaccaaa agtgagaatg ctccacagaa cacaccccag 9480

ggtatggttg agcaaaaaat aaacactccg atacggggaa tcgaaccccg gtctccacgg 9540

ttctcaagaa gtattcttga tgagagcgta tcgattgccc cggagaagac ggccaggccg 9600

cctagatgac aaattcaaca actcacagct gactttctgc cattgccact aggggggggc 9660

ctttttatat ggccaagcca agctctccac gtcggttggg ctgcacccaa caataaatgg 9720

gtagggttgc accaacaaag ggatgggatg gggggtagaa gatacgagga taacggggct 9780

caatggcaca aataagaacg aatactgcca ttaagactcg tgatccagcg actgacacca 9840

ttgcatcatc taagggcctc aaaactacct cggaactgct gcgctgatct ggacaccaca 9900

gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca gaaaacgctg 9960

gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga gcagggtggt 10020

gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc atcaggccag 10080

attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct ggatatagcc 10140

ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg ctcggtaccc 10200

acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac caacatctta 10260

caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg gttgccagtc 10320

tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac agaattccga 10380

gccgtgagta tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat 10440

ccgaaagtcg ctagcaacac acactctcta cacaaactaa cccagctctc catggccttc 10500

cagtttcacc tggaggtcct cctgccctac ctccttcctc tgcttctgct catcctgccc 10560

accactatct tctttctcac caagcccaac aataaggtgt cctctacttc caccaacaat 10620

aacatcatta cactgcccaa gtcgtaccct ctcattggct cctacctttc gttccgaaag 10680

aacctgcatc gacggatcca gtggctctcc gacattgttc agatctctcc ctccgctacc 10740

ttccagctcg acggaaccct gggcaagcga cagatcatta ctggcaaccc ttctaccgtc 10800

cagcacattc tcaagaacca gttctccaac tatcagaagg gcaccacatt caccaacact 10860

ctgtccgact ttctcggaac aggcatcttc aacaccaacg gtcccaactg gaagtttcaa 10920

cgacaggttg cctctcacga gttcaacacc aagtccattc ggaacttcgt cgagcacatc 10980

gtggataccg aactcaccaa ccgattgatt cccatcctca cttcgagcac ccagacaaac 11040

aatatcctgg acttccagga tattctgcag cgatttacct tcgacaacat ctgcaacatt 11100

gccttcggat acgatcccga gtacctcact ccctcgacca atcgttccaa gttcgcggag 11160

gcctacgaag acgctaccga gatctccagc aagcgattca gactgcctct tcccatcatt 11220

tggaagatca aaaagtactt caacattggc tccgagaagc gactcaagga agccgtcacc 11280

gaggtccgat cctttgccaa gaaactggtc cgagagaaga aacgggagct cgaagagaag 11340

tcttcgctgg agaccgaaga catgctttct cgatttctgt ccagcggtca ctcggacgag 11400

gatttcgttg ccgacattgt catctccttc attctcgcag gcaaggacac tacctctgcc 11460

gctcttacct ggtttttctg gctgctctgg aagaaccctc gagtggagga agagatcgtc 11520

aacgagctgt ccaagaaatc ggagcttatg gtgtacgacg aggtcaagga aatggtctac 11580

acccatgctg cgctgtccga gtcgatgaga ctctaccctc ccgttccaat ggattccaag 11640

gaggccgtca acgacgatgt gctgcccgac ggctgggtgg tcaagaaagg tacaatcgtc 11700

acctaccatg tctacgctat gggtcgaatg aagtctctct ggggagacga ttgggcagag 11760

tttcgaccag aacggtggct cgagaaggac gaggtcaacg gcaagtgggt gttcgtcgga 11820

cgagacagct actcctatcc tgtgttccag gctggtccca gagtctgcct gggaaaggag 11880

atggccttca tgcagatgaa gcgaattgtg gctggcatcg tcggaaagtt caaggtggtt 11940

cccgaagccc acttggctca ggagccagga ttcatttcct ttctgtcgtc tcagatggag 12000

ggtggatttc ccgtcactat ccagaagcga gactcctaag cggccgcatt gatgattgga 12060

aacacacaca tgggttatat ctaggtgaga gttagttgga cagttatata ttaaatcagc 12120

tatgccaacg gtaacttcat tcatgtcaac gaggaaccag tgactgcaag taatatagaa 12180

tttgaccacc ttgccattct cttgcactcc tttactatat ctcatttatt tcttatatac 12240

aaatcacttc ttcttcccag catcgagctc ggaaacctca tgagcaataa catcgtggat 12300

ctcgtcaata gagggctttt tggactcctt gctgttggcc accttgtcct tgctgttt 12358

&lt;210&gt; 106

&lt;211&gt; 1296

&lt;212&gt; DNA

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 106

atggatttct tcagacggca ccagaaaaag gtgctggcac tggtaggtgt ggcgctgagt 60

tcctacctgt ttatcgacta tgtgaagaaa aagttcttcg agatccaggg tcgtttgagc 120

tcggagcgaa ccgctaaaca gaatctccgg cgccgatttg aacagaacca gcaggatgca 180

gattttacaa tcatggctct gctatccagc ttgacgacac cggtaatgga gcgttacccc 240

gtcgaccaga tcaaggcaga gttacagagc aagagacgcc ccacagaccg ggttttggct 300

ctcgagagct ccacctcgtc ctcagctacc gcacaaaccg tgcccaccat gacaagtggc 360

gccacagagg agggcgagaa gtcgaaaaca cagttgtggc aggatctcaa gcgaacgacc 420

atttcccgag cgttttctct tgtctatgca gatgcacttc ttattttctt cacgcgtttg 480

cagctcaaca ttctaggacg acgaaactac gtcaacagtg ttgtcgctct ggcgcagcag 540

ggccgagagg gtaatgccga gggtcgagtg gcgccctcgt ttggtgatct tgcagatatg 600

ggctatttcg gcgacctttc aggctcgtcc agcttcggag aaactattgt cgatcccgat 660

ctggacgaac agtaccttac cttttcgtgg tggctgctga acgagggatg ggtgtcgctg 720

agcgagcgag tggaggaagc ggttcgtcga gtgtgggacc ccgtgtcacc caaggccgaa 780

cttggatttg acgagttgtc ggaactcatt ggacgaacac agatgctcat tgatcgacct 840

ctcaatccct cgtcgccact caactttctg agccagctgc tgccaccacg ggagcaggag 900

gagtacgtgc ttgcccagaa ccccagcgat actgctgccc ccattgtagg acctaccctc 960

cgacggcttc tggacgagac tgccgacttc atcgagtccc ctaatgccgc agaggtgatt 1020

gagcgacttg ttcactccgg tctctctgtg ttcatggaca agctggctgt cacgtttgga 1080

gccacacctg ctgattcggg ttcgccttat cctgtggtgc tgcctactgc aaaggtcaag 1140

ctgccctcca ttcttgccaa catggctcga caggctggag gcatggccca gggatcgccg 1200

ggcgtggaaa acgagtacat tgacgtgatg aaccaagtgc aggagctgac ctcctttagt 1260

gctgtggtct attcatcttt tgattgggct ctctag 1296

&lt;210&gt; 107

&lt;211&gt; 431

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 107

Met Asp Phe Phe Arg Arg His Gln Lys Lys Val Leu Ala Leu Val Gly

1 5 10 15

Val Ala Leu Ser Ser Tyr Leu Phe Ile Asp Tyr Val Lys Lys Lys Phe

20 25 30

Phe Glu Ile Gln Gly Arg Leu Ser Ser Glu Arg Thr Ala Lys Gln Asn

35 40 45

Leu Arg Arg Arg Phe Glu Gln Asn Gln Gln Asp Ala Asp Phe Thr Ile

50 55 60

Met Ala Leu Leu Ser Ser Leu Thr Thr Pro Val Met Glu Arg Tyr Pro

65 70 75 80

Val Asp Gln Ile Lys Ala Glu Leu Gln Ser Lys Arg Arg Pro Thr Asp

85 90 95

Arg Val Leu Ala Leu Glu Ser Ser Thr Ser Ser Ser Ala Thr Ala Gln

100 105 110

Thr Val Pro Thr Met Thr Ser Gly Ala Thr Glu Glu Gly Glu Lys Ser

115 120 125

Lys Thr Gln Leu Trp Gln Asp Leu Lys Arg Thr Thr Ile Ser Arg Ala

130 135 140

Phe Ser Leu Val Tyr Ala Asp Ala Leu Leu Ile Phe Phe Thr Arg Leu

145 150 155 160

Gln Leu Asn Ile Leu Gly Arg Arg Asn Tyr Val Asn Ser Val Val Ala

165 170 175

Leu Ala Gln Gln Gly Arg Glu Gly Asn Ala Glu Gly Arg Val Ala Pro

180 185 190

Ser Phe Gly Asp Leu Ala Asp Met Gly Tyr Phe Gly Asp Leu Ser Gly

195 200 205

Ser Ser Ser Phe Gly Glu Thr Ile Val Asp Pro Asp Leu Asp Glu Gln

210 215 220

Tyr Leu Thr Phe Ser Trp Trp Leu Leu Asn Glu Gly Trp Val Ser Leu

225 230 235 240

Ser Glu Arg Val Glu Glu Ala Val Arg Arg Val Trp Asp Pro Val Ser

245 250 255

Pro Lys Ala Glu Leu Gly Phe Asp Glu Leu Ser Glu Leu Ile Gly Arg

260 265 270

Thr Gln Met Leu Ile Asp Arg Pro Leu Asn Pro Ser Ser Pro Leu Asn

275 280 285

Phe Leu Ser Gln Leu Leu Pro Pro Arg Glu Gln Glu Glu Tyr Val Leu

290 295 300

Ala Gln Asn Pro Ser Asp Thr Ala Ala Pro Ile Val Gly Pro Thr Leu

305 310 315 320

Arg Arg Leu Leu Asp Glu Thr Ala Asp Phe Ile Glu Ser Pro Asn Ala

325 330 335

Ala Glu Val Ile Glu Arg Leu Val His Ser Gly Leu Ser Val Phe Met

340 345 350

Asp Lys Leu Ala Val Thr Phe Gly Ala Thr Pro Ala Asp Ser Gly Ser

355 360 365

Pro Tyr Pro Val Val Leu Pro Thr Ala Lys Val Lys Leu Pro Ser Ile

370 375 380

Leu Ala Asn Met Ala Arg Gln Ala Gly Gly Met Ala Gln Gly Ser Pro

385 390 395 400

Gly Val Glu Asn Glu Tyr Ile Asp Val Met Asn Gln Val Gln Glu Leu

405 410 415

Thr Ser Phe Ser Ala Val Val Tyr Ser Ser Phe Asp Trp Ala Leu

420 425 430

&lt;210&gt; 108

&lt;211&gt; 377

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 108

Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu

1 5 10 15

Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys

20 25 30

Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly

35 40 45

Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser

50 55 60

Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val

65 70 75 80

Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe

85 90 95

Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu

100 105 110

Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro

115 120 125

Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro

130 135 140

Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg

145 150 155 160

Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser

165 170 175

Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe

180 185 190

Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile

195 200 205

Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly

210 215 220

Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile

225 230 235 240

Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser

245 250 255

Phe Val Gln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser

260 265 270

Val Glu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val

275 280 285

Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu

290 295 300

Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile

305 310 315 320

Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala

325 330 335

Pro Ala Cys Thr Pro Cys Gly His Phe Phe Cys Trp Asp Cys Ile Ser

340 345 350

Glu Trp Val Arg Glu Lys Pro Glu Cys Pro Leu Cys Arg Gln Gly Val

355 360 365

Arg Glu Gln Asn Leu Leu Pro Ile Arg

370 375

&lt;210&gt; 109

&lt;211&gt; 391

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 109

Met Thr Asp Lys Leu Val Lys Val Met Gln Lys Lys Lys Ser Ala Pro

1 5 10 15

Gln Thr Trp Leu Asp Ser Tyr Asp Lys Phe Leu Val Arg Asn Ala Ala

20 25 30

Ser Ile Gly Ser Ile Glu Ser Thr Leu Arg Thr Val Ser Tyr Val Leu

35 40 45

Pro Gly Arg Phe Asn Asp Val Glu Ile Ala Thr Glu Thr Leu Tyr Ala

50 55 60

Val Leu Asn Val Leu Gly Leu Tyr His Asp Thr Ile Ile Ala Arg Ala

65 70 75 80

Val Ala Ala Ser Pro Asn Ala Ala Ala Val Tyr Arg Pro Ser Pro His

85 90 95

Asn Arg Tyr Thr Asp Trp Phe Ile Lys Asn Arg Lys Gly Tyr Lys Tyr

100 105 110

Ala Ser Arg Ala Val Thr Phe Val Lys Phe Gly Glu Leu Val Ala Glu

115 120 125

Met Val Ala Lys Lys Asn Gly Gly Glu Met Ala Arg Trp Lys Cys Ile

130 135 140

Ile Gly Ile Glu Gly Ile Lys Ala Gly Leu Arg Ile Tyr Met Leu Gly

145 150 155 160

Ser Thr Leu Tyr Gln Pro Leu Cys Thr Thr Pro Tyr Pro Asp Arg Glu

165 170 175

Val Thr Gly Glu Leu Leu Glu Thr Ile Cys Arg Asp Glu Gly Glu Leu

180 185 190

Asp Ile Glu Lys Gly Leu Met Asp Pro Gln Trp Lys Met Pro Arg Thr

195 200 205

Gly Arg Thr Ile Pro Glu Ile Ala Pro Thr Asn Val Glu Gly Tyr Leu

210 215 220

Leu Thr Lys Val Leu Arg Ser Glu Asp Val Asp Arg Pro Tyr Asn Leu

225 230 235 240

Leu Ser Arg Leu Asp Asn Trp Gly Val Val Ala Glu Leu Leu Ser Ile

245 250 255

Leu Arg Pro Leu Ile Tyr Ala Cys Leu Leu Phe Arg Gln His Val Asn

260 265 270

Lys Thr Val Pro Ala Ser Thr Lys Ser Lys Phe Pro Phe Leu Asn Ser

275 280 285

Pro Trp Ala Pro Trp Ile Ile Gly Leu Val Ile Glu Ala Leu Ser Arg

290 295 300

Lys Met Met Gly Ser Trp Leu Leu Arg Gln Arg Gln Ser Gly Lys Thr

305 310 315 320

Pro Thr Ala Leu Asp Gln Met Glu Val Lys Gly Arg Thr Asn Leu Leu

325 330 335

Gly Trp Trp Leu Phe Arg Gly Glu Phe Tyr Gln Ala Tyr Thr Arg Pro

340 345 350

Leu Leu Tyr Ser Ile Val Ala Arg Leu Glu Lys Ile Pro Gly Leu Gly

355 360 365

Leu Phe Gly Ala Leu Ile Ser Asp Tyr Leu Tyr Leu Phe Asp Arg Tyr

370 375 380

Tyr Phe Thr Ala Ser Thr Leu

385 390

&lt;210&gt; 110

&lt;211&gt; 2106

&lt;212&gt; DNA

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 110

atgatcaccc caaaccccgc taacgacatt gtccatgacg gcaagctcta cgacaccttc 60

actgagcccc ccaagctgat ggctcaggag cgagctcagc tggacttcga ccctagagac 120

atcacctact ttctggatgg ctctaaggag gagaccgagc tgctggagtc gctcatgctc 180

atgtacgagc gagaccctct cttcaacaac cagaacgagt acgatgaatc gtttgaaaca 240

ctgcgagagc gatctgtgaa gcgaattttc cagctgtcca agtccatcgc catggacccc 300

gagcccatgt ctttccgaaa gattgggttc ctgggtattc ttgacatggg aacgtatgct 360

cgactgggag tccactacgc gctcttctgt aactccatcc ggggccaggg aacccccgat 420

cagctcatgt actggctgga ccagggagcc atggtcatca agggcttcta cggctgtttt 480

gccatgaccg aaatgggcca tggatctaac ctgtcgcgtc tggaaaccat cgccactttc 540

gacaaagaga ccgacgaatt tatcattaac acgccccacg ttggagccac aaagtggtgg 600

attggaggag ccgcccacac tgctactcac acacttgcct ttgcccgtct tcaagtagac 660

ggaaaggact acggtgtgaa atcgtttgtc gtacctctcc gaaacctgga cgaccattcg 720

ctgcgtcctg gaatcgccac aggtgatatt ggtaagaaga tgggtcgaga tgccgttgac 780

aacggctgga ttcagttcac caacgtccga gtgccccgaa actacatgct catgaagcat 840

accaaggttc ttcgagacgg taccgtcaag cagccgcctt tggcccaact gacttacgga 900

tctctcatca ctggacgagt ccagatgacc actgactctc acaatgtgtc caaaaagttc 960

ctcaccattg ccctgagata cgccaccatc cgacgacagt tctcgtcaac tccaggagag 1020

cccgaaaccc gactaattga ctacctgtac caccaaagac gactcctgcc tcttatggct 1080

tactcttacg ccatgaaact agctggagat cacgtccgag agctgttctt tgcatcccag 1140

gagaaggctg agagcctcaa ggaggacgac aaagccggag ttgagtctta cgtccaggat 1200

atcaaggagc tcttctctgt ttctgctggt ctcaaggctg ccactacatg ggcttgtgct 1260

gacatcattg acaaggcccg acaggcgtgt ggaggccacg gatactctgc ctacaacggc 1320

tttggacagg ccttccagga ctgggttgtc cagtgcactt gggagggtga caatactgtt 1380

ctgactctat ctgccggccg agctctgatc caatctgctc tcgtctaccg aaaggagggc 1440

aaactaggta acgccacgaa gtacctctct cggtccaagg agcttgccaa cgccaagaga 1500

aacggacgat ccctggaaga ccccaagctg ctcgtggagg catgggaggc tgtctctgcc 1560

ggtgctatca acgctgctac tgacgcttac gaggagctct ccaagcaggg agtttctgtt 1620

gacgagtgct ttgagcaggt gtcccaggag cgattccagg ctgcccgaat ccacactcga 1680

cgagctctta tcgaggcctt ctactcacga atcgccactg ctgatgagaa ggtgaagcct 1740

catctgatcc ctctggccaa cctgtttgcc ctgtggtcca ttgaggagga ctctgctctg 1800

ttcctggctg agggctactt tgagcctgag gatatcattg aggtgacttc tcttgtcaac 1860

aagtactgcg gaattgttcg aaagaacgtt attggataca ccgatgcctt caacctgtcc 1920

gactacttca tcaacgctgc cattggacga tacgacggag acgtgtacaa gaactacttt 1980

gagaaggtca aacagcagta ccctcctgag ggtggcaagc ctcactacta cgaggatgtc 2040

atgaagccct tcctgcatcg agagcgaatt cccgatgtcc ccatggagcc cgaggatatt 2100

cagtaa 2106

&lt;210&gt; 111

&lt;211&gt; 701

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 111

Met Ile Thr Pro Asn Pro Ala Asn Asp Ile Val His Asp Gly Lys Leu

1 5 10 15

Tyr Asp Thr Phe Thr Glu Pro Pro Lys Leu Met Ala Gln Glu Arg Ala

20 25 30

Gln Leu Asp Phe Asp Pro Arg Asp Ile Thr Tyr Phe Leu Asp Gly Ser

35 40 45

Lys Glu Glu Thr Glu Leu Leu Glu Ser Leu Met Leu Met Tyr Glu Arg

50 55 60

Asp Pro Leu Phe Asn Asn Gln Asn Glu Tyr Asp Glu Ser Phe Glu Thr

65 70 75 80

Leu Arg Glu Arg Ser Val Lys Arg Ile Phe Gln Leu Ser Lys Ser Ile

85 90 95

Ala Met Asp Pro Glu Pro Met Ser Phe Arg Lys Ile Gly Phe Leu Gly

100 105 110

Ile Leu Asp Met Gly Thr Tyr Ala Arg Leu Gly Val His Tyr Ala Leu

115 120 125

Phe Cys Asn Ser Ile Arg Gly Gln Gly Thr Pro Asp Gln Leu Met Tyr

130 135 140

Trp Leu Asp Gln Gly Ala Met Val Ile Lys Gly Phe Tyr Gly Cys Phe

145 150 155 160

Ala Met Thr Glu Met Gly His Gly Ser Asn Leu Ser Arg Leu Glu Thr

165 170 175

Ile Ala Thr Phe Asp Lys Glu Thr Asp Glu Phe Ile Ile Asn Thr Pro

180 185 190

His Val Gly Ala Thr Lys Trp Trp Ile Gly Gly Ala Ala His Thr Ala

195 200 205

Thr His Thr Leu Ala Phe Ala Arg Leu Gln Val Asp Gly Lys Asp Tyr

210 215 220

Gly Val Lys Ser Phe Val Val Pro Leu Arg Asn Leu Asp Asp His Ser

225 230 235 240

Leu Arg Pro Gly Ile Ala Thr Gly Asp Ile Gly Lys Lys Met Gly Arg

245 250 255

Asp Ala Val Asp Asn Gly Trp Ile Gln Phe Thr Asn Val Arg Val Pro

260 265 270

Arg Asn Tyr Met Leu Met Lys His Thr Lys Val Leu Arg Asp Gly Thr

275 280 285

Val Lys Gln Pro Pro Leu Ala Gln Leu Thr Tyr Gly Ser Leu Ile Thr

290 295 300

Gly Arg Val Gln Met Thr Thr Asp Ser His Asn Val Ser Lys Lys Phe

305 310 315 320

Leu Thr Ile Ala Leu Arg Tyr Ala Thr Ile Arg Arg Gln Phe Ser Ser

325 330 335

Thr Pro Gly Glu Pro Glu Thr Arg Leu Ile Asp Tyr Leu Tyr His Gln

340 345 350

Arg Arg Leu Leu Pro Leu Met Ala Tyr Ser Tyr Ala Met Lys Leu Ala

355 360 365

Gly Asp His Val Arg Glu Leu Phe Phe Ala Ser Gln Glu Lys Ala Glu

370 375 380

Ser Leu Lys Glu Asp Asp Lys Ala Gly Val Glu Ser Tyr Val Gln Asp

385 390 395 400

Ile Lys Glu Leu Phe Ser Val Ser Ala Gly Leu Lys Ala Ala Thr Thr

405 410 415

Trp Ala Cys Ala Asp Ile Ile Asp Lys Ala Arg Gln Ala Cys Gly Gly

420 425 430

His Gly Tyr Ser Ala Tyr Asn Gly Phe Gly Gln Ala Phe Gln Asp Trp

435 440 445

Val Val Gln Cys Thr Trp Glu Gly Asp Asn Thr Val Leu Thr Leu Ser

450 455 460

Ala Gly Arg Ala Leu Ile Gln Ser Ala Leu Val Tyr Arg Lys Glu Gly

465 470 475 480

Lys Leu Gly Asn Ala Thr Lys Tyr Leu Ser Arg Ser Lys Glu Leu Ala

485 490 495

Asn Ala Lys Arg Asn Gly Arg Ser Leu Glu Asp Pro Lys Leu Leu Val

500 505 510

Glu Ala Trp Glu Ala Val Ser Ala Gly Ala Ile Asn Ala Ala Thr Asp

515 520 525

Ala Tyr Glu Glu Leu Ser Lys Gln Gly Val Ser Val Asp Glu Cys Phe

530 535 540

Glu Gln Val Ser Gln Glu Arg Phe Gln Ala Ala Arg Ile His Thr Arg

545 550 555 560

Arg Ala Leu Ile Glu Ala Phe Tyr Ser Arg Ile Ala Thr Ala Asp Glu

565 570 575

Lys Val Lys Pro His Leu Ile Pro Leu Ala Asn Leu Phe Ala Leu Trp

580 585 590

Ser Ile Glu Glu Asp Ser Ala Leu Phe Leu Ala Glu Gly Tyr Phe Glu

595 600 605

Pro Glu Asp Ile Ile Glu Val Thr Ser Leu Val Asn Lys Tyr Cys Gly

610 615 620

Ile Val Arg Lys Asn Val Ile Gly Tyr Thr Asp Ala Phe Asn Leu Ser

625 630 635 640

Asp Tyr Phe Ile Asn Ala Ala Ile Gly Arg Tyr Asp Gly Asp Val Tyr

645 650 655

Lys Asn Tyr Phe Glu Lys Val Lys Gln Gln Tyr Pro Pro Glu Gly Gly

660 665 670

Lys Pro His Tyr Tyr Glu Asp Val Met Lys Pro Phe Leu His Arg Glu

675 680 685

Arg Ile Pro Asp Val Pro Met Glu Pro Glu Asp Ile Gln

690 695 700

&lt;210&gt; 112

&lt;211&gt; 1581

&lt;212&gt; DNA

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 112

atggaagtcc gacgacgaaa aatcgacgtg ctcaaggccc agaaaaacgg ctacgaatcg 60

ggcccaccat ctcgacaatc gtcgcagccc tcctcaagag catcgtccag aacccgcaac 120

aaacactcct cgtccaccct gtcgctcagc ggactgacca tgaaagtcca gaagaaacct 180

gcgggacccc cggcgaactc caaaacgcca ttcctacaca tcaagcccgt gcacacgtgc 240

tgctccacat caatgctttc gcgcgattat gacggctcca accccagctt caagggcttc 300

aaaaacatcg gcatgatcat tctcattgtg ggaaatctac ggctcgcatt cgaaaactac 360

ctcaaatacg gcatttccaa cccgttcttc gaccccaaaa ttactccttc cgagtggcag 420

ctctcaggct tgctcatagt cgtggcctac gcacatatcc tcatggccta cgctattgag 480

agcgctgcca agctgctgtt cctctctagc aaacaccact acatggccgt ggggcttctg 540

cataccatga acactttgtc gtccatctcg ttgctgtcct acgtcgtcta ctactacctg 600

cccaaccccg tggcaggcac aatagtcgag tttgtggccg ttattctgtc tctcaaactc 660

gcctcatacg ccctcactaa ctcggatctc cgaaaagccg caattcatgc ccagaagctc 720

gacaagacgc aagacgataa cgaaaaggaa tccacctcgt cttcctcttc ttcagatgac 780

gcagagactt tggcagacat tgacgtcatt cctgcatact acgcacagct gccctacccc 840

cagaatgtga cgctgtcgaa cctgctgtac ttctggtttg ctcccacact ggtctaccag 900

cccgtgtacc ccaagacgga gcgtattcga cccaagcacg tgatccgaaa cctgtttgag 960

ctcgtctctc tgtgcatgct tattcagttt ctcatcttcc agtacgccta ccccatcatg 1020

cagtcgtgtc tggctctgtt cttccagccc aagctcgatt atgccaacat ctccgagcgc 1080

ctcatgaagt tggcctccgt gtctatgatg gtctggctca ttggattcta cgctttcttc 1140

cagaacggtc tcaatcttat tgccgagctc acctgttttg gaaacagaac cttctaccag 1200

cagtggtgga attcccgctc cattggccag tactggactc tatggaacaa gccagtcaac 1260

cagtacttta gacaccacgt ctacgtgcct cttctcgctc ggggcatgtc gcggttcaat 1320

gcgtcggtgg tggttttctt tttctccgcc gtcatccatg aactgcttgt cggcatcccc 1380

actcacaaca tcatcggagc cgccttcttc ggcatgatgt cgcaggtgcc tctgatcatg 1440

gctactgaga accttcagca tattaactcc tctctgggcc ccttccttgg caactgtgca 1500

ttctggttca cctttttcct gggacaaccc acttgtgcat tcctttatta tctggcttac 1560

aactacaagc agaaccagta g 1581

&lt;210&gt; 113

&lt;211&gt; 526

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 113

Met Glu Val Arg Arg Arg Lys Ile Asp Val Leu Lys Ala Gln Lys Asn

1 5 10 15

Gly Tyr Glu Ser Gly Pro Pro Ser Arg Gln Ser Ser Gln Pro Ser Ser

20 25 30

Arg Ala Ser Ser Arg Thr Arg Asn Lys His Ser Ser Ser Thr Leu Ser

35 40 45

Leu Ser Gly Leu Thr Met Lys Val Gln Lys Lys Pro Ala Gly Pro Pro

50 55 60

Ala Asn Ser Lys Thr Pro Phe Leu His Ile Lys Pro Val His Thr Cys

65 70 75 80

Cys Ser Thr Ser Met Leu Ser Arg Asp Tyr Asp Gly Ser Asn Pro Ser

85 90 95

Phe Lys Gly Phe Lys Asn Ile Gly Met Ile Ile Leu Ile Val Gly Asn

100 105 110

Leu Arg Leu Ala Phe Glu Asn Tyr Leu Lys Tyr Gly Ile Ser Asn Pro

115 120 125

Phe Phe Asp Pro Lys Ile Thr Pro Ser Glu Trp Gln Leu Ser Gly Leu

130 135 140

Leu Ile Val Val Ala Tyr Ala His Ile Leu Met Ala Tyr Ala Ile Glu

145 150 155 160

Ser Ala Ala Lys Leu Leu Phe Leu Ser Ser Lys His His Tyr Met Ala

165 170 175

Val Gly Leu Leu His Thr Met Asn Thr Leu Ser Ser Ile Ser Leu Leu

180 185 190

Ser Tyr Val Val Tyr Tyr Tyr Leu Pro Asn Pro Val Ala Gly Thr Ile

195 200 205

Val Glu Phe Val Ala Val Ile Leu Ser Leu Lys Leu Ala Ser Tyr Ala

210 215 220

Leu Thr Asn Ser Asp Leu Arg Lys Ala Ala Ile His Ala Gln Lys Leu

225 230 235 240

Asp Lys Thr Gln Asp Asp Asn Glu Lys Glu Ser Thr Ser Ser Ser Ser

245 250 255

Ser Ser Asp Asp Ala Glu Thr Leu Ala Asp Ile Asp Val Ile Pro Ala

260 265 270

Tyr Tyr Ala Gln Leu Pro Tyr Pro Gln Asn Val Thr Leu Ser Asn Leu

275 280 285

Leu Tyr Phe Trp Phe Ala Pro Thr Leu Val Tyr Gln Pro Val Tyr Pro

290 295 300

Lys Thr Glu Arg Ile Arg Pro Lys His Val Ile Arg Asn Leu Phe Glu

305 310 315 320

Leu Val Ser Leu Cys Met Leu Ile Gln Phe Leu Ile Phe Gln Tyr Ala

325 330 335

Tyr Pro Ile Met Gln Ser Cys Leu Ala Leu Phe Phe Gln Pro Lys Leu

340 345 350

Asp Tyr Ala Asn Ile Ser Glu Arg Leu Met Lys Leu Ala Ser Val Ser

355 360 365

Met Met Val Trp Leu Ile Gly Phe Tyr Ala Phe Phe Gln Asn Gly Leu

370 375 380

Asn Leu Ile Ala Glu Leu Thr Cys Phe Gly Asn Arg Thr Phe Tyr Gln

385 390 395 400

Gln Trp Trp Asn Ser Arg Ser Ile Gly Gln Tyr Trp Thr Leu Trp Asn

405 410 415

Lys Pro Val Asn Gln Tyr Phe Arg His His Val Tyr Val Pro Leu Leu

420 425 430

Ala Arg Gly Met Ser Arg Phe Asn Ala Ser Val Val Val Phe Phe Phe

435 440 445

Ser Ala Val Ile His Glu Leu Leu Val Gly Ile Pro Thr His Asn Ile

450 455 460

Ile Gly Ala Ala Phe Phe Gly Met Met Ser Gln Val Pro Leu Ile Met

465 470 475 480

Ala Thr Glu Asn Leu Gln His Ile Asn Ser Ser Leu Gly Pro Phe Leu

485 490 495

Gly Asn Cys Ala Phe Trp Phe Thr Phe Phe Leu Gly Gln Pro Thr Cys

500 505 510

Ala Phe Leu Tyr Tyr Leu Ala Tyr Asn Tyr Lys Gln Asn Gln

515 520 525

&lt;210&gt; 114

&lt;211&gt; 1545

&lt;212&gt; DNA

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 114

atgactatcg actcacaata ctacaagtcg cgagacaaaa acgacacggc acccaaaatc 60

gcgggaatcc gatatgcccc gctatcgaca ccattactca accgatgtga gaccttctct 120

ctggtctggc acattttcag cattcccact ttcctcacaa ttttcatgct atgctgcgca 180

attccactgc tctggccatt tgtgattgcg tatgtagtgt acgctgttaa agacgactcc 240

ccgtccaacg gaggagtggt caagcgatac tcgcctattt caagaaactt cttcatctgg 300

aagctctttg gccgctactt ccccataact ctgcacaaga cggtggatct ggagcccacg 360

cacacatact accctctgga cgtccaggag tatcacctga ttgctgagag atactggccg 420

cagaacaagt acctccgagc aatcatctcc accatcgagt actttctgcc cgccttcatg 480

aaacggtctc tttctatcaa cgagcaggag cagcctgccg agcgagatcc tctcctgtct 540

cccgtttctc ccagctctcc gggttctcaa cctgacaagt ggattaacca cgacagcaga 600

tatagccgtg gagaatcatc tggctccaac ggccacgcct cgggctccga acttaacggc 660

aacggcaaca atggcaccac taaccgacga cctttgtcgt ccgcctctgc tggctccact 720

gcatctgatt ccacgcttct taacgggtcc ctcaactcct acgccaacca gatcattggc 780

gaaaacgacc cacagctgtc gcccacaaaa ctcaagccca ctggcagaaa atacatcttc 840

ggctaccacc cccacggcat tatcggcatg ggagcctttg gtggaattgc caccgaggga 900

gctggatggt ccaagctctt tccgggcatc cctgtttctc ttatgactct caccaacaac 960

ttccgagtgc ctctctacag agagtacctc atgagtctgg gagtcgcttc tgtctccaag 1020

aagtcctgca aggccctcct caagcgaaac cagtctatct gcattgtcgt tggtggagca 1080

caggaaagtc ttctggccag acccggtgtc atggacctgg tgctactcaa gcgaaagggt 1140

tttgttcgac ttggtatgga ggtcggaaat gtcgcccttg ttcccatcat ggcctttggt 1200

gagaacgacc tctatgacca ggttagcaac gacaagtcgt ccaagctgta ccgattccag 1260

cagtttgtca agaacttcct tggattcacc cttcctttga tgcatgcccg aggcgtcttc 1320

aactacgatg tcggtcttgt cccctacagg cgacccgtca acattgtggt tggttccccc 1380

attgacttgc cttatctccc acaccccacc gacgaagaag tgtccgaata ccacgaccga 1440

tacatcgccg agctgcagcg aatctacaac gagcacaagg atgaatattt catcgattgg 1500

accgaggagg gcaaaggagc cccagagttc cgaatgattg agtaa 1545

&lt;210&gt; 115

&lt;211&gt; 514

&lt;212&gt; PRT

&lt;213&gt; 解脂耶氏酵母

&lt;400&gt; 115

Met Thr Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr

1 5 10 15

Ala Pro Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu

20 25 30

Leu Asn Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile

35 40 45

Pro Thr Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu

50 55 60

Trp Pro Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser

65 70 75 80

Pro Ser Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn

85 90 95

Phe Phe Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His

100 105 110

Lys Thr Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val

115 120 125

Gln Glu Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr

130 135 140

Leu Arg Ala Ile Ile Ser Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met

145 150 155 160

Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp

165 170 175

Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp

180 185 190

Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly

195 200 205

Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn

210 215 220

Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr

225 230 235 240

Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn

245 250 255

Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys

260 265 270

Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile

275 280 285

Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser

290 295 300

Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn

305 310 315 320

Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala

325 330 335

Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser

340 345 350

Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro

355 360 365

Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu

370 375 380

Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly

385 390 395 400

Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu

405 410 415

Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro

420 425 430

Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro

435 440 445

Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro

450 455 460

Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg

465 470 475 480

Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr

485 490 495

Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met

500 505 510

Ile Glu

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1