产生脂肪醛的方法和组合物的制作方法

文档序号:581363阅读:394来源:国知局

专利名称::产生脂肪醛的方法和组合物的制作方法产生脂肪醛的方法和组合物相关申请的交叉引用本申请要求2008年10月7日提交的美国临时申请第61/103,447号的优先权,通过弓丨用将其全部内容全部并入本文。
背景技术
:石油是地球上发现的、液体、气体或固体形式的有限的天然资源。石油主要由碳氢化合物组成,碳氢化合物主要由碳和氢组成。石油还含有大量的处于不同形式的其他元素,例如氮、氧或硫。石油是宝贵资源,但是以相当大的金融和环境代价对石油产品进行开发。首先,必须发现石油资源。石油勘探是耗资并有风险的投资。勘探深水井的费用可以超过1亿美元。此外,不能保证这些井会含有石油。据估计,仅40%的钻井成为产生商业碳氢化合物的生产井。除经济费用外,石油勘探存在严重的环境代价。例如近海勘探扰乱周围海洋环境。发现生产井后,必须以巨大代价从地球开采石油。在初次采收(primaryrecovery)中,地下的自然压力足以开采约20%的井中石油。当该自然压力降低时,如果经济上合算,则使用二次采收(secondrecovery)。通常,二次采收涉及通过例如水注射、天然气注射或气举等增加井压。使用二次采油,采收到另外5%至15%的石油。一旦二次采收方法不起作用,如果经济上合算,可以使用三次采收方法。三次方法涉及降低石油的粘度以使其更易开采。使用三次采收方法,采收到另外5%至15%的石油。因此,即使在最佳条件下,仅可以开采50%的井中石油。石油开采也存在环境代价。例如,石油开采可以导致大量石油渗漏上升至表面。此外,近海钻井涉及挖掘河床,这扰乱或破坏周围海洋环境。因为石油矿藏不是在地球各处均勻发现的,所以石油必须从石油产生区长距离运输到石油消耗区。除运输费用外,还存在大规模油泄漏的环境风险。从地球开采的原油在天然形式时具有少数商业用途。其是具有不同长度和复杂性的碳氢化合物(例如,石蜡(或烷)、烯烃(或烯)、炔、环烷(napthenes)(或环烷(cylcoalkanes))、脂肪族化合物、芳香族化合物等)的混合物。此外,原油含有其他有机化合物(例如含有氮、氧、硫等的有机化合物)和杂质(例如硫磺、盐、酸、金属等)。因此,在商业上可以使用前,必须提炼并纯化原油。由于其高能量密度及其便利的可运输性,大部分石油被提炼为燃料,例如运输燃料(例如汽油、柴油、航空燃料等)、燃用油、液化石油气等。原油还是用于产生石化产品的原材料的主要来源。两类主要的来自石油的原材料是短链烯烃(例如乙烯和丙烯)和芳香族化合物(例如苯和二甲苯异构体)。这些原材料来源于原油中较长链的碳氢化合物,这是通过以相当大的费用使用各种方法,例如催化裂化、蒸汽裂化或催化重整,裂化原油。这些原材料用于制造不能直接从原油提炼的石化产品,例如单体、溶剂、去垢剂或粘合剂。来源于原油的原材料的一个实例是乙烯。乙烯被用于生产石化产品,例如聚乙烯、乙醇、氧化乙烯、乙二醇、聚酯、乙二醇醚、乙氧基化物、乙酸乙烯酯、1,2-二氯乙烷、三氯乙烯、四氯乙烯、氯乙烯和聚氯乙烯。原材料的其他实例是丙烯,丙烯用于生产异丙醇、丙烯腈、聚丙烯、氧化丙烯、丙烯二醇、乙二醇醚、丁烯、异丁烯、1,3_丁二烯、合成橡胶、聚烯烃、α-烯烃、脂肪醇、丙烯酸、丙烯聚合物、氯化丙烯、环氧氯丙烷和环氧树脂。然后,这些石化产品可以用于制造特种化学品,例如塑料、树脂、纤维、橡胶、药品、润滑剂或凝胶。可以产自石化原材料的具体特种化学品为脂肪酸、碳氢化合物(例如长链、支链、饱和的、不饱和的等)、脂肪醇、酯、脂肪醛、酮、润滑剂等。醛用于生产很多特种化学品。例如,醛用于生产聚合物、树脂(例如胶木(Bakelite))、染料、调味剂、增塑剂、香水、药品和其他化学品。一些被用作溶剂、防腐剂或消毒剂。一些天然和合成的化合物,例如维生素和激素是醛。此外,很多糖含有醛基。从原油获得这些特种化学品需要大量的金融投资以及大量的能量。因为常常裂化原油中的长链碳氢化合物以产生较小的单体,其也是低效的过程。这些单体然后被用作生产更复杂的特种化学品的原材料。除勘探、开采、运输和提炼石油的问题外,石油是有限的并逐渐减少的资源。估计世界石油消耗为每年300亿桶。据估计,以现有生产水平,世界石油储量预计在2050年前会耗竭。最后,基于石油的燃料的燃烧释放温室气体(例如二氧化碳)和其他形式的空气污染(例如一氧化碳、二氧化硫等)。随着世界对燃料需求的增加,温室气体的排放和其他形式的空气污染也增加。大气中温室气体的累积可以导致增加全球变暖。因此,除局部破坏环境外(例如油泄漏、海洋环境的挖掘等),燃烧石油还破坏全球环境。由于石油所引起的内在挑战,存在对于不需要像石油一样被勘探、开采、长距离运输或大量提炼的可再生石油资源的需要。还存在对于可以经济地生产而不会产生石油工业和基于石油的燃料的燃烧所产生的类型的环境破坏的可再生石油资源的需要。基于相似原因,还存在对于通常来自石油的化学品的可再生资源的需要。产生可再生石油的一种方法是通过工程化微生物以产生可再生石油产物。某些微生物具有产生化学品的天然能力。例如,酵母已被使用数世纪以产生乙醇(例如,啤酒、葡萄酒等)。近年,通过先进的生物技术的发展,可能新陈代谢地工程化有机体以产生之前从未产生过的生物产物。来源于这些细胞活性的诸如化学品的产物被称为生物产物。由这些细胞活性产生的燃料被称为生物燃料。生物燃料是基于石油的燃料的可再生的替代选项。生物燃料可以代替任何基于石油的燃料(例如,汽油、柴油、航空燃料、燃用油等)。生物燃料可以来源于可再生的来源,例如植物物质、动物物质或甚至废品。这些可再生的来统称为生物量。生物燃料相比基于石油的燃料的一个优势在于,它们不需要耗资和有风险的的勘探或开采。另外,生物燃料可以在本地生产。因此,它们不需要长距离运输。此外,生物燃料可以直接地制备而不需要耗资和能量密集的提炼,而这在提炼原油时是需要的。在其他条件下,生物燃料可以需要有限的和经济有效的提炼水平。此外,使用生物燃料通过减少燃烧期间释放的环境有害的排放(例如,温室气体,气体污染等)的量改善环境。例如,由于生物燃料是从可再生的天然资源——生物量生产的,它维持平衡的碳循环。尽管生物燃料的燃烧会释放碳(例如,以二氧化碳),但该碳会在生物量的产生期间在循环(例如,作物的栽培),从而平衡碳循环,这与基于石油的燃料不同。基于类似的理由,生物来源的化学品提供了与生物燃料相同的优于基于石油的燃料的优点。生物来源的化学品是石化产品的可再生的替代选项。生物来源的化学品,例如碳氢化合物(例如,烷烃、烯烃、或炔烃)、脂肪醇、酯、脂肪酸、脂肪醛和酮,比石化产品更优质,因为它们是直接产生的而不需要大量的提炼。与石化产品不同,生物来源的化学品不需要像原油那样提炼以提取随后必须进一步加工以制备更复杂的石化产品的原材料。生物来源的化学品是从生物量直接地转变为所需化学产品。发明_既述本发明至少部分基于编码脂肪醛生物合成多肽的基因的鉴定。因此,在一方面,本发明特征为制备脂肪醛的方法。所述方法包括在宿主细胞中表达编码包含SEQIDNO18,20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列的脂肪醛生物合成多肽或其变体的基因。在一些实施方案中,该方法还包括从所述宿主细胞分离所述脂肪醛。在某些实施方案中,所述脂肪醛存在于细胞外环境。在一些实施方案中,所述脂肪醛分离自所述宿主细胞的细胞外环境。在一些实施方案中,所述脂肪醛分泌自所述宿主细胞。在可选择的实施方案中,将所述脂肪醛运输进细胞外环境。在其他实施方案中,将脂肪醛被动运输到细胞外环境中。在一些实施方案中,脂肪醛生物合成多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQIDNO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列,并且所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨酸被丝氨酸替换;例如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有脂肪酸酸还原酶活性。在一些实施方案中,所述方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在一些实施方案中,所述方法还包括修饰宿主细胞中编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选择的实施方案中,修饰编码脂肪酸合酶的基因的表达包括减弱宿主细胞中编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,所述脂肪酸合酶是硫酯酶。在具体实施方案中,所述硫酯酶是由tesA、缺乏前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码的。在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,所述多肽来自细菌、植物、昆虫、酵母、真菌或哺乳动物。在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述的有机体。在一些实施方案中,细菌是选自耻垢分枝杆菌(Mycobacteriumsmegmatis)、脓肿分支杆菌(Mycobacteriumabscessus)、鸟分支杆菌(Mycobacteriumavium)、牛分支杆菌(Mycobacteriumbovis)、结核分枝杆菌(Mycobacteriumtuberculosis)、麻风分枝杆菌(Mycobacteriumleprae)、海分枝杆菌(Mycobacteriummarinum)禾口馈荡分枝杆菌(Mycobacteriumulcerans)的分支杆菌。在其他实施方案中,细菌是诺卡氏菌(Nocardiasp.)、NRRL5646、皮疽诺卡氏菌(Nocardiafarcinica)、灰色链霉菌(Streptomycesgriseus)、砂嗜盐产孢菌(Salinisporaarenicola)5^^(Clavibactermichiganenesis)。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述生物合成多肽包含与SEQIDNO:18,20,22,24,26,28,30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列。在一些实施方案中,所述氨基酸序列是SEQIDN0:18、20、22、24J6、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,所述多肽来自细菌、植物、昆虫、酵母、真菌或哺乳动物。在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述的有机体。在一些实施方案中,细菌是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。在其他实施方案中,细菌是诺卡氏菌(Nocardiasp.)、NRRL5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷酸编码具有羧酸还原酶活性的多肽。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述多核苷酸与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列的互补序列,或其片段,在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,所述多核苷酸来自细菌、植物、昆虫、酵母、真菌或哺乳动物。在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述有机体。在一些实施方案中,细菌是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。在其他实施方案中,细菌是诺卡氏菌(Nocardiasp.)、NRRL5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含SEQIDN0:16的氨基酸或其变体,和(ii)修饰编码脂肪酸合酶的基因的表达,包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQIDNO:16的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含与SEQIDN0:16的氨基酸序列具有至少约70%序列同一性的氨基酸序列,和(ii)修饰编码脂肪酸合酶的基因的表达,包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述氨基酸序列与SEQIDNO16的氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。在一些实施方案中,所述氨基酸序列是SEQIDN0:16。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达与SEQIDNO:15的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷酸编码具有羧酸还原酶活性的多肽;和(ii)修饰编码脂肪酸合酶的基因的表达,包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述多核苷酸与SEQIDNO:15的核苷酸序列的互补序列或其片段在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含SEQIDN0:16的氨基酸或其变体,其中遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22,faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQIDNO:16的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含与SEQIDN0:16的氨基酸序列具有至少约70%序列同一性的氨基酸序列,其中遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDUfadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述氨基酸序列与SEQIDNO16的氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。在一些实施方案中,所述氨基酸序列是SEQIDN0:16。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fal^B或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达与SEQIDNO:15的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷酸编码具有羧酸还原酶活性的多肽,并且其中遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述多核苷酸与SEQIDNO15的核苷酸序列的互补序列或其片段在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约70%的序列同一性。在一些实施方案中,所述核苷酸序列与SEQIDNO:17,19,21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,所述核苷酸序列是SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。在其他实施方案中,所述重组载体包含至少一个选自以下的序列(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(C)可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化部分;(e)可操作地偶联到所述核苷酸序列的分泌序列;和(f)可操作地偶联到所述核苷酸序列的弓I导序列(targetingsequence)。在一些实施方案中,重组载体是质粒。在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调型启动子区的控制。在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQIDNO:15的核苷酸序列具有至少约70%的序列同一性,和(ii)修饰宿主细胞中编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述核苷酸序列与SEQIDNO:15的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。在一些实施方案中,所述核苷酸序列是SEQIDNO:15的核苷酸序列。在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。在其他实施方案中,所述重组载体包含至少一个选自以下的序列(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(C)可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化部分;(e)可操作地连接到所述核苷酸序列的分泌序列;和(f)可操作地连接到所述核苷酸序列的引导序列。在一些实施方案中,重组载体是质粒。在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调型启动子区的控制。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQIDNO15的核苷酸序列具有至少约70%的序列同一性,其中遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDUfadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含编码脂肪酸降解酶的一个或多个基因的敲除,例如上述的酰基CoA合酶基因。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述核苷酸序列与SEQIDNO:15的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。在一些实施方案中,所述核苷酸序列是SEQIDNO:15的核苷酸序列。在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。在其他实施方案中,所述重组载体包含至少一个选自以下的序列(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(C)可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化部分;(e)可操作地偶联到所述核苷酸序列的分泌序列;和(f)可操作地偶联到所述核苷酸序列的引导序列。在一些实施方案中,重组载体是质粒。在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调型启动子区的控制。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含(i)SEQIDNO:7,SEQIDNO:8、SEQIDNO9和SEQIDNO10;(ii)SEQIDNO:11、SEQIDNO:12、SEQIDNO13或SEQIDNO14;和/或(iii)SEQIDNO:7、SEQIDNO:9、SEQIDNO:10和SEQIDNO11;其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环境。在其他实施方案中,脂肪醛被动运输到细胞外环境。在一些实施方案中,所述多肽的长度为约1000个氨基酸至约2000个氨基酸。在某些实施方案中,所述多肽的长度为约1000个氨基酸、长度为约1050个氨基酸、长度为约1100个氨基酸、长度为约1150个氨基酸、长度为约1200个氨基酸、长度为约1250个氨基酸、长度为约1300个氨基酸、长度为约1400个氨基酸、长度为约1500个氨基酸、长度为约1600个氨基酸、长度为约1700个氨基酸、长度为约1800个氨基酸、长度为约1900个氨基酸或长度为约2000个氨基酸。在其他实施方案中,所述多肽的长度为高达约1500个氨基酸、长度为高达约1400个氨基酸、长度为高达约1300个氨基酸、长度为高达约1250个氨基酸、长度为高达约1200个氨基酸、长度为高达约1150个氨基酸、长度为高达约1100个氨基酸、长度为高达约1050个氨基酸或长度为高达约1000个氨基酸。在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354,EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿主细胞包含编码脂肪酸降解酶的一个或多个基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。在本文所述的本发明的任何方面中,所述宿主细胞可以选自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。在一些实施方案中,所述宿主细胞是革兰氏阳性细菌细胞。在其他实施方案中,所述宿主细胞是革兰氏阴性细菌细胞。在一些实施方案中,所述宿主细胞选自以下的属埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、键刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉菌属(Mucor)、蚀丝霉属(Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金黄孢子菌属(Chrysosporium)>酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耳口氏酵母属(Yarrowia)或链霉菌属(Streptomyces)0在具体实施方案中,所述宿主细胞为迟缓芽孢杆菌(Bacilluslentus)细胞、短芽孢杆菌(Bacillusbrevis)细胞、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)细胞、地衣芽孢杆菌(Bacilluslicheniformis)细胞、嗜碱芽孢杆菌(Bacillusalkalophilus)细胞、凝结芽孢杆菌(Bacilluscoagulans)细胞、环状芽孢杆菌(Bacilluscirculans)细胞、短小芽孢杆菌(Bacilluspumilis)细胞、苏云金芽孢杆菌(Bacillusthuringiensis)细胞、克劳氏芽孢杆菌(Bacillusclausii)细胞、巨大芽孢杆菌(Bacillusmegaterium)细胞、枯草芽孢杆菌(Bacillussubtilis)细胞或解淀粉芽孢杆菌(BacillusamyIoliquefaciens)细胞。在其他实施方案中,宿主细胞为康氏木霉(Trichodermakoningii)细胞、绿色木霉(Trichodermaviride)细胞、里氏木霉(Trichodermareesei)细胞、长枝木霉(Trichodermalongibrachiatum)细胞、泡盛曲霉(Aspergillusawamori)细胞、烟曲霉(Aspergillusfumigates)细胞、臭曲霉(Aspergillusfoetidus)细胞、构巢曲霉(Aspergillusnidulans)(Aspergillusniger)(Aspergillusoryzae)细胞、特异腐质霉(Humicolainsolens)细胞、棉毛状腐质霉(Humicolalanuginose)细胞、混浊红球菌(Rhodococcusopacus)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛酶(Mucormichei)细胞。在其他实施方案中,所述宿主细胞是浅青紫链霉菌(Sti^ptomyceslividans)细胞或鼠灰链霉菌(Streptomycesmurinus)细胞。在仍然其他实施方案中,宿主细胞是放线菌(Actinomycetes)细胞。在一些实施方案中,宿主细胞是酿酒酵母(Saccharomycescerevisiae)细胞。在具体实施方案中,宿主细胞是来自真核植物、藻类、蓝藻(cyanolacterium)、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极生物、酵母、真菌、其工程化的有机体或合成的有机体的细胞。在一些实施方案中,宿主细胞为光依赖性或固定碳。在一些实施方案中,宿主细胞轻度依赖或固定碳。在一些实施方案中,宿主细胞具有自养活性。在一些实施方案中,宿主细胞具有光合自养活性,例如在光的存在下。在一些实施方案中,在缺乏光时,宿主细胞时异养的或兼养的。在某些实施方案中,宿主细胞是来自拟南芥(Avabidopsisthaliana)、柳枝稷(Panicumvirgatum)、巨芒(Miscanthusgiganteus)、玉米(Zeamays)、葡萄藻(Botryococcusebraunii)、莱菌^藻(Chlamydomonasreinhardtii)、杜氏盐藻(Dunalielasalina)、聚球蓝细菌(SynechococcusSp.)PCC7002、聚球蓝细菌(SynechococcusSp.)PCC7940、聚球蓝细菌(SynechococcusSp.)PCC6803、长嗜热聚球蓝细菌(Thermosynechococcuselongates)BP-1、绿硫菌(Chlorobiumtepidum)、荚膜iLMM(Rhodobactercapsulatus)>^Xfix-^-Ifilii(Rhodopseudomonaspalusris)达梭菌(Clostridium1jungdahlii)、热纤梭菌(Clostridiuthermocellum)、产黄青霉菌(Penicilliumchrysogenum)、巴斯德毕赤酵母(Pichiapastoris)、酿酒酵母、粟酒裂殖酵母(Schizosaccharomycespombe)、焚光假单胞菌(Pseudomonasfluorescens)或运动发酵单胞菌(Zymomonasmobilis)的细胞。在其他实施方案中,所述宿主细胞是CHO细胞、COS细胞、VERO细胞、BHK细胞、HeLa细胞、Cvl细胞、MDCK细胞、293细胞、3T3细胞或PC12细胞。在仍然其他实施方案中,所述宿主细胞是大肠杆菌(E.coli)细胞。在某些实施方案中,所述大肠杆菌细胞是菌株B、菌株C、菌株K或菌株W大肠杆菌细胞。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括将底物与(i)包含SEQIDNO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列或其变体的脂肪醛生物合成多肽或()由与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列或其变体具有至少约70%同一性的核苷酸序列编码的脂肪醛生物合成多肽接触。在一些实施方案中,该方法还包括纯化脂肪醛。在一些实施方案中,脂肪醛生物合成多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQIDNO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽具有与SEQIDNO18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%—致的氨基酸序列。在一些实施方案中,所述多肽具有SEQIDNO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列。在一些实施方案中,所述核苷酸序列与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,所述核苷酸序列是SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121。在另一方面,本发明特征为产生脂肪醛的方法。该方法包括将底物与脂肪醛生物合成多肽接触,所述脂肪醛生物合成多肽包含(i)SEQIDNO:7,SEQIDN0:8、SEQIDNO:9和SEQIDNO10;(ii)SEQIDNO:11、SEQIDNO:12、SEQIDNO:13或SEQIDNO:14;和/或(iii)SEQIDNO:7、SEQIDNO:9、SEQIDNO:10禾口SEQIDNO:11;其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。在一些实施方案中,所述多肽的长度为约1000氨基酸至约2000氨基酸。在某些实施方案中,所述多肽的长度为约1000个氨基酸、长度为约1050个氨基酸、长度为约1100个氨基酸、长度为约1150个氨基酸、长度为约1200个氨基酸、长度为约1250个氨基酸、长度为约1300个氨基酸、长度为约1400个氨基酸、长度为约1500个氨基酸、长度为约1600个氨基酸、长度为约1700个氨基酸、长度为约1800个氨基酸、长度为约1900个氨基酸或长度为约2000个氨基酸。在其他实施方案中,所述多肽的长度为高达约1500个氨基酸、长度为高达约1400个氨基酸、长度为高达约1300个氨基酸、长度为高达约1250个氨基酸、长度为高达约1200个氨基酸、长度为高达约1150个氨基酸、长度为高达约1100个氨基酸、长度为高达约1050个氨基酸或长度为高达约1000个氨基酸。在本文所述的本发明的任何方面中,所述方法可以产生包含C6-C26脂肪醛的脂肪醛。在一些实施方案中,所述脂肪醛包含c6、C7、C8、C9、C10,C11,C12,C13,C14,C15,C16,C17,C18,C19、C20,C21,C22,C23,C24,C25或C26脂肪醛。在具体实施方案中,所述脂肪醛为癸醛、十二醛、十四醛或十六醛。在其他实施方案中,所述脂肪醛包含直链脂肪醛。在其他实施方案中,所述脂肪醛包含支链脂肪醛。在其他实施方案中,所述脂肪醛包含环状部分。在一些实施方案中,所述脂肪醛是不饱和脂肪醛。在其他实施方案中,所述脂肪醛是单不饱和脂肪醛。在其他实施方案中,所述脂肪醛是饱和脂肪醛。在本文所述的发明的任何方面,脂肪醛生物合成多肽的底物可以是脂肪酸。在一些实施方案中,所述脂肪酸包括C6-C26脂肪酸。在一些实施方案中,所述脂肪酸包含c6、c7、C8、C9λC10ΛCn、C12ΛCi3、C14ΛCi5、C16ΛCn、C18ΛC19、C20、C21ΛC22、C23ΛC24ΛC25或C26月曰肪在具体实施方案中,所述脂肪酸是c6、C8、C10,C12,C13、C14,C15,C16,C17或C18脂肪酸。在其他实施方案中,所述脂肪酸包含直链脂肪酸。在其他实施方案中,所述脂肪酸包含支链脂肪酸。在仍然其他实施方案中,所述脂肪酸包含环状部分。在一些实施方案中,所述脂肪醛是不饱和脂肪醛。在其他实施方案中,所述脂肪醛是单不饱和脂肪醛。在某些实施方案中,所述不饱和脂肪醛是C61、C71、C81、C91、C10:l、Cll:l、C12:l、C13:l、C14:l、C15:l、C16:l、C17:l、C18:l、C19:l、C20:l、C21:l、C22:1、C23:1、C24:1、C25:1或C26:1不饱和脂肪醛。在仍然其他实施方案中,所述脂肪醛在Ω-7位置是不饱和的。在某些实施方案中,所述不饱和脂肪醛包含顺式双键。在另一方面,本发明特征为遗传工程化的微生物,所述微生物包含稳定并入所述微生物的基因组DNA中位于多核苷酸的上游的外源控制序列,所述多核苷酸包含与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少70%序列同一性的核苷酸序列,其中所述微生物相对于野生型微生物产生增高水平的脂肪醛。在一些实施方案中,所述核苷酸序列与SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,所述核苷酸序列是SEQIDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121。在一些实施方案中,所述多核苷酸对于所述微生物来说是内源的。在其他实施方案中,遗传工程化所述微生物以在宿主细胞中表达修饰水平的编码脂肪酸合酶的基因。在某些实施方案中,所述微生物表达编码脂肪酸合酶的基因和/或具有增强表达或活性的内源脂肪酸合酶。在可选的实施方案中,所述微生物具有减弱表达的在宿主中编码脂肪酸合酶的基因和/或具有降低表达或活性的内源脂肪酸合酶。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatAl编码。在其他实施方案中,遗传工程化微生物以相对于野生型微生物表达减弱水平的脂肪酸降解酶。在一些实施方案中,所述微生物相对于野生型微生物表达减弱水平的酰基CoA合酶。在具体实施方案中,所述微生物表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的微生物包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。在仍然其他实施方案中,遗传工程化微生物以表达减弱水平的脱水酶/异构酶,例如由fabA或图6中列出的基因编码的酶。在一些实施方案中,该微生物包含fabA或图6中列出的基因的敲除。在其他实施方案中,遗传工程化微生物以表达减弱水平的酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该微生物包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化微生物以表达修饰水平的编码去饱和酶的基因,例如desA。在一些实施方案中,所述微生物是细菌。在某些实施方案中,所述细菌是革兰氏阴性菌或革兰氏阳性菌。在一些实施方案中,所述微生物是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。在其他实施方案中,所述微生物是诺卡氏菌(Nocardiasp.)、NRRL5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。在另一方面,本发明特征为由本文所述的任何方法或任何微生物所产生的脂肪在一些实施方案中,所述脂肪醛的δ1V为约-15.4或更高。在某些实施方案中,所述脂肪醛的δ13C为约-15.4至约-10.9,或δ13C为约-13.92至约-13.84。在一些实施方案中,所述脂肪醛的fM14C为至少约1.003。在某些实施方案中,所述脂肪醛的f/c为至少约1.01或至少约1.5。在一些实施方案中,所述脂肪醛的fMMC为约1.111至约1.124。在本文所述的任何方面,所产生的脂肪醛的产量为约25mg/L、约50mg/L、约75mg/L、约100mg/L、约125mg/L、约150mg/L、约175mg/L、约200mg/L、约225mg/L、约250mg/L、约275mg/L、约300mg/L、约325mg/L、约350mg/L、约375mg/L、约400mg/L、约425mg/L、约450mg/L、约475mg/L、约500mg/L、约525mg/L、约550mg/L、约575mg/L、约600mg/L、约625mg/L、约650mg/L、约675mg/L、约700mg/L、约725mg/L、约750mg/L、约775mg/L、约800mg/L、约825mg/L、约850mg/L、约875mg/L、约900mg/L、约925mg/L、约950mg/L、约975mg/L、约1000g/L、约1050mg/L、约1075mg/L、约1100mg/L、约1125mg/L、约1150mg/L、约1175mg/L、约1200mg/L、约1225mg/L、约1250mg/L、约1275mg/L、约1300mg/L、约1325mg/L、约1350mg/L、约1375mg/L、约1400mg/L、约1425mg/L、约1450mg/L、约1475mg/L、约1500mg/L、约1525mg/L、约1550mg/L、约1575mg/L、约1600mg/L、约1625mg/L、约1650mg/L、约1675mg/L、约1700mg/L、约1725mg/L、约1750mg/L、约1775mg/L、约1800mg/L、约1825mg/L、约1850mg/L、约1875mg/L、约1900mg/L、约1925mg/L、约1950mg/L、约1975mg/L、约2000mg/L或更高。在本文所述的任何方面,脂肪醛在本文所述的宿主细胞或微生物中由碳源产生。下述附图仅以示例的目的呈现而不意图限制。附图简述图1为脂肪醛产生的新途径的示意图。图2为诺卡氏菌(Nocardiasp.)NRRL5646car基因的核苷酸序列和相应氨基酸序列的列表。图3为CAR同系物的氨基酸序列基序的列表。图4为car同系物基因的核苷酸和氨基酸序列的列表。图5为鉴定可以被表达、超表达或减弱以增加特定底物产生的示例性基因的表格。图6为fabA相关基因的核苷酸和氨基酸序列的表格。图7为fabB相关基因的核苷酸和氨基酸序列的表格。发明详述除非另有限定,本文使用的所有技术和科学术语与本发明所属领域技术人员通常理解的具有相同的意义。尽管与本文所述的那些方法和材料相似或等同的方法和材料可以用于本发明的实践或测试,仍然在下文描述了合适的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考资料,包括GenBank数据库序列,通过引用全文并入。如有冲突,以包括定义在内的本说明书为准。此外,材料、方法和实施例仅是举例说明并不意图限制。根据下文的详细描述和权利要求,本发明的其他特征和优势会清晰。在整个本说明书中,可以使用缩写基因名称或多肽名称进行引用,但是应当理解到,该缩写基因或多肽名称表示基因或多肽的种类。这些基因名称包括编码相同多肽和具有相同生理功能的同源多肽的所有基因。多肽名称包括具有相同活性(例如催化相同基础化学反应活性)的所有多肽。除非另作说明,本文引用的登录号来自美国国立卫生研究院(NationalInstituteofHealth,U.S.Α)所维护的NCBI数据库(国家生物技术信息中心(NationalCenterforBiotechnology^formation))。登录号按照截止到2008年十月的数据库中提供的。EC号由国际生物化学和分子生物学联盟命名委员会(NomenclatureCommitteeoftheInternationalUnionofBiochemistryandMolecularBiology(NC-IUBMR))(可获取自http://www.chem.qmul.ac.uk/iubmb/enzyme/)制定。本文引用的EC号来自由东京大学部分资助的京都基因与基因组百科全书(KyotoEncyclopediaofGenesandGenomics)所维护的KEGG配体数据库。除非另作说明,EC号按照截止到2008年十月的数据库中提供的。本文所用冠词“a(—个)”和“an(—个)”是指该冠词的一个或多于一个(即至少一个)语法对象。作为实例,“元件(anelement)"表示一个元件或多于一个元件。本文所用术语“约”表示给定数值的士20%的值。因此,“约60%”表示在60%士(60的20%)之间的值(即48-70)。如本文所用的术语“减弱”表示削弱、降低或缩小。例如,可以通过修饰多肽来减弱多肽以降低其活性(例如,通过修饰编码所述多肽的核苷酸序列)。如本文使用,术语“生物量”是指任何生物材料,其中碳源来源于所述生物材料。在一些实例中,将生物量处理成适用于生物转化的碳源。在其他实例中,生物量不需要进一步处理成碳源。碳源可以转化成生物燃料。生物量的一个示例性来源是植物物质或植被。例如,玉米、甘蔗或柳枝稷可以用作生物量。生物量的另一非限制性实例是代谢废物,例如动物物质,例如牛粪。另外,生物量可以包括藻类或其他海洋植物。生物量还包括来自工业、农业、林业和家庭的废品。可以用作生物量的这些废品的实例是发酵废渣、青贮饲料、秸秆、无用杂物、污水、垃圾、纤维质城市废物和剩余食物。生物量还包括例如碳水化合物(例如单糖、二糖或多糖)的碳源。如本文所用的短语“碳源”是指适于用作原核细胞或简单真核细胞生长的碳源的底物或化合物。碳源可以具有不同形式,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和co2)。这些包括,例如,多种单糖,例如葡萄糖、果糖、甘露糖和半乳糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如木糖和阿拉伯糖;二糖,例如蔗糖、麦芽糖和松二糖;纤维素原料,例如甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪酸酯,例如琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇、甲醇或丙三醇或其混合物。碳源还可以是光合作用的产物,包括但不限于葡萄糖。优选的碳源是生物量。另一优选的碳源是葡萄糖。如果两个序列的每个碱基都匹配(即能够形成WatsonCrick碱基对),则核苷酸序列与另一核苷酸序列是“互补的”。术语“互补链”在本文中与术语“互补序列”互换使用。核酸链的互补序列可以是编码链的互补序列或非编码链的互补序列。如本文所用的术语“足以允许表达的条件”表示允许宿主细胞产生诸如本文所述的多肽或脂肪醛的所需产物的任何条件。合适的条件包括,例如发酵条件。发酵条件可以包含很多参数,例如温度范围、通气水平和培养基组分。这些条件中每一个单独地并联合地允许宿主细胞生长。示例性培养基包括培养液或凝胶。通常,所述培养基包括诸如葡萄糖、果糖、纤维素等的碳源,该碳源可以直接被宿主细胞代谢。此外,培养基中可以使用酶以便于促进动员(例如淀粉或纤维素的解聚为可发酵的糖)和随后碳源的代谢。为了确定条件是否足以允许表达,可以将宿主细胞培养例如约4、8、12、24、36或48小时。培养中和/或培养后,可以获取样品并分析样品以确定该条件是否允许表达。例如,可以测试样品或宿主细胞在其中生长的培养基中的宿主细胞的所需产物的存在。当测试产物的存在时,可以使用的检测诸如但不限于TLC、HPLC,GC/FID、GC/MS、LC/MS、MS。应当理解到,本文所述的多肽可以具有另外的对于多肽功能没有本质影响的保守型或非必需氨基酸取代。特定取代是否会被允许(即不会不利地影响例如脱羧酶活性的所需生物性质),可以按照Bowieetal.Science(1990)247:13061310中所述进行测定。“保守型氨基酸取代”是氨基酸残基被具有相似侧链的氨基酸残基所替代的取代。具有相似氨基酸侧链的氨基酸残基家族,在本领域中已有定义。这些家族包括具有以下侧链的氨基酸碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β分枝侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。如本文所用的“控制元件”表示转录控制元件。控制元件包括启动子和增强子。术语“启动子元件”、“启动子”或“启动子序列”是指作为激活基因表达的开关发挥功能的DNA序列。如果基因被激活,认为其被转录或参与转录。转录涉及由基因合成mRNA。因此,启动子充当转录调节元件并且还提供基因转录为mRNA的起始位点。控制元件与参与转录的细胞蛋白特异性相互作用(Maniatisetal,Science236:1237,1987)。如本文使用,术语“脂肪酸”表示具有通式RCOOH的羧酸。R表示脂肪族基团,优选地表示烷基。R可以包含约4到约22个碳原子。脂肪酸可以为饱和的、单不饱和的或多不饱和的。在优选的实施方案中,所述脂肪酸由脂肪酸生物合成途径产生。如本文所用的术语“脂肪酸生物合成途径”表示产生脂肪酸的生物合成途径。所述脂肪酸生物合成途径包括脂肪酸酶,所述脂肪酸酶可以按照本文所述经工程化产生脂肪酸,并且在一些实施方案中可以与其他酶一起表达以产生具有所需碳链特征的脂肪酸。如本文所用的术语“脂肪酸降解酶”表示涉及将脂肪酸或脂肪酸衍生物分解或转化成另一产物的酶。脂肪酸降解酶的非限制性实例是酰基CoA合酶。本文描述了脂肪酸降解酶的其他实例。如本文所用的术语“脂肪酸衍生物”表示部分地产生于生产宿主生物体的脂肪酸生物合成途径的产物。“脂肪酸衍生物”还包括部分地产生于酰基ACP或酰基ACP衍生物的产物。所述脂肪酸生物合成途径包括脂肪酸合酶酶类,所述脂肪酸合酶酶类可以按照本文所述经工程化产生脂肪酸衍生物,并且在一些实施例中可以与其他酶一起表达以产生具有所需碳链特征的脂肪酸衍生物。示例性的脂肪酸衍生物包括,例如脂肪酸、酰基CoA、脂肪醛、短和长链醇、碳氢化合物、脂肪醇和酯(例如蜡、脂肪酸酯或脂肪酯)。如本文所用的术语“脂肪酸衍生酶”表示在脂肪酸衍生物的产生中可以被表达或超表达的任何酶。这些酶可以是脂肪酸生物合成途径的一部分。脂肪酸衍生酶的非限制性实例包括脂肪酸合酶、硫酯酶、酰基CoA合酶、酰基CoA还原酶、醇脱氢酶、醇酰基转移酶、形成脂肪醇的酰基CoA还原酶、脂肪酸(羧酸)还原酶、醛还原酶、酰基ACP还原酶、脂肪酸羟化酶、酰基CoA去饱和酶、酰基ACP去饱和酶、酰基CoA氧化酶、酰基CoA脱氢酶、酯合酶和烷生物合成多肽等。脂肪酸衍生酶可以将底物转化为脂肪酸衍生物。在一些实施例中,所述底物可以是被脂肪酸衍生酶转化为不同的脂肪酸衍生物的脂肪酸衍生物。如本文所用的“脂肪酸酶”表示参与脂肪酸生物合成的任何酶。脂肪酸酶可以在宿主细胞中被修饰以产生脂肪酸。脂肪酸酶的非限制性实例包括脂肪酸合酶和硫酯酶。本文描述了脂肪酸酶的其他实例。如本文所用的“脂肪酸合酶”表示参与脂肪酸生物合成的任何酶。脂肪酸合酶可以在宿主细胞中表达或超表达以产生脂肪酸。脂肪酸合酶的非限制性实例是硫酯酶。本文描述了脂肪酸合酶的其他实例。如本文所用术语“脂肪醛”表示具有通式RCHO的醛,所述RCHO特征为不饱和羰基(c=0)。在优选的实施方案中,所述脂肪醛是产生自脂肪酸或脂肪酸衍生物的任何醛。在一个实施方案中,R基长度为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碳。R可以是直链或支链。支链可以具有一个或多个分支点。此外,支链可以包括环状分支。另外,R可以是饱和的或不饱和的。如果是不饱和的,R可以具有一个或多个不饱和点。在一个实施方案中,脂肪醛是生物合成产生的。脂肪醛具有很多用途。例如,脂肪醛可被用于产生多种特种化学品。例如,脂肪醛用于生产聚合物、树脂、染料、调味剂、增塑剂、香水、药品和其他化学品。一些被用作溶剂、防腐剂或消毒剂。一些天然和合成的化合物,例如维生素和激素是醛。术语“脂肪醛生物合成多肽”、“羧酸还原酶”和“CAR”在本文可交换地使用。如本文所用的“现代碳比例(fractionofmoderncarbon)”或“fM”与分别由称为草酸标准HOxI和HOxII的国家标准技术研究院(NationalInstituteofStandardsandTechnology(NIST))标准参考物(SRMs)4990B和4990C所定义的具有相同意义。基本定义涉及0.95倍的14Cz^C同位素比例HOxI(参考AD1950)。这粗略地等于衰变校正的工业革命前树木(decay-correctedpre-IndustrialRevolutionwood)。对于现今生命生物圈(植物物质)而言,fM约为1.1。本文所用的“基因敲除”是指修饰或失活编码靶蛋白的基因以降低或消除该完整蛋白的功能的方法。基因的失活可以通过常规方法进行,例如,通过UV照射或用N-甲基-N'-硝基-N-亚硝基胍处理的诱变,定点诱变、同源重组、插入-缺失诱变、或“Red-drivenintegration,,(Datsenkoetah,Proc.Natl.Acad.Sci.USA,97:6640-45,2000)。例如,在一实施方案中,将构建体引入宿主细胞从而可能在宿主细胞中选择同源重组事件。本领域技术人员会容易地设计包含阳性或阴性选择基因的敲除构建体,所述选择基因有效地选择经历了同源重组事件、具有构建体的转染的细胞。例如,宿主细胞中的改变可以通过用包含改变的DNA序列置换野生型DNA序列获得,所述置换通过单或双交叉重组。例如,为了方便地选择转化体,所述改变可以是编码抗生素抗性标记的DNA序列或与宿主的可能的营养缺陷型互补的基因。突变包括但不限于,缺失-插入突变。这类改变的实例包括基因中断,即基因干扰使得从该基因正常产生的产物没有以功能形式产生。这可以是由于完全缺失、选择性标记的缺失或插入、选择性标记的插入、移码突变、框内缺失或导致提前终止的定点突变。在一些实例中,该基因的完整mRNA是不存在的。在其他情况下,产生的mRNA的量发生变化。可以按照以下计算两个序列之间“同源性”。序列以最佳比较目的进行比对(例如,可以在第一和第二氨基酸或核酸序列之一或两者中引入空位用于最佳比对,并且为了比较目的可以忽略非同源序列)。在优选的实施方案中,用于比较目的的而比对的参考序列长度,为参考序列长度的至少约30%、优选地至少约40%、更优选地至少约50%、更优选地至少约60%并且更优选地至少约70%、至少约80%、至少约90%或约100%。然后比较位于相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中相应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置是相同的(如本文所用的,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列所共享的相同位置数的函数,这考虑到空位数和每个空位的长度,为了两个序列的最佳比对需要弓丨入空位。可以使用数学算法完成序列的比较和两个序列之间同源性百分比的测定。在优选的实施方案中,使用以下测定两个氨基酸序列之间的同源性百分比=NeedlemanandWunsch(1970),J.Mol.Biol.48:444453的算法,其被并入GCG软件包中的GAP程序中,使用Blossum62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重。在另一优选的实施方案中,使用以下测定两个核苷酸序列之间的同源性百分比GCG软件包中的GAP程序,使用NWSgapdna.CMP矩阵以及40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重。特别优选的参数组(和如果操作者不确定应当应用哪些参数确定分子是否在要求的同源性限制内而应该使用的参数组)是具有12的空位罚分、4的空位延伸罚分和5的移码空位罚分的Blossum62评分矩阵。如本文所用的“宿主细胞”是用于产生本文所述产物(例如本文所述的脂肪醛)的细胞。可以工程化宿主细胞以表达或超表达所选择的基因或具有所选择的基因的减弱的表达。宿主细胞的非限制性实例包括植物、动物、人、细菌、酵母或丝状真菌细胞。如本文所用的术语在“低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交”,描述用于杂交和洗涤的条件。进行杂交反应的指导可以见于CurrentProtocolsinMolecularBiology(现代分子生物学实验技术),JohnWiley&Sons,N.Y.(1989),6.3.1-6.3.6。该参考资料中描述了水性和非水性方法并且可以使用任一方法。本文涉及的具体杂交条件如下1)低严紧性杂交条件在约45°C下、在6X氯化钠/柠檬酸钠(SSC)中,然后是在至少50°C下、在0.2XSSC、0.1%SDS中洗涤两次(对于低严紧性条件,洗涤温度可以升至;2)中严紧性杂交条件在约45°C下在、在6XSSC中,然后是在60°C的0.2XSSC、0.SDS中洗涤一次或多次;3)高严紧性杂交条件在约45°C的6XSSC中,然后是在65°C下、在0.2XSSC、0.1%SDS中洗涤一次或多次;以及优选地4)非常高严紧性杂交条件为65°C的0.5M磷酸钠、7%SDS,然后是在65°C下、在0.2XSSCU%SDS中洗涤一次或多次。除非另作规定,非常高的严紧性条件(4)是优选的条件。本文中涉及诸如DNA或RNA的核酸所用的术语“分离的”是指分别从所述核酸的天然来源中存在的其他DNA或RNA中隔离的分子。此外,“分离的核酸”包括核酸片段,所述核酸片段不是以片段天然存在的并不会在天然状态中发现。本文所用的术语“分离的”还指从其他细胞蛋白分离的多肽,并且还指包括纯化的和重组的多肽两者。当核酸或多肽是通过重组DNA技术产生时,本文使用的术语“分离的”还指基本上不含细胞物质、病毒物质或培养基的核酸或肽。当核酸或多肽是化学合成时,本文所用的术语“分离的”还指基本上不含化学前体或其他化学品的核酸或肽。本文所用的术语“分离的”,对于诸如脂肪醛的产品而言,是指从细胞组分、细胞培养基或化学或合成前体分离的产物。如本文所用的“细胞中的基因表达水平”是指由所述细胞中基因编码的mRNA、前体mRNA新生转录物、转录加工中间体、成熟mRNA和降解产物的水平。如本文所用的术语“微生物”表示来自古菌域、细菌域和真核域的原核和真核微生物种类,后者包括酵母和丝状真菌、原生动物、藻类或高等原生生物。术语“微生物细胞”(即,来自微生物的细胞)和“微生物”是可交换使用的并且表示仅借助于显微镜可见的细胞或小有机体。如本文所用的术语“核酸”是指多核苷酸,例如脱氧核糖核酸(DNA)以及适当情况下,指核糖核酸(RNA)。该术语应理解为还包括作为等同物的产生自核苷酸类似物的RNA或DNA的类似物,以及适用于所述实施方案的单链(有义或反义)和双链多核苷酸、EST、染色体、cDNA、mRNA和rRNA。如本文所用的术语“可操作地连接”表示所选择的核苷酸序列(例如编码本文所述的多肽)与启动子接近以允许所述启动子调节该选择的DNA的表达。此外,按照转录和翻译的方向,所述启动子位于所述选择的核苷酸序列的上游。“可操作地连接”表示将核苷酸序列和调节序列连接以便当合适的分子(例如转录激活蛋白)与调节序列结合时允许基因表达。本文所用术语“或”表示术语“和/或”并且与术语“和/或”交换使用,除非上下文明确表示并非如此。如本文所用的“超表达”表示在细胞中以高于相应野生型细胞中正常表达浓度的浓度表达核酸、多肽或碳氢化合物或使之表达。例如,当在重组宿主细胞中多肽以与其在相同种类的非重组宿主细胞中的浓度相比更高的浓度存在时,所述多肽在所述重组宿主细胞中能够“超表达”。如本文所用的“分配系数”或“P”定义为化合物在有机相中的平衡浓度除以在水相中(例如发酵液)平衡时的浓度。在本文所述的两相系统的一个实施方案中,生产过程中所述有机相是由脂肪醛形成的。但是,在一些实施例中,可以例如通过提供辛烷层来提供有机相以便促进产物分离。当描述两相系统时,化合物的分配特性可以描述为logP。例如,IogP为1的化合物会101分配到有机相。IogP为-1的化合物会110分配到有机相。通过选择合适的发酵液和有机相,具有高IogP值的脂肪醛在发酵容器中也会分离到有机相中,即使处于很低的浓度。如本文所用的术语“纯化(purify)”、“纯化的(purified)”或“纯化(purification)”表示通过例如分离或隔离从分子的环境中移除或分离所述分子。“基本上纯化的”分子为至少约60%、优选地至少约75%以及更优选地至少约90%游离于与其相关的其他组分。如本文所用的这些术语还指从样品中去除污染物。例如,污染物的去除可以导致样品中脂肪醛的百分比增加。例如,当脂肪醛在宿主细胞中产生时,可以通过去除宿主细胞蛋白纯化脂肪醛。纯化后,样品中脂肪醛的百分比增加。术语“纯化(purify)”、“纯化的(purified)”或“纯化(purification),,不需要绝对纯。它们是相对的术语。因此,例如当脂肪醛在宿主细胞中产生时、纯化的脂肪醛是基本与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他碳氢化合物)隔离的脂肪醛。在另一实施例中,纯化的脂肪醛制剂是这样的制剂,在该制剂中,所述脂肪醛基本不含例如发酵后可能存在的那些污染物。在一些实施方案中,当样品重量的至少约50%是由脂肪醛组成时,所述脂肪醛是纯化的。在其他实施方案中,当样品重量的至少约eo^jo^jo^、85%、90%、92%、95%、98%或99%或更多是由脂肪醛组成时,所述脂肪醛是纯化的。如本文所用,术语“重组多肽”是指通过重组DNA技术产生的多肽,其中通常将编码所表达的多肽或RNA的DNA插入合适的表达载体,并且所述表达载体接下来用于转化宿主细胞以产生所述肽或RNA。如本文所用的术语“基本相同”(或“基本同源”)是用于指含有足够数量的与第二氨基酸或核苷酸序列相同或等同的(例如具有相似侧链,例如保守氨基酸取代)氨基酸残基或核苷酸的第一氨基酸或核苷酸序列,这样所述第一和第二氨基酸或核苷酸序列具有相似活性。如本文所用的术语“合酶”表示催化合成过程的酶。如本文所用的术语合酶包括合酶、合成酶和连接酶。如本文所用的术语“转染”表示将核酸(例如通过表达载体)通过核酸介导的基因转移引入到受体细胞。如本文所用的“转化”是指这样的过程,在该过程中,细胞的基因型由于细胞摄入外源核酸而改变。这可以导致表达重组形式的RNA或多肽的转化的细胞。在由转移的基因反义表达的情况下,天然存在形式的多肽的表达遭到破坏。如本文所用,“转运蛋白”是促进一种或多种化合物移入和/或移出细胞器和/或细胞的多肽。如本文所用,多肽X的“变体”是指具有肽X的氨基酸序列的多肽,其中一个或多个氨基酸残基发生改变。所述变体可以具有保守型改变或非保守型改变。使用本领域熟知的计算机程序,例如LASERGENE软件(DNASTAR),可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不影响生物活性的指导。在用于多核苷酸序列的情况下,术语“变体”可以包括与基因或其编码序列的多核苷酸序列相关的多核苷酸序列。该定义还可以包括,例如“等位基因”变体、“剪接”变体、“物种”变体或“多态性”变体。剪接变体可以与参考多核苷酸具有显著的同一性,但是由于在mRNA加工中的可选的外显子剪接,会通常具有更多或更少的多核苷酸数。相应的多肽可以具有另外的功能结构域或结构域缺失。物种变体是在物种之间彼此不同的多核苷酸序列。得到的多肽通常会具有显著的相对于彼此的氨基酸同一性。多态性变体是在给定物种的个体之间特定基因的多核苷酸序列中的变异。如本文所用,术语“载体”是指能够转运另一核酸的核酸分子,所述核酸分子连接到所述另一核酸。一种有用的载体是附加体(即能够染色体外的复制的核酸)。有用的载体是能够自主复制和/或表达与其连接的核酸的那些载体。能够指导基因的表达的载体在本文被称为“表达载体”,所述载体被可操作地连接到所述基因。通常,在重组DNA技术中有用的表达载体经常是“质粒”的形式,所述“质粒”通常是指在其载体形式时不与染色体结合的环状双链DNA环。在本说明书中,因为质粒是最通常使用的载体形式,所以“质粒”和“载体”是交换使用的。但是,还包括发挥等同功能并随后至今成为本领域已知的表达载体的这些其他形式。本发明至少部分基于大肠杆菌中脂肪醛合成新途径的发现和编码脂肪醛生物合成多肽的基因的鉴定。所述脂肪醛生物合成多肽参与图1中所示的生物合成途径。在该途径中,首先用ATP活化脂肪酸,然后用羧酸还原酶(CAR)样酶还原以产生脂肪醛。因此,本文所述的脂肪醛生物合成核苷酸和多肽可以用于产生脂肪醛。脂肪醛生物合成基因和变体例如,本文所述的方法和组合物包括脂肪醛生物合成基因,例如具有图2和图4中所列核苷酸序列的羧酸还原酶基因(car基因),以及其多核苷酸变体。在一些实例中,所述脂肪醛生物合成基因编码图3所示的一个或多个氨基酸基序。例如,该基因可以编码包含SEQIDNO7,SEQIDNO:8、SEQIDNO:9和SEQIDNO10;SEQIDNO11;SEQIDNO12;SEQIDNO13;SEQIDNO14;和/或SEQIDNO:7、SEQIDNO:9、SEQIDNO10和SEQIDN0:11的多肽。SEQIDNO:7包括还原酶结构域;SEQIDNO8禾口SEQIDNO14包括NADP结合结构域;SEQIDNO:9包括磷酸泛酰巯基乙胺附着位点;并且SEQIDNO10包括AMP结合结构域。变体可以是天然存在的或体外产生的。特别是,可以使用基因工程技术产生这些变体,例如定点诱变、随机化学诱变、外切核酸酶III缺失操作或标准克隆技术。可选地,可以使用化学合成或修饰操作产生这些变体、片段、类似物或衍生物。制备变体的方法是本领域熟知的。这些方法包括这样的操作,在该操作中,修饰获得自天然分离物的核酸序列以生成编码多肽的核酸,所述多肽具有增强其在工业或实验室应用中的价值的特征。在这些操作中,生成并表征了相对于获得自天然分离物的序列具有一个或多个核苷酸差异的大量变体序列。通常,这些核苷酸差异导致相对于来自天然分离物的核酸所编码的多肽的氨基酸改变。例如,可以使用易错PCR(参见,例如Leungetal.,Technique1:11-15,1989;和Caldwelletal.,PCRMethodsApplic.2:28_33,1992)产生变体。在易错PCR中,在DNA聚合酶的复制保真度低的条件下进行PCR,这样沿着PCR产物的整个长度获得了高效点突变。简单地说,在这些操作中,将待诱变的核酸(例如脂肪醛生物合成多核苷酸序列)与PCR引物、反应缓冲液、MgCl2,MnCl2,Taq聚合酶和适当浓度的dNIPs混合,以实现沿着PCR产物的整个长度的高效点突变。例如,可以使用20fmoles的待诱变的核酸(例如脂肪醛生物合成多核苷酸序列),30pmole的每种PCR引物,包含50mMKClUOmMTrisHCl(pH8.3)和0.01%明胶的反应缓冲液,7mMMgCl2,0.5mMMnCl2,5单位的Taq聚合酶,0.2mMdGTP,0.2mMdATP,ImMdCTP和ImMdTTP进行反应。PCR可以进行30个以下循环94°C持续1分钟、45°C持续1分钟和72°C持续1分钟。但是,应当理解到这些参数可以视情况变化。然后,将诱变后的核酸克隆到合适的载体中并且评价所述诱变后的核酸编码的多肽的活性。还可以使用寡核苷酸定向诱变以在任何克隆的目的DNA中产生位点特异性突变来产生变体。寡核苷酸诱变描述于,例如Reidhaar-Olsonetal.,Science241:53-57,1988。简单地说,在这些操作中,合成大量带有一个或多个待被引入克隆DNA中的突变的双链寡核苷酸并且将其插入待诱变的克隆DNA(例如脂肪醛生物合成多核苷酸序列)。重获含有诱变后的DNA的克隆并且评价其编码的多肽的活性。产生变体的另一方法是组合PCR(assemblyPCR)。组合PCR涉及由小DNA片段的混合物组合PCR产物。大量的不同PCR反应在相同小管中平行发生,伴随一个反应的产物引发另一反应的产物。组合PCR描述于例如美国专利第5,965,408号。生成变体的又一方法是有性PCR诱变。在有性PCR诱变中,作为基于序列同源性的DNA分子随机破碎的结果,体外发生了不同但高度相关的DNA序列的DNA分子之间的被迫的同源重组。然后是通过在PCR反应中的引物延伸固定交换。有性PCR诱变描述于例如Stemmer,PNAS,USA91:10747_10751,1994。还可以通过体内诱变产生变体。在一些实施方案中,核酸序列中的随机突变通过在携带一个或多个DNA修复途径中的突变的例如大肠杆菌菌株的细菌菌株中增殖所述序列来生成。这些“致突变(mutator)”菌株具有比野生型菌株更高的随机突变率。在这些菌株的一个菌株中增殖DNA序列(例如脂肪醛生物合成多核苷酸序列)会最终在所述DNA中产生随机突变。适用于体内诱变的致突变菌株描述于例如PCT公布第WO91/16427号。还可以使用盒诱变产生变体。在盒诱变中,双链DNA分子的小的区被不同于天然序列的合成的寡核苷酸“盒”替换。该寡核苷酸经常含有完全和/或部分随机化的天然序列。回归整体诱变(Recursiveensemblemutagenesis)也可以用于产生变体。回归整体诱变是开发用以产生表型相关的突变体的多样性群体的蛋白工程(即蛋白诱变)的运算法则,所述群体成员的氨基酸序列是不同的。该方法使用反馈机制来控制连续轮的组合盒诱变。回归整体诱变描述于例如Arkinetal.,PNAS,USA89:7811-7815,1992。在一些实施方案中,使用指数整体诱变(exponentialensemblemutagenesis)产生变体。指数整体诱变是产生具有高百分比的独特并且有功能的变体的组合文库的过程,其中小群残基被平行随机化以鉴定每个改变的位置上导致功能性蛋白的氨基酸。指数整体诱变描述于例如Delegraveetal.,Biotech.Res.111548-1552,1993。随机诱变和定点诱变描述于例如Arnold,Curr.Opin.Biotech.4:450-455,1993。在一些实施方案中,如例如美国专利第5,965,408号和第5,939,250号中所述,使用改组操作产生变体,其中许多编码不同多肽的核酸中的部分融合在一起以产生编码嵌合多肽的嵌合核酸序列。多核苷酸变体还包括核酸类似物。核酸类似物可以在碱基部分、糖部分或磷酸主链处进行修饰以改善例如核酸的稳定性、杂交或溶解性。碱基部分的修饰包括将脱氧胸苷修饰为脱氧尿苷和将脱氧胞苷修饰为5-甲基-2'-脱氧胞苷或5-溴-2'-脱氧胞苷。糖部分的修饰包括修饰核糖的2'羟基以形成2'-0-甲基糖或'-0-烯丙基糖。可以修饰脱氧核糖磷酸主链以产生吗啉代核酸,其中每个碱基部分连接到六元吗啉代环,或产生肽核酸,其中脱氧磷酸主链被假肽主链代替并保留4个碱基(参见,例如Summertonetal.,AntisenseNucleicAcidDrugDev.(1997)7187-195;禾口Hyrupetal.,Bioorgan.Med.Chem.(1996)4:5-23.)0此外,脱氧磷酸主链可以被例如硫代磷酸酯或二硫代磷酸酯主链、亚磷酰胺、或烷基磷酸三酯主链所代替。编码图2和图4中列出的同系物或其变体的任何多核苷酸序列可以被用作本文所述方法中的脂肪醛生物合成多核苷酸。脂肪酵牛物合成多肽和变体本文所述的方法和组合物还包括具有图2和图4列出的氨基酸序列的脂肪醛生物合成多肽及其多肽变体。在一些实例中,所述脂肪醛生物合成多肽是包括图3所示的一个或多个氨基酸基序的多肽。例如,该多肽可以包含SEQIDNO7,SEQIDNO:8、SEQIDNO:9和SEQIDNO:10的氨基酸序列。在其他情况下,该多肽包含SEQIDNO=IUSEQIDNO:12,SEQIDNO:13和SEQIDNO:14中的一个或多个。在仍然其他实例中,该多肽包含SEQIDNO:7、SEQIDNO:9、SEQIDNO10和SEQIDNO11的氨基酸序列。SEQIDNO7包括还原酶结构域;SEQIDNO:8和SEQIDNO14包括NADP结合结构域;SEQIDN0:9包括磷酸泛酰巯基乙胺附着位点;并且SEQIDNO10包括AMP结合结构域。脂肪醛生物合成多肽变体可以是其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)所取代的变体。这些取代的氨基酸残基可以是或可以不是遗传密码所编码的残基。保守型取代为由相似性质的另一氨基酸取代多肽中给定氨基酸的那些取代。典型的保守型取代是以下替换诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸替换,或反之亦然;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺基的残替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香族残基替换。其他多肽变体是那些其中一个或多个氨基酸残基包括取代基的变体。还有其他多肽变体是那些其中所述多肽与另一化合物结合的变体,如增加多肽的半衰期的化合物(例如聚乙二醇)。另外的多肽变体是那些其中其他氨基酸被融合到所述多肽的变体,所述其他氨基酸例如前导序列、分泌序列、前蛋白序列或促进所述多肽的纯化、富集或稳定的序列。在一些情况下,所述多肽变体保留了与具有图2和图4列出的氨基酸序列的多肽相同的生物学功能(例如,保留脂肪醛生物合成活性,例如羧酸或脂肪酸还原酶活性)并且具有与其基本相同的氨基酸序列。在其他情况下,所述多肽变体与图2和图4列出的氨基酸序列具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或多于约95%的同源性。在另一实施方案中,所述多肽变体包括片段,所述片段包含图2和图4列出的氨基酸序列的至少约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸。所述多肽变体或其片段可以通过使用本文所述的技术分离编码它们的核酸或通过超表达编码它们的合成的核酸来获得。可选地,多肽变体或其片段可以通过生物化学富集或纯化操作来获得。多肽变体或片段的序列可以通过蛋白水解消化、凝胶电泳和/或微测序来确定。然后使用本文所述的任何程序,可以将所述多肽变体或片段的序列与图2和图4列出的氨基酸序列进行比较。使用常规方法,可以检测所述多肽变体及其片段的产生脂肪醛醛的活性。例如,在允许所述多肽变体发挥功能的条件下,可以使所述多肽变体或片段与底物(例如,脂肪酸底物、脂肪酸衍生物底物或本文所述的其他底物)接触。可以测量底物水平的下降或脂肪醛水平的升高以测定产生脂肪醛的活性。抗脂肪酵牛物合成多肽抗体本文所述的脂肪醛生物合成多肽还可以用于产生针对脂肪醛生物合成多肽的抗体。这些抗体可以用于,例如利用本领域已知的方法检测脂肪醛生物合成多肽的表达。所述抗体可以是,例如多克隆抗体;单克隆抗体或其抗原结合片段;例如嵌合抗体、重构抗体(reshapedantibody)、人源化抗体的修饰的抗体或其片段(例如Fab'、Fab、F(ab')2);或例如单链抗体、单结构域抗体(DAB)、Fv、单链Fv(SCFV)等的生物合成抗体。制备和使用多克隆和单克隆抗体的方法描述于,例如Harlowetal.,UsingAntibodies:ALaboratoryManualportableProtocolI(用抗.体实骑室才旨南操作手册I).ColdSpringHarborLaboratory(1998年12月1日)。制备修饰的抗体和抗体片段(例如嵌合抗体、重构抗体、人源化抗体或其片段,所述片段例如Fab'、Fab、F(ab')2片段)或生物合成抗体(例如单链抗体、单结构域抗体(DABs)、Fv、单链Fv(SCFV)等)的方法是本领域已知的并且可以见于,例如Zola,MonoclonalAntibodiespreparationandUseofMonoclonalAntibodiesandEngineeredAntibodyDerivatives(单克隆抗体单克隆抗体和工程化抗体衍生物的制备和使用),施普林格(SpringerVerlag)(2000年12月15;第一版)。本文所述的组合物和方法可以用于由合适的底物产生脂肪醛。尽管不希望被理论所约束,还是认为本文所述的多肽通过还原机制由底物产生脂肪醛。在一些情况下,所述底物是脂肪酸衍生物(例如脂肪酸),并且具有特定分支模式和碳链长度的脂肪醛可以由具有那些会导致所需脂肪醛的特定特征的脂肪酸衍生物产生。因此,可以修饰导致脂肪酸衍生物底物的产生的生物合成途径中的每一个步骤以产生或过量产生目的底物。例如,可以在宿主细胞中表达、超表达或减弱参与脂肪酸生物合成途径或脂肪醛途径的已知基因,以产生所需底物(参见,例如PCT/US08/058788)。示例性基因提供于图5中。底物的合成脂肪酸合酶(FAQ是一组催化酰基链的起始和延长的多肽(Marrakchietal.,BiochemicalSociety,301050-1055,2002)。酰基载体蛋白(ACP)以及FAS途径中的酶控制所产生的脂肪酸衍生物的长度、饱和度和分支。脂肪酸生物合成途径涉及前体乙酰CoA和丙二酰CoA。该途径中的步骤由脂肪酸生物合成(fab)和乙酰CoA羧化酶(acc)基因家族的酶催化(参见,例如Heathetal.,Prog.LipidRes.40(6):467-97(2001))可以通过重组表达或超表达一种或多种脂肪酸合酶基因,例如乙酰CoA和/或丙二酰CoA合酶基因,工程化宿主细胞以表达脂肪酸衍生物底物。例如,为了增加乙酰CoA产生,可以在宿主细胞中表达一个或多个以下基因pdh(包含aceEF(编码丙酮酸和2_酮戊二酸脱氢酶复合物的Elp脱氢酶组分和E2p二氢硫辛酰胺酰基转移酶组分,和Ipd)的多酶复合物)、panK、fabH、fabD、fabG、acpP和fabF。这些基因的示例性GenBank登录号为pdh(BAB34380、AAC73227、AAC73226)、panK(也称为CoA、AAC76952)、aceEF(AAC73227、AAC73226)、fabH(AAC74175)、fabB(P0A953)、fabD(AAC74176)、fabG(AAC74177)、acpP(AAC74178)、fabF(AAC74179)。此外,可以通过用含有相应基因的无效或缺失突变的条件复制或非复制质粒进行转化或通过取代启动子或增强子序列,在工程化的宿主细胞中减弱或敲除fadE、gpsA、ldhA、pflb、adhE、pta、poxB、ackA和/或ackB的表达水平。这些基因的示例性GenBank登录号为fadE(AAC73325)、gspA(AAC76632)、IdhA(AAC74462)、pflb(AAC73989)、adhE(AAC74323)、pta(AAC75357)、poxB(AAC73958)、ackA(AAC75356)和ackB(BAB81430)。得到的宿主细胞当在合适的环境中生长时,会具有增加的乙酰CoA产生水平。可以通过将accABCD(例如登录号AAC73296、EC6.4.1.2)引入宿主细胞影响丙二酰CoA的超表达。可以通过将编码脂肪酶的DNA序列(例如,登录号CAA89087、CAA98876)引入宿主细胞,在宿主细胞中进一步超表达脂肪酸。此外,抑制PlsB可以导致长链酰基ACP的水平增加,这会抑制途径中的早期步骤(例如,accABCD、fabH和fabl)。pisB(例如,登录号AAC77011)D31IE突变可以用于增加可用的脂肪酸的量。此外,可以工程化宿主细胞以超表达sfa基因(fabA的抑制基因,例如,登录号AAN79592),从而增加单不饱和脂肪酸的产生(Rocketal.,J.Bacteriology1785382-5387,1996)。通过修饰所选择的硫酯酶的表达,可以选择脂肪酸衍生物底物的链长度。硫酯酶影响产生的脂肪酸的链长度。因此,可以工程化宿主细胞以表达、超表达、具有减弱表达或不表达一种或多种选择的硫酯酶以增加优选的脂肪酸衍生物底物的产生。例如,Cltl脂肪酸可以通过表达具有产生Cltl脂肪酸偏向性的硫酯酶并减弱具有产生除了Cltl脂肪酸外的脂肪酸的偏向性的硫酯酶(例如,优选产生C14脂肪酸的硫酯酶)来产生。这会导致碳链长度为10的脂肪酸的相对同种群体。在仍然其他情况下,C14脂肪酸可以通过减弱产生非C14脂肪酸的内源硫酯酶并且表达使用C14-ACP的硫酯酶来产生。在一些情况下,C12脂肪酸可以通过表达使用C12-ACP的硫酯酶并且减弱产生非C12脂肪酸的硫酯酶来产生。使用本领域已知的方法可以证实乙酰CoA、丙二酰CoA和脂肪酸的过量产生,例如,通过在细胞裂解后使用放射性操作、HPLC或GC-MS。可以用于本文所述的方法中的硫酯酶的非限制性实例在表1中列出。表1硫酯酶权利要求1.产生脂肪醛的方法,所述方法包括在宿主细胞中表达编码多肽的基因和从所述宿主细胞分离所述脂肪醛,其中所述多肽包含与SEQIDNO:18、20、22、24、沈、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列具有至少约80%的序列同一性的氨基酸序列。2.如权利要求1所述的方法,其还包括修饰所述宿主细胞中编码脂肪酸合酶的基因的表达。3.如权利要求2所述的方法,其中修饰脂肪酸合酶的基因的表达包括在宿主细胞中表达编码硫酯酶的基因。4.如权利要求1所述的方法,其中遗传工程化所述宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。5.产生脂肪醛的方法,所述方法包括在宿主细胞中表达(i)编码包含与SEQIDNO16的氨基酸序列具有至少约80%的序列同一性的氨基酸序列的多肽的基因和(ii)编码重组脂肪酸合酶的基因;并从所述宿主细胞分离所述脂肪醛。6.产生脂肪醛的方法,所述方法包括在宿主细胞中表达编码包含SEQIDN0:16的氨基酸序列的多肽或其变体的基因,和从所述宿主细胞分离所述脂肪醛,其中遗传工程化所述宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。7.产生脂肪醛的方法,所述方法包括在宿主细胞中表达重组载体和从所述宿主细胞分离所述脂肪醛,其中所述重组载体包含与SEQIDNO:17、19、21、23、25、27、29、31、33、;35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约80%的序列同一性的核苷酸序列。8.如权利要求7所述的方法,其还包括修饰宿主细胞中编码脂肪酸合酶的基因的表达。9.如权利要求8所述的方法,其中修饰脂肪酸合酶的基因的表达包括在宿主细胞中表达编码硫酯酶的基因。10.如权利要求7所述的方法,其中遗传工程化所述宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。11.产生脂肪醛的方法,所述方法包括在宿主细胞中表达(i)包含与SEQIDN0:15的核苷酸序列具有至少约80%的序列同一性的核苷酸序列的重组载体和(ii)重组脂肪酸合酶;并从所述宿主细胞分离所述脂肪醛。12.产生脂肪醛的方法,所述方法包括在宿主细胞中表达包含与SEQIDN0:15的核苷酸序列具有至少约80%序列同一性的核苷酸序列的重组载体,和从所述宿主细胞分离所述脂肪醛,其中所述宿主细胞相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。13.如权利要求1所述的方法,其中所述宿主细胞选自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。14.如权利要求13所述的方法,其中从所述宿主细胞的细胞外环境分离所述脂肪醛。15.如权利要求13所述的方法,其中所述脂肪醛包含C6-C26脂肪醛。16.如权利要求15所述的方法,其中所述脂肪醛是癸醛、十二醛、十四醛或十六醛。17.如权利要求13所述的方法,其中所述脂肪醛是不饱和脂肪醛。18.如权利要求13所述的方法,其中所述脂肪醛是饱和脂肪醛。19.如权利要求1所述的方法,其还包括在所述多肽或所述核苷酸序列编码的多肽的至少一种生物底物的存在下,培养所述宿主细胞。20.如权利要求19所述的方法,其中所述底物是脂肪酸。21.如权利要求20所述的方法,其中所述脂肪酸包括C6-C26脂肪酸。22.如权利要求21所述的方法,其中所述脂肪酸是癸酸、十二酸、十四酸或十六酸。23.如权利要求20所述的方法,其中所述脂肪酸是不饱和脂肪酸。24.如权利要求20所述的方法,其中所述脂肪酸是饱和脂肪酸。25.遗传工程化的微生物,所述微生物包含稳定并入所述微生物的基因组DNA中位于多核苷酸的上游的外源控制序列,所述多核苷酸包含与SEQIDN0:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少70%序列同一性的核苷酸序列,其中所述微生物相对于野生型微生物产生增高水平的脂肪醛。26.通过权利要求1的方法所产生的脂肪醛。27.如权利要求沈所述的脂肪醛,其中所述脂肪醛的δ"C为约-15.4或更大。28.如权利要求沈所述的脂肪醛,其中所述脂肪醛的fMMC为至少约1.003。全文摘要描述了用于产生脂肪醛的方法和组合物,包括核苷酸序列、氨基酸序列和宿主细胞。文档编号C12P1/00GK102232110SQ200980148338公开日2011年11月2日申请日期2009年10月7日优先权日2008年10月7日发明者穆尔塔扎·F·阿里比海,胡志浩申请人:Ls9公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1