分离的醇脱氢酶酶类及其用途的制作方法

文档序号:580257阅读:362来源:国知局
专利名称:分离的醇脱氢酶酶类及其用途的制作方法
技术领域
本发明的实施方案一般地涉及分离的多肽以及编码该多肽的多核苷酸,所述多 肽具有脱氢酶活性,例如醇脱氢酶(ADH)活性、糖醛酸,4-脱氧-L-赤-5-己酮糖糖醛酸 (DEHU) ((45,5幻-4,5-二羟基-2,6-二氧代己酸)氢化酶活性、2-酮基-3-脱氧-D-葡萄 糖酸脱氢酶活性、D-甘露糖醛酸氢化酶活性和/或D-甘露糖酸脱氢酶活性,还涉及使用包 含这些多核苷酸和多肽的重组微生物、微生物系统和化学系统,将生物质转化为大量生产 型化学品,例如生物燃料。相关技术用于将生物质转化为生物燃料的现有方法集中在木质纤维素生物质的使用,并且 存在很多与使用本工艺相关的问题。木质纤维素生物质的大规模培育需要大量的耕地,这 只有通过用能源作物生产替代粮食作物生产、采伐森林和再耕种目前未经耕作的土地来实 现。其他的问题包括水的可利用性和质量的降低以及杀虫剂和化肥的使用的增加。由于木质纤维素生物质坚实的机械强度和复杂的化学组分,使用生物系统对其进 行降解是非常困难的挑战。将木质纤维素完全转化为单糖需要约三十种不同的酶。该复杂 的方式的仅有的可用的替代方式需要大量的热、压力和强酸。因此,本领域需要用于将生物 质转化为作为生物燃料或生物汽油使用的碳氢化合物的经济的和技术上简单的工艺。作为该工艺中的一个步骤,具有醇脱氢酶活性的酶类在将来自生物质的多糖转化 为寡糖或单糖中是有用的,然后所述寡糖或单糖可以转化为各种生物燃料。具有诸如糖醛 酸、4-脱氧-L-赤-5-己酮糖糖醛酸(DEHU)和/或D-甘露糖醛酸氢化酶活性的醇脱氢酶 活性的酶类先前已经从藻酸盐代谢细菌中纯化,但是编码DEHU或D-甘露糖醛酸氢化酶的 基因尚未被克隆和表征。本申请提供了编码具有DEHU和/或D-甘露糖醛酸氢化酶活性的 醇脱氢酶的基因,并且也提供了在生产例如生物燃料的大量生产型化学品中与它们的使用 相关的方法。概述本发明的实施方案包括选自以下的分离的多核苷酸,及其片段或变体(a)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少80%同一的核苷酸序列;(b)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少90%同一的核苷酸序列;(c)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少95%同一的核苷酸序列;(d)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少97%同一的核苷酸序列;(e)分离的多核苷酸,其包含与 SEQ I D NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少99%同一的核苷酸序列;和(f)分离的多核苷酸,其包含 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、 27、29、31、33、35或37所示的核苷酸序列,其中所述分离的核苷酸编码具有脱氢酶活性的多肽。在其他实施方案中,所述多 肽具有醇脱氢酶活性。在某些实施方案中,所述多肽具有DEHU氢化酶活性和/或D-甘露 糖醛酸氢化酶活性。另外的实施方案包括用于将多糖转化为适合的单糖或寡糖的方法,所述方法包含 使多糖与微生物系统接触,其中所述微生物系统包含重组微生物,并且其中所述重组微生 物包含本公开内容的多核苷酸,其中所述多核苷酸编码具有氢化酶活性的多肽,所述氢化 酶活性例如醇脱氢酶活性、DEHU氢化酶活性和/或D-甘露糖醛酸氢化酶活性。另外的实施方案包括用于催化D-甘露糖醛酸还原(氢化)的方法,所述方法包含 使D-甘露糖醛酸与微生物系统接触,其中所述微生物系统包含微生物,并且其中所述微生 物包含本公开内容的多核苷酸。另外的实施方案包括用于催化DEHU还原(氢化)的方法,所述方法包含使DEHU 与微生物系统接触,其中所述微生物系统包含微生物,并且其中所述微生物包含本公开内 容的多核苷酸。另外的实施方案包括包含本公开内容的分离的多核苷酸的载体,并且还可以包括 下述载体,其中所述分离的多核苷酸可操作地连接在表达调控区,并且其中所述多核苷酸 编码具有氢化酶活性的多肽,所述氢化酶活性例如醇脱氢酶活性、DEHU氢化酶活性和/或 D-甘露糖醛酸氢化酶活性。另外的实施方案包括重组微生物或包含重组微生物的微生物系统,其中所述重组 微生物包含如本文所述的多核苷酸或多肽。在某些实施方案中,所述重组微生物选自醋 USlff (Acetobacter aceti) ,^i^iffM (Achromobacter) >Bf SIS' (Acidiphilium) >^ 云力ff (Acinetobacter) ^^iMMM (Actinomadura)、 字云力方(Actinoplanes) > 嗜热古生菌(Aeropyrum pernix)、土壤杆菌(Agrobacterium)、产碱杆菌(Alcaligenes)、 菠萝(Ananas comosus) (M)、节细菌(Arthrobacter)、黑曲霉(Aspargillusniger)、米 曲 β (Aspergillus oryze) >(Aspergillus melleus)、曲 β (Aspergllus pulverulentus)、佐氏曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇 佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillusalcalophilus)、解淀粉芽孢 杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌 (Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、缓慢芽孢杆菌(Bacillus lentus)、地衣芽胞杆菌活菌(Bacillus lichiformis)、浸麻芽孢杆菌(Bacillus macerans)、嗜热月旨肪芽抱杆菌(Bacillus stearothermophilus)、枯草杆菌(Bacillussubtilis)、双歧杆菌属(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋 葱布克氏菌(Burkholderia c印acia)、柱状假丝酵母(Cmdida cylindracea)、皱褶假丝 酵母(Candida rugosa)、番木瓜(Carica papaya) (L)、纤维菌(Cellulosimicrobium)、 头抱霉(Cephalosporium)、毛壳菌(Chaetomiumerraticum)、细 HI3 毛壳菌(Chaetomium gracile)、梭状芽孢杆菌属(Clostridium)、酪酸梭菌(Clostridium butyricum)、丙酮 丁酉享梭菌(Clostridiumacetobutylicum)、热纤维梭菌(Clostridium thermocellum)、 (# M M ) # ^ ff S" (Corynebacterium(glutamicum)) ^ efficiens _ # ff 胃 (Corynebacteriumefficiens)、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、 菊欧文氏菌(Erwina chrysanthemi)、葡糖杆菌(Gliconobacter)、葡糖醋杆菌 (Gluconacetobacter)、嗜盐古菌(Haloarcula)、特异腐质霉(Humicolainsolens)、 Humicola nsolens、西唐北里孢菌(Kitasatospora setae)、克雷桕氏杆菌(Klebsiella)、 产酸克雷桕氏杆菌(Klebsiella oxytoca)、克鲁维斯酵母属(Kluyveromyces)、脆壁克 鲁维斯酵母(Kluyveromyces fragilis)、乳酸克鲁维斯酵母(Kluyveromyces lactis)、 考克氏菌(Kocuria)、乳酸乳杆菌(Lactlactis)、乳酸杆菌属(Lactobacillus)、发酵 乳酸杆菌(Lactobacillusfermentum)、清酒乳酸杆菌(Lactobacillus sake)、乳球菌 属(Lactococcus)、乳酸乳球菌(Lactococcus lactis)、明串珠菌属(Leuconostoc)、甲 基孢囊菌属(methylocysis)、西西里甲烷叶菌(methanolobus siciliae)、嗜器官产甲 焼菌(Methanogenium organophilum)、布氏甲焼杆菌(Methanobacteriumbryantii)、蛾 微杆菌(Microbacterium imperiale)、溶壁微球菌(Micrococcuslysodeikticus)、小月 菌(Microlunatus)、爪口圭毛霉(Mucor javanicus)、分支杆菌属(Mycobacterium)、漆斑 M (Myrothecium)、石宵(Nitrobacter) ^^it^MM (Nitrosomonas) λ K (Nocardia)、番木瓜(Papayacarica)、小球菌(Pediococcus)、嗜盐片球菌(Pediococcus halophilus)、青霉(Penicillium)、沙门桕干酪青霉(Penicillium camemberti)、桔青霉 (Penicillium citrinum)、埃默森青霉(Penicillium emersonii)、娄地青霉(Penicillium roqueforti)、薄青霉(Penicillium lilactinum)、多色青霉(Penicillium multicolor)、 异养石肖化~好氧反石肖化菌(Paracoccuspantotrophus)、丙酸杆菌(Propionibacterium)、 假单胞菌(Pseudomonas)、荧光假单胞菌(Pseudomonas f luorescens)、脱氮假单胞 菌(Pseudomonasdenitrificans)、热球菌(Pyrococcus)、激烈热球菌(Pyrococcus furiosus)、极端嗜热球菌(Pyrococcus horikoshii)、根瘤菌(Rhizobium)、米赫 根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus Lindt)、根霉 (Rhizopus)、戴尔根霉(Rhizopus delemar)、日本根霉(Rhizopus japonicus)、雪白根 霉(Rhizopus niveus)、米根霉(Rhizopus oryzae)、少抱根霉(Rhizopusoligosporus)、 红球菌(Rhodococcus)、酉良酒酵母(Saccharomyces cerevisiae)、核盘菌(Sclerotina libertina)、多食鞘氨酉享杆菌(Sphingobacteriummultivorum)、鞘氨酉享杆菌 (Sphingobium)、鞘氨醇单胞菌(Sphingomonas)、链球菌(Streptococcus)、嗜热链球菌 (Streptococcus thermophilus Y-1)、链霉菌(Streptomyces)、灰色链霉菌(Streptomyces griseus)、变铅青链霉菌(Streptomyces lividans)、鼠链霉菌(Streptomyces murinus)、 诱赤链霉菌(Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、 轮枝链霉菌(Streptoverticillium mobaraense)、四联球菌(Tetragenococcus)、嗜热菌(Thermus)、泛养硫球菌(Thiosphaera pantotropha)、栓菌(Trametes)、木霉 (Trichoderma)、长梗木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、青霉毛抱子菌(Trichosporon penicillatum)、 溶藻弧菌(Vibrio alginolyticus)、黄杆菌(Xmthomonas)、酵母(yeast)、鲁氏酵母 (Zygosaccharomyces rouxii)、酵单胞菌(Zymomonas)禾口运动发酵单胞菌(Zymomonus mobilis)。另外的实施方案包括选自以下的分离的多肽,及其变体或片段(a)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少80%同一的氨基酸序列;(b)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示氨基酸序列至少90%同一的氨基酸序列; (c)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少95%同一的氨基酸序列;(d)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少97%同一的氨基酸序列;(e)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少99%同一的氨基酸序列;和(f)分离的多肽,其包含 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34、36、38或78所示的氨基酸序列,其中所述分离的多肽具有氢化酶活性,例如醇脱氢酶活性、DEHU氢化酶活性和/ 或D-甘露糖醛酸氢化酶活性。另外的实施方案包括用于将多糖转化为适合的单糖或寡糖的方法,所述方法包含 使多糖与重组微生物接触,其中所述重组微生物包含按照本公开内容的ADH多核苷酸或多 肽。另外的实施方案包括用于催化D-甘露糖醛酸还原(氢化)的方法,所述方法包含 使D-甘露糖醛酸与重组微生物接触,其中所述重组微生物包含按照本公开内容的ADH多核 苷酸或多肽。另外的实施方案包括用于催化糖醛酸,4-脱氧-L-赤-5-己酮糖糖醛酸(DEHU)还 原(氢化)的方法,所述方法包含使DEHU与重组微生物接触,其中所述重组微生物包含按 照本公开内容的ADH多核苷酸或多肽。另外的实施方案包括用于将多糖转化为适合的单糖或寡糖的微生物系统,其中所 述微生物系统包含重组微生物,并且其中所述重组微生物包含选自以下的分离的多核苷 酸(a)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少80%同一的核苷酸序列;(b)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少90%同一的核苷酸序列;(c)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少95%同一的核苷酸序列;
(d)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少97%同一的核苷酸序列;(e)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少99%同一的核苷酸序列;和(f)分离的多核苷酸,其包含 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、
27、29、31、33、35或37所示的核苷酸序列。另外的实施方案包括用于将多糖转化为适合的单糖或寡糖的微生物系统,其中所 述微生物系统包含重组微生物,并且其中所述重组微生物包含选自以下的分离的多肽(a)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、2 0、22、24、26、
28、30、32、34、36、38或78所示的氨基酸序列至少80%同一的氨基酸序列;(b)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少90%同一的氨基酸序列;(c)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少95%同一的氨基酸序列;(d)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少97%同一的氨基酸序列;(e)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少99%同一的氨基酸序列;和(f)分离的多肽,其包含 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34、36、38或78所示的氨基酸序列。在另外的实施方案中,如本文公开的分离的多核苷酸可以编码多肽,所述多肽包 含烟酰胺腺嘌呤二核苷酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸磷酸(NADP+)或NADPH 的结合基序中的至少一个。其他实施方案可以包括分离的ADH多肽或者其片段、变体或 衍生物,其中所述多肽包含烟酰胺腺嘌呤二核苷酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸 磷酸(NADP+)或NADPH结合基序中的至少一个。在某些实施方案中,NAD+、NADH、NADP+ 或 NADPH 结合基序选自 Y-X-G-G-X-Y (SEQ IDNO 67)、Y-X-X-G-G-X-Y (SEQ ID NO 68)、 Y-X-X-X-G-G-X-Y (SEQ IDNO 69)、Y-X-G-X-X-Y (SEQ ID NO 70)、Y-X-X-G-G—X—X—Y (SEQ IDNO 71)、Y-X-X-X-G-X-X-Y(SEQ ID NO 72),Y-X-G-X-Y(SEQ IDNO 73)、Y-X-X-G-X_Y(SEQ ID NO 74)、Y-X-X-X-G-X-Y(SEQ ID NO 75)和 Υ-Χ-Χ-Χ-X-G-X—Y(SEQ ID NO 76);其中 Y 独立地选自丙氨酸、甘氨酸和丝氨酸,其中G是甘氨酸,并且其中X独立地选自基因编码的 氨基酸。某些实施方案涉及将多糖转化为乙醇的方法,所述方法包含将多糖与重组微生物 接触,其中所述重组微生物能够在作为唯一碳源的多糖上生长。在某些实施方案中,所述重 组微生物包含至少一种编码至少一种丙酮酸脱羧酶的多核苷酸和至少一种编码醇脱氢酶 的多核苷酸。在某些实施方案中,所述多糖是藻酸盐。在某些实施方案中,所述重组微生物 包含一个或多个含有灿烂弧菌(Vibro splendidus)V12B01_24189和V12B01_24249之间 的基因组区的多核苷酸。在某些实施方案中,至少一种丙酮酸脱羧酶来自运动发酵单胞菌 (Zymomonas mobilis)。在某些实施方案中,至少一种醇脱氢酶来自运动发酵单胞菌。在某 些实施方案中,重组微生物是大肠杆菌。
附图简要描述

图1显示按照实施例2实施的分离的醇脱氢酶(ADH)酶利用DEHU作为底物的 NADPH消耗。图2显示按照实施例2实施的分离的ADH酶利用D-甘露糖醛酸作为底物的NADPH消耗。图3显示ADHl的核苷酸序列(SEQ ID NO 1)和氨基酸序列(SEQ IDNO 2)图4显示ADH2的核苷酸序列(SEQ ID NO 3)和氨基酸序列(SEQ IDNO 4)图5显示ADH3的核苷酸序列(SEQ ID NO 5)和氨基酸序列(SEQ IDNO 6) 图6显示ADH4的核苷酸序列(SEQ ID NO 7)和氨基酸序列(SEQ IDNO 8)图7显示ADH5的核苷酸序列(SEQ ID NO 9)和氨基酸序列(SEQ IDNO 10)图8显示ADH6的核苷酸序列(SEQ ID NO 11)和氨基酸序列(SEQ IDNO 12)图9显示ADH7的核苷酸序列(SEQ ID NO 13)和氨基酸序列(SEQ IDNO 14)图10显示ADH8的核苷酸序列(SEQ ID NO 15)和氨基酸序列(SEQID NO 16)图11显示ADH9的核苷酸序列(SEQ ID NO 17)和氨基酸序列(SEQID NO 18)图12显示ADHlO的核苷酸序列(SEQ ID NO 19)和氨基酸序列(SEQID NO 20)图13显示ADHll的核苷酸序列(SEQ ID NO 21)和氨基酸序列(SEQID NO 22)图14显示ADH12的核苷酸序列(SEQ ID NO 23)和氨基酸序列(SEQID NO 24)。图15显示ADH13的核苷酸序列(SEQ ID NO 25)和氨基酸序列(SEQID NO 26)图16显示ADH14的核苷酸序列(SEQ ID NO 27)和氨基酸序列(SEQID NO 28)图17显示ADH15的核苷酸序列(SEQ ID NO 29)和氨基酸序列(SEQID NO 30)图18显示ADH16的核苷酸序列(SEQ ID NO 31)和氨基酸序列(SEQID NO 32)图19显示ADH17的核苷酸序列(SEQ ID NO 33)和氨基酸序列(SEQID NO 34)图20显示ADH18的核苷酸序列(SEQ ID NO 35)和氨基酸序列(SEQID NO 36)图21显示ADH19的核苷酸序列(SEQ ID NO 37)和氨基酸序列(SEQID NO 38)图22显示如实施例3所描述的改造的或重组的大肠杆菌在作为唯一碳源的藻酸 盐上生长的结果(见实线圆圈),。根瘤土壤杆菌(Agrobacteriumtumefaciens)细胞提供 阳性对照(见阴影线圆圈)。紧靠根瘤土壤杆菌阳性对照左边的孔含有DHlOB大肠杆菌细 胞,DHlOB大肠杆菌细胞提供阴性对照。图23显示如实施例4所描述的由在作为唯一碳源的藻酸盐上生长的大肠杆菌产 生的乙醇。大肠杆菌用pBBRPdc-AdhA/B或pBBRPdc-AdhA/B+1. 5F0S转化,并且允许在含有
藻酸盐的m9培养基中生长。图24显示ADHll和ADH20的DEHU氢化酶活性。ADH20是从灿烂弧菌12B01中分 离的推定的羟基丙二酸半醛还原酶(TSAR)基因(参见SEQ ID NO :78氨基酸序列),并且 ADH20展示出显著的DEHU氢化作用活性,特别是与NADH。详细描述定义除非另有定义,本文使用的所有技术和科学术语与在本发明所属领域具有普通技 术的人员所通常理解的具有相同意义。尽管任何与本文所述相近或等同的方法和材料可以 用于本发明的实践或测试,但是描述的是优选的方法和材料。为了本发明的目的,以下术语定义如下。本文使用的冠词“一个(a)”和“一个(an)”是指一个或多于一个(即至少一个) 该冠词的语法对象。例如,“一个元件(an element)”表示一个元件或多于一个元件。“约(about),,表示与参照数量(quantity)、水平、值、数目(number)、频率、百分 比、尺度、尺寸、量(amount)、重量或长度相比改变了 30、25、20、25、10、9、8、7、6、5、4、3、2或
的数量、水平、值、数目、频率、百分比、尺度、尺寸、量、重量或长度。“生物质(biomass)”的实例包括水生或海生的生物质、基于水果的生物质如水果 废料和基于蔬菜的生物质如蔬菜废料等。水生或海生的生物质的实例包括但不限于海藻、 巨藻、淡水海草、水藻和海生的显微植物群、微藻、海草等。在某些方面,生物质不包括碳的 化石化来源,例如通常发现于地壳顶层内的碳氢化合物(例如天然气、几乎纯碳组成的非 挥发性材料、如无烟煤等)。 “水生生物质(aquatic biomass) ”或“海生生物质(marine biomass) ”的实例包 括但不限于海藻、巨藻、马尾藻类海草、淡水海草、水藻、海生显微植物群、微藻和海草等。水果和/或蔬菜生物质的实例包括但不限于任何果胶来源,例如植物外皮和渣, 包括柑橘、橙、葡萄柚、西红柿、马铃薯、葡萄、芒果、醋栗、胡萝卜、糖用甜菜和苹果以及其 他。生物质的多糖、寡糖、单糖或其他糖类成分的实例包括但不限于藻酸盐、琼脂、角 叉胶、岩藻依聚糖、果胶、葡萄糖酸、甘露糖醛酸、甘露醇、来苏糖、纤维素、半纤维素、甘油、 木糖醇、葡萄糖、甘露糖、半乳糖、木糖、木聚糖、甘露聚糖、阿拉伯胶素、阿拉伯糖、葡糖醛 酸、半乳糖醛酸(包括二半乳糖醛酸和三半乳糖醛酸)、鼠李糖等。藻酸盐衍生的多糖的一些实例包括饱和多糖,例如β -D-甘露糖醛酸、α -L-葡 萄糖醛酸、二藻酸盐(dialginate)、三藻酸盐(trialginate)、五藻酸盐(pentalginate)、 六藻酸盐(hexalginate)、七藻酸盐(h印talginate)、八藻酸盐(octalginate)、九藻酸
盐(nonalginate)、十藻酸盐(decalginate)、^--藻酸盐(undecalginate)、十 二藻酸
盐(dodecalginate)和多聚藻酸盐,以及不饱和多糖例如4_脱氧-L-赤_5_己酮糖糖醛 酸、4- (4-脱氧-β -D-mann-4-enuronosyl) _D_甘露糖醛酸或L-古罗糖醛酸、4- (4-脱 氧- β -D-mann-4-enuronosyl) - 二藻酸盐、4-(4-脱氧- β -D-mann-4-enuronosyl)-三 藻酸盐、4-(4_ 脱氧-0-D-mann-4-enuronosyl)-四藻酸盐、4_(4_ 脱 氧- β -D-mann-4-enuronosyl)-五藻酸盐、4-(4-脱氧- β -D-mann-4-enuronosyl)-六 藻酸盐、4-(4_ 脱氧-β-D-mann-4-enuronosyl)-七藻酸盐、4_(4_ 脱 氧- β -D-mann-4-enuronosyl)-八藻酸盐、4-(4-脱氧- β -D-mann-4-enuronosyl)-九 藻酸盐、4-(4-脱氧-0-D-mann-4-enuronosyl)-十一藻酸盐和 4-(4-脱 氧-β -D-mann-4-enuronosy 1)-十二藻酸盐。果胶衍生的多糖的一些实例包括饱和多糖,例如半乳糖醛酸、二半 乳糖醛酸、三半乳糖醛酸、四半乳糖醛酸、五半乳糖醛酸、六半乳糖醛酸、七 半乳糖醛酸、八半乳糖醛酸、九半乳糖醛酸、十半乳糖醛酸、十二半乳糖醛 酸、多聚半乳糖醛酸和鼠李半乳糖醛酸,以及饱和多糖,例如4-脱氧-L-苏 式-5-己酮糖糖醛酸、4-(4_ 脱氧-a-D-gluc-4-enuronosyl)-D-半 乳糖酸酸、4-(4_ 脱氧一α -D-gluc-4-enuronosyl)-D- 二 半乳糖醛酸、4-(4-脱氧-α -D-gluc-4-enuronosy 1)-D-三半乳 糖醛酸、4-(4_ 脱氧-α -D-gluc-4-enuronosyl)-D-四半乳糖 醛酸、4-(4_ 脱氧-α -D-gluc-4-enuronosyl)-D-五半乳糖醛 酸、4-(4_ 脱氧-α -D-gluc-4-enuronosy 1)-D-六半乳糖醛 酸、4-(4_ 脱氧-α -D-gluc-4-enuronosyl)-D-七半乳糖醛酸、 4_ (4-脱氧-a-D-gluc-4-enuronosyl)-D-八半乳糖醛酸、4_(4_ 脱 氧-α -D-gluc-4-enuronosy1)-D-九半乳糖醛酸、4_(4_ 脱 氧-α -D-gluc-4-enuronosyl)-D-十半乳糖 Sl 酸禾口 4-(4-脱 氧-α -D-gluc-4-enuronosyl) -D-十二半乳糖醛酸。这些多糖或寡糖成分可以通过本文所述的微生物转化为“适合的单糖”或其他“适 合的糖类”,例如“适合的寡糖”,所述微生物能够在作为碳源(例如唯一的碳源)的这些多 糖或其他糖类组分上生长。“单糖”、“适合的单糖”或“适合的糖类”通常指由在作为碳源或唯一碳源的果胶、 藻酸盐或其他糖类(例如半乳糖醛酸、纤维素、半纤维素等)上生长的重组微生物产生的 任何糖类,还通常指可以用来在本发明的生物燃料生物合成途径中产生碳氢化合物的任何 糖类,所述碳氢化合物例如生物燃料或生物汽油。适合的单糖或寡糖的实例包括但不限于 2-酮基-3-脱氧D-葡萄糖酸(KDG)、D-甘露醇、葡糖醛酸、甘露糖醛酸、甘露醇、来苏糖、甘 油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸、半乳糖醛酸和鼠李糖等。如 本文所提示,本文使用的“适合的单糖”或“适合的糖类”可以由本发明的改造的或重组的 微生物产生,或者从商业上可利用的来源中获得。本文使用的叙述“大量生产型化学品(commodity chemical) ”包括可以直接产生 或作为本文提供的方法的副产品产生的任何可供出售的或可销售的化学品,包括生物燃料 和/或生物汽油。“大量生产型化学品”的一般实例包括但不限于,生物燃料、矿产品、聚合 物前体、脂肪醇、表面活性剂、增塑剂和溶剂。本文使用的叙述“生物燃料(biofuels)”包括 至少部分来自例如重组微生物的生物来源的固体、液体或气体燃料。大量生产型化学品的实例包括但不限于甲烷、甲醇、乙烷、乙烯、乙醇、正丙烷、
1-丙烯、1-丙醇、丙醛、丙酮、丙酸酯、正丁烷、1-丁烯、1-丁醇、正丁醛、丁酸乙酯、异丁 醛、异丁醇、2-甲基正丁醛、2-甲基丁醇、3-甲基正丁醛、3-甲基丁醇、2- 丁烯、2- 丁醇、
2-丁酮、2,3- 丁二醇、3-羟基-2- 丁酮、2,3- 丁二酮、乙苯、乙烯苯、2-苯基乙醇、苯基乙 醛、1-苯基丁烷、4-苯基-1- 丁烯、4-苯基-2- 丁烯、1-苯基-2- 丁烯、1-苯基-2- 丁醇、 4-苯基-2- 丁醇、1-苯基-2- 丁酮、4-苯基-2- 丁酮、1-苯基-2,3- 丁二醇、1_苯基_3_羟 基-2- 丁酮、4-苯基-3-羟基-2- 丁酮、1-苯基-2,3- 丁二酮、正戊烷、乙基苯酚、乙烯 基苯酚、2-(4_羟苯基)乙醇、4-羟苯基乙醛、1-(4_羟苯基)丁烷、4-(4_羟苯基)-1_ 丁 烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯 基)-2- 丁醇、1- (4-羟苯基)-2- 丁酮、4- (4-羟苯基)-2- 丁酮、1- (4-羟苯基)-2,3- 丁二 醇、1- (4-羟苯基)-3-羟基-2- 丁酮、4- (4-羟苯基)-3-羟基-2- 丁酮、1_ (4-羟苯基)-2,
3-丁酮二酮、吲哚基乙烷、吲哚基乙烯、2-(吲哚-3-)乙醇、η-戊烷,1-戊烯、1-戊醇、戊 醛、戊酸、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2,3_戊二 醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2,3-戊二酮、2-甲基戊烷、4-甲基戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲 基-3-戊酮、4-甲基-2,3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、 4-甲基_2,3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、 1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基_2,3-戊 二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2,3-戊二酮、4-甲 基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯 基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊 酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2,3-戊二醇、4-甲基-1-苯基-2,3-戊 二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1_(4_羟 苯基)戊烷、1-(4_羟苯基)-1_戊烯、1-(4_羟苯基)-2_戊烯、1-(4_羟苯基)-3_戊烯、 1-(4_羟苯基)-2_戊醇、1-(4_羟苯基)-3_戊醇、1-(4_羟苯基)-2_戊酮、1-(4_羟苯 基)-3_戊酮、1-(4_羟苯基)-2,3_戊二醇、1-(4_羟苯基)-2_羟基-3-戊酮、1-(4_羟 苯基)-3_羟基-2-戊酮、1-(4_羟苯基)-2,3_戊二酮、4-甲基-l-(4-羟苯基)戊烷、 4-甲基-l-(4-羟苯基)-2_戊烯、4-甲基-l-(4-羟苯基)-3_戊烯、4-甲基-1-(4_羟苯 基)-1_戊烯、4-甲基-l-(4-羟苯基)-3_戊醇、4-甲基-l-(4-羟苯基)-2_戊醇、4-甲 基-1- (4-羟苯基)-3-戊酮、4-甲基-1- (4-羟苯基)-2-戊酮、4-甲基-1- (4-羟苯基)-2, 3-戊二醇、4-甲基-1- (4-羟苯基)-2,3-戊二酮、4-甲基-1- (4-羟苯基)-3-羟基-2-戊 酮、4-甲基-l-(4-羟苯基)-2_羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-l-戊烯、 1-(吲哚_3) -2-戊烯、1-(吲哚-3) -3-戊烯、1-(吲哚-3) -2-戊醇、1_ (吲哚_3) -3-戊醇、 1-(吲哚-3) -2-戊酮、1-(吲哚-3) -3-戊酮、1-(吲哚-3) -2,3-戊二醇、1_ (吲哚-3) -2-羟 基-3-戊酮、1-(吲哚_3) -3-羟基-2-戊酮、1-(吲哚-3) -2,3-戊二酮、4-甲基-1-(吲 哚-3_)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲 哚-3)-1-戊烯、4-甲基_2-(吲哚_3)-3-戊醇、4-甲基-1-(吲哚_3)-2-戊醇、4-甲 基-1-(吲哚_3)-3-戊酮、4-甲基-l-( B引哚-3)-2-戊酮、4-甲基_1_( B引哚_3)-2,3_戊 二醇、4-甲基-1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲 基-1-(吲哚-3)-2-羟基-3-戊酮、正己烷、1-己烯、1-己醇、己醛、己酸、2-己烯、3-己 烯、2-己醇、3-己醇、2-己酮、3-己酮、2,3_己二醇、2,3_己二酮、3,4_己二醇、3 ,4_己二 酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、 3-甲基己烧、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲 基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲 基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲 基-3-己酮、2-甲基-3,4-己二醇、2-甲基-3,4-己二酮、5-甲基_2,3_己二醇、5-甲基-2,
3-己二酮、4-甲基-2,3-己二醇、4-甲基-2,3-己二酮、2-甲基-3-羟基-4-己酮、2-甲 基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟 基-3-己酮、4-甲基-3-羟基-2-己酮、2,5- 二甲基己烷、2,5- 二甲基-2-己烯、2,5- 二甲 基-3-己烯、2,5-二甲基-3-己醇、2,5-二甲基-3-己酮、2,5-二甲基-3,4-己二醇、2,5-二 甲基-3,4-己二酮、2,5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯 基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、
4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯 基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己 酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2,3-己二醇、4-甲基-1-苯基-2,3-己二 醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯 基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2,3-己二酮、
4-甲基-1-苯基-2,3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1- (4-羟苯基)-1-己 烯、5-甲基-l-(4-羟苯基)-2_己烯、5-甲基-l-(4-羟苯基)-3_己烯、4-甲基_1-(4_羟 苯基)-1_己烯、4-甲基-l-(4-羟苯基)-2_己烯、4-甲基-l-(4-羟苯基)-3_己烯、
5-甲基-l-(4-羟苯基)-2_己醇、5-甲基-l-(4-羟苯基)-3_己醇、4-甲基_1-(4_羟 苯基)-2_己醇、4-甲基-l-(4-羟苯基)-3_己醇、5-甲基-l-(4-羟苯基)-2_己酮、 5-甲基-l-(4-羟苯基)-3_己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4_羟苯 基)-3_己酮、5-甲基-l-(4-羟苯基)-2,3_己二醇、4-甲基-l-(4-羟苯基)-2,3_己二 醇、5-甲基-l-(4-羟苯基)-3_羟基-2-己酮、5-甲基-l-(4-羟苯基)-2_羟基-3-己 酮、4-甲基-l-(4-羟苯基)-3_羟基-2-己酮、4-甲基-l-(4-羟苯基)-2_羟基-3-己 酮、5-甲基-l-(4-羟苯基)-2,3_己二酮、4-甲基-l-(4-羟苯基)-2,3_己二酮、4-甲 基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3) -2-己烯、5-甲 基-1-(吲哚-3)-3_己烯、4-甲基-1-(吲哚-3)-l-己烯、4-甲基-1-(吲哚-3)-2_己烯、 4-甲基-1-(吲哚-3) -3-己烯、5-甲基-1-(吲哚-3) -2-己醇、5-甲基-1-(吲哚-3) -3-己 醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基+(吲 哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚_3)-2_己酮、4-甲 基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二醇、4-甲基(吲哚_3)-2, 3-己二醇、5-甲基-1-(吲哚-3) -3-羟基-2- 己酮、5-甲基-1-(吲哚-3) -2-羟基-3-己 酮、4-甲基-1-(吲哚_3)-3-羟基-2-己酮、4-甲基-1-(吲哚_3)-2-羟基-3-己酮、5-甲 基-1-(吲哚-3) -2,3-己二酮、4-甲基-1-(吲哚-3) -2,3-己二酮、正庚烷、1_庚烯、1_庚 醇、庚醛、庚酸、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2,3-庚 二醇、2,3_庚二酮、3,4_庚二醇、3,4_庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟 基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚 烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚 烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚 醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚 酮、2-甲基_3,4-庚二醇、2-甲基-3,4-庚二酮、6-甲基_3,4-庚二醇、6-甲基_3,4_庚二 酮、5-甲基_3,4-庚二醇、5-甲基_3,4-庚二酮、2-甲基-3-羟基_4_庚酮、2-甲基_4_羟 基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚 酮、5-甲基-4-羟基-3-庚酮、2,6_ 二甲基庚烷、2,5- 二甲基庚烷、2,6_ 二甲基-2-庚烯、 2,6- 二甲基-3-庚烯、2,5- 二甲基-2-庚烯、2,5- 二甲基-3-庚烯、3,6- 二甲基-3-庚烯、 2,6-二甲基-3-庚醇、2,6-二甲基-4-庚醇、2,5-二甲基-3-庚醇、2,5-二甲基-4-庚醇、 2,6-二甲基-3,4-庚二醇、2,6-二甲基-3,4-庚二酮、2,5-二甲基-3,4-庚二醇、2,5-二 甲基_3,4-庚二酮、2,6- 二甲基-3-羟基-4-庚酮、2,6- 二甲基-4-羟基-3-庚酮、2,5- 二 甲基-3-羟基-4-庚酮、2,5- 二甲基-4-羟基-3-庚酮、正辛烷、1-辛烯、2-辛烯、1_辛醇、辛醛、辛酸、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4,5-辛二醇、4,5-辛二酮、4-羟基-5-辛酮、 2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲 基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲 基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲 基-4,5-辛二醇、2-甲基-4,5-辛二酮、3-甲基-4,5-辛二醇、3-甲基-4,5-辛二酮、2-甲 基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟 基-4-辛酮、2,7_ 二甲基辛烷、2,7_ 二甲基-3-辛烯、2,7_ 二甲基-4-辛烯、2,7_ 二甲 基-4-辛醇、2,7- 二甲基-4-辛酮、2,7- 二甲基-4,5-辛二醇、2、7_ 二甲基-4,5-辛二酮、 2,7-二甲基-4-羟基-5-辛酮、2,6-二甲基辛烷、2,6-二甲基-3-辛烯、2,6-二甲基-4-辛 烯、3,7-二甲基-3-辛烯、2,6-二甲基-4-辛醇、3,7-二甲基-4-辛醇、2,6-二甲基-4-辛 酮、3,7-二甲基-4-辛酮、2,6-二甲基-4,5-辛二醇、2,6-二甲基-4,5-辛二酮、2,6-二甲 基-4-羟基-5-辛酮、2,6- 二甲基-5-羟基-4-辛酮、3,6- 二甲基辛烷、3,6- 二甲基-3-辛 烯、3,6-二甲基-4-辛烯、3,6-二甲基-4-辛醇、3,6-二甲基-4-辛酮、3,6-二甲基-4,5-辛 二醇、3,6- 二甲基-4,5-辛二酮、3,6- 二甲基-4-羟基-5-辛酮、正壬烷、1_壬烯、壬醇、 壬醛、壬酸、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基_5_壬 醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基_4,5-壬二醇、8-甲基-4, 5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2,8- 二甲基壬烷、2,8- 二 甲基-3-壬烯、2,8_ 二甲基-4-壬烯、2,8_ 二甲基-5-壬烯、2,8-二甲基-4-壬醇、2,8-二 甲基-5-壬醇、2,8_ 二甲基-4-壬酮、2,8_ 二甲基-5-壬酮、2,8_ 二甲基-4,5-壬二醇、2, 8- 二甲基-4,5-壬二酮、2,8- 二甲基-4-羟基-5-壬酮、2,8- 二甲基-5-羟基-4-壬酮、 2,7- 二甲基壬烷、3,8_ 二甲基-3-壬烯、3,8_ 二甲基-4-壬烯、3,8_ 二甲基-5-壬烯、3, 8-二甲基-4-壬醇、3,8_ 二甲基-5-壬醇、3,8_ 二甲基-4-壬酮、3,8-二甲基-5-壬酮、 3,8-二甲基-4,5-壬二醇、3,8-二甲基-4,5-壬二酮、3,8-二甲基-4-羟基-5-壬酮、3, 8-二甲基-5-羟基-4-壬酮、η-癸烷、1-癸烯、1-癸醇、癸酸、2,9_ 二甲基癸烷、2,9_ 二甲 基-3-癸烯、2,9_ 二甲基-4-癸烯、2,9_ 二甲基-5-癸醇、2,9_ 二甲基-5-癸酮、2,9_ 二 甲基-5,6-癸二醇、2,9_ 二甲基-6-羟基-5-癸酮、2,9_ 二甲基-5,6-癸二酮^一烷、 Ι-i^一烯、1-十一醇、i^一醛,十一酸、正十二烷、1-十二烯、1-十二醇、十二醛、十二酸、正 十二烷、1-十癸烯(decadecene)、1-十二醇、十二醛、十二酸、正十三烷、十三烯、十三 醇、十三醛、十三酸、正十四烷、1-十四烯、1-十四醇、十四醛、十四酸、正十五烷、1-十五烯、 1-十五醇、十五醛、十五酸、正十六烷、1-十六烯、1-十六醇、十六醛、十六酸、正十七烷、 1-十七烯、1-十七醇、十七醛、十七酸、正十八烷、1-十八烯、1-十八醇、十八醛、十八酸、正 十九烷、1-十九烯、1-十九醇、十九醛、十九酸、二十烷、1-二十烯、1-二十醇、二十醛、二十 酸、3-羟基丙醛、1、3-丙二醇、4-羟基正丁醛、1、4_ 丁二醇、3-羟基-2- 丁酮、2、3_ 丁二 醇、1,5_戊二醇、高柠檬酸、高异柠檬酸、b-羟基己二酸、戊二酸、戊二半醛,戊二醛、2-羟 基-1-环戊酮、1,2_环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2,3-二羟基-异 戊酸、2_氧代异戊酸、异丁酰_Co4、异丁酸酯、异丁醛、5-氨基戊醛、1,10- 二氨基癸烷、1, 10- 二氨基-5-癸烯、1,10- 二氨基-5-羟基癸烷、1,10- 二氨基-5-癸酮、1,10- 二氨基-5, 6_癸二醇、1,10- 二氨基-6-羟基-5-癸酮、苯乙醛、1,4- 二苯基丁烷、1,4- 二苯基-1- 丁 烯、1,4-二苯基-2-丁烯、1,4-二苯基-2-丁醇、1,4-二苯基-2-丁酮、1,4-二苯基-2,3-二醇、1,4- 二苯基-3-羟基-2- 丁酮、1- (4-羟苯基)-4"苯基丁烷、1-(4-羟苯基)~4~苯 基-1- 丁烯、1- (4-羟苯基)-4-苯基-2- 丁烯、1- (4-羟苯基)-4-苯基-2- 丁醇、1_ (4-羟 苯基)-4_苯基-2-丁酮、1-(4_羟苯基)-4_苯基-2,3-丁二醇、1-(4-羟苯基)-4-苯 基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲 哚-3) -4-苯基-2- 丁烯、1-(吲哚-3) -4-苯基-2- 丁醇、1-(吲哚_3) -4-苯基-2- 丁酮、 1-(吲哚_3) -4-苯基-2,3- 丁二醇、1-(吲哚-3) -4-苯基-3-羟基-2- 丁酮、4-羟基苯乙 醛、1,4_ 二(4-羟苯基)丁烷、1,4_ 二(4-羟苯基)-1_ 丁烯、1,4_ 二(4-羟苯基)_2_ 丁 烯、1,4_ 二(4-羟苯基)-2_ 丁醇、1,4_ 二(4-羟苯基)-2_ 丁酮、1,4_ 二(4-羟苯基)_2, 3_ 丁二醇、1,4_ 二(4-羟苯基)-3_羟基-2-丁酮、1-(4_羟苯基)-4-(吲哚-3-) 丁烷、 1-(4-羟苯基)-4-(吲哚-3)-1- 丁烯、1- 二 (4-羟苯基)-4-(吲哚-3) -2- 丁烯、1_ (4-羟 苯基)-4-(吲哚-3) -2- 丁醇、1- (4-羟苯基)-4-(吲哚-3) -2- 丁酮、1_ (4-羟苯基)-4-(吲 哚-3) -2,3- 丁二醇、1- (4-羟苯基-4-(吲哚-3) -3-羟基-2- 丁酮、吲哚_3_乙醛、1,4- 二 (吲哚-3_) 丁烷、1,4_ 二(吲哚-3)-l-丁烯、1,4_ 二(吲哚-3)-2-丁烯、1,4_ 二(口引 哚-3)-2-丁醇、1,4-二(吲哚-3)-2-丁酮、1,4-二(吲哚 _3)-2,3-丁二醇、1,4-二(口引 哚-3) -3-羟基-2- 丁酮、琥珀酸半醛、己烷-1,8- 二羧基酸、3-己烯-1,8- 二羧基酸、3-羟 基-己烷-1,8-二羧基酸、3-己酮-1,8-二羧基酸、3,4_己二醇-1,8-二羧基酸、4-羟 基-3-己酮-1,8-二羧基酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾、磷酸盐寸。
术语“生物活性片段(biologically active fragment) ”,适用于参照或全长多 核苷酸或多肽序列的片段,是指具有参照序列活性的至少约0. 1、0.5、1、2、5、10、12、14、16、 18、20、22、24、26、28、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、97、98、99% 的片 段。本发明范围内包括长度至少约 18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、 60、70、80、90、100、120、140、160、180、200或更多核苷酸或残基的生物活性片段,其包含或 编码参照多核苷酸或多肽的活性。示例性的生物活性片段通常参与相互作用,例如分子内 或分子间相互作用。分子间相互作用可以是特异结合相互作用或酶促相互作用。分子间 相互作用可以是在ADH多肽和辅因子分子之间,所述辅因子分子例如烟酰胺腺嘌呤二核苷 酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸磷酸(NADP+)或NADPH分子。ADH多肽的生物活性 部分包括包含与任何以下氨基酸序列具有足够相似性或同一性或者衍生自任何以下氨基 酸序列的的氨基酸序列的肽:SEQ ID NOs :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38 或 78。“编码序列(coding sequence)”是指对基因的多肽产物编码的起作用的任何核酸 序列。相反地,术语“非编码序列(non-coding sequence) ”是指对基因的多肽产物编码不 起作用的任何核酸序列。在本说明书始终,除非上下文另有规定,词语“包含(comprise) ”、“包含 (comprises) ”和“包含(comprising) ”应理解为意指包括所述的步骤或要素或者步骤 或要素组,而不排除任何其他的步骤或要素或者步骤或要素组。“由…组成(consisting of)”是指包括且限于跟在该短语“由…组成”之后的内容。因此,短语“由…组成”表明所 列出的要素是必需的的或强制性,并且不存在其他要素。“基本上由…组成(consisting essentially of) ”指包括该短语后面列出的任何要素,并且限于不干扰或促进所列出的要素在本公开内容中给定的活性或作用的其他要素。因此,该短语“基本上由…组成”表明所 列出的要素是必需的或强制性的,但其他要素不是任选的,其是否可以存在取决于它们是 否影响所列出的要素的活性或作用。术语“互补的(complementary),,和“互补性(complementarity),,是指与碱基配 对原则相关的多核苷酸(即核苷酸序列)。例如,序列“A-G-T”与序列“T-C-A”是互补的。 互补性可以是“部分的(partial)”,其中只有一些核酸碱基按照碱基配对原则被匹配。或 者,可以有核酸之间“完全的”或“全部的”互补性。核酸链之间互补性的程度对核酸链之 间杂交的效率和强度具有显著影响。“对应于(corresponds to),,或“对应于(corresponding to),,是指(a)多核昔酸 具有与参照多核苷酸序列的全部或部分基本上同一的或互补的核苷酸序列,或者编码与肽 或蛋白质中的氨基酸序列同一的氨基酸序列;或者(b)肽或多肽具有与参照肽或蛋白质中 的氨基酸序列基本上同一的氨基酸序列。“衍生物”是指通过修饰从基础序列衍生而来的多肽,所述修饰例如通过与其他化 学部分共轭或配位或者通过翻译后修饰,这些在本领域是可以理解的。术语“衍生物”在其 范围内还包括对母序列(parentsequence)进行的改动,其包括用于提供功能等同分子的 添加或缺失。如本文所用的,术语“功能”和“功能的”等是指生物的、酶的或治疗的功能。 术语“外源的”通常指不是天然存在于野生型细胞或生物体中,而是通常通过分子 生物学技术即工程改造技术导入到细胞中来产生重组微生物的多核苷酸序列或多肽。“外 源”多核苷酸的实例包括编码期望的蛋白或酶的载体、质粒和/或人造核酸构建体。术语 “内源的”通常指可以见于给定的野生型细胞或生物体内的天然存在的多核苷酸序列或多 肽。例如某些天然存在的细菌或酵母种类通常不含有苯甲醛裂解酶基因,因此,不包含编码 苯甲醛裂解酶的“内源的”多核苷酸序列。关于这点,还应该注意到尽管生物体包含给定的 多核苷酸序列或基因的内源的拷贝,但是导入编码所述序列的质粒或载体,例如用于过表 达所述编码蛋白或者调节所述编码蛋白的表达,表示所述基因或多核苷酸序列的“外源”拷 贝。任何本文所述的途径、基因或酶可以利用或依赖于“内源”序列,或者可以作为一个或 多个“外源”多核苷酸序列提供,和/或按照已经包含在给定的微生物中的内源的序列来使 用。“重组”微生物包含一个或多个外源的核苷酸序列,例如在质粒或载体中的外源核 苷酸序列。“微生物系统”通常指重组微生物的群体,例如包含在培养箱或其他类型的微生物 培养瓶/装置/孔中的群体,或者例如发现在皿或板上生长的(例如含有琼脂糖的培养皿) 群体。“基因”是指在染色体占据特定基因座的遗传单位,其由转录和/或翻译调节序列 和/或编码区和/或非翻译序列(即内含子、5’和3’非翻译序列)组成。“同源性(Homology) ”是指同一的或组成型保守取代的核苷酸或氨基酸的百分数。 同源性可以使用序列比较程序来确定,例如GAP(Deverauxet al.,1984,Nucleic Acids Research 12,387-395),在此通过引用将其并入。以此方式,与本文引用的序列长度相似或 基本上不同的序列可以通过在比对中插入空位来进行比较,所述空位的确定例如通过GAP所用的比较算法。术语“宿主细胞”包括可以是或已经是本发明的任何重组载体或分离的多核苷酸 的接受体的个体细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代,并且由于天然的、 偶然的或蓄意的突变和/或变化,所述后代并不一定与最初的母体细胞完全相同(在形态 上或在总DNA互补物方面)。宿主细胞包括用本发明的重组载体或多核苷酸体内或体外转 染或感染的细胞。包含本发明重组载体的宿主细胞是重组宿主细胞。“分离的,,是指基本上或实质上没有通常在其天然状态中与之伴随的组分的物质。 例如,本文使用的“分离的多核苷酸”是指从在天然存在状态时位于其侧翼的序列中纯化的 多核苷酸,例如从通常与其相邻的序列中移开的DNA片段。可选地,本文使用的“分离的肽” 或“分离的多肽”等是指肽或多肽分子从其天然细胞环境中和从与该细胞其他组分的结合 中进行体外分离和/或纯化,即它不与体内物质结合。如本文所用叙述,“多糖”、“适合的单糖”或“适合的寡糖”可以作为微生物中能量 和碳的来源使用,并且适合用于产生例如生物燃料和生物汽油的碳氢化合物的生物燃料的 生物合成途径。多糖、适合的单糖和适合的寡糖的实例包括但不限于藻酸盐、琼脂糖、岩藻 依聚糖、果胶、葡糖醛酸、甘露糖醛酸、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳 糖、木糖、阿拉伯糖、葡糖醛酸、半乳糖醛酸、鼠李糖和2-酮基-3-脱氧D-葡萄糖酸-6-磷 酸(KDG)等。 “获自”是指样品,例如诸如多核苷酸提取物或多肽提取物分离自或衍生自特定来 源的个体。例如,所述提取物可以获自直接从所述个体分离的的组织或生物流体。本文使用的术语“寡核苷酸”是指多个核苷酸残基(脱氧核糖核苷酸或核糖核苷 酸或其相关的结构变体或合成类似物)通过磷酸二酯键(或其相关的结构变体或合成类似 物)连接组成的聚合物。因此,虽然术语“寡核苷酸”通常指核苷酸聚合物,其中核苷酸残基 和它们之间的连接是天然存在的,但也应该理解到,该术语在其范围内还包括各种类似物, 包括但不限于肽核酸(PNAs)、氨基磷酸酯、硫代磷酸、甲基膦酸酯、2-0-甲基核糖核酸等。 分子精确的大小根据具体应用而有所不同。寡核苷酸通常在长度上较短,通常从10到30 个核苷酸残基,但是该术语可以指任何长度的分子,尽管术语“多核苷酸”或“核酸”通常用 于指代大的寡核苷酸。本文使用的术语“可操作地连接(operably linked) ”表示将结构基因置于启动子 的调节控制下,然后该启动子控制基因的转录和任选的翻译。在异源启动子/结构基因组 合的构建中,通常优选地将基因序列或启动子放置在与基因转录起始位点有一定距离的位 置,这段距离与该基因序列或启动子和其在天然环境中控制的基因之间的距离大约相同; 即所述基因序列或启动子衍生自的基因。在本领域中众所周知,可以对所述这段距离进行 一些变化,而不会损失功能。相似地,调节序列元件相对于将置于其控制下的异源基因的优 选的放置是由该元件在其天然环境中的放置所限定;即该元件衍生自的基因。本文使用的叙述“优化的”是指途径、基因、多肽、酶或其他分子具有改变的生物活 性,例如通过多肽的氨基酸序列的遗传改变或通过所述多肽周围细胞环境的改变/修饰, 以相对于最初的分子或最初的细胞环境(例如给定多肽的野生型序列或野生型微生物)改 善其功能特性。本文所述的任何多肽或酶类可以任选地“优化”,并且本文所述的任何基因 或核苷酸序列可以任选地编码优化的多肽或酶。本文所述的任何途径可以任选地含有一个或多个“优化的”酶或一个或多个用于编码优化的酶或多肽的核苷酸序列。通常,多肽、酶或其他分子的改善的功能特性与所述多肽或其他分子用于在生物 途径(例如生物合成途径、C-C连接途径)将单糖或寡糖转化为生物燃料的适合性有关。 因此某些实施方案考虑使用“优化的”生物途径。示例性的“优化的”多肽可以在其氨基酸 编码序列含有一个或多个改变或突变(例如点突变、缺失、异源序列的添加),这促进在给 定的微生物系统或微生物中的表达和/或稳定性的改善,允许相对于所需底物调节多肽活 性(例如诱导型或阻遏活性),调整多肽在细胞中的定位(例如细胞内定位、细胞外分泌), 和/或相对于所需底物影响多肽整体活性水平(例如降低或增加酶促活性)。也可以“优 化”多肽或其他分子用于通过改变给定的微生物系统或微生物内的一条或多条途径来与该 系统或生物体一起使用,例如通过改变调节“优化的”多肽或其他分子的表达(例如上调)、 定位和/或活性的途径,或者通过改变将不需要的副产品产量降到最低的途径,以及其他 改变。这样,多肽或其他分子可以改变或不改变其野生型氨基酸序列或最初的化学结构而 被“优化”。按照本领域已知的技术,优化的多肽或生物途径可以通过例如针对所需要的表 型进行直接诱变或自然选择来获得。在某些方面,“优化的”基因或多肽可以包含与本文所述的参照(例如野生型)基 因或多肽的核苷酸或氨基酸序列50%至99%同一的(包括中间的所有整数)核苷酸编码 序列或氨基酸序列。在某些方面,“优化的”多肽或酶可以具有参照多肽的约1、2、3、4、5、6、 7、8、9、10、20、30、40、50、100(包括中间的所有整数和小数点,例如 1. 2,1. 3,1. 4,1. 5,5. 5、 5. 6,5. 7,60,70等)或更多倍的生物活性。
如本文使用的叙述“多核苷酸”或“核酸”是指mRNA、RNA、cRNA、cDNA或DNA。该 术语通常指在长度上至少10个碱基的核苷酸的聚合形式,所述核苷酸可以是核糖核苷酸 或脱氧核苷酸或两种类型核苷酸之一的修饰形式。该术语包括单链或双链形式的DNA。术语“多核苷酸变体”和“变体”等是指展示出与参照多核苷酸序列基本的序列同 一性的多核苷酸或与参照序列在下文定义的严格条件下杂交的多核苷酸。这些术语还包括 与参照多核苷酸的区别在于至少一个核苷酸的添加、缺失或取代的多核苷酸。因此,该术语 “多核苷酸变体”和“变体”包括其中一个或多个核苷酸被添加或缺失或用不同核苷酸取代 的多核苷酸。关于这点,在本领域应很好地理解到,包括突变、添加、缺失和取代的的某些改 变可以用于参照序列,由此改变的多核苷酸保留该参照序列的生物功能或活性。多核苷酸 变体包括与 SEQ ID NOs :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35 或 37 中 任一个所示的序列具有至少50% (和至少51%至至少99%,以及中间的所有整数百分比) 序列同一性的多核苷酸。术语“多核苷酸变体”和“变体”还包括天然存在的等位基因变体。“多肽”、“肽”和“蛋白,,在本文可交替使用,指氨基酸残基的聚合物及其变体和合 成类似物。因此,这些术语适用于氨基酸聚合物,其中一个或多个氨基酸残基是合成的非天 然存在的氨基酸,例如相应天然存在氨基酸的化学类似物,还适用于天然存在的氨基酸聚 合物。如本文使用的表述“ADH多肽”或“及其变体”包括但不限于,具有与SEQ ID NOs 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38 或 78 中任一个所示的序列共 享至少50% (和至少51%至99%,以及中间的所有整数百分比)序列同一性的氨基酸序 列的多肽。这些表述还包括可以在细菌种类彼此之间存在或发生的ADH多肽的天然等位变体。包括其变体在内的ADH多肽,,包括展示出至少约10 %、20 %、30 %、40 %、50 %、 60%、70%、80%、90%、100%、110%、120%和130%野生型40!1多肽特异性活性的多肽(即 例如具有醇脱氢酶活性,包括DEHU氢化酶活性和/或D-甘露糖醛酸氢化酶活性)。具有与 野生型ADH多肽相比基本上相同或提高的生物活性的ADH多肽包括变体包括展示出至少约 25%、50%、75%、100%、110%、120%或130%的野生型多肽的特异生物活性的多肽。为了 本申请的目的,ADH相关生物活性可以通过例如测量ADH多肽或其变体以DEHU或D-甘露 糖醛酸为底物(参见例如实施例2)消耗NADPH的能力来定量。具有与野生型ADH相比降 低的生物活性的ADH多肽包括变体展示出少于约25%、10%、5%或的野生型ADH的特 异活性。表述多肽“变体”是指通过至少一个氨基酸残基的添加、缺失或取代与参照多肽相 区别的多肽。在某些实施方案中,多肽变体是通过一个或多个保守性或非保守性取代与参 照多肽相区别。在某些实施方案中,所述多肽变体包含保守性取代,并且关于这点,在本领 域中应该很好地理解到,一些氨基酸可以转变为具有广泛相似性质的其他氨基酸而不改变 该多肽的活性的本质。多肽变体还包括一个或多个氨基酸被添加或缺失或用不同氨基酸残 基所取代的多肽。本发明考虑全长ADH序列以及其生物活性片段在本申请的方法和微生物系统中 的用途。通常,全长ADH多肽的生物活性片段可以参与相互作用,例如分子内或分子间相互 作用。分子间相互作用可以是特异结合相互作用或酶促相互作用(例如所述相互作用可以 是瞬时的和共价键的形成或打开)。全长ADH多肽的生物活性片段包括包含与(推定的) 全长ADH氨基酸序列足够相似或衍生自(推定的)全长AD H氨基酸序列的氨基酸序列的 肽。通常,生物活性片段包含具有全长ADH多肽的至少一种活性的结构域或基序,并且可以 包括多种活性结构域的一个或多个(以及某些情况下所有的),以及包括含有具有氢化酶 活性片段的片段,例如醇脱氢酶活性、DEHU氢化酶活性和/或D-甘露糖醛酸氢化酶活性。 全长ADH多肽的生物活性片段可以是,例如,SEQ ID NOs :2、4、6、8、10、12、14、16、18、20、22、 24、26、28、30、32、34、36、38 或 78 中任一个所示的氨基酸序列的 10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、120、150 或更多 个连续氨基酸的多肽。在某些实施方案中,生物活性片段包含如本文所述的NAD+、NADH、 NADP+或NADPH结合基序。适宜地,所述生物活性片段具有不少于约1%、10%、25%和50% 的其来自的全长多肽的活性。如本文使用的表述“序列同一性”或例如包含“与…50%同一的序列”是指基于整 个比较窗内的核苷酸与核苷酸或者氨基酸与氨基酸的序列的同一程度。因此,“序列同一性 百分比”的计算通过如下进行将两个最优比对的序列在整个比较窗内进行比较,确定在两 个序列中出现一致的核酸碱基(例如腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷)或同一的氨 基酸残基(例如丙氨酸、脯氨酸、丝氨酸、苏氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙 氨酸、酪氨酸、色氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、半 胱氨酸和蛋氨酸)的位置的数目,以得到匹配的位置的数目,将匹配的位置的数目除以比 较窗中位置总数(即窗大小),并且将结果乘以100以得到序列同一性百分比。用来描述两个或多个多核苷酸或多肽之间的序列关系的术语包括“参照序列(reference sequence) ”、“ 比较窗(comparison window) ” “序列同一性(sequence identity),,“序列同一'性百分比(percentage of sequenceidentity),,禾口“基本同一'性 (substantial identity)”。“参照序列”在长度上为至少12个,但经常15至18个,且通 常至少25个单体单位,包括核苷酸和氨基酸残基。因为两个多核苷酸可以每个包含(1) 在所述两个核苷酸之间相似的序列(即只有完整多核苷酸序列的一部分)和(2)在所述 两个核苷酸之间不同的序列,所以两个(或多个)多核苷酸之间的序列比较通常通过比较 整个“比较窗”内的两个多核苷酸的序列来进行,从而鉴定和比较序列相似性的局部区域。 “比较窗”是指至少6个连续位置,常见地约50个到约100个连续位置,更常见地约100至 约150个连续位置的概念节段,其中序列与参照序列最佳比对后,所述序列与相同数目连 续位置的所述参照序列比较。用于两个序列的最佳比对时,比较窗与对照序列相比(不包 含添加或缺失)可以包含约20%或更少的添加或缺失(即空位)。用于比对比较窗的序列 的最佳比对可以通过计算机化执行运算法则(威斯康星遗传学软件包7.0版(Wisconsin Genetics Software Package Release 7. 0)的 GAP、BESTFIT、FASTA 和 TFASTA,遗传学计 算机组(GeneticsComputer Group),575 Science Drive Madison, WI, USA)或者通过目测 来实施,由此通过选定的不同方法的任一种得到最优的比对(即得到整个比较内最高百分 比同源性)。还可以参照例如Altschul et al.,1997,Nucl. AcidsRes. 25 3389所公开的 BLAST家族程序,。序列分析的详细讨论可以见Ausubel et al, " Current Protocols in Molecular Biology (现代分子生物学指南)〃,John Wiley & Sons Inc,1994-1998,第 15 章的19. 3单元“载体(vector)”指多核苷酸可以插入或克隆入其中的来自于例如质粒、噬菌体、 酵母或病毒的多核苷酸分子,优选地DNA分子。载体优选地含有一个或多个独特的限制位 点,并且能在规定的宿主细胞中自主复制,所述宿主细胞包括靶细胞或组织或者其前体细 胞或组织,或者能与规定的宿主的基因组整合,这样克隆的序列就是可复制的。因此,所述 载体可以是自主复制载体,即作为染色体外独立体存在的实体的载体,其复制独立于染色 体复制,例如线形或闭合环状质粒、染色体外元件、微型染色体(mini-chromosome)或人工 染色体。所述载体可以含有任何用于确保自我复制的元件。可选地,当所述载体被导入宿主 细胞中时,其可以整合到基因组中并且与其整合的染色体一起复制。载体系统可以包含单 个载体或质粒,两个或多个载体或质粒,其共同含有待被导入宿主细胞基因组的全部DNA, 或者转座子。载体的选择通常取决于载体与该载体被导入的宿主细胞的相容性。在本文情 况下,载体优选是在细菌细胞中可操作地起作用的载体。所述载体还可以包括选择标记,例 如用于选择适合转化子的抗生素抗性基因。术语“野生型”和“天然存在的”可交替使用,指具有基因或基因产物从天然存在 的来源中分离出来时的特征的基因或基因产物。野生型基因或基因产物(例如多肽)是群 体中最常见的并因此任意设计为基因的“正常”或“野生型”形式。本发明的实施方案部分地与细菌脱氢酶基因和这些基因编码的多肽的分离和表 征有关。一些实施方案可以包括具有醇脱氢酶活性的分离的脱氢酶多肽,所述多肽称作醇 脱氢酶(ADH)多肽。按照本申请,ADH多肽可以具有DEHU氢化酶活性、D-甘露糖醛酸活性 或DEHU和D-甘露糖醛酸氢化酶活性两者。其他的实施方案可以包括编码这些多肽的多核 苷酸。例如本申请的分子可以包括选自以下的分离的多核苷酸,及其片段或变体
(a)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少80%同一的核苷酸序列;(b)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少90%同一的核苷酸序列;(c)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少95%同一的核苷酸序列;(d)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少97%同一的核苷酸序列;(e)分离的多核苷酸,其包含与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35或37所示的核苷酸序列至少99%同一的核苷酸序列;和(f)分离的多核苷酸,其包含 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21 、23、25、
27、29、31、33、35或37所示的核苷酸序列,其中所述分离的核苷酸编码具有脱氢酶活性的多肽。在某些实施方案中,所述多 肽具有醇脱氢酶活性,例如DEHU氢化酶活性和/或D-甘露糖醛酸氢化酶活性。本发明的分子还可以包括分离的ADH多肽或其变体、片段或衍生物,其具体可以 选自(a)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、
28、30、32、34、36、38或78所示的氨基酸序列至少80%同一的氨基酸序列;(b)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少90%同一的氨基酸序列;(c)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少95%同一的氨基酸序列;(d)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少97%同一的氨基酸序列;(e)分离的多肽,其包含与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38或78所示的氨基酸序列至少99%同一的氨基酸序列;和(f)分离的多肽,其包含 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34、36、38或78所示的氨基酸序列,其中所述分离的多肽具有脱氢酶活性。在某些实施方案中,所述多肽具有醇脱氢 酶活性,例如DEHU氢化酶活性和/或D-甘露糖醛酸氢化酶活性。在另外的实施方案中,如本文公开分离的多核苷酸编码多肽,所述多肽包含烟酰 胺腺嘌呤二核苷酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序 中的至少一个。其他实施方案包括如本文公开的ADH多肽、其变体、片段或衍生物,其中 所述多肽包含NAD+、NADH、NADP+或NADPH结合基序中的至少一个。在某些实施方案中, 所述结合基序选自以下Y-X-G-G-X-Y (SEQ ID NO 67)、Y-X-X-G—G—X—Y (SEQ ID NO 68)、 Y-X-X-X-G-G-X-Y(SEQ ID NO 69),Y-X-G-X-X-Y(SEQ ID NO :70)、Y-X-X-G-G-X-X_Y(SEQ ID NO 71)、Y-X-X-X-G-X-X-Y (SEQ ID NO :72)、Y-X-G-X-Y (SEQ ID NO :73)、Y-X-X-G-X-Y (SEQ ID NO :74)、Y-X-X-X-G-X-Y(SEQ ID NO 75)和 Y-X-X-X-X—G—X—Y(SEQ ID NO 76);其中 Y 独立地选自丙氨酸、甘氨酸和丝氨酸,其中G是甘氨酸,并且其中X独立地选自基因编码的氨基酸。不希望被任何理论所约束,NAD+和相关分子在脱氢酶反应中作为辅因子,这些结 合基序通常在醇脱氢酶中是保守的,并且在NAD+、NADH、NADP+或NADPH结合中起到重要作用。本申请所包括的变体蛋白是有生物活性的,即它们保留所需要的天然蛋白的生物 活性。此类变体可以来自,例如,基因多态性或人为操纵。如通过本文其他地方所述的序列 比对程序、使用默认参数所测定的,天然或野生型ADH多肽的生物活性变体具有与天然蛋 白的氨基酸序列的至少40%、50%、60%、70%,一般至少75%、80%、85%,经常约90%至 95%或更高,典型性地约98%或更高的序列相似性或一致性。野生型ADH多肽的生物活性 变体与该蛋白的差别通常是200、100、50或20个氨基酸残基,或者适宜地少至1-15个氨基 酸残基,少至1-10个,例如6-10,少至5个,少至4、3、2或甚至1个氨基酸残基。在一些实 施方案中,ADH 多肽与 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、 36、38或78中的相应序列的差异在于至少一个但少于15、10或5个氨基酸残基。在其他实 施方案中,它与 SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38 或 78中的相应序列的差异在于至少一个残基但少于20%、15%、10%或5%的残基。ADH多肽可以用各种方法改变,包括氨基酸取代、缺失、截断和插入。此类操纵的 方法是本领域内所熟知的。例如,ADH多肽的氨基酸序列变体可以通过DNA中的突变制 备。用于诱变和核苷酸序列改变的方法是本领域内所熟知的。参见,例如Kimkel (1985, Proc. Natl. Acad. Sci USA. 82 488-492),Kunkel et al, (1987,Methods in Enzymol,154 367-382),美国专利第 4,873,192 号,Watson, J. D. et al, ( "Molecular Biology of the Gene (基因分子生物学)”,第四版,Benjamin/Cummings,Menlo Park, Calif, 1987)和其中 引用的文献。不影响目的蛋白的生物活性的合适的氨基酸取代的指导可以见于Dayhoff et al.,(1978),Atlas of Protein Sequence and Structure (蛋白质序列与结构图集) (Natl. Biomed. Res. Found. ,Washington,D. C)中的模型。筛选由点突变和截断生成的组合 文库的基因产物的方法和用于筛选具有所选特性的基因产物的cDNA文库的方法是本领域 已知的。这些方法适于ADH多肽的组合诱变所生成的基因文库的快速筛选。递归整体诱变 (recursive ensemble mutagenesis (REM))是提高文库中功能性突变体的频数的技术,可 以与筛选检测联合使用来鉴定ADH多肽变体(Arkinand Yourvan (1992) Proc. Natl. Acad. Sci.USA 89 7811-7815 ;Delgrave etal.,(1993)Protein Engineering,6 :327_331)。如 下文更详细讨论的,保守性取代,例如将一个氨基酸交换成具有相似性质的另一个氨基酸, 可能是理想的。变体ADH多肽当与亲本ADH氨基酸序列比较时,可以在沿着其序列的不同位点含 有保守性氨基酸取代。“保守性氨基酸取代”是氨基端残基被具有相似侧链的氨基端残基所 替代。具有相似侧链的氨基酸残基家族在本领域中已有界定,通常可以按照以下进行亚分 类酸性残基在生理pH值由于失去氢离子而带有负电荷,并且残基被水溶液吸引, 以至于当含有该残基的肽在生理PH值的水性介质中时,该残基在肽的构象中寻找表面位 置。具有酸性侧链的氨基酸包括谷氨酸和天冬氨酸。碱性残基在生理pH值或其一或两个pH单位内(例如组氨酸)由于与氢离子结 合而带有正电荷,并且残基被水溶液吸引,以至于当含有该碱基的肽在生理PH值的水性介质中时,该残基在的肽的构象中寻找表面位置。具有碱性侧链的氨基酸包括精氨酸、赖氨酸 和组氨酸带电荷的该类残基在生理PH值下带有电荷,因此包括具有酸性和碱性侧链的氨 基酸(即谷氨酸、天冬氨酸、精氨酸、赖氨酸和组氨酸)。疏水的该类残基在生理pH值下不带电荷,并且该残基被水溶液排斥,以至于当 含有该残基的肽在水性介质中时,该残基在肽的构象中寻找内部位置。具有疏水侧链的氨 基酸包括酪氨酸、缬氨酸、异亮氨酸、亮氨酸、蛋氨酸、苯丙氨酸和色氨酸。中性的/极性的该类残基在生理pH值下不带电荷,但是该残基不被水溶液充分 排斥,这样当含有该残基的肽在水性介质中时,该残基可能会在肽的构象中寻找内部位置。 具有中性的/极性的侧链的氨基酸包括天冬酰胺、谷氨酰胺、半胱氨酸、组氨酸、丝氨酸和 苏氨酸。本说明书还将某些氨基酸表征为“小的”,因为即使缺乏极性基团,其侧链也不足 够大到赋予其疏水性。除了脯氨酸,“小的”氨基酸是那种当至少一个极性基团在侧链时为 4个碳或更少的氨基酸,以及当没有极性基团在侧链时为3个碳或更少的氨基酸。具有小侧 链的氨基酸包括甘氨酸、丝氨酸、丙氨酸和苏氨酸。由于脯氨酸已知的对肽链二级构象的影 响,所以基因编码的二级氨基酸(secondary amino acid)脯氨酸是特例。脯氨酸的结构与 所有其他天然存在氨基酸的区别在于其侧链与α-氨基基团的氮以及α-碳结合。但是,一 些氨基酸相似性矩阵(例如,ΡΑΜ120矩阵和ΡΑΜ250矩阵,例如由Dayhoff et al.,(1978), A model of evolutionarychange in proteins. Matrices for determining distance relationships In M. 0. Dayhoff, (ed. ),Atlas of protein sequence and structure, Vol. 5, pp. 345-358, National Biomedical Research Foundation, Washington DC 以及由 Gonnet etal.,(1992,Science, 256 (5062) 14430-1445)所公开的)将脯氨酸包括在与甘 氨酸、丝氨酸、丙氨酸和苏氨酸相同的组内。因此,为了本发明的目的,脯氨酸分类为“小”氨 基酸。极性或非极性分类所需的吸引或排斥的程度是任意的,因此本发明所特别考虑的 氨基酸被分类为两者中的一种。没有特别命名的大部分氨基酸可以基于已知的行为进行分 类。氨基酸残基可以进一步亚分类为环状或非环状,芳香族或非芳香族,根据残基侧 链取代基团的显而易见的分类,以及亚分类为大或小。如果残基在存在额外的极性取代基 时,包括羧基碳在内总共含有4个或更少的碳原子,或不存在额外的极性取代基时含有总 共3个或更少的碳原子,该残基被认为是小的。当然小的残基总是非芳香族的。氨基酸残 基根据其结构特性可能落入两个或更多的分类中。对于天然存在的蛋白质氨基酸,按照本 方案的亚分类显示于表A中。表 A氨基酸亚分类
权利要求
分离的多核苷酸,选自(a)分离的多核苷酸,其包含与SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少80%同一的核苷酸序列;(b)分离的多核苷酸,其包含与SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少90%同一的核苷酸序列;(c)分离的多核苷酸,其包含与SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少95%同一的核苷酸序列;(d)分离的多核苷酸,其包含与SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少97%同一的核苷酸序列;(e)分离的多核苷酸,其包含与SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列至少99%同一的核苷酸序列;和(f)分离的多核苷酸,其包含SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37所示的核苷酸序列,其中所述分离的核苷酸编码具有脱氢酶活性的多肽。
2.用于将多糖转化为单糖或寡糖的方法,所述方法包含使多糖与重组微生物接触,其 中所述重组微生物包含如权利要求1所述的多核苷酸。
3.用于催化糖醛酸,D-甘露糖醛酸还原(氢化)的方法,其包含使所述糖醛酸,D-甘 露糖醛酸与重组微生物接触,其中所述重组微生物包含如权利要求1所述的多核苷酸。
4.用于催化糖醛酸,4-脱氧-L-赤-5-己酮糖糖醛酸(DEHU)还原(氢化)的方法,其 包含使DEHU与重组微生物接触,其中所述重组微生物包含如权利要求1所述的多核苷酸。
5.包含如权利要求1所述的分离的多核苷酸的载体。
6.如权利要求5所述的载体,其中所述分离的多核苷酸可操作地连接到表达调控区。
7.包含重组微生物的微生物系统,其中所述重组微生物包含如权利要求5所述的载体。
8.包含重组微生物的微生物系统,其中所述重组微生物包含如权利要求1所述的多核 苷酸,并且其中所述多核苷酸整合到所述重组微生物的基因组中。
9.如权利要求8所述的微生物系统,其中所述分离的多核苷酸可操作地连接到表达调 控区。
10.如权利要求7或8所述的重组微生物,其中所述微生物选自醋化醋杆菌 (Acetobacter aceti)、无色杆菌(Achromobacter) > Bf lif (Acidiphilium)、不动杆菌 (Acinetobacter)、马杜拉放线菌(Actinomadura)、游动放线菌(Actinoplanes)、嗜热 古生菌(Aeropyrum pernix)、土壤杆菌(Agrobacterium)、产喊杆菌(Alcaligenes)、菠 萝(Ananas comosus) (M)、_ 胃(Arthrobacter)、■曲 β (Aspargillus niger)、f ft 霉(Aspargillus oryze)、蜂蜜曲霉(Aspergillus melleus)、粉状曲霉(Aspergillus pulverulentus)、佐氏曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇 佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢 杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌 (Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、缓慢芽孢杆菌(Bacillus lentus)、地衣芽胞杆菌活菌(Bacillus licheniformis)、浸麻芽孢杆菌(Bacillusmacerans)、嗜热月旨肪芽抱杆菌(Bacillus stearothermophilus)、枯草杆菌(Bacillus subtilis)、双歧杆菌(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋 葱布克氏菌(Burkholderia c印acia)、柱状假丝酵母(Cmdida cylindracea)、皱褶假 丝酵母(Candida rugosa)、番木瓜(Caricapapaya) (L)、纤维菌(Cellulosimicrobium)、 头抱霉(Cephalosporium)、毛壳菌(Chaetomium erraticum)、细 HI3 毛壳菌(Chaetomium gracile)、梭状芽孢杆菌(Clostridium)、酪酸梭菌(Clostridium butyricum)、丙酮丁醇 梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、(谷氨 酸)棒状杆菌(Corynebacterium(glutamicum))、efficiens 棒状杆菌(Corynebacterium efficiens)、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、菊欧文氏菌(Erwina chrysanthemi)、葡糖杆菌(Gliconobacter)、葡糖醋杆菌(Gluconacetobacter)、嗜盐古 菌(Haloarcula)、特异腐质霉(Humicola insolens)、Humicola nsolens、西唐北里孢菌 (Kitasatospora setae) Λ ^Wtt Kff S" (Klebsiella) ^/^M^Wtt Kff S" (Klebsiella oxytoca)、克鲁维斯酵母(Kluyveromyces)、脆壁克鲁维斯酵母(Kluyveromyces fragilis)、乳 酸克鲁维斯酵母(Kluyveromyces lactis)、考克氏菌(Kocuria)、乳酸乳杆菌 (Lactlactis)、乳酸杆菌(Lactobacillus)、发酵乳酸杆菌(Lactobacillus fermentum)、 清酒乳酸杆菌(Lactobacillus sake)、乳球菌(Lactococcus)、乳酸乳球菌(Lactococcus lactis)、明串珠菌(Leuconostoc)、甲基孢囊菌(methylocystis)、西西里甲烷叶菌 (methanolobus siciliae)、嗜器官产甲焼菌(Methanogenium organophilum)、布氏甲焼 杆菌(Methanobacterium bryantii)、蛾微杆菌(Microbacterium imperiale)、溶壁微球 菌(Micrococcus lysodeikticus)、小月菌(Microlunatus)、爪口圭毛霉(Mucorjavanicus) Λ 木干 (Mycobacterium)、■ ■胃(Myrothecium)、石宵 it 木干 M (Nitrobacter)、M 石宵 化单胞菌(Nitrosomonas)、诺卡氏菌(Nocardia)、番木瓜(Papaya carica)、小球 菌(Pediococcus)、嗜盐片球菌(Pediococcushalophilus)、青霉菌(Penicillium)、 ^ Π tt zF # β (Penicilliurncamemberti)、 Μ # β (Penicillium citrinum)、 默森青霉(Peniclliumemersonii)、娄地青霉(Penicillium roqueforti)、薄青霉 (Penicilliumlilactinum)、多色青霉(Penicillium multicolor)、异养硝化-好氧反 石肖化菌(Paracoccus pantotrophus)、丙酸杆菌属(Propionibacterium)、假单胞菌属 (Pseudomonas)、焚光假单胞菌(Pseudomonas f luorescens)、脱氮假单胞菌(Pseudomonas denitrificans)、热球菌(Pyrococcus)、激烈热球菌(Pyrococcusfuriosus)、极端嗜 热球菌(Pyrococcus horikoshii)、根瘤菌(Rhizobium)、米赫根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus Lindt)、根霉(Rhizopus)、戴尔根霉 (Rhizopus delemar)、日本根霉(Rhizopusjaponicus)、雪白根霉(Rhizopus niveus)、 米根霉(Rhizopus oryzae)、少抱根霉(Rhizopusoligosporus)、红球菌(Rhodococcus)、 (Saccharomyces cerevisiae) Λ tl # ^ (Sclerotina libertina)^ ^ ^ffi M 酉享杆菌(Sphingobacteriummultivorum)、鞘氨酉享杆菌(Sphingobium)、鞘氨酉享单胞菌 (Sphingomonas)、链球菌(Streptococcus)、嗜热链球菌(Streptococcus thermophilus) Y-U 链霉菌(Streptomyces)、灰色链霉菌(Streptomyces griseus)、变铅青链霉 菌(Streptomyces lividans)、鼠链霉菌(Streptomyces murinus)、诱赤链霉菌 (Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、轮枝链霉菌(StreptoverticiIlium mobaraense)、四联球菌(Tetragenococcus)、嗜热菌(Thermus)、 δ 胃 /求胃(Thiosphaera pantotropha)、!^ 胃(Trametes)、β (Trichoderma)、jk (Trichoderma longibrachiatum)、Jl 氏(Trichoderma reesei) > M^y^M (Trichoderma viride)、青霉毛抱子菌(Trichosporon penicillatum)、溶藻弧菌(Vibrio alginolyticus)、黄杆菌(Xanthomonas)、酵母(yeast)、鲁氏酵母(Zygosaccharomyces rouxii)、酵单胞菌(Zymomonas)禾口运动发酵单胞菌(Zymomonus mobilis)。
11.分离的多肽,选自(a)分离的多肽,其包含与SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少80%同一的氨基酸序列;(b)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少90%同一的氨基酸序列;(c)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少95%同一的氨基酸序列;(d)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少97%同一的氨基酸序列;(e)分离的多肽,其包含与SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少99%同一的氨基酸序列;和(f)分离的多肽,其包含SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列,其中所述分离的多肽具有脱氢酶活性。
12.用于将多糖转化为单糖或寡糖的方法,其包含使所述多糖与重组微生物接触,其中 所述重组微生物包含如权利要求11所述的多肽。
13.用于催化糖醛酸,D-甘露糖醛酸还原(氢化)的方法,其包含使所述糖醛酸,D-甘 露糖醛酸与重组微生物接触,其中所述重组微生物包含如权利要求11所述的多肽。
14.用于催化糖醛酸,4-脱氧-L-赤-5-己酮糖糖醛酸(DEHU)还原(氢化)的方法, 其包含使DEHU与重组微生物接触,其中所述重组微生物包含如权利要求11所述的多肽。
15.用于将多糖转化为单糖或寡糖的微生物系统,其中所述微生物系统包含重组微生 物,并且其中所述重组微生物包含选自以下的分离的多核苷酸(a)分离的多核苷酸,其包含与SEQID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35或37所示的核苷酸序列至少80%同一的核苷酸序列;(b)分离的多核苷酸,其包含与SEQID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35或37所示的核苷酸序列至少90%同一的核苷酸序列;(c)分离的多核苷酸,其包含与SEQID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35或37所示的核苷酸序列至少95%同一的核苷酸序列;(d)分离的多核苷酸,其包含与SEQID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35或37所示的核苷酸序列至少97%同一的核苷酸序列;(e)分离的多核苷酸,其包含与SEQID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35或37所示的核苷酸序列至少99%同一的核苷酸序列;和(f)分离的多核苷酸,其包含SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、`29、31、33、35或37所示的核苷酸序列。
16.用于将多糖转化为单糖或寡糖的微生物系统,其中所述微生物系统包含重组微生 物,并且其中所述重组微生物包含选自以下的分离的多肽(a)分离的多肽,其包含与SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少80%同一的氨基酸序列;(b)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少90%同一的氨基酸序列;(c)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少95%同一的氨基酸序列;(d)分离的多肽,其包含与SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少97%同一的氨基酸序列;(e)分离的多肽,其包含与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列至少99%同一的氨基酸序列;和(f)分离的多肽,其包含SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38或78所示的氨基酸序列。
17.如权利要求1或15所述的分离的多核苷酸,其中所述多核苷酸编码多肽,所 述多肽包含烟酰胺腺嘌呤二核苷酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸磷酸(NADP+) 或NADPH结合基序中的至少一个,所述结合基序选自Y-X-G-G-X-Y(SEQ ID NO :67)、 Y-X-X-G-G-X-Y (SEQ IDNO 68)、Υ-Χ-Χ-Χ-G-G-X-Y (SEQ ID NO 69)、Y-X-G-X-X-Y (SEQ IDNO 70)、Y-X-X-G-G-X-X-Y (SEQ ID NO 71)、Υ-Χ-Χ-Χ-G-X-X-Y (SEQ IDNO 72)、 Y-X-G-X-Y(SEQ ID NO :73)、Y-X-X-G-X_Y(SEQ ID NO :74)、Y-X-X-X-G-X_Y(SEQ ID NO 75) 和Y-X-X-X-X-G-X-Y(SEQ ID NO 76);其中Y独立地选自丙氨酸、甘氨酸和丝氨酸,其中G 是甘氨酸,并且其中X独立地选自基因编码的氨基酸。
18.如权利要求11或16所述的分离的多肽,其中所述多肽包含烟酰胺腺嘌呤二核 苷酸(NAD+)、NADH、烟酰胺腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序中的至少一 个,所述结合基序选自 Y-X-G-G-X-Y(SEQ ID NO 67), Y-X-X-G-G-X-Y(SEQ ID NO :68)、 Y-X-X-X-G-G-X-Y(SEQ ID NO 69),Y-X-G-X-X-Y(SEQ ID NO :70)、Y-X-X-G-G-X-X_Y(SEQID NO 71)、Y-X-X-X-G-X-X-Y(SEQ ID NO 72)、Y-X-G-X-Y(SEQ IDNO 73)、Y—X-X—G—X—Y(SEQ ID NO 74)、Y-X-X-X-G-X-Y(SEQ ID NO 75)和 Υ-Χ-Χ-Χ-X-G-X—Y(SEQ ID NO 76);其中 Y 独立地选自丙氨酸、甘氨酸和丝氨酸,其中G是甘氨酸,并且其中X独立地选自基因编码的 氨基酸。
19.用于将多糖转化为乙醇的方法,其包含使所述多糖与重组微生物接触,其中所述重 组微生物能够在作为唯一碳源的所述多糖上生长。
20.如权利要求19所述的方法,其中所述重组微生物包含至少一种编码至少一种丙酮 酸脱羧酶的多核苷酸和至少一种编码醇脱氢酶的多核苷酸。
21.如权利要求19所述的方法,其中所述多糖是藻酸盐。
22.如权利要求19所述的方法,其中所述重组微生物包含一种或多种含有灿烂弧菌的 V12B01_24189和V12B01_24249之间的基因组区的多核苷酸。
23.如权利要求19所述的方法,其中所述至少一种丙酮酸脱羧酶来自运动发酵单胞菌。
24.如权利要求19所述的方法,其中所述至少一种醇脱氢酶来自运动发酵单胞菌。
25.如权利要求19所述的方法,其中所述重组微生物是大肠杆菌。
全文摘要
提供细菌的多核苷酸和多肽,其中所述多肽具有脱氢酶活性,例如醇脱氢酶(ADH)活性、糖醛酸,4-脱氧-L-赤-5-己酮糖糖醛酸(DEHU)((4S,5S)-4,5-二羟基-2,6-二氧代己酸)氢化酶活性、2-酮基-3-脱氧-D-葡萄糖酸脱氢酶活性、D-甘露糖醛酸氢化酶活性和/或D-甘露糖酸脱氢酶活性。还提供方法、酶类、重组微生物和微生物系统,用于将例如来自生物质的多糖转化为适合的单糖或寡糖,还用于将适合的单糖或寡糖转化为大量生产型化学品,例如生物燃料。还提供按本文所述方法生产的大量生产型化学品。
文档编号C12N1/21GK101970665SQ200980108270
公开日2011年2月9日 申请日期2009年1月28日 优先权日2008年1月28日
发明者樫山雄树 申请人:生物结构实验室公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1