来源于细菌的丙酮酸脱羧酶(pdc)基因的克隆和测序及其用途的制作方法

文档序号:408642阅读:1725来源:国知局
专利名称:来源于细菌的丙酮酸脱羧酶(pdc)基因的克隆和测序及其用途的制作方法
相关资料本申请要求下列美国申请的优先权名称为“活性胃八叠球菌丙酮酸脱羧酶在重组巨大芽胞杆菌中的高水平产生”的美国临时申请号60/288,638;名称为“来源于耐酸性厌氧革兰氏阳性菌胃八叠球菌的丙酮酸脱羧酶的克隆,表达,和表征”的美国临时申请号60/,288,671;名称为“巴氏醋杆菌丙酮酸脱羧酶生化,遗传,和生理性质”的美国临时申请号60/288,698;名称为“来源于醋酸菌巴氏醋杆菌的丙酮酸脱羧酶的生物化学及生物物理特征”的美国临时申请号60/288,622;名称为“丙酮酸脱羧酶一种利用巴氏醋杆菌氧化代谢乳酸的重要酶”的美国临时申请号60/288,699;以上全部申请都是在2001年5月4日提交的,并全文引入此处作为参考。本说明书自始至终引用的所有专利,专利申请,和参考文献的内容都全文引入此处作为参考。
政府出资的研究这项工作由U.S.Department of Energy’s National RenewableEnergy Laboratory(ZDH-9-29009-04),Energy BiosciencesProgram(FG02-96ER20222),和Florida Agricultural ExperimentStation的基金部分资助。
背景技术
很多环境和社会效益都是由于使用从植物材料获得的可再生燃料代替基于石油的汽车燃料而产生的(Lynd等,(1991)Science2511318-1323;Olson等,(1996)EnzymeMicrob.Technol.181-17;Wyman等,(1995)Amer.Chem.Soc.Symp.618272-290)。美国每年要燃烧掉1200亿加仑的汽车燃料,大约相当于进口石油的总量。作为一种可再生的替代燃料,乙醇的开发可消除美国对进口石油的依赖,改善环境,并提供新的就业机会(Sheehan,(1994)ACSSymposium Series No.566,ACS Press,pp 1-53)。
理论上,解决用于汽车燃料的进口石油问题的方法似乎十分简单。除了使用石油这种有限的资源外,还可通过使植物材料发酵而有效生产可再生的资源——乙醇。事实上,巴西已经证实了生产乙醇的可行性,以及20多年来,乙醇作为一种主要汽车燃料的使用。同样,美国每年要生产超过12亿加仑的燃料乙醇。目前,燃料乙醇是利用啤酒糖酵母或运动发酵单胞菌从玉米淀粉或蔗糖生产的。然而,这两种糖源都不能供给可替换基于石油的汽车燃料所需的量。此外,蔗糖和玉米淀粉属于相对较贵的起始材料,并具有作为食品的竞争用途。
此外,这些糖底物仅代表植物中全部碳水化合物的一部分。事实上,植物中的绝大部分碳水化合物都是以木质纤维素,即一种含有纤维素,半纤维素,果胶,和木质素的复合结构的聚合物形式存在的。木质纤维素存在于植物的茎,叶,皮,壳,和穗中。这些聚合物水解后释放出一种含有葡萄糖,木糖,甘露糖,半乳糖,以及阿拉伯糖的中性糖混合物。目前还没有天然的生物体能够迅速而且有效地把所有这些糖代谢成乙醇。
然而,为了努力开发这种底物来源,Gulf Oil公司研究出一种利用以酵母为基础的称作同时糖化和发酵(SSF)的过程从纤维素生产乙醇的方法(Gauss等,(1976)U.S.P.N.3,990,944)。把真菌纤维素酶制品和酵母加入到单个容器中的纤维素底物匀浆中。乙醇在纤维素水解的同时产生。然而,Gulf’s SSF过程具有某些缺点。例如,酵母的细胞周期时间相对较长(24-36小时),而且它们不能使复合糖发酵。此外,还不得不加入真菌纤维素酶,而直到目前为止,这样做仍然被认为是成本太高,不适于大规模的生物乙醇生产过程(Himmel等,(1997)Amer.Chem.Soc.pp.2-45;Ingram等,(1987)Appl.Environ.Microbiol.532420-2425;Okamoto等,(1994)Appl.Microbiol.Biotechnol.42563-568;Philippidis,G.,(1994)Amer.Chem.Soc.pp.188-217;Saito等,(1990)J.Ferment.Bioeng.69282-286;Sheehan,J.,(1994)Amer.Chem.Soc.pp1-52;Su等,(1993)Biotechnol.Lett.159779-984)。
此外,利用其它生物体生产乙醇也很难,这是因为丙酮酸脱羧酶(PDC),这种对于发酵乙醇而言很重要的酶,只在植物,酵母和真菌中普遍存在;很少存在于细菌中,在动物中则根本没有(9,25)。
发明概述进行乙醇发酵的廉价酶方法的发展对于改进底物利用效率并使发酵过程更经济实用而言具有巨大的潜力。因此,研究酶和生物催化剂将十分有益,所述生物催化剂可生产这种酶,用于使复合糖有效解聚,随后迅速把糖发酵成醇。
某些微生物,如革兰氏阴性菌和革兰氏阳性菌都可产生许多发酵酶,它们能催化纤维素和半纤维素解聚,从而产生可发酵的糖,糖转化成丙酮酸,底物丙酮酸转化成乙醛,最终,底物乙醛转化成乙醇。然而,这种生物很少会以最理想水平产生所有必需的酶。
因此,本发明提供编码丙酮酸脱羧酶的基因,它可在各种生物体中高水平表达。因此当在生物体中表达,或与生物体一起培养时,产生乙醇发酵所需的重要酶,从而产生较高水平的乙醇。这些酶,例如丙酮酸脱羧酶(PDC),可单独或与醇脱氢酶(ADH)联合用作具有所需活性的粗提物,或用作纯化的组合物。
此外,生物催化剂,优选重组细菌,更优选产乙醇(ethanologenic)细菌,可被工程化表达这些酶活性的一种或多种,具体而言,它的量足以使糖发酵。这种生物催化剂适于有效降解复合糖,随后利用称作同时糖化和发酵(SSF)过程发酵成醇。
本发明至少部分是以发现编码用于在细菌中发酵乙醇的重要酶的基因为基础的。具体而言,已经鉴定了棕榈发酵细菌,巴氏醋杆菌,和胃八叠球菌的pdc基因。这些基因已经被确定编码具有极高的丙酮酸脱羧酶活性,底物亲和性,例如对丙酮酸的亲和性,和热稳定性,以及在不同pH值下的极高的活性的丙酮酸脱羧酶。此外,本发明的pdc基因还具有在各种生物体中高水平表达的密码子使用。
因此,一方面,本发明提供编码丙酮酸脱羧酶多肽(PDC)的分离核酸分子及其生物活性部分,以及适于用作检测编码PDC的核酸的引物或杂交探针的核酸片段。
在其中一个实施方案中,本发明的丙酮酸脱羧酶(pdc)核酸分子是与SEQ ID NO1,3,5所示的核苷酸序列(如,当与核苷酸序列全长进行比较时)具有至少约50%,60%,70%,75%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或更多同一性的核酸分子,或其互补序列。
在具体实施方案中,所述分离核酸分子含有SEQ ID NO1,3,5所示的核苷酸序列,或其互补序列。
在另一实施方案中,pdc核酸分子含有编码一种多肽的核酸序列,所述多肽的氨基酸序列与SEQ ID NO2,4或6的氨基酸序列足够同源。在具体实施方案中,pdc核酸分子含有编码(PDC)多肽的核苷酸序列,所述多肽与SEQ ID NO2,4和6所示的氨基酸序列(例如,当与氨基酸序列全长进行比较时)具有至少约50%,60%,70%,75%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或更多的同一性。
在其中一个具体实施方案中,分离的核酸分子编码具有SEQ IDNO2所示氨基酸序列的棕榈发酵细菌丙酮酸脱羧酶的氨基酸序列。
在另一具体实施方案中,分离的核酸分子编码具有SEQ ID NO4所示氨基酸序列的巴氏醋杆菌丙酮酸脱羧酶的氨基酸序列。
在另一具体实施方案中,分离的核酸分子编码具有SEQ ID NO6所示氨基酸序列的胃八叠球菌丙酮酸脱羧酶的氨基酸序列。
在另一具体实施方案中,所述核酸分子的长度至少约为1600个核苷酸,并编码具有丙酮酸脱羧酶活性的多肽(如这里所述)。
在更具体的实施方案中,本发明提供一种编码来源于棕榈发酵细菌的pdc基因的质粒pJAM3440,所述质粒保藏在美国典型培养物保藏中心,保藏号为ATCC______。在相关实施方案中,本发明提供一种编码来源于巴氏醋杆菌的pdc基因的质粒pJAM304,所述质粒保藏在美国典型培养物保藏中心,保藏号为ATCC______。在另一相关实施方案中,本发明提供一种编码来源于胃八叠球菌的pdc基因的质粒pJAM419,所述质粒保藏在美国典型培养物保藏中心,保藏号为ATCC______。
本发明另一实施方案提供核酸分子,优选丙酮酸脱羧酶的核酸分子,它可相关于编码非-丙酮酸脱羧酶(PDC)多肽的核酸分子而特异性检测丙酮酸脱羧酶的核酸分子(即,pdc基因)。例如,在其中一个实施方案中,这种核酸分子的长度至少约为50,60,70,80,90,100,150,200,300,400,500,500-1000,1000-1500,1500-1500或更多个核苷酸,和/或在严格条件下与含有SEQ ID NO1,3,或5所示核苷酸序列的核酸分子,或其互补序列杂交。应当了解,核酸分子的长度可以是用上面所列的其中一个数值作为核苷酸数的下限,用另外一个数值作为核苷酸数的上限,例如,分子的长度可以为60-80,300-1000,或150-400个核苷酸。
在具体实施方案中,核酸分子的长度至少约为15个(例如,连续的)核苷酸,并在严格条件下与SEQ ID NO1,3,或5的核苷酸序列杂交。因此,本发明提供一种使用前述核酸检测是否存在本发明pdc核酸的方法。
在其它具体实施方案中,核酸分子编码含有SEQ ID NO2,4,或6所示氨基酸序列的多肽的天然存在的等位基因变体,其中所述核酸在严格条件下分别与含有SEQ ID NO1,3,或5的核酸分子杂交。
在另一实施方案中,本发明的核酸分子位于载体中,而且可与替代启动子和/或编码异源多肽的附加核酸序列可操作性连接。
在具体实施方案中,本发明提供一种含有本发明核酸分子的宿主细胞,例如,包含在载体中或稳定整合到宿主细胞基因组中。
在其中一个具体实施方案中,所述宿主细胞含有编码来源于细菌细胞,如棕榈发酵细菌,巴氏醋杆菌,或胃八叠球菌的丙酮酸脱羧酶的异源核酸序列,如SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示。
在另一实施方案中,含有pdc基因的宿主细胞可以是产乙醇的,例如,天然产乙醇和/或进一步含有编码醇脱氢酶,葡聚糖酶,分泌酶(secretase),或其组合的产乙醇基因。在相关实施方案中,该宿主细胞适于从糖发酵乙醇。在具体实施方案中,该宿主细胞是重组的产乙醇宿主细胞,含有编码SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6所示PDC的异源核酸。异源核酸可受到外源替代启动子的控制。
上述宿主细胞可以是革兰氏阴性菌细胞或革兰氏阳性菌细胞。
本发明的革兰氏阴性菌宿主细胞是,例如,葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌,发酵细菌,或醋杆菌。
本发明的革兰氏阳性菌宿主细胞是,例如,丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,或八叠球菌。
另一方面,本发明提供一种分离多肽,它的氨基酸序列与SEQ IDNO2,4或6所示的氨基酸序列(例如,当与氨基酸序列的全长比较时)至少具有约50%,60%,70%,75%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或更多的同一性。
在其中一个实施方案中,本发明的分离多肽具有SEQ ID NO2,4,或6的氨基酸序列。
在相关实施方案中,所述分离多肽具有丙酮酸脱羧酶活性。本发明的丙酮酸脱羧酶是为具有改进的活性,例如,丙酮酸脱羧酶活性,改进的密码子使用,底物(例如,丙酮酸)亲和性,热稳定性,和/或在特定pH值下的活性而选择的。本发明这种丙酮酸脱羧酶可以是改变过的或嵌合的多肽,从而获得上述任何一种性质。此外,所述多肽还可进一步含有异源氨基酸,例如,用于纯化或检测的免疫标记。
另一方面,本发明提供一种抗体,它可选择性结合本发明的多肽(或其片段),例如,SEQ ID NO2,4,或6所示的丙酮酸脱羧酶。因此,本发明提供一种使用这种抗体检测本发明丙酮酸脱羧酶的方法。
另一方面,本发明提供一种在适宜培养条件下,通过在宿主细胞中表达本发明上述其中一种核酸,从而产生本发明丙酮酸脱羧酶的方法。也可对核酸进行改变或使其突变,从而改进核酸的密码子使用或所编码产物的脱羧酶活性(例如,热稳定性,底物亲和性,或在不同pH值下的活性)。
另一方面,本发明提供一种生产乙醛的方法,即在以充分水平表达丙酮酸脱羧酶的条件下培养上述其中一种宿主,这样就可从丙酮酸生产乙醛。在相关实施方案中,生产乙醛的方法是在从丙酮酸生产乙醛的条件下,接触从上述宿主细胞获得的细胞溶解产物而进行的。因此,本发明提供具有改进的脱羧酶活性,及具有例如热稳定性,在不同pH下的活性,和/或极高的底物亲和性的酶提取物。
另一方面,本发明提供一种生产乙醇的方法,即在以充分水平表达丙酮酸脱羧酶和醇脱氢酶的条件下培养上述宿主细胞,使乙醇作为主要的发酵产物产生。
另一方面,本发明提供一种选择具有改进的脱羧酶活性(例如,改进的丙酮酸亲和性,热稳定性,在不同pH值下的活性)的丙酮酸脱羧酶的方法,包括把丙酮酸脱羧酶的氨基酸序列与SEQ ID NO2,SEQID NO4,或SEQ ID NO6的氨基酸序列进行比较;改变丙酮酸脱羧酶的至少一个氨基酸残基,使其与SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的相应氨基酸残基具有同一性,这样就可获得具有改进的丙酮酸脱羧酶活性的多肽。
在相关实施方案中,本发明提供一种选择在受体宿主细胞中表达的丙酮酸脱羧酶的方法,即把编码丙酮酸脱羧酶的核酸序列与SEQ IDNO1,SEQ ID NO3,或SEQ ID NO5的核酸序列进行比较;改变编码丙酮酸脱羧酶的核酸的至少一个密码子,使其与SEQ ID NO1,SEQID NO3,或SEQ ID NO5的相应密码子具有同一性,这样就可在所述宿主细胞中获得所述改变过的、编码丙酮酸脱羧酶的核酸的表达的改进。
在另一相关实施方案中,本发明提供一种选择在受体宿主细胞中的表达改进的丙酮酸脱羧酶的方法,即把编码丙酮酸脱羧酶的核酸序列与该受体宿主细胞的密码子使用进行比较,改变所述编码丙酮酸脱羧酶的核酸的至少一个密码子,使其相应于所述受体宿主细胞的密码子使用,从而在所述宿主细胞中获得所述改变过的、编码丙酮酸脱羧酶的核酸的表达的改进。
在另一相关实施方案中,本发明提供一种选择在受体宿主细胞中的表达改进的丙酮酸脱羧酶的方法,即把编码丙酮酸脱羧酶的核酸序列与该受体宿主细胞的密码子使用进行比较;改变所述受体宿主细胞,以便重组产生至少一个相应于编码所述丙酮酸脱羧酶的核酸的密码子的tRNA,从而在所述宿主细胞中获得所述编码丙酮酸脱羧酶的核酸的表达的改进。
本发明的其它特征和优点可从下列详细描述及权利要求很明显地看出。
附图简述

图1表示棕榈发酵细菌pdc基因的图示。质粒pJAM3400携带一个6-kb平端的,棕榈发酵细菌基因组DNA的BamHI片段,并连接到质粒载体pLITMUS28中。其余质粒来源于pJAM3400,并用于分析含pdc基因的一个2.9kb区的DNA序列。质粒pJAM3440用于在重组大肠埃希氏菌中生产棕榈发酵细菌PDC多肽。箭头表示pdc基因转录的方向。
图2表示巴氏醋杆菌pdc基因的图示。质粒pJAM301携带一个连接到质粒载体pLITMUS28 XhoI位点中的,6,337-bp的巴氏醋杆菌基因组DNA的AatII片段。由AatII和XhoI产生的3’-和5’-突出端在连接之前用Vent DNA聚合酶加工成平端。其余质粒来源于pJAM301,并用于DNA序列分析。质粒pJAM304用于在重组大肠埃希氏菌中生产巴氏醋杆菌PDC的蛋白。箭头表示推断的ORF的转录及翻译方向。
图3表示胃八叠球菌pdc基因的图示,为了对pdc基因座进行测序和表征而生产的各种质粒以及含有pdc可读框的质粒pJAM413,pJAM419,和pJAM418都适于在细菌中高水平表达pdc基因。
图4表示棕榈发酵细菌的pdc基因和基因产物的核酸序列(SEQ IDNO1)及氨基酸序列(SEQ ID NO2)。
图5表示巴氏醋杆菌的pdc基因和基因产物的核酸序列(SEQ IDNO3)及氨基酸序列(SEQ ID NO4)。在pdc核酸序列中,推定启动子用大写字母突出显示,并在下面加双下划线,-35和-10启动子的共有序列则直接标注在PDC预测序列的下面。DNA序列上的箭头表示转录起始位点。加下划线的碱基表示“Shine-Dalgarno”核糖体结合位点。星号表示转录终止密码子。DNA序列下的箭头表示茎-环结构,它可促进ρ-非依赖性转录终止。
图6表示胃八叠球菌的pdc基因和基因产物的核酸序列(SEQ IDNO5)及氨基酸序列(SEQ ID NO6)。
图7表示描述不同细菌PDC酶的热稳定性的曲线图。在指定温度下,在含有1mM TPP和ImM MgCl2的pH5.0的50mM柠檬酸钠缓冲液中,将‘重组的’Zmo(●),Zpa(■),Apa(○)和Sve(□)PDC多肽预温育30分钟,冷却至0℃,然后于25℃时,在相同的缓冲液中测定残留的活性。100%是0℃预温育后的活性。SvePDC是从重组大肠埃希氏菌BL21-CodonPlus-RIL(pJAM419)纯化的。
图8表示描述pH值对细菌PDC酶活性的作用的曲线图。‘重组的’ZpaPDC(●)和ApaPDC(■)。‘天然的’ZpaPDC(○)和ApaPDC(□)。25℃时,在pH 4.0-5.0的50mM柠檬酸钠缓冲液和pH 5.5-8.0的50mM磷酸钠缓冲液中测量活性。100%是最佳pH值下的活性。
图9表示棕榈发酵细菌的推断PDC多肽(SEQ ID NO2)与所选择的PDC多肽,即,运动发酵单胞菌(SEQ ID NO8),巴氏醋杆菌(SEQID NO4),胃八叠球菌(SEQ ID NO6),玉米(SEQ ID NO9),和啤酒糖酵母(SEQ ID NO10)的多个氨基酸序列比对。功能上保守的(黑色突出显示区)和半-保守的(灰色突出显示区)氨基酸残基。序列比对中引入的空位(--)。0.4nm Mg2+及酵母和运动发酵单胞菌PDC多肽的TPP结合位点内的残基(*)。与丙酮酰胺形成氢键的酵母PDC1残基(■)。加双下划线的残基是TPP-依赖酶中的保守残基。缩写词和GenBank或SwissProt登记号Zpa,棕榈发酵细菌,AF474145;Apa,巴氏醋杆菌,AR368435;Sce,啤酒糖酵母,P06169;胃八叠球菌,AF354297;Zma,玉米,P28516;Zmo,运动发酵单胞菌,P06672。
发明详述为了更清楚地理解本发明的全部范围,给出下列定义。
I.定义此处所用术语“醇脱氢酶”包括能够把乙醛转化成醇,优选乙醇的酶。
术语“嵌合”包括突变或改变过的PDC,其中利用基因工程方法,用PDC中的相应结构域对另一PDC的整个结构域进行工程化(融合,交换)。
术语“密码子使用”包括分析被考虑在受体宿主生物(或其无细胞的提取物)中表达的给定核酸是否存在或“使用”宿主生物所需的(有利的是充足水平的)、用于把核酸翻译成相应多肽的某些“密码子。以这种观察结果为基础,受体宿主可用任何所需的密码子重组补充。可选择性地,其它宿主可用极高的密码子使用选择,或把所述核酸(例如,通过引入沉默突变)改变成不再含有限制密码子。
术语“脱羧酶活性”包括多肽把丙酮酸酶促转化成乙醛的能力。通常,所选多肽的活性包括与所产生多肽有关的全部酶活性,包括,例如,酶的极高的底物亲和性,热稳定性,在不同pH值下的稳定性,或这些性质的组合。
术语“来源于”包括从指定来源(完全或部分)分离多核苷酸的片段。该术语包括,例如,从与指定多核苷酸来源有关的序列,或以它们为基础直接克隆,PCR扩增,或人工合成。
术语“产乙醇”包括微生物从碳水化合物生产主要的发酵产物乙醇的能力。该术语包括天然存在的产乙醇生物,具有天然存在或诱导的突变的产乙醇生物,和已经被基因工程改造过的产乙醇生物。
术语“发酵”包括从碳水化合物生产发酵的主要产物乙醇的酶过程(例如,细胞或无细胞的,例如,溶解产物或纯化的多肽混合物)。
术语“参与产乙醇的基因”包括能够赋予细胞产乙醇特性或能够改进细胞产乙醇任一方面,如,底物摄取,底物加工,乙醇耐受等的任何基因。参与产乙醇的基因是,例如,醇脱氢酶,丙酮酸脱羧酶,分泌多肽,和多糖酶的基因,这些基因或它们的同源物可来源于任何适宜的生物体。
术语“葡聚糖酶”包括能够催化任何相连糖部分的降解或解聚的多肽,所述糖部分为,例如,二糖,三糖,低聚糖,包括,复合碳水化合物,这里也称作复合糖,例如,纤维寡糖和木质纤维素,木质纤维素包括纤维素,半纤维素,和果胶。该术语包括纤维素酶,如葡聚糖酶,优选包括内葡聚糖酶,此外还包括,例如,外葡聚糖酶,β-糖苷酶,纤维生物水解酶,内-1,4-β-木聚糖酶,β-木糖苷酶,α-葡糖醛酸糖苷酶,α-L-阿拉伯呋喃糖苷酶,乙酰酯酶,乙酰木聚糖酯酶,α-淀粉酶,β-淀粉酶,葡糖淀粉酶,支链淀粉酶,β-葡聚糖酶,半纤维素,阿拉伯糖苷酶,mannanase,果胶酸盐水解酶,果胶酸盐裂合酶或这些纤维素酶的任意组合。
术语“革兰氏阴性菌细胞”包括该术语本领域公认的定义。通常,革兰氏阴性菌包括葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌(例如,运动发酵单胞菌),发酵细菌(例如棕榈发酵细菌),和醋杆菌(例如,巴氏醋杆菌)。
术语“革兰氏阳性菌”包括该术语本领域公认的定义。通常,革兰氏阳性菌包括丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,八叠球菌(例如,胃八叠球菌)。
术语“异源多肽”包括由任何来源,例如,真核生物,原核生物,病毒的异源核酸,或合成的核酸片段编码的多肽或其一部分。
术语“同源”是指第一个氨基酸或核苷酸序列与第二个氨基酸或核苷酸序列相比,含有充足或最少数目的相同或相等的氨基酸残基或核苷酸,例如,具有相似侧链的氨基酸残基,这样才能使第一和第二个氨基酸或核苷酸序列共有共同的结构域和/或共同的功能活性。
术语“宿主细胞”和“重组宿主细胞”包括适于遗传操作的细胞,例如,可掺入异源多核苷酸序列,例如,可被转染。所述细胞可以是微生物或高级真核生物的细胞,如动物细胞或植物细胞。该术语包括最初转染的细胞的子代。在具体实施方案中,所述细胞是细菌细胞,例如,革兰氏阴性菌细胞或革兰氏阳性菌细胞。具体而言,术语重组宿主细胞包括已经被选择或改造成具有某些所希望的性质并适于利用本发明的组合物和方法进一步修饰的细胞。
术语“分离的多肽”(例如,分离的或纯化的生物合成酶)基本上没有来源于衍生所述多肽的微生物的细胞物质或其它污染多肽,或基本上没有化学合成时的化学前体或其它化学物质。
术语“核酸”包括核酸分子,例如含有编码多肽的可读框的多核苷酸,还可进一步包括非-编码调节序列,和内含子。此外,该术语还包括作图于功能基因座的一个或多个基因。此外,该术语包括用于选择目的的特异基因。该基因对于宿主细胞而言可以是内源性的,或被重组引入到宿主细胞中,例如,作为游离维持的质粒或稳定整合到基因组中的质粒(或其片段)。在其中一个实施方案中,多核苷酸片段的基因涉及碳水化合物生物转化成乙醇中的至少一个步骤。因此,该术语包括编码多肽的任何基因,所述多肽包括丙酮酸脱羧酶,醇脱氢酶,分泌多肽,或多糖酶,例如,葡聚糖酶,或其组合。
术语“突变核酸分子”或“突变基因”是指所含核苷酸序列包括至少一次改变(例如,取代,插入,缺失)的核酸分子或基因,这样由所述突变体编码的多肽就会显示出不同于由野生型核酸分子或基因编码的多肽的活性。
术语“可操作性连接”是指目标核酸分子或基因的核苷酸序列以允许表达核苷酸序列(例如,增强的,增加的,组成型,基础的,减弱的,降低的或阻抑的表达),优选表达由该核苷酸序列编码的基因产物(例如,当重组核酸分子包含在重组载体中时,如此处所定义的,或被引入到微生物中时)表达的方式与调节序列连接。
术语“pH”包括本领域公认的含义。通常,本发明的丙酮酸脱羧酶在约pH 4-8,更优选约pH 5-7,甚至更优选约pH 5.5-6.0时显示脱羧酶活性。
术语“丙酮酸脱羧酶”包括这里所述能够把丙酮酸脱羧成乙醛的酶。通常,术语“pdc”是指丙酮酸脱羧酶的基因,而术语“PDC”则是指pdc基因的产物,即丙酮酸脱羧酶的多肽或酶。
术语“重组核酸分子”包括已经改变,修饰或工程化的核酸分子(例如,DNA分子),这样它的核苷酸序列就不同于衍生(例如,通过加成,缺失或取代一个或多个核苷酸)该重组核酸分子的天然核酸分子。优选,重组核酸分子(例如,重组DNA分子)包括与调节序列可操作性连接的本发明的分离核酸分子或基因(例如,分离的pdc基因)。
术语“分泌酶”包括单独与其它多肽结合,促进另外的多肽从细胞的胞内区转运到胞外环境的任何多肽。在其中一个实施方案中,分泌多肽包括足以赋予革兰氏阴性菌或革兰氏阳性菌宿主细胞分泌活性的所有必需的分泌多肽。
术语“同时糖化和发酵”或“SSF”包括一个或多个重组宿主(或其提取物,包括纯化或未纯化的提取物,如果需要,加入其它酶,例如,来自于一个或多个不同的来源)使复合糖同时降解或解聚,并使该糖残基生物转化成乙醛,以及随后如果需要,通过发酵生物转化成乙醇的用途。
术语“底物亲和性”是指酶对底物的结合动力学,例如,丙酮酸脱羧酶对其底物丙酮酸(或其类似物)的KM。通常,本发明丙酮酸脱羧酶的底物亲和性(例如,对丙酮酸)KM约为0.1-1,更优选约0.1-0.5,甚至更优选约0.2-0.4。
术语“糖”包括含有糖部分的任何碳水化合物源。这种糖是根据本发明的产品和方法进行解聚(如果需要),随后生物转化成乙醛,然后再通过发酵生物转化成乙醇的可能糖源。
术语“替代启动子”包括可转录控制目标基因,例如,丙酮酸脱羧酶基因,但又不会完全转录控制的多核苷酸片段。在其中一个实施方案中,替代启动子的转录控制导致目标基因的表达水平增加。在另一实施方案中,替代启动子位于目标基因的5’端。替代启动子可用于替换天然启动子,或在除天然启动子之外的情况下使用。替代启动子对于使用它的宿主细胞而言可以是内源性的,或它可以是引入到宿主细胞中的异源多核苷酸序列,例如对于使用它的宿主细胞而言是外源性的。适合用于细菌中的其它启动子包括,例如,lacZ,T7,和SP6(见,例如,Ausubel等)。
术语“热稳定性”与“耐热性”可互换使用,是指酶(例如,在细胞中表达,存在于细胞提取物,细胞溶解产物中,或是纯化或部分纯化的形式)至少在约20℃,优选约25-35℃。更优选约37℃或更高,特别是约50℃或更高,例如,至少约60℃或更高的温度下,催化反应(例如,丙酮酸到乙醛的转化)的能力。
II.分离的核酸分子和基因本发明提供含有编码丙酮酸脱羧酶多肽(PDC)的丙酮酸脱羧酶基因(pdc)的核酸分子,其中所述核酸是从革兰氏阴性菌和革兰氏阳性菌,例如革兰氏阴性菌棕榈发酵细菌,巴氏醋杆菌和革兰氏阳性菌胃八叠球菌中分离出来的。本发明还提供了不但含有上述任何一种丙酮酸脱羧酶基因(即,pdc),而且含有其它侧翼区的分离基因组核酸,其中所述侧翼区含有调节区(例如,启动子及核糖体结合位点)和参与产乙醇的其它相关基因,例如,醇脱氢酶(adh)。
所述核酸分子包括DNA分子(例如,线状,环状,cDNA或染色体DNA)和RNA分子(例如,tRNA,rRNA,mRNA)以及使用核苷酸类似物产生的DNA或RNA类似物。所述核酸分子可以是单链或双链的,但优选双链的DNA。本发明的分离核酸分子包括这样一种核酸分子,即它没有天然侧翼于衍生所述核酸的生物的染色体DNA中的核酸分子的序列(即,位于核酸分子5’和3’端的序列)。在不同的实施方案中,分离的核酸分子可含有少于约10kb,5kb,4kb,3kb,2kb,1kb,0.5kb,0.1kb,50bp,25bp或10bp的核苷酸序列,所述核苷酸序列天然侧翼于衍生所述核酸分子的微生物的染色体DNA中的核酸分子。此外,“分离的”核酸分子,如cDNA分子,当通过重组技术产生时,基本上没有其它细胞物质,或当化学合成时,基本上没有化学前体或其它化学物质。
这里所述的pdc基因(用斜体字表示)包括这样一种核酸分子(例如,DNA分子或其片段),例如,一种编码多肽或RNA的核酸分子,它是利用基因间DNA(即,间插或间隔DNA,它天然侧翼于和/或分开生物染色体DNA中的基因)从生物体中的另外一个基因或其它基因中分离的。基因可指导酶或其它多肽分子的合成(例如,可含有编码序列,如,编码多肽的连续可读框(ORF))或其本身在生物体中是功能性的。生物体中的基因可在操纵子中簇集,其中所述操纵子是利用基因间DNA从其它基因和/或操纵子中分离的。操纵子内所含的各个基因可在没有基因间DNA的情况下,在各基因之间重叠。
这里所述的分离基因包括这样一种基因,它基本上没有天然侧翼于衍生该基因的生物的染色体DNA中的基因的序列(即,没有编码第二种或不同多肽或RNA分子的相邻编码序列,相邻结构序列等),而且可选择性地含有5’和3’调节序列,例如启动子序列和/或终止子序列。在其中一个实施方案中,分离基因包括多肽的优势编码序列(例如,编码PDC多肽的序列)。
在另一实施方案中,分离基因包括多肽(例如,PDC多肽)的编码序列和来源于衍生该基因的生物染色体DNA的相邻5’和/或3’调节序列(例如,相邻的5’和/或3’pdc调节序列)。优选,分离基因含有少于约10kb,5kb,2kb,1kb,0.5kb,0.2kb,0.1kb,50bp,25bp或10bp的核苷酸序列,所述核苷酸序列天然侧翼于衍生该基因的生物的染色体DNA中的基因。
一方面,本发明提供分离的pdc核酸序列或基因,分离的醇脱氢酶(adh)核酸序列或基因,优选来源于革兰氏阳性菌或革兰氏阴性菌。优选,所述pdc核酸或基因来源于革兰氏阴性菌,如葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌(例如,运动发酵单胞菌),发酵细菌(例如棕榈发酵细菌),和醋杆菌(例如,巴氏醋杆菌)。
在另一实施方案中,所述pdc核酸或基因来源于革兰氏阳性菌,如丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,八叠球菌(例如,胃八叠球菌)。
在其中一个实施方案中,所述pdc核酸或基因来源于革兰氏阴性菌棕榈发酵细菌。
在另一实施方案中,所述pdc核酸或基因来源于革兰氏阴性菌巴氏醋杆菌。
在另一实施方案中,所述pdc核酸或基因来源于革兰氏阳性菌胃八叠球菌。
在另一实施方案中,本发明分离核酸分子所含的核苷酸序列与SEQID NO1,SEQ ID NO3,或SEQ ID NO5所示的核苷酸序列至少具有约60-65%,优选至少约70-75%,更优选至少约80-85%,甚至更优选至少约90-95%或更多的同一性。
在另一实施方案中,分离核酸分子在严格条件下与具有SEQ IDNO1,SEQ ID NO3,或SEQ ID NO5所示核苷酸序列的核酸分子杂交。这种严格条件对于本领域那些技术人员而言是已知的,可在Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6中找到。严格(例如,高度严格)杂交条件的具体非限制性例子是约45℃时在6X氯化钠/柠檬酸钠(SSC)中杂交,然后于50-65℃时,在0.2XSSC,0.1%SDS中洗涤一次或多次。优选,在严格条件下与SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示序列杂交的本发明分离核酸分子相应于天然存在的核酸分子。通常,天然存在的核酸分子包括具有天然存在的核苷酸序列的RNA或DNA分子。
本发明的核酸分子(例如,具有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示核苷酸序列的核酸分子)可使用标准的分子生物学技术和这里提供的序列信息分离。例如,核酸分子可使用标准的杂交和克隆技术分离(例如,在Sambrook,J.,Fritsh,E.F.,和Maniatis,T.Molecular CloningA Laboratory Manual.2nd,ed.,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1989中所述)或使用以SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示序列为基础设计的合成寡核苷酸引物,通过聚合酶链反应分离。本发明的核酸可使用cDNA,mRNA或可选择性地,基因组DNA作为模板,以及适宜的寡核苷酸引物,按照标准PCR扩增技术扩增。在另一实施方案中,本发明的分离核酸分子含有这样一种核酸分子,它是SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示核苷酸序列的互补序列。
其它pdc核酸序列是含有SEQ ID NO1,SEQ ID NO3,或SEQ IDNO5所示核苷酸序列的那些,其编码具有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6所示氨基酸序列的多肽同源物(例如,编码与具有SEQID NO2,SEQ ID NO4,或SEQ ID NO6所示氨基酸序列的多肽具有至少30%,40%,50%,60%,70%,80%,90%,95%或更多同一性的多肽),在严格条件下与具有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示核苷酸序列的核酸分子的全部或一部分杂交,或与编码具有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6所示氨基酸序列的多肽的核酸分子的全部或一部分杂交,或与这里所示的pdc核苷酸序列互补。
在另一实施方案中,分离的pdc核酸分子或基因编码具有SEQ IDNO2,SEQ ID NO4,或SEQ ID NO6所示氨基酸序列的PDC多肽同源物。通常,术语“同源物”包括这样的多肽,它与野生型多肽或这里所述多肽的氨基酸序列具有至少约30-35%,优选至少约35-40%,更优选至少约40-50%,甚至更优选至少约60%,70%,80%,90%或更多的同一性,而且具有与野生型多肽或这里所述多肽基本上相同的功能或生物活性。例如,PDC同源物与具有SEQ ID NO2,SEQ IDNO4,或SEQ ID NO6所示氨基酸序列的多肽具有至少约30-35%,优选至少约35-40%,更优选至少约40-50%,甚至更优选至少约60%,70%,80%,90%或更多的同一性,而且它的功能或生物活性与具有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6所示氨基酸序列的多肽(即,功能等同物)基本上相同(如,具有基本上相同的丙酮酸脱羧酶活性)。
在另一实施方案中,分离的pdc核酸分子或基因含有编码SEQ IDNO2,SEQ ID NO4,或SEQ ID NO6任何一个所示多肽的核苷酸序列。
在另一实施方案中,分离的pdc核酸分子与具有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5所示核苷酸序列的核酸分子的全部或一部分杂交,或与具有编码多肽的核苷酸序列的核酸分子的全部或一部分杂交,所述多肽具有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6任何一个所示的氨基酸序列。
这种杂交条件对于本领域那些技术人员而言是已知的,可在Current Protocols in Molecular Biology,Ausubel等,eds.,John Wiley & Sons,Inc.(1995),sections 2,4和6中找到。其它严格条件可在Molecular CloningA Laboratory Manual,Sambrook等,Cold Spring Harbor Press,Cold Spring Harbor,NY(1989),chapters 7,9和11中找到。严格杂交条件的具体非限制性例子包括约65-70℃时在4X氯化钠/柠檬酸钠(SSC)中杂交(或约42-50℃时,在4XSSC加50%甲酰胺中杂交),然后约65-70℃时,在1XSSC中洗涤一次或多次。高度严格杂交条件的具体非限制性例子包括约65-70℃时在1XSSC中杂交(或约42-50℃时,在1XSSC加50%甲酰胺中杂交),然后约65-70℃时,在0.3XSSC中洗涤一次或多次。还原严格杂交条件的具体非限制性例子包括约50-60℃时在4XSSC中杂交(或约40-45℃时,在6XSSC加50%甲酰胺中杂交),然后约50-60℃时,在2XSSC中洗涤一次或多次。上面列举值的中间范围,例如65-70℃或42-50℃也包括在本发明内。可用SSPE(1XSSPE是0.15M NaCl,10mM NaH2PO4,和1.25mM EDTA)替换杂交中的SSC(1XSSC是0.15M NaCl和15mM柠檬酸钠)和洗涤缓冲液;每次杂交完成后,洗涤15分钟。长度小于50个碱基对的杂交体的杂交温度应为5-10℃,低于杂交体的解链温度(Tm),其中Tm是根据下列公式确定的。对于长度小于18个碱基对的杂交体而言,Tm(℃)=2(A+T的碱基#)+4(G+C的碱基#)。对于长度在18-49个碱基对之间的杂交体而言,Tm(℃)=81.5+16.6(log10[Na+])+0.41(G+C%)-(600/N),其中N是杂交体中的碱基数,[Na+]是杂交缓冲液中的钠离子浓度(1XSSC的[Na+]=0.165M)。
本领域的技术人员应当认识到,还可把其它试剂加入到杂交和/或洗涤缓冲液中,以降低核酸分子与膜,例如,硝酸纤维素或尼龙薄膜的非特异性杂交,这些试剂包括但不限制于封闭剂(例如,BSA或鲑鱼或鲱鱼精子的载体DNA),去污剂(例如SDS),螯合剂(例如,EDTA),Ficoll,PVP等。当使用尼龙薄膜时,严格杂交条件具体的非限制性例子是约65℃时,在0.25-0.5M NaH2PO4,7%SDS中杂交,然后于65℃时,在0.02M NaH2PO4,1%SDS中洗涤一次或多次,见,例如,Church和Gilbert(1984)Proc.Natl.Acad.Sci.USA 811991-1995,(或可选择性的,0.2XSSC,1%SDS)。在另一实施方案中,分离核酸分子所含的核苷酸序列与这里所示的pdc核苷酸序列互补(例如,它是SEQ ID NO1,SEQ ID NO3,SEQ ID NO5所示核苷酸序列的完全互补序列)。
本发明另一实施方案提供突变或嵌合的pdc核酸分子或基因。通常,这里所述的突变核酸分子或突变基因包括具有下列核苷酸序列的核酸分子或基因,即所述核苷酸序列包括至少一个改变(例如,取代,插入,缺失),这样由所述突变体编码的多肽就会显示出与野生型核酸分子或基因编码的多肽不同的活性。通常,嵌合pdc含有来源于另外一个PDC的完整结构域,其中所述另外一个PDC已经用PDC中的相应结构域改造过(融合,交换)。优选,突变核酸分子或突变基因(例如,突变pdc基因)编码具有改进的活性,例如,脱羧酶活性(例如底物亲和性(例如,对于丙酮酸));热稳定性;在不同pH值下的活性;或密码子使用(例如,在受体宿主细胞中的表达改进)的PDC多肽。
III.重组核酸分子和载体本发明还提供重组核酸分子(例如,重组DNA分子),它含有这里所述的核酸分子和/或基因(例如,分离的核酸分子和/或基因),优选pdc基因,更优选来源于革兰氏阴性菌或革兰氏阳性菌的pdc基因。
本发明进一步提供含有这里所述的核酸分子(例如,分离或重组的核酸分子和/或基因)的载体(例如重组载体)。具体而言,提供含有核酸序列的重组载体,所述核酸序列编码这里所述的细菌基因产物,优选pdc基因产物,更优选革兰阴性菌或革兰氏阳性菌的pdc基因产物,甚至更优选棕榈发酵细菌,巴氏醋杆菌,或胃八叠球菌的pdc基因产物。
还可对重组载体(例如,质粒,噬菌体,噬菌粒,病毒,粘粒或其它纯化核酸载体)进行改变,修饰或工程化,这样与衍生该重组载体的天然核酸分子中所含的那些相比,它就含有更多,更少或不同的核酸序列。优选,所述重组载体包括pdc基因或含有这种pdc基因的重组核酸分子,其中该pdc基因与这里所述的调节序列,例如,启动子序列,终止子序列和/或人工核糖体结合位点(RBS)可操作性连接。
通常,pdc基因以使核苷酸序列表达(例如,增强的,增加的,组成型,基础的,减弱的,降低的或阻抑的表达),优选使核苷酸序列编码的基因产物表达(例如,当重组核酸分子包含在重组载体中时,如此处所定义的,或引入到微生物中时)的方式与调节序列可操作性连接。
所述调节序列包括影响(例如,调控或调节)其它核酸序列表达的核酸序列。在其中一个实施方案中,调节序列包含在重组核酸分子或重组载体中,其位置和/或方向与相对于调节序列观察到的特定目标基因以及天然存在的目标基因相似或相同,例如,处于天然的位置和/或方向。举例来说,目标基因可包含在与调节序列可操作性连接的重组核酸分子或重组载体中,其中调节序列与天然生物体中的目标基因相伴或相邻(例如,与“天然”调节序列可操作性连接,例如,与“天然”启动子可操作性连接)。可选择性地,目标基因可包含在与调节序列可操作性连接的重组核酸分子或重组载体中,其中调节序列与天然生物体中另外的(例如,不同的)基因相伴或相邻。可选择性地,目标基因可包含在与其它生物体的调节序列可操作性连接的重组核酸分子或重组载体中。例如,其它微生物的调节序列(例如,其它细菌调节序列,噬菌体调节序列等)可与特定的目标基因可操作性连接。
在其中一个实施方案中,调节序列是非天然存在的序列(例如,已经修饰,突变,取代,衍生,缺失的序列,包括化学合成的序列)。优选的调节序列包括启动子,增强子,终止信号,抗终止信号以及其它表达控制元件(例如,结合阻抑物或诱导物的序列和/或转录和/或翻译调节多肽的结合位点,例如,在转录的mRNA中)。这种调节序列在Sambrook,J.,Fritsh,E.F.,和Maniatis,T.Molecular CloningALaboratory Manual,2nd,ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中描述。调节序列包括指导核苷酸序列在微生物中组成型表达的那些(例如,组成型启动子和强组成型启动子);指导核苷酸序列在微生物中诱导型表达的那些(例如,诱导型启动子,如木糖诱导型启动子);和减弱或阻抑核苷酸序列在微生物中表达的那些(例如,衰减信号或阻抑序列)。本发明的范围还包括通过使调节序列除去或缺失而调节目标基因的表达。例如,可除去涉及转录负调节的序列,如此可改进目标基因的表达。
在其中一个实施方案中,本发明的重组核酸分子或重组载体包括编码至少一个与启动子或启动子序列可操作性连接的细菌pdc基因产物的核酸序列或基因。本发明的优选启动子包括天然启动子,替代启动子和/或噬菌体启动子。在其中一个实施方案中,启动子是与生化管家基因有关的启动子或与产乙醇途径有关的启动子。在另一实施方案中,启动子是噬菌体启动子。其它启动子包括tef(翻译延伸因子(TEF))和pyc(丙酮酸羧酶(PYC)启动子),它们可促进在杆菌(例如,枯草杆菌)中的高水平表达。其它优选启动子,例如,用于革兰氏阳性菌中的,包括但不限制于amyE启动子或噬菌体SP02启动子。其它优选启动子,例如,用于革兰氏阴性菌中的,包括但不限制于,tac,trp,tet,trp-tet,lpp,lac,lpp-lac,lacIq,T7,T5,T3,gal,trc,ara,SP6,λ-PR或λ-PL。
在另一实施方案中,本发明的重组核酸分子或重组载体含有终止序列(例如,转录终止序列)。通常,终止序列是指可终止基因转录的调节序列。终止序列(或串联转录终止子)可进一步稳定mRNA(例如,通过向mRNA中加入结构),例如,可抗核酸酶。
在另一实施方案中,本发明的重组核酸分子或重组载体含有这种序列,即它可检测含所述序列(即,可检测和/或可选择性标记)的载体,例如,克服营养缺陷型突变的序列,例如,ura3或ilvE,荧光标记,和/或比色标记(例如,lacZ/β-半乳糖苷酶),和/或抗生素抗性基因(例如,bla或tet)。
应当理解,可被引入到载体中的本发明任何一种pdc基因还可含有一种或多种产乙醇基因(例如,醇脱氢酶(即,adh))和/或编码基因产物的基因,所述基因产物适于使糖发酵或降解,随后接着发酵,例如在实施例8和9中所述,以及美国专利号5,821,093;5,482,846;5,424,202;5,028,539;5,000,000;5,487,989;5,554,520和5,162,516中所述。这两种或多种基因可使用独立调节元件(例如,启动子),共有调节元件,天然调节元件,或其组合独立表达。
IV.分离的多肽本发明另一方面提供分离的多肽(例如,分离的产乙醇酶,如丙酮酸脱羧酶(PDC))。在其中一个实施方案中,PDC多肽是利用重组DNA技术生产的,而且可使用标准的多肽纯化技术,利用适宜的纯化方法从本发明的微生物中分离。在另一实施方案中,多肽是使用标准的肽合成技术化学合成的。
分离或纯化的多肽(例如,分离或纯化的PDC)基本上没有来源于衍生该多肽的微生物的细胞物质或其它污染多肽,或基本上没有化学合成时的化学前体或其它化学物质。在其中一个实施方案中,分离或纯化的多肽含有少于约30%(干重)的污染多肽或化学物质,更优选少于约20%的污染多肽或化学物质,更优选少于约10%的污染多肽或化学物质,最优选少于约5%的污染多肽或化学物质。
在其中一个实施方案中,PDC多肽或基因产物来源于革兰氏阳性菌或革兰氏阴性菌。优选PDC多肽或基因产物来源于革兰氏阴性菌,如葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌(例如,运动发酵单胞菌),发酵细菌(例如棕榈发酵细菌),和醋杆菌(例如,巴氏醋杆菌)。
在另一实施方案中,PDC多肽或基因产物来源于革兰氏阳性菌,如丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,八叠球菌(例如,胃八叠球菌)。优选基因产物来源于选自革兰氏阴性菌棕榈发酵细菌,巴氏醋杆菌,和革兰氏阳性菌胃八叠球菌的微生物。
包括在本发明范围内的PDC多肽或基因产物是由天然存在的细菌基因编码的,棕榈发酵细菌,巴氏醋杆菌,或胃八叠球菌衍生的多肽或基因产物。进一步包括在本发明范围内的是细菌衍生的多肽或基因产物,它们不同于天然存在的细菌和/或棕榈发酵细菌,巴氏醋杆菌,或胃八叠球菌的基因(例如,pdc),例如,该基因具有已经突变,插入或缺失的核酸,但仍然编码与本发明天然存在的基因产物基本相似的多肽,例如,含有丙酮酸脱羧酶活性。
例如,应当理解,本领域的技术人员可使核酸突变(例如,取代),由于遗产密码的简并性,它编码与天然存在基因编码的相同的氨基酸。这可能是我们所希望的,以便改进在特定生物体中表达的核酸的密码子使用。此外,应当理解,本领域的技术人员可使编码保守氨基酸取代的核酸突变(例如,取代)。还应当理解,本领域的技术人员可使氨基酸取代,加成或缺失到一定程度,与天然存在的基因产物相比,基本上不会影响基因产物的功能(例如,脱羧酶活性),它的每个例子都包括在本发明的范围之内。使用这里所述的测定法可很容易地测定脱羧酶活性和,例如,酶/底物亲和性,酶热稳定性,和/或酶在各种pH值下的活性。
在其中一个实施方案中,本发明的分离多肽(例如,分离的丙酮酸脱羧酶),如分离的PDC多肽具有SEQ ID NO2,SEQ ID NO4,SEQID NO6,或SEQ ID NO8所示的氨基酸序列。在其它实施方案中,本发明的分离多肽是至少一个SEQ ID NO2,SEQ ID NO4,SEQ IDNO6,或SEQ ID NO8所示多肽的同源物(例如,所含的氨基酸序列与SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,或SEQ ID NO8的氨基酸序列具有至少约30-40%,优选约40-50%,更优选约50-60%,甚至更优选约60-70%,70-80%,80-90%,90-95%或更多的同一性),而且所具有的活性与分别由SEQ ID NO2,SEQ ID NO4,SEQ IDNO6,或SEQ ID NO8所示氨基酸序列编码的多肽基本相似。
为了确定两个氨基酸序列或两个核酸的同一性百分比,将序列进行比对(例如,可把空位引入到第一个氨基酸或核酸序列中,与第二个氨基酸或核酸序列进行最佳序列比对)。当第一个序列中的位置被与第二个序列相应位置相同的氨基酸残基或核苷酸占据时,那么分子在该位置是相同的。两个序列之间的同一性百分比是序列共有的相同位置数的函数(即,同一性%=相同位置数#/总位置数#×100),优选考虑空位数和产生最佳序列比对所需的该空位的大小。
序列比对和两个序列之间同一性百分比的测定可利用数学算法完成。用于序列比对的数学算法具体的非限制性例子是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 872264-68的算法,并对这种算法所作的改进Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 905873-77。可把这种算法结合到Altschul等,(1990)J.Mol.Biol.215403-10的NBLAST和XBLAST程序(2.0版本)中。BLAST核苷酸检索可用NBLAST程序进行,分值=100,字长=12,从而获得与本发明核酸分子同源的核苷酸序列。BLAST多肽检索可用XBLAST程序进行,分值=50,字长=3,从而获得与本发明多肽分子同源的氨基酸序列。为了对空位进行序列比对,可利用Altschul等,(1997)Nucleic Acids Research 25(17)3389-3402描述的有空位的BLAST。当利用BLAST和有空位的BLAST程序时,可使用各程序(例如,XBLAST和NBLAST)的缺省参数。见http//www.ncbi.nlm.nih.gov。用于进行序列比对的数学算法其它具体的非限制性例子是Myers和Miller(1988)Comput Appl Biosci.411-17的算法。将这种算法结合到ALIGN程序中,例如,在GENESTREAM网络服务器,IGH Montpellier,FRANCE或ISREC服务器上。当利用ALIGN程序比较氨基酸序列时,可使用PAM120权重残基表,数值为12的空位长度罚分,和数值为4的空位罚分。
在另一实施方案中,两个氨基酸序列之间的同一性百分比可使用GCG软件包中的GAP程序,使用Blossom 62矩阵或PAM250矩阵,数值为12,10,8,6,或4的空位权重和数值为2,3,或4的长度权重测定。在另一实施方案中,两个核酸序列之间的同一性百分比可使用GCG软件包中的GAP程序(可在http//www.gcg.com获得),使用数值为50的空位权重和数值为3的长度权重测定。
以上述分离的PDC多肽为基础,可使用这里所述的标准技术,相对于PDC多肽,或其一部分培养免疫特异性抗体。
V.使用方法生产乙醛的方法所需产物乙醛的洁净有效的生产具有广泛的商业和工业用途。例如,乙醛可用于醋酸,调味料,食品,饮料,香料,塑料,苯胺染料的生产,合成橡胶制造业,镜子的镀银,明胶纤维的硬化和实验室的研究。此外,乙醛可作为通过发酵生产乙醇的底物。
因此,本发明包括使用本发明的PDC酶把底物,例如丙酮酸或丙酮酸类似物转化成乙醛的方法。在其中一个实施方案中,本发明提供使用表达pdc基因和基因产物(PDC)的微生物(例如,重组微生物)从丙酮酸生产乙醛的方法。所述方法还包括生物过程,该过程可产生(例如,转换或转化)丙酮酸,或其可转化的类似物,该类似物可被转化或脱羧成乙醛,或其类似物。
该方法包括使微生物与糖接触,其中所述微生物表达本发明的pdc基因和基因产物,且可选择性地表达一个或多个产乙醇基因,使糖的碳骨架转化成丙酮酸或其类似物,在培养条件下产生乙醛(或其类似物)。
在本发明另一实施方案中,上述微生物可被加工成进行上述转化反应的酶溶解产物。在另一实施方案中,pdc基因产物是按照这里所述纯化的,用于进行转化反应。
转化反应所用的微生物和/或酶(例如,溶解产物形式的,部分纯化,或纯化形式的)是以能够执行它们预定功能(例如,生产所需的化合物,如乙醛)的形式存在的。所述微生物可以是完整的细胞,或仅仅是获得预期结果所需的细胞的一部分。所述微生物可以是混悬的(例如,混悬在适宜的溶液,如缓冲液或培养基中),洗过的(例如,洗至没有培养微生物的培养基),丙酮-干燥的,固定的(例如,用聚丙烯酰胺凝胶或k-角叉菜胶固定或固定在合成支持物,例如,珠子,基质等上),固定的,交联的或渗透的(例如,具有渗透膜和/或壁,这样化合物,例如底物,中间体或产物可更容易地通过该膜或壁)。
纯化或未纯化PDC的酶(单独或与其它产乙醇酶结合)也可用于转化反应。该酶应以能够执行其预定功能(例如,获得所需化合物,如乙醛,或,存在必需的产乙醇基因产物,乙醇)的形式存在。例如,该酶可以是游离的形式或固定的。
生产乙醇的方法在本发明其中一个实施方案中,具有上述性质的宿主细胞也是产乙醇的。因此,本发明提供使用这种宿主细胞(或从其衍生的提取物/酶)生产乙醇的方法。此外,宿主细胞可用于把复合糖协同降解或解聚为单糖。随后,细胞可通过发酵把更简单的糖分解代谢成乙醇。同时把复合糖解聚成更小的糖残基,然后发酵的过程称作同时糖化和发酵(SSF)。
通常,要对发酵条件进行选择,以便提供最佳的pH值和温度,促进生产者宿主细胞株的最佳生长动力学以及培养所产生酶的催化条件(Doran等,(1993)Biotechnol.Progress 9533-538)。例如,对于克雷白氏菌,对于P2株而言,最佳条件被确定为35-37℃和pH5.0-5.4。在这些条件下,甚至是外源性加入的真菌内葡聚醣酶和外葡聚糖酶也十分稳定,并在很长一段时间内继续发挥作用。其它条件在实施例中讨论。此外,本领域的技术人员仅仅需要常规实验,使用本领域已知的技术,就可优化本发明的已知发酵反应。见,例如,美国专利号5,424,202和5,916,787,它们引入此处作为参考。
本发明可通过下列实施例进一步举例说明,但这些实施例不应被解释为对本发明的限制。
示例除非另有说明,在实施例中使用下列原料和方法。缩写词如下PDC,丙酮酸脱羧酶;ADH,醇脱氢酶;SDS-PAGE,十二烷基硫酸钠-聚丙稀酰胺凝胶电泳;TPP,二磷酸硫胺素;PCMS,对-氯汞苯基-磺酸;PCMB,对-氯汞苯甲酸;DTT,二硫苏糖醇;Apa,巴氏醋杆菌;Sve,胃八叠球菌;Zpa,棕榈发酵细菌;Zmo,运动发酵单胞菌。
材料和方法菌株和培养基-棕榈发酵细菌的菌株T109(IAM 14233,ATCC51623)是26℃(200rpm)时,在ATCC 1956 MY培养基(每升含有10g酵母提取物,20g麦芽糖,2g KH2PO4,和5g NaCl)中培养的。巴氏醋杆菌的菌株NCIB8618(ATCC 12874)是25℃时,在基本培养基(pH 5.0-5.5)中通气生长的,其中按先前所述(3,13)向基本培养基中补充了2%(v/v)D-L-乳酸盐,每升又加入了0.1ml的1%(v/v)止泡剂。大肠埃希氏菌的菌株ER1648 F-fhuA2Δ(lacZ)rl supE44trp31 mcrA1272Tn10(Tetr)his-1 rpsL104(Strr)xyl-7 mtl-2 metB1Δ(mcrC-mrr)102Tn10(Tetr)(New England Biolabs,Beverly,MA),DH5α F-recA1 endA1 hsdR17(rk-mk+)supE44 thi-1gyrA relA1(Life Technologies,Rockville,MD),BL21-CodonPlus-RIL F-ompT hsdS(rB-mB-)dcm+Tetrgalλ(DE3)endAHte[argU ileY leuW Camr](一种大肠埃希氏菌的B菌株)(Stratagene,LaJolla,CA),和Rosetta(DE3)F-ompT hsdSB(rB-MB-)gal dcm lacY1(pRARE)(Novagen,Madison,WI)用于重组DNA的实验。大肠埃希氏菌的菌株是37℃(200rpm)时,在Luria-Bertani(LB)培养基中生长的。如果需要,可向培养基中补充2%(w/v)葡萄糖和抗生素,包括氨苄西林(100mg/升),卡那霉素(100mg/升),和氯霉素(30mg/升)。
DNA的分离和克隆-质粒DNA是用BioRad(Hercules,CA)的Quantum Prep Plasmid Miniprep试剂盒分离的。DNA片段是用Qiagen(Valencia,CA)的QIAquick凝胶提取试剂盒,使用1XTAE缓冲液(40mM Tris醋酸盐,2mM EDTA,pH 8.5)从0.8%Seakem GTG琼脂糖(FMC Bioproducts,Rockland,ME)凝胶洗脱下来的。基因组DNA是用Harwood和Cutting(17)描述的方法分离的。
棕榈发酵细菌的DNA和多肽序列的分析-质粒是使用LICOR测序仪(DNA测序设备,Department of Microbiology and Cell Science,University of Florida)利用Sanger双脱氧方法(42)进行测序的。Genpro 5.0(Hoefer Scientific,San Francisco,CA),1.81版本的ClustalW(46),1.5版本的Treeview(39),和MultiAln(12)用于DNA和多肽序列的比对和比较。使用BLAST网络服务器把GenBank,EMBL,和位于National Center for BiotechnologyInformation(Bethesda,MD)的SwissProt中的多肽序列与推断氨基酸序列进行比较。
PDC多肽的纯化-PDC的纯化是按照表2进行的。除非另有说明,所有过程都是室温进行的,所有纯化缓冲液都含有1mM TPP和1mMMgCl2。胃八叠球菌的PDC是按照先前所述(45)从重组大肠埃希氏菌BL21-CodonPlus-RIL(pJAM419)和Rosetta(DE3)(pRARE,pJAM419)纯化的。运动发酵单胞菌的PDC是按照下面棕榈发酵细菌PDC的纯化所述,使用热处理,Q-琼脂糖凝胶,和Superdex 200过程从重组大肠埃希氏菌DH5α(pLOI276)(11)纯化的,区别在于运动发酵单胞菌的PDC是以0.22-0.32M NaCl从Q-琼脂糖凝胶上洗脱下来的。
(i)棕榈发酵细菌PDC的纯化-使棕榈发酵细菌和大肠埃希氏菌DH5α(pJAM3440)细胞生长至稳定期,10,000Xg离心采集(10分钟,4℃)。把细胞(12-15g湿重)重悬浮在6个体积,含有1mM TPP和1mM MgCl2的pH6.5的50mM磷酸钠缓冲液(缓冲液A)中,以20,000lb/in2通过冷却了的弗氏细胞压器。16,000Xg(20分钟,4℃)离心除去细胞碎片。把细胞溶解产物60℃加热30分钟,在冰上冷却15分钟,16,000Xg(30分钟,4℃)离心除去变性多肽。把上清液加入在50mM缓冲液A中平衡的HiLoad Q-琼脂糖凝胶26/10柱(AmershamPharmacia Biotech,Piscataway,NJ)上。用200ml 50mM的缓冲液A洗涤柱子,以4.0ml/分钟的速率把400ml线性的0-1M的NaCl梯度加在柱上。在0.4-0.5M NaCl之间洗脱PDC活性的峰,并收集。以0.2ml/分钟的速率把等分试样(0.5ml)注射到用50mM缓冲液A平衡的Superdex 200 10/30柱(Amersham Pharmacia Biotech)上,从而把来源于大肠埃希氏菌的重组棕榈发酵细菌的PDC纯化至均一,其中所述缓冲液A含有150mMNaCl和10%甘油。
棕榈发酵细菌“天然”PDC的纯化还需要其它步骤。把热处理过的溶解产物加在用10mM缓冲液A平衡的羟磷灰石CHT5-1柱(BioRad)上。用30ml 10mM的缓冲液A洗涤柱子,并以0.5ml/分钟的速率把30ml线性的10mM-1M的磷酸钠梯度加在柱子上。在0.45-0.5M磷酸钠之间洗脱PDC活性的峰,并收集。按照前面所述使用Superdex 200 10/30进一步纯化等分试样。向混合活性部分加固体硫酸铵至1M,然后上样到用含有1M硫酸铵的50mM缓冲液A平衡的苯基琼脂糖凝胶6FastFlow(low sub)柱(Amersham Pharmacia Biotech)上。15-ml的洗涤之后,以0.5ml/分钟的速率用15-m11-0M递逐渐线性梯度的硫酸铵展开柱子。“天然”PDC活性的峰是在0.55-0.3M盐之间洗脱的。
(ii)巴氏醋杆菌PDC的纯化-对棕榈发酵细菌PDC的纯化方法进行下列改进后,使用热处理,Q-琼脂糖凝胶,Superdex 200,和羟磷灰石从巴氏醋杆菌及大肠埃希氏菌ER1648(pJAM304)中纯化PDC。细胞以30,000lb/in2通过弗氏压器。收集在0.17-0.26M NaCl之间,从Q-琼脂糖凝胶柱洗脱下来的PDC活性,并在上样到Superdex 200柱之前,通过相对于PEG8000透析而浓缩。
棕榈发酵细菌和巴氏醋杆菌的PDC可在液氮下的10%甘油中贮存1个月而不会损失活性。胃八叠球菌和运动发酵单胞菌的PDC在4℃贮存。
PDC的量化和酶活性的测定-多肽浓度是使用含有牛血清白蛋白的Bradford试剂作为标准(BioRad)测定的。PDC活性是按照先前所述(11)通过使用面包酵母醇脱氢酶(ADH)(Sigma-Aldrich,St.Louis,MO)的偶联测定法测量的。反应混合物在pH 5.0的50mM柠檬酸钠缓冲液中含有0.15mM NADH,5mM MgCl2,0.1mM TPP,5mM丙酮酸,和10U ADH,除非另有说明,测量是在25℃进行的。一个单位的酶活性被定义为每分钟生产1μmol乙醛的酶的量。
PDC多肽的分子量和氨基酸序列的测定-亚单位的分子量和酶纯度是用考马斯蓝R-250(26)染色的12%聚丙稀酰胺凝胶,通过十二烷基硫酸钠-聚丙稀酰胺凝胶电泳(SDS-PAGE)测定的。SDS-PAGE的分子量标准如下磷酸化酶b(97.4kDa),血清白蛋白(66.2kDa),卵清蛋白(45kDa),碳酸酐酶(31kDa),胰蛋白酶抑制剂(21.5kDa),和溶菌酶(14.4kDa)。对于天然分子量的测定而言,是把样品加在Superdex 200 10/30柱上,该柱子已经在含有150mM NaCl的pH 6.5的50mM磷酸钠缓冲液中平衡。分子量标准包括血清白蛋白(66kDa),醇脱氢酶(150kDa),α-淀粉酶(200kDa),脱铁铁蛋白(443kDa),和甲状腺球蛋白(669kDa)。
纯化PDC多肽的N-末端序列是在进行了SDS-PAGE,并把多肽电印迹在聚偏二氟乙烯薄膜(PVDF-PLUS)(Micron Separations Inc.,Westborough,MA)上测定的。序列是利用自动Edman降解,在Polypeptide Chemistry Core Facility of the University ofFlorida Interdisciplinary Center for Biotechnology Research上测定的。
脱辅酶的制备-用pH 9.0的1.5ml 50mM磷酸钠缓冲液稀释纯化的PDC(0.75mg/0.5ml),然后立即使用Centricon YM30浓缩器(Millipore,Bedford,MA)浓缩8倍。调节体积至0.5ml之后,25℃温育该多肽45分钟。PDC是通过加在Superdex 200 10/30柱上而从未结合的辅因子中纯化的,其中该柱子用含有10%甘油和150mMNaCl的pH 9.0的50mM磷酸钠缓冲液平衡。立即洗脱后,把脱辅酶在pH 5.0的50mM柠檬酸钠缓冲液中稀释5倍,4℃贮存,并在16小时内用于进行重构测定。TPP是使用15%NaOH中的K3Fe(CN)6,利用氧化成thichrome二磷酸盐后的荧光测量的(15)。激发和发射波长分别为375nm和430nm。为进行重构,把脱辅酶(755ng)稀释在1ml含有1mM TPP和/或1mM MgCl2的pH 5.0的50mM柠檬酸钠缓冲液中。在相同的缓冲液中测定混合物的PDC活性。
原料-生化制品是从Sigma-Aldrich购买的。其它有机和无机的分析级化学物质是从Fisher Scientific(Atlanta,GA)购买的。限制性内切核酸酶和DNA-修饰酶来源于New England BioLabs。洋地黄毒苷-11-dUTP(通过11-原子的间隔区与洋地黄毒苷偶联的2’-脱氧尿苷-5’-三磷酸),相对于洋地黄毒苷培养的碱性磷酸酶偶联抗体,菌落与噬斑杂交所用的尼龙薄膜来源于Roche MolecularBiochemicals。进行DNA杂交的正电尼龙薄膜来源于Ambion(Austin,TX)。
实施例1来源于革兰氏阴性菌棕榈发酵细菌的PDC基因的鉴定和表征在这个实施例中,描述了来源于革兰氏阴性菌棕榈发酵细菌的PDC基因的鉴定和表征。
简单地说,丙酮酸脱羧酶(pdc)操纵子是使用基于纯化蛋白N-末端氨基酸序列的简并寡核苷酸探针,从棕榈发酵细菌的基因组文库中分离出来的(图1)。该片段(pJAM3440)1.7-kb的PstI到BamHI的亚克隆是重组大肠埃希氏菌中PDC活性所需的。以DNA序列为基础,在该区中鉴定了一个1668-bp的ORF(55mol%G+C含量),其编码推定的PDC多肽(图1)。规范Shine-Dalgarno序列(GGAGG)是翻译起始密码子(ATG)的10bp上游。此外,推定的-35和-10启动子(TTcACt-N17-atTAAT,其中N是任意的核苷酸,大写字母与细菌启动子共有序列相对应)位于起始密码子的16-44bp上游(18)。翻译终止密码子的下游(21bp)是一个62bp的序列,经预测它可形成两个茎-环结构和一个16bp富含AT的区,与ρ-非依赖性转录终止相一致(18)。全部四个细菌pdc基因,包括来源于运动发酵单胞菌,胃八叠球菌和巴氏醋杆菌的那些,都被预测是从单顺反操纵子独立转录的(11,40,45)。
棕榈发酵细菌的推断PDC多肽(ZpaPDC)含有556个氨基酸(包括N-末端甲硫氨酸),无水分子量为60,113Da(图4)。它与其余三种细菌PDC相似,它们含有552-568个氨基酸,无水分子量为59,830-61,809Da。棕榈发酵细菌序列的GenBank登记号为AF474145。
实施例2来源于革兰氏阴性菌巴氏醋杆菌的PDC基因的鉴定和表征在这个实施例中,描述了来源于革兰氏阴性菌巴氏醋杆菌的PDC基因的鉴定和表征。
简单地说,染色体DNA是用Harwood等描述的方法从巴氏醋杆菌的细胞中分离出来的(17)。为进行DNA分析,用限制酶(AatII,BamHI,ClaI,EcoRI,和HincII)裂解基因组DNA(1-2μg/泳道),通过凝胶电泳(0.8%琼脂糖)分离,并通过向下的毛细作用转移到带正电的尼龙薄膜上。60℃时,在含有1%封闭试剂,0.1%N-十二酰肌氨酸,和0.02%十二烷基硫酸钠(SDS)的5XSSC(1XSSC是0.15M NaCl+0.015M柠檬酸钠)中平衡该薄膜2小时。使用运动发酵单胞菌pdc基因的0.7-kb KpnI片段作为模板,随机引物可用于标记具有洋地黄毒苷-11-dUTP的探针。加入标记过的探针(1ng/ml)后,60℃培养薄膜14小时,用含有2XSSC和0.1%SDS的溶液(每次5ml)洗涤两次,用含有0.5XSSC和0.1%SDS的溶液(每次15ml,60℃)洗涤两次。使用X-射线胶片利用化学发光观察信号。
亚-基因组文库是使用巴氏醋杆菌染色体DNA的5-到7-kb AatII片段产生的。使用Vent DNA聚合酶把突出端转化成平头端,并连接到平头端(Vent DAN聚合酶),pLITMUS28的脱磷酸化(牛小肠碱性磷酸酶)XhoI位点中。转化后,使用与DNA分析相似的条件,通过杂交筛选重组体,分离含有全长pdc和aldI基因的质粒pJAM301(图2)。
然后亚克隆pJAM301中的巴氏醋杆菌DNA片段(4.2kb),并使用LICOR测序仪(DNA测序设备,Department of Microbiology and CellScience,University of Florida),通过Sanger双脱氧方法进行测序(42)。该序列的GenBank等级号为AF368435。
Genepro 5.0(Riverside Scientific,Seattle,WA),1.81版本的ClustalW(Thompson等,1994),1.5版本的Treeview(Page,1996),和MultiAln(Corpet,1988)用于DNA和/或多肽序列的比对和比较。使用BLAST网络服务器把推断的氨基酸序列和GenBank,EMBL,及National Center for Biotechnology Information(Bethesda,MD)SwissProt数据库中的多肽序列进行比较。
运动发酵单胞菌的丙酮酸脱羧酶(pdc)基因片段可被用作DNA杂交的探针,从而自巴氏醋杆菌基因组DNA中分离出一个6,337bp的,具有58.5%G+C含量的AatII片段(图2)。以DNA序列的BLAST分析为基础,可鉴定pdc基因。经预测该基因编码的多肽具有548个氨基酸(包括N-末端的甲酰基-甲硫氨酸),计算出的pI为5.49,无水分子量为58,873Da(图5)。pdc基因的密码子使用是通过把两个其它的细菌pdc基因,运动发酵假单胞菌(11,34,Reynen和Sahm,J.Bacteriol.1703310-3313(1998))和胃八叠球菌与大肠埃希氏菌K-12的基因组进行比较而获知的(表1)。与巴氏醋杆菌pdc基因较高的G+C含量(60.4%)相一致,除Glu,His,和Tyr那些之外,密码子在第3个碱基位置中主要含有C和/或G(表1)。这一点与运动发酵假单胞菌(52.4%)和胃八叠球菌(30.9%)pdc基因较低的G+C含量正好相反,而且它们的密码子使用也不同。
对巴氏醋杆菌pdc基因5’末端的分析揭示,规范Shine-Dalgarno序列是GTG预测翻译起始密码子的8bp上游。此外,pdc基因上游的72-101bp区与σ70-依赖性启动子的真细菌-35和-10共有序列高度相同。pdc翻译终止密码子的下游(17bp)是一组预测的发夹环状结构,然后是富含AT的区,表明pdc转录的ρ-非依赖性终止。因此而确定巴氏醋杆菌pdc基因可被转录为像运动发酵单胞菌(11)和胃八叠球菌pdc基因那样的单顺反操纵子。
其它可读框(ORF)是在pdc基因区中鉴定的,所述pdc基因区中含有以aldI表示的ORF,它是从pdc背驰转录的(图2)。经预测,推定aldI基因编码的多肽具有357个氨基酸(包括N-末端甲酰基-甲硫氨酸),计算出的分子量为38,108Da,pI为6.32。推断的多肽序列(AldI)与Zn2+-和NAD+-依赖性培养基-链ADH家族(III类)的成员非常相似,与谷胱甘肽-依赖性甲醛脱氢酶(GSH-FDH)最相似(Jornvall等,Eur.J.Biochem 167195-201(1987))。氨基酸残基是保守的,它是对于GSH-FDH活性很重要的结构(C-92,C-95,C-98,和C-106)及催化(C-40,H-62,和C-169)锌离子的可能配体。还存在Rossman折叠共有序列(残基194-GLGGIG-199),表明AldI可结合NAD(P)+。预测的巴氏醋杆菌AldI多肽与醋杆菌中乙醇氧化所必需的膜结合ALD或ADH酶三个亚单位的序列同一性非常小(Thurner等,1997;Kondo和Horinouchi,J.Bacteriol.1775048-5055(1997))。该预测多肽被确定具有与GSH-FDH多肽接近的进化带。最为显著的是,由aldI聚簇编码的巴氏醋杆菌多肽与醋酸菌的分类相一致,具有α-蛋白细菌,蓝细菌属链鱼腥蓝细菌的GSH-FDH酶,很少具有β-和γ-蛋白细菌的GSH-FDH酶。
通过ADH偶联测定法分析巴氏醋杆菌AatII6.3-kb基因组片段的亚克隆的PDC活性,其中的基因组片段在高拷贝数质粒上携带pdc基因。只检测了携带质粒pJAM304菌株的PDC活性显著水平,除了该基因124bp的上游和236bp的下游之外,它还具有完整的pdc可读框(图2和5)。巴氏醋杆菌序列的GenBank登记号为AR368435。
实施例3来源于革兰氏阳性菌胃八叠球菌的PDC基因的鉴定和表征在这个实施例中,描述了来源于革兰氏阳性菌胃八叠球菌的PDC基因的鉴定和特性。
简并寡核苷酸5’-AARGARGTNAAYGTNGARCAYATGTTYGGNGT-3’(SEQID NO11)是以从胃八叠球菌纯化的PDC的N-末端氨基酸序列为基础合成的(Lowe和Zeikus,1992)(其中,R是A或G;N是A,C,G,或T;Y是C或T)。该寡核苷酸是使用供应商(Roche MolecularBiochemicals)推荐的具有洋地黄毒苷-11-dUTP和dATP的末端转移酶在3’端标记的。
为进行DNA分析,用BglI,EcoRI,或HincII消化基因组DNA,通过0.8%琼脂糖电泳分离,并转移到带正电的尼龙薄膜(Southern,1975)上。薄膜是58℃时,在含有1%封闭试剂(Roche MolecularBiochemicals),0.1%N-十二酰肌氨酸,和0.02%SDS的5XSSC(1XSSC是0.15M NaCl加0.015M柠檬酸钠)中平衡的。加入探针(0.2pmol/ml)和Poly(A)(0.01mg/ml)后,58℃培养薄膜18.5小时。25℃用含有0.1%SDS的2XSSC洗涤薄膜2次(每次5分钟),58℃用含有0.1%SDS的0.5XSSC洗涤薄膜2次(每次15分钟)。按照供应商(Roche Molecular Biochemicals)的建议,利用比色检测观察信号。
为了在质粒pBR322中生产亚基因组文库,用HincII消化染色体DNA,并通过电泳分离。把2.5-到3.5-kb的HincII DNA片段连接到pBR322的EcoRV位点中,然后转化到大肠埃希氏菌SE2309中。通过比色检测,用简并寡核苷酸筛选菌落。通过该方法可分离出携带HincII片段的质粒pJAM400,其中所述HincII片段含有1,350bp的pdc基因(图3)。
λBlueSTAR载体系统(Novagen)用于建造其它亚基因组文库,从而促进从胃八叠球菌中分离全长pdc基因。用BclI消化基因组DNA,通过在0.8%琼脂糖中电泳分离,然后将6.5-到8.5-kb的片段与λBlueSTAR BamHI臂连接。噬菌体的体外包装和平板接种是按照供应商(Novagen)的方法进行的。DNA探针是使用来源于pJAM400pdc基因的一个800-bp EcoRI片段生产的,并已经用供应商(Roche MolecularBiochemicals)推荐的随机引物方法使用洋地黄毒苷-11-dUTP标记。利用比色检测筛选噬斑。Cre-loxP介导的亚克隆可通过平板接种具有表达Cre重组酶(Novagen)的大肠埃希氏菌BM25.8的λBlueSTAR噬菌体,而用于环化阳性噬斑的DNA。然后纯化环化的质粒pJAM410,并把它电穿孔到大肠埃希氏菌DH5α中。
为了产生pdc表达载体,在通过聚合酶链反应(PCR)从pJAM413(图3)扩增后,把promoterless pdc基因亚克隆到pET21d中。设计引物从而使用BspHI(寡核苷酸1)和XhoI(寡核苷酸2)限制位点定向插入。把所得片段连接到pET21d(Novagen)的适合NcoI和XhoI位点中,产生pJAM419(图3)。pdc基因的保真度是通过DNA测序加以证实的。
为了确定胃八叠球菌丙酮酸脱羧酶的操纵子,使用从胃八叠球菌纯化的PDC多肽的N-末端氨基酸序列(Lowe和Zeikus,1992)生产用于和基因组DNA杂交的简并寡核苷酸。该方法可促进从胃八叠球菌中分离7.0-kb的BclI基因组DNA片段。进一步亚克隆该片段,以便对与寡核苷酸探针杂交的3,886bp HincII-to-HincII区的两个链进行测序(图3)。DNA序列的分析揭示,1,656bp的可读框(ORF)编码具有与先前纯化的胃八叠球菌PDC相同的N-末端的多肽(图6)。因此把ORF命名为pdc。规范Shine-Dalgarno序列位于pdc翻译起始密码子的7bp上游。此外,pdc上游的82-110bp区与真细菌的-35和-10启动子共有序列的同一性有限。经预测,pdc翻译终止密码子的下游(43bp)区可形成茎环结构,然后是富含AT的区,与ρ-非依赖性转录终止子相一致。因此,胃八叠球菌pdc可被转录为像运动发酵单胞菌pdc基因那样的单顺反操纵子(Conway等,1987)。
部分ORF被鉴定为pdc的722bp上游,它编码一个177氨基酸的多肽片段(ORF1*)(图3)。ORF1*与很多假拟膜多肽(GenBank登记号CAC11620,CAC24018,CAA22902)具有同一性(28-29%),并被预测可形成很多跨膜结构域(没有给出数据)。经预测,编码ORF1*的基因不会从pdc操纵子的推定-35和-10启动子转录。
以上述研究为基础,确定了胃八叠球菌pdc基因可编码具有552个氨基酸(包括N-末端甲硫氨酸)的多肽,经计算其pI为5.16,无水分子量为61,737Da。胃八叠球菌序列的GenBank登记号为AF354297。
实施例4生产特异性结合PDC多肽的抗体的方法在这个实施例中,描述了生产丙酮酸脱羧酶的免疫特异性抗体的方法。
简单地说,通过SDS-PAGE分离纯化的重组巴氏醋杆菌PDC多肽(300μg)。在用考马斯蓝R-250染色前,切下含有PDC蛋白的凝胶片段。按照供应商(Cocalico Biologicals,Reamstown,Penn.)的建议,它可用作在兔中产生的多克隆抗体的抗原(抗-ApPDC)。为进行免疫印迹分析,通过SDS-PAGE分离蛋白,并于4℃20伏时,转移到含10%甲醇,pH 6.0的10mM MES中的PVDF薄膜中16小时。为了检测抗原,免疫印迹过程和比色检测使用标准技术。一级抗体,抗ApPDC是以1∶7,000的比例稀释的。使用上述方法,可鉴定特异性结合PDC多肽的多克隆抗血清。
如果需要,可从哺乳动物(例如,血液)中分离PDC的抗体分子,并利用本领域熟知的技术,如A蛋白层析进一步纯化,从而获得IgG部分。此外,在免疫后的适宜时间,例如,当抗-PDC抗体滴定度达到最高时,可从受试者获得产生抗体的细胞,并用于通过标准技术制备单克隆抗体,如Kohler和Milstein(1975)Nature 256495-497最初描述的杂交瘤技术;还可见,例如,使用抗体实验室手册,Harlow等,C.S.H.L.Press,Pub.(1999))。
实施例5鉴定不同宿主细胞中PDC基因的密码子使用的方法在这个实施例中,描述了以密码子使用为基础,鉴定适于改进表达的PDC多肽的方法。
细菌PDC可用于工程化各种生物体中的乙醇途径。然而,优选确定密码子使用的适合模式,从而确保在异源系统中功能性表达(4,14,16,22)。G+C含量的简单列表可作为初步指导。这4个pdc基因的G+C含量从巴氏醋杆菌的60%到胃八叠球菌的31%不等。大肠埃希氏菌ORF的平均G+C含量为52%,与运动发酵单胞菌pdc的(52%)相同,与棕榈发酵细菌pdc的(55%)相似。对于绝大多数氨基酸而言,这两种生物体的密码子使用模式彼此十分相似,而且与大肠埃希氏菌也十分相似。棕榈发酵细菌的pdc在重组大肠埃希氏菌中高水平功能性表达(活性大约为多肽的1/3)。运动发酵单胞菌的pdc和巴氏醋杆菌的pdc表达水平较低(活性为多肽的7-9%),胃八叠球菌的pdc在重组大肠埃希氏菌中的表达更低(活性低于多肽的0.3%)(45)。
为了产生更大量的功能性重组胃八叠球菌PDC,使用含有罕用密码子,如AGA(精氨酸),GGA(甘氨酸),AUA(异亮氨酸),和CUA(亮氨酸)的其它tRNA基因的修饰大肠埃希氏菌宿主证实对于高水平多肽的产生很重要(活性几乎为多肽的1/4)(45)。胃八叠球菌pdc中密码子使用的模式可特别用于G+C含量较低的革兰氏阳性菌中乙醇途径的基因工程改造,这一点可通过与胃八叠球菌ORF的比较举例说明(表1)。相反,巴氏醋杆菌的pdc可被选择用于工程化G+C含量较高的纤维素解质细菌,如Thermobifidia sp.(23)或纤维单胞菌(35)中的homoethanol途径。
表1.细菌pdc基因的密码子使用
pdc(*)和基因组DNA(+)的密码子使用以每千对碱基的频率表示。每个氨基酸的密码子使用百分比在圆括号中表示。不包括终止密码子。缩写词(GenBank登记号)Apa,巴氏醋杆菌pdc(AF368435);Zpa,棕榈发酵细菌pdc(AF474145);Zmo,运动发酵单胞菌(M15393);Sve,(AF354297);Eco,大肠埃希氏菌;Bsu,胃八叠球菌。
实施例6PDC活性的生化特性在这个实施例中,描述了若干代表性PDC多肽的生化特性。
四个代表性细菌FDC多肽的纯化是按照下面表2所述进行的。ZpaPDC是从棕榈发酵细菌和重组大肠埃希氏菌纯化至均一的。为了进行比较,其它三种细菌PDC是从重组大肠埃希氏菌纯化的。PDC还可从巴氏醋杆菌纯化。通常,‘天然’PDC的纯化还需要其它步骤(即,苯基琼脂糖和羟磷灰石层析)。这是因为与‘重组’细胞溶解产物相比,‘天然’PDC活性的水平要低10-到250-倍。所有PDC多肽都具有分子量55-60kDa的亚单位,这是由还原SDS-PAGE测定的,与根据推断多肽序列计算的分子量相一致。
从棕榈发酵细菌纯化的PDC的N-末端氨基酸序列(MYTVGMYLAE)与根据基因推断且含有N-末端甲硫氨酸的序列相同。先前的研究已经证实,从胃八叠球菌纯化的PDC也保留有N-末端甲硫氨酸,它是赖氨酸残基的氨基(28,45)。相反,从巴氏醋杆菌纯化的PDC的N-末端序列(TYTVGMYLAERL)则缺少N-末端甲硫氨酸,表明已经被天然甲硫氨酸氨肽酶裂解。经测定,从运动发酵单胞菌纯化的PDC也被裂解,显露出一个N-末端丝氨酸(34)。这些结果与P1’残基描述的甲硫氨酸氨肽酶的高度保守底物的特异性相一致(5)。如果第二个残基很小而且不带电荷,则仅仅除去N-末端甲硫氨酸。该底物的优先与多肽降解的‘N-末端规则’相反(47)。
还进行了PDC多肽四级结构的测定。甚至在除去辅因子TPP和Mg2+之后,ZmoPDC缔合为240kDa的四聚物(15)。同样,SvePDC和ZpaFDC也在辅因子解离后,缔合成240kDa的四聚物(没有给出数据)。有趣的是,ApaPDC可形成具有相似比活性的四聚物和八聚物(224和447kDa),并在提取辅因子后,解离成二聚物(120kDa)。在加入分别具有3.1μM和5.8μM半饱和常数及1.17-1.22Hill常数的Mg2+和TPP之后,可完全恢复ApaPDC脱辅酶的活性及四聚构型。所有四个细菌PDC的四聚构型都与绝大部分真核PDC的四级结构相一致。然而,在丝状真菌粗糙链孢霉的PDC中,已经观察到类似ApaPDC的高级结构,其缔合为8-10nm的均聚丝(1)。同样,在植物(玉蜀黍,豌豆,和小麦胚)中,PDC形成1MDa的复合物(24,27,32)。除去辅因子后,ApaPDC到二聚物的解离也与真核PDC相一致(25)。
表2.细菌PDC多肽的纯化
PDC-R,从重组大肠埃希氏菌纯化的PDC。SvePDC-R表示从大肠埃希氏菌Rosetta(DE3)(pRARE,pJAM419)纯化的多肽。在大肠埃希氏菌BL21-CodonPlus-RIL(pJAM419)的细胞溶解产物中没有检测到SvePDC-R的活性。圆括号表示最后的纯化步骤。Q-琼脂糖凝胶和Superdex 200是所有细菌PDC共同的纯化步骤。
实施例7PDC热稳定性的描述在这个实施例中,描述了若干代表性PDC多肽的热稳定性。
人们已经观察到,在有辅因子(TPP和Mg2+)存在的条件下,把细胞溶解产物加热至60℃后,ZmoPDC是热稳定的(11)。为了进一步描述这种现象,在有饱和辅因子存在时,在暴露于各种温度下之后,分析纯化细菌PDC的活性(图7)。所有三个革兰氏阴性菌的PDC都是相对热稳定的,并在加热至60℃30分钟后,仍然保留有60-100%的活性。相反,在暴露于50℃或更高的温度下后,纯化的SvePDC完全灭活。虽然氨基酸组成不能被用作热稳定性的通用指标(30,31,48),但还是可以观察到三个热稳定的PDC都含有较高水平的丙氨酸和半胱氨酸,以及较低水平的苯丙氨酸。这些改变与基于同源酶组成比对的热稳定性的增加相一致(2,31)。丙氨酸水平的增加可通过促进螺旋及更紧密多肽核心的形成而使革兰氏阴性菌的PDC多肽稳定在较高温度。因此,本发明还包括已经被改变表达PDC多肽的pdc基因,所述PDC多肽含有相应的半胱氨酸和/或丙氨酸改变,从而获得热稳定性的改进。此外,对革兰氏阴性菌的热稳定性PDC的分析揭示,与室温相比,当在60℃的温度最优值进行测定时,活性增加了2.5倍。以阿仑尼乌斯图为基础,经测定,这些酶具有12.6-14.2kJmol-1的活化焓及-92.8到-98.2Jmol-1K-1的熵。
实施例8PDC底物亲和性及pH最优值的表征在这个实施例中,描述了若干代表性PDC多肽的底物亲和性及pH最优值。
具体而言,在细菌PDC多肽中观察到了pH最优值的显著性差异。ZpaPDC在pH 5.5-6.0时活性最高(图8),与pH最优值为6.0的ZmoPDC相似(34)。然而,ApaPDC的pH最优值明显比其它两个革兰氏阴性菌PDC的更低,为5.0-5.5(图8)。革兰氏阳性菌SvePDC的pH最优值(pH 6.3-7.6)比革兰氏阴性菌PDC的范围更宽,而且更偏中性(28)。这表明,在活性位点处或附近,带电残基的构象和/或组成有所不同。
真核及细菌SvePDC在有底物丙酮酸存在的条件下,显示出肯定的协同动力学(9,25,28)。然而,ZpaPDC和ApaPDC则显示出对丙酮酸的0.2-0.4mM Km值的标准米-曼动力学,和20,500-30,500分-1的Kcat值(pH最优值,25℃)(表3)。关于丙酮酸缺少别构调节,是在革兰氏阴性菌PDC酶中观察到的,与运动发酵单胞菌的高水平相关PDC建立的相似(7,34)。作为进一步的比对,在pH最优值和pH7.0下测定所有四种细菌PDC多肽的动力学常数(表3)。该方法被选择用来分析细菌PDC酶,从而更准确反映先前用于高水平乙醇生产的重组宿主的中性细胞溶胶(例如,大肠埃希氏菌,欧文氏杆菌)。这些适当的pH改变对所有四种细菌PDC多肽的反应最大速率只有轻微的影响。相反,pH可显著影响革兰氏阴性菌PDC对丙酮酸的亲和性。最显著的是,当ApaPDC从其pH最优值转换到中性条件下时,观察到Km增加了13倍。
表3.重组细菌PDC酶的动力学参数
缩写词N,标准米-曼动力学;S,S形动力学。SvePDC是从大肠埃希氏菌Rosetta(DE3)(pRARE,pJAM419)纯化的。
这些结果表明,所有三种革兰氏阴性菌PDC具有的氨基酸残基都可使酶在质子化(pH最优值)时,比在去质子化(中性pH)时更有效地结合丙酮酸。然而,该残基的质子化状态不会影响脱羧作用从头到尾的速率。因为革兰氏阴性菌PDC的Km改变是在pH 5-7之间观察到的,因此对于所有三种酶而言,很可能调节底物结合的残基是组氨酸。游离组氨酸的pKa为6.04;而,丙酮酸和其它离子化氨基酸残基(即,Asp,Glu,Lys,和Arg)的pKa不落在此pH范围之内。
一个或多个组氨酸的质子化对于通过与丙酮酸的羧基形成离子对,或通过制造更多底物接近的活性位点来促进底物结合而言非常重要。也有可能是不同的残基涉及调节底物结合;然而,其pKa是通过多肽环境改变的。
相对于运动发酵单胞菌的PDC酶而言,pH对kcat/Km和对kcat的作用是用滴定曲线确定的,滴定曲线的pKa值是相对于调节底物结合的残基,在6.23-6.45评估的(21,43)。His113的去质子化可导致构象改变,从而产生在催化过程中遮蔽活性位点的可弯曲环(残基105-112)(43)。His113和His114在已经描述过的所有PDC多肽中都是保守的。因此,对于在所有三种革兰氏阴性菌PDC中观察到的Km的pH-依赖性改变而言,His113是合理的侯选物。然而,可将具有伸进运动发酵单胞菌PDC活性位点中的离子化侧链的5个重要残基(Asp27,Glu50,His113,His114,和Glu473)改变成非离子化或具有改变pKa值的残基(21)。kcat/Km的pH-依赖性相对不受这些改变的影响,表明与这些残基,包括His113无关。重要地是,在这种相同的研究中,把His113改变成具有明显更高pKa值的残基(即,Arg和Lys)可使ZmoPDC对丙酮酸的亲和性增加20倍。
这些结果表明,His113带正电的形式保存有对底物结合开放的活性位点。
实施例9来源于不同生物体的PDC基因的序列比对在这个实施例中,比较了来源于不同生物体的丙酮酸脱羧酶(PDC)的氨基酸序列。
棕榈发酵细菌的推断PDC多肽(ZpaPDC)含有556个氨基酸(包括N-末端甲硫氨酸),无水分子量为60,113Da。它与其它三个细菌PDC相似,它们含有552-568个氨基酸,无水分子量为59,830-61,809Da。经计算,ZpaPDC的pI为4.93,与实验测定的运动发酵单胞菌PDC的pI(4.87-5.3)相似(7,33)。ZpaPDC中相对较高的丙氨酸含量(13.1%)与革兰氏阴性菌运动发酵单胞菌和巴氏醋杆菌PDC(Zmo和ApaPDC)的相似,但几乎比革兰氏阳性菌胃八叠球菌PDC(SvePDC)(6.9%)高2倍。多个氨基酸序列的序列比对(图9)和树状聚簇的分析揭示,ZpaPDC与ApaPDC最相关(72%的同一性),与ZmoPDC高度相关(62%的同一性)。所有三种革兰氏阴性菌PDC的序列都与植物PDC的序列相似(例如,玉米的PDC;39-40%的同一性)。
相反,革兰氏阳性菌SvePDC与革兰氏阴性菌的PDC仅仅30-31%相同,可与绝大部分丝状真菌和酵母的PDC替换(例如,啤酒糖酵母的PDC1;38%相同)。所有四种细菌PDC都缺少植物界PDC共有的N-末端延伸。以运动发酵单胞菌和酵母PDC的晶体结构为基础,涉及TPP和Mg2+结合的残基在所有四种细菌PDC中都是保守的。相反,以结合丙酮酸类似物丙酮酰胺为基础(29),涉及底物活化的酵母PDC1的残基(Tyr157和Arg224)仅在细菌SvePDC中是保守的,在其余三种细菌PDC中则没有找到。
把推断巴氏醋杆菌PDC的氨基酸序列与运动发酵单胞菌和酵母的PDC序列(PDC1)进行比较,两者都是通过X-射线晶体照相术分析的(Dyda等,1993;Arjunan等,1996;Lu等,2000;Dobritzsch等,1998),还有玉米(图9)。多个序列比对揭示,巴氏醋杆菌的PDC与运动发酵单胞菌的PDC最相似(62%的同一性和74%的相似性)。与其它植物PDC共有的,玉米PDC的N-末端延伸在真菌或细菌PDC多肽,包括巴氏醋杆菌的PDC多肽中都没有找到。经证实位于酵母和运动发酵单胞菌PDC酶的0.4nm TPP和Mg2+结合位点内的残基在巴氏醋杆菌的PDC多肽序列(V24,D27,E50,T72,V75,N82,H113,H114,T384,D386,G408,I410,D435,S437,L440,I460,N462,G464,I467,E468)中是高度保守的。此外,由Hawkins等(1989)在TPP-依赖性酶中鉴定的,涉及Mg2+和TPP结合的花边序列在巴氏醋杆菌的PDC多肽序列(G435-N462)中也是保守的。涉及别构调节,且被证实可结合丙酮酸类似物丙酮酰胺(Lu等,2000)的酵母PDC1的残基(Tyr157和R224)在巴氏醋杆菌,运动发酵单胞菌,或玉米的PDC多肽中不是保守的。这些残基的替换被限制在绝大部分真菌的PDC和来源于革兰氏阳性菌胃八叠球菌的相关PDC多肽,这些PDC多肽是底物活化的(Lowe和Zeikus,1992)。以在醋酸菌细胞溶解产物中观察到的,从丙酮酸生产CO2的动力学为基础(King和Cheldelin,1953),推断巴氏醋杆菌的PDC多肽与运动发酵单胞菌的PDC相似,不是底物活化的。然而,植物PDC不含这些保守残基,但可由底物调节,表明PDC多肽之间的别构调节机理存在着某些不同之处。
以PDC多肽的聚簇分析为基础,巴氏醋杆菌的PDC与运动发酵单胞菌的PDC最相关。这一点与这两种细菌作为革兰氏阴性α-蛋白细菌的分类相一致。与G+C含量较低的革兰氏阳性菌胃八叠球菌的PDC形成对照,其中胃八叠球菌的PDC与绝大部分真菌PDC共有近似的进化根,来源于α-蛋白细菌的PDC多肽与植物更相关,而且是一对外类群真菌PDC。
等同物本领域那些技术人员仅仅使用常规实验就可认识到,或能够确定这里所述的本发明具体实施方案的很多等同物。这种等同物将包括在下列权利要求内。此外,美国专利号5,821,093;5,482,846;5,424,202;5,028,539;5,000,000;5,487,989;5,554,520,和5,162,516中描述的任意数量的遗传构建体,宿主细胞,和方法都可用于进行本发明,这些专利引入此处作为参考。
引用的文献1.Alvarez,M.E.,A.L.Rosa,E.D.Temporini,A.Wolstenholme,G.Panzetta,L.Pattrito,and H.J.Maccioni.1993.The 59-kDa polypeptide constituent of 8-10-nm-cytoplasmic filaments in Neurospora crassa is a pyruvate decarboxylase.Gene130253-258.
2.Argos,P.,M.G.Rossman,U.M.Grau,H.Zuber,G.Frank,and J.D.Tratschin.1979.Thermal stability and polypeptide structure.Biochemistry 185698-5703.
3.Atkinson,D.E.1956.Hydrogen metabolism in Acetobacter peroxydans.J.Bacteriol.72189-194.
4.Barbosa,M.F.S.and L.O.Ingram.1994.Expression of the Zymomonas mobilisalcohol dehydrogenase II(adhB)and pyruvate decarboxylase(pdc)genes inBacillus.Curr.Microbiol.28279-282.
5.Bradshaw,R.A.,W.W.Brickey,and K.W.Walker.1998.N-terminal processingthe methionine aminopeptidase and Nα-acetyl transferase families.TrendsBiochem.Sci.23263-267.
6.Braü,B.and H.Sahm.1986.Cloning and expression of the structural gene forpyruvate decarboxylase of Zymomonas mobilis in Escherichia coli.Arch.Microbiol.144296-301.
7.Bringer-Meyer,S.,K.-L.Schimz,and H.Sahm.1986.Pyruvate decarboxylasefrom Zymomonas mobilis.Isolation and partial characterization.Arch.Microbiol.146105-110.
8.Bucher,M.,R.Braendle,and C.Kuhlemeier.1994.Ethanolic fermentation intransgenic tobacco expressing Zymomonas mobilis pyruvate decarboxylase.EMBO J.132755-2763.
9.Candy,J.M.and R.G.Duggleby.1998.Structure and properties of pyruvatedecarboxylase and site-directed mutagenesis of the Zymomonas mobilis enzyme.Biochim.Biophys.Acta 1385323-338.
10.Candy,J.M.,R.G.Duggleby,and J.S.Mattick.1991.Expression of active yeastpyruvate decarboxylase in Escherichia coli.J.Gen.Microbiol.1372811-2815.
11.Conway,T.,Y.A.Osman,J.I.Konnan,E.M.Hoffmann,and L.O.Ingram.1987.Promoter and nucleotide sequences of the Zymomonas mobilis pyruvatedecarboxylase.J.Bacteriol.169949-954.
12.Corpet,F.1988.Multiple sequence alignment with hierarchical clustering.NucleicAcids Res.1610881-10890.
13.DeLey,J.1958.Studies on the metabolism of Acetobacter peroxydans.Part I.General properties and taxonomic position of the species.Antonie VanLeeuwenhoek J.Microbiol.Serol.24281-297.
14.Deng,M.D.and J.R.Coleman.1999.Ethanol synthesis by genetic engineering incyanobacteria.Appl.Environ.Microbiol.65523-528.
15.Diefenbach,R.J.and R.G.Duggleby.1991.Pyruvate decarboxylase fromZymomonas mobilis.Structure and re-activation of apoenzyme by the cofactorsthiamin diphosphate and magnesium ion.Biochem.J.276439-445.
16.Gold,R.S.,M.M.Meagher,S.Tong,R.W.Hutkins,and T.Conway.1996.Cloning and expression of the Zymomonas mobilis″production of ethanol″genesin Lactobacillus casei.Curr.Microbiol.33256-260.
17.Harwood,C.R.and S.M.Cutting.1990.In Molecular Biological Methods forBacillus.Wiley,New York.
18.Hénaut,A.and A.Danchin.1996.Analysis and predictions from Escherichia colisequences,or E.coli in silico,p.2047-2066.In F.C.Neidhardt and et al.(eds.),Escherichia coli and Salmonella Cellular and Molecular Biology.ASM Press,Washington,DC.
19.Hoppner,T.C.and H.W.Doelle.1983.Purification and kinetic characteristics ofpyruvate decarboxylase and ethanol dehydrogenase from Zymomonas mobilis inrelation to ethanol production.Eur.J.Appl.Microbiol.Biotechnol.17152-157.
20.Horn,S.J.,I.M.Aasen,and K.stgaard.2000.Production of ethanol frommannitol by Zymobacter palmae.J.Indust.Microbiol.Biotech.2451-57.
21.Huang,C.Y.,A.K.Chang,P.F.Nixon,and R.G.Duggleby.2001.Site-directedmutagenesis of the ionizable groups in the active site of Zymomonas mobilispyruvate decarboxylaseeffect on activity and pH dependence.Eur.J.Biochem.2683558-3565.
22.Ingram,L.O.,H.C.Aldrich,A.C.Borges,T.B.Causey,A.Martinez,F.Morales,A.Saleh,S.A.Underwood,L.P.Yomano,S.W.York,J.Zaldivar,and S.Zhou.1999.Enteric bacterial catalysts for fuel ethanol production.Biotechnol.Prog.15855-866.
23.Irwin,D.C.,S.Zhang,and D.B.Wilson.2000.Cloning,expression andcharacterization of a Family 48 exocellulase,Cel48A,from Thermobifida fusca.Eur.J.Biochem.2674988-4997.
24.Kenworthy,P.and D.D.Davies.1976.Kinetic aspects of regulation of pyruvicdecarboxylase.Phytochemistry 15279-282.
25.Knig,S.1998.Subunit structure,function and organisation of pyruvatedecarboxylases from various organisms.Biochim.Biophys.Acta 1385271-286.
26.Laemmli,U.K.1970.Cleavage of structural polypeptides during the assembly ofthe head of bacteriophage T4.Nature 227680-685.
27.Lee,T.C.and P.J.Langston-Unkefer.1985.Pyruvate decarboxylase from Zeamays L.I.Purification and partial characterization from mature kernals andanaerobically treated roots.Plant Physiol.79242-247.
28.Lowe,S.E.and J.G.Zeikus.1992.Purification and characterization of pyruvatedecarboxylase from Sarcina ventriculi.J.Gen.Microbiol.138803-807.
29.Lu,G.,D.Dobritzsch,S.Baumann,G.Schneider,and S.Knig.2000.Thestructural basis of substrate activation in yeast pyruvate decarboxylase.Acrystallographic and kinetic study.Eur.J.Biochem.267861-868.
30.Matthews,B.W.1993.Structural and genetic analysis of polypeptide stability.Annu.Rev.Biochem.62139-160.
31.Mozhaev,V.V.and K.Martinek.1984.Structure-stability relationships inpolypeptidesnew approaches to stabilizing enzymes.Enzyme Microb.Technol.650-59.
32.Mücke,U.,S.Knig,and G.Hübner.1995.Purification and characterisation ofpyruvate decarboxylase from pea seeds(Pisum sativum cv.Miko).Biol.Chem.Hoppe Seyler 376111-117.
33.Neale,A.D.,R.K.Scopes,R.E.Wettenhall,and N.J.Hoogenraad.1987.Nucleotide sequence of the pyruvate decarboxylase gene from Zymomonasmobilis.Nucleic Acids Res.151753-1761.
34.Neale,A.D.,R.K.Scopes,R.E.Wettenhall,and N.J.Hoogenraad.1987.Pyruvate decarboxylase of Zymomonas mobilisisolation,properties,and geneticexpression in Escherichia coli.J.Bacteriol.1691024-1028.
35.Notenboom,V.,C.Birsan,R.A.Warren,S.G.Withers,and D.R.Rose.1998.Exploring the cellulose/xylan specificity of the beta-1,4-glycanase cex fromCellulomonas fimi through crystallography and mutation.Biochemistry 374751-4758.
36.Okamoto,T.,H.Taguchi,K.Nakamura,and H.Ikenaga.1994.Production ofethanol from maltose by Zymobacter palmae fermentation.Biosci.Biotechnol.Biochem.581328-1329.
37.Okamoto,T.,H.Taguchi,K.Nakamura,H.Ikenaga,H.Kuraishi,and K.Yamasato.1993.Zymobacter palmae gen.nov.,sp.nov.,a new ethanol-fermentingperitrichous bacterium isolated from palm sap.Arch.Microbiol.160333-337.
38.Or,E.,J.Baybik,A.Sadka,and A.Ogrodovitch.2000.Fermentative metabolismin grape berriesisolation and characterization of pyruvate decarboxylase cDNAand aralysis of its expression throughout berry development.Plant Sci.156151-158.
39.Page,R.D.1996.TreeViewan application to display phylogenetic trees onpersonal computers.Comput.Appl.Biosci.12357-358.
40.Raj,K.C.,L.O.Ingram,and J.A.Maupin-Furlow.2001.Pyruvate deccarboxylasea key enzyme for the oxidative metabolism of lactic acid by Acetobacterpasteurianus.Arch.Microbiol.176443-451.
41.Reid,M.F.and C.A.Fewson.1994.Molecular characterization of microbialalcohol dehydrogenases.Crit Rev.Microbiol.2013-56.
42.Sanger,F.,S.Nicklen,and A.R.Coulson.1977.DNA sequencing with chain-terminating inhibitors.Proc.Natl.Acad.Sci.U.S.A.745463-5467.
43.Schenk,G.,F.J.Leeper,R.England,P.F.Nixon,and R.G.Duggleby.1997.Therole of His113 and His114 in pyruvate decarboxylase from Zymomonas mobilis.Eur.J.Biochem.24863-71.
44.Tadege,M.,R.Brandle,and C.Kuhlemeier.1998.Anoxia tolerance in tobaccorootseffect of overexpression of pyruvate decarboxylase.Plant J.14327-335.
45.Talarico,L.A.,L.O.Ingram,and J.A.Maupin-Furlow.2001.Production of theGram-positive Sarcina ventriculi pyruvate decarboxylase in Escherichia coli.Microbiology 1472425-2435.
46.Thompson,J.D.,D.G.Higgins,and T.J.Gibson.1994.CLUSTAIL Wimprovingthe sensitivity of progressive multiple sequence alignment through sequenceweighting,position-specific gap penalties and weight matrix choice.Nucleic AcidsRes.224673-4680.
47.Tobias,J.W.,T.E.Shrader,G.Rocap,and A.Varshavsky.1991.The N-end rulein bacteria Science 2541374-1377.
48.Vieille,C.and G.J.Zeikus.2001.Hyperthermophilic enzymessources,uses,andmolecular mechanisms for thermostability.Microbiol.Mol.Biol.Rev.651-43.
序列表<110>佛罗里达大学等<120>来源于细菌的丙酮酸脱羧酶(PDC)基因的克隆和测序及其用途<130>BCI-029CPPC<150>60/288,638<151>2001-05-04<150>60/288,671<151>2001-05-04<150>60/288,698<151>2001-05-04<150>60/288,622<151>2001-05-04<150>60/288,699<151>2001-05-04<160>11<170>FastSEQ for Windows Version 4.0<210>1<211>1671<212>DNA<213>棕榈发酵细菌(Zymobacter palmae)<400>1atgtataccg ttggtatgta cttggcagaa cgcctagccc agatcggcct gaaacaccac 60tttgccgtgg ccggtgacta caacctggtg ttgcttgatc agctcctgct gaacaaagac 120atggagcagg tctactgctg taacgaactt aactgcggct ttagcgccga aggttacgct 180cgtgcacgtg gtgccgccgc tgccatcgtc acgttcagcg taggtgctat ctctgcaatg 240aacgccatcg gtggcgccta tgcagaaaac ctgccggtca tcctgatctc tggctcaccg 300aacaccaatg actacggcac aggccacatc ctgcaccaca ccattggtac tactgactat 360aactatcagc tggaaatggt aaaacacgtt acctgcgcac gtgaaagcat cgtttctgcc 420gaagaagcac cggcaaaaat cgaccacgtc atccgtacgg ctctacgtga acgcaaaccg 480gcttatctgg aaatcgcatg caacgtcgct ggcgctgaat gtgttcgtcc gggcccgatc 540aatagcctgc tgcgtgaact cgaagttgac cagaccagtg tcactgccgc tgtagatgcc 600gccgtagaat ggctgcagga ccgccagaac gtcgtcatgc tggtcggtag caaactgcgt 660gccgctgccg ctgaaaaaca ggctgttgcc ctagcggacc gcctgggctg cgctgtcacg 720atcatggctg ccgaaaaagg cttcttcccg gaagatcatc cgaacttccg cggcctgtac 780tggggtgaag tcagctccga aggtgcacag gaactggttg aaaacgccga tgccatcctg 840
tgtctggcac cggtattcaa cgactatgct accgttggct ggaactcctg gccgaaaggc 900gacaatgtca tggtcatgga caccgaccgc gtcactttcg caggacagtc cttcgaaggt 960ctgtcattga gcaccttcgc cgcagcactg gctgagaaag caccttctcg cccggcaacg 1020actcaaggca ctcaagcacc ggtactgggt attgaggccg cagagcccaa tgcaccgctg 1080cccaatgacg aaatgacgcg tcagatccag tcgctgatca cttccgacac tactctgaca 1140gcagaaacag gtgactcttg gttcaacgct tctcgcatgc cgattcctgg cggtgctcgt 1200gtcgaactgg aaatgcaatg gggtcatatc ggttggtccg taccttctgc attcggtaac 1260gccgttggtt ctccggagcg tcgccacatc atgatggtcg gtgatggctc tttccagctg 1320actgctcaag aagttgctca gatgatccgc tatgaaatcc cggtcatcat cttcctgatc 1380aacaaccgcg gttacgtcat cgaaatcgct atccatgacg gcccttacaa ctacatcaaa 1440aactggaact acgctggcct gatcgacgtc ttcaatgacg aagatggtca tggcctgggt 1500ctgaaagctt ctactggtgc agaactagaa ggcgctatca agaaagcact cgacaatcgt 1560cgcggtccga cgctgatcga atgtaacatc gctcaggacg actgcactga aaccctgatt 1620gettggggta aacgtgtagc agctaccaac tctcgcaaac cacaagcgta a 1671<210>2<211>556<212>PRT<213>棕榈发酵细菌<400>2Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly1 5 10 15Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu20 25 30Asp Glu Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn35 40 45Gln Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly50 55 60Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met65 70 75 80Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile85 90 95Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His100 105 110His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys115 120 125His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro130 135 140Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro145 150 155 160Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg165 170 175Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr180 185 190Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg195 200 205
Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala210 215 220Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr225 230 235 240Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe245 250 255Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu260 265 270Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp275 280 285Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met290 295 300Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly305 310 315 320Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser325 330 335Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu340 345 350Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln355 360 365Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly370 375 380Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg385 390 395 400Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met420 425 430Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met435 440 445Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly450 455 460Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly485 490 495His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala500 505 510Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys515 520 525Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys530 535 540Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala545 550 555<210>3<211>1674
<212>DNA<213>巴氏醋杆菌(Acetobacter pasteurianus)<400>3gtgacctata ctgttggcat gtatcttgca gaacgccttg tacagatcgg gctgaagcat 60cacttcgccg tgggcggcga ctacaatctc gttcttctgg atcagttgct cctcaacaag 120gacatgaaac agatctattg ctgcaatgag ttgaactgtg gcttcagcgc ggaaggctac 180gcccgttcta acggggctgc ggcagcggtt gtcaccttca gcgttggcgc catttccgcc 240atgaacgccc tcggcggcgc ctatgccgaa aacctgccgg ttatcctgat ttccggcgcg 300cccaacagca atgatcaggg cacaggtcat atcctgcatc acacaatcgg caagacggat 360tacagctacc agcttgaaat ggcccgtcag gtcacctgtg ccgccgaaag cattaccgac 420gctcactccg ccccggccaa gattgaccac gtcattcgca cggcgctgcg cgagcgtaag 480ccggcctatc tggacatcgc gtgcaacatt gcctccgagc cctgcgtgcg gcctggccct 540gtcagcagcc tgctgtccga gcctgaaatc gaccacacga gcctgaaggc cgcagtggac 600gccacggttg ccttgctgaa aaatcggcca gcccccgtca tgctgctggg cagcaagctg 660cgggccgcca acgcactggc cgcaaccgaa acgctggcag acaagctgca atgcgcggtg 720accatcatgg cggccgcgaa aggctttttc cccgaagacc acgcgggttt ccgcggcctg 780tactggggcg aagtctcgaa ccccggcgtg caggaactgg tggagacctc cgacgcactg 840ctgtgcatcg cccccgtatt caacgactat tcaacagtcg gctggtcggg catgcccaag 900ggccccaatg tgattctggc tgagcccgac cgcgtaacgg tcgatggccg cgcctatgac 960ggctttaccc tgcgcgcctt cctgcaggct ctggcggaaa aagcccccgc gcgcccggcc 1020tccgcacaga aaagcagcgt cccgacgtgc tcgctcaccg cgacatccga tgaagccggt 1080ctgacgaatg acgaaatcgt ccgtcatatc aacgccctgc tgacatcaaa cacgacgctg 1140gtggcagaaa ccggcgattc atggttcaat gccatgcgca tgaccctggc cggtgcgcgc 1200gtggaactgg aaatgcagtg gggccatatc ggctggtccg tgccctccgc gttcggcaat 1260gccatgggct cgcaggaccg ccagcatgtg gtgatggtag gcgatggctc cttccagctt 1320accgcgcagg aagtggctca gatggtgcgc tacgaactgc ccgtcattat ctttctgatc 1380aacaaccgtg gctatgtcat tgaaatcgcc attcatgacg gcccgtacaa ctatatcaag 1440aactgggatt acgccggcct gatggaagtc ttcaacgccg gagaaggcca tggacttggc 1500ctgaaagcca ccaccccgaa ggaactgaca gaagccatcg ccagggcaaa agccaatacc 1560cgcggcccga cgctgatcga atgccagatc gaccgcacgg actgcacgga tatgctggtt 1620caatggggcc gcaaggttgc ctcaaccaac gcgcgcaaga ccactctggc ctga 1674<210>4<211>557<212>PRT<213>巴氏醋杆菌<400>4Met Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu20 25 30Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys35 40 45Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn50 55 60
Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala65 70 75 80Met Asu Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu100 105 110His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala115 120 125Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala130 135 140Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys145 150 155 160Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val165 170 175Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His180 185 190Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn195 200 205Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn210 215 220Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val225 230 235 240Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly245 250 255Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu260 265 270Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn275 280 285Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val290 295 300Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp305 310 315 320Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro325 330 335Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu340 345 350Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg355 360 365His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr370 375 380Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg385 390 395 400Val Glu Leu Gln Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met420 425 430Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly450 455 460Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly485 490 495His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala500 505 510Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys515 520 525Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg530 535 540Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala545 550 555<210>5<211>1659<212>DNA<213>胃八叠球菌(Sarcina ventriculi)<400>5atgaaaataa caattgcaga atacttatta aaaagattaa aagaagtaaa tgtagagcat 60atgtttggag ttcctggaga ttataactta ggatttttag attatgttga agattctaaa 120gatattgaat gggttggaag ctgtaatgaa cttaatgcag gatatgcagc agatggatat 180gcaagactta gaggatttgg tgtaatactt acaacttatg gagttggttc acttagtgca 240ataaatgcta caacaggttc atttgcagaa aatgttccag tattacatat atcaggtgta 300ccatcagctt tagttcaaca aaacagaaag ctagttcacc attcaactgc tagaggagaa 360ttcgacactt ttgaaagaat gtttagagaa ataacagaat ttcaatcaat cataagcgaa 420tataatgcag ctgaagaaat cgatagagtt atagaatcaa tatataaata tcaattacca 480ggttatatag aattaccagt tgatatagtt tcaaaagaaa tagaaatcga cgaaatgaaa 540ccgctaaact taactatgag aagcaacgag aaaactttag agaaattcgt aaatgatgta 600aaagaaatgg ttgcaagctc aaaaggacaa catattttag ctgattatga agtattaaga 660gctaaagctg aaaaagaatt agaaggattt ataaatgaag caaaaatccc agtaaacact 720ttaagtatag gaaagacagc agtatcagaa agcaatccat actttgctgg attattctca 780ggagaaacta gttcagattt agttaaagaa ctttgcaaag cttctgatat agttttacta 840tttggagtta aattcataga tactacaaca gctggattta gatatataaa taaagatgtt 900aaaatgatag aaattggttt aactgattgt agaattggag aaactattta tactggactt 960tacattaaag atgttataaa agctttaaca gatgctaaaa taaaattcca taacgatgta 1020aaagtagaaa gagaagcagt agaaaaattt gttccaacag atgctaaatt aactcaagat 1080agatatttca aacaaatgga agcgttctta aaacctaatg atgtattagt tggtgaaaca 1140ggaacatcat atagtggagc atgtaatatg agattcccag aaggatcaag ctttgtaggt 1200caaggatctt ggatgtcaat tggatatgct actcctgcag ttttaggaac tcatttagct 1260gataagagca gaagaaacat tcttttaagt ggtgatggtt cattccaatt aacagttcaa 1320aaagtttcaa caatgataag acaaaaatta aatacagtat tatttgtagt taacaatgat 1380ggatatacaa ttgaaagatt aatccacgga cctgaaagag aatataacca tattcaaatg 1440tggcaatatg cagaacttgt aaaaacatta gctactgaaa gagatataca accaacttgt 1500
ttcaaagtta caactgaaaa agaattagca gctgcaatgg aagaaataaa caaaggaaca 1560gaaggtattg cttttgttga agtagtaatg gataaaatgg atgctccaaa atcattaaga 1620caagaagcaa gtctatttag ttctcaaaat aactactaa1659<210>6<211>552<212>PRT<213>胃八叠球菌<400>6Met Lys Ile Thr Ile Ala Glu Tyr Leu Leu Lys Arg Leu Lys Glu Val1 5 10 15Asn Val Glu His Met Phe Gly Val Pro Gly Asp Tyr Asn Leu Gly Phe20 25 30Leu Asp Tyr Val Glu Asp Ser Lys Asp Ile Glu Trp Val Gly Ser Cys35 40 45Asn Glu Leu Asn Ala Gly Tyr Ala Ala Asp Gly Tyr Ala Arg Leu Arg50 55 60Gly Phe Gly Val Ile Leu Thr Thr Tyr Gly Val Gly Ser Leu Ser Ala65 70 75 80Ile Asn Ala Thr Thr Gly Ser Phe Ala Glu Asn Val Pro Val Leu His85 90 95Ile Ser Gly Val Pro Ser Ala Leu Val Gln Gln Asn Arg Lys Leu Val100 105 110His His Ser Thr Ala Arg Gly Glu Phe Asp Thr Phe Glu Arg Met Phe115 120 125Arg Glu Ile Thr Glu Phe Gln Ser Ile Ile Ser Glu Tyr Asn Ala Ala130 135 140Glu Glu Ile Asp Arg Val Ile Glu Ser Ile Tyr Lys Tyr Gln Leu Pro145 150 155 160Gly Tyr Ile Glu Leu Pro Val Asp Ile Val Ser Lys Glu Ile Glu Ile165 170 175Asp Glu Met Lys Pro Leu Asn Leu Thr Met Arg Ser Asn Glu Lys Thr180 185 190Leu Glu Lys Phe Val Asn Asp Val Lys Glu Met Val Ala Ser Ser Lys195 200 205Gly Gln His Ile Leu Ala Asp Tyr Glu Val Leu Arg Ala Lys Ala Glu210 215 220Lys Gln Leu Glu Gly Phe Ile Asn Glu Ala Lys Ile Pro Val Asn Thr225 230 235 240Leu Ser Ile Gly Lys Thr Ala Val Ser Glu Ser Asn Pro Tyr Phe Ala245 250 255Gly Leu Phe Ser Gly Glu Thr Ser Ser Asp Leu Val Lys Glu Leu Cys260 265 270Lys Ala Ser Asp Ile Val Leu Leu Phe Gly Val Lys Phe Ile Asp Thr275 280 285Thr Thr Ala Gly Phe Arg Tyr Ile Asn Lys Asp Val Lys Met Ile Glu
290 295 300Ile Gly Leu Thr Asp Cys Arg Ile Gly Glu Thr Ile Tyr Thr Gly Leu305 310 315 320Tyr Ile Lys Asp Val Ile Lys Ala Leu Thr Asp Ala Lys Ile Lys Phe325 330 335His Asn Asp Val Lys Val Glu Arg Glu Ala Val Glu Lys Phe Val Pro340 345 350Thr Asp Ala Lys Leu Thr Gln Asp Arg Tyr Phe Lys Gln Met Glu Ala355 360 365Phe Leu Lys Pro Asn Asp Val Leu Val Gly Glu Thr Gly Thr Ser Tyr370 375 380Ser Gly Ala Cys Asn Met Arg Phe Pro Glu Gly Ser Ser Phe Val Gly385 390 395 400Gln Gly Ser Trp Met Ser Ile Gly Tyr Ala Thr Pro Ala Val Leu Gly405 410 415Thr His Leu Ala Asp Lys Ser Arg Arg Asn Ile Leu Leu Ser Gly Asp420 425 430Gly Ser Phe Gln Leu Thr Val Gln Glu Val Ser Thr Met Ile Arg Gln435 440 445Lys Leu Asn Thr Val Leu Phe Val Val Asn Asn Asp Gly Tyr Thr Ile450 455 460Glu Arg Leu Ile His Gly Pro Glu Arg Glu Tyr Asn His Ile Gln Met465 470 475 480Trp Gln Tyr Ala Glu Leu Val Lys Thr Leu Ala Thr Glu Arg Asp Ile485 490 495Gln Pro Thr Cys Phe Lys Val Thr Thr Glu Lys Glu Leu Ala Ala Ala500 505 510Met Glu Glu Ile Asn Lys Gly Thr Glu Gly Ile Ala Phe Val Glu Val515 520 525Val Met Asp Lys Met Asp Ala Pro Lys Ser Leu Arg Gln Glu Ala Ser530 535 540Leu Phe Ser Ser Gln Asn Asn Tyr545 550<210>7<211>1707<212>DNA<213>运动发酵单孢菌(Zymomonas mobilis)<400>7atgagttata ctgtcggtac ctatttagcg gagcggcttg tccagattgg tctcaagcat 60cacttcgcag tcgcgggcga ctacaacctc gtccttcttg acaacctgct tttgaacaaa 120aacatggagc aggtttattg ctgtaacgaa ctgaactgcg gtttcagtgc agaaggttat 180gctcgtgcca aaggcgcagc agcagccgtc gttacctaca gcgtcggtgc gctttccgca 240tttgatgcta tcggtggcgc ctatgcagaa aaccttccgg ttatcctgat ctccggtgct 300ccgaacaaca atgatcacgc tgctggtcac gtgttgcatc acgctcttgg caaaaccgac 360tatcactatc agttggaaat ggccaagaac atcacggccg cagctgaagc gatttacacc 420
ccagaagaag ctccggctaa aatcgatcac gtgattaaaa ctgctcttcg tgagaagaag 480ccggtttatc tcgaaatcgc ttgcaacatt gcttccatgc cctgcgccgc tcctggaccg 540gcaagcgcat tgttcaatga cgaagccagc gacgaagctt ctttgaatgc agcggttgaa 600gaaaccctga aattcatcgc caaccgcgac aaagttgccg tcctcgtcgg cagcaagctg 660cgcgcagctg gtgctgaaga agctgctgtc aaatttgctg atgctctcgg tggcgcagtt 720gctaccatgg ctgctgcaaa aagcttcttc ccagaagaaa acccgcatta catcggtacc 780tcatggggtg aagtcagcta tccgggcgtt gaaaagacga tgaaagaagc cgatgcggtt 840atcgctctgg ctcctgtctt caacgactac tccaccactg gttggacgga tattcctgat 900cctaagaaac tggttctcgc tgaaccgcgt tctgtcgtcg ttaacggcgt tcgcttcccc 960agcgttcatc tgaaagacta tctgacccgt ttggctcaga aagtttccaa gaaaaccggt 1020gctttggact tcttcaaatc cctcaatgca ggtgaactga agaaagccgc tccggctgat 1080ccgagtgctc cgttggtcaa cgcagaaatc gcccgtcagg tcgaagctct tctgaccccg 1140accacgacgg ttattgctga aaccggtgac tcttggttca atgctcagcg catgaagctc 1200ccgaacggtg ctcgcgttga atatgaaatg cagtggggtc acatcggttg gtccgttcct 1260gcegccttcg gttatgccgt cggtgctccg gaacgtcgca acatcctcat ggttggtgat 1320ggttccttcc agctgacggc tcaggaagtc gctcagatgg ttcgcctgaa actgccggtt 1380atcatcttct tgatcaataa ctatggttac accatcgaag ttatgatcca tgatggtccg 1440tacaacaaca tcaagaactg ggattatgcc ggtctgatgg aagtgttcaa cggtaacggt 1500ggttatgaca gcggtgctgg taaaggcctg aaggctaaaa ccggtggcga actggcagaa 1560gctatcaagg ttgctctggc aaacaccgac ggcccaaccc tgatcgaatg cttcatcggt 1620cgtgaagact gcactgaaga attggtcaaa tggggtaagc gcgttgctgc cgccaacagc 1680cgtaagcctg ttaacaagct cctctag 1707<210>8<211>568<212>PRT<213>运动发酵单孢菌<400>8Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu20 25 30Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys35 40 45Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys50 55 60Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala65 70 75 80Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu100 105 110His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala115 120 125Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala130 135 140
Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys145 150 155 160Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala165 170 175Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu180 185 190Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn195 200 205Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly210 215 220Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val225 230 235 240Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His245 250 255Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys260 265 270Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn275 280 285Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu290 295 300Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Val Arg Phe Pro305 310 315 320Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser325 330 335Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu340 345 350Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala355 360 365Gln Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val370 375 380Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu385 390 395 400Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly405 410 415Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg420 425 430Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln435 440 445Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu450 455 460Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro465 470 475 480Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe485 490 495Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala500 505 510Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn
515 520 525Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys530 535 540Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser545 550 555 560Arg Lys Pro Val Asn Lys Leu Leu565<210>9<211>610<212>PRT<213>玉米(Zea mays)<400>9Met Glu Thr Leu Leu Ala Gly Asn Pro Ala Asn Gly Val Ala Lys Pro1 5 10 15Thr Cys Asn Gly Val Gly Ala Leu Pro Val Ala Asn Ser His Ala Ile20 25 30Ile Ala Thr Pro Ala Ala Ala Ala Ala Thr Leu Ala Pro Ala Gly Ala35 40 45Thr Leu Gly Arg His Leu Ala Arg Arg Leu Val Gln Ile Gly Ala Ser50 55 60Asp Val Phe Ala Val Pro Gly Asp Phe Asn Leu Thr Leu Leu Asp Tyr65 70 75 80Leu Ile Ala Glu Pro Gly Leu Thr Leu Val Gly Cys Cys Asn Glu Leu85 90 95Asn Ala Gly Tyr Ala Ala Asp Gly Tyr Ala Arg Ser Arg Gly Val Gly100 105 110Ala Cys Ala Val Thr Phe Thr Val Gly Gly Leu Ser Val Leu Asn Ala115 120 125Ile Ala Gly Ala Tyr Ser Glu Asn Leu Pro Val Val Cys Ile Val Gly130 135 140Gly Pro Asn Ser Asn Asp Tyr Gly Thr Asn Arg Ile Leu His His Thr145 150 155 160Ile Gly Leu Pro Asp Phe Ser Gln Glu Leu Arg Cys Phe Gln Thr Ile165 170 175Thr Cys Tyr Gln Ala Ile Ile Asn Asn Leu Asp Asp Ala His Glu Gln180 185 190Ile Asp Thr Ala Ile Ala Thr Ala Leu Arg Glu Ser Lys Pro Val Tyr195 200 205Ile Ser Val Ser Cys Asn Leu Ala Gly Leu Ser His Pro Thr Phe Ser210 215 220Arg Asp Pro Val Pro Met Phe Ile Ser Pro Arg Leu Ser Asn Lys Ala225 230 235 240Asn Leu Glu Tyr Ala Val Glu Ala Ala Ala Asp Phe Leu Asn Lys Ala245 250 255Val Lys Pro Val Met Val Gly Gly Pro Lys Ile Arg Val Ala Lys Ala
260 265 270Arg Glu Ala Phe Ala Ala Val Ala Asp Ala Ser Gly Tyr Pro Phe Ala275 280 285Val Met Pro Ala Ala Lys Gly Leu Val Pro Glu His His Pro Arg Phe290 295 300Ile Gly Thr Tyr Trp Gly Ala Val Ser Thr Thr Phe Cys Ala Glu Ile305 310 315 320Val Glu Ser Ala Asp Ala Tyr Leu Phe Ala Gly Pro Ile Phe Asn Asp325 330 335Tyr Ser Ser Val Gly Tyr Ser Leu Leu Leu Lys Arg Glu Lys Ala Val340 345 350Ile Val Gln Pro Asp Arg Met Val Val Gly Asp Gly Pro Ala Phe Gly355 360 365Cys Ile Leu Met Pro Glu Phe Leu Arg Ala Leu Ala Lys Arg Leu Arg370 375 380Arg Asn Thr Thr Ala Tyr Asp Asn Tyr Arg Arg Ile Phe Val Pro Asp385 390 395 400Arg Glu Pro Pro Asn Gly Lys Pro Asn Glu Pro Leu Arg Val Asn Val405 410 415Leu Phe Lys His Ile Lys Gly Met Leu Ser Gly Asp Ser Ala Val Val420 425 430Ala Glu Thr Gly Asp Ser Trp Phe Asn Cys Gln Lys Leu Arg Leu Pro435 440 445Glu Gly Cys Gly Tyr Glu Phe Gln Met Gln Tyr Gly Ser Ile Gly Trp450 455 460Ser Val Gly Ala Thr Leu Gly Tyr Ala Gln Ala Ala Lys Asp Lys Arg465 470 475 480Val Ile Ala Cys Ile Gly Asp Gly Ser Phe Gln Val Thr Ala Gln Asp485 490 495Val Ser Thr Met Leu Arg Cys Gly Gln Lys Ser Ile Ile Phe Leu Ile500 505 510Asn Asn Gly Gly Tyr Thr Ile Glu Val Glu Ile His Asp Gly Pro Tyr515 520 525Asn Val Ile Lys Asn Trp Asp Tyr Thr Gly Leu Val Asn Ala Ile His530 535 540Asn Ser Glu Gly Asn Cys Trp Thr Met Lys Val Arg Thr Glu Glu Gln545 550 555 560Leu Lys Glu Ala Ile Ala Thr Val Thr Gly Ala Lys Lys Asp Cys Leu565 570 575Cys Phe Ile Glu Val Ile Val His Lys Asp Asp Thr Ser Lys Glu Leu580 585 590Leu Glu Trp Gly Ser Arg Val Ser Ala Ala Asn Ser Arg Pro Pro Asn595 600 605Pro Gln610<210>10
<211>563<212>PRT<213>啤酒糖酵母(Saccromyces cerevisae)<400>10Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln1 5 10 15Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser20 25 30Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn35 40 45Ala Asn Glu Leu Asn Ala Arg Tyr Ala Ala Asp Gly Tyr Ala Arg Ile50 55 60Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser65 70 75 80Ala Len Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu85 90 95His Val Val Gly Val Pro Ser Ile Ser Ser Gln Ala Lys Gln Leu Leu100 105 110Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met115 120 125Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Cys Thr130 135 140Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln145 150 155 160Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val165 170 175Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn180 185 190Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Val Leu Ala195 200 205Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg210 215 220His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe225 230 235 240Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Ser Glu Gln His245 250 255Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val260 265 270Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu275 280 285Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys290 295 300Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr305 310 315 320Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Asn325 330 335
Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg340 345 350Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu355 360 365Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val370 375 380Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe385 390 395 400Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly405 410 415Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile420 425 430Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln435 440 445Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro450 455 460Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile465 470 475 480His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu485 490 495Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val500 505 510Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn515 520 525Asp Asn Ser Lys Ile Arg Met Ile Glu Val Met Leu Pro Val Phe Asp530 535 540Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn545 550 555 560Ala Lys Gln<210>11<211>32<212>DNA<213>人工序列<220>
<223>primer<221>misc_特征<222>3,6,18<223>r=a或g<221>misc_特征<222>12,21,27<223>y=c或t
<221>misc_特征<222>9,15,30<223>n=任意核苷酸碱基<400>11aargargtna aygtngarca yatgttyggn gt3权利要求
1.一种分离的核酸分子,选自a)所含核苷酸序列与SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5的核苷酸序列至少60%同源的核酸分子,或其互补序列;b)含有一种核酸的至少000个核苷酸的片段的核酸分子或其互补序列,前一种核酸含有SEQ ID NO1,SEQ ID NO3,SEQ ID NO5的核苷酸序列;c)编码一种多肽的核酸分子,该多肽所含的氨基酸序列与SEQ IDNO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列至少约50%同源;d)编码一种多肽的片段的核酸分子,该多肽含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列;其中该片段含有SEQ IDNO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少15个连续氨基酸残基;和e)编码一种多肽的天然存在的等位基因变体的核酸分子,该多肽含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列;其中所述核酸分子在严格条件下与含有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5的核酸分子的互补序列杂交。
2.根据权利要求1所述的分离的核酸分子,选自a)含有SEQ ID NO1,SEQ ID NO3,SEQ ID NO5的核苷酸序列的核酸分子,或其互补序列;和b)编码一种多肽的核酸分子,该多肽含有SEQ ID NO2,SEQ IDNO4,或SEQ ID NO6的氨基酸序列。
3.根据权利要求1所述的核酸分子,它进一步含有载体核酸序列。
4.根据权利要求1所述的核酸分子,它与替代启动子可操作性连接。
5.根据权利要求1所述的核酸分子,它进一步含有编码异源多肽的核酸序列。
6.一种含有权利要求1所述的核酸分子的宿主细胞。
7.根据权利要求6所述的宿主细胞,其中所述宿主细胞选自革兰氏阴性菌细胞和革兰氏阳性菌细胞。
8.根据权利要求6所述的宿主细胞,其中所述革兰氏阴性菌细胞选自葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌,发酵细菌,和醋杆菌。
9.根据权利要求6所述的宿主细胞,其中所述革兰氏阳性菌细胞选自丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,和八叠球菌。
10.一种分离的多肽,选自a)含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的多肽的片段,其中该片段含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的至少15个连续氨基酸;b)含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的多肽的天然存在的等位基因变体,其中该多肽由在严格条件下与含有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5的核酸分子的互补序列杂交的核酸分子编码;c)由一种核酸分子编码的多肽,该核酸分子所含的核苷酸序列与含有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5的核苷酸序列的核酸至少50%同源;d)所含氨基酸序列与SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列至少30%同源的多肽。
11.根据权利要求10所述的分离多肽,它含有SEQ ID NO2,SEQID NO4,或SEQ ID NO6的氨基酸序列。
12.根据权利要求10或11任何一项所述的多肽,其中所述多肽具有改进的脱羧酶活性。
13.根据权利要求10或11任何一项所述的多肽,其中所述多肽具有改进的热稳定性。
14.根据权利要求10或11任何一项所述的多肽,其中所述多肽具有改进的底物亲和性。
15.根据权利要求10或11任何一项所述的多肽,它进一步含有异源氨基酸序列。
16.一种选择性结合权利要求10或11所述多肽的抗体。
17.一种生产多肽的方法,包括在表达核酸分子的条件下培养权利要求6所述的宿主细胞,所述多肽选自a)含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的多肽;b)含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的多肽的片段,其中该片段含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的至少15个连续氨基酸;c)含有SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的多肽的天然存在的等位基因变体,其中该多肽由在严格条件下与含有SEQ ID NO1,SEQ ID NO3,或SEQ ID NO5的核酸分子的互补序列杂交的核酸分子编码。
18.一种检测样品中是否存在权利要求10或11所述多肽的方法,包括a)使样品接触选择性结合所述多肽的化合物;并b)确定所述化合物是否结合样品中的多肽,由此检测样品中是否存在权利要求10所述的多肽。
19.根据权利要求18所述的方法,其中结合多肽的化合物是抗体。
20.一种检测样品中是否存在权利要求1所述的核酸分子的方法,包括a)使样品接触与核酸分子的互补序列选择性杂交的核酸探针或引物;并b)确定所述核酸探针或引物是否结合样品中的核酸分子,由此检测样品中是否存在权利要求1所述的核酸分子。
21.根据权利要求20所述的方法,其中所述样品含有mRNA分子,并与核酸探针接触。
22.一种试剂盒,它含有与权利要求1所述的核酸分子互补序列选择性杂交的化合物,以及使用说明。
23.一种含有编码丙酮酸脱羧酶的异源核酸序列的重组宿主细胞,其中的核酸序列是为改进所述宿主细胞中的密码子使用而选择的。
24.一种含有编码丙酮酸脱羧酶的异源核酸序列的重组宿主细胞,其中的核酸序列是为改进脱羧酶活性而选择的。
25.一种含有编码丙酮酸脱羧酶的异源核酸序列的重组宿主细胞,其中的核酸序列是为改进热稳定性而选择的。
26.根据权利要求23所述的宿主细胞,其中所述编码丙酮酸脱羧酶的异源核酸序列与替代启动子可操作性连接。
27.根据权利要求23所述的宿主细胞,其中所述编码丙酮酸脱羧酶的异源核酸序列来源于选自棕榈发酵细菌,巴氏醋杆菌,和胃八叠球菌的细菌细胞。
28.根据权利要求23-26任何一项所述的宿主细胞,其中所述异源核酸序列选自SEQ ID NO1,SEQ ID NO3,和SEQ ID NO5。
29.根据权利要求6和23-26任何一项所述的宿主细胞,其中所述宿主细胞进一步含有编码选自醇脱氢酶,葡聚糖酶,和分泌酶的多肽的核酸。
30.根据权利要求29所述的宿主细胞,其中所述宿主细胞进一步含有编码醇脱氢酶的核酸。
31.根据权利要求6和23-26任何一项所述的宿主细胞,其中所述宿主细胞是产乙醇的。
32.根据权利要求6和23-26任何一项所述的宿主细胞,其中所述宿主细胞适于从糖发酵乙醇。
33.根据权利要求23-26任何一项所述的重组宿主细胞,其中所述宿主细胞是选自革兰氏阴性菌细胞和革兰氏阳性菌细胞的细菌细胞。
34.根据权利要求33所述的宿主细胞,其中所述革兰氏阴性菌细胞选自葡糖杆菌,根瘤菌,慢生根瘤菌,产碱菌,红细菌,红球菌,固氮螺菌,红螺菌,鞘氨醇单胞菌,伯克霍尔德氏菌,脱硫单胞菌,Gepspirillum,琥珀酸单胞菌,气单胞菌,希瓦氏菌,Halochromatium,柠檬酸杆菌,埃希氏菌,克雷伯氏菌,发酵单胞菌,发酵细菌,和醋杆菌。
35.根据权利要求33所述的宿主细胞,其中所述革兰氏阳性菌细胞选自丝状杆菌,酸杆菌,拟杆菌,鞘氨醇杆菌,放线菌,棒杆菌,诺卡氏菌,红球菌,丙酸杆菌,双岐杆菌,芽孢杆菌,Geobacillus,类芽孢杆菌,硫化杆菌,梭菌,Anaerobacter,真杆菌,链球菌,乳杆菌,明串珠菌,肠球菌,乳球菌,Thermobifida,纤维单胞菌,和八叠球菌。
36.一种含有编码PDC的异源核酸的重组产乙醇宿主细胞,该PDC选自SEQ ID NO2,SEQ ID NO4,和SEQ ID NO6,其中所述核酸受到外源替代启动子的转录控制。
37.一种生产乙醛的方法,包括在以充分水平表达丙酮酸脱羧酶的条件下培养权利要求6和23-26任何一项所述的宿主细胞,从而自丙酮酸生产乙醛。
38.根据权利要求37所述的方法,其中所述宿主细胞进一步含有选自醇脱氢酶,分泌酶,和葡聚糖酶的产乙醇基因。
39.一种生产乙醛的方法,包括在从丙酮酸生产乙醛的条件下,接触从权利要求6和23-26任何一项所述的宿主细胞获得的细胞溶解产物。
40.一种生产乙醇的方法,包括在以充分水平表达丙酮酸脱羧酶和醇脱氢酶的条件下,培养权利要求6和23-26任何一项所述的宿主细胞,从而生产作为主要发酵产物的乙醇。
41.根据权利要求38所述的方法,其中所述方法是在水溶液中进行的。
42.根据权利要求40所述的方法,其中所述方法是在水溶液中进行的。
43.一种酶提取物,它含有可检测水平的丙酮酸脱羧酶,所述丙酮酸脱羧酶来源于权利要求6和23-26任何一项所述的宿主细胞。
44.根据权利要求37所述的酶提取物,其中所述丙酮酸脱羧酶具有改进的脱羧酶活性。
45.根据权利要求40所述的酶提取物,其中所述丙酮酸脱羧酶具有改进的脱羧酶活性。
46.根据权利要求43所述的酶提取物,其中所述丙酮酸脱羧酶具有改进的热稳定性。
47.根据权利要求43所述的酶提取物,其中所述丙酮酸脱羧酶具有改进的底物亲和性。
48.一种选择具有改进的脱羧酶活性的丙酮酸脱羧酶的方法,包括把丙酮酸脱羧酶的氨基酸序列与SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列进行比较;并改变所述丙酮酸脱羧酶的至少一个氨基酸残基,使其与SEQ IDNO2,SEQ ID NO4,或SEQ ID NO6的相应氨基酸残基具有同一性;从而获得改进的丙酮酸脱羧酶活性。
49.根据权利要求48所述的方法,其中所述的丙酮酸脱羧酶活性包括改进的,对丙酮酸的丙酮酸脱羧酶亲和性。
50.根据权利要求48所述的方法,其中所述的丙酮酸脱羧酶活性包括改进的热稳定性。
51.一种选择在受体宿主细胞中的表达改进的丙酮酸脱羧酶的方法,包括把编码丙酮酸脱羧酶的核酸序列与SEQ ID NO1,SEQ ID NO 3,或SEQ ID NO5的核酸序列进行比较;并改变所述编码丙酮酸脱羧酶的核酸的至少一个密码子,使其与SEQID NO1,SEQ ID NO3,或SEQ ID NO5的相应密码子具有同一性,从而在所述宿主细胞中获得所述改变过的、编码丙酮酸脱羧酶的核酸的表达的改进。
52.一种选择在受体宿主细胞中的表达改进的丙酮酸脱羧酶的方法,包括把编码丙酮酸脱羧酶的核酸序列与该受体宿主细胞的密码子使用进行比较;改变所述编码丙酮酸脱羧酶的核酸的至少一个密码子,使其相应于所述受体宿主细胞的密码子使用,从而在所述宿主细胞中获得所述改变过的、编码丙酮酸脱羧酶的核酸的表达的改进。
53.一种选择在受体宿主细胞中的表达改进的丙酮酸脱羧酶的方法,包括把编码丙酮酸脱羧酶的核酸序列与该受体宿主细胞的密码子使用进行比较;改变所述受体宿主细胞,以便重组产生至少一个相应于编码所述丙酮酸脱羧酶的核酸的密码子的tRNA,从而在所述宿主细胞中获得所述编码丙酮酸脱羧酶的核酸的表达的改进。
54.编码来源于棕榈发酵细菌的pdc基因的质粒pJAM3440,其中所述质粒保藏在美国典型培养物保藏中心,保藏号为ATTC------。
55.编码来源于巴氏醋杆菌的pdc基因的质粒pJAM304,其中所述质粒保藏在美国典型培养物保藏中心,保藏号为ATTC------。
56.编码来源于胃八叠球菌的pdc基因的质粒pJAM419,其中所述质粒保藏在美国典型培养物保藏中心,保藏号为ATTC------。
全文摘要
本发明提供编码丙酮酸脱羧酶的分离核酸分子,所述丙酮酸脱羧酶具有改进的脱羧酶活性,底物亲和性,热稳定性,和在不同pH值下的活性。本发明的核酸还具有允许在各种宿主细胞中高水平表达的密码子使用。因此,本发明提供含有这种核酸分子的重组表达载体,含有该表达载体的重组宿主细胞,进一步含有其它产乙醇酶的宿主细胞,以及使用这种宿主细胞生产有用物质,如乙醛和乙醇的方法。
文档编号C12N9/10GK1678735SQ02813514
公开日2005年10月5日 申请日期2002年4月29日 优先权日2001年5月4日
发明者J·A·毛平-福尔罗, L·A·塔拉里科, K·C·拉, L·O·因格拉姆 申请人:佛罗里达大学研究基金会有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1