四碳醇的发酵生产的制作方法

文档序号:438434阅读:917来源:国知局

专利名称::四碳醇的发酵生产的制作方法
技术领域
:本发明涉及工业微生物领域和醇的生产。更具体地讲,2-丁醇是通过重组微生物的工业发酵而产生。本发明的重组微生物和方法还可以适于生产2-丁酮,2-丁酮是本文所公开的2-丁醇生物合成途径中的中间产物。
背景技术
:丁醇是一种重要的工业化学品,可用作燃料添加剂、塑料工业中的化学原料以及食品和香料工业中的食品级萃取剂。每年,通过石油化学手段生产100亿镑至120亿磅的丁醇,并且对该日用化学品的需求可能还会增加。2-丁酮(也称作曱基乙基酮(MEK))是一种应用广泛的溶剂,并且是仅次于丙酮的最重要的商业生产的酮。它被用作油漆、树脂和粘合剂的溶剂,以及用作选择性萃取剂和氧化反应的活化剂。2-丁酮的化学合成方法是已知的,例如通过2-丁醇的脱氢作用合成,或在其中将液体丁烷催化氧化而生成2-丁酮和乙酸的工艺中合成(Ullmann,sEncyclopediaofIndustrialChemistry,笫6版,2003,Wiley-VCHVerlagGmbHandCo.,Weinheim,Germany,第5巻,笫727-732页)。2-丁酮还可通过氢化而化学转化为2-丁醇(Breen等人,丄orCatalysis236:270-281(2005))。2-丁醇的化学合成方法是已知的,例如通过正丁烯的7J^合合成(Ullmann,sEncyclopediaofIndustrialChemistry,第6版,2003,Wiley-VCHVerlagGmbHandCo.,Wemheim,Germany,第5巻,第716-719页)。这些工艺利用衍生自石油化学品的起始材料并通常昂贵,并且对环境不友好。用衍生自植物的原材料生产2-丁酮和2-丁醇将会使温室气体排放达到最低程度并将代表本领域的进步。通过生物转化其它有机化学品来生产2-丁醇的方法也是已知的。例如,Stampfer等人(WO03/078615)描述了仲醇例如2-丁醇的生产方法,该方法是通过由4寻自赤纟工5求菌(W/zodococcz^rwZ)w)的醇脱氬酶催化酮的还原而产生仲醇。同样,Kojima等人(EP0645453)描述了产生仲醇例如2-丁醇的方法,该方法是通过由得自近平滑假丝酵母(aw&甴;^ra戸z7ow^)的仲醇脱氢酶催化酮的还原而制备仲醇。另外,Kuehnle等人(EP1149918)描述了产生1-丁醇和2-丁醇两者的工艺,该工艺是通过赤红球菌的多种菌抹氧化烃而产生。该工艺对1-丁醇产生具有93.8%的选才奪性。通过乳酸杆菌(丄"ctokcz〃z)的某些菌株来生产2-丁醇的方法也是已知的(Speranza等人,J.Agric.FoodChem.(1997)45:3476-3480)。2-丁醇是通过转化内消旋-2,3-丁二醇而产生。还论述了通过这些乳酸杆菌菌林从乙酰乳酸和乙偶姻产生2-丁醇。然而,设计用于生产2-丁醇的重组微生物还未报道。因此,需要环保型高性价比的生产2-丁醇和2-丁酮的工艺。本发明通过发现表达2-丁醇和2-丁酮生物合成途径的重组微生物生产宿主,从而满足了该需求。发明概述本发明提供了具有工程化2-丁醇生物合成途径的重组微生物。本发明还提供了具有工程化2-丁酮生物合成途径的重组微生物,该合成途径与省略最后一步的2-丁醇生物合成途径相同。工程化微生物可用于2-丁醇或2-丁酮的商业生产。因此,本发明提供了重组微生物宿主细胞,该宿主细胞包含至少一种编码多肽的DNA分子,该多肽催化底物至产物的转化,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;iv)2,3-丁二醇转化为2-丁酮;和v)2-丁酮转化为2-丁醇;12其中所述至少一种DNA分子与所述微生物宿主细胞是异源的,并且其中所述微生物宿主细胞产生2-丁醇。在另一个实施方案中本发明提供了重组微生物宿主细胞,该宿主细胞包含至少一种编码多肽的DNA分子,该多肽催化底物至产物的转化,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转^i为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;和iv)2,3-丁二醇转化为2-丁酮;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的,并且其中所述微生物宿主细胞产生2-丁酮。在另一个实施方案中,本发明提供了生产2-丁醇的方法,该方法包括1)提供重组微生物宿主细胞,其包含至少一种编码多肽的DNA分子,该多肽催化底物至产物的转化,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;iv)2,3-丁二醇转化为2-丁酮;和v)2-丁酮转化为2-丁醇;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的;和2)使(1)中的宿主细胞在能产生2-丁醇的条件下与可发酵碳底物在发酵培养基中接触。同样,本发明提供了生产2-丁酮的方法,该方法包括1)提供重组微生物宿主细胞,其包含至少一种编码多肽的DNA分子,该多肽催化底物至产物的转化,所述底物至产物的转化选自由以下4i^匕组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;和iv)2,3-丁二醇转化为2-丁酮;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的;和2)使(1)中的宿主细胞在能产生2-丁酮的条件下与可发酵碳底物在发酵培养基中接触。在另一个实施方案中,本发明提供通过本发明的方法产生的含有2-丁醇或2-丁酮的发酵产物培养基。附图、表和序列的说明通过下面的详细说明、附图和随附的序列描述可以更全面地理解本发明,这些详细描述、附图和序列描述形成了本专利申请的一部分。图1示出了生物合成2-丁酮和2-丁醇的四种不同途径。图2示出了二醇/甘油脱水酶的全长大亚基的系统树,其中移除了具有>95%同一性的序列(但保留了所有通过实验验证了的功能序列),以及示出了列出该系统树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。图3示出了二醇/甘油脱水酶的全长中等亚基的系统树,其中移除了具有>95%同一性的序列,以及示出了列出该系统树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。图4示出了二醇/甘油脱水酶的全长小亚基的系统树,其中移除了具有>95%同一性的序列,以及示出了列出该系统树中每条序列的身份的索引表。经实验确定功能为二醇或甘油脱水酶的序列分别以黑色或浅灰色突出显示。表2是二醇/甘油脱水酶的a大亚基分布型HMM(ProfileHMM)的表。表12是与电子表格形式一起提交并将其以引用的方式并入本文。表13是二醇/甘油脱水酶的a中等亚基分布型HMM的表。表13是与电子表格形式一起提交并将其以引用的方式并入本文。表14是二醇/甘油脱水酶的a小亚基分布型HMM的表。表14是与电子表格形式一起提交并将其以引用的方式并入本文。下面的序列遵照37C.F.R.1.821-1.825("RequirementsforPatentApplicationsContainingNucleotideSequencesand/orAminoAcidSequenceDisclosures-theSequenceRules"(只于含有核酸序列和/或氨基酸序列公开的专利申请的要求-序列规则)),并且符合WorldIntellectualPropertyOrganization(世界知识产权组织,WIPO)ST.25标准(1998)以及EPO和PCT的序列清单要求(规则5.2和49.5(a-bis)以及AdministrativeInstructions(行政指令)的第208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式均遵照37C.F.R.§1.822中列出的规则。表1<table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table>20<table>tableseeoriginaldocumentpage17</column></row><table>SEQIDNO:15-65是实施例中所用的寡核苷酸PCR引物、克隆引物、筛选引物和测序引物的核苷酸序列。SEQIDNO:66是实施例11中所述的大肠杆菌菌林MG1655AyqhCD中yqhD基因的缺失区的核苷酸序列。SEQIDNO:67是葡萄糖异构酶启动子1.6GI的变体的核苷酸序列。SEQIDNO:68是1.5GI启动子的核苷酸序列。SEQIDNO:69是来自产酸克雷伯菌的二醇脱水酶操纵子的核苷酸序列。SEQIDNO:70是来自产酸克雷伯菌的二醇脱水酶再活化因子操纵子的核苷酸序列。SEQIDNO:73是实施例9中所述的pDCQ2的核苷酸序列。SEQIDNO:127-132是实施例中所用的其它寡核苷酸PCR引物和克隆引物的核普酸序列。SEQIDNO:155是胡萝卜软腐欧文氏菌黑胫亚种的氨基醇激酶的密码子优化的编码区。SEQIDNO:156是胡萝卜软腐欧文氏菌黑胫亚种的氨基醇O-磷酸酯裂解酶的密码子优化的编码区。SEQIDNO:157-163是实施例中所用的其它寡核普酸PCR引物和克隆引物的核苷酸序列。SEQIDNO:275是来自胡萝卜软腐欧文氏菌黑胫亚种的操作子的核苦酸序列。表2:其它甘油和二醇脱水酶的大亚基、中等亚基和小亚基<table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>来自未培养细菌的PduES269来自单核细胞增多性李斯特菌菌抹l/2aF6854的脱水酶小亚基S270来自未培养细菌的DhaES271来自未培养细菌的DhaES272来自未培养细菌的DhaES273来自单核细胞增多性李斯特菌FSLN1-017的脱水酶小亚基s274a说明来自序列的GenBank注释,可能没有正确包括甘油或二醇的命称,或者可能没有包括亚基信息。b亚基通过与产酸克雷伯菌酶的大亚基、中等亚基或小亚基的序列同源性鉴定。c来源于同一生物体的亚基在一起列出并且注释为相同的酶,或者具有靠近的GenBank号以表明在基因组中的接近。发明详述本发明涉及采用重组微生物生产2-丁醇的方法。本发明符合多种商业需求和工业需求。丁醇是一种具有多种应用的重要工业日用化学品,其中其作为燃料或燃料添加剂的潜力尤为重要。尽管丁醇仅仅是一种四碳醇,但是其具有与汽油相似的能含量,并且可以与任何化石燃料混合。丁醇是优选的燃料或燃料添加剂,因为它在标准内燃机中燃烧时仅生成CCb以及少量(或不生成)SOx或NOx。另外,丁醇的腐蚀性不及乙醇,是目前为止最优选的燃料添加剂。丁醇除了可用作生物燃料或燃料添加剂之外,在新兴的燃料电池工业中其还具有影响氲分配问题的潜力。如今,由于氳的运输和分配存在安全隐患,燃料电池饱受困扰。可以容易地对丁醇重整其氢含量,并且可以通过现有的加油站以燃料电池或汽车内燃机所需的纯度进行分配。最后,本发明从源自植物的碳源生产2-丁醇,避免了与丁醇生产的标准石油化学工艺相关的负面的环境影响。本发明还提供了生产2-丁酮的重组微生物和方法,2-丁酮是本文所公开的2-丁醇生物合成途径中的中间产物。2-丁酮也称为曱基乙基酮(MEK),可用作油漆或其它涂料的溶剂。其还可用于合成橡胶工业以及用于石蜡的生产。以下定义和缩写是用于权利要求和说明书的判读。如在此所用的,术语"发明,,或"本发明,,为非限制性术语并且无意于指具体发明的任何单个实施方案,而是涵盖如说明书和权利要求书中所述的所有可能的实施方案。术语"2-丁醇生物合成途径"指从丙酮酸产生2-丁醇的酶途径。术语"2-丁酮生物合成途径"指从丙酮酸产生2-丁酮的酶途径。术语"乙酰乳酸合酶",也称"乙酰羟酸合酶,,,指具有催化两分子丙酮酸转化为一分子a-乙酰乳酸的酶活性的一种多肽(或多种多肽)。乙酰乳酸合酶,即EC2.2丄6[原为EC4丄3.18](EnzymeNomenclature1992,AcademicPress,SanDiego),其活性可能取决于辅因子焦磷酸硫胺素。适用的乙酰乳酸合酶可得自多种来源,例如,枯草芽孢杆菌[GenBankNo:AAA22222NCBI(美国国家生物技术信息中心)氨基酸序列(SEQIDNO:77),L04470NCBI核普酸序列(SEQIDNO:76)]、土生克雷伯菌[GenBankNo:AAA25055(SEQIDNO:79),L04507(SEQIDNO:78)]和肺炎克雷伯菌[GenBankNo:AAA25079(SEQIDNO:4),M73842(SEQIDNO:3)]。术语"乙酰乳酸脱羧酶"指具有催化a-乙酰乳酸转化为乙偶姻的酶活性的一种多肽(或多种多肽)。乙酰乳酸脱羧酶(即EC4丄1.5)可得自例如枯草芽孢杆菌[GenBankNo:AAA22223(SEQIDNO:81),L04470(SEQIDNO:80)]、土生克雷伯菌[GenBankNo:AAA25054(SEQIDNO:83),L04507(SEQIDNO:82)]和肺炎克雷伯菌[GenBankNo:AAU43774(SEQIDNO:2),AY722056(SEQIDNO:1)]。术语"乙偶姻胺化酶Uminase),,指具有催化乙偶姻转化为3-氨基-2-丁醇的酶活性的一种多肽(或多种多肽)。乙偶姻胺化酶可以利用辅因子5'-磷酸吡。多醛或NADH(还原型烟酰胺腺噤呤二核苷酸)或NADPH(还原型烟酰胺腺噤呤二核苷酸磷酸)。所得产物在3号位上具有(R)或(S)立体化学。磷酸吡喷醛依赖型酶可将氨基酸(例如丙氨酸或谷氨酸)用作氨基供体。NADH依赖型和NADPH依赖型酶可将氨用作第二底物。NADH依赖型乙偶姻胺化酶(也称作氨基醇脱氢酶)的一个合适实例由Ito等人(美国专利No.6,432,688)进行了描述。吡。多醛依赖型乙偶姻胺化酶的一个实例是由Shin和Kim(J.Org.Chem.67:2848-2853(2002))描述的胺丙酮酸氨基转移酶(也称为胺丙酮酸转氨酶)。术语"丁醇脱氢酶"指具有催化2-丁酮和2-丁醇相互转换的酶活性的一种多肽(或多种多肽)。丁醇脱氬酶是庞大的醇脱氢酶家族中的亚群。丁醇脱氢酶可以是NAD依赖型或NADP依赖型。NAD依赖型酶称为EC1.1.1.1,可得自例如赤红球菌[GenBankNo:CAD36475(SEQIDNO:14),AJ491307(SEQIDNO:13)]。NADP依赖型酶称为EC1.1.1.2,可得自例如强烈炽热球菌[GenBankNo:AAC25556(SEQIDNO:91),AF013169(SEQIDNO:90)]。另外,丁醇脱氲酶可得自大肠杆菌[GenBankNo:NP—417484(SEQIDNO:75),NC—000913(SEQIDNO:74)],环己醇脱氢酶可得自不动杆菌[GenBankNo:AAG10026(SEQIDNO:72),AF282240(SEQIDNO:71)]。术语"乙偶姻激酶,,指具有催化乙偶姻转化为磷酸乙偶姻的酶活性的一种多肽(或多种多肽)。乙偶姻激酶可以利用ATP(三磷酸腺苷)或磷酸烯醇式丙酮酸作为该反应的磷酸供体。尽管催化乙偶姻进行该反应的酶未见报道,但存在催化相似底物二羟基丙酮进行类似反应的酶,例如称为EC2.7.1.29的酶(Garcia-Alles等人,(2004)Biochemistry43:13037-13046)。术语"乙偶姻磷酸酯胺化酶"指具有催化磷酸乙偶姻转化为3-氨基-2-丁醇O-磷酸酯的酶活性的一种多肽(或多种多肽)。乙偶姻磷酸酯胺化酶可以利用辅因子5,-磷酸吡。多醛、NADH或NADPH。所得产物在3号位上具有(R)或(S)立体化学。磷酸吡。多醛依赖型酶可利用氨基酸例如丙氨酸或谷氨酸。NADH依赖型和NADPH依赖型酶可将氨用作第二底物。尽管催化磷酸乙偶姻进行该反应的酶未见报道,但存在据悉催化相似底物磷酸丝氨醇的类似反应的磷酸吡喷醛依赖型酶(Yasuta等人,(2001)Appl.Environ.Microbiol.67:4999-5009)。术语"氨基丁醇磷酸酯磷酸裂解酶"也称"氨基醇O-磷酸酯裂解酶",是指具有催化3-氨基-2-丁醇O-磷酸酯转化为2-丁酮的酶活性的一种多肽(或多种多肽)。氨基丁醇磷酸酯磷酸裂解酶可以利用辅因子5,-磷酸吡。多醛。尽管能催化氨基丁醇磷酸酯,进行该反应的酶未见报道,但是报道了催化相似底物l-氨基-2-丙醇磷酸酯进行类似反应的酶25(Jones等人,(1973)BiochemJ.134:167-182)。本发明描述了一种新鉴定的氨基丁醇磷酸酯磷酸裂解酶(SEQIDNO:126),其来自物体胡萝卜软腐欧文氏菌,本文的实施例15中说明了其活性。术语"氨基丁醇激酶"指具有催化3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯的酶活性的一种多肽(或多种多肽)。氨基丁醇激酶可以利用ATP作为磷酸供体。尽管能催化3-氨基-2-丁醇进行该反应的酶未有报道,但是报道了催化相似底物乙醇胺和l-氨基-2-丙醇进行类似反应的酶(Jones等人,同上)。本发明在实施例14中描述了胡萝卜软腐欧文氏菌黑胫亚种的氨基丁醇激酶(SEQIDNO:124)。术语"丁二醇脱氬酶"(也称"乙偶姻还原酶")指具有催化乙偶姻转化为2,3-丁二醇的酶活性的一种多肽(或多种多肽)。丁二醇脱氬酶是庞大的醇脱氪酶家族中的亚群。丁二醇脱氲酶可对醇产物中的(R)或(S)立体化学的产生具有特异性。(S)-特异性的丁二醇脱氬酶称为EC1丄1.76,可得自例如肺炎克雷伯菌(GenBankNo:BBA13085(SEQIDNO:6),D86412(SEQIDNO:5))。(R)-特异性丁二醇脱氢酶称为EC1.1.1.4,可得自例如肺炎克雷伯菌[GenBankNo.NP—830481(SEQIDNO:85),NC—004722(SEQIDNO:84);AAP07682(SEQIDNO:87),AE017000(SEQIDNO:86)]和乳酸乳球菌[GenBankNo.AAK04995(SEQIDNO',89),AE006323(SEQIDNO:88)]。术语"丁二醇脱水酶"(也称"二醇脱水酶"或"丙二醇脱水酶")指具有催化2,3-丁二醇转化为2-丁酮的酶活性的一种多肽(或多种多肽)。丁二醇脱水酶可以利用辅因子腺苷钴胺素(维生素B12)。腺苷钴胺素依赖型酶称为EC4.2.1.28,可得自例如产酸克雷伯菌[GenBankNo:BAA08099(a亚基)(SEQIDNO:8),D45071(SEQIDNO:7);BAA08100((3亚基)(SEQIDNO:10),D45071(SEQIDNO:9);和BBA08101亚基)(SEQIDNO:12),D45071(SEQIDNO:11)(注意,所有三种亚基均是活性所必需的)],以及肺炎克雷伯菌[GenBankNo:AAC98384(a亚基)(SEQIDNO:105),AF102064(SEQIDNO:104);GenBankNo:AAC98385(卩亚基)(SEQIDNO:107),AF102064(SEQIDNO:106),GenBankNo:AAC98386(Y亚基)(SEQIDNO:109),AF102064(SEQIDNO:108)]。其它合适的二醇脱水酶包括但不限于B12依赖型二醇脱水酶,其可得自鼠伤寒沙门菌[GenBankNo:AAB84102(大亚基)(SEQIDNO:93),AF026270(SEQIDNO:92);GenBankNo:AAB84103(中等亚基)(SEQIDNO:95),AF026270(SEQIDNO:94);GenBankNo:AAB84104(小亚基)(SEQIDNO:97),AF026270(SEQIDNO:96)];以及丘状乳杆菌[GenBankN(KCAC82541(大亚基)(SEQIDNO:99),AJ297723(SEQIDNO:98);GenBankNo:CAC82542(中等亚基)(SEQIDNO:101);AJ297723(SEQIDNO:100);GenBankNo:CAD01091(小亚基)(SEQIDNO:103),AJ297723(SEQIDNO:102)];和来自短乳杆菌的酶(尤其是菌株CNRZ734和CNRZ735,Speranza等人,同上),以及编码相应酶的核苷酸序列。分离二醇脱水酶基因的方法是本领域所熟知的(如美国专利No.5,686,276)。另外的甘油脱水酶在表2中列出。术语"甘油脱水酶"指具有催化甘油转化为3-鞋基丙醛的酶活性的一种多肽(或多种多肽)。腺苷钴胺素-依赖型甘油脱水酶称为EC4.2.1.30。EC4.2.1.30的甘油脱水酶在序列上类似于二醇脱水酶,并且也有三种亚基。甘油脱水酶还可用于将2,3-丁二醇转化为2-丁酮。EC4.2.1.30的甘油脱水酶的一些实例包括来自如下来源的那些肺炎克雷伯菌(a亚基,编码区序列为SEQIDNO:145,蛋白质序列为SEQIDNO:146;卩亚基,编码区序列为SEQIDNO:147,蛋白质序列为SEQIDNO:148;和y亚基,编码区序列为SEQIDNO:149,蛋白质序列为SEQIDNO:150);巴斯德梭菌[GenBankNo:3360389(a亚基,SEQIDNO:135),3360390(卩亚基,SEQIDNO:136),以及3360391(y亚基,SEQIDNO:137)];蟑螂埃希氏菌[GenBankNo:60099613(a亚基,SEQIDNO:138),57340191(卩亚基,SEQIDNO:139)和57340192(y亚基,SEQIDNO:140)];以及弗氏种檬酸杆菌[GenBankNo:1169287(a亚基,SEQIDNO:141),1229154(卩亚基,SEQIDNO:142),以及1229155亚基,SEQIDNO:143)]。注意,所有这三种亚基均是活性所必需的。另外的甘油脱水酶列于表2中。二醇脱水酶和甘油脱水酶在催化过程中可能会进行自杀式失活。再活化因子蛋白(在本文中也称作"再激活酶")可用于再活化失活的酶(Mori等人,J.Biol.Chem.272:32034(1997))。优选地,再活化因子可得自与所用的二醇或甘油脱水酶相同的来源。例如,合适的二醇脱水酶再活化因子可得自产酸克雷伯菌[GenBankNo:AAC15871(大亚基)(SEQIDNO:111),AF017781(SEQIDNO:110);GenBankNo:AAC15872(小亚基)(SEQIDNO:113),AF017781(SEQIDNO:112)];鼠伤寒沙门氏菌[GenBankNo:AAB84105(大亚基)(SEQIDNO:115),AF026270(SEQIDNO:114),GenBankNo:AAD39008(小亚基)(SEQIDNO:117),AF026270(SEQIDNO:116)];以及丘状乳杆菌[GenBankNo:CAD01092(大亚基)(SEQIDNO:119),AJ297723(SEQIDNO:118);GenBankNo:CAD01093(小亚基)(SEQIDNO:121),AJ297723(SEQIDNO:120)]。大亚基和小亚基两者均为活性所必需的。例如,合适的甘油脱水酶再活化因子可得自肺炎克雷伯菌(大亚基,编码区序列为SEQIDNO:151,蛋白质序列为SEQIDNO:152;以及小亚基,编码区序列为SEQIDNO:153,蛋白质序列为SEQIDNO:154)。术语"兼性厌氧微生物"指既可在有氧环境中生长又可在无氧环境中生长的微生物。术语"碳底物"或"可发酵碳底物"指能够被本发明的宿主生物体代谢的碳源,并且特别是选自由下列物质组成的组的碳源单糖、寡糖、多糖和一碳底物,或它们的混合物。术语"基因"指能够被表达为特定蛋白质的核酸片段,其任选包括编码序列前的调控序列(5'非编码序列)和编码序列后的调控序列(3'非编码序列)。"天然基因"是指存在于自然界具有其自己的调控序列的基因。"嵌合基因"是指不是天然基因的任何基因,包含在自然界中不是一起存在的调控序列和编码序列。因此,嵌合基因可包含源于不同来源的调控序列和编码序列,或者包含源于同一来源但以不同于在自然界中的方式排列的调控序列和编码序列。"内源性基因"指在生物体的基因组内位于其本来位置的天然基因。"外来,,或"外源,,基因指正常情况下不存在于宿主生物体中,而是通过基因转移导入宿主生物体内的基因。外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。"转基因"是通过转化方法导入基因组内的基因。如本文所用,"分离的核酸片段"或"分离的核酸分子"或"基因构建体"可以互换使用,并将指单链-或双链-的RNA或DNA聚合体,任选含有合成的、非天然的或改变的核芬酸碱基。DNA聚合体形式的分离28的核酸片段可由cDNA、基因组DNA或合成DNA的一个或多个片段构成。当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时,则核酸片段"可杂交"至另一核酸片段,例如cDNA、基因组DNA或RNA分子。杂交条件和洗涤条件是众所周知的,并在Sambrook,J.,Fritsch,E.F.和Maniatis,T.MolecularCloning:ALaboratoryManual,第二版,ColdSpringHarborLaboratory:ColdSprmgHarbor,NY(1989)中举例说明,尤其是其中的第11章和表11.1(将其全部内容以引用的方式并入本文)。温度和离子强度条件确定了杂交的"严格性"。可以调节严格性条件以筛选中度相似的片段(例如来自远亲生物体的同源序列),到筛选高度相似的片段(例如从近亲生物体复制功能性酶的基因)。杂交后的洗涤确定严格性条件。一组优选的条件采用一系列如下洗涤开始采用6xSSC、0.5%SDS在室温下持续洗涤15分钟,然后再使用2xSSC、0.5。/。SDS在45。C下洗涤30分钟,最后使用0.2xSSC、0.5%SDS在50。C下重复洗涤30分钟两次。更优选的一组严格性条件采用更高的温度,其中洗涤与上述洗涤相同,不同的是最后两次在0.2xSSC、0.5%SDS中洗涤30分钟时的温度被增加到6(TC。另一组优选的高严格性条件是最后两次洗涂是在65。C下用0.1xSSC、0.1%SDS进行。例如,另一组严才各性条件包括在0.1xSSC、0.1%SDS中于65。C下杂交,并用2xSSC、0.1。/oSDS洗涤,随后用0.1xSSC、0.1%SDS洗涤。杂交需要两种核酸含有互补序列,但是取决于杂交的严格性,碱基之间可能会发生错配。用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度,所述长度和互补程度是本领域内所熟知的变量。两条核苷酸序列之间的相似性或同源性程度越高,具有那些序列的核酸的杂交体的Tm值越大。核酸杂交的相对稳定性(对应较高的Tm)按以下顺序依次降低RNA:RNA、DNA:RNA、DNA:DNA。对于长度超过100个核苷酸的杂交体,已经推导出了用于计算Tm的公式(请参见Sambrook等人,同上,9.50-9.51)。对于较短核酸(寡核苷酸)的杂交,错配的位置变得更重要,而且寡核苷酸的长度决定了其特异性(请参见Sambrook等人,同上,11.7-11.8)。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;并且最优选地,长度为至少约30个核苷酸。此外,技术人员将认识到,可根据需要根据诸如探针长度之类的因素来调节温度和洗涤溶液盐浓度。氨基酸或核苷酸序列的"基本部分"是这样的部分,该部分包含的多肽的氨基酸序列或基因的核苷酸序列足以能通过推定来鉴定所述多肽或者利用比对算法(例如BLAST(Altschul,S.F.等人,J.Mol.Biol.,215:403-410(1993))通过计算机自动化序列比较和鉴别来完成。一般来讲,要推定鉴别多肽或核酸是否与已知蛋白质或基因同源,需要有10个或更多个连续氨基酸或30个或更多个核苷酸。此外,对于核苷酸序列,包含20-30个连续核苷酸的基因特异性寡核苦酸探针可用于序列依赖性的基因识别(如DNA杂交法)和基因分离(如细菌菌落或噬斑的原位杂交法)的方法中。此外,12至15个碱基的短寡核普酸可在PCR中用作扩增引物,以便获得包含该引物的特定核酸片段。因此,核苷酸序列的"基本部分"包含的序列足以特异性地鉴别和/或分离包含该序列的核酸片段。本说明书提出了完整的氨基酸序列和编码特定真菌蛋白质的完整核苷酸序列。根据本文所公开的序列,技术人员现在可以利用本发明所公开序列的全部或基本部分,以用于本领域技术人员所熟知的目的。因此,本发明包括如随附的序列表中所示的完整序列,以及这些序列的如上文定义的基本部分。术语"互补"用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于DNA,腺噤呤与胸腺嘧啶互补,而胞嘧啶与鸟噪呤互补。术语"同源性"和"同源的"在本文中可互换使用。它们指这样的核苷酸片段,即其中一个或多个核苷酸碱基的变化不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核普酸),相对于初始的未经修饰的核酸片段,基本上不会改变所得核酸片段的功能特性。因此,正如本领域技术人员应该理解的,本发明不仅仅涵盖这些具体的示例性序列。此外,技术人员认识到,本发明所涵盖的同源核苷酸序列也由它们在中等严才各条件(如0.5xSSC,0.1%SDS,60。C)下,与本文所示例的序列杂交的能力,或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核普酸序列功能相当的序列的能力所限定。"密码子简并性"指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解在使用核苷酸密码子确定给定氨基酸时特定宿主细胞显示出的"密码子偏好性"。因此,在合成基因以改善其在宿主细胞中的表达时,希望设计基因以使得其密码子使用频率接近宿主细胞中优选的密码子使用频率。如本领域所熟知的,术语"百分比同一性"是两条或更多条多肽序列之间或两条或更多条多核苷酸序列之间的关系,该关系是通过对序列进行比较来确定。在本领域中,"同一性"还表示多肽或多核苦酸序列之间序列关联的程度,根据具体情况,它由这些序列的序列串之间的匹配程度确定。"同一性"和"相似性,,可容易地通过已知方法计算出来,所述的方法包括但不限于以下文献中所描述的那些1.)ComputationalMolecularBiology(Lesk,A.M.编辑)OxfordUniversity:NY(1988);2.)Biocomputing:InformaticsandGenomeProjects(Smith,D.W.纟扁4尋)Academic:NY(1993);3.)ComputerAnalysisofSequenceData,PartI(Griffin,A.M.和Griffin,H.G.编辑)Humama:NJ(1994);4.)SequenceAnalysisinMolecularBiology(vonHeinje,G.编辑)Academic(1987);以及5.)SequenceAnalysisPrimer(Gribskov,M.禾口Devereux,J.纟扁專辱)Stockton:NY(1991)。确定同一性的优选方法被用于给出待测试序列之间的最佳匹配。确定同一性和相似性的方法在可公开获得的计算机程序中编成了代码。可以使用LASERGENE生物信息学计算软件包(DNASTARInc.,Madison,Madison,)的MegAlign禾呈序来进4亍序歹'J比只于和百分比同一性的计算。使用"Clustal比对方法"执行序列多重比对,"Clustal比对方法T涵盖了多种算法,包括"ClustalV比对方法",其对应被称为ClustalV(在Higgins和Sharp,CABIOS.5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992)中有所描述),并且可见于LASERGENE生物信息学计算软件包(DNASTARInc.)MegAlign程序中的比对方法。对于多重比对,默认值为空位罚分(GAPPENALTY)=10和空位长度罚分(GAPLENGTHPENALTY)=10。采用Clustal方法进行双序列比对和蛋白质序列百分比同一性计算的默认参数为KTUPLE=1,空位罚分=3,窗口大小(WINDOW)=5和DIAGONALSSAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口大小=4和DIAGONALSSAVED=4。用ClustalV程序比对序列后,可通过查看同一程序中的"序列距离(sequencedistances)"表来获得"百分比同一性"。另外,还可以利用"ClustalW比对方法",其对应于标为ClustalW(在Higgins和Sharp,CABIOS.5:151-153(1989);Higgms,D.G.等人,Comput.Appl.Biosci.8:189-191(1992)中有所描述),并且可见于LASERGENE生物信息学计算软件包(DNASTARInc.)的MegAlignv6.1程序中的比对方法。多重比对的默认参数(空位罚分-10,空位长度罚分=0.2,延迟发射序列(%)(DelayD證genSeqs(%))=30,DNA转换权重(DNATransitionWeight)=0.5,蛋白质权重矩阵(ProteinWeightMatrix)=Gonnet系列,DNA权重矩阵(DNAWeightMatrix)=IUB)。在使用ClustalW程序对序列进行比对之后,可通过查看同一程序中的"序列距离"表来获得"百分比同一性"。本领域的技术人员非常清楚,多种程度的序列同一性可用于从其它物种中鉴別多肽,其中这类多肽具有相同或相似的功能或活性。百分比同一性的可用实例包括但不限于24%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或24%至100%之间的任何整数百分比都可用于描述本发明,例如'25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。合适的核酸片段不仅具有上述同源性,而且通常还可编码具有至少50个氨基酸的多肽,优选具有至少100个氨基酸,更优选具有至少150个氨基酸,还更优选具有至少200个氨基酸,并且最优选具有至少250个氨基酸。术语"序列分析软件"指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。"序列分析软件"可商购获得或独立开发。典型的序列分析软件包括但不限于1.)GCG程序程序包(WisconsinPackageVersion9.0,GeneticsComputerGroup(GCG),Madison,WI);2.)BLASTP、BLASTN、BLASTX(Altschul等人,J.Mol.Biol.,215:403-410(1990));3.)DNASTAR(DNASTAR,Inc.,Madison,WI);4.)Sequencher(GeneCodesCorporation,AnnArbor,MI);和5.)整合了Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.MethodsGenomeRes.,[Proc.Int.Symp.](1994),MeetingDate1992,111-20,编辑Suhai,Sandor.Plenum:NewYork,NY)。在本专利申请案的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果将基于所用程序的"默认值"。在此所用的"默认值"是指在首次初始化软件时软件最初加载的任何值或参数集。如本文所用的,术语"编码序列"或"CDS"是指编码特定氨基酸序列的DNA序列。"合适的调控序列"指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列)的核苷酸序列,其可影响转录、RNA加工或稳定性,或者相关编码序列的翻译。调控序列可包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。术语"启动子"指能够控制编码序列或功能RNA的表达的DNA序列。一般来讲,编码序列位于启动子序列的3'端。启动子可以整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件或生理条件而引导基因的表达。在大多数时候在大多数细胞类型中引起基因表达的启动子通常称为"组成型启动子"。还应进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全界定,因此不同长度的DNA片段可以具有相同的启动子活性。术语"可操纵地连接"指单个核酸片段上核酸序列的关联,以使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)33时,则该启动子与该编码序列可操纵地连接。编码序列可以正义或反义的取向可操纵地连接至调控序列。如本文所用的,术语"表达"指源于本发明核酸片段的正义(mRNA)或反义RNA的转录和稳定积聚。表达还可指将mRNA翻译为多肽。在本文所用的,术语"转化"指将核酸片段转移至宿主生物体内,导致基因稳定遗传。含有转化核酸片段的宿主生物体被称为"转基因"或"重组"或"转化"生物体。术语"质粒"和"载体"指常携带不是细胞中心代谢的部分的基因的染色体外遗传元件,并且通常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3'末端非翻译序列一起引入细胞中。"转化载体"指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞的元件的特定载体。如在此所用的,术语"密码子简并性"指遗传密码允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下变化的性质。技术人员非常了解在使用核苷酸密码子确定给定氨基酸时具体宿主细胞显示出的"密码子偏好性"。因此,在合成基因以改善其在宿主细胞中的表达时,希望设计基因以使得其密码子使用频率接近于宿主细胞中优选的密码子使用频率。术语"密码子优化的"在其涉及用于转化不同宿主的核酸分子的基因或编码区时,指在不改变由DNA编码的多肽的情况下,改变核酸分子的基因或编码区中的密码子以反映宿主生物体通常的密码子使用。术语"发酵产物培养基"指在其中进行了发酵而使得产物存在于培养基中的培养基。本文所用的标准重组DNA和分子克隆技术为本领域所熟知,并且在Sambrook,J.,Fritsch,E.F.和Maniatis,T.,MolecularCloning:ALaboratoryManual,第二版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY(1989)(以下称为"Maniatis");以及Silhavy,T丄,Bennan,M丄.和Enquist,L.W.,ExperimentswithGeneFusions,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY(1984);以及Ausubd,F.M.等人,CurrentProtocolsinMolecularBiology(GreenePublishingAssoc.andWiley-Interscience出版,(1987))中有所描述。2-丁醇和2-丁酮生物合成途径利用碳水化合物的微生物将糖酵解(EMP)途径、恩-杜二氏(Entner-Doudoroff)途径和磷酸戊糖循环作用作中心代谢途径以给生长和维持提供能量和细胞前体。这些途径都有共同的中间产物3-磷酸甘油醛,而且最终,会直接成形丙酮酸或与EMP途径结合生成丙酮酸。糖转化为丙酮酸的组合反应产生能量(如5,-三磷酸腺苷,ATP)和还原型当量(如,还原型烟酰胺腺。票呤二核普酸NADH,以及还原型烟酰胺腺噤呤二核苦酸磷酸盐NADPH)。NADH和NADPH必须被循环以形成其氧化形式(分别为NAD+和NADP+)。在存在无机电子受体(如02、NCV和SO-)的情况下,还原型当量可以用于增加能量池;作为另外一种选择,可能形成还原型碳副产物。本发明通过提供从丙酮酸至2-丁酮或2-丁醇的完整生物合成途径,使得能用重组微生物从碳水化合物源产生2-丁酮或2-丁醇。还描述了另外三种途径述。尽管已知2-丁醇不是任何细菌发酵的主要产物,但是存在多条可能的途径用来经由已知生化反应类型而生成2-丁醇。这些途径在图1中示出。下面所引用的字母和罗马数字与图1中的字母和罗马数字对应,它们分别用于描述转化步骤和产物。如下所述,2-丁酮是所有这些2-丁醇生物合成途径的中间产物。所有途径均始于两个丙酮酸分子生成a-乙酰乳酸的初始反应(I),在图1中作为底物至产物的转化(a)示出。从a-乙酰乳酸开始,存在4条途径生成2-丁酮(V),在本文中称为2-丁酮生物合成途径途径i)i…〉n…〉III…〉IV…〉V(底物至产物的转化b、c、d、e);2)I—〉11—〉VII…〉IV…〉V(底物至产物的转化b、g、h、e)3)I_—>II—_〉VIII-—>V(底物至产物的转化b、i、j)这是本发明的合成途径。4)I—->IX—->X—->V(底物至产物的转化k、1、m)2-丁醇生物合成途径以2-丁酮(V)转化为2-丁醇(VI)结束。下面是对每种途径中底物至产物的转化的详细论述。途径1:(a)丙酮酸转^S为a-乙酰乳酸:途径1中的初始步骤是由焦磷酸硫胺素依赖型酶催化,两分子丙酮酸转化为一分子(X-乙酰乳酸(图1中的化合物I)和一分子二氧化碳。催化该底物至产物转化的酶(通常被称为乙酰乳酸合酶或称为乙酰羟酸合酶;EC2.2.1.6[2002年以前为EC4.1.3.18])是众所周知的,并且它们参与蛋白氨基酸亮氨酸和缬氨酸的生物合成途径,以及参与多种生物体中发酵产生2,3-丁二醇和乙偶姻的途径。技术人员将理解,分离自多种来源的具有乙酰乳酸合酶活性的多肽将可用于本发明,而不依赖于序列同源性。合适的乙酰乳酸合酶的一些实例可得自多种来源例如枯草芽孢杆菌[GenBankNo:AAA22222NCBI(美国国家生物技术信息中心)氨基酸序列(SEQIDNO:77),L04470NCBI核苷酸序列(SEQIDNO:76)]、土生克雷伯菌[GenBankNo:AAA25055(SEQIDNO:79),L04507(SEQIDNO:78)]和肺炎克雷伯菌[GenBankNo:AAA25079(SEQIDNO:4),M73842(SEQIDNO:3)]。优选的乙酰乳酸合酶是与SEQIDN04、77和79具有至少80%-85%的同一性的那些,其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列)具有至少95%的同一性是最优选的。(b)a-乙酰乳酸转化为乙偶姻:通过诸如乙酰乳酸脱羧酶(EC4.1.1.5)之类的酶的作用,a-乙酰乳酸(I)转化为乙偶姻(11)。与乙酰乳酸合酶类似,该酶也是焦磷酸碌u胺素依赖型酶,并且还涉及多种生物体产生2,3-丁二醇和乙偶姻。不同来源的酶在大小(4.2E-20g(25kDa)-8.3E-20g(50千道尔顿))、寡聚反应(二聚体至六聚物)、位置(细胞内或细胞外)和变构调节(例如,由支链氨基酸活化)方面十分多样化。就本发明的目的而言,位于细胞内优于位于细胞外,但是其它变型一般是可接受的。技术人员将理解,分离自多种来源的具有乙酰乳酸脱羧酶活性的多肽将可用于本发明,而不依赖于序列同源性。合适的乙酰乳酸脱羧酶的一些实例可得自多种来源,例如,枯草芽孢杆菌[GenBankNo:AAA22223(SEQIDNO:81),L04470(SEQIDNO:80)]、土生克雷伯菌[GenBankNo:AAA25054(SEQIDNO:83),L04507(SEQIDNO:82)]和肺炎克雷伯菌[GenBankNo:AAU43774(SEQIDNO:2),AY722056(SEQIDNO:1)]。优选的乙酰乳酸脱羧酶是与SEQIDNO2、81和83具有至少80%-85%的同一性,其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。(c)乙偶姻转化为3-氨基-2-丁醇:存在两种已知类型的生化反应可以实现底物乙偶姻(II)至产物3-氨基-2-丁醇(III)的转化,具体地讲,这两种反应是利用辅助氨基供体的磷酸吡。多醛依赖型转氨作用和直接与氨进行的还原氨化。在后一种情况下,还原当量是以还原型烟酰胺辅因子(NADH或NADPH)的形式提供。Ito等人(美国专利No.6,432,688)报道了以乙偶姻作为底物催化该反应的NADH依赖型酶的实例。尚未对该酶的任何立体特异性进行评价。Shin和Kim(同上)已报道了催化乙偶姻转化为3-氨基-2-丁醇的磷酸吡口多醛依赖型转氨酶的实例。本文实施例13中显示这种酶既能将乙偶姻的(R)异构体转化为3-氨基-2-丁醇的(2R,3S)异构体,又能将乙偶姻的(S)异构体转化为3-氨基-2-丁醇的(2S,3S)异构体。任一类型的酶(即转氨酶或还原胺化酶)被认为是乙偶姻胺化酶,并且可以用于产生2-丁醇。该组中其它酶可以具有不同的立体特异性。技术人员将理解,从多种来源分离的具有乙偶姻胺化酶活性的多肽可用于本发明中,而与序列同源性无关。这种活性的一个实例已经在本文中有所描述,并且筌定为SEQIDNO:122。因此,优选的乙偶姻胺化酶是与SEQIDNO:122具有至少80%-85%的同一性的那些酶,其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质4又重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。(d)3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯:本领域中尚无已知酶催化底物3-氨基-2-丁醇(III)至产物3-氨基-2-丁醇磷酸酯(IV)的转化。然而,一些假单胞菌属(Pseudomonas)和欧文氏菌属(Erwinia)的菌种已经显示可表达ATP依赖型乙醇胺激酶(EC2.7.1.82),该激酶允许它们利用乙醇胺或l-氨基-2-丙醇作为氮源(Jones等人,(1973)Biochem丄134:167-182)。有可能该酶还具有对3-氨基-2-丁醇的活性或可以被工程化而实现该活性,由此提供氨基丁醇激酶。本发明在实施例14中描述了胡萝卜软腐欧文氏菌黑胫亚种的一种基因(SEQIDNO:123),该基因编码一种蛋白质(SEQIDNO:24),这种蛋白质已鉴定为氨基醇激酶。该酶可用于将3-氨基-2-丁醇转化为3-氨基-2-丁醇O-磷酸酯。技术人员将理解,分离自多种来源的具有氨基丁醇激酶活性的多肽将可用于本发明,而不依赖于序列同源性。该活性的一个实例已经在本文中有所描述,并鉴定为SEQIDNO:124。因此,优选的氨基丁醇激酶是与SEQIDNO:124具有至少80%-85%的同一性的那些酶,其中至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。(e)3-氨基-2-丁醇磷酸酯转化为2-丁酮:虽然未报道有酶催化底物3-氨基-2-丁醇磷酸酯(IV)至产物2-丁酮(V)的转化,但是该底物非常类似于存在于少量假单胞菌属和欧文氏菌属菌种中由磷酸吡哆醛依赖型磷酸乙醇胺磷酸裂解酶所利用的那些底物。这些酶对磷酸乙醇胺和2-磷酸-1-氨基丙烷的两种对映体(Jones等人,(1973)Biochem丄134:167-182)都具有活性,而且还对3-氨基-2-丁醇0-磷酸酯具有活性。本发明描述了一种胡萝卜软腐欧文氏菌黑胫亚种的基因(SEQIDNO:125),该基因编码与III类转氨酶具有同源性的蛋白质(SEQIDNO:126)。实施例15证明这种酶对氨丙醇磷酸酯和氨基丁醇磷酸酯底物两者均具有活性。新鉴定和表征的酶能够催化(R)-3-氨基-(S)-2-丁醇O-磷酸酯和(S)-3-氨基-(R)-2-丁醇O-磷酸酯的混合物以及(R)-3-氨基-(R)-2-丁醇O-磷酸酯和(S)-3-氨基-("-2-丁醇o-磷酸酯的混合物向2-丁酮的转化。新鉴定和表征的酶也能够催化(R)和(S)-2-氨基-1-丙醇磷酸酯两者向丙酮的转化,优先催化(S)-2-氨基-l-丙醇磷酸酯的转化。利用建议的天然底物DL-l-氨基-2-丙醇磷酸酯时,可观察到最高的活性,该底物被转化为丙醛。技术人员将理解,分离自多种来源的具有氨基丁醇磷酸酯磷酸裂解酶活性的多肽将可用于本发明,而不依赖于序列同源性。合适的氨基丁醇磷酸酯磷酸裂解酶的一个实例在本文中描述为SEQIDNO:126。因此,优选的氨基丁醇磷酸酯磷酸裂解酶是与SEQIDN0126具有至少80%-85%的同一性的那些酶,其中至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。(f)2-丁酮转化为2-丁醇:在所有途径中从丙酮酸产生2-丁醇的最后步骤是2-丁酮(V)还原为2-丁醇(VI)。该底物向产物的转化是由^[艮广的一类醇脱氲酶(取决于酶,是利用NADH或利用NADPH作为氬化物源的类型)中的一些成员催化,这些成员可以被称为丁醇脱氢酶。催化2-丁酮还原的每种酶是众所周知的,如上文对丁醇脱氲酶的定义中所述。技术人员将理解,分离自多种来源的具有丁醇脱氲酶活性的多肽将可用于本发明中,而不依赖于序列同源性。合适的丁醇脱氬酶的一些实例可得自多种来源,例如,赤红球菌[GenBankNo:CAD36475(SEQIDNO:14),AJ491307(SEQIDNO:13)]。NADP依赖型酶称为EC1.1.1.2,可得自例如强烈炽热球菌[GenBankNo:AAC25556(SEQIDNO:91),AF013169(SEQIDNO:90)]。另外,丁醇脱氢酶可得自大肠杆菌[GenBankNo:NP—417484(SEQIDNO:75),NC—000913(SEQIDNO:74)],环己醇脱氢酶可得自不动杆菌[GenBankNo:AAG10026(SEQIDNO:72),AF282240(SEQIDNO:71)]。优选的丁醇脱氢酶是与SEQIDN014、91、75和72具有至少80%-85%的同一性的那些酶,其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。途径2:(a)丙酮酸转化为a-乙酰乳酸:该底物向产物的转化与上文对途径1所述的一样。(b)a-乙酰乳酸转化为乙偶姻:该底物向产物的转化与上文对途径1所述的一样。(g)乙偶姻转化为^!酸乙偶姻:尽管尚未描述催化底物乙偶姻(II)至产物磷酸乙偶姻(VII)的转化的酶,但是底物乙偶姻的结构与二羟基丙酮的结构非常类似,因此乙偶姻对二羟基丙酮激酶(EC2.7丄29)(催化二羟基丙酮磷酸化的酶)来说是一种可接受的底物。用于改变酶的底物特异性的蛋白质工程技术是众所周知的(Antikainen和Martin(2005)Bioorg.Med.Chem.13:2701-2716),并且可用于产生具有所需特异性的酶。在这种转化中,磷酸部分可由任何高能生物磷酸供体提供,而常见的底物是磷酸烯醇式丙酮酸(如在大肠杆菌二羟基丙酮激酶的情况下)和ATP(如在弗氏柠檬酸杆菌二羟基丙酮激酶的情况下)(Garcia-Alles等人,(2004)Biochemistry43:13037-13045)。(h)磷酸乙偶姻转化为3-氨基-2-丁醇O-磷酸酯:尽管尚未描述催化底物磷酸乙偶姻(VII)至产物3-氨基-2-丁醇O-磷酸酯(IV)的转化的酶,但是该底物的结构与磷酸二鞋基丙酮的结构非常类似,磷酸二羟基丙酮是所提出的由短根瘤菌属(Brac/,/nz(^mm)—些菌种的rtxA基因的5,部分所编码的磷酸丝氨醇转氨酶的底物(Yasuta等人,同上)。因此,磷酸丝氨醇转氨酶可在该步骤中起作用。(e)3-氨基-2-丁醇O-磷酸酯转化为2-丁酮:该底物向产物的转化与上文对途径1所述的一样。(f)2-丁酮转化为2-丁醇:该底物向产物的转化与上文对途径1所述的一样。途径3:(a)丙酮酸转化为a-乙酰乳酸:该底物向产物的转化与上文对途径1所述的一样。(b)a-乙酰乳酸转化为乙偶姻:该底物向产物的转化与上文对途径1所述的一样。(i)乙偶姻转化为2,3-丁二醇:底物乙偶姻(II)至产物2,3-丁二醇(VIII)的转化可由丁二醇脱水氪酶催化,当进行还原时丁二醇脱氲酶可利用NADH或利用NADPH作为还原当量的来源。对乙偶姻具有活性的酶参与产生2,3-丁二醇的生物体中产生2,3-丁二醇的途径。所报道的酶(如来自肺炎克雷伯菌的40BudC(Ui等人,(2004)LettersinAppliedMicrobiology3义533-537))通常利用NADH。可接受任一种辅因子用于通过该途径产生2-丁醇。技术人员将理解,分离自多种来源的具有丁二醇脱氪酶活性的多肽将可用于本发明,而不依赖于序列同源性。合适的丁二醇脱氬酶的一些实例可得自多种来源,例如,肺炎克雷伯菌(GenBankNo:BBA13085(SEQIDNO:6),D86412(SEQIDNO:5))。(R)-特异性的丁二醇脱氢酶称为EC1.1.1.4,可得自例如蜡状芽孢杆菌[GenBankNo.NP—830481(SEQIDNO:85),NC—004722(SEQIDNO:84);AAP07682(SEQIDNO:87),AE017000(SEQIDNO:86)]和乳酸乳球菌[GenBankNo.AAK04995(SEQIDNO:89),AE006323(SEQIDNO:88)]。优选的丁二醇脱氢酶是与SEQIDN06、85、87和89具有至少80%-85%的同一性的那些酶,其中至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。(j)2,3-丁二醇转化为2-丁酮:底物2,3-丁二醇(VIII)至产物2-丁酮(V)的转化可由二醇脱水酶(EC4.2.1.28)和甘油脱水酶(EC4.2丄30)催化。得到最好表征的二醇脱水酶是辅酶B12依赖型产酸克雷伯菌酶,但是类似的酶存在于多种肠道细菌中。该产酸克雷伯菌酶已显示出可接受内消旋-2,3-丁二醇作为底物(Bachovchin等人,(1977)Biochemistryl6:1082-1092),产生所需的产物2-丁酮。实施例17证明了肺炎克雷伯菌甘油脱水酶能够将内消旋-2,3-丁二醇转化为2-丁酮。肺炎克雷伯菌甘油脱水酶的三个亚基(a:SEQIDNO:145(编码区)和146(蛋白质);(3:SEQIDN〇147(编码区)和148(蛋白质);和y:SEQIDNO:149(编码区)和SEQIDNO:150(蛋白质))连同肺炎克雷伯菌甘油脱水酶再激活酶的两个亚基(大亚基,SEQIDNO:151(编码区)和152(蛋白质);和小亚基,SEQIDNO:153(编码区)和SEQIDNO:154(蛋白质))一起表达以提供活性。文献中还报道了来自乙二醇梭菌(Clostridiumglycolicum)的B12-依赖型二醇脱水酶(Hartmanis等人,(1986)Arch.Biochem.Biophys.245:144-152)。该酶对2,3-丁二醇具有活性,尽管这种活性不到对乙二醇的活性的1%,但是可以工程改造该酶以提高该活性。得以较好表征的B12-依赖型脱水酶是来自丁酸梭菌(Clostridiumbutyricum)的甘油脱水酶(O'Brien等人,(2004)Biochemistry43:4635-4645),其对1,2-丙二醇以及甘油具有高活性。该酶利用S-腺苷曱硫氨酸作为腺苷基的来源。该酶对2,3-丁二醇的活性尚未有报道,但是这种活性(如果还未存在),也可以进行工程改造。技术人员将理解,分离自多种来源的具有丁二醇脱氢酶活性的多肽将可用于本发明,而不依赖于序列同源性。如上文指出的,多种二醇和甘油脱水酶已经在文献中描述并将适用于本发明。因此,根据本发明的一个方面,优选的二醇和甘油脱水酶是与其大亚基、中等亚基和小亚基分别具有如下序列的酶具有至少80%-85%同一性的那些a)SEQIDNOb)SEQIDNOc)SEQIDNOd)SEQIDNOe)SEQIDNOf)SEQIDNOg)SEQIDNOh)SEQIDNO及i)SEQIDNO:8、SEQIDNO:10和SEQIDNO:12;93、SEQIDNO:95和SEQIDNO:97;99、SEQIDNO:101和SEQIDNO:103;105、SEQIDNO135、SEQIDNO138、SEQIDNO146、SEQIDNO141、SEQIDNO107和SEQIDNO136和SEQIDNO139和SEQIDNO148和SEQIDNO142和SEQIDNO:109137140150143166,以164、SEQIDNO:165和SEQIDNO:其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分=0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。类似地,优选的二醇和甘油脱水酶是与其大亚基、中等亚基和小亚基分别具有如下序列的酶具有至少80%-85%同一性的那些大亚基SEQIDNO:8、99、105、135、138、141、146和164;中等亚基SEQIDNO:10、101、107、136、139、142、148和165;小亚基SEQIDNO:12、103、109、137、140、143、150和166;其中具有至少85%-90%的同一性是更优选的,并且其中基于ClustalW比对方法(采用默认参数空位罚分=10,空位长度罚分-0.1和蛋白质权重矩阵为Gonnet250系列),具有至少95%的同一性是最优选的。42可用于本发明的生物合成途径3的其它二醇和甘油脱水酶是通过在下面以及在实施例18中描述的生物信息学结构/功能分析来鉴定。(f)2-丁酮转化为2-丁醇-.该底物向产物的转化与上文对途径1所述的一样。用于生物合成途径3的二醇和甘油脱水酶作为二醇和甘油脱水酶的任何酶可在本发明中用于将2,3-丁二醇转化为2-丁酮。酶类型EC4.2.1.28和EC4.2.1.30中的二醇和甘油脱水酶的结构/功能关系分别在本文实施例18中建立。功能由实验数据提供而结构通过生物信息学分析提供。分析了具有已经通过实验证明的活性的八种二醇和甘油脱水酶。在该组酶中(在表10中列出),产酸克雷伯菌二醇脱水酶和肺炎克雷伯菌甘油脱水酶两者均显示将2,3-丁二醇转化为2-丁酮(分别在Bachovchin等人,(1977)Biochemistry16:1082-1092和本文17中显示),而对另外六种酶的活性则利用它们的天然底物进行了证明(参考文献在表10中给出)。利用HMMER软件包的hmmsearch算法(JaneliaFarmResearchCampus,Ashburn,VA)分析了这组八种二醇和甘油脱水酶。将该hmmsearch算法的Z参数设定为10亿。利用一组蛋白质序列进行的HMMER分析的输出是分布型隐马尔可夫才莫型(ProfileHiddenMarkovModel)(分布型HMM(ProfileHMM))。分布型HMM依据的理论由Durbin等人,Biologicalsequenceanalysis:probabilisticmodelsofproteinsandnucleicacids,CambridgeUniversityPress,1998;Krogh等人,1994;J.Mol.Biol.235:1501-1531进行了描述(将其以引用的方式并入本文),该方法基于每种氨基酸在蛋白质集的比对中每个位置上出现的概率来表征所述蛋白质集。由于用来分析的具有实验验证的功能的八种二醇和甘油脱水酶(二醇/甘油脱水酶)的每种酶具有三个亚基(大亚基或a亚基、中等亚基或卩亚基和小亚基或Y亚基),故对每种亚基构建单独的分布型HMM。大亚基的分布型HMM(表12)用具有表1和表2中描述的SEQIDNO:8、99、105、135、138、141、146和164的蛋白质构建。中等亚基分布型HMM(表13)用具有表1和表2中描述的SEQIDNO:10、101、107、136、139、142、148和165的蛋白质构建。小亚基分布型HMM(表14)用具有表1和表2中描述的SEQIDNO:12、103、109、137、140、143、150和166的蛋白质构建。提供功能测定法数据的参考文献在表10中给出。为大亚基构建的分布型HMM给出了对二醇/甘油脱水酶的功能性大亚基的结构表征。类似地,为中等亚基和小亚基构建的分布型HMM分别给出了对二醇/甘油脱水酶对功能性中等亚基和小亚基的结构表征。因此,将与大亚基、中等亚基或小亚基的分布型HMM具有显著匹配的任何蛋白质直4妻与所述分布型HMM对应的亚基的功能关联。要具有显著性,则所述的匹配具有的E-值为0.01或更小,其它"匹配"的用法应该理解为符合该E-值标准。因而,可用于本发明的二醇/甘油脱水酶亚基是匹配这样的分布型HMM的蛋白质,即该分布型HMM是用具有上文列出的SEQIDNO的蛋白质构建,其中E-值为0.01或更小。全长的并且通过匹配大亚基分布型HMM而与所述二醇/甘油脱水酶的大亚基具有功能关联的蛋白质,包括但不限于具有SEQIDNO:93、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259的蛋白质。全长的并且通过匹配中等亚基分布型HMM而与所述二醇/甘油脱水酶的中等亚基具有功能关联的蛋白质,包括但不限于具有SEQIDNO:95、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167的蛋白质。全长的并且通过匹配小亚基分布型HMM而与所述二醇/甘油脱水酶的小亚基具有功能关联的蛋白质,包括但不限于具有SEQIDNO:97、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274的蛋白质。此外,全长的并且通过匹配大亚基和中等亚基分布型HMM而与所述二醇/甘油脱水酶的大亚基和中等亚基具有功能关联的蛋白质,包括但不限于具有SEQIDNO:233、235、237、239、241、246和247的蛋白质。由于上述分布型HMM提供了二醇/甘油脱水酶的结构/功能关系,匹配这些分布型HMM的新鉴定的蛋白质也可以用于本发明。此外,可用于本发明的二醇/甘油脱水酶亚基蛋白质序列包括具有的氨基酸变化对亚基功能具有最小影响的蛋白质,其基本上类似于上文列出的SEQIDNO的序列。本领域技术人员将理解,对所编码的蛋白质的功能特性不产生影响的、化学等价的氨基酸在给定位点处的置换是常见的。为本发明的目的,将提供基本相似的蛋白质的置换定义为下列五组中的一组内的交才灸1.小的脂族非极性残基或微弱极性的残基Ala、Ser、Thr(Pro、Gly);2.极性的、带负电荷的残基和它们的酰胺Asp、Asn、Glu、Gln;3.极性的、带正电荷的残基His、Arg、Lys;4.大的脂族非才及性残基Met、Leu、Ile、Val(Cys);和5.大的芳族残基Phe、Tyr、Trp。因而,可以预计这些组中一个氨基酸置换另一个氨基酸产生功能等价的蛋白质。在许多情况下,导致蛋白质的N-端和C-端部分改变的变化也将预计不会改变蛋白质的活性。与匹配分布型HMM的那些SEQID基本类似的蛋白质可以在氨基酸序列上与其中一种匹配蛋白质具有90%或95%的同一性,并且这些蛋白质可以用于本发明。本领域技术人员可以容易地鉴定一组可以一起用于提供功能性二醇/甘油脱水酶三种亚基。尤其合适的是来自相同生物体的大亚基、中等亚基和小亚基的组合,它们的编码区在基因组中的位置相互接近。这些亚基将最有可能形成天然的二醇或甘油脱水酶。许多大亚基、中等亚基和小亚基以表2中的这种方式分组。来自亲缘关系接近的菌株或物种的亚基的组合适于构成二醇脱水酶或甘油脱水酶。可以使用催化2,3-丁二醇转化为2-丁酮的任何亚基组合。通过氨基酸序列比较和/或功能测定法,本领域技术人员可以容易地确定有效的亚基组合。因此,本发明提供了二醇和甘油脱水酶,其具有包含全长的大亚基、中等亚基和小亚基的氨基酸序列,当利用分布型隐马尔可夫模型进行查询时每个所述亚基得到的E值参数为0.01或更小,其中所述的分布型隐马尔可夫模型用如下亚基构建SEQIDNO:8、99、105、135、138、141、146和164的大亚基;SEQIDNO:10、101、107、136、139、142、148和165的中等亚基;和SEQIDNO:12、103、109、137、140、143、150和166的小亚基;每次查询采用其中Z参数设定为104乙的hmmsearch算法进4亍。作为另一种选择,本发明提供了二醇和甘油脱水酶,其具有通过如下方法鉴定的氨基酸序列a)从对应二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型,其中i)大亚基包含选自由如下序列组成的组的氨基酸序列SEQIDNO:8、99、105、135、138、141、146和164;H)中等亚基包含选自由如下序列组成的组的氨基酸序列SEQIDNO:10、101、107、136、139、142、148和165;以及iii)小亚基包含选自由如下序列组成的组的氨基酸序列SEQIDNO:12、103、109、137、140、143、150和166;b)利用其中Z参数设定为10亿以及E值参数设定为0.01的hmmsearch算法,用(a)的隐马尔可夫才莫型查询至少一个公开的含二醇和甘油脱水酶序列的蛋白质序列数据库,以鉴定二醇和甘油脱水酶氨基酸序列的第一数据集;以及c)从(b)的第一数据集移除任何部分序列以产生二醇和甘油脱水酶氨基酸序列的笫二数据集,其中二醇脱水酶和甘油脱水酶得以鉴定。对于本发明的二醇和甘油脱水酶大亚基,该酶可以包含这样的大亚基,该大亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95%的同一性的氨基酸序列SEQIDNO:8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259,所述的序列同一性是基于ClustalW比对方法计算,该比对方法使用如下默认参数空位罚分=10,空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列。对于本发明的二醇和甘油脱水酶中等亚基,该酶可以包含这样的中等亚基,该中等亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95%的同一性的氨基酸序列SEQIDNO:10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167,所述的序列同一性是基于ClustalW比对方法计算,该比对方法使用如下默认参数空位罚分=10,空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列。对于本发明的二醇和甘油脱水酶小亚基,该酶可以包含这样的小亚基,该小亚基包含与选自由以下序列组成的组的氨基酸序列具有至少95%的同一性的氨基酸序列SEQIDNO:12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274、所述的序列同一性是基于ClustalW比对方法计算,该比对方法使用如下默认参数空位罚分=10,空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列。作为另外一种选"f奪,二醇脱水酶或甘油脱水酶可以包含融合的大亚基、中等亚基和小亚基,该融合的大亚基、中等亚基和小亚基包含与选自由如下序列组成的组的氨基酸序列具有至少95%的同一性的氨基酸序列SEQIDNO:233、235、237、239、241、246和247,所述的序列同一性是基于ClustalW比对方法计算,该比对方法使用如下默认参数空位罚分=10,空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列。作为另一种选才奪,该二醇脱水酶或甘油脱水酶可以包含融合的大亚基、中等亚基和小亚基并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95%的同一性,其中所述三条氨基酸序列选自由如下序列组成的组SEQIDNO:95和SEQIDNO:97;a)SEQIDNO8,Sb)SEQIDNO93,c)SEQIDNO99,d)SEQIDNO105,e)SEQIDNO135,f)SEQIDNO138,g)SEQIDNO146,SEQIDNO107和SEQIDNO136和SEQIDNO139和SEQIDNO148和SEQIDNO109137140150h)SEQIDNO:141,SEQIDNO:142和SEQIDNO:143;以及i)SEQIDNO:164,SEQIDNO:165和SEQIDNO:166;所述的序列同一性是基于ClustalW比对方法计算,该比对方法使用如下默认参数该比对方法使用如下默认参数空位罚分=10,空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列。途径4:(a)丙酮酸转化为a-乙酰乳酸:该底物向产物的转化与上文对途径1所述的一样。(k)a-乙酰乳酸转化为2,3-二羟基-2-甲基丁酸:底物乙酰乳酸(I)至产物2,3-二羟基-2-曱基丁酸(IX)的转化是本领域未知的。然而,该转化的产物作为发酵肉汤培养基的组分已经有报道(Ziadi等人,(1973)ComptesRendusdesSeancesdel,AcademiedesSciences,SerieD:SciencesNaturelles276:965-8),4旦是形成的才几理未知。可能的形成机理是用NADH或NADPH作为电子供体还原乙酰乳酸。要利用该途径来产生2-丁醇,则需要鉴定或工程改造催化该反应的酶。然而,关于酮到醇的酶促还原反应的先例是得到确认的。(1)2,3-二羟基-2-曱基丁酸转化为2-羟基-2-曱基-3-磷酸基丁酸:尚不知道可催化底物2,3-二羟基-2-甲基丁酸(IX)至产物2-羟基-2-曱基-3-磷酸基丁酸(X)转化的酶。然而,自然界中存在大量的激酶,它们具有多样化的特异性。因此,有可能进行分离或工程改造而得到具有该活性的酶。(m)2-鞋基-2-曱基-3-磷酸基丁酸转化为2-丁酮:尚不知道可催化底物2-羟基-2-甲基-3-磷酸丁酸(X)至产物2-丁酮(V)转化的酶。该反应与前一反应的组合非常类似于由甲羟戊酸-5-焦磷酸(M5PP)脱羧酶催化的多步反应,该多步反应包括最初将M5PP磷酸化而转化为3-磷酸基甲羟戊酸-5-PP以及随后依赖脱羧作用去除磷酸(Alvear等人,(1982)Biochemistry21:4646-4650)。(f)2-丁酮转化为2-丁醇:该底物至产物的转化与上文对途径1所述的一样。因而,在提供,人丙酮酸至2-丁醇的多条重组途径中,存在多种选择来实现各个转化步骤,并且本领域技术人员将能够利用可公开获得的序列以及本文所公开的序列来构建相关途径。上面表1和2中给出了本领域内已知的并且可用于构建2-丁醇生物合成途径的众多代表性基因的列表。用于生产2-丁醇和2-丁酮的微生物宿主用于生产2-丁醇或2-丁酮的^:生物宿主可以选自细菌、蓝细菌、丝状真菌和酵母。用于生产2-丁醇或2-丁酮的微生物宿主应能耐受所产生的产物,从而产率不会受产物对宿主的毒性限制。用于生产2-丁醇的微生物宿主的选择将在下面进行详细描述。同样的标准也适用于对生产2-丁酮的宿主的选择。在高滴度水平的2-丁醇下代谢活跃的微生物是不为本领域所熟知的。尽管已从产溶剂梭菌(卵/ve^ogem'cC/oW〃t/,")中分离了丁醇耐受性突变体,但有关其它潜在可用的细菌菌抹的丁醇耐受性方面的信息几乎没有。关于细菌醇耐受性的比较的大部分研究表明,丁醇的毒性大于乙醇(deCavalho等人,Microsc.Res.Tech.64:215-22(2004)和Kabelitz等人,FEMSMicrobiol.Lett.220:223-227(2003))。Tomas等人(J.Bacteriol.l86:2006-2018(2004))报道,1-丁醇的产率在丙酮丁醇梭菌(C/oWn力'wmaceto^(y"cwm)发酵期间可能会受丁醇毒性的限制。1-丁醇对丙酮丁醇梭菌的主要影响是破坏膜功能(Hermann等人,Appl.Environ.Microbiol.50:1238-1243(1985))。选择用于生产2-丁醇的微生物宿主应能耐受2-丁醇并且应该能利用引入的生物合成途径将碳水化合物转化成2-丁醇。选择合适微生物宿主的标准包括如下对2-丁醇的固有耐受性、对碳水化合物的高利用率、用于基因操纵的遗传工具的可用性以及产生稳定的染色体变异的能力。具有2-丁醇耐受性的合适宿主菌抹可以通过基于菌抹的固有耐受性进行筛选而鉴定。微生物对2-丁醇的固有耐受性可以通过测定在基本培养基中培养时,造成生长率50%抑制的2-丁醇浓度(IC50)来测量。IC50值可以利用本领域已知的方法来确定。例如,可让所关注的微生物在含有多种量的2-丁醇的情况下生长,通过测量600纳米下的光密度来监测生长率。倍增时间可以从生长曲线的对数部分计算并用作生长率的量度。产生50°/。生长抑制的2-丁醇的浓度可以从生长抑制百分比对2-丁醇浓度的曲线图测定。优选地,宿主菌抹对2-丁醇的IC50应该大于约0.5%的IC50。更合适的是对2-丁醇的IC50大于约1.5%的宿主菌抹。尤其合适的是对2-丁醇的IC50大于约2.5%的宿主菌株。用于生产2-丁醇的微生物宿主也应对葡萄糖和/或其它碳水化合物具有高利用率。大多数微生物都能够利用碳水化合物。然而,某些环境微生物不能有效地利用碳水化合物,并因而将不会是合适的宿主。遗传修饰宿主的能力对任何重组微生物的产生来说十分关键。可采用的基因转移技术模式包括电穿孔、接合、转导或自然转化。可利用多种宿主接合性质粒和药物抗性标记。基于可在宿主中产生作用的抗生素抗性标记的性质,针对该宿主生物体定制用于生物体的克隆载体。也可以操纵微生物宿主以便通过使多种基因失活而使竟争碳流的途径失活。这就需要存在转座子或染色体整合载体用以引导失活。另外,通过化学诱变和突变株筛选,受化学诱变的生产宿主可能经历固有2-丁醇耐受性的提高。基于上述标准,用于生产2-丁醇和2-丁酮的合适微生物宿主包括但不限于梭菌属(C/oWnW/wm)、发酵单胞菌属(Zymomo"w)、埃希氏菌属(i^c/^"'c/2/")、沙门氏菌属(5W,we〃a)、红球菌属(W/zofiococcws)、,i单月包菌属(尸《ew(iomcW(aw)、芽孑包斥干菌属(Siacz'〃w5)、乳酸菌属(Z^"6>/)"cz'〃z^)、肠5求菌属(iwferacoccw51)、片5求菌属(尸e(i/ococcwi1)、产石咸斥干菌属(爿/ca/z'geww)、克雷伯菌属(Klebsiella)、类芽月包4干菌属(尸"em'6""'〃ws)、节4干菌属(y4w/2rc^"c,er)、才奉状4干菌属(Co/7"eZ^"en.wm)、#豆才干菌属(i^e"W6acfen'wm)、毕赤酵母属(尸z'c/2/")、假丝酵母属(Candida)、汉逊酵母属(//a朋eww/a)和酵母属(S""cc/^row_ycM)的成员。优选的宿主包括大肠杆菌、真养产石咸杆菌(y4/ca/Zge/e51ew/>*o/7/zz^)、地衣芽孑包軒菌(Bacz'〃ws//c/zem/br脂'5)、浸麻类芽孑包杆菌(尸aem'Z)ac/〃z^附acera朋)、红串红球菌(W/zoc/ococcz^eo^/zrapo//^*)、恶臭单月包菌(尸^W(iomow^;w〃(ia)、才直物乳才干菌(丄ac,o6(2"'〃w5"//(2wtorww)、屎肠J求菌(EVz/^ncoccw5力e"'w附)、享鸟7鸟肠5求菌(EVfen9coccw5ga〃/""rz'wm)、粪肠5求菌(五w化n9Coccws/aec"/z'《)、戊糖片球菌(7Wz.ococcw61pe幽Mcew5)、乳酸片球菌(/W/ococcw5*)、枯草芽孢杆菌(5a"'〃ww6"fe)和酉良酒酵母50生产宿主的构建可以采用本领域已知的技术构建含有编码将可发酵碳底物转化至2-丁醇或2-丁酮的酶途径的必需基因的重组生物体。在本发明中,编码2-丁醇生物合成途径3中的酶(乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氲酶、丁二醇脱水酶和丁醇脱氲酶)或编码省略了丁醇脱氲酶的2-丁酮生物合成途径3的酶的基因可以分离自如上所述的多种来源。从细菌基因组中获得所需基因的方法是分子生物学领域中常用并且为人所熟知的。例如,如果基因序列已知,则可以设计引物并采用标准的引物引导的扩增方法(例如聚合酶链反应(美国专利No.4,683,202))扩增所需序列,以获得适于克隆进表达载体内的量的DNA。如果要分离与已知序列异源的基因,则可以通过限制性内切酶消化来产生合适的基因组文库并且可以用具有与所需基因序列互补的序列的探针来筛选。一旦分离了序列,即可以用标准的引物引导的扩增方法(例如聚合酶链反应(美国专利No.4,683,202))来扩增DNA,以获得适于克隆进表达载体中的量的DNA,然后将该表达载体转化至合适的宿主细胞内。另外,给定具有所需酶活性的蛋白质的氨基酸序列时,则可通过逆翻译该蛋白质序列的来确定编码序列。含有该编码序列的DNA片段可以通过合成制备并将其克隆至表达载体内,然后将该表达载体转化到所需的宿主细月包内。制备含有编码序列的合成DNA片段时,可以优化该序列用以在目标宿主细胞中表达。用于优化密码子以在异源宿主细胞内表达的工具很容易得到。一些密码子优化工具可基于宿主生物体的GC含量获得。表3中给出了一些示例性微生物宿主的GC含量。表3微生物宿主的GC含量菌抹%GC地衣芽胞杆菌46枯草芽胞杆菌42丙酮丁醇梭菌37大肠杆菌50恶臭假单胞菌61真养产碱杆菌61浸麻类芽孢杆菌51红串红球菌62短芽孢杆菌属50多粘类芽胞軒菌(尸aem力a"'〃w5/o(y,;m)50一旦鉴定并分离了相关途径的基因,即可将它们通过本领域中已知的方法转化到合适的表达宿主内。可用于转化多种宿主细胞的载体是常见的并且可以从一些7>司商购获得,例如EPICENTRE(Madison,WI)、InvitrogenCorp.(Carlsbad,CA)、Stratagene(LaJolla,CA)和NewEnglandBiolabs,Inc.(Beverly,MA)。通常,载体含有选择性标记和允许在所需宿主中自主复制或染色体整合的序列。另外,合适的载体包含具有转录起始控制功能的启动子区和转录终止控制区,在该启动子区和转录终止控制区之间可以插入编码区DNA片段,以提供插入该编码区的表达。这两种控制区均可来源于与转化的宿主细胞同源的基因,但是应当理解,这种控制区也可能来源于对被选择作生产宿主的特定物种来说是非天然的基因。可用于驱动相关途径编码区在所需宿主细胞中表达的起始控制区或启动子有很多,并且为本领域技术人员所熟悉。事实上,驱动这些遗传元件的任何启动子都适用于本发明,所述的启动子包括但不限于源于以下基因的启动子CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PH〇5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI、CUP1、FBA、GPD和GPM(可用于在酵母菌属中表达);AOXl(可用于在毕52赤酵母菌属中表达);以及lac、ara、tet、trp、IPL、IPR、T7、tac和trc启动子(可用于在大肠杆菌、产碱杆菌属和假单胞菌属中表达);amy、apr和npr启动子,以及多种噬菌体启动子(可用于在枯草芽胞杆菌、地衣芽孢杆菌和浸麻类芽孢杆菌中表达);nisA(可用于在革兰氏阳性菌中表达,Eichenbaum等人,Appl.Environ.Microbiol.64(8):2763-2769(1998));以及合成的Pll启动子(可用于在植物乳杆菌中表达,Rud等人,Microbiologyl52:1011-1019(2006))。终止控制区也可以源于优选宿主天然的多种基因。任选地,终止位点可能是不必要的,然而,如果含有终止位点则是最优选的。某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。可利用pRK404和三种相关载体pRK437、pRK442及pRK442(H)的完整且有注释的序列。这些衍生物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具(Scott等人,Plasmid50(1):74-79(2003))。广宿主范围的IncP4质粒RSF1010的几种衍生质粒也可获得,其具有在一系列革兰氏阴性菌中发挥功能的启动子。质粒pAYC36和pAYC37具有活性启动子以及多克隆位点以允许异源基因在革兰氏阴性菌中表达。染色体基因置换工具也可广泛获得。例如,将广宿主范围的复制子pWV101的热敏性变体进行改良以构建可用于在一系列革兰氏阳性菌内实现基因置换的质粒pVE6002(Maguin等人,J.Bacterio1.174(17):5633-5638(1992))。另外,体外转座体可得自商业来源(例如EPICENTRE),用以在各种基因組中产生随机突变。2-丁醇生物合成途径在多种优选的微生物宿主中的表达在下面进行了更详细地描述。对于2-丁酮生物合成途径的表达,以下描述同样适用,但省略了最后的底物2-丁酮至产物2-丁醇的转化。.2-丁醇或2-丁酮生物合成途径在大肠杆菌中的表达可用于转化大肠杆菌的载体是4艮普遍的并且可以从上述公司中商购获得。例如,可以将2-丁醇生物合成途径的基因从上述的多种来源分离,将其克隆至改良的pUC19载体上并转化进大肠杆菌NM522中,如实施例6和7所述。作为另外一种选4爭,可以将编码2-丁醇生物合成途径的基因分至多个操纵子中,克隆到表达载体上,并转化至多种大肠杆菌菌林内,如实施例9、10和11中所述。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氪酶。2-丁醇或者2-丁酮生物合成途径在红串红球菌中的表达一系列大肠杆菌-红球菌穿梭载体可用于在红串红球菌中表达,所述穿梭载体包括但不限于pRhBR17和pDA71(Kostichka等人,Appl.Microbiol.Biotechnol.62:61-68(2003))。另外,一系列启动子可用于异源基因在红串红球菌中表达(参见例如Nakashima等人,Appl.Environ.Microbiol.70:5557-5568(2004),以及Tao等人,Appl.Microbiol.Biotechnol.2005,DOI10.1007/s00253-005-0064)。红串红球菌染色体基因中的靶向基因中断(Targetedgenedisruption)可以利用Tao等人(同上),和Brans等人(Appl.Envion.Microbiol.66:2029-2036(2000))所述的方法产生。最初可以将如上所述的产生2-丁醇所需的异源基因克隆至pDA71或pRhBR71内,并转化进大肠杆菌中。然后,可以通过电穿孔将载体转化进红串红球菌中,如Kostichka等人(同上)所述。重组体可以在含有葡萄糖的合成培养基中生长,并随后可以利用本领域已知的发酵方法产生2-丁醇。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氬酶。2-丁醇或者2-丁酮生物合成途径在枯草芽孢杆菌中的表达枯草芽孢杆菌中基因表达及突变产生的方法也是本领域所熟知的。例如,2-丁醇生物合成途径的基因可以分离自多种来源,如上所述,将其克隆进改良的大肠杆菌-杆菌穿梭载体内,然后转化进枯草芽孢杆菌BE1010内,如实施例8所述。可以将所需基因克隆进杆菌属表达载体内并将其转化进菌抹中以制备生产宿主。作为另外一种选择,可以利用本领域技术人员已知的条件复制子或者自杀载体将基因整合到杆菌染色体内。例如,BacillusGeneticStockCenter(芽孢杆菌遗传保藏中心)拥有众多整合载体。2-丁酮生物合成途径也可相似地表达,但省,咯丁醇脱氲酶。2-丁醇或2-丁酮生物合成途径在地衣芽孢杆菌中的表达在枯草芽孢杆菌中复制的大多数质粒和穿梭载体可用于通过原生质体转化或电穿孔来转化地衣芽孢杆菌。产生2-丁醇所需的基因可以被克隆进质粒pBE20或pBE60衍生物(Nagarajan等人,Genell4:121-126(1992))内。转化地衣芽孢杆菌的方法是本领域已知(例如,参见Fleming等人,Appl.Environ.Microbiol.,61(11):3775-3780(1995))。构建用于在枯草芽孢杆菌中表达的质粒可以被转化进地衣芽孢杆菌内以产生可生产2-丁醇的重组微生物宿主。2-丁酮生物合成途径可以类似地表达,但省略丁醇脱氲酶。2-丁醇或2-丁酮生物合成途径在浸麻类芽孢杆菌中的表达可按照上面关于在枯草芽孢杆菌中表达的描述构建质粒,并通过原生质体转化法将该质粒用于转化浸麻类芽孢杆菌,以产生可生产2-丁醇的重组微生物宿主。2-丁酮生物合成途径可以类似地表达,但省略丁醇脱氲酶。2-丁醇或2-丁酮生物合成途径在真养产碱杆菌中的表达用于在真养产碱杆菌中进行基因表达和产生突变的方法是本领域内已^口的(参见例如Taghavi等人,Appl.Environ.Microbiol.,60(10):3585-3591(1994))。可以将2-丁醇生物合成途径的基因克隆进上述任何广宿主范围的载体中,并通过电穿孔转化至真养产碱杆菌内以形成生产2-丁醇的重组体。产碱杆菌属中的聚羟基丁酸酯途径已经有详细描述,多种改良真养产碱杆菌基因组的遗传技术是已知的,并且这些工具可以应用于工程化2-丁醇生物合成途径。2-丁酮生物合成途径也可相似地表达,^旦省略丁醇脱氬酶。2-丁醇或2-丁酮生物合成途径在恶臭假单胞菌中的表达在恶臭假单胞菌中表达基因的方法是本领域内已知的(参见例如Ben-Bassat等人,美国专利No.6,586,229,将该文献以引用的方式并入本文)。可将2-丁醇生物合成途径的基因插入pPCU18内,并可将该连接的DNA通过电穿孔转化至恶臭假单胞菌DOT-TlC5aARl的电转化感受态细胞以生成可生产2-丁醇的重组体。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氬酶。2-丁醇或2-丁酮生物合成途径在植物乳杆菌中的表达乳杆菌属属于乳杆菌科(Lactobacillales),并且用于转化枯草芽孢杆菌和链球菌的许多质粒及载体可用于转化乳杆菌属。合适载体的非限制性实例包括pAM(31及其衍生载体(Renault等人,Gene183:175-182(1996);以及O,Sullivan等人,Genel37:227-231(1993));pMBBl和pMBBl的衍生载体pHW800(Wyckoff等人,Appl.Environ.Microbiol.62:1481-1486(1996));接合质粒pMGl(Tanimoto等人,J.Bacteriol.184:5800-5804(2002));pNZ9520(Kleerebezem等人,Appl.Environ.Microbiol.63:4581-4584(1997));pAM401(Fujimoto等人,Appl.Environ.Microbiol.67:1262-1267(2001));和pAT392(Arthur等人,Antim腦b.AgentsChemother.38:1899-1903(1994))。也已经报道了几种来源于植物乳杆菌的质粒(vanKranenburg等人,Appl.Environ.Microbiol.71(3):1223-1230(2005))。2-丁醇生物合成途径的多种基因可组装进任何合适的载体中,例如上述那些载体。可以基于从植物乳杆菌或La"oMd〃Manzo"e朋/s的基因组序列推导出的密码子指数优化密码子以用于表达。可以利用本领域已知的方法将质粒引入宿主细胞中,例如电穿孔法(Cruz-Rodz等人,MolecularGeneticsandGenomics224:1252-154(1990),Bringel等人,Appl.Microbiol.Biotechnol.33:664-670(1990);Alegre等人,FEMSMicrobiologyletters241:73-77(2004))和接合法(Shrago等人,Appl.Environ.Microbiol.52:574-576(1986))。还可以利用整合载体将2-丁醇生物合成途径基因整合至乳杆菌染色体内(Hols等人,Appl.Environ.Microbiol.60:1401-1403(1990);Jang等人,Micro.Lett.24:191-195(2003))。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氲酶。2-丁醇或2-丁酮生物合成途径在屎肠球菌、鶉鸡肠球菌和粪肠球菌中的表达肠球菌属属于乳杆菌科,上述用于转化乳杆菌、枯草芽孢杆菌和链球菌的多种质粒和载体也可用于肠球菌。还可以使用采用来自乳球菌属(Lactococcus)的nisA基因的用于粪肠球菌的表达载体(Eichenba腿等人,Appl.Environ.Microbiol.64:2763-2769(1998)。另外,可以使用用于在屎肠球菌染色体中进行基因置换的载体(Nalkapareddy等人,Appl.Environ.Microbiol.72:334-345(2006))。2-丁醇生物合成途径的多种基因可以组装进任何合适的载体中,例如上述那些载体。可以基于从粪肠球菌或屎肠球菌基因组序列推导出的密码子指数优化密码子以用于表达。质粒可以利用本领域已知的方法引入宿主细胞,例如电穿孔法,如Cruz-Rodz等人所述(MolecularGeneticsandGenomics224:1252-154(1990))或接合法,如Tanimoto等人(J.Bacteriol.184:5800-5804(2002))和Grohamann等人所述(Microbiol.Mol.Biol.Rev.67:277-301(2003))。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氩酶。2-丁醇或2-丁酮生物合成途径在戊糖片球菌和乳酸片球菌中的表片球菌属属于乳杆菌科(Lactobacillales),并且上述用于转化枯草芽孢杆菌和链球菌的多种质粒和载体也可用于转化片球菌属。合适载体的非限制性实施例是pHPS9(Bukhtiyarova等人,Appl.Environ.Microbiol.6(h3405-3408(1994))。已经报道了几种来自片球菌的质粒(Alegre等人,FEMSMicrobiol.Lett.250:151-156(2005);Shareck等人,Crit.RevBiotechno.24'.155-208(2004))。2-丁醇生物合成途径的基因可组装至任何合适的载体中,例如上述那些载体。可以基于从戊糖片球菌基因组序列推导出的密码子指数优化密码子以用于表达。质粒可以利用本领域已知的方法引入宿主细胞,例如电穿孑L法(参见例如Osmanagaoglu等人,J.BasicMicrobiol.40:233-241(2000);Alegre等人,FEMSMicrobiol.Lett250:151-156(2005))及接合(Gonzalez和Kunka,Appl.Environ.Microbiol.46:81-89(1983))。还可以利用整合载体将2-丁醇生物合成途径基因整合至片J求菌属的染色体内(Davidson等人,AntonievanLeeuwenhoek70:161-183(1996))。2-丁酮生物合成途径也可相似地表达,但省略丁醇脱氢酶。发酵培养基本发明中的发酵培养基必须含有合适的碳底物。合适的底物可包括但不限于单糖,例如葡萄糖和果糖;寡糖,例如乳糖或蔗糖;多糖,例如淀粉、纤维素或它们的混合物;以及来自可再生原料的未纯化混合物,例如干酪乳清渗透物、玉米浆、甜菜糖蜜及大麦麦芽。另外,碳底物也可以为已证明可以被代谢转化为关键生化中间产物的诸如二氧化碳之类的一碳底物或甲醇。除了一碳和二碳底物外,曱基营养生物体也已知可以利用多种其它含碳化合物,例如甲胺、葡糖胺及用于代谢活动的多种氨基酸。例如,曱基营养酵母已知可利用来自甲胺的碳来形成海藻糖或甘油(Bellion等人,Microb.GrowthCICompd.,[Int.Symp.],第七届(1993),415-32,编辑Murrell,J.Collin;Kelly,DonP.Publisher:Intercept,Andover,UK)。类似地,fi丝酵母属的多种物种将会代谢丙氨酸或油酸(Suiter等人,Arch.MicrobioU53:485-489(1990))。因此,设想本发明中所利用的碳源可涵盖各种含碳底物并且将仅受限于生物体的选择。尽管预期所有上述碳底物及它们的混合物都适用于本发明,但优选的碳底物为葡萄糖、果糖和蔗糖,以及任意这些糖的混合物。蔑糖可以从诸如甘蔗、甜菜、木薯及甜高粱之类的原料获得。葡萄糖和右旋糖可以通过淀粉基原料(包括诸如玉米、小麦、棵麦、大麦和燕麦之类的谷物)的糖化作用获得。另外,可发酵糖可以通过预处理及糖化工艺从纤维素类生物质和木质纤维类生物质获得,如例如在共同拥有及共同未决的美国专利申请US20070031918A1中所述,将该专利申请以引用的方式并入本文。生物质指任何纤维素类物质或木质纤维素类物质并包括包含纤维素,以及任选另外包含半纤维素、木质素、淀粉、寡糖和/或单糖的物质。生物质还可以包含附加成分,例如蛋白质和/或脂质。生物质可以源自单一来源,或生物质可以包含源于一种以上来源的混合物;例如,生物质可以包含玉米芯和玉米秸秆的混合物,或草和叶的混合物。生物质包括但不限于生物能作物、农业残余物、城市固体废弃物、工业固体废弃物、造纸废渣、庭园废弃物、木材及林业废弃物。生物质的实例包括但不限于玉米粒、玉米芯、作物残体(例如玉米壳、玉米秸秆)、禾草、小麦、麦秸、大麦、大麦秸秆、干草、稻草、柳枝稷、废纸、甘蔗渣、高梁、大豆、从碾磨谷物获得的成分、树木、树枝、树根、树叶、木片、锯末、灌木及丛枝灌木、蔬菜、果实、花及厩肥。除了合适的碳源外,发酵培养基还必须含有本领域技术人员已知的适于培养物生长并促进生产2-丁醇或2-丁酮所必需的酶途径的矿物质、盐、辅因子、緩冲剂及其它组分。培养条件通常,细胞在约25。C至约40。C的温度范围下在合适的培养基中培养。本发明中合适的生长培养基是普通的商业制备的培养基,例如LuriaBertani(LB)肉汤、SabouraudDextrose(SD)肉汤或酵母膏培养基(YM)肉汤。也可以使用其它确定的或合成的生长培养基,微生物学或发酵科学领域的技术人员将知道用于具体微生物生长的合适培养基。已知可以直接或间接调节分解代谢物阻遏的试剂,如环腺普酸2':3'-单磷酸,也可以掺入发酵培养基中。适于发酵的pH范围在pH5.0到pH9.0之间,其中pH6.0至pH8.0优选作为起始条件。发酵可以在有氧或厌氧条件下进行,厌氧或微氧条件是优选的。工业分批发酵和连续发酵本发明的工艺采用分批发酵方法。经典的分批发酵是封闭系统,其中培养基的组成在发酵开始时设定并且在发酵过程中不进行人工改变。因此在发酵开始时,用所需生物体对培养基进行接种,在不向系统添加任何物质的情况下进行发酵。然而,通常来说,"分批"发酵是指碳源的添加是成批的,但经常试图控制诸如pH和氧浓度之类的因素。在分批发酵系统中,代谢产物和生物质组成持续改变直至发酵结束时。在分批培养物内,细胞緩慢通过静态延緩期到达高速生长对数期,并最后达到稳定期,此时生长速率减緩或终止。如果不加以处理,稳定期的细胞将最终死亡。通常,指数生长期中的细胞负责产生大部分终产物或中间产物。标准分批式系统的一种变型是补料-分批系统。补料-分批发酵工艺也适用于本发明,并且包括典型的分批式系统,不同的是随着发酵进程递增地添加底物。在代谢产物往往抑制细胞的代谢作用,以及其中期望培养基中具有有限量的底物时,补料-分批式系统是有用的。补料-分批式系统中的实际底物浓度难于测量并因而可根据一些可测量因素(例如pH、溶解的氧以及废气例如C02的分压)进行评估。分批发酵和补料-分批发酵在本领域内是常用的且众所周知,并且实例可见于如下文南大ThomasD.Brock,Biotechnology:ATextbookofIndustrialMicrobiology,第二版,(1989),SinauerAssociates,Inc.,Sunderland,MA.或Deshpande,MukundV.,Appl.Biochem.Biotechnol.,36:227,(1992),将这两篇文献以引用的方式并入本文。尽管本发明是以分批模式进行,但也设想该方法将可适用于连续发酵方法。连续发酵是一种开放式系统,其中将设定好的发酵培养基连续加入生物反应器里,并同时移出等量适应了的培养基用于加工。连续发酵通常将培养物维持在恒定高的密度。连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生长或终产物浓度。例如,一种方法将以固定的速率维持限制性营养物质(例如碳源或氮水平)并且允许所有其它参数适度。在其它系统中,可以连续改变影响生长的许多因素,同时保持恒定的细胞浓度(通过培养基的浊度测量)。连续系统力求维持稳态的生长条件并因而,在发酵过程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。用于调节连续发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工业微生物领域众所周知的,并且多种方法在已由Brock(同上)详细描述。设想可以或者采用分批发酵、补料-分批发酵或者釆用连续发酵工艺来实践施本发明,并且任何已知的发酵模式都将适用。另外,设想可以将细胞固定在底物上而作为完整的细胞催化剂并让其经受发酵条件用于生产2-丁醇或2-丁酮。从发酵培养基中分离2-丁醇和2-丁酮的方法采用本领域内已知的ABE发酵方法(参见例如Durre,Microbiol.Biotechnol.49:639-648(1998),Groot等人,ProcessBiochem.27:61-75(1992),以及其中的参考文献),可从发酵培养基中分离生物产生的2-丁醇。例如,可以通过离心、过滤、滗析等方法从发酵培养基移出固形物。然后,使用诸如蒸馏、共沸蒸镏、液-液萃取、吸附、气提、薄膜蒸发或全蒸发等方法分离发酵培养基中的2-丁醇。这些方法同样适用于从发酵培养基中分离生物产生的2-丁酮。实施例本发明将在下面的实施例中进一步限定。应当理解,这些实施例在描述本发明的优选实施方案时,仅仅是以举例说明的方式给出。根据上面的论述和这些实施例,本领域技术人员可以确定本发明的基本特征,并且在不脱离本发明的精神和范围的前提下,可以对本发明作出多种变化和修改使其适用于多种用途和条件。一般方法实施例中所述的标准重组DNA技术和分子克隆技术在领域内是众所周知的,并且在下列文献中有所描述Sambrook,丄,Fritsch,E.F.和Maniatis,T.MolecularCloning:ALaboratoryManual;ColdSpring60HarborLaboratoryPress:ColdSpringHarbor,NY,(1989)(Maniatis)和T.J.Silhavy,M.L.Bennan和L.W.Enquist,ExperimentswithGeneFusions,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(1984)以及Ausubel,F.M.等人,CurrentProtocolsinMolecularBiology,GreenePublishingAssoc.禾口Wiley-Interscience出片反(1987)。适合细菌培养物维持及生长的材料和方法在领域内是众所周知的。适合用于下述实施例中的技术可见于如下文献ManualofMethodsforGeneralBacteriology(PhillippGerhardt,R.G.E.Murray,RalphN.Costilow,EugeneW.Nester,WillisA.Wood,NoelR.Krieg和G.BriggsPhillips(编辑)),AmericanSocietyforMicrobiology,Washington,DC.(1994)或ThomasD.Brock,Biotechnology:ATextbookofIndustrialMicrobiology,笫二版,SinauerAssociates,Inc.,Sunderland,MA(1989)。除非另外指明,否则所述用于细菌细胞生长和维持的所有试剂、限制性内切酶和材料均得自AldnchChemicals(Milwaukee,WI)、BDDiagnosticSystems(Sparks,MD)、LifeTechnologies(Rockville,MD)或SigmaChemicalCompany(St丄oms,MO)。除非另外指明,否则细菌菌材、均得自AmericanTypeCultureCollection(美国典型培养物保藏中心)(ATCC,Manassas,VA)。下面的实施例中所述的寡核苷酸引物在表4中给出。所有寡核苷酸引物均由Sigma-Genosvs(Woodlands,TX)合成。表4克隆引物和筛选引物基因引物名称序列SEQIDNO:描述BlCACCATGGACAAACAGTATCCGGTACGCC15budB正向引物<table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table><table>tableseeoriginaldocumentpage64</column></row><table>测定培养基中2-丁醇和2-丁酮浓度的方法可通过本领域已知的多种方法测定培养基中2-丁醇和2-丁酮的浓度。例如,利用带有ShodexSH-G保护柱的ShodexSH-1011色谱柱(均可从WatersCorporation(Milford,MA)购得)的特定高效液相色镨法(HPLC),该色谱仪使用折射率(RI)检测器。用0.01MH2S04作为流动相,流速为0.5mL/min,色谱柱温度为50。C来实现色谱分离。在所使用的条件下,2-丁酮和2-丁醇的保留时间分别为39.5和44.3分钟。作为另外一种选择,也可以利用气相色镨法(GC)。例如,利用HP-INNOWax色谱柱(30mx0.53mm内径,膜厚度为lpm,AgilentTechnologies,Wilmington,DE)的气相色谱法,该色i普仪使用火焰离子化检测器(FID)。载气为氦气,流速为4.5mL/min,在恒定排出压力下于15(TC测量;20(TC下进样分流比为1:25;将烘箱温度在45°C保持1分钟,以10°C/min升至45-220°C,然后在220。C保持5分钟;然后在24(TC下用26mL/min的氦尾吹气进行FID检测。2-丁酮和2-丁醇的保留时间分别为3.61分钟和5.03分钟。也可以通过用3-曱基-2-苯并噻唑酮腙(MBTH)衍生来检测2-丁酮。将含有2-丁酮的水溶液与等体积的6mg/mLMBTH水溶液在375mM甘氨酸-盐酸(pH2.7)中混合,并在100。C下孵育3分钟。在25cmx4.6mm(内径)SupelosilLC-18-D55jim色谱柱(Supelco)上用流动相(55%乙腈水溶液,流速为lmL/mm)分析所得的MBTH衍生的样品。2-丁酮衍生物显示为两个峰(顺式和反式异构体),保留时间分别为大约12.3和13.3分钟,吸光度最大值为230和307nm。缩写的含意如下"s"表示秒钟,"min"表示分钟,"h"表示小时,"psi"表示磅/平方英寸,"nm,,表示纳米,"d"表示天,、L"表示微升,"mL"表示毫升,"L"表示升,"mm,,表示毫米,"nm,,表示纳米,"mM,,表示毫摩尔浓度,"M"表示摩尔浓度,"mmol"表示亳摩尔,》mol"表示微摩尔,"g"表示克,、g,,表示微克,"ng,,表示'纳克,"PCR"表示聚合酶链反应,"OD"表示光密度,"OD6。o"表示波长600nm时测得的光密度,"kDa"表示千道尔顿,"g,,表示重力常数,"bp"表示碱基对,"kbp"表示千碱基对,"。/。w/v"表示重量/体积百分比,"。/。v/v"表示体积/体积百分比,"wt。/o,,表示重量百分比,"HPLC"表示高效液相色谱法,"GC"表示气相色谱法。术语"摩尔选择性"是每摩尔糖底物所生成的产物的摩尔数,并以百分比计。实施例1乙酰乳酸合酶的克隆和表达本实施例的目的是在大肠杆菌中克隆并表达编码乙酰乳酸合酶的budB基因。budB基因是利用PCR从肺炎克雷伯菌菌林ATCC25955基因组DNA扩增得到。编码乙酰乳酸合酶的budB序列是利用引物对Bl(SEQIDNO:15)和B2(SEQIDNO:16)通过PCR/人肺炎克雷伯菌(ATCC25955)基因组DNA扩增而来的。其它PCR扩增试剂(如KodHiFiDNA聚合酶(NovagenInc.,Madison,WI;商品编号71805-3))可从制造商的65试剂盒中获得,并根据制造商提供的方法使用。肺炎克雷伯菌基因组DNA是用GentraPuregenePuregene;式剂盒(GentraSystems,Inc.,Minneapolis,MN;商品编号D-5000A)制备。扩增在DNA热循环仪GeneAmp9700(PEAppliedBiosystems,Fostercity,CA)中进行。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQIDNO:3和SEQIDNO:4。对于表达研究,使用了Gateway克隆技术(NovagenInc.,Carlsbad,CA)。进入载体(entryvector)pENTR/SD/D-TOPO允许进行定向克隆并为所关注的基因提供SD序列。目的载体pDEST14使用了T7启动子用于表达无标记基因。正向引物紧邻翻译起始密码子处整合了四个碱基(CACC),以允许budB乙酰乳酸合酶编码区PCR产物定向克隆至pENTR/SD/D-TOPO(Invitrogen)内,产生了质粒pENTRSDD-TOPObudB。将pENTR构建体转化至大肠杆菌Top10(Invitrogen)细胞内,并根据制造商的推荐方法涂布平板。使转化林过夜生长并用QIAprepSpinMiniprep试剂盒(Qiagen,Valencia,CA;商品编号27106)按照制造商的推荐方法制备质粒DNA。为了产生表达克隆,利用LRClonase酶混合物(LRClonasemix)(Invitrogen,Carlsbad,CA)通过体外重组,将budB编码区从pENTRSDD-TOPObudB转移至pDEST14载体。将所得的载体pDEST14budB转化至BL-21-AI细胞(NovagenInc.)内。在阿拉伯糖诱导型araBAD启动子的控制下,BL-21-AI细胞携带T7RNA聚合酶的染色体拷贝。将转化林接种至添加了50pg/mL氨千青霉素的LB培养基中并过夜培养。将过夜培养物的等分试样接种至50mL添加了50pg/mL氨节青霉素的LB培养基中。在37。C下振荡培养该培养物,直到OD,达到0.6-0.8。将培养物分为两个25mL部分,并将阿拉伯糖加入其中一个烧瓶至终浓度为0.2%w/v。阴性对照烧瓶不用阿拉伯糖诱导。将烧瓶在37。C下振荡孵育4小时。通过离心收获细胞并将细胞沉淀颗粒重悬浮于50mMMOPS、pH7.0緩冲液中。细胞可通过超声波处理或通过弗氏压碎器(FrenchPressureCell)进行破裂。将各细胞裂解产物进行离心产生上清液和沉淀颗粒或不溶解部分。将各部分(来自诱导细胞和对照细胞的整个细胞裂解物)的等分试样重悬浮于SDS(MES)上样緩沖液(Invitrogen))中,加热至85。C保持10分钟,并接受SDS-PAGE分析(NuPAGE4-12%Bis-Tris凝胶,商品编号NP0322Box,Invitrogen)。诱导培养物中存在预期分子量的蛋白质(该分子量从核酸序列推导得到),而未诱导的参照物中则没有。用Bauerle等人所述的方法测量无细胞提取物中的乙酰乳酸合酶活性(Bauerle等人,(1964)Biochim.Biophys.Acta92:142-149)。用牛血清白蛋白(BSA)(Bio-Rad,Hercules,CA)作为标准,通过Bradford方法或Bicinchoninic^式剂盒(Sigma,商品编号为BCA-1;St.Louis,MO)测定蛋白质浓度。实施例2乙酰乳酸脱羧酶的克隆和表达本实施例的目的是在大肠杆菌中克隆并表达编码乙酰乳酸脱羧酶的budA基因。budA基因是利用PCR技术,从肺炎克雷伯菌菌抹ATCC25955基因组DNA扩增得到。以与实施例1中描述budB相同的方式克隆编码乙酰乳酸脱羧酶的budA序列,不同的是用于PCR扩增的引物为B3(SEQIDNO:17)和B4(SEQIDNO:18)。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQIDNO:l和SEQIDNO:2。所得的质粒命名为pENTRSDD-TOPObudA。用Bauerle等人(同上)描述的方法测量无细胞提取物中的乙酰乳酸脱羧酶活性。实施例3(预言性的)丁二醇脱氢酶的克隆和表达本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁二醇脱氬酶的budC基因。budC基因是利用PCR从肺炎克雷伯菌菌才朱IAM1063基因组DNA扩增得到。编码丁二醇脱氬酶的budC序列是以与实施例1中描述budA相同的方式进行克隆和表达,不同的是用于PCR扩增的引物为B5(SEQIDNO:19)和B6(SEQIDNO:20),基因组模板DNA来自肺炎克雷伯菌IAM1063(可4寻自InstituteofAppliedMicrobiologyCultureCollection,Tokyo,Japan)。肺炎克雷伯菌IAM1063基因组DNA是用GentraPuregenePuregene试剂盒(GentraSystems有限^>司,Minneapolis,MN;商品编号D-5000A)制备。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQIDNO:5和SEQIDNO:6。根据NADH的消耗用分光光度法在340nm吸光度下测定无细胞提取物中丁二醇脱氢酶的活性。实施例4(预言性的)丁二醇脱水酶的克隆和表达本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁二醇脱水酶的pddA、pddB和pddC基因。pddA、pddB和pddC基因是利用PCR从产酸克雷伯菌ATCC8724基因组DNA扩增得到。编码丁二醇脱水酶的pddA、pddB和pddC序列是以与实施例1中描述budA相同的方式进行克隆和表达,不同的是基因组模板DNA来自产酸克雷伯菌ATCC8724,而且引物为B7(SEQIDNO:21)和B8(SEQIDNO:22)。产酸克雷伯菌基因组DNA是用GentraPuregenePuregene^式剂盒(GentraSystems,Inc.,Minneapolis,MN;商品编号D-5000A)制备。克隆包含所有三个开放阅读框(ORF)的单个PCR产物,以使得所有三个编码区作为一个操纵子从表达质粒上的单个启动子进行表达。三个亚基的开放阅读框的核苷酸序列分别为SEQIDNO:7、9和11,三个酶亚基的预测氨基酸序列分别为SEQIDNO:8、10和12。通过用2,4-二硝基苯肼(DNPH)衍生酮产物来测定无细胞提取物中丁二醇脱水酶的活性。简而言之,通过加入等体积的1.0NHC1中的0.05重量%的DNPH淬灭IOOjliL反应混合物,该反应混合物含有大约0.0005单位酶的细胞提取物、40mM磷酸钾緩冲液(pH8.0)、2pg腺苷钴胺素、5昭2,3-丁二醇和l吗牛血清白蛋白。在室温下15分钟后,通过加入100|liL4NNaOH进行显色。与用2-丁酮制备的标准曲线相比,根据波长为550nm时终溶液的吸光度确定产物的量。所有反应均于37。C在暗红光下进行。实施例5(预言性的)68丁醇脱氢酶的克隆和表达本预言性实施例的目的是描述如何在大肠杆菌中克隆并表达编码丁醇脱氲酶的sadh基因。sadh基因是利用PCR从赤红球菌菌抹219基因组DNA扩增得到。编码丁醇脱氳酶的sadh序列是以与实施例1中描述budA相同的方式进行克隆和表达,不同的是基因组模板DNA来自赤红球菌菌抹219(Meens,InstitutfuerMikrobiologie,UniversitaetHannover,Hannover,Germany),并且引物为B9(SEQIDNO:23)和BIO(SEQIDNO:24)。赤红球菌基因组DNA是用UltraClean微生物DNA分离试剂盒(UltraCleanMicrobialDNAIsolationKit)(MOBIOLaboratoriesInc.,Carlsbad,CA)根据制造商提供的方法制备。开放阅读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别为SEQIDNO:13和SEQIDNO:14。无细胞提取物中丁醇脱氲酶的活性是根据当将酶与NAD和2-丁醇进行孵育时,NAD转化为NADH引起的340nm波长处吸光度的增加来测量。实施例6(预言性的)用于2-丁醇生物合成途径中的基因的转化载体的构建本预言性实施例的目的是描述用于2-丁醇生物合成途径(即上述途径3)中的基因的转化载体的制备。与大多数生物体类似,大肠杆菌最初将葡萄糖转化为丙酮酸。按途径3将丙酮酸转化为2-丁醇所需的酶(即乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氳酶、丁二醇脱水酶和丁醇脱氲酶)由budA、budB、budC、pddA、pddB、pddC和sadh基因编码。为了简化重组生物体中2-丁醇生物合成途径的构建,将编码该途径中的五个步骤的基因分至两个操纵子中。上游途径包括由乙酰乳酸合酶、乙酰乳酸脱羧酶以及丁二醇脱氳酶催化的前三个步骤。下游途径包括由丁二醇脱水酶和丁醇脱氲酶催化的后两个步骤。通过PCR技术扩增编码序列,使用的引物整合了限制性酶切位点以用于后来的克隆,并且正向引物含有优化的大肠杆菌核糖体结合位点(AAAGGAGG)。将PCR产物TOPO克隆至pCR4Blunt-TOPO载体中,并转化进ToplO细胞(Invitrogen)内。质粒DNA从TOPO克隆制备,并检验克隆的PCR片段的序列。根据制造商的推荐方法使用限制性酶和T4DNA连接酶(NewEnglandBiolabs,Beverly,MA)。对于克隆实验,用QIAquick凝胶提取试剂盒(QIAquickGelExtractionkit)(Qiagen)将限制性酶切片段进行凝胶纯化。确认序列后,将该编码区亚克隆至改良的pUC19载体中作为克隆平台。pUC19载体通过HindlII/SapI进行消化,然后通过用KlenowDNA聚合酶处理以补平末端而进行改良。对2.4kB载体片段进行凝胶纯化并重新连接以产生pUC19dHS。作为另外一种选冲奪,pUC19载体通过用Sphl/Sapl消化,然后用KlenowDNA聚合酶处理以形成平末端而进行改良。对2.4kB载体片段进行凝胶纯化并重新连接以产生pUC19dSS。所述的消化移除了邻近MCS(多克隆位点)的lac启动子,抑制载体上操纵子的转录。上游途径budABC编码区通过PCR从肺炎克雷伯菌基因组DNA克隆,该PCR采用的引物对为Bll和B12(表4),分别为SEQIDNO:25和SEQIDNO:26。正向引物整合了EcoRI限制性酶切位点和核糖体结合位点(RBS)。反向引物整合了Sphl限制性酶切位点。将PCR产物克隆至pCR4Blunt-TOPO内产生pCR4Blunt-TOPO-budABC。为了构建上游途径操纵子,将pCR4Blunt-TOPO-budABC用EcoRI和Sphl进行消化,释放3.2kbpbudABC片段。pUC19dSS载体也用EcoRI和Sphl消化,释放2.0kbp载体片段。利用T4DNA连接酶(NewEnglandBiolabs)将budABC片段与载体片段连接在一起以形成pUC19dSS-budABC。下游途径pddABC编码区通过PCR从产酸克雷伯菌ATCC8724基因组DNA扩增,产生2.9kbp产物,该PCR使用引物B13和B14(表4),分别为SEQIDNO:27和SEQIDNO:28。正向引物整合了EcoRI和Pmel限制性酶切位点和RBS。反向引物整合了BamHI限制性酶切位点。将PCR产物克隆至pCRBluntll-TOPO内,产生pCRBluntII-pdd。sadh基因通过PCR从赤红球菌菌抹219基因组DNA扩增,产生l.Okbp产物,该PCR使用引物B15和B16(表4),分别为SEQIDNO:29和SEQIDNO:30。正向引物整合了BamHI限制性酶切位点和RBS。反向引物整合了Xbal限制性酶切位点。将PCR产物克隆至pCRBluntn-TOPO内形成pCRBluntII-sadh。为了构建下游途径操纵子,将来自pCRBluntII-pdd的2.9kbpEcoRI和BamHI片段、来自pCRBluntII-sadh的l.OkbpBamHI和Xbal片段以及来自pUC19dHS的EcoRI和Xbal消化的大片段连接在一起。该三路连接产生了pUC19dHS-pdd-sadh。将pUC19dSS-budABC载体用Pmel和HindIII消化,释放3.2kbp片段,将该片段克隆至pBenBP(大肠杆菌-枯草芽孢杆菌穿梭载体)内。质粒pBenBP通过改良pBE93载体产生,Nagarajan对此有所描述(WO93/2463,实施例4)。为了产生pBenBP,用Ncol/Hindm消化将解淀粉芽孢杆菌(Bacillusamyloliquefaciens)中性蛋白酶启动子(NPR)信号序列和phoA基因从pBE93上移除。用引物BenF和BenBPR(分别为SEQIDNO:31和32)从pBE93PCR扩增NPR启动子。引物BenBPR在启动子下游整合了BsffilI、Pmel和HindIII位点。将PCR产物用Ncol和HindIII进行消化,并将片段克隆至载体pBE93中的相应位点以产生pBenBP。将上游才喿纵子片l殳亚克隆至pBenBP中的Pmel和HmdIII位点,生成pBen-budABC。将pUC19dHS-pdd-sadh载体用Pmel和HindIII消化,释放3.9kbp片段,将该片段克隆进pBenBP的Pmel与HindIII位点,生成pBen-pdd-sadh。实施例7(预言性的)2-丁醇生物合成途径在大肠杆菌中的表达本预言性实施例的目的是描述如何在大肠杆菌中表达2-丁醇生物合成途径。将按实施例6所述制备的质粒pBen-budABC和pBen-pdd-sadh分别转化进大肠杆菌NM522(ATCCNo.47000)中,通过SDS-PAGE分析和酶测定法监测每个操纵子中基因的表达。确认所有基因的表达后,用EcoRI和HmdIII消化pBen-budABC以释放NPR启动子-budABC片段。用DNA聚合酶的Klenow片段(NewEnglandBiolabs,商品编号为M0210S)将该片段进行平末端化。用EcoRI消化质粒pBen-pdd-sadh并同样补平其末端以生成线性化的平末端载体片段。连接载体和NPR-budABC片段,生成p2BOH。将该质粒转化至大肠杆菌NM522内产生大肠杆菌NM522/p2BOH,并如上文所述监测基因的表达。将NM522/p2BOH接种至装有50mL培养基的250mL摇瓶中,并在35。C下以250rpm摇动。培养基由以下物质组成右旋糖,5g/L;MOPS,0.05M;硫酸铵,0.01M;磷酸二氲钾,0.005M;S10金属混合物,1%(v/v);酵母提取物,0.1%(w/v);酪蛋白氨基酸,0.P/。(w/v);硫胺素,0.1mg/L;脯氨酸,0.05mg/L;以及生物素0.002mg/L,并用KOH滴定至pH7.0。S10金属混合物含有MgCl2,200mM;CaCl2,70mM;MnCl2,5mM;FeCl3,0.1mM;ZnCl2,0.1mM;盐酸石危胺,0.2mM;CuS04,172pM;CoCl2,253|tiM;和Na2Mo04,242jliM。18小时后,用本领域所熟知的方法(如上文中"一般方法"部分所述)通过HPLC和GC分析^^测2-丁醇。实施例8(预言性的)2-丁醇生物合成途径在枯草芽孢杆菌中的表达本预言性实施例的目的是描述如何在枯草芽孢杆菌中表达2-丁醇生物合成途径。将按实施例6所述制备的质粒pBen-budABC和pBen-pdd-sadh分别转化至枯草芽孢杆菌BE1010(J.Bacteriol.l73:2278-2282(1991))并如实施例7所述监测每个操纵子中基因的表达。用EcoRI和HindIII消化质粒pBen-budABC以释放NPR启动子-budABC片段。用DNA聚合酶的Klenow片段(NewEnglandBiolabs,商品编号为M0210S)将该片段进行平末端化。用EcoRI消化质粒pBen-pdd-sadh并同样补平其末端以生成线性化的平末端载体片段。连接载体和NPR-budABC片段,生成p2BOH。将该质粒转化进枯草芽孢杆菌BE1010内以产生枯草芽孢杆菌BE1010/p2BOH,并如上文所述监测基因的表达。将枯草芽孢杆菌BE1010/p2BOH接种进装有50mL培养基的250mL摇瓶中,并在35。C下以250rpm摇动18h。培养基由以下物质组成右旋糖,5g/L;MOPS,0.05M;谷氨酸,0.02M;碌L酸铵,0.01M;石寿酸二氲钾緩沖液,0.005M;S10金属混合物(如实施例7所述),1%(v/v);酵母提取物,0.1°/。(w/v);酪蛋白氨基酸,0.1%(w/v);色氨酸,50mg/L;曱碌u氨酸,50mg/L;以及赖氨酸,50mg/L,并用KOH滴定至pH7.0。18小时后,用本领域所熟知的方法(如上文中"一般方法"部分所述)通过HPLC和GC分析检测2-丁醇。实施例9用于2-丁醇生物合成途径中的基因的转化载体的构建本实施例的目的是制备携带2-丁醇生物合成途径(即上述途径3)中的基因的重组大肠杆菌宿主。与大多数生物体类似,大肠杆菌最初将葡萄糖转化为丙酮酸。途径3中将丙酮酸转化为2-丁酮的酶(即乙酰乳酸合酶、乙酰乳酸脱羧酶、丁二醇脱氬酶以及丁二醇脱水酶)由budA、budB、budC、pddA、pddB和pddC基因编码。在该途径的最后步骤中,丁醇脱氬酶将2-丁酮转化为2-丁醇。执行该最后步骤的脱氲酶是广泛的,并且可以在许多生物体中找到。为了简化重组生物体中2-丁醇生物合成途径的构建,将编码该途径中的5个步骤的基因分至多个操纵子中。上游途径操纵子包括由乙酰乳酸合酶、乙酰乳酸脱羧酶以及丁二醇脱氲酶催化的前三个步骤,并将该操纵子克隆到表达载体上。下游途径操纵子包括由丁二醇脱水酶(包括再活化因子(Mori等人,J.Biol.Chem.272:32034(1997)))和丁醇脱氬酶催化的后两个步骤。催化过程中,二醇脱水酶可能进行自杀性失活。由ddrA和ddrB(GenBankAF017781,SEQIDNO:70)编码的再活化因子蛋白会再活化失活的酶。ddrA和ddrB基因在二醇脱水酶操纵子的两侧。或者将脱水酶/再活化因子和丁醇脱氬酶的操纵子克隆到另一个表达载体上,或者将脱水酶/再活化因子操纵子单独克隆到另一个表达载体上并且最后的步骤由示范宿主中的内源活性提供。载体pTrc99a-budABC的构建通过PCR技术从肺炎克雷伯菌ATCC25955基因组DNA扩增budAB编码区,生成2.5kbp产物,该PCR使用引物对BABCF和BABR(分别为SEQIDNO:33和34,见表4)。正向引物整合了SacI和EcoRI限制性酶切位点和核糖体结合位点(RBS)。反向引物整合了Spel限制性酶切位点。将PCR产物克隆进pCR4Blunt-TOPO中,产生pCR4Blunt-TOPO-budAB。从TOPO克隆制备质粒DNA,并用引物M13Forward(SEQIDNO:35)、引物M13Reverse(SEQIDNO:36)、N83SeqF2(SEQIDNO:37)、N83SeqF3(SEQIDNO:38)和N84SeqR4(SEQIDNO:39)(参见表5)验证基因的序列。通过PCR技术,以肺炎克雷伯菌ATCC25955基因组DNA为模板,用引物对BCSpeF和BCXbaR扩增budC编码区,生成0.8kbp产物,其中BCSpeF和BCXbaR的SEQIDNO分别为40和41。正向引物整合了Spel限制性酶切位点、RBS,并通过将笫二与第三密码子从AAA改变为AAG而修饰CDS。反向引物包括XbaI限制性酶切位点。将该PCR产物克隆进pCR4Blimt-TOPO中,生成pCR4Blunt-TOPO-budC。通过TOPO克隆制备质粒DNA,用引物M13Forward(SEQIDNO:35)和引物M13Reverse(SEQIDNO:36)验证基因的序列。为了构建budABC操纵子,用SnaBI和Xbal消化pCR4Blunt-TOPO-budC,释放1.0kbpbudC片段。用Smal和Xbal消化载体pTrc99a(Amann等人,Gene69(2):301-315(1988)),生成4.2kbp线性化载体片段。将载体和budC片段连接以生成pTrc99a-budC,并将其转化至大肠杆菌ToplO纟田胞(Invitrogen)中。通过用引物TrcF(SEQIDNO:42)和TrcR(SEQIDNO:43)对转化抹进行PCR扩增分析1.2kbp产物,以确认budC嵌入序列的存在。从pCR4Blunt-TOPO-budAB亚克隆得到budAB基因的2.5kbpEcoRI/Spel片段。用EcoRI和Spel消化载体pTrc99a-budC,并将所得的5.0kbp载体片段进行凝胶纯化。将纯化的载体与budAB插入序列连接,并过转化至大肠杆菌ToplO细胞中。利用引物TrcF(SEQIDNO:42)和N84SeqR2(SEQIDNO:65),通过PCR扩增筛选转化林,以确定是否产生pTrc99a-budABC。在该质粒中,budA、B和C编码区在Trc启动子和rrnB终止序列之间4安此顺序纟皮此相邻。结果:o检查大肠杆菌ToplO/pTrc99a-budABC的三个独立的分离抹是否产生丁二醇,用大肠杆菌ToplO/pCLW25-Kodd-ddr(下文所述)作为阴性对照。菌林在含有100昭/mL羧千青霉素的LB培养基中生长。将所得的细胞用于在摇瓶(总体积大约175mL)中接种,该摇瓶装有125mL含100pg/mL羧千青霉素的TM3a/葡萄糖培养基。此外,用携带pTrc99a-budABC的菌抹接种的烧瓶还盛有0.4mM异丙基P-D-l-硫代半74乳糖普(IPTG)。TM3a/葡萄糖培养基(每升)含有10g葡萄糖、13.6gKH2P04、2.0g柠檬酸一水合物、3.0g(NH4)2S04、2.0gMgS04.7H2〇、0.2gCaCl2.2H2O、0.33g柠檬酸铁铵、l.Omg硫胺素.HCl、0.50g酵母提取物和10mL痕量元素溶液,用NH40H调节至pH6.8。痕量元素溶液含有柠檬酸.H20(4.0g/L)、MnS04.H20(3.0g/L)、NaCl(1.0g/L)、FeSO4.7H2O(0.10g/L)、CoCl2.6H2〇(0.10g/L)、ZnS04.7H20(0.10g/L)、CuS04.5H20(0.010g/L)、H3B03(0.010g/L)和Na2Mo04.2H20(0.010g/L)。以大约0.03单位的起始OD6oo对用透气盖封端的烧瓶进行接种,并在34。C下孵育,同时以300rpm摇动。诱导后大约23小时,通过HPLC(ShodexSugarSH1011柱)和GC(HP-INNOWax),用与"一般方法"部分中描述的相同方法,分析肉汤等分试样中的2-丁醇和2-丁酮。分析结果在表6示出。三个大肠杆菌克隆将葡萄糖转化为乙偶姻和内消旋-2,3-丁二醇,这是该途径所期望的中间产物,摩尔选择性为14%。该选择性比缺乏budABC的大肠杆菌对照菌株中所观察到的选择性高大约35倍。表6大肠杆菌ToplO/pTrc99a-budABC产生的乙偶姻和内消旋-2,3-丁二醇<table>tableseeoriginaldocumentpage75</column></row><table>a摩尔选>#性=(乙偶姻+内消旋-2,3-丁二醇)/(消耗的葡萄糖)。载体pCL1925-KoDD-ddr的构建:利用引物DDoFor(SEQIDNO:44)和DDoRev(SEQIDNO:45),将二醇脱水酶(GenBankD45071,SEQIDNO:69)和再活化因子(GenBankAFO17781,SEQIDNO:70)操纵子作为单一单位从产酸克雷伯菌ATCC8724PCR扩增。正向引物整合了优化的大肠杆菌RBS和HindIII限制性酶切位点。反向引物包含XbaI限制性酶切位点。将5318bpPCR产物克隆进pCR4Bhmt-TOPO中,并将所得的pCR4Blunt-TOPO-Kodd-ddr克隆进行测序,所用引物为M13Forward(SEQIDNO:35)、M13Reverse(SEQIDNO:36)、DDkoseqF2(SEQIDNO:46)、DDkos叫F5(SEQIDNO:47)、DDkoseqF7(SEQIDNO:48)、DDkoseqF9(SEQIDNO:49)、DDkoseqRl(SEQIDNO:50)、DDkoseqR3(SEQIDNO:51)、DDkoseqR7(SEQIDNO:52)以及DDkos叫R10(SEQIDNO:53)。婆定了具有含预期序列的插入物的克隆。为进行表达,将二醇脱水酶/再活化因子基因亚克隆进pCL1925(美国专利No.7,074,608)中,pCL1925是一种携带得自链霉菌属(Streptomcyes)的萄糖异构酶启动子的低拷贝质粒。用HmdIII和Xbal消化pCR4Blunt-TOPO-Kodd-ddr,并将所得的5.3kbpKodd-ddr片段进4亍凌是月交纯化。用Hindin和Xbal消化载体pCL1925,并将所得的4539bp载体片段进行凝胶纯化。连接载体和Kodd-ddr片段,并将其转化进大肠杆菌ToplO中。利用引物DDkoSeqF7(SEQIDNO:48)和DDkoseqR7(SEQIDNO:52)通过PCR技术筛选转化林。扩增携带该插入物的质粒(pCL1925-Kodd-ddr)产生大约797bp的产物。通过在室温下于80mMHEPES(pH8.2)中将细胞提取物(总蛋白质为0.8mg/mL)与10mM丁二醇和12mM辅酶B12孵育17h,测定二醇脱水酶对内消旋-2,3-丁二醇的活性。如"一般方法"中所述的通过HPLC确定预期产物2-丁酮的形成。载体pCL1925-KoDD-ddr::T5chnAter的构建要提供异源乙醇脱氬酶的活性,将来自不动杆菌编码环己醇脱氬酶的chnA基因(Cheng等人,J.Bacteriol.182:4744-4751(2000))克隆到具有二醇脱水酶操纵子pCL1925-Kodd-ddr的pCL1925载体中。用引物ChnAF(SEQIDNO:54)和ChnAR(SEQIDNO:55)从pDCQ2(来自不动杆菌携带环己醇基因簇的粘粒)扩增chnA基因(SEQIDNO:71(GenBankNo:AF282240,SEQIDNO:73))。将所得的828bpPCR产物克隆到pCR4Blunt-TOPO内而产生pCR4Blunt-TOPO-chnA,并利用引物M13Forward(SEQIDNO:35)和引物M13Reverse(SEQIDNO:36)通过菌落PCR筛选转化株。正确的克隆产生约lkbp的PCR产物,并用引物M13Forward(SEQIDNO:35)和引物M13Reverse(SEQIDNO:36)进行测序。对pCR4Blunt-TOPO-chnA进行测序以确认序列正确后,从质粒中亚克隆chnA基因的813bp的Mfel/Smal片段。用M化I和Smal消化表达载体pQE30(Qiagen),并且将所得的3350bp载体片段进行凝胶纯化。将chnA片段和纯化的载体连接,并转化到大肠杆菌ToplO细胞内。针对494bp的PCR产物,用引物chnSeqFl(SEQIDNO:56)和chnseqRl(SEQIDNO:57)对转化抹进行菌落PCR筛选。在该克隆将chnA基因置于质粒pQE30-chnA中的T5启动子控制下。要制备携带两个操纵子的pCL1925载体,向该载体加入终止子。利用引物TopterFl(SEQIDNO:58)、TopterF2(SEQIDNO:59)、BotterRl(SEQIDNO:60)和BotterR2(SEQIDNO:61)通过寡核苷酸退火而制备tonB终止子-mcs-trpA终止子片段。将退火的DNA在6。/oPAGE凝胶(Embi-tec,SanDiego,CA)上进行凝胶纯化。用Sacl和Xbal消化载体pCL1925并进行凝月交纯化。连接退火的DNA和载体片段以生成pCL1925-ter。通过采用引物pCL1925vecF(SEQIDNO:62)和pCL1925vecRl(SEQIDNO:63)的菌落PCR扩增,针对大约400bp的PCR产物的存在筛选转化抹。利用相同的引物对PCR篩选所得到的阳性克隆进行测序。用Xhol和Pmel消化载体pCL1925-ter,对所得的4622bp片段进行凝胶纯化。用Ncol消化pQE30-chnA,并用KlenowDNA聚合酶处理该DNA以产生平末端。然后用Xhol消化pQE30-chnA,并将所得的1.2kbp的T5启动子-chnA片l殳进行凝月交纯化。将pCL1925-ter载体和chnA操纵子片段连接在一起以产生pCL1925-ter-T5chnA,并将其转化到大肠杆菌ToplO中。通过采用引物pCL1925vecF(SEQIDNO:64)和chnseqRl(SEQIDNO:59)的菌落PCR扩增,针对大约lkbp的产物筛选转化抹。77要完成途径载体的构建,用Xbal和Sacl消化pCL1925-KoDD-ddr质粒,并将所得的9504bp载体片段进行凝胶纯化。将来自pCL1925-ter-T5chnA、两侧带有终止子的chnA操纵子(Koichi等人,(1997)Volume272,Number51,pp.32034-32041)(trpA终止子位于chnA编码序列的3,端)被凝胶纯化为1271bp的Xbal/Sacl片段。连接片段并转化到大肠杆菌ToplO中后,通过菌落PCR对转化抹进行筛选。用引物chnSeqFl(SEQIDNO:58)和pCL1925vecR2(SEQIDNO:64)在所得的质粒pCL1925画KoDD-ddr::ter-T5chnA中扩增出预期的1107bpPCR产物。实施例102-丁醇生物合成途径在过表达内源性醇脱氬酶的大肠杆菌中的表逸本实施例的目的是在几种大肠杆菌菌株中表达2-丁醇生物合成途径。组成型表达vqhD的大肠杆菌菌抹的构建大肠杆菌含有天然基因(yqhD),该天然基因被鉴定为1,3-丙二醇脱氢酶(美国专利No.6,514,733)。yqhD基因(SEQIDNO:74)与梭菌属中的基因adhB(可能是NADH依赖型丁醇脱氲酶)具有40%的同一性。采用XRed技术(Datsenko和Wanner,Proc.Natl.Acad.Sci.U.S.A.97:6640(2000))将yqhD基因置于大肠杆菌菌林MG16551.6yqhD::Cm(WO2004/033646)中的葡萄糖异构酶启动子1.6GI(SEQIDNO:67)变体的组成型表达下。类似地,用1.5GI启动子(WO2003/089621)(SEQIDNO:68)代替该天然启动子,产生菌林MG16551.5yqhD::Cm,因而,用1.5GI启动子代替了MG16551.6yqhD::Cm的1.6GI启动子。1.5GI和1.6GI启动子的不同之处在于-35区中的lbp,由此改变了启动子的强度(WO2004/033646)。用1.5GI或用1.6GI启动子代替天然的yqhD启动子时,编码yqh操纵子的推定的转录调节因子的yqhC基因-f皮删除。采用本领域内熟知的方法通过酶测法确认丁醇脱氲酶的活性。大肠杆菌菌抹的转化将实施例9中描述的途径质粒pCL1925-Kodd-ddr和pTrc99a-budABC共转化到大肠杆菌菌抹MG1655、MG16551.6yqhD和MG16551.5yqhD中。后两种菌抹过表达1,3-丙二醇脱氲酶(YqhD),该脱氲酶还具有丁醇脱氩酶活性。基本如上所述检查菌林是否产生2-丁酮和2-丁醇。将细胞接种到装有50或150mLTM3a/葡萄糖培养基(含0.1mg/L维生素B12、合适的抗生素和IPTG)的摇瓶(总体积大约为l乃mL)以分别表现中等氧和低氧条件。大观霉素(50吗/mL)和羧千青霉素(100)ug/mL)分别用于质粒pCL1925-Kodd-ddr和pTrc99a-budABC。以起始OD6CK^0.04单位将菌落接种至摇瓶,在34°C下以300rpm振荡孵育。盛有50mL培养基的摇瓶盖有有通气盖;盛有U0mL培养基的摇瓶带有不通气的盖以最大程度减少空气交换。在时间点零时加入浓度为0或0.04mM的IPTG。2-丁酮和2-丁醇产生的分析结果在表7中示出。所有包含2-丁醇生物合成途径的大肠杆菌菌抹在低氧和中等氧条件下产生了2-丁酮,并且在低氧条件下产生了2-丁醇。表7用含有途径质粒pCL1925-Kodd-ddr和pTrc99a-budABC的大肠軒菌MG1655菌抹产生2-丁酮和2-丁醇<table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table>a#1和#2表示独立的分离林。bMG1655是MG1655/pCL1925-Kodd-ddr/pTrc99a-budABCMG16551.6yqhD是MG16551.6yqhD/pCL1925-Kodd-ddr/pTrc99a-budABCMG16551.6yqhD是MG16551.5yqhD/pCL1925-Kodd-ddr/pTrc99a-budABC。实施例112-丁醇生物合成途径在具有异源乙醇脱氢酶的大肠杆菌中的表达如实施例9中所述,将质粒pCL1925曙KoDD-ddr::ter-T5chnA和pTrc99a-budABC转化到大肠杆菌菌抹MG1655和MG1655AyqhCD内以用于验证2-丁醇的产生。MG1655AyqhCD携带失活的yqhCD,失活的yqhCD是利用Datsenko和Wanner的方法(Proc.Natl.Acad.Sci.U.S.A.97(12):6640-6645(2000))制备。在将该区用pKD3的FRT-CmR-FRT盒置换后,用FLP重组酶移除氯霉素抗性标记。缺失区域的序列定为SEQIDNO:66。基本按上述方法,检查菌林MG1655/pTrc99a-budABC/pCL1925KoDD-ddr::ter-T5chnA和MG1655AyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr::ter-T5chnA的2-丁酮和2-丁醇产生。菌株MG1655AyqhCD/pCL1925作为阴性对照。将细胞接种在装有50或150mLTM3a/葡萄糖培养基(添加了0.1mg/L维生素B!2和合适的抗生素)的摇瓶(总体积大约为175mL)中以分别表现中等氧和低氧条件。大观霉素(50pg/mL)和氨千青霉素(100jag/mL)分别用于筛选基于pCLl925的质粒和pTrc99a-budABC。源于pTrc99a-budABC的酶活性是在不存在PTG诱导物的情况下通过酶测定法检测,因而,培养基中不加入IPTG。以起始ODmqSO.OI单位将菌落接种至摇瓶中,在34。C下以300rpm振荡孵育24h。盛有50mL培养基的摇弁瓦盖有有通气盖;盛有150mL培养基的摇瓶盖有不通气的盖以最大程度减少空气交换。2-丁酮和2-丁醇产生的分析结果在表8中示出。两种包含2-丁醇生物合成途径的大肠杆菌菌株均在低氧和中度氧条件下产生2-丁酮,而在低氧条件下产生2-丁醇。<table>tableseeoriginaldocumentpage82</column></row><table>来自河流弧菌JS17的氨基丙酮酸转氨酶(APT)由Shin等人鉴定(Appl.MicrobiolBiotechnol.(2003)61:463-471)。发现该酶的氨基酸序列(SEQIDNO:122)与氨基酸丙酮酸转氨酶具有显著的同源性(Shin和Kim(J.Org.Chem.67:2848-2853(2002))。这表明,河流弧菌APT对乙偶姻具有转氨酶活性。为了使APT酶在大肠杆菌中表达,利用大肠杆菌优选的密码子以及其它的考虑(例如密码子平衡和mRNA的稳定性),设计密码子优化的APT编码区(SEQIDNO:144),并合成(由DNA2.0合成;RedwoodCity,CA)。将编码区DNA片段亚克隆至pBAD.HisB载体(Invitrogen)的Ncol和HindIII位点之间,并将所得的质粒(下文称为pBAD.APTl)转化到TOP10细胞中。实施例13河流弧菌APT丙氨酸乙偶姻转氨酶活性的表征将TOP10/pBAD:APT1细胞的新鲜菌落接种到5mL含100pg/mL氨苄青霉素的LB肉汤中。将培养物在37t:下振荡(225rpm)孵育大约16h。将300jiL该培养物的等分试样用于接种300mL相同的培养基,将培养基在37。C下振荡孵育(225rpm)。当培养物的OD600达到0.8时,加入L-阿拉伯糖至终浓度为0.2%(w/v)。将培养物另外孵育16h,然后收获。将细胞用lOOmM磷酸钾緩沖液(pH7.8)洗涤一次,然后冷冻并在-8(TC下保存。要分离酶,则将细胞颗粒解冻并重悬于8mL100mM磷酸钾緩冲液(pH7)中,緩冲液中含有0.2mM乙二胺四乙酸、ImM二石危苏糖醇和一片蛋白酶抑制剂混合物(Roche;Indianapolis,IN)。两次通过6.2MPa(900psi)下的弗氏压碎器使细胞裂解,并将所得的裂解产物通过在17000xg下离心30min进行澄清。加入硫酸铵至35%的饱和度,并在室温下4觉拌溶液30min,此时通过离心(30min,17000xg)移出沉淀固形物。在上清液中加入额外的石危酸铵至55。/c^包和,在室温下再次才觉拌溶液30min。通过离心(30min,17000xg)移出沉淀固形物,然后重悬于5mL含10pM5,-磷酸吡哆醛和1mM二硫苏糖醇的100mM磷酸钾緩冲液(pH7)中。将该溶液通过用緩冲液A(50mMbis-tris丙烷緩冲液(pH6),含有lOpM5,-磷酸吡。多醛和lmM二硫苏糖醇)平衡的PD10柱进行脱盐。然后将脱盐后的提取物上样至到用緩沖液A预平衡过的20mLQ-FastFlow柱中。用緩沖液A中0-0.1MNaCl的线性梯度洗脱APT。通过在用聚丙烯酰胺凝胶电泳分析时存在的约8.3E-20g(50kD)的蛋白条带以及通过418nm下的特征性吸光度来4会测洗脱级分中的酶。含有所述酶的级分在约0.3MNaCl时洗脱。合并这些级分得到总体积6mL的5.45mg/mL酶溶液,通过聚丙烯酰胺凝胶电泳判断该酶纯度>90%。APT的丙氨酸乙偶姻转氨酶活性采用乳酸脱氲酶偶联测定法来测定。反应混合物含100mMbis-tris丙烷(pH9.0)、10;iM5,-磷酸吡口多醛、0-50mM乙偶姻、0-5mML-丙氨酸、0.14或0.28mg/mL纯化的酶、200jiMNADH和20U/mL乳酸脱氬酶(Sigma;St丄ouis,MO)。反应后,测量340nm处吸光度的变化,以此指示NADH的氧化。在上述条件下,乙偶姻的kcat/Km为lONfY1,L-丙氨酸的kcat/Km为400M-Y1。预期产物3-氨基-2-丁醇的身份是通过与合成的标准品比较来确定。用Dickey等人的方法合成(R,R)-和(S,S)-3-氨基-2-丁醇的混合物[A隨ChemSoc74:944(1952)]:将5g反式-2,3-环氧丁烷緩慢地搅动加至150mL冷的(4°C)NH4OH中。将反应物慢慢升温至室温,密封并在室温下另外搅拌10天。此时,在40。C的真空条件下,通过旋转蒸发除去过量的氨和水以及残留的环氧丁烷。将所得的澄清油状物(2.9g)重悬于水中至浓度为10%(w/v)。通过NMR分析并与Levy等人报道的NMR谱[Org.MagneticReso醒cel4:214(1980)]进行比较以确定产物的生成。用相同的方法合成相应的(2R,3S)-和(2S,3R)-异构体混合物,不同的是以2,3环氧丁烷的顺式异构体作为原料。根据Roth报道的用于测定氨基酸的邻苯二甲醛衍生法[Anal.Chem.43:880(1971)]开发出了检测3-氨基-2-丁醇的分析方法。将200pL的lmM3-氨基-2-丁醇(异构体混合物)等分试样与200|iL50mM硼酸盐溶液(pH9.5)混合,向其加入10pL乙醇中的5pL/mL2-巯基乙醇和lOjiL乙醇中的10mg/mLo-邻苯二曱醛。溶液于室温下孵育10min,那时将衍生物萃取至200|nL己烷中。通过滗析将己烷从水溶液分离,并将10pL注射至ChiracelODHPLC柱(DaicelChemicalIndustries;FortLee,NJ)。用卯10的己烷异丙醇流动相以lmL/min的流速通过色谱注。通过在340nm处的吸光度检测到了3-氨基-2-丁醇的衍生化异构体,保留时间为大约15.7和16.8min[(2S,3S)和(2R,3R)],以及18.4和21.9min[(2R,3S)和(2S,3R)]。为了区分笫一混合物中的对映体,也在相同条件下对纯化的(2R,3R)异构体(BridgeOrganics;Vicksburg,MI)进行色镨分析,并且发现是16.8min的峰。为了区分第二混合物中的异构体,首先利用丙氨酸乙偶姻转氨酶对混合物进行动力学拆分将0.28mg纯化的酶与lmLlOOmMbis-tris丙烷(pH9.0)中的10mM丙酮酸和10mM3-氨基-2-丁醇[(2R,3S)和(2S,3R)异构体的1:1混合物]孵育。室温下24h后,移出等分试样如上所述进行分析。分析表明,18.4min的峰减少了95%,而21.9min的峰超过90%的保留下来。将lOOjxL剩余反应混合物的等分试样与50|iiL20mMNADH以及IOjiL来自实施例9中所述的TOP10/pTrc99a-BudC菌林的提取物进行混合。BudC酶已知可将(R)-乙偶姻还原为内消旋-2,3-丁二醇,并且可以4吏(S)-乙偶姻还原为(S,S)-2,3-丁二醇[Ui等人,(2004)LettersmAppliedMicrobiology39:533-537]。3h后,从反应物取出样品并如上所述分析乙偶姻和丁二醇。分析表明,主要的还原产物是内消旋-2,3-丁二醇,说明转氨酶反应的产物是(R)-乙偶姻,因此消耗的3-氨基-2-丁醇为(2R,3S)异构体。因而,保留时间18.4min可归为该异构体,21.9min可归为(2S,3R)异构体。为了确认APT催化的丙氨酸乙偶姻转氨酶反应的产物是3-氨基-2-丁醇,将0.28mg纯酶与lmL100mMbis-tris丙烷(pH9.0)中的10mM乙偶姻、10mML-丙氨酸、50U乳酸脱氢酶和200)iMNADH进行孵育。将反应混合物在室温下孵育20h,然后移出200jiL等分试样并如上所述衍生化。衍生产物的保留时间分别为15.8min(主要产物)和18.5min(次要产物),与(2S,3S)-和(2R,3S)-3-氨基-2-丁醇标准样品的保留时间相符。实施例14胡萝卜软腐欧文氏菌黑胫亚种的氨基醇激酶和氨基醇O-磷酸酯裂解酶的鉴定与克隆该实施例的目的是描述如何鉴定和克隆来自细菌胡萝卜软腐欧文氏菌的编码氨基醇激酶和氨基醇O-磷酸酯裂解酶的序列。这两种酶是85途径1中将3-氨基-2-丁醇经中间产物3-氨基-2-丁醇磷酸酯转化为2-丁酮的部分,如图1所示。欧文氏菌氨基醇激酶和氨基醇O-磷酸酯裂解酶的预测ATP依赖型氨基醇激酶和氨基醇O-磷酸酯裂解酶活性已经在几种假单胞菌属和欧文氏菌属的菌种中得以检测,包括假单胞菌P6NCIB10431)、恶臭假单胞菌NCIB10558(Jones等人,(1973)Biochem.J.134:167-182)、胡萝卜软腐欧文氏菌、菠萝欧文氏菌(Erwimaamanas)、鸡血藤欧文氏菌(Erwinamilletiae)和马铃薯黑胫欧文氏菌(Erwiniaatroseptica)(Jones等人,(1973)Biochem丄134:959-968)。在这些研究中,上述菌种的提取物显示具有将氨丙醇经由氨丙醇O-磷酸酯转化为丙醛以及将乙醇胺经由乙醇胺O-磷酸酯转化为乙醛的活性。据报道存在上述活性的马铃薯黑胫欧文氏菌菌抹(现命名为胡萝卜软腐欧文氏菌黑胫亚种菌株SCRI1043(ATCCBAA-672))的基因序列已在SangerInstitute进行了测定(Bell等人,Proc.Natl.Acad.Sci.USA101(30):11105-11110)。分析胡萝卜软腐欧文氏菌黑胫亚种基因组中的推定激酶基因发现了一个操纵子序列(SEQIDNO:275),其编码的推定蛋白(ECA2059;SEQIDNO:124)与百脉根根瘤菌(Rhizobiumloti)的高丝氨酸激酶具有39%的同源性,编码的第三类磷酸吡哆醛(PLP)依赖型转氨酶(ECA2060;SEQIDNO:126)与来自苜蓿根瘤菌(Rhizobmmmeliloti)的推定转氨酶具有58%的同源性。预计ECA2059是一种氨基醇激酶,ECA2060是一种利用PLP作为辅因子的氨基醇O-磷酸酯裂解酶。胡萝卜软腐欧文氏菌黑胫亚种的推定氨基醇激酶和推定氨基醇O-磷酸酯裂解酶的克隆胡萝卜软腐欧文氏菌黑胫亚种(ATCC#:BAA-672D)的基因组DNA可得自美国典型菌种保藏中心(ATCC)。编码推定的氨基醇激酶(KA)和氨基醇O-磷酸酯裂解酶(AT)的操纵子命名为KA-AT(SEQIDNO:275。用PhusionDNA聚合酶(Finnzymes;NewEnglandBiolabs;Ipswich,MA)从欧文氏菌属基因组DNA扩增该操纵子序列,扩增引物为OT872(SEQ.ID:127)和OT873(SEQID:128)。通过PCR反应得到2.4kb的基因片段,其对应于KA-AT操纵子的大小。用EcoRI和Pstl限制性内切酶消化PCR产物,并将其克隆至用相同限制性内切86酶消化的pKK223-3载体(AmershamBiosciences;Piscataway,NJ)中。这产生了质粒pKK223.KA-AT,其含有处于tac启动子控制下的推定的欧文氏菌属氨基醇激酶-裂解酶操纵子序列。类似地,制备了质粒pKK223.KA和pKK223.AT,其中将推定的欧文氏菌属激酶及推定的欧文氏菌属裂解酶编码区置于独立的载体中,均处于tac启动子控制下。对于KA编码区(SEQIDNO:123)的PCR克隆,使用了引物OT872(SEQID:127)和OT879(SEQIDNo.l29);而对于AT编码区(SEQIDNO:125)的PCR克隆,在PCR扩增中4吏用了引物OT873(SEQ.ID:128)和OT880(SEQID:130),生成的PCR产物分别为1.1kb和1.3kb。将每种PCR产物用EcoRI和Pstl消化,并连接进载体pKK223-3中以产生pKK223.KA和pKK223.AT。来源于胡萝卜软腐欧文氏菌黑胫亚种的推定氨基醇激酶和推定氨基醇O-磷酸酯裂解酶的体内活性将质粒pKK223.KA-AT、pKK223.KA、pKK223.AT和pKK223匿3转化至大肠杆菌MG1655菌株中。将转化体再次划线接种到MOPS基本培养基平板上,该基本培养基含有1%葡萄糖、0.5%氨丙醇(作为单一氮源)、lmMIPTG以及100pg/mL氨千青霉素。用IPTG诱导KA-AT、KA和AT基因的表达。对照平板中不含IPTG。将平板于37。C下培养7天。在含有IPTG的平板上,仅MG1655/pKK223.KA-AT菌抹生长,其它三种菌抹未能生长。无IPTG的平板中长出了MG1655/pKK223.KA-AT菌林,不过菌落显著小于含IPTG的平板上的那些菌落,这对应于未诱导菌林细胞中KA和AT表达水平较低。其它三种菌抹也未能在平板上生长。这表明推定的欧文氏菌属KA和AT基因的共表达提供了足够的酶活性,该活性使得大肠杆菌菌林MG1655/pKK223.KA-AT能利用氨丙醇作为唯一的氮源。每种单独的KA酶或AT酶的表达不足以在体内产生这样的酶活性。实施例15欧文氏菌属推定的氨基醇激酶和氨基醇O-磷酸酯裂解酶的体外活胜将欧文氏菌属KA-AT操纵子亚克隆到pBAD.HisB载体内并诱导蛋白质表达采用SDS-PAGE分析法,分析了MG1655细胞中从pKK223.KA-AT载体表达的欧文氏菌属的推定的KA和AT酶的蛋白质表达水平。欧文氏菌AT酶的表达水平相对较低,并且在细胞提取物的可溶级分中检测到正确分子量为7.8E-20g(46kD)的新蛋白条带,而没有检测到与预期的KA酶相当大小的新蛋白条带。为了提高欧文氏菌属推定的KA和AT基因的表达,将KA-AT操纵子亚克隆进载体pBAD.HisB-EcoRI的EcoRI和Hindlll位点。通过使用引物OT909(SEQID#131)和OT910(SEQID#132),经由QuickChange定点诱变(Stratagene,LaJolla,CA)用EcoRI位点置换pBAD.HisB中的Ncol位点,从pBAD.HisB载体(Invitrogen)衍生得到pBAD.HisB-EcoRI。在构建的质粒pBAD.KA-AT中,KA-AT操纵子被直接置于araB启动子(没有组氨酸标签)的控制下。将pBAD.KA-AT质粒转化到大肠杆菌TOP10菌株中。将TOP10/pBAD.KA-AT抹的50mL培养物在含有100|iig/mL氨千青霉素的LB培养基中于37。C下以250rpm振荡培养至对数中期(OD6CK)=0.6)。通过加入L-阿拉伯糖至终浓度0.1%(w/v)诱导培养物,并在37。C下进一步孵育5h,然后通过离心收获培养物。将细胞颗粒重悬于水冷的50mMTris-HCl(pH8.0中),并用FischerSonic300型Dismembrator(Fischer,Pittsburgh,PA)以50%的功率,在水上超声破碎细胞,每个循环进行超声处理30秒,每次循环间停止60秒,重复四次循环。将每种绿超声处理的样品离心(15,000xg,4分钟,4°C)。对澄清的无细胞提取物分析其蛋白质表达水平和氨基醇O-磷酸酯裂解酶活性。氨基丁醇O-磷酸酯和氨丙醇O-磷酸酯的化学合成通过基于Ferrari和Ferrari报道用于磷酸乙醇胺的方法(美国专利2730542[1956])的方法合成底物(R,R)-3-氨基-2-丁醇O-磷酸酯将50%(w/v)水溶液中的lOmmolH3P04与(R,R)-3-氨基-2-丁醇(BridgeOrganics;Vicksburg,MI)的50%(w/v)水溶液混合,同时在冰上搅拌。混匀后,将溶液緩慢升温至室温,并然后在真空条件下搅拌并加热至7(TC。在70。C下lh后,将温度緩慢地升高至185。C并维持另外2h。然后,将反应冷却至室温,并释放真空。将剩余物质溶于水中,并通过NMR分析表明,80%的原料转化成产物,有20%仍未反应。未,见察到额外的产物。88通过同样的方法,用(2R,3S)-3-氨基-2-丁醇和(2S,3R)-3-氨基-2-丁醇的1:1混合物(如实施例13所述合成)作为原料,合成另外的底物(2R,3S)-3-氨基-2-丁醇O-磷酸酯以及(2S,3R)-3-氨基-2-丁醇O-磷酸酯。按照同样的方法,用DL-l-氨基-2-丙醇、(R)-2-氨基-l-丙醇或(S)-2-氨基-1-丙醇作为原料,合成DL-l-氨基-2-丙醇O-磷酸酯、(S)-2-氨基-1-丙醇O-磷酸酯以及(R)-2-氨基-1-丙醇O-磷酸酯。由推定的欧文氏菌属KA-AT操纵子编码的氨丙醇O-磷酸酯裂解酶活性的分析氨丙醇O-磷酸酯裂解酶测定法按照Jones等人(1973,Biochem.丄134:167-182)及G.Gori等人(1995,Ch腿atographia40:336)所述的进行。对从氨丙醇O-磷酸酯形成丙醛用MBTH(其使得能检测醛形成)通过比色分析法测定。该反应如下进行。在lmL反应物中,将lOOjag大肠杆菌TOP10/pBAD.KA-AT的无细胞提取物加至100mMTris-HCl(pH7.8)中的lOmMDL-l-氨基-2-丙醇O-磷酸酯中,该Tris画HCl中具有0.1mMPLP。将反应物在37。C下孵育10分钟和30分钟,在每个时间点移出100pL反应混合物等分试样,并将其与100jjL375mM甘氨酸-HCl(pH2.7)中的6mg/mLMBTH混合。将该混合物在IO(TC孵育3分钟,在冰上冷却15-30s,并加入lmL的3.3mg/mLFeCl3.6H2〇(在10mMHCl中),然后在室温下孵育30分钟。在670nm处测定含有醛-MBTH加成物的反应混合物的吸光度。该测定的结果在表9中示出。在存在氨丙醇磷酸酯底物、PLP和无细胞提取物时,检测到醛的生成,醛生成用AbS670指示,其比对照背景高多达0.3。当没有底物或无细胞提取物时,均未检出醛。不添加PLP时,检测到较少量的醛,推测是由于无细胞提取物中存在PLP的缘故。未经诱导的TOP10/pBAD.KA-AT-培养物的无细胞提取物在反应中未生成任何可检测到的醛。这些结果表明,推定的欧文氏菌属氨基醇O-磷酸酯裂解酶的确催化氨丙醇O-磷酸酯转化生成丙醛。表9。氨丙醇O-磷酸酯裂解酶测定。样品1是未经诱导的大肠杆菌TOP10/pBAD.KA-AT的对照物的无细胞提取物。样品2-5含有经诱导的培养物大肠杆菌TOP10/。BAD.KA-AT的无细月包提取物。<table>tableseeoriginaldocumentpage90</column></row><table>欧文氏菌属氨基醇o-磷酸酯裂解酶对氨基丁醇o-磷酸酯底物的活性分析在与上述相同的条件下,研究氨基醇o-磷酸酯裂解酶对氨基丁醇O-磷酸酯底物的活性。该反应在lmL反应物中于37。C过夜进行,该反应物含有100mMTris-HCl(pH7.8)中的lOOpg大肠杆菌TOP10/pBAD.KA-AT的无细胞提取物、10mM氨基丁醇O-磷酸酯((R,R)+(S,S)的混合物或(R,S)+(S,R)异构体的混合物,如实施例15中所述),该Tris-HCl添加有O.lmMPLP。移出100jiL反应混合物,并用"一般方法"中所述的MBTH衍生法检测2-丁酮产物。观察到代表衍生的2-丁酮异构体的两个峰。所以,欧文氏菌属氨基醇O-磷酸酯裂解酶除了是氨丙醇磷酸酯磷酸裂解酶外,还是氨基丁醇磷酸酯磷酸裂解酶。欧文氏菌属氨基醇O-磷酸酯裂解酶对氨丙醇O-磷酸酯和氨丁醇O-磷酸酯的立体异构体的活性分析在与上述相同的条件下,研究欧文氏菌属氨基醇O-磷酸酯裂解酶对氨丙醇O-磷酸酯和氨丁醇O-磷酸酯的多种立体异构体的活性。在存在欧文氏菌属氨基醇O-磷酸酯裂解酶的情况下,(R)和(S)-2-氨基一l-丙醇O-磷酸酯均由该酶转化成丙酮,但是(S)异构体的产率要高得多。该酶还从3-氨基-2-丁醇O-磷酸酯异构体的两种混合物都生成丁酮,在含有(R,S)和(S,R)底物异构体的反应物中产率较高。丙酮和丁酮产物两者均通过MBTH进行衍生化,并通过如"一般方法"中所述的HPLC4企测。欧文氏菌属氨基醇激酶和氨基醇O-磷酸酯裂解酶的基因表达水平的优化为了提高欧文氏菌属氨基醇激酶和氨基醇O-磷酸酯裂解酶基因在大肠杆菌中的表达水平,由DNA2.0(RedwoodCity,CA)合成两种酶的密码子优化的编码区(分别命名为EKA:SEQIDNO:155,和EAT:SEQIDNO:156)。合成在5,与3'末端包含限制性酶切位点以用于克隆的每个编码区EKA具有5,Bbsl和3'EcoRI、Hindlll位点;EAT具有5,EcoRI和3,Hindlll位点。DNA2.0以质粒pEKA和pEAT的形式提供EKA和EAT编码区,这两个质粒在DNA2.0的pJ51载体中。通过连接经Bbsl和HmdIII消化的pEKA片段,将EKA优化的编码区亚克隆到pBAD.HisB载体的Ncol和Hindlll位点之间,以产生质粒pBAD.EKA。在所得的质粒中,编码区在组氨酸标记的5,端,所以使用引物SEQIDNO:157和SEQIDNO:158,通过进行QuickChange定点诱变反应,构建与欧文氏菌属的氨基醇激酶融合的N-末端HiS6标记的编码区以产生载体pBAD.His-EKA。将pBAD.His-EKA转化到大肠杆菌菌株BL21AI(F-ompThsdSB(rB—mB—)galdcmaraB::T7RNAP-tetA;Invitrogen)中以产生菌才朱BL21AI/pBAD.HisA-EKA。将50mLBL21AI/pBAD.HisA画EKA培养物培养至对数中期(OD6(K)=0.6),用0.1%阿拉伯糖诱导,并进一步在3(TC下孵育过夜。通过超声处理制备无细胞提取物。在非变性纯化条件下,按照生产商的说明书,用ProBond纯化系统(Invitrogen)纯化His6-标记的欧文氏菌属氨基醇激酶融合蛋白。预言性结果4姿照生产商的说明书,用ADPQuestAssay(DiscoveRx,Fremont,CA)分析His6标记的欧文氏菌属氨基醇激酶的活性。这是一种测定ADP的积累的生化测定法,ADP是利用氨丙醇或氨基丁醇作为底物的氨基醇激酶反应的产物。在0.2mL的反应物中,将10mM的底物与His6标记的欧文氏菌属氨基醇激酶在lOOmMTris-HCl(pH7.8)、10mMMgCl2、2mMKCl、O.lmMATP中混合,并在37。C下反应lh。加入ADP试剂A(lOO^L)和ADP试剂B(200pL),并将混合物在室温下孵育30min。以530nm的激发波长和590nm的发射波长测定荧光信号指示的活性。实施例16整个途径3的表达载体pCLBudAB-ter-T5chnA的构建用EcoRI消化载体pTrc99a::BudABC(如实施例9中所述),并将该DNA用KlenowDNA聚合酶处理以产生平末端。随后,用Spel消化该平末端化载体以产生含有budA和budB基因的2.5kb片段。用HindIII消化载体pCL1925-ter-T5chnA(如实施例9中所述),并将该DNA用KlenowDNA聚合酶处理以产生平末端。随后用Xbal消化该平末端化载体以产生4.6kb的片段,然后将该片段连接至来自pTrc99a::BudABC的budAB片段。将所得的质粒(命名为pCLBudAB-ter-T5chnA)用于转化大肠杆菌ToplO细胞,并利用引物pCL1925vecF(SEQIDNO:62)和N84seqR3(SEQIDNO:159)通过PCR筛选具有正确质粒结构的单克隆菌落。从产生预期大小为1.4kb的PCR产物的单克隆菌落中制备质粒。载体pKK223.KA-AT-APT的构建利用引物APTfor(SEQIDNO:162;5'端含有RBS和Smal位点)和APTrev(SEQIDNO:163;3'端添加了Smal位点),通过PCR从载体pBAD.APT(如实施例12中所述)扩增APT基因。将具有1.7kb的预期大小的产物进行凝胶纯化并用Smal消化以产生平末端。用Pstl消化载体pKK223.KA-AT(如实施例14中所述),并将DNA用KlenowDNA聚合酶处理以产生平末端。将所得的DNA片段与Smal消化的PCR产物连接,并将连接产物用于转化大肠杆菌ToplO细胞。利用引物OT872(SEQIDNO:127)和APTrev(SEQIDNO:163),通过PCR筛选单个的氨节青霉素抗性菌落。预计大小为4.1kbp的PCR产物的存在表明,编码APT的基因存在并且与编码KA和AT的基因相同的方向取向。使用引物APTs叫Rev(SEQIDNO:160)和APTseqFor(SEQIDNO:161)检验插入物的序列。将该质粒命名为pKK223.KA-AT-APT。通过将5mlT叩10/pKK223.KA-AT-APT的培养物在含有100jig/mL氨T青霉素的LB培养基中于37。C振荡培养,从而检验全部三种基因是否正确表达。当OD,达到约0.8时,通过加入IPTG至0.4mM来诱导质粒上的基因的表达。通过SDSPAGE和上述活性测定法来评估表达。2-丁醇生产菌抹的构建和2-丁醇和2-丁酮的产生用pKK223.KA-AT-APT和pCLBudAB-ter-T5chnA两者转化大肠杆菌菌林MG1655,并筛选具有氨节青霉素和大观霉素抗性的转化抹,氨苄青霉素和大观霉素抗性指示质粒的存在。将细胞接种到盛有50或150mlTM3a/葡萄糖培养基(含有合适的抗生素)的摇瓶(总体积大约为175ml)中以分别表现中等氧和^氐氧条件。加入IPTG至0.4mM以诱导pKK223.KA-AT-APT的基因表达。作为阴性对照,将MG1655细胞在缺少抗生素的相同培养基中培养。以起始OD60^0.01接种摇瓶,在34。C下以300rpm振荡培养24h。盛有50mL培养基的摇瓶盖有通气盖;盛有150mL培养基的摇瓶带有不通气的盖以最大程度减少空气交换。包含2-丁醇合成途径的MG1655/pKK223.KA-AT-APT/pCLBudAB-ter-T5chnA菌林在低等和中等氧条件下产生了2-丁酮和2-丁醇两者,而阴性对照菌株未产生可检测水平的2-丁醇或2-丁酮。实施例17甘油脱水酶和丁二醇脱水酶活性的表4正甘油脱水酶(E.C.4.2丄30)和二醇脱水酶(E.C.4.2丄28)虽然在结构上相关,但本领域内通常基于多种差异(包括底物特异性)来区分。本实施例证明了甘油脱水酶将内消旋-2,3-丁二醇转化为2-丁酮。在US6,514,733(Emptage等人)和WO2003089621(将这两篇文献以引用的方式并入本文)中描述了重组大肠杆菌菌抹KLP23/pSYC012,其包含肺炎克雷伯菌基因,该基因编码甘油脱水酶的多个亚基(a:SEQIDNO:145(编码区)和146(蛋白质);卩SEQIDNO:147(编码区)和148(蛋白质);和y:SEQIDNO:149(编码区)和150(蛋白质)),并且其还包含肺炎克雷伯菌基因,该基因编码甘油脱水酶再激活酶的多个亚基(大亚基,SEQIDNO:151(编码区)和152(蛋白质);以及小亚基,SEQIDNO:153(编码区)和154(蛋白质))。通过本领域技术人员已知的方法制备KLP23/pSYC012无细胞粗提物。在37。C下80mMHEPES緩冲液(pH8.2)中于无光条件下进行酶测定法,该緩冲液具有12iuM辅酶Bu和10mM内消旋-2,3-丁二醇。通过HPLC(使用ShodexSH-1011柱和具有折射率检测器的SH-G保护柱;0.01MH2S04作为流动相,流速为0.5mL/min,柱温为50°C;2-丁酮保留时间^40.2min)监测2-丁酮的生成。通过甘油脱水酶制备的2-丁酮的形成速率为0.4nmol/min/mg粗蛋白。实施例18通过产生并4企-验经实-验证明的二醇/甘油脱水酶的分布型HMM对二醇/甘油脱水酶进行结构分析二醇脱水酶和甘油脱水酶分布属于酶类型4.2.1.28和4.2.1.30。这两种类型的酶每种均为三个亚基的复合物大亚基(也称为a亚基)、中等亚基(也称为(3亚基)和小亚基(也称为y亚基)。在一些甘油脱水酶中,发现大亚基和中等亚基是融合的。通过序列鉴定家族成员将产酸克雷伯菌丁二醇脱水酶用作原型酶以用于鉴定二醇和甘油脱水酶家族。将a亚基的氨基酸序列(GenBankNo:BAA08099;SEQIDNO:8)、卩亚基的氨基酸序列(GenBankNo:BAA08100;SEQIDNO:10)和y亚基的氨基酸序列(GenBankNo:BAA08101;SEQIDNO:12)每个均作为查询序列,对GenBank非冗余蛋白质数据库采用默认参数进行BLASTp搜索。提取具有相关匹配的序列相关性通过关于匹配蛋白质的E值分值、蛋白质定义、GenBank报告中包括的细节,以及关于主题的文献综述。对于大亚基,BLAST输出结果显示E值从e-20突然增加至E值为1.5。具有1.5或更大的E值的全部序列匹配均定义为不属于脱水酶。这些序列中的许多被标定为DNA引导的RNA聚合酶卩亚基。有些匹配的E值约为e-20,其为部分序列。如果E值低于1.5,则将没有注释的序列包括在内。利用产酸克雷伯菌丁二醇脱水酶a亚基作为查询序列,50种同系物被鉴定为该蛋白质家族的成员。该组包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶a亚基家族的全长序列是原型SEQIDNO:948和SEQIDNO:93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。SEQIDNO:233、235、237、239、241、246、247包括a亚基和卩亚基两者,这两个亚基在这些序列中融合在一起。利用产酸克雷伯菌丁二醇脱水酶P-亚基作为查询序列,51种同系物被鉴定为该蛋白质家族的成员。该组成员包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶卩亚基家族的全长序列是原型SEQIDNO:10和SEQIDNO:95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。利用产酸克雷伯菌丁二醇脱水酶Y亚基作为查询序列,48种同系物被鉴定为该蛋白质家族的成员。该组成员包括不是全长蛋白质的一些序列。鉴定为二醇/甘油脱水酶y亚基家族的全长序列是原型SEQIDNO:12和SEQIDNO:97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。鉴定具有经实验评估的功能的家族成员对于通过上述分析鉴定的每条序列,在BRENDA、UniProt和NCBIEntrez数据库中搜索其生化功能的实验证据。BRENDA是一个人工维护的数据库,其含有从实验文献提取的关于酶动力学、物理和生化性质的详细信息,并且具有与相关数据库的链接(CologneUniversityBiolnformaticsCenter)。UniProtKnowledgebase由人工维护部分Swiss-Prot数据库和由机器注释补充TrEMBL数据库构成。人工维护的Swiss-Prot数据库(SwissInstituteofBiomformatics)才是供了高水平的蛋白质注释,包括结构域结构、翻译后修饰和序列变体。NCBIEntrez是位于NCBI(NationalCenterforBiotechnologyInformation,Bethesda,MD)关于主要数据库(包括PubMed、Nucleotide和ProteinSequences、ProteinStructures、CompleteGenomes和Taxonomy)的集成的、基于文本的搜索和检索系统。通过对从这些数据库鉴定的信息和参考文献进行分析,鉴定了经实-验-验证具有二醇或甘油脱水酶功能的八种二醇/甘油脱水酶。这八种酶在表10中示出。<table>tableseeoriginaldocumentpage97</column></row><table>将来自具有实验确定的功能的二醇/甘油脱水酶的每种亚基的一组8条氨基酸序列(在表10中列出),通过用采用默认参数的ClustalW进行多序列比对来比较。大亚基的同一性百分比范围为97.6%至58.4%。中等亚基的同一性百分比范围为89.5%至41.7%。小亚基的同一性百分比范围为83.3%至36.4%。因而,一些亚基序列之间的序列同一性程度比较低(例如36.4%、41.7%),尽管已经知道这些亚基为通过实验数据已知能执行相同功能的酶的组分。低程度的序列同一性百分比使得利用这些用于结构/功能相关性的标准变得不切实际。经实〗全-睑证的二醇/甘油脱水酶与其它二醇/甘油脱水酶的序列关为了进行这些分析,将大于>95%同一性的高度冗余的序列从大亚基、中等亚基或小亚基的序列集中移除,只保留所有经实验验证的功能序列。截短的或部分的蛋白质序列也被移除。利用采用默认参数的ClustalW对剩下的序列进行多序列比对。大亚基的同一性百分比的范围为97.6%(最高的百分比来自多条经实验验证的序列)至42.8%。中等亚基的同一性百分比的范围为91.9%至26.4%。小亚基的同一性百分比的范围为85.2%至20.5%。这些同一性百分比范围类似于经实验验证的序列的同一性百分比范围。基于多序列比对,利用邻接算法(neighbor-joiningalgorithm)构建系统树(如MEGA软件包3.1版中所实现的;Kumar等人,2004BriefingsinBioinfo腿tics5:150-163。)。系统树在图2(大亚基)、图3(中等亚基)和图4(小亚基)中示出,其中对于每个图,映射的序列(mappedsequence)的身份在检索表中列出。从标记为经实验验证的功能序列的位置(二醇脱水酶和甘油脱水酶分別在黑色和浅灰色园圈中)可以看出,这些序列散步该系统树的大部分。然而,每个系统树确实包括具有没有经实验验证的成员的分支,但这些成员看起来属于二醇/甘油脱水酶家族。基于八条亚基序列的序列集构建二醇/甘油-脱水酶家族的分布型隐马尔可夫模型(HMM)一种替代的对酶的二醇/甘油脱水酶家族的亚基集的结构/功能表征是用HMMER软件包(分布型HMM所依据的理论在如下参考文献中描述R.Durbin,S.Eddy,A.Krogh和G.Mitchison,Biologicalsequenceanalysis:probabilisticmodelsofproteinsandnucleicacids,CambridgeUniversityPress,1998;Krogh等人,1994;J.Mol.Biol.235:1501-1531),才艮据可得自HMMER(JaneliaFarmResearchCampus,Ashburn,VA)的用户指南进行。将经功能鉴定的二醇/甘油脱水酶的大亚基、中等亚基和小亚基的每个8条序列(如表10中所示)的序列集用HMMER软件程序单独地分析。HMMER软件程序的输出为分布型隐马尔可夫才莫型(HMM),其表征了输入序列。如用户指南中所述,分布型HMM是多序列比对的统计模型。这些分布型HMM捕集了关于每列比对的保守性程度,以及在各个位置上哪种氨基酸最可能出现的位置特异性信息。因而,HMM具有形式概率基础(formalprobabilisticbasis)。大量的蛋白质家族的分布型HMM可以在PFAM数据库中获得(JaneliaFarmResearchCampus,Ashbum,VA)。每个分布型HMM如下构建步骤l.构建序列比对用采用默认参数的ClustalW对经功能验证的二醇/甘油脱水酶的大亚基的八条序列(SEQIDNO:8、99、105、135、138、141、146和164)进行比对。对中等亚基序列的序列集(SEQIDNs:10、101、107、136、139、142、148和165)和小亚基序列的序列集(SEQIDNO:12、103、109、137、140、143、150和166)同样用采用默认参数的ClustalW进行比对。步骤2.构建分布型HMM采用默认参数,对每个比对序列集执行hmmbuild程序。hmmbuild读取多序列比对文件,构建新的分布型HMM,并将该分布型HMM保存至文件。利用该程序,从上述每个亚基序列集的多序列比对产生未校准的分布型HMM。基于HMMER软件用户指南的如下信息给出了一些对hmmbuild程序构建分布型HMM的方式的描述。分布型HMM能才莫拟空位比对,如包括插入和缺失,这使得该软件能描述完整的保守结构域(而不是仅描述没有空位的基序)。插入和缺失用插入(I)状态和缺失(D)状态来模拟。含有多于某一分数x的空位字符的所有列将被赋为插入列。缺省时,x设定为0.5。每种匹配状态具有与之相关的I状态和D状态。HMMER将比对中相同的共有位置处的一组三种状态(M/D/I)称为"节点(node)"。这些状态与称为状态转移概率(statetransitionprobability)的箭头互联。M和I状态是发射体(emitter),而D状态是沉默的。对这些转移(transition)进行排列以使得在每个节点,或者使用了M状态(并对残基进行比对和打分),或者使用了D状态(不进行残基比对,导致缺失-空位字符'-')。插入出现在节点之间,并且I状态具有自转移(self-transition),允许一个或多个插入残基出现在共有列之间。匹配状态的残基的分值(即匹配状态发射分值),或插入状态的残基的分值(即插入状态发射分值)与Log—2(p—x)/(null—x)成比例。其中,p—x是根据分布型HMM的、比对中特定位置处的氨基酸残基的概率,而null一x是根据Null模型的概率。Null模型是一种单一状态的概率模型,具有预先计算的20种氨基酸中每种的发射概率集,该概率源于氨基酸在SWISSPROTrelease24中的分布。状态转移分值也计算为胜算对数(logodds)参数并与Log—2(t—x)成比例。其中t一x是转移至发射状态或非发射状态的概率。步骤3j交准分布型HMM用hmmcalibrate读取每个分布型HMM,hmmcalibrate用该分布型HMM对大量合成的随机序列进行打分(所用的合成序列的默认数是5,000),将极值分布(EVD)与这些分值的直方图拟合,并重新保存HMM文件,该文件现在包括了EVD参数。在用该分布型HMM搜索蛋白质序列数据库时,这些EVD参数(p和X)被用于计算二进制分值(bitscore)的E值。hmmcalibrate将两个参数在标为"EVD"的行上写入HMM文件这两个参数是极值分布(EVD)的p(位置)和X(尺度)参数,该极值分布最匹配对随机产生的序列进行计算得到的分值的直方图,其中该随机产生的序列具有大约与SWISS-PROT相同的长度和残基组成。对每个分布型HMM执行该校准。大亚基、中等亚基和小亚基序列集的校准的分布型HMM在附录中给出,为a分布型HMM、卩分布型HMM和y分布型HMMExcel图表。每个分布型HMM在图表中给出,图表给出了每种氨基酸在氨基酸序列中各个位置出现的概率。对于每个位置,突出显示了最高的斗既率。表11显示了为具有经实-验验证的功能的二醇/甘油脱水酶的大亚基而构建的分布型HMM的几行。100<table>tableseeoriginaldocumentpage101</column></row><table>序列都匹配。因而,通过与具有经实验验证的功能的8种二醇和甘油脱水酶的大亚基、中等亚基或小亚基的分布型HMM匹配,全部二醇和甘油脱水酶均与这8种酶关联。匹配所述分布型HMM的全长二醇和甘油脱水酶具有如下SEQIDNO:大(a)亚基8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。融合的大亚基和中等亚基(大亚基和中等亚基部分分别匹配大亚基分布型HMM和中等亚基分布型HMM):233、235、237、239、241、246和247。中等(P)亚基10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和'167。小)亚基12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。这些分析显示,每种亚基的用具有经实验验证的功能的序列构建的分布型HMM,提供了与二醇/甘油脱水酶的功能关联的结构。所有上述序列与该分布型HMM的匹配继而又提供了这些序列的结构/功能关联。102表12<table>tableseeoriginaldocumentpage103</column></row><table>用于产生文件的命令该命令表示将hmmcalibrate(默认参数)应用于hmm分布比对文件中的序列4t文件产生的时间用于null模型(单G状态)的转移概率分布197249902-1085-142-21-31345531201用于null模型(G状态〕的符号发射概率分布(如4或20)个整数用于将这些转换回至模型概率的null概率为l/k。384-1998-644EVD-264.9891970.112643极值分布参数p和l,均为浮点数值。、为正且非零。在用hmmcdibrate校准模型时设定这些值。hmmaCd-efghikl|m|n|p|o|r|s|t|v|w|ym>mi>mb->m-5851585km)-965-S82-2125-1844276-2022-1302373-1390610输聘-1701-2229-1356-1425-1444-1028126-1279-B801--14323343-381399106626210466-720275394459635s117294-249-33~6d45-7087894-1115-701-1378-585,■603-1732■469811-2化2-1397205-1770繊-1654掘-59-1465629495471-1439-1719-12942--149-50023343掘399106626210-4郎-7202753944596359117■369-294-249-350"6045-2321894-111s-701-1378111<table>tableseeoriginaldocumentpage104</column></row><table><table>tableseeoriginaldocumentpage105</column></row><table><table>tableseeoriginaldocumentpage106</column></row><table><table>tableseeoriginaldocumentpage107</column></row><table><table>tableseeoriginaldocumentpage108</column></row><table><table>tableseeoriginaldocumentpage0</column></row><table><table>tableseeoriginaldocumentpage110</column></row><table><table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table><table>tableseeoriginaldocumentpage114</column></row><table><table>tableseeoriginaldocumentpage115</column></row><table><table>tableseeoriginaldocumentpage116</column></row><table><table>tableseeoriginaldocumentpage117</column></row><table><table>tableseeoriginaldocumentpage118</column></row><table><table>tableseeoriginaldocumentpage119</column></row><table><table>tableseeoriginaldocumentpage120</column></row><table><table>tableseeoriginaldocumentpage121</column></row><table><table>tableseeoriginaldocumentpage122</column></row><table><table>tableseeoriginaldocumentpage123</column></row><table><table>tableseeoriginaldocumentpage124</column></row><table><table>tableseeoriginaldocumentpage125</column></row><table><table>tableseeoriginaldocumentpage126</column></row><table><table>tableseeoriginaldocumentpage127</column></row><table><table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table><table>tableseeoriginaldocumentpage130</column></row><table><table>tableseeoriginaldocumentpage131</column></row><table><table>tableseeoriginaldocumentpage132</column></row><table><table>tableseeoriginaldocumentpage133</column></row><table><table>tableseeoriginaldocumentpage134</column></row><table><table>tableseeoriginaldocumentpage135</column></row><table><table>tableseeoriginaldocumentpage136</column></row><table><table>tableseeoriginaldocumentpage137</column></row><table><table>tableseeoriginaldocumentpage138</column></row><table><table>tableseeoriginaldocumentpage139</column></row><table><table>tableseeoriginaldocumentpage140</column></row><table><table>tableseeoriginaldocumentpage141</column></row><table><table>tableseeoriginaldocumentpage142</column></row><table><table>tableseeoriginaldocumentpage143</column></row><table><table>tableseeoriginaldocumentpage144</column></row><table><table>tableseeoriginaldocumentpage145</column></row><table><table>tableseeoriginaldocumentpage146</column></row><table><table>tableseeoriginaldocumentpage147</column></row><table><table>tableseeoriginaldocumentpage148</column></row><table><table>tableseeoriginaldocumentpage149</column></row><table><table>tableseeoriginaldocumentpage150</column></row><table><table>tableseeoriginaldocumentpage151</column></row><table><table>tableseeoriginaldocumentpage152</column></row><table><table>tableseeoriginaldocumentpage153</column></row><table><table>tableseeoriginaldocumentpage154</column></row><table><table>tableseeoriginaldocumentpage155</column></row><table><table>tableseeoriginaldocumentpage156</column></row><table><table>tableseeoriginaldocumentpage157</column></row><table><table>tableseeoriginaldocumentpage158</column></row><table><table>tableseeoriginaldocumentpage159</column></row><table><table>tableseeoriginaldocumentpage160</column></row><table><table>tableseeoriginaldocumentpage161</column></row><table><table>tableseeoriginaldocumentpage162</column></row><table><table>tableseeoriginaldocumentpage163</column></row><table><table>tableseeoriginaldocumentpage164</column></row><table><table>tableseeoriginaldocumentpage165</column></row><table><table>tableseeoriginaldocumentpage166</column></row><table><table>tableseeoriginaldocumentpage167</column></row><table><table>tableseeoriginaldocumentpage168</column></row><table><table>tableseeoriginaldocumentpage169</column></row><table><table>tableseeoriginaldocumentpage170</column></row><table><table>tableseeoriginaldocumentpage171</column></row><table><table>tableseeoriginaldocumentpage172</column></row><table><table>tableseeoriginaldocumentpage173</column></row><table><table>tableseeoriginaldocumentpage174</column></row><table><table>tableseeoriginaldocumentpage175</column></row><table><table>tableseeoriginaldocumentpage176</column></row><table><table>tableseeoriginaldocumentpage177</column></row><table>表13<image>imageseeoriginaldocumentpage178</image><table>tableseeoriginaldocumentpage179</column></row><table><table>tableseeoriginaldocumentpage180</column></row><table><table>tableseeoriginaldocumentpage181</column></row><table><table>tableseeoriginaldocumentpage182</column></row><table><table>tableseeoriginaldocumentpage183</column></row><table><table>tableseeoriginaldocumentpage184</column></row><table><table>tableseeoriginaldocumentpage185</column></row><table><table>tableseeoriginaldocumentpage186</column></row><table><table>tableseeoriginaldocumentpage187</column></row><table><table>tableseeoriginaldocumentpage188</column></row><table><table>tableseeoriginaldocumentpage189</column></row><table><table>tableseeoriginaldocumentpage190</column></row><table><table>tableseeoriginaldocumentpage191</column></row><table><table>tableseeoriginaldocumentpage192</column></row><table><table>tableseeoriginaldocumentpage193</column></row><table><table>tableseeoriginaldocumentpage194</column></row><table><table>tableseeoriginaldocumentpage195</column></row><table><table>tableseeoriginaldocumentpage196</column></row><table><table>tableseeoriginaldocumentpage197</column></row><table><table>tableseeoriginaldocumentpage198</column></row><table><table>tableseeoriginaldocumentpage199</column></row><table><table>tableseeoriginaldocumentpage200</column></row><table><table>tableseeoriginaldocumentpage201</column></row><table><table>tableseeoriginaldocumentpage202</column></row><table><table>tableseeoriginaldocumentpage203</column></row><table><table>tableseeoriginaldocumentpage204</column></row><table><table>tableseeoriginaldocumentpage205</column></row><table><table>tableseeoriginaldocumentpage206</column></row><table>表14<image>imageseeoriginaldocumentpage207</image><table>tableseeoriginaldocumentpage208</column></row><table><table>tableseeoriginaldocumentpage209</column></row><table><table>tableseeoriginaldocumentpage210</column></row><table><table>tableseeoriginaldocumentpage211</column></row><table><table>tableseeoriginaldocumentpage212</column></row><table><table>tableseeoriginaldocumentpage213</column></row><table><table>tableseeoriginaldocumentpage214</column></row><table><table>tableseeoriginaldocumentpage215</column></row><table><table>tableseeoriginaldocumentpage216</column></row><table><table>tableseeoriginaldocumentpage217</column></row><table><table>tableseeoriginaldocumentpage218</column></row><table><table>tableseeoriginaldocumentpage219</column></row><table><table>tableseeoriginaldocumentpage220</column></row><table><table>tableseeoriginaldocumentpage221</column></row><table><table>tableseeoriginaldocumentpage222</column></row><table><table>tableseeoriginaldocumentpage223</column></row><table><table>tableseeoriginaldocumentpage224</column></row><table><table>tableseeoriginaldocumentpage225</column></row><table><table>tableseeoriginaldocumentpage226</column></row><table><image>imageseeoriginaldocumentpage227</image>权利要求1.一种重组微生物宿主细胞,包含至少一种编码催化底物至产物转化的多肽的DNA分子,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为α-乙酰乳酸;ii)α-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;iv)2,3-丁二醇转化为2-丁酮;以及v)2-丁酮转化为2-丁醇;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的,并且其中所述微生物宿主细胞产生2-丁醇。2.—种重组微生物宿主细胞,包含至少一种编码催化底物至产物转化的多肽的DNA分子,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;以及iv)2,3-丁二醇转化为2-丁酮;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的,并且其中所述微生物宿主细胞产生2-丁酮。3.根据权利要求1或2所述的宿主细胞,其中催化底物丙酮酸至产物a-乙酰乳酸转化的多肽是乙酰乳酸合酶。4.根据权利要求1或2所述的宿主细胞,其中所述催化底物a-乙酰乳酸至产物乙偶姻转化的多肽是乙酰乳酸脱羧酶。5.根据权利要求1或2所述的宿主细胞,其中所述催化底物乙偶姻至产物2,3-丁二醇转化的多肽是丁二醇脱氢酶。6.根据权利要求1或2所述的宿主细胞,其中所述催化底物2,3-丁二醇至产物2-丁酮转化的多肽是二醇脱水酶或甘油脱水酶。7.根据权利要求1所述的宿主细胞,其中所述催化底物2-丁酮至产物2-丁醇转化的多肽是丁醇脱氢酶。8.根据权利要求1或2所述的宿主细胞,其中所述细胞选自由以下细胞组成的组细菌、蓝细菌、丝状真菌和酵母。9.根据权利要求8所述的宿主细胞,其中所述细胞是选自由以下属组成的组的属的成员梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷伯菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属和酵母属。10.根据权利要求3所述的宿主细胞,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述乙酰乳酸合酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:4,SEQIDNO:77和SEQIDNO:79。11.根据权利要求4所述的宿主细胞,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述乙酰乳酸脱羧酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:2、SEQIDNO:81和SEQIDNO:83。12.根据权利要求5所述的宿主细胞,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述丁二醇脱氢酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:6、SEQIDNO:85、SEQIDNO:87和SEQIDNO:89。13.才艮据权利要求6所迷的宿主细月包,其中所迷二醇脱水酶或甘油脱水酶包含全长的大亚基、中等亚基和小亚基,当用分布型隐马尔可夫模型查询时,所述每种亚基给出的E-值参数是0.01或更小,其中所述分布型隐马尔可夫^jt型是用如下亚基产生SEQIDNO:8、99、105、135、138、141、146和164的大亚基;SEQIDNO:10、101、107、136、139、142、148和165的中等亚基;和SEQIDNO:12、103、109、137、140、143、150和166的小亚基;每次查询是用其中Z参数设定为10^f乙的hmmsearch算法进4亍。14.根据权利要求6所述的宿主细胞,其中所述二醇脱水酶或所述甘油脱水酶由包括如下步骤的方法鉴定a)从对应所述二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型;其中i)所述大亚基包含选自由以下序列组成的组的氨基酸序歹'J:SEQIDNO:8、99、105、135、138、141、146和164;ii)所述中等亚基包含选自由以下序列组成的组的氨基酸序歹'J:SEQIDNO:10、101、107、136、139、142、148和165;以及iii)所述小亚基包含选自由以下序列组成的组的氨基酸序歹寸SEQIDNO:12、103、109、137、140、143、150和166;b)利用其中Z参数设定为10亿以及E值参数设定为0.01的hmmsearch算法,用(a)的分布型隐马尔可夫才莫型查询至少一个公开的含二醇和甘油脱水酶序列的蛋白质序列数据库,以鉴定二醇和甘油脱水酶氨基酸序列的第一数据集;以及c)从(b)的第一数据集移除任何部分序列以产生二醇和甘油脱水酶氨基酸序列的第二数据集,其中二醇脱水酶和甘油脱水酶得以鉴定。15.根据权利要求6所述的宿主细胞,其中所述二醇脱水酶或甘油脱水酶包含大亚基,基于使用默认参数为空位罚分-10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述大亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。16.根据权利要求6所述的宿主细胞,其中所述二醇脱水酶或甘油脱水酶包含中等亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述中等亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、(192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、(364、265、266和167。17.根据权利要求6所述的宿主细胞,其中所述二醇脱水酶或甘油脱水酶包含小亚基,基于使用默认参数为空位罚分-10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。18.根据权利要求6所述的宿主细胞6,其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述融合的大亚基、中等亚基和小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95。/。的同一性的氨基酸序列SEQIDNO:233、235、237、239、241、246和247。19.根据权利要求6所述的宿主细胞,其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基,并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95%的同一性,其中所述三条氨基酸序列选自由如下序列组成的组a)SEQIDNO8,SEQIDNO:IO和SEQIDNO:125b)SEQIDNO93,SEQIDNO:95和SEQIDNO:97;c)SEQIDNO99,SEQIDNO:101和SEQIDNO:103;d)SEQIDNO105,SEQIDNO:107和SEQIDNO:109;e)SEQIDNO135,SEQIDNO:136和SEQIDNO:137;f)SEQIDNO138,SEQIDNO:139和SEQIDNO:140;g)SEQIDNO146,SEGIDNO:148和SEQIDNO:150;h)SEQIDNO141,SEQIDNO:142和SEQIDNO:143;和i)SEQIDNO164,SEQIDNO:165和SEQIDNO:166;其中所述序列同一性是基于使用默认参数为空位罚分=10、空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法。20.根据权利要求8所述的宿主细胞,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述丁醇脱氬酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:14、SEQIDNO:72、SEQIDNO:75和SEQIDNO:91。21.—种生产2-丁醇的方法,包括1)提供重组微生物宿主细胞,其包含至少一种编码催化底物至产物转化的多肽的DNA分子,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;iv)2,3-丁二醇转化为2-丁酮;以及v)2-丁酮转化为2-丁醇;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的;和2)使(1)中的宿主细胞在能生产2-丁醇的条件下与可发酵碳底物在发酵培养基中接触。22.—种生产2-丁酮的方法,包括1)提供重组微生物宿主细胞,其包含至少一种编码催化底物至产物转化的多肽的DNA分子,所述底物至产物的转化选自由以下转化组成的组i)丙酮酸转化为a-乙酰乳酸;ii)a-乙酰乳酸转化为乙偶姻;iii)乙偶姻转化为2,3-丁二醇;以及iv)2,3-丁二醇转化为2-丁酮;其中所述至少一种DNA分子与所述微生物宿主细胞是异源的;和2)使(1)中的宿主细胞在能生产2-丁酮的条件下与可发酵碳底物在发酵培养基中接触。23.根据权利要求21或22所述的方法,其中所述可发酵碳底物选自由单糖、寡糖和多糖组成的组。24.根据权利要求21或22所述的方法,其中催化底物丙酮酸至产物a-乙酰乳酸转化的所述多肽是乙酰乳酸合酶。25.根据权利要求21或22所述的方法,其中催化底物a-乙酰乳酸至产物乙偶姻转化的所述多肽是乙酰乳酸脱羧酶。26.根据权利要求21或22所述的方法,其中催化底物乙偶姻至产物2,3-丁二醇转化的所述多肽是丁二醇脱氬酶。27.根据权利要求21或22所述的方法,其中催化底物2,3-丁二醇至产物2-丁酮转化的所述多肽是二醇脱水酶或甘油脱水酶。28.根据权利要求21所述的方法,其中催化底物2-丁酮至产物2-丁醇转化的所述多肽是丁醇脱氢酶。29.才艮据权利要求21或22所述的方法,其中所述细胞选自以下细胞组成的组细菌、蓝细菌、丝状真菌和酵母。30.根据权利要求29所述的方法,其中所述细胞是选自由以下属组成的组的属的成员梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷伯菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属和酵母属。31.根据权利要求24所述的方法,其中基于使用默认参数为空位罚分=10、空位长度罚分-0.1,以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述乙酰乳酸合酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:4、SEQIDNO:77和SEQIDNO:79。32.根据权利要求25所述的方法,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述乙酰乳酸脱羧酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:2、SEQIDNO:81和SEQIDNO:83。33.根椐权利要求26所述的方法,其中基于使用默认参数为空位罚分=10、空位长度罚分-0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述丁二醇脱氲酶具有与选自由以下序列组成的组的序列具有至少95%的同一性的氨基酸序列SEQIDNO:6、SEQIDNO:85、SEQIDNO:87和SEQIDNO:89。34.根据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含全长的大亚基、中等亚基和小亚基,当用分布型隐马尔可夫模型查询时,所述每种亚基给出的E-值参数是0.01或更小,其中所述分布型隐马尔可夫模型是用如下亚基产生SEQIDNO:8、99、105、135、138、141、146和164的大亚基;SEQIDNO:10、101、107、136、139、142、148和165的中等亚基;以及SEQIDNO:12、103、109、137、140、143、150和166的小亚基;每次查询是用其中Z参数i史定为104乙的hmmsearch算法进4亍。35.根据权利要求27所述的方法,其中所述二醇脱水酶或所述甘油脱水酶通过包括以下步骤的方法鉴定a)从对应所述二醇和甘油脱水酶的大亚基、中等亚基和小亚基的氨基酸序列的比对产生分布型隐马尔可夫模型;i)所述大亚基包含选自由以下序列组成的组的氨基酸序歹'J:SEQIDNO:8、99、105、135、138、141、146和164;ii)所述中等亚基包含选自由以下序列组成的组的氨基酸序歹寸SEQIDNO:10、101、107、136、139、142、148和165;以及iii)所述小亚基包含选自由以下序列组成的组的氨基酸序歹'J:SEQIDNO:12、103、109、137、140、143、150和166;b)利用其中Z参数设定为10亿以及E值参数设定为0.01的hmmsearch算法,用(a)的分布型隐马尔可夫才莫型查询至少一个公开的含二醇和甘油脱水酶序列的蛋白质序列数据库,以鉴定二醇和甘油脱水酶氨基酸序列的笫一数据集;以及C)从(b)的笫一数据集移除任何部分序列以产生二醇和甘油脱水酶氨基酸序列的第二数据集,其中二醇脱水酶和甘油脱水酶得以鉴定。36.根据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含大亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述大亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列8、93、99、105、135、138、141、146、164、167、170、173、176、179、182、185、188、191、194、197、200、203、206、209、212、215、218、221、224、227、130、243、254、255、256、257、258和259。37.4艮据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含中等亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述中等亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:10、95、101、107、136、139、142、148、165、168、171、174、177、180、183、186、189、192、195、198、201、204、207、210、213、216、219、222、225、228、231、244、250、252、260、261、262、263、364、265、266和167。38.根据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含小亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:12、97、103、109、137、140、143、150、166、169、172、175、178、181、184、187、190、193、196、199、202、205、208、211、214、217、220、223、226、229、232、234、236、238、240、242、245、248、249、251、253、268、270、271、272、273和274。39.根据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基,基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述融合的大亚基、中等亚基和小亚基包含与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:233、235、237、239、241、246和247。40.根据权利要求27所述的方法,其中所述二醇脱水酶或甘油脱水酶包含融合的大亚基、中等亚基和小亚基,并且与包含编码大亚基、中等亚基和小亚基的全部三条氨基酸序列的氨基酸序列具有至少95%的同一性,其中所述三条氨基酸序列选自由如下序列组成的组-.8,SEQIDNO:IO和SEQIDNO:12;93,SEQIDNO:95和SEQIDNO:97;99,SEQIDNO:101和SEQIDNO:103;105,SEQIDNO:107和SEQIDNO:109;135,SEQIDNO:136和SEQIDNO:137;138,SEQIDNO:139和SEQIDNO:140;146,SEQIDNO:148和SEQIDNO:150;141,SEQIDNO:142和SEQIDNO:143;和164,SEQIDNO:165和SEQIDNO:166;a)SEQIDNOb)SEQIDNOc)SEQIDNOd)SEQIDNOe)SEQIDNOf)SEQIDNOg)SEQIDNOh)SEQIDNOi)SEQIDNO其中所述序列同一性是基于使用默认参数为空位罚分=10、空位长度罚分=0.1,以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法。41.根据权利要求28所述的方法,其中基于使用默认参数为空位罚分=10、空位长度罚分=0.1、以及蛋白质权重矩阵为Gonnet250系列的ClustalW比对方法,所述丁醇脱氬酶具有与选自由以下序列组成的组的氨基酸序列有至少95%的同一性的氨基酸序列SEQIDNO:14、SEQIDNO:72、SEQIDNO:75和SEQIDNO:91。42.—种含2-丁醇的发酵产物培养基,所述发酵产物培养基是通过根据权利要求21所述的方法生产的。43.—种含有2-丁酮的发酵产物培养基,所述发酵产物培养基是通过权利要求22所述的方法生产的。全文摘要本发明提供了发酵生产四碳醇的方法。具体地讲,通过表达2-丁醇生物合成途径的重组细菌进行发酵生长而生产丁醇,优选2-丁醇。本发明的重组微生物和方法还可以适于生产2-丁酮,2-丁酮是本文所公开的2-丁醇生物合成途径中的中间产物。文档编号C12P7/16GK101454457SQ200780015929公开日2009年6月10日申请日期2007年5月2日优先权日2006年5月2日发明者A·C·伊里奥特,C·E·纳卡穆拉,G·K·多纳德森,J·-F·汤姆布,V·纳加拉詹申请人:纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1