用于改进微生物产生异戊二烯的异戊二烯合酶变体的制作方法

文档序号:580673阅读:326来源:国知局
专利名称:用于改进微生物产生异戊二烯的异戊二烯合酶变体的制作方法
技术领域
本发明提供方法和包含具有改进的催化活性和/或溶解度的至少一种异戊二烯合酶的组合物。具体地,本发明提供了用于增加微生物宿主细胞中异戊二烯产生的变异植物异戊二烯合酶。生物合成产生的本发明异戊二烯用于橡胶和高弹体的制造中。
背景技术
类异戊二烯是用于药物、营养药、调料、香料和橡胶产品中的异戊二烯聚合物。但是,天然类异戊二烯供应因生态顾虑而受限。出于该原因并为了提供具有更少杂质和更大均一性的类异戊二烯组合物,往往合成产生类异戊二烯,如橡胶。异戊二烯甲基-1,3-丁二烯)是不溶于水中并可溶于醇中的挥发烃。商业可行量的异戊二烯可以通过从石油C5裂化馏分直接分离或通过C5异烷烃或异烯烃脱水来获得(Weissermel 禾口 Arpe, Industrial Organic Chemistry,第 4 版,Wiley-VCH,第 117-122 页,200 。C5骨架也可以从更小的亚单位合成。但是,希望具有不依赖于不可再生资源的产生异戊二烯的商业可行方法。异戊二烯的生物合成产生通过两条不同代谢途径发生(Julsing等人,Appl Microbiol Biotechnol,75 1377-1384,2007)。在真核生物和古细菌(archae),异戊二烯通过甲羟戊酸(MVA)途径形成,而一些真细菌和高等植物通过甲基赤藓糖醇磷酸(MEP)途径产生异戊二烯。异戊二烯从植物中发散是光线和温度依赖的,其增加与叶发育相关。产生异戊二烯的酶(异戊二烯合酶)已经在杨属(Aspen)树木中被鉴定(Silver和i^all,Plant Physiol,97 :1588-1591,1991 ;和 Silver 和 Fall, J Biol Chem,270 :13010-13016,1995) 并认为负责体内从完整叶中产生异戊二烯。异戊二烯的细菌产生也已经被描述(Kuzma等人,Curr Microbiol, 30 :97-103,1995 ;和 ffilkins, Chemosphere,32 1427-1434,1996) 并且在量上随细菌生长的阶段和培养基的营养含量变化(授予!^11等人的美国专利号 5, 849, 970 ;和 Wagner 等人,JBacteriol,181 :4700_4703,1999,这两份文献均通过引用的方式完整并入本文)。然而,通过现有技术的细菌系统可获得的异戊二烯水平不足以商用。因而,本领域需要的是为制造类异戊二烯提供原料的高效、大规模、细菌性异戊二烯产生方法。本文提到的全部专利、专利申请、文章和出版物在此通过引用的方式明确地并入本文。发明概述本发明提供方法和包含具有改善的催化活性和/或溶解度的至少一种异戊二烯合酶的组合物。具体地,本发明提供了用于增加微生物宿主细胞中异戊二烯产生的植物变异异戊二烯合酶。生物合成产生的本发明异戊二烯用于橡胶和高弹体的制造中。
具体地,本发明提供了分离的异戊二烯合酶变体,其中该变体在与葛异戊二烯合酶的一个或多个(1、2、3、4、5、6、7、8、9或10个)残基相对应的位置处包含替换,所述的葛异戊二烯合酶包含SEQ ID NO :2中所述的氨基酸序列。在一些实施方案中,异戊二烯合酶变体是葛(葛属物种(Pueraria sp.))异戊二烯合酶变体或杨(杨属物种(Populus sp.)异戊二烯合酶变体。在一些实施方案中,所述一个或多个残基选自但不限于由L26、E30、F31、 Q33、L35、E36、N37、L39、K40、V41、K43、L44、R61、V62、D63、Q65、K87、E94、N95、L99、D100、 N105、K137、E138、G143、E144、N182、L184、K185、G187、N189、T190、P225、H226、K247、T257、 E258、M259、D266、N334、D353、S357、I358I、E361、N389、I392、I393、K398、E401、C421、Q423、 Q424、E425、D426、H430、L432、R433、S434、D437、R443、L462、E463、H476、N478、D479、Q485、 D508、P513、A515、Q532、Y533、L537、G538、R539、Y542、A543 和 P557 组成的组。在一些实施方案中,所述一个或多个残基选自但不限于由P24、N25 J309、D310、L377、F381、E384、Y399、 N402、A403、S406、S407、G409、A411、L413、F449、A456、T457、S458、A459、A460、E461、L462、 E463、R464、G465、E466、T467、T468、N469、M523、S527 和 Y531 组成的组。在一些实施方案中,所述一个或多个残基选自但不限于A20、N21、Y22、Q23、R271、W278、F299, V302和S408 组成的组。本发明也提供了分离的异戊二烯合酶变体,其具有葛异戊二烯合酶中的A20G替换,所述的葛异戊二烯合酶具有SEQ ID NO :2中所述的氨基酸序列。在这些实施方案的子集中,该变体包含至少两个替换0、3、4、5、6、7、8、9或10),其中所述替换之一是具有SEQ ID NO :2中所述氨基酸序列的葛异戊二烯合酶中的A20G替换。本发明也提供了分离的异戊二烯合酶变体,其具有葛异戊二烯合酶中的S408D替换,所述的葛异戊二烯合酶具有SEQ ID NO 2中所述的氨基酸序列。在这些实施方案的子集中,该变体包含至少两个替换(2、3、 4、5、6、7、8、9或10),其中所述替换之一是具有SEQ ID NO :2中所述氨基酸序列的葛异戊二烯合酶中的S408D替换。在一些优选的实施方案中,与野生型异戊二烯合酶相比,该异戊二烯合酶变体具有至少一种改进的特性。在一些特别优选的实施方案中,至少一种改进的特性选自但不限于由比活性(从二甲基烯丙基二磷酸产生异戊二烯)和溶解度组成的组。此外,本发明还提供编码该异戊二烯合酶变体的多核苷酸序列。也提供了包含与启动子有效连接的编码该异戊二烯合酶变体的多核苷酸序列的表达载体。在其他实施方案中,本发明提供了包含该表达载体的宿主细胞。也提供该宿主细胞的裂解物,其中裂解物还包含溶菌酶。在一些实施方案中,该裂解物具有中性PH(6. 5至7.幻,而在其他实施方案中,该裂解物具有碱性PH(高于7. 5且低于9. 5)。本发明也提供产生异戊二烯的方法,包括(a)提供包含该表达载体的宿主细胞;和(b)在适合产生异戊二烯的条件下培养该宿主细胞。在一些实施方案中,该方法还包括(c)回收异戊二烯。仍在其他实施方案中,该方法还包括(d)聚合异戊二烯。本发明还提供了检测异戊二烯合酶活性的方法,包括(a)在适合产生异戊二烯合酶变体的条件下培养包含该表达载体的宿主细胞;(b)用包含溶菌酶的裂解缓冲液裂解宿主细胞以产生细胞裂解物;和(c)通过测量来自二甲基烯丙基二磷酸(DMAPP)的异戊二烯产生来检测该细胞裂解物中的异戊二烯合酶活性。在一些实施方案中,宿主选自但不限于由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。在一些优选的实施方案中,宿主选自但不限于由埃希氏菌属物种(Escherichia sp.)(大肠杆菌(E. col))、泛菌属物种(Panteoa sp.)(柠檬泛菌 (P. citrea))、芽孢杆菌属物种(Bacillus sp.)(枯草芽孢杆菌(B. subtilis))、耶氏酵母属物种(Yarrowia sp.)(解脂耶氏酵母(Y. Iipolytica))和木霉属(Trichoderma)(里氏木霉(T. reesei))组成的组。在一些实施方案中,宿主细胞在包括碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、糖蜜、蔗糖和油组成的组。另外,本发明提供了检测多份样品中异戊二烯的方法(高通量筛选法),包括(a) 提供i)分别包含异戊二烯合酶的多份样品;ii)包含多个孔的玻璃板;和iii)该玻璃板的封盖;(b)将多份样品置于该玻璃板的多个孔中;(c)用封盖密封该玻璃板以产生密封的玻璃板,其具有与多个孔的每孔中样品相关的顶空;(d)在异戊二烯合酶有活性的条件下孵育该玻璃板;(e)检测顶空中的异戊二烯。在一些实施方案中,异戊二烯由气相色谱-质谱法(GC-MQ检测。在一些实施方案中,所述多份样品包含有包含表达载体的宿主细胞,所述的表达载体包含与启动子有效连接的编码异戊二烯合酶变体的多核苷酸序列。在一些实施方案中,所述多份样品包含宿主细胞裂解物、溶菌酶和二甲基烯丙基二磷酸(DMAPP)。在一些优选的实施方案中,玻璃板是深孔玻璃块。在一些优选的实施方案中,所述多个孔包括至少M个孔(优选地至少48个孔、更优选地至少96个孔、仍更优选地至少192个孔和最优选地至少384个孔)。在特别优选实施方案中,所述多个孔各自包含包含2ml或更小(优选地2ml至0. 2ml)的容积。额外地,本发明提供了宿主细胞,其包含与启动子有效连接的编码异戊二烯合酶变体的异源多核苷酸序列,其中该异戊二烯合酶变体在与葛异戊二烯合酶的一个或多个 (1、2、3、4、5、6、7、8、9或10个)残基相对应的位置处包含替换,所述的葛异戊二烯合酶包含 SEQ ID NO :2中所述的氨基酸序列。在一些实施方案中,所述一个或多个残基选自但不限于由 L26、E30、F31、Q33、L35、E36、N37、L39、K40、V41、K43、L44、R61、V62、D63、Q65、K87、E94、 N95、L99、D100、N105、K137、E138、G143、E144、N182、L184、K185、G187、N189、T190、P225、 H226、K247、T257、E258、M259、D266、N334、D353、S357、I358I、E361、N389、I392、I393、K398、 E401、C421、Q423、Q424、E425、D426、H430、L432、R433、S434、D437、R443、L462、E463、H476、 N478、D479、Q485、D508、P513、A515、Q532、Y533、L537、G538、R539、Y542、A543 和 P557 组成的组。在一些实施方案中,所述一个或多个残基选自但不限于由P24、N25、Y309、D310、 L377、F381、E384、Y399、N402、A403、S406、S407、G409、A411、L413、F449、A456、T457、S458、 A459、A460、E461、L462、E463、R464、G465、E466、T467、T468、N469、M523、S527 和 Y531 组成的组。在一些实施方案中,所述一个或多个残基选自但不限于々20、拟1、¥22、023、1 271、 W278、F299, V302和S408组成的组。本发明也提供了分离的异戊二烯合酶变体,其具有葛异戊二烯合酶中的A20G替换和/或S408D替换,所述的葛异戊二烯合酶具有SEQ ID NO 2中所述的氨基酸序列。在一些优选的实施方案中,与野生型异戊二烯合酶相比,该异戊二烯合酶变体具有至少一种改进的特性。在一些特别优选的实施方案中,至少一种改进的特性选自但不限于由比活性(从二甲基烯丙基二磷酸产生异戊二烯)和溶解度组成的组。在一些优选的实施方案中,该多核苷酸序列含于质粒内。在其他优选实施方案中,该多核苷酸序列整合到宿主细胞的染色体中。在一些实施方案中,宿主选自但不限于由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。在一些优选的实施方案中,宿主选自但不限于由埃希氏菌属物种(Escherichia sp.)(大肠杆菌(E.coli))、泛菌属物种(Panteoa sp.)(柠檬泛菌(P. citrea))、芽孢杆菌属物种(Bacillus sp.)(枯草芽孢杆菌(B. subtilis))、耶氏酵母属物种(Yarrowia sp.)(解脂耶氏酵母(Y. Iipolytica)) 和木霉属(Trichoderma)(里氏木霉(T.reesei))组成的组。在一些实施方案中,宿主细胞在包括碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、糖蜜、蔗糖和油组成的组。在一些实施方案中,宿主细胞还包含有时与天然DXP 途径组合的编码IDI多肽的异源或天然核酸和/或编码DXS多肽的异源或天然核酸(例如, 在天然DXP途径之外,在大肠杆菌中表达dxs和idi)。备选地,完整的DXP途径(

图15)可以在质粒上表达或整合于染色体上作为操纵子,带有调控表达的单个启动子或调控各个基因中一个或多个基因的不同强度的多个启动子(例如GI 1.20,GI 1.5或GI 1. 6)。在一些实施方案中,宿主细胞还包含编码IDI多肽和DXS多肽的一种或多种核酸,而在一些优选的实施方案中,一个载体编码该异戊二烯合酶变体、该IDI多肽和该DXS多肽。在一些实施方案中,宿主细胞还包含编码MVA途径多肽(例如来自酿酒酵母(Saccharomyces cerevisia) 或粪肠球菌(Enterococcus faecalis)的MVA途径多肽)的异源核酸。在一些实施方案中, 宿主细胞还包含编码MVA途径多肽和DXS多肽的一种或多种核酸,而在一些优选的实施方案中,一个载体编码该异戊二烯合酶变体、该MVA途径多肽和该DXS多肽。在一些优选的实施方案中,宿主细胞还包含编码DXS多肽、IDI多肽、或者其余DXP途径多肽中一种或多种多肽和MVA途径多肽的一种或多种核酸。在一些实施方案中,该载体还包含选择标记(例如, 抗生素抗性核酸)。也提供了产生异戊二烯的方法,包括(a)在用于产生异戊二烯的合适培养条件下培养该宿主细胞;和(b)产生异戊二烯。在一些实施方案中,该方法还包括(c) 回收异戊二烯。在一些优选的实施方案中,该方法还包括(d)聚合异戊二烯。本发明也提供产生异戊二烯合酶的方法,包括(a)提供(i)宿主细胞;和(ii)与启动子有效连接的编码异戊二烯合酶变体的核酸,其中该异戊二烯合酶变体在与葛异戊二烯合酶的一个或多个(1、2、3、4、5、6、7、8、9或10个)残基相对应的位置处包含替换,所述葛异戊二烯合酶包含SEQ ID NO 2中所述的氨基酸序列;(b)使宿主细胞与该核酸接触以产生转化的宿主细胞;和(C)在用于产生异戊二烯合酶的合适培养条件下培养转化的宿主细胞。在另一方面,本发明提供了分离的杨异戊二烯合酶变体。在一个实施方案中,该变体包含在异戊二烯合酶氨基端部分中的截短。在另一个实施方案中,该异戊二烯合酶变体与全长异戊二烯合酶相比具有增加的比活性。在另一个实施方案中,该异戊二烯合酶是 SEQ ID NO :120的银白杨异戊二烯合酶。在另一个实施方案中,该变体选自由MEA变体(SEQ ID NO :122)、MSV 变体(SEQ ID NO :124)、MVS 变体(SEQ ID NO 126), MTE 变体(SEQ ID N0:U8)、MNV变体(SEQ ID NO :130)组成的组。在另一个实施方案中,该变体是MEA变体 (SEQ ID NO :122)。在另一个实施方案中,该变体选自由TRC (-3)变体(SEQ ID NO :136)、 TRC (-4)变体(SEQ ID NO :138)、TRC (-5)变体(SEQ ID NO :140)、TRC (-6)变体(SEQ ID NO 142)和TRC(-7)变体(SEQ ID NO :144)组成的组。在另一个实施方案中,该变体是美洲山杨异戊二烯合酶的MET变体(SEQ ID NO 146) 0在另一个实施方案中,该变体是毛果杨(P. trichocharpa)异戊二烯合酶的 MET 变体(SEQ ID NO :148)。在另一方面,本发明提了分离的杨异戊二烯合酶变体,其中该变体包含野生型异戊二烯合酶的一个或多个氨基酸残基的替换;并且其中该异戊二烯合酶变体与野生型异戊二烯合酶相比具有增加的异戊二烯合酶活性。在一个实施方案中,增加的异戊二烯合酶活性由包含异戊二烯合酶变体的宿主细胞显示,该宿主细胞与包含亲本异戊二烯合酶的宿主细胞相比在二甲基烯丙基焦磷酸(DMAPP)存在下以更快速率生长。在另一个实施方案中, 该异戊二烯合酶是SEQ ID NO :120的银白杨异戊二烯合酶。在另一个实施方案中,该变体包含选自由 V10M、F12S、T15A、E18G、V58I、V58F、L70Q、L70V、L70T、T71P、V79L、E89D、G94A、 S119F、F120L、G127R、E175V、T212I、S257A、R262G、A266G、F280L、N297K、F305L、L319M、 E323K、A328T、D342E、A359T、K366N、E368D、L374M、S396T、V418S、K438N、H440R、T442I、 T442A、I449V、A469S、K500R、K505Q、G507S、S509N、F511Y 和 Ν53^(组成的组中的多个氨基酸替换之一。在另一个实施方案中,所述至少一个氨基酸替换是L70R替换。在另一个实施方案中,该变体包含选自由 G127R/F511Y、L70Q/G94A/R262G/F305L、F12S/T15A/E18G/N297K、 S396T/T442I、V10M/E323K、F120L/A266G、K438N/K500R、V79L/S509N、E175V/S257A/E368D/ A469S、T71P/L374M、F280L/H440R、E89D/H440R、V58F/A328T/N532K、S119F/D342E/I449V 和 K366N/G507S组成的组中的多个氨基酸替换之一。在另一方面,本发明提供了包含SEQ ID NO :120的氨基酸残基(图19)的多肽的
曰曰形。在另一方面,本发明提供了产生异戊二烯的方法,包括(a)提供包含表达载体的宿主细胞,所述的表达载体包含编码异戊二烯合酶变体的多核苷酸序列;和(b)在适合产生异戊二烯的条件下培养宿主细胞。在一个实施方案中,该方法还包括(c)回收异戊二烯。 在另一个实施方案中,该方法还包括(d)聚合异戊二烯。在另一方面,本发明提供了检测异戊二烯合酶活性的方法,包括(a)在适合产生异戊二烯合酶变体的条件下培养包含表达载体的宿主细胞;(b)用包含溶菌酶的裂解缓冲液裂解该宿主细胞以产生细胞裂解物;和(c)通过测量来自二甲基烯丙基二磷酸(DMAPP) 的异戊二烯产生来检测该细胞裂解物中的异戊二烯合酶活性。在一个实施方案中,宿主细胞选自由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。 在另一个实施方案中,宿主细胞选自由埃希氏菌属物种(大肠杆菌)、泛菌属物种(柠檬泛菌)、芽孢杆菌属物种(枯草芽孢杆菌)、耶氏酵母属物种(解脂耶氏酵母)和木霉属(里氏木霉)组成的组。在另一个实施方案中,宿主细胞在包含碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、糖蜜、蔗糖和油组成的组。在另一方面,本发明提供了宿主细胞,其包含与启动子有效连接的编码异戊二烯合酶变体的异源多核苷酸序列,其中该异戊二烯合酶变体在与杨异戊二烯合酶的一个或多个(1、2、3、4、5、6、7、8、9或10个)残基相对应的位置处包含替换。在一个实施方案中,该异戊二烯合酶是SEQ ID N0:120的银白杨异戊二烯合酶。在另一个实施方案中,该变体选自由 MEA 变体(SEQ ID NO :122)、MSV 变体(SEQ ID NO :124)、MVS 变体(SEQ ID NO :126)、MTE 变体(SEQ ID N0:U8)、MNV变体(SEQ ID NO :130)组成的组。在另一个实施方案中,该变体选自由 TRC(-3)变体(SEQ ID NO :136) ,TRC(-4)变体(SEQ ID NO :138) ,TRC(-5)变体(SEQ ID NO 140), TRC (-6)变体(SEQ ID NO :142)和 TRC(_7)变体(SEQ ID NO :144)组成的组。 在另一个实施方案中,该变体是美洲山杨异戊二烯合酶的MET变体(SEQ ID N0:146)。在另一个实施方案中,该变体是毛果杨异戊二烯合酶的MET变体(SEQ ID N0:148)。在另一个实施方案中,该变体包含选自由 V10M、F12S、T15A、E18G、V58I、V58F、L70Q、L70V、L70T、T71P、 V79L、E89D、G94A、Sl 19F、F120L、G127R、E175V、T212I、S257A、R262G、A266G、F280L、N297K、F305L、L319M、E323K、A328T、D342E、A359T、K366N、E368D、L374M、S396T、V418S、K438N、 H440R、T442I、T442A、I449V、A469S、K500R、K505Q、G507S、S509N、F511Y 和 Ν53^(组成的组中的多个氨基酸替换之一。在另一个实施方案中,所述至少一种氨基酸替换是L70R替换。在另一个实施方案中,该变体包含选自由 G127R/F511Y、L70Q/G94A/R262G/F305L、F12S/T15A/ E18G/N297K、S396T/T442I、V10M/E323K、F120L/A266G、K438N/K500R、V79L/S509N、E175V/ S257A/E368D/A469S、T71P/L374M、F280L/H440R、E89D/H440R、V58F/A328T/N532K、S119F/ D342E/I449V和K366N/G507S组成的组中的多个氨基酸替换之一。在另一个实施方案中,该多核苷酸序列含于质粒内。在另一个实施方案中,该多核苷酸序列整合到宿主细胞的染色体中。在另一个实施方案中,宿主选自由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。在另一个实施方案中,宿主选自由埃希氏菌属物种(大肠杆菌)、泛菌属物种(柠檬泛菌)、芽孢杆菌属物种(枯草芽孢杆菌)、耶氏酵母属物种(解脂耶氏酵母)和木霉属(里氏木霉)组成的组。在另一个实施方案中,宿主细胞在包括碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、 糖蜜、蔗糖和油组成的组。在另一个实施方案中,宿主细胞还包含编码IDI多肽的异源或天然核酸和/或编码DXS多肽的异源或天然核酸,其任选地与天然DXP途径组合。在另一个实施方案中,宿主细胞还包含编码IDI多肽和DXS多肽的一种或多种核酸。在另一个实施方案中,宿主细胞包含编码该异戊二烯合酶变体、该IDI多肽和该DXS多肽的一个载体。在另一个实施方案中,宿主细胞还包含编码MVA途径多肽的异源核酸,所述MVA途径多肽选自由 : 自酉良(Saccharomyces cerevisia)禾口$1(Enterococcus faecalis) ^ MVA 途径多肽组成的组。在另一个实施方案中,宿主细胞还包含编码MVA途径多肽和DXS多肽的一种或多种核酸,并且其中一个载体编码该异戊二烯合酶变体、该MVA途径多肽和该DXS 多肽。在另一个实施方案中,宿主细胞还包含编码DXS多肽、IDI多肽、或者其余DXP途径多肽中一种或多种多肽和MVA途径多肽的一种或多种核酸。在另一方面,本发明提供了产生异戊二烯的方法,包括(a)在用于产生异戊二烯的合适培养条件下培养宿主细胞,其包含与启动子有效连接的编码异戊二烯合酶变体的异源多核苷酸序列,其中该异戊二烯合酶变体在与杨异戊二烯合酶的一个或多个(1、2、3、4、 5、6、7、8、9或10个)残基相对应的位置处包含替换;和(b)产生异戊二烯。在一个实施方案中,该方法还包括(c)回收异戊二烯。在另一个实施方案中,该方法还包括(d)聚合异戊 -~ 火布ο在另一方面,本发明提供了产生异戊二烯合酶的方法,包括(a)提供(i)宿主细胞;和(ii)与启动子有效连接的编码异戊二烯合酶变体的核酸,其中异戊二烯合酶变体在与SEQ ID NO :120的银白杨异戊二烯合酶的一个或多个(1、2、3、4、5、6、7、8、9或10个)残基相对应的位置处包含替换;(b)使宿主细胞与该核酸接触以产生转化的宿主细胞;和(C) 在用于产生异戊二烯合酶的合适培养条件下培养转化的宿主细胞。附图简述图1提供了为大肠杆菌中表达而密码子优化的葛(葛麻姆(Pueraria montana)) 异戊二烯合酶的编码序列(SEQ ID NO :1)。图2提供葛异戊二烯合酶的氨基酸序列(SEQ ID NO 2)。图3提供了为大肠杆菌中表达而密码子优化的杨(银白杨χ欧洲山杨(Populusalba χ tremula))异戊二烯合酶的编码序列(SEQ ID NO :6)。图4提供杨(银白杨χ欧洲山杨)异戊二烯合酶的氨基酸序列(SEQ ID NO 7)。图5提供葛异戊二烯合酶同源性模型,同时半胱氨酸残基突出显示为空间填充分子。图6提供杨异戊二烯合酶同源性模型,同时半胱氨酸残基突出显示为空间填充分子(深灰色)。此外,来自图5葛模型的的半胱氨酸残基作为空间填充分子(浅灰色)叠加到杨模型。图7提供曲线图,其显示实施例5的葛IspS半胱氨酸突变体的生长曲线。图8显示来自裂解细胞的葛IspS半胱氨酸突变体的SDS-PAGE分析结果。通过离心制备沉淀物和上清液级分。图 9 提供质粒 MCM93 (pCR2. 1-Kudzu)的图。图10提供质粒MCM93的核苷酸序列(SEQ ID NO 22)。图 11 提供 pETMD-Kudzu 的图。图 12 提供 pET24D-Kudzu 的核苷酸序列(SEQ ID NO 23)。图13显示含葛异戊二烯合酶的包含体的SDS-PAGE分析结果。泳道M含有分子量标记,而其余泳道含有递增量的纯化包含体制备物。该葛异戊二烯合酶估计具有> 90%的纯度。图14提供曲线图,其显示就Y22、A20和S408位置而言葛位点评价文库(SEL)成员的异戊二烯合酶活性。大部分成员显示高度降低的活性,而保守性替换显示较少的活性降低。分图A显示与独立的野生型样品(划圈的WT)相比Y22文库成员的验定结果。分图 B显示与野生型样品(划圈的WT)相比A20文库成员的验定结果。分图C显示S408文库成员的验定结果,表明成员S408D具有比野生型对照的平均值高1. 5至2倍的活性。图15显示异戊二烯的MVA和DXP代谢途径(基于F. Bouvier等人,Progress in Lipid Res. 44 :357-4 ,2005)。以下描述包括所述途径中每种多肽的备选名称和公开了测量所述多肽活性的测定法的参考文献(这些参考文献的每一篇因而分别通过引用的方式完整并入,尤其是测定MVA和DXP途径中多肽的多肽活性的测定法)。甲羟戊酸途径 AACT ;乙酰-CoA 乙酰转移酶,MvaE, EC 2. 3. 1. 9,测定法 J. Bacteriol.,184 :2116-2122, 2002 ;HMGS ;羟甲基戊二酰-CoA 合酶,MvaS, EC 2. 3. 3. 10,测定法 J. Bacteriol.,184 4065-4070,2002 ;HMGR ;3-羟基-3-甲基戊二酰-CoA 还原酶,MvaE, EC 1. 1. 1. 34,测定法 J. Bacteriol.,184 :2116-2122,2002 ;MVK ;甲羟戊酸激酶,ERG12, EC 2. 7. 1. 36,测定法 Curr Genet 19 :9-14,1991 ;PMK ;磷酸甲羟戊酸激酶,ERG8, EC 2. 7. 4. 2,测定法:Mol Cell Biol. ,11 =620-631,1991 ;DPMDC ;二磷酸甲羟戊酸脱羧酶,MVD1, EC 4. 1. 1. 33,测定法 Biochemistry, 33 13355-13362,1994 ;IDI ;异戊烯二磷酸△-异构酶,IDI1, EC 5. 3. 3. 2, 测定法:J. Biol. Chem. 264 19169-19175,1989。DXP 途径=DXS ;1-脱氧木酮糖 ~5~ 磷酸合酶,dxs,EC 2. 2. 1. 7,测定法=PNAS, 94 12857-62,1997 ;DXR ; 1-脱氧-D-木酮糖 5-磷酸还原异构酶,dxr,EC 2. 2. 1. 7,测定法:Eur. J. Biochem. 269 :4446-4457,2002 ;MCT ;4-二磷酸胞苷-2C-甲基-D-赤藓糖醇合酶,IspD,EC 2. 7. 7. 60,测定法PNAS,97 :6451-6456,2000 ; CMK ;4- 二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶,IspE, EC 2. 7. 1. 148,测定法=PNAS, 97 1062-1067,2000 ;MCS ;2C-甲基-D-赤藓糖醇 2,4-环二磷酸合酶,IspF, EC 4. 6. 1. 12,测定法PNAS,96 :11758-11763,1999 ;HDS ;1-羟基-2-甲基 _2-(E)_ 丁烯基 4- 二磷酸合酶,ispG, EC 1. 17.4.3,测定法 J. Org. Chem. ,70 :9168-9174,2005 ;HDR; 1-羟基-2-甲基-2-(E)-丁烯基 4-二磷酸还原酶,IspH,EC 1. 17. 1. 2,测定法JACS,126 12847-12855, 2004。图16提供了 pDu27的图。图17提供pDu27中氨基端加6Xhis标记的银白杨IspS的氨基酸序列(SEQ ID NO 118)。图18提供质粒pDu27的核苷酸序列(SEQ ID NO :119)。图19提供pET2^中全长银白杨IspS的氨基酸序列(SEQ ID NO :120)。以下划线标出的残基表示质粒pDu39至pDu43中IspS内氨基端截短的位置。图20提供银白杨质粒pDu27的核苷酸序列(SEQ ID NO :121)。图21显示纯化的IspS通过SDS-PAGE分析而显示一个较低分子量“双联体”。图22显示通过质谱法鉴定的胰蛋白酶肽。图23提供携带银白杨IspS氨基端截短的pDu40、pDu41、pDu42和pDu43的图。图M提供(菌株MD09-173中)作为未加标签的pETMa-银白杨MEA的Pdu39的25提供pDu39中银白杨IspS的截短“MEA”变体的氨基酸序列(SEQ ID NO 122)。图26提供质粒pDu39的核苷酸序列(SEQ ID NO :123)。图27提供pDu41中银白杨IspS的截短“MSV”变体的氨基酸序列(SEQ ID NO 124)。图28提供质粒pDu41 (未加标签的pETMa-银白杨(MSV))的核苷酸序列(SEQ ID NO 125)。图四提供pDu43中银白杨IspS的截短“MVS”变体的氨基酸序列(SEQ ID NO 126)。图30提供质粒pDu43 (未加标签的pETMa-银白杨(MVS))的核苷酸序列(SEQ ID NO 127)。图31提供pDu42中银白杨IspS的截短“MTE”变体的氨基酸序列(SEQ ID NO 128)。图32提供质粒pDu42 (未加标签的pETMa-银白杨(MTE))的核苷酸序列(SEQ ID NO 129)。图33提供pDu40中银白杨IspS的截短“MNV”的氨基酸序列(SEQ IDNO :130)。图34提供质粒pDu40 (未加标签的pETMa-银白杨(MNV))的核苷酸序列(SEQ ID NO 131)。图35提供羧基端加TEV、6XHis标记的IspS变体MD09-161和MD09-163的图。图36提供MD09-163中银白杨MEA (+) TEV的氨基酸序列(SEQ ID NO :132)。图 37 提供质粒 MD09-163(pET24a-MEA(+)TEV)的核苷酸序列(SEQ ID NO :133)。 CDS以下划线标出,TEV蛋白酶位点是粗体字。图38提供MD09-161中银白杨FL(+) TEV的氨基酸序列(SEQ IDNO :134)。
图 39 提供质粒 MD09-161(pET24a-FL(+)TEV)的核苷酸序列(SEQ ID NO 135) CDS以下划线标出,TEV蛋白酶位点是粗体字。图40显示了代表MD09-167、全长(FL)、MD09-165和截短异戊二烯合酶 (MD09-173)的比活性的曲线图。反应在30°C于下述溶液中进行15分钟,所述溶液含有 IOOmM TrisUOOmM NaCl、50mM MgCl2、5mM DMAPP 禾Π 2. 5-4. 5 μ g 在完整细胞裂解物的上清液中的异戊二烯合酶。图41显示了展示速率/[E]对[DMAPP]的曲线图。X代表MD09-173,圆圈代表 MD09-167,菱形代表MD09-165并且正方形代表全长IspS。图42显示了展示异戊二烯合酶活性对[DMAPP]的曲线图。X,s代表用MD09-173 截短的异戊二烯合酶产生的数据。圆圈代表用MD09-167异戊二烯合酶产生的数据。菱形代表用MD09-165异戊二烯合酶产生的数据。正方形代表用全长异戊二烯合酶产生的数据。 每个数据组一式三份来自独立培育的培养物。图43显示了展示不同的k-和Ks^PKi对反应速率影响的曲线图。在分图A中,曲线1代表在不同的DMAPP浓度下作图的截短的异戊二烯合酶活性的速率等式除以全长异戊二烯合酶速率等式。曲线2代表全长异戊二烯合酶的速率等式(其中k。at已经被截短异戊二烯合酶k。at取代)除以全长异戊二烯合酶速率等式。曲线3代表全长异戊二烯合酶的速率等式(其中Km已经被截短异戊二烯合酶Km取代)除以全长异戊二烯合酶速率等式。曲线4代表全长异戊二烯合酶的速率等式(其中Ki已经被截短异戊二烯合酶Ki取代)除以全长异戊二烯合酶速率等式。分图B显示一个曲线图,其展示截短异戊二烯合酶的速率等式与全长异戊二烯合酶之比相对于[DMAPP]的数据拟合。图44显示一个曲线图,其展示MCM531因甲羟戊酸(MVA)所致的生长抑制。细胞在微量滴定平板中于TM3培养基中伴以不同浓度的MVA下培育。在所示的时间测量一式四份孔的OD6tltl。图45显示了展示L70SSL平板的DMAPP测定法的曲线图。深色条形代表全长(银白杨pET24a)或pDU39(截短)对照。选择C3 Q7)、D3 (39)或E3(51)孔中的变体用于进一步分析。 图46显示一个曲线图,其展示为用蛋白质测定为DMAPP测定法所选择的全部变体的平均比活性。误差线表示一个标准差。全部3个L70R变体显示高于对照(WT)的活性。图47显示一个曲线图,其展示全部3个L70R变体与“MEA”截短的银白杨IspS酶相比的平均比活性。误差线表示一个标准差。图 48 提供质粒 pDu47-3、pDu47_4 和 pDu47_5 的图。图 49 提供质粒 pDu47-6、pDu47_7 和 pDu48 的图。图 50 提供质粒 pDu49、pDu50 和 pDu50_4 的图。图51提供pDu47-3中银白杨TRC (_3)的氨基酸序列(SEQ ID NO :136)。图52提供质粒pDu47-3的核苷酸序列(SEQ ID NO :137)。图53提供pDu47-4中银白杨TRC (_4)的氨基酸序列(SEQ ID NO :138)。图M提供质粒pDu47_4的核苷酸序列(SEQ ID NO :139)。图55提供pDu47-5中银白杨TRC (_5)的氨基酸序列(SEQ ID NO :140)。图56提供质粒pDu47-5的核苷酸序列(SEQ ID NO :141)。
图57提供pDu47-6中银白杨TRC (_6)的氨基酸序列(SEQ ID NO :142)。图58提供质粒pDu47-6的核苷酸序列(SEQ ID NO :143)。图59提供pDu47-7中银白杨TRC (_7)的氨基酸序列(SEQ ID NO :144)。图60提供质粒pDu47-7的核苷酸序列(SEQ ID NO :145)。图61提供pDu48中美洲山杨TRC(MET)的氨基酸序列(SEQ IDNO :146)。图62提供质粒pDu48的核苷酸序列(SEQ ID NO :147)。图63提供pDu49中毛果杨(TRC)的氨基酸序列(SEQ ID NO :148)。图64提供质粒pDu49的核苷酸序列(SEQ ID NO :149)。图 65 提供 pDu50 中葛 TRC (MEA)的氨基酸序列(SEQ ID NO :150)。图66提供质粒pDu50的核苷酸序列(SEQ ID NO :151)。图67 提供 pDu50-4 中葛 TRC (_4)的氨基酸序列(SEQ ID NO :152)。图68提供质粒pDu50_4的核苷酸序列(SEQ ID NO :153)。图69显示一个曲线图,其展示来自IspS截短变体的DMAPP测定法的原始数据和 OD归一化数据。图70显示了代表IspS截短体比活性的曲线图。相对于银白杨“全长”变体,比较了银白杨、美洲山杨和毛果杨截短体的比活性。图71提供质粒p9795的图。图72提供质粒p9795的核苷酸序列(SEQ ID NO :154)。图73提供质粒PiTrcKudzu的图。图74提供质粒PiTrcKudzu的核苷酸序列(SEQ ID NO :155)。图75提供质粒pMAL-C4X的图。图76提供质粒pMAL-C4X的核苷酸序列(SEQ ID NO :156)。图 77 提供质粒 pMAL-C4X_Kudzu 的图。图 78 提供质粒 pMAL-C4X-Kudzu 的核苷酸序列(SEQ ID NO :157)。图79提供质粒PET24、美洲山杨pET2^和毛果杨pET2^的图。图80提供毛果杨pET24a中美洲山杨IspS的氨基酸序列(SEQ ID NO :158)。图81提供质粒美洲山杨pET24a的核苷酸序列(SEQ ID NO :159)。图82提供毛果杨pET2^中毛果杨IspS的氨基酸序列(SEQ ID NO :160)。图83提供质粒毛果杨pET2^的核苷酸序列(SEQ ID NO :161)。图 84 提供质粒 pDu30、pDu31 和 pDu32 的图。图85提供pDu30中IspS变体银白杨TRC_pET200的氨基酸序列(SEQID NO :162)。图86提供pDu30的核苷酸序列(SEQ ID NO 163)。图87提供pDu31中IspS变体美洲山杨TRC_pET200的氨基酸序列(SEQ ID NO 164)。图88提供pDu31的核苷酸序列(SEQ ID NO :165)。图89提供pDu32中IspS变体毛果杨TRC-pET200的氨基酸序列(SEQ ID NO :166)。图90提供pDu32的核苷酸序列(SEQ ID NO 167)。图91提供显示为二聚体的美洲山杨IspS的三维结构。链A为深灰色,链B为中等灰色并且每个活性中心内的单个镁离子为浅灰色。
图92提供美洲山杨IspS结构的单体视图。镁显示为浅灰色球体并且标出氨基末端和羧基末端。图 93 显示(A)BdpS 与 LS、(B)BdpS 与杨 IspS, (C)LS 与杨 IspS 以及(D) TEAS 与杨 IspS之间的结构比对。在每种情况下,第一个结构为浅灰色并且第二个结构为深灰色。二价镁离子显示为球体。图94显示BdpS和LS中的环的三维结构。分图A显示浅灰色的Ls的氨基端环和深灰色的BdpS的氨基端环。分图B显示环I和环II是结构上同源的。图95显示BdpS(深灰色)和杨IspS(浅灰色)的氨基端环是结构上趋异的。分图A显示氨基端环并且分图B显示环I和环II。图96显示LS(浅灰色)和杨IspS(深灰色)的氨基端环是结构上趋异的。分图 A显示氨基端环并且分图B显示环I和环II。图97显示TEAS(浅灰色)和杨IspS(深灰色)的氨基端环是结构上趋异的。分图A显示氨基端环并且分图B显示环I和环II。环I在TEAS中扭曲。发明的一般性描述本发明提供了方法和包含催化活性和/或溶解度改进的至少一种异戊二烯合酶的组合物。具体地,本发明提供了用于增加微生物宿主细胞中异戊二烯产生的植物变异异戊二烯合酶。生物合成产生的本发明异戊二烯用于橡胶和高弹体的制造中。除非另外说明,本发明的实施涉及分子生物学、微生物学和重组DNA中常用的常规技术,它们处在本领域技术人员能力范围内。此类技术是本领域技术人员已知的并且在众多教材和参考书中描述(见例如,Sambrook等人,“Molecular Cloning :A Laboratory Manual,"2 版,Cold Spring Harbor,1989 ;禾口 Ausubel 等人,"Current Protocols in Molecular Biology,” 1987)。除非本文另外定义,本文中所用的全部术语及科学术语具有与本发明所属领域的技术人员通常理解的相同意义。例如,Singleton等人,DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY,2 版,John Wiley and Sons, New York (1994);和 Hale 与Markham,THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY(1991)向本领域技术人员提供了具有本发明中所用众多术语的通用字典。尽管与本文中所述那些方法和材料相似或相等的任意方法和材料用于本发明的实施中,然而本文中描述了优选的方法和材料。因而,通过整体地参考本说明书更充分地描述了下文马上定义的术语。此外,本文中提供的标题不限制本发明的多个方面或实施方案,可以通过整体地参考本说明书得出所述标题。因此,通过整体地参考本说明书更完整地描述下文立即定义的术语。然而,为了促进理解本发明,下文定义了众多术语。定义除非本文另外定义,本文中所用的全部技术及科学术语具有与本发明所属领域的技术人员通常理解的相同意义。尽管与本文中所述那些方法和材料相似或等同的任意方法和材料可用于本发明的实施中,然而本文中描述了优选的方法和材料。因而,通过整体地参考本说明书更充分地描述了下文马上定义的术语。除非本文另外定义,本文中所用的单数形式包括复数指代。除非另外指出,核酸以 5’到3’方向书写;氨基酸序列以氨基到羧基方向书写。可以理解本发明不限于描述的具体的方法学、方案和试剂,因为这些取决于本领域技术人员使用它们的背景而可以改变。意图是,在本说明书通篇范围内给出的每个最大数字界限包括每个较小的数字界限,如同在本文中清楚地写出此类较小的数字界限。在本说明书通篇范围内给出的每个最小数字界限将包括每个较高的数字界限,如同在本文中明确地写出此类较高的数字界限。 在本说明书通篇范围内给出的每个数字范围将包括落入这种较宽泛数字范围内的每个较窄的数字界限,如同在本文中明确地写出此类较窄的数字界限。本说明书中提到的全部文件通过引用的方式并入有关部分中。然而,对任一文件的引用不得解释为承认该文件是本发明的现有技术。如本文中所用,术语2-甲基-1,3-丁二烯(CAS# 78-79-5)( “异戊二烯”)指从 3,3-二甲基烯丙基焦磷酸(DMAPP)消去焦磷酸所致的直接和最终挥发性C5烃产物并且不涉及将[一个]IPP分子连接或聚合至[一个]DMAPP分子。如本文中所用,术语“异戊二烯合酶”和“IspS”指催化焦磷酸从二甲基烯丙基二磷酸(DMAPP)消去以形成异戊二烯的酶。 在一些优选的实施方案中,IspS是从植物如葛、杨或红栎获得的酶。在一些实施方案中,术语“ IspS"指天然存在的成熟酶或其部分。相关(和衍生物)蛋白质包含“变体蛋白”。在一些优选的实施方案中,变体蛋白因少数氨基酸残基而不同于亲本蛋白(例如,描述为SEQ ID NO :2的葛IspS或杨IspS)并且彼此不同。不同氨基酸残基的数目可以是一个或多个,优选地1、2、3、4、5、10、15、20、30、 40、50个或更多个氨基酸残基。在一些优选的实施方案中,变体之间不同氨基酸的数目在1 到10之间。在一些特别优选的实施方案中,相关蛋白并且特别地变体蛋白包含至少35%、 40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98% 或 99% 氨基酸序列同一性。额外地,如本文中所用的相关蛋白或变体蛋白指在突出区域的数目上不同于另一种相关蛋白或亲本蛋白的蛋白质。例如,在一些实施方案中,变体蛋白具有1、2、3、 4、5或10个不同于亲本蛋白的相应突出区域。适合产生本发明酶的变体的几种方法是本领域已知的,包括但不限于位点饱和诱变、扫描诱变、插入诱变、随机诱变、位点定向诱变和定向进化以及多种其他重组方法。对野生型和突变蛋白的表征通过任何手段或合适“试验”实现并且优选地基于对目的特性的评估。例如,在本发明的一些实施方案中评估了一个或多个以下特性pH稳定性;温度稳定性;氧化稳定性;蛋白水解的稳定性;溶解度;DMAPP在体外转变成异戊二烯的Km和/或比活性;DMAPP在体内在宿主生物(例如,大肠杆菌)的环境下转变成异戊二烯的Km和/或比活性;和DXP途径和/或MVA途径酶的表达。实际上,构思了在一种或多种试验条件下具有各种程度的稳定性、溶解度、活性和/或表达水平的酶将用于本发明中。如本文中所用,术语“基因”指多核苷酸(例如,DNA区段),其编码多肽并包括编码区之前和之后的区域,以及各个编码区段(外显子)之间的间插序列(内含子)。如本文中所用,“同源基因”指来自不同但通常相关的物种中的一对基因,它们相互对应并且是彼此相同或极相似的。该术语包括因物种形成(即,新物种的发展)而隔离的基因(例如,直向同源基因)以及因遗传重复而隔离的基因(例如,旁系同源基因)。如本文中所用,“直向同源物”和“直向同源基因”指不同物种中因物种形成而已经从共同先祖基因(即同源基因)进化而来的基因。一般而言,直向同源物在进化期间仍保留相同的功能。直向同源物的鉴定用于可靠地预测新测序基因组中的基因功能。
如本文中所用,“旁系同源物”和“旁系同源基因”指由于基因组内部重复而相关的基因。尽管直向同源物在进化期间自始至终保留相同的功能,然而旁系同源物演化出新功能,尽管一些功能经常与原始功能相关。如本文中所用,“同源性”指序列相似性或同一性,优选同一性。这种同源性使用本领域已知的标准技术(见例如,Smith 和 Waterman,Adv. Adv Appl Math, 2 :482,1981 ; Needleman 禾口 Wunsch, J Mol Biol,48 :443,1970 ;Pearson 禾口 Lipman, Proc Natl Acad Sci USA,85 :2444,1988 ;程序如威斯康辛遗传学软件包(Wisconsin Genetics Software Package) Genetics Computer Group,Madison, WI 中的 GAP、BESTFIT、FASTA 和 TFASTA 以及 Devereux 等人,Nucl Acid Res, 12 :387-395,1984)确定。如本文中所用,“类似序列”是这样一种序列,其中基因的功能与基于葛异戊二烯合酶(IspS)或杨IspSdspS)的该基因基本上相同。额外地,类似基因包括与葛异戊二烯合酶序列有至少 45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、 99%或100%序列同一性。在额外的实施方案中,多于一种上文的特性适用于该序列。类似序列由已知的序列比对方法确定。通常使用的比对方法是BLAST,不过如上文及下文所示, 存在也用于比对序列的其他方法。有用算法的一个实例是PILEUP。使用累进配对比对,PILEUP从一组相关序列产生多重序列比对结果。它也可以绘制树,其中所述树显示用来产生该比对结果的聚类关系。PILEUP 使用 Feng 和 Doolittle 累进比对方法(Feng 和 Doolittle,J Mol Evol, 35 351-360,1987)的简化形式。该方法类似于Higgins和Siarp描述的方法(Higgins和 Sharp, CABIOS 5 :151-153,1989)。有用的PILEUP参数包括默认空位权重3. 00、默认空位长度权重0. 10和加权末端空位。有用算法的另一个例子是Altschul等人(Altschul等人,J Mol Biol,215 403-410,1990 和 Karlin 等人,Proc Natl Acad Sci USA,90 :5873_5787,1993)描述的 BLAST算法。一个特别有用的BLAST程序是WU-BLAST-2程序(见,Altschul等人,Meth Enzymol, 266 =460-480,1996)。WU-BLAST-2使用几个搜索参数,它们大部分设置为默认值。 设置具有以下值的可调整参数重叠覆盖区=1,重叠分数=0. 125,字阈值(T) = 11。HSP S和HSP S2参数是动态值并且由程序自身根据特定序列的组成和特定数据库的组成建立, 其中针对所述的特定数据库检索目的序列。然而,可以调整所述值以提高灵敏度。通过匹配性相同残基数除以所比对区域中“较长”序列的总残基数来确定%氨基酸序列同一性值。 “较长”序列是比对区域中具有最多实际残基的序列(忽略由WU-Blast-2导入以最大化比对评分的空位)。因而,“核酸序列同一性百分数(%)”定义为候选序列中与起始序列(即目的序列)的核苷酸残基相同的核苷酸残基百分数。优选的方法使用设置成默认参数的 WU-BLAST-2的BLASTN模块,重叠覆盖区和重叠分数分别设置成1和0. 125。如本文中所用,术语“杂交”指核酸的一条链通过如本领域已知的碱基配对作用与互补链结合的过程。若一个核酸序列和一个参比核酸序列在高严格性杂交和洗涤条件下彼此特异性杂交,则这两个核酸序列被视为“选择性杂交”。杂交条件基于核酸结合复合体或探针的解链温度(Tm)。例如,“最大严格性” 一般在约Tm-5°C (该探针Tm以下5°C )出现;“高严格性”在该Tm以下约5-10°C出现;“中等严格性”在该探针Tm以下约10_20°C出现并且“低严格性”在该Tm以下约20-25°C出现。功能上,最大严格性条件可以用来鉴定与杂交探针具有严格同一性或近乎严格同一性的序列;而中等或低严格性杂交可以用来鉴定或检测多核苷酸序列同源物。中等和高严格性杂交条件是本领域熟知的。高严格性条件的实例包括在约42°C 于 50% 甲酰胺,5 X SSC,5 XDenhardt' s 溶液,0.5% SDS 和 100 μ g/ml 变性载体 DNA 中杂交,随后在室温于2X SSC^PO. 5% SDS中洗涤2次并且在42°C于0. IX SSC^PO. 5% SDS中额外洗涤2次。中等严格条件的实例包括在37°C于包含20%甲酰胺、5XSSC(150mM NaCl, 15mM柠檬酸三钠)、50mM磷酸钠(pH 7. 6) ,5 XDenhardt' s溶液、10%硫酸葡聚糖和20mg/ ml变性剪切鲑精DNA的溶液中孵育过夜,随后在约37-50°C于1 X SSC中洗涤滤膜。本领域技术人员知道如何按照需要调整温度、离子强度等以适应诸如探针长度等因素。如本文中所用,“重组体”包括对细胞或载体的指代,其中所述的细胞或载体已经因异源核酸序列导入而修饰或该细胞从如此修饰的细胞衍生。因而,例如重组细胞表达在该细胞的天然(非重组)形式中不以相同形式存在的基因或表达否则因故意人为干预而异常表达、不足表达或根本不表达的天然基因。“重组”、和生成“重组”核酸一般是两个或多个核酸片段的装配,其中所述装配产生嵌合基因。在优选的实施方案中,在至少一个密码子中用位点饱和诱变法产生突变DNA序列。在另一个优选的实施方案中,对2个或多个密码子进行位点饱和诱变。在又一个实施方案中,突变DNA序列与野生型序列具有大于50 %、大于55 %、大于60 %、大于65 %、大于 70%、大于75%、大于80%、大于85%、大于90%、大于95%或大于98%同源性。在备选实施方案中,使用任何已知的诱变方法如例如辐射法、亚硝基胍等在体内产生突变DNA。想要的DNA序列随后分离并且用于本文所提供的方法中。如本文中所用,术语“靶序列”指宿主细胞中编码下述序列的DNA序列,其中希望将该进入序列插入宿主细胞基因组中。在一些实施方案中,靶序列编码有功能的野生型基因或操纵子,而在其他实施方案中,靶序列编码有功能的突变基因或操纵子,或无功能的基因或操纵子。如本文中所用,“侧翼序列”指位于所讨论序列的上游或下游的任意序列(例如,对于基因A-B-C,基因B侧翼为A和C基因序列)。在优选的实施方案中,该进入序列在每一侧具有同源盒。在另一个实施方案中,该进入序列和同源盒包含在每一侧具有填充序列的单元。在一些实施方案中,侧翼序列仅存在于单侧(3'或5'侧),但是在优选的实施方案中,它存在于被侧翼包围的序列的每一侧。在一些实施方案中,侧翼序列仅存在于单侧(3 ‘ 或5'侧),而在优选的实施方案中,它存在于被侧翼包围的序列的每一侧。如本文中所用,术语“填充序列”指存在于同源盒侧翼的任意额外DNA(—般是载体序列)。然而,该术语包括任意非同源的DNA序列。不受任何理论限制,填充序列为细胞提供不重要的靶标用于启动DNA摄取。如本文中所用,术语“扩增”和“基因扩增”指一个过程,其中特定DNA序列借助该过程不成比例地复制,从而扩增的基因以高于基因组中最初存在的拷贝数存在。在一些实施方案中,通过药物(例如可可抑制酶的抑制物)存在下的生长而选择细胞,这导致编码在该药物存在下生长所需的基因产物的内源基因扩增,或通过扩增编码这种基因产物的外源(即,输入)序列或这两种方式选择细胞。“扩增”是涉及模板专一性的核酸复制的特定情况。它应与非特定模板复制(即具有模板依赖性但不依赖于特定模板的复制)形成对比。模板专一性这里与复制忠实性(即合成正确的多核苷酸序列)和核苷酸(核糖或脱氧核糖)特异性相区别。模板专一性经常按照“靶”特异性而描述。靶序列在如此意义上是“靶”,在该意义上试图将它们与其他核酸分选出来。已经设计主要用于这种分选过程的扩增技术。如本文中所用,术语“共扩增”指将可扩增的标记连同其他基因序列(即包含一个或多个不可选择的基因,如表达载体内包含的那些基因)导入单个细胞并且施加适宜的选择压力,从而该细胞扩增这个可扩增的标记和其余不可选择的基因序列。可扩增的标记可以与其余基因序列物理上连接,或备选地,可以将两个分开的DNA片段(一个片段含有可扩增的标记并且另一个片段含有不可选择的标记)导入相同细胞。如本文中所用,术语“可扩增的标记”、“可扩增的基因”和“扩增载体”指允许该基因在适宜生长条件下扩增的基因或编码该基因的载体。在大多数扩增技术中通过选择酶来实现“模板专一性”。扩增酶是在使用这些酶的条件下仅会加工核酸的不均一混合物中特定核酸序列的酶。例如在复制酶的情况下, MDV-I RNA是该复制酶的专一模板(见例如Kacian等人,Proc Natl Acad Sci USA 69 3038,1972)并且其他核酸不被这种扩增酶复制。类似地,在T7RNA聚合酶的情况下,这种扩增酶具有对其自身启动子的严格专一性(见Chamberlin等人,Nature 228 :227 (1970))。在 T4DNA连接酶的情况下,该酶不会连接两个寡核苷酸或多核苷酸,其中该寡核苷酸或多核苷酸底物与模板之间在连接接头处存在错配(见mi和Wallace,Genomics 4 :560,1989)。最后,因Taq和Pfu聚合酶在高温下发挥作用的能力,发现这两种酶针对被引物结合并且因而限定的序列表现出高度专一性;所述高温产生了热动力学条件,其有利于引物与靶序列杂交并且不与非靶序列杂交。如本文中所用,术语“可扩增的核酸”指可以通过任意扩增方法扩增的核酸。构思了 “可扩增的核酸”通常会包含“样品模板”。如本文中所用,术语“样品模板”指源自某样品的核酸,其中对所述样品分析(下文定义的)“靶”的存在。相反,“背景模板”用来指并非样品模板的核酸,它可能存在或可能不存在于样品中。背景模板最经常是偶然存在的。它可能是携带污染的结果,或它可能归因于存在试图从该样品中纯化出去的核酸杂质。例如,源自除待检测生物之外生物的核酸可以作为背景存在于试样中。如本文中所用,术语“引物”指寡核苷酸,无论天然存在(如存在于纯化的限制性消化产物中)或合成产生,其中当置于诱导与一条核酸链互补的引物延伸产物合成的条件下(即存在核苷酸和诱导物质(如DNA聚合酶)并在适宜的温度和pH下)时,所述寡核苷酸能够充当合成的起始点。引物优选地是单链的,旨在扩增中效率最大,不过备选地可以是双链的。如果是双链的,则首先处理该引物以使其链在使用前分开以制备延伸产物。优选地,引物是寡脱氧核糖核苷酸。引物必须足够地长以在诱导物质存在下引发延伸产物的合成。引物的确切长度将取决于众多因素,包括温度、引物来源和方法的使用。如本文中所用,术语“探针”指能够与另一种目的寡核苷酸杂交的寡核苷酸(即核苷酸序列),无论是天然存在的(如存在于纯化的限制性消化产物中)或合成地、重组地或通过PCR扩增产生的。探针可以是单链的或双链的。探针可用于检测、鉴定和分离特定的基因序列。构思的是,本发明中所用的任意探针将用任何“报道分子”标记,从而是可在任意检测系统中检测到的,所述的检测系统包括,但不限于酶系统(例如ELISA以及基于酶的组织化学测定法)、荧光系统、放射性系统和化学发光系统。不意图使本发明限于任何特定的检测系统或标记物。如本文中所用,在关于聚合酶链反应使用时,术语“靶”指被用于聚合酶链反应的引物结合的核酸区域。因而,试图将“靶”与其他核酸序列分选出来。“区段”定义为该靶序列内部的核酸区域。如本文中所用,在一个实施方案中,术语“聚合酶链反应”(“PCR”)指通过引用方式并入的美国专利号4,683,195,4, 683,202和4,965,188的方法,所述方法包括用于提高基因组DNA混合物中靶序列区段的浓度而不进行克隆或纯化的方法。用于扩增靶序列的这种方法由以下组成导入大量过量的两种寡核苷酸引物至含有预期靶序列的DNA混合物, 随后是在DNA聚合酶存在下的一系列精确热循环。两条引物互补于双链靶序列的各自链。 为实现扩增,将混合物变性并且所述引物随后与靶分子内它们的互补序列复性。复性后,引物用聚合酶延伸,从而形成新的一对互补链。变性、引物复性和聚合酶延伸的步骤可以重复许多次(即,变性、复性和延伸构成一个“循环”;可以存在众多“循环”)以获得所需靶序列的高浓度扩增区段。所需靶序列的扩增区段的长度由引物彼此的相对位置决定,并且因而,这个长度是可控参数。由于该过程的重复方面,将该方法称作“聚合酶链反应”(下文 “PCR”)。因为靶序列的所需扩增区段在该混合物中变成优势序列(就浓度而言),所以称它们被“PCR扩增”。如本文中所用,术语“扩增试剂”指除引物、核酸模板和扩增酶之外的为扩增所需的那些试剂(脱氧核糖核苷酸三磷酸、缓冲液等)。一般而言,将扩增试剂连同其他反应组分放置并纳入反应容器(试管、微孔等)中。采用PCR,可以扩增基因组DNA中特定靶序列的单拷贝至几种不同方法学(例如, 与标记的探针杂交;掺入生物素化引物,随后是抗生物素蛋白-酶缀合物检测;将32P-标记的脱氧核苷酸三磷酸如dCTP或dATP掺入扩增的区段)可检测的水平。除基因组DNA之外, 任意的寡核苷酸或多核苷酸序列还可以用适宜的成套引物分子扩增。特别地,由PCR方法自身产生的扩增区段本身是后续PCR扩增的有效模板。如本文中所用,术语“PCR产物”、“PCR片段”和“扩增产物”指两轮或多轮变性、复性和延伸PCR步骤结束后所得的化合物混合物。这些术语包括其中已经扩增一个或多个靶序列的一个或多个区段的情况。如本文中所用,术语“RT-PCR”指RNA序列的复制和扩增。在这个方法中,逆转录偶联于PCR,最经常地使用其中使用热稳定性聚合酶的单一酶方法,如通过引用方式并入本文的美国专利号5,322,770中所述。在RT-PCR,RNA模板因该聚合酶的逆转录酶活性转化成cDNA,并随后使用该聚合酶的聚合活性(即,如其他PCR方法中那样)扩增。如本文中所用,术语“限制性核酸内切酶”和“限制酶”指细菌酶,其各自在特定核苷酸序列处或其附近切割双链DNA。“限制性位点”指被给定限制性核酸内切酶识别和切割并往往作为DNA片段插入位点的核苷酸序列。在本发明的某些实施方案中,将限制性位点工程化到DNA构建体的选择标记中和5'和3'末端中。如本文中所用,术语“染色体整合”指进入序列借以导入宿主细胞染色体的过程。 转化性DNA的同源区与染色体的同源区域对齐。随后,同源盒之间的序列在双交换(即,同源重组)中被进入序列替换。在本发明的一些实施方案,DNA构建体的失活性染色体区段的同源部分与埃希氏菌属染色体的固有染色体区域的侧翼同源区对齐。随后,该固有染色体区域由该DNA构建体在双交换(即,同源重组)中缺失。“同源重组”意指在两个DNA分子或配对染色体之间在相同或几乎相同的核苷酸序列位点处DNA片段的交换。在优选的实施方案中,染色体整合是同源重组。如本文中所用, “同源序列”意指在最佳对比用于比较时,与另一个核酸或多肽序列具有100<%、99%、98%、 97%,96%,95%,94%,93%,92%,91%,90%,88%,85%,80%,75%^; 70%序列同一性的核酸或多肽序列。在一些实施方案中,同源序列具有85%到100%之间的序列同一性,而在其他实施方案中,存在90%与100%之间的序列同一性,并且在更优选的实施方案中,存在 95%与100%之间的序列同一性。如本文中所用,“氨基酸”指肽或蛋白质序列或其部分。术语“蛋白质”、“肽”和“多肽”可互换地使用。如本文中所用,术语“异源蛋白,,指不天然存在于宿主细胞中的蛋白质或多肽。异源蛋白的实例包括酶,如异戊二烯合酶。在一些实施方案中,编码所述蛋白质的基因是天然存在的基因,而在其他实施方案中,使用突变基因和/或合成的基因。如本文中所用,“同源蛋白,,指细胞中固有或天然存在的蛋白质或多肽。在优选的实施方案中,所述细胞是革兰氏阴性细胞,而在特别优选的实施方案中,该细胞是埃希氏菌属宿主细胞。如果一种酶在宿主细胞中以高于它在相应野生型细胞中表达的水平表达,则该酶 “过量表达”于此细胞中。术语“蛋白质”和“多肽”在本文中互换地使用。在本公开通篇范围内使用如按照 UPAC-IUB生物化学命名联合委员会(JCBN)所定义的氨基酸3字母代码。也可以理解由于遗传密码子的简并性,多肽可以由多于一种核苷酸序列编码。术语蛋白质或肽的“成熟”形式指该蛋白质或肽的最终功能形式。例如,葛异戊二烯合酶的成熟形式包括SEQ ID NO :2的氨基酸序列。术语“前体”形式的蛋白质或肽指蛋白质的成熟形式,其具有与该蛋白质氨基端或羧基端有效连接的前序列。该前体也可以具有与该前序列的氨基端有效连接的“信号”序列。该前体也可以具有参与翻译后活性的额外多核苷酸(例如从中切除以形成蛋白质或肽的成熟形式的多核苷酸)。“天然存在酶”指一种酶,其具有与自然界中存在的氨基酸序列相同的未修饰的氨基酸序列。天然存在酶包括天然酶,即特定微生物中天然表达或发现的那些酶。 在两个核酸序列或多肽序列的环境中,术语“相同的”指这两个序列中为最大对应性进行比对时相同的残基,如使用以下序列比较或分析算法之一测量。术语“最佳比对”指产生最高同一性百分数评分的比对。“序列同一性百分数”、“氨基酸序列同一性百分数”、“基因序列同一性百分数”和 /或“核酸/多核苷酸序列同一性百分数”就两个氨基酸序列、多核苷酸序列和/或基因序列(根据需要)而言,指在最佳比对两个序列时这两个序列中相同的残基的百分数。因而, 80 %氨基酸序列同一性意指这两个最佳比对的多肽序列中80 %氨基酸是相同的。在两个核酸或多肽的环境下,短语“基本上相同的”因而指下述多核苷酸或多肽, 其中使用程序或算法(例如BLAST、ALIGN、CLUSTAL),使用标准参数,与参考序列相比时, 所述多核苷酸或多肽包含至少70%序列同一性、优选至少75%、优选至少80%、优选至少 85 %、优选至少90 %、优选至少95 %、优选至少97 %、优选至少98 %并且优选至少99 %序列同一性。两个多肽基本上相同的一个指标是第一多肽与第二多肽具有免疫学交叉反应。一般而言,因保守氨基酸替换而不同的多肽是免疫学交叉反应的。因而,例如,一个多肽与第二多肽基本上相同,其中这两个肽仅因保守性替换而不同。两个核酸序列基本上相同的另一个指标是这两个分子在严格条件(例如,中等至高严格性范围内)下相互杂交。术语“分离的”或“纯化的”指从其原始环境(例如天然环境,若它是天然存在的) 中移出的物质。例如,该物质在特定组合物中以高于或低于天然存在生物或野生型生物 (例如,葛)中的浓度存在或与从天然存在生物或野生型生物表达时通常不存在的组分组合存在时,称该物质是“纯化”的。例如,活动物中存在的天然存在的多核苷酸或多肽不是分离的,然而与该天然系统中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。 此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,并且仍是分离的,因为这种载体或组合物不是其天然环境的一部分。例如在优选的实施方案中,如果核酸或蛋白质在电泳凝胶或印迹中产生基本上一条带,则称该核酸或蛋白质是纯化的。关于DNA序列使用时,术语“分离的”指一种DNA序列,它已经从其天然遗传环境中被移出并且因而不含有其他外部或不想要的编码序列,并且处在适合用于基因工程蛋白质产生系统中的形式。关于重组DNA序列使用时,术语“分离的”指一种DNA序列,它已经从宿主生物的天然遗传环境中被移出并且因而不含有其他外部或不想要的编码序列(例如, 大肠杆菌中增殖的葛IspS表达载体)。此类分离的分子是与其天然环境分开的那些分子并且包括cDNA和基因组克隆。本发明的分离的DNA分子不含有通常与之结合的其他基因, 但可以包含天然存在的5'和3'非翻译区如启动子和终止子。结合区域的鉴定将对本领域普通技术人员而言是显而易见的(见,例如Dynan和Ti jan,Nature 316 =774-78,1985) 术语“分离的DNA序列”备选地称作“克隆的DNA序列”。当关于蛋白质使用时,术语“分离的”指在其天然环境以外的条件下发现的蛋白质。在优选的形式中,分离的蛋白质基本上不含其他蛋白质,特别是其他同源蛋白。关于重组产生的蛋白质使用时,术语“分离的”指一种蛋白质,它已经从宿主生物的蛋白质环境中被移出并且因而不含有其他外部或不想要的蛋白质(例如,大肠杆菌中产生的重组葛 IspS) 0如SDS-PAGE所测定,分离的蛋白质是大于10%纯的、优选大于20%纯的并且甚至更优选大于30%纯的。本发明的其他方面包括高度纯化形式(即,大于40%纯的、大于60% 纯的、大于80%纯的、大于90%纯的、大于95%纯的、大于97%纯的并且甚至大于99%纯) 的蛋白质,如SDS-PAGE所测定。以下的盒诱变方法可以用来辅助本发明酶变体的构建,尽管可以使用其他方法。 首先,如本文中所述,获得编码该酶的天然存在基因并将它完全或部分地测序。随后,扫描该序列的一个点,其中想要在编码的酶中产生在所述点处的一个或多个氨基酸的突变(缺失、插入或替换)。对该点侧翼的序列评价限制性位点的存在性,旨在以表达时会编码多种突变体的寡核苷酸库替代该基因的短区段。此类限制性位点优选地是该蛋白质基因内部的独特位点,从而有助于替代该基因区段。然而,可以使用该酶基因中不过度冗余的任何便利限制性位点,前提是由限制性消化产生的基因片段可以按正确顺序再装配。如果限制性位点不存在于距离所选位点的便利距离(从10至15个核苷酸)内的位置处,则通过在最终构建中既不改变可读框,也不改变所编码氨基酸的方式替换该基因中的核苷酸来产生此类位点。根据广泛已知的方法,通过M13引物延伸作用实现对基因的突变旨在改变其序列以符合所希望的序列。定位合适的侧翼区并评价需要的改变以获得两个便利限制性位点序列的任务通过遗传密码冗余性、该基因的限制酶图谱和大量不同的限制酶而变成例行工作。应指出,如果便利的侧翼限制性位点是可获得的,则上述方法仅需要联合不含位点的侧翼区使用。一旦克隆天然存在的DNA和/或合成性DNA,位于待突变位置侧翼的限制性位点用同族限制酶消化并且将多个末端互补性寡核苷酸盒连接到该基因中。诱变通过这种方法简化,因为全部寡核苷酸均可以合成,从而具有相同的限制性位点并且不需要合成性接头以产生限制性位点。如本文中所用,“对应于”指在蛋白质或肽中所枚举位置处的残基,或与蛋白质或肽中所枚举残基的类似、同源或等同的残基。如本文中所用,“相应区域”通常指沿相关蛋白或亲本蛋白的类似位置。如本文中所用,术语“组合诱变法”指其中产生起始序列变体文库的方法。在这些文库中,所述变体含有选自预定义突变集合的一个或几个突变。此外,所述方法提供了导入随机突变的手段,其中所述的随机突变不是预定义突变集合的成员。在一些实施方案中,所述方法包括通过引用方式并入的美国申请号09/699,250中所述的那些方法。在备选的实施方案中,组合诱变方法包括市售试剂盒(例如,QUIKCHANGE多位点诱变试剂盒, Stratagene, San Diego, CA)0如本文中所用,术语“突变体文库”指一群细胞,它们在其绝大部分的基因组中相同但包括一个或多个基因的不同同源物。此类文库可以用来例如鉴定具有改良性状的基因或操纵子。如本文中所用,术语“起始基因”和“亲本基因”指编码待使用本发明予以改进和/ 或改变的目的蛋白的目的基因。如本文中所用,术语“多重序列比对”和“MSA”指使用一种算法(例如,Clustal W) 进行比对的一个起始基因的多个同源物的序列。如本文中所用,术语“共有序列,,和“规范序列,,指原型氨基酸序列,具体目的蛋白质或目的序列的全部变体与之进行比较。该术语也指一种序列,其给出目的DNA序列中最经常存在的核苷酸。对于基因的每个位置,共有序列给出了 MSA中该位置内最多见的氨基酸。如本文中所用,术语“共有突变”指起始基因和共有序列的序列中差异。共有突变通过比较起始基因和从MSA所获得共有序列的序列进行鉴定。在一些实施方案中,将共有突变导入起始基因,从而起始基因变得更相似于共有序列。共有突变也包括将起始基因中的氨基酸改变成下述氨基酸的氨基酸变化,其中所述氨基酸相对于该氨基酸在起始基因中的频率更频繁地存在于MSA中该位置处。因而,术语“共有突变”包含这样的全部单个氨基酸改变,它们将起始基因的一个氨基酸替换为丰度高于MSA中该氨基酸的丰度的一种氨基酸。术语“修饰的序列”和“修饰的基因”在本文中互换地用来指包括天然存在的核酸序列的缺失、插入或中断的序列。在一些优选的实施方案中,修饰序列的表达产物是截短的蛋白质(例如,该修饰是序列的缺失或中断时)。在一些特别优选的实施方案中,这种截短的蛋白质仍保留生物学活性。在备选的实施方案中,修饰序列的表达产物是延长的蛋白质 (例如,包含核酸序列中一个插入的修饰)。在一些实施方案中,插入导致截短的蛋白质(例如,该插入导致终止密码子的形成时)。因而,插入可以产生截短的蛋白质或延长的蛋白质作为表达产物。如本文中所用,术语“突变序列”和“突变基因”互换地使用并且指在宿主细胞的野生型序列中出现的至少一个密码子中具有改变的序列。该突变序列的表达产物是具有相对于野生型而言已改变的氨基酸序列的蛋白质。该表达产物可以具有改变的功能性能力(例如,增强的酶活性)。(本文中互换地使用的)术语“诱变引物”或“诱变寡核苷酸”意图指与模板序列的一部分相对应并且能够与之杂交的寡核苷酸组合物。就诱变引物而言,该引物不会精确地匹配模板核酸,利用该引物中的错配或多个错配以将想要的突变导入核酸文库中。如本文中所用,“非诱变引物”或“非诱变寡核苷酸”指与模板核酸精确匹配的寡核苷酸组合物。 在本发明的一个实施方案,仅使用诱变引物。在本发明的另一个优选实施方案中,所述引物如此设计,从而对于已经包括诱变引物的至少一个区域,也存在包含于寡核苷酸混合物中的非诱变引物。通过添加诱变引物和与所述诱变引物至少之一相对应的非诱变引物的混合物,可能产生所得核酸文库,其中存在多种组合突变模式。例如,如果想要的是该突变核酸文库的一些成员仍在某些位置处保留其亲本序列,而其他成员在此类位点处是突变的, 则所述非诱变引物提供以下能力针对给定残基获得该核酸文库内部特定水平的非突变成员。本发明的方法使用一般是10-50之间碱基长度、更优选约15-45碱基长度的诱变和非诱变寡核苷酸。然而,可能需要使用短于10个碱基或长于50个碱基的引物以获得想要的诱变结果。就相应的诱变和非诱变引物而言,相应的寡核苷酸应当具有相同长度不是必需的,但是仅需要与待添加突变相对应的区域内存在重叠。引物可以按本发明的预定比率添加。例如,如果想要的是所得文库在相同或不同的位点处具有明显水平的某种特定突变和较少量的不同突变,则通过调整添加的引物数量,可能产生想要的偏倚文库。或者,通过添加更少或更多数量的非诱变引物,可以调节突变核酸文库中产生相应突变的频率。术语“野生型序列”和“野生型基因”在本文中互换地用来指宿主细胞中固有或天然存在的序列。在一些实施方案中,野生型序列指作为蛋白质工程化项目起点的目的序列。 此野生型序列可以编码同源或异源蛋白。同源蛋白是无干预下宿主细胞将产生的蛋白质。 异源蛋白是宿主细胞本不会产生但因干预而产生的蛋白质。如本文中所用,术语“裂解物”指含有裂解细胞内容物的溶液。在一些实施方案中, 裂解物是细菌细胞裂解物(例如,使用来自Epicentre的READYLYSE 溶菌酶溶液裂解的大肠杆菌细胞;或使用弗氏细胞压碎器裂解的大肠杆菌细胞)。
如本文中所用的术语“溶菌酶”指一种葡糖苷酶,其水解N-乙酰基胞壁酸与N-乙酰葡糖胺之间的键,从而切开许多细菌的细胞壁中的重要聚合物。随本发明使用的合适溶菌酶包括但不限于鸡蛋清溶菌酶(Sigma)、T4溶菌酶、重组的非哺乳动物非鸟类溶菌酶 (READYLYSE )或真菌溶菌酶。如本文中所用,术语“顶空”指在密封容器中固体或液体样品上方所截获的蒸汽/ 空气混合物。如本文中所用,术语“高通量筛选法”和“HTS”指以4小时或更少时间测量至少96 份样品中的异戊二烯。在优选的实施方案中,样品容积小于2mL。除非另外说明,全部组分或组合物的水平指该组分或组合物的有效水平,并且排除了杂质,例如可能存在于市售原料中的残余溶剂或副产物。酶组分重量以总的活性蛋白质为基础。除非另外说明。全部百分数和比率以重量计算。除非另外说明,全部百分数和比率基于总的组成计算。发明详述异戊二烯单体用于聚异戊二烯和多种共聚物(与异丁烯、丁二烯、苯乙烯或其他单体)的制造中。为建立能够产生商业可行水平的异戊二烯的(原核或真核)菌株,要求优化MVA至异戊二烯或DXP至异戊二烯的整条途径。该途径中的一种关键酶是异戊二烯合酶(IspS),它将前体DMAPP转化成异戊二烯。迄今鉴定的异戊二烯合酶(IspQ仅是来自植物(如杨、欧洲栎和葛藤)的那些异戊二烯合酶。虽然一些细菌(如枯草芽孢杆菌)也产生异戊二烯,然而原核IspS仍待鉴定并且芽孢杆菌属中的天然IspS活性不足够用于商业过程。已经部分地通过大肠杆菌中的表达局部地表征了迄今鉴定的植物IspS酶,并且已经用纯化的蛋白质在体外确定这些酶的一些动力学参数。然而,天然IspS酶的动力学参数 (Km、速率等)不足够用于生物宿主中异戊二烯的商业生产。为解决如本文中所述的这个问题,在细菌宿主中表达植物IspS。另外,该IspS工程化以改变目的特性。对野生型和突变IspS的表征通过任何手段或合适“试验”实现并且优选地基于对目的特性的评估。目的特性包括,但不限于最适PH、温度稳定性(例如,Tffl 值)、胞内和胞外溶解度、Kffl值、kcat值或比活性,以及对潜在抑制物(包括底物)的灵敏度或产物抑制作用。氧化稳定性及蛋白水解稳定性也是目的特性。另外,因金属离子效应和离子强度所致的激活作用或抑制作用是目的特性。可以通过体外用纯化或部分纯化的异戊二烯合酶或体内在表达DXP途径、MVA途径或这两者的宿主生物(如大肠杆菌)环境下将 DMAPP转化成异戊二烯,评估这些特性和参数。构思了在一种或多种试验条件下具有各种程度的稳定性、溶解度、活性和/或表达水平的酶将用于本发明中以在多种宿主中产生异戊二烯。需要以经济的方式研究这些特性的高通量方法,如实施例10中所述的那些方法。本发明描述了产生增加量的异戊二烯的组合物和方法。特别地,这些组合物和方法提高异戊二烯产生的速率并增加所产生异戊二烯的总量。用于本文中所述异戊二烯产生的生物合成方法是使用天然橡胶的想要的备选方案。如下文进一步讨论,可以通过编码异戊二烯合酶(IspQ多肽的异源核酸导入细胞而大大增加由该细胞产生的异戊二烯的量。 异戊二烯合酶多肽将二甲基烯丙基二磷酸(DMAPP)转化成异戊二烯。如实施例中所示,在革兰氏阴性细菌细胞(例如,大肠杆菌)中表达异源葛麻姆(葛)异戊二烯合酶多肽及其变体。还在实施例中显示和在本发明的范围构思了在革兰氏阴性细菌细胞(例如,大肠杆菌)中表达杨异戊二烯合酶多肽及其变体。植物IspS在细菌宿主细胞中的异源表达导致比缺少该植物IspS的相应细胞产生更多的异戊二烯。已经显示,使蛋白酶表面上的氨基酸残基突变可以改善酶的活性、表达和稳定性 (W02008/153925、W02008/153934、W02008/153935)。出乎意料地,我们发现使一种完全不同的酶,即异戊二烯合酶的表面上的氨基酸残基突变可以增强该酶的表达、溶解度和活性。 L70R是这种有益表面突变的的一个实例。阐明酶的三维结构对于精确鉴定其表面上的氨基酸残基是必需的。使用下述结构的同源建模可以揭示所建模的结构的大体方面,但是不足以精确地鉴定表面暴露的残基并量化它们的表面暴露程度,其中所述的结构具有与异戊二烯合酶(例如,龙脑基合酶和苧烯合酶,结构已知的与异戊二烯合酶具有最密切同一性的酶)大约40%同一性的序列。氨基酸残基的表面暴露由其侧链的溶剂可及性表面积百分数量化。异戊二烯合酶中突变的以下分类可以通过靶定下述氨基酸残基改善该酶的溶解度,其中所述的氨基酸残基是> 50%暴露于溶剂的,优选地是> 65%暴露于溶剂的并且最优选地是> 85%暴露于溶剂的疏水性一带正电荷,并且反之亦然疏水性一带负电荷,并且反之亦然疏水性一中性极性,并且反之亦然中性极性一带正电荷,并且反之亦然中性极性一带负正电荷,并且反之亦然带正电荷一带负电荷,并且反之亦然另外,由含有异源异戊二烯合酶核酸的细胞的异戊二烯生产可以通过增加由该细胞表达的1-脱氧-D-木酮糖-5-磷酸合酶(DXQ多肽和/或异戊烯二磷酸异构酶(IDI) 多肽的量来增强。例如,DXS核酸和/或IDI核酸可以导入该细胞。该DXS核酸可以是异源核酸或是内源核酸的重复拷贝。类似地,该IDI核酸可以是异源核酸或是内源核酸的重复拷贝。在一些实施方案中,通过DXS和/或IDI内源启动子或调节区替换为导致DXS和 /或IDI核酸更大转录的其他启动子和/或调节区来增加DXS和/或IDI多肽的量。在一些实施方案中,该细胞含有编码异戊二烯合酶多肽(例如,植物异戊二烯合酶核酸)的异源核酸和编码异戊二烯合酶多肽的内源核酸的重复拷贝。编码的DXS和IDI多肽是生物合成异戊二烯的DXP途径的组成部分(图15)。DXS 多肽将丙酮酸和D-甘油醛-3-磷酸转化成1-脱氧-D-木酮糖-5-磷酸。尽管不意图受任何具体理论限制,然而认为增加DXS多肽的量增加了经过DXP途径的碳通量,从而导致更大的异戊二烯生产。IDI多肽催化异戊烯二磷酸(IPP)和二甲基烯丙基二磷酸(DMAPP)互变。尽管不意图受任何具体理论限制,然而认为增加细胞中IDI多肽的量增加了被转化成 DMAPP的IPP的量,所述DMAPP又被转化成异戊二烯。在一些实施方案中,由含有异源异戊二烯合酶核酸的细胞所致的异戊二烯生产可以通过增加该细胞中MVA多肽的表达来增强(图15)。示例性MVA途径多肽包括任意的以下多肽乙酰-CoA酰基转移酶(AA-CoA硫解酶)多肽、3-羟基-3-甲基戊二酰-CoA合酶 (HMG-CoA合酶)多肽、3-羟基-3-甲基戊二酰-CoA还原酶(HMG-CoA还原酶)多肽、甲羟戊酸激酶(MVK)多肽、磷酸甲羟戊酸激酶(PMK)多肽、二磷酸甲羟戊酸脱羧酶(MVD)多肽、 IDI多肽和具有两种或多种MVA途径多肽活性的多肽(例如融合多肽)。例如,一种或多种 MVA途径核酸可以导入该细胞。在一些实施方案中,该细胞含有上方MVA途径,该途径包括 AA-CoA硫解酶核酸、HMG-CoA合酶核酸和HMG-CoA还原酶核酸。在一些实施方案中,该细胞含有下方MVA途径,该途径包括MVK核酸、PMK核酸、MVD核酸和IDI核酸。在一些实施方案中,该细胞含有整个MVA途径,该途径包括AA-CoA硫解酶核酸、HMG-CoA合酶核酸、HMG-CoA 还原酶核酸、MVK核酸、PMK核酸、MVD核酸和IDI核酸。MVA途径核酸可以是异源核酸或是内源核酸的重复拷贝。在一些实施方案中,通过MVA途径核酸的内源启动子或调节区替换为导致所述MVA途径核酸更多转录的其他启动子和/或调节区来增加一种或多种MVA途径多肽的量。在一些实施方案中,该细胞含有编码异戊二烯合酶多肽(例如,植物异戊二烯合酶核酸)的异源核酸和编码异戊二烯合酶多肽的内源核酸的重复拷贝。在一些实施方案中,至少一部分细胞在连续培养物(如无稀释的连续培养)中保留异源异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸至少约5、10、20、50、75、 100、200、300次或更多次细胞分裂。在本发明任意方面的一些实施方案中,包含内源异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸之异源或重复拷贝的核酸也包含选择标记如卡那霉素、氨苄青霉素、羧苄西林、庆大霉素、潮霉素、腐草霉素、博来霉素、新霉素或氯霉素抗生素抗性核酸。I.示例性多肽和核酸多种异戊二烯合酶、DXS、IDI和/或MVA途径多肽和核酸可以用于本发明的组合物和方法中。如本文中所用,“多肽”包括下述多肽、蛋白质、肽、多肽片段和融合多肽,它们包含第一多肽(例如,异戊二烯合酶、DXS、IDI或MVA途径多肽)的部分或全部和第二多肽(例如,辅助纯化或检测融合多肽的肽,如His标记)的部分或全部。在一些实施方案中,融合多肽具有两种或多种MVA途径多肽(如AA-CoA硫解酶和HMG-CoA还原酶多肽)的活性。在一些实施方案中,该多肽是具有两种或多种MVA途径多肽活性的天然存在多肽(如粪肠球菌mvaE核酸编码的多肽)。在多种实施方案中,多肽具有至少或约50、100、150、175、200、250、300、350、400
个或更多个氨基酸。在一些实施方案中,多肽片段含有来自全长多肽的至少或约25、50、 75、100、150、200、300个或更多个连续氨基酸并具有相应全长多肽的至少或约5%、10%、 20%、30%、40%、50%、60%、70%、80%、90%、95%,或 100%活性。在特定的实施方案中, 所述多肽包括任意的天然存在异戊二烯合酶、DXS、IDI或MVA途径多肽的区段或完整氨基酸序列。在一些实施方案中,与野生型异戊二烯合酶、DXS、IDI,或MVA途径多肽的序列(即, 自然界中存在的序列)相比,该多肽具有一个或多个突变。在一些实施方案中,该多肽是分离的多肽。如本文中所用,“分离的多肽”不是多肽文库(如2、5、10、20、50种或更多种不同多肽的文库)的部分并且同自然界中与之共存的至少一种组分分开。分离的多肽可以例如通过表达编码该多肽的重组核酸获得。在一些实施方案中,该多肽是异源多肽。“异源多肽”意指一种多肽,其中所述多肽的氨基酸序列与相同宿主细胞中天然表达的另一种多肽的氨基酸序列相同。如本文中所用,“核酸”指单链或双链形式的两个或多个脱氧核糖核苷酸和/或核
28糖核苷酸。在一些实施方案中,该核酸是重组核酸。“重组核酸”意指不含下述一种或多种核酸(例如,基因)的目的核酸,其中所述的一种或多种核酸在自然界中存在的衍生该目的核酸的生物的基因组中分布于该目的核酸侧翼。该术语因而包括例如不依赖于其他序列而掺入载体、掺入自主复制型质粒或病毒或掺入原核生物或真核生物的基因组DNA或作为独立分子存在(例如,通过PCR或限制性核酸内切酶消化产生的cDNA、基因组DNA片段或cDNA 片段)的重组DNA。在多种实施方案中,该核酸是重组核酸。例如,在一些实施方案中,一种异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与编码另一种多肽的全部或部分的另一种核酸有效连接,从而该重组核酸编码一种融合多肽,其包括异戊二烯合酶、DXS、IDI或MVA途径多肽和另一种多肽(例如,辅助纯化或检测该融合多肽的肽,如His标记)的全部或部分。在一些实施方案中,化学合成重组核酸的部分或全部。在一些实施方案中,该核酸是异源核酸。“异源核酸”意指一种核酸,其核酸序列与相同宿主细胞中天然发现的另一种核酸的核酸序列不同。在特定实施方案中,该核酸包括任意的天然存在的异戊二烯合酶核酸、DXS核酸、 IDI核酸或MVA途径核酸的区段或完整核酸序列。在一些实施方案中,该核酸包括来自天然存在的异戊二烯合酶核酸DXS、IDI或MVA途径核酸的至少或约50、100、150、200、300、400、 500、600、700、800个或更多连续核苷酸。在一些实施方案中,与异戊二烯合酶、DXS、IDI,或 MVA途径核酸的野生型序列(S卩,自然界中存在的序列)相比,该核酸具有一个或多个突变。 在一些实施方案中,该核酸具有增加异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸转录或翻译的一个或多个突变(例如,沉默突变)。在一些实施方案中,该核酸是编码异戊二烯合酶、DXS、IDI或MVA途径多肽的任意核酸的简并变体。“密码子简并性”指遗传密码中的趋异性,其允许核苷酸序列变异而不影响所编码多肽的氨基酸序列。技术人员非常熟悉特定宿主细胞在指示给定氨基酸的核苷酸密码子选择上所表现的“密码子偏倚”。因而,当合成用以改善在宿主细胞中表达的核酸时,在一些实施方案中想要的是如此设计该核酸,使得它的密码子选择频率接近于该宿主细胞的优选密码子选择频率。示例性异戊二烯合酶DXS、IDI和/或MVA途径多肽和核酸的检索号列于通过引用方式完整并入本文的美国申请号61/013,574的附件1中,特别就异戊二烯合酶、DXS、IDI和 /或MVA途径多肽和核酸的氨基酸序列和核酸序列而言。Kegg数据库也含有众多示例性异戊二烯合酶、DXS、IDI和/或MVA途径多肽和核酸的氨基酸和核酸序列(见,例如,在互联网 “ genome. jp/kegg/pathway/map/map00100. html ”处及其中序列,所述网址和序列各自通过引用的方式完整并入,特别是异戊二烯合酶、DXS、IDI和/或MVA途径多肽和核酸的氨基酸序列和核酸序列方面)。在一些实施方案中,一种或多种异戊二烯合酶、DXS、IDI和/或MVA 途径多肽和/或核酸与2007年12月12日公众可获得的序列(如与美国申请号61/013,574 附件1中的任意检索号相对应的任意序列或到本申请的申请日时存在于Kegg数据库中的任意序列)具有序列同一性。下文进一步描述额外的示例性异戊二烯合酶、DXS、IDI和/ 或MVA途径多肽和核酸。示例性异戊二烯合酶多肽和核酸如上文所述,异戊二烯合酶多肽将二甲基烯丙基二磷酸(DMAPP)转化成异戊二烯。示例性异戊二烯合酶多肽包括具有异戊二烯合酶多肽的至少一种活性的多肽、多肽片段、肽和融合多肽。标准方法可以用来通过测量多肽在体外、在细胞提取物中或在体内将 DMAPP转化成异戊二烯的能力而确定该多肽是否具有异戊二烯合酶多肽活性。细胞提取物中的异戊二烯合酶多肽活性例如可以如Silver等人,J. Biol. Chem. 270 :13010-13016, 1995和参考文献中所述那样测量,所述文献在此各自通过引用的方式完整并入,特别是用于异戊二烯合酶多肽活性的测定法方面。DMAPP(Sigma)在氮气流下蒸发至干燥并在IOOmM 磷酸钾缓冲液PH 8.2中再水化至浓度IOOmM并贮存于-20°C。为开展该测定法,将含有 5μ 1 IM MgCl2UmM(250y g/ml)DMAPP,65y 1 植物提取缓冲液(PEB) (50mM Tris-HCl, pH 8.0、20mM 1%(12、5%丙三醇和21111 DTT)的溶液添加到带有金属螺旋盖和特氟龙涂层硅隔片的20ml顶空小瓶(Agilent Technologies)中的25 μ 1细胞提取物并在37°C摇动下培育 15分钟。通过添加200 μ 1的250mMEDTA或通过加热失活作用终止反应并且通过GC/MS定量异戊二烯。示例性异戊二烯合酶核酸包括编码具有异戊二烯合酶多肽至少一种活性的多肽、 多肽片段、肽和融合多肽的核酸。示例性异戊二烯合酶多肽和核酸包括来自本文中所述任意来源生物的天然存在多肽和核酸以及从本文中所述任意来源生物衍生的突变多肽和核酸。在一些实施方案中,该异戊二烯合酶多肽或核酸来自豆科(Fabaceae)、杨柳科 (Salicaceae)或壳斗科(Fagaceae)。在一些实施方案中,该异戊二烯合酶多肽或核酸是来自葛麻姆(葛)(Sharkey 等人,Plant Physiology 137 :700_712,2005)、杨(如银白杨 χ 欧洲山杨 CAC;35696) (Miller 等人,Planta 213 :483_487,2001)、杨(如美洲山杨)(Silver 等人,JBC 270(22) :13010-1316,1995)或欧洲栎(夏栎(Quercus robur)) (Zimmer 等人,WO 98/02550)的天然存在多肽或核酸,所述文献在此各自通过引用的方式完整并入,特别是异戊二烯合酶核酸和异戊二烯合酶多肽的表达方面。合适的异戊二烯合酶包括,但不限于由 GenBank 检索号 AY341431,AY316691, AY279379, AJ457070 和 AY182241 所鉴定的那些戊二烯合酶,所述的检索号因而各自通过引用的方式完整并入,特别是异戊二烯合酶核酸和多肽的序列方面。在一些实施方案中,该异戊二烯合酶多肽或核酸不是来自夏栎的天然存在多肽或核酸(即,该异戊二烯合酶多肽或核酸是除了来自夏栎的天然存在多肽或核酸之外的异戊二烯合酶多肽或核酸)。在一些实施方案中,该异戊二烯合酶核酸或多肽不是来自杨 (如银白杨χ欧洲山杨CAC35696)的天然存在多肽或核酸。 示例性DXS多肽和核酸如上文所述,1-脱氧-D-木酮糖-5-磷酸合酶(DXQ多肽将丙酮酸和D-甘油醛-3-磷酸转化成1-脱氧-D-木酮糖-5-磷酸。示例性DXS多肽包括具有DXS多肽的至少一种活性的多肽、多肽片段、肽和融合多肽。标准方法(如本文中所述的那些标准方法) 可以用来通过测量多肽在体外、在细胞提取物中或在体内将丙酮酸和D-甘油醛-3-磷酸转化成1-脱氧-D-木酮糖-5-磷酸的能力而确定该多肽是否具有DXS多肽活性。示例性DXS 核酸包括编码具有DXS多肽的至少一种活性的多肽、多肽片段、肽和融合多肽的核酸。示例性DXS多肽和核酸包括来自本文中所述任意来源生物的天然存在多肽和核酸以及从本文中所述任意来源生物衍生的突变多肽和核酸。示例性IDI多肽和核酸
异戊烯基二磷酸异构酶多肽(异戊烯二磷酸Δ -异构酶或IDI)催化异戊烯二磷酸(IPP)和二甲基烯丙基二磷酸(DMAPP)互变(例如,将IPP转化成DMAPP和/或将DMAPP 转化成IPP)。示例性IDI多肽包括具有IDI多肽的至少一种活性的多肽、多肽片段、肽和融合多肽。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内使IPP与DMAPP互变的能力而确定该多肽是否具有IDI多肽活性。示例性IDI核酸包括编码具有IDI多肽的至少一种活性的多肽、多肽片段、肽和融合多肽的核酸。示例性IDI多肽和核酸包括来自本文中所述任意来源生物的天然存在的多肽和核酸以及从本文中所述任意来源生物衍生的突变多肽和核酸。示例性MVA途径多肽和核酸示例性MVA途径多肽包括乙酰-CoA酰基转移酶(AA-CoA硫解酶)多肽、3-羟基-3-甲基戊二酰-CoA合酶(HMG-CoA合酶)多肽、3-羟基-3-甲基戊二酰-CoA还原酶 (HMG-CoA还原酶)多肽、甲羟戊酸激酶(MVK)多肽、磷酸甲羟戊酸激酶(PMK)多肽、二磷酸甲羟戊酸脱羧酶(MVD)多肽、IDI多肽和具有两种或多种MVA途径多肽活性的多肽(例如融合多肽)。特别地,MVA途径多肽包括具有MVA途径多肽的至少一种活性的多肽、多肽片段、肽和融合多肽。示例性MVA途径核酸包括编码具有MVA途径多肽至少一种活性的多肽、 多肽片段、肽和融合多肽的核酸。示例性MVA途径多肽和核酸包括来自本文中所述任意来源生物的天然存在多肽和核酸以及从本文中所述任意来源生物衍生的突变多肽和核酸。特别地,乙酰-CoA酰基转移酶多肽(AA-CoA硫解酶或AACT)将两分子的乙酰-CoA 转化成乙酰乙酰-CoA。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将两分子乙酰-CoA转化成乙酰乙酰-CoA的能力而确定该多肽是否具有AA-CoA硫解酶多肽活性。3-羟基-3-甲基戊二酰-CoA合酶(HMG-CoA合酶或HMGS)多肽将乙酰乙酰-CoA 转化成3-羟基-3-甲基戊二酰-CoA。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将乙酰乙酰-CoA转化成3-羟基-3-甲基戊二酰-CoA的能力而确定该多肽是否具有HMG-CoA合酶多肽活性。3-羟基-3-甲基戊二酰-CoA还原酶(HMG-CoA还原酶或HMGR)多肽将3_羟基-3-甲基戊二酰-CoA转化成甲羟戊酸。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将3-羟基-3-甲基戊二酰-CoA转化成甲羟戊酸的能力而确定该多肽是否具有HMG-CoA还原酶多肽活性。甲羟戊酸激酶(MVK)多肽磷酸化甲羟戊酸以形成甲羟戊酸-5-磷酸。标准方法 (如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将甲羟戊酸转化成甲羟戊酸-5-磷酸的能力而确定该多肽是否具有MVK多肽活性。磷酸甲羟戊酸激酶(PMK)多肽磷酸化甲羟戊酸-5-磷酸以形成甲羟戊酸-5-二磷酸。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将甲羟戊酸-5-磷酸转化成甲羟戊酸-5-二磷酸的能力而确定该多肽是否具有PMK多肽活性。二磷酸甲羟戊酸脱羧酶(MVD或DPMDC)多肽将甲羟戊酸_5_ 二磷酸转化成异戊烯二磷酸多肽(IPP)。标准方法(如本文中所述的那些标准方法)可以用来通过测量多肽在体外、在细胞提取物中或在体内将甲羟戊酸-5-二磷酸转化成IPP的能力而确定该多肽是否具有MVD多肽活性。用于分离核酸的示例性方法异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸可以使用标准方法分离。从目的来源生物(如细菌基因组)获得想要的核酸的方法是分子生物学领域常见和熟知(见,例如,WO 2004/033646及所引用的文献,所述文献因而各自通过引用的方式完整并入,特别是分离目的核酸方面)。例如,如果该核酸的序列是已知的(如本文中所述的任何已知核酸),则可以通过限制性核酸内切酶消化产生合适的基因组文库并可以用与所需核酸的序列互补的探针筛选。一旦该序列分离,则该DNA可以使用标准的引物定向扩增方法如聚合酶链反应(PCR)(美国专利号4,683,202,该文献通过引用的方式完整并入,特别是 PCR方法方面)扩增以获得适合使用适宜载体转化的DNA量。备选地,使用标准方法,可以化学合成异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸(如具有已知核酸序列的任意异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸)。可以使用标准方法鉴定可能合适用于本文中所述组合物和方法中的额外异戊二烯合酶、DXS、IDI或MVA途径多肽和核酸。例如,已知天然产生异戊二烯的生物的染色体DNA 的粘粒文库可以在生物(如大肠杆菌)中构建并随后筛选异戊二烯产生。用于获得异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸的额外方法包括通过测定法(如本文中所述的顶空测定法)或通过使用下述引物的PCR筛选宏基因组文库,其中所述的引物针对编码某个长度的保守氨基酸(例如,至少3个保守氨基酸)的核苷酸。可以通过比对已知异戊二烯合酶、DXS、IDI和/或MVA途径多肽的氨基酸序列鉴定保守氨基酸。可以基于比对的已知异戊二烯合酶多肽序列鉴定异戊二烯合酶多肽的保守氨基酸。发现天然产生异戊二烯的生物可以经过(本领域熟知的)标准蛋白质纯化方法处理并且所得的纯化多肽可以用标准方法测序。其他方法存在于文献中(见,例如,Julsing等人,Applied. Microbiol. Biotechnol. 75 1377-84,2007 ;和 Withers 等人,Appl Environ Microbiol. 73 :6277-83, 2007,所述文献因而各自通过引用的方式完整并入,特别是参与合成异戊二烯的核酸的鉴定方面)。另外,可以使用标准序列比对和/或结构预测程序来基于一级结构和/或所预测多肽二级结构与已知DXS、IDI或MVA途径多肽和核酸的相似性而鉴定额外的DXS、IDI或 MVA途径多肽和核酸。标准数据库如swissprot-trembl数据库(在互联网“expasy. org" 上,瑞士生物信息学研究所Swiss-Prot group CMU-I rue Michel Servet CH-1211 Geneva 4,瑞士)也可以用来鉴定异戊二烯合酶、DXS、IDI或MVA途径多肽和核酸。可以使用标准结构预测程序如Predictfrotein (Rost等人,The PredictProtein Server. Nucleic Acids Research 32(网络服务器发行)W321_W326,2004)的默认设置预测异戊二烯合酶、DXS、 IDI或MVA途径多肽的二级和/或三级结构。备选地,可以使用标准方法确定异戊二烯合酶、DXS、IDI或MVA途径多肽的实际二级和/或三级结构。也可以通过与探针杂交鉴定额外的异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸,其中所述的探针从已知的异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸产生。示例性启动子和载体本文中所述的任意异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸可以包含于一个或多个载体中。因而,本发明也描述了以下载体,所述载体具有编码本文中所述的任一异戊二烯合酶、DXS、IDI或MVA途径多肽的一个或多个核酸。如本文中所用,“载体”意指能够递送并以想要的方式在宿主细胞中表达一种或多种目的核酸的构建体。载体的实例包括,但不限于质粒、病毒载体、DNA或RNA表达载体、粘粒和噬菌体载体。在一些实施方案中,载体含有表达调控序列控制下的核酸。如本文中所用,“表达调控序列”意指指导目的核酸转录的核酸序列。表达调控序列可以是启动子,如组成型或诱导型启动子,或增强子。“诱导型启动子”是在环境或发育调节作用下有活性的启动子。表达调控序列与待转录的核酸区段有效连接。在一些实施方案中,载体含有选择标记。术语“选择标记”指能够在宿主细胞中表达的允许轻易选择含有所导入核酸或载体的那些宿主细胞的核酸。选择标记的实例包括, 但不限于抗生素(例如,卡那霉素、氨苄青霉素、羧苄西林、庆大霉素、潮霉素、腐草霉素、博来霉素、新霉素或氯霉素)抗性核酸和/或赋予宿主细胞代谢优势如营养优势的核酸。在一些实施方案中,异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸在无选择标记的情况下整合到细胞的染色体中。合适的载体是与所用宿主细胞相容的那些载体。合适的载体可以例如从细菌、病毒(如细菌噬菌体T7或M-13衍生的噬菌体)、粘粒、酵母,或植物衍生。用于获得和使用此类载体的方案是本领域已知(见,例如,Sambrook等人,Molecular Cloning :A Laboratory Manual,2版,ColdSpring Harbor,1989,该文献通过引用的方式完整并入本文,特别是载体的用途方面)。启动子是本领域熟知的。在宿主细胞中有功能的任何启动子可以用于在宿主细胞中表达异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸。用于驱动异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸在多种宿主细胞中表达的起始调控区或启动子是众多的并且是本领域技术人员熟悉的(见,例如,WO 2004/033646和其中引用的参考文献,所述文献因而各自通过引用的方式完整并入,特别是用于表达目的核酸的载体方面)。实际上,能够驱动这些核酸的任何启动子适用于本发明,包括,但不限于lac、trp、λΡρ λΡκ、Τ7、 tac和trc (用于大肠杆菌中的表达)。在一些实施方案中,使用葡萄糖异构酶启动子(见,例如,美国专利号7,132,527 和其中引用的参考文献,所述文献因而各自通过引用的方式完整并入,特别是用于表达目的多肽的启动子和质粒系统方面)。报道的葡萄糖异构酶启动子突变体可以用来改变与该葡萄糖异构酶启动子有效连接的核酸所编码多肽的表达水平(美国专利号7,132,527)。 在多种实施方案,该葡萄糖异构酶启动子包含于低、中等或高拷贝质粒中(美国专利号 7,132,527)。在多种实施方案中,异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸包含于低拷贝质粒(例如,以每个细胞约1至约4个拷贝维持的质粒)、中等拷贝质粒(例如, 以每个细胞约10至约15个拷贝维持的质粒)或高拷贝质粒(例如,以每个细胞约50或更多个拷贝维持的质粒)。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与T7启动子有效连接。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与包含于中等或高拷贝质粒中的T7 启动子有效连接。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI 核酸或MVA途径核酸与Trc启动子有效连接。在一些实施方案中,异源或额外的内源异戊二
33烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与包含于中等或高拷贝质粒中的Trc启动子有效连接。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与Lac启动子有效连接。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与包含于低拷贝质粒中的Lac启动子有效连接。 在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与内源启动子如埃希氏菌属、泛菌属、芽孢杆菌属、耶氏酵母、链霉菌属(Streptomyces) 或木霉属内源启动子或内源碱性丝氨酸蛋白酶、异戊二烯合酶、DXS、IDI或MVA途径启动子有效连接。在一些实施方案中,异源或额外的内源异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸与包含于高拷贝质粒中的内源启动子有效连接。在一些实施方案中,载体是不整合到细胞中染色体内的复制型质粒。在一些实施方案中,载体的部分或全部整合到细胞中的染色体内。在一些实施方案中,表达载体也包括终止序列。终止控制区也可以从宿主细胞固有的多种基因衍生。在一些实施方案中,终止序列和启动子序列从相同的来源衍生。在另一个实施方案中,终止序列对宿主细胞是内源的。在一些实施方案中,启动子、编码区和终止子均源自待表达的异戊二烯合酶核酸、 DXS核酸、IDI核酸或MVA途径核酸。在一些实施方案中,将异戊二烯合酶核酸、DXS核酸、 IDI核酸或MVA途径核酸的编码区插入通用型表达载体,从而该编码区处于表达构建体的启动子和终止子序列的转录控制下。在一些实施方案中,基因或其部分插入cbhl强启动子的下游。使用标准技术,异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸可以掺入载体,如表达载体(Sambrook 等人,Molecular Cloning :A Laboratory Manual, Cold Spring Harbor, 1982,该文献通过引用的方式完整并入本文,特别是筛选适宜DNA序列和载体构建方面)。用来连接包含目的核酸(如异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸)、启动子、终止子和其他序列的DNA构建体用来将它们插入合适载体的方法是本领域熟知的。例如,限制酶可以用来切割该异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸和载体。随后,可以连接切割的异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸和切割的载体的相容性末端。连接一般通过在便利的限制酶位点处连接而进行。如果此类位点不存在,则根据常规实践使用合成性寡核苷酸接头(见,Sambrook等人,Molecular Cloning :A Laboratory Manual,2 片反,Cold Spring Harbor,1989 禾口 Bennett 禾口 Lasure, More Gene Manipulations in Fungi,Academic Press,San Diego,第 70-76页,1991,所述文献因而各自通过引用的方式完整并入,特别是寡核苷酸接头方面)。另外,使用已知的重组技术(例如,Invitrogen Life Technologies, Gateway Technology),可以构建载体。在一些实施方案中,可能想要的是以远高于天然存在细胞中目前发现的水平过量表达异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸。可以通过将编码那些多肽的核酸选择性克隆入多拷贝质粒或将那些核酸置于诱导型或组成型强启动子下实现这个结果。用于过量表达所需多肽的方法是分子生物学领域常见和熟知的并且可以在Sambrook 等人,Molecular Cloning :A Laboratory Manual,2 片反,Cold Spring Harbor,1989 (该文献通过引用的方式完整并入本文,特别是克隆技术方面)中找到。以下资源包括对根据本发明有用的额外一般方法学的描述Kreigler,GeneTransfer and Expression ;A Laboratory Manual, 1990 ;禾口 Ausubel 等人编著,Current Protocols in Molecular Biology,1994,1994,所述文献因而各自通过引用的方式完整并入,特别是分子生物学和克隆技术方面。示例性来源生物异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸(及它们的编码多肽)可以从天然含有异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸的任何生物获得。 如上文所述,异戊二烯由多种生物如细菌、酵母、植物和动物天然地产生。生物含有产生异戊二烯的MVA途径、DXP途径或同时含有MVA和DXP途径(图15)。因而,DXS核酸可以例如从含有DXP途径或同时含有MVA和DXP途径的任何生物获得。IDI核酸和异戊二烯合酶核酸可以例如从含有MVA途径、DXP途径或同时含有MVA和DXP途径的任何生物获得。MVA 途径核酸可以例如从含有MVA途径或同时含有MVA和DXP途径的任何生物获得。在一些实施方案中,异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸的核酸序列与自然界中以下生物任何者产生的核酸的序列相同。在一些实施方案中,异戊二烯合酶、DXS、IDI或MVA途径多肽的氨基酸序列与自然界中以下生物任何者产生的多肽的序列相同。在一些实施方案中,异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸或多肽是从本文中所述的任意生物衍生的突变核酸或多肽。如本文中所用,“从……衍生”指向其中导入一个或多个突变的核酸或多肽的来源。例如,“从植物多肽衍生”的多肽指因导入一个或多个突变至野生型植物多肽的序列(即,自然界中存在的序列)中产生的目的多肽。在一些实施方案中,来源生物是细菌,如埃希氏菌属菌株(例如,大肠杆菌),或芽孢杆菌属菌株(例如,枯草芽孢杆菌)。如本文中所用,“埃希氏菌属”包括如本领域技术人员已知的“埃希氏菌属”内的全部物种,包括但不限于大肠杆菌、非脱羧埃希氏菌(E. adecarboxylata), Ε. albertii, 蟑螂埃希氏菌(E. blattae),弗格森埃希氏菌(E. fergusonii)、赫尔曼埃希氏菌 (E. hermannii)、E. senegalensis和伤口埃希氏菌(E. vulneris)。“埃希氏菌属”定义为革兰氏阴性、不形成孢子、兼性厌氧杆状细菌,划分为Y变形杆菌纲(Gamma Proteobacteria), 肠杆菌目(Enterobacteriales)、肠杆菌禾斗(Enterobacteriaceae)的成员。如本文中所用,“芽孢杆菌属(Bacillus) 〃包括如本领域技术人员已知的"芽孢杆菌属"内的全部物种,包括但不限于枯草芽孢杆菌(B.subtilis)、地衣芽孢杆菌(B. Iicheniformis)、迟缓芽孢杆菌(B. Ientus)、短芽孢杆菌(B. brevis)、嗜热脂肪芽孢杆菌(B. stearothermophiIus)、嗜碱芽孢杆菌(B. alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌(B. clausii)、耐盐芽孢杆菌 (B. halodurans)、巨大芽孢杆菌(B. megaterium)、凝固芽孢杆菌(B. coagulans)、环状芽孢杆菌(B. circulans)、灿烂芽孢杆菌(B. Iautus)和苏云金芽孢杆菌(B. thuringiensis)。 认识到芽孢杆菌属继续经历分类学重新编排。因而,意图该属包括已经重新划分的物种, 包括但不限于此类生物诸如嗜热脂肪芽孢杆菌,它现在命名为"嗜热脂肪土芽孢杆菌 (Geobacillus stearothermophiIus)“。在氧存在下产生抗性内生孢子被视为芽孢杆菌属的定义特征,尽管该特征也适用于新近命名的脂环酸芽孢杆菌属(Alicyclobacillus)、 双芽孢杆菌属(Amphibaci 1 Ius)、硫胺素芽孢杆菌属(Aneurinibaci 1 Ius)、厌氧芽孢杆菌属(Anoxybacillus)、短芽孢杆菌属(Brevibacillus)、Filobacillus,薄壁芽孢杆菌
35属(Gracilibacillus)、喜盐芽孢杆菌(Halobacillus)、类芽孢杆菌属(Paenibacillus)、 需盐芽孢杆菌属(Salibaci llus)、热杆菌属(Thermobaci llus)、解脲芽孢杆菌属 (Ureibacillus)禾口枝芽孢杆菌属(Virgibacillus)0示例性宿主细胞多种宿主细胞可以在要求保护的发明的方法中用来表达异戊二烯合酶、DXS、IDI 和/或MVA途径多肽和用来产生异戊二烯。示例性宿主细胞包括来自标题为“示例性来源生物”的上一节列出的任意生物的细胞。宿主细胞可以是天然产生异戊二烯的细胞或不天然产生异戊二烯的细胞。在一些实施方案中,宿主细胞使用DXP途径天然地产生异戊二烯, 并且添加异戊二烯合酶核酸、DXS核酸和/或IDI核酸以利用该途径增强异戊二烯产生。在一些实施方案中,宿主细胞使用MVA途径天然地产生异戊二烯,并且添加异戊二烯合酶核酸和/或一种或多种MVA途径核酸以利用该途径增强异戊二烯产生。在一些实施方案中, 宿主细胞使用DXP途径天然地产生异戊二烯,并且添加一种或多种MVA途径核酸以利用MVA 途径的部分或全部以及DXP途径产生异戊二烯。在一些实施方案中,宿主细胞使用DXP和 MVA途径天然地产生异戊二烯,并且添加一种或多种异戊二烯合酶核酸、DXS核酸、IDI核酸或MVA途径核酸以利用这两个途径之一或二者增强异戊二烯产生。示例性转化方法使用用于表达所编码异戊二烯合酶、DXS、IDI和/或MVA途径多肽的标准技术,可以将异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸或含有它们的载体插入宿主细胞(例如,细菌细胞)。向宿主细胞中导入DNA构建体或载体可以使用以下技术实施, 如转化;电穿孔;核内显微注射;转导 ’转染(例如,脂质体转染介导或DEAE-葡聚糖介导的转染或使用重组噬菌体病毒的转染);与磷酸钙DNA沉淀物孵育;采用DNA包被的微粒的高速粒子轰击和原生质体融合。一般转化技术是本领域已知的(见,例如,Current Protocols in Molecular Biology (F. Μ· Ausubel 等人(编著)第 9 章,1987 ;Sambrook等人,Molecular Cloning :A Laboratory Manual, 2 版,Cold Spring Harbor, 1989 ;禾口 Campbell 等人,Curr Genet, 16 =53-56,1989,所述文献因而各自通过引用的方式完整并入,特别是转化方法方面)。导入的核酸可以整合到染色体DNA中或维持为染色体外复制序列。示例性细胞培养基本发明也包括处于培养下的产生异戊二烯的细胞或细胞群。“处于培养下的细胞” 意指处于允许细胞发生一次或多次细胞分裂的溶液(例如,细胞培养基)中的两个或多个细胞。“处于培养下的细胞”不包括作为活的多细胞植物的部分的植物细胞,其中所述的多细胞植物含有已经分化成植物组织的细胞。在多个实施方案中,细胞培养物包括至少或约 10、20、50、100、200、500、1,000,5, 000,10, 000 个或更多个细胞。任何碳源可以用来培育宿主细胞。术语“碳源”指一种或多种能够被宿主细胞或生物代谢的含碳化合物。例如,用来培育宿主细胞的细胞培养基可以包括适合维持宿主细胞的活力或生长的任何碳源。在一些实施方案中,碳源是糖类(如单糖、二糖、寡糖或多糖)、转化糖(例如,酶促处理的蔗糖糖浆)、丙三醇、甘油(例如,生物柴油或肥皂制造过程的甘油副产物)、二羟基丙酮、一碳源、脂肪酸(例如,饱和脂肪酸、不饱和脂肪酸或多不饱和脂肪酸)、脂类、磷脂、 甘油酯类、甘油一酯、甘油二酯、甘油三酯、多肽(例如,微生物或植物蛋白质或肽)、可再生
36碳源(例如,生物量碳源如水解生物量碳源;甜菜糖蜜或甘蔗糖蜜)、酵母提取物、来自酵母提取物的组分、聚合物、酸、醇、醛、酮、氨基酸、琥珀酸、乳酸、乙酸、乙醇或前述两种或多种物质的任意组合。在一些实施方案中,碳源是光合作用产物,包括,但不限于葡萄糖。示例性单糖包括葡萄糖和果糖;示例性寡糖包括乳糖和蔗糖,并且示例性多糖包括淀粉和纤维素。示例性糖类包括C6糖(例如,果糖,甘露糖,半乳糖,或葡萄糖)和C5糖 (例如,木糖或阿拉伯糖)。在一些实施方案中,细胞培养基包括糖类以及糖类以外的碳源 (例如,丙三醇、甘油、二羟基丙酮、一碳源、脂肪酸、脂质、磷脂、甘油酯类、甘油一酯、甘油二酯、甘油三酯、可再生碳源或来自酵母提取物的组分)。在一些实施方案中,细胞培养基包括糖类以及多肽(例如,微生物或植物蛋白质或肽)。在一些实施方案中,微生物多肽是来自酵母或细菌的多肽。在一些实施方案中,植物多肽是来自大豆、谷物、油菜、麻风树、棕榈、花生、向日葵、椰子、芥菜、油菜籽、棉籽、棕榈仁、橄榄、红花、芝麻或亚麻子的多肽。在一些实施方案中,糖类的浓度是至少或约5克/每升培养液(g/L,其中培养液的体积包括细胞培养基的体积和细胞的体积),如至少或约10、15、20、30、40、50、60、80、100、 150、200、300、400或更大g/L。在一些实施方案中,糖类的浓度在约50与约400g/L之间, 如在约100与约360g/L之间,约120与约360g/L之间或在约200与约300g/L之间。在一些实施方案中,糖类的这个浓度包括在培养宿主细胞之前和/或期间所添加糖类的总量。示例性脂类是含有一种或多种脂肪酸的任何物质,其中所述的脂肪酸是C4及以上的饱和、不饱和或分支脂肪酸。示例性脂肪酸包括式R-COOH的化合物,其中“R”是烃。示例性不饱和脂肪酸包括其中“R”包含至少一个碳-碳双键的化合物。示例性不饱和脂肪酸包括,但不限于油酸、 11-十八碳烯酸、亚油酸、棕榈烯酸(palmitelaidic acid)和花生四烯酸。示例性多不饱和脂肪酸包括其中“R”包含多个碳-碳双键的化合物。示例性饱和脂肪酸包括其中“R”是饱和脂族基团的化合物。在一些实施方案中,碳源包括一种或多种C12-C22脂肪酸,如C12饱和脂肪酸、C14饱和脂肪酸、C16饱和脂肪酸、C18饱和脂肪酸、C20饱和脂肪酸或C22饱和脂肪酸。在示例性实施方案中,脂肪酸是棕榈酸。在一些实施方案中,碳源是脂肪酸(例如,不饱和脂肪酸)的盐、脂肪酸(例如,不饱和脂肪酸)的衍生物或脂肪酸(例如,不饱和脂肪酸)衍生物的盐。合适的盐包括,但不限于锂盐、钾盐、钠盐等。甘油二酯和甘油三酯是丙三醇的脂肪酸酯。在一些实施方案中,脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯的浓度是至少或约1克/每升培养液(g/L,其中培养液的体积包括细胞培养基的体积和细胞的体积),如至少或约 5、10、15、20、30、40、50、60、80、100、150、200、300、400 或以上 g/L。在一些实施方案中,脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯的浓度在约10与约400g/L之间,如在约25与约300g/L之间,约60与约180g/L之间或在约75与约150g/L之间。在一些实施方案中,该浓度包括在培养宿主细胞之前和/或期间所添加脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯的总量。在一些实施方案中,碳源包括(i)脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯和(ii)糖类,如葡萄糖。在一些实施方案中,脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯对糖类之比基于碳是约1 1(即,脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯中的一个碳/糖类碳)。在特定的实施方案中,脂类、脂肪酸、甘油一酯、甘油二酯或甘油三酯的量在约60与180g/L之间并且糖的量在约120与360g/L之间。[ 0289]示例性微生物多肽碳源包括来自酵母或细菌的一种或多种多肽。示例性植物多肽碳源包括来自大豆、玉米、油菜、麻风树、棕榈、花生、向日葵、椰子、芥菜、油菜籽、棉籽、棕榈仁、橄榄、红花、芝麻或亚麻的一种或多种多肽。示例性可再生碳源包括干酪乳清渗透物、玉米浆、甜菜糖蜜、大麦麦芽和来自任何前述物质的组分。示例性可再生碳源也包括存在于生物量(如玉米、柳枝稷、甘蔗、发酵过程的细胞废弃物和来自大豆、玉米或小麦磨粉的蛋白质副产品)中的葡萄糖、己糖、戊糖和木糖。在一些实施方案中,生物量碳源是木质纤维素、半纤维素或纤维素性材料,如,但不限于草、小麦、小麦秆、甘蔗渣、甜菜渣、软木浆、玉米、玉米芯或玉米壳、玉米粒、来自玉米粒、 玉米秸秆、柳枝稷、稻壳产物的纤维,或来自谷物干磨法和湿磨法的副产品(例如,玉米、高粱、黑麦、黑小麦、大麦、小麦和/或酒糟)。示例性纤维素性材料包括木材、纸和纸浆废弃物、草本植物和果浆。在一些实施方案中,碳源包括任何植物部分,如茎、谷粒、根或块茎。在一些实施方案中,任何以下植物的全部或部分作为碳源使用玉米、小麦、黑麦、高粱、黑小麦、稻、粟、大麦、木薯、豆类,如豆和豌豆、马铃薯、甘薯、香蕉、甘蔗和/或木薯。在一些实施方案中,碳源是生物量水解物,如包含木糖与葡萄糖和包含蔗糖与葡萄糖的生物量水解物。在一些实施方案中,可再生碳源(如生物量)在添加至细胞培养基之前作预处理。在一些实施方案中,预处理包括酶预处理、化学预处理或酶预处理和化学预处理的组合 (见,例如,Farzaneh 等人,Bioresource Technology 96(18) :2014_2018,2005 ;美国专利号6,176,176 ;美国专利号6,106,888 ;所述文献因而各自通过引用的方式完整并入,特别是可再生碳源预处理方面)。在一些实施方案中,可再生碳源在添加至细胞培养基之前被部分或彻底水解。在一些实施方案中,可再生碳源(如玉米秸秆)在添加至细胞培养基之前进行氨纤维膨胀(AFEX)预处理(见,例如,Farzaneh 等人,Biosource Technology 96(18) 2014-2018,2005)。在AFEX预处理期间,可再生碳源用无水液氨在温和温度(如约60至约 IOO0C )和高压(如约250至约300psi)下处理约5分钟。随后,迅速释放压力。在这个过程中,木质素增溶、半纤维素水解、纤维素解晶作用和表面积增加的组合化学和物理作用使纤维素和半纤维素近乎完全地酶促转化成可发酵糖。AFEX预处理具有优势,在于全部氨可以回收并再利用,同时残留物充当下游工艺中微生物的氮源。另外,AFEX预处理不需要洗涤流。因此,AFEX处理后的干物质回收基本上是100%。AFEX是基本上干态至干态的过程。 处理的可再生碳源长时间稳定并且可以在酶促水解或发酵过程中以高固形物载量投料。纤维素和半纤维素在AFEX过程中受到充分保护,很少或无降解。在酶促水解已经经过AFEX 预处理的可再生碳源之前无需中和。酶促水解AFEX处理的碳源为后续发酵用途产生清洁的糖流。在一些实施方案中,碳源(例如,可再生碳源)的浓度等同于至少或约0. 1,0. 5、1、 1. 5、2、3、4、5、10、15、20、30、40或50%葡萄糖(w/v)。可以通过使用标准HPLC方法,以葡萄糖作为参照物以测量从该碳源所产生葡萄糖的量,确定等同量的葡萄糖。在一些实施方案中,碳源(例如,可再生碳源)的浓度等同于约0. 与约20%之间葡萄糖,如在约0. 与约10%之间葡萄糖、在约0. 5%与约10%之间葡萄糖、在约与约10%之间葡萄糖、在约
与约5%之间葡萄糖或在约与约2%之间葡萄糖。在一些实施方案中,碳源包括酵母提取物或酵母提取物的一种或多种组分。在一些实施方案中,酵母提取物的浓度是至少或约1克酵母提取物/每升培养液(g/L,其中培养液的体积包括细胞培养基的体积和细胞的体积),如至少或约5,10,15,20,30,40,50,60, 80,100,150,200,300或更大g/L。在一些实施方案中,酵母提取物的浓度在约1与约300g/ L之间,如在约1与约200g/L之间,约5与约200g/L之间或在约5与约100g/L之间,或在约5与约60g/L之间。在一些实施方案中,该浓度包括在培养宿主细胞之前和/或期间所添加酵母提取物的总量。在一些实施方案中,碳源包括酵母提取物(或其一种或多种组分) 和另一种碳源,如葡萄糖。在一些实施方案中,酵母提取物对另一种碳源的比率是约1 5、 约 1 10 或约 1 20 (w/w)。另外,碳源也可以是一碳底物如二氧化碳或甲醇。已经在甲基营养型酵母中 (Yamada等人,Agric. Biol. Chem.,53 (2) 541-543,1989,该文献通过引用的方式完整并入本文,特别是碳源方面)和在细菌(Hunter等人,Biochemistry,对,4148-4155,1985,该文献通过引用的方式完整并入本文,特别是碳源方面)中报道从一碳源(例如,甲醇、甲醛或甲酸)产生丙三醇。这些生物可以同化在氧化状态从甲醇至甲酸的一碳化合物并产生丙三醇。碳同化的途径可以通过核酮糖单磷酸途径、通过丝氨酸途径或通过木酮糖单磷酸途径进行(Gottschalk,Bacterial Metabolism,第 2 片反,Springer-Verlag :New York,1986, 该文献通过引用的方式完整并入本文,特别是碳源方面)。核酮糖单磷酸途径涉及甲酸与核酮糖-5-磷酸缩合以形成一个六碳糖,该六碳糖变成果糖并最终变成三碳产物甘油醛醛-3-磷酸。类似地,丝氨酸途径借助亚甲基四氢叶酸将一碳化合物同化入糖酵解途径。除了一种和两种碳底物外,已知甲基营养型生物也利用众多的其他含碳化合物如甲胺、氨基葡糖和多种氨基酸用于代谢活动。例如,已知甲基营养型酵母利用来自甲胺的碳形成海藻糖或丙三醇(Bellion 等人,Microb. Growth Cl Compd Cl Compd.,[Int. Symp.], 第 7 版,415-32.编者Murrell 等人,Publisher Jntercept, Andover, UK,1993,该文献通过引用的方式完整并入本文,特别是碳源方面)。类似地,假丝酵母属(Candida)的多个物种代谢丙氨酸或油酸(Suiter等人,Arch. Microbiol. 153 (5),485-9,1990,该文献通过引用的方式完整并入本文,特别是碳源方面)。在一些实施方案中,细胞在含有生理盐和营养物的标准培养基中培养(见,例如, Pourquie, J0等人,Biochemistry and Genetics of Cellulose Degradation编者Aubert 等人,Academic Press,第 71-86 页,1988 ;和 Ilmen 等人,App 1. Environ. Microbiol. 63 1298-1306,1997,所述文献因而通过引用方式并入,特别是细胞培养基方面)。示例性生长培养基是常见的商业制备的培养基,如Luria Bertani (LB)肉汤、Sabouraud Dextrose(SD) 肉汤或酵母培养基(YM)肉汤。也可以使用其他限定成分或合成的生长培养基,并且用于培育特定宿主细胞的适宜培养基是微生物学或发酵科学领域技术人员已知的。除了适宜碳源之外,细胞培养基还希望地含有合适的矿物质、盐、辅因子、缓冲剂和本领域技术人员已知适用于培养物生长或增强异戊二烯产生的其他组分(见,例如,WO 2004/033646和其中引用的参考文献和WO 96/35796和其中引用的参考文献,所述文献因而各自通过引用的方式完整并入,特别是细胞培养基和细胞培养条件方面)。在异戊二烯合酶核酸、DXS核酸、IDI核酸和/或MVA途径核酸在诱导型启动子控制下的一些实施方案中, 将诱导试剂(例如,糖、金属盐或抗微生物药)希望地以有效诱导异戊二烯合酶、DXS、IDI 和/或MVA途径多肽表达的浓度添加至培养基。在一些实施方案中,细胞培养基具有与具
39有一种或多种DXS、IDI或MVA途径核酸的载体上抗生素抗性核酸(如卡那霉素抗性核酸) 相对应的抗生素(如卡那霉素)。异戊二烯的示例性产生在一些实施方案中,细胞在允许由该细胞产生异戊二烯的条件下在培养基中培养。在一些实施方案中,培养的细胞以大于或约1、10、25、50、100、150、200、250、300、400、 500、600、700、800、900、1,000,1, 250,1, 500,1, 750,2, 000,2, 500,3, 000,4, 000,5, 000 或更
多纳摩尔异戊二烯/以细胞湿重计的细胞克数/小时(纳摩尔/gw。m/小时)产生异戊二烯。在一些实施方案中,异戊二烯的量在约2至约5,000纳摩尔/gw。m/小时之间,如在约2 至约100纳摩尔/gw。m/小时之间、约100至约500纳摩尔/gw。m/小时之间、约150至约500 纳摩尔/gw。m/小时之间、约500至约1,000纳摩尔/gw。m/小时之间、约1,000至约2,000纳摩尔/g /小时或约2,000至约5,000纳摩尔/gw。m/小时之间。单位为纳摩尔/gw。m/小时的异戊二烯的量可以如美国专利号5,849,970中所公开那样测量,该文献通过引用的方式完整并入本文,特别是异戊二烯产生的测量方面。例如,使用标准气相色谱系统,如带有正辛烷/多孔硅胶珠C柱(Alltech Associates, Inc.,Deerf ield,IL)并连接于RGD2氧化汞还原气体检测仪(Trace Analytical,Menlo Park,CA)的(85°C )等温运行的一个系统,对 2mL顶空(例如,来自培养物(如以200转/分钟振摇在32°C于密封小瓶中培养大约3小时的2mL培养物)的顶空)分析异戊二烯(见,例如,Greenberg等人,Atmos. Environ. 27A 2689-2692,1993 ;Silver 等人,Plant Physiol. 97 :1588-1591,1991,所述文献因而各自通过引用的方式完整并入,特别是异戊二烯产生的测量方面)。借助标准异戊二烯浓度校准曲线,将气相色谱面积单位换算成nmol异戊二烯。在一些实施方案中,通过获得细胞培养物样品的A_值并随后基于具有已知A_值的细胞培养物的湿重校准曲线将这个A_值换算成细胞克数,计算了以细胞湿重计的细胞克数值。在一些实施方案中,通过假定具备A6tltl值 1的1升培养液(包括细胞培养基和细胞)具有1克湿细胞重量,估计出细胞的克数。该值也除以已经孵育培养物的小时数,如3小时。在一些实施方案中,培养的细胞以大于或约1、10、25、50、100、150、200、250、 300、400、500、600、700、800、900、1,000,1,250,1,500,1,750,2,000,2,500,3,000,4,000、 5,000、10,000、100,000或更多ng异戊二烯/以细胞湿重计的细胞克数/小时(ng/gw。m/小时)产生异戊二烯。在一些实施方案中,异戊二烯的量在约2至约5,000ng/gw。m小时之间,如在约2至约100ng/gwcm/小时之间、约100至约500ng/gwcm/小时之间、约500至约1,OOOng/ gwcm/小时之间、约1,000至约2,000ng/gwcm/小时或约2,000至约5,000ng/gwcm/小时之间。 可以通过单位为上文所讨论的纳摩尔/gw。m/小时的异戊二烯生产值乘以68. 1计算单位为 ng/gWCffl/小时的异戊二烯量(如下文等式5中所述)。在一些实施方案中,培养的细胞以大于或约1、10、25、50、100、150、200、250、 300、400、500、600、700、800、900、1,000,1,250,1,500,1,750,2,000,2,500,3,000,4,000、 5,000、10,000、50,000、100,000或更多mg异戊二烯/L培养液(mg/L,其中培养液的体积包括细胞的体积和细胞培养基的体积)产生异戊二烯的累积滴度(总量)。在一些实施方案中,异戊二烯的量在约2至约5,000mg/L培之间,如在约2至约100mg/L培之间、约100 至约500mg/L培之间、约500至约1,000mg/L培之间、约1,000至约2,000mg/L培或约 2,000至约5,000mg/L±if#a之间。可以通过从OD6tltl值大约1. 0的细胞培养物取得Iml样品,将该样品置于20mL小瓶中,孵育30分钟并随后测量顶空中异戊二烯的量而测量来自摇瓶或相似培养物的顶空的以mg异戊二烯/L计的异戊二烯的比生产率。如果0D_值不是1. 0, 则量值可以通过除以该OD6tltl值归一化为0D_值1. 0。mg异戊二烯/L顶空的值可以通过乘以系数38换算成mg/L_a/小时/培养培养液的0D6QQ。单位为mg/L_a/小时/OD6tltl的值可以乘以小时数和该0D_值以获得单位为mg异戊二烯/L培养液的累积滴度。可以通过取得发酵罐废气的样品,对该样品分析异戊二烯的量(如单位为每
mg异戊二烯)并且该值乘以废气通过每升培养液的速率(例如,在Ivvm(空气体积/培养液体积/分钟)时,该速率是每小时,测量发酵罐中单位为mg/L±if#a/小时的瞬间异戊二烯产生速率。因而,lmg/L^^的废气水平对应于空气流量Ivvm时60mg/L_a/小时的瞬间产生速率。根据需要,单位为mg/L_a/小时的值可以除以该0D_值以获得单位为 mg/L±if#a/小时/OD的比速率。mg异戊二烯几气体的平均值可以通过这个平均废气异戊二烯浓度乘以发酵期间每升发酵培养液产生的废气总量而换算成总生产率(克异戊二烯每升发酵培养液,mg/L±if#a)。因而,在Ivvm下10小时内的平均废气异戊二烯浓度0. 5mg/L 培养瓶/小时对应于300mg异戊二烯/L±if#a的总产物浓度。在一些实施方案中,培养的细胞将细胞培养基中大于或约0. 0015,0. 002,0. 005、 0. 0U0. 02、0· 05、0· 1、0· 12、0· 14、0· 16、0· 2、0· 3、0· 4、0· 5、0· 6、0· 7、0· 8、0· 9、1· 0、1· 2、 1.4,或1.6%的碳转化成异戊二烯。在一些实施方案中,碳转化成异戊二烯的百分数在约0. 002至约1. 6%之间,如约0. 002至约0. 005%、约0. 005至约0. 01 %、约0. 01至约 0. 05%、约 0. 05 至约 0. 15%,0. 15 至约 0. 2%、约 0. 2 至约 0. 3%、约 0. 3 至约 0. 5%、约0. 5 至约0.8%、约0.8至约1.0%,或约1.0至约1.6%。碳转化成异戊二烯的百分数(也称作“ %碳产率”)可以通过所产生异戊二烯中的碳摩尔数除以碳源中的碳摩尔数(如分批投入和送入的葡萄糖和酵母提取物中的碳摩尔数)测量。该数字乘以100%以给出百分数值 (如等式1中所示)。等式1%碳产率=(所产生异戊二烯中的碳摩尔数)/(碳源中的碳摩尔数)*100对于该计算而言,酵母提取物可以假定含有50% w/w碳。等式2% 碳产率=(39. Ig 异戊二烯 *l/68. lmol/g*5C/mol) / [ (181221g 葡萄糖 *l/180mol/g*6C/mol) + (17780g 酵母提取物 *0. 5*l/12mol/g) ] *100 = 0. 042%本领域技术人员可以轻易地将异戊二烯产生的速率或所产生异戊二烯的量换算成任何其他单位。下文列出单位之间相互换算的示例性等式。异戊二烯产生速率的单位(总的和比)等式3Ig异戊二烯几培养液/小时=14. 7讓01异戊二烯/L培养a/小时(总容积率)。等式4Inmol异戊二烯/gwcm/小时=Inmol异戊二烯/L培养液/小时/OD600 (该换算假定 OD600值为1的1升培养液具有1克湿细胞重量)。等式5Inmol异戊二烯Zgwcm/小时=68. Ing异戊二烯Zgwcm/小时(给定异戊二烯的分子
41量)等式6Inmol异戊二烯/L^frO2/小时=90nmol异戊二烯/L培养液/小时(在每L培养液 90L/小时的&流速下)等式7废气中的Iyg异戊二烯/L气体异戊二烯=在60L气体每L培养a的流速(Ivvm)下 60 μ g异戊二烯/L培养液/小时滴度的单位(总的和比)等式8Inmol异戊二烯/mg细胞蛋白=150nmol异戊二烯/L培养a/OD6tltl (该换算假定0D_ 值1的1升培养液具有大约150mg的总细胞蛋白)(比生产力)。等式9Ig异戊二烯/L培养液=14. 7謹ol异戊二烯/L培养液(总滴度)。根据需要,等式10可以用来换算任何单位,包括将细胞的湿重换算成包括细胞干重的相应单位。等式10细胞的干重=(细胞的湿重)/3. 3在本发明所包括的一些实施方案中,包含编码异戊二烯合酶多肽的异源核酸的细胞产生下述量的异戊二烯,所述的异戊二烯量是从基本上相同条件下培育的不含编码异戊二烯合酶多肽的异源核酸的相应细胞中产生的戊二烯量的至少或约2倍、3倍、5倍、10倍、 25倍、50倍、100倍、150倍、200倍、400倍或更多倍数。在本发明所包括的一些实施方案中,包含编码异戊二烯合酶多肽的异源核酸和编码DXS、IDI和/或MVA途径多肽的一种或多种异源核酸的细胞产生下述的异戊二烯量,所述的异戊二烯量是从基本上相同条件下培育的不含所述异源核酸的相应细胞中产生的戊二烯量的至少或约2倍、3倍、5倍、10倍、25倍、50倍、100倍、150倍、200倍、400倍或更多倍数。示例性异戊二烯纯化方法在一些实施方案中,本文中所述的任意方法还包括回收异戊二烯。例如,使用本发明组合物和方法产生的异戊二烯可以使用标准技术回收,如气提、分馏、吸附/解吸附、 全蒸发、从固相热或真空解吸附异戊二烯或用溶剂提取固定至或吸附于固相的异戊二烯 (见,例如,美国专利号4,703,007和4,570,029,所述文献因而各自通过引用的方式完整并入,特别是异戊二烯回收与纯化方法方面)。在一些实施方案中,异戊二烯的回收涉及分离液体形式的异戊二烯(如异戊二烯的纯液或异戊二烯在溶剂中的溶液)。气提法涉及以连续方式从发酵废气流取出异戊二烯蒸汽。这种取出可以以几种不同方式实现,包括,但不限于吸附至固相、分配入液相或直接冷凝。在一些实施方案中,在异戊二烯蒸汽的露点上膜富集稀薄异戊二烯蒸汽流导致液态异戊二烯的冷凝。异戊二烯的回收可以涉及一个步骤或多个步骤。在一些实施方案中,同时进行从发酵废气取出异戊二烯蒸汽和将异戊二烯转换成液相。例如,可以从废气流直接冷凝异戊二烯以形成液体。在一些实施方案中,依次进行从发酵废气流取出异戊二烯蒸汽和将异戊二烯转换成液相。例如,异戊二烯可以吸附至固相并随后用溶剂从固相提取出来。在一些实施方案中,本文中所述的任意方法还包括纯化异戊二烯。例如,使用本发明组合物和方法产生的异戊二烯可以使用标准技术纯化。纯化指一个过程,其中借助所述过程将异戊二烯与异戊二烯生产时存在的一种或多种组分分开。在一些实施方案中,异戊二烯作为基本上纯的液体获得。纯化方法的实例包括(i)从在液体提取剂中的溶液蒸馏和 (ii)层析法。如本文中所用,“纯化的异戊二烯”意指与异戊二烯产生时存在的一种或多种组分分开的异戊二烯。在一些实施方案中,异戊二烯为至少约20% (以重量计),不含异戊二烯产生时存在的其他组分。在多种实施方案中,异戊二烯以重量计具有至少或约25%、 30%、40%、50%、60%、70%、75%、80%、90%、95%,或 99% 的纯度。纯度可以通过任何适宜方法(例如通过柱层析法、HPLC分析法或GC-MS分析法)测定。异戊二烯合酶的晶体结构本发明也构思了如上文和实施例中所述植物异戊二烯合酶(例如,杨和葛)及其变体的晶形。在一个实施方案中,本发明包括具有如表16-7中所公开的杨异戊二烯合酶晶体结构的任意多肽。实验提供以下实施例旨在展示和进一步说明本发明的某些优选实施方案和方面,并且不应解释为限制本发明的范围。在随后的实验公开内容中,使用以下缩写V (摄氏度);rpm(转/分钟); H20(水);diH20(去离子水);aa和AA(氨基酸);bp (碱基对);1Λ (千碱基对);kD (千道尔顿);gm(克);μ g和ug (微克);mg (毫克);ng (纳克);μ 1和ul (微升);ml (毫升); mm(毫米);qs (足够量);nm(纳米);μπι和um(微米);M(摩尔);mM(毫摩尔);μ M和 uM(微摩尔);ρΜ(皮摩尔);U(单位);丽(分子量);sec(秒);min(分钟);hr (小时); 0D_(在600nm的光密度);BSA(牛血清白蛋白);DMAPP(二甲基烯丙基二磷酸);DTT(二硫苏糖醇)出tOH(乙醇);IPTG(异丙基-β-D-硫代吡喃半乳糖苷);异戊二烯O-甲基-1,3-丁二烯);IspS (异戊二烯合酶);PAGE (聚丙烯酰胺凝胶电泳);PBS (磷酸缓冲盐水[150mM NaCl,IOmM磷酸钠缓冲液,pH 7. 2])和SDS (十二烷基硫酸钠)。以下缩写适用于在实验实施例中已经提到其产品或服务的公司 Agi1ent (Agilent Technologies,Santa Clara,CA) ;Becton Coulter (Beeton Coulter,Inc.,Fullerton,CA) ;Bio-Rad (Bio-Rad Laboratories,Hercules,CA); Cayman Chemical(Cayman Chemical Co.,Ann Arbor,MI) ;CTC Analytics (CTC Analytics A. G. , Zwingen, 瑞士);EMS(Electron Microscopy Supply, Hatfield, PA) ;Epicentre (Epicentre Biotechnologies,Madison,WI) ; Integrated DNA Technologies (Integrated DNA Technologies, Coralville,IA) ;Invitrogen (Invitrogen Corp.,Carlsbad,CA) ;Molecular Dynamics (Molecular Dynamics, Sunnyvale, CA); Novagen(Novagen, Inc.,Madison,WI) ;Perkin Elmer (Perkin Elmer,Waltham, MA); Roche (Roche Applied Science,Indianopolis,IN) ;Sigma(Sigma-Aldrich,St.Louis, M0) ;Stratagene(Stratagene Cloning Systems, La Jolla,CA) ;Qiagen (Qiagen,Inc., Valencia, CA) ;Takara(Takara Bio USA, Madison, WI) ;Thomson Instrument(Thomson Instrument Co.,Oceanside,CA) ;V&P Scientific(V&P Scientific,Inc.,San Diego,CA);禾口 Zinsser (Zinsser North America, Northridge, CA)。实施例1克隆用于重组细菌中表达的葛异戊二烯合酶在本实施例中,描述了用来在大肠杆菌中产生葛异戊二烯合酶(IspS)的方法。葛(葛麻姆)异戊二烯合酶基因(IspS)的蛋白质序列从GenBank(AAQ84170)获得。对大肠杆菌密码子选择优化的葛异戊二烯合酶基因购买自DNA2. O (Menlo Park, CA) 并如SEQ ID N0:1中描述(图1)。该异戊二烯合酶基因通过采用BspLUllI/I^stl的限制性核酸内切酶消化从提供的质粒移出,经凝胶纯化并连接至已经用Ncol/I^stl消化的 PTrcHis2B (Invitrogen)中。如此设计该构建体,从而该异戊二烯合酶基因中的终止密码子位于I^stI位点的5’。因此,当表达该构建体时,His标记不连接于异戊二烯合酶蛋白。通过测序验证所得的质粒pTrcKudzu。该异戊二烯合酶基因也克隆到pET16b(N0Vagen)中。在这种情况下,将该异戊二烯合酶基因插入pET16b,使得重组异戊二烯合酶蛋白含有N端His标记。使用引物组 pET-His-Kudzu-2F :5’ -CGTGAGATCA TATGTGTGCG ACCTCTTCTC AATTTAC(SEQ ID NO 3)和 pET-His-Kudzu-R 5' -CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG(SEQ ID NO :4), 过PCR从pTrcKudzu扩增该异戊二烯合酶基因。这些弓I物分别在该基因的5,末端添加NdeI 位点并且在该基因的3’末端添加BamHI位点。使用上文所述的质粒pTrcKudzu作为模板 DNA,根据制造商的说明使用HERCULASE DNA聚合酶(Stratagene)并以IOpM浓度添加引物。 PCR在25 μ 1总体积中实施。PCR产物用Ndel/BamHl消化并克隆到用相同酶消化的pET16b 中。将连接混合物转化到大肠杆菌ToplOanvitrogen)中并通过测序选择正确的克隆。命名为pETNHisKudzu的所得质粒随后转化到BL21 ( λ DE3)pLysS (Novagen)细胞中用于从T7 启动子表达。该葛异戊二烯合酶基因也克隆到低拷贝数质粒pCL1920 (Lerner和Inouye,Nucl Acids Res, 18 :4631,1990)中。使用引物从上文所述的pTrcKudzu扩增葛异戊二烯合酶基因。正向引物添加一个HindIII位点和一个大肠杆菌共有RBS至5’端。I^stI克隆位点已经存在于pTrcKudzu中就在终止密码子的3’,因而,构建反向引物使得最终PCR产物包括该 PstI 位点。所述引物的序列是HindIII-rbs-Kudzu F :5,-CATATGAAAG CTTGTATCGA TTAAATAAGG AGGAATAAAC C(SEQ ID NO 5)禾口 BamHl-Kudzu R 5,-CGGTCGACGG ATCCCTGCAG TTAGACATAC ATCAGCTG (SEQ ID NO :4)。使用 HERCULASE DNA 聚合酶(Stratagene),以 IOpM 浓度的引物并以Ing模板DNA(pTrcKudzu)扩增PCR产物。扩增方案包括30个循环(95°C 1 分钟,60°C 1分钟,72°C 2分钟)。产物用HindIII和PstI消化并连接到也已经用HindIII 和I3StI消化的pCL1920中。将连接混合物转化到大肠杆菌ToplO中。通过测序分析验证几个转化体。所得的质粒命名为pCL-lac-Kudzu。为了去除β -内酰胺酶基因,pTrcKudzu用BspHI消化,用虾碱性磷酸酶(SAP) 处理,在65°C孵育10分钟以热灭活SAP,随后通过与2单位Klenow片段(New England BioLabs)和dNTP孵育进行末端补平。从琼脂糖凝胶纯化出51Λ片段并将它连接至Kan (R) 基因。根据制造商的说明,使用引物MCM22和MCM23和Taq DNA聚合酶,通过PCR从 pCR-Blunt-IΙ-Τ0Ρ0(Invitrogen)制备该 Kan(R)基因。该 PCR 片段用 HindIII 和 PvuI 消化和使用Klenow片段和dNTP进行末端补平。将连接混合物转化到大肠杆菌Top 10化学感
44受态细胞中并在含有卡那霉素(50 μ g/ml) Luria琼脂上选择携带赋予卡那霉素抗性的质粒 pTrcKudzu (kan)的转化体。所述引物的序列是MCM225,-gatcaagcttAACCGGAATTGCCAG CTG(SEQ ID NO 15)和 MCM23 5‘-gatccgatcgTCAGAAGAACTCGTCAAGAAGGC(SEQ ID N0:16)。实施例2克隆用于重组细菌中表达的杨异戊二烯合酶在本实施例中,描述了用来在大肠杆菌中产生杨异戊二烯合酶(IspS)的方法。 杨(银白杨χ欧洲山杨)异戊二烯合酶的蛋白质序列(Schnitzler等人,Planta 222 777-786,2005)从GenBank(CAC35696)获得。密码子对大肠杆菌优化的一种基因购买自 DNA2. 0并如SEQ ID NO 6中描述(图3)。该异戊二烯合酶基因通过采用BspLUllI/PstI 的限制性核酸内切酶消化从提供的质粒(p9796-poplar)移出,经凝胶纯化并连接至已经用NcoI/PstI消化的pTrcHis2B中。如此克隆该构建体,从而插入序列中的终止密码子位于PstI位点之前,这产生构建体,其中His标记不连接于异戊二烯合酶蛋白。使用在载体序列内部杂交的(正向和反向)市售引物以及引物Poplar InSeq InSeq 5’ GAGAAAATCG GTAAGGAACT GG (SEQ ID NO :8),通过测序验证所得的质粒 pTrcPoplar。实施例3重组细菌中的异戊二烯产生在本实施例中,描述了用来在重组大肠杆菌中产生和测量异戊二烯的方法。1.异戊二烯产生的测定对于摇瓶培养物,将1培养物从摇瓶转移至20ml CTC顶空小瓶(Agilent瓶体目录号5188 2753和瓶盖目录号5188 2759)。旋紧瓶盖并且小瓶在恒定温度孵育,伴以250 转/分钟摇动。30分钟后,从培养箱中取出小瓶并如下文所述分析。在其中测定发酵罐中异戊二烯产生的情况下,从发酵罐的废气取得样品并直接分析。使用Agilent 6890 GC/MS系统进行分析,其中所述的系统连接顶空模式运行的 CTC Analytics CombiPAL 自动进样器。将 Agilent HP-5MS GC/MS 柱(30mx0. 25mm ;0· 25 μ m 膜厚度)用于分析物的分离。进样器设置成进样500 μ L顶空气体。GC/MS方法利用流速 Iml/分钟的氦气作为载气。进样口维持在250°C,伴以50 1的分流比。分析期间,烘箱温度在37°C维持2分钟。Agilent 5793N质量选择检测仪以m/z 67上的单离子监测(SIM) 模式运行。从1.4至1.7分钟关闭该检测仪以允许洗脱永久气体。在这些条件下,观察到异戊二烯(2-甲基-1,3-丁二烯)在1.78分钟洗脱。校准表用来量化异戊二烯的绝对量并发现从1 μ g/L至200 μ g/L是线性的。使用这种方法,估计检测限是50至lOOng/L。II.摇瓶中异戊二烯的产生将上文所述的载体导入大肠杆菌菌株BL21( λ DE3)PLysS(Novagen)以产生菌株 BL21/ptrcKudzu、BL21/pCL-lac-Kudzu 和 BL21/pETHisKudzu。将菌株涂布用于在含有适宜抗生素(对于 BL21/ptrcKudzu 和 BL21/pETHisKudzu 是 50 μ g/ml 羧苄西林或对于 BL21/ pCL-lac-Kudzu是50 μ g/ml壮观霉素)的LA (Luria琼脂)上分离并在37°C孵育过夜。单菌落接种到含有20ml Luria Bertani培养基(LB)和适宜抗生素的250ml带挡板的摇瓶中。 培养物在20°C培育过夜,伴以200转/分钟摇动。测量过夜培养物的0D_并且该培养物稀释到装有含适宜的抗生素的30ml MAGICMEDIA表达培养基(Invitrogen)的250ml带挡板的摇瓶中至OD6tltl约0. 05。该培养物在30°C培育过夜,伴以200转/分钟摇动。当OD6tltl是大约0. 5-0. 8时,添加400 μ M IPTG并且细胞在30°C再孵育6小时,伴以200转/分钟摇动。用IPTG诱导0、2、4和6小时后,收集Iml等分试样的培养物,测定0D_并且如上文所述测量所产生的异戊二烯的量。III. 14升发酵中从BL21/ptrcKudzu产生异戊二烯从补料分批培养物确定从含有重组葛异戊二烯合酶基因的大肠杆菌中大规模产生异戊二烯。每升发酵培养基中发酵培养基(TM2)的配方如下=K2HPO4 13. 6g,KH2PO4 13. 6g,MgS04*7H20 2g,一水合柠檬酸2g,柠檬酸亚铁铵0. 3g,(NH4)2SO4 3. 2g,酵母提取物 5g,1000 X改良的微量金属溶液1ml。全部组分一起添加并溶解于diH20中。pH用氢氧化钾(KOH)调节至6. 8并且补足至体积。终产物用0. 22 μ M滤器过滤除菌,但是不进行高压灭菌。1000Χ改良微量金属溶液的配方如下柠檬酸*H20 40g, MnSO4^H2O 30g,NaCl 10g, FeS04*7H20 lg,CoC12*6H20 lg,ZnS04*7H20 lg,CuS04*5H20 IOOmg, H3BO3 lOOmg,NaMo04*2H20 IOOmgo每种组分一次一种溶解于diH20中,pH用HCl/NaOH调节至3. 0,随后补足至体积, 并且用0. 22 μ M滤器过滤除菌。在14L生物反应器中实施该实验以监测从葡萄糖中在想要的发酵,ρΗ6. 7和温度 34°C下形成异戊二烯。在2个600ml烧瓶中的大豆胨_酵母提取物_葡萄糖培养基内制备取自冷冻小瓶的大肠杆菌菌株BL21/ptrcKUdZU的接种物。在接种物生长至OD55tl = 0. 6 后,将这2个600ml烧瓶离心并且内容物重悬于70ml上清液中以将细胞沉淀物(70ml的OD 3. 1材料)转移至生物反应器。在接种后的多个时间,取出样品并如上文所述测量所产生异戊二烯的量。实施例4选择用于改善植物异戊二烯合酶的位点植物的异戊二烯合酶预期与萜烯合酶同源。已经从龙脑基二磷酸合酶(pdb条目 1N1B)和5-表-aristolochene合酶(pdb条目5EAU)测定了两种同源萜烯合酶的三维结构。这些酶仅有32%同源性,但它们的三级结构是保守的。此外,具有这两种酶的中间复合物的结构显示这些酶的活性中心中的三级折叠和具体相互作用均高度保守。如下表4-1中所示,葛异戊二烯合酶和杨异戊二烯合酶比龙脑基二磷酸合酶与 5-表-马aristolochene合酶之间具有更高的序列同一性。表4-1.多种酶的同一性百分数
权利要求
1.分离的杨异戊二烯合酶变体,其中所述的变体包含异戊二烯合酶氨基端部分中的截短。
2.权利要求1的分离的杨异戊二烯合酶变体,其中该异戊二烯合酶变体与全长异戊二烯合酶相比具有增加的比活性。
3.权利要求1的分离的杨异戊二烯合酶变体,其中所述异戊二烯合酶是SEQID NO 120的银白杨(P. alba)异戊二烯合酶。
4.权利要求3的分离的杨异戊二烯合酶变体,其中所述变体选自由MEA变体(SEQID NO 122)、MSV 变体(SEQ ID NO :124)、MVS 变体(SEQ ID NO :126)、MTE 变体(SEQ ID NO 128)、MNV 变体(SEQ ID NO :130)组成的组。
5.权利要求4的分离的杨异戊二烯合酶变体,其中所述变体是MEA变体(SEQID NO 122)。
6.权利要求3的分离的杨异戊二烯合酶变体,其中所述变体选自由TRC(-3)变体(SEQ ID NO :136)、TRC (-4)变体(SEQ ID NO :138)、TRC (-5)变体(SEQ ID NO :140)、TRC (-6)变体(SEQ ID NO 142)和 TRC(-7)变体(SEQ ID NO :144)组成的组。
7.权利要求1的分离的杨异戊二烯合酶变体,其中所述变体是美洲山杨异戊二烯合酶的 MET 变体(SEQ ID NO :146)。
8.权利要求1的分离的杨异戊二烯合酶变体,其中所述变体是毛果杨异戊二烯合酶的 MET 变体(SEQ ID NO :148)。
9.分离的杨异戊二烯合酶变体,其中所述变体包含野生型异戊二烯合酶的一个或多个氨基酸残基的替换;并且其中异戊二烯合酶变体与野生型异戊二烯合酶相比具有增加的异戊二烯合酶活性。
10.权利要求9的分离的杨异戊二烯合酶变体,其中增加的异戊二烯合酶活性由与包含亲本异戊二烯合酶的宿主细胞相比在二甲基烯丙基焦磷酸(DMAPP)存在下以更快速率生长的包含异戊二烯合酶变体的宿主细胞指示。
11.权利要求9的分离的杨异戊二烯合酶变体,其中所述异戊二烯合酶是SEQID NO 120的银白杨异戊二烯合酶。
12.权利要求11的分离的杨异戊二烯合酶变体,其中所述变体包含选自由V10M、F12S、 T15A、E18G、V58I、V58F、L70Q、L70V、L70T、T71P、V79L、E89D、G94A、S119F、F120L、G127R、 E175V、T212I、S257A、R262G、A266G、F280L、N297K、F305L、L319M、E323K、A328T、D342E、 A359T、K366N、E368D、L374M、S396T、V418S、K438N、H440R、T442I、T442A、I449V、A469S、 K500R、K505Q、G507S、S509N、F511Y和N53I组成的组中的多个氨基酸替换之一。
13.权利要求11的分离的杨异戊二烯合酶变体,其中至少一个氨基酸替换是L70R替换。
14.权利要求11的分离的杨异戊二烯合酶变体,其中所述变体包含选自由G127R/ F511Y、L70Q/G94A/R262G/F305L、F12S/T15A/E18G/N297K、S396T/T442I、V10M/E323K、 F120L/A266G、K438N/K500R、V79L/S509N、E175V/S257A/E368D/A469S、T71P/L374M、F280L/ H440R、E89D/H440R、V58F/A328T/N532K、S119F/D342E/I449V 和 K366N/G507S 组成的组中的多个氨基酸替换之一。
15.包含SEQID NO :120的氨基酸残基(图19)的多肽的晶形。
16.产生异戊二烯的方法,包括(a)提供包含表达载体的宿主细胞,所述的表达载体包含编码异戊二烯合酶变体的多核苷酸序列;和(b)在适合产生异戊二烯的条件下培养宿主细胞。
17.权利要求16的方法,还包括(c)回收异戊二烯。
18.权利要求17的方法,还包括(d)聚合异戊二烯。
19.检测异戊二烯合酶活性的方法,包括(a)在适合产生异戊二烯合酶变体的条件下培养包含表达载体的宿主细胞;(b)用包含溶菌酶的裂解缓冲液裂解该宿主细胞以产生细胞裂解物;和(c)通过测量来自二甲基烯丙基二磷酸(DMAPP)的异戊二烯产生来检测该细胞裂解物中的异戊二烯合酶活性。
20.权利要求19的方法,其中所述宿主细胞选自由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。
21.权利要求19的方法,其中所述宿主细胞选自由埃希氏菌属物种(Escherichia sp.)(大肠杆菌)、泛菌属物种(Panteoa sp.)(柠檬泛菌)、芽孢杆菌属物种(Bacillus sp.)(枯草芽孢杆菌)、耶氏酵母属物种(Yarrowia sp.)(解脂耶氏酵母)和木霉属 (Trichoderma)(里氏木霉)组成的组。
22.权利要求19的方法,其中所述宿主细胞在包括碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、糖蜜、蔗糖和油组成的组。
23.以高通量筛选检测多份样品中异戊二烯的方法,包括(a)提供i)分别包含异戊二烯合酶的多份样品;ii)包含多个孔的玻璃板;和iii)该玻璃板的封盖;(b)将多份样品置于玻璃板的多个孔中;(c)用封盖密封玻璃板以产生密封的玻璃板,其具有与多个孔的每孔中样品相关的顶空;(d)在异戊二烯合酶有活性的条件下孵育玻璃板;(e)检测顶空中的异戊二烯。
24.权利要求23的方法,其中异戊二烯由气相色谱-质谱法(GC-MQ检测。
25.权利要求23的方法,其中所述多份样品包含含有表达载体的宿主细胞,所述表达载体包含与启动子有效连接的编码异戊二烯合酶变体的多核苷酸序列。
26.权利要求23的方法,其中所述多份样品包含宿主细胞的裂解物、溶菌酶和二甲基烯丙基二磷酸(DMAPP)。
27.权利要求23的方法,其中所述玻璃板是深孔玻璃块。
28.权利要求23的方法,其中所述多个孔包括至少M个孔。
29.权利要求23的方法,其中所述多个孔各自包含2ml或更小的容积。
30.宿主细胞,其包含与启动子有效连接的编码异戊二烯合酶变体的异源多核苷酸序列,其中异戊二烯合酶变体在与杨异戊二烯合酶的一个或多个(1、2、3、4、5、6、7、8、9或10 个)残基相对应的位置处包含替换。
31.权利要求30的宿主细胞,其中所述异戊二烯合酶是SEQID NO :120的银白杨异戊二烯合酶。
32.权利要求31的宿主细胞,其中所述变体选自由MEA变体(SEQID NO 122), MSV变体(SEQ ID NO :124)、MVS 变体(SEQ ID NO :1 )、MTE 变体(SEQ ID NO :12 、MNV 变体 (SEQ ID NO 130)组成的组。
33.权利要求31的宿主细胞,其中所述变体选自由TRC(-3)变体(SEQID NO 136), TRC (-4)变体(SEQ ID NO :138)、TRC (-5)变体(SEQ ID NO :140)、TRC (-6)变体(SEQ ID NO 142)和 TRC (-7)变体(SEQ ID NO :144)组成的组。
34.权利要求30的宿主细胞,其中所述变体是美洲山杨异戊二烯合酶的MET变体(SEQ ID NO 146)。
35.权利要求30的宿主细胞,其中所述变体是毛果杨异戊二烯合酶的MET变体(SEQID NO 148)。
36.权利要求31的宿主细胞,其中所述变体包含选自由V10M、F12S、T15A、E18G、V58I、 V58F、L70Q、L70V、L70T、T71P、V79L、E89D、G94A、S119F、F120L、G127R、E175V、T212I、S257A、 R262G、A266G、F280L、N297K、F305L、L319M、E323K、A328T、D342E、A359T、K366N、E368D、 L374M、S396T、V418S、K438N、H440R、T442I、T442A、I449V、A469S、K500R、K505Q、G507S、 S509N、F511Y和N53I组成的组中的多个氨基酸替换之一。
37.权利要求36的宿主细胞,其中至少一个氨基酸替换是L70R替换。
38.权利要求31的宿主细胞,其中所述变体包含选自由G127R/F511Y、L70Q/G94A/ R262G/F305L、F12S/T15A/E18G/N297K、S396T/T442I、V10M/E323K、F120L/A266G、K438N/ K500R、V79L/S509N、E175V/S257A/E368D/A469S、T71P/L374M、F280L/H440R、E89D/H440R、 V58F/A328T/N532K、S119F/D342E/I449V和K366N/G507S组成的组中的多个氨基酸替换之
39.权利要求30的宿主细胞,其中所述多核苷酸序列包含于质粒内。
40.权利要求39的宿主细胞,其中所述多核苷酸序列整合到宿主细胞的染色体中。
41.权利要求30的宿主细胞,其中所述宿主选自由革兰氏阳性细菌细胞、革兰氏阴性细菌细胞、丝状真菌细胞和酵母细胞组成的组。
42.权利要求30的宿主细胞,其中所述宿主选自由埃希氏菌属物种(大肠杆菌)、泛菌属物种(柠檬泛菌)、芽孢杆菌属物种(枯草芽孢杆菌)、耶氏酵母属物种(解脂耶氏酵母) 和木霉属(里氏木霉)组成的组。
43.权利要求30的宿主细胞,其中所述宿主在包含碳源的培养基中培养,所述碳源选自由葡萄糖、丙三醇、甘油、二羟基丙酮、酵母提取物、生物量、糖蜜、蔗糖和油组成的组。
44.权利要求30的宿主细胞,其中所述宿主细胞还包含编码IDI多肽的异源或天然核酸和/或编码DXS多肽的异源或天然核酸,其任选地与天然DXP途径组合。
45.权利要求30的宿主细胞,其中所述宿主细胞还包含编码IDI多肽和DXS多肽的一种或多种核酸。
46.权利要求30的宿主细胞,其中所述宿主细胞包含编码异戊二烯合酶变体、IDI多肽和DXS多肽的一种载体。
47.权利要求46的宿主细胞,其中所述宿主细胞还包含编码MVA途径多肽的异源核酸,所述MVA途径多肽选自由来自酿酒酵母(Saccharomyces cerevisia)和粪肠球菌 (Enterococcus faecalis)的MVA途径多肽组成的组。
48.权利要求30的宿主细胞,其中所述宿主细胞还包含编码MVA途径多肽和DXS多肽的一种或多种核酸并且其中一种载体编码所述异戊二烯合酶变体、MVA途径多肽和DXS多肽。
49.权利要求48的宿主细胞,其中所述宿主细胞还包含编码DXS多肽、IDI多肽或者剩余DXP途径多肽中一种或多种多肽和MVA途径多肽的一种或多种核酸。
50.产生异戊二烯的方法,包括(a)在用于产生异戊二烯的合适培养条件下培养权利要求30的宿主细胞;和(b)产生异戊二烯。
51.权利要求50的方法,还包括(c)回收异戊二烯。
52.权利要求51的方法,还包括(d)聚合异戊二烯。
53.产生异戊二烯合酶的方法,包括(a)提供(i)宿主细胞;和(ii)与启动子有效连接的编码异戊二烯合酶变体的核酸, 其中异戊二烯合酶变体在与SEQ ID NO :120的银白杨异戊二烯合酶的一个或多个(1、2、3、 4、5、6、7、8、9或10个)残基相对应的位置处包含替换;(b)将宿主细胞与该核酸接触以产生转化的宿主细胞;和(c)在用于产生异戊二烯合酶的合适培养条件下培养转化的宿主细胞。
全文摘要
本发明提供了方法和包含催化活性和/或溶解度改进的至少一种异戊二烯合酶的组合物。具体地,本发明提供了用于增加微生物宿主细胞中异戊二烯产生的变异植物异戊二烯合酶。生物合成产生的本发明异戊二烯用于橡胶和高弹体的制造中。
文档编号C12N9/88GK102171335SQ200980123460
公开日2011年8月31日 申请日期2009年4月23日 优先权日2008年4月23日
发明者A·米亚斯尼科夫, C·L·莱福, C·M·派瑞斯, D·H·韦尔斯, G·M·怀特德, J·C·麦考利夫, J·凯利斯, M·A·卡文, R·R·博特, W·韦勒 申请人:丹尼斯科美国公司, 固特异轮胎和橡胶公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1