具有改善了的反应动力学的b的制作方法

文档序号:455584阅读:1157来源:国知局
专利名称:具有改善了的反应动力学的b的制作方法
技术领域
本发明涉及分子生物学领域,以及将B12-依赖型脱水酶用于生产1,3-丙二醇的用途。更具体地讲,本发明描述了用于制备和选择具有改善了的反应动力学的B12-依赖型脱水酶的方法,以便降低酶失活的速率。
背景1,3-丙二醇具有多种用途,包括作为生产聚酯,聚醚和聚氨基甲酸酯的原材料。用于生产1,3-丙二醇的方法包括传统化学方法和生物学方法。最近业已描述了用于生产1,3-丙二醇的生物学方法(Zeng等,Adv.Biochem.Eng.Biotechnol.,74239-259(2002))。通过生物学方法生产1,3-丙二醇,需要甘油作为两个步骤的顺序反应的底物。首先,脱水酶(通常是辅酶B12-依赖型脱水酶)将甘油转化成中间体——3-羟基丙醛(3-HP)。然后,通过NADH-(或NADPH)依赖型氧化还原酶将3-HP还原成1,3-丙二醇(参见反应式1和2)。
甘油→3-HP+H2O(反应式1)3-HP+NADH+H+→1,3-丙二醇+NAD+(反应式2)1,3-丙二醇不能进一步代谢,其结果是以高浓度在培养基中积累。
通常,甘油被用作通过生物学方法生产1,3-丙二醇的原材料。不过,葡萄糖和其他糖类也是用于1,3-丙二醇生产的合适底物。具体地讲,Laffend等(WO 96/35796;US 5,686,276)公开了用于由除了甘油或二羟基丙酮以外的碳底物生产1,3-丙二醇的方法(例如,特别是用葡萄糖),其中使用包括脱水酶活性的单一微生物。Emptage等(WO01/012833)描述了通过非专一性催化活性将3-HP转化成1,3-丙二醇获得的效价的显著提高(克产物/升)(与由dhaT编码的1,3-丙二醇氧化还原酶不同)。Payne等(US 60/374931)公开了用于通过生物学方法生产1,3-丙二醇的特殊载体和质粒。Cervin等(US 60/416192)公开了用于高产量生产1,3-丙二醇的改良的大肠杆菌(E.coli)菌株。在此将WO96/35796,WO 01/012833,US 60/374931和US 60/416192以全文形式引入本说明书作为参考。
负责将甘油转化成3-HP的酶主要是辅酶B12-依赖型酶,被称为辅酶B12-依赖型甘油脱水酶(E.C.4.2.1.30)和辅酶B12-依赖型二醇脱水酶(E.C.4.2.1.28)。对上述不同的,但是相关的辅酶B12-依赖型酶在它们的分子和生物化学特性方面进行了充分研究。业已鉴定了编码辅酶B12-依赖型脱水酶的基因,例如,在肺炎克雷伯氏菌(Klebsiellapneumoniae),弗氏柠檬酸杆菌(Citrobacter freundii),巴氏梭菌(Clostridium pasteurianum),鼠伤寒沙门氏菌(Salmonellatyphimurium),产酸克雷伯氏菌(Klebsiella oxytoca)和丘状菌落乳杆菌(Lactobacillus collinoides)中鉴定(Toraya,T.,InMetalloenzymes Involving Amino Acid-Residue and RelatedRadicals;Sigel,H.和Sigel,A.,Eds.;Metal Ions in BiologicalSystems;Marcel DekkerNew York,1994;Vol.30,pp 217-254;Daniel等,FEMS Microbiology Reviews 22553-566(1999);和Sauvageot等,FEMS Microbiology Letters 20969-74(2002))。
尽管在文献中使用的所述基因的名称有多种变化,但在每一种情况下,辅酶B12-依赖型脱水酶都是由三个亚基组成的较大的或“α”亚基,中等的或“β”亚基,和较小的或“γ”亚基。所述亚基组装成α2β2γ2结构,以便形成脱辅基酶。辅酶B12(活性辅因子种类)与所述脱辅基酶结合,以便形成催化活性的全酶。辅酶B12是催化活性所必需的,因为它参与发生催化所依赖的游离基机理。
在生物化学方面,辅酶B12-依赖型甘油和辅酶B12-依赖型二醇脱水酶已知会通过甘油和其他底物发生基于机理的自杀失活(Daniel等,同上;Seifert,等,Eur.J.Biochem.2682369-2378(2001))。另外,通过全酶与高浓度的1,3-丙二醇的相互作用发生失活。失活涉及辅酶B12辅因子的钴-碳(Co-C)键的裂解,导致了5′-脱氧腺苷和无活性的钴胺素种类的形成。无活性的钴胺素种类保持与脱水酶紧密结合;在没有辅酶B12-依赖型脱水酶再激活因子(“脱水酶再激活因子”)干预的情况下,不会发生解离。这种失活作用能显著减弱与3-HP形成相关的反应动力学,因此间接降低了1,3-丙二醇的生产。
可以部分克服辅酶B12-依赖型脱水酶失活的影响。例如,可以通过依赖负责再激活脱水酶活性的蛋白来克服失活作用。脱水酶再激活因子业已描述于以下文献中WO 98/21341(US 6,013,494);Daniel等(同上);Toraya和Mori(J.Biol.Chem.2743372(1999));和Tobimatsu等(J.Bacteriol.1814110(1999))。再激活是通过多个步骤的过程发生的。首先,在ATP-依赖型过程中,失活的辅酶B12-依赖型脱水酶与脱水酶再激活因子相互作用导致紧密结合的无活性的钴胺素种类的释放,以便产生脱辅基酶。然后,脱水酶脱辅基酶可以结合辅酶B12,以重新形成催化活性的全酶,并且无活性的钴胺素种类可以再生成(在独立的ATP-依赖型过程中,通过酶促作用)辅酶B12。不过,仅仅依靠脱水酶再激活因子恢复脱水酶活性固有地是有限的,因为脱水酶再激活和辅酶B12再生过程都需要ATP。所述ATP-依赖型过程造成了将甘油转化成3-HP的过程的显著的能量负担,特别是如果存在3-HP至1,3-丙二醇的后续反应,并且1,3-丙二醇浓度较高的话,更是如此。
或者,可能增加在1,3-丙二醇生产期间添加到培养基中的辅酶B12的量,或者用维生素B12(它在体内被转化成辅酶B12)补充所述培养基,以便为微生物提供额外的辅酶B12。不过,在这两种情况下,所述添加的成本可能显著干扰工艺的经济性。
Croux等(WO 01/04324 A1)业已解决了与辅酶B12-依赖型脱水酶相关的问题,这通过使用能表达辅酶B12-不依赖型脱水酶的重组微生物开发了用于生产1,3-丙二醇的方法来实现。不过,该解决方案的有效性可能受到B12-不依赖型脱水酶在某些优选工艺条件下发挥作用的能力的限制(例如在需氧条件下(Hartmanis和Stadman,Arch.Biochem.Biophys.245144-52(1986))。
原则上讲,应当可能从天然存在的微生物菌株中分离具有较低的失活动力学的辅酶B12-依赖型脱水酶。较低的失活动力学能提高辅酶B12-依赖型脱水酶在微生物宿主中的转换率(摩尔产物/摩尔全酶),并因此减少对脱水酶和辅酶B12的需求。这一方法还能减少保持脱水酶和辅酶B12水平所需要的能量。不过,在实践中,业已发现辅酶B12-依赖型脱水酶的多样性在失活动力学方面是有限的。
因此,要解决的问题是现有的辅酶B12-依赖型脱水酶不能提供用于生产工业化合物的工业应用所需要的反应动力学。
发明概述申请人业已提供了用于筛选具有改善了的反应动力学的B12-依赖型脱水酶的方法,包括(a)让B12-依赖型脱水酶全酶与包括甘油和1,3-丙二醇的混合物接触,其中,所述1,3-丙二醇至少为25mM;(b)筛选所述B12-依赖型脱水酶全酶,以便评估B12-依赖型脱水酶全酶的转换率。
所述方法的筛选步骤还包括以下步骤a)在不包括甘油的可发酵的碳底物上生长细胞,其中,所述细胞不具备辅酶B12,脱水酶再激活因子或内源B12-依赖型脱水酶的来源;b)透化所述细胞;c)将辅酶B12,甘油和至少25mM1,3-丙二醇的混合物添加到步骤(b)的透化的细胞中;d)对在步骤(c)中产生的3-羟基丙醛进行定量,其中,所述定量是选自T1,T2和T(600)的量度。
本发明还包括选自下列序列的编码B12-依赖型突变型脱水酶的核酸序列SEQ ID NO40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,143,147,151,155,159,163,167,171,175,179,182,186,189,192,195,198,201,204,208,212,215,218,221,225,229,233,237,241,245,249,253,257,261,265,269,273,277,281,285,289,293,297,301,304,307,310,313,316,319,322,325,328,331,334和337。由所述核酸序列编码的更优选的B12-依赖型突变型脱水酶选自SEQ ID NO40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,143,147,151,155,159,163,167,171,175,179,182,186,189,192,195,198,201,204,208,212,215,218,221,225,229,233,237,241,245,249,253,257,261,265,269,273,277,281,285,289,293,297,301,304,307,310,313,316,319,322,325,328,331,334和337。编码B12-依赖型突变型脱水酶的更优选的核酸序列包括选自如下序列的α-β亚基融合体SEQ ID NO140,179,186,189,192,195,198,201,212,215,218,301,304,307,310,313,316,319,322,325,328,331,334和337。编码B12-依赖型突变型脱水酶的最优选的核酸序列包括选自如下序列的α-β亚基融合体SEQ ID NO313,322和328。
本发明还包括核酸序列,这些序列还包括位于α-β亚基融合体的α和β亚基之间的接头序列,其中,所述接头序列选自SEQ ID NO18和SEQ ID NO19。
本发明还包括用于制备具有改善了的反应动力学的B12-依赖型脱水酶突变体的方法,包括a)让包括热点1或热点2的B12-依赖型脱水酶全酶与诱变剂接触;b)筛选在步骤A)中产生的具有改善了的kcat和/或稳定性的突变体;和c)重复步骤a)和b)。
7.本发明用于鉴定相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型脱水酶的进一步的方法包括a)让脱水酶全酶与5-10mM甘油和/或10-300mM 1,3-丙二醇接触;b)在高通量测定中,在至少两个间隔足够大的时间点上进行测量以便评估kcat和总的酶转换;c)选择相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型突变体。
本发明的用于鉴定相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型脱水酶的另一种方法包括a)让脱水酶全酶与5-50mM甘油和>300mM 1,3-丙二醇接触;b)在高通量测定中,在相对于T0的一个间隔足够大的时间点上进行测量,以便评估总的酶转换数;和c)选择相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型突变体。
附图和序列表简述

图1表示在存在甘油或在存在甘油和1,3-丙二醇的条件下进行的一般GDH反应的时程(time course)。
图2用示意图表示如实施例6所描述的一般后续测定的结果。
图3表示在α-亚基上包括单点突变(相对于野生型GDH而言)的突变体的分布。
图4表示在α-亚基上包括多点突变(相对于野生型GDH而言)的突变体的分布。
图5表示使用不配对的引物的重组源(recombinogenic)延伸方法的原理。
申请人业已提供了346种序列,所述序列符合专利申请中核苷酸和氨基酸序列的标准表示方法规则(Annexes I and II to the Decisionof the President of the EPO,published in Supplement No.2 to OJEPO,12/1992),符合37 C.F.R.1.821-1.825和Appendices A and B(Requirements for Application Disclosures ContainingNucleotides and/or Amino Acid Sequences)的规定,符合世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列表要求的规定(Rules 5.2 and 49.5(a-bis),and Section 208 and Annex Cof the Administrative Instructions)。所述序列说明包括表示核苷酸序列特征的单字母密码和表示氨基酸的三字母密码,其定义与描述于以下文献中的IUPAC-IYUB标准一致Nucleic Acids Research 133021-3030(1985)和Biochemical Journal 219(2)345-373(1984),以上文献被收作本文参考。
SEQ ID NO1是12.1kB的EcoRI-SalI片段,它包括从肺炎克雷伯氏菌ATCC 25955(Emptage等,WO 01/012833 A2)中分离的野生型GDH。野生型GDH是由α-亚基(bp 7044-8711),β-亚基(bp 8724-9308)和γ-亚基(bp 9311-9736)编码的。GDH的α,β和γ-亚基的氨基酸序列分别由SEQ ID NO2,SEQ ID NO3和SEQ ID NO4提供。
SEQ ID NOs5和6分别编码引物DHA-F1和DHA-R1,用于克隆来自质粒pGH20的GDH。
SEQ ID NO7编码反向引物DHA-R2,它被用于克隆GDH的完整的α-亚基和β-亚基的一部分。
SEQ ID NOs8-14分别编码引物pGD20RM-F1,pGD20RM-R1,TB4BF,TB4BR,pGD20RM-F2,pGD20RM-R2和GD-C,这些引物被用于α-亚基的区域性随机诱变。
SEQ ID NOs15-17分别编码简并引物pGD20RM-F3,TB4B-R1和pGD20RM-R4,这些引物被用于制备区域性随机突变体文库。
SEQ ID NO18编码位于融合蛋白Sma3002的α-和β-亚基之间的接头。SEQ ID NO19编码位于融合蛋白Xba3009的α-和β-亚基之间的接头。
SEQ ID NOs20-25分别编码引物2-F4-F1,2-F4-R1,12-B1-F1,12-B1-R1,16-H5-F1和16-H5-R1,这些引物被用于合成第二代突变体GDHs。
SEQ ID NOs26-29分别编码引物1-E1-F1,1-E1-R1,22-G7-F1和22-G7-R1,这些引物被用于制备纯的融合突变体1-E1和22-G7。
SEQ ID NOs30-39分别编码引物7A-C1-F1,7A-C1-R1,7C-A5-F1,7C-A5-R1,8-C9-F1,8-C9-R1,9-D7-F1,9-D7-R1,10-G6-F1和10-G6-R1,这些引物被用于合成Sma3002-衍生的突变体。
根据它们的相应的核酸序列和氨基酸序列将来自野生型GDH的突变型酶赋予以下SEQ ID Nos(表1)
表1完整长度的突变体GDHs以及它们各自的SEQ ID NOs
SEQ ID NOS340-342分别编码引物T53-SM,L509-SM和V224-SM。
SEQ ID Nos343和344分别编码引物GDHM-F1和GDHM-R1。
SEQ ID Nos345和346分别编码引物GDHM-F2和GDHM-R2。
发明详述本申请人通过以下方法解决了上述问题提供具有改善了的反应动力学的工程化的辅酶B12-依赖型脱水酶(即,在存在甘油和1,3-丙二醇的条件下提供较高的总转换数),以便用于工业用途,特别是用于生产3-羟基丙醛和1,3-丙二醇。这些通过诱变技术生产的脱水酶以相对于产生它的野生型酶而言具有提高的kcat和/或降低的酶失活的速率为特征。
本发明的工程化的辅酶B12-依赖型脱水酶能降低失活速率,而又不会过度牺牲催化速率。这种解决脱水酶失活问题的方案是优选的,因为它提高了微生物宿主中辅酶B12-依赖型脱水酶的转换率(摩尔产物/摩尔全酶)。提高了的转换率的作用减少对脱水酶的需求,对辅酶B12的需求,以及保持脱水酶和辅酶B12的水平的能耗。另外,业已证实了辅酶B12-依赖型脱水酶可用于在工业生产条件下有效生产1,3-丙二醇。
除了提供一套突变型脱水酶之外,本发明还提供了两种高通量测定,以便促进突变型脱水酶的筛选。这两种方法依赖于B12-依赖型脱水酶以它的脱辅基酶形式在细胞中的存在,这些细胞没有辅酶B12、脱水酶再激活因子或B12-依赖型脱水酶的来源。因此,可能根据辅酶B12和底物甘油的添加精确地控制脱水酶活性的启动。
具体地讲,制备了突变的辅酶B12-依赖型脱水酶基因的大型文库,并且以高通量形式表达和筛选在存在甘油和1,3-丙二醇混合物的情况下减少失活的基因产物。所述筛选方法能够方便快捷地鉴定具有降低的失活速率和提高的甘油催化速率的工程化的辅酶B12-依赖型脱水酶。随后几轮脱水酶工程改造,使得能够制备并且鉴定进一步改善了的脱水酶变体。
本领域技术人员可以看出的是,根据本文的教导,编码能够催化甘油向3-HP的转化的B12-依赖型脱水酶活性的多种基因,应该适合作为诱变和筛选的靶,正如在本发明中所描述的。因此,可以预料的是通过本发明能鉴定具有改善了的反应动力学(即,在存在甘油和1,3-丙二醇的条件下具有较高的总转换数)的突变型脱水酶。
定义以下缩写和定义被用于解释本说明书和权利要求书。
“聚合酶链反应”被缩写成PCR。
“3-羟基丙醛”被缩写成3-HP。
术语“脱水酶”被用于表示能够将甘油分子异构化或转化为产物3-羟基丙醛的任何酶。正如上文所指出的,某些脱水酶需要辅酶B12作为辅因子。术语“辅酶B12-依赖型脱水酶”和“B12-依赖型脱水酶”可以互换使用,表示那些需要辅酶B12的脱水酶。辅酶B12-依赖型脱水酶包括辅酶B12-依赖型脱水酶(E.C.4.2.1.30)和辅酶B12-依赖型脱水酶(E.C.4.2.1.28)。或者,脱水酶可以是辅酶B12-不依赖型的;这些酶不需要辅酶B12作为辅因子,并且被表示为术语“B12-不依赖型脱水酶”。对于本发明的目的来说,术语“甘油脱水酶”被专门用于表示辅酶B12-依赖型脱水酶(E.C.4.2.1.30),而术语“二醇脱水酶”被专门用于表示辅酶B12-依赖型脱水酶(E.C.4.2.1.28)。(申请人对名称的精心选择是为了不与以下文献中的名称混淆Hartmanis和Stadman,同上,和Crous等,同上,他们将B12-不依赖型脱水酶分别称作术语“二醇脱水酶”和“甘油脱水酶”。)术语“脱辅基酶”表示由蛋白组成的酶的部分。脱辅基酶不包括非蛋白结构,所述非蛋白结构可能是所述酶的功能所必需的;因此,脱辅基酶可能是无催化活性的。术语“辅因子”表示脱辅基酶的催化活性所必需的非蛋白结构。术语“全酶”表示催化活性的蛋白-辅因子复合物。辅酶B12-依赖型脱水酶脱辅基酶需要辅因子辅酶B12以便形成全酶。
术语“辅酶B12”和“腺苷钴胺素”可以互换使用,表示5′-脱氧腺苷钴胺素。
术语“维生素B12”和“氰钴胺素”可以互换使用,并且表示辅酶B12的衍生物,其中,上部轴向5′-脱氧-5′-腺苷配体被氰基部分所取代。
“羟钴胺素”表示辅酶B12的衍生物,其中,上部轴向5′-脱氧腺苷配体被羟基部分所取代。Aquacobalamin是羟钴胺素的质子化形式。
由甘油或1,3-丙二醇对B12-不依赖型脱水酶全酶产生的失活作用,导致了无活性的钴胺素种类的形成,这种钴胺素失去了上部轴向5′-脱氧-5′-腺苷配体。术语“辅酶B12前体”表示辅酶B12的衍生物,其中,上部轴向5′-脱氧腺苷配体被取代。
在本文中,术语“GDH”专门表示B12-依赖型甘油脱水酶,它是从肺炎克雷伯氏菌ATCC 25955中分离的,并且是由SEQ ID NO1的bp7044-8711,bp 8724-9308和bp 9311-9736编码的。术语“GDH”被用于表示α,β和γ-亚基组装的复合物,并且可以表示脱辅基酶或全酶。述及GDH的个别亚基时将指明该亚基,例如“GDH的α-亚基”或“GDHα-亚基”。类似地,也可以提到GDH的氨基酸序列,其中可统一地称为α,β和γ-亚基;或提到GDH的个别亚基。GDH的α,β和γ-亚基的氨基酸序列分别在SEQ ID NO2,SEQ ID NO3和SEQ ID NO4中提供。
对于本发明公开内容的目的来说,GDH被用作DNA和氨基酸序列的参考,与工程化的(突变型)衍生物进行比较。GDH还被用作野生型反应动力学的参考,相对于它测量通过本发明生产的工程化衍生物的反应动力学。尽管在本发明中GDH被用作参考材料,但在本发明中,任何天然存在的辅酶B12-依赖型脱水酶(例如,在表2中所列举的脱水酶)可以与GDH互换使用,相对于它测量工程化衍生物的反应动力学。
术语“遗传学改变的”表示通过转化或突变改变遗传材料的过程。
在本文中,术语“突变体”表示包括业已通过突变方法产生的GDH酶或GDH序列的细菌克隆,质粒,文库或载体。或者,术语突变体直接表示业已通过突变方法生成的GDH酶,GDH氨基酸序列或GDH DNA序列。因此,突变体GDH不同于(野生型)GDH。
术语“改善了的反应动力学”表示在存在甘油和/或1,3-丙二醇的条件下,相对野生型酶而言具有降低的脱水酶失活速率。因此,改善了的反应动力学与在存在甘油和1,3-丙二醇的条件下的较高的总的酶转换数相关。这可以通过提高kcat和/或降低酶失活的速率来实现。
术语“催化效率”被定义为酶的kcat/KM。“催化效率”被用于对酶对底物的特异性的定量。
术语“kcat”,“KM”和“Ki”为本领域技术人员所公知,并且描述于以下文献中(Ferst In Enzyme Structure and Mechanism,2nded.;W.H.FreemanNew York,1985;pp 98-120)。
术语“kcat”通常被称为“转换数”。术语“kcat”被定义为每个活性位点每个单位时间转化成产物的底物分子的最大数量,或每单位时间酶转换的次数。kcat=Vmax/[E],其中[E]是酶浓度(Ferst In EnzymeStructure and Mechanism,2nd ed.;W.H.FreemanNew York,1985;pp 98-120)。术语“总转换”和“总转换数”在本文中被用于表示通过B12-依赖型脱水酶全酶与甘油起反应(任选地在存在1,3-丙二醇的条件下)产生的产物的量,所述产物是在反应开始(T0)和全酶业已完全失活的时间点之间产生的。
术语“Ki”表示1,3-丙二醇的抑制常数。
术语“kinact obsd”表示在B12-依赖型脱水酶全酶和过量的甘油和/或过量的1,3-丙二醇反应中观察到的一级失活速率常数。在仅存在过量甘油的条件下,kinact obsd与kinact 甘油相等。在仅存在过量的1,3-丙二醇的条件下,kinact obsd与kinact 1, 3-丙二醇相等。在同时存在过量的甘油和过量的1,3-丙二醇的条件下,kinact obsd与kinact 甘油和kinact 1,3-丙二醇的函数相等。
术语“T1”表示通过GDH酶反应制备的产物量,该产物量是在存在10mM甘油和50mM1,3-丙二醇的条件下在反应开始之后30秒测量的。T1与kcat成比例。
术语“T2”表示通过GDH酶反应制备的产物量,该产物量是在存在10mM甘油和50mM 1,3-丙二醇的条件下在反应开始之后40分钟测量的。T2与kcat/kinact obsd成比例,体现了总的酶总转换数(total enzyme totalturnover number)。
术语“T2/T1比例”表示T2与T1的比例。T2/T1比例与1/kinact obsd成比例。
术语“T2(600)”表示通过GDH酶反应制备的产物量,该产物量是在存在10mM甘油和600mM 1,3-丙二醇的条件下在反应开始之后40分钟测量的。T2(600)与kcat/kinact obsd成比例,反应了在存在600mM 1,3-丙二醇的条件下的总的酶总转换数。
术语“T(600)”表示通过GDH酶反应制备的产物量,该产物量是在存在10mM甘油和600mM 1,3-丙二醇的条件下在反应开始之后70分钟测定的。T(600)与kcat/kinact obsd成比例。在存在600mM 1,3-丙二醇的条件下,T(600)值提供了比T2(600)更精确的总的酶总转换数。
术语“多肽”和“蛋白”可以互换使用。
术语“宿主细胞”或“宿主生物”表示能够接收外源或异源基因并且表达所述基因以便产生活性基因产物的微生物。
术语“分离的”表示与和它天然结合的至少一种成分分离的蛋白或DNA序列。
“分离的核酸分子”是单链或双链RNA或DNA聚合物,它任选地含有合成的,非天然的或改变了的核苷酸碱基。DNA聚合物形式的分离的核酸分子可以由cDNA,基因组DNA或合成的DNA的一个或多个片段组成。
“基因”表示能表达特定蛋白并且任选地包括位于编码序列前面(5′非编码序列)和后面(3′非编码序列)的调控序列的核酸片段。“天然基因”和“野生型基因”表示天然存在的具有它自身的调控序列的基因。“嵌合基因”表示不是天然基因的任何基因,其包括天然状态下不在一起的调控序列和编码序列。因此,嵌合基因可以包括来自不同来源的调控序列和编码序列,或来自相同来源的调控序列和编码序列,但是这些序列是以不同于天然状态的形式排列的。“内源基因”表示位于生物基因组中的天然位置上的天然基因。“外源”基因表示正常情况下不存在于宿主生物中的基因,但相反,它是通过基因转移导入宿主生物的。外源基因可以包括插入非天然生物的天然基因,或嵌合基因。“转基因”是业已通过转化方法导入基因组的基因。
术语编码(“encoding”和“coding”)表示一种过程,通过该过程基因通过转录和翻译机制产生了氨基酸序列。可以理解的是,编码特定氨基酸序列的过程包括可能涉及不会改变所编码的氨基酸的碱基改变的DNA序列,或涉及可能改变一个或多个氨基酸,但不会影响由所述DNA序列编码的蛋白的功能特性的碱基改变的DNA序列。因此,可以理解的是,本发明包括除了具体示例性序列以外的序列。
术语“氨基酸”表示蛋白或多肽的基本化学结构单位。通过氨基酸的单字母密码或三字母密码鉴定的氨基酸与在以下文献中描述的IUPAC-IYUB标准一致Nucleic Acids Research 133021-3030(1985)和Biochemical Journal 219(2)345-373(1984),以上文献被收作本文参考。
对于特定蛋白来说,在DNA编码区内的点取代突变以及所得到的氨基酸改变是用下列符号中的一种相对于标准DNA和氨基酸序列进行说明的。例如,对于GDH上的突变来说,所述突变是使用下面所描述的符号中的一种说明的1.详细符号首先,提供了野生型密码子的核苷酸序列;随后是“α”,“β”或“γ”符号(以便区分GDH的α-,β-或γ-亚基中的突变),三字母缩写的特定野生型氨基酸以及它的位置。所述野生型信息之后是存在于所提到的突变中的特定核苷酸和氨基酸修饰。这种符号的一种例子是GGG(α-Gly63)至GGA(Gly),其中α-亚基的63位密码子发生了沉默突变,使得突变体中的所述核苷酸序列从“GGG”改变成“GGA”。
2.“速记”符号“α”,“β”或“γ”符号(用于区分GDH的α-,β-或γ-亚基中的突变)的后面是单字母缩写的野生型氨基酸,密码子位置,以及突变型氨基酸的单字母缩写。该符号的一种例子是α-V224L,表示α-亚基上的224位密码子的野生型缬氨酸突变成突变体中的亮氨酸。本领域众所周知的是,导致在给定位点上产生化学上等同的氨基酸的基因上的改变(但是不会影响所编码蛋白的功能特性)是常见的。
“基本上相似”表示核酸分子,其中,一个或多个核苷酸碱基的改变导致了一个或多个氨基酸的取代,但是不会影响由所述DNA序列编码的蛋白的功能特性。“基本上相似”还表示核酸分子,其中,在一个或多个核苷酸碱基上的改变不会影响所述核酸分子通过反义或共抑制技术介导基因表达改变的能力。“基本上相似”还表示本发明核酸分子的修饰(如一个或多个核苷酸碱基的缺失或插入),这种改变不会明显影响所得到的转录物在通过反义或共抑制技术介导基因表达的改变或改变所得到的蛋白分子的功能特性方面的功能特性。本发明包括除了具体示例性序列以外的序列。
每一个建议的修饰都是本领域技术人员所熟悉的常规技术,所编码产物的生物学活性保留的确定也是如此。另外,技术人员了解本发明所包含的基本上相似的序列还可以通过它们在严格条件下(0.1X SSC,0.1%SDS,65℃,并且用2X SSC,0.1%SDS洗涤,然后用0.1X SSC,0.1%SDS洗涤)与本文所示例的序列杂交的能力限定。本发明的优选的基本上相似的核酸片段是这样的核酸片段,它的DNA序列与本文所报道的核酸片段的DNA序列至少80%相同。更优选的核酸片段是这样的核酸片段,它与本文所报道的核酸片段的DNA序列至少90%相同。最优选的是与本文所报道的核酸片段的DNA序列至少95%相同的核酸片段。
当一种核酸片段的单链形式能够在合适的温度和溶液离子强度条件下与其他核酸片段退火时,所述核酸片段就能够与另一个核酸片段“杂交”,如cDNA,基因组DNA或RNA。杂交和洗涤条件是众所周知的并且示例于以下文献中Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular CloningA Laboratory Manual,2nd ed.,Cold Spring HarborLaboratoryCold Spring Harbor,NY(1989),特别是其中的Chapter11和Table 11.1。
“基本部分”表示氨基酸或核苷酸序列,它包括有关多肽的足够的氨基酸序列或基因足够的核苷酸序列,以便提供对多肽或基因的推测性鉴定,这通过本领域技术人员对所述序列进行人工评估或通过计算机自动化序列比较和鉴定使用诸如BLAST的算法来实现(Basic LocalAlignment Search Tool;Altschul等,J.Mol.Biol.215403-410(1993);还可参见www.ncbi.nlm.nih.gov/BLAST/)。一般,为了推测性鉴定多肽或核酸序列与已知蛋白或基因同源,需要10个或10个以上邻接的氨基酸或30个或30个以上核苷酸的序列。另外,就核苷酸序列而言,可以将包括20-30个邻接的核苷酸的基因特异性寡核苷酸探针用于基因鉴定(例如,DNA印迹杂交)和分离(例如,细菌菌落或噬菌斑的原位杂交)的序列依赖型方法。另外,可以将具有12-15个碱基的短的寡核苷酸用作PCR的扩增引物,以便获得包括所述引物的特定核酸分子。因此,核苷酸序列的“基本部分”包括足够的序列,以便提供对包括所述序列的核酸分子的特定鉴定和/或分离。本说明书教导了部分或完整的氨基酸序列以及编码一种或多种特定蛋白的核苷酸序列。本领域技术人员利用本文所报道的序列,可以将所公开序列的全部或主要部分用于本领域技术人员所公知的目的。因此,本发明包括在所附序列表中所报道的完整序列,以及上文所定义的那些序列的基本部分。
术语“互补的”表示双链DNA之间的关系。例如,对于DNA来说,腺苷互补于胸腺嘧啶,而胞嘧啶互补于鸟嘌呤。因此,本发明还包括分离的核酸分子,它互补于在所附序列表中所报道的完整序列,以及基本上相似的核酸序列。
正如本领域所公知的,术语“百分比同一性”是两种或两种以上多肽序列或两种或两种以上多核苷酸序列之间的关系,如通过比较所述序列所确定的。在本领域中,“同一性”还表示多肽或多核苷酸序列之间的序列相关程度,根据具体情况,正如可以通过所述序列的串之间的匹配所决定的。“同一性”和“相似性”可以通过已知方法方便地计算,包括,但不局限于描述于以下文献中的方法1.)Computational MolecularBiology;Lesk,A.M.,Ed.;Oxford UniversityNew York,1988;2.)BiocomputingInformatics and Genome Projects;Smith,D.W.,Ed.;AcademicNewYork,1993;3.)Computer Analysis of SequenceData,PartI;Griffin,A.M.和Griffin,H.G.,Eds.;HumanaNewJersey,1994;4.)Sequence Analysis in Molecular Biology;vonHeinje,G.,Ed.;AcademicNew York,1987;和5.)Sequence analysisPrimer,Gribskov,M.和Devereux,J.,Eds.;StocktonNew York,1991。设计了用于测定同一性的优选方法,以便提供测试序列之间的最大的匹配。
用于测定同一性和相似性的方法被编制成可公开获得的计算机程序。用于测定两种序列之间的同一性和相似性的优选的计算机程序方法包括,但不局限于在GCG程序包中提供的GCG Pileup程序,其使用Needleman和Wunsch算法,采用它们的标准默认值,缺口生成罚分(gapcreation penalty)=12,缺口延伸罚分(gap extension penalty)=4(Devereux等人,Nucleic Acids Res.12387-395(1984)),BLASTP,BLASTN和FASTA(Pearson等,Proc.Natl.Acad.Sci.USA 852444-2448(1988))。BLASTX程序可以从NCBI和其他来源公开获得(BLASTManual,Altschul等,Natl.Cent.Biotechnol.Inf.,Natl.LibraryMed.(NCBI NLM)NIH,Bethesda,MD;Altschul等,J.Mol.Biol.215403-410(1990);Altschul等,Nucleic Acids Res.253389-3402(1997))。用于确定百分比同一性的另一种优选方法是通过DNASTAR蛋白比对方案的方法,该方法使用了Jotun-Hein算法(Hein等,MethodsEnzymol.183626-645(1990))。用于比对的Jotun-Hein方法的默认参数是1.)对于多重比对来说缺口罚分=11,缺口长度罚分=3;和2.)对于成对比对来说ktuple=6。作为一种解释,具有与参考核苷酸序列至少,例如,95%“同一性”的核苷酸序列的多核苷酸被认为是所述多核苷酸的核苷酸序列与所述参考序列相同,所不同的是,所述多核苷酸序列可能包括在参考核苷酸序列的每100个核苷酸的最多5个点突变。换句话说,为了获得具有与参考核苷酸序列至少95%同一性的核苷酸序列的多核苷酸,所述参考序列中的最多5%的核苷酸可以缺失或者用另一种核苷酸取代,或者可以将参考序列的所有核苷酸的最多5%的核苷酸插入所述参考序列。参考序列上的这些突变可能出现在参考核苷酸序列的5′或3′末端位置,或位于所述末端位置之间的任何地方,单独分散在参考序列的核苷酸之间或分布在参考序列中的一个或多个邻接组中。类似地,具有与参考氨基酸序列至少,例如,95%同一性的氨基酸序列的多肽被认为所述多肽的氨基酸序列是与所述参考序列相同的,所不同的是,所述多肽序列可能包括所述参考氨基酸的每100个氨基酸的最多5个氨基酸的改变。换句话说,为了获得具有与参考氨基酸序列至少95%相同的氨基酸序列的多肽,所述参考序列中的最多5%的氨基酸残基可以缺失或用另一种氨基酸取代,或可以将参考序列中的总氨基酸残基的最多5%的氨基酸插入所述参考序列。所述参考序列的这些改变可以发生在参考氨基酸序列的氨基或羧基末端位置,或位于所述末端位置之间的任何位置,单独分散在参考序列的残基之间或分布在参考序列中的一个或多个邻接组之中。
术语“同源的”表示给定宿主细胞天然的或天然存在的蛋白或多肽。本发明包括能通过重组DNA技术产生同源蛋白的微生物。
术语“百分比同源性”表示多肽之间的氨基酸序列同一性的程度。当第一种氨基酸序列与第二种氨基酸序列相同时,所述第一和第二种氨基酸序列具有100%的同源性。任何两种多肽之间的同源性是在任一序列给定位置上匹配的氨基酸的总数的直接函数,例如,如果在两种序列任一个的氨基酸总数的一半是相同的话,这两种序列就被说成具有50%同源性。
“密码子简并性”表示遗传密码中允许核苷酸序列改变,而又不影响所编码多肽的氨基酸序列的趋异。技术人员熟知在用核苷酸密码子表述给定氨基酸时由特定宿主细胞所表现出来的“密码子偏倚”。
还预期序列的修饰,如序列中的缺失,插入或取代,这些修饰能产生沉默改变,这种改变不会明显影响所得到的蛋白分子的功能特性。例如,预期基因序列上的改变,这种改变体现了遗传密码的简并性,或导致了在给定位点上化学等同的氨基酸的产生。在某些场合下,可能实际上需要制备序列的突变体,以便研究有关改变对所述蛋白的生物学活性的影响。所建议的每一种修饰都是本领域技术人员所熟悉的,确定在所编码的产物中保留的生物学活性也是如此。
术语“表达”表示由编码基因产物的序列的基因转录并且翻译为所述基因产物。
术语“质粒”,“载体”和“盒”表示染色体外元件,通常携带有不是细胞中心代谢的一部分的基因,并且通常是环状双链DNA分子形式的。所述元件可以是自主复制序列,基因组整合序列,噬菌体或核苷酸序列,线性的或环状的单链或双链DNA或RNA,其来自任何来源,其中的多个核苷酸序列业已连接或重组成独特结构,这种结构能够将启动子片段和编码选择的基因产物的DNA序列连同合适的3′非翻译序列导入细胞。“转化盒”表示特定载体,其包括外源基因,并且除了所述外源基因之外还具有能促进特定宿主细胞转化的元件。“表达盒”表示特定载体,其包括外源基因,并且除了所述外源基因之外还具有能增强该基因在外源宿主中表达的元件。
术语“重组”表示形成在亲本模板分子中不存在的遗传组合的过程,这是通过交换或自由组合过程实现的。因此,重组包括可以由亲本模板分子获得的遗传序列的所有组合(以便新产生的“重组产物”的每一个核苷酸位置能够由特定核苷酸位置上的任何亲本模板产生);此外,重组包括导入新的突变(即,缺失,取代,插入)。
术语“重组多肽”表示由重组基因或DNA编码的多肽。重组多肽通常具有改变了的或增强了的特性。
术语“改变了的特性”在用于多肽或蛋白时,表示可以通过测定方法测量的与由核苷酸序列编码的蛋白相关的特征,其中,所述特征与和天然序列相关的特征相比增强了或减弱了。可以改变的酶的优选特性的例子包括酶的活性,底物特异性,针对抑制剂的稳定性,热稳定性,蛋白酶稳定性,溶剂稳定性,去污剂稳定性,以及折叠特性。“增强了的生物学特性”表示比与天然序列相关的特性更强的改变了的特性。“减弱了的生物学特性”是比与天然序列相关的特性更弱的改变了的特性。
术语“模板”或“亲本模板”表示由DNA或RNA聚合酶按照沃森-克里克(Watson-Crick)碱基配对规则拷贝的核酸分子,以便产生新的DNA或RNA链。保留了所述模板(或“模型”)中的序列信息,因为由模板分子产生的第一个拷贝具有互补序列。模板分子可以是单链或双链的,并且可来自任何来源。
“复制”是“模板核酸”的核酸链的互补拷贝通过聚合酶合成的过程。在“引物-指导的”复制中,该过程需要位于“双链”“寡核苷酸”的末端核苷酸的(脱氧)核糖部分的3′位置的羟基(OH)来启动复制。
可以将核酸的“5′区”和“3′区”用作关于期望进行重组的核苷酸区的相对术语。这些区可以位于模板分子内或位于与模板分子连接的侧翼DNA序列中。不配对的引物能够与所述5′和3′区的一部分退火。
“侧翼序列”或“侧翼DNA片段”表示与模板分子的5′或3’区连接的DNA的短的片段,以便提供不配对的引物可以与它退火的独特的核苷酸序列(相对模板分子而言)。
“全长延伸产物”是通过引物指导的复制产生的核苷酸序列,它的长度与在亲本模板的5′和3’区之间所包含的部分的长度非常类似(大约100个碱基以内)。
“扩增”是以循环方式重复进行复制的过程,以便“模板核酸”的拷贝数以线性或对数形式增加。
术语“引物”表示寡核苷酸(合成的或天然存在的),它能够起着在通过聚合酶催化互补链合成的条件下沿互补链的核酸合成或复制的起点的作用。所述引物必须具有与互补链退火的能力,这种能力是基于引物本身和核酸的互补链之间的序列互补性,不过,某些碱基错配是可以耐受的。在下面将对引物大小,碱基序列,互补性和目标相互作用的要求作更详细的讨论。同样,术语“引物”在本文中被申请人一般性地使用,包括任何结合序列的寡核苷酸,它起着启动核酸复制过程的作用(即,能够引发合成)。
术语“正向引物”表示能够在双链模板分子的有义链的5’区引发合成的引物,或能够在单链模板分子的5’区引发合成的引物。
术语“反向引物”表示能够在双链模板分子的反义链的5’区引发合成或者能够在单链模板分子的5’区引发合成的引物,该单链模板分子是双链模板分子的反义链。
术语“配对的引物”表示一对引物,由正向和反向引物组成,它被设计成与一个模板分子退火,并且能够通过引物指导的核酸扩增过程合成所述模板的精确拷贝。对于双链模板分子来说,正向和反向引物能够合成双链模板的精确拷贝,因为所述正向引物产生了反义链的精确拷贝(它是用作模板的有义链的互补拷贝),而所述反向引物产生了有义链的精确拷贝(它是用作模板的反义链的互补拷贝)。相反,当模板分子是单链时,采用引物指导的核酸扩增过程产生了所述模板的精确拷贝。
术语“不配对的引物”表示由正向和反向引物组成的一对引物,它们没有被设计成能与一个模板分子退火,并且通过引物指导的核酸扩增过程合成所述模板的精确拷贝。相反,所述正向引物能够与第一模板分子退火,而不能与第二模板分子退火。反向引物能够与在序列上与第一模板分子不同的第二模板分子退火,并且仍然不能与第一模板分子退火。不配对的引物的这种独特设计确保单链或双链模板分子不能通过引物指导的核酸扩增过程扩增,除非在复制期间通过模板转换发生了重组。
术语“引物指导的延伸”表示本领域所公知的任何方法,其中,引物被用于在核酸分子的线性或对数扩增中启动核酸序列的复制。例如,引物指导的延伸可以通过本领域已知的若干方案中的任意一种实现,包括,但不局限于聚合酶链反应(PCR),连接酶链反应(LCR)和链置换扩增(SDA)。
GDH和编码基因对于甘油向3-HP的转化来说,负责催化该反应的脱水酶可以是B12-依赖型脱水酶或B12-不依赖型脱水酶。不过,对于本发明的目的来说,所述脱水酶是B12-依赖型脱水酶。这种B12-依赖型脱水酶可以是GDH,即甘油脱水酶(E.C.4.2.1.30),或二醇脱水酶(E.C.4.2.1.28)。上述每一种酶都具有α2β2γ2结构。为了清楚起见,由于在文献中使用了各种不同的基因名称,在表2中提供了表示肺炎克雷伯氏菌,弗氏柠檬酸杆菌,巴氏梭菌,鼠伤寒沙门氏菌,丘状菌落乳杆菌和产酸克雷伯氏菌的脱水酶基因的基因名称和GeneBank编号的比较表,以便于辨别。所述基因还描述于以下文献中,例如,Daniel等(FEMS Microbiol.Rev.22553(1999))和Toraya和Mori(J.Biol.Chem.2743372(1999))。
表2脱水酶的基因名称和GenBank编号的比较表
对于本发明的目的来说,将由肺炎克雷伯氏菌(WO01/012833A2)的dhaB1,dhaB2和dhaB3编码的GDH(分别为SEQ ID NO1和SEQ ID NO2,3和4)用作诱变的靶。这种酶是一种甘油脱水酶,具有甘油的优选底物,并且已知由两个63kDa的α亚基,两个21kDa的β亚基和两个16kDa的γ亚基组成。不过,本领域技术人员可以了解的是,弗氏柠檬酸杆菌,巴氏梭菌或其他肺炎克雷伯氏菌菌株的甘油脱水酶;或鼠伤寒沙门氏菌,产酸克雷伯氏菌或肺炎克雷伯氏菌的二醇脱水酶也适合本文所描述的技术。类似的,编码B12-依赖型脱水酶活性的,其中所述活性能够催化甘油向3-HP转化的任何基因都适合作为本发明的靶,包括含有不改变GDH酶的功能的氨基酸取代,缺失或添加的任何氨基酸序列。因此,本领域技术人员可以了解的是,从其他来源分离的编码GDH的基因也适用于本发明。
在存在甘油或1,3-丙二醇条件下的B12-依赖型脱水酶失活催化期间通过甘油或通过与1,3-丙二醇相互作用使B12-依赖型脱水酶发生了不可逆的失活。失活涉及辅酶B12辅因子的钴-碳(Co-C)键的裂解,导致了5′-脱氧腺苷和无活性的钴胺素种类的形成。所述无活性的钴胺素种类保持与脱水酶紧密结合;在没有辅酶B12-依赖型脱水酶再激活因子干预的情况下不会发生解离。
图1表示与GDH失活相关的一般时程。所述酶活性测定是使用由肺炎克雷伯氏菌(WO01/012833A2)的dhaB1,dhaB2和dhaB3编码的GDH(分别为SEQ ID NO1和SEQ ID NO2,3和4)进行的。图1中的上部轨迹表示用10mM甘油(Km大约0.5mM)作底物的GDH反应的时程,而下部轨迹表示在测定中包括50mM 1,3-丙二醇(Ki大约15mM)的效果。很显然,根据一级失活速率常数(kinact obsd),随着失活的发生,3-HP产物形成的速率随时间推移迅速减少。
具有改进了的活性的突变体GDH根据观察到的GDH失活,制备了相对于野生型GDH而言具有降低了的失活速率的一系列突变体GDHs。通常,所述方法涉及制备和分离在存在甘油和1,3-丙二醇的条件下具有提高的总转换数的突变型酶。这可以通过提高kcat和/或降低酶失活的速率实现。
提高GDH活性的方法涉及包括GDH基因的表达载体的构建,GDH编码序列的诱变,以及具有降低的失活速率的变体的最终分离。随后几轮诱变使得GDH编码序列能够进化。
可以用任何野生型(或基本上相似)的B12-依赖型脱水酶作为诱变的原材料制备突变型B12-依赖型脱水酶文库。
B12-依赖型脱水酶诱变的传统方法可以将多种方法用于B12-依赖型脱水酶的诱变。本发明所使用的两种合适方法包括易错PCR(Leung等,Techniques,111-15(1989);Zhou等,Nucleic Acids Res.196052-6052(1991);和Spee等,NucleicAcids Res.21777-778(1993))和体内诱变。
易错PCR的主要优点是通过该方法导入的所有突变都在B12-依赖型脱水酶基因上,并且任何改变都可以通过改变PCR条件方便地控制。或者,可以采用体内诱变,其中使用可通过商业渠道获得的材料,如大肠杆菌XL1-Red菌株和Epicurian coli XL1-Red突变菌株,这些菌株来自Stratagene(La Jolla,CA;还可参见Greener和Callahan,Strategies732-34(1994))。该菌株在三个主要DNA修复途径中是缺陷型的(mutS,mutD和mutT),导致了突变率比野生型提高了5000倍。体内诱变不依赖于连接效率(与易错PCR类似);不过,突变可以在载体的任何区域发生,并且突变率通常更低。
或者,预期可以使用“基因改组(shuffling)”方法(US 5,605,793;US 5,811,238;US 5,830,721和US 5,837,458)或促进核酸之间的重组源活性的任何类似方法构建具有降低的失活速率的突变型B12-依赖型脱水酶。这种基因改组方法由于它便于实施和高的诱变率而特别有吸引力。所述基因改组方法涉及在存在与感兴趣的基因相似(或不同)的DNA区的额外群体的条件下将感兴趣的基因限制成特定大小的片段。然后对该片段库进行变性,并且重新退火,以便产生突变的基因。然后筛选具有改变了的活性的突变基因。
野生型B12-依赖型脱水酶序列可以通过该方法突变并筛选改变了的或增强了的活性。所述序列应当是双链,并且可以具有从50bp到10kB的各种长度。可以使用本领域所熟知的限制性内切核酸酶将所述序列随机消化成大约10bp-1000bp的片段(Maniatis,同上)。除了全长序列之外,还可以添加能够与所述序列的全部(或部分)杂交的片段群体。类似的,还可以添加不能与野生型序列杂交的片段群体。通常,所述额外的片段群体是以与总核酸相比按重量计算超出10倍至20倍的量添加的。一般来说,该方法可以在混合物中产生大约100-1000个不同的特定核酸片段。对所述随机核酸片段的混合群体进行变性,以便形成单链核酸片段并且然后重新退火。只有那些具有与其他单链核酸片段同源的区域的单链核酸片段能够重新退火。可以通过加热使所述随机核酸片段变性。本领域技术人员可以确定使双链核酸完全变性所需要的条件。所述温度优选为大约80℃-100℃。可以通过冷却使所述核酸片段重新退火。所述温度优选为大约20℃-75℃。通过添加聚乙二醇(“PEG”)或盐可以加快复性。盐的浓度优选为0mM-200mM。然后在存在核酸聚合酶和dNTP′s(即,dATP,dCTP,dGTP和dTTP)的条件下温育退火的核酸片段。所述核酸聚合酶可以是克列诺(Klenow)片段,Taq聚合酶或本领域已知的任何其他DNA聚合酶。可以在退火之前、在退火同时或在退火之后将所述聚合酶添加到随机核酸片段中。将在存在聚合酶的条件下进行的变性,复性和温育的循环重复需要的次数。优选将所述循环重复2-50次,更优选将所述循环重复10-40次。所得到的核酸是长度为大约50bp-大约100kB的较大的双链多核苷酸,并且可以通过标准克隆和表达方法筛选表达和改变的活性(Maniatis,同上)。
除了上述示例的方法之外(这些方法被设计成直接诱变编码B12-依赖型脱水酶的基因),还可以将制备突变体的传统方法用于本文所描述的目的。例如,可以让具有B12-依赖型脱水酶活性的野生型细胞接触多种试剂,如辐射或化学诱变剂,然后筛选需要的表型。在通过辐射产生突变时,紫外线(UV)或电离辐射都可以使用。用于遗传突变的合适的短波UV波长在200nm-300nm范围内,其中254nm是优选的。在该波长下的UV辐射主要会导致核酸序列中的从胍和胞嘧啶到腺嘌呤和胸苷的改变。由于所有细胞都具备DNA修复机制,这种机制能够修复大部分UV诱导的突变,所以可以添加诸如咖啡因和其他抑制剂的试剂,以便阻断所述修复过程,并且使有效突变的数量最大化。使用波长为300nm-400nm的长波UV突变也是可行的;不过,该范围通常不如短波UV光有效,除非与各种能与DNA相互作用的激活剂(如补骨脂素染料)组合使用。类似的,用化学试剂进行的诱变也能有效产生突变体,并且常用的物质包括能影响非复制DNA的化学制剂(如HNO2和NH2OH),以及能影响复制中的DNA的试剂(如吖啶染料,主要是导致移码突变)。使用辐射或化学试剂制备突变体的具体方法在现有技术中有大量报道。参见例如,ThomasD.Brock in BiotechnologyA Textbook of Industrial Microbiology,2nded.;Sinauer AssociatesSunderland,MA(1989);或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.36227(1992)。
无论采用什么样的诱变方法,基因都可能发生进化,以便所述酶在存在甘油和1,3-丙二醇的条件下具有提高的总转换数。这一目的可以通过提高kcat和/或降低酶失活的速率而实现。
通过重组源延伸方法使用不配对的引物诱变B12-依赖型脱水酶图5表示使用不配对的引物的重组源延伸方法的原理,该方法基于两个基因之间的重组。该方法需要亲本基因在其5′和3′末端具有不同的DNA序列。如果亲本基因具有相同的5′和3′序列的话,则必须通过标准PCR将短的侧翼DNA片段连接在所述基因的5′或3′末端(如图5的步骤A所示)。
然后,可以将所述PCR产物用作重组源延伸方法的模板,之前设计用于热循环的两种不配对的引物。引物-1能与模板-1的5’末端退火,但是不能与模板-2的5’末端结合。引物-2能与模板-2的3’末端退火,但是不能与模板-1的3’末端结合(步骤B)。由此确保了任意一个亲本模板都不能通过热循环反应扩增。
进行了短的退火和合成循环,以便制备一系列短的DNA片段(步骤C)。在具有足够同源性的情况下,上述某些DNA片段在随后的退火循环(步骤D)中能够与不同的模板退火(即,“模板转换”)。然后,可以按图5所示制备重组DNA片段。最终,可以制备具有模板-1的5’末端和模板-2的3’末端的重组DNA基因(步骤E)。
此时,以前不配对的引物-1和引物-2变成新产生的重组基因的配对的引物。进一步的退火和合成循环能扩增具有模板1的5’末端和模板-2的3’末端的重组DNA基因的库(图5的步骤F)。在所述扩增步骤中,所述重组DNA基因还可以重组,这能够增加重组DNA基因交换的数目。理论上讲,所有扩增的产物都应当是重组DNA产物。所述重组产物可以是由亲本模板分子直接衍生的,或可以将额外的突变(例如,插入,缺失和取代)整合到最终的重组源产物中。亲本模板在最终反应混合物中的污染作用是可以忽略的。
有关这种方法的细节公开于被收作本文参考的U.S.0/374366中。
鉴定具有改善了的动力学性能的B12-依赖型脱水酶变体为了鉴定具有改善了的动力学性能的B12-依赖型脱水酶变体(从大的群体中鉴定),高通量测定方法的开发能大大促进筛选。本文公开了一种简单的筛选方法,该方法依赖于两种测量,以便提供对脱水酶变体相对于标准物(例如,野生型GDH)的kcat和/或总转换数改善的评估。具体地讲,GDH突变基因文库通过标准方法克隆到大肠杆菌中,以便进行GDH表达,获得分离物,并且在Lennox Broth中生长,透化,并且测定GDH活性。尽管所述筛选方法是针对完整细胞中所含GDH进行说明的,但技术人员可以了解的是,所述方法可方便地进行修饰,以便可应用于粗制或纯化制剂中的酶。
本发明所开发的GDH测定依赖于GDH酶以它的脱辅基酶形式在不具有辅酶B12,脱水酶再激活因子或B12-依赖型脱水酶的来源的细胞中的存在。具有催化活性的GDH全酶只能在向培养基中添加辅酶B12时形成。因此,通过添加辅酶B12和底物甘油,能够以很高的精度有效“开启”GDH反应。这样能够精确控制GDH活性的持续时间(计时),并因此控制GDH活性测量的精确性。所述反应是在零时间(时间=t0)开始的,并且测定在所述反应开始阶段形成的产物(在紧接t0之后和之后和发生酶失活之前,时间=t1)。另外,产物形成是在较长时间内测定的(紧接t0之后一直到酶失活完成,时间=t2)。产物(3-HP)形成的测定是基于比色醛测定的(Zurek G.,和U.Karst.Analytica Chimica Acta,351247-257(1997))。
对于GDH来说,在存在饱和辅酶B12和甘油浓度的条件下,随着时间推移产生的3-HP的量(y)是通过下式估算的y=T0+AMP(1-exp(-kinact obsd*时间)),其中T0是在t0处的3-HP的量(背景),AMP是在t0和GDH完全失活之间产生的3-HP的量(总转换数),而kinact obsd是观察到的一级失活速率常数。由于不存在1,3-丙二醇,所以kinact obsd完全是由kinact 甘油导致的(由甘油造成的一级失活速率常数)(参见图1的上部轨迹。AMP=[GDH]*kcat/kinact obsd)。将该时程用于建立固定浓度的GDH,辅酶B12和甘油的合适的时间(t1和t2)。在校正T0之后,将在t1处形成的产物的量(T1,在酶失活发生之前)用于评估[GDH]*kcat;并且将在t2处形成的产物(T2,酶失活完成之后)用于评估总转换数和[GDH]*kcat/kinact obsd。因此,T1值与kcat成正比,T2值与kcat/kinact obsd成正比,而T2/T1得出了1/kinact obsd。
在对固定浓度的野生型GDH,辅酶B12和甘油确定了适当时间(t1和t2)之后(在没有1,3-丙二醇的条件下),在相同的测定条件下重新测定了T1和T2值,不过,添加了1,3-丙二醇(图1,下部轨迹)。在存在甘油和1,3-丙二醇的条件下,发生了竞争性抑制作用;并且,kinact obsd是kgly(由于甘油造成的一级失活速率常数)和k1,3-丙二醇(由于1,3-丙二醇造成的一级失活速率常数)的函数。在合适的1,3-丙二醇浓度下,T1值相对于在没有1,3-丙二醇的条件下的值有可测量的降低(体现了1,3-丙二醇和甘油的竞争性抑制作用),并且T2值相对于在没有1,3-丙二醇的条件下的值大大降低了(体现了k1,3-丙二醇>kgly这一事实)。对于两点测定来说,甘油存在的浓度为5-50mM,优选10mM;并且1,3-丙二醇存在的浓度为10-300mM,优选50mM。
申请人业已建立了在存在甘油和1,3-丙二醇的条件下检查野生型GDH对突变型变体的条件。在微观水平上,向GDH中导入突变可能影响kcat,所述酶对甘油和/或1,3-丙二醇的亲和力,以及相应的kinact值。尽管最初无法确保所述亲和力和速率常数是彼此独立地改变的,但考虑所述参数的变化如何能够影响在存在10mM甘油和50mM1,3-丙二醇的条件下进行的两点(T1和T2)测定的结果是有用的。具体地讲,缓慢失活(kinact obsd的降低)导致了T2/T1比例的增加。另一方面,T1或T2的改变可能是由于所述酶的内在特性改变所导致的。例如,在给定对甘油和1,3-丙二醇的恒定相对亲和力的条件下,如果kcat和kinact值成比例地降低的话,那么T2/T1将会增加,不过T1会较低。另一方面,能与甘油正常的相互作用,不过,对1,3-丙二醇具有降低的相对亲和力,或对1,3-丙二醇失活具有更低的速率常数的突变体会表现出大致正常的T1,提高的T2和更高的T2/T1比例。具有正常的甘油和1,3-丙二醇亲和力,但是对上述化合物都具有降低的kinact的突变体同样表现出正常的T1,但是具有提高的T2和T2/T1比例。不会导致kinact或底物或1,3-丙二醇亲和力的改变的kcat的增加,能够提高T1和T2,但是不能提高T2/T1比例。尽管上面描述了多种改变,不过,本发明研究工作的最终目的是在存在甘油和1,3-丙二醇的条件下提高GDH酶的总转换数。这可以通过提高kcat和/或降低酶失活的速率实现。因此,与野生型相比,表现出选自下列的至少一种改进的突变体被认为具有改善了的特征更高的T1和/或更高的T2和/或更高的T2/T1值,或上述参数的任意组合。
当与1,3-丙二醇浓度相比甘油的浓度较小时,不可能测量T1(以便评估kcat),因此通过1,3-丙二醇发生了显著失活。这种条件是相关的,因为高的1,3-丙二醇浓度和低的甘油浓度是生产1,3-丙二醇的过程所需要的。考虑到所述问题的这一方面,提供了上文所述的单点测定,所不同的是甘油是以xx至yymM的浓度提供的,优选10mM;而1,3-丙二醇是以超过300mM的浓度,优选600mM的浓度提供的。在该单点测定中,所述时间用tend表示,而所产生的3-HP的量用T(XXX)表示,其中,XXX是1,3-丙二醇的浓度(mM)。
影响辅酶B12失活的关键氨基酸的鉴定申请人描述了多种突变型GDH酶,所述酶与野生型基因相比,具有降低了的辅酶B12失活速率。所述突变体是采用上文所述的诱变和筛选方法鉴定的。所述突变体,改变了的氨基酸残基,1/kinact obsd活性(以T2/T1形式测量)以及T2总结在表1中。在表格的第一栏中提供了所述酶的DNA序列的SEQ ID NO。
表3GDH突变体总结,以T2/T1为特征
在下面的表4中总结了同样用上文所描述的诱变和筛选方法鉴定的其他突变体。该表格提供了有关每一种突变体,改变了的氨基酸残基和T(600)活性的信息。在该表格的第一栏中提供了所述酶的DNA序列的SEQ ID NO。
表4GDH突变体的总结,以T(600)为特征
上面所公开的多种突变型GDH酶具有降低的辅酶B12失活速率。本发明的优选的突变体包括SEQ ID NOs40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,143,147,151,155,159,163,167,171,175,179,182,186,189,192,195,198,201,204,208,212,215,218,221,225,229,233,237,241,245,249,253,257,261,265,269,273,277,281,285,289,293,297,301,304,307,310,313,316,319,322,325,328,331,334和337。本发明的更优选的突变体是SEQ ID NOs140,179,186,189,192,195,198,201,212,215,218,301,304,307,310,313,316,319,322,325,328,331,334和337。本发明的最优选的突变体是SEQ ID NOs313,322和328。
除了上述突变体之外,还可以合成具有改善了的反应动力学的大型突变体库,每一种突变体还具有在表2和3中所列举的突变的一些组合。例如,具有多点突变的突变体GDH上的每一种突变可以针对改善所述酶的总体反应动力学的理想作用进行评估。如果需要的话,不能增强反应动力学的任何突变都能够恢复成野生型序列。同样,上文所列举的只具有单点突变的GDH突变体可以与上文所公开的另一种突变组合,以便进一步提高所述酶的活性。申请人公开了GDH酶中的以下有用的突变,这些突变以多种组合形式用于生产其他突变型GDH酶,这些酶与野生型基因相比具有降低的辅酶B12失活速率。这些突变包括1.在α-亚基中TCA(α-Ser41)至TCG(Ser);GTG(α-Val44)至GCG(Ala);GTG(α-Val44)至GAG(Glu);GGT(α-Gly47)至GGC(Gly);CAG(α-Gln59)至CGG(Arg);ATG(α-Met62)至GTG(Val);ATG(α-Met62)至ACG(Thr);ATG(α-Met62)至CTG(Leu);ATC(α-Ile63)至GTC(Val);GGG(α-Gly63)至GGA(Gly);CGA(α-Arg65)至CAA(Gln);ATC(α-Ile67)至GTC(Val);TAC(α-Tyr70)至AAC(Asn);GTT(α-Val74)至GTC(Val);GTT(α-Val74)至ATT(Ile);ACG(α-Thr77)至GCG(Ala);GTG(α-Val86)至GAG(Glu);CAC(α-His96)至CAT(His);ATC(α-Ile102)至ACC(Thr);ATC(α-Ile102)至GTC(Val);ATC(α-Ile105)至ATT(Ile);GTC(α-Val115)至GCC(Ala);GAG(α-Glu116)至GAA(Glu);GCG(α-Ala119)至ACG(Thr);GTG(α-Val124)至GCG(Ala);CGT(α-Arg134)至CGC(Arg);CGG(α-Arg137)至AGG(Arg);AAC(α-Asn141)至ATC(Ile);TGC(α-Cys143)至TGT(Cys);CTC(α-Leu148)至CGC(Arg);AAA(α-Lys149)至AGA(Arg);AAA(α-Lys149)至CAA(Gln);GAT(α-Asp150)至CAT(His);GAT(α-Asp150)至GAC(Asp);AAT(α-Asn151)至AAC(Asn);CCG(α-Pro152)至CCC(Pro);TCA(α-Ser168)至CCA(Pro);TGC(α-Cys193)至AGC(Ser);GAG(α-Glu209)至GAA(Glu);ATG(α-Met214)至TTG(Leu);GGC(α-Gly216)至GGG(Gly);TTA(α-Leu217)至GTA(Val);AGC(α-Ser219)至AAC(Asn);GTG(α-Val224)至CTG(Leu);GTG(α-Val224)至ATG(Met);GTG(α-Val224)至TTG(Leu);GTC(α-Val226)至GCC(Ala);GCG(α-Ala231)至ACG(Thr);TTT(α-Phe233)至CTT(Leu);GGC(αGly236)至AGC(Ser);GAG(α-Glu240)至GAA(Glu);CAG(α-Gln242)至CAA(Gln);ATG(α-Met257)至GTG(Val);ATG(α-Met257)至ACG(Thr);CTG(α-Leu268)至CTA(Leu);TAT(α-Tyr271)至TGT(Cys);ACT(α-Asn288)至ACC(Asn); GTG(α-Val301)至GTA(Val);ATG(α-Met306)至CTG(Leu);ATG(α-Met306)至TTG(Leu);GCT(α-Ala309)至GCC(Ala);ATT(α-Ile314)至GTT(Val);CTG(α-Leu318)至TTG(Leu);CAG(α-Gln337)至CAA(Gln);TTC(α-Phe339)至GTC(Val);CGC(α-Arg346)至CGG(Arg);ACC(α-Thr350)至GCC(Ala);GCC(α-Ala376)至GCT(Ala);GTT(α-Val423)至ATT(Ile);CGC(α-Arg425)至CGT(Arg);CCG(α-Pro430)至TCG(Ser);AAC(α-Asn447)至AAT(Asn);CCG(α-Pro450)至CCA(Pro);GCG(α-Ala460)至GCA(Ala);GTG(α-Val461)至GGG(Gly);GAA(α-Glu462)至GAG(Glu);AAC(α-Asn468)至AAT(Asn);ACC(α-Thr470)至GCC(Ala);AGC(α-Ser481)至AGT(Ser);AAT(α-Asn489)至AGT(Ser);ACC(α-Thr499)至GCC(Ala);TAC(α-Tyr502)至CAC(His);CTC(α-Leu509)至TTC(Phe);CTC(α-Leu509)至TTT(Phe);TTC(α-Phe513)至CTC(Leu);AAC(α-Asn520)至AGC(Ser);CGC(α-Arg533)至GGC(Gly);GTT(α-Val549)至GCT(Ala);ACC(α-Thr553)至ACG(Thr);TAA(α的终止)至CAA(Gln);TAA(α-的终止)至GAA(Glu);2.在β-亚基中CAA(β-Gln2)至CGA(Arg);TTT(β-Phe11)至TTA(Leu);TTT(β-Phe11)至TTC(Phe);CTG(β-Leu13)至CCG(Pro);AAA(β-Lys14)至AGA(Arg);GGG(β-Gly19)至GAG(Glu);GAT(β-Asp24至GGT(Gly);GAT(β-Asp24)至GAA(Glu);GAA(β-Glu25)至GAG(Glu);GCC(β-Ala27)至TCC(Ser);GAA(β-Glu29)至GAG(Glu);ACT(β-Thr45)至GCT(Ala);GCG(β-Ala53)至GTG(Val);AAA(β-Lys56)至AGA(Arg);CTG(β-Leu58)至CTT(Leu);GAA(β-Glu64)至GAG(Glu);CTT(β-Leu67)至CTC(Leu);CGG(β-Arg70)至CGA(Arg);GCC(β-Ala88)至GCT(Ala);GAT(β-Asp111)至GAA(Glu);CTG(β-Leu113)至CCG(Pro);TCT(β-Ser122)至CCC(Pro);GAG(β-Glu130)至GGG(Gly);CCG(β-Pro152)至ACG(Thr);CCG(β-Pro152)至TCG(Ser);AAC(β-Asn155)至AGC(Ser);AAC(β-Asn155)至AAG(Lys);AAA(β-Lys166)至AGA(Arg);AAA(β-Lys173)至GAA(Glu);GAC(β-Asp181)至GGC(Gly);CCC(β-Pro184)至CCT(Pro);和3.在γ-亚基中AAA(γ-Lys4)至AAG(Lys);ATC(γ-Ile21)至ACC(Thr);AAA(γ-Lys27)至AGA(Arg);GAG(γ-Glu35)至AAG(Lys);ATC(γ-Ile49)至ACC(Thr);ACC(γ-Thr53)至GCC(Ala);ACC(γ-Thr53)至TCC(Ser);ACC(γ-Thr53)至TGT(Cys);CAT(γ-His67)至TAT(Tyr);AAT(γ-Asn72)至AGT(Ser);CAG(γ-Gln101)至CGG(Arg);ACC(γ-Thr114)至TCC(Ser);ACC(γ-Thr114)至GCC(Ala);GCC(γ-Ala122)至GTC(Val);GCG(γ-Ala128)至GTG(Val);和CTG(γ-Leu137)至CTA(Leu)。
可以在除了野生型GDH之外的其他B12-依赖型脱水酶中产生类似的核苷酸和氨基酸突变。感兴趣的B12-依赖型脱水酶与GDH的比对能够表明需要突变的精确核苷酸/碱基位置。
本发明不仅包含上面所描述的具体突变,而且还包括能够产生化学上等同的氨基酸取代的突变。因此,例如,用脂族,非极性氨基酸丙氨酸进行氨基酸取代时,预期相同的位点可能被化学上等同的氨基酸丝氨酸所取代。
脱水酶的蛋白工程现在可能通过将有关三维结构的信息和经典的蛋白化学与遗传工程和分子作图的方法组合在一起,即蛋白工程,来尝试改变蛋白的多种特性。这种用于获得具有改变了的活性的酶的方法首先依赖于模型分子的产生,或使用与未知结构具有类似序列的已知结构。
对于本发明的目的来说,以前业已通过X射线晶体学测定了无底物形式的B12-依赖型甘油脱水酶的三维晶体结构(Liao等,J.InorganicBiochem.(in press));另外,业已报道了在与1,2-丙二醇形成的复合物中的酶的结构(Yamanishi等,Eur.J.Biochem.2694484-4494(2002))。通过B12-依赖型甘油脱水酶的这些三维模型,以及对突变的“热点”通常位于在反应动力学方面表现出提高的活性的脱水酶的什么位置的理解(以便降低自杀失活的速率),人们能够靶定脱水酶结构中的区域,在这里,结构中的其他修饰可能造成所述蛋白特性的理想的变化。因此,例如,针对以下野生型残基的区域定点诱变预期会产生具有改善了的催化活性的其他脱水酶变体1.)62-70位残基(包括来自α-亚基N-末端的第二个α螺旋);和/或2.)219-236位残基(位于活性位点附近的区域,包括α-亚基的TIM桶的第四β-链的一部分以及随后的环和一个短的螺旋)。
重组脱水酶在宿主细胞中的表达用于通过表达编码脱水酶的基因重组生产3-HP和1,3-丙二醇的合适的宿主细胞可以是原核细胞或真核细胞,并且仅仅受它们表达活性酶的能力的限制。优选的宿主是一般用于生产3-HP或1,3-丙二醇的宿主,如柠檬酸杆菌属(Citrobacter),肠杆菌属(Enterobacter),梭菌属(Clostridium),克雷伯氏菌属(Klebsiella),气杆菌属(Aerobacter),乳杆菌属(Lactobacillas),曲霉属(Aspergillus),糖酵母属(Saccharomyces),裂殖糖酵母属(Schizosaccharomyces),接合糖酵母属(Zygosaccharomyces),毕赤氏酵母属(Pichia),克鲁维氏酵母属(Kluyveromyces),假丝酵母属(Candida),汉逊氏酵母属(Hansenula),德巴利氏酵母属(Debarymyces),毛霉属(Mucor),球拟酵母属(Torulopsis),甲基细菌属(Methylobacter),埃希氏菌属(Escherichia),沙门氏菌属(Salmonella),芽孢杆菌属(Bacillus),链霉菌属(Streptomyces)和假单胞菌属(Pseudomonas)。在本发明中更优选的是大肠杆菌,蟑螂埃希氏菌(E.blattae),克雷伯氏菌属,柠檬酸杆菌属和气杆菌属。
适合将编码合适的脱水酶的基因克隆,转化和表达进宿主细胞的载体,转化方法和表达盒为本领域技术人员所公知。合适的载体是与被用作宿主细胞的细菌相容的载体。因此,合适的载体可来自,例如,细菌,病毒(例如,噬菌体T7或M-13衍生的噬菌体),粘粒,酵母或植物。用于获得和使用所述载体的方法为本领域技术人员所知(Sambrook等,同上)。
通常,载体或盒包括指导相关基因转录和翻译的序列,选择标记和允许自主复制或进行染色体整合的序列。合适的载体包括具有转录起始控制的基因5′的区域和控制转录终止的DNA片段3′的区域。最优选的是,两个控制区都来自与转化的宿主细胞同源的基因,尽管应当理解的是,所述控制区不一定来自被选择用作生产宿主的特定物种的天然基因。
用于驱动本发明的相关基因在理想的宿主细胞中表达的起始控制区(或启动子)有很多种,并且是本领域技术人员所熟悉的。实际上,能够驱动所述基因的任何启动子都是适合本发明的,包括,但不局限于CYC1,HIS3,GAL1,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI(用于在糖酵母属中表达);AOX1(用于在毕赤氏酵母属中表达);和lac,trp,λPL,λPR,T7,tac和trc(用于在大肠杆菌中表达)。
终止控制区也可来自所述优选宿主的多种天然基因。终止位点任选地不是必需的;不过,如果包括终止位点的话是最优选的。
一旦构建了合适的盒,就将其用于转化合适的宿主细胞。将包括编码突变型脱水酶的基因的盒导入宿主细胞可以通过已知方法实现,如通过转化(例如,使用钙-透化的细胞,电穿孔),或通过使用重组噬菌体病毒转染(Sambrook等,同上)。
通过发酵进行的工业生产本发明的发酵培养基必须包括合适的碳底物。合适的底物为发酵科学领域的技术人员所公知。优选的碳底物是甘油,二羟基丙酮,单糖,寡糖,多糖和一碳底物。更优选的是糖类(例如,葡萄糖,果糖,蔗糖)和单碳底物(例如,甲醇和二氧化碳)。最优选的是葡萄糖。
除了合适的碳源之外,发酵培养基必须包括本领域技术人员所知的合适的矿物质,盐,辅因子,缓冲液和其他成分,这些成分适合培养物的生长,并且适于促进3-HP和1,3-丙二醇生产所必需的酶促途径。要特别关注的是Co(II)盐和/或维生素B12或它的前体。
通常,细胞是在30℃在合适培养基中生长的。本发明优选的生长培养基是常见的商业化制备的培养基,如Luria Bertani(LB)培养液,沙氏葡糖(Sabouraud Dextrose)(SD)培养液或酵母麦芽汁(YM)培养液。还可以使用其他确定的或合成的生长培养基,并且适合生长特定微生物的培养基是微生物学或发酵科学领域的技术人员所知的。
预期本发明可以使用分批,补料分批或连续方法实施,并且任何已知的发酵模式都是合适的(Brock详细介绍了多种方法,同上)。另外,预期可以将细胞作为完整的细胞催化剂固定在底物上,并且接受3-HP或1,3-丙二醇生产的发酵条件。
预期改善了的B12-依赖型脱水酶突变体可用于用多种方法中生产3-HP和1,3-丙二醇,不依赖于所使用的碳底物(US 5686276,甘油至3-HPA)。相关菌株的重组体可以由US 10/420587(DuPont 2002)的质粒中所描述的脱水酶交换得到,该文献被收作本文参考。
在下面的实施例中将对本发明作进一步的限定。应当理解的是,这些实施例尽管表明了本发明的优选实施方案,但是仅仅是以说明形式提供的。根据上述讨论和这些实施例,本领域技术人员能够确定本发明的实质性特征,并且在不超出本发明精神和范围的前提下,可对本发明进行各种改变和修饰,以便使它适应各种用途和条件。
实施例一般方法进行PCR扩增,用内切核酸酶和外切核酸酶进行DNA修饰(用于产生克隆DNA和连接所需要的末端),以及细菌转化所需要的方法为本领域所公知。本发明采用了标准分子克隆技术,并且描述于以下文献中Sambrook,J.,Fritsch,E.F.和Maniatis,T.in Molecular CloningA Laboratory Manual,2nd ed.(Cold Spring Harbor LaboratoryCold Spring Harbor,NY,1989;下文称为“Maniatis”);Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.in Experiments with GeneFusions(Cold Spring Harbor LaboratoryCold Spring,NY,1984);和Ausubel等in Current Protocols in Molecular Biology(GreenePublishing and Wiley-Interscience;1987)。
适合细菌培养物维持和生长的材料和方法为本领域所公知。适用于下面的实施例中的技术可以从以下文献中查阅到1.)Manual ofMethods for General Bacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips,Eds.,American Society forMicrobiologyWashington,D.C.,1994);或2.)Brock,T.D.inBiotechnologyA Textbook of Industrial Microbiology,2nd ed.(Sinauer AssociatesSunderland,MA,1989)。用于生长和维持细菌细胞的所有试剂,限制酶和材料都是从Aldrich Chemicals(Milwaukee,WI),DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),Sigma Chemical Company(St.Louis,MO),或Promega(Madison,WI)获得的,除非另有说明。PCR反应是在GeneAMPPCR系统9700上进行的,其中使用Amplitaq或Amplitaq Gold酶(PEApplied Biosystems,Foster City,CA),除非另有说明。循环条件和反应是按照生产商的说明标准化的,除了在本文中另有说明。
DNA测序反应是在ABI 377自动测序仪(PE Applied Biosystems)或在PTC-200 DNA Engine(MJ Research,Waltham,MA)上进行的,其中使用Expand High Fidelity PCR System(Roche Applied Science,Indianapolis,IN),除非另有说明。同样,数据是使用Vector NTI程序(InforMax,Inc.,Bethesda,MD)或DNAstar程序(DNASTAR Inc.,Madison,WI)处理的。
缩写的含义如下缩写的含义如下“sec”表示秒,“min”表示分钟,“hr”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“mm”表示毫米,“μm”表示微米,“nm”表示纳米,“mM”表示毫摩尔的,“μM”微摩尔的,“nM”表示纳摩尔的,“M”表示摩尔的,“mmol”表示毫摩尔,“μmol”表示微摩尔,“ng”表示纳克,“mg”表示毫克,“g”表示克,“kB”表示千碱基,“mU”表示毫单位,且“U”表示单位。
菌株,载体和培养条件将大肠杆菌BL21(DE3)细胞用于酶超表达(Shuster,B.和Retey,J.,FEBS Lett.349252-254(1994))。大肠杆菌XL1-Blue细胞是从Stratagene(La Jolla,CA)购买的。野生型大肠杆菌5K最初是从ColiGenetic Stock Center(CGSC #4510;Yale University,New Haven,CT)获得的,并且用λDE3使它溶原化(5K(DE3))。载体pBluescriptII SK+是从Stratagene购买的。
用于分子生物学用途的所有试剂盒都是按照生产商的说明使用的,除非另有说明。
实施例1构建“Xba-文库”靶向GDH的α-,β-和γ-亚基的随机诱变采用易错PCR扩增,制备了靶向肺炎克雷伯氏菌dhaB1,dhaB2和dhaB3基因的随机突变体文库。对所述文库进行的代表性序列分析证实了每kB具有大约4.2个点突变;酶活性测量确定该文库中大约15-25%的突变体是活性的。
易错PCR扩增Emptage等(WO01/12833)描述了质粒pDT2的构建,它包括肺炎克雷伯氏菌dhaB1,dhaB2和dhaB3基因(SEQ ID NO1)。质粒pGD20是通过将pDT2的HindIII/XbaI片段(包括dhaB1,dhaB2,和dhaB3)插入pBluescript II SK+(Stratagene)中构建的,它将GDH基因的表达置于T7启动子的控制之下。
制备了靶向GDH的所有三个基因的随机产生的突变体文库。首先,通过易错PCR,由pGD20扩增包括dhaB1(1668bp),dhaB2(585bp)和dhaB3(426bp)的序列,其中使用了以下引物DHA-F1(SEQ ID NO5)和DHA-R1(SEQ ID NO6)。将Clontech诱变试剂盒(ClontechLaboratories,Inc.,Palo Alto,CA)用于实施易错PCR。反应混合物由以下成分组成38μl PCR级水,5μl 10x AdvanTaq Plus缓冲液,2μl MnSO4(8mM),1μl dGTP(2mM),1μl 50x多样化dNTP混合物,1μl引物混合物,1μl模板DNA和1μl AdvanTaq Plus聚合酶。热循环反应是按照生产商的说明进行的。用Hind III/XbaI消化2.7kB PCR产物,并且制备用于连接。
突变体文库构建尽管使用HindIII和XbaI消化能够从pGD20构建体上除去包括GDH的所有三个基因的整个插入片段,但所述插入片段的大小大约为2.7kB,而所述载体的大小大约为2.9kB。为了方便在琼脂糖凝胶上分离这两种片段,用HindIII,XbaI和PstI消化pGD20。PstI不能切割所述载体,相反,只能在三个位置上切割所述插入片段,从而由所述插入片段产生了四个小的片段。因此,消化过的载体以大约2.9kB的大小在琼脂糖凝胶上迁移,而不会受到其他DNA片段的污染。然后将HindIII/XbaI/PstI-消化过的载体与HindIII/XbaI-消化过的易错PCR产物连接。在乙醇沉淀之后,连接混合物可用于转化。
连接混合物的转化由于T7启动子被用于所述突变体文库,将用λDE3溶原化的大肠杆菌细胞用作宿主细胞,以进行突变型酶的表达。具体地讲,将5K(DE3)大肠杆菌菌株用于突变体文库构建。首先,按以下方法制备电穿孔感受态5K(DE3)细胞将2.5mL的过夜细胞培养物添加到装在2L无菌烧瓶中的500mL的LB培养液中。在37℃下,在摇床上温育所述培养物,直到OD600达到0.5-0.8。然后在冰上温育所述细胞10分钟,然后在4℃下离心10分钟。在用500mL冰冷的水洗涤所述细胞1次之后,将所述细胞重新悬浮到1-2mL的10%冰冷的甘油中。在无菌eppendorf管中制备等分试样(50μL),并且马上在干冰中冷冻。所述感受态细胞在-80℃下保存。
为了进行转化,将1μL的连接混合物添加到40μL的感受态细胞中,并且将所述样品转移到电穿孔杯中,所述杯具有0.1cm的间隙。将1.7kv/cm的电压用于电穿孔。将所述细胞铺平板到含有氨苄青霉素的LB平板上,并且在37℃下温育过夜。
“Xba”突变体文库的DNA序列分析随机挑取9个突变菌落进行DNA测序分析。在测序之后,分析每一个突变体所产生的突变的数量,突变的位置,以及所观察到的突变的特定类型。所述分析发现了在突变体中出现了所有类型的碱基置换,表明了缺乏对特定突变类型的偏倚。另外,在9个分析过的突变克隆中只观察到了一种缺失突变;没有鉴定到碱基插入突变。这表明了在所述突变体文库中缺失和插入的频率是非常低的。每kB的平均突变率为4.2个点突变。GDH活性测量表明了在所述文库中大约有15-25%的突变体是活性的。
实施例 2“Sma-文库”的构建靶向GDH的α-亚基和β-亚基的一部分的随机诱变生成了主要靶向肺炎克雷伯氏菌dhaB1基因的第二种随机突变体文库。对所述文库进行的代表性序列分析证实了每kB存在大约4.5个点突变;酶活性测量确定了该文库中大约15-25%的突变体是活性的。
易错PCR扩增和突变体文库构建通过易错PCR,用pGD20作模板将以下引物用于扩增完整的dhaB1基因和dhaB2基因的大约200bp的部分DHA-F1(SEQ ID NO5)和DHA-R2(SEQ ID NO7)。易错PCR反应是使用Clontech诱变试剂盒进行的,正如在实施例1中所描述的。然后用HindIII和SmaI消化1.9kBPCR产物。
为了制备载体,用HindIII和SmaI消化pGD20质粒(以便除掉野生型dhaB1基因和dhaB2基因的一部分),并且然后从琼脂糖凝胶上纯化。将HindIII/SmaI-消化的易错PCR产物与HindIII/SmaI-消化的pGD20载体连接。通过电穿孔将连接混合物转化入大肠杆菌5K(DE3),与实施例1中所描述的制备突变体文库的方法类似。
“Sma”突变体文库的DNA序列分析随机挑取10个突变菌落进行DNA测序分析,以便检查所述文库的完整性。对于每一种突变体来说,测定了所产生的突变的数量,突变的位置,以及观察到的突变的特定类型。根据以上结果,确定Sma-文库中的平均突变率为每kB4.5个点突变。不存在对任何特定突变类型的明显偏倚,并且在所述突变体文库中缺失和插入的频率非常低。酶活性测量发现该文库中大约15-25%的突变体是活性的。
实施例3靶向GDH的α-亚基的氨基酸No.141-152(“PpuMI-文库”)、219-226(“4BR1-文库”)和330-342(“RsrII-文库”)的区域随机诱变根据GDH的晶体结构(Liao等,J Inorganic Biochem.93(1-2)84-91(2003);Yamanishi等,Eur.J.Biochem.2694484-4494(2002)),靶向GDH的α-亚基的下述区域进行区域随机诱变1)氨基酸No.141-152;2)氨基酸No.219-226;和3)氨基酸No.330-342。由于这些区域中的每一个的长度都相当短,将寡核苷酸指导的诱变方法用于制备这三种突变体文库。该方法涉及到多步骤过程,其中,首先产生了相应于要突变的每一个区域的上游或下游的唯一限制位点的沉默突变,以便于克隆。然后,制备简并寡核苷酸引物,并用于PCR反应,以便诱变α-亚基的所述靶区域。然后将所述诱变的PCR片段克隆到大肠杆菌中,以便产生“PpuMI-文库”,“4BR1-文库”和“RsrII-文库”。
在pGD20中导入沉默突变在每一个靶区域的上游或下游产生一个沉默突变,以便在质粒pGD20上产生唯一的限制位点。使用以下引物对在每一个区域产生点突变。在每一个引物中用大写的粗体字母表示的核苷酸表示要引入特定突变的位置。
表5靶氨基酸中沉默突变的形成
诱变实验是使用Stratagene′s QuikChange定点诱变试剂盒(LaJolla,CA),按照生产商的说明进行的。在诱变之后,从每一种突变克隆中纯化质粒。通过限制酶消化证实所述点突变,然后进行直接DNA序列分析。
寡核苷酸指导的诱变为了制备区域性随机突变体文库,合成了三种简并寡核苷酸(pGD20RM-F3,TB4B-R1和GD20RM-R4,如下面所示出)。将正常条件用于寡核苷酸合成,合成用大写字母表示的核苷酸。相反,用小写的粗体字母表示的核苷酸在合成期间使用了在每一种引物下面所示出的简并核苷酸混合物。因此,预期1-2个点突变产生了所述引物的每一个“简并区”。
pGD20RM-F3(用于a.a.141-a.a.152区-“PpuMI文库”)
5’-GCC CGC AGG ACC CCC TCC aac cag tgc cac gtc acc aatctc aaa gat aat ccg GTG CAG ATT-3’(SEQ ID NO15)a=94%A与2%G,2%C和2%T混合;g=94%G与2%A,2%C和2%T混合;c=94%C与2%G,2%A和2%T混合;t=94%T与2%G,2%C和2%A混合。
TB4B-R1(用于a.a.219-a.a.226区-“4BR1文库”)5’-GCGTGG GTT AAC cag cta cgc cga gac ggt gtc ggt cta cGGCAC CGA AGC GGT ATT TAC C-3’ (SEQ ID NO16)a=94%A与2%G,2%C和2%T混合;g=94%G与2%A,2%C和2%T混合;c=94%C与2%A,2%T和2%G混合;t=94%T与2%A,2%G和2%C混合。
pGD20RM-R4(用于a.a.330-a.a.342区-“RsrII文库”)5’-GGT GCG CGC GGT GCG GCG AAT ATC cga gtg gga gaa agtctg gtc gtt ggc gga cgc cac ttc GAG GTC GAG-3’(SEQ ID NO17)a=95%A与1.66%G,1.66%C和1.66%T混合;g=95%G与1.66%A,1.66%C和1.66%T混合;c=95%C与1.66%G,1.66%A和1.66%T混合;t=95%T与1.66%G,1.66%C和1.66%A混合。
然后进行了高保真度PCR反应,以便使用以下引物对产生诱变PCR片段·PpuMI-文库pGD20RM-F3和DHA-R2(SEQ ID NOs15和7);·4BR-1文库TB4B-R1和GD-C(SEQ ID NOs16和14);·RsrII-文库DHA-F1和pGD20RM-R4(SEQ ID NOs5和17)。
从琼脂糖凝胶中纯化PCR片段,然后分别用PpuMI/XbaI(用于PpuMI-文库),HpaI/XbaI(用于4BR-1文库)和HindIII/RsrII(用于RsrII-文库)消化。
突变体文库构建分别用PpuMI/XbaI,HpaI/XbaI或HindIII/RsrII消化突变的pGD20构建体(其中,业已通过定点诱变向其中导入了PpuMI,Hpal或RsrII唯一的限制酶消化位点。从琼脂糖凝胶中纯化线性化的载体,然后与限制酶-消化的PCR产物连接。通过将所述连接混合物电穿孔转移到大肠杆菌菌株5K(DE3)中制备突变体文库,如在实施例1中所描述的。
区域文库的测序分析从每一个区域文库中随机挑取9-10个突变菌落进行DNA测序分析。对于PpuMI-文库来说,每个突变体的平均突变率为2.8个突变(n=9)。在4BR1-文库中,每个突变体的平均突变率为2.0个突变(n=8)。最后,来自RsrII文库的测序数据发现了每个突变体的平均突变率为2.2个突变(n=10)。在这三种文库中的任意一个上都没有发现插入或缺失。但是检测到了所有类型的碱基置换,表明了缺乏对任何特定突变类型的偏倚。
实施例4筛选测定的开发开发了筛选测定,其中,可以通过添加B12辅酶和底物(甘油)人工“启动”B12-依赖型脱水酶反应。通过比色醛测定检测脱水酶反应产物3-HP。使用这种测定,在存在甘油和1,3-丙二醇的条件下对一般的B12-依赖型脱水酶反应的时程进行的初步分析使得能够开发快速的理论技术,以便评估所述反应的起始速率v以及观察到的酶失活速率kinact obsd。
筛选测定基本原理能表达野生型B12-依赖型脱水酶或突变型B12-依赖型脱水酶的培养物,如果它们没有所述酶的辅因子,辅酶B12的话,会产生脱辅基-B12-依赖型脱水酶。相反,如果将辅酶添加到甲苯-和去污剂透化的完整细胞中的话,会自发形成全酶。因此,可以通过向所述细胞中添加辅酶和底物“启动”B12-依赖型脱水酶反应。可以通过比色醛测定检测反应产物3-HP(Zurek,G.,Karst,U.Analytica Chimica Acta,351247-257(1997)),其中使用试剂3-甲基-2-苯并噻唑啉酮(MBTH)和氧化剂氯化铁。
用于检查一般的GDH反应的时程的初步测定(有和没有1,3-丙二醇)在37℃下,在Innova 4300培养箱中(New Brunswick Scientific,New Brunswick,NJ)振荡(250rpm),在15%Lennox培养液(通过用85体积的0.5%NaCl稀释15体积的Lennox培养液(Gibco-BRL,Rockville,MD)然后灭菌来制备)中生长能产生野生型GDH的细胞过夜。按以下方法透化细胞将培养物的等分试样(0.3mL)分配到聚丙烯深孔平板(Beckman-Coulter,Fullerton,CA)的方形孔中,并且将10μL含有2.5%(v/v)TritonX-100去污剂的甲苯添加到每一个孔中。然后在IKA MTS4摇床(IKA-Werke Gmbh.,Staufen,德国)上以最高速率振荡10分钟。在红色灯光下操作,以便保护辅酶B12,通过将5体积的底物溶液添加到1体积的透化细胞悬浮液中启动反应。所述底物溶液含有溶于0.1M K-Hepes,pH8中的12mM甘油和24μM辅酶B12。在定时的时间间隔,将所述反应的12.5μl等分试样添加到96-孔平板的孔中,所述孔容纳有12.5μl溶于0.4M甘氨酸-HCl,pH2.7中的3mg/mLMBTH。在采样之后至少20分钟,将125μL溶于10mM HCl中的5.5mMFeCl3添加到每一种含有MBTH的样品中。再经过20分钟或更长时间之后,使用Spectramax 160平板读数器(Molecular Devices,Sunnyvale,CA)以在670nm的吸收度形式对与GDH活性相关的蓝色进行定量。进行类似的实验,其中,在底物溶液中补充了50mM 1,3-丙二醇。
测定结果的理论分析如图1所示,以时间对OD670的形式对来自所述时程反应的数据进行作图。具体地讲,图1中的上部轨迹表示GDH反应的时程(室温,在0.1MK-HEPES,pH8中),用10mM甘油(Km大约0.5mM)作底物。由于失活的发生,产物形成的速率随着时间推移迅速降低。通过将三种参数拟合入下式,通过有关点绘制出了理论曲线y=T0+amp(1-exp(-kinact obsd*时间))。所述参数是1.)用于分析的背景(t=0(T0))值;2.)在所述测定期间产生的有限的总吸收度的幅度值(amp);和3.)一级失活速率常数(kinact obsd),它控制曲率。所述拟合的参数与反应的动力学性质相关,如下文所述所述幅度等于所述反应的起始速率(v)除以观察到的酶失活速率(kinact obsd)。起始速率为[GDH][gly]kcat/(Km+[gly])。如果扣除所述测定背景的话,进一步分析发现1.只能用在反应期间采集的两种样品评估v和kinact obsd用于评估v的早期点(T1)和用于评估幅度的晚期点(T2);和2.可以将1/kinact obsd估算为T2/T1。
图1的下部轨迹表示在测定中包括50mM 1,3-丙二醇的作用(Ki大约15mM)。所述反应的起始速率只降低了大约20%,不过失活加速了大约3倍。这是因为尽管所述竞争性抑制是适度的,但酶-1,3-丙二醇复合物失活的速率常数(kinact 1,3-丙二醇)大于酶-甘油复合物失活的速率常数(kinact 甘油)。
下面示出了动力学方案,它整合了两种失活过程。
实施例5两点高通量筛选测定采用高通量筛选测定方案检查在实施例1,2和3中制备的突变菌落,该方法是以实施例4中描述的方法为基础的。该测定专门在该测定期间的两个时间点上测量GDH反应产物T1,在T0之后30秒测量;和T2,在T0之后40分钟测量。
将来自铺平板的文库的菌落挑取到标准96孔微量滴定板的94个孔中,这些孔中含有0.15mL/孔的15%Lennox培养液。其余的两个孔接种能产生野生型GDH的细胞,并且让所述细胞在37℃下,在静止培养箱中生长4-6小时。或者,如果在筛选之前将挑取的细胞放置在-80℃下保存是理想的,那么所述培养基还添加有甘油(10%v/v),并且让挑取的细胞在保存之前生长过夜。在筛选之前,用96针接种器(V&PScientific,San Diego,CA)将以前冷冻的细胞转移到新的96-孔平板上,该平板装有不含甘油的15%Lennox培养液,并且在不振荡的条件下在37℃下让它生长6-16小时。
为了进行GDH突变体筛选,细胞生长方案如下将15%Lennox培养液培养基分配(0.3mL/孔)到聚丙烯深孔96-孔平板(Beckman-Coulter,Fullerton,CA)的孔中。将来自浅的96-孔平板的细胞接种到深孔中,其中使用96针长针接种器(V&P Scientific),并且用3″宽的微孔手术胶带(3M Health Care,St.Paul,MN)覆盖所述平板。将浅的96-孔平板在4℃下保存直到测定完成,此时它们被用作活细胞的来源,用于进一步检查被鉴定为可能改善了的细胞系。让所述深-孔平板中的细胞在37℃振荡(250rpm)生长过夜。用放置在塑料托盘中的湿海绵对培养箱(Innova 4300,New Brunswick Scientific,NewBrunswick,NJ)中的空气加湿。
通过向每一个孔中添加10μL含有2.5%(v/v)TritonX-100去污剂的甲苯对96-孔平板上的细胞进行透化。然后在IKA MTS4摇床(IKA-Werke Gmbh.,Staufen,德国)上以最高速率振荡平板10分钟。使用Biomek 2000机器人(Beckman-Coulter)将透化细胞的等分试样(8μL)转移到96-孔反应平板上,所述平板放置在Plexiglas(Rohm and Haas,Philadelphia,PA)外罩中,上面用红色塑料膜覆盖,以便使底物混合物免受室内白色光线的照射。通过用机器人向所述细胞中添加40μL的底物混合物(在红色光线下制备,并且在-20℃下用箔包装的容器中保存直到使用)启动在室温下的反应,所述混合物含有溶于0.1M钾-HEPES缓冲液,pH8中的24μM辅酶B12,12mM甘油和50mM1,3-丙二醇。在添加底物30秒之后,将该反应的12.5μL等分试样(T1样品)转移到第二个平板上,在该平板的孔中容纳有12.5μL溶于0.4M甘氨酸-HCl,pH2.7中的3-甲基-2-苯并噻唑啉酮(MBTH)。在添加底物之后大约40分钟,将该反应的类似等分试样(T2样品)转移到装有MBTH的第三个平板上。在该转移之后至少20分钟,将125μL溶于10mM HCl中的5.5mM FeCl3溶液添加到第二和第三(含有MBTH)个平板的每一个孔中。再过20-60分钟之后,使用Spectramax 160平板读数器(MolecularDevices,Sunnyvale,CA),以在670nm的吸收度对与GDH活性相关的蓝色进行定量。
将来自平板读数器的数据转移到修改过的Microsoft(Redmond,WA)Excel计算机程序中。该程序被设计成将来自每一个反应平板的第一(T1)和第二(T2)样品进行匹配,以便制备表格形式的结果,这些结果表示每一种反应的平板,在平板上的位置,和T1,T2以及T2/T1比例。对样品的数据进行检查,寻找显示额外高的T1,T2或T2/T1比例值的样品。这通过所述程序能够根据任何所述参数对数据进行分类的能力而得到了加强。用来自保留的浅的96-孔平板的最有希望的候选物进行划线培养,以便进一步检查。
实施例6筛选GDH突变体文库并且鉴定阳性命中物(hit)使用例实施例5所描述的自动化高通量测定,对来自5个突变体文库的大约100,000突变菌落进行筛选。所述文库包括1.)Xba文库,靶向α-,β-和γ-亚基(DhaB1,DhaB2和DhaB3),如实施例1所述;2.)Sma文库,靶向α-亚基和β-亚基的一小部分,如实施例2所述;3.)PpuM1文库,靶向α-亚基的a.a.141-a.a.152,如实施例3所述;4.)4BR1文库,靶向α-亚基的a.a.219-a.a.226,如实施例3所述;和5.)RsrII文库,靶向α-亚基的a.a.330-a.a.342,如实施例3所述。
所有独立的分离物都来自上述5个文库之一。大部分独立的分离物都是通过表示来源文库的标记和随后的编号进行唯一识别的(例如“Xba3010”)。来自第一次筛选的所有推测的“命中物”都在随后的测定中验证。大部分突变作用都是按照基于下面所描述的动力学参数的四种大的类型进行分类的。突变基因的序列分析,随后与野生型基因进行比较,能够确定存在于每一个突变基因上的特定点突变。
筛选突变体文库并且证实命中物在对大约100,000突变体进行初步筛选之后,通过随后的验证测定证实了推测的命中物。简单地讲,在8个孔中对每一个推测的命中物进行再测定。对来自单独的克隆的结果进行统计学分析,以便获得T1(在30秒时测量的醛的量)和T2(在40分钟时测量的醛的量)的平均值和标准差。将以上结果与野生型酶的结果进行比较。
图2表示一般的后续测定结果,其中将x轴上的测定数对y轴上的OD670nm进行作图。提供了克隆Xba3010和野生型的每一个单独测定(n=8)在T1和T2处的结果。平均值以水平线的形式图示,并且在括号中以+/-标准差的形式用数字表示。一般,标准差为大约10-15%。
筛选结果表6总结了命中物的后续测定结果,这些命中物的T2/T1比例大于野生型的T2/T1比例,或者其T2大于野生型的T2,或者同时具备这两种特征。T2/T1比例提供了在40分钟反应期间酶稳定性的指示,该反应是在存在1,3-丙二醇和甘油的条件下进行的。T2表明了在它完全失活之前所述酶的总转换数。T2/T1比例越高,酶的稳定性越好。因此,与野生型酶相比,具有改善了的稳定性的突变型酶在存在甘油和1,3-丙二醇的条件下具有较降低的失活速率。
在表6中报道了来自后续测定的T1和T2的平均值,之前已经将它们相对于野生型结果进行了标准化。大部分突变型酶可以根据以下定义划分成1型、2型、3型或4型突变体·1型突变体T2/T1比例相对于野生型提高了,同时T2绝对值降低了;·2型突变体与野生型相比T2/T1比例和T2值都提高了,不过T2的提高程度低于T2/T1比例的提高程度;·3型突变体与野生型相比,T2/T1比例和T2都提高了,并且这两者的提高程度是相似的;和·4型突变体与野生型相比T2/T1比例相当或降低,不过T2提高了。
表6同样总结了在每一种突变体中鉴定的特定点突变。在该表格的第一栏中提供了酶的DNA序列的SEQ ID NO。
表61型、2型、3型和4型突变体的总结
*T2/T1比例和T2值是相对于野生型进行标准化之后的相对数值。
从测序结果中可以看出,大部分突变是作为氨基酸取代鉴定的(沉默突变除外)。不过,两种突变体(Sma3002[SEQ ID NO140]和Xba3009[SEQ ID NO179])是融合蛋白。具体地讲,编码α-亚基的基因(dhaB1)的终止密码子(TAA)分别变成了Sma3002和Xba3009中的CAA(Gln)或GAA(Glu)。由于在编码β-亚基的基因(dhaB2)的终止密码子和起始密码子之间存在15bp,所以这两种融合蛋白都不会导致在β-亚基中发生移码。这使得两种突变型酶都保留了活性。β-亚基的起始密码子(GTG)通常是由fMet-tRNA识别的;不过,在所述融合突变体中,该密码子应该由Val-tRNA识别。Sma3002融合蛋白包括接头,该接头由6个氨基酸残基组成Gln-Gly-Gly-Ile-Pro-Val(SEQ ID NO18)。对于Xba3009融合蛋白来说,所述接头是Glu-Gly-Gly-Ile-Pro-Val(SEQ ID NO19)。
实施例7使用纯化的酶对突变体进行生物化学分析对五种突变体和野生型GDH的更好的表征是在对每一种酶进行超表达和纯化之后进行的。
超表达和纯化选择Xba3007(1型;SEQ ID NO40),Sma3002(2型;SEQ ID NO140),Xba3010(3型;SEQ ID NO175),Xba3009(4型;SEQ ID NO179)和4BR1001(2型;SEQ ID NO171))作进一步的生物化学分析,同时使用野生型酶。首先,从5K(DE3)大肠杆菌宿主菌株中纯化质粒,并且转化入大肠杆菌BL21(DE3)。让所述细胞在含有氨苄青霉素的LB培养基中生长到OD600为0.6-1.0,然后添加1.0mM IPTG。在37℃下诱导3小时之后,通过离心收获细胞,并且用20mM HEPES-KOH缓冲液(pH8.0)洗涤1次。细胞沉淀物在-80℃下保存。
为了进行酶纯化,首先将细胞沉淀物重新悬浮在20mM HEPES-KOH缓冲液(pH8.0)中,该缓冲液含有完全的Mini蛋白酶抑制剂混合物片剂(Roche,Polo Alto,CA)和0.5mM EDTA。通过超声处理破碎所述细胞(Branson model 450;20%输出,50%脉冲,在冰浴中处理4分钟),然后进行离心(40,000xg,30分钟,4℃)。再次对清澈的上清液进行离心(110,000xg,1小时,4℃),并且在冰上将(NH4)2SO4缓慢添加到上清液中,使该溶液达到50%的饱和度。在冰上搅拌该溶液25分钟,然后离心(40,000xg,30分钟,4℃)。将沉淀物重新悬浮在2mL运行缓冲液(running buffer)(100mM HEPES-KOH(pH8.2),100mM1,2-丙二醇和1mM DTT)中,然后加样到用运行缓冲液平衡的16/60 HiloadSuperdex200大小排阻柱(Pharmacia Biotech,Piscataway,NJ)上。
所述酶用运行缓冲液以0.25mL/分钟的流速洗脱,并且用级分收集器(3mL/级分)收集洗脱液。采用实施例5中描述的测定来测定级分中的酶活性,然后合并活性级分,并且用Centricon YM100(Milipore,Bedford,MA)浓缩。让浓缩的酶再次通过相同的柱,使用新的运行缓冲液,该缓冲液由100mM HEPES-KOH(pH8.2)和1mM DTT组成。纯化的酶的纯度为75-95%,该纯度是通过SDS-PAGE电泳判断的,电泳中使用了10-20%梯度凝胶和考马斯蓝染色。
突变型GDH酶的生物化学表征使用纯化的野生型和突变型GDH酶进行了详细的酶动力学分析。酶活性是通过用MBTH-比色醛测定(Zurek,G.,Karst,U.AnalyticaChimica Acta,351247-257(1997))测量产物形成而确定的,并根据Lineweaver-Burke曲线测定KM和Vmax。kcat是根据Vmax计算的。在表7中示出了测定的所述酶的KM和kcat。
表7野生型和选择的突变型GDH酶的KM和kcat
最后,对每一种突变型酶的失活特性进行了详细分析。按实施例4所述方法测量了甘油失活速率常数。为了测量空气失活速率常数,用含有21μM辅酶B12的0.1M K-HEPES缓冲液(pH8)将所述酶稀释到27μg/mL,然后在室温下在空气中温育。在温育0.25,0.5,1,2,5,10,15,20和30分钟之后测量总转换数。为了测量总转换数,将10μL酶溶液添加到含有200mM甘油,24mM辅酶B12和0.1M K-HEPES缓冲液(pH8)的190μL-反应溶液中,并且在室温下温育反应混合物2小时。通过使用MBTH-比色醛测定(Zurek,G.和Karst,U.,同上)来测定3-HP浓度从而估算总转换数。以时间对总转换数形式对数据进行作图,并且通过曲线拟合使用下式估算空气失活速率常数A=A0exp(-k空气t),其中“A”是总转换数,“A0”是在零时间的总转换数,“k空气”是空气失活速率常数,而“t”是时间。
为了测量1,3-丙二醇失活,用含有21μM辅酶B12和各种浓度的1,3-丙二醇(即,1,20,100和300mM)的0.1M K-HEPES缓冲液(pH8)将所述酶稀释到27μg/mL。对每一种1,3-丙二醇浓度来说,通过用于测量空气失活速率常数的方法估算失活速率常数。将所述失活速率常数对1,3-丙二醇浓度作图,并且根据曲线估算由1,3-丙二醇产生的最大失活速率常数。1,3-丙二醇的离解常数是当所述失活速率常数为最大失活速率常数的1/2时的1,3-丙二醇浓度。
在下面的表8中示出了来自该失活特性分析的结果。在没有甘油或1,3-丙二醇或光照,但是存在空气(氧)的条件下,B12-依赖型脱水酶全酶的失活是以双相动力学形式发生的。kgly是在存在10mM甘油,而没有1,3-丙二醇的条件下测量的失活速率常数。所有突变型和野生型脱水酶都表现出双相空气失活;因此,k空气,F是快速相的空气失活速率常数,而k空气,s是慢速相的空气失活速率常数。k1,3丙二醇是1,3-丙二醇产生的最大失活速率常数。Kd是1,3丙二醇的离解常数。
表8选择的突变型酶的失活特性
实施例8通过选择的第一代突变体的组合进行第二轮诱变为了进一步改善通过第一轮诱变获得的突变体,进行了第二轮诱变,以便合并来自几个第一代突变体的突变。
为了制备第二代突变体,首先从宿主细胞中纯化了来自包括多个突变的几个第一代突变体(例如,Sma3002或Xba3009)的质粒。然后将存在于Xba3007,Xba3029或4BR1001中的单点突变导入所述质粒,以便产生第二代突变体2-F4,12-B1,13-B7和16-H5。表9总结了有关每一种突变体和用于生产它们的引物的详细情况。在每一个引物中用大写的粗体字母表示的核苷酸表示要导入的特定突变的位置。
表9第二代突变体的合成
按实施例3所述,使用Stratagene QuikChange定点诱变试剂盒(Stratagene,La Jolla,CA)进行诱变实验。
测定了第二代突变体中每一个的T2/T1比例和T2值,正如前文在实施例5中所描述的。以上结果在下面的表10中示出。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表10第二代突变体的T2/T1比例和T2值
*T2/T1比例和T2值是相对于野生型酶标准化之后的相对数值。用粗体字符表示的突变体是第二代突变体。
实施例9纯的融合突变体的构建和分析在实施例6中描述了两种融合突变体Xba3009(SEQ ID NO179)和Sma3002(SEQ ID NO140)。这两者除了融合体本身之外都包括其他突变。为了研究α-和β-融合体的作用,构建了两种纯的融合突变体(1E1和20G7)。
纯的融合突变体的构建α-亚基(TAA)的终止密码子改变为CAA(1E1)或GAA(22-G7)。这种修饰是通过将单点突变导入野生型GDH质粒实现的。将以下两对引物用于制备点突变对于1-E1突变体来说1-E1-F15’-gac acc att gaa Caa ggc ggt att cct-3’(SEQ ID NO26)1-E1-R15’-agg aat acc gcc ttG ttc aat ggt gtc-3’(SEQ ID NO27)对于22-G7突变体来说22-G7-F15’-ccc gac acc att gaa Gaa ggc ggt att cct gtg-3’(SEQ ID NO28)22-G7-R15’-cac agg aat ac gcc ttC ttc aat ggt gtc ggg-3’(SEQ ID NO29)在每一个引物中用大写的粗体字母表示的核苷酸表示要引入的特定突变的位置。
按照实施例3所述方法用Stratagene QuikChange定点诱变试剂盒(Stratagene,La Jolla,CA)进行诱变实验。按照实施例5所描述的方法测量这两种突变体的T2/T1比例和T2值。结果如表11所示。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表11纯的融合突变体的T2/T1比例和T2值
*T2/T1比例和T2值是相对于野生型酶标准化之后的相对数值。
实施例10存在于突变体Sma3002中的突变的分析在实施例6中鉴定的第一代突变体Sma3002(SEQ ID NO140)在T2/T1比例和T2值两方面都有显著的提高。它包括四个点突变,其中之一包括在实施例9中详细研究的融合突变。为了单独研究这些突变的作用,构建了另外两种突变体(α-Y271C和β-Q2R)。
采用以前所使用的方法,将单点突变导入野生型质粒,其中使用下面所示出的唯一地设计的引物。与前面的实施例一样,在每一个引物中用大写的粗体字母表示的核苷酸,表示要引入的特定突变的位置。
表12Sma3002-衍生的突变体的合成,每一种突变体包括存在于Sma3002中的单点突变
按照实施例3所描述的方法,用Stratagene QuikChange定点诱变试剂盒(Stratagene,La Jolla,CA)进行诱变实验。按照实施例5所描述的方法测量这些突变体的T2/T1比例和T2值。表13表示结果。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表13Sma3002-衍生的突变体的T2/T1比例和T2值,每一种突变体包括相对于Sma3002的单点突变
*T2/T1比例和T2值是相对于野生型酶标准化之后的相对数值。用粗体字符表示的突变体包括来自Sma3002的单点突变。
α-Y271C突变降低了T2值,但是未能改变T2/T1比例。因此,该突变降低了所述酶的kcat。另一种突变β-Q2R似乎不会显著影响T2或T2/T1比例。
为了确定Sma3002(SEQ ID NO140)中的三种非融合突变中的任何一个是否能够在存在1,3-丙二醇和甘油的情况下起着共同提高所述酶的稳定性的作用,制备了三种其他的突变体。在这些突变体中的每一个中,通过以单点突变的形式导入野生型DNA序列将Sma3002上的三个非融合突变之一(α-Y271C,α-Y502H或β-Q2R)去除了。由此产生了三种Sma3002-衍生的突变体,各自包括最初存在于Sma3002中的非融合突变中的两个。按照实施例3所述方法,将单点突变导入Sma3002质粒,其中使用Stratagene QuikChange定点诱变试剂盒,且在下面的表14中示出引物。
表14Sma3002-衍生的突变体的合成,每一种突变体包括存在于Sma3002中的四个点突变
按实施例5所描述的方法测量所述突变体的T2/T1比例和T2值。表15示出了该分析的结果。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表15Sma3002-衍生的突变体的T2/T1比例和T2值,每一种突变体包括四个点突变
*T2/T1比例是相对于野生型酶标准化之后的相对数值。用粗体字符表示的的突变体包括三个突变,并且来自Sma3002。
实施例11通过将某些第一代突变添加到第二代突变体中进行第三轮诱变尽管在前面的实施例中为了提高GDH酶的总转换而进行了显著改进,如通过这里所报道的T2形式的值所衡量的,但仍然进行了第三轮诱变。在这些反应中,将从第一代突变体中选择的点突变导入在T2值方面表现出最大提高的两个第二代突变体(即,1-E1和8-C9)。这是通过首先由宿主细胞纯化1-E1和8-C9突变质粒实现的。然后将存在于Xba3007,Xba3029或4BR1001中的单氨基酸取代的突变导入所述质粒,其中使用在下面的表16中所示出的引物和Stratagene QuikChange定点诱变试剂盒(Stratagene,La Jolla,CA),按照实施例3所述方法进行。
表16第三代突变体的合成
按照实施例5所描述的方法测量第三代突变体的T2/T1比例和T2值。表17中示出了结果。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表17第三代突变体的T2/T1比例和T2值
*T2/T1比例和T2值是相对于野生型酶标准化之后的相对数值。用粗体字符表示的突变体是第三代突变体。
总体上讲,第三代突变体在酶稳定性方面有显著的提高。与最好的第一代突变体(即,Sma3002(SEQ ID NO140))相比,所有突变体都具有提高了的稳定性(T2/T1比例)和总转换数(T2)。实际上,突变体20-B9和21-D10的T2值大于以前所制备的所有突变体的相应值。
实施例12某些第二和第三代突变体的生物化学表征为了进一步表征选择的第二和第三代突变体,在存在10mM甘油和50mM1,3-丙二醇的条件下测定了这些突变体的失活速率常数,其中使用实施例4所描述的方法。结果总结在下面示出的表18中。
表18某些第二和第三代突变体的失活速率常数
正如所预料的,以上结果与T2/T1比例量度吻合。
由于改进的GDHs的一种用途是用于1,3-丙二醇的生物生产,重要的是确定在存在高浓度的1,3-丙二醇的条件下所述突变体的总转换数。上述测定是在仅存在50mM的条件下进行的。在用于1,3-丙二醇生物生产的发酵的晚期阶段,1,3-丙二醇的浓度可以最高达到1M;因此,进行了第二次两点测定。具体地讲,还在存在10mM甘油和600mM 1,3-丙二醇的条件下对若干有希望的突变体的T2值进行了测量。表19总结了有关结果
表19在存在600mM 1,3-丙二醇的条件下测量了选择的第二和第三代突变体的T2值
结果与T2(50mM)所获得的结果有些类似,不过一些突变体表现的比预测的要好。Sma3002的T2(600mM)比野生型酶的相应值高3.3倍。第三代突变体中的每一个(15-E4,18-D7,20-B9和21-D10)表现出T2(600mM)相对Sma3002的进一步提高。以上结果表明,具有更高T2(600mM)的第三代突变体更能抵抗较高浓度的1,3-丙二醇。预期这些突变体对于1,3-丙二醇的生物生产来说是非常有用的。
实施例13用于在存在高浓度的1,3-丙二醇的条件下测量总的酶转换数的一点高通量筛选测定当1,3-丙二醇浓度高于大约300mM时,GDH的失活几乎是在反应开始之后马上出现的。在上述条件下,不可以使用在实施例4和5中所描述的高通量筛选测定来筛选突变体,因为不能精确测量T1。在存在高浓度的1,3-丙二醇的条件下的总的酶转换数是本发明希望改善的关键酶动力学参数之一。通过降低失活速率或提高kcat,可以提高总的酶转换数。为了筛选在存在高浓度的1,3-丙二醇的条件下具有提高了的总的酶转换数的突变体,开发了一种改进的高通量筛选测定方法。
简单地讲,按实施例5所描述的方法在96-孔平板上生长和透化突变细胞。使用Biomek 2000机器人(Beckman-Coulter,Fullerton,CA)将透化的细胞的等分试样(8μL)转移到96-孔反应平板上。通过向所述细胞中添加40μL含有溶于0.1M钾-HEPES缓冲液,pH8中的24μM辅酶B12,12mM甘油和720mM1,3-丙二醇的底物在室温下启动反应,其中使用Qfill2(Genetix,New Mitlon,Hampshire,英国)。在室温下温育所述平板大约70分钟之后,将该反应的12.5μL等分试样转移到第二个平板上,该平板的孔装有12.5μL溶于0.4M甘氨酸-HCl,pH2.7中的3-甲基-2-苯并噻唑啉酮(MBTH),其中使用Biomek 2000机器人(Beckman-Coulter)。70分钟的反应时间能够精确测量总转换数。按照实施例5所描述的方法测定产物3-HP的浓度。通过使用Spectramax 160平板读数器(Molecular Devices,Sunnyvale,CA),通过测量在670nm的吸收度估算总的酶转换数(T(600))。
这种一点比色测定执行起来很简单,因为Qfill2能够在15秒之内将底物添加到一个96-孔平板上。另外,相对于实施例4和5所描述的测定而言,这种测定能够提供更高通量的能力。在表20中示出了按照在实施例5和本实施例中对野生型GDH和几种具有不同酶动力学参数的突变体进行测定的比较结果。
表20T2/T1和T(600)值的比较
所述结果表明了每一种测定能筛选不同的动力学参数。通过本实施例所描述的筛选测定鉴定的突变体能够抵抗更高浓度的1,3-丙二醇,并且通常具有更高的稳定性和合理的kcat值。
实施例14酶结构和突变之间的相关性在本实施例中,检查了相对于野生型GDH而言具有较高T2和较高T2/T1比例的突变关于GDH的三维晶体结构的位置。由此可以鉴定脱水酶内的可以被视为突变“热点”的区域,其中,所述突变通常会导致改善了的反应动力学(使得失活速率降低)。在这些区域中的其他序列修饰同样可能导致具有改善了的反应动力学的其他突变体。
关于三维结构的突变的位置业已通过X射线晶体学测定了无底物形式的脱水酶的三维晶体结构(Liao等,J.Inorganic Biochem.93(1-2)84-91(2003));另外,业已报道了与1,2-丙二醇形成的复合物中所述酶的结构(Yamanishi等,Eur.J.Biochem.2694484-4494(2002))。根据所述结构,将导致T2/T1比例或T2提高的突变(来自实施例6-12)在每一种GDH亚基的示意图上作图。更具体地讲,图3表示在α-亚基上包括单点突变(相对于野生型GDH而言)的突变体的分布(占所有单点突变的88%)。相反,图4表示在α-亚基上包括多点突变(相对于野生型GDH而言)的突变体的分布;该亚基含有所有多点突变的58%,其余的突变分别分布在β-(31%)和γ-(11%)亚基之间。
根据阳性命中物确定的热点尽管单点和多点突变体中的突变位于GDH的所有三个亚基上,并且分布在整个大的α-亚基上,但包括单点突变的突变体和包括多点突变的突变体在α-亚基中表现出两个共同的热点。
一个突变热点位于从α-亚基的N-末端数起的第二个α螺旋上(62-70位残基)。在该区域发现了五种单点突变体其中的三个具有位于62位残基上的突变,这些突变具有不同的氨基酸取代,一个具有位于65位残基上的突变,以及一个具有位于70位残基上的突变(图3)。来自多点突变体的6个突变位点也位于该螺旋上其中的3个位于62位残基上,在63,67和70位残基上各有一个(图4)。
第二个热点是包括α-亚基的TIM桶的第四个β-链的一部分和随后的环和短的螺旋(224-236位残基)的区域。该热点位于活性位点附近。在该区域发现了五个单点突变。残基224在两种突变体中具有不同的氨基酸取代。226位残基是两种相同突变体的突变位点。一种突变体是在233位残基上。另外,所述多点突变体的三个突变位点位于该区域(226,231和236位残基)。
实施例15GDH突变体的位点饱和诱变对在实施例9中表征的突变体中存在的三个突变位点进行位点饱和诱变。具体地讲,这些位点是γ-Thr53(存在于突变体Xba3009中),α-Leu509(存在于突变体Xba3029中)和α-Va1224(存在于突变体4BR1001中)。为了制备饱和诱变文库,从它们的宿主细胞中纯化1-E1和8-C9突变体(分别为实施例9和10),并且用作模板,且与在下面的表21中所示出的简并引物一起使用。
表21饱和诱变文库
使用Stratagene QuikChange多位点定点诱变试剂盒(Stratagene,La Jolla,CA)按照生产商的说明进行诱变实验,以便制备GDH-SM1,GDH-SM2,GDH-SM3和GDH-SM4文库。在将质粒电穿孔转移到大肠杆菌菌株5K(DE3)(如实施例1所述)中之后,使用一点GDH测定筛选了来自每一个文库的88个突变菌落,以便评估在存在高浓度的1,3-丙二醇的条件下的总的酶转换数。然后对来自每一次筛选的最佳命中物进行DNA序列分析。结果在下面的表中示出。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表22在四种饱和突变体中的T(600)值和突变
*T(600)值是相对于野生型酶标准化之后的相对数值。用粗体字符表示的突变体是饱和突变体。
与产生它们的亲本突变基因相比,所有四种饱和突变体(GDH-SM1-G11,GSH-SM2-B11,GDH-SM3-D2和GDH-SM4-H2[用粗体字符表示])表现出T(600)的进一步提高。有趣的是,在突变体GDH-SM4-H2中,鉴定了三个碱基的变化(即,ACC(γ-Thr53)至TGT(Cys))。这种类型的突变使用易错PCR是非常难以产生的。
实施例16使用不配对的引物的重组源延伸方法生成GDH突变体尽管使用随机诱变,合理化设计诱变和饱和诱变显著提高了在存在甘油和1,3-丙二醇的条件下GDH的失活速率(实施例6,8-11和15),但对于工业应用来说进一步提高是理想的。因此,在单一重组源延伸反应中将来自实施例6,9,10和15的24种甘油脱水酶突变体用作亲本模板,其中使用不配对的引物方法(U.S. 60/360279)。
将短的侧翼DNA片段连接在亲本基因的5′或3′末端通过PCR将短的侧翼DNA片段连接在亲本基因的5′或3′末端,然后将它用作使用不配对的引物的重组源延伸方法的结合位点。从宿主细胞中纯化含有GDHs的质粒,并且用作模板。
具体地讲,将正向引物GDHM-F1(SEQ ID NO343)和反向引物GDHM-R1(SEQ ID NO344)用于通过标准高保真度PCR反应扩增以下模板基因,其中用Expand High Fidelity PCR System(Roche Applied Science,Indianapolis,IN)1-E1(SEQ ID NO198),野生型GDH(SEQ ID NO1),Xba3023(SEQ ID NO182),Xba3010(SEQ ID NO175),8-C9(SEQID NO212),4BR1001(SEQ ID NO171),Xba3015(SEQ ID NO147),Xba3008(SEQ ID NO151),Sma3003(SEQ ID NO143),Xba3016(SEQID NO155)和Xba3020(SEQ ID NO159)。然后将所得到的PCR产物以等摩尔比例混合,并且被称作“混合物-1”。
以类似方法将正向引物GDHM-F2(SEQ ID NO345)和反向引物GDHM-R2(SEQ ID NO346)用于扩增以下基因Xba3007(SEQ ID NO40),Xba3029(SEQ ID NO44),Xba3025(SEQ ID NO52),Sma3009(SEQ ID NO179),Sma3010(SEQ ID NO175),Sma3008(SEQ ID NO151),RsrII001(SEQ ID NO136),PpuMI002(SEQ ID NO128),KG005(SEQ ID NO253),GDH-SM1-G11(SEQ ID NO301),GDH-SM2-B11(SEQID NO304),GDH-SM3-D2(SEQ ID NO307)和GDH-SM4-H2(SEQ ID NO310)。将所得到的PCR产物以等摩尔比例混合,并且称作“混合物-2”。
使用Qiagen DNA提取试剂盒(Qiagen,Valencia,CA)从琼脂糖凝胶中纯化扩增的产物,并且然后用作亲本模板,用于使用不配对的引物的重组源延伸方法。
使用不配对的引物方法制备重组源突变体产物用上述24种亲本模板制备重组源产物(即,GDH突变基因),其中使用两种引物PADH316F1(SEQ ID NO29)和T7T(SEQ ID NO30)。PADH316F1与“混合物-1”中的模板(即,1-E1,野生型GDH,Xba3023,Xba3010,8-C9,4BR1001,Xba3015,Xba3008,Sma3003,Xba3016和Xba3020)的5′末端退火,这是因为添加了通过SEQ ID NO343生产的短的5′DNA片段。不过,引物PADH316F1不能结合“混合物-2”模板的5′末端。类似的,引物T7T与“混合物-2”模板(即,Xba3007,Xba3029,Xba3025,Sma3009,Sma3010,Sma3008,RsrII001,PpuMI002,KG005,GDH-SM1-G11,GDH-SM2-B11,GDH-SM3-D2和GDH-SM4-H2)的3′末端退火,但是不能结合“混合物-1”模板的3′末端。
配制以下反应混合物用于反应10ng“混合物-1”,10ng“混合物-2”,各200μM的dNTP,1×PCR缓冲液(具有最终浓度为1.5mM的MgCl2),286nM pADH316F1,286nM T7T,0.625 U HotStarTaq(Qiagen,Valencia,CA)和dH2O至25μl。热循环条件为95℃变性2分钟;然后进行60轮以下循环95℃ 30秒,在63-69℃的梯度上每一轮1秒+1秒;72℃最终延伸7分钟;并且保持在4℃。将Eppendorf Mastercycler梯度5331(Eppendorf Scientific,Inc.,Westbury,NY)用于热循环反应。
由于在该反应中使用的两种引物不能同时与任何模板的5′和3′末端匹配,因此没有一种亲本模板能够在该反应期被扩增。不过,具有5′和3′末端的任何重组DNA产物都能在随后的热循环中扩增。在所述不配对的引物反应之后,将反应混合物加样到琼脂糖凝胶上。在大约66-67℃下,获得了来自所述不配对的引物反应的大量2.7kB PCR产物。这种大小的产物是期望的,因为被用作模板的原始亲本分子本身大约为2.7kB。
制备和筛选重组源GDH突变体文库使用Qiagen DNA提取试剂盒从凝胶中纯化重组GDH DNA产物(大约2.7kB),用XbaI和HindIII消化,然后连接到Xba1-HindIII-消化的pGD20载体上(实施例1)。按照实施例1所述方法通过电穿孔将连接混合物转化入大肠杆菌菌株5K(DE3)获得突变体文库。所述文库的大小为每个连接反应超过0.3百万个菌落。
从琼脂糖平板上挑取6,000-7,000个突变菌落,并且采用一点高通量筛选测定进行筛选,如实施例13所述。在初步筛选之后,通过后续的验证测定证实推测的命中物。简单地讲,在8个孔中对每一个推测的命中物进行再次测定。对来自每一个单独克隆的结果进行统计学分析,以便获得T(600)的平均值和标准差。将所述结果与野生型GDH酶进行比较。
另外,用两点测定(实施例5)对若干命中物作进一步的研究,以便大致估算这些命中物的起始反应速率和失活的变化。
表23总结了对若干重组源GDH突变体进行各种测定的结果。
表23用不配对的引物的重组源延伸方法获得的重组GDH突变体的表征
*T(600),T1,T2和T2/T1比例是相对于野生型酶标准化之后的相对数值。用粗体字符表示的突变体是通过使用不配对的引物的重组源延伸方法制备的。
尽管不同的重组GDH突变体表现出不同的酶动力学(尽管具有类似的T(600)值),但这仅仅体现了每一种测定所测量的参数的差别。例如,突变体SHGDH24和SHGDH43具有相同的T(600)值,但是,与野生型相比,SHGDH24在T1值仅略有提高,而SHGDH43具有大大降低了的T1。对于SHGDH24来说,所述酶的kcat没有降低。相反,SHGDH43的kcat大大降低了。在上述场合下,SHGDH24和SHGDH43的GDH酶稳定性都提高了,因此能够提高总的酶转换数。
在这些突变体中,SHGDH51表现出稳定性方面的最大改进,不过,该突变体不具备最高的总的酶转换数,因为它的kcat大大降低了。在这些突变体中,SHGDH37表现出在T(600)方面的最大提高,不过它的T2值低于SHGDH12的,表明了SHGDH37比SHGDH12更能抵抗高浓度的1,3-丙二醇。
不过,在任何场合下,以上结果都明确地证实了GDH稳定性方面的显著提高,这是因为通过不配对的引物方法产生了新的突变体。具体地讲,通过随机诱变获得的最佳突变体的T(600)为3.3(即,突变体Sma3002;SEQ ID NO140);通过随机诱变和筛选鉴定的突变体的合理的组合或使用位点饱和诱变的所述突变的半随机组合产生了具有4.3的最大T(600)的突变体(即,突变体GDH-SM1-G11;SEQ ID NO301)。因此,得出的结论是,使用不配对的引物的重组源延伸方法的随机重组方法是比以前的合理化和半随机方法更有效的技术。
突变基因的序列分析从在表23中所列举的重组GDH突变体中纯化质粒DNA,并且对每一种的完整的GDH基因序列进行测序。对突变体进行分析,然后与原始野生型GDH基因进行比较,表明了这些重组突变基因包括单碱基置换突变(点突变),这些突变在表24中示出。在该表的第一栏提供了有关酶的DNA序列的SEQ ID NO。
表24重组源GDH突变体的DNA序列分析
有趣的是,所有突变体(SEQ ID NOs313,316,319,322,325,328,331,334,337)都包括α-β融合体突变(正如最初在Sma3002和Xba3009突变体中所发现的[实施例6]),表明了该突变对于T(600)值的提高来说是非常重要的。除了四种新产生的突变之外,SHGDH43包括来自四种不同亲本基因的突变(即,4BR1001,1-E1,Xba3008和GDH-SM1-G11)。这表明在重组源PCR期间,在四种不同的亲本基因之间至少发生了四次交换。除了若干种新产生的突变之外,SHGDH25和SHGDH51包括来自三种亲本基因的突变(即,对于SHGDH25来说,Sma3003,4BR1001和1-E1;对于SHGDH51来说,RsrII001,1-E1和Xba3007)。
权利要求
1.一种筛选具有改善了的反应动力学的B12-依赖型脱水酶的方法,包括(c)让B12-依赖型脱水酶全酶与包括甘油和1,3-丙二醇的混合物接触,其中,所述1,3-丙二醇至少为25mM;(d)筛选所述B12-依赖型脱水酶全酶,以便评估所述B12-依赖型脱水酶的转换率。
2.如权利要求1的方法,其中,筛选步骤(b)包括以下步骤e)在不包括甘油的可发酵的碳底物上生长细胞,其中,所述细胞不具备辅酶B12、脱水酶再激活因子或内源B12-依赖型脱水酶的来源;f)透化所述细胞;g)将辅酶B12甘油和至少25mM 1,3-丙二醇的混合物添加到步骤(b)的透化的细胞中;h)定量在步骤(c)中产生的3-羟基丙醛,其中,所述定量是选自T1、T2和T(600)的量度。
3.编码B12-依赖型突变型脱水酶的核酸序列,该序列选自SEQ IDNos40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,143,147,151,155,159,163,167,171,175,179,182,186,189,192,195,198,201,204,208,212,215,218,221,225,229,233,237,241,245,249,253,257,261,265,269,273,277,281,285,289,293,297,301,304,307,310,313,316,319,322,325,328,331,334和337。
4.由选自下列的核酸序列编码的B12-依赖型突变型脱水酶SEQ IDNO40,44,48,52,56,60,64,68,72,76,80,84,88,92,96,100,104,108,112,116,120,124,128,132,136,140,143,147,151,155,159,163,167,171,175,179,182,186,189,192,195,198,201,204,208,212,215,218,221,225,229,233,237,241,245,249,253,257,261,265,269,273,277,281,285,289,293,297,301,304,307,310,313,316,319,322,325,328,331,334和337。
5.编码包括α-β亚基融合体的B12-依赖型突变型脱水酶的核酸序列,该序列选自SEQ ID NOs140,179,186,189,192,195,198,201,212,215,218,301,304,307,310,313,316,319,322,325,328,331,334和337。
6.编码包括α-β亚基融合体的B12-依赖型突变型脱水酶的核酸序列,该序列选自SEQ ID NOs313,322和328。
7.如权利要求5的核酸序列,还包括位于α-β亚基融合体的α和β亚基之间的接头序列,其中,所述接头序列选自SEQ ID NO18和SEQID NO19。
8.一种用于制备具有改善了的反应动力学的B12-依赖型脱水酶突变体的方法,包括d)让包括热点1或热点2的B12-依赖型脱水酶全酶与诱变剂接触;e)筛选在步骤A)中产生的具有改善了的kcat和/或稳定性的突变体;和f)重复步骤a)和b)。
9.一种鉴定相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型脱水酶的方法,包括d)让脱水酶全酶与5-10mM甘油和/或10-300mM 1,3-丙二醇接触;e)在高通量测定中,在至少两个间隔足够大的时间点上进行测量,以便评估kcat和总的酶转换;f)选择相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型突变体。
10.一种鉴定相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型脱水酶的方法,包括d)让脱水酶全酶与5-50mM甘油和>300mM 1,3-丙二醇接触;e)在高通量测定中,在相对于T0的一个间隔足够大的时间点上进行测量,以便评估总的酶转换数;和f)选择相对于参考脱水酶而言具有改善了的反应动力学的B12-依赖型突变体。
全文摘要
提供了具有改善了的反应动力学的B
文档编号C12N9/02GK1965088SQ200380109760
公开日2007年5月16日 申请日期2003年12月16日 优先权日2002年12月16日
发明者K·J·吉布森, X·-S·唐, D·-I·廖 申请人:纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1