酮还原酶多肽及其用途的制作方法

文档序号:571173阅读:487来源:国知局
专利名称:酮还原酶多肽及其用途的制作方法
酮还原酶多肽及其用途1.相关申请的交叉引用本申请根据美国法典第35编专利法第119(e)条要求在2007年9月28日提交的 序号为60/976,345的申请的权益,所述申请的内容通过引用被并入本文。2.对序列表、表格或计算机程序的引用根据37C. F. R. 1. 821以计算机可读形式(CRF)通过EFS-Web使用文件名 376247-018. txt随本申请共同提交的序列表通过引用被并入本文。电子版的序列表创建于 2008年9月28日,其文件大小为254千字节。3.背景属于酮还原酶(KRED)或羰基还原酶类别(EC1. 1. 1. 184)的酶用于从相应的前立 体异构(prostereoisomeric)酮底物或相应的外消旋(racemic)醛底物合成旋光的醇。 KRED通常将酮或醛转化为相应的醇产物,但是还可以催化逆反应,即醇底物被氧化为相应 的酮/醛产物。酶例如KRED对酮和醛的还原以及醇的氧化需要辅助因子,其中最常见的为 还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)以及 用于氧化反应的烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP)。NADH 和NADPH充当电子供体,而NAD和NADP充当电子受体。经常观察到酮还原酶和醇脱氢酶接 受磷酸化的或非磷酸化的辅助因子(以其氧化态和还原态)。可在大范围的细菌和酵母中发现KRED酶(关于综述,参见Kraus和Waldman, 1995,Enzyme catalysis in organic synthesis (有机合成中的酶催化),卷 1 和 2. VCH Weinheim ;Faber, K. , Biotransformations in organic chemistry (有机化学中的生 物转化),第 4 版 Springer, Berlin Heidelberg New York. 2000 ;以及 Hummel 和 Kula, 1989,Eur. J. Biochem. 184 :1_13)。已经报道了若干KRED基因和酶序列,例如木兰假 丝酵母(Candida magnoliae) (Genbank 登记号 JC7338 ;GI :11360538)、近平滑假丝酵 母(Candidaparapsilosis) (Genbank 登记号 BAA24528. 1 ;GI 2815409)、赭色掷孢酵母 (Sporobolomyces salmonicolor) (Genbank 登记号 AF160799 ;GI 6539734)。为了省去产生关键化合物的许多化学合成步骤,渐增地利用酮还原酶将不同的酮 和醛底物向手性醇产物进行酶促转化。这些应用可利用表达酮还原酶的完整细胞来进行 生物催化的酮还原,或在多种酮还原酶在完整细胞中的存在将不利地影响立体纯度和期望 产物收率的情况下使用纯化的酶。对于体外应用,将再生酶例如葡萄糖脱氢酶(GDH)、甲 酸脱氢酶等的辅助因子(NADH或NADPH)与酮还原酶共同使用。使用酮还原酶来产生有用 的化合物的实例包括4-氯乙酰基乙酸酯的不对称还原(Zhou,1983,J. Am. Chem. Soc. 105 5925-5926 ;Santaniello, J. Chem. Res. (S) 1984 132-133 ;美国专利第 5,559,030 号;美国 专利第5,700, 670号和美国专利第5,891,685号)、二氧代羧酸的还原(例如美国专利第 6,399,339号)、(S)氯_5_羟基-3-氧代已酸叔丁基酯的还原(例如美国专利第6,645,746 号和WO 01/40450)、基于吡咯并三嗪的化合物的还原(例如美国申请第2006/0286646 号)、取代苯乙酮的还原(例如美国专利第6,800,477号)和酮噻吩烷(ketothiolanes)的 还原(W0 2005/054491)。
期望鉴定可被用来进行从各种酮和醛底物向其对应的手性醇产物转化的其他的 酮还原酶。4.概述在一个方面,本公开提供能够将2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯(“底物”)还原或转化为(S,E)-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)-3_羟丙基)苯甲酸甲酯(“产物”)的酮还原酶多肽,编码这种 多肽的多核苷酸以及使用所述多肽的方法。相比之下,天然存在的酮还原酶不展示将特定 的酮底物还原或转化为相应的醇产物的显著活性。本公开中人工改造的酮还原酶多肽衍生自乳酸杆菌属(Lactobacillus)物 种的酮还原酶。照这样,在一些实施方案中,与得自乳酸杆菌例如高加索酸奶乳杆菌 (Lactobacillus kifir) ( "L. kefir" ;SEQ ID NO :4)、短乳杆菌(Lactobacillus brevis) ("L. brevis";SEQ ID NO 2)和微小乳杆菌(Lactobacillus minor) ( "L. minor", SEQ ID NO 114)的天然存在的野生型酮还原酶相比,本公开中人工改造的酮还原酶多肽在将特定 的酮底物转化为相应的醇产物中具有增加的活性。在一些实施方案中,与SEQ ID NO :2、 4或114的序列相比,人工改造的酮还原酶至少具有下面的特征(1)对应于位置190(即 X190)的残基是受限(constrained)残基,而且(2)对应于位置202 (即X202)的残基是 芳香族残基。在一些实施方案中,与SEQ ID NO :2、4或114的序列相比,本公开的酮还原 酶至少具有下面的特征(1)对应于位置190 (即X190)的残基是受限残基,(2)对应于位 置195(即X195)的残基是碱性的、酸性的、非极性的或极性的残基,而且(3)对应于位置 202 (即X202)的残基是芳香族残基。除了上述特征之外,与SEQ ID NO :2、4或114的序列相比,酮还原酶在其他残基位 置可具有一个或多个残基差异。在一些实施方案中,本文的酮还原酶多肽包括与具有下述 特征的基于SEQ ID NO :2、4或114的参考序列至少约80%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更多地相同的氨基酸序列对 应于X190的残基是受限残基,特别是脯氨酸;而且对应于X202的残基是芳香族残基,特别 是色氨酸;条件是酮还原酶多肽至少具有上述特征,即,对应于X190的残基是受限残基,而 且对应于X202的残基是芳香族残基。在一些实施方案中,酮还原酶多肽至少具有下面的特 征对应于X190的残基是脯氨酸;而且对应于X202的残基是色氨酸。在一些实施方案中,本文的酮还原酶多肽包括与具有下述特征的基于SEQ ID NO 2、4 或 114 的参考序列至少约 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列对应于X190的残基是受限 残基,特别是脯氨酸;对应于X195的残基是碱性的、酸性的、非极性的或极性的残基,特别 是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺;而且对应于X202的残基是芳香族残基, 特别是色氨酸;条件是酮还原酶多肽至少具有上述特征,即,对应于X190的残基是受限残 基,对应于X195的残基是碱性的、酸性的、非极性的或极性的残基,而且对应于X202的残基 是芳香族残基。在一些实施方案中,酮还原酶多肽至少具有下面的特征对应于X190的残 基是脯氨酸;对应于X195的残基是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺;而且对 应于X202的残基是色氨酸。在一些实施方案中,例如当改进的性质是来自单个残基差异或残基差异的特定组
16合时,人工改造的酮还原酶可任选地包括与参考序列相比在多肽中其他位置一个或多个保 守的残基差异。在一些实施方案中,可以引入其他残基位置的另外的残基差异以对酶的性 质产生进一步的改进。这些改进可以是针对确定底物的酶活性的进一步增加,但也可包括 立体选择性、热稳定性、溶剂稳定性的增加和/或产物抑制的减少。能够导致一种或多种改 善的酶性质的各种残基差异在详述中被提供。在一些实施方案中,这些人工改造的酮还原 酶多肽基于SEQ ID NO: 111、112和139或其区域(例如对应于残基90至211的残基)中所 陈列的序列式。SEQ ID NO :112基于高加索酸奶乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO 4) ;SEQ IDNO :111基于短乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO 2);而 且SEQ ID NO 139基于微小乳杆菌酮还原酶的野生型氨基酸序列(SEQ IDNO :114)。序列 式说明,对应于X190的残基是受限残基;对应于X195的残基是碱性的、酸性的、非极性的或 极性的残基;而且对应于X202的残基是芳香族残基。如详述中所提供,序列式还说明在其 他残基位置的特征。在一些实施方案中,与SEQ ID NO :2、4或114相比,在酶活性速率方面改进了本公 开的酮还原酶多肽,所述酶活性速率即它们将底物转化为产物的速率。改进量范围可是1. 5 倍(或重)于对应的野生型或参考酮还原酶的酶活性至多达2倍、5倍、10倍、20倍、25倍、 50倍、75倍、100倍或更多倍。在一些实施方案中,酮还原酶多肽能够以至少5倍、10倍、25 倍、50 倍、75 倍、100 倍、150 倍、200 倍、250 倍、300 倍、500 倍或 1000 倍于 SEQ ID NO 4 或 SEQ ID NO :90的多肽所展现的速率的速率将底物转化为产物。在一些实施方案中,人工改造的酮还原酶多肽能够以比参考多肽改进的速率将底 物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物 (S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯,其中所述 参考多肽具有SEQ ID NO :90的氨基酸序列并能够将底物转化为具有至少约95%的百分比 立体异构过量的产物。具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID NO :6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、 60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和110的氨基酸序列的多肽。在一些实施方案中,酮还原酶多肽还能够将底物转化为具有至少约99%的百分比 立体异构过量的产物。具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID NO :6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、 60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和110的氨基酸序列的多肽。因为具有SEQ ID NO :90的氨基酸序列的参考多肽能够以比 野生型(SEQ IDNO 4)改进的速率(例如,用约10g/L的KRED将lg/L的底物的10-20%在 24小时内转化为产物)和立体选择性(99%的立体异构过量)将底物转化为产物,所以比 SEQ ID NO :90改进的本文的多肽也是比野生型改进的。在一些实施方案中,酮还原酶多肽能够以至少约99 %的百分比立体异构过量和比 参考多肽改进了至少1-50倍的速率将底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯转化为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羟丙基)苯甲酸甲酯,其中所述参考多肽具有SEQ ID NO :90的氨基酸序列。 具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID NO :42、44、46、48、86、88、92、94、96、100或102的氨基酸序列的多肽。 在一些实施方案中,酮还原酶多肽能够以至少约99 %的百分比立体异构过量和比 参考多肽改进了至少50-250倍的速率将底物2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯转化为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3-羟丙基)苯甲酸甲酯,其中所述参考多肽具有SEQ ID NO :90的氨基酸序列。 具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID NO :10、32、34、36、50、64、66、 68、70、72、74、76、78、80、82、84、98、104、106 和 108 的氨基酸序列的多肽。
在一些实施方案中,酮还原酶多肽能够以至少约99 %的百分比立体异构过量和比 参考多肽改进了至少250-1000倍的速率将底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基] 苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羟丙基)苯甲酸甲酯,其中所述参考多肽具有SEQ ID NO :90的氨基酸序列。 具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID NO :12、18、22、24、26、28、30、 38、40、52、54、56、58、60、62和110的氨基酸序列的多肽。在一些实施方案中,本发明提供能够以至少约99%的百分比立体异构过量和比 参考多肽改进了至少1000倍的速率将底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯转化为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羟丙基)苯甲酸甲酯的酮还原酶多肽,其中所述参考多肽具有SEQ ID NO 90的氨基酸序列。具有这种性质的示例性多肽包括但不限于含有对应于SEQ ID N0:6、8、 14、16和20的氨基酸序列的多肽。在一些实施方案中,与具有SEQ ID NO 90的氨基酸序列的参考多肽相比,本公开 的改进的酮还原酶多肽还具有增加的对丙酮的抵抗性,其中丙酮作为底物向产物转化中的 竞争性抑制剂。具有这种增加的丙酮抵抗性的示例性多肽包括但不限于含有对应于SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的氨基酸序列的多 肽。在一些实施方案中,当用超过约100g/L的底物和小于约5g/L的多肽进行时,酮还 原酶多肽能够在小于约24小时中将至少约95%的底物转化为产物。具有这种能力的示例 性多肽包括但不限于含有对应于SEQ IDNO :6、8、14、16和20的氨基酸序列的多肽。在一些实施方案中,本公开的酮还原酶是高度地立体选择性的,并且因此能够将 底物还原为具有超过约 99%,99. 1 99. 2%,99. 3%,99. 4%,99. 5%,99. 6%,99. 7%, 99. 8%或99. 9%立体异构过量的产物。具有这种高度立体选择性的示例性酮还原酶多肽 包括但不限于含有对应于SEQ IDNO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108 和 110 的氨基酸序列的多肽。在另一方面,本公开提供编码本文所述人工改造的酮还原酶的多核苷酸或者与这 种多核苷酸在高度严格的条件下杂交的多核苷酸。所述多核苷酸可包括启动子和用于表达 所编码的人工改造的酮还原酶的其他调节元件,并且可利用为特定的所期望的表达系统而 优化的密码子。示例性多核苷酸包括但不限于SEQ ID NO :5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 或 109。示例性多核苷酸还 包括编码对应于SEQ ID NO 111、112和139的序列式的多肽的多核苷酸。 在另一方面,本公开提供含有本文所述多核苷酸和/或表达载体的宿主细胞。所 述宿主细胞可以是高加索酸奶乳杆菌或短乳杆菌或微小乳杆菌,或者它们可以是不同的生 物体。所述宿主细胞可被用来表达和分离本文所述人工改造的酮还原酶,或者可选地,它们 可被直接用来将底物转化为立体异构产物。无论用完整的细胞、细胞提取物还是纯化的酮还原酶进行该方法,都可以使用单 独的酮还原酶,或者可选地,可以使用两种或更多种酮还原酶的混合物。本文所述的酮还原酶能够催化具有结构式(I)的化合物即 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯(“底物”)中 的酮基 向具有结构式(II)的相应的立体异构醇产物即(S,E)-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)-3_羟丙基)苯甲酸甲酯(“产物”)还原的反应 在一些实施方案中,本文所述的酮还原酶能够催化具有结构式(III)的化合物即 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇(也是
“底物”)中的酮基, 向具有结构式(IV,(S,E)-l-(3-(2-(7-氯喹啉_2_基)乙烯基)苯 基)-3-(2-(2-羟丙-2-基)苯基)丙-1-醇(也是有关式(III)中底物的产物))的相应 的立体异构醇产物还原的反应 因此,在一些实施方案中,本文提供了将结构式(I)或结构式(III)中底物还原为 相应的醇产物的方法,其包括将所述底物在适于将所述底物分别还原或转化为结构式(II)或结构式(IV)中产物的反应条件下与本公开的酮还原酶多肽接触或孵化。在一些实施方案中,本文所提供的酮还原酶多肽可被用来生产用于合成结构式 (V)中化合物 2- [ 1- [[ (IR) -1- [3- [ (E) -2- (7-氯喹啉-2-基)乙烯基]苯基]-3- [2- (2-羟 丙-2-基)苯基]丙基]硫甲基]环丙基]乙酸的中间产物 包括其溶剂化物、水合物及药学上可接受的盐。在一些实施方案中,在用于合成式 (V)中化合物的方法中,所述方法中的步骤可包括在适于将所述底物还原或转化为式(II) 中产物的反应条件下使用本公开的酮还原酶多肽将式(I)中的底物还原或转化为式(II) 中的产物。在一些实施方案中,式(IV)的中间产物还可被用来合成结构式(V)中的化合物。 因此,在一些实施方案中,在用于合成式(V)中化合物的方法中,所述方法中的步骤可包括 通过在适于将所述底物还原或转化为式(IV)中产物的反应条件下将底物与本文公开的酮 还原酶接触而将式(III)中的底物还原或转化为式(IV)中的产物。在一些将底物还原为产物的方法的实施方案中,底物被还原为具有超过约99% 立体异构过量的产物,其中所述酮还原酶多肽包括对应于SEQ IDNO :6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、111 或 112的序列。在一些将底物还原为产物的方法的实施方案中,当用超过约100g/L的底物和小 于约5g/L的多肽进行时,至少约95%的底物在小于约24小时中被转化为产物,其中所述多 肽包括对应于SEQ ID NO :6、8、14、16或20的氨基酸序列。在一些将底物还原为产物的方法的实施方案中,使用约10g/L的多肽在小于约24 小时中将至少约10-20%的lg/L的底物转化为产物,其中所述多肽包括对应于SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、 106、108、110、111或112的氨基酸序列。5.附图简述

图1说明酮还原酶(KRED)在将式(I)中底物化合物向式(II)中相应产物转化中 的作用。该还原使用本文所述的KRED和辅助因子例如NADPH。葡萄糖脱氢酶(GDH)被用来 将NAD(P)+转化/再循环为NAD(P)H。葡萄糖被转化为葡萄糖酸,而随着氢氧化钠的加入, 葡萄糖酸又被转化为它的钠盐(葡萄糖酸钠)。可选地,可使用仲醇脱氢酶(例如KRED)来 将异丙醇转化为丙酮并将NAD (P) +转化/再循环为NAD (P) H。6.详述
6. 1.定义如本文所用,下列术语旨在具有下列意义。“酮还原酶”和“_”在本文中被可互换地使用以指具有将羰基还原为它相应的 醇的酶能力的多肽。更具体地说,本发明的酮还原酶多肽能够立体选择性地将上述式(I) 中的化合物还原为上述式(II)中的相应产物。所述多肽通常利用辅助因子即还原型烟酰 胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)作为还原剂。本 文所用的酮还原酶包括天然存在的(野生型的)酮还原酶以及通过人类操作而产生的非天 然存在的人工改造的多肽。“编码序列”是指编码蛋白的氨基酸序列的那部分核酸(例如基因)。“天然存在的”或“野牛型的”是指在自然中所发现的形式。例如,天然存在的或野 生型的多肽或多核苷酸序列是存在于生物体中的、可从自然中的来源分离的并且未被人类 操作有意识地修改的序列。“重组的”在提及例如细胞、核酸或多肽而被使用时,是指对应于天然或天牛形式 的物质的物质,该物质以否则在自然中不存在的方式被修饰,或者与天然或天生形式的物 质相同但是是从合成的物质和/或通过使用重组技术的操作而产生或衍生出来的。非限制 性的实例包括但不限于这样的重组细胞,其表达在天然(非重组)形式的细胞中未被发现 的基因或者表达否则以不同水平表达的天然基因。“序列同一件百分比”和“百分比同源件”在本文中可被互换使用以提及多核苷酸 和多肽中的比较,并且是通过将两个最佳地比对的序列在一个比较窗上进行比较而被确定 的,其中比较窗中的多核苷酸或多肽序列的部分与参考序列(其不包括添加或缺失)相比 可包括添加或缺失(即,缺口)以将这两个序列最佳地比对。百分比可如下计算确定两个 序列中存在相同核酸碱基或氨基酸残基的位置的数量来得到匹配位置数量,将匹配位置数 量除以比较窗中位置的总数量并将该结果乘以100以得到序列同一性百分比。可选地,百 分比可如下计算确定两个序列中存在相同核酸碱基或氨基酸残基或者核酸碱基和氨基酸 残基与缺口对齐的位置的数量而产生匹配位置数量,将匹配位置数量除以比较窗中位置的 总数量并将该结果乘以100以得到序列同一性百分比。本领域技术人员理解,存在许多可 用的确立的算法比对两个序列。可通过例如Smith和Waterman,1981,Adv. App 1. Math. 2 482的局部同源性算法、Needleman和Wunsch, 1970,J. Mol. Biol. 48 443的同源性比对算 法、Pearson 和 Lipman,1988,Proc. Natl. Acad. Sci. USA 85 2444 的相似性搜索方法、这些 算法的计算机化执行(GCGWisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)或目视 检查(通常参见Current Protocols in Molecular Biology (最新分子生物学实验方法 汇编),F. M. Ausubel 等,编辑,Current Protocols (最新实验方法),GreenePublishing Associates, Inc.和 John Wiley & Sons, Inc.之间的合资企业,(1995 补编)(Ausubel)) 来进行比较序列的最佳比对。适合于确定百分比序列同一性和序列相似性的算法的实例是 BLAST 和 BLAST 2. 0 算法,其分别被描述在 Altschul 等,1990,J. Mol. Biol. 215 403-410 和 Altschul 等,1977,Nucleic Acids Res. 3389-3402 中。用于进行 BLAST 分析的软件可通过 美国国家生物技术信息中心网站公开获得。该算法包括首先通过鉴定查询序列中长度W的 短字来鉴定高分值序列对(HSP),其在与数据库序列中相同长度的字比对时匹配或满足一 些正值的阈值分Τ。T被称作邻近字分值的阈值(Altschul等,如上述)。这些最初的邻近的字符合(word hit)被作为启动对更长的含有字符合的HSP的搜索的种子(seed)而起作 用。然后将字符合向双方向沿着每个序列扩展,直到累计比对分值被增加。对于核苷酸序 列,使用参数M(匹配的残基对儿的奖赏分值;总是>0)和N(错配的残基的惩罚分值;总是 <0)来计算累计分值。对于氨基酸序列,评分矩阵被用来计算累计分值。字符合在各方向 的延伸在下面这时停止累计比对分值从它所获得的最大值减少了数量X ;由于一个或多 个负分值残基比对的积累导致累计分值降到零或以下;或者到达任一个序列的末端。BLAST 算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)默认使用字 长度(W) 11、期望值(E) 10、M = 5、N = 4和两条链的对比。对于氨基酸序列,BLASTP程序 默认使用字长度(W) 3、期望值(E) 10和BL0SUM62评分矩阵(参见Henikoff和Henikoff, 1989,Proc Natl Acad Sci USA 89:10915)。序列比对和%序列同一性的示例性的确定可 利用 GCG Wisconsin 软件包(Accelrys,Madison WI)中的 BESTFIT 或 GAP 程序,其使用所 提供的默认参数。“参考序列”是指被用作序列比较基础的确定序列。参考序列可以是较大序列的亚 组(subset),例如全长基因或多肽序列的一部分。通常,参考序列的长度为至少20个核苷 酸或氨基酸残基、至少25个残基、至少50个残基或者全长的核酸或多肽。因为两个多核苷 酸或多肽可各自⑴包括两个序列之间相似的序列(即完整序列的一部分),并且⑵还包 括两个序列之间有分歧的序列,所以通常通过在“比较窗”中比较两个多核苷酸的序列来进 行两个(或更多个)多核苷酸或多肽之间的序列比较,以便鉴定并比较具有序列相似性的 局部区域。在一些实施方案中,“参考序列”可基于一级氨基酸序列,其中所述参考序列是可 在一级序列中具有一个或多个改变的序列。例如,“在对应于X190的残基处具有脯氨酸的 基于SEQ ID NO 4的参考序列”是指在其中SEQ ID NO 4的X190处的相应残基已被改变 为脯氨酸的参考序列。“比较窗”是指具有至少约20个连续的核苷酸位置或氨基酸残基的概念性区段, 其中可将序列与具有至少20个连续核苷酸或氨基酸的参考序列进行比较,而且其中为了 两个序列的最佳比对,比较窗中的序列部分与参考序列(其不包括添加或缺失)相比可包 括20%或更少的添加或缺失(即缺口)。比较窗可以比20个连续残基长,并且包括任选地 30、40、50、100个或更长的窗。“基本同一件”是指与参考序列在具有至少20个残基位置的比较窗且常常为至少 30-50个残基的窗中相比具有至少80%序列同一性、至少85%序列同一性和89至95%序 列同一性,更通常地至少99%序列同一性的多核苷酸或多肽序列,其中通过将参考序列与 包括缺失或添加在内的序列进行比较来计算序列同一性百分比,所述缺失或添加在比较窗 上总共占参考序列的20%或更少。在应用于多肽的特定实施方案中,术语“基本同一性”是 指在被任选地比对例如通过程序GAP或BESTFIT使用默认的缺口权重进行比对时两个多肽 序列共享至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性 或更高(例如99%序列同一性)。优选地,不相同的残基位置的区别在于保守的氨基酸取 代。“对应于”、“参照”或“相对于”在被用于给定的氨基酸或多核苷酸序列编号的上下 文中时是指在将给定的氨基酸或多核苷酸序列与参考序列比较时指定的参考序列的残基
22编号。换句话说,给定的多聚体的残基编号或残基位置是参照参考序列指定的而非通过在 给定的氨基酸或多核苷酸序列中残基的实际编号位置指定的。例如,给定的氨基酸序列例 如人工改造的酮还原酶的氨基酸序列,可与参考序列进行比对,其通过引入缺口而将两个 序列之间的残基匹配最佳化。在这些情况下,虽然存在缺口,但是给定的氨基酸或多核苷酸 序列中残基的编号是参照它与之比对的参考序列而制定的。“立体诜择件”是指在化学或酶促反应中一种立体异构体与另一种相比优先差 异形成。立体选择性可以是部分的,其中对一种立体异构体的形成的偏爱超过另一种;或 者它可以是全部的,其中只形成一种立体异构体。当立体异构体是对映体时,立体选择性 被称作对映选择性,即一种对映体在两种的总和中的分数(通常被报道为百分数)。它 通常可选地在本领域中被报道(通常作为百分数)为对映体过量(e.e.),它是根据公 式[主要对映体一次要对映体]/[主要对映体+次要对映体]从中计算而得的。当立 体异构体是非对映异构体(diastereoisomer)时,立体选择性被称作非对映立体选择性 (diastereoselectivity), ^(diastereomer)白勺一禾中白勺 分数(通常被报道为百分数)通常被可选地报道为非对映体过量(d. e.)。对映体过量和非 对映体过量是立体异构过量的类型。“高立体诜择件的”是指这样的酮还原酶多肽,其能够将底物转化或还原为具有至 少约99%立体异构过量的相应的(S)-产物。“^fim”是指在化学或酶促反应中一种立体异构体与另一种相比优先差异 转化。立体特异性可以是部分的,其中对一种立体异构体的转化的偏爱超过另一种;或者它 可以是全部的,其中只转化一种立体异构体。“化学诜择件”是指在化学或酶促反应中一种产物与另一种相比优先差异形成。“改进的酶性质”是指与参考酮还原酶相比展现了任何酶性质改进的酮还原酶多 肽。关于本文所述的人工改造的酮还原酶多肽,通常是针对野生型酮还原酶进行比较,虽然 在一些实施方案中,参考酮还原酶可以是另一个改进的人工改造的酮还原酶。期望得到改 进的酶性质包括但不限于酶活性(其可被表示为底物的转化百分比)、热稳定性、溶剂稳定 性、PH活性概况、辅助因子的要求、对抑制剂的不应性(例如产物抑制)、立体特异性和立体 选择性(包括对映体选择性)。“增加的酶活件”是指人工改造的酮还原酶多肽的改讲的件质,其可被表示为与参 考酮还原酶相比之下比活性(例如,所产生的产物/时间/蛋白重量)的增加或底物向产 物的转化百分比(例如,使用特定量的KRED在特定时间段内起始量的底物向产物的转化百 分比)的增加。确定酶活性的示例性方法在实施例中提供。可影响与酶活性相关的任何特 性,包括经典的酶性质Km、Vmax或k。at,其改变可导致酶活性的增加。酶活性的改进可以是从 约1. 5倍于相应野生型酮还原酶的酶活性到多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、 100倍或更多倍于天然存在的酮还原酶或酮还原酶多肽所衍生自的另一种人工改造的酮还 原酶的酶活性。在特定的实施方案中,人工改造的酮还原酶展现改进的酶活性,其范围是超 过母体酮还原酶的酶活性1. 5至50倍、1. 5至100倍。技术人员所理解的是,任何酶的活性 被扩散限制了以至于催化反转速率不能超过底物(其包括任何必需的辅助因子)的扩散速 率。扩散限制的理论最大值或1^/\通常是约IO8至109(Μ_ν)。因此,酮还原酶的酶活性 的任何改进将具有与所述酮还原酶所作用于其上的底物的扩散速率相关的上限。可通过用于测量酮还原酶的任一个标准测定来测量酮还原酶活性,例如由与酮向醇的还原伴随的其 氧化所致的NADPH吸光度或荧光的减少,或者通过耦合测定中所产生的产物来测量酮还原 酶活性。如本文进一步更详细地描述,使用酶的确定制剂、设定条件下的确定测定和一种或 多种确定底物来进行酶活性的比较。通常,当比较裂解产物时,确定了所测定的细胞的数目 和蛋白的量,以及使用相同表达系统和相同宿主细胞来将宿主细胞所产生的并存在于裂解 产物中的酶量的变化降至最低。“體,是指将底物酶促还原为相应的产物。“转化百分比”是指在特定条件下一 段时间内被还原为产物的底物的百分比。因此,酮还原酶多肽的“酶活性”或“活性”可被 表达为底物向产物的“转化百分比”。“热稳定的”是指与未处理的酶相比在暴露于升高的温度(例如40-80°C )下一段 时间(例如0. 5-24小时)后保持相似活性(例如超过60%至80% )的酮还原酶多肽。“溶剂稳定的”是指与未处理的酶相比在暴露于变化的浓度(例如5-99% )的溶 齐U (异丙基醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、醋酸丁酯、甲基叔丁基醚等)中一段 时间(例如0. 5-24小时)后保持相似活性(超过60%至80% )的酮还原酶多肽。“dH稳定的”是指与未处理的酶相比在暴露于高或低pH(例如4. 5-6或8至12) 中一段时间(例如0. 5-24小时)后保持相似活性(超过60%至80% )的酮还原酶多肽。“热和溶剂稳定的”是指既是热稳定的又是溶剂稳定的酮还原酶多肽。“衍牛自”如本文中在人工改造的酮还原酶的上下文中所用,鉴定所沭人工改造所 基于的起始酮还原酶和/或编码这种酮还原酶的基因。例如,通过人工地使编码SEQ ID NO 4中的高加索酸奶乳杆菌酮还原酶的基因经过多代而进化来获得SEQ ID N0:90中的人工 改造的酮还原酶。因此,该人工改造的酮还原酶“衍生自” SEQ ID NO :4中的野生型酮还原 酶。“亲水件氨基酸或残基”是指具有展现小于零的疏水性的侧链的氨基酸或残基,所 述疏水性是根据Eisenberg等,1984,J. Mol. Biol. 179 125-142中归一化的共有疏水性量 表。被遗传编码的亲水性氨基酸包括 L-Thr (T)、L-Ser (S)、L-His (H)、L-Glu (E)、L-Asn (N)、 L-Gln (Q)、L-Asp (D)、L-Lys (K)禾口 L-Arg (R)。“酸件氨基酸或残基”是指当氨基酸被包含在肽或多肽中时具有展现小于约6的 PK值的侧链的亲水性氨基酸或残基。酸性氨基酸在生理pH下由于失去了氢离子而通常具 有带负电的侧链。被遗传编码的酸性氨基酸包括L-Glu (E)和L-Asp (D)。“碱件氨基酸或残基”是指当氨基酸被包含在肽或多肽中时具有展现大于约6的 PK值的侧链的亲水性氨基酸或残基。碱性氨基酸在生理PH下由于缔合了水合氢离子而通 常具有带正电的侧链。被遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。“极性氨基酸或残基”是指具有在生理PH下不带电的侧链的亲水性氨基酸或残基, 但是它具有至少一个这样的键,在其中两个原子所共享的电子对儿与其中一个原子保持得 更近。被遗传编码的极性氨基酸包括L-Asn (N)、L-Gln (Q)、L-Ser (S)和L-Thr (T)。“疏水性氨基酸或残基”是指具有展现大于零的疏水性的侧链的氨基酸或残基,所 述疏水性是根据Eisenberg等,1984,J. Mol. Biol. 179 125-142中归一化的共有疏水性量 表。被遗传编码的疏水性氨基酸包括 L-Pro (P) ,L-Ile (I) ,L-Phe (F) ,L-Val (V) ,L-Leu (L)、 L-Trp (W)、L-Met (M)、L-Ala (A)和 L-Tyr (Y)。
“芳呑族氨某酸或残某”是指具有句,括至Φ—个芳呑族或杂芳呑族环的侧链的 亲水性或疏水性氨基酸或残基。被遗传编码的芳香族氨基酸包括L-Phe (F)、L-Tyr(Y)和 L-Trp (W)。虽然由于它的杂芳香族氮原子的pKa,L-His(H)有时候被分类为碱性残基,或者 由于它的侧链包括杂芳香族环而被分类为芳香族残基,但是在本文中组氨酸被分类为亲水 性残基或“受限残基”(参见如下)。“警限氨基酸或残基”是指具有警限的几何形状的氨基酸或残基。在本文中,受限 残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何形状,因为它具有相对小的咪唑 环。脯氨酸具有受限的几何形状,因为它也具有五元环。“非极件氨基酸或残基”是指具有在生理pH下不带电的侧链的疏水性氨基酸或 残基,而且所述侧链具有这样的键,在其中两个原子所共享的电子对儿与这两个原子中的 每一个通常保持同等距离(即,该侧链不是极性的)。被遗传编码的非极性氨基酸包括 L-Gly (G)、L-Leu (L)、L-Val (V)、L-Ile (I)、L-Met (M)和 L-Ala (A)。“脂肪族氨基酸或残基”是指具有脂肪烃侧链的疏水件氨基酸或残基。被遗传编码 的非极性氨基酸包括 L-Ala (A)、L-Val (V)、L-Leu (L)和 L-Ile (I)。“半胱氨酸”或L-Cys (C)是不普通的,因为它能够与其他L-Cys (C)氨基酸或其他 含有硫烷基或硫氢基的氨基酸形成二硫桥。“类半胱氨酸残基”包括半胱氨酸和含有能够形 成二硫桥的硫氢基部分的其他氨基酸。L-Cys (C)(和具有含-SH的侧链的其他氨基酸)以 还原的游离-SH或氧化的二硫桥形式存在于肽中的能力影响L-Cys(C)是否为肽贡献净疏 水或亲水特性。当L-Cys(C)展示根据Eisenberg(Eisenberg等,1984,见上文)归一化的 共有量表为0. 29的疏水性时,可以理解的是,为了本公开的目的,L-Cys(C)被分类到它自 己的独特的组。“小氨基酸或残基”是指具有由总共三个或更少的碳和/或杂原子(不包括α -碳 和氢)所组成的侧链的氨基酸或残基。小氨基酸或残基可根据上述定义被进一步分类为 脂肪族、非极性、极性或酸性的小氨基酸或残基。被遗传编码的小氨基酸包括L-Ala(A)、 L-Val (V)、L-Cys (C)、L-Asn (N)、L-Ser (S)、L-Thr (T)禾口 L-Asp (D)。“含羟基的氨基酸或残基”是指含有羟基(-0Η)部分的氨基酸。被遗传编码的含羟 基的氨基酸包括 L-Ser (S)、L-Thr (T)和 L-Tyr (Y)。“保守的”氨基酸取代或突变是指具有相似侧链的残基的可互换性,并且因此通常 包括多肽中的氨基酸被相同或相似的确定分类内的氨基酸所取代。然而,如本文所用,在一 些实施方案中,保守的突变不包括从亲水性残基到亲水性残基、疏水性残基到疏水性残基、 含羟基的残基到含羟基的残基或者小残基到小残基的取代,如果取而代之地保守的突变可 以是从脂肪族残基到脂肪族残基、非极性残基到非极性残基、极性残基到极性残基、酸性残 基到酸性残基、碱性残基到碱性残基、芳香族残基到芳香族残基或者受限残基到受限残基 的取代。此外,如本文所用,A、V、L或I可被保守地突变为另一种脂肪族残基或另一种非极 性残基。下面的表1显示示例性的保守取代。表1 保守取代
25 “非保守的取代”是指多肽中的氨基酸向具有显著不同的侧链件质的氨基酸讲行 的取代或突变。非保守的取代可使用上面所列的确定组之间而非之内的氨基酸。在一个实 施方案中,非保守的突变影响(a)取代(例如脯氨酸取代甘氨酸)的区域中肽骨架的结构, (b)电荷或疏水性,或(C)侧链的体积。“迹失”是指通过从参考多肽除去一个或多个氨基酸而对多肽的修饰。缺失可包括 除去1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、 15个或更多个氨基酸或者20个或更多个氨基酸、多达构成多肽的氨基酸总数目的10%、多 达构成多肽的氨基酸总数目的20%或多达构成多肽的氨基酸总数目的30%,同时保留酶 活性并且/或者保留人工改造的酮还原酶的改进的性质。缺失可针对多肽的内部部分和/ 或末端部分。在各种实施方案中,缺失可包括连续的区段或者可以是不连续的。“插入”是指通过向参考多肽添加一个或多个氨基酸而对多肽的修饰。在一些实 施方案中,改进的人工改造的酮还原酶包括向天然存在的酮还原酶多肽插入一个或多个氨 基酸以及向其他改进的酮还原酶多肽插入一个或多个氨基酸。插入可以是在多肽的内部部 分,或者在羧基或氨基末端。本文所用的插入包括本领域已知的融合蛋白。插入可以是连 续的氨基酸区段或者是被天然存在的多肽中一个或多个氨基酸所分开的。“丑段”如本文所用是指具有氨基末端和/或羧基末端缺失的多肽,但是其中余下 的氨基酸序列与序列中相应位置相同。片段可以是至少14个氨基酸的长度、至少20个氨基 酸的长度、至少50个氨基酸的长度或更长,并且长达SEQ ID NO 2或SEQ ID NO 4或SEQ ID NO 114中天然存在的酮还原酶多肽全长的70%、80%、90%、95%、98%和99%。“分离的多肽”是指基本上同天然伴随它的其他杂质例如蛋白、脂质和多核苷酸分 开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如宿主细胞或体外合成)中除去或纯化的多肽。改进的酮还原酶可以存在于细胞中,存在于细胞培养基中或者 以各种形式例如裂解产物或分离的制剂而被制备。像这样,在一些实施方案中,改进的酮还 原酶可以是分离的多肽。“某本卜.钝的多fe”是指这样的组合物,在其中所述多肽种类是所存在的优势种类 (即在摩尔或重量基础上,它比组合物中任何其他单独的大分子种类的含量更多),而且当 目标种类占存在的大分子种类至少约50% (以摩尔或%重量)时所述组合物通常是基本上 纯化的组合物。通常,基本上纯的酮还原酶组合物将包括约60%或更多、约70%或更多、约 80%或更多、约90%或更多、约95%或更多和约98%或更多的(以摩尔或%重量)存在于 组合物中的所有大分子种类。在一些实施方案中,目标种类被纯化为大致均一的(即通过 常规检测方法不能在组合物中检测到杂质种类),其中组合物基本上由单独的大分子种类 所组成。溶剂种类、小分子(< 500道尔顿)和元素离子种类不被视为大分子种类。在一 些实施方案中,分离的改进的酮还原酶多肽是基本上纯的多肽组合物。在本文中被用来指这样的条件,在其中核酸杂交体是稳定的。如本领 域技术人员所知,杂交体的稳定性反映在杂交体的解链温度(Tm)上。通常,杂交体的稳定 性是离子强度、温度、G/C含量和离液剂的存在的函数。可使用用于预测解链温度的已知 方法来计算多核苷酸的Tm值(参见例如Baldino等,Methods Enzymology 168 :761_777 ; Bolton φ, 1962, Proc. Natl. Acad. Sci. USA 48 1390 ;Bresslauer 等,1986,Proc. Natl. Acad. SciUSA 83 :8893_8897 ;Freier 等,1986,Proc. Natl. Acad. Sci USA 83 :9373_9377 ; Kierzek 等,Biochemistry 25 7840-7846 ;Rychlik 等,1990,Nucleic Acids Resl8 6409-6412 (勘误表,1991,Nucleic Acids Res 19:698) ;Sambrook 等,见上文;Suggs 等, 1981,在Developmental Biology Using Purified Genes (使用纯化的基因的发育生物学) 中(Brown 等,编辑),第 683-693 页,AcademicPress ;禾口 Wetmur,1991,Crit Rev Biochem Mol Biol 26:227-259。所有出版物通过引用并入本文)。在一些实施方案中,多核苷酸编 码本文所公开的多肽,并在确定条件(例如适度严格的或高度严格的条件)下与编码本公 开的人工改造的酮还原酶的序列的互补体进行杂交。“杂交严格性”涉及核酸的杂交中的杂交条件,例如洗涤条件。通常,在较低严格 性条件下进行杂交反应,接着在不同的但是更高的严格性下洗涤。术语“适度严格的杂 交”是指允许靶DNA结合互补核酸的条件,其中所述互补核酸与靶DNA具有大约60%的同 一性、优选地大约75%的同一性、大约85%的同一性;与靶多核苷酸具有超过大约90%的 同一性。示例性的适度严格的条件是这样的条件,其等同于在42°C下在50%甲酰胺、5X 登纳特氏溶液、5XSSPE、0. 2% SDS中杂交,接着在42°C下用0. 2XSSPE、0. 2% SDS洗涤。 “高度严格的杂交”通常是指与在溶液条件下针对确定的核苷酸序列所确定的热解链温度 Tm相差约10°C或更少的条件。在一些实施方案中,高度严格的杂交是指仅允许在65°C下 0.018M NaCl中形成稳定杂交体的那些核酸序列进行杂交的条件。(即,如果杂交体在65°C 下0. OlSMNaCl中不稳定,它在如本文所包括的高度严格的条件下将不稳定)。可通过例如 在等同于在42°C下在50%甲酰胺、5X登纳特氏溶液、5XSSPE、0. 2% SDS并接着在65°C 下用0. IX SSPE和0. 1% SDS洗涤的条件下杂交来提供高度严格的条件。另一种高度严格 的条件是在等同于在65°C下在含有0. 1% (w:v) SDS的5XSSC中杂交并在65°C下用含有 0. 1% SDS的0. IX SSC洗涤的条件下杂交。其他高度严格的杂交条件以及适度严格的条件在上面所引用的参考文献中描述。“显M&ffl”多核苷酸是指通过实验室技术被引入宿主细胞的任何多核苷酸,而且 包括从宿主细胞中取出,进行实验室操作并且之后被重新引入宿主细胞的多核苷酸。“MiiMim”是指将编码蛋白的多核苷酸的密码子改变为在特定生物体中优 先使用的那些,以使被编码的蛋白被有效地表达在感兴趣的生物体中。虽然遗传密码因 为大多数氨基酸由若干密码子(被称作“同义密码子”或“同义的”密码子)而是简并的 (degenerate),但是众所周知特定生物体的密码子选择是非随机的并且偏向于特定密码子 三联体。根据给定基因、具有共同功能或祖先起源的基因、高表达蛋白与低拷贝数蛋白的对 比以及生物体基因组的聚集蛋白编码区,密码子选择偏向可能更高。在一些实施方案中,编 码酮还原酶的多核苷酸可以是密码子优化的以从被选作表达的宿主生物体最优化地生产。“优诜的”、“最优化的”或“高度密码子诜择偏向的密码子”可互换地指与编码相 同氨基酸的其他密码子相比在蛋白编码区中以更高频率使用的密码子。可根据单个基因、 具有共同功能或起源的一组基因、高表达的基因、整个生物体的聚集蛋白编码区中的密码 子频率、相关生物体的聚集蛋白编码区中的密码子频率或其组合来确定优选的密码子。其 频率与基因表达水平一起增加的密码子通常是表达的最优化的密码子。已经知道若干方 法用于确定密码子频率(例如,密码子选择、相对同义的密码子选择)和特定生物体中的 密码子偏好,其包括多变量分析,例如使用聚类分析或对应分析和用于基因中的密码子的 有效数目(参见 GCG CodonPreference, Genetics Computer Group Wisconsin Package ; Codonff, John Peden, University of Nottingham ;McInerney, J. 0,1998, Bioinformatics 14 372-73 ;Stenico 等,1994,Nucleic Acids Res. 222437-46 ;Wright, F.,1990,Gene87 23-29)。对于越来越多的生物体可获得密码子选择表(参见例如Wada等,1992,Nucleic Acids Res. 20 :2111_2118 ;Nakamura 等,2000,Nucl. Acids Res. 28 292 ;Duret,等,见上 文;Henaut 禾口 Danchin, "Escherichia coli andSalmonella,,,1996, Neidhardt,等编辑, ASM Press, Washington D. C.,第2047-2066页)。获得密码子选择的数据来源可依靠能够 编码蛋白的任何可得的核苷酸序列。这些数据集包括实际上已知编码被表达蛋白的核酸序 列(例如,完整的编码蛋白的序列-CDS)、被表达的序列标签(ESTS)或预测的基因组序列 编石马区(参见例如 Mount, D. , Bioinformatics :Sequence andGenome Analysis,第 8 章, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, N. Y. ,2001 ;Uberbacher, Ε. C.,1996,Methods Enzymo1. 266 :259_281 ;Tiwari 等·,1997,Comput. App1. Biosci. 13 263-270)。“控制序列”在本文中被定义为包括这样的所有成分,其对于感兴趣的多核苷酸和 /或多肽的表达是必要的或有利的。每个控制序列对于编码多肽的核酸序列可以是天生的 或外来的。这种控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号 肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。为了引入特 定的限制位点以促进控制序列与编码多肽的核酸序列的编码区连接,可为控制序列提供连 接序列。“可操作地连接的”在本文中被定义为这样的构型,在其中将控制序列适当置于 (即,以功能的关系)相对于感兴趣的多核苷酸的一个位置以使所述控制序列指导或调节 感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是被宿主细胞识别以表达感兴趣的多核苷酸(例如编码序列)的核 酸序列。控制序列可包括适当的启动子序列。启动子序列含有转录控制序列,其介导感兴 趣的多核苷酸的表达。启动子可以是在所选的宿主细胞中显示转录活性的任何核酸序列, 其包括突变、截短的和杂交的启动子,并且可从编码与宿主细胞同源或异源的细胞外或细 胞内多肽的基因获得。6.2.酮还原酶
本公开提供人工改造的酮还原酶(“KRED”),其能够立体选择性地将底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯还原或转化 为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲 酯,而且与从高加索酸奶乳杆菌(SEQ ID NO 4)或短乳杆菌(SEQ IDNO 2)或微小乳杆 菌(SEQ ID NO 114)获得的天然存在的野生型KRED酶相比或者与其他人工改造的酮还 原酶相比,其具有改进的特性。所述产物化合物在孟鲁司特的合成中是有用的,孟鲁司特 也被称作Singulari 这个名字,即被用作治疗过敏症和控制哮喘的治疗剂的一种白三 烯受体拮抗剂。如本文所示,来自高加索酸奶乳杆菌的野生型酶不以任何显著的速率将 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯还原或转化 为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。 与此相反,本公开的酮还原酶能够将特定底物还原或转化为明显水平的产物。在一些实施 方案中,本公开的酮还原酶多肽具有如下要求(1)对应于SEQ ID N0:2、4或114的位置 190 (即X190)的残基是受限残基;而且⑵对应于SEQ ID NO :2、4或114的位置202 (即 X202)的残基是芳香族残基。在一些实施方案中,改进的酮还原酶多肽具有如下要求(1) 对应于SEQ ID NO :2、4或114的位置190 (即X190)的残基是受限残基;(2)对应于SEQ ID NO :2、4或114的位置195 (即X195)的残基是碱性的、酸性的、 非极性的或极性的残基;而且(3)对应于SEQ ID N0:2、4或114的位置202(即X202)的残 基是芳香族残基。如上所述,可针对高加索酸奶乳杆菌、短乳杆菌或微小乳杆菌的天然存在的酮还 原酶(也被称作“ADH”或“醇脱氢酶”)或另外人工改造的酮还原酶的氨基酸序列来描述本 公开的酮还原酶。像这样,在从起始的甲硫氨酸(M)残基(即M代表残基位置1)开始的酮 还原酶中确定氨基酸残基位置,虽然技术人员将理解可通过生物加工装置在例如宿主细胞 或体外翻译系统中除去该起始的甲硫氨酸残基以便产生缺少起始的甲硫氨酸残基的成熟 蛋白。特殊氨基酸或氨基酸改变存在于氨基酸序列中的氨基酸残基位置在本文中有时候被 描述为术语“Xn”或“位置n”,其中η是指残基位置。当相同残基位置处的氨基酸残基在酮 还原酶之间有所不同时,不同的残基可表示为含有“/”的排列“高加索酸奶乳杆菌残基/短 乳杆菌残基/微小乳杆菌残基”。取代突变,即不同氨基酸残基对参考序列例如SEQID NO 2和SEQ ID NO 4和SEQ ID NO 114的野生型酮还原酶中的氨基酸残基的替换,可被表示 为符号“一”。在本文中,突变有时候被描述为突变“至一个”类型的氨基酸。例如,SEQ ID NO 4的残基96可被突变“至一个”脂肪族残基。但是短语“至一个”的使用不排除从一类 的一个氨基酸突变至同类的另一个氨基酸。例如,SEQ ID NO :4的残基96是极性残基丝氨 酸,但是它可被突变为不同的极性残基;例如,所述突变可以是“S96T”(96 —T)突变。可从 已知编码酮还原酶活性的多核苷酸来获得高加索酸奶乳杆菌、短乳杆菌或微小乳杆菌的天
29然存在的酮还原酶(也被称作“ADH”或“醇脱氢酶”)的氨基酸序列(例如,关于高加索酸 奶乳杆菌,Genbank登录号AAP94029 GI :33112056或SEQ ID NO :3 ;关于短乳杆菌,Genbank 登录号 CAD66648 GI =28400789 或 SEQ ID NO 1 ;以及关于微小乳杆菌,SEQ ID NO :113)。在一些实施方案中,与野生型或另外人工改造的多肽相比,酮还原酶多肽的 改进的特性是关于它将式(I)中的底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯还原或转化为其相应的式(II)中的(S)-醇产物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯的活性的增 加。在一些实施方案中,酶活性的增加可体现为底物向产物转化的速率的增加,或体现为与 野生型或另外的参考序列(例如SEQ IDNO 90)相比在还原或转化相同量产物中使用较少 的改进的多肽的能力。在一些实施方案中,酮还原酶性质的改进的性质是关于还原底物至 产物中立体选择性的增加,即,这里是产物的立体异构过量的增加。在一些实施方案中,酮 还原酶多肽的改进的性质是关于它的稳定性或热稳定性。在一些实施方案中,酮还原酶多 肽具有多于一个改进的性质,例如改进的酶活性和改进的立体选择性。在一些实施方案中,本文的酮还原酶多肽可具有对参考序列(例如天然存在的多 肽或人工改造的多肽)的若干修饰,其在一些实施方案中可产生改进的酮还原酶性质。如 本文所用,“修饰”包括氨基酸取代、缺失和插入。可将任一个或一组合的修饰引入天然存 在的或人工改造的多肽以产生人工改造的酶。在这种实施方案中,对氨基酸序列修饰的数 目可包括一个或多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨 基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基 酸、15个或更多个氨基酸或者20个或更多个氨基酸,参考多肽序列的氨基酸总数目的至多 10%、氨基酸总数目的至多10%、氨基酸总数目的至多15%、氨基酸总数目的至多20%或 氨基酸总数目的至多30%。在一些实施方案中,产生改进的酮还原酶性质的对天然存在的 多肽或人工改造的多肽的修饰的数目可包括约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个参考序 列修饰。在一些实施方案中,修饰的数目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或约40个氨基酸残基。所述修饰可包括插入、缺失、取代或其组合。在一些实施方案中,修饰包括对参考序列的氨基酸取代。可产生改进的酮还原酶 性质的取代可以在一个或多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更 多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多 个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸,参考酶序列的氨基酸总数目 的至多10%、氨基酸总数目的至多20%或氨基酸总数目的至多30%。在一些实施方案中, 产生改进的酮还原酶性质的对天然存在的多肽或人工改造的多肽的取代的数目可包括参 考序列的约 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1_40个氨基酸取代。在一些实施方案中,取代的数 目可以是 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40 个氨基 酸残基。在一些实施方案中,本文的酮还原酶多肽包括与具有下述特征的基于SEQ ID NO 2、4 或 114 的参考序列至少约 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列对应于位置X190的残基是受限残基,特别是脯氨酸;而且对应于X202的残基是芳香族残基,特别是色氨酸;条件是 酮还原酶多肽具有这样的氨基酸序列,在其中对应于X190的残基是受限残基,而且对应于 X202的残基是芳香族残基。在一些实施方案中,对应于X190的残基是脯氨酸。在一些实 施方案中,对应于X202的残基是色氨酸。在一些实施方案中,酮还原酶多肽具有这样的氨 基酸序列,在其中对应于X190的残基是脯氨酸,而且对应于X202的残基是色氨酸。在一些 实施方案中,这些酮还原酶多肽与参考氨基酸序列相比可在其他残基位置上具有一个或多 个残基差异。该差异可包括各种修饰,例如取代、缺失和插入。取代可以是非保守取代、保 守取代或者非保守取代和保守取代的组合。在一些实施方案中,这些酮还原酶多肽可任选 地与参考序列相比在其他氨基酸残基位置上具有约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45 或 约1-50个残基差异。在一些实施方案中,与参考序列相比在其他氨基酸残基上的差异的数 目可以是 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45或50个 残基差异。在一些实施方案中,本文的酮还原酶多肽包括与具有下述特征的基于SEQ ID NO 2、4 或 114 的参考序列至少约 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列对应于位置X190的残基是 受限残基,特别是脯氨酸;对应于X195的残基是碱性的、酸性的、非极性的或极性的残基, 特别是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺;而且对应于X202的残基是芳香族残 基,特别是色氨酸;条件是酮还原酶多肽包括至少具有上述特征的氨基酸序列,即,对应于 X190的残基是受限残基;对应于X195的残基是碱性的、酸性的、非极性的或极性的残基;而 且对应于X202的残基是芳香族残基。在一些实施方案中,对应于X190的残基是脯氨酸。 在一些实施方案中,对应于X195的残基是精氨酸。在一些实施方案中,对应于X202的残基 是色氨酸。在一些实施方案中,酮还原酶多肽具有这样的氨基酸序列,在其中对应于X190 的残基是脯氨酸;对应于X195的残基是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺,特 别是精氨酸;而且对应于X202的残基是色氨酸。在一些实施方案中,这些酮还原酶多肽与 参考氨基酸序列相比可在其他残基位置上具有一个或多个残基差异。该差异可包括各种修 饰,例如取代、缺失和插入。取代可以是非保守取代、保守取代或者非保守取代和保守取代 的组合。在一些实施方案中,这些酮还原酶多肽可任选地与参考序列相比在其他氨基酸残 基位置上具有约 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45 或约 1-50 个残基差异。在一些实施方 案中,与参考序列相比在其他氨基酸残基位置上的差异的数目可以是1、2、3、4、5、6、7、8、9、 10、11、12、14、15、16、18、20、22、24、26、30、35、40、45 或 50 个残基差异。在一些实施方案中,改进的酮还原酶多肽包括基于SEQ ID N0:111或SEQ ID NO: 112或SEQ ID NO :139或其区域(例如对应于90-211的残基)中所陈列的序列式的氨基酸 序列。SEQ ID NO :112基于高加索酸奶乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO 4) ;SEQ ID NO :111基于短乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO 2);而且SEQ ID NO: 139基于微小乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID N0:114)。基于SEQ ID NO :111、112或139中的序列式的酮还原酶说明,对应于X190的残基是受限残基;对应于 X195的残基是碱性的、酸性的、非极性的或极性的残基;而且X202是芳香族残基。在SEQID N0:lll、112或139中的序列式的一些实施方案中,对应于X190的残基是脯氨酸;而且对应于X202的残基是色氨酸。在SEQ ID NO :111、112或139中的序列式的一些实施方案 中,对应于X190的残基是脯氨酸;对应于X195的残基是脯氨酸、精氨酸、赖氨酸、天冬氨酸 或天冬酰胺,特别是精氨酸;而且对应于X202的残基是色氨酸。如下所述,该序列式还说明 了各种残基位置的特征。 在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列并且具有本文所述对应于X190和X202的残基的特定 特征或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶多肽,还可包括如 序列式中所提供的一个或多个选自如下的特征对应于X7的残基是受限的或非极性的残 基;对应于X17的残基是非极性的或脂肪族的残基;对应于X25的残基是极性的或酸性的 残基;对应于X27的残基是芳香族的残基;对应于X41的残基是极性的、脂肪族的或非极性 的残基;对应于X53的残基是极性的、非极性的或酸性的残基;对应于X57的残基是非极性 的或脂肪族的残基;对应于X64的残基是极性的、脂肪族的或非极性的残基;对应于X66的 残基是酸性的残基;对应于X68的残基是极性的、酸性的、脂肪族的或非极性的残基;对应 于X72的残基是碱性的残基;对应于X76的残基是脂肪族的、非极性的或极性的残基;对应 于X80的残基是脂肪族的、非极性或极性的残基;对应于X93的残基是极性的、脂肪族的或 非极性的残基;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基;对应于X95的残 基是脂肪族的、非极性的或酸性的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的 或非极性的残基;对应于X97的残基是碱性的、受限的或极性的残基;对应于XlOO的残基 是碱性的、酸性的、极性的、脂肪族的或非极性的残基;对应于X108的残基是碱性的或受限 的残基;对应于Xlll的残基是非极性的或脂肪族的残基;对应于X139的残基是非极性的 或脂肪族的残基;对应于X145的残基是酸性的、脂肪族的或非极性的残基;对应于X147的 残基是芳香族的、脂肪族的或非极性的残基;对应于X148的残基是非极性的或脂肪族的残 基;对应于X151的残基是受限的、非极性的或脂肪族的残基;对应于X152的残基是极性 的、芳香族的、脂肪族的或非极性的残基;对应于X163的残基是非极性的或脂肪族的残基; 对应于X165的残基是极性的、非极性的或脂肪族的残基;对应于X173的残基是酸性的、非 极性的或脂肪族的残基;对应于X179的残基是芳香族的、碱性的、脂肪族的或非极性的残 基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基 是非极性的或脂肪族的残基;对应于X197的残基是酸性的残基;对应于X198的残基是酸 性的或极性的残基;对应于X210的残基是极性的或碱性的残基;对应于X211的残基是碱 性的、脂肪族的、非极性的、酸性的或极性的残基;对应于X212的残基是极性的、脂肪族的 或非极性的残基;对应于X216的残基是受限的或碱性的残基;对应于X223的残基是非极 性的或脂肪族的残基;对应于X226的残基是非极性的或极性的残基;对应于X233的残基 是极性的或酸性的残基;对应于X235的残基是极性的或芳香族的残基;对应于X248的残 基是非极性的或芳香族的残基;而且对应于X249的残基是芳香族的残基。在一些实施方 案中,氨基酸序列可具有至少2、3、4、5、6或更多种特征。在一些实施方案中,包括基于SEQ ID NO 111、112或139 (或其区域)中的序列式的氨基酸序列的多肽与SEQ ID NO :2、4或 114中的参考序列相比可另外在未被上面的X所指出的残基位置上具有一个或多个残基 差异。在一些实施方案中,所述差异可以是在未被上面的X所限定的其他氨基酸残基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以 是在其他氨基酸残基位置上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30,35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些 实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列的多肽与SEQ ID NO :2、4或114中的氨基酸序列相比可 具有一个或多个保守突变。示例性的保守突变包括氨基酸替换,例如但不限于用另一种芳 香族残基例如酪氨酸替换对应于X27的残基苯丙氨酸(F);用另一种非极性的或脂肪族残 基例如缬氨酸替换对应于X57的残基异亮氨酸(I);用另一种非极性的或脂肪族残基例如 缬氨酸替换对应于X64的残基丙氨酸(A);用另一种酸性的残基例如谷氨酸替换对应于X66 的残基天冬氨酸(D);用另一种碱性残基例如精氨酸替换对应于X72的残基赖氨酸(K);用 另一种非极性的或脂肪族残基例如缬氨酸替换对应于X80的残基丙氨酸(A);用另一种极 性的残基例如丝氨酸替换对应于X93的残基异亮氨酸(I);用另一种非极性的残基例如甘 氨酸替换对应于X94的残基丙氨酸(A);用另一种非极性的或脂肪族残基例如亮氨酸替换 对应于X95的残基缬氨酸(V);用另一种极性的残基例如苏氨酸替换对应于X96的残基丝 氨酸(S);用另一种非极性的或脂肪族残基例如异亮氨酸替换对应于X148的残基缬氨酸 (V);用另一种极性的残基例如丝氨酸替换对应于X152的残基苏氨酸;用另一种非极性的 或脂肪族残基例如异亮氨酸替换对应于X163的残基缬氨酸(V);用另一种芳香族残基例如 苯丙氨酸替换对应于X179的残基酪氨酸(Y);用另一种脂肪族残基例如亮氨酸替换对应于 X196的残基缬氨酸(V);用另一种酸性的残基例如谷氨酸替换对应于X198的残基天冬氨酸 (D);用另一种非极性的或脂肪族残基例如缬氨酸替换对应于X223的残基异亮氨酸(I);以 及用另一种芳香族残基例如色氨酸替换对应于X249的残基酪氨酸(Y)。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列的,具有本文所述对应于X190和X202的残基的特定特 征或对应于X190、X195和X202的残基的特定特征的酮还原酶多肽,还可包括一个或多个选 自如下的特征对应于X7的残基是组氨酸、脯氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮 氨酸或异亮氨酸,特别是甘氨酸或组氨酸;对应于X17的残基是甘氨酸、甲硫氨酸、丙氨酸、 缬氨酸、亮氨酸、异亮氨酸,特别是甲硫氨酸;对应于X25的残基是谷氨酸、天冬氨酸、丝氨 酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是苏氨酸或天冬氨酸;对应于X27的残基是酪氨酸、 苯丙氨酸、色氨酸,特别是酪氨酸;对应于X41的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰 胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是丝氨酸或丙氨酸;对应于 X53的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨 酸、异亮氨酸、天冬氨酸或谷氨酸,特别是苏氨酸、甘氨酸或天冬氨酸;对应于X57的残基是 甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸;对应于X64的残基 是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮 氨酸,特别是丝氨酸、丙氨酸或缬氨酸;对应于X66的残基是天冬氨酸或谷氨酸;对应于X68 的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨 酸、缬氨酸、亮氨酸或异亮氨酸,特别是苏氨酸、天冬氨酸、丙氨酸、缬氨酸或谷氨酸;对应于 X72的残基是赖氨酸或精氨酸,特别是精氨酸;对应于X76的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是丙氨酸或苏氨酸;对应于 X80的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨 酸或异亮氨酸,特别是丙氨酸、苏氨酸或缬氨酸;对应于X93的残基是丝氨酸、苏氨酸、谷氨 酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是异亮氨酸、 丝氨酸、丙氨酸或甘氨酸;对应于X94的残基是半胱氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨 酸、亮氨酸或异亮氨酸,特别是半胱氨酸、甘氨酸或丙氨酸;对应于X95的残基是天冬氨酸、 谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸、亮氨酸或谷 氨酸;对应于X96的残基是半胱氨酸、丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨 酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨 酸或苏氨酸;对应于X97的残基是赖氨酸、精氨酸、组氨酸、脯氨酸、丝氨酸、苏氨酸、谷氨酰 胺或天冬酰胺,特别是赖氨酸、组氨酸或丝氨酸;对应于XlOO的残基是赖氨酸、精氨酸、丝 氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是谷 氨酸、赖氨酸、谷氨酰胺或丙氨酸;对应于X108的残基是精氨酸、赖氨酸、组氨酸或脯氨酸, 特别是精氨酸或组氨酸;对应于Xlll的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸 或异亮氨酸,特别是甲硫氨酸;对应于X139的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮 氨酸或异亮氨酸,特别是亮氨酸;对应于X145的 残基是天冬氨酸、谷氨酸、甘氨酸、甲硫氨 酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是谷氨酸或亮氨酸;对应于X147的残基是酪 氨酸、苯丙氨酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是苯 丙氨酸或亮氨酸;对应于X148的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮 氨酸,特别是异亮氨酸;对应于X151的残基是脯氨酸、组氨酸、甘氨酸、甲硫氨酸、丙氨酸、 缬氨酸、亮氨酸或异亮氨酸,特别是丙氨酸;对应于X152的残基是丝氨酸、苏氨酸、谷氨酰 胺、天冬酰胺、酪氨酸、苯丙氨酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮 氨酸,特别是苏氨酸、色氨酸、丙氨酸或丝氨酸;对应于X163的残基是甘氨酸、甲硫氨酸、丙 氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是异亮氨酸;对应于X165的残基是丝氨酸、苏氨酸、 谷氨酰胺天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是天冬酰 胺;对应于X173的残基是天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异 亮氨酸,特别是缬氨酸;对应于X179的残基是酪氨酸、苯丙氨酸、色氨酸、精氨酸、赖氨酸、 甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是酪氨酸、苯丙氨酸、赖氨酸或 亮氨酸;对应于X194的残基是脯氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨 酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是脯氨酸、谷氨酰胺、丝氨酸或亮氨 酸;对应于X196的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是亮 氨酸;对应于X197的残基是天冬氨酸或谷氨酸,特别是谷氨酸;对应于X198的残基是天冬 氨酸、谷氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是天冬氨酸、谷氨酸或谷氨酰胺; 对应于X210的残基是精氨酸、赖氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是苏氨 酸或精氨酸;对应于X211的残基是赖氨酸、精氨酸、天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、 丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是赖氨酸、 缬氨酸、亮氨酸、精氨酸、苏氨酸、天冬氨酸或异亮氨酸;对应于X212的残基是丝氨酸、苏氨 酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是苏 氨酸、丝氨酸或缬氨酸;对应于X216的残基是脯氨酸、组氨酸、精氨酸或赖氨酸,特别是组氨酸或精氨酸;对应于X223的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸;对应于X226的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮 氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是苏氨酸;对应于X233的残基是丝氨酸、 苏氨酸、谷氨酰胺、天冬酰胺、天冬氨酸、谷氨酸,特别是天冬酰胺或天冬氨酸;对应于X235 的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、酪氨酸、苯丙氨酸、色氨酸,特别是丝氨酸或 色氨酸;对应于X248的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、酪氨 酸、苯丙氨酸或色氨酸,特别是甘氨酸或色氨酸;并且对应于X249的残基是酪氨酸、苯丙氨 酸或色氨酸,特别是色氨酸。在一些实施方案中,氨基酸序列可具有至少2、3、4、5、6或更 多种由上述X所定义的另外的特征。在一些实施方案中,包括基于SEQ ID N0:lll、112或 139(或其区域)中的序列式的氨基酸序列的酮还原酶多肽与SEQ ID N0:2、4或114中的参 考序列相比在未被上面的X所指出的残基位置上可另外具有一个或多个残基差异。在一些 实施方案中,所述差异可以是在未被上面的X所限定的其他氨基酸残基位置上的1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10U-11、1-12U-14、1-15U-16、1-18U_20、1-22、1-24、 1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基 酸残基位置上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或40个 残基差异。在一些实施方案中,所述差异包括保守突变。 在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,可另外具有一个或多 个或至少所有的下述特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对 应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸或甘氨酸;对应 于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是苏氨酸、半胱氨酸、缬 氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别 是亮氨酸。在一些实施方案中,酮还原酶多肽除了前述特征之外可具有一种或多种如下特 征对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是丝氨酸;对应于X194的 残基是受限的、极性的、脂肪族的或非极性的残基,特别是亮氨酸、丝氨酸或谷氨酰胺;对应 于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;并且对应于X211的残基是碱 性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨 酸。在一些实施方案中,酮还原酶多肽除了前述特征之外可具有一种或多种如下特征对应 于X17的残基是非极性的或脂肪族的残基,特别是甲硫氨酸;对应于X27的残基是芳香族的 残基,特别是酪氨酸;对应于X64的残基是极性的、非极性的或脂肪族的残基,特别是缬氨 酸;对应于X80的残基是脂肪族的、非极性的或极性的残基,特别是苏氨酸;对应于XlOO的 残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基,特别是赖氨酸;对应于X198的 残基是酸性的或极性的残基,特别是谷氨酸;并且对应于X216的残基是受限的或碱性的残 基,特别是精氨酸。在一些实施方案中,酮还原酶多肽除了前述特征之外可具有一种或多种 如下特征对应于X25的残基是极性的或酸性的残基,特别是苏氨酸;对应于X41的残基是 极性的、脂肪族的或非极性的残基,特别是丝氨酸或丙氨酸;对应于X53的残基是极性的、 非极性的或酸性的残基,特别是天冬氨酸;对应于X57的残基是非极性的或脂肪族的残基, 特别是缬氨酸;对应于X66的残基是酸性的残基,特别是谷氨酸;对应于X68的残基是极性的、酸性的、脂肪族的或非极性的残基,特别是缬氨酸;对应于X72的残基是碱性的残基,特 别是精氨酸;对应于X76的残基是脂肪族的、非极性的或极性的残基,特别是丙氨酸;对应 于X95的残基是脂肪族的、非极性的或酸性的残基,特别是亮氨酸或谷氨酸;对应于X97的 残基是碱性的、受限的或极性的残基,特别是组氨酸;对应于X108的残基是碱性的或受限 的残基,特别是组氨酸;对应于Xlll的残基是非极性的或脂肪族的残基,特别是甲硫氨酸; 对应于X139的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于X145的残基是酸 性的、脂肪族的或非极性的残基,特别是亮氨酸或谷氨酰胺;对应于X148的残基是非极性 的或脂肪族的残基,特别是异亮氨酸;对应于X151的残基是受限的、非极性的或脂肪族的 残基,特别是丙氨酸;对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的残基, 特别是丝氨酸;对应于X163的残基是非极性的或脂肪族的残基,特别是异亮氨酸;对应于 X165的残基是极性的、非极性的或脂肪族的残基,特别是天冬酰胺;对应于X173的残基是 酸性的、非极性的或脂肪族的残基,特别是缬氨酸;对应于X179的残基是芳香族的、碱性 的、脂肪族的或非极性的残基,特别 是苯丙氨酸;对应于X197的残基是酸性的残基,特别是 谷氨酸;对应于X210的残基是极性的或碱性的残基,特别是精氨酸;对应于X212的残基是 极性的、脂肪族的或非极性的残基,特别是缬氨酸或丝氨酸;对应于X223的残基是非极性 的或脂肪族的残基,特别是缬氨酸;对应于X226的残基是非极性的或极性的残基,特别是 苏氨酸;对应于X233的残基是极性的或酸性的残基,特别是天冬酰胺或天冬氨酸;对应于 X235的残基是极性的或芳香族的残基,特别是色氨酸;对应于X248的残基是非极性的或芳 香族的残基,特别是甘氨酸或色氨酸;并且对应于X249的残基是芳香族的残基,特别是色 氨酸。对于本领域技术人员将是明显的是,前述组中特征的各种组合可被用来形成本公开 的酮还原酶。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征或 对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或至少 所有的下述另外特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基特别是半 胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基特别是 苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;并且对应于X211的残基是碱性的、脂肪族 的、非极性的、酸性的或极性的残基特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施 方案中,酮还原酶多肽与SEQID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或至少所有的下述另外特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是 半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特 别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;并且对应于X147的残基是脂肪族的、 脂肪族的或非极性的残基,特别是亮氨酸。在一些实施方案中,酮还原酶多肽与SEQ ID NO
2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约1-40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、
3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约 40 个残基差异。在一些 实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、9 8%或99%相同的氨基酸序列,条件是酮还原酶具有至 少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或至 少所有的下述另外特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是 半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特 别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳香族的、脂肪 族的或非极性的残基,特别是亮氨酸;并且对应于X211的残基是碱性的、脂肪族的、非极性 的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中, 酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征或 对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或至少 所有的下述另外特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半 胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别 是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X194的残基是受限的、极性的、月旨 肪族的或非极性的残基,特别是亮氨酸、丝氨酸或谷氨酰胺;并且对应于X211的残基是碱 性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸。在一些实施方案中,酮还 原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约
40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ ID而2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。
在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或至 少所有的下述另外特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是 半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特 别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳香族的、脂肪 族的或非极性的残基,特别是亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非 极性的残基,特别是亮氨酸、丝氨酸或谷氨酰胺;并且对应于X211的残基是碱性的、脂肪族 的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实 施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异 的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施 方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或 至少所有的下述另外特征对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是 丝氨酸;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸或甘氨 酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是苏氨酸或亮 氨酸;并且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别 是苏氨酸、异亮氨酸、亮氨酸或缬氨酸。在一些实施方案中,酮还原酶多肽与SEQ ID NO :2、 4或114中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约1-40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一些 实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是酮还原酶具有至 少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或 至少所有的下述另外特征对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是 丝氨酸;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸或甘氨 酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是半胱氨酸、苏 氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的 或非极性的残基,特别是赖氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残 基,特别是亮氨酸;对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的残基,特 别是丝氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特别是亮氨 酸、丝氨酸或谷氨酰胺;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸; 并且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨 酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与SEQ IDNO:2、4或114 中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一些实施方案 中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基 于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是酮还原酶具有至少含 前述特征的氨基酸序列。 在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或 至少所有的下述另外特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对 应于X66的残基是酸性的残基,特别是谷氨酸;对应于X93的残基是极性的、脂肪族的或非 极性的残基,特别是丝氨酸或甘氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的 残基,特别是半胱氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基, 特别是异亮氨酸、亮氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的 残基,特别是亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特 别是亮氨酸、丝氨酸或谷氨酰胺;对应于X196的残基是非极性的或脂肪族的残基,特别是 亮氨酸;对应于X198的残基是酸性的或极性的残基,特别是谷氨酸;并且对应于X211的 残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是苏氨酸、缬氨酸、亮氨酸 或异亮氨酸。在一些实施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相 比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在 一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、 12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包 括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、 4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96 %、97 %、98 %或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸 序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还包括一个或多个或 至少所有的下述另外特征对应于X7的残基是受限的或非极性的残基 ,特别是组氨酸;对 应于X17的残基是非极性的或脂肪族的残基,特别是甲硫氨酸;对应于X27的残基是芳香 族的残基,特别是酪氨酸;对应于X64的残基是极性的、非极性的或脂肪族的残基,特别是 缬氨酸;对应于X66的残基是酸性的残基,特别是谷氨酸;对应于X80的残基是脂肪族的、 非极性的或极性的残基,特别是苏氨酸;对应于X93的残基是极性的、脂肪族的或非极性的 残基,特别是丝氨酸或甘氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基, 特别是半胱氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别 是异亮氨酸、亮氨酸或苏氨酸;对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的、非 极性的残基或受限的残基,特别是赖氨酸;对应于X147的残基是芳香族的、脂肪族的或非 极性的残基,特别是亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残 基,特别是亮氨酸、丝氨酸或谷氨酰胺;对应于X196的残基是非极性的或脂肪族的残基,特 别是亮氨酸;对应于X198的残基是酸性的或极性的残基,特别是谷氨酸;对应于X211的残 基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是苏氨酸、缬氨酸、亮氨酸或 异亮氨酸;并且对应于X216的残基是受限的或碱性的残基,特别是精氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是甘氨酸或组氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。
在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X17的残基是非极性的或脂肪族的残基,特别是甲硫氨酸。在一些实施方案中, 酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施 方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X25的残基是极性的或酸性的残基,特别是苏氨酸。在一些实施方案中,酮还原 酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其 他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ IDN0:2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X27的残基是芳香族的残基,特别是酪氨酸。在一些实施方案中,酮还原酶多肽 与SEQ IDNO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有1_2、1_3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10U-11、1-12、1-14、1-15、1-16、1-18U-20、1-22U_24、 1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基 酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40 个残 基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包 括与具有前述特征的基于SEQ ID N0:2、4或114的参考序列至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%相同的氨基酸序列,条件 是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特征对应于X53的残基是极性的、非极性的或酸性的残基,特别是天冬氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。
在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X64的残基是非极性的或脂肪族的残基,特别是缬氨酸。在一些实施方案中,酮 还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X80的残基是脂肪族的、非极性的或极性的残基,特别是缬氨酸或苏氨酸。在 一些实施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸 残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方案中, 差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、 20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在 一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是丝氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是甘氨酸或半胱氨酸。 在一些实施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨 基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方 案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。 在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参 考序列至少 85%、86%、87%、88% 、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98 %或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是缬氨酸、亮氨 酸、异亮氨酸、苏氨酸或半胱氨酸。在一些实施方案中,酮还原酶多肽与SEQ IDN0:2、4或 114中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一些实施 方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特征的 基于SEQ ID NO :2、4或 114 的参考序列至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是酮还原酶具有至少含 前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基,特别是赖氨 酸。在一些实施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨 基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方 案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。 在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参 考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98 %或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。
在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X108的残基是碱性的或受限的残基,特别是组氨酸。在一些实施方案中,酮还原 酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其 他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ IDN0:2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是亮氨酸。在一些实 施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异 的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施 方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X151的残基是受限的、非极性的或脂肪族的残基,特别是丙氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X165的残基是极性的、非极性的或脂肪族的残基,特别是天冬酰胺。在一些实 施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异 的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施 方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特 定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X173的残基是酸性的、非极性的或脂肪族的残基,特别是缬氨酸。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特别是丝氨酸、谷氨 酰胺或亮氨酸。在一些实施方案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相 比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在 一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、 12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包 括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、 4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96 %、97 %、98 %或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸 序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸。在一些实施方案中,酮 还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X198的残基是酸性的或极性的残基,特别是谷氨酸或谷氨酰胺。在一些实施方 案中,酮还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X210的残基是极性的或碱性的残基,特别是精氨酸。在一些实施方案中,酮还原 酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其 他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ IDNO :2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与SEQ IDN0:2、4或114 中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一些实施方案 中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基 于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、 93 %、94%、95%、96 %、97 %、98 %或99%相同的氨基酸序列,条件是酮还原酶具有至少含 前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X212的残基是极性的、脂肪族的或非极性的残基,特别是缬氨酸或丝氨酸。在 一些实施方案中,酮还原酶 多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸 残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异。在一些实施方案中, 差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、 20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在 一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99 %相同的氨基酸序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X216的残基是受限的或碱性的残基,特别是精氨酸。在一些实施方案中,酮还原 酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其 他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ IDNO :2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X223的残基是非极性的或脂肪族的残基,特别是缬氨酸。在一些实施方案中,酮 还原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID NO:2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列,条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X226的残基是非极性的或极性的残基,特别是苏氨酸。在一 些实施方案中,酮还 原酶多肽与SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1_40个残基差异。在一些实施方案中,差异的数目可以是在其 他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶 多肽包括与具有前述特征的基于SEQ ID而2、4或114的参考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列, 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特 征或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另 外特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X94的残基是 半胱氨酸、非极性的或脂肪族的残基,特别是半胱氨酸或甘氨酸;对应于X147的残基是芳 香族的、脂肪族的或非极性的残基,特别是苯丙氨酸或亮氨酸;并且对应于X196的残基是 非极性的或脂肪族的残基,特别是亮氨酸。在一些实施方案中,酮还原酶多肽与具有前述 特征的基于SEQ ID NO :2、4或114的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1-40个残基差异(例如SEQ ID NO :48)。在一些实施方案中,差 异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列(例如 SEQ ID NO 48), 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X96的残基是半 胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮 氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨酸或亮氨酸;并且对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸。在一些 实施方案中,酮还原酶多肽与具有前述特征的SEQ ID NO :2、4或114中的参考序列相比在 其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异(例如 SEQ ID N0:42、44、46或90)。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、 2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一 些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考序 列至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的氨基酸序列(例如SEQ ID NO :42、44、46或90),条件是酮还原酶具有至少含前 述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X96的残基是半 胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮 氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨 酸或亮氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;并且对应于 X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨 酸、 异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与具有前述特征的SEQ ID N0:2、4或 114中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40个残基差异(例如SEQ ID N0:88、94或102)。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4 或 114 的参考序列至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%, 95%、96%、97%、98%或99%相同的氨基酸序列(例如SEQID NO :88、94或102),条件是酮 还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X96的残基是半 胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮 氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨 酸或亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特别是亮氨 酸、谷氨酰胺或丝氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸; 并且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨 酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与具有前述特征的SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有1_2、1_3、1_4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基差异(例如SEQ ID NO :98)。在一些实施方案中,差异的数目 可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于 SEQ IDNO :2、4或114的参考序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%相同的氨基酸序列(例如SEQ ID N0:98),条件是酮还 原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特 征或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另 外特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X93的残基是 极性的、脂肪族的或非极性的残基,特别是丝氨酸;对应于X94的残基是半胱氨酸、非极性 的或脂肪族的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、月旨 肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对 应于X147的残基是芳香族的、脂肪族的或非极 性的残基,特别是苯丙氨酸或亮氨酸;对应 于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;并且对应于X211的残基是碱 性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨 酸。在一些实施方案中,酮还原酶多肽与具有前述特征的SEQ ID N0:2、4或114中的参考 序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差 异(例如SEQ ID N0:84)。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在 一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID N0:2、4或114的参考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%相同的氨基酸序列(例如SEQID NO :84),条件是酮还原酶具有至少含前述特征的氨 基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X66的残基是酸 性的残基,特别是谷氨酸;对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是 丝氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基,特别是半胱氨酸或甘氨 酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝 氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非 极性的残基,特别是苯丙氨酸或亮氨酸;对应于X196的残基是非极性的或脂肪族的残基, 特别是亮氨酸;并且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残 基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与具有前 述特征的SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1-40个残基差异(例如SEQ IDNO 64)。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列(例如 SEQ ID NO 64),
条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括 基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X17的残基是非 极性的或脂肪族的残基,特别是甲硫氨酸;对应于X27的残基是芳香族的残基,特别是酪氨 酸;对应于X64的残基是极性的、非极性的或脂肪族的残基,特别是缬氨酸;对应于X80的 残基是脂肪族的、非极性的或极性的残基,特别是苏氨酸或缬氨酸;对应于X93的残基是极 性的、脂肪族的或非极性的残基,特别是丝氨酸;对应于X94的残基是半胱氨酸、非极性的 或脂肪族的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪 族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应 于XlOO的残基是碱性的、酸性的、极性的或脂肪族的,特别是赖氨酸;对应于X147的残基 是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨酸或亮氨酸;对应于X196的残基是 非极性的或脂肪族的残基,特别是亮氨酸;并且对应于X211的残基是碱性的、脂肪族的、非 极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案 中,酮还原酶多肽与具有前述特征的SEQID NO :2、4或114中的参考序列相比在其他氨基酸 残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异(例如 SEQ ID NO 22 或24)。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,酮 还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸 序列(例如SEQ ID NO :22或24),条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X66的残基是酸 性的残基,特别是谷氨酸;对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是 丝氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基,特别是半胱氨酸或甘氨 酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、 丝氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或 非极性的残基,特别是苯丙氨酸或亮氨酸;对应于X194的残基是受限的、极性的或非极性 的残基,特别是天冬酰胺或亮氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别 是亮氨酸;对应于X198的残基是酸性的或极性的残基,特别是谷氨酸或天冬酰胺;对应于 X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸;并且对应于X216的残基是受限的或碱性的残基,特别是精氨酸。在一 些实施方案中,酮还原酶多肽与具有前述特征的SEQ ID NO :2、4或114中的参考序列相 比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异(例 如SEQ IDNO :58)。在一些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个残基差异。在一些实施 方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的氨基酸序列(例如SEQ ID NO :58),条件是酮还原酶具有至少含前述特征的氨基酸序 列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X66的残基是酸 性的残基,特别是谷氨酸;对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是 丝氨酸;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸;对应 于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是半胱氨酸、苏氨酸、缬 氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳香族的或脂肪族的残基,特别是亮氨酸; 对应于 X194的残基是受限的、极性的、脂肪族的或非极性的残基,特别是谷氨酰胺;对应于 X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于X198的残基是酸性的或极 性的残基,特别是谷氨酸;并且对应于X211的残基是碱性的、脂肪族的或非极性的残基,特 别是缬氨酸缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽与具有 前述特征的SEQ ID NO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1-40个残基差异(例如SEQ ID NO :40)。在一些实施方案中,差 异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列(例如 SEQ ID NO 40), 条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X17的残基是非 极性的或脂肪族的残基,特别是甲硫氨酸;对应于X27的残基是芳香族的残基,特别是酪氨 酸;对应于X64的残基是非极性的或脂肪族的残基,特别是缬氨酸;对应于X80的残基是脂 肪族的、非极性的或极性的残基,特别是苏氨酸或缬氨酸;对应于X93的残基是极性的、月旨 肪族的或非极性的残基,特别是丝氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族 的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于XlOO的 残基是碱性的、酸性的、极性的、非极性的或脂肪族的残基,特别是赖氨酸;对应于X147的 残基是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨酸或亮氨酸;对应于X194的残 基是受限的、极性的或非极性的残基,特别是天冬酰胺或亮氨酸;对应于X196的残基是非 极性的或脂肪族的残基,特别是亮氨酸;对应于X198的残基是酸性的或极性的残基,特别 是谷氨酸或天冬酰胺;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的 残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸;并且对应于X216的残基是受限的或碱性 的残基,特别是精氨酸。在一些实施方案中,酮还原酶多肽与具有前述特征的SEQ ID NO 2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约1-40个残基差异(例如SEQ ID NO :14或16)。在一些实施方案中,差异的数目可以是 在其他氨基酸残基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%相同的氨基酸序列(例如SEQ ID NO 14或16),条件是酮还 原酶具有至少含前述特征的氨基酸序列。
在一些实施方案中,包括基于SEQ ID NO :111、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外 特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X17的残基是非 极性的或脂肪族的残基,特别是甲硫氨酸;对应于X25的残基是极性的或酸性的残基,特别 是苏氨酸;对应于X27的残基是芳香族的残基,特别是酪氨酸;对应于X53的残基是极性 的、非极性的或酸性的残基,特别是天冬氨酸;对应于X64的残基是非极性的或脂肪族的残 基,特别是缬氨酸;对应于X80的残基是脂肪族的、非极性的或极性的残基,特别是苏氨酸 或缬氨酸;对应于X93的残基是极性的、脂肪族的或非极性的残基,特别是丝氨酸;对应于 X94的残基是半胱氨酸、非极性的或脂肪族的残基,特别是半胱氨酸或甘氨酸;对应于X96 的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、 亮氨酸、异亮氨酸或苏氨酸;对应于XlOO的残基是碱性的、酸性的、极性的、非极性的或脂 肪族的残基,特别是赖氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特 别是苯丙氨酸或亮氨酸;对应于X194的残基是受限的、极性的或非极性的残基,特别是天 冬酰胺或亮氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于 X198的残基是酸性的或极性的残基,特别是谷氨酸或天冬酰胺;对应于X211的残基是碱性 的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸; 并且对应于X216的残基是受限的或碱性的残基,特别是精氨酸。在一些实施方案中,酮还 原酶多肽与具有前述特征的SEQ IDNO :2、4或114中的参考序列相比在其他氨基酸残基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35 或约 1-40 个残基差异(例如 SEQ ID NO :6)。在一 些实施方案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、 14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特征的基于SEQ ID NO :2、4或114的参考序列至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的氨基酸序列(例如 SEQ ID NO :6),条件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,包括基于SEQ ID N0:lll、112或139或其区域(例如残基 90-211)中的序列式的氨基酸序列,具有本文所述对应于X190和X202的残基的特定特征 或对应于X190、X195和X202的残基的特定特征的改进的酮还原酶,还至少包括下述另外特 征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X17的残基是非极 性的或脂肪族的残基,特别是甲硫氨酸;对应于X25的残基是极性的或酸性的残基,特别是 苏氨酸;对应于X27的残基是芳香族的残基,特别是酪氨酸;对应于X53的残基是极性的、 非极性的或酸性的残基,特别是天冬氨酸;对应于X64的残基是非极性的或脂肪族的残基, 特别是缬氨酸;对应于X76的残基是脂肪族的、非极性的或极性的残基,特别是丙氨酸;对 应于X80的残基是脂肪族的、非极性的或极性的残基,特别是苏氨酸或缬氨酸;对应于X93 的残基是极性的、脂肪族的或非极性的残基,特别是丝氨酸;对应于X94的残基是半胱氨 酸、非极性的或脂肪族的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、 极性的、脂肪族的或非极性的残基,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨酸或 苏氨酸;对应于XlOO的残基是碱性的、酸性的、极性的、非极性的或脂肪族的残基,特别是 赖氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是苯丙氨酸或亮 氨酸;对应于X194的残基是受限的、极性的或非极性的残基,特 别是天冬酰胺或亮氨酸;对 应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于X198的残基是酸性 的或极性的残基,特别是谷氨酸或天冬酰胺;对应于X211的残基是碱性的、脂肪族的、非极 性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸;并且对应于X216 的残基是受限的或碱性的残基,特别是精氨酸。在一些实施方案中,酮还原酶多肽与具有 前述特征的SEQ IDNO :2、4或114中的参考序列相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或约1-40个残基差异(例如SEQ ID NO :8)。在一些实施方案中,差 异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或约40个残基差异。在一些实施方案中,酮还原酶多肽包括与具有前述特 征的基于 SEQ ID NO :2、4 或 114 的参考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列(例如 SEQ ID N0:8),条 件是酮还原酶具有至少含前述特征的氨基酸序列。在一些实施方案中,本公开的改进的酮还原酶包括具有对应于SEQ IDN0:111、112 或139中的序列式的残基90-211的区域或结构域的氨基酸序列,其中对应于X190的残基 是受限的残基,而对应于X202的残基是芳香族的残基。在一些实施方案中,对应于残基 90-211的结构域或区域包括这样的氨基酸序列,其中对应于X190的残基是脯氨酸,而对应 于X202的残基是色氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于 SEQ ID NO :2、4或114的参考序列的相应结构域相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残 基差异。在一些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有与在对应于X190和X202的残 基上具有前述特征的基于SEQ IDNO :2、4或114的参考序列的相应结构域至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的结构域 或区域的氨基酸序列,条件是酮还原酶结构域或区域包括至少含前述特征的氨基酸序列。在一些实施方案中,本公开的改进的酮还原酶包括具有对应于SEQIDN0:111、112 或139中的序列式的残基90-211的区域或结构域的氨基酸序列,其中对应于X190的残基 是受限的残基;对应于X195的残基是碱性的、酸性的、非极性的或极性的残基;而对应于 X202的残基是芳香族的残基。在一些实施方案中,对应于残基90-211的结构域或区域包括 这样的氨基酸序列,其中对应于X190的残基是脯氨酸;对应于X195的残基是脯氨酸、精氨 酸、赖氨酸、天冬氨酸或天冬酰胺,特别是精氨酸;而对应于X202的残基是色氨酸。在一些 实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或114的参考序列 的相应结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,差异 的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、 16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案 中,酮还原酶多肽包括具有与在对应于X190、X195和X202的残基上具有前述特征的基于 SEQ ID NO :2、4或114的参考序列的相应结构域至少85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或99%相同的结构域或区域的氨基酸序列, 条件是酮还原酶结构域或区域包括至少含前述特征的氨基酸序列。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有对应于X190和X202的残基的特定特征或对应于X190、 X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选自如 下的一种或多种特征对应于X93的残基是极性的、脂肪族的或非极性的残基;对应于X94 的残基是半胱氨酸、脂肪族的或非极性的残基;对应于X95的残基是脂肪族的、非极性的或 酸性的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于X97 的残基是碱性的、受限的或极性的残基;对应于XlOO的残基是碱性的、酸性的、极性的、月旨 肪族的或非极性的残基;对应于X108的残基是碱性的或受限的残基;对应于Xlll的残基 是非极性的或脂肪族的残基;对应于X139的残基是非极性的或脂肪族的残基;对应于X145 的残基是酸性的、脂肪族的或非极性的残基;对应于X147的残基是芳香族的、脂肪族的或 非极性的残基;对应于X148的残基是非极性的或脂肪族的残基;对应于X151的残基是受 限的、非极性的或脂肪族的残基;对应于X152的残基是极性的、芳香族的、脂肪族的或非极 性的残基;对应于X163的残基是非极性的或脂肪族的残基;对应于X165的残基是极性的、 非极性的或脂肪族的残基;对应于X173的残基是酸性的、非极性的或脂肪族的残基;对应 于X179的残基是芳香族的、碱性的、脂肪族的或非极性的残基;对应于X194的残基是受限 的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对 应于X197的残基是酸性的残基;对应于X198的残基是酸性的或极性的残基;对应于X210 的残基是极性的或碱性的残基;而且对应于X211的残基是碱性的、脂肪族的、非极性的、酸 性的或极性的残基。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或114的参考序列的相应结构域相比在其他未被上述X所指定的氨基酸残基上可另外具有约 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或1-20个残基差异。在一些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残 基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案
中,所述差异包括保守突变。 在一些实施方案中,如上所述具有包含与SEQ ID NO :111、112或139中的序列式 的残基90-211相对应的氨基酸序列的结构域或区域的酮还原酶多肽,与SEQ ID NO :2、4或 114的相应结构域的氨基酸序列相比在所述结构域或区域中可具有一个或多个保守突变。 这种保守突变的实例包括氨基酸替换例如但不限于用另一种极性残基例如丝氨酸替换对 应于X93的残基异亮氨酸(I);用另一种非极性残基例如甘氨酸替换对应于X94的残基丙 氨酸(A);用另一种非极性或脂肪族残基例如亮氨酸替换对应于X95的残基缬氨酸(V);以 及用另一种极性残基例如苏氨酸替换对应于X96的残基丝氨酸(S);用另一种非极性或脂 肪族残基例如异亮氨酸替换对应于X148的残基缬氨酸(V);用另一种极性残基例如丝氨酸 替换对应于X152苏氨酸;用另一种非极性或脂肪族残基例如异亮氨酸替换对应于X163的 残基缬氨酸(V);用另一种芳香族残基例如苯丙氨酸替换对应于X179的残基酪氨酸(Y); 以及用另一种脂肪族残基例如亮氨酸替换对应于X196的残基缬氨酸(V);用另一种酸性残 基例如谷氨酸替换对应于X198的残基天冬氨酸(D)。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有对应于X190和X202的残基的特定特征或对应于X190、 X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选自如 下的一种或多种特征对应于X93的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、 甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是异亮氨酸、丝氨酸、丙氨酸或甘氨酸; 对应于X94的残基是半胱氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特 别是半胱氨酸、甘氨酸或丙氨酸;对应于X95的残基是天冬氨酸、谷氨酸、甘氨酸、甲硫氨 酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸、亮氨酸或谷氨酸;对应于X96的残 基是半胱氨酸、丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、 亮氨酸或异亮氨酸,特别是天冬酰胺、丝氨酸、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于 X97的残基是赖氨酸、精氨酸、组氨酸、脯氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别 是赖氨酸、组氨酸或丝氨酸;对应于XlOO的残基是赖氨酸、精氨酸、丝氨酸、苏氨酸、谷氨酰 胺、天冬酰胺、甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是谷氨酸、赖氨酸、谷氨酰 胺或丙氨酸;对应于X108的残基是精氨酸、赖氨酸、组氨酸或脯氨酸,特别是精氨酸或组氨 酸;对应于Xlll的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是甲 硫氨酸;对应于X139的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别 是亮氨酸;对应于X145的残基是天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮 氨酸或异亮氨酸,特别是谷氨酸或亮氨酸;对应于X147的残基是酪氨酸、苯丙氨酸、色氨 酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是苯丙氨酸或亮氨酸;对应 于X151的残基是脯氨酸、组氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸, 特别是丙氨酸;对应于X152的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、酪氨酸、苯丙氨 酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是苏氨酸、色氨酸、 丙氨酸或丝氨酸;对应于X163的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是异亮氨酸;对应于X165的残基是丝氨酸、苏氨酸、谷氨酰胺天冬酰胺、甘氨酸、 甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是天冬酰胺;对应于X173的残基是天 冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸,特别是缬氨酸;对 应于X179的残基是酪氨酸、苯丙氨酸、色氨酸、精氨酸、赖氨酸、甘氨酸、甲硫氨酸、丙氨酸、 缬氨酸、亮氨酸或异亮氨酸,特别是酪氨酸、苯丙氨酸、赖氨酸或亮氨酸;对应于X194的残 基是脯氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨 酸、亮氨酸或异亮氨酸,特别是脯氨酸、谷氨酰胺、丝氨酸或亮氨酸;对应于X196的残基是 甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是亮氨酸;对应于X197的残基 是天冬氨酸或谷氨酸,特别是谷氨酸;对应于X198的残基是天冬氨酸、谷氨酸、丝氨酸、苏 氨酸、谷氨酰胺或天冬酰胺,特别是天冬氨酸、谷氨酸或谷氨酰胺;对应于X210的残基是精 氨酸、赖氨酸、丝氨酸、苏氨酸、谷氨酰胺或 天冬酰胺,特别是苏氨酸或精氨酸;而且对应于 X211的残基是赖氨酸、精氨酸、天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨 酸、异亮氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别是缬氨酸、亮氨酸、苏氨酸或异亮 氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或 114的参考序列的相应结构域相比在其他未被上述X所指定的氨基酸残基上可另外具有约 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残 基差异。在一些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,所述差异 包括保守突变。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应 于X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包 括选自如下的一种或多种或所有特征对应于X94的残基是半胱氨酸、脂肪族的或非极性 的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非 极性的残基,特别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;而且对应于X211的残 基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、苏氨酸或 异亮氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、 4或114的参考序列的结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残基差异。在一些实 施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、 10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。 在一些实施方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其 中所述氨基酸序列与对应于具有前述特征的基于SEQ IDNO :2、4或114的参考序列的残基 90-211 的氨基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%或 99%的同一性。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应 于X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括 选自如下的一种或多种或所有特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极 性的残基,特别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳 香族的、脂肪族的或非极性的残基,特别是亮氨酸;而且对应于X211的残基是碱性的、脂肪 族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、苏氨酸或异亮氨酸。在一些 实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或114的参考序列 的结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,差异的数 目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中, 酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中所述氨基酸序列与 对应于具有前述特征的基于SEQ ID NO :2、4或114的参考序列的残基90-211的氨基酸序列 相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%, 98%或99%的同一性。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应 于X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包 括选自如下的一种或多种或所有特征对应于X94的残基是半胱氨酸、脂肪族的或非极性 的残基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非 极性的残基,特别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X194的残基是 受限的、极性的、脂肪族的或非极性的残基,特别是丝氨酸或谷氨酰胺;而且对应于X211的 残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、苏氨酸 或异亮氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ IDNO :2、 4或114的参考序列的结构域相比在其他氨基酸残基上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残基差异。在一些实施 方案中,差异的数目可以 是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15、16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。在 一些实施方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中 所述氨基酸序列与对应于具有前述特征的基于SEQ ID NO :2、4或114的参考序列的残基 90-211 的氨基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%或 99%的同一性。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应于 X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选 自如下的一种或多种或所有特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残 基,特别是半胱氨酸或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性 的残基,特别是苏氨酸、半胱氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于X147的残基是芳香 族的、脂肪族的或非极性的残基,特别是亮氨酸;对应于X194的残基是受限的、极性的、月旨 肪族的或非极性的残基,特别是亮氨酸、丝氨酸或谷氨酰胺;而且对应于X211的残基是碱 性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨酸、亮氨酸、异亮氨酸或苏氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO:2、4或114的 参考序列的结构域相比在其他氨基酸残基上可另外具有1-2、1-3、1-4、1-5、1-6、1_7、1_8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残基差异。在一些实施方案中,差 异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、 15、16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施 方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中所述氨基 酸序列与对应于具有前述特征的基于SEQ ID NO :2、4或114的参考序列的残基90-211的 氨基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%, 96%、97%、98%或 99% 的同一性。 在一些实施方案中,具有对应于SEQ ID N0:lll、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应于 X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选 自如下的一种或多种或所有特征对应于X93的残基是极性的、脂肪族的或非极性的残基, 特别是丝氨酸;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸 或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是苏氨 酸或亮氨酸;而且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残 基,特别是苏氨酸、异亮氨酸、亮氨酸或缬氨酸。在一些实施方案中,对应于残基90-211的 区域或结构域与基于SEQ ID NO :2、4或114的参考序列的结构域相比在其他氨基酸残基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18或1-20个残基差异。在一些实施方案中,差异的数目可以是在所述结构域中其他氨 基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实 施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结构域包括至少 具有前述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特征的基于SEQ ID NO :2、4或114的参考序列的残基90-211的氨基酸序列相比具有至少85%、86%、87%、 88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。在一些实施方案中,具有对应于SEQ ID N0:lll、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应于 X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选 自如下的一种或多种或所有特征对应于X93的残基是极性的、脂肪族的或非极性的残基, 特别是丝氨酸;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基,特别是半胱氨酸 或甘氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是半胱 氨酸、苏氨酸、缬氨酸、亮氨酸或异亮氨酸;对应于XlOO的残基是碱性的、酸性的、极性的、 脂肪族的或非极性的残基,特别是赖氨酸;对应于X147的残基是芳香族的、脂肪族的或非 极性的残基,特别是亮氨酸;对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的 残基,特别是丝氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特 别是丝氨酸或谷氨酰胺;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸; 而且对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是缬氨 酸。在一些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或114的参考序列的结构域相比在其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,差异的数目可以是在所述结构域 中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。 在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结构域 包括至少具有前述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特征的 基于SEQ ID NO :2、4或114的参考序列的残基90-211的氨基酸序列相比具有至少85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一 性。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应于 X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包括选 自如下的一种或多种或所有特征对应于X93的残基是极性的、脂肪族的或非极性的残基, 特别是丝氨酸或甘氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基,特别是 半胱氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别是异亮 氨酸、亮氨酸或苏氨酸;对应于X147的残基是芳香族的、脂肪族的或非极性的残基,特别是 亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基,特别是谷氨酰胺 或丝氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于X198的 残基是酸性的或极性的残基,特别是谷氨酸;而且对应于X211的残基是碱性的、脂肪族的、 非极性的、酸性的或极性的残基,特别是苏氨酸、缬氨酸、亮氨酸或异亮氨酸。在一些实施方 案中,对应于残基90-211的区域或结构域与基于SEQ ID NO :2、4或114的参考序列的结 构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,差异的数目可 以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或 约20个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原 酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中所述氨基酸序列与对应于 具有前述特征的基于SEQ ID NO :2、4或114的参考序列的残基90-211的氨基酸序列相比 具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98% 或99%的同一性。在一些实施方案中,具有对应于SEQ ID NO 111、112或139中的序列式的残基 90-211的结构域或区域并且具有本文所述对应于X190和X202的残基的特定特征或对应 于X190、X195和X202的残基的特定特征的酮还原酶多肽,还可在所述区域或结构域中包 括选自如下的一种或多种或所有特征对应于X93的残基是极性的、脂肪族的或非极性的 残基,特别是丝氨酸或甘氨酸;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基, 特别是半胱氨酸;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,特别 是异亮氨酸、亮氨酸或苏氨酸;对应于XlOO的残基是is a碱性的、酸性的、极性的、脂肪族 的、非极性的残基或受限的残基,特别是赖氨酸;对应于X147的残基是芳香族的、脂肪族的 或非极性的残基,特别是亮氨酸;对应于X194的残基是受限的、极性的、脂肪族的或非极性 的残基,特别是谷氨酰胺或丝氨酸;对应于X196的残基是非极性的或脂肪族的残基,特别是亮氨酸;对应于X198的残基是酸性的或极性的残基,特别是谷氨酸;而且对应于X211的 残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基,特别是苏氨酸、缬氨酸、亮氨酸 或异亮氨酸。在一些实施方案中,对应于残基90-211的区域或结构域与基于SEQ ID NO 2、4或114的参考序列的结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 个残基差异。在一 些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,所述差异包括保守突 变。在一些实施方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而 且其中所述氨基酸序列与对应于具有前述特征的基于SEQ ID N0:2、4或114的参考序列 的残基90-211的氨基酸序列相比具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或 99% 的同一性。
在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基1-89的结构域或区域,其中所述结构域或区域可具有一种或多种下述特 征对应于X7的残基是受限的或非极性的残基;对应于X17的残基是非极性的或脂肪族的 残基;对应于X25的残基是极性的或酸性的残基;对应于X27的残基是芳香族的残基;对应 于X41的残基是极性的、脂肪族的或非极性的残基;对应于X53的残基是极性的、非极性的 或酸性的残基;对应于X57的残基是非极性的或脂肪族的残基;对应于X64的残基是极性 的、脂肪族的或非极性的残基;对应于X66的残基是酸性的残基;对应于X68的残基是极性 的、酸性的、脂肪族的或非极性的残基;对应于X72的残基是碱性的残基;对应于X76的残 基是脂肪族的、非极性的或极性的残基;对应于X80的残基是脂肪族的、非极性的或极性的 残基。在一些实施方案中,包括对应于SEQ ID N0:lll、112或139中的序列式的残基1-89 的区域或结构域的多肽与SEQ ID NO :2、4或114的参考序列相比在未被上述X所指定的残 基位置上可另外具有一个或多个残基差异。在一些实施方案中,所述差异可以是与SEQ ID NO :2、4或114的参考序列相比在其他未被上述X所界定的氨基酸残基位置上的1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15 或 1-16 个残基差异。在一些实施 方案中,差异的数目可以是在其他氨基酸残基位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、 15或16个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO 111、112或139中 的序列式的残基1-89的结构域或区域,其中所述结构域或区域可具有一种或多种下述特 征对应于X7的残基是组氨酸、脯氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮 氨酸,特别是甘氨酸或组氨酸;对应于X17的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮 氨酸、异亮氨酸,特别是甲硫氨酸;对应于X25的残基是谷氨酸、天冬氨酸、丝氨酸、苏氨酸、 谷氨酰胺或天冬酰胺,特别是苏氨酸或天冬氨酸;对应于X27的残基是酪氨酸、苯丙氨酸、 色氨酸,特别是酪氨酸;对应于X41的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、 甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是丝氨酸或丙氨酸;对应于X53的残基 是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨 酸、天冬氨酸或谷氨酸,特别是苏氨酸、甘氨酸或天冬氨酸;对应于X57的残基是甘氨酸、甲 硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸;对应于X64的残基是丝氨酸、 苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是丝氨酸、丙氨酸或缬氨酸;对应于X66的残基是天冬氨酸或谷氨酸;对应于X68的残基 是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、天冬氨酸、谷氨酸、甘氨酸、甲硫氨酸、丙氨酸、缬氨 酸、亮氨酸或异亮氨酸,特别是苏氨酸、天冬氨酸、丙氨酸、缬氨酸或谷氨酸;对应于X72的 残基是赖氨酸或精氨酸,特别是精氨酸;对应于X76的残基是丝氨酸、苏氨酸、谷氨酰胺、天 冬酰胺、甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是丙氨酸或苏氨酸;而且对应于 X80的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨 酸或异亮氨酸,特别是丙氨酸、苏氨酸或缬氨酸。在一些实施方案中,包括对应于SEQ ID NO 111、112或139中的序列式的残基1-89的区域或结构域的多肽与SEQ ID N0:2、4或114 的参考序列相比在未被上述X所指定的残基位置上可另外具有一个或多个残基差异。在 一些实施方案中,所述差异可以是与SEQ ID NO :2、4或114的参考序列相比在其他未被上 述 X 所界定的氨基酸残基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15或1-16个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基 位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或16个残基差异。在一些实施方案中,所 述差异包括保守突变。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基1-89的结构域或区域,其中所述结构域或区域可至少具有下述特征对应 于X7的残基是受限的或非极性的残基,特别是组氨酸。在一些实施方案中,包括对应于SEQ ID NO :111、112或139中的序列式的残基1-89的区域或结构域的多肽与SEQ ID N0:2、4或 114的参考序列相比在其他残基位置上可另外具有一个或多个残基差异。在一些实施方案 中,对应于残基1-89的区域或结构域与基于SEQ ID NO :2、4或114的参考序列的相应结构 域或区域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15或1-16个残基差异。在一些实施方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或约16个残基 差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结 构域包括至少具有前述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特 征的基于SEQ IDNO :2、4或114的参考序列的残基1_89的氨基酸序列相比具有至少85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一 性。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO 111、112或139中 的序列式的残基1-89的结构域或区域,其中所述结构域或区域可具有一种或多种或至少 所有的下述特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;而且对应于 X66的残基是酸性的残基,特别是谷氨酸。在一些实施方案中,包括对应于SEQ ID NO=IlU 112或139中的序列式的残基1-89的区域或结构域的多肽与SEQ ID NO :2、4或114的参考 序列相比在其他残基位置上可另外具有一个或多个残基差异。在一些实施方案中,对应于 残基1-89的区域或结构域与基于SEQ ID NO :2、4或114的参考序列的相应结构域相比在 其他氨基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15或1-16个残基差异。在一些实施方案中,差异的数目可以是在所述结构域中其 他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或约16个残基差异。在一些实 施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特征的基于SEQ IDN0:2、4或114的参考序列的残基1_89的氨基酸序列相比具有至少85 %、86 %、87 %、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO 111、112或139中 的序列式的残基1-89的结构域或区域,其中所述结构域或区域可具有一种或多种或至少 所有的下述特征对应于X7的残基是受限的或非极性的残基,特别是组氨酸;对应于X17 的残基是非极性的或脂肪族的残基,特别是甲硫氨酸;对应于X27的残基是芳香族的残基, 特别是酪氨酸;对应于X64的残基是极性的、脂肪族的或非极性的残基,特别是缬氨酸;而 且对应于X80的残基是脂肪族的、非极性的或极性的残基,特别是苏氨酸或缬氨酸。在一些 实施方案中,包括对应于SEQ ID N0:lll、112或139中的序列式的残基1-89的区域或结 构域的多肽与SEQ ID NO :2、4或114的参考序列相比在其他残基位置上可另外具有一个 或多个残 基差异。在一些实施方案中,对应于残基1-89的区域或结构域与基于SEQ IDNO
2、4或114的参考序列的相应结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15 或 1-16 个残基差异。在一些实施 方案中,差异的数目可以是在所述结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15或约16个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实 施方案中,酮还原酶区域或结构域包括至少具有前述特征的氨基酸序列,而且其中所述氨 基酸序列与对应于具有前述特征的基于SEQ IDNO :2、4或114的参考序列的残基1_89的 氨基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%, 96%、97%、98%或 99% 的同一性。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基212-252的结构域或区域,其中所述结构域或区域可具有一种或多种下述 特征对应于X212的残基是极性的、脂肪族的或非极性的;对应于X216的残基是受限的或 碱性的残基;对应于X223的残基是非极性的或脂肪族的残基;对应于X226的残基是非极 性的或极性的残基;对应于X233的残基是极性的或酸性的;对应于X235的残基是极性的 或芳香族的残基;对应于X248的残基是非极性的或芳香族的残基;而且对应于X249的残 基是芳香族的残基。在一些实施方案中,所述氨基酸序列可具有由上述X所界定的至少2、
3、4、5、6或更多种另外特征。在一些实施方案中,包括基于SEQID NO :111、112或139中 的序列式的氨基酸序列(或其区域)的多肽与SEQ ID NO :2、4或114的参考序列相比在未 被上述X所指定的残基位置上可另外具有一个或多个残基差异。在一些实施方案中,所述 差异可以是在其他未被上述X所界定的氨基酸残基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9或1-10个残基差异。在一些实施方案中,差异的数目可以是在其他氨基酸残基位 置上的1、2、3、4、5、6、7、8、9或约10个残基差异。在一些实施方案中,所述差异包括保守突 变。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基212-252的结构域或区域,其中所述结构域或区域可具有一种或多种下述 特征对应于X212的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、甘氨酸、甲硫氨酸、丙氨 酸、缬氨酸、亮氨酸或异亮氨酸,特别是苏氨酸、丝氨酸或缬氨酸;对应于X216的残基是脯 氨酸、组氨酸、精氨酸或赖氨酸,特别是组氨酸或精氨酸;对应于X223的残基是甘氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸,特别是缬氨酸;对应于X226的残基是甘氨酸、 甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、谷氨酰胺或天冬酰胺,特别 是苏氨酸;对应于X233的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、天冬氨酸、谷氨酸, 特别是天冬酰胺或天冬氨酸;对应于X235的残基是丝氨酸、苏氨酸、谷氨酰胺、天冬酰胺、 酪氨酸、苯丙氨酸、色氨酸,特别是丝氨酸或色氨酸;对应于X248的残基是甘氨酸、甲硫氨 酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、酪氨酸、苯丙氨酸或色氨酸,特别是甘氨酸或色氨 酸;而且对应于X249的残基是酪氨酸、苯丙氨酸或色氨酸,特别是色氨酸。在一些实施方案 中,所述氨基酸序列可具有由上述X所界定的至少2、3、4、5、6或更多种另外特征。在一些 实施方案中,包括基于SEQID N0:lll、112或139中的序列式的氨基酸序列(或其区域)的 多肽与SEQID NO :2、4或114的参考序列相比在未被上述X所指定的残基位置上可另外具 有一个或多个残基差异。在一些实施方案中,所述差异可以是在其他未被上述X所界定的 氨基酸残基位置上的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1_10个残基差异。在一些实 施方案中,差异的数目可以是在其他氨基酸残基位置上的1、2、3、4、5、6、7、8、9或约10个残 基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮 还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基212-252的结构域或区域,其中所述结构域或区域至少具有下述特征对 应于X216的残基是受限的或碱性的残基,特别是精氨酸。在一些实施方案中,包括对应于 SEQ ID NO: 111、112或139中的序列式的残基212-252的区域或结构域的多肽与具有前述 特征的SEQ ID NO :2、4或114的参考序列相比在其他残基位置上可另外具有一个或多个 残基差异。在一些实施方案中,对应于残基212-252的区域或结构域与基于SEQ ID NO :2、 4或114的参考序列的相应结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9或1_10个残基差异。在一些实施方案中,差异的数目可以是在所述 结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9或约10个残基差异。在一些实施方案 中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结构域包括至少具有前 述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特征的基于SEQ ID NO 2、4或114的参考序列的残基212-252的氨基酸序列相比具有至少85%、86%、87%、88%、 89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。在一些实施方案中,酮还原酶多肽还可包括对应于SEQ ID NO :111、112或139中 的序列式的残基212-252的结构域或区域,其中所述结构域或区域可具有一种或多种或至 少所有的下述特征对应于X212的残基是极性的、脂肪族的或非极性的残基,特别是苏氨 酸、丝氨酸或缬氨酸;对应于X216的残基是受限的或碱性的残基,特别是组氨酸或精氨酸; 对应于X223的残基是极性的、脂肪族的或非极性的,特别是缬氨酸;对应于X233的残基是 极性的或酸性的残基,特别是天冬酰胺或天冬氨酸;对应于X235的残基是极性的或芳香族 的残基,特别是丝氨酸或色氨酸;对应于X248的残基是非极性的或芳香族的残基,特别是 甘氨酸或色氨酸;而且对应于X249的残基是芳香族的残基,特别是色氨酸。在一些实施方 案中,包括对应于SEQ ID NO :111、112或139中的序列式的残基212-252的区域或结构域 的多肽与SEQ ID NO :2、4或114的参考序列相比在其他残基位置上可另外具有一个或多个 残基差异。在一些实施方案中,对应于残基212-252的区域或结构域与基于SEQ ID NO :2、 4或114的参考序列的相应结构域相比在其他氨基酸残基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1_10个残基差异。在一些实施方案中,差异的数目可以是在所述 结构域中其他氨基酸残基上的1、2、3、4、5、6、7、8、9或约10个残基差异。在一些实施方案 中,所述差异包括保守突变。在一些实施方案中,酮还原酶区域或结构域包括至少具有前 述特征的氨基酸序列,而且其中所述氨基酸序列与对应于具有前述特征的基于SEQ ID NO 2、4或114的参考序列的残基212-252的氨基酸序列相比具有至少85%、86%、87%、88%、 89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。
下表2提供本文公开的具有相关活性的特定SEQ ID NO的列表。除非另外说明, 下面的序列衍生自野生型高加索酸奶乳杆菌酮还原酶序列(SEQID N0:3和4)。在下表2 中,每行列出两个SEQ ID N0,其中的奇数指的是编码由偶数所提供的氨基酸序列的核苷酸 序列。列出突变数目的列是关于与SEQ ID NO :4中的高加索酸奶乳杆菌KRED氨基酸序列 相比之下氨基酸取代的数目。在活性列中,一个“ + ”对应于10g/L的酶在约24小时内转化 10-20%的lg/L底物的能力。两个加号“++”表示多肽比SEQ ID NO 90的活性高约1至50 倍。三个加号“+++”表示多肽比SEQ ID NO :90的活性高约50至250倍。四个加号“++++” 表示多肽比SEQ ID NO 90的活性高约250至1000倍,而五个加号“+++++”表示多肽比SEQ ID NO 90的活性高1000倍以上。表2 序列和相应的活性改进的列表 在一些实施方案中,所述多肽与基于SEQID NO :6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 或 110 的参考序列的多Jj太相 比具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%的序列同一性,条件是酮还原酶多肽氨基酸序列与SEQ ID NO :4相比包括列在表2中的任何一组取代组合。在一些实施方案中,酮还原酶多肽与参考序列相比在其他氨 基酸残基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约 1-40 个残基差异。在一些实施方 案中,差异的数目可以是在其他氨基酸残基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,所述差异包括保守突变。在一些实施方案中,酮还原酶多肽能够以至少约99 %的百分比立体异构过量和比 具有SEQ ID NO :90的氨基酸序列的参考多肽改进的速率将底物2-[3-[3-[2-(7-氯-2-喹 啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(5,幻-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。具有这种性质的示例性多肽包括但不 限于含有对应于 SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、 42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、 94、96、98、100、102、104、106、108和110的氨基酸序列的多肽。因为具有SEQ ID NO :90的 氨基酸序列的参考多肽能够以比野生型(SEQ ID N0:4)改进的速率(例如,用约10g/L的 KRED在24小时内将10-20%的lg/L底物转化为产物)和立体选择性(99%的立体异构过 量)将底物转化为产物,所以本文中比SEQ IDN0:90改进的多肽也是比野生型改进的。在一些实施方案中,酮还原酶多肽能够以至少约99%的百分比立体异构过量 和比具有SEQ ID NO :90的氨基酸序列的参考多肽改进了至少1-50倍的速率将底物
2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。具有这种 性质的示例性多肽包括但不限于含有对应于SEQ IDN0 :42、44、46、48、86、88、92、94、96、100 和102的氨基酸序列的多肽。在一些实施方案中,酮还原酶多肽能够以至少约99%的百分比立体异构过量 和比具有SEQ ID NO :90的氨基酸序列的参考多肽改进了至少50-250倍的速率将底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。具有这种性 质的示例性多肽包括但不限于含有对应于SEQ ID NO :10、32、34、36、50、64、66、68、70、72、 74、76、78、80、82、84、98、104、106 和 108 的氨基酸序列的多肽。在一些实施方案中,酮还原酶多肽能够以至少约99%的百分比立体异构过量和 比具有SEQ ID NO 90的氨基酸序列的参考多肽改进了至少250-1000倍的速率将底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。具有这种性 质的示例性多肽包括但不限于含有对应于SEQ ID NO :12、18、22、24、26、28、30、38、40、52、 54、56、58、60、62和110的氨基酸序列的多肽。在一些实施方案中,酮还原酶多肽能够以至少约99%的百分比立体异构过量 和比具有SEQ ID NO :90的氨基酸序列的参考多肽改进了至少1000倍的速率将底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。具有这种 性质的示例性多肽包括但不限于含有对应于SEQ IDN0 :6、8、14、16和20的氨基酸序列的多 肽。
在一些实施方案中,与具有SEQ ID NO :90的氨基酸序列的参考多肽相比,改进 的酮还原酶多肽可具有增加的对丙酮的抵抗性,其中丙酮被作为底物向产物转化中的竞争 性抑制剂。具有这种增加的抵抗性的示例性多肽包括但不限于含有对应于SEQ ID N0:6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的氨基酸序列的多肽。在一些实施方案中,当用超过约100g/L的底物和小于约5g/L的多肽进行时,酮还 原酶多肽能够在小于约24小时中将至少约95%的底物转化为产物。具有这种能力的示例 性多肽包括但不限于含有对应于SEQ IDN0 :6、8、14、16和20的氨基酸序列的多肽。在一些实施方案中,本公开的酮还原酶多肽是高度地立体选择性的,以便它能够 将底物还原为具有超过约 99%,99. 1%,99. 2%,99. 3%,99. 4%,99. 5%,99. 6%,99. 7%, 99. 8%或99. 9%立体异构过量的产物。具有这种高度立体选择性的示例性酮还原酶多肽 包括但不限于含有对应于SEQ IDN0 :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108 和 110 的氨基酸序列的多肽。在一些实施方案中,改进的酮还原酶多肽可包括与SEQ ID NO :2或SEQ ID NO 4 或SEQ ID NO :114或者其区域或结构域(例如残基90-211)至少约85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%相同的氨基酸序列,条件 是对应于SEQ IDN0 :2、4或114中的残基190的残基是脯氨酸,对应于SEQ ID NO :2、4或 114中的残基195的残基是精氨酸,而且对应于SEQ ID NO :2、4或114中的残基202的残 基是色氨酸,并且改进的酮还原酶多肽另外具有一种或多种下述取代以使该多肽比野生型 高加索酸奶乳杆菌酮还原酶或另一种人工改造的酮还原酶(例如SEQ ID N0:90)进一步 改进(例如,关于立体选择性、酶活性和/或热稳定性)7 — H ;17 — M ;25 — T ;27 — Y ; 41 — S ;53 — D ;57 — V ;64 — V ;66 — E ;68 — V,E ;72 — R ;76 — A ;80 — T,V ;93 — S, A, G ;94 — C,G ;95 — L,E ;96 — V, L, I,T ;97 — H,S ;100 — K,Q,A ;108 — H ;111 — M ; 139 — L ;145 — L ;147 — L ;152 — W,A,S ;163 — I ;179 — F,K,L ; 194 — Q,S,L ;196 — L ; 197 —E ; 198 —E,Q ;210 — R ;211 — V,L,R,T,D,I ;212 —S,V ;216 —R ;223 —V ;233 —N ; 235 — W ; 248 — W 和 249 — W。在一些实施方案中,改进的酮还原酶多肽可包括与SEQ ID NO :2、4或114(或者 其区域或结构域,例如残基90-211)至少约85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是对应于5£0 ID NO :2、 4或114中的残基190的残基是脯氨酸;对应于SEQ ID NO :2、4或114中的残基195的残 基是精氨酸;而且对应于SEQ ID NO :2、4或114中的残基202的残基是色氨酸,并且改进 的酮还原酶多肽另外具有至少一种或多种下述取代以使该多肽比野生型高加索酸奶乳杆 菌酮还原酶或另一种人工改造的酮还原酶(例如SEQ ID NO 90)进一步改进(例如,关于 立体选择性、酶活性和/或热稳定性):17 — M ;27 — Y ;64 — V ;80 — T ;93 — S ;94 — C ; 96 — L ;100 — K ;147 — L ;152 — S ;194 — Q 和 211 — V。如本领域技术人员将理解的,除非另外说明,上述界定的氨基酸类别中的一些不 互斥。因此,具有展现两种或更多种物理化学性质的侧链的氨基酸可被包括在多个类别中。 任何氨基酸或残基的适当分类对于本领域技术人员将是明显的,特别是鉴于本文提供的详
在一些实施方案中,改进的人工改造的酮还原酶包括天然存在的酮还原酶多肽的 缺失或其他人工改造的酮还原酶多肽的缺失。在一些实施方案中,本文所述的每种改进的 人工改造的酮还原酶可包括本文所述的多肽的缺失。因此,对于本公开的酮还原酶多肽的 各个和每个实施方案来说,缺失可包括一个或多个氨基酸、2个或更多个氨基酸、3个或更 多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个 氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸,酮还原酶 多肽的氨基酸总数目的至多10%、氨基酸总数目的至多20%或氨基酸总数目的至多30%, 只要能维持酮还原酶活性的功能性活性。在一些实施方案中,缺失可包括1_2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、
1-30、1-35或约1-40个氨基酸残基。在一些实施方案中,缺失的数目可以是1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或约 40 个氨基酸。在一些实施方案中, 缺失可包括1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或20个氨基酸残基的缺失。如本文所述,本公开的酮还原酶多肽可以是融合多肽的形式,其中所述酮还原酶 多肽被融合至其他多肽,例如但不限于抗体标签(例如myc表位)、纯化序列(例如His标 签)和细胞定位信号(例如分泌信号)。因此,酮还原酶多肽可以与或者不与其他多肽融合 而使用本文所述多肽不限于被遗传编码的氨基酸。除了被遗传编码的氨基酸之外,本 文所述的多肽可以全部或部分地包括天然存在的和/或合成的非编码氨基酸。可能包含 本文所述多肽的某些常见的非编码氨基酸包括但不限于被遗传编码的氨基酸的D-立体 异构体;2,3-二氨基丙酸(Dpr) ; a-氨基异丁酸(Aib) ; e-氨基己酸(Aha) ; S -氨基戊 酸(Ava) ;N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit) ;t_ 丁基 丙氨酸(Bua) ;t-丁基甘氨酸(Bug) ;N-甲基异亮氨酸(Melle);苯甘氨酸(Phg);环己基 丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal) ;2_氯苯丙氨酸(Ocf) ;3_氯苯丙氨酸 (Mcf) ;4-氯苯丙氨酸(Pcf) ;2-氟代苯丙氨酸(Off) ;3-氟代苯丙氨酸(Mff) ;4-氟代苯 丙氨酸(Pff) ;2-溴代苯丙氨酸(Obf) ;3-溴代苯丙氨酸(Mbf) ;4-溴代苯丙氨酸(Pbf);
2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf) ;4-甲基苯丙氨酸(Pmf) ;2-硝基苯丙氨 酸(Onf) ;3-硝基苯丙氨酸(Mnf) ;4-硝基苯丙氨酸(Pnf) ;2-氰基苯丙氨酸(Ocf) ;3-氰 基苯丙氨酸(Mcf) ;4-氰基苯丙氨酸(Pcf) ;2-三氟代甲基苯丙氨酸(Otf) ;3-三氟代甲 基苯丙氨酸(Mtf) ;4-三氟代甲基苯丙氨酸(Ptf) ;4-氨基苯丙氨酸(Paf) ;4-碘代苯丙 氨酸(Pif) ;4-氨基甲基苯丙氨酸(Pamf) ;2,4-二氯苯丙氨酸(Opef) ;3,4-二氯苯丙氨 酸(Mpcf) ;2,4-二氟代苯丙氨酸(Opff) ;3,4-二氟代苯丙氨酸(Mpff);吡啶_2_基丙氨 酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶_4_基丙氨酸(4pAla);萘基丙氨酸 (InAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻 吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨 酸(hTrp);戊氟代苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla) ;3,3_ 二 苯丙氨酸(Dfa) ;3-氨基-5-苯基戊酸(Afp);青霉胺(Pen) ; 1,2,3,4-四氢异喹啉-3-羧 酸(Tic) ; 0-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso) ;N(w)_硝基精氨酸(nArg);高 赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu) ; 1-氨基环戊-(2或3)-烯-4羧酸;哌啶酸(PA),氮 杂环丁烷-3-羧酸(ACA) ;1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸 (pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu),高缬氨酸(hVal);高异亮 氨酸(hlle);高精氨酸(hArg) ;N-乙酰赖氨酸(AcLys) ;2,4-二氨基丁酸(Dbu) ;2,3-二 氨基丁酸(Dab) ;N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟脯氨酸 (Hyp)和高脯氨酸(hPro)。可能包含本文所述多肽的另外的非编码氨基酸对于本领域技术 人员将是明显的(参见例如 Fasman,1989,CRC Practical Handbook of Biochemistryand Molecular Biology, CRC Press, Boca Raton,FL,第3-70页和本文所引用的参考文献中提 供的各种氨基酸,其全部通过引用被并入)。这些氨基酸可以是L-或D-构型的。本领域技术人员将发现,含有侧链保护基团的氨基酸或残基还可包括本文所述的 多肽。这种受保护的氨基酸(在这种情况下其属于芳香族类别)的非限制性实例包括(括 号中列出保护基团)但不限于:Arg(tos)、Cys(甲基苄基)、Cys (硝基吡啶亚氧硫基)、 Glu(6-苄酯)、Gln(氧杂蒽基)、Asn(N- 6 -氧杂蒽基).His (bom) .His (苄基).His (tos)、 Lys (fmoc)、Lys (tos)、Ser (0_ 苄基)、Thr (0-苄基)和 Tyr (0-苄基)。可能包含本文所述多肽的、构象受限的非编码氨基酸包括但不限于N-甲基氨基 酸(L-构型);1-氨基环戊_(2或3)-烯-4-羧酸;哌啶酸;氮杂环丁烷-3-羧酸;高脯氨 酸(hPro)和1-氨基环戊烷-3-羧酸。如上所述,被引入天然存在的多肽以产生人工改造的酮还原酶的各种修饰可针对 该酶的特殊性质。6. 3编码人工改造的酮还原酶的多核苷酸在另一方面,本公开提供编码人工改造的酮还原酶的多核苷酸。所述多核苷酸可 以被可操作地连接至一个或多个控制基因表达的异源性调节序列以产生能够表达该多肽 的重组多核苷酸。含有编码人工改造的酮还原酶的异源性多核苷酸的表达构建体可被引入 适当的宿主细胞以表达相应的酮还原酶多肽。因为对应于各种氨基酸的密码子的知识,蛋白序列的可用性提供对所有能够编 码所述蛋白序列的多核苷酸的描述。遗传密码的简并性(在其中相同的氨基酸被可选的 或同义的密码子所编码)允许产生极大量的核酸,其所有都编码本文公开的改进的酮还原 酶。因此,在已经鉴定了特定氨基酸序列之后,本领域技术人员可以以不改变蛋白氨基酸 序列的方式通过简单地修饰一个或多个密码子的序列来制备任何数量的不同核酸。在这点 上,本公开特别预期能够通过选择基于可能的密码子选择的组合来进行多核苷酸的各个和 每个可能的改变,而且所有这种改变都将被视为为了本文所公开的任何多肽而被特别公开 的,其中所述多肽包括呈现于表2中的氨基酸序列。在一些实施方案中,优选地选择密码子 以适应产生蛋白的宿主细胞。例如,用于细菌中的优选的密码子被用来表达细菌中的基因; 用于酵母中的优选的密码子被用于酵母中的表达;而且用于哺乳动物中的优选的密码子被 用于哺乳动物细胞中的表达。举例来说,SEQ ID NO :3的多核苷酸是为了大肠杆菌中的表 达而被优化的密码子,但是另外还编码高加索酸奶乳杆菌的天然存在的酮还原酶。在一些实施方案中,不需要替换所有密码子以将酮还原酶的密码子选择最佳化, 因为天然序列将包括优选的密码子并且因为优选的密码子的使用对于所有氨基酸残基可 能不是必需的。因此,编码酮还原酶的密码子优化的多核苷酸可在全长编码区域中约40 %、50%,60%,70%,80%或超过90%的密码子位置上含有优选的密码子。在一些实施方案中,多核苷酸包括编码酮还原酶多肽的核苷酸序列,所述酮还原 酶多肽具有与本文所述任何参考人工改造的酮还原酶多肽相比具有至少约80%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或更高 序列同一性的氨基酸序列。因此,在一些实施方案中,多核苷酸编码与具有下述特征的基 于 SEQID NO :2、4 或 114 的参考序列至少约 80%、85%、86%、87%、88%、89%、90%、91 %、 92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列对应于位置 X190的残基是受限残基,特别是脯氨酸;而且对应于X202的残基是芳香族残基,特别是色 氨酸;条件是被编码的酮还原酶多肽具有这样的氨基酸序列,在其中对应于X190的残基是 受限残基,而且对应于X202的残基是芳香族残基。在一些实施方案中,多核苷酸编码具有 一种氨基酸序列的酮还原酶,所述氨基酸序列中对应于X190的残基是脯氨酸;而且对应于 X202的残基是色氨酸。在一些实施方案中,多核苷酸编码包括与具有下述特征的基于SEQ IDN0 :2、4或 114 的参考序列至少约 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更多地相同的氨基酸序列的酮还原酶多肽对应于位置 X190的残基是受限残基,特别是脯氨酸;对应于X195的残基是碱性的、酸性的、非极性的或 极性的残基,特别是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺;而且对应于X202的残 基是芳香族残基,特别是色氨酸;条件是被编码的酮还原酶多肽包括至少具有前述特征的 氨基酸序列(即,对应于位置X190的残基是受限残基;对应于X195的残基是碱性的、酸性 的、非极性的或极性的残基;而且对应于X202的残基是芳香族残基。在一些实施方案中,被 编码的酮还原酶具有这样的氨基酸序列,其中对应于X190的残基是脯氨酸;对应于X195的 残基是脯氨酸、精氨酸、赖氨酸、天冬氨酸或天冬酰胺;而且对应于X202的残基是色氨酸。 在一些实施方案中,多核苷酸编码包括选自SEQ ID NO :6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的氨基酸序列的人工 改造的酮还原酶多肽。在一些实施方案中,多核苷酸编码包括与选自SEQ ID NO :6、8、10、12、14、16、18、 20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、 70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的参考序列 至少约 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或更多地相同的氨基酸序列的酮还原酶多肽,其中被编码的多肽具有本文中对 应于X190和X202的残基的特定特征,或者具有本文中的残基X190、X195和X202的特定特 征。在一些实施方案中,编码人工改造的酮还原酶的多核苷酸选自SEQ IDN0:5、7、9、 11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 和109。在一些实施方案中,多核苷酸能够在高度严格的条件下与包括SEQ ID N0:5、7、 9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 或109的多核苷酸杂交,其中在高度严格的条件下杂交的多核苷酸编码能够将式(I)的底物 还原或转化为式(II)的产物的酮还原酶多肽。在一些实施方案中,由严格地杂交的多核苷 酸所编码的多肽能够将式(III)的底物还原或转化为式(IV)的产物。在一些实施方案中, 由严格地杂交的多核苷酸所编码的多肽将具有特定的酶活性,以及对应于X190和X202的 残基的特定特征或者对应于X190、X195和X202的残基的特定特征。在一些实施方案中,多核苷酸编码本文所述的多肽,但在核苷酸水平上与编码人 工改造的酮还原酶的参考多核苷酸相比具有约80%或更高的序列同一性,约85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或更高的序列 同一性。在一些实施方案中,所述参考多核苷酸选自SEQ ID NO :5、7、9、11、13、15、17、19、 21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、 71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 和 109。可以以各种方式对编码改进的酮还原酶多肽的分离的多核苷酸进行操作以提供 多肽的表达。取决于表达载体,在插入载体之前对分离的多核苷酸的操作可以是期望的 或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域众所周知的。指 导被提供在 Sambrook 等 ,2001,Molecular Cloning :A Laboratory Manual,第 3 版, Cold Spring HarborLaboratory Press ;禾口 Current Protocols in Molecular Biology, Ausubel.F.编辑,Greene Pub. Associates, 1998,更新至 2006 中。关于细菌宿主细胞,用于指导本公开核酸构建体的转录的适合的启动子 包括从大肠杆菌lac操纵子、大肠杆菌trp操纵子、天蓝色链霉菌(Str印tomyces coelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣 型芽胞杆菌(Bacillus licheniformis) a-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌 (Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens) a-淀粉酶基因(amyQ)、地衣型芽胞杆菌青霉素酶基因(penP)、枯草 芽孢杆菌xylA和xylB基因和原核0 -内酰胺酶基因获得的启动子(Villa-Kamaroff等., 1978,Proc. Natl Acad. Sci. USA 75 :3727_3731),以及tac启动子(DeBoer等.,1983,Proc. Natl Acad. Sci. USA 80 :21_25)。关于丝状真菌宿主细胞,用于指导本公开核酸构建体的转录的适合的启动子包括 从米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸 蛋白酶、黑曲霉(Aspergillus niger)中性a -淀粉酶、黑曲霉酸稳定性a-淀粉酶、黑曲 霉或泡盛曲霉(Aspergillusawamori)葡萄糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱 性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰 刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶的基因获得的启动子(W096/00787),以及 NA2_tpi启动子(来自黑曲霉中性a-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂 交体)及其突变的、截短的和杂交的启动子。在酵母宿主中,有用的启动子可来自酿酒酵母烯醇化酶(EN0-1)、酿酒酵母半乳糖 激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸 甘油酸酯激酶的基因。酵母宿主细胞的其他有用的启动子被描述于Romanos等.,1992, Yeast 8 :423-488。控制序列还可以是适合的转录终止子序列,即被宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在所选宿主细胞中有 功能性的任何终止子可被用于本发明。例如,丝状真菌宿主细胞的示例性转录终止子可获得自米曲霉TAKA淀粉酶、黑曲 霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉a “葡萄糖苷酶和尖孢镰刀菌胰 蛋白酶样蛋白酶的基因。酵母宿主细胞的示例性终止子可获得自酿酒酵母烯醇化酶、酿酒酵母细胞色素 C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。酵母宿主细胞的其他有用的终止子被 描述于Romanos等 ,1992,见上文。控制序列还可以是适合的前导序列,即对于宿主细胞的翻译重要的mRNA的非翻 译区。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。在所选宿主细胞中有功 能性的任何前导序列可被使用。示例性的前导序列包括M13噬菌体pill前导序列、大肠杆 菌麦芽糖结合蛋白前导序列和大肠杆菌pelB前导序列。丝状真菌宿主细胞的前导序列可 获得自米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因。酵母宿主细胞的适合的前 导序列获得自酿酒酵母烯醇化酶(EN0-1)、酿酒酵母3-磷酸甘油酸酯激酶、酿酒酵母a -因 子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。控制序列还可以是多腺苷酸化序列,即被可操作地连接至核酸序列的3’末端的序 列,而且其在被转录时作为向被转录的mRNA添加多腺苷酸残基的信号而被宿主细胞识别。 在所选宿主细胞中有功能性的任何多腺苷酸化序列可被用于本发明。丝状真菌宿主细胞的 示例性多腺苷酸化序列可来自米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基 苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉a-葡萄糖苷酶。酵母宿主细胞的 有用的多腺苷酸化序列被描述于Guo和Sherman,1995,Mol Cell Biol5 :5983_5990。控制序列还可以是信号肽编码区,其编码被连接至多肽氨基末端并将被编码的多 肽引导进入细胞分泌途径的氨基酸序列。核酸序列的编码序列的5’端可内在地含有在翻 译阅读框架中被天然地连接编码分泌多肽的编码区片段的信号肽编码区。可选地,编码序 列的5’端可含有对于所述编码序列来说是外来的单个肽编码区。当编码序列不天然地含 有信号肽编码区时,外来的信号肽编码区可能是必需的。可选地,外来的信号肽编码区可简单地替换天然的信号肽编码区以便增强多肽的 分泌。然而,将表达多肽引导进入所选宿主细胞分泌途径的任何信号肽编码区可被用于本 发明。细菌宿主细胞的有效的信号肽编码区是从杆菌属(Bacillus)NC1B11837麦芽 糖淀粉酶、嗜热脂肪芽胞杆菌a-淀粉酶、地衣型芽胞杆菌枯草蛋白酶、地衣型芽胞杆菌 3 -内酰胺酶、嗜热脂肪芽胞杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的 基因获得的信号肽编码区。进一步的信号肽被描述于Simonen和Palva,1993,Microbiol Rev 57 :109-137。丝状真菌宿主细胞的有效的信号肽编码区可以是从米曲霉TAKA淀粉酶、黑曲霉 中性淀粉酶、黑曲霉葡萄糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和嗜热羊毛状腐质霉(Humicola lanuginosa)脂肪酶的基因获得的信 号肽编码区。酵母宿主细胞的有用的信号肽可来自酿酒酵母a-因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区被描述于Romanos等.,1992,见上文。控制序列还可以是前肽编码区,其编码被置于多肽氨基末端的氨基酸序列。所得 的多肽被称作前酶或前多肽(或者在一些情况下的酶原)。前多肽通常是无活性的,并且 可通过从所述前多肽中将前肽催化或自催化裂解而被转化为成熟的活性多肽。前肽编码 区可获得自枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母 a-因子、米赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖 酶的基因(W0 95/33836)。当信号肽区域和前肽区域二者都存在于多肽的氨基末端时,所述前肽区域被置于 多肽氨基末端邻近处,而且所述信号肽区域被置于所述前肽区域的氨基末端邻近处。还可能期望加入调节序列,其允许对与宿主细胞生长相关的多肽表达进行调节。 调节系统的实例是导致基因表达根据化学或物理刺激而被打开或关闭的那些,所述刺激包 括调节化合物的存在。在原核宿主细胞中,适合的调节序列包括lac、tac和trp操纵子系 统。在酵母宿主细胞中,适合的调节系统包括例如ADH2系统或GAL1系统。在丝状真菌中, 适合的调节序列包括TAKAa-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖 淀粉酶启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括在氨甲蝶 呤存在下被扩增的二氢叶酸还原酶基因以及与重金属一起的被扩增的金属硫蛋白基因。在 这些情况下,编码本发明的KRED多肽的核酸序列将被可操作地连接至调节序列。因此,在另一个实施方案中,本公开还针对包括编码人工改造的酮还原酶多肽或 其变体的多核苷酸以及一个或多个表达调节区例如启动子和终止子、复制起点等等的重组 表达载体,这取决于它们将被引入的宿主类型。上述各种核酸和控制序列可被连接在一起 以产生重组表达载体,其可包括一个或多个方便的限制位点以允许在此类位点插入或取代 编码多肽的核酸序列。可选地,可通过将包括所述序列的核酸序列或核酸构建体插入用于 表达的适合的载体来表达本公开的核酸序列。在产生表达载体时,编码序列位于载体中以 便将编码序列可操作地连接至用于表达的适合的控制序列。重组表达载体可以是任何载体(例如质粒或病毒),其可被方便地进行重组DNA程 序并且可导致多核苷酸序列的表达。载体的选择通常将取决于载体与其将被引入的宿主细 胞之间的相容性。载体可以是线状或闭环质粒。表达载体可以是其复制独立于染色体复制的自主复制载体,即作为染色体外的实 体存在的载体,例如质粒、染色体外元件、微型染色体或人工染色体。该载体可含有用于保 证自复制的任何工具。可选地,该载体可以是在被引入宿主细胞时被整合进基因组并与其 被整合进入的染色体一起复制的载体。此外,可以使用待引入宿主细胞基因组的单个载体 或质粒或者共同含有总DNA的两个或更多个载体或质粒,或者转座子。本发明的表达载体优选地含有一个或多个可选择标志物,其允许对被转化的细胞 的便利选取。可选择标志物是这样的基因,其产物提供杀生物剂或病毒抗性、重金属抗性、 营养缺陷体的原营养以及诸如此类。细菌的可选择标志物的实例是来自枯草芽孢杆菌或地 衣型芽胞杆菌的dal基因,或者赋予抗生素抗性例如氨苄西林、卡那霉素、氯霉素(实施例 1)或四环素抗性的标志物。酵母宿主细胞的适合的标志物是ADE2、HIS3、LEU2、LYS2、MET3、 TRP1 禾口 URA3。
用于丝状真菌宿主细胞的可选择标志物包括但不限于amdS (乙酰胺酶)、argB (鸟 氨酸氨甲酰转移酶)、bar (草丁膦乙酰转移酶)、hph (潮霉素磷酸转移酶)、niaD(硝酸盐 还原酶)、pyrG (乳清酸核苷-5 ‘-磷酸脱羧酶)、sC (硫酸腺苷基转移酶)和trpC (邻氨 基苯甲酸合成酶)及其等价物。用于曲霉属细胞的实施方案包括构巢曲霉或米曲霉的amdS 禾口 pyrG 基因禾口吸水链霄菌(Streptomyces hygroscopicus)的 bar 基因。本发明的表达载体优选地含有这样的元件,其允许载体向宿主细胞基因组中的整 合或细胞中载体独立于基因组的自主复制。关于向宿主细胞基因组中的整合,该载体可依 赖于编码多肽的核酸序列或用于通过同源或非同源的重组将载体整合进入基因组的任何 其他载体元件。可选地,表达载体可含有另外的核酸序列,其用于指导通过同源重组向宿主细胞 基因组中的整合。所述另外的核酸序列使得载体被整合进宿主细胞基因组中染色体的精 确位置处。为了增加在精确位置处整合的相似性,整合元件应该优选地含有足够数目的核 酸,例如100至10,000个碱基对儿,优选地400至10,000个碱基对儿,而且最优选地800 至10,000个碱基对儿,其中所述核酸与相应的靶序列是高度同源的以提高同源重组的可 能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可 以是非编码的或编码的核酸序列。在另一方面,可通过非同源重组将载体整合进入宿主细 胞的基因组。关于自主复制,载体还可包括复制起点,其使得载体能够在所讨论的宿主细胞中 自主地复制。细菌复制起点的实例是P15A ori (如?16.5中的质粒所示)或者质粒pBR322、 pUC19、pACYC177(其中质粒具有P15A ori)的复制起点,或者允许大肠杆菌中的复制的 PACYC184和允许芽胞杆菌中的复制的pUB110、pE194、pTA1060或pAM0 1。用于酵母宿主细 胞的复制起点的实例是2微米的复制起点,即ARS1、ARS4、ARS1和CEN3的组合、以及ARS4 和CEN6的组合。复制起点可以是具有一种突变的复制起点,所述突变使其在宿主细胞中的 功能是温度敏感的(参见例如 Ehrlich,1978,Proc Natl Acad Sci. USA 75:1433)。可将本发明多于一个拷贝的核酸序列插入宿主细胞中以增加基因产物的生产。可 通过将至少一个另外拷贝的序列整合进入宿主细胞基因组或者通过包括具有核酸序列的 可扩增的可选择标志物基因来获得核酸序列拷贝数的增加,其中含有扩增的拷贝数的可选 择标志物基因以及因此额外拷贝的核酸序列的细胞可通过在适当的可选择的剂的存在下 培养细胞来进行选择。用于本发明的许多表达载体是商业上可得的。适合的商品化的表达载体包括来 自 Sigma-Aldrich Chemicals, St. Louis M0.的 p3xFLAGTM 表达载体,其包括用于哺乳 动物宿主细胞中表达的CMV启动子和hGH多腺苷酸化位点以及用于大肠杆菌中扩增的 PBR322复制起点和氨苄西林抗性标志物。其他适合的表达载体是pBluescriptll SK(-) 和pBK-CMV (其可通过商业从Stratagene,Lajolla CA获得),以及衍生自pBR322 (Gibco BRL)、pUC (Gibco BRL)、pREP4、pCEP4 (Invitrogen)或 pPoly (Lathe 等 ,1987,Gene 57 193-201)的质粒。6. 4用于表达酮还原酶多肽的宿主细胞在另一方面,本公开提供包括编码本公开改进的酮还原酶多肽的多核苷酸的宿主 细胞,所述多核苷酸被可操作地连接至用于表达宿主细胞中酮还原酶的一个或多个控制序列。用于通过本发明的表达载体来表达KRED多肽的宿主细胞是本领域众所周知的,并且包 括但不限于细菌细胞例如大肠杆菌、高加索酸奶乳杆菌、短乳杆菌、微小乳杆菌、链霉菌和 鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞例如酵母细胞(例如酿酒酵母 或巴斯德毕赤酵母(Pichia pastoris) (ATCC登录号201178));昆虫细胞例如果蝇S2和夜 蛾Sf9细胞;动物细胞例如CHO、COS、BHK、293和Bowes黑素瘤细胞;以及植物细胞。上述 宿主细胞的适合的培养基和生长条件是本领域众所周知的。用于表达酮还原酶的多核苷酸可通过本领域已知的各种方法被引入细胞。技术包 括但不限于电穿孔、基因枪粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用 于将多核苷酸引入细胞的各种方法对于技术人员将是明显的。示例性的宿主细胞是大肠杆菌W3110。通过将编码改进的酮还原酶的多核苷酸 连接至质粒PCK110900来产生表达载体,其中所述质粒被可操作地连接至受lacl抑制子 (repressor)控制的lac启动子。所述表达载体还含有P15a复制起点和氯霉素抗性基因。 通过将细胞经过氯霉素选择来分离含有大肠杆菌W3110中目标多核苷酸的细胞。6. 5产生人工改造的酮还原酶多肽的方法在一些实施方案中,为了制备本公开中改进的KRED多核苷酸和多肽,从高加索酸 奶乳杆菌或短乳杆菌或微小乳杆菌获得(或衍生)催化还原反应的天然存在的酮还原酶。 在一些实施方案中,亲本多核苷酸序列是密码子优化的以便增强酮还原酶在特定宿主细胞 中的表达。作为说明,从低聚核苷酸构建了编码高加索酸奶乳杆菌野生型KRED多肽的亲 本多核苷酸序列,其中所述低聚核苷酸是基于Genbank数据库中可得的高加索酸奶乳杆菌 KRED序列(Genbank登录号AAP94029 GI =33112056)的已知多肽序列来制备的。被指定为 SEQ ID NO :1的亲本多核苷酸序列是密码子优化的以用于大肠杆菌中的表达,而且密码子 优化的多核苷酸被克隆进表达载体,将酮还原酶基因的表达置于lac启动子和lacl抑制子 基因的控制之下。表达大肠杆菌中活性酮还原酶的克隆被鉴定,而且基因被测序以确认它 们的身份。指定的序列(SEQ ID N0:1)是被用作大多数实验起始点的亲本序列,而且人工 改造的酮还原酶的文库构建是从高加索酸奶乳杆菌酮还原酶发展而来的。如上面讨论的,可通过将编码天然存在的酮还原酶的多核苷酸经过诱变和/或定 向进化方法来获得人工改造的酮还原酶。示例性的定向进化技术是诱变和/或DNA重排, 如 Stemmer,1994,Proc Natl Acad Sci USA91 :10747-10751;W0 95/22625 ;W0 97/0078 ; W0 97/35966 ;W0 98/27230 ;W0 00/42651 ;W0 01/75767 和美国专利 6,537,746 中所 述。其他可用的定向进化程序包括但不限于交错延伸过程(StEP)、体外重组(Zhao等., 1998,Nat. Biotechnol. 16 :258_261)、诱变 PCR(Caldwell 等.,1994,PCR MethodsAppl. 3 S136-S140)以及盒式诱变(Black 等.,1996,Proc Natl Acad Sci USA93 :3525_3529)。 可在下述参考文献中发现对于本文目的有用的另外的诱变和定向进化技术Ling, 等.,1997, "Approaches to DNA mutagenesis :anoverview (DNA ^ 7j ^ ) Anal. Biochem. 254(2) 157-78 ;Dale 等.,1996, "Oligonucleotide-directed random mutagenesis using thephosphorothioate method(使用憐硫酷方法的低聚核昔酸指导的 随机诱变)”,Methods Mol. Biol. 57 369-74 ;Smith, 1985, "In vitro mutagenesis (体外
"7Ann. Rev. Genet. 19 423-462 ;Botstein^. , 1985,"Strategies andapplications of in vitro mutagenesis (体外诱变的策略和应用)”,Science229 1193-1201 ;Carter,
851986, "Site-directed mutagenesis (位点定向诱变)”,Biochem. J. 237 1~7 ;Kramer 等 ,1984,‘‘Point Mismatch Repair (点错配修复)”,Cell, 38 :879_887 ;Wells 等 , 1985, "Cassette mutagenesis :an efficientmethod for generation of multiple mutations at defined sites (盒式诱变在确定位点产生多重突变的有效方法)”,Gene 34315-323 ;Minshull 等.,1999,"Protein evolution by molecular breeding(通 过分子育种进行的蛋白进化)”,Curr Op in Chem Biol 3 :284_290 ;Christians 等., 1999, "Directed evolution ofthymidine kinase for AZT phosphorylation using DNA family shuffling(使用DNA家族重排进行的用于AZT磷酸化的胸腺嘧啶核苷激酶定向进 化)”,Nature Biotech 17 :259_264 ;Crameri 等 ,1998,"DNA shuffling of a family ofgenes from diverse species accelerates directed evolution(来自各禾中物禾中的基因 家族的 DNA 重排加速定向进化),,,Nature 391 :288_291 ;Crameri 等.,1997,"Molecular evolution of an arsenate detoxification pathway by DNA shuffling(iEii DNA M 排进行的砷酸盐解毒途径分子进化)”,Nature Biotechl5 =436-438 ;Zhang等.,1997, "Directed evolution of an effective fructosidasefrom a galactos idase by DNA shuffling and screening(通过DNA重排和筛选进行的从半乳糖苷酶向有效的果糖苷酶的 定向进化)”,Proc Natl Acad SciUSA 94:45-4-4509 ;Crameri 等 ,1996," Improved green fluorescent protein bymolecular evolution using DNA shuffling(使用 DNA 重排通 过分子进化来改进绿色荧光蛋白)”,Nature Biotech 14 :315_319 ;以及Stemmer,1994, "Rapidevolution of a protein in vitro by DNA shuffling(通过 DNA 重排进行的体外 蛋白快速进化)”,Nature 370:389-391。所有出版物通过引用被并入本文。筛选在诱变处理之后获得的克隆中具有期望的改进的酶性质的人工改造的酮还 原酶。当被转化为NAD+或NADP+时,可使用监测NADH或NADPH浓度的减少率的标准生化技 术(通过吸光度或荧光的减少)来进行表达文库中的酶活性测量。在该反应中,随着酮还原 酶将酮底物还原为相应的羟基,NADH或NADPH被酮还原酶消耗(氧化)。如吸光度或荧光 的减少所测量的,每单位时间中NADH或NADPH浓度的减少率表示固定量的裂解产物(或从 中制备的冻干粉末)中KRED多肽的相对(酶促)活性。当期望改进的酶性质是热稳定性 时,可在将酶制剂经过确定的温度并测量热处理之后残留的酶活性的量之后测量酶活性。 含有编码酮还原酶的多核苷酸的克隆然后被分离,被测序以鉴定核苷酸序列改变(如果有 任何的话),并被用来在宿主细胞中表达酶。当已知人工改造的多肽的序列时,可根据已知的合成方法通过标准的固相方法来 制备编码酶的多核苷酸。在一些实施方案中,多达约100个碱基的片段可被分别合成,然后 连接(例如通过酶促或化学连接方法,或聚合酶介导的方法)以形成任何期望的连续序列。 例如,可使用例如Beaucage等 ,1981,Tet Lett 22 =1859-69中描述的经典的亚磷酰胺方 法或Matthes等.,1984,EMB0 J. 3 :801_05中描述的方法(例如,如它通常在自动化的合成 方法中实践的那样)通过化学合成来制备本发明的多核苷酸和低聚核苷酸。根据亚磷酰胺 方法,将低聚核苷酸在例如自动化DNA合成器中合成、纯化、退火、连接并克隆进适合的载 体。另外,可从各种商业来源中的任一种获得基本上任何核酸,其中所述商业来源例如The Midland CertifiedReagent Company, Midland, TX, The Great American Gene Company, Ramona,CA,ExpressGen Inc. Chicago,IL,Operon Technologies Inc.,Alameda,CA,以及许多其他的。可使用蛋白纯化的熟知技术中的任一种或多种从细胞和/或培养基中回收宿主 细胞中表达的人工改造的酮还原酶,其中所述技术包括但不限于溶菌酶处理、超声裂解、过 滤、盐析、超离心和色谱法。用于细胞裂解和从细菌如大肠杆菌中高效提取蛋白的适合溶液 是可以以CelLytic B 的商标名从St. Louis M0的Sigma-Aldrich通过商业获得的。用于分离酮还原酶多肽的色谱技术包括但不限于反相色谱高效液相色谱、离子交 换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分取决于例如净电荷、疏水性、 亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是明显的。在一些实施方案中,亲和技术可被用来分离改进的酮还原酶。对于亲和色谱纯化, 可以使用特异性结合酮还原酶多肽的任何抗体。为了产生抗体,可通过注射酮还原酶多肽 来对各种宿主动物进行免疫接种,所述宿主动物包括但不限于兔、小鼠、大鼠等。可通过侧 链功能基团或连接至侧链功能基团的连接体将多肽连接至适合的载体例如BSA。可根据宿 主物种而使用各种佐剂来增强免疫应答,所述佐剂包括但不限于弗氏佐剂(完全和不完全 的)、矿物凝胶例如氢氧化铝、表面活性物质例如溶血卵磷脂、普卢兰尼克多元醇类、多聚阴 离子、肽、油乳剂、钥孔血蓝蛋白、二硝基苯酚和潜在有用的人类佐剂例如BCG(卡介苗)和 短小棒状杆菌(Corynebacterium parvum)。在一些实施方案中,可以制备酮还原酶并以表达酶的细胞的形式将其用作粗提取 物或者分离的或纯化的制剂。可将酮还原酶制备成冻干产物、粉末形式(例如丙酮粉末) 或制备为酶溶液。在一些实施方案中,酮还原酶可以是基本上纯的制剂的形式。在一些实施方案中,酮还原酶多肽可被连接至固体基质。所述基质可以是固相、表 面和/或膜。固体支持体可由有机多聚体(例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙 烯氧基和聚丙烯酰胺)及其共聚物和移植物所组成。固体支持体还可以是无机的,例如玻 璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或者金属例如金或钼。底物的构型可以是 珠子、球形、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面 的。固体支持体可以是多孔的或无孔的,并且可具有膨胀的或不膨胀的特征。可以以孔、凹 陷或其他容器、器皿、特征或位置的形式形成固体支持体。可在阵列上对于试剂的机器人递 送可寻址的各种位置上或者通过检测方法和/或仪器形成许多支持体。6. 6人工改造的酮还原酶和与之一起制备的化合物的使用方法本文所述的酮还原酶可催化结构式(I)中的底物即2-[3-[3-[2-(7-氯_2_喹啉 基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯向结构式(II)中相应的立体异构产物即(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基) 乙烯基)苯基)-3_羟丙基)苯甲酸甲酯(“产物”)的还原 在另一个实施方案中,本文所述的酮还原酶能够催化结构式(III)中的化合物即 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇(也是
“底物”), 向结构式(IV,(5,幻-1-(3-(2-(7-氯喹啉-2_基)乙烯基)苯基)_3_ (2_ (2_羟 丙-2-基)苯基)丙-1-醇(也可被称作有关式(III)中底物的“产物”))中相应的立体 异构产物的还原反应 在一些实施方案中,本公开的酮还原酶可被用于将具有化学式(I)或(III)的底 物还原为相应产物的方法中,其中所述方法包括将底物在适于将所述底物分别还原或转化 为式(II)或式(IV)中产物的反应条件下与本文所述的酮还原酶多肽中任一种(或多种) 接触或孵化。在一些将底物还原为产物的方法的实施方案中,与SEQ ID NO :4、2和114的野生 型高加索酸奶乳杆菌或短乳杆菌或微小乳杆菌KRED序列相比,酮还原酶多肽至少具有下 面的特征(1)对应于X190的残基是受限残基而且(2)对应于X202的残基是芳香族残基。 在一些实施方案中,与SEQ ID NO :4、2和114的野生型高加索酸奶乳杆菌或短乳杆菌或微 小乳杆菌KRED序列相比,酮还原酶多肽至少具有下面的特征(1)对应于X190的残基是受 限残基;⑵对应于195的残基是碱性的、酸性的或极性的残基;而且(3)对应于X202的残 基是芳香族残基。在一些将底物还原为产物的方法的实施方案中,底物被还原为具有超过约99% 立体异构过量的产物,其中所述酮还原酶多肽包括对应于SEQ IDN0:6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、111 或 112的序列。在一些将底物还原为产物的方法的实施方案中,当用超过约100g/L的底物和小 于约5g/L的多肽进行时,至少约95%的底物在小于约24小时中被转化为产物,其中所述多 肽包括对应于SEQ ID NO :6、8、14、16和20的氨基酸序列。在一些将底物还原为产物的方法的实施方案中,使用约10g/L的多肽在小于约24小时中将至少约10-20%的lg/L的底物转化为产物,其中所述多肽包括对应于SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、 106、108、110、111或112的氨基酸序列。在一些实施方案中,本文所提供的酮还原酶多肽可被用来生产用于合成结构式 (V)中化合物的中间产物 其包括溶剂化物、水合物及其药学上可接受的盐。式(V)中的化合物即 2-[l-[[(lR)-l_[3-[(E)-2-(7-氯喹啉-2-基)乙烯基]苯基]_3_ [2-(2-羟丙-2-基)苯 基]丙基]硫甲基]环丙基]乙酸(也被称作孟鲁司特)是可以以式(Va)中所示的钠盐形 式(即(R,E)-2-(l-((l-(3-(2(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羟丙-2-基) 苯基)丙基硫)甲基)环丙基)乙酸钠)通过商业获得的 如上所述而不被理论所约束,孟鲁司特是白三烯受体拮抗剂(LTRA)并且看来似 乎阻断白三烯D4对半胱氨酰白三烯受体CysLTl的作用。为了过敏症的治疗和哮喘的维持 治疗而将孟鲁司特开处方(参见例如美国专利第5,565,473号)。在一些合成孟鲁司特的实 施方案中,重要的中间产物是式(II)的化合物。因此,在用于合成化合物(V)的方法中,该 方法的一个步骤可包括在适于将所述底物还原或转化为式(II)中产物的条件下将式(I) 的底物与本公开的酮还原酶多肽反应或接触。在一些实施方案中,可以从式(II)中的化合物合成式(V)中的化合物,如方案I 中所说明以及如美国申请公布20070135480和20050245568中所述。
因此,在一些实施方案中,用于合成化合物(V)的方法可包括(a)用本公开的酮 还原酶将化合物(I)还原或转化为化合物(II) ; (b)将化合物(II)与甲基磺酰氯反应以 形成式(VI)中的化合物;(c)将化合物(VI)转化成式(VII)中的硫代(thio)化合物,接 着转化为式(Vila)中的化合物;(d)将硫代化合物(Vila)与式(X)的化合物反应以形成 式(IX)中的化合物,其中R’是离去基团而R是H或C1-C4烷基;以及(e)将化合物(IX)转化为式(Vb)中的化合物或其盐例如式(Va)。在一些实施方案中,其他的烷基磺酰卤素 或芳基磺酰卤素可替代甲基磺酰氯来使用。式(IX)中的化合物向式(Vb)中的化合物的 转化可使用CH3Li但该步骤还可使用格氏试剂例如甲基卤化镁来进行(参见美国申请公布 20070135480)。在一些实施方案中,上述步骤(c)之后的可选过程可包括(d)将式(VII) 中的化合物转化成式(VIII)中的化合物,接着转化为式(Vllb)中的化合物,以及(e)将硫 代化合物(X)与化合物(Vllb)反应以形成式(Vb)中的化合物或其盐。各步骤的细节和条 件被描述在美国申请公布20070135480和20050245568中。在一些实施方案中,孟鲁司特的合成可使用式(IV)的中间产物。因此,在一些实 施方案中,在用于合成式(V)的化合物的方法中,该方法的一个步骤可包括在适于将所述 底物还原或转化为式(VI)中产物的条件下通过将底物与本文所公开的酮还原酶接触而将 式(III)中的底物还原或转化为式(IV)中的产物。在一些实施方案中,可由式(IV)中的产物来合成孟鲁司特化合物,如方案II中所 说明以及如美国申请公布第2005/0234241号和美国专利第7,189,853号中所述
(XIII)
NaOMe 或 NaOH
(V
方案2因此,在一些实施方案中,用于合成化合物(V)的方法可包括(a)用本公开的酮 还原酶将化合物(I)还原或转化为化合物(II) ; (b)将式(IV)中的化合物与甲基磺酰氯反 应以形成式(VI)中的化合物;(C)将式(XIII)中的巯基化合物与式(IV)中的化合物偶合 以形成式(VII)中的化合物,其中X是-CN或C0NH2 ;以及(d)将式(VII)中的化合物转化 为式(V)中的化合物或其盐。在一些实施方案中,还可由式(II)中的产物来合成孟鲁司特化合物,如下面的方案III中所说明以及如美国专利第5,614632号中所述,其公开通过引用被并入本文(参见 美国专利5,614,632的实施例5-8)。在方案III中,使用本公开的酮还原酶将式(I)中的 底物还原为式(II)中的产物;然后通过例如使用格氏试剂(甲基氯化镁)转化为式(IV) 中的化合物。将式(IV)中的化合物与甲基磺酰氯反应以形成甲磺酸盐化合物(XIII),虽然 可以使用其他烷基磺酰卤素或芳基磺酰卤素。化合物(XIII)与式(XIII)中的巯基化合物 的反应得到化合物(V),其可被转化为钠盐形式。

可根据方案4来合成式(XIII)中的巯基化合物(参见例如美国专利第5,614,632
方案4方案4中的R基团可以是低级烷基,优选地为C1-C4烷基。从式(II)或式(IV) 中的化合物合成孟鲁司特的各种变化也被描述在美国专利第5,565,473号;美国公布 20050107612 ;美国公布 20050245569 ;美国公布 20060004204 ;和美国公布 20060194839 中;所有参考文献通过引用并入本文。鉴于式(VI)和式(XII)中的甲磺酸盐化合物的重要性,本公开的酮还原酶可被用 于合成式(XX)中的化合物
OCH3
或者式(XXI)中的化合物 其中R1是烷基磺酰基、(全)氟代烷基磺酰基或芳基磺酰基。在一些实施方案中, 所述烷基是低级烷基例如C1-C4烷基,而芳基是苄基。在一些实施方案中,R1是甲苯磺酰基 或甲磺酰基。在一些实施方案中,化合物(XX)的合成方法可包括(a)在适于将化合物(I)还 原为化合物(II)的反应条件下将化合物(I)与本文所述的酮还原酶接触;以及(b)将化 合物(II)与烷基磺酰基、(全)氟代烷基磺酰基、芳基磺酰基卤素或酐反应以形成化合物 (XX)。在一些实施方案中,用于(b)中的烷基磺酰卤素是甲基磺酰氯,使得化合物(XX)中 的R1是甲磺酰基。在一些实施方案中,式(XXI)中的化合物的合成方法可包括(a)在适于将化合物
(III)还原为化合物(IV)的反应条件下将化合物(III)与本文所述的酮还原酶接触;以及(b)将化合物(VI)与烷基磺酰基或芳基磺酰基卤素或酐反应以形成化合物(XXI)。在一些 实施方案中,用于(b)中的烷基磺酰卤素是甲基磺酰氯,使得化合物(XXI)中的R1是甲磺酰基。可选地,在一些实施方案中,化合物(XXI)的合成方法可使用方案3中所说明的 过程,其中所述方法包括(a)在适于将化合物(I)还原为化合物(II)的反应条件下将化 合物(I)与本文所述的酮还原酶接触;(b)将化合物(II)转化为化合物(IV);以及(c) 将化合物(IV)与烷基磺酰基、(全)氟代烷基磺酰基、芳基磺酰基卤素反应以形成化合物 (XXI)。如上所述,化合物(II)向(b)中的化合物(IV)的转化可使用格氏试剂或CH3Li。在一些实施方案中,本公开的酮还原酶可以与酮还原酶所作用的底物和/或由酮 还原酶反应所产生的产物一起作为组合物例如反应组合物存在。因此,在一些实施方案中, 组合物可包括本公开的酮还原酶以及结构式(I)中的底物或结构式(III)中的底物。在一 些实施方案中,组合物可包括本公开的酮还原酶以及结构式(II)中的产物或结构式(IV) 中的产物。在一些实施方案中,所述组合物可包括本公开的酮还原酶、式(I)中的底物和式 (II)中的产物。在一些实施方案中,所述组合物可包括本公开的酮还原酶、式(III)中的底 物和式(IV)中的产物。因为酮还原酶反应可在辅助因子(NADH或NADPH)再生系统的存在下进行,所以反 应条件还可包括辅助因子再生系统的元件,其在下面更详细地描述。因此,在一些实施方案 中,前述酮还原酶组合物还可包括辅助因子再生系统,其包括葡萄糖脱氢酶和葡萄糖;甲酸 脱氢酶和甲酸;或者异丙醇和仲醇脱氢酶。在一些实施方案中,仲醇脱氢酶是人工改造的酮 还原酶。可被用于辅助因子循环的其他酶和底物将是技术人员众所周知的。如本领域技术人员所知,酮还原酶催化的还原反应通常需要辅助因子。由本文所 述的人工改造的酮还原酶所催化的还原反应通常也需要辅助因子,虽然人工改造的酮还原 酶的许多实施方案需要比野生型酮还原酶所催化的反应少得多的辅助因子。如本文所用, 术语“辅助因子”是指与酮还原酶共同起作用的非蛋白化合物。适合与本文所述的人工改 造的酮还原酶共同使用的辅助因子包括但不限于NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、 NADPH(NADP+的还原型)、NAD+ (烟酰胺腺嘌呤二核苷酸)和NADH(NAD+的还原型)。通常,将 辅助因子的还原型加入反应混合物。任选地,可以使用辅助因子再生系统从氧化的NAD(P) + 形式再生还原的NAD(P)H形式。术语“辅助因子再生系统”是指参加将氧化型的辅助因子还原(例如NADP+至 NADPH)的反应的一组反应物。被酮还原酶催化的酮底物还原所氧化的辅助因子被辅助因 子再生系统再生为还原型。辅助因子再生系统包括化学计量还原剂,其为还原氢等价物的 来源并且能够将辅助因子的氧化型还原。辅助因子再生系统还可包括催化剂,例如为还原 剂对辅助因子氧化型的还原进行催化的酶催化剂。用于从NAD+或NADP+分别再生NADH或 NADPH的辅助因子再生系统是本领域已知的并且可被用于本文所述的方法。可被使用的适合的示例性辅助因子再生系统包括但不限于葡萄糖和葡萄糖脱氢 酶、甲酸和甲酸脱氢酶、葡萄糖6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇(例如异丙醇)和 仲醇脱氢酶、亚磷酸盐和亚磷酸盐脱氢酶、分子氢和氢化酶以及诸如此类。这些系统可与 NADP+/NADPH或NAD+/NADH辅助因子共同使用。使用氢化酶的电化学再生还可被用作辅助 因子再生系统。参见例如美国专利第5,538,867和6,495,023号,其二者都通过引用被并
96入本文。包括金属催化剂和还原剂(例如分子氢或甲酸盐)的化学的辅助因子再生系统也 是适合的。参见例如PCT公布WO 2000/053731,其通过引用被并入本文。术语“葡萄糖脱氢酶”和“⑶H”在本文中被互换地使用以指NAD+或NADP+依赖性 酶,所述酶催化D-葡萄糖和NAD+或NADP+分别向葡萄糖酸和NADH或NADPH的转化。下面 的反应式(1)描述葡萄糖脱氢酶催化的葡萄糖对NAD+或NADP+的还原。
(1) 葡萄糖 +NAD(P)++ H2O GDH .葡萄糖酸 +NAD(P)H+ H+适合用于本文所述方法的实践的葡萄糖脱氢酶包括天然存在的葡萄糖脱氢酶以 及非天然存在的葡萄糖脱氢酶二者。编码天然存在的葡萄糖脱氢酶的基因已在文献中报 道。例如,枯草芽孢杆菌61297⑶H基因被表达在大肠杆菌中,并且据报道其展示了与在 其天然宿主中所产生的酶相同的物理化学性质(Vasantha等.,1983,Proc. Natl. Acad. Sci.USA 80:785)。对应于Genbank登录号M12276的枯草芽孢杆菌GDH基因的基因序列 被报道在 Lampel 等·,1986,J. Bacteriol. 166 :238_243 中,而且其作为 Genbank 登录号 D50453 的修正形式被报道在 Yamane 等.,1996,Microbiologyl42 3047-3056 中。天然存 在的GDH基因还包括编码赌样芽胞杆菌(B. cereus)ATCC 14579 (Nature, 2003,423 :87_91 ; Genbank 登录号 AE017013)和巨大芽胞杆菌(B. megaterium) (Eur. J. Biochem.,1988,174 485-490,Genbank 登录号 X12370 J. Ferment. Bioeng.,1990,70 :363_369,Genbank 登录号 GI216270)中⑶H的那些。来自芽孢杆菌属的葡萄糖脱氢酶作为SEQID N0:10和12(分别 由对应于该PCT公布中的SEQ ID NO :9和11多核苷酸序列所编码)被提供在PCT公布WO 2005/018579中,其公开通过引用被并入本文。可使用已知方法例如诱变、定向进化以及诸如此类来产生非天然存在的葡萄糖脱 氢酶。可使用PCT公布WO 2005/018579中实施例4所描述的测定容易地鉴定具有适当活 性的GDH酶,不论它是天然存在的还是非天然存在的,其公开通过引用被并入本文。示例性 的非天然存在的葡萄糖脱氢酶作为SEQ ID而62、64、66、68、122、124和126被提供在卩(^ 公布WO 2005/018579中。编码它们的多核苷酸序列作为SEQ ID NO :61、63、65、67、121、 123和125被分别提供在PCT公布WO 2005/018579中。所有这些序列通过引用被并入本 文。本文所公开的适合用于酮还原酶催化的还原反应的另外的非天然存在的葡萄糖脱氢酶 被提供在美国申请公布第2005/0095619和2005/0153417号中,其公开通过引用被并入本 文。本文所述的用于酮还原酶催化的还原反应的葡萄糖脱氢酶可在PCT公布WO 2005/018579的实施例4中所述的测定中展示至少约10 μ mol/min/mg而且有时候至少约 102μ mol/min/mg 或约 IO3 μ mol/min/mg、高达约 IO4 μ mol/min/mg 或更高的活性。本文所述的酮还原酶催化的还原反应通常在溶剂中进行。适合的溶剂包括水、有 机溶剂(例如乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及诸 如此类)、离子液体(例如1-乙基4-甲基咪唑四氟硼酸盐、1-丁基-3-甲基咪唑四氟硼酸 盐、1-丁基-3-甲基咪唑六氟磷酸盐以及诸如此类)。在一些实施方案中,使用水溶剂,其 包括水和水共溶剂系统。示例性的水共溶剂系统具有水和一种或多种有机溶剂。通常,选择水共溶剂系统 的有机溶剂组分以便它不完全地使酮还原酶失活。可利用酶活性测定例如本文所述的那些,通过用候选溶剂系统中感兴趣的确定底物来测量指定的人工改造的酮还原酶的酶活性 来容易地鉴定适当的共溶剂系统。水共溶剂系统的有机溶剂组分可与水组分混溶以提供单液相,或者可与水组分 部分混溶或不可混溶以提供两个液相。通常,当使用水共溶剂系统时,它被选择为双相性 的,水被分散在有机溶剂中或者相反。通常,当使用水共溶剂系统时,期望选择可从水相容 易地分离的有机溶剂。通常,共溶剂系统中水和有机溶剂的比例通常是在有机溶剂对水约 90 10至约10 90 (ν/ν),以及有机溶剂对水约80 20至约20 80 (ν/ν)的范围内。 可在加入反应混合物之前预先形成共溶剂系统,或者可将其在反应容器中就地(in situ) 形成。水溶剂(水或水共溶剂系统)可以是PH缓冲的或未缓冲的。一般地,可在约10或 以下,通常在约5至约10的范围内的pH中进行还原。在一些实施方案中,在约9或以下, 通常在约5至约9的范围内的pH中进行还原。在一些实施方案中,在约8或以下,通常在 约5至约8的范围内并且通常在约6至约8的范围内的pH中进行还原。还可在约7. 8或 以下,或者7. 5或以下的pH中进行还原。可选地,可在中性pH即约7中进行还原。在还原反应的过程中,可改变反应混合物的pH。可在反应过程中通过加入酸或碱 而将反应混合物的PH维持在期望的pH或在期望的pH范围内。可选地,可使用含有缓冲液 的水溶剂来控制PH。维持期望pH范围的适合的缓冲液是本领域已知的并且包括例如磷酸 盐缓冲液、三乙醇胺缓冲液以及诸如此类。还可使用缓冲和酸或碱添加的组合。当使用葡萄糖/葡萄糖脱氢酶辅助因子再生系统时,如果所得的葡萄糖酸水溶液 不被另外中和,那么反应式(1)中所表示的葡萄糖酸(PKa = 3.6)的共同产生导致反应混 合物的PH下降。可通过标准的缓冲技术(其中所述缓冲将高达所提供的缓冲能力的葡萄 糖酸中和),或者通过与转化过程同时发生的碱的加入而将反应混合物的PH维持在期望水 平。还可使用缓冲和碱添加的组合。上面描述了维持期望PH范围的适合的缓冲液。用于 葡萄糖酸中和的适合的碱是有机碱例如胺、醇化物和诸如此类,以及无机碱例如氢氧化物 盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱式磷酸盐(例如Κ2ΗΡ04、 Na3PO4)以及诸如此类。可以在监测反应混合物pH时手动地,或者更方便地通过使用被用 作PH恒定器的自动滴定器来完成与转化过程同时发生的碱的加入。还可将部分缓冲能力 和碱添加的组合用于过程控制。当碱添加被用来中和在酮还原酶催化的还原反应过程中释放的葡萄糖酸时,可通 过被添加以维持PH的碱的量来监测转化过程。通常,在还原过程中被加入未缓冲的或部分 缓冲的反应混合物的碱被加入水溶液。在一些实施方案中,辅助因子再生系统可包括甲酸脱氢酶。术语“甲酸脱氢酶” 和“FDH”在本文中被互换地使用以指NAD+或NADP+依赖性酶,所述酶催化甲酸和NAD+或 NADP+分别向二氧化碳和NADH或NADPH的转化。适合在本文所述的酮还原酶催化的还原 反应中用作辅助因子再生系统的甲酸脱氢酶包括天然存在的甲酸脱氢酶以及非天然存在 的甲酸脱氢酶二者。甲酸脱氢酶包括对应于PCT公布WO 2005/018579中SEQ ID NOS 70 (假单胞菌属)和72 (博伊丁念珠菌Candida boidinii)的那些,其被分别对应于PCT 公布2005/018579中SEQ ID NOS :69和71的多核苷酸序列所编码,其公开通过引用被并 入本文。用于本文所述方法的甲酸脱氢酶(不论是天然存在的还是非天然存在的)可展示至少约1 μ mol/min/mg、有时候至少约10 μ mol/min/mg或至少约IO2 μ mol/min/mg、高达约 IO3 μ mol/min/mg或更高的活性,并且可在PCT公布W02005/018579的实施例4中所述的测
定中容易地筛选活性。如本文所用,术语“甲酸(formate)”是指甲酸阴离子(HC02_)、甲酸(HCO2H)及其混 合物。可以以盐(通常为碱或铵盐(例如HC02Na、KHC02NH4以及诸如此类))、甲酸(通常为 甲酸水溶液)或其混合物的形式提供甲酸。甲酸是温和酸。在它的pKa(水中pKa = 3. 7) 的几个PH单位以内的水溶液中,甲酸以平衡浓度的HC02_和HCO2H 二者存在。在高于约pH 4的pH值下,甲酸主要以HC02_存在。当以甲酸(formic acid)的形式提供甲酸(formate) 时,通常通过加入碱而对反应混合物进行缓冲或使其酸性减少以提供期望的pH,其通常为 约pH 5或以上。适用于中和甲酸的碱包括但不限于有机碱例如胺、醇化物和诸如此类,以 及无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱 式磷酸盐(例如K2HP04、Na3PO4)以及诸如此类。对于高于约pH 5的pH值(在此条件下甲酸主要以HC02_存在),下面的反应式⑵ 描述甲酸脱氢酶催化的甲酸对NAD+或NADP+的还原。 当使用甲酸和甲酸脱氢酶作为辅助因子再生系统时,可通过标准的缓冲技术(其 中所述缓冲释放高达所提供的缓冲能力的质子),或者通过与转化过程同时发生的酸的加 入而将反应混合物的PH维持在期望水平。在反应过程中被加入以维持pH的适合的酸包括 有机酸例如羧酸、磺酸、膦酸和诸如此类,无机酸例如氢卤酸(例如氢氯酸)、硫酸、磷酸和 诸如此类,酸式盐例如磷酸二氢盐(例如KH2PO4)、硫酸氢盐(例如NaHSO4)和诸如此类。一 些实施方案利用甲酸(formic acid),从而甲酸(formate)浓度和溶液pH二者都得以维持。当利用酸添加来维持使用甲酸/甲酸脱氢酶辅助因子再生系统的还原反应中的 PH时,可通过被添加以维持pH的酸的量来监测转化过程。通常,在转化过程中被加入未缓 冲的或部分缓冲的反应混合物的酸被加入水溶液。术语“仲醇脱氢酶”和“sADH”在本文中被互换地使用以指NAD+或NADP+依赖性酶, 所述酶催化仲醇和NAD+或NADP+分别向酮和NADH或NADPH的转化。下面的反应式(3)描 述仲醇(用异丙醇进行说明)对NAD+或NADP+的还原。 适合用作本文所述酮还原酶催化的还原反应中辅助因子再生系统的仲醇脱氢 酶包括天然存在的仲醇脱氢酶以及非天然存在的仲醇脱氢酶二者。天然存在的仲醇脱 氢酶包括来自布氏热厌氧菌(Thermoanaerobiumbrockii)、红串红球菌(Rhodococcus erythropolis)、高加索酸奶乳杆菌、短乳杆菌和微小乳杆菌的已知的醇脱氢酶,而非天然 存在的仲醇脱氢酶包括从其衍生的人工改造的醇脱氢酶。用于本文所述方法的仲醇脱氢 酶(不论是天然存在的还是非天然存在的)可展示至少约1 μ mol/min/mg、有时候至少约 10 μ mol/min/mg 或至少约 IO2 μ mol/min/mg、高达约 IO3 μ mol/min/mg 或更高的活性。适合的仲醇包括低级仲链烷醇和芳基-烷基甲醇。低级仲醇的实例包括异丙醇、
992_ 丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3_ 二甲基-2-丁醇以及诸如此类。在一个实 施方案中,仲醇是异丙醇。适合的芳基-烷基甲醇包括未取代的和取代的1-芳基乙醇。当仲醇和仲醇脱氢酶被用作辅助因子再生系统时,所得的NAD+或NADP+被仲醇的 偶合氧化所还原,其中所述偶合氧化是仲醇脱氢酶将仲醇氧化为酮。一些人工改造的酮还 原酶还具有对仲醇还原剂脱氢的活性。在一些将仲醇用作还原剂的实施方案中,人工改造 的酮还原酶和仲醇脱氢酶是相同的酶。在进行利用辅助因子再生系统的本文所述酮还原酶催化的还原反应的实施方案 中,可最初提供氧化或还原型的辅助因子。如上所述,辅助因子再生系统将氧化的辅助因子 转化为其还原型,其然后被用于酮还原酶底物的还原中。在一些实施方案中,辅助因子再生系统未被使用。对于不使用辅助因子再生系统 而进行的还原反应,将还原型的辅助因子加入反应混合物。在一些实施方案中,当使用宿主生物体的整个细胞进行该过程时,整个细胞可天 生地提供该辅助因子。可选地或共同地,该细胞可天生地或重组地提供葡萄糖脱氢酶。在进行本文所述立体选择性还原反应时,人工改造的酮还原酶和包括任选的辅助 因子再生系统的任何酶可以以纯化的酶、用编码该酶的基因转化的整个细胞和/或这种细 胞的细胞提取物和/或裂解产物的形式被加入反应混合物。编码人工改造的酮还原酶的基 因和任选的辅助因子再生系统可被分别转化进宿主细胞或一起转化进相同宿主细胞。例 如,在一些实施方案中,可用编码人工改造的酮还原酶的基因来转化一组宿主细胞,并用编 码辅助因子再生酶的基因来转化另一组。两组转化细胞可以完整细胞形式或从其衍生的裂 解产物或提取物形式一起用于反应混合物。在其他实施方案中,可用编码人工改造的酮还 原酶和辅助因子再生酶的基因来转化宿主细胞。用编码人工改造的酮还原酶和/或任选的辅助因子再生酶的基因所转化的整个 细胞或者细胞提取物和/或其裂解产物可以以各种不同形式被使用,所述形式包括固体 (例如冻干的、喷雾干燥的以及诸如此类)或半固体(例如粗制的糊状物)。可通过沉淀作用(硫酸铵、聚乙烯亚胺、热处理或诸如此类,接着在冻干之前进行 脱盐程序(例如超滤、透析以及诸如此类))将细胞提取物或细胞裂解产物部分地纯化。可 通过使用已知的交联剂例如戊二醛的交联或固定于固相(例如Eupergit C以及诸如此类) 来稳定任何细胞制剂。可以以各种不同形式将固体反应物(例如酶、盐等)提供给反应,所述不同形式 包括粉末(例如冻干的、喷雾干燥的以及诸如此类)、溶液、乳浊液、悬液以及诸如此类。可 使用本领域普通技术人员已知的方法和设备将反应物容易地冻干或喷雾干燥。例如,可以 在-80°C以小等份将蛋白溶液冷冻,然后加入预先冷却的冻干容器中,接着施加真空。在从 样品除去水后,在释放真空并回收冻干的样品之前,通常将温度提高到4°C保持两小时。取决于期望产物的量并随着所使用的酮还原酶底物的量,用于还原反应的反应物 的量通常将变化。可使用下述准则来确定待使用的酮还原酶、辅助因子和任选的辅助因子 再生系统的量。通常,可以使用约50mg至约5g的酮还原酶和约IOmg至约150mg的辅助因 子来利用浓度为约20至300克/升的酮底物。本领域普通技术人员将容易理解如何改变 这些量以使它们达到期望的产率水平和生产规模。可通过基于所用辅助因子和/或酮还原 酶的量的常规实验来容易地确定任选的辅助因子再生系统的适当的量。通常,以超过等摩尔水平的酮还原酶底物的水平来利用还原剂(例如葡萄糖、甲酸、异丙醇)以获得基本完全 的或接近完全的酮还原酶底物转化。反应物的加入顺序不重要。可同时将反应物一起加入溶剂(例如单相溶剂、双相 水共溶剂系统以及诸如此类),或可选地可将一些反应物分开加入,以及将一些在不同时间 点一同加入。例如,辅助因子再生系统、辅助因子、酮还原酶和酮还原酶底物可被首先加入 溶剂。为了在使用水共溶剂系统时增加混合效率,可首先将辅助因子再生系统、酮还原 酶和辅助因子加入并混合进水相。然后可将有机相加入并混合,接着加入酮还原酶底物。可 选地,在加入水相之前,可将酮还原酶底物在有机相中预先混合。进行本文所述的酮还原酶催化的还原反应的适合条件包括各种各样的可被常规 实验容易地优化的条件,所述常规实验包括但不限于在实验PH和温度下将人工改造的酮 还原酶和底物相接触并且使用例如本文所提供的实施例中所述的方法检测产物。通常在约15°C至约75°C范围内的温度下进行酮还原酶催化的还原。对于一些实 施方案,在约20°C至约55°C范围内的温度下进行反应。还在其他的实施方案中,在约20°C 至约45°C范围内的温度下进行。还可在环境条件下进行反应。通常允许还原反应进行到基本上完成或者接近完成,得到底物的还原。可使用已 知方法通过检测底物和/或产物来监测底物向产物的还原。适合的方法包括气相色谱法、 HPLC以及诸如此类。反应混合物中产生的醇还原产物的转化率通常超过约50%,也可超过 约60 %,也可超过约70 %,也可超过约80 %,也可超过约90 %,并且往往超过约97 %。
7.实施例在下面的代表性实例中说明本公开的各种特征和实施方案,其旨在是说明性的而 不是限制性的。在下面的描述中,不管是否使用葡萄糖脱氢酶(⑶H),它是可从JulichChiral Solutions, Julich, Germany 获得的⑶H CDX901。实施例1 野生型酮还原酶基因的获得和表达载体的构建。根据报道的酮还原酶氨基酸序列和美国临时申请第60/848,950号(其通过引用 被并入本文)的实施例1中所述的密码子优化算法,为了在大肠杆菌中的表达而设计了编 码酮还原酶(KRED)的基因。使用由42个核苷酸所组成的低聚核苷酸合成了基因,并将其克 隆进受Iac启动子控制的表达载体pCK110900(其被描述为美国专利申请公布20060195947 中的图3)。所述表达载体还含有P15a复制起点和氯霉素抗性基因。使用标准方法将所得 的质粒转化进大肠杆菌W3110。密码子优化的基因以及编码多肽被列在表3中。如美国临 时申请第60/848,950号中所述确认了野生型酮还原酶的活性。表3
表3:所用的酮还原酶的缩写、来源和参考KRED最初从其中鉴定出Genbank 登GI号多核苷酸多肽SEQ 编码本发明中人工改造的酮还原酶的多核苷酸同样被克隆进载体PCK110900以 在大肠杆菌W3110中表达。实施例2 酮还原酶粉末的产生;摇瓶程序。包括含有感兴趣的酮还原酶基因的质粒的大肠杆菌的一个单独微生物菌落被接 种在50ml的含有30μ g/ml氯霉素和葡萄糖的Terrific Broth肉汤中。在30°C培养 箱中以250rpm摇动培养细胞过夜(至少16小时)。在1升的烧瓶中的250ml的Terrific Broth肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4ml/L甘油、65mM磷酸钾(pH 7.0)、 ImM的MgS04、30 μ g/ml氯霉素)中将培养物稀释到在600nm(0D600)下0. 2的光密度,并允许其在30°C下生长。当培养物的0D600是0. 6至0. 8时,用ImM的IPTG诱发酮还原酶基因 的表达并培养过夜(至少16小时)。通过离心(5000rpm、15min、4°C )收集细胞并丢弃上清 液。用等体积冷的(4°C ) IOOmM三乙醇胺(氯)缓冲液pH 7. 0 (在ADH-LK和ADH-LB以及 从其衍生的人工改造的酮还原酶的情况下包括2mM的MgSO4)将细胞团块重悬浮,并如上通 过离心收集。在两体积的冷的三乙醇胺(氯)缓冲液中将被冲洗的细胞重悬浮,并在维持 在4°C时在12000psi下将其通过弗氏压碎器(French Press)两次。通过离心(9000rpm、 45min、4°C)除去细胞碎片。收集澄清的裂解产物上清液并储存在_20°C。对冷冻的澄清裂 解产物的冻干提供了粗制酮还原酶的干燥粉末。实施例3 酮还原酶的产生;发酵步骤。在通风搅拌的15L发酵器中,含有0. 88g/L硫酸铵、0. 98g/L柠檬酸钠、12. 5g/L三 水合磷酸氢二钾、6. 25g/L磷酸二氢钾、6. 2g/L的Tastone-154酵母提取物、0. 083g/L柠檬 酸铁铵和8. 3ml/L的微量元素溶液(含2g/L 二水合氯化钙、2. 2g/L七水合硫酸锌、0. 5g/L 一水合硫酸锰、lg/L七水合硫酸亚铜、0. lg/L四水合钼酸铵和0. 02g/L十水合四硼酸钠) 的6. OL的生长培养基被升到30°C。用含有带感兴趣的酮还原酶基因的质粒的大肠杆菌 W3110的晚期指数培养物在发酵器中接种,并在实施例3中所述的摇瓶中生长至0. 5至2. 0 的起始0D600。以500-1500rpm搅拌发酵器,并以1. 0-15. OL/min向发酵容器中提供空气以 维持30%饱和或更高的溶氧水平。通过加入20% ν/ν的氢氧化铵来将培养物的pH控制在 7. O。通过加入含有500g/L结晶葡萄糖(cerelose)、12g/L氯化铵和10. 4g/L七水合硫酸镁 的进料溶液来维持培养物的生长。在培养物达到50的0D600之后,通过将异丙基-b-D-硫 代半乳糖苷(IPTG)加到ImM的终浓度来诱导酮还原酶的表达。将培养物再生长14小时。 然后将培养物冷却到4°C并维持在4°C直到被收集。在4°C下Sorval RC12BP离心机中以 5000G离心40分钟来收集细胞。将收集的细胞直接用于接下来的下游回收过程并储存在 4°C下直到如此使用。在4°C下在2体积的IOOmM三乙醇胺(氯)缓冲液(pH6. 8)中将细胞团块重悬浮 至每体积的湿细胞糊状物。通过将悬浮液穿过装有二阶段均质阀门组件的均质器(其使 用12000psig的压力)来从细胞释放细胞内的酮还原酶。破裂之后马上将细胞勻浆冷却到 4°C。10%w/v的聚乙烯亚胺pH 7. 2的溶液被加入裂解产物至终浓度0.5% w/v,并且搅拌 30分钟。通过在标准的实验室离心机上以5000G离心30分钟而使所得的悬浮液变澄清。 将澄清的上清液倒出并使用具有30Kd的分子量截留(cut off)的纤维素超滤膜将其浓缩 十倍。将最终的浓缩物分配到浅容器中,在_20°C下冷冻并冻干为粉末。将酮还原酶粉末储 存在_80°C。实施例4 将2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯基]_3_酮丙基]苯甲 酸甲酯转化为(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羟丙基]苯甲酸甲 酯的分析方法。2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基]苯甲酸甲酯的还原和 醇产物的手性纯度由如下所确定反相HPLC(具有保护筒的2. lX50mmZorbax XDB柱子;在 30°C下,0. 6mL/min,H20中的90 10的ACN/0. 25% AcOH ;使用下面的保留时间以287nm进 行检测对映体醇0. 55min ;酮0. 72min)或者正相的手性HPLC (具有保护筒的2. 1 X 150mm ChiralPakAS-H柱子,在40°C下,0.5mL/min,10 90的异丙醇/庚烷;使用下面的保留时间以 287nm 进行检测(S)-醇 7. Imin ; (R)-醇 5. 7min ;酮 4. 5min)。实施例5 将2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯基]_3_酮丙基]-苯 基]-1-甲基-1-乙醇转化为(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_羟 丙基]-苯基]-1-甲基-1-乙醇的分析方法。2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基]-苯基]甲 基-1-乙醇(通过将相应的醇氧化而制备的)的还原和醇产物的纯度由HPLC(具有下面的 洗脱图的 4. 6 X 50mm Phenomix Gemini C18,IlOA 柱子从 40% 至 80%在水/0. 1 % TFA 梯 度持续4min,保持1. 5min,以0. 5mL/min的流速在Imin内回到40%的乙腈/0. 1% TFA ;环 境温度;使用下面的保留时间以254nm进行检测醇4. 4min,酮5. 7min)所确定。通过HPLC(2. IX 150mm ChiralPak AD-H 柱子;溶剂40 60 异丙醇庚烧; 在40°C下,流速=0. 5mL/min ;使用下面的保留时间以280nm进行检测(S)-醇12. Omin ; (R)-醇11. 2min ;酮10. 3min)来评估手性纯度。实施例6 对用来将2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯还原的野生型酮还原酶的评估使用作为辅助因子的NADH和NADPH以及作为辅助因子再生系统的葡萄糖脱氢酶 /葡萄糖或异丙醇来筛选实施例1的表3中所述的KRED。向96深孔板的孔中加入250 μ L 的含有1.0g/L NAD(P)、30-50g/L的KRED变体的IOOmM三乙醇胺(氯)缓冲液pH7. 0、 200 μ L的IPA和50 μ L的10_20g/L酮底物的THF溶液。可选地,向96深孔板的每孔中预 先加入 10-20mg 的 CaC03、250 μ L 的含有 1. Og/L 的 NAD(P)、30_50g/L 的 KRED、10_20g/L 的 ⑶H和10%葡萄糖的IOOmM三乙醇胺(氯)缓冲液pH7.0。用铝/聚丙烯分层热密封胶带 (Velocity ll(Menlo Park, CA),目录号06643-001)对板进行密封,并在室温下摇动过夜。 通过加入IOOOyL的EtOAc而将反应猝灭。离心(在22°C下以4000rpm进行IOmin)后,使 用实施例4中的正相HPLC方法来测定有机相的转化。在被测试的任何条件下这些酶中没 有一个显示了任何活性(检测极限为 0. 5%转化)。该实施例证明,野生型酮还原酶对2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-酮丙基]苯甲酸甲酯具有非常少(如果有的话)的活性。实施例7 对用来将2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯还原的ADH-LK变体的评估对已经产生的几种ADH-LK变体进行了评估并且发现当在实施例6中所述的和 表4中所列的条件下进行评估时具有SEQ ID NO :90的ADH-LK变体将底物转化为手性的 (S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羟丙基]苯甲酸甲酯。表 4 该实施例显示,含有 G7H、S96T、F147L、Y190P、V196L、A202W 突变的 ADH-LK 变体 以高度的立体选择性(>99%的立体异构过量)将2-[3-[3-[2-(7-氯-2-喹啉基)乙烯 基]苯基]-3-酮丙基]苯甲酸甲酯转化为(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羟丙基]苯甲酸甲酯。实施例8 利用异丙醇来再生辅助因子的用来测定酮还原酶对 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯的活性的高通量 HPLC测定通过定向进化获得并含有进化的酮还原酶基因的质粒文库被转化进大肠杆菌 中并被铺板在含有葡萄糖和30 μ g/mL氯霉素(CAM)的Luria-Bertani (LB)肉汤上。 在30 °C下孵化至少16小时后,使用Q-bot 机器人菌落采集器(Genetix USA,Inc., Beaverton,0R)将菌落采集进含有180 μ L的Terrif ic肉汤(TB)、1 %葡萄糖、30 μ g/mL氯 霉素(CAM)和2mM的MgSO4的96孔浅孔微量滴定板中。在30°C下以200rpm摇动使细胞生 长过夜。然后将20 μ L的该培养物转移进含有350 μ L的Terrific肉汤(TB)、2mM的MgSO4 和30 μ g/mL的CAM的96深孔板中。在30°C下深孔板中以250rpm摇动孵化2. 5至3小时 后(0D_ 0.6-0. 8),细胞培养物对重组基因的表达被异丙基硫代半乳糖苷(IPTG)诱导至 ImM的终浓度。然后在30°C下以250rpm摇动板孵化15-23小时。向96孔微量滴定板的孔中加入100 μ L的含有0. 2mM Na-NADP和2mM的MgSO4的 IOOmM三乙醇胺(氯)缓冲液pH7.0,以及足够体积的细胞培养物以使最熟知的酶将在任何 时间点上(例如在第一轮进化中的SEQ ID 90)给出酮向(S)-醇的10-20%的转化。IPA 和含有1. 67至16. 7g/L的2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯的THF溶液被加入孔中以得到体积比为4 1 5的IOOmM三乙醇胺(氯)缓 冲液pH7. 0、THF和IPA的最终组合物(最终的底物浓度为1至10g/L)。随意地将酮加到 终浓度为0至2% (通常作为IPA或THF中的溶液)。如实施例6中所述将板热密封并在 室温或40°C下摇动孵化4或24小时。在反应的最后,用1000 μ L的1 4的THF 乙腈将 底物和产物猝灭。在室温下离心之后,使用实施例4中所述的反相HPLC方法分析上清液的 转化。对于待测定对映选择性的反应,用ImL的EtOAc将反应猝灭,离心并通过实施例4中 所述的正相HPLC方法对有机相进行手性分析。该实施例描述被用来鉴定针对2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-酮丙基]苯甲酸甲酯的还原而被改进的KRED变体的方法。实施例9 衍生自ADH-LK的人工改造的酮还原酶对2-[3-[3-[2-(7_氯_2_喹啉 基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯的还原。在空气中随着搅拌棒的搅拌向琥珀色小瓶中按顺序加入50_500mg的底物、1. 5mL 的含有 0. 33g/L 的 NADP-Na 禾Π 10. 0-33. 3g/L 的 KRED 变体、2mM 的 MgSO4 的 IOOmM 三乙醇 胺(氯)缓冲液pH 7. 0或8. 0、2. 5mL的IPA和0. 5mL的共溶剂(THF或甲苯)。小瓶被封 闭并被浸入被控制在期望温度下的油浴中。在1、2、4和8小时处取出两个50 μ L等份,并 在t = 24h处取出四个50 μ L等份。用IOOOyL的THF稀释所述等份,并离心(22°C下, 4000rpm,10分钟)以除去碎屑。用乙腈将上清液稀释9 X,并如实施例4中所述确定转化。 在第24小时的样品上进行手性分析加入0. 5体积的盐水和2体积的THF以获得清晰的 相分离(phase break),并用MgSO4将有机相干燥。用EtOAc将有机相稀释IOX,并如实施 例4中所述来分析。表5给出对应于酮还原酶的SEQ ID NO.、来自野生型ADH-LK的氨基 酸突变的数目和2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯 向(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羟丙基]苯甲酸甲酯的转化。被测的所有变体给出>99. 2%立体异构过量的(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯
基]苯基]-3-羟丙基]苯甲酸甲酯(参考标准是99.2% ee;不期望的立体异构体是不可
检测的)。
+ < 0. 03g 产物 / 升 /g 酶 / 天;++ 0. 03 至 Ig 产物 / 升 /g 酶 / 天;+++ :1 至 5g 产物/升/g酶/天;++++ 5至20g产物/升/g酶/天;+++++ > 20g产物/升/g酶/天。实施例10 衍生自ADH-LK的人工改造的酮还原酶对2-[2-[3-[3[2-(7_氯_2_喹 啉基)乙烯基]苯基]-3-氧代丙基]苯基]-2-丙醇的还原。在空气中随着搅拌棒的搅拌向琥珀色小瓶中按顺序加入500mg的 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇、1. 5mL的 含有 0. 89g/L 的 NADP-Na 和 13. 3g/L 的 KRED 变体 SEQ ID NO :20、2mM 的 MgSO4 的 IOOmM 三 乙醇胺(氯)缓冲液PH 7.0,2. 5mL的IPA和0. 5mL的共溶剂(THF或甲苯)。小瓶被封闭 并被浸入被控制在40°C下的油浴中。在6、24和29小时处取出样品(30 μ L),并用1500 μ L的THF稀释;30 μ L稀释的样品被浓缩干燥,在如实施例5中所述的化学转化的HPLC分析 之前溶解在IOOOyL乙腈中。在29h处建立整个反应混合物之后进行手性分析用2mL盐水和6mL的THF稀释 样品而得到清晰的相分离。用乙酸乙酯(3X10mL)萃取水相,并在MgSO4I将合并的有机 层干燥。将有机溶液滤过西莱特(Celite)床并浓缩干燥。通过将Img的残基溶解在Iml 的乙腈中来制备分析样品,并如实施例5中所述进行分析。以> 99%的立体异构过量获得 (S)-I-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羟丙-2-基)苯基)丙-1-醇。 转化超过约67%。实施例11 (S) -2- [3- [3- [2- (7-氯_2_喹啉基)乙烯基]苯基]_3_羟丙基]苯 甲酸甲酯的制备性规模生产。在氮气中向通过外部热交换器将套温度设置为51°C的装备有内部温度计和机 械搅拌子(250rpm)的带套的2L三颈烧瓶中加入300mL的IOOmM的pH 8. 0的三乙醇 胺*HC1、0. 6mL的IM的MgSO4、如实施例3中所制备的3. Og的SEQ ID NO 20的催化剂、 0. Ig的NADP-Na2以得到淡黄色溶液。搅拌10分钟之后,在 5分钟内分批加入IOOg的 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯。向浆体加入 500mL(390g)的IPA和IOOmL(85g)的甲苯。如实施例4和6中所述通过手性HPLC监测反 应过程。实施例9中所述的过程被用作取样和样品制备。在45°C下搅拌24小时后,根据手性HPLC分析来表明反应完成。通过空气驱动的 真空泵将反应混合物滤过三层的150mm直径的Whatman#2滤纸。需要大约10分钟来完成 过滤以得到褐色糊状物。用2X500mL水冲洗褐色糊状物。将褐色糊状物过夜风干以得到 104g的褐色固体(S)-2-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羟丙基]苯甲酸甲 酯一水合物(100%产率;产物是一水合物),其化学纯度是98. 5HPLC面积百分比(起始物 质的主要杂质是0. 3-0. 4HPLC面积百分比)。(R)-立体异构体是未检测到的。本申请中所引用的所有出版物、专利、专利申请和其他文件为所有目的通过引用 以其整体并入本文,达到如同单个出版物、专利、专利申请或其他文件单独表明为了所有目 的而通过引用被并入的程度。
权利要求
一种能够以SEQ ID NO4多肽速率的至少1.5倍的速率将底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯转化为产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-羟丙基)苯甲酸甲酯的酮还原酶多肽。
2.根据权利要求1所述的多肽,其能够将所述底物转化为具有至少约95%的百分比立 体异构过量的所述产物。
3.根据权利要求1所述的多肽,其能够将所述底物转化为具有至少约99%的百分比立 体异构过量的所述产物。
4.根据权利要求1所述的多肽,其包括与具有下述特征的基于SEQIDN0:2、4或114 的参考序列至少约85%相同的氨基酸序列对应于X190的残基是脯氨酸,而且对应于X202 的残基是色氨酸;条件是所述酮还原酶多肽具有这样的氨基酸序列,其中对应于X190的残 基是受限残基,而且对应于X202的残基是芳香族残基。
5.根据权利要求1所述的多肽,其包括与具有下述特征的基于SEQIDN0:2、4或114的 参考序列至少约85%相同的氨基酸序列对应于X190的残基是脯氨酸;对应于X195的残 基是精氨酸;而且对应于X202的残基是色氨酸;条件是所述酮还原酶多肽具有这样的氨基 酸序列,其中对应于X190的残基是受限残基,对应于X195的残基是碱性的、酸性的、非极性 的或极性的残基,而且对应于X202的残基是芳香族残基。
6.根据权利要求4所述的多肽,其包括这样的氨基酸序列,其中对应于X190的残基是 脯氨酸,而且对应于X202的残基是色氨酸。
7.根据权利要求5所述的多肽,其包括这样的氨基酸序列,其中对应于X190的残基是 脯氨酸,对应于X195的残基是精氨酸,而且对应于X202的残基是色氨酸。
8.根据权利要求4至7任一项所述的多肽,其中酮还原酶氨基酸序列另外具有一种或 多种下述特征对应于X7的残基是受限的或非极性的残基; 对应于X17的残基是非极性的或脂肪族的残基; 对应于X25的残基是极性的或酸性的残基; 对应于X27的残基是芳香族的残基; 对应于X41的残基是极性的、脂肪族的或非极性的残基; 对应于X53的残基是极性的、非极性的或酸性的残基; 对应于X57的残基是非极性的或脂肪族的残基; 对应于X64的残基是极性的、脂肪族的或非极性的残基; 对应于X66的残基是酸性的残基;对应于X68的残基是极性的、酸性的、脂肪族的或非极性的残基; 对应于X72的残基是碱性的残基; 对应于X76的残基是脂肪族的、非极性的或极性的残基; 对应于X80的残基是脂肪族的、非极性的或极性的残基; 对应于X93的残基是极性的、脂肪族的或非极性的残基; 对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X95的残基是脂肪族的、非极性的或酸性的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于X97的残基是碱性的、受限的或极性的残基;对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基;对应于X108的残基是碱性的或受限的残基;对应于Xlll的残基是非极性的或脂肪族的残基;对应于X139的残基是非极性的或脂肪族的残基;对应于X145的残基是酸性的、脂肪族的或非极性的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X148的残基是非极性的或脂肪族的残基;对应于X151的残基是受限的、非极性的或脂肪族的残基;对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的残基;对应于X163的残基是非极性的或脂肪族的残基;对应于X165的残基是极性的、非极性的或脂肪族的残基;对应于X173的残基是酸性的、非极性的或脂肪族的残基;对应于X179的残基是芳香族的、碱性的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对应于X197的残基是酸性的残基;对应于X198的残基是酸性的或极性的残基;对应于X210的残基是极性的或碱性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;对应于X212的残基是极性的、脂肪族的或非极性的;对应于X216的残基是受限的或碱性的残基;对应于X223的残基是非极性的或脂肪族的残基;对应于X226的残基是非极性的或极性的残基;对应于X233的残基是极性的或酸性的;对应于X235的残基是极性的或芳香族的残基;对应于X248的残基是非极性的或芳香族的残基;对应于X249的残基是芳香族的残基;而且其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
9.根据权利要求4至7任一项所述的多肽,其中酮还原酶氨基酸序列另外具有一种或 多种下述特征对应于X7的残基是组氨酸; 对应于X17的残基是甲硫氨酸; 对应于X25的残基是天冬氨酸; 对应于X27的残基是酪氨酸; 对应于X41的残基是丝氨酸或丙氨酸; 对应于X53的残基是天冬氨酸;对应于X57的残基是缬氨酸; 对应于X64的残基是缬氨酸; 对应于X66的残基是谷氨酸;对应于X68的残基是缬氨酸; 对应于X72的残基是精氨酸; 对应于X76的残基是丙氨酸; 对应于X80的残基是苏氨酸或缬氨酸; 对应于X93的残基是丝氨酸; 对应于X94的残基是半胱氨酸或甘氨酸; 对应于X95的残基是亮氨酸或谷氨酸;对应于X96的残基是半胱氨酸、天冬酰胺、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于X97的残基是组氨酸或丝氨酸;对应于XlOO的残基是赖氨酸;对应于X108的残基是组氨酸;对应于Xlll的残基是甲硫氨酸;对应于X139的残基是亮氨酸;对应于X145的残基是谷氨酰胺或亮氨酸;对应于X147的残基是亮氨酸;对应于X148的残基是缬氨酸;对应于X151的残基是丙氨酸;对应于X152的残基是丝氨酸;对应于X163的残基是异亮氨酸;对应于X165的残基是天冬酰胺;对应于X173的残基是缬氨酸;对应于X179的残基是苯丙氨酸、赖氨酸或亮氨酸;对应于X194的残基是谷氨酰胺、丝氨酸或亮氨酸;对应于X196的残基是亮氨酸;对应于X197的残基是谷氨酸;对应于X198的残基是谷氨酸或谷氨酰胺;对应于X210的残基是精氨酸;对应于X211的残基是缬氨酸、亮氨酸、苏氨酸或异亮氨酸;对应于X212的残基是丝氨酸或缬氨酸;对应于X216的残基是精氨酸;对应于X223的残基是缬氨酸;对应于X226的残基是苏氨酸;对应于X233的残基是天冬酰胺或天冬氨酸;对应于X235的残基是色氨酸;对应于X248的残基是甘氨酸或色氨酸;对应于X249的残基是色氨酸;而且其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
10.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基,而且 对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
11.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基, 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于X147的残基是芳香族的、脂肪族的或非极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
12.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于X147的残基是芳香族的、脂肪族的或非极性的残基; 对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
13.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基; 对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
14.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
15.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X93的残基是极性的、脂肪族的或非极性的残基; 对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
16.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X93的残基是极性的、脂肪族的或非极性的残基; 对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基; 对应于X147的残基是芳香族的、脂肪族的或非极性的残基; 对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的残基; 对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基; 对应于X196的残基是非极性的或脂肪族的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
17.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X7的残基是受限的或非极性的残基;对应于X66的残基是酸性的残基;对应于X93的残基是极性的、脂肪族的或非极性的残基;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对应于X198的残基是酸性的或极性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
18.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有一种或多种或至 少所有的下述特征对应于X7的残基是受限的或非极性的残基;对应于X17的残基是非极性的或脂肪族的残基;对应于X27的残基是芳香族的残基; 对应于X64的残基是极性的、非极性的或脂肪族的残基; 对应于X66的残基是酸性的残基;对应于X80的残基是脂肪族的、非极性的或极性的残基;对应于X93的残基是极性的、脂肪族的或非极性的残基;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于XlOO的残基是碱性的或受限的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对应于X198的残基是酸性的或极性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基; 对应于X216的残基是受限的或碱性的残基;其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
19.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有所有的下述特征 对应于X7的残基是受限的或非极性的残基;对应于X17的残基是非极性的或脂肪族的残基;对应于X27的残基是芳香族的残基;对应于X64的残基是极性的、非极性的或脂肪族的残基;对应于X80的残基是脂肪族的、非极性的或极性的残基;对应于X93的残基是极性的、脂肪族的或非极性的残基;对应于X94的残基是半胱氨酸、非极性的或脂肪族的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于XlOO的残基是碱性的或受限的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对应于X198的残基是酸性的或极性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基; 对应于X216的残基是受限的或碱性的残基;其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
20.根据权利要求4所述的多肽,其中酮还原酶氨基酸序列另外具有所有的下述特征 对应于X7的残基是组氨酸;对应于X17的残基是甲硫氨酸;对应于X27的残基是芳香族的残基;对应于X64的残基是酪氨酸;对应于X80的残基是苏氨酸;对应于X93的残基是丝氨酸;对应于X94的残基是半胱氨酸;对应于X96的残基是缬氨酸、亮氨酸或异亮氨酸;对应于XlOO的残基是赖氨酸;对应于X147的残基是亮氨酸;对应于X194的残基是谷氨酰胺;对应于X196的残基是亮氨酸;对应于X198的残基是谷氨酸;对应于X211的残基是缬氨酸;对应于X216的残基是精氨酸;其中任选地,所述氨基酸序列与所述参考序列相比在其他氨基酸残基位置具有一个或 多个残基差异。
21.根据权利要求8所述的多肽,其中所述酮还原酶氨基酸序列具有下述特征对应于 X7的残基是组氨酸;对应于X96的残基是苏氨酸;对应于X147的残基是亮氨酸;而且对应 于X196的残基是亮氨酸。
22.根据权利要求21所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X93的残基是丝氨酸;对应于X94的残基是半胱氨酸;对应于X96的残基是亮氨酸; 而且对应于X211的残基是缬氨酸。
23.根据权利要求22所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X17的残基是甲硫氨酸;对应于X27的残基是酪氨酸;对应于X64的残基是缬氨酸; 对应于X80的残基是苏氨酸;而且对应于XlOO的残基是赖氨酸。
24.根据权利要求22所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X66的残基是谷氨酸;对应于X96的残基是异亮氨酸;对应于X194的残基是谷氨酰 胺;对应于X198的残基是谷氨酸;而且对应于X216的残基是精氨酸。
25.根据权利要求22所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X66的残基是谷氨酸;对应于X96的残基是异亮氨酸;对应于X194的残基是谷氨酰 胺;而且对应于X198的残基是谷氨酸。
26.根据权利要求23所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X194的残基是谷氨酰胺;对应于X198的残基是谷氨酸;而且对应于X216的残基是 精氨酸。
27.根据权利要求24所述的多肽,其中所述酮还原酶氨基酸序列另外具有下述特征 对应于X17的残基是甲硫氨酸;对应于X27的残基是酪氨酸;对应于X64的残基是缬氨酸; 对应于X66的残基是天冬氨酸;对应于X80的残基是苏氨酸;对应于X96的残基是异亮氨酸 或亮氨酸;而且对应于XlOO的残基是赖氨酸。
28.根据权利要求1所述的多肽,其中所述酮还原酶多肽包括具有与具有下述特征的 基于SEQ ID NO :2、4或114的参考序列的残基90至211至少85%相同的氨基酸序列的区域或结构域对应于X190的残基是脯氨酸,而且对应于X202的残基是色氨酸;条件是酮还 原酶结构域或区域具有这样的氨基酸序列,其中对应于X190的残基是受限残基,而且对应 于X202的残基是芳香族残基。
29.根据权利要求1所述的多肽,其中所述酮还原酶多肽包括具有与具有下述特征的 基于SEQ ID NO :2、4或114的参考序列的残基90至211至少85%相同的氨基酸序列的区 域或结构域对应于X190的残基是脯氨酸;对应于X195的残基是精氨酸;而且对应于X202 的残基是色氨酸;条件是酮还原酶结构域或区域具有这样的氨基酸序列,其中对应于X190 的残基是受限残基,对应于X195的残基是碱性的、酸性的、非极性的或极性的残基,而且对 应于X202的残基是芳香族残基。
30.根据权利要求28所述的多肽,其中所述酮还原酶结构域或区域包括这样的氨基酸 序列,其中对应于X190的残基是脯氨酸,而且对应于X202的残基是色氨酸。
31.根据权利要求29所述的多肽,其中所述酮还原酶结构域或区域包括这样的氨基酸 序列,其中对应于X190的残基是脯氨酸,对应于X195的残基是精氨酸,而且对应于X202的 残基是色氨酸。
32.根据权利要求28至31任一项所述的多肽,其中所述酮还原酶结构域或区域另外具 有一种或多种下述特征对应于X93的残基是极性的、脂肪族的或非极性的残基;对应于X94的残基是半胱氨酸、脂肪族的或非极性的残基;对应于X95的残基是脂肪族的、非极性的或酸性的残基;对应于X96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基;对应于X97的残基是碱性的、受限的或极性的残基;对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基;对应于X108的残基是碱性的或受限的残基;对应于Xlll的残基是非极性的或脂肪族的残基;对应于X139的残基是非极性的或脂肪族的残基;对应于X145的残基是酸性的、脂肪族的或非极性的残基;对应于X147的残基是芳香族的、脂肪族的或非极性的残基;对应于X148的残基是非极性的或脂肪族的残基;对应于X151的残基是受限的、非极性的或脂肪族的残基;对应于X152的残基是极性的、芳香族的、脂肪族的或非极性的残基;对应于X163的残基是非极性的或脂肪族的残基;对应于X165的残基是极性的、非极性的或脂肪族的残基;对应于X173的残基是酸性的、非极性的或脂肪族的残基;对应于X179的残基是芳香族的、碱性的、脂肪族的或非极性的残基;对应于X194的残基是受限的、极性的、脂肪族的或非极性的残基;对应于X196的残基是非极性的或脂肪族的残基;对应于X197的残基是酸性的残基;对应于X198的残基是酸性的或极性的残基;对应于X210的残基是极性的或碱性的残基;对应于Χ211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且 其中所述氨基酸序列与所述参考序列相比可以任选地具有在对应于残基90-211的结 构域中其他氨基酸残基位置的一个或多个差异。
33.根据权利要求28至31任一项所述的多肽,其中所述酮还原酶结构域或区域另外具 有一种或多种下述特征对应于Χ93的残基是丝氨酸; 对应于Χ94的残基是半胱氨酸或甘氨酸; 对应于Χ95的残基是亮氨酸或谷氨酸;对应于Χ96的残基是半胱氨酸、天冬酰胺、缬氨酸、亮氨酸、异亮氨酸或苏氨酸;对应于Χ97的残基是组氨酸或丝氨酸;对应于XlOO的残基是赖氨酸;对应于Χ108的残基是组氨酸;对应于Xlll的残基是甲硫氨酸;对应于Χ139的残基是亮氨酸;对应于Χ145的残基是谷氨酰胺或亮氨酸;对应于Χ147的残基是亮氨酸;对应于Χ151的残基是丙氨酸;对应于Χ152的残基是丝氨酸;对应于Χ163的残基是异亮氨酸;对应于Χ165的残基是天冬酰胺;对应于Χ173的残基是缬氨酸;对应于Χ179的残基是苯丙氨酸、赖氨酸或亮氨酸;对应于Χ194的残基是谷氨酰胺、丝氨酸或亮氨酸;对应于Χ196的残基是亮氨酸;对应于Χ197的残基是谷氨酸;对应于Χ198的残基是谷氨酸或谷氨酰胺;对应于Χ210的残基是精氨酸;对应于Χ211的残基是缬氨酸、亮氨酸、精氨酸、苏氨酸或异亮氨酸; 其中所述氨基酸序列与所述参考序列相比可以任选地具有在对应于残基90-211的结 构域中其他氨基酸残基位置的一个或多个差异。
34.根据权利要求28至31任一项所述的多肽,其中所述酮还原酶结构域或区域另外具 有所有的下述特征对应于Χ93的残基是极性的、脂肪族的或非极性的残基; 对应于Χ94的残基是半胱氨酸、脂肪族的或非极性的残基; 对应于Χ96的残基是半胱氨酸、极性的、脂肪族的或非极性的残基; 对应于XlOO的残基是碱性的、酸性的、极性的、脂肪族的或非极性的残基; 对应于Χ147的残基是芳香族的、脂肪族的或非极性的残基; 对应于Χ194的残基是受限的、极性的、脂肪族的或非极性的残基; 对应于Χ196的残基是非极性的或脂肪族的残基;对应于X198的残基是酸性的或极性的残基;对应于X211的残基是碱性的、脂肪族的、非极性的、酸性的或极性的残基;而且其中所述氨基酸序列与所述参考序列相比可以任选地具有在对应于残基90-211的结 构域中其他氨基酸残基位置的一个或多个差异。
35.根据权利要求1所述的多肽,其中所述酮还原酶包括选自SEQIDN0:6、8、10、12、 14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的氨基酸序列。
36.根据权利要求1所述的多肽,其中所述酮还原酶能够以比参考多肽高至少1-50倍 的速率将所述底物转化为所述产物。
37.根据权利要求36所述的多肽,其中所述酮还原酶包括对应于SEQIDNO :42、44、46、 48、86、88、92、94、96、100 或 102 的氨基酸序列。
38.根据权利要求1所述的多肽,其中所述酮还原酶能够以比参考多肽高至少50-250 倍的速率将所述底物转化为所述产物。
39.根据权利要求38所述的多肽,其包括对应于SEQID NO 10、32、34、36、50、64、66、 68、70、72、74、76、78、80、82、84、98、104、106 和 108 的氨基酸序列。
40.根据权利要求1所述的多肽,其能够以比参考多肽高至少250-1000倍的速率将所 述底物转化为所述产物。
41.根据权利要求40所述的多肽,其包括对应于SEQID NO 12、18、22、24、26、28、30、 38、40、52、54、56、58、60、62 和 110 的氨基酸序列。
42.根据权利要求1所述的多肽,其能够以比参考多肽高至少1000倍的速率将所述底 物转化为所述产物。
43.根据权利要求42所述的多肽,其包括对应于SEQID NO :6、8、14、16和20的氨基酸序列。
44.根据权利要求1所述的多肽,当用超过约100g/L的底物和小于约5g/L的所述多肽 进行时,所述多肽能够在小于约24小时内将至少约95%的所述底物转化为所述产物。
45.根据权利要求44所述的多肽,其包括对应于SEQID NO :6、8、14、16和20的氨基 酸序列。
46.根据权利要求1所述的多肽,其与参考多肽相比具有增加的对作为所述底物向所 述产物转化的竞争性抑制剂的丙酮的抵抗性。
47.根据权利要求46所述的多肽,其中所述酮还原酶包括选自SEQIDN0:6、8、10、12、 14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、64、66、68、70、 72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的氨基酸序列。
48.一种编码根据权利要求1-46任一项的多肽的多核苷酸。
49.根据权利要求48所述的多核苷酸,其选自对应于SEQID NO:的序列。
50.一种包括权利要求48所述多核苷酸的表达载体,所述多核苷酸可操作地连接至适 合指导在宿主细胞中表达的控制序列。
51.根据权利要求50所述的表达载体,其中所述控制序列包括启动子。
52.根据权利要求51所述的表达载体,其中所述启动子包括大肠杆菌启动子。
53.一种包括权利要求50所述表达载体的宿主细胞。
54.根据权利要求53所述的宿主细胞,其为大肠杆菌。
55.根据权利要求53所述的宿主细胞,其中编码所述多肽的所述表达载体的密码子已 被优化以在所述宿主细胞中表达。
56.一种组合物,其包括权利要求1-46任一项的酮还原酶和结构式(I)的底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯;结构式(II) 的产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯; 结构式(III)的底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基] 苯基]-2-丙醇;或结构式(IV)的产物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2-羟丙-2-基)苯基)丙-1-醇。
57.根据权利要求56所述的组合物,其中所述底物是结构式(I)的底物而且所述组合 物还包括结构式(II)的产物。
58.根据权利要求56所述的组合物,其中所述底物是结构式(II)的底物而且所述组合 物还包括结构式(IV)的产物。
59.根据权利要求56所述的组合物,还包括辅助因子再生系统。
60.根据权利要求59所述的组合物,其中所述辅助因子再生系统包括葡萄糖脱氢酶和 葡萄糖;甲酸脱氢酶和甲酸;或者异丙醇和仲醇脱氢酶。
61.一种将式(I)的底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙 基]苯甲酸甲酯还原为式(II)的产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3_羟丙基)苯甲酸甲酯的方法,该方法包括将式(I)底物在适于将所述底物还原或转 化为式(II)产物的反应条件下与权利要求1-46任一项所述的酮还原酶多肽接触。
62.根据权利要求61所述的方法,其中所述产物以超过约99%的立体异构过量存在。
63.根据权利要求63所述的方法,其中至少约95%的所述底物在小于约24小时内被 还原为所述产物,其中所述底物的浓度是至少100g/L而所述多肽的浓度是小于约5g/L,并 且其中所述多肽包括对应于SEQ IDNO :6、8、14、16和20的氨基酸序列。
64.根据权利要求61所述的方法,该方法使用表达酮还原酶的完整细胞或这种细胞的 提取物或裂解产物进行。
65.根据权利要求61所述的方法,其中所述酮还原酶是分离和/或纯化的而且还原反 应是在酮还原酶的辅助因子以及任选地辅助因子再生系统的存在下进行的。
66.根据权利要求65所述的方法,其中所述辅助因子再生系统包括葡萄糖脱氢酶和葡 萄糖;甲酸脱氢酶和甲酸;或者异丙醇和仲醇脱氢酶。
67.根据权利要求66所述的方法,其中所述仲醇脱氢酶是酮还原酶。
68.一种将式(III)底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]_3_氧 代丙基]苯基]-2-丙醇还原为产物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2_羟丙-2-基)苯基)丙-1-醇的方法,该方法包括将式(III)底物在适于将 所述底物还原为式(IV)产物的反应条件下与权利要求1-46任一项所述的酮还原酶多肽接 触。
69.根据权利要求68所述的方法,其中所述产物以超过约99%的立体异构过量存在。
70.根据权利要求68所述的方法,其中至少约95%的所述底物在小于约24小时内被还原为产物,其中所述底物的浓度是至少100g/L而所述多肽的浓度是小于约5g/L,并且其 中所述多肽包括对应于SEQ ID NO :6、8、14、16和20的氨基酸序列。
71.根据权利要求68所述的方法,其使用表达酮还原酶的完整细胞或这种细胞的提取 物或裂解产物进行。
72.根据权利要求68所述的方法,其中所述酮还原酶是分离和/或纯化的而且还原反 应是在酮还原酶的辅助因子以及任选地辅助因子再生系统的存在下进行的。
73.根据权利要求72所述的方法,其中所述辅助因子再生系统包括葡萄糖脱氢酶和葡 萄糖;甲酸脱氢酶和甲酸;或者异丙醇和仲醇脱氢酶。
74.根据权利要求73所述的方法,其中所述仲醇脱氢酶是酮还原酶。
75.一种用于合成式(XX)化合物的方法 化为式(II)产物的反应条件下将式(I)底物与权利要求1-46任一项所述的酮还原酶多肽 接触而将式(I)底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲 酸甲酯还原为式(II)产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3_羟 丙基)苯甲酸甲酯;以及(b)将式(II)化合物与烷基磺酰基卤素或芳基磺酰基卤素在适于 形成化合物(XX)的条件下反应。
76.根据权利要求75所述的方法,其中所述烷基磺酰基卤素是甲基磺酰氯。
77.一种用于合成式(XXI)化合物的方法 化为式(IV)产物的反应条件下将式(III)底物与权利要求1-46任一项所述的酮还原酶多 肽接触而将式(III)底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]-3-氧代丙 基]苯基]-2-丙醇还原为式(IV)产物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2-羟丙-2-基)苯基)丙-1-醇;以及(b)将式(IV)化合物与烷基磺酰基卤 素或芳基磺酰基卤素在适于形成化合物(XXI)的条件下反应。
78.根据权利要求75所述的方法,其中所述烷基磺酰基卤素是甲基磺酰氯。
79. 一种用于合成化合物(V)或其盐、水合物或溶剂化物的方法 其中所述方法中的步骤包括通过在适于将底物还原或转化为式(II)产物的反应条件下将式(I)底物与权利要求1-46任一项所述的酮还原酶多肽接触而将式(I)底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯还原为式(II) 产物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羟丙基)苯甲酸甲酯。
80. 一种用于合成化合物(V)或其盐、水合物或溶剂化物的方法 其中所述方法中的步骤包括通过在适于将底物还原为式(IV)产物的反应条件下 将式(III)底物与权利要求1-46任一项所述的酮还原酶多肽接触而将式(III)底物 2_ [2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]_3_氧代丙基]苯基]-2-丙醇还原为式 (IV)产物(5,幻-1-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羟丙-2-基)苯 基)丙-ι-醇。
全文摘要
本公开提供与天然存在的野生型酮还原酶相比具有改进性质的人工改造的酮还原酶。还提供了编码人工改造的酮还原酶的多核苷酸、能够表达人工改造的酮还原酶的宿主细胞和使用人工改造的酮还原酶来合成各种手性化合物的方法。
文档编号C12N9/04GK101889081SQ200880118039
公开日2010年11月17日 申请日期2008年9月28日 优先权日2007年9月28日
发明者吉伽特·哈思曼, 杰克·梁, 波蒂·博勒普, 艾米丽·穆德弗, 詹姆士·拉隆德, 韦丝娜·米切尔 申请人:科德克希思公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1