具有改良比活和/或热稳定性的葡糖淀粉酶的组合变体的制作方法

文档序号:392878阅读:231来源:国知局
专利名称:具有改良比活和/或热稳定性的葡糖淀粉酶的组合变体的制作方法
技术领域
本发明公开了亲本葡糖淀粉酶的组合变体,其具有改变的特性,适用于淀粉水解组合物和清洁组合物。本发明也公开了编码该变体的DNA构建体和用于在宿主细胞内生产葡糖淀粉酶变体的方法。
背景技术
葡糖淀粉酶(葡聚糖1,4_α -葡糖水解酶,EC 3. 2. I. 3)是淀粉水解外切糖酶,其催化从淀粉或相关的寡糖或多糖分子的非还原末端移去相继的葡萄糖单元。葡糖淀粉酶能够水解淀粉(例如,直链淀粉和支链淀粉)的直链和支链葡糖苷键。多种细菌菌株、真菌、酵母和植物都产生葡糖淀粉酶。特别令人感兴趣和在商业上重要的是,葡糖淀粉酶是在细胞外产生的真菌酶,例如来自以下属的菌株曲霉属(Aspergillus) (Svensson 等,Carlsberg Res. Commun. 48 :529-544 (1983) ;Boel 等,EMBO J. 3 :1097-1102(1984) ;Hayashida 等,Agric. Biol. Chem. 53 :923-929(1989);美国专利号 5,024,941 ;美国专利号 4,794,175 和 WO 88/09795);篮状菌属(Talaromyces)(美国专利号4,247,637 ;美国专利号6,255,084 ;和美国专利号6,620,924);根霉属(Rhizopus) (Ashikari 等,Agric.Biol. Chem. 50 :957-964(1986) ;Ashikari 等,App.Microbio· Biotech. 32 :129-133(1989)和美国专利号 4,863,864);腐质霉属(Humicola)(W0 05/052148 和美国专利号 4,618,579);以及毛霉属(Mucor) (Houghton-Larsen 等,Appl. Microbiol. Biotechnol. 62 :210-217 (2003))。许多编码这些酶的基因已经被克隆,并在酵母、真菌和/或细菌细胞中表达。在商业上,葡糖淀粉酶是非常重要的酶,已在许多需要淀粉水解的用途中使用(例如,用于从淀粉生产葡萄糖或其它单糖)。葡糖淀粉酶可以用于生产高果糖的玉米甜味齐U,高果糖玉米甜味剂占据超过50%的美国甜味剂市场。通常,在淀粉水解过程中,葡糖淀粉酶可以且通常与α-淀粉酶一起使用,以将淀粉水解为糊精,再水解为葡萄糖。然后,葡萄糖可以被其它酶(例如,葡萄糖异构酶)转化为果糖;结晶;或用于发酵以生产许多终产物(例如,乙醇、柠檬酸、乳酸、琥珀酸、抗坏血酸中间体、谷氨酸、甘油和1,3_丙二醇)。使用葡糖淀粉酶在含淀粉和/或纤维素的物质的发酵中生产的乙醇可以用作燃料的来源或用于醇消费。尽管葡糖淀粉酶已经被成功用于商业应用许多年了,但仍然需要具有改变的特性(例如改良的比活和增加的热稳定性)的新型葡糖淀粉酶。
发明概述本文涉及的葡糖淀粉酶变体在催化结构域和/或淀粉结合结构域内包含氨基酸取代。变体显示出改变的特性,例如改良的热稳定性和/或增加的比活。在一方面,葡糖淀粉酶变体在SEQ ID NO :2所示的氨基酸序列中的如下位置上或在亲本葡糖淀粉酶中的等价位置上包含一个或多个取代10,14,15,23,42,43,44,59,60,61,65,67,68,72,73,97,98,99,102,110,113,114,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,294,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,417,418,430,431,433,436,442,444,448,451,493,494,495,502,503,508,511,518,519,520,527,531,535,536,537,539,563,或 577。该一个或多个氨基酸取代可以是 T10,L14,N15,P23,T42,143,D44,P45,D46,F59,K60,N61,T67,E68,A72,G73,S97,L98, A99, S102, K108, E110, L113, K114, R122, Q124, R125, 1133,K140, N144, N145, Y147,S152, N153, N164, F175, N182, A204, T205, S214, V216, Q219, W228, V229, S230, S231,D236,1239,N240, T241,N242,G244, N263, L264, G265, A268, G269, D276, V284, S291,G294,P300,A301, A303, Y310, A311,D313,Y316, V338, T342, S344, T346, A349, V359, G361, A364, T375,N379, S382, S390, E391, A393, K394, R408, S410, S415, L417, H418, T430, A431, R433, 1436,A442, N443, S444, T448, S451, T493, P494, T495, H502, E503, Q508, Q511,N518,A519, A520,T527, V531, A535, V536, N537, A539, N563,和 N577。在再一方面,该一个或多个氨基酸取代可以是T10S, T42V, I43Q/R, D44R/C, N61I, T67M, E68C/M, A72Y, G73F/W, S97N, S102A/M/R, K114M/Q, I133T/V, N145I, N153A/D/E/M/S/V, T205Q, Q219S, W228A/F/H/M/V, V229I/L,S230C/F/G/L/N/Q/R, S231L/V, D236R, I239V/Y, N263P, L264D/K, A268C/D/G/K, S291A/F/H/M/T, G294C, A301P/R, V338I/N/Q, T342V, S344M/P/Q/R/V, G36ID/E/F/I/L/M/P/S/W/Y,A364D/E/F/G/K/L/M/R/S/T/V/W, T375N, K394S, L417K/R/V, T430A/K, A431I/L/Q, R433C/E/G/L/N/S/V/Y, I436H, T451K, T495K/M/S, E503A/C/V, Q508R, Q511H, A519I/K/R/Y, A520C/L/P, V531L, A535K/N/P/R, V536M, A539E/R/S, N563C/E/I/K/K/Q/T/V,或 N577K/P/R.在另一方面,葡糖淀粉酶变体包含两个或更多个氨基酸取代,对应于SEQ ID NO:2 的位置=43,44,61,73, 294,417,430,431,503,511,535,539 或 563 位,或亲本葡糖淀粉酶中的等价位置。该两个或更多个氨基酸取代可以是I43Q/R,D44R/C,N61I, G73F,G294C,L417R/V, T430A/M, A431L/Q, E503A/V, Q511H, A535R, A539R,和 / 或 N563I/K。在另一方面,葡糖淀粉酶变体可以还包含对应于如下位置的一个或多个氨基酸取代,所述位置为=SEQID NO : 2的位置10,14,15,23,42,59,60,65,67,68,72,97,98,99,102,110,113,114,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,418,433,436,442,444,448,451,493,494,495,502,508,518,519,520,527,531,536,537,或 577,
或亲本葡糖淀粉酶中的等价位置。该一个或多个额外的氨基酸取代可以是T10S, T42V, T67M, E68C/M, A72Y, S97N, S102A/M/R, K114M/Q, I133T/V, N145I,N153A/D/E/M/S/V, T205Q, Q219S, W228A/F/H/M/V, V229I/L, S230C/F/G/L/N/Q/R, S231L/V, D236R, I239V/Y, N263P, L264D/K, A268C/D/G/K, S291A/F/H/M/T, A301P/R, V338I/N/Q, T342V, S344M/P/Q/R/V, G361D/E/F/I/L/M/P/S/W/Y, A364D/E/F/G/K/L/M/R/S/T/V/W,T375N, K394S, R433C/E/G/L/N/S/V/Y, I436H, T451K, T495K/M/S, Q508R, A519I/K/R/Y,A520C/L/P, V531L, V536M,或 N577K/P/R.在其他方面,葡糖淀粉酶变体包含对应于如下位置的氨基酸取代SEQ ID NO : 2的(a) 61,417,431 和 539 位,(b) 43,417,431,535 和 539 位;或(c) 73,503 和 563 位,或亲本葡糖淀粉酶中的等价位置。氨基酸取代可以是(a)N61I, L417G/R/V,A431L/Q和A539R ; (2)I43Q/R, L417G/R/V, A431L/Q, A535R和 A539R ;或(3)G73F,E503V和 N563K。
葡糖淀粉酶变体可以于SEQ ID NO 2的相关位置、或于亲本葡糖淀粉酶中的等价位置包含以下取代组之一N61I/L417V/A431L/A539R ;I43Q/N61I/L417V/A431L/A539R ;N61I/L417V/A431L/A535R/A539RI43Q/L417V/A431L/A535R/A539R ;I43Q/N61I/L417V/A431L/A535R/A539R ;I43Q/N61I/L417V/T430A/A431L/A535R/A539R ;I43Q/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;N61I/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;I43Q/N61I/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;I43R/N61I/L417V/A431L/A539R ;I43R/N61I/L417V/T430A/A431L/A535R/A539R ;G73F/L417R/E503V/A539R/N563K ;I43R/G73F/L417R/E503V/A539R/N563K ;和I43R/G73F/E503V/Q511H/N563K.葡糖淀粉酶变体可以包含一个或多个额外的氨基酸取代,所述取代对应于SEQ IDNO :2的第43,44,61,73,294,430,503,511,535或563位,或亲本葡糖淀粉酶中的等价位置。该一个或多个额外的氨基酸取代可以是I43Q/R,D44C/R,N61I, G73F,G294C,T430A/M,E503A/V, Q511H,A535R或N563I/K。葡糖淀粉酶变体可以包含一个或多个额外的氨基酸取代,所述取代对应于 SEQ ID NO 2 的位置 10,14,15,23,42,59,60,65,67,68,72,97,98,99,102,110,113,114,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,418,433,436,442,444,448,451,493,494,495,502,508,518,519,520,527,531,536,537 或 577,或亲本葡糖淀粉酶中的等价位置。该一个或多个额外的氨基酸取代可以是T10S,T42V,T67M,E68C/M,A72Y,S97N,S102A/M/R,Kl14M/Q,I133T/V,N145I,N153A/D/E/M/S/V, T205Q, Q219S,W228A/F/H/M/V, V229I/L, S230C/F/G/L/N/Q/R, S231L/V, D236R, I239V/Y, N263P, L264D/K, A268C/D/G/K, S291A/F/H/M/T, A301P/R, V338I/N/Q, T342V, S344M/P/Q/R/V, G361D/E/F/1/L/M/P/S/W/Y,A364D/E/F/G/K/L/M/R/S/T/V/W, T375N, K394S, R433C/E/G/L/N/S/V/Y,I436H, T451K, T495K/M/S, Q508R, A519I/K/R/Y, A520C/L/P, V531L, V536M,或 N577K/P/R.葡糖淀粉酶变体与SEQ ID NO :1或2或亲本葡糖淀粉酶具有至少80%,85%,90%,95%,99. 5%的序列同一性。亲本葡糖淀粉酶或葡糖淀粉酶变体可以包含与SEQ IDNO :1,2,3,5,6,7,8或9具有至少80%,85%,90%,95%或99. 5%的序列同一性的催化结构域。亲本葡糖淀粉酶或葡糖淀粉酶变体可以包含与SEQ ID NO :1,2,11,385,386,387,388,389或390具有至少95 %,96 %,97 %,98 %,99 %或99. 5 %的序列同一性的淀粉结合结构域。亲本葡糖淀粉酶可以包含SEQ ID:1或2。任选地,亲本葡糖淀粉酶可以由SEQ IDNO :1或2组成。亲本葡糖淀粉酶可以是来自木霉属的种(Trichoderma spp.),曲霉属的种(Aspergillus spp·),腐质霉属的种(Humicola spp·),青霉属的种(Penicillium spp·),篮状菌属的种(Talaromycese spp.),或裂殖酵母属的种(Schizosaccharmyces spp.)之任一的酶。在一些方面,亲本葡糖淀粉酶可来自木霉属的种(Trichoderma spp.)或曲霉属的种(Aspergillus spp.)。 本发明还提供了葡糖淀粉酶变体,所述葡糖淀粉酶变体包含以下取代组之一,于SEQ ID NO 2的相关位置,或于亲本葡糖淀粉酶中的等价位置L417V/A431L/A539R ;I43Q/L417V/A431L/A539R ;L417V/A431L/A535R/A539RI43R/L417V/A431L/A539R ;L417R/A431L/A539R ;或 L417G/A431L/A539R ;其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体不具有任何其它取代,并且其中亲本葡糖淀粉酶具有与SEQ ID N0:l,2,3,5,6,7,8或9有至少80%序列同一性的催化结构域。亲本葡糖淀粉酶可以包含与SEQ ID NO :1,2,11,385,386,387,388,389 或 390 具有至少95%的序列同一性的淀粉结合结构域。亲本葡糖淀粉酶可以与SEQ ID N0:1或2具有至少80%的序列同一性;例如,其可以包含SEQ ID NO :1或2。任选地,亲本葡糖淀粉酶可以由SEQ ID NO :1或2组成。在一方面,与亲本葡糖淀粉酶相比较,变体葡糖淀粉酶显示出改变的热稳定性。改变的热稳定性可以是增加的热稳定性。可选地或此外,与亲本葡糖淀粉酶相比较,变体表现出改变的比活。改变的比活可以是增加的比活。本发明还涉及编码所述变体的多核苷酸。一方面是包含该多核苷酸的载体。另一方面是包含该载体的宿主细胞。另一方面是通过在适于葡糖淀粉酶变体表达和产生的条件下培养包含该多核苷酸的宿主细胞以及生产该变体来生产变体葡糖淀粉酶的方法。方法还可以包括从培养物回收葡糖淀粉酶变体的步骤。本发明的另一方面是包含葡糖淀粉酶变体的酶组合物。在一方面,酶组合物用于淀粉转化工艺,例如醇发酵工艺或高果糖糖浆生产工艺。附图
简述
附图被整合进本说明书并组成本说明书的一部分,其对实施方案进行举例说明。在图中图IA描述了具有632个氛基酸(SEQ ID NO :I)的里氏木霉(Trichoderma reesei)葡糖淀粉酶(TrGA)。信号肽以加下划线表示;催化区域(SEQ ID NO 3)以粗体表示,其开始于氨基酸残基SVDDFI (SEQ ID NO :12),具有453个氨基酸残基;接头区域以斜体表示;淀粉结合结构域(SBD)以斜体和加下划线表示。TrGA的成熟蛋白质(SEQ ID NO 2)包括催化结构域(SEQ ID NO 3)、接头区域(SEQ ID NO 10)和淀粉结合结构域(SEQ ID NO :11)。对于TrGA葡糖淀粉酶分子的SBD编号,在本发明中参考a)成熟TrGA的SEQ ID NO 2中的491至599位,和/或b) SEQ ID NO : 11中的I至109位(其代表成熟TrGA的分离的SBD序列)。对于TrGA分子的催化结构域编号,参考SEQ ID NO :2和/或SEQ ID NO :3。图IB描述了编码TrGA的cDNA(SEQ ID NO 4)。图IC描述了前体和成熟蛋白质TrGA结构域。图2 描述了包含 TrGA 的 cDNA (SEQ ID NO 4)的目的质粒(destination plasmid)pDONR-TrGA。图3 描述了质粒 pTTT-Dest。图4描述了最终表达载体pTTT-TrGA。图5A和5B描述了亲本葡糖淀粉酶的催化结构域的比对比较,所述亲本葡糖淀粉酶来自泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO :5);黑曲霉(Aspergillusniger) (AnGA) (SEQ ID NO :6);米曲霉(Aspergillus oryzae) (AoGA) (SEQ ID NO :7);里氏木霉(Trichoderma reesei) (TrGA) (SEQ ID NO :3);灰腐质霉(Humicola grisea) (HgGA)(SEQ ID NO 8);和酒色肉座菌(Hypocrea vinosa) (HvGA) (SEQ ID NO :9)。相同的氨基酸以星号(*)表示。图5C描述了篮状菌属(Talaromycese)的葡糖淀粉酶(TeGA)成熟蛋白质序列(SEQ ID NO :384)。图和5E描述了亲本葡糖淀粉酶的淀粉结合结构域(SBD)的比对比较,所述亲本葡糖淀粉酶来自里氏木霉(Trichoderma reesei) (SEQ ID NO 11);灰腐质霉(Humicola grisea) (HgGA) (SEQ ID NO 385);疏绵状嗜热丝抱菌(Thermomyceslanuginosus)(ThGA)(SEQ ID NO 386);埃默森篮状菌(Talaromyces emersonii)(TeGA) (SEQ ID NO :387);黑曲霉(Aspergillus niger) (AnGA) (SEQ ID NO :388);泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO :389);和太瑞斯梭抱壳(Thielaviaterrestris)(TtGA)(SEQ ID NO :390)。图6描述了从侧面观察的里氏木霉(Trichoderma reesei)葡糖淀粉酶(黑色)(SEQ ID NO:2)和泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(灰色)(SEQ ID NO 5)的三维结构的比较。所述侧面是参考活性位点来量度的,活性位点入口在分子的“顶部”。图7描述了从顶部观察的里氏木霉(Trichoderma reesei)葡糖淀粉酶(黑色)(SEQ ID NO:2)和泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(灰色)(SEQ ID NO 5)的三维结构的比较。图8描述了从侧面观察的TrGA (SEQ ID NO 2)和AnGA (SEQ ID NO 6)的三维结构的比对,显示结合位点I和2。图9描述了阿卡波糖与TrGA晶体结构结合的模型。发明详述 葡糖淀粉酶是需要淀粉水解的多种应用中的商业上重要的酶。本文描述的葡糖淀粉酶变体在其催化结构域或淀粉结合结构域内包含氨基酸取代。变体可以显示出改变的特性,所述特性例如改良的热稳定性和/或比活。具有改良的热稳定性和/或比活的变体可以例如显著地提高从玉米淀粉生产葡萄糖和燃料乙醇的效率。I.定义和缩写I. I.定义除非另外定义,本文中使用的所有技术和科学术语都具有本发明所属领域普通技术人贝通吊理解的思思。Singleton 等,Dictiqnary Of Micrqbiquxy And Moleculae Biqixigy,弟 2 版,JohnWiley 和 Sons, New York(1994),以及 Hale 和 Markham, THE Haepee Collins Dictionaey Of Biology,Harper Perennial,N. Y. (1991)为技术人员提供了本文中使用的许多术语的一般含义。出于清楚和便于参考的原因,将一些术语定义如下。如本文中使用的,术语“葡糖淀粉酶(EC 3. 2. I. 3) ”指催化从淀粉和相关的寡糖和多糖的非还原末端释放D-葡萄糖的酶。 术语“亲本”或“亲本序列”指在宿主细胞内原来存在的或天然存在的序列。亲本葡糖淀粉酶包括但不限于SEQ ID NOs :1,2,3,5,6,7,8和9中所示的葡糖淀粉酶序列,以及与SEQ ID NO :2具有80%的氨基酸序列同一性的葡糖淀粉酶。如本文中使用的,“等价位置”意指,基于所讨论的亲本葡糖淀粉酶的氨基酸序列以及所讨论的亲本葡糖淀粉酶的三维结构分别与TrGA参照葡糖淀粉酶的氨基酸序列(SEQID N02)和三维结构的比对,两个亲本序列中共同的位置。因此,序列比对或结构比对可以用来确定等价性。术语“TrGA”指具有SEQ ID NO :2中所示成熟蛋白质序列的亲本里氏木霉(Trichoderma reesei)葡糖淀粉酶序列,其包括具有SEQ ID NO :3中所示序列的催化结构域。TrGA的分离、克隆和表达描述于W02006/060062和美国专利号7,413,887中,两者均通过引用整合到本文中。在一些实施方案中,亲本序列指作为蛋白质工程起点的葡糖淀粉酶序列。本文中,葡糖淀粉酶氨基酸的编号基于葡糖淀粉酶与TrGA(SEQ ID NO :2和/或3)的序列比对。词组“蛋白质或多肽的成熟形式”指蛋白质或多肽的最终功能形式。例如,葡糖淀粉酶的成熟形式可以缺乏信号肽。作为示例,TrGA的成熟形式包括催化结构域、接头区域和淀粉结合结构域,具有SEQ ID NO 2的氨基酸序列。如本文中使用的,术语“葡糖淀粉酶变体”和“变体”用来指与亲本葡糖淀粉酶序列具有一定程度的氨基酸序列同一性的葡糖淀粉酶。变体与亲本序列相似,但在其氨基酸序列中具有至少一个取代、缺失或插入,从而使其在序列上与亲本葡糖淀粉酶不同。在某些情况下,变体已经被操作和/或改造以在其氨基酸序列中包括至少一个取代、缺失或插入,从而使其在序列上与亲本不同。此外,葡糖淀粉酶变体可以保留亲本葡糖淀粉酶的功能特征,例如,维持亲本葡糖淀粉酶的至少约50%、约60%、约70%、约80%或约90%的葡糖淀粉酶活性。当进行最佳比对来比较时,“变体”可以与亲本多肽序列具有至少约45%、约50%、约 55 %、约 60 %、约 65 %、约 70 %、约 75 %、约 80 %、约 85 %、约 88 %、约 90 %、约 91 %、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或约99. 5%的序列同
一性。在一些实施方案中,葡糖淀粉酶变体可以与亲本葡糖淀粉酶的催化结构域具有至少约 45%、约 50%、约 55%、约 60%、约 65%、约 70%、约 75%、约 80%、约 85%、约 88%、约90 %、约 91 %、约 92 %、约 93 %、约 94 %、约 95 %、约 96 %、约 97 %、约 98 %、约 99 % 或约99. 5%的序列同一性。在一些实施方案中,葡糖淀粉酶变体可以与亲本葡糖淀粉酶的淀粉结合结构域具有至少约45 %、约50 %、约55 %、约60 %、约65 %、约70 %、约75 %、约80 %、约 85%、约 88%、约 90%、约 91%、约 92%、约 93%、约 94%、约 95%、约 96%、约 97%、约98%、约99%或约99. 5%的序列同一性。序列同一性可以基于亲本或变体序列的总长来测定。可以利用本领域已知的标准技术来确定序列同一性(见例如,Smith和Waterman,Adv. Appl. Math. 2 482 (1981) ;Needleman 和 Wunsch, J. Mol. Biol. 48 :443 (1970) ;Pearson和 Lipman,Proc· Natl. Acad. Sci. USA 85:2444(1988) jl^PWisconsin Genetics SoftwarePackage (Genetics Computer Group, Madison, WI)中的程序 GAP、BESTHT、FASTA 和 TFASTA等;以及 Devereux 等,Nucleic Acid Res.,12 :387-395 (1984))。“百分比)核酸序列同一性”或“百分比)氨基酸序列同一性”被定义为,在候选序列中与起始序列(例如,PS4)的核苷酸残基或氨基酸残基相同的核苷酸残基或氨 基酸残基的百分比。序列同一性可以基于起始序列的总长来测定。在本文中,“序列同一性”通过序列比对方法来确定。为了本发明的目的,比对方法可以是 Altschul 等描述的 BLAST(Altschul 等,J. Mol. Biol. 215 :403-410(1990);和Karlin 等,Proc. Natl. Acad. Sci. USA 90:5873-5787(1993))。特别有用的 BLAST 程序是WU-BLAST-2 程序(见 Altschul 等,Meth. Enzymol. 266 :460-480 (1996))。WU-BLAST-2 利用了几个搜索参数,其中大部分都可以设定为默认值。可调节的参数可以设定为如下值重叠跨度(overlap span) = 1,重叠分数(overlap fraction) = 0. 125,字阈值(wordthreshold) (T) = 11。HSP S和HSP S2参数是动态值,其由程序本身根据具有序列的组成和搜索目的序列所用的特定数据库的组成来确定。然而,可以对该值进行调节以增加灵敏度。百分比(%)氨基酸序列同一性值是由匹配的相同残基的数除以比对区域内“较长的”序列的残基总数来确定的。“较长的”序列是在比对区域内具有最多实际残基的序列(忽略为了使比对分数最大化而由WU-Blast-2引入的空位)。术语“最佳比对”指产生最高百分比同一性分数的比对。如本文中使用的,术语“催化结构域”指多肽的结构区域,其包含用于底物水解的活性位点。术语“接头”指通常具有3至40个氨基酸残基的短氨基酸序列,其使包含淀粉结合结构域的氨基酸序列与包含催化结构域的氨基酸序列共价连接。术语“淀粉结合结构域”指优先地与淀粉底物结合的氨基酸序列。如本文中使用的,术语“突变序列”和“突变基因”可互换使用,其指宿主细胞的亲本序列中的至少一个密码子发生了改变的多核苷酸序列。突变序列的表达产物是变体蛋白质,所述变体蛋白质与亲本相比较具有改变的氨基酸序列。表达产物可以具有改变的功能能力(例如,增加的酶活性)。如本文中使用的,涉及多肽时,术语“特性”或其语法等同物指多肽的可以进行选择或检测的任何特征或属性。这些特性包括但不限于,氧化稳定性、底物特异性、催化活性、热稳定性、PH活性谱、对蛋白水解降解的抗性、KM、Kcat, Kcat/Km比值、蛋白质折叠、结合底物的能力和被分泌的能力。如本文中使用的,涉及核酸时,术语“特性”或其语法等同物指核酸的可以进行选择或检测的任何特征或属性。这些特性包括但不限于,影响基因转录的特性(例如,启动子强度或启动子识别),影响RNA加工的特性(例如,RNA剪切和RNA稳定性),影响翻译的特性(例如,调控,mRNA与核糖体蛋白质的结合)。术语“热稳定”和“热稳定的”指,本发明的葡糖淀粉酶变体在淀粉底物水解期间惯常的条件下、于一定的温度下暴露给定的时间后(例如,暴露于改变的温度),维持规定量的酶活性。在涉及例如热稳定性等特性时,术语“增加的稳定性”指经过一段时间后,与其它参照(即,亲本)葡糖淀粉酶相比较,保留了较高的淀粉水解活性。在涉及例如热稳定性等特性时,术语“降低的稳定性”指经过一段时间后,与其它参照葡糖淀粉酶相比较,保留了较低的淀粉水解活性。 术语“比活”定义为每毫克葡糖淀粉酶蛋白质的活性。在一些实施方案中,葡糖淀粉酶的活性通过本文中描述的乙醇分析试验来测定,表示为从淀粉底物产生的葡萄糖的量。在一些实施方案中,可以使用本文中描述的Caliper分析试验来测定蛋白质的浓度。术语“活性”和“生物学活性”指与特定蛋白质相关的生物学活性。由此,给定蛋白质的生物学活性指由本领域技术人员典型地归属于所述蛋白质的任何生物学活性。例如,与葡糖淀粉酶相关的酶活性是水解,因此,活性葡糖淀粉酶具有水解活性。术语“多核苷酸”和“核酸”在本文中可互换使用,指任意长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)聚合形式。这些术语包括但不限于单链、双链或三链DNA,基因组DNA, cDNA, RNA, DNA-RNA杂合体,或包含嘌呤和嘧啶碱基或其它天然、化学、生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。如本文中使用的,术语“DNA构建体”、“转化DNA”和“表达载体”可互换使用,指用于将序列引入宿主细胞或生物体内的DNA。该DNA可以通过PCR或任何其它本领域技术人员已知的合适技术在体外产生。DNA构建体、转化DNA或重组表达盒可以并入质粒、染色体、线粒休DNA、质体DNA、病毒或核酸片段中。通常,表达载体、DNA构建体或转化DNA的重组表达盒部分包括待转录的核酸序列和启动子以及其它序列。在一些实施方案中,表达载体具有在宿主细胞内整合和表达异源DNA片段的能力。如本文中使用的,术语“载体”指设计用于将核酸引入到一种或多种细胞类型中的多核苷酸构建休。载体包括克隆载体、表达载体、穿梭载体、质粒、盒等。如本文中使用的,涉及将核酸序列引入细胞时,术语“引入”指适于将核酸序列转移到该细胞内的任何方法。此类用于引入的方法包括但不限于原生质体融合、转染、转化、接合和转导。如本文中使用的,术语“转化的”和“稳定转化的”指具有整合到其基因组内或作为附加体质粒维持至少两代的非天然(异源的)多核苷酸序列的细胞。如本文中使用的,术语“选择性标记”和“选择标记”指能够在宿主细胞内表达的核酸(例如,基因),其允许容易地选择那些含有载体的宿主。通常,选择性标记是赋予宿主细胞抵抗抗微生物剂的抗性或代谢优势的基因,从而使含有外来DNA的细胞可以区别于在转化过程中未接受任何外来序列的细胞。
如本文中使用的,术语“启动子”指具有指导下游基因转录的作用的核酸序列。启动子,与其它转录和翻译调控核酸序列(也被称为“控制序列”)一起,是表达给定基因所必需的。通常,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列,以及增强子或激活物序列。当核酸被置于与另一核酸序列的功能性关系中时,它是“有效连接的”。例如,编码分泌前导区(即,信号肽)的DNA,当表达为参与多肽分泌的前蛋白时,是与编码多肽的DNA有效连接的。通常,“有效连接的”意指所连接的DNA序列是连续的,并且就分泌前导区来说,是连续的且在阅读框中。如本文中使用的术语“基因”指编码多肽的多核苷酸(例如,DNA片段),其包括位于编码区前和后的区域、以及位于编码区段(外显子)之间的间插序列(内含子)。如本文中使用的,“直系同源物”和“直系同源基因”指不同物种中的、从共同祖先基因(即,同源基因)通过物种形成而进化成的基因。通常,直系同源物在进化过程中保留 了相同的功能。直系同源物的鉴别可用于可靠预测新测序基因组中的基因功能。如本文中使用的,“旁系同源物”和“旁系同源基因”指通过基因组内复制而相关的基因。直系同源物在进化过程中保留了相同的功能,而旁系同源物则进化出新的功能,即使一些功能常与原来的功能相关。旁系同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因,它们都是丝氨酸蛋白酶,并一起存在于相同的物种内。如本文中使用的,术语“杂交”,如本领域已知的,指一条核酸链通过碱基配对与互补链结合的过程。如果在中等至高严紧杂交和洗涤条件下,核酸序列与参照核酸序列特异地相互杂交,则认为核酸序列可以与参照核酸序列“选择性杂交”。杂交条件基于核酸结合复合体或探针的解链温度CU。例如“最大严紧”通常是约^!(比探针的T_JS5°C); “高严紧”是比Tm低约5-10°C ;“中等严紧”是比探针的Tm低约10-20°C 低严紧”是比Tm低约20-25°C。从功能上讲,最大严紧条件可用于鉴别与杂交探针严格相同或接近严格相同的序列;而中等或低严紧杂交可用于鉴别或检测多核苷酸序列同源物。中等和高严紧杂交条件在本领域公知。高严紧条件的实例包括在50%甲酰胺、5 X SSC, 5 X Denhardt; s 溶液、0.5% SDS 和 100 μ g/ml 变性载体 DNA 中,于约 42 °C 杂交,然后在2 X SSC和O. 5% SDS中于室温洗涤两次,在O. IXSSC和O. 5% SDS中于42°C再洗涤两次。中等严紧条件的实例包括在包含20%甲酰胺、5XSSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH 7. 6) ,5 XDenhardt; s溶液、10%硫酸葡聚糖和20mg/ml变性剪切蛙精DNA的溶液中,于37°C孵育过夜,然后在IXSSC中于约37_50°C洗涤滤膜。本领域技术人员知道如何酌情调节温度、离子强度等,以适应例如探针长度等因素。如本文中使用的,“重组”包括细胞或载体,所述细胞或载体通过引入异源或同源的核酸序列而已经被修饰,或者所述细胞来源于如此修饰的细胞。因此,例如,作为有意的人为干预的结果,重组细胞可以表达在天然(非重组)形式的细胞内不存在相同形式的基因,或者使原本异常表达、低表达或完全不表达的天然基因表达。在本发明的一个实施方案中,在至少一个密码子上,用位点饱和诱变,产生突变的DNA序列。在另一个实施方案中,对两个或更多个密码子进行位点饱和诱变。在其它实施方案中,突变的DNA序列与亲本序列具有高于约50 %、约55 %、约60 %、约65 %、约70 %、约75%、约80%、约85%、约90%、约95%、或约98%的同一性。在可选的实施方案中,利用任何已知的诱变方法(例如,辐射、亚硝基胍等)在体内产生突变的DNA。然后分离所需的DNA序列并用于本文中提供的方法。如本文中使用的,“异源蛋白质”指在宿主细胞内非天然存在的蛋白质或多肽。如果酶在宿主细胞内表达的水平比在相应的野生型细胞内表达的水平更高,则酶在宿主细胞内是“过量表达”的。术语“蛋白质”和“多肽”在本文中可互换使用。在本发明说明书和权利要求中,使用氨基酸残基的常规单字母和三字母代码。所定义的该氨基酸3-字母代码按照IUPAC-IUB生物化学命名联合委员会(Joint Commission on Biochemical Nomenclature) (JCBN)进行定义。还应理解的是,由于遗传密码的简并性,多肽可以由一条以上核苷酸序列编码。对本发明的变体按以下命名法进行描述[原始氨基酸残基/位置/取代的氨基酸残基]。例如,以亮氨酸取代76位的精氨酸表示为R76L。当一个给定位置可以被多个氨基酸取代时,取代表示为I) Q172C, Q172D或Q172R ;2) Q172C,D或R ;或3) Q172C/D/R。当在本文中适于取代的位置被指出但是没有提出特定的氨基酸时,应理解的是,任何氨基酸残基都可以取代存在于该位置上的该氨基酸残基。当变体葡糖淀粉酶与其它葡糖淀粉酶相比包含缺失时,以表示缺失。例如,将R76位的缺失表示为R76'两个或更多个连续氨基酸的缺失表示为例如(76-78) *。“原序列(piOsequence) ”是位于信号序列和成熟蛋白质之间的氨基酸序列,其对蛋白质的分泌是必需的。将原序列切除后,将获得成熟的活性蛋白。术语“信号序列”或“信号肽”指可以参与成熟或前体形式蛋白质的分泌的任何核苷酸和/或氨基酸序列。信号序列的该定义是功能性的,意指包括由蛋白质基因的N-端部分编码的所有那些参与实现蛋白质分泌的氨基酸序列。它们常常,但并非绝对,结合在蛋白质的N-端部分,或结合在前体蛋白质的N-端部分。信号序列可以是内源的或外源的。信号序列可以是正常与蛋白质(例如,葡糖淀粉酶)连接的信号序列,或者可以来自编码其它分泌蛋白的基因。术语蛋白质或肽的“前体”形式指,具有与蛋白质的氨基端或羧基端有效连接的原序列的成熟形式蛋白质。前体还可以具有与原序列的氨基端有效连接的“信号”序列。前体还可以具有涉及翻译后活性的其它多核苷酸(例如,从蛋白质或肽上被切除以留下成熟形式蛋白质或肽的多核苷酸)。“宿主株”或“宿主细胞”指合适含有本发明DNA的表达载体的宿主。术语“来自”和“获自”不仅指由所讨论的生物体的株系生产或可生产的葡糖淀粉酶,而且还指由从该株系中分离的DNA序列编码的、并在含有该DNA序列的宿主生物体中产生的葡糖淀粉酶。此外,该术语还指由合成的和/或cDNA来源的DNA序列编码的、具有所讨论的葡糖淀粉酶的标识特征的葡糖淀粉酶。“衍生物”在该定义范围内一般保留在野生型、天然或亲本形式中观察到的特征性水解活性,所保留的程度使衍生物可用于与野生型、天然或亲本形式类似的目的。葡糖淀粉 酶的功能衍生物包括天然存在的、合成或重组产生的肽或肽片段,其具有本发明的葡糖淀粉酶的一般特征。
术语“分离的”指,当物质是天然存在的时,物质从天然环境中移出。“纯化的”蛋白质指至少部分纯化至同质的蛋白质。在一些实施方案中,纯化的蛋白质的纯度(以SDS-PAGE测得)大于约10%、约20%、或约30%。本发明的其它方面包括高度纯化形式(以SDS-PAGE测得)的蛋白质(S卩,纯度大于约40%、约60%、约80%、约90%、约95%、约97%、或约99% )。如本文中使用的,术语“组合诱变”指产生起始序列的变体文库的方法。在这些文库中,变体包含选自一组预定的突变的一个或几个突变。此外,该方法可以提供引入随机突变的手段,所述随机突变不是该组预定突变的成员。在一些实施方案中,该方法包括在美国专利号6,582,914中提出的方法,其通过引用整合至本文中。在可选的实施方案中,组合诱变方法包括可商业获取的试剂盒(例如,QuikChange Multisite,Stratagene,SanDiego, CA)o如本文中使用的,术语“突变体文库”指一群细胞,其基因组大部分相同,但包括一个或多个基因的不同同源物。此类文库可用于,例如,鉴别具有改良性状的基因或操纵子。
如本文中使用的术语“干固形物含量(DS或ds) ”指基于干重的、浆中的%总固形物。如本文中使用的,术语“初始命中物”指通过筛选组合共有诱变文库(combinatorial consensus mutagenesis library)而鉴别出的变体。在一些实施方案中,与起始基因相比,初始命中物具有改良的性能特征。如本文中使用的,术语“改良的命中物,,指通过筛选增强的组合共有诱变文库而鉴别出的变体。如本文中使用的,术语“目标特性”指起始基因的待改变的特性。其不意味着本发明限于任何特定的目标特性。然而,在一些实施方案中,目标特性是基因产物的稳定性(例如,对变性、蛋白水解或其它降解因素的抗性),而在其它实施方案中,在生产宿主中的生产水平被改变。事实上,可以考虑起始基因的任何特性都可用于本发明中。其它术语定义可以在整个说明书中是明显的。当提供数值范围时,应理解的是,位于该范围的上下限之间的每个中间值(到下限单位的十分之一,除非上下文另外清楚地指出)也都被具体公开。本公开还涵盖了在该所述范围中的任何述及值或中间值与在该所述范围内的任何其它述及值或中间值之间的每个更小的范围。这些更小范围的上下限可以独立地被包含在范围内或排除在范围之外,而且每个范围(其中两个端点之一或两者包含在或两个端点都不包含在该更小范围内)也都涵盖在本公开中,在不与在所述范围中任何具体排除的限定相抵触的情况下。当述及的范围包括一个或两个端点时,排除那些所包括的端点之一个或两者的范围也包括在本发明中。在更详细地描述示例性实施方案之前,应理解的是,本发明不限于所描述的特定的实施方案,其当然是可以变化的。尽管现在对示例性方法和材料进行描述,但是在实施或测试本发明时可以使用与本文中描述的相似或等同的任何方法和材料。除非上下文另外清楚地指出,在本文中和所附权利要求中使用的单数形式“一”、“一种”和“这”都包括了对复数的指示。因此,例如,提到“一种基因”时,包括了复数个此类候选物,提到“该细胞”时,包括提到一个或多个细胞及本领域技术人员已知的其等同物,坐坐
寸寸O提供本文中讨论的出版物仅由于其公开早于本申请的申请日。本文的任何内容都
不应被解释为承认本发明无权依据在先发明而先于此类出版物。I. 2.缩写
GA葡糖淀粉酶
GAU葡糖淀粉酶单元 wt %重量百分比
0C摄氏度
rpm每分钟转数
H2O水
ClH2O去离子水
ClIH2O去离子7化,Milli-Q过滤
aa或AA氣基酸
bp減基对
kb千減基对
kD千道尔顿
g或gm克
(Ag微克
mg毫克
)il和jxL微升ml和mL毫升
mm毫米
I^m微米
M摩尔
mM毫摩尔
[iM微摩尔
U单位
V伏特
MW分子量
MWCO截留分子量 sec(s)或 s(s) 秒 min(s)或 m(s)分钟 hr(s)或h(s) 小时
DO溶解氧
ABS吸光度
EtOH乙醇
PSS生理盐溶液
m/v质量/体积
MTP微量滴定板
N正常的
DPl单糖
DP2二糖
DP>3寡糖,具有大于3的聚合度的糖
ppm百万分之
SBD淀粉结合结构域 CD催化结构域
PCR聚合酶链式反应
WT 野生型2.亲本葡糖淀粉酶在一些实施方案中,本发明提供了葡糖淀粉酶变休。葡糖淀粉酶变体是亲本葡糖淀粉酶的变休,亲本葡糖淀粉酶可以包含催化结构域和淀粉结合结构域。在一些实施方案中,亲本葡糖淀粉酶包含催化结构域,所述催化结构域具有SEQ ID N0:l,2,3,5,6,7,8或9中所示氨基酸序列,或具有与SEQ ID NO :1,2,3,5,6,7,8或9中所示氨基酸序列的ー个或多个显示出至少约80 %、约85 %、约90 %、约95 %、约97 %、约99 %或约99. 5 %的序列同一性的氨基酸序列。在其它实施方案中,亲本葡糖淀粉酶包含由DNA序列编码的催化结构域,其中所述DNA序列在中等、高或严紧条件下与具有SEQ ID NO :1,2或3的氨基酸序列之一的葡糖淀粉酶的催化结构域的编码DNA杂交。在一些实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域具有SEQ ID NO 1,2,11,385,386,387,388,389或390中所示氨基酸序列,或具有与SEQID NO 1,2,11,385,386,387,388,389或390中所示氨基酸序列的一或多个显示出至少约80 %、约85%、约90 %、约95%、约97 %、约99%或约99. 5%的序列同一性的氨基酸序列。在其它实施方案中,亲本葡糖淀粉酶包含由DNA序列编码的淀粉结合结构域,其中所述DNA序列在中等、高或严紧条件下与具有SEQ ID NO :1,2或11的氨基酸序列之一的葡糖淀粉酶的淀粉结合结构域的编码DNA杂交。
葡糖淀粉酶的预测结构和已知序列在真菌物种中是保守的(Coutinho等,1994,Protein Eng.,7 :393-400 和 Coutinho 等,1994,Protein Eng.,7 :749-760)。在一些实施方案中,亲本葡糖淀粉酶是丝状真菌的葡糖淀粉酶。在一些实施方案中,亲本葡糖淀粉酶获自木霉属(Trichoderma)菌株(例如,里氏木霉(T. reesei),长枝木霉(T. longibrachiatum), T.strictipilis, M f包 ft (T. aspere丄丄um), T. Konilangbra 才ロ哈茨木霉(T. hazianum));曲霉属(Aspergillus)菌株(例如,黑曲霉(A.niger),构巢曲霉(A. nidulans), A. kawachi,泡盛曲霉(A. awamori)和米曲霉(A. orzyae));篮状菌属(Talaromyces)菌株(例如,T. emersonii, T. thermophilus 和 T. duponti);肉座菌属(Hypocrea)菌株(例如,胶质肉座菌(H. gelatinosa), H. orientalis,酒色肉座菌(H. vinosa)和淡黄肉座菌(H.citrina));铼孢属(Fusarium)菌株(例如,尖铼孢(F. oxysporum),粉红祿抱(F. roseum)和 F. venenatum);脉抱霉属(Neurospora)菌株(例如,粗糙脉孢霉(N.crassa));腐质霉属(Humicola)菌株(例如,灰腐质霉(H. grisea),特异腐质霉(H. insolens)和疏绵状腐质霉(H. Ianuginose));青霉属(Penicillium)菌株(例如,特异青霉(P. notatum)或产黄青霉(P. chrysogenum));或复膜孢酵母属(Saccharomycopsis)菌株(例如,扣囊复膜孢酵母(S. f ibuligera))。在一些实施方案中,亲本葡糖淀粉酶可以是细菌葡糖淀粉酶,例如,多肽可以获自革兰氏阳性菌菌株,例如芽孢杆菌属(Bacillus)菌株(例如,嗜碱芽孢杆菌(B. alkalophilus),解淀粉芽抱杆菌(B. amyloliquefaciens),迟缓芽抱杆菌(B. Ientus),地衣芽抱杆菌(B. Iicheniformis),嗜热脂肪芽抱杆菌(B. stearothermophi Ius),枯草芽孢杆菌(B. subtilis)和苏云金芽孢杆菌(B. thuringiensis));或链霉菌属(Streptomyces)菌株(例如,变铅青链霉菌(S. Iividans))。在一些实施方案中,亲本葡糖淀粉酶包含催化结构域,所述催化结构域与SEQ IDNO :3的TrGA氨基酸序列的催化结构域具有至少约80 %、约85 %、约90 %、约93 %、约95 %、约97%、约98%或约99%的序列同一性。在一些实施方案中,亲本葡糖淀粉酶包含催化结构域,所述催化结构域与SEQ IDNO :5或SEQ ID NO :6的曲霉属亲本葡糖淀粉酶的催化结构域具有至少约90%、约93%、约95 %、约96 %、约97 %、约98 %或约99 %的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含催化结构域,所述催化结构域与SEQ IDNO 8的灰腐质霉(HgGA)亲本葡糖淀粉酶的催化结构域具有至少约90%、约95%、约97%或约99%的序列同一性。在一些实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :1,2或11的TrGA氨基酸序列的淀粉结合结构域具有至少约80%、约85%、约90 %、约95 %、约97 %或约98 %的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :385的灰腐质霉(HgGA)葡糖淀粉酶的催化结构域具有至少约90%、约95%、约97%、或约99%的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :390的太瑞斯梭孢壳(TtGA)葡糖淀粉酶的催化结构域具有至少约90%、约95 %、约97 %、或约99 %的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :386的疏绵状嗜热丝孢菌(Thermomyces lanuginosus) (ThGA)葡糖淀粉酶的催化结构域具有至少约90%、约95%、约97%、或约99%的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :387的埃默森篮状菌(Talaromyces emersonii) (TeGA)葡糖淀粉酶的催化结构域具有至少约90%、约95%、约97%、或约99%的序列同一性。在其它实施方案中,亲本葡糖淀粉酶包含淀粉结合结构域,所述淀粉结合结构域与SEQ ID NO :388或389的曲霉属亲本葡糖淀粉酶的淀粉结合结构域具有至少约90%、约93%、约95%、约96%、约97%、约98%或约99%的序列同一性。在一些实施方案中,亲本葡糖淀粉酶与SEQ ID NO :1或2的TrGA氨基酸序列具有至少约80%、约85%、约88%、约90%、约93%、约95%、约96%、约97%、约98%或约99%的序列同一性。在其它实施方案中,木霉属(Trichoderma)葡糖淀粉酶同源物获自木霉属(Trichoderma)或肉座菌属(Hypocrea)菌株。一些典型的木霉属(Trichoderma)葡糖淀粉酶同源物描述于美国专利号No. 7,413, 887中,特别參考所述參考文献中的SEQ ID NOs 17-22和43-47所示的氨基酸序列。在一些实施方案中,亲本葡糖淀粉酶是包含SEQ ID N0:2的氨基酸序列的TrGA,或是与TrGA序列(SEQ ID NO :2)具有至少约80%、约85%、约88%、约90%、约93%、约95%、约96%、约97%、约98%或约99%的序列同一性的木霉属葡糖淀粉酶同源物。可以使用标准的重组DNA技术来分离和/或鉴别亲本葡糖淀粉酶。可以使用技术人员已知的任何标准技木。例如,可以使用对葡糖淀粉酶的保守区域特异的探针和/或引物来鉴别细菌或真菌细胞中的同源物(催化结构域、活性位点等)。可选地,可以使用简并PCR来鉴别细菌或真菌细胞中的同源物。在某些情况下,可以分析已知序列(例如数据库中的序列)与已知的葡糖淀粉酶之ー(包括SEQ ID N02)或已知的淀粉结合结构域(包括 SEQ ID NO 11)的序列和/或结构同一性。也可以利用功能分析试验来鉴别细菌或真菌细胞中的葡糖淀粉酶活性。可以分离具有葡糖淀粉酶活性的蛋白质并对其进行反向测序,以分离其对应的DNA序列。此类方法为技术人员已知。3.葡糖淀粉酶结构同源性分子生物学的中心法则是编码特定酶的基因的DNA序列决定该蛋白质的氨基酸序列,该氨基酸序列又决定该酶的三维折叠。该折叠将分开的残基带到一起形成催化中心和底物结合表面,从而导致所讨论的酶的高特异性和活性。葡糖淀粉酶由多达三个不同的结构域组成,于所有葡糖淀粉酶中结构保守的约450个残基的催化结构域,通常跟着由30至80个残基组成的接头区域,接头区域连接至约100个残基的淀粉结合结构域。具有所有三个完整区域的里氏木霉葡糖淀粉酶的结构在本文中进行了測定,至I. 8埃分辨率(见表9和实施例9)。利用该坐标(见表9),将该结构与以前測定的泡盛曲霉菌林XlOO的葡糖淀粉酶的催化结构域的坐标(Aleshin,A. E. , Hoffman, C. , Firsov, L. M.和 Honzatko, R. B. Refined crystal structures of glucoamylase from Aspergillus awamori var. X100. J. Mol. Biol. 238 :575-591 (1994))进行了比对。该泡盛曲霉晶体结构仅包括催化结构域。如图6-7中所见,这些催化结构域的结构非常紧密地重叠,基于该结构叠合,可以鉴定等价残基。所有的葡糖淀粉酶被认为都具有图6-7中描述的基本结构。图6是从侧面观察的、SEQ ID NO 2的里氏木霉葡糖淀粉酶(黒色)和泡盛曲霉葡糖淀粉酶(灰色)的三维结构的比较。在此视图中,可见催化结构域、接头区域和淀粉结合结构域之间的关系。图7是从顶部观察的、SEQ ID NO 2的里氏木霉葡糖淀粉酶(黒色)和泡盛曲霉葡糖淀粉酶(灰色)的三维结构的比较。图中所示的葡糖淀粉酶和实际上目前已知的所有葡糖淀粉酶都具有该结构同源性。该结构的保守性与所有葡糖淀粉酶的保守的活性以及保守的作用机制相关。考虑到该高同源性,由木霉葡糖淀粉酶的位点特异性变异导致的、引起功能改变的变化,在其它葡糖淀粉酶中也将具有相似的结构以及由此功能后果。因此,可以将有关何种变体导致期望有益结果的教导适用于其它的葡糖淀粉酶。利用表9中的坐标,还产生了淀粉结合结构域(SBD)的晶体结构。将TrGA的SBD与黑曲霉(A.niger)的SBD进行比对。如图8中所示,黑曲霉和TrGA SBD的结构非常紧密地重叠。据信,尽管所有的淀粉结合结构域都具有至少部分图8中描述的基本结构,但ー些SBD在结构上比其它SBD更相似。例如,在CAZY数据库(cazy.org)中,TrGA SBD可以被分类在碳水化合物结合模块20家族中。CAZY数据库描述了降解、修饰或产生糖苷键的酶的结构相关催化模块和碳水化合物结合模块(或功能结构域)的家族。考虑到高度的结构同源性,导致功能改变的TrGA SBD的位点特异性变异也将在具有与TrGA SBD类似结构的SBD的其它葡糖淀粉酶,特别是那些分类在碳水化合物结合模块20家族中的葡糖淀粉酶中,具有相似的结构和由此功能的后果。因此,可以将有关何种变异会导致所需要的有益结果的教导适用于具有结构相似性的其它SBD。因此,本文中讨论的氨基酸位置号指分配给图I中显示的成熟里氏木霉葡糖淀粉酶序列(SEQ ID N02)的位置号。然而,本发明不限于木霉属葡糖淀粉酶的变体,而是扩展至在等价于里氏木霉葡糖淀粉酶(SEQ ID NO :2)中的具体鉴定残基的位置包含氨基酸残基的葡糖淀粉酶。在本发明ー些实施方案中,亲本葡糖淀粉酶是篮状菌属GA,在篮状菌属葡糖淀粉酶(见例如,SEQ ID NO 12)中等价的氨基酸残基位置上进行取代,如本文所述的取代。在其它实施方案中,亲本葡糖淀粉酶包括SEQ ID NOs :5-9(见图5A和5B)。在其它实施方案中,亲本葡糖淀粉酶是青霉属葡糖淀粉酶,例如产黄青霉(见例如,SEQ ID N0:13)。“结构同一性”决定氨基酸残基是否是等价的。结构同一性是当比对两个结构(三维和氨基酸结构)时ー对一的拓扑学等价性。如果ー个葡糖淀粉酶的ー个残基(氨基酸)位置与里氏木霉葡糖淀粉酶的残基是等价的,则其与里氏木霉葡糖淀粉酶中的特定残基或该残基的部分是同源的(即,在一级或三级结构中在位置上相应)或类似的(具有相同或相似的化学結合、反应或相互作用的功能能力)。为了建立一级结构的同一性,可以将葡糖淀粉酶的氨基酸序列与里氏木霉葡糖淀粉酶的ー级序列,特别是与序列已知的葡糖淀粉酶中已知不变的残基集合,进行直接比较。例如,本文中的图5A和5B显示了葡糖淀粉酶之间的保守残基。图和5E显示了来自各种葡糖淀粉酶的淀粉结合结构域的比对。在比对保守残基、允许进行必要的插入和缺失以維持比对(即,通过主观的缺失和插入而避免去除保守残基)后,定义与里氏木霉葡糖淀粉酶的ー级序列中特定氨基酸等价的残基。典型地,保守残基的比对应该保存100%的此类残 基。然而大于约75%或少至约50%的保守残基的比对也足以定义等价残基。此外,可以将结构同一性与序列同一性结合起来用于鉴定等价残基。例如,在图5A和5B中,对来自6个生物体的葡糖淀粉酶的催化结构域进行了比对,以提供氨基酸序列之间的最大同源性。这些序列的比较显示,有多个包含在每条序列中的保守残基(用星号指示)。因此,这些保守残基可用于定义其它葡糖淀粉酶(例如来自黑曲霉的葡糖淀粉酶)中、与里氏木霉葡糖淀粉酶对应的等价氨基酸残基。类似地,图和5E显示了来自7个生物体的葡糖淀粉酶的淀粉结合结构域的比对,以鉴定等价残基。结构同一性涉及两个结构之间等价残基的鉴别。对于三级结构已经通过X射线晶体学进行了确定的酶,可以通过确定三级结构水平上的同源性(结构同一性)来定义“等价残基”。等价残基定义为,在比对后,相对于里氏木霉葡糖淀粉酶的特定氨基酸残基的两个或更多个主链原子的原子坐标(N对N,CA对CA,C对C和0对0),在0. 13nm以内,可选地在0. Inm以内的残基。当将最佳模型进行定向和定位,以使所讨论的葡糖淀粉酶与里氏木霉葡糖淀粉酶的非氢蛋白质原子的原子坐标获得最大重叠之后,实现比对。最佳模型是,对可获得的最高分辨率下的实验衍射数据产生最低R因子的晶体学模型。R 因子将在功能上与里氏木霉葡糖淀粉酶的特定残基类似的等价残基定义为可以采取如下构象的酶的氨基酸残基,所述构象使得这些氨基酸残基可以以确定的且归属于里氏木霉葡糖淀粉酶的特定残基的方式,改变、修饰或贡献于蛋白质结构、底物结合或催化。此外,它们是占据了类似位置的酶(已经通过X射线晶体学获得了三级结构的酶)的残基,所述类似的程度使得虽然给定残基的主链原子可能未满足以占据同源位置为基础的等价标准,但是该残基的至少两个侧链原子的原子坐标位于里氏木霉葡糖淀粉酶的对应侧链原子的
0.13nm内。表9中列出了里氏木霉葡糖淀粉酶的三维结构的坐标,其可如上所述用于确定三级结构水平上的等价残基。一些鉴定用于取代的残基是保守残基,而另ー些则不是。在残基不保守的情况下,一个或多个氨基酸的取代被限于产生具有与天然发现的序列不一致的氨基酸序列的变体的取代。在保守残基的情况下,取代不应导致天然存在的序列。4.葡糖淀粉酶变体根据本发明的变体包括在亲本葡糖淀粉酶的氨基酸序列中的至少ー个取代、缺失或插入,其使变体在序列上与亲本葡糖淀粉酶不同。在一些实施方案中,本发明的变体具有TrGA(SEQ ID NO :2),亲本葡糖淀粉酶(与TrGA(SEQ ID NO :2)具有至少80%序列同一性),的至少约20 %、约40 %、约50 %、约60 %、约70 %、约80 %、约85 %、约90 %、约95 %、约97 %或约100 %的葡糖淀粉酶活性。在一些实施方案中,根据本发明的变体在亲本TrGA (SEQID N02)的至少ー个氨基酸位置上,或者在另ー亲本葡糖淀粉酶序列中的等价位置上包含取代、缺失或插入,所述另ー亲本葡糖淀粉酶与TrGA序列(SEQ ID NO :2)具有至少约80%、约85%、约90%、约95%、约97%、约98%或约99%的序列同一性。在其它实施方案中,根据本发明的变体在亲本TrGA的片段的至少ー个氨基酸位置上包含取代、缺失或插入,其中所述片段包含TrGA序列的催化结构域(SEQ ID N0:3),或在亲本葡糖淀粉酶的含催化结构域的片段中的等价位置上包含取代、缺失或插入,其中所述亲本葡糖淀粉酶的含催化结构域片段与SEQ ID NO :3,5,6,7,8或9的含催化结构域片段具有至少约80%、约85%、约90%、约95%、约97%、约98%或约99%的序列同一性。在一些实施方案中,片段包含TrGA催化结构域(SEQ ID NO 3)的至少约400、约425、约450或约500个氨基酸残基。在其它实施方案中,根据本发明的变体在亲本TrGA的片段的至少ー个氨基酸位置上包含取代、缺失或插入,其中所述片段包含TrGA序列的淀粉结合结构域(SEQ ID NO11),或在亲本葡糖淀粉酶的含淀粉结合结构域的片段中的等价位置上包含取代、缺失或插入,其中所述亲本葡糖淀粉酶的含淀粉结合结构域的片段与SEQ ID NO =11,385,386,387,388,389和390的含淀粉结合结构域的片段具有至少约80%、约85%、约90%、约95%、约97 %、约98 %或约99 %的序列同一性。在一些实施方案中,片段包含TrGA淀粉结合结构域(SEQ ID NO 11)的至少约40、约50、约60、约70、约80、约90、约100或约109个氨基酸残基。在一些实施方案中,当亲本葡糖淀粉酶包括催化结构域、接头区域和淀粉结合结构域时,变体在包含部分接头区域的片段的至少ー个氨基酸位置上包含取代、缺失或插入。在一些实施方案中,变体在TrGA序列(SEQ ID NO 2)的片段的氨基酸序列中包含取代、缺失或插入。就氨基酸取代而言,结构同一性意指,取代发生在同源葡糖淀粉酶或亲本葡糖淀粉酶中的等价氨基酸位置上。术语等价位置意指两个亲本序列共有的位置,这是基于所讨论的亲本葡糖淀粉酶的氨基酸序列以及所讨论的亲本葡糖淀粉酶的三维结构与TrGA參照萄糖淀粉酶的氨基酸序列和三维序列的比对得到的。例如,參考图5A,TrGA(SEQ ID NO 2或3)中的第24位是D24,黑曲霉(SEQ ID NO 6)的等价位置是位置D25,米曲霉(SEQ IDNO 7)的等价位置是位置D26。三维序列的示例性比对见图6和7。在一些实施方案中,葡糖淀粉酶变体将包括在亲本的氨基酸序列中的至少ー个取代。在其它实施方案中,变体可以具有ー个以上的取代。例如,与对应的亲本葡糖淀粉酶相比较,变体可以具有1,2,3,4,5,6,7,8,9,10,15,20或25个氨基酸取代、缺失或插入。
在一些实施方案中,葡糖淀粉酶变体包括取代、缺失或插入,典型地是在对应于图5A,5B,ro和5E所示非保守氨基酸区域的位置(例如,对应于图5A,5B,ro和5E中没有用 标示的那些位置的氨基酸位置)中的至少ー个氨基酸位置上的取代。尽管变体可以在成熟蛋白质序列(SEQ ID NO 2)的任何位置中具有取代,但在ー些实施方案中,葡糖淀粉酶变体在SEQ ID NO :2所示氨基酸序列中的下列位置、或在亲本葡糖淀粉酶中的等价位置中包含一个或多个取代10,14,15,23,42,43,44,59,60,61,65,67,68,72,73,97,98,99,102,110,113,114,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,294,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,417,418,430,431,433,436,442,444,448,451,493,494,495,502,503,508,511,518,519,520,527,531,535,536,537,539,563,或 577。在一些实施方案中,亲本葡糖淀粉酶与SEQ ID NO: 2具有至少约50 %、约60 %、约 70%、约80%、约90%、约95%、约96%、约97%、约98%或约99%的序列同一性。在其它实施方案中,亲本葡糖淀粉酶是木霉属葡糖淀粉酶同源物。在一些实施方案中,变体具有改变的特性。在一些实施方案中,亲本葡糖淀粉酶与SEQ ID NO :2的葡糖淀粉酶具有结构同一性。在一些实施方案中,葡糖淀粉酶变体在SEQ ID NO :2所示氨基酸序列中的下列位置、或在亲本葡糖淀粉酶(例如,木霉属葡糖淀粉酶同源物)中的等价位置,包含一个或多个取代T10, L14, N15, P23, T42, 143,D44, P45, D46, F59, K60, N61,T67,E68, A72, G73, S97,L98, A99, S102, K108, E110, L113, K114, R122, Q124, R125, 1133,K140, N144, N145, Y147,S152, N153, N164, F175, N182, A204, T205, S214, V216, Q219, W228, V229, S230, S231,D236,1239,N240, T241,N242,G244, N263, L264, G265, A268, G269, D276, V284, S291,G294,P300,A301, A303, Y310, A311,D313,Y316, V338, T342, S344, T346, A349, V359, G361, A364, T375,N379, S382, S390, E391, A393, K394, R408, S410, S415, L417, H418, T430, A431, R433, 1436,A442, N443, S444, T448, S451, T493, P494, T495, H502, E503, Q508, Q511,N518,A519, A520,T527, V531, A535, V536, N537, A539, N563,和 N577。在一些实施方案中,与亲本葡糖淀粉酶相比较,变体具有改变的特性。在其它实施方案中,葡糖淀粉酶亲本的变体在SEQ ID NO :2所示的氨基酸序列中的下列位置包含至少一个下列取代T10S,T42V, I43Q/R, D44R/C, N61I,T67M, E68C/M, A72Y, G73F/W, S97N, S102A/M/R, K114M/Q, I133T/V, N145I, N153A/D/E/M/S/V, T205Q, Q219S, W228A/F/H/M/V, V229I/L, S230C/F/G/L/N/Q/R, S231L/V, D236R, I239V/Y, N263P, L264D/K, A268C/D/G/K, S291A/F/H/M/T, G294C, A301P/R, V338I/N/Q, T342V, S344M/P/Q/R/V, G361D/E/F/1/L/M/P/S/W/Y,A364D/E/F/G/K/L/M/R/S/T/V/W, T375N, K394S, L417K/R/V, T430A/K, A431I/L/Q, R433C/E/G/L/N/S/V/Y, I436H, T451K, T495K/M/S, E503A/C/V, Q508R, Q511H, A519I/K/R/Y, A520C/L/P,V531L, A535K/N/P/R, V536M, A539E/R/S, N563C/E/I/K/K/Q/T/V 或 N577K/P/R,或在亲本葡糖淀粉酶中的等价位置中包含替代。本发明的葡糖淀粉酶变体也可以包括嵌合的或杂合的葡糖淀粉酶,具有,例如来自ー种葡糖淀粉酶的淀粉结合结构域(SBD)和来自另ー种葡糖淀粉酶的催化结构域和接头。例如,杂合葡糖淀粉酶可以通过将来自AnGA (SEQ ID NO 6)的SBD与来自TrGA (SEQ IDNO 2)的SBD进行交換,以获得具有AnGA的SBD和TrGA的催化结构域和接头的杂合体。可选地,可以将来自AnGA的SBD和接头,与TrGA的SBD和接头进行交換。在ー些方面,与亲本葡糖淀粉酶相比较,变体葡糖淀粉酶显示出改变的热稳定性。在ー些方面,改变的热稳定性可以是与亲本葡糖淀粉酶相比,増加的热稳定性。在一些实施方案中,改变的特性是与亲本葡糖淀粉酶相比,改变的比活。在一些实施方案中,改变的比活可以是与亲本葡糖淀粉酶相比,増加的比活。在一些实施方案中,改变的特性是与亲本葡糖淀粉酶相比,在较低的温度下增加的热稳定性。在一些实施方案中,改变的特性是与亲本葡糖淀粉酶相比,増加的比活和增加的热稳定性。—些具有多重取代的变体,即组合变体,可以包括在SEQ ID NO :2的位置或亲本葡糖淀粉酶,特别是木霉属葡糖淀粉酶同源物,的等价位置上的取代I43Q/D44C/L417V/E503A/Q511H/A539R ; I43Q/L417V/E503A/Q511H/A539R ;I43Q/D44C/N611/L417V/E503A/Q511H/A539R ;I43Q/N61I/L417V/E503A/Q511H/A539R ;I43R/L417V/E503A/Q511H/A539R ;I43R/N61I/L417V/E503A/Q511H/A539R ;I43R/L417R/E503A/A539R ;I43R/N61I/L417R/E503A/Q511H/A539R ;G73F/T430A/Q511H ;I43R/G73F/T430A ;G73F/T430A/E503V/Q5IlH ;
D44C/G73F/N563K ;D44C/G73F/E503V/Q5IlH ;D44C/G73F/N563K ;D44C/G73F/L417R/N563K ;D44C/G73F/N563K ;I43R/T430A ;I43Q/T430A ;I43Q/T430A/Q511H ;D44C/L417R/N563K ;L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;L417V/T430A/A431Q/Q511H/A535R/A539R/N563I ;L417V/T430A/Q511H/A535R/N563I ;L417V/T430A/Q511H/A539R/N563I ;G294C/L417R/A431L ;G294C/L417V/A431Q ;G294C/L417V/A431L/Q511H ;G294C/L417R/A431Q/Q511H ;L417R/A431L/Q511H ;
L417V/A431Q/Q511H ;I43Q/T430A/Q511H/N61I ;I43Q/T430A/Q511H/L417V ;I43Q/T430A/Q511H/A431L ;I43Q/T430A/Q511H/E503A ;I43Q/T430A/Q511H/A539R ;I43Q/T430A/Q511H/N61I/A539R ;I43Q/T430A/Q511H/L417V/A539R ;I43Q/T430A/Q511H/A431L/A539R ;I43Q/T430A/Q511H/A431L/E503A ;I43Q/T430A/Q511H/N61I/A539R/A431L ;I43Q/T430A/Q511H/L417V/A539R/A431L ;I43Q/Q511H/N61I ;I43Q/Q511H/L417V ;I43Q/Q511H/A431L ;I43Q/Q511H/A539R ;I43Q/Q511H/A539R/N61I ;I43Q/Q511H/A539R/E503A ;I43Q/Q511H/A539R/T430M ;I43Q/Q511H/A539R/T430M/N611 ;I43Q/Q511H/A539R/T430M/N61I/L417V ;I43R/T430A/E503V/A535R/N563K ;D44R/E503A/Q511H/N563I ;E503A/N563I ;I43R/T430A/E503A/Q511H/N563K ;D44R/T430A/Q511H/A535R ;L417V/A431L/A539R ;L417V/A431L/A539R/I43Q ;L417V/A431L/A539R/N611 ;L417V/A431L/A539R/A535R ;L417V/A431L/A539R/I43Q/N61I ;L417V/A431L/A539R/N61I/A535R ;L417V/A431L/A539R/A535R/I43Q ;L417V/A431L/A539R/I43Q/N61I/A535R ;L417V/A431L/A539R/I43Q/N61I/A535R/T430A ;L417V/T430A/A431L/Q511H/A535R/A539R/N563I/I43Q ;L417V/T430A/A431L/Q511H/A535R/A539R/N563I/N61I ;L417V/T430A/A431L/Q511H/A535R/A539R/N563I/I43Q/N61I ;L417V/A431L/A539R/I43R ;
L417V/A431L/A539R/I43R/N61I ;L417V/A431L/A539R/I43R/N61I/A535R/T430A ;L417R/A431L/A539R ;L417G/A431L/A539R ;G73F/E503V/N563K/L417R/A539R ;G73F/E503V/N563K/I43R/L417R/A539R ;和G73F/E503V/N563K/I43R/Q511H。已经将多个亲本葡糖淀粉酶与TrGA的氨基酸序列进行了比对。图5包括下列亲本葡糖淀粉酶的催化结构域泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO :5);黑曲 霉(Aspergillus niger) (AnGA) (SEQ ID NO :6);米曲霉(Aspergillus oryzae) (AoGA) (SEQID NO 7);灰腐质霉(Humicola grisea) (HgGA) (SEQ ID NO :8);和酒色肉座菌(Hypocreavinosa) (HvGA) (SEQ ID NO :9)。下表I中显示了催化结构域的百分比(% )同一1注。表I、各种真菌葡糖淀粉酶之间的序列同源性
权利要求
1.包含氨基酸取代的葡糖淀粉酶变体,所述氨基酸取代对应于SEQID NO 2的位置(a)61,417,431和 539 ;(b)43,417,431,535和 539 ;或(c)73,503和 563, 或者对应于亲本葡糖淀粉酶的等价位置,其中,葡糖淀粉酶变体与SEQ ID NO :1或2、或该亲本葡糖淀粉酶有至少80%序列同一性。
2.权利要求I的葡糖淀粉酶变体,其中氨基酸取代是(a)N61I,L417G/R/V, A431L/Q 和 A539R ;(b)I43Q/R,L417G/R/V, A431L/Q,A535R和 A539R ;或(c)G73F,E503V 和 N563K。
3.权利要求I或权利要求2的葡糖淀粉酶变体,所述变体在SEQID NO 2的相关位置或在亲本葡糖淀粉酶中的等价位置上包含以下取代集合之一N611/L417V/A431L/A539R ;I43Q/N611/L417V/A431L/A539R ;N61I/L417V/A431L/A535R/A539RI43Q/L417V/A431L/A535R/A539R ;I43Q/N61I/L417V/A431L/A535R/A539R ;I43Q/N61I/L417V/T430A/A431L/A535R/A539R ;I43Q/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;N61I/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;I43Q/N61I/L417V/T430A/A431L/Q511H/A535R/A539R/N563I ;I43R/N61I/L417V/A431L/A539R ;I43R/N61I/L417V/T430A/A431L/A535R/A539R ;G73F/L417R/E503V/A539R/N563K ;I43R/G73F/L417R/E503V/A539R/N563K ;和I43R/G73F/E503V/Q511H/N563K。
4.权利要求I至3之任一的葡糖淀粉酶变体,其中亲本葡糖淀粉酶或葡糖淀粉酶变体具有与SEQ ID ΝΟ:1,2,3,5,6,7,8或9有至少80%序列同一性的催化结构域。
5.权利要求I至4之任一的葡糖淀粉酶变体,其中亲本葡糖淀粉酶或葡糖淀粉酶变体具有与SEQ ID NO : 1,2,11,385,386,387,388,389或390有至少95%的序列同一性的淀粉结合结构域。
6.权利要求I至5之任一的葡糖淀粉酶变体,其中葡糖淀粉酶变体与SEQID ΝΟ:1或.2具有至少85%的序列同一性。
7.权利要求6的葡糖淀粉酶变体,其中葡糖淀粉酶变体与SEQID NO :1或2具有至少.90%的序列同一性。
8.权利要求7的葡糖淀粉酶变体,其中葡糖淀粉酶变体与SEQID NO :1或2具有至少.95%的序列同一性。
9.权利要求8的葡糖淀粉酶变体,其中葡糖淀粉酶变体与SEQID NO :1或2具有至少.99. 5%的序列同一性。
10.权利要求I至3之任一的葡糖淀粉酶变体,其中亲本葡糖淀粉酶包含SEQID NO:I或2。
11.权利要求10的葡糖淀粉酶变体,其中亲本葡糖淀粉酶由SEQID NO :1或2组成。
12.上述权利要求之任一的葡糖淀粉酶变体,其中葡糖淀粉酶变体包含一个或多个另外的氨基酸取代,对应于 SEQ ID NO 2 的 43,44,61,73,294,430,503,511,535 或 563 位,或亲本葡糖淀粉酶中的等价位置。
13.权利要求12的葡糖淀粉酶变体,其中氨基酸取代是SEQID NO:2的I43Q/R,D44C/R, N61I, G73F, G294C, T430A/M, E503A/V, Q511H, A535R 或 N563I/K,或亲本葡糖淀粉酶中的等价位置。
14.权利要求12的葡糖淀粉酶变体,其中葡糖淀粉酶变体包含一个或多个另外的氨基酸取代,对应于 SEQ ID NO 2 的 10,14,15,23,42,59,60,65,67,68,72,97,98,99,102,110,113,114,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,418,433,436,442,444,448,451,493,494,495,502,508,518,519,520,527,531,536,537 或 577 位,或亲本葡糖淀粉酶中的等价位置。
15.权利要求14的葡糖淀粉酶变体,其中氨基酸取代是SEQID NO 2的T10S,T42V,T67M, E68C/M, A72Y, S97N, S102A/M/R, K114M/Q, I133T/V, N145I, N153A/D/E/M/S/V, T205Q,Q219S, W228A/F/H/M/V, V229I/L, S230C/F/G/L/N/Q/R, S231L/V, D236R, I239V/Y, N263P,L264D/K, A268C/D/G/K, S291A/F/H/M/T, A301P/R, V338I/N/Q, T342V, S344M/P/Q/R/V,G361D/E/F/I/L/M/P/S/ff/Y, A364D/E/F/G/K/L/M/R/S/T/V/W, T375N, K394S, R433C/E/G/L/N/S/V/Y, I436H, T451K, T495K/M/S, Q508R, A519I/K/R/Y, A520C/L/P, V531L, V536M,或N577K/P/R,或亲本葡糖淀粉酶中的等价位置。
16.上述权利要求之任一的葡糖淀粉酶变体,其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体显示出增加的热稳定性。
17.权利要求16的葡糖淀粉酶变体,其中葡糖淀粉酶变体包含一个或多个另外的氨基酸取代,对应于 SEQ ID NO 2 的位置10,42,59,61,68,72,73,97,98,99,102,114,133,140,144,152,153,182,204,205,214,216,228,229,230,231,236,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,430,433,436,442,444,448,451,493,495,503,508,511,518,519,520,527,531,535,536,537,563或577位,或亲本葡糖淀粉酶中的等价位置。
18.权利要求17的葡糖淀粉酶变体,其中氨基酸取代是SEQ ID NO 2 的 T10S, T42V, E68C/M, G73F/W, K114M/Q, I133V, N153A/E/M/S/V,W228V, V229I/L, S230Q, S231V, D236R, L264D/K, A268D, S291A/E/H/M/T, A301P/R, V338I/N/Q, S344M/P/Q/R/V, G361D/E/F/1 /L/M/P/S/ff/Y, A364D/E/F/G/K/L/M/R/S/T/V/W, T375N,R433C/E/G/L, R433N/S/V, I436H, T495K/S, E503A/C/V, Q508R, Q511H, A519K/R/Y, V531L,A535K/N/P/R, N563C/E/I/K/L/Q/T/V,或N577K/P/R,或亲本葡糖淀粉酶中的等价位置。
19.权利要求I至15之任一的葡糖淀粉酶变体,其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体显示出增加的比活。
20.权利要求19的葡糖淀粉酶变体,其中葡糖淀粉酶变体包含一个或多个另外的氨基酸取代,对应于 SEQ ID NO 2 的 10,14,15,23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144,145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,375,379,382,390,391,393,394,410,418,430,433,442,444,448,451,493,494,495,502,503,508,511,518,519,520,531,535 或 536 位,或亲本葡糖淀粉酶中的等价位置。
21.权利要求19的葡糖淀粉酶变体,其中氨基酸取代对应于SEQID NO:2的位置N61I,T67M, A72Y, S97N, S102A/M/R, I133T, N145I, N153D, T205Q, Q219S, W228A/F/H/M, S230C/F/G/L/N/Q/R, S231L, I239V/Y, N263P, A268C/G/K, S291A, T342V, K394S, T430K, R433Y, T451K,T495M,A519I,A520C/L/P, A535R或V536M,或亲本葡糖淀粉酶中的等价位置。
22.权利要求I至15之任一的葡糖淀粉酶变体,其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体显示出增加的热稳定性和增加的比活。
23.权利要求22的葡糖淀粉酶变体,其中葡糖淀粉酶变体包含一个或多个另外的氨基酸取代,对应于 SEQ ID NO 2 的 10,15,59,61,68,72,73,97,99,102,140,153,182,204,205,214,228,229,230,231,236,241,242,264,265,268,276,284,291,300,301,303,311,338,344,346,349,359,361,364,375,379,382,391,393,394,410,430,433,444,448,451,495,503,511,520,531,535或536位,或亲本葡糖淀粉酶中的等价位置。
24.权利要求22的葡糖淀粉酶变体,其中氨基酸取代是SEQID NO :2的W228F/H/M,S230C/F/G/N/Q/R, S231L, A268C/D/G/K, S291A, R433Y, S451K, E503C, Q511H, A520C/L/P,或A535N/P/R,或亲本葡糖淀粉酶中的等价位置。
25.于SEQID NO :2的位置或亲本葡糖淀粉酶中的等价位置包含以下取代集合之一的葡糖淀粉酶变体L417V/A431L/A539R ;I43Q/L417V/A431L/A539R ;L417V/A431L/A535R/A539RI43R/L417V/A431L/A539R ;L417R/A431L/A539R ;或L417G/A431L/A539R ; 其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体不具有任何其它取代,并且 其中亲本葡糖淀粉酶具有与SEQ ID NO:l,2,3,5,6,7,8或9有至少80%的序列同一性的催化结构域。
26.权利要求25的葡糖淀粉酶变体,其中亲本葡糖淀粉酶具有与SEQID NO:l,2,ll,385,386,387,388,389或390有至少95%的序列同一性的淀粉结合结构域。
27.权利要求25的葡糖淀粉酶变体,其中亲本葡糖淀粉酶与SEQID NO :1或2具有至少80%的序列同一性。
28.权利要求25至27之任一的葡糖淀粉酶变体,其中亲本葡糖淀粉酶包含SEQID NO:I或2。
29.权利要求28的葡糖淀粉酶变体,其中亲本葡糖淀粉酶由SEQID NO :1或2组成。
30.权利要求25至29之任一的葡糖淀粉酶变体,其中与亲本葡糖淀粉酶相比较,葡糖淀粉酶变体显示出增加的热稳定性和/或增加的比活。
31.上述权利要求之任一的葡糖淀粉酶变体,其中亲本葡糖淀粉酶选自获自木霉属物种、曲霉属物种、腐质霉属物种、青霉属物种、篮状菌属物种、或裂殖酵母属物种的葡糖淀粉酶。
32.权利要求31的葡糖淀粉酶变体,其中亲本葡糖淀粉酶获自木霉属物种或曲霉属物种。
33.编码上述权利要求之任一的变体的多核苷酸。
34.包含权利要求33的多核苷酸的载体。
35.包含权利要求34的载体的宿主细胞。
36.在宿主细胞中生产葡糖淀粉酶变体的方法,所述方法包括在合适葡糖淀粉酶变体表达和生产的条件下培养权利要求35的宿主细胞,以及产生葡糖淀粉酶变体。
37.根据权利要求36的方法,其还包括从培养物回收葡糖淀粉酶变体。
38.包含权利要求I至32之任一的葡糖淀粉酶变体的酶组合物。
39.转化淀粉的方法,所述方法包括使用权利要求38的酶组合物水解淀粉。
40.发酵醇的方法,所述方法包括使用权利要求38的酶组合物发酵醇。
41.生产高葡萄糖糖浆的方法,所述方法包括使用权利要求38的酶组合物生产高葡萄糖糖浆。
全文摘要
本发明提供显示出改变特性,例如改良的热稳定性和/或比活,的变体葡糖淀粉酶。还公开编码该变体的DNA序列、整合了该DNA序列的载体和宿主细胞、酶组合物、以及在各种应用中使用变体的方法。
文档编号C12P19/14GK102712915SQ201080046710
公开日2012年10月3日 申请日期2010年8月18日 优先权日2009年8月19日
发明者C·弗勒门, M·S·舍费尔斯, R·R·博特, W·埃赫勒 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1