具有改变的性质的葡糖淀粉酶变体的制作方法

文档序号:570858阅读:346来源:国知局
专利名称:具有改变的性质的葡糖淀粉酶变体的制作方法
技术领域
本发明涉及具有改变的性质(例如,改善的热稳定性和/或比活性)的亲本葡糖 淀粉酶的变体。具体地,本发明提供包含变体葡糖淀粉酶的组合物,包括淀粉水解组合物, 动物饲料组合物和清洁组合物。本发明也涉及编码所述变体的DNA构建体和在宿主细胞中 生产所述葡糖淀粉酶变体的方法。
背景技术
葡糖淀粉酶(葡聚糖1,4-α-葡糖水解酶,EC3.2. 1.3)是淀粉水解外切糖酶,其 催化从淀粉或相关寡糖和多糖分子的非还原性末端去除连续的葡萄糖单元。葡糖淀粉酶可 以水解线性的和分枝的糖苷键连接的淀粉(例如,直链淀粉和支链淀粉)。葡糖淀粉酶可以通过多种株系的细菌,真菌,酵母和植物生产。尤其有趣和商业 上重要的是,葡糖淀粉酶是细胞外产生的真菌酶,例如来自曲霉属(Svensson等,(1983) Carlsberg Res.Commun. 48 :529_544 ;Boel 等·,(1984)EMBO J. 3 1097-1102 ;Hayashida 等·,(1989)Agric BiolChem. 53 923~929 ;USP 5024,941 ;USP4,794,175 和 W088/09795); 踝节菌属(USP4, 247,637 ;USP6, 255,084 和 USP6, 620,924);根霉属(Ashikari 等·, (1986)Agric. Biol. Chem. 50 957-964 ;Ashikari 等·, (1989)App. Microbiol.禾口 Biotech. 32 129-133 和 USP4, 863,864);腐质霉属(W005/052148 和 USP4, 618579)和毛霉 菌(Houghton-Larsen 等·,(2003) Appl. Microbiol. Biotechnol. 62 :210_217)的菌株。编 码这些酶的很多基因已经在酵母,真菌和/或细菌细胞内被克隆和表达。葡糖淀粉酶是商业上非常重要的酶,并已经应用于需要淀粉水解的各种应用(例 如,从淀粉产生葡萄糖和其它单糖)。葡糖淀粉酶用于产生高果糖浆甜味剂,其构成美国超 过50%的甜味剂市场。一般来说,葡糖淀粉酶可以,并且通常与α-淀粉酶一起用于淀粉水 解过程,以水解淀粉为糊精,然后水解为葡萄糖。接着葡萄糖可以由其它酶(例如,葡萄糖 异构酶)转化为果糖;结晶化;或用于发酵以产生多种终产物(例如,乙醇,柠檬酸,乳酸, 琥珀酸,抗坏血酸中间体,谷氨酸,甘油和1,3_丙二醇)。通过在淀粉和/或包含纤维素材 料的发酵中使用葡糖淀粉酶产生的乙醇可以用做燃料或用于酒精消费。尽管葡糖淀粉酶已经成功用于商业用途多年,对具有改变性质的新葡糖淀粉酶的 需要仍然存在。发明概述在有些方面,本发明涉及分离的葡糖淀粉酶变体,其在对应于SEQ IDNO 2或SEQ ID NO :3 残基位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108, 110,113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216,219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284, 291,300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 的位置上 或亲本葡糖淀粉酶的等同位置上具有一个或多个氨基酸取代。在一些实施方案中,亲本葡糖淀粉酶包含SEQ ID ΝΟ:1,4,5,6,7,8或9的序列。在一些实施方案中,亲本葡糖淀粉酶 包含SEQ ID NO :2。在一些实施方案中,亲本葡糖淀粉酶获自木霉菌,曲霉菌,腐质霉菌,青 霉菌,踝节菌,或裂殖酵母菌。在另外的实施方案中,亲本的等同位置通过序列同一性确定。 在其它的实施方案中,亲本葡糖淀粉酶具有与SEQ IDNO :2至少80%的序列同一性。在另外 的实施方案中,亲本的等同位置通过与SEQ ID NO :2或3的结构同一性确定。在此方面的其 它实施方案中,变体在选自 SEQ ID NO :2 或 SEQ ID NO :3 的 T10D/F/G/K/L/M/P/R/S ;L14E/ H ;N15D/N ;P23A/G ;F59A/G ;K60F/H ;N61D/I/L/Q/V/W ;R65A/C/G/I/K/M/S/V/Y ;T67C/I/K/ M/T ;E68I/M/W ;A72E/G/L/M/Q/R/W/Y ;G73C/L/W ;S97F/M/N/P/R/S/V/W/Y ;L98H/M ;A99C/ L/M/N/P ;S102A/C/1/L/M/N/R/V/W/Y;E110Q/S/W ;L113E/N ;Kl 14C/D/E/L/M/Q/S/T/V ; I133K/R/S/T ;K140A/E/F/H/K/L/M/N/Q/R/S/V/W/Y ;N144C/D/E/I/K ;N145A/C/E/I/K/L/M/ Q/R/V/W/Y;Y147A/M/R ;S152H/M ;N153C/D/K/L/W/Y ;N164A/G ;N182C/E/K/P/R ;A204C/D/ G/I/M/Q/T ; T205A/D/H/1/Κ/Μ/Ν/Ρ/Q/S/V/ff/Y ;S214P/T ;V216C/G/H/K/N/Y ; Q219D/G/H/N/ P/S ;W228A/F/G/H/I/L/M/Q/S/T/V/Y ;V229E/I/M/N/Q ;S230C/D/E/F/G/H/I/K/L/N/P/Q/R/ T/V/Y ; S231C/D/F/L/M/N/Q/R/S/V/Y ;D236F/G/L/M/N/P/S/T/V ; I239M/Q/S/V/W/Y ;T241C/ E/H/L/M/P/S/T/V ;N242C/F/H/M/T/V/W ;N263H/K/P ;L264A/C/E/F/L/S ;G265E/G/H/I/K/R/ T ;A268C/D/E/F/G/I/K/L/P/R/T/W ;G269E ;D276S ;V284R/T/V/Y/A/E/F/H/K/N/P/W ;P300K/ R ;A301E/K/L/P/S/W ;A303C/D/F/H/I/K/L/N/R/T/V/W/Y;A311N/P/Q/S/Y ;V338P/Q/S/ Y;T342N/V ;S344A/T ;T346G/H/M/N/P/Q/Y ;A349L/I/K/M/N/Q/R/W ;G361H/L/R ;A364M/W ; N379A/C/D/G/I/M/P/S ; S382A/N/P/V/W ; S390A/Y ;E391A/E/1/K/L/M/Q/R/V/W/Y ;A393E/G/ H/1/K/L/M/N/Q/R/S/T/V/ff/Y ;K394A/H/K/L/M/Q/R/S/T/V/W ; S410E/H/N ; L417A/D/E/F/G/ I/K/Q/R/S/T/V/ff/Υ ;H418E/M ;T430A/E/F/G/H/1/K/M/N/Q/R/V ;A431C/E/H/I/L/M/Q/R/S/ ff/Υ ;R433A/C/E/F/G/K/L/M/N/S/V/W/Y ; I436E/F/G/H/K/P/R/S/T/V/Y ;S444M/N/P/Q/R/T/ V/W ;T448F/G/I/P/Q/T/V ;和S451E/H/K/L/Q/T的位置上或亲本葡糖淀粉酶的等同位置上 具有取代。 在另一方面,本发明涉及分离的葡糖淀粉酶变体,其在对应于SEQ IDNO 2或SEQ ID NO 3 的位置 10,14,15,23,42,45,46,59,60,61,67,68,72,73,97,98,99,102,108,110, 113,114,122,124,125,133,140,144,145,147,152,153,164,175,182,204,205,214,216, 219,228,229,230,231,236,239,240,241,242,244,263,264,265,268,269,276,284,291, 300,301,303,310,311,313,316,338,342,344,346,349,359,361,364,379,382,390,391, 393,394,408,410,415,417,418,430,431,433,436,442,443,444,448 和 451 上包含一个或 多个氨基酸取代。在此方面的一个实施方案中,葡糖淀粉酶变体在对应于选自SEQ ID NO 2 或 3 的 10,14,15,23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144, 145,147,152,153,164,182,204,205,214,216,219,228,229,230,231,236,239,241,242, 263,264,265,268,269,276,284,291,300,301,303,311,338,342,344,346,349,359,361, 364,379,382,390,391,393,394,410,417,418,430,431,433,442,444,448 和 451 上包含一个或多个氨基酸取代。在该方面的其它实施方案中,葡糖淀粉酶变体在对应于SEQ ID NO 2 或 SEQ ID NO 3 的位置 61,67,72,97,102,133,205,219,228,230,231,239,263,268,291, 342,394,430,431和451上包含一个或多个氨基酸取代。在此方面的另外的实施方案中,葡 糖淀粉酶变体具有一个或多个氨基酸取代,其对应于SEQ ID NO 2或SEQ ID NO 3的至少 一个下列取代:T67M, A72Y, S97N, S102M, I133T, T205Q, Q219S, W228M, S230F, S230G, S230N, S230R, S231L, I239V, I239Y, N263P, A268C, A268G, A268K, S291A, T342V, K394S, T430K, A431Q, S451K。在另一方面,与亲本葡糖淀粉酶相比,本发明的葡糖淀粉酶变体具有改变的性质。 在一些实施方案中,比较于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或与SEQ ID NO :2有至少80%序列同一性的亲本葡糖淀粉酶,改变的性质为比活性的增加。在一些 实施方案中,比较于包含SEQ ID NO :2的葡糖淀粉酶,葡糖淀粉酶变体具有增加的比活性。 在此方面的其它实施方案中,葡糖淀粉酶变体在对应于选自SEQ ID而2或3的10,14,15, 23,59,60,61,65,67,68,72,73,97,98,99,102,110,113,133,140,144,145,147,152,153, 164,182,204,205,214,216,219,228,229,230,231,236,239,241,242,263,264,265,268, 269,276,284,291,300,301,303,311,338,342,344,346,349,359,361,364,379,382,390, 391,393,394,410,417,418,430,431,433,442,444,448,和 451 的位置上包含一个或多个 氨基酸取代。在其它的方面,比较于包含SEQ ID NO :2、SEQ ID NO 3的序列的葡糖淀粉酶或与 SEQ ID NO :2有至少80%序列同一性的亲本葡糖淀粉酶,本发明的葡糖淀粉酶变体具有增 加的热稳定性。在一些实施方案中,比较于包含SEQ ID NO :2或SEQ ID NO :3的葡糖淀粉 酶,葡糖淀粉酶变体具有增加的热稳定性。在此方面的一些实施方案中,本发明的葡糖淀粉 酶变体在对应于选自 SEQ ID NO :2 或 SEQ ID NO :3 的位置 10,15,23,42,59,60,61,68,72, 73,97,98,99,102,114,133,140,144,147,152,153,164,182,204,205,214,216,228,229, 230,231,236,241,242,263,264,265,268,269,276,284,291,300,301,303,311,338,342, 344,346,349,359,361,364,379,382,390,391,393,394,410,417,430,431,433,436,442, 443,444,448和451的位置上包含一个或多个氨基酸取代。在此方面的其它实施方案中,本 发明的葡糖淀粉酶变体在对应于选自SEQ ID NO :2或SEQ ID NO :3的位置10,42,68,73, 97,114,153, 229, 231, 236, 264, 291, 301, 344, 361, 364,417, ^P 433 的位置上包含一个或多 个氨基酸取代。在此方面的其它实施方案中,本发明的葡糖淀粉酶变体在对应于选自SEQ ID NO :2 或 SEQ ID NO :3 的位置 68,73,114,153,236,344,361,364 和 433 的位置上包含一 个或多个氨基酸取代。在此方面的又一些实施方案中,葡糖淀粉酶变体包含一个或多个氨 基酸取代,其对应于至少一个下面的SEQ ID NO 2或SEQ ID NO 3的T10S,T42V,E68C, E68M, G73F, G73W, K114M, K114T, N153A, N153S, N153V, W228V, D236R, G361D, G361E, G361P, G361Y, A364D, A364E, A364F, A364G, A364K, A365L, A365R, R433C, R433G, R433L, R433N, R433S, R433V,和 I436H。在另外的方面,比较于包含SEQ ID NO 2或SEQ ID NO 3序列的葡糖淀粉酶或与 SEQ ID NO :2有至少80%序列同一性的亲本葡糖淀粉酶,本发明的葡糖淀粉酶变体具有增 强的比活性和增加的热稳定性。在此方面的一些实施方案中,本发明的葡糖淀粉酶变体在 对应于选自 SEQ ID NO :2 或SEQ ID NO :3 的位置10,15,59,61,68,72,73,97,99,102,133,140,153,182,204,205,214,228,229,230,231,236,241,242,264,265,268,275,284,291, 300,301,303,311,338,344,346,359,361,364,370,382,391,393,394,410,417,430,431, 433,444,448,和451的位置上包含一个或多个氨基酸取代。在此方面的另外实施方案中, 葡糖淀粉酶变体在对应于选自SEQ IDNO :2或SEQ ID NO :3的位置228,230,231,268,291, 417,433和451的位置上包含一个或多个氨基酸取代。在此方面的另外实施方案中,葡糖淀 粉酶变体包含一个或多个氨基酸取代,其对应于至少一个下面的取代SEQID NO 2或SEQ ID NO 3 的 W228A, W228F, W228H, W228M, S230F, S230G, S230R, S231L, A268C, A268G,S291A, L417R, R433Y,和 S451K。在另一方面,本发明涉及编码涵盖在本发明中的任何一种葡糖淀粉酶变体的分离 的多核苷酸。在一些实施方案中,本发明涉及一种宿主细胞,其包含编码涵盖在本发明中的 葡糖淀粉酶的多核苷酸。在其它的方面,本发明涉及酶组合物,其包含一种或多种涵盖在本发明中的葡糖 淀粉酶变体。在一些实施方案中,所述酶组合物将包括另外的酶,例如一种或多种α-淀粉 酶。在一些实施方案中,所述酶组合物可以用于淀粉转化方法,乙醇发酵方法和/或动物饲 料配制。在有些方面,本发明涉及生产涵盖在本发明中的变体葡糖淀粉酶的方法,包括用 编码本发明的葡糖淀粉酶变体的多核苷酸转化宿主细胞;在适于表达和生产所述葡糖淀粉 酶变体的条件下培养该宿主细胞并生产所述变体。在一些实施方案中,所述葡糖淀粉酶变 体从培养基中回收。


图1显示了具有632个氨基酸(SEQ ID NO 1)的里氏木霉葡糖淀粉酶(TrGA)。信 号肽加下划线,以氨基酸残基SVDDFI (SEQ ID NO 12)开始,并具有453个氨基酸残基的催 化区(SEQ ID NO 3)以粗体显示;接头区域以斜体显示,淀粉结合区(SBD)以斜体显示并加 下划线。包括催化区(SEQ ID Ν0:3),接头区(SEQ ID NO 10)和淀粉结合区(SEQ IDNO 11)的成熟蛋白由SEQ ID NO 2表示。图IB显示了编码TrGA的cDNA(SEQ ID NO 4)。图 IC显示了 TrGA前体和成熟蛋白结构域。图 2 显示了包括 TrGA 的 cDNA(SEQ ID NO 4)的目的质粒 pDONR-TrGA。图 3 显示了质粒 pTTT-Dest。图4显示了最终的表达载体pTTT-TrGA。图5A-5B显示了亲本葡糖淀粉酶催化区的比对比较,所含葡糖淀粉酶包括来源于 泡盛曲霉(Aspergillus awamori) (AaGA) (SEQ ID NO 5);黑曲霉(Aspergillus niger) (AnGA) (SEQ ID NO 6);米曲霉(Aspergillusoryzae) (AoGA) (SEQ ID NO 7);里氏木霉 (Trichoderma reesei) (TrGA) (SEQ ID NO 3);灰腐质霉(Humicola grisea) (HgGA) (SEQID NO 8)和Hypocrea vinosa(HvGA) (SEQ ID NO 9)的葡糖淀粉酶。相同的氨基酸通过星号 (女)指出。图5C显示了踝节菌葡糖淀粉酶(TeGA)成熟蛋白序列(SEQ IDNO 308)。图6是从侧面观察的木霉菌葡糖淀粉酶(黑色)(SEQ ID NO 2)和泡盛曲霉葡糖淀 粉酶(灰色)三维结构的比较。根据活性中心测定侧面并且活性中心入口在该分子的“顶部”。图7是从顶部观察木霉菌葡糖淀粉酶(黑色)和泡盛曲霉葡糖淀粉酶(灰色)三 维结构的比较。活性中心入口在该分子的“顶部”。发明详述定义除非另有定义,本文使用的所有技术和科学术语具有与本发明所属技术领域的 普通技术人员通常理解相同的含义。Singleton等,DICTI0NARY0F MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED.,JohnWiley 和 Sons, New York (1994),和 Hale&Markham,The HARPERCOLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N. Y. (1991)为技术人员提供 本文应用的很多术语的通常含义。但为了清楚和便于参考,仍在下面定义某些术语。本文所使用的术语“葡糖淀粉酶(EC3. 2.1.3) ”是指催化从淀粉和相关寡糖和多糖 的非还原性末端释放D-葡萄糖的酶。本文所使用的术语“亲本“或“亲本序列”指的是与TrGA具有序列和/或结构同 一性的序列(例如,SEQ ID N0:l,2和/或3)和宿主细胞内天然的或自然出现的序列。本文所使用的术语“TrGA”指的是具有SEQ ID NO 2中显示的成熟蛋白序列的里 氏木霉葡糖淀粉酶序列,其包括具有SEQ ID NO :3中显示序列的催化区。W02006/060062 和2006年5月4日公开的美国专利号2006/0094080中描述了 TrGA的分离,克隆和表达, 其并入本文做为参考。TrGA也被认为是亲本葡糖淀粉酶序列。在一些实施方案中,亲本序 列指的是做为蛋白质工程的起点的TrGA。本文中葡糖淀粉酶氨基酸的编号基于TrGA葡糖 淀粉酶序歹Ij (SEQ ID NO 2 和 SEQ ID NO :3)。短语“蛋白质或多肽的成熟形式”指的是蛋白质或多肽的最终功能形式。举例来 说,TrGA成熟形式包括催化区,接头区和淀粉结合区,具有SEQ ID NO 2的氨基酸序列。术语“木霉菌葡糖淀粉酶同源物”指的是具有与TrGA序列(SEQ IDN0:1, SEQ ID NO :2或SEQ ID NO 3)至少80%氨基酸序列同一性的亲本葡糖淀粉酶,其中该葡糖淀粉酶 保持了葡糖淀粉酶的功能性特征。本文中使用的“同源序列”意思是为了比较进行最佳序列比对时,与一种核酸序 列或多肽序列具有至少100%,至少99%,至少98%,至少97%,至少96%,至少95%,至 少94%,至少93%,至少92%,至少91%,至少90%,至少88%,至少85%,至少80%,至少 75 %,至少70 %,至少65 %,至少60 %,至少55 %,至少50 %或至少45 %序列同一性的核酸 或多肽序列,其中候选核酸序列或多肽序列的功能与和所述候选同源序列相比较的核酸序 列或多肽序列基本相同。在一些实施方案,同源序列具有85%和100%之间的序列同一性, 而在其它的实施方案中具有90%和100%之间的序列同一性,在其它的实施方案中,具有 95%和100%的序列同一性。在一些实施方案中,候选同源序列或亲本与TrGA核酸序列或 成熟蛋白序列比较。序列同一性可以经由亲本或同源序列的全长测定。本文中使用的术语“葡糖淀粉酶变体”,“变体”和“TrGA变体”用于与亲本葡糖淀粉酶序列相似的葡糖淀粉酶(例如,TrGA或木霉菌葡糖淀粉酶同源物),但在其氨基酸序 列中具有使其在序列上不同于亲本葡糖淀粉酶的至少一个取代,缺失或插入。在一些情况 中,它们已经被操作/改造以在它们的氨基酸序列中包括至少一个取代,缺失或插入,其使 得它们的序列不同于亲本葡糖淀粉酶。
本文中使用的术语“催化区”指的是多肽的结构区,其包含底物水解的活性位点。术语“接头”指的是通常具有3到40个之间氨基酸残基的短氨基酸序列,其共价 连接包含淀粉结合区的氨基酸序列和包含催化区的氨基酸序列。术语“淀粉结合区”指的是优选结合于淀粉底物的氨基酸序列。本文中使用的术语“突变序列,,和“突变基因”可互换使用,指的是一种多核苷酸 序列,其具有发生于宿主细胞亲本序列中的至少一个密码子内的改变。突变序列的表达产 物为相对于亲本具有改变的氨基酸序列的变体蛋白。所述表达产物可以具有改变的功能容 量(例如,增强的酶活性)。在多肽背景下,本文应用的术语“性质”或其语法上的等同对应词指的是能够被选 择或检测的多肽的任何特点或属性。这些性质包括,但不限于氧化稳定性,底物特异性,催 化活性,热稳定性,PH活性曲线,对蛋白降解的抗性,KM, Kcat, Kcat/Km比率,蛋白折叠,结合底 物的能力和分泌能力。在核酸背景下,本文应用的术语“性质”或其语法上的等同对应词指的是能够被选 择或检测的核酸的任何特点或属性。这些性质包括,但不限于,影响基因转录的性质(例 如,启动子强度和启动子识别),影响RNA加工的性质(例如,RNA剪接和RNA稳定性),影 响翻译的性质(例如,调控,结合mRNA到核糖体蛋白)。
术语“热稳定的”和“耐热的”指的是在淀粉底物水解过程中普通的条件下,本发 明的葡糖淀粉酶变体在给定的时段暴露于确认的温度后,例如暴露于改变的温度后,保持 特定量的酶活性。在性质例如热稳定性的背景下,术语“增强的稳定性”指的是比较于另一个参照 (例如,亲本)葡糖淀粉酶,随时间推移维持的更高的淀粉水解活性。在性质例如热稳定性的背景下,术语“降低的稳定性”指的是比较于另一个参照葡 糖淀粉酶,随时间推移维持的更低的淀粉水解活性。术语“比活性”被定义为每毫克葡糖淀粉酶蛋白的活性。在一些实施方案中,葡糖 淀粉酶的活性通过本文描述的乙醇试验测定并表达为从淀粉底物产生的葡萄糖的量。在一 些实施方案中,蛋白质浓度可以使用本文描述的Caliper试验测定。术语“活性”和“生物活性”指的是与某具体蛋白相关的生物活性。由此可见,给 定蛋白的生物活性指的是由本领域技术人员通常归因于该蛋白的任何生物活性。例如,与 葡糖淀粉酶相关的酶活性是水解的,于是活性葡糖淀粉酶具有水解活性。术语“多核苷酸”和“核酸”,在本文中互换使用,指的是任何长度核苷酸的聚合形 式,或者核糖核苷酸或者脱氧核糖核苷酸。这些术语包括,但不限于,单_,双_,或三-链 DNA,基因组DNA,cDNA, RNA, DNA-RNA杂合物,或包含嘌呤和嘧啶碱基的聚合物,或其他天然 的,化学,生物化学修饰的,非天然的或者衍化的核苷酸碱基。本文中使用的术语“DNA构建体” “转化DNA”和“表达载体”互换使用,指的是用 于引入序列到宿主细胞或生物的DNA。所述DNA可以通过PCR或本领域技术人员已知的任 何其它合适的技术在体外产生。DNA构建体,转化DNA或重组表达盒可以被掺入到质粒,染 色体,线粒体DNA,质体DNA,病毒或核酸片段。通常地,表达载体的重组表达盒部分,DNA构 建体或转化DNA包括,除其它序列外,被转录的核酸序列和启动子。在实施方案中,表达载 体具有在宿主细胞中掺入和表达异源DNA片段的能力。
本文中使用的术语“载体”指的是设计用于引入核酸到一种或多种细胞类型的多 核苷酸构建体。载体包括克隆载体,表达载体,穿梭载体,质粒,表达盒等等。在引入核酸序列到细胞内的背景下,本文使用的术语“引入”指的是适合转移核酸 序列到细胞内的任何方法。这些引入方法方法包括但不限于原生质体融合,转染,转化,接 合,和转导。本文中使用的术语“转化的”和“稳定转化的”指的是细胞,其具有整合入其基因 组的非天然(异源的)多核苷酸序列或做为维持至少两代的游离质粒。本文中使用的术语“选择标记”和“选择性标记”指的是能够在宿主细胞内表达的 核酸(例如,基因),其允许容易地选择那些包含载体的宿主。通常,选择标记是赋予宿主细 胞抗生素抗性或代谢优势的基因,以在转化过程中允许包含外源DNA的细胞与未接受任何 外源序列的细胞区分开来。本文中使用的术语“启动子”指的是具有指导下游基因转录作用的核酸序列。启 动子,和其他转录和翻译调节核酸序列(也称为“控制序列”)一起对于表达给定基因是必 须的。通常,转录和翻译调节序列包括,但不限于启动子序列,核糖体结合位点,转录起始和 终止序列,翻译起始和终止序列,和增强子或激活子序列。当其置于与另外一个核酸序列的功能关系中时,核酸被“有效连接”。例如,如果 编码分泌前导序列(即,信号肽)的DNA表达为参与多肽分泌的前导蛋白,那么编码分泌前 导序列(即,信号肽)的DNA有效地连接于多肽的DNA。通常,“有效连接”意思是被连接的 DNA序列是相邻的,并且至于分泌前导序列,是相邻的并且在阅读相内。本文中使用的术语“基因”指的是多核苷酸(例如,DNA片段),其编码多肽,并包 括编码区之前和之后的区域以及单个编码区段(外显子)之间的间插序列(内含子)。本文中使用的“同源基因”指的是来自不同,但通常相关的物种的一对基因,其相 互对应并且彼此相同或非常近似。该术语包括由物种形成(即新物种发展)分离的基因 (例如,直向同源基因),以及已经由基因复制分离的基因(例如,旁系同源基因)。本文中使用的“直向同源物”和“直向同源基因”指的是通过物种形成从共同的祖 先基因(S卩,同源基因)进化而来的不同物种中的基因。通常,直向同源物在进化过程中保 持相同的功能。直向同源物的鉴定在新近测序的基因组中可靠预测基因功能中得到应用。本文中使用的“旁系同源物”和“旁系同源基因”指的是基因组内通过复制相关的 基因。尽管直向同源物在进化过程中保持相同的功能,但是旁系同源物进化新功能,尽管一 些功能通常与最初的基因相关。旁系同源基因的实例包括,但不限于编码胰蛋白酶,胰凝乳 蛋白酶,弹性蛋白酶和凝血酶的基因,其都是丝氨酸蛋白酶并在同一物种内一起发生。本文中使用的术语“同源性”指的是序列相似性或同一性,优选同一性。该同源 性使用本领域已知的标准技术确定(参见,例如,Smith和Waterman,(1981)Adv. Appl. Math. ,2482 ;Needleman 禾口 Wunsch, (1988)J. Mol. Biol. ,48443 ;Pearson 禾口 Lipman, (1988) Proc. Natl. Acad. Sci. USA 85:2444;程序,如 Wisconsin Genetics Software Package (GeneticsComputer Group, Madison, WI)中的 GAP,BESTFIT,FASTA,和 TFASTA ;禾口 Devereux et al.,(1984)Nucl. Acid Res.,12 :387_395)。“核酸序列同一性百分数(% ) ”或“氨基酸序列同一性百分数(% ) ”被定义为候 选序列中与起始序列(如,TrGA)的核苷酸残基或氨基酸残基相同的核苷酸残基或氨基酸残基的百分比。序列同一性可以在起始序列全长(即,TrGA SEQ ID NO :2或3)上测量。同源序列由已知的序列比对方法确定。通常使用的比对方法是由Altschul等 (Altschul 等,(1990) J. Mol.Biol.,215 403-410 ;禾口 Karl in 等,(1993) Proc. Natl. Acad. Sci.USA 90 5873-5787)描述的BLAST。一个尤其有用的BLAST程序是WU-BLAST-2程序(参 见,Altschul 等,(1996)Meth. Enzymol.,266 460-480)。WU-BLAST-2 使用几个检索参数, 其大多数被设定为默认值。可调整的参数设定为下列值,重叠间隔=1,重叠部分=0. 125, 字段阈值(T) =11。HSPS和HSP S2参数是动态值并通过程序本身建立,其依赖于具体序 列的组成和目的序列被检索的具体数据库的组成。但是,这些值可以被调整以增加灵敏性。 氨基酸序列同一性值由匹配的相同残基的数目除以比对区内“更长”序列的残基总数来 确定。“更长”序列是在比对区中具有大多数实际残基的序列(忽略由WU-Blast-2为最大 化比对得分而引入的空位)。其它的方法也应用于比对序列。一个有用算法的例子是PILEUP。PILEUP使用渐 进的逐对比对从一组相关序列产生多个序列比对。PILEUP使用Feng和Doolittle的渐进 式比对方法的简化形式(Feng和Doolittle,(1987) J. Mol. Evol. ,35 :351_360)。该方法与 Higgins 和 Sharp 描述的方法相似(Higgins 和 Sharp,(1989)CABI0S 5 151-153)。有用的 PILEUP参数包括默认的空位权重3. 00,默认的空位长度权重0. 10和加权的末端空位。术语“最优比对”指的是提供最高同一性百分率得分的比对。“等同位置”指的是 两个序列之间的最优比对。例如利用图5D和5E,TrGA(SEQID NO 2)中491位是C491 ;黑 曲霉的等同位置是C509位;泡盛曲霉的等同位置是Q538位。对于三维序列的示例性比对 参见图8。本文中使用的术语“杂交”指的是如本领域所知,核酸链与互补链通过碱基配对结 合的过程。如果在中等到高严格度杂交和洗涤条件下,两个序列互相特异地杂交,则认为核 酸序列对于参考序列是“选择性杂交的”。杂交条件是以核酸结合复合体或探针的解链温度 (Tm)为基础的。例如,“最大严格性”通常发生在约Tm-5°C (低于探针Tm 5°C );“高严格 性”在低于Tm约5-10°C ;“中等严格性”在低于探针Tm约10_20°C ;“低严格性”在低于Tm 约20-25°C。功能上来说,最大严格性条件可以用于鉴定与杂交探针具有严格同一性或接近 严格同一性的序列;而中等或低严格性条件可以用于鉴定或检测多核苷酸序列同源物。中等和高严格性杂交条件是本领域公知的。高严格性条件的一个例子包括在约 42°C,在 50% 甲酰胺,5XSSC,5XDenhardt,s 液,0. 5% SDS 和 100 ii g/ml 变性载体 DNA 中杂 交,之后在室温下,2XSSC和0. 5%SDS中洗涤两次,并在42°C,0. IX SSC和0. 5%SDS中洗涤 另外两次。中等严格性条件的一个例子包括37°C,在包含20%甲酰胺,5X SSC(150mMNaCl, 15mM柠檬酸三钠),50mM磷酸钠(pH7. 6),5XDenhardt,s液,10%硫酸葡聚糖和20mg/ml变 性的剪切鲑精DNA的溶液中温育,之后在约37-50°C,lX SSC中洗涤滤膜。本领域技术人员 知晓如何调整温度,离子强度等,其对于适应例如探针长度等等的因素是必须的。本文中使用的“重组”包括涉及的细胞或载体,其通过引入异源的或同源的核酸序 列被修饰或所述细胞来源于此种修饰的细胞。这样,例如,作为人类有意干预的结果,重组 细胞表达天然(非重组)形式细胞内未发现相同形式的基因,或表达天然基因,其否则异常 表达,低表达或根本不表达。
在本发明的一些实施方案中,突变的DNA序列通过在至少一个密码子中位点饱和 诱变产生。在其它的实施方案中,位点饱和诱变实施于两个或更多的密码子。在另一实施 方案中,突变的DNA序列具有与亲本序列超过50 %,超过55 %,超过60%,超过65%,超过 70%,超过75%,超过80%,超过85%,超过90%,超过95%,超过98%或超过99%的同源 性。在备选实施方案中,突变DNA使用任何已知的诱变方法如,举例来说,辐射,亚硝基胍等 等在体内产生。希望DNA序列于是被分离和在本文提供的方法中使用。本文中使用的“异源蛋白”指的是非宿主细胞内自然发生的蛋白质或多肽。本文中使用的“同源蛋白”指的是细胞内天然或自然发生的蛋白质或多肽,并包括 由重组DNA技术或者细胞内天然过表达的天然蛋白质。如果酶在细胞内以比其在相应野生型细胞内表达的水平更高的水平表达,酶即为 在宿主细胞内“过表达”。术语“蛋白质”和“多肽”在本文中可互换使用。在本公开和权利要求中,使用用 于氨基酸残基的常规单字母和三字母代码。氨基酸三字母代码定义与IUPAC-IUB生物化学 命名联合委员会(JCBN) —致。也可以理解的是,由于基因密码的简并性,多肽可以由不止 一个核苷酸序列编码。通过下面的命名法描述本发明的变体[原始氨基酸残基/位置/取代的氨基酸 残基]。例如在76位用亮氨酸取代精氨酸被表示为R76L。当多于一个氨基酸在给定位置 被取代,该取代被表示为DQ172C, Q172D或Q172R ;2)Q172C, D,R或c)Q172C/D/R。可以理 解的是,当本文鉴定的适合取代的位置没有推荐的特定氨基酸,那么任何氨基酸残基可以 取代该位置上存在的氨基酸残基。与其它葡糖淀粉酶相比,变体葡糖淀粉酶包含缺失时,该 缺失以标示。例如,位置R76的缺失被表示为R76 *。两个或更多个连续氨基酸的缺 失被标示为,例如(76-78) *。“前序列”是信号序列和成熟蛋白之间对于蛋白质分泌必需的氨基酸序列。切割前 序列将产生成熟有活性的蛋白质。术语“信号序列”或“信号肽”指的是可以参与成熟或前体形式蛋白质分泌的任何 核苷酸和/或氨基酸序列。信号序列的该定义是功能性定义,意味着包括由所述蛋白基因 的N-末端部分编码的所有那些氨基酸序列,其参与蛋白分泌的完成。其经常,但不总是,结 合于蛋白质的N-末端部分或前体蛋白的N-末端部分。信号序列可以是内源的或外源的。 信号序列可以通常情况下结合于所述蛋白质(例如,葡糖淀粉酶)或可以来自编码另一分 泌蛋白的基因。术语蛋白质或肽的“前体”形式指的是具有有效连接于该蛋白质的氨基或羰基末 端的前序列的成熟形式的蛋白质。前体也可以具有有效连接于前序列氨基末端的“信号” 序列。前体也可以具有参与翻译后活动(例如,从中切割以产生成熟形式蛋白质或肽的多 肽)的另外的多肽。“宿主菌株”或“宿主细胞”指的是包含根据本发明DNA的表达载体的适宜宿主。术语“来自”和“获自,,不仅指由讨论中的生物株系产生或可产生的葡糖淀粉酶, 也指由分离自如此株系的DNA序列编码的和在包含如此DNA序列的宿主生物中产生的葡糖 淀粉酶。此外,该术语指由合成的和/或cDNA来源的DNA序列编码的并且具有讨论中的葡 糖淀粉酶确认特征的葡糖淀粉酶。
该定义范围内的“衍生物”通常保持野生型,天然的或亲本形式中观察到的特征性 水解活性到这样的程度,其使该衍生物可用于与野生型,天然的或亲本形式相似的目的。葡 糖淀粉酶功能性的衍生物包含自然发生的,合成地或重组产生的肽或肽片段,其具有本发 明的葡糖淀粉酶的一般特征。术语“分离的”或“纯化的”指的是从其起始环境中被移开的物质(例如自然环 境,如果其是自然发生地)。在一些实施方案中,如通过SDS-PAGE确定,分离的蛋白质是超 过10%纯的,优选超过20%纯的,和更优选超过30%纯的。本发明另外的方面包括如通过 SDS-PAGE确定的高度纯化形式的蛋白质(即超过40 %纯的,超过60 %纯的,超过80 %纯 的,超过90 %纯的,超过95 %纯的,超过97 %纯的,和甚至超过99 %纯的)。本文中使用的术语“组合诱变”指的是产生起始序列的变体文库的方法。在这些 文库内,变体包含选自预先确定的一组突变的一个或几个突变。除此之外,方法提供了引 入随机突变的手段,所述随机突变不是预先确定的一组突变的成员。在一些实施方案中, 所述方法包括USP6,582,914中阐述的那些方法,在此并入作为参考。在备选的实施方案 中,组合诱变方法包括商业上可获得的试剂盒(例如,QUIKCHANGE MUltisite, Stratagene, San Diego, CA)0本文中使用的术语“突变体文库”指的是细胞群体,其基因组的大多数相同,但包 括一个或多个基因的不同同源物。这样的文库可以用于,例如,鉴定具有改良性状的基因或 操纵子。本文中使用的术语“干燥固体含量(DS或ds) ”指的是浆液的总固体基于干重的百 分比。本文中使用的术语“起始命中”指的是通过筛选组合共有诱变文库鉴定的变体。在 实施方案中,与起始基因相比,起始命中具有改善的性能特征。本文中使用的术语“改善的命中”指的是通过筛选增强的组合共有诱变文库鉴定 的变体。本文中使用的术语“目标特性”指的是将被改变的起始基因的特性。并不意图将 本发明限定于任何具体的目标特性。但是,在一些实施方案中,目标特性是基因产物的稳定 性(例如,对变性,蛋白水解或其它降解因素的抗性),而在其它的实施方案中,生产宿主中 的产物的水平改变。事实上,预期起始基因的任何特性都在本发明中得到应用。术语的其 它定义可在说明书的各处出现。在更详细描述示例性的实施方案之前,应当理解的是,本发明不限于本文描述的 具体实施方案,因为这些可以变化。也应当理解,本文中使用的术语只是为了描述具体的实 施方案,并无限制性意图。当提供数值范围时,应当理解,除非上下文另有明确规定,该范围的上限和下限之 间的每个中间值,直至下限单位的十分之一,也被具体地公开。任何陈述值之间的每个更小 范围或陈述范围内的中间值和任何其它公开的或所述公开范围内的中间值都包括在本发 明内。这些更小范围的上限或下限可以独立地包括于或排除于该范围,两个端点之一,两个 端点都不或都包括在更小范围的每个范围也包括在本发明之内,其受限于公开范围内任何 具体排除的界限。如果公开的范围排除一个或两个端点,排除一个或者两个所述被包括端 点的范围也包括在本发明内。
尽管与本文描述的那些方法和材料相似或等同的任何方法和材料可以用于实施或测试本发明,现在仍描述示例性的和优选的方法和材料。本文提到的所有出版物并入本 文作为参考,以公开和描述与引用的出版物有关的方法和/或材料。除非上下文另有明确规定,单数形式包括复数指代。这样,例如,提到“一个基因” 包括多个这样的候选基因,提到“细胞”包括涉及一个或多个细胞和本领域技术人员知晓的 等同物,等等。本文中讨论的出版物只有其公开早于本申请的申请日,才被提供。本文不承认本 发明无权由于是在先发明而早于此类出版物。详述的实施方案本发明的目的是改变亲本葡糖淀粉酶,尤其是里氏木霉葡糖淀粉酶(TrGA)的特 性,例如热稳定性和/或比活性,以获得具有改变特性的葡糖淀粉酶变体,其将会用于多种 应用,例如淀粉转化或乙醇发酵过程。亲本葡糖淀粉酶在一些实施方案中,本发明提供了亲本葡糖淀粉酶的葡糖淀粉酶变体。亲本葡糖 淀粉酶可以包含与TrGA(SEQ ID NOs :2和/或3)有序列和/或结构同一性的序列。在一 些实施方案中,亲本葡糖淀粉酶包含如SEQ IDNOs :1,2,3,5,6,7,8或9中显示的氨基酸序 列。在一些实施方案中,亲本葡糖淀粉酶是同源物。在一些实施方案中,亲本葡糖淀粉酶具 有与SEQ ID NO :2的TrGA氨基酸序列至少50%的序列同一性,至少60%的序列同一性, 至少70%的序列同一性,至少80%的序列同一性,至少85%的序列同一性,至少88%的序 列同一性,至少90%的序列同一性,至少93%的序列同一性,至少95%的序列同一性,至少 96 %的序列同一性,至少97 %的序列同一性,至少98 %的序列同一性,和至少99 %的序列 同一性。在一些实施方案中,亲本葡糖淀粉酶包含催化区,其具有与SEQ IDNO =1,2,3,5,6, 7或8中显示的一个或多个氨基酸序列有至少50%的氨基酸序列同一性,至少60%的氨基 酸序列同一性,至少70%的氨基酸序列同一性,至少80%的氨基酸序列同一性,至少85% 的氨基酸序列同一性,至少90 %的氨基酸序列同一性,至少93 %的氨基酸序列同一性,至 少95%的氨基酸序列同一性,至少97%的氨基酸序列同一性和至少99%的氨基酸序列同 一性的氨基酸序列。在其它的实施方案中,亲本葡糖淀粉酶将具有与SEQ IDNO :3的TrGA 氨基酸序列的催化区至少80%的序列同一性,至少85%的序列同一性,至少90%的序列同 一性,至少95%的序列同一性,至少97%的序列同一性,和至少98%的序列同一性。亲本葡糖淀粉酶可以由DNA序列编码,其在中等或高严格性条件下与编码具有 SEQ ID N0:l,2或3的一个氨基酸序列的葡糖淀粉酶的DNA杂交。在一些实施方案中,具 有至少50%序列同一性,至少60%的氨基酸序列同一性,至少70%的氨基酸序列同一性, 至少80%的氨基酸序列同一性,至少90%的氨基酸序列同一性,至少95%的氨基酸序列同 一性和至少97%的氨基酸序列同一性的亲本葡糖淀粉酶也具有与SEQ ID NOs :2和/或3 的结构同一性。尽管亲本葡糖淀粉酶是宿主细胞内天然的或自然发生的序列,但在一些实 施方案中,亲本葡糖淀粉酶是自然发生的变体。在一些实施方案中,亲本葡糖淀粉酶是改造 的变体和/或杂合葡糖淀粉酶。葡糖淀粉酶的预测结构和已知序列在真菌物种中是保守的(Coutinho等,(1994)Protein Eng. ,7 :393_400 和 Coutinho 等· , (1994), ProteinEng. ,7 :749_760)。在一 些实施方案中,亲本葡糖淀粉酶是丝状真菌葡糖淀粉酶。在一些实施方案中,亲本葡 糖淀粉酶获自木霉属菌株(例如,里氏木霉,长梗木霉(T. longibrachiatum),严紧木 霉(T. strictipilis),棘胞木霉(T. asperellum),康长木霉(T. koni langbra)和哈茨 木霉(T.hazianum)),曲霉属菌株(例如黑曲霉,构巢曲霉,A. kawachi,泡盛曲霉和米曲 霉),踝节菌属株(例如埃默森踝节菌(T. emersonii),湿热踝节菌(T. thermophilus) 和T. duponti),肉座菌属菌株(例如胶质肉座菌(H. gelatinosa),东方肉座菌 (H. orientalis),H. vinosa,H. citrina),镰孢属菌株(例如,尖镰孢(F. oxysporum),粉红 镰孢(F. roseum)和F. venenatum),脉孢菌属菌株(例如粗糙脉孢菌(N. crassa))和腐质霉 属菌株(例如,灰腐质霉,特异腐质霉(H. insolens)和H. lanuginosa),青霉属菌株(例如 点青霉或产黄青霉),或复膜孢酵母属菌株(例如S. fibuligera)。在一些实施方案中,亲本葡糖淀粉酶是细菌葡糖淀粉酶。例如,多肽可以获自革兰氏阳性菌株,例如芽孢杆菌(例如,嗜碱芽孢杆菌(B. alkalophilus),解淀粉芽孢杆菌 (B. amyloliquefaciens),迟缓芽孢杆菌(B. Ientus),地衣芽孢杆菌(B. Iicheniformis), 嗜热脂肪芽孢杆菌(B. stearothermophilus),枯草芽孢杆菌(B. subtilis)和苏云金芽孢 杆菌(B. thuringiensis))或链霉属菌株(例如,浅青紫链霉菌(S. Iividans))。在一些其它实施方案中,亲本葡糖淀粉酶将包含与SEQ ID NO :5或SEQ ID NO 6 的曲霉亲本葡糖淀粉酶的催化区有至少90%序列同一性,至少93%序列同一性,至少95% 序列同一性,至少96%序列同一性,至少97%序列同一性,至少98%序列同一性和至少 99 %序列同一性的氨基酸序列。在其它实施方案中,亲本葡糖淀粉酶将包含与SEQ ID NO 8的灰腐质霉(HgGA)亲 本葡糖淀粉酶的催化区有至少90%序列同一性,至少95%序列同一性,至少97%序列同一 性和至少99%序列同一性的氨基酸序列。在一些实施方案中,亲本葡糖淀粉酶具有与SEQ ID NO :2或3的TrGA氨基酸序列 至少50%的序列同一性,至少60%的序列同一性,至少70%的序列同一性,至少80%的序 列同一性,至少85 %的序列同一性,至少88 %的序列同一性,至少90 %的序列同一性,至少 93 %的序列同一性,至少95 %的序列同一性,至少96 %的序列同一性,至少97 %的序列同 一性,至少98%的序列同一性和至少99%的序列同一性,并具有与SEQ IDNO :2或3的葡糖 淀粉酶的结构同一性。在另外的实施方案中,木霉属葡糖淀粉酶同源物可以获自木霉属或肉座菌属的菌 株。有些木霉葡糖淀粉酶同源物在美国专利
发明者C·弗勒门, I·尼古拉耶夫, M·谢弗斯, P·范索林恩, R·R·博特, W·埃赫勒 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1