α-淀粉酶及其用途的制作方法

文档序号:527760阅读:1278来源:国知局

专利名称::α-淀粉酶及其用途的制作方法
技术领域
:本发明涉及具有a-淀粉酶活性的分离的多肽和编码所述多肽的分离的多核普酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。相关领域描述a-淀粉酶(a-l,4-葡聚糖-4-葡聚糖水解酶,EC.3.2丄1)组成了一组酶,其催化淀粉和其他线性和具有支链的1,4-糖苷寡糖和多糖的水解。多年来一直为多种不同目的而使用a-淀粉酶,最重要的用途是淀粉液化、纺织品脱浆、纸和纸浆工业中淀粉的修饰,和用于酿造、乙醇生产和烘培。有非常多与这种在工业上非常重要的酶类有关的专利和科学文献。从,例如,WO90/11352、WO95/10603、WO95/26397和WO96/23874,已知称作"Termamyf样a-淀粉酶"的很多a-淀粉酶及其变体。Termamy产样a-淀粉酶是非常热稳定的,因此适用于在高温进行的过程,如右旋糖生产工艺中的淀粉液化。另一组a-淀粉酶称为"FungamyFM样a-淀粉酶",其为与源自米曲霉的a-淀粉酶有关或与其同源的a-淀粉酶。Fungamyl样a-淀粉酶具有相对低的热稳定性,NovozymesA/S,Denmark以商标名FUNGAMYL出售的商业产品的最适温度为约55。C,并且不适合于在高温进行的过程。Fungamyl样a-淀粉酶当前用于制备糖浆,例如,用于酿造业。明显地,有利的是提供可替换的a-淀粉酶,其具有不同于先前已知的a-淀粉酶的性质,特别是在中性或酸性pH具有高活性的a-淀粉酶。本发明的目的是提供具有a-淀粉酶活性的多肽和编码所述多肽的多核苷3酸。发明概述本发明提供具有a-淀粉酶活性或淀粉结合活性的分离的多肽,所述多肽选自下组(a)多肽,其具有与SEQIDNO:2的氨基酸1至719有至少60%同一性的氛基酸序列;(b)多肽,其由在至少中严紧条件下与以下杂交的核苷酸序列编码(i)SEQIDNO:1的核香酸1至2256,或(ii)(i)的互补《连;和(c)多肽,具有通过一个或多个氨基酸的取代(特別是保守取代)、缺失和/或插入而由SEQIDNO:2的氨基酸1至719得到的氨基酸序列。本发明还涉及分离的多核苷酸,其编码具有a-淀粉酶活性的多肽,所述多核苦酸选自下组(a)多核苷酸,其与SEQIDNO:1的核苦酸97至2256具有至少60%同一性;和(b)多核苷酸,其在中严紧条件下与以下序列杂交(i)SEQIDNO:1的核苷酸97至2256,或(ii)(i)的互补《连。本发明还涉及包含所述多核苦酸的核酸构建体、重组表达载体和重组宿主细月包。本发明还涉及用于产生这些具有a-淀粉酶活性的多肽的方法,其包括(a)在有益于产生该多肽的条件下培养包含核酸构建体的重组宿主细胞,所述核酸构建体包含编码所述多肽的多核苷酸;和(b)回收所述多肽。本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中所述基因与编码信号肽的核普酸序列可操作地连接,该信号肽由SEQIDNO:1的核苷酸1至96组成,其中所述基因对于编码所述信号序列的核苷酸序列是外源的。a-淀粉酶(具有a-淀粉酶活性的多肽)可以用在用于产生麦芽糊精的多种工艺中,包括将淀粉或淀粉水解物与a-淀粉酶一起温育,从而使淀粉或淀粉水解物中的a-l,44建水解。因此,a-淀4分酶可以用于淀;盼工业、食品加工业、纺织业和洗涤剂工业,例如,用于淀粉液化、液化淀粉的糖化、纺织品脱浆、纸和纸浆工业中的淀粉修饰、酿造、乙醇生产和烘培(baking)。a-淀粉酶可以用于产生酶修饰的淀粉衍生物,其中a-淀粉酶用于液化和/或糖化淀粉;用于产生糖浆(例如,高麦芽糖浆),其中a-淀粉酶用于淀粉液化和/或液化淀粉的糖化;用于将纺织品脱浆,其中a-淀粉酶用于处理纺织品;和用于酿造,其中在麦芽汁发酵过程中加入a-淀粉酶;用于乙醇生产,其中a-淀粉酶用于蒸馏醪液中淀4分的液化;和用于将包含a-淀粉酶的面团烘培的工艺。a-淀粉酶可以在淀粉转化过程使用,用于液化和/或糖化;用于在高麦芽糖浆产生过程中液化淀粉;用于纺织品脱浆;用于产生乙醇;用于酿造;和用于烘培。定义a-淀粉酶活性术语"a-淀粉酶活性"在本文中定义为1,4-葡聚糖4-葡聚糖水解酶(l,4-glucan4-glucanohydrolase)(E.C.No.3.2.U)活性,其催化淀粉和其他线性和分支的1,4-糖芬寡糖和多糖的水解。a-淀粉酶测定法如下所述。淀粉结合活性术语"淀粉结合活性"应理解为多肽结合天然淀粉的能力。就本发明而言,淀粉结合活性应理解为淀粉与糖结合模块结合的结合活'l"生^口A.B.Boraston在(Boraston,A.B.等2004.Carbohydrate-bindingmodules:fme-tuningpolysacchariderecognition.Biochem.J.382:769-781)中综述的。分离的多肽术语"分离的多肽"用于本文中指,如通过SDS-PAGE测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。基本上纯的多肽术语"基本上纯的多肽"在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.50/。的与其天然结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最4尤选100°/。纯。本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是"基本上(essentially)纯的形式",即,所述多肽制备物基本上(essentially)不含与其天然结合的其它多肽材料。这能够通过以下方式实现,例如,通过公知的重组方法或由经典纯化方法制备多肽。在本文中,术语"基本上纯的多肽"与术语"分离的多肽"和"分离形式的多肽"同义。同一性参数"同一性"描述两个氨基酸序列之间的相关性。就本发明而言,两个氨基酸序列的比对通过使用来自EMBOSS软件包(http:〃emboss.org)2.8.0版的Needle程序来确定。Needle软件执行Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453中所述的全局比对算法。使用的取代矩阵为BLOSUM62,缺口开放罚分为10,而缺口延伸罚分为0.5。第一和第二氨基酸序列之间的同一性程度如下计算两个序列比对中完全匹配的数目,除以第一或第二序列其中较短者的长度。结果用百分比同一性表示。当两个序列在重叠的相同位置有相同的氨基酸残基时即发生完全匹配。序列的长度是序列中氨基酸残基的数目。就本发明而言,两个核苷酸序列之间的同一性程度通过Wilbur-Lipman方法(Wilbur和Lipman,1983,尸raceW"^q/"」c"^few少y&/e"ceOS^80:726-730)使用LASERGENEMEGALIGNtm軟件(DNASTAR,Inc.,Madison,WI)来确定,使用同一性表和以下多重比对参数缺口罚分10和缺口长度罚分10。配对比对参数是K元组(Ktuple"3,缺口罚分=3,和窗口=20。在一个具体的实施方案中,多肽的氨基酸序列与,或对,SEQIDNO:2的氨基酸1至719的同一性百分比通过下述方式确定i)使用Needle程序比对两个氨基酸序列,用BLOSUM62取代矩阵,缺口开放罚分为10,和缺口延伸罚分为0.5;ii)计算比对中完全匹配的数目;iii)完全匹配的数目除以两个氨基酸序列中最短者的长度,和iv)将iii)的除法结果转换成百分比。对,或与本发明其他序列如SEQIDNO:2的氨基酸1-719的同一性百分比以类似的方法计算。本发明的多肽具有由SEQIDNO:2的氨基酸1至719所示氨基酸序列组成的多肽的a-淀粉酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70。/。,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。多肽片段术语"多肽片段"在本文中定义为从SEQIDNO:2的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,或其同源序列;其中所述片段具有生物活性,如a-淀粉酶活性或淀粉结合活性。等位变体(allelicvariant):术语"等位变体"在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基l拼列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。基本上纯的多核香酸术语"基本上纯的多核香酸"用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程改造的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的其它多核苷酸材料。然而,基本上纯的多核芬酸可以包括天然存在的5'和3,非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苦酸优选为基本上纯的形式。具体而言,优选本文公开的多核苷酸是"基本上(essentially)纯的形式",即,所述多核苷酸制备物基本上不含与其天然结合的其它多核苷酸材料。在本文中,术语"基本上纯的多核苷酸"与术语"分离的多核苷酸"和"分离形式的多核苷酸"同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。核酸构建体术语"核酸构建体"用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段。当所述核酸构建体含有本发明的编码序列表达所需的调控序列时,术语核酸构建体与术语"表达盒"同义。调控序列(controls叫uence):术语"调控序列"在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有组分。每种调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控7序列可提供有用于引入特异性限制位点的接头,所述特异性限制位点促进调控序列与编码多肽的核苷S交序列编码区的连接。可操作地连接术语"可操作地连接"在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置,使得调控序列指导多肽的编码序列的表达。编码序列当用于本文时术语"编码序列"的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始。编码序列可以是DNA、cDNA或重组核苷酸序列。表达术语"表达,,包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语"表达载体"在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞如本文中所使用的术语"宿主细胞"包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体的转化、转染、转导等是易感的(susceptible)。修饰术语"修饰"在本文的意思是,对由SEQIDNO:2的氨基酸l至719组成的多肽的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多个氨基酸侧链的置换。人工变体当用在本文时,术语"人工变体"的意思是具有a-淀粉酶活性的多肽,所述多肽由表达修饰的SEQIDNO:1的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰公开于SEQIDNO:1的核苷酸序列来获得。发明详述a-淀4分酶在第一个方面,本发明涉及具有下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO:2的成熟多肽(即,氨基酸1至719)具有至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或至少97%的同一性程度,所述多肽具有a-淀粉酶活性(下文中的"同源多肽")。在优选的方面,所述同源多肽具有的氨基酸序列与SEQIDNO:2的氨基酸1至719相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO:2的氨基酸序列或其等位变体;或其具有a-淀粉酶活性或淀粉结合活性的片段。在优选的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一个优选方面,多肽包含SEQIDNO:2的氨基酸1至719,或其等位变体;或其具有a-淀粉酶活性的片段。在另一个优选方面,多肽由SEQIDNO:2的氨基酸序列或其等位变体;或其具有a-淀粉酶活性的片段组成。在另一个优选方面,多肽由SEQIDNO:2的氨基酸序列组成。在第二个方面,本发明涉及具有a-淀粉酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交(i)SEQIDNO:1的核苷酸1至2256,(ii)(i)的亚序列,或(iii)(i)或(ii)的互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Mo/ecw/arC7ow/"g,」Z^0rato/7Mawwa/,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:l的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苦酸。此外,所述亚序列可编码具有a-淀粉酶活性或淀粉结合活性的多肽片段。SEQIDNO:1的核苷酸序列或其亚序列,以及SEQIDNO:2的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从多种生物体鉴定和克隆编码具有a-淀粉酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核S交探针是至少100个核苷酸长度。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核香酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长vl是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针包含于本发明中。因而,可从由这些生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有a-淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其它分离技术分离来自这些生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:l或其亚序列同源的克隆或DNA,将所述载体材料用在Sounthern印迹中。就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:l所示的核苷酸序列、它的互补链或其亚序列。可使用X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42°C,在5XSSPE、0.3%SDS、200jug/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的曱酰胺、对于中和中-高严紧性为35%的曱酰胺、或对于高和非常高严紧性为50%的曱酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选至少在45°(3(非常低严紧性),更优选至少在50。C(低严紧性),更优选至少在55。C(中严紧性),更优选至少在60。C(中-高严紧性),甚至更优选至少在65°C(高严紧性),并且最优选至少在70。C(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。在一个具体的实施方案中,使用0.2XSSC、0.2%SDS优选至少在45°C(非常低严紧性),更优选至少在50。C(低严紧性),更优选至少在55。C(中严紧性),更优选至少在60。C(中-高严紧性),甚至更优选至少在65。C(高严紧性),并且最优选至少在70°C(非常高严紧性)进行洗涤。在另一个具体的实施方案中,使用0.1XSSC、0.2%SDS优选至少在45。C(非常低严紧性),更优选至少在50。C(低严紧性),更优选至少在55。C(中严紧性),更优选至少在W。C(中-高严紧性),甚至更优选至少在65。C(高严紧性),并且最优选至少在冗。C(非常高严紧性)进行洗涤。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定10义为在比#4居Bolton和McCarthyi十算法(1962,Pracee^wgso/AeJVo"o"a/JcWe^y0/5We"ces"&448:1390)得出的Tm低大约5。C至大约10。C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1xDenhardt溶液,1mM傳、石舞酸4内(sodiumpyrophosphate),1mM石舞酸二氬4内(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6xSSC加0.1%SDS中洗涤一次15分钟,并用6xSSC在比计算的Tm低5。C至10。C的温度下洗涤两次,每次15分钟。在含盐的杂交条件下,有效的Tm可以控制探针和结合滤膜的DNA之间用于成功杂交所需的同一性程度。可以使用下述公式确定有效的Tm,从而确定在各种严紧性条件下两个DNA杂交所需的同一性程度,从而。有效的Tm=81.5+16.6(logM[Na+])+0.41(%G+C)—0.72(%曱酰胺)(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)SEQIDNO:1的G+C含量为约55%。对于中严紧性,曱酰胺为35%,并且对于5XSSPE的Na+浓度为0.75M。对这些数值应用这一公式,得到有效Tm为76°C。另一个相关的关系是两个DNA之间1。/。的不匹配会将Tm降低1.4°C。为了确定在42。C在中严紧条件下两个DNA杂交所需的同一性程度,使用下述公式%同源性=100—[(有效Tm-杂交温度)/1.4]对数值应用这一公式,在42。C中严紧条件下两个DNA杂交所需的同一性程度为100-[(76-42)/1.4)]=76%。在第三个方面,本发明涉及具有活性的分离的多肽,其由包含SEQIDNO:1的核苷酸97至751的多核苷酸编码,作为唯一的基序。多肽可以提供淀粉水解的下述降解产物除了分子量较高的糊精之外,还有葡萄糖、麦芽糖、麦芽三糖、麦芽四糖、麦芽五糖、麦芽六糖、麦芽七糖。具体而言,可以提供淀粉水解的下述降解产物相似量的葡萄糖(DPl)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),和大量较大的糊精(〉DP10)。多肽的分子量可以约为78kDa。可以如下所述确定淀粉分解活性。pH6.0时a-淀粉酶活性的最适温度为约60°C,37。C时的最适pH为约6.0。多肽可以是人工变体,其具有通过取代(特别是保守取代)、缺失和/或插入一个或多个氨基酸而由SEQIDNO:2的成熟片段得到的氨基酸序列。优选氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;小缺失,通常为l至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端曱硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的'J、延伸(如多组氨酸区(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain))。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和曱硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R丄.Hill,1979,于77ze尸rato'ra,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、AWGly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-7V-曱基赖氨酸、2-氨基异丁酸、异缬氨酸和a-曱基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。"非天然氨基酸"在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合威,并且优选是商业上可获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脱氬月甫氨酸(dehydroproline)、3-和4-甲基脯氨酸,和3,3-二曱基脯氨酸。可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,5We"ce244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,a-淀粉酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J所o/.C7zem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而确定,如通过以下这些技术如核》兹共振、晶体学、电子衍射或光亲和标记,连同推定的4妻触位点氨基酸的突变来确定。参见例如deVos等,1992,Sc/e"ce255:306-312;Smith等,1992,/Mo/.所o/.224:899-904;Wlodaver等,1992,丄e".309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,如由Reidhaar-Olson和Sauer,1988,5W騰e241:53-57;Bowie和Sauer,1989,尸rac.M^/.爿cac/.5W.86:2152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、嗟菌体展示(例如,Lowman等,1991,所oc/^w.30:10832-10837;美国专利号5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,46:145;Ner等,1988,DA^7:127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDNO:2的氨基酸1至719的氨基酸取代、缺失和/或插入的总数可为至多10,至多9,至多8,至多7,至多6,至多5,至多4,至多3,至多2,或者至多1。a-淀粉酶的降解谱由淀粉降解产生的降解产物依赖于降解使用的特定的a-淀粉酶。典型的真菌a-淀粉酶如米曲霉a-淀粉酶产生麦芽糖(DP2)、麦芽三糖(DP3)和麦芽四糖(DP4)作为主要降解产物,剩余大部分较大的糊精(〉DP10)。芽孢杆菌属a-淀粉酶如嗜热脂肪芽孢杆菌a-淀粉酶和地衣芽孢杆菌a-淀粉酶,通常产生葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽五糖(DP5)或麦芽六糖(DP6)作为主要降解产物,仅剩余小部分的较大糊精(〉DP10)。根据本发明的a-淀粉酶产生大约相似量的葡萄糖(DPl)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),使用RI检测估计,剩余大量较大的糊精(〉DP10)。因此,在另一个方面,本发明涉及a-淀粉酶,其降解淀粉提供相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),并剩余大量较大的糊精(〉DP10)。具有(X-淀粉酶活性的多肽的来源本发明的多肽可以获得自任何属的生物体。优选本发明的多肽获得自微生物。就本发明而言,用于本文与给定的来源有关的术语"获得自",意思是由核苷酸序列编码的多肽通过已插入或天然存在本发明的核苷酸序列的生物体产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。多核香酸本发明还涉及分离的多核苷酸,其具有编码本发明的多肽的核苷酸序列。在优选的方面,核苷酸序列示于SEQIDNO:1。在另一个优选方面,核苷酸序列是SEQIDNO:1的成熟多肽编码区。本发明还涵盖编码下述多肽的核苷酸序列,所述多肽具有SEQIDNO:2的氨基酸序列或其成熟多肽;由于遗传密码的简并性,所述核苷酸序列不同于SEQIDNO:1。本发明还涉及SEQIDNO:1的亚序列,所述亚序列编码具有a-淀粉酶活性的SEQIDNO:2的片段。本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQIDNO:l的成熟多肽编码序列中包含至少一个突变,其中所述突变核苷酸序列编码由SEQIDNO:2的氨基酸1至719组成的多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,并包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特征的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PC7:爿GWtietoMef/c^AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。14在本发明中,使用元基因组(metagenomic)技术分离具有SEQIDNO:1中所示的核苷酸序列的多核香酸,即从土壤样本纯化多核苷酸,由纯化的多核苷酸产生多核苷酸库并筛选库以提供包含SEQIDNO:2中所示的核苷酸序列的多核苷酸。因此不知道包含SEQIDNO:1中所示的核苷酸序列的多核苷酸源自哪种生物体。本发明还涉及具有编码下述多肽的核苷酸序列的多核苷酸,所述多肽与SEQIDNO:1的成熟多肽编码序列(即,核香酸97至2256)具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%同一性的同一性程度,所述多核苦酸编码活性多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可能是必需的。术语与所述多肽"基本上相似"指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQII)NO:l的多肽编码区存在的核苷S吏序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苦酸序列编码的多肽的另外的氨基酸序列,但是其符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苦酸取代的概述,参见,例^口,Ford等,1991,尸rafe/w£!xp*as^/ow尸wnycafz'ow2:95-107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性是关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,5We"ce244:1081-1085)来鉴定。在后一的技术中,将突变引入到分子中的每个正电残基处,并且测试所得突变分子的a-淀粉酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构而确定,如通过如核磁共振分析、晶体学或光亲和标记这样的技术来确定(参见,例如,deVos等,1992,5We"ce255:306-312;Smith等,1992,JoMrwa/o/Mo/ecw/ar伤o/ogv224:899-904;Wlodaver等,1992,F五^S丄e/化ra309:59-64)。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交(i)SEQIDNO:1的核苷酸96至2256;或(ii)(i)的互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。本发明还涉及分离的多核苷酸,其通过以下方式获得(a)在中-高、高或非常高严紧条件下,将DNA的群体与以下杂交(i)SEQIDNO:1的核苷酸97至2256,或(ii)(i)的互补链;和(b)分离杂交的多核苷酸,其编码具有a-淀粉酶活性的多肽。元基因组技术在本说明书和权利要求中,术语元基因组意欲表示从包含不同生物体的样本分离的多核苷酸的集合。样本可以是任何已知或疑似包含合适生物体的样本,并且经常从自然环境收集。样本可以是土壤、水、植物材料或疑似包含可能令人感兴趣的多核苷酸的其他材料的样本。当样本已提供有完整基因组材料时,优选使用例如本领域已知的技术,如在(Ausuble等1995"CurrentprotocolsinmolecularbiologyPubl:JohnWileyandsons)中所述方法从样本提取完整的基因组DNA。获得的基因材料代表样本中存在的生物体。当已经制备了元基因组时,可使用元基因组产生元基因组文库,在其中筛选特别令人感兴趣的多核苷酸序列。元基因组文库和DNA的产生和筛选可以使用本领域公知的方法进行。所理解的,已经开发出几种表达载体,其包括XZAP系统,可由Stratagene得到。根据本发明,可以使用公知的a-淀粉酶筛选系统筛选文库,如将文库涂布在含淀粉的琼脂平板上,并且通过所述克隆周围的透明圈鉴定包含编码a-淀粉酶的多肽的克隆。淀粉可以是着色的,便于鉴定阳性克隆周围的透明区域,或者可以在克隆生长后将淀粉染色,所述克隆通过,例如,将涂布有文库克隆的平板置于包含碘蒸汽的室中生长,从而淀粉将着深色,并且透明区容易可见。当已经鉴定了阳性克隆时,可以使用公知的DNA操作技术如(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Mo/ecw/arC7om'"g,爿丄a6orato^yAfo厢a/,第2版,ColdSpringHarbor,NewYork)中所述,进一步表征和操作分离的多核苷酸。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。技术人员应了解的是,在合适的宿主细胞中,包括于适合表达根据本发明的多肽的核酸构建体中的元件依赖于特定选择的宿主细胞。在本发明中,细齒细胞是优选的宿主细胞,并且因此详细描述了根据本发明的适用于细菌细胞中的核酸构建体。然而技术人员应了解的是,其他宿主细胞如真菌细胞、哺乳动物细胞、植物细胞或昆虫细胞也可以根据本发明使用,并且技术人员能够决定哪种元件适合包含于意欲与这些宿主细胞联合使用的核酸构建体中。可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。调控序列可以是合适的启动子序列,其是由用于表达编码本发明多肽的多核苦酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子大肠杆菌/ac操纵子、天蓝色链霉菌(&reptomyc"^》0/^)琼脂糖酶基因(^^4)、枯草芽孢杆菌果聚糖蔗糖酶基因0ac巧、地衣芽孢杆菌a-淀粉酶基因(amy丄)、嗜热脂肪芽孢杆菌产麦芽糖a-淀粉酶基因O^M)、解淀粉芽孢杆菌a-淀粉酶基因Owy0、地衣芽孢杆菌青霉素酶基因(pew尸)、枯草芽孢杆菌矽M和xy/B基因和原核P-内酰胺酶基因(Villa-Kamaroff等,1978,尸raceW"g^o/_/Va//owa/^4ca<i,_yo/5Wewc&st/S/475:3727-3731),以及toc启动子(DeBoer等,1983,尸rac^一o///ze淑/画/Academy5Wewces80:21-25)。另夕卜的启动子在"Usefulproteinsfromrecombinantbacteria"于5b/ew打yc爿wen'ca",1980,242:74-94中;和在Sambrook等,1989,见上文中有所描述。在优选的方面,启动子是由来自下述基因的启动子组成的启动子系统地衣芽孢杆菌a-淀粉酶基因(amy丄)、解淀粉芽孢杆菌a-淀粉酶基因(amy0和包含稳定化序列的苏云金芽孢杆菌C7//"启动子,如WO99/43835中所述。调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3'末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5,-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相联的氨基酸序列,并且指导编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列5,端可固有地包含信号肽编码区,其与编码分泌多肽的编码区的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5'端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地替代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码区可在本发明中使用。对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区芽孢杆菌属NCIB11837产麦芽糖a-淀粉酶、嗜热脂肪芽孢杆菌a-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌|3-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(";^r,w;^S,wpWW)和枯草芽孢杆菌jW""。另外的信号脉由Simonen和Palva,1993,7kf/craZ/o/og/ca/Aev/ems57:109-137描述。调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基S交序列。所得多盧称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(a/^;)、18枯草芽孢杆菌中性蛋白酶(w;^7)、酿酒酵母a因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO95/33836)的基因获得前肽编码区。当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(nextto)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应于化学或物理剌激,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括/ac、toc和/^操纵基因系统。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。上述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在合适的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苦酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与合适的表达调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposes)。本发明的载体优选地含有一个或多个选择性标记,其允许简单选择经转化的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。条件必需基因可以作为非抗生素选择性标记起作用。细菌条件必需非抗生素选择性标记的非限制性实例是来自枯草芽孢杆菌、地衣芽孢杆菌或其他芽孢杆菌的tfo/基因,其仅在缺少D-丙氨酸的条件下培养细菌时是必需的。当细胞在半乳糖存在的情况下或在能引起半乳糖存在的培养基中生长时,编码参与UDP-半乳糖的转换(turnover)的酶的基因也可以在细胞中作为条件必需标记起作用。这类基因的非限制性实例是来自枯草芽孢杆菌或地衣芽孢杆菌的编码UTP-依赖型磷酸化酶(EC2.7.7.10)、UDP-葡萄糖-依赖型脲芬酰转移酶(EC2.7.7.12)或UDP-半乳糖差向异构酶(EC5丄3.2)的那些。芽孢杆菌的木糖异构酶基因如砂"也可以用作在以木糖作为唯一碳源在基本培养基中生长的细胞中的选择性标记。利用葡萄糖酸所需的基因,gnW和g"/尸也可以用作以葡萄糖酸作为唯一碳源在基本培养基中生长的细胞中的选择性标记。条件必需基因的其他实例在本领域中已知。抗生素选择性标记可以赋予对这些抗生素的抗生素抗性,所述抗生素如氨千青霉素、卡那霉素、氯霉素、红霉素、四环素、新霉素、潮霉素或曱氨蝶呤。本发明的载体优选含有元件,其允许载体整合入宿主细胞的基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语"复制起点"或"质粒复制子"在本文定义为能够使质粒或载体在体内复制的核苷酸序列。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMBl的复制起点。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括在多核苷酸中,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增的拷贝,并且由此含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。宿主细胞本发明还涉及重组宿主细胞,所述重组宿主细胞包含本发明的多核苷酸,将其有利地用于多肽的重组产生中。将包含本发明多核苷酸的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomalintegrant)或作为前述的自复制的染色体外载体。术语"宿主细胞"包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例:^,真4亥生物。有用的单细胞微生物是细菌细胞,例如革兰氏阳性细菌,包括但不限于,芽孢杆菌属细胞,例如,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌(^^7/wc/aww7)、凝结芽孢杆菌、灿烂芽孢杆菌、迟緩芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌;或链霉菌属细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌例如大肠杆菌和假单胞菌属菌种。在优选的方面,细菌宿主细胞是迟緩芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的方面,芽孢杆菌属细胞是嗜碱的芽孢杆菌属。可通过如下方法实现将载体导入细菌宿主细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,Afo/ecw/wGe"era/Ge"e/Zcs168:111-115),4吏用感受态细月包(参见,例如,Young和Spizizen,1961,Jowma/o/5a"en'o/ogy81:823-829或Dubnau和Davidoff-Abelson,1971,Jow謂/o/Mo/腦/ar肠/ogy56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Aoto^m々way6:742-751)或接合(参见,例如,Koehler和Thome,1987,Jowwa/5a"en'o/ogy21169:5771-5278)。宿主细胞还可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。在优选的方面,宿主细胞是真菌细胞。"真菌"用在本文包括以下门子囊菌门(Ascomycota)、4旦子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于爿!.mw0W/2朋t/BZsfey》Z)/c/7.o"a/"yT7zeFw"g7',第8版,1995,CABInternational,UniversityPress,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfongi)(Hawksworth等,1995,见上文)。在更优选的方面,真菌宿主细胞是酵母细胞。"酵母"用在本文包括产子嚢酵.母(ascosporogenousyeast)(内孑包霉目(Endomycetales))、产4a子酵母(basidiosporogenousyeast)禾口属于半^口菌类(FungiImperfecti)(芽孑包纟冈(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如历o/ogyJc//W/7'&so/Ife"W(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.编,5bc.^/.5acfeWo/.Syw/as7'wmiSen'&sNo.9,1980)中所述。在甚至更加优选的方面,酵母宿主细胞是4支丝酵母属、汉逊酵母属(//araewM/a)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或耶氏酵母属细月包。在最优选的方面,酵母宿主细胞是卡尔酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁弗酵母,诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(幻wj/veramycas/acto)细胞。在另一个最优选的方面,酵母宿主细胞是解脂耶氏酵母(7"mw/a印o/,'ca)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。"丝状真菌,,包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属CSyeAa"t/era)、拟蜡菌属(CeWpon'o戸&)、鬼伞属(Opn'"w力、革盖菌属(Con'o/w)、隐球菌属、Fz7oZ)osWmw、镰孢属、腐质霉属、梨孢菌属(M3g"apwt/2e)、毛霉属、毁丝霉属、新考玛脂霉属(iVeoca肌wa幼'x)、脉孢菌属、拟青霉属、青霉属、平革菌属(尸/2a/7erac/2"ete)、射脉菌属(尸/2/eZ7/")、瘤胃壶菌属(尸/raw;/cM)、侧耳属(户/wra^s)、裂褶菌属、踝节菌属、嗜热子嚢菌属、梭孢壳属、弯颈霉属(ro/yjwc/at^m)、栓菌属(rramete)或木霉属细胞。在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另外的最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圓镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(场'e^a^fera^/wto)、干拟蜡菌(Or—"'o/w7'sa"ezW"a)、干拟错菌、Cer—".o/w/scflreg/ea、浅黄拟错菌纟工扣乂错菌(Cen)on'o/w^s、或虫#以错菌(Cen^on'o/w7'ssw6verm/5por")、灰盖鬼伞(Co/n'm^cz'"ereu)、毛革盖菌(Cw7'o/ms/2/raw似力、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌CP/zawerac/^etec/^sc^;on'Mw)、辐射射月永菌(尸/z/e6/ara<i/ato)、刺芽侧耳(/Ve,加e,gz7)、土生梭孑包霉、长織松菌(rra,tes1v/〃asa)、变色松菌(rrawe/asvera/co/w)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,iVoceW,o/AeTVa/Zowa/Academy>SWewces"&481:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,G麼78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母Becker和Guarente,于Abelson,J.N.和Simon,M.I.Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,/owtg(/o/Ba"en.o/ogy153:163;和Hinnen等,1978,尸raceW"gso/7Va"'owa/爿co(i證yo/Sc/e"c&y75:1920。最优选的宿主细胞是细菌细胞如属于芽孢杆菌属的革兰氏阳性细菌。23产生方法
技术领域
:本发明还涉及用于产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。优选地,所述细胞是芽孢杆菌属的细胞,并且更优选地,所述细胞是枯草芽孢杆菌的细胞。本发明还涉及用于产生本发明的多肽的方法,其包括(a)在有益于产生多肽的条件下培养宿主细胞;和(b)回收所述多肽。本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于产生多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDNO:l的成熟多肽编码区中具有至少一个突变,其中所述突变核苦酸序列编码由SEQIDNO:2的氨基酸1至719组成的多肽,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以-使用本领域已知的方法回收。例如,多肽可以通过常M^方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括-f旦不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或4是取(参见,例如,尸wnyco^'o";J.-C.Janson和LarsRyden编,VCHPublishers,NewYork,1989)。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语"富含"表示所述组合物的a-淀粉酶活性增加,例如,以至少1.1的富集因数(enrichmentfactor)增加。所述组合物可以包含本发明的多肽作为主要酶组分,例如,单组分组合物。或者,所述组合物可以包含多种酶活性,如氨肽酶、a-淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、a-半乳糖苷酶、|3-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、(3-葡糖普酶、卣素过氧化酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或孩i粒(microgranulate)的形式。可以将包括于所述组合物中的多肽依照本领域内已知方法稳、定。以下提供的实施例是本发明多肽组合物的优选的用途。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。用途ot-淀粉酶可以用于产生麦芽糊精,包括在合适的条件下将淀粉或淀粉水解物与a-淀粉酶一起温育以水解淀粉或淀粉水解物中的a-l,4键。麦芽糊精可以是线性或有支链的,并且可以包括葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP"、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DPQ和麦芽七糖(DP7)。可以通过如下方式制备麦芽糊精在热稳定的a-淀粉酶存在的情况下液化(部分水解)淀粉,然后在本发明的a-淀粉酶存在的情况下,在适于切割a-(l,4)糖苷键的条件下将液化淀粉糖化(进一步水解)。可以处理非常高的淀粉浓度,例如30%至40%干-固体。液化可以包括在约105。C初步水解约五分钟,然后在85。C至90。C的温度温育约一小时,以得到10至15的右旋糖当量(D.E.)。用本发明的a-淀粉酶进行的糖化可以在pH5-6.5和50-70。C进行24-72小时,优选36-48小时。用本发明的a-淀粉酶进4亍的糖化可以在比用常规真菌淀粉酶糖化时更高的温度和更低的pH进行。本发明的a-淀粉酶还可以用于淀粉转化、醇生产、酿造和烘培。麦芽糖浆的产生可以包括以下步骤l)在a-淀粉酶存在的情况下液化淀粉;2)在本发明的a-淀粉酶存在的情况下糊精化;和3)回收所述糖浆;和任选地纯化糖浆。步骤l)中用于液化的a-淀粉酶可以是任何a-淀粉酶。优选的a-淀粉酶是芽孢杆菌属a-淀粉酶,如Termamyl-样a-淀粉酶,包括地衣芽孢杆菌a-淀粉酶(作为TermamyFM商业上可得到(Novozymes)),解淀粉芽孢杆菌a-淀粉酶(作为BAN销售(Novozymes)),嗜热解脂肪芽孢杆菌a-淀粉酶(作为S型TermamylTM120L销售),源自芽孢杆菌属菌种NCIB12289、NCIB12512、NCIB12513或DSM9375的菌抹的a-淀粉酶,所有上述菌4朱均在WO95/26397中详细描述,和由Tsukamoto等,BiochemicalandBiophysicalResearchCommunications,151(1988),pp.25-31描述的a-淀粉酶。"Termamyl-样a-淀粉酶"的定义中的a-淀粉酶在例如WO96/23874(Novozymes)中限定。在另一个方面,本发明涉及产生麦芽糖的方法,包括下述步骤l)在140-160。C在pH4-6液化淀粉;2)在60-95。C,特别是65-85。C,如70-80°C,在pH4-6,在本发明的真菌a-淀粉酶变体存在的情况下糊精化;和3)回收所述糖浆;和任选地纯化所述糖浆。在本发明的一个实施方案中,在步骤(2)中加入有效量的葡糖淀粉酶。在这个实施方案(包括用葡糖淀粉酶处理)中的糖浆不是麦芽糖浆,而是具有不同糖谱(sugarprofile)的糖浆。葡糖淀粉酶可以是曲霉属葡糖淀粉酶,具体为黑曲霉葡糖淀粉酶。或者,方法包含下述步骤1)在95-110。C在pH4-6,在芽孢杆菌属a-淀粉酶存在的情况下液化淀粉;2)在70-95。C在pH4-6,在本发明的a-淀粉酶存在的情况下液化,然后回收和/或任选地纯化获得的产物。最后,本发明的一些方面涉及多种洗涤剂用途。一个方面涉及包含本发明的a-淀粉酶的洗涤添加剂,任选地为无粉尘颗粒、稳定化液体或受保护的酶的形式。这个方面的优选实施方案涉及包含0.02-200mg酶蛋白质/g添加剂的洗涤添加剂。另一个优选的实施方案涉及根据先前方面的洗涤添加剂,其额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。另一个方面涉及包含本发明a-淀粉酶的洗涤组合物,并且这个方面的优选实施方案涉及洗涤组合物,其额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。另一个方面涉及包含本发明的a-淀粉酶的手动或自动洗碗洗涤剂组合物。优选的洗^宛洗涤剂组合物额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。最后一个洗涤剂相关方面是包含本发明的a-淀粉酶的手动或自动洗衣组合物。根据本发明优选的洗衣组合物额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、淀粉分解酶和/或纤维素酶。淀粉结合域本发明还涉及包含编码蛋白质的基因的核酸构建体,所述基因与由编码具有淀粉结合活性的多肽的SEQIDNO:1的片段组成的核苷酸序列可操作连接,其中所述基因对于SEQIDNO:1是外源的。本发明还涉及包含这些核酸构建体的重组表达载体和重组宿主细胞。本发明还涉及用于产生蛋白质的方法,其包括(a)在适于产生所述蛋白质的条件下培养这种重组宿主细胞;和(b)回收所述蛋白质。核苷酸序列可以单独地以调控序列与外源基因可操作地连接(operablylinkedtoforeigngenesindividuallywithcontrolsequences),^口上文戶斤述。所述蛋白质对于宿主细胞可以是天然的或异源的。术语"蛋白质"在本文的意思不是指特定长度的编码产物,并且因此涵盖肽、寡肽和蛋白质。术语"蛋白质"还涵盖组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一种或多种蛋白质对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质的天然存在的等位基因变异和工程改造的变异。27优选地,蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报道蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、ot-淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、a-半乳糖香酶、卩-半乳糖苷酶、葡糖淀粉酶、(x-葡糖苷酶、P-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以从任何原核、真核或其它来源获得。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。淀粉酶试验二硝基水杨酸法就本发明而言,可以使用二硝基水杨酸法测定a-淀粉酶活性,所述方法为由Miller,G丄.在(Miller,G.L.1959.Useofdinitrosalicylicacidfordeterminationofreducingsugar.Anal.Chem.31:426428.)中描述的用于测定还原糖的方法。PNP-G7方法或者,可以通过使用PNP-G7为底物的方法测定a-淀粉酶活性。PNP-G7(对硝基苯基-a,D-麦芽庚糖香)是封闭的(blocked)寡糖,其能被内切淀粉酶切割。切割后,试剂盒中包括的a-葡糖苷酶消化底物以释放游离的PNP分子,PNP分子为黄色,因此能在1=405nm.(400-420nm.)处通过可见光分光光度法测定。包含PNP-G7底物和a-葡糖苷酶的试剂盒可以从Boehringer-Mannheim获得(目录号1054635)。为了制备底物,向5ml緩冲液(BM1442309)中加入一并瓦底物(BM1442309)。为了制备a-葡糖苷酶,向45ml緩冲液(BM1442309)中加入一瓶a-葡糖苷酶(BM1462309)。通过将5mla-葡糖苷酶溶液与1ml底物混合制成工作溶液。通过将20pi酶溶液转移至96孔微量滴定板并在25。C温育而进行试验。在25。C加入200(il工作溶液。将溶液混合并预温育1分钟,在3分钟内在OD405nm每15秒钟测定吸收。依赖时间的吸收曲线的斜率与指定条件组下的所述a-淀粉酶的比活性(活性每mg酶)成正比。实施例用作緩冲液和底物的化学品都是至少试剂级的商业产品。使用Phadebas试-睑测定a-淀4分酶活性通过使用Phadebas⑧片为底物的方法测定a-淀粉酶活性。Phadebas片(Phadebasa-淀粉酶测试,由PharmaciaDiagnostic提供)包含交联的不可溶蓝色淀粉聚合物,其已经与牛血清白蛋白和緩沖液物质混合并制成片剂。对于每次单独的测试,将一片悬浮于包含5ml50mMBritton-Robinson緩沖液(50mM乙酸,50mM磷酸,50mM硼酸,0,1mMCaCl2,用NaOH将pH调至感兴趣的数值)的试管中。在感兴趣的温度,在水浴中进行测试。将待测试的a-淀粉酶用xml50mMBritton-Robinson緩冲液稀释。向5ml50mMBritton-Robinson緩冲液中加入1ml这种a-淀粉酶溶液。由a-淀粉酶水解淀粉产生可溶的蓝色片段。在620nm处用分光光度计测定获得的蓝色溶液的吸光度,所述吸光度是a-淀粉酶活性的函数。重要的是,在温育10或15分钟(测试时间)后测定的620nm吸光度于620nm在0.2至2.0吸光度单位的范围内。在此吸光度范围中,活性和吸光度之间有线性(Lambert-Beer定律)。因此必须调整酶的稀释度(dilution)使其符合此标准。在特定的条件组(温度、pH、反应时间、緩冲液条件)下,lmg给定的a-淀粉酶将水解一定量的底物,并产生蓝色。在620nm测定颜色强度。测得的吸光度与给定条件组下所述a-淀粉酶的比活性(活性/mg纯a-淀粉酶蛋白质)成正比。培养基与溶液除非另外指出,限制性内切酶和其他用于DNA操作的酶由(供应商)提供,并且#4居制造商的说明-使用。实施例1:序列SEQIDNO:1的鉴定A.基因组文库构建从Denmark,Sandbjerg中的地点采集含沙土壤(sandysoil)样本。将土壤样本巴氏杀菌并用橄榄油富集(oliveoilenriched)。通过使用标准分子生物学技术(Ausuble等1995"CurrentprotocolsinmolecularbiologyPubl:JohnWileyandsons)从这一富集培养物中制备染色体DNA。用限制性内切酶Mbol部分切割制备的DNA,并通过超速离心在蔗糖梯度中分离。提取3至10kb的片段,沉淀并重悬于合适的緩沖液中。通过^f吏用StratageneZAPExpressTM予贞消^化的载体试剂盒和StratageneZAPExpressTM预消化的Gigapack⑧克隆试剂盒(用BamHI预消化)(StratageneInc.,USA),根据销售方的说明/推荐,制备基因组文库。得到的lambdaZAP文库包含200pfU/ul,收集其中的100,000pfu用于大量剪切(massexcision)。将得到的41,900,000cfli/ul大肠杆菌菌落汇集,并通过使用QiagenSpin微量制备试剂盒(Qiagen,德国)制备质粒。B.文库筛选将约100,000个文库克隆均匀地涂布在包含用Cibachron红染色的支链淀粉(1%,重量百分比)、LB琼脂和卡那霉素(25微克/ml)的平板上。在37。C过夜温育后,通过菌落周围指示分泌淀粉降解酶的透明区(clearingzone)来鉴定阳性克隆。鉴定出这个文库中的一个阳性克隆(pSBL0622-2),通过如下^r证这个克隆胞外产生淀粉降解酶使克隆在包含卡那霉素(25微克/ml)和1%(重量百分比)马铃薯淀粉(Sigma,S-2630)的LB平板上过夜生长,然后将淀粉进行碘蒸汽染色,当淀粉降解时,其在菌落周围指示透明区。此外,在SDS-Page凝胶上计算的分子量(78kDa)的条带对应于来自SEQIDNO:2位置1-719的成熟多肽的的计算的分子量,其指示了酶的表达。仅筛选宿主(大肠杆菌DH10B)本身不显示这个蛋白质条带。根据制造商的推荐,通过使用Qiagen质粒制备试剂盒,制备活性克隆的质粒。C.基因的分析使用载体中具有退火位点的T3和T7测序引物,通过Sanger测序由质粒获得基因序列,根据获得的序列设计定制的测序引物,如SEQIDNO:3-8中所示。.本发明编码a-淀粉酶的完整DNA序列如SEQIDNO:1中所示,推定的30氨基酸序列如SEQIDNO:2中所示,并且鉴定了信号肽。分析推定的氨基酸序列,全长多肽显示包括下述序列的域结构能划分为糖基水解酶家族13亚家族2的成员的a-淀粉酶蛋白质序列(MarkR.Stam等,"Dividingthelargeglycosidehydrolasefamily13intosubfamilies:towardsimprovedfunctionalannotationsofa-alpha-amylase-relatedproteins",ProteinEngineering,Design&Selectionvol.19no.12pp.555-562,2006)并且包含N誦端信号肽序列,GH13—2域,a-淀粉酶C-端域(Pfam登录号PF02806)和糖结合域(CBM)20(PfamPF00686)。实施例2:枯草芽孢杆菌中a-淀粉酶的克隆通过PCR融合来自地衣芽孢杆菌的a-淀粉酶(AmyL)的信号肽,使其符合编码a-淀粉酶的基因的阅读框。通过同源重组,将编码获得的编码序列的DNA整合到枯草芽孢杆菌宿主细胞基因组上。在三启动子系统(如WO99/43835中所述)的控制下表达基因构建体,所述系统由来自地衣芽孢杆菌a-淀粉酶基因(amyL)的启动子、来自解淀粉芽孢杆菌a-淀粉酶基因(amyQ)的启动子和包括稳定化序列的苏云金芽孢杆菌cryIIIA启动子组成。使用编码氯霉素乙酰專争移酶的基因作为才示i己(在例3口Diderichsen等,Ausefulcloningvectorforto/肠s由iPlasmid,30,p.312,1993中描述)。选捧十个具有氯霉素抗性的转化体,在大豆基培养基(soybasedmedia)中的4mL培养物中在37。C生长3天,并将20微升上清液点样在包含cibachron-乡f标记支链淀粉的琼脂平板上。选择一个这样的克隆,通过DNA测序分析来一睑i正构建体的DNA序列正确。在旋转摇床上,在300mL带挡板的锥形瓶中进行a-淀粉酶表达克隆的发酵,每瓶包含补加34mg/1氯霉素的100mL大豆基培养基。在37。C将克隆发酵4天。使用色语,在苯基琼脂糖柱上从上清液纯化酶,然后使用盐梯度,在Q琼脂糖柱上洗脱。汇集物(pool)的吸收值为A280=0.79和A260=0.43,并且纯化的淀粉酶为12%SDS-PAGE凝胶上的主要条带。在实施例4、5和6中使用纯化的酶。实施例3:a-淀粉酶活性的检测A.使用二硝基水杨酸的试验通过使用二硝基水杨酸方法进行淀粉分解活性的确定,所述方法为测定还原冲唐的方'法.(Miller,G.L.1959.Useofdinitrosalicylicacidfordeterminationofreducingsugar.Anal.Chem.31:426-428.)。B.用酶谱;险测通过加入三氯乙酸至终浓度10%,然后在冰浴中温育30分钟并在13,000xg离心5分钟,将来自携带a-淀粉酶基因(SEQIDNO:l)的表达克隆(实施例2)的两百微升培养物上清液沉淀。去除上清液,并在10%SDS-PAGE凝胶上对样品(50jiiL)进行大小排阻。在室温在包含100mMTrispH8和5mMCaCl2的2.5%TritonX-100中洗涤凝胶,然后在室温在1%Paselli淀粉(Avebe,Netherlands)、100mMTrispH8和5mMCaCl2中温育30分钟。用Lugol溶液(溶于100mL水中的0.15gl2,1.5gKI)将凝胶染色10秒钟,并用过量水将剩余的Lugol溶液洗去。携带a-淀粉酶基因(SEQIDNO:2)的表达克隆的SDS-PAGE和酶谱(zymogram)指示了期望大小(78kDa)的蛋白质条带和透明区。实施例4:N-端N-端序列测定为ASGQSLGPVT(SEQIDNO:2中的位置1至10)。实施例5:最适pH与最适温度通过37。C在调至从pH2.0至pH9.0的不同pH值的緩冲液中运行Phadebas试验,来进行关于最适pH的实验。发现酶的最适pH为约pH6。相似地,在pH6,通过在从30。C至80。C的温度运行Phadebas试验,来进行关于最适温度的实验。发现酶的最适温度为约60°C。实施例6:淀粉降解谱对制备于50mM乙酸緩冲液,1mMCaCl2,pH6.0(煮沸3分钟以溶解淀粉)中的5%(重量百分比)蜡质玉米淀粉(waxycornstarch)(Cerestar蜡质玉蜀黍0401)进行淀粉降解谱分析。以0.2mg酶/g干物质的量,向1ml底物加入如实施例2所制备的纯化的酶,并将混合物在50。C温育24小时。加入一滴浓HC1,并将样品在IO(TC温育15分钟使酶失活。通过0.22微米滤器过滤样品,并使用BIO-RADAminexHPX-42A柱(Cat.nr.125-0097),与1套BIO匿RADMicro-GuardDeashingcartridge(脱灰筒)(目录号125-0118)相适合的BIO-RADDeashingHolder(支持器)(Cat.nr.125-0139),在WatersHPLC系统上进行分析,用两次脱气的蒸馏水洗脱并使用WatersRI检测器4全测。使用RI检测评价,降解谱显示大约相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),并剩余大量的(substantialamount)较大的糊精(〉DP10)。权利要求1.具有α-淀粉酶活性的分离的多肽,其选自下组(a)多肽,其具有与SEQIDNO2的氨基酸1至719有至少65%同一性的氨基酸序列;(b)多肽,其由在低严紧条件下与以下序列杂交的多核苷酸编码(i)SEQIDNO1的核苷酸97至2256,或(ii)(i)的互补链;和(c)多肽,其具有通过取代(特别是保守取代)、缺失和/或插入一个或多个氨基酸而由SEQIDNO2的氨基酸1至719得到的氨基酸序列。2.权利要求1的多肽,其具有与SEQIDNO:2的氨基酸1至719有至少95%同一性的氨基酸序列。3.权利要求1或2的多肽,其具有包含SEQIDNO:2的氨基S臾1至719或由SEQIDNO:2的氨基酸1至719组成的氨基酸序列。4.分离的多核苷酸,其包含编码权利要求1-3中任一项的多肽的核苷酸序列。5.分离的多核苷酸,其编码具有a-淀粉酶活性的多肽,所述多核苷酸选自下组a)多核苷酸,其与下述核苷S交序列具有至少60%同一性(i)SEQIDNO:1的核芬酸97至2256,或(ii)(i)的互补《连;和b)多核苷酸,其在中严紧条件下与以下序列杂交(i)SEQIDNO:1的核芬酸97至2256,或(ii)(i)的互补链。6.核酸构建体,其包含权利要求4或5的多核苷酸,所述多核苷酸与指导所述多肽在表达宿主中产生的一个或多个调控序列可操作地连接。7.重组表达载体,其包含权利要求6的核酸构建体。8.重组宿主细胞,其包含权利要求6的核酸构建体或权利要求7的载体。9.用于产生权利要求1-3中任一项的多肽的方法,其包括(a)在有益于所述多肽产生的条件下培养权利要求8的重组宿主细胞;和(b)回收所述多肽。10.权利要求1-3中任一项的多肽用于淀粉液化、纺织品脱浆、纸和纸浆工业中的淀粉修饰,用于酿造、乙醇生产或烘培的用途。11.用于产生麦芽糊精的方法,其包括将淀粉或淀粉水解物与权利要求1-3中任一项的多肽一起温育,从而水解淀粉或淀粉水解物中的a-l,4键。全文摘要本发明涉及具有α-淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。文档编号C12N9/28GK101600794SQ200880003832公开日2009年12月9日申请日期2008年1月31日优先权日2007年2月1日发明者安德斯·维克索-尼尔森,马丁·伯彻特申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1