具有蛋白酶活性的多肽和编码该多肽的多核苷酸的制作方法

文档序号:571188阅读:558来源:国知局

专利名称::具有蛋白酶活性的多肽和编码该多肽的多核苷酸的制作方法
技术领域
:本发明涉及具有蛋白酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及用于产生和使用所述多肽的方法。
背景技术
:本发明的目的是提供具有蛋白酶活性的多肽和编码所述多肽的多核苷酸。在洗涤剂工业中,酶运用于洗涤配方中已经超过30年。在这些配方中使用的酶包括蛋白酶、脂肪酶、淀粉酶、纤维素酶、甘露糖苷酶以及其它的酶或它们的混合物。商业上最重要的酶是蛋白酶。WO89/06270(NovozymesA/S)公开了一种洗涤剂组合物,其包含底物特异性窄的蛋白酶,即能够切割赖氨酸或精氨酸的C末端侧肽键的胰蛋白酶样蛋白酶。进一步地,WO9V25583公开了克隆编码镰孢属(Fusarium)胰蛋白酶样蛋白酶的DNA序列和从所述DNA序列获得活性胰蛋白酶样蛋白酶的表达。然而,尽管描述了许多有用的蛋白酶和蛋白酶变体,但是仍需要进一步改善用于多种工业用途的蛋白酶或蛋白酶变体。具体而言,在通常的洗涤剂组合物的其它组分存在下保持高活性的问题有使蛋白酶的性能降低的趋势。因此,本发明的目的是提供新的蛋白酶,其适用于洗涤剂中,所述洗涤剂用于例如衣物和/或硬表面的清洁。真菌,并且特别是丝状真菌在商业上广泛地使用,是因为它们分泌非常高水平的蛋白质的能力。在丝状真菌中,属于曲霉属(genusAspergillus)的真菌菌种具有很长的用于产生内源和异源蛋白的商业使用史。蛋白质产生所用的大多数微生物的一个缺点是固有产生的蛋白酶可能使目标蛋白质产物因蛋白水解而降解。设想了多种避免这点的方法。在各解决方法中,提议了缺失或破坏编码多种蛋白酶的基因。WO2006/110677公开了属于菌种黑曲霉(Aspergilusniger)的重组真菌宿主细胞,其中失活了染色体基因derA、derB、htmA、mnn9、mnnlO、ochA、ρ印Aa、ρ印Ab、ρ印Ac、ρ印Ad、ρ印F和组合以降低对异源产生蛋白质的降解。遗憾的是,一些真菌产生很多种不同的蛋白酶。因此持续需要不展现蛋白酶产生或展现非常低水平的蛋白酶产生的丝状真菌菌株。
发明内容本发明涉及分离的蛋白酶,其具有与SEQIDNO:5的氨基酸2-148具有至少95%同一性的氨基酸序列。本发明还涉及用于产生这样的具有蛋白酶活性的多肽的方法,其包括(a)在有益于产生所述多肽的条件下培养包含核酸构建体的重组宿主细胞,所述核酸构建体包含编码所述多肽的多核苷酸;和(b)回收所述多肽。本发明还涉及清洁或洗涤剂组合物,优选洗衣或洗碗组合物,所述组合物包含本发明的蛋白酶。本发明进一步的方面涉及本发明的蛋白酶在清洁或洗涤剂组合物中的用途;用于清洁或洗涤硬表面或衣物的方法,包括将所述硬表面或衣物与本发明的组合物接触。本发明还涉及真菌,其经修饰而将本发明的蛋白酶的表达与相应的未经修饰的真菌相比降低或完全消除。优选地,所述修饰使用重组DNA技术进行。由此本发明进一步涉及用于产生这样的真菌的方法,其通过缺失至少部分编码具有蛋白酶活性的多肽的多核苷酸来获得,所述多核苷酸选自下组(a)多核苷酸,其编码具有与SEQIDNO:5的氨基酸2_148具有至少60%,如至少65%,如至少70%,如至少75%,如至少80%,如至少85%,如至少90%,如至少95%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%,如至少99.5%同一性的氨基酸序列的多肽;(b)多核苷酸,其在至少中严紧条件下与SEQIDNO4的核苷酸1_515或其互补链杂交。这可以通过这样的方法获得,所述方法包括i)从目标真菌克隆编码具有蛋白酶活性的多肽的多核苷酸,所述多核苷酸选自下组(a)多核苷酸,其编码具有与SEQIDNO:5的氨基酸2_148具有至少60%,如至少65%,如至少70%,如至少75%,如至少80%,如至少85%,如至少90%,如至少95%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%,如至少99.5%同一性的氨基酸序列的多肽;(b)多核苷酸,其在至少中严紧条件下与SEQIDNO4的核苷酸1_515或其互补链杂交;ii)产生包含i)中克隆的多核苷酸的DNA构建体,其中已取代、缺失了内在部分或已插入了额外的DNA,iii)用所述构建体转化所述的真菌,和iv)分离转化体,其与未经修饰的真菌的表达量相比,表达本发明蛋白酶的量减少。进一步地,本发明还涉及用于产生真菌的方法,与未经修饰的亲本真菌相比在所述真菌中已将本发明蛋白酶的表达降低,其中使用公知的反义技术降低表达,通过构建在引入所述真菌时导致RNA分子合成的载体进行,所述RNA分子与从编码具有蛋白酶活性的多肽的多核苷酸转录的mRNA互补,所述多核苷酸选自下组(a)多核苷酸,其编码具有与SEQIDNO:5的氨基酸2_148具有至少60%,如至少65%,如至少70%,如至少75%,如至少80%,如至少85%,如至少90%,如至少95%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%,如至少99.5%同一性的氨基酸序列的多肽;(b)多核苷酸,其在至少中严紧条件下与SEQIDNO4的核苷酸1_515或其互补链杂交。本发明还涉及意欲用于上述方法中的DNA构建体。本发明还涉及产生期望的蛋白质或基因产物(特别是分泌的蛋白)的方法,其中将经修饰并任选用至少包含编码目标蛋白质或基因产物的DNA序列的DNA构建体转化的真菌宿主在合适的培养基中在适合的条件下培养,和回收并纯化所述期望的基因产物。当进行本发明的工作时,惊讶地发现本发明的真菌以大大改进的产率产生这些分泌的蛋白。具体而言,发现本发明的多肽看起来负责从包含催化部分和CBM(糖结合模块)的多肽切割CBM,并且降低了本发明多肽表达的宿主细胞与未降低本发明多肽表达的相同宿主细胞相比发生更少的CBM切割。因此本发明的另一方面涉及用于产生包含多肽的蛋白质产物的方法,所述多肽包含两个或更多个结构域,其中一个结构域是糖结合模块,其中所述方法包括步骤a)发酵根据权利要求1-2中任一项的多肽的表达降低的细胞,所述细胞产生所述包含两个或更多个结构域的多肽,和b)回收所述产物。进一步地,本发明还涉及用于产生基本上不含本发明多肽的蛋白酶活性的蛋白质产物的方法,如包括以下步骤的方法a)发酵表达根据权利要求1-8中任一项的多肽和目标蛋白质产物的细胞,b)在发酵之前、发酵期间或在发酵完成之后向发酵液加入能够抑制本发明多肽的蛋白酶活性的试剂,和c)从发酵液回收目标产物。或包括以下步骤的方法a)在允许所述蛋白质产物表达的条件下培养细胞,b)对所述培养物进行组合的pH和温度处理,和c)回收所述产物。附图简述图1显示SDS-PAGE凝胶,其显示本发明的纯化的19kDa蛋白酶,如实施例1中所述。图2显示黑曲霉19kDa蛋白酶的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO4和5)。图3显示用包含本发明的多核苷酸的表达质粒转化的米曲霉的凝胶渗透层析。图4显示加样有图3中公开的凝胶渗透层析的所选级分的SDS-PAGE凝胶。图5显示具有SEQIDNO3的蛋白酶的pH曲线。定义5蛋白酶活性术语“蛋白酶活性”在本文定义为蛋白水解活性,其催化肽中连接两个氨基酸的肽键的水解。就本发明而言,蛋白酶活性是根据由S.Ishiura,等,FEBSLett,.189,119(1985)]描述的方法测定的。将1单位蛋白酶活性定义为在37°C,pH6.7每分钟从底物Suc-LLVY-MCA(可在P印tideInc.(日本大阪(Osaka,Japan))获得)释放1.0微摩尔[氨甲基香豆素(aminomethylcoumarin)]。本发明的多肽具有由SEQIDNO:5的氨基酸2-148中所示氨基酸序列组成的多肽的蛋白酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。分离的多肽术语“分离的多肽”如用于本文是指从与其天然结合的(nativelyassociated)至少一种组分移出的多肽。如用于本文的术语指如通过SDS-PAGE测定为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,其按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%与其天然结合的其它多肽材料。因此,优选所述基本上纯的多肽按制备物中存在的全部多肽材料的重量计是至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%,最优选至少99.5%纯,和甚至最优选100%纯。本发明的多肽优选是基本上纯的形式(substantiallypureform)。具体而言,优选所述多肽是“基本上纯的形式(essentiallypureform)”,S卩,所述多肽制备物基本上(essentially)不含与其天然结合的其它多肽材料。这可以通过,例如,用公知的重组方法或由经典纯化方法制备多肽来实现。在本文中,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。同一性参数“同一性”描述两个氨基酸序列之间的相关性(relatedness)。就本发明而言,通过使用来自EMBOSS软件包(http//emboss,org)版本2.8.0的Needle程序来确定两个氨基酸序列的比对。Needle程序执行在Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453中描述的全局比对算法。使用的取代矩阵是BL0SUM62,缺口产生罚分(gapopeningpenalty)是10,且缺口延伸罚分(gapextensionpenalty)是0·5。本发明的氨基酸序列(“发明序列”)例如SEQIDNO5的氨基酸2_148和不同的氨基酸序列(“外源序列”)之间的同一性程度如下计算用两个序列比对中完全匹配的数目除以“发明序列”的长度或“外源序列”的长度中最短的一个。结果以百分比同一性表7J\ο当“发明序列”和“外源序列”在重叠的相同位置中具有同一氨基酸残基时(在下述比对实例中用“I”表示),发生完全匹配。序列的长度是序列中氨基酸残基的数目(例如SEQIDNO5的长度是148)。在以下纯假设性的比对实例中,重叠是序列1的氨基酸序列“HTWGER-NL”,或序列2的氨基酸序列“HGWGEDANL”。在该实例中,缺口用“-”表示。假设性比对实例序列1:ACMSHTWGER_NLIIII序列2=HGffGEDANLAMNPS就本发明而言,两个核苷酸序列之间的同一性程度是通过WiIbur-Lipman法(Wilbur禾口Lipman,1983,ProceedingsoftheNationalAcademyofScienceUSA80:726-730)使用LASERGENEMEGALIGN软件(DNASTAR,Inc.,Madison,WI)用同一性表和以下多重比对参数测定的缺口罚分为10且缺口长度罚分为10。配对比对参数为K元组(Ktuple)=3,缺口罚分=3,且窗口(windows)=20。在具体的实施方案中,多肽的氨基酸序列与或对SEQIDNO5的氨基酸2_148的同一性百分比是通过如下测定的i)使用Needle程序,用BL0SUM62取代矩阵、缺口产生罚分10和缺口延伸罚分0.5,比对所述两个氨基酸序列;ii)计算比对中的完全匹配数;iii)用完全匹配数除以两个氨基酸序列中最短序列的长度;和iv)将iii)的除得的结果转换成百分比。多肽片段术语“多肽片段”在本文中定义为从SEQIDNO5或其同源序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽;其中所述片段具有蛋白酶活性。亚序列(subsequence)术语“亚序列”在本文中定义为从SEQIDNO:4或其同源序列的5'和/或3'端缺失一个或多个核苷酸的核苷酸序列;其中所述亚序列编码具有蛋白酶活性的多肽片段。优选地,亚序列含有至少100个核苷酸,更优选至少200个核苷酸,并且最优选至少300个核苷酸。等位变体(allelicvariant)术语“等位变体”在本文中表示占据同一染色体基因座的基因的两种或更多种可选形式中的任一种。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在基因工程化蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选是基本上纯的形式。具体而言,优选的是,本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然结合的其它多核苷酸材料。在本文中,术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。cDNA:术语〃cDNA"在本文定义为能够通过逆转录从获得自真核细胞的成熟、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应的基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或修饰所述核酸分子使其以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence)术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。可操作地连接术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。编码序列当用于本文时术语“编码序列”的意思是直接指定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始。编码序列可以是DNA、cDNA或重组核苷酸序列。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体的转化、转染、转导等是易感的(susceptible)。修饰术语“修饰”在本文的意思是,对由SEQIDNO5的氨基酸2_148组成的多肽的任何化学修饰,以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个氨基酸的一个或多个取代、缺失和/或插入,以及一个或多个氨基酸侧链的一个或多个置换。人工变体当用在本文时,术语“人工变体”的意思是具有蛋白酶活性的多肽,所述多肽由表达SEQIDNO:4的修饰的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰公开于SEQIDNO:4的核苷酸序列来获得。发明详述具有蛋白酶活性的多肽在第一个方面,本发明涉及具有以下氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO:5的氨基酸2-148(即,成熟多肽)具有至少95%,如优选96%,如优选至少97%,如优选98%,如优选99%和如优选99.5%的同一性程度,所述多肽具有蛋白酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQIDNO5的氨基酸2-148相差五个氨基酸,优选相差四个氨基酸,更优选相差三个氨基酸,甚至更优选相差两个氨基酸,并且最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO5的氨基酸序列或其等位变体;或它们的具有蛋白酶活性的片段。在优选的方面,多肽包含SEQIDNO:5的氨基酸序列。在另一优选的方面,多肽包含SEQIDNO:5的氨基酸2-148,或其等位变体;或它们的具有蛋白酶活性的片段。在另一优选的方面,多肽包含SEQIDNO:5的氨基酸2-148。在另一优选的方面,多肽由SEQIDNO5的氨基酸序列或其等位变体组成;或由它们的具有蛋白酶活性的片段组成。在另一优选的方面,多肽由SEQIDNO:5的氨基酸序列组成。在另一优选的方面,多肽由SEQIDNO5的氨基酸2-148或其等位变体组成;或由它们的具有蛋白酶活性的片段组成。在另一优选的方面,多肽由SEQIDNO5的氨基酸2-148组成。SEQIDNO4的核苷酸序列或其亚序列,以及SEQIDNO5的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有蛋白酶活性的多肽的DNA。具体而言,可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交,以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。因而,可从由这些其它生物制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有蛋白酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDN0:4或其亚序列同源的克隆或DNA,将所述载体材料用在Sounthern印迹中。就本发明而言,杂交表示核苷酸序列在中等至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:4中所示的核苷酸序列;其互补链;或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。对于长度至少100个核苷酸的长探针,将中等至非常高的严紧条件定义为在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且变性的鲑精DNA中,并且对于中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选至少在550C(中严紧性),更优选在60°C(中-高严紧性),甚至更优选在65°C(高严紧性),并且最优选在70°C(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。在具体的实施方案中,洗涤使用0.2XSSC,0.2%SDS优选至少在55°C(中严紧性),更优选至少在60°C(中-高严紧性),甚至更优选至少在65°C(高严紧性),和最优选至少在70°C(非常高严紧性)进行。在另一具体实施方案中,洗涤使用0.IXSSC,0.2%SDS优选至少在55°C(中严紧性),更优选至少在60°C(中-高严紧性),甚至更优选至少在65°C(高严紧性),和最优选至少在70°C(非常高严紧性)进行。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比使用根据Bolton和McCarthy的计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)计算得出的Tm低大约5°C至大约10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸钠(sodiumpyrophosphate),ImM舞酸二Mi内(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6XSCC加0.1%SDS中洗涤一次15分钟,并用6XSSC在比计算得出的T1Jg5°C至10°C的温度洗涤两次,每次15分钟。在含盐的杂交条件下,有效Tm控制探针和与滤纸结合的DNA之间成功杂交所需的同一性程度。有效Tm可以使用以下公式确定,以确定在多种严紧条件下两种DNA杂交所需的同一性程度。有效Tm=81.5+16.6(logM[Na+])+0.41G+C)-0.72甲酰胺)(#JALwww,ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)SEQIDNO:4或SEQIDNO:4的核苷酸1-518的G+C含量是55%。对于中严紧性,亚序列是35%,且5XSSPE的Na+浓度是0.75M。对这些数值应用此公式,有效Tm是77°C。另一相关关系是两个DNA的错配使Tm降低1.4°C。为了确定两个DNA在42°C在中严紧条件下杂交所需的同一性程度,使用以下公式%同源性=100-[(有效Tm-杂交温度)/1.4](#JALwww,ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)对所述数值应用此公式,在42°C在中严紧条件下两个DNA杂交所需的同一性程度是100-[(77-42)/1·4]=75%。在第二个方面,本发明涉及具有蛋白酶活性的分离的多肽,其由包含SEQIDNO4的核苷酸1-515(作为独特的基序)的多核苷酸编码。在第四个方面,本发明涉及具有以下理化性质的分离的多肽-8-9的最适pH;-约19kDa的分子量;-不受亮抑蛋白酶肽(Ieup印tin)、胃蛋白酶抑制剂(ρ印statin)、4_(2_氨基乙基)-苯磺酰氟(4-(2-aminoethyl)-benzenesulfonylfluoride(AEBSF))、ZnS04*EDTA的抑制;-对底物Suc-LLVY-MCA具有高活性且对底物Glt_AAF_MCA、Boc-FSR-MCA、Sue(OMe)-AAPV-MCA和Z-LLE-MCA具有低活性。在第三个方面,本发明涉及人工变体,其包含保守取代、缺失和/或插入一个或10多个氨基酸的SEQIDNO:5或其成熟多肽。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2_氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烧羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,蛋白酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699_4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.309:59_64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.3010832-10837;美国专利5,223,409号;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDNO5的氨基酸2_148的氨基酸取代、缺失和/或插入的总数为至多6,优选至多5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有蛋白酶活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。本发明的多肽可以是真菌多肽,并且更优选酵母多肽如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、网孢菌属(Filobasidium)>IiifeM(Fusarium)、腐质霉属(Humicola),Ml^MM(Magnaporthe)>^;βM(Mucor)、胃MβM(Myceliophthora)>新考玛月旨霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizoptyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霄属(Trichoderma)多月太。在优选的方面,所述多肽是具有蛋白酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一优选的方面,所述多肽是棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)Λ■ffiβ、^ffiβ(Aspergillusoryzae)Λ木干包状■包(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威德抱(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖,廉抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、肤色,廉?包(Fusariumsarcochroum)、拟分枝抱,廉抱(Fusariumsporotrichioides)、硫色镰?包(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、米漂毛霉(Mucormiehei)、Bi9(Myceliophthorathermophila)、|1_E孢M(Neurosporacrassa)、Γ紫青β(Penicilliumpurpurogenum)、哈茨木β(Trichodermaharzianum)、康宁木M(Trichodermakoningii)、长枝τΚβ(Trichodermalongibrachiatum)、!I氏τΚβ(Trichodermareesei)或參录色木霄(Trichodermaviride)多月太。在另一优选的方面,所述多肽是曲霉、黑曲霉或米曲霉多肽。在更优选的方面,所述多肽是黑曲霉多肽,例如,SEQIDNO5的多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员会容易地识别适合的等同物的身份(identity)。这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选另一微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。多核苷酸本发明还涉及具有编码本发明的多肽的核苷酸序列的分离的多核苷酸。在优选的方面,所述核苷酸序列示于SEQIDNO:4。在另一优选的方面,所述核苷酸序列是SEQIDNO:4的成熟多肽编码区。本发明还包括编码如下多肽的核苷酸序列,所述多肽具有SEQIDNO5的氨基酸序列或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQIDNO:4。本发明还涉及SEQIDNO:4的亚序列,所述亚序列编码具有蛋白酶活性的SEQIDNO5的片段。本发明还涉及突变的多核苷酸,其在SEQIDNO4的成熟多肽编码序列中包含至少一个突变,其中突变的核苷酸序列编码由SEQIDN05的氨基酸2-148组成的多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从曲霉属菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)。本发明还涉及具有以下核苷酸序列的多核苷酸,所述核苷酸序列与SEQIDNO4的成熟多肽编码序列(即,核苷酸4-518)具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%的同一性程度,所述多核苷酸编码活性多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的人工变体。可以在作为SEQIDNO:4的多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification2一107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,Science244:1081-1085)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的蛋白酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物_酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等·,1992,Science255:306_312;Smith等·,1992,JournalofMolecularBiology224:899_904;Wlodaver等.,1992,FEBSLetters309:59-64)。本发明还涉及编码本发明的多肽的分离的多核苷酸,所述多核苷酸在中严紧条件,更优选中_高严紧条件,甚至更优选高严紧条件,并且最优选非常高严紧条件下,与SEQIDNO4的核苷酸4-518或其互补链;或它们的等位基因变体和亚序列杂交(Sambrook等.,1989,见上),如本文所定义的。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(WC)00/56900)、镶片镰孢Quirm(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423_488描述。调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上描述。调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3,末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,该信号肽编码区与编码分泌多肽的编码区区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可为必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码区可在本发明中使用。对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶和疏棉状腐质霉脂肪酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等,1992,见上描述。调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情况下称为酶原(zymogen))0前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(W095/33836)的基因获得前肽编码区。当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(nextto)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。在酵母中,可以使用ADH2系统或GALl系统。在丝状真菌中,可以使用TAKAa-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。上文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。本发明的载体优选地含有一个或多个选择性标记,其允许简单选择经转化的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷_5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Sti^ptomyceshygroscopicus)的bar基因。本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(r印licator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARSl,ARS4,ARSl和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的实例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的多核苷酸,将所述重组宿主细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。所述宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如真核生物。所述宿主细胞也可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内抱霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,会将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在甚至更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、Ceriporiopsis、鬼伞属(Coprinus)、革盖菌属(Coriolus)、β急球菌属、网孢菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)>Ceriporiopsisaneirina>Ceriporiopsisaneirina>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa、Ceriporiopsissubvermispora>灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、辐射射脉胃(Phlebiaradiata)、束Ijj^iiJ耳(Pleurotuseryngii)、土生—胃、Trametesvillosa>Trametesversicolor、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton^,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187页,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o产生方法本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于所述多肽产生的条件下,培养以其野生型形式能够产生所述多肽的细胞;和(b)回收所述多肽。优选地,所述细胞是曲霉属的,并且更优选黑曲霉或米曲霉。本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于所述多肽产生的条件下培养宿主细胞;和(b)回收所述多肽。本发明还涉及用于产生本发明的多肽的方法,包括(a)在有益于所述多肽产生的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDN0:4的成熟多肽编码区中具有至少一个突变,其中所述突变核苷酸序列编码由SEQIDNO:5的氨基酸2-148组成的多肽,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补19料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌,其能够从细胞裂解物(Iysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson禾口LarsRyden编,VCHPublishers,NewYork,1989)。植物本发明还涉及转基因植物、植物部分或植物细胞,其已经用编码本发明具有蛋白酶活性的多肽的核苷酸序列转化,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模型生物体拟南芥(Arabidopsisthaliana)。植物部分的实例是茎(stem)、愈伤组织(calIus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质夕卜体(apoplast)、线粒体(mitochondria)>(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)ο同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个表达构建体并入植物宿主基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达载体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莲和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863_878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39:885_889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiologyl52:708_711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantandCellPhysiology39:935_941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本
技术领域
公知的任何其它种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或来自稻的aldP基因启动子(Kagaya等,1995,MolecularandGeneralGenetics248:668_674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573_588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于转化单子叶植物,虽然对于这些植物其它的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10:667_674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及用于产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有蛋白酶活性的多肽;和(b)回收所述多肽。蛋白酶活性的去除或减少本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过减少或消除编码本发明多肽的核苷酸序列的表达,从而构建突变细胞。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变进行。此外,可以通过使用这些诱变剂的任何组合来进行诱变。适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、0_甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时培育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。可通过导入、取代或去除基因中的一个或多个核苷酸或其转录或翻译所需的调节元件实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因替代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。可能理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的实施方案中,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。或者,可以使用与所述核苷酸序列互补的序列通过确定的反义技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致突变体细胞产生比亲本细胞更少的所述多肽。这样生成的多肽缺陷型突变细胞作为表达同源和/或异源多肽的宿主细胞特别有用。已经发现,与相应的在相同但具有正常水平本发明蛋白酶的宿主细胞中的产率相比,可以获得较高产率的在本发明蛋白酶缺陷的宿主细胞中表达的同源和/或异源多肽。所以,本发明进一步涉及用于产生同源或异源多肽的方法,其包括(a)在有益于产生多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。已经发现,本发明的多肽负责切除至少一些多肽的CBM(糖结合模块),所述多肽包含两个或更多个结构域,其中一个结构域是CBM。因此,在另一个方面,本发明涉及用于产生包含多肽的蛋白质产物的方法,所述多肽包含两个或更多个结构域,其中一个结构域是CBM,所述方法通过如下进行发酵本发明多肽的表达降低的细胞,所述细胞产生所述包含两个或更多个结构域的多肽,并从发酵液回收产物,和任选地对回收的产物进行进一步纯化。在另一方面,本发明涉及通过如下产生基本上(essentially)无本发明多肽的蛋白酶活性的蛋白质产物的方法发酵产生本发明的多肽以及目标蛋白质产物的细胞,在发酵之前、期间或发酵完成之后向发酵液加入有效量的能够抑制蛋白酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。在另一方面,本发明涉及通过如下产生基本上(essentially)无本发明多肽的蛋白酶活性的蛋白质产物的方法在允许产物表达的条件下培养细胞,将得到的培养液进行组合的PH和温度处理以实质上(substantially)减少本发明多肽的蛋白酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的PH和温度处理。所述组合的PH和温度处理可任选地与用蛋白酶抑制剂的处理组合使用。依照本发明的这个方面,可能去除至少60%,优选至少65%,优选至少70%,优选至少75%,优选至少80%,优选至少85%,优选至少90%,优选至少95%,优选至少96%,更优选至少97%,甚至更优选至少98%和最优选至少99%的本发明多肽的蛋白酶活性。用于培养和纯化目标产物的方法可以通过本领域已知的方法进行。用于产生如下产物的本发明的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的,所述产物是基本上无蛋白酶的产物或是包含多肽的产物,所述多肽包含两个或更多个结构域,其中一个结构域是CMB,其中不含CBM的所述多肽的量相当低。所述酶可以选自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolyticenzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。蛋白酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质例如激素、生长因子、受体等。可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、PH耐受性等。在另外的方面,本发明涉及基本上无蛋白酶活性的蛋白质产物,其通过本发明的方法产生。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的蛋白酶活性,例如,以至少1.1的富集因数(enrichmentfactor)±曾力口。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(ρ印tidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木毒ο可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。用途本发明还涉及使用具有蛋白酶活性的多肽的方法。洗涤剂组合物可以将本发明的酶加入洗涤剂组合物并因此成为洗涤剂组合物的组分。例如,本发明的洗涤剂组合物可以配制成手洗或机洗洗涤剂组合物,其包括适合于预处理沾污织物的洗衣添加剂组合物和漂洗添加的织物柔软剂组合物;或者可以配制成用于一般家庭硬表面清洁操作的洗涤剂组合物;或者配制用于手洗或机洗洗碗操作。在具体的方面,本发明提供包含本发明的酶的洗涤剂添加剂。洗涤剂添加剂以及洗涤剂组合物可以包含一种或多种其它的酶,如蛋白酶、脂肪酶、角质酶(cutinase)、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶(marmanase)、阿拉伯糖酶(arabinase)、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶,和/或过氧化物酶。通常所选酶的性质应与选择的洗涤剂相容(即,最适pH、与其它酶和非酶成分的相容性等),并且所述酶应该以有效量存在。蛋_:合适的蛋白酶包括动物、植物或微生物来源的那些。微生物来源是优选的。包括化学修饰的或蛋白质工程的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选是碱性微生物蛋白酶或胰蛋白酶-样蛋白酶。碱性蛋白酶的实例是枯草蛋白酶,特别是源自芽孢杆菌的那些枯草蛋白酶,例如,枯草蛋白酶Novo、枯草蛋白酶Carlsberg、枯草蛋白酶309、枯草蛋白酶147和枯草蛋白酶168(在WO89/06279中描述)。胰蛋白酶-样蛋白酶的实例是胰蛋白酶(例如,猪或牛来源的)和WO89/06270和WO94/25583中描述的镰孢属蛋白酶。有用的蛋白酶的实例是WO92/19729,WO98/20115,WO98/20116和WO98/34946中描述的变体,特别是在以下位置中的一个或多个具有取代的变体27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274-参考具体序列和位置。优选的商业上能够获得的蛋白酶包括Alcalase、Savinase,Primase,Duralase、Esperase禾口Kannase(NovozymesA/S),Maxatase、Maxacal、Maxapem、Properase,Purafect,PurafectOxP、FN2和FN3(GenencorInternationalInc.)。MM:合适的脂肪酶包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程的突变体。有用的脂肪酶的实例包括来自腐质霉属(同物异名嗜热霉属(Thermomyces))的脂肪酶,例如EP258068和EP305216中所述来自疏棉状腐质霉(细毛嗜热霉(T.Ianuginosus))的脂肪酶或WO96/13580中所述来自特异腐质霉的脂肪酶;假单胞菌属(Pseudomonas)脂肪酶,例如来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP218272)、洋葱假单胞菌(P.cepacia)(EP331376)、施氏假单胞菌(P.stutzeri)(GB1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌属菌种菌株SD705(W095/06720和WO96/27002)、威斯康星假单胞菌(P.wisconsinensis)(W096/12012);芽孢杆菌脂肪酶,例如来自枯草芽孢杆菌(Dartois等.(1993),BiochemicaetBiophysicaActa,1131,253-360)、嗜热脂肪芽孢杆菌(JP64/744992)或短小芽孢杆菌(WO91/16422)。其它例子是脂肪酶变体,如在WO92/05249、WO94/01541、EP407225、EP260105、WO95/35381、WO96/00292、WO95/30744、WO94/25578、W095/14783、WO95/22615、WO97/04079和WO97/07202中描述的那些变体。优选的商业上能够获得的脂肪酶包括Lipolase和LipolaseUltra(NovozymesA/S)。淀粉酶合适的淀粉酶(α和/或β)包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程的突变体。淀粉酶包括,例如,获得自芽孢杆菌属,例如地衣芽孢杆菌的特殊菌株的α-淀粉酶,在GB1,296,839中有更详细的描述。有用的淀粉酶的实例是WO94/02597、WO94/18314、WO96/23873和W097/43424中描述的变体,特别是在以下位置中的一个或几个具有取代的变体15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444-参考具体序列和位置。商业上能够获得的淀粉酶包括Duramyl、Termamyl,Fungamyl和BAN(NovozymesA/S),Rapidase禾口Purastar(来自GenencorInternationalInc.)。纤维素酶合适的纤维素酶包括细菌或真菌来源的那㈣。包括化学修饰的或蛋白质工程的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属的纤维素酶,例如从特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶,其在US4,435,307,US5,648,263,US5,691,178,US5,776,757和WO89/09259中公开。特别合适的纤维素酶是具有颜色保护益处的碱性或中性纤维素酶。这些纤维素酶的实例是EPO495257、EPO531372、WO96/11262、WO96/29397、WO98/08940中描述的纤维素酶。其它实例是纤维素变体如WO94/07998、EPO531315、US5,457,046、US5,686,593,US5,763,254,WO95/2447UW098/12307和WO1999/001544中描述的那些变体。商业上能够获得的纤维素酶包括Celluzyme和CarezymeTM(NovozymesA/S),Clazinase和PuradaxHA(GenencorInternationalInc.),和KAC-500(B)(KaoCorporation)。过氧化物酶/氧化酶合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括化学修饰的或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属(Coprinus)例如来自灰盖鬼伞(C.cinereus)的过氧化物酶,和它们的变体,如WO93/24618,WO95/10602和WO98/15257中所述的那些变体。商业上能够获得的过氧化物酶包括Guardzyme(NovozymesA/S)。可以通过加入含有一种或多种酶的单独的添加剂,或通过加入包含全部这些酶的组合添加剂,将洗涤剂酶包括在洗涤剂组合物中。可以将本发明的洗涤剂添加剂,即单独添加剂或组合添加剂,配制成例如颗粒、液体、浆料等。优选的洗涤剂添加剂剂型是颗粒,特别是无粉尘的颗粒;液体,特别是稳定化的液体;或浆料。无粉尘的颗粒可以例如如US4,106,991和4,661,452中所公开的产生,并且可以任选地通过本领域已知的方法进行包覆。蜡质包覆材料的实例是具有1000-20000的平均摩尔量(meanmolarweight)的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16-50个环氧乙烷单位的乙氧基化壬基酚;乙氧基化脂肪醇,其中所述醇含有12-20个碳原子且其中存在15-80个环氧乙烷单位;脂肪醇;脂肪酸;和脂肪酸的单-和二-和三酸甘油酯。适于通过流化床技术施用的成膜包覆材料的实例在GB1483591中给出。例如,可以根据已确定的方法通过添加多羟基化合物如丙二醇、糖或糖醇、乳酸或硼酸来使液体酶制备物稳定化。受保护的酶(protectedenzyme)可根据EP238,216中公开的方法来制备。本发明的洗涤剂组合物可以是任何方便的形式,例如,条、片剂、粉剂、颗粒(granule)、糊剂(paste)或液体。液体洗涤剂可以是含水的,通常含有多至70%水和0-30%有机溶剂;或者是非水的。洗涤剂组合物包含一种或多种表面活性剂,所述表面活性剂可以是非离子的包括半_极性的和/或阴离子的和/或阳离子的和/或两性离子的。表面活性剂通常以按重量计0.-60%的水平存在。当包括于其中时,洗涤剂通常会含有约至约40%的阴离子表面活性剂,如直链烷基苯磺酸酯(linearalkylbenzenesulfonate)、α-烯烃磺酸酯、烷基硫酸酯(脂肪醇硫酸酯)、醇乙氧基硫酸酯(alcoholethoxysulfate)、仲烷基磺酸酯(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸或肥皂(soap)。当包括于其中时,洗涤剂通常会含有约0.2%至约40%的非离子表面活性剂,如醇乙氧基化物、壬基酚乙氧基化物、烷基聚苷(alkylpolyglycoside)、烷基二甲胺氧化物(alkyldimethylamineoxide)、乙氧基化脂肪酸单乙醇酰胺(ethoxylatedfattyacidmonoethanolamide)、脂肪酸单乙醇酰胺、多羟基烷基脂肪酸酰胺,或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺(glucamides),,)。洗涤剂可以含有0-65%的洗涤剂增效剂(builder)或络合剂如沸石、二磷酸盐/酯、三磷酸盐/酯、膦酸盐/酯(phosphonate)、碳酸盐/酯、柠檬酸盐/酯、氮川三乙酸(nitrilotriaceticacid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐或层状硅酸盐(例如来自Hoechst的SKS-6)。洗涤剂可包含一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯基咪唑)、聚羧酸盐/酯(polycarboxylate)如聚丙烯酸盐/酯、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。洗涤剂可含有漂白体系,所述体系可包含H2O2源如过硼酸盐或过碳酸盐,可将其与形成过酸的漂白活化剂如四乙酰乙二胺或壬酰氧基苯磺酸酯(nonanoyloxybenzenesulfonate)组合。可供选择的是,漂白体系可包含过氧酸,例如酰胺、酰亚胺或砜型的过氧酸。可以使用常规稳定剂使本发明的洗涤剂组合物中的酶稳定化,所述稳定剂例如,多羟基化合物例如丙二醇或甘油,糖或糖醇,乳酸,硼酸或硼酸衍生物,例如,芳族硼酸酯,或苯基硼酸(phenylboronicacid)衍生物如4_甲酰基苯基硼酸,并且所述组合物可例如WO92/19709和WO92/19708中所述配制。洗涤剂也可含有其它常规洗涤剂成分如织物调节剂,包括粘土、泡沫促进剂、抑泡剂、抗腐蚀剂、悬污剂、防污物再沉积剂、染料、杀菌剂、光学增亮剂、助水溶物(hydrotrope)、晦暗抑制剂(tarnishinhibitors)或香料。目前预期在洗涤剂组合物中,可以以相当于每升洗涤液0.Ol-IOOmg酶蛋白,优选每升洗涤液0.05-5mg酶蛋白,特别是每升洗涤液0.I-Img酶蛋白的量加入任何酶,特别是本发明的酶。可以额外地将本发明的酶并入WO97/07202中公开的洗涤剂配方,特此将WO97/07202并入作为参考。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例用作缓冲液和底物的化学品是至少试剂级的商业产品。培养基和溶液^^除非另有声明,DNA操作和转化使用分子生物学的标准方法进行,如Sambrook等.(1989)Molecularcloning:Alaboratorymanual,ColdSpringHarborlab.,ColdSpringHarbor,NY;Ausube1,F.M.等编,"CurrentprotocolsinMolecularBiology",JohnWileyandSons,1995;Harwood,C.R.,禾口Cutting,S.Μ·编,〃MolecularBiologicalMethodsforBacillus".JohnWileyandSons,1990中所述。酶用于DNA操作的酶(例如限制性内切核酸酶、连接酶等)是从NewEnglandBiolabs,Inc.获得的,并且按照制造商的说明书使用。微生物菌株大肠杆菌DH5α(Τ0Υ0Β0)使用的黑曲霉菌株源自原始分离株C40,其是由Novozymes从在丹麦哥本哈根(Copenhagen,Denmark)收集的土壤样品中分离的。米曲霉BECh-2在WO2006/069289(Novozymes)中描述。培养基和试剂Cove342.3g/L蔗糖,20ml/LCOVE盐溶液,IOmM乙酰胺,30g/L纯净琼脂(nobleagar)。Cove盐溶液每升26gKC1,26gMgS04_7aq,76gKH2PO4,50mlCove痕量金属。Cove痕量金属每升0.04gNaB4O7-IOaq,0.4gCuS04_5aq,1.2gFeS04_7aq,0.7gMnS04-aq,0.7gNa2Mo02-2aq,0.7gZnS04_7aqoYPG:4g/L酵母提取物,lg/LKH2PO4,0.5g/LMgS04_7aq,5g/L葡萄糖,pH6.O。STC:0.8M山梨糖醇,25mMTrispH8,25mMCaCl20STPC:STC缓冲液中的40%PEG4000。Cove顶层琼脂糖342.3g/L蔗糖,20ml/LCOVE盐溶液,IOmM乙酰胺,10g/L低熔点琼脂糖。28MS-9每升30g大豆粉,20g甘油,pH6.0。MDU-pH5每升45g麦芽糖-laq,7g酵母提取物,12gKH2PO4,lgMgS04_7aq,2gK2SO4,0.5mlAMG痕量金属溶液和25g2-吗啉代乙磺酸,pH5.0。实施例1黑曲霉19kDa蛋白酶的半纯化酶样品的制备将黑曲霉细胞冷冻干燥并保存在4°C。将IOg冷冻干燥的细胞通过液氮冷冻并用BallMill(stainlesssteel,volume420ml,IrieSyoukaiCo.Ltd.)压碎,然后通过Physcotron(MicrotecNichionCo.Ltd.)在液氮中均质化。将勻浆物重悬在120ml20mMTris-HCl,pH7.5中。离心之后,将沉淀重悬在120ml相同缓冲液中并再次离心。将两次的上清液组合并通过膜过滤器(0.2微米孔径)过滤。将滤液相对于同样的缓冲液透析,产生151.5ml粗制酶样品。杆菌肽亲和凝胶的制备试剂环氧活化的琼月旨糖6B(Epoxy_activatedSepharose6B)(AmershamBiosciences,17-0480-01)偶联缓冲液(5OmMNa2B4O7-HCl,pH9)杆菌肽(WakoPureChemicalIndustryLtd.,022—07701,LotEWM1905)流程将15g环氧活化的琼脂糖6B悬浮并用Milli-Q水按照制造商的说明书洗涤。然后将凝胶用200ml偶联缓冲液洗涤并在玻璃滤器上过滤。将凝胶块转移至装有50ml偶联缓冲液的密封瓶中。将2.5g杆菌肽溶解在50ml偶联缓冲液中并与凝胶混合。将反应混合物在25°C轻柔振荡过夜。使用偶联缓冲液洗去过量的配体。用0.IM乙醇胺,pH5在25°C处理5小时来封闭剩余的活性基团。用偶联缓冲液洗涤用含IMNaCl和25%异丙醇的20mM咪唑缓冲液,pH6.5洗涤。通过杆菌肽亲和柱纯化来自黑曲霉的蛋白酶柱尺寸22xl00_流速4ml/min级分大小8ml/min将柱用20mMTris-HCl,pH7.5预平衡。将150ml粗制酶样品上样到柱上。用170ml相同的缓冲液洗柱,然后用120ml含有IMNaCl的相同缓冲液洗柱。通过120ml含IMNaCl和25%异丙醇的Tris缓冲液洗脱与柱结合的蛋白酶。汇集展现UV吸收的级分并相对于Tris-HCl缓冲液透析以去除NaCl和异丙醇。将56ml汇集的级分通过超滤浓缩成0.6ml。SDS-PAGESDS-PAGE以CompactPAGE,AE7300和预制凝胶c-PAGEL,12.5%,76mm(W)χ70mm(H)(ΑΤΤ0Co.)的组合进行。电泳缓冲液和SDS缓冲液按照ATTO的指导手册制备。电泳之后,将凝胶用SYPROOrange蛋白凝胶染料(InvitrogenCo.)染色。为了鉴定蛋白酶活性,将2-巯基乙醇从SDS-缓冲液去除并略去样品的煮沸步骤。用溶解在50mMTris-HCl,PH7.5中的脱脂乳和2%琼脂糖覆盖凝胶。SDS-PAGE凝胶示于图1泳道1:LMW标记(97、66、45、30、20、14.4kDa,GEHealthcare))泳道2纯化的蛋白酶(经煮沸的)泳道3纯化的蛋白酶(未经煮沸且无2-巯基乙醇的)脱脂乳-琼脂糖覆盖层经煮沸和未经煮沸的样品的SDS-PAGE图谱是有差异的。将半纯化的样品应用到N-末端测序分析中。实施例2从头蛋白质测序通过N-末端测序获得了19kDa蛋白酶的部分氨基酸序列。为了样品制备,将使用杆菌肽亲和柱半纯化后的样品用TCA沉淀,在SDS-PAGE上分离,并印迹到PVDF膜上。对于N-末端氨基酸测序,将一片加载有19kDa条带的PVDF膜切下并置于AppliedBiosystemsProcise蛋白测序仪的印迹盒(blottingcartridge)中。使用用于PVDF膜样品的方法运行文件(methodrunfileforPVDFmembranesamples)(脉冲液体PVDF(PulsedliquidPVDF))按照制造商的说明书进行N-末端测序。获得了以下N-末端序列(单字母编码)SPIPSYSRPGRG(SEQIDNO1)实施例3黑曲霉19kDa蛋白酶基因的克隆和测序基于所述部分氨基酸序列和通过SDS-PAGE鉴定的分子量,进行了数据库检索(JGI黑曲霉基因组浏览器(genomebrowser))并获得了以下命中结果。erseqn:zyl63155XSCFFLD1.Aspergillusnigergenomicsequence(黑曲霉基因组序列)Length(长度)=3970925Score(分数)=30.Obits(66),Expect(预期)=0.98Identities(同一性)=12/12(100%),Positives(阳性)=12/12(100%)Frame(框)=+1Query1SPIPSYSRPGRG12SPIPSYSRPGRGSbjct3509032SPIPSYSRPGRG350906基于黑曲霉基因组数据库的核苷酸序列信息设计了下述引物HU941和HU942,它们分别引入BamHI和XhoI位点。HU941:TTTGGATCCACCATGTCCCCAATCCCCAGC(SEQIDNO2)HU942TTTCTCGAGTCACCCCAAGAAAACATCCAC(SEQIDNO3)用黑曲霉菌株的基因组DNA作为模板的PCR反应用ExpandTMPCR系统(RocheDiagnostics,Japan)使用HU941和HU942进行。扩增反应(50μ1)由以下组成lng/y1模板DNA,每种dNTP250mM,250nM引物HU941,250nM引物HU942,0.IU/μ1Taq聚合酶,于IX缓冲液中(RocheDiagnostics,Japan)。将所述反应在DNAEnginePTC-200(MJ-Research,Japan)中温育,程序如下1个循环94°C2分钟;30个循环,每个循环为92°C1分钟,55°C1分钟和72°C1分钟;1个循环72°C10分钟;并在4°C保温。将反应产物在1.0%琼脂糖凝胶上分离,使用TAE缓冲液,其中将0.5kb产物条带从凝胶上切下并使用QIAquickTMGelExtractionKit(QIAGENInc.,Valencia,CA)按照制造商的说明书纯化。将所述0.5kb的扩增DNA片段使用BamHI和XhoI消化,并连接到用BamHI和XhoI消化的曲霉属表达盒pCaHj483中。将所述连接混合物转化到大肠杆菌DH5ci(Τ0Υ0Β0)中以制备表达质粒pHUda772。使用QIApi^pSpinMinipr印试剂盒(QIAGENInc.,Valencia,CA)按照制造商的说明书回收扩增的质粒。质粒PCaHj483包含如下表达盒,该表达盒基于与构巢曲霉丙糖磷酸异构酶非翻译前导序列融合的黑曲霉中性淀粉酶II启动子(Na2/tpi启动子)和黑曲霉淀粉糖苷酶终止子(AMG终止子),来自构巢曲霉的选择标记amdS使得能够在乙酰胺作为唯一氮源时生长。测序所得质粒并与黑曲霉基因组数据库比较,显示该克隆编码未知的19kDa蛋白酶。克隆的DNA序列及其通过预测内含子(通过NetGene2)推导的氨基酸序列和基于氨基酸序列的同源性检索结果。黑曲霉19kDa基因的序列和推导的氨基酸序列示于图2。同源性检索的结果数据库:uniprot_trembl程序blastpa0r4686e-12内切核糖核酸酶L-psp家族蛋白.a2qti5Ie-Il重叠群An09c0050,完整基因组.q5aqu22e-ll假设的蛋白.a0ywm95e-ll内切核糖核酸酶L-PSP.q5arf7le-10假设的蛋白.q3mlgl2e-10内切核糖核酸酶L-PSP.q5b5q5le-09假设的蛋白.q2h8292e-09假设的蛋白.q2ulll2e-08预测的蛋白.a4qwk3le-07假设的蛋白.q0mf294e-04假设的蛋白.q46me65e-04内切核糖核酸酶L-PSP.q8xes95e-04假设的跨膜蛋白(假设的蛋白).qllgu96e-〇4内切核糖核酸酶L-PSP.qOkdel6e-04推定的翻译起始抑制子,yjgF家族.同源性检索中的命中结果均未显示经鉴定为具有蛋白酶活性的多肽。实施例4黑曲霉19kDa蛋白酶基因在米曲霉中的表达将米曲霉菌株BECh-2接种到100mlYPG培养基中并在32°C在80rpm温时。收集沉淀并用0.6MKCl洗涤,并以终浓度600μ1/ml重悬在20ml含有商用β-葡聚糖产品(GLUCANEX,NovozymesA/S,Bagsvaerd,Denmark)的0·6MKCl中。将悬液在32°C和SOrpm温育直到形成原生质体,然后用STC缓冲液洗涤两次。将原生质体用血红蛋白计计数并重悬,并且在STCSTPCDMSO的820.1溶液中调整至终浓度为2.5xl07原生质体/ml。向100μ1的所述原生质体悬液加入大约3μg的pHUda772,轻柔混合,并在冰上温育20分钟。加入ImlSPTC并将所述原生质体悬液在37°C温育30分钟。在加入IOml500CCOVE顶层琼脂糖之后,将反应物倾倒至COVE琼脂平板上并将所述平板在32°C温育。5天之后,从该COVE培养基选择转化体。将四个随机选择的转化体接种到100mlMS-9培养基中并在32°C培养1天。将3mlMS-9培养基接种到100mlMDU_pH5培养基中并在30°C培养3天。将生长的菌丝体用SDS样品缓冲液重悬并在100°C加热10分钟。在12,OOOrpm离心10分钟之后,回收上清液并应用于SDS-PAGE分析(CompactPAGE,AE7300和预制凝胶c-PAGEL,12.5%,76mm(W)x70mm(H)(ATTOCo.)。样品缓冲液、电泳缓冲液和SDS缓冲液按照ATTO的指导手册制备。电泳之后,将凝胶用SYPROOrange蛋白质凝胶染料(InvitrogenCo.)染色。选择表达19kDa蛋白酶的克隆之一,即菌株772-10,用于进一步的实验。实施例5表达的19kDa蛋白酶的样品制备将选择的胞内表达黑曲霉19kDa蛋白酶的转化体之一在实施例4中公开的条件下培养,收集菌丝体并冻干。32将1克冻干的细胞用研钵研磨并悬浮在含有0.5MNaCl的25mlIOmM磷酸盐缓冲液,PH6.7中。通过离心获得无细胞的提取物。将所述无细胞的提取物浓缩至4ml并上样于用相同的缓冲液预平衡的HiLoad26/60Superdex200柱(GEhealthcare)。通过相同的缓冲液洗脱所述样品(流速2ml/min,级分大小4ml/2min/fr)。凝胶渗透的层析图示于图3。SDS-PAGE以CompactPAGE,AE7300和预制凝胶c-PAGEL,15%,76mm(W)x70mm(H)(ATTOCo.)的组合进行。电泳缓冲液和SDS缓冲液按照ATTO的指导手册制备。电泳之后,将凝胶用SYPROOrange蛋白质凝胶染料(InvitrogenCo.)染色(参见图4)。汇集含有19kDa蛋白酶的级分55、56、57并用于进一步的分析。实施例6表达的19kDa蛋白酶的表征19kDa蛋白酶的底物特异件五种合成底物购自P印tideInstituteCo.,Osaka。所述底物为Glt-AAF-MCA、Suc-LLVY-MCA,Boc-FSR-MCA、Sue(OMe)-AAPV-MCA和Z-LLE-MCA。将25μ10.04mM底物在37°C预温育5分钟。将20μ1蛋白酶样品与25μ1400mM磷酸盐缓冲液,pH6.7、5μ12ΜNaCl和25μ1MilliQ水混合,然后在37°C预温育5分钟。通过将所述底物溶液与酶溶液混合来起始反应。通过具有360nm激发和460nm发射滤波器(filter)的FL600MicroplateFluorescenceReader在37°C测量30分钟荧光强度的增加。Suc-LLVY-MCA为最佳底物。抑制剂的效果4-(2-氨乙基)_苯磺酰氟(AEBSF)、亮抑蛋白酶肽、胃蛋白酶抑制剂A、ZnSO4和EDTA购自WakoChemicalCo.,Osaka。所述抑制剂为用MilliQ水稀释10倍的DMSO中的4.5mg/10ml亮抑蛋白酶肽,用MilliQ水稀释10倍的DMSO中的3mg/10ml胃蛋白酶抑制剂A,IOmMAEBSF,IOmMZnSO4和IOmMEDTA。底物为0.04mMSuc-LLVY-MCA。酶溶液含有5μ1汇集的19kDa蛋白酶级分,10μ1抑制剂,25μ1400mMKPB,ρΗ6·7禾口35μ1Milli-Q水。将底物溶液和酶溶液分别在37°C预温育5分钟。如上所述测量活性。残余活性(%)无抑制剂100亮抑蛋白酶肽89AEBSF10033没有观察到任何抑制剂的明显抑制。pH曲线使用磷酸盐缓冲液pH6、7、8和二乙醇胺缓冲液pH8、9、10。底物溶液为0.04mMSuc-LLVY-MCAo酶溶液含有5μ119kDa蛋白酶,25μ1缓冲液,5μL2ΜNaCl禾口40μLMilliQ水。如前文所述进行测定。结果示于图5。所述19kDa蛋白酶是最适pH为8-9的碱性蛋白酶。本文描述和要求保护的发明并不受限于本文所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等同的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本文所显示和描述的那些之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。本文引用了多篇参考文件,将它们的内容通过提述以其整体并入。权利要求分离的蛋白酶,其具有与SEQIDNO5的氨基酸2-148至少具有95%同一性的氨基酸序列。2.权利要求1的多肽,其包含SEQIDNO5的氨基酸序列。3.分离的多核苷酸,其包含编码权利要求1-2中任一项的多肽的核苷酸序列。4.用于产生亲本细胞的突变体的方法,所述方法包括破坏或缺失编码权利要求1-2中任一项的多肽的核苷酸序列,其导致突变体产生的所述多肽比亲本细胞少。5.通过权利要求4的方法产生的突变细胞。6.权利要求5的突变细胞,所述突变细胞还包含编码天然或异源蛋白质的基因。7.用于产生包含多肽的蛋白质产物的方法,所述多肽包含两个或更多个结构域,其中一个结构域是糖结合模块,其中所述方法包括以下步骤a)发酵根据权利要求1-2中任一项的多肽的表达降低的细胞,所述细胞产生所述包含两个或更多个结构域的多肽,和b)从发酵液回收发酵产物。8.用于产生蛋白质产物的方法,所述蛋白质产物基本上不含根据权利要求1-2中任一项的多肽的蛋白酶活性,其中所述方法包括以下步骤a)发酵表达根据权利要求1-2中任一项的多肽以及目标蛋白质产物的细胞,b)在发酵之前、发酵期间或发酵完成之后向发酵液加入能够抑制本发明多肽的蛋白酶活性的试剂,和c)从发酵液回收目标产物。9.用于产生蛋白质产物的方法,所述蛋白质产物基本上不含根据权利要求1-2中任一项的多肽的蛋白酶活性,其中所述方法包括以下步骤a)在允许所述蛋白质产物表达的条件下培养细胞,b)对所述培养液进行组合的pH和温度处理,和c)从培养液回收产物。10.根据权利要求8或9的方法,其中将所述蛋白酶活性去除至少60%。全文摘要本发明涉及具有蛋白酶活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及产生和使用所述多肽的方法。文档编号C12N9/62GK101883848SQ200880118745公开日2010年11月10日申请日期2008年9月30日优先权日2007年10月1日发明者克里斯琴·I·乔根森,宇田川裕晃申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1