酸性真菌蛋白酶的制作方法

文档序号:440742阅读:331来源:国知局

专利名称::酸性真菌蛋白酶的制作方法
技术领域
:0002本发明涉及编码被命名为NSP24家族蛋白酶、NSP25家族蛋白酶和PepA蛋白酶的酸性蛋白酶的多核苷酸;NSP24和NSP25家族蛋白酶多肽;包括所述蛋白酶的组合物以及它们的使用。
背景技术
:0003蛋白酶是能够切开肽键的酶。酸性蛋白酶(例如具有酸性最适pH的蛋白酶)是由大量不同的生物,包括哺乳动物和微生物产生的。例如,微生物酸性蛋白酶是由细菌菌株诸如芽孢杆菌属某种(Bacillussp.)的菌株(JP01240184)和真菌菌株诸如根霉属某种(Rhizopussp.)(EP72978)、Schytalidiumsp.(JP48091273)、Sulpholobussp.、热原体属某种(Thermoplasmasp.)(WO/9010072)以及曲霉属某种(Aspergillussp.)(JP50121486和EP82395)的菌株产生的。0004Berka等(Gene(1990)96313)公开了编码来自泡盛曲霉(Aspergillusawamori)的天冬氨酸蛋白酶曲霉胃蛋白酶(aspergillopepsin)A的基因。对编码来自米曲霉(Aspergillusoryzae)的天冬氨酸蛋白酶曲霉胃蛋白酶(aspergillopepsin)O的基因的克隆由Berka等(Gene(1993)125195-198)加以描述。对编码来自米曲霉的酸性蛋白酶(PepA)的基因的克隆由Gomi等(Biosci.Biotech.Biochem.(1993)57(7)1095-1100)加以描述。0005蛋白酶,具体而言是酸性蛋白酶,被广泛地应用工业应用中,例如用于制备食品和饲料、用于皮革工业(例如使皮革脱毛)、用于生产蛋白质水解产物、以及用于生产醇类诸如乙醇生产、酒类生产与酿造。0006对于许多不同的应用,特别是在食品和饲料工业中,对蛋白酶仍然有着持续的需求。发明概述0007申请人已发现大量新型蛋白酶基因,其包括编码NSP24蛋白酶(SEQIDNO2或SEQIDNO10)的新型nsp24基因;编码NSP25蛋白酶(SEQIDNO9)的新型nsp25基因;和编码新型PepA蛋白酶(SEQIDNO7)的新型pepA变体基因。0008因此,本发明的特征是NSP24蛋白酶、NSP25蛋白酶或PepA蛋白酶以及它们的变体的重组的或者基本上纯的制剂。0009在本发明的一些方面,蛋白酶是NSP24家族蛋白酶多肽,其包括与SEQIDNO2或SEQIDNO10中的氨基酸序列基本相同的氨基酸序列(下文图6所示)。在一些实施方式中,NSP24家族蛋白酶多肽是由SEQIDNO8中的核酸编码(下文图5所示),或者由具有与SEQIDNO8的核酸基本相同的核酸序列的核酸编码。0010在本发明的其它方面,NSP24家族蛋白酶多肽与SEQIDNO10中的序列在氨基酸序列上具有多达10个残基的差异。在一些实施方式中,NSP24家族蛋白酶多肽与SEQIDNO10中的序列在氨基酸序列上具有多达10%残基的差异。在一些实施方式中,具有如此的差异,以至于NSP24家族蛋白酶多肽表现出NSP24蛋白酶的生物学活性,例如NSP24蛋白酶保留了天然存在的NSP24蛋白酶的生物学活性。0011在本发明进一步的方面,NSP24家族蛋白酶多肽包括此处所述的NSP24蛋白酶序列以及其它的N-末端和/或C-末端氨基酸序列。0012在本发明的其它方面,NSP24家族蛋白酶多肽包括来自SEQIDNO2或SEQIDNO10的氨基酸序列的全部或片段,在阅读框中,其与其它氨基酸残基融合,优选地与由基因组DNA5′至编码来自SEQIDNO1或SEQIDNO8的序列的基因组DNA所编码的残基融合。0013仍在本发明的其它方面,NSP24家族蛋白酶是重组体融合蛋白,其具有第一NSP24家族蛋白酶部分和第二多肽部分,例如具有与NSP24家族蛋白酶不相关的氨基酸序列的第二多肽部分。该第二多肽部分可以是DNA结合结构域或者聚合酶活化结构域。本发明的多肽包括那些由于多基因的存在、选择性转录事件、选择性RNA剪接事件以及选择性翻译和翻译后事件所产生的多肽。该多肽可以在系统例如培养的细胞中表达,该系统产生与表达的NSP24蛋白酶在天然细胞中表达时基本上相同的翻译后修饰,或者可以在这样的系统中表达,该系统导致当在天然细胞中表达时存在的翻译后修饰的省略。0014仍在其它方面,本发明涉及酶组合物,其包括NSP24家族蛋白酶以及一种或多种其它组分,例如载体、稀释剂或溶剂。所述其它组分可以是赋予该组合物体外用途、体内用途、药物用途或兽医用途的组分。在本方面的一些实施方式中,酶组合物将包括其它酶类。在优选的实施方式中,其它酶将会是葡糖淀粉酶、α淀粉酶或它们的组合。0015仍在进一步的方面,本发明提供了基本上纯的核酸,其具有或包括编码NSP24家族蛋白酶多肽的核苷酸序列,所述多肽包括与SEQIDNO2或SEQIDNO10的氨基酸序列具有至少80%序列同一性的氨基酸序列。0016在一些方面,NSP24家族蛋白酶核酸将包括转录调控序列,例如可操纵地连接于NSP24家族蛋白酶基因序列的转录启动子或转录增强子序列的至少其中之一,例如以使NSP24家族蛋白酶基因序列适合作为表达载体使用。0017仍在其它方面,编码本发明的NSP24蛋白酶多肽(例如SEQIDNO2)的核酸在严格条件下与核酸探针杂交,该探针对应于来自SEQIDNO8的至少12个连续的核苷酸,更优选地对应于来自SEQIDNO8的至少20个连续的核苷酸。0018本发明的另一方面提供了NSP24家族蛋白酶(例如NSP24)在各种工业设施方面的应用。例如,NSP24家族蛋白酶可以被用于农业废料的酶促降解以生产醇类燃料和其它重要的工业化学品,用于生产动物或人类食品,或者作为去污剂组合物的组分,用于皮革加工以及蛋白质基的纤维加工(诸如毛料或丝绸),用于生物量应用,用于个人护理应用(皮肤、头发、口腔护理等),用于药物和保健护理应用以及用于生产适用于以上应用的新型肽。0019在进一步的方面,本发明涉及多核苷酸,其编码具有SEQIDNO7的pepA变体蛋白酶L388M。在一些实施方式中,该多核苷酸具有SEQIDNO5的序列。0020仍在另一方面,本发明涉及NSP25家族蛋白酶。在一些实施方式中,NSP25家族蛋白酶将具有与SEQIDNO9至少85%的序列同一性。在其它实施方式中,NSP25家族蛋白酶将由与SEQIDNO4具有至少85%序列同一性的多核苷酸所编码。仍在其它实施方式中,NSP25家族蛋白酶将是母体NSP25家族蛋白酶的生物学活性片段。0021图1举例说明了糖类的降解(DP+3)%w/v,使用了1)NSP24、2)可商业获得的蛋白酶,GC106和3)DISTILLASE,其不包括蛋白酶(参见实施例5)。0022图2描述了糖类的降解(DP2)%w/v,使用了NSP24、GC106和DISTILLASE。0023图3举例说明了葡萄糖的形成(DP1),使用了NSP24、GC106和DISTILLASE。对于NSP24和GC106样品,在40小时末剩余的葡萄糖量为0.2%w/v以下,而在48小时末为0.1%w/v以下。相反,对于DISTILLASE,在48小时末以%w/v测量的葡萄糖量稍大于1.0%w/v。0024图4举例说明了NSP24、GC106和DISTILLASE的乙醇生产(%v/v)。通过使用两种蛋白酶样品产生乙醇的速率和量基本相同。相反,DISTILLASE产生较少的乙醇且速度较慢。0025图5A-D举例说明了由里氏木霉(Trichodermalreesei)获得的pTrex3g_NSP24cDNA克隆的核苷酸序列(SEQIDNO1)。NSP24基因序列加下划线,推定的基因内含子序列用黑体加以标识。编码该蛋白酶的核酸序列用SEQIDNO8的序列加以表示。0026图6A-B举例说明了来自里氏木霉的NSP24的预测的氨基酸序列(407个氨基酸)(SEQIDNO2)(图6A),以及NSP24核苷酸序列,其带有用粗体字母标识的推定内含子(图6B)(SEQIDNO8)。在图6A中,信号肽为粗体,前原序列(preprosequence)为粗体加下划线,而成熟的NSP24蛋白以KYGAPIS...开始并用SEQIDNO10表示。0027图7举例说明了pTrex3g_NSP24载体以及图5核苷酸序列上的限制性酶切位点的位置。0028图8举例说明了pepA蛋白酶的核酸序列(SEQIDNO3)。推定的内含子为粗体。0029图9A-B举例说明了编码新型NSP25蛋白酶(399个氨基酸)(SEQIDNO9)的核酸序列(SEQIDNO4)。信号序列为粗体。0030图10举例说明了新型pepA蛋白酶变体(L388M)(SEQIDNO7)的核酸序列(SEQIDNO5),其中图中加下划线的′A′是由图8pepA中的′C′改变而成。0031图11举例说明了表达载体,pSL899_pepA。0032图12A-E举例说明了表达载体pSL899_pepA的核苷酸序列(SEQIDNO6)。XhoI切割位点用Λ表示,而XbaI位点用*表示。pepA的编码序列以粗体表示。内含子被加下划线。0033图13举例说明了由SEQIDNO5编码的蛋白的PepA变体L388M的氨基酸序列(SEQIDNO7)。发明详述0034现在本发明将仅仅通过参考的方式使用下列定义和实施例来加以详细描述。本文中所参考的全部专利和出版物,包括在此类专利和出版物中公开的全部序列,被明确并入本文作为参考。0035除非另作说明,本发明的实践将使用常规的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA以及免疫学技术,其在本领域技术人员的能力范围内。此类技术在文献中有所描述。参见例如Sambrook、Fritsch和Maniatis编辑的MolecularCloningALaboratoryManual,第二版(ColdSpringHarborLaboratoryPress1989);Ausubel等编辑的ShortProtocolsinMolecularBiology(5thEd.2002);DNACloning,VolumesI和II(D.N.Glovered.,1985);OligonucleotideSynthesis(M.J.Gaited.,1984);Mullis等美国专利号4,683,195;NucleicAcidHybridization(B.D.Hames&S.J.Higginseds.1984);TranscriptionAndTranslation(B.D.Hames&S.J.Higginseds.1984);CultureOfAnimalCells(R.I.Freshney,AlanR.Liss,Inc.,1987);ImmobilizedCellsAndEnzymes(IRLPress,1986);B.Perbal,APractical-GuideToMolecularCloning(1984);论文,MethodsInEnzymology(AcademicPress,Inc.,N.Y.);GeneTransferVectorsForMammalianCells(J.H.Miller和M.P.Caloseds.,1987,ColdSpringHarborLaboratory);MethodsInEnzymology,Vols.154和155(Wu等eds.),ImmunochemicalMethodsInCellAndMolecularBiology(Mayer和Walker,eds.,AcademicPress,London,1987);HandbookOfExperimentalImmunology,VolumesI-IV(D.M.Weir和C.C.Blackwell,eds.,1986);ManipulatingtheMouseEmbryo,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1986)。同样,有关蛋白酶的制备、表达、分离和使用的方法的信息可以通过阅读美国专利号6,768,001而获得,该专利在此以其整体并入本文作为参考。0036通过下列详细说明并通过权利要求,本发明的其它特征和优势将是显而易见的。尽管与本文所述相似或等同的任何方法和材料都可以被用于本发明的实践或测试,但优选的方法和材料还是被加以描述。0037除非在本文中另作定义,此处所用的所有科学技术术语具有与本发明所属领域普通技术人员所通常理解的相同的含义。Singleton等DICTIONARYOFMICROBIOLOGYANDMOLECULARBIOLOGY,2DED.,JohnWileyandSons,NewYork(1994)和Hale&Marham,THEHARPERCOLLINSDICTIONARYOFBIOLOGY,HarperPerennial,NY(1991)为技术人员提供了本发明中所使用的许多术语的通用字典。0038此处所提供的标题并非是限定本发明的各个方面或实施方式,其可以作为本说明书的参考以整体包含于其中。因此,以下即刻被定义的术语以整体作为本说明书的参考而被更充分地定义。0039数字范围包括限定该范围的数字。0040除非另作说明,核酸是按照5′至3′方向从左至右书写;氨基酸序列是按照氨基至羧基方向从左至右书写。0041应当注意,如本说明书和所附权利要求中所用的,单数形式“一(a)”、“一(an)”和“该(the)”,除非将其内容另作清楚的描述,包括复数参考。因此,例如,提及含“(一种)化合物(acompound)”的组合物时,则包括了两种或更多种化合物的混合物。同样应当注意的是,术语″或(or)″,除非将其内容另作清楚的描述,一般用作包括“和/或(and/or)”的含义。定义0042“蛋白酶”表示来源于微生物,例如真菌、细菌,或者来自植物或动物的蛋白或者蛋白的多肽结构域或者多肽,其具有在蛋白质骨架的一个或多个不同位置催化切开肽键的能力(例如E.C.3.4)。0043“酸性蛋白酶”指在酸性条件下具有水解蛋白的能力的蛋白酶。0044如此处所用,“NSP24家族蛋白酶”表示以其天然或野生型形式存在时具有蛋白酶活性的酶(例如图6的蛋白);与SEQIDNO2或SEQIDNO10的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少93%、至少95%、至少97%、至少98%和至少99%序列同一性的蛋白酶蛋白;SEQIDNO2或SEQIDNO10的氨基酸序列的衍生物,以及蛋白酶序列的生物学活性片段。0045如此处所用,“衍生物”表示来源于前体或母体蛋白(例如天然蛋白)的蛋白质,是通过在C-末端和N-末端之一或者两者上加入一个和多个氨基酸,在氨基酸序列中的一个或大量不同位点置换一个或多个氨基酸,在该蛋白的单个或两个末端或者在该氨基酸序列的一个或多个位点缺失一个或多个氨基酸,或者在该氨基酸序列中的一个或多个位点插入一个或多个氨基酸而获得的。0046如此处所用,“天然序列NSP24”或“野生型NSP24序列”包括与来源于自然的NSP24家族蛋白酶具有相同氨基酸序列的多肽。0047“生物学活性片段”(例如具有SEQIDNO10序列的NSP24家族蛋白酶的生物学活性片段)表示NSP24家族蛋白酶或NSP25家族蛋白酶,其具有蛋白酶活性,但所包含的序列少于NSP24家族蛋白酶或NSP25家族蛋白酶的前体或母体的全序列。0048如此处所用,术语“分离的”或“纯化的”指由于将蛋白酶从与其天然相关的一种或多种或所有天然存在的组分中分离出来而改变其天然状态的蛋白酶。0049“PepA”指酸性蛋白酶,具有与SEQIDNO7至少95%的序列同一性。0050“L388M”指变体PepA,其具有SEQIDNO7序列。0051如此处所用,“NSP25家族蛋白酶”表示与SEQIDNO9具有至少85%序列同一性的蛋白酶及其生物学活性片段。0052“与NSP24家族蛋白酶不相关的”表示具有一种氨基酸序列,其与SEQIDNO10的NSP24蛋白酶具有30%以下的同源性、20%以下的同源性或者10%以下的同源性。0053术语“肽”、“蛋白质”和“多肽”在本文中可以被互换使用。0054如此处所用,有关鉴定的氨基酸或核苷酸序列的“序列同一性百分比(%)”被定义为与感兴趣序列(例如NSP24家族蛋白酶序列)的氨基酸残基或核苷酸相一致的候选序列的氨基酸残基或核苷酸的百分比,这是经序列比对之后获得,且如有必要,引入空位,以便获得最大百分比的序列同一性,而不考虑作为部分序列同一性的任何保守取代。0055如此处所用,术语“α淀粉酶(例如E.C.类3.2.1.1)”指催化α-1,4-糖苷键水解的酶。此类酶也被描述为实现含有1,4-α-连接D-葡萄糖单位的多糖中1,4-α-D-糖苷键的外切或内切水解的酶。用于描述这些酶的另一个术语是“糖原酶”。示例性的酶包括α-1,4-葡聚糖-4-葡聚糖水化酶葡聚糖水解酶。0056如此处所用,术语“葡糖淀粉酶”指葡糖淀粉酶类的酶(例如E.C.3.2.1.3,葡糖淀粉酶,1,4-α-D-葡聚糖葡萄糖水化酶)。这些酶为外切作用酶,其从直链淀粉和支链淀粉分子的非还原性末端释放出葡糖基残基。尽管速度大大低于α-1,4键,但此酶也水解α-1,6键和α-1,3键。0057术语“启动子”表示一种调控序列,其涉及结合RNA聚合酶以启动基因转录。0058如此处所用,“异源启动子”是与基因或纯化的核酸非天然相关的启动子。0059如此处所用,多肽的“纯化的制剂”或“基本上纯的制剂”表示多肽已被从细胞、与其天然存在的其它蛋白质、脂类或核酸分离出来。0060如此处所用,在植物或动物细胞的情况下,“纯化的细胞制品”指细胞的体外制品,而非整个完整的植物或动物。在培养细胞或微生物细胞的情况下,其由至少10%且更优选地50%的受试细胞的制品组成。0061“基本上纯的核酸”,例如基本上纯的DNA,是这样的核酸,该核酸是以下的一种或者两者其与序列例如编码序列的之一或两者并非紧密相邻,其在所述核酸的来源生物中天然存在的基因组中与所述序列是紧密相邻的(例如5′末端的序列和3′末端的序列);或者其基本不含在所述核酸的来源生物中存在的核酸序列。该术语包括,例如重组DNA,其被整合入载体,例如整合入自我复制的质粒或病毒,或者整合入原核生物或真核生物的基因组DNA,或者其以独立于其它DNA序列的单独分子(例如通过PCR或限制性内切核酸酶处理而产生的cDNA或基因组DNA片段)存在。基本上纯的DNA还包括重组DNA,其为编码其它NSP24蛋白酶序列的杂合基因的一部分。0062如此处所用,“同源的”指两种多肽分子之间或者两种核酸分子之间的序列相似性。当两条比较序列中的位置都被相同的碱基或氨基酸单体亚基占据时,例如,若两DNA分子中每个分子的一个位置都被腺嘌呤所占据,那么所述分子在该位置上就是同源的。两序列间的同源性百分比,是两序列所共有的匹配位置或同源位置数除以所比较的位置数再乘以100的函数。例如,如果两序列中10个位置中的6个位置匹配或同源,那么两序列则为60%同源。通过举例的方式,DNA序列ATTGCC和TATGGC具有50%的同源性。一般地,在两序列比对时进行比较以提供最大同源性。0063如此处所用,术语“载体”指被设计为将核酸导入一种或多种细胞类型的多核苷酸序列。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌粒、盒以及类似载体。0064如此处所用,“表达载体”表示一种DNA构建物,其包含被可操纵地连接于合适的调控序列的DNA序列,所述调控序列能够影响该DNA在合适宿主中的表达。0065术语“表达”表示根据基因的核酸序列产生多肽的过程。0066如此处所用,术语“可操纵地连接”表示将调控区诸如启动子、终止子、分泌信号或增强子区结合于(attachedto)或连接于(linkedto)结构基因并控制该基因的表达。0067如此处所用,“来源于”微生物的物质(例如多核苷酸或蛋白质)表示该物质对于该微生物而言是天然的。0068如此处所用,“微生物”指细菌、真菌、病毒、原生动物以及其它的微生物或微观生物(microscopicorganisms)。0069如此处所用,“宿主菌株”或“宿主细胞”表示一种适合于表达载体的宿主,且包括所述细胞的后代,其中所述表达载体包括根据本发明的DNA。0070术语“丝状真菌”指所有丝状形式的真菌亚门(Eumycotina)生物(参见Alexopoulos,C.J.(1962),INTRODUCTORYMYCOLOGY,Wiley,NewYorkandAINSWORTHANDBlSBYDICTIONARYOFTHEFUNGI,9thEd.(2001)Kirk等,EdS.,CABInternationalUniversityPress,CambridgeUK)。这些真菌是通过带有细胞壁的营养菌丝体来加以表征的,其细胞壁包括几丁质、纤维素和其它复杂多糖。本发明的丝状真菌在形态学、生理学和遗传学上不同于酵母菌。丝状真菌的营养生长是通过菌丝的延伸进行的,碳的分解代谢是专性好氧的。0071如此处所用,术语“木霉属”或“木霉属某种”指以前或目前被分类为木霉属的任何真菌属。0072如此处所用,术语“四重缺失(quad-delete)”或“四重缺失的(quad-deleted)”宿主细胞指由木霉属宿主菌株细胞产生的细胞和原生质体,其缺少至少两个编码功能性内切葡聚糖酶(endoglucanases)的基因和至少两个编码功能性纤维二糖水解酶(cellobiohydrolases)的基因。0073如此处所用,术语“培养”指使微生物细胞群落在适当条件下在液体或固体培养基中生长。在一种实施方式中,培养指将淀粉底物诸如包含颗粒淀粉的底物经发酵生物转化为终产物(一般在容器或反应器中进行)。发酵是通过微生物将有机物质酶促厌氧降解以产生较简单的有机化合物。当发酵过程在厌氧条件下进行时,并非意欲将该术语仅仅限定在严格的厌氧条件,因为发酵也在氧存在下进行。0074如此处所用,术语“接触”指将各种酶(一种或多种)放置于足够接近各种底物之处,以使所述酶(一种或多种)能够将该底物转变成为终产物。本领域的技术人员将认识到酶与各种底物的混合溶液可以实现接触。0075在关于将核酸序列中插入细胞的上下文中,术语“导入的”表示“转染”、或“转化”或“转导”,且包括涉及将核酸序列整合入真核或原核细胞,其中该核酸序列可以被整合入该细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中,转变成自主复制元或者是被瞬时表达(例如,转染的mRNA)。0076如此处所用,有关细胞所用的术语“转化的”、“稳定转化的”和“转基因的”表示该细胞含有非天然的(例如异源的)核酸序列,该核酸序列或者整合入其基因组或者作为染色体外质粒被保持多代。0077如此处所用,有关多肽或多核苷酸的术语“异源的”指在宿主细胞中并非天然存在的多肽或多核苷酸。0078术语“过量表达”表示在宿主细胞中表达多肽的过程,其中多核苷酸已被导入该宿主细胞中。0079如此处所述,本发明的一个方面的特征是“基本上纯的”(或重组的)核酸,其包括编码NSP24家族蛋白酶或NSP25家族蛋白酶的核苷酸序列、和/或此类核酸的等价物。0080术语“等价物”指编码功能上等价的多肽的核苷酸序列。等价的核苷酸序列将包括由于一个或多个核苷酸置换、添加或缺失而有所不同的序列,诸如等位基因变体。例如在一些实施方式中,由于遗传密码的简并性,等价的核苷酸序列包括不同于SEQIDNO8核苷酸序列的序列,所述SEQIDNO8核苷酸序列编码SEQIDNO2中所示的NSP24蛋白酶。0081如此处所用,术语“糖化作用”指将淀粉酶促转化成为葡萄糖。0082如此处所用,“淀粉”指由植物的复合多糖碳水化合物组成的任何物质,包括具有式(C6H10O5)x的直链淀粉和支链淀粉,其中X可以是任何数字。0083术语“颗粒淀粉”指生的未熟化的(生的)淀粉(例如尚未经过糊化的淀粉)。0084如此处所用,术语“凝胶化作用”表示通过熟化将淀粉分子溶解以形成粘性悬浮液。0085如此处所用,术语“液化作用”指淀粉转化的阶段,其间凝胶化的淀粉被水解以提供低分子量的可溶性糊精。0086如此处所用,术语“可溶性淀粉水解物”指由淀粉水解产生的可溶性产物,其可以包含单糖、二糖和寡糖(例如葡萄糖、麦芽糖和更高级的糖)。0087术语“单糖”表示聚合物诸如淀粉的一个单体单位,其中聚合度(DP)是1(例如葡萄糖、甘露糖、果糖和半乳糖)。0088术语“二糖”表示一种包含两个共价连接的单糖单位的化合物(DP2)(例如蔗糖、乳糖和麦芽糖)。0089术语“DP3+”表示各种聚合度在3以上的聚合物。蛋白酶和编码它们的多核苷酸0090本发明涉及NSP24家族蛋白酶,诸如酸性蛋白酶,并且还涉及酸性真菌蛋白酶,其与SEQIDNO2蛋白酶或SEQIDNO10蛋白酶(图6)具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少93%、至少95%、至少97%、至少98%、至少99%的序列同一性。在一些实施方式中,NSP24家族蛋白酶被命名为NSP24,其包括SEQIDNO10的序列(成熟蛋白序列)或者还包括SEQIDNO2的前蛋白序列。0091在一些实施方式中,本发明涉及NSP24家族蛋白酶的生物学活性片段。在一些实施方式中,生物学活性片段包括具有至少250个氨基酸残基、至少300个氨基酸残基、至少350个氨基酸残基、至少375个氨基酸残基以及至少400个氨基酸残基的蛋白酶。0092在其它实施方式中,生物学活性片段包括多肽序列的至少60%、至少70%、至少80%、至少85%、至少90%、至少93%、至少95%、至少97%、至少98%、至少99%,所述多肽序列与图6中的蛋白质序列(SEQIDNO2或SEQIDNO10)具有至少80%、至少85%、至少90%、至少93%、至少95%、至少97%、至少98%和至少99%的序列同一性。在一些实施方式中,生物学活性片段将包括多肽序列的至少60%、至少70%、至少80%、至少85%、至少90%、至少95%和至少98%,所述多肽序列与具有SEQIDNO2或SEQIDNO10的母体NSP24蛋白酶具有至少95%的序列同一性。在一些实施方式中,生物学活性片段将包括多肽序列的至少60%、至少70%、至少80%、至少85%、至少90%、至少95%和至少98%,所述多肽序列与具有SEQIDNO2或SEQIDNO10的母体NSP24蛋白酶具有至少99%的序列同一性。0093在一些实施方式中,生物学活性片段为体内存在的多种片段,例如由转录后加工所产生的片段或者由选择性剪接的RNA的翻译所产生的片段。片段包括那些在天然的或内源性的细胞中表达的片段,例如由于翻译后加工、例如由于氨基末端信号序列的去除产生的片段,并包括在表达系统例如CHO细胞中产生那些片段。一些优选的片段是这样的片段,例如活性片段,其由蛋白水解切割或选择性剪接事件而产生。因为肽诸如NSP24家族蛋白酶通常表现出一定范围的生理学特性,并且因为此类特性可以被归因于由该分子的不同部分引起的,所以有用的NSP24家族蛋白酶片段或NSP24家族蛋白酶类似物是在任何NSP24蛋白酶活性生物学试验中表现出生物学活性的那些。0094在一些实施方式中,生物学活性片段包括具有SEQIDNO2或SEQIDNO10的NSP24的蛋白酶活性的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%和至少100%。在一些优选的实施方式中,片段或类似物在任何体内或体外NSP24蛋白酶试验中具有NSP24蛋白酶(SEQIDNO2或SEQIDNO10)的蛋白酶活性的至少40%或至少90%。0095NSP24家族蛋白酶或NSP25家族蛋白酶的片段可以通过本领域技术人员所已知的方法生成。表现出蛋白酶生物学活性的候选片段的能力可以通过如此处所述的本领域技术人员已知的方法加以评估。同样包括在内的是NSP24家族蛋白酶或NSP25家族蛋白酶,其含有对于该肽的生物学活性非必需的残基或者由于选择性mRNA剪接或选择性蛋白质加工事件所产生的残基。0096在一些实施方式中,本发明所包括的蛋白酶是具有SEQIDNO2或SEQIDNO10的蛋白酶的衍生物。衍生物可以与SEQIDNO10具有至少80%、85%、90%、93%、95%、97%、98%和99%的序列同一性。0097本发明也包括多种蛋白酶类似物。蛋白酶类似物是带有增加肽稳定性的修饰的那些;此类类似物可以在肽序列中含有例如一个或多个非肽键(其取代了肽键)。同样包括在内的是包括除天然存在的L-氨基酸以外的残基例如D-氨基酸,或者非天然存在的或合成氨基酸,例如b或氨基酸的类似物;以及环状类似物。类似物在氨基酸序列方面或者不涉及序列的方面或者两个方面,都不同于天然存在的蛋白酶诸如NSP24或NSP25蛋白。非序列修饰包括本发明所包括的蛋白酶的体内或体外的化学衍生作用。非序列修饰作用包括乙酰化作用、甲基化作用、磷酸化作用、羧化作用或糖基化作用的变化。0098在进一步的实施方式中,本发明包括NSP25家族蛋白酶。NSP25家族蛋白酶是与SEQIDNO9的成熟蛋白序列(图9)具有至少85%、至少90%、至少93%、至少95%、至少97%、至少98%和至少99%氨基酸序列同一性的酸性蛋白酶,或者它们的生物学活性片段。一种具体的NSP25家族蛋白酶是具有SEQIDNO9的被命名为NSP25的蛋白酶。在一些实施方式中,NSP25家族蛋白酶将是一种蛋白酶的生物学活性片段,其包括与SEQIDNO9具有至少90%序列同一性的序列的至少75%、至少80%、至少85%、至少90%和至少95%。在另一个实施方式中,NSP25家族蛋白酶将是一种蛋白酶的生物学活性片段,其包括与SEQIDNO9具有至少95%序列同一性的序列的至少75%、至少80%、至少85%、至少90%和至少95%。0099尽管根据本发明的酸性蛋白酶能够在酸性条件下水解蛋白,但在一些实施方式中,蛋白酶活性的最适pH是在pH3.0至5.5的范围内。在一些实施方式中,蛋白酶活性的最适pH范围是在pH3.0至5.0之间,而在其它实施方式中,蛋白酶活性的最适pH范围是在pH3.0至4.5之间。0100根据本发明的蛋白酶,诸如NSP24家族蛋白酶或NSP25家族蛋白酶,可以包括氨基酸置换诸如使用L-氨基酸进行“保守氨基酸的置换”,其中一种氨基酸被另一种生物学相似的氨基酸置换。保守氨基酸的置换是那些保持了被置换的氨基酸的总电荷、疏水性/亲水性、和/或空间体积(stericbulk)的置换。保守置换的实例是在下列各组间进行的置换Gly/Ala、Val/Ile/Leu、Lys/Arg、Asn/Gln、Glu/Asp、Ser/Cys/Thr和Phe/Trp/Tyr。衍生物可以例如有少至1至10个氨基酸残基不同,诸如6-10个、少至5个、少至4个、3个、2个或者甚至1个氨基酸残基不同。表1举例说明了本领域所公认的示例性的氨基酸置换。此外,置换可以通过一种或多种不破坏蛋白酶生物学活性的非保守性氨基酸置换、缺失或插入来完成。表1保守氨基酸的置换0101在一些实施方式中,本发明的蛋白酶是天然的序列。此类天然序列可以从自然界分离或者可以通过重组或合成的方式产生。术语“天然序列”具体地包括天然存在的截短形式或分泌形式的NSP24或NSP25家族蛋白酶(例如生物学活性片段),以及天然存在的变体形式(例如选择性剪接的形式)。0102在一些实施方式中,本发明的酸性蛋白酶是PepA蛋白酶,其与SEQIDNO7具有至少97%、至少98%和至少99%的序列同一性。在一些实施方式中,该蛋白酶具有SEQIDNO7序列并被命名为“L388M”。在进一步的实施方式中,该蛋白酶由具有SEQIDNO5或SEQIDNO3序列的核苷酸序列所编码。0103本发明还涉及编码本发明所包括的蛋白酶的多核苷酸序列。一些此类多核苷酸包括a)编码NSP24家族蛋白酶的多核苷酸,该蛋白酶与SEQIDNO2或SEQIDNO10具有至少80%、至少85%、至少90%、至少93%、至少95%、至少97%、至少98%和至少99%的序列同一性;b)编码SEQIDNO2序列的多核苷酸;c)具有SEQIDNO8序列的多核苷酸;d)编码NSP24家族蛋白酶生物学活性片段的多核苷酸;e)与SEQIDNO8序列具有至少80%、至少85%、至少90%、至少95%、至少97%、至少98%和至少99%的序列同一性的多核苷酸;f)与对应于SEQIDNO4、SEQIDNO8或者SEQIDNO4或SEQIDNO8片段的DNA序列的核酸探针相杂交的多核苷酸,所述片段具有至少10、15、20、30、40、50、60、70、80、90、100或150个连续的核苷酸;g)编码NSP25家族蛋白酶的多核苷酸,其与SEQIDNO4具有至少85%、至少90%、至少93%、至少95%、至少97%、至少98%和至少99%的序列同一性;h)编码SEQIDNO9蛋白酶的多核苷酸;i)具有SEQIDNO4序列的多核苷酸;j)编码NSP25家族蛋白酶的生物学活性片段的多核苷酸;k)编码SEQIDNO7的序列及其生物学活性片段的多核苷酸;和l)具有SEQIDNO3或SEQIDNO5序列的多核苷酸。0104因为遗传密码的简并性,一个以上的密码子可以被用于编码一具体氨基酸。因此,不同的DNA序列可以编码与例如SEQIDNO2多肽具有相同氨基酸序列的多肽。本发明包括编码此同一多肽的多种多核苷酸。0105当单链形式的核酸能够在适宜的温度和溶液离子强度条件下与其它核酸进行退火时,则该核酸可与另一核酸序列杂交。对于低、中、高以及极高严紧性条件的杂交而言,杂交和清洗条件为本领域所熟知(参见例如Sambrook(1989)supra,具体是第9章和第11章)。一般而言,杂交涉及核苷酸探针和同源DNA序列,其通过互补多核苷酸广泛的碱基配对形成稳定的双链杂合体(同样参见第8章,GeneCloning,AnIntroduction,T.A.Brown(1995)ChapmanandHallLondon)。在一些实施方式中,可以将带有探针和同源序列的滤膜在2×氯化钠/柠檬酸钠(SSC)、0.5%SDS中,在大约60℃(中等严紧性)、65℃(中/高严紧性)、70℃(高严紧性)和大约75℃(非极高严紧性)下进行洗涤(CurrentProtocolsinMolecularBiology,JohnWiley&Sons,NewYork,1989,6.3.1-6.3.6,在此被并入本文作为参考)。0106包括在本发明内的是等位基因变异;天然突变体;诱导突变体;由在高或低严紧性条件下与编码SEQIDNO2、SEQIDNO8、SEQIDNO9和SEQIDNO10的多肽的核酸杂交的DNA所编码的蛋白;以及被抗血清特异性结合至具有SEQIDNO2或SEQIDNO10的NSP24蛋白酶的多肽,尤其是被抗血清特异性结合至NSP24蛋白酶的活性位点或结合结构域的多肽。在一些实施方式中,编码本发明的NSP24家族蛋白酶的核酸,诸如编码SEQIDNO2的NSP24蛋白酶的核酸,在高严紧性条件下,与对应于来自SEQIDNO8的至少12、15或20个连续核苷酸的核酸杂交。0107本发明的核酸和多肽包括由于所公开序列中的测序错误而不同于本文所公开的序列的那些核酸和多肽。0108DNA序列的同源性由两DNA序列间的同一性程度确定。可以用计算机程序来确定多肽序列或核苷酸序列的同源性或者同一性百分比。进行序列联配以及确定序列同一性的方法是技术人员已知的,可以不经过过多的实验而进行,并且可以明确地计算出同一性的值。参见,例如Ausubel等eds.(1995)CurrentProtocolsinMolecularBiology,Chapter19(GreenePublishingandWiley-Interscience,NewYork);和ALIGN程序(Dayhoff(1978)inAtlasofProteinSequenceandStructure5Suppl.3(NationalBiomedicalResearchFoundation,Washington,D.C.)。有大量用于比对序列和确定序列同一性的算法是可利用的,包括,例如Needleman等(1970)J.Mol.Biol.48443的同源性联配算法;Smith等(1981)Adv.Appl.Math.2482的局部同源性联配算法;Pearson等(1988)Proc.Natl.Acad.Sci.852444的相似性搜索法;Smith-Waterman算法(Meth.Mol.Biol.70173-187(1997);以及BLASTP、BLASTN和BLASTX算法(参见Altschul等(1990)J.Mol.Biol.215403-410)。使用这些算法的计算机化程序也是可利用的,包括但不限于ALIGN或Megalign(DNASTAR)软件、或者WU-BLAST-2(Altschul等,Meth.Enzym.,266460-480(1996));或者GAP、BESTFIT、BLASTAltschul等,supra、FASTA和TFASTA,可获自GeneticsComputingGroup(GCG)包,Version8,Madison,Wis.,USA;和PC/Gene程序中的CLUSTAL,Intelligenetics,MountainView,Calif。本领域的技术人员可以确定用于测量联配的合适参数,包括用于在所比较的序列长度内获得最大联配所需的算法。优选地,使用程序确定的默认参数来测定序列同一性。具体而言,序列同一性可以通过Smith-Waterman同源性搜索算法加以测定(Meth.Mol.Biol.70173-187(1997)),如在MSPRCH程序(OxfordMolecular)中使用拟合空位搜索(affinegapsearch),并使用下列搜索参数所进行的空位开放罚分为12,空位延伸罚分为1。优选地,成对的氨基酸比较可以使用GeneticsComputerGroup,Inc.,Madison,Wis.的GCG序列分析软件包中的GAP-程序进行,其使用blosum62氨基酸置换矩阵,空位权重为12,长度权重为2。关于两氨基酸序列的最适联配,变体氨基酸序列的连续片段相对于参比氨基酸序列而言可以含有额外的氨基酸残基或缺失的氨基酸残基。被用于与参比氨基酸序列进行比较的连续片段将包括至少20个连续的氨基酸残基,并可以是30、40、50、或更多个氨基酸残基。可以通过指定空位罚分,对衍生物的氨基酸序列中与包含空位有关的增加的序列同一性进行校正。0109在一些实施方式中,本发明所包括的蛋白酶(例如与SEQIDNO2序列具有至少80%序列同一性的NSP24家族蛋白酶),来源于细菌或真菌诸如丝状真菌。一些优选的丝状真菌包括曲霉属某些种(Aspergillusspp.)和木霉属某些种(Trichodermaspp.)。一种优选的木霉为里氏木霉(T.reesei)。然而,根据本发明的蛋白酶和/或编码蛋白酶的DNA可以是来源于真菌,诸如犁头霉属某些种(Absidiaspp.);枝顶孢霉属某些种(Acremoniumspp.);伞菌属某些种(Agaricusspp.);Anaeromycesspp.;曲霉属某些种(Aspergillusspp.),包括刺孢曲霉(A.aculeatus)、泡盛曲霉(A.awamori)、黄曲霉(A.flavus)、臭曲霉(A.foetidus)、A.fumaricus、烟曲霉(A.fumigatus)、构巢曲霉(A.nidulans)、黑曲霉(A.niger)、米曲霉(A.oryzae)、土曲霉(A.terreus)和杂色曲霉(A.versicolor);Aeurobasidiumspp.;Cephalosporumspp.;毛壳菌属某些种(Chaetomiumspp.);鬼伞属某些种(Coprinusspp.);Dactyllumspp.;镰刀菌属某些种(Fusariumspp.),包括F.conglomerans、砖红镰刀菌(F.decemcellulare)、爪哇镰刀菌(F.javanicum)、亚麻镰刀菌(F.lini)、尖镰孢菌(F.oxysporum)和茄腐镰刀菌(F.solani);粘帚霉属某些种(Gliocladiumspp.);腐质霉属某些种(Humicolaspp.),包括特异腐质霉(H.insolens)和疏棉状腐质霉(H.lanuginose);毛霉属某些种(Mucorspp.);脉孢菌属某些种(Neurosporaspp.),包括粗糙脉孢菌(N.crassa)和好食脉孢霉(N.sitophila);Neocallimastixspp.;Orpinomycesspp.;青霉属某些种(Penicilliumspp.);显革菌属某些种(Phanerochaetespp.);Phlebiaspp.;Piromycesspp.;根霉属某些种(Rhizopusspp.);裂褶菌属某些种(Schizophyllumspp.);栓菌属某些种(Trametesspp.);木霉属某些种(Trichodermaspp.),包括里氏木霉(T.reesei)、里氏木霉(T.reesei)(长枝木霉(T.longibrachiatum))和绿色木霉(T.viride);和接合霉属某些种(Zygorhynchusspp.)。宿主细胞0110在一些实施方式中,本发明提供了用本文所述的DNA构建物和载体转化的宿主细胞。在一些实施方式中,被导入宿主细胞的编码本发明所包括的蛋白酶(例如与SEQIDNO2具有至少95%序列同一性的NSP24家族蛋白酶)的多核苷酸编码异源性蛋白酶,而在其它实施方式中,该多核苷酸编码在宿主细胞中过量表达的内源性蛋白酶。在一些实施方式中,本发明提供了在宿主细胞诸如细菌和真菌宿主细胞中发挥功能的基因启动子控制下,异源性蛋白酶基因的表达或者蛋白酶基因的过量表达。0111一些优选的宿主细胞包括丝状真菌细胞。丝状真菌宿主细胞的非限定性实例包括木霉属某些种(Trichodermaspp.)(例如绿色木霉(T.viride)和里氏木霉(T.reesei)、红褐肉座菌(Hypocreajecorina)的无性型,以前被分类为长枝木霉(T.longibrachiatum))、青霉属某些种(Penicilliumspp.)、腐质霉属某些种(Humicolaspp.)(例如特异腐质霉(H.insolens)和灰色腐质霉(H.grisea))、曲霉属某些种(Aspergillusspp.)(例如黑曲霉(A.niger)、构巢曲霉(A.nidulans)、米曲霉(A.orzyae)和泡盛曲霉(A.awamori))、镰刀菌属某些种(Fusariumspp.)(禾赤镰孢菌(F.graminum))、脉孢菌属某些种(Neurosporaspp.)、肉座菌属某些种(Hypocreaspp.)和毛霉属某些种(Mucorspp.)。进一步地,宿主细胞可以包括芽孢杆菌属某些种(Bacillusspp.)(例如枯草芽孢杆菌(B.subtilis)、地衣芽孢杆菌(B.licheniformis)、缓慢芽孢杆菌(B.Lentus)、脂肪嗜热芽孢杆菌(B.stearothremophilus)和短小芽胞杆菌(B.brevis))以及链霉菌属某些种(Streptomycesspp.)(例如杂色链霉菌(S.coelicolor)和变铅青链霉菌(S.lividans)(TK23和TK21))。分子生物学0112本发明依靠重组遗传领域的常规技术。公开本发明中的一般使用方法的基本教科书包括Sambrook等MolecularCloning,ALaboratoryManual(2nded.1989);Kriegler,GeneTransferandExpressionALaboratoryManual(1990);和Ausubel等,eds.,CurrentProtocolsinMolecularBiology(1994))。0113异源基因,包括例如丝状真菌的基因启动子序列,一般在转化进入宿主细胞诸如里氏木霉细胞进行复制和/或表达以前,被克隆进中间载体。这些中间载体一般是原核载体,例如质粒或穿梭载体。0114为获得克隆基因的高水平表达,异源基因与启动子间的距离优选地同天然存在的基因与启动子间的距离大约相同。然而,如本领域已知,在不损失启动子功能的条件下,对此距离的一些变化是可以接受的。0115本领域的技术人员应认识到,在不改变其功能的条件下,天然启动子可以通过置换(replacement)、取代、添加或消除一个或多个核苷酸而被修饰。本发明实践包括而不限于对启动子的此类改变。0116表达载体/构建物一般包含转录单位或表达盒,其包含表达异源序列所需的全部额外的元件。因此,典型的表达盒包含被可操纵地连接于异源核酸序列的启动子和对转录物进行有效的多聚腺苷酸化、核糖体结合位点以及翻译终止所需的信号。盒的其它元件可以包括增强子,且如果基因组DNA被用作结构基因,则还包括携带功能性剪接供体位点和受体位点的内含子。0117本发明实践并不受到对遗传构建物中启动子的选择所限制。但是,示例性的启动子为里氏木霉cbh1、cbh2、eg1、eg2、eg3、eg5、xln1和xln2启动子。同样,来自泡盛曲霉和黑曲霉葡糖淀粉酶基因(glaA)的启动子(Nunberg等(1984)Mol.CellBiol.42306-2315)以及来自构巢曲霉乙酰胺酶的启动子可以用于所述的载体。被用于枯草芽孢杆菌所用载体的优选启动子为AprE启动子;大肠杆菌所用的优选启动子为Lac启动子,酿酒酵母(Saccharomycescerevisiae)所用的优选启动子为PGK1,黑曲霉(Aspergillusniger)所用的优选启动子为glaA,而里氏木霉(Trichodermareesei)的优选启动子为cbh1。0118除启动子序列以外,表达盒应当还包含结构基因的转录终止区下游以提供有效的终止作用。终止区可以从与启动子序列相同的基因中获得,或者可以从不同的基因中获得。0119尽管任何真菌终止子在本发明中都有可能是有用的,但是一些优选的终止子包括来自构巢曲霉trpC基因(Yelton,M.等(1984)PNASUSA811470-1474,Mullaney,E.J.等(1985)MGG19937-45)、泡盛曲霉或黑曲霉葡糖淀粉酶基因(Nunberg,J.H.等(1984)Mol.CellBiol.42306,Boel,E.等(1984)EMBOJ.31581-1585)、米曲霉TAKA淀粉酶基因和米氏毛霉(Mucormiehei)羧基蛋白酶基因(EPO公布号.0215594)的终止子。0120用于将遗传信息传送入细胞的具体表达载体并非特别关键。用于在真核或原核细胞表达的任何常规载体都可以被使用。标准的细菌表达载体包括噬菌体λ和M13,以及质粒诸如基于pBR322的质粒、pSKF、pET23D,和融合表达系统诸如MBP、GST和LacZ。也可以给重组蛋白添加表位标签,以提供简便的分离方法,例如c-myc。适当的表达和/或整合载体实例在Sambrook等(1989)supra、Bennett和Lasure(Eds.)MoreGeneManipulationsinFungi,(1991)AcademicPresspp.70-76与pp.396-428及其所引用的文章;USP5,874,276以及真菌遗传保藏中心菌株目录(FungalGeneticStockCenterCatalogueofStrains)(FGSC,www.fgsc.net.)中提供。可以从Promega和Invitrogen获得有用的载体。一些具体的有用载体包括pBR322、pUC18、pUC100、pDONTM201、pENTRTM、pGEN3Z和pGEN4Z。然而,本发明意欲包括其它形式的表达载体,其具有发挥着等效的功能并且已被或正在被本领域所知晓。因此,大量的各种宿主/表达载体的组合可以被用于表达本发明的DNA序列。有用的表达载体,例如,可以包括染色体的、非染色体的和合成的DNA序列的片段,诸如各种已知的SV40衍生物和已知的细菌质粒,例如来自大肠杆菌的质粒,包括colE1、pCR1、pBR322、pMb9、pUC19以及它们的衍生物、宿主范围更广的质粒,例如RP4、噬菌体DNA例如大量的λ噬菌体的衍生物,例如NM989,以及其它DNA噬菌体例如M13和丝状单链DNA噬菌体、酵母质粒诸如2μ质粒或其衍生物。0121在一些实施方式中,表达载体包括选择性标记。选择性标记的实例包括赋予其抗微生物抗性的标记。营养型标记也可用于本发明中,包括那些本领域已知的标记如amdS、argB和pyr4。用于转化木霉的有用标记是本领域已知的(参见例如Finkelstein,chapter6,inBiotechnologyofFilamentousFungi,Finkelstein等,EDSButterworth-Heinemann,BostonMA(1992)和Kinghorn等,(1992)AppliedMolecularGeneticsofFilamentousFungi,BlackieAcademicandProfessional,ChapmanandHall,London)。在一些实施方式中,表达载体还将包括复制元、编码抗生素抗性的基因,这使得能够对包容重组质粒的细菌进行选择,以及包括质粒非必需区中独特的限制性位点,以使得能够插入异源序列。所选的具体抗生素抗性基因并非关键性的,本领域已知的许多抗性基因中的任何一个都是适用的。优选地选择原核序列,这样,它们便无法干扰DNA在里氏木霉中的复制和整合。0122本发明的转化方法可以导致将全部或部分转化载体稳定整合入宿主细胞诸如丝状真菌宿主细胞的基因组中。但是,还考虑的转化作用是,其导致了自我复制的染色体外转化载体的维持。0123许多标准的转染方法可以被用于产生表达大量蛋白酶的细菌或丝状真菌(例如曲霉属或木霉属)细胞系。一些公布的将DNA构建物导入产纤维素木霉属菌株的方法包括Lorito,Hayes,DiPietro和Harman,(1993)Curr.Genet.24349-356;Goldman,VanMontagu和Herrera-Estrella,(1990)Curr.Genet.17169-174;和Penttila,Nevalainen,Ratto,Salminen和Knowles,(1987)Gene6155-164,也参见USP6,022,725;USP6,268,328和Nevalainen等,″TheMolecularBiologyofTrichodermaanditsApplicationtotheExpressionofBothHomologousandHeterologousGenes″inMolecularIndustrialMycology,Eds,LeongandBerka,MarcelDekkerInc.,NY(1992)pp129-148;对于曲霉属而言,包括Yelton、Hamer和Timberlake,(1984)Proc.Natl.Acad.Sci.USA811470-1474,对于镰刀菌属而言,包括Bajar,Podila和Kolattukudy,(1991)Proc.Natl.Acad.Sci.USA888202-8212,对于链霉菌属而言,包括Hopwood等,1985,GeneticManipulationofStreptomycesLaboratoryManual,TheJohnInnesFoundation,Norwich,UK和Femandez-Abalos等,Microbiol1491623-1632(2003),而对于芽孢杆菌属而言,包括Brigidi,DeRossi,Bertarini,Riccardi和Matteuzzi,(1990)FEMSMicrobiol.Lett.55135-138。0124然而,将外源核苷酸序列导入宿主细胞的任何熟知的方法都可以被使用。这些方法包括使用磷酸钙-转染法、polybrene法、原生质体融合、电穿孔、生物射弹法(biolistics)、脂质体、显微注射、原生质载体、病毒载体以及任何其它熟知的将克隆的基因组DNA、cDNA、合成DNA或其它外源遗传物质导入宿主细胞的方法(参见例如Sambrook等,supra)。同样使用的是美国专利号6,255,115中所述的农杆菌介导的转染法。唯一必不可少的是所用的具体遗传工程方法应当是能够将至少一种基因成功地导入能够表达该基因的宿主细胞中。在一种实施方式中,本发明涉及一种生产本发明所包括的蛋白酶(例如NSP24家族蛋白酶)的方法,其包括向宿主细胞中导入包含启动子的多核苷酸,该启动子被可操纵地连接于编码蛋白酶诸如NSP家族蛋白酶的核酸;在适于蛋白酶表达和产生的合适培养条件下培养该宿主细胞;并产生所述的蛋白酶。在一些优选的实施方式中,蛋白酶是与SEQIDNO2或SEQIDNO10具有至少95%序列同一性的NSP24家族蛋白酶或者其生物学活性片段。0125当表达载体被导入细胞后,转染的细胞或转化的细胞被培养在适于基因表达的条件下,并受到蛋白酶基因启动子序列的控制。大批量的转化的细胞可以如下文实施例3中所述进行培养。最后,使用标准技术从培养物中回收产物。0126因此,本发明在此提供了所需多肽的表达和增强的分泌,该多肽的表达是在基因启动子序列的控制之下,所述基因启动子序列包括天然存在的蛋白酶基因、融合DNA序列以及多种异源构建物。本发明还提供了表达和分泌高水平的此类所需多肽的方法。蛋白表达0127本发明的蛋白质是由用载体诸如含有基因的表达载体转化的培养细胞产生的,所述基因的表达是在基因启动子序列控制之下。本发明对于增强蛋白质诸如本发明所包括的蛋白酶的细胞内和/或细胞外产生特别有用。蛋白质可以是同源的或者异源的。对于所述基因表达的适宜条件包括向培养物中提供本发明的诱导供给组合物(inducingfeedcomposition)。生产该蛋白的最适条件将随对宿主细胞的选择以及随对将要表达的蛋白酶蛋白的选择而变化。通过常规的实验和优化作用,本领域的技术人员将会容易地确定此类条件。0128感兴趣的蛋白酶蛋白可以在表达后被分离或回收并纯化。根据样品中存在的其它组分,感兴趣的蛋白可以按本领域技术人员已知的各种方法加以分离或纯化。标准的纯化方法包括电泳技术、分子技术、免疫技术和层析技术,所述层析技术包括离子交换层析、疏水层析、亲合层析以及反相HPLC色谱和色谱聚焦。例如,感兴趣的蛋白可以用标准的抗感兴趣蛋白的抗体柱加以纯化。结合蛋白质浓缩,超滤和透析技术也是有用的。合适纯化技术的一般指南,参见Scopes,ProteinPurification(1982)。必需的纯化程度将根据感兴趣蛋白质的用途而变化。在一些实例中,将不必进行纯化。细胞培养0129宿主细胞和转化细胞可以培养在常规的营养培养基中。转化的宿主细胞的培养基可以根据适合于活化启动子以及选择转化体来进行修改。具体的培养条件诸如温度、pH及类似的条件可以是用于被选择用来表达的宿主细胞的那些条件,并且对于本领域的技术人员而言将是显而易见的。此外,优选的培养条件可以在科学文献诸如Sambrook,(1982)supra;Kieser,T,MJ.Bibb,MJ.Buttner,KFChater,andD.A.Hopwood(2000)PRACTICALSTREPTOMYCESGENETICS.JohnInnesFoundation,NorwichUK;Harwood.等,(1990)MOLECULARBIOLOGICALMETHODSFORBACILLUS,JohnWiley中和/或从美国典型培养物保藏中心(ATCC;www.atcc.org)中找到。真菌宿主细胞诸如木霉细胞的稳定转化体一般可以根据其较快的生长速度或者在固体培养基上形成带有光滑而非粗糙轮廓的圆形克隆而区别于非稳定转化体。表达多肽的回收和纯化蛋白酶的方法0130本发明所包括的多肽,诸如由转化宿主细胞所产生的与SEQIDNO10具有至少80%序列同一性的多肽,可以从培养基中回收,这通过多种常规方法进行,包括通过离心或过滤将宿主细胞从培养基中分离出来,或者如有必要,裂解细胞并从细胞级分或细胞残骸移取上清。在一些情况下,经过澄清之后,上清或滤液中的蛋白质组分利用盐例如硫酸铵进行沉淀。然后,将沉淀的蛋白质溶解并可以通过各种层析方法例如离子交换层析、凝胶过滤层析、亲合层析以及其它本领域所认知的方法进行纯化。肽和蛋白质的抗体可以通过免疫动物例如兔或小鼠来进行制备,并通过现有技术的方法回收抗-NSP24蛋白酶抗体。0131用于本发明的试验包括,但不限于WO9934011和USP6,605,458中所述的那些试验。组合物和应用0132在一些实施方式中,本发明涉及包含如此处所述的本发明的蛋白酶的组合物。在根据本发明的组合物以及应用中有用的蛋白酶的一些非限制性实例包括例如NSP24家族蛋白酶或者NSP25家族蛋白酶,更具体地与SEQIDNO2具有至少85%序列同一性的NSP24家族蛋白酶或者其生物学活性片段,诸如与SEQIDNO10序列具有至少90%序列同一性的蛋白酶。在一些实施方式中,酶组合物为单组分蛋白酶组合物。在一些实施方式中,本发明涉及在工业和商业应用中使用本发明的蛋白酶的方法。组合物与工业应用的下列描述意欲为示例性的而非包括性的。0133包括本发明蛋白酶的组合物可以进一步包括其它酶类,诸如,但不限于,葡糖淀粉酶、α淀粉酶、颗粒淀粉水解酶、纤维素酶、脂酶、木聚糖酶、角质酶、半纤维素酶、氧化酶以及它们的组合。0134在一些优选的实施方式中,组合物将包括本发明的蛋白酶和葡糖淀粉酶,所述蛋白酶与SEQIDNO10序列具有至少85%的序列同一性。葡糖淀粉酶可以是从丝状真菌来源诸如曲霉属、木霉属或根霉属菌株获得的野生型葡糖淀粉酶,或者葡糖淀粉酶可以是蛋白质工程化葡糖淀粉酶,诸如黑曲霉葡糖淀粉酶的变体。在其它优选的实施方式中,组合物将包括本发明的蛋白酶和α淀粉酶。在一些实施方式中,α淀粉酶可以从细菌来源诸如芽孢杆菌属某些种或者从真菌来源诸如曲霉属某些种获得。在一些实施方式中,组合物可以包括根据本发明的蛋白酶以及葡糖淀粉酶和α淀粉酶。这些酶类的商业来源是已知的,并且可从例如GenencorInternational,Inc.和NovozymesA/S获得。0135在若干实施方式中,本发明已考虑用于乙醇生产、烘焙、果汁生产、酿造、蒸馏、酒类制造、皮革、油类与脂肪、纸与浆以及动物饲料生产。0136在其它实施方式中,本发明被考虑作为去污剂和清洁产品的活性“生物学”组分。在此,蛋白酶、淀粉酶和脂酶被用于分解蛋白质、淀粉和脂肪污渍。本发明的实施方式包括通过进行稳定性研究测试酶类与去污剂组分的相容性以及在多种配方中测试它们。0137仍在另一实施方式中,本发明考虑了将淀粉液化并糖化为葡萄糖并异构化为果糖的酶促用途。本发明可以被用于将大体积的植物底物,诸如粮食(例如玉米、小麦、蜀黍、黑麦及类似物)转变为增甜剂,如高果糖玉米糖浆和麦芽糖糖浆。0138本发明的酶(一种或多种)可应用于食品和饲料工业以提高蛋白质的可消化性。蛋白酶还被用于多种工业应用方面,具体而言,用于纺织品、平版印刷、化学工艺、农业、环境废弃物转化、生物浆加工、生物量转化为燃料以及其它化学方法(一种或多种)。进而,该蛋白酶被应用于保健及个人护理产品诸如化妆品、皮肤护理品、牙膏及类似物。饲料0139本文所述的本发明酶被用于动物饲料。所述饲料可以包括植物材料诸如玉米、小麦、高梁、大豆、油菜、向日葵以及任何此类植物材料的混合物或者植物蛋白来源,用于家禽、猪、反刍动物、水产养殖和宠物。应当考虑,各种性能参数诸如生长、饲料摄取和饲料效率,以及改善的均匀性、动物棚舍中降低的氨浓度、随之提高的动物福利和健康状况都将得到改善。食品0140食用蛋白质水解产物代表了一个小而重要的市场部分。此类制品被用于术后患者或用于消化系统损伤的个体。此水解产物可以作为本身相对粗的制品被施用(Clegg,1978In″BiochemicalAspectsofNewProteinFood″,J,Adler-Nissen,B,O,Eggum,L,Munck&H.S.Olseneds.,p.109-117,Pergamon,Oxford),或者作为高度纯化的氨基酸混合物用于静脉内施用。乳蛋白的酶水解产物已被用作食用制品。0141瘦肉食品,特别是肉类的酶促嫩化,代表了一个巨大的市场部分,其目前由植物蛋白酶和某些微生物酶类所主导。鱼类瘦肉的酶促成熟和嫩化在许多国家也是相当重要的。因此,现在所描述的酶类被用于食品的多种用途中。0142进一步,本发明的酶或酶组合物可以用于由例如植物蛋白如大豆、豌豆、羽扇豆或油菜籽蛋白、奶如酪蛋白、肉类蛋白或鱼蛋白来制作蛋白质水解产物。此处所述的酶(一种或多种)可以被用于蛋白质水解产物以改善溶解性、均一性或可发酵性,减少抗原性、减少水解产物的苦味,或者用于制造食品、饲料或医药产品的其它目的。此处所述的酶(一种或多种)可以被单独使用或者与其它肽酶一起或者与其它酶类如外切肽酶一起使用。此处所述的酶(一种或多种)与富含外切肽酶的酶制剂一起使用,将会改善蛋白质水解产物的口味。0143而且,该酶或酶组合物可以被用于鱼或肉的加工,例如改变质地和/或粘性。皮革0144工业皮革制造有赖于涉及皮革的清洁、脱毛以及最终的鞣制和干燥的一系列步骤。酶处理在脱毛步骤中发挥了重要的作用,该步骤是通过应用蛋白水解酶,如本发明的肽水解酶而实现的;由于它们具有高蛋白水解活性和在低pH下具有功效,从而能够提供皮革制造中目前所用的哺乳动物蛋白酶的有效替代品。毛料与丝绸0145此处所述的蛋白酶被用于工业处理毛料制品以赋予所期望的特性。在一种实施方式中,本发明提供了处理纺织品的组合物。该组合物可以被用于处理例如毛料与丝绸(参见例如RE216,034;EP134,267;US4,533,359;和EP344,259)。0146本发明的方法可以被用于处理含蛋白的纤维,例如角蛋白纤维。其适于处理毛料、毛料纤维或动物毛发,诸如安哥拉山羊毛(angora)、马海毛(mohair)、开司米毛(cashmere)、alpacca或其它商业上有用的动物毛发产品,其可以来源于绵羊、山羊、羊驼、骆驼、兔等。蚕丝、蜘蛛丝或人类毛发也可以用本发明的方法处理。所述纤维可以是纤维或顶绒(top)、纱线(yarn)或者纺织品或针织品或服装的形式。清洁0147本发明还涉及含有本发明蛋白酶(一种或多种)的清洁组合物。该清洁组合物可以额外含有通常用于清洁组合物的多种添加剂。它们可以选自,但不限于漂白剂、表面活性剂、助洗剂、酶和漂白催化剂。对于本领域的普通技术人员而言,什么添加剂适合于包含在组合物中将会是显而易见的。此处所提供的清单并非详尽,而应当被视为合适添加剂的实例。对于本领域的普通技术人员而言,仅使用那些与组合物中的酶和其它组分相容的添加剂,例如表面活性剂,也将会是显而易见的。0148蛋白质,具体而言是本发明的那些蛋白质,可以按重量被配制成大约0.01至大约5%(优选地0.1%至0.5%)水平的已知的粉末去污剂和液体去污剂,其具有3.5至7.0之间的酸性pH。在一些实施方式中,此类清洁组合物进一步包括其它酶类诸如淀粉酶、其它蛋白酶、纤维素酶、脂酶或内切葡萄糖苷酶、以及助洗剂和稳定剂。在一些实施方式中,pH是在4.0至6.5之间,优选地在4.0至5.6之间。根据所需的活性水平,尽管由于其最适pH的缘故,这些酶被称为酸性蛋白酶,但是在pH7-9下使用这些酶也是有可能的。0149将蛋白质加入常规清洁组合物并没有任何特殊的使用限制。换言之,只要pH在以上范围内,而温度在所述蛋白质变性温度以下,适于去污剂的任何温度与pH也都适于本组合物。此外,本发明的蛋白质被用在无去污剂的清洁组合物中,再者单独使用或者与助洗剂和稳定剂组合使用。蛋白质加工0150蛋白质原材料的酶促水解经常导致苦味肽(bitterpeptides)的形成(Clegg,1978)。存在于蛋白水解产物中的苦味肽可能代表了相当多的实际问题,如这样的情况,例如在不同类型奶酪的熟化过程中以及在食用蛋白质水解产物的生产过程中。水解产物的苦味通常是由于特定的肽,且尤其是含有高比例疏水氨基酸的那些肽引起的。通过苦味肽的完全或者部分水解可以有效地减少苦味。因此,此处所述的酶类可用于去除食品的苦味。本发明的酶或酶组合物可以被用于减少食物中蛋白质和/或蛋白质水解产物的苦味。0151根据本发明还考虑到从蛋白质和/或蛋白质水解产物生产游离氨基酸。当游离氨基酸为谷氨酸的情况下,其强化了食品的风味。0152所述蛋白质或蛋白质水解产物可以是动物或植物来源的。在本发明的实施方式中,将要被水解的蛋白是酪蛋白或大豆蛋白。0153该蛋白可以被用于生产食品诸如奶酪和含可可的食品。0154尽管此处所述的酶(一种或多种)以及富集了本发明酶的酶制品在用于生产无苦味的蛋白质或蛋白质水解产物中可能特别是有利的,但是此处所述的酶(一种或多种)还可以被用于大量工业应用,包括含蛋白质物质诸如细胞壁的降解或改性。一些蛋白质如伸展蛋白是植物细胞壁的组分。因此,此处所述的酶(一种或多种)将有助于植物细胞壁的降解和改性。0155本发明酶制品的剂量以及使用该制品时的其它条件可以根据本领域已知的方法加以确定。0156蛋白质沉淀物在某些产品诸如例如啤酒中也提出了相当大的问题,原因在于沉淀导致产品混浊。在啤酒的冷却储藏期间,当可溶性蛋白沉淀时,会在啤酒中产生混浊。这一问题有着相当大的经济重要性,而且除挑选合适的原材料用于制造啤酒外,目前避免此问题的主要方法是向啤酒中加入蛋白水解酶。个人护理0157在一些实施方式中,一旦此处所述的蛋白酶被合成并纯化,则将有效的量加入个人护理组合物(一种或多种),其可用于个人护理产品。个人护理产品可以被划分/描述为化妆品、非处方(‘“OTC”)化合物,其可用于个人护理应用(例如化妆品、皮肤护理、口腔护理、头发护理、指甲护理)。在一些实施方式中,此处所述的蛋白酶被加入个人护理组合物诸如头发护理组合物、皮肤护理组合物、指甲护理组合物、化妆品组合物或者它们的任何组合。因此,可以在例如用于清洗隐形眼镜的溶液、牙膏、化妆品和皮肤护理产品中使用该酶或酶制品。增甜剂0158此处所述的蛋白酶可用于生产高麦芽糖或高果糖糖浆以及其它增甜剂。含可发酵糖类或可被转化为糖类的组分的原材料通常为含淀粉的植物材料,包括但不限于粮食作物(例如玉米、小麦、蜀黍、燕麦和黑麦)的块茎、根、茎、穗和谷粒以及含糖原材料诸如甜菜、甘蔗、水果材料和糖蜜。益生素(调节肠道微生态平衡用的寡糖类等有机物,Prebiotics)0159酶制品可以用于从蛋白质生产肽,其中使用基本无其它蛋白水解活性的克隆的酶是有利的。0160通过使用此处所描述的酶(一种或多种)(例如纯化的酶)来水解合适的蛋白来源,产生高度适于作为微生物底物的游离氨基酸和肽的粗制品是可能的,所述微生物对用于生长的氨基酸有着特殊的要求。0161这是用在工业发酵中的相当大量的微生物的情况。必需氨基酸的供应通常代表了此类发酵过程中的流程节约的一项重要因素。通过应用酶所产生的氨基酸制品不但适合用作实验室的底物而且适合用作大规模工业发酵的底物。0162此处所述的酶(一种或多种)也可以被用于功能肽、益生素和类似物的原位产生。术语“益生素”指食品或饲料组分,其通过选择性地刺激消化道内,优选地为结肠内的一种或有限数量的细菌的生长和/或活性而对宿主产生有益的影响。发酵与生物乙醇0163使用本发明的蛋白酶组合物由含淀粉底物的发酵来生产乙醇,可以包括生产燃料酒精或便携酒精(portablealcohol)。在一些实施方式中,酶组合物也可以被用于促进燕麦、麦芽以及其它原材料的酵母发酵以生产例如啤酒。0164淀粉酶是酿造和烘焙工业的基本酶类。在麦芽制备过程中以及在缺乏添加的糖类或其它碳水化合物的条件下进行的某些烘焙过程中,需要淀粉酶来降解淀粉。获得此类酶的充分活性是成问题的,尤其在麦芽制备工业。一种用生理学可接受的系统充分提高淀粉酶活性的方法,导致产生了更加迅速的麦芽制备方法,并且由于提高的糖类可利用性,从而导致产生了具有降低的碳水化合物含量的酒精饮料诸如啤酒。0165在一些实施方式中,含淀粉底物诸如谷粒(例如玉米、小麦和高梁)、穗以及其它植物残留物的水解将会产生酒精诸如乙醇。酒精的生产方法在TheAlcoholTextbook,AReferencefortheBeverage,FuelandIndustrialAlcoholIndustries,3rdEd.,Eds.,K.A.Jacques等,(1999)NottinghamUniversityPress,UK中有所描述。在本发明的一些实施方式中,蛋白酶将与葡糖淀粉酶以及任选的α淀粉酶一起以组合物方式被应用于合并的糖化发酵步骤,也被称为同步糖化和发酵。同样参考了Chapter2.1,FermentationAlcohol,S.LewisinIndustrialEnzymology,2nd.Ed.Eds.,T.Godfrey和S.West,(1996)StocktonPress,NY。使用酸性真菌蛋白酶与葡糖淀粉酶相组合通过发酵生产乙醇的方法是已知的。例如,USP5,231,017公开了使用来源于黑曲霉的蛋白酶生产乙醇的方法,包括获得液化的醪液并在糖化步骤期间将蛋白酶引入此液化醪液中,所述糖化步骤可以与发酵步骤合并在一起。在一些实施方式中,本发明的蛋白酶组合物将被用于在非熟化过程中用颗粒淀粉底物生产醇类例如乙醇,其中该过程是在低于用于生产醇类的底物中淀粉的糊化温度的温度下进行。而淀粉水解过程中所用的蛋白酶的数量将决定于蛋白酶的酶促活性。在一些实施方式中,该量将是加入到450g浆液中的范围为0.001至2.0ml的2%蛋白酶溶液,所述浆液被调节至20-33%干固体,其中该浆液在糖化作用期间和/或在水解的淀粉中为液化的醪。其它有用的范围包括0.005至1.5ml以及还有0.01至1.0ml。0166用蛋白酶处理种子和谷粒为通过发酵过程生产麦芽和饮料提供了有利条件。0167同样期望在糖化作用期间使用蛋白酶以便水解面粉中的蛋白质,并因此在对随后的醇类发酵阶段的预期中富集含有可溶性氮的麦芽汁。谷物中增强的淀粉酶活性提高了发芽的速度和效率,这在麦芽制备过程中是重要的,其中生产的麦芽具有提高的酶促活性,从而导致淀粉被强化水解为可发酵的碳水化合物,因而,改善了醇类饮料例如啤酒和苏格兰威士忌生产过程中的发酵效率。0168在以下的实验公开内容中,使用了下列缩略语eq(当量);M(摩尔浓度);μM(微摩尔浓度);N(正常的);mol(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);g(克);mg(毫克);kg(千克);μg(微克);L(升);ml(毫升);μl(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);℃(摄氏度);h(小时);min(分钟);sec(秒);msec(毫秒);Ci(居里);mCi(毫居里);μCi(微居里);TLC(薄层色谱);Ts(甲苯磺酰基);Bn(苯甲基);Ph(苯基);Ms(甲磺酰基);Et(乙基)、Me(甲基)、ds或DS(干固体含量)、SAPU(酸性蛋白酶分光光度单位,其中1SAPU是在试验条件下每分钟从酪蛋白底物释放1微摩尔酪氨酸的蛋白酶活性的量)以及GAU(葡糖淀粉酶单位,其被定义为在pH4.2和60℃条件下每小时从可溶性淀粉底物产生以葡萄糖计算的1g还原糖的酶量)。实施例0169下面的实施例进一步详细描述了本发明,这些实施例的意图并不在于以任何方式限制要求保护的本发明的范围。附图被认为是本发明的说明书和描述的一个完整部分。所有引用的参考文献在此特意地并入作为参考,用于在此描述的所有内容。下列实施例被提供用于举例说明所要求保护的发明,而并非限定所要求保护的发明。实施例1新型蛋白酶NSP24的里氏木霉DNA克隆0170基因组DNA是从里氏木霉菌株QM6a中提取的。根据在里氏木霉基因组的叠连群1-5500中所发现的推定的蛋白酶序列,设计PCR引物(JointGenomeInstitute(JGI)T.reeseigenomev1.0)。正向引物包含用于定向克隆入pENTR/D载体(Invitrogen)的基序。0171afp6f引物的序列为CACCATGCAGACCTTTGGAGCT(SEQIDNO11),而afp7r引物的序列为TTATTTCTGAGCCCAGCCCAG(SEQIDNO12)。根据InvitrogenGateway系统方案,通过凝胶提取方法来纯化1.3kb的PCR产物(凝胶纯化试剂盒(GelPurificationkit),Qiagen),并克隆进pENTR/D。0172然后,将载体转化进带有卡那霉素选择标记的化学感受态Top10大肠杆菌(Invitrogen)中。将来自若干独立克隆的质粒DNA用限制性酶消化,从而确认正确大小的插入片段。对来自若干克隆的蛋白酶基因插入片段进行测序(Sequetech,MountainView,CA)。将来自一个克隆的质粒DNA,pENTR/D_55.3与pTrex3g/amdS目的载体DNA加入LR克隆酶反应(InvitrogenGatewaysystem)中。pTrex3g载体基于大肠杆菌pSL1180(PharmaciaInc.,NJ),其为pUC118噬菌粒基载体并在WO05/001036中有所描述。在LR克隆酶反应中进行的重组,用来自pENTR/D_55.3的里氏木霉蛋白酶置换目的载体的CmR和ccdB基因。此重组将蛋白酶定向插入目的载体的cbh1启动子和终止子之间。44和50bp的重组位点序列分别保留在蛋白酶基因的上游和下游。将LR克隆酶反应的等份试样转化进化学感受态Top10大肠杆菌中并过夜生长,用羧苄青霉素选择。将来自若干克隆的质粒DNA用限制性酶消化以确认正确的插入片段大小。将来自克隆的质粒DNApTrex3g_55.3.1用XbaI消化以释放出包括cbh1启动子NSP24蛋白酶终止子amdS的表达盒。通过琼脂糖凝胶提取法用标准技术纯化此5.8kb盒,并将其转化进里氏木霉菌株,其来自于公众可获得的菌株QM6a(参见WO05/001036)。参考图5、6和7。实施例2新型蛋白酶NSP25的里氏木霉DNA克隆0173基因组DNA是从里氏木霉菌株QM6a中提取的。根据在里氏木霉基因组(JGIT.reeseigenomev1.0)的叠连群22-263400中所发现的推定的蛋白酶序列,设计PCR引物。正向引物包含用于定向克隆入pENTR/D载体(Invitrogen)的基序。0174afp8f引物的序列为CACCATGCAGCCCTCATTTGGCAG(SEQIDNO13),而afp9r引物的序列为CTATTTCTTCTGCGCCCAGCCAAC(SEQIDNO14)。根据InvitrogenGateway系统方案,通过凝胶提取法来纯化1.2kb的PCR产物(凝胶纯化试剂盒(GelPurificationkit),Qiagen)并克隆进pENTR/D。然后,将载体转化进带有卡那霉素选择标记的化学感受态Top10大肠杆菌(Invitrogen)中。将来自若干独立克隆的质粒DNA用限制性酶消化,从而确认正确大小的插入片段。对来自若干克隆的蛋白酶基因插入片段进行测序(Sequetech,MountainView,CA)。将来自一个克隆的质粒DNA,pENTR/D_22.2与pTrex3g/amdS目的载体DNA一起加入LR克隆酶反应(InvitrogenGatewaysystem)中。在LR克隆酶反应中进行的重组,用来自pENTR/D_22.2的里氏木霉蛋白酶置换目的载体中的CmR和ccdB基因。此重组将蛋白酶定向插入目的载体的cbh1启动子和终止子之间。44和50bp的重组位点序列分别保留在蛋白酶基因的上游和下游。将LR克隆酶反应的等份试样转化进化学感受态Top10大肠杆菌中并过夜生长,用羧苄青霉素选择。将来自若干克隆的质粒DNA用限制性酶消化,以确认正确的插入片段大小。将来自克隆的质粒DNApTrex3g_22.2#1用XbaI(并用EcoRI消化以便将细菌骨架消化成小片段,其在电泳过程中与盒迁移开来)消化,以释放出包括cbh1启动子NSP25蛋白酶终止子amdS的表达盒。通过琼脂糖凝胶提取法用标准技术纯化此5.7kb盒,并将其转化进里氏木霉菌株,该菌株来自于公众可获得的菌株QM6a。除NSP24插入片段用NSP25序列替换外,用于转化的质粒与图7中举例说明的质粒基本相同。实施例3木霉的PEG真菌转化0175将来自形成孢子的菌丝体的平板的2cm2琼脂塞(agarplug)接种于250ml4-挡板摇瓶中的50mlYEG肉汤中,并以200rpm在37℃培养16-20小时。通过将液体体积转移入50ml锥形管中并在2500rpm下离心10分钟来回收菌丝体。吸去上清。将菌丝体沉淀转移入装有40ml过滤除菌的β-D-葡聚糖酶(InterSpexProducts,Inc.)溶液的250ml0.22μmCACorning过滤瓶中,并在200rpm,30℃下温育2小时。通过无菌Miracloth(CalBiochem,LaJolla,CA),将菌丝体收集入50ml锥形离心管中,在2000rpm下离心5分钟,抽气。将沉淀用50ml1.2M山梨醇洗涤一次,再次离心,抽气,并用25ml山梨醇/CaCl2洗涤。将原生质体用血细胞计数器计数、离心、抽气,并重悬于山梨醇/CaCl2中,其体积足以产生1.25×108/ml的原生质体浓度。每一转化反应使用200μl的等份试样。将20μgDNA(>1μg/ul)装入15ml锥形管,并将锥形管放置于冰上。加入200μl原生质体。加入50μlPEG混合物,并轻轻混匀,在冰上温育20分钟。将2mlPEG混合物加入锥形管中,并在室温下温育5分钟。将4ml山梨醇/CaCl2(总共6.25ml)加入到锥形管中。此转化混合物被分为3等份,每一覆盖物(overlay)~2ml。将2ml加入到熔化的乙酰胺山梨醇顶层琼脂的试管中,并将覆盖物混合物(overlaymixture)倒在乙酰胺山梨醇平皿上,用于选择能够依靠乙酰胺作为唯一的氮源来生长的转化体。将平皿在28-30℃温育,直至克隆出现。通过在乙酰胺培养基(无山梨醇的乙酰胺山梨醇配方)上对单个克隆重复传代,转化体得以纯化。材料017640mlβ-D-葡聚糖酶溶液600mgβ-D-葡聚糖酶;400mgMgSO4·7H2O和40ml1.2M山梨醇。0177200mlPEG混合物50gPEG4000(BDHLaboratorySuppliesPoole,England)和1.47gCaCl2·2H2O,在MiIIiQ水中制成。0178山梨醇/CaCl21.2M山梨醇和50mMCaCl0179为了进行amdS选择,使用乙酰胺山梨醇平皿和覆盖物。为对孢子进行纯化,使用同样的平皿,但不含山梨醇。乙酰胺山梨醇琼脂(培养板和顶层琼脂)0180乙酰胺(Aldrich99%经升华的)0.6g/L;CsCl1.68g/L;葡萄糖20g/L;KH2PO420g/L;MgSO4·7H2O0.6g/L;CaCl2·2H2O0.6g/L;1000×盐(参见下文)1ml。将pH调至5.5并将体积定容至300ml。用0.22微米滤膜过滤除菌并在烘箱中加热至55℃。0181向700ml水中加入Noble琼脂(低熔点用于顶层琼脂)20g和山梨醇218g,然后高压灭菌。将此混合物冷却至55℃,并加入滤膜除菌的乙酰胺混合物。倒入平皿和试管。1000×盐——FeSO4·7H2O(0.5g/100ml);MnSO4·H2O(0.16g/100ml);ZnSO4·7H2O(0.14g/100ml);CoCl2·6H2O(0.1g/100ml),并用0.22微米滤膜过滤除菌。马铃薯葡萄糖琼脂(PDA,DifcoDehydratedCultureMedia)——马铃薯,来自200g/L的浸液;葡萄糖20g/L和琼脂15g/L在50-80%终体积的dH2O中充分混合,然后定容至100%终体积。将此混合物高压灭菌,冷却至55℃并倾倒。为了制成用于pH3.5培养基的1%脱脂奶琼脂,如上制备PDA,并向100ml熔化的PDA中加入1.8ml的10%酒石酸和12.5ml灭菌的8%脱脂奶,并铺板。为了对脱脂奶进行预灭菌,将8%脱脂奶(Difco)在122-123℃下高压灭菌10分钟,暴露期间的室压为32-35psi。取出混合物,冷却至室温并在室温下储存。0182在摇瓶中生长3天后的转化体中,评估蛋白酶的表达。用琼脂塞接种里氏木霉培养基(Davis等,(1970)MethodsEnzymol.1779-143)。将培养物在30℃下摇动培养3天。使培养肉汤通过0.22微米滤膜,并将滤液点到1%脱脂奶琼脂上。经过在室温下过夜培养,观察到清澈的区带。实施例4NSP24、NSP25和L388MPeoA的PH活性图0183PepA(野生型和L388M)、NSP24和NSR25在里氏木霉菌株中均过量表达,它们的pH活性图,使用获自MolecularProbes(EnzChekPorteaseKit-Greenfluorescence)的荧光标记的酪蛋白试验进行测定。PepA(野生型和L388M)和NSP是全发酵样品,而NSP24是在50%甘油中稳定化的纯化蛋白。将该酶稀释为1.0mg/ml、0.5mg/ml和0.25mg/ml。荧光标记的底物在DIH2O中被稀释为0.1mg/ml。将10ml底物加入50ml各种pH的缓冲液和30ulDIH2O中。通过加入10ml酶启动反应,并在加入100ul1.0MpH10的磷酸盐中止反应前使其继续进行不同的时段。用485激发光在538nm发射处测量样品的荧光,并在SpectraMAXEM荧光板读数器中在530nm将发射光用滤镜截止。NSP24在pH3.7下具有最适活性,野生型PepA在pH3.4下具有最适活性,而L388MpepA在pH3.5下具有最适活性。NSP25在pH4.6下具有最适活性。实施例5在实验室发酵中里氏木霉NSP24蛋白酶与GC106的比较0184当今乙醇工业中所使用的标准蛋白酶是由GenencorInternational,Inc.商业销售的蛋白酶GC106。在糖类降解、葡萄糖形成以及乙醇生产方面,将NSP24的功能性与GC106进行比较。材料DistillaseL-400(Lot#107-04057-901,372GAU/g)GC106(Lot#A01-01300-001,1010SAPU/g)NSP24(Lot#20040423,1165SAPU/g)RedStarRedYeast来自乙醇生产商的醪液和稀釜馏物(MashandThinStillage)(玉米)方法0185从乙醇生产商获得醪液和稀釜馏物(MashandThinStillage)(在发酵前,也被称为大浅盒(backset)),并混合至26.5白利(brix)。将pH用1NHCL调至pH4.3。然后将样品分为3-300克的等份试样并放入32℃水浴中。平衡后,加入下列酶组合表20186DISTILLASEL-400是来源于黑曲霉的液体葡糖淀粉酶,其可以从GenencorInternationalInc.购得。在加入酶后,加入1.00克/瓶的RedStarRedYeast。在16、24、40和48小时取样并离心。将500ul每一样品放入装有50ul1.1NH2SO4的试管中以停止反应。2分钟后,将样品用4.5mlDIH2O稀释并混合。混匀后,使样品通过0.45微米滤膜并放入HPLC瓶中进行分析。通过HPLC(PhenomenexRezex8u)分析样品。结果在图1-4中列出。NSP24的表现与GC106相似。实验室6在非熟化过程中NSP24对碎玉米的乙醇产量的影响0187用DIH2O制成碾碎的玉米的30%DS浆液。该碾碎的玉米是典型的用于乙醇工业的#2黄色马齿形玉米样品,其被粉碎以使70%以上将通过30目筛。谷粒的含水量用OHAUS,MB35Halogenmoisturebalance(MB35卤素水份平衡)(NJ)进行测量。用6NH2SO4将pH调至4.2。在125ml装有100g醪液的烧瓶中进行发酵,其中含有1.0GAU/g剂量的STARGEN001并含有或不含有0.5kg/MT剂量的NSP24。0188在45ml水中制备5gRedStarEthanolRed干酵母(LesaffreyeastCorporation,Milwaukee,WI),并在接种至发酵罐前在32℃水浴中混合1小时。向每一125ml烧瓶中加入0.5ml酵母浆液。将烧瓶放入32℃水浴中并温和混合此醪液。在发酵期间,取出样品进行HPLC分析。(HPLC柱PhenomenexRezex有机酸柱(RHM-Monosaccharide)#00H0132-KO;柱温60℃;流动相0.01NH2SO4;流速0.6ml/min;检测器RI;注射体积20uL。72小时后停止发酵。在不同采样间隔的化合物产量,包括糖类、乳酸、甘油和乙醇,在下表3中表示,其中+表示NSP24被加入烧瓶中,而--表示NSP24未被加入烧瓶中。经测量,所有样品的乳酸在大约0.01至0.02%w/v之间,而DP-2则测定为0.0。在24小时,乙酸被测定为大约0,而在71小时,对于所有样品在0.03至0.04之间。表3实施例7使用玉米胚乳进行乙醇生产中不同蛋白酶的比较0189使用胚乳(除菌玉米,75.8%淀粉,99.5%的颗粒大小<30目)作为颗粒淀粉底物制得29.5%的DS醪液。将一百克每一醪液转移至125ml烧瓶,并将培养基的pH调至pH4.5。将蛋白酶(NSP24;中性蛋白酶(MULTIFECTNEUTRAL,PROTEINASE-T)和碱性蛋白酶(SPEZYMEFAN,PROTEX6LMULTIFECTP-3000和PROTEASE899(GenencorInternational))以0.5kg/MT加入,随后以2.5Kgs/MT加入STARGEN001(GenencorInternational)淀粉。然后用0.5ml20%酵母(RedStarEthanolRed)接种烧瓶,并放入水浴中保持在32℃。在温育过程中将烧瓶的内容物连续搅拌以获得均匀的混合。在不同的时间间隔取样进行HPLC分析。测定72小时发酵罐肉汤中DDGS的残留淀粉和蛋白质含量。乙醇生产的结果在下表4中表示。表4权利要求1.一种分离的NSP24家族蛋白酶,其与SEQID10具有至少85%的氨基酸序列同一性。2.权利要求1所述的分离的NSP24家族蛋白酶,其与SEQID10具有至少90%的氨基酸序列同一性。3.权利要求2所述的分离的NSP24家族蛋白酶,其与SEQID10具有至少95%的氨基酸序列同一性。4.权利要求3所述的分离的NSP24家族蛋白酶,其与SEQID10具有至少97%的氨基酸序列同一性。5.一种分离的多核苷酸,其编码NSP24家族蛋白酶。6.权利要求5所述的分离的多核苷酸,其中所述分离的核酸编码NSP24蛋白酶,其与SEQID2具有至少85%的序列同一性。7.权利要求6所述的分离的多核苷酸,其具有SEQID8的序列。8.一种载体,其包括权利要求5所述的多核苷酸。9.一种宿主细胞,其用权利要求5所述的多核苷酸转化。10.权利要求9所述的宿主细胞,其中所述宿主细胞是丝状真菌细胞。11.权利要求10所述的宿主细胞,其中所述丝状真菌细胞是曲霉属某些种(Aspergillusspp.)、镰刀菌属某些种(Fusariumspp.)或者木霉属某些种(Trichodermaspp.)。12.权利要求11所述的宿主细胞,其中所述曲霉是黑曲霉(A.niger)、米曲霉(A.oryzae)、构巢曲霉(A.nidulans)或者泡盛曲霉(A.awamori)。13.权利要求11所述的宿主细胞,其中所述木霉是里氏木霉(T.reesei)。14.权利要求10所述的宿主细胞,其中所述宿主细胞是四重缺失的宿主细胞。15.一种产生蛋白酶的方法,包括a)向宿主细胞中导入多核苷酸,其包括被可操纵地连接于编码NSP24家族蛋白酶的核酸的启动子,b)将所述宿主细胞在适于表达和产生NSP24家族蛋白酶的培养条件下培养,并c)产生所述NSP24家族蛋白酶。16.根据权利要求15所述的方法,进一步包括回收所述产生的蛋白酶。17.一种分离的母体NSP24家族蛋白酶的生物学活性片段。18.权利要求17所述的分离的生物学活性片段,其中所述母体NSP24家族蛋白酶与SEQIDNO2具有至少90%的序列同一性。19.权利要求17所述的分离的生物学活性片段,其中所述片段具有NSP24蛋白酶的至少40%的活性,所述NSP24蛋白酶具有SEQIDNO2或者SEQIDNO10。20.一种酶组合物,其包括权利要求1所述的NSP24家族蛋白酶。21.一种酶组合物,其包括权利要求17所述的NSP24家族蛋白酶的生物学活性片段。22.权利要求20所述的酶组合物,其中所述组合物是清洁组合物。23.权利要求22所述的酶组合物,其中所述清洁组合物是去污剂组合物。24.权利要求20所述的酶组合物,其中所述组合物是淀粉水解组合物。25.权利要求20所述的酶组合物,其中所述组合物是动物饲料组合物。26.权利要求20所述的酶组合物,其中所述组合物被用于乙醇生产过程。27.权利要求20所述的酶组合物,其中所述组合物被用于淀粉糖化过程。28.权利要求20所述的酶组合物,其中所述组合物被用于麦芽糖或果糖的生产。29.权利要求20所述的酶组合物,其中所述组合物是个人护理组合物。30.权利要求20所述的酶组合物,进一步包括葡糖淀粉酶。31.权利要求21所述的酶组合物,进一步包括葡糖淀粉酶。32.权利要求20所述的酶组合物,进一步包括α淀粉酶。33.权利要求21所述的酶组合物,进一步包括α淀粉酶。34.权利要求33所述的酶组合物,进一步包括葡糖淀粉酶。35.一种水解淀粉的方法,包括将含淀粉底物与权利要求20所述的酶组合物在适于淀粉水解的条件下接触,并获得水解的淀粉。36.分离的PepA蛋白酶,其具有SEQIDNO7。37.一种分离的多核苷酸,其编码权利要求36所述的蛋白酶。38.权利要求37所述的多核苷酸,其具有SEQIDNO5。39.一种分离的NSP25家族蛋白酶,其与SEQIDNO9具有至少90%的序列同一性。40.一种分离的多核苷酸,其编码权利要求39所述的NSP25蛋白酶。全文摘要本发明涉及新型酸性蛋白酶,更具体地涉及NSP24家族蛋白酶和NSP25家族蛋白酶,包括它们的生物学活性片段,并涉及编码所述蛋白酶的核酸分子。同样提供了包括编码所述蛋白酶的核酸序列的载体和宿主细胞,生产所述蛋白酶的方法,酶组合物以及使用所述蛋白酶的方法。文档编号C12N5/10GK101094918SQ200580045498公开日2007年12月26日申请日期2005年12月20日优先权日2004年12月30日发明者K·A·克拉森,N·邓恩-克莱曼,S·E·兰特斯,C·E·皮尔格林,P·范索林格恩,M·沃德申请人:金克克国际有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1