链霉菌蛋白酶的制作方法

文档序号:335154阅读:2432来源:国知局
专利名称:链霉菌蛋白酶的制作方法
技术领域
本发明提供了链霉菌丝氨酸蛋白酶。在一些实施方案中,该蛋白酶包含与野生型 链霉菌1AG3蛋白酶至少约80%相同的氨基酸序列。本发明还提供了分离的核酸序列,也提 供了重组核酸和含有该重组核酸的宿主细胞。此外,本发明提供了包含链霉菌丝氨酸蛋白 酶的清洁组合物和其他组合物。
背景技术
丝氨酸蛋白酶是多种酶类别的一个亚组,具有多种特异性和生物学功能。不论其 功能多样性,已经对至少两个遗传迥异的酶家族探讨了丝氨酸蛋白酶的催化机制,即枯草 杆菌蛋白酶和哺乳动物胰凝乳蛋白酶相关且同源的细菌丝氨酸蛋白酶(例如,胰蛋白酶和 灰色链霉菌(S.griseus)胰蛋白酶)。这两个丝氨酸蛋白酶家族显示出显著相似的催化 机制(参见例如,Kraut, Ann. Rev. Biochem. ,46 :331_358[1977])。此外,虽然一级结构不 相关,但是这两个酶家族的三级结构均具有保守的氨基酸催化三联体。枯草杆菌蛋白酶和 胰凝乳蛋白酶相关的丝氨酸蛋白酶均具有包含天冬氨酸、组氨酸和丝氨酸的催化三联体。 在枯草杆菌蛋白酶相关的蛋白酶中,从氨基端至羧基端,这些氨基酸的相对顺序是天冬氨 酸_组氨酸_丝氨酸。然而,在胰凝乳蛋白酶相关的蛋白酶中,相对顺序是组氨酸_天冬氨 酸-丝氨酸。对枯草杆菌蛋白酶已经进行了大量研究,主要是出于其在清洁和饲料应用中 的用途。其他工作则着眼于在各种应用中可以负面影响这些酶的功能的不良环境条件(例 如,暴露于氧化剂、螯合剂和/或极端的温度和/或PH)。尽管如此,本领域仍然需要这样的 酶系统,所述酶系统能够抵抗这些不良条件,并保留或具有提高的本领域目前已知的活性。发明概述提供了分离的丝氨酸蛋白酶,以及含有所述丝氨酸蛋白酶的清洁组合物。在一 些实施方案中,蛋白酶与野生型链霉菌1AG3蛋白酶(SEQ IDN0 9)相同,而在其他实施方 案中,蛋白酶是变体。在一些实施方案中,蛋白酶包含与野生型链霉菌1AG3蛋白酶至少 约80%相同的氨基酸序列。在一些实施方案中,分离的丝氨酸蛋白酶相对于野生型链霉菌 1AG3蛋白酶具有至少1个氨基酸取代。在一些实施方案中,分离的丝氨酸蛋白酶相对于野 生型链霉菌1AG3蛋白酶具有改变的底物特异性,以及相对于野生型链霉菌1AG3蛋白酶,具 有改变的pi、提高的活性,例如,改善的酸稳定性、热稳定性、酪蛋白酶解、角蛋白酶解、清洁 性能和/或LAS稳定性。也提供了编码分离的丝氨酸蛋白酶的分离的核酸。在一些实施方案中,分离的核 酸具有这样的核苷酸序列a)在严格杂交条件下与SEQ ID NO :8杂交;和/或b)与SEQ ID NO 8至少约70%相同。
还提供了包含分离的核酸的重组多核苷酸。在一些实施方案中,重组多核苷酸包 含有效连接的启动子和分离的核酸。在一些实施方案中,启动子与分离的核酸是异源的,即 它不是野生型链霉菌1AG3蛋白酶启动子。在一些实施方案中,启动子是野生型链霉菌1AG3 蛋白酶启动子。在其他一些实施方案中,重组核酸提供从宿主细胞分泌所述分离的丝氨酸 蛋白酶(即,含有信号序列编码区,定位分离的丝氨酸蛋白酶的分泌)。还提供了包含重组 核酸的表达载体。本发明还提供了包含重组多核苷酸的宿主细胞。在一些实施方案中,宿主细胞 选自芽孢杆菌属物种(Bacillus sp.)、链霉菌属物种(Str印tomycessp.)、曲霉属物种 (Aspergillus sp.)和木霉菌属物种(Trichoderma sp.)。在一些实施方案中,重组多核苷 酸存在于细胞内的表达载体中,而在其他实施方案中,存在于细胞的基因组中(即,整合到 宿主细胞的基因组中)。在一些实施方案中,宿主细胞用于产生分离的丝氨酸蛋白酶的方 法。在一些实施方案中,方法包括在适合产生分离的丝氨酸蛋白酶的条件下,培养宿主细 胞。在一些替代性的实施方案中,方法还包括回收分离的丝氨酸蛋白酶。在一些实施方案 中,蛋白酶分泌到培养基中。在一些替代性的实施方案中,方法还包括从培养基中回收蛋白 酶。还提供了包含分离的丝氨酸蛋白酶的清洁组合物。在一些实施方案中,清洁组合 物还包含表面活性剂。在一些实施方案中,表面活性剂是包含环氧乙烷部分的烷基硫酸钠 表面活性剂。在一些实施方案中,清洁组合物包含约0. 001wt%至约0. 5wt%的分离的丝氨 酸蛋白酶。在一些实施方案中,清洁组合物包含足量的PH调节剂,提供组合物的净pH从约 3至约5,而清洁组合物基本不含在约3至约5的pH水解的材料。在一些优选的实施方案 中,清洁组合物配制成衣物洗涤剂(laundry detergent),和/或餐具洗涤剂(dishwashing detergent),禾口 / 或硬表Ui青洁组合物(hard-surfacecleaning composition)。在一些实 施方案中,除对象蛋白酶以外,清洁组合物还包含至少一种其他的酶,所述其他的酶选自蛋 白酶、淀粉酶、脂肪酶、甘露聚糖酶、果胶酶、角质酶(cutinase)、氧化还原酶、半纤维素酶和 /或纤维素酶。在一些实施方案中,清洁组合物还包含至少一种稳定剂。在一些优选的实施 方案中,稳定剂是硼砂、甘油和/或竞争性抑制剂。在一些实施方案中,稳定剂使分离的丝 氨酸蛋白酶对阴离子表面活性剂稳定。以任何合适的形式提供清洁组合物,包含但不限于 固体、液体、气体和/或凝胶。本发明的清洁组合物可用于清洁的方法。在一些实施方案中,方法包括将对象与 清洁组合物接触来清洁对象。在一些实施方案中,方法还包括洗涤和/或漂洗对象。在示 例性的实施方案中,对象是纺织品(例如,衣物)或餐具物件(例如,碟或盘)。本发明还提供了包含分离的丝氨酸蛋白酶的动物饲料。


图1提供了显示1AG3基因结构的示意图。图 2 提供了来自 1AG3 (SEQ ID NO 2)和链霉菌蛋白酶(Str 印 togrisin) C (SEQ ID NO 12)的多肽序列的比对。图3提供了成熟的(即,催化结构域)1AG3蛋白酶(SEQ ID NO 13)和链霉菌蛋白 酶C(SEQ ID NO 14)的比对。在该图中,用粗体印出了活性位点氨基酸(his-asp-ser),并通过连接线提示了特征性的三个二硫键。图 4 提供了 1AG3 蛋白酶(SEQ ID NO 2)和 ASP(SEQ ID NO 15)的比对。图5提供了成熟的(即,催化结构域)1AG3蛋白酶(SEQ ID NO 13)和ASP(SEQ ID NO: 16)的比对。图6提供了 PSEA4CT-1AG3表达构建体的图谱。图7提供了 20°C下在pH8. 2的液体洗涤剂中测试的1AG3蛋白酶的剂量反应曲线。图8提供了在30°C下在pH6. 0的液体洗涤剂中测试的1AG3蛋白酶的剂量反应曲线。发明详述本文提供了新蛋白酶,编码这些酶的新遗传材料,和获得自链霉菌属物种的蛋白 酶解性蛋白质,包含从其发展的变体蛋白质。在一些实施方案中,提供了从新描述的链霉菌 种种获得的蛋白酶组合物,编码蛋白酶的DNA,包含编码蛋白酶的DNA的载体,用载体DNA转 化的宿主细胞,和由宿主细胞产生的酶。本发明的一些实施方案还提供了包含从链霉菌属 物种获得的一种或多种蛋白酶的清洁组合物(例如,洗涤剂组合物)、动物饲料组合物和纺 织品和皮革处理组合物。在替代性实施方案中,本发明提供了从本文描述的野生型蛋白酶 衍生的突变(即,变体)蛋白酶。这些突变蛋白酶液可用于多种应用。链霉菌是革兰氏阳性菌,分类属于放线菌纲(Actinobacteria),放线菌目 (Actinomycetales),链霉菌亚目(Streptomycineae),链霉菌禾斗(Streptomycetaceae)中 的成员。生长的链霉菌具有广泛分支的初生菌丝体或基内菌丝体,和丰富的气生菌丝体, 气生菌丝体在成熟时产生特征性的孢子。链霉菌蛋白酶是从多种链霉菌中大量分泌的 丝氨酸蛋白酶。已经从至少9个不同的链霉菌属物种中确定了链霉菌蛋白酶的氨基酸序 列,包含灰色链霉菌(Str印tomyces griseus)的链霉菌蛋白酶C(登录号P52320);来自 链霉菌属物种(登录号PC2053)的碱性蛋白酶(EC 3.4.21.-);来自链霉菌属物种(登 录号S34672)的碱性丝氨酸蛋白酶I,来自变铅青链霉菌(Str印tomyces lividans,登录 号CAD4208)的丝氨酸蛋白酶;来自天蓝色链霉菌(Str印tomyces coelicolor) A3 (2)(登 录号NP_625129)的推定的丝氨酸蛋白酶;来自除虫链霉菌(Str印tomyces avermitilis) MA_4680(登录号NP_822175)的推定的丝氨酸蛋白酶;来自变铅青链霉菌的丝氨酸蛋白酶 (登录号CAD42809);来自天蓝色链霉菌A3 (2)(登录号NP_628830)的推定的丝氨酸蛋白酶 前体。纯化的天然碱性蛋白酶具有19,000道尔顿的表观分子量,分离自灰色链霉菌嗜碱性 变种;已经描述了包含该酶的清洁组合物(参见例如,美国专利号5,646,028,引入本文作 为参考)。另一菌株分离自湖水和沉积物的样品;该菌株在本文中命名为“菌株1AG3”。水 柱和沉积物的温度是19-23°C,pH10. 5,水的传导率是26. lmS cnT1。本文中描述的一些蛋白酶具有良好的稳定性和蛋白酶解活性。这些酶可用于多种 应用,包含但不限于清洁组合物、动物饲料、纺织品和皮革处理等。本发明还提供了产生这 些酶的方法。在一些实施方案中,本发明的蛋白酶是纯化的或相对纯化的形式。在一些实施方案中,本发明还提供了适合在重组生物体中产生本发明的蛋白酶的 核苷酸序列。在一些实施方案中,重组产生提供了以可商业化的量产生蛋白酶的方法。除非另外提及,本发明的实施涉及在分子生物学、微生物学和重组DNA技术中普 遍使用的常规技术,属于本领域技术人员的范畴。此类技术是本领域技术人员已知的,描述在多个文本和参考文献中。本文上下文中提及的所有专利、专利申请、文章和出版物,都通 过引用清楚地合并到本文中。除非本文中另外提及,本文使用的所有技术和科学术语都具有本发明所属领域普 遍技术人员常规理解的相同含义。虽然与本文所述相似或等价的方法和材料也可用于本发 明的实施,但仍描述了示例性的方法和材料。因此,通过整体参考说明书,可以更全面的描 述下文定义的术语。此外,除非文中明确地另外指出,本文中使用的单数形式“一个”和“这 个”包含了复数含义。数值范围包含了定义范围的数。除非另外指出,核酸序列以从5’至 3’方向由左至右的书写;氨基酸序列以从氨基至羧基方向由左至右的书写。可以理解,发 明不限于所描述的特定方法、方案和试剂,本领域技术人员可以根据所使用的情况而进行 变动。除非另外指出,本发明的实施使用蛋白质纯化、分子生物学、微生物学、重组DNA 技术和蛋白质测序的常规技术,其均属于本领域技术人员的知识范围内。此外,本文提供的标题并不限制本发明的多个方面或实施方案,其可参照说明书 整体。因此,通过整体参照说明书可以更完整的定义下文定义的术语。尽管如此,为了便于 理解发明,下文仍定义了多个术语。I.定义如本文中使用的,术语“蛋白酶”和“蛋白酶解活性”指这样的蛋白质或肽,其显示 出具有水解肽或具有肽键的底物的能力。有多种用于测量蛋白酶解活性的已知方法,且是 本领域技术人员熟知的。例如,通常通过比较测定来证实蛋白酶解的活性,所述测定分析 各蛋白酶水解商品底物的能力。可用于蛋白酶和/或蛋白酶解活性分析的示例性底物包 含但不限于,二甲基酪蛋白(Sigma C-9801)、牛胶原(Sigma C-9879)、牛弹性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。使用这些底物的比色测定是本领域熟知的 (参见例如,W0 99/34011 ;和美国专利号6,376,450,均引入本文作为参考)。pNA测定(参 见例如,Del Mar等人,Anal. Biochem. ,99 316-320 [1979])也可用于确定在梯度洗脱中收 集的组分中的活性酶浓度。上述测定测量了当酶水解可溶性合成底物琥珀酰_丙氨酸_丙 氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(sAAPE-pNA)时,对硝基苯胺的释放速率。在分光光 度计上,410nm处测量水解反应中产生黄色的速率,其与活性酶浓度成比例。此外,在280nm 处的吸光度测量值可用于确定总蛋白浓度。活性酶/总蛋白比例给出了酶的纯度。如本文中使用的,术语菌株“1AG3蛋白酶”指本发明的一个实施方案的蛋白酶。如 本文所述,野生型蛋白酶分离自链霉菌菌株1AG3。在一些实施方案中,本发明提供了蛋白酶 的活性形式,包含256个氨基酸的多肽。在其他实施方案中,1AG3蛋白酶是1AG3ASP蛋白酶 的变体或同源物。术语“链霉菌蛋白酶同源物”指与源自链霉菌菌株1AG3的成熟蛋白酶具有基本 相同的氨基酸序列的天然存在的蛋白酶,和/或编码此类天然存在的蛋白酶的多核苷酸序 列,并且所述蛋白酶保留了此类核酸编码的丝氨酸蛋白酶的功能性特征。"ASP蛋白酶”、“Asp蛋白酶”和“Asp”指在本文和PCT系列号US04/39006和 US04/39066(均通过引用全文整合到本文中)中描述的丝氨酸蛋白酶。在一些实施方案中, Asp蛋白酶是本文中获得自纤维单胞菌菌株69B4的命名为69B4蛋白酶的蛋白酶。因此,在 一些实施方案中,术语“69B4蛋白酶”指源自纤维单胞菌菌株69B4(DSM 16035)的天然存在的成熟蛋白酶,其具有与SEQ ID NO :25基本相同的氨基酸序列。在一些替代性的实施方案 中,本发明提供了 ASP蛋白酶的一部分。术语“纤维单胞菌蛋白酶同源物”指与源自纤维单胞菌菌株69B4的成熟蛋白酶具 有基本相同的氨基酸序列的天然存在的蛋白酶,或编码此类天然存在的蛋白酶的多核苷酸 序列,并且所述蛋白酶保留了此类核酸编码的丝氨酸蛋白酶的功能性特征。在一些实施方 案中,这些蛋白酶同源物被称为“纤维单胞菌蛋白酶(cellulomonadins) ”。如本文中使用的,术语“链霉菌1AG3变体”、“链霉菌蛋白酶变体”和“1AG3蛋白酶 变体”用于指这样的蛋白酶,所述蛋白酶与野生型链霉菌1AG3蛋白酶相似,特别是其功能相 似,但在其氨基酸序列中具有突变,使其与野生型蛋白酶的序列不同。如本文中使用的,术语“ASP变体”、“ASP蛋白酶变体”和“69B蛋白酶变体”用于指 这样的蛋白酶,所述蛋白酶与野生型ASP相似,特别是其功能相似,但在其氨基酸序列中具 有突变,使其与野生型蛋白酶的序列不同。如本文中使用的,“纤维单胞菌”指所有属于纤维单胞菌属(Cellulomonas)中的物 种,其是革兰氏阳性菌,分类为放线菌纲(Actinobacteria),放线菌目(Actinomycetales), 微球菌亚目(Micrococcineae),纤维单胞菌科(Cellulomonadaceae)的成员。公认纤维单 胞菌属不断经历着分类重组。因此,该属意在包含已重新分类的物种。如本文中使用的,“链霉菌属物种”指所有属于“链霉菌属(Str印tomyces),, 中的物种,其是革兰氏阳性菌,分类属于放线菌纲(Actinobacteria),放线菌目 (Actinomycetales),链霉菌亚目(Streptomycineae),链霉菌禾斗(Streptomycetaceae)中 的成员。公认链霉菌属不断经历着分类重组。因此,该属意在包含已重新分类的物种。如本文中使用的,“芽孢杆菌(Bacillus)属”包含所有属于“芽孢杆 菌(Bacillus)”属中的物种,本领域技术人员已知,包含但不限于枯草芽孢杆菌 (B. subtilis)、地衣芽孢杆菌(B. licheniformis)、迟缓芽孢杆菌(B. lentus)、短 芽孢杆菌(B. brevis)、嗜热脂肪芽孢杆菌(B. stearothermophilus)、嗜碱芽孢杆 菌(B. alkalophilus)、解淀粉芽孢杆菌(B. amyloliquefaciens)、克劳氏芽孢杆菌 (B. clausii)、耐盐芽孢杆菌(B. halodurans)、巨大芽孢杆菌(B. megaterium)、凝结芽孢杆 菌(B. coagulans)、环状芽孢杆菌(B. circulans)、灿烂芽孢杆菌(B. lautus)和苏云金芽孢 杆菌(B.thuringiensis)。公认芽孢杆菌属不断经历着分类重组。因此,该属意在包含已 重新分类的物种,包含但不限于生物体例如嗜热脂肪芽孢杆菌(B. stearothermophilus), 现名为嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)。在氧存在的条件下产 生抗性内生孢子被认为是芽孢杆菌属的决定性特征,但该特征也可用于最近命名的环脂酸 芽孢杆菌属(Alicyclobacillus)、双芽孢杆菌属(Amphibacillus)、Aneurinibacillus、 Anoxybacillus、短芽抱杆菌属(Brevibacillus)、Filobacillus、Gracilibacillus、喜盐 芽孢杆菌属(Halobacillus)、类芽孢杆菌属(Paenibacillus)、Salibacillus、热杆菌属 (Thermobacillus)、解脲芽孢杆菌属(Ureibacillus)和枝芽孢杆菌属(Virgibacillus), 以及其他生物体。术语“多核苷酸”和“核酸”在本文中可互换的使用,指任何长度的核苷酸的聚合 形式,不论是核糖核苷酸或脱氧核糖核苷酸。这些术语包含但不限于,单链、双链或三链的 DNA、基因组DNA、cDNA、RNA、DNA-RNA杂交体,或包含嘌呤和嘧啶碱基或其他天然的、化学的、生物化学修饰的、非天然的或衍生的核苷酸碱基的多聚体。以下是多核苷酸的非限制 性实例基因、基因片段、染色体片段、EST、外显子、内含子、mRNA、tRNA、rRNA、核酶、cDNA、 重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、 核酸探针和引物。在一些实施方案中,多核苷酸包含修饰的核苷酸,例如甲基化核苷酸和 核苷酸类似物、尿嘧啶、其他糖和连接基团,例如氟代核糖(fluororibose)和硫代酸酯 (thioate),以及核苷酸支链。在替代性实施方案中,核苷酸序列被非核苷酸组分中断。如本文中使用的,术语“DNA构建体”和“转化DNA”是可互换使用的,指用于向宿 主细胞或生物体中弓I入序列的DNA。可以通过PCR或本领域已知的其他合适技术在体外产 生DNA。在特定的实施方案中,DNA构建体包含目的序列(例如,输入的(incoming)序列)。 在一些实施方案中,序列与其他元件是有效连接的,例如调控元件(如,启动子等)。DNA构 建体还可以包含选择性标记物。还包含侧接同源盒的输入序列。在其他实施方案中,转化 DNA包含添加在末端的其他非同源序列(例如,填充序列(stuffer sequences)或侧翼)。 在一些实施方案中,输入序列的末端是封闭的,从而使转化DNA形成封闭环状。转化序列可 以是野生型、变体或修饰的。在一些实施方案中,DNA构建体包含与宿主细胞染色体同源的 序列。在其他实施方案中,DNA构建体包含非同源的序列。一旦DNA构建体在体外装配,则 可用于1)将异源序列插入到宿主细胞的期望靶序列中,和/或2)突变宿主细胞染色体的 区域(即,用异源序列替代内源性序列),3)删除靶基因;和/或向宿主引入复制性质粒。如本文中使用的,术语“表达盒”和“表达载体”指重组地或合成地产生的核酸构 建体,具有一系列特殊的核酸元件,允许特定核酸在靶细胞内的转录。重组表达盒可以整合 到质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。一般地,除其他序列外,表达载 体的重组表达盒部分包含待转录的核酸序列和启动子。在一些实施方案中,表达载体具有 在宿主细胞内掺入和表达异源DNA片段的能力。多种原核和真核表达载体是市售的。选择 合适的表达载体属于本领域技术人员的知识范围。术语“表达盒”与“DNA构建体”及其语 法等价体可互换的使用。选择合适的表达载体属于本领域技术人员的知识范围。如本文中使用的,术语“载体”指设计用于将核酸引入一种或多种细胞类型中的多 核苷酸构建体。载体包含克隆载体、表达载体、穿梭载体、质粒、盒式结构(cassette)等。 在一些实施方案中,多核苷酸构建体包含编码蛋白酶(例如,前体或成熟蛋白酶)的DNA序 列,有效连接了能够影响DNA在合适宿主中的表达的合适的原序列(例如,分泌性的等)。如本文中使用的,术语“质粒”指作为克隆载体使用的环状双链(ds)DNA构建体, 其在一些真核细胞或原核细胞中形成染色体外自我复制的遗传元件,或整合到宿主染色体 中。如本文中使用的,在向细胞内引入核酸序列的情况下,术语“引入”指适合将核酸 序列转移到细胞内的任何方法。此类引入的方法包括但不限于原生质体融合、转染、转化、 接合和转导(参见例如,Ferrari等人,“Genetics,”在Hardwood等人(编著),Bacillus, Plenum Publishing Corp.,第 57-72 页,[1989]中)。如本文中使用的,术语“转化的”和“稳定转化的”指这样的细胞,所述细胞具有非 天然(异源)多核苷酸序列整合在其基因组中,或作为附加型质粒维持至少2代。如本文中使用的,术语“编码选择性标志物的核苷酸序列”指这样的核苷酸序列, 所述序列能够在宿主细胞中表达,且选择性标志物的表达使含有所表达基因的细胞能够在存在相应选择剂或缺少关键营养物的条件下生长。如本文中使用的,术语“可选择的标志物”和“选择性标志物”指这样的核酸(即, 基因),所述核酸能够在宿主细胞内表达,并允许便于选择含有载体的这些宿主。此类可选 择的标志物的实例包含但不限于抗微生物剂。因此,术语“可选择的标志物”指这样的基 因,所述基因为已摄入输入的目的DNA或已发生其他反应的宿主细胞提供指示。一般地,可 选择的标志物是在宿主细胞中赋予抗微生物剂抗性或代谢优势的基因,使含有外源DNA的 细胞与在转化过程中未接受任何外源序列的细胞相区别。“驻留的(residing)可选择性标 志物”是位于转化微生物的染色体上的标志物。驻留的可选择标志物编码的基因与位于转 化DNA构建体上的可选择标志物不同。选择性标志物是本领域技术人员熟知的。如上所 示,标志物可以是抗微生物剂抗性标志物(例如,ampK ;phleoE ;specE ;kanE ;eryE ;tetE ;cmpE 和 neoE ;参见例如,Guerot-Fleury, Gene, 167 :335_337[1995] ;Palmeros 等人,Gene 247 255-264 [2000];和 Trieu-Cuot 等人,Gene,23 :331_341 [1983])。其他标志物包含但不限 于营养缺陷型标志物,例如色氨酸;和检测标志物,例如β-半乳糖苷酶。如本文中使用的,术语“启动子”指功能是指导下游基因转录的核酸序列。在一些 实施方案中,启动子适合在其中表达靶基因的宿主细胞。启动子和其他转录和翻译调控核 酸序列(也称为“控制序列”)对表达指定的基因是必需的。通常,转录和翻译的调控序列 包含但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列, 以及增强子或激活子序列。当其置于与另一核酸序列的功能性关联中时,核酸是“有效连接的”。例如,如果作 为参与多肽分泌的前蛋白质表达,则编码分泌前导区(即,信号肽)的DNA与多肽DNA是有 效连接的;如果影响序列的转录,则启动子或增强子与编码序列是有效连接的;如果其位 置有利于翻译,则核糖体结合位点与编码序列是有效连接的。通常,“有效连接的”意指连 接的DNA序列是连续的,并且在分泌前导区的情况下,是以阅读相(in readingphase)连续 的。然而,增强子不需要是连续的。通过在常规的限制性酶切位点连接来实现连接。如果 不存在此类位点,则根据常规操作使用合成的寡核苷酸衔接头(adaptor)或接头。如本文中使用的,术语“基因”指多核苷酸(例如,DNA片段),所述多核苷酸编码 多肽,并包含位于编码区前后的区域,以及在各编码片段(外显子)之间的间插序列(内含 子)。如本文中使用的,术语“同源基因”指来自不同但通常相关的物种的成对基因,所 述基因相互对应,且彼此相同或高度相似。该术语涵盖了由于物种形成(即,新物种产生) 而不同的基因(例如,直系同源基因),和由于基因复制而不同的基因(例如,旁系同源基 因)。如本文中使用的,术语“直系同源物”和“直系同源基因”指从共同祖先基因通过物 种形成进化而来的、但位于不同物种中的基因(即,同源基因)。一般地,直系同源物在进化 过程中保留了相同的功能。鉴别直系同源物可用于新测序基因组中基因功能的可靠预测。如本文中使用的,术语“ 旁系同源物”和“旁系同源基因”指在基因组内通过复制 而相关的基因。当直系同源物在进化过程中保留相同功能的同时,旁系同源物进化了新的 功能,虽然一些功能通常是与原始功能相关的。旁系同源基因的实例包含但不限于,编码胰 蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因,其都是丝氨酸蛋白酶,并共同存在于相同的物种中。如本文中使用的,“同源性”指序列相似性或同一性。该同源性是使用本领域已 知的标准技术确定的(参见例如,Smith 和 Waterman,Adv. App 1. Math.,2 482[1981]; Needleman 禾口 Wunsch, J. Mol. Biol. ,48 443 [1970] ;Pearson 禾口 Lipman, Proc. Natl. Acad. Sci.USA 85 2444[198 8];程序,例如 Wisconsin Genetics 软件包中的 GAP、BESTFIT、FASTA 禾口 TFASTA (Genetics Computer Group, Madison, WI);禾口 Devereux 等人,Nucl. Acid Res., 12 :387-395[1984])。如本文中使用的,“类似序列”是这样的序列,其中基因的功能与基于链霉菌1AG3 蛋白酶的基因基本相同。此外,类似基因与链霉菌菌株1AG3蛋白酶的序列包含至少约 45 %、约 50 %、约 55 %、约 60 %、约 65 %、约 70 %、约 75 %、约 80 %、约 85 %、约 90 %、约 95%、约97%、约98%、约99%或约100%的序列同一性。可选的,类似序列与在链霉菌菌 株1AG3蛋白酶区中发现的基因具有70至100%的匹配(alignment),和/或在与链霉菌菌 株1AG3染色体基因匹配的区域中含有至少5-10个基因。在另一些实施方案中,一种以上 上述性质适用于该序列。通过序列比对的已知方法来确定类似序列。常用的比对方法是 BLAST,但如上下文种指出的,其他方法也可用于比对序列。有用的算法的一个实例是PILEUP。PILEUP利用渐进的、成对比对,从一组相关序 列中创建多重序列比对。也可以绘制树状图来显示用于创建比对的簇状关系。PILEUP使 用了 Feng 和 Doolittle (Feng 和 Doolittle,Mol. Evol. ,35 :351_360 [1987])的渐进比对 方法的简化版。该方法与 Higgins 和 Sharp (Higgins 和 Sharp,CABIOS 5 151-153 [1989]) 所述的相似。有用的PILEUP参数包含缺省的空位权重3. 00,缺省的空位长度权重0. 10,和 加权的末端空位。有用的算法的另一个实例是BLAST算法,由Altschul等人所述(Altschul等 人,J. Mol. Biol.,215 :403_410,[1990];和 Karlin 等人,Proc. Natl. Acad. Sci. USA 90 5873-5787 [1993])。特别有效的 BLAST 算法是 WU-BLAST-2 程序(参见,Altschul 等人, Meth. Enzymol.,266 :460_480 [1996])。WU-BLAST-2使用若干检索参数,大部分设定为缺省 值。可调节的参数设定为下列值重叠跨度=1,重叠分数=0.125,字符阈值(T) = 11。 HSP S和HSP S2参数是动态值,由程序本身根据特定序列的组成和检索目的序列的特定数 据库的组成来确定。然而,可以调整值来增加灵敏度。通过匹配的相同残基数除以比对区 域中“较长”序列的总残基数,来确定%氨基酸序列同一性值。“较长”序列是在比对区域中 具有最多的实际残基的序列(忽略由WU-BLAST-2为了使比对分数最大化而引入的空位)。因此,“百分比(% )核酸序列同一性”定义为在候选序列中与起始序列(即,目的 序列)的核苷酸残基相同的核苷酸残基的百分比。方法使用WU-BLAST-2的BLASTN模块设 定缺省参数,重叠跨度和重叠分数分别设定为1和0. 125。如本文中使用的,术语“杂交”指核酸链与互补链通过碱基配对相连接的过程,如 本领域所已知的。如果在中度至高度严格杂交和洗涤条件下,两条序列彼此特异性的杂交,则认为 核酸序列与参照核酸序列是“可选择性杂交的”。杂交条件是基于核酸结合复合物或探针的 熔解温度(Tm)。例如,“最大严格度”通常发生在约Tm-5°C (低于探针的Tm 5°C ); “高严 格度”在低于Tm约5-10°C ;“中严格度”在低于探针的Tm约10-20°C ;而“低严格度”在低于Tm约20-25°C。功能性地,最大严格度条件可以用于鉴别与杂交探针具有严格一致性或 接近严格一致性的序列,而中度或低度严格杂交可用于鉴别或检测多核苷酸序列同源物。中度和高度严格杂交条件是本领域熟知的。高度严格条件的实例包含在42°C,在 50% 甲酰胺,5X SSC, 5X Denhardt' s 溶液,0. 5% SDS 和 100 μ g/ml 变性载体 DNA 中杂交, 然后在2X SSC和0. 5% SDS中室温洗涤2次,在IX SSC和0. 5% SDS中42°C再洗涤2次。 中度严格条件的实例包含在37 °C,在包含20%甲酰胺,5X SSC(150mM NaCl,15mM柠檬酸三 钠),50mM磷酸钠(pH 7. 6),5X Denhardt' s溶液,10%葡聚糖硫酸盐和20mg/ml变性剪切 的鲑鱼精子DNA的溶液中孵育过夜,然后在IXSSC中约37-50°C洗涤滤膜。本领域技术人员 知道如何调整温度、离子强度等,如必要时调节因子例如探针长度等。如本文中使用的,“重组”包含指细胞或载体,其已通过引入异源核酸序列进行了 修饰,或所述细胞源自上述修饰的细胞。因此,例如,由于有意地人为干预,重组细胞表达在 天然(非重组)形式的细胞中未发现的相同形式的基因,或者异常地表达、低表达或完全不 表达天然基因。“重组”、“重组的”和产生“重组”核酸通常是组装两个或多个核酸片段,其 中所述组装产生嵌合基因。
在一个实施方案中,在至少1个密码子处产生位点饱和诱变的突变DNA序列。在另 一个实施方案中,在两个或多个密码子处实施位点饱和诱变。在另一实施方案中,突变DNA 序列与野生型序列具有高于50%,高于55%,高于60%,高于65%,高于70%,高于75%, 高于80 %,高于85 %,高于90 %,高于95 %,或高于98 %的同源性。在替代性实施方案中, 使用任何已知的诱变程序在体内产生突变DNA,例如辐射、亚硝基胍等。然后,分离期望的 DNA序列,并用于本文提供的方法。如本文中使用的,术语“靶序列,,指宿主细胞中这样的DNA序列,所述DNA序列编 码供输入序列插入宿主细胞基因组时所需的序列。在一些实施方案中,靶序列编码功能性 野生型基因或操纵子,而在其他实施方案中,靶序列编码功能性突变基因或操纵子,或非功 能性基因或操纵子。如本文中使用的,术语“侧翼序列”指在所讨论的序列上游或下游的任何序列(例 如,对于基因A-B-C,基因B的侧翼是A和C基因序列)。在一个实施方案中,输入序列两侧 的侧翼是同源盒。在另一个实施方案中,输入序列和同源盒包含两侧侧翼是填充序列的单 位。在一些实施方案中,侧翼序列仅位于一侧(3’或5’),但在一个实施方案中,位于待侧翼 序列的两侧。在一些实施方案中,侧翼序列仅位于一侧(3’或5’),而在其他实施方案中, 位于待侧翼序列的两侧。如本文中使用的,术语“填充序列”指位于同源盒侧翼的任何额外的DNA(通常是 载体序列)。然而,该术语涵盖了任何非同源的DNA序列。不受任何理论限制,填充序列为 起始DNA摄入的细胞提供了非关键性的(noncritical)靶。如本文中使用的,术语“染色体整合”指这样的过程,在所述过程中输入序列被引 入宿主细胞的染色体中。转化DNA的同源区与染色体同源区匹配。然后,在双交换(即,同 源重组)中,用输入序列取代同源盒之间的序列。在本发明的一些实施方案中,DNA构建体 的失活染色体片段的同源部分与芽孢杆菌染色体的内源(indigenous)染色体区的同源区 侧翼相匹配。然后,在双交换(即,同源重组)中,用DNA构建体删除内源染色体区。“同源重组”意指在相同或几乎相同的核苷酸序列的位点处,两个DNA分子或成对染色体之间DNA片段的交换。在一个实施方案中,染色体整合是同源重组。如本文中使用的,“同源序列”意指当优化比较比对时,与另一核酸或多肽序列具 有约 100%、约 99%、约 98%、约 97%、约 96%、约 95%、约 94%、约 93%、约 92%、约 91%、 约90 %、约88 %、约85 %、约80 %、约75 %或约70 %序列同一性的核酸或多肽序列。在一些 实施方案中,同源序列具有在约85%和约100%之间的序列同一性,而在其他实施方案中, 具有在约90%和约100%之间的序列同一性,在其他实施方案中,具有在约95%和约100% 之间的序列同一性。如本文中使用的,“氨基酸”指肽或蛋白质序列或其部分。术语“蛋白质”、“肽”和 “多肽”是可互换使用的。如本文中使用的,“目的蛋白”和“目的多肽”指期望的和/或待评估的蛋白质/多 肽。在一些实施方案中,目的蛋白在胞内表达,而在其他实施方案中,其是分泌多肽。在特 定实施方案中,这些酶包含本文描述的丝氨酸蛋白酶。在一些 实施方案中,目的蛋白是与信 号肽融合的分泌多肽(即,待分泌蛋白质的氨基端延伸)。几乎所有的分泌蛋白都使用氨基 端的蛋白质延伸,其在跨膜定位和前体蛋白质转运中发挥关键作用。该延伸是在膜转运过 程中或之后立即被信号肽酶通过蛋白酶解切除的。如本文中使用的,术语“异源蛋白质”指不天然存在于宿主细胞内的蛋白质或多 肽。异源蛋白质的实例包含酶,例如水解酶,包含蛋白酶。在一些实施方案中,编码蛋白质 的基因是天然存在的基因,而在其他实施方案中,使用了突变的和/或合成的基因。如本文中使用的,“同源蛋白质”指宿主细胞内天然的或天然存在的蛋白质或多 肽。在一些实施方案中,细胞是革兰氏阳性细胞,而在其他实施方案中,细胞是芽孢杆菌宿 主细胞。在替代性实施方案中,同源蛋白是其他生物体产生的天然蛋白,该其他生物体包含 但不限于大肠杆菌、链霉菌、木霉菌和曲霉。本公开文本还提供了通过重组DNA技术产生同 源蛋白的宿主细胞。“宿主菌株”或“宿主细胞”指用于表达载体的合适的宿主,所述载体包含本发明一 些实施方案的DNA。如果酶在细胞中表达的水平高于其在相应野生型细胞中表达的水平,则酶在宿主 细胞中是“过表达的”。“原序列,,是在信号序列和成熟蛋白酶之间,对蛋白酶分泌所必需的氨基酸序列。 切除原序列可以获得成熟活性蛋白酶。术语“信号序列”或“信号肽”指参与成熟或前体形式的蛋白质分泌的任何核苷酸 和/或氨基酸序列。该信号序列的定义是功能性的,意在包含由蛋白质基因N末端部分编 码的所有氨基酸序列,所述序列参与蛋白质分泌的实施。它们通常,但不是总是连接到蛋白 质的N端部分或连接到前体蛋白质的N端部分。信号序列可以是内源的或外源的。信号序 列通常可以与蛋白质(例如蛋白酶)连接,或可以来自编码另一分泌蛋白质的基因,一个示 例性外源信号序列包含来自枯草芽孢杆菌的信号序列的前七个氨基酸残基,与来自迟缓芽 孢杆菌(BacilluslentusATCC 21536)的枯草杆菌蛋白酶的剩余的信号序列融合。术语“成熟”形态的蛋白质或肽指最终功能形态的蛋白质或肽。例如,成熟形态的 对象蛋白酶至少包含SEQ ID NO 9中提出的氨基酸序列。术语“前体”形态的蛋白质或肽指具有与蛋白质氨基或羧基端有效连接的原序列的成熟形态的蛋白质。前体也可以具有与原序列氨基端有效连接的“信号”序列。前体还 可以具有参与翻译后活性的其他多核苷酸(例如,切除多核苷酸产生成熟形态的蛋白质或 肽)。“天然存在的酶”指具有与天然发现的酶相同的、未修饰的氨基酸序列的酶。天然存在的酶包含天然的酶、在特定微生物体中天然表达或发现的酶。术语“源自”和“获得自”不仅指由或可由所讨论的生物菌株产生的蛋白酶,还指由 分离自此类菌株的DNA序列编码、且在含有此类DNA序列的宿主生物中产生的蛋白酶。此 夕卜,该术语指由合成的和/或cDNA来源的DNA序列编码的蛋白酶,所述蛋白酶具有所讨论 的蛋白酶已鉴定的特征。出于示例,“源自链霉菌的蛋白酶”指具有链霉菌天然产生的蛋白 酶解活性的酶,以及这样的丝氨酸蛋白酶,所述丝氨酸蛋白酶与链霉菌来源产生的酶相似, 但通过使用遗传工程技术,由转化了编码所述丝氨酸蛋白酶的核酸的非链霉菌生物产生。该定义范围内的“衍生物”通常保留了在野生型、天然或亲本形式中观察到的特征 性蛋白酶解活性至下述程度使该衍生物可用于与所述野生型、天然或亲本形式相似的目 的。丝氨酸蛋白酶的功能性衍生物涵盖了天然存在的、合成的或重组产生的肽或肽片段,其 具有本发明丝氨酸蛋白酶的一般特征。术语“功能性衍生物”指这样的核酸衍生物,其具有编码丝氨酸蛋白酶的核酸的功 能性特征。编码本发明丝氨酸蛋白酶的核酸的功能性衍生物涵盖了天然存在的、合成的或 重组产生的核酸或核酸片段,并编码本发明的特征性丝氨酸蛋白酶。编码本发明丝氨酸蛋 白酶的野生型核酸包含天然存在的等位基因,以及基于本领域已知的遗传密码简并性的同 源物。在两个核酸或多肽序列的情况下,术语“相同”指当以最高对应性比对时,两条序 列中相同的残基,使用下列序列比较或分析算法之一进行测量。术语“优化比对”指产生最高百分比同一性分数的比对。就两个氨基酸、多核苷酸和/或基因序列(适当地)而言,“百分比同一性”、“百分 比氨基酸序列同一性”、“百分比基因序列同一性”和/或“百分比核酸/多核苷酸序列同一 性”指当两条序列最优比对时,两条序列中相同残基的百分比。因此,80%氨基酸序列同一 性意指在两条最优比对的多肽序列中,80 %的氨基酸是相同的。因此,在两个核酸或多肽的情况下,短语“基本相同,,指与使用标准参数的程序或 算法(例如,BLAST、ALIGN、CLUSTAL)的参照序列相比,多核苷酸或多肽包含至少70%序列 同一性,至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%和至 少99 %序列同一性。两条多肽基本相同的一个指标是第一条多肽与第二条是免疫交叉反应 的。一般地,由于保守氨基酸取代而相异的多肽是免疫交叉反应的。因此,例如当两条多肽 仅由于保守取代而不同时,多肽与第二多肽是基本相同的。两条核酸序列基本相同的另一 指标是两个分子在严格条件下彼此杂交(例如,在中度至高度严格度的范围)。术语“分离的”或“纯化的”指从其原始环境中移出的材料(例如,如果是天然存 在的,则指天然环境)。例如,如果材料在特定组合物中存在的浓度高于或低于其在天然存 在的或在野生型生物中存在的浓度,或者与在天然存在的或野生型生物中表达后通常不存 在的组分组合,则认为所述材料是“纯化的”。例如,在活动物中存在的天然存在的多核苷酸 活多肽不是分离的,但与天然系统中共存的部分或全部材料分离的相同多核苷酸或多肽则是分离的。此类多核苷酸可以是载体的一部分,和/或此类多核苷酸或多肽可以是组合物 的一部分,只要此类载体或组合物不是其天然环境的一部分,则仍然是分离的。在一些实施 方案中,例如,如果核酸或蛋白质在凝胶电泳或印迹中基本产生一条带,则认为所述核酸或 蛋白质是纯化的。当用于指代DNA序列时,术语“分离的”指已经从天然遗传环境中移出的DNA序列, 并因此不含其他外来的或不期望的编码序列,其存在形式适合在遗传工程改造的蛋白质产 生系统中使用。此类分离的分子是与其天然环境分离的分子,包含cDNA和基因组克隆。本 发明的分离的DNA分子不含其常规相关的其他基因,但可以包含天然存在的5’和3’非翻 译区,例如启动子和终止子。相关区域的鉴定对本领域技术人员是显而易见的(参见例如, Dynan 和 Ti jan,Nature 316 :774_78 [1985])。术语“分离的 DNA 序列”也称为“克隆的 DNA 序列”。当用于指代蛋白质时,术语“分离的”指在其天然环境以外的条件下存在的 蛋白 质。在一种形式中,分离的蛋白质基本不含其他蛋白质,特别是其他同源蛋白质。通过 SDS-PAGE确定时,分离的蛋白质纯度可高于10%,高于20%,和高于30%。通过SDS-PAGE 确定时,发明的其他方面涵盖了更高纯度形式的蛋白质(即,纯度高于约40%,高于约 60 %,高于约80 %,高于约90 %,高于约95 %,高于约97 %,甚至高于约99 % )。如本文中使用的,术语“功能性测定”指提供蛋白质活性的指示的测定。在特定的 实施方案中,该术语指分析蛋白质以其常见能力发挥作用的测定系统。例如,在酶的情况 下,功能性测定涉及确定酶在催化反应时的效率。如本文中使用的,术语“靶性质”指待改变的起始基因的性质。本发明并非意在限 定任何特定的靶性质。但是,在一些实施方案中,靶性质是基因产物的稳定性(例如,对变 性、蛋白酶解或其他降解因素的抗性),而在其他实施方案中,改变了在产生宿主中的产生 水平。实际上,起始基因的任何性质均可考虑用于本发明。如本文中使用的,术语“性质”或其语法等价物在多肽的情况下,指多肽的可以选 择或检测的任何特征或属性。这些性质包含但不限于氧化稳定性、底物特异性、催化活性、 热稳定性、碱稳定性、PH活性谱、对蛋白酶解降解的抗性、KM、Kcat、Kcat/KM比、蛋白质折叠、诱 导免疫应答、结合配体的能力、结合受体的能力、分泌能力、在细胞表面展示的能力、寡聚化 的能力、信号(发放)能力、刺激细胞增殖的能力、抑制细胞增殖的能力、诱导凋亡的能力、 提供磷酸化或糖基化修饰的能力、治疗疾病的能力。术语“修饰的序列,,和“修饰的基因”在本文中可互换的使用,指在天然存在的核 酸序列中包含缺失、插入或间断的序列。在一些实施方案中,修饰的序列的表达产物是截短 的蛋白质(例如,如果修饰是删除或间断序列)。在一些特定的实施方案中,截短的蛋白质 保留了生物学活性。在替代性实施方案中,修饰的序列的表达产物是延长的蛋白质(例如, 在核酸序列中包含插入片段的修饰作用)。在一些实施方案中,插入片段导致截短的蛋白质 (例如,当插入片段导致形成终止密码子时)。因此,插入片段可以导致截短的蛋白质或延 长的蛋白质作为表达产物。术语“野生型序列”或“野生型基因”在本文中可互换的使用,指宿主细胞中天然 的或天然存在的序列。在一些实施方案中,野生型序列指作为蛋白质工程计划起点的目的 序列。野生型序列可以编码同源或异源的蛋白。同源蛋白是宿主细胞无需干预即产生的蛋白质。异源蛋白是宿主细胞没有干预就不产生的蛋白质。如本文中使用的,术语“抗体”指免疫球蛋白。抗体包含但不限于直接得自期望产 生抗体的任何物种的免疫球蛋白。此外,本发明包含修饰的抗体。该术语还指保留与完整 抗体所结合表位的结合能力的抗体片段,并包含多克隆抗体、单克隆抗体、嵌合抗体、抗独 特型(抗ID)抗体。抗体片段包含但不限于互补决定区(CDR)、单链片段可变区(scFv)、重 链可变区(VH)、轻链可变区(VL)。本发明也涵盖了多克隆抗体和单克隆抗体。在一些实施 方案中,抗体是单克隆抗体。术语“氧化稳定的”指本发明的蛋白酶处于蛋白酶解、水解、清洁或其他本发明过 程中的常见条件下(例如,暴露于或接触漂白剂或氧化剂)一段给定时间后,保留特定量的 酶活性。在一些实施方案中,蛋白酶在接触漂白剂或氧化剂给定时间段后,例如至少1分 钟、3分钟、5分钟、8分钟、12分钟、16分钟、20分钟等,保留至少约50%、约60%、约70%, 约 75%、约 80%、约 85%、约 90%、约 92%、约 95%、约 96%、约 97%、约 98%或约 99%的 蛋白酶解活性。在一些实施方案中,如实施例所述测量稳定性。术语“螯合剂稳定的”指本发明的蛋白酶处于蛋白酶解、水解、清洁或其他本发明 过程中的常见条件下(例如,暴露于或接触螯合剂)一段给定时间后,保留特定量的酶活 性。在一些实施方案中,蛋白酶在接触螯合剂给定时间后,例如至少10分钟、20分钟、40分 钟、60分钟、100分钟等,保留至少约50%、约60%、约70%、约75%、约80%、约85%、约 90%、约92%、约95%、约96%、约97%、约98%或约99%的蛋白酶解活性。术语“热稳定的”和“热稳定”指本发明的蛋白酶处于蛋白酶解、水解、清洁或其他 本发明过程中的常见条件下(例如,暴露于改变的温度)一段给定时间后,保留特定量的酶 活性。改变的温度包含升高或降低的温度。在一些实施方案中,蛋白酶在暴露于改变的温 度一段给定时间后,例如至少60分钟、120分钟、180分钟、240分钟、300分钟等,保留至少 约 50%、约 60%、约 70%、约 75%、约 80%、约 85%、约 90%、约 92%、约 95%、约 96%、约 97%、约98%或约99%的蛋白酶解活性。在氧化、螯合剂、热和/或pH稳定性蛋白酶的情况下,术语“增强的稳定性”指与 其他的丝氨酸蛋白酶(例如,枯草杆菌蛋白酶)和/或野生型酶相比,随时间流逝保留更高 的蛋白酶解活性。在氧化、螯合剂、热和/或pH稳定性蛋白酶的情况下,术语“降低的稳定性”指与 其他的丝氨酸蛋白酶(例如,枯草杆菌蛋白酶)和/或野生型酶相比,随时间流逝保留更低 的蛋白酶解活性。术语“清洁活性”指蛋白酶在蛋白酶解、水解、清洁或本发明的其他过程中常见条 件下获得的清洁性能。在一些实施方案中,通过使用多种涉及酶敏感性污渍(例如,草、 血、奶、或卵蛋白)的清洁测定来确定清洁性能,通过将污渍置于标准洗涤条件后,进行多 种层析、分光光度或其他定量方法来确定。示例性测定包含但不限于在WO 99/34011和 U. S. Pat. 6,605,458中描述的(均引入本文作为参考),以及实施例中包含的那些方法。术语蛋白酶的“清洁有效量”指在特定清洁组合物中实现预 期酶活性水平的上述 蛋白酶的量。此类有效量易于为本领域技术人员确定,并取决于多种因素,例如所使用的 特定蛋白酶、清洁用途、清洁组合物的特定组成,以及需要液体组合物还是干燥组合物(例 如,颗粒状、条形)。
如本文中使用的,术语“清洁辅助材料”意指为期望的特定类型的清洁组合物和产 品形式(例如,液体、颗粒、粉末、条形、糊状、片剂、凝胶或泡沫组合物)而选择的任何液体、 固体或气体材料,所述材料与组合物中使用的蛋白酶相容。在一些实施方案中,颗粒状组合 物是“致密”形式的,而在其他实施方案中,液体组合物是“浓缩”形式的。在清洁活性的情况下,术语“增强的性能”指通过标准洗涤循环和/或多个洗涤循 环后的常规评估,确定对一些酶敏感性污渍(如卵、奶、草或血)提高的或增加的清洁活性。在清洁活性的情况下,术语“降低的性能”指通过标准洗涤循环后的常规评估,确 定对一些酶敏感性污渍(如卵、奶、草或血)降低的或减少的清洁活性。在清洁活性的情况下,术语“相当的性能”指比较的枯草杆菌蛋白酶(如,市售 蛋白酶)的至少约60%、至少约70%、至少约80%、至少约90%、至少约95%的清洁活 性,所述枯草杆菌蛋白酶包含但不限于0PTIMASE 蛋白酶(Genencor) 、PURAFECT 蛋白酶 (Genencor)、SAVINASE 蛋白酶(Novozymes)、BPN’-变体(参见例如,美国专利号 34,606)、 RELASE 、DURAZYME 、EVERLASE 、KANNASE 蛋白酶(Novozymes)、MAXACAL 、MAXAPEM 、 PR0PERASE 蛋白酶(Genencor ;还参见,美国专利号34,606,美国专利号5,700,676 ; 5,955, 340 ;6, 312, 936 ;6, 482, 628),和迟缓芽孢杆菌变体蛋白酶产品(例如,在WO 92/21760、WO 95/23221和/或WO 97/07770 (Henkel)中描述的)。示例性枯草杆菌蛋白 酶变体包含但不限于在等价于 BPN’ 的 76、101、103、104、120、159、167、170、194、195、217、 232、235、236、245、248和/或252位的残基位置上具有取代或缺失的对象。可以通过将本 发明的蛋白酶与上述枯草杆菌蛋白酶在多个清洁测定中进行比较,来确定清洁性能,所述 清洁测定涉及酶敏感性污渍(如,草、血或奶),在标准洗涤循环条件后,通过常规的分光光 度法或分析方法来测定。如本文中使用的,“低洗涤剂浓度”系统包含洗涤剂,其中洗涤水中存在低于约 SOOppm的洗涤剂组分。通常认为日本洗涤剂是低洗涤剂浓度系统,其通常在洗涤水中含有 约667ppm的洗涤剂组分。如本文中使用的,“中洗涤剂浓度”系统包含洗涤剂,其中洗涤水中存在约SOOppm 至约2000ppm的洗涤剂组分。通常认为北美洗涤剂是中洗涤剂浓度系统,其通常在洗涤水 中含有约975ppm的洗涤剂组分。巴西洗涤剂通常在洗涤水中含有约1500ppm的洗涤剂组 分。如本文中使用的,“高洗涤剂浓度”系统包含洗涤剂,其中洗涤水中存在大于约 2000ppm的洗涤剂组分。通常认为欧洲洗涤剂是高洗涤剂浓度系统,其通常在洗涤水中含有 约3000-8000ppm的洗涤剂组分。如本文中使用的,“纺织品清洁组合物”包含手洗和机洗洗涤剂组合物,包含洗衣 添加组合物和适用于浸泡和/或预处理污损纺织品(例如,衣物、亚麻和其他纺织材料)的 组合物。如本文中使用的,“非纺织品清洁组合物”包含非纺织(即,织物(fabric))表面清 洁组合物,包含但不限于餐具洗涤剂组合物、口腔清洁组合物、洁齿组合物和个人清洁组合 物。本文中,清洁组合物的“致密”形式最好通过密度来反映,对组合物而言,通过无机 填充盐的量来反映。无机填充盐是粉末形态的洗涤剂组合物的常规成分。在常规的洗涤剂组合物中,填充盐以显著的量存在,一般为总组合物重量的17-35%。相反,在致密组合物 中,填充盐以不超过总组合物15 %的量存在。在一些实施方案中,填充盐存在的量不超过组 合物重量的10%或5%。在一些实施方案中,无机填充盐选自硫酸和盐酸的碱金属盐和碱 土金属盐。示例性的填充盐是硫酸钠。II.丝氨酸蛋白酶和编码丝氨酸蛋白酶的核酸本发明提供分离的多核苷酸,其编码氨基酸序列、编码蛋白酶。在一些实施方案中,这些多核苷酸编码的多肽包含与SEQ ID NO :3、8和11所示的氨基酸序列至少65%氨 基酸序列同一性,至少70%氨基酸序列同一性,至少75%氨基酸序列同一性,至少80%氨 基酸序列同一性,至少85%氨基酸序列同一性,至少90%氨基酸序列同一性,至少92%氨 基酸序列同一性,至少95%氨基酸序列同一性,至少97%氨基酸序列同一性,至少98%氨 基酸序列同一性,和至少99%氨基酸序列同一性(例如,至少一部分由多核苷酸编码的氨 基酸序列具有蛋白酶解活性,包含成熟的蛋白酶催化底物肽键水解),和/或在确定的洗涤 条件下,显示出可比较的或增强的洗涤性能。在一些实施方案中,通过比对序列,直接比较两条分子之间的序列信息,计算两条 比对序列之间匹配的实际数量,除以较短序列的长度,再将结果乘以100,来确定百分比同 一性(氨基酸序列、核酸序列、基因序列)。在这类分析中可以方便的使用可获得的计算机 程序,例如上文描述的。用于确定核苷酸序列同一性的程序可获得自Wisconsin序列分析 包,版本 8 (Genetics Computer Group, Madison, WI),例如 BESTFIT、FASTA 和 GAP 程序,均 依赖于Smith和Waterman算法。使用产生商推荐的缺省参数和上文所述Wisconsin序列 分析包中的描述,可以方便的使用这些程序。适合确定序列相似性的算法的实例是BLAST算法,其描述在Altschul等人, J. Mol. Biol.,215 =403-410(1990)中。用于实施BLAST分析的软件是公众可获得的,通过 国立生物技术信息中心(http://WWW. ncbi. nlm. nih. gov/)。该算法首先涉及鉴别高评分 序列对(HSP),通过在检索序列中鉴别长度W的短词,所述短词当与数据库序列中相同长度 的词比对时,匹配或者满足一些正值的阈值分数T。这些初始的邻接词命中(neighborhood word hits)作为寻找含有它们的更长HSP的起点起作用。分别沿着进行比对的两条序列的 双侧方向延伸字符命中(word hits),尽可能的可以增加累积比对分数。当出现以下情况时 终止字符命中的延伸累积比对分数从最大实际值下降了数量X ;累积比对分数成为0或负 值;或达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程 序使用缺省的字符长(W)为11,BL0SUM62评分矩阵(参见,Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89 10915 (1989))比对(B)为 50,期望值(E)为 10,M,5,N,-4,以及 比对两条链。然后,BLAST算法在两条序列之间实施相似度的统计学分析(参见例如,Karlin和 Altschul,Proc. Nat'1. Acad. Sci. USA 90 :5873_5787 [1993])。BLAST 算法提供的一种相似 度测量是最小总概率(smallest sumprobability) (P (N)),其提供了在两条核苷酸或氨基 酸序列之间可以偶然发生匹配的概率的指标。例如,如果在比对的测试核酸和丝氨酸蛋白 酶核酸之间的最小总概率小于约0. 1,小于约0. 01,或小于约0. 001,则认为核酸与本发明 的丝氨酸蛋白酶核酸是相似的。在测试核酸编码丝氨酸蛋白酶多肽的情况下,如果比对导 致最小总概率小于约0. 5 (例如,小于约0. 2),则认为其与特定的丝氨酸蛋白酶核酸相似。
在本发明的一些实施方案中,通过BLAST和蛋白质翻译序列工具分析序列。在一 些实施方案中,使用Basic BLAST 2. 0版。程序选择“BlastX”,数据库选择“nr”。使用标
准/缺省参数值。在一些实施方案中,本发明涵盖了长度为约1389碱基对的SEQ IDNO 1所示的多 核苷酸,其编码本文描述的1AG3蛋白酶。在SEQ ID NO 1中,以粗体显示起始密码子和终 止密码子,以下划线显示潜在的核糖体结合位点。在本发明的另一个实施方案中,编码这些 氨基酸序列的多核苷酸包含1362碱基对部分(SEQ ID NO 2的残基1-1362),如果表达,认 为将编码信号序列(SEQ ID NO :2的核苷酸1-75)(即,SEQ ID NO 4)(其编码SEQ ID NO 3 的氨基酸 1-25 (即,SEQ ID NO :5))、N-端原序列(SEQID NO 2 的残基 76-591 (SEQ ID NO: 6),编码SEQ ID NO :3的氨基酸残基26-197)(即,SEQ ID NO :7)、成熟蛋白酶序列(SEQ ID NO :2的核苷酸592-1359,其编码SEQ ID NO :3的氨基酸残基198-453 (SEQ ID NO :9的氨基 酸残基1-256))。可选的,信号肽、N-端原序列和成熟丝氨酸蛋白酶序列相对于SEQ ID NO 9的 成熟蛋白酶的氨基酸残基进行编号,即编号为1-256的(S卩,信号肽残基-198至-173), N-端原序列(残基-172至-1),成熟丝氨酸蛋白酶序列(残基1-256)。在本发明的另一 个实施方案中,编码具有蛋白酶解活性的氨基酸序列的多核苷酸包含SEQ ID N0:2核苷酸 1-1362的部分的核苷酸序列,编码信号肽和前体蛋白酶。在本发明的另一个实施方案中,编 码氨基酸序列的多核苷酸包含编码前体链霉菌蛋白酶(SEQ ID NO: 11)的多核苷酸(SEQ ID NO 10)的核苷酸1-1287的部分的序列。在另一个实施方案中,编码氨基酸序列的多核苷 酸包含编码成熟链霉菌蛋白酶(SEQ ID NO 9)的多核苷酸(SEQ ID NO 8)的核苷酸1-768 的序列。下文提供了这些序列SEQ ID NO=I提供了完整的1AG3核苷酸序列,其包含侧翼区1 GACAGC GAGGAG ACCCCT CatgCA CCGCAG AOGOGG AGOGCT ATTOGC OGGCGC CGTGGCCTGTCG CTCCTC TGGGGA GTACGT GGOGTC TGCGCC TCGCGA TAAGCG GCOGOG GCACCG61 GATAGC OGCCCT GACGAT OGCCGC CGOGCC GGCCAC OGCCGG ACCGGC CCTCGC CCCGCCCTATCG GCGGGA CTGCTA GCGGOG GCGCGG COGGTG GCGGCC TGGCCG GGAGOG GGGOGG121 ACCGGC CCAGGA GACGGC GGCCCA GGAGAT CCCTGC OGGCAT GCTGCA GGCCAT GCAGCGTGGCCG GGTCCT CTGCCG CCGGGT CCTCTA GGGACG GCOGTA CGAOGT CCGGTA CGTOGC181 TGATCT OGGCCT CACOGA GCAGCA GGCCGA GGAGCG OGTGGC CAAOGA GTACCA AGCGGGACTAGA GCOGGA GTGGCT OGTCGT CCGGCT CCTOGC GCACOG GTTGCT CATGGT TOGCCC241 CCAGCT GGAGCC AOGGCT GCGGGC GCAATT GGCGGA CACCTT CGCOGG TTCCTG GACCAGGGTOGA CCTCGG TGCOGA OGCCOG CGTTAA COGCCT GTGGAA GOGGCC AAGGAC CTGGTC301 GGGOGA GACCGC CGAGCT GGTCGT GGCCAC CACOGA CCGCGA GCAGCT ACOGGC GCTGACCCCGCT CTGGOG GCTOGA CCAGCA CCGGTG GTGGCT GGOGCT CGTOGA TGGCOG CGACTG361 GGCGGC GGGCGT GOGGGC CACCGT GGCCGA GCACAG CCTGTC CGAGCT OGAGGC CGTGAACOGCCG CCOGCA CGCCCG GTGGCA CCGGCT CGTGTC GGACAG GCTOGA GCTCOG GCACTT421 GGAGAC ACTGGA CGAGGC OGCCGA GGAGCA CGCCAC GACCGA GGCGCC OGTGTG GTAOGTCCTCTG TGACCT GCTCCG GCGGCT CCTCGT GOGGTG CTGGCT COGOGG GCACAC CATGCA481 GGATGT CAOGAG CAACAC GGTCAT CGTGCA CGCCCA GGACGT GACGGC OGGGOG CGACTTCCTACA GTGCTC GTTGTG CCAGTA GCACGT GOGGGT CCTGCA CTGCCG GCCCGC GCTGAA
541 CGTCTC GGCCGC GGGOGT GGACCC CGCCGC GGTCCA OGTGCT GOGCTC GGACGA GCAGCCGCAGAG CCGGOG CCCGCA CCTGGG GOGGOG CCAGGT GCACGA CGCGAG CCTGCT CGTOGG601 GOGGCC TTACCA CGACCT GCGGGG TGGGGA GGCGTA CTACAT GGGCAG OGGAGG GOGCTGCGCOGG AATGGT GCTGGA OGCCCC ACCCCT COGCAT GATGTA CCCGTC GCCTCC CGCGAC
661 CTCGGT OGGCTT CTCOGT TCGCOG CGGAAC TCAGGC GGGCTT CGCGAC OGOGGG TCACTGGAGCCA GCOGAA GAGGCA AGOGGC GCCTTG AGTCCG CCOGAA GOGCTG GCGCCC AGTGAC721 CGGCCG GGTCGG CACCAC CACAOG GGGCTT CAACCA GGTGGC GCAGGG CACCTT CCAGGGGCCGGC CCAGCC GTGGTG GTGTGC CCCGAA GTTGGT CCACOG CGTCCC GTGGAA GGTCCC781 CTCCAT CTTCCC CGGGCG OGACAT GGGCTG GGTOGC GGTCAA CTCCAA CTGGAA CACCACGAGGTA GAAGGG GCCOGC GCTGTA CCCGAC CCAGCG CCAGTT GAGGTT GACCTT GTGGTG841 CCCCTT OGTCOG CGGCCA GGGGGG CGCGAA CGTGAC GGTGGC GGGTTC GCAGCA GGCTCCGGGGAA GCAGGC GCCGGT CCCCCC GOGCTT GCACTG CCACOG CCCAAG OGTCGT COGAGG901 GGTOGG CTCCTC GGTGTG CCGTTC CGGCTC CACCAC OGGCTG GCACTG OGGCAC CATCCACCAGCC GAGGAG CCACAC GGCAAG GCCGAG GTGGTG GCOGAC CGTGAC GCOGTG GTAGGT961 GCAGCA CAACAC CTCGGT GCGCTA TCCGGA GGGCAC CATCAG CGGAGT GACCAG GACCTCCGTOGT GTTGTG GAGCCA OGOGAT AGGCCT CCCGTG GTAGTC GCCTCA CTGGTC CTGGAG1021 GGTGTG OGCCGA ACCOGG TGACTC CGGCGG CGCCTA CATCTC CGGGAA CCAGGC CCAGGGCCACAC GCGGCT TGGGCC ACTGAG GCCGCC GOGGAT GTAGAG GCCCTT GGTCOG GGTCCC1081 CGTGAC CTCCGG CGGCTC GGGCAA CTGCOG CACOGG TGGCAC CACCTA CCACCA GCCGATGCACTG GAGGCC GCCGAG CCOGTT GAOGGC GTGGCC ACOGTG GTGGAT GGTGGT CGGCTA1141 CAACCC GCTGCT GGCACA GTGGAA CCTGAC CCTOGT GACCAC GGGCAA OGGCGG CGACCCGTTGGG OGACGA COGTGT CACCTT GGACTG GGAGCA CTGGTG CCCGTT GCOGCC GCTGGG1201 GGGOGA CCCCGG TGACCC GGGCGA CCCGGG TGAGCC OGGCGG CAGCTG GTCCGC CGGGACCCCGCT GGGGCC ACTGGG CCOGCT GGGCCC ACTOGG GCOGCC GTCGAC CAGGOG GCCCTG1261 CAGTTA OGOGGT CGGOGA CCGGGT GACCTA CGGOGG OGOGGA GTACCG CTGCCT GCAGGCGTCAAT GCGCCA GCCGCT GGCCCA CTGGAT GCCGCC GCGCCT CATGGC GAOGGA CGTCCG1321 CCAOGT OGCCCA GTCOGG CTGGAC GCCCCC GAACAC GCCCGC CCTCTG GCAGOG CGTGtgGGTGCA GCGGGT CAGGCC GACCTG CGGGGG CTTGTG OGGGOG GGAGAC OGTCGC GCACAC1381 a CACGA CCA(SEQ ID NO 1)TGTGCT GGT在上述序列中,推定的核糖体结合位点是下划线的。起始和终止密码子以粗体显 示。下文SEQ ID NO 2提供了 1AG3蛋白酶的多核苷酸序列/1AG3蛋白酶的开放阅读框1 ATG CACCGCA GACGCGGAGC GCTATTCGCC GGCGCCGTGG CGATAGCCGCTACGTGGCGT CTGCGCCTCG CGATAAGCGG CCGCGGCACC GCTATCGGCG51 CCTGACGATC GCCGCCGCGC CGGCCACCGC CGGACCGGCC CTCGCCCCGCGGACTGCTAG CGGCGGCGCG GCCGGTGGCG GCCTGGCCGG GAGCGGGGCG101 CACCGGCCCA GGAGACGGCG GCCCAGGAGA TCCCTGCCGG CATGCTGCAGGTGGCCGGGT CCTCTGCCGC CGGGTCCTCT AGGGACGGCC GTACGACGTC
151 GCCATGCAGC GTGATCTCGG CCTCACCGAGCAGCAGGCCG AGGAGCGCGTCGGTACGTCG CACTAGAGCC GGAGTGGCTCGTCGTCCGGC TCCTCGCGCA201 GGCCAACGAG TACCAAGCGG GCCAGCTGGAGCCACGGCTG CGGGCGCAATCCGGTTGCTC ATGGTTCGCC CGGTCGACCTCGGTGCCGAC GCCCGCGTTA251 TGGCGGACAC CTTCGCCGGT TCCTGGACCAGGGGCGAGAC CGCCGAGCTGACCGCCTGTG GAAGCGGCCA AGGACCTGGTCCCCGCTCTG GCGGCTCGAC301 GTCGTGGCCA CCACCGACCG CGAGCAGCTACCGGCGCTGA CGGCGGCGGGCAGCACCGGT GGTGGCTGGC GCTCGTCGATGGCCGCGACT GCCGCCGCCC351 CGTGCGGGCC ACCGTGGCCG AGCACAGCCTGTCCGAGCTC GAGGCCGTGAGCACGCCCGG TGGCACCGGC TCGTGTCGGACAGGCTCGAG CTCCGGCACT401 AGGAGACACT GGACGAGGCC GCCGAGGAGCACGCCACGAC CGAGGCGCCCTCCTCTGTGA CCTGCTCCGG CGGCTCCTCGTGCGGTGCTG GCTCCGCGGG451 GTGTGGTACG TGGATGTCAC GAGCAACACGGTCATCGTGC ACGCCCAGGACACACCATGC ACCTACAGTG CTCGTTGTGCCAGTAGCACG TGCGGGTCCT501 CGTGACGGCC GGGCGCGACT TCGTCTCGGCCGCGGGCGTG GACCCCGCCGGCACTGCCGG CCCGCGCTGA AGCAGAGCCGGCGCCCGCAC CTGGGGCGGC551 CGGTCCACGT GCTGCGCTCG GACGAGCAGCCGCGGCCTTA CCACGACCTGGCCAGGTGCA CGACGCGAGC CTGCTCGTCGGCGCCGGAAT GGTGCTGGAC601 CGGGGTGGGG AGGCGTACTA CATGGGCAGCGGAGGGCGCT GCTCGGTCGGGCCCCACCCC TCCGCATGAT GTACCCGTCGCCTCCCGCGA CGAGCCAGCC651 CTTCTCCGTT CGCCGCGGAA CTCAGGCGGGCTTCGCGACC GCGGGTCACTGAAGAGGCAA GCGGCGCCTT GAGTCCGCCC GAAGCGCTGG CGCCCAGTGA701 GCGGCCGGGT CGGCACCACC ACACGGGGCTTCAACCAGGT GGCGCAGGGCCGCCGGCCCA GCCGTGGTGG TGTGCCCCGAAGTTGGTCCA CCGCGTCCCG751 ACCTTCCAGG GCTCCATCTT CCCCGGGCGCGACATGGGCT GGGTCGCGGTTGGAAGGTCC CGAGGTAGAA GGGGCCCGCGCTGTACCCGA CCCAGCGCCA801 CAACTCCAAC TGGAACACCA CCCCCTTCGTCCGCGGCCAG GGGGGCGCGAGTTGAGGTTG ACCTTGTGGT GGGGGAAGCAGGCGCCGGTC CCCCCGCGCT851 ACGTGACGGT GGCGGGTTCG CAGCAGGCTCCGGTCGGCTC CTCGGTGTGCTGCACTGCCA CCGCCCAAGC GTCGTCCGAGGCCAGCCGAG GAGCCACACG901 CGTTCCGGCT CCACCACCGG CTGGCACTGCGGCACCATCC AGCAGCACAAGCAAGGCCGA GGTGGTGGCC GACCGTGACGCCGTGGTAGG TCGTCGTGTT951 CACCTCGGTG CGCTATCCGG AGGGCACCATCAGCGGAGTG ACCAGGACCTGTGGAGCCAC GCGATAGGCC TCCCGTGGTAGTCGCCTCAC TGGTCCTGGA1001 CGGTGTGCGC CGAACCCGGT GACTCCGGCGGCGCCTACAT CTCCGGGAACGCCACACGCG GCTTGGGCCA CTGAGGCCGCCGCGGATGTA GAGGCCCTTG1051 CAGGCCCAGG GCGTGACCTC CGGCGGCTCGGGCAACTGCC GCACCGGTGGGTCCGGGTCC CGCACTGGAG GCCGCCGAGCCCGTTGACGG CGTGGCCACC
1101 CACCACCTAC CACCAGCCGA TCAACCCGCT GCTGGCACAG TGGAACCTGAGTGGTGGATG GTGGTCGGCT AGTTGGGCGA CGACCGTGTC ACCTTGGACT1151 CCCTCGTGAC CACGGGCAAC GGCGGCGACC CGGGCGACCC CGGTGACCCGGGGAGCACTG GTGCCCGTTG CCGCCGCTGG GCCCGCTGGG GCCACTGGGC1201 GGCGACCCGG GTGAGCCCGG CGGCAGCTGG TCCGCCGGGA CCAGTTACGCCCGCTGGGCC CACTCGGGCC GCCGTCGACC AGGCGGCCCT GGTCAATGCG 1251 GGTCGGCGAC CGGGTGACCT ACGGCGGCGC GGAGTACCGC TGCCTGCAGGCCAGCCGCTG GCCCACTGGA TGCCGCCGCG CCTCATGGCG ACGGACGTCC1301 CCCACGTCGC CCAGTCCGGC TGGACGCCCC CGAACACGCC CGCCCTCTGGGGGTGCAGCG GGTCAGGCCG ACCTGCGGGG GCTTGTGCGG GCGGGAGACC1351 CAGCGCGTGt GA (SEQ ID NO 2)GTCGCGCACA CTSEQ ID NO 3提供了 1AG3蛋白酶的多肽序列1 MHRRRGALFA GAVAIAALTI AAAPA TAGPA LAPPPAQETA AQEIPAGMLQ51 AMQRDLGLTE QQAEERVANE YQAGQLEPRL RAQLADTFAG SffTRGETAEL101 VYATTDREQL PALTAAGVRA TVAEHSLSEL EAVKETLDEA AEEHATTEAP151 VffYVDVTSNT VIVHAQDVTA GRDFVSAAGV DPAAVHVLRS DEQPRPY HDl·201 R6GEAYYMGS GGRCSVGFSV RRGTQAGFAT A6HCGRVGTT TRGFNQVAQG251 TFQGSIFPGR OMGWVAVNSN WNTTPFVRGQ GGANVTVAGS QQAPVGSSVC301 RSGSTTGWHC GTIQQHNTSV RYPEGTISGV TRTSVCAEPG DSGGAYISGN351 QAQGVTSGGS GNCRTGGTTY HQPINPLLAQ WNLTLVTTGN GGDPGDPGDP401 GDPGEPGGSW SAGTSYAVGD RVTYGGAEYR CLQAHVAQSG WTPPNTPALW451 QRV (SEQ ID NO 3)在上文显示的SEQ ID NO :3中,以双下划线显示预测的信号肽,以单下划线表示预 测的原序列,以粗体显示预测的成熟链。SEQ ID NO 4提供了 1AG3信号序列的多核苷酸序列1 ATGCACCGCA GACGCGGAGC GCTATTCGCC GGCGCCGTGG CGATAGCCGCTACGTGGCGT CTGCGCCTCG CGATAAGCGG CCGCGGCACC GCTATCGGCG51 CCTGACGATC GCCGCCGCGC CGGCC (SEQ ID NO 4)GGACTGCTAG CGGCGGCGCG GCCGGSEQ ID NO 5 (MHRRRGALFA GAVAIAALTI AAAPA)是 SEQ IDNO :4 的信号序列的相应
多肽序列。SEQ ID NO 6提供了 1AG3N-端原序列的多核苷酸序列1 ACCGCCGGAC CGGCCCTCGC CCCGCCACCG GCCCAGGAGA CGGCGGCCCATGGCGGCCTG GCCGGGAGCG GGGCGGTGGC CGGGTCCTCT GCCGCCGGGT51 GGAGATCCCT GCCGGCATGC TGCAGGCCAT GCAGCGTGAT CTCGGCCTCACCTCTAGGGA CGGCCGTACG ACGTCCGGTA CGTCGCACTA GAGCCGGAGT101 CCGAGCAGCA GGCCGAGGAG CGCGTGGCCA ACGAGTACCA AGCGGGCCAGGGCTCGTCGT CCGGCTCCTC GCGCACCGGT TGCTCATGGT TCGCCCGGTC
151 CTGGAGCCAC GGCTGCGGGC GCAATTGGCG GACACCTTCG CCGGTTCCTGGACCTCGGTG CCGACGCCCG CGTTAACCGC CTGTGGAAGC GGCCAAGGAC201 GACCAGGGGC GAGACCGCCG AGCTGGTCGT GGCCACCACC GACCGCGAGCCTGGTCCCCG CTCTGGCGGC TCGACCAGCA CCGGTGGTGG CTGGCGCTCG251 AGCTACCGGC GCTGACGGCG GCGGGCGTGC GGGCCACCGT GGCCGAGCACTCGATGGCCG CGACTGCCGC CGCCCGCACG CCCGGTGGCA CCGGCTCGTG301 AGCCTGTCCG AGCTCGAGGC CGTGAAGGAG ACACTGGACG AGGCCGCCGATCGGACAGGC TCGAGCTCCG GCACTTCCTC TGTGACCTGC TCCGGCGGCT351 GGAGCACGCC ACGACCGAGG CGCCCGTGTG GTACGTGGAT GTCACGAGCACCTCGTGCGG TGCTGGCTCC GCGGGCACAC CATGCACCTA CAGTGCTCGT401 ACACGGTCAT CGTGCACGCC CAGGACGTGA CGGCCGGGCG CGACTTCGTCTGTGCCAGTA GCACGTGCGG GTCCTGCACT GCCGGCCCGC GCTGAAGCAG451 TCGGCCGCGG GCGTGGACCC CGCCGCGGTC CACGTGCTGC GCTCGGACGAAGCCGGCGCC CGCACCTGGG GCGGCGCCAG GTGCACGACG CGAGCCTGCT501 GCAGCCGCGG CCTTAC (SEQ ID NO 6)CGTCGGCGCC GGAATGSEQ ID NO -J提供了 SEQ ID NO 6所示的N_端原序列的相应多肽序列。1 TAGPALAPPP AQETAAQEIP AGMLQAMQRD LGLTEQQAEE RVANEYQAGQ51 LEPRLRAQLA DTFAGSffTRG ETAELVVATT DREQLPALTA AGVRATVAEH101 SLSELEAVKE TLDEAAEEHA TTEAPVffYVD VTSNTVIVHA QDVTAGRDFV151 SAAGVDPAAV HVLRSDEQPR PY (SEQ ID NO 7)SEQ ID NO 8提供了编码成熟蛋白酶序列的多核苷酸序列1 CACGACCTGC GGGGTGGGGA GGCGTACTAC ATGGGCAGCG GAGGGCGCTGGTGCTGGACG CCCCACCCCT CCGCATGATG TACCCGTCGC CTCCCGCGAC51 CTCGGTCGGC TTCTCCGTTC GCCGCGGAAC TCAGGCGGGC TTCGCGACCGGAGCCAGCCG AAGAGGCAAG CGGCGCCTTG AGTCCGCCCG AAGCGCTGGC101 CGGGTCACTG CGGCCGGGTC GGCACCACCA CACGGGGCTT CAACCAGGTGGCCCAGTGAC GCCGGCCCAG CCGTGGTGGT GTGCCCCGAA GTTGGTCCAC151 GCGCAGGGCA CCTTCCAGGG CTCCATCTTC CCCGGGCGCG ACATGGGCTGCGCGTCCCGT GGAAGGTCCC GAGGTAGAAG GGGCCCGCGC TGTACCCGAC201 GGTCGCGGTC AACTCCAACT GGAACACCAC CCCCTTCGTC CGCGGCCAGGCCAGCGCCAG TTGAGGTTGA CCTTGTGGTG GGGGAAGCAG GCGCCGGTCC
251 GGGGCGCGAA CGTGACGGTG GCGGGTTCGC AGCAGGCTCC GGTCGGCTCCCCCCGCGCTT GCACTGCCAC CGCCCAAGCG TCGTCCGAGG CCAGCCGAGG301 TCGGTGTGCC GTTCCGGCTC CACCACCGGC TGGCACTGCG GCACCATCCAAGCCACACGG CAAGGCCGAG GTGGTGGCCG ACCGTGACGC CGTGGTAGGT351 GCAGCACAAC ACCTCGGTGC GCTATCCGGA GGGCACCATC AGCGGAGTGACGTCGTGTTG TGGAGCCACG CGATAGGCCT CCCGTGGTAG TCGCCTCACT401 CCAGGACCTC GGTGTGCGCC GAACCCGGTG ACTCCGGCGG CGCCTACATC
GGTCCTGGAG CCACACGCGG CTTGGGCCAC TGAGGCCGCC GCGGATGTAG451 TCCGGGAACC AGGCCCAGGG CGTGACCTCC GGCGGCTCGG GCAACTGCCGAGGCCCTTGG TCCGGGTCCC GCACTGGAGG CCGCCGAGCC CGTTGACGGC501 CACCGGTGGC ACCACCTACC ACCAGCCGAT CAACCCGCTG CTGGCACAGTGTGGCCACCG TGGTGGATGG TGGTCGGCTA GTTGGGCGAC GACCGTGTCA551 GGAACCTGAC CCTCGTGACC ACGGGCAACG GCGGCGACCC GGGCGACCCCCCTTGGACTG GGAGCACTGG TGCCCGTTGC CGCCGCTGGG CCCGCTGGGG 601 GGTGACCCGG GCGACCCGGG TGAGCCCGGC GGCAGCTGGT CCGCCGGGACCCACTGGGCC CGCTGGGCCC ACTCGGGCCG CCGTCGACCA GGCGGCCCTG651 CAGTTACGCG GTCGGCGACC GGGTGACCTA CGGCGGCGCG GAGTACCGCTGTCAATGCGC CAGCCGCTGG CCCACTGGAT GCCGCCGCGC CTCATGGCGA701 GCCTGCAGGC CCACGTCGCC CAGTCCGGCT GGACGCCCCC GAACACGCCCCGGACGTCCG GGTGCAGCGG GTCAGGCCGA CCTGCGGGGG CTTGTGCGGG751 GCCCTCTGGC AGCGCGTG (SEQ ID NO 8)CGGGAGACCG TCGCGCAC下文SEQ ID N0:9提供了成熟1AG3蛋白酶的氨基酸序列。在该序列中,以粗体显
示催化三联体。1 HDLRGGEAYY MGSGGRCSVG FSVRRGTQAG FATAG η CGRV GTTTRGFNQV51 AQGTFQGSIF PGR D MGffVAV NSNWNTTPFV RGQGGANVTV AGSQQAPVGS101 SVCRSGSTTG WHCGTIQQHN TSVRYPEGTI SGVTRTSVCA EPGD S GGAYI151 SGNQAQGVTS GGSGNCRTGG TTYHQPINPL LAQffNLTLVT TGNGGDP⑶P201 GDP⑶PGEPG GSffSAGTSYA V⑶RVTYGGA EYRCLQAHVA QSGffTPPNTP251 ALffQRV (SEQ ID NO 9)下文SEQ ID NO 10提供了 1AG3前体蛋白酶的多核苷酸序列。1 ACCGCCGGAC CGGCCCTCGC CCCGCCACCG GCCCAGGAGA CGGCGGCCCATGGCGGCCTG GCCGGGAGCG GGGCGGTGGC CGGGTCCTCT GCCGCCGGGT51 GGAGATCCCT GCCGGCATGC TGCAGGCCAT GCAGCGTGAT CTCGGCCTCACCTCTAGGGA CGGCCGTACG ACGTCCGGTA CGTCGCACTA GAGCCGGAGT101 CCGAGCAGCA GGCCGAGGAG CGCGTGGCCA ACGAGTACCA AGCGGGCCAGGGCTCGTCGT CCGGCTCCTC GCGCACCGGT TGCTCATGGT TCGCCCGGTC151 CTGGAGCCAC GGCTGCGGGC GCAATTGGCG GACACCTTCG CCGGTTCCTGGACCTCGGTG CCGACGCCCG CGTTAACCGC CTGTGGAAGC GGCCAAGGAC201 GACCAGGGGC GAGACCGCCG AGCTGGTCGT GGCCACCACC GACCGCGAGCCTGGTCCCCG CTCTGGCGGC TCGACCAGCA CCGGTGGTGG CTGGCGCTCG251 AGCTACCGGC GCTGACGGCG GCGGGCGTGC GGGCCACCGT GGCCGAGCACTCGATGGCCG CGACTGCCGC CGCCCGCACG CCCGGTGGCA CCGGCTCGTG301 AGCCTGTCCG AGCTCGAGGC CGTGAAGGAG ACACTGGACG AGGCCGCCGATCGGACAGGC TCGAGCTCCG GCACTTCCTC TGTGACCTGC TCCGGCGGCT351 GGAGCACGCC ACGACCGAGG CGCCCGTGTG GTACGTGGAT GTCACGAGCA
CCTCGTGCGG TGCTGGCTCC GCGGGCACAC CATGCACCTA CAGTGCTCGT401 ACACGGTCAT CGTGCACGCC CAGGACGTGA CGGCCGGGCG CGACTTCGTCTGTGCCAGTA GCACGTGCGG GTCCTGCACT GCCGGCCCGC GCTGAAGCAG451 TCGGCCGCGG GCGTGGACCC CGCCGCGGTC CACGTGCTGC GCTCGGACGAAGCCGGCGCC CGCACCTGGG GCGGCGCCAG GTGCACGACG CGAGCCTGCT501 GCAGCCGCGG CCTTACCACG ACCTGCGGGG TGGGGAGGCG TACTACATGGCGTCGGCGCC GGAATGGTGC TGGACGCCCC ACCCCTCCGC ATGATGTACC 551 GCAGCGGAGG GCGCTGCTCG GTCGGCTTCT CCGTTCGCCG CGGAACTCAGCGTCGCCTCC CGCGACGAGC CAGCCGAAGA GGCAAGCGGC GCCTTGAGTC601 GCGGGCTTCG CGACCGCGGG TCACTGCGGC CGGGTCGGCA CCACCACACGCGCCCGAAGC GCTGGCGCCC AGTGACGCCG GCCCAGCCGT GGTGGTGTGC651 GGGCTTCAAC CAGGTGGCGC AGGGCACCTT CCAGGGCTCC ATCTTCCCCGCCCGAAGTTG GTCCACCGCG TCCCGTGGAA GGTCCCGAGG TAGAAGGGGC701 GGCGCGACAT GGGCTGGGTC GCGGTCAACT CCAACTGGAA CACCACCCCCCCGCGCTGTA CCCGACCCAG CGCCAGTTGA GGTTGACCTT GTGGTGGGGG751 TTCGTCCGCG GCCAGGGGGG CGCGAACGTG ACGGTGGCGG GTTCGCAGCAAAGCAGGCGC CGGTCCCCCC GCGCTTGCAC TGCCACCGCC CAAGCGTCGT801 GGCTCCGGTC GGCTCCTCGG TGTGCCGTTC CGGCTCCACC ACCGGCTGGCCCGAGGCCAG CCGAGGAGCC ACACGGCAAG GCCGAGGTGG TGGCCGACCG851 ACTGCGGCAC CATCCAGCAG CACAACACCT CGGTGCGCTA TCCGGAGGGCTGACGCCGTG GTAGGTCGTC GTGTTGTGGA GCCACGCGAT AGGCCTCCCG901 ACCATCAGCG GAGTGACCAG GACCTCGGTG TGCGCCGAAC CCGGTGACTCTGGTAGTCGC CTCACTGGTC CTGGAGCCAC ACGCGGCTTG GGCCACTGAG951 CGGCGGCGCC TACATCTCCG GGAACCAGGC CCAGGGCGTG ACCTCCGGCGGCCGCCGCGG ATGTAGAGGC CCTTGGTCCG GGTCCCGCAC TGGAGGCCGC1001 GCTCGGGCAA CTGCCGCACC GGTGGCACCA CCTACCACCA GCCGATCAACCGAGCCCGTT GACGGCGTGG CCACCGTGGT GGATGGTGGT CGGCTAGTTG1051 CCGCTGCTGG CACAGTGGAA CCTGACCCTC GTGACCACGG GCAACGGCGGGGCGACGACC GTGTCACCTT GGACTGGGAG CACTGGTGCC CGTTGCCGCC1101 CGACCCGGGC GACCCCGGTG ACCCGGGCGA CCCGGGTGAG CCCGGCGGCAGCTGGGCCCG CTGGGGCCAC TGGGCCCGCT GGGCCCACTC GGGCCGCCGT1151 GCTGGTCCGC CGGGACCAGT TACGCGGTCG GCGACCGGGT GACCTACGGCCGACCAGGCG GCCCTGGTCA ATGCGCCAGC CGCTGGCCCA CTGGATGCCG1201 GGCGCGGAGT ACCGCTGCCT GCAGGCCCAC GTCGCCCAGT CCGGCTGGACCCGCGCCTCA TGGCGACGGA CGTCCGGGTG CAGCGGGTCA GGCCGACCTG1251 GCCCCCGAAC ACGCCCGCCC TCTGGCAGCG CGTGTGA(SEQ ID NO 10)CGGGGGCTTG TGCGGGCGGG AGACCGTCGC GCACACT下文SEQ ID NO 11提供了 1AG3前体蛋白酶的氨基酸序列。1 TAGPALAPPP AQETAAQEIP AGMLQAMQRD LGLTEQQAEE RVANEYQAGQ
51 LEPRLRAQLA DTFAGSffTRG ETAELVVATT DREQLPALTA AGVRATVAEH101 SLSELEAVKE TLDEAAEEHA TTEAPVffYVD VTSNTVIVHA QDVTAGRDFV151 SAAGVDPAAV HVLRSDEQPR PYHDLRGGEA YYMGSGGRCS VGFSVRRGTQ201 AGFATAGHCG RVGTTTRGFN QVAQGTFQGS IFPGRDMGffV AVNSNWNTTP251 FVRGQGGANV TVAGSQQAPV GSSVCRSGST TGffHCGTIQQ HNTSVRYPEG301 TISGVTRTSV CAEP⑶SGGA YISGNQAQGV TSGGSGNCRT GGTTYHQPIN
351 PLLAQffNLTL VTTGNGGDPG DPGDP⑶PGE PGGSffSAGTS YAV⑶RVTYG401 GAEYRCLQAH VAQSGffTPPN TPALffQRV (SEQ ID NO 11)下文SEQ ID NO 12提供了菌株1AG3的16S rRNA基因序列的部分多核苷酸序列1 GATCCTGGCT CAGGACGAAC GCTGGCGGCG TGCTTAACAC ATGCAAGTCGCTAGGACCGA GTCCTGCTTG CGACCGCCGC ACGAATTGTG TACGTTCAGC51 AACGATGAAG CCGCTTCGGT GGTGGATTAG TGGCGAACGG GTGAGTAACATTGCTACTTC GGCGAAGCCA CCACCTAATC ACCGCTTGCC CACTCATTGT101 CGTGGGCAAT CTGCCCTGCA CTCTGGGACA AGCCCGGGAA ACTGGGTCTAGCACCCGTTA GACGGGACGT GAGACCCTGT TCGGGCCCTT TGACCCAGAT151 ATACCGGATA TGACTGCTTC GGGCATCCGA GGTGGTGGAA AGCTCCGGCGTATGGCCTAT ACTGACGAAG CCCGTAGGCT CCACCACCTT TCGAGGCCGC201 GTGCAGGATG GGCCCGCGGC CTATCAGCTT GTTGGTGGGG TGATGGCCTACACGTCCTAC CCGGGCGCCG GATAGTCGAA CAACCACCCC ACTACCGGAT251 CCAAGGCGAC GACGGGTAGC CGGCCTGAGA GGGCGACCGG CCACACTGGGGGTTCCGCTG CTGCCCATCG GCCGGACTCT CCCGCTGGCC GGTGTGACCC301 ACTGAGACAC GGCCCAGACT CCTACGGGAG GCAGCAGTGG GGAATATTGCTGACTCTGTG CCGGGTCTGA GGATGCCCTC CGTCGTCACC CCTTATAACG351 ACAATGGGCG CAAGCCTGAT GCAGCGACGC CGCGTGAGGG ATGACGGCCTTGTTACCCGC GTTCGGACTA CGTCGCTGCG GCGCACTCCC TACTGCCGGA401 TCGGGTTGTA AACCTCTTTC AGCAGGGAAG AAGC (SEQ ID NO 12)AGCCCAACAT TTGGAGAAAG TCGTCCCTTC TTCG在其他一些实施方案中,本发明提供了编码蛋白酶的DNA片段或部分,只要所编 码的片段保留蛋白酶解的活性。本发明的另一个实施方案涵盖了具有SEQ ID N0:2、8、10 或15的多核苷酸序列的至少20%的序列长度,至少30%的序列长度,至少40%的序列长 度,至少50%的序列长度,至少60%的序列长度,至少70%的序列长度,至少75%的序列长 度,至少80 %的序列长度,至少85 %的序列长度,至少90 %的序列长度,至少92 %的序列长 度,至少95 %的序列长度,至少97 %的序列长度,至少98 %的序列长度,和至少99 %的序列 长度。在一些替代性实施方案中,这些序列长度的片段或部分是序列长度的连续部分,用于 转移重组DNA序列中的DNA序列(参见例如,美国专利号6,132,970,引入本文作为参考)。发明的另一实施方案包含本文所述的DNA片段,根据本领域已知的技术可用于获 得部分长度的DNA片段,所述片段可用于分离或鉴别编码本文所述链霉菌1AG3成熟蛋白酶 的多核苷酸,或其具有蛋白酶解活性的片段。此外,SEQ ID NO :1中提供的DNA可用于鉴别 来自其他物种(特别是链霉菌)的同源DNA片段,所述片段编码蛋白酶或其具有蛋白酶解活性的部分。此外,本发明涵盖了使用由SEQ ID N0:1,或其合适部分或片段(例如,至少约 5-20或10-15个连续核苷酸)构建的引物或探针序列,作为筛选基因组或cDNA来源的核酸 的探针或引物。在一些实施方案中,本发明提供了基于本文提出序列的期望长度的DNA探 针(即,长度通常在100至1000碱基之间)。在一些实施方案中,将DNA片段电泳分离,从凝胶中切出,并从凝胶的琼脂基质 中回收。在一些实施方案中,随后标记该纯化的DNA片段(例如,根据产生商的说明使用 Megaprime标记系统),向DNA中掺入ρ32。在95°C加热所标记的探针一段给定时间(例如, 5分钟),使其变性,并立即添加到膜和预杂交溶液中。杂交反应在合适条件下进行合适的 时间(例如,37°C,18小时),伴随轻柔振荡或旋转。漂洗膜(例如,在SSC/0. 3% SDS中两 遍),然后在合适的洗涤溶液中洗涤并轻柔搅动。期望的严格度是洗膜(滤膜)所用条件 的反映。在本文的一些实施方案中,“低严格度”条件涉及用0.2X SSC/0. 1%SDS的溶液 在20°C洗涤15分钟,而在其他实施方案中,“中严格度”条件涉及另一洗涤步骤,其包括用 0. 2XSSC/0. 1% SDS的溶液在37°C洗涤30分钟,在其他实施方案中,“高严格度”条件涉及 另一洗涤步骤,其包括用0. 2X SSC/0. 1 % SD S的溶液在37°C洗涤45分钟,在其他实施方案 中,“最高严格度”条件涉及另一洗涤步骤,其包括用0. 2X SSC/0. 1% SDS的溶液在37°C洗 涤60分钟。因此,本发明的多个实施方案提供了能在中、高和/或最高严格度条件下,与来 自本文提供的一个或多个核苷酸序列的探针杂交的多核苷酸。 在洗涤后,干燥膜并检测结合的探针。如果使用P32或其他放射性同位素作为标记 试剂,则通过放射自显影检测结合的探针。使其他探针可视化的其他技术是本领域技术人 员熟知的。结合探针的检测表示核酸序列与本文提出的序列具有期望的同源性,因而具有 同一性,涵盖在本发明的范围内。因此,本发明提供了检测编码本发明涵盖的蛋白酶的核酸 的方法,其包括将本文提出的部分或全部核酸序列与基因组或cDNA来源的其他核酸杂交。如上所述,在其他实施方案中,杂交条件是基于核酸结合复合体的熔解温度(Tm), 产生下文解释的确定的“严格度”。“最大严格度”通常发生在约Tm-5°C (低于探针的Tm 5°C );“高严格度”在低于Tm约5-10°C;“中严格度”在低于探针的Tm约10-20°C;而“低严 格度”在低于Tm约20-25°C。如本领域技术人员所知,选择中、高和/或最高严格度杂交, 从而优化条件来鉴别或检测与多核苷酸序列同源或等价的多核苷酸序列。在其他实施方案中,本发明提供了包含编码本发明蛋白酶的多核苷酸的核酸构建 体(即,表达载体)。在其他实施方案中,本发明提供了用至少一种这类载体转化的宿主细 胞。在其他一些实施方案中,本发明提供了还编码信号序列(参加,SEQ IDNO 4)的 多核苷酸序列。在一些实施方案中,发明涵盖了具有信号活性的多核苷酸,包含与SEQ ID NO 4具有至少65%序列同一性,至少70%序列同一性,至少75%序列同一性,至少(more least)80%序列同一性,至少85%序列同一性,至少90%序列同一性,至少95%序列同一 性,至少97 %序列同一性,至少98 %序列同一性,和至少99 %序列同一性的核苷酸序列。因 此,在这些实施方案中,本发明提供了具有推定的信号序列的序列,以及在中、高和/或最 高严格度条件下,能够与源自SEQ ID NO :4公开的核苷酸序列的探针杂交的多核苷酸,其 中,信号序列具有与本发明的多核苷酸编码的信号序列基本相同的信号活性。
在一些实施方案中,通过蛋白酶与起始材料以基本相同的水平分泌到发酵培养基 中来表示信号活性。例如,在一些实施方案中,本发明提供了发酵培养基的蛋白酶水平是信 号序列SEQ ID NO :4提供的发酵培养基中的分泌蛋白酶水平的至少50%,至少60%,至少 70 %,至少80 %,至少90 %,至少95 %,或至少98 %。在一些实施方案中,通过蛋白酶活性 分析验证分泌的蛋白酶水平,例如PNA测定(参见例如,Del Mar, [1979],见上文)。在革 兰氏阳性宿主细胞中确定异源或同源蛋白质分泌水平,并检测分泌蛋白的其他方法包括使 用特异性针对蛋白质的多克隆或单克隆抗体。实例包含酶联免疫吸附测定(ELISA)、放射免 疫测定(RIA)和荧光激活细胞分选(FACS),如本领域技术人员熟知的。在其他一些实施方案中,本发明提供了多核苷酸,其编码信号肽(SEQID NO 2的 核苷酸1-75)的氨基酸序列,如SEQ ID N0:4、SEQ ID NO :2的核苷酸残基位置1_75,和/ 或SEQ ID N0:4所示。发明还涵盖了在低、中、高严格度和/或最高严格度条件下,与SEQ ID NO :4所示核酸序列杂交的核酸序列,却具有与序列基本相同的信号活性。本发明涵盖 了所有此类多核苷酸。在其他一些实施方案中,本发明提供了与本文所述核苷酸序列互补 的多核苷酸。本发明的其他方面涵盖了这样的多肽,所述多肽具有蛋白酶解活性,并包含与SEQ ID NO :3的氨基酸序列(即,信号和前体蛋白酶),SEQ IDNO :11(即,前体蛋白酶)和/或 SEQ ID NO :9( S卩,成熟蛋白酶)65%氨基酸序列同一性,至少70%氨基酸序列同一性,至 少75%氨基酸序列同一性,至少80%氨基酸序列同一性,至少85%氨基酸序列同一性,至 少90%氨基酸序列同一性,至少92%氨基酸序列同一性,至少95%氨基酸序列同一性,至 少97%氨基酸序列同一性,至少98%氨基酸序列同一性,和至少99%氨基酸序列同一性。 使用本领域已知的方法确定这些多肽的蛋白酶解活性,包括用于评估洗涤剂功能的那些方 法。在其他实施方案中,多肽是分离的。在本发明的其他实施方案中,多肽包含与本文提出 的氨基酸序列相同的氨基酸序列。在其他一些实施方案中,多肽与本文提出的部分氨基酸 序列是相同的。在一些实施方案中,本发明提供了具有蛋白酶解活性的分离的多核苷酸,包含长 度约453个氨基酸的氨基酸序列,如SEQ ID NO :3中提供的。在其他实施方案中,本发明涵 盖了具有蛋白酶解活性的多肽,包含SEQ IDNO 11中提供的、长度约428个氨基酸的氨基酸 序列。在一些实施方案中,这些氨基酸序列包含信号序列(SEQ ID NO :5的氨基酸1-25),和 前体蛋白酶(SEQ ID NO :11的氨基酸1-428)。在其他实施方案中,本发明涵盖了包含N-端 原序列(SEQ ID NO 7的氨基酸1-172)、成熟蛋白酶序列(SEQID NO 9的氨基酸1-256)的 多肽。在其他实施方案中,本发明涵盖了包含前体蛋白酶序列(例如,SEQ ID N0:11的氨 基酸1-428)的多肽。在其他实施方案中,本发明涵盖了包含成熟蛋白酶序列,包含(如SEQ ID NO 9的氨基酸1-256)的多肽。
在其他实施方案中,本发明提供了包含上述氨基酸序列的多肽和/或蛋白酶,所 述多肽和/或蛋白酶来自细菌物种,包含但不限于链霉菌科(Str印tomycetaceae),并通过 氨基酸序列同源性研究而鉴别的。在一些实施方案中,如果与链霉菌菌株1AG3蛋白酶中的 特定残基或部分残基同源(即,在一级或三级结构的相应位置)或类似(即,具有相同或相 似的功能进行结合、反应或化学相互作用),则前体链霉菌科蛋白酶的氨基酸残基等价于链 霉菌菌株1AG3的残基。
在一些实施方案中,为了建立一级结构的同源性,直接比较前体蛋白酶的氨基酸 序列与链霉菌菌株1AG3成熟蛋白酶的氨基酸序列,特别是一组保守性残基,所述残基被认 为在所有的或大部分序列已知的链霉菌样蛋白酶中是不变的。在比对保守残基后,为了维 持匹配,允许必要的插入和删除(即,避免由于人为删除和插入导致保守残基的消失),确 定与成熟蛋白酶(SEQ ID NO 9)和链霉菌1AG3蛋白酶中的特定氨基酸对应的残基。保守 残基的比对应该保留100%的此类残基。然而,多于约75%或低至约45%的保守残基的匹 配也足以确定等价的残基。然而,应该维持催化三联体的保守性,即SEQ ID N0:9的His36/ Asp64/Serl45。例如,在一些实施方案中,比对来自链霉菌菌株1AG3,和上述其他链霉菌科物种的蛋白酶的氨基酸序列,来提供氨基酸序列之间最大程度的同源性。这些序列的比较表示在 每条序列中都含有大量的保守残基。这些残基是鉴别并用于建立氨基酸的等价残基位置的 残基,所述氨基酸是在待分析的前体或成熟链霉菌科蛋白酶中鉴别的。这些保守残基用于在一种或多种链霉菌科蛋白酶同源物中确定链霉菌菌株1AG3 蛋白酶的相应氨基酸残基。比对这些特定的氨基酸序列和链霉菌1AG3蛋白酶的序列,产生 保守残基的最大同源性。通过该比对,比较其他生物(例如,链霉菌属物种)观察链霉菌 1AG3的序列和特定残基位置。因此,在其他链霉菌科物种中可以鉴别催化三联体的等价氨 基酸(例如,在链霉菌1AG3蛋白酶中)。在本发明的一些实施方案中,蛋白酶同源物包含 SEQ ID NO 9 的 His36/Asp64/Serl45 的等价物。两条多肽基本相同的另一个指标是,第一条多肽与第二条多肽是免疫交叉反应 的。确定免疫交叉反应性的方法记载在本领域中,并描述与本文的实施例中。一般地,保守 氨基酸取代不同的多肽是免疫交叉反应的。因此,例如,当两条多肽仅保守取代不同时,多 肽与第二多肽是基本相同的。本发明涵盖了从多种来源获得的蛋白酶。在一些实施方案中,蛋白酶获得自细菌, 而在其他实施方案中,蛋白酶获得自真菌。在本发明的其他一些方面,多核苷酸源自这样的细菌,所述细菌的16SrRNA基因 核苷酸序列与链霉菌菌株1AG3的16S rRNA基因核苷酸序列(SEQ ID NO 12)具有至少 70%、75%、80%、85%、90%、92%、95%、98% 的序列同一性。菌株1AG3表现出与链霉菌科的链霉菌属成员最接近的16S rDNA关系。认为最 接近的亲缘关系是索马里链霉菌(Sti^ptomyces somaliensis) (DSM40738),与链霉菌菌株 1AG3的16S rRNA基因核苷酸序列具有至少97%的序列同一性。在本发明的一些实施方案中,菌株69B4如美国专利申请系列号10/576,33所述, 通过引用全文整合到本文中。虽然在给定生物物种的天然存在的酶序列中可以存在突变,对于给定条件下(例 如,温度、PH、水硬度、氧化条件、螯合条件和浓度)的底物特异性和/或蛋白酶解活性水平 等,由相同物种的生物体产生的特定类型的酶通常是基本相同的。因此,出于本发明的目 的,认为链霉菌的其他菌株和物种也产生本发明的链霉菌蛋白酶,从而为本发明的蛋白酶 提供有用的来源。实际上,如本文所示,可以认为链霉菌科的其他成员可用于本发明。在一些实施方案中,本发明的蛋白酶解多肽是物理化学表征的,而在其他实施方 案中,它们的特征是基于它们的功能,在其他实施方案中,同时使用两组性质来表征它们。物理化学特征利用了普遍已知的技术,例如SDS电泳、凝胶过滤、氨基酸组成、质谱(例如, MALDI-TOF-MS.LC-ES-MS/MS等)和沉降来确定蛋白质的分子量,等电聚焦来确定蛋白质的 pl,氨基酸测序来确定蛋白质的氨基酸序列,晶体学研究来确定蛋白质的三级结构,以及抗 体结合来确定蛋白质中存在的抗原性表位。在一些实施方案中,通过蛋白酶领域从业人员熟知的技术来确定功能特征,包含 但不限于各种商业底物的水解,例如二甲基酪蛋白(“DMC”)和/或AAPF-pNA。用于功能 性表征的技术更详细的描述在本文提供的实施例中。在本发明的一些实施方案中,如MALDI-T0F-MS确定的蛋白酶具有约17kD至约 22kD的分子量,例如约18kD至约19kD,例如18700道尔顿至18800道尔顿,例如约18764 道尔顿。在本发明的另一方面,图3中提出了 MALDI-T0F-MS测量的蛋白酶谱。成熟蛋白酶也表现出蛋白酶解活性(例如,对具有肽键的底物的水解活性),例如 DMC。在其他实施方案中,本发明的蛋白酶在定义的条件下提供了增强的洗涤性能。虽然本 发明涵盖了本文描述的蛋白酶1AG3,在一些实施方案中,本发明的蛋白酶与1AG3的蛋白酶 解活性相比,表现出至少 50%,60%,70%,75%,80%,85%,90%,92%,95%,96%,97%, 98%或99%的蛋白酶解活性。在一些实施 方案中,与以商标SAVINASE (Novzymes)或 PURAFECT (Genencor)销售的蛋白酶,在相同条件下的蛋白酶解活性相比,蛋白酶 表现出至少 50%、60%、70%、75%、80%、85%、90%、92%、95%、96%、97%、98% 或 99% 的蛋白酶解活性。在一些实施方案中,本发明的蛋白酶在定义的条件下,与相同条件下的 1AG3相比,表现出可比较的或增强的洗涤性能。在一些实施方案中,本发明的蛋白酶在定 义的条件下,与相同条件下的、以商标SAVINASE (Novzymes)或PURAFECT (Genencor)销售的蛋白酶相比,表现出可比较的或增强的洗涤性能。在其他实施方案中,以纯化的形式(即,在特定组合物中存在的浓度高于或低于 天然存在的或野生型生物体中存在的浓度)提供本发明的蛋白酶和/或编码蛋白酶的多核 苷酸,或者,与在天然存在的或野生型生物体中表达时通常不存在的组分组合。然而,本发 明并非意在限制任意特定纯度水平的蛋白酶,因为多种蛋白酶纯度可用于在本发明的蛋白 酶适用的各种用途。如上所述,还提供了包含编码本发明蛋白酶的核酸的重组多核苷酸。在一些实施 方案中,重组核酸包含表达盒,所述表达盒以有效连接包含启动子、编码目的蛋白酶的编码 序列,和终止序列,其中表达盒足以在宿主细胞中产生蛋白酶。在一些实施方案中,启动子 对编码序列是异源的。在一些优选的实施方案中,重组多核苷酸还编码用于指导目的蛋白酶分泌的信号 序列。在一些优选的实施方案中,重组核酸还包含可选择的标志物,用于从不含重组核酸的 其他细胞中选择含有重组核酸的细胞。示例性的可选择标志物包含但不限于提供抗生素 抗性的可选择标志物(例如,对潮霉素、博来霉素、chloroamphenicol、phleomycin、卡那霉 素、链霉素、青霉素、四环素的抗性等)。在一些实施方案中,编码序列是密码子优化的,用于在所使用的宿主细胞中表达 融合蛋白。由于列举多种细胞中各密码子使用的密码子使用表是本领域已知的(参见例 如,Nakamura等人,Nucl. Acids Res. ,28 292[2000])或可方便获得的,因此,可以方便的 设计此类核酸,产生待表达的蛋白质的氨基酸序列。
在一些实施方案中,目的重组核酸存在于(例如,整合到)宿主细胞的基因组(如 核基因组)中,而在其他实施方案中,它存在于在宿主细胞中自主复制的载体(例如,噬菌 体、质粒、病毒或逆转录载体)中。在一些实施方案中,载体是用于在宿主细胞中表达蛋白 质的表达载体。信号序列、启动子和终止子的选择大部分取决于所使用的宿主细胞。如上所述,在 一些实施方案中,使用链霉菌宿主细胞。在一些实施方案中,信号序列是celA信号序列。 在一些实施方案中,celA信号序列是由变铅青链霉菌维素酶A基因,CelA,编码的信号序 列,如 Klu印fel 等人所述(Klu印fel 等人,Nature Biotechnol.,14 :756_759[1996])。在 使用芽孢杆菌宿主细胞的其他实施方案中,信号序列是能够指导融合蛋白进入芽孢杆菌宿 主细胞分泌通路的任何氨基酸序列。在一些实施方案中,使用的信号序列包含野生型芽孢 杆菌细胞分泌的蛋白质的信号序列。此类信号序列包含α-淀粉酶、蛋白酶(例如,aprE 或枯草杆菌蛋白酶E)或内酰胺酶基因编码的信号序列。示例性的信号序列包含但不 限于,来自任何合适的芽孢杆菌属物种的α-淀粉酶基因、枯草杆菌蛋白酶基因、β-内酰 胺酶基因、中性蛋白酶基因(例如,nprT、nprS、nprM)或prsA基因编码的信号序列,所述 芽孢杆菌属物种包含但不限于嗜热脂肪芽孢杆菌、地衣芽孢杆菌、地衣芽孢杆菌、枯草芽孢 杆菌和解淀粉芽孢杆菌。在一个实施方案中,信号序列是由枯草芽孢杆菌的aprE基因编 码的(参见例如,Olmos-Soto 禾口 Contreras-Flores,Appl. Microbiol. Biotechnol. ,62 369-73 [2003])。其他信号序列描述在 Simonen 和 Palva(Simonen 和 Palva,Microbiol. Rev. ,57 109-137[1993])中,也是本领域已知的。 适合在芽孢杆菌和链霉菌宿主细胞中使用的启动子和终止子是已知的,包含 apr (碱性蛋白酶)、npr(中性蛋白酶)、amy ( α -淀粉酶)和β -内酰胺酶基因,以及枯 草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪 芽孢杆菌的麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌的α _淀粉酶基因(amyQ)、地衣 芽孢杆菌青霉素酶基因(PenP)、枯草芽孢杆菌xylA和xylB基因的启动子和终止子,以 及在WO 93/10249、WO 98/07846和WO 99/43835中描述的启动子和终止子。可以使用本 领域已知的启动子和终止子构建在链霉菌宿主细胞中使用的表达盒(参见例如,HoDwood 等 人’ Genetic Manipulation ofStreptomyces :A Laboratory Manual, Cold Spring Harbor Laboratories [1985] ;Hopwood 等人,In Booth and Higgins ( ) Symposium of theSociety for General Microbiology, Regulation of Gene Expression, Cambridge University Press, [1986],第 251-276 页;FornwaId 等人,Proc. Natl. Acad. Sci. ,84 2130-2134[1987] ;Pulido 等人,Gene 56 :277_82 [1987] ;Dehottay 等人,Eur. J. Biochem., 166 345-50[1987]) ;Taguchi, Gene84 279-86[1989] ;Schmitt-John 等人’ Appl. Microbiol. Biotechnol. ,36 :493-8[1992] ;Motamedi,Gene 160 :25_31[1995];禾口 Binnie, Protein Expr. Purif.,11 :271_8[1997])。在一些实施方案中,使用 A4 启动子(参见,WO 06/054997,提供引用整合到本文中)。链霉菌、芽孢杆菌、曲霉、木霉菌和其他宿主细胞中表达重组蛋白的载体系统是本 领域熟知的。可以考虑在本发明中使用任何合适的系统。III.获得编码本发明的链霉菌科(例如,链霉菌属)蛋白酶的多核苷酸在一些实施方案中,通过本领域已知的标准程序获得编码本发明蛋白酶的核酸,例如克隆DNA (如,DNA“文库”)、化学合成、cDNA克隆、PCR、克隆基因组DNA或其片段,或从期 望的细胞(如细菌或真菌)内纯化,如本领域熟知的。实际上,合成多核苷酸的方法是本领 域熟知的(参见例如,Beaucage禾口 Caruthers,Tetrahedron Lett. ,22 :1859_1862[1981]), 包含使用自动合成仪(参见例如,Needham-VanDevanter等人,Nucl. AcidsRes.,12 6159-6168[1984])。还可以定制DNA序列,并从多个商业来源订购。如本文中更详细描述 的,在一些实施方案中,源自基因组DNA的核酸序列除编码区外还含有调控区。在涉及从基因组DNA中分子克隆基因的一些实施方案中,产生DNA片段,其中一 些包含至少一部分期望的基因。在一些实施方案中,使用不同的限制性酶在特定位点切割 DNA。在一些替代性实施方案中,在存在锰的条件下使用DNA酶来使DNA片段化,或物理剪 切DNA(例如,通过超声)。然后,通过标准技术,根据大小分离并扩增所创造的线性DNA片 段,包含但不限于琼脂糖和聚丙烯酰胺凝胶电泳、PCR和柱层析。—旦产生了核酸片段,可以使用任何合适的方法实现对编码蛋白酶的特定DNA片 段的鉴别。例如,在一些实施方案中,将编码蛋白酶解酶的1AG3基因或其特异性RNA或其 片段(例如探针或引物)分离、标记,然后用于本领域熟知的杂交测定,来检测产生的基因 (参见例如,Benton 和 Davis,Science 196 180 [1977];以及 Grunstein 和 Hogness,Proc. Natl. Acad. Sci. USA 72 :3961 [1975])。在一些实施方案中,与探针具有显著的序列相似性 的DNA片段在中至高严格度条件下杂交。在一些实施方案中,如本领域已知的,使用PCR实现扩增。在一些实施方案中,以 任意合适的组合使用至少约4个核苷酸到多达约60个核苷酸(即,片段)(例如,12-30个 核苷酸或约25个核苷酸)的核酸序列作为PCR引物。这些相同的片段也可以在杂交和产 物检测方法中作为探针使用。在一些实施方案中,从cDNA或基因组文库中分离发明的核酸构建体时,使用简并 的寡核苷酸引物进行PCR,所述引物基于蛋白质的氨基酸序列制备,具有SEQ ID N0:3和/ 或8所示的氨基酸序列。引物可以是任何片段长度,例如长度为至少约4个、至少约5个、 至少约8个、至少约15个、至少约20个核苷酸。本申请的示例性探针使用这样的引物,所 述引物包含与TTGWHCGT(SEQ ID NO 20)和GDSGG(SEQ ID NO 21)多核苷酸序列对应的序 列,如实施例中更详细所述的。综上所述,可以理解,本文提供的多核苷酸序列,和基于本文提供的多核苷酸序列 的序列,可用于从其他物种(特别是细菌)中获得相同或同源的多核苷酸片段,其编码的酶 具有蛋白酶1AG3表达的丝氨酸蛋白酶活性。IV.表达和回收本发明的丝氨酸蛋白酶任何用于表达和回收本发明的丝氨酸蛋白酶的合适方法均可用于本文中。实际 上,本领域技术人员了解许多方法,适合克隆具有蛋白酶解活性的链霉菌-来源的多肽及 其他酶(例如,具有蛋白酶解活性的第二肽,如蛋白酶、纤维素酶、甘露聚糖酶(marmanase) 或淀粉酶等)。本领域还已知多种方法,用于将编码本发明的一种或多种酶的至少一份 (如,多份)一种或多种多核苷酸拷贝,与任何其他期望序列结合,引入宿主细胞基因或基 因组。—般而言,用于克隆基因和向所述基因引入外源蛋白 酶编码区(包含外源编码 区的多份拷贝)的标准方法可用于获得链霉菌1AG3蛋白酶衍生物或其同源物。实际上,本说明书(包括实施例)提供了此类教导。然而,其他本领域已知的方法也是合适的(参 见例如,Sambrook等人,见上文(1989) ;Ausubel等人,见上文[1995];以及Harwood和 CuttinR(编著),Molecular BioloRical Methods for Bacillus, " John Wiley and Sons, [1990];以及 WO 96/34946)。在一些实施方案中,通过与合适的表达载体中的表达控制序列有效连接,并根据本领域成熟建立的技术使用所述表达载体转化合适的宿主,来表达本发明的多核苷酸序 列。在一些实施方案中,根据本领域成熟建立的技术,从细胞培养的发酵物中分离,并使用 多种方法纯化本发明DNA序列表达所产生的多肽。本领域技术人员能够选择最合适的分离 和纯化技术。更具体地,本发明提供了构建体、编号本文所述多核苷酸的载体、用此类载体转化 的宿主细胞,由此类宿主细胞表达的蛋白酶,表达方法和用于产生源自微生物的丝氨酸蛋 白酶的系统,特别是链霉菌科的成员,包含但不限于链霉菌属物种。在一些实施方案中,编 码一种或多种丝氨酸蛋白酶的一种或多种多核苷酸用于产生适合一种或多种丝氨酸蛋白 酶表达的重组宿主细胞。在一些实施方案中,表达宿主能够以可商业化的量来产生一种或 多种蛋白酶。V.重组载体如上文所述,在一些实施方案中,本发明提供了包含上述多核苷酸的载体。在一些 实施方案中,编码蛋白酶的本发明载体(即,构建体)是基因组来源的(例如,通过使用基 因组文库,并使用根据标准技术的合成寡核苷酸探针杂交,筛选编码全部或部分蛋白酶的 DNA序列来制备)。在一些实施方案中,通过从链霉菌菌株1AG3中分离染色体DNA,并通过 PCR方法扩增序列,来获得编码蛋白酶的DNA序列,如本文实施例中所述。在替代性实施方案中,通过已建立的标准方法来合成制备编码蛋白酶的发明的核 酸构建体(参见例如,Beaucage 和 Caruthers, Tetra. Lett. 22 1859-1869[1981];以及 Matthes等人,EMBO J.,3 :801_805 [1984])。根据亚磷酰胺法,合成寡核苷酸(例如,在自 动化DNA合成仪中),纯化、退火、连接并克隆到合适的载体中。在其他实施方案中,核酸构建体是合成的和基因组来源相混合的。在一些实施方 案中,根据标准技术,通过连接合成的片段或基因组DNA片段(当合适时)来制备构建体, 其中片段对应完整核酸构建体的不同部分。在其他实施方案中,本发明提供了包含至少1个本发明的DNA构建体的载体。在 一些实施方案中,本发明涵盖了重组载体。可以考虑在本发明中使用任何合适的载体,包含 自主复制的载体和(瞬时或稳定地)整合到宿主细胞基因组中的载体。实际上,本领域技 术人员已知多种载体、表达盒适合用于在真菌(霉菌或酵母)、细菌、昆虫和植物细胞中克 隆、转化和表达。一般地,载体或盒式结构含有指导核酸转录和翻译地序列,可选择标志物, 和允许自主复制或染色体整合的序列。在一些实施方案中,合适的载体包含基因的5’区, 其锚定转录起始控制因子,以及DNA片段的3’区,其控制转录终止。这些控制区源自与宿 主同源或异源的基因,只要所选择的控制区能够在宿主细胞中发挥功能。在一些实施方案中,载体是表达载体,其中编码发明的蛋白酶的DNA序列有效 连接DNA转录所需的其他片段。在一些实施方案中,表达载体源自质粒或病毒DNA,而在 一些替代性实施方案中,同时含有两类元件。示例性载体包含但不限于PSEA4C、pSEGCT、pSEACT和/或pSEA4CT,以及所有本文实施例中描述的载体。此类载体的构建描述在本文 中,方法是本领域熟知的(参见例如,美国专利号6,287,839 ;和WO 02/50245)。在一些 实施方案中,本文描述的载体PSEA4C可用于构建包含本文描述的多核苷酸的载体(例如, PSEA4CT-1AG3)。实际上,意在本文描述的所有载体都可用于本发明。
在一些实施方案中,如本领域已知的,转录需要的其他片段包含调控片段(例如, 启动子、分泌片段、抑制子、整体调控子(global regulator)等)。一个实例包含在选定 的宿主细胞内表现出转录活性的任何DNA序列,源自编码与宿主细胞同源或异源的蛋白质 的基因。具体地,用于细菌宿主细胞的合适启动子的实例包含但不限于嗜热脂肪芽孢杆 菌麦芽糖淀粉酶基因、解淀粉芽孢杆菌(BAN)的淀粉酶基因、枯草芽孢杆菌的碱性蛋白酶 基因、克劳氏芽孢杆菌的碱性蛋白酶基因、短小芽孢杆菌(Bacilluspumilus)的木糖苷酶 (xylosidase)基因、苏云金芽孢杆菌的cryIIIA和地衣芽孢杆菌的α-淀粉酶基因的启动 子。其他启动子包含Α4启动子,如本文所述。其他可用于本发明的启动子包含但不限于噬 菌体λ的Pk或P^启动子,以及大肠杆菌的lac、trp或tac启动子。在一些实施方案中,启动子源自编码蛋白酶或其片段的基因,与所述序列具有基 本相同启动子活性。发明还涵盖了这样的核酸序列,所述核酸序列在中、高和/或最高严格 度条件下与启动子序列杂交,或与此类启动子具有至少约90%同源性或约95%同源性,具 有基本相同的启动子活动。在一些实施方案中,启动子用于促进蛋白酶和/或异源DNA序 列的表达(例如,除本发明的蛋白酶以外的另一种酶)。在其他实施方案中,载体还包含至 少一种可选择的标志物。
在一些实施方案中,发明的重组载体还包含使载体在宿主细胞中复制的DNA序 列。在涉及细菌宿主细胞的一些实施方案中,这些序列包含允许质粒复制的所有序列(例 如,ori和/或r印序列)。在一些特定的实施方案中,载体还包含信号序列(例如,前导区序列或原序列), 用于指导本发明的多肽进入宿主细胞的分泌通路。在一些实施方案中,分泌信号序列与编 码前体蛋白酶的DNA序列连接在正确的阅读框中。根据蛋白酶是胞内表达或分泌,使用或 不使用天然多肽信号序列,或在细菌(例如芽孢杆菌)、真菌(例如木霉菌)、其他原核细胞 或真核细胞中发挥作用的信号序列,来改造发明的多核苷酸序列或表达载体。在一些实施 方案中,通过去除或部分去除信号序列来实现表达。在一些涉及从细菌细胞中分泌的实施方案中,信号肽是天然存在的信号肽,或其 功能部分,而在其他实施方案中,它是合成的肽。合适的信号肽包含但不限于源自地衣芽孢 杆菌的α-淀粉酶、克劳氏芽孢杆菌的碱性蛋白酶和解淀粉芽孢杆菌的淀粉酶的序列。一 种信号序列是源自链霉菌菌株1AG3的信号肽,如本文所述。因此,在一些特定的实施方案 中,信号肽包含来自本文所述蛋白酶的信号肽。该信号可用于有利于1AG3蛋白酶和/或 异源DNA序列(例如,第二蛋白酶,如另一种野生型蛋白酶、ΒΡΝ’变体蛋白酶、GG36变体蛋 白酶、脂肪酶、纤维素酶、甘露聚糖酶等)的分泌。在一些实施方案中,由本领域已知的DNA 序列和/或氨基酸序列编码这些第二种酶(参见例如,美国专利号6,465,235,6, 287,839、 5,965,384 和 5,795,764 ;以及 WO 98/22500,WO 92/05249,EP 0305216Β1 和 W094/25576)。 此外,可以考虑在一些实施方案中,信号肽序列还与内源序列有效连接,激活和分泌此类内 源编码的蛋白酶。
用于分别连接编码本发明蛋白酶的DNA序列、启动子和/或分泌信号序列的方法, 以及将它们插入含有复制必需信息的合适载体中的方法,是本领域技术人员熟知的。如上 所示,在一些实施方案中,使用特定引物的PCR制备核酸构建体。VI.宿主细胞 如上所述,在一些实施方案中,本发明还提供了用上述载体转化的宿主细胞。在一 些实施方案中,编码引入宿主细胞的一种或多种本发明蛋白酶的多核苷酸是同源的,而在 其他实施方案中,多核苷酸对宿主是异源的。在一些实施方案中,多核苷酸与宿主细胞是同 源的(例如,引入了宿主细胞产生的天然蛋白酶的其他拷贝),它与其他同源或异源的启动 子序列有效连接。在替代性实施方案中,另一分泌信号序列和/或终止子序列可用于本发 明。因此,在一些实施方案中,多肽DNA序列包含多份拷贝的同源多肽序列、来自另一生物 体的异源多肽序列,或一种或多种合成多肽序列。实际上,本发明并非意在限制任何特定的 宿主细胞和/或载体。实际上,引入本发明的DNA构建体的宿主细胞包含能够产生本发明碱性蛋白酶的 任何细胞,包含但不限于细菌、真菌和更高等的真核细胞。可用于本发明的细菌宿主细胞的实例包含但不限于革兰氏阳性细菌,例 如芽孢杆菌、链霉菌和木霉菌,例如枯草芽孢杆菌(B. subtilis)、地衣芽孢杆菌 (B. Iicheniformis)、迟缓芽孢杆菌(B. Ientus)、短芽孢杆菌(B. brevis)、嗜热脂肪 芽孢杆菌(B. stearothermophiIus)、克劳氏芽孢杆菌(B. clausii)、解淀粉芽孢杆菌 (B. amyIoliquefaciens)、凝结芽抱杆菌(B. coagulans)、环状芽抱杆菌(B. circulans)、 灿烂芽孢杆菌(B. Iautus)、巨大芽孢杆菌(B. megaterium)、苏云金芽孢杆菌 (B. thuringiensis)、灰色链霉菌(S. griseus)、变铅青链霉菌(S. Iividans)、天蓝色链霉 菌(S. coelicolor)、除虫链霉菌(S. avermitilis)和褐色高温单孢菌(T. fusca)菌株;以 及革兰氏阴性菌例如肠杆菌科(Enterobacteriaceae)的成员(如,大肠杆菌)。在一些实 施方案中,宿主细胞是枯草芽孢杆菌、克劳氏芽孢杆菌和/或地衣芽孢杆菌。在其他实施 方案中,宿主细胞是变铅青链霉菌的菌株(例如,TK23和/或TK21)。本发明可使用任何 用于细菌转化的合适方法,包括但不限于原生质体转化、使用感受态细胞等,如本领域已知 的。在一些实施方案中,美国专利号5,264,366(提供引用整合到本文中)中提供的方法 可用于本发明。对于变铅青链霉菌,Fernandez-Abalos等人(参见Fernandez-Abalos等 人,Microbiol.,149 1623-1632 [2003];还参见 Hopwood 等人,Genetic Manipulation of Streptomyces LaboratoryManual, Innis [编著],[1985],均引入本文作为参考)描述了 用于转化和蛋白质表达的一种方法。当然,本文实施例中描述的方法也可用于本发明。可用于本发明的真菌宿主细胞的实例包含但不限于木霉菌属物种和曲霉属物 种。在一些特定的实施方案中,宿主细胞是里氏木霉(Trichodermareesei)和/或黑曲霉 (Aspergillus niger)。在一些实施方案中,如美国专利5,364,770中所述,实施曲霉中的 转化和表达,该美国专利引入本文作为参考。当然,本文实施例中描述的方法也可用于本发 明。在一些实施方案中,需要特定的启动子和信号序列来提供一种或多种本发明蛋白 酶的有效转化和表达。因此,在一些涉及使用芽孢杆菌宿主细胞的实施方案中,组合使用 aprE启动子和已知的芽孢杆菌来源的信号序列和其他调控序列。在一些涉及在曲霉中表达的实施方案中,使用glaA启动子。在一些涉及链霉菌宿主细胞的实施方案中,使用米苏里 游动放线菌(Actinoplanes missouriensis)的葡萄糖异构酶(GI)启动子,而在其他实施 方案中,使用A4启动子。在一些涉及在细菌(例如大肠杆菌)中表达的实施方案中,蛋白酶保留在原生质 体中,通常作为不可溶的颗粒(即,包涵体)。然而,在其他实施方案中,通过细菌分泌序列 将蛋白酶导入周质空间中。在前一种情况下,细胞是裂解的,在通过稀释变性剂使蛋白酶重 新折叠后,回收并变性所述颗粒。在后一种情况下,通过破裂细胞(例如,通过超声或渗透 休克),释放周质空间的内容物并回收蛋白酶,从周质空间中回收蛋白酶。在一些实施方案中,在允许本发明蛋白酶表达的条件下,在合适的营养培养基上 培养本发明的转化的宿主细胞,然后从培养物中回收所获得的蛋白酶。用于培养细胞的基 质不可任何适合宿主细胞生长的常规基质,例如含有合适添加物的基础培养基或复杂培养 基。可以从商业供应商获得和/或根据本领域熟知的公开配方制备合适的培养基。在一些 实施方案中,通过常规方法从培养基中回收细胞产生的蛋白酶,包含但不限于通过离心或 过滤从培养基中分离宿主细胞,通过盐(例如,硫酸铵)、层析纯化(例如,离子交换、凝胶过 滤、亲和等)的方式,沉淀上清或滤液的蛋白质组分。因此,可以使用任何适合回收一种或 多种本发明蛋白酶的方法。实际上,本发明并非意在限制任何特定的纯化方法。VII.丝氨酸蛋白酶的用途 如本文详述,本发明的蛋白酶具有使其非常适用于某些用途的重要特征。例如,与 目前使用的蛋白酶相比,本发明的蛋白酶具有增强的热稳定性、增强的氧化稳定性和增强 的螯合剂稳定性。因此,这些蛋白酶可用于清洁组合物。实际上,在一些洗涤条件下,本发 明的蛋白酶表现出与目前使用的枯草杆菌蛋白酶相当的或增强的洗涤性能。因此,可以考 虑以多种清洁组合物的形式提供本发明的清洁和/或酶组合物。在一些实施方案中,以与 枯草杆菌蛋白酶(即,目前使用的蛋白酶)相同的方式使用本发明的蛋白酶。因此,本发明 的蛋白酶可用于多种清洁组合物,以及动物饲料应用、皮革处理(例如,软化(bating))、蛋 白质水解和纺织品用途。鉴别的蛋白酶还可用于个人护理应用。因此,本发明的蛋白酶可用于多种工业应用,特别是在清洁、消毒、动物饲料和 纺织品/皮革工业。在一些实施方案中,一种或多种本发明的蛋白酶与洗涤剂、增洁剂 (builder)、漂白剂和其他常规成分组合,产生多种新清洁组合物,所述清洁组合物可用于 洗衣和其他清洁领域,例如衣物洗涤剂(粉末的和液体的)、洗衣预浸泡剂、全织物漂白剂、 自动餐具洗涤剂(液体和粉末的)、家用洗涤剂、特别是条形皂和液体皂应用,以及下水道 洗涤剂/疏通剂。此外,蛋白酶可用于清洁隐形眼镜和其他物品,通过将此类材料与清洁组 合物的水溶液接触。此外,这些天然存在的蛋白酶可用于,例如肽水解、废物处理、纺织品应 用、医疗设备清洁、生物膜去除以及在蛋白质产生中作为融合切割酶等。这些产品的组成对 本发明不是关键的,只要一种或多种蛋白酶在所用环境中保持其功能。在一些实施方案中, 可以方便的制备所述组合物,通过将清洁有效量的蛋白酶或包含蛋白酶制品的酶组合物, 与本领域公知量的此类组合物的常规组分相组合。本发明的蛋白酶特别可用于清洁工业,包含但不限于洗衣和餐具洗涤剂。这些应 用将酶置于多种环境压力下。由于本发明的蛋白酶在多种条件下的稳定性,具有比目前使 用的许多酶没有的优势。
实际上,在洗涤过程中,蛋白酶暴露于多种洗涤条件下,包含改变的洗涤剂配方、 洗涤水体积、洗涤水温度和洗涤时间长度。此外,在不同地理区域使用的洗涤剂配方在洗涤 水中存在不同的相关组分浓度。例如,欧洲洗涤剂通常在洗涤水中具有约4500-5000ppm的 洗涤剂组分,而日本洗涤剂通常在洗涤水中具有约667ppm的洗涤剂组分。在北美,特别是 美国,洗涤剂通常在洗涤水中具有约975ppm的洗涤剂组分。低洗涤剂浓度系统包含洗涤剂,其中洗涤水中存在低于约SOOppm的洗涤剂组分。 通常认为日本洗涤剂是低洗涤剂浓度系统,其通常在洗涤水中含有约667ppm的洗涤剂组 分。中洗涤剂浓度系统包含洗涤剂,其中洗涤水中存在约800ppm至约2000ppm的洗涤 剂组分。通常认为北美洗涤剂是中洗涤剂浓度系统,其通常在洗涤水中含有约975ppm的洗 涤剂组分。巴西洗涤剂通常在洗涤水中含有约1500ppm的洗涤剂组分。高洗涤剂浓度系统包含洗涤剂,其中洗涤水中存在大于约2000ppm的洗涤剂组 分。通常认为欧洲洗涤剂是高洗涤剂浓度系统,其通常在洗涤水中含有约4500-5000ppm的 洗涤剂组分。拉丁美洲洗涤剂通常是高泡磷酸增洁洗涤剂,拉丁美洲使用的洗涤剂范围可落入 中洗涤剂浓度和高洗涤剂浓度之间,因为它们在洗涤水中的洗涤剂组分范围在1500ppm至 6000ppmo如上所述,巴西洗涤剂通常在洗涤水中含有约1500ppm的洗涤剂组分。然而,其 他高泡磷酸增洁洗涤剂地区,不限于其他拉丁美洲国家,具有高洗涤剂浓度系统,在洗涤水 中存在高达约6000ppm的洗涤剂组分。鉴于上述内容,很显然,典型的洗涤溶液中洗涤剂组合物的浓度在世界范围内变 动,从低于约SOOppm的洗涤剂组合物(“低洗涤剂浓度系统”),例如日本的约667ppm,到在 约800ppm至约2000ppm之间(“中洗涤剂浓度系统”),例如美国的约975ppm和巴西的约 1500ppm,到大于约2000ppm( “高洗涤剂浓度系统”),例如欧洲的约4500ppm至约5000ppm, 以及高泡磷酸增洁洗涤剂地区的约6000ppm。根据经验确定典型洗涤溶液的浓度。例如,在美国,典型的洗衣机容纳体积约 64. 4L的洗涤溶液。因此,为了获得洗涤溶液中约975ppm的洗涤剂浓度,应该向64. 4L洗涤 溶液中添加62. 79g的洗涤剂组合物。该量是消费者利用洗涤剂提供的量杯量入洗涤水中 的典型量。在另一实例中,不同地区使用不同的洗涤温度。日本的洗涤水的温度通常低于欧 洲使用的温度。例如,北美和日本的洗涤水温度可以在10至30°C (如,约20°C ),而欧洲洗 涤水温度一般在30至60°C (如,约40°C )。在另一实例中,不同地区通常具有不同的水硬度。水硬度一般通过每加仑混合的 Ca2+/Mg2+的格令(grain)数来描述。硬度是水中钙(Ca2+)和镁(Mg2+)的量的度量。美国的 多数水是硬水,但硬度值不同。中等硬度水(60-120ppm)至硬水(121-181ppm)具有60至 ISlppm的硬度矿物(ppm转换成格令/美制加仑是ppm数除以17. 1等于格令/加仑)。
欧洲水硬度通常大于10. 5 (例如10. 5-20. 0)格令/加仑混合的Ca2+/Mg2+(例如, 约15格令/加仑混合的Ca27Mg2+)。北美水硬度通常大于日本水硬度,但小于欧洲水硬度。 例如,北美水硬度可以在3-10格令之间、3-8格令或约6格令。日本水硬度通常低于北美水 硬度,一般低于4,例如3格令/加仑混合的Ca27Mg2+。因此,在一些实施方案中,本发明提供了在至少一组洗涤条件下(例如,水温、水 硬度和/或洗涤剂浓度),表现出令人惊讶的洗涤性能的蛋白酶。在一些实施方案中,本发 明的蛋白酶与枯草杆菌蛋白酶的洗涤性能是相当的。在一些实施方案中,本发明的蛋白酶 表现出比枯草杆菌蛋白酶增强的洗涤性能。因此,在本发明的一些实施方案中,本文提供的 蛋白酶表现出增强的氧化稳定性、增强的热稳定性和/或增强的螯合剂稳定性。在一些实施方案中,本发明提供了 1AG3蛋白酶,以及蛋白酶的同源物和变体。这 些蛋白酶可用于期望从纺织品或织物上清除基于蛋白质的污渍的任何应用。在一些实施方案中,本发明的清洁组合物配制成手洗和机洗的衣物洗涤剂组合 物,包含添加剂组分,以及适用于预处理污损纺织品的组合物、漂洗时添加的纺织品软化剂 组合物,在普通家用硬表面清洁操作以及餐具洗涤操作中使用的组合物。本领域技术人员 熟悉可用作清洁组合物的不同配方。在一些实施方案中,本发明的蛋白酶在清洁组合物中 包含相当的或增强的性能(即,与其他蛋白酶相比)。在一些实施方案中,以标准方法,在使 用酶敏感污渍(例如,卵、草、血、奶等)的多种清洁测定中,比较本发明的蛋白酶与枯草杆 菌蛋白酶,来评估清洁性能。实际上,本领域技术人员熟悉使用分光光度法和其他分析方法 在标准洗涤循环条件下评估洗涤剂的性能。可用于本发明的测定包括但不限于在WO 99/34011和美国专利号6,605,458 (参 见例如,实施例3)中描述的。在美国专利号6,605,458中,在实施例3中,在ρΗΙΟ. 5、洗涤 时间15分钟、15°C、水硬度6° dH、IOnM酶浓度条件下,使用3. Og/Ι的洗涤剂剂量,在带搅 棒的150ml玻璃烧杯中,使用5片纺织品片(phi 2. 5cm)和50ml来自Center for Test MaterialsHolland 的 EMPA 117 测试材料。使用 Macbeth ColorEye 7000 光度计,在 460nm 处测量测试材料的反射度“R”。本文的实施例中提供了其他方法。因此,这些方法也可用于 本发明。向常规洗涤组合物中添加本发明的蛋白酶不产生任何特殊的用途限定。换言之, 适合洗涤剂的任何温度和PH液适合本发明的组合物,只要pH落入本文提出的范围内,且温 度低于所述的蛋白酶的变性温度。此外,本发明的蛋白酶可用于(单独的或与增洁剂和稳 定剂组合的)不包含洗涤剂的清洁组合物中。当用于清洁组合物或洗涤剂中时,还要考虑氧化稳定性。因此,在一些应用中,根据多种用途的需要,稳定性与枯草杆菌蛋白酶相比是增强的、降低的或相当的。在一些实施 方案中,需要增强的氧化稳定性。本发明的一些蛋白酶特别适用于此类应用。当用于清洁组合物或洗涤剂中时,还要考虑热稳定性。因此,在一些应用中,根据 多种用途的需要,稳定性与枯草杆菌蛋白酶相比是增强的、降低的或相当的。在一些实施方 案中,需要增强的热稳定性。本发明的一些蛋白酶特别适用于此类应用。当用于清洁组合物或洗涤剂中时,还要考虑螯合剂稳定性。因此,在一些应用中, 根据多种用途的需要,稳定性与枯草杆菌蛋白酶相比是增强的、降低的或相当的。在一些实 施方案中,需要增强的螯合剂稳定性。本发明的一些蛋白酶特别适用于此类应用。在本发明的一些实施方案中,提供天然存在的蛋白酶,其与枯草杆菌蛋白酶相比, 在不同的PH表现出改变的酶活性。pH活性谱是pH对酶活性的图,如实施例所述和/或通 过本领域已知的方法来构建。在一些实施方案中,获得具有宽谱的天然存在的蛋白酶是期 望的(即,在PH范围内,具有比相当的枯草杆菌蛋白酶更高的活性)。在其他实施方案中, 酶在任何PH下均无显著升高的活性,或具有较尖锐的谱的天然存在的同源物(即,在给定 PH下,具有比枯草杆菌蛋白酶增强的活性,但在其他情况下活性较低)。因此,在多个实施 方案中,本发明的蛋白 酶具有不同的PH最适度和/或范围。本发明并非意在限制任何特定 的PH或pH范围。在本发明的一些实施方案中,清洁组合物包含本发明的蛋白酶,其水平是占组合 物重量的约0. 00001%至约10%的1AG3和/或本发明的其他蛋白酶,以及包含清洁辅助材 料的余量(balance)(例如,占组合物重量的约99. 999%至约90. 0% )。在本发明的其他方 面,本发明的清洁组合物包含1AG3和/或其他蛋白酶,水平为占组合物重量的约0. 0001% 至约10%,约0. 001%至约5%,约0. 001%至约2%,约0. 005%至约0. 5%的69B4或本发 明的其他蛋白酶,以及包含清洁辅助材料的清洁组合物余量(例如,以重量计约99. 9999% 至约 90. 0%,约 99. 999%至约 98%,约 99. 995%至约 99. 5% )。在一些实施方案中,清洁组合物,除本发明的蛋白酶制品外,还包含一种或多种其 他酶或酶衍生物,所述酶或酶衍生物提供清洁性能和/或织物护理益处。此类酶包含但不 限于其他蛋白酶、脂肪酶、角质酶、淀粉酶、纤维素酶、过氧化物酶(例如,虫漆酶)和/或甘 露聚糖酶。 任何适合在碱性溶液中使用的其他蛋白酶都可用于本发明的组合物。合适的蛋白 酶包含动物、植物或微生物来源的。在特定的实施方案中,使用微生物蛋白酶。在一些实施 方案中,包含化学的或遗传修饰的变体。在一些实施方案中,蛋白酶是丝氨酸蛋白酶、碱性 微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例包含枯草杆菌蛋白酶,特别是源自 芽孢杆菌属物种(例如,枯草芽孢杆菌、迟缓芽孢杆菌和解淀粉芽孢杆菌)的蛋白酶,以及 枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、GG36、枯草杆菌蛋白酶147和枯草杆菌 蛋白酶168。其他实例包含在美国专利号RE34, 606,5, 955,340,5, 700,676,6, 312,936和 6,482,628中描述的变体蛋白酶,均引入本文作为参考。其他蛋白酶的实例包含但不限于胰 蛋白酶(例如,猪或牛来源的),和WO 89/06270中描述的镰孢菌(Fusarium) 蛋白酶。市售蛋白酶包含以商标名MAXATASE 、MAXACAL 、MAXAPEMtm、
OPTICLEAN 、OPTIMASE 、PROPERASE 、PURAFECT 和PURAFECT OXP(Genencor)出售的那些蛋白酶,以商标名 ALCALASE 、SAVINASE 、PRIMASE 、DURAZYM 、RELASE 和ESPERASE (Novozymes)出售的那些蛋白酶;和以商标名BLAP (Henkel Kommanditgesellschaft auf Aktien,Duesseldorf,德国)出售的蛋白酶。在W095/23221、 W092/21760,和美国专利号 5,801,039,5, 340,735,5, 500,364,5, 855,625 中描述了多种蛋 白酶。另一 BPN,变体(在本文中称为“BPN-var 1 ”和“BPN-变体1 ”)描述在US RE 34,606 中。另一 GG36-变体(在本文中称为“GG36-var 1”和“GG36-变体1”)描述在美国专利号 5,955,340和5,700,676中。其他GG36-变体描述在美国专利号6,312,936和6,482,628 中。在本发明的一个方面,本发明的清洁组合物包含其他蛋白酶,水平为占组合物重量的 0. 00001%至10%,以及占组合物重量的99. 999%至90. 0%的清洁辅助材料。在本发明的 其他实施方案中,本发明的清洁组合物还包含蛋白酶,水平为占组合物重量的0. 0001%至 10%,0. 001%至5%,0. 001%至2%,0. 005%至0. 5%的69B4蛋白酶(或其同源物或变 体),以及包含清洁辅助材料的清洁组合物余量(例如,以重量计约99. 9999%至约90. 0%, 约 99. 999 % 至约 98 %,约 99. 995 % 至约 99. 5 % )。
此外,任何适合在碱性溶液中使用的脂肪酶都可用于本发明。合适的脂肪酶包 含但不限于细菌或真菌来源的。本发明涵盖了化学或遗传修饰的变体。有用的脂肪酶的 实例包含Humicola lanuginosa脂肪酶(参见例如,EP 258068和EP 305216)、米赫根毛 霉(Rhizomucor miehei)脂肪酶(参见例如,EP 238023)、假丝酵母(Candida)脂肪酶, 例如南极假丝酵母(C. antarctica)脂肪酶(例如,南极假丝酵母脂肪酶A或B,参见例 如EP 214761)、假单胞菌(Pseudomonas)脂肪酶例如产碱假单胞菌(P. alcaligenes)和 类产碱假单胞菌(P.pseudoalcaligenes)脂肪酶(参见例如EP 218272)、洋葱假单胞菌 (P. cepacia)脂肪酶(参见例如EP 331376)、斯氏假单胞菌(P. stutzeri)脂肪酶(参见例 如GB 1,372,034)、荧光假单胞菌(P. fluorescens)脂肪酶、芽孢杆菌脂肪酶(例如,枯草芽 孢杆菌脂肪酶(Dartois 等人,Biochem. Biophys. Acta 1131 253-260 [1993]);嗜热脂肪芽 孢杆菌脂肪酶(参见例如JP 64/744992);和短芽孢杆菌脂肪酶(参见例如W091/16422))。此外,多种克隆的脂肪酶可用于本发明的一些实施方案,包含但不限于沙门 柏干酪青霉(Penicillium camembertii)脂肪酶(参见,Yamaguchi 等人,Gene 103 61-67 [1991])、白地霉(Geotricum candidum)脂肪酶(参见,Schimada 等人,J. Biochem., 106 :383-388[1989])和多种根霉(Rhizopus)脂肪酶,例如德氏根霉(R. delemar)脂肪酶 (参见,Hass 等人,Gene 109 :117_113[1991])、雪白根霉(R. niveus)脂肪酶(Kugimiya 等 人,Biosci. Biotech. Biochem. 56 :716_719 [1992])和米根霉(R. oryzae)脂肪酶。其他类型的脂肪水解酶(如角质酶)也可用于本发明的一些实施方案中,包含但 不限于源自门多萨假单胞菌(Pseudomonas mendocina)的角质酶(参见WO 88/09367),或 源自腐皮镰孢菌(Fusarium solani pisi)的角质酶(参见WO 90/09446)。其他合适的脂肪酶包含市售脂肪酶例如M1LIPASE 、LUMAFAST 和 LIP0MAX (Genencor) ;LIPOLASE 和LIPOLASE ULTRA (Novozymes);和 LIPASE P " Amano" (Amano PharmaceuticalCo. Ltd. , H^S ) ο在本发明的一些实施方案中,本发明的清洁组合物还包含脂肪酶,水平为占组合物重量的0.00001%至10%,以及占组合物重量的余量清洁辅助材料。在本发明的其他方 面,本发明的清洁组合物还包含脂肪酶,水平为占组合物重量的0. 0001%至10%,0. 001% 至 5%,0. 001%至 2%,0. 005%至 0. 5%。任何适合在碱性溶液中使用的淀粉酶(α和/或β)都可用于本发明。合 适的淀粉酶包含但不限于细菌或真菌来源的。在一些实施方案中还包含了化学或 遗传修饰的变体。可用于本发明的淀粉酶的实例包含但不限于获得自地衣芽孢杆 菌的α-淀粉酶(参见例如,GB 1, 296, 839) 0可用于本发明的市售淀粉酶包含但 不限于 DURAMYL 、TERMAMYL 、 FUNGAMYL 、BAN 、 STAINZYME 和 NATALASE (Novozymes),以及 RAPIDASE 和 MAXAMYL P(Genencor International)。在本发明的一些实施方案中,本发明的清洁组合物还包含淀粉酶,水平为占组 合物重量的约0. 00001%至约10%的其他淀粉酶,以及以重量计,占余量的清洁辅助材 料。在本发明的其他方面,本发明的清洁组合物还包含淀粉酶,水平为占组合物重量的约 0. 0001%至约 10%,约 0. 001%至约 5%,约 0. 001%至约 2%,约 0. 005%至约 0. 5%。任何适合在碱性溶液中使用的纤维素酶都可用于本发明的一些实施方案。合适的 纤维 素酶包含但不限于细菌或真菌来源的。在一些实施方案中还包含了化学或遗传修饰的 变体。合适的纤维素酶的实例包含但不限于Humicola insolens纤维素酶(参见例如,美 国专利号4,435,307)。特别适合的纤维素酶是有颜色护理益处的纤维素酶(参见例如,EP 0495257)。可用于本发明的市售纤维素酶包含但不限于CELLUZYME (Novozymes) 和KAC-500(B)TM(Kao Corporation)。在一些实施方案中,掺入的纤维素酶是成熟野生型或 变体纤维素酶的部分或片段,其中缺失了 N端部分(参见例如,美国专利号5,874,276)。在一些实施方案中,本发明的清洁组合物还可以包含纤维素酶,水平为占组合物 重量的约0. 00001%至约10%的其他纤维素酶,以及以重量计,占余量的清洁辅助材料。 在本发明的其他方面,本发明的清洁组合物还包含纤维素酶,水平为占组合物重量的约 0. 0001%至约 10%,约 0. 001%至约 5%,约 0. 001%至约 2%,约 0. 005%至约 0. 5%。任何适合在洗涤剂组合物和/或碱性溶液中使用的甘露聚糖酶都可用于本发 明。合适的甘露聚糖酶包含但不限于细菌或真菌来源的。在一些实施方案中还包含了化 学或遗传修饰的变体。可用于本发明的多种甘露聚糖酶是已知的(参见例如,美国专利号 6,566,114,6, 602,842 和 6,440,991,均引入本文作为参考)。在一些实施方案中,本发明的清洁组合物还可以包含甘露聚糖酶,水平为占组合 物重量的约0. 00001%至约10%的其他甘露聚糖酶,以及以重量计,占余量的清洁辅助材 料。在本发明的其他方面,本发明的清洁组合物还包含甘露聚糖酶,水平为占组合物重量的 约 0. 0001%至约 10%,约 0. 001%至约 5%,约 0. 001%至约 2%,约 0. 005%至约 0. 5%。在一些实施方案中,过氧化物酶与过氧化氢或其来源(例如,过碳酸盐、过硼酸盐 或过硫酸盐)组合的使用。在替代性实施方案中,氧化酶与氧组合使用。两类酶都用于“溶 液漂白”(即,当在洗涤液中同时洗涤织物时,防止纺织品染料从染色的织物转移到其他织 物上),与增效剂一起使用(参见例如,WO 94/12621和WO 95/01426)。合适的过氧化物酶 /氧化酶包含但不限于植物、细菌或真菌来源的。在一些实施方案中还包含了化学或遗传修饰的变体。在一些实施方案中,本发明的清洁组合物还可以包含过氧化物酶和/或氧化酶, 其水平为占组合物重量的约0.00001%至约10%的其他过氧化物酶和/或氧化酶,以及以 重量计,占余量的清洁辅助材料。在本发明的其他方面,本发明的清洁组合物还包含过氧化 物酶和/或氧化酶,水平为占组合物重量的约0. 0001%至约10%,约0. 001%至约5%,约 0. 001%至约 2%,约 0. 005%至约 0. 5%。本文涵盖了上述酶的混合物,特别是1AG3酶、一种或多种其他蛋白酶、至少一种 淀粉酶、至少一种脂肪酶、至少一种甘露聚糖酶,和/或至少一种纤维素酶的混合物。实际 上,本发明可以考虑使用上述酶的多种混合物。考虑蛋白酶以及一种或多种其他酶的不同水平均可独立的达到10%,清洁组合物 的余量为清洁辅助材料。通过考虑待清洁的表面、物品或织物,以及在使用过程中(例如, 提供洗涤洗涤剂使用)用于清洁条件的组合物的期望形态,可以方便的确定对清洁辅助材 料的具体选择。合适的清洁辅助材料的实例包含但不限于表面活性剂、增洁剂、漂白剂、漂白活化 齐U、 漂白催化剂、其他酶、酶稳定系统、螯合剂、光学增白剂、土壤释放聚合物、染料转移剂、 分散剂、消泡剂、染料、香料、着色剂、填充盐、水溶助长剂、光活化剂、荧光剂、织物调节剂、 可水解的表面活性剂、防腐剂、抗氧化剂、抗收缩剂、抗皱剂、杀菌剂、杀真菌剂、色斑、银护 理剂、抗晦暗剂和/或抗腐蚀剂、碱度来源、增溶剂、载体、加工助剂、色素和PH控制剂(参 见例如,美国专利号 6,610,642,6, 605,458,5, 705,464,5, 710,115,5, 698,504,5, 695,679、 5,686,014和5,646,101,均引入本文作为参考)。下文详细示例了特定清洁组合物材料的 实施方案。如果清洁辅助材料与清洁组合物中的本发明蛋白酶不相容,则使用合适的方法将 清洁辅助材料和一种或多种蛋白酶分隔(即,不彼此接触),直至适合组合这两种组分时。 此类分隔方法包括本领域已知的任何合适方法(例如,软胶囊、封装、片剂、物理分隔等)。在一些实施方案中,组合物中包含有效量的本文提供的一种或多种蛋白酶,所述 组合物用于清洁多种需要去除蛋白质污渍的表面。此类清洁组合物包含用于以下应用的清 洁组合物,如清洁硬表面、织物和餐具。实际上,在一些实施方案中,本发明提供了织物清洁 组合物,而在其他实施方案中,本发明提供了非织物清洁组合物。值得注意的,本发明还提 供了适合个人护理的清洁组合物,包含口腔护理(包含洁牙剂、牙膏、漱口剂等,以及洁齿 组合物)、皮肤和头发清洁组合物。本发明旨在涵盖任何形式的洗涤剂组合物(即,液体、颗 粒、条形、半固体、凝胶、乳液、片剂、胶囊等)。作为示例,下文更详细地描述了可使用本发明的蛋白酶的一些清洁组合物。在一 些实施方案中,本发明的清洁组合物配制成适合衣物机洗方法的组合物,本发明的组合物 含有至少一种表面活性剂和至少一种增洁剂化合物,以及一种或多种清洁辅助材料,所述 材料选自有机聚合化合物、漂白剂、其他酶、消泡剂、分散剂、石灰皂分散剂、土壤悬浮剂和 抗再沉积剂以及缓蚀剂。在一些实施方案中,洗衣组合物还含有软化剂(即,作为其他的清 洁辅助材料)。本发明的组合物还可用于固体或液体形式的洗涤剂添加剂产品。此类添加剂产品 旨在补充和/或提高常规洗涤剂组合物的性能,可以在清洁过程的任何阶段添加。
在一些实施方案中,配制成用于手工洗碗方法的组合物,所述组合物包含至少一 种表面活性剂和/或至少一种其他的清洁辅助材料,所述材料选自有机聚合化合物、增泡 齐 、π族金属离子、溶剂、水溶助长剂和其他酶。在一些实施方案中,本文的衣物洗涤剂组合物的密度范围在约400至约1200g/ 升,而在其他实施方案中,在约20°C下测量时,范围在约500至约950g/升组合物。在一些实施方案中,本发明的蛋白酶可用于多种清洁组合物,例如在美国专利号 6,605,458中提供的。因此,在一些实施方案中,包含至少一种本发明蛋白酶的组合物是致 密的颗粒状织物清洁组合物,而在其他实施方案中,组合物是用于着色织物洗涤的颗粒状 织物清洁组合物,在其他实施方案中,组合物是通过洗涤力提供软化的颗粒状织物清洁组 合物,在其他实施方案中,组合物是重役型液体织物清洁组合物。在一些实施方案中,包含至少一种本发明蛋白酶的组合物是织物清洁组合物,例 如在美国专利号6,610,642和美国专利号6,376,450中描述的。此外,本发明的蛋白酶可 用于在欧洲或日本洗涤条件下的特定用途的颗粒状衣物洗涤剂组合物 (参见例如,美国专 利号 6,610,642)。在替代性的实施方案中,本发明提供了包含至少一种本文提供的蛋白酶的硬表面 清洁组合物。因此,在一些实施方案中,包含至少一种本发明蛋白酶的组合物是硬表面清洁 组合物(参见例如,美国专利号6,610,642,6, 376,450和6,376,450)。在其他实施方案中,本发明提供了包含至少一种本文提供的蛋白酶的洗碗组合 物。因此,在一些实施方案中,包含至少一种本发明蛋白酶的组合物是硬表面清洁组合物 (参见例如,美国专利号6,610,642和6,376,450)。在其他实施方案中,本发明提供了包含至少一种本文提供的蛋白酶的洗碗组合 物。因此,在一些实施方案中,包含至少一种本发明蛋白酶的组合物包含口腔护理组合物 (参见例如,美国专利号6,376,450和6,376,450)。化合物和清洁附加材料的配方和描述(参见例如美国专利号6,376,450、 6,605,458,6, 605,458和6,610,642,通过引用清楚地整合到本文中)。下文实施例中提出 了其他实例。另外,本发明提供了用于生产食品或动物饲料的组合物和方法,其特征在于将本 发明蛋白酶与食品或动物饲料混合。在一些实施方案中,上述蛋白酶在加工之前作为干燥 产品加入,而在其他实施方案中,其在加工之前或之后作为液体加入。在使用干粉的一些实 施方案中,在干燥载体(例如磨碎的谷粒)上将酶稀释为液体。本发明的蛋白酶可用作动 物饲料和/或添加剂的组分(参见例如,美国专利号5,612,055,5, 314,692和5,147,642, 均引入本文作为参考)。本发明的酶饲料添加剂适于以多种方法制备。例如,在一些实施方案中,通过混合 具有适当活性的不同酶以产生酶混合物,来简单地制备。在一些实施方案中,该酶混合物直 接与饲料混合,而在其他实施方案中,将其浸渍到基于谷物的载体材料(如,磨碎的小麦、 玉米或大豆粉)上。本发明还涵盖了这些经过浸渍的载体,因为它们可用作酶饲料添加剂。在一些替代性实施方案中,用具有适当活性的酶同时或依次浸渍基于谷物的载体 (例如,磨碎的小麦或玉米)。例如,在一些实施方案中,磨碎的小麦载体先用木聚糖酶喷 雾,然后用蛋白酶,任选的用葡聚糖酶喷雾。本发明还涵盖了这些经过浸渍的载体,因为它们可用作酶饲料添加剂。在一些实施方案中,这些经过浸渍的载体包含至少一种本发 明的蛋白酶。在一些实施方案中,本发明的饲料添加剂与动物饲料直接混合,而在替代性实施 方案中,其与一种或多种其他饲料添加剂混合,例如维生素饲料添加剂、矿物质饲料添加剂 和/或氨基酸饲料添加剂。然后,将所获得的包含几种不同类型组分的饲料添加剂以适当 的量与饲料混合。在一些实施方案中,本发明的饲料添加剂,包含基于谷物的载体,通常以约0.01 至约50g/kg饲料的量进行混合(例如,约0. 1至约10g/kg,或约lg/kg)。在替代性的实施方案中,本发明的酶饲料添加剂涉及构建以期望的相对量产生期 望的一种或多种酶的重组微生物。在一些实施方案中,通过提高编码至少一种本发明蛋白 酶的基因的拷贝数,和/或通过使用与编码一种或多种蛋白酶的多核苷酸有效连接的适当 的强启动子来实现。在其他实施方案中,根据需要,重组微生物菌株缺失了一些酶活性(例 如,纤维素酶、内切葡聚糖酶等)。在其他实施方案中,本发明提供的酶饲料添加剂还包含其他酶,包含但不限于至 少一 种木聚糖酶、α-淀粉酶、葡糖淀粉酶、果胶酶、甘露聚糖酶、α-半乳糖苷酶、肌醇六磷 酸酶和/或脂肪酶。在一些实施方案中,在浸渍到基于谷物的载体上之前,混合具有期望活 性的酶与木聚糖酶和蛋白酶,或者可选的,将此类酶同时或依次浸渍到此类基于谷物的载 体上。然后,将载体与基于谷物的饲料混合,制备最终的饲料。在替代性实施方案中,将酶 饲料添加剂配制成单个酶活性的溶液,然后,与预制为丸状或糊状物的饲料材料混合。在其他实施方案中,通过掺入到第二种(即,不同的)饲料中或动物的饮用水中, 使动物饮食中包含酶饲料添加剂。因此,本发明提供的酶混合物不必须掺入基于谷物的 饲料本身,虽然此类掺入形成了本发明的特定实施方案。在一些实施方案中,木聚糖酶活 性单位/g饲料添加剂与蛋白酶活性单位/g饲料添加剂的比值是约1 0.001-1,000,约 1 0.01-100,或约1 0. 1-10。如上所述,本发明提供的酶混合物可在基于谷物的饲料的 制备中用作饲料添加剂。在一些实施方案中,基于谷物的饲料包含至少25wt%,或更多的至少35wt%的小 麦或玉米,或者这两种谷物的组合。饲料还包含这样的量的蛋白酶(即,至少一种本发明的 蛋白酶),所述蛋白酶的量使包含蛋白酶的饲料中包含约100至约100,000蛋白酶活性单位 /kg饲料的量。本发明提供的基于谷物的饲料可作为用于多种非人动物的饲料,所述动物包含家 禽(例如,火鸡、鹅、鸭、鸡等)、家畜(例如,猪、绵羊、牛、山羊等)和伴侣动物(例如,马、 狗、猫、兔、小鼠等)。饲料特别适用于家禽和猪,特别是肉鸡。本发明还提供用于处理纺织品的组合物,其包含至少一种本发明的蛋白酶。在一 些实施方案中,至少一种本发明的蛋白酶是适用于处理丝或羊毛的组合物中的组分(参见 例如,美国再版专利号216,034、EP 134,267、美国专利号4,533,359和EP 344,259)。此外,本发明的蛋白酶可用于期望从肌醇六磷酸盐中分离磷的多种应用。因此, 本发明还提供产生具有改良性质的羊毛或动物毛材料的方法。在一些实施方案中,这些 方法包括以下步骤预处理羊毛、羊毛纤维或动物毛材料,预处理的方法选自等离子体 (plasma)处理工艺和Delhev工艺;以及将预处理过的羊毛或动物毛材料进行蛋白水解酶(例如至少一种本发明的蛋白酶)处理,所述酶的量可以有效改善性质。在一些实施方案 中,在等离子体处理之前进行蛋白水解酶处理,而在其他实施方案中,其在等离子体处理之 后进行。在其他实施方案中,其作为单独的步骤进行,而在其他实施方案中,其与羊毛或动 物毛材料的擦洗或染色组合进行。在其他实施方案中,在酶处理步骤中存在至少一种表面 活性剂和/或至少一种软化剂,而在其他实施方案中,在单独步骤中掺入一种或多种表面 活性剂和/或一种或多种软化剂,在所述步骤中对羊毛或动物毛材料进行软化处理。在一些实施方案中,本发明的组合物可用于防缩水羊毛纤维的方法(参见例如,JP 4-327274)。在一些实施方案中,组合物用于羊毛纤维防缩水处理的方法,通过将纤维进 行低温等离子体处理,然后,用防缩水树脂(例如,嵌段氨基甲酸乙酯树脂、聚酰胺环氧氯 丙烷树脂、乙醛酸树脂、亚乙基脲树脂或丙烯酸树脂)处理,然后,用减轻重量的蛋白水解 酶处理以获得软化效果。在一些实施方案中,等离子体处理步骤是低温处理(例如,电晕放 电处理)或辉光放电处理。在一些实施方案中,使用气体进行低温等离子体处理(例如,选自空气、氧、氮、 氨、氦或氩的气体)。通常使用空气,但在一些实施方案中,也可以使用其他气体。可以在约0. 1托至5托的压力下进行约2秒至约300秒的低温等离子体处理(例 如,约5秒至约100秒,或约5秒至约30秒)。如上所述,本发明可与诸如Delhey工艺方法组合使用(参见例如, DE-A-4332692)。在该工艺中,在存在可溶性钨酸盐的条件下,在过氧化氢水溶液中处理羊 毛,其后任选地在合成聚合物的溶液或分散体中处理,以改善羊毛的抗缩绒性质。在该方法 中,在存在约2至约60% (w/w)(例如,约8至约20% (w/w))催化剂(例如,Na2WO4),和存 在非离子型湿润剂的条件下,在过氧化氢(约0. 1-约35% (w/w),例如,约2-约10% (w/ w))的水溶液中处理羊毛。可以在pH 8-11和室温下进行处理。处理时间取决于过氧化氢 和催化剂的浓度,但可以是约2分钟或更短。在氧化处理后,用水漂洗羊毛。为了除去残余 的过氧化氢,并任选地进行额外的漂白,在还原剂(例如,亚硫酸盐、亚磷酸盐等)的酸性溶 液中进一步处理羊毛。在一些实施方案中,酶处理步骤进行约1分钟至约120分钟。在一些实施方案中, 该步骤在约20°C至约60°C (例如,约30°C至约50°C )的温度下进行。可选的,用酶的水溶 液浸泡或填充羊毛,然后在常规温度和压力下汽蒸定型,一般处理约30秒至约3分钟。在 一些实施方案中,在酸性或中性或碱性基质中进行蛋白水解酶处理,在一些实施方案中,所 述基质包含缓冲剂。在替代性的实施方案中,在存在一种或多种常规阴离子型、非离子型(例如, Dobanol ;Henkel AG)或阳离子型表面活性剂的条件下,进行酶处理步骤。有效的非离子型 表面活性剂的实例是Dobanol (Henkel AG)。在其他实施方案中,将羊毛或动物毛材料进行 超声处理,其在蛋白水解酶处理前进行或与其同时进行。在一些实施方案中,在约50 V的温 度下进行约5分钟的超声处理。在一些实施方案中,基于羊毛或动物毛材料的重量,酶处理 步骤中使用的蛋白水解酶的量在约至约之间。在一些实施方案中,为了 减少处理步骤数,在羊毛或动物毛材料的染色和/或擦洗过程中进行酶处理,简单地通过 将蛋白酶加入染色、漂洗和/或擦洗液体中来进行酶处理。在一些实施方案中,在等离子体 处理后进行酶处理,但在其他实施方案中,以相反顺序进行这两个处理步骤。
常规用于羊毛的软化剂通常是阳离子型软化剂,是有机阳离子型软化剂或基于硅 氧烷的产品,但阴离子或非离子型软化剂也是有效的。有效的软化剂的实例包含但不限于 聚乙烯软化剂和硅氧烷软化剂(即,聚二甲基硅氧烷(硅油))、H-聚硅氧烷、硅氧烷高弹 体、氨基功能的聚二甲基硅氧烷、氨基功能的硅氧烷高弹体,以及环氧功能的聚二甲基硅氧 烷,和有机阳离子型软化剂(例如烷基季铵盐衍生物)。在其他实施方案中,本发明提供用于处理动物生皮的组合物,其包含至少一种本 发明的蛋白酶。在一些实施方案中,本发明的蛋白酶可用于处理动物生皮的组合物,如WO 03/00865 (Insect Biotech Co.,Taejeon-Si, Korea)中所述。在其他实施方案中,本发明 提供用于将生皮和/或皮加工成皮革的方法,其包括用本发明的蛋白酶对所述生皮或皮进 行酶处理(参见例如,WO 96/11285)。在其他实施方案中,本发明提供用于将动物皮或生皮 处理成皮革的组合物,所述组合物包含至少一种本发明的蛋白酶。通常在制革厂中以腌制过或干燥的生皮或皮的形式获得生皮和皮。将生皮或皮加 工成皮革的方法包括若干不同的加工步骤,包括浸泡、脱毛和软化的步骤。这些步骤构成了 湿加工,在浸灰间中进行。在涉及皮革加工的方法期间的任何时段,都可使用利用了本发明 蛋白酶的酶处理。然而,通常在湿加工的过程中(即,在浸泡、脱毛和/或软化的过程中) 使用蛋白酶。因此,在一些实施方案中,在湿加 工阶段期间进行使用了至少一种本发明蛋白 酶的酶处理。在一些实施方案中,在常规浸泡条件下(例如,pH范围是约pH 6. 0-约11)实施 本发明的浸泡工艺。在一些实施方案中,范围是约PH7.0-约10.0。在替代性实施方案中, 温度范围是约20-30°C,而在其他实施方案中,范围是约24-28°C。在其他实施方案中,反应 时间的范围是约2-24小时(例如,范围是约4-16小时)。在其他实施方案中,根据需要提 供表面活性剂和/或防腐剂。软化步骤的第二阶段通常始于软化剂的加入。在一些实施方案中,在软化过程中 进行酶处理。在一些实施方案中,在软化过程中,在脱灰阶段之后进行酶处理。在一些实施 方案中,使用常规条件(例如,PH范围是约pH 6.0-9.0)实施本发明的软化工艺。在一些实 施方案中,PH范围是约6. 0-8. 5。在其他实施方案中,温度范围是约20-30 °C,而在其他实施 方案中,温度范围是约25-28°C。在一些实施方案中,反应时间范围是约20-90分钟,而在其 他实施方案中,范围是约40-80分钟。用于产生皮革的工艺是本领域技术人员熟知的(参 见例如,WO 94/069429, WO 90/1121189、美国专利号 3,840,433、EP 505920,GB 2233665 和 美国专利号3,986,926,均通过引用整合到本文)。在其他实施方案中,本发明提供了包含至少一种本发明蛋白酶的软化剂。软化剂 是一种试剂或含酶制剂,其包含在浸灰间工艺(特别是在皮革产生的软化工艺中使用)中 使用的化学活性成分。在一些实施方案中,本发明提供了包含蛋白酶和适当赋形剂的软化 齐U。在一些实施方案中,试剂包含但不限于本领域已知的和已使用的化学品(例如,稀释 剂、软化剂、脱灰剂和载体)。在一些实施方案中,根据本领域已知的制备包含至少一种本发 明蛋白酶的软化剂(参见例如,GB-A2250289、W096/11285和EP0784703)。在一些实施方案中,本发明的软化剂含有约0. 00005至约0. Olg活性蛋白酶/g软 化剂,而在其他实施方案中,软化剂含有约0. 0002至约0. 004g活性蛋白酶/g软化剂。因此,本发明的蛋白酶可用于多种应用和情况中。
具体实施例方式以下的实施例更详细地描述了本发明,但其并非意在以任何方式限制本发明的范 围。附图应认为是本发明说明书和描述的完整部分。本文引用的所有参考文献均特别并入 本文作为参考。提供以下实施例以用于说明而非限制本发明。在下文公开的实验内容中使用以下缩写PI(蛋白酶抑制剂);ppm(百万分之 一);M(摩尔/升);mM(毫摩尔/升);μΜ(微摩尔/升);ηΜ(纳摩尔/升);mol (摩 尔);mmol (毫摩尔);μ mol (微摩尔);nmol (纳摩尔);gm(克);mg(毫克);yg(微 克);Pg(皮克);L(升);ml和mL(微升);μ 和1^(微升);cm(厘米);mm(毫米); ym(微米);nm(纳米);U(单位);V(伏特);丽(分子量);sec(秒);min(分钟);h 和hr (小时);V (摄氏度);QS(有效量);ND(未进行);NA(不适用);rpm(每分钟转 数);H20(水);dH20(去离子水);HCI (盐酸);aa(氨基酸);bp(碱基对);kb(千碱基 对);kD (千道尔顿);cDNA(拷贝或互补DNA) ;DNA(脱氧核糖核酸);ssDNA(单链DNA); dsDNA(双链DNA) ;dNTP(脱氧核糖核苷酸三磷酸);RNA(核糖核酸);MgCl2 (氯化镁); NaCl (氯化钠);w/v (重量/体积);ν/ν (体积/体积);g (重力);OD (光密度);Dulbecco 磷酸缓冲液(DPBS) ;S0C(2%细菌用胰蛋白胨、0.5%细菌用酵母提取物、IOmM NaCl, 2. 5mM KCl) ;Terrific 培养液(TB;12g/l 细菌用胰蛋白胨、24g/l 甘油、2. 31g/l KH2PO4 和 12. 54g/l K2HPO4) ;OD28tl (280nm 处的光密度) ;OD6tltl (600nm 处的光密度);A405 (405nm ^h 的吸光度);Vmax(酶催化反应的最高起始速率);PAGE(聚丙烯酰胺凝胶电泳);PBS(磷 酸缓冲盐水[150mM NaClUOmM 磷酸钠缓冲液,pH 7.21]) ;PBST(PBS+0. 25%TWEEN 20) ;PEG(聚乙二醇);PCR(聚合酶链式反应);RT-PCR(逆转录PCR) ;SDS(十二烷基硫 酸钠);Tris (三(羟甲基)氨基甲烷);HEPES(N-[2-羟乙基]哌嗪-N_[2_乙磺酸]); HBS(HEPES缓冲盐水);SDS (十二烷基硫酸钠);Tris-HCI (三[羟甲基]氨基甲烷-盐酸 盐);Tricine(N-[三-(羟甲基)-甲基]-甘氨酸);CHES(2-(N-环己基氨基)乙磺酸); TAPS(3-{[三-(羟甲基)-甲基]-氨基}_丙磺酸);CAPS(3-(环己基氨基)-丙磺酸; DMSO (二甲亚砜);DTT(1,4-二硫代-DL-苏糖醇);SA (芥子酸(s,5-二甲氧基-4-羟基 肉桂酸));TCA(三氯乙酸);Glut和GSH(还原型谷胱甘肽);GSSG(氧化型谷胱甘肽); TCEP(三[2-羧乙基]膦);Ci(居里);mCi(毫居里);μ Ci (微居里);HPLC(高压液相层 析);RP-HPLC(反向高压液相层析);TLC(薄层层析);MALDI-T0F(基质辅助的激光解吸/ 电离飞行时间);Ts (甲苯磺酰基);Bn (苄基);Ph (苯基);Ms (甲磺酰基);Et (乙基), Me (甲基);Taq (栖热水生菌(Thermus aquaticus) DNA 聚合酶);Klenow (DNA 聚合酶 I 大 (Klenow)片段);rpm (每分钟转数);EGTA (乙二醇-双(β-氨基乙醚)N,N,N,,N,-四 乙酸);EDTA(乙二胺四乙酸);bla( β-内酰胺酶或氨苄青霉素抗性基因);HDL(高密度 液体);MJ Research (MJ Research,Reno,NV) ;Infors (InforsAG,Bottmingen-Basel,瑞 士);Baseclear (Baseclear BV, Inc. ,Leiden, the Netherlands) ;PerSeptive (PerSeptive Biosystems, Framingham, MA) ;ThermoFinnigan(ThermoFinnigan,San Jose, CA) ;Argo(Argo Bio Analytica,Morris Plains,NJ) ;Seitz EKS (SeitzSchenk Filtersystems GmbH,Bad Kreuznach, 德 国);Pall (Pall Corp.,East Hills, NY) ;Spectrum (Spectrum Laboratories, Dominguez Rancho, CA) ;MolecularStructure (Molecular Structure Corp.,Woodlands, TX) ;Accelrys(Accelrys, Inc., San Diego, CA) ;ChemicalComputing(Chemical Computing Corp.,Montreal,力口拿大); NewBrunswick (New Brunswick Scientific,Co.,Edison,NJ) ;CFT (Center forTest Materials,Vlaardingeng,the Netherlands) ;Procter & Gamble(Procter & Gamble, Inc.,Cincinnati,OH) ;GE Healthcare (GE Healthcare,Chalfont St.Giles, United Kingdom) ;DNA2. O(DNA2. O, Menlo Park, CA) ;OXOID (Oxoid, Basingstoke, Hampshire, UK) ;Megazyme(Megazymelnternational Ireland Ltd. , Bray Business Park, Bray, Co.,Wicklow,爱尔兰);Finnzymes(Finnzymes Oy, Espoo,芬兰);Kelco (CP Kelco, Wilmington, DE) ;Corning(Corning Life Sciences,Corning,NY) ; (NEN(NEN Life Science Products, Boston, MA) ;Pharma AS (Pharma AS,Oslo,挪威);Dynal (Dynal, Oslo, 挪威);Bio-Synthesis (Bio-Synthesis, Lewisville, TX) ;ATCC (American Type Culture Collection, Rockville, MD) ;Gibco/BRL (Gibco/BRL,Grand Island,NY) ;Sigma (Sigma Chemical Co.,St.Louis, MO) ;Pharmacia (Pharmacia Biotech,Piscataway, NJ); NCBI(National Center for Biotechnology Information) ;Applied Biosystems(Applied Biosystems, Foster City, CA) ;BD Biosciences 禾口 / 或 Clontech(BDBiosciences CLONTECH Laboratories, Palo Alto, CA) ;OperonTechnologies(Operon Technologies, Inc. , Alameda, CA) ;MWG Biotech(MWG Biotech, High Point, NC) ;Oligos Etc(01igos Etc. Inc,Wilsonville, OR) ;Bachem(Bachem Bioscience,Inc.,King of Prussia, PA) ;Difco (DifcoLaboratories,Detroit,MI) ;Mediatech(Mediatech,Herndon,VA ; SantaCruz(Santa Cruz Biotechnology, Inc. , Santa Cruz, CA) ;Oxoid(Oxoid Inc., Ogdensburg,NY) ;Worthington (Worthington Biochemical Corp.,Freehold,NJ) ;GIBCO BRL 或 Gibco BRL(Life Technologies, Inc. , Gaithersburg, MD) ;Millipore(Millipore, Billerica,MA) ;Bio-Rad(Bio-Rad,Hercules,CA) ;Invitrogen (Invitrogen Corp., San Diego, CA) ;NEB(New England Biolabs, Beverly, MA) ;Sigma(Sigma Chemical Co., St.Louis, MO) ;Pierce (Pierce Biotechnology, Rockford,IL) ;Takara(TakaraBio Inc. Otsu,日本);Roche (Hoffmann-La Roche,Basel,瑞士);EMScience (EM Science, Gibbstown, NJ) ;Qiagen (Qiagen,Inc.,Valencia, CA) ;Biodesign(Biodesign Intl., Saco, 緬 因 州);Aptagen (Aptagen,Inc.,Herndon, VA) ;Sorvall (Sorvan brand, from Kendro Laboratory Products, Asheville, NC) ;Molecular Devices(Molecular Devices, Corp.,Sunnyvale, CA) ;R&D Systems (R&D Systems, Minneapolis,MN); Stratagene (Stratagene Cloning Systems, La Jolla,CA) ;Marsh(Marsh Biosciences, Rochester,NY) ;Bio-Tek(Bio-Tek Instruments,Winooski, VT) ;(Biacore (Biacore, Inc. ,Piscataway, NJ) ;PeproTech(PeproTech,Rocky Hill, NJ) ;SynPep(SynPep,Dublin, CA) ;New Objective(New Objective brand ;Scientific Instrument Services, Inc., Ringoes,NJ) ;Waters (Waters, Inc.,Milford,MA) ;Matrix Science (Matrix Science, Boston, MA) ;Dionex(Dionex, Corp. ,Sunnyvale,CA) ;Monsanto(Monsanto Co.,St.Louis, MO) ;Wintershall (Wintershall AG,Kassel,德国);BASF(BASF Co.,FlorhamPark, NJ); Huntsman (Huntsman Petrochemical Corp.,Salt Lake City, UT) ;Enichem (Enichem Iberica,Barcelona,西班牙);Fluka Chemie AG (FIuka Chemie AG,Buchs,瑞士);Gist-Brocades (Gist-Brocades, NV, Delft,荷兰);Dow Corning (Dow Corning Corp., Midland, MI) ;ServiceXS (Service XS,荷兰)禾口 Microsoft (Microsoft, Inc. , Redmond, WA)。 在下文一些实施例中,提供了多种洗涤剂配方。下表提供了这些洗涤剂中使用的 一些组分的定义。洗涤剂定义
LAS直链cn_13烷基苯磺酸钠
TAS动物脂烷基硫酸钠
CxyASclx-cly烷基硫酸钠
CxyEz与平均z摩尔的环氧乙烷缩合的以clx-cly为主的直链伯醇
CxyAEzS与平均z摩尔的环氧乙烷缩合的clx-cly烷基硫酸钠。实施
例中指出了附加的分子
Nonionic混合的乙氧基化/丙氧基化脂肪醇(例如Plurafac LF404),其
为醇类,具有平均乙氧基化程度为3. 8,且平均丙氧基化程度为
4. 5.
QASR2. N+ (CH3)2 (C2H40H),其中 R2 = C12-C14
Silicate无定形硅酸钠(Si02 Na20比值=1. 6-3. 2 1)
Metasilicate硅醛钠(Si02 Na20 比值=1. 0)
Zeolite A式 Na12 (A102Si02) 12. 27H20 的水合硅酸铝
SKS-6式5 -Na2Si205的硅酸盐层状结晶
Sulfate无水硫酸钠
STPP三磷酸钠
MA/AA4 1丙烯酸/马来酸的随机共聚体,平均分子量为约
70,000-80,000
AA聚丙烯酸钠聚合物,平均分子量为4,500
Polycarboxylate包含MW范围在2,000-80,000的羧酸化单体(例如,丙烯酸、
mh马来酸和甲基丙烯酸)混合物的共聚体,例如可从BASF商则
的Sokolan,其为丙烯酸的共聚物,MW4, 500
BB13-(3,4-二氢异喹啉鐺)丙烷磺酸盐
BB21-(3,4- 二氢异喹啉鐺)-癸烷-2-硫酸盐
PB1单水合过硼酸钠
PB4标准通式NaB03. 4H20的四水合过硼酸钠
过碳酸盐标准通式2Na2C03. 3H202的过碳酸钠
TAED四酰乙二胺
NOBS钠盐形式的壬酰基氧基苯磺酸盐
DTPA二乙三胺五乙酸
HEDP1,1_羟基亚乙基二膦酸
DETPMPMonsanto以商标名Dequest 2060销售的二乙基三胺五(亚甲基)
EDDS
二胺5-戊二胺;
DETBCHD氯化物,
PAAC
石蜡
石蜡烃磺酸盐
醛糖氧化酶
半乳糖氧化酶
蛋白酶
中,
淀粉酶
Fungamyl 禾口 Duramyl
脂肪酶
纤维素酶
果胶裂合酶
PVP
PVN0
PVPVI
增白剂1
硅树脂消泡剂
消泡剂
膦酸盐钠盐形式的乙二胺-N,N' - 二琥珀酸(S,S)异构体 二甲基氨丙基胺;1,6_己二胺;1,3_丙二胺;2-甲基-1,
1,3-戊二胺;1-甲基-二氨基丙烷 5,12-二乙基-1,5,8,12_四氮杂双环[6,6,2]鲸蜡烷,二
Mn(II)盐 五胺乙酸钴(III)盐
ffintershall以商标名Winog 70出售的石蜡油
-些氢原子被磺酸基替换了的石蜡油或蜡 Novozymes A/S以商标名Aldose Oxidase出售的氧化酶 来自Sigma的半乳糖氧化酶 :Novo Nordisk A/S 以商标名 Savinas、Alcalase、Everlase 出售 的蛋白酶解酶,以及下列来自Genencor International, Inc的 “蛋白酶A”,描述在US RE 34,606的图1A、IB和7中,以 及11栏11-37行中;“蛋白酶B”,描述在US5,955,340和 US5, 700,676的图1A、1B和5中,以及表1中;“蛋白酶C”, 描述在 US6, 312,936 和 US 6,482,628 的图 1-3 [SEQ ID NO 3]
和25栏12行中;“蛋白酶D”是W0 99/20723中描述的变体 101G/103A/104I/159D/232V/236H/245R/248D/252K(BPN,编 号)
:Genencor以商标名Purafect Ox Am出售的淀粉分解酶,描
述在 TO 94/18314、W096/05295 中;Natalase 、Termamyl 、 丨,均可购自Novozymes A/S
:Novozymes A/S 以商标名 Lipolase Lipolase Ultra 出售的禾口
Gist-Brocades以商标名Lipomax出售的脂肪水解酶 :Novozymes A/S 以商标名 Carezyme、Celluzyme 禾口 / 或 Endolase
出售的溶细胞酶(Cellulytic enzyme) 可购自 Novozymes A/S 的Pectaway 禾口pectawash 聚乙烯吡咯烷酮,平均分子量为60,000 聚乙烯吡啶-N-氧化物,平均分子量为50,000. 乙烯基咪唑和乙烯吡咯烷酮的共聚物,平均分子量为20,000. 4,4' -二(2-磺酸基苯乙烯基)-联苯二钠 聚二甲基硅氧烷泡沫控制剂,具有硅氧烷-氧化烯共聚物作为分 散剂,所述泡沫控制剂与所述分散剂的比例为10 1至100 1 在颗粒形式中含12%硅氧烷/ 二氧化硅,18%硬脂醇,70%淀粉
srp 1阴离子封端的聚酯
peg x聚乙二醇,具有分子量X PVPK60 乙烯吡咯烷酮均聚物(平均 mw 160,000) __ -jr^-Jeffamine ED-2001 来自 Huntsman 的封端聚乙~■日于
Isachem AS来自Enichem的支链醇烷基磺酸酯
mme peg (2000)来自Fluka Chemie AG的单甲基醚聚乙二醇(MW 2000)
DC3225C硅氧烷消泡剂,硅油和二氧化硅的混合物,来自Dow Corning
TEPAE四亚乙基五胺乙氧基化物
BTA苯并三唑.
甜菜碱(ch3) 3n+ch2coct
糖工业级D-葡萄糖或食品级糖
CFAAC12-C14烷基N-甲基葡糖胺
TPKFAC12-C14 去头全切割脂肪酸(topped whole cut fatty acids)
粘土水合的硅酸铝,通式为Al203Si02 xH20。类型高岭土、蒙脱
土、凹凸棒土、伊利石、斑脱土、埃洛石
pH以在水中稀释的溶液在20°C测量
实施例1
微生物菌株的分离和培养
在该实施例中,描述了链霉菌1AG3的分离和培养。所使用的分离培养基是具有利
福平选择压力的碱性土壤提取琼脂。如下制备土壤提取培养基土壤提取培养基的制备溶液A 将1kg花园土悬浮在1升水中,在120°C高压灭菌20分钟。冷却至室温,将悬浮液 倾倒在玻璃纤维滤器上,获得澄清的滤液。用200ml和100ml软化水洗涤土壤滞留物两遍。 添加足量的水至体积为1升。溶液B NaCl 80g/LNa2C03 20g/L混合并在120°C灭菌20分钟。利福平储液将50mg/ml利福平(Sigma R3501)溶解在DMS0中,通过20 y m膜过滤灭菌。首先,将20g琼脂添加到500ml溶液A中,在120°C灭菌溶液20分钟。然后,将 500ml溶液A与500ml溶液B混合,并冷却至60°C。然后,添加利福平,产生终浓度为50 u g/ ml。然后,将琼脂混合物倾倒到Petri平板中,并储存在4°C封闭的聚乙烯袋中,直到接种生 物。将湖水沉积物和水与溶液B按1 1的比例混合,并充分振荡。在沉淀后,将系列 稀释的上清倒在土壤提取琼脂上,PH 10且含有利福平。将平板置于30°C下,在装有湿纸 巾的紧闭塑料盒中孵育数周,从而维持湿度并防止蒸发。通过立体显微镜周期性检查平板。 挑取在这些检查中观察到的丝状克隆,并接种在新鲜培养基上。
实施例2通过16S rRNA测序鉴别1AG3菌株在该实施例中,描述了通过16S rRNA测序鉴别链霉菌菌株1AG3所进行的实验。如 下所述,通过PCR获得含有16S rRNA基因的前500个碱基对的染色体DNA片段。确定片段 的核苷酸序列。合成和测序使用相同的引物。引物33385,_G(A/T)A TTA CCG CGG C (G/T) G CTG-3,(SEQ ID NO 22)35725,-AGA GTT TGA TCC TGG CTC AG-3,(SEQ ID NO 21)PCR 方案反应混合物含有 10iiL Pwo 缓冲液(Boehringer Mannheim)、80. 5 ii L 去离子 水、2 ii L dNTP (各 lOmM)、1 P L 的各种引物(10 y g/ y L)、0. 5 y L Pwo 聚合酶(5U/ u L) (Boehringer Mannheim),置于 500 u 1 Eppendorf 管中。PCR的条件是在95°C,45秒,然后在55 °C,45秒,然后在72°C,2分钟进行25个 循环。通过琼脂糖凝胶电泳,然后利用产生商的试剂盒说明书,使用QIAquick Gel Extraction Kit (Qiagen)从凝胶中切出并分离,纯化PCR片段。本文鉴别的链霉菌菌株 1AG3的部分16S rRNA基因具有下列序列1 GATCCTGGCT CAGGACGAAC GCTGGCGGCG TGCTTAACAC ATGCAAGTCG51 AACGATGAAG CCGCTTCGGT GGTGGATTAG TGGCGAACGG GTGAGTAACA101 CGTGGGCAAT CTGCCCTGCA CTCTGGGACA AGCCCGGGAA ACTGGGTCTA151 ATACCGGATA TGACTGCTTC GGGCATCCGA GGTGGTGGAA AGCTCCGGCG201 GTGCAGGATG GGCCCGCGGC CTATCAGCTT GTTGGTGGGG TGATGGCCTA251 CCAAGGCGAC GACGGGTAGC CGGCCTGAGA GGGCGACCGG CCACACTGGG301 ACTGAGACAC GGCCCAGACT CCTACGGGAG GCAGCAGTGG GGAATATTGC351 ACAATGGGCG CAAGCCTGAT GCAGCGACGC CGCGTGAGGG ATGACGGCCT401 TCGGGTTGTA AACCTCTTTC AGCAGGGAAG AAGC (SEQ ID NO 12)GenBank的Blastn检索揭示,与菌株1AG3最接近的物种是索马里链霉菌,在 434bp的重叠区具有97%同一性,提示菌株1AG3最可能是链霉菌属物种。实施例3鉴别存在于嗜碱性链霉菌(alkaliphilic Streptomyces)菌株1AG3中的新蛋白 酶的部分基因序列在该实施例中,描述了用于鉴别链霉菌1AG3蛋白酶基因序列的部分序列的方法 和组合物。使用简并引物Str印tomycProt_FW和Str印tomycProt_RV,在天然分离的链霉 菌1AG3的染色体DNA上实施PCR。PCR获得的DNA片段编码新蛋白酶,与称为“链霉菌蛋白 酶”的蛋白质相似。PCR方法使用下列简并的引物对Str印tomycProt_FW 5,-CGCTGYTCWTSGGCTTC-3,(SEQ ID NO 13)StreptomycProt_RV 5,-GCAGTYGCCNNNGCCGCCGGASGT-3,(SEQ ID NO 14)在热循环仪上实施PCR,根据产生商的说明(退火温度为50摄氏度),使用高 保真 Platinum Taq 聚合酶(Invitrogen)。如 Kieser 等人(Kieser 等人,PracticalStreptomyces Genetics,The John Innes Foundation, Norwich,United Kingdom[2000]) 所述,分离链霉菌菌株1AG3的基因组DNA,在PCR中作为模板DNA使用。PCR获得的PCR片 段长约400bp,DNA测序(ServiceXS)揭示该PCR片段的DNA序列编码了与其他丝氨酸蛋白 酶相似的蛋白质。下文显示了该1AG3蛋白酶的部分核苷酸序列。在该序列中,简并的FW 引物的序列用下划线表示。由于在运行结尾时较低的序列信息质量(如N的数量所示),未 发现RV引物(通过N的数字表示)。1 CGCTGTTCGC TGGGCTTCCC CGTTCGCCGC GGAACTCAGG CGGGCTTCGC GACCGCGGGT61 CACTGCGGCC GGGTCGGCAC CACCACACGG GGCTTCAACC AGGTGGCGCA GGGCACCTTC121 CAGGGCTCCA TCTTCCCCGG GCGCGACATG GGCTGGGTCG CGGTCAACTC CAACTGGAAC181 ACCACCCCCT TCGTCCGCGG CCAGGGGGGC GCGAACGTGA CGGTGGCGGG TTCGCAGCAG241 GCTCCGGTCG GCTCCTCGGT GTGCCGTTCC GGCTCCACCA CCGGCTGGCA CTGCGGCACC301 ATCCAGCAGC ACAACACCTC GGTGCGCTAT CCGGAGGGCC ACCATCAGCG GAGTGACCAC361 GACCTCGGTG TGCGCCGAAC CNTAGTGACT CCGGCGGCGC CTACATCTTT GGGAACCACN421 GCCCAGGGGC GTNTANGTCC CNTCCACCNA AGGCCANNTG CCA(SEQ ID NO 15)下列序列是1AG3蛋白酶的部分(翻译的)氨基酸序列RCSLGFPVRR GTQAGFATAG HCGRVGTTTR GFNQVAQGTF QGSIFPGRDMGWVAVNSNWN TTPFVRGQGG ANVTVAGSQQ APVGSSVCRS GSTTGWHCGTIQQHNTSVRY PEG(SEQ ID NO 16)Blastn检索揭示,来自天蓝色链霉菌(Str印tomyces coelicolor)的蛋白质链霉 菌蛋白酶C与来自多个链霉菌属物种和其他微生物体的其他链霉菌蛋白酶和丝氨酸蛋白 酶之间的相似性。实施例4对1AG3蛋白酶的完整基因和蛋白质序列的说明在该实施例中,描述了用于说明完整的1AG3蛋白酶基因和蛋白质序列所进行的 实验。在这些实验中,在新链霉菌菌株1AG3的染色体DNA上实施反向PCR实验,从嗜碱性 链霉菌菌株1AG3中分离并克隆全长的1AG3蛋白酶基因。基于实施例3描述的链霉菌菌株 1AG3蛋白酶基因的约400bp片段的DNA序列,设计新的DNA弓丨物lAG3prot_RV 5,-GCGAAGCCCGCCTGAGTTCCGCGGCGAACG-3,(SEQ ID NO 18)lAG3prot_Fff 5,-GTGCCGTTCCGCCTCCACCACCGGCTGGCAC-3,(SEQ ID NO 17)用限制性酶六 &1、83111111、8881111、恥111、恥1~1、叱01、他61、卩¥111、5&11或 Sstll 消 化嗜碱性链霉菌菌株1AG3的染色体DNA,根据产生商的说明,使用Qiagen PCR纯化试剂盒 (Qiagen,货号28106)纯化,并用T4DNA连接酶(Invitrogen)自身连接。使用Qiagen PCR 纯化试剂盒(Qiagen)纯化连接混合物,并用引物lAG3prot_RV和lAG3prot_FW对用Ncol、 Narl.BssHII或Sail消化的DNA片段实施PCR,然后自身连接,获得约0. 6和2. 5kb之间的 PCR产物。根据产生商的说明,在热循环仪上用高保真Platinum Taq聚合酶(Invitrogen) 实施PCR(退火温度为55°C,35个循环)。DNA测序分析(BaseClear,荷兰)揭示,DNA片段 覆盖了来自灰色链霉菌(Str印tomyces griseus)的链霉菌蛋白酶样蛋白酶基因的主体部 分。在相同的PCR产物上,使用引物lAG3-up 1(5,-GTGGTGGCCACGACCAGCTCGGCGGTCTC-3‘ ;SEQ ID NO 27)和 lAG3_up2 (5,-TGGTCCAGGAACCGGCGAAGGTGTC ;SEQ IDNO :28),通过其他序列分析反应(BaseClear)获得完整的 1AG3蛋白酶基因序列。用这些引物进行序列分析,导致鉴别了 1362bp的完整的1AG3蛋白 酶基因序列。下文提供了所述序列。1 GACAGC GAGGAG ACCCCT C ATG CA CCGCAG ACGCGG AGCGCT ATTCGC CGGCGC CGTGGCCTGTCG CTCCTC TGGGGA GTACGT GGCGTC TGCGCC TCGCGA TAAGCG GCCGCG GCACCG61 GATAGC CGCCCT GACGAT CGCCGC CGCGCC
GGCC AC CGCCGG ACCGGC CCTCGC CCCGCCCTATCG GCGGGA CTGCTA GCGGCG GCGCGG
CCGG :TG GCGGCC TGGCCG GGAGCC- GGGCGG
ACCGGC CCAGGA GACGGC^6GCCCA_GGAGAT CCCTGC CGGCAT GCTGCA GGCCAT GCAGCG U TGGCCG GGTCCT CTGCC^CrifcGGGf CCTCTA GGGACG GCCGTA CGACGT CCGGTA CGTCGC
TGATCT CGGCCT CACCGA GCAGCA GGCCGA GGAGCG CGTGGC CAACGA GTACCA AGCGGG 丄8 丄 ACTAGA GCCGGA GTGGCT CGTCGT CCGGCT CCTCGC GCACCG GTTGCT CATGGT TCGCCC
.CCAGCT GGAGCC ACGGCT GCGGGC GCAATT GGCGGA CACCTT CGCCGG TTCCTG GACCAG 丄 GGTCGA CCTCGG TGCCGA CGCCCG CGTTAA CCGCCT GTGGAA. GCGGCC AAGGAC CTGGTC
GGGCGA GACCGC CGAGCT GGTCGT GGCCAC CACCGA CCGCGA GCAGCT ACCGGC GCTGAC 州丄 CCCGCT CTGGCG GCTCGA CCAGCA CCGGTG GTGGCT GGCGCT CGTCGA TGGCCG CGACTG
GGCGGC GGGCGT GCGGGC CACCGT GGCCGA GCACAG CCTGTC CGAGCT CGAGGC CGTGAA 北丄 CCGCCG CCCG.CA __C.G.g_gSg..g!gg_gA—g_gJggg.IL—SSLI巨Ig——GGACAG GCT CGA_GCTCCC- G_CACTT
A91 GGAGAC ACTGGA CGAGGC CGCCGA GGAGCA CGCCAC GACCGA GGCGCC CGTGTG GTACGT 4」丄 CCTCTG TGACCT GCTCCG GCGGCT CCTCGT GCGGTG CTGGCT CCGCGG GCACAC CATGCA
GGATGT CACGAG CAACAC GGTCAT CGTGCA CGCCCA GGACGT GACGGC C6GGCG CGACTT 481 CCTACA GTGCTC GTTGTG CCAGTA GCACGT GCGGgT_ CCTGCA CTGCCG GCCCGC GCTGAA
.CGTCTC GGCCGC GGGCGT GGACCC CGCCGC GGTCCA CGTGCT GCGCTC GGACGA GCAGCC 丄 GCAGAG CCGGCG CCCGCA CCTGGG GCGGCG CCAGGT GCACGA CGCGAG CCTGCT CGTCGG
601 GCGGCC TTACi CA CGACCT GCGGGG TGGGGA GGCGTA CTACAT GGGCAG CGGAGG
CGCCGG AATG GT GCTGGA CGCCCC ACCCCT CCGCAT GATGTA CCCGTC GCCTCC CGCGAC 661 CTCGGT CGGCTT CTCCGT TCGCCG CGGAAC TCAGGC GGGCTT CGCGAC CGCGGG
GAGCCA GCCGAA GAGGCA AGCGGC GCCTTG AGTCCG CCCGAA GCGCTG GCGCCC
721 CGGCCG GGTCGG CACCAC CACACG GGGCTT CAACCA GGTGGC GCAGGG CACCTT
GCCGGC CCAGCC GTGGTG GTGTGC CCCGAA GTTGGT CCACCG CGTCCC GTGGAA
781 CTCCAT CTTCCC CGGGCG CGACAT GGGCTG GGTCGC GGTCAA CTCCAA CTGGAA
GAGGTA GAAGGG GCCCGC GCTGTA CCCGAC CCAGCG CCAGTT GAGGTT GACCTT
841 CCCCTT CGTCCG CGGCCA GGGGGG CGCGAA CGTGAC GGTGGC GGGTTC GCAGCA
54
GCGCTG TCACTG AGTGAC CCAGGG GGTCCC CACCAC GTGGTGGGCTCC
GGGGAAGCAGGCGCCGGTCCCCCCGCGCTTGCACTGCCACCGCCCAAGCGTCGTCCGAGG
901GGTCGGCTCCTCGGTGTGCCGTTCCGGCTCCACCACCGGCTGGCACTGCGGCACCATCCA
CCAGCCGAGGAGCCACACGGCAAGGCCGAGGTGGTGGCCGACCGTGACGCCGTGGTAGGT
961GCAGCACAACACCTCGGTGCGCTATCCGGAGGGCACCATCAGCGGAGTGACCAGGACCTC
CGTCGTGTTGTGGAGCCACGCGATAGGCCTCCCGTGGTAGTCGCCTCACTGGTCCTGGAG
1021GGTGTGCGCCGAACCCGGTGACTCCGGCGGCGCCTACATCTCCGGGAACCAGGCCCAGGG
CCACACGCGGCTTGGGCCACTGAGGCCGCCGCGGATGTAGAGGCCCTTGGTCCGGGTCCC
1081CGTGACCTCCGGCGGCTCGGGCAACTGCCGCACCGGTGGCACCACCTACCACCAGCCGAT
GCACTGGAGGCCGCCGAGCCCGTTGACGGCGTGGCCACCGTGGTGGATGGTGGTCGGCTA
1141CAACCCGCTGCTGGCACAGTGGAACCTGACCCTCGTGACCACGGGCAACGGCGGCGACCC
GTTGGGCGACGACCGTGTCACCTTGGACTGGGAGCACTGGTGCCCGTTGCCGCCGCTGGG
1201GGGCGACCCCGGTGACCCGGGCGACCCGGGTGAGCCCGGCGGCAGCTGGTCCGCCGGGAC
CCCGCTGGGGCCACTGGGCCCGCTGGGCCCACTCGGGCCGCCGTCGACCAGGCGGCCCTG
1261CAGTTACGCGGTCGGCGACCGGGTGACCTACGGCGGCGCGGAGTACCGCTGCCTGCAGGC
GTCAATGCGCCAGCCGCTGGCCCACTGGATGCCGCCGCGCCTCATGGCGACGGACGTCCG
1321CCACGTCGCCCAGTCCGGCTGGACGCCCCCGAACACGCCCGCCCTCTGGCAGCGCGTG tg
GGTGCAGCGGGTCAGGCCGACCTGCGGGGGCTTGTGCGGGCGGGAGACCGTCGC
GCACAC1381 aCACGA CCA (SEQ ID NO 1)TGTGCT GGT在上述序列中,核糖体结合位点用下划线表示,起始和终止密码子以粗体印刷, (预测的)信号序列以斜体表示,(预测的)N-端原序列是双下划线的,而成熟的蛋白酶链序列用波浪线进行下划线。 1 MHRRRGALFA GAVAIAALTI AAAPA TAGPA LAPPPAQETA AQEIPAGMLQ51 AMQRDLGLTE QQAEERVANE YQAGQLEPRL RAQLADTFAG SffTRGETAEL101 VYATTDREQL PALTAAGYRA TVAEHSLSEL EAVKETLDEA AEEHATTEAP151 VffYVDVTSNT VIVHAQDYTA GRDFYSAAGY DPAAVHVLRS DEQPRPYHDL201 RGGEAYYMGS GGRCSVGFSV RRGTQAGFAT AGHCGRVGTT TRGFNQVAQG251 TFQGSIFPGR DMGWVAVNSN WNTTPFVRGQ GGANVTVAGS QQAPVGSSVC301 RSGSTTGWHC GTIQQHNTSV RYPEGTISGV TRTSVCAEPG DSGGAYISGN351 QAQGVTSGGS GNCRTGGTTY HQPINPLLAQ WNLTLVTTGN G⑶PGDP⑶P401 GDPGEPGGSff SAGTSYAVGD RVTYGGAEYR CLQAHVAQSG WTPPNTPALff451 QRV(SEQ ID NO 3)在上述序列中,用双下划线表示信号序列(预测),而用下划线表示原序列(预 测),用粗体显示成熟的链。使用LC-MS方法,如本领域已知地确定1AG3蛋白酶的分子量(MW)。ASP同源物 1AG3的测量MW是21261Da(通过LC-MS,参见下文的色谱和光谱)。该MW与1AG3序列 [49-256]相匹配(计算 MW21250Da)。实施例51AG3蛋白酶基因在变铅青链霉菌中的克隆和表达在该实施例中,描述了 1AG3蛋白酶的克隆和表达。因此,该实施例描述了这样 的质粒,所述质粒包含编码具有蛋白酶解活性的多肽的多核苷酸,以及使用此类载体转化 变铅青链霉菌宿主细胞。本文中使用的转化方法是本领域已知的(参见例如,美国专利号 6,287,839和W0 02/50245,引入本文作为参考)。这些实验中使用的载体(S卩,质粒)包含编码本发明蛋白酶的多核苷酸,其获自嗜 碱性链霉菌菌株1AG3。该质粒用于转化变铅青链霉菌。在本文中,最终的质粒载体被称为 “PSEA4CT-1AG3”。与前述载体相似,pSEA4CT_lAG3的构建使用了 pSEA4CT质粒载体(见上 文)。黑曲霉(“A4”)调控序列与编码链霉菌1AG3蛋白酶(1AG3)的结构基因连接,用于 驱动蛋白酶的表达。通过本领域已知的PCR技术,构建包含链霉菌CelA信号序列、1AG3原 序列和1AG3成熟蛋白酶序列的DNA片段,如Nhel-BamHI片段。用于克隆pSEA4CT中的链 霉菌1AG3蛋白酶(1AG3)的多核苷酸引物是基于SEQ ID NO 1的。正向引物和反向引物显 示如下pSEA4C-lAG3-Fw 5,-GACTGCGCTAGCCGGCCCCCCGGCACAGGCCACCGCCGGACCGGCCCTCGCCCCGCCACCG-3’ (SEQ ID NO 29)pSEA4C-lAG3-Rv 5,-GCTCGCGGATCCCCATTGTCACACGCGCTGCCAGAGGGCGGGCGTGTTC-3,(SEQID NO 30)根据产生商的说明,在热循环仪上用高保真Platinum Taq聚合酶(Invitrogen) 实施PCR(退火温度为55°C,28个循环)。用限制性酶BamHI和Nhel消化获得的PCR片段, 用限制性酶BamHI和Xbal消化pSEA4CT质粒。使用Qiagen PCR纯化试剂盒(Qiagen,货号28106)纯化消化的1AG3PCR和质粒DNA片段。根据产生商的说明,使用T4DNA连接酶试剂 盒(Invitrogen)将1AG3蛋白酶片段克隆到pSEA4CT质粒中,获得质粒pSEA4CT_lAG3的产
生。 利用前述实施例中描述的原生质体方法,用质粒PSEA4CT-1AG3转化宿主变铅青 链霉菌TK23 (即,使用Hopwood等人的方法,见上文)。扩增转化的培养物,来提高三种在TS *培养基中的发酵培养物。TS *培养基的组成 是(g/L)胰蛋白胨(Difco)16,大豆蛋白胨(Difco)4,酪蛋白酶解产物(Merck) 20,K2HP0410, 葡萄糖 15,Basildon 去泡剂 0.6,pH 7.0。孵育条件30°C,250rpm(Infors HT)。在不同 的时间点,移出发酵液的样品供分析。出于该实验的目的,使用脱脂乳方法来验证成功的克 隆。在该测试中,将30 y L的摇瓶上清移至脱脂乳琼脂平板上打的孔中,并在37°C孵育。在孵育过夜后,目测孵育的平板,出现清澈区(环)表示蛋白酶解酶的表达。出 于该实验的目的,还检测了样品的蛋白酶活性和分子量(SDS-PAGE)。在发酵末期,通过 SDS-PAGE观察到全长的蛋白酶。如下检测发酵液的样品收集10 y L的稀释上清,并添加至 190 u L AAPE 底物溶液中(浓度 lmg/ml,0. 1M Tris/0. 005%TWEEN -80,pH 8. 6)。监控由于对硝基苯胺的释放而造成410nm处的吸光度增加的速率(25°C )。下表 (5. 1)显示了 3个克隆的测定结果。 结果清楚地显示,变铅青链霉菌中表达由来自链霉菌属物种1AG3的多核苷酸编 码的、具有蛋白酶解活性的多肽实施例61AG3蛋白酶与其他蛋白酶的关系在该实施例中,描述了用于确定1AG3蛋白酶和其他蛋白酶的关系的方法。在 Swissprot中,对1AG3多肽(SEQ ID NO 3)序列的BLASTP检索揭示,来自灰色链霉菌的 链霉菌蛋白酶C(SGPC) (SEQ ID NO :23)是已知最接近的同源物,具有59. 7%的同一性和 68.0%的相似性,如图2中提供的比对所示。当仅比较成熟的(即,催化结构域)蛋白酶序 列时,如图3所示,1AG3蛋白酶(SEQ ID NO :9)和SGPC(SEQ ID NO :24)的同一性提高到 74. 2%,相似性提高到80. 1%。在该图中,活性位点氨基酸his-asp-ser表示为粗体,而用 连线表示特征性的3个二硫键。1AG3蛋白酶和纤维单胞菌(Cellul0m0naS)69B4(ASP)蛋白酶是直系同源物。然 而,1AG3蛋白酶(SEQ ID NO 3)和ASP蛋白酶(SEQ IDN0 25)的序列比对揭示它们的同一 性低至39.6%,相似性为49.6%,如图4所示。当仅比较蛋白酶的成熟(催化)部分时,则 1AG3蛋白酶(SEQID N0 9)和SGPC(SEQ ID NO 26)的同一性提高到44. 1%,相似性提高到53. 1%,如图5所示。因此,结果表示1AG3与ASP具有高于50%的同源性。此外,应注 意1AG3具有比ASP更大的分子量(约21kD)。此外,确定1AG3具有比ASP低的pi。实施例71AG3蛋白酶在液体洗涤剂中的微样品(microswatch)性能在该实施例中,使用BMI-微样品(Blood,Milk,Int)测试来确定1AG3蛋白酶的洗 涤性能。确定清洁活性iJffil 胃II (Innova 4330 Incubator,New Brunswick Scientific Co.,Edison, NJ,USA)分别在20°C和30°C进行微样品测试。从CFT获得Blood-Milk-Ink样品(EMPA 116),并通过在室温下暴露于0. 3%过氧 化氢中30分钟进行预处理,然后干燥。从干燥的样品中切出6. 5mm直径的圆,垂直地置于 96孔微平板(MTP)中,每孔一个。例如,从实施例5描述的转化培养物中获得蛋白酶样品,在lOmMNaCl,0.005% Tween 80 (聚氧乙烯山梨糖醇酐羧酸酯)[Sigma P-1754]中稀释,获得5_60 y g/ml (蛋白 质)的期望浓度用于测定。洗涤剂溶液在1升去离子水中制备1.6g不含漂白剂和酶的液体洗涤剂,从储液添加钙和镁, 获得最终水硬度值为6格令/加仑(S卩,北美条件)。用4N NaOH将洗涤剂溶液I调节至 pH 6. 0,用5mM Hepes和4N NaOH将洗涤剂溶液II调节至pH 8. 2。测试方法将孵育箱设定为期望温度20°C为低温(洗涤剂溶液II)条件,30°C为低pH(洗 涤剂溶液I)条件。如上所述,将预处理和预切出的微样品置于96孔MTP的每个孔中。向 MTP的每个孔加入190 yl的各洗涤剂溶液,每孔含有一片微样品。然后,向每个孔中加入 10 u 1预稀释的酶溶液,获得终浓度0. 25-3. 0 u g/ml (提供总体积为200 yl/孔)。然后, 封闭MTP,防止渗漏,置于孵育箱/振荡器的支架上,设定为20°C (低温洗涤剂溶液II)或 30 °C (低pH洗涤剂溶液I)和350rpm,允许振荡1小时。在孵育后,从每个孔移出100 yl反 应液,并置于新鲜微平板中(Costar 9017, Corning Incorporated,NY,USA)。在Microplate Reader (SpectraMax 340,Molecular Devices)上读取各等分样品在405nm处的吸光度,并 与空白对照相比较(即,含有微样品和洗涤剂但不含酶样品的孔)。计算BMI洗涤性能相对空白值校正所获得的吸光度(在缺少酶的条件下孵育微样品获得)。使用获 得的吸光度作为对水解活性的度量。如图7和8所示,剂量反应曲线的结果将405nm处的吸光度描述为1AG3蛋白酶浓 度(孔中的ppm蛋白质)的函数。实施例8液体织物清洁组合物该实施例提供了用于与本发明结合使用的液体织物清洁组合物。可认为这些组合 物在日本机洗条件下,以及对于涉及清洁精细和/或精致织物的应用特别有效。表8-1提 供了合适的组合物。然而,其并非意在将本发明限制为该特定的配方,因为其他多种配方可用于本发明。
表8-1.液体织物清洁组合物 实施例9液体洗碗组合物该实施例提供了用于与本发明结合使用的液体洗碗组合物。可认为这些组合物在 日本洗碗洗涤条件下特别有效。表9-1提供了合适的组合物。然而,其并非意在将本发明 限制为该特定的配方,因为其他多种配方可用于本发明。
实施例10液体织物清洁组合物本发明的蛋白酶在清洁组合物中特别有效。例如,可认为根据发明制备的液体织 物清洁组合物在日本机洗条件下特别有效。在一些实施方案中,这些组合物包含下列在表 10-1中显示的组分。除非另外指出,该表和后续实施例的表格中的“蛋白酶”是本文提供的 1AG3蛋白酶。 实施例11颗粒状织物清洁组合物在该实施例中,提供了多种可用于本发明的颗粒状织物清洁组合物。下列表格提
供了合适的组合物。然而,其并非意在将本发明限制为这些特定的配方,因为其他多种配方
可用于本发明。
_表11-2.颗粒状织物^洁组合物_ 认为下列衣物洗涤剂组合物在欧洲机洗条件下特别有效。
实施例12洗涤剂配方
在该实施例中,提供了多种使用1AG3和/或1AG3变体的洗涤剂配方。可以理解, 本节提供的测试方法必定可用于确定本发明参数的不同值。在示例的洗涤剂组合物中,通过纯化酶占总组合物的重量比来表示酶水平,除非 另外提示,通过占总组合物的重量比来表示洗涤剂的成分。下表(表12-1)提供了制备的液体衣物洗涤剂组合物。
#添加至产物,以调节产物的净pH至约4. 2⑴和约3. 8 (II)。下表(12-2)提供了制备的手洗液体洗涤剂组合物。
这些组合物的PH是约8至约11。表12-3提供了制备的液体自动餐具洗涤剂组合物。
表12-4提供了以颗粒状或片剂形式制备的洗衣组合物。
女香料、染料、增白剂/SRPl/羧甲基纤维素钠/光漂白剂/MgS04/PVPVI/消泡剂/ 高分子PEG/粘土。表12-5提供了制备的液体衣物洗涤剂配方。
表12-6提供了制备的致密高密度餐具洗涤剂。
*增白剂/染料/SRP1/羧甲基纤维素钠/光漂白剂/MgS04/PVPVI/消泡剂/高 分子PEG/粘土。上述组合物的pH从约9. 6至约11.3。表12-7提供了本发明的片剂洗涤剂组合物,所述片剂是使用标准12头旋转式压 机,在13KN/cm2的压力下,压缩颗粒状餐具洗涤剂组合物制备的
__表12 了 7.片卞洗条剂组合物 ___ *增白剂/SRPl/羧甲基纤维素钠/光漂白剂/MgS04/PVPVI/消泡剂/高分子PEG/ 粘土。这些组合物的pH从约10至约11. 5。这些组合物的片剂重量从约20克至约30克。表12-8提供了制备的本发明的液体硬表面清洁洗涤剂组合物。
这些组合物的pH从约7. 4至约9. 5。当然,可以理解,对上述实施方案可以进行多种改变和修饰。因此,上述详细的说
明旨在根据下列权利要求进行理解,包含其所有等价形式,其意在定义本发明的范围。实施例13包含1AG3的动物饲料本发明还提供了包含aAG3和/或1AG3变体的动物饲料组合物。在该实施例中,
提供了适合家禽的一种此类饲料。然而,其并非意在将本发明限于该特定的配方,因为本发
明的蛋白酶可用于多种其他饲料配方。其还意在说明本发明的饲料适合施与任何动物,包
含但不限于家畜(例如,牛、猪、羊等),以及伴侣动物(例如,狗、猫、马、啮齿类等)。下表提供了捣碎的、基于玉米的开食饲料(starter feed)配方,其适于施与达3周龄的小火鸡
(turkey poult)。
在一些实施方案中,该饲料配方添加了各种浓度的本发明蛋白酶(例如,2,000单 位 /kg,4,000 单位 /kg,和 6,000 单位 /kg)。本说明书中提及的所有专利和出版物是发明所属领域的技术人员的水平指标。所 有专利和出版物都引入本文作为参考,就像每个出版物都具体并单独引入本文作为参考。 然而,任何出版物的引用都不认为是承认其是本发明的现有技术。已描述了本发明的示例性实施方案,可以对最接近的实施方案进行多种修饰,这 对本领域普通技术人员是显而易见的,并且此类修饰旨在落入本发明的范围内。本领域技术人员可以容易的理解,本发明很适于实施所提及的目标并获得所述结 果和优势,以及其他本文内在的属性。本文描述的组合物和方法是代表性的,并非意在限制 本发明的范围。在不脱离发明的范围和精神的条件下,可以对本文公开的发明进行多种取 代和修饰,这对本领域技术人员是显而易见的。本文说明性描述的发明可以适当地在缺少本文未具体公开的任何要素或限制的 情况下实施。所使用的术语和表述用于描述而非限制,这些术语和表述的使用并不旨在排 除所述特征的任何等同物或其部分,而是应该认识到,在要求保护的本发明范围内可以有 多种修改。因此,应该理解,尽管通过优选实施方案和任选特征具体公开了本发明,但本领 域技术人员可应用本文所公开概念的修饰和变体,这些修饰和变体均认为落入所附权利要 求书所限定的本发明范围之内。本文已经宽泛并一般性地描述了发明。落入一般性公开范围内的任何较小种类和 亚类也都构成发明的一部分。这包含对本发明的一般性描述,其前提或反面限制为从该类 中去除任何主题,无论所去除的内容是否在本文中具体描述。
权利要求
分离的丝氨酸蛋白酶,其包含与SEQ ID NO9的野生型链霉菌1AG3蛋白酶至少约80%相同的氨基酸序列。
2.权利要求1的分离的丝氨酸蛋白酶,其中所述分离的丝氨酸蛋白酶包含与所述野生型链霉菌1AG3蛋白酶至少约95%相同的氨基酸序列。
3.权利要求1的分离的丝氨酸蛋白酶,其中所述分离的丝氨酸蛋白酶包含所述野生型 链霉菌1AG3蛋白酶的氨基酸序列。
4.权利要求1的分离的丝氨酸蛋白酶,其中相对于所述野生型链霉菌1AG3蛋白酶,所 述分离的丝氨酸蛋白酶包含至少1个氨基酸取代。
5.分离的核酸,其编码权利要求1的分离的丝氨酸蛋白酶的。
6.权利要求5的分离的核酸,其中所述核酸具有如下核苷酸序列a)在严格杂交条件 下与SEQ ID NO 8杂交;和/或b)与SEQ ID NO 8至少约70%相同。
7.重组多核苷酸,其包含有效连接的启动子和权利要求6的分离的核酸。
8.权利要求7的重组多核苷酸,其中所述重组多核苷酸提供从宿主细胞分泌所述分离 的丝氨酸蛋白酶。
9.表达载体,其包含权利要求7的重组多核苷酸。
10.宿主细胞,其包含权利要求7的重组多核苷酸。
11.权利要求10的宿主细胞,其中所述宿主选自芽孢杆菌属物种(Bacillussp.)、 链霉菌属物种(Str印tomyces sp.)、曲霉属物种(Aspergillussp.)和木霉菌属物种 (Trichoderma sp.)。
12.权利要求10的宿主细胞,其中所述重组多核苷酸存在于所述宿主细胞的基因组中。
13.产生分离的丝氨酸蛋白酶的方法,其包括在适合产生所述分离的丝氨酸蛋白酶的条件下培养权利要求10的宿主细胞。
14.权利要求13的方法,其还包括回收所述分离的丝氨酸蛋白酶。
15.清洁组合物,其包含权利要求1的分离的丝氨酸蛋白酶。
16.权利要求15的清洁组合物,其中所述清洁组合物还包含表面活性剂。
17.权利要求16的清洁组合物,其中所述表面活性剂是包含环氧乙烷部分的烷基硫酸 钠表面活性剂。
18.权利要求15的清洁组合物,所述组合物包含约0.001衬%至约0. 5wt%的所述分离 的丝氨酸蛋白酶。
19.权利要求15的清洁组合物,其中所述组合物包含足量的PH调节剂,以提供具有净 PH从约3至约5的所述组合物,所述组合物基本不含在约3至约5的pH水解的材料。
20.权利要求15的清洁组合物,其中所述清洁组合物配制成衣物洗涤剂。
21.权利要求15的清洁组合物,其中所述清洁组合物配制成餐具洗涤剂。
22.权利要求15的清洁组合物,其还包含选自蛋白酶、淀粉酶、脂肪酶、甘露聚糖酶、果 胶酶、角质酶、氧化还原酶、半纤维素酶和纤维素酶的其他酶。
23.权利要求15的清洁组合物,其还包含稳定剂。
24.权利要求23的清洁组合物,其中所述稳定剂选自硼砂、甘油和竞争性抑制剂。
25.权利要求24的清洁组合物,其中所述竞争性抑制剂使所述分离的丝氨酸蛋白酶对阴离子表面活性剂稳定。
26.权利要求15的清洁组合物,其中所述清洁组合物是固体组合物。
27.权利要求18的清洁组合物,其中所述清洁组合物是液体组合物。
28.清洁的方法,所述方法包括步骤在适合清洁所述对象的条件下,将对象与权利要求15的清洁组合物接触。
29.权利要求28的方法,其中所述方法还包括洗涤和/或漂洗所述对象。
30.权利要求28的方法,其中所述对象是织物。
31.权利要求28的方法,其中所述对象是餐具。
32.动物饲料,其包含权利要求1的分离的丝氨酸蛋白酶。
全文摘要
本发明提供了链霉菌丝氨酸蛋白酶。在一些实施方案中,该蛋白酶包含与野生型链霉菌1AG3蛋白酶至少约80%相同的氨基酸序列。本发明还提供了分离的核酸序列,也提供了重组核酸和含有该重组核酸的宿主细胞。此外,本发明提供了包含链霉菌丝氨酸蛋白酶的清洁组合物和其他组合物。
文档编号A23K1/165GK101842480SQ200880114395
公开日2010年9月22日 申请日期2008年10月24日 优先权日2007年10月30日
发明者B·E·琼斯, C·莱夫朗, M·科尔克曼 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1