富含具有羧基末端脯氨酸残基的肽的蛋白质水解产物的制作方法

文档序号:389230阅读:1831来源:国知局
专利名称:富含具有羧基末端脯氨酸残基的肽的蛋白质水解产物的制作方法
技术领域
本发明涉及蛋白质水解产物、生产水解产物的方法和这些水解产物的用途。
背景技术
牛奶或牛奶组分的酶水解产物在食品工业上仅有有限的应用。然而,这些水解产物在市场中占有引人关注的位置,如由大量对获得这样的水解产物的最优化的方法进行描述和要求保护的文献所证实的。将牛奶或牛奶组分用具有蛋白水解活性的酶处理以生产水解产物,这主要是为了使产物的变应原性最小化、通过提供一种易于可同化的消化而促进胃肠摄取以及在酸性产品中稳定蛋白质以防止其在延长的贮存期间沉淀。
尽管减少牛奶蛋白质的分子量是通常可接受的产生这些有益作用的操作,但对牛奶蛋白质的酶促水解确实具有缺点。将牛奶与酶温育的消极方面包括不完全的蛋白水解消化、减小肽片段的长度后愈加苦的味道、由于必不可少的纯化步骤而导致终产物的减少的产量以及由高水平的游离氨基酸所导致的讨厌的味道变化。
通过与内切蛋白酶温育,所有牛奶组分的一致的和完全的降解通常是很难得到的。例如,已知β乳球蛋白是蛋白酶抗性的且对该分子的部分消化可导致对婴儿配方(infant formulae)未预料到的强免疫原性反应,以及在产品如酸性运动饮料中可见的蛋白质沉淀。为了保证在蛋白质水解产物中不存在不充分消化的蛋白质,通常需要一个最终的超滤步骤以从水解产物中去除任何残存的大肽片段。从水解产物中去除这些部分消化的蛋白质片段的不可缺少的步骤必然降低了最终消化产物的产量,从而增加了生产成本。
蛋白质抗原性可通过将蛋白质降解为仅具有8-10个氨基酸残基的肽而克服,但通过这样高强度酶促消化而造成的肽是非常苦的。对这种现象的一般解释为具有高的疏水氨基酸含量的小肽促进了苦味。所用蛋白质原料的特性、用于消化的蛋白水解酶的类型和所得肽的长度在很大程度上决定了最终水解产物的苦味程度。例如,已知含有许多疏水氨基酸的酪蛋白可比乳清蛋白生成更多的苦味水解产物。
在工业操作中,蛋白质水解产物的脱苦味是通过选择性地用活性炭去除苦味肽或将它们吸附到疏水树脂上而实现的。在这样的去除步骤中伴随的产量减少增加了最终产物的成本。此外,该方法对终产物的营养值具有负面影响,这是因为几个营养上不可缺少的氨基酸由于它们疏水的特性而丢失,包括色氨酸、亮氨酸、苯丙氨酸和异亮氨酸。因而,这个方法的脱苦味易于产生缺乏这些营养上重要的氨基酸的水解产物。
脱苦味也可以通过将水解产物用外肽酶处理而实现。在这个方法中,将氨基末端和羧基末端的氨基酸从肽中释放以试图减小它们总的疏水性。将肽暴露于非选择性的外切蛋白酶时导致不可控制的量的游离氨基酸释放到最终的水解产物中。如灭菌或喷雾干燥所需要的,随后对这样含有游离氨基酸的水解产物的加热常通过美拉反应而生成无味的液体培养基。此外,通过外切蛋白酶产生的高水平的游离氨基酸可将最终水解产物产品的渗透值增加到可导致渗透性腹泻的水平。
因此,蛋白水解产物的生产代表了蛋白水解消化正反两方面之间的平衡。当前的实践是为了产品种类的特殊要求而使蛋白质底物的酶促消化最适化。例如,打算供真正变态反应婴儿使用的蛋白质水解产物需要广泛的蛋白水解消化,随后进行任何残留的大分子量肽片段的严格去除。作为对照的,为很少表现牛奶变态反应的成年人设计的产品一般含有水解产物,其中增加了肽的平均长度以使无味的可能性最小并使得产量最大。
所有主要的牛奶蛋白质都被认为是重要的抗原性化合物,例如从β-酪蛋白、β-乳球蛋白和α-乳清蛋白,以及从如大豆分离物、水稻蛋白质和小麦谷蛋白中获得的蔬菜蛋白质组分。因而,认为将这些牛奶和谷类蛋白质酶促消化为分子量低于3000 Da对于使变应原性最小化是重要的。尤其认为乳清中的β-乳球蛋白组分是重要的变态反应原,因为该蛋白质不存在于人乳中且已证实β-乳球蛋白的蛋白水解消化是困难的。含有广泛水解的蛋白质水解产物的婴儿配方一般含有高水平的游离氨基酸,这指示了不最理想的味道和高的重量摩尔渗透压浓度。对当前市场上的婴儿配方水解产品的最近评估显示它们中的许多仍然含有基于乳清的免疫原性物质。该观察显示继续需要可在较低成本导致改善的水解产物的新酶混合物。
预定提供给非医疗需要的消费者如运动员或减轻体重的人的蛋白质水解产物必须适应于提供好的味道特征。在这些情况下,高的适口性以及物理化学方面如在酸性环境下的溶解性具有最重要的作用。这个种类的产品(包括强化的果汁和运动饮料)特别关注谷氨酰胺和精氨酸添加剂以改善消费者的健康。例如运动饮料适合增强身体的忍耐力和在延长的高强度锻炼后使运动员恢复。已认为富含谷氨酰胺的谷类蛋白质来源如小麦谷蛋白或富含精氨酸的蛋白质来源如水稻蛋白质和大豆分离物是牛奶蛋白质的替换物,以满足酸性健康相关产品的添加剂需要。然而,这样的谷类蛋白质,具体而言地为小麦谷蛋白在更酸性的pH值即那些小于4的pH值时显示了非常差的溶解性,这意味着完全可溶的谷蛋白水解产物难于获得。
因为与蛋白质水解相关联的对产品成本和质量的负面影响,几种目标在于改善水解产物特征和降低生产成本的酶混合物已经在以前的出版物中描述。例子包括EP 321 603,它涉及源自动物的内切蛋白酶如胰蛋白酶、胰凝乳蛋白酶和胰酶制剂的使用,也包括EP 325986和WO 96/13174,它们偏重从芽孢杆菌属和曲霉属物种获得的内切蛋白酶的使用。已经描述了几种能够使肽混合物脱苦味的外切蛋白酶。然而,例如EP 0223 560涉及特定的脯氨酸特异性内切蛋白酶的用途,WO 96/13174涉及为此目的的氨肽酶和羧肽酶的混合物。
许多出版物竭力推荐脯氨酸特异性内切蛋白酶和各种外切蛋白酶组合以生产具有相对低的苦味的蛋白质水解产物。例如,日本专利JP02039896涉及与二肽羧肽酶组合的脯氨酸特异性内切蛋白酶生成低分子量肽制剂的用途。富含脯氨酸的寡肽由3个脯氨酸特异性肽水解酶的降解被描述为对于没有苦味地促进干酪的成熟是基本的(Journal of Dairy Science,77(2)385-392(1994))。更明确地,脯氨酸特异性内切蛋白酶与羧肽酶组合的脱苦味作用描述于JP5015314。JP5015314描述了从米曲霉(Aspergillus oryzae)中获得的粗酶制剂,它除了通常的非特异性蛋白水解活性之外,显示小量的脯氨酸特异性内切蛋白酶和羧肽酶活性。根据JP5015314,在肽的羧基末端存在的脯氨酸残基导致苦味且为不合需要的。将大豆蛋白质与脯氨酸特异性内切蛋白酶和羧肽酶的酶混合物温育可产生一种水解产物,该水解产物的苦味显著地低于用缺乏脯氨酸特异性内切蛋白酶和羧肽酶组合的蛋白酶制剂获得的大豆水解产物。
总起来说,本领域的技术表明外肽酶介导的羧基末端(或氨基末端)疏水性氨基酸残基从肽中的释放对于肽水解产物的显著的脱苦味是基本的。同样地,明确地涉及用于脱苦味的脯氨酸特异性内切蛋白酶的参考文献教导人们该活性的功能是将疏水性脯氨酸残基暴露以使得它们随后被羧肽酶去除。这个假说的含义是脯氨酸特异性内切蛋白酶的脱苦味活性是与羧基末端脯氨酸残基的有效去除有关的,而不是与具有这样的羧基末端脯氨酸残基的肽的产生有关。
发明概述本发明提供了一种包含肽的蛋白质水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数(%)比用于生成水解产物的蛋白质底物中脯氨酸的摩尔份数(%)高两倍多。
本发明也提供了-一种包含肽的乳清水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少8%,优选地为至少15%,更优选地为30~70%;-一种包含肽的酪蛋白水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少25%,优选地为至少30%,更优选地为少于70%;-一种包含肽的大豆水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少20%,优选地为30~70%;-一种包含肽的谷蛋白水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少20%,优选地为至少30%,有利地为少于70%;和-一种包含肽的大麦水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少20%,优选地为至少30%,有利地为少于70%。
本发明进一步提供一种脯氨酸特异性内切蛋白酶,以及编码内肽酶的DNA分子,所述脯氨酸特异性内切蛋白酶选自(a)一种其氨基酸序列与SEQ ID NO2或其片段的氨基酸1~526具有至少40%氨基酸序列一致性的多肽;(b)一种由多核苷酸编码的多肽,该多核苷酸在低严格性条件下与(i)SEQ ID NO1或其片段的核酸序列杂交,该片段与其在60个核苷酸优选地为100个核苷酸上具有至少80%或90%的一致性,更优选地为在200个核苷酸上具有至少90%的一致性,或与(ii)SEQ ID NO1的核酸序列互补的核酸序列杂交。
本发明也提供- 本发明的蛋白质水解产物在食物或饮料中的用途;- 根据本发明的脯氨酸特异性内切蛋白酶的用途;- 一种从蛋白质底物中酶促生产蛋白质水解产物的方法,其中蛋白质底物与脯氨酸特异性内切蛋白酶温育以产生富含具有羧基末端脯氨酸的肽的蛋白质水解产物;- 一种包含本发明的脯氨酸特异性内切蛋白酶的酶组合物,该组合物能够生产包含肽的蛋白质水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数(%)至少为本发明中的蛋白质或水解产物中脯氨酸的摩尔份数(%)的两倍;和- 一种包含本发明的蛋白质水解产物或通过本发明的方法可获得的食物。
发明详述我们已经显示脯氨酸残基在肽的羧基末端的高发生率与低的苦味相关。此外,我们证明羧基末端脯氨酸残基的预期的高发生率只能用高浓度的脯氨酸特异性内切蛋白酶来实现,即超过在JP5015314中所指定的活性几个数量级的浓度而且不存在羧肽酶。
从经济的视点看,该观察的含义为对以高的量和相对纯的形式生产脯氨酸特异性内切蛋白酶的改进方法存在明显的需求。这样做的优选途径为用重组DNA技术来过量生产这样的脯氨酸特异性内切蛋白酶。由于许多食物都是酸性的,且在工业的非无菌环境中长时间的酶温育需要酸性温育条件以防止微生物污染,因此这样做的更优选的途径为用重组DNA技术来过量生产酸稳定性的脯氨酸特异性内切蛋白酶。这样做的特别优选的途径是通过过量生产源自曲霉属的脯氨酸特异性内切蛋白酶,最优选的途径为通过过量生产源自黑曲霉(Aspergillus niger)的脯氨酸特异性内肽酶。为了使后一种途径成为可能,源自曲霉属的脯氨酸特异性内切蛋白酶的唯一序列信息是基本的。更优选地,编码基因的全部核苷酸序列必须是可得到的。
一旦以相对纯的形式使新的酶可用了,即可展望其他具有技术和经济优势的新的和令人惊讶的应用。一种新的应用可为从具有不寻常的氨基酸组分的蛋白质底物产生无苦味的水解产物。这样的不寻常的氨基酸组分可在某些食物应用中提供主要的益处。例子为具有高水平的疏水氨基酸残基的酪蛋白或小麦谷蛋白或玉米蛋白质分离物。迄今这样的底物因为用本领域现有方法通过水解而产生讨厌的苦味,所以没有实际的用处。用根据本发明的水解方法,可制得无苦味的新水解产物以用于婴儿和临床营养、用于治疗膳食以及用于消费者膳食和运动营养。除这样的新水解产物之外,也展望了这样的酸性脯氨酸特异性内切蛋白酶的苦味减少作用的应用。例如,在涉及发酵步骤的蛋白质食物产品中内切蛋白酶的整合可以抑制随老化而发展的苦味,其中的食物产品包括如奶酪或酸奶酪。同样在需要用蛋白酶处理的蛋白质食物产品中,如酶修饰的奶酪的生产或香料工业中蛋白质水解产物的生产,根据本发明的酶的整合将有助于抑制苦味。
此外,也研究了不直接与抑制苦味相关的益处。一种这样的应用是将酶与食物蛋白质温育以减少它们的变应原性。几种食物蛋白质含有高变应原细分馏份,例如含有具有富含脯氨酸的肽序列的谷醇溶蛋白的小麦谷蛋白。可用新的酶处理这些蛋白质以减轻它们的抗原性。另一种新的应用是将酶整合到各种生面团中,这是因为已观察到这减缓了所得面包的腐败。另一种新的应用是用脯氨酸特异性内切蛋白酶生成富含脯氨酸的肽。这样的富含脯氨酸的肽是各种食物或营养产品的理想添加剂,这是因为它们涉及厌食作用、血纤维蛋白溶解和抗凝以及抗高血压作用、对胃粘膜的保护以及对类风湿性关节炎的预防。
另一个另人惊讶的应用是将新的酶添加到动物饲料中以增强蛋白质利用。例如,酶的添加导致在饲料蛋白质中存在的难消化的富含脯氨酸的序列的改善的可消化性以及含有高水平多酚的可便宜获得的植物蛋白质的改进的转化率。
在另一个新的应用中,该酶被用于啤酒酿造。大麦蛋白质中富含脯氨酸的序列很丰富,且在它们非发芽的形式时谷类蛋白质是极其难以降解成生产适当的可发酵的麦芽汁所必需的游离氨基酸的。相当另人惊讶地,在淀粉糖化过程中整合新的酶已显示可刺激氨基酸从碾磨的而非发芽的大麦中释放,因而获得了更充足的麦芽汁。以相似的途径可改进从含有高比例的其他便宜且本地可获得的谷类(如高粱属的植物)的麦芽汁而来的啤酒发酵物。
在这些新的应用的多数中,脯氨酸特异性内切蛋白酶应该优选地显示具有酸性pH最适值的活性谱。
为了克服上述问题,本发明证明分离的、纯化的脯氨酸特异性内切蛋白酶活性本身(即没有伴随的或随后的外切蛋白水解酶基本活性的)对于显著地使蛋白质水解产物脱苦味是足够的。因此,脯氨酸特异性内切蛋白酶可含有每克蛋白质至少5单位的本发明的酶制剂,优选地为10u/g,更优选地为25u/g且更加优选地为50u/g。此外,依照本发明所做的研究证明分离的、纯化的脯氨酸特异性内切蛋白酶活性本身(意思是没有伴随的或随后的外切蛋白水解酶活性)对于显著地降低蛋白质水解产物总的免疫原性水平以及显著地增加它们在酸性条件下总的溶解性是足够的。根据本发明生产的水解产物富含具有羧基末端脯氨酸残基的肽。
本发明的一个实施方案提供了一种包含分离的、纯化的脯氨酸特异性内切蛋白酶的酶混合物以进行高产量的蛋白质水解产物的生产,该水解产物基本上具有低的苦味和低的变应原性质而无伴随的基本水平游离氨基酸的产生。该酶混合物适合于制备各种蛋白质组分的水解产物。具体而言地,可将蛋白质底物如牛奶蛋白质与分离的、纯化的脯氨酸特异性内切蛋白酶和枯草溶菌酶温育以生产富含具有羧基末端脯氨酸的肽片段的蛋白质水解产物。术语“富合”意指酶促切割的水解产物产品中至少8%的肽片段具有羧基末端脯氨酸残基。
本发明提供了通过水解包含肽的蛋白质而获得的蛋白质水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数(%)至少为用于生产水解产物的蛋白质底物中脯氨酸的摩尔份数(%)的两倍。
水解产物中肽的平均长度通常为3~9个氨基酸。
根据本发明优选的水解产物为一种包含肽的乳清水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少8%,优选地为至少15%,更优选地为30~70%;一种包含肽的酪蛋白水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少25%,优选地为30~70%;一种包含肽的大豆水解产物,其中具有羧基末端脯氨酸的肽的摩尔份数为至少20%,优选地为30~70%。
肽或肽片段指具有分子量为400~2000道尔顿的肽。这些肽可根据在“材料与方法”部分里所描述的LC/MC分析来分析。
通常在本发明的蛋白质水解产物的生产中,蛋白质底物是基本水解的,有利地为至少50%。优选地至少10%的蛋白质底物转化为具有分子量为400~2000道尔顿的肽。更优选地20~90%,且更加优选地30~80%的蛋白质底物转化为这样的肽。
在本发明的另一个实施方案中,可将蛋白质底物与包含分离的、纯化的脯氨酸特异性内切蛋白酶、丝氨酸内切蛋白酶或金属内切蛋白酶和羧肽酶的酶混合物进行温育以生产富含具有羧基末端脯氨酸的肽片段的蛋白质水解产物。
本发明的酶混合物特别适合于用作运动饮料和基于果汁的饮料的调味料和营养增强物的蛋白质水解产物的生产,这是因为结果所得的水解肽混合物将非常低的苦味性质和在这样的饮料的普遍酸性条件下的极好的溶解性组合在一起。本发明的酶混合物特征在于它含有至少一种内切蛋白酶(如丝氨酸蛋白酶或金属内切蛋白酶)和脯氨酸特异性内切蛋白酶(E.C.3.4.21.26)以提供主要的水解产物。更特定地,本发明涉及分离的、纯化的脯氨酸特异性内切蛋白酶和丝氨酸蛋白酶或金属蛋白酶的酶混合物,该混合物能够生产包含肽片段的蛋白质水解产物,其中至少8%的,优选地为至少15%的,更优选地为30~70%的所述肽片段具有羧基末端脯氨酸。
本发明的另一个实施方案为富含相对高含量的以脯氨酸作为羧基末端氨基酸残基的肽的蛋白质水解产物。这样富含的水解产物可包含至少8%的,优选地为至少15%的,更优选地为30~70%的具有羧基末端脯氨酸残基的肽片段。由于一般用于生成蛋白质水解产物的酶制剂不能够生成在羧基末端具有脯氨酸残基的肽,所以相对富含这样的肽的蛋白质水解产物是新颖的。
用本发明的酶混合物进行水解的底物包括全脂奶、脱脂乳、酸性酪蛋白、凝固酪蛋白、酸性乳清产品或奶酪乳清产品。相当另人惊讶地是,衍生自曲霉属的脯氨酸特异性内切蛋白酶不仅在脯氨酸残基的羧基末端一侧进行切割,而且在羟脯氨酸的羧基末端一侧进行切割,这使得其他基于胶原的动物蛋白质如动物胶以及含有残留的肉的骨或鱼骨成为引起关注的酶底物。此外植物底物是适当的底物,如小麦谷蛋白、碾磨的大麦和从如大豆、水稻或玉米中获得的蛋白质组分。根据本发明生产的牛奶蛋白质水解产物(经过或不经过额外的过滤或纯化步骤)可被用于各种特殊食物中,如低变应原性的水解产物用于婴儿营养,碱性的水解产物用于肠道和饮食的营养,以及蛋白质浓缩物用于各种形式的健康食物。因而,本发明的蛋白质水解产物可被用于生产具有低抗原性的食品,如婴儿配方。另外,根据本发明的酶制剂可被用于减少由至少一种蛋白质水解产物调味的食物中的苦味,即使当这些蛋白质水解产物是大量存在时。例如,食物可包含5%~10%(w/v)的蛋白质水解产物而仍然能用本发明的酶制剂使其苦味减少。
本发明提供了一种具有酸性pH最适值的分离的、纯化的脯氨酸特异性内切蛋白酶,它单独存在或处于包含一种或多种额外的酶的组合物中,用以制取供各种食物应用的蛋白质水解产物。这样的分离的、纯化的脯氨酸特异性内切蛋白酶定义为在每克蛋白质材料中含有至少10单位的脯氨酸特异性内切蛋白酶活性。如在材料与方法部分所详细说明的,在脯氨酸特异性内切蛋白酶的pH最适值低于pH6时,如在黑曲霉脯氨酸特异性内切蛋白酶的情况下,这些单位应该用合成肽Z-Gly-Pro-pNA于37摄氏度和pH5来测量,否则该单位应该在pH=7时测量。该分离的、纯化的酶本身或在酶混合物中克服了在本领域中以前所知的酶混合物的许多缺点。最重要地,本发明分离的、纯化的脯氨酸特异性内切蛋白酶在同时具有低变应原性潜能、高产量和低苦味性质的水解产物的生产中是关键的。此外,用分离的、纯化的脯氨酸特异性内切蛋白酶或包含该脯氨酸特异性内切蛋白酶的酶混合物所生产的水解产物是酸稳定的,并含有很低水平的游离氨基酸,因而在加热步骤中,如喷雾干燥或产品灭菌中只产生了最小的减味(off-taste)。根据本发明的水解产物将含有每克干粉少于900微摩尔的游离氨基酸,优选地为每克干粉少于300微摩尔的游离氨基酸,更优选地为每克干粉少于150微摩尔的游离氨基酸,且更加优选地为每克干粉少于50微摩尔。
根据本发明的酶混合物特征在于它包含另外的内切蛋白酶(如丝氨酸蛋白酶或金属内切蛋白酶)与分离的、纯化的脯氨酸特异性内切蛋白酶(E.C.3.4.21.26)组合,它们共同作用以提供主要的蛋白质水解产物。
丝氨酸蛋白酶代表了一类众所周知的碱性内切蛋白酶,且一些它们最重要的代表物如枯草溶菌素(E.C.3.4.21.62)和胰凝乳蛋白酶(E.C.3.4.21.1)优选在疏水氨基酸如Tyr、Trp、Phe和Leu的羧基末端一侧对肽链进行切割。本发明的酶混合物可含有胰凝乳蛋白酶和/或枯草溶菌素。枯草溶菌素是由芽孢杆菌属的物种生产的,具有特别广泛的底物特异性和广泛的碱性pH最适值。该酶在50℃和60℃之间具有最适的活性。该酶是便宜可用的常规商业产品且在如各种牛奶水解产物的生产中是有用的。胰凝乳蛋白酶可从动物胰腺获得,在稍微比枯草溶菌素高的碱性pH值具有稍微狭窄的底物特异性,且在低于50摄氏度时具有最适活性。
金属内切蛋白酶类广泛分布在细菌、真菌和高等生物中。可将它们区分为中性和酸性金属蛋白酶。在这两个子集中,只有中性蛋白酶显示了期望的切割优选性,即在疏水氨基酸残基如Phe和Leu的羧基末端一侧切割肽链。中性金属蛋白酶类的众所周知的代表物为芽孢杆菌溶素(bacillolysin)(E.C.3.4.24.28)和嗜热芽孢菌蛋白酶(E.C.3.4.24.27),且它们每一个或两者可存在于本发明的酶混合物中。两种酶均从芽孢杆菌属的物种中获得并在中性或稍微碱性的条件下显示最大的活性。这些中性金属内切蛋白酶非众所周知的代表物已从曲霉属物种中获得。在那些其中脯氨酸特异性内切蛋白酶不是以其脱苦味作用而使用而是协助富含脯氨酸的蛋白质序列的水解的情况下,与酸性金属蛋白酶种类如deuterolysine(EC 3.4.24.39)的组合可为有益的。脯氨酸特异性内切蛋白酶是能够在脯氨酸残基的羧基末端切割肽或多肽的内切蛋白酶。这样的酶广泛发现于动物和植物中,但其在微生物中的存在显得是有限的。到目前为止,已经在曲霉属(EP 0 522 428)、黄杆菌属(EP 0 967 285)和气单胞菌属(J.Biochem.113,790-796)、黄单胞菌属和拟杆菌属的物种中鉴定了脯氨酸特异性内切蛋白酶。尽管来自这些生物的大多数的脯氨酸特异性酶在pH8左右有活性,但是曲霉属的酶在pH5左右具有最适活性。根据优选实施方案,使用了具有低于7的pH最适值的脯氨酸特异性内切蛋白酶,优选地为具有3.5~6.5的pH最适值的,因为这样的酶具有一些技术和经济优点。本发明的脯氨酸特异性内切蛋白酶可从一种上述的微生物物种中分离,具体而言地为从曲霉属的物种中分离。优选地,脯氨酸特异性内切蛋白酶是从黑曲霉的一个菌株分离的。更优选地,脯氨酸特异性内切蛋白酶是从经过遗传工程改造以过表达编码脯氨酸特异性内切蛋白酶的基因的黑曲霉宿主中分离的,尽管其他的宿主如大肠杆菌也是适当的表达载体。例如,除了在其它宿主中的克隆和过量生产之外,源自黄杆菌属的脯氨酸特异性内切蛋白酶在大肠杆菌中的克隆和过量生产已制得纯的脯氨酸特异性内切蛋白酶。这样的过量生产构建体的例子在World Journal ofMicrobiology & Biotechnology,Vol 11,pp 209-212中提供。黑曲霉宿主优选地用于生产非重组型的自身构建体,该自身构建体利用黑曲霉的启动子来驱动编码黑曲霉脯氨酸特异性内切蛋白酶的基因的表达。
大多数涉及脯氨酸特异性内切蛋白酶克隆和生产的科学出版物都集中在该酶在生物活性蛋白质的合成和调节中的作用。涉及该酶用于有用的蛋白质水解产物生产的出版物是稀少的,且是关心该酶与外切蛋白酶的组合使用的。几个日本的出版物涉及粗的和复杂的酶混合物中脯氨酸特异性内切蛋白水解活性的存在,其中的酶混合物能够生产具有低的苦味的水解产物,但是所用的酶混合物总是含有外切蛋白酶。在本领域中没有人建议缺乏外切蛋白酶如羧肽酶或氨肽酶时脱苦味和脯氨酸特异性内切蛋白水解活性之间有直接的联系。此外,以前也没有描述将用脯氨酸特异性内切蛋白水解活性生产的水解产物与减少的免疫原性反应或改善的酸溶解性联系起来的数据。
本发明具有脯氨酸特异性内切蛋白酶的多肽可为分离的形式。如在此处所定义的,分离的多肽为内源生产的或重组多肽,它基本不含其他非脯氨酸特异性内切蛋白酶多肽,且通过SDS-PAGE确定一般为至少约20%纯的,优选地为至少约40%纯的,更优选地为至少约60%纯的,更加优选地为至少约80%纯的,仍然更优选地为至少约90%纯的,且最优选地为约95%纯的。该多肽可由离心和色谱方法或本领域公知的任何其他从粗溶液中获得纯的蛋白质的技术来分离。应理解多肽可与不妨碍该多肽的期望目的的载体或稀释剂混合,因而这种形式的多肽仍然被认为是分离的。一般在制剂中包含多肽,其中按制剂中蛋白质的重量超过20%的,如超过30%、40%、50%、80%、90%、95%或99%的为本发明的多肽。
优选地,本发明的多肽是从微生物中获得的,该微生物含有编码具脯氨酸特异性内切蛋白酶活性的酶的基因。更优选地,该微生物为真菌且最适的为丝状真菌。因而优选的生物为曲霉属的,如那些黑曲霉物种。
在第一个实施方案中,本发明提供了一种分离的多肽,该多肽的氨基酸序列与SEQ ID NO2的氨基酸1~526(即多肽)具有至少约40%的氨基酸序列一致性,优选地为至少约50%,优选地为至少约60%,优选地为至少约65%,优选地为至少约70%,更优选地为至少约80%,更加优选地为至少约90%,仍然更加优选地为至少约95%,且最优选地为至少约97%,且该氨基酸序列具有脯氨酸特异性内切蛋白酶活性。
就本发明而言,两个或多个氨基酸序列之间的一致性程度是由BLAST P蛋白质数据库搜索程序(Altschul等人,1997,NucleicAcids Research 253389-3402)来确定的,该程序具有矩阵Blosum 62和预期的阈值10。
本发明的多肽可包含在SEQ ID NO2中阐明的氨基酸序列或基本同源的序列,或任一具有脯氨酸特异性内切蛋白酶活性的序列的片段。通常,在SEQ ID NO2中所示的天然存在的氨基酸序列是优选地。
本发明的多肽也可包含SEQ ID NO2的多肽的天然存在的变体或同源种类。
变体是天然存在于如真菌、细菌、酵母或植物细胞的多肽,该变体具有脯氨酸特异性内切蛋白酶活性和与SEQ ID NO2的蛋白质基本相似的序列。术语“变体”指与SEQ ID NO2的脯氨酸特异性内切蛋白酶具有同样的基本特征或基本生物学功能的多肽,且包括等位变体。SEQ ID NO2的脯氨酸特异性内切蛋白酶的基本特征为它是一种能够从蛋白质或(多)肽中切割氨基末端的氨基酸的酶。优选地,变体多肽具有至少与SEQ ID NO2的多肽相同水平的脯氨酸特异性内切蛋白酶活性。变体包括来自与SEQ ID NO2的多肽相同菌株的或者来自相同属或物种的不同菌株的等位变体。
相似地,本发明蛋白质的同系物为具有相似序列的等价蛋白质,它是一种脯氨酸特异性内切蛋白酶且天然存在于曲霉属的其他物种中。
变体和物种同系物(species homologue)可用在此处描述的程序来分离,该程序是用于分离SEQ ID NO2的多肽的,并在适当的细胞来源上实施该程序,如细菌、酵母、真菌或植物细胞。也可能的是用本发明的探针来探测由细菌、酵母、真菌或植物细胞制得的文库以获得表达SEQ ID NO2多肽的变体或物种同系物的克隆。这些克隆可用常规技术操作以生成本发明的多肽,其后该多肽可由已知的重组或合成技术来生产。
也可以修饰SEQ ID NO2的多肽以及变体和物种同系物的序列以提供本发明的多肽。可进行氨基酸替代,如1、2或3至10、20或30个替代。也可以进行相同数量的缺失和插入。这些改变可在多肽功能的重要区域之外进行,因为这样修饰的多肽将保留其脯氨酸特异性内切蛋白酶活性。
本发明的多肽包括上述全长多肽和其变体的片段,包括在SEQID NO2中阐明的序列的片段。这样的片段一般将保留脯氨酸特异性内切蛋白酶的活性。片段可为至少50、100或200氨基酸长或可为达不到在SEQ ID NO2中所示的全长序列的这一数目的氨基酸。
如果必要,本发明的多肽可通过合成方式来生产,尽管通常它们将如下面所述重组地制得。合成的多肽可以进行修饰,如通过添加组氨酸残基或T7标记以有助于其鉴定或纯化,或者通过添加信号序列以促进它们从细胞分泌。
因而,变体序列可包含那些源自曲霉属菌株的,而不是SEQ IDNO2的多肽从中分离的菌株的。可以通过寻找脯氨酸特异性内切蛋白酶活性并如在此处所述地克隆和测序而从其他的曲霉属菌株中鉴定变体。变体可包括蛋白质中单个氨基酸或许多氨基酸的缺失、修饰或添加,只要该肽维持了SEQ ID NO2脯氨酸特异性内切蛋白酶基本的生物功能。
可进行氨基酸替代,如从1、2或3到10、20或30个替代。该修饰的肽将保持脯氨酸特异性内切蛋白酶的活性。可进行保守替代;这样的替代是本领域中所公知的。优选的替代不影响多肽的折叠或活性。
更短的多肽序列是在本发明范围之内的。例如,认为长度至少50个氨基酸或达60、70、80、100、150或200个氨基酸的肽在本发明的范围之内,只要它展示了SEQ ID NO2脯氨酸特异性内切蛋白酶的基本生物学功能。特别地,但不是唯一地,本发明的该方面包含该蛋白质是完全蛋白质序列的片段的情况。
在第二个实施方案中,本发明提供一种具有脯氨酸特异性内切蛋白酶活性的分离的多肽,且由多核苷酸编码,该多核苷酸在低严格性条件下、更优选地为中等严格性条件下且最优选地为高严格性条件下与(i)SEQ ID NO1的核酸序列或者包含至少SEQ ID NO1的c-末端部分但具有少于SEQ ID NO1的全部碱基或含有与其不同的碱基的核酸片段杂交或能够杂交;或与(ii)SEQ ID NO1互补的核酸链杂交或能够杂交。
术语“能够杂交”指本发明的目标多核苷酸可与用作探针的核酸(例如在SEQ ID NO1中阐明的序列或其片段,或SEQ ID NO1的互补体)在显著高于背景的水平上进行杂交。本发明也包含编码本发明的脯氨酸特异性内切蛋白酶的多核苷酸,以及与其互补的核苷酸序列。该核苷酸序列可为RNA或DNA,包括基因组DNA、合成的DNA或cDNA。优选地,该核苷酸序列为DNA且最优选地为基因组DNA序列。一般地,本发明的多核苷酸包含核苷酸的连续序列,其中该核苷酸在选择性条件下能够与SEQ ID NO1的编码序列或编码序列的互补体杂交。这样的核苷酸可根据本领域中公知的方法合成。
本发明的多核苷酸可在显著高于背景的水平上与SEQ ID NO1的编码序列或编码序列的互补体杂交。例如由于cDNA文库中其他cDNA的存在,背景杂交也可发生。由本发明的多核苷酸和SEQ IDNO1的编码序列或编码序列的互补体之间的相互作用生成的信号水平强度一般为其他核苷酸和SEQ ID NO1的编码序列之间相互作用的至少10倍,优选地为至少20倍,更优选地为至少50倍,且更加优选地为至少100倍。相互作用的强度可通过如探针的放射性标记来测量,如用32P。选择性杂交一般可用低严格性的条件(0.3M的氯化钠和0.03M的柠檬酸钠,在约40℃)、中等严格性的条件(例如,0.3M的氯化钠和0.03M的柠檬酸钠,在约50℃)或高严格性的条件(例如,0.3M的氯化钠和0.03M的柠檬酸钠,在约60℃)来实现。
修饰本发明的多核苷酸可包含DNA或RNA。它们可为单链或双链的。它们也可为在其中包含合成的或修饰的核苷酸(包括肽核酸)的多核苷酸。对多核苷酸的许多不同类型的修饰是本领域所公知的。这包括甲基磷酸酯和硫代磷酸酯主链,以及在分子的3’和/或5’末端吖啶或聚赖氨酸链的添加。就本发明而言,应理解在此处描述的多核苷酸可由本领域中任何可用的方法来修饰。
应理解技术人员可用常规技术来进行核苷酸替代而不影响由本发明的多核苷酸编码的多肽序列,以反映任何特定宿主生物的密码使用,其中本发明的多肽是在所述宿主生物中表达的。
SEQ ID NO1的编码序列可用核苷酸替代来修饰,如从1、2或3到10、25、50或100个替代。可通过一种或多种插入和/或缺失和/或通过在两个末端之一或两者的延伸来代替性地或额外地对SEQ IDNO1的多核苷酸进行修饰。修饰的多核苷酸通常编码具有脯氨酸特异性内切蛋白酶活性的多肽。可进行简并的替代和/或进行那些当修饰序列翻译时将导致保守的氨基酸替代的替代,如下文关于多肽的描述。
同系物能够选择性地与SEQ ID NO1的DNA编码序列的互补体杂交的核苷酸序列包括在本发明中,且通常在至少60个,优选地为至少100个,更优选地为至少200个连续核苷酸的区域中或最优选地在SEQ ID NO1的全长上与SEQ ID NO1的编码序列具有至少50%或60%的,至少70%的,至少80%的,至少90%的,至少95%的,至少98%的或至少99%的序列一致性。同样地,编码活性脯氨酸特异性内切蛋白酶且能够选择性地与SEQ ID NO1的DNA编码序列的互补体片段杂交的核苷酸也包含在本发明中。SEQ ID NO1的核酸序列的C-末端片段包含在本发明中,它在60个,优选地为100个核苷酸上为至少80%或90%一致的,更优选地为在200个核苷酸上是至少90%一致的。
上述一致性程度和最小大小的任何组合都可用于定义本发明的多核苷酸,其中更严格的组合(即在更长长度上具有更高的一致性的)是优选的。因而,例如在60个,优选地为100个核苷酸上为至少80%或90%一致的核苷酸构成了本发明的一个方面,在200个核苷酸上为至少90%一致的核苷酸也一样构成本发明的一个方面。
UWGCG Package提供了可用于计算一致性的BESTFIT程序(例如以其缺省设置应用)。
PILEUP和BLAST N算法也可用于计算序列一致性或比对序列(例如以其缺省设置来鉴定相当的或相应的序列)。
进行BLAST分析的软件是通过国家生物技术信息中心公共可用的(http//www.ncbi.nlm.nih.gov/)。该算法包括首先通过鉴定所查询序列中长度W的短字串来鉴定高分值的序列对(HSPs),其中当与数据库中相同长度的字串比对时,该短字串或者匹配或者满足一些正值的阈值分数T。T被称为邻近字串的阈值。这些初始邻近命中字串(word hit)作为种子开始搜索以发现包含它们的HSPs。将命中字串沿每个序列在两个方向延伸以使累积的比对分值增加。每个方向上命中字串的延伸在遇到如下情况时就停止,即当累积的比对分数以量X从其最大所得值下降时;由于一个或多个负分值残基比对的累积,累积的分数变为0或低于0时;或者当到达任一序列的末端时。BLAST算法的参数W、T和X确定了比对的灵敏度和速度。BLAST程序用字长(W)为11、BLOSUM62分值矩阵比对(B)为50、期望(E)为10、M=5、N=4和对两条链的比对作为缺省值。
BLAST算法进行了两个序列间相似性的统计分析。由BLAST算法提供的一个相似性测量为最小概率和(smallest sumprobability)(P(N)),它提供了对两个核苷酸或氨基酸序列之间的匹配偶然发生的概率的指示。例如,如果第一个序列和第二个序列比较中的最小概率和小于约1,优选地为小于约0.1,更优选地为小于约0.01且最优选地为小于约0.001,则可认为该序列与另一个序列相似。
引物和探针本发明的多核苷酸包括引物,并且也可被用作引物,如聚合酶链反应(PCR)引物,如用于交替扩增反应(alternativeamplification reactions)的引物,或用作以常规方法用放射性或非放射性标记(例如以显示性标记)进行了标记的探针,或者多核苷酸可以克隆入载体。这样的引物、探针和其他片段长度至少为15个核苷酸,如至少20、25、30或40个核苷酸。它们一般长度达40、50、60、70、100、150、200或300个核苷酸,或甚至达到比SEQ IDNO1短几个核苷酸(如5或10个核苷酸)。
通常,引物将以合成方式制备,包括每次一个核苷酸地逐步加工想要的核酸序列。用自动的规程实现该目的的技术是本领域中容易得到的。较长的多核苷酸通常将用重组方法生产,例如用PCR克隆技术。这将包括构造一对引物(一般约15-30个核苷酸)来扩增要克隆的脯氨酸特异性内切蛋白酶的想要区域,使该引物与从酵母、细菌、植物、原核或真菌细胞,优选地为曲霉属菌株中获得的mRNA、cDNA或基因组DNA接触,在适于扩增想要区域的条件下进行聚合酶链反应,分离扩增的片段(如通过在琼脂糖凝胶上纯化反应混合物)及回收扩增的DNA。该引物可设计为含有适当的限制性内切酶识别位点以使得扩增的DNA可被克隆入适当的克隆载体。
这样的技术可被用于获得编码在此处描述的脯氨酸特异性内切蛋白酶序列的多核苷酸的全长或一部分。内含子、启动子和尾区(tailer region)在本发明的范围之内,且也可以从来自真菌、酵母、细菌、植物或原核细胞的基因组DNA开始,用类似的方式获得(例如通过重组方法、PCR或克隆技术)。
多核苷酸或引物可含有显示性标记。适当的标记包括放射性同位素如32P或35S,酶标记或其他蛋白质标记如生物素。这样的标记可添加到本发明的多核苷酸或引物中并且用本领域技术人员公知的技术探测。
标记的或未标记的多核苷酸或引物(或其片段)可用于基于核酸的检验中以在真菌样品中对脯氨酸特异性内切蛋白酶或其变体进行探测或测序。这样的探测通常包含使怀疑含有目的DNA的真菌样品与含有本发明的多核苷酸或引物的探针在杂交条件下接触,并且探测在探针和样品中核酸之间形成的任何双链体。探测可以用如PCR的技术来实现,或者通过将探针固定在固体支持体上,去除样品中不与探针杂交的任何核酸,然后探测任何与探针杂交的核酸来实现。可选择地,可将样品核酸固定在固体支持体上,用探针进行杂交,然后将任何未结合的探针去除后探测结合到这样的支持体上的探针量。
本发明的探针可方便地以检验试剂盒的形式包装在适当的容器中。在这样的试剂盒中,探针可以结合到固体支持体上,如果该试剂盒所设计的测定形式需要这样的结合。该试剂盒也可包含适当的用以处理要探测的样品和将探针与样品中的核酸杂交的试剂、对照试剂、说明书等。本发明的探针和多核苷酸也可用于微量测定。
优选地,本发明的多核苷酸可从与多肽来源相同的生物中获得,如真菌,具体而言地为曲霉属的真菌。
本发明的多核苷酸也包括编码具有脯氨酸特异性内切蛋白酶活性的多肽的SEQ ID NO1序列的变体。变体可通过添加、替代和/或缺失来形成。SEQ ID NO1编码序列的这样的变体可因而编码具有在脯氨酸的羧基末端一侧消化多肽链的能力的多肽。
多核苷酸的生产与SEQ ID NO1不具有100%的一致性但在本发明范围之内的多核苷酸可通过许多途径获得。因而,此处所描述的脯氨酸特异性内切蛋白酶序列的变体可通过如探测由一些生物制备的基因组DNA文库而获得,如那些作为本发明的多肽来源的生物。另外,可获得脯氨酸特异性内切蛋白酶的其他真菌、植物或原核生物的同系物,且这样的同系物及其片段通常能够与SEQ ID NO1杂交。这样的序列可以通过探测来自其他物种的cDNA文库或基因组DNA文库,及用包含SEQ IDNO1的所有或一部分的探针在低、中到高严格性的条件下(如前文所述)探测这样的文库而获得。包含SEQ ID NO1的所有或一部分的核酸探针可用于探测来自其他物种的cDNA文库或基因组文库,如那些作为本发明的多肽来源的生物。
物种同系物也可用简并PCR获得,该PCR使用针对编码保守的氨基酸序列的变体和同系物中的序列而设计的引物。该引物可含有一个或多个简并位置,且将在比那些以针对已知序列的单一序列引物克隆序列时低的严格性条件下使用。
可选择地,这样的多核苷酸可通过脯氨酸特异性内切蛋白酶序列或其片段的定点诱变而获得。这在例如需要对序列进行沉默密码子改变以使特定宿主细胞的密码子偏爱性最适化的情况下是有用的,其中多核苷酸序列是表达于所述特定宿主细胞中的。可进行其他的序列改变以引入限制性内切酶识别位点,或者改变由多核苷酸编码的多肽的性质或功能。
本发明包括包含本发明的多核苷酸及其互补体的双链多核苷酸。
本发明也提供了编码上述本发明的多肽的多核苷酸。由于这样的多核苷酸将可用作进行本发明多肽的重组生产的序列,所以它们不必要能够与SEQ ID NO1的序列杂交,尽管这一般是期望的。另外,如果需要,这样的多核苷酸可如上所述进行标记、使用并制备。
重组多核苷酸本发明也提供了包含本发明的多核苷酸的载体,包括克隆和表达载体以及另一方面使这样的载体生长、转化或转染入适当的宿主细胞的方法,例如在本发明的多肽或由本发明的序列编码的多肽能表达的条件下。也提供的是包含本发明的多核苷酸或载体的宿主细胞,其中多核苷酸对于宿主细胞的基因组是异源的。通常关于宿主细胞的术语“异源的”指多核苷酸不是天然存在于宿主细胞的基因组中的或该多肽不是由该细胞天然生产的。优选地,该宿主细胞是酵母细胞如克鲁维氏酵母属或糖酵母属的酵母细胞,或者是丝状真菌细胞如曲霉属的。
本发明的多核苷酸可整合到重组复制型载体上,如克隆或表达载体。该载体可用于在相容的宿主细胞中复制该核酸。因而,在进一步的实施方案中,本发明提供了制备本发明的多核苷酸的方法,即将本发明的多核苷酸引入复制型载体中,将该载体引入相容的宿主细胞,并在载体能复制的条件下使宿主细胞生长。载体可从宿主细胞中回收。适当的宿主细胞连同表达载体一起在下文描述。
载体本发明的表达盒所插入的载体可为任何可方便地进行重组DNA程序操作的载体,且对载体的选择常依赖于其要引入的宿主细胞。因而,该载体可为自主复制载体,即作为染色体外实体存在的载体,其复制不依赖于染色体的复制,如质粒。可选择地,该载体可为一个当引入到宿主细胞中后,可以整合入宿主细胞基因组并与它所整合的染色体一起复制的载体。
优选地,当本发明的多核苷酸在载体中时,可将它可操作性地连接到调节序列上,该调节序列能够提供编码序列在宿主细胞中的表达,即该载体为表达载体。术语“可操作性地连接的”指并列(juxtaposition),其中描述的成分是处于允许其以预定方式发挥功能的关系的。“可操作性地连接”到编码序列上的调节序列如启动子、增强子或其他表达调节信号是以这样的方式放置的,即使得编码序列的表达可在与控制序列相容的条件下实现。
如在质粒、粘粒、病毒或噬菌体载体的情况下,载体可具有复制起点、可选择的多核苷酸表达的启动子和可选择的增强子和/或启动子的调节基因。可存在终止子序列,如可为聚腺苷酸化序列。该载体可包含一种或多种选择性标记基因,如细菌质粒情况下的氨苄青霉素抗性基因或哺乳动物载体情况下的新霉素抗性基因。载体可在体外使用,如进行RNA的生产,或者可用于转染或转化宿主细胞。
编码多肽的DNA序列优选地是作为表达构建体的部分而引入到适当的宿主细胞中的,其中DNA序列可操作地连接到表达信号上,该信号能够指导DNA序列在宿主细胞中的表达。对于用表达构建体对适当宿主的转化,技术人员所公知的转化程序是可用的。该表达构建体可用作含有选择性标记的载体的部分而转化宿主,或者该表达构建体是作为单独的分子与含有选择性标记的载体一起共转化的。该载体可含有一种或多种选择性标记基因。
优选的选择性标记包括但不局限于那些补充了宿主中缺陷的或给于对药物的抗性的。它们包括,例如可用于对大多数丝状真菌和酵母进行转化的标记基因如乙酰胺酶基因或cDNA(amdS、niaD、facA基因或来自构巢曲霉(A.nidulans)、米曲霉或黑曲霉的cDNAs),或者提供对抗生素如G418、潮霉素、博来霉素、卡那霉素、腐草霉素或苯菌灵抗性(benA)的基因。可选择地,可用到特定的选择性标记如营养缺陷型标记,该标记需要相应的突变型宿主菌株例如,URA3(来自啤酒糖酵母(S.cerevisiae)或来自其他酵母的类似基因)、pyrG或pyrA(来自构巢曲霉或黑曲霉)、argB(来自构巢曲霉或黑曲霉)或trpC。在一个优选实施方案中,选择性标记是在表达构建体引入之后从转化的宿主细胞中去除的,以获得能够生产无选择性标记基因的多肽的转化宿主。
其他的标记包括ATP合成酶亚基9(oliC)、乳清酸核苷-5’-磷酸脱羧酶(pvrA)、细菌G418抗性基因(在酵母中是有用的,但不能用于丝状真菌)、氨苄青霉素抗性基因(大肠杆菌)、新霉素抗性基因(芽孢杆菌属)和编码葡糖醛酸糖苷酶(GUS)的大肠杆菌uidA基因。载体可用于体外,如用于生产RNA或转染或转化宿主细胞。
对于大多数丝状真菌和酵母,表达构建体优选地整合入宿主细胞的基因组中以获得稳定的转化体。然而,对于某些酵母,适当的附加型载体系统也是可用的,在其中可整合表达构建体以进行稳定和高水平的表达。其例子包括分别源自糖酵母属和克鲁维氏酵母属的2μm的CEN和pKD1质粒的载体,或者含有AMA序列(例如来自曲霉属的AMA1)的载体。当表达构建体整合入宿主细胞基因组中时,构建体可以整合入基因组中的随机座位,或者通过同源重组整合入预定的目标座位,在后者的情况下目标座位优选地包含高度表达的基因。高度表达的基因是其mRNA可组成总细胞mRNA的至少0.01%(w/w)的基因,如在诱导的条件下,或者可选择地,是其基因产物可组成总细胞蛋白质的至少0.2%(w/w)的基因,或者在分泌基因产物的情况下,其基因产物可在至少0.05g/l的水平分泌的基因。
给定宿主细胞的表达构建体将通常含有如下的元件,这些元件相对于编码第一方面的多肽的序列的编码链而言,从5’端到3’端以连续的顺序相互可操作地连接(1)能够在给定的宿主细胞中指导编码多肽的DNA序列转录的启动子序列,(2)优选地,5’-非翻译区(前导区),(3)可选择地,能够指导多肽从给定的宿主细胞向培养基中分泌的信号序列,(4)编码成熟的多肽和(优选地)多肽的活性形式的DNA序列,和同样优选地(5)能够在编码多肽的DNA序列下游终止转录的转录终止区(终止子)。
在编码多肽的DNA序列下游,表达构建体优选地含有3’-非翻译区,该区含有一个或多个转录终止位点,也称为终止子。终止子的来源不是关键的。例如终止子可为编码多肽的DNA序列所固有的。然而,优选的是,酵母终止子用于酵母宿主细胞而丝状真菌终止子用于丝状真菌宿主细胞。更优选地,终止子对于表达编码多肽的DNA序列的宿主细胞是内源的。
编码本发明的多肽的多核苷酸的增强表达也可通过选择异源的调节区而实现,例如启动子、信号序列和终止子区,它们起增加表达和(如果需要)增加目标蛋白质从选择的表达宿主中分泌的作用,和/或起提供对本发明的多肽表达进行诱导性控制的作用。
除编码本发明的多肽的基因所固有的启动子之外,可用其他的启动子来指导本发明的多肽的表达。该启动子可根据其在想要的表达宿主中指导本发明的多肽表达的效率而选择。
可选择启动子/增强子和其他表达调节信号以与宿主细胞相容,其中,表达载体是为所述宿主细胞设计的。例如可以使用原核启动子,具体而言地为那些适用于大肠杆菌菌株的。当本发明多肽的表达是在哺乳动物细胞中实现时,可使用哺乳动物的启动子。也可使用组织特异性启动子,如肝细胞特异性启动子。也可使用病毒启动子,如莫洛尼鼠类白血病毒(Moloney murine leukaemia virus)长末端重复序列(MMLV LTR)、劳斯肉瘤病毒(rous sarcoma virus)(RSV)LTR启动子、SV40启动子、人巨细胞病毒(humancytomegalovirus)(CMV)IE启动子、单纯疱疹病毒(herpessimplex virus)启动子或腺病毒(adenovirus)启动子。
适当的酵母启动子包括啤酒糖酵母的GAL4和ADH启动子和S.pombe的nmt1和adh启动子。哺乳动物启动子包括可响应于重金属如镉而被诱导的金属硫蛋白启动子。也可使用病毒启动子如SV40大T抗原启动子或腺病毒启动子。所有这些启动子都是本领域容易得到的。
可使用哺乳动物启动子如β-肌动蛋白启动子。组织特异性启动子,具体而言地为内皮或神经元细胞特异性启动子(如DDAH I和DDAH II启动子)是尤其优选的。也可使用病毒启动子,如莫洛尼鼠类白血病毒长末端重复序列(MMLV LTR)、劳斯肉瘤病毒(RSV)LTR启动子、SV40启动子、人巨细胞病毒(CMV)IE启动子、腺病毒、HSV启动子(如HSV IE启动子)或HPV启动子,特别是HPV的上游调节区(URR)。病毒启动子是本领域容易得到的。
可使用各种能够在本发明的宿主细胞中指导转录的启动子。优选地该启动子源自前述高度表达的基因。优选的高度表达的基因(其中启动子优选地源自该基因和/或该基因优选地包含在用以整合表达构建体的预定的目标座位中)的例子包含但不局限于编码糖酵解酶的基因,如丙糖磷酸异构酶(TPI)、甘油醛磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶(PGK)、丙酮酸激酶(PYK)、醇脱氢酶(ADH),以及编码淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、纤维二糖水解酶、β-半乳糖苷酶、醇(甲醇)氧化酶、延伸因子和核糖体蛋白质的基因。适当的高度表达基因的特定例子包括如来自克鲁维氏酵母属物种的LAC4基因、分别来自汉逊氏酵母属(Hansenula)和毕赤氏酵母属(Pichia)的甲醇氧化酶基因(AOX和MOX)、来自黑曲霉和泡盛曲霉(A.awamori)的葡糖淀粉酶(glaA)基因、米曲霉的TAKA-淀粉酶基因、构巢曲霉的gpdA基因和T.reesei的纤维二糖水解酶基因。
优选地用于真菌表达宿主的强组成型和/或诱导型启动子的例子为那些可获得自真菌基因的启动子,如木聚糖酶(xlnA)、肌醇六磷酸酶、ATP-合成酶亚基9(oliC)、丙糖磷酸异构酶(tpi)、醇脱氢酶(AdhA)、淀粉酶(amy)、淀粉葡糖苷酶(AG——来自glaA基因)、乙酰胺酶(amdS)和甘油醛磷酸脱氢酶(gpd)的启动子。
可用的强酵母启动子的例子包括那些可获得自醇脱氢酶、乳糖酶、3-磷酸甘油酸激酶和丙糖磷酸异构酶基因的启动子。
可用的强细菌启动子的例子包括淀粉酶和SPo2启动子以及来自细胞外蛋白酶基因的启动子。
可用的适合于植物细胞的启动子包括胭脂碱(napaline)合成酶(nos)、章鱼氨酸合成酶(ocs)、甘露氨酸合成酶(mas)、核酮酶小亚基(rubisco ssu)、组蛋白、水稻肌动蛋白、菜豆蛋白、花椰菜花叶病毒(CMV)的35S和19S及circovirus启动子。
该载体可进一步包括产生RNA的多核苷酸的侧翼序列,该侧翼序列包含与真核基因组序列同源的序列,其中的真核基因组序列优选地为哺乳动物基因组序列或病毒基因组序列。这将使得能将本发明的多核苷酸通过同源重组引入到真核细胞或病毒的基因组中。具体而言地,包含侧翼连接了病毒序列的表达盒的质粒载体可用于制备适用于将本发明的多核苷酸送递到哺乳动物细胞中的病毒载体。其他适当的病毒载体的例子包括单纯疱疹病毒载体和反转录病毒,包括慢病毒属、腺病毒、腺伴随病毒和HPV病毒(如HPV-16或HPV-18)。利用这些病毒的基因转移技术是本领域技术人员所公知的。例如,反转录病毒载体可用于稳定地将能产生反义RNA的多核苷酸整合入宿主基因组。相反地,复制缺陷型腺病毒载体是游离的,因此使得能瞬时表达。
载体含有反义方向的本发明的多核苷酸以提供反义RNA的产生。如果需要,这将用于降低该多肽的表达水平。
宿主细胞和表达在进一步的方面中,本发明提供了制备本发明的多肽的方法,这包括培养用上述表达载体转化或转染的宿主细胞,培养在适合于由该载体表达编码多肽的编码序列的条件下进行,及回收表达的多肽。本发明的多核苷酸可插入到重组复制型载体上,如表达载体。该载体可用于在相容的宿主细胞中复制该核酸。因而在进一步的实施方案中,本发明提供了制备本发明的多核苷酸的方法,即将本发明的多核苷酸引入到复制型载体中,将该载体引入到相容的宿主细胞中,以及在使得载体复制的条件下使宿主细胞生长。该载体可从宿主细胞中回收。适当的宿主细胞包括细菌如大肠杆菌、酵母、哺乳动物细胞系和其他的真核细胞系,如昆虫细胞如Sf9细胞和(如丝状)真菌细胞。
该多肽优选地是作为分泌蛋白质而生产的,在此情况下,在表达构建体中编码多肽的成熟形式的DNA序列是可操作地与编码信号序列的DNA序列连接的。在编码分泌蛋白质的基因在其野生型菌株中具有信号序列的情况下,所用信号序列对于编码多肽的DNA序列优选地为固有的(同源的)。可选择地,该信号序列对于编码多肽的DNA序列为外源的(异源的),在此情况下,该信号序列对于DNA序列在其中表达的宿主细胞优选地是内源的。对于酵母细胞适当的信号序列的例子为源自酵母MFalpha基因的信号序列。相似地,对于丝状真菌宿主细胞适当的信号序列为如源自丝状真菌淀粉葡糖苷酶(AG)基因如黑曲霉glaA基因的信号序列。该信号序列可与淀粉葡糖苷酶(也称为葡糖淀粉酶)启动子组合使用,以及与其他的启动子组合使用。在本发明的范围内也可使用杂交的信号序列。
优选的异源分泌前导序列为那些来源于真菌淀粉葡糖苷酶(AG)基因(glaA-18个和24个氨基酸两种形式,如来自曲霉属的)、MFalpha基因(酵母,如糖酵母属和克鲁维氏酵母属)或α-淀粉酶基因(芽孢杆菌属)。
该载体可如上所述转化或转染入适当的宿主细胞以提供本发明的多肽的表达。该方法可包含在适合于多肽表达的条件下培养用如上所述的表达载体转化的宿主细胞,及可选择地回收表达的多肽。
因而本发明进一步的方面提供了用本发明的多核苷酸或载体转化或转染或者包含该多核苷酸或载体的宿主细胞。该多核苷酸优选地是在使得该多核苷酸能复制和表达的载体中携带的。该细胞将选择为与该载体相容的,且可为如原核细胞(如细菌),或真核的真菌、酵母或植物细胞。
本发明包含通过编码多肽的DNA序列的重组表达来生产本发明的多肽的方法。为此目的,为了使得能在适当的同源或异源宿主细胞中经济地生产多肽,本发明的DNA序列可用于基因扩增和/或表达信号如启动子、分泌信号序列的交换。同源的宿主细胞在此处定义为与DNA序列所衍生的物种是相同物种的或为相同物种的变体的宿主细胞。
适当的宿主细胞优选地为原核生物如细菌,或者更优选地为真核生物,如真菌如酵母或丝状真菌或者植物细胞。通常,酵母细胞因为其更容易操作而比丝状真菌细胞优选。然而,一些蛋白质或者从酵母中很难分泌,或者在一些情况下没有适当地加工(例如酵母中的过糖基化(hyperglycosylation))。在这些情况下,应该选择丝状真菌宿主生物。
来自芽孢杆菌属的细菌由于其向培养基中分泌蛋白质的能力而非常适合于做异源的宿主。其他适合于做宿主的细菌是那些来自链霉菌属(Streptomyces)和假单胞菌属(Pseudomonas)的。用于编码多肽的DNA序列表达的优选酵母宿主细胞为糖酵母属、克鲁维氏酵母属、汉逊氏酵母属、毕赤氏酵母属、Yarrowia或裂殖糖酵母属中之一。更优选地,酵母宿主细胞选自啤酒糖酵母、乳克鲁维氏酵母(Kluyveromyces lactis)(也称为马克斯克鲁维氏酵母乳酸变种(Kluyveromyces marxianus var.lactis)、多形汉逊氏酵母(Hansenula polymorpha)、巴斯德毕赤氏酵母(Pichiapastoris)、Yarrowia lipolytica和粟酒裂殖糖酵母(Schizosaccharomyces pombe)。
然而表达编码多肽的DNA序列的最优选的宿主细胞为丝状真菌宿主细胞。优选地丝状真菌宿主细胞选自曲霉属、木霉属(Trichoderma)、镰孢属(Fusarium)、Disporotrichum、青霉属(Penicillium)、支顶孢属(Acremonium)、脉孢菌属(Neurospora)、热子囊菌属(Thermoascus )、毁丝霉属(Myceliophtora)、孢子丝菌属(Sporotrichum)、草根霉属(Thielavia)和踝节菌属(Talaromyces)。更优选地丝状真菌宿主细胞是米曲霉、酱油曲霉(Aspergillus sojae)或构巢曲霉或是来自黑曲霉类群(如由Raper和Fennell所定义,The GenusAspergillus,The Williams & Wilkins Company,Baltimore,pp293-344,1965)的物种。这些包括但不局限于黑曲霉、泡盛曲霉、塔宾曲霉(Aspergillus tubigensis)、棘孢曲霉(Aspergillusaculeatus)、臭曲霉(Aspergillus foetidus)、构巢曲霉、日本曲霉(Aspergillus japonicus)、米曲霉和无花果曲霉(Aspergillus ficuum),以及Trichoderma reesei、禾谷镰孢(Fusarium graminearum)、产黄青霉(Penicilliumchrysogenum)、Acremonium alabamense、粗糙链孢菌(Neurospora crassa)、Myceliophtora thermophilum、Sporotrichum cellulophilum、Disporotrichum dimorphosporum如Thielavia terrestris。
在本发明的范围内优选的表达宿主的例子为真菌如曲霉属物种(具体而言地为那些描述于EP-A-184,438和EP-A-284,603中的)和木霉属物种;细菌如芽孢杆菌属物种(具体而言地为那些描述于EP-A-134,048和EP-A-253,455中的),尤其是枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、假单胞菌属物种;和酵母如克鲁维氏酵母属物种(具体而言地为那些描述于EP-A-096,430中的如乳克鲁维氏酵母和EP-A-301,670中的)及糖酵母属物种,如啤酒糖酵母。
根据本发明的宿主细胞包括植物细胞,且本发明因而延伸至转基因生物,如植物及其部分,所述生物包含一种或多种本发明的细胞。该细胞可异源地表达本发明的多肽或可异源地含有一种或多种本发明的多核苷酸。因此转基因(或基因修饰的)植物可在其基因组中插入了(一般是稳定地)编码本发明多肽的序列。植物细胞的转化可用已知的技术进行,例如使用来自根癌土壤杆菌(Agrobacteriumtumefaciens)的Ti或Ri质粒。质粒(或载体)因此可以含有感染植物必需的序列,且可采用Ti和/或Ri质粒的衍生物。
宿主细胞可使多肽过表达,且过表达工程的技术是众所周知的并被用于本发明。因而宿主可具有两个或多个多核苷酸的拷贝。
可选择地,植物的部分如叶、根或茎的直接感染可为有效的。在该技术中,可损伤要感染的植物,如用剃刀切割植物、用针穿刺植物或者用研磨剂摩擦植物。然后用土壤杆菌在伤口接种。植物或植物部分然后生长在适当的培养基上并使得能发育为成熟植物。将转化细胞再生成遗传修饰的植物可用已知的技术来实现,如用抗生素来选择转化的苗,或者将苗在含有适当的营养物、植物激素等的培养基上传代培养。
宿主细胞的培养和重组体生产本发明也包括进行修饰以表达脯氨酸特异性内切蛋白酶或其变体的细胞。这样的细胞包括瞬时修饰的,或优选地稳定修饰的高等真核细胞系如哺乳动物细胞或昆虫细胞,低等真核细胞如酵母和丝状真菌细胞,或原核细胞如细菌细胞。
本发明的多肽也可能瞬时地表达于细胞系中或细胞膜上,如在杆状病毒表达系统中。此类适合于表达本发明的蛋白质的系统也包括在本发明的范围之内。
根据本发明,本发明多肽的生产可通过在常规的营养物发酵培养基中培养微生物表达宿主而实现,该宿主已用本发明的一种或多种多核苷酸进行了转化。
根据本发明的重组宿主细胞可用本领域公知的程序培养。对于启动子和宿主细胞的每一个组合,能够使编码多肽的DNA序列表达的培养条件是可得的。在达到想要的细胞密度或多肽的效价后,停止培养且用已知的程序回收多肽。
发酵培养基可包含公知的培养基,所述公知的培养基含有碳源(如葡萄糖、麦芽糖、糖蜜等)、氮源(如硫酸铵、硝酸铵、氯化铵等)、有机氮源(如酵母提取物、麦芽提取物、蛋白胨等)和无机营养物源(如磷酸、镁、钾、锌、铁等)。可选择地,可包含或随后添加诱导物(依赖于所用的表达构建体)。
适当的培养基的选择可基于表达宿主的选择和/或基于表达构建体的调节要求。适当的培养基是本领域技术人员所公知的。如果需要,该培养基可含有相对于潜在的污染微生物对转化的表达宿主更有益的额外成分。
该发酵可进行0.5-30天。发酵可为在0℃~45℃的适当温度和如pH2~10时的分批的、连续的或补料分批的方法。优选的发酵条件包括20℃~37℃的温度和/或3~9的pH。适当的条件通常是基于表达宿主和要表达的蛋白质的选择而选择的。
发酵后,如果必需,可通过离心或过滤的方法将细胞从发酵液体培养基中去除。在发酵停止后或去除细胞后,本发明的多肽即可回收并且如果需要,可用常规方法纯化和分离。本发明的脯氨酸特异性内切蛋白酶可从真菌菌丝体或者从培养物的液体培养基中纯化,其中脯氨酸特异性内切蛋白酶是由培养的真菌细胞释放到该液体培养基中的。
在一个优选的实施方案中,多肽是从真菌中获得的,更优选地为从曲霉属,最优选地为从黑曲霉。
修饰本发明的多肽可进行化学修饰,如翻译后的修饰。例如,它们可糖基化(一次或多次)或包含修饰的氨基酸残基。它们也可通过添加组氨酸残基来修饰以有助于其纯化或通过添加信号序列来修饰以促进从细胞的分泌。该多肽可具有氨基-或羧基末端的延长,如氨基末端的甲硫氨酸残基,至多约20-25个残基的小连接体肽,或促进纯化的小的延长,如聚组氨酸序列、抗原性表位或结合结构域。
本发明的多肽可用显示性标记进行标记。该显示性标记可为任何使得该多肽能被探测的适当标记。适当的标记包括放射性同位素如125I、35S,酶,抗体,多核苷酸和连接体如生物素。
可修饰该多肽以使其包括非天然存在的氨基酸或增加该多肽的稳定性。当蛋白质或多肽是以合成方法生产时,这样的氨基酸可在生产中引入。该蛋白质或多肽也可在合成或重组生产后被修饰。
本发明的多肽也可用D-氨基酸来生产。在这样的情况下,氨基酸将从C到N方向以相反的顺序来连接。对于生产这样的蛋白质或多肽,这在本领域中是常规的。
许多侧链修饰是本领域公知的且可应用于本发明的蛋白质或肽的侧链。这样的修饰包括如与醛反应然后用NaBH4还原,从而通过还原性烷基取代对氨基酸进行修饰;用亚氨乙酸甲酯的酰胺化或用乙酸酐的酰化。
本发明提供的序列也可用作起始材料以进行“第二代”酶的构建。“第二代”脯氨酸特异性蛋白酶是用诱变技术(如定点诱变)而改变的脯氨酸特异性蛋白酶,其具有与那些野生型脯氨酸特异性蛋白酶或重组脯氨酸特异性蛋白酶(如那些本发明所生产的)不同的性质。例如,它们的温度或pH最适值、特定的活性、底物亲和力或热稳定性可进行改变以更好地适用于特殊的方法。
对本发明的脯氨酸特异性蛋白酶的活性是基本的且因而优选地进行替代的氨基酸可根据本领域公知的程序来鉴定,如定点诱变或丙氨酸扫描诱变(alanine-scanning mutagenesis)。在后一种技术中,突变是在分子中的每一个残基上引入的,且对结果所得的突变分子进行生物学活性(如脯氨酸特异性内切蛋白酶活性)检验以鉴定对分子活性关键的氨基酸残基。酶-底物相互作用位点也可通过晶体结构分析来确定,其中的晶体结构是用如核磁共振、晶体学和光亲和标记的技术来确定的。
预期使用酵母和丝状真菌宿主细胞以提供这样的翻译后修饰(如蛋白水解加工、十四烷基化(myristilation)、糖基化、截短和酪氨酸、丝氨酸或苏氨酸的磷酸化),以给本发明的重组表达产物提供最适的生物学活性。
制剂本发明的多肽可为分离的形式。应理解该多肽可与不干扰该多肽的预期目的的载体或稀释剂混合而仍然被认为是分离的。本发明的多肽也可为基本纯化的形式,在该情况下通常在制剂中含有多肽,在所述制剂中超过70%的多肽,例如超过80%、90%、95%、98%或99%的蛋白质是本发明的多肽。
本发明的多肽可以以在其天然的细胞环境之外的形式提供。因而,它们可为如上所述基本分离或纯化的,或者处于它们天然地不存在的细胞中,例如其他的真菌物种、动物、植物或细菌的细胞。
脯氨酸特异性内切蛋白酶活性的去除或减少本发明也涉及生产亲代细胞的突变细胞的方法,这包括将编码多肽的内源核酸序列或其控制序列破坏或去除,从而导致比亲代细胞生产较少的多肽的突变细胞。
具有减少的脯氨酸特异性内切蛋白酶活性的品系的构建可方便地通过细胞内脯氨酸特异性内切蛋白酶表达所必需的核酸序列的修饰或失活来实现。要修饰或失活的核酸序列可为,例如对于显示脯氨酸特异性内切蛋白酶活性是基本的编码多肽或其部分的核酸序列,或者具有调节功能的核酸序列,所述功能对从核酸序列的编码序列表达多肽是必需的。这样的调节或控制序列的例子为启动子序列或其功能部分,即足够影响多肽表达的部分。其他可能进行修饰的控制序列包括,但不局限于前导序列、聚腺苷酸化序列、前肽、信号序列和终止序列。
核酸序列的修饰或失活可通过将细胞进行诱变并选择其中脯氨酸特异性内切蛋白酶的生产能力已经减少或消除的细胞而实现。该特异性或随机的诱变可通过如使用适当的物理或化学诱变剂、通过使用适当的寡核苷酸或通过将DNA序列进行PCR诱变而实现。此外,该诱变可通过使用这些诱变剂的任意组合来实现。
适用于本目的的物理或化学诱变剂的例子包括紫外线(UV)辐射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,诱变一般是通过在适当的条件下在选定的诱变剂存在时温育要诱变的细胞,并且选择显示减少的或不表达脯氨酸特异性内切蛋白酶活性的细胞而实现的。
本发明多肽的生产的修饰或失活可通过在编码该多肽的核酸序列或其转录或翻译所必需的调节元件中引入、替代或去除一个或多个核苷酸而实现。例如,可插入或去除核苷酸以导致终止密码子的引入、起始密码子的去除或可读框的改变。这样的修饰或失活可通过依照本领域公知方法的定点诱变或PCR诱变来实现。
尽管原则上该修饰可在体内进行,即直接在表达要修饰的核酸序列的细胞上进行,但该修饰优选地应如下文所说明地在体外进行。
使选择的宿主细胞的脯氨酸特异性内切蛋白酶的生产失活或减少的方便途径的例子是基于基因置换或基因中断(geneinterruption)技术的。例如,在基因中断方法中,相应于内源的目标基因或基因片段的核酸序列可在体外诱变以生产缺陷的核酸序列,然后将该序列转化入宿主细胞以生产缺陷基因。通过同源重组,该缺陷的核酸序列置换了内源的基因或基因片段。该缺陷基因或基因片段优选地也编码可用于选择转化体的标记,在该转化体中编码多肽的基因已被修饰或破坏了。
可选择地,对编码本发明的多肽的核酸序列的修饰或失活可通过已建立的使用与多肽编码序列互补的核苷酸序列的反义技术来实现。更特定地,细胞的多肽生产可通过引入与编码该多肽的核酸序列互补的核苷酸序列来减少或消除。该反义多核苷酸于是一般在细胞内转录并将能够与编码脯氨酸特异性内切蛋白酶的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,细胞内生产的脯氨酸特异性内切蛋白酶的量将减少或消除。
依照本发明的方法要修饰的细胞优选地为微生物来源的,如适合于生产想要的蛋白质产物的真菌菌株,该蛋白质产物与细胞同源或者异源。
本发明进一步涉及亲代细胞的突变细胞,它包含编码多肽或其控制序列的内源核酸序列的破坏或删除,这导致突变的细胞生产比亲代细胞少的多肽。
这样产生的多肽缺陷型细胞特别适用于作为表达同源和/或异源多肽的宿主细胞。因此,本发明进一步涉及生产同源或异源多肽的方法,这包括(a)在利于多肽生产的条件下培养突变细胞;和(b)回收该多肽。在本发明的范围内,术语“异源多肽”在此处定义为不是宿主细胞所固有的多肽、在其中已经进行修饰以改变固有序列的天然蛋白质或者通过重组DNA技术对宿主细胞操作而产生的其表达量改变的天然蛋白质。
在更进一步的方面中,本发明提供了通过细胞发酵来生产基本上无脯氨酸特异性内切蛋白酶活性的蛋白质产物的方法,其中所述细胞能生产本发明的脯氨酸特异性内切蛋白酶多肽及目标蛋白质产物两者。该方法包含在发酵期间或结束之后向发酵液体培养基中添加有效量的能够抑制脯氨酸特异性内切蛋白酶活性的试剂、从发酵液体培养基中回收目标产物及可选择地将回收产物进行进一步的纯化。可选择地,在培养之后,可对结果所得的液体培养基进行pH或温度处理以基本上减少脯氨酸特异性内切蛋白酶活性,并使得能从液体培养基中回收产物。组合的pH或温度处理可对从液体培养基中回收的蛋白质制剂进行。
本发明制备基本无脯氨酸特异性内切蛋白酶的方法在真核多肽的生产中是特别重要的,特别是在真菌蛋白质如酶的生产中。脯氨酸特异性内切蛋白酶缺陷细胞也可用于表达食品工业中重要的或具有药物重要性的异源蛋白质。
脯氨酸特异性内切蛋白酶的优选来源是通过将编码脯氨酸特异性内切蛋白酶的微生物基因克隆入微生物宿主生物中而获得的。脯氨酸特异性内切蛋白酶更优选的来源是通过将编码脯氨酸特异性内切蛋白酶的源自曲霉属的基因克隆入能够过表达脯氨酸特异性内切蛋白酶基因的曲霉属的宿主中而获得的。
在含有目标为非医疗需要的消费者的蛋白质水解产物的产品种类中,在对运动员的产品中应用蛋白质水解产物的市场正在快速增长。在该产品种类中,终产品的变应原性不是问题。相反地,如味道、营养价值和存在特定的氨基酸以支持耐力和在锻炼后刺激生理的恢复等方面是这样的水解产物的重要参数,特别当用于运动饮料中时。例如,已认为谷氨酰胺可对抗代谢压力但只能以小肽来提供,因为游离氨基酸在溶液中是不稳定的。根据本发明生产的蛋白质水解产物由于其在普遍酸性pH条件下如在运动饮料中具有非常高的溶解性,因而非常适合于用于运动相关的产品中。该标准的重要的含义是根据本发明生产的高浓度的水解产物可包括在营养性运动产品中,而不具有在灭菌和延长的贮存中蛋白质沉淀的缺点。因而,运动产品的保存期通过添加本发明的蛋白质水解产物而延长。
根据本发明的酶混合物可用于水解动物来源的蛋白质材料,如全脂奶、脱脂乳、酪蛋白、乳清蛋白或酪蛋白和乳清蛋白的混合物。这样的酪蛋白和乳清蛋白的混合物可以如与那些发现于人乳中的相似的比率来使用。此外,基于胶原蛋白的动物蛋白质形成了底物,这是因为可将这些蛋白质降解为较小的分子,并因此使动物肉提取物脱苦味或促进对运动员的关节有益的脯氨酸和羟脯氨酸的摄取。
根据本发明的酶也可用于水解植物来源的蛋白质材料,如小麦谷蛋白、发芽的或未发芽的大麦或其他用于制备啤酒的谷类、豆奶、其浓缩物或分离物、玉米蛋白质浓缩物及其分离物和水稻蛋白质。
实施例材料与方法具有最少90%的β-酪蛋白且来自牛奶的β-酪蛋白(冻干的,基本无盐的粉末)从Sigma获得。胶原蛋白(类型1,来自牛跟腱,不溶性的)也从Sigma获得。
酪蛋白酸钠(Miprodan 30)从MD Foods(Viby,丹麦)获得。甜乳清浓缩物(未经巴氏消毒的,10%ds,35%蛋白质)从Borculo Domo(Zwolle,荷兰)获得。
低苦味的乳清水解产物Vitalarmor800 LB以及富含β-乳球蛋白的乳清蛋白(Protarmor905)从Armor Proteines(Saint-Brice-en-Cogles,法国)获得。其他商业的水解产物是从生产者获得的或购自药房。
大豆分离物Soyamin90 HV从Lucas Meyer,Hamburg,德国获得。
来自地衣芽孢杆菌的枯草溶菌素(Delvolase,每克560000DU)从DSM Food Specialities(Seclin,法国)获得。SumizymeLP 75.000从Shin Nihon(Anjyo,日本)获得。Flavourzyme1000L从NOVO Industries,Bagsvaerd,丹麦获得。Thermolysin(Thermoase;一种来自Bacillus thermoproteolyticus Rokko的热稳定性金属内切蛋白酶,具有14000 PU/mg的活性,由DaiwaKasei,Osaka,日本生产)来自脑膜脓毒性金黄杆菌(FlaVobacterium meningosepticum且克隆入大肠杆菌的脯氨酸特异性内切蛋白酶是用已知的质粒构建体和酶纯化方法分离的(T.Diefenthal和H.Dargatz,WorldJournal of Microbiology & Biotechnologyll,209-212(1995))。酶活性是在0.26 mM的CBZ-Gly-Pro-pNA上于25℃下(溶于0.1M pH7.0的磷酸缓冲液)中检验的。在该检验中用pH7.0是因为该酶的pH最适值高于pH6.0。产物在410nm进行分光光度监控。
酶的单位定义为在这种条件下每分钟引起1μmol的对硝基苯胺(p-nitroanilide)释放所需的酶量。
来自曲霉属(Aspergili)的脯氨酸特异性内切蛋白酶是根据描述于日本专利JP5015314中并做了较小改动的方法来测量的。简而言之,酶活性是在CBZ-Gly-Pro-pNA上于37摄氏度在pH 5.0的柠檬酸盐/磷酸二钠缓冲液中检验的。选用pH5.0是因为在该检验中酶的pH最适值低于pH6.0。反应产物也在410nM进行分光光度监控。
双向凝胶电泳对来自黑曲霉的脯氨酸特异性内肽酶的双向凝胶电泳和氨基酸部分测序来自黑曲霉G-306的脯氨酸特异性内切蛋白酶是以在实施例4中所概述的方法而生产和分离的。完全的纯化是用双向凝胶电泳来实现的。在那之后,从Superdex 75柱中分离的活性材料首先通过在10mM pH6.8的Tris/HCl缓冲液中稀释(约20倍)以脱盐,然后用Centricon 30kD的小型浓缩器(Amicon)进行浓缩。
双向电泳基本上是如《用固定的pH梯度进行双向电泳原理和方法》(Amersham Pharmacia Biotech 80-6429-60 Rev A/10-98)所描述的来进行的。第一向(IEF)是用pH范围为3-6的11cm IPG条(BioRad)在IPGphor(Amersham-Pharmacia)上进行的。将脱盐的3倍浓缩的样品在8M的尿素(6M的尿素和2M的硫脲)中稀释。这与18.5微升的10X-浓缩再水合缓冲液混合,该缓冲液含有6M尿素、2M硫脲、20%CHAPS和5%IPG(缓冲范围3-10)。将整体用于对IPG条的再水合。聚焦是用与该条一起提供作为指南的BioRad单页宣传品中描述的规程在29.320 Vh进行的。
第二向(SDS)是用购自BioRad的12%预制凝胶(Type Prep+2Comb))在Criterion Mini Vertical Cell(BioRad)上进行的。
首先将IPG条在含有DTT(1%)的SDS平衡缓冲液中温育,其次在含有碘乙酰胺(2.5%)的缓冲液中温育。两次温育都是在20℃进行15分钟。该SDS平衡缓冲液由50mM pH8.8的Tris/HCl、6M尿素、30%(v/v)甘油和2%(w/v)SDS和痕量的溴酚蓝组成。
温育后修剪IPG条以使其适合所述的凝胶类型,并用10x稀释的TGS缓冲液(BioRad)进行电泳。电泳后将凝胶用Sypro Ruby(Molecular Probes,Leiden,荷兰)染色3-4小时并用MilliQ水洗涤2小时。成像是在Imager(Appligene)上进行的。将最大的点切出,用50毫摩尔/升的碳酸氢铵洗涤几次,于37摄氏度与测序级的胰蛋白酶(nr.1047841,Boehringer Mannheim)温育过夜。肽是通过将凝胶块用含有甲酸的乙腈/水(50/50/5,v/v/v)洗涤几次而从中抽提的。将该样品用真空离心机(New BrunswickScientific,荷兰)来干燥并贮存于-20℃直到分析。
LC/MS分析使用Qtof-2(Micromass,Manehester,英国)质谱仪的HPLC(高效液相色谱)被用于分离在胰蛋白酶消化的过程中形成的肽。将5微升的肽溶液用含有0.1%甲酸的MilliQ水于20微升/分钟的流速捕获在C18 5*0.3mm的小型前置柱上(MCA30-05-C18,LCPackings,Amsterdam,荷兰)。然后将肽用MilliQ水中的0.1%甲酸(Millipore,Bedford,MA,美国;溶液A)和乙腈中的0.1%甲酸(溶液B)的快速梯度从前置柱上洗脱。该梯度以100%的溶液A开始并在20分钟内增加到60%的溶液B,且在另外5分钟内保持后一比率。在肽的洗脱中所用的流速为200nl/min。利用LC/MS/MS分析,黑曲霉脯氨酸特异性内切蛋白酶的部分氨基酸序列可通过对适当的肽的从头测序来确定。
使用偶联到P4000泵(ThermoquestTM,Breda,荷兰)上的离子阱质谱仪(ThermoquestTM,Breda,荷兰)的HPLC法被用于表征由本发明的酶混合物生产的酶促蛋白质水解产物。形成的肽用PEPMAPC18 300A(MIC-15-03-C18-PM,LC Packings,Amsterdam,荷兰)柱与MilliQ水中的0.1%甲酸(Millipore,Bedford,MA,美国;溶液A)和乙腈中的0.1%甲酸(溶液B)的梯度结合进行分离并洗脱。该梯度以100%的溶液A开始并在45分钟内增加到70%的溶液B,且在另外5分钟内保持后一比率。所用的注射体积为50微升,流速为50微升每分钟且柱温度维持在30℃。注射的样品的蛋白质浓度约为50微克每毫升。
个别肽的详细信息是通过用“扫描依赖型”MS/MS算法获得的,该算法是离子阱质谱仪的特征性算法。
完整扫描(full scan)分析之后进行放大扫描(zoom scan)分析以确定完整扫描质量范围内的最强离子的电荷状态。随后对后一离子的MS/MS分析结果得到肽的部分序列信息,这将用于用来自Xcalibur Bioworks(ThermoquestTM,Breda,荷兰)的SEQUEST应用程序进行的数据库搜索。所用的数据库是从OWL.fasta数据库中抽取的,可得自NCBI(国家生物技术信息中心),含有适合于所用的应用程序的目标蛋白质。在那些在其中测量了良好表征的蛋白质底物如乳清蛋白或酪蛋白的实验中,分析技术的精度是通过略去那些具有低于50%的序列适合度的MS/MS谱而增加的。
认为只有质量为约400~2000道尔顿的肽适合于用MS测序进行进一步的分析。
血管紧张肽(M=1295.6)用于在MS模式下调整最适的灵敏度和在MS/MS模式下调整最适的断裂,进行60μg/ml的恒量注入,在MS模式中主要导致二重和三重带电荷的类群,且在MS/MS模式中导致约35%的最适碰撞能。
对婴儿配方和商业的蛋白质水解产物的LC/MS分析在LC/MS之前,必须从婴儿配方中去除脂肪材料。其后将完全的营养样品(在100ml MilliQ水中的13.5 g粉末)用30ml己烷抽提3次。加入少量的NaCl以改善溶剂层的分离。然后获得5ml的水层并冻干。在分析前,将该样品重新溶解于25ml的MilliQ水中,离心2次(13000rpm)并通过0.22μm的滤器过滤。对于纯的水解样品,将400mg溶解于100mlMilliQ水中,离心2次(13000rpm)并通过0.22μm的滤器过滤。为了表征存在于商业的蛋白质水解产物中的肽,遵循了上述对由本发明的酶混合物形成的酶促水解产物同样的策略,即将过滤的水解产物加入到HPLC柱上且分子量为400~2000道尔顿的个别肽进一步由MS/MS分析来表征。然而,用于获得源自乳清或酪蛋白的水解产物的肽序列信息的数据库仅由牛奶蛋白质序列组成。
具有羧基来端脯氨酸的肽的摩尔份数(%)的确定LC/MS/MS可用于对肽C-末端的分析。用一种在其中肽的分子量(用LC/MS分析)及其(部分的)氨基酸序列(用LC/MS/MS分析)与在蛋白质数据库中的自动搜索程序联合的算法,可对复杂的肽混合物进行分析。这些选项使得我们能够量化具有羧基末端脯氨酸残基的肽的发生率。由于所用的PEPMAP肽分离柱设定的限制,只有分子量在约400和2000道尔顿之间的肽用此方法进行了分析。幸运的是,在蛋白质水解产物中多数的肽具有这样的分子量。
为了在蛋白质水解产物中确定具有羧基末端脯氨酸的肽的摩尔份数,选择了从PEPMAP柱中洗脱的个别肽的峰且用上述的技术确定了部分的羧基末端氨基酸序列。对至少20个,优选地为至少30个且最优选地为40~60个(如50个)最大量的且随机选择的肽的分析因而提供了对频率的理解,该频率为在羧基末端具有脯氨酸残基的肽出现的频率。具有羧基末端脯氨酸残基的肽的数目乘以100后和分析的肽的总数的商即提供了具有羧基末端脯氨酸的肽的摩尔份数(%)。
在用于生成水解产物的蛋白质底物中脯氨酸摩尔份数(%)的确定将可出现在婴儿配方产品中的脂肪材料首先用己烷提取物来去除,如在描述对婴儿配方和商业蛋白质水解产物的LC/MS分析的段落里所详述的。将蛋白质底物进行酸水解以将本发明的蛋白质转变为游离氨基酸是通过在2毫升6N的HCl中造成100毫克蛋白质材料的悬浮液而实现的。酸水解在无氧的环境里于112摄氏度进行22小时。离心后,将上清液在稀HCl里稀释10倍。在水解后,将氨基酸根据在Amino Acid Analysis System of Waters(Milford MA,美国)的操作员手册所详细说明的Picotag方法进行衍生和分析。脯氨酸存在的水平是用HPLC方法量化的。为了确定样品中脯氨酸的摩尔份数(%),将存在的脯氨酸的微摩尔数乘以100然后除以被分析的样品中所有存在的氨基酸的微摩尔总数。由于在酸水解中Trp和Cys被破坏,所以这两个氨基酸没有包括在所有氨基酸微摩尔数的总数中。
蛋白质水解产物或婴儿配方中游离氨基酸水平的确定将精确称量的蛋白质材料样品溶解于稀酸中,且通过在Eppendorf离心机中离心来去除沉淀。氨基酸分析是根据在AminoAcid Analysis System of Waters(Milford MA,美国)的操作员手册所详细说明的Picotag方法在清澈的上清液中进行的。然后,从液体中获得了适当的样品,将其加入到稀酸中并搅匀。从后一种溶液中得到了一种新的样品,使其干燥并用异硫氰酸苯酯进行衍生。各种存在的衍生氨基酸是用HPLC进行量化的,并且合计以计算称量的样品中游离氨基酸的总水平。
为了使样品中游离氨基酸的总水平和那些可从该样品中释放的氨基酸的总水平发生关系,也如上文所详述的,使样品进行酸水解然后对存在的总游离氨基酸进行量化。
附例

图1表达质粒pGBFIN11-EPO的质粒图。Endo-Pro代表脯氨酸特异性内切蛋白酶。
图2宿主菌株(黑曲霉CBS513.88)和几个过表达脯氨酸特异性内切蛋白酶的转化体的培养物滤液的SDS-PAGE分析,此处以箭头显示。
实施例1用枯草溶菌素与来自脑膜脓毒性金黄杆菌的脯氨酸特异性内切蛋白酶一起对β-酪蛋白的水解β-酪蛋白代表牛奶中一种主要的酪蛋白组分。该蛋白质已在其氨基酸序列方面很好地表征了且以几乎纯的形式为商业上可获得的。同样地,β-酪蛋白提供了极好的检验底物以研究酶切位点和各种在酶水解中形成的肽长度之间的关系。
本实施例证明尽管有枯草溶菌素广谱的特征,但非常特异性的酶如脯氨酸特异性内切蛋白酶的添加可对形成的β-酪蛋白片段的大小具有主要的影响。通过与枯草溶菌素与脯氨酸特异性内切蛋白酶一起温育可因此获得改进的酪蛋白组分的产量。β-酪蛋白是相对富含脯氨酸的,这是因为根据材料与方法部分的酸水解及以后的氨基酸分析揭示脯氨酸的摩尔份数为14%(如在材料与方法部分中所详细说明的脯氨酸的摩尔数/所有氨基酸的摩尔数)。
将β-酪蛋白粉末(Sigma)以10%的浓度(w/w)与0.1%(w/w)的DelvolaseTM一起溶解于0.1摩尔/升pH7.0的磷酸缓冲液中。在45℃振荡水浴中温育24小时之后,通过在90℃加热15分钟而终止反应。在一半溶液(1ml,含有100毫克的β-酪蛋白)中加入100微升来自脑膜脓毒性金黄杆菌的脯氨酸特异性内切蛋白酶(根据在World Journal of Microbiology & Biotechnology,Vol 11,pp209-212中描述的程序相应于4个单位),并且使反应在45℃时继续反应24小时。在另一次90℃热休克后,将DelvolaseTM和DelvolaseTM+脯氨酸特异性内切蛋白酶处理的β-酪蛋白材料两者的样品用LC/MS设备进行分析,如在材料与方法部分所详细说明的。
在单独用Delvolase消化的样品中,LC/MS/MS分析鉴定了覆盖β-酪蛋白分子多个部分的40个肽。这些肽一起占总β-酪蛋白序列的79%。肽在C18柱上的不同存留时间可追溯到长度为2~23个氨基酸残基的肽。谷氨酰胺被证明为出现频率最高的羧基末端残基(40个肽中有10个)。分析的肽没有一个显示具有脯氨酸作为羧基末端残基。
相反地,用DelvolaseTM和脯氨酸特异性内切蛋白酶消化的样品从β-酪蛋白中生成了28个可鉴定的肽。这些肽一起占总β-酪蛋白蛋白质序列的63%。肽大小分布是显著均一的,这是因为肽的长度范围仅为3~9个残基。在该肽群体中,谷氨酰胺仅在3个肽中是羧基末端残基,而脯氨酸被证明是最丰富的羧基末端残基(分析的28个肽中有17个)。该结果显示在用脯氨酸特异性内切蛋白酶所得的水解产物中,那些具有羧基末端脯氨酸残基的肽代表了存在于分子量在400~2000道尔顿的肽总数的61%的摩尔份数。因而,β-酪蛋白与脯氨酸特异性内切蛋白酶的温育产生具有脯氨酸作为羧基末端残基的肽。此外,枯草溶菌素加脯氨酸特异性内切蛋白酶的组合导致所生成的各种肽显著均一大小的分布,表明对这样的水解产物超滤后可得到高的产物产量。
实施例2β-酪蛋白水解产物和苦味尽管实施例1阐明了脯氨酸特异性内切蛋白酶对肽大小和具有羧基末端脯氨酸残基的肽的比例的影响,但该酶对苦味的影响在实施例1中没有测量。酪蛋白水解产物众人皆知是苦的且该性质与其相对高的疏水氨基酸残基的含量有关。
为了检验脯氨酸特异性内切蛋白酶对由枯草溶菌素水解的β-酪蛋白味道的影响,如在实施例1中描述的进行了用DelvolaseTM以及DelvolaseTM与脯氨酸特异性内切蛋白酶的酶温育。在枯草溶菌素和脯氨酸特异性内切蛋白酶两者的热失活后,将样品冷却到室温,并加入蒸馏水以使最终酪蛋白浓度为4%(w/w)。然后由一组有经验的品味者(taster)来评价后一种溶液的味道。该品味者无异议地得出结论由枯草溶菌素加脯氨酸特异性内切蛋白酶组合获得的水解产物显著地比由枯草溶菌素单独获得的水解产物不苦。
因而,用脯氨酸特异性内切蛋白酶对酪蛋白水解产物的处理基本地减少了终产物的苦味。
实施例3脯氨酸特异性内切蛋白酶从黑曲霉中的分离使一大组能够形成黑色孢子的霉菌生长于含有1.0g K2HPO4、0.5g KH2PO4、0.5g KCl、0.5g MgSO4.7H2O、0.01g FeSO4.7H2O、5g葡萄糖、15g胶原蛋白(Sigma)并加入蒸馏水以得到1升体积的pH6.5培养基上。每一实验的接种物是通过将生长在琼脂斜面上的真菌孢子(5日龄的)吸收于5毫升的无菌水中的方法制备的。将2%(v/v)的后一种悬浮液用于pH6.5培养基的接种。使其于28摄氏度振荡生长100小时,其后将培养物过滤,且使清澈滤液的样品在pH5.0和50摄氏度用合成的肽Z-Ala-Pro-pNA(Bachem;Bubendorf,瑞士)孵育。通过测量410纳米的吸收的增加而鉴定能够释放pNA的样品。对产生相对高的活性的阳性菌株进行进一步的研究。
菌株G-306分泌脯氨酸特异性内切蛋白酶并被鉴定为Aspergillus niger Van Tieghem var.niger。将该特殊的菌株用于脯氨酸特异性内切蛋白酶的分离、纯化和进一步的表征。为纯化酶,将1升培养物上清液加入到400毫升用0.05摩尔/升pH5.0的乙酸钠平衡的杆菌肽-粗孔硅胶柱上。将结合到柱上的蛋白酶用补充了1摩尔/升NaCl和10%(v/v)异丙醇的乙酸缓冲液来洗脱(J.Appl.Biochem.,1983 pp420-428)。收集活性组分并用蒸馏水透析,然后加入到200毫升用乙酸缓冲液平衡的杆菌肽-琼脂糖柱上。如前所述,洗脱是用补充了NaCl和异丙醇的乙酸缓冲液来进行的。将活性组分收集,用5毫摩尔/升pH5.0的乙酸缓冲液透析,然后用Amicon PM-10膜超滤以浓缩。为了得到几乎完全纯的脯氨酸特异性内切蛋白酶,使浓缩的液体在用0.05摩尔/升pH5.0的乙酸钠缓冲液平衡和用0.5摩尔/升的NaCl补充的SuperdexTM75柱上进行色谱。
用纯化的酶完成的实验显示分子量为约66.6千道尔顿,IEP为约pH 4.2,pH最适值为约5.0,及在50摄氏度温育4小时时几乎100%的热稳定性。
为了获得酶的部分氨基酸序列,使分离的酶制剂根据在材料与方法部分描述的程序首先进行双向凝胶电泳。将最大的点切出、与胰蛋白酶进行温育并洗脱。然后对回收的肽进行如在材料与方法部分描述的LC/MS/MS分析以确定部分氨基酸序列。
下面的氨基酸序列可得自黑曲霉的脯氨酸特异性内切蛋白酶NH2-ATTGEAYFE-COOHNH2-ATVNSWTGGWDFTR-COOHNH2-DGAPEGTST-COOHNH2-EREAGAAVTP-COOH将这些氨基酸序列用于合成从黑曲霉中分离编码脯氨酸特异性内切蛋白酶的基因所需要的DNA序列。
在后面的实验中(实施例10),显示序列NH2-ATTGEAYFE-COOH代表了成熟脯氨酸特异性内切蛋白酶的氨基末端。
实施例4脯氨酸特异性内切蛋白酶及其在大豆蛋白质水解中的作用日本专利JP501314描述了从米曲霉FS1-32获得的粗酶制剂,该制剂显示主要量的非特异性内切蛋白水解活性和次要量的脯氨酸特异性内切蛋白酶和羧肽酶活性。大豆蛋白质与该粗酶制剂的温育可产生一种水解产物,该水解产物显著地比用另一种蛋白酶制剂获得的大豆水解产物不苦,所述另一种蛋白酶制剂缺乏羧肽酶和脯氨酸特异性内切蛋白酶。在JP5015314中认为脯氨酸特异性内切蛋白酶的活性使随后由羧肽酶去除的脯氨酸残基得以暴露。这些疏水的羧基末端脯氨酸残基由羧肽酶的去除被认为对于获得不苦的水解产物是必需的。
为了检验该论点,对在JP5015314中提供的一个实施例进行了重复,对结果所得的大豆水解产物用上述的LC/MS技术进行了分析而不是评估对味道的影响。
根据JP5015314,其与米曲霉FS1-32的温育物含有下面的酶活性(对于每克底物而言)。
蛋白酶650PU的级别;羧肽酶0.01单位的级别脯氨酸特异性内切蛋白酶0.03毫单位的级别。
由于最初的米曲霉FS1-32制剂是不可获得的,所以在本实施例中使用了两种同样衍生自米曲霉的商业酶制剂。此外,使用了从黑曲霉分离的色谱纯化的脯氨酸特异性内切蛋白酶(参见实施例3)以获得酸性脯氨酸特异性内切蛋白酶的超剂量。
各种酶制剂的活性是根据在JP5015314中提供的程序来测量的并提供在下面。
- Sumizyme LP 75.000,一种已知富于内切蛋白水解活性的商业米曲霉酶制剂。
根据JP5015314的方法估计的酶活性蛋白酶226PU/克产物;羧肽酶21单位/克产物;脯氨酰-内切蛋白酶430毫单位/克产物- Flavourzyme 1000L,一种已知富于外切蛋白水解活性的商业米曲霉酶制剂。
根据JP5015314的方法估计的酶活性蛋白酶332PU/克产物;羧肽酶10单位/克产物;脯氨酰-内切蛋白酶不可测- 获得自黑曲霉并如在实施例3中分离的色谱纯的脯氨酸特异性内切蛋白酶。
根据JP5015314的方法估计的酶活性蛋白酶不可测;羧肽酶不可测;脯氨酰-内切蛋白酶45毫单位/毫升从这些数据可证明尽管Sumizyme和Flavourzyme以其高的蛋白水解活性而众所周知,但它们没有一个可提供与在JP5015314中提供的相同的非常高的(内切)蛋白酶对羧肽酶活性的比率。令人惊讶地发现Sumizyme LP 75.000含有比在JP5015314中报道的高得多的脯氨酸特异性内切蛋白酶活性。
各种酶制剂是根据在JP5015314中描述的规程来温育的,但是是根据想要的羧肽酶的活性(0.01单位每克底物)而标准化的。将大豆分离物(Soyamin 90 HV)用作这些反应的底物。在pH 5和50摄氏度温育5小时后,将样品离心并将上清液冷冻保存直到LC/MS分析。
LC/MS分析是如在材料与方法中所详细说明的来进行的。
在本实验中,蛋白质数据库仅由大豆蛋白质组成。获得的结果详细说明于表1中。
表1用几种酶处理的大豆蛋白质
PEP脯氨酰-内肽酶或脯氨酸特异性内切蛋白酶。
Sumizyme LP 75.000含有比在菌株FS1-32中记录的脯氨酸特异性内切蛋白水解活性高约7倍的脯氨酸特异性内切蛋白水解活性,并且产生了约10%摩尔份数的具有羧基末端脯氨酸的大豆肽。从黑曲霉中分离且富含脯氨酸特异性内切蛋白酶的Sumizyme LP 75.000含有比在菌株FS1-32中记录的活性高约50倍的脯氨酸特异性内切蛋白水解活性,但仍产生了约10%摩尔份数的具有羧基末端脯氨酸的大豆肽。这些数据通过分析存在于肽中但不存在于羧基末端的脯氨酸残基的数目而证实。Flavourzyme不含有可测的脯氨酸特异性内切蛋白酶,但在生成的且适合于LC/MS技术分析的肽中产生了6%摩尔份数的在羧基末端具有脯氨酸的肽。如果与该大豆蛋白质分离物中约5%的脯氨酸含量相结合,该三个观察显示脯氨酸特异性内切蛋白酶的存在和活性与羧肽酶活性结合仅对羧基末端脯氨酸的摩尔发生率具有较小的作用。因而,很难想象在JP5015314中描述且仅仅归因于0.03毫单位的脯氨酸特异性内切蛋白酶活性的脱苦味作用可与具有脯氨酸作为其羧基末端氨基酸残基的肽的高发生率相关。
实施例5脯氨酸特异性内切蛋白酶增加的剂量及其对大豆蛋白质水解的作用在本实施例中,证明了高水平的脯氨酸特异性内切蛋白酶是生成含有显著量的具羧基末端脯氨酸残基的肽的大豆水解产物所必需的。这些实验的总体设计与在实施例4中描述的相同。将大豆蛋白质分离物与Sumizyme LP 75.000温育,其中Sumizyme LP 75.000是根据想要的羧肽酶活性(0.01单位每克大豆蛋白质)并在JP5015314中描述的条件下标准化的。温育在pH 5和50摄氏度进行2.5或者5.0小时,并通过将材料在100摄氏度放置10分钟而停止。随后获得了一些温育了5小时的材料并将其pH增加到7.0。从该材料中获得了3个样品,并将不同量的大肠杆菌生产的脑膜脓毒性金黄杆菌脯氨酸特异性内切蛋白酶加入其中。向第一个样品加入1.5毫单位的脯氨酸特异性内切蛋白酶(根据JP5015314,但在pH7.0和30摄氏度进行测量以适应大肠杆菌衍生的脯氨酸特异性内切蛋白酶的pH和温度最适值),向第二个样品加入150毫单位且向第三个样品加入15000毫单位,然后将样品再次于40摄氏度温育2小时。温育后,将样品离心,上清液冷冻保存直到LC/MS分析。LC/MS如在前文详细说明的进行。获得的结果详细说明于表2。
表2用高浓度的脯氨酸特异性内切蛋白酶处理的大豆蛋白质
PEP脯氨酰-内肽酶或脯氨酸特异性内切蛋白酶。
获得的结果明显显示水解产物中具有羧基末端脯氨酸残基的肽的发生率的显著增加是完全依赖于脯氨酸特异性内切蛋白酶的添加的。然而,只有以几个数量级超过在JP5015314中提到的活性和存在于Sumizyme LP 75000中的活性的活性能够作到这一点。该观察的含义是纯的和分离的脯氨酸特异性内切蛋白酶对获得水解产物中想要的肽组成是必需的。
实施例6
在商业水解产物中具有脯氨酸作为羧基末端残基的肽的摩尔发生率如前文所述,LC/MS/MS可用于肽C-末端的分析。利用在其中肽的分子量(用LC/MS/MS分析)及其(部分的)氨基酸序列(用LC/MS/MS分析)与在蛋白质数据库中的自动搜索程序结合的算法,可对复杂的肽混合物进行分析。
在本实施例中,将这些可能性用于分析大量的商业婴儿配方制剂及商业蛋白质水解产物以确定分子量在400~2000道尔顿的具有羧基末端脯氨酸残基的肽的摩尔发生率。
对下面的产品进行了分析。
1.NidalHA 1(Nestle),每100g粉末含有11.5g乳清蛋白水解产物2.Alfare(Nestle),每100g粉末含有16.5g乳清蛋白3.NutrilonPepti Plus(Nutricia),每100g粉末含有13.5g乳清蛋白4.NutrilonPepti Junior(Nutricia),每100g粉末含有16.5g乳清蛋白水解产物5.AptamilHA(Milupa),每100g粉末含有12.3g乳清蛋白和酪蛋白水解产物6.Pregomin(Milupa),每100g粉末含有13.3g可能的大豆和胶原蛋白水解产物7.Nutramigen(Mead Johnson),每100g粉末含有14.0g可能的酪蛋白水解产物8.Vitalarmor800 LB(Armor Proteines),含有100%的乳清蛋白水解产物9.WPH 916(New Zealand Milk Products),含有100%的乳清蛋白水解产物10.WE80 BG(DMV International),含有100%的乳清蛋白水解产物当婴儿配方含有约15%的蛋白质水解产物加脂肪(25%)和糖类(50%),对这些产品的己烷抽提以去除脂相证明是必不可少的。纯的水解产物即可这样使用。
为了使获得的部分蛋白质序列与已知蛋白质的序列联系起来,将仅含有牛奶蛋白质序列的数据库用于除Pregomin样品之外的所有样品。将Pregomin样品用含有大豆-和胶原蛋白特异性序列数据的数据库进行分析。由于分析的原因,LC/MS分析集中在分子量为400到约2000道尔顿的肽上,因此,在该范围之外的肽不予考虑。
在每个样品中,可鉴定32~76个含有所用的水解的蛋白质的序列信息的肽。在大多数样品中,色谱谱中25个最强峰中超过95%的可与牛奶蛋白质的序列信息相关。在Pregomin样品中,25个最强峰中只有65%可与大豆和胶原蛋白蛋白质的序列信息相关。对此,可能的原因是在蛋白质主要成分中其他蛋白质的结合或由于小的或共洗脱的峰而导致的不良MS/MS数据。
为了检验系统的重复性和再现性,将Nutrilon Pepti Plus样品进行2次抽提和3次分析(在系列的开始、中间和结尾)。发现从各种对羧基末端氨基酸残基分布的分析中获得的数据具有很好的一致性。
在各种商业产品中具有羧基末端脯氨酸残基的肽的摩尔发生率提供于表3。这样的肽的摩尔发生率也与用于制备水解产物的蛋白质粗材料中脯氨酸的含量相关。例如,酪蛋白和胶原蛋白具有比乳清或大豆蛋白质高许多的脯氨酸。为了考虑这个方面,也用酸水解并伴随用如在材料与方法部分中所描述技术的氨基酸分析对在用于每一商业产品的蛋白质主要成分中存在的氨基酸中脯氨酸的摩尔份数进行了推导。此外,所用的粗材料可在其对酶切割的易感性上有不同,如由于特定的重复氨基酸序列的存在。
表3商业产品中具有羧基末端脯氨酸的肽的摩尔发生率
从在表3中给出的数据看,明显的是,在通用的乳清水解产物中具有羧基末端脯氨酸残基的肽的摩尔发生率低。如果我们考虑乳清的脯氨酸含量,我们认为没有一种基于商业乳清的产品含有比在蛋白质主要成分中存在的脯氨酸的摩尔份数高的具有羧基末端脯氨酸残基的肽的摩尔份数。一般地,在这些基于乳清的商业产品中具有羧基末端脯氨酸的肽的摩尔份数为5%或更低。
观察在基于酪蛋白的产品如Nutramigen中羧基末端脯氨酸残基的摩尔发生率,我们发现即使考虑酪蛋白中相对高的脯氨酸含量,仍然可以看到比在基于乳清的产品中发现的水平显著更高的水平。然而,在一方面对Nutramigen产品与通过与枯草溶菌素和脯氨酸特异性内切蛋白酶温育而制备的β-酪蛋白水解产物(参见实施例1)的比较显示巨大的组成差别,该差别可存在于现有的商业酪蛋白水解产物和根据本发明的酪蛋白水解产物之间。然而,商业产品(即Nutramigen)显示了22%的具有羧基末端脯氨酸残基的肽的摩尔发生率,实施例1的酪蛋白水解产物中该发生率为61%。
实施例7与所加的脯氨酸特异性内切蛋白酶的浓度相关的具有羧基末端脯氨酸的乳清肽的摩尔发生率在本实施例中,将商业乳清蛋白在各种条件下与由大肠杆菌生产的脯氨酸特异性内切蛋白酶进行温育。在结果所得的水解产物中确定了具有羧基末端脯氨酸残基的肽的摩尔发生率。
将Protarmor 905(Armor Proteins)在水中的溶液(10%w/w)在2.5%的Delvolase(酶重量/底物重量)存在时于pH8.5在1小时内从25℃缓缓加热到60℃。1小时后,将溶液迅速加热到80℃并立即冷却到60℃,其后将新的2.5%剂量的Delvolase加入。使得水解再进行1小时;然后加热到95℃5分钟并再次冷却。在将pH调节到7.4后,将脯氨酸特异性内切蛋白酶以0.87和170单位/克底物的浓度(表4中的U/g;单位是根据在World Journal ofMicrobiology & Biotechnology,Vol 11,pp 209-212中所描述的程序而确定的)加入,并使水解在45℃进行另外的3小时。最后,将溶液在95℃放置5分钟以使酶失活并对溶液进行巴氏消毒。然后将所获得的水解产物用LC/MS进行分析以确定如前所述形成的肽中羧基末端脯氨酸残基的摩尔发生率。获得的结果在表4中给出。
表4酶剂量和具有羧基末端脯氨酸的肽的摩尔发生率
从该表中,看来在45℃时,在其C-末端具有脯氨酸的肽的摩尔发生率随脯氨酸特异性内切蛋白酶的剂量而增加。用最高的酶剂量时,从该乳清产品中获得的高达50%的肽显示具有羧基末端的脯氨酸残基。当在30℃进行温育时,具有羧基末端脯氨酸残基的肽的摩尔发生率在87单位/克底物时可达52%,但在更高剂量的酶时几乎不能再增加。与在45℃时相比,在30 ℃时在87 U/g达到的较高的发生率可由大肠杆菌酶低的热稳定性来解释。
实施例8用或不用脯氨酸特异性内切蛋白酶生产的乳清水解产物的味道和组成在本实施例中,从大肠杆菌获得的脯氨酸特异性内切蛋白酶与枯草溶菌素(Delvolase)组合使用以生产低苦味的乳清水解产物。利用在实施例7中生成的数据,可选择脯氨酸特异性内切蛋白酶的剂量以使得预期具有羧基末端脯氨酸残基的肽只有微小的增加。将用脯氨酸特异性内切蛋白酶形成的水解产物与不用脯氨酸特异性内切蛋白酶形成的相似的水解产物以及一种商业的低苦味的乳清水解产物进行比较。所有这些产物都在味道及其具有羧基末端脯氨酸残基的肽的含量方面进行表征。
将Protarmor 905(Armor Proteins)在水中的溶液(10%w/w)在2.5%的Delvolase(酶重量/底物重量)存在时于pH8.5在1小时内从25℃缓缓加热到60℃。1小时后,将溶液迅速加热到80℃并立即冷却到60℃,其后将新的2.5%剂量的Delvolase加入。使得水解进行另外1小时;然后加热到95℃5分钟并再次冷却。在将pH调节到7.4后,将脯氨酸特异性内切蛋白酶以50单位/克底物的浓度加入。使得该过程在45℃继续3小时。根据在实施例7中获得的数据,这些条件只导致具有羧基末端脯氨酸残基的肽的微小增加。其后,将溶液在95℃放置5分钟以使酶失活并对溶液进行巴氏消毒。然后使溶液冷却。对另一个样品应用相同的处理,但是不加入脯氨酸特异性内切蛋白酶。
对水解产物的感觉分析是在所谓的成对比较检验(two-pairedcomparison test)中进行的。该类检验被美国啤酒酿造化学家协会(American Society of Brewers Chemists)(ASBC)用于比较2种不同啤酒的苦味。如果在这样的片面检验(one-sided test)中我们接受5%错误率的风险,具有统计学差异的阈值则为在24次反馈(reply)中出现17次。在每种检验中,将水解产物以2.5%的干物质浓度进行品味,且将1ml各种溶液在易处理的小瓶中给出。要求每个鉴定员不吞咽即评价苦味水平并在其后用水漱口。将所有样品编码并随机分派给鉴定员。
第一个检验目标在于评价枯草溶菌素与脯氨酸特异性内切蛋白酶的组合与单独枯草溶菌素相比的益处。第二个检验目标在于评估用枯草溶菌素与脯氨酸特异性内切蛋白酶的组合获得的水解产物与商业低苦味的水解产物(Vitalarmor 800LB)相比的苦味程度。其后,将Vitalarmor 800LB在与用于其他水解产物的相同的缓冲液中稀释以获得可比较的蛋白质浓度。
在参与第一个检验的24个人中,17个认为用枯草溶菌素与脯氨酸特异性内切蛋白酶的组合获得的样品比单独用枯草溶菌素获得的样品不苦。该结果是统计学显著的,且证实了脯氨酸特异性内切蛋白酶的脱苦味活性,即使是在以相对低的浓度应用时(实施例7)。值得注意的是这些“低”的酶浓度比在专利JP5015314中所应用且被宣称具有脱苦味作用的酶剂量高几个数量级。
在第二个成对样品比较中,24个参与者中的19个认为用枯草溶菌素与脯氨酸特异性内切蛋白酶的组合处理的样品比商业的Vitalarmor 800LB不苦。该后一种观察也是统计学上显著的,且阐明了本发明的水解产物和酶混合物的经济价值。
将用或不用脯氨酸特异性内切蛋白酶获得的水解产物用如前文所述的LC/MS进行分析。在单独用枯草溶菌素获得的水解产物中分析了41个肽。结果是这些肽没有一个具有羧基末端的脯氨酸残基,尽管18个肽含有至少一个脯氨酸残基。
在用枯草溶菌素与脯氨酸特异性内切蛋白酶的组合获得的水解产物中分析了31个肽,且6个显示具有羧基末端脯氨酸残基。该观察与在实施例6获得的结果的基础上所预期的相符,显示作为与脯氨酸特异性内切蛋白酶温育的结果,具有羧基末端脯氨酸残基的肽的摩尔发生率从0增加到19%。由于对后一样品的感觉检验已证明统计学显著的减少的苦味,所以该实验明显地将羧基末端脯氨酸残基的微小增加与减少的苦味相联系了。
除了降低苦味水平之外,与低水平的脯氨酸特异性内切蛋白酶的温育显示也可降低水解产物的肽长度。在单独用Delvolase处理的水解产物中,LC/MS分析揭示肽长度为4~14个氨基酸且平均长度为7.5个氨基酸。在用Delvolase和脯氨酸特异性内切蛋白酶的组合处理的水解产物中,肽长度显示可为4~12个氨基酸且平均长度为6.1个氨基酸。这些减少的肽长度将不仅改善水解产物生产方法的产量,而且减少水解产物的总体变应原性以及使酸性条件下的沉淀最小化。
实施例9来自黑曲霉的脯氨酸特异性内切蛋白酶的克隆正向和反向寡核苷酸引物是用在实施例3中阐明的肽序列导出的。为了减少引物的简并性,在几个位置引入了肌苷碱基。这增加了能够引发PCR反应的寡核苷酸引物在库中的丰度,但缺点是反应的特异性降低了。
来自黑曲霉G306(于2001年9月10日保藏于CBS,保藏号为CBS109712)的基因组DNA是用标准的技术分离的并用作PCR反应的模板,其中所用的寡核苷酸引物在表5中显示。
表5endo-pro的肽-和寡核苷酸引物(I=肌苷)
在实验中,将正向和反向引物的所有可能组合用于扩增编码来自黑曲霉的脯氨酸特异性内切蛋白酶基因。最初的实验是在标准PCR条件(在94℃变性,在55℃退火且在72℃延伸)下进行。令人惊讶地是这些实验没有生成任何特异性PCR产物。由于负结果也可能是因为模板DNA不纯,所以我们用PCR引物对几个不同的但已知的黑曲霉基因进行了对照PCR反应。在可比较的反应中,这些后面的基因可成功地从黑曲霉G306基因组DNA中扩增出来,显示用endo-pro的引物不能扩增片段不是由于基因组DNA制剂的不纯。
随后决定通过将退火温度降低到45℃来降低PCR反应的严格性。因此PCR的特异性即降低了,且扩增出了几个条带,尽管这些条带也在缺乏一个引物的对照PCR反应中探测到了。将几个这样的PCR产物克隆入通用克隆载体pCR2.1(Invitrogen,Groningen,荷兰)中,且确定了这些片段的DNA序列。不幸的是,克隆的片段没有一个编码脯氨酸特异性内切蛋白酶的编码基因。
另外,对PCR规程做了许多其他的调整,如不同聚合酶的使用、增加引物或模板浓度、降落(touch-down)PCR和热启动的引入,但这些规程没有一个产生了编码脯氨酸特异性内切蛋白酶的特异性片段。为了使该不确定的方法的明显的风险减到最小,决定尝试另一种人们不太熟知的克隆程序。
3’-RACE由于我们扩增编码来自黑曲霉G306基因组DNA的脯氨酸特异性内切蛋白酶的基因的尝试没有一个是成功的,所以我们决定使用不同的方法,其中用RNA作为cDNA合成的模板。用3’-RACE、5’-RACE和对完整可读框的扩增来克隆未知基因的方法已在WO9938956中描述。与上述的直接PCR程序相比,该程序的优点是在cDNA的3’-末端引入了额外的引发位点,所以扩增部分的编码序列只需要一个单一的基因特异性寡核苷酸加一个通用引物,而不是两个简并引物。此外,用cDNA作为模板防止了扩增中由于内含子引起的问题。在扩增反应中用cDNA作为模板与从基因组DNA的扩增相比也增加了模板的浓度。
根据该方法,使黑曲霉G306生长于含有胶原蛋白作为唯一碳源的培养基上以诱导编码脯氨酸特异性内切蛋白酶的基因的表达。培养基的组成在材料与方法部分描述。在34℃生长48小时后收获幼小(young)菌丝体并用于分离总RNA。为该目的,将菌丝体通过Miracloth过滤材料(Filtration wrap)过滤而收获并用冰预冷的无菌脱矿质水(demiwater)洗涤。将菌丝体(250mg)立即在液氮中冻结并用研钵和杵研磨成精细的白色粉末。将该白色粉末转移到无菌的15ml Greiner管中,且用完全如供应商描述的Trizol方法来分离总RNA(Life Technologies,Paisley,英国)。
将RNA制剂用于从3’-RACE试剂盒(AP;Life Technologies)的锚定引物来合成cDNA,即从mRNA的聚腺苷酸尾来延伸cDNA。在用RNase H处理之后,将cDNA用PCR进行扩增,该PCR使用上述的缩短的通用扩增引物(AUAP;Life Technologies)和肌苷替代的基因特异性正向引物(No.1、3、5和7)。仅当用引物No.1加AUAP时,从黑曲霉G306 RNA扩增了~1.4kb的特异性扩增产物。用其他引物时,在低严格条件下只获得了非特异性的扩增产物。将该1.4kb的cDNA克隆入pCR2.1并确定了其DNA序列。
5’-RACE从该序列设计了3个基因特异性引物来进一步扩增基因的5’-部分。所有3个引物,即5’-TTCAGTACTCCACCAGTACCTC-3’,5’-TGGGAAAAGGTGCCCTTCTCC-3’和5’-GGATTATGATGGTCCAGCAGC-3’是与编码脯氨酸特异性内切蛋白酶的基因的编码序列互补且反向的。
将来自黑曲霉G306的总RNA和5’-RACE试剂盒(LifeTechnologies)用来合成cDNA,使用引物5’-TTCAGTACTCCACCAGTACCTC-3’。在RNase处理后,用Glasmaxcartridge(Life Technologies)纯化cDNA。用末端转移酶(TdT;Life Technologies)将聚脱氧胸苷酸尾(poly-dC tail)添加到cDNA上。将cDNA用PCR进行扩增,该PCR使用缩短的锚定引物(AAP;Life Technologies)和第一个嵌套引物5’-TGGGAAAAGGTGCCCTTCTCC-3’。使用AUAP引物(Life Technologies)和第二个引物5’-GGATTATGATGGTCCAGCAGC-3’的第二次扩增是获得~0.25kb的特异性扩增产物所必需的。通过琼脂糖凝胶电泳来纯化该片段并克隆pCR2.1,且确定了其DNA序列。这显示该片段含有编码脯氨酸特异性内切蛋白酶的基因的5’-部分。
对基因的表征组合3’-RACE和5’-RACE的交迭序列结果得到了编码脯氨酸特异性内切蛋白酶的基因的完整编码序列。SEQ_ID 1表示该基因可读框的完整序列。推定的526个氨基酸的蛋白质序列描述于SEQ_ID 2。肽ATTGEAYFE看来是完全正确的。肽DGAPEGTST也是正确的,但是是由被一个内含子打断的基因组DNA编码的(参见SEQ_ID 15和实施例11中黑曲霉CBS513.88的基因组DNA的克隆和序列)。另外两个肽由于用于对它们进行表征的LC/MS/MS方法而掺入了错误(参见实施例3)。尽管有这些不确定性,我们还是首次成功地选择并鉴定了来自曲霉属的编码脯氨酸特异性内切蛋白酶的想要的遗传信息。
来自曲霉属的该脯氨酸特异性内切蛋白酶的新颖性通过对众所周知的数据库如SwissProt、PIR和trEMBL的BLAST搜索而证实。当与蛋白质序列数据库比较时,探测不到该蛋白质与任何其他蛋白质的强的一致性。
实施例10编码脯氨酸特异性内切蛋白酶的基因的过表达及脯氨酸特异性内切蛋白酶的分离编码脯氨酸特异性内切蛋白酶的基因的整个可读框是用引物5’-ATGCGTGCCTTCTCCGCTGTC-3’和AUAP引物(Life Technologies)从黑曲霉G306的cDNA进行PCR而扩增的。将获得的PCR片段克隆入克隆载体pCR2.1(Invitrogen)中。将结果所得的质粒用EcoR I消化,且将含有endo-pro基因的片段克隆入表达载体pGBFIN-11(WO9932617)的EcoR I位点上。结果所得的克隆用Xho I的限制性酶切来检查,当片段以正确方向插入时这可产生~0.65kb的片段。该结果所得的质粒以图1显示并命名为pGBFIN11-EPO。
将黑曲霉CBS513.88用作编码脯氨酸特异性内切蛋白酶的基因过表达的宿主。因此,用Not I消化使表达载体pGBFIN11-EPO线性化,这从表达载体中去除了所有的大肠杆菌衍生的序列。将消化的DNA用酚∶氯仿∶异戊醇(24∶23∶1)抽提并用乙醇沉淀来纯化。黑曲霉转化程序在WO 98/46772中有详尽的描述。其中也描述了如何在含有乙酰胺的琼脂糖平板上选择转化体及如何选择目标多拷贝整合体。优选地,选择含有多拷贝表达盒的黑曲霉转化体以产生进一步的样品材料。
培养和蛋白酶的分离将含有多拷贝表达盒的黑曲霉菌株通过在摇瓶培养体系中培养该菌株而用于色谱生成样品材料。培养黑曲霉菌株和从培养物液体培养基中分离菌丝体的有用方法描述于WO 98/46772中。将获得的培养物液体培养基用在图2中描述的SDS-PAGE进行分析。随后,将培养物液体培养基用于蛋白酶的色谱纯化以去除任何污染的内切-或外切蛋白水解活性。为该目的,首先将发酵液体培养基离心以去除大多数真菌物质,然后将上清液经过许多孔径递降的滤器以去除所有的细胞碎片。最后,将获得的超滤液在20毫摩尔/升pH5.1的乙酸钠中稀释10倍并加入到Q-琼脂糖FF柱上。将蛋白质在20毫摩尔/升pH5.1的乙酸钠中以0到0.4摩尔/升NaCl的梯度进行洗脱。根据在WorldJournal of Microbiology & Biotechnology,Vol 11,pp 209-212(1995)中描述的规程,但是是在做了微小修改的条件下,收集显示Z-Gly-Pro-pNA(Bachem,瑞士)切割活性的峰组分。考虑到黑曲霉衍生的脯氨酸特异性内切蛋白酶的酸性pH最适值,该酶测定是在柠檬酸/磷酸缓冲液中于37℃在pH5时进行的。集中活性组分并随后进行浓缩,最后产生了仅显示在SDS-PAGE上的单一条带和在HP-SEC上的一个峰的制剂。通过疏水相互作用色谱的进一步分析证实了获得的酶制剂的纯度。
此外,将纯化的脯氨酸特异性内切蛋白酶通过Edman降解用于成熟蛋白质的氨基末端的确定。成熟脯氨酸特异性内切蛋白酶的氨基末端开始于SEQ_ID 2和SEQ_ID_17的位置42。
实施例11筛选除黑曲霉之外的真菌物种以确定编码脯氨酸特异性内切蛋白酶的基因的存在在脑膜脓毒性金黄杆菌和黑曲霉编码脯氨酸特异性内切蛋白酶的基因之间低的核苷酸序列同源性的基础上,可以排除这两个基因之间的杂交。为了得到黑曲霉特异性核苷酸序列在更相关的微生物中保守性的知识,选择了以下的菌株进行杂交实验。将真菌物种黑曲霉CBS102.12、黑曲霉CBS513.88、黑曲霉G306、炭黑曲霉(Aspergillus carbonarius)ATCC1025、酱油曲霉DSM2809、赭色曲霉(Aspergillus ochraceus)ATCC18500、棘孢曲霉(Aspergillus acculeatis)CBS101.43、Vetticilliumpsalliotae CBS396.58、Phialophora mustea CBS142.41、产黄青霉URCM237、Phoma exigua CBS431.74、鸡小孢子菌(Microsporumgallinae)CBS221.55、Acremonium strictum ATCC20371、Rhizomucor miehei CBS370.65、互格链格孢(Alternariaalternata)CBS103.33、Talaromyces emersonii CBS393.64、Cladosporium chlorocephalum CBS213.73、Cladosporiumtenuissinum CBS117.79和Trichoderma reesii ATCC26921于30℃(踝节菌属菌株除外,它培养于50℃)并在220rpm振荡培养于100ml PDB(Potato Dextrose Broth,Difco)中。
当培养物充分生长后,通过Miracloth滤器过滤来收获菌丝体物质,用10mM KPi缓冲液(pH7.0)洗涤并在滤纸间干燥。在液氮中用研钵和杵研磨菌丝体,直到得到精细的白色粉末。随后根据供应商的说明书用PureGene试剂盒(Gentra Systems,Minneapolis,美国)分离染色体DNA。
啤酒糖酵母ATCC20785在实验中用作负对照并在30℃以220rpm振荡培养于YePD中。
为了准备Southern印迹,将所有物种的染色体DNA用Xho I消化,且限制性内切酶酶切片段在TAE缓冲液中0.8%的琼脂糖凝胶上通过琼脂糖凝胶电泳进行分离。分离后,通过常规技术(Sambrook等人(1982)Molecular cloninga laboratory manual,ISBN0-87969-309-6)将DNA片段印迹到硝酸纤维素(0.2pm,Schleicher & Schuel1)膜上,且使该印迹在80℃保持(back)2小时。
用于杂交的探针是在作为模板的pGBFIN11-EPO上以引物5’-ATGCGTGCCTTCTCCGCTGTC-3’和AUAP引物用PCR合成的。根据供应商的说明书用RadPrime DNA标记系统(Life Technologies)以32P-α-dATP(Amersham,England)对约30纳克的cDNA片段进行标记。标记后根据离心柱程序通过在交联葡聚糖G-50柱上纯化探针片段而将未整合的dNTP’s去除(Sambrook等人,1982)。
在加入到杂交混合物中之前,通过将探针在沸水中温育5分钟并随后在冰上的迅速冷却而使其变性,然后立即使用。
对印迹的预杂交是在50ml 6 x SSC、0.5%SDS、5 xDenhardt、0.1mg/ml Herring sperm DNA(Life Technologies)中于50℃在连续搅动中进行1小时。在向预杂交液中加入探针之后,使杂交在50℃进行16小时。将印迹于环境温度在200ml 6 xSSC、0.1%SDS中洗涤两次,每次30分钟,并于50℃在200ml 6 xSSC、0.1%SDS中洗涤一次达30分钟,以去除对印迹的非特异性杂交。用X-Omat AR(Kodak)胶片来显现杂交。
该实验的结果描述于图6中。黑曲霉和炭黑曲霉菌株与探针进行了强的杂交。其他的曲霉属菌株如酱油曲霉、赭色曲霉和棘孢曲霉都与探针进行了杂交。明显地,编码脯氨酸特异性内切蛋白酶的基因在曲霉属中是保守的。令人惊讶地,与曲霉属更远的真菌如Philalophora mustea、Rhizomucor miehei、互格链格孢、Talaromyces emersonii和Trichoderma reesii也与脯氨酸特异性内切蛋白酶的cDNA进行了很好的杂交。作为负对照的啤酒糖酵母以及一些其他的物种不显示与来自黑曲霉的cDNA的任何杂交(参见表6)。该结果显示编码脯氨酸特异性内切蛋白酶的基因在许多真菌物种中是保守的,且本领域的技术人员可理解来自这些物种的基因可用在此处所示作为探测方法的异源杂交来分离。
为了对此进行阐明,将本实施例中所用的黑曲霉G306的cDNA片段用作筛选黑曲霉CBS513.88的基因组DNA文库的探针。本领域的技术人员熟知生成基因组DNA文库并用标记的DNA探针筛选这样的文库的方法。该程序也在文献中进行了详尽的描述(Sambrook等人(1989)Molecular cloninga laboratory manual,Cold SpringHarbor laboratory Press)。将筛选中的阳性克隆纯化并将其DNA测序。编码脯氨酸特异性内切蛋白酶的黑曲霉CBS513.88基因组DNA在SEQ_ID 15中给出。本实施例阐明用对来自黑曲霉G306的基因的cDNA的杂交来从其他物种和菌株中分离编码脯氨酸特异性内切蛋白酶的基因是可能的。
CBS513.88的脯氨酸特异性内切蛋白酶推定的编码序列和氨基酸序列分别在SEQ_ID 16和SEQ_ID 17中描述。
表6黑曲霉endo-pro基因与各种真菌染色体DNA的异源杂交
实施例12从米曲霉FS1-32中获得的酶混合物及其在大豆蛋白质水解中的作用日本专利JP5015314公开了从米曲霉FS1-32中获得的粗酶制剂,该制剂含有主要量的非特异性内切蛋白水解活性和次要量的脯氨酸特异性内切蛋白酶。该粗酶制剂进一步含有显著的羧肽酶活性。在将大豆蛋白质与该粗酶制剂温育时,获得了一种大豆蛋白质水解产物,据称其比可用其他蛋白酶制剂获得的大豆水解产物显著地不苦。JP5015314中对此有益的脱苦味作用给出的解释为其他的蛋白酶制剂缺乏脯氨酸特异性内切蛋白酶与羧肽酶组合的存在。JP5015314认为脱苦味作用的基础是脯氨酸残基的去除,该残基由脯氨酸特异性内切蛋白酶的活性来暴露并随后被羧肽酶去除。
本中请的实施例4描述了商业酶混合物对大豆蛋白质的作用,其中的酶混合物类似菌株米曲霉FS1-32的蛋白水解活性性质。本实验工作的一个结论是以菌株FS1-32记录的水平结合脯氨酸特异性内切蛋白水解活性不会导致具有羧基末端脯氨酸残基的大豆肽的增加。由于该结论对于在本申请中描述的不苦的蛋白质水解产物有重要的含义,我们决定通过用在米曲霉FS1-32中获得的酶混合物并在如JP5015314描述的条件下重复该实验。
将米曲霉FS1-32(从Micr.Ind Lab in Japan的保藏号12193获得的)涂平板于麦芽汁琼脂平板上,在35℃温育4天,然后在4℃贮存1天。将来自这些平板的孢子用于接种含有20克/kg的葡萄糖、15克/kg的脱脂大豆粉、5克/kg的低盐酵母提取物、1克/kg的KH2PO4和0.2克/kg的消泡剂的接种培养基。在脱矿质水中溶解后,将培养基的pH用硫酸调节到5.5,然后用具挡板的100ml的摇瓶将其分成20ml的等分。将含有培养基的摇瓶在121℃灭菌30分钟并在冷却后接种。在振荡培养器中于32℃培养2天后,取1ml用于接种另外100ml接种培养基。在振荡培养器中于32℃培养另外1天后,将培养物用于接种培养基。因为JP5015314没有提供关于所用发酵程序的信息,所以采用了如在EP 0 522 428中提供的规程和培养基。
根据EP 0 522 428的培养基含有如下成分酸性酪蛋白(ArmorProteins,法国)25.4克/升、烤制的大豆粉(Cargill,荷兰)8.6克/升、小麦麸(Zonnatura,荷兰)15.0克/升、玉米淀粉20.0克/升、鞣酸(Omnichem)16.0克/升和KH2PO426.6克/升。因为建议的鞣酸(用于刺激脯氨酸特异性内切蛋白酶的形成)没有在EP0522428中详细说明,所以使用了两种类型的鞣酸,即BREWTAN C和TANALW2(均来自Omnichem(Wetteren,比利时))。最后,将培养基的pH值用磷酸(20%)调节到4.5,然后用具挡板的500ml的摇瓶将其分成100ml的等分。将摇瓶在121℃灭菌30分钟。
在用1毫升预生长接种培养基接种后,将培养物在32℃和250rpm温育2~4天。为去除生物质,将培养物液体培养基在Whatman玻璃微纤维滤器(cat no 1820090)上过滤,然后贮存于-20℃。将部分该冷冻的材料冻干并用于活性测量以及用于大豆蛋白质的温育。
冻干的材料中脯氨酰-内肽酶、羧肽酶和内切蛋白酶的活性是完全按照如在JP5015314中描述的来测量的。已发酵2天的样品显示比进行建议的4天发酵的样品高得多的酶活性水平,因此决定使用这些2天的样品来最终与大豆蛋白质进行温育。这些显示最高的脯氨酰-内肽酶活性的样品的酶活性数据如下所示。
表7.每克冻干材料的酶活性
在样品1、3和4中测量的脯氨酰-内肽酶和羧肽酶的活性与在JP5015314中提供的数字是类似的。然而,在这些样品中测量的内切蛋白酶的活性比在JP501314中显示的低约200倍。考虑到在各种工业酶制剂中报道的内切蛋白水解活性(参见实施例4),用米曲霉FS1-32获得的和在JP5015314中详细说明的极其高的内切蛋白水解活性可能是不现实的。
在尽可能精确地复制JP5015314中的实施例2的尝试中,进行了如下的实验。将10克大豆蛋白质Soyamin 90HV(Lucas Meyer,Hamburg,德国)悬浮于100ml脱矿质水中并用4 N NaOH调节pH至8.5。然后加入0.5g的Delvolase(DSM Food Specialities,Seclin,法国)(代替来自Daiwa Kasei的Protin AY;Delvolase和Protin AY两者均为芽孢杆菌衍生的碱性内切蛋白酶)并将蛋白质溶液于60℃温育2小时(在JP5015314中用Protin AY温育的时间和温度没有详细说明)。最后,通过于92℃将溶液加热10分钟而使Delvolase失活。
然后根据在JP5015314中描述但根据想要的羧肽酶活性(0.01单位每克底物)进行了标准化的规程,将结果所得的蛋白质水解产物与样品1、3和4进行温育。其建议为对于每克大豆分离物必须加入2.0毫克的冻干酶样品1、2.7毫克冻干的酶样品3和1.3毫克冻干的酶样品4。结果所得的内切蛋白酶和脯氨酰-内切蛋白酶的活性在表8中给出。
在pH 5和50摄氏度温育5小时之后,将样品离心,然后将上清液冷冻保存直到进行LC/MS分析。
LC/MS分析是如在材料与方法中详细说明的来进行的。
在本实验中,蛋白质数据库仅由大豆蛋白质组成。在获得的肽中探测到的羧基末端脯氨酸残基的频率在下面详细说明。
表8用几种酶处理的大豆蛋白质
PEP脯氨酰-内肽酶或脯氨酸特异性内切蛋白酶从获得的数据看很明显大豆蛋白质与从米曲霉FS1-32获得的粗酶制剂温育不会导致具有羧基末端脯氨酸残基的肽的摩尔份数的显著增加。因此,在JP5015314中描述的脱苦味作用不能归结于这样的肽在水解终产物中高的发生率。
实施例13通过嗜热芽孢菌蛋白酶与来自曲霉属的脯氨酸特异性内切蛋白酶的组合而获得的无苦味的酪蛋白水解产物将来自黑曲霉G306的脯氨酸特异性内切蛋白酶过表达和色谱纯化(参见实施例10),并随后用于生产无苦味的酪蛋白水解产物。为该目的,我们向100mL含有酪蛋白酸钠(60g/L)(Miprodan30)的溶液中加入100mg嗜热芽孢菌蛋白酶(Thermoase)。在pH6.7和85摄氏度的温育立刻导致酪蛋白的絮凝沉淀。两小时的温育最终产生含有一些沉淀的澄清溶液。然后将溶液的pH调节到pH5.0,并通过在95摄氏度加热45分钟来使Thermoase失活。冷却后,品尝该溶液并发现非常苦。在该阶段酪蛋白酸溶液的DH(水解度;根据TNBS方法建立)为约35%。利用牛酪蛋白酸数据库通过LC/MS/MS对64个肽的分析显示具有羧基末端脯氨酸残基的肽的摩尔发生率为14%。
然后将3单位来自色谱纯化的黑曲霉脯氨酸特异性内切蛋白酶加入到25毫升水解产物中。在50摄氏度温育20小时后,通过将溶液在90℃加热30分钟实现了另一轮的酶失活。在冷却到室温后,将溶液轻轻倒出,并将清澈的上清液调节到pH值为4.0;发现酪蛋白酸水解产物保持完全溶解和清澈。品尝证明不存在任何苦味或为无味。用TNBS测得该水解终产物的DH为约50%;对64个肽的LC/MS/MS分析显示具有羧基末端脯氨酸残基的肽的摩尔发生率增加到45%。该45%几乎比在Miprodan底物中出现的脯氨酸的摩尔份数高4倍。
序列表<110>DSM NV<120>富含具有羧基末端脯氨酸残基的肽的蛋白质水解产物<130>20001WO<160>17<170>PatentIn version 3.1<210>1<211>1581<212>DNA<213>黑曲霉G306<400>1atgcgtgcct tctccgctgt cgctgctgcg gccctggcgc tctcttgggc gtctctggct 60caggctgctc gcccccgtct tgtgcccaag cctgtctctc ggccagcctc gagtaaatcg120gctgcgacca cgggcgaggc ttactttgag cagctgctgg accatcataa tccggagaag180ggcacctttt cccagaggta ctggtggagt actgaatact ggggtggtcc tgggtcaccg240gtcgtcctct ttactcctgg agaggtctct gccgatggct atgaggggta tctcaccaat300gggactctca ctggtgtcta tgcgcaggag atccagggtg ccgtcattct cattgagcac360cgctactggg gtgattcttc tccttatgag gtgctcaatg ccgaaactct tcagtacctc420acactggacc aagccattct ggacatgacc tacttcgccg agacggtgaa gctgcaattc480gataacagca cccgcagcaa tgcgcagaat gctccctggg tcatggtcgg tggatcatac540agtggtgcct tgacggcttg gaccgaatct gtcgcgcctg gaacgttctg ggcttaccat600gccactagtg ctcctgtgga ggctatctac gactattggc aatactttta ccccatccag 660caaggtatgg cacagaactg cagcaaggac gtgtctctgg tagccgagta tgtcgacaag 720attggaaaga acggaactgc caaggagcag caggcactca aggaattgtt tggtctggga 780gctgttgagc attttgatga ctttgccgct gtcctcccca acggaccgta cctctggcaa 840gacaacgact ttgccacggg atactcttcc ttcttccagt tctgtgacgc cgtcgagggt 900gtcgaagccg gcgcggcagt aacccccggc cccgagggtg tcggcctcga aaaggccctg 960gccaactacg caaactggtt caattcaacc attctccctg attactgcgc aagctacggc1020tactggaccg acgaatggag cgtcgcctgc ttcgacagct acaacgcctc gagccccatc1080tacaccgata cctccgtagg caatgccgtc gaccgccaat gggaatggtt cctctgcaac1140gagcctttct tctactggca ggacggtgct cccgagggta cctccaccat tgtgccccga1200ctcgtcagcg cctcctactg gcaacggcaa tgtccgctct acttccccga aacgaacggc1260tacacgtacg gcagcgcgaa gggtaagaac gccgccacgg tgaacagctg gaccggtgga1320tgggatatga cccgcaacac gacgcggttg atctggacga acgggcaata tgacccctgg1380cgggactccg gtgtgtcgag cactttccgg cccggtggac cgctggcgag cacggcgaat1440gaacccgtgc agattatccc gggcggattc cattgctcgg atttgtatat ggcggattat1500tatgcgaatg agggggttaa aaaggtggtg gataatgagg tgaagcagat caaggagtgg1560gtggaggagt attatgcctg a 1581<210>2<211>526<212>PRT<213>黑曲霉G306<400>2Met Arg Ala Phe Set Ala Val Ala Ala Ala Ala Leu Ala Leu Ser Trp1 5 10 15Ala Ser Leu Ala Gln Ala Ala Arg Pro Arg Leu Val Pro Lys Pro Val20 25 30Ser Arg Pro Ala Ser Ser Lys Ser Ala Ala Thr Thr Gly Glu Ala Tyr35 40 45Phe Glu Gln Leu Leu Asp His His Asn Pro Glu Lys Gly Thr Phe Ser50 55 60Gln Arg Tyr Trp Trp Ser Thr Glu Tyr Trp Gly Gly Pro Gly Ser Pro65 70 75 80Val Val Leu Phe Thr Pro Gly Glu Val Ser Ala Asp Gly Tyr Glu Gly85 90 95Tyr Leu Thr Asn Gly Thr Leu Thr Gly Val Tyr Ala Gln Glu Ile Gln100 105 110Gly Ala Val Ile Leu IIe Glu His Arg Tyr Trp Gly Asp Ser Ser Pro115 120 125Tyr Glu Val Leu Asn Ala Glu Thr Leu Gln Tyr Leu Thr Leu Asp Gln130 135 140Ala Ile Leu Asp Met Thr Tyr Phe Ala Glu Thr Val Lys Leu Gln Phe145 150 155 160Asp Asn Ser Thr Arg Ser Asn Ala Gln Asn Ala Pro Trp Val Met Val165 170 175Gly Gly Ser Tyr Ser Gly Ala Leu Thr Ala Trp Thr Glu Ser Val Ala180 185 190Pro Gly Thr Phe Trp Ala Tyr His Ala Thr Ser Ala Pro Val Glu Ala195 200 205Ile Tyr Asp Tyr Trp Gln Tyr Phe Tyr Pro Ile Gln Gln Gly Met Ala210 215 220Gln Asn Cys Ser Lys Asp Val Ser Leu Val Ala Glu Tyr Val Asp Lys225 230 235 240Ile Gly Lys Asn Gly Thr Ala Lys Glu Gln Gln Ala Leu Lys Glu Leu245 250 255Phe Gly Leu Gly Ala Val Glu His Phe Asp Asp Phe Ala Ala Val Leu260 265 270Pro Asn Gly Pro Tyr Leu Trp Gln Asp Asn Asp Phe Ala Thr Gly Tyr275 280 285Ser Ser Phe Phe Gln Phe Cys Asp Ala Val Glu Gly Val Glu Ala Gly290 295 300Ala Ala Val Thr Pro Gly Pro Glu Gly Val Gly Leu Glu Lys Ala Leu305 310 315 320Ala Asn Tyr Ala Asn Trp Phe Asn Ser Thr Ile Leu Pro Asp Tyr Cys325 330 335Ala Ser Tyr Gly Tyr Trp Thr Asp Glu Trp Ser Val Ala Cys Phe Asp340 345 350Ser Tyr Asn Ala Ser Ser Pro Ile Tyr Thr Asp Thr Ser Val Gly Asn355 360 365Ala Val Asp Arg Gln Trp Glu Trp Phe Leu Cys Asn Glu Pro Phe Phe370 375 380Tyr Trp Gln Asp Gly Ala Pro Glu Gly Thr Ser Thr Ile Val Pro Arg385 390 395 400Leu Val Ser Ala Ser Tyr Trp Gln Arg Gln Cys Pro Leu Tyr Phe Pro405 410 415Glu Thr Asn Gly Tyr Thr Tyr Gly Ser Ala Lys Gly Lys Asn Ala Ala
420 425 430Thr Val Asn Ser Trp Thr Gly Gly Trp Asp Met Thr Arg Asn Thr Thr435 440 445Arg Leu Ile Trp Thr Asn Gly Gln Tyr Asp Pro Trp Arg Asp Ser Gly450 455 460Val Ser Ser Thr Phe Arg Pro Gly Gly Pro Leu Ala Ser Thr Ala Asn465 470 475 480Glu Pro Val Gln Ile Ile Pro Gly Gly Phe His Cys Ser Asp Leu Tyr485 490 495Met Ala Asp Tyr Tyr Ala Asn Glu Gly Val Lys Lys Val Val Asp Asn500 505 510Glu Val Lys Gln Ile Lys Glu Trp Val Glu Glu Tyr Tyr Ala515 520 525<210>3<211>9<212>PRT<213>黑曲霉G306<400>3Ala Thr Thr Gly Glu Ala Tyr Phe Glu15<210>4<211>26<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(26)<223>/修饰的碱基=位置3、6、9、12和18的“肌苷”<400>4gcaacaacag gagargcata yttyga 26<210>5<211>26<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(26)<223>/修饰的碱基=位置9、15、18、21和24的“肌苷”<400>5tcraartaag cytcaccagt agtagc 26<210>6<211>14<212>PRT<213>黑曲霉G306<400>6Ala Thr Val Asn Ser Trp Thr Gly Gly Trp Asp Phe Thr Arg1 5 10<210>7<211>23<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(23)<223>/修饰的碱基=位置6、9和12的“肌苷”<400>7tggacaggag gatgggaytt yac 23<210>8<211>23<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(23)<223>/修饰的碱基=位置12、15和18的“肌苷”<400>8gtraartccc aaccaccagt cca 23<210>9<211>9<212>PRT<213>黑曲霉G306<400>9Asp Gly Ala Pro Glu Gly Thr Ser Thr1 5<210>10<211>20<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(20)<223>/修饰的碱基=位置6、9、12和18的“肌苷”<400>10gayggagcac cagarggaac20<210>11<211>20<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(20)<223>/修饰的碱基=位置3、9、12和15的肌苷<400>11gtaccytcag gagcaccrtc 20<210>12<211>10<212>PRT<213>黑曲霉G306<400>12Glu Arg Glu Ala Gly Ala Ala Val Thr Pro1 5 10<210>13<211>23<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(23)<223>/修饰的碱基=位置6、9、12、15、18和21的“肌苷”<400>13gargcaggag cagcagtaac acc 23<210>14<211>23<212>DNA<213>合成的构建体<220><221>修饰的碱基<222>(1)..(23)<223>/修饰的碱基=位置3、6、9、12、15和18的“肌苷”<400>14ggagtaacag cagcaccagc ytc 23<210>15<211>3290<212>DNA<213>黑曲霉CBS513.88<400>15gagaggcaga aggagtcatt tatcacttgt attccaatgt attttccatt tatagatact 60gcattcaaat gcaccgttta gcatagcatc ccacattcta tttcattcca atctcatgcc120attgccatcc ccggtattaa tttacttctc cgccttatct tgcaatcttg caatctcttt180ctcctcgtta tcacgcgttc ctgcaggcgc acctccgatg gcactgcagc cggagtcccc240gcggcgccgg cactactaaa gactaaagtg tctagtctag cctccaatgt gctcacctcc300atcagcatct catccattta tcttctgacg atgtcatctg caggctccac cccctccggc360cgccccgacg ctctccgacg gtgcacaaca atcaattctg cagtcacgct caagattcgt420ccctgccgga ctcctcatgc cgtgcctggt ttaatctatg caatggagta aggtagtatc480gcctagcagg agcggagttc ctgctgcgct cacgccatgg tgccggcgca gacataaatc540gctcgtttcc tccggcgctg gccgttctct cgagccagtt tgtctgttgt ggttgtagga600tcctctgttc ccctcgacag ctcacaatgc gttccttctc cgttgtcgct gccgcgtcac660tggcgctctc ttgggcgtct ctggcccagg ctgctcgccc ccgtcttgtg cccaagccta720tctctcggcc agcttcgagt aagtcggctg cgactacggg tgaggcttat tttgagcagc780tgctggacca tcacaacccg gagaagggaa cgttttccca gcggtactgg tggagtactg 840aatactgggg tggacctggg tcaccggtgc gtctctgaca tttggtctta tgaccggcca 900tattgaaact tagccggtgg caaggtccgc aatcatgagg aacattgctg attaaactag 960gtggtcctct ttaaccctgg agaggtctct gccgatggct atgaggggta tctcaccaac1020gatactctca ctggtgtcta tgcgcaggag atccagggtg ccgtcattct cattgaacgt1080gagtgtcact gctaccatgg aaaaaagaca ttcgctgatc gaccccaatc tagaccgcta1140ctggggcgac tcttcgcctt atgaggtgct caatgccgaa acacttcagt atctcacact1200ggatcagtcc attctggaca tgacctactt cgccgagacg gtaaagctgc agttcgataa1260tagcagccgc agcaatgcgc agaatgctgt atgttacctt caccgctcta tgtttctgat1320aggtactgac aacgtagccc tgggtcatgg tcggtggctc atacagcggt gccttgacgg1380cttggaccga gtctatcgcg cctggaacgt tctgggctta ccatgccacc agtgcgcctg1440tggaggctat ctatgacttt gtaggtgtag cctgctcttg ttatctatac ttgcagctaa1500ccaagccagt ggcaatactt ctaccccatt cagcaaggta tggcacagaa ctgcagcaag1560gatgtgtctc tggtagccga gtatgtcgac aaaattggga agaatggaac tgccaaggaa1620cagcaggagc tcaaagaatt gtttggtctg ggagctgttg agcattacga tgactttgcc1680gcgtgagtac ttcaaagtct atagacgagc ttttctgaca ggaacagtgt cctgcccaac1740ggaccgtacc tctggcaaga caacgacttt gtcacaggat actcttcctt cttccagttc1800tgtgatgctg tcgaggtgag ttaccaccag attcctcttg attgaagcaa tatactaacg1860gacacagggt gtcgaagccg gcgcggcagt gacccccggc cccgagggcg tcggacttga1920aaaggccctg gccaactacg caaactggtt caattcaacc atactcccta actgtatttc1980accatctctt gtctcgttcc tctcccttat cctcccagac taacctagtg acagactgcg2040caagctacgg ctactggacc gacgaatgga gcgtcgcctg tttcgacagc tataatgcct2100cgagccccat cttcaccgac acctccgtgg gtaaccctgt cgaccgccaa tgggaatggt2160tcctctgcaa cgagcctttc ttctggtggc aggagtgcgt accccttacc tcattcatga2220taacacacga acaattccac taacaaagat ccagcggtgc ccccgaggga acctccacta2280ttgtgccccg gctcgtcagc gcctcctact ggcaacgcca atgcccgctc tacttccccg2340aagttaacgg ctacacgtac ggcagcgcga agggtaaaaa ctccgctacg gtgaacagct2400ggacgggtgg atgggatatg acccgcaaca cgacgcggtt gatctggacg aacgggtagg2460tctcccccta atttccgttg aatgtgatgt gaagataaac tcaatgctaa taaattgaga2520aggcaatatg acccctggcg cgactccggt gtgtcgagca ctttccggcc cggtggtccg2580ctggttagca cggcgaacga acccgtgcag attattccgg gcgggttcca ttgctcggac2640ttgtatatgg aggattacta tgcgaatgag ggtgtgagga aggtggttga taatgaggtg2700aagcagatta aggagtgggt ggaggagtat tatgcttgat gaagatactg gtggacatat2760ggagtgtaca taagatgaat ggtcataaaa tgatgatggt agatacggct atggctgttg2820attagatggt cctttcgcat ttcctaatta ctgagcacgt gctccatggt atgggaagtg2880gagacgttgc tatatatatt gactgtcggg ctattgttca cggcgtagaa gctagacgct2940ttgtctatgt ggccttcact aaagaccgtg actctgccca gtcttccccc cttcgaggac3000ctggtattag ccaaacccac ccacaaacct aacaaagatc atcgtgacat tgaagtcact3060ctaggtactg ctggcgctga ttacagtggc tcaattcgaa catttcaaca gcacataagg3120gaagggtcgc ttcacttgct accttgatac gaaagcagcc acgcccaaca cttatagggg3180tgacaaccat cggcatgctg ggttatctac tatatctcct gattctgtgg atcctggaga3240tcgatctggt acactaatct actacaatgc atgtgaagta gggataggca 3290<210>16<211>1581<212>DNA<213>黑曲霉CBS513.88<400>16atgcgttcct tctccgttgt cgctgccgcg tcactggcgc tctcttgggc gtctctggcc 60caggctgctc gcccccgtct tgtgcccaag cctatctctc ggccagcttc gagtaagtcg120gctgcgacta cgggtgaggc ttattttgag cagctgctgg accatcacaa cccggagaag180ggaacgtttt cccagcggta ctggtggagt actgaatact ggggtggacc tgggtcaccg240gtggtcctct ttaaccctgg agaggtctct gccgatggct atgaggggta tctcaccaac300gatactctca ctggtgtcta tgcgcaggag atccagggtg ccgtcattct cattgaacac360cgctactggg gcgactcttc gccttatgag gtgctcaatg ccgaaacact tcagtatctc420acactggatc agtccattct ggacatgacc tacttcgccg agacggtaaa gctgcagttc480gataatagca gccgcagcaa tgcgcagaat gctccctggg tcatggtcgg tggctcatac540agcggtgcct tgacggcttg gaccgagtct atcgcgcctg gaacgttctg ggcttaccat600gccaccagtg cgcctgtgga ggctatctat gacttttggc aatacttcta ccccattcag 660caaggtatgg cacagaactg cagcaaggat gtgtctctgg tagccgagta tgtcgacaaa 720attgggaaga atggaactgc caaggaacag caggagctca aagaattgtt tggtctggga 780gctgttgagc attacgatga ctttgccgct gtcctgccca acggaccgta cctctggcaa 840gacaacgact ttgtcacagg atactcttcc ttcttccagt tctgtgatgc tgtcgagggt 900gtcgaagccg gcgcggcagt gacccccggc cccgagggcg tcggacttga aaaggccctg 960gccaactacg caaactggtt caattcaacc atactcccta actactgcgc aagctacggc1020tactggaccg acgaatggag cgtcgcctgt ttcgacagct ataatgcctc gagccccatc1080ttcaccgaca cctccgtggg taaccctgtc gaccgccaat gggaatggtt cctctgcaac1140gagcctttct tctggtggca ggacggtgcc cccgagggaa cctccactat tgtgccccgg1200ctcgtcagcg cctcctactg gcaacgccaa tgcccgctct acttccccga agttaacggc1260tacacgtacg gcagcgcgaa gggtaaaaac tccgctacgg tgaacagctg gacgggtgga1320tgggatatga cccgcaacac gacgcggttg atctggacga acgggcaata tgacccctgg1380cgcgactccg gtgtgtcgag cactttccgg cccggtggtc cgctggttag cacggcgaac1440gaacccgtgc agattattcc gggcgggttc cattgctcgg acttgtatat ggaggattac1500tatgcgaatg agggtgtgag gaaggtggtt gataatgagg tgaagcagat taaggagtgg1560gtggaggagt attatgcttg a 1581<210>17<211>526<212>PRT<213>黑曲霉CBS513.88<400>17Met Arg Ser Phe Ser Val Val Ala Ala Ala Ser Leu Ala Leu Ser Trp1 5 10 15Ala Ser Leu Ala Gln Ala Ala Arg Pro Arg Leu Val Pro Lys Pro Ile20 25 30Ser Arg Pro Ala Ser Ser Lys Ser Ala Ala Thr Thr Gly Glu Ala Tyr35 40 45Phe Glu Gln Leu Leu Asp His His Asn Pro Glu Lys Gly Thr Phe Ser50 55 60Gln Arg Tyr Trp Trp Ser Thr Glu Tyr Trp Gly Gly Pro Gly Ser Pro65 70 75 80Val Val Leu Phe Asn Pro Gly Glu Val Ser Ala Asp Gly Tyr Glu Gly85 90 95Tyr Leu Thr Asn Asp Thr Leu Thr Gly Val Tyr Ala Gln Glu Ile Gln100 105 110Gly Ala Val Ile Leu Ile Glu His Arg Tyr Trp Gly Asp Ser Ser Pro115 120 125Tyr Glu Val Leu Asn Ala Glu Thr Leu Gln Tyr Leu Thr Leu Asp Gln130 135 140Ser Ile Leu Asp Met Thr Tyr Phe Ala Glu Thr Val Lys Leu Gln Phe145 150 155 160Asp Asn Ser Ser Arg Ser Asn Ala Gln Asn Ala Pro Trp Val Met Val165 170 175Gly Gly Ser Tyr Ser Gly Ala Leu Thr Ala Trp Thr Glu Ser Ile Ala180 185 190Pro Gly Thr Phe Trp Ala Tyr His Ala Thr Ser Ala Pro Val Glu Ala195 200 205Ile Tyr Asp Phe Trp Gln Tyr Phe Tyr Pro Ile Gln Gln Gly Met Ala210 215 220Gln Asn Cys Ser Lys Asp Val Ser Leu Val Ala Glu Tyr Val Asp Lys225 230 235 240Ile Gly Lys Asn Gly Thr Ala Lys Glu Gln Gln Glu Leu Lys Glu Leu245 250 255Phe Gly Leu Gly Ala Val Glu His Tyr Asp Asp Phe Ala Ala Val Leu260 265 270Pro Asn Gly Pro Tyr Leu Trp Gln Asp Asn Asp Phe Val Thr Gly Tyr
275 280 285Ser Ser Phe Phe Gln Phe Cys Asp Ala Val Glu Gly Val Glu Ala Gly290 295 300Ala Ala Val Thr Pro Gly Pro Glu Gly Val Gly Leu Glu Lys Ala Leu305 310 315 320Ala Asn Tyr Ala Asn Trp Phe Asn Ser Thr Ile Leu Pro Asn Tyr Cys325 330 335Ala Ser Tyr Gly Tyr Trp Thr Asp Glu Trp Ser Val Ala Cys Phe Asp340 345 350Ser Tyr Asn Ala Ser Ser Pro Ile Phe Thr Asp Thr Ser Val Gly Asn355 360 365Pro Val Asp Arg Gln Trp Glu Trp Phe Leu Cys Asn Glu Pro Phe Phe370 375 380Trp Trp Gln Asp Gly Ala Pro Glu Gly Thr Ser Thr Ile Val Pro Arg385 390 395 400Leu Val Ser Ala Ser Tyr Trp Gln Arg Gln Cys Pro Leu Tyr Phe Pro405 410 415Glu Val Asn Gly Tyr Thr Tyr Gly Ser Ala Lys Gly Lys Asn Ser Ala420425 430Thr Val Asn Ser Trp Thr Gly Gly Trp Asp Met Thr Arg Asn Thr Thr435 440 445Arg Leu Ile Trp Thr Asn Gly Gln Tyr Asp Pro Trp Arg Asp Ser Gly450 455 460Val Ser Ser Thr Phe Arg Pro Gly Gly Pro Leu Val Ser Thr Ala Asn465 470 475 480Glu Pro Val Gln Ile Ile Pro Gly Gly Phe His Cys Ser Asp Leu Tyr485 490 495Met Glu Asp Tyr Tyr Ala Asn Glu Gly Val Arg Lys Val Val Asp Asn500 505 510Glu Val Lys Gln Ile Lys Glu Trp Val Glu Glu Tyr Tyr Ala515 520 525-13--1-
权利要求
1.一种分离的具有脯氨酸特异性内切蛋白酶活性的多肽,该多肽选自(a)一种其氨基酸序列与SEQ ID NO2的氨基酸1~526具有至少40%的氨基酸序列一致性的多肽或其片段;(b)一种由多核苷酸编码的多肽,该多核苷酸在低严格性条件下与(i)SEQ ID NO1的核酸序列或其片段杂交,该核酸序列或片段与其在60个,优选地为100个核苷酸上具有至少80%或90%的一致性,更优选地为在200个核苷酸上具有至少90%的一致性,或与(ii)SEQ IDNO1的核酸序列的互补核酸序列杂交。
2.权利要求1的多肽,该多肽的氨基酸序列与SEQ ID NO2的氨基酸1~526具有至少约50%的氨基酸序列一致性,优选地为至少约60%,优选地为至少约65%,优选地为至少约70%,更优选地为至少约80%,更加优选地为至少约90%,仍然更加优选地为至少约95%,且最优选地为至少约97%。
3.权利要求1的多肽,该多肽包含SEQ ID NO2的氨基酸序列。
4.权利要求1的多肽,该多肽由多核苷酸编码,所述多核苷酸在低严格性条件下、更优选地在中等严格性条件下且最优选地在高严格性条件下与(i)SEQ ID NO1的核酸序列或其片段杂交,或与(ii)SEQID NO1的核酸序列的互补核酸序列杂交。
5.权利要求1的多肽,该多肽获得自真菌,优选地获得自曲霉属,更优选地获得自黑曲霉。
6.一种包含核酸序列的分离的多核苷酸,所述核酸序列编码权利要求1的多肽,或者与SEQ ID NO1在低严格性条件下、更优选地在中等严格性条件下且最优选地在高严格性条件下杂交。
7.一种包含权利要求6的多核苷酸的核酸构建体,其中的多核苷酸可操作地连接到一个或多个在适当的表达宿主中指导多肽生产的控制序列上。
8.一种包含权利要求7的核酸构建体的重组表达载体。
9.一种包含权利要求7的核酸构建体或权利要求8的载体的重组宿主细胞。
10.一种生产权利要求1~5中任意一项的多肽的方法,包括培养根据权利要求9的菌株/重组宿主细胞以生产包含多肽的上清液和/或细胞,以及回收该多肽。
11.一种由权利要求10的方法生产的多肽。
12.一种生产权利要求1~5中的多肽的方法,包括在适合于多肽生产的条件下培养包含核酸构建体的宿主细胞,以及回收该多肽,其中的核酸构建体包含编码该多肽的多核苷酸。
13.一种由权利要求12的方法生产的多肽。
14.一种编码根据权利要求1的内切蛋白酶的DNA分子。
15.黑曲霉G306或其突变体或变体。
16.根据权利要求1~5中任意一项的多肽在食物或饲料制剂中的用途。
全文摘要
本发明提供了一种分离的具有脯氨酸特异性内切蛋白酶活性的多肽,该多肽选自(a)一种其氨基酸序列与SEQ ID NO2的氨基酸1~526具有至少40%的氨基酸序列一致性的多肽,或其片段;(b)一种由多核苷酸编码的多肽,该多核苷酸在低严格性条件下与(i)SEQ ID NO1的核酸序列或其片段杂交,该核酸序列或片段与其在60个,优选地为100个核苷酸上具有至少80%或90%的一致性,更优选地为在200个核苷酸上具有至少90%的一致性,或与(ii)SEQ ID NO1的核酸序列的互补核酸序列杂交。
文档编号A23L2/84GK1484694SQ01821603
公开日2004年3月24日 申请日期2001年12月6日 优先权日2000年12月7日
发明者P·J·T·戴克, R·A·M·范德霍文, L·伊登斯, L·德兰格, M 范德霍文, P J T 戴克, 几, 撬 申请人:Dsm Ip资产有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1