蛋白酶缺陷丝状真菌细胞及其使用方法

文档序号:466923阅读:1076来源:国知局
蛋白酶缺陷丝状真菌细胞及其使用方法
【专利摘要】本公开涉及可用于在丝状真菌细胞,特别是包含三种具有降低的活性的内源蛋白酶和编码异源多肽的重组多核苷酸的丝状真菌细胞,中产生异源蛋白的组合物和方法,其中所述多肽以比其中所述蛋白酶不具有降低的活性的对应亲本丝状真菌细胞中该多肽的产生水平高至少两倍的水平产生。
【专利说明】蛋白酶缺陷丝状真菌细胞及其使用方法 发明领域
[0001] 本公开涉及可用于在丝状真菌细胞中产生异源蛋白质的组合物和方法。

【背景技术】
[0002] 真核生物蛋白质(特别是治疗性蛋白质如免疫球蛋白)的翻译后修饰通常是 正确的蛋白质折叠和功能必需的。因为标准的原核表达系统缺乏这类修饰所需的适当 机制,必须使用替代的表达系统来产生这些治疗性蛋白质。即使在真核蛋白质不具有翻 译后修饰的情况中,原核表达系统还通常缺乏正确折叠所需的必要的伴侣蛋白。酵母和 真菌对于表达蛋白质是有吸引力的选项,因为它们可以容易地在简单培养基中大规模生 长,这允许低的生产成本,且酵母和真菌具有执行与在哺乳动物细胞中发现的相似功能 的翻译后机制和伴侣蛋白。此外,操作酵母和真菌细胞的相对简单的遗传构成以及更复 杂的真核细胞如哺乳动物或昆虫细胞的工具是可用的(De Pourcq等,Appl Microbiol Biotechnol,87(5) :1617-31)。尽管存在这些优点,许多治疗性蛋白质仍然在哺乳动物中产 生,其产生具有与天然人蛋白质最相似的翻译后修饰的治疗性蛋白质,而由酵母和真菌天 然产生的翻译后修饰通常与哺乳动物中发现的不同。
[0003] 为解决这种不足,开发了产生与天然人蛋白质中发现的翻译后修饰更相似的翻译 后修饰新的酵母和真菌菌株。因此,存在着使用酵母和真菌细胞表达更复杂的蛋白质的新 兴趣。但是,由于工业上长时间内集中于哺乳动物细胞培养技术,真菌细胞表达系统如木霉 属未如哺乳动物细胞培养一样良好建立且因此在表达哺乳动物蛋白质时存在缺陷。
[0004] 因此,在本领域中仍需要可以稳定地产生异源蛋白质如免疫球蛋白的改进的丝状 真菌细胞如木霉属真菌细胞,优选以高表达水平产生。
[0005] 发明概述
[0006] 本文描述的是包括具有降低的或没有可检测的至少三种蛋白酶的活性且具有编 码以提高的水平产生的异源多肽的重组多核苷酸的丝状真菌细胞如木霉属真菌细胞的组 合物。本文进一步描述的是提高异源多肽稳定性的方法和制备其中蛋白酶不具有降低的活 性的异源多肽的方法。
[0007] 因此,一个方面包括具有降低的或没有可检测的至少三种蛋白酶的活性的丝状真 菌细胞,其中该细胞进一步包含编码异源多肽的重组多核苷酸,该异源多肽以比其中所述 蛋白酶不具有降低的活性的对应亲本丝状真菌细胞中该多肽的产生水平高至少两倍的水 平产生。在某些实施方式中,当所述细胞是曲霉属细胞时,总蛋白酶活性降低到其中所述蛋 白酶不具有降低的活性的对应亲本曲霉属细胞的总蛋白酶活性的50%或更低。在其它实施 方式中,丝状真菌细胞的总蛋白酶活性降低到其中所述蛋白酶不具有降低的活性的对应亲 本丝状真菌细胞的总蛋白酶活性的49 %或更低,31 %或更低。
[0008] 在某些实施方式中,至少三种蛋白酶的表达水平被降低或消除。在某些实施方式 中,编码三种蛋白酶的基因各自包含降低或消除相应蛋白酶活性的突变。在可以与前述实 施方式组合的某些实施方式中,三种蛋白酶编码基因是P印l、tspl和slpl。在其它实施方 式中,三种蛋白酶编码基因是gapl、slpl和pepl。
[0009] 在某些实施方式中,真菌细胞的四种内源蛋白酶具有降低的或没有可检测的活 性;编码该四种蛋白酶的基因各自包含降低或消除相应蛋白酶活性的突变。在可以与前述 实施方式组合的某些实施方式中,四种蛋白酶编码基因是pepl、tspl、slpl和gapl。
[0010] 在可以与前述实施方式组合的某些实施方式中,三种或四种蛋白酶编码基因选 自 pepl、pep2、pep3、pep4、pep5、pep8、pepll、pepl2、tspl、slpl、slp2、slp3、slp7、gapl 和gap2。在可以与前述实施方式组合的某些实施方式中,三种或四种蛋白酶编码基因选自 pepl、pep3、pep4、tspl、slpl、slp2、gapl和gap2。在某些实施方式中,三种或四种蛋白酶 编码基因选自 pepl、pep2、pep3、pep4、pep5、gapl、gap2、slpl、slp2 和 tspl。 toon] 在某些实施方式中,真菌细胞的五种内源蛋白酶具有降低的或没有可检测的活 性;编码该五种蛋白酶的基因各自包含降低或消除相应蛋白酶活性的突变。在可以与前述 实施方式组合的某些实施方式中,五种蛋白酶编码基因是pepl、tspl、slpl、gapl和pep4。 在其它实施方式中,五种蛋白酶编码基因是pep 1、tspl、slpl、gapl和gap2。
[0012] 在某些实施方式中,真菌细胞的六种内源蛋白酶具有降低的或没有可检测的活 性;编码该六种蛋白酶的基因各自包含降低或消除相应蛋白酶活性的突变。在某些实施方 式中,所述细胞具有六种蛋白酶编码基因,其各包含降低或消除相应蛋白酶活性的突变,且 六种蛋白酶编码基因是pepl、tspl、slpl、gapl、gap2和pep4。
[0013] 在可以与前述实施方式组合的某些实施方式中,真菌细胞具有三到六种具有降低 的或没有可检测的活性的蛋白酶,该三到六种蛋白酶各选自pepl、pep2、pep3、pep4、pep5、 tspl、slpl、slp2、slp3、gapl 和 gap2〇
[0014] 在可以与前述实施方式组合的某些实施方式中,细胞具有七种蛋白酶编码基因, 其各包含降低或消除相应蛋白酶活性的突变,且七种蛋白酶编码基因是P印1、tspl、slpl、 gap1、gap2、pep4 和 pep3 〇
[0015] 在可以与前述实施方式组合的某些实施方式中,细胞具有八种蛋白酶编码基因, 其各包含降低或消除相应蛋白酶活性的突变,且八种蛋白酶编码基因是Ρ印1、tspl、slpl、 gapl、gap2、pep4、pep3 和 pep5〇
[0016] 在可以与前述实施方式组合的某些实施方式中,真菌细胞具有活性降低的另外的 蛋白酶,编码另外的蛋白酶的基因包含降低或消除相应蛋白酶活性的突变,且另外的蛋白 酶选自 pep7、pep8、pepll、pepl2、tppl、gap2、slp3、slp5、slp6、slp7 和 slp8。
[0017] 在可以与前述实施方式组合的某些实施方式中,异源多肽是哺乳动物多肽。在某 些实施方式中,哺乳动物多肽是糖基化的。
[0018] 在某些实施方式中,哺乳动物多肽选自免疫球蛋白、抗体及其抗原结合片段、生长 因子、干扰素、细胞因子和白介素。在某些实施方式中,哺乳动物多肽是免疫球蛋白或抗体。 在某些实施方式中,哺乳动物多肽选自胰岛素样生长因子1(IGF1)、人生长激素(hGH)和干 扰素 ct 2b (IFN a 2b)。
[0019] 在可以与前述实施方式组合的某些实施方式中,异源多肽是非哺乳动物多肽。 在某些实施方式中,非哺乳动物多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维 素酶、壳多糖酶、角质酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖 淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、聚糖酶、氧化酶、果胶分解酶 (pectinolytic enzyme)、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核 糖核酸酶、转谷氨酰胺酶或木聚糖酶。
[0020] 在可以与前述实施方式组合的某些实施方式中,真菌细胞进一步包含ALG3 (甘露 糖基转移酶)的降低的活性或没有可检测的活性。在某些实施方式中,编码ALG3的基因包 含降低或消除相应活性的突变。在可以与前述实施方式组合的某些实施方式中,真菌细胞 进一步包含编码α -1,2-甘露糖苷酶的多核苷酸。
[0021] 在可以与前述实施方式组合的某些实施方式中,真菌细胞具有降低希望活性降低 的蛋白酶的表达的突变。在可以与前述实施方式组合的某些实施方式中,突变是编码蛋白 酶的基因内的缺失。在可以与前述实施方式组合的某些实施方式中,突变是编码蛋白酶的 催化结构域的基因部分的缺失。在可以与前述实施方式组合的某些实施方式中,真菌细胞 具有编码蛋白酶的催化结构域的基因部分中的点突变。
[0022] 在其它实施方式中,一种或多种蛋白酶的蛋白酶活性的降低或消除由对于选自 pep-型蛋白酶、胰蛋白酶样丝氨酸蛋白酶、gap-型蛋白酶、sedolisin蛋白酶和sip-型蛋 白酶的i) 一种蛋白酶或ii)两种或更多种蛋白酶特异性的RNAi构建体产生。在某些实施 方式中,RNAi构建体对于slp2、slp3、slp5和/或slp6是特异性的。
[0023] 在可以与前述实施方式组合的某些实施方式中,真菌细胞进一步包含N-乙酰葡 糖胺基转移酶I催化结构域和N-乙酰葡糖胺基转移酶II催化结构域。在某些实施方式 中,N-乙酰葡糖胺基转移酶I催化结构域和N-乙酰葡糖胺基转移酶II催化结构域由多核 苷酸编码。在某些实施方式中,N-乙酰葡糖胺基转移酶I催化结构域由第一多核苷酸编码 和N-乙酰葡糖胺基转移酶II催化结构域由第二多核苷酸编码。在可以与前述实施方式组 合的某些实施方式中,真菌细胞进一步包含编码甘露糖苷酶II和/或半乳糖基转移酶的多 核苷酸。在某些实施方式中,真菌细胞包含选自α?,2-甘露糖苷酶、N-乙酰葡糖胺基转移 酶I、Ν-乙酰葡糖胺基转移酶II、甘露糖苷酶II和/或半乳糖基转移酶的酶,所述酶进一 步包括靶向肽,例如,用于相应酶的正确定位的异源靶向肽。在某些实施方式中,靶向肽选 自 SEQ ID Ν0:589-594。
[0024] 在可以与前述实施方式组合的某些实施方式中,真菌细胞是木霉属真菌细胞、毁 丝霉属真菌细胞、曲霉属真菌细胞、链孢霉属真菌细胞、镰孢菌属或青霉菌属真菌细胞或者 金孢子菌属真菌细胞。在可以与前述实施方式组合的某些实施方式中,真菌细胞是里氏木 霉(Trichoderma reesei)〇
[0025] 在可以与前述实施方式组合的某些实施方式中,真菌细胞对于p印4蛋白酶是野 生型的。
[0026] 另一个方面包括通过以下方式提高异源多肽稳定性的方法:a)提供前述任何实 施方式的丝状真菌细胞和b)培养该细胞以表达该异源多肽,其中所述异源多肽与其中所 述蛋白酶不具有降低的活性(例如,如不包含编码该蛋白酶的基因的突变)的对应亲本丝 状真菌细胞中产生的异源多肽相比具有提高的稳定性。另一个方面包括通过以下方式制 备异源多肽的方法:a)提供前述任何实施方式的丝状真菌细胞;b)培养所述宿主细胞以使 得表达所述异源多肽,和c)纯化所述异源多肽。在可以与前述实施方式组合的某些实施方 式中,所述丝状真菌细胞进一步包含载体蛋白。在某些实施方式中,所述载体蛋白是CHB1。 在可以与前述实施方式组合的某些实施方式中,所述培养是在包含蛋白酶抑制剂的培养基 中。在某些实施方式中,所述培养是在具有选自SBT1和胰凝乳蛋白酶抑制剂的一种或两种 蛋白酶抑制剂的培养基中。在某些实施方式中,根据该方法产生的异源多肽是糖基化的哺 乳动物多肽且多肽的总N-聚糖的至少10%、至少20%、至少30%、至少40%、至少50%、 至少60 %、至少70 %、至少80 %、至少90 %或100 % (摩尔% )由Man3GlcNAc2N-聚糖组 成。在其它实施方式中,根据该方法产生的异源多肽是糖基化的哺乳动物多肽且多肽的总 N-聚糖的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至 少80%、至少90%或100% (摩尔% )由复合N-聚糖组成。在某些实施方式中,根据该方 法产生的异源多肽是糖基化的哺乳动物多肽且多肽的总N-聚糖的至少10%、至少20%、 至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100% (摩 尔% )由杂合N-聚糖组成。在某些实施方式中,根据该方法产生的异源多肽是糖基化的哺 乳动物多肽且多肽的总N-聚糖的至少10 %、至少20 %、至少30 %、至少40 %、至少50 %、至 少60%、至少70%、至少80%、至少90%或100% (摩尔% )由G1或G2N-聚糖组成。另一 个方面包括可通过上述方法获得的异源多肽。
[0027] 另一个方面包括选自 pepl、pep2、pep3、pep4、pep5、tspl、slpl、slp2、gapl 和 gap2 的至少三种蛋白酶具有降低的或没有可检测的活性的木霉属真菌细胞,其中所述细胞进一 步包含编码产生水平比对应亲本木霉属真菌细胞中该多肽的产生水平高至少2倍的哺乳 动物多肽的重组多核苷酸。
[0028] 在某些实施方式中,至少三种蛋白酶的表达水平在木霉属真菌细胞中降低或消 除。在某些实施方式中,编码至少三种蛋白酶的基因各自包含降低或消除木霉属真菌细胞 中相应蛋白酶活性的突变。在某些实施方式中,木霉属真菌细胞包括具有降低或消除蛋白 酶活性的突变的三个蛋白酶编码基因,其选自gapl、slpl和pepl。在可以与前述实施方式 组合的某些实施方式中,木霉属真菌细胞中的哺乳动物多肽是抗体或其抗原结合片段或者 免疫球蛋白,且该至少三种蛋白酶选自pepl、pep3、pep4、tspl、slpl、slp2、gapl和gap2。在 某些实施方式中,木霉属真菌细胞包含四种蛋白酶编码基因,其各包含降低或消除相应蛋 白酶活性的突变,且具有这种突变的四种蛋白酶编码基因是P印l、tspl、slpl和gapl。在某 些实施方式中,木霉属真菌细胞具有五种蛋白酶编码基因,其各包含降低或消除相应蛋白 酶活性的突变,且具有这种突变的五种蛋白酶编码基因是pepl、tspl、slpl、gapl和pep4。 在可以与前述实施方式组合的某些实施方式中,木霉属真菌细胞中的哺乳动物多肽是生长 因子、干扰素、细胞因子或白介素,且具有降低的活性的三种蛋白酶选自pepl、pep2、pep3、 pep4、pep5、pep8、pepll、pepl2、gapl、gap2、slpl、slp2、slpl 和 tspl。在某些实施方式中, 木霉属真菌细胞具有五种蛋白酶编码基因,其各包含降低或消除相应蛋白酶活性的突变, 且具有这种突变的五种蛋白酶编码基因是pepl、tspl、slpl、gapl和gap2。在某些实施方 式中,木霉属真菌细胞具有六种蛋白酶编码基因,其各包含降低或消除相应蛋白酶活性的 突变,且具有这种突变的六种蛋白酶编码基因是pepl、tspl、slpl、gapl、gap2和pep4。在 可以与前述实施方式组合的某些实施方式中,木霉属真菌细胞具有七种蛋白酶编码基因, 其各包含降低或消除相应蛋白酶活性的突变,且七种蛋白酶编码基因是P印1、tspl、slpl、 gapl、gap2、pep4和pep3。在可以与前述实施方式组合的某些实施方式中,木霉属真菌细胞 具有八种蛋白酶编码基因,其各包含降低相应蛋白酶活性的突变,且具有这种突变的八种 蛋白酶编码基因是 pepl、tspl、slpl、gapl、gap2、pep4、pep3 和 pep5。
[0029] 在可以与前述实施方式组合的某些实施方式中,木霉属真菌细胞进一步包含一种 或多种另外的蛋白酶的降低的活性或没有可检测的活性。在某些实施方式中,降低或消除 木霉属真菌细胞中一种或多种另外的蛋白酶的表达水平。在某些实施方式中,木霉属真菌 细胞中编码一种或多种另外的蛋白酶的基因各具有降低或消除相应蛋白酶活性的突变。 在可以与前述实施方式组合的某些实施方式中,一种或多种另外的蛋白酶编码基因选自 pep7、pep8、pepll、pepl2、tppl、gap2、slp3、slp5、slp6、slp7 和 slp8〇
[0030] 在可以与前述实施方式组合的某些实施方式中,木霉属真菌细胞进一步包含降低 的或没有可检测的ALG3活性。在某些实施方式中,木霉属真菌细胞中编码ALG3的基因包 含降低或消除相应活性的突变。在可以与前述实施方式组合的某些实施方式中,木霉属真 菌细胞进一步包含编码α-1,2-甘露糖苷酶的多核苷酸。在可以与前述实施方式组合的 某些实施方式中,突变降低或消除木霉属真菌细胞中基因的表达。在可以与前述实施方式 组合的某些实施方式中,突变是木霉属真菌细胞中基因的缺失。在可以与前述实施方式组 合的某些实施方式中,突变是木霉属真菌细胞中编码蛋白酶的催化结构域的基因部分的缺 失。在可以与前述实施方式组合的某些实施方式中,突变是木霉属真菌细胞中编码蛋白酶 的催化结构域的基因部分中的点突变。在可以与前述实施方式组合的某些实施方式中,木 霉属真菌细胞进一步包含Ν-乙酰葡糖胺基转移酶I催化结构域和Ν-乙酰葡糖胺基转移酶 II催化结构域。在某些实施方式中,Ν-乙酰葡糖胺基转移酶I催化结构域和Ν-乙酰葡糖 胺基转移酶II催化结构域通过木霉属真菌细胞的多核苷酸编码。在某些实施方式中,Ν-乙 酰葡糖胺基转移酶I催化结构域通过木霉属真菌细胞的第一多核苷酸编码和Ν-乙酰葡糖 胺基转移酶II催化结构域通过木霉属真菌细胞的第二多核苷酸编码。在可以与前述实施 方式组合的某些实施方式中,木霉属真菌细胞进一步包含编码甘露糖苷酶II的多核苷酸。 在某些实施方式中,蛋白质各与选自SEQ ID勵:1、17、37、58、66、82、98、118、129、166和182 的氨基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少 96 %、至少97 %、至少98 %、至少99 %或100 %的序列同一性。在某些实施方式中,木霉属真 菌细胞中的总蛋白酶活性降低到其中所述蛋白酶不具有降低的活性的对应木霉属亲本细 胞的总蛋白酶活性的49%或更低,31 %或更低。在可以与前述实施方式组合的某些实施方 式中,细胞进一步包含编码产生水平比对应亲本木霉属真菌细胞中多肽的产生水平高至少 两倍的的哺乳动物多肽的重组多核苷酸。在可以与前述实施方式组合的某些实施方式中, 哺乳动物多肽以全长形式产生,其水平高于对应亲本木霉属真菌细胞中全长形式多肽的产 生水平。
[0031] 另一个方面包括通过以下方式提高异源多肽稳定性的方法:a)提供前述任一实 施方式的木霉属真菌细胞;和b)培养所述细胞以表达异源多肽,其中该异源多肽与不包含 编码蛋白酶的基因的突变的宿主细胞相比具有提高的稳定性。另一个方面包括通过以下方 式制备异源多肽的方法:a)提供前述任一实施方式的木霉属真菌细胞;b)培养宿主细胞以 表达异源多肽;和c)纯化异源多肽。在可以与前述实施方式组合的某些实施方式中,丝状 真菌细胞进一步包含载体蛋白。在某些实施方式中,载体蛋白是CBH1。
[0032] 附图简要说明
[0033] 图1描绘了显示从天冬氨酸蛋白酶的亲和柱纯化洗脱的级分的PAGE凝胶。
[0034] 图2描绘了显示将IgG与天冬氨酸蛋白酶孵育的结果的PAGE凝胶。
[0035] 图3描绘了显示单蛋白酶删除菌株M181和M195的产生的DNA印迹分析。图3A 描绘了 P印1 0RF的预期信号:来自亲本M127的>8kb,没有来自转化体的信号。图3B描绘 了 p印1 5'侧翼的预期信号:来自亲本M127的>8kb,来自转化体的4kb。图3C描绘了 p印1 3'侧翼的预期信号:来自亲本M127的>8kb,来自转化体的4. 2kb。
[0036] 图4描绘了显示p印1缺失菌株M182中利妥昔单抗抗体的产生的DNA印迹分析。 图4A描绘了 peplORF的预期信号:来自亲本M169的>8kb,没有来自转化体的信号。图4B 描绘了 bar的预期信号:来自转化体的1. 0+1. 7kb,来自pTTv41的3. lkb,没有来自M169的 信号。图4C描绘了 bar的预期信号:来自转化体的1. 8+2. 8kb,来自pTTv41的3. lkb,没有 来自M169的信号。
[0037] 图5描绘了显示含p印1菌株和Λ p印1菌株的天冬氨酸蛋白酶纯化的峰级分的蛋 白质凝胶。
[0038] 图6Α-Β描绘了免疫印迹,其说明从利妥昔单抗产生菌株Μ169删除ρ印2蛋白酶 提高了转化体206Α (菌株Μ455)中(Α)轻链和(Β)重链的产生。代表18kD的轻链片段和 38kD的重链片段的条带在菌株M455中与亲本菌株M169相比更强。
[0039] 图7图示地描绘了来自利妥昔单抗产生菌株M169和ρ印2蛋白酶删除转化体98A、 116A、198A、201A和206A(M455)的上清液的蛋白酶活性。转化体116AU98A和206A与其亲 本菌株M169相比显示出降低的针对酪蛋白的蛋白酶活性。
[0040] 图8描绘了显示PEP3和PEP7的蛋白酶活性对MAB01重链和原始IGF-1的影响的 免疫印迹。图8A描绘了 pH 5. 5下蛋白酶活性对MAB01的影响。图8A描绘了 pH 4. 5下蛋 白酶活性对MAB01的影响。图8C描绘了 pH 4. 5下蛋白酶活性对原始IGF-1的影响。
[0041] 图9描绘了显示从SIP肽亲和柱纯化的含蛋白酶级分的PAGE凝胶。
[0042] 图10描绘了显示对于MAB01重链的SIP蛋白酶活性的免疫印迹。
[0043] 图11图示地描绘了有或没有抑制剂的情况下针对酪蛋白的蛋白酶活性。
[0044] 图12描绘了显示在删除slpl、slp2、slp3和gapl各蛋白酶后MAB01重链和轻链 产生的水平的免疫印迹。图12A显示MAB01重链的产生。图12B显示MAB01轻链的产生。
[0045] 图13图示地描绘了在删除slpl、slp2、slp3和gapl各蛋白酶后MAB01重链和轻 链产生的倍数提高。各条代表图12中显示的几个克隆的平均。
[0046] 图14描绘了显示gap2删除菌株M244的MAB01产生水平的免疫印迹。图14A显 示MAB01重链(HC)的产生。图14B显示MAB01轻链(LC)的产生。
[0047] 图15描绘了显示与含GAP2蛋白酶的毕赤酵母上清液孵育后MAB01抗体的水平的 免疫印迹。
[0048] 图16描绘了显示人IgGl的蛋白酶降解水平的免疫印迹。
[0049] 图17描绘了来自氨基苄脒柱的亲和纯化(纯化的级分)和来自上清液样品(上 清液)的MAB02抗体酶谱的结果。
[0050] 图18描绘了 Λρ印lAtspl双重蛋白酶删除菌株M219的产生。图18A描绘了 tspl 0RF的预期信号:来自亲本M196的6. 4kb。图18B描绘了 tspl 5'侧翼的预期信号:来自转 化体的3. 9kb,来自M196的>8kb,来自pTTv72的3. 9kb。图18C描绘了 tspl 3'侧翼的预 期信号:来自转化体的2. 8kb,来自M196的>8kb,来自pTTv72的3. 9kb。
[0051] 图19描绘了显示Apepl Δ tsp2双重删除菌株M194的产生的DNA印迹分析。图 19A描绘了 tsplORF的预期信号:来自亲本M181的kb。图19B描绘了 bar的预期信号:来 自转化体的1.4+2. 5kb,来自pTTv42的2. 9kb,没有来自M181的信号。图19C描绘了 bar 的预期信号:来自转化体的1. 9+3. 2kb,来自pTTv42的2. 9kb,没有来自M181的信号。
[0052] 图20图示地描绘了来自各蛋白酶删除上清液和亲本菌株M124的培养上清液的标 准化蛋白酶活性数据。蛋白酶活性在前5个菌株中在pH 5. 5下测量和在后3个删除菌株 中在pH 4. 5下测量。蛋白酶活性是针对绿色荧光酪蛋白。六重蛋白酶删除菌株仅具有野 生型亲本菌株的6%和7重蛋白酶删除菌株的蛋白酶活性比六重蛋白酶删除菌株活性低约 40%。
[0053] 图21A描绘了发酵上清液的氨基苄脒纯化级分的MAB02酶谱的结果。图21B描绘 了发酵上清液的氨基苄脒纯化级分的SDS PAGE凝胶(7% )。
[0054] 图22描绘了包含蛋白酶的SBTI亲和纯化级分的MAB02酶谱分析的结果。在蛋白 酶降解MAB02抗体的情况中主要蛋白质水解活性表现为白色。浓缩的级分3 (cf3)和未浓 缩的级分1-4(fl-f4)在酶谱凝胶中分析。
[0055] 图23描绘了显示包含蛋白酶的SBTI亲和纯化级分的SDS PAGE凝胶。浓缩的级 分cf3和cf4显示于凝胶中。
[0056] 图24描绘了显示SBTI纯化蛋白酶的利妥昔单抗重链降解水平的免疫印迹。
[0057] 图25描绘了显示与含枯草溶菌素的毕赤酵母上清液孵育过夜时的抗体降解水平 的免疫印迹。图25A显示利妥昔单抗重链的蛋白酶降解。图25B显示MAB01重链的蛋白酶 降解。
[0058] 图26描绘了显示三重蛋白酶删除菌株M277的产生的DNA印迹分析。图26A描绘 了 slplORF的预期信号:仅来自亲本(M219,M228)的6. 5kb。图26B描绘了 slpl 5'侧翼 的预期信号:来自亲本的6. 5kb,来自转化体的3. 3kb,来自质粒对照pTTvl26的4. 4kb。图 26C描绘了 slpl 3'侧翼的预期信号:来自亲本的6. 5kb,来自转化体的2. 3kb,来自质粒对 照 pTTvl26 的 4. 4kb。
[0059] 图27描绘了显示蛋白酶删除菌株上清液的活性的MAB02酶谱分析。染色的凝胶 上的白色区域表示蛋白酶活性的区域。
[0060] 图28图示地描绘了蛋白酶删除培养物上清液与野生型M124活性相比的总蛋白酶 活性。
[0061] 图29描绘了显示四蛋白酶删除菌株M307的产生的DNA印迹分析。图29A描绘了 gaplORF的预期的信号:仅来自亲本(Mill 2A = M306)的4kb。图29B描绘了 gapl 5'侧翼 的预期的信号:来自亲本的5. 5kb,来自转化体的3. 4kb,来自质粒对照pTTvll7的4. lkb。 图29C描绘了 gapl 3'侧翼的预期的信号:来自亲本的5. 5kb,来自转化体的3. lkb,来自质 粒对照 pTTvll7 的 4. lkb。
[0062] 图30图示地描绘了三重和四重删除菌株与野生型M124菌株相比的总蛋白酶活 性。
[0063] 图31图示地描绘了 M304三重删除菌株和M371四重删除菌株之间随时间变化的 蛋白酶活性。
[0064] 图32描绘了显示四重蛋白酶删除菌株M369的产生的DNA印迹分析。图32A描绘 了 gap20RF的预期信号:来自亲本(M307)的4. 9kb。图32B描绘了 gap2 5'侧翼的预期信 号:来自亲本的4. 9kb,来自转化体的2. 3kb,来自质粒对照pTTvl45的2. 3kb。图32C描绘了 gap2 3'侧翼的预期信号:来自亲本的4. 9kb,来自转化体的3. 8kb,来自质粒对照pTTvl45 的3. 8kb。图32D描绘了显示从四重蛋白酶删除菌株Μ369产生pyr4-的DNA印迹分析,从 而产生菌株M381(克隆14)。预期的信号是gap2 5'侧翼:来自所有菌株的1.5kb,来自质 粒对照PTIV145的4. lkb。图32E描绘了显示从四重蛋白酶删除菌株M369产生pyr4-的 DNA印迹分析,从而产生菌株M381 (克隆14)。预期的信号是gap2 3'侧翼:来自M307的 3.6kb,来自M369+环出(loopout)克隆的2.7kb,来自质粒对照pTTvl45的3.8kb。
[0065] 图33图示地描绘了从利用4重蛋白酶删除菌株M307、5重蛋白酶删除菌株M369 及6重蛋白酶删除转化体10B、44B、97A、97B和120A进行的摇瓶培养获取的第5天上清液 的蛋白酶活性。荧光酪蛋白在pH 4. 5的柠檬酸盐缓冲液中与稀释的上清液孵育以检测蛋 白酶活性。
[0066] 图34描绘了显示6重蛋白酶删除菌株M396和M400的产生的DNA印迹分析。图 34A描绘了 p印40RF的预期信号:来自M307和M369的6. 3kb。图34B描绘了 p印40RF的 预期信号:来自M307和M369的6. 3kb,没有来自转化体的信号。图34C描绘了 p印4 5'侧 翼的预期信号:来自M307和M369的6. 3kb,来自转化体的4. 8kb,来自pTTvl81的4. Okb。 图34D描绘了 p印4 3'侧翼的预期信号:来自M307和M369的6. 3kb,来自转化体的2. lkb, 来自pTTvl81的4. Okb。图34E描绘了显示从6重蛋白酶删除菌株M396产生pyr4-的DNA 印迹分析。预期的信号是P印4 3'侧翼:来自M307和M369的6. 3kb,来自再纯化转化体的 2. lkb,来自环出克隆的4. 9kb。
[0067] 图35描绘了显示上清液蛋白酶体外产生的利妥昔单抗重链片段的量的免疫印 迹。
[0068] 图36描绘了显示来自SBTI处理的培养物和未处理对照的上清液样品的重链和轻 链降解的免疫印迹。图36A显示重链的降解。图36B显示轻链的降解。
[0069] 图37描绘了显示来自胰凝乳蛋白酶抑制剂和胃蛋白酶抑制剂A处理的培养物或 来自未处理的对照培养物的上清液样品的重链和轻链降解水平的免疫印迹。图37A显示轻 链的降解。图37B显示重链的降解。
[0070] 图38描绘了从里氏木霉培养物上清液纯化抗体的过程。
[0071] 图39描绘了显示来自包含p印1蛋白酶删除的里氏木霉的抗体重链(HC)和轻链 (LC)的稳定性提高的免疫印迹。三种模型抗体在大的摇瓶上清液(Λρ印1和M124)和发 酵上清液(pH 5.5 ;28°C ;20g/L 废谷物提取物(spent grain extract),60g/L 乳糖)中测 试。
[0072] 图40描绘了显示来自包含tspl蛋白酶删除的里氏木霉细胞的利妥昔单抗(Rx) 重链的产生增加的免疫印迹。转化体12-2A和12-16A与亲本菌株相比清楚地显示更多的 重链。
[0073] 图41描绘了显示与来自三重蛋白酶删除菌株M277的上清液孵育过夜后MAB01重 链降解降低的免疫印迹。在第5天培养物上清液中孵育过夜后,与来自没有蛋白酶删除的 对照菌株M124的上清液相比,在三重蛋白酶删除上清液中发现2. 5倍高的重链。当在7天 培养上清液中孵育时,与来自对照菌株M124的上清液相比,在三重蛋白酶删除上清液中发 现4倍高的重链。
[0074] 图42描绘了模型蛋白质的降解研究。来自6重蛋白酶删除菌株的未稀释上清液 在pH 4. 2下用于掺入纯模型蛋白质中(0.05 μ g/μ 1)。掺有模型蛋白质(0.05 μ g/μ 1) 的50mM柠檬酸钠 pH 4.0显示为缓冲液对照。掺杂的上清液和对照在37°C下孵育20小 时。10 μ 1的各样品加载到18% SDS PAGE凝胶中。hGH在22kD处,IFNa 2b在19. 4kD处 和 IGF1 在 7. 5kD 处。
[0075] 图43描绘了来自6重蛋白酶删除菌株的上清液中MAB01抗体重链的稳定性测试。 MAB01抗体以0. 05μ g/μ 1存在于未稀释的上清液中。10μ 1的各样品加载到4-20% SDS PAGE凝胶中。重链在来自6重蛋白酶删除菌株的上清液中pH 4. 2下37°C下20小时孵育 后是稳定的。重链用TBST中1:30, 000稀释的抗重链IgG AP偶联的抗体(Sigma#A3188) 检测。全长重链在凝胶上50kD处。
[0076] 图44描绘了来自具有或不具有抑制剂和补充剂的24孔培养物的人生长激素的 第4天样品。12 μ 1的各上清液被加载。来自Acris的初级抗体,目录#AM00401PU-N小鼠 抗-116!1抗体(在了851'中稀释到2以8/1111)和1:10,000稀释的扮〇1^(1(#170-6520)山羊 抗小鼠 IgG AP偶联二级抗体。hGH标准(200ng),Abeam目录#ab51232。全长hGH蛋白在 22kD 处。
[0077] 图45描绘了里氏木霉、嗜热毁丝霉、粗糙链孢霉、产黄青霉、米曲霉、构巢曲霉和 黑曲霉的天冬氨酸蛋白酶的系统发生。比对利用Clustal Omega(http://www.ebi. ac.uk/ Tools/msa/clustalo/)进行且树使用BL0SUM62采用平均距离计算。
[0078] 图46描绘了里氏木霉、嗜热毁丝霉、粗糙链孢霉、产黄青霉、米曲霉、构巢曲霉 和黑曲霉的枯草溶菌素蛋白酶的系统发生。比对利用Clustal Omega(http://www.ebi. ac.uk/Tools/msa/clustalo/)进行且树使用BL0SUM62利用平均距离计算。"pyr"是指热 解素(pyrolysin),"prKsf3"是指蛋白酶 K,亚族 3 ;prtA、prtK、prU、prtF 和 prtBCI 是指如 Bryant 等(2009)BMC Evolutionary Biology 9:168,doi:10. 1186/1471-2148-9-168,图 5 和附加的文件no. 8中所述的亚族。
[0079] 图47描绘了里氏木霉、嗜热毁丝霉、粗糙链孢霉、产黄青霉、米曲霉、构巢曲霉和 黑曲霉的谷氨酸蛋白酶的系统发生。比对利用Clustal Omega(http://www.ebi. ac.uk/ Tools/msa/clustalo/)进行且树使用BL0SUM62利用平均距离计算。
[0080] 图48描绘了里氏木霉、嗜热毁丝霉、粗糙链孢霉、产黄青霉、米曲霉、构巢曲霉 和黑曲霉的sedolisin蛋白酶的系统发生。比对利用Clustal Omega(http://www.ebi. ac.uk/Tools/msa/clustalo/)进行且树使用BL0SUM62利用平均距离计算。由于slp7 类似于sedolisin蛋白酶,它包括在该树中。包括烟曲霉序列以帮助确定sedolisins 之间的关系。各蛋白酶前面的缩写sedA/B/C/D/E是基于Reichard等(2006)APPLIED AND ENVIRONMENTAL MICROBIOLOGY, Vol. 72, p. 1739-1748,图 4,由其中获取了与烟曲霉 sedolisin (对应蛋白酶)的BLAST检索。
[0081] 图49 :A :表达质粒pTTv67和pTTv99的示意图。MAB01重链包含在pTTv67载体中 且轻链包含在PTIV99载体中。B :表达载体pTTv223的示意图。MAB01重链和轻链包含在 pTTv223载体中。
[0082] 图50 :A :MAB01产生菌株M507的分批补料发酵中pH 5. 2下MAB01轻链和重链 产生的蛋白质印迹分析。使用的抗体是针对重链的Sigma A3188(左印迹)和针对轻链的 Sigma A3813(右印迹),都以1:10,000稀释。样品代码表示按天计的发酵时间。0. 1μ 1的 上清液在两个印迹中加载到各道中。Β :ρΗ 5. 5下ΜΑΒ01产生菌株Μ507的分批补料发酵中 ΜΑΒ01轻链和重链产生的蛋白质印迹分析。使用的抗体是针对重链的Sigma Α3188(左侧的 印迹)和针对轻链的Sigma Α3813 (右侧的印迹),都以1:10, 000稀释。样品代码表示按天 计的发酵时间。〇. ?μ 1的上清液在两个印迹中加载到各道中。
[0083] 图51. pH 5. 5下分批补料发酵bio00503b中菌株Μ304的ΜΑΒ01轻链和重链产生的 蛋白质印迹分析。使用的抗体是针对重链的Sigma A3188和针对轻链的Sigma A3813。来 自M304发酵bi〇00477b的第8天包括作为对照。样品代码表示按天计的发酵时间。0. 1μ 1 的上清液在两个印迹中加载。最上面的印迹是重链和较下面的印迹是轻链。
[0084] 图 52. pTTv204RNAi 表达载体。
[0085] 图53 :表达敲减slp2表达的RNAi的菌株中检测MAB01重链产生的免疫印迹。
[0086] 图54A描绘了 M401发酵的第3天样品的IFN- a 2b表达水平的定量。 1 μ 1/2 μ 1/4 μ 1上清液加载到4-20% SDS PAGE凝胶。免疫印迹用在TBST中稀释到1 μ g/ ml 的 Abeam (#ab9386)抗-IFN-a 2b 抗体进行。来自 Bio-rad (#170-6520)的二级抗体是在 TBST中1:5000稀释的山羊抗-小鼠 IgG AP偶联二级抗体。蛋白质标准加载到凝胶上,对 应于50ng、100ng和200ng的全长IFN-a2b。光密度定量使用Totallab Quant TL100软件 进行。对于定量,2μl样品是最具代表性的。全长IFN-α2b对照(100ng)在19.3kD处和 载体结合的IFN- a 2b在70kDa处。
[0087] 图54B描绘了 M577和M652发酵培养的第3-6天样品的免疫印迹分析。0. 2μ 1 的生长上清液加载到4-20% SDS PAGE凝胶。免疫印迹使用在TBST中稀释到1 μ g/ml的 Abcam(#ab9386)抗-IFN-a 2b 抗体进行。来自 Bio-rad(#170-6520)的二级抗体是在 TBST 中1:5000稀释的山羊抗-小鼠 IgG AP偶联二级抗体。全长IFN-a2b对照(100ng)在 19. 3kD处和载体结合的IFN- a 2b在70kDa处。
[0088] 图55描绘了来自第4天(M577发酵)和第3天(M652发酵)样品的IFN- a 2b表 达水平的定量。各样品的〇. 05 μ 1和0. 1 μ 1的上清液加载到4-20% SDS PAGE凝胶。免 疫印迹使用在TBST中稀释到1 μ g/ml的Abcam(#ab9386)抗-IFN-α 2b抗体进行。来自 Bi〇-rad(#170-6520)的二级抗体是在TBST中1:5000稀释的山羊抗-小鼠 IgG AP偶联二 级抗体。蛋白质标准加载到凝胶上,对应于50ng、100ng和200ng的全长IFN-α 2b。光密度 定量使用Totallab Quant TL100软件进行。对于定量,0. 1 μ 1样品是最具代表性的。全长 IFN- a 2b对照(100ng)在19. 3kD处和载体结合的IFN- a 2b在70kDa处。
[0089] 详细说明
[0090] 本发明涉及在至少三种蛋白酶具有降低的活性或没有活性的丝状真菌细胞中产 生重组异源多肽的改进的方法。本发明部分地基于以下令人惊异的发现,即降低丝状真菌 细胞中特定内源蛋白酶组合的活性提高多种重组表达的异源蛋白质(如免疫球蛋白和生 长因子)的表达和稳定性。尽管其它人产生了具有一种或多种灭活的蛋白酶的木霉属真菌 细胞,但他们未提供关于哪些蛋白酶与提高特定类型的蛋白质(如哺乳动物蛋白质)的表 达和稳定性最相关的指导。例如,W02011/075677公开了可以在木霉属中敲除的特定蛋白酶 且甚至公开了多种蛋白酶缺陷的木霉属真菌细胞。但是,W02011/075677未提供关于哪些蛋 白酶对哺乳动物蛋白质(如免疫球蛋白或生长因子)的表达和稳定性具有不利影响的任何 指导,因为其中没有描述任何哺乳动物蛋白质表达的实例。此外,W02011/075677仅公开了 单一真菌蛋白质在单一蛋白酶缺陷的三种不同真菌菌株的各菌株中的异源表达。因此,本 领域技术人员很可能将W02011/075677作为各单一蛋白质的灭活足以用于异源蛋白产生 的教导。Yoon 等(2009,Appl.Microbiol Biotechnol 82:691-701,2010:Appl.Microbiol Biotechnol DOI 10. 1007/s00253-010-2937-0)报告了用于在米曲霉中产生异源蛋白的五 重和十重蛋白酶基因破坏体(disruptant)的构建。10重蛋白酶破坏体细胞提高凝乳酶产 率仅3. 8倍,尽管存在较高数目的破坏蛋白酶基因 。Van den Hombergh等报告了黑曲霉的 三重蛋白酶基因破坏体。尽管数据显示了蛋白酶活性的降低,但其中没有描述任何哺乳动 物蛋白质产生的实例。
[0091] 申请人:令人惊异地证明多种蛋白酶与丝状真菌细胞如木霉属真菌细胞中总蛋白 酶活性的降低、异源蛋白产生的增加和异源蛋白表达后的稳定相关。特别地,发明人通过 纯化蛋白酶和确定哪些蛋白酶具有与降解异源蛋白质(如哺乳动物蛋白质)最相关的活 性鉴定了在木霉属真菌细胞中实际表达的蛋白酶(与仅在基因组中被编码相反)。另外 地,发明人确认删除负责特定蛋白酶活性的基因获得总蛋白酶活性的实质降低(这与包含 这类删除的丝状真菌细胞中就产生的蛋白质的量和质量方面来说蛋白质稳定性的提高相 关),并导致细胞中全长异源蛋白质产生的增加。还发现经工程化以降低至少三种蛋白酶 基因的活性的木霉属真菌细胞导致全长哺乳动物蛋白如抗体、治疗性蛋白质或抗体变体 (如Fab或单域抗体)的产生的预料不到的和协同的增加。换句话说,产生的全长哺乳动 物蛋白的量大于仅包含一种或两种蛋白酶基因删除的木霉属真菌细胞产生的总量。因此, 与TO2011/075677相反,本发明人证明丝状真菌细胞如木霉属真菌细胞中完整异源蛋白质 的产生可以通过降低或消除细胞中至少三种蛋白酶的活性而实现。
[0092] 因此,本公开的特定方面提供了通过具有降低的或没有至少三种蛋白酶的活性产 生提高水平的异源蛋白质的丝状真菌细胞,其中该细胞进一步包含编码异源多肽的重组多 核苷酸,该异源多肽的产生水平与其中蛋白酶不具有降低的活性的对应亲本丝状真菌细胞 中多肽的产生水平相比高至少两倍。换句话说,所希望的异源蛋白产生水平的提高可通过 将具有至少三种蛋白酶的降低的活性的丝状真菌细胞中异源蛋白的产生水平与不具有这 种降低的活性但其它方面与表现出提高的水平的细胞相同的丝状真菌细胞中异源蛋白的 产生水平相比较确定。
[0093] 本公开的其它方面提供了通过以下方式提高异源多肽稳定性的方法:a)提供具 有降低的或没有至少三种蛋白酶的活性的本公开的丝状真菌细胞,其中该细胞进一步包含 编码异源多肽的重组多核苷酸;和b)培养该细胞以表达异源多肽,其中异源多肽与不包含 编码蛋白酶的基因的突变的宿主细胞相比具有提商的稳定性。
[0094] 本公开的再其它方面提供了通过以下方式制备异源多肽的方法:a)提供具有降 低的或没有至少三种蛋白酶的活性的本公开的丝状真菌细胞,其中该细胞进一步包含编码 异源多肽的重组多核苷酸;b)培养宿主细胞以表达异源多肽;和c)纯化异源多肽。
[0095] 本公开的特定方面还提供通过具有降低的或没有至少三种蛋白酶的活性而产生 提高水平的哺乳动物多肽的木霉属真菌细胞,该至少三种蛋白酶选自pepl、pep2、pep3、 pep4、pep5、pep8、pepll、pepl2、tspl、slpl、slp2、gapl 和 gap2,其中该细胞进一步包含编 码哺乳动物多肽的重组多核苷酸,该哺乳动物多肽的产生水平与其中蛋白酶不具有降低的 活性的对应亲本木霉属真菌细胞中多肽的产生水平相比高至少两倍。换句话说,所希望的 异源蛋白产生水平的提高可通过将具有至少三种蛋白酶的降低的活性的木霉属真菌细胞 中异源蛋白质的产生水平与不具有这种降低的活性但其它方面与表现出提高的水平的细 胞相同的木霉属真菌细胞中异源蛋白质的产生水平相比较确定。
[0096] 本公开的其它方面提供了通过以下方式提高哺乳动物多肽稳定性的方法:a)提 供具有至少三种蛋白酶的降低的活性的本公开的木霉属真菌细胞,其中该细胞进一步包含 编码哺乳动物多肽的重组多核苷酸;和b)培养该细胞以表达哺乳动物多肽,其中哺乳动物 多肽与不包含编码蛋白酶的基因的突变的宿主细胞相比具有提高的稳定性。
[0097] 本公开的进一步的方面提供了通过以下方式制备哺乳动物多肽的方法:a)提供 具有至少三种蛋白酶的降低的活性的本公开的木霉属真菌细胞,其中该细胞进一步包含编 码哺乳动物多肽的重组多核苷酸;b)培养宿主细胞以表达哺乳动物多肽;和c)纯化哺乳动 物多肽。
[0098] 定义
[0099] 如本文中所使用的,"免疫球蛋白"是指包含共价偶联在一起的重链和轻链并能够 特异性地与抗原结合的多聚蛋白质。免疫球蛋白分子是包括几种类型的分子如IgM、IgD、 IgG、IgA和IgE的大的分子家族。
[0100] 如本文中所使用的,"抗体"是指完整的免疫球蛋白分子以及能够结合抗原的其片 段。这些包括杂合(嵌合)抗体分子(参见,例如Winter等Nature349:293-99225, 1991 和美国专利No. 4, 816, 567226)、F(ab')2和F(ab)片段和Fv分子、非共价异二聚 体[227,228]、单链 Fv 分子(scFv)(参见,例如 Huston 等?1'〇(:.似1:1.4〇3(1.3(3;[· U. S. A. 85:5897-83, 1988)、二聚和三聚的抗体片段构建体、微抗体(参见,例如Pack等 Biochem 31,1579-84, 1992 和 Cumber 等 J. Immunology 149B, 120-26, 1992)、人源化 抗体分子(参见,例如 Riechmann 等 Nature 332, 323-27, 1988 ;Verhoeyan 等 Science 239, 1534-36, 1988和GB 2, 276, 169)和从这类分子获得的任何功能性片段以及通过非常 规过程如噬菌体展示获得的抗体。优选地,抗体是单克隆抗体。获得单克隆抗体的方法是 本领域中公知的。
[0101] 如本文中所使用的,"肽"和"多肽"是包括多个连续的聚合氨基酸残基的氨基酸序 列。为了本发明的目的,通常肽是包括最多50个氨基酸残基的那些分子,和多肽包括超过 50个氨基酸残基。肽或多肽可以包括修饰的氨基酸残基、非由密码子编码的天然存在的氨 基酸残基和非天然存在的氨基酸残基。如本文中所使用的,"蛋白质"可以指任何尺寸的肽 或多肽。
[0102] 本发明的蛋白酶
[0103] 本文描述的本发明涉及通过使得细胞中存在的至少三种蛋白酶具有降低的或没 有可检测的活性而产生提高水平的异源多肽如哺乳动物多肽的丝状真菌细胞如木霉属真 菌细胞。表达异源多肽的丝状真菌细胞中存在的这些蛋白酶通常催化表达的重组多肽的 显著降解。因此,通过降低或消除表达异源多肽的丝状真菌细胞中的蛋白酶活性,表达的多 肽的稳定性提高,导致多肽产生水平的提高,且在一些情况中,导致产生的多肽的质量提高 (例如,全长多肽而不是降解的多肽)。
[0104] 蛋白酶包括,但不限于天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、枯草溶菌素蛋 白酶、谷氨酸蛋白酶和sedolisin蛋白酶。这类蛋白酶可以从丝状真菌细胞中鉴定和分离 并测试以确定是否其活性的降低影响丝状真菌细胞的重组多肽的产生。用于鉴定和分离蛋 白酶的方法是本领域中公知的,并包括,但不限于亲和色谱、酶谱分析和凝胶电泳。鉴定的 蛋白酶然后可以通过从表达重组多肽如异源或哺乳动物多肽的丝状真菌细胞删除编码所 鉴定的蛋白酶的基因并确定是否该删除导致细胞总蛋白酶活性的降低(例如,降低到对应 亲本丝状真菌细胞总蛋白酶活性的49%或更低或者31 %或更低的水平)和表达的重组多 肽的产生水平的提高(例如,比对应亲本丝状真菌细胞中的产生水平高两倍)来进行测试。 用于删除基因、测量总蛋白酶活性和测量产生的蛋白质的水平的方法是本领域中公知的并 包括本文中描述的方法。"对应亲本丝状真菌细胞"指其中蛋白酶不具有降低的或消除的活 性的对应细胞。
[0105] 天冬氨酸蛋白酶
[0106] 天冬氨酸蛋白酶是利用天冬氨酸残基水解多肽和蛋白质中的肽键的酶,通常,天 冬氨酸蛋白酶在其活性位点中包含两个高度保守的天冬氨酸残基(其在酸性pH下具有最 佳活性)。来自真核生物体如木霉属真菌的天冬氨酸蛋白酶包括胃蛋白酶、组织蛋白酶和肾 素。这类天冬氨酸蛋白酶具有双结构域的结构,其被认为是由祖先基因重复产生的。与这 种重复事件一致,各结构域的总体折叠 (overall fold)是相似的,尽管两个结构域的序列 开始偏离。各结构域贡献催化性天冬氨酸残基中的一个。活性位点位于天冬氨酸蛋白酶的 两个结构域形成的裂隙中。真核天冬氨酸蛋白酶进一步包括保守的二硫桥,其可以帮助鉴 别多肽为天冬氨酸蛋白酶。
[0107] 在木霉属真菌细胞中已经鉴定了九种天冬氨酸蛋白酶:pepl(tre74156)、 pep2 (tre53961)、pep3 (trel21133)、pep4 (tre77579)、pep5 (tre81004)和 pep7 (tre58669)、 p印8(trel22076)、p印11 (trel21306)和 p印12 (trell9876)。
[0108] Pepl
[0109] 合适的p印1蛋白酶的实例包括,但不限于里氏木霉p印1(SEQ ID NO: 1)、有性哈茨 木霉(Hypocrea lixii)gi|ll558498(SEQ ID N0:2)、棘抱木霉(Trichoderma asperellum) gi|47027997(SEQ ID N0:3)、深绿木霉(Trichoderma atroviride)jgi|Triat21297887(SEQ ID NO:4)、绿木霉(Trichoderma virens)jgi|TriviGv29_8_2I 81777 (SEQ ID NO:5)、 烟曲霉(Aspergillus fumigatus)jgi|Trire2Iafm:Afu5gl3300(SEQ ID NO:6)、米曲 霉(Aspergillus oryzae)gi| 94730408 (SEQ ID NO: 7)、金龟子绿僵菌(Metarhizium anisopliae)gi I 322712783 (SEQ ID NO: 8)、玉米赤霉(Gibberella zeae)gi I 46126795 (SEQ IDN0:9)、Fusariumvenenatumgi|l8448713(SEQIDN0:10)、尖抱鎌刀菌(Fusa;rium oxysporum)giI 342879173(SEQ ID NO: 11) > Grosmannia clavigera gi|320591399(SEQ ID N0:12)、黑白轮枝菌(Verticillium alboatrum)gi|302422750(SEQ ID N0:13)、球毛壳霉 (Chaetomiumglobosum)gi|ll6l82964(SEQIDNO:l 4)、粗糖链抱霉(Neurosporacrassa) gi I 85110723 (SEQ ID NO: 15)、四孢链孢菌(Neurospora tetrasperma)gi I 336463990 (SEQ IDN0:16)、嗜热毁丝霉(Myceliophthorathermophila)gi367030924(SEQIDN0:491)、产 黄青霉(Penicillium chrysogenum)gi255953325(SEQ ID N0:492)、黑曲霉(Aspergillus niger)gi350639535 (SEQ ID N0:493)、构巢曲霉(Aspergillus nidulans)gi67541436 (SEQ ID NO :494)及其同源物。
[oho] 因此,在某些实施方式中,本公开的蛋白酶(通常p印1蛋白酶)的氨基酸序列 与选自SEQ ID N0:1-16、SEQ ID N0:491-494的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99.5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:1-16、SEQ ID N0:491-494的氨基酸序列具有100%的同一性。
[0111] 在一些实施方式中,pepl是里氏木霉pepl。里氏木霉pepl编码的氨基酸序列示 于SEQ ID NO: 1中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID NO: 1具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID NO: 1具有100%的同一性。
[0112] Pep2
[0113] 合适的p印2蛋白酶的实例包括,但不限于里氏木霉p印2(SEQ ID NO: 182)、深 绿木霉jgi|Triat2|l42040(SEQIDN0:183)、绿木霉jgi|TriviGv29_8_2|53481(SEQID N0:184)、蛹虫草(Cordyc印smilitaris)CM01gi|346326575(SEQIDN0:185)、粗糙链孢霉 gi 85111370 (SEQ ID N0:495)及其同源物。
[0114] 因此,在某些实施方式中,本公开的蛋白酶(通常p印2蛋白酶)的氨基酸序列与 选自SEQ ID N0:182-185、SEQ ID N0:495的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:182-185、SEQ ID NO:495的氨基酸序列具有100%的同一性。
[0115] 在一些实施方式中,pep2是里氏木霉pep2。里氏木霉pep2编码的氨基酸序列示于 SEQ ID N0:182中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:182具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:182具有100 %的同一性。
[0116] Pep3
[0117] 合适的p印3蛋白酶的实例包括,但不限于里氏木霉p印3(SEQ ID NO: 17)、深绿 木霉jgi|Triat2(SEQIDN0:18)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:19)、有性哈 茨木霉 gi 1145583125 (SEQ ID N0:20)、棘孢木霉 gi I 51860175 (SEQ ID N0:21)、黑曲霉 gi|:317〇25l64(SEQ ID NO:22)、烟曲霉(Aspergillus fumigatus)gi|l59l22534(SEQ ID NO: 23)、黑曲霉 gi 1134054572 (SEQ ID NO: 24)、蛹虫草 gi |346318620 (SEQ ID NO: 25)、 Glomerella graminicola gi I 310800156 (SEQ ID NO: 26)、尖孢镰刀菌 gi I 342871221 (SEQ ID N0:27)、Grosmannia clavigera gi|320591121 (SEQ ID N0:28)、灰葡萄孢霉 (Botryotinia fuckeliana)gi|l2002205(SEQ ID N0:29)、太瑞斯梭抱壳霉(Thielavia terrest;ris)gi| 346997107 (SEQ ID NO: 30)、核盘菌(Sclerotinia sclerotiorum) gi|l56055954(SEQ ID N0:31)、球毛壳霉 gi|ll6197829(SEQ ID N0:32)、四孢链孢菌 gi|336472132(SEQ ID N0:33)、粗糙链孢霉 gi|85102020(SEQ ID N0:34)、费希新萨托 菌(Neosartorya fischeri)gi|ll9467426(SEQ ID N0:35)、马尼弗青霉菌(Penicillium marneffei)gi|212534792(SEQ ID N0:36)、嗜热毁丝霉gi367025909(SEQ ID N0:496)、产黄 青霉 gi255947264(SEQ ID N0:497)、米曲霉 391870123(SEQ ID N0:498)及其同源物。
[0118] 因此,在某些实施方式中,本公开的蛋白酶(通常p印3蛋白酶)的氨基酸序列 与选自SEQ ID N0:17-36、SEQ ID N0:496-498的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99.5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:17-36、SEQ ID NO:496-498的氨基酸序列具有100%的同一性。
[0119] 在一些实施方式中,pep3是里氏木霉pep3。里氏木霉pep3编码的氨基酸序列示 于SEQ ID N0:17中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:17具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:17具有100 %的同一性。
[0120] Pep4
[0121] 合适的pep4蛋白酶的实例包括,但不限于里氏木霉pep4(SEQ ID N0:37)、绿木 霉jgi|TriviGv29_8_2(SEQIDN0:38)、深绿木霉jgi|Triat2(SEQIDN0:39)、黄绿木霉 (Trichoderma aureoviride)gi|l93735605(SEQ ID N0:40)、黑曲霉 gi|l45232965(SEQ ID N0:41)、烟曲霉gi|70999520(SEQ ID N0:42)、棒曲霉(Aspergillus clavatus) gi 1121705756(SEQ ID NO: 43), Nectria haematococca gi | 302899226(SEQ ID N0:44), Glomerella graminicola gi|310796316(SEQ ID N0:45)、蛹虫草gi|346322842(SEQ ID N0:46)、玉米赤霉 gi|46138535(SEQ ID N0:47)、金龟子绿僵菌 gi|322708430(SEQ ID N0:48)、尖抱鎌刀菌 gi|342882947(SEQ ID N0:49)、Metarhizium acridum gi|322700747(SEQ ID N0:50)、大丽轮枝菌(Verticillium dahliae)gi|346973691(SEQ ID N0:51)、灰葡萄孢霉 gi|l54309857(SEQ ID N0:52)、球毛壳霉 gi|ll6203505(SEQ ID N0:53)、太瑞斯梭抱壳霉gi|347001590(SEQIDN0:54)、稻癌病菌(Magnaportheoryzae) gi|39973863(SEQ ID NO:55)、黑孢块菌(Tuber melanosporum)gi|296417651 (SEQ ID N0:56)、粗糙链孢霉 gi|85094599(SEQ ID N0:57)、嗜热毁丝霉 gi367031892 gi255947264(SEQ ID N0:499)、产黄青霉 gi255936729 gi255947264(SEQ ID N0:500)、米 曲霉gil69770745 gi255947264(SEQ ID N0:501)、构巢曲霉gi67524891 gi255947264(SEQ ID NO:502)及其同源物。
[0122] 因此,在某些实施方式中,本公开的蛋白酶(通常p印4蛋白酶)的氨基酸序列 与选自SEQ ID N0:37-57、SEQ ID N0:499-502的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:37-57、SEQ ID NO:499-502的氨基酸序列具有100%的同一性。
[0123] 在一些实施方式中,pep4是里氏木霉pep4。里氏木霉pep4编码的氨基酸序列示 于SEQ ID N0:37中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:37具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:37具有100%的同一性。
[0124] Pep5
[0125] 合适的p印5基因的实例包括,但不限于里氏木霉p印5(SEQ ID N0:58)、绿木 霉jgi|TriviGv29_8_2(SEQIDN0:59)、深绿木霉jgi|Triat2|277859(SEQIDN0:60)、 Metarhizium acridum gi I 322695806 (SEQ ID NO: 61)、尖孢镰刀菌 gi 1156071418 (SEQ ID NO:62)、蛹虫草 gi I 346324830 (SEQ ID NO:63)、玉米赤霉 gi I 46124247 (SEQ ID NO: 64)、大 丽轮枝菌gi|346978752(SEQ ID N0:65)、嗜热毁丝霉gi367019798(SEQ ID N0:503)及其同 源物。
[0126] 因此,在某些实施方式中,本公开的蛋白酶(通常p印5蛋白酶)的氨基酸序列与 选自SEQ ID N0:58-65、SEQ ID N0:503的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:58-65、SEQ ID N0:503 的氨基酸序列具有100%的同一性。
[0127] 在一些实施方式中,pep5是里氏木霉pep5。里氏木霉pep5编码的氨基酸序列示 于SEQ ID N0:58中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:58具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:58具有100%的同一性。
[0128] Pep7
[0129] 合适的p印7基因的实例包括,但不限于里氏木霉p印7 (SEQ ID NO: 186)、深绿木 霉jgi|Triat2(SEQIDN0:187)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:188)、Glomerella graminicola gi|310800487(SEQ ID NO: 189), Metarhizium acridum gi|322700577(SEQ ID N0:190)、太瑞斯梭孢壳霉 gi|347003264(SEQ ID N0:191)、鹅掌柄孢壳(Podospora anserine)gi|171680938(SEQ ID NO:192)、嗜热毛壳菌(Chaetomium thermophilum) gi I 340905460 (SEQ ID NO:193)、大丽轮枝菌 gi I 346975960 (SEQ ID NO: 194)、嗜热毁丝霉 gi I 347009870, gi367026634 (SEQ ID NO: 195)、粗糙链孢霉 gi I 85090078 (SEQ ID NO: 196)、 稻瘟病菌 gi|39948622(SEQ ID N0:197)、球毛壳霉 gi|ll6191517(SEQ ID N0:198)、稻 瘟病菌gi|39970765(SEQIDN0:199)、构巢曲霉gi67522232(SEQIDN0:504)、黑曲霉 gi350630464(SEQ ID N0:505)、米曲霉 gi317138074(SEQ ID N0:506)及其同源物。
[0130] 因此,在某些实施方式中,本公开的蛋白酶(通常p印7蛋白酶)的氨基酸序列 与选自SEQ ID N0:186-199、SEQ ID N0:504-506的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:186-199、SEQ ID NO:504-506的氨基酸序列具有100%的同一性。
[0131] 在一些实施方式中,pep7是里氏木霉pep7。里氏木霉pep7编码的氨基酸序列示于 SEQ ID N0:186中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:186具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:186具有100 %的同一性。
[0132] Pep8
[0133] 合适的p印8基因的实例包括里氏木霉p印8EGR48424(SEQ ID N0:507)、绿木霉 EHK19238(SEQ ID N0:508)、深绿木霉EHK40047(SEQ ID N0:509)、四孢链孢菌EG053367(SEQ IDN0:510)、嗜热毁丝霉XP_003658897(SEQIDN0:511)、粗糙链孢霉XP_965343(SEQID N0:512)、金龟子绿僵菌EFZ03501(SEQIDN0:513)、太瑞斯梭孢壳霉XP_003656869(SEQID N0:514)、尖孢镰刀菌E⑶79769(SEQIDN0:515)和玉米赤霉XP_381566(SEQIDN0:516)、 稻瘟病菌XP_。。3714540·1(SEQIDN0:517)、产黄青霉XP_002557331 (SEQIDN0:518)、米 曲霉 XP_001822899.1(SEQ ID N0:519)、构巢曲霉 XP_664091.1(SEQ ID N0:520)、黑曲霉 EHA24387. 1(SEQ ID N0:521)及其同源物。
[0134] 因此,在某些实施方式中,本公开的蛋白酶(通常p印8蛋白酶)的氨基酸序列与 选自SEQ ID N0:507-521的氨基酸序列具有50%或更高的同一性(例如,60%、65%、70%、 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更 高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:507-521的氨基酸序列具有具有100% 的同一'I"生。
[0135] 在一些实施方式中,pep8是里氏木霉pep8。里氏木霉pep8编码的氨基酸序列示于 SEQ ID N0:507中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:507具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:507具有100%的同一性。
[0136] Pep 11
[0137] 合适的p印11基因的实例包括,但不限于里氏木霉p印11EGR49498(SEQ ID N0:522)、绿木霉EHK26120(SEQIDN0:523)、深绿木霉EHK41756(SEQIDN0:524)、Fusarium pseudograminearum EKJ74550(SEQ ID NO:525) > Metarhizium acridum EFY91821(SEQ ID N0:526)和玉米赤霉 XP_384151(SEQ ID N0:527)、嗜热毁丝霉 XP_003667387. 1(SEQ ID N0:528)、粗糙链孢霉XP_960328.1(SEQIDN0:529)及其同源物。
[0138] 因此,在某些实施方式中,本公开的蛋白酶(通常pepll蛋白酶)的氨基酸序列与 选自SEQ ID N0:522-529的氨基酸序列具有50%或更高的同一性(例如,60%、65%、70%、 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更 高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:522-529的氨基酸序列具有100%的同 一性。
[0139] 在一些实施方式中,pepll是里氏木霉pep8。里氏木霉pepll编码的氨基酸序列示 于SEQ ID N0:522中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:522 具有50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶 与SEQ ID N0:522具有100%的同一性。
[0140] Pepl2
[0141] 合适的p印12基因的实例包括,但不限于里氏木霉p印12EGR52517(SEQ ID N0:530)、绿木霉 p印 12EHK18859(SEQ ID N0:531)、深绿木霉 p印 12EHK45753(SEQ ID NO: 532)、Fusarium pseudograminearum pepl2EKJ73392 (SEQ ID NO: 533)、玉米赤霉 p印12XP_388759(SEQIDN0:534)和金龟子绿僵菌p印12EFY95489(SEQIDN0:535)、粗糙 链孢霉XP_964574.1(SEQIDN0:536)、嗜热毁丝霉XP_003659978.1(SEQIDN0:537)及其 同源物。
[0142] 因此,在某些实施方式中,本公开的蛋白酶(通常p印12蛋白酶)的氨基酸序列与 选自SEQ ID N0:530-537的氨基酸序列具有50%或更高的同一性(例如,60%、65%、70%、 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更 高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:530-537的氨基酸序列具有100%的同 一性。
[0143] 在一些实施方式中46口8是里氏木霉口6口12。里氏木霉口6口12编码的氨基酸序列示 于SEQ ID N0:530中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:530 具有50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶 与SEQ ID N0:530具有100%的同一性。
[0144] 胰蛋白酶样丝氨酸蛋白酶
[0145] 胰蛋白酶样丝氨酸蛋白酶是具有与胰蛋白酶类似的底物特异性的酶。胰蛋白酶样 丝氨酸蛋白酶利用丝氨酸残基水解多肽和蛋白质中的肽键。通常,胰蛋白酶样丝氨酸蛋白 酶切割带正电的氨基酸残基之后的肽键。来自真核生物体如木霉属真菌的胰蛋白酶样丝氨 酸蛋白酶包括胰蛋白酶1、胰蛋白酶2和中胰蛋白酶(mesotrypsin)。这类胰蛋白酶样丝氨 酸蛋白酶一般包含三个氨基酸(如组氨酸、天冬氨酸和丝氨酸)的催化三联体(catalytic triad),其形成使得活性位点丝氨酸亲核的电荷中继(charge relay)。真核生物胰蛋白酶 样丝氨酸蛋白酶进一步包括由甘氨酸和丝氨酸的骨架酰胺氢原子形成的"氧阴离子穴",其 可以帮助鉴别多肽为胰蛋白酶样丝氨酸蛋白酶。
[0146] 在木霉属真菌细胞中已经鉴定了一种胰蛋白酶样丝氨酸蛋白酶: tspl (tre73897)。如以下讨论的,已证明tspl对重组多肽如免疫球蛋白的表达具有显著影 响。
[0147] 如以下实施例3中讨论的,丝氨酸蛋白酶从木霉属纯化并显示为具有降解哺乳动 物蛋白的多种蛋白酶活性。在这些活性中,tspl确认为胰蛋白酶样丝氨酸蛋白酶。tspl蛋 白酶基因然后从木霉属真菌细胞删除并证明删除tspl实现了总蛋白酶活性的显著降低, 从而导致该细胞产生的哺乳动物蛋白的稳定性提高。
[0148] 合适的tspl蛋白酶的实例包括,但不限于里氏木霉tspl (SEQ ID N0:66)、深 绿木霉 jgi|Triat2|298187(SEQ ID N0:67)、jgi|TriviGv29_8_2(SEQ ID N0:68)、有性 哈茨木霉 gi|l45583579(SEQ ID N0:69)、有性哈茨木霉 gi|63025000(SEQ ID N0:70)、 核盘菌 gi|l56052735(SEQ ID N0:71)、灰葡萄孢霉 gi|l54314937(SEQ ID N0:72)、颖 枯壳针抱(Phaeosphaeria nodorum)gi|l69605891(SEQ ID N0:73)、Leptosphaeria maculans gi | 312219044 (SEQ ID NO: 74)、大丽轮枝菌 gi | 37992773 (SEQ ID NO: 75)、炭 色抱腔菌(Cochliobolus carbonum)gi|l072114(SEQ ID N0:76)、Metarhizium acridum gi I 322695345 (SEQ ID NO :77)、金龟子绿僵菌 gi I 4768909 (SEQ ID NO :78)、gi I 464963 (SEQ ID N0:79)、玉米赤霉gi|46139299(SEQ ID N0:80)、金龟子绿僵菌(SEQ ID N0:81)、构巢曲 霉 gi67523821 (SEQ ID N0:538)及其同源物。
[0149] 因此,在某些实施方式中,本公开的蛋白酶(通常tspl蛋白酶)的氨基酸序列与 选自SEQ ID N0:66-81、SEQ ID N0:538的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID NO:66-81、SEQ ID NO:538 的氨基酸序列具有100%的同一性。
[0150] 在一些实施方式中,tspl是里氏木霉tspl。里氏木霉tspl编码的氨基酸序列示 于SEQ ID N0:66中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:66具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:66具有100 %的同一性。
[0151] 枯草溶菌素蛋白酶
[0152] 枯草溶菌素蛋白酶是具有与枯草溶菌素类似的底物特异性的酶。枯草溶菌素蛋白 酶利用丝氨酸残基水解多肽和蛋白质中的肽键。一般地,枯草溶菌素蛋白酶是包含三个氨 基酸天冬氨酸、组氨酸和丝氨酸的催化三联体的丝氨酸蛋白酶。这些催化性残基的排列是 来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草溶菌素共有的。来自真核生物 体如木霉属真菌的枯草溶菌素蛋白酶包括弗林蛋白酶、MBTPS1和TPP2。真核生物胰蛋白酶 样丝氨酸蛋白酶进一步包括氧阴离子穴中的天冬氨酸残基。枯草溶菌素蛋白酶slp7也类 似于sedolisin蛋白酶tppl。
[0153] 在木霉属真菌细胞中已经鉴定了七种枯草溶菌素蛋白酶:slpl (tre51365)、 slp2(trel23244)、 slp3(trel23234)、 slp5(tre64719)、 slp6(trel21495)、 slp7(trel23865)和 slp8(tre58698)。
[0154] Slpl
[0155] 合适的slpl蛋白酶的实例包括,但不限于里氏木霉slpl(SEQ ID N0:82)、 深绿木霉jgi|Triat2(SEQIDN0:83)、深绿木霉jgi|Triat2(SEQIDN0:84)、绿木 霉 jgi|TriviGv29_8_2(SEQ ID N0:85)、有性哈茨木霉 gi|l45583581(SEQ ID N0:86)、 Metarhizium acridum gi | 322694632 (SEQ ID NO: 87)、尖孢镰刀菌 gi | 342877080 (SEQ ID N0:88)、玉米赤霉 gi | 46139915 (SEQ ID N0:89)、Epichloe festucae gi 1170674476 (SEQ ID NO:90) >Nectria haematococca gi|302893164(SEQ ID NO:91) >Sordaria macrospore gi I 336266150(SEQ ID NO:92)、Glomerella graminicola giI 310797947(SEQ ID NO:93)、 四孢链孢菌gi I 336469805 (SEQ ID N0:94)、粗糙链孢霉gi I 85086707 (SEQ ID N0:95)、稻瘟 病菌 gi 1145608997 (SEQ ID N0:96)、球毛壳霉 gi 1116208730 (SEQ ID N0:97)、嗜热毁丝霉 gi367029081(SEQ ID N0:539)及其同源物。
[0156] 因此,在某些实施方式中,本公开的蛋白酶(通常slpl蛋白酶)的氨基酸序列与 选自SEQ ID N0:82-97、SEQ ID N0:539的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:82-97、SEQ ID N0:539 的氨基酸序列具有100%的同一性。
[0157] 在一些实施方式中,slpl是里氏木霉slpl。里氏木霉slpl编码的氨基酸序列示 于SEQ ID N0:82中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:82具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID NO :82具有100 %的同一性。
[0158] Slp2
[0159] 合适的slp2蛋白酶的实例包括,但不限于里氏木霉slp2(SEQ ID N0:98)、深绿 木霉jgi|Triat2(SEQIDN0:99)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:100)、有性哈 茨木霉 gi 1115111226 (SEQ ID NO: 101)、烟曲霉 gi I 70997972 (SEQ ID NO: 102)、Nectria haematococca gi I 302915240 (SEQ ID NO: 103)、玉米赤霉 gi I 46105128 (SEQ ID NO: 104)、 虫花棒束抱(Isaria farinose) gi I 68165000 (SEQ ID NO: 105)、Glomerella graminicola giI 310797854(SEQ ID NO: 106)、Epichloe festucae giI 170674491 (SEQ ID NO:107)、 Metarhizium acridum gi|322697754(SEQ ID N0:108)、支顶抱属(Acremonium sp.) F11177gi1147225254(SEQ ID NO: 109)、Ophiostoma piliferum gi115808807(SEQ ID NO: 110)、四孢链孢菌 gi I 336463649 (SEQ ID NO: 111)、嗜热毛壳菌 gi I 340992600 (SEQ ID NO: 112)、Metarhizium flavoviride gi| 254351265 (SEQ ID NO: 113)、鹅掌柄孢 壳gi|l71680111(SEQIDN0:114)、稻瘟病菌gi|39943180(SEQIDN0:115)、核盘菌 gi 1156058540 (SEQ ID NO: 116)、柄篮状菌(Talaromyces stipitatus)gi I 242790441 (SEQ ID N0:117)、嗜热毁丝霉 gi367021472(SEQ ID N0:540)、黑曲霉 gil45237646(SEQ ID N0:541)、米曲霉gil69780712(SEQIDN0:542)、产黄青霉gi255955889(SEQIDN0:543)、 构巢曲霉gi259489544(SEQIDN0:544)、粗糙链孢霉gi85084841(SEQIDN0:545)及其同 源物。
[0160] 因此,在某些实施方式中,本公开的蛋白酶(通常slp2蛋白酶)的氨基酸序列 与选自SEQ ID N0:98-117、SEQ ID N0:540-545的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:98-117、SEQ ID NO:540-545的氨基酸序列具有100%的同一性。
[0161] 在一些实施方式中,slp2是里氏木霉slp2。里氏木霉slp2编码的氨基酸序列不 于SEQ ID N0:98中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:98具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:98具有100 %的同一性。
[0162] Slp3
[0163] 合适的slp3蛋白酶的实例包括,但不限于里氏木霉slp2(SEQIDN0:166)、深绿 木霉jgi|Triat2(SEQIDN0:167)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:168)、康宁肉座 菌(Hypocrea koningii)gi| 124295071 (SEQ ID NO: 169)、淡紫紫抱菌(Purpureocillium lilacinum)gi|l30750164(SEQ ID N0:170)、金龟子绿僵菌gi|l6215677(SEQ ID N0:171)、洛斯里被毛孢(Hirsutella rhossiliensis)gi| 90655148 (SEQ ID N0:172)、 Tolypocladium inflatum gi118542429 (SEQ ID NO:173)、Metacordyceps chlamydosporia gi|19171215(SEQ ID NO:174)、蛹虫草gi|346321368(SEQ ID NO:175)、镰孢菌属 (Fusariumsp·)gi|628051(SEQIDN0:176)、四孢链孢菌gi|336471881(SEQIDN0:177)、 球毛壳霉 gi 1116197403 (SEQ ID NO: 178)、粗糙链孢霉 gi I 85084841 (SEQ ID NO: 179)、尖 孢镰刀菌 gi I 56201265 (SEQ ID NO: 180)、玉米赤霉 gi I 46114268 (SEQ ID NO: 181)、嗜热 毁丝霉 gi367026259(SEQ ID N0:546)、构巢曲霉 gi67538776(SEQ ID N0:547)、米曲霉 gil69771349(SEQIDN0:222)、黑曲霉gi470729(SEQIDN0:223)及其同源物。
[0164] 因此,在某些实施方式中,本公开的蛋白酶(通常slp3蛋白酶)的氨基酸序列与 选自SEQIDN0:166-181、SEQIDN0:546-547、SEQIDN0:222-223的氨基酸序列具有50% 或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%、99.5%或更高)。在一些实施方式中,蛋白酶与选自SEQID N0:166-181、SEQ ID N0:546-547、SEQ ID N0:222-223 的氨基酸序列具有 100%的同一性。
[0165] 在一些实施方式中,slp3是里氏木霉slp3。里氏木霉slp3编码的氨基酸序列不于 SEQ ID N0:166中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:166具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:166具有100 %的同一性。
[0166] Slp5
[0167] 合适的slp5蛋白酶的实例包括,但不限于里氏木霉slp5 (SEQ ID NO: 200)、深绿木 霉jgi|Triat2(SEQIDN0:201)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:202)、有性哈茨木 霉 gi 1118161442 (SEQ ID NO: 203)、尖孢镰刀菌 gi I 342883549 (SEQ ID NO: 204)、玉米赤霉 giI 46135733(SEQ ID NO:205)、Glomerella graminicola giI 310796396(SEQ ID NO:206)、 Nectria haematococca gi I 302927954 (SEQ ID NO: 207)、蛹虫草 gi I 346319783 (SEQ ID NO: 208)、粗糙链孢霉 gi I 85094084 (SEQ ID NO: 209)、四孢链孢菌 gi I 336467281 (SEQ ID NO: 210)、大丽轮枝菌 gi I 346971706 (SEQ ID NO: 211)、太瑞斯梭孢壳霉 gi I 347001418 (SEQ ID NO: 212)、稻瘟病菌 gi 1145605493 (SEQ ID NO: 213)、嗜热毁丝霉 gi367032200 (SEQ ID N0:548)、产黄青霉gi62816282(SEQIDN0:549)及其同源物。
[0168] 因此,在某些实施方式中,本公开的蛋白酶(通常slp5蛋白酶)的氨基酸序列 与选自SEQ ID N0:200-213、SEQ ID N0:548-549的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:200-213、SEQ ID NO:548-549的氨基酸序列具有100%的同一性。
[0169] 在一些实施方式中,slp5是里氏木霉slp5。里氏木霉slp5编码的氨基酸序列不于 SEQ ID N0:200中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:200具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:200具有100 %的同一性。
[0170] Slp6
[0171] 合适的slp6蛋白酶的实例包括,但不限于里氏木霉slp6(SEQ ID N0:214)、深绿 木霉jgi|Triat2(SEQIDN0:215)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:216)、绿色木 霉菌(Hypocrea virens) gi I 29421423 (SEQ ID NO: 217)、有性哈茨木霉 gi 1145583127 (SEQ ID N0:218)、钩状木霉(Trichoderma hamatum)gi|30144643(SEQ ID N0:219)、烟曲霉 gi|2295(SEQ ID N0:220)、土曲霉(Aspergillus terreus)gi|ll5391147(SEQ ID N0:221)、 米曲霉 gi 1169771349 (SEQ ID NO: 222)、黑曲霉 gi I 470729 (SEQ ID NO: 223)、Glomerella graminicola gi|310794714(SEQ ID N0:224)、玉米赤霉 gi|46114946(SEQ ID N0:225)、 尖孢镰刀菌 gi I 342873942 (SEQ ID NO: 226)、Nectria haematococca gi I 302884541 (SEQ ID N0:227)、费希新萨托菌(Neosartorya fischeri)gi|ll9500190(SEQ ID N0:228)、黑白 轮枝菌 gi I 302413161 (SEQ ID NO: 229)、Glomerella graminicola gi I 310790144 (SEQ ID N0:230)、粗糙链孢霉gi85090020(SEQIDN0:550)及其同源物。
[0172] 因此,在某些实施方式中,本公开的蛋白酶(通常slp6蛋白酶)的氨基酸序列与 选自SEQ ID N0:214-230、SEQ ID N0:550的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:214-230、SEQ ID NO:550的氨基酸序列具有100%的同一性。
[0173] 在一些实施方式中,slp6是里氏木霉slp6。里氏木霉slp6编码的氨基酸序列不于 SEQ ID N0:214中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:214具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:214具有100%的同一性。
[0174] Slp7
[0175] 合适的slp7蛋白酶的实例包括,但不限于里氏木霉slp7(SEQ ID N0:231)、深 绿木霉jgi|Triat2(SEQIDN0:232)、绿木霉jgi|TriviGv29_8_2(SEQIDN0:233)、金 龟子绿僵菌 gi I 322710320 (SEQ ID NO: 234)、Nectria haematococca gi I 302915000 (SEQ ID N0:235)、嗜热毁丝霉 gi|347009020,gi367024935(SEQ ID N0:236)、玉米赤霉 gi| 46137655 (SEQ ID NO: 237)、太瑞斯梭孢壳霉 gi| 346996549 (SEQ ID NO: 238)、稻 瘟病菌 gi|l45610733(SEQ ID N0:239)、构巢曲霉 gi67541991(SEQ ID N0:551)、产黄 青霉 gi255933786(SEQ ID N0:552)、黑曲霉 gi317036543(SEQ ID N0:553)、米曲霉 gil69782882(SEQIDN0:554)、粗糙链孢霉gi85109979(SEQIDN0:555)及其同源物。
[0176] 因此,在某些实施方式中,本公开的蛋白酶(通常slp7蛋白酶)的氨基酸序列 与选自SEQ ID N0:231-239、SEQ ID N0:551-555的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:231-239、SEQ ID NO:551-555的氨基酸序列具有100%的同一性。
[0177] 在一些实施方式中,slp7是里氏木霉slp7。里氏木霉slp7编码的氨基酸序列不于 SEQ ID N0:231中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:231具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:231具有100%的同一性。
[0178] Slp8
[0179] 合适的slp8蛋白酶的实例包括,但不限于里氏木霉slp8(SEQ ID N0:240)、深 绿木霉jgi|Triat2|l98568(SEQIDN0:241)、绿木霉jgi|TriviGv29_8_2|33902(SEQID NO:242)及其同源物。
[0180] 因此,在某些实施方式中,本公开的蛋白酶的氨基酸序列与选自SEQ ID N0:240-242的氨基酸序列具有50%或更高的同一性(例如,60%、65%、70%、75%、80%、 85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99· 5% 或更高)。在一些实 施方式中,蛋白酶与选自SEQ ID N0:240-242的氨基酸序列具有100%的同一性。
[0181] 在一些实施方式中,slp8是里氏木霉slp8。里氏木霉slp8编码的氨基酸序列不于 SEQ ID N0:240中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:240具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:240具有100 %的同一性。
[0182] 谷氨酸蛋白酶
[0183] 谷氨酸蛋白酶是水解多肽和蛋白质中的肽键的酶。谷氨酸蛋白酶对胃蛋白酶抑制 剂A是不敏感的,且因此有时称为胃蛋白酶抑制剂不敏感的酸性蛋白酶。尽管谷氨酸蛋白 酶先前与天冬氨酸蛋白酶一起分组且通常统称为酸性蛋白酶,目前发现谷氨酸蛋白酶具有 与天冬氨酸蛋白酶非常不同的活性位点残基。
[0184] 在木霉属真菌细胞中已经鉴定了两种谷氨酸蛋白酶:gapl (tre69555)和 gap2(trel06661)。
[0185] Gapl
[0186] 合适的gapl蛋白酶的实例包括,但不限于里氏木霉gapl (SEQ ID NO: 118)、深 绿木霉jgi|Triat2|40863(SEQIDN0:119)、绿木霉jgi|TriviGv29_8_2|l92684(SEQID NO: 120)、黄曲霉 gi I 238499183 (SEQ ID NO: 121)、黑曲霉 gi 1145251555 (SEQ ID NO: 122)、 土曲霉 gi 1115491521 (SEQ ID NO: 123)、gi I 37154543 (SEQ ID NO: 124)、gi I 48425531 (SEQ ID NO: 125)、gi| 351873 (SEQ ID NO: 126)、太瑞斯梭孢壳霉 gi| 346997245 (SEQ ID N0:127)、产黄曲霉 gi|255940586(SEQ ID N0:128)、嗜热毁丝霉 gi367026504(SEQ ID N0:574)、米曲霉 gi317150886(SEQ ID N0:575)、粗糙链孢霉 gi85097968(SEQ ID N0:576)、黑曲霉 gil31056(SEQ ID N0:577)、产黄青霉 gi255930123(SEQ ID N0:578)、 黑曲霉 gil45236956(SEQ ID N0:579)、米曲霉 gil69772955(SEQ ID N0:580)、黑曲 霉 gil45249222(SEQ ID N0:581)、构巢曲霉 gi67525839(SEQ ID N0:582)、米曲霉 gil69785367(SEQ ID N0:583)、产黄青霉 gi255955319(SEQ ID N0:584)、嗜热毁丝 霉gi367019352(SEQIDN0:585)、米曲霉gi391863974(SEQIDN0:586)、嗜热毁丝霉 gi367024513(SEQ ID N0:587)及其同源物。
[0187] 因此,在某些实施方式中,本公开的蛋白酶(通常gapl蛋白酶)的氨基酸序列 与选自SEQ ID N0:118-128、SEQ ID N0:574-587的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:118-128、SEQ ID NO:574-587的氨基酸序列具有100%的同一性。
[0188] 在一些实施方式中,gapl是里氏木霉gapl。里氏木霉gapl编码的氨基酸序列示于 SEQ ID N0:118中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:118具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:118具有100 %的同一性。
[0189] Gap 2
[0190] 合适的gap2蛋白酶的实例包括,但不限于里氏木霉gap2(SEQIDN0:129)、深 绿木霉jgi|Triat2|298116(SEQIDN0:130)、绿木霉jgi|TriviGv29_8_2|30331 (SEQID NO: 131)、jgi|TriviGv29_8_2 I 225131 (SEQ ID NO: 132)、黄曲霉gi| 238499183 (SEQ ID N0:133)、黑曲霉gi|l45251555(SEQ ID N0:134)、构巢曲霉gi|67901056(SEQ ID N0:135)、 棒曲霉gi|l21711990(SEQ ID N0:136)、烟曲霉gi|70986250(SEQ ID N0:137)、马尼弗青霉 菌 gi I 212534108 (SEQ ID NO: 138)、柄篮状菌 gi I 242789335 (SEQ ID NO: 139)、Grosmannia clavigera gi I 320591529 (SEQ ID NO: 140)、费希新萨托菌gi 1119474281 (SEQ ID NO: 141)、 马尼弗青霉菌 gi I 212527274 (SEQ ID NO: 142)、产黄曲霉 gi I 255940586 (SEQ ID NO: 143)、 gi|l31056(SEQIDN0:144)、嗜热毁丝霉gi367030275(SEQIDN0:588)及其同源物。
[0191] 因此,在某些实施方式中,本公开的蛋白酶(通常gap2蛋白酶)的氨基酸序列与 选自SEQ ID N0:129-144、SEQ ID N0:588的氨基酸序列具有50%或更高的同一性(例如, 60 %,65 %,70 %,75 %,80 %,85 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:129-144、SEQ ID NO:588的氨基酸序列具有100%的同一性。
[0192] 在一些实施方式中,gap2是里氏木霉gap2。里氏木霉gap2编码的氨基酸序列示于 SEQ ID N0:129中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:129具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:129具有100 %的同一性。
[0193] Sedolisin 蛋白酶
[0194] Sedolisin蛋白酶是利用丝氨酸残基水解多肽和蛋白质中的肽键的酶。Sedolisin 蛋白酶一般包含独特的丝氨酸、谷氨酸和天冬氨酸催化三联体。Sedolisin蛋白酶也包含氧 阴离子穴中的天冬氨酸残基。来自真核生物体如木霉属真菌的sedolisin蛋白酶包括三肽 基肽酶。
[0195] 合适的tppl蛋白酶的实例包括,但不限于里氏木霉tppl (SEQ ID N0:145)、深 绿木霉 jgi I Triat2 1188756 (SEQ ID NO: 146)、绿木霉 jgi I TriviGv29_8_2 I 217176 (SEQ ID NO:147)、烟曲霉gi|70993168(SEQ ID NO:148)、米曲霉gi|169776800(SEQ ID N0:149)、黑曲霉gi|l45236399(SEQIDN0:150)、棒曲霉gi|l21708799(SEQIDN0:151)、 黑曲霉 gi|145239871(SEQ ID NO:152)、棒曲霉 gi|121714541(SEQ ID NO:153)、 土 曲霉 gi| 115387645 (SEQ ID NO: 154)、烟曲霉 gi| 70982015 (SEQ ID NO: 155)、核盘菌 gi 1156045898 (SEQ ID NO: 156)、灰葡萄孢霉 gi 1154321758 (SEQ ID NO: 157)、费希新萨 托菌 gi 1119499774 (SEQ ID NO: 158)、柄篮状菌 gi I 242798348 (SEQ ID NO: 159)、马尼弗 青霉菌 gi I 212541546 (SEQ ID NO: 160)、玉米赤霉 gi I 46114460 (SEQ ID NO: 161)、尖孢 镰刀菌 gi I 342890694(SEQ ID NO: 162)、Grosmannia clavigera gi I 320592937(SEQ ID N0:163)、黑白轮枝菌 gi|302406186(SEQ ID N0:164)、大丽轮枝菌 gi|346971444(SEQ ID N0:165)、烟曲霉CAE51075·1(SEQIDN0:556)、米曲霉XP_001820835·1(SEQIDN0:557)、 产黄青霉 XP_〇〇2564029.1(SEQ ID N0:558)、构巢曲霉 XP_664805.1(SEQ ID N0:559)、产 黄青霉 XP_002565814.1(SEQ ID N0:560)、嗜热毁丝霉 XP_003663689.1(SEQ ID N0:561)、 粗糙链孢霉 XP_958412.1(SEQ ID N0:562)、黑曲霉 XP_001394118.1(SEQ ID N0:563)、 烟曲霉 CAE17674. 1(SEQ ID N0:564)、黑曲霉 XP_001400873. 1(SEQ ID N0:565)、烟 曲霉 CAE46473. 1(SEQ ID N0:566)、米曲霉 ΧΡ_002373530· 1(SEQ ID N0:567)、构巢 曲霉 ΧΡ_660624· 1 (SEQ ID N0:568)、产黄青霉 ΧΡ_002562943· 1 (SEQ ID N0:569)、烟 曲霉CAE17675·1(SEQIDN0:570)、烟曲霉EAL86850·2(SEQIDN0:571)、粗糙链孢霉 XP_961957·1(SEQIDN0:572)、米曲霉BAB97387·1(SEQIDN0:573)及其同源物。
[0196] 因此,在某些实施方式中,本公开的蛋白酶(通常tppl蛋白酶)的氨基酸序列 与选自SEQ ID N0:145-165、SEQ ID N0:556-573的氨基酸序列具有50%或更高的同一性 (例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 5%或更高)。在一些实施方式中,蛋白酶与选自SEQ ID N0:145-165、SEQ ID NO:556-573的氨基酸序列具有100%的同一性。
[0197] 在一些实施方式中,tppl是里氏木霉tppl。里氏木霉tppl编码的氨基酸序列示于 SEQ ID N0:145.中。在其它实施方式中,本公开的蛋白酶的氨基酸序列与SEQ ID N0:145具 有 50%或更高的同一性(例如,60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99. 5%或更高)。在进一步的实施方式中,蛋白酶与SEQ ID N0:145具有100 %的同一性。
[0198] 同源蛋白酶
[0199] 本公开的其它实施方式涉及降低与本公开的蛋白酶同源的蛋白酶的活性。本文中 使用的"同源性"是指参比序列与第二序列的至少一个片段之间的序列相似性。同源物可 以通过本领域中已知的任何方法确定,优选通过使用BLAST工具将参比序列与单一第二序 列或序列的片段比较或与序列的数据库比较确定。如下面描述的,BLAST基于序列同一性 和相似性比较序列。
[0200] 在两个或更多个核酸或氨基酸序列的情况中,术语"相同"或百分"同一性"是指 相同的两个或更多个序列或子序列。当在比较窗或指定区域上进行比较或比对以获得最 大对应性时,如使用以下序列比较算法之一或通过人工比对和目视检查测量的,如果两个 序列具有指定百分比的氨基酸残基或核苷酸相同(即,在指定区域上或在未指明的情况下 在整个序列上 29%的同一性,任选地30%、40%、45%、50%、55%、60%、65%、70%、75%、 80%、85%、90%、95%、99%或100%的同一性),则两个序列"基本上相同"。任选地,同一 性在长度至少约50个核苷酸(或10个氨基酸)的区域上存在,或更优选地在长度100-500 或1000或更多个核苷酸(或20、50、200或更多个氨基酸)的区域上存在。
[0201] 对于序列比较,通常一个序列用作将测试序列与其对比的参比序列。当使用序列 比较算法时,测试序列和参比序列输入计算机中,指定子序列坐标(如果必要)并指定序列 算法程序参数。可以使用缺省程序参数,或者可以指定可选的参数。然后序列比较算法基于 序列参数计算测试序列相对于参比序列的百分序列同一性。当比较两个序列的同一性时, 序列不必须是连续的,但任何空位将带来降低总体百分同一性的罚分。对于blastn,缺省参 数是Gap开放罚分=5和Gap延伸罚分=2。对于blastp,缺省参数是Gap开放罚分=11 和Gap延伸罚分=1。
[0202] 如本文中使用的,"比较窗"包括指任何数目的连续位置的片段,包括,但不限于 20-600,通常约50-约200,更通常约100-约150,其中在两个序列最佳对准后,序列可以与 具有相同数目的连续位置的参比序列比较。用于比较的序列比对方法是本领域中公知的。 可以进行用于比较的序列的最佳比对,例如通过Smith和Waterman (1981)的局部同源性算 法、通过他6(1161]^11和¥11118(311(1970)1]\1〇113;[01 48(3):443-453 的同源性比对算法、通过 Pearson 和 Lipman (1988) Proc Natl Acad Sci USA 85(8) :2444-2448 的相似性检索方法、 通过这些算法的计算机实施(Wisconsin Genetics Software Package, Genetics Computer Group,575Science Dr.,Madison,WI 中的 GAP、BESTFIT、FASTA 和 TFASTA)或通过人工比对 和目视检查[参见,例如Brent等,(2003)Current Protocols in Molecular Biology, John Wiley&Sons,Inc. (Ringbou Ed)]〇
[0203] 适合于确定百分序列同一性和序列相似性的算法的两个实例是BLAST和BLAST 2.0 算法,其分别描述于 Altschul 等(1997)Nucleic Acids Res 25(17):3389-3402 和 Altschul 等(1990)J.M〇1 Biol 215(3) :403-410 中。用于进行 BLAST 分析的软件通过 National Center for Biotechnology Information公开可得。该算法包括通过鉴别查询 序列中长度W的短字串,其在与数据库序列中相同长度的字串比对时匹配或满足一定的正 值阈值评分T,由此首先鉴别高分值序列对(HSP)。T被称为邻近字串评分阈值(Altschul 等,同上)。这些初始邻近字串选中充当启动检索的种子以查找包含其的更长的HSP。字串 选中在两个方向上沿着每个序列延伸,直到累积的比对分值可增加为止。对于核苷酸序列, 利用参数Μ(-对匹配残基的奖励分数,通常>0)和N(非配对残基的罚分,通常<0)计算 累积分数。对于氨基酸序列,使用评分矩阵计算累积分数。每个方向上字串选中的延伸在 下列情况时停止:累积比对分值由其最大实现值跌落量X时;累积分值由于累积了一个或 多个负分残基比对而达到〇以下时;或达到任一个序列的末端时。BLAST算法参数W、T和X 确定比对的灵敏度的速度。BLAST程序(对于核苷酸序列)使用的默认字长(W)为11,期望 值(E)为10, Μ = 5, N = -4和两条链的比较。对于氨基酸序列,BLAST程序使用的默认字 长(W)为3,期望值(E)为10和BL0SUM62评分矩阵[参见Henikoff和Henikoff, (1992) Proc Natl Acad Sci USA 89(22):10915-10919]比对值(B) 50,期望值(E) 10, Μ = 5, N =-4 和两条链的比较。
[0204] BLAST算法还进行两个序列之间相似性的统计分析(参见,例如Karl in和 Altschul,(1993)Proc. Natl. Acad. Sci. USA 90(12) :5873-5787)。由 BLAST 算法提供的一 种相似性测量是最小和概率(P (N)),其提供了两个核苷酸序列或氨基酸序列之间偶然发生 匹配的概率的指示。例如,如果测试核酸与参比核酸的对比中的最小和概率低于约0. 2,更 优选低于约〇. 01,最优选低于约〇. 001,则认为该核酸与参比序列相似。
[0205] 除了如上所述的序列同一性百分比之外,两个核酸序列或多肽基本上相同的另一 指示是由第一核酸编码的多肽与针对由第二核酸编码的多肽产生的抗体具有免疫交叉反 应性,如下所述。因此,例如在两个肽仅存在保守置换的差异时,多肽与第二多肽通常基本 上相同。两个核酸序列基本上相同的另一指示是两个分子或它们的互补序列在严格条件下 彼此杂交,如下所述。两个核酸序列基本上相同的再另一指示是相同的引物可用于扩增该 序列。
[0206] 如本文中公开的,本公开的蛋白酶也可以包括作为由如上所述的蛋白酶基因编码 的保守修饰蛋白酶变体的蛋白酶。如本文所用的,"保守修饰变体"包括编码的氨基酸序列 的单个置换、删除或添加,其导致氨基酸被化学相似的氨基酸置换。提供功能上相似的氨基 酸的保守置换表是本领域中公知的。这类保守修饰变体附加于多态性变体、物种间同源物 和本公开的等位基因且不排除它们。以下八个组包含相互为保守置换的氨基酸:1)丙氨酸 (A)、甘氨酸(G) ;2)天冬氨酸(D)、谷氨酸(E) ;3)天冬酰胺(N)、谷氨酰胺(Q) ;4)精氨酸 (R)、赖氨酸⑷;5)异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、缬氨酸(V) ;6)苯丙氨酸(F)、酪 氨酸(Y)、色氨酸(W) ;7)丝氨酸(S)、苏氨酸⑴和8)半胱氨酸(C)、蛋氨酸(M)(参见,例 如 Creighton, Proteins (1984))。
[0207] 图45-48描绘了所选择的丝状真菌的天冬氨酸蛋白酶、枯草溶菌素蛋白酶、谷氨 酸蛋白酶和Sedolisin蛋白酶的系统发生树。
[0208] 降低本发明蛋白酶的活性的方法
[0209] 本公开的进一步的方面涉及降低表达异源多肽如哺乳动物多肽的丝状真菌细胞 中存在的蛋白酶的活性。
[0210] 丝状真菌细胞中存在的蛋白酶的活性可以通过本领域技术人员已知的任何方法 降低。
[0211] 在一些实施方式中,降低的蛋白酶活性通过降低蛋白酶的表达实现,例如通过启 动子修饰或RNAi。
[0212] 在其它实施方式中,降低的蛋白酶活性通过修饰编码蛋白酶的基因实现。这类修 饰的实例包括,但不限于敲除突变、截断突变、点突变、错义突变、置换突变、移码突变、插入 突变、重复突变、扩增突变、易位突变或反转突变,且导致相应蛋白酶活性的降低。在目标蛋 白酶编码基因中产生至少一个突变的方法是本领域中公知的,且包括,但不限于随机诱变 和筛选、定点诱变、PCR诱变、插入诱变、化学诱变和照射。
[0213] 在某些实施方式中,蛋白酶编码基因的一部分被修饰,如编码催化结构域的区域、 编码区域或编码区域的表达需要的控制序列。基因的这种控制序列可以是启动子序列或其 功能性部分,即足以影响基因的表达的部分。例如,启动子序列可以灭活从而导致无表达, 或者较弱启动子可以替代原始启动子序列以减少编码序列的表达。用于可能的修饰的其它 控制序列包括,但不限于前导序列、前肽序列、信号序列、转录终止子和转录激活子。
[0214] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以通过 利用基因删除技术修饰以消除或降低该基因的表达。基因删除技术使得基因的部分或完全 删除成为可能,从而消除其表达。在这类方法中,基因的删除可以使用构建为连续地包含该 基因侧翼的5'和3'区域的质粒通过同源重组完成。
[0215] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以通 过引入、替换和/或移除基因中的一个或多个核苷酸或者该基因的转录或翻译所需要 的其控制序列来修饰。例如,核苷酸可以插入或移除以引入终止密码子、移除起始密 码子或开放阅读框的移码。这样的修饰可以通过本领域中已知的方法完成,包括,但 不限于定点诱变和peR产生的诱变(参见,例如,Botstein和Shortie, 1985, Science 229:4719 ;Lo 等,1985,Proceedings of the National Academy of Sciences USA 81:2285 ;Higuchi 等,1988,Nucleic Acids Research 16:7351 ;Shimada,1996,Meth. 皿〇1.8丨〇1.57:157;!1〇等,1989,6611677:61;!1〇忖〇11等,1989,66116 77:61及53431'和 Sommer, 1990,BioTechniques 8:404)。
[0216] 另外,存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因可以通 过将基因插入包含与该基因同源的核酸片段的破坏性核酸构建体中(其将产生同源性区 域的重复和在重复的区域之间并入构建体DNA)利用基因破坏技术修饰。如果插入的构建 体将基因的启动子和编码序列分隔开或干扰编码序列以使得产生非功能性基因产物,则这 种基因破坏可以消除基因表达。破坏构建体可以简单地是伴随与该基因同源的5'和3'区 域的选择标记基因。选择标记使得能够鉴别包含破坏的基因的转化体。
[0217] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以通 过基因转化的方法修饰(参见,例如,Iglesias和Trautner,1983, Molecular General Genetics 189:573-76)。例如,在基因转化中,对应于基因的核苷酸序列体外诱变以产生缺 陷核苷酸序列,其随后转化到木霉属菌株中以产生缺陷基因。通过同源重组,缺陷核苷酸序 列替代内源基因。可能希望的是缺陷核苷酸序列也包含用于选择含缺陷基因的转化体的标 记。
[0218] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以使用 与基因的核苷酸序列互补的核苷酸序列通过已建立的反义技术修饰(参见,例如,Parish 和 Stoker, 1997, FEMS Microbiology Letters 154:151-157)。特别地,丝状真菌细胞的基 因表达可以通过引入与基因的核苷酸序列互补的核苷酸序列(其可以转录到菌株中且能 够与细胞中产生的mRNA杂交)降低或灭活。在允许互补的反义核苷酸序列与mRNA杂交的 条件下,翻译的蛋白质的量因此降低或消除。
[0219] 另外,存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以 通过已建立的RNA干扰(RNAi)技术修饰(参见,例如,W02005/056772和W0 2008/080017)。
[0220] 存在于表达重组多肽的丝状真菌细胞中的本公开的蛋白酶编码基因也可以使用 本领域中公知的方法通过随机或特异性诱变修饰,其包括,但不限于化学诱变(参见,例 如,Hopwood, The Isolation of Mutants in Methods in Microbiology(J. R. Norris 和 D.W. Ribbons 编辑)pp. 363-433, Academic Press, New York, 251970)。基因修饰可以通过 使丝状真菌细胞经历诱变和筛选其中基因表达降低或灭活的突变体细胞来进行。例如,诱 变(其可以是特异性的或随机的)可以通过使用合适的物理和化学诱变剂、使用合适的寡 核苷酸、使DNA序列经历peR产生的诱变或其任何组合进行。物理和化学诱变剂的实例包 括,但不限于紫外(UV)照射、羟胺、N-甲基-Ν' -硝基-N-亚硝基胍(MNNG)、N-甲基-Ν' -亚 硝基胍(NTG)、〇-甲基羟胺、亚硝酸、甲磺酸乙酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。 当使用这类试剂时,诱变通常通过在所选择的诱变剂存在下在合适的条件下孵育待诱变的 木霉属细胞,且随后选择表现出降低的或没有基因表达的突变体来进行。
[0221] 在某些实施方式中,本公开的蛋白酶编码基因中的至少一个突变或修饰导致不具 有可检测的蛋白酶活性的修饰的蛋白酶。在其它实施方式中,本公开的蛋白酶编码基因 中的至少一个修饰导致与对应非修饰蛋白酶相比具有至少低25%、低至少50%、低至少 75 %、低至少90 %、至少95 %、至少100 %、至少200 %、至少300 %、至少400 %、至少500 %、 至少600%、至少700%、至少800%、至少900%、至少1,000%或低更高百分比的蛋白酶活 性的修饰的蛋白酶。
[0222] 在某些实施方式中,例如,在木霉属细胞中,本公开的蛋白酶编码基因中的至少一 个突变或修饰导致总蛋白酶活性降低到对应亲本木霉属细胞的总蛋白酶活性的49%或更 低(通常具有至少两个不同蛋白酶基因中的突变),或降低到31%或更低(通常具有至少 三个不同蛋白酶基因中的突变),或降低到13%或更低(通常具有至少四个不同蛋白酶基 因中的突变),或降低到10%或更低(通常具有至少五个不同蛋白酶基因中的突变),或降 低到6. 3%或更低(通常具有至少六个不同蛋白酶基因中的突变),或降低到5. 5%或更低 (通常具有至少七个不同蛋白酶基因中的突变)。
[0223] 本发明的异源多肽
[0224] 本文的本发明进一步涉及通过降低细胞中存在的蛋白酶的活性提高表达异源多 肽的丝状真菌细胞中该异源多肽的产生。
[0225] 如本文中使用的,"异源多肽"是指非天然存在于本公开的丝状真菌细胞中(即丝 状真菌细胞内源)的或在丝状真菌细胞中与多肽的内源形式相比以提高的水平表达的多 肽。在某些实施方式中,异源多肽是哺乳动物多肽。在其它实施方式中,异源多肽是非哺乳 动物多肽。
[0226] 晡乳动物多狀
[0227] 本公开的哺乳动物多肽可以是具有目标生物活性的任何哺乳动物多肽。如本文中 使用的,"哺乳动物多肽"是在哺乳动物中天然表达的多肽、源自哺乳动物中天然表达的多 肽的多肽或其片段。哺乳动物多肽还包括保持生物活性的肽和寡肽。本公开的哺乳动物多 肽还可以包括结合以形成编码的产物的两个或更多个多肽。本公开的哺乳动物多肽可以进 一步包括融合多肽,其包含从至少两个不同多肽获得的部分或完整氨基酸序列的组合。哺 乳动物多肽还可以包括任何所公开的哺乳动物多肽的天然存在等位的和工程化的变体及 杂合哺乳动物多肽。
[0228] 哺乳动物多肽可以是天然糖基化的多肽或天然非糖基化的多肽。
[0229] 合适的哺乳动物多肽的实例包括,但不限于免疫球蛋白、抗体、抗原、抗微生物肽、 酶、生长因子、激素、干扰素、细胞因子、白介素、免疫增强剂(immunodilator)、神经递质、受 体、报告蛋白、结构蛋白和转录因子。
[0230] 合适的哺乳动物多肽的特定实例包括,但不限于免疫球蛋白、免疫球蛋白重链、免 疫球蛋白轻链、单克隆抗体、杂合抗体、F(ab')2抗体片段、F(ab)抗体片段、Fv分子、单链Fv 抗体、二聚化抗体片段、三聚化抗体片段、功能性抗体片段、免疫粘附素、胰岛素样生长因子 1、生长激素、胰岛素、干扰素 a 2b、成纤维细胞生长细胞21、人血清白蛋白、骆驼抗体和/或 抗体片段、单域抗体、多聚单域抗体和促红细胞生成素。
[0231] 合适的哺乳动物多肽的其它实例包括,但不限于氧化还原酶、转移酶、水解酶、裂 合酶、异构酶、连接酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、糖基转移酶、脱氧核糖核 酸酶、酯酶、半乳糖苷酶、β -半乳糖苷酶、葡糖苷酶、葡糖醛酸酶、葡糖醛酸酯酶、齒代过氧 化物酶、转化酶、脂肪酶、氧化酶、磷脂酶、蛋白水解酶、核糖核酸酶、尿激酶、白蛋白、胶原蛋 白、弹性蛋白原和弹性蛋白。
[0232] 非晡乳动物多狀
[0233] 本公开的非哺乳动物多肽可以是具有目标生物活性的任何非哺乳动物多肽。如本 文中使用的,"非哺乳动物多肽"是非哺乳动物生物体如真菌细胞中天然表达的多肽、源自 非哺乳动物生物体中天然表达的多肽的多肽或其片段。非哺乳动物多肽还包括保持生物活 性的肽和寡肽。本公开的非哺乳动物多肽还可以包括结合以形成编码的产物的两个或更多 个多肽。本公开的非哺乳动物多肽可以进一步包括融合多肽,其包含从至少两个不同多肽 获得的部分或完整氨基酸序列的组合。非哺乳动物多肽还可以包括任何所公开的非哺乳动 物多肽的天然存在的等位的和工程化的变体及杂合非哺乳动物多肽。
[0234] 合适的非哺乳动物多肽的实例包括,但不限于氨肽酶、淀粉酶、糖酶、羧肽酶、过氧 化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖 苷酶、葡糖淀粉酶、α -葡糖苷酶、β -葡糖苷酶、转化酶、漆酶、脂肪酶、变构酶(mutanase)、 氧化酶、果胶分解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核 酸酶、转谷氨酰胺酶和木聚糖酶。
[0235] 异源多狀的产牛
[0236] 目标异源多肽使用本领域中已知的方法通过在用于产生异源多肽的营养培养基 中培养包含至少三种具有降低的活性的蛋白酶的本公开丝状真菌细胞而由该细胞产生。例 如,细胞可以通过摇瓶培养、实验室中的小规模或大规模发酵(包括连续、分批、分批补料 或固态发酵)或在合适培养基中和允许表达和/或分离多肽的条件下进行的工业化发酵进 行培养。培养使用本领域中已知的方法发生在包含碳和氮源及无机盐的合适营养培养基 中。合适的培养基可从供应商获得或可以按照公布的组成(例如,在美国典型培养物培养 中心的目录中)制备。分泌的多肽可以从培养基直接回收。如果多肽不分泌,它可以从细 胞裂解产物获得。
[0237] 由包含至少三种具有降低的活性的蛋白酶的本公开丝状真菌细胞产生的目标 异源多肽可以使用对于异源多肽特异性的本领域中已知的方法检测。这些检测方法可 以包括,但不限于使用特异性抗体、高效液相色谱、毛细管色谱、酶产物的形成、酶底物 的消失和SDS-PAGE。例如,可以使用酶分析测定酶的活性。用于测定多种酶的酶活性 的过程是本领域中已知的(参见,例如,0. Schomburg和M. Salzmann (编辑),Enzyme Handbook, Springer-Verlag, New York, 1990)〇
[0238] 所得的异源多肽可以通过本领域中已知的方法分离。例如,目标异源多肽可以通 过常规方法从培养基分离,所述方法包括,但不限于离心、过滤、萃取、喷雾干燥、蒸发和沉 淀。分离的异源多肽然后可以进一步通过本领域中已知的多种过程纯化,其包括,但不限 于色谱法(例如,离子交换色谱、亲和色谱、疏水性色谱、层析聚焦色谱和尺寸排阻色谱)、 电泳过程(例如,制备型等电聚焦(IEF)、差异溶解性(例如,硫酸铵沉淀)或萃取(参 见,例如,Protein Purification, J.-C.Janson 和 Lars Ryden 编辑,VCH Publishers, New York, 1989) 〇
[0239] 编码异源多狀的多核苷酸的制各
[0240] 本公开的异源多核苷酸的序列通过本领域中已知的任何合适的方法制备,其包 括,但不限于直接化学合成或克隆。对于直接化学合成,核酸多聚物的形成通常涉及3' -封 闭和5' -封闭的核苷酸单体顺序添加到生长的核苷酸链的末端5' -羟基上,其中各次添加 通过生长链的末端5' -羟基对添加的单体(其通常是磷衍生物如磷酸三酯、亚磷酰胺等) 的3'位的亲核攻击实现。这种方法是本领域技术人员已知的且在相关文章和文献中描述 [例如,Matteucci 等,(1980)Tetrahedron Lett 21:719-722;美国专利 No. 4, 500, 707、 5, 436, 327和5, 700, 637]。另外,所需的序列可以通过使用合适的限制性酶分裂DNA、使用 凝胶电泳分离片段和之后经由本领域技术人员中已知的技术如利用聚合酶链反应(PCR; 例如美国专利No. 4, 683, 195)从凝胶回收所需的核酸序列而从天然来源分离。
[0241] 本公开的各异源多核苷酸可以并入表达载体中。"表达载体"或"载体"是指转导、 转化或感染宿主细胞的化合物和/或组合物,从而使得细胞表达该细胞本来的核酸和/或 蛋白质以外的核酸和/或蛋白质,或以非该细胞原始的方式表达核酸和/或蛋白质。"表达 载体"包含宿主细胞待表达的核酸(一般地是RNA或DNA)的序列。任选地,表达载体也包 括有助于核酸进入宿主细胞的物质,如病毒、脂质体、蛋白质衣壳等。设想用于本公开中的 表达载体包括核酸序列可以插入其中的与任何优选的或需要的操作元件一起的核酸序列。 此外,表达载体必须是可以转移到宿主细胞中并在其中复制的表达载体。优选的表达载体 是质粒,特别是具有已良好证明的限制性位点并包含核酸序列的翻译优选的或所需的操作 元件的质粒。这类质粒以及其它表达载体是本领域中公知的。
[0242] 单个多核苷酸的并入可以通过已知的方法完成,其包括,例如,使用限制性酶(如 BamHI、Ec〇RI、HhaI、Xh〇I、XmaI等)切割表达载体(例如质粒)中的特定位点。限制性酶产 生单链末端,该单链末端可以与具有与切割的表达载体的末端互补的末端序列或合成为具 有序列与切割的表达载体的末端互补的末端序列的多核苷酸退火。退火使用适宜的酶(例 如,DNA连接酶)进行。如本领域技术人员理解的,表达载体和所需的多核苷酸两者经常用 相同的限制性酶切割,从而确保表达载体的末端和多核苷酸的末端彼此互补。另外,DNA连 接体可以用于帮助将核酸序列连接到表达载体中。
[0243] -系列的单个多核苷酸也可以通过利用本领域中已知的方法(例如,美国专利 No. 4, 683, 195)进行组合。
[0244] 例如,所需的多核苷酸开始可以各自在单独的PCR中产生。之后,设计特异性引物 以使得PCR产物的末端包含互补序列。当PCR产物混合、变性和再退火时,在其3'末端具 有匹配序列的链重叠并可以起到彼此的引物的作用。这种重叠通过DNA聚合酶延伸以产生 其中原始序列被"剪接"到一起的分子。以这种方式,一系列的单个多核苷酸可以"剪接"到 一起并随后同时转导到宿主细胞中。因此,实现多个多核苷酸中各多核苷酸的表达。
[0245] 单个多核苷酸或"剪接"的多核苷酸然后并入表达载体中。本公开对于多核苷 酸并入表达载体中的方法没有限制。本领域普通技术人员熟悉用于将多核苷酸并入表达 载体中的必要步骤。典型的表达载体包含需要的多核苷酸,在其之前是一个或多个调控 区域以及核糖体结合位点,例如大肠杆菌中的长度3-9个核苷酸并位于起始密码子上游 3-11 个核苷酸的核苷酸序列。参见 Shine 和 Dalgarno (1975) Nature 254(5495) :34-38 及 Steitz(1979)Biological Regulation and Development (编者 Goldberger, R. F.),1:349-399(Plenum, New York)。
[0246] 如本文中使用的,术语"可操作地连接"是指其中控制序列相对于DNA序列或多核 苷酸的编码序列处于适宜的位置以使得控制序列指导多肽的表达。
[0247] 调控区域包括例如,包含启动子和操纵基因的那些区域。启动子与所需的多核苷 酸可操作地连接,从而通过RNA聚合酶启动多核苷酸的转录。操纵基因是与启动子相邻的 核酸序列,其包含其中阻遏蛋白可以结合的蛋白质结合结构域。在不存在阻遏蛋白的情况 下,转录通过启动子启动。当存在阻遏蛋白时,对于操纵基因的蛋白质结合结构域特异性的 阻遏蛋白结合操纵基因,从而抑制转录。以这种方式,转录的控制基于所使用的特定调控 区域和相应阻遏蛋白的存在或不存在完成。实例包括乳糖启动子(Lad阻遏蛋白在与乳糖 接触时改变构象,从而阻止Lad阻遏蛋白结合操纵基因)和色氨酸启动子(当与色氨酸复 合时,TrpR阻遏蛋白具有结合操纵基因的构象;在不存在色氨酸的情况下,TrpR阻遏蛋白 具有不结合操纵基因的构象)。另一个实例是tac启动子(参见de Boer等,(1983)Proc Natl Acad Sci USA 80(1) :21-25)。如本领域普通技术人员理解的,这些和其它表达载体 可以用于本公开中,且本公开在这一方面不受限制。
[0248] 虽然任何合适的表达载体可以用于并入所需的序列,但容易获得的表达载体包 括,但不限于:质粒如 pSC101、pBR322、pBBRlMCS-3、pUR、pEX、pMR100、pCR4、pBAD24、pUC19、 PRS426和噬菌体如Ml 3噬菌体和λ噬菌体,当然,这类表达载体可能仅适合于特定宿主细 胞。但是,本领域技术人员可以容易地通过常规试验确定是否任何特定表达载体适合于任 何给定宿主细胞。例如,表达载体可以引入宿主细胞中,然后监测宿主细胞的存活力和载体 中包含的序列的表达。另外,可以参考描述表达载体及其对任何特定宿主细胞的适合性的 相关文章和文献。
[0249] 用于本发明目的(包括所需异源多肽、酶和一种或多种本文描述的催化结构域的 表达)的合适的表达载体包括包含与组成型或诱导型启动子可操作地连接的编码所需异 源多肽、酶或催化结构域的多核苷酸的表达载体。用于与这类多核苷酸可操作地连接的特 别适合的启动子的实例包括来自以下基因的启动子:gpdA、cbhl、米曲霉TAKA淀粉酶、米 赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸性稳 定ct-淀粉酶、黑曲霉葡糖淀粉酶(glaA)、泡盛曲霉(Aspergillus awamori)glaA、米赫根 毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、米曲霉乙酰 胺酶、尖孢镰刀菌胰蛋白酶样蛋白酶、真菌内α-L-阿拉伯糖酶(abnA)、真菌α-L-阿拉伯 呋喃糖酶A(abfA)、真菌α-L-阿拉伯呋喃糖酶B(abfB)、真菌木聚糖酶(xlnA)、真菌肌醇 六磷酸酶、真菌ATP-合酶、真菌亚基9 (oliC)、真菌磷酸丙糖异构酶(tpi)、真菌醇脱氢酶 (adhA)、真菌α -淀粉酶(amy)、真菌淀粉葡糖苷酶(glaA)、真菌乙酰胺酶(amdS)、真菌甘油 醛-3-磷酸脱氢酶(gpd)、酵母醇脱氢酶、酵母乳糖酶、酵母3-磷酸甘油酸激酶、酵母磷酸丙 糖异构酶、细菌α -淀粉酶、细菌Sp〇2和SS0。这种合适的表达载体和启动子的实例也描述 于PCT/EP2011/070956中,其全部内容在此通过引入并入本文。
[0250] 何含通讨本发明的丝状直菌细朐产牛的异源多狀的药物纟目合物
[0251] 在另一个方面,本发明提供包含与药物可接受的载体一起配制的本公开的丝状真 菌细胞产生的一种或多种目标异源多肽如哺乳动物多肽的组合物,例如药物组合物,该丝 状真菌细胞具有至少三种降低的蛋白酶的活性且进一步包含编码异源多肽的重组多核苷 酸。本发明的药物组合物也可以在组合疗法中施用,即与其它的药剂组合。例如,组合疗法 可以包括与至少一种另外的治疗剂组合的目标哺乳动物多肽。
[0252] 如本文中使用的,"药物可接受的载体"包括生理相容的任何和所有的溶剂、分散 介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等等。优选地,载体适合于静脉内、 肌肉内、皮下、肠胃外、脊髓或表皮施用(例如,通过注射或输注)。取决于施用途径,活性成 分,即目标哺乳动物多肽,可以包被在材料中以保护化合物免于酸和可灭活该化合物的其 它自然条件的作用。
[0253] 本发明的药物组合物可以包括一种或多种药物可接受的盐。"药物可接受的盐"是 指保持母体化合物的所需生物活性且不施加任何不希望的毒理学效应的盐(参见,例如, Berge, S. M.等(1977) J. Pharm. Sci. 66:1-19)。这类盐的实例包括酸加成盐和碱加成盐。酸 加成盐包括由非毒性无机酸如盐酸、硝酸、磷酸,硫酸、氢溴酸、氢碘酸、亚磷酸等衍生的那 些,以及由非毒性有机酸如脂族单-和二羧酸、苯基取代的链烷酸、羟基链烷酸、芳香酸、月旨 族和芳族磺酸等衍生的那些。碱加成盐包括由碱土金属如钠、钾、镁、钙等衍生的那些,以及 由非毒性有机胺如Ν,Ν' -二苄基乙二胺、N-甲基葡糖胺、氯普鲁卡因、胆碱、二乙醇胺、乙二 胺、普鲁卡因等衍生的那些。
[0254] 发明的药物组合物也可以包括药物可接受的抗氧化剂。药物可接受的抗氧化剂 的实例包括:(1)水溶性抗氧化剂如抗坏血酸、盐酸半胱氨酸、硫酸氢钠、焦亚硫酸钠、亚 硫酸钠等;(2)油溶性抗氧化剂如抗坏血酸棕榈酸盐、丁羟基茴香醚(ΒΗΑ)、丁基羟基甲苯 (ΒΗΤ)、卵磷脂、没食子酸丙酯、α-生育酚等;和(3)金属螯合剂如柠檬酸、乙二胺四乙酸 (EDTA)、山梨糖醇、酒石酸、磷酸等。
[0255] 可以用于发明的药物组合物中的合适的水性和非水性载体的实例包括水、乙醇、 多元醇(如甘油、丙二醇、聚乙二醇等)及其合适的混合物、植物油如橄榄油及可注射有机 酯如油酸乙酯。适当的流动性可例如通过使用包衣材料如卵磷脂、通过保持所需的颗粒尺 寸(在分散体的情况中)和通过使用表面活性剂维持。
[0256] 这些组合物也可以包含辅剂如防腐剂、湿润剂、乳化剂和分散剂。防止微生物的存 在可以通过消毒过程和通过包括各种抗细菌剂和抗真菌剂(例如,对羟基苯甲酸酯、氯丁 醇、苯酚、山梨酸等)来确保。也可能需要的是包括等渗剂如糖、氯化钠等到组合物中。另 夕卜,注射药物形式的延长吸收可通过包括延迟吸收的试剂如单硬脂酸铝和明胶获得。
[0257] 药物可接受的载体包括无菌水性溶液或分散液和用于即时制备无菌注射溶液或 分散液的无菌粉末。用于药物活性物质的这类介质和试剂的使用是本领域中已知的。除非 任何常规的介质或试剂与活性化合物不相容,其在本发明的药物组合物中的使用是可预期 的。补充的活性化合物也可以合并到组合物中。
[0258] 治疗组合物通常必须在制造和储存条件下是无菌的和稳定的。组合物可以配制为 溶液、微乳液、脂质体或其它适合于高药物浓度的有序结构。载体可以是包含例如水、乙醇、 多元醇(如甘油、丙二醇和液体聚乙二醇等)及其合适的混合物的溶剂或分散介质。适当 的流动性可例如通过使用包衣材料如卵磷脂、通过保持所需的颗粒尺寸(在分散体的情况 中)和通过使用表面活性剂维持。在许多情况中,优选的是组合物中包括等渗剂,例如糖、 多元醇如甘露醇、山梨醇或氯化钠。可注射组合物的延长吸收可通过在组合物中包括延迟 吸收的试剂例如单硬脂酸盐和明胶获得。
[0259] 可以如下制备无菌注射溶液:根据需要在具有上文所列举的一种组分或组分组合 的合适溶剂中掺入需要量的活性化合物,接着进行无菌微滤。一般而言,通过将活性化合物 掺入无菌媒介中来制备分散体,所述无菌媒介含有基础分散介质及所需的那些上文所列举 的组分中的其它组分。在用于制备无菌注射溶液的无菌粉末的情况中,特定制备方法是自 先前无菌过滤的溶液产生活性成分加任何其它需要的成分的粉末的真空干燥和冷冻干燥 (冻干)。
[0260] 可以与载体材料组合以产生单一剂型的活性成分的量随待治疗的受试者和特定 的施用方式变化。可以与载体材料组合以产生单一剂型的活性成分的量一般是产生治疗效 果的该组合物的量。一般地,在百分之一百中,这一量在约0.01% -约99%的活性成分的 范围内,优选约〇. 1 % -约70%,最优选与药物可接受的载体组合的约1 % -约30%的活性 成分。
[0261] 剂量方案经调整以提供最佳的所需反应(例如,治疗反应)。例如,可以施用单一 的大剂量,可以随时间施用几个分开的剂量或可以如治疗状况的紧急性所指示的成比例地 降低或提高剂量。特别有利的是配制单位剂型的肠胃外组合物以实现施用方便性和剂量均 匀性。如本文中使用的,单位剂型是指适合作为用于待治疗受试者的单一剂量的物理离散 单元;各单元包含与需要的药物载体结合的经计算以产生所需治疗效果的预定量的活性化 合物。本发明的单位剂型的规格由以下方面决定并直接取决于以下方面:(a)活性化合物 的独特特征和待获得的特定治疗效果和(b)组合这种活性化合物以处理个体的敏感性的 领域中固有的限制。
[0262] 对于目标哺乳动物多肽的施用,特别是其中哺乳动物多肽是抗体的情况中,剂量 范围为宿主体重的约〇· 〇〇〇l-l〇〇mg/kg,更通常0· 01-5mg/kg。例如,剂量可以是0· 3mg/kg 体重,lmg/kg体重,3mg/kg体重,5mg/kg体重或10mg/kg体重或者在l-10mg/kg的范围内。 示例性的治疗方案需要每周施用一次、每两周一次、每三周一次、每四周一次、一月一次、每 3个月一次或每3-6个月一次。用于抗体的特定剂量方案可以包括经静脉内施用的lmg/kg 体重或3mg/kg体重,其中抗体使用以下给药时间表之一给予:(i)每四周六个剂量,然后每 三个月;(ii)每三周;(iii)3mg/kg体重一次,之后每三周lmg/kg体重。
[0263] 或者,目标哺乳动物多肽可以作为持续释放制剂施用,在该情况中需要较低频率 的施用。剂量和频率根据施用的物质在患者中的半衰期变化。一般地,人抗体显示最长的 半衰期,之后是人源化抗体、嵌合抗体和非人抗体。施用剂量和频率可以根据治疗是预防性 的还是治疗性的而变化。在预防性应用中,相对低的剂量在长时间段中以相对较低的频率 施用。一些患者在其剩余生存期中持续接受治疗。在治疗性应用中,有时需要以相对短的 间隔施用相对高的剂量直到疾病进展降低或终止,且优选直到患者显示疾病症状的部分或 完全改善。随后,患者可以施用预防性方案。
[0264] 本公开的药物组合物中活性成分的实际剂量水平可以变化以获得对于特定患者、 组成和施用途径有效实现所需治疗反应而对患者非毒性的活性成分量。选择的剂量水平取 决于多种药代动力学因素,包括所采用的本发明特定组合物或其酯、盐或氨基化合物的活 性、施用途径、施用时间、使用的特定化合物的排泄率、治疗持续时间、与使用的特定组合物 组合的其它药物、化合物和/或物质、所治疗患者的年龄、性别、体重、状况、总体健康和先 前病史及医学领域中公知的类似因素。
[0265] 本公开的免疫球蛋白的"治疗有效剂量"优选导致疾病症状严重性的降低、无疾病 症状期的频率和持续时间的增加或者防止由于患病导致的损害或残疾。例如,对于肿瘤的 治疗,"治疗有效剂量"优选相对于未治疗受试者抑制细胞生长或肿瘤生长至少约20%,更 优选至少约40 %,甚至更优选至少约60 %,且再更优选至少约80 %。化合物抑制肿瘤生长 的能力可以在指示人肿瘤中的效力的动物模型系统中评估。或者,组合物的这一性质可以 通过熟练的实施者已知的分析方法检验化合物体外抑制这种抑制作用的能力来评估。治疗 有效量的治疗化合物可以减小肿瘤尺寸或以其它方式改善受试者的症状。本领域技术人员 能够基于如受试者体型、受试者症状的严重性和所选择的特定组合物或施用途径的因素确 定这种量。
[0266] 本公开的组合物可以使用本公开中已知的多种方法中的一种或多种经由一种或 多种施用途径施用。如本领域技术人员理解的,施用途径和/或方式根据所需的结果变化。 用于本发明的结合部分的特定施用途径包括静脉内、肌肉内、皮内、腹膜内、皮下、脊髓或其 它肠胃外施用途径,例如通过注射或输注。如本文中使用的,短语"肠胃外施用"意思是肠 施用和局部施用以外的施用方式,通常是通过注射,且包括,但不限于静脉内、肌肉内、动脉 内、鞘内、囊内、眶内、心脏内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、 脊柱内、硬膜外及胸骨内注射和输注。
[0267] 或者,根据本公开的哺乳动物多肽可以经由非肠胃外途径如局部、表皮或粘膜施 用途径施用,例如,鼻内、口服、阴道、直肠、舌下或局部。
[0268] 活性化合物可以用保护化合物免于快速释放的载体制备,如控释制剂,包括植入 物、透皮贴片和微囊化递送系统。可以使用生物可降解的生物相容性聚合物如乙烯乙酸乙 烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。用于制备这类制剂的许多方法获得专利 或一般为本领域技术人员已知(参见,例如,Sustained and Controlled Release Drug Delivery Systems, J. R. Robinson 编辑,Marcel Dekker,Inc.,New York, 1978)。
[0269] 治疗组合物可以利用本领域中已知的医疗机械施用。例如,在特定实施方式 中,本发明的治疗组合物可以利用无针皮下注射装置施用,如美国专利No. 5, 399, 163 ; 5, 383, 851 ;5, 312, 335 ;5, 064, 413 ;4, 941,880 ;4, 790, 824 或 4, 596, 556 中公开的装置。 可用于本发明中的公知植入物和模块的实例包括:美国专利No. 4, 487, 603,其公开了用于 以受控速率分配药物的可植入微输注泵;美国专利No. 4, 486, 194,其公开了用于通过皮肤 施用药物的治疗装置;美国专利No. 4, 447, 233,其公开了用于以精确输注速率递送药物的 药物输注泵;美国专利No. 4, 447, 224,其公开了用于连续药物递送的可变流量植入输注装 置;美国专利No. 4, 439, 196,其公开了具有多腔区室的渗透性药物递送系统和美国专利 No. 4, 475, 196,其公开了渗透性药物递送系统。
[0270] 在某些实施方式中,根据本公开的哺乳动物多肽的使用是用于治疗可用治疗性抗 体治疗的任何疾病。
[0271] 本发明的丝状真菌细胞
[0272] 本文的本发明还涉及通过降低或消除表达异源多肽的细胞中存在的且催化异源 多肽降解的至少三种蛋白酶的活性来提高丝状真菌细胞中异源多肽如哺乳动物多肽的产 生水平。降低或消除表达异源多肽的丝状真菌细胞中存在的蛋白酶的活性提高了表达的重 组多肽的稳定性,其导致异源多肽产生水平的提高。丝状真菌细胞中存在的蛋白酶的活性 可以例如通过修饰编码蛋白酶的基因降低。
[0273] "丝状真菌细胞"包括来自真菌和卵菌亚门的所有丝状形式的细胞(如由 Hawksworth 等定义的,Ainsworth and Bisby's Dictionary of The Fungi,第 8 版,1995, CAB International, University Press, Cambridge, UK)。丝状真菌细胞一般特征 在于由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖和其它复合多糖组成的菌丝体壁。 营养性生长是通过菌丝延伸且碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养性 生长是通过单细胞菌体的出芽和碳分解代谢可以是发酵的。
[0274] 任何丝状真菌细胞可以用于本公开中,只要它在用核酸序列转化和/或者经修饰 或突变以降低蛋白酶活性后保持存活。优选地,丝状真菌细胞不受必要核酸序列转导、蛋白 质(例如哺乳动物蛋白)的后续表达或得到的中间体的不利影响。
[0275] 合适的丝状真菌细胞的实例包括,但不限于来自支顶孢属、曲霉属、镰孢菌属、 腐质霉属、毛霉属、毁丝霉属、链抱霉属、青霉属、柱霉属、梭抱壳属、弯颈霉属或木霉属困 株的细胞。在某些实施方式中,丝状真菌细胞来自木霉属、支顶孢属、曲霉属、短梗霉属、 隐球菌属、金抱子菌属、Chrysosporium lucknowense、Filibasidium、链抱霉属、赤霉属、 Magnaporthe、毛霉属、毁丝霉属、漆斑菌属、新美鞭菌属(Neocallimastix)、链孢霉属、拟青 霉属(Paecilomyces)、青霉属、瘤胃壶菌属(Piromyces)、裂裙菌属(Schizophyllum)、踝节 菌属(Talaromyces)、Thermoascus、梭孢壳属或弯颈霉属菌株。
[0276] 本公开的曲霉属真菌细胞可以包括,但不限于棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、棒曲霉(Aspergillus clavatus)、黄 曲霉、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉 (Aspergillus japonicus)、构巢曲霉、黑曲霉、米曲霉或土曲霉。
[0277] 本公开的链孢霉属真菌细胞可以包括,但不限于粗糙链孢霉。
[0278] 在某些实施方式中,丝状真菌细胞不是曲霉属细胞.
[0279] 在某些实施方式中,丝状真菌细胞选自木霉属(里氏木霉)、链孢霉(粗糙链孢 霉)、青霉属(产黄青霉)、曲霉属(构巢曲霉、黑曲霉和米曲霉)、毁丝霉属(嗜热毁丝霉) 和金抱子菌属(C. lucknowense)。
[0280] 在某些实施方式中,丝状真菌细胞是木霉属真菌细胞。本公开的木霉属真菌细 胞可以源自野生型木霉属菌株或其突变体。合适的木霉属真菌细胞的实例包括,但不限 于哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉 (Trichoderma longibrachiatum)、里氏木霉、深绿木霉、绿木霉、绿色木霉及其可选的有性 形式(即肉座菌(Hypocrea))。
[0281] 破坏丝状真菌细胞的基因和培养丝状真菌细胞的一般方法,例如,对于青霉 属,公开于 Kopke 等(2010)Application of the Saccharomyces cerevisiae FLP/ FRT recombination system in filamentous fungi for marker recycling and construction of knockout strains devoid of heterologous genes. Appl Environ Microbiol.76 (14):4664-74. doi:10. 1128/AEE 00670-10 中,对于曲霉属,公开于 Maruyama 和 Kitamoto (2011),Targeted Gene Disruption in Koji Mold Aspergillus oryzae, James A. Williams (编辑),Strain Engineering:Methods and Protocols, Methods in Molecular Biology, vol. 765, D0I10. 1007/978-l-61779-197-0_27 中,对于链孢霉属, 公开于 Collopy 等(2010)High-throughput construction of gene deletion cassettes for generation of Neurospora crassa knockout strains. Methods Mol Biol.2010 ; 638:33-40. doi: 10. 1007/978-l-60761-611-5_3中和对于毁丝霉属或金孢子菌属,公开于 PCT/NL2010/000045 和 PCT/EP98/06496 中。
[0282] 丝状直菌细朐成分
[0283] 本公开的特定方面涉及具有降低的或没有至少三种蛋白酶的可检测的活性和具 有编码以提高的水平(例如至少两倍高的水平)产生的异源多肽的重组多核苷酸的丝状真 菌细胞。本公开的其它方面涉及具有降低的或没有至少三种蛋白酶的可检测的活性的木 霉属真菌细胞,该至少三种蛋白酶选自pepl、pep2、pep3、pep4、pep5、pep8、pepll、pepl2、 tspl、slpl、slp2、slp7、gapl和gap2,其中细胞进一步包含编码以比对应亲本木霉属细胞 中多肽的产生水平高至少两倍的水平产生的哺乳动物多肽的重组多核苷酸。在某些实施方 式中,丝状真菌细胞或木霉属真菌细胞具有降低的或没有至少四种、至少五种、至少六种、 至少七种、至少八种、至少九种、至少十种、至少i^一种、至少十二和或更多种蛋白酶的活 性。
[0284] 降低的蛋白酶的表达
[0285] 本公开的丝状真菌细胞或木霉属真菌细胞中至少三种蛋白酶的降低的活性可以 是蛋白酶表达降低或消除的结果。在一些实施方式中,至少三种蛋白酶的降低的或消除的 表达是对催化结构域、编码区域或编码各蛋白酶的基因的编码区域的表达所需的控制区域 进行修饰的结果。在其它实施方式中,蛋白酶的降低的或消除的表达是引入、替换和/或移 除基因或编码各蛋白酶的基因的转录或翻译需要的控制序列中的一个或多个核苷酸的结 果。
[0286] 在进一步的实施方式中,蛋白酶的降低的或消除的表达是将各包含与各基因同源 的核酸片段的破坏性核酸构建体插入编码各蛋白酶的基因中的结果,这产生同源性区域的 重复和将构建体DNA并入重复区域之间。在其它实施方式中,蛋白酶的降低的或消除的表 达是编码各蛋白酶的基因的基因转化的结果。在再其它的实施方式中,蛋白酶的降低的或 消除的表达是通过对于编码各蛋白酶的基因中的各基因特异性的反义多核苷酸或RNAi构 建体产生的结果。在一个实施方式中,RNAi构建体对于编码天冬氨酸蛋白酶如pep-型蛋 白酶、胰蛋白酶样丝氨酸蛋白酶如tspl、谷氨酸蛋白酶如gap-型蛋白酶、枯草溶菌素蛋白 酶如sip-型蛋白酶或Sedolisin蛋白酶如tppl或slp7蛋白酶的基因是特异性的。在一 个实施方式中,RNAi构建体对于编码sip-型蛋白酶的基因是特异性的。在一个实施方式 中,RNAi构建体对于编码slp2、slp3、slp5或slp6的基因是特异性的。在一个实施方式 中,RNAi构建体对于两种或更多种蛋白酶是特异性的。在一个实施方式中,两种或更多种 蛋白酶是pep-型蛋白酶中的任一种、胰蛋白酶样丝氨酸蛋白酶中的任一种、sip-型蛋白酶 中的任一种、gap-型蛋白酶中的任一种和/或Sedolisin蛋白酶的任一种。在一个实施方 式中,两种或更多种蛋白酶是slp2、slp3、slp5和/或slp6。在一个实施方式中,RNAi构 建体包含表22. 2的核酸序列中的任一种。
[0287] 在一些实施方式中,编码蛋白酶的基因各包含降低或消除相应蛋白酶活性的突 变。在其它实施方式中,突变降低或消除各蛋白酶的表达。在进一步的实施方式中,突变 是降低或消除相应蛋白酶活性的敲除突变、截断突变、点突变、错义突变、置换突变、移码突 变、插入突变、重复突变、扩增突变、易位突变或反转突变。
[0288] 在一些实施方式中,突变是蛋白酶编码基因的删除。在其它实施方式中,突变是编 码蛋白酶的催化结构域的蛋白酶编码基因部分的删除。在再其它的实施方式中,突变是编 码蛋白酶的催化结构域的蛋白酶编码基因部分中的点突变。
[0289] 蛋白酶基因的组合
[0290] 本公开的丝状真菌细胞或木霉属细胞可以包含至少三种、至少四种、至少五种、至 少六种、至少七种、至少八种、至少九种、至少十种或更多种天冬氨酸蛋白酶、胰蛋白酶样丝 氨酸蛋白酶、枯草溶菌素蛋白酶和/或谷氨酸蛋白酶。在某些实施方式中,蛋白酶由pep-型 蛋白酶基因、gap-型蛋白酶基因或sip-型蛋白酶基因编码。在一些实施方式中,p印-型 蛋白酶基因选自pepl、pep2、pep3、pep4、pep5、pep8、pepll和pepl2。在其它实施方式中, gap-型蛋白酶基因选自gapl和gap2。在进一步的实施方式中,sip-型蛋白酶基因选自 slpl、slp2、slp3 和 slp7 或选自 slpl、slp2、slp3、slp5、slp6、slp7 和 slp8。在某些优选 的实施方式中,sip-型蛋白酶基因是slpl。
[0291] 在其它实施方式中,蛋白酶由选自pepl、pep2、pep3、pep4、pep5、pep7、pep8、 pepll、pepl2、tspl、slpl、slp2、slp3、slp5、slp6、slp7、slp8、gapl、gap2 和 tppl 的基因 编码。在一些实施方式中,丝状真菌细胞,例如,木霉属细胞具有降低的或没有至少三种或 至少四种选自 pepl、pep2、pep3、pep4、pep5、pep8、pepll、pepl2、tspl、slpl、slp2、slp3、 slp7、gapl和gap2的蛋白酶编码基因的表达水平。在某些实施方式中,丝状真菌细胞,例 如木霉属细胞具有降低的或没有至少三种选自pepl、tspl和slpl的蛋白酶编码基因的表 达水平。在其它实施方式中,丝状真菌细胞或木霉属细胞具有降低的或没有至少三种选自 gapl、slpl和p印1的蛋白酶编码基因的表达水平。在一些实施方式中,丝状真菌细胞,例如 木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、p印1和gapl的表达水平。在一些实 施方式中,丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、pepl、 gapl和p印4的表达水平。在一些实施方式中,丝状真菌细胞,例如木霉属细胞具有降低的 或没有蛋白酶编码基因 slp2、pepl、gapl、pep4和slpl的表达水平。在一些实施方式中, 丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、p印l、gapl、p印4、 slpl和slp3的表达水平。在一些实施方式中,丝状真菌细胞,例如木霉属细胞具有降低的 或没有蛋白酶编码基因 slp2、pepl、gapl、pep4、slpl、slp3和pep3的表达水平。在一些实 施方式中,丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、pepl、 gapl、pep4、slpl、slp3、pep3和pep2的表达水平。在一些实施方式中,丝状真菌细胞,例如 木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、pepl、gapl、pep4、slpl、slp3、pep3、 p印2和p印5的表达水平。在一些实施方式中,丝状真菌细胞,例如木霉属细胞具有降低的 或没有蛋白酶编码基因 slp2、pepl、gapl、pep4、slpl、slp3、pep3、pep2、pep5 和 tspl 的表 达水平。在一些实施方式中,丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码 基因 slp2、pepl、gapl、pep4、slpl、slp3、pep3、pep2、pep5、tspl 和 slp7 的表达水平。在 一些实施方式中,丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、 pepl、gapl、pep4、slpl、slp3、pep3、pep2、pep5、tspl、slp7 和 slp8 的表达水平。在一些实 施方式中,丝状真菌细胞,例如木霉属细胞具有降低的或没有蛋白酶编码基因 slp2、pepl、 gapl、pep4、slpl、slp3、pep3、pep2、pep5、tspl、slp7、slp8 和 gap2 的表达水平。
[0292] 在某些实施方式中,丝状真菌细胞的至少三种、至少四种、至少五种、至少六种、至 少七种、至少八种、至少九种、至少十种或更多种蛋白酶具有降低的蛋白酶活性,其中具有 野生型活性的相应蛋白酶各具有与SEQ ID N0:l-16、17-36、37-57、58-65、66-81、82-97、 98-117、118-128、129-144、166-181、182-185 或 SEQ ID N0:491-588 的氨基酸序列至少 70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少 98%、至少99%或100%相同的氨基酸序列。在其中丝状真菌细胞是具有一种或多种蛋白 酶的降低的蛋白酶活性的木霉属真菌细胞的实施方式中,其中具有野生型活性的相应蛋白 酶各具有与SEQIDN0:1、17、37、58、66、82、98、118、129、166或182或者SEQIDN0:507、 SEQ ID N0:522或SEQ ID N0:530的氨基酸序列至少70%、至少75%、至少80%、至少85%、 至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序 列。
[0293] 异源多肽
[0294] 本公开的丝状真菌细胞或木霉属真菌细胞包含编码异源多肽的重组多核苷酸。在 某些实施方式中,异源多肽是哺乳动物多肽。在其它实施方式中,异源多肽是非哺乳动物多 肽。
[0295] 在其中丝状真菌细胞包含编码哺乳动物多肽的重组多核苷酸的实施方式中,哺乳 动物多肽可以是非糖基化的哺乳动物多肽、糖基化的哺乳动物多肽或其组合,其包括,但不 限于免疫球蛋白、抗体、生长因子和干扰素。在一些实施方式中,哺乳动物多肽是免疫球蛋 白或抗体。在其中丝状真菌细胞包含编码免疫球蛋白或抗体的重组多核苷酸的实施方式 中,丝状真菌细胞,例如木霉属真菌细胞可以具有降低的或没有至少三种或至少四种选自 pepl、pep3、pep4、pep8、pepll、pepl2、tspl、slpl、slp2、slp7、gapl 和 gap2 的蛋白酶编码 基因的表达。在某些优选的实施方式中,细胞,例如木霉属真菌细胞,包含编码免疫球蛋白 或抗体的重组多核苷酸并具有降低的或没有蛋白酶编码基因 slpl、slp2、slp3、tspl、p^)l、 区&口146口446口346口246口5和83口2的表达。在某些优选的实施方式中,细胞,例如木霉属 真菌细胞,包含编码免疫球蛋白或抗体的重组多核苷酸并具有降低的或没有蛋白酶编码基 因 p印l、tspl、slpl和gapl的表达。在其它实施方式中,细胞包含编码免疫球蛋白或抗体 的重组多核苷酸并具有降低的蛋白酶编码基因 pepl、tspl、slpl、gapl和pep4的表达。在 其它实施方式中,细胞包含编码免疫球蛋白或抗体的重组多核苷酸并具有降低的蛋白酶编 码基因 slpl、slp2和slp3的表达。在其它实施方式中,细胞包含编码免疫球蛋白或抗体的 重组多核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、slp3和tspl的表达。在其它实 施方式中,细胞包含编码免疫球蛋白或抗体的重组多核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、slp3、tspl和pepl的表达。在其它实施方式中,细胞包含编码免疫球蛋白或抗 体的重组多核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、slp3、tspl、pepl和gapl的表 达。在其它实施方式中,细胞包含编码免疫球蛋白或抗体的重组多核苷酸并具有降低的蛋 白酶编码基因 slpl、slp2、slp3、tspl、pepl、gapl和pep4的表达。在其它实施方式中,细 胞包含编码免疫球蛋白或抗体的重组多核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、 81口348口1、口6口1、8&口1、口6口4和口6口3的表达。在其它实施方式中,细胞包含编码免疫球蛋白 或抗体的重组多核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、slp3、tspl、pepl、gapl、 p印4、p印3和p印2的表达。在其它实施方式中,细胞包含编码免疫球蛋白或抗体的重组多 核苷酸并具有降低的蛋白酶编码基因 slpl、slp2、slp3、tspl、pepl、gapl、pep4、pep3、pep2 和pep5的表达。
[0296] 在其它实施方式中,丝状真菌细胞包含编码生长因子、干扰素、细胞因子或白介素 的重组多核苷酸。在其中丝状真菌细胞,例如木霉属真菌细胞包含编码生长因子、干扰素、 细胞因子、人血清白蛋白或白介素的重组多核苷酸的实施方式中,丝状真菌细胞可以具有 降低的或没有至少三种或至少四种选自pepl、pep2、pep3、pep4、pep5、pep8、gapl、gap2、 slpl、slp2、slp7和tspl的蛋白酶编码基因的表达。在某些实施方式中,细胞包含编码生 长因子、干扰素、细胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编 码基因 pepl、tspl、slpl、gapl和gap2的表达。在某些实施方式中,细胞包含编码生长因 子、干扰素、细胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基 因 slpl、slp2、pepl、gapl、pep4、slp7、pep2、pep3、pep5、tspl 和 gap2 的表达。在其它实 施方式中,细胞,例如木霉属真菌细胞,包含编码生长因子、干扰素、细胞因子、人血清白蛋 白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 pepl、tspl、slpl、gapl、gap2和 P印4的表达。在进一步的实施方式中,细胞包含编码生长因子的重组多核苷酸并具有降低 的选自pepl、pep2、pep3、pep4和pep5的pep-型蛋白酶基因的表达。在某些优选的实施 方式中,生长因子是IGF-1或干扰素是干扰素- a 2b。在某些实施方式中,细胞包含编码生 长因子、干扰素、细胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编 码基因 P印l、gapl和p印4的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细 胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 P印l、gapl、 p印4和slp7的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细胞因子、人血 清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 pepl、gapl、pep4、slp7 和slp2的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细胞因子、人血清白 蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 pepl、gapl、pep4、slp7、slp2 和p印2的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细胞因子、人血清白 蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 pepl、gapl、pep4、slp7、slp2、 p印2和p印3的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细胞因子、人血 清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 P印1、gap 1、p印4、slp7、 slp2、pep2、p印3和p印5的表达。在某些实施方式中,细胞包含编码生长因子、干扰素、细 胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编码基因 P印l、gapl、 pep4、slp7、slp2、pep2、pep3、pep5和slpl的表达。在某些实施方式中,细胞包含编码生 长因子、干扰素、细胞因子、人血清白蛋白或白介素的重组多核苷酸并具有降低的蛋白酶编 码基因 pepl、gapl、pep4、slp7、slp2、pep2、pep3、pep5、slpl 和 tspl 的表达。
[0297] 在某些实施方式中,哺乳动物多肽以比没有降低的蛋白酶活性的对应亲本丝状真 菌细胞中多肽的产生水平高至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、 至少9倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍、 至少60倍、至少70倍、至少75倍、至少80倍、至少90倍、至少100倍或更高倍的水平产生。 在其它实施方式中,哺乳动物多肽以比对应亲本丝状真菌细胞中多肽的全长形式的产生水 平更高的水平以全长形式产生。
[0298] 在其中丝状真菌细胞包含编码非哺乳动物多肽的重组多核苷酸的实施方式中,非 哺乳动物多肽可以是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质 酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、 β -葡糖苷酶、转化酶、漆酶、脂肪酶、聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、肌 醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。在其中丝状 真菌细胞包含编码非哺乳动物多肽的重组多核苷酸的实施方式中,丝状真菌细胞可以具有 降低的或没有至少三种、至少四种、至少五种或至少六种选自pepl、pep2、pep3、pep4、pep5、 pep8、pepll、pepl2、tspl、slpl、slp2、slp3、gapl和gap2的蛋白酶编码基因的可检测的表 达。在某些实施方式中,非哺乳动物多肽以比对应亲本丝状真菌细胞中多肽的产生水平高 至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少 15倍、至少20倍、至少25倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至 少75倍、至少80倍、至少90倍、至少100倍或更高倍的水平产生。在其它实施方式中,非 哺乳动物多肽以比对应亲本丝状真菌细胞中多肽的全长形式的产生水平更高的水平以全 长形式产生。
[0299] 降低的另外的蛋白酶的活性
[0300] 在一些实施方式中,本公开的丝状真菌细胞或木霉属真菌细胞也具有降低的一种 或多种另外的蛋白酶的活性。在某些实施方式中,一种或多种另外的蛋白酶的表达水平降 低。在某些优选的实施方式中,编码一种或多种另外的蛋白酶的基因各包含降低相应蛋白 酶活性的突变。一种或多种另外的蛋白酶编码基因可以是pep7、tppl、gap2、slp3、slp5、 slp6、slp7 或 slp8〇
[0301] 在某些实施方式中,当丝状真菌细胞是曲霉属细胞时,总蛋白酶活性降低到其中 蛋白酶不具有降低的活性的对应亲本曲霉属细胞中总蛋白酶活性的50%或更低。
[0302] 在某些实施方式中,总蛋白酶活性在本公开的细胞(例如木霉属细胞)中降低到 其中蛋白酶不具有降低的活性的对应亲本丝状真菌细胞中总蛋白酶活性的49%或更低、 31%或更低、13%或更低、10%或更低、6. 3%或更低或者5. 5%或更低。
[0303] 另外的重组修饰
[0304] 在某些实施方式中,本公开的丝状真菌细胞或木霉属真菌细胞也具有降低的长醇 基-P-Man:Man(5)GlcNAc(2)-PP-长醇基甘露糖基转移酶的活性。长醇基-P-Man:Man(5) GlcNAc (2)-PP-长醇基甘露糖基转移酶(EC 2. 4. 1. 130)将a -D-甘露糖残基从长醇-磷 酸D-甘露糖转移到膜脂连接的寡糖中。通常,长醇基-P-Man:Man (5) GlcNAc (2)-ΡΡ-长醇 基甘露糖基转移酶通过alg3基因编码。因此,在某些实施方式中,丝状真菌细胞具有降低 的ALG3活性,其是由alg3基因编码的活性。在一些实施方式中,alg3基因包含降低相应 ALG3活性的突变。在某些实施方式中,alg3基因从丝状真菌细胞删除。
[0305] 在其它实施方式中,本公开的丝状真菌细胞或木霉属真菌细胞进一步包含编码 α-l,2-甘露糖苷酶的多核苷酸。编码α-1,2-甘露糖苷酶的多核苷酸可以对于宿主细胞 是内源的,或它可以对于宿主细胞是异源的。这些多核苷酸特别可用于表达从高尔基体转 移到ER的高甘露糖聚糖而无有效的外-α -2-甘露糖苷酶切割的丝状真菌细胞。α -1,2-甘 露糖苷酶可以是属于糖苷水解酶家族47 (cazy.org/GH47_all.html)的I型甘露糖苷酶。 在某些实施方式中,ct -1,2_甘露糖苷酶是列于cazy. org/GH47_characterized. html中的 酶。特别地,α-1,2-甘露糖苷酶可以是切割糖蛋白的ER-型酶如ERa-甘露糖苷酶I EC 3. 2. 1. 113酶亚家族。这类酶的实例包括人a -2-甘露糖苷酶IB (AAC26169)、哺乳动物ER 甘露糖苷酶的组合或丝状真菌酶如a -1,2-甘露糖苷酶(MDS1)(里氏木霉AAF34579 ;Maras Μ等J Biotech. 77, 2000, 255)。对于ER/高尔基体表达,甘露糖苷酶的催化结构域通常与 靶向肽如HDEL、KDEL或者ER或早期高尔基体蛋白质的部分融合,或与动物或植物甘露糖 苷酶I的内源ER革巴向结构一起表达,参见例如,Callewaert等2001Use of HDEL-tagged Trichoderma reesei mannosyl oligosaccharide 1,2_a -D-mannosidase for N-glycan engineering in Pichia pastoris. FEBS Lett 503:173-178。
[0306] 在进一步的实施方式中,本公开的丝状真菌细胞或木霉属真菌细胞还包含N-乙 酰葡糖胺基转移酶I催化结构域和N-乙酰葡糖胺基转移酶II催化结构域。这类催化结构 域可用于在非哺乳动物细胞中表达复合N-聚糖。N-乙酰葡糖胺基转移酶I (GlcNAc-ΤΙ ; GnTI ;EC 2. 4. 1. 101)催化UDP-N-乙酰基-D-葡糖胺+3-( a -D-甘露糖基)-β -D-甘露糖 基-R〈 = >UDP+3- (2- (N-乙酰基-β -D-葡糖胺基)-a -D-甘露糖基)-β -D-甘露糖基-R 的反应,其中R表示聚糖受体中N-连接的寡糖的其余部分。N-乙酰葡糖胺基转移酶I催化 结构域是能够催化这一反应的N-乙酰葡糖胺基转移酶I的任何部分。N-乙酰葡糖胺基转 移酶 II (GlcNAc-ΤΠ ;GnTII ;EC 2. 4. 1. 143)催化 UDP-N-乙酰基-D-葡糖胺 +6-( a -D-甘 露糖基)-β -D-甘露糖基_R〈 = >UDP+6- (2- (Ν-乙酰基-β -D-葡糖胺基)-a -D-甘露糖 基)-β -D-甘露糖基-R的反应,其中R表示聚糖受体中Ν-连接的寡糖的其余部分。Ν-乙 酰葡糖胺基转移酶II催化结构域是能够催化这一反应的Ν-乙酰葡糖胺基转移酶II的任 何部分。合适的Ν-乙酰葡糖胺基转移酶I催化结构域和Ν-乙酰葡糖胺基转移酶II催化 结构域的实例可以在国际专利申请NO.PCT/EP2011/070956中发现。Ν-乙酰葡糖胺基转移 酶I催化结构域和Ν-乙酰葡糖胺基转移酶II催化结构域可以通过单一多核苷酸编码。在 某些实施方式中,单一多核苷酸编码包含Ν-乙酰葡糖胺基转移酶I催化结构域和Ν-乙酰 葡糖胺基转移酶II催化结构域的融合蛋白。或者,Ν-乙酰葡糖胺基转移酶I催化结构域 可以通过第一多核苷酸编码和Ν-乙酰葡糖胺基转移酶II催化结构域可以通过第二多核苷 酸编码。
[0307] 在其中丝状真菌细胞或木霉属真菌细胞包含Ν-乙酰葡糖胺基转移酶I催化结构 域和Ν-乙酰葡糖胺基转移酶II催化结构域的实施方式中,细胞还可以包含编码甘露糖苷 酶II的多核苷酸。甘露糖苷酶Π 能够切割GlcNAcMan5的Man5结构以生成GlcNAcMan3, 且如果与GnTII的催化结构域的作用结合,以生成GO ;且进一步地,与半乳糖基转移酶的 催化结构域的作用结合,以生成G1和G2。在某些实施方式中,II-型甘露糖苷酶属于糖苷 水解酶家族38(cazy. org/GH38_all. html)。这类酶的实例包括人酶AAC50302、黑腹果蝇 (D.melanogaster)酶(Van den Elsen J.M.等(2001)EMB0 J. 20:3008-3017)、具有按照 TOB-记录号1HTY的3D结构的那些或以PBD中的催化结构域指代的其它酶。对于ER/高 尔基体表达,甘露糖苷酶的催化结构域通常与N-末端靶向肽融合,例如使用国际专利申请 No. PCT/EP2011/070956中所列的或SEQ ID NO:589-594的靶向肽。在用II-型甘露糖苷酶 的甘露糖苷酶催化结构域转化后,选择有效产生GlcNAc2Man3、GlcNAclMan3或G0的菌株。
[0308] 在可以与前述实施方式结合的某些实施方式中,丝状真菌细胞进一步包含编码 UDP-GlcNAc转运蛋白的多核苷酸。
[0309] 在可以与前述实施方式结合的某些实施方式中,丝状真菌细胞进一步包含 编码β-1,4-半乳糖基转移酶的多核苷酸。一般地,β-1,4-半乳糖基转移酶属于 CAZy半乳糖基转移酶家族7 (cazy.org/GT7_all.html)。可用的i3 4GalT酶的实例包 括@46&11'1,例如牛(黄牛)酶八八八3〇534.1(511&卩6『111^等?1'〇(3.似1:1.八〇&(1.3(3;[· U.S.A. 83(6),1573-1577(1986))、人酶(Guo S.等Glycobiology 2001,11:813-20)和小鼠 酶 AAA37297 (Shaper, N. L.等 1998J. Biol. Chem. 263 (21),10420-10428)。在其中丝状真菌 细胞包含编码半乳糖基转移酶的多核苷酸的本发明的某些实施方式中,丝状真菌细胞还包 含编码UDP-Gal 4表异构酶和/或UDP-Gal转运蛋白的多核苷酸。在其中丝状真菌细胞 包含编码半乳糖基转移酶的多核苷酸的本发明的某些实施方式中,乳糖可以代替葡萄糖用 作培养宿主细胞时的碳源。培养基可以在pH 4. 5和7.0之间或5.0和6. 5之间。在其中 丝状真菌细胞包含编码半乳糖基转移酶的多核苷酸和任选的编码M)P-Gal 4表异构酶和/ 或UDP-Gal转运蛋白的多核苷酸的本发明的某些实施方式中,二价阳离子如Mn2+、Ca2+或 Mg2+可以添加到细胞培养基中。
[0310] 在可以与前述实施方式结合的某些实施方式中,宿主细胞中α-l,6-甘露糖基转 移酶的活性水平与野生型宿主细胞中的活性水平相比降低。在某些实施方式中,丝状真菌 具有与野生型丝状真菌细胞中的表水平相比降低的ochl基因的表达水平。
[0311] 另一个方面包括在丝状真菌细胞中产生Man3GlcNAc2N_聚糖[即Man a 3 (Man α 6) Man β 4GlcNAc β 4GlcNAc]的方法,包括提供具有编码异源多肽的重组多核苷酸和具有与 野生型丝状真菌细胞中的活性水平相比降低的alg3甘露糖基转移酶活性水平的丝状真 菌细胞,和培养该丝状真菌细胞以产生Man3GlcNAc2聚糖的步骤,其中Man3GlcNAc2聚糖 占丝状真菌细胞分泌的中性N-聚糖的至少10%、至少20%、至少30%、至少40%、至少 50%、至少60%、至少70%、至少80%、至少90%或100% (mol%)。在特定实施方式中, Man3GlcNAc2N-聚糖代表异源多肽的总N-聚糖的至少10%、至少20%、至少30%、至少 40%、至少 50%、至少 60%、至少 70%、至少 80%、至少 90%或 100% (mol% )。
[0312] 另一个方面包括在丝状真菌细胞中产生复合N-聚糖(S卩,包含 末端 GlcNAc2Man3 结构的 N-聚糖),例如 GlcNAc2Man3GlcNAc2 {:即 G0,艮P GlcNAcP 2Mana 3(GlcNAcP 2Mana 6)ManP 4GlcNAcP 4GlcNAc}聚糖的方法,包括提供具 有编码异源多肽的重组多核苷酸、与野生型丝状真菌细胞中的活性水平相比具有降低的 alg3甘露糖基转移酶活性水平且进一步包含编码N-乙酰葡糖胺基转移酶I催化结构域 的多核苷酸和编码N-乙酰葡糖胺基转移酶II催化结构域的多核苷酸的丝状真菌细胞, 和培养该丝状真菌细胞以产生复合N-聚糖,例如GlcNA C2Man3GlcNAC2聚糖的步骤,其中 GlcNAc2Man3GlcNAc2聚糖占丝状真菌细胞分泌的中性N-聚糖的至少5%、至少10%、至少 20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100% (mol % )。在某些实施方式中,复合N-聚糖,例如GlcNAc2Man3GlcNAc2聚糖,代表多肽的 总N-聚糖的至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至 少70 %、至少80 %、至少90 %或100 % (mol%)。在某些实施方式中,所述复合N-聚糖是 GlcNAcMan3 和 / 或 GlcNAc2Man3。
[0313] 另一个方面包括在丝状真菌细胞中产生G1或G2N-聚糖或其混合物, 例如 GalGlcNAc2Man3GlcNAc2 {:艮P G1,艮P Gal β 4GlcNAc β 2Man a 3 (GlcNAc β 2Ma η α 6)Man β 4GlcNAc β 4GlcNAc}或 GlcNAc β 2Man α 3 (Gal β 4GlcNAc β 2Man α 6) 1&1113 461。嫩(^461。嫩。}和/或6&1261。嫩。21&111361。嫩。2{即62,即6&13 461。嫩(^21&111 α 3 (Gal β 4GlcNAc β 2Man a 6)Man β 4GlcNAc β 4GlcNAc}聚糖的方法,包括提供具有编码异 源多肽的重组多核苷酸和与野生型丝状真菌细胞中的活性水平相比具有降低的alg3甘露 糖基转移酶活性水平且进一步包含编码N-乙酰葡糖胺基转移酶I催化结构域的多核苷酸、 编码N-乙酰葡糖胺基转移酶II催化结构域的多核苷酸和编码GalT催化结构域的多核苷 酸的丝状真菌细胞,和培养该丝状真菌细胞以产生G1或G2N-聚糖或其混合物的步骤,其中 G1聚糖占丝状真菌细胞分泌的中性N-聚糖的至少5 %、至少10 %、至少20 %、至少30 %、至 少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100% (mol% ),或其中 G2聚糖占丝状真菌细胞分泌的中性N-聚糖的至少5%、至少10%、至少20%、至少30%、 至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100% (mol%)。在特 定实施方式中,G1聚糖占多肽的总N-聚糖的至少10%、至少20%、至少30%、至少40%、 至少50 %、至少60 %、至少70 %、至少80 %、至少90 %或100 % (mol%)。在特定实施方式 中,G2聚糖占多肽的总N-聚糖的至少10 %、至少20 %、至少30 %、至少40 %、至少50 %、至 少 60%、至少 70%、至少 80%、至少 90%或 100% (mol% )。
[0314] 在某些实施方式中,产生复合N-聚糖的方法生成不同聚糖的混合物。复合N-聚 糖或Man3GlcNAc2可以占这种聚糖混合物的至少5%、至少10%、至少20%、至少30%、至 少40%、至少50%、至少60%、至少70%、至少80%或至少90%或者更高。在某些实施方 式中,多肽的N-聚糖的至少5 %、至少10 %、至少20 %、至少30 %、至少40 %、至少50 %、至 少60 %、至少70 %、至少80 %或至少90 %或者更多由这种聚糖混合物组成。在某些实施方 式中,产生复合N-聚糖及G1和/或G2N-聚糖的方法生成不同聚糖的混合物。复合N-聚 糖、Man3GlcNAc2、Gl和/或G2可以占这种聚糖混合物的至少5%、至少10%、至少20%、至 少30 %、至少40 %、至少50 %、至少60 %、至少70 %、至少80 %或至少90 %或者更高。在某 些实施方式中,多肽的N-聚糖的至少5 %、至少10 %、至少20 %、至少30 %、至少40 %、至少 50 %、至少60 %、至少70 %、至少80 %或至少90 %或者更多由这种聚糖混合物组成。
[0315] 在某些实施方式中,需要的是产生杂合N-聚糖的方法。如本文中使用的,术语"杂 合"意思是具有N-乙酰葡糖胺连接的包含未取代的末端甘露糖残基(如存在于高甘露糖聚 糖中)和取代的甘露糖残基两者的聚糖,例如GlcNAcP 2Mana 3[Mana 3(Mana 6)Mana 6] Man β 4GlcNAc β 4GlcNAc。在这样的实施方式中,Man5 {即 Man a 3 [Man a 3 (Man a 6)Man a 6] ManP4GlcNA(^4GlcNAc}表达丝状真菌细胞如里氏木霉菌株用编码异源多肽的重组多核 苷酸和编码N-乙酰葡糖胺基转移酶I催化结构域的多核苷酸转化且培养该丝状真菌细胞 以产生杂合N-聚糖,其中杂合N-聚糖占丝状真菌细胞分泌的中性N-聚糖的至少5%、至 少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少 90%或100% (mol%)。在特定实施方式中,多肽的N-聚糖的至少10%、至少20%、至少 30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100% (mol% ) 由杂合N-聚糖组成。
[0316] Man3GlcNAc2,复合的、杂合的、G1和G2N-聚糖可以连接于选自氨基酸、肽和多肽 的分子。在某些实施方式中,Man3GlcNAc2,复合的、杂合的、G1和G2N-聚糖连接于异源多 肽。在某些实施方式中,异源多肽是糖基化蛋白质。在特定实施方式中,糖基化多肽是哺乳 动物多肽。在某些实施方式中,哺乳动物多肽是抗体或其抗原结合片段。
[0317] 在某些实施方式中,糖基转移酶,例如GnTI、GnTII或GalT或者糖基水解酶,例如, α -1,2-甘露糖苷酶或甘露糖苷酶II,包括与催化结构域连接的靶向肽。如本文中使用的, 术语"连接"意思是两个氨基酸残基聚合物(在多肽的情况中)或两个核苷酸聚合物(在 多核苷酸的情况中)彼此相邻地直接偶联或处于相同多肽或多核苷酸内但由插入氨基酸 残基或核苷酸分隔。如本文中使用的,"靶向肽"是指能够将重组蛋白质定位于丝状真菌细 胞内的内质网(ER)或高尔基体(Golgi)的重组蛋白中的任何数目的连续氨基酸残基。靶 向肽可以是催化结构域的N-末端或C-末端。在某些实施方式中,靶向肽是催化结构域的 N-末端。在某些实施方式中,靶向肽提供与ER或高尔基体膜的直接结合。靶向肽的成分 可以来自于正常存在于ER或高尔基体中的任何酶。这样的酶包括甘露糖苷酶、甘露糖基转 移酶、糖基转移酶、2型高尔基体蛋白质及MNN2、MNN4、MNN6、MNN9、MNN10、MNS1、KRE2、VAN1 和0CH1酶。合适的靶向肽描述于国际专利申请N〇.PCT/EP2011/070956中。在一个实施方 式中,GnTI或GnTII的靶向肽是人GnTII酶。在其它实施方式中,靶向肽源自木霉属Kre2、 Kre2-样、Ochl、Anpl和Vanl。在一个实施方式中,靶向肽选自SEQ ID N0:589-594的组。
[0318] 本发明丝状真菌细胞的用途
[0319] 本文的本发明进一步涉及使用本公开的任何丝状真菌细胞如木霉属真菌细胞的 方法,该细胞具有降低的或没有至少三种蛋白酶的蛋白酶活性和包含编码以提高的水平 产生的异源多肽如哺乳动物多肽的重组多核苷酸,用于提高异源多肽稳定性和产生异源多 肽。测量蛋白质稳定性和产生异源多肽的方法是公知的,并包括,但不限于本公开中描述的 所有方法和技术。
[0320] 因此,本公开的特定实施方式涉及通过以下方式提高异源多肽稳定性的方法:a) 提供具有降低的或没有至少三种蛋白酶的活性的本公开丝状真菌细胞,其中该细胞进一步 包含编码异源多肽的重组多核苷酸;和b)培养该细胞以使得表达异源多肽,其中与不包含 编码蛋白酶的基因的突变的宿主细胞相比,该异源多肽具有提高的稳定性。本公开的其它 实施方式涉及通过以下方式提高哺乳动物多肽稳定性的方法:a)提供具有降低的或没有 至少三种蛋白酶的活性的本公开木霉属真菌细胞,其中该细胞进一步包含编码哺乳动物多 肽的重组多核苷酸;和b)培养该细胞以使得表达哺乳动物多肽,其中与不包含编码蛋白酶 的基因的突变的宿主细胞相比,哺乳动物多肽具有提高的稳定性。丝状真菌细胞或木霉属 真菌细胞可以是题为"本发明的丝状真菌细胞"的章节中描述的任何细胞。测量多肽稳定 性和培养丝状真菌细胞和/或木霉属真菌细胞的方法是本领域中公知的,且包括,但不限 于本公开中描述的所有方法和技术。
[0321] 在某些实施方式中,异源多肽或哺乳动物多肽的稳定性与对应亲本丝状真菌细胞 或木霉属真菌细胞中表达的异源多肽或哺乳动物多肽相比提高至少2倍、至少3倍、至少4 倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少15倍、至少20倍、 至少25倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少75倍、至少80 倍、至少90倍、至少100倍或更高倍。
[0322] 本公开的其它实施方式涉及通过以下方式制备异源多肽的方法:a)提供具有降 低的或没有至少三种蛋白酶的活性的本公开丝状真菌细胞,其中该细胞进一步包含编码异 源多肽的重组多核苷酸;b)培养该细胞以使得表达异源多肽;和c)纯化所述异源多肽。本 公开的进一步的实施方式涉及通过以下方式制备哺乳动物多肽的方法:a)提供具有降低 的或没有至少三种蛋白酶的活性的本公开木霉属真菌细胞,其中该细胞进一步包含编码哺 乳动物多肽的重组多核苷酸;b)培养该宿主细胞以使得表达哺乳动物多肽;和c)纯化所述 哺乳动物多肽。丝状真菌细胞或木霉属真菌细胞可以是题为"本发明的丝状真菌细胞"的 章节中描述的任何细胞。培养丝状真菌或木霉属真菌细胞和纯化多肽的方法是本领域中公 知的,且包括,但不限于本公开中描述的所有方法和技术。
[0323] 在某些实施方式中,丝状真菌细胞或木霉属真菌细胞在选自pH 3. 5-7、pH 3.5-6. 5、pH 4-6、pH 4.3-5. 7、pH 4.4-5. 6 和 pH 4.5-5. 5 的 pH 范围中培养。在某些实 施方式中,为产生抗体,丝状真菌细胞或木霉属真菌细胞在选自4. 7-6. 5、pH 4. 8-6. 0、pH 4· 9-5. 9和pH 5· 0-5. 8的pH范围中培养。
[0324] 在一些实施方式中,异源多肽是哺乳动物多肽。在其它实施方式中,异源多肽是非 哺乳动物多肽。
[0325] 在某些实施方式中,哺乳动物多肽选自免疫球蛋白、免疫球蛋白重链、免疫球蛋白 轻链、单克隆抗体、杂合抗体、F(ab')2抗体片段、F(ab)抗体片段、Fv分子、单链Fv抗体、 二聚的抗体片段、三聚的抗体片段、功能性抗体片段、单域抗体、多聚单域抗体、免疫粘附分 子、胰岛素样生长因子1、生长激素、胰岛素和促红细胞生成素。在其它实施方式中,哺乳动 物蛋白是免疫球蛋白或胰岛素样生长因子1。在再其它的实施方式中,哺乳动物蛋白是抗 体。在进一步的实施方式中,哺乳动物多肽的产率是至少0. 5、至少1、至少2、至少3、至少 4或至少5克/升。在某些实施方式中,哺乳动物多肽是抗体,任选地IgGl、IgG2、IgG3或 IgG4。在进一步的实施方式中,抗体的产率是至少0. 5、至少1、至少2、至少3、至少4或至 少5克/升。在再其它的实施方式中,哺乳动物多肽是生长因子或细胞因子。在进一步的实 施方式中,生长因子或细胞因子的产率是至少0. 1、至少0. 2、至少0. 3、至少0. 4、至少0. 5、 至少1、至少1. 5、至少2、至少3、至少4或至少5克/升。在进一步的实施方式中,哺乳动 物多肽是抗体,且该抗体包含至少70 %、至少80 %、至少90 %、至少95 %或至少98 %的天然 抗体C-末端和N-末端而没有另外的氨基酸残基。在其它实施方式中,哺乳动物多肽是抗 体,且该抗体包含至少70 %、至少80 %、至少90 %、至少95 %或至少98 %的天然抗体C-末 端和N-末端,其不缺少任何C-末端或N-末端氨基酸残基。
[0326] 在其中哺乳动物多肽从细胞培养物纯化的某些实施方式中,含有哺乳动物多肽的 培养物包含占到所产生多肽的质量的少于50 %、少于40 %、少于30 %、少于20 %或少于 10%的质量百分比的多肽片段。在某些优选的实施方式中,哺乳动物多肽是抗体,且多肽片 段是重链片段和/或轻链片段。在其中哺乳动物多肽是抗体且多肽从细胞培养物纯化的其 它实施方式中,含有抗体的培养物包含占到所产生抗体的质量的少于50%、少于40%、少 于30%、少于20%或少于10%的质量百分比的游离重链和/或游离轻链。测定多肽片段的 质量百分比的方法是本领域中公知的且包括测量SDS-凝胶的信号强度。
[0327] 在进一步的实施方式中,非哺乳动物多肽选自氨肽酶、淀粉酶、糖酶、羧肽酶、过氧 化氢酶、纤维素酶、壳多糖酶、角质酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖 苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、聚糖酶、氧化酶、果 胶分解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷 氨酰胺酶或木聚糖酶。
[0328] 在任何公开的方法的特定实施方式中,该方法包括提供一种或多种、两种或更多 种、三种或更多种、四种或更多种或者五种或更多种蛋白酶抑制剂的另外的步骤。在某些实 施方式中,蛋白酶抑制剂是与哺乳动物多肽共表达的肽。在其它实施方式中,抑制剂抑制选 自天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、枯草溶菌素蛋白酶和谷氨酸蛋白酶的蛋白 酶家族的至少两种、至少三种或至少四种蛋白酶。
[0329] 在任何公开的方法的特定实施方式中,丝状真菌细胞或木霉属真菌细胞还包含载 体蛋白。如本文中使用的,"载体蛋白"是丝状真菌细胞或木霉属真菌细胞内源的或由丝状 真菌细胞或木霉属真菌细胞高度分泌的蛋白质的部分。合适的载体蛋白包括,但不限于里 氏木霉甘露聚糖酶I (Man5A或ΜΑΝΙ)、里氏木霉纤维二糖水解酶II (Cel6A或CBHII)(参见, 例如,Paloheimo 等 Appl. Environ. Microbiol. 2003December ;69 (12) :7073-7082)或里氏 木霉纤维二糖水解酶I (CBHI)的那些。在一些实施方式中,载体蛋白是CBH1。在其它实施 方式中,载体蛋白是截短的里氏木霉CHB1蛋白,其包括CHB1核心区和CHB1连接体区域的 部分。在一些实施方式中,载体如纤维二糖水解酶或其片段与抗体轻链和/或抗体重链融 合。在一些实施方式中,载体如纤维二糖水解酶或其片段与胰岛素样生长因子1、生长激素、 胰岛素、干扰素 a 2b、成纤维细胞生长因子21或人血清白蛋白融合。在一些实施方式中, 载体-抗体融合多肽包含Kex2切割位点。在某些实施方式中,Kex2或其它载体切割酶是 丝状真菌细胞内源的。在某些实施方式中,载体切割蛋白酶是对于丝状真菌细胞异源的,例 如,源自酵母的另一种Kex2蛋白或TEV蛋白酶。在某些实施方式中,载体切割酶过表达。
[0330] 应理解的是,尽管本发明已结合其某些具体的实施方式进行了描述,前述说明意 图阐明而非限制本发明的范围。本发明范围内的其它方面、优势和改进对于本发明所属领 域的技术人员是明显的。
[0331] 尽管已经描述了本发明,以下实施例提供用于通过说明的方式而不是限制的方式 阐明本发明。 实施例
[0332] 实施例1 一里氏木霉中天冬氨酸蛋白酶的鉴定
[0333] 这一实施例证明了来自里氏木霉(T. reesei)培养上清液的天冬氨酸蛋白酶降解 抗体重链和轻链的能力。
[0334] 天冬氨酸蛋白酶的钝化
[0335] 据发现里氏木霉上清液中的蛋白酶活性可以用天冬氨酸蛋白酶抑制剂胃蛋白酶 抑制剂A抑制。因此,胃蛋白酶抑制剂A(Sigma#P2032)经由二氨基二丙基胺连接体与琼脂 糖珠连接,并用作用于纯化的亲和树脂。里氏木霉分批补料发酵上清液(15ml)用于将蛋白 酶分批结合35ml含50mM柠檬酸钠、0. 2M NaCl的缓冲液,pH 3. 0中的树脂。柱用相同的 结合缓冲液洗涤且结合的蛋白质用洗脱缓冲液(50mM Tris-HCL,1M NaCl,pH 8. 5)去除。 收集0.5ml的级分。纯化总共42 μ g的蛋白酶。峰级分包含0.04 μ g/μ 1蛋白质。30 μ 1 的各级分与6 μ 1含β -巯基乙醇的Laemmli样品缓冲液混合。样品在95°C下加热5分 钟,然后与宽范围的预染色分子量标志物(BioRad) -起加载到4-15% PAGE凝胶(BioRad mini-protean TGX预制凝胶)中。凝胶在SDS PAGE电泳缓冲液中100V下运行30分钟,且 然后用 GelCode (Thermo Scientific)蓝染染色。
[0336] 42kD双峰带在胃蛋白酶抑制剂A亲和柱中纯化(图1),并从SDS PAGE凝胶切除和 用测序级修饰胰蛋白酶(Pr〇mega#V5111)进行凝胶中胰蛋白酶消化。所得的肽然后从凝胶 提取并通过 C18ZipTip (Millipore#ZTC18M096)纯化。纯化的肽在 QSTAR Pulsar, ESI-混 合四极_T0F(AB Sciex)上通过LC-MS/MS分析。
[0337] 这一分析导致鉴别具有非常类似的分子量的4种天冬氨酸蛋白酶。鉴别的蛋白酶 包括:p印 1 (Tre74156 ;42· 7kD, 42 %序列覆盖率)、p印2 (Tre53961 ;42· 4kD, 15 %序列覆盖 率)、p印3(Trel21133 ;49kD,6%序列覆盖率)和 p印5(Tre81004 ;45kD,9%序列覆盖率)。 这些天冬氨酸蛋白酶在PAGE凝胶中以相似的分子量运行。它们的氨基酸序列相似性在 51% -64%之间。
[0338] 来自峰级分(F3)的蛋白质(0. 8 μ g)然后在37°C下与柠檬酸钠缓冲液(50mM, pH 5. 5)中的IgGbOyg/ml)孵育20小时(图2)。蛋白质在10uM胃蛋白酶抑制剂A存在或 不存在的情况下孵育。抗体混合物与Laemmli样品缓冲液组合并在95°C下加热5分钟。这 些样品然后与宽范围预染色分子量标志物(Bi0Rad)-起加载到4-15%PAGE凝胶(Bi0Rad mini-protean TGX预制凝胶)中。凝胶在100V下于SDS PAGE电泳缓冲液中运行30分钟。 在凝胶上运行之前,IgG不还原。全尺寸IgG恰在200kDa标志物之上。如可在图2的非还 原凝胶中看到的,天冬氨酸蛋白酶能够产生IgG的轻度降解。此外,IgG降解被胃蛋白酶抑 制剂A抑制。天冬氨酸蛋白酶活性在pH 5.5下比在酸性pH下受到更大限制,它们在酸性 pH下具有最大活性。
[0339] Deol刪除的分析
[0340] 天冬氨酸蛋白酶pepl蛋白酶然后进行测试以确定其在里氏木霉中的丰度。这通 过从源自P印1删除菌株M182的上清液样品纯化天冬氨酸蛋白酶来进行。M182p印1删除菌 株也产生利妥昔单抗抗体。
[0341] 在基础菌株M124中形成的M181p印1删除菌株在大的摇瓶培养中与M124对照瓶 一起生长。培养物在具有4g/L乳糖、2g/L废谷物提取物(spent grain extract)和100mM PIPPS的300ml的TrMM,pH 5. 5中生长。三种不同的模型抗体在p印1删除菌株和其亲本菌 株M124的摇瓶培养上清液(在柠檬酸钠缓冲液pH 5. 5中稀释2mg/ml)中孵育(0. 05 μ g/ μ 1终浓度),且作为对比在亲本菌株的发酵培养上清液中孵育。来自第5天培养物的含抗 体的上清液样品(30 μ 1)加载到4-15% SDS PAGE凝胶中并转移到硝基纤维素上以用于用 在了851'中1:30,000稀释的抗-重链4?偶联抗体(5丨8111&#43188)或抗-轻链4?偶联物 (Sigma#A3813)进行免疫印迹分析。当与抗体孵育18小时过夜时,Λρ印1上清液较少的重 链蛋白质,如与Μ124对照菌株或发酵上清液(pH 5. 5 ;28°C;20g/L废谷物提取物,60g/L乳 糖)对比的(图39)。与轻链相比,重链更易降解。最大的稳定性效应对于利妥昔单抗和 MAB01重链是明显的。在重链中,两种不同的降解产物可以在?48kD和?38kD处看到(图 39)。与对照相比,在Λρ印1上清液中轻链蛋白的稳定性中仅具有轻微改善(图39)。
[0342] ρ印1删除质粒的产生
[0343] 设计了用于ρ印l(TreID74156)的第一删除构建体以使得能够在成功整合后从 里氏木霉基因组去除选择标记并从而再循环选择标记用于后续的蛋白酶基因删除。在 这种方法中,标记的再循环(即从删除构建体去除pyr4基因)类似于针对酵母开发的 所谓 blaster 盒(Hartl,L.和 Seiboth,B·,2005, Curr Genet48:204-211 及 Alani,E. 等,1987, Genetics 116:541-545)。类似的blaster盒也已针对丝状真菌包括红褐肉座 菌(Hypocrea jecorina)(无性型:里氏木霉)开发(Hartl, L.和 Seiboth, B.,2005, Curr Genet 48:204-211)。
[0344] TrelD编号是指来自Joint Genome Institute里氏木霉ν2· 0基因组数据库的 特定蛋白酶基因的识别编号。用于构建删除质粒的引物"经眼(by eye)"或使用Primerf 软件设计(Primer3 网站,Rozen 和 Skaletsky(2000)Bioinformatics Methods and Protocols:Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386)。
[0345] 使用pyr4作为标记基因的blaster盒的原理如下:pyr4,编码里氏木霉的乳清 苷-5'-单憐酸(01\^ :>)脱羧酶(3111;[1:11,]\1^等,1991,(]111'代11〖661161:;^819:27-33),是尿 苷合成所需要的。缺乏0ΜΡ脱羧酶活性的菌株不能在没有尿苷补充的最低培养基上生长 (即,是尿苷营养缺陷型)。5-氟乳清酸(5-F0A)用于产生缺乏0ΜΡ脱羧酶活性的突变菌株 (pyr4_菌株)是基于5-F0A通过OMP脱羧酶转化为毒性中间体5-氟-UMP。因此,具有突 变的pyr4基因的细胞是5-F0A抗性的,但此外也是尿苷营养缺陷的。5-F0A抗性原则上也 可能由另一基因(pyr2,乳清酸磷酸核糖转移酶)中的突变产生,且因此利用这一选择获得 的自发突变体需要通过补充具有pyr4基因的突变体对pyrf基因型进行验证。一旦突变, pyr4基因可以用作里氏木霉中的营养缺陷型选择标记。在我们的blaster盒中,pyr4接着 pyr4 5'未翻译区(5'UTR)的308bp同向重复序列并由待删除基因的5'和3'侧翼区域包 围。删除盒的整合通过功能pyr4选择。pyr4标记的去除随后在5-F0A的存在下通过两个 同源区域(5'UTR的同向重复序列)之间的重组强制进行,导致选择标记的环出(looping out)并使得能够在后续轮的基因删除中利用相同的blaster盒(pyr4环出)。在环出后, 仅5' UTR的308bp序列保留在基因座中。
[0346] 因此,pyr4选择标记和5'同向重复片段(pyr4 5' UTR的308bp)使用质粒 pAR0502(包含里氏木霉pyr4的基因组拷贝)作为模板通过PCR产生。PCR扩增用Phusion 聚合酶和HF缓冲液或GC缓冲液进行,或用Dynazyme EXT聚合酶进行。反应条件基于所扩 增的片段变化。两个片段包含需要在酵母中利用同源重组克隆具有环出盒的质粒的40bp 重叠序列(参见下文)。为使得能够实现可能的另外的克隆步骤,AscI消化位点置于pyr4 标记和5'同向重复序列之间且Notl位点包围完整blaster盒。
[0347] 1066bp的5'侧翼区域和1037bp的3'侧翼区域选择作为p印1删除质粒的基础。 片段通过PCR产生。产物用琼脂糖凝胶电泳分离且正确的片段使用标准实验室方法利用凝 胶提取试剂盒(Qiagen)从凝胶分离。用于侧翼区域扩增的模板DNA来自里氏木霉野生型 菌株 QM6a(ATCC13631)。
[0348] 对于克隆中使用的酵母同源重组系统,对适宜的PCR-引物设置用于载体和选择 标记的重叠序列。为使标记能够在构建体中切换,Notl限制性位点在侧翼区域和选择标记 之间引入。Pmel限制性位点设置在载体和侧翼区域之间用于在转化到里氏木霉中之前去除 载体序列。载体骨架PRS426用限制性酶(EcoRI和Xhol)消化。限制性片段然后用琼脂糖 凝胶电泳分离,且正确的片段使用标准实验室方法利用凝胶提取试剂盒(Qiagen)从凝胶 分离。
[0349] 为构建删除质粒,载体骨架及适宜的标记和侧翼区域片段转化到酿酒酵母(菌 株H3488/FY834)中。酵母转化方案是基于描述于Colot和Collopy的链孢霉敲除工 作组材料(Dartmouth链孢霉基因组方案网站)和Gietz实验室方案(University of Manitoba, Gietz实验室网站)中的同源酵母重组的方法。来自酵母转化体的质粒DNA通过 转化到大肠杆菌中拯救。几个克隆被培养,质粒DNA被分离和消化以使用标准实验室方法 筛选正确的重组。具有正确插入大小的几个克隆进行测序并储存。
[0350] 用于pepl的第一删除质粒(质粒pTTv41,表1. 1)使用另一选择标记bar,携带链 霉菌的草铵勝 N-乙醜转移酶(GenBank ID:AF013602. 1,Sweigard 等,1997, Fungal Genet Newsl 44:52-53)的合成构建体。侧翼区域和标记片段通过PCR产生并使用如上所述的酵 母重组方法组装到质粒中。为克隆第二pepl删除质粒(pTTv71,表1. 1),bar标记利用Notl 消化从删除质粒pTTv41除去并使用酵母同源重组系统以上述pyr4blaster盒替代。这些 用于P印1的删除质粒(PTIV41和pTTv71)导致p印1基因座中的1874bp删除并覆盖PEP1 的完整编码序列。
[0351] 表1. 1:用于产生p印1删除质粒的引物
[0352] 用于p印1的删除质粒pTTv41 (TreID74156),载体骨架pRS426
[0353]

【权利要求】
1. 一种丝状真菌细胞,包含至少三种具有降低的活性的内源蛋白酶和编码异源多肽的 重组多核苷酸,其中所述多肽以比其中所述蛋白酶不具有降低的活性的对应亲本丝状真菌 细胞中该多肽的产生水平高至少两倍的水平产生。
2. 权利要求1所述的丝状真菌细胞,条件是当所述细胞是曲霉属细胞时,所述总蛋白 酶活性降低到其中所述蛋白酶不具有降低的活性的对应亲本曲霉属细胞的总蛋白酶活性 的50 %或更低。
3. 权利要求1或2所述的丝状真菌细胞,其中所述总蛋白酶活性降低到其中所述蛋白 酶不具有降低的活性的对应亲本丝状真菌细胞的总蛋白酶活性的49%或更低,优选31% 或更低。
4. 权利要求1-3任一项所述的丝状真菌细胞,其中至少三个编码内源蛋白酶的基因各 自包含降低或消除相应蛋白酶活性的突变。
5. 权利要求1-4任一项所述的丝状真菌细胞,其中至少四个编码内源蛋白酶的基因各 自包含降低或消除相应蛋白酶活性的突变。
6. 前述权利要求任一项所述的丝状真菌细胞,其中所述真菌细胞是木霉属真菌细胞、 毁丝霉属真菌细胞、曲霉属真菌细胞、链孢霉属真菌细胞、青霉属细胞或金孢子菌属真菌细 胞。
7. 前述权利要求任一项所述的丝状真菌细胞,其中所述真菌细胞是里氏木霉 (Trichoderma reesei)〇
8. 权利要求6或7所述的丝状真菌细胞,其中所述细胞对于pep4蛋白酶是野生型的。
9. 权利要求6、7或8所述的丝状真菌细胞,其中所述细胞的至少以下三种蛋白酶具有 降低的活性或没有活性:pepl、tspl和slpl或者gapl、slpl和pepl。
10. 权利要求6或7所述的丝状真菌细胞,其中所述细胞的选自以下的至少三种或四种 蛋白酶具有降低的或没有可检测的蛋白酶活性:pep 1、pep2、pep3、pep4、pep5、pep8、pep 11、 pepl2、tspl、slpl、slp2、slp3、slp7、gapl 和 gap2〇
11. 权利要求10所述的丝状真菌细胞,其中编码所述具有降低的或没有可检测的蛋白 酶活性的三种或四种蛋白酶的基因各自包含降低或消除相应蛋白酶活性的突变。
12. 权利要求6或7所述的丝状真菌细胞,其中所述细胞的至少八种蛋白酶具有降低的 活性或没有蛋白酶活性,编码所述八种蛋白酶的基因各自包含降低或消除相应蛋白酶活性 的突变,且所述八种蛋白酶是 pepl、tspl、slpl、gapl、gap2、pep4、pep3 和 pep5。
13. 权利要求6或7所述的丝状真菌细胞,其中所述细胞包含三到六种具有降低的或 没有可检测的活性的蛋白酶,且所述三到六种蛋白酶各选自pepl、pep2、pep3、pep4、pep5、 tspl、slpl、slp2、slp3、gapl 和 gap2〇
14. 权利要求6-13中任一项所述的丝状真菌细胞,其中所述细胞包含编码另外的蛋 白酶的基因,其包含降低相应蛋白酶活性的突变,且所述另外的蛋白酶选自pep7、pep8、 pepll、pepl2、tppl、gap2、slp3、slp5、slp6、slp7 和 slp8〇
15. 前述权利要求任一项所述的丝状真菌细胞,其中所述异源多肽是哺乳动物多肽。
16. 权利要求15所述的丝状真菌细胞,其中所述哺乳动物多肽是糖基化的。
17. 权利要求15所述的丝状真菌细胞,其中所述哺乳动物多肽选自抗体及其抗原结合 片段、生长因子、干扰素、细胞因子和白介素。
18. 权利要求15所述的丝状真菌细胞,其中所述哺乳动物多肽选自胰岛素样生长因子 1 (IGF1)、人生长激素(hGH)和干扰素 a 2b (IFN a 2b)。
19. 前述权利要求任一项所述的丝状真菌细胞,其中所述真菌细胞进一步包含具有降 低的活性的ALG3。
20. 权利要求19所述的丝状真菌细胞,其中所述编码ALG3的基因包含降低或消除相应 活性的突变。
21. 权利要求1-20中任一项所述的丝状真菌细胞,其中所述真菌细胞进一步包含编码 α -1,2-甘露糖苷酶的多核苷酸。
22. 前述权利要求任一项所述的丝状真菌细胞,进一步包含 Ν-乙酰葡糖胺基转移酶I催化结构域,和任选地 Ν-乙酰葡糖胺基转移酶II催化结构域。
23. 权利要求22所述的丝状真菌细胞,进一步包含编码Ν-乙酰葡糖胺基转移酶I催化 结构域的第一多核苷酸和,任选地,编码Ν-乙酰葡糖胺基转移酶II催化结构域的第二多核 苷酸。
24. 前述权利要求任一项所述的丝状真菌细胞,进一步包含编码甘露糖苷酶II和/或 半乳糖基转移酶的多核苷酸。
25. 提高多肽的稳定性的方法,包括 a) 提供前述权利要求任一项的丝状真菌细胞,和 b) 培养所述细胞以使得表达所述异源多肽, 其中所述异源多肽与其中所述蛋白酶不具有降低的活性的对应亲本丝状真菌细胞中 产生的异源多肽相比表现出提高的稳定性。
26. 制备异源多肽的方法,包括 a) 提供权利要求1-24的丝状真菌细胞, b) 培养所述细胞以使得表达所述异源多肽,和 c) 纯化所述异源多肽。
27. 权利要求25或权利要求26所述的方法,其中所述丝状真菌细胞进一步包含载体蛋 白。
28. 权利要求27所述的方法,其中所述载体蛋白是CHB1。
29. 权利要求26-28中任一项所述的方法,其中所述培养是在包含蛋白酶抑制剂的培 养基中。
30. 权利要求26-29中任一项所述的方法,其中所述培养是在包含选自SBT1和胰凝乳 蛋白酶抑制剂的一种或两种蛋白酶抑制剂的培养基中。
【文档编号】C12N9/58GK104245919SQ201380012940
【公开日】2014年12月24日 申请日期:2013年1月4日 优先权日:2012年1月5日
【发明者】C·兰道斯基, A·雨斯科南, J·萨里南, A·韦斯特霍尔姆-帕维南, A·卡内尔瓦, J·纳蒂南, A-L·阿尼南, N·萨洛维奥里, M·彭蒂拉, M·萨洛埃莫 申请人:诺华股份有限公司, 格利科斯芬兰公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1