多肽表达方法

文档序号:8303080阅读:1061来源:国知局
多肽表达方法
【专利说明】多肽表达方法 发明领域
[0001] 本发明涉及在宿主细胞中生产目标多肽的方法,本发明还涉及被修饰的多肽。另 夕卜,本发明涉及改进多肽的表达水平的方法,并涉及被修饰的目标多肽用来增加所述多肽 在宿主细胞中的表达水平的用途。
[0002] 发明背景
[0003] 在细菌宿主细胞、酵母宿主细胞和真菌宿主细胞中生产重组多肽是本领域已知 的。当前多肽的生产以多种方式进行。
[0004] 现有技术的生产重组多肽的方法是通过发酵包含表达构建体的宿主细胞,所 述表达构建体尤其包含可操作地连接至编码目标多肽的多核苷酸的启动子。得到的 多肽可以在细胞内积聚或者可以通过宿主细胞的分泌途径被进一步分泌。在后一种 情况下,目标多肽通常包含信号序列。在Broekhuijsen等人(Journal of Biotechno logy, 31 (1993) 135-145, Broekhuijsen 等人;Secretion of heterologous proteins by Aspergillusniger!Production of active human interleukin-6 in a protease deficient mutant by KEX2~like processing of a glucoamylase-hIL6 fusion protein) 中,重组蛋白质在使用了被分泌的多肽葡萄糖淀粉酶的信号序列的Aspergillus niger中 表达。
[0005] 重组的目标多肽的生产产率可以通过增加生产和分泌效率,例如通过使用被修饰 的Kozak序列(W02008000632),密码子对优化(W02008000632),引入改进的分泌信号序列 (W02010/121933)来增强。这些方法不改变成熟多肽的氨基酸组成。
[0006] 近来,蛋白质特征优化(protein feature optimization,PF0)作为一种新的方法 被引入,通过修饰多肽的氨基酸骨架中一组相关蛋白质特征的数值,使其落入对真核宿主 中一种或更多种蛋白质特征而言的最适范围内或者变得更接近对真核宿主中一种或更多 种蛋白质特征而言的最适值来改进通过真核宿主细胞的目标多肽的分泌。所述蛋白质特征 是能够通过计算源自蛋白质氨基酸序列和DNA序列的特性(W02010/102982)。
[0007] 在工业背景下,需要所生产的多肽的高产率。因此,为了进一步增强目标多肽生产 的产率,需要改进分泌效率。本发明的一个目的是提供生产重组多肽的改进的方法。 发明概要
[0008] 可以采用影响蛋白质生产的因素的知识来改进工业设置下的酶生产速率。在某些 情况下同源基因表达可以获得高的生产产率,但是异源基因表达的产率往往受限制。我们 已应用了基于序列的机器学习技术来识别相关的蛋白质序列特征。蛋白质序列的氨基酸组 成被发现是最预测性的,并且解释揭示了:对于同源基因表达和异源基因表达二者而言,相 同的特征是重要的。特别地,甲硫氨酸(M)和赖氨酸(K)被发现对高水平的生产具有负贡 献。
[0009] 相应地,本发明涉及通过减少成熟多肽氨基酸骨架中的甲硫氨酸或赖氨酸或甲硫 氨酸和赖氨酸的数目来改进通过宿主细胞例如真核宿主细胞的目标多肽的分泌的方法。
[0010] -个优点是赖氨酸(K)、甲硫氨酸(M)或赖氨酸(L)和甲硫氨酸(M)的含量的减少 有助于改进的蛋白质生产,并促使更低成本的方法的开发。
[0011] 因此根据本发明,提供了在宿主细胞中生产目标多肽的方法,所述方法包括:
[0012] a.提供载有编码目标多肽的核酸的宿主细胞,其中目标多肽被修饰使得其相比参 考多肽包含较少的甲硫氨酸残基和/或赖氨酸残基,位于多肽序列的N-末端的任何起始甲 硫氨酸氨基酸除外;
[0013] b.在适合生产多肽的条件下培养宿主细胞;以及任选地,
[0014] c.回收目标化合物。
[0015] 通常,可以就编码序列包括或不包括一个或更多个或所有的控制序列(例如信号 序列)对所述多肽进行修饰。通常,修饰不包括N-末端氨基酸。
[0016] 本发明还涉及:
[0017]-被修饰的多肽,其相比参考多肽包含较少的甲硫氨酸残基和/或赖氨酸残基,位 于多肽序列的N-末端的任何起始甲硫氨酸氨基酸除外;
[0018] -改进宿主细胞中多肽表达水平的方法,所述方法包括与参考多肽相比减少多肽 的甲硫氨酸和/或赖氨酸氨基酸的数目,多肽序列的N-末端的任何起始甲硫氨酸氨基酸除 外;
[0019] -被修饰的目标多肽用于增加目标多肽在宿主细胞中的表达水平的用途,所述目 标多肽被修饰使得其相比参考多肽包含较少的甲硫氨酸残基和/或赖氨酸残基,位于多肽 序列的N-末端的任何起始甲硫氨酸氨基酸除外;以及
[0020] 具有 SEQ ID NO :16、17、18、19、20、8、9、10、11、12、26、27、43、44、45、28 或 29 示出 的氨基酸序列的多肽。
[0021] 附图概沭
[0022] 图1显示了分类器(classifier)的权重。对每个(负相关)氨基酸(X轴),条块 指示了蛋白质中该氨基酸的出现频率对过表达后获得高产率的重要性/权重。
[0023] 图2显示了 hom分类器和het分类器的比较。从hom分类器和het分类器获得的 氨基酸贡献分别是X值和y值。贡献在每个分类器(轴)上归一化:每个贡献除以最大绝 对贡献。该图显示了由使用蛋白质氨基酸组成训练的分类器获得的贡献。
[0024] 图3描述了表达载体PGBFINEBA205 (构建描述于实施例1)的质粒图谱。指示了 相对于amdS选择标记物盒的glaA侧翼区。此外,指示了 glaA启动子的序列和编码根据本 发明方法的变体酶的EBA205序列。可以在转化A. niger菌株之前通过用限制酶NotI消化 来去除 E. coli DNA。
[0025] 图4描述了表达载体pGBFINFUA(构建描述于实施例1)的质粒图谱。指示了相对 于amdS选择标记物盒的glaA侧翼区。此外,指示了 glaA启动子的序列和编码根据本发明 方法的变体酶的EBA205序列。可以在转化A. niger菌株之前通过用限制酶NotI消化来去 除 E.coli DNA。
[0026] 图5示出了被测作上清液的FUA活性的摇瓶发酵中的EBA205蛋白质M-变体表达; 归一化至M-含量100%以及100%的蛋白质浓度(mg/ml)WT ;数据点为1-3个独立选择的 菌株的平均并显示了 IX标准差。
[0027] 图6示出了被测作上清液的FUA活性的摇瓶发酵中的EBA205蛋白质K-变体表达; 归一化至K-含量100%以及100%的蛋白质浓度(mg/ml)WT ;数据点为1-3个独立选择的 菌株的平均并显示了 IX标准差。
[0028] 图7示出了被测作上清液的真菌α-淀粉酶活性的摇瓶发酵中的FUA蛋白质M-变 体表达;归一化至M-含量100%以及100%的活性WT ;数据点为1-3个独立选择的菌株的 平均并显示了 IX标准差。
[0029] 图8示出了被测作上清液的真菌α -淀粉酶活性的摇瓶发酵中的FUA蛋白质K-变 体表达;归一化至K-含量100%以及100%的活性WT ;数据点为1-3个独立选择的菌株的 平均并显示了 IX标准差。
[0030] 序列表描沭
[0031] SEQ ID NO :1 :肽:SS_EBA205 信号序列 ΕΒΑ205 ;18 个氨基酸。
[0032] SEQ ID NO :2 :肽:SS_FUA 信号序列 FUA ;20 个氨基酸。
[0033] SEQ ID NO :3 :肽:SS_PmeA 信号序列;17 个氨基酸。
[0034] SEQ ID NO :4 :DNA :SS_PmeA信号序列;51个碱基对:密码子对优化。
[0035] SEQ ID NO :5 :蛋白质:EBA205野生型序列,包含信号序列(SEQ ID NO :1)。
[0036] SEQ ID NO :6 :蛋白质:FUA野生型序列,包含信号序列(SEQ ID NO :2)。
[0037] SEQ ID NO :7 :蛋白质:FUA野生型序列,其中信号序列(SEQ ID NO :2)被置换为 (SEQ ID NO :3)〇
[0038] SEQ ID NO :8-27 :蛋白质:基于 SEQ ID NO :5 的 EBA205 变体序列。
[0039] SEQ ID NO :28-52 :蛋白质:基于 SEQ ID NO :7 的 FUA 变体序列。
[0040] SEQ ID NO :53 :DNA :密码子对优化的(CPO) :SEQ ID NO :5 的 EBA205 序列。
[0041] SEQ ID NO :54 :DNA :密码子对优化的(CPO) :SEQ ID NO :7 的 FUA 序列。
[0042] SEQ ID NO :55-74 :DNA,基于模板 SEQ ID NO :53 的 SEQ ID NO :8-27 的 EBA205 序 列变体。
[0043] SEQ ID NO :75-99 :DNA,基于模板 SEQ ID NO : 54 的 SEQ ID NO :28-52 的 FUA 序列 变体。

【发明内容】

[0044]
[0045] 在本说明书和所附权利要求的全文中,词语"包含"、"包括"和"具有"及它们的变 型应作包括性解释。也就是说,这些词语意在表达上下文允许时,可纳入没有具体列举的其 他要素或整体。
[0046] 本文中不使用数量词修饰时是指一个(种)或多于一个(种)(即一个(种)或 至少一个(种))的对象。举例来说,"要素"可以表示一个要素或多于一个要素。
[0047] 在本发明中,应用了多肽的重新设计方法来改变序列特性同时不影响酶的功能。 其原理是,相比过表达之后不提供高产率的蛋白质,对过表达之后提供高产率的蛋白质所 观察到的氨基酸组成特点;由此指示了该特点的改变可以被用来改进分泌产率。然而,酶的 活性应保持与其原活性类似来使得所述方法在酶工业中是有用的。氨基酸组成的特点差异 可以通过比较成功的实例与不太成功的实例的单个的氨基酸组成来获得。
[0048] 使用合理化的和随机化的两种方法,蛋白质改造已被用来例如增加热稳定 性,改变副产物谱,使酶在有机溶剂等中工作,避免包涵体或形成包涵体等。近来,一 种方法集中于蛋白质特征优化来增加蛋白质的表达(W02010/102982)。近来,其他人 (Goltermann等人(2010)通过氨基酸和密码子消除研究蛋白质进化,并表明可以制备没 有苯丙氨酸的GFP。其他人关注了维持生命的氨基酸字母表的减少。自然进化用20种 氨基酸字母表产生了复杂蛋白质折叠。但是原始蛋白质的合成被认为只涉及少数的氨 基酸。一些研究表明,大大减少的氨基酸字母表可足够来编码天然样的蛋白质(Tanaka 等人 2011,v6 (3),el8034;Walter 等人,2005,The Journal ofBiological Chemistry vol. 280, no. 45, ρρ· 37742 - 37746)。例如 Walter 等人,2005 (The Journal of Biological Chemistry vol. 280, NO. 45, pp. 37742 - 37746)由9氨基酸字母表构建了活性酶,基本上针 对新的结构和功能。简化的9氨基酸字母表(Asp、Glu、Asn、Lys/Phe、Ile、Leu、Met和Arg) 含有甲硫氨酸和赖氨酸。Tanaka等人(Protein Science 2010 Vol. 19:786-795)评估了由 5、12和20种氨基酸组成的随机序列蛋白质的比较特点。12氨基酸表含有赖氨酸和甲硫氨 酸;5氨基酸字母表(Ala、Gly、Val、Asp和Glu)没有产出呈现广泛良好折叠结构的蛋白质。
[0049] 然而,我们已经观察到,成熟多肽的甲硫氨酸(M)和赖氨酸(K)组成部分与表达性 负相关。相应地,本发明涉及多肽和多肽表达方法,其中多肽中甲硫氨酸和/或赖氨酸氨基 酸的数目被修饰,特别地相比参考/起始多肽是被减少的。
[0050] 也就是说,本发明采用修饰特别是减少氨基酸甲硫氨酸或赖氨酸或甲硫氨酸和赖 氨酸(一起)的方法来增加蛋白质的表达,并且在催化酶的情况下不会失去其催化活性。这 可导致改进的蛋白质生产水平以及随之而来的较低成本的方法。本发明的方法可以被称为 蛋白质序列优化(Protein Sequence Optimisation,PS0)。
[0051] 目标多肽中甲硫氨酸和/或赖氨酸氨基酸的数目减少可以在包括其所有的控制 序列(例如信号序列)的多肽的基础上进行,或在不包括一个或更多个或所有的其控制序 列(例如信号序列)的多肽的基础上进行。通常N-末端氨基酸除外。
[0052] 因此根据本发明,提供了在宿主细胞中生产目标多肽的方法,所述方法包括:
[0053] a.提供载有编码目标多肽的核酸
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1