用于生产感兴趣的重组多肽的方法

文档序号:392069阅读:296来源:国知局
专利名称:用于生产感兴趣的重组多肽的方法
技术领域
本发明涉及用于生产感兴趣的重组多肽的方法,通过所述方法获得的多肽,重组多核苷酸、表达载体、表达构建体,以及特定信号肽用于生产感兴趣的重组多肽的用途和编码所述特定信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。
背景技术
丝状真菌宿主细胞中重组多肽的生产是本领域已知的。目前多肽的生产以多种方式进行。用于生产重组多肽的现有技术方法是通过发酵包含表达构建体的宿主细胞进行的,所述表达构建体包含与编码感兴趣的多肽的多核苷酸可操作地连接的启动子等等。为了将感兴趣的多肽导向宿主细胞的分泌途径,感兴趣的多肽包含信号序列。在 Broekhuijsen et al(Journal of Biotechnology,31(1993)135-145, Broekhuijsen et al ;Secretion of heterologous proteins by Aspergillus niger Production of active human interleukin-6 in a protease deficient mutant by KEX2_like processing of a glucoamylase-hIL6 fusion protein)中,使用分泌型多肽葡糖淀粉酶的信号序列在Aspergillus niger中表达重组蛋白质。在工业背景下,需要生产的多肽的高产量。可以通过提高分泌效率来增强感兴趣的重组多肽的生产产量。因此,为了增强感兴趣的多肽的生产产量,需要改进分泌效率。本发明的一个目的是提供改进的用于生产重组多肽的方法。


图1描绘了表达载体pGBFINFUA-1 (描述于W02008/000632中)的质粒图谱。 pGBFINFUA-Ι对于质粒pGBFINFUA_3和pGBFINFUA_21来说也是代表性的。相对于amyB启动子序列和编码引入了变体信号序列的α -淀粉酶的A. niger amyB cDNA序列,标出了 glaA 侧翼区。转化A. niger菌株之前,可以通过用限制性酶NotI消化来去除E. coli DNA。图2描绘了表达载体pGBFINFUA-6(构建描述于实施例1中)的质粒图谱。 pGBFINFUA-6 对于质粒 pGBFINFUA-8、pGBFINFUA-11、pGBFINFUA-12、pGBFINFUA-13、 pGBFINFUA-15、pGBFINFUA-16和pGBFINFUA_18来说也是代表性的。相对于glaA启动子和编码引入了变体信号序列的α-淀粉酶的A. niger amyB cDNA序列,标出了 glaA侧翼区。 转化A. niger菌株之前,可以通过用限制性酶NotI消化来去除E. coliDNA。图3描绘了通过单同源重组整合的图示。表达载体包含可选择的amdS标记物,和与amyB基因连接的启动子,所述启动子含有变体信号序列。这些特征侧翼是指导在基因组 glaA基因座处整合的glaA基因座的同源区(分别为3’ glaA和3” glaA)。图4描绘了表达不同amyB构建体的A. niger菌株培养液中的α -淀粉酶活性,所有amyB构建体均位于glaA启动子的控制下。描绘了表达amyB构建体的A. niger菌株发酵液中的α-淀粉酶活性,其中不同构建体中的信号序列已被修饰。关于不同构建体的细节可见表1。以相对α-淀粉酶单位[AU]为单位描述α-淀粉酶活性,其中第3天FUA6组 3个菌株的FUA-6单拷贝菌株的均值被设为100%。对指出的所有转化体组而言,分离并独
立培养三个转化体。图5描绘了表达两种不同的amyB构建体的A. niger菌株培养液中的α -淀粉酶活性,所述两种不同的amyB构建体均位于amyB启动子的控制下。描述了表达天然amyB构建体(pGBFINFUA-3)的A. niger菌株发酵液中的α -淀粉酶活性,其中根据本发明的方法将amyB信号序列修饰成了经密码子优化的pmeA信号序列(pGBFINFUA_21)。关于两种构建体的细节可见表2。以相对α -淀粉酶单位[AU]为单位描述α -淀粉酶活性,以第3天 FUA3组3个菌株的FUA-3-1单拷贝菌株的均值设为100%。对指出的两个转化体组而言, 分离并独立培养三个转化体。图6描述了表达编码P. chrysogenum葡萄糖氧化酶GoxA的两种不同的构建体的 A. niger菌株培养液中的葡萄糖氧化酶活性,所述两种不同的构建体均位于glaA启动子的控制下。描述了表达天然goxA构建体(G0X-l-#)的A. niger菌株发酵液中的葡萄糖氧化酶活性,其中根据本发明的方法将经密码子优化的goxA信号序列修饰成了经密码子优化的pmeA信号序列(G0X-2-#)。以相对葡萄糖氧化酶单位[AU]为单位描述葡萄糖氧化酶活性。对指出的两个转化体组而言,分离并独立培养五个转化体。发明详述令人惊讶地,我们确定,可以通过使用特定的信号序列改进感兴趣的重组多肽的生产。因此,本发明在第一方面提供了用于生产感兴趣的重组多肽的方法,所述方法包括(i)在有助于生产所述多肽的条件下培养丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码选自下组的信号肽,所述组由a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同,f) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同,i) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO :34,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成,(ii)以及任选地,从培养基分离所述多肽。上文所述方法在本文中被称作根据本发明的方法。根据一个实施方案,在本发明的方法中,信号肽是SEQ ID NO :25。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO :25的变体,其中至少8个氨基酸与SEQ ID NO :25的前10个氨基酸在相应位置上相同。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO :39。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO :44。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO :34。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。优选地,在根据本发明的方法中,当信号肽是以下时a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,或c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。优选地,编码SEQ ID NO 25时,第一多核苷酸是根据SEQ ID NO 29的多核苷酸。 优选地,编码SEQ ID NO 39时,第一多核苷酸是根据SEQ ID NO 38的多核苷酸。优选地, 编码SEQ ID NO :44时,第一多核苷酸是根据SEQ ID NO :43的多核苷酸。优选地,编码SEQ ID NO 34时,第一多核苷酸是根据SEQ ID NO 33的多核苷酸。优选地,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :25变体是下述变体,其中至少9个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 25的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 25变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或 Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。优选地,其中至少8个氨基酸与SEQ ID NO :39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 39的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 39的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 44的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 44的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 34的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 34的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu 的氨基酸,b) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少 5个选自Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,e) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,f) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
g) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,h) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,i) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,j) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,m) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,η) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,ο) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,q) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,r) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,s) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,t) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,u) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。
15 到 23 个氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34的变体可包含15个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。由上文所述第一多核苷酸编码的信号肽在本文中被称作根据本发明的信号肽。“肽”或“寡肽”在本文中是指由至少两个氨基酸组成的分子,所述至少两个氨基酸在线性链中排列,并通过相邻氨基酸残基羧基与氨基之间的肽键接合在一起。术语“肽”和 “寡肽”被认为是同义的(如所公认的那样),并且每个术语可以根据上下文的需要可交换地使用。“多肽”在本文中是指包含至少40个氨基酸的分子。在本发明的上下文中,术语“信号肽”在本文中被定义为引导多肽进入宿主细胞分泌途径的肽。信号序列通常但不必须存在于多肽的氨基端,与多肽以符合读码框的方式融合。信号肽和多肽的氨基端之间可存在前肽(prop印tide)。信号序列通常但不必须在分泌过程期间从多肽上被切下,得到成熟的多肽。本领域技术人员已知如何鉴定信号序列。可以获得多种工具和大量文献。不应理解为本发明的限制的例子是A new method for predicting signal sequence cleavage sites.von Heijne G. Nucleic Acids Res. 1986 Jun 11 ;14(11) :4683-90.Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Henrik Nielsen, Jacob Engelbrecht, S0ren Brunak and Gunnar von Heijne. Protein Engineering,10 :1-6,1997.Locating proteins in the cell using TargetP, SignalP, and related tools.Olof EmanueIsson, S0ren Brunak, Gunnar von Heijne, Henrik Nielsen. Nature Protocols 2,953-971(2007).网站:http://www. cbs. dtu. dk/services/SignalP/术语“前肽”在本文中被定义为与多肽氨基端以符合读码框的方式融合的肽。得到的多肽已知为前多肽,并且可以通过从前多肽上催化切割或自动催化切割前肽而被转化为成熟的多肽。信号肽和前肽一起在本文中被称作“前肽原(pr印rop印tide) ”,信号序列以符合读码框的方式与前肽融合,前肽以符合读码框的方式与多肽的氨基端融合。信号肽、前肽和前肽原在本领域中有时被称作“前导序列”。术语“成熟多肽”在本文中被定义为在翻译、翻译后修饰(例如N-端加工、C-端加工、糖基化、磷酸化和任选的通过切割去除前导序列)之后为最终形式的多肽。在本发明的上下文中,术语“多肽”和“蛋白质”是相同的,并且在本发明的说明书通篇中可以互换理解。在本发明的上下文中,“重组体”是指不排外地涉及天然存在的过程的任何遗传修饰和/或通过对宿主细胞进行随机诱变诱导的遗传修饰。因此,重组体和天然存在的过程和/或通过对宿主细胞进行随机诱变诱导的遗传修饰的组合被认为是重组体。优选地,重组体遗传修饰不涉及天然存在的过程和/或通过对宿主细胞进行随机诱变诱导的遗传修饰。术语“可操作地连接”在本文中被定义为一种构型,其中控制序列相对于编码序列被置于适当的位置上,使得控制序列指导编码序列的表达。
术语“编码序列”在本文中被定义为下述序列,所述序列被转录成mRNA并翻译成根据本发明的多肽。编码序列的界限通常由mRNA 5’-侧的ATG或其他起始密码子和mRNA 3'-侧终止开放读码框的翻译终止密码子序列决定。编码序列可包括但不限于DNA、cDNA 和重组核酸序列。术语“变体肽”或“变体多肽”在本文中被定义为分别在肽或多肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的肽或多肽。相应地,变体信号肽是在信号肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的信号肽。根据本发明的变体信号肽的相应位置由与参照序列例如信号肽SEQ ID NO 25、SEQ ID NO :39, SEQ ID NO :44或SEQ ID N0:34的比对决定。适用时,可以使用本领域中已知的方法进行肽、多肽或多核苷酸的比对或多重比对。此类方法包括但不限于 Clustalff(Thompson et al,1994, Nucleic Acid Research 22,4673-4680), BLAST, GAP, MAP, MultiBLAST, and Smith Waterman。术语“多核苷酸”与术语“核酸分子”相同,并且在本文中可互换理解。该术语是指多核苷酸分子,其为单链或双链的核糖核酸(RNA)或脱氧核糖核酸(DNA)分子。多核苷酸可以分离形式存在,或者可包含在重组核酸分子或载体中,或包含在宿主细胞中。术语“变体多核苷酸”在本文中被定义为在多核苷酸中一个或多个特定位置上包含一个或多个改变(例如一个或多个核苷酸的取代、插入、缺失和/或截短)的多核苷酸。根据本发明的信号肽可以与第二多核苷酸编码的感兴趣的多肽天然结合,或者可以对第二多核苷酸编码的感兴趣的多肽而言是外源的。优选地,根据本发明的信号肽对第二多核苷酸编码的感兴趣的多肽而言是外源的。变体信号肽在本文中被定义为对第二多核苷酸编码的感兴趣的多肽而言是外源的。可以通过使用本领域已知的标准分子克隆技术,通过用根据本发明的信号肽物理替换编码天然结合的信号肽的多核苷酸,将与感兴趣的多肽天然结合的信号肽替换为根据本发明的信号肽。所述方法详尽描述于Sambrook & Russell,Molecular Cloning A Laboratory Manual,3rd Ed. , CSHLPress, Cold Spring Harbor, NY,2001 禾口 Ausubel et al. , Current Protocols in Molecular Biology, Wiley InterScience, NY,1995 中。或者,可以使用本领域已知的方法(见例如上文Sambrook & Russel),通过编码天然结合的信号肽的位点特异性诱变,将与感兴趣的多肽天然结合的信号肽转化为根据本发明的信号肽。根据本发明的信号肽对丝状真菌宿主细胞而言可以是天然的或外源的。优选地, 根据本发明的信号肽对丝状真菌宿主细胞而言是天然的。优选地,在相同条件下培养时,与由与编码其天然信号肽的多核苷酸以符合翻译读码框的方式连接的第二多核苷酸编码的感兴趣的多肽相比,根据本发明的方法生产了至少多10%、更优选地至少多25%、进一步更优选地至少多50%、进一步更优选地至少多 75%、进一步更优选地至少多100%、进一步更优选地至少多200%、最优选地至少多500% 的由与编码根据本发明的信号肽的第一多核苷酸以符合翻译读码框的方式连接的第二多核苷酸编码的感兴趣的重组多肽。可以通过本领域技术人员已知的一般方法提供编码感兴趣的多肽的第二多核苷酸。此类方法详尽描述于上文Sambrook & Russell中。所述方法的例子如下。当第二多核苷酸的序列已知时,或所编码的感兴趣的多肽的序列已知时,可以从天然表达所述多核苷酸的宿主细胞中分离所述多核苷酸。或者,可以化学合成多核苷酸。例如下文所述的密码子优化方法可被用于适应所选择的宿主细胞的密码子使用。如果多肽的序列未知,则可首先使用本领域已知的方法确定序列(上文Sambrook & Russel)。组合或单独的本文多核苷酸(即以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码信号肽;或单独的第一多核苷酸或单独的第二多核苷酸)可以是合成的多核苷酸。合成的多核苷酸可以按照密码子使用被优化,优选地根据W02006/077258和/或PCT/EP2007/055943中所述的方法被优化,所述参考文献通过引用并入本文。PCT/EP2007/055943介绍了密码子对优化。密码子对优化是这样一种方法其中编码多肽的核苷酸序列根据其密码子使用、尤其是使用的密码子对而被修饰,以获得编码多肽的核苷酸序列经改进的表达和/或所编码的多肽的经改进的生产。密码子对被定义为编码序列中一组两个连续的三联体(密码子)。组合或单独的本文多核苷酸(即以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码信号肽;或单独的第一多核苷酸或单独的第二多核苷酸)可包含一个或多个内含子。将多核苷酸以符合翻译读码框的方式彼此连接的方法在本领域中已知为一般克隆技术(Sambrook & Russell,上文)。例子是消化、连接、PCR、化学合成等等。因此,可以通过本领域已知的此类方法孔昂第一多核苷酸与第二多核苷酸以符合翻译读码框的方式连接。可以使用本领域已知的方法构建下述丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。优选地,通过下述方法构建所述丝状真菌宿主细胞,所述方法包括-提供合适的丝状真菌宿主细胞,和-用以符合翻译读码框的方式与所述第二多核苷酸连接的所述第一多核苷酸转化所述宿主细胞。优选地通过本领域公知的技术(见Sambrook & Russell ;Ausubel,上文),通过将多核苷酸、表达载体或核酸构建体引入细胞中,来进行宿主细胞的转化。转化可涉及由以下组成的方法以本身已知的方式形成原生质体、转化原生质体和再生细胞壁。用于转化 Aspergillus 细胞的合适程序描述于 EP 238 023 和 Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81 :1470-1474 中。使用 Agrobacterium tumefaciens转化Aspergillus和其他丝状真菌宿主细胞的合适步骤描述于例如De Groot et al. ,Agrobacterium tumefaciens-mediated transformation of filamentous fungi. Nat Biotechnol. 1998,16 :839-842. Erratum in :Nat Biotechnol 1998 16 :1074 中。转化Fusarium物种的合适方法由Malardier et al.,1989,Gene78 :147156描述或描述于 WO 96/00787中。可以应用其他方法,例如使用如描述于Christiansen et al. ,Biolistic transformation of the obligate plant pathogenic fungus, Erysiphe graminis f. sp. hordei. 1995,Curr Genet. 29 :100-102 中的生物射弹转化。可以使用 Becker andGuarente, In Abelson, J. N. and Simon, Μ. I. , editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology,Volume 194,pp 182—187, Academic Press, Inc. , New York ;Ito et al. , 1983, Journal of Bacteriology 153 :163 ;禾口 Hinnen et al. , 1978, Proceedings of the National Academy of Sciences USA 75 :1920 ^步骤转化酵母。使用本领域已知的方法,在适合生产感兴趣的重组多肽的营养培养基中培养根据本发明的丝状真菌宿主细胞。例如,可以在合适的培养基中和允许多肽表达和/或分离的条件下,通过在实验室或工业发酵罐中进行的摇瓶培养、小规模或大规模发酵(包括连续、 分批、进料分批或固体状态发酵)来培养细胞。使用本领域已知的程序(见例如Bennett, J. W. and LaSure, L,eds.,More Gene Manipulations in Fungi,Academic Press,CA, 1991),在包含碳源和氮源和无机盐的合适营养培养基中进行培养。合适的培养基可来自商业供应商,或者可以使用(例如American Type Culture Collection产品目录中)公开的组合物制备。如果多肽被分泌进营养培养基中,则多肽可从培养基中直接回收。如果多肽不被分泌,则从细胞裂解物中回收。可以通过本领域已知的方法从培养基中回收生产的感兴趣的重组多肽。例如,可以通过常规步骤从培养基中回收多肽,所述常规步骤包括但不限于离心、过滤、萃取、喷雾干燥、蒸发或沉淀。可以通过本领域已知的多种程序纯化感兴趣的重组多肽,所述程序包括但不限于色谱法(例如离子交换、亲合、疏水、色谱聚焦和尺寸排除)、电泳程序(例如制备的等电位聚焦)、差异溶解度(例如硫酸铵沉淀)、SDS-PAGE或萃取(见例如ftOtein Purification, J.-C. Janson and Lars Ryden, editors, VCH Publishers, New York,1989)。可以使用本领域已知的对多肽特异性的方法来检测感兴趣的重组多肽。这些检测方法可包括使用特异性抗体、高效液相色谱、毛细色谱、电泳、酶产物的形成、或酶底物的消失。根据本发明的宿主细胞是丝状真菌宿主细胞。“丝状真菌”包括(如Hawksworth et al. , In, Ainsworth and Bisby' s Dictionary of The Fungi,8thedition, 1995, CAB International, University Press, Cambridge, UK 所定义的)Eumycota 禾口 Oomycota 亚门的所有丝状形式。丝状真菌的特征是由甲壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝壁。营养生长通过菌丝伸长进行,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于 Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、 Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、MucorΛ Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、 Panerochaete、Pleurotus、Sporotrichum、Schizophyllum、Talaromyces、Thermoascus、 Thielavia、Tolypocladium 禾口 Trichoderma 的菌株。优选的丝状真菌细胞属于 Acremonium、Aspergillus、Chrysosporium、 Myceliophthora、Penicillium、Sporotrichum、Talaromyces、Thielavia 或 Trichoderma 属的禾中,最优选地属于 Acremonium alabamensis、Aspergillus niger、Aspergillus awamoriλ Aspergillus foetidus、Aspergillus sojae、Aspergillus fumigatus、 Aspergillus oryzae、Chrysosporium lucknowense、Myceliophthora thermophila、Sporotrichum eellulophilum>Thielavia terrestris>Trichoderma reesei>Talaromyces emersonii 或Penicillium chrysogenum 的禾中。丝状真菌的若干菌株是公众能够容易地从大量培养物保藏机构例如American Type Culture Collection (ATCC)、Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSM)、Centraalbureau Voor Schimmelcultures (CBS)禾口 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center (NRRL)获得的,Aspergillus niger CBS 513. 88、Aspergillus oryzae ATCC 20423、IFO 4177、ATCC1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892, P.chrysogenum CBS 455.95, Penicillium citrinum ATCC 38065, Penicillium chrysogenum P2, Acremonium chrysogenum ATCC 36225 或 ATCC 48272, Trichoderma reesei ATCC 26921 或 ATCC 56765 或 ATCC 26921, Aspergillus sojae ATCCl1906, Chrysosporium lucknowense ATCC44006, Talaromyces emersonii CBS393.64 或 CBS814. 70及其衍生物。任选地,宿主细胞包含与野生型细胞相比提高的解折叠蛋白应答(UPR),以增强感兴趣的多肽的生产能力。可以通过US2004/0186070A1和/或US2001/0034045A1和/或 W001/72783A2和/或W02005/123763中描述的技术提高UPR。更特定地,为了获得具有提高的UPR的宿主细胞,调控了 HACl和/或IREl和/或PTC2的蛋白质水平,和/或改造了 SEC61蛋白质。或者,或与提高的WR组合,对宿主细胞进行遗传修饰,以获得与野生型细胞相比展示更低蛋白酶表达和/或蛋白酶分泌的表型,从而增强感兴趣的多肽的生产能力。此类表型可以通过蛋白酶表达的转录调节子的缺失和/或修饰和/或失活来获得。此类转录调节子可以是例如prtT。通过调控prtT来降低蛋白酶的表达可以通过US2004/0191864A1中描述的技术进行。或者,或与提高的WR和/或展示更低蛋白酶表达和/或蛋白酶分泌的表型组合, 宿主细胞展示了草酸盐缺陷型表型,从而增强感兴趣的多肽的生产产量。草酸盐缺陷型表型可以通过W02004/070022A2中描述的技术获得。或者,或与提高的WR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型组合,宿主细胞展示了与野生型相比的表型差异的组合,以增强感兴趣的多肽的生产产率。这些差异可包括但不限于,降低的葡糖淀粉酶和/或中性α-淀粉酶A和 /或中性α-淀粉酶B蛋白酶和草酸水解酶的表达。宿主细胞展示的所述表型差异可以通过根据US2004/0191864A1中所述技术的遗传修饰获得。或者,或与提高的WR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型和与野生型相比为了增强感兴趣的多肽生产产率的表型差异的组合相组合, 宿主细胞展示毒素基因的缺陷,使得丝状真菌宿主细胞失去表达毒素的能力。此类毒素包括但不限于,赭曲毒素,烟曲霉毒素,环并偶氮酸(cyclapiazonic acid),3-硝基丙酸,布洛芬,畸形素,黄曲霉毒素和黑麦酸。此类缺陷优选地例如描述于W02000/039322中。感兴趣的多肽可以是具有感兴趣的生物活性的任何多肽。多肽对宿主细胞而言可以是天然的或异源的。异源的多肽在本文中被定义为对宿主细胞而言并非天然的多肽,或者其中进行了结构修饰以改变多肽的天然多肽。多肽可以是胶原或明胶,或其变体或杂种(hybrid)。多肽可以是任何抗体或其部分,抗原,凝血因子,酶,激素或激素变体,受体或其部分,调节蛋白,结构蛋白,报告蛋白,或转运蛋白,天然涉及分泌过程的蛋白质,涉及折叠过程的蛋白质,伴侣蛋白,肽氨基酸转运蛋白,糖基化因子,转录因子,寡肽,天然是细胞内的蛋白质。天然是细胞内的蛋白质可以是酶例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。感兴趣的重组多肽优选地是细胞外分泌的酶。此类酶可属于氧化还原酶、转移酶、水解酶、裂合酶、异构酶、连接酶、过氧化氢酶、 纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、聚糖酶、酯酶的组。酶可以是糖酶,例如纤维素酶如内切葡聚糖酶,β-葡聚糖酶,纤维二糖水解酶或β-葡糖苷酶,半纤维素酶或果胶分解酶如木聚糖酶,木糖苷酶,甘露聚糖酶,半乳聚糖酶,半乳糖苷酶,果胶甲基酯酶,果胶裂合酶,果胶酸裂合酶,内切多聚半乳糖醛酸酶,外切多聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶(arabinofuranosidases),阿拉伯木聚糖水解酶, 半乳糖醛酸酶,裂合酶,或淀粉酶;水解酶,异构酶,或连接酶,磷酸酶如植酸酶,酯酶如脂肪酶,蛋白水解酶,氧化还原酶如氧化酶,转移酶,或异构酶。酶可以是植酸酶。酶可以是天冬酰胺酶,氨肽酶,淀粉酶,糖酶,羧肽酶,内切蛋白酶,金属蛋白酶,丝氨酸-蛋白酶接触酶, 几丁质酶,角质酶,环糊精糖基转移酶,脱氧核糖核酸酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡萄糖淀粉酶,α-葡糖苷酶,β -葡糖苷酶,卤素过氧化物酶(haloperoxidase),蛋白水解酶,转化酶,漆酶,脂肪酶,甘露糖苷酶,变构酶,氧化酶,果胶分解酶,过氧化物酶,磷脂酶,多酚氧化酶,核糖核酸酶,转谷氨酰胺酶,或葡萄糖氧化酶,己糖氧化酶,单加氧酶。多肽还包括上述多肽的天然存在的等位基因变异和经改造的变异。根据本发明,感兴趣的多肽也可以是融合的多肽或杂种多肽,另一多肽在所述多肽或其片段的N-端或C-端与之融合。融合的多肽通过将编码一种多肽的核酸序列与编码另一多肽的核酸序列(或其部分)融合来生产。杂种多肽可包含得自至少两种不同多肽的部分或全部多肽序列的组合,其中所述至少两种不同多肽中的一种或多种对宿主细胞而言可以是异源的。根据本发明的方法被便利地用于生产感兴趣的重组多肽。因此,在第二方面中,本发明涉及通过根据本发明第一方面的方法生产的感兴趣的重组多肽。优选地,所述多肽是如上文所述的酶。本发明还涉及中间产物,即由于第二多核苷酸以符合翻译读码框的方式连接的第一多核苷酸编码的感兴趣的多肽,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。优选地,信号肽是选自下组的信号肽,所述组由a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,d) SEQ ID NO 39,
e) 15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同,f) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同,i) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成。根据一个实施方案,在中间产物中,信号肽是SEQ ID NO :25。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO :39。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO 44 根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID N0 44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO :34。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID N0 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID N034的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。优选地,在中间产物中,当信号肽是以下时a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,或c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。优选地,编码SEQ ID NO 25时,第一多核苷酸是根据SEQ ID NO 29的多核苷酸。 优选地,编码SEQ ID NO 39时,第一多核苷酸是根据SEQ ID NO 38的多核苷酸。优选地, 编码SEQ ID NO :44时,第一多核苷酸是根据SEQ ID NO :43的多核苷酸。优选地,编码SEQ ID NO 34时,第一多核苷酸是根据SEQ ID NO 33的多核苷酸。优选地,其中至少8个氨基酸与SEQ ID NO :25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 25的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 25的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO :25的变体,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或 Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。优选地,其中至少8个氨基酸与SEQ ID NO :39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 39的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 44的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 44的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 34的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 34的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu 的氨基酸,b) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少 5个选自Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,e) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,f) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,g) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,h) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,i) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,j) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,m) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,η) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,ο) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,q) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,r) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,s) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,t) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,u) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。15 到 23 个氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO: 34变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。在第三方面中,本发明涉及包含以下的重组表达构建体以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。优选地,当信号肽是以下时a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,或c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。优选地,编码SEQ ID NO 25时,第一多核苷酸是根据SEQ ID NO 29的多核苷酸。 优选地,编码SEQ ID NO 39时,第一多核苷酸是根据SEQ ID NO 38的多核苷酸。优选地, 编码SEQ ID NO :44时,第一多核苷酸是根据SEQ ID NO :43的多核苷酸。优选地,编码SEQ ID NO 34时,第一多核苷酸是根据SEQ ID NO 33的多核苷酸。本发明还涉及还包含以下的所述重组表达构建体与以符合读码框的方式与第二多核苷酸连接的第一多核苷酸可操作地连接的启动子,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。本发明还涉及包含上文所述的表达构建体的重组表达载体。术语“核酸构建体”在本文中是指单链或双链的核酸分子,其与天然存在的基因分离,或者已被修饰为含有下述核酸区段,所述核酸区段以天然不会存在的方式组合和并置。 当核酸构建体含有表达编码序列所需的所有控制序列(其中所述控制序列与所述编码序列可操作地连接)时,术语“核酸构建体”与术语“表达盒”同义。
术语“控制序列”在本文中被定义为包括对mRNA和/或多肽的体外表达或在宿主细胞中的表达而言必需的或有利的所有组件。每种控制序列对编码多肽的核酸序列而言可以是内源的或外源的。此类控制序列可包括,但不限于Siine-Delgarno序列、最适翻译起始序列(如Kozak, 1991,J. Biol. Chem. 266 :19867-19870中所述)、多聚腺苷酸化序列、启动子和转录终止子。控制序列至少包括启动子以及转录和翻译终止信号。可以针对其特定的用途优化控制序列。优选地,DNA构建体包含启动子DNA序列,与所述启动子DNA序列可操作地连接的编码序列,和控制序列例如-一个选自以下序列列表的由5’朝向3’方向的翻译终止序列TAAG、TAGA和 TAAA,优选地TAAA,和/或-一个选自以下序列列表的由5’朝向3’方向的翻译起始子编码序列GCTACCCCC ; GCTACCTCC ;GCTACCCTC ;GCTACCTTC ;GCTCCCCCC ;GCTCCCTCC ;GCTCCCCTC ;GCTCCCTTC ; GCTGCCCCC ;GCTGCCTCC ;GCTGCCCTC ; GCTGCCTTC ;GCTTCCCCC ;GCTTCCTCC ; GCTTCCCTC ;和 GCTTCCTTC,优选地 GCT TCC TTC,和 / 或-选自以下序列列表的翻译起始子序列5,-mwChkyCAAA-3,;5,-mwChkyCACA-3, 或 5’ -mwChkyCAAG-3’,使用核苷酸的模糊编码m(A/C) ;w(A/T) ;y(C/T) ;k(G/T) ;h(A/C/ Τ),优选地 5,-CACCGTCAAA-3’ 或 5,-CGCAGTCAAG-3,。在本发明的上下文中,术语“翻译起始子编码序列”被定义为DNA编码序列开放读码框起始子或起始密码子紧下游的9个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。在本发明的上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端的翻译终止密码子开始并按5’到3’方向的四个核苷酸。在本发明的上下文中,术语“翻译起始子序列”被定义为编码多肽的DNA序列开放读码框的起始子或起始密码子紧上游的十个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。本领域公知在 RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶Τ。可以为了引入特定的限制性位点而对控制序列提供连接子,所述特定的限制性位点有助于将控制序列与编码多肽的核酸序列的编码区连接。控制序列可以是合适的启动子序列,启动子序列是被宿主细胞识别用于表达核酸序列的核酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在细胞中显示转录活性的任何核酸序列,包括突变、截短和杂种的启动子,并且可得自编码对细胞而言同源或异源的细胞外或细胞内多肽的基因。控制序列也可以是合适的转录终止子序列,这是被丝状真菌细胞识别为终止转录的序列。终止子序列与编码多肽的核酸序列的3'-端可操作地连接。本发明中可以使用在细胞中发挥功能的任何终止子。对丝状真菌细胞而言优选的终止子得自编码以下的基因A. oryzae TAKA淀粉酶、 A.niger葡糖淀粉酶(glaA)、A. nidulans邻氨基苯甲酸合酶、A. niger α-葡糖苷酶、trpC 基因和Fusarium oxysporum胰蛋白酶样蛋白酶。控制序列也可以是多聚腺苷酸化序列,这是与核酸序列3'-端可操作地连接的序列,其转录后被丝状真菌细胞识别为对所转录的mRNA添加多聚腺苷残基的信号。本发明中可以使用在细胞中有功能的任何多聚腺苷酸化序列。对丝状真菌细胞而言优选的多聚腺苷酸化序列得自编码以下的基因Aoryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans邻氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶样蛋白酶和A.niger α-葡糖苷酶。术语“启动子”在本文中被定义为结合RNA聚合酶并指导聚合酶到达编码生物化合物的核酸序列的正确下游转录起始位点处从而起始转录的DNA序列。RNA聚合酶有效地催化与编码区的适当DNA链互补的信使RNA的装配。术语“启动子”还可被理解为包括在转录成mRNA后用于翻译的5'-非编码区(启动子和翻译起点之间),顺式作用转录控制元件如增强子,和能够与转录因子相互作用的其他核苷酸序列。启动子可以是适用于真核或原核宿主细胞的任何合适的启动子序列,其显示转录活性,包括突变、截短和杂种的启动子, 并且可得自编码对细胞而言同源(天然)或异源(外源)的细胞外或细胞内多肽的基因。 启动子可以是组成型或诱导型启动子。可以使用的诱导型启动子的例子是淀粉诱导型启动子、铜诱导型启动子、油酸诱导型启动子。启动子可选自下组,所述组包括但不限于下述启动子,所述启动子得自编码以下的基因A.oryZae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A. niger中性α -淀粉酶、A. niger酸稳定性α -淀粉酶、A. niger或A. awamori 葡糖淀粉酶(glaA)、R. miehei脂肪酶、A. oryzae碱性蛋白酶、A. oryzae磷酸丙糖异构酶、 A. nidulans乙酰胺酶、NA2_tpi启动子(来自编码A. niger中性α -淀粉酶和A. oryzae 磷酸丙糖异构酶的基因的启动子的杂种),及其突变、截短和杂种的启动子。在丝状真菌细胞中使用的尤其优选的启动子是来自蛋白酶基因的启动子或其功能性部分;例如来自 F. oxysporum胰蛋白酶样蛋白酶基因(U. S. 4,288,627)、A. oryzae碱性蛋白酶基因(alp)、 A. niger pacA基因、A. oryzae碱性蛋白酶基因、A. oryzae中性金属蛋白酶基因、A. niger曲霉肽酶蛋白酶P印A基因或F. venenatum胰蛋白酶基因、A. niger天冬氨酸蛋白酶ρ印B基因。其他优选的启动子是W02006/092396和W02005/100573中描述的启动子,所述参考文献通过引用并入本文。当感兴趣的重组多肽是由两个或更多多肽(部分)组成的嵌合多肽时,本领域技术人员已知如何使用本领域已知的方法构建这些和其他嵌合多核苷酸构建体。为了促进表达和/或翻译,根据本发明的多核苷酸或核酸构建体可包含在表达载体中,使得本发明的多核苷酸与用于在体外、或原核或真核宿主细胞中表达和/或翻译的适当控制序列可操作地连接。重组表达载体可以是任何载体(例如质粒或病毒),可对其便利地进行重组DNA程序,并且可导致编码多肽的核酸序列的表达。载体的选择典型地应取决于载体与引入所述载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。载体可以是自主复制载体, 即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体、或人工染色体。自主维持的克隆载体可包含AMAl-序列(见例如Aleksenko and Clutterbuck(1997),Fungal Genet. Biol. 21 :373-397)。或者,载体可以是在引入宿主细胞后被整合进基因组中并与整合了所述载体的染色体一起复制的载体。整合型克隆载体可在宿主细胞染色体中随机整合,或在预定的靶基因座处整合。在本发明的一个优选的实施方案中,整合型克隆载体包含与宿主细胞基因组中预定的靶基因座中的DNA序列同源的DNA片段,从而将克隆载体整合至该预定的基因座。为了促进定向整合,在转化细胞之前优选地将克隆载体线性化。优选地以下述方式进行线性化,所述方式使得克隆载体的至少一端,优选地任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选地至少为30bp,优选地至少为50bp,优选地至少为0. 11Λ,进一步优选地至少为0. 21Λ,更优选地至少为0. 51Λ,进一步更优选地至少为 11Λ,最优选地至少21Λ。优选地,通过宿主细胞增强的同源重组能力提高了定向整合进宿主细胞基因组中(即在预定的靶基因座中整合)的效率。细胞的此类表型优选地涉及如 W02005/095624中所述的缺陷型ku70基因。W02005/0956M公开了获得包含提高的定向整合效率的丝状真菌细胞的一种优选的方法。优选地,克隆载体中与靶基因座同源的同源侧翼DNA序列源自高度表达的基因座,即它们源自能够在宿主细胞中具有高表达水平的基因。能够具有高表达水平的基因(即高度表达的基因)在本文中被定义为例如在被诱导的条件下,其mRNA能够组成总细胞mRNA的至少0.5% (w/w)的基因,或者其基因产物能够组成总细胞蛋白质的至少(w/w)的基因,或者在分泌型基因产物的情况下,可以分泌到至少0. lg/Ι的水平(如EP 357 127 Bl中所述)。通过举例给出了大量优选的高度表达的真菌基因来自Aspergilli或Trichoderma的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、 磷酸甘油醛脱氢酶或纤维二糖水解酶(cbh)基因。用于这些目的的最优选的高度表达的基因是葡糖淀粉酶基因,优选地为A. niger葡糖淀粉酶基因、A. oryzae TAKA-淀粉酶基因、 A. nidulans gpdA 基因、Trichoderma reesei cbh 基因,优选地为 cbhl。可以向细胞中插入多于一个拷贝的核酸序列,以提高基因产物的生产。这可以如下完成优选地通过向其基因组中整合进多个拷贝的DNA序列来完成,更优选地通过将DNA 序列的整合靶向至在前一段中定义的高度表达的基因座之一处来完成。或者这可以如下完成包括可扩增的可选择标记物基因与核酸序列,其中含有被扩增的可选择标记物基因拷贝、从而存在额外的核酸序列拷贝的细胞可以通过在存在适当的可选择试剂时培养细胞而被选择。为了进一步提高要过表达的DNA序列的拷贝数,可以使用如W098/46772中所述的基因转化基因。载体系统可以是单个载体或质粒,或两个或更多的载体或质粒,它们一起含有要被引入宿主细胞基因组中的总DNA,或是转座子。载体优选地含有一个或多个可选择标记物,所述可选择标记物允许容易地选择被转化的细胞。可选择标记物是一种基因,其产物提供杀生物性或病毒抗性、对重金属的抗性、对营养缺陷型的自养型等等。丝状真菌细胞中使用的可选择标记物可选自下组, 所述组包括但不限于amdS (乙酰胺酶),argB (鸟氨酸氨甲酰转移酶),bar (膦丝菌素乙酰转移酶),bleA(腐草霉素结合),hygB (潮霉素磷酸转移酶),niaD (硝酸还原酶), PyrG(乳清酸核苷-5'-磷酸脱羧酶),sC(硫酸腺嘌呤基转移酶)和trpC(邻氨基苯甲酸合酶),以及来自其他物种的等同物。优选用于Aspergillus和Penicillium细胞中的是 A. nidulans 或 A. oryzae 的 amdS (EP635574B1,WO 97/06261)和 pyrG 基因,禾口 Streptomyces hygroscopicus的bar基因。更优选地使用amdS基因,进一步更优选地使用来自A. nidulans或A. niger的amdS基因。最优选的选择标记物基因是与A. nidulans gpdA 启动子融合的A. nidulans amdS编码序列(见EP 635574B1)。其他优选的AmdS标记物是 W02006/040358中所述的那些。也可以使用来自其他丝状真菌的AmdS基因(W0 97/06261)。用于连接上文所述元件从而构建本发明的重组表达载体的程序是本领域技术人员公知的(见例如Sambrook & Russell,上文)。在第四方面中,本发明涉及包含根据本发明第三方面的表达构建体或包含根据本发明第三方面的表达载体的重组丝状真菌宿主细胞。所述丝状真菌宿主细胞优选地是如本文先前所述的细胞。所述丝状真菌宿主细胞可使用本领域已知的方法构建。优选地,所述丝状真菌宿主细胞通过下述方法构建,所述方法包括-提供合适的丝状真菌宿主细胞,和-用根据本发明第三方面的表达构建体或用根据本发明第三方面的表达载体转化所述宿主细胞。丝状真菌宿主细胞的转化优选地如本文之前所述进行。在第五方面中,本发明涉及根据本发明的信号肽用于生产感兴趣的重组多肽的方法。因此,信号肽优选地选自由以下组成的组a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同,f) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同,i) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据一个实施方案,信号肽是SEQ ID NO :25。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :39。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :44。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :34。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。优选地,当信号肽是以下时a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,或c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。优选地,其中至少8个氨基酸与SEQ ID NO :25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO 25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 25的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 25的变体是选自下组的变体
a) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或 Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。优选地,其中至少8个氨基酸与SEQ ID NO :39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 39的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 39的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 44的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 44的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 34的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 34的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu 的氨基酸,b) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少 5个选自Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,e) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,f) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,g) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,h) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,i) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,j) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,m) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,η) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,ο) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,q) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,r) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,s) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,t) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,u) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。15 到 23 个氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。在第六方面中,本发明涉及编码根据本发明的信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。因此,信号肽优选地选自由以下组成的组a) SEQ ID NO 25,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同,f) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g) SEQ ID NO 44,h) 15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同,i) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据一个实施方案,信号肽是SEQ ID NO :25。根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :39。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :44。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 44的变体,其中至少8个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 44变体,其中第 1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。根据另一个实施方案,信号肽是SEQ ID NO :34。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中至少8个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。优选地,当信号肽是以下时a) SEQ ID NO 25,
b) 15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同,或c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨
基酸,感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。优选地,编码SEQ ID NO 25时,第一多核苷酸是根据SEQ ID NO 29的多核苷酸。 优选地,编码SEQ ID NO :39时,第一多核苷酸是根据SEQ ID NO :38的多核苷酸。优选地, 编码SEQ ID NO :44时,第一多核苷酸是根据SEQ ID NO :43的多核苷酸。优选地,编码SEQ ID NO 34时,第一多核苷酸是根据SEQ ID NO 33的多核苷酸。优选地,其中至少8个氨基酸与SEQ ID NO :25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 25的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 25的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或 Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。优选地,其中至少8个氨基酸与SEQ ID NO :39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :39变体是下述的变体,其中至少9个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 39的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 39的变体是选自下组的变体
a) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO 39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 44的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 44的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala 或Leu的氨基酸,b) 15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自 Ala或Leu的氨基酸。优选地,其中至少8个氨基酸与SEQ ID NO :34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO :34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO 34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO 34的前 10个氨基酸在相应位置上相同。优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO 34的变体是选自下组的变体a) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu 的氨基酸,b) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少 5个选自Ala或Leu的氨基酸,c) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,d) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,e) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,f) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,g) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,h) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,i) 15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,j) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,k) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,m) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,η) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,ο) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,q) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,r) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,s) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,t) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,u) 15到23个氨基酸的SEQ ID NO 34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。
在上述SEQ ID NO 25 的变体(a)到(d)、SEQ ID NO 39 的变体(a)禾口 (b),SEQ ID NO 44的变体(a)和(b)和SEQ ID NO 34的变体(a)到(U)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。15 到 23 个氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34的变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。本文提供的序列信息不应被狭窄地理解为要求包括错误鉴定的碱基。本文公开的特定序列可容易地被用于从各个宿主细胞中分离完整的基因,所述完整的基因可随后被容易地进行序列分析,从而鉴定序列错误。除非另有说明,本文通过测序DNA分子测定的所有核苷酸序列都使用自动化DNA 测序仪测定,由本文测定的DNA分子编码的多肽的所有氨基酸序列都通过翻译如上文测定的核酸序列来预测。因此,如本领域针对通过该自动化途径测定的任何DNA序列所已知的, 本文测定的任何核苷酸序列可含有一些错误。通过自动化测定的核苷酸序列可典型地与被测序的DNA分子的实际核苷酸序列至少约90 %相同,更典型地至少约95 %到至少约99. 9 % 相同。实际序列可通过其他途径更精确地测定,包括本领域中公知的手动DNA测序方法。 还如本领域所已知的,与实际序列相比被测定的核苷酸序列中的单个插入或缺失会在核苷酸序列翻译中引起移码,使得所预测的由测定的核苷酸序列编码的氨基酸序列与被测序的 DNA分子实际编码的氨基酸序列从此类插入或缺失点开始完全不同。本领域技术人员能够鉴定此类被错误鉴定的碱基,并且知道如何纠正此类错误。本文所描述和要求保护的发明在范围上不受本文公开的特定实施方案的限制,因为这些实施方案旨在阐述本发明的若干方面。任何等同的实施方案旨在落入本发明的范围内。事实上,除了本文所展示盒描述的以外,本领域技术人员根据前述说明书能够明白对本发明的多种修饰。此类修饰也旨在落入附带的权利要求书的范围内。在冲突的情况下,采取包括定义在内的本公开作为指导。本发明通过以下实施例进一步说明。
实施例菌株WT 1 该A. niger菌株被用作野生型菌株。该菌株以保藏号CBS513. 88保藏于CBS Institute。WT 2 该A. niger菌株是包含编码葡糖淀粉酶的基因(glaA)缺失的WT 1菌株。 如EP 0 635 574 Bl中所述通过使用“MARKER-GENE FREE”途径构建WT 2。在该专利中详尽地描述了如何在CBS 513.88的基因组中缺失glaA特异的DNA序列。所述程序导致 MARKER-GENE FREE Δ glaA重组体A. niger CBS 513. 88菌株,所述菌株最终完全不具有外来DNA序列。WT 3 该A. niger菌株是包含下述缺失的WT 2菌株,所述缺失导致草酸盐/酯缺陷型A. niger菌株。通过使用EP1157100和US6,936,438中所述的方法构建WT 3,其中通过缺失编码草酰乙酸水解酶的oahA基因获得草酸盐/酯缺陷型菌株,菌株WT 3被选择为在WT 2菌株背景中失活了 oahA基因的代表性菌株。或者,在EP1590444中详尽地描述了如何筛选草酸盐/酯缺陷型突变体A. niger 菌株。根据EP1590444的实施例1和2,描述了如何获得WT 2的草酸盐/酯缺陷型突变体菌株。WT 4 该A.niger菌株是包含在三个后续步骤中编码α-淀粉酶的三个基因 (amyB、amyBI和amyBII)缺失的WT 3菌株。缺失载体的构建和这三个基因的基因组缺失已详细描述于 W02005095624 中。描述于 W02005095624 中的载体 pDEL_AMYA、pDEL-AMYBI 和pDEL-AMYBII已根据EP 0 635 574 Bl中所述的“MARKER-GENE FREE”途径使用。上述程序得到草酸盐 / 酯缺陷型的,MARKER-GENE FREE Δ glaA、Δ amyA, Δ amyBI 禾Π AamyBII 淀粉酶阴性重组体A. niger CBS 513. 88菌株,所述菌株最终完全不具有外来DNA序列。这样,WT 4具有低淀粉酶背景,并且与WT 1相比针对α-淀粉酶表达和表达检测更加优化。分子生物学技术在这些菌株中,使用本领域技术人员已知的分子生物学技术(见Sambrook & Russell, Molecular Cloning :A Laboratory Manual, 3rd Ed. , CSHL Press, Cold Spring Harbor, NY,2001),如下文所述过表达了若干基因,并下调了其它基因。用于基因过表达和破坏的表达载体,用于下调、转化的载体的一般设计的例子,标记物和选择培养基的使用可参见 W0199846772、W0199932617、W02001121779、W02005095624、EP635574B 和 W02005100573。A. niger 摇瓶发酵如 WO 99/32617 的实施例“Aspergillus niger shake flask fermentations,,部分中所述,在20ml预培养培养基中预培养A. niger菌株。过夜生长后,将IOml该培养物转移至发酵培养基(FM)中。每升发酵培养基(FM)含有82.5g Glucose. lH20,25g Maldex 15(荷兰 Boom M 印 pel),2g 柠檬酸,4.5g NaH2P04. 1H20,9gKH2P04,15g (NH4) 2S04,0. 02g ZnC12,0. Ig MnS04. 1H20,0. 015gCuS04. 5H20,0. 015g CoC12. 6H20,Ig MgS04. 7H20,0. lgCaC12. 2H20, 0. 3g FeS04. 7H20,30g MES(2-[N-吗啉代]乙磺酸),pH = 6。在FM中的发酵于34°C和170rpm下在含有100ml发酵液的500ml带挡板烧瓶中进行指示的天数,一般如W099/3^17中所述。真菌α -淀粉酶活性为了在A. niger培养液中测定α -淀粉酶活性,根据供应商的说明使用Megazyme 谷物α -淀粉酶试剂盒(Megazyme,CERALPHA α淀粉酶测定试剂盒,产品目录编号K-CERA, 2000-2001年)。所测量的活性以存在过量葡糖淀粉酶和α-葡糖苷酶时非还原性末端阻断的P-硝基苯基麦芽庚糖苷(P-nitrophenyl maltoheptaoside)的水解为基础。形成的P-硝基苯酚是样品中存在的α-淀粉酶活性的度量。葡萄糖氧化酶活性为了在A. niger培养液中测定葡萄糖氧化酶活性,如Witteveen et al. 1990 ( "Glucose oxidase overproducing and negative mutants of Aspergillus niger", Appl. Microbiol. Biotechnol 33:683-686)所述使用邻联二茴香胺 (o-dianisidine),在450nm处用分光光度计测量葡萄糖氧化酶。
实施例1针对A. niger α -淀粉酶AmyB和P. chrysogenum葡萄糖氧化酶goxA构津经修饰的Aspergillus表汰构津体编码α-淀粉酶蛋白质的amyB基因的DNA序列可在登记号XM_001395712. 1、 ΧΜ_001390741. 1 或 CAK46324 下得自 EMBLNucleotide Sequence Database (http//www. ebi.ac.uk/embl/index.html)。天然 A. niger amyB 基因的基因组序列作为 SEQ ID NO. 1 展示。amyB的相应编码序列或cDNA序列作为SEQ ID NO. 2展示。SEQ ID NO. 2经翻译的序列被命名为SEQ ID N0. 3,代表了 A. niger α -淀粉酶蛋白质AmyB。该序列也与 A. oryzae α -淀粉酶蛋白质具有 100% 的相似性(Wirsel S.,Lachmund Α.,Wildhardt G. , Ruttkowski Ε. , “ Three alpha-amylase genes of Aspergillus oryzae exhibit identical intron-exon organization" (1989)Mol. Microbiol. 3 :3-14)。天然的分泌型 A. niger成熟α -淀粉酶肽被命名为SEQ ID Ν0. 4。如下文详述的,用经优化的amyB cDNA 序列和静改进的表达载体进行根据本发明方法的优化。为了进行Aspergillus物种中A. niger amyB构建体变体的表达分析,amyB编码序列包含编码α-淀粉酶的amyB基因的经密码子优化的(CO)编码序列(如W02008/000632 中详述的)。使用基于pGBFIN-的表达构建体,使用强A. niger葡糖淀粉酶glaA启动子和α -淀粉酶amyB启动子二者进行A. niger中α -淀粉酶的过表达(如W01999/3^17 和TO2006/077258中所述)。在所有随后产生的amyB表达构建体中,葡糖淀粉酶glaA和 α -淀粉酶amyB启动子的翻译起始序列已被修饰成5’ -CACCGTCAAA ATG-3’ (也详述于 W02006/077258中)。在一些载体中去除存在于天然α -淀粉酶amyB启动子中的BstXl位点(5’-CCANNNNN/NTGG-3’),以便于克隆信号序列变体。另外,使用最适的翻译终止序列,因此在所有表达构建体中,野生型amyB 5’ -TGA-3’翻译终止序列被替换为5’ -TAAA-3,(如 W02006/077258 中所详述)。在两端引入适当的限制性位点,以允许在表达载体中克隆。在5’_端引入B10I位点,在3’ -端引入I^cI位点。包含经修饰的基因组glaA或amyB启动子和经优化的amyB cDNA序列的参照构建体的DNA片段被完全合成、亚克隆,并通过序列分析进行序列验证。使用两种合成的片段端部的BioI-PacI限制性位点,从而允许在经BioI和 PacI消化的pGBFINFUA-Ι表达载体(pGBFINFUA_l载体还描述于W02006/077258和 W02008/000632中)的大载体片段中克隆,分别产生pGBFINFUA_6和pGBFINFUA_3。根据本发明的方法在信号序列中a. ο.变化的经修饰的AmyB序列的所有DNA片段被设计、完全合成为EcoRI-PacI或EcoRI-BstXl片段,亚克隆并进行序列验证。使用所有合成的片段端部的EcoRI-PacI/BstXl限制性位点,从而允许在经EcoRI和I^acI/BstXl消化的pGBFINFUA-3或经EcoRI和I^acI消化的pGBFINFUA_6表达载体的大载体片段中克隆, 产生变体pGBFINFUA-表达载体。对各个载体进行序列验证后,如下文表1和表2中所述对变体表达构建体命名。对所有PGBFINFUA-构建体的各个序列的所有特征和参照可从表1 和表2中推出。表1 用于A. niger中位于glaA启动子控制下的α -淀粉酶AmyB表达的经修饰
的表达构建体
权利要求
1.用于生产感兴趣的重组多肽的方法,所述方法包括(i)在有助于生产所述多肽的条件下培养丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码选自下组的信号肽,所述组由a)SEQ ID NO :25,b)15到23个氨基酸的SEQ ID NO :25的变体,其中至少8个氨基酸与SEQ ID NO 25 的前10个氨基酸在相应位置上相同,c)15到23个氨基酸的SEQ ID NO :25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23个氨基酸的SEQ ID NO :39的变体,其中至少8个氨基酸与SEQ ID NO 39 的前10个氨基酸在相应位置上相同,f)15到23个氨基酸的SEQ ID NO :39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23个氨基酸的SEQ ID NO :44的变体,其中至少8个氨基酸与SEQ ID NO 44 的前10个氨基酸在相应位置上相同,i)15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23个氨基酸的SEQ ID NO :34的变体,其中至少8个氨基酸与SEQ ID NO 34 的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸, 构成( )以及,任选地,从培养基分离所述多肽,并且,当所述信号肽是(b)或(c)时,所述感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
2.通过根据权利要求1所述的方法获得的多肽。
3.由以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸编码的重组多肽, 所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码选自下组的信号肽,所述组由a)SEQ ID NO :25,b)15到23个氨基酸的SEQ ID NO 25的变体,其中至少8个氨基酸与SEQ ID NO 25 的前10个氨基酸在相应位置上相同,c)15到23个氨基酸的SEQ ID NO :25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23个氨基酸的SEQ ID NO :39的变体,其中至少8个氨基酸与SEQ ID NO 39的前10个氨基酸在相应位置上相同,f)15到23个氨基酸的SEQ ID NO :39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23个氨基酸的SEQ ID NO :44的变体,其中至少8个氨基酸与SEQ ID NO 44 的前10个氨基酸在相应位置上相同,i)15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23个氨基酸的SEQ ID NO :34的变体,其中至少8个氨基酸与SEQ ID NO 34 的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成,并且,当所述信号肽是(b)或(c)时,所述感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
4.包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸的重组表达构建体,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码选自下组的信号肽,所述组由a)SEQ ID NO :25,b)15到23个氨基酸的SEQ ID NO :25的变体,其中至少8个氨基酸与SEQ ID NO 25 的前10个氨基酸在相应位置上相同,c)15到23个氨基酸的SEQ ID NO :25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23个氨基酸的SEQ ID NO :39的变体,其中至少8个氨基酸与SEQ ID NO 39 的前10个氨基酸在相应位置上相同,f)15到23个氨基酸的SEQ ID NO :39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23个氨基酸的SEQ ID NO :44的变体,其中至少8个氨基酸与SEQ ID NO 44 的前10个氨基酸在相应位置上相同,i)15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23个氨基酸的SEQ ID NO :34的变体,其中至少8个氨基酸与SEQ ID NO 34 的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成,并且当所述信号肽是(b)或(c)时,所述感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
5.根据权利要求3所述的表达构建体,其还包含与所述第一和第二多核苷酸可操作地连接的启动子。
6.包含根据权利要求4和5中任一项所述的表达构建体的重组表达载体。
7.包含根据权利要求4和5中任一项所述的表达构建体或包含根据权利要求6所述的表达载体的重组丝状真菌宿主细胞。
8.选自下组的信号肽用于生产感兴趣的重组多肽的用途,所述组由a)SEQID NO :25,b)15到23个氨基酸的SEQ ID NO :25的变体,其中至少8个氨基酸与SEQ ID NO 25 的前10个氨基酸在相应位置上相同,c)15到23个氨基酸的SEQ ID NO :25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23个氨基酸的SEQ ID NO :39的变体,其中至少8个氨基酸与SEQ ID NO 39 的前10个氨基酸在相应位置上相同,f)15到23个氨基酸的SEQ ID NO :39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23个氨基酸的SEQ ID NO :44的变体,其中至少8个氨基酸与SEQ ID NO 44 的前10个氨基酸在相应位置上相同,i)15到23个氨基酸的SEQ ID NO 44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23个氨基酸的SEQ ID NO :34的变体,其中至少8个氨基酸与SEQ ID NO 34 的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸, 组成,并且,当所述信号肽是(b)或(c)时,所述感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
9.编码下述信号肽的多核苷酸用于生产感兴趣的重组多肽的用途,所述信号肽选自下组,所述组由a)SEQ ID NO :25,b)15到23个氨基酸的SEQ ID NO :25的变体,其中至少8个氨基酸与SEQ ID NO 25 的前10个氨基酸在相应位置上相同,c)15到23个氨基酸的SEQ ID NO 25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23个氨基酸的SEQ ID NO :39的变体,其中至少8个氨基酸与SEQ ID NO 39 的前10个氨基酸在相应位置上相同,f)15到23个氨基酸的SEQ ID NO :39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23个氨基酸的SEQ ID NO :44的变体,其中至少8个氨基酸与SEQ ID NO 44 的前10个氨基酸在相应位置上相同,i)15到23个氨基酸的SEQ ID NO :44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23个氨基酸的SEQ ID NO :34的变体,其中至少8个氨基酸与SEQ ID NO 34 的前10个氨基酸在相应位置上相同,1)15到23个氨基酸的SEQ ID NO :34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸, 组成,并且当所述信号肽是(b)或(c)时,所述感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
全文摘要
本发明涉及用于生产感兴趣的重组多肽的方法,通过所述方法获得的多肽,重组多核苷酸,表达载体,表达构建体,以及特定信号肽用于生产感兴趣的重组多肽的用途和编码所述特定信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。
文档编号C12P21/02GK102414323SQ201080017888
公开日2012年4月11日 申请日期2010年4月14日 优先权日2009年4月22日
发明者德 彼得·约瑟夫·艾达·沃恩德沃尔特·范, 约翰尼斯·安德列什·劳博斯, 诺埃尔·尼古拉斯·玛丽亚·伊丽莎白·佩吉·范, 阿恩·斯达姆 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1