具有经修饰的前原区域的蛋白酶的制作方法

文档序号:3570839阅读:485来源:国知局
专利名称:具有经修饰的前原区域的蛋白酶的制作方法
技术领域
本发明涉及编码经修饰的蛋白酶的经修饰的多核苷酸,本发明还涉及用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核苷酸包含一个或多个突变,编码具有改变的前原(pre-pro)区域的经修饰的蛋白酶,所述修饰的前原区域增强该活性酶的生产。本发明还涉及用于改变蛋白酶在微生物(例如芽孢杆菌属(Bacillus)物种)中的生产的方法。
背景技术
细菌来源的蛋白酶是重要的工业酶,其占所有酶销售量的大多数,在多种工业(包括洗涤剂、肉嫩化、干酪制造、脱毛、烘焙、酿造、助消化剂的生产、以及从摄影胶片回收银)中被广泛应用。这些酶作为洗涤剂添加剂的应用促进了它们的商业发展, 并导致对这些酶的基础研究的大幅扩增(Germano等,Enzyme Microb. Techno 1. 32 M6-251[2003])。除了作为洗涤剂和食品添加剂,蛋白酶(例如,碱性蛋白酶)在其它工业领域(例如皮革、纺织、有机合成、以及废水处理)中也具有广泛的应用((Kalisz,Adv. Biochem. Eng. Biotechnol. ,36 1-65[1988])禾口(Kumar 禾口 Takagi, Biotechnol. Adv. ,17 561-594[1999]))ο随着对这些工业酶的高要求,具有新颖特性的碱性蛋白酶持续成为研究兴趣的重点,从而导致了具有改良的催化效率和对温度、氧化剂及变化的使用条件具有更佳稳定性的新蛋白酶制剂。然而,酶生产和下游加工的总成本仍然是酶工业中任何技术成功应用所面临的主要障碍。为了解决这个问题,研究人员和工艺工程师采用了几种方法,相对于碱性蛋白酶的工业需求,增加碱性蛋白酶的产量。尽管采用了多种方法(包括筛选高产菌种、克隆和过表达蛋白酶、改进补料分批发酵和恒化器发酵、以及优化发酵技术)来增加蛋白酶的产量,但仍然需要额外的手段来提高蛋白酶的生产。发明概述本发明提供经修饰的多核苷酸,其编码经修饰的蛋白酶;本发明还提供用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核苷酸包含一个或多个突变,编码前原(pre-pro)区域具有修饰的经修饰的蛋白酶,所述前原区域的修饰增强该活性酶的生产。本发明还涉及用于改变蛋白酶在微生物(例如芽孢杆菌属物种)中的生产的方法。在一个实施方案中,本发明提供了编码经修饰的全长蛋白酶的分离的修饰多核苷酸,其中该分离的经修饰的多核苷酸包含编码该全长蛋白酶的前原区域的第一多核苷酸, 该第一多核苷酸有效地连接到编码该全长蛋白酶的成熟区域的第二多核苷酸上,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变而包含至少一个增强该蛋白酶在宿主细胞中的生产的突变。优选地,宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌(Bacillus subtilis)宿主细胞。在一些实施方案中,经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型的或变体的亲本丝氨酸蛋白酶,例如枯草芽孢杆菌(Bacillussubtilis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短小芽孢杆菌(Bacillus pumilis)或地衣芽孢杆菌(Bacillus licheniformis)的丝氨酸蛋白酶。在另一个实施方案中,本发明提供了分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码该全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的蛋白酶生产的突变,第二多核苷酸编码与SEQ ID NO 9的成熟蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。在一些实施方案中,经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型的或变体的亲本丝氨酸蛋白酶,例如枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。优选地,宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。本发明也提供了分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的蛋白酶生产的突变。在一些实施方案中,第一多核苷酸的至少一个突变编码在选自位置 2,3,6,7,8,10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,26,27,28, 29,30,31,32,33,34,35,36,37,38,39,45,46,47,48,49,50,51,52,53,54,55,57,58,59, 61,62,63,64,66,67,68,69,70,72,74,75,76,77,78,80,82,83,84,87,88,89,90,91,93, 96,100和102的一个或多个位置的至少一个氨基酸取代,其中的位置通过与SEQ ID NO 7 所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它实施方案中,该至少一个突变编码至少一个取代,选自:X2F, N,P和Y ;X3A, M,P和R ;X6K和M ;X7E ;I8W ;X10A, C, G,M 禾口 T ;X11A,F 禾口 T ;X12C,P, T ;X13C, G 禾口 S ;X14F ;X15G, M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 禾口 H ;X27A, F, H, P, Τ, V 禾口 Y ;X28V ;X29E, I,R,S 禾口 T ;X30C ;X31H, K, N, S,V 禾口 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 禾口 S ;X36C, D, L, N, S,W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q, S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H,I 禾口 M ;X53D, Ε, M,Q 禾口 T ;X54F,G, H,I 禾口 S ;X55D ; X57E, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F,I 禾Π R ;Χ62Α, F, G, H, N,S,T 禾Π V ; Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 禾口 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 禾口 Y ;Χ78Μ, Q 禾口 V ;X80D, L 禾口 N ; X82C, D, P, Q,S 禾口 T ;X83G 和 N ;Χ84Μ ;X87R ;Χ88Α, D, G,T 禾口 V ;X89V ;X90D 和 Q ;Χ91Α ;Χ92Ε 和S ;X93G, N和S ;X96G, N和T ;X100Q ;以及Χ102Τ,其中的位置通过与SEQ ID NO 7所示 FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它一些实施方案中,该至少一个突变编码至少一个取代,选自:R2F, N,P 和 Y ;S3A, M,P 和 R ;L6K 和 M ;W7E ;I8W ;L10A, C, G, M 禾口 T ;L11A,F 禾口 T ;F12C,P, T ;A13C,G 禾口 S ;L14F ;A15G, M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ; M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, Τ, V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N, S,V 禾口 W ;G32C, F, M, N, P,S 禾口 T ;K33E,F, M, P禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S,W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ; K39A, C,G,I,L, M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C, E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M,Q 禾口 T ;A54F,G, H,I 禾口 S ;K55D ;K57E, N 禾口 R ;D58A, C, E, F, G, K, R, S, T, W ;V59E ;S61A, F,I 禾Π R ;Ε62Α, F, G, H, N, S,T 禾Π V ;Κ63Α,
C,Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C,
D,P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G,T 禾口 V ;L89V ;K90D 禾口 Q ;Κ91Α ;D92E 禾口 S ; P93G,N和S ;A96G,N和T ;E100Q ;以及Η102Τ,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌(Bacillus subtilis)宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶, 其源自野生型的或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型的或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码突变组合, 所述突变组合编码选自以下的取代组合X49A-XMT,X49A-X72D,X49A-X78M,X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, X91A-x24T, X91A-X49A, X91A-X52H, X91A-X72D, X91A-X78M, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M 和 X93S-X78V,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它实施方案中,至少一个突变为突变组合,所述突变组合编码选自以下的取代组合S49A-SMT,S49A-K72D, S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C,P93S-S52H,P93S-K72D,P93S-S78M 和 P93S-S78V,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。 宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码选自以下的至少一个缺失p. X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del, 其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个突变编码选自以下的至少一个缺失P. I18_T19del, p. F22_G23del, p. E37del, p. T47del, p. S49del, p. K55del 和 p. K57del,其中的位置通过与 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶, 其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码选自以下的至少一个插入p. X2_X3insT, p. X30_X3IinsA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG和p. X58_X59insA,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个突变编码选自以下的至少一个插入p. R2_S3insT, p. A30_A3IinsA, p. T19_M20insAT, p. A21_F22insS, p. G32_ K33insG,p. G36_E37insG 和 p. D58_V59insA,其中的位置通过与 SEQ ID NO :7 所示 FNA 蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、 解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO 9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少2个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的至少一个取代和至少一个缺失X46H-p. X47del,X49A_p. X22_X23del,X49C_p. X22_ X23del, X48I-p. X49del,X17ff-p. X18_X19del, X78M_p. X22_X23del, X78V-p. X22_X23del, X78V-p. X57del,X91A_p. X22_X23del,X91A_X48I-pX49del,X91A_p. X57del,X93S_p. X22_ X23del和X93S-X48I-p. X49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个取代和至少一个缺失选自Q46H-p. T47del,S49A_p. F22_G23del,S49C_p. F22_G23del,M48I_p. S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约 65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少2个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的至少一个取代和至少一个插入X49A-p. X2_X3insT, X49A_p32X_X33insG,X49A_p. X19_X20insAT, X49C-p.X19_X20insAT, X49C-p.X32_X33insG, X52H—p. X19_X20insAT, X72D-p.X19_ X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A_p. X32_X33insG, X93S_p. X19_X20insAT 和 X93S_p. X32_X33insG,其中的位置通过与 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个取代和至少一个插入选自S49A-p. R2 S3insT, S49A_p32G_K33insG,S49A_p. T19_ M20insAT, S49C_p. T19_M20insAT, S49C_p. G32_K33insG, S49C_p. T19_M20insAT, S52H—p. T19_M20insAT, K72D_p. T19_M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A-p. T19_M20insAT, K91A-p. G32_K33insG, P93S-p. T19_M20insAT 禾P P93S-p. G32_ K33insG,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID N0:9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO :9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少2个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的至少一个缺失和至少一个插入P. X57del-p. X19_X20insAT 和 p. X22_X23del_p. X2_X3insT, 其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个缺失和至少一个插入选自pK57del-p. T19_M20insAT 和p. F22_G23del-p. R2_S3insT。优选地,第一多核苷酸编码SEQ ID NO 7的前原区域,并被突变以包含至少2个增强宿主细胞的蛋白酶生产的突变。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO 9的成熟蛋白酶。本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少3个增强宿主细胞的蛋白酶生产的突变。第一多核苷酸的该至少3个突变编码相应于 p. X49del-p. X19_X20insAT-X48I的至少一个缺失、至少一个插入和至少一个取代,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,编码至少一个缺失、至少一个插入和至少一个取代的至少3个突变相应于 p. S49del-p. T19_M20insAT-M48I,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与 SEQ ID NO :9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO: 9的成熟蛋白酶。在另一个实施方案中,本发明提供了由以上所描述的任一经修饰的全长多核苷酸编码的多肽。在另一个实施方案中,本发明提供了表达载体,所述表达载体包含以上所描述的任一分离的、经修饰的多核苷酸。在一些实施方案中,表达载体还包含AprE启动子,例如 SEQ ID NO 333 或 SEQ ID NO :445。在另一个实施方案中,本发明提供了芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞,所述宿主细胞包含本发明的表达载体,并能够表达以上所提供的任一经修饰的多核苷酸。优选地,表达载体稳定地整合到宿主的基因组中。在一些实施方案中,本发明的宿主细胞为芽孢杆菌属物种宿主细胞。在一些实施方案中,芽孢杆菌属物种宿主细胞选自枯草芽孢杆菌(B. subtilis)、地衣芽孢杆菌(B. Iicheniformis)、迟缓芽孢杆菌 (B. Ientus)、短芽胞杆菌(B. brevis)、嗜热脂肪芽孢杆菌(B. stearothermophilus)、嗜碱芽孢杆菌(B. alkalophilus)、解淀粉芽孢杆菌(B. amyloliquefaciens)、克劳氏芽孢杆菌 (B. clausii)、耐盐芽孢杆菌(B. halodurans)、巨大芽孢杆菌(B. megaterium)、凝结芽孢杆菌(B. coagulans)、环状芽孢杆菌(B. circulans)、灿烂芽孢杆菌(B. Iautus)和苏云金芽孢杆菌(B. thuringiensis)。在一些实施方案中,芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。在另一个实施方案中,本发明提供了用于在芽孢杆菌属物种宿主细胞中生产成熟蛋白酶的方法,所述方法包括(a)提供包含编码经修饰的全长蛋白酶的分离的、经修饰的多核苷酸的表达载体,其中所述多核苷酸包括第一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编码SEQ ID NO :7的前原区域,并进一步被突变以包含至少一个增强宿主细胞的成熟蛋白酶生产的突变,其中该至少一个突变选自X2F,N,P和Y;X3A,M,P 禾口 R ;X6K 禾口 M ;X7E ; I8W ;X10A,C,G,M 禾口 T ;X11A,F 禾口 T ;X12C,P,T ;X13C,G 禾口 S ;X14F ; X15G, M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 禾口 H ;X27A, F, H, P, T,V 禾口 Y ;X28V ;X29E, I,R,S 禾口 T ;X30C ;X31H, K, N, S, V 禾口 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 和 S ;X36C, D, L, N, S, W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q,S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H,I 禾口 M ;X53D, Ε, M, Q 禾Π T ;X54F,G, H,I 禾Π S ;X55D ;Χ57Ε, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F, I 禾口 R ;Χ62Α, F, G, H, N, S,T 禾口 V ;Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 禾口 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 和 Y ;Χ78Μ, Q 和 V ;X80D, L 和 N ;X82C, D, P, Q,S 和 T ;X83G 和 N ;Χ84Μ ;X87R ;Χ88Α, D, G, T 和 V ;X89V ;X90D 和 Q ;Χ91Α ;Χ92Ε 和 S ;X93G, N 和 S ;X96G, N 和 T ;X100Q ;Χ102Τ ;Χ49Α-Χ24Τ, X49A-X72D, Χ49Α-Χ78Μ, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, Χ91Α_χ24Τ, Χ91Α-Χ49Α, Χ91Α-Χ52Η, X91A-X72D, Χ91Α-Χ78Μ, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M, X93S-X78V,p. X18_X19del,p. X22_23del,pX37del,pX49del,p. X47del,pX55del,p. X57del, p. X2_X3insT, p. X30_X3IinsA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_ X37insG, p.X58_X59insA, X46H-p.X47del, X49A-p. X22_X23del, X49C-p. X22_X23del, X48I-P. X49del,X17ff-p. X18_X19del, X78M-p. X22_X23del, X78V-p. X22_X23del, X78V-p. X57del, X91A-P. X22_X23del,X91A_X48I-pX49del,X91A_p. X57del,X93S_p. X22_X23del, X93S-X48I-p. X49del, X49A_p. X2_X3insT,X49A_p32X_X33insG,X49A_p. X19_X20insAT, X49C-p.X19_X20insAT, X49C-p.X32_X33insG, X52H—p. X19_X20insAT, X72D-p.X19_ X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A_p. X19_X20insAT, X91A-p. X32_X33insG, X93S_p. X19_X20insAT,X93S_p. X32_X33insG, p.X57del_p. X19_X20insAT, p. X22_X23del-p. X2_X3insT,p. X49del-p. X19_X20insAT-X48I,以及 p. X49del_p· X19_ X20insAT-X48I,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号;(b)以表达载体转化宿主细胞;以及(c)在允许成熟蛋白酶生产的合适条件下培养转化了的宿主细胞。在一些实施方案中,所述方法还包括回收成熟蛋白酶。在一些实施方案中,蛋白酶为丝氨酸蛋白酶。在一些实施方案中,芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。在一些实施方案中,经修饰的多核苷酸编码全长蛋白酶,所述全长蛋白酶包含与SEQ ID NO :9至少约65%相同的成熟区域。优选地,第二多核苷酸编码SEQ ID NO 9的成熟蛋白酶。宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。 经修饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌丝氨酸蛋白酶。 在另一个实施方案中,本发明提供了用于在芽孢杆菌属物种宿主细胞中生产成熟蛋白酶的方法,所述方法包括(a)提供表达载体,所述表达载体包含SEQ ID NO :7所示的第一多核苷酸,此第一多核苷酸有效地连接到第二多核苷酸,所述第二多核苷酸编码SEQ ID NO 9的前原区域,其中第一多核苷酸被突变以编码至少一个增强细胞中该成熟蛋白酶生产的突变,其中该至少一个突变选自:R2F,N,P和Y ;S3A,M,P和R ;L6K和M ;W7E ; I8W ;L10A,C,G,M 禾口 T ;L11A,F 禾口 T ;F12C,P,T ;A13C,G 禾口 S ;L14F ;A15G,M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ;M20V ;A21S ;F22E ;G23F,Q 和 W ;S24G,T 和 V ;T25A,D 和 W ;S26C 和 H ;S27A,F,H,P,T,V 和 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H,K,N,S,V 和 W ;G32C,F,M,N,P,S 和 T ;K33E,F,M,P 和 S ;S34D,H,P 和 V ;N35C,Q 禾口 S ;G36C,D,L,N,S,W 和 Y ;E37C,G,K 禾口 Q ;K38F,Q,S 禾口 W ;K39A, C,G,I,L,M,P,S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 和 F ;M48G, I,T,W 禾口 Y ;S49A,C,E 禾口 I ;T50D 和 Y ;M51A和 H ;S52A,H,I 和M ;A53D,E,M,Q和 T ;A54F,G,H,I 和 S ;K55D ;K57E,N和 R ;D58A, C, Ε, F, G, K, R, S, Τ, W ;V59E ;S61A, F,I 和 R ;Ε62Α, F, G, H, N, S,T 和 V ;Κ63Α, C, Ε, F, G, N, Q, R 禾口 T ;64D,M,Q 禾口 S ;K66E ;V67G 和 L ;Q68C, D 和 R ;K69Y ;Q70E, G, K,L,M,P,S 和 V ;K72D 和 N ;V74C 和 Y ;D75G ;A76V ;A77E, V 和 Y ;S78M, Q 和 V ;T80D, L 和 N ;N82C, D, P, Q,S 禾口 T ;E83G 和 N ;K84M ;K87R ;E88A, D, G,T 禾口 V ;L89V ;K90D 和 Q ;K91A ;D92E 和 S ;P93G, N 和 S ;A96G, N 和 T;E100Q ;H102T,S49A-S24T,S49A-K72D,S49A-S78M,S49A-S78V,S49A-P93S,S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H, P93S-K72D, P93S-S78M, P93S-S78V, p.I18_T19del, p. F22_G23del,p. E37del, p.T47del, p.S49del, p.K55del, p. K57del, p. R2_S3insT, p. A30_A31insA, p.T19_M20insAT, p. A21_ F22insS, p.G32_K33insG, p. G36_E37insG, p. D58_V59insA, Q46H-p. T47del, S49A-p. F22_ G23del, S49C_p. F22_G23del,M48I_p. S49del,I17ff-p. I18_T19del, S78M_p. F22_G23del, S78V-p. F22_G23del, K91A_p. F22_G23del,K91A_M48I-pS49del,K91A_p. K57del,P93S_p. F22_G23del, P93S_M48I_p. S49del, S49A_p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_ M20insAT, S49C_p. T19_M20insAT,S49C_p. G32_K33insG,S49C_p. T19_M20insAT,S52H_p. T19_M20insAT, K72D-p. T19_M20insAT, S78M_p. T19_M20insAT,S78V-p. T19_M20insAT, K91A-p.T19_M20insAT, K91A-p. G32_K33insG, P93S-p. T19_M20insAT, P93S-p. G32_ K33insG, pK57del_p. T19_M20insAT, p. F22_G23del_p. R2_S3insT,以及 p. S49del_p. T19_ M20insAT-M48I ; (b)以表达载体转化芽孢杆菌属物种宿主细胞;以及(c)在允许成熟蛋白酶生产的合适条件下培养转化了的宿主细胞。在一些实施方案中,所述方法另外还包括回收成熟蛋白酶。在一些实施方案中,蛋白酶为丝氨酸蛋白酶,并且其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。在一些实施方案中,该至少一个突变增加该成熟蛋白酶的生产。附图简述

图1提供了 SEQ ID NO=I的全长FNA蛋白酶的氨基酸序列。氨基酸1-107 (SEQ ID NO 7)和氨基酸108-382 (SEQ ID NO 9)分别对应于FNA (SEQ ID NO 1)的前原多肽和成熟部分。图2显示了 FNA的未经修饰的前原区域(SEQ ID NO 7)与来自各种芽孢杆菌属物种的蛋白酶的未经修饰的前原区域的氨基酸序列比对。图3显示了 FNA的成熟区域(SEQ ID NO 9)与来自各种芽孢杆菌属物种的蛋白酶的成熟区域的氨基酸序列比对。图4显示了示意图,说明用于产生符合读框的缺失和插入的方法。文库质量33% 没有插入或缺失;33%具有插入和33%具有缺失;没有移码突变。
图5显示了质粒pAC-FNAare的示意图,所述质粒用于在枯草芽孢杆菌 (B. subtilis)中表达FNA蛋白酶。质粒的元件如下pUBllO =来自质粒pUBllO的DNA片段[McKenzie T.,Hoshino T.,Tanaka T.,Sueoka N. (1986)pUB110 的核苷酸序列与复制及其调节相关的一些^ilient特征.Plasmid 15 :93-103],pBR322 =来自质粒pBR322 的 DNA >t g [Bolivar F, Rodriguez RL, Greene PJ, Betlach MC, Heyneker HL, Boyer HW. (1977).新克隆载体的构建和表征.II.多用途克隆系统.Gene 2 :95-113],pC194 =来自质粒 PC194 的 DNA 片段[Horinouchi S.,Weisblum B. (1982)pC194,一种规定可诱导的氯霉素抗性的质粒,的核苷酸序列和功能图谱.J. Bacteriol 150 :815-825]。图6显示了用于在枯草芽孢杆菌中表达FNA蛋白酶的整合型载体 ρJH-FNA(Ferrari 等,J. Bacteriol. 154 1513-1515[1983])的示意图。图7显示了柱形图,描述了相对于相同成熟FNA从未经修饰的全长FNA前体蛋白质(未经修饰的;SEQ ID NO :1)的加工生产,从经修饰的全长FNA蛋白质加工的成熟 FNA(SEQ ID NO 9)的百分比相对活性,其中经修饰的全长FNA蛋白质具有包含氨基酸取代 P93S和缺失p. F22_G23del的突变了的前原多肽(克隆684)。发明描述本发明提供了经修饰的多核苷酸,其编码经修饰的蛋白酶;本发明还提供了用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核苷酸包含一个或多个突变,编码经修饰的蛋白酶,所述经修饰的蛋白酶具有增强该活性酶生产的前原区域修饰。本发明还涉及用于改变在微生物(例如芽孢杆菌属物种)中的蛋白酶生产的方法。除非在本文中另有指明,本文所使用的所有技术和科学术语都具有本发明所属领域的普通技术人员通常理解的含义(例如,Singleton和Minsbury,微生物学和分子生物学i司典(Dictionary of Microbiology and Molecular Biology),第二片反,John Wiley and Sons,NY[1994];以及 Hale 和 Markham,Harper Collins 生物学词典(The Harper Collins Dictionary of Biology),Harper Perennial,NY[1991])。本文描述了优选的方法和材料, 但是与本文描述的方法和材料相似或等同的任何方法和材料都可用于本发明的实施。因此,下文即将定义的术语通过说明书整体而进行更为充分的描述。此外,如本文中使用的, 除非上下文另有清楚指示,否则单数"a"," an"和"the"包括复数指代。数值范围包括界定该范围的数字。除非另有指明,分别地,核酸是按照5'至3'的方向从左到右书写的;氨基酸序列是按照氨基到羧基的方向从左到右书写的。应当理解,本发明并不限于所描述的特定的方法、方案和试剂,这些方法、方案和试剂可以根据本领域技术人员使用它们的背景而变化。在整个说明书中给出的每一个最大数值界限均旨在包括每一个较小的数值界限, 如同在本文中明确书写了该较小的数值界限。在整个本说明书中给出的每一个最小数值界限均包括每一个较大的数值界限,如同在本文中明确书写了该较大的数值界限。在整个说明书中给出的每一个数值范围均包括落入该较宽数值范围以内的每一个较窄的数值范围, 如同在本文中明确书写了所有该较窄的数值范围。本文中(包括上文和下文中)所提到的所有专利、专利申请、文献和出版物都通过引用明确并入本文。此外,本文提供的标题并非是对本发明的各个方面或实施方案的限制,本发明的各个方面或实施方案可以通过参照说明书整体而得出。因此,下文即将定义的术语应通过参考说明书整体而更完整地定义。但是,为了便于理解本发明,对多个术语定义如下。定义如本文中使用的,术语“分离的”和“纯化的”指核酸或氨基酸(或其它组分)从至少一种天然与其相关的组分中分离出。本文中术语“经修饰的多核苷酸”指已经经过改变而包含至少一个突变以编码“经修饰的”蛋白质的多核苷酸序列。如本文中使用的,术语“蛋白酶”和“蛋白水解活性”指显示出能够水解肽或具有肽键的底物的能力的蛋白质或肽。已有很多公知的方法用于测定蛋白质水解活性 (Kalisz, “ Microbial Proteinases “,于 Fiechter (ed. ), Advances in Biochemical Engineering/Biotechnology, [1988])。例如,可以通过分析所产生的蛋白酶水解商业底物之能力的比较试验来确定蛋白水解活性。可用于此类蛋白酶或蛋白水解活性分析中的示例性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛胶原蛋白(Sigma C-9879)、牛弹性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用这些底物进行的比色测定法在是本领域公知的(见例如,WO 99/34011和美国专利号6,376,450,它们都通过引用并入本文)。AAPF 检验(见例如,Del Mar 等,Anal. Biochem.,99 :316-320 [1979])也可用于确定成熟蛋白酶的产生。该检验测量酶水解可溶性合成底物(琥珀酰丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(sAAPF-pNA))时释放对硝基苯胺的速率。在分光光度计上于410nm测量从水解反应产生黄色的速率,其与活性酶浓度成比例。特别地,本文中术语“蛋白酶”指“丝氨酸蛋白酶”。如本文中使用的,术语“枯草杆菌蛋白酶”和“丝氨酸蛋白酶”可互换使用,指 MEROPS-肽酶数据库中描述的S8丝氨酸蛋白酶家族的任何成员(Rawlings等,MEROPS the peptidase database, Nucleic Acids Res, 34Database issue,D270-272, 2006,于网站 merops. sanger. ac. uk/cgi-bin/merops. cgi ? id = s08 ;action = ·)。以下信息得自截止于2008年11月6日的MEROPS-肽酶数据库“肽酶S8家族包含丝氨酸内肽酶和丝氨酸蛋白酶及其同源物”(Biochem J,290 =205-218,1993) 0 S8家族,也被称为枯草杆菌蛋白酶家族,是第二大的丝氨酸肽酶家族,其可被分为2个亚家族,枯草杆菌蛋白酶(S08. 001)为S8A 亚家族的典型例子,kexin(S08. 070)为S8B亚家族的典型例子。三肽基肽酶II (TPP-II ; S08.090)以前被认为是第三亚家族的典型例子,但已经被确定是错误分类。S8家族的成员在序列中具有按Asp,His和kr的顺序的催化三联体,该顺序与Si,S9和SlO家族的不同。 在S8A亚家族中,活性位点残基时常位于基序Asp-ThrAer-Gly (其与AA族(clan)中天冬氨酸内肽酶家族的序列基序类似),His-Gly-Thr-His和Gly-Thr-Ser-Met-Ala-Xaa-Pro 中。在S8B亚家族中,催化残基时常位于基序Asp-Asp-Gly,His-Gly-Thr-Arg和 Gly-Thr-Ser-Ala/Val-Ala/Ser-Pro中。S8家族的大多数成员是内肽酶,其在中性-弱碱性PH值条件下具有活性。该家族中许多肽酶是热稳定的。酪蛋白常被用作蛋白质底物,典型的合成底物为suc-AAPF。该家族的大多数成员为非特异性肽酶,其偏好在疏水残基后进行切割。然而,S8B亚家族的成员,例如kexin (S08. 070)和fur in (S08. 071),在双碱性氨基酸后进行切割。S8家族的大多数成员受一般丝氨酸肽酶抑制剂(例如DFP和PMSF)的抑制。因为该家族的许多成员和钙结合以保持稳定性,故以EDTA和EGTA可以看到抑制,EDTA
15和EGTA常被认为是金属肽酶的特异性抑制剂。蛋白抑制剂包括火鸡卵类粘蛋白第三结构域(101. 003),链霉菌属(Sti^ptomyces)枯草杆菌蛋白酶抑制剂(116. 003),113家族的成员例如eglin C(I13. 001)和大麦抑制剂CI-IA(113. 005),其中的许多抑制剂也抑制胰凝乳蛋白酶(S01.001),枯草杆菌蛋白酶前肽自身具有抑制性,来自酵母属的同源蛋白酶B抑制剂抑制cereviSin(S08. 052)。现已确定了 S8家族几个成员的三级结构。典型的S8蛋白结构由三层(7股β折叠夹在两层螺旋之间)组成。枯草杆菌蛋白酶(S08.001)是SB族 (SB)的典型结构。尽管结构不同,枯草杆菌蛋白酶和胰凝乳蛋白酶(S01.001)的活性位点可以重叠,这说明该相似性是趋同进化而不是趋异进化的结果。本文中的术语“前体蛋白酶”和“亲本蛋白酶”指未经修饰的全长蛋白酶,其包含全长野生型或变体亲本蛋白酶的前原区域和成熟区域。前体蛋白酶可以源自天然存在的 (即野生型)蛋白酶,或源自变体蛋白酶。野生型或变体前体蛋白酶的前原区域被修饰,以产生经修饰的蛋白酶。在本文上下文中,“经修饰的”和“前体”蛋白酶都是包含信号肽、原 (pro)区域和成熟区域的全长蛋白酶。编码经修饰的序列的多核苷酸被称为“经修饰的多核苷酸”,编码前体蛋白酶的多核苷酸被称为“前体多核苷酸”。“前体多肽”和“前体多核苷酸”可分别与称谓“未经修饰的前体多肽”或“未经修饰的前体多核苷酸”互换。本文中“天然存在的”或“野生型”指蛋白酶或编码所述蛋白酶的多核苷酸,其中所述蛋白酶具有与天然存在的氨基酸序列相同的未经修饰的氨基酸序列。天然存在的酶包括天然酶,即在特定微生物中天然表达或存在的那些酶。野生型序列或天然存在的序列是变体所源自的序列。野生型序列可编码同源或异源蛋白质。如本文中使用的,“变体”指通过在C-末端和N-末端中任一或两者添加一个或多个氨基酸、在氨基酸序列的一个或多个不同位点取代一个或多个氨基酸、在蛋白质的任一末端或两个末端或在氨基酸序列中的一个或多个位点缺失一个或多个氨基酸、和/或在氨基酸序列中的一个或多个位点插入一个或多个氨基酸,而与其相应野生型蛋白质不同的蛋白质。在本发明上下文中,通过解淀粉芽孢杆菌(B.amyloliquefaciens)蛋白酶FNA(SEQ ID NO 9)来示例变体蛋白质,它是天然存在的蛋白质BPN’的变体,其与BPN’的不同在于在成熟区域的单个氨基酸取代Y217L。变体蛋白酶包括天然存在的同源物。例如,SEQ ID NO 9的成熟蛋白酶的变体包括图3所示的同源物。术语“源自”和“得自”不仅指由所述及生物的菌株产生的或可产生的蛋白酶,也指由分离自该菌株的DNA序列编码并在含有该DNA序列的宿主生物中生产的蛋白酶。此外, 该术语还指由合成的和/或cDNA来源的DNA序列编码并具有所述及蛋白酶的标识特征的蛋白酶。作为例示,“来自芽孢杆菌的蛋白酶”指由芽孢杆菌天然产生的具有蛋白水解活性的那些酶,也指丝氨酸蛋白酶,如由芽孢杆菌源产生的、通过使用遗传工程技术而从转化了编码所述丝氨酸蛋白酶的核酸的非芽孢杆菌生物产生的那些丝氨酸蛋白酶。“经修饰的全长蛋白酶”或“经修饰的蛋白酶”可互换使用,指包含源自亲本蛋白酶的成熟区域和前原区域的全长蛋白酶,其中前原区域被突变以包含至少一个突变。在一些实施方案中,前原区域和成熟区域源自相同的亲本蛋白酶。在其它实施方案中,前原区域和成熟区域源自不同的亲本蛋白酶。经修饰的蛋白酶包含经修饰以包含至少一个突变的前原区域,它由经修饰的多核苷酸编码。经修饰的蛋白酶的氨基酸序列可以被认为是通过在前体氨基酸序列的前原区域中进行一个或多个氨基酸的取代、缺失或插入而自所述前体蛋白酶氨基酸序列“产生的”。在一些实施方案中,前体蛋白酶的前原区域的一个或多个氨基酸被取代,以产生经修饰的全长蛋白酶。该修饰是对编码“前体”或“亲本”蛋白酶的氨基酸序列的“前体”或“亲本” DNA序列的修饰,而非对前体蛋白酶本身进行的操作。本文中使用的术语“增强”是指突变对成熟蛋白酶的生产的影响,其中来自经修饰的前体的成熟蛋白酶的产量大于相同的成熟蛋白酶自未经修饰的前体加工时的产量。术语“全长蛋白质”在本文中指基因的初级基因产物,其包含信号肽、原序列和成熟序列。例如,SEQ ID NO 1的全长蛋白酶包含信号肽(前区(pre region)) (VRSKKLWISL LFALALIFTM AFGSTSSAQA ;SEQ ID NO :3,由例如 SEQ ID NO :4 的前(pre)多核苷酸编码),原区(pro region) (AGKSNGEKKY IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ FKYVDAASAT LNEKAVKELK KDPSVAYVEE DHVAHAY ;SEQ ID NO :5,由例如前多核苷酸GCAGGGAAATCAAACGGGG AAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAA AAAGGCGGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGA ATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACACGCGTAC :SEQ ID NO :6 编码), 和成熟区域(SEQ ID NO 9)。术语“信号序列”、“信号肽”或“前区”指可参与蛋白质的成熟或前体形式分泌的任何核苷酸和/或氨基酸序列。信号序列的该定义是功能性定义,其意欲包括由蛋白质基因N-末端部分编码的、参与实现蛋白质分泌的所有那些氨基酸序列。例如,本发明的蛋白酶的前肽可以至少包括与SEQ ID NO 1的1-30位残基相同的氨基酸序列。术语“原序列,,或“原区,,是信号序列和成熟蛋白酶之间的氨基酸序列,其对于蛋白酶的分泌/生产来说是必要的。将原序列切割掉将产生成熟活性蛋白酶。例如,本发明的蛋白酶的原区可以至少包括与SEQ ID NO :1的31-107位残基相同的氨基酸序列。术语“前原区域”或“前原多肽”在本文中指蛋白酶的N-末端区域,其包括全长蛋白酶的前区和原区。例如,一个前原区域如SEQ ID NO :7所示,其包括SEQ ID NO :5的原区和SEQ ID NO 3的信号肽(前区)。术语“成熟形式”或“成熟区域”指蛋白质的最终功能性部分。例如,本发明的蛋白酶的成熟形式可以包括与SEQ ID NO 1的108-382位残基相同的氨基酸序列。在本上下文中,“成熟形式” “加工自”全长蛋白酶,其中对全长蛋白酶的加工包括除去信号肽和除去原区。如本文中使用的,“同源蛋白”指细胞中天然的或天然存在的蛋白质或多肽。类似地,“同源多核苷酸”指细胞中天然的或天然存在的多核苷酸。如本文中使用的,术语“异源蛋白”指不在宿主细胞中天然存在的蛋白质或多肽。 类似地,“异源多核苷酸”指不在宿主细胞中天然存在的多核苷酸。异源多肽和/或异源多核苷酸包括嵌合多肽和/或多核苷酸。如本文中使用的,“取代的”和“取代”指对亲本序列中的氨基酸残基或核酸碱基的替换。在一些实施方案中,取代包括对天然存在的残基或碱基的替换。在本文中,经修饰的蛋白酶涵盖在前体蛋白酶的前原区域的任何一个氨基酸残基位上19种天然存在的氨基酸的任何一种的取代。在一些实施方案中,对两个或更多个氨基酸进行取代,以产生包含氨基酸取代组合的经修饰的蛋白酶。在一些实施方案中,取代的组合用发生取代的氨基酸位置来表示。例如,以X49A-X93S表示的组合意思是亲本蛋白质中第49位无论是何种氨基酸(X)都用丙氨酸(A)取代,以及亲本蛋白质中第93位无论是何种氨基酸(X)都用丝氨酸 (S)取代。氨基酸的位置按对应于全长亲本蛋白质中的编号位置给出。如本文中使用的,“缺失”指遗传物质的丢失,其中部分DNA序列失去。尽管可以缺失任何数量的核苷酸,但缺失的核苷酸数目不被3整除将导致移码突变,造成缺失之后的所有密码子在翻译中被错误地阅读,从而产生严重改变的和可能无功能的蛋白质。缺失可以在末端,即对染色体末端发生的缺失;或者缺失可以是中间缺失,即从基因内部发生的缺失。在本文中,缺失以被缺失的氨基酸(一个或多个)和该氨基酸(一个或多个)的位置表示。例如,P. I18del表示第18位的异亮氨酸(I)被缺失;p. I18_T19del表示第18位的异亮氨酸(I)和第19位的苏氨酸(T)都被缺失。可以单独地或与一个或多个取代和/或插入组合地,实施一个或多个氨基酸的缺失。如本文中使用的,“插入”指向DNA中添加数量为3的倍数的核苷酸,以在编码的蛋白质中编码添加的一个或多个氨基酸。在本文中,插入以插入的氨基酸(一个或多个)和该氨基酸(一个或多个)的位置表示。例如,pR2_S3insT表示在第2位精氨酸(R)和第3 位丝氨酸( 之间插入苏氨酸(T)。可以单独地或与一个或多个取代和/或缺失组合地进行一个或多个氨基酸的插入。在提到蛋白酶时,术语“生产/产生”包括对全长蛋白酶的两个加工步骤,包括 1.除去信号肤,这己知在蛋白质分泌期间发生,和2.除去原区,这产生酶的活性成熟形式, 并且已知在成熟过程中发生(Wang等,Biochemistry 37 :3165-3171 (1998) ;Power 等,Proc Natl Acad Sci USA83 :3096-3100(1986)) 如本文中使用的,“与......对应”和“对应于”指,蛋白质或肽中位于所编号位置
上的残基与参考蛋白质或肽中的编号残基等价。在提到成熟蛋白酶时,术语“经加工的”指全长蛋白质(例如蛋白酶)经历以成为活性成熟酶的成熟过程。在本文中,术语“增强的生产”指从经修饰的全长蛋白酶加工的成熟蛋白酶的生产水平高于同样的成熟蛋白酶从未经修饰的全长蛋白酶加工时的生产水平。
当提到酶时,“活性”意指“催化活性”,其包括对酶活性的任何可接受的度量,例如活性速率,活性量,或比活性。催化活性指催化特定化学反应,例如水解特定化学键,的能力。如技术人员将理解的,酶的催化活性只是加快没有酶存在时慢的化学反应的速率。因为酶仅充当催化剂,其本身既不由反应产生,也不被反应消耗。技术人员也将理解,不是所有的多肽都具有催化活性。“比活性”是每单位总蛋白或酶的酶活性的量度。因此,比活性可以用酶的单位重量(例如,每克或每毫克)或单位体积(例如,每毫升)来表示。此外, 例如在活性标准已知或可得以用于进行比较的情况下,比活性可以包括对酶纯度的度量, 或可以提供对纯度的指示。活性量反映了由表达所测定酶的宿主细胞产生的酶量。术语“相对活性”或“产量比”在本文中可互换使用,其指从经修饰的蛋白酶加工得到的成熟蛋白酶的酶活性与从未经修饰的蛋白酶加工得到的成熟蛋白酶的酶活性的比率。产量比通过用从经修饰的前体加工得到的蛋白酶的活性值除以从未经修饰的前体加工得到的同样蛋白酶的活性值来确定。相对活性是以百分比表示的产量比。如本文中使用的,术语“表达”指基于基因的核酸序列产生多肽的过程。此过程包括转录和翻译。
当用来指蛋白质时,术语“嵌合”或“融合”在本文中指通过连接两个或更多个原先编码分开的蛋白质的多核苷酸而产生的蛋白质。该融合多核苷酸的翻译导致单个嵌合多肽,其具有源自于每个原先蛋白质的功能特性。重组融合蛋白质通过重组DNA技术来人工产生。“嵌合多肽”或“嵌合体”意指包含源自一个以上多肽的序列的蛋白质。经修饰的蛋白酶在如下意义上可以是嵌合的,即,其包含源自一个蛋白酶的部分、区域或结构域,其中该部分、区域或结构域融合到源自一个或多个其它蛋白酶的一个或多个部分、区域或结构域上。例如,嵌合蛋白酶可以包含一个成熟蛋白酶的序列,其中该序列与另一个蛋白酶的前原肽的序列连接。技术人员将理解的是,嵌合多肽和蛋白酶不必由蛋白质序列的实际融合构成,而是,具有相应编码序列的多核苷酸也可以用来表达嵌合多肽或蛋白酶。术语“百分比(% )同一性”定义为候选序列中与前体序列(即,亲本序列)的氨基酸/核苷酸残基相同的氨基酸/核苷酸残基的百分比。%氨基酸序列同一性数值通过用匹配的相同残基的数目除以比对区域中“较长”序列的残基的总数来确定。当相对于参考序列,目标序列中氨基酸被取代、缺失或插入时,氨基酸序列可以是相似的而不是“相同的”。对于蛋白质,百分比序列同一性优选在就翻译后修饰而言状态相似的序列之间进行测定。典型地,将目标蛋白酶的“成熟序列”(即,加工以除去信号序列和原区后剩下的序列) 和参考蛋白质的成熟序列进行比较。在其它情况下,可以将目标多肽序列的前体序列和参考序列的前体进行比较。如本文中使用的,术语“启动子”指具有指导下游基因转录的作用的核酸序列。在一些实施方案中,启动子适合于其中将要表达靶基因的宿主细胞。启动子,与其它转录和翻译调控核酸序列(也称为“控制序列”)一起,是表达给定基因所必需的。通常,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、以及增强子或激活物序列。当核酸或多肽被置于与另一核酸或多肽序列发生功能性关系的位置时,其为“有效连接的”。例如,当启动子或增强子影响编码序列的转录时,启动子或增强子与编码序列是有效连接的;当核糖体结合位点被放置在促进翻译的位置上时,它是与编码序列有效连接的;或者,当经修饰的前原区域能够使全长蛋白酶加工以产生酶的成熟活性形式时,它是与蛋白酶的成熟区域有效连接的。通常,“有效连接”意指连接的DNA或多肽序列是毗邻的。“宿主细胞”指可作为包含本发明DNA的表达载体的宿主的合适细胞。合适的宿主细胞可以是天然存在的或野生型宿主细胞,或者其可以是经改造了的宿主细胞。在一个实施方案中,宿主细胞是革兰氏阳性微生物。在一些实施方案中,该术语指芽胞杆菌属细胞。如本文中使用的,“芽孢杆菌属物种”包括本领域技术人员已知的“芽孢杆菌”属中的所有种,其包括但不限于枯草芽孢杆菌(B. subtilis)、地衣芽孢杆菌(B. Iicheniformis)、迟缓芽孢杆菌(B. Ientus)、短芽孢杆菌(B. brevis)、短小芽胞杆菌(B. pumilis)、嗜热脂肪芽孢杆菌(B. stearothermophiIus)、嗜碱芽孢杆菌(B. alkalophilus)、解淀粉芽孢杆菌(B. amyloliquefaciens)、克劳氏芽孢杆菌 (B. clausii)、耐盐芽孢杆菌(B. halodurans)、巨大芽孢杆菌(B. megaterium)、凝结芽孢杆菌(B. coagulans)、环状芽孢杆菌(B. circulans)、灿烂芽孢杆菌(B. Iautus)和苏云金芽孢杆菌(B.thuringiensis)。应当认识到,芽孢杆菌属继续经历分类学重组织。因此,该属旨在包括已经被重新分类的物种,包括但不限于生物例如嗜热脂肪芽孢杆菌(其现在被称为"Geobacillus stearothermophilus”)。在氧存在时产生抗性内生孢子被认为是芽孢杆菌属的定义特征,但该特征也适用于近来命名的脂环酸芽孢杆菌属(Alicyclobacillus)、双芽孢杆菌属(Amphibacillus)、解硫胺素芽孢杆菌属(Aneurinibacillus)、厌氧芽孢杆菌属(Anoxykicillus)、短小芽孢杆菌属(Brevikicillus)、线芽孢杆菌属(FilcAacillus)、 薄壁芽孢杆菌属(Gracilibacillus)、喜盐芽孢杆菌属(HalcAacillus)、类芽孢杆菌属 (Paenibacillus)、盐芽孢杆菌属(&ilibacillus)、嗜热芽孢杆菌属(Thermobacillus)、解脲芽胞杆菌属⑴reikicillus)和枝芽孢杆菌属(Virgikicillus)。术语“多核苷酸”和“核酸”在本文中可互换使用,指任何长度的核苷酸聚合形式。 这些术语包括但不限于,单链DNA、双链DNA、基因组DNA、cDNA或包含嘌呤和嘧啶碱基或其它天然的、经化学修饰的、经生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的非限制性例子包括基因、基因片段、染色体片段、ESTs、外显子、内含子、mRNA、tRNA、 rRNA、核糖体、cDNA、重组多核苷酸、分支的多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。如本文中使用的,术语“DNA构建体”和“转化DNA”可互换使用,表示用于将序列引入宿主细胞或生物中的DNA。DNA构建体可以通过PCR或本领域技术人员已知的任何其它合适技术,在体外产生。在一些实施方案中,DNA构建体包含目的序列(例如,经修饰的序列)。在一些实施方案中,所述序列与另外的元件,例如控制元件(例如启动子等)有效连接。DNA构建体可以进一步包含选择标记。在一些实施方案中,DNA构建体包含与宿主细胞染色体同源的序列。在其它实施方案中,DNA构建体包含非同源序列。一旦DNA构建体被体外装配,其可用于诱变宿主细胞染色体的区域(即,用异源序列替换内源序列)。如本文中使用的,术语“表达盒”指通过重组或合成产生的核酸构建体,其具有允许特定核酸在靶细胞中转录的一系列指定的核酸元件。重组表达盒可以被整合进载体,例如质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括例如待转录的核酸序列和启动子。在一些实施方案中,表达载体具有将异源DNA 片段整合在宿主细胞中和表达的能力。许多原核和真核表达载体可以商业获取。对合适表达载体的选择为本领域技术人员所知。在本文中,术语“表达盒”与“DNA构建体”以及它们的语法等同表述可以互换使用。对合适表达载体的选择为本领域技术人员所知。如本文中使用的,术语“异源DNA序列,,指不在宿主细胞中天然存在的DNA序列。 在一些实施方案中,异源DNA序列为嵌合的DNA序列,其由不同基因的部分(包括调控序列)组成。如本文中使用的,术语“载体”指设计来向一种或多种细胞类型中引入核酸的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体和质粒。在一些实施方案中,多核苷酸构建体包含编码全长蛋白酶(例如,经修饰的蛋白酶或未经修饰的前体蛋白酶)的DNA 序列。如本文中使用的,术语“质粒”指用作克隆载体的环状双链(ds)DNA构建体,其在一些真核生物或原核生物中形成染色体外自主复制遗传元件,或整合到宿主染色体中。如本文中使用的,在向细胞中引入核酸序列的上下文中,术语“引入”指适用于将核酸序列转入细胞的任何方法。用于引入的此类方法包括但不限于原生质体融合、转染、转化、接合和转导(见例如,Ferrari 等,“Genetics”,于Hardwood等(eds.),Bacillus,Plenum Publishing Corp.,页 57-72,[1989])。
如本文中使用的,术语“经转化的”和“稳定转化的”指具有非天然(异源)多核苷酸序列的细胞,所述非天然(异源)多核苷酸序列整合进了所述细胞的基因组中,或为保持至少两代的游离型质粒形式。如本文中使用的,术语“表达”指基于基因的核酸序列产生多肽的过程。该过程包括转录和翻译。经修饰的蛋白酶本发明提供了用于在细菌宿主细胞中生产成熟蛋白酶的方法和组合物。特别地, 本发明提供了用于增强细菌细胞中成熟丝氨酸蛋白酶生产的组合物和方法。本发明的组合物包括编码经修饰的蛋白酶(其在前原区域具有至少一个突变)的经修饰的多核苷酸,由经修饰的多核苷酸编码的经修饰的丝氨酸蛋白酶,包含编码经修饰的丝氨酸蛋白酶的经修饰的多核苷酸的表达盒、DNA构建体、载体,以及转化了本发明载体的细菌宿主细胞。本发明的方法包括用于增强细菌宿主细胞中成熟蛋白酶生产的方法。所产生的蛋白酶可以用于工业生产酶,适用于各种工业,包括但不限于清洁、动物饲料和纺织品加工工业。在一些实施方案中,本发明提供了编码经修饰的全长蛋白酶的经修饰的全长多核苷酸,其通过在源自编码动物、植物或微生物来源的野生型或变体全长前体蛋白酶的多核苷酸的前原多核苷酸中,引入至少一个突变而产生。在一些实施方案中,前体蛋白酶是细菌来源的。在一些实施方案中,前体蛋白酶为包含催化活性氨基酸的枯草杆菌蛋白酶类型的蛋白酶(subtilases, subtilop印tidases,EC 3. 4. 21. 62),也被称为丝氨酸蛋白酶。在一些实施方案中,前体蛋白酶为芽孢杆菌属物种的蛋白酶。优选地,前体蛋白酶为源自枯草芽孢杆菌、解淀粉芽孢杆菌、地衣芽孢杆菌和短小芽孢杆菌的丝氨酸蛋白酶。前体蛋白酶的例子包括枯草杆菌蛋白酶BPN' (SEQ ID N0:67),其源自解淀粉芽孢杆菌,已知于 Vasantha 等(1984),J. Bacteriol. , Volume 159,pp. 811-819,和 J. A. Wells 等(1983) ,Nucleic Acids Research, Volume 11,pp. 7911-7925 ;枯草杆菌蛋白酶 Carlsberg,描述于 Ε. L. Smith 等(1968),J. Biol. Chem.,Volume 243,pp. 2184-2191,禾口 Jacobs 等(1985), Nucl. Acids Res. , Volume 13,pp. 8913-8926,其由地衣芽孢杆菌天然形成;蛋白酶PB92,其由嗜碱芽孢杆菌Bacillus nov. spec. 92天然产生;以及AprE,其由枯草芽孢杆菌天然产生。在一些实施方案中,前体蛋白酶为FNA(SEQ ID NO 1),它是天然存在的 BPN'的变体,其因在成熟区域的第217位具有单个氨基酸的取代而不同于BPN’,其中BPN’ 的第217位的Tyr(Y)被替换为Leu(L),即FNA的成熟区域的第217位氨基酸为L(SEQ ID NO :9)。在一些实施方案中,前体蛋白酶包含和SEQ ID NO :7至少约30%相同的前原区域 (VRSKKLWISL LFALALIFTM AFGSTSSAQA AGKSNGEKKY IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ FKYVDAASAT LNEKAVKELK KDPSVAYVEE DHVAHAY ; SEQ ID NO 7),所述前原区域与 SEQ ID N0: 9 的成熟区域有效连接(AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETN PFQDNNSHGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVI匪SLGGPSGSA ALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSIQSTLP GNKYGALNGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAAAQ ;SEQ ID NO 9).在其它实施方案中,前体蛋白酶包含和SEQ ID NO :7至少约30%相同的前原区域,所述前原区域与和SEQ ID NO :9至少约65%相同的成熟区域有效连接。在其它实施方案中,前体蛋白酶包含SEQ ID NO :7的前原区域,所述前原区域和与SEQ ID NO :9至少约 65%相同的成熟区域有效连接。和SEQ ID NO :7的前原区域至少约30%相同的丝氨酸蛋白酶的前原区域的例子包括SEQ ID NOS :11-66,其显示在图2中。和SEQ ID NO :9至少约 65%相同的成熟区域的例子包括SEQ ID NOS :67-122,其显示在图3中。多核苷酸序列共有的百分比同一性通过如下方式确定利用本领域已知的方法, 比对序列以直接比较分子之间的序列信息,并确定同一性。适用于确定序列相似性的一个算法例子是 BLAST 算法,其被描述于 Altschul 等,J. Mol. Biol.,215 =403-410(1990)中。 用于进行BLAST分析的软件可以通过美国国家生物技术信息中心(National Center for Biotechnology Information)公开获取。该算法包括首先通过在查询序列中鉴定出长度为W的短字,所述短字与数据库序列中同样长度的字比对时匹配或满足一定的正值阈值分数T,以鉴定高得分序列对(HSPs)。以这些初始相邻字命中物作为起点,寻找含有它们的较长的HSI^s。只要累积比对分数可以增加,就让字命中物沿着被比较的两条序列之每条向两个方向延伸。当累积比对分数从获得的最大值降低了数量X ;累积分数趋于零或更低;或者到达了任一序列的末端时,字命中物的延伸停止。BLAST算法参数W、T和X决定了比对的灵敏性和速度。作为默认设置,BLAST程序采用字长(W)为11、BL0SUM62打分矩阵(见 Henikoff 和 Henikoff,Proc. Natl. Acad. Sci. USA 89 10915 (1989))、比对(B)为 50、期望值(E)为10、M' 5、N' -4和两链比较。然后,BLAST算法进行两条序列间相似性的统计学分析(见例如,Karlin和 Altschul,Proc. Nat'1. Acad. Sci. USA 90 :5873-5787 [1993])。BLAST 算法提供的一种相似性量度是最小和概率(P(N)),这指示了两条核苷酸或氨基酸序列间偶然发生匹配的概率。 例如,如果在测试核酸与丝氨酸蛋白酶核酸的比较中最小和概率小于约0. 1,更优选小于约 0. 01,最优选小于约0. 001,则该核酸就被认为与本发明的丝氨酸蛋白酶核酸相似。当测试核酸编码丝氨酸蛋白酶多肽时,如果比较产生了小于约0. 5,更优选小于约0. 2的最小和概率,则认为所述测试核酸与指定的丝氨酸蛋白酶核酸相似。按照如下方式,使用BLAST程序,获得了各种丝氨酸蛋白酶的前原区域(图2)和成熟区域(图3)的氨基酸序列与FNA的前原区域和成熟区域的比对。使用FNA的前原区域或成熟蛋白质区域搜索NCBI非冗余蛋白质数据库(2009年2月9日版)。使用命令行 BLAST程序(2. 2. 17版),其中除了 5000和_b 5000以外,采用默认参数。仅选择具有期望的最终百分比同一性的序列。使用clustalw(1.83版)程序,采用默认参数进行比对。 使用MUSCLE(3. 51版)程序,采用默认参数,对比对进行5次精化。在比对中,仅选择对应于FNA的成熟区域或前原区域的区域。根据与FNA的百分比同一性,按递减的顺序,将比对中的序列进行排序。百分比同一性通过用所述及的两条序列间对齐的相同残基的数量除以在比对中比对的残基数量来计算。在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸包含与编码SEQ ID NO :9所示成熟区域的多核苷酸有效连接的、编码前原区域的前原多核苷酸,其中该前原区域与SEQ ID NO=I(FNA)的前体蛋白酶的前原区域(SEQ ID NO 7)的氨基酸序列具有至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约 55%、至少约60%、至少约65%的氨基酸序列同一性,优选至少约70%的氨基酸序列同一性、更优选至少约75%的氨基酸序列同一性、更优选至少约80%的氨基酸序列同一性、更优选至少约85%的氨基酸序列同一性、甚至更优选至少约90%的氨基酸序列同一性、更优选至少约92%的氨基酸序列同一性、再更优选至少约95%的氨基酸序列同一性、更优选至少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸序列同一性、以及最优选至少约99 %的氨基酸序列同一性。优选地,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸包含与编码SEQ ID NO :9所示成熟区域的多核苷酸有效连接的、编码SEQ ID NO 7 的前原区域的前原多核苷酸。在其它实施方案中,经修饰的多核苷酸从前体多核苷酸产生, 所述前体多核苷酸编码SEQ ID NOS :11-66之任一的前原区域,所述前原区域与编码SEQ ID NO :9中所示的成熟区域的多核苷酸有效连接。编码SEQ ID NO :9的成熟蛋白酶的多核苷酸的一个例子是 SEQ ID NO: 10 的多核苷酸(GCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCC CCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCA TCCTGATTTAAAGGTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACG GAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTT TACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGCGATCGC AAACAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAG CCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTAC CCTGGTAAATACCCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGG ACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGCGCGTTGAACG GTACATCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCCGAACTGGACAAACACT CAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGT ACAGGCGGCAGCTCAGTAA ; SEQ ID NO: 10).如以上所描述,前原区域多核苷酸被进一步修饰以在所编码的多肽的前原区域中引入至少一个突变,以使得该蛋白酶的成熟形式的生产水平,与从未经修饰的多核苷酸加工时相同成熟蛋白酶的生产水平相比较,得到增强。经修饰的前原多核苷酸与成熟多核苷酸有效连接,以编码本发明的经修饰的蛋白酶。在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸包含与编码蛋白酶的成熟区域的多核苷酸有效连接的、编码前原区域的前原多核苷酸,其中所述前原区域与SEQ ID NO :1的前体蛋白酶的前原区域(SEQ ID NO 7)的氨基酸序列具有至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%的氨基酸序列同一性,优选至少约70%的氨基酸序列同一性、更优选至少约75%的氨基酸序列同一性、更优选至少约80%的氨基酸序列同一性、更优选至少约 85%的氨基酸序列同一性、更优选至少约90%的氨基酸序列同一性、更优选至少约92%的氨基酸序列同一性、更优选至少约95%的氨基酸序列同一性、更优选至少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸序列同一性、以及最优选至少约99%的氨基酸序列同一性,其中所述成熟区域和SEQ ID NO 1的前体蛋白酶的成熟区域(SEQ ID NO 9)的氨基酸序列具有至少约65%的氨基酸序列同一性,优选至少约70%的氨基酸序列同一性、 更优选至少约75%的氨基酸序列同一性、更优选至少约80%的氨基酸序列同一性、更优选至少约85%的氨基酸序列同一性、更优选至少约90%的氨基酸序列同一性、更优选至少约 92%的氨基酸序列同一性、更优选至少约95%的氨基酸序列同一性、更优选至少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸序列同一性、以及最优选至少约99%的氨基酸序列同一性。在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸编码与蛋白酶的成熟区域有效连接的SEQ ID NO :1的蛋白酶的前原区域(SEQ ID NO 7), 其中所述成熟区域和SEQ ID NO :1的前体蛋白酶的成熟形式(SEQ ID NO :9)的氨基酸序列具有至少约65%的氨基酸序列同一性,优选至少约70%的氨基酸序列同一性、更优选至少约75%的氨基酸序列同一性、更优选至少约80%的氨基酸序列同一性、更优选至少约85% 的氨基酸序列同一性、更优选至少90%的氨基酸序列同一性、更优选至少约92%的氨基酸序列同一性、更优选至少约95%的氨基酸序列同一性、更优选至少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸序列同一性、以及最优选至少约99%的氨基酸序列同一性。在其它实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸编码SEQ ID NO 1的蛋白酶的前原区域(SEQ ID NO :7),所述前原区域与SEQ ID NO 1的蛋白酶的成熟区域(SEQ ID NO 9)有效连接,即,前体多核苷酸编码SEQ ID NO :1的蛋白酶。如以上所描述,前原区域多核苷酸被修饰以引入至少一个突变,该突变使该蛋白酶的成熟形式的生产水平,与从未经修饰的多核苷酸加工时相同成熟蛋白酶的生产水平相比,得到增强。前体多核苷酸被突变以产生本发明的经修饰的多核苷酸。在一些实施方案中,编码前原区域的前体多核苷酸序列的部分被突变,以在选自位置1-107的至少一个氨基酸位置上编码至少一个突变,其中的位置通过与SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。因此,在一些实施方案中,本发明的经修饰的全长多核苷酸在选自位置 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26, 27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51, 52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76, 77,78,79,80,81,82,83,84,85,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100, 101,102,103,104,105,106和107的至少一个氨基酸位置上包含至少一个突变,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它实施方案中,经修饰的全长多核苷酸在氨基酸位置2,3,6, 7,8,10,11,12, 13,14,15,16,17,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38, 39,45,46,47,48,49,50,51,52,53,54,55,57,58,59,61,62,63,64,66,67,68,69,70,72, 74,75,76,77,78,80,82,83,84,87,88,89,90,91,93,96,100 和 102 上包含至少一个突变, 其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一个突变为取代,选自以下取代X2F, N,P,禾口 Y ;X3A, M,P,禾口 R ;X6K,禾口 M ;X7E ; 18W ;X10A, C, G, M,禾口 T ;Xl 1A, F,禾口 T ;X12C,P,T ;X13C,G,和 S ;X14F ;X15G,M,T,和 V ;X16V ;X17S ;X19P,和 S ;X20V ;X21S ;X22E ; X23F, Q,和 W ;X24G, T 和 V ;X25A, D,禾口 W ;X26C,和 H ;X27A, F,H,P,T,V,和 Y ;X28V ;X29E, I, R, S,和 T ;X30C ;X31H, K, N, S, V,和 W ;X32C, F, M, N, P, S,和 V ;X33E, F, M, P,和 S ;X34D, H, P,禾口 V ;X35C, Q,禾口 S ;X36C, D, L, N, S, W,禾口 Y ;X37C, G, K,禾口 Q ;X38F, Q, S,禾口 W ;X39A, C, G, I, L, M, P, S, T,禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W,禾口 Y ;X49A, C,E 禾口 I ;X50D,和 Y ;X51A 和 H ;X52A,H,I,禾口 M ;X53D,E,M,Q,禾口 T ;X54F, G, H, I,禾口 S ;X55D ;X57E,N,禾口 R ; X58A, C, E, F, G, K, R, S, T, W ;X59E ;X61A, F, I,禾口 R ;X62A, F, G, H, N, S,T 禾口 V ;X63A, C, E, F, G, N, Q, R,和 T ;G64D, M, Q,和 S ;X66E ;X67G 和 L ;X68C, D,和 R ;X69Y ;X70E, G, K, L, M, P, S,和 V ;X72D 和 N ;X74C 和 Y ;X75G ;X76V ;X77E,V,和 Y ;X78M, Q 和 V ;X80D, L,和 N ;X82C,D, P, Q, S,和 T ;X83G,和 N ;X84M ;X87R ;X88A, D, G, T,和 V ;X89V ;X90D 和 Q ;X91A ;X92E 和 S ; X93G, N,禾口 S ;X96G, N,禾口 T ;X100Q ;禾口 X102T,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它实施方案中,至少一个突变为取代组合,选自X49A-XMT,X49A-X72D, X49A-X78M, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, X91A_x24T, X91A-X49A, X91A-X52H, X91A-X72D, X91A-X78M, X91A-X78V, X93S-X24T, X93S-X49C,X93S-X52H,X93S-X72D,X93S-X78M,和 X93S-X78V,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变编码至少一个缺失,选自p.X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变编码至少一个插入,选自p. X2_X3insT,p. X30_ X31insA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG 和 p.X58_ )(59insA,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变编码至少一个取代和至少一个缺失,选自 X46H-p. X47del、X49A_p. X22_X23del、x49C_p. X22_X23del、X48I_p. X49del、X17ff-p. X18_ X19del、X78M-p. X22_X23del、X78V-p. X22_X23del、X78V-p. X57del、X91A_p. X22_X23del、 X91A-X48I-pX49del、X91A-p. X57del、X93S_p. X22_X23del、和 X93S_X48I_p. X49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变编码至少一个取代和至少一个插入,选自 X49A-P. X2_X3insT, X49A_p32X_X33insG,Χ49Α_ρ· X19_X20insAT,X49C_p. X19_X20insAT, X49C-p. X32_X33insG, X52H—p. X19_X20insAT, X72D-p. X19_X20insAT, X78M-p.X19_ X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A-p. X32_X33insG, X93S_p. X19_X20insAT和X93S-p. X32_X33insG,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变为编码至少一个缺失和至少一个插入的至少2 个突变,选自P. X57del-p. X19_X20insAT 和 p. X22_X23del_p. X2_X3insT,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,至少一个突变为相应于p. S49del-p. T19_M20insAT_M48I的编码至少一个缺失、一个插入和一个取代的至少3个突变,其中的位置通过与SEQ ID NO 7 所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体多核苷酸编码SEQ ID NO :1的全长FNA蛋白酶。在一些实施方案中,编码SEQ ID NO 1的全长FNA蛋白酶的前体多核苷酸是SEQ ID NO 2的多核苷酸。经修饰的全长多核苷酸通过在前体多核苷酸(SEQ ID NO 2)的前原区域(SEQ ID NO 4)中引入至少一个突变,从SEQ ID NO :2的前体多核苷酸产生。在一些实施方案中,至少一个突变是至少一个取代,选自:R2F, N,P 和 Y ;S3A, M,P 和 R ;L6K 和 M ;W7E ;I8W ;L10A, C, G, M 禾口 T ;L11A,F 禾口 T ;F12C,P, T ;A13C,G 禾口 S ;L14F ;A15G, M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ; M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, Τ, V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N, S,V 禾口 W ;G32C, F, M, N, P,S 禾口 T ;K33E,F, M, P 禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S,W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ; K39A, C,G,I,L,M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C, E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M,Q 禾口 T ;A54F,G, H,I 禾口 S ;K55D ;K57E, N 禾口 R ;D58A, C, E, F, G, K, R, S, T, W ;V59E ;S61A, F,I 禾Π R ;Ε62Α, F, G, H, N, S,T 禾Π V ;Κ63Α,
C,Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C,
D,P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G,T 禾口 V ;L89V ;K90D 禾口 Q ;Κ91Α ;D92E 禾口 S ; P93G,N和S ;A96G,N和T ;E100Q ;以及Η102Τ,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的取代组合的至少一个突变组合 S49A-S24T, S49A-K72D, S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H, P93S-K72D, P93S-S78M和P93S-S78V,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的至少一个缺失的至少一个突变p. 118_ T19del, p. F22_G23del, p. E37del, p. T47del466, p. S49del, p. K55del 和 p. K57del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的至少一个插入的至少一个突变p. R2_ S3insT, p. A30_A3IinsA, p. T19_M20insAT, p. A21_F22insS, p. G32_K33insG, p. G36_E37insG 和p. D58_V59insA,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个取代和至少一个缺失的至少2个突变,选自Q46H-p. T47del,S49A_p. F22_G23del,S49C-p. F22_G23del, M48I_p. S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个取代和至少一个插入的至少2个突变,选自 S49A-p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_M20insAT, S49C_p. T19_M20insAT, S49C-p. G32_K33insG, S49C-p. T19_M20insAT, S52H—p. T19_M20insAT, K72D-p.T19_M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A_p. T19_M20insAT, K91A-p. G32_K33insG, P93S_p. T19_M20insAT 和 P93S_p. G32_K33insG,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码缺失和插入的至少2个突变,选自pK57del-p. T19_ M20insAT 和 p. F22_G23del_p. R2_S3insT,其中的位置通过与 SEQ ID NO :7 所示 FNA 蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个缺失、一个插入和一个取代的至少3个突变, 其对应于P. S49del-p. T19_M20insAT-M48I,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。本发明前体蛋白酶前原区域的修饰包括至少一个取代、至少一个缺失或至少一个插入。在一些实施方案中,前原区域的修饰包括突变的组合。例如,前原区域的修饰包括至少一个取代和至少一个缺失的组合。在其它实施方案中,前原区域的修饰包括至少一个取代和至少一个插入的组合。在其它实施方案中,前原区域的修饰包括至少一个缺失和至少一个插入的组合。在其它实施方案中,前原区域的修饰包括至少一个取代、至少一个缺失和至少一个插入的组合。本领域已知若干方法适于产生本发明的经修饰的多核苷酸序列,其包括但不限于位点饱和诱变、扫描诱变、插入诱变、缺失诱变、随机诱变、位点定向诱变和定向进化以及多种其它重组方法。常用的方法包括DNA改组(Stemmer WP, Proc Natl Acad Sci U S A. 25 ;91 (22) :10747-51 [1994]),基于基因的非同源重组的方法,例如ITCHY (Ostermeier 等,Bioorg Med Chem. 7(10) :2139-44[1999])、SCRACHY(Lutz 等,Proc Natl Acad Sci U S A. 98(20) :11248-53[2001])、SHIPREC (Sieber 等,Nat Biotechnol. 19(5) :456-60 [2001]) 和 NRR(Bittker 等,Nat Biotechnol. 20(10) :1024-9 [2001] ;Bittker 等,Proc Natl Acad Sci U S A. 101(18) :7011-6[2004]),以及依赖于使用寡核苷酸插入随机和靶向的突变、 缺失和 / 或插入的方法(Ness 等,Nat Biotechnol. 20(12) 1251-5[2002] ;Coco 等,Nat Biotechnol. 20(12) 1246-50[2002] ;Zha 等,Chembiochem. 3 ;4(1) :34_9[2003] ;Glaser 等,J Immunol. 149(12) :3903-13 [1992] ;Sondek 和 Shortle,Proc Natl Acad Sci U S A 89(8) :3581-5 [1992] ;Yafiez等,Nucleic Acids Res. 32(20) :el58[2004] ;Osuna 等, Nucleic Acids Res. 32(17) :el36[2004] ;Gaytcin等,NucleicAcids Res. 29(3) :E9[2001]; 以及 GayWn 等,Nucleic Acids Res. 30(16) :e84[2002])。在一些实施方案中,将全长亲本多核苷酸连接到合适的表达质粒上,可以使用以下诱变方法以利于本发明经修饰的蛋白酶的构建,但也可以使用其它方法。所述诱变方法基于 Pisarchik 等(Protein engineering,Design and Selection20 :257-265 [2007])的描述,具有额外的优点,即本文中使用的限制性内切酶在其识别序列外进行切割,这使得可以对几乎任何核苷酸序列进行消化并防止限制性内切位点疤痕的形成。首先,如本文中所描述,获得天然存在的、编码全长蛋白酶的基因,并对其全部或部分进行测序。随后,对前原序列进行扫描,以确定期望在编码的前原区域中进行一个或多个氨基酸的突变(缺失、插入、取代,或它们的组合)的点。可以按照公知的方法,通过引物延伸,进行基因突变,以便改变基因的序列以使其符合期望序列。以PCR扩增期望的突变位点(一个或多个)的左边和右边片段,使其包含Eaml 1041限制性位点。以Eaml 1041消化左边和右边片段,以产生多个具有互补的3碱基突出端的片段,然后将这些片段混合并连接,以产生包含一个或多个突变的经修饰的前原序列的文库。该方法图示于图2。该方法避免了移码突变的发生。此外,该方法简化了诱变过程,因为可以合成所有的寡核苷酸以具有相同的限制性位点,而不需要如一些其他方法所必须的那样利用合成接头来产生限制性位点。如上所示,在一些实施方案中,本发明提供了包含上述多核苷酸的载体。在一些实施方案中,载体为表达载体,其中编码本发明的经修饰的蛋白酶的经修饰的多核苷酸序列与基因高效表达所需的额外片段有效连接(例如,启动子有效连接到该目的基因)。在一些实施方案中,提供的这些必需元件是基因自身的同源启动子(如果其能被识别的话,即,被宿主转录)、和外源的或由蛋白酶基因的内源终止子区域提供的转录终止子。在一些实施方案中,也包括选择基因,例如抗生素抗性基因,所述抗生素抗性基因使得可以通过在含杀微生物剂的培养基中生长来持续培养维持被质粒感染了的宿主细胞。在一些实施方案中,表达载体源自质粒或病毒DNA,或者,在可选择的实施方案中,表达载体包含两者的元件。示例性载体包括但不限于pXX,PC194,pJHIOl, pE194, pHP13 (Harwood 禾口 Cutting (编辑),MolecularBioloRical Methods for Bacillus, John ffiley&Sons, [1990],详见第3章;适用于枯草芽孢杆菌的复制型质粒包括第92页所列的那些;Perego,Μ. (1993),用于在枯草芽孢杆菌中进行遗传操作的整合型载体,p. 615-624 ; A. L. Sonenshein, J. A. Hoch,和R. Losick (ed.),枯草芽孢杆菌以及其它革兰氏阳性细菌 生物化学、生理学禾口分子遗传学,American Society for Microbiology, Washington, D. C.)。为了在细胞中表达和生产目的蛋白质(例如,蛋白酶),将包含至少一个拷贝(优选包含多个拷贝)的编码经修饰蛋白酶的多核苷酸的至少一个表达载体,在合适蛋白酶表达的条件下转化到细胞中。在一些特定实施方案中,编码蛋白酶的序列(以及载体中所包含的其它序列)被整合进宿主细胞的基因组中,而在其它实施方案中,质粒在细胞中作为染色体外自主元件维持。由此,本发明既提供染色体外元件,也提供整合进宿主细胞基因组中的进入序列(incoming sequence)。在一些实施方案中,可以用复制型载体构建包含本文中所描述的多核苷酸的载体 (例如,pAC-FNA;见图5)。本文中所描述的每一个载体均旨在用于本发明。在一些实施方案中,构建体存在于整合型载体上(例如,PJH-FNA ;图6),该载体使得经修饰的多核苷酸可以整合到细菌染色体中并任选地扩增。整合位点的例子包括但不限于aprE,amyE, veg或 pps区域。事实上,可以考虑的是,在本发明中也可以使用本领域技术人员所知的其它位点。 在一些实施方案中,启动子是所选择的前体蛋白酶的野生型启动子。在一些其它实施方案中,启动子是与前体蛋白酶异源的,但其在宿主细胞中是起作用的。特别地,用于细菌宿主细胞的合适启动子的例子包括但不限于pSPAC、pAprE、pAmyE、pVeg、pHpaII启动子,嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因、解淀粉芽孢杆菌(BAN)淀粉酶基因、枯草芽孢杆菌碱性蛋白酶基因、克劳氏芽孢杆菌碱性蛋白酶基因、短小芽孢杆菌木糖苷酶基因、苏云金芽孢杆菌cryIIIA基因、以及地衣芽孢杆菌α-淀粉酶基因的启动子。在一些实施方案中,启动子具有SEQ ID NO :333中所示的序列。在其它实施方案中,启动子具有SEQ ID NO :445中所示的序列。另外的启动子包括但不限于A4启动子,以及λ噬菌体&或1\启动子和大肠杆菌lac、trp或tac启动子。可以在任何合适的革兰氏阳性微生物宿主细胞(包括细菌和真菌)中生产前体和经修饰的蛋白酶。例如,在一些实施方案中,在真菌和/或细菌来源的宿主细胞中生产经修饰的蛋白酶。在一些实施方案中,宿主细胞是芽孢杆菌属物种、链霉菌属物种、埃希氏杆菌属物种(Escherichia sp.)或曲霉属物种(Aspergillus sp.)。在一些实施方案中,经修饰的蛋白酶由芽孢杆菌属物种宿主细胞生产。可以用于生产本发明经修饰的蛋白质的芽孢杆菌属物种宿主细胞的例子包括但不限于地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、迟缓芽孢杆菌、短芽胞杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌、克劳氏芽孢杆菌、巨大芽孢杆菌以及芽孢杆菌属中其它微生物。在一些实施方案中,使用芽孢杆菌宿主细胞。美国专利5,264, 366 和4,760,025(RE 34,606)中描述了各种可以用于本发明的芽孢杆菌宿主菌株,但在本发明中也可以使用其它合适的菌株。几种工业菌株也可以用于本发明,包括非重组(即,野生型)芽孢杆菌属物种菌株、以及天然存在的菌株的变体和/或重组菌株。在一些实施方案中,宿主菌株是重组菌株,其中编码目的多肽的多核苷酸已经被引入到该宿主中。在一些实施方案中,宿主菌株是枯草芽孢杆菌宿主菌株,特别是重组枯草芽孢杆菌宿主菌株。现已知许多枯草芽孢杆菌菌株,其包括但不限于 1A6 (ATCC 39085),168 (1A01),SB19, W23, Ts85, B637, PB1753 至 PB1758, PB3360, JH642,1A243(ATCC 39,087), ATCC 21332, ATCC 6051, MI113, DE100 (ATCC 39,094),GX4931,PBT 110 和 PEP 211 菌株(见例如,Hoch 等,Genetics,73 215-228[1973])(也见美国专利号 4,450,235 ;美国专利号 4,302,544 ;和 EP 0134048 ;每一项均就其全部内容通过引用并入本文)。使用枯草芽孢杆菌作为表达宿主在本领域中公知(见例如,Palva 等,Gene 19 :81_87[1982] ;Fahnestock 和 Fischer,J. Bacteriol.,165 796-804 [1986];以及 Wang 等,Gene 69 39-47 [1988]) 在一些实施方案中,芽孢杆菌宿主是在基因degU,degS, degR和degQ之至少一个中包含突变或缺失的芽孢杆菌属物种。优选地,突变在degU基因中,更优选地,突变是 degU (Hy) 32 (见例如,Msadek 等,J. Bacteriol.,172 :824-834 [1990];和 Olmos 等, Mol. Gen. Genet.,253 :562-567 [1997])。优选的宿主菌株是携带 degU32 (Hy)突变的枯草芽孢杆菌。在另外一些的实施方案中,芽孢杆菌宿主包含在scoC4(见例如,Caldwell 等,J. Bacteriol.,183 :7329-7340 [2001]), spoIIE(见,Arigoni 等,Mol. Microbiol., 31 :1407-1415[1999])、和/或oppA或opp操纵子的其它基因(见例如,Perego等,Mol. Microbiol. ,5 173-185[1991])中的突变或缺失。事实上,可以考虑,将与oppA基因中突变导致相同表型的opp操纵子中的任何突变,用于本发明的改变的芽孢杆菌菌株的一些实施方案中。在一些实施方案中,这些突变单独存在,而在其它一些实施方案中,存在突变的组合。在一些实施方案中,可用于生产本发明的经修饰蛋白酶的改变了的芽孢杆菌是已经在一种或多种上述基因中包括突变的芽孢杆菌宿主菌株。此外,可以使用包含内源蛋白酶基因的突变和/或缺失的芽孢杆菌属物种宿主细胞。在一些实施方案中,芽孢杆菌宿主细胞包括aprE和nprE基因的缺失。在其它实施方案中,芽孢杆菌属物种宿主细胞包含5个蛋白酶基因的缺失(US20050202535),而在其它实施方案中,芽孢杆菌属物种宿主细胞包含9个蛋白酶基因的缺失(US20050202535)。可以使用本领域已知的任何合适方法,以编码本发明的经修饰的蛋白酶的经修饰的多核苷酸来转化宿主细胞。无论是将经修饰的多核苷酸整合到载体中还是在没有质粒 DNA存在的情况下使用,所述经修饰的核苷酸均可以被引入到微生物中,在一些实施方案中,优选大肠杆菌细胞或感受态芽孢杆菌细胞。涉及质粒构建体和质粒向大肠杆菌中的转化的、用于将DNA引入芽孢杆菌细胞中的方法是公知的。在一些实施方案中,随后从大肠杆菌中分离质粒,并将其转化到芽孢杆菌中。但是,使用居间微生物例如大肠杆菌并不是必须的,在一些实施方案中,DNA构建体或载体被直接引入到芽孢杆菌宿主中。本领域技术人员熟知用于将多核苷酸序列引入到芽孢杆菌细胞中的合适方法 (见例如,Ferrari 等,"Genetics,,,于 Harwood 等(ed. ), Bacillus, Plenum Publishing Corp. [1989],57-72 页中;Saunders 等,J. Bacteriol.,157 :718-726 [1984] ;Hoch 等, J. Bacteriol. ,93 1925-1937[1967] ;Mann 等,Current Microbiol. ,13 131-135[1986]; Holubova, Folia Microbiol. , 30 97 [1985] ;Chang 等,Mol. Gen. Genet. , 168 11-115 [1979] ;Vorobjeva 等,FEMS Microbiol. Lett. ,7 :261-263 [1980] ;Smith 等,Appl. Env. Microbiol. ,51 634[1986] ;Fisher 等,Arch. Microbiol.,139 :213-217[1981];以及McDonald,J. Gen. Microbiol.,130 :203 [1984])。事实上,诸如转化,包括原生质体转化和congression、转导和原生质体融合等方法是已知的并适用于本发明。可以使用转化的方法,将本发明提供的DNA构建体引入到宿主细胞中。本领域中已知用于转化芽孢杆菌的方法包括质粒标记挽救转化等方法,其涉及由携带有部分同源的居民质粒的感受态细胞摄入供体质粒(Contente 等,Plasmid 2 :555-571 [1979] ;Haima 等,Mol. Gen. Genet.,223 185-191 [1990] ;Weinrauch 等,J. Bacteriol.,154 1077-1087 [1983];以及 Weinrauch 等, J. Bacteriol.,169 :1205-1211 [1987])。在该方法中,进入供体质粒在模拟染色体转化的过程中与居民“辅助”质粒的同源区域重组。除了通常使用的方法之外,在一些实施方案中,可以直接转化宿主细胞(即,在引入到宿主细胞之前,不用居间细胞来扩增或加工DNA构建体)。将DNA构建体引入宿主细胞包括本领域已知用来将DNA引入宿主细胞而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另一些实施方案中, 将DNA构建体与质粒共转化,而不插入到质粒中。在另外一些实施方案中,通过本领域已知的方法,将选择性标记从经改变的芽孢杆菌菌株中除去(见,Stahl等,J. Bacteriol.,158 411-418[1984];和 Palmeros 等,Gene 247 :255-264[2000])。在一些实施方案中,在常规营养培养基中培养本发明的经转化了的细胞。合适的具体培养条件,例如温度、PH等,为本领域技术人员熟知。此外,一些培养条件可以自科学文献例如 Hopwood(2000)PracticalStreptomyces Genetics, John Innes Foundation, Norwich UK ;Hardwood 等(1990)Molecular Biological Methods for Bacillus, John Wiley,以及自美国典型培养物保藏中心(American Type Culture Collection,ATCC)找到。在一些实施方案中,在允许表达和生产本发明蛋白酶的条件下,于合适的营养培养基中培养转化了编码经修饰蛋白酶的多核苷酸序列的宿主细胞,之后从培养物中回收所得到的蛋白酶。用于培养细胞的培养基包括适于宿主细胞生长的任何常规培养基,例如基本培养基或含有合适补充物的复杂培养基。合适的培养基可从商业供应者获得,或者可以按照公开的配方(例如,在American Type Culture Collection的目录中)来制备。在一些实施方案中,通过常规方法从细胞培养基中回收细胞生产的蛋白酶,所述方法包括但不限于通过离心或过滤从培养基中分离宿主细胞、通过盐(例如,硫酸铵)来沉淀上清液或滤液的蛋白质性组分、层析纯化(例如,离子交换、凝胶过滤、亲和层析等)。因此,适于回收本发明蛋白酶的任何方法都可用于本发明。事实上,本发明不受任何特定纯化方法的限制。包含本发明的经修饰蛋白酶的重组宿主细胞生产的蛋白质可以被分泌到培养基中。在一些实施方案中,其它重组构建体将该异源或同源多核苷酸序列连接至编码蛋白酶多肽结构域的核苷酸序列,以方便可溶蛋白的纯化(Kroll DJ等(1993)DNA Cell Biol 12 :441-53)。此类协助纯化的结构域包括但不限于金属螯合肽,例如,允许在固定化的金属上进行纯化的组氨酸-色氨酸模块(Porath J (1992) Protein Expr Purif3 :263-281), 允许在固定化的免疫球蛋白上进行纯化的A蛋白结构域、以及用于FLAGS延伸/亲和纯化系统的结构域(Immimex Corp, Seattle WA)。将可切割的接头序列,例如因子XA或肠激酶 (Invitrogen, San Diego CA)纳入纯化结构域和异源蛋白之间也可用于促进纯化。如上所述,本发明提供了编码经修饰的全长蛋白酶的经修饰的全长多核苷酸,所述经修饰的全长蛋白酶被芽孢杆菌宿主细胞加工以产生成熟形式,该生产水平高于由在相同条件下生长的芽孢杆菌宿主细胞从未经修饰的全长酶加工相同成熟蛋白酶时的生产水平。该生产水平可以通过所分泌的酶的活性水平确定。生产增强的一种量度可以以相对活性来测量,这可表示为从经修饰的蛋白酶加工的成熟形式的酶促活性值与从未经修饰的前体蛋白酶加工的成熟形式的酶促活性值的比值百分数。等于或高于100%的相对活性表明,从经修饰的前体加工时蛋白酶成熟形式的生产水平等于或高于从未经修饰的前体加工时同样的成熟蛋白酶的生产水平。由此,在一些实施方案中,与从未经修饰的前体蛋白酶加工的蛋白酶成熟形式的相应生产相比,从经修饰的蛋白酶加工的成熟蛋白酶的相对活性是至少约100%、至少约110%、至少约120%、 至少约130%、至少约140%、至少约150%、至少约160%、至少约170%、至少约180%、至少约190%、至少约200%、至少约225%、至少约250%、至少约275%、至少约300%、至少约325%、至少约350%、至少约375%、至少约400%、至少约425%、至少约450%、至少约475%、至少约500%、至少约525%、至少约550%、至少约575%、至少约600%、至少约625%、至少约650%、至少约675%、至少约700%、至少约725%、至少约750%、至少约800%、至少约825%、至少约850%、至少约875%、至少约850%、至少约875%、至少约 900 %、以及高达至少约1000 %或更高。可选地,相对活性可表示为产量比,其通过用从经修饰的前体加工的蛋白酶的活性值除以从未经修饰的前体加工的相同蛋白酶的活性值来测量。由此,在一些实施方案中,从经修饰的前体加工的成熟蛋白酶的产量比为至少约1、至少约1. 1、至少约1. 2、至少约1. 3、至少约1. 4、至少约1. 5、至少约1. 6、至少约1. 7、至少约 1. 8、至少约1. 9、至少约2、至少约2. 25、至少约2. 5、至少约2. 75、至少约3、至少约3. 25、 至少约3. 5、至少约3. 75、至少约4. 0、至少约4. 25、至少约4. 5、至少约4. 75、至少约5、至少约5. 25、至少约5. 5、至少约5. 75、至少约6、至少约6. 25、至少约6. 5、至少约6. 75、至少约7、至少约7. 25、至少约7. 5、至少约8、至少约8. 25、至少约8. 5、至少约8. 75、至少约9、 以及高达至少约10。
本领域技术人员已知用于检测和测量蛋白酶活性的多种测定法。特别是,可获得用于测量蛋白酶活性的如下测定法,所述测定法基于酸可溶性肽从酪蛋白或血红蛋白的释放,该释放可以使用Folin方法通过^Onm处吸光度或比色法来进行测量(见例如,Bergmeyer 等,"Methods of Enzymatic Analysis^ vol. 5, Peptidases, Proteinases and their Inhibitors, Verlag Chemie, ffeinheim[1984]) 一些其它测定法涉及生色底物的溶解(JAL 例如,Ward, "Proteinases,,,in Fogarty (ed. ). ,Microbial Enzymes andBiotechnology,Applied Science,London, [1983],pp 251-317)。其它示例性测定法包括但不限于琥珀酰-Ala-Ala-Pro-Phe-对硝基酰苯胺测定法(SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐测定法(TNBS测定法)。本领域技术人员已知的许多其它参考文献提供了合适的方法(见例如,Wells 等,Nucleic Acids Res. 11 :7911-7925[1983] ;Christianson 等, Anal. Biochem.,223 :119_129[1994];和Hsia等,Anal Biochem.,242 :221-227[1999])。这并不意味着本发明受限于任何特定的测定方法。用于测定宿主细胞中成熟蛋白酶生产水平的其它手段包括但不限于使用对该蛋白质特异的多克隆或单克隆抗体的方法。例子包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些以及其它一些测定法在本领域公知(见例如,Maddox等,J. Exp. Med.,158 :1211 [1983])。本文提到的所有出版物和专利都通过弓I用并入本文。对本领域技术人员将是显而易见的,可以对所描述的本发明方法和系统进行多种修改和变动而不偏离本发明的范围和宗旨。虽然已经参照具体实施方案对本发明进行了描述,但应理解的是,本发明不应被不恰当地限定于这些特定的实施方案。事实上,所描述的本发明实施方式的各种对本领域和/ 或相关领域技术人员显而易见的变型形式都旨在落入本发明的范围内。实验提供下述实施例来展示和进一步阐述本发明的某些实施方案和方面,它们不应被解释为限制本发明的范围。在下文的实验公开内容中,应用了下述缩写ppm(每百万分之);M(摩尔每升); mM(毫摩尔每升);μ M(微摩尔每升);ηΜ(纳摩尔每升);mol (摩尔);mmol (毫摩尔); μπιο (微摩尔);nmol (纳摩尔);gm(克);mg (毫克);Pg (微克);Pg (皮克);L (升);ml 和mL(毫升);μ 和4 1^(微升);cm(厘米);mm(毫米);^111(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒);min(s)(分钟/分钟);h(s)和hr(s)(小时/ 小时);。C (摄氏度);QS(足够量);ND(未进行);NA(不适用);rpm(每分钟转数);w/ ν(质量体积比);v/V(体积体积比);g(重力);OD(光密度);aa(氨基酸);bp (碱基对); kb (千碱基对);kD (千道尔顿);suc-AAPF-pNA (琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酰基-对硝基苯胺);FNA(BPN’的变体);BPN’ (解淀粉芽孢杆菌的枯草杆菌蛋白酶);DMSO(二甲基亚砜);cDNA(拷贝或互补DNA) ;DNA(脱氧核糖核酸);ssDNA(单链 DNA) ; dsDNA (双链DNA) ; dNTP (三磷酸脱氧核糖核苷酸);DTT (1,4- 二巯基-DL-苏糖醇); H20(水);dH20(去离子水);HCl (盐酸);MgCl2 (氯化镁);MOPS (3-[N-吗啉代]-丙烷磺酸);NaCl (氯化纳);PAGE (聚丙烯酰胺凝胶电泳);PBS (磷酸缓冲盐溶液[150mM NaCl, IOmM磷酸钠缓冲液,pH 7.2]) ;PEG(聚乙二醇);PCR(聚合酶链式反应);PMSF(苯基甲基磺酰氟);RNA(核糖核酸);SDS(十二烷基硫酸纳);Tris(三(羟甲基)氨基甲烷);SOCO^细菌用胰蛋白胨,0.5%细菌用酵母提取物,IOmM NaCl, 2. 5mM KCl) ;Terrific Broth (TB 12g/l 细菌用胰蛋白胨,24g/l 甘油,2. 31g/l KH2PO4,和 12. 54g/l K2HPO4) ;0D280 (280nm ^h 的光密度);0D600(600nm处的光密度);A405 G05nm处的吸光度);Vmax(酶催化反应的最大初速度);HEPES(N-[2-羟乙基]哌嗪-N-[2-乙磺酸]);Tris-HCl (三[羟甲基]氨基甲烷盐酸盐);TCA(三氯乙酸);HPLC(高压液相色谱);RP-HPLC(反相高压液相色谱); TLC(薄层色谱);EDTA(乙二胺四乙酸)出tOH(乙醇);SDS(十二烷基硫酸纳);Tris(三 (羟甲基)氨基甲烷);TAED (N,N, N’ N’ -四乙酰基乙二胺)。实施例1靶向ISD(插入取代缺失)文库的构建用于构建经修饰的FNA多核苷酸文库的方法(ISD方法)显示于图2中。使用在正向和反向上均勻地覆盖编码392个氨基酸的全长蛋白质(SEQ ID NO 1)的前原区域(SEQ ID NO 7)的FNA基因序列的两套寡核苷酸,扩增编码FNA的前原区域的FNA基因部分的左边和右边片段。两种PCR反应(左边和右边片段)包含5’正向或3’反向基因序列侧翼寡核苷酸,每一寡核苷酸与相应的相对引物寡核苷酸组合。使用包含EcoRI位点的单一正向引物(P3233,TTATTGTCTCATGAGCGGATAC ;SEQ ID NO :123)和各含 Eaml04I 位点的反向引物 P3301r-P3404r(SEQ ID NOS =124-227 ;表1)扩增左边片段。使用包含MluI限制性位点的单条反向引物(P3237,TGTCGATAACCGCTACTTTAAC ;SEQ ID NO 228)和各含 Eaml04I 限制性位点的正向引物P3301f-P3401f(SEQ ID NOS :229-332 ;表2)扩增右边片段。表1、用于扩增左边片段的反向引物序列
权利要求
1.一种编码经修饰的全长蛋白酶的分离的经修饰的多核苷酸,所述分离的经修饰的多核苷酸包含编码所述全长蛋白酶的前原区域的第一多核苷酸,该第一多核苷酸有效连接到编码所述全长蛋白酶的成熟区域的第二多核苷酸上,其中所述第一多核苷酸编码SEQ ID NO 7的前原区域,并进一步被突变而包含至少一个突变,其中所述至少一个突变增强宿主细胞的所述蛋白酶生产。
2.权利要求1的分离的经修饰的多核苷酸,其中所述经修饰的全长蛋白酶为源自野生型或变体前体碱性丝氨酸蛋白酶的碱性丝氨酸蛋白酶。
3.权利要求2的分离的经修饰的多核苷酸,其中所述前体碱性丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。
4.权利要求1的分离的多核苷酸,其中所述宿主细胞为芽孢杆菌属物种宿主细胞。
5.权利要求4的分离的多核苷酸,其中所述芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。
6.权利要求1-5之任一的分离的经修饰的多核苷酸,其中所述第二多核苷酸编码与 SEQ ID NO :9的蛋白酶具有至少约65%同一性的蛋白酶。
7.权利要求1-6之任一的分离的经修饰的多核苷酸,其中所述第二多核苷酸编码SEQ ID NO 9的蛋白酶。
8.权利要求1-7之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码在选自以下的一个或多个位置上的至少一个取代2, 3,6,7,8,10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33, 34,35,36,37,38,39,45,46,47,48,49,50,51,52,53,54,55,57,58,59,61,62,63,64,66, 67,68,69,70,72,74,75,76,77,78,80,82,83,84,87,88,89,90,91,93,96,100 和 102,其中的位置通过与SEQ ID NO :7的前原多肽的氨基酸序列对应而进行编号。
9.权利要求1-8之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的至少一个取代X2F,N,P和Y ;X3A, M,P和R ; X6K 禾口 M ;X7E ;I8W ;X10A,C,G,M 禾口 T ;X11A,F 禾口 T ;X12C,P,T ;X13C,G 禾口 S ;X14F ;X15G,M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 和 H ;X27A, F, H, P, T,V 和 Y ;X28V ;X29E, I,R,S 和 T ;X30C ;X31H, K, N, S,V 和 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 禾口 S ;X36C, D, L, N, S,W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q,S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H, I 禾口 M ;X53D,E,M,Q 禾口 T ;X54F, G, H,I 禾Π S ;X55D ;Χ57Ε, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F,I 禾Π R ;Χ62Α, F, G, H, N, S,T 禾口 V ;Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 和 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 禾口 Y ;Χ78Μ, Q 禾口 V ;X80D, L 禾口 N ;X82C, D, P, Q,S 禾口 T ;X83G 禾口 N ;Χ84Μ ;X87R ;Χ88Α, D, G,T 禾口 V ;X89V ; X90D 和 Q ;Χ91Α ;Χ92Ε 和 S ;X93G,N 禾口 S ;X96G,N 禾口 T ;X100Q ;禾口 Χ102Τ,其中的位置通过与 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
10.权利要求1-9之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的至少一个取代R2F,N,P和Y ;S3A, M,P和 R ;L6K 禾口 M ;W7E ; I8W ;L10A, C,G,M 禾口 T ;L11A,F 禾口 T ;F12C,P,T ;A13C,G 禾口 S ;L14F ;A15G,M,T 禾口 V ;L16V ;I17S ;T19P 禾口 S ;M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, T,V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N,S,V 禾口 W ; G32C, F, M, N, P,S 禾口 T ;K33E,F, M,P 禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S, W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ;K39A, C,G,I,L, M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C,E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M, Q 禾Π T ;A54F,G, H,I 禾Π S ;K55D ;Κ57Ε, N 禾Π R ;D58A, C, Ε, F, G, K, R, S, Τ, W ;V59E ;S61A, F, I 禾口 R ;Ε62Α, F, G, H, N, S,T 禾口 V ;Κ63Α, C, Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C, D, P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G, T 和 V ;L89V ;K90D 和 Q ;Κ91Α ;D92E 和 S ;P93G,N 禾口 S ;A96G,N 禾口 T ;E100Q ;禾口 Η102Τ,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
11.权利要求1-10之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含编码选自以下的取代组合的至少一个突变组合X49A-XMT,X49A-X72D,Χ49Α-Χ78Μ, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, Χ91Α-χ24Τ, Χ91Α-Χ49Α, Χ91Α-Χ52Η, X91A-X72D, Χ91Α-Χ78Μ, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M 和 X93S-X78V,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
12.权利要求1-11之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含编码选自以下的取代组合的至少一个突变组合S49A-S24T,S49A-K72D,S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H,P93S-K72D,P93S-S78M 和 P93S-S78V,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
13.权利要求1-7之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的至少一个缺失p. X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
14.权利要求1-7和13之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的至少一个缺失p. I18_T19del, p. F22_ G23del, p. E37del, p. T47del, p. S49del, p. K55del 和 p. K57del,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
15.权利要求1_7、13和14之任一的分离的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的至少一个插入p. X2_X3insT,p. X30_ X31insA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG 和 p. X58_ )(59insA,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
16.权利要求1-7和15之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少一个突变,所述至少一个突变编码选自以下的插入p. R2_S3insT, p. A30_A31insA, p. T19_M20insAT, p. A21_F22insS, p. G32_K33insG, p. G36_E37insG 和 p. D58_V59insA,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
17.权利要求1-7之任一的分离的多核苷酸,其中所述第一多核苷酸包含至少2 个突变,所述至少2个突变编码选自以下的至少一个取代和至少一个缺失X46H-p. X47del, X49A-p.X22_X23del, x49C-p.X22_X23del, X48I-p. X49del, X17ff-p.X18_ X19del, X78M-P. X22_X23del,X78V-p. X22_X23del, X78V-p. X57del, X91A_p. X22_X23del, X91A-X48I-pX49del, X91A_p. X57del, X93S_p. X22_X23del 和 X93S_X48I-p. X49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
18.权利要求1-7和17之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少2个突变,所述至少2个突变编码选自以下的至少一个取代和至少一个缺失Q46H-p. T47del, S49A-p. F22_G23del, S49C-p. F22_G23del, M48I-p.S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
19.权利要求1-7之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少2个突变,所述至少2个突变编码选自以下的至少一个取代和至少一个插入X49A-p. X2_ X3insT, X49A-p32X_X33insG, X49A_p. X19_X20insAT, X49C_p. X19_X20insAT, X49C_p. X32_ X33insG, X52H—p. X19_X20insAT, X72D_p. X19_X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A-p. X32_X33insG, X93S-p. X19_X20insAT 和 X93S-p. X32_X33insG,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
20.权利要求1-7和19之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少2个突变,所述至少2个突变编码选自以下的至少一个取代和至少一个插入 S49A-p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_M20insAT, S49C_p. T19_M20insAT, S49C-p. G32_K33insG, S49C-p. T19_M20insAT, S52H—p. T19_M20insAT, K72D-p.T19_ M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A_p. T19_M20insAT, K91A-p. G32_K33insG, P93S_p. T19_M20insAT 和 P93S_p. G32_K33insG,其中的位置通过与 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
21.权利要求1-7之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少2个突变,所述至少2个突变编码选自以下的至少一个缺失和至少一个插入 p. X57del-p. X19_X20insAT 和 p. X 22_X23del_p. X2_X3insT,其中的位置通过与 SEQ ID NO: 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
22.权利要求1-7和21之任一的分离的经修饰的多核苷酸,其中所述第一多核苷酸包含至少2个突变,所述至少2个突变编码选自以下的缺失和插入pK57del-p. T19_M20insAT 和 p. F22_G23del-p. R2_S3insT。
23.权利要求1-7之任一的分离的多核苷酸,其中所述第一多核苷酸包含至少3个突变,所述至少3个突变编码相应于p. X49del-p. X19_X20insAT_X48I的至少一个缺失、一个插入和一个取代,其中的位置通过与SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
24.权利要求1-7和23之任一的分离的多核苷酸,其中所述第一多核苷酸包含至少3个突变,所述至少3个突变编码相应于p. S49del-p. T19_M20insAT_M48I的至少一个缺失、 一个插入和一个取代,其中的位置通过与SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。
25.由权利要求I-M之任一的经修饰的全长多核苷酸编码的分离的多肽。
26.包含权利要求I-M之任一的分离的经修饰的多核苷酸的表达载体。
27.权利要求沈的表达载体,其还包含AprE启动子。
28.包含权利要求沈-27之任一的表达载体的宿主细胞。
29.权利要求观的宿主细胞,其中宿主细胞为芽孢杆菌属物种宿主细胞。
30.权利要求四的宿主细胞,其中所述芽孢杆菌属物种宿主细胞选自枯草芽孢杆菌、 地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。
31.权利要求观-30之任一的宿主细胞,其中所述宿主细胞为枯草芽孢杆菌宿主细胞。
32.在芽孢杆菌属物种宿主细胞中生产成熟蛋白酶的方法,所述方法包括a)提供权利要求沈-27之任一的表达载体;b)以所述表达载体转化宿主细胞;c)在合适的条件下培养所述宿主细胞,以使所述宿主细胞生产所述蛋白酶。
33.权利要求32的方法,其中所述芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。
34.权利要求32-33之任一的方法,其中所述蛋白酶为碱性丝氨酸蛋白酶。
35.权利要求32-34之任一的方法,其中所述经修饰的多核苷酸编码包含与SEQID NO 9至少约65%相同的成熟区域的蛋白酶。
36.权利要求32-35之任一的方法,其中所述第一多核苷酸编码SEQID NO :7的前原区域,其中所述第一多核苷酸包含至少一个增加所述蛋白酶的所述成熟区域的生产的突变, 并且其中所述第二多核苷酸编码SEQ ID NO :9的成熟区域。
全文摘要
本发明涉及编码经修饰的蛋白酶的经修饰的多核苷酸,本发明还涉及用于改变蛋白酶在微生物中的生产的方法。特别地,该经修饰的多核苷酸包含一个或多个突变,编码经修饰的蛋白酶,所述经修饰的蛋白酶具有增强该活性酶生产的前原区域修饰。本发明还涉及用于改变蛋白酶在微生物,例如芽孢杆菌属物种,中的生产的方法。
文档编号C07H21/04GK102575242SQ201080043790
公开日2012年7月11日 申请日期2010年4月15日 优先权日2009年7月31日
发明者A·比萨奇科, B·F·施密特 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1