具有修饰的原区的蛋白酶的制作方法

文档序号:392068阅读:553来源:国知局
专利名称:具有修饰的原区的蛋白酶的制作方法
技术领域
本发明提供用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。该组合物包含编码在原区(pro region)中具有至少一个突变的修饰蛋白酶的修饰多核苷酸;由该修饰多核苷酸编码的修饰的丝氨酸蛋白酶;包含编码该修饰蛋白酶的修饰多核苷酸的表达盒、DNA构建体和载体;及用本发明的载体转化的细菌宿主细胞。该方法包括用于增强成熟蛋白酶在细菌宿主细胞,例如芽孢杆菌属物种(Bacillus sp.)宿主细胞中的产生的方法。 所产生的蛋白酶用于工业产生适合用于包括但不限于清洁、动物饲料和织物加工产业的多种产业中的酶。
背景技术
部分由于它们将其发酵产物分泌入其培养基中的能力,已将作为芽孢杆菌属 (Bacillus)成员的微生物,如革兰氏阳性微生物用于大规模工业发酵。使分泌性蛋白质跨细胞膜和细胞壁输出,然后释放入外部培养基中。事实上,异源多肽的分泌是工业中广泛使用的技术。通常,用编码待表达和分泌的异源目的多肽的核酸转化细胞来大量产生希望的多肽。已通过编码希望的蛋白质的多核苷酸的遗传操作来控制希望的多肽的表达和分泌。尽管蛋白质产生方法中有多种进步,但本领域中仍然存在提供更有效的方法用于胞外蛋白质分泌的需要,目的在于增强用于包括但不限于清洁、动物饲料和织物加工产业的多种产业中的酶,如蛋白酶的产生。
发明概述本发明提供用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。该组合物包含编码在原区中具有至少一个突变的修饰蛋白酶的修饰多核苷酸;由该修饰多核苷酸编码的修饰的丝氨酸蛋白酶;包含编码该修饰蛋白酶的修饰多核苷酸的表达盒、DNA构建体和载体;及用本发明的载体转化的细菌宿主细胞。该方法包括用于增强成熟蛋白酶在细菌宿主细胞,例如芽孢杆菌属物种宿主细胞中的产生的方法。所产生的蛋白酶用于工业产生适合用于包括但不限于清洁、动物饲料和织物加工产业的多种产业中的酶。在一个实施方案中,本发明提供编码修饰蛋白酶的分离的修饰多核苷酸。该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID N0:7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌(Bacillus subtilis)的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌(Bacillus clausii)或迟缓芽孢杆菌(Bacillus lentus)的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码选自SEQ ID NO :9、11、13、15、17、19和21 的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,本发明提供编码修饰蛋白酶的分离的修饰多核苷酸。该分离的修饰多核苷酸包含编码选自SEQ ID NO :3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30 和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID NO 3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID N0:9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID NO 3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码选自SEQ ID NO 9, 11、13、15、17、19和21的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸, 该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸, 该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸, 该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码选自SEQ ID N0:9、ll、13、15、17、19和21的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,本发明提供编码修饰蛋白酶的分离的修饰多核苷酸。该分离的修饰多核苷酸包含编码选自SEQ ID NO :3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID N0:3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6X-E30G、E6X-E30S、 E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60% 同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。 优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID N0:3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6X-E30G、E6X-E30S、 E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码选自SEQ ID NO :9、11、13、15、17、19和21 的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G, E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G,E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N,E30S-A32D,E30S-A32C,E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G, E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N,E30S-A32D,E30S-A32C,E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G, E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N,E30S-A32D,E30S-A32C,E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F,E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码选自SEQ ID N0:9、ll、13、15、17、 19和21的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,本发明提供编码修饰蛋白酶的分离的修饰多核苷酸。该分离的修饰多核苷酸包含编码选自SEQ ID NO :3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、 E6P-A32K,E6S-A32K,E6T-A32K,E6N-A32K,E30W-A32K,E30V-A32K,E6A-E30G、E6R-E30G、
E6C-E30G, E6Q-E30G,E6G-E30G,E6H-E30G,E6K-E30G,E6S-E30G,E6W-E30G,E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W,E6A-E30G,E6R-E30G,E6N-E30G,E6D-E30G,E6C-E30G,E6Q-E30G,E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T,E30S-A32W, E30S-A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID N0:3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6R-A32K、E6N-A32K、 E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、E6N-A32K、 E30W-A32K,E30V-A32K,E6A-E30G、
E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G,E6H-E30G,E6K-E30G,E6S-E30G,E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S,E6V-E30S, E30S-A32R, E30S-A32N,E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W、E30S_A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID N0:9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。
在另一实施方案中,该分离的修饰多核苷酸包含编码选自SEQ ID NO :3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自E6R-A32K、E6N-A32K、 E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、E6N-A32K、 E30W-A32K,E30V-A32K,E6A-E30G、
E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G,E6H-E30G,E6K-E30G,E6S-E30G,E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S,E6V-E30S,E30S-A32R, E30S-A32N,E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W、E30S_A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID N0:9的成熟蛋白酶至少约60%同一的源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶的成熟区。优选地,该取代增强成熟蛋白酶通过芽孢杆菌属物种宿主,例如枯草芽孢杆菌的产生。在另一实施方案中,本发明提供包含分离的修饰多核苷酸的表达载体,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID N0:7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如 SEQ ID NO :9、11、13、15、17、19和21。在一些实施方案中,通过包含于该表达载体中的AprE 启动子驱动该分离的多核苷酸的表达。在另一实施方案中,该表达载体包含分离的修饰多核苷酸,该分离的修饰多核苷酸包含编码选自SEQ ID NO 3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO 7所示原区的第二多核苷酸有效连接,该原区在选自原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合。相应地,该第二多核苷酸与第三多核苷酸有效连接, 该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如SEQ ID NO :9、11、13、15、17、19和21。在一些实施方案中,通过包含于该表达载体中的AprE启动子驱动该分离的多核苷酸的表达。在另一实施方案中,本发明提供包含分离的修饰多核苷酸的表达载体,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID N0:7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID N0:9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如SEQ ID NO :9、11、13、15、17、19 和21。在一些实施方案中,通过包含于该表达载体中的AprE启动子驱动该分离的多核苷酸的表达。在另一实施方案中,该表达载体包含分离的修饰多核苷酸,该分离的修饰多核苷酸包含编码选自SEQ ID NO :3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码 SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如SEQ ID NO :9、11、13、15、17、19和21。在一些实施方案中,通过包含于该表达载体中的AprE启动子驱动该分离的多核苷酸的表达。在另一实施方案中,本发明提供包含分离的修饰多核苷酸的表达载体,该分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID N0:7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合,该组合选自 E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K,E6N-A32K,
E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G,E6W-E30G, E30G-A32R,E30G-A32Q,E30G-A32E,E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W,E30S-A32Y和E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接, 该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如SEQ ID N0:9、ll、13、15、17、19和21。在一些实施方案中,通过包含于该表达载体中的AprE启动子驱动该分离的多核苷酸的表达。在另一实施方案中,该表达载体包含分离的修饰多核苷酸,该分离的修饰多核苷酸包含编码选自SEQ ID NO 3和5的信号肽的第一多核苷酸,该第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含至少两个氨基酸的取代的组合, 该组合选自 E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G, E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T,E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P、 E30S-A32S、E30S-A32T、E30S-A32W、E30S-A32Y 和 E30S-A32V。相应地,该第二多核苷酸与第三多核苷酸有效连接,该第三多核苷酸编码与SEQ ID NO :9的成熟蛋白酶至少约60%同一的蛋白酶的成熟区。优选地,该成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶,例如SEQ ID N0:9、ll、13、15、17、19和21。在一些实施方案中,通过包含于该表达载体中的AprE启动子驱动该分离的多核苷酸的表达。在另一实施方案中,本发明提供包含上述表达载体中的任一个的芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌。优选地,包含于修饰多核苷酸的原区中的取代增强成熟蛋白酶从芽孢杆菌属宿主细胞的产生。除枯草芽孢杆菌外,可以用于从表达载体表达修饰多核苷酸的其他宿主细胞包含地衣芽孢杆菌(Bacillus licheniformis)、迟缓芽孢杆菌、短芽孢杆菌(Bacillus brevis)、嗜热月旨肪芽孢杆菌(Bacillus stearothermophilus)、嗜碱 ^ifelf lif (Bacillus alkalophilus) >I ^jv^ifelflii (Bacillus amyloliquefaciens) > 克劳氏芽孢杆菌、耐盐芽孢杆菌(Bacillus halodurans)、巨大芽孢杆菌(Bacillus megaterium)、凝结芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacillus circulans)、灿烂芽孢杆菌(Bacillus lautus)禾Π苏云金芽孢杆菌(Bacillus thuringiensis)。在另一实施方案中,本发明提供用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法。该方法包括提供上述表达载体中的任一种,将该表达载体转化入芽孢杆菌属物种宿主细胞中,并在适宜的条件下培养转化的宿主细胞来产生蛋白酶。优选地,该宿主细胞是枯草芽孢杆菌宿主细胞。但是,除枯草芽孢杆菌外,可以用于从表达载体产生成熟蛋白酶的其他宿主细胞包含地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生SEQ ID NO 9的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO 3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E6R-A32K、 E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、 E6N-A32K、E30W-A32K、E30V-A3^(的取代组合;和编码SEQ ID NO :9的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO :17的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO :3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E6A-E30G、 E6R-E30G、E6C-E30G, E6Q-E30G,E6G-E30G,E6H-E30G,E6K-E30G,E6S-E30G,E6W-E30G,E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S,E6G-E30G-A32T 禾P E6G-E30G-A32W的取代组合;和编码SEQ ID NO :17的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO :19的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO :3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E6A-E30G、 E6R-E30G、E6N-E30G、E6D-E30G、E6C-E30G、E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、 E6M-E30G、E6F-E30G、E6P-E30G、E6S-E30G、E6T-E30G、E6W-E30G、E6V-E30G 和 E6Y-E30G 的取代组合;和编码SEQ ID NO :19的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO :21的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO :3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E6A-E30S、 E6G-E30S、E6L-E30S、E6K-E30S、E6F-E30S、E6P-E30S、E6Y-E30S、E6V-E30S、E30S-A32R, E30S-A32N、E30S-A32D、E30S-A32C、E30S-A32Q、E30S-A32E、E30S-A32G、E30S-A32H、 E30S-A32L、E30S-A32K、E30S-A32M、E30S-A32F、E30S-A32P、E30S-A32S、E30S-A32T、 E30S-A32W、E30S-A32Y和E30S-A32V的取代组合;和编码SEQ ID NO 21的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在其他实施方案中,该分离的修饰多核苷酸包含优选增强成熟蛋白酶从芽孢杆菌属物种宿主细胞的产生的一个氨基酸取代。在一个实施方案中,该分离的修饰多核苷酸包含第一多核苷酸,该第一多核苷酸编码SEQ ID NO :3的信号肽,且与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含选自E6A、E6R、E6C、E6Q、E6H、E6I、E6K、E6M、 E6S、E6Y、E30A、E30R、E30N、E30D、E30Q、E30G、E30L、E30M、E30P、E30S、E30T、E30W、E30Y、 E30V、A32、A32R、A32C、A32E、A32G、A32L、A32K、A32F、A32T、A32Y 和 A32V 的氨基酸取代。该第二多核苷酸与编码SEQ ID NO :17的蛋白酶的成熟区的第三多核苷酸有效连接。在另一实施方案中,该分离的修饰多核苷酸包含第一多核苷酸,该第一多核苷酸编码SEQ ID NO :3的信号肽,且与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含选自 E6A、E6R、E6N、E6C、E6Q、E6G、E6H、E6M、E6F、E6P、E6S、E6T、E6W、E6V、A32K、 A32T和A32V的氨基酸取代。该第二多核苷酸与编码SEQ ID NO :9的蛋白酶的成熟区的第三多核苷酸有效连接。在另一实施方案中,该分离的修饰多核苷酸包含第一多核苷酸,该第一多核苷酸编码SEQ ID NO :3的信号肽,且与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,该原区包含选自 E6A、E6H、E6K、E6R、E30A、E30R、E30N、E30D、E30G、E30H、E30L、E30K、E30F、 E30S、E30T和E30V的氨基酸取代。该第二多核苷酸与编码SEQ ID NO :19的蛋白酶的成熟区的第三多核苷酸有效连接。在另一实施方案中,该分离的修饰多核苷酸包含第一多核苷酸,该第一多核苷酸编码SEQ ID NO :3的信号肽,且与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接, 该原区包含选自 E6A、E6R、E6Q、E6G、E6L、E6K、E6M、E6F、E6T、E6V、E30R、E30Q、E30G、E30I、 E30L、E30M、E30F、E30P、E30T、E30W、E30Y、E30V、A32Q、A32S、A32T 和 A32V 的氨基酸取代。 该第二多核苷酸与编码SEQ ID NO :11的蛋白酶的成熟区的第三多核苷酸有效连接。在另一实施方案中,该分离的修饰多核苷酸包含第一多核苷酸,该第一多核苷酸编码SEQ ID NO :3的信号肽,且与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接, 该原区包含选自 E30A、E30R、E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、 A32F和A32V的氨基酸取代。该第二多核苷酸与编码SEQ ID NO :21的蛋白酶的成熟区的第三多核苷酸有效连接。用于产生从原区中包含两个或三个取代的修饰多核苷酸表达的成熟蛋白酶的方法还用于产生从包含单个氨基酸取代的修饰多核苷酸表达的成熟蛋白酶。在一个实施方案中,该方法包括提供如上文所述且包含原区中含有单个氨基酸取代的修饰多核苷酸的表达载体中的任一个,将该表达载体转化入芽孢杆菌属物种宿主细胞中,并在适宜的条件下培养转化的宿主细胞来产生蛋白酶。优选地,该宿主细胞是枯草芽孢杆菌宿主细胞。但是,除枯草芽孢杆菌外,可以用于从表达载体产生成熟蛋白酶的其他宿主细胞包含地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。在一个实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO 17的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO 3的信号肽的第一多核苷酸;编码SEQ ID NO 7的原区的第二多核苷酸,该原区包含选自E6A、E6R、E6C、 E6Q、E6H、E6I、E6K、E6M、E6S、E6Y、E30A、E30R、E30N、E30D、E30Q、E30G、E30L、E30M、E30P、 E30S、E30T、E30W、E30Y、E30V、A32、A32R、A32C、A32E、A32G、A32L、A32K、A32F、A32T、A32Y 和A32V的单个氨基酸取代;和编码SEQ ID NO 17的成熟蛋白酶的第三多核苷酸。将改表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO :9的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO :3的信号肽的第一多核苷酸;编码SEQ ID NO 7的原区的第二多核苷酸,该原区包含选自E6A、E6R、E6N、 E6C、E6Q、E6G、E6H、E6M、E6F、E6P、E6S、E6T、E6W、E6V、A32K、A32T 和 A32V 的单个氨基酸取代;和编码SEQ ID NO :9的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO 19的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO 3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E6A、E6H、E6K、 E6R、E30A、E30R、E30N、E30D、E30G、E30H、E30L、E30K、E30F、E30S、E30T 和 E30V 的单个氨基酸取代;和编码SEQ ID NO :19的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO 11的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO 3的信号肽的第一多核苷酸;编码SEQ ID NO 7的原区的第二多核苷酸,该原区包含选自E6A、E6R、E6Q、 E6G、E6L、E6K、E6M、E6F、E6T、E6V、E30R、E30Q, E30G、E30I、E30L、E30M、E30F、E30P、E30T、 E30W、E30Y、E30V、A32Q、A32S、A32T 和 A32V 的单个氨基酸取代;和编码 SEQ ID NO 11 的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。在另一实施方案中,该方法通过提供表达分离的修饰多核苷酸的表达载体来产生 SEQ ID NO 21的成熟蛋白酶,该分离的修饰多核苷酸包含编码SEQ ID NO 3的信号肽的第一多核苷酸;编码SEQ ID N0:7的原区的第二多核苷酸,该原区包含选自E30A、E30R、 E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、A32F 和 A32V 的单个氨基酸取代;和编码SEQ ID NO :21的成熟蛋白酶的第三多核苷酸。将该表达载体转化入芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中,在适宜的条件下培养该宿主细胞来产生成熟蛋白酶。
附图简述

图1显示SEQ ID NO 9的迟缓芽孢杆菌野生型丝氨酸蛋白酶(GG36)、SEQ ID NO 11的迟缓芽孢杆菌变体丝氨酸蛋白酶、SEQ ID NO :13的克劳氏芽孢杆菌丝氨酸蛋白酶及 SEQ ID NO 15,SEQ ID NO 17,SEQ ID NO 19,SEQ ID NO :21、SEQ ID NO :23 禾口SEQ ID NO: 25的克劳氏芽孢杆菌变体丝氨酸蛋白酶的成熟区的氨基酸序列比对。图2显示Blast检索产生的SEQ ID NO 7的未修饰的原区的氨基酸序列与来自多种芽孢杆菌属物种的蛋白酶的未修饰的原区的氨基酸序列的比对。图3显示Blast检索产生的成熟蛋白酶的氨基酸序列(SEQ ID NO 9)与来自多种芽孢杆菌属物种的蛋白酶的成熟区氨基酸序列的比对。图4提供包含aprE信号序列(SEQ ID NO :3)、SEQ ID NO 7的原序列(pro sequence)和编码成熟丝氨酸蛋白酶Pn的多核苷酸的pJH-Pn质粒(A)图谱和pBN3_Pn载体(B)图谱。图5提供分别编码SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟蛋白酶的示例性多核苷酸(SEQ ID NO :8、10、12、14、16、18、20、22和24)的比对。应理解,由于遗传密
码的简并性,多肽可以由一个以上核苷酸序列编码。 发明详述本发明提供编码修饰蛋白酶的修饰多核苷酸,及用于增强蛋白酶在微生物中的产生的方法。具体而言,该修饰多核苷酸包含编码具有原区的修饰,例如氨基酸取代的蛋白酶的一个或多个突变来增强活性酶的产生。本发明还涉及用于改变蛋白酶在微生物,如芽孢杆菌属物种中的表达的方法。除非本文中另作定义,本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员的通常理解相同的含义(例如Singleton和^tinsbury,Dictionary of Microbiology and Molecular Biology,第 2 版·,John Wiley and Sons, NY[1994] ;Hale 禾口Markham,The Harper Collins Dictionary of Biology,Harper Perennial,NY[1991])。虽然与本文中所述的那些类似或等同的任意方法和材料也可用于实施本发明,但本文中描述优选的方法和材料。因此,以下术语通过参考说明书整体而得到更充分的定义。同样,除非文中清除地另有说明,本文中使用的单数形式“一”、“一个”和“该”包含复数指代。数字范围包含定义该范围的数字。除非另有说明,分别按5'至3'方向从左至右书写核酸;按氨基至羧基方向从左至右书写氨基酸序列。应理解,本发明不限于所描述的具体方法、流程和试剂,因为这些可以取决于本领域技术人员使用它们的背景而变化。本说明书通篇给出的每一最大数值限制旨在包含每一较低数值限制,就如同在本文中明确写出这类较低数值限制一样。本说明书通篇给出的每一最小数值限制将包含每一较高数值限制,就如同在本文中明确写出这类较高数值限制一样。本说明书通篇给出的每一数值范围将包含落在这种较宽数值范围内的每一较窄数值范围,就如同在本文中明确写出这类较窄数值范围一样。本文在上文和下文中提到的所有专利、专利申请、文章和出版物在此明确引入作为参考。此外,本文中提供的标题不是可以参考说明书整体而得到的本发明的多种方面或实施方案的限制。因此,以下术语通过参考说明书整体而得到更充分的定义。但是,为了便于理解本发明,下文定义了许多术语。
定义本文中使用的术语“分离的”和“纯化的”指从它与之天然结合的至少一种成分移出的核酸或氨基酸(或其他成分)。本文中的术语“修饰多核苷酸”指已改变为包含至少一个突变来编码“修饰”蛋白质的多核苷酸序列。本文中使用的术语“蛋白酶”和“蛋白水解活性”指显示水解具有肽键的肽或底物的能力的蛋白质或肽。存在许多公知的方法用于测量蛋白水解活性(Kalisz," Microbial Proteinases, “ 在 Fiechter(编辑),Advances in Biochemical Engineering/ BiotechnoloRY, [1988]中)。例如,可以通过比较测定来确定蛋白水解活性,该比较测定分析所产生的蛋白酶水解市售底物的能力。用于蛋白酶或蛋白水解活性的这种分析的示例性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛胶原(Sigma C-9879)、牛弹性蛋白 (Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用这些底物的比色测定为本领域公知(参见例如WO 99/34011和美国专利号6,376,450,二者均在此引入作为参考)。 AAPF测定(参见例如Del Mar等,Anal. Biochem.,99 :316-320 [1979])也用于测定成熟蛋白酶的产生。此测定测量酶水解可溶性合成底物琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(sAAPF-pNA)时释放对硝基苯胺的速率。在分光光度计上于410nm测量从水解反应产生黄色的速率,且其与活性酶浓度成比例。尤其是,本文中的术语“蛋白酶”指 “丝氨酸蛋白酶”。本文中使用的术语“枯草蛋白酶”和“丝氨酸蛋白酶”指MEROPS-The Peptidase Data base (Rawlings 等,MEROPS :the peptidase database, Nucleic Acids Res,34 Database issue, D270-272, 2006,在网立占 merops. sanger. ac. uk/cgi-bin/merops. cgi ? id = s08 ;action =.上)中所述的S8丝氨酸蛋白酶家族的任意成员。以下信息源自 2008 ^ 11^6 H ^ MEROPS-The Peptidase Data base "Peptidase family S8 containsthe serine endopeptidase serine protease and its homologues (Biochem J,290: 205-218,1993) ”。S8家族(也称为枯草杆菌酶(subtilase)家族)是丝氨酸肽酶的第二大家族,且可以划分为两个亚家族以枯草蛋白酶(S08. 001)为模式实例的S8A亚家族和以 kexin(S08. 070)为模式实例的S8B亚家族。先前认为三肽酰肽酶II (TPP-II ;S08. 090)是第三亚家族的模式实例,但后来确定其是错误分类。本文中的术语“亲本蛋白酶”指包含天然组合表达的前区(pre region)、原区和成熟区的全长蛋白酶。在一些实施方案中,亲本蛋白酶的前区和/或原区和/或成熟区用于产生前体蛋白酶的前区和/或原区和/或成熟区。本文中的术语“前体蛋白酶”指包含信号肽、原区和成熟区的未修饰的全长蛋白酶。前体蛋白酶可以源自天然存在(即野生型)的蛋白酶,或源自变体蛋白酶。正是修饰前体蛋白酶的原区来产生修饰蛋白酶。在一些实施方案中,前体蛋白酶包含源自一种亲本蛋白酶的原区和成熟区。在其他实施方案中,前体蛋白酶是嵌合蛋白质,其包含源自一种亲本蛋白酶的原区和源自不同亲本蛋白酶的成熟区。在用来指蛋白质时,本文中的术语“嵌合的”或“融合”指通过原来编码分开的蛋白质的两个或多个多核苷酸的连接产生的蛋白质。此融合多核苷酸的翻译产生具有源自各原始蛋白质的功能特性的单个嵌合多肽。通过重组DNA技术人工产生重组融合蛋白质。“嵌合多肽”或“嵌合体”意指包含来自一个以上多肽的序列的蛋白质。在它包含与来自一种或多种其他蛋白酶的一个或多个部分、区域或结构域融合的来自一种蛋白酶的部分、区域或结构域的意义上,修饰的蛋白酶可以是嵌合的。作为实例,嵌合蛋白酶可以包含一种蛋白酶的成熟区,该成熟区与另一蛋白酶的前肽连接。熟练的技术人员将理解,嵌合的多肽和蛋白酶无需由蛋白质序列的实际融合组成,而是还可以用具有对应的编码序列的多核苷酸来表达嵌合的多肽或蛋白酶。本文中的“天然存在的”或“野生型的”指具有与见于自然界中的氨基酸序列相同的未修饰的氨基酸序列的蛋白酶或编码这种蛋白酶的多核苷酸。天然存在的酶包含天然酶——天然表达或见于具体微生物中的那些酶。野生型的或天然存在的序列指从其衍生变体的序列。野生型序列可以编码同源或异源蛋白质。本文中使用的“变体”指成熟蛋白质,其与它所对应的野生型成熟蛋白质的不同在于向C端和N端的任一端或两端添加一个或多个氨基酸;在氨基酸序列中的一个或许多个不同位点上取代一个或多个氨基酸;在蛋白质的任一端或两端或在氨基酸序列中的一个或多个位点上缺失一个或多个氨基酸;和/或在成熟蛋白质的氨基酸序列中的一个或多个位点上插入一个或多个氨基酸。变体蛋白质包含天然存在的变体蛋白质和遗传改造的变体蛋白质。通过SEQ ID NO :11的迟缓芽孢杆菌蛋白酶来示例本发明的背景中的变体蛋白酶, 其是天然存在的蛋白质迟缓芽孢杆菌蛋白酶GG36 (SEQ ID NO 9)的变体,其与GG36的不同在于成熟区的位置74、101和102上的三个氨基酸取代。变体蛋白酶的另一实例是克劳氏芽孢杆菌蛋白酶SEQ ID NO :19,其是天然存在的蛋白质克劳氏芽孢杆菌蛋白酶Maxacal (SEQ ID N0 13)的变体,其与Maxacal的不同在于成熟区的位置99和102上的两个氨基酸取代 (图 1)。本文中使用的“同源物”和“同源蛋白质”指具有与目的蛋白质(例如来自另一来源的蛋白酶)相似的作用和/或结构的蛋白质(例如蛋白酶)。同源物并非意指必然在进化上相关。因此,该术语意指包含获自不同物种的相同或相似的酶(即就结构和功能而言)。术语“源自”和“获自”不仅指由所讨论的生物的菌株产生或可产生的蛋白酶,还指由分离自这种菌株的DNA序列编码且在包含这种序列的宿主生物中产生的蛋白酶。此外, 该术语指由合成和/或cDNA来源的DNA序列编码,且具有所讨论的蛋白酶的鉴定特征的蛋白酶。为了示例,“源自芽孢杆菌属的蛋白酶”指由芽孢杆菌属天然产生的具有蛋白水解活性的那些酶,以及丝氨酸蛋白酶,如由芽孢杆菌属来源产生,但其是通过基因工程技术的使用,由用编码该丝氨酸蛋白酶的核酸转化的非芽孢杆菌属生物产生的那些。“修饰的全长蛋白酶”、“修饰的前体蛋白酶”或“修饰的蛋白酶”可互换使用来指包含源自亲本或前体蛋白酶的信号肽、成熟区和原区的全长蛋白酶,其中修饰原区为包含至少一个突变。在一些实施方案中,原区和成熟区源自相同的亲本蛋白酶。在其他实施方案中,原区和成熟区源自不同的亲本蛋白酶。修饰的蛋白酶包含修饰为含有至少一个突变的原区,且它由修饰的多核苷酸编码。将修饰蛋白酶的氨基酸序列称为是通过向亲本氨基酸序列的原区中引入至少一个突变(例如一个或多个氨基酸的取代、缺失或插入)从亲本蛋白酶氨基酸序列“产生的”。在一些实施方案中,取代前体蛋白酶的原区的一个或多个氨基酸来产生修饰的全长蛋白酶。这种修饰是编码“前体”蛋白酶氨基酸序列的“前体”DNA序列的修饰,而不是操作前体蛋白酶本身。在用来指蛋白酶多肽或多核苷酸时,本文中的术语“未修饰的”指包含未修饰为含有至少一个突变(例如取代)的原区的蛋白酶。本文中的术语“全长蛋白质”和“前蛋白原”指包含信号肽、原序列和成熟序列的基因产物。例如,SEQ ID NO :59的全长蛋白酶包含信号肽(前区)(SEQ ID N0:3,例如由 SEQ ID NO :2的前多核苷酸编码)、原区(SEQ ID NO :7,例如由SEQ ID NO :6的前多核苷酸编码)和成熟区(由SEQ ID NO 8的多核苷酸编码的SEQ ID NO :9)。术语“信号序列”、“信号肽”或“前区”指核苷酸和/或氨基酸的任意序列,其可以参与蛋白质的成熟形式或前体形式的分泌。信号序列的此定义是功能性定义,意在包含所有由蛋白质基因的N端部分编码,且参与实现蛋白质的分泌的那些氨基酸序列。为了示例, 本发明的蛋白酶的前肽至少包含与SEQ ID NO 3的残基1- 同一的氨基酸序列。术语“原序列,,或“原区,,是信号肽和成熟蛋白酶间的氨基酸序列,其是蛋白酶的分泌/产生所必需的。原序列的切割将产生成熟的活性蛋白酶。为了示例,本发明的蛋白酶的原区至少包含与SEQ ID NO 7的原区的残基1-84(其对应于SEQ ID NO 59的全长蛋白酶的氨基酸30-113)同一的氨基酸序列。术语“成熟形式”或“成熟区”指蛋白质最终的功能性部分。为了示例,本发明的蛋白酶的成熟形式包含与SEQ ID N0:9的残基H69同一的氨基酸序列。在此背景中,“成熟形式”是全长蛋白酶的“加工形式”,其中全长蛋白酶的加工包含信号肽的去除和原区的去除。本文中的术语“蛋白质原(pro-protein) ”、“多肽原(pro-polyp印tide) ”和“蛋白酶原(pro-protease)”指包含与多肽原有效连接的成熟形式的蛋白质。“多肽原”由“原多核苷酸”编码。本文中使用的术语“异源蛋白质”指并非天然存在于宿主细胞中的蛋白质或多肽。 类似地,“异源多核苷酸”指并非天然存在于宿主细胞中的多核苷酸。异源多肽和/或异源多核苷酸包含嵌合的多肽和/或多核苷酸。本文中使用的“取代的”和“取代”指亲本序列中的氨基酸残基或核酸碱基的取代。 在一些实施方案中,取代涉及天然存在的残基或碱基的取代。本文中的修饰蛋白酶包含通过其余十九种氨基酸中的任一种来取代前体蛋白酶的原区的84个氨基酸中的任一个。例如,位置6(E6)上的取代是用丙氨酸(A)、半胱氨酸(C)、天冬氨酸(D)、甘氨酸(G)、苯丙氨酸(F)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、亮氨酸(L)、甲硫氨酸(M)、天冬酰胺(N)、脯氨酸(P)、谷氨酰胺(Q)、精氨酸(R)、丝氨酸(S)、苏氨酸(T)、缬氨酸(V)、色氨酸(W)和酪氨酸(Y)中的一个取代谷氨酸(E)。在相同位置上用任意其他氨基酸取代氨基酸例如E6表示为E6X,其中X是在位置6上取代E的其余19种氨基酸之一。在一些实施方案中,取代两个或多个氨基酸来产生包含氨基酸取代的组合的修饰蛋白酶。例如,用氨基酸A取代位置 6上的氨基酸E与用氨基酸T取代位置30上的氨基酸E的组合表示为E6A-E30T。对应于 SEQ ID NO :7的原区中编号的位置来编号原区中进行取代的氨基酸位置。本文中使用的“与...对应”、“对应于”或“等同于”指蛋白质或多肽中列出的位置上的残基,或与蛋白质或多肽中列出的残基类似、同源或等同的残基。本文中使用的“对应的区域”泛指沿着相关蛋白质或参考蛋白质的类似位置。本文中的术语“前多核苷酸”、“原核苷酸”和“成熟多核苷酸”指分别编码蛋白质 (例如蛋白酶)的前区、原区和成熟区的多核苷酸序列。就蛋白酶而言,术语“产生”包含全长蛋白酶的两个加工步骤1.信号肽的去除, 已知其发生在蛋白质分泌期间;和2.原区的去除,其产生酶的活性成熟形式,且已知其发生在成熟过程期间(Wang 等,Biochemistry 37:3165-3171 (1998) ;Power 等,Proc Natl Acad Sci USA83 :3096-3100[1986])。本文中的术语“增强的产生”指从修饰的全长蛋白酶加工的成熟蛋白酶的产生,且其以高于从未修饰的全长蛋白酶加工时相同成熟蛋白酶的产生水平的水平发生。就成熟蛋白酶而言,术语“加工的”指成熟过程,全长蛋白质(例如全长蛋白酶)经历该过程而成为活性成熟酶。就酶而言,“活性”意指“催化活性”,且包含酶活性的任意可接受的测量,如活性的速率、活性的量或比活性。催化活性指催化具体的化学反应,如具体的化学键的水解的能力。熟练的技术人员将理解,酶的催化活性只是加快否则将缓慢的化学反应的速率。因为酶只是作为催化剂,所以反应本身既不产生也不消耗酶。熟练的技术人员还将理解,并非所有多肽都具有催化活性。“比活性”是每单位总蛋白质或酶的酶活性的测量。因此,比活性可以表示为酶的单位重量(例如每克或每毫克)或单位体积(例如每毫升)。此外,比活性可以包含酶纯度的测量,或者可以提供纯度的指示,例如在已知或可获得活性标准用于比较时。活性的量反映由表达所测量的酶的宿主细胞产生的酶的量。术语“相对活性”或“产生比”在本文中可互换使用,指从修饰蛋白酶加工的成熟蛋白酶的酶活性与从未修饰的蛋白酶加工的成熟蛋白酶的酶活性的比。用从修饰前体加工的蛋白酶的活性值除以从未修饰的前体加工时相同蛋白酶的活性值来测定产生比。相对活性是表示为百分数的产生比。本文中使用的术语“表达”指通过其来根据基因的核酸序列产生多肽的过程。该过程包含转录和翻译二者。
术语“百分比(% )同一性”定义为候选序列中与前体序列(即亲本序列)的氨基酸残基/核苷酸残基同一的氨基酸/核苷酸残基的百分比。用匹配的相同残基数除以比对区中“较长”序列的残基总数来测定%氨基酸序列同一性。氨基酸序列可以是相似的,但不是“同一的”,其中相对于参考序列在主题序列中取代、缺失或插入氨基酸。对于蛋白质,优选在就翻译后修饰而言处于相似的状态的序列间测量百分比序列同一性。通常,将主题蛋白质的“成熟序列”(即在去除信号序列的加工后保留的序列)与参考蛋白质的成熟序列相比较。在其他情况下,可以将主题多肽序列的前体序列与参考序列的前体相比较。本文中所用的术语“启动子”指发挥功能来指导下游基因的转录的核酸序列。在一些实施方案中,启动子适合于在其中表达靶基因的宿主细胞。启动子以及其他转录和翻译调节核酸序列(也称为“控制序列”)是表达给定基因所必需的。一般而言,转录和翻译调节序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列及增强子或激活序列。在将其分别置于与另一核酸或多肽序列的功能性关系中时,核酸或多肽是“有效连接的”。例如,如果启动子或增强子影响编码序列的转录,则它与该序列有效连接;如果为了便于翻译而放置核糖体结合位点,则它与编码序列有效连接;或者如果修饰的原区使得能够加工全长蛋白酶来产生酶的成熟活性形式,则它与蛋白酶的成熟区有效连接。一般而言,“有效连接的”意指所连接的DNA或多肽序列是连续的。“宿主细胞”指可用作包含本发明的DNA的表达载体的宿主的适宜细胞。适宜的宿主细胞可以是天然存在的或野生型的宿主细胞,或者它可以是改变的宿主细胞。在一个实施方案中,宿主细胞是革兰氏阳性微生物。在一些实施方案中,该术语指芽孢杆菌属中的细胞。本文中使用的“芽孢杆菌属物种”包含本领域技术人员已知的“芽孢杆菌属”内的所有物种,其包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、短小芽孢杆菌(B. pumilis)、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、 灿烂芽孢杆菌和苏云金芽孢杆菌。公认芽孢杆菌属持续经历分类学重组。因此,该属旨在包含已重新分类的物种,其包括但不限于如嗜热脂肪芽孢杆菌的生物,其现在命名为“嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus) ”。认为在存在氧的情况下产生抗性内生孢子是芽孢杆菌属的定义特征,虽然此特征也适用于最近命名的脂环酸芽孢杆菌属(Alicyclobacillus)、双芽孢杆菌属(Amphikicillus)、溶硫胺素芽孢杆菌属(Aneurinibacillus)、厌氧芽孢杆菌属(Anoxybacillus)、短芽孢杆菌属 (Brevibacillus)、Filobacillus、Gracilibacillus、耐盐芽抱杆菌属(Halobacillus)、类芽抱杆菌属(Paenibacillus)、Salibacillus、热杆菌属(Thermobacillus)、Ureibacillus 和支芽孢杆菌属(Virgikicillus)。本文中互换使用的术语“多核苷酸”和“核酸”指任意长度的核苷酸的聚合形式。 这些术语包括但不限于单链、双链DNA ;基因组DNA ;cDNA ;或包含嘌呤和嘧啶碱基,或其他天然的,化学、生物化学修饰的,非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的非限制性实例包含基因、基因片段、染色体片段、EST、外显子、内含子、mRNA、tRNA、rRNA、核酶、 cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任意序列的分离的DNA、任意序列的分离的RNA、核酸探针和引物。应理解,由于遗传密码的简并性,可以产生编码给定蛋白质的多个核酸序列。本文中使用的术语“DNA构建体”和“转化DNA”可互换使用,指用来将序列引入宿主细胞或生物中的DNA。可以通过PCR或本领域技术人员已知的任意其他适宜的技术来在体外产生DNA构建体。在一些实施方案中,DNA构建体包含目的序列(例如编码修饰蛋白酶的序列)。在一些实施方案中,序列与其他元件,如控制元件(例如启动子等)有效连接。 DNA构建体可以进一步包含选择标记。在一些实施方案中,DNA构建体包含与宿主细胞染色体同源的序列。在其他实施方案中,DNA构建体包含非同源序列。一旦在体外组装了 DNA构建体,即可以用它来诱变宿主细胞染色体的区域(即用异源序列取代内源序列)。本文中使用的术语“表达盒”指重组或合成产生的核酸构建体,其具有允许具体核酸在靶细胞中转录的一系列指定的核酸元件。可以将重组表达盒掺入载体,如质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。通常,除其他序列外,表达载体的重组表达盒部分包含待转录的核酸序列和启动子。在一些实施方案中,表达盒具有在宿主细胞中掺入和表达异源DNA片段的能力。许多原核和真核表达载体是市售的。适当的表达载体的选择在本领域技术人员的知识范围之内。术语“表达盒”在本文中可以与“DNA构建体”及它们的语法等同形式互换使用。适当的表达载体的选择在本领域技术人员的知识范围之内。本文中使用的术语“异源DNA序列”指并非天然存在于宿主细胞中的DNA序列。在一些实施方案中,异源DNA序列是由不同基因的部分(包含调节元件)组成的嵌合DNA序列。本文中使用的术语“载体”指设计用来将核酸引入一种或多种细胞类型中的多核苷酸构建体。载体包含克隆载体、表达载体、穿梭载体和质粒。在一些实施方案中,多核苷酸构建体包含编码全长蛋白酶(例如修饰蛋白酶或未修饰的前体蛋白酶)的DNA序列。本文中使用的术语“质粒”指用作克隆载体,且在一些真核生物或原核生物中形成染色体外自主复制的遗传元件,或整合入宿主染色体中的环状双链(ds) DNA构建体。本文在将核酸序列引入细胞的背景中使用的术语“引入”指适合用于将核酸序列转移入细胞中的任意方法。这类用于引入的方法包括但不限于原生质体融合、转染、转化、 接合和转导(参见例如 Ferrari 等,“Genetics,”在Hardwood等,(编辑),Bacillus,Plenum Publishing Corp.,57-72 页,[1989]中)。本文中使用的术语“转化”和“稳定转化”指具有整合入其基因组中或作为保持至少两代的附加型质粒的非天然(异源)多核苷酸序列的细胞。
修饰的蛋白酶本发明提供用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。该组合物包含编码在原区中具有至少一个突变的修饰蛋白酶的修饰多核苷酸;由该修饰多核苷酸编码的修饰的丝氨酸蛋白酶;包含编码该修饰蛋白酶的修饰多核苷酸的表达盒、DNA构建体和载体;及用本发明的载体转化的细菌宿主细胞。该方法包括用于增强成熟蛋白酶在细菌宿主细胞,例如芽孢杆菌属物种宿主细胞中的产生的方法。所产生的蛋白酶用于工业产生适合用于包括但不限于清洁、动物饲料和织物加工产业的多种产业中的酶。蛋白质跨膜转运的基本机制似乎是通用的,其重要特征在细菌和真核生物间保守。因为它们可以大量分泌某些蛋白质至培养基中,所以芽孢杆菌属物种用于酶,如碱性丝氨酸蛋白酶的工业产生。在体内,蛋白酶是从称为前蛋白酶原的前体蛋白酶产生的,该前蛋白酶原包含蛋白酶的前区(也称为信号肽)、原区和成熟区。跨芽孢杆菌属物种细胞膜的蛋白质分泌是复杂的过程,其包括前体蛋白质插入膜中和蛋白质跨细胞膜易位。前区用作蛋白质跨膜分泌的信号肽,并由信号肽酶水解。成熟过程的胞外部分包含蛋白酶原的折叠、 原区的自加工和原区的降解,以产生酶的活性成熟形式(Nagarj an V. Protein Secretion in "Bacillus subtilis and other Gram-Positive Bacteria,,Ch. 49,第 713-726 页, [1993] ;Ruan 等,Biochemistry,38 :8562-8571[2009])。在一些实施方案中,本发明提供编码修饰蛋白酶的修饰多核苷酸,该修饰蛋白酶是通过在前体蛋白酶的原多核苷酸中引入至少一个突变来产生的。该修饰多核苷酸产生自前体多核苷酸,该前体多核苷酸包含编码蛋白酶的原区的多核苷酸(原多核苷酸)和编码蛋白酶的成熟区的多核苷酸(成熟多核苷酸),其中修饰原多核苷酸为包含至少一个突变,以产生编码本发明的修饰蛋白酶的修饰多核苷酸。前体多核苷酸进一步包含编码信号肽的多核苷酸(前多核苷酸)。未修饰的蛋白酶的前区、原区和成熟区可以源自动物、植物或微生物来源的野生型或变体亲本蛋白酶。在一些实施方案中,未修饰的前体蛋白酶的原区和成熟区源自一种亲本蛋白酶,而前区源自不同的亲本蛋白酶。在其他实施方案中, 前区、原区和成熟区源自三种不同的亲本蛋白酶。在一些实施方案中,亲本蛋白酶是细菌来源的。在一些实施方案中,亲本蛋白酶是枯草蛋白酶型(枯草杆菌酶,枯草杆菌肽酶,EC 3. 4.21.62)蛋白酶,其包含催化活性氨基酸,也称为丝氨酸蛋白酶。在一些实施方案中,亲本蛋白酶是芽孢杆菌属物种蛋白酶。优选地,亲本蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的丝氨酸蛋白酶。
编码前体蛋白酶的前体多核苷酸在一些实施方案中,未修饰的前体多核苷酸编码包含亲本蛋白酶的成熟区的全长蛋白酶,如源自克劳氏芽孢杆菌和迟缓芽孢杆菌的蛋白酶,其同源物和变体,其与多核苷酸,例如
gctgaagaagcaaaagaaaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaa gtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaac gattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattg aagaggatgcagaagtaacgacaatg(SEQ ID NO 6)有效连接,该多核苷酸编码 SEQ ID NO :7 的原区
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAIS YIEEDAEVTTM(SEQ ID NO :7)。成熟亲本蛋白酶的实例包含野生型迟缓芽孢杆菌蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEffAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR (SEQ IDNO :9),及其变体,如
SEQ ID NO 11的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPSAELYAVKVLGASGSGAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR (SEQ IDNO 11); 野生型克劳氏芽孢杆菌PB92蛋白酶Maxacal (美国专利5,217,878) AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 13),及其变体,如 SEQ ID NO 15的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 15), SEQ ID NO 17的蛋白酶
AQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGMGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 17), SEQ ID NO 19的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPG EPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGGGSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 19), SEQ ID NO 21的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 21), SEQ ID NO 23的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNRQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO :23),和 SEQ ID NO 25的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR ; (SEQ ID NO 25)。
编码SEQ ID NO 9、11、13、15、17、19、21、23和25的成熟蛋白酶的多核苷酸的实例分别是图5中所示的SEQ ID吣8、10、12、14、16、18、20、22和对。应理解,由于遗传密码的简并性,多肽可以由一个以上核苷酸序列编码。
SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟蛋白酶彼此不同在于至多9个氨基酸(图1)。在一些实施方案中,SEQ ID NO :7的多肽原与SEQ ID NO :9、11、13、15、17、 19、21、23和25的成熟序列天然地且有效地连接。因此,在一些实施方案中,前体多核苷酸包含编码SEQ ID NO :7的原区的多核苷酸,该原区与选自SEQ ID NO :9、11、13、15、17、19、 21、23和25的成熟区有效连接,分别产生SEQ ID NO :38-46的原蛋白酶 SEQ ID NO 38
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 38), SEQ ID NO 39
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPSAELYAVKVLGASGSGAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSffSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 39) SEQ ID NO 40
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 40); SEQ ID NO 41
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 41); SEQ ID NO 42
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGMGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 42), SEQ ID NO 43
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGGGSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 43), SEQ ID NO 44
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 44); SEQ ID NO 45
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNRQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ;SEQ ID NO 45);禾口 SEQ ID NO 46
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR(SEQ ID NO :46).与SEQ ID NO :7的多肽原有效连接的其他成熟亲本蛋白酶包含来自芽孢杆菌属物种的成熟蛋白酶的同源物,如P27693嗜碱芽孢杆菌,例如SEQ ID NO 47 ;P20724芽孢杆菌属物种_YAB,例如SEQ ID NO :48 ;BAA25184芽孢杆菌属物种,例如SEQ ID NO 49 ; YP_174261克劳氏芽孢杆菌_KSM-K16,例如SEQ ID NO 50 ;BAA06157芽孢杆菌属物种 G-825-6 (SEQ ID NO 51);和 BAF34115_A_transvaalensis,例如 SEQ ID NO :52(图 3)。在一些实施方案中,未修饰的前体多核苷酸编码包含蛋白酶的成熟区的前体蛋白酶,该成熟区与有效连接至SEQ ID NO :7的多肽原的SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟区至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99%同一。对SEQ ID NO :7的原区的氨基酸序列进行BLAST查询揭示,除与P41362克劳氏芽孢杆菌和P27693嗜碱芽孢杆菌的天然存在的原区相同(图2)之外,SEQ ID NO :7的原区与来自GG36迟缓芽孢杆菌^7048(SEQ ID NO :53)、P20724芽孢杆菌属物种_丫六8 (SEQ ID NO: M)、BAA25184芽孢杆菌属物种(SEQ ID NO :55)、YP_174261克劳氏芽孢杆菌_KSM_K16 (例如 SEQ ID NO :56)、BAA06157 芽孢杆菌属物种 G-825-6(SEQ ID NO :57)和 BAF34115_A_ transvaalensis (例如SEQ ID NO :58)的蛋白酶的原区具有高度的同一性(图2)。预期在 SEQ ID NO :53-58的原区中产生,且对应于SEQ ID NO :7的增强其与之有效连接的成熟蛋白酶的产生的突变的突变将增强SEQ ID NO :53-58的原区与之有效连接的成熟蛋白酶的产生。因此,在一些实施方案中,未修饰的前体多核苷酸包含编码多肽原的原多核苷酸,该多肽原选自SEQ ID N0:53-58,且与SEQ ID NO :9的成熟蛋白酶,其变体和同源物有效连接。例如,编码选自SEQ ID NO 53-58的多肽原的原多核苷酸与SEQ ID NO 9的成熟蛋白酶的变体,例如SEQ ID NO :11、13、15、17、18、21、23和25有效连接。类似地,编码选自SEQ ID NO :53-58的多肽原的原多核苷酸与SEQ ID NO :9的成熟蛋白酶的同源物,例如SEQ ID NO 47-52有效连接。在其他实施方案中,未修饰的前体多核苷酸包含编码多肽原的原多核苷酸,该多肽原与SEQ ID NO 7的多肽原至少约60 %、至少约65 %、至少约70 %、至少约75%、 至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%同一,该 SEQ ID NO :7 的多肽原与 SEQ ID NO :9 的成熟蛋白酶或 SEQ ID NO :11、13、15、17、18、21、 23和25及47-52中的任一个有效连接。通过本领域已知的方法比对序列并测定同一性,通过直接比较分子间的序列信息来测定多核苷酸或多肽序列所具有的百分比同一性。适合用于测定序列相似性的算法的实例是描述于 Altschul 等,J. Mol. Biol.,215 :403-410(1990)中的 BLAST 算法。用于进行 BLAST分析的软件是通过National Center for Biotechnology ^formation 公开可得的。 该算法涉及首先通过在查询序列中鉴定长度W的短字串来鉴定高得分序列对(HSP),在与数据库序列中相同长度的字串比对时,其匹配或满足一定的正值阈值得分T。这些初始相邻字串命中作为起点来发现包含它们的更长HSP。字串命中沿所比较的两条序列的每一条在两个方向扩展,直至累积比对得分可以提高。当累积比对得分从最大达到值下降数量X ; 累积得分达到零或以下;或到达任一序列的末端时,字串命中的延伸就终止。BLAST算法参数W、T和X决定比对的灵敏性和速度。BLAST程序默认使用字长(W) 11、BL0SUM62评分矩阵(见 Henikoff&HenikofT,Proc. Natl. Acad. Sci. USA 89 :10915 (1989))、比对(B)50、期望值(E) 10、Μ’ 5、N’ -4和两条链的比较。然后BLAST算法进行两条序列间相似性的统计学分析(参见例如Kar 1 in和 Altschul,Proc. Nat'1. Acad. Sci. USA 90 :5873-5787[1993])。BLAST 算法提供的一种相似性的测量是最小总数概率(P(N)),其提供两条核苷酸或氨基酸序列间偶然发生匹配的概率的指示。例如,如果测试核酸与丝氨酸蛋白酶核酸的比较中的最小总数概率小于约0. 1、更优选小于约0. 01和最优选小于约0. 001,则认为核酸与本发明的丝氨酸蛋白酶核酸相似。 在测试核酸编码丝氨酸蛋白酶多肽时,如果比较产生小于约0. 5和更优选小于约0. 2的最小总数概率,则认为它与指定的丝氨酸蛋白酶核酸类似。用SEQ ID NO 7的原区来检索NCBI非丰余蛋白质数据库(2009年3月沈日版)。 按默认参数使用命令行BLAST程序(2.2. 17版)。将发现其具有与该原区(SEQ ID NO 7) 相似的序列的获得的序列划分为原区和成熟区,进一步按以下对其进行分析来产生图2和 3中所示的比对。用多重比对程序ClustalW和MUSCLE获得了多种丝氨酸蛋白酶的原区(图2)和成熟区(图3)与GG36的原区(SEQ ID NO 7)和成熟区(SEQ ID NO 9)的氨基酸序列比对。 首先以默认参数用程序Clustaiwa. 83版)进行比对。以默认参数用程序MUSCLE(3. 51版) 将比对精练五倍。比对中仅选择对应于成熟区或原区的区域。用在所讨论的两条序列间比对的相同残基数除以比对中比对的残基数来计算百分比同一性。如上文所讨论,比对显示, 存在与GG36的原区序列(SEQ ID NO 7)和成熟区序列(SEQ ID NO 9)具有高度氨基酸同一性的几个原序列和成熟序列。在一些实施方案中,除编码蛋白酶原外,未修饰的前体多核苷酸进一步包含编码与蛋白酶原有效连接的信号肽的前多核苷酸。在一些实施方案中,该信号肽是由多核苷酸 gtgagaagcaaaaaattgtggatcagcttgttgtttgcgttaacgttaatctttacgatggcgttcagcaacatgtc tgcgcaggct (SEQ ID NO 2)编码的 AprE 信号肽 VRSKKLWISLLFALTLIFTMAFS匪SAQA (SEQ ID NO 3)。在其他实施方案中,该信号肽是由多核苷酸gtgagaagcaaaaaattgtggatcgtcgcgtcg accgcactactcatttctgttgcttttagttcatcgatcgcatcggct (SEQ ID NO 4)编码的融合信号肽 VRSKKLWIVASTALLISVAFSSSIASA(SEQ ID NO :5)。还在其他实施方案中,前体多核苷酸包含编码与蛋白酶原天然地且有效地连接的信号肽的多核苷酸。可以使可以实现修饰的蛋白酶在芽孢杆菌属物种宿主细胞中的有效分泌的任意信号序列与本发明的蛋白酶原有效连接。 这类信号肽包含指导蛋白质通过细菌分泌途径,例如Sec途径、TAT途径分泌的细菌来源的信号肽,及适用于在原核宿主细胞中表达蛋白质的真核信号序列(EP1481059B1)。 编码修饰蛋白酶的修饰多核苷酸通过在与成熟蛋白酶有效连接的SEQ ID NO 7的多肽原的位置1_84上的氨基酸中的任一个上引入至少一个突变来修饰上述未修饰的前体多核苷酸,以编码修饰蛋白酶。 在一些实施方案中,该至少一个突变是氨基酸取代。在一些实施方案中,该修饰多核苷酸编码至少在选自SEQ ID NO 7的多肽原的位置 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、 79、80、81、82、83和84的一个氨基酸位置上氨基酸取代,该SEQ ID NO 7的多肽原与成熟蛋白酶有效连接,该成熟蛋白酶与SEQ ID NO :9的成熟蛋白酶至少60%同一。在一些实施方案中,该成熟蛋白酶与SEQ ID NO :9的成熟区至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%、至少约99% 同一。与SEQ ID N0:9的成熟蛋白酶(迟缓芽孢杆菌蛋白酶GG36)至少60%同一的成熟蛋白酶包含野生型克劳氏芽孢杆菌PB92蛋白酶Maxacal (SEQ ID NO 13)及其变体,如SEQ ID NO 11, SEQ ID NO :15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21、SEQ ID NO 23 和SEQ ID NO :25 JPSEQ ID NO :9的同源物,包括来自芽孢杆菌属物种的成熟蛋白酶的同源物,如:P27693嗜碱芽孢杆菌,例如SEQ ID NO 47 ;P20724芽孢杆菌属物种_YAB,例如 SEQ ID NO 48 ;BAA25184芽孢杆菌属物种,例如SEQ ID NO 49 ;YP_174261克劳氏芽孢杆菌_1 ]\1-1(16,例如 SEQ ID NO :50 ;ΒΑΑ06157 芽孢杆菌属物种 G-825-6(SEQ ID NO :51);禾口 BAF34115_A_transvaalensis,例如SEQ ID NO :52(图3)。优选地,该修饰的原多核苷酸编码至少在选自SEQ ID NO 7的多肽原的位置6、30和32的位置上的一个氨基酸上突变,该 SEQ ID NO :7的多肽原与SEQ ID NO :9、11、13、15、17、19、21、23和25的蛋白酶中的任一个的成熟蛋白酶有效连接。该至少一个突变是位置6和/或30上的谷氨酸(E)的氨基酸取代;和/或位置32上的丙氨酸㈧的氨基酸取代。取代SEQ ID NO 7的原区的位置6和/ 或30上的谷氨酸(E)和/或位置32上的丙氨酸(A)的其它19种氨基酸中的任一个旨在可以用来编码修饰蛋白酶,以比从对应的未修饰的前体蛋白质的加工获得的水平高的水平从该修饰蛋白酶产生成熟形式。在一些实施方案中,该至少一个突变是选自以下取代的取代SEQ ID NO 7 的多肽原的 E6A, E6R, E6C, E6Q, E6H, E6I, E6K, E6L, E6M, E6S, E6Y,E6N, E6G, E6F, E6P, E6T, E6W, E6V, E30A, E30R, E30N, E30D, E30G, E30H, E30L, E30K, E30F, E30S, E30T, E30V, E30R, E30Q, E30G, E30I, E30L, E30M, E30F, E30P, E30T, E30W, E30Y, E30C, E30M, E30F E30V, A32K, A32T, A32Q, A32S, A32V, A32L 禾口 A32F。例如,在 SEQ ID NO 7 的原区中产生选自 E6A、E6R、E6C、E6Q、E6H、E6I、E6K、E6M、E6S、E6Y、E30A、E30R、E30N、E30D、 E30Q, E30G、E30L、E30M、E30P、E30S、E30T、E30W、E30Y、E30V、A32、A32R、A32C、A32E、A32G、 A32L、A32K、A32F、A32T、A32Y和A32V的取代中的任一个,以产生SEQ ID NO 17的成熟蛋白酶;在 SEQ ID NO 7 的原区中产生选自 E6A、E6R、E6N、E6C、E6Q、E6G、E6H、E6M、E6F、E6P、 E6S、E6T、E6W、E6V、A3I、A32T和A32V的取代中的任一个,以产生SEQ ID NO 9的成熟蛋白酶;在 SEQ ID NO 7 的原区中产生选自 E6A、E6H、E6K、E6R、E30A、E30R、E30N、E30D、E30G、 E30H、E30L、E30K、E30F、E30S、E30T 和 E30V 的取代中的任一个,以产生 SEQ ID NO 19 的成熟蛋白酶;在 SEQ ID NO :7 的原区中产生选自 E6A、E6R、E6Q、E6G、E6L、E6K、E6M、E6F、E6T、 E6V、E30R、E30Q, E30G、E30I、E30L、E30M、E30F、E30P、E30T、E30W, E30Y、E30V、A32Q, A32S、 A32T和A32V的取代中的任一个,以产生SEQ ID NO 11的成熟蛋白酶;在SEQ ID NO 7的原区中产生选自 E30A、E30R、E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、 A32F和A32V的取代中的任一个,以产生SEQ ID NO :21的成熟蛋白酶。与表达自在与之有效连接的SEQ ID NO :7的原区中不包含该至少一个取代的前体蛋白酶的成熟蛋白酶的产生相比时,该至少一个取代增强成熟蛋白酶的产生。 在一些其他实施方案中,SEQ ID NO 7的原区的修饰包含突变的组合。例如,SEQ ID NO :7的原区的修饰包含至少两个取代的组合。在其他实施方案中,SEQ ID NO :7的原区的修饰包含至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个取代的组合。该原区的修饰还包含至少一个取代和一个缺失的组合;至少一个取代和至少一个插入的组合;至少一个插入和一个缺失的组合;及至少一个取代、至少一个缺失和至少一个插入的组合。优选地,SEQ ID NO 7的原区的修饰包含在位置6和30 (即 E6X-E30X)、6和32 (即E6X-A32X)或30和32 (即E30X-A32X)上导致取代的组合的至少两个取代。例如,该修饰多核苷酸编码包含选自以下的取代组合的原区
E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K,E6M-A32K,E6P-A32K,E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G,E6S-E30G,E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。例如,SEQ ID NO 7 的原区的修饰包含选自 E6R-A32K,E6N-A32K,E6D-A32K,E6I-A32K,E6K-A32K,E6M-A32K,E6P-A32K,E6S-A32K, E6T-A32K、E6N-A32K、E30W-A32K 和 E30V-A32K 的至少两个取代的组合,以产生 SEQ ID NO 9的成熟蛋白酶;SEQ ID NO 7的原区的修饰包含选自E6A-E30G、E6R-E30G、E6C-E30G、E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、E6S-E30G、E6W-E30G、E30G-A32R, E30G-A32Q, E30G-A32E、E30G-A32G、E30G-A32H、E30G-A32I、E30G-A32K、E30G-A32S、E30G-A32T、 E30G-A32W、E30G-A32V的至少两个取代的组合,以产生SEQ ID NO :17的成熟蛋白酶;SEQ ID NO :7 的原区的修饰包含选自 E6A-E30G、E6R-E30G、E6N-E30G、E6D-E30G、E6C-E30G、 E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、E6M-E30G、E6F-E30G、E6P-E30G、E6S-E30G、 E6T-E30G、E6W-E30G、E6V-E30G、E6Y-E30G 的至少两个取代的组合,以产生 SEQ ID NO 19的成熟蛋白酶;SEQ ID NO :7的原区的修饰包含选自E6A-E30S、E6G-E30S、E6L-E30S、 E6K-E30S、E6F-E30S、E6P-E30S、E6Y-E30S、E6V-E30S、E30S-A32R, E30S-A32N、E30S-A32D, E30S-A32C、E30S-A32Q、E30S-A32E、E30S-A32G、E30S-A32H、E30S-A32L、E30S-A32K、 E30S-A32M、E30S-A32F、E30S-A32P、E30S-A32S、E30S-A32T、E30S-A32W、E30S-A32Y 禾P E30S-A32V的至少两个取代的组合,以产生SEQ ID NO 21的成熟蛋白酶。SEQ ID NO 7的原区的修饰的其他实例包含在位置6、30和32上导致取代的组合(即E6X-E30X-A32X)的至少三个取代。例如,SEQ ID NO :7的原区的修饰包含选自E6G-E30G-A32E、E6G-E30G-A32S、 E6G-E30G-A32T、E6G-E30G-A32W的至少三个取代的组合,以产生SEQ ID NO 17的成熟蛋白酶。与表达自在与之有效连接的SEQ ID NO :7的原区中不包含该至少两个或三个取代的前体蛋白酶的成熟蛋白酶的产生相比时,该至少两个或三个取代增强成熟蛋白酶的产生。本领域中已知适合用于产生本发明的修饰多核苷酸序列的几种方法,其包括但不限于位点饱和诱变、扫描诱变、插入诱变、缺失诱变、随机诱变、位点定向诱变和定向进化, 以及多种其他重组方法。常用的方法包括DNA改组(Stemmer WP, Proc Natl Acad Sci U S A. 25 ;91 (22) :10747-51 [1994]);基于基因的非同源重组的方法,例如ITCHY(Ostermeier 等,Bioorg Med Chem. 7(10) :2139-44[1999])、SCRACHY(Lutz 等 Proc Natl Acad Sci U S A. 98(20) :11248-53[2001])、SHIPREC (Sieber 等,Nat Biotechnol. 19(5) :456-60 [2001]) 和 NRR(Bittker 等,Nat Biotechnol. 20(10) 1024-9 [2001] ;Bittker 等,Proc Natl Acad Sci U S A. 101(18) :7011_6[2004]);依赖于用寡核苷酸插入随机和靶向的突变、 缺失和 / 或插入的方法(Ness 等,Nat Biotechnol. 20(12) :1251-5[2002] ;Coco 等,Nat Biotechnol. 20(12) 1246-50 [2002] ;Zha 等,Chembiochem. 3 ;4(1) :34_9[2003] ;Glaser 等,J Immunol. 149(12) :3903-13 [1992] ;Sondek 和 Shortle,Proc Natl Acad Sci U S
A 89(8) :3581-5[1992] ; Yafiez 等,Nucleic Acids Res. 32(20) :el58[2004] ;Osuna
等,Nucleic Acids Res. 32(17) :el36[2004] ;Gaytan 等,Nucleic Acids Res. 29(3) E9[2001];和 GayWn 等,Nucleic Acids Res. 30(16) :e84[2002])。除编码修饰的蛋白酶原外,修饰的前体多核苷酸进一步包含编码信号肽的前多核苷酸。在一些实施方案中,该信号肽是由SEQ ID NO :2的多核苷酸编码的AprE信号肽(SEQ ID NO :3)。例如,全长修饰前体蛋白酶包含SEQ ID NO 的蛋白酶,其中该前体蛋白酶的原区包含至少一个突变。在一些实施方案中,该至少一个突变是在等同于SEQ ID N0:7的原区的位置6、30或32的位置上产生的氨基酸取代。备选地,该信号肽是由SEQ ID NO 4的多核苷酸编码的SEQ ID NO :5的融合信号肽。与成熟蛋白酶天然连接的信号肽也可以用来表达本文中所述的全长修饰蛋白酶。可以修饰为在选自SEQ ID N0:7的原区的6、30和32 的位置上包含至少一个氨基酸取代的全长前体蛋白酶的实例包含
SEQ ID NO 59的全长蛋白酶VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPSAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGL VNAEAATR\ SEQ ID NO :59); SEQ ID NO 60的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNS1GVLGVAPSAELYAVKVLGASGS GAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANA MAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSW SNVQIRNHLKNTATSLGSTNL YGSGLVNAEAATR] SEQ ID NO :60); SEQ ID NO 61的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAYSEFVEQVEANDEVAILSEEEEYEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAA TR] SEQ ID NO 61); SEQ ID NO 62的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQAAEEAKEKYLIGFN EQEAVSEFVEQVEAN DEVAILSEEEEV EIELLEEFETIPYLSYELSPEmMLELOPAISYIEEMEYTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGS GSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR\ SEQ ID NO 62); SEQ ID NO 63的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEV
EIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGM GSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAA TR\ SEQ ID NO 63); SEQ ID NO 64的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEV EIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGG GSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAATR, SEQ ID NO :64);SEQ ID NO 65的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVE QVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTT M AQSVPWGISRVQAPAAHNRGLTGSGVKVA
VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR] SEQ ID NO 65),
SEQ ID NO 66的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVE QVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTT M AQSVPWGISRVQAPAAHNRGL TGSG VKVA
VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNRQIRNHLKNTATSLGSTNL YGSGLVNAEAAT, SEQ ID NO :66);禾口
SEQ ID NO 67的全长蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVE IELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR\ SEQ ID NO :67).。 前区(信号肽;SEQ ID NO 3)以黑体显示,原区(SEQ ID NO :7)下划线,成熟区为斜体。 如之前所描述,除与P41362克劳氏芽孢杆菌和P27693嗜碱芽孢杆菌的天然存在的原区相同(图2)之外,SEQ ID NO :7的原区与来自以下的蛋白酶的原区的氨基酸序列具有高度同一性GG36迟缓芽孢杆菌^7048(SEQ ID NO 53) ;P207M芽孢杆菌属物种_ YAB (SEQ ID NO 54) ;BAA25184 芽孢杆菌属物种(SEQ ID NO 55) ;YP_174261 克劳氏芽孢杆菌_1 ]\1-1(16,例如 SEQ ID NO :56 ;ΒΑΑ06157 芽孢杆菌属物种 G-825-6(SEQ ID NO :57);禾口 BAF34115_A_transvaalensis,例如 SEQ ID NO :58 (图 2)。预期在 SEQ ID NO :53-58 的原区中产生,且对应于SEQ ID NO :7的增强其与之有效连接的成熟蛋白酶的产生的突变的突变将增强SEQ ID NO :53-58的修饰原区与之有效连接的成熟蛋白酶的产生。例如,可以修饰编码SEQ ID NO :53-58的原区的修饰多核苷酸中的任一个,以至少在选自位置1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83 和84的一个氨基酸位置上编码氨基酸取代,其中,通过与SEQ ID NO :7的多肽原的氨基酸序列对应来编号位置。优选地,修饰编码SEQ ID NO :53-58的原区的修饰多核苷酸中的任一个,以至少在选自位置6、30和32的位置上的一个氨基酸上编码突变。在一些实施方案中,选自位置6、30和32的该至少一个突变是选自以下取代的取代E6A、E6R、E6C、E6Q、
E6H, E6I,E6K,E6L, E6M, E6S, E6Y, E6N, E6G, E6F, E6P, E6T, E6W, E6V, E30A, E30R, E30N, E30D, E30G, E30H, E30L, E30K, E30F, E30S, E30T, E30V, E30R, E30Q, E30G, E30I,E30L,E30M, E30F, E30P, E30T, E30W, E30Y, E30C, E30M, E30F E30V, A32K, A32T, A32Q, A32S, A32V, A32L 和A32F,其中,通过与SEQ ID NO :7的多肽原的氨基酸序列对应来编号位置。在其他实施方案中,该修饰多核苷酸编码包含取代组合的原区,该取代组合选自在位置6和32上(即 E6X-E30X)、在位置30和32上(即E30X-A32X)产生的取代组合。例如,该修饰多核苷酸编码包含选自以下的取代组合的原区E6R-A32K、
E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K,E6S-A32K,E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G,E6W-E30G, E30G-A32R,E30G-A32Q,E30G-A32E,E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y和E30S-A32V,其中,通过与SEQ ID NO 7的多肽原的氨基酸序列对应来编号位置。还在其他实施方案中,该修饰多核苷酸编码包含选自以下的取代组合的原区E6G-E30G-A32E、E6G-E30G-A32S、E6G-E30G-A32T、E6G-E30G-A32W,其中,通过与 SEQ ID NO :7的多肽原的氨基酸序列对应来编号位置。使上述修饰为包含至少一个、两个或三个取代的SEQ ID NO 7和53-58的原区中的任一个与成熟蛋白酶有效连接,该成熟蛋白酶与SEQ ID NO 9的成熟蛋白酶至少60%同一。与SEQ ID NO 9的成熟蛋白酶(迟缓芽孢杆菌蛋白酶GG36)至少60%同一的成熟蛋白酶包含野生型克劳氏芽孢杆菌PB92蛋白酶 Maxacal (SEQ ID NO 13)及其变体,如 SEQ ID NO 11、SEQ ID NO 15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21、SEQ ID NO 23 和 SEQ ID NO 25 ;和 SEQ ID NO 9 的同源物,包括来自芽孢杆菌属物种的成熟蛋白酶的同源物,如P27693嗜碱芽孢杆菌,例如SEQ ID NO 47 ;P207M芽孢杆菌属物种_丫々8,例如SEQ ID NO 48 ;BAA25184芽孢杆菌属物种,例如SEQ ID NO :49 ;YP_174261 克劳氏芽孢杆菌 _KSM-K16,例如 SEQ ID NO :50 ;BAA06157 芽孢杆菌属物种 G-825-6 (SEQ IDNO 51);和 BAF34115_A_transvaalensis,例如 SEQ ID NO :52(图 3)。 修饰为包含上述至少一个取代,且有效连接至与SEQ ID NO :9的成熟多肽至少 60%同一的成熟多肽的SEQ ID NO 7和53-58的原区中的任一个进一步与信号肽有效连接。优选地,该信号肽是由SEQ ID NO :2的多核苷酸编码的AprE信号肽(SEQ ID NO :3)。 备选地,该信号肽是由 SEQ ID NO 4 的多核苷酸 gtgagaagcaaaaaattgtggatcgtcgcgtcga ccgcactactcatttctgttgcttttagttcatcgatcgcatcggct (SEQ ID NO 4)编码的融合信号肽 VRSKKLWIVASTALLISVAFSSSIASA(SEQ ID NO :5)。可以使可以实现修饰蛋白酶在芽孢杆菌属物种宿主细胞中的有效分泌的任意信号序列与本发明的蛋白酶原有效连接。这类信号肽包含指导蛋白质通过细菌分泌途径,例如Sec途径、TAT途径分泌的细菌来源的信号肽,及适用于在原核宿主细胞中表达蛋白质的真核信号序列(EP1481059B1)。可以在前蛋白酶原的原区中等同的氨基酸位置上引入在SEQ ID NO :7的原区中产生的位置6、30和/或32上的至少一个氨基酸取代,以增强成熟蛋白酶的产生,其中该信号肽可以选自SEQ ID NOS :3和5的信号肽;与蛋白酶原天然地且有效地连接的信号肽;及可以实现修饰蛋白酶在芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌中有效分泌的任意信号序列。如上文所指出,在一些实施方案中,本发明提供包含前述修饰多核苷酸的载体。在一些实施方案中,该载体是表达载体,其中编码本发明的修饰蛋白酶的修饰多核苷酸序列与有效的基因表达所需的其他区段(例如与目的基因有效连接的启动子)有效连接。在一些实施方案中,以基因自身的同源启动子(如果它是已知的,即由宿主转录)和外源的或由蛋白酶基因的内源终止子区提供的转录终止子提供这些必需元件。在一些实施方案中,还包含选择基因,如抗生素抗性基因,其使得能够通过在含有抗微生物剂的培养基中培养来持续培养维持质粒感染的宿主细胞。在一些实施方案中,该表达载体衍生自质粒或病毒DNA,或者在备选实施方案中, 包含二者的元件。示例性载体包括但不限于pXX、pC194、ρJHlOU pE194、pHP13 (Harwood 禾口 Cutting(编辑),Molecular BioloRical Methods for Bacillus, John ffiley&Sons, [1990],尤其是第3章;适合用于枯草芽孢杆菌的复制质粒包含92页上所列的那些; Perego, M. (1993)Integrational Vectors for Genetic Manipulations in Bacillus subtilis,p. 615-624 ;A. L Sonenshein, J. A. Hoch禾口 R. Losick(编辑),Bacillus subtilis and other Gram-positive bacteria :biochemistry,physiology and molecular genetics,American Society for Microbiology,Washington,D· C·)0为了在细胞中表达和产生目的蛋白质,例如蛋白酶,在适合用于表达该蛋白酶的条件下将包含编码修饰蛋白酶的多核苷酸的至少一个拷贝,且优选包含多个拷贝的至少一个表达载体转化入该细胞中。在一些具体实施方案中,编码蛋白酶的序列(以及包含于载体中的其他序列)整合入宿主细胞的基因组中,而在其他实施方案中,质粒作为自主染色体外的元件保留在细胞内。因此,本发明提供染色体外的元件以及整合入宿主细胞基因组中的输入序列二者。预期本文中所述的各载体将用于本发明中。在一些实施方案中,编码修饰蛋白酶的多核苷酸构建体存在于整合载体(例如PJH-GG36 ;图4)上,该整合载体使得能够将修饰多核苷酸整合入细菌染色体中和可选地扩增。整合位点的实例包括但不限于 aprE、amyE、veg或pps区。事实上,考虑将本领域技术人员已知的其他位点用于本发明中。 在一些实施方案中,通过对所选择的前体蛋白酶而言是野生型启动子的启动子来实现编码修饰蛋白酶的多核苷酸的转录。在一些实施方案中,启动子对前体蛋白酶而言是异源的,但在宿主细胞中是具有功能的。具体而言,适合用于细菌宿主细胞中的启动子的实例包括但不限于 amyE、amyQ、amyL、pstS、sacB、pSPAC、pAprE、pVeg、pHpall 启动子,嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因、解淀粉芽孢杆菌(BAN)淀粉酶基因、枯草芽孢杆菌碱性蛋白酶基因、 克劳氏芽孢杆菌碱性蛋白酶基因、短小芽孢杆菌木糖苷酶基因、苏云金芽孢杆菌cryIIIA 和地衣芽孢杆菌α-淀粉酶基因的启动子。在一些实施方案中,启动子是具有以下序列的 AprE启动子gaattcctccattttcttctgctatcaaaataacagactcgtgattttccaaacgagctttcaaaaaagcc tctgccccttgcaaatcggatgcctgtctataaaattcccgatattggttaaacagcggcgcaatggcggccgcat ctgatgtctttgcttggcgaatgttcatcttatttcttcctccctctcaataattttttcattctatcccttttct gtaaagtttatttttcagaatacttttatcatcatgctttgaaaaaatatcacgataatatccattgttctcacgg aagcacacgcaggtcatttgaacgaattttttcgacaggaatttgccgggactcaggagcatttaacctaaaaaa gcatgacatttcagcataatgaacatttactcatgtctattttcgttcttttctgtatgaaaatagttatttcga gtctctacggaaatagcgagagatgatatacctaaatagagataaaatcatctcaaaaaaatgggtctactaaaa tattattccatctattacaataaattcacagaatagtcttttaagtaagtctactctgaatttttttaaaaggag agggtaaaga (SEQ ID N0:1)·。
其他启动子包括但不限于A4启动子,以及λ噬菌体1\或1\启动子和大肠杆菌 (E. coli) lac、trp 或 tac 启动子。在包括细菌和真菌的任意适宜的革兰氏阳性微生物的宿主细胞中产生前体和修饰蛋白酶。例如,在一些实施方案中,在真菌和/或细菌来源的宿主细胞中产生修饰蛋白酶。在一些实施方案中,宿主细胞是芽孢杆菌属物种、链霉菌属物种(Sti^ptomyces sp.)、 埃希氏菌属物种(Escherichia sp.)或曲霉属物种(Aspergillus sp.)。在一些实施方案中,通过芽孢杆菌属物种宿主细胞产生修饰蛋白酶。用于产生本发明的修饰蛋白质的芽孢杆菌属物种宿主细胞的实例包括但不限于地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、 解淀粉芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌、克劳氏芽孢杆菌和巨大芽孢杆菌,以及芽孢杆菌属内的其他生物。在一些实施方案中,使用枯草芽孢杆菌宿主细胞。美国专利 5,沈4,366和4,760,025 (RE 34,606)描述了用于本发明中的多种芽孢杆菌属宿主菌株,虽然其他适宜的菌株也用于本发明中。用于本发明中的几种工业菌株包含非重组(即野生型)芽孢杆菌属物种菌株,以及天然存在的菌株的变体和/或重组菌株。在一些实施方案中,宿主菌株是重组菌株,其中已将编码目的多肽的多核苷酸引入该宿主中。在一些实施方案中,宿主菌株是枯草芽孢杆菌宿主菌株,尤其是重组枯草芽孢杆菌宿主菌株。已知许多枯草芽孢杆菌菌株,其包括但不限于 1A6 (ATCC 39085)、168 (1A01)、SB19、W23、Ts85、B637、PB1753 至 PB1758、PB3360、 JH642、1A243(ATCC 39, 087),ATCC 21332、ATCC6051、MI113、DE100(ATCC 39,094)、GX4931、 PBT 110和PEP 211菌株(参见例如Hoch等,Genetics,73 :215-2沘[1973];还见美国专利号4,450,235、美国专利号4,302,544和EP 0134048 ;其中每一篇以其整体引入作为参考)。枯草芽孢杆菌作为表达宿主的用途为本领域公知(参见例如I^lva等,Gene 19 81-87[1982] ;Fahnestock 和 Fischer, J. Bacteriol.,165 :796-804[1986];和 Wang 等, Gene 69 :39-47[1988])。在一些实施方案中,芽孢杆菌属宿主是在以下基因的至少一个中包含突变或缺失的芽孢杆菌属物种degU、degS、degR和degQ。优选地,突变在degU基因中,且更优选地, 突变是 degU(Hy)32。(参见例如 Msadek 等,J. Bacteriol.,172 :824-834 [1990];和 Olmos 等,Mol. Gen. Genet.,253 :562-567 [1997])。优选的宿主菌株是携带 degU32 (Hy)突变的枯草芽孢杆菌。在一些其他实施方案中,芽孢杆菌属宿主在scoC4(参见例如Caldwell 等,J. Bacteriol.,183 :7329-7340[2001]), spoIIE(参见 Arigoni 等,Mol. Microbiol.,31 :1407-1415 [1999])和/或oppA或opp操纵子的其他基因(参见例如Perego等,Mol. Microbiol. ,5 173-185[1991])中包含突变或缺失。事实上,考虑将opp操纵子中导致与 oppA基因中的突变相同的表型的任意突变用于本发明的改变的芽孢杆菌属宿主的一些实施方案中。在一些实施方案中,这些突变单独存在,而在其他实施方案中,存在突变的组合。 在一些实施方案中,可以用来产生本发明的修饰蛋白酶的改变的芽孢杆菌属是已在上文提到的一个或多个基因中包含突变的芽孢杆菌属宿主菌株。此外,还使用包含内源蛋白酶基因的突变和/或缺失的芽孢杆菌属物种宿主细胞。在一些实施方案中,芽孢杆菌属宿主细胞包含aprE和nprE基因的缺失。在其他实施方案中,芽孢杆菌属物种宿主细胞包含5个蛋白酶基因的缺失(US20050202535),而在其他实施方案中,芽孢杆菌属物种宿主细胞包含 9个蛋白酶基因的缺失(US200502025;35)。使用本领域已知的任意适宜的方法,用编码本发明的修饰蛋白酶的修饰多核苷酸转化宿主细胞。无论将修饰多核苷酸整合入载体中,还是在不存在质粒DNA的情况下使用, 都将它引入微生物中,在一些实施方案中,优选引入大肠杆菌细胞或感受态芽孢杆菌属细胞中。涉及质粒构建体和质粒向大肠杆菌中的转化的用于将DNA引入芽孢杆菌属细胞中的方法是公知的。在一些实施方案中,随后从大肠杆菌分离质粒,并转化入芽孢杆菌属中。但是,并非必需使用中间微生物,如大肠杆菌,在一些实施方案中,直接将DNA构建体或载体引入芽孢杆菌属宿主中。本领域技术人员清楚意识到适合用于将多核苷酸序列引入芽孢杆菌属细胞中的方法(参见例如 Ferrari 等,“Genetics,” 在 Harwood 等(编辑),Bacillus, Plenum Publishing Corp. [1989],57-72 页中;Saunders 等,J. Bacteriol. , 157 :718-726 [1984]; Hoch 等,J. Bacteriol. ,93 1925-1937 [ 1967] ;Mann 等,Current Microbiol. ,13 131-135[1986] ;Holubova, Folia Microbiol. ,30 :97 [1985] ;Chang 等,Mol. Gen. Genet., 168 11-115[1979] ;Vorobjeva 等,FEMS Microbiol. Lett.,7 :261-263[1980] ;Smith 等, Appl. Env. Microbiol. ,51 634[1986] ;Fisher 等,Arch. Microbiol.,139 :213-217[1981]; 和 McDonald,J. Gen. Microbiol.,130 :203[1984])。事实上,诸如转化(包括原生质体转化和中板集合(congression))、转导和原生质体融合的这类方法是已知的,且适合用于本发明中。用转化的方法将本发明提供的DNA构建体引入宿主细胞中。本领域已知的转化芽孢杆菌属的方法包括诸如质粒标记拯救转化的方法,该方法涉及携带部分同源的存留质粒(resident plasmid)的感受态细胞摄取供体质粒(Contente等, Plasmid2 :555-571 [1979] ;Haima 等,Mol. Gen. Genet.,223 185-191[1990] ;Weinrauch 等,J. Bacteriol. ,154 1077-1087 [1983];禾口 Weinrauch 等,J. Bacteriol. ,169 1205-1211 [1987])。在此方法中,输入的供体质粒在模拟染色体转化的过程中与居民“辅助”质粒的同源区重组。除常用方法外,在一些实施方案中,直接转化宿主细胞(即在引入宿主细胞之前不用中间细胞来扩增或以其他方式加工DNA构建体)。DNA构建体向宿主细胞中的引入包括本领域已知的,在不插入质粒或载体的情况下将DNA引入宿主细胞中的那些物理和化学方法。这类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在其他实施方案中, 将DNA构建体与质粒共转化,而不插入质粒中。在其他实施方案中,通过本领域已知的方法从改变的芽孢杆菌属菌株缺失选择标记(见Mahl等,J. Bacteriol.,158 :411-418 [1984];和 Palmeros 等,Gene 247 :255-264[2000])。在一些实施方案中,在常规营养培养基中培养本发明的转化的细胞。适宜的具体培养条件,如温度、PH等为本领域技术人员已知。此外,一些培养条件可以见于科学文献中, 如 Hopwood(2000)Practical Streptomvces Genetics, John Innes Foundation, Norwich UK ;Hardwood 等,(1990)Molecular Biological Methods for Bacillus, John Wiley 和来自美国典型培养物保藏中心(ATCC)。在一些实施方案中,在允许表达该蛋白酶的条件下将编码修饰蛋白酶的多核苷酸序列转化的宿主细胞培养在适宜的营养培养基中,然后从培养物回收产生的蛋白酶。用来培养细胞的培养基包含适合用于培养宿主细胞的任意常规培养基,如包含适当补充物的基本培养基或复合培养基。适宜的培养基可以从供应商获得,或者可以按照公开的配方(例如美国典型培养物保藏中心的目录中)制备。在一些实施方案中,通过常规方法从培养基回收由细胞产生的蛋白酶,该方法包括但不限于通过离心或过滤从培养基分离宿主细胞、 利用盐(例如硫酸铵)沉淀上清或滤液的蛋白质成分、层析纯化(例如离子交换、凝胶过滤、亲和力等)。因此,将适合用于回收本发明的蛋白酶的任意方法用于本发明中。事实上, 本发明并非旨在限于任意具体的纯化方法。包含本发明的修饰蛋白酶的由重组宿主细胞产生的蛋白质分泌进入培养基中。在一些实施方案中,其他重组构建将异源或同源多核苷酸序列与编码便于纯化可溶性蛋白质的蛋白酶多肽结构域的核苷酸序列连接(Kroll DJ等(1993)DNA Cell Biol 12 :441-53)。 这类便于纯化的结构域包括但不限于金属螯合肽,如组氨酸-色氨酸组件,其允许在固定化金属上纯化(Porath J(1992)Protein Expr Purif 3:263-281);蛋白 A 结构域,其允许在固定化免疫球蛋白上纯化;和用于FLAGS延伸/亲和纯化系统的结构域(Immunex Corp, Seattle WA)。在纯化结构域和异源蛋白质之间包含可切割的接头序列,如因子XA或肠激酶(Invitrogen, San Diego CA)也用于便于纯化。如上文所指出,本发明提供编码修饰全长蛋白酶的修饰全长多核苷酸,通过芽孢杆菌属宿主细胞加工该修饰全长蛋白酶来以这样的水平产生成熟形式,该水平高于在相同条件下通过芽孢杆菌属宿主细胞从未修饰的全长酶加工时相同成熟蛋白酶的产生水平。产生水平由分泌酶的活性水平决定。产生的一个度量(measure)可以测定为相对活性,其表示为从修饰蛋白酶加工时成熟形式的酶活性值与从未修饰的前体蛋白酶加工时成熟形式的酶活性值之比的百分数。相对活性等于或大于100%表明以这样的水平产生从修饰前体加工的蛋白酶的成熟形式,该水平等于或高于从未修饰的前体加工时产生相同成熟蛋白酶的水平。因此,在一些实施方案中,在与对应的从未修饰的前体蛋白酶加工的蛋白酶的成熟形式的产生相比时, 从修饰蛋白酶加工的成熟蛋白酶的相对活性是至少约100%、至少约110%、至少约120%、 至少约130%、至少约140%、至少约150%、至少约160%、至少约170%、至少约180%、至少约190%、至少约200%、至少约225%、至少约250%、至少约275%、至少约300%、至少约325%、至少约350%、至少约375%、至少约400%、至少约425%、至少约450%、至少约475%、至少约500%、至少约525%、至少约550%、至少约575%、至少约600%、至少约625%、至少约650%、至少约675%、至少约700%、至少约725%、至少约750%、至少约800%、至少约825%、至少约850%、至少约875%、至少约850%、至少约875%、至少约900%和至多至少约1000%或更多。备选地,将相对活性表示为用从修饰前体加工的蛋白酶的活性值除以从未修饰的前体加工时相同蛋白酶的活性值测定的产生比。因此,在一些实施方案中,从修饰前体加工的成熟蛋白酶的产生比是至少约1、至少约1. 1、至少约1.2、至少约1. 3、至少约1. 4、至少约1. 5、至少约1. 6、至少约1. 7、至少约1. 8、至少约1. 9、至少约 2、至少约2. 25、至少约2. 5、至少约2. 75、至少约3、至少约3. 25、至少约3. 5、至少约3. 75、 至少约、至少约4. 25、至少约4. 5、至少约4. 75、至少约5、至少约5. 25、至少约5. 5、至少约 5. 75、至少约6、至少约6. 25、至少约6. 5、至少约6. 75、至少约7、至少约7. 25、至少约7. 5、 至少约8、至少约8. 25、至少约8. 5、至少约8. 75、至少约9和至多至少约10。存在本领域普通技术人员已知的多种用于检测和测量蛋白酶活性的测定。具体而言,可以获得基于酸溶性肽从酪蛋白或血红蛋白的释放的测定来测量蛋白酶活性,用福林法将该释放度量为280nm的吸光度或进行比色测量(参见例如Bergmeyer等,"Methods of Enzymatic Analysis” 卷 5, Peptidases, Proteinases and their Inhibitors, Verlag Chemie, ffeinheim[1984]) 0 一些其他测定涉及显色底物的溶解(参见例如 Ward, "Proteinases, ” 在 Fogarty (编辑)·,Microbial Enzymes and BiotechnoloRY, Applied Science, London, [1983],251-317页中)。其他示例性测定包括但不限于琥珀酰-Ala-Ala-Pro-Phe-对硝基苯胺测定(SAAPFpNA)和2,4,6_三硝基苯磺酸钠盐测定 (TNBS测定)。本领域技术人员已知的许多其他参考文献提供了适宜的方法(参见例如 Wells 等,Nucleic Acids Res. 11 :7911-7925[1983] ;Christianson 等,Anal. Biochem., 223 119-129[1994];和 Hsia 等,Anal Biochem.,242 :221-227[1999])。本发明并非旨在限于任意具体的测定方法。用于测定宿主细胞中成熟蛋白酶的产生水平的其他手段包括但不限于使用对该蛋白质特异的多克隆或单克隆抗体的方法。实例包括但不限于酶联免疫吸附测定(ELISA)、 放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选术(FACS)。这些及其他测定为本领域公知(参见例如Maddox等,J.Exp. Med.,158 :1211 [1983])。本文中提到的所有出版物和专利在此引入作为参考。本发明所述的方法和系统的多种修改和变化对本领域技术人员而言显而易见而不背离本发明的范围和精神。虽然已结合具体实施方案描述了本发明,但应理解,不应不当地将本发明限于这类具体实施方案。事实上,旨在将对本领域和/或相关领域技术人员而言显而易见的所述用于实施本发明的方式的多种修改包含于本发明的范围之内。
实验在随后的实验公开内容中,适用以下缩写ppm(百万分之几);M(摩尔每升); mM(毫摩尔每升);μ M(微摩尔每升);ηΜ(纳摩尔每升);mol (摩尔);mmol (毫摩尔); μπιο (微摩尔);nmol (纳摩尔);gm (克);mg (毫克);Pg (微克);Pg (皮克);L (升);ml 和mL(毫升);μ 和4 1^(微升);cm(厘米);mm(毫米);ym(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒);min(s)(分钟);h(s)和 hr(s)(小时);。C (摄氏度);QS(足量);QC(QuikChange) ;ND(未进行);NA(不适用);rpm(转每分钟);w/ ν (质量比体积);v/V (体积比体积);g (重力);OD (光密度);aa (氨基酸);bp (碱基对); 1Λ (千碱基对);kD(千道尔顿);suc-AAPF-pNA(琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酰-对硝基苯胺);DMSO ( 二甲基亚砜);cDNA (拷贝或互补DNA) ;DNA (脱氧核糖核酸);ssDNA(单链DNA) ;dsDNA(双链DNA) ;dNTP(脱氧核糖核苷三磷酸);DTT(1, 4-二硫代-DL-苏糖醇);H20(7jO ;dH20(去离子水);HCl (盐酸);MgCl2(氯化镁); MOPS (3-[N-吗啉代]丙磺酸);NaCl (氯化钠);PAGE (聚丙烯酰胺凝胶电泳);PBS (磷酸缓冲盐溶液[150mM NaCl、10mM磷酸钠缓冲液,pH7. 2]) ;PEG(聚乙二醇);PCR(聚合酶链反应);PMSF(苯甲基磺酰氟);RNA(核糖核酸);SDS(十二烷基硫酸钠);Tris(三(羟甲基)氨基甲烷);S0C(2% Bacto-Tryptone,0. 5% Bacto Yeast Extract , IOmM NaCl, 2. 5mM KCl) ;Terrific Broth (TB ; 12g/l Bacto Tryptone,24g/l 甘油,2. 31g/lKH2P04 和 12. 54g/l K2HPO4) ;O拟80Q80nm 的光密度);0D600 (600nm 的光密度);A405 (405nm 的吸光度);Vmax(酶催化的反应的最大初速度);HEPES(N-[2-羟乙基]哌嗪-N_[2_乙磺酸]); Tris-HCl(三[羟甲基]氨基甲烷-盐酸);TCA(三氯乙酸);HPLC (高压液相层析); RP-HPLC(反相高压液相层析);TLC(薄层层析);EDTA(乙二胺四乙酸)出tOH(乙醇); SDS(十二烷基硫酸钠);Tris(三(羟甲基)氨基甲烷);TAED(N,N,N,N,-四乙酰基乙二胺)。提供以下实施例来显示和进一步说明本发明的某些实施方案和方面,而不解释为限制其范围。为了测定碱性蛋白酶原区中的氨基酸取代对该原区与之有效连接的蛋白酶的成熟形式的产生的影响,在分别与实施例1-5中所述的SEQ ID NO :9、11、17、19和21的成熟蛋白酶有效连接时,在SEQ ID NO :7的原区的位置6、30和32上的氨基酸上引入一个、两个和三个氨基酸取代。
实施例1
SEQ ID NO :7的原区中的突变对SEQ ID NO :9的成熟碱性蛋白酶的产生的影响(a)原区位置6、30或32上的氨基酸的位点饱和诱变。
按照厂家的说明用QuikChange 位点定向诱变试剂盒(qc ;Stratagene)进行关于seq ID NO :9的成熟蛋白酶的产生的原区的位点饱和诱变。将包含AprE启动子和编码seq ID NO :59的全长蛋白酶的多核苷酸的DNA盒克隆入pJHIOl载体(Ferrari等 J. Bacteriol. 154 1513-1515[1983])pJH-Pn(图 4A)的 EcoRI 和 HindIII 限制位点,产生 PJH-P9质粒。(Pn指从pJH-pn质粒表达的成熟蛋白酶的seq ID NO)。该DNA盒包含枯草芽孢杆菌aprE启动子
gaattcctccattttcttctgctatcaaaataacagactcgtgattttccaaacgagctttcaaaaaagcc tctgccccttgcaaatcggatgcctgtctataaaattcccgatattggttaaacagcggcgcaatggcggccgcat ctgatgtctttgcttggcgaatgttcatcttatttcttcctccctctcaataattttttcattctatcccttttct gtaaagtttatttttcagaatacttttatcatcatgctttgaaaaaatatcacgataatatccattgttctcacgg aagcacacgcaggtcatttgaacgaattttttcgacaggaatttgccgggactcaggagcatttaacctaaaaaa gcatgacatttcagcataatgaacatttactcatgtctattttcgttcttttctgtatgaaaatagttatttcga gtctctacggaaatagcgagagatgatatacctaaatagagataaaatcatctcaaaaaaatgggtctactaaaa tattattccatctattacaataaattcacagaatagtcttttaagtaagtctactctgaatttttttaaaaggag agggtaaaga(SEQ ID NO :1),
多核苷酸序列
gtgagaagcaaaaaattgtggatcagcttgttgtttgcgttaacgttaatctttacgatggcgttcagcaacatgtctgcgcaggct (SEQ ID NO 2),其编码 AprE 信号肽 VRSKKLWISLLFALTLIFTMAFS匪SAQA (SE Q ID NO 3);
多核苷酸序列
gctgaagaagcaaaagaaaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaa gtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaac gattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattg aagaggatgcagaagtaacgacaatg(SEQ ID NO :6),其编码未修饰的原区
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAIS YIEEDAEVTTM(SEQ ID NO 7);和多核苷酸序列
gcgcaatcagtgccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttct ggtgtaaaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgt accaggggaaccatccactcaagatgggaatgggcatggcacgcatgtggccgggacgattgctgctttaaacaatt cgattggcgttcttggcgtagcgccgagcgcggaactatacgctgttaaagtattaggggcgagcggttcaggtteg gtcagctcgattgcccaaggattggaatgggcagggaacaatggcatgcacgttgctaatttgagtttaggaagccc ttcgccaagtgccacacttgagcaagctgttaatagcgcgacttctagaggcgttcttgttgtagcggcatctggaa attcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatggcagtcggagctactgaccaaaacaac aaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaaacgtgcagagcacataccc aggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagcccttgttaaac aaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcacgaac ttgtatggaagcggacttgtcaatgcagaagctgcaactcgt(SEQ ID NO :8),,其编码蛋白酶 9 的成熟区(P9)
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAG TIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVN SATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGS TYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR(SEQ ID NO 9)。
按如下将包含于SEQ ID NO 59的全长蛋白酶中的SEQ ID NO 7的原区中的3个密码子(通过NNG/C示例)中的每一个突变为被编码20种天然存在的氨基酸的32个可能的核苷酸三联体取代来产生三个文库。突变包含编码全长蛋白酶的序列的质粒PJH-P9DNA的整分试样,以产生编码原区(SEQ ID NO 7)位置6上的谷氨酸(E)的所有可能的取代(E6X) 的克隆的第一文库;突变第二整分试样,以产生编码原区(SEQ ID NO 7)位置30上的谷氨酸(E)的所有可能的取代(E30X)的克隆的第二文库;突变第三整分试样,以产生编码原区 (SEQ ID NO 7)位置32上的精氨酸(A)的所有可能的取代(A32X)的克隆的第三文库。设计在NNS密码子侧翼具有约18个碱基的互补重叠引物来突变目的密码子。表1中给出了用来突变位置6、30和32上的氨基酸的正向引物和反向引物的多核苷酸序列。 表权利要求
1.编码修饰蛋白酶的分离的修饰多核苷酸,所述分离的修饰多核苷酸包含编码信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区在选自所述原区的位置6、30和32的位置上包含至少两个氨基酸的取代的组合,所述第二多核苷酸与编码蛋白酶成熟区的第三多核苷酸有效连接,其中所述蛋白酶与SEQ ID NO :9的成熟蛋白酶至少约60%同一,且其中通过与SEQ ID NO :7的多肽原的氨基酸序列对应来编号位置。
2.权利要求1的分离的修饰多核苷酸,其中所述成熟蛋白酶是源自克劳氏芽孢杆菌或迟缓芽孢杆菌的野生型或变体碱性丝氨酸蛋白酶。
3.权利要求1或2的分离的修饰多核苷酸,其中所述成熟蛋白酶具有选自SEQID NO 9、11、13、15、17、19和21的氨基酸序列。
4.权利要求1-3中任一项的分离的多核苷酸,其中所述信号肽具有选自SEQID NO 3 和5的氨基酸序列。
5.权利要求1-4中任一项的分离的修饰多核苷酸,其中所述取代的组合选自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。
6.权利要求1-4中任一项的分离的修饰多核苷酸,其中所述取代的组合选自 E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G,E6S-E30G,E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y,和 E30S-A32V。
7.权利要求1-6中任一项的分离的多核苷酸,其中所述取代增强所述成熟蛋白酶通过芽孢杆菌属物种宿主细胞的产生。
8.权利要求7的分离的多核苷酸,其中所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。
9.表达载体,其包含权利要求1的分离的修饰多核苷酸。
10.权利要求9的表达载体,其进一步包含AprE启动子。
11.芽孢杆菌属物种宿主细胞,其包含权利要求9或10的表达载体。
12.权利要求11的宿主细胞,其中所述宿主细胞是枯草芽孢杆菌宿主细胞。
13.用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法,所述方法包括a)提供权利要求10的表达载体;b)用所述表达载体转化芽孢杆菌属物种宿主细胞;和c)在适宜的条件下培养所述宿主细胞,使得通过所述宿主细胞产生所述蛋白酶。
14.权利要求13的方法,其中所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。
15.权利要求13或14的方法,其中所述成熟蛋白酶是野生型克劳氏芽孢杆菌或迟缓芽孢杆菌碱性丝氨酸蛋白酶,其变体或同源物。
16.权利要求13-15中任一项的方法,其中所述第一多核苷酸编码SEQID NO :3的信号肽,其中编码所述原区的所述第二多核苷酸包含选自E6R-A32K、E6N-A32K、E6D-A32K、 E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K 和 E30V-A32K的取代组合,且其中所述第三多核苷酸编码选自SEQ ID NO 9的成熟蛋白酶。
17.权利要求13-15中任一项的方法,其中所述第一多核苷酸编码SEQID NO :3的信号肽,其中编码所述原区的所述第二多核苷酸包含选自E6A-E30G,E6R-E30G,E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G, E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V,E6G-E30G-A32E,E6G-E30G-A32S,E6G-E30G-A32T 和 E6G-E30G-A32W 的取代组合,且其中所述第三多核苷酸编码选自SEQ ID NOS 17的成熟蛋白酶。
18.权利要求13-15中任一项的方法,其中所述第一多核苷酸编码SEQID NO :3的信号肽,其中编码所述原区的所述第二多核苷酸包含选自E6A-E30G,E6R-E30G,E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G,E6W-E30G, E6V-E30G 和 E6Y-E30G 的取代组合,且其中所述第三多核苷酸编码选自SEQ ID NO :19的成熟蛋白酶。
19.权利要求13-15中任一项的方法,其中所述第一多核苷酸编码SEQID NO :3的信号肽,其中编码所述原区的所述第二多核苷酸包含选自E6A-E30S,E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S, E30S-A32R, E30S-A32N,E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 禾P E30S-A32V的取代组合,且其中所述第三多核苷酸编码选自SEQ ID NO 21的成熟蛋白酶。
20.编码修饰蛋白酶的分离的多核苷酸,所述分离的修饰多核苷酸包含编码SEQID NO :3的信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区包含选自E6A、E6C、E6Y、E30A、E30L、E30P、E30T、E30Y、E30V、 A32C、A32E、A32G、A3^(和A32T的氨基酸取代,所述第二多核苷酸与编码SEQ ID NO :17的蛋白酶的成熟区的第三多核苷酸有效连接。
21.编码修饰蛋白酶的分离的多核苷酸,所述分离的修饰多核苷酸包含编码SEQID NO :3的信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区包含选自E6A、E6C、E6F、E6P、E6T、E6W、E6V、A3I和A32T的氨基酸取代,所述第二多核苷酸与编码SEQ ID NO :9的蛋白酶的成熟区的第三多核苷酸有效连接。
22.编码修饰蛋白酶的分离的多核苷酸,所述分离的修饰多核苷酸包含编码SEQID NO :3的信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区包含选自E6A、E30A、E30L、E30T和E30V的氨基酸取代,所述第二多核苷酸与编码SEQ ID NO :19的蛋白酶的成熟区的第三多核苷酸有效连接。
23.编码修饰蛋白酶的分离的多核苷酸,所述分离的修饰多核苷酸包含编码SEQIDNO :3的信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区包含选自E6A、E6L、E6F、E6T、E6V、E30I、E30L、E30P、E30T、 E30Y、E30V、A32Q、A32S和A32T的氨基酸取代,所述第二多核苷酸与编码SEQ ID NO 11的蛋白酶的成熟区的第三多核苷酸有效连接。
24.编码修饰蛋白酶的分离的多核苷酸,所述分离的修饰多核苷酸包含编码SEQID NO :3的信号肽的第一多核苷酸,所述第一多核苷酸与编码SEQ ID NO :7所示原区的第二多核苷酸有效连接,其中所述原区包含氨基酸取代E30A,所述第二多核苷酸与编码SEQ ID NO 21的蛋白酶的成熟区的第三多核苷酸有效连接。
25.用于在枯草芽孢杆菌宿主细胞中产生成熟蛋白酶的方法,所述方法包括a)提供包含分离的多核苷酸的表达载体,所述分离的多核苷酸选自权利要求20、21、 22,23和M的分离的多核苷酸;b)用所述表达载体转化所述枯草芽孢杆菌宿主细胞;和c)在适宜的条件下培养所述宿主细胞,使得通过所述宿主细胞产生所述成熟蛋白酶。
全文摘要
本发明提供用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。该组合物包含编码在原区中具有至少一个突变的修饰蛋白酶的修饰多核苷酸;由该修饰多核苷酸编码的修饰的丝氨酸蛋白酶;包含编码该修饰蛋白酶的修饰多核苷酸的表达盒、DNA构建体和载体;及用本发明的载体转化的细菌宿主细胞。该方法包括用于增强成熟蛋白酶在细菌宿主细胞,例如芽孢杆菌属物种宿主细胞中的产生的方法。所产生的蛋白酶用于工业产生适合用于包括但不限于清洁、动物饲料和织物加工产业的多种产业中的酶。
文档编号C12N9/54GK102414321SQ201080017883
公开日2012年4月11日 申请日期2010年4月15日 优先权日2009年4月24日
发明者齐蒙耐德 A·范, C·菲奥雷西, E·费拉里 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1