具有经修饰的前肽区域的蛋白酶的制作方法

文档序号:14185925阅读:155来源:国知局
本申请要求于2015年6月17日提交的美国临时申请序列号62/181,192的权益和优先权,将该申请以其全文通过引用结合在此。序列表的引用本申请含有按照37c.f.r.§1.52(e)已经经由efs提交的序列表。命名为“nb40947wopct_sequencelisting.txt”的文本文件序列表的电子提交的内容创建于2016年6月16日,并且大小为71.7kb(73,457字节),将该内容以其全文通过引用特此结合。本发明提供了用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。这些组合物包括编码具有经修饰的或异源的前肽区域的丝氨酸蛋白酶序列的多核苷酸;包含具有经修饰的或异源的前肽区域的丝氨酸蛋白酶的多肽;包含这样的多核苷酸的表达盒、dna构建体、载体,和染色体;以及包含这样的多核苷酸的细菌宿主细胞。这些方法包括用于增强在细菌宿主细胞(例如,芽孢杆菌属(bacillus)物种宿主细胞)中成熟蛋白酶产生的方法。所产生的蛋白酶可用于适用于各种行业的酶的工业生产,这些行业包括但不限于清洁业、动物饲料业和纺织品加工业。
背景技术
:已经将微生物(例如属于芽孢杆菌属的革兰氏阳性微生物)用于大规模工业发酵,部分原因是微生物将其发酵产物分泌到其培养基中的能力。分泌的蛋白质通过细胞膜和细胞壁输出,并且然后被随后释放到外部介质中。实际上,异源多肽的分泌是工业中广泛使用的技术。通常,将细胞用编码目的异源多肽的核酸转化以被表达并且分泌,以产生大量所需的多肽。在一些情况下,对宿主细胞的染色体进行修饰以编码这样的异源多肽。已经通过对编码所需蛋白质的多核苷酸的遗传操作来控制所希望的多肽的表达和分泌。尽管蛋白质产生方法有了各种进步,但本领域仍然需要提供更有效的用于细胞外蛋白质分泌的方法,其中目的在于增强可用于各种行业的酶(如蛋白酶)的产生,这些行业包括但不限于清洁业、动物饲料业和纺织品加工业。技术实现要素:本发明提供了用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。这些组合物包括编码具有经修饰的或异源的前肽区域的丝氨酸蛋白酶序列的多核苷酸;包含具有经修饰的或异源的前肽区域的丝氨酸蛋白酶的多肽;包含这样的多核苷酸的表达盒、dna构建体、载体,和染色体;以及包含这样的多核苷酸的细菌宿主细胞。这些方法包括用于增强在细菌宿主细胞(例如,芽孢杆菌属(bacillus)物种宿主细胞)中成熟蛋白酶产生的方法。所产生的蛋白酶可用于适用于各种行业的酶的工业生产,这些行业包括但不限于清洁业、动物饲料业和纺织品加工业。在一方面,本发明提供了多核苷酸,这些多核苷酸编码具有经修饰的前肽区域的丝氨酸蛋白酶序列。因此,在某些实施例中,本公开涉及编码经修饰的蛋白酶的多核苷酸,该多核苷酸包含(a)编码信号肽的任选的第一多核苷酸区域;(b)编码异源芽孢杆菌蛋白酶的前肽区域的第二多核苷酸区域,所述前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列,和(c)编码吉氏芽孢杆菌(bacillusgibsonii)进化枝蛋白酶的成熟区域的第三多核苷酸区域,其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在其他实施例中,本公开涉及编码蛋白酶的多核苷酸,所述多核苷酸包含(a)编码信号肽的任选的第一多核苷酸区域,(b)编码来自迟缓芽孢杆菌(bacilluslentus)或其相关物种的蛋白酶的前肽区域的第二多核苷酸区域,和(c)编码吉氏芽孢杆菌进化枝蛋白酶的成熟区域的第三多核苷酸区域,其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在某些实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的蛋白酶的前肽区域。在其他实施例中,第二多核苷酸区域编码来自芽孢杆菌属物种的蛋白酶的前肽区域,所述芽孢杆菌属物种选自由以下组成的组:迟缓芽孢杆菌、克劳氏芽孢杆菌(b.clausii)、嗜碱芽孢杆菌(b.alcalophilus)、列城芽孢杆菌(b.lehensis)和诺瓦利斯芽孢杆菌(b.novalis)。在具体的实施例中,第二多核苷酸区域编码迟缓芽孢杆菌蛋白酶的前肽区域。在其他实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌(bacilluslentus)或其相关物种的丝氨酸蛋白酶或枯草杆菌蛋白酶的前肽区域。在其他实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的野生型前肽区域。在又其他实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域。在其他实施例中,第二多核苷酸区域编码枯草杆菌蛋白酶的前肽区域,该枯草杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、bpan01744、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、bps02003、bohn00569、bspak01305、bpan04382、和bspal03279。在另一个实施例中,第二多核苷酸区域编码枯草杆菌蛋白酶的前肽区域,该枯草杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、和bpan01744。在其他实施例中,第二多核苷酸区域编码迟缓芽孢杆菌_p29600的前肽区域。在某些实施例中,第二多核苷酸区域编码与seqidno:8具有至少50%同一性的氨基酸序列。在其他实施例中,第二多核苷酸区域编码与seqidno:8具有至少75%同一性的氨基酸序列。在另一个实施例中,第二多核苷酸区域编码与seqidno:8具有至少90%同一性的氨基酸序列。在其他实施例中,第二多核苷酸区域编码包含seqidno:8的序列的氨基酸序列。在某些其他实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,其中该变体前肽区域包含在对应于seqidno:8的位置6、30、或32的位置处的至少一个氨基酸取代。在另一个实施例中,第二多核苷酸区域包含至少一个氨基酸取代,该取代通过芽孢杆菌属物种宿主细胞增强吉氏芽孢杆菌进化枝蛋白酶的成熟区域的产生。在某些其他实施例中,如与包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码相同的枯草杆菌蛋白酶的野生型前肽区域的不同第二多核苷酸区域的多核苷酸相比,至少一个氨基酸取代增强吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在另一个实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置6的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:a、c、r、n、q、g、h、i、l、k、m、f、p、s、t、w、y、和v。在又另一个实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置30的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:a、r、n、d、c、q、g、h、l、k、m、s、t、w、y、和v。在某些其他实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置32的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:r、n、c、q、g、h、i、l、k、m、f、p、s、t、w、y、和v。在某些其他实施例中,所述第二多核苷酸区域编码seqidno:8中所示的前肽区域,条件是该前肽区域包含选自seqidno:8的位置6、30和32的位置处的至少一个氨基酸取代。在另一个实施例中,该前肽区域包含在seqidno:8的位置6处的氨基酸取代,该氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、和e6v。在其他实施例中,该前肽区域包含在seqidno:8的位置30处的氨基酸取代,该氨基酸取代选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、和e30v。在又其他实施例中,该前肽区域包含在seqidno:8的位置32处的氨基酸取代,该氨基酸取代选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v。在另一个实施例中,第二多核苷酸区域包含与seqidno:5具有至少60%同一性的核苷酸序列。在其他实施例中,第二多核苷酸区域包含与seqidno:5具有至少90%同一性的核苷酸序列。在某些其他实施例中,第二多核苷酸区域包含seqidno:5的序列。在另一个实施例中,第二多核苷酸区域包含seqidno:5中所示的序列,条件是seqidno:5的第六(6th)、第三十(30th)、或第三十二(32nd)密码子发生突变以编码不同的氨基酸。在某些实施例中,芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在其他实施例中,本公开涉及编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含(a)编码信号肽的任选的第一多核苷酸区域,(b)编码第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域的第二多核苷酸区域,和(c)编码第二吉氏芽孢杆菌进化枝蛋白酶的成熟区域的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在具体的实施例中,第一吉氏芽孢杆菌进化枝蛋白酶或所述第二吉氏芽孢杆菌进化枝蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在其他实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自相同的芽孢杆菌属物种。在其他实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自不同的芽孢杆菌属物种。在另一个实施例中,第二多核苷酸区域编码与seqidno:7具有至少60%同一性的氨基酸序列。在其他实施例中,第二多核苷酸区域编码与seqidno:7具有至少90%同一性的氨基酸序列。在又其他实施例中,所述第二多核苷酸区域编码与seqidno:7具有至少60%同一性的变体前肽区域,其中所述变体前肽区域包含对应于seqidno:7的位置34的位置处的氨基酸取代。在某些其他实施例中,所述第二多核苷酸区域编码seqidno:7中所示的前肽区域,条件是该前肽区域包含seqidno:7的位置34处的氨基酸取代。在某些其他实施例中,在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:d、c、g、h、s、和v。在另一个实施例中,在seqidno:7的位置34处的氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s、和e34v。在其他实施例中,通过芽孢杆菌属物种宿主细胞,氨基酸取代增强了第二吉氏芽孢杆菌进化枝蛋白酶的成熟区域的产生。在某些实施例中,芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在又其他实施例中,第二多核苷酸区域包含与seqidno:3具有至少60%同一性的核苷酸序列。在其他实施例中,第二多核苷酸区域包含与seqidno:3具有至少90%同一性的核苷酸序列。在又其他实施例中,第二多核苷酸区域包含seqidno:3中所示的序列,条件是seqidno:3的第三十四(34th)密码子发生突变以编码不同的氨基酸。在某些实施例中,第二多核苷酸区域编码异源或变体前肽区域,该前肽区域包含seqidno:44中所示的氨基酸序列。在另一个实施例中,第二多核苷酸区域编码异源或变体前肽区域,该前肽区域包含seqidno:69中所示的氨基酸序列。在又其他实施例中,第三多核苷酸区域编码来自吉氏芽孢杆菌的蛋白酶的成熟区域。在其他实施例中,第三多核苷酸区域编码吉氏芽孢杆菌进化枝丝氨酸蛋白酶或枯草杆菌蛋白酶的成熟区域。在另一个实施例中,第三多核苷酸区域编码野生型吉氏芽孢杆菌进化枝枯草杆菌蛋白酶的成熟区域。在又其他实施例中,第三多核苷酸区域编码变体吉氏芽孢杆菌进化枝枯草杆菌蛋白酶的成熟区域。在某些其他实施例中,第三多核苷酸区域编码枯草杆菌蛋白酶的成熟区域,该枯草杆菌蛋白酶选自由以下组成的组:bgi02446、dsm9728、dsm9729、dsm9730、dsm9731、吉氏芽孢杆菌tii-5、吉氏芽孢杆菌ti-1和吉氏芽孢杆菌hp302。在另一个实施例中,第三多核苷酸区域编码bgi024446的成熟区域。在某些实施例中,第三多核苷酸区域编码bgi024446变体(例如,bsp-00801)的成熟区域。在其他实施例中,第三多核苷酸区域编码与seqidno:10、11、12或13具有至少60%同一性的氨基酸序列。在某些其他实施例中,第三多核苷酸区域编码与seqidno:10、11、12或13具有至少75%同一性的氨基酸序列。在另一个实施例中,第三多核苷酸区域编码与seqidno:10、11、12或13具有至少90%同一性的氨基酸序列。在某些其他实施例中,第三多核苷酸区域编码包含seqidno:10、11、12或13的序列的氨基酸序列。在某些实施例中,第三多核苷酸区域编码包含seqidno:10或11的序列的氨基酸序列。在其他实施例中,第三多核苷酸区域编码包含seqidno:12或13的序列的氨基酸序列。在某些其他实施例中,第三多核苷酸区域包含与seqidno:4或9具有至少60%同一性的核苷酸序列。在其他实施例中,第三多核苷酸区域包含与seqidno:4或9具有至少75%同一性的核苷酸序列。在又其他实施例中,第三多核苷酸区域包含与seqidno:4或9具有至少90%同一性的核苷酸序列。在另一个实施例中,第三多核苷酸区域包含seqidno:4或9的序列。在其他实施例中,第三多核苷酸区域包含seqidno:4的序列。在又其他实施例中,第三多核苷酸区域包含seqidno:9的序列。在某些其他实施例中,所述第一多核苷酸区域是存在的并编码芽孢杆菌信号肽。在另一个实施例中,所述第一多核苷酸区域是存在的并编码枯草芽孢杆菌信号肽。在另一个实施例中,所述第一多核苷酸区域是存在的并编码与seqidno:40具有至少60%同一性的氨基酸序列。在其他实施例中,所述第一多核苷酸区域是存在的并编码与seqidno:40具有至少90%同一性的氨基酸序列。在另一个实施例中,所述第一多核苷酸区域是存在的并编码包含seqidno:40的序列的氨基酸序列。在某些其他实施例中,所述第一多核苷酸区域是存在的并包含与seqidno:2具有至少60%同一性的核苷酸序列。在其他实施例中,所述第一多核苷酸区域是存在的并包含与seqidno:2具有至少90%同一性的核苷酸序列。在又其他实施例中,所述第一多核苷酸区域是存在的并包含seqidno:2的核苷酸序列。在其他实施例中,本公开涉及编码经修饰的蛋白酶的多核苷酸,该多核苷酸包含(a)编码seqidno:40的氨基酸序列的第一多核苷酸区域,(b)编码seqidno:8的氨基酸序列或编码具有至少一个氨基酸取代的seqidno:8的序列的第二多核苷酸区域,该氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、e6v、e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、e30v、a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v,以及(c)编码seqidno:11或12的氨基酸序列的第三多核苷酸区域,其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在其他实施例中,本公开涉及编码经修饰的蛋白酶的多核苷酸,该多核苷酸包含(a)编码seqidno:40的氨基酸序列的第一多核苷酸区域,(b)编码具有氨基酸取代的seqidno:7的氨基酸序列的第二多核苷酸区域,该氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s、和e34v,以及(c)编码seqidno:11或12的氨基酸序列的第三多核苷酸区域,其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在某些实施例中,本公开涉及包含本公开的多核苷酸的表达载体。在其他实施例中,本公开涉及包含本公开多核苷酸的经修饰的染色体。在某些其他实施例中,包含本公开的多核苷酸的表达载体或经修饰的染色体进一步包含适用于在枯草芽孢杆菌中基因表达的启动子。因此,在具体的实施例中,本公开涉及包含本公开的多核苷酸的芽孢杆菌属物种宿主细胞。因此,在某些其他实施例中,本公开的芽孢杆菌属物种宿主细胞包含本公开的表达载体或经修饰的染色体。在某些实施例中,宿主细胞是枯草芽孢杆菌宿主细胞。在某些其他实施例中,本公开涉及用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法,该方法包括(a)提供包含本公开的多核苷酸的表达载体,(b)用表达载体转化芽孢杆菌属物种宿主细胞;并且(c)在适当的条件下培养宿主细胞,这样使得通过宿主细胞产生成熟蛋白酶。在某些实施例中,芽孢杆菌属物种宿主细胞是枯草芽孢杆菌。在其他实施例中,成熟蛋白酶是野生型吉氏芽孢杆菌进化枝丝氨酸蛋白酶、其变体、或其同系物。在用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法的某些实施例中,成熟蛋白酶以比包含表达载体或修饰染色体的宿主细胞更高的水平表达,该表达载体或修饰染色体包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码由第三多核苷酸区域编码的吉氏芽孢杆菌进化枝蛋白酶的野生型前肽区域的不同的第二多核苷酸区域。在其他实施例中,第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,并且其中成熟的蛋白酶以比由包含表达载体或经修饰的染色体的宿主细胞更高的水平表达,该表达载体或经修饰的染色体包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码来自迟缓芽孢杆菌或其相关物种的相同枯草杆菌蛋白酶的野生型前肽区域的不同的第二多核苷酸区域。在某些实施例中,产生的成熟蛋白酶以n-末端位置中的两个谷氨酰胺开始。在某些其他实施例中,产生的成熟蛋白酶与seqidno:11或12具有至少90%同一性。在另一个实施例中,产生的成熟蛋白酶包含seqidno:11或12的序列。在其他实施例中,本公开涉及由本公开的多核苷酸编码的多肽。因此,在某些实施例中,本公开涉及包含经修饰的蛋白酶的多肽,其中该蛋白酶包含有效地连接至吉氏芽孢杆菌进化枝蛋白酶的成熟区域的异源芽孢杆菌蛋白酶的前肽区域,其中该前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列。在其他实施例中,异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌或其相关物种。在其他实施例中,本公开涉及包含经修饰的蛋白酶的多肽,其中该经修饰的蛋白酶包含有效地连接至吉氏芽孢杆菌进化枝蛋白酶成熟区域的异源芽孢杆菌蛋白酶的前肽区域,其中该异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌或其相关物种。在某些实施例中,异源芽孢杆菌蛋白酶来自选自由以下组成的组的芽孢杆菌属物种:迟缓芽孢杆菌、克劳氏芽孢杆菌、嗜碱芽孢杆菌、列城芽孢杆菌、和诺瓦利斯芽孢杆菌。在具体的实施例中,异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌。在另一个实施例中,异源芽孢杆菌蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在另一个实施例中,前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的野生型前肽区域。在某些其他实施例中,前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域。在另一个实施例中,异源芽孢杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、bpan01744、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、bps02003、bohn00569、bspak01305、bpan04382和bspal03279。在另一个实施例中,异源芽孢杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970和bpan01744。在另一个实施例中,异源芽孢杆菌蛋白酶是迟缓芽孢杆菌_p29600。在又其他实施例中,前肽区域包含与seqidno:8具有至少50%同一性的氨基酸序列。在某些其他实施例中,前肽区域包含与seqidno:8具有至少75%同一性的氨基酸序列。在另一个实施例中,前肽区域包含与seqidno:8具有至少90%同一性的氨基酸序列。在其他实施例中,前肽区域包含seqidno:8的序列。在又其他实施例中,前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,其中该变体前肽区域包含对应于seqidno:8的位置6、30、或32的位置处的至少一个氨基酸取代。在另一个实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置6的位置处,并且选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、和e6v。在某些其他实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置30的位置处,并且选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、和e30v。在又其他实施例中,至少一个氨基酸取代是在对应于seqidno:8的位置32的位置处,并且选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v。在某些其他实施例中,前肽区域包含seqidno:8中所示的序列,条件是该前肽区域包含在选自seqidno:8的位置6、30和32的位置处的至少一个氨基酸取代。在其他实施例中,该前肽区域包含在seqidno:8的位置6处的氨基酸取代,该氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、和e6v。在另一个实施例中,该前肽区域包含在seqidno:8的位置30处的氨基酸取代,该氨基酸取代选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、和e30v。在某些其他实施例中,该前肽区域包含在seqidno:8的位置32处的氨基酸取代,该氨基酸取代选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v。在其他实施例中,本公开涉及包含经修饰的蛋白酶的多肽,其中该经修饰的蛋白酶包含有效地连接至第二吉氏芽孢杆菌进化枝蛋白酶成熟区域的第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域。在某些实施例中,第一吉氏芽孢杆菌进化枝蛋白酶或第二吉氏芽孢杆菌进化枝蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在某些其他实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和第二吉氏芽孢杆菌进化枝蛋白酶来自相同的芽孢杆菌属物种。在另一个实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和第二吉氏芽孢杆菌进化枝蛋白酶来自不同的芽孢杆菌属物种。在某些其他实施例中,变体前肽区域包含与seqidno:7具有至少60%同一性的氨基酸序列。在又其他实施例中,变体前肽区域包含与seqidno:7具有至少90%同一性的氨基酸序列。在其他实施例中,变体前肽区域包含seqidno:7中所示的前肽区域,条件是该前肽区域包含在seqidno:7的位置34处的氨基酸取代。在某些实施例中,通过芽孢杆菌属物种宿主细胞,氨基酸取代增强了第二吉氏芽孢杆菌进化枝蛋白酶的成熟区域的产生。在其他实施例中,芽孢杆菌属物种宿主细胞是枯草芽孢杆菌。如权利要求[0255]所述的多肽,其中在seqidno:7的位置34处的所述氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s、和e34v。在另一个实施例中,异源或变体前肽区域包含seqidno:44中所示的氨基酸序列。在某些其他实施例中,异源或变体前肽区域包含seqidno:69中所示的氨基酸序列。在又其他实施例中,多肽进一步包含信号肽。在其他实施例中,本公开涉及编码本公开的多肽的多核苷酸。附图说明图1描绘了使用邻接法产生的所选择的芽孢杆菌属物种前肽序列的系统树。图2显示使用天然bgi02446前肽序列,用于表达bgi02446,吉氏芽孢杆菌丝氨酸蛋白酶(枯草杆菌蛋白酶)的成熟区域的基因盒的图表。图3显示使用迟缓芽孢杆菌枯草杆菌蛋白酶前肽序列,用于表达bgi02446的成熟区域的基因盒的图表。图4显示用于使在图2和3中所示出的基因盒连接的金黄色葡萄球菌(staphylococcusaureus)氯霉素乙酰基转移酶(cat)基因的基因盒的图表。图5说明了针对使用在氨基酸残基位置6、30、或32处具有突变(即,取代)的不同迟缓芽孢杆菌前肽序列表达成熟bgi02446所构建的质粒的示意图。图6显示用于表达具有迟缓芽孢杆菌前肽序列的bsp-00801(即,变体吉氏芽孢杆菌枯草杆菌蛋白酶)的成熟区域的表达盒的图表。图7显示针对使用在氨基酸残基位置6、34、或36处具有突变的不同bgi02446前肽序列表达成熟bgi02446所构建的质粒的示意图。图8显示吉氏芽孢杆菌bgi02446野生型(seqidno:59)和迟缓芽孢杆菌p29600野生型(seqidno:60)前肽加各自成熟区域的n-末端的四个氨基酸(以粗体显示)的clustal2.0.10多重序列比对。图9显示编码来自吉氏芽孢杆菌(bgi02446)和迟缓芽孢杆菌(p29600)的枯草杆菌蛋白酶的野生型前肽区域的核酸序列的比对。用clustalx1.81算法进行该比对。图10显示来自不同芽孢杆菌属物种的丝氨酸蛋白酶(枯草杆菌蛋白酶)的野生型前肽区域的氨基酸序列的比对。用clustalw算法进行该比对。图11显示从图10示出的多重序列比对分析建立的芽孢杆菌属前肽序列基序。图12显示从如在图10中所示的来自克劳氏芽孢杆菌、列城芽孢杆菌、bspal03240、和迟缓芽孢杆菌前肽的序列比对分析建立的芽孢杆菌属前肽序列基序。具体实施方式本公开提供了经修饰的芽孢杆菌属蛋白酶,编码经修饰的芽孢杆菌属蛋白酶的多核苷酸,包含经修饰的芽孢杆菌属蛋白酶的多肽,和用于在微生物中增强芽孢杆菌属蛋白酶产生的方法。特别地,经修饰的蛋白酶包含经修饰的前肽区域,该前肽区域包括代替待表达的芽孢杆菌属蛋白酶的天然前肽的异源芽孢杆菌蛋白酶前肽,或待表达的芽孢杆菌属蛋白酶的变体前肽。这些多核苷酸编码与成熟蛋白酶序列连接的异源芽孢杆菌蛋白酶前肽或变体前肽。蛋白酶或编码蛋白酶的多核苷酸的这样的修饰导致出乎意料的和增强的蛋白酶产生水平。本发明进一步涉及用于在微生物(例如芽孢杆菌属物种)中改变蛋白酶表达的方法。除非在此另外定义,否则在此所使用的所有技术与科学术语均具有与本发明所属领域的普通技术人员通常理解的相同含义(例如singleton和sainsbury,dictionaryofmicrobiologyandmolecularbiology[微生物学和分子生物学词典],第2版,约翰威利父子公司(johnwileyandsons),纽约州,1994;以及hale和markham,theharpercollinsdictionaryofbiology[哈珀柯林斯生物学词典],哈珀永久出版社(harperperennial),纽约州,1991)。尽管与在此描述方法和材料类似或等同的任何方法和材料可用于本发明的实践,但是在此描述了优选的方法和材料。因此,把说明书作为一个整体参考时,以下立即定义的术语得以更全面地描述。此外,除非上下文另有明确指示,如在此所使用的,单数“一个/一种”(a/an)和“该/所述”(the)包括复数引用。数值范围包括限定范围的数值在内。除非另外说明,否则分别地,核酸是从左向右以5'到3'方向书写;氨基酸序列都从左向右以氨基到羧基方向书写。应当理解,本发明不限于所描述的特定方法、方案和试剂,因为它们可以根据本领域技术人员使用的上下文而变化。在本说明书全文中给出的每一最大数值限度旨在包括每一较低数值限度,如同此类较低数值限度在此明确写出一样。在本说明书全文中给出的每一最小数值限度将包括每一较高数值限度,如同此类较高数值限度在此明确写出一样。在本说明书全文中给出的每一数值范围将包括落入此类较宽数值范围内的每一较窄数值范围,如同此类较窄数值范围在此全部明确写出一样。在此提到的所有专利、专利申请、文章和出版物特此通过引用明确地结合在此。此外,在此提供的标题并不是对本披露发明的各方面或实施例的限制,这些方面或实施例可以通过将本说明书作为一个整体来参考而得到。因此,把说明书作为一个整体参考时,以下立即定义的术语得以更全面地定义。然而,为了便于理解本发明,以下定义了多个术语。定义如在此所使用的,术语“分离的”和“经纯化的”是指从与其天然结合的至少一种组分去除的核酸或氨基酸(或其他组分)。在本发明的一些实施例中,将多核苷酸或多肽进行分离或纯化。在其他实施例中,多核苷酸或多肽是未经分离或纯化的。在一些情况下,通过基因工程、基因修饰、蛋白质工程、蛋白质修饰、或其他手段产生多核苷酸或多肽,这样使得该多核苷酸或多肽不同于天然存在的多核苷酸或多肽,但与至少一种与其天然结合的组分相关联。在此术语“经修饰的多核苷酸”是指已经发生改变以含有至少一种突变以编码“经修饰的”蛋白质的多核苷酸序列。在一些情况下,术语“多核苷酸”不与“经修饰的”关联使用,这不排除经修饰的多核苷酸的实施例。如在此所使用的,术语“蛋白酶”和“蛋白水解活性”是指表现出水解肽或具有肽键的底物的能力的蛋白质或肽。存在用于测量蛋白水解活性的许多的方法(kalisz,“microbialproteinases[微生物朊酶]”,在:fiechter(编辑),advancesinbiochemicalengineering/biotechnology熟知[生化工程/生物技术进展],1988)。例如,蛋白水解活性可以通过分析产生的蛋白酶水解商业底物的能力的比较测定来确定。可用于蛋白酶或蛋白水解活性这样的分析的示例性底物包括但不限于二甲基酪蛋白(西格玛公司(sigma)c-9801)、牛胶原(西格玛公司(sigma)c-9879)、牛弹性蛋白(西格玛公司(sigma)e-1625)和牛角蛋白(icn生物医学公司902111)。使用这些底物的比色测定是本领域熟知的(参见例如wo99/34011和美国专利号6,376,450,这两者都通过引用结合在此)。aapf测定(参见例如,delmar等人,anal.biochem.,[生物化学年鉴],99:316-320,1979,或estell等人,jbiolchem.[生物化学杂志],260:6518-6521,1985)也可用于确定成熟蛋白酶的产生。该测定测量当酶水解可溶性合成底物,琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(saapf-pna)时释放对硝基苯胺的速率。在分光光度计上在410nm或405nm下测量来自水解反应的黄色的生成速率并且该速率与活性酶浓度成正比。特别地,在此术语“蛋白酶”是指“丝氨酸蛋白酶”。如在此所使用的,术语“枯草杆菌蛋白酶”和“丝氨酸蛋白酶”是指如在merops-肽酶数据库中描述的s8丝氨酸蛋白酶家族的任何成员(rawlings等人,merops:thepeptidasedatabase[merops:肽酶数据库],nucleicacidsres[核酸研究],34数据库问题,d270-272,2006,在网址merops.sanger.ac.uk/cgi-bin/merops.cgi?id=s08;action=.)。以下信息来源于如在2008年11月6日的merops-肽酶数据库“peptidasefamilys8containstheserineendopeptidaseserineproteaseanditshomologues[肽酶家族s8含有丝氨酸肽链内切酶丝氨酸蛋白酶及其同系物](biochemj[生物化学杂志],290:205-218,1993)。s8家族(又称为枯草杆菌酶家族)是丝氨酸肽酶的第二最大的家族,并且可以划分为两个亚家族,其中枯草杆菌蛋白酶(s08.001)亚家族s8a的类型实例和kexin(s08.070)亚家族s8b的类型实例。之前认为三肽基-肽酶ii(tpp-ii;s08.09)是第三亚家族的类型实例,但已经被确定为错误分类。在此术语“亲本蛋白酶”是指包含以组合天然表达的前区域、原区域和成熟区域的全长蛋白酶。在一些实施例中,亲本蛋白酶的前区域和/或原区域和/或成熟区域用于产生前体蛋白酶的前区域和/或原区域和/或成熟区域。在此术语“前体蛋白酶”是指包含信号肽、原(或前肽)区域和成熟区域的未经修饰的或经修饰的全长蛋白酶。该前体蛋白酶可以来源于天然存在的(即,野生型)蛋白酶、来源于变体蛋白酶、经修饰的蛋白酶、或突变的蛋白酶。在本发明的一些实施例中,它是被修饰以产生经修饰的蛋白酶的前体蛋白酶的原区域。在一些实施例中,前体蛋白酶的前区域是经修饰的。在一些实施例中,该前体蛋白酶包含来源于一种亲本蛋白酶的原区域和成熟区域。在其他实施例中,该前体蛋白酶是包含来源于一种或多种亲本蛋白酶的前区域或原区域和来源于不同的亲本蛋白酶的成熟区域的嵌合蛋白。当用于提及蛋白质时,在此术语“嵌合”或“融合”是指通过连接最初编码分开的蛋白质或蛋白质片段的两种或更多种多核苷酸产生的蛋白质。这种融合多核苷酸的翻译导致具有来源于每种原始蛋白质的功能特性的单一嵌合多肽。重组融合蛋白可以通过重组dna技术和融合/嵌合多核苷酸的表达而产生。重组融合蛋白还可以通过体外化学合成来产生。“嵌合多肽”或“嵌合体”意指含有来自多于一种多肽的序列的蛋白质。经修饰的蛋白酶可以是嵌合的,在这种意义上该蛋白酶含有与来自一种或多种其他蛋白酶的部分、区域、或结构域融合的来自一种蛋白酶的部分、区域或结构域。举例来说,嵌合蛋白酶可以包含与另一种蛋白酶的前肽连接的一种蛋白酶的成熟区域。本领域技术人员将认识到,嵌合多肽和蛋白酶不需要通过蛋白质序列的实际融合来制备,而是具有相应编码序列的多核苷酸还可以用于表达嵌合多肽或蛋白酶。在此“天然存在的”或“野生型”是指具有与在自然中发现的蛋白酶相同的未经修饰的氨基酸序列的蛋白酶,或编码这样的蛋白酶的多核苷酸。天然存在的酶包括天然的酶,在特定的微生物中天然表达或发现的那些酶。野生型或天然存在的序列是指与在自然中发现的序列相同的或来源于自然中发现的序列的序列。野生型序列可以包含或编码自然中存在的变体、同系物或异源物的序列,该序列与最初鉴定的多核苷酸或多肽的序列不同。编码天然存在的或野生型蛋白酶的多核苷酸可以是本身天然存在的或野生型多核苷酸,或可以是编码与天然存在的或野生型多肽相同的蛋白质序列的经修饰的多核苷酸。如在此所使用的“变体”蛋白质或蛋白质区域是指通过以下方式不同于其对应的野生型蛋白质或蛋白质区域的蛋白质或蛋白质区域:向c-和n-末端之一或二者添加一个或多个氨基酸,在氨基酸序列的一个或多个位点处取代一个或多个氨基酸,在蛋白质的一端或两端处或在氨基酸序列的一个或多个位点处缺失一个或多个氨基酸,和/或在蛋白质的氨基酸序列的一个或多个位点处插入一个或多个氨基酸。变体蛋白涵盖天然存在的变体和基因工程变体蛋白质。在本发明的上下文中变体蛋白是指非天然存在的变体并通过吉氏芽孢杆菌枯草杆菌蛋白酶bsp-00801进行示例,该吉氏芽孢杆菌枯草杆菌蛋白酶bsp-00801是天然存在的蛋白质吉氏芽孢杆菌枯草杆菌蛋白酶bgi02446的变体。将bsp-00801的成熟区域的两种形式的序列示于seqidno:12和seqidno:13中,然而将bgi02446的那些示于seqidno:10和seqidno:11中。seqidno:12和13分别与seqidno:11和10相差十个氨基酸取代。如在此所使用的“同系物”和“同源蛋白”是指与目的蛋白(例如,来自另一种来源的蛋白酶)具有相似作用和/或结构的蛋白质(例如,蛋白酶)。这并不旨在意味着同系物在进化上是必然相关的。因此,术语旨在涵盖从不同物种获得的相同或相似的一种或多种酶(即,根据结构和功能)。术语“来源于”和“获得自”不仅是指由所讨论的生物体的菌株产生或可以由其产生的蛋白酶,而且是指由从此类菌株分离的dna序列编码并且在含有此类dna序列的宿主生物体中产生的蛋白酶。另外,该术语是指由合成的和/或cdna来源的dna序列编码并且具有所讨论的蛋白酶的鉴定特征的蛋白酶。举例来说,“来源于芽孢杆菌属的蛋白酶”是指由芽孢杆菌属天然产生的具有蛋白水解活性的那些酶,以及如由芽孢杆菌属来源产生但是通过使用基因工程技术由用编码所述丝氨酸蛋白酶的核酸转化的非芽孢杆菌属生物体产生的那些丝氨酸蛋白酶。“经修饰的全长蛋白酶”和“经修饰的前体蛋白酶”可互换地使用,是指包含来源于一个或多个亲本或前体蛋白酶的信号肽、原(或前肽)区域、和成熟区域的全长蛋白酶,其中将该原区域或前区域,或二者进行修饰以含有至少一种修饰或突变。在另一方面,如在此所使用的术语“经修饰的蛋白酶”是指具有来源于一个或多个亲本蛋白酶的至少原区域和成熟区域的全长或部分蛋白酶,其中将该原区域进行修饰以含有至少一种修饰或突变。在一些实施例中,原区域和成熟区域来源于相同的亲本蛋白酶。在其他实施例中,原区域和成熟区域来源于不同的亲本蛋白酶。该经修饰的蛋白酶包含原区域,将该原区域进行修饰以含有异源蛋白酶的原区域,或含有相同亲本蛋白酶的但具有至少一个突变的原区域。经修饰的蛋白酶是通过经修饰的多核苷酸编码的,该经修饰的多核苷酸不是野生型,至少在蛋白酶编码基因的整个长度上不是野生型。据说经修饰的蛋白酶的氨基酸序列是通过以下方式“产生”自亲本蛋白酶氨基酸序列:将一个或多个氨基酸的至少一个突变(例如,取代、缺失或插入)引入到亲本氨基酸序列的原区域,或用异源蛋白酶的原区域替换整个亲本氨基酸序列的原区域。在一些实施例中,将前体蛋白酶的原区域的一个或多个氨基酸取代以产生经修饰的全长蛋白酶。这种修饰是对编码“前体”蛋白酶的氨基酸序列的“前体”dna序列进行,而不是对前体蛋白酶本身的操纵。例如,经修饰的全长蛋白酶由seqidno:58表示,该蛋白酶包括枯草芽孢杆菌枯草杆菌蛋白酶apre的信号肽、野生型迟缓芽孢杆菌枯草杆菌蛋白酶p29600的前肽序列、和吉氏芽孢杆菌枯草杆菌蛋白酶变体bsp-00801的成熟序列。将编码seqidno:58的经修饰的全长蛋白酶的dna序列示于seqidno:14中。当用于指蛋白酶多肽或多核苷酸时,在此术语“未经修饰的”是指包含未被修饰以包含至少一个突变(例如,取代)的原区域的蛋白酶。在此术语“全长蛋白”和“前原蛋白”是指包含信号肽、前序列和成熟序列的基因产物。术语“信号序列”、“信号肽”或“前区域”是指可参与该蛋白质的成熟形式或前体形式的分泌的核苷酸和/或氨基酸的任何序列。信号序列的这个定义是功能性定义,意在包括所有那些由该蛋白质基因的n末端部分所编码的、参与蛋白质分泌的实现的氨基酸序列。举例来说,本发明蛋白酶的前肽至少包括seqidno:40的氨基酸序列,该氨基酸序列对应于seqidno:58的全长蛋白酶的氨基酸1-29。如下呈现,seqidno:58包含经修饰的全长蛋白酶的氨基酸序列,其中这些加下划线的氨基酸残基包含apre信号肽(即,seqidno:58的残基1-29),斜体的氨基酸残基包含迟缓芽孢杆菌_p29600前肽(即,seqidno:58的残基30-113),并且大写的氨基酸残基包含成熟bsp-00801变体蛋白酶(即,seqidno:58的残基114-382)。术语“前序列”、“原区域”、“前肽”、“前肽序列”或“前肽区域”是信号序列和成熟蛋白酶之间的氨基酸序列,该序列对于蛋白酶的折叠、分泌,和/或产生是必需的。从原蛋白酶上切割前序列将导致成熟的活性蛋白酶。举例来说,本发明蛋白酶的原区域包括至少seqidno:8的氨基酸序列,该序列对应于seqidno:58的全长蛋白酶的氨基酸30-113。如在此所使用的“异源前肽区域”是指与目的成熟蛋白酶不是原生的或不是最初表达为与目的成熟蛋白酶相同的前体蛋白酶的一部分的前肽区域。异源前肽区域,或异源蛋白酶的前肽区域具有与目的成熟蛋白酶的天然前肽区域不同的至少一个氨基酸。术语蛋白酶的“成熟形式”或“成熟区域”是指蛋白酶的最终功能部分。举例来说,本发明的蛋白酶的成熟形式包括seqidno:12或13的氨基酸序列,该氨基酸序列分别对应于seqidno:58的全长蛋白酶的氨基酸114-382或115-382。在此上下文中,“成熟形式”“加工自”全长蛋白酶,其中对全长蛋白酶的加工涵盖信号肽的去除和原区域的去除。在此术语“原蛋白”、“前多肽”和“原蛋白酶”是指包含有效地连接至前多肽的成熟形式的蛋白质。“前多肽”由“前多核苷酸”编码。如在此所使用的,术语“异源蛋白质”与天然蛋白质相反,例如,是指不像天然蛋白质那样天然存在于相同的宿主细胞或宿主菌株中的蛋白质或多肽。相似地,“异源多核苷酸”是指与不像天然多核苷酸那样天然存在于相同的宿主细胞或宿主菌株中的多核苷酸。异源多肽和/或异源多核苷酸包括天然存在于宿主细胞或宿主菌株中的全长或部分野生型多肽和/或多核苷酸,该宿主细胞或宿主菌株不同于天然多肽和/或异源多核苷酸存在的宿主细胞或宿主菌株。它们还包括非天然存在于任何已知的天然宿主细胞或宿主菌株的全长或部分多肽和/或多核苷酸(例如,基因工程化的多肽和/或多核苷酸)。它们包括全长的、部分的、或嵌合的多肽和/或多核苷酸。异源蛋白质可以是与天然蛋白质具有相同、相似或等同的功能和/或结构的蛋白质,或者它可以是具有非常不同的功能和/或结构的蛋白质。异源蛋白质具有至少一个不同于天然蛋白质的氨基酸。如在此所使用的“取代的”和“取代”是指在亲本序列中氨基酸残基或核酸碱基的一个或多个替换。在一些实施例中,取代涉及天然存在的残基或碱基的替换。在此经修饰的蛋白酶涵盖通过在细菌中天然存在的剩余的19个氨基酸中任一者,或通过非天然存在的氨基酸在前体蛋白酶的原区域中的所有氨基酸中任一者的取代。例如,野生型迟缓芽孢杆菌枯草杆菌蛋白酶p29600序列,seqidno:8的位置6(简写为“e6”)处的谷氨酸的取代可以被由以下组成的组中的任一者取代/替换:丙氨酸(a)、半胱氨酸(c)、门冬氨酸(d)、甘氨酸(g)、苯丙氨酸(f)、组氨酸(h)、异亮氨酸(i)、赖氨酸(k)、亮氨酸(l)、甲硫氨酸(m)、天冬酰胺(n)、脯氨酸(p)、谷氨酰胺(q)、精氨酸(r)、丝氨酸(s)、苏氨酸(t)、缬氨酸(v)、色氨酸(w)和酪氨酸(y)。由e6x表示在相同位置处的氨基酸(例如,e6)取代为任何其他的氨基酸,其中x是在位置6处取代e的剩余19个氨基酸中的一者。在一些实施例中,取代两个或更多个氨基酸以产生包含氨基酸取代组合的经修饰的蛋白酶。例如,将在位置6处的氨基酸e取代氨基酸a与在位置30处的氨基酸e取代氨基酸t结合的组合表示为e6a-e30t。在一些实施例中,将在原区域中用于取代的氨基酸位置对应于在seqidno:8的原区域中编号的位置进行编号。在一些其他实施例中,将在原区域中用于取代的氨基酸位置对应于在seqidno:7的原区域中编号的位置进行编号。如在此所使用的“相对应”、“对应于”或“相当于”是指在蛋白质或肽中列举位置处的残基,或与蛋白质或肽中所列举的残基类似、同源或等同的残基。如在此所使用的“对应区域”通常是指沿相关蛋白质或参考蛋白质中的类似位置。在对应于参考蛋白质中的列举残基的位置处的蛋白质中的天然氨基酸与参考蛋白质中的残基可以是相同或不同的。在此术语“前多核苷酸”、“原核苷酸”和“成熟多核苷酸”是指分别编码蛋白质的前区域、原区域和成熟区域(例如蛋白酶)的多核苷酸序列。关于蛋白酶的术语“产生”涵盖全长蛋白酶的两个加工步骤,包括:(1)去除已知在蛋白质分泌期间发生的信号肽;和(2)去除原区域,该原区域产生活性成熟形式的酶并且该原区域在成熟过程中是已知发生的(wang等人,biochemistry[生物化学]37:3165-3171,1998;power等人,procnatlacadsciusa[美国国家科学院学报]83:3096-3100,1986)。在此术语“增强的产物”是指从经修饰的全长蛋白酶加工的成熟蛋白酶的产生,并且该产生以比当从未经修饰的全长蛋白酶加工时相同成熟蛋白酶的产生水平更高的水平发生。关于成熟蛋白酶的术语“加工的”是指全长蛋白(例如全长蛋白酶)经历以成为一个活性成熟酶的成熟过程。关于酶的“活性”是指“催化活性”,并且涵盖酶活性的任何可接受的量度,例如活性速率、活性量或比活性。“催化活性”是指催化特定化学反应的能力,例如对特定化学键的水解。如本领域技术人员将理解的,酶的催化活性仅加速本来缓慢的化学反应的速率。因为酶只起到催化剂的作用,它既不会被反应本身产生也不会被消耗。本领域技术人员还将认识到并非所有的多肽都具有催化活性。“比活性”是每单位总蛋白质或酶的酶活性的量度。因此,比活性可按单位重量(例如每克或每毫克)或单位体积(例如每ml)的酶来表示。此外,例如,在活性标准是已知的或可用于比较的情况下,比活性可以包括酶纯度的度量,或者可以提供纯度的指示。活性的量反映了由表达所测量酶的宿主细胞产生的酶的量。术语“相对活性”或“产生比率”在此可互换使用,是指从经修饰的蛋白酶加工的成熟蛋白酶的酶活性与从未修饰的蛋白酶加工的成熟蛋白酶的酶活性的比率。通过将从经修饰的前体加工的蛋白酶的活性值除以从未经修饰的前体加工时的相同蛋白酶的活性值来确定产生比率。相对活动是表示为百分比的产生比率。如在此所用,术语“表达”是指基于基因的核酸序列产生多肽的过程。此过程包括转录和翻译。将术语“百分比(%)同一性”定义为在与前体序列(即,亲本序列)的氨基酸残基/核苷酸残基相同的候选序列中氨基酸/核苷酸残基的百分比。氨基酸序列同一性值%由匹配的相同残基数除以比对区域中“较长”序列的残基总数来确定。氨基酸序列可以是相似的,但相对于参考序列,在氨基酸被取代、缺失或插入到主题序列中时不是“相同的”。对于蛋白质,序列同一性百分比优选地在相对于翻译后修饰处于相似状态的序列之间测量。典型地,将主题蛋白质的“成熟序列”,即处理去除信号序列后保留的序列与参考蛋白质的成熟序列进行比较。在其他情况下,可以将主题多肽序列的前体序列与参考序列的前体进行比较。如在此所使用的,术语“启动子”是指用于引导下游基因转录的核酸序列。在一些实施例中,启动子适用于正在表达靶基因的宿主细胞。启动子与其他转录和翻译调控核酸序列(也称为“控制序列”)一起是表达给定的基因所必须的。通常,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、以及增强子或激活子序列。当核酸或多肽序列置于与另一个核酸或多肽序列的功能关系时,该核酸或多肽分别与另一个核酸或多肽序列“有效地连接”。例如,如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子有效地连接至所述序列;如果核糖体结合位点被定位以便促进翻译,那么所述核糖体结合位点有效地连接至编码序列。或如果经修饰的或异源的原区域能够加工全长蛋白酶以产生成熟活性形式的酶,那么所述经修饰的或异源的原区域有效地连接至蛋白酶的成熟区域。通常,“有效地连接”意指被连接的dna或多肽序列是连续的。在一些情况下,“有效地连接”涵盖间接连接。“宿主细胞”是指充当用于包含根据本发明dna的表达载体的宿主的合适的细胞。合适的宿主细胞可以是天然存在的或野生型宿主细胞,或它可以是经改变的宿主细胞。在一个实施例中,宿主细胞是革兰氏阳性微生物。在一些实施例中,该术语是指在芽孢杆菌属中的细胞。如在此所使用的“芽孢杆菌属物种”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌(b.licheniformis)、迟缓芽孢杆菌、吉氏芽孢杆菌、克劳氏芽孢杆菌、诺瓦利斯芽孢杆菌、短芽孢杆菌(b.brevis)、短小芽孢杆菌(b.pumilis)、嗜热脂肪芽孢杆菌(b.stearothermophilus)、嗜碱芽孢杆菌(b.alkalophilus)、解淀粉芽孢杆菌(b.amyloliquefaciens)、耐盐芽孢杆菌(b.halodurans)、巨大芽孢杆菌(b.megaterium)、凝结芽孢杆菌(b.coagulans)、环状芽孢杆菌(b.circulans)、灿烂芽孢杆菌(b.lautus)和苏云金芽孢杆菌(b.thuringiensis)。据认识,芽孢杆菌属继续经历分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于:例如嗜热脂肪芽孢杆菌(b.stearothermophilus)(现在称为“嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)”)的此类生物体。在氧气存在下的抗性内生孢子的产生被认为是芽孢杆菌属的定义性特性,尽管这个特征也适用于最近命名的脂环酸芽孢杆菌属(alicyclobacillus)、双芽孢杆菌属(amphibacillus)、硫胺素芽孢杆菌属(aneurinibacillus)、厌氧芽孢杆菌属(anoxybacillus)、短芽孢杆菌属(brevibacillus)、线性杆菌属(filobacillus)、薄壁芽孢杆菌属(gracilibacillus)、喜盐芽孢杆菌属(halobacillus)、类芽孢杆菌属(paenibacillus)、需盐芽孢杆菌属(salibacillus)、耐热芽孢杆菌属(thermobacillus)、脲芽孢杆菌属(ureibacillus)和枝芽孢杆菌属(virgibacillus)。术语“多核苷酸”和“核酸”在此可互换地使用,是指任何长度的核苷酸的聚合形式。这些术语包括但不限于,单链dna;双链dna;基因组dna;cdna;或包含嘌呤碱和嘧啶碱,或其他天然的、经化学或生物化学修饰的、非天然的、或衍生的核苷酸碱的聚合物。多核苷酸的非限制性实例包括基因、基因片段、染色体片段、est、外显子、内含子、mrna、trna、rrna、核酶、cdna、重组多核苷酸、分枝的多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针和引物。应当理解,由于遗传密码的简并性,可以产生编码给定蛋白质的许多核苷酸序列。如在此所使用的,术语“dna构建体”和“转化dna”可互换地使用,是指用于将序列引入宿主细胞或生物体的dna。dna构建体可以通过pcr或任何其他本领域技术人员已知的一种或多种合适的技术在体外产生。在一些实施例中,dna构建体包含目的序列(例如,编码经修饰的蛋白酶的序列)。在一些实施例中,序列有效地连接到另外的元件,例如控制元件(例如,启动子等)。dna构建体可以进一步包含选择性标志。在一些实施例中,dna构建体包含与宿主细胞染色体同源的序列。在其他实施例中,dna构建体包含非同源序列。一旦在体外装配了dna构建体,则可将其用于诱变宿主细胞染色体的区域(即,用异源序列替换内源序列)。如在此所使用的,术语“表达盒”是指重组或合成产生的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件的核酸构建体。重组表达盒可以整合在载体,例如质粒、染色体、线粒体dna、质体dna、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括,除了其他序列之外,待转录的核酸序列和启动子。在一些实施例中,表达载体具有在宿主细胞中整合并表达异源dna片段的能力。许多原核和真核表达载体是可商购的。合适的表达载体的选择在本领域技术人员的知识范围内。在此术语“表达盒”与“dna构建体”和它们的语法等价物可互换地使用。合适的表达载体的选择在本领域技术人员的知识范围内。如在此所使用的,术语“异源dna序列”是指非天然存在于宿主细胞的dna序列。在一些实施例中,异源dna序列是由不同基因的部分(包括调控元件)组成的嵌合dna序列。如在此所使用的,术语“载体”是指设计用于将核酸引入一种或多种细胞类型的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体、和质粒。在一些实施例中,多核苷酸构建体包含编码全长蛋白酶(例如,经修饰的蛋白酶或未经修饰的前体蛋白酶)的dna序列。如在此所使用的,术语“质粒”是指用作克隆载体的环状双链(ds)dna构建体,并且其在一些真核或原核生物中形成额外的染色体自复制遗传元件,或整合进宿主染色体。如在此使用的,在将核酸序列引入细胞中的背景下,术语“引入”是指适合于将核酸序列转移到细胞中的任何方法。这种引入方法包括但不限于原生质体融合、转染、转化、缀合和转导(参见例如,ferrari等人,“genetics[遗传学]”在hardwood等人(编辑),bacillus[芽孢杆菌],普莱南出版公司(plenumpublishingcorp.),第57-72页,1989)。如在此所使用的,术语“转化的”和“稳定转化的”是指具有整合到其基因组中的或作为维持至少两代的游离型质粒的非天然(例如,异源的)多核苷酸序列的细胞。经修饰的蛋白酶本发明提供了用于在细菌宿主细胞中产生成熟蛋白酶的方法和组合物。这些组合物包括编码经修饰的蛋白酶的多核苷酸,该多核苷酸在待产生的蛋白酶的天然原区域中具有异源原区域或至少一个突变;由这样的多核苷酸编码的经修饰的丝氨酸蛋白酶;包含编码经修饰的蛋白酶的多核苷酸的表达盒、dna构建体、载体和染色体;和用载体转化的细菌宿主细胞或包含本发明染色体的细菌宿主细胞。这些方法包括用于增强在细菌宿主细胞(例如芽孢杆菌属物种宿主细胞)中成熟蛋白酶产生的方法。所产生的蛋白酶可用于适用于各种行业的酶的工业生产,这些行业包括但不限于清洁业、动物饲料业和纺织品加工业。蛋白质穿膜运输的基本机制似乎是普遍的,其中重要特征在细菌和真核生物之间是保守的。因为它们可以大量地分泌某些蛋白质到生长介质中,所以芽孢杆菌属物种被用于工业生产酶(如碱性丝氨酸蛋白酶)。蛋白酶由被称为前原蛋白酶的前体蛋白酶在体内产生,该前体蛋白酶包含又称为信号肽的前区域、蛋白酶的原区域和成熟区域。跨芽孢杆菌属物种细胞包膜的蛋白质分泌是一个复杂的过程,包括将前体蛋白质插入膜中,以及蛋白质穿过膜转运。前区域充当用于蛋白质跨膜分泌的信号肽,并被信号肽酶水解。成熟过程的细胞外部分涉及原蛋白酶的折叠、原区域的自加工、和原区域的降解以产生酶的活性成熟形式(nagarjanv.,proteinsecretionin“bacillussubtilisandothergram-positivebacteria”[在“枯草芽孢杆菌和其他革兰氏阳性细菌”中的蛋白质分泌]第49章,第713-726页,1993;ruan等人,biochemistry[生物化学],38:8562-8571,2009)。在一些实施例中,经修饰的蛋白酶是丝氨酸蛋白酶。在一些实施例中,经修饰的蛋白酶是碱性丝氨酸蛋白酶。在某些实施例中,经修饰的蛋白酶是枯草杆菌蛋白酶。在一些实施例中,本发明提供了包含有效地连接至吉氏芽孢杆菌进化枝蛋白酶成熟区域的异源芽孢杆菌蛋白酶的前肽区域的经修饰的蛋白酶。在一些实施例中,经修饰的蛋白酶基本上由有效地连接至吉氏芽孢杆菌进化枝蛋白酶成熟区域的异源芽孢杆菌蛋白酶的前肽区域组成,或由其组成。在一些实施例中,异源芽孢杆菌蛋白酶来自芽孢杆菌属物种,该芽孢杆菌属物种不是吉氏芽孢杆菌进化枝的成员。在一些实施例中,经修饰的蛋白酶包含与第二吉氏芽孢杆菌进化枝蛋白酶的成熟区域连接的第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域。在某些实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自相同的芽孢杆菌属物种或相同的菌株。在其他实施例中,第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自不同的芽孢杆菌属物种或菌株。在一些实施例中,通过用编码异源芽孢杆菌蛋白酶(异源前多核苷酸)的前肽区域的核酸序列替换吉氏芽孢杆菌进化枝蛋白酶(待产生的蛋白酶)的编码前肽区域的核酸序列(天然前多核苷酸)来产生经修饰的蛋白酶。前肽区域在本发明的经修饰的蛋白酶的一些实施例中,前肽区域是来自异源芽孢杆菌蛋白酶(例如,非吉氏芽孢杆菌进化枝蛋白酶,或来自不同吉氏芽孢杆菌进化枝物种或来自天然物种吉氏芽孢杆菌的不同菌株的或提供成熟区域序列的菌株的蛋白酶)的前肽区域。来自异源芽孢杆菌蛋白酶的前肽区域具有与提供成熟区域序列的蛋白酶的天然前肽区域不同的至少一个氨基酸。在一些实施例中,前肽区域是来自吉氏芽孢杆菌进化枝蛋白酶的非天然存在的变体前肽区域。可以将来自芽孢杆菌属的多种物种的异源蛋白酶用于提供或衍生处于编码蛋白质序列的氨基酸或核苷酸形式的经修饰的蛋白酶的前肽区域的序列。例如,来自迟缓芽孢杆菌、克劳氏芽孢杆菌、嗜碱芽孢杆菌、列城芽孢杆菌、诺瓦利斯芽孢杆菌,或它们的相关物种的丝氨酸蛋白酶都可以使用。在一些实施例中,经修饰的蛋白酶的前肽区域来自迟缓芽孢杆菌或其相关物种。野生型或变体异源蛋白酶二者都可以使用。异源蛋白酶的实例包括,但不限于bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、bpan01744、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、bps02003、bohn00569、bspak01305、bpan04382和bspal03279。例如,克劳氏芽孢杆菌_p41362的前肽序列seqidno:42中所示;列城芽孢杆菌_afk08970的前肽序列seqidno:43中所示;bps02003的前肽序列seqidno:48中所示;bspq01211的前肽序列seqidno:49中所示;bps02592的前肽序列seqidno:50中所示;迟缓芽孢杆菌_p29600的前肽序列seqidno:8中所示;bspal03240的前肽序列seqidno:51中所示;bpan01744的前肽序列seqidno:52中所示;bohn00569的前肽序列seqidno:53中所示;bspak01305的前肽序列seqidno:54中所示;bpan04382的前肽序列seqidno:55中所示,以及bspal03279的前肽序列seqidno:56中所示。在其中使用吉氏芽孢杆菌进化枝前肽区域(包括吉氏芽孢杆菌进化枝蛋白酶的异源和变体前肽区域)的实施例中,这样的吉氏芽孢杆菌进化枝蛋白酶的实例包括但不限于来自吉氏芽孢杆菌菌株dsm8722(命名为bgi02446或aprbg的蛋白酶)、dsm9728、dsm9729、dsm9730和dsm9731的枯草杆菌蛋白酶,这些枯草杆菌蛋白酶中的全部公开于国际pct公开号wo2015/089447中,将其通过引用结合在此。这些dsm菌株丝氨酸蛋白酶的前肽序列是相同的。这样的吉氏芽孢杆菌进化枝蛋白酶的其他实例包括但不限于来自以下各项的枯草杆菌蛋白酶:吉氏芽孢杆菌tii-5(pct公开号wo2003/054185,德温特专利索引登录号cae48424)、吉氏芽孢杆菌ti-1(pct公开号wo2003/054184,德温特专利索引登录号cae48421)、吉氏芽孢杆菌hp302(pct公开号wo2007/131657,德温特专利索引登录号cas91385和pct公开号wo2008/086916,德温特专利索引登录号cav33594)。将在此描述的来自一些吉氏芽孢杆菌进化枝蛋白酶的前肽区域的序列是以下序列中所示:seqidno:7(bgi02446前肽)、seqidno:45(吉氏芽孢杆菌_tii-5前肽)、seqidno:46(吉氏芽孢杆菌_hp302前肽)和seqidno:47(吉氏芽孢杆菌_ti-1前肽)。为了比较并可视化来自上述芽孢杆菌属物种的枯草杆菌蛋白酶的前肽区域序列之间的关系,生成代表性序列的系统树并将该系统树列于图1中。可以在例如vectorntiadvance套件中输入前肽氨基酸序列,并且可以使用邻接(nj)法创建引导树(guidetree)(saitou和nei,molbiolevol[分子生物学与进化],4:406-425,1987)。nj方法用于待分析的所有序列对之间的距离矩阵。这些距离与序列之间的散度有关。在序列比对后计算引导树。使用以下参数计算树结构:针对序列距离的木村(kimura)校正并且忽略具有空位的位置。mega6程序被用来显示系统树。下面在例13中介绍并阐述了使用具有默认参数的clustalw软件(thompson等人,nucleicacidsresearch[核酸研究],22:4673-4680,1994)创建的更详细的序列比对。在经修饰的蛋白酶的一些实施例中,异源芽孢杆菌蛋白酶的前肽区域或异源前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列。在一些实施例中,异源芽孢杆菌蛋白酶的前肽区域,或异源前肽区域包含与seqidno:8具有至少42%、44%、46%、48%、50%、52%、54%、56%、58%、60%、62%、64%、66%、68%、或70%同一性的氨基酸序列。在一些实施例中,异源前肽区域包含与seqidno:8具有至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在一些实施例中,异源芽孢杆菌蛋白酶的前肽区域包含seqidno:8的氨基酸序列。在一些实施例中,异源芽孢杆菌蛋白酶的前肽区域包含来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,其中该变体前肽区域包含至少一个氨基酸取代。在一些实施例中,至少一个氨基酸取代在对应于seqidno:8的位置6、30或32的位置处。在一些实施例中,至少一个氨基酸取代通过芽孢杆菌属物种宿主细胞(例如,枯草芽孢杆菌宿主细胞)增强吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在一些实施例中,如与包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码相同的枯草杆菌蛋白酶的野生型前肽区域的第二多核苷酸区域的多核苷酸相比,至少一个氨基酸取代增强吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在一些实施例中,前肽区域包含与seqidno:7具有至少60%同一性的吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域。在一些实施例中,变体前肽区域包含与seqidno:7具有至少62%、64%、66%、68%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、或98%同一性的氨基酸序列。在一些实施例中,吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域包含对应于seqidno:7的位置34的位置处的氨基酸取代。在一些实施例中,氨基酸取代通过芽孢杆菌属物种宿主细胞(例如,枯草芽孢杆菌宿主细胞)增强与前肽连接的吉氏芽孢杆菌进化枝蛋白酶的成熟区域的产生。在一些实施例中,异源或变体前肽区域的前肽区域包含列于seqidno:44(该序列在图11中示出并进一步描述于实例13中)中的氨基酸序列。在一些实施例中,每个“x”可以是任何氨基酸。在一些实施例中,位置1、22-51和91处的“x”可以单独地或共同地缺失。在具体的实施例中,在seqidno:44中的氨基酸“x”可以选自如下在表1中列出的可能的氨基酸。表1表1(续)位置氨基酸55d、e、y、t、f、或q64t、s、d、或n72k、l、s、或e73n、e、l、g、k、或a74e或d75e、p、a、或s76s、a、或g80i或v85q、i、a、v、或f87v或l88t、s、或k89t或i90m、f、a、或缺失91a或缺失在其他实施例中,异源或变体前肽区域的前肽区域包含seqidno:69中所示的氨基酸序列,该序列在图12中示出。在一些实施例中,每个x可以是任何氨基酸。在具体的实施例中,在seqidno:44中的氨基酸“x”可以选自如下在表2中列出的可能的氨基酸。表2位置氨基酸13n、k、或t20e、q、或t27a、g、或e28n或缺失29d或缺失31v、e、或y32a、s、或v34l、s、或i37a、v、或e59s、n、或d在经修饰的蛋白酶的一些实施例中,异源或变体芽孢杆菌属蛋白酶的前肽区域包含与seqidno:44或69具有至少50%、60%、75%、80%、85%、90%、95%、96%、97%、98%,或99%同一性的氨基酸序列。成熟区域在一些实施例中,本发明的经修饰的蛋白酶的成熟区域来自吉氏芽孢杆菌进化枝蛋白酶。已经鉴定了吉氏芽孢杆菌进化枝成员的不同物种或菌株。已经报道或在出版物或专利申请中公开了许多吉氏芽孢杆菌进化枝成员的丝氨酸蛋白酶或枯草杆菌蛋白酶的序列,这些出版物或专利申请包括deng等人2014(j.microbiol.biotechnol.[微生物与生物技术杂志]24:197-208)、pct国际公开号wo2015/089447、pct国际公开号wo2016/069563和pct国际公开号wo2016/069569,其全部通过引用结合在此。以下列出了吉氏芽孢杆菌进化枝成员和它们的丝氨酸蛋白酶前体/前酶原序列的一些实例。信号肽序列以下划线和粗体表示,前序列以斜体表示,同时预测的成熟酶序列以正常字体表示。然而,尚未证实至少一些预测的成熟区域序列在自然界是可产生的。又称为aprbg的吉氏芽孢杆菌菌株dsm8722的bgi02446(deng等人2014),以及由菌株dsm9728、dsm9729、dsm9730和dsm9731编码的同源枯草杆菌蛋白酶在枯草杆菌蛋白酶系统树的相同区域中均共享显著的序列同一性和聚簇(参见,pct公开号wo2015/089447)。它们形成枯草杆菌蛋白酶的吉氏芽孢杆菌进化枝的基础。前酶原bgi02446的氨基酸序列如seqidno:61所示,并bgi02446的预测的成熟区域的氨基酸序列如seqidno:11所示。如下在实例6中所示,包含seqidno:11的序列(该序列在n-末端具有两个谷氨酰胺(qq))的bgi02446的预测的成熟区域是使用与其有效连接的异源芽孢杆菌蛋白酶前肽区域产生的。当bgi02446的天然前肽区域用于表达bgi02446的成熟区域时,产生不同形式的在n-末端仅具有一个谷氨酰胺(q)的成熟区域序列,该成熟区域序列的序列是seqidno:10中所示。dsm9728前酶原的氨基酸序列如seqidno:62所示。dsm9729前酶原的氨基酸序列如seqidno:63所示。dsm9730前酶原的氨基酸序列如seqidno:64所示。一些其他的丝氨酸蛋白酶吉氏芽孢杆菌进化枝枯草杆菌蛋白酶成员也被分类在吉氏芽孢杆菌进化枝下。例如,吉氏芽孢杆菌枯草杆菌蛋白酶bsp-00801是天然存在的吉氏芽孢杆菌枯草杆菌蛋白酶bgi02446的变体,也在此被分类在吉氏芽孢杆菌进化枝下。该蛋白质还被公开于2015年7月17日提交的美国临时专利申请序列号62/180,673中,命名为“吉氏芽孢杆菌进化枝丝氨酸蛋白酶”中,该申请以其全文通过引用结合在此。将bsp-00801的成熟区域的两种形式的序列示于seqidno:12和seqidno:13中。公开于美国临时专利申请序列号62/180,673中的bgi02446的其他变体还可以用于提供本发明的经修饰的蛋白酶的成熟区域。dsm9731前酶原的氨基酸序列如seqidno:57所示。已经鉴定出一些其他的丝氨酸蛋白酶并且可以分类在吉氏芽孢杆菌进化枝下。例如,如在pct公开号wo2008/086916中公开的吉氏芽孢杆菌枯草杆菌蛋白酶(德温特专利索引登录号cav33594),在wo2003/054185(登录号cae48424)中公开的吉氏芽孢杆菌枯草杆菌蛋白酶tii-5,在wo2003/054184(登录号cae48421)中公开的吉氏芽孢杆菌枯草杆菌蛋白酶ti-1,和在wo2007/131657(登录号cas91385)中公开的吉氏芽孢杆菌枯草杆菌蛋白酶hp302,以上所有蛋白酶由henkelag&co公开。提取这些序列的预测的成熟区域并在下文中示出。wo2003/054184-cae48421的预测的成熟区域的氨基酸序列如seqidno:65所示,wo2003/054185-cae48424的预测的成熟区域的氨基酸序列如seqidno:66所示,wo2007/131657-cas91385的预测的成熟区域的氨基酸序列如seqidno:67所示,并且wo20008/086916-cav33594的预测的成熟区域的氨基酸序列如seqidno:68所示。在一些实施例中,本发明的经修饰的蛋白酶的成熟区域来自野生型吉氏芽孢杆菌进化枝枯草杆菌蛋白酶。在其他实施例中,经修饰的蛋白酶的成熟区域来自成熟的或变体吉氏芽孢杆菌进化枝枯草杆菌蛋白酶。在一些实施例中,经修饰的蛋白酶的成熟区域来自枯草杆菌蛋白酶,该枯草杆菌蛋白酶选自由以下组成的组:bgi02446、dsm9728、dsm9729、dsm9730、dsm9731、吉氏芽孢杆菌tii-5(wo2003/054185-cae48424)、吉氏芽孢杆菌ti-1(在wo2003/054184-cae48421中公开的)、吉氏芽孢杆菌hp302(wo2007/131657-cas91385和wo2008/086916-cav33594)。在某些实施例中,经修饰的蛋白酶的成熟区域来自bgi024446枯草杆菌蛋白酶。在其他实施例中,经修饰的蛋白酶的成熟区域来自bgi024446枯草杆菌蛋白酶的变体。在某些实施例中,该成熟区域来自bsp-00801。在本发明经修饰的蛋白酶的一些实施例中,该成熟区域来自芽孢杆菌属蛋白酶,该芽孢杆菌属蛋白酶可能未被分类在吉氏芽孢杆菌进化枝下,但与吉氏芽孢杆菌进化枝枯草杆菌蛋白酶是同源的。在某些实施例中,该成熟区域包含与seqidno:10、11、12、或13具有至少60%同一性的氨基酸序列。在一些实施例中,该成熟区域包含与seqidno:10、11、12、或13具有至少65%、70%、75%、76%、77%、78%,或79%同一性的氨基酸序列。在一些实施例中,该成熟区域包含与seqidno:10、11、12、或13具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%,或99%同一性的氨基酸序列。在一些实施例中,该成熟区域包含seqidno:10、11、12、或13的氨基酸序列。多核苷酸、表达载体、染色体、以及宿主细胞在一方面,本发明提供了编码经修饰的蛋白酶的多核苷酸,该多核苷酸在待产生的蛋白酶的天然原区域中具有异源原区域或至少一个突变。在一些实施例中,多核苷酸编码在此描述的经修饰的蛋白酶。在一些实施例中,本发明提供了编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含:a)任选地,编码信号肽的第一多核苷酸区域;b)编码异源芽孢杆菌蛋白酶的前肽区域的第二多核苷酸区域,所述前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列;和c)编码吉氏芽孢杆菌进化枝蛋白酶的成熟区域的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在一些实施例中,本发明提供了编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含:a)任选地,编码信号肽的第一多核苷酸区域;b)编码来自迟缓芽孢杆菌或其相关物种的蛋白酶的前肽区域的第二多核苷酸区域;和c)编码吉氏芽孢杆菌进化枝蛋白酶的成熟区域的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在一些实施例中,多核苷酸包含第一多核苷酸区域。在其他实施例中,多核苷酸不包含第一多核苷酸区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的蛋白酶的前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自芽孢杆菌属物种的蛋白酶的前肽区域,该芽孢杆菌属物种选自由以下组成的组:迟缓芽孢杆菌、克劳氏芽孢杆菌、嗜碱芽孢杆菌、列城芽孢杆菌、和诺瓦利斯芽孢杆菌。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌的蛋白酶的前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的丝氨酸蛋白酶或枯草杆菌蛋白酶的前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的野生型前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码枯草杆菌蛋白酶的前肽区域,该枯草杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、bpan01744、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、bps02003、bohn00569、bspak01305、bpan04382、和bspal03279。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码枯草杆菌蛋白酶的前肽区域,该枯草杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、和bpan01744。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码迟缓芽孢杆菌_p29600的前肽区域。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码与seqidno:8具有至少50%同一性的氨基酸序列。在多核苷酸的一些实施例中,其中所述第二多核苷酸区域编码与seqidno:8具有至少75%同一性的氨基酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码与seqidno:8具有至少90%同一性的氨基酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码包含seqidno:8的序列的氨基酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,其中所述变体前肽区域包含对应于seqidno:8的位置6、30或32的位置处的至少一个氨基酸取代。在多核苷酸的一些实施例中,所述至少一种氨基酸取代通过芽孢杆菌属物种宿主细胞增强吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在一些实施例中,所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在多核苷酸的一些实施例中,如与包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码相同的枯草杆菌蛋白酶的野生型前肽区域的第二多核苷酸区域的多核苷酸相比,至少一个氨基酸取代增强吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在多核苷酸的一些实施例中,所述至少一种氨基酸取代在对应于seqidno:8的位置6的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:a、c、r、n、q、g、h、i、l、k、m、f、p、s、t、w、y和v。在多核苷酸的一些实施例中,所述至少一种氨基酸取代在对应于seqidno:8的位置30的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:a、r、n、d、c、q、g、h、l、k、m、s、t、w、y和v。在多核苷酸的一些实施例中,所述至少一种氨基酸取代在对应于seqidno:8的位置32的位置处,并且在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:r、n、c、q、g、h、i、l、k、m、f、p、s、t、w、y和v。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码seqidno:8中所示的前肽区域,条件是所述前肽区域包含选自seqidno:8的位置6、30和32的位置处的至少一个氨基酸取代。在多核苷酸的一些实施例中,所述前肽区域包含seqidno:8的位置6处的氨基酸取代,该氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y和e6v。在多核苷酸的一些实施例中,所述前肽区域包含seqidno:8的位置30处的氨基酸取代,该氨基酸取代选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y和e30v。在多核苷酸的一些实施例中,所述前肽区域包含seqidno:8的位置32处的氨基酸取代,该氨基酸取代选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y和a32v。在本发明的多核苷酸的某些实施例中,其中第二多核苷酸编码异源芽孢杆菌蛋白酶的前肽区域,并且其中该前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列,该前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:8的位置6的位置处的d、p和w。在某些实施例中,由第二多核苷酸编码的前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:8的位置6的位置处的d、c、y、p和w。在某些实施例中,由第二多核苷酸编码的前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:8的位置6的位置处的n、h、i、f、s、v、d、c、p、y和w。在一些实施例中,由第二多核苷酸编码的前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:8的位置30的位置处的i、p和y。在某些实施例中,由第二多核苷酸编码的前肽区域不包含在对应于seqidno:8的位置32的位置处的氨基酸q。在某些实施例中,由第二多核苷酸编码的前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:8的位置32的位置处的n、l、p和q。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含与seqidno:5具有至少60%同一性的核苷酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含与seqidno:5具有至少90%同一性的核苷酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含seqidno:5的序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含seqidno:5中所示的序列,条件是seqidno:5的第六、第三十,或第三十二密码子发生突变以编码不同的氨基酸。在一些实施例中,本发明提供了编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含:a)任选地,编码信号肽的第一多核苷酸区域;b)编码第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域的第二多核苷酸区域;和c)编码第二吉氏芽孢杆菌进化枝蛋白酶的成熟区域的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在多核苷酸的一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶或所述第二吉氏芽孢杆菌进化枝蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在多核苷酸的一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自相同的芽孢杆菌属物种。在多核苷酸的一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自不同的芽孢杆菌属物种。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码与seqidno:7具有至少60%同一性的氨基酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码与seqidno:7具有至少90%同一性的氨基酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码与seqidno:7具有至少60%同一性的变体前肽区域,其中所述变体前肽区域包含对应于seqidno:7的位置34的位置处的氨基酸取代。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码seqidno:7中所示的前肽区域,条件是所述前肽区域包含seqidno:7的位置34处的氨基酸取代。在一些实施例中,在所述位置处的天然氨基酸被选自由以下组成的组的氨基酸取代:d、c、g、h、s和v。在一些实施例中,在seqidno:7的位置34处的所述氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s和e34v。在多核苷酸的一些实施例中,所述氨基酸取代通过芽孢杆菌属物种宿主细胞增强第二吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在一些实施例中,所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在本发明的多核苷酸的某些实施例中,其中第二多核苷酸编码第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域,该前肽区域不包含选自由以下组成的组的任何氨基酸:在对应于seqidno:7的位置34的位置处的a、r、n、q、i、l、k、m、f、p、t、y和w。在某些实施例中,变体前肽区域不包含对应于seqidno:7的位置6或36的位置处的取代氨基酸。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含与seqidno:3具有至少60%同一性的核苷酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含与seqidno:3具有至少90%同一性的核苷酸序列。在多核苷酸的一些实施例中,所述第二多核苷酸区域包含seqidno:3中所示的序列,条件是seqidno:3的第三十四密码子发生突变以编码不同的氨基酸。在多核苷酸的一些实施例中,所述第二多核苷酸区域编码包含seqidno:44中所示的氨基酸序列的异源或变体前肽区域。在多核苷酸的一些实施例中,本文所述第二多核苷酸区域编码包含seqidno:69中所示的氨基酸序列的异源或变体前肽区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码来自吉氏芽孢杆菌的蛋白酶的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码吉氏芽孢杆菌进化枝丝氨酸蛋白酶或枯草杆菌蛋白酶的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码野生型吉氏芽孢杆菌进化枝枯草杆菌蛋白酶的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码变体吉氏芽孢杆菌进化枝枯草杆菌蛋白酶的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码枯草杆菌蛋白酶的成熟区域,该枯草杆菌蛋白酶选自由以下组成的组:bgi02446、dsm9728、dsm9729、dsm9730、dsm9731、吉氏芽孢杆菌tii-5(wo2003/054185-cae48424)、吉氏芽孢杆菌ti-1(wo2003/054184-cae48421)、吉氏芽孢杆菌hp302(wo2007/131657-cas91385)和wo2008/086916-cav33594。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码bgi024446的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码bgi024446的变体的成熟区域。在多核苷酸的一些实施例中,所述第三多核苷酸区域编码与seqidno:10、11、12、或13具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在一些实施例中,所述第三多核苷酸区域编码包含seqidno:10、11、12、或13的序列的氨基酸序列。在一些实施例中,所述第三多核苷酸区域编码包含seqidno:10或11的序列的氨基酸序列。在一些实施例中,所述第三多核苷酸区域编码包含seqidno:12或13的序列的氨基酸序列。在多核苷酸的一些实施例中,所述第三多核苷酸区域包含与seqidno:4或9具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列。在一些实施例中,所述第三多核苷酸区域包含seqidno:4或9的序列。在多核苷酸的一些实施例中,所述第一多核苷酸区域是存在的并编码芽孢杆菌信号肽。在一些实施例中,所述第一多核苷酸区域是存在的并编码枯草芽孢杆菌信号肽。在一些实施例中,所述第一多核苷酸区域编码与seqidno:40具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在一些实施例中,所述第一多核苷酸区域编码包含seqidno:40的序列的氨基酸序列。在多核苷酸的一些实施例中,所述第一多核苷酸区域是存在的并包含与seqidno:2具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%同一性的核苷酸序列。在一些实施例中,所述第一多核苷酸区域包含seqidno:2的核苷酸序列。在一些实施例中,本发明提供了编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含:a)编码seqidno:40的氨基酸序列的第一多核苷酸区域;b)编码seqidno:8的氨基酸序列或编码具有至少一个氨基酸取代的seqidno:8的序列的第二多核苷酸区域,所述氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、e6v、e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、e30v、a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v;和c)编码seqidno:11或12的氨基酸序列的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在一些实施例中,本发明提供了编码经修饰的蛋白酶的多核苷酸,所述多核苷酸包含:a)编码seqidno:40的氨基酸序列的第一多核苷酸区域;b)编码具有氨基酸取代的seqidno:7的氨基酸序列的第二多核苷酸区域,所述氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s和e34v;和c)编码seqidno:11或12的氨基酸序列的第三多核苷酸区域;其中将所述第一多核苷酸区域有效地连接至所述第二多核苷酸区域,并将所述第二多核苷酸区域有效地连接至所述第三多核苷酸区域。在一方面,本发明提供了包含本发明多核苷酸的表达载体。在另一方面,本发明提供了包含本发明多核苷酸的经修饰的染色体。可以通过用整合到染色体的本发明的多核苷酸引入宿主细胞dna构建体来改变染色体。在没有外源dna构建体的情况下,染色体还可以在原位突变。在一些实施例中,表达载体或经修饰的染色体进一步包含合适用于在枯草芽孢杆菌中基因表达并有效地连接至第一多核苷酸区域的启动子。在一方面,本发明提供了包含本发明的多核苷酸、表达载体、或经修饰的染色体的芽孢杆菌属物种宿主细胞。在一些实施例中,所述宿主细胞是枯草芽孢杆菌宿主细胞。如上所述,在一些实施例中,本发明提供了包含前述经修饰的多核苷酸的载体。在一些实施例中,该载体是表达载体,其中将编码本发明经修饰的蛋白酶的经修饰的多核苷酸序列有效地连接至用于有效基因表达所需的另外的区段(例如,有效地连接至目的基因的启动子)。在一些实施例中,这些必需元件(如果必需元件被识别的话)作为基因自身的同源启动子(即,由宿主转录)和外源的或由蛋白酶基因的内源终止子区提供的转录终止子提供的。在一些实施例中,还包括能够通过在含有抗菌剂的培养基中生长来实现质粒感染的宿主细胞的连续培养维持的选择基因,例如抗生素抗性基因。在一些实施例中,表达载体来源于质粒或病毒dna,或在可替代实施例中,含有两者的元件。示例性载体包括但不限于pxx、pc194、pjh101、pe194、php13(harwood和cutting(编辑),molecularbiologicalmethodsforbacillus[用于芽孢杆菌的分子生物学方法],约翰威利父子公司(johnwiley&sons),1990,特别是第3章;枯草芽孢杆菌的适合的复制质粒包括第92页列出的那些;perego,m.(1993)integrationalvectorsforgeneticmanipulationsinbacillussubtilis[在枯草芽孢杆菌中用于遗传操作的整合载体],第615-624页;a.l.sonenshein,j.a.hoch和r.losick(编辑),bacillussubtilisandothergram-positivebacteria:biochemistry,physiologyandmoleculargenetics[枯草芽孢杆菌和其他革兰氏阳性细菌:生物化学、生理学和分子遗传学],americansocietyformicrobiology[美国微生物学会],华盛顿特区)。为了在细胞中表达和产生一种或多种目的蛋白质(例如,蛋白酶),包含编码经修饰的蛋白酶的多核苷酸的至少一个拷贝(并且优选包含多个拷贝)的至少一种表达载体在适合于蛋白酶表达的条件下被转化到细胞中。在一些具体的实施例中,将编码蛋白酶(以及包含于载体中的其他序列)的这些序列整合到宿主细胞的基因组中,然而在其他实施例中,这些质粒在细胞内保持为自主的染色体外元件。因此,本发明提供了染色体外元件以及整合到宿主细胞基因组中的进入的序列。旨在说明在此描述的每种载体将可用于本发明。在一些实施例中,编码经修饰的蛋白酶的多核苷酸构建体存在于整合型载体(例如,pjh-gg36;图4)上,该载体使得经修饰的多核苷酸整合并任选地扩增到细菌染色体中。用于整合的位点的实例包括但不限于apre、amye、veg或pps区域。实际上,预期本领域中技术人员已知的其他位点将可用于本发明。在一些实施例中,编码经修饰的蛋白酶的多核苷酸的转录通过作为用于选择性前体蛋白酶的野生型启动子的启动子来完成。在一些其他实施例中,启动子与前体蛋白酶是异源的,但是在宿主细胞中发挥功能。具体地,用于细菌宿主细胞的合适的启动子的实施例包括但不限于amye、amyq、amyl、psts、sacb、pspac、papre、pveg、phpaii启动子,嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因的启动子、解淀粉芽孢杆菌(ban)淀粉酶基因的启动子、枯草芽孢杆菌碱性蛋白酶基因的启动子、克劳氏芽孢杆菌碱性蛋白酶基因的启动子、短小芽孢杆菌木糖苷酶基因的启动子、苏云金芽孢杆菌cryiiia的启动子、和地衣芽孢杆菌α-淀粉酶基因的启动子。另外的启动子包括但不限于a4启动子,以及噬菌体λpr或pl启动子,以及大肠杆菌lac、trp或tac启动子。在任何合适的革兰氏阳性微生物(包括细菌和真菌)的宿主细胞中产生前体和经修饰的蛋白酶。例如,在一些实施例中,经修饰的蛋白酶在真菌和/或细菌来源的宿主细胞中产生。在一些实施例中,这些宿主细胞是芽孢杆菌属细胞、链霉菌属细胞、埃希氏菌属细胞或曲霉属细胞。在一些实施例中,通过芽孢杆菌属物种宿主细胞产生经修饰的蛋白酶。可用于本发明的经修饰的蛋白质的产生的芽孢杆菌属宿主细胞的实例包括但不限于:地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌、克劳氏芽孢杆菌和巨大芽孢杆菌,以及芽孢杆菌属内的其他生物体。在一些实施例中,可使用枯草芽孢杆菌宿主细胞。美国专利5,264,366和4,760,025(re34,606)描述了可用于本发明的不同的芽孢杆菌属宿主菌株,尽管其他合适的菌株可用于本发明。可用于本发明的若干工业菌株包括非重组(即,野生型)芽孢杆菌属物种菌株,以及天然存在的菌株和/或重组菌株的变体。在一些实施例中,宿主菌株是重组菌株,其中编码目的多肽的多核苷酸已经被引入宿主中。在一些实施例中,宿主菌株是枯草芽孢杆菌宿主菌株,并且特别是重组枯草芽孢杆菌宿主菌株。许多枯草芽孢杆菌菌株是已知的,包括但不限于1a6(atcc39085)、168(1a01)、sb19、w23、ts85、b637、pb1753至pb1758、pb3360、jh642、1a243(atcc39,087)、atcc21332、atcc6051、mi113、de100(atcc39,094)、gx4931、pbt110、和pep211菌株(参见例如,hoch等人,genetics[遗传学],73:215-228,1973;美国专利号4,450,235;美国专利号4,302,544;和ep0134048;将这些参考文献中的每一个通过引用以其全文结合)。使用枯草芽孢杆菌作为表达宿主是本领域熟知的(参见例如,参见palva等人,gene[基因]19:81-87,1982;fahnestock和fischer,j.bacteriol.[细菌学杂志],165:796-804,1986;和wang等人,gene[基因]69:39-47,1988)。在一些实施例中,芽孢杆菌属宿主是包括以下基因中至少一个突变或缺失的芽孢杆菌属物种:degu、degs、degr和degq。优选地突变是在degu基因中,并且更优选地该突变是degu(hy)32。(参见,例如,msadek等人,j.bacteriol.[细菌学杂志],172:824-834,1990和olmos等人,mol.gen.genet.[分子和普通遗传学],253:562-567,1997)。优选地宿主菌株是携带degu32(hy)突变的枯草芽孢杆菌。在一些另外的实施例中,芽孢杆菌属宿主包含在以下基因中的突变或缺失:scoc4(参见例如,caldwell等人,j.bacteriol.[细菌学杂志],183:7329-7340,2001);spoiie(参见,arigoni等人,mol.microbiol.[分子微生物学],31:1407-1415,1999);和/或opp操纵子的oppa或其他基因(参见,perego等人,mol.microbiol.[分子微生物学],5:173-185,1991)。实际上,预期引起与oppa基因突变相同的表型的opp操纵子中的任何突变将可用于本发明的经改变的芽孢杆菌属菌株的一些实施例中。在一些实施例中,这些突变单独发生,而在其他实施例中,存在突变的组合。在一些实施例中,可以用于产生本发明的经修饰的蛋白酶的经改变的芽孢杆菌属是一种芽孢杆菌属宿主菌株,该芽孢杆菌属宿主菌株已经包括在一个或多个以上提及的基因中的突变。另外,可使用包含内源蛋白酶基因的一个或多个突变和/或缺失的芽孢杆菌属宿主细胞。在一些实施例中,芽孢杆菌属宿主细胞包含apre和npre基因的缺失。在其他实施例中,芽孢杆菌属物种宿主细胞包含5个蛋白酶基因的缺失(参见,美国公开号us2005/0202535),然而在其他实施例中,芽孢杆菌属物种宿主细胞包含9个蛋白酶基因的缺失(参见,美国公开号us2005/0202535)。使用本领域已知的任何合适的方法,用编码本发明经修饰的蛋白酶的经修饰的多核苷酸转化宿主细胞。无论经修饰的多核苷酸是否并入载体中或在质粒dna的不存在下使用,将其引入微生物,在一些实施例中,优选大肠杆菌细胞或感受态芽孢杆菌细胞。用于将dna导入涉及质粒构建体的芽孢杆菌属细胞中并将质粒转化到大肠杆菌中的方法是熟知的。在一些实施例中,随后将质粒从大肠杆菌中分离并且转化到芽孢杆菌属中。然而,没有必要使用介入微生物例如大肠杆菌,并且在一些实施例中,直接将dna构建体或载体引入芽孢杆菌属宿主中。本领域技术人员非常了解用于将多核苷酸序列引入芽孢杆菌属细胞的合适方法(参见例如,ferrari等人,“genetics[遗传学]”在harwood等人(编辑),bacillus[芽孢杆菌],plenumpublishingcorp.[普莱南出版公司],1989,第57-72页;saunders等人,j.bacteriol.[细菌学杂志],157:718-726,1984;hoch等人,j.bacteriol.[细菌学杂志],93:1925-1937,1967;mann等人,currentmicrobiol.[现代微生物学],13:131-135,1986;和holubova,foliamicrobiol.[微生物学大观],30:97,1985;chang等人,mol.gen.genet.[分子和普通遗传学],168:11-115,1979;vorobjeva等人,femsmicrobiol.lett.[fems微生物学快报],7:261-263,1980;smith等人,appl.env.microbiol.[应用与环境微生物学],51:634,1986;fisher等人,arch.microbiol.[微生物学文献集],139:213-217,1981和mcdonald,j.gen.microbiol.[普通微生物学杂志],130:203,1984)。实际上,包括原生质体转化和中板集合、转导、和原生质体融合在内的转化方法是已知的并且适合用于本发明。转化方法用于将本发明提供的dna构建体引入宿主细胞。本领域已知的用于转化芽孢杆菌属的方法包括例如质粒标记物拯救转化的方法,其涉及通过携带部分同源的驻留质粒的感受态细胞摄取供体质粒(contente等人,plasmid[质粒]2:555-571,1979;haima等人,mol.gen.genet.[分子和普通遗传学],223:185-191,1990;weinrauch等人,j.bacteriol.[细菌学杂志],154:1077-1087,1983;和weinrauch等人,j.bacteriol.[细菌学杂志],169:1205-1211,1987)。在该方法中,进入的供体质粒在模拟染色体转化的过程中与驻留的“辅助”质粒的同源区重组。除了通常使用的方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增或以其他方式处理dna构建体)。将dna构建体引入宿主细胞包括本领域已知的将dna插入宿主细胞而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸dna、脂质体等。在另外的实施例中,dna构建体与质粒一起共转化而不插入该质粒。在进一步的实施例中,通过本领域已知的方法从经改变的芽孢杆菌属菌株中缺失选择标记(参见,stahl等人,j.bacteriol.[细菌学杂志],158:411-418,1984和palmeros等人,gene[基因]247:255-264,2000)。在一些实施例中,将本发明的转化细胞在常规营养培养基中培养。合适的特定培养条件,例如温度、ph等是本领域技术人员已知的。另外,可以在以下科学文献中发现一些培养条件,例如hopwood(2000)practicalstreptomycesgenetics[实用链霉菌属遗传学],约翰英纳斯基金会(johninnesfoundation),诺维奇,英国;hardwood等人,(1990)molecularbiologicalmethodsforbacillus[用于芽孢杆菌属的分子生物学方法]约翰威利公司(johnwiley)并且来自美国典型培养物保藏中心(atcc)。在一些实施例中,用编码经修饰的蛋白酶的多核苷酸序列转化的宿主细胞在允许本发明的蛋白酶表达的条件下在合适的营养介质中培养,其后从培养物中回收所得的蛋白酶。用于培养细胞的介质包含适合于宿主细胞生长的任何常规介质,例如含有适当补充剂的基本介质或复杂介质。适合的介质可从商业供应商获得或可以根据公开的配方(例如,在美国典型培养物保藏中心(americantypeculturecollection)的目录中)来制备。在一些实施例中,通过常规程序从培养基中回收由细胞产生的蛋白酶,该常规程序包括但不限于通过离心或过滤从介质中分离宿主细胞、借助于盐(例如硫酸铵)沉淀上清液或滤液的蛋白质组分、层析法纯化(例如离子交换、凝胶过滤、亲和等)。因此,适用于回收本发明的一种或多种蛋白酶的任何方法可用于本发明。实际上,本发明不旨在限于任何具体的纯化方法。将由包含本发明经修饰的蛋白酶的重组宿主细胞产生的蛋白质分泌到培养基中。在一些实施例中,其他重组构建将异源或同源多核苷酸序列连接至编码促进可溶性蛋白质纯化的蛋白酶多肽结构域的核苷酸序列(kroll等人,dnacellbiol[dna细胞生物学]12:441-453,1993)。此类纯化促进结构域包括但不限于金属螯合肽,例如允许在固定化金属上纯化的组氨酸-色氨酸模块(porathj.,proteinexpr.purif.[蛋白表达与纯化]3:263-281,1992);允许在固定化免疫球蛋白上纯化的蛋白质a结构域;以及在flags延伸/亲和纯化系统中使用的结构域(英姆纳克斯公司(immunexcorp),华盛顿州西雅图)。在纯化结构域和异源蛋白之间包含可切割的接头序列例如因子xa或肠激酶(英杰公司(invitrogen),圣地亚哥,加利福尼亚州)还可用于促进纯化。如上所述,本发明提供了编码由芽孢杆菌属宿主细胞加工的经修饰的全长蛋白酶的经修饰的全长多核苷酸,从而在一种水平下产生成熟形式,该水平高于当由在相同条件下生长的芽孢杆菌属宿主细胞从未经修饰的全长酶加工时相同成熟蛋白酶的水平。产生水平由分泌酶的活性水平确定。生产的一种测量可以被确定为相对活性,该相对活性表示为当从经修饰的蛋白酶加工时的成熟形式的酶活性的值与当从未经修饰的前体蛋白酶加工时的成熟形式的酶活性的值的比率的百分比。相对活性等于或大于100%表示从经修饰的前体加工的蛋白酶的成熟形式以等于或高于当从未经修饰的前体加工时但产生相同成熟蛋白酶的水平产生。因此,在一些实施例中,当与从未经修饰的前体蛋白酶加工的蛋白酶的成熟形式的对应的产生相比,从经修饰的蛋白酶加工的成熟蛋白酶的相对活性是至少约100%、至少约110%、至少约120%、至少约130%、至少约140%、至少约150%、至少约160%、至少约170%、至少约180%、至少约190%、至少约200%、至少约225%、至少约250%、至少约275%、至少约300%、至少约325%、至少约350%、至少约375%、至少约400%、至少约425%、至少约450%、至少约475%、至少约500%、至少约525%、至少约550%、至少约575%、至少约600%、至少约625%、至少约650%、至少约675%、至少约700%、至少约725%、至少约750%、至少约800%、至少约825%、至少约850%、至少约875%、至少约850%、至少约875%、至少约900%、以及高达至少约1000%或更高。可替代地,将相对活性表示为产生比率,该产生比率通过将由经修饰的前体加工的蛋白酶的活性值除以当从未经修饰的前体加工时的相同蛋白酶的活性值来确定。因此,在一些实施例中,从经修饰的前体加工的成熟蛋白酶产生的比率是至少约1、至少约1.1、至少约1.2、至少约1.3、至少约1.4、至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2、至少约2.25、至少约2.5、至少约2.75、至少约3、至少约3.25、至少约3.5、至少约3.75、至少约、至少约4.25、至少约4.5、至少约4.75、至少约5、至少约5.25、至少约5.5、至少约5.75、至少约6、至少约6.25、至少约6.5、至少约6.75、至少约7、至少约7.25、至少约7.5、至少约8、至少约8.25、至少约8.5、至少约8.75、至少约9、以及高达至少约10。本领域普通技术人员已知有用于检测和测量蛋白酶活性的各种测定。具体而言,基于从酪蛋白或血红蛋白释放酸溶性肽的测定可用于测量蛋白酶活性,该释放以280nm的吸光度或使用folin方法经比色法进行测量(参见例如,bergmeyer等人,“methodsofenzymaticanalysis[酶分析方法]”第5卷,peptidases,proteinasesandtheirinhibitors[肽酶,蛋白酶及其抑制剂],化学出版社,魏因海姆,1984)。一些其他测定涉及显色底物的溶解(参见例如,ward,“proteinases[蛋白酶]”,在fogarty(编辑),microbialenzymesandbiotechnology[微生物酶与生物技术],应用科学出版社,伦敦,1983,第251-317页)。其他示例性测定包括但不限于琥珀酰-ala-ala-pro-phe-对硝基苯胺测定(saapfpna)和2,4,6-三硝基苯磺酸钠盐测定(tnbs测定)。本领域技术人员已知的许多另外的参考文献提供了合适的方法(参见例如,wells等人,nucleicacidsres.[核酸研究]11:7911-7925,1983;christianson等人,anal.biochem.[生物化学年鉴],223:119-129,1994以及hsia等人,analbiochem.[生物化学年鉴],242:221-227,1999)。本发明不旨在限于一种或多种任何具体的测定方法。用于确定宿主细胞中成熟蛋白酶产生水平的其他手段包括但不限于使用针对蛋白质具有特异性的多克隆或单克隆抗体的方法。实例包括但不限于酶联免疫吸附测定(elisa)、放射免疫测定(ria)、荧光免疫测定(fia)和荧光激活细胞分选(facs)。这些和其他测定是本领域熟知的(参见例如,maddox等人,j.exp.med.[实验医学杂志],158:1211,1983)。用于产生成熟蛋白酶的方法在另一方面,本发明提供了用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法,所述方法包括:a)提供本发明的表达载体;b)用所述表达载体转化芽孢杆菌属物种宿主细胞;和c)在适当的条件下培养所述宿主细胞这样使得通过所述宿主细胞产生所述成熟蛋白酶。在一方面,本发明提供了用于在芽孢杆菌属物种宿主细胞中产生成熟蛋白酶的方法,所述方法包括:a)提供本发明的宿主细胞;b)在适当的条件下培养所述宿主细胞这样使得通过所述宿主细胞产生所述成熟蛋白酶。在该方法的一些实施例中,所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在该方法的一些实施例中,所述成熟蛋白酶是野生型吉氏芽孢杆菌进化枝丝氨酸蛋白酶、其变体或同系物。在该方法的一些实施例中,所述成熟蛋白酶以比由包含表达载体或修饰染色体的宿主细胞更高的水平表达,该表达载体或修饰染色体包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码由第三多核苷酸区域编码的吉氏芽孢杆菌进化枝蛋白酶的野生型前肽区域的第二多核苷酸区域。在该方法的一些实施例中,所述第二多核苷酸区域编码来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,并且其中所述成熟的蛋白酶以比由包含表达载体或经修饰的染色体的宿主细胞更高的水平表达,该表达载体或经修饰的染色体包含相同的第一多核苷酸区域和第三多核苷酸区域,但包含编码来自迟缓芽孢杆菌或其相关物种的相同枯草杆菌蛋白酶的野生型前肽区域的第二多核苷酸区域。在该方法的一些实施例中,产生的成熟蛋白酶以两个谷氨酰胺开始。在一些实施例中,产生的成熟蛋白酶与seqidno:11或12具有至少90%、95%、96%、97%、98%,或99%同一性。在一些实施例中,产生的成熟蛋白酶包含seqidno:11或12的序列。多肽在另一方面,本发明提供了由本发明的多核苷酸编码的多肽,或包含如在此描述的经修饰的蛋白酶的多肽。在一些实施例中,该多肽包含经修饰的蛋白酶,所述该蛋白酶包含有效地连接至吉氏芽孢杆菌进化枝蛋白酶的成熟区域的异源芽孢杆菌蛋白酶的前肽区域,其中所述前肽区域包含与seqidno:8具有至少40%同一性的氨基酸序列。在一些实施例中,该多肽包含经修饰的蛋白酶,所述经修饰的蛋白酶包含有效地连接至吉氏芽孢杆菌进化枝蛋白酶成熟区域的异源芽孢杆菌蛋白酶的前肽区域,其中所述异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌或其相关物种。在一些实施例中,将该前肽区域连接至成熟区域的氨基末端。在一些实施例中,所述异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌或其相关物种。在一些实施例中,所述异源芽孢杆菌蛋白酶来自选自由以下组成的组的芽孢杆菌属物种:迟缓芽孢杆菌、克劳氏芽孢杆菌、嗜碱芽孢杆菌、列城芽孢杆菌、和诺瓦利斯芽孢杆菌。在一些实施例中,所述异源芽孢杆菌蛋白酶来自迟缓芽孢杆菌。在一些实施例中,所述异源芽孢杆菌蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在一些实施例中,所述前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的野生型前肽区域。在一些实施例中,所述前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域。在一些实施例中,所述异源芽孢杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、bpan01744、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970、bps02003、bohn00569、bspak01305、bpan04382、和bspal03279。在一些实施例中,所述异源芽孢杆菌蛋白酶选自由以下组成的组:bspq01211、bps02592、迟缓芽孢杆菌_p29600、bspal03240、克劳氏芽孢杆菌_p41362、列城芽孢杆菌_afk08970和bpan01744。在一些实施例中,所述异源芽孢杆菌蛋白酶是迟缓芽孢杆菌_p29600。在一些实施例中,所述前肽区域包含与seqidno:8具有至少50%同一性的氨基酸序列。在一些实施例中,所述前肽区域包含与seqidno:8具有至少75%同一性的氨基酸序列。在一些实施例中,所述前肽区域包含与seqidno:8具有至少90%同一性的氨基酸序列。在一些实施例中,所述前肽区域包含seqidno:8的序列。在一些实施例中,所述前肽区域是来自迟缓芽孢杆菌或其相关物种的枯草杆菌蛋白酶的变体前肽区域,其中该变体前肽区域包含对应于seqidno:8的位置6、30、或32的位置处的至少一个氨基酸取代。在一些实施例中,所述至少一种氨基酸取代是在对应于seqidno:8的位置6的位置处,并且选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、和e6v。在一些实施例中,所述至少一种氨基酸取代是在对应于seqidno:8的位置30的位置处,并且选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、和e30v。在一些实施例中,所述至少一种氨基酸取代是在对应于seqidno:8的位置32的位置处,并且选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v。在一些实施例中,所述前肽区域包含seqidno:8中所示的序列,条件是所述前肽区域包含选自seqidno:8的位置6、30和32的位置处的至少一个氨基酸取代。在一些实施例中,所述前肽区域包含seqidno:8的位置6处的氨基酸取代,该氨基酸取代选自由以下组成的组:e6a、e6c、e6r、e6n、e6q、e6g、e6h、e6i、e6l、e6k、e6m、e6f、e6p、e6s、e6t、e6w、e6y、和e6v。在一些实施例中,所述前肽区域包含seqidno:8的位置30处的氨基酸取代,该氨基酸取代选自由以下组成的组:e30a、e30r、e30n、e30d、e30c、e30q、e30g、e30h、e30l、e30k、e30m、e30s、e30t、e30w、e30y、和e30v。在一些实施例中,所述前肽区域包含seqidno:8的位置32处的氨基酸取代,该氨基酸取代选自由以下组成的组:a32r、a32n、a32c、a32q、a32g、a32h、a32i、a32l、a32k、a32m、a32f、a32p、a32s、a32t、a32w、a32y、和a32v。在一些实施例中,该多肽包含经修饰的蛋白酶,所述经修饰的蛋白酶包含有效地连接至第二吉氏芽孢杆菌进化枝蛋白酶成熟区域的第一吉氏芽孢杆菌进化枝蛋白酶的变体前肽区域。在一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶或所述第二吉氏芽孢杆菌进化枝蛋白酶是丝氨酸蛋白酶或枯草杆菌蛋白酶。在一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自相同的芽孢杆菌属物种。在一些实施例中,所述第一吉氏芽孢杆菌进化枝蛋白酶和所述第二吉氏芽孢杆菌进化枝蛋白酶来自不同的芽孢杆菌属物种。在一些实施例中,所述变体前肽区域包含与seqidno:7具有至少60%同一性的氨基酸序列。在一些实施例中,所述变体前肽区域包含与seqidno:7具有至少90%同一性的氨基酸序列。在一些实施例中,所述变体前肽区域包含seqidno:7中所示的前肽区域,条件是所述前肽区域包含seqidno:7的位置34处的氨基酸取代。在一些实施例中,所述氨基酸取代通过芽孢杆菌属物种宿主细胞增强第二吉氏芽孢杆菌进化枝蛋白酶的所述成熟区域的产生。在一些实施例中,所述芽孢杆菌属物种宿主细胞是枯草芽孢杆菌宿主细胞。在一些实施例中,在seqidno:7的位置34处的所述氨基酸取代选自由以下组成的组:e34d、e34c、e34g、e34h、e34s和e34v。在一些实施例中,所述异源或变体前肽区域包含seqidno:44中所示的氨基酸序列。在一些实施例中,所述异源或变体前肽区域包含seqidno:69中所示的氨基酸序列。在多肽的一些实施例中,在此描述了经修饰的蛋白酶的成熟区域。在一些实施例中,该多肽进一步包含如在此所描述的信号肽。在一些实施例中,该信号肽适用于在芽孢杆菌属物种中分泌蛋白质。在一些实施例中,该信号肽适用于在枯草芽孢杆菌中分泌蛋白质。在此提及的所有公开物以及专利都通过引用结合在此。在不背离本发明的范围和精神的情况下,本发明的所描述的方法和系统的各种修改和变化对本领域的技术人员将是显而易见的。虽然已结合特定实施例描述了本发明,但应当理解,要求保护的本发明不应不适当地限于这类特定实施例。际上,对于本领域和/或相关领域的技术人员显而易见的、用于执行本发明的所描述的实施例的各种修改旨在落入本发明的范围内。实验在下面的实验公开中,应用以下缩写:ppm(百万分率);m(摩尔);mm(毫摩尔);μm(微摩尔);nm(纳摩尔);mol(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);gm(克);mg(毫克);μg(微克);pg(皮克);l(升);ml和ml(毫升);μl和μl(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);u(单位);v(伏特);mw(分子量);sec(秒);min(s)(分钟);h和hr(小时(hour/hours));℃(摄氏度);qs(足量);qc(快速更换),nd(未做);na(不适用);rpm(每分钟转数);w/v(重量体积比);v/v(体积体积比);g(重力);od(光密度);aa(氨基酸);bp(碱基对);kb(千碱基对);kd(千道尔顿);suc-aapf-pna(琥珀酰-l-丙氨酰-l-丙氨酰-l-脯氨酰-l-苯基-丙氨酰-对硝基苯胺);dmso(二甲亚砜);cdna(拷贝dna或互补dna);dna(脱氧核糖核酸);ssdna(单链dna);dsdna(双链dna);dntp(脱氧核糖核苷三磷酸);dtt(1,4-二硫-dl-苏糖醇);h2o(水);dh2o(去离子水);hcl(盐酸);mgcl2(氯化镁);mops(3-[n-吗啉代]丙磺酸);nacl(氯化钠);page(聚丙烯酰胺凝胶电泳);pbs(磷酸盐缓冲盐水[150mmnacl,10mm磷酸钠缓冲液,ph7.2]);peg(聚乙二醇);pcr(聚合酶链式反应);pmsf(苯甲基磺酰氟);rna(核糖核酸);sds(十二烷基硫酸钠);tris(三(羟甲基)氨基甲烷);soc(2%细菌用胰蛋白胨、0.5%细菌用酵母提取物、10mmnacl、2.5mmkcl);terrificbroth(tb;12g/l细菌用胰蛋白胨、24g/l甘油、2.31g/lkh2po4和12.54g/lk2hpo4);od280(在280nm下的光密度);od600(在600nm下的光密度);a405(在405nm下的吸光度);vmax(酶催化反应的最大初速度);hepes(n-[2-羟乙基]哌嗪-n-[2-乙磺酸]);tris-hcl(三[羟甲基]氨基甲烷-盐酸盐);tca(三氯乙酸);hplc(高压液相色谱);rp-hplc(反相高压液相色谱);tlc(薄层色谱);edta(乙二胺四乙酸);etoh(乙醇);sds(十二烷基硫酸钠);tris(三(羟甲基)氨基甲烷);taed(n,n,n’n’-四乙酰乙二胺)。提供以下实例以便证实和进一步说明本发明的某些实施例和方面,而不应被解释为限制其范围。实例1方法蛋白酶活性的aapf测定针对产生的作为蛋白酶表达的量度的活性枯草杆菌蛋白酶测定如下所述获得的枯草芽孢杆菌培养物。测定所产生的酶对合成底物琥珀酰-l-ala-l-ala-l-pro-l-phe-对硝基苯胺(aapf)的活性。该测定将活性蛋白酶的产生测量为随着时间的推移405nm处的吸光度的增加,这由水解和释放产生对硝基苯胺产生(estell等人,j.biol.chem.[分子生物学杂志],260:6518-6521,1985)。将枯草芽孢杆菌培养物上清液适当稀释于含有10mmtris+0.005%ph8.6的tris缓冲液中。通过将稀释的培养物上清液添加至25ulaapf底物(在以上所描述的tris缓冲液中1mg/mlaapf)来制备反应。动力学测定在96孔板读数器(spectramax,分子仪器公司(moleculardevices),森尼韦尔,加利福尼亚州,美国)上运行2分钟产生线性响应。用于分离蛋白酶样品的枯草芽孢杆菌的培养将携带对照质粒或编码经修饰的蛋白酶的质粒的菌落用于在微量滴定板(mtp)的孔中接种150ul含有5ppm氯霉素(cmp)的luria肉汤。然后将这些mtp在37℃孵育4小时同时在250rpm下旋转。在ph7.6下,将10ul的每种培养物转移至含有以下所描述的160ul的芽孢杆菌属培养基的新mtp中,并且在振荡培养箱中在31℃且在270rpm下使这些培养物生长68小时。芽孢杆菌属培养基是基于mops缓冲液的富集的半定义培养基,以尿素为主要氮源,以葡萄糖为主要碳源,并补充有1%大豆蛋白胨用于稳健的细胞生长。孵育期后,将mtp离心,并使用上述aapf测定针对蛋白酶活性测定每种培养物的上清液。实例2使用天然bgi02446前肽序列或来自迟缓芽孢杆菌枯草杆菌蛋白酶的异源前肽序列,表达吉氏芽孢杆菌bgi02446成熟枯草杆菌蛋白酶由geneart,生命技术公司(lifetechnologies)(卡尔斯巴德,加利福尼亚州)合成包含枯草芽孢杆菌apre启动子(seqidno:1)、枯草芽孢杆菌apre信号肽(seqidno:2)、bgi02446前序列(seqidno:3)、吉氏芽孢杆菌bgi02446成熟基因(seqidno:4)和迟缓芽孢杆菌终止子(seqidno:39)的dna盒。图2描绘了用bgi02446天然前肽序列用于bgi02446枯草杆菌蛋白酶表达所使用的基因盒。原序列预测是基于在同源丝氨酸蛋白酶,例如bpn’中的原成熟连接的知识(wells等人,nucleicacidsres[核酸研究],11:7911-7925,1983)和pb92蛋白酶(vanderlaan等人,applenvironmicrobiol[应用环境微生物学],57:901-909,1991)。先前已经报道了吉氏芽孢杆菌bgi02446(又称为aprbg)的表达(deng等人,“secretoryexpression,functionalcharacterization,andmoleculargeneticanalysisofnovelhalo-solvent-tolerantproteasefrombacillusgibsonii.[来自吉氏芽孢杆菌的新颖性耐卤素溶剂的蛋白酶的分泌表达、功能特征和分子遗传分析]”jmicrobiolbiotechnol.[微生物与生物技术杂志]24:197-208,2014),并且还通过美国丹尼斯克公司(daniscousinc.)在国际pct公开号wo2015/089447中进行了报道。bgi02446枯草杆菌蛋白酶由dsm8722菌株编码,并且又称为aprbg(deng等人,2014)。该枯草杆菌蛋白酶与由菌株dsm9728、dsm9729、dsm9730和dsm9731编码的同源酶一起都在枯草杆菌蛋白酶系统树的相同区域中均共享显著的序列同一性和聚簇。它们形成枯草杆菌蛋白酶的吉氏芽孢杆菌进化枝(pct公开号wo2015/089447)的基础。合成(geneart)包含枯草芽孢杆菌apre启动子(seqidno:1)、枯草芽孢杆菌apre信号肽(seqidno:2)、迟缓芽孢杆菌枯草杆菌蛋白酶前肽序列(seqidno:5)、bgi02446枯草杆菌蛋白酶成熟基因(seqidno:4)和迟缓芽孢杆菌终止子(seqidno:39)的dna盒。图3显示在此情况下用迟缓芽孢杆菌枯草杆菌蛋白酶前肽序列用于bgi02446枯草杆菌蛋白酶表达所使用的基因盒。使用标准分子生物学方案,通过限制性内切酶ecori和hindiii消化两种表达盒。还合成了来自金黄色葡萄球菌(seqidno:6)的氯霉素乙酰基转移酶(cat)基因表达盒(dna2.0,门洛帕克,加利福尼亚州)。该盒的图表显示在图4中。使用标准分子生物学方案,通过限制性内切酶ecori和hindiii消化该盒。遵循试剂盒的制造商说明书(产品目录号25640010,ge医疗集团(gehealthcare)),使用t4dna连接酶(纽英伦生物技术有限公司(newenglandbiolabs))将表达吉氏芽孢杆菌bgi02446枯草杆菌蛋白酶的两种基因盒与cat基因盒连接,然后进行滚环扩增(rca)反应。将滚环扩增反应用于转化200ul合适的枯草芽孢杆菌菌株的感受态细胞。将转化的细胞在37℃孵育一小时同时以250rpm振荡。在氯霉素选择下,将来自转化混合物的细胞置于含有1.6%脱脂奶的琼脂板上。在600nm下,选择单菌落在luria肉汤中生长至光密度为1.3。然后用20%甘油将每种菌株样品在-80℃冷冻。将由seqidno:2编码的来自枯草芽孢杆菌的apre信号肽的氨基酸序列seqidno:40中所示。实例3当使用天然吉氏芽孢杆菌bgi02446前肽序列或来自迟缓芽孢杆菌枯草杆菌蛋白酶的异源前肽序列时,吉氏芽孢杆菌bgi02446野生型成熟枯草杆菌蛋白酶的表达水平将从实例2中描述的构建体获得的枯草芽孢杆菌培养物用于测量对来自每种菌株的样品的相对枯草杆菌蛋白酶活性。使用对aapf-pna底物的蛋白酶活性来检测由本实例和后续实例中评估的各种构建体表达的枯草杆菌蛋白酶的相对量。将对天然吉氏芽孢杆菌bgi02446前肽与异源迟缓芽孢杆菌前肽的表达的影响比较的结果显示在表3中。当将来自不同枯草芽孢杆菌蛋白酶的前肽,此情况下为迟缓芽孢杆菌枯草杆菌蛋白酶,用于替换天然存在的序列时,吉氏芽孢杆菌bgi02446枯草杆菌蛋白酶的表达显著增强。如可以在以下实例13中的序列比对上可以看出,这两种前肽的氨基酸序列是显著不同的。表3迟缓芽孢杆菌枯草杆菌蛋白酶原区域对产生成熟蛋白酶bgi02446枯草杆菌蛋白酶的影响将由bgi02446前序列编码的多肽的氨基酸序列seqidno:7中所示,并且将由迟缓芽孢杆菌枯草杆菌蛋白酶前序列编码的多肽的氨基酸序列seqidno:8中所示。实例4使用天然bgi02446前肽序列或来自迟缓芽孢杆菌枯草杆菌蛋白酶的前肽序列,表达成熟枯草杆菌蛋白酶的吉氏芽孢杆菌变体bsp-00801使用在表4列出的引物通过扩增合成包含枯草芽孢杆菌apre启动子(seqidno:1)、枯草芽孢杆菌apre信号肽(seqidno:2)、来自吉氏芽孢杆菌bgi02446(seqidno:3)或来自迟缓芽孢杆菌(seqidno:5)的前序列、和对应于针对吉氏芽孢杆菌bgi02446的变体基因的序列(称为bsp-00801)(seqidno:9)的dna盒。使用本领域已知的技术,使用gibson组装(sgidna目录编号ga1100-10)对pcr片段进行装配以制成最终的表达盒。按照制造商的说明书(ge医疗集团目录编号25640010)进行滚环扩增反应。将滚环扩增反应用于转化200ul合适的枯草芽孢杆菌菌株的感受态细胞。将转化的细胞在37℃孵育一小时同时以250rpm振荡。在氯霉素选择下,将来自转化混合物的细胞置于含有1.6%脱脂奶的琼脂板上。在600nm下,选择单菌落在luria肉汤中生长至光密度为1.3。然后用20%甘油将每种菌株样品在-80℃冷冻。表4用于构建编码吉氏芽孢杆菌bgi02446前肽或迟缓芽孢杆菌前肽与吉氏芽孢杆菌变体bsp00801成熟基因融合的表达盒所使用的引物实例5当使用天然bgi02446前肽序列或来自迟缓芽孢杆菌枯草杆菌蛋白酶的异源前肽序列时,吉氏芽孢杆菌变体bsp-00801成熟枯草杆菌蛋白酶的表达水平将从实例4中描述的构建体获得的枯草芽孢杆菌培养物用于测量对来自每种菌株的样品的相对枯草杆菌蛋白酶活性。使用对aapf-pna底物的蛋白酶活性来检测由本实例和后续实例中评估的各种构建体表达的吉氏芽孢杆菌变体bsp-00801枯草杆菌蛋白酶的相对量。将天然吉氏芽孢杆菌bgi02446前肽与异源迟缓芽孢杆菌前肽的比较结果显示在表3中。我们观察到使用在具有bsp-00801成熟基因(seqidno:9)的表达盒中迟缓芽孢杆菌枯草杆菌蛋白酶前肽序列(seqidno:3)给出bsp-00801蛋白质的增强的生产率。当使用迟缓芽孢杆菌前肽表达吉氏芽孢杆菌变体bsp-00801时,观察到增强的表达在量级上与针对野生型bgi02446吉氏芽孢杆菌前肽序列观察到的相似(参见表5)。表5迟缓芽孢杆菌枯草杆菌蛋白酶原区域对产生成熟蛋白酶bsp-00801蛋白质枯草杆菌蛋白酶的影响实例6成熟蛋白酶序列的确认用三氯乙酸处理样品以沉淀蛋白质。将蛋白质球粒溶解于8m尿素中并用二硫苏糖醇还原,用碘乙酰胺烷基化,并使用胰蛋白酶、α-胰凝乳蛋白酶和胞内蛋白酶gluc的混合物进行消化。使用高分辨率lc/ms/ms分析这些样品。将样品进行rp-hplc(在acquityhplc上的phenomenexaerispeptidexb-c18柱,沃特世(waters))并且经受具有0.1%甲酸的2%-85%乙腈梯度。将该系统连续地连接至高分辨率的串联质谱仪(orbitrapxl,thermo)。在蛋白质组学数据库检索软件(proteomediscoverer1.4)上鉴定多肽。使用天然bgi02446前肽从表达系统中分离的bgi02446成熟蛋白质的氨基酸序列seqidno:10中所示。在n-末端具有一个谷氨酰胺(q)的第268个氨基酸多肽与先前观察到的bgi02446成熟蛋白质一致(由deng等人,2014以及由美国丹尼斯克公司报道为在pct公开号wo2015/089447中seqidno:7)。基于在同源丝氨酸蛋白酶,例如bpn’(wells等人,nucleicacidsres[核酸研究],11:7911-7925,1983)和pb92蛋白酶(vanderlaan等人,applenvironmicrobiol[应用环境微生物学],57:901-909,1991)中原成熟连接的知识的前序列预测已经预测到在n-末端具有两个谷氨酰胺(qq)的269氨基酸成熟bgi02446蛋白质,但相反仅观察到一个谷氨酰胺(q)。使用异源迟缓芽孢杆菌前肽从表达系统中分离的bgi02446成熟蛋白质的269氨基酸序列seqidno:11中所示。有趣的是发现当使用异源迟缓芽孢杆菌前肽获得的成熟bgi02446枯草杆菌蛋白酶的这个序列不同于当使用天然/同源bgi02446前肽时获得的序列。在异源表达盒的情况下,269氨基酸bgi02446枯草杆菌蛋白酶具有预测的n-末端,并且没有被进一步加工。通过如上所描述的lc/ms还分析了吉氏芽孢杆菌变体bsp-00801枯草杆菌蛋白酶的样品。类似于bgi02446成熟蛋白质,取决于在表达盒中使用哪种前肽,bsp-00801枯草杆菌蛋白酶变体也具有不同的n-末端。如同bgi02446,当使用异源迟缓芽孢杆菌前肽(seqidno:12)表达时,bsp-00801枯草杆菌蛋白酶变体显示出在n-末端的两个谷氨酰胺(qq),当使用亲本bgi02446前肽(seqidno:13)表达时显示出在n-末端的一个谷氨酰胺(q)。实例7构建用于表达bgi02446枯草杆菌蛋白酶的迟缓芽孢杆菌前肽位点评估文库产生在迟缓芽孢杆菌枯草杆菌蛋白酶前肽的若干氨基酸位置处的位点评估文库(sel)以便评估对表达bgi02446枯草杆菌蛋白酶的影响。使用标准分子生物学方案产生这些sel。构建含有dna盒的模板质粒并将其称为pkb723-bgi02446(图5),该dna盒包含枯草芽孢杆菌apre启动子(seqidno:1)、枯草芽孢杆菌apre信号肽(seqidno:5)和bgi02446成熟基因(seqidno:4)。将在位点饱和文库中每个氨基酸位点的正向和反向nns寡聚体(在表6中列出)和外部引物(在表7中列出)用于杂交表达盒的起始或末端,该表达盒从eurofinsgenomics(亨茨维尔,阿拉巴马,美国)获得。使用pfuultraii聚合酶(安捷伦科技公司(agilenttechnologiesinc.))进行具有合适的引物对和模板质粒的聚合酶链式反应使用40ul的h2o、5ul的pfuultraii10x缓冲液、1uldntp混合物(罗氏公司(roche))、1ul的每种引物(5um浓度)和1ul的dna模板进行pcr。使用以下条件在热循环仪中进行孵育:95℃持续2分钟,一次;随后30个循环,95℃持续20秒、55℃持续20秒,以及72℃持续30秒;然后1个循环,72℃持续3分钟。在由1.5ul的每种pcr反应物+8ul2xmastermix+5ulh2o组成的反应中,使用gibson组装(sgidna目录编号ga1100-10)对pcr片段进行装配,在热循环仪中在50℃孵育80分钟,然后在65℃下孵育10分钟并且冷却至4℃。用装配的dna转化合适的枯草芽孢杆菌感受态细胞。将转化的细胞在37℃孵育1小时同时以250rpm振荡。在氯霉素选择下,将来自转化混合物的细胞置于含有1.6%脱脂奶的琼脂板上。在600nm下,选择单菌落在luria肉汤中生长至光密度为1.3。然后用20%甘油将每种菌株样品在-80℃冷冻。通过dna序列分析确认每种变体。为了产生用于分析的bgi02446枯草杆菌蛋白酶蛋白酶样品,在每个孔的培养介质(基于mops缓冲液的富集的半定义介质,以尿素为主要氮源,以葡萄糖为主要碳源,并补充有1%大豆蛋白胨用于稳健的细胞生长)中的96孔mtp中在31℃使变体的选择性生长68小时。在孵育结束时,使用下文描述的aapf测定针对蛋白酶活性测定每种培养物。表6使迟缓芽孢杆菌枯草杆菌蛋白酶前肽序列的位点6、30和32突变的nns引物序列表7与nns引物结合所使用的外部引物序列实例8在迟缓芽孢杆菌前肽的位置6、30和32处的突变对表达bgi02446野生型枯草杆菌蛋白酶的影响如上述实例1中描述的针对aapf活性测定来自迟缓芽孢杆菌前肽sel和bgi02446成熟枯草杆菌蛋白酶表达的培养物上清液的等分试样。使用野生型迟缓芽孢杆菌前肽作为参考,针对每种表达质粒计算活性(成熟)bgi02446枯草杆菌蛋白酶的相对表达。所突变的位置对应于迟缓芽孢杆菌前肽线性序列(seqidno:8)的6、30和32。表8列出了迟缓芽孢杆菌前肽位置6处的变体的结果,这些结果显示出相比野生型序列的表达增加;表9列出了迟缓芽孢杆菌前肽位置30处的变体的结果,这些结果显示出相比野生型序列的表达增加;并且表10列出了迟缓芽孢杆菌前肽位置32处的变体的结果,这些结果显示出相比野生型序列的表达增加。表8在迟缓芽孢杆菌枯草杆菌蛋白酶前肽区域位置6处的氨基酸取代对产生bgi02446成熟蛋白酶的影响表9在迟缓芽孢杆菌枯草杆菌蛋白酶原区域的位置30处的氨基酸取代对产生bgi02446成熟蛋白酶的影响表10在迟缓芽孢杆菌枯草杆菌蛋白酶原区域的位置32处的氨基酸取代对产生bgi02446成熟蛋白酶的影响实例9构建用于表达吉氏芽孢杆菌bsp-00801变体枯草杆菌蛋白酶的迟缓芽孢杆菌前肽位点评估文库使用在表11中列出的引物和标准pcr以及组装pcr技术(例如sambrook等人,molecularcloning[分子克隆]:冷泉港实验室出版社(coldspringharborlaboratorypress))在吉氏芽孢杆菌bsp-00801变体表达构建体(参见图5)的迟缓芽孢杆菌前肽线性序列(seqidno:8)的氨基酸位置6、30或32处引入突变。使所得pcr片段通过连接并转化到合适的枯草芽孢杆菌菌株中进行环化。随后通过dna测序鉴定个体突变。使携带不同迟缓芽孢杆菌前肽突变(取代)的菌株在具有递增浓度的氯霉素的液体培养基中生长,以便染色体上强制扩增表达构建体。遵循扩增程序,在31℃在含有5mmcacl2和5ug/ml氯霉素的芽孢杆菌属培养基(实例1中描述的)中使菌株生长68小时。收获培养物上清液并使用在实例1中描述的aapf活性测定来确定bsp-00801蛋白酶的量。表11在构建迟缓芽孢杆菌前肽-bsp-00801成熟表达盒中使用的引物seqidno:14(下文列出)包含表达盒的核苷酸序列,该表达盒包括迟缓芽孢杆菌前肽和bsp-00801枯草杆菌蛋白酶变体可读框(orf)。apre信号序列以下划线表示,迟缓芽孢杆菌前肽序列以斜体表示,并成熟bsp-00801枯草杆菌蛋白酶的核苷酸序列以大写表示。实例10在迟缓芽孢杆菌前肽的氨基酸位置6、30和32处的突变对表达bsp-00801变体枯草杆菌蛋白酶的影响如实例1中描述的针对aapf活性测定来自迟缓芽孢杆菌前肽sel和吉氏芽孢杆菌变体bsp-00801成熟枯草杆菌蛋白酶表达的培养物上清液的等分试样。使用野生型迟缓芽孢杆菌前肽作为参考,针对每种表达质粒计算活性(成熟)bsp-00801枯草杆菌蛋白酶的相对表达。所突变的(取代的)位置对应于迟缓芽孢杆菌前肽线性序列(seqidno:8)的位置6、30和32。表12列出了迟缓芽孢杆菌前肽位置6处的变体的结果,这些结果显示出相比野生型序列的表达增加;表13列出了迟缓芽孢杆菌前肽位置30处的变体的结果,这些结果显示出相比野生型序列的表达增加;并且表14列出了迟缓芽孢杆菌前肽位置32处的变体的结果,这些结果显示出相比野生型序列的表达增加。表12bsp-00801成熟枯草杆菌蛋白酶针对迟缓芽孢杆菌前肽的位置6处的变体的表达水平比较表13bsp-00801成熟枯草杆菌蛋白酶针对迟缓芽孢杆菌前肽的位置30处的变体的表达水平比较表14bsp-00801成熟枯草杆菌蛋白酶针对迟缓芽孢杆菌前肽的位置32处的变体的表达水平比较实例11用于表达bgi02446成熟枯草杆菌蛋白酶的在bgi02446前序列的位置34处的位点饱和诱变根据制造商的指导,使用定点诱变试剂盒(qc;stratagene)进行氨基酸位置位点34处的bgi02446前肽(seqidno:7)的位点饱和诱变。将包含枯草芽孢杆菌apre启动子(seqidno:1)、枯草芽孢杆菌apre信号肽(seqidno:2)、吉氏芽孢杆菌bgi02446前序列(seqidno:3)和吉氏芽孢杆菌bgi02446成熟基因(seqidno:4)的dna盒克隆进pjh101载体的ecori和hindiii限制性位点(ferrari等人,j.bacteriol.[细菌学杂志]154:1513-1515,1983)以产生pjh-bgi02446质粒(图7)。互补重叠引物被设计用于用侧接nns密码子的约18个碱基使位点34发生突变,并从eurofinsgenomics(亨茨维尔,阿拉巴马,美国)订购。表15给出了用于使位置34处的氨基酸发生突变的正向和反向引物的多核苷酸序列。表15使bgi02446前序列的位点34发生突变所使用的nns引物序列将pjh-bgi02446dna用作如下quikchange(qc)诱变反应中的模板。将俩微升的pjh-p9小量制备dna(50ng)添加至39μl的无菌蒸馏的h2o、1μl的pfuultraii、5ul10xpfu缓冲液、1μldntp(罗氏公司)、5μl的正向引物(5um),和5μl反向引物(5um),总共50μl。在以下循环条件下进行dna扩增反应(pcr):95℃持续1分钟,一次;随后19-20个循环,95℃持续1分钟,55℃持续1分钟和68℃持续12分钟。通过电泳使用1.2%e-凝胶(英杰公司(invitrogen))对五微升的pcr反应进行分析。随后,使用1μldpni在37℃,将突变的扩增dna消化两次,持续2小时。在相似的条件下,但在引物缺失情况下,产生阴性对照。使用制造商的方案,将一微升的每种dpni消化的反应产物用于转化五十微升的单次大肠杆菌top10化学感受态细胞(英杰公司)。在37℃搅拌的情况下,使转化的细胞在luria肉汤(lb)中生长1小时,然后在含有50ppm羧苄青霉素的卢里亚(luria)琼脂(la)板上划线,并允许在37℃生长过夜。孵育过夜后,挑选单个菌落,用于接种150μl的含有50ppm羧苄青霉素的lb,并在96孔mtp中在37℃生长过夜。进行dna序列分析以确认dna突变。将携带突变前序列的大肠杆菌细胞培养物的等分试样用于接种5ml的lb+50ppm羧苄青霉素。使用qiagen试剂盒(凯杰公司(qiagen))制备质粒dna,并且将每种质粒dna的一部分用于转化枯草芽孢杆菌宿主细胞。将十微升的质粒dna(pjh-bgi02446)用于转化100ul合适的枯草芽孢杆菌感受态细胞。含有包含野生型bgi02446前序列(seqidno:3)的构建体的pjh-bgi02446对照质粒也被转化为枯草芽孢杆菌细胞的相同合适的菌株。将转化的细胞在37℃孵育1小时同时以250rpm振荡。在氯霉素选择下,将来自转化混合物的细胞置于含有1.6%脱脂奶的琼脂板上。选择单菌落在具有氯霉素的luria肉汤中生长。对于蛋白酶样品产生,使培养物在芽孢杆菌属细胞培养基(基于mops缓冲液的富集的半定义介质,以尿素为主要氮源,以葡萄糖为主要碳源,并补充有1%大豆蛋白胨用于稳健的细胞生长)上生长。使用在以上实例1描述的aapf测定,针对蛋白酶活性测定澄清的培养物上清液。实例12吉氏芽孢杆菌前肽的位置34处的突变对表达吉氏芽孢杆菌bsp-00801变体枯草杆菌蛋白酶的影响如实例1中描述的针对aapf活性测定来自吉氏芽孢杆菌bgi02246前肽sel和吉氏芽孢杆菌变体bsp-00801成熟枯草杆菌蛋白酶表达的培养物上清液的等分试样。使用野生型吉氏芽孢杆菌前肽作为参考,针对每种表达质粒计算活性(成熟)bsp-00801枯草杆菌蛋白酶的相对表达。表16列出了针对吉氏芽孢杆菌bgi02246前肽(seqidno:7)的位置34处的变体的结果,该结构显示出相比野生型序列的表达增加。表16吉氏芽孢杆菌bgi02446枯草杆菌蛋白酶原区域的位置34处的氨基酸取代对产生吉氏芽孢杆菌bsp-00801变体枯草杆菌蛋白酶的影响实例13枯草芽孢杆菌蛋白酶前肽区域之间的序列比较将在该研究中所评估的迟缓芽孢杆菌和吉氏芽孢杆菌的枯草杆菌蛋白酶前肽序列进行比较。图8显示了吉氏芽孢杆菌bgi02446前肽加bgi02446(seqidno:59,该序列包含seqidno:7的84个残基)的成熟区域n末端的四个氨基酸与迟缓芽孢杆菌p29600前肽加p29600(seqidno:60,该序列包含seqidno:8的87个残基)的成熟区域的n末端的四个氨基酸的氨基酸序列的clustalw比对。这2个前肽区域在原区域的氨基酸水平上共享小于40%的序列同一性,其中在中央区域以及发生加工的连接处具有显著差异(图8)。如在图9中呈现的,编码吉氏芽孢杆菌(seqidno:3)和迟缓芽孢杆菌(seqidno:5)枯草杆菌蛋白酶的前肽区域的核酸序列的序列比对表明同一性百分比是53.7%。如图10所示,对来自包括迟缓芽孢杆菌和吉氏芽孢杆菌二者的芽孢杆菌属成员的枯草杆菌蛋白酶前肽序列的更大集合进行分析。在这组前肽多肽中观察到了显著的多样性,这些前肽多肽对应于其中成熟区域的同一性百分比大于75%的枯草杆菌蛋白酶。但如在下文所列的表17中可以看出,枯草杆菌蛋白酶前肽区域共享在35%和100%之间的序列同一性。在图10中将来自一些或多或少与迟缓芽孢杆菌有关的代表种的前肽序列进行比对(包括seqidno:7、8、42、43、48、49、50、51、54、和56)。这些序列中的一些首先报道于在美国丹尼斯克公司(daniscousinc.)公开的pct申请(pct公开号pct公开号wo2015/089447)和美国临时申请序列号62/069,188和62/069,184(二者均于2014年10月27日提交)中。使用图10中的序列比对和其他方法,针对异源或变体前肽序列产生基序序列,可以将这些异源或变体前肽序列用于表达在图11中显示的吉氏芽孢杆菌进化枝丝氨酸蛋白酶的成熟序列,其中将该基序序列seqidno:44中所示。在图11中“x”的定义如下:每个“x”可以是任何氨基酸,在位置1、22-51、和91处的“x”可以单独地或共同地缺失,并且需要从位置22至51存在至少约23个氨基酸。在某些位置处,斜线(/)表示列出的氨基酸两者之一的存在。表17在图10中比对的每个前肽区域之间的序列同一性百分比当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1