杆菌中增强的蛋白质生产的制作方法

文档序号:571283阅读:772来源:国知局
专利名称:杆菌中增强的蛋白质生产的制作方法
技术领域
本发明涉及已经被遗传改造而具有改变的表达和/或生产目的蛋白质能力的细 胞。具体来讲,本发明涉及革兰氏阳性微生物的修饰的宿主细胞,例如能够过表达ymaH的 杆菌物种。本发明涵盖了包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体,以 及包含这些构建体和表达载体的经修饰的宿主细胞。特别是,本发明涉及用于在杆菌物种 中增强目的蛋白(例如蛋白酶)的表达和生产的过表达ymaH的组合物和方法。
背景技术
遗传工程已经使得用作工业上生物反应器、细胞工厂和用于食品发酵的微生物的 可以得到改进。特别地,杆菌物种生产和分泌大量有用的蛋白质和代谢产物(Zukowski, "Production of commercially valuableproducts,,,出自Doi 和McGlouglin(编著) BioloRY of Bacilli :Applicationsto Industry,Butterworth-Heinemann, Stoneham. Mass PP 311-337[1992])。工业中最常用的杆菌物种是地衣芽孢杆菌(B-Iicheniformis)、解淀 粉芽孢杆菌(B. amyloliquefaciens)和枯草芽孢杆菌(B. subtilis)。因为它们的GRAS (公 认为是安全的)身份,这些杆菌物种的菌株是生产用于食品和药品工业的蛋白质的天然候 选株。重要的产物酶包括α-淀粉酶、中性蛋白酶和碱性(或丝氨酸)蛋白酶。然而,尽管 对在杆菌宿主细胞中蛋白质的生产的理解有了进步,仍然需要改进微生物表达和生产这些 蛋白质的方法。

发明内容
本发明涉及已经过遗传改造以具有改变的表达和/或生产目的蛋白质能力的细 胞。具体来讲,本发明涉及革兰氏阳性微生物的修饰的宿主细胞,例如能够过表达ymaH的 杆菌物种。本发明涵盖包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体,以及 包含这种构建体和表达载体的经修饰的宿主细胞。具体来说,本发明涉及用于在杆菌物种 中增强目的蛋白(例如蛋白酶)的表达和生产的过表达ymaH的组合物和方法。在一个实施方式中,本发明提供了分离的嵌合多核苷酸,其包含限定了有效连接 了编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列。在另一个实施方式中,本发明提供了分离的嵌合多核苷酸,其包含限定了有效连 接编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列,其中所述嵌合多核苷酸包 含 SEQ ID NO 2 或 SEQ ID NO :3。在另一个实施方式中,本发明提供了包含多核苷酸构建体的载体,该构建体包含 有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸。在另一个实施方式中,本发明提供了包含多核苷酸构建体的载体,该构建体包含 有效连接到sigA和/或sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸,其中所 述多核苷酸构建体包含SEQ ID N0:l、2、3或13。在另一个实施方式中,本发明提供了一种改良的杆菌细胞,该细胞包含含有一种多核苷酸构建体的载体,该构建体包含有效连接到SigA和/或SigH启动子多核苷酸序列 的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产目的蛋白质。在另一个实施方式中,本发明提供了改良的芽孢杆菌属宿主细胞,所述细胞选 自由地衣芽孢杆菌,枯草芽孢杆菌,迟缓芽孢杆菌(B. lentus),短芽孢杆菌(B. brevis), 嗜热脂肪芽孢杆菌(B. stearothermophiIus),嗜碱芽孢杆菌(B. alkalophilus),解淀 粉芽孢杆菌(B. amyloliquefaciens),凝结芽孢杆菌(B. coagulans),环状芽孢杆菌 (B. circulans),灿烂芽孢杆菌(B. Iautus),短小芽孢杆菌(B. pumilus),苏云金芽孢杆菌 (B. thuringiensis),克劳氏芽孢杆菌(B. clausii)和巨大芽孢杆菌(B. megaterium)组成 的组中,而且包含含有多核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或 sigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产 目的蛋白质。在另一个实施方式中,本发明提供了改良的杆菌宿主细胞,所述细胞包含一种含 有多核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或SigH启动子多核苷酸 序列的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产与所述改良的细胞同 源或异源的目的蛋白质。在另一个实施方式中,本发明提供了改良的杆菌宿主细胞,所述细胞包含一种含 有多核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或SigH启动子多核苷酸 序列的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产目的蛋白质,并且其中 aprE启动子驱动所述目的蛋白质的表达。在另一个实施方式中,本发明提供了改良的杆菌宿主细胞,所述细胞包含一种含 有多核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或SigH启动子多核苷酸 序列的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产选自淀粉酶、蛋白酶、 木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶(cutinase)、纤维素酶、半纤维素酶、酯 酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、 激酶磷酸酶、半乳糖苷酶和壳多糖酶、激素、细胞因子、生长因子、受体、疫苗和抗体的目的 蛋白质。在另一个实施方式中,本发明提供了改良的杆菌细胞,所述细胞包含一种含有多 核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或SigH启动子多核苷酸序列 的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产酶。在另一个实施方式中,本发明提供了改良的杆菌细胞,所述细胞包含一种含有多 核苷酸构建体的载体,所述构建体包含有效连接到SigA和/或SigH启动子多核苷酸序列 的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产蛋白酶。在另一个实施方式中,本发明提供了改良的杆菌细胞,所述细胞包含一种含有多 核苷酸构建体的载体,所述构建体包含有效连接到sigA和/或sigH启动子多核苷酸序列 的编码YmaH蛋白质的多核苷酸,其中所述改良的细胞能够生产选自枯草杆菌蛋白酶168, 枯草杆菌蛋白酶BPN',枯草杆菌蛋白酶Carlsberg,迟缓芽孢杆菌的枯草杆菌蛋白酶,克 劳氏芽孢杆菌的枯草杆菌蛋白酶,枯草杆菌蛋白酶DY,枯草杆菌蛋白酶147和枯草杆菌蛋 白酶309中的至少一种枯草杆菌蛋白酶及其变体。在另一个实施方式中,本发明提供了一种改良的产蛋白酶杆菌细胞,所述细胞能够过表达ymaH,其中所述改良的细胞包含在选自degU、degQ、degS、sco4、spoIIE、degQ和 degR中的至少一个基因中的突变。在另一个实施方式中,本发明提供了一种改良的产蛋白酶杆菌细胞,所述细胞能 够过表达ymaH,其中所述改良的细胞包含deg(Hy)32突变。在另一个实施方式中,本发明提供了 一种改良的产蛋白酶枯草芽孢杆菌 (Bacillus subtilis),所述细胞能够过表达ymaH,其中所述改良的细胞包含在选自degU、 degQ、degS、sco4、spoIIE、degQ和degR中的至少一个基因中的突变。在另一个实施方式中,本发明提供了一种获得改良的杆菌细胞的方法,所述方法 包括用包含一种多核苷酸构建体的载体转化杆菌宿主细胞,所述构建体包含有效连接到 SigA和/或SigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸,其中所述杆菌宿 主细胞能够表达目的蛋白质;和在适宜表达目的蛋白质的生长条件下培养该改良的杆菌细 胞。在另一个实施方式中,本发明提供了一种获得改良的杆菌细胞的方法,所述方法 包括用包含一种多核苷酸构建体的载体转化杆菌宿主细胞,所述构建体存在于复制质粒 上,并包含有效连接到SigA和/或SigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷 酸,其中所述杆菌宿主细胞能够表达目的蛋白质;和在适宜表达目的蛋白质的生长条件下 生长该改良的杆菌细胞。在另一个实施方式中,本发明提供了一种获得改良的杆菌细胞的方法,所述方法 包括用包含一种多核苷酸构建体的载体转化杆菌宿主细胞,所述构建体被整合到所述改 良的细胞的基因组中,并包含有效连接到SigA和/或SigH启动子多核苷酸序列的编码 YmaH蛋白质的多核苷酸,其中所述杆菌宿主细胞能够表达目的蛋白质;和在适宜表达目的 蛋白质的生长条件下生长该改良的杆菌细胞。在另一个实施方式中,本发明提供了一种获得改良的杆菌细胞的方法,所述方法 包括用包含一种多核苷酸构建体的载体转化杆菌宿主细胞,所述构建体包含有效连接到 sigA和/或SigH启动子多核苷酸序列的编码YmaH蛋白质的多核苷酸,其中所述杆菌宿主 细胞能够表达至少一种枯草杆菌蛋白酶;和在适宜表达所述枯草杆菌蛋白酶的生长条件下 生长该改良的杆菌细胞。在另一个实施方式中,本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的 方法,所述方法包括培养能够过表达ymaH的所述改良的杆菌细胞,并在适宜表达目的蛋 白质的生长条件下生长该改良的杆菌细胞。在一些实施方式中,该目的蛋白质是酶,例如枯 草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的 方法,所述方法包括培养能够过表达ymaH的所述改良的杆菌细胞,在适宜表达目的蛋白 质的生长条件下生长该改良的杆菌细胞,和回收该目的蛋白质。在一些实施方式中,该目的 蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌细 胞。在另一个实施方式中,本发明提供了一种在早于对应的前体宿主细胞中产生目的 蛋白质的时间在改良的杆菌细胞中生产目的蛋白质的方法,其中所述方法包括培养能够 过表达ymaH的所述改良的杆菌细胞,并在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。在一些实施方式中,该目的蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方 式中,所述杆菌细胞是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在改良的杆菌细胞中生产目的蛋白质的 方法,其中aprE启动子驱动目的蛋白质的表达,所述方法包括培养能够过表达ymaH的所 述改良的杆菌细胞,在适宜表达目的蛋白质的生长条件下生长该改良的杆菌细胞。在一些 实施方式中,该目的蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞 是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方 法,其中所述方法包括用下述方法获得改良的杆菌细胞该方法包括在杆菌亲本宿主细胞 中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该 改良的杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白 质在亲本宿主细胞中的表达相比得到了增强。在一些实施方式中,该目的蛋白质是酶,例如 枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方 法,其中所述方法包括用下列方法获得改良的杆菌细胞该方法包括在杆菌亲本宿主细胞 中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该 改良的杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白 质在亲本宿主细胞中的表达相比得到了增强,而且其中所述过表达包括用包含编码YmaH 蛋白质的多核苷酸的多核苷酸构建体转化杆菌亲本宿主细胞,其中所述编码YmaH蛋白质 的多核苷酸与sigA或SigH启动子多核苷酸序列有效连接。在一些实施方式中,该目的蛋 白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方 法,其中所述方法包括用下列方法获得改良的杆菌细胞该方法包括在杆菌亲本宿主细胞 中过表达ymaH、在适宜的生长条件下生长得到的改良杆菌细胞、并使所述目的蛋白质在该 改良的杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白 质在亲本宿主细胞中的表达相比得到了增强,而且其中所述过表达包括用包含选自SEQ ID NOS :1、2、3和13的序列的多核苷酸构建体转化杆菌宿主细胞。在一些实施方式中,该目的 蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌细 胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方 法,其中所述方法包括用下列方法获得改良的杆菌细胞该方法包括在杆菌宿主细胞中过 表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该改良的 杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白质在所 述杆菌宿主细胞中的表达相比得到了增强,而且其中所述过表达包括用存在于质粒中或整 合到该改良细胞基因组中、而且包括编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化 杆菌宿主细胞,其中所述编码YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列 有效连接。在一些实施方式中,该目的蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式 中,所述杆菌细胞是枯草芽孢杆菌细胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方法,其中所述方法包括用下列方法获得改良的杆菌细胞该方法包括在野生型杆菌宿主细 胞中过表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该 改良的杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白 质在所述野生型杆菌宿主细胞中的表达相比得到了增强,而且其中所述过表达包括用包含 编码YmaH蛋白质的多核苷酸的多核苷酸构建体转化野生型杆菌宿主细胞,其中所述编码 YmaH蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式 中,该目的蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽 孢杆菌细胞。在另一个实施方式中,本发明提供了一种在杆菌物种中增强目的蛋白质表达的方 法,其中所述方法包括用下列方法获得改良的杆菌细胞该方法包括在改变的杆菌宿主细 胞中过表达ymaH、在适宜的生长条件下生长所述改良杆菌细胞、并使所述目的蛋白质在该 改良的杆菌细胞中表达,其中所述目的蛋白质在该改良杆菌细胞中的表达与相同目的蛋白 质在所述改变的宿主细胞中的表达相比得到了增强,而且其中所述过表达包括用包含编码 YmaH蛋白质的多核苷酸的多核苷酸构建体转化改变的杆菌宿主细胞,其中所述编码YmaH 蛋白质的多核苷酸与sigA或sigH启动子多核苷酸序列有效连接。在一些实施方式中,该 目的蛋白质是酶,例如枯草杆菌蛋白酶。在一些实施方式中,所述杆菌细胞是枯草芽孢杆菌 细胞。


图I(A-E)图示了用于产生根据本发明一些实施方式的多核苷酸构建体的引物的 定位。组B-E展示了分别用于产生构建体SigH、SigAl、SigA2和SigA3的引物的位置,该位 置相对于组A中所图示枯草芽孢杆菌的miaA操纵子的杆菌染色体序列(枯草芽孢杆菌菌 株 168 的 1865428-1867019 碱基对;NCBI 登录号 NC000964)。引物对 P4-P5 和 P6-P7 是融 合引物,在其5’末端包含与要直接扩增的序列同源的碱基对“尾巴”,而且互相互补。融合 引物的互补尾巴使扩增的Sigma A启动子DNA与扩增的YmaH编码DNA融合,以便得到包含 与YmaH编码序列相邻的Sigma A启动子序列的嵌合多核苷酸,而删除大部分或全部miaA 编码序列。图2展示了枯草芽孢杆菌基因组的一部分多核苷酸序列,其包含限定SigA启动子 至编码YmaH蛋白质的序列末端的序列。该序列在图1的组A中图解。标示出了编码miaA 蛋白质的序列的开端,以粗体字母示出了完整的miaA编码序列;标示出了编码YmaH蛋白质 的序列的开端,以下划线的粗体字母示出了完整的YmaH编码序列。图3(A_B)组A示出了枯草杆菌蛋白酶的蛋白水解活性的图表,该枯草杆菌蛋 白酶分别由杆菌对照宿主细胞(42pBS)和过表达ymaH的改良杆菌宿主细胞(42SigAl 和42SigH)产生。组B示出了杆菌对照宿主细胞(41pBS)和过表达ymaH的改良杆菌 宿主细胞(41SigH)产生的枯草杆菌蛋白酶活性。根据由于水解和释放对硝基苯胺 (p-nitroanaline)导致的405nm光吸收的增加而测量蛋白质水解活性。酶活性水平是过表 达ymaH对杆菌宿主细胞产生枯草杆菌蛋白酶的影响的指征。图4示出了杆菌对照宿主细胞42pBS 19和过表达ymaH的改良杆菌宿主细胞 42SigH和42SigAl的枯草杆菌蛋白酶生产水平。
具体实施例方式本发明涉及已经遗传改造以具有改变的表达和/或生产目的蛋白质能力的细胞。 具体来讲,本发明涉及革兰氏阳性微生物的改良的宿主细胞,例如能够过表达ymaH的杆菌 物种。本发明涵盖包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体,以及包含 这种构建体和表达载体的改良的宿主细胞。具体来说,本发明涉及用于在杆菌物种中增强 目的蛋白(例如蛋白酶)的表达和生产的过表达YmaH的组合物和方法。除非另外指明,本发明的实施包括属于本领域技术的普遍用于分子生物学、微生 物学、蛋白质纯化、蛋白质工程、蛋白质和DNA测序以及重组DNA领域的常规技术。这些技 术为本领域技术人员所公知,并记载于许多标准文章和参考著作中。此处提及的所有专利、 专利申请、文章和出版物,包括上文中和下文中的,都明确引入本申请作为参考。除非另外定义,此处所用的所有技术和科学术语具有与本发明所属领域普通技术 人员所一般理解的含义相同的含义。包括本文涉及的术语的各种科学词典为本领域技术人 员所公知,而且能够得到。虽然与此处描述的方法和材料相似或等同的任何方法和材料均 可用于本发明的实施或检测,还是描述了一些优选的方法和材料。因此,通过整体参考说明 书而更加完全地描述下面定义的术语。应理解本发明不限于所描述的特定方法学、实验方 案和试剂,因为本领域技术人员可以根据使用它们的背景而对其进行改变。此处使用的单数术语“一个”、“一”和“所述”(“a”、“an”和“the”)包括其复数 指代,除非另外清楚指明。除非另外说明,核酸以5'至3'的方向从左向右书写,而氨基酸 序列以氨基端到羧基端的方向从左向右书写。此处引用的包括其中公开的所有序列的所有专利、专利申请和其他出版物均通过 明确引入本申请而作为参考,其程度相当于各个单独的出版物、专利或专利申请特别、单独 地通过引入本申请而作为参考。在相关部分引用的所有文献均通过引入本文作为参考。然 而,任何文献的引用都不应解释为承认其就是相对于本发明的现有技术。数值范围包括限定范围的端点数值。预期通篇说明书中给定的每个上限值意欲包 括每个较小的数值限制,相当于这样的较小数值限制明确记载于本文中。通篇说明书中给 定的每个下限值意欲包括每个较大的数值限制,相当于这样的更大数值限制明确记载于本 文中。整个说明书中每个数值范围包括落入该较宽数值范围的每个较窄数值范围,相当于 这样的较窄数值范围全部明确记载于本文中。此处提供的标题不是本发明的各个实施方式或方面的限制,该各个实施方式或方 面可以通过整体参考说明书而获得。因此,如上所述,通过整体引用说明书而更加完全地描 述下面定义的术语。此处使用的术语“分离的”和“纯化的”指与其天然相关的至少一种成分分离的核 酸或氨基酸(或其他成分)。术语“嵌合多核苷酸” “嵌合多核苷酸构建体”和“异源核酸构建体”指包含部分不 同基因的包括调节元件的多核苷酸。因此,在一些实施方式中,嵌合多核苷酸构建体包括与 不是其天然启动子的启动子有效连接的蛋白质编码区。在一些实施方式中,嵌合多核苷酸 指包括限定了启动子的多核苷酸序列的多核苷酸序列,该限定了启动子的多核苷酸序列有 效连接到编码蛋白质的多核苷酸序列。在一些实施方式中,该启动子和该编码多核苷酸是邻接的。在涉及启动子的上下文中的术语“限定”是指包含能够转录的启动子元件的多核 苷酸序列。此处使用的术语“启动子”是指其功能为驱动/影响下游基因的转录的核酸序列。 通常,启动子与其中要表达基因的宿主细胞相容。启动子与其他转录和翻译调控核酸序列 (也称为“控制序列”)对于表达给定基因是必需的。通常,转录和翻译调节序列包括但不 限于,启动子序列,核糖体结合位点,转录起始和终止序列,翻译起始和终止序列,上游启动 子元件的上游序列(UP元件)和增强子或激活子序列。在一些实施方式中,启动子还包括 转录前导序列。此处的术语“Sigma A启动子”和“SigA启动子”是指包含核心启动子序列的多核 苷酸序列,该核心启动子序列包括直接被相应的σΑ因子识别的序列。SigA启动子包含在 天然存在于miaA编码区域上游的序列中。此处的术语“Sigma H启动子”和“SigH启动子”是指包含核心启动子序列的 多核苷酸序列,该核心启动子序列包括直接被相应的σΗ因子识别的序列。SigH启动 子包含在天然存在于ymaH编码区域上游的序列中(Britton等人J. Bacteriol. 184 4881-4890[2002])。核心启动子包含如下启动子序列该启动子序列包括被相应的σ因子 直接识别的序列和位于被相应的σ因子直接识别的序列之间的间隔序列。此处的术语“aprE启动子”是指在枯草芽孢杆菌中天然驱动枯草芽孢杆菌蛋白酶 表达的多核苷酸启动子序列(Ferrari等人,J Bacteriol. 170 :289_295[1988])。在aprE 启动子的语境中,此处的“aprE启动子”是指野生型的aprE启动子及其突变体。在一些实 施方式中,所述aprE启动子包括用DegU,ScoC, AbrB和该启动子的任何其他调节子进行转 录调节所必需的核苷酸序列,和/或aprE转录前导序列(Hambraeus等人,Microbiology 148 1795-1803[2002])。在一些备选的实施方式中,aprE启动子并非包括所有对由DegU, ScoC,AbrB和其他调节子进行的转录调控必需的核苷酸序列,和/或不包括aprE转录前导 序列。术语“调节片段” “调节序列”和“表达控制序列”是指与编码多肽链的氨基酸序列 的DNA多核苷酸序列有效连接,以影响该编码氨基酸序列表达的DNA多核苷酸序列。该调 节序列能够抑制、阻遏或促进该有效连接的编码氨基酸的多核苷酸序列的表达。在一些实 施方式中,该调节序列包括与编码转录调节子YmaH的DNA序列有效连接的启动子。在一些 实施方式中,该启动子是与该ymaH基因异源的(例如,该启动子是并非立即驱动YmaH蛋白 质表达的启动子)。例如,在一些实施方式中,该启动子是有效连接到编码YmaH蛋白质的 DNA的Sigma A启动子。在一些其他的实施方式中,该启动子是立即驱动YmaH蛋白质表达、 并且有效连接到编码YmaH的DNA的启动子,与其在天然发生的宿主中的一样。术语“多核苷酸”和“核酸”,在此可以互换使用,是指任何长度核苷酸的聚合物形 式。这些术语包括但不限于,单链DNA,双链DNA,基因组DNA,cDNA,或包括嘌呤和嘧啶碱基 的聚合物,或其他天然的、化学的、生化修饰的、非天然的或衍生的核苷酸碱基。多核苷酸的 非限制性实例包括基因、基因片段、染色体片段、ESTs、外显子、内含子、mRNA、tRNA、rRNA、核 酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、分离的任何序列的DNA、分离的任何序 列的RNA、核酸探针和引物。应理解,由于遗传密码的简并性,可以制备许多编码给定蛋白质的核苷酸序列。此处的术语“基因”是指在生产多肽链中涉及的染色体DNA片段,其可以包括也 可以不包括编码区之前或之后的区域(例如5'未翻译序列(5‘ UTR)或前导序列和3' 未翻译序列(3' UTR)或尾随序列,以及单个编码片段(外显子)之间的间插序列(内含 子))。在一些实施方式中,基因编码商业上重要的工业蛋白质或肽,例如酶,包括但不限于 蛋白酶、纤维素酶、诸如淀粉酶和葡糖淀粉酶的糖酶、纤维素酶、氧化酶、异构酶、转移酶、激 酶、磷酸酶和酯酶。在一些其他的实施方式中,基因编码由其中出现miaA的操纵子(例如 miaA或ymaH)所编码的蛋白质。然而,不应理解为本发明限于任何具体的酶或蛋白质。在 一些其他的实施方式中,基因编码其他蛋白质或多肽,例如生长因子、细胞因子、配体、受体 和抑制剂,以及疫苗和抗体。在一些实施方式中,目的基因是天然存在的基因,而在其他实 施方式中,目的基因是突变的基因或合成的基因。如此处所使用的,“合成的”是指由体外化学或酶促合成制备的多核苷酸分子。其 包括但不限于用对于宿主微生物(诸如但不限于杆菌属物种)最优的密码子制备的变体核酸。此处使用的术语“聚合酶链式反应(PCR),,是指如美国专利4,683,1954,683,202 和4,965,188中记载的方法,其通过引入本申请作为参考,包括在基因组DNA混合物中提高 靶序列片段浓度而无需克隆或纯化的方法。扩增靶序列的这种方法包括引入大大过量的 两个寡核苷酸引物至含有目的靶序列的DNA混合物中,然后在DNA聚合酶存在下进行精确 顺序的热循环。这两个引物分别与双链靶序列中它们各自的链互补。为了完成扩增,将混合 物变性,然后将引物退火至靶分子中它们的互补序列。退火之后,用聚合酶延伸该引物,以 形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即,变性、退 火和延伸构成一个“循环”;可以有许多个“循环”),以得到高浓度的目的靶序列扩增片段。 目的靶序列的扩增片段的长度决定于引物相互间的相对位置,因此,其长度是可控参数。由 于该过程方面的重复,该方法被称作“聚合酶链式反应”(下面称为“PCR”)。因为靶序列的 目的扩增片段成为混合物中的优势序列(指浓度方面),因此被称为“PCR扩增的”。此处使用的术语“扩增试剂”指除引物、核酸模版和扩增酶之外的那些扩增所需试 剂(脱氧核糖核苷酸三磷酸盐、缓冲液等)。通常,扩增试剂与其他反应成分一起放入并包 含于反应容器(试管、微孔等)中。使用PCR,有可能扩增基因组DNA中单拷贝的特定靶序列至通过几种不同的方法 学可检测的水平(例如,与标记的探针杂交;加入生物素化的引物,然后用亲和素-酶结合 物检测;将32P-标记的脱氧核苷酸三磷酸盐掺入扩增的片段中,例如dCTP或dATP)。除了基 因组DNA,任何寡核苷酸或多核苷酸序列都能够用适宜的引物分子来扩增。特别地,用PCR 方法本身所产生的扩增的片段本身就是后续PCR扩增的有效模板。此处使用的术语“PCR产物”、“PCR片段”和“扩增产物”是指在PCR步骤变性、退 火和延伸完成两轮或更多轮循环之后得到的化合物的混合物。这些术语包括扩增了一个或 多个靶序列的一个或多个片段的情况。此处使用的术语“限制性核酸内切酶”和“限制性酶”是指细菌的酶,其在特异性 核苷酸序列处或附近切割双链DNA。术语“重组”是指不是在宿主细胞中天然存在的多核苷酸或多肽。在一些实施方式中,重组分子包括以一种不是天然存在的方式连接到一起的两个或多个天然存在的序列。核酸当与其他核酸序列处于功能关系中时,是“有效连接的”。例如,多核苷酸启动 子当影响编码多肽的多核苷酸的转录时,为有效连接到编码多肽的多核苷酸。在一些其他 的实施方式中,如果其处于能够促进翻译的位置时,核糖体结合位点为有效连接到编码序 列。在一些实施方式中,“有效连接”意味着这些连接的多核苷酸序列是邻接的。通过在合 宜的限制性酶切位点处连接达成结合。如果不存在这样的位点,则根据常规经验使用合成 的寡核苷酸适配体或接头。此处使用的“同源基因”是指来自不同但是通常相关物种、互相对应、而且彼此相 同或非常相似的基因。该术语包含那些由物种形成(即,新物种的形成)而分离的基因(例 如直向同源基因),以及那些已经通过遗传复制而分离的基因(例如共生同源基因)。如本文中使用的,“直向同源物”和“直向同源基因”指不同物种中从共同祖先基因 (即,同源基因)通过物种形成进化成的基因。通常,直向同源物在进化过程中保留了相同 的功能。直向同源物的鉴别可用于对新测序基因组中的基因功能进行可靠预测。如本文中使用的,“旁系同源物”和“共生同源基因”指基因组内通过复制相关的基 因。直向同源物在进化过程中保留了相同的功能,而旁系同源物则进化出新的功能,虽然一 些功能通常是与原始功能相关的。共生同源基因的实例包括但不限于编码胰蛋白酶、胰凝 乳蛋白酶、弹性蛋白酶和凝血酶的基因,它们都是丝氨酸蛋白酶,并同时存在于相同的物种 内。此处使用的“同源性”是指序列相似性或同一性,优选同一性。可以用本领域公知 的标准技术测定同源性,(参见,例如Smith和Waterman,Adv. App 1. Math.,2 482[1981]; Needleman 禾口 Wunsch, J. Mol. Biol. ,48 443[1970] ;Pearson 禾口 Lipman, Proc. Natl. Acad. Sci. USA 85 2444[1988];威斯康辛遗传软件包中的如 GAP,BESTFIT, FASTA,和 TFASTA 等程序(遗传计算机组,威斯康辛州麦迪逊);和Devereux等人,Nucl. AcidRes.,12 387-395[1984])。此处使用的“同功序列”是其中基因的功能与来自优选的枯草芽孢杆菌菌株(即 枯草芽孢杆菌168)中特定基因的功能基本相同的基因。并且,同功基因包括与枯草芽孢杆 菌168基因的序列有至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约 95%、约97%、约98%、约99%或约100%序列同一性的序列。或者,同功序列具有枯草芽 孢杆菌168区域中存在基因的排比之介于70-100%之间的排比,和/或在与枯草芽孢杆菌 168基因组比对的区域中具有至少5-10个基因。在另外的实施方式中,所述序列具有超过 一个的上述性质。同功序列用已知的序列比对方法来测定。常用的比对方法是BLAST,虽然 如上文和下文中所述,还有其他也可以用于比对序列的方法。适用算法的一个例子是PILEUP。PILEUP使用累进的、配对的比对从一组相关的序 列形成多个序列比对。也可以绘出表明用于形成比对的簇关系的树。PILEUP使用Feng和 Doolittle (Feng 和 Doolittle,J. Mol. Evol. ,35 :351_360 [1987])的累进比对方法的简化 方法。该方法与 Higgins 和 Sharp (Higgins 和 Sharp,CABIOS 5 151-153 [1989])中所述的 方法类似。可用的PILEUP参数包括3. 00的缺省空位权重,0. 10的缺省空位长度权重和加 权的最终空位。可用的算法的另一个例子是BLAST算法,由Altschul等所描述(Altschul等人,J. Mol. Biol.,215 403-410, [1990];和 Karlin 等人,Proc. Natl. Acad. Sci. USA 90 5873-5787 [1993])。特别有用的 BLAST 程序是 WU-BLAST-2 程序(参见 Altschul 等人,Meth. Enzymol. 266 :460_480 [1996])。WU-BLAST-2使用几种研究参数,大部分设定为缺省值。可 调的参数用下列数值设定重叠跨距(overlap span) = 1,重叠分数(overlapfraction)= 0.125,字符阈值(word threshold) (T) =11。HSP S和HSPS2参数是动态的值,由程序本 身根据具体序列的组成和目的序列所针对搜索的具体数据库的组成建立。然而,这些值可 以调节以增加敏感度。%氨基酸序列同一性值用匹配的相同残基数除以比对的区域中较长 的序列的残基总数来测定。“较长”序列是在比对区域具有最多实际残基的序列(忽略为了 最大化比对分值而由WU-Blast-2引入的空位)。因此,“核酸序列同一性百分数”定义为候选序列中与此处公开的序列的核苷酸残 基相同的核苷酸残基的百分比。优选的方法使用设定为缺省参数的WU-BLAST-2的BLASTN 模块,分别将重叠跨距和重叠分数设定为1和0. 125。在一些实施方式中,比对包括在要比对的序列中引入空位。另外,对于比候选核酸 序列含有更多或更少核苷酸的序列,应理解的是,与核苷酸的总数相比,同源性的百分数应 基于同源核苷酸的数量来测定。所以,例如,如下所述比此处鉴定的序列短的序列的同源性 应用该较短序列的核苷酸数量来测定。此处使用的“多核苷酸构建体” “表达盒”和“表达载体”是指含有有效连接到适宜 控制序列的DNA序列的DNA构建体,该控制序列能够影响DNA在适当宿主中的表达。这样 的控制序列包括影响转录的启动子、控制该转录的可选操纵子序列、编码适当的mRNA核糖 体结合位点的序列和控制转录和翻译终止的序列。通常,多核苷酸构建体包括有效连接到 蛋白质编码区域的转录调节区域(例如启动子)。在一些实施方式中,多核苷酸构建体包 括有效连接到是天然启动子的一个启动子的蛋白质编码区域(即,该启动子与在自然中发 现的一样,与该编码序列邻接)。因此,例如,本发明的多核苷酸构建体包括sigH启动子和 ymaH编码序列。在其他实施方式中,该多核苷酸构建体包括有效连接到不是天然的邻接启 动子的启动子上的蛋白质编码区域(即,该多核苷酸构建体包括嵌合多核苷酸,其中在该 构建体中相对于编码序列的启动子位置并未在自然中发现)。例如,sigA启动子有效连接 到ymaH编码序列。在其他实施方式中,该多核苷酸构建体包括多于一个的启动子和多于一 个的蛋白质编码区域(例如,该多核苷酸构建体包括多顺反子序列,该多顺反子序列包括 多个启动子和编码区域,如一个操纵子中发现的那样)。在一些其他的实施方式中,多核苷 酸构建体或表达盒包括选择性标记(例如抗生素抗性标记,例如编码氯霉素乙酰基转移酶 的基因),当适当的抗生素存在时,这些标记能使得在宿主细胞的基因组中的该多核苷酸构 建体扩增。上述多核苷酸构建体能够合并入质粒、基因组、线粒体DNA、质体DNA、病毒或核 酸片段中。在一些实施方式中,载体是质粒、噬菌体颗粒或简单的潜在的基因组插入物。在 另外的一些实施方式中,一旦转化入合适的宿主中,载体独立于宿主基因组复制并发挥功 能,或者,在一些备选的情况下,整合入基因组本身中。此处使用的“质粒” “表达质粒” “载 体”经常可以互换使用,因为质粒是目前最常用的载体形式。然而,本发明意在包括那些行 使同样功能、并且为本领域已知或将为本领域公知的表达载体的其他形式。“载体”包括克 隆载体、表达载体、穿梭载体、质粒、噬菌体或病毒颗粒、DNA构建体、盒等。此处使用的术语“质粒”是指用作克隆载体的环状双链(ds)DNA构建体,其在许多细菌和一些真核细胞中形成染色体外自主复制遗传元件。在一些实施方式中,质粒将整合 入宿主细胞的基因组中。术语“质粒”包括能够通过同源重组整合入宿主细胞基因组中的 多拷贝质粒。此处使用的术语“转化的”和“稳定转化的”是指具有整合到其基因组中的非天然 (异源的)多核苷酸序列的细胞,或包括保持至少两代或更多代的游离质粒的细胞。此处使 用的术语“表达”是指转录多核苷酸,并将得到的转录物翻译以产生多肽的过程。该过程包 括转录和翻译。术语“过表达”此处是指含有编码多肽的序列的基因在改良的细胞中被人工表达, 以产生所编码的多肽,该多肽的表达水平超过相同多肽在前体宿主细胞中的表达水平。因 此,虽然该术语通常与基因连用,术语“过表达”也可以与蛋白质连用,来表示由于其编码基 因的过表达导致的蛋白质水平的升高。在一些实施方式中,编码蛋白质的基因的过表达通 过增加编码该蛋白质的基因的拷贝数来达到。在另外的实施方式中,编码蛋白质的基因的 过表达通过以如此方式提高启动子区域和/或核糖体结合位点的结合强度,以提高编码该 蛋白质的基因的转录和/或翻译来达到。在其他的实施方式中,过表达可以通过增加基因 的拷贝数和提高启动子区域和/或核糖体结合位点的结合强度来达成。在一些实施方式 中,编码蛋白质的基因的过表达是由于相应的编码多核苷酸的至少一个拷贝的表达,这些 核苷酸存在于已经引入宿主细胞中的多拷贝质粒中。在其他实施方式中,编码蛋白质的基 因的过表达是由于相应编码多核苷酸的两个或多个拷贝的表达,该多核苷酸整合入宿主细 胞基因组中。“宿主细胞”是指来自作为包括本发明的DNA的表达载体的宿主的细胞的适宜细 胞。适宜的宿主细胞可以是天然存在的或野生型宿主细胞,或者可以是改变的宿主细胞。在 一个实施方式中,该宿主细胞是革兰氏阳性微生物。在一些优选的实施方式中,该术语是指 杆菌属的细胞。此处使用的“杆菌细胞”包括本领域技术人员已知的所有成员,包括但不限于 枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢 杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、B. halodurans、巨大芽孢杆菌、凝结芽孢杆菌、 环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。应承认,杆菌属还在持续进行分类学 上的重新组织。所以,杆菌属包括那些已经重新分类的物种,包括但不限于例如嗜热脂 肪芽孢杆菌(现在命名为Geobacillus stearothermophilus)等微生物。氧气存在下 抵抗性的内生孢子被认为是杆菌属的定义性特征,虽然该特征也适用于现在命名的环 脂芽孢杆菌(Alicyclobacillus)、兼性芽孢杆菌(Amphibacillus)、解硫胺素芽孢杆菌 (Aneurinibacillus)、厌氧芽孢杆菌(Anoxybacillus)、短芽孢杆菌(Brevibacillus)、 Filobacillus、薄壁芽孢杆菌(Gracilibacillus)、喜盐芽孢杆菌(Halobacillus)、类芽孢 杆菌(Paenibacillus)、需盐芽孢杆菌(Salibacillus)、而才热芽孢杆菌(Thermobacillus)、 Ureibacillus 禾口枝芽孢杆菌(Virgibacillus)。野生型宿主细胞是没有用重组方法遗传改变的宿主细胞。当此处使用的术语“野生型”涉及基因或基因产物时,是指具有分离自天然存在来 源的基因或基因产物的特征。通常,野生型基因是在种群中最常观察到的基因,因此被任意 地命名为该基因的“正常”或“野生型”形式。此处使用的术语“野生型序列”和“野生型基因”可以互换使用,是指在宿主细胞中天然的或天然产生的序列。野生型序列可以编码同源 的或异源的蛋白质。此处使用的“改变的宿主细胞” “改变的细胞”和“改变的菌株”是指遗传工程化的 宿主细胞(微生物),其中目的蛋白质的表达和/或生产水平大于相同目的蛋白质在未改变 或野生型宿主细胞在基本相同生长条件下生长时表达和/或生产的水平。在一些实施方式 中,改变的宿主细胞是重组的产蛋白酶细胞。“改良的细胞”和“改良的宿主细胞”是指已经遗传工程化以过表达编码YmaH蛋白 质的基因的野生型或改变的宿主细胞。在一些实施方式中,改良的宿主细胞是重组的产蛋 白酶细胞。在一些实施方式中,改良的宿主细胞能够以高于野生型或改变的亲本宿主细胞 的水平表达和/或生产目的蛋白质。“亲本”或“前体”细胞是指改良的宿主细胞所来自的细胞,亲本或前体细胞可以是 野生型或改变的细胞。在一些实施方式中,改变的亲本细胞能够以高于未改变或野生型亲 本/前体细胞的水平表达和/或生产目的蛋白质。在将核酸序列引入细胞的语境中,术语“引入”是指适宜于将核酸序列转移入该 细胞的任何方法。这样的引入方法包括但不限于原生质体融合、转染、转化、接合和转导 (参见,例如 Ferrari 等人,“Genetics” 出自 Hardwood 等人(编著),Bacillus, Plenum Publishing Corp.,第 57-72 页,[1989])。此处使用的术语“转化的”和“稳定转化的”是指具有整合到其基因组中的非天然 (异源的)多核苷酸序列的细胞,或包括保持至少两代的作为游离质粒存在的异源多核苷 酸序列的细胞。此处使用的“转化DNA/多核苷酸” “转化序列”和“DNA/多核苷酸构建体”是指用 于将序列引入宿主细胞或微生物的DNA。“转化DNA”是用于将序列引入宿主细胞或生物的 DNA。该DNA可以通过PCR或任何其他适宜技术体外产生。在一些优选的实施方式中,转化 DNA包括输入顺序(incoming sequence),而在其他优选的实施方式中,进一步包含两侧有 同源性盒的输入顺序。在又一个实施方式中,转化DNA包括加入到末端的其他非同源性序 列(即填充序列或侧翼)。在一些实施方式中,末端被关闭,使得该转化DNA形成闭合的环, 例如加入载体中。此处使用的术语“编码可选择性标记的多核苷酸序列”是指能够在宿主细胞中表 达的核苷酸序列,而且该可选择性标记的表达赋予含有该表达基因的细胞在存在相关选择 性试剂时或缺乏基本营养物时生长的能力。此处使用的术语“可选择性标记”是指能够在宿主细胞中表达的基因,其使得含有 该载体的宿主容易选择出来。这样的可选择性标记的例子包括但不限于抗生素(例如卡那 霉素、红霉素、放线菌素、氯霉素和四环素)。因此,术语“可选择性标记”是指提供宿主细胞 已经摄取了目的DNA或一些其他反应已经发生的指征的基因。通常,可选择性标记是对宿 主细胞赋予抗生素抗性或代谢优势的基因,以使含有该外源DNA的细胞能够从在转化中没 有接受任何外源序列的细胞中区别出来。“居留可选择性标记”是位于转化的微生物基因组 上的标记。居留可选择性标记编码的基因不同于在转化DNA构建体上的可选择性标记。此处使用的术语“扩增”和“基因扩增”是指使特定的DNA序列不成比例地复制 的方法,从而该扩增的基因以比原来在基因组存在的数量高的拷贝数存在。在一些实施方式中,在药物(例如可抑制酶的抑制剂)存在下通过生长对细胞的选择导致该药物存在时 编码生长所需基因产物的内源性基因的扩增,或者通过编码该基因产物的外源性(即输入 的)序列的扩增,或者两者兼备。在药物(例如可抑制酶的抑制剂)存在下通过生长对细 胞的选择可以导致编码该药物存在时生长所需的基因产物的内源性基因的扩增,或者通过 编码该基因产物的外源性(例如输入的)序列的扩增,或者两者兼备。此处使用的术语“多肽”是指由通过肽键连接的氨基酸残基构成的化合物。在一 些实施方式中,此处使用的术语“蛋白质”是术语“多肽”的同义词。在一些备选的实施方 式中,是指两个或更多个多肽的复合物。因此,术语“蛋白质”和“多肽”可互换使用。术语“YmaH蛋白质”与“Hfq蛋白质”可互换使用,是指增强目的蛋白质表达的蛋 白质。在YmaH的语境中,“YmaH蛋白质”是指野生型YmaH蛋白质及其变体,包括直向同源 物。此处使用的“变体”是指来自前体蛋白质(例如枯草芽孢杆菌YmaH蛋白质)的蛋 白质,通过加入一个或多个氨基酸至C末端或N末端或两端都加、在氨基酸序列的一个或多 个不同位点处一个或多个氨基酸的取代、在蛋白质的某一端或两端、或者在氨基酸序列的 一个或多个位点删除一个或多个氨基酸,和/或在氨基酸序列的一个或多个位点插入一个 或多个氨基酸。“枯草芽孢杆菌YmaH蛋白质“是指如下所述修饰的枯草芽孢杆菌YmaH蛋 白质。枯草芽孢杆菌YmaH蛋白质变体的制备优选通过修饰编码天然蛋白的DNA序列、该 DNA序列向适宜宿主中的转化和该修饰的DNA序列的表达来达成,以形成该衍生的酶。本发 明的变体枯草芽孢杆菌YmaH蛋白质包括与前体酶氨基酸序列相比含有氨基酸序列改变的 肽,其中该变体枯草芽孢杆菌YmaH蛋白质保持了在枯草芽孢杆菌细胞中增强目的蛋白质 生产的能力,其中YmaH蛋白是过表达的。变体的活性与前体分泌因子相比,可以是升高的 或降低的。应理解本发明的变体可以来自编码枯草芽孢杆菌YmaH蛋白质变体的DNA片段, 其中保持了表达的枯草芽孢杆菌YmaH蛋白质变体的功能活性。“目的蛋白质”和“目的多肽”是指用宿主细胞生产的蛋白质/多肽。通常,目的 蛋白质是具有商业意义的想要的蛋白质。目的蛋白质可以与宿主同源或异源。在一些实施 方式中,目的蛋白质是分泌的多肽、特别是酶,包括但不限于淀粉酶、蛋白水解酶、溶细胞的 酶、氧化还原酶和植物细胞壁降解的酶。在进一步的实施方式中,这些酶包括但不限于淀 粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、 酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移 酶、半乳糖苷酶和壳多糖酶。在更进一步的实施方式中,表达的多肽是激素、细胞因子、生长 因子、受体、疫苗、抗体等。这并不意味着本发明限于任何具体的蛋白质/多肽,在一些最优 选的实施方式中,表达的目的蛋白质是蛋白酶。此处使用的术语“异源蛋白质”是指不是在宿主细胞中天然存在的蛋白质或多肽。 异源蛋白质的例子包括酶,例如,包括蛋白酶、纤维素酶、淀粉酶、其他糖酶和酯酶的水解 酶,诸如消旋酶、差向异构酶、互变异构酶(tautomerase)或突变酶的异构酶;转移酶;激酶 和磷酸酶。在一些实施方式中,这些蛋白质是有治疗意义的蛋白质或肽,包括但不限于生长 因子、细胞因子、配体、受体和抑制剂,以及疫苗和抗体。在一些备选的实施方式中,蛋白质 是商业上重要的工业蛋白质或肽(例如,蛋白酶、诸如淀粉酶和葡糖淀粉酶的糖酶、纤维素 酶、氧化酶和酯酶)。在一些实施方式中,编码该蛋白质的基因是天然存在的基因,而在其他实施方式中,使用突变和/或合成的基因。在一些实施方式中,编码该蛋白质的基因是天然 存在的基因,而在其他实施方式中,使用突变和/或合成的基因。此处使用的术语“同源蛋白质”是指在宿主细胞中天然存在的蛋白质或多肽。本发 明包括通过重组DNA技术生产同源蛋白质的宿主细胞。在备选的实施方式中,该同源蛋白 质是其他生物(包括但不限于大肠杆菌(E. coli))生产的天然蛋白质。本发明包括通过重 组DNA技术生产同源蛋白质的宿主细胞。本发明进一步包括宿主细胞,其具有编码天然存 在的同源蛋白质(例如蛋白酶)的核酸的一个或多个删除,或一个或多个中断,并具有以重 组形式再次引入(即在表达盒中引入)的编码该同源蛋白质的核酸。在其他实施方式中, 宿主细胞生产同源蛋白质。此处使用的术语“蛋白酶”和“蛋白水解活性”是指具有能够水解肽或具有肽 键的底物的能力的蛋白质或肽。存在许多公知的方法来测量蛋白水解活性((Kalisz, "Microbial Proteinases” 出 自 Fiechter (编 著),Advances in Biochemical Engineering/Biotechnology, [1988])。例如,蛋白水解活性可以通过比较实验来确定,该 实验分析了生产的蛋白酶水解商业底物的能力。用于这种蛋白酶或蛋白水解活性分析的示 例性底物包括但不限于,二甲基酪蛋白(Sigma C-9801),牛胶原(Sigma C-9879),牛弹性 蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。使用这些底物的比色法为 本领域所公知,参见,例如WO 99/34011和美国专利No. 6,376,450,其通过引入本申请作为 参考。AAPF 实验(参见,例如 DelMar 等人,Anal. Biochem.,99 :316-320[1979])也可以用 于测定成熟蛋白酶的生产。该实验测量当酶水解可溶性合成底物琥珀酰_丙氨酸_丙氨 酸-脯氨酸-苯丙氨酸-对-硝基苯胺(sAAPF-pNA)时的对硝基苯胺释放率。用分光光度 计在410nm处测量从水解反应中产生的黄色的产生率,其与活性酶浓度成比例比较。此处使用的术语“活性”是指与特定蛋白质相关的生物活性,例如与蛋白酶相关的 蛋白水解活性。生物活性是指本领域技术人员通常标志该蛋白质的任何活性。术语“生产”当涉及目的蛋白质时,包括多肽生产的加工步骤,包括去除前区(pro region),通常形成多肽的活性成熟形式,其已知在成熟过程中产生。在一些实施方式中, 多肽的生产包括信号肽的去除,其已知会在蛋白质分泌过程中出现(参见,例如Wang等 人,Biochemistry37 :3165_3171 (1998)禾Π Power 等人,Proc Natl Acad Sci USA 83 3096-3100[1986])。在一些实施方式中,表达的蛋白质被限制在其表达的细胞的细胞内 环境中,而在其他实施方式中,表达的蛋白质分泌到细胞外环境中。因此,在一些实施方 式中,目的蛋白质的生产包括蛋白质表达以及其分泌到细胞外基质的细胞过程。例如,蛋 白酶的生产包括全长蛋白酶的两个加工步骤1.信号肽的去除,已知会在蛋白质分泌过 程中发生;和2.前区的去除,其形成酶的活性成熟形式,已知会在成熟过程中发生(Wang 等人,Biochemistry 37:3165-3171 (1998) ;Power 等人,Proc Natl Acad Sci USA83 3096-3100[1986])。此处的术语“早期表达和/或早期生产”表示目的蛋白质的表达和/或生产在宿 主细胞中发生的时间早于目的蛋白质通常在前体/亲本宿主中表达的时间。在一些实施方 式中,目的蛋白质“早期表达和/或生产”在过表达YmaH的宿主中的发生早于没有过表达 ymaH的宿主细胞。此处使用的术语“增强”是指目的蛋白质的改善的生产。在优选的实施方式中,本发明提供目的蛋白质在改良宿主中增强的(即改善的)生产。在这些实施方式中,该“增强 的”生产与未改良的野生型或改变的亲本宿主(例如野生型细胞,或不过表达转录激活子如 YmaH的改变的细胞)生产的正常水平相比,得到了改善。YmaH多肽和多核苷酸构建体在一些实施方式中,本发明提供了包含启动子和编码YmaH蛋白质多核苷酸序列 的多核苷酸构建体。枯草芽孢杆菌YmaH,也叫HFQ_BACSU,是RNA结合蛋白,是RNA结合蛋 白的 Hfq 家族的一个成员(Sauter 等人,Nucleic Acid Res 31 =4091-4098, [2003])。YmaH 蛋白质在枯草芽孢杆菌中由ymaH基因编码,该基因是大肠杆菌的hfq基因的直向同源基因 (Silvaggi 等人,J Bacteriol. 187(19) :6641_6650,[2005])。YmaH 是原核生物中大量且 广泛存在的RNA结合蛋白,行使RNA代谢的基因多效性调节子的功能,在稳定一些转录物并 降解其他转录物中需要该蛋白。YmaH优先结合到未组织的富含A/U的RNA序列,在序列和 结构上都与真核生物中的Sm蛋白相似。还已知YmaH也结合称为核糖核酸调节物的小RNA 分子,该分子调整RNA转录物的稳定性或翻译效率。本发明提供用于过表达ymaH的方法和组合物,其增加已经改良为过表达ymaH的 宿主细胞中目的蛋白的生产。另外,如本文所示,ymaH的过表达增强了杆菌宿主细胞中蛋 白酶的生产。ymaH的过表达可以通过多种方法得到,包括增强编码YmaH的多核苷酸的转录 和/或翻译。例如,在转录水平,ymaH的过表达可以通过在宿主细胞中增加编码ymaH的多 核苷酸序列的数量来达到,和/或提高ymaH启动子的结合强度以提高相关RNA聚合酶的活 性来达到。在翻译水平,ymaH的过表达可以通过突变核糖体结合位点(RBS)以提高核糖体 与RBS的亲和性,进而增强翻译活性来达到。本领域技术人员可以知晓ymaH的过表达可以 仅仅通过ymaH基因拷贝数量的升高来完成,或者联合其他对ymaH基因的可能修饰来达到 ymaH的过表达。本发明提供了能够过表达ymaH的包括多核苷酸构建体、载体和宿主细胞的组合 物。本发明还提供了使用本发明的组合物过表达目的蛋白质的方法。本发明的多核苷酸构 建体包括编码YmaH蛋白质的多核苷酸序列和SigA和/或SigH启动子。在一个实施方式中,本发明通过增加编码ymaH的多核苷酸序列的数量来提供 ymaH的过表达。因此,本发明提供包含有效连接到ymaH启动子的编码ymaH的多核苷酸序 列的多核苷酸构建体。ymaH启动子可以是驱动ymaH表达的任何启动子(例如SigA和/或 SigH启动子),可以是在选择的宿主细胞中表现转录活性的任何核酸序列,包括突变体、截 短的和杂合体启动子,而且可以从编码细胞外或细胞内多肽的基因得到,不论这些基因对 于宿主细胞是同源的还是异源的。该启动子序列对于宿主细胞可以是天然的或外来的。在一些实施方式中,启动子序列可以得自细菌。在一些实施方式中,启动子序列可 以得自革兰氏阳性菌,例如芽孢杆菌属菌株(例如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢 杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌(Bacillus firmus), 灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽胞杆菌、巨大芽孢杆菌、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌);或链霉菌属菌株(例如 浅青紫链霉菌(Steptomyces lividans)或鼠灰链霉菌(Streptomycesmurinus));或来自 革兰氏阴性菌(例如大肠杆菌或假单胞菌属物种)。ymaH的转录可以天然地由两个启动子驱动=SigA启动子,存在于miaA编码区上游,和SigH启动子,存在于枯草芽孢杆菌的miaA操纵子中紧靠着ymaH编码区的上游。在 一些实施方式中,本发明提供多核苷酸构建体,包括编码YmaH的多核苷酸序列和SigA启动 子(例如SEQ IDNOs 2和3)。SEQ ID NOs 2和3例证了其中ymaH编码区邻接于SigA启 动子序列以提供嵌合多核苷酸构建体的实施方式。在一些优选的实施方式中,因此嵌合多 核苷酸构建体包含天然存在时不与ymaH编码序列邻接的启动子序列。例如,SEQ ID NOS 2和3分别示例了嵌合构建体SigA和SigA2,均包含有效连接到编码ymaH的多核苷酸序列 的SigA启动子。GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAG AAGGATGTTTACCGATGCAAAAMAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATT TATAAAAGAGAGTGATACATATTGAATAATACGAAGCAGCCCCACACATATAGCAGGAAAACTCGAACTTTAATCGA AACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATC CGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAA CTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAA AAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGG CGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTT TATGAGGGATCCGGTGCC(SEQ ID NO 2)GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAG AAGGATGTTTACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATT TATAAAAGAGAGTGCTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAACCGATT AATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGCTTTCA GTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTATATATA AACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATGTCAAG ACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTTGTGTA AGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAGGGATCCGGTGCC(SEQ ID NO 3)在另一个实施方式中,本发明提供了多核苷酸构建体,包括编码YmaH的多核苷酸 序列和SigH启动子(例如SEQ ID NO 1的SigH构建体,如下所示)。SEQ ID NO :1还示例 了包含天然与SigH启动子邻接的ymaH编码序列的多核苷酸构建体。GGCACCGAATTCGACGTGGTTTCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGA TATGGAGCTGAAAAAAAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAG AGAATCAAGGAGGACGAAACATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACG TATGTCACTGTTTTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTT GGAATCGGAAGGTAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTG AACTCGAATAGATCAAAAAATGCCATGTCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACA TGAATCCACTTTTGCTCCAAGCTTTTTGTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAGGGATCCGGA GCC(SEQ ID NO 1)在又一个实施方式中,本发明提供了多核苷酸构建体,其包括编码YmaH的多核苷 酸序列和SigA和SigH启动子(例如如下所示的SEQ IDNO 13的SigA3构建体)。TCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTTA CCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGAGAGTGATACATATTGAATAATACGAAGCAGCCCGTTGTCATTTTAGTCGGACCGACGGCAGTGGGGAAAACCAATTTAA GTATTCAGCTAGCCAAATCCTTAAACGCGGAAATTATCAGCGGAGATTCGATGCAGATTTATAAAGGGATGGATATT GGAACAGCTAAAATTACCGAACAGGAGATGGAGGGAGTGCCCCATCATCTGATTGACATTTTAGATCCCCAAGACTC TTTCTCTACTGCCGATTATCAAAGCTTAGTAAGAAATAAAATCAGCGAGATTGCAAATAGAGGAAAGCTTCCGATGA TTGACGGCGGTACAGGGCTTTATATACAATCTGAGCTTTACGATTATACATTTACGGAAGAGGCAAATGATCCCGTG TTTCGAGAGAGCATGCAAATGGCTGCTGAGCGGGAAGGCGCTGACTTTCTTCATGCCAAACTTGCTGCAGCAGATCC CGAGGCAGCAGCTGCGATTCATCCGAATAATACAAGAAGAGTCATTCGCGCACTGGAAATTTTACATACGTCCGGAA AAACGATGTCCCAGCATTTGAAGGAACAAAAACGAGAACTTCTGTACAATGCAGTGTTAATTGGCCTGACAATGGAT AGAGACACGCTTTACGAAAGAATTAATCAGCGGGTCGATTTGATGATGCAGTCAGGCCTTCTTCCGGAAGTGAAACG CTTATACGACAAGAACGTGAGAGACTGTCAATCAATACAGGCGATAGGCTATAAAGAGCTGTATGCATATTTTGACG GTTTTGTGACACTTTCCGATGCTGTCGAACAGCTAAAGCAGAACTCGAGGCGGTATGCGAAACGCCAGCTGACGTGG TTTCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGATATGGAGCTGAAAAAAAAGGAAATTTT CACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCAAGGAGGACGAAACATGAAAC CGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTTTTTTTGCTGAACGGC TTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGGTAAGCAGCAGCTTAT ATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAGATCAAAAAATGCCATG TCAAGACATGAGGAAAGGCTGTCGGGGGTTCCCGGCGGCCATTTTTAACATGAATCCACTTTTGCTCCAAGCTTTTT GTGTAAGCTGACCATGCCAAGGCACGGTCTTTTTTTATGAG(SEQ ID NO 13)指导ymaH基因表达的适宜启动子例子是来自枯草芽孢杆菌操纵子(包含编码 miaA的基因)的SigA和SigH启动子,例如,在一个实施方式中,本发明提供了限定SigA启 动子的多核苷酸序列(SEQ ID N0:14,如下所示)。TCATACCCTGAAAGGAAAGACAAGGGAAATTGTCGGCAATGAGCCGCTCGGCAGGTAGAAGGATGTTT ACCGATGCAAAAAAAGGGCAAAATGGATAGGTGGTTGTCCATGTTGAATGCTATAATGGGGGAGATTTATAAAAGA GAGTGATACATA(SEQ ID NO 14)在另一个实施方式中,本发明提供了限定SigH启动子的多核苷酸序列(SEQ ID 而16,如下所示)。AAAGGAAATTTTCACACATATAGCAGGAAAACTCGAACTTTAATCGAAACTGTATGATATAGAGAATCA AGGAGGACGAAAC(SEQ ID NO 16)能够用于表达ymaH基因的启动子的其他例子包括被σΑ因子识别的Sigma A启 动子,其包括天蓝色链霉菌(Str印tomyces coelicolor)琼脂糖酶基因(dagA)的启动子、 迟缓芽孢杆菌碱性蛋白酶基因(aprH)的启动子、地衣芽胞杆菌碱性蛋白酶基因(枯草杆 菌蛋白酶Carlsberg基因)的启动子、枯草芽孢杆菌果聚糖蔗糖酶(levansucrase)基因 (sacB)的启动子、枯草芽孢杆菌α-淀粉酶基因(amyE)的启动子、地衣芽胞杆菌α -淀粉 酶基因(amyL)的启动子、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)的启动子和解淀 粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子。能够用于表达ymaH基因的启动子的例子 包括被σ η因子识别的Sigma H启动子,包括spoOA、spoOF、spoVG和citG (参见Helmann, J. D.和 C.P.Moran.,2002,RNA polymerase and sigma factors,第 289—312 页,出自 A. L. Sonenshein, J. A. Hoch 和 R. Losick(编著),Bacillus subtilis and its closest relatives :from genes to cells, American Society for Microbiology, Washington,D. C.)。在一些实施方式中,共有的SigA和/或SigH启动子可以用于本发明。共有启动 子(consensus promoter)的构建可以通过定点诱变形成启动子来达成,该启动子更完全地 符合针对枯草芽孢杆菌的无性“Sigma A型”启动子的“-10”和“-35”区域所建立的共有序 列(Voskuil等人,Mol Microbioll7 =271279 [1995]) 在其他实施方式中,共有启动子通 过定点诱变形成启动子来达成,该启动子更完全地符合针对枯草芽孢杆菌的无性“Sigma H 型”启动子的“_10”和“-35”区域所建立的共有序列(参见Helman和Moran,自Bacillus subtilis and its closest relatives,Ch. 21,第 289-312 页;Sonenshein 等人(2002 ASM Press, Washington, D. C.)。用于sigma A型启动子的“_35”区的共有序列是TTGaca,用于 “-10”区的序列是tgnTATaat,用于sigma H型启动子的“_35”区的共有序列是RnAGGAwffff, 用于“-10”区的序列是RrmGAAT。大写字母表示高度保守的位置;小写字母表示保守性较 低的位置;缩写R可以是A或G,缩写W可以是A或T。共有启动子可以从能够在杆菌宿主 细胞中发挥功能的任何启动子获得。在一些实施方式中,包含SEQ ID N0:14的SigA启动子,限定为天然存在于miaA 编码序列(SEQ ID NO :15,如下所示)上游的多核苷酸序列;而包含SEQ ID NO 16的SigH 启动子,限定为天然存在于yamH编码序列(SEQ ID NO :17,如下所示)上游的多核苷酸序 列。TTGAATAATACGAAGCAGCCCGTTGTCATTTTAGTCGGACCGACGGCAGTGGGGAAAACCAATTTAAGT ATTCAGCTAGCCAAATCCTTAAACGCGGAAATTATCAGCGGAGATTCGATGCAGATTTATAAAGGGATGGATATTGG AACAGCTAAAATTACCGAACAGGAGATGGAGGGAGTGCCCCATCATCTGATTGACATTTTAGATCCCCAAGACTCTT TCTCTACTGCCGATTATCAAAGCTTAGTAAGAAATAAAATCAGCGAGATTGCAAATAGAGGAAAGCTTCCGATGATT GACGGCGGTACAGGGCTTTATATACAATCTGAGCTTTACGATTATACATTTACGGAAGAGGCAAATGATCCCGTGTT TCGAGAGAGCATGCAAATGGCTGCTGAGCGGGAAGGCGCTGACTTTCTTCATGCCAAACTTGCTGCAGCAGATCCCG AGGCAGCAGCTGCGATTCATCCGAATAATACAAGAAGAGTCATTCGCGCACTGGAAATTTTACATACGTCCGGAAAA ACGATGTCCCAGCATTTGAAGGAACAAAAACGAGAACTTCTGTACAATGCAGTGTTAATTGGCCTGACAATGGATAG AGACACGCTTTACGAAAGAATTAATCAGCGGGTCGATTTGATGATGCAGTCAGGCCTTCTTCCGGAAGTGAAACGCT TATACGACAAGAACGTGAGAGACTGTCAATCAATACAGGCGATAGGCTATAAAGAGCTGTATGCATATTTTGACGGT TTTGTGACACTTTCCGATGCTGTCGAACAGCTAAAGCAGAACTCGAGGCGGTATGCGAAACGCCAGCTGACGTGGTT TCGCAACAAAATGCAGGTCACATGGTTCGATATGACACCGCCTGTTGATATGGAGCTGAAAAAAAAGGAAATTTTCA CACATATAGCAGGAAAACTCGAACTTTAA(SEQ ID NO 15)ATGAAACCGATTAATATTCAGGATCAGTTTTTGAATCAAATCCGGAAAGAAAATACGTATGTCACTGTT TTTTTGCTGAACGGCTTTCAGTTGCGGGGCCAGGTGAAAGGCTTTGATAACTTTACCGTATTGTTGGAATCGGAAGG TAAGCAGCAGCTTATATATAAACATGCGATCTCAACGTTTGCGCCGCAAAAAAACGTCCAGCTTGAACTCGAATAG( SEQ ID NO 17)本发明还涉及与相应野生型启动子活性相比已经突变为启动子活性提高的启动 子序列,导致YmaH蛋白质的过表达。因此,可以理解限定SigA和SigH启动子的序列的 变体可以用于本发明的构建体。用于在杆菌属物种中制备启动子变体的方法为本领域所 公知(参见,例如 Helmann 等人,2002,RNA polymerase and sigma factors, H 289-312 页,出自 A. L. Sonenshein, J. A. Hoch 和 R. Losick(编著),Bacillus subtilis and itsclosestrelatives :from genes to cells, American Society for Microbiology, Washington,D. C.))。这并不意味着本发明限制为任何具体的启动子,因为本领域技术人员 已知的任何适宜启动子都可以用于本发明。然而,在一些实施方式中,启动子是枯草芽孢杆 菌sigH启动子,而在其他实施方式中,启动子是枯草芽孢杆菌SigA启动子。在进一步的实 施方式中,sigH和sigA启动子用于实现YmaH蛋白质的过表达。在一些实施方式中,本发明的多核苷酸构建体还包含必需的核糖体结合位点以保 证ymaH RNA转录物的最优翻译。在一些实施方式中,上述多核苷酸构建体包含miaA基因 的核糖体结合位点(RBS)序列(AAGAGAG;SEQ ID NO :21),而在其他实施方式中,多核苷酸 构建体包含ymaH基因的RBS序列(GGAGG ;SEQ ID NO 22)。在另外的实施方式中,多核苷 酸构建体包含miaA和ymaH基因的核糖体结合位点序列。在一些实施方式中,本发明提供 了在ymaH编码序列上游具有启动子和核糖体结合位点序列的构建体。本发明并不限于此 处公开的核糖体结合位点序列,因为还包括已经突变了来提高ymaH基因表达水平的任何 适宜的核糖体结合位点序列。获得在杆菌中提高基因表达的突变核糖体结合序列的方法 为本领域所公知。例如,Band和Henner通过修饰RBS以得到与16S rRNA更牢固的碱基配 对,而成功地提高了干扰素在枯草芽孢杆菌中的表达水平(Band,L.和D. J. Hermer,DNA 3 17-21[1984])。枯草芽孢杆菌中天然产生的YmaH蛋白质是一个73个氨基酸的蛋白质(SEQ ID NO :4),由一个219个碱基对(包括终止密码子是222)的多核苷酸(EMBL初级登录号 Z99113 ;SEQ ID NO 17)编码。MKPINIQDQFLNQIRKENTYVTVFLLNGFQLRGQVKGFDNFTVLLESEGKQQLIYKHAISTFAPQKNVQ LELE(SEQ ID NO 4)因此,在一些实施方式中,编码YmaH的多核苷酸构建体序列是发现于野生型枯草 芽孢杆菌菌株168的基因组中的天然存在的多核苷酸序列(SEQ ID NO :4)。本发明还包括 变体YmaH蛋白质,包括通过删除(即截短)、添加或取代在天然蛋白的一个或多个位点上 的一个或多个氨基酸从野生型蛋白衍生来的变体YmaH蛋白质。这种删除、添加和取代的方 法为本领域技术人员所公知。例如,多肽的氨基酸序列变体可以通过在编码天然目的蛋白 质的克隆的DNA序列中突变来制备。诱变和核苷酸序列改变的方法为本领域所公知(参 见,例如 Kunkel (1985) Proc. Natl. Acad. Sci. USA 82 488492 ;Kunkel 等人(1987)Methods Enzymo 1. 154 =367382 ;U. S. Pat. No. 4,873, 192 ;以及其中引用的参考文献,通过引入本申 请作为参考)。在构建目的蛋白质的变体时,进行对编码该变体的核苷酸序列的修饰,从而 变体继续具有所需的活性。技术人员能够理解,由于遗传密码的简并性,有多种修饰的多核 苷酸都编码YmaH蛋白质。在本发明一些其他的实施方式中,提供了具有与SEQ ID N0:17的 多核苷酸序列具有至少约70%序列同一性、至少约75%序列同一性、至少约80%序列同一 性、至少约85 %序列同一性、至少约90 %序列同一性、至少约92 %序列同一性、至少约95 % 序列同一性、至少约97%序列同一性、至少约98%序列同一性或至少约99%序列同一性的 核苷酸序列的多核苷酸。在其他实施方式中,本发明的多核苷酸构建体包括与枯草芽孢杆菌菌株168的 YmaH编码序列类似的YmaH编码序列。该菌株的基因组,包含在一个4215kb的基因组 中,已经被很好表征了(参见Kunst等人,Nature390 249-256[1997];和Henner等人,Microbiol. Rev. ,44 :57_82 [1980])。在一些实施方式中,本发明的多核苷酸构建体包括编 码YmaH蛋白质的多核苷酸序列,该YmaH蛋白质与YmaH蛋白质的野生型形式的氨基酸序列 具有至少约65%氨基酸序列同一性、至少约70%氨基酸序列同一性、至少约75%氨基酸序 列同一性、至少约80%氨基酸序列同一性、至少约85%氨基酸序列同一性、至少约90%氨 基酸序列同一性、至少约92%氨基酸序列同一性、至少约95%氨基酸序列同一性、至少约 97%氨基酸序列同一性、至少约98%氨基酸序列同一性和至少约99%的氨基酸序列同一 性,而且与野生型多肽(SEQ ID NO :4)相比具有相当的或改善的增强目的蛋白质在宿主细 胞中生产的能力,而且保持了增强目的蛋白质在宿主细胞中的表达的能力。在另外的实施 方式中,本发明提供了包含与野生型杆菌序列的基因SEQ ID NO :17同源、直向同源或共生 同源,而且保持了增强目的蛋白质生产的能力的多核苷酸序列的多核苷酸构建体。本发明还包括其中包含编码在结构和/或功能上相似而相关的YmaH蛋白质的编 码序列的多核苷酸构建体。在一些实施方式中,这些蛋白质来自不同的属和/或种,包括 生物纲间的差异(例如细菌蛋白和真菌蛋白)。在一些实施方式中,这些蛋白质来自不同 的属和/或种。在另外的实施方式中,相关的蛋白质来自相同的种。实际上,本发明并不 是意图限制为来自任何具体来源的相关蛋白。此外,术语“相关蛋白”包括三级结构同源 物和一级序列同源物(例如本发明的YmaH)。例如,本发明包括下列同源物,其包括但不 限于下列 YmaH 蛋白例如来自大肠杆菌(HFQ_EC0LI)、Shighella flexneri (HFQ_SHIFL)、 鼠伤寒沙门氏菌(Salmonellatyphimurium) (HFQ_SALTY)、小肠结肠炎耶尔森菌(Yersinia enterocolitica) (HFQ_YEREN)、鼠疫耶尔森氏杆菌(Yersinia pestis) (HFQ_YERPE)、 胡萝卜软腐欧文氏菌(Erwinia carotovora) (HFQ_ERWCA)、流感嗜血菌(Haemophilus influenzae) (HFQ_HAEIN)、多杀巴斯德菌(Pasteurellamultocida) (HFQ_PASMU)、霍乱弧菌 (Vibrio cholerae) (HFQ_VIBCH)、铜绿假单胞菌(Pseudomonas aeruginosa) (HFQ_PSEAE)、 地毯草黄单胞菌(Xanthomonas axonopodis) (HFQ_XANAC)、野油菜黄单胞菌(Xanthomonas campestris) (HFQ_XANCP)、苛养木杆菌(Xylellafastidiosa) (GSQ_XYLFA)、脑膜炎奈瑟氏 球菌(Neisseria meningitidis) (HFQ_NEIMA)、青枯雷尔氏菌(Ralstonia solanacearum) (HFQ_RALS0)、根癌土壤杆菌(Agrobacterium tumefaciens) (HFQ_AGRTS)、马尔他布鲁杆 菌(Brucella melitensis) (HFQ_BRUME)、百脉根根瘤菌(Rhizobium loti) (HFQ_RHILO)、 茎瘤固氮根瘤菌(Azorhizobium caulinodans) (HFQ_AZ0CA)、新月柄杆菌(Caulobacter crescentus) (HFQ_CAUCR)、Aquifex melitensis (HFQ_AQUAE)、海栖热胞菌(Thermotoga maritime) (HFQ_THEMA)、丙酮丁醇梭菌(Clostridium acetobutylicum) (HFQ_CL0AB)、产气荚膜梭菌
(Clostridium perfringens) (HFQ_CL0PE)、 Bacillus halodurans (HFQ_BACHD), 枯草芽孢杆菌(HFQ_BACSU)、腾冲嗜热杆菌(Thermoanaerobacter tengcongensis) (HFQ_ THETN)、金黄色葡萄球菌(S. aureaus) (Q99UG9)和 M. jannasci (Q58830) (Sauter 等人, NucleicAcids Res. 31 :4091_4098 [2003])的 YmaH。相关的(和衍生的)蛋白质包括变体YmaH蛋白质。在一些优选的实施方式中,变 体蛋白质会有少数几个氨基酸残基不同于亲本蛋白质,变体蛋白质之间也会有少数几个氨 基酸残基相互不同。不同的氨基酸残基数量可以是一个或多个,优选为约1、2、3、4、5、10、 15、20、30、40、50或更多个氨基酸残基。在一些优选的实施方式中,变体间不同氨基酸的数 量在约1至约10之间。在一些特别优选的实施方式中,相关蛋白和特别的变体蛋白包含至少约70%、约75%、约80%、约85%、约90%、约95%、约97%、约98%或约99%的氨基酸 序列同一性。本领域已知几种方法适用于产生本发明的YmaH蛋白的变体,包括但不限于 点饱和诱变、扫描诱变、插入诱变、随机诱变、定点诱变和定向进化,以及各种其他重组的方法。野生型和突变蛋白质的表征通过任何适宜的方法进行,优选基于目的性质的评价 进行。例如,预期可以使用能够增强目的蛋白质生产的YmaH蛋白质。在某些实施方式中,本发明的重组多核苷酸包含可以是为YmaH蛋白质在所用 的宿主细胞中表达而密码子优化的多核苷酸序列。由于本领域公知密码子使用表(列 出了各个密码子在许多细胞中的使用,参见例如Nakamura等人,Nucl. Acids Res. ,28 292[2000])或容易推导出,产生要表达的蛋白质的氨基酸序列的这种核酸很容易设计出 来。在一些实施方式中,密码子优化的序列包括编码与SEQ ID NO :4有至少约70%同一性 的YmaH蛋白质的多核苷酸。ymaH 载体本发明提供了包含本发明的多核苷酸构建体的载体。将这些载体引入宿主细胞中 以过表达YmaH蛋白质。在一些实施方式中,多肽的过表达是由于相应的YmaH编码多核苷酸的一个或多 个拷贝的表达,这些核苷酸存在于已经引入宿主细胞中的多拷贝/复制质粒中。因此,在 一些实施方式中,本发明提供了包含整合到载体中的多核苷酸构建体的载体。在一些实施 方式中,载体是多拷贝/复制质粒载体,其形成在宿主细胞中过表达YmaH的染色体外自主 复制遗传成分。通常,载体是质粒载体,其携带能够使含有该质粒的宿主细胞易于选择的 可选择性标记基因。在宿主细胞中自主复制的载体包括含有复制起点的载体,复制起点使 该载体能够在杆菌细胞中自主复制。细菌复制起点的例子是允许在大肠杆菌中复制的质 粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在杆菌中复制的质粒pUBllO、 pC194、pE194、pTA1060和ρΑΜβ 1的复制起点。复制起点可以是具有使其功能在杆菌细胞 中为温度敏感性的突变的复制起点(参见例如Ehrlich,Proceedings of the National Academy of Sciences USA 75 :1433[1978])。如上所述,在本发明的一些实施方式中,编码YmaH蛋白质的多核苷酸通过能够在 宿主细胞中复制的表达载体被引入到宿主细胞中。本领域已知的适用于杆菌的适宜复制 和整合质粒参见例如 Harwood 和 Cutting (编著),Molecular BioloRical Methods for Bacillus,.John ffiley&Sons, [1990],特别是第3章;适用于枯草芽孢杆菌的复制质粒包括 列于第92页的那些。在一些实施方式中,YmaH多肽的过表达是由于编码YmaH多核苷酸的表达而产生, 其至少一个拷贝整合到宿主细胞基因组中。因此,在一些实施方式中,当载体引入宿主细胞 中时,载体被整合如基因组中,并与其整合入的基因组一起复制。多拷贝的ymaH基因可以 在几个位点整合入宿主细胞基因组中。或者,带有编码YmaH和可选择性标记(例如抗生素 抗性标记,如编码氯霉素乙酰基转移酶的基因)的序列的可扩增表达盒可以通过单次交换 事件整合到基因组中,然后通过用浓度升高的适宜抗生素(如氯霉素)激发转化的宿主细 胞而扩增。在其他实施方式中,本发明提供了整合到整合型载体中的多核苷酸构建体。在一些实施方式中,整合到整合型载体中的本发明多核苷酸构建体靶向杆菌宿主细胞的染色体 序列,以形成包含稳定串联整合的多载体拷贝的改良的宿主细胞。整合到整合型载体中的 多核苷酸构建体通常包含提供给细胞抗生素制剂抗性的可选择性标记基因,并使该整合入 的ymaH构建体能够扩增。可以出现向单个位点的串联整合,也可以出现单拷贝和两个位点 的整合。不论多核苷酸构建体是整合入载体中,还是在质粒DNA不存在的情况下使用,多核 苷酸构建体都用于使用任何本领域已知的适宜方法转化宿主细胞。涉及质粒构建体和质粒转化入细菌宿主细胞的将DNA引入至杆菌细胞的方法为 本领域所公知。在一些实施方式中,将质粒从大肠杆菌中分离出来,随后转化入杆菌中。然 而,使用诸如大肠杆菌的间插微生物并不是必需的,在一些实施方式中,DNA构建体或载体 直接引入杆菌宿主中。本领域技术人员很清楚将多核苷酸序列引入杆菌细胞的适宜方法(参见,例 如 Ferrari 等人,"Genetics,,自 Harwood 等人(编著),Bacillus, Plenum Publishing Corp. [1989],第 57-72 页;Saunders 等人,J. Bacteriol.,157 :718_726[1984] ;Hoch 等人,J. Bacteriol. ,93 1925-1937 [1967] ;Mann 等人,Current Microbiol. , 13 131-135[1986];和 Holubova, Folia Microbiol. ,30 97[1985] ;Chang 等人,Mol. Gen. Genet.,168 :11-115[1979] ;Vorobjeva 等人,FEMS Microbiol. Lett. ,7 261-263[1980]; Smith 等人,Appl. Env. Microbiol.,51 :634 [1986] ;Fisher 等人,Arch. Microbiol.,139 213-217 [1981];和 McDonald,J. Gen. Microbiol.,130 :203[1984])。实际上,已知诸如转化 的这类方法,包括原生质体转化和中板集合、转导和原生质体融合,并且这类方法适用于本 发明。转化的方法特别优选用于将本发明提供的DNA构建体引入至宿主细胞中。除了常用的方法,在一些实施方式中,宿主细胞被直接转化(即,在引入宿主细胞 之前不使用中间细胞来扩增(或者以其它方式加工)DNA构建体)。DNA构建体向宿主细 胞中的引入包括本领域已知的将DNA引入宿主细胞,而不插入到质粒或载体中的那些物理 和化学方法。这些方法包括但不限于,电穿孔、裸DNA的插入或脂质体等。在另外的实施方 式中,DNA构建体与质粒共转化,而不是插入到质粒中。在进一步的实施方式中,用本领域 已知的方法从改变的杆菌菌株删除可选择性标记(参见Stahl等人,J. Bacteriol.,158 411-418[1984];和 Palmeros 等人,Gene 247 :255_264[2000])。本领域已知的转化杆菌的方法包括诸如质粒标记挽救转化等方法,其包括携 带有部分同源的固有质粒的感受态细胞对供体质粒的摄取(Contente等人,Plasmid 2 555-571 [1979] ;Haima 等人,Mol.Gen. Genet.,223 185-191[1990] ;Weinrauch 等 人,J. Bacteriol. , 154 1077-1087 [1983];和 Weinrauch 等人,J. Bacteriol. , 169 1205-1211 [1987])。在该方法中,在模拟染色体转化的过程中,进入的供体质粒与固有的 “辅助”质粒的同源区重组。涉及用原生质体转化进行转化的其他方法为本领域所公知(参见,例如Chang和 Cohen, Mol. Gen. Genet.,168 :111_115[1979] ;Vorobjeva 等人,FEMS Microbiol. Lett., 7 261-263[1980] ;Smith 等人,Appl. Env. Microbiol.,51 634[1986] ;Fisher 等人,Arch. Microbiol.,139 :213_217[1981] ;McDonald[1984]J. Gen. Microbiol.,130 203[1984]; 和 Bakhiet 等人,49 :577[1985])。并且,Mann 等人,(Mann 等人,Curr. Microbiol., 13 131-135[1986])记载了杆菌原生质体的转化,Holubova (Holubova, Microbiol. ,30 97[1985])记载了利用含DNA的脂质体将DNA引入原生质体的方法。在一些实施方式中,使 用标记基因来指示目的基因是否存在于宿主细胞中。在一些实施方式中,包含在本发明的 载体中的ymaH多核苷酸序列编码具有SEQ ID NO 4的YmaH蛋白质或其变体。除了这些方法,在其他实施方式中,宿主细胞被直接转化。在“直接转化”中,在引 入宿主(即杆菌)细胞之前,不使用中间细胞扩增或以其它方式加工修饰的多核苷酸。修饰 的多核苷酸向宿主细胞中的引入包括本领域已知的将修饰的多核苷酸引入宿主细胞,而不 插入到质粒或载体中的那些物理和化学方法。这样的方法包括但不限于利用感受态细胞, 以及利用“人工方法”,例如氯化钙沉淀、电穿孔等将DNA引入细胞中。因此,本发明可以使 用裸DNA、脂质体等。在另外的实施方式中,该修饰的多核苷酸与质粒共转化,而不插入到 质粒中。在一些实施方式中,本发明提供含有有效连接到sigA启动子(例如SEQ ID NO 2 和3)的编码YmaH蛋白质的多核苷酸的载体。在其他实施方式中,该载体含有有效连接到 sigH启动子(例如SEQ ID NO 1)的编码YmaH的多核苷酸。在又一些实施方式中,载体包 含多核苷酸构建体,该构建体包含YmaH编码序列、sigA启动子和sigH启动子(例如SEQ ID NO 13)。在一些实施方式中,用非整合型载体过表达ymaH。在一些实施方式中,在其中一个 或多个染色体基因已经得到修饰(例如degU)和/或从杆菌基因组中删除掉(例如nprE) 的宿主细胞中过表达ymaH。在一些进一步的实施方式中,一个或多个天然的染色体区域已 经得到修饰和/或已经从相应的野生型杆菌宿主基因组中删除掉。在一些优选的实施方 式中,本发明提供用于提高至少一种目的蛋白质在杆菌中的表达和/或分泌的方法和组合 物。ymaH宿主细胞本发明提供了已经遗传改造以过表达ymaH且具有增强的生产目的蛋白质能力的 改良的宿主细胞。具体来讲,本发明涉及革兰氏阳性微生物的改良的宿主细胞,例如过表达 ymaH的杆菌物种。在一些实施方式中,ymaH在野生型微生物中过表达,而在其他实施方式 中,YmaH在改变的宿主细胞中过表达。在一些实施方式中,改变的宿主细胞能够以高于其 野生型前体的水平生产目的蛋白质。在一些特别优选的实施方式中,YmaH在过度生产的经 改变亲本宿主中的过表达进一步提高了生产目的蛋白质的水平。在一些实施方式中,在改 变的亲本宿主中YmaH的过表达诱导了生产目的蛋白质的时间早于相应未改变亲本宿主中 蛋白质的生产时间。用本文所述的本发明的载体和构建体得到宿主细胞中ymaH的过表达。 因此,在一些实施方式中,本发明提供了改良的宿主细胞,该细胞通过用载体转化野生型或 改变的宿主细胞来得到,该载体包含有效连接到sigA和/或sigH启动子的YmaH编码序列。 特别地,本发明的改良的宿主细胞能够生产目的蛋白质,在一些实施方式中,该改良的宿主 细胞包含编码YmaH(如SEQID NOS :1,2,3或13)的多核苷酸构建体。在一些实施方式中,本发明提供了在宿主细胞中过表达ymaH以提高目的蛋白质 产量的方法。目的蛋白质可以与宿主同源或异源。在一些实施方式中,目的蛋白质是分泌的 多肽、特别是酶,包括但不限于淀粉分解酶、蛋白水解酶、溶细胞的酶、氧化还原酶和植物细 胞壁降解的酶。在进一步的实施方式中,这些酶包括但不限于淀粉酶、蛋白酶、木聚糖酶、 脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化 氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳糖苷酶和壳多糖酶。在更进一步的实施方式中,目的蛋白质是激素、细胞因子、生长因子、受体、 疫苗、抗体等。这并不意味着本发明限于任何具体的蛋白质,在一些实施方式中,目的蛋白 质是蛋白酶。在一些实施方式中,宿主细胞是杆菌属物种、链霉菌属物种、埃希氏菌属物种或曲 霉菌属物种。在其他实施方式中,目的蛋白质是杆菌属的宿主细胞生产的蛋白酶(参见, 例如美国专利No. 5,264,366、美国专利No. 4,760,025和RE 34,6060)。在一些实施方式 中,目的杆菌菌株是嗜碱性的杆菌。已知许多种嗜碱性的杆菌菌株(参见,例如美国专利 No. 5,217,878 ;和 Aunstrup 等人,Proc IV IFS =Ferment. Tech. Today, 299-305 [1972])。特 别感兴趣的另一类型的杆菌菌株是工业杆菌菌株的细胞。工业杆菌菌株的例子包括但不限 于地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、克劳氏芽孢杆菌和解淀粉芽孢杆菌。在 另外的实施方式中,杆菌宿主菌株选自由地衣芽孢杆菌、枯草芽孢杆菌、迟缓芽孢杆菌、短 芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆 菌、灿烂芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌和巨大芽孢杆菌以及杆菌属中的其他微 生物组成的组中。在优选的实施方式中,使用枯草芽孢杆菌细胞。在一些实施方式中,工业宿主菌株选自由杆菌属物种的非重组菌株、天然存在的 杆菌菌株的突变体和重组的杆菌宿主菌株组成的组中。优选地,宿主菌株是重组的宿主 菌株,其中编码目的多肽的多核苷酸已经预先引入到该宿主中。进一步优选的宿主菌株是 枯草芽孢杆菌宿主菌株,特别优选的是重组的枯草芽孢杆菌宿主菌株。已知许多枯草芽 孢杆菌菌株,其适于本发明(参见,例如1A6 (ATCC 39085),168 (1A01),SB19, W23, Ts85, B637,PB1753 至 PB1758,PB3360,JH642,1A243(ATCC 39,087), ATCC 21332,ATCC 6051, MI113,DE100 (ATCC 39,094),GX4931, PBT 110,和 PEP211 菌株;Hoch 等人,Genetics, 73 215-228[1973];美国专利 No. 4,450,235 ;美国专利 No. 4,302,544 ;EP 0134048)。枯草芽 孢杆菌作为表达宿主的用途为本领域所公知(参见Palva等人,Gene, 19 :81_87[1982]; Fahnestock 和 Fischer,J. Bacteriol.,165 796-804[1986];和 Wang 等人,Gene 69 39-47[1988])。其中特别感兴趣的宿主细胞是生产工业蛋白酶的杆菌的细胞。利用这些菌株,再 通过利用本发明提供的改良的杆菌菌株,高效率的蛋白酶生产被进一步增强。生产工业蛋 白酶的杆菌菌株提供了特别优选的表达宿主。在一些实施方式中,这些菌株在本发明中的 使用提供了蛋白酶产量的进一步增加。如上所述,有两大类型的蛋白酶通常被杆菌属分泌, 称为中性的(或“金属蛋白酶”)和碱性的(或“丝氨酸”)蛋白酶。如上所述,枯草杆菌 蛋白酶是用于本发明的优选的丝氨酸蛋白酶。已经鉴定出并测序了多种杆菌属枯草杆菌 蛋白酶,例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN'、枯草杆菌蛋白酶CarlsbergjS 草杆菌蛋白酶DY、枯草杆菌蛋白酶147、枯草杆菌蛋白酶309(参见,例如EP 414279 B5WO 89/06279 ;和 Stahl 等人,J. Bacteriol.,159 :811_818[1984])、迟缓芽孢杆菌枯草杆菌蛋 白酶和克劳氏芽孢杆菌枯草杆菌蛋白酶(J C van der Laan, G Gerritse, LJ Mulleners, R A van der Hoek 禾口 W J Quax,Appl Environ Microbiol. 57 :901_909[1991])。在本发明的一些实施方式中,杆菌宿主菌株生产突变的(例如变体)蛋白酶。许 多参考文献提供了变体蛋白酶的例子和参考(参见例如Μ^ΘΛΟ ΤΟ ;W0 99/20726 ;WO 99/20769 ;WO 89/06279 ;RE 34,606 ;美国专利 No. 4,914,031 ;美国专利 No. 4,980,288 ;美国专禾Ij No. 5,208,158 ;美国专利No. 5,310,675 ;美国专利No. 5,336,611 ;美国专利 No. 5,399,283 ;美国专利No. 5,441,882 ;美国专利No. 5,482,849 ;美国专利No. 5,631,217 ; 美国专禾Ij No. 5,665,587 ;美国专利No. 5,700,676 ;美国专利No. 5,741,694 ;美国专 利No. 5,858,757 ;美国专利No. 5,880,080 ;美国专利No. 6,197,567 ;和美国专利 No. 6,218,165)。在一些实施方式中,目的蛋白质在宿主细胞中的表达被aprE基因的aprE启动 子驱动,枯草芽孢杆菌枯草杆菌蛋白酶从该基因天然转录。aprE基因被sigma Α(σΑ)因 子转录,其表达被几个调节子高度控制,例如:DegU/DegS, AbrB, Hpr和SinR(Valle和 Ferrari (1989)自Smith I, Slepecky RA, Setlow P(编著)Regulation of Procaryotic Development. American Society for Microbiology, Washington, DC 第 131-146 页), 而且共有的 Sigma A 启动子已经鉴定为 TGGGTCTTGACAAATATTATTCCATCTATTACAATAAATT CACAGA(SEQ ID NO 23 ;US 2003014846 ;Helman 等人,1995,Nucleic Acid Research, Vol. 24,第2351-2360页)。在一些实施方式中,宿主细胞包含本身是野生型aprE启动子 TGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGA(SEQ ID NO 24 ;美国专利申请公开 No. 20030148461)的 aprE 启动子。在另外的实施方式中,宿主细胞对目的蛋白质的表达被枯草芽孢杆菌aprE启 动子的突变体驱动。在一些实施方式中,本发明提供了杆菌宿主细胞,其含有有效连接 到编码目的蛋白质的多核苷酸序列的突变aprE启动子。因此,本发明包括从突变aprE 启动子表达目的蛋白质的宿主细胞。突变aprE启动子的一个例子是具有序列TGGGTC TTGACAAATATTATTCCATCTAT TACAAT AAATTCACAGA(SEQ ID NO 25)的突变的 aprE 启动子, 其记载于美国专利申请公开No. 20030148461中。此处引用的任何目的蛋白质(例如杆菌 属枯草杆菌蛋白酶)都可以从aprE启动子转录。在一些实施方式中,本发明提供了改良的 杆菌宿主细胞,该宿主细胞能够从aprE启动子表达目的蛋白质。在一些实施方式中,该改 良的宿主细胞是能够由aprE启动子驱动表达蛋白酶的改良的枯草芽孢杆菌宿主细胞。在 一些实施方式中,aprE启动子包括aprE启动子调节元件和/或aprE转录前导序列,而在 其他实施方式中,aprE启动子不包括aprE启动子调节元件和/或aprE转录前导序列。除了 aprE启动子,本发明还包括由宿主细胞表达目的蛋白质的组合物和方法,其 中编码目的蛋白质的基因的表达由适宜驱动目的基因转录的任何启动子驱动,只要该启动 子包含aprE基因的转录前导序列。在另一个实施方式中,杆菌宿主是在degU、degS、degR和/或degQ基因中至 少一个中有突变或删除的杆菌属物种。优选该突变在degU基因中,更优选该突变是 degU (Hy) 32 (参见,Msadek 等人,J. Bacteriol.,172 :824_834 [1990];和 Olmos 等人,Mol. Gen. Genet.,253 :562_567 [1997])。最优选的宿主菌株是带有degU (Hy) 32突变的枯草芽抱 杆菌。在进一步的实施方式中,杆菌宿主在scoC4 (参见Caldwell等人,J. Bacteriol.,183 7329-7340 [2001])和 spoIIE (参见 Arigoni 等人,Mol. Microbiol. ,31 1407-1415 [1999]) 中包含突变或删除。在一些实施方式中,这些突变单独存在,而在其他实施方式中,存在这 些突变的组合。在一些实施方式中,本发明的改良的杆菌获得自已经在一个或多个上述基 因中包括突变的杆菌宿主菌株。在一些实施方式中,具有增强的生产目的蛋白质能力的改 变的杆菌宿主选择为本发明的宿主细胞。在一些实施方式中,改变的杆菌宿主细胞具有增强的生产蛋白酶的能力。培养方法本发明提供了在改良的杆菌细胞中生产目的蛋白质的方法,该改良的杆菌细胞能 够通过如下步骤过表达ymaH 培养能够生产目的蛋白质的该改良的细胞,和在对于表达该 目的蛋白质适宜的生长条件下生长该细胞。在一些实施方式中,本发明的宿主细胞和改良 的宿主细胞在常规培养基中培养。适宜的特定培养条件,例如温度、PH等为本领域技术人 员所公知。另外的优选的培养条件为本领域技术人员所公知,并记载在各种参考出版物上。在一些实施方式中,所述改良的宿主细胞生产的目的蛋白质被限制在宿主细胞的 胞内环境中,而在其他实施方式中,宿主细胞生产的目的蛋白质被分泌到细胞外空间(即 培养基中)。因此,在一些实施方式中,目的蛋白质可以用本领域已知的方法通过裂解宿主 细胞并回收目的蛋白质,从表达其的细胞的内环境中回收。在其他实施方式中,改良的宿主 细胞在适宜表达的条件下培养,并从细胞培养物中回收目的蛋白质。本发明过表达ymaH的 改良宿主细胞生产的目的蛋白质被分泌到培养基中。在一些实施方式中,用常规程序从培 养基中回收细胞生产的目的蛋白质(例如蛋白酶),该常规程序包括但不限于,用离心或过 滤从培养基中分离宿主细胞,用盐(例如硫酸铵)沉淀上清或滤出液中的蛋白质性质的成 分、色谱纯化(例如离子交换、凝胶过滤、亲和层析等)。因此,任何适用于回收本发明的蛋 白酶的方法都可以用于本发明。实际上,不应理解为本发明限于任何具体的纯化方法。在一些实施方式中,其他重组的构件将编码目的蛋白质的异源或同源多核苷酸序 列与编码促进可溶性蛋白纯化的多肽结构域的多核苷酸序列连接起来(Kroll DJ等人, DNA Cell Biol 12 :441_53[1993])。这样的纯化促进结构域包括但不限于金属螯合肽, 例如组氨酸-色氨酸模块,允许在固定化的金属上纯化(Porath,Protein Expr Purif 3 263-281 [1992]);蛋白A结构域,允许在固定的免疫球蛋白上纯化;和用于FLAGS延伸/亲 和纯化系统中的结构域(Immimex公司,华盛顿西雅图)。在纯化结构域和上述异源蛋白质 之间包括的可裂解接头序列(例如因子XA或肠激酶(加州圣地亚哥Invitrogen)也可以 用于促进纯化。在一些实施方式中,在允许目的蛋白质(例如蛋白酶)表达的条件下,本发明转化 的宿主细胞培养于适宜的营养介质中,然后从培养物中回收得到的蛋白酶。用来培养细胞 的培养基包括用于生长宿主细胞的任何常规培养基,例如基本培养基或含有合适添加剂的 复合培养基。适宜的培养基可获自商品供应商或可根据公开的制剂配方(例如按美国典型 培养物保藏中心的目录所述)制备。在一些实施方式中,宿主细胞在分批发酵、分批补料发 酵或连续发酵的条件下培养。经典的分批发酵方法使用封闭的系统,其中培养基在开始发 酵程序之前制备,培养基接种了所需的微生物,发酵发生时没有任何成分会后续添加到培 养基中。在某些情况下,在分批发酵方法过程中,改变生长培养基的PH和氧气含量,但不改 变碳源含量。分批发酵系统的代谢产物和细胞生物量不断改变,直至发酵结束。在分批发 酵系统中,细胞通常会经过一个静态的迟滞期后发展到高度生长的对数期,最终会到达静 止生长期,在静止生长期生长率减小或停止。如果不处理的话,静止生长期的细胞最终会死 亡。一般意义上,对数期的细胞生产最多的蛋白。对标准分批发酵系统的改变是“分批补料发酵”系统。在该系统中,营养物质(例 如碳源、氮源、O2和通常的其他营养素)仅仅当它们在培养基中的浓度落至阈值以下时才加入。当分解代谢产物阻遏倾向于抑制细胞的新陈代谢、而且想要在培养基中含有限定量的 营养物时,可使用分批补料发酵系统。分批补料发酵系统中实际营养物质浓度的测量是基 于可测量因素(例如PH、溶解氧和诸如CO2等废气的分压)的改变而估计的。分批发酵和 分批补料发酵为本领域常用而且公知。连续发酵是一个开放的系统,其中限定的培养基被连续地加入到生物反应器中, 同时等量的控制条件(conditioned)的培养基被取出进行加工处理。连续发酵通常保持培 养物在恒定的高密度,其中细胞主要处于对数生长期。连续发酵使其可以调节影响细胞生长和/或最终产物浓度的一个因素或任何数 量的因素。例如,在一些实施方式中,诸如碳源和氮源的限制性营养物被保持在固定的比 率,而所有其他参数可以调节。在其他系统中,许多影响生长的因素是连续变化的,而通过 培养基浊度测量的细胞密度保持恒定。连续发酵系统致力于保持稳定状态的生长条件。因 此,由于培养基的去除造成的细胞损失可以被发酵中的细胞生长率所平衡。为连续发酵过 程调节营养物和生长因子的方法以及最大化产品形成率的技术为本领域技术人员所公知, 可以用于根据本发明的方法生产目的蛋白质(例如蛋白酶).如上所述,与相同蛋白质在相应的野生型或改变的亲本宿主细胞中的产量水平相 比,宿主细胞的ymaH的过表达增强了目的蛋白质的产量水平。在本发明的一些实施方式 中,杆菌宿主细胞中ymaH的过表达导致目的蛋白质的产量升高到其中不过表达ymaH的相 应细胞中得到的水平之上。在一些实施方式中,本发明提供了过表达YmaH的野生型或重组 的(改变的)的杆菌宿主细胞。在一些实施方式中,在相同的条件下生长时,与未改变的 亲本/前体杆菌细胞相比,重组的杆菌宿主细胞是已经改变为生产较高水平的蛋白酶的细 胞。本发明还包括,在比前体宿主细胞所需时间更短的时间内,在过表达ymaH的改良 细胞中生产目的蛋白质的方法。例如,本发明的改良的宿主细胞能够以比相应的未改良前 体宿主细胞高的水平和早的时间生产目的蛋白质。因此,在一些实施方式中,本发明提供了 生产目的蛋白质(例如蛋白酶)的方法,其生产水平比亲本宿主细胞的生产水平高,而且在 前体宿主细胞达到其最大表达水平所需时间的大约六分之一的时间,生产目的蛋白质达到 其最大表达水平。在其他实施方式中,改良的宿主细胞在前体宿主细胞达到其最大表达水 平所需时间的约五分之一、约四分之一、约三分之一或约二分之一的时间生产目的蛋白质 达到其最大表达水平。产量/活性的测定在一些实施方式中,本发明提供了在杆菌宿主细胞增强目的蛋白质表达的方法, 该方法通过如下步骤进行获得过表达ymaH的改良的杆菌宿主,将该改良的杆菌宿主在适 宜的生长条件下生长,以及使该宿主细胞以与前体宿主细胞相比增强了的水平生产目的蛋 白质。在一些实施方式中,该改良的杆菌细胞得自野生型杆菌细胞。在其他实施方式中,该 改良的杆菌细胞得自改变的宿主细胞。宿主细胞的目的蛋白质产量水平可以测定为所生产 的蛋白质的活性的函数。在一些实施方式中,增强目的蛋白质表达的方法使用改良的杆菌 宿主细胞进行,该改良的杆菌宿主细胞已经用编码YmaH而且有效连接到SigA和/或sigH 启动子的多核苷酸构建体转化。在一些实施方式中,上述多核苷酸构建体包含选自SEQ ID NOS :1,2,3和13的序列。在一些实施方式中,多核苷酸构建体存在于在杆菌细胞中复制的质粒上,而在其他实施方式中,多核苷酸构建体被整合到改良杆菌细胞的基因组中。如上所 述,改良的杆菌细胞能够生产目的蛋白质,所述目的蛋白质包括但不限于淀粉分解酶、蛋白 水解酶、溶细胞的酶、氧化还原酶和植物细胞壁降解酶的蛋白质。在进一步的实施方式中, 这些酶包括但不限于淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、 纤维素酶、半纤维素酶、酯酶、过氧化物酶、过氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡 萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳糖苷酶和壳多糖酶。在其他实施方式中,目的 蛋白质是激素、细胞因子、生长因子、受体、疫苗、抗体等。这并不意味着本发明限于任何具 体的蛋白质,在一些特别优选的实施方式中,目的蛋白质是蛋白酶。有本领域技术人员已知的各种检测方法用于进行本发明的宿主细胞生产的目的 蛋白质活性的检测和测量。具体来说,可获得用于测量蛋白酶活性的检测方法,该检测方 法基于酸可溶的肽从酪蛋白或血红蛋白的释放,测量为405nm处的吸光度,或用Folin法 用比色法检测(参见,例如Bergmeyer等人,“Methods of Enzymatic Analysis”第5卷, Peptidases, Proteinases and their Inhibitors, VerlaR Chemie,ffeinheim[1984])。一些其他的检测方法包括生色底物的溶解(参见,例如Ward,“Proteinases,” 自 Fogarty (编 著),Microbial Enzymes and BiotechnoloRY, Applied Science, London, [1983],第251-317页)。其他示例性检测方法包括但不限于,琥珀 酰-Ala-Ala-Pro-Phe-对-硝基苯胺检测方法(SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐检 测方法(TNBS检测方法)。本领域技术人员已知的许多另外的参考文献提供了适宜的方法 (参见,例如 Wells 等人,Nucleic Acids Res. 11 :7911_7925[1983] ;Christianson 等人, Anal. Biochem.,223 :119_129[1994];和 Hsia等人,Anal Biochem.,242 :221_227[1999])。 不应理解为本发明限于任何具体的检测方法。测定宿主细胞中目的蛋白质产量水平和检测表达的蛋白质的其他方式包括使用 特异性针对该蛋白质的多克隆或单克隆抗体进行的免疫测定法。例子包括酶联免疫吸附 试验(ELISA),放射免疫测定(RIA),荧光免疫分析(FIA)和荧光活化的细胞分选(FACS)。 但是,本领域技术人员已知其他方法,也可用于评价本发明的蛋白质(参见,例如Hampton 等人,SeroloRical Methods, A Laboratory Manual, APS Press, St. Paul, MN[1990];禾口 Maddox等人,J. Exp. Med. ,158 =1211 [1983]) 0在一些优选的实施方式中,本发明的宿主细 胞中目的蛋白质的产量高于相应的野生型或改变的宿主细胞中的蛋白质产量。如本领域所 公知,在适宜于表达和从细胞培养物中回收目的多肽的条件下保持和生长用本发明制备的 杆菌细胞。不应理解为本发明限于任何具体的检测方法。高于野生型或改变的亲本宿主细胞中相同蛋白酶的产量水平,本发明改良的宿主 细胞中蛋白酶产量水平的增强的一种测度可以测定为活性比。活性比可以表示为过表达 ymaH的宿主细胞产生的目的蛋白质的酶活性与没有过表达ymaH的相应宿主细胞产生的目 的蛋白质的酶活性之比。等于或大于1的比例说明,与相同的目的蛋白质在不过表达YmaH 的相应宿主细胞中生产的水平相比,过表达YmaH的宿主细胞生产的目的蛋白质是以相等 或更高的水平生产的。例如,活性比1.5说明,在相同的条件下生长时,目的蛋白质在过表 达ymaH的宿主细胞中的产量水平是相同目的蛋白质在没有过表达ymaH的相应宿主细胞中 生产的产量水平的1. 5倍(即,过表达ymaH的宿主细胞比没有过表达ymaH的相应宿主细胞 多生产了 50%的目的蛋白质)。在一些实施方式中,活性比是至少1、至少约1. 05、至少约1.1、至少约1. 2、至少约1. 3、至少约1. 4、至少约1. 5、至少约1. 6、至少约1. 7、至少约1. 8、 至少约1. 9或至少约2。在其他实施方式中,活性比为至少约2. 1、至少约2. 2、至少约2. 3、 至少约2. 4、至少约2. 5、至少约2. 6、至少约2. 7、至少约2. 8、至少约2. 9或至少约3。在又 一些其他的实施方式中,活性比是至少约3. 5、至少约4. 0或至少约5。在一些实施方式中, 希望活性比为1或更大。或者,本发明的改良的宿主细胞的蛋白酶产量水平可以关联为高于亲本宿主细胞 的产量水平的百分比增加。在本发明的方法中,改良的杆菌细胞优选比野生型或改变的亲 本宿主细胞多生产至少约25%的多肽,更优选至少约50%、更优选至少约75%、更优选至 少约100%、进一步优选至少约200%、最优选至少约300%、进一步最优选至少约400%的 多肽。因此,在一些实施方式中,与不过表达ymaH的宿主细胞中相同目的蛋白质产量相比, 过表达ymaH的宿主细胞中的目的蛋白质产量增加了至少约0. 5%、约1. 0%、约1. 5%、约 2.0%、约 2. 5%、约 3. 0%、约 4. 0%、约 5. 0%、约 8. 0%、约 10%、约 15%、约 20%、约 25%、 约30 %、约40 %、约50 %、至少约60 %、至少约70 %、至少约80 %、至少约90 %、至少约 100%或更多。在其他实施方式中,与不过表达ymaH的宿主细胞中相同目的蛋白质产量相 比,过表达ymaH的宿主细胞中的目的蛋白质产量增强了至少约110%、约120%、约130%、 约140%、约150%、约160%、约170%、约180%、约190%和高达至少约200%,或更多。为了进一步说明本发明及其优势,给出了下列具体实施例。应理解的是,这些实施 例仅仅是为了进一步说明本发明而提供,而不应理解为以任何方式对其范围的限制。实验提供下面的实施例来说明和进一步阐释本发明某些优选的实施方式和方面,而不 是为了作为本发明范围的限制。在下面的实验公开中,使用了下列缩写ppm(百万分之一);M(摩尔每升);mM(毫 摩尔每升);μ M(微摩尔每升);ηΜ(纳摩尔每升);mol (摩尔);mmol (毫摩尔);μπιο (微 摩尔);nmol (纳摩尔);gm (克);mg (毫克);Pg (微克);Pg (皮克);L (升);ml和mL (毫 升);μ1和yL(微升);cm(厘米);mm(毫米);ym(微米);nm(纳米);U(单位);V(伏 特);丽(分子量);sec(秒);min(s)(分钟);h(s)和hr(s)(小时);°C (摄氏度); QS(足量);ND(未做);NA(不适用);rpm(每分钟转数);H20(水);dH20(去离子水); (HCl (盐酸);aa (氨基酸);bp (碱基对);kb (千碱基对);kD (千道尔顿);cDNA(副本或 互补DNA) ;DNA (脱氧核糖核酸);ssDNA (单链DNA) ;dsDNA (双链DNA) ;dNTP (脱氧核糖核 苷酸三磷酸盐);RNA (核糖核酸);MgCl2 (氯化镁);NaCl (氯化钠);Cm (氯霉素);w/v (重 量体积比);ν/ν(体积体积比);g(重力);OD(光密度);Dulbecco’ s磷酸盐缓冲溶液 (DPBS) ;0D28Q(280nm 处光密度);OD6tltl (600nm 处光密度);A4tl5 (405nm 处的吸光度);PAGE (聚 丙烯酰胺凝胶电泳);PBS(磷酸盐缓冲液[150mM NaCl,IOmM磷酸钠缓冲剂,pH 7.2]); PBST(PBS+0.25%TWEEN -20) ;PEG (聚乙二醇);PCR (聚合酶链式反应);SDS (十二 烷基磺酸钠);Tris (三羟甲基氨基甲烷);HEPES(N-[2-羟乙基]哌嗪-N_[2_乙磺酸]); HBS(HEPES缓冲盐水);SDS (十二烷基磺酸钠);bME,BME和β ME ( β -巯基乙醇或2-巯基乙 醇);Tris-HCl (三羟甲基氨基甲烷-盐酸化物);Tricine(N-[三-(羟甲基)-甲基]-甘氨 酸);DMSO(二甲基亚砜);Taq(栖热水生菌DNA聚合酶);Klenow(DNA聚合酶I大(Klenow) 片段);rpm(每分钟转数);EGTA(乙二醇-双(β-氨基乙醚)N,N,N' , N'-四乙酸);EDTA(乙二胺四乙酸);内酰胺酶或氨苄青霉素抗药性基因);DNA2. 0 (DNA2. 0, Menlo Park,CA) ;OXOID(Oxoid,Basingstoke,Hampshire,UK) ;Corning(Corning Life Sciences,Corning, NY) ;ATCC(美国模式菌种收藏所,Rockville,MD); Sequetech (Sequetech Corporation, Mountainview, CA) ;Gibco/BRL(Gibco/BRL,Grand Island,NY) ;Sigma(Sigma Chemical Co.,St.Louis,M0) ;Pharmacia(Pharmacia Biotech, Pisacataway, NJ) ;NCBI (国家生物技术信息中心);Applied Biosystems (Applied Biosystems,Foster City,CA) ;Clontech(CLONTECHLaboratories,Palo Alto,CA) ;Operon Technologies (Operon Technologies, Inc.,Alameda,CA) ;Bachem(Bachem Bioscience, Inc. , King of Prussia, PA) ;Difco(Difco Laboratories, Detroit, MI) ;GIBCO BRL 或 Gibco BRL(Life Technologies, Inc. , Gaithersburg, MD) ;Millipore(Millipore, Billerica,MA) ;Bio-Rad(Bio-Rad,Hercules,CA) ;Invitrogen (Invitrogen Corp., SanDiego, CA) ;NEB (New England Biolabs,Beverly, MA) ;Sigma (SigmaChemical Co., St.Louis, MO) ;Pierce(Pierce Biotechnology,Rockford,IL) ;Takara(Takara Bio Inc. Otsu,Japan) ;Roche(Hoffmann-La Roche,Basel,Switzerland) ;EM Science (EM Science, Gibbstown, NJ) ;Qiagen (Qiagen,Inc.,Valencia, CA) ;Molecular Devices(Molecular Devices, Corp.,Sunnyvale, CA) ;R&D Systems(R&D Systems, Minneapolis,MN); Stratagene(Stratagene Cloning Systems, La Jolla,CA);禾口 Microsoft (Microsoft, Inc.,Redmond,WA)。实施例1SigA和SigH多核苷酸构建体的产生产生多核苷酸构建体SigH、SigAl和SigA2,以在枯草芽孢杆菌宿主细胞中过表达 ymaHoPCR引物设计为与枯草芽孢杆菌基因组同源(图1A),而且含有位于从引物的5’端 开始的6个碱基对处的6碱基对的限制性酶切位点。引物设计为在构建体的上游和下游末 端改造有唯一的限制性酶切位点。基因组序列(Kunst等人,Nature 390 :249_256[1997])、 基因定位和起始和终止密码子信息的初始来源来自NCBI数据库完成的枯草芽孢杆菌亚 种枯草芽孢杆菌菌株168,或来自本领域技术人员已知的SubtiList万维网服务器(Moser, I. 1998. FEBS Lett. 430(1-2) :28_36)。所考虑的序列报告为 SEQ IDNO 13,对应于 NCBI 数 据库中的 1865428-18670191,ACC No NC000964。SigH构建体(SEQ ID NO 1)生成为包含其中包括Sigma H启动子和相邻的编码 YmaH蛋白质的序列的多核苷酸序列。Sigma H启动子天然位于编码miaA基因的多核苷酸 序列中,接近该基因的3’末端,紧靠在ymaH基因的上游。使用下列引物扩增完整的Sigma H启动子和相邻的ymaH编码序列正向引物Pl GGCACCGAATTCGACGTGGTTTCGCAACAAAATGCAG(SEQ ID NO :5;位于 SEQ ID N0:13 的 987至1011位),其中在5’末端加入了 EcoRI限制性酶切位点;和反向引物P2 :GGCACCGGA TCCCTCATAAAAAAAGACCGTGCCTTGG(SEQ ID NO :6,位于 SEQ ID NO 13 的 1472 至 1496 位), 具有加入的BamHI限制性酶切位点(图1B)。用三步法产生SigAl和SigA2构建体1)扩增枯草芽孢杆菌染色体DNA的单个片 段;2)纯化和组合这些片段;和3)用PCR扩增组合的产物。
SigAl构建体(SEQ ID NO 2)用两套引物产生(图1C)。第一套引物正向引物 P3 :GCGCCGAATTCTCATACCCTGAAAGGAAAGACAAGG(SEQ ID NO :7),位于 SEQ ID NO 13 的 5,末 端;和反向引物P4 TTCGAGTTTTCCTGCTATATGTGTGGGGCTGCTTCGTATTATTCAATATG(SEQ ID NO 8)位于SEQ ID N0:13的bp 153至bp 177,用于扩增含有SigA启动子、核糖体结合位点、 miaA基因的起始密码子和前几个密码子的第一片段。第二套引物,正向引物P5 CATATTGAATAATACGAAGCAGCCCCACACATATAGCAGGAAAACTCGAA(SEQ ID NO 9)位于 SEQ ID NO: 13的bp 1071至bp 1095,反向引物P2 (SEQ ID NO 6),用来扩增含编码YmaH蛋 白质的DNA序列的第二片段。反向引物P4和正向引物P5是融合引物,设计为含有互相互 补的尾部,但是与要扩增的序列不同源,以消除插入的miaA编码序列。将这两个片段退火, 得到的SigA构建体包含SigA启动子、核糖体结合位点和miaA基因的转录起始位点。用分 别含有EcoRI和BamHI限制性酶切位点的正向引物P3 (SEQ ID NO 7)和反向引物P2 (SEQ ID NO 6)扩增SigAl构建体,并将其连接到复制质粒pBS19的多聚接头。pBS19的多核苷 酸序列如下所示(SEQ ID N0:12)。pBS19质粒能够在大肠杆菌和枯草芽孢杆菌中复制,并 携带氯霉素抗性选择标记基因。GAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTGGCGATCCTGCC TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCG GATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTC ACGTAGCGATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCG GTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGC TGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGG GATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTT TTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGAC TATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATAC CTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGT CGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTC TTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTAT GTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGC TCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTG GTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGG TCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTGGAGCTGTAA TATAAAAACCTTCTTCAACTAACGGGGCAGGTTAGTGACATTAGAAAACCGACTGTAAAAAGTACAGTCGGCATTAT CTCATATTATAAAAGCCAGTCATTAGGCCTATCTGACAATTCCTGAATAGAGTTCATAAACAATCCTGCATGATAAC CATCACAAACAGAATGATGTACCTGTAAAGATAGCGGTAAATATATTGAATTACCTTTATTAATGAATTTTCCTGCT GTAATAATGGGTAGAAGGTAATTACTATTATTATTGATATTTAAGTTAAACCCAGTAAATGAAGTCCATGGAATAAT AGAAAGAGAAAAAGCATTTTCAGGTATAGGTGTTTTGGGAAACAATTTCCCCGAACCATTATATTTCTCTACATCAG AAAGGTATAAATCATAAAACTCTTTGAAGTCATTCTTTACAGGAGTCCAAATACCAGAGAATGTTTTAGATACACCA TCAAAAATTGTATAAAGTGGCTCTAACTTATCCCAATAACCTAACTCTCCGTCGCTATTGTAACCAGTTCTAAAAGC TGTATTTGAGTTTATCACCCTTGTCACTAAGAAAATAAATGCAGGGTAAAATTTATATCCTTCTTGTTTTATGTTTC GGTATAAAACACTAATATCAATTTCTGTGGTTATACTAAAAGTCGTTTGTTGGTTCAAATAATGATTAAATATCTCTTTTCTCTTCCAATTGTCTAAATCAATTTTATTAAAGTTCATTTGATATGCCTCCTAAATTTTTATCTAAAGTGAATT TAGGAGGCTTACTTGTCTGCTTTCTTCATTAGAATCAATCCTTTTTTAAAAGTCAATATTACTGTAACATAAATATA TATTTTAAAAATATCCCACTTTATCCAATTTTCGTTTGTTGAACTAATGGGTGCTTTAGTTGAAGAATAAAAGACCA CATTAAAAAATGTGGTCTTTTGTGTTTTTTTAAAGGATTTGAGCGTAGCGAAAAATCCTTTTCTTTCTTATCTTGAT AATAAGGGTAACTATTGCCGGTTGTCCATTCATGGCTGAACTCTGCTTCCTCTGTTGACATGACACACATCATCTCA ATATCCGAATAGGGCCCATCAGTCTGACGACCAAGAGAGCCATAAACACCAATAGCCTTAACATCATCCCCATATTT ATCCAATATTCGTTCCTTAATTTCATGAACAATCTTCATTCTTTCTTCTCTAGTCATTATTATTGGTCCATTCACTA TTCTCATTCCCTTTTCAGATAATTTTAGATTTGCTTTTCTAAATAAGAATATTTGGAGAGCACCGTTCTTATTCAGC TATTAATAACTCGTCTTCCTAAGCATCCTTCAATCCTTTTAATAACAATTATAGCATCTAATCTTCAACAAACTGGC CCGTTTGTTGAACTACTCTTTAATAAAATAATTTTTCCGTTCCCAATTCCACATTGCAATAATAGAAAATCCATCTT CATCGGCTTTTTCGTCATCATCTGTATGAATCAAATCGCCTTCTTCTGTGTCATCAAGGTTTAATTTTTTATGTATT TCTTTTAACAAACCACCATAGGAGATTAACCTTTTACGGTGTAAACCTTCCTCCAAATCAGACAAACGTTTCAAATT CTTTTCTTCATCATCGGTCATAAAATCCGTATCCTTTACAGGATATTTTGCAGTTTCGTCAATTGCCGATTGTATAT CCGATTTATATTTATTTTTCGGTCGAATCATTTGAACTTTTACATTTGGATCATAGTCTAATTTCATTGCCTTTTT CCAAAATTGAATCCATTGTTTTTGATTCACGTAGTTTTCTGTATTCTTAAAATAAGTTGGTTCCACACATACCAATA CATGCATGTGCTGATTATAAGAATTATCTTTATTATTTATTGTCACTTCCGTTGCACGCATAAAACCAACAAGATTT TTATTAATTTTTTTATATTGCATCATTCGGCGAAATCCTTGAGCCATATCTGACAAACTCTTATTTAATTCTTCGCC ATCATAAACATTTTTAACTGTTAATGTGAGAAACAACCAACGAACTGTTGGCTTTTGTTTAATAACTTCAGCAACAA CCTTTTGTGACTGAATGCCATGTTTCATTGCTCTCCTCCAGTTGCACATTGGACAAAGCCTGGATTTACAAAACCAC ACTCGATACAACTTTCTTTCGCCTGTTTCACGATTTTGTTTATACTCTAATATTTCAGCACAATCTTTTACTCTTTC AGCCTTTTTAAATTCAAGAATATGCAGAAGTTCAAAGTAATCAACATTAGCGATTTTCTTTTCTCTCCATGGTCTCA CTTTTCCACTTTTTGTCTTGTCCACTAAAACCCTTGATTTTTCATCTGAATAAATGCTACTATTAGGACACATAATA TTAAAAGAAACCCCCATCTATTTAGTTATTTGTTTAGTCACTTATAACTTTAACAGATGGGGTTTTTCTGTGCAACC AATTTTAAGGGTTTTCAATACTTTAAAACACATACATACCAACACTTCAACGCACCTTTCAGCAACTAAAATAAAAA TGACGTTATTTCTATATGTATCAAGATAAGAAAGAACAAGTTCAAAACCATCAAAAAAAGACACCTTTTCAGGTGCT TTTTTTATTTTATAAACTCATTCCCTGATCTCGACTTCGTTCTTTTTTTACCTCTCGGTTATGAGTTAGTTCAAATT CGTTCTTTTTAGGTTCTAAATCGTGTTTTTCTTGGAATTGTGCTGTTTTATCCTTTACCTTGTCTACAAACCCCTTA AAAACGTTTTTAAAGGCTTTTAAGCCGTCTGTACGTTCCTTAAG(SEQ ID NO 12)用下列引物(图1D)以所述SigAl构建体的构建方法产生SigA2构建体(SEQ ID N0:3)。含有SigA启动子的第一片段用正向引物P3(SEQ IDNO :7)和反向融合引物P7扩 增CATACAGTTTCGATTAMGTTCGAGCACTCTCTTTTATAAATCTCCCCCA(SEQ ID NO: 11)位于 SEQ ID N0:13的bp 125至bp 149。用正向融合引物P6扩增含编码YmaH蛋白质的DNA序列的第 二片段TGGGGGAGATTTATAAAAGAGAGTGCTCGAACTTTAATCGAAACTGTATG(SEQ ID NO: 10),位于 SEQ ID NO: 13的bp 1090至bp 1114,和反向引物P2 (SEQ ID NO :6)。将这两个片段退火, 得到的SigA2构建体包含SigA启动子、核糖体结合位点和ymaH基因的转录起始位点。本发明还包括第四SigA构建体(SigA3 ;SEQ ID NO 13 ;图1E),其通过扩增包括 SigA启动子、编码MiaA蛋白质的区域、SigH YmaH启动子和编码YmaH蛋白质的区域的杆菌 染色体DNA的miaA ymaH区域产生。用正向引物
GCGCGCGAATTCAGGGAAATTGTCGGCAATGAGCCGCTCGGC(SEQ ID NO 18)和反向引物 GC GCGCCATGGCTGATTCGTCTCAGTTCTGCTTCACTTTCA(SEQ ID NO 19)产生 SigA3 构建体。SEQ ID NO 13在该片段的5,末端放置了 EcoRI限制性酶切位点,而SEQ ID NO 19在另一端放置 了 NcoI限制性酶切位点。这使得可以在pBN3载体中克隆该片段,报告为如下所示的SEQ ID NO :20。GACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGT CTTCAAGAATTAATTCTCATGTTTGACAGCTTATCATCGATAAGCTTGCATGCCTGCAGGTCGACTCTAGAGGATCC CCGGGTACCGAGCTCGAATTCCTTAAGGAACGTACAGACGGCTTAAAAGCCTTTAAAAACGTTTTTAAGGGGTTTGT AGACAAGGTAAAGGATAAAACAGCACAATTCCAAGAAAAACACGATTTAGAACCTAAAAAGAACGAATTTGAACTAA CTCATAACCGAGAGGTAAAAAAAGAACGAAGTCGAGATCAGGGAATGAGTTTATAAAATAAAAAAAGCACCTGAAAA GGTGTCTTTTTTTGATGGTTTTGAACTTGTTCTTTCTTATCTTGATACATATAGAAATAACGTCATTTTTATTTTAG TTGCTGAAAGGTGCGTTGAAGTGTTGGTATGTATGTGTTTTAAAGTATTGAAAACCCTTAAAATTGGTTGCACAGAA AAACCCCATCTGTTAAAGTTATAAGTGACTAAACAAATAACTAAATAGATGGGGGTTTCTTTTAATATTATGTGTCC TAATAGTAGCATTTATTCAGATGAAAAATCAAGGGTTTTAGTGGACAAGACAAAAAGTGGAAAAGTGAGACCATGGA GAGAAAAGAAAATCGCTAATGTTGATTACTTTGAACTTCTGCATATTCTTGAATTTAAAAAGGCTGAAAGAGTAAAA GATTGTGCTGAAATATTAGAGTATAAACAAAATCGTGAAACAGGCGAAAGAAAGTTGTATCGAGTGTGGTTTTGTAA ATCCAGGCTTTGTCCAATGTGCAACTGGAGGAGAGCAATGAAACATGGCATTCAGTCACAAAAGGTTGTTGCTGAAG TTATTAAACAAAAGCCAACAGTTCGTTGGTTGTTTCTCACATTAACAGTTAAAAATGTTTATGATGGCGAAGAATTA AATAAGAGTTTGTCAGATATGGCTCAAGGATTTCGCCGAATGATGCAATATAAAAAAATTAATAAAAATCTTGTTGG TTTTATGCGTGCAACGGAAGTGACAATAAATAATAAAGATAATTCTTATAATCAGCACATGCATGTATTGGTATGTG TGGAACCAACTTATTTTAAGAATACAGAAAACTACGTGAATCAAAAACAATGGATTCAATTTTGGAAAAAGGCAATG AAATTAGACTATGATCCAAATGTAAAAGTTCAAATGATTCGACCGAAAAATAAATATAAATCGGATATACAATCGGC AATTGACGAAACTGCAAAATATCCTGTAAAGGATACGGATTTTATGACCGATGATGAAGAAAAGAATTTGAAACGTT TGTCTGATTTGGAGGAAGGTTTACACCGTAAAAGGTTAATCTCCTATGGTGGTTTGTTAAAAGAAATACATAAAAAA TTAAACCTTGATGACACAGAAGAAGGCGATTTGATTCATACAGATGATGACGAAAAAGCCGATGAAGATGGATTTTC TATTATTGCAATGTGGAATTGGGAACGGAAAAATTATTTTATTAAAGAGTAGTTCAACAAACGGGCCAGTTTGTTGA AGATTAGATGCTATAATTGTTATTAAAAGGATTGAAGGATGCTTAGGAAGACGAGTTATTAATAGCTGAATAAGAAC GGTGCTCTCCAAATATTCTTATTTAGAAAAGCAAATCTAAAATTATCTGAAAAGGGAATGAGAATAGTGAATGGACC AATAATAATGACTAGAGAAGAAAGAATGAAGATTGTTCATGAAATTAAGGAACGAATATTGGATAAATATGGGGATG ATGTTAAGGCTATTGGTGTTTATGGCTCTCTTGGTCGTCAGACTGATGGGCCCTATTCGGATATTGAGATGATGTGT GTCATGTCAACAGAGGAAGCAGAGTTCAGCCATGAATGGACAACCGGTGAGTGGAAGGTGGAAGTGAATTTTGATAG CGAAGAGATTCTACTAGATTATGCATCTCAGGTGGAATCAGATTGGCCGCTTACACATGGTCAATTTTTCTCTATTT TGCCGATTTATGATTCAGGTGGATACTTAGAGAAAGTGTATCAAACTGCTAAATCGGTAGAAGCCCAAACGTTCCAC GATGCGATTTGTGCCCTTATCGTAGAAGAGCTGTTTGAATATGCAGGCAAATGGCGTAATATTCGTGTGCAAGGACC GACAACATTTCTACCATCCTTGACTGTACAGGTAGCAATGGCAGGTGCCATGTTGATTGGTCTGCATCATCGCATCT GTTATACGACGAGCGCTTCGGTCTTAACTGAAGCAGTTAAGCAATCAGATCTTCCTTCAGGTTATGACCATCTGTGC CAGTTCGTAATGTCTGGTCAACTTTCCGACTCTGAGAAACTTCTGGAATCGCTAGAGAATTTCTGGAATGGGATTCA GGAGTGGACAGAACGACACGGATATATAGTGGATGTGTCAAAACGCATACCATTTTGAACGATGACCTCTAATAATT GTTAATCATGTTGGTTACCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGT CGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATT GTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTC CGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAA TACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCG TAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTC AGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTT CCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTG TAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCT GCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGT AACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAG AAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCA AACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAA GATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATT ATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAA CTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTT GCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCG AGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTG CAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTG CGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTC CCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTG TCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCC GTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTC TTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTT CGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCT TCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAG GGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCA TGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCA CCT(SEQ ID NO 20)所有的PCR反应在50 μ 1体积中进行,其中含有1-2 μ 1的DNA或来自克隆重悬物 的 DNA,5 μ 1 的 IOX Pfu Ultra 缓冲液(Stratagene),1 μ L 的 IOmM dNTP 共混物(Roche), 0. 5 μ L的0. 2uM引物,1μ 1 Pfu Ultra高保真聚合酶,用水将体积调节至总体积为50 μ 1。 PCR条件是95°C,2分钟;95°C,30秒,62°C,30秒,72°C,1分钟,共30个循环;然后1个循 环的72°C,10分钟。将得到的PCR片段用Qiagen凝胶纯化试剂盒根据说明书进行凝胶纯化。将混合到一起的纯化PCR片段中取0. 25μ 1的等分部分进行退火,加入到新的PCR 混合物中,用引物Ρ3和Ρ2以上述方案进行PCR获得融合构建体。PCR混合物的总体积是 50μ 1。PCR条件与上述相同,只是根据引物的Tm调节了退火温度。将所需的SigH、SigAl和SigA2构建体连接到已经用EcoRI和BamHI消化的质粒PBS19中,以产生用于如实施例2所述转化宿主细胞的SigA和SigH表达载体。将转化混合物铺板到LB+1. 6%脱脂牛奶+5 μ g/ml cmp平板上。第二天,挑取形成 晕的菌落,铺板,以获得单个菌落。菌落纯化进行两次。通过测序aprE启动子区域分析五 个单独的菌落。所有的菌落都具有aprE启动子的-35区共有序列。实施例2宿主细胞转化和aprE蛋白酶的表达用电穿孔的方法,将含有SigA或SigH构建体的5微升的连接混合物用来转化大 肠杆菌ToplO细胞(Invitrogen)。转化的细胞铺板到含有5ppm/ml氯霉素(Cm)的LB琼 脂糖平板上,让菌落在37°C生长过夜。挑取单个的菌落,转移到含有5ml的LB+5ppm/ml Cm 的试管中。在37°C,250rpm振摇的条件下让培养物生长过夜。从大肠杆菌培养物中制备质 粒 DNA,取一部分该质粒 DNA 制品去测序(Sequetech)。用 Phr印,Phrap,Consed,Custal W 软件进行自动序列分析。携带来自三个表达载体中的每一个的正确构建体的质粒用来转化枯草芽孢杆菌 宿主细胞。含有 SigH(SEQ ID NO 1)和 SigAl (SEQ ID NO 2)和 SigA2(SEQ ID NO 3)构 建体的表达载体被称为PBS19 ymaH-H和pBS19ymaH_Al和pBS19 ymaH-A2,如下所述将这 些表达载体转化到枯草芽孢杆菌菌株BG2941和BG2942中。两微升带有适宜构建体的质粒 DNA 用来转化 100 μ 1 的枯草芽孢杆菌细胞 BG 2941 ( AnprE, amyE: PxyIRA-comK-phIeoR) 和 BG2942 ( Δ nprE, degU(Hy) 32,amyE: :PxylRA-comK-phleoR)。带有 SigH 构建体的 BG2941 和BG2942转化细胞分别称为41SigH和42SigH ;带有SigAl构建体的BG2941和BG2942转 化细胞分别称为41SigAl和42SigAl。一些BG2941和BG2942宿主细胞也用对照pBS19质 粒转化,称为41pBS19和42pBS19。BG 2941和BG2942宿主细胞都具有nprE基因的缺失,其 消除了大部分的非aprE背景蛋白水解活性,因此,有利于测定产生的碱性蛋白酶(aprE)。 BG 2941和BG2942宿主细胞还带有盒amyE: :PxylRA-comK-phleoR,其允许通过用木糖诱导 生长培养物来制备感受态细胞(Hahn等人,Mol Microbiol. 18 :755_67 [1995])。2942宿主 细胞也携带degU基因中的突变(degU(Hy) 32突变),携带该突变的宿主细胞独自分泌的枯 草杆菌蛋白酶水平比不携带该degU(Hy)突变的宿主细胞分泌的枯草杆菌蛋白酶水平提高 几倍(Msadek 等人 J Bacteriol, 172 :824_834[1990])。杆菌宿主细胞中过表达YmaH的效果用实施例3中所述的试验定性和定量检测。实施例3过表达ymaH对蛋白酶生产的影响酪蛋白试验首先用定性试验测定过表达的ymaH对杆菌宿主细胞生产蛋白酶的 影响,该定性实验中比较了在琼脂糖平板上生长的菌落产生的晕斑的大小,该平板含有脱 脂牛奶形式的酪蛋白。随着杆菌细胞分泌出蛋白酶,其消化脱脂牛奶中的酪蛋白,并围绕生 长的菌落形成清晰的区域或晕斑。具有无活性的蛋白酶的宿主细胞会呈现围绕菌落的很小 晕斑或没有晕斑。因此,晕斑的大小提供了分泌菌落产生的蛋白酶量的定性评估(Wells, Τ. Α.等人 Nucleic Acids Res.,11,7911-7925 [1983])。将用SigH或SigAl表达载体转化的BG2941和BG2942枯草芽孢杆菌宿主细胞铺 板到含有1.6%脱脂牛奶和5ppm Cm/ml的LB琼脂平板上,在37°C孵育过夜。第二天,一些 转化体的菌落是在含有5ppm/ml Cm的LB琼脂平板上分离的单个菌落,这些平板在37°C孵育过夜。挑取单菌落分离物并接种到同样类型的平板上,再次在37°C孵育过夜。最大的晕斑由42SigH宿主细胞产生,其带有degU(Hy)32突变和使其能够过表达 ymaH的SigH构建体。具体地说,42SigH细胞的晕斑大小证明了过表达的ymaH进一步增强 了宿主细胞中枯草杆菌蛋白酶的产生,该宿主细胞已经产生了比野生型细胞高水平的酶, 即,42SigH细胞产生的晕斑大于携带degU(Hy)突变但是不带有能使其过表达ymaH的构建 体的42pBS19细胞产生的晕斑,但是42pBS19依次也产生了大于41pBS19细胞产生的晕斑, 41pBS19细胞不带有degU(Hy)32突变也不带有能使其过表达ymaH的构建体。42SigH细胞 产生的晕斑也大于41SigH细胞产生的晕斑,41SigH细胞不带有degU(Hy)突变,但是带有能 使其过表达ymaH的SigH构建体。AAPF检测——过表达ymaH的转化的杆菌宿主细胞42SigH,42SigAl, 41SigA2,以及它们各自的对照42pBS19和41pBS19的枯草杆菌蛋白酶生产被定量 为分泌的aprE蛋白酶活性的函数。分泌的蛋白酶的蛋白水解活性测定为底物琥珀 酰-L-Ala-L-Ala-L-Pro-L-Phe-对-硝基苯胺(AAPF,来自 Sigma Chemical Co)的水解率。 该检测测得蛋白酶生产的水平为水解和释放对硝基苯胺而产生的405nm/分钟处的吸光度 (Estell 等人,J Biol Chem.,260 :6518_6521 [1985])。该测定用 Sofmax Pro 软件进行,具 体条件设定为类型动态的;减小(Reduction) =Vmax点(读最好的15点Λ8个点);Lml 405nm ;时间5分钟;间隔11秒。通过将转化细胞41SigH和42SigAl和42SigH的单个菌落接种到5ml含5pmm/ml 氯霉素(Cm)的LB中,并让这些细胞在振摇下37°C下生长,直至生长达到中对数期,得到枯 草芽孢杆菌对照宿主细胞41pBS19和42pBS19,以及过表达ymaH的宿主细胞的液体培养物, 将各个培养物用含有5ppm/ml Cm的新鲜复合培养基以1 100稀释,并在250rpm振摇下 在37°C下生长。在图中所示时间点取培养物的样本。离心样本,检测上清中的枯草杆菌蛋 白酶的生产。10微升的各种枯草芽孢杆菌培养物上清用IOOul的Tris缓冲液稀释,其中含有 IOmM Tris+0. 005%TWEEN "80,pH 8. 6 ;和 25 μ 1 的 100mg/ml AAPF。计算各个蛋白 酶的活性,过表达YmaH对蛋白酶生产的影响示于图3A-B和图4中。图3A和3B表明在杆菌宿主细胞中过表达ymaH,无论存在(42SigA和42SigH ;图 3A)还是不存在(41SigH ;图3B) degU (Hy)突变,与各自的对照细胞41pBS19和42pBS19产 生的水平相比,都以几倍的水平增强了 aprE枯草杆菌蛋白酶的生产。另外,过表达ymaH的 细胞在比不过表达ymaH的细胞早的时间产生了升高水平的枯草杆菌蛋白酶。例如,图3A表 明42sigH细胞在生长20小时时产生了与亲本对照细胞在48小时时产生的几乎同样多的 枯草杆菌蛋白酶。相似地,图3B表明41SigH细胞在25小时时产生了比41pBS对照细胞在 48小时产生的多的枯草杆菌蛋白酶。图4中所示图表明表达ymaH的细胞当该表达用SigH 启动子驱动(42SigH)时,导致产生的枯草杆菌蛋白酶多于其中用sigma启动子驱动ymaH 表达的细胞(42SigA)产生的枯草杆菌蛋白酶。图4还表明,无论是被SigH还是SigA启动 子驱动,ymaH的过表达都在早至细胞仅仅生长一小时后的时间点就导致枯草杆菌蛋白酶的 增强生产。
权利要求
一种分离的嵌合多核苷酸,包括有效连接到编码YmaH蛋白质的多核苷酸的SigA启动子的多核苷酸序列。
2.如权利要求1所述的分离的嵌合多核苷酸,包括SEQID NO :2或SEQ ID NO :3。
3.一种包括多核苷酸构建体的载体,所述构建体包含编码YmaH蛋白质的多核苷酸,所 述多核苷酸有效连接到sigA和/或SigH启动子多核苷酸序列上。
4.如权利要求3所述的载体,其中所述多核苷酸构建体包含SEQIDN0:1、2、3或13。
5.一种改良的包含权利要求3所述载体的杆菌宿主细胞,其中所述改良的杆菌宿主细 胞能够生产目的蛋白质。
6.如权利要求5所述的改良的细胞,其中所述杆菌细胞选自由地衣芽孢杆菌、枯草芽 孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、 凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌、克劳氏芽孢 杆菌和巨大芽孢杆菌所组成的组中。
7.如权利要求5所述的改良的宿主细胞,其中所述目的蛋白质与所述改良的宿主细胞 同源或异源。
8.如权利要求5所述的改良的细胞,其中所述目的蛋白质的表达由aprE启动子驱动。
9.如权利要求5所述的宿主细胞,其中所述目的蛋白质选自淀粉酶、蛋白酶、木聚糖 酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶、过 氧化氢酶、葡萄糖氧化酶、植酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、激酶磷酸酶、半乳 糖苷酶和壳多糖酶、激素、细胞因子、生长因子、受体、疫苗和抗体。
10.如权利要求5所述的宿主细胞,其中所述目的蛋白质是酶。
11.如权利要求10所述的宿主细胞,其中所述酶是蛋白酶。
12.如权利要求11所述的宿主细胞,其中所述蛋白酶是选自下组中的枯草杆菌蛋白 酶枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN'、枯草杆菌蛋白酶Carlsberg、迟缓芽孢杆 菌的枯草杆菌蛋白酶、克劳氏芽孢杆菌的枯草杆菌蛋白酶、枯草杆菌蛋白酶DY、枯草杆菌蛋 白酶147、枯草杆菌蛋白酶309及其变体。
13.一种改良的杆菌细胞,所述细胞是能够过表达ymaH的蛋白酶生产细胞,其中所述 改良的细胞包含在选自degU、degQ、degS、sco4、spoIIE、degQ和degR中的至少一个基因中 的突变。
14.如权利要求13所述的改良的细胞,其中所述突变是deg(Hy)32。
15.如权利要求13所述的改良的细胞,其中所述杆菌细胞是枯草芽孢杆菌细胞。
16.一种获得改良的杆菌细胞的方法,包括a)用权利要求3的载体转化杆菌宿主细胞,其中所述杆菌细胞能够表达目的蛋白质;和b)在适宜表达所述目的蛋白质的生长条件下生长所述改良的细胞。
17.如权利要求16所述的方法,其中包含所述多核苷酸构建体的所述载体存在于复制 的质粒上。
18.如权利要求16所述的方法,其中所述构建体被整合到所述改良的细胞的基因组中。
19.如权利要求16所述的方法,其中所述目的蛋白质是枯草杆菌蛋白酶。
20.一种在能够生产目的蛋白质的改良的杆菌细胞中生产所述目的蛋白质的方法,所 述方法包括a)培养所述改良的杆菌细胞,其中所述改良的细胞能够过表达ymaH;和b)在适宜表达所述目的蛋白质的生长条件下生长所述改良的杆菌细胞。
21.如权利要求20所述的方法,进一步包括回收所述目的蛋白质的步骤。
22.如权利要求20所述的方法,其中所述目的蛋白质产生的时间点早于该蛋白质在相 应的前体宿主细胞中产生的时间点。
23.如权利要求20所述的方法,其中所述目的蛋白质的表达由aprE启动子驱动。
24.如权利要求20所述的方法。其中所述目的蛋白质是酶。
25.一种在杆菌中增强目的蛋白质表达的方法,包括a)在杆菌亲本宿主细胞中获得改良的杆菌细胞,该改良的杆菌细胞包含过表达的 ymaH ;b)在适宜的生长条件下生长所述改良的杆菌细胞;和C)使所述目的蛋白质在所述改良的杆菌细胞中表达,其中所述目的蛋白质在所述改良 的杆菌细胞中的表达与所述目的蛋白质在所述杆菌亲本宿主细胞中的表达相比得到了增强。
26.如权利要求25所述的方法,其中所述过表达包括用包含编码YmaH蛋白质的多核苷 酸的多核苷酸构建体转化杆菌亲本宿主细胞,所述编码YmaH蛋白质的多核苷酸有效连接 到sigA或sigH启动子多核苷酸序列。
27.如权利要求26所述的方法,其中所述多核苷酸构建体包含选自SEQID N0:l、2、3 和13的多核苷酸序列。
28.如权利要求26所述的方法,其中所述构建体存在于质粒中或被整合到所述改良的 细胞的基因组中。
29.如权利要求26所述的方法,其中所述宿主细胞是野生型细胞。
30.如权利要求26所述的方法,其中所述宿主细胞是改变的宿主细胞。
31.如权利要求25所述的方法,其中所述目的蛋白质是酶。
全文摘要
本发明涉及已经遗传改造以具有改变的表达和/或生产目的蛋白质能力的细胞。具体来讲,本发明涉及革兰氏阳性微生物的改良的宿主细胞,例如能够过表达ymaH的杆菌物种。本发明涵盖包含编码YmaH的多核苷酸序列的多核苷酸构建体和表达载体,以及包含这种构建体和表达载体的改良的宿主细胞。具体来说,本发明涉及用于在杆菌物种中增强目的蛋白(例如蛋白酶)的表达和生产的过表达YmaH的组合物和方法。
文档编号C12N15/67GK101903519SQ200880122122
公开日2010年12月1日 申请日期2008年12月19日 优先权日2007年12月21日
发明者E·费拉里, M·A·卡文, S·D·鲍尔 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1