用于在巯基-二硫键氧还酶缺陷的细菌突变体细胞中产生异源多肽的方法

文档序号:393344阅读:548来源:国知局
专利名称:用于在巯基-二硫键氧还酶缺陷的细菌突变体细胞中产生异源多肽的方法
技术领域
本发明涉及巯基-二硫键氧还酶(thiol-disulfide oxidoreductase)缺陷细菌突变体细胞和在此类巯基-二硫键氧还酶缺陷细菌突变体细胞中产生异源多肽的方法。
背景技术
多肽链的折叠依赖于分子伴侣和折叠催化剂,如巯基-二硫键氧还酶。巯基-二硫键氧还酶催化巯基/ 二硫键交换反应并促进二硫键形成、异构化或还原,由此协助正确的二硫键配对的形成(Hart 等,1995,Current Opinion in Structural Biology 5:92-102)。此类氧还酶直接与新合成的分泌蛋白相互作用,并且是在真核细胞内质网(ER)中初生多肽的折叠所必需的。由于其表达和分泌其产物的能力,芽孢杆菌属细菌(Bacilli)已在工业上充分确立为用于重组产生异源蛋白的宿主细胞系统。然而,具有理想的蛋白表达和分泌性状的芽孢杆菌属(Bacillus)宿主细胞并不一定对于生物活性异源蛋白的产生具有最理想的特征。对于宿主细胞为天然的巯基-二硫键氧还酶的存在可在异源蛋白中催化不正确的二硫键配对的形成。Meima 等,2002,Journal of Biological Chemistry 277:6994-7001 公开了编码感受态形成(competence development)所需的巯基-二硫键氧还酶的枯草芽孢杆菌(Bacillus subtilis)的 bdbCD 操纵子。Erlendsson 和 Hederstedt, 2002,Journal ofBacteriology 184:1423-1429公开了巯基-二硫键氧还酶BdbC和BdbD中的突变可抑制CcdA缺陷枯草芽孢杆菌细胞的细胞色素c缺乏。美国专利号6,521,421和7,037,714公开了编码枯草芽孢杆菌二硫键异构酶的表达载体和使用该载体在革兰氏阳性微生物中分泌蛋白的方法。本发明提供了用于产生异源蛋白的巯基-二硫键氧还酶产生缺陷的改善的细菌宿主细胞,以及在此类巯基-二硫键氧还酶缺陷细菌突变体细胞中产生异源多肽的方法。

发明内容
本发明涉及亲本细菌细胞的分离的突变体,其包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,其中所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的。
本发明还涉及产生异源多肽的方法,包括(a)在用于产生所述异源多肽的培养基中培养亲本细胞的突变体,其中(i)所述突变体细胞包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,和(ii)所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的;和(b)从培养基回收所述异源多肽.本发明进一步涉及获得亲本细菌细胞的突变体的方法,包括(a)向所述亲本细菌细胞导入编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱 氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸;和(b)鉴定包含修饰的多核苷酸的来自步骤(a)的突变体细胞,其中所述突变体细胞在巯基-二硫键氧还酶产生方面是缺陷的。


图I显示pNNB194_ispAA的限制图。图2显示pM0L2657的限制图。图3显示pRB217的限制图。图4显示pRB219的限制图。 图5显示pSM0280的限制图。图6显示pIC20R_amyL的限制图。图7 显示 pHP13ampMCS_amyL 的限制图。图8 显示 pSJ2882_amyL orf 的限制图。图9显示pMRT135的限制图。图10显示pBW223的限制图。图11显示pBW224的限制图。图12显示pBW226的限制图。定义巯基-二硫键氧还酶术语“巯基-二硫键氧还酶”意指通过涉及两个具氧化还原活性的半胱氨酸交换反应的二巯基/二硫键交换机理催化氧还酶反应的酶,其促进二硫键形成、异构化或还原,由此促进正确二硫键配对的形成(Ortenberh和Beckwith,2003,Antioxidants & Redox Signaling 5:403-11;Meyer 等,2009,Annu.Rev. Genet. 2009. 43: 335 - 367)。就本发明而言,巯基-二硫键氧还酶活性根据Holmgren, 1979, Journal of Biological Chemistry 254:9627-9632 所述的步骤或任何其他本领域中公知的测定法来确定。分离的或纯化的术语“分离的”或“纯化的”意指从与其天然结合(naturallyassociated)的至少一种成分去除的多肽或多核苷酸。举例而言,多肽如通过SDS-PAGE确定,可为至少1%纯,例如,至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯,而多核苷酸如通过琼脂糖电泳确定,可为至少1%纯,例如,至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯。成熟多肽术语“成熟多肽”意指在翻译和任何翻译后修饰如N端加工,C端截短,糖基化,磷酸化等之后以其最终形式存在的多肽。本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽的混合物(即,具有不同的C端和/或N端氨基酸)。成熟多肽编码序列术语“成熟多肽编码序列”意指编码成熟多肽的多核苷酸。同一性两个氨基酸序列间或两个核苷酸序列间的相关性由参数“序列同一性”所描述。就本发明而言,两个氨基酸序列之间的序列同一'I"生程度使用Needleman-Wunsch 算法(Needleman 和 Wunsch,1970,J。Mol。Biol。48:443-453)确定,如 EMBOSS 软件包(EMBOSS :欧洲分子生物学开放软件组(The European Molecular Biology Open SoftwareSuite),Rice 等,2000,Trends Genet. 16:276-277)的 Needle 程序,优选为 3. 0. 0 版或之后的版本中执行的。所用的可选参数为缺口开放罚分(gap open penalty) 10,缺口延伸罚分(gap extension penalty) O. 5,和 EBL0SUM62 (BL0SUM62 的 EMBOSS 版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算(相同的残基X100)/(比对长度-比对中缺口总数)就本发明而言,两个脱氧核糖核苷酸序列之间的序列同一性程度使用Needleman-Wunsch 算法(Needleman 和 Wunsch, 1970,见上)确定,如 EMBOSS 软件包(EMB0SS :欧洲分子生物学开放软件组(The European Molecular Biology Open SoftwareSuite), Rice等,2000,见上)的Needle程序,优选为3. O. O版或之后的版本中执行的。所用的可选参数为缺口开放罚分10,缺口延伸罚分0. 5,和EDNAFULL(NCBI NUC4. 4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算(相同的脱氧核糖核苷酸X100)/(比对长度-比对中缺口总数)同源序列术语“同源序列”意指在用SEQ ID NO: 2, SEQ ID NO:4, SEQ ID NO: 50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64, SEQ ID N0:66,或SEQ ID NO:68的枯草芽孢杆菌巯基-二硫键氧还酶或其成熟多妝进行的 tfasty 搜索(Pearson, W. R.,1999,于 Bioinformatics Methods andProtocols 中,S. Misener 和 S. A. Krawetz 编,pp. 185-219)中 E 值(或期望得分)小于0. 001的预测蛋白质。片段术语“片段”意指在SEQ ID NO: 2,SEQ ID NO: 4,SEQ ID NO:50, SEQ IDNO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ IDNO: 64,SEQ ID NO: 66,或SEQ ID NO: 68,或其成熟多肽的氨基端和/或羧基端具有一个或多个(几个)氨基酸缺失的多肽,其中所述片段具有巯基-二硫键氧还酶活性。亚序列:术语“亚序列”意指在SEQ ID NO: I, SEQ ID NO: 3, SEQ ID NO:49, SEQ IDN0:51, SEQ ID N0:53, SEQ ID N0:55, SEQ ID N0:57, SEQ ID NO:59, SEQ ID N0:61, SEQID N0:63, SEQ ID N0:65,或SEQ ID N0:67的多肽编码序列,或其成熟多肽编码序列的5’和/或3’端具有一个或多个(几个)核苷酸缺失的多核苷酸,其中所述亚序列编码具有巯基-二硫键氧还酶活性的多肽片段。等位变体(allelic variant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。编码序列术语“编码序列”意指直接指定多肽氨基酸序列的多核苷酸。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、合成或重组的多核苷酸。核酸构建体术语“核酸构建体”意指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(control sequence):术语“调控序列”意指对于编码目标多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前肽序列、启动子、信号肽序列和转录终止子。最低限度,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。可操作地连接术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并与供用于其表达的额外核苷酸可操作地连接。宿主细胞术语“宿主细胞”意指任何细胞类型,所述细胞类型对于用包含多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖由于在复制过程中发生的突变而与亲本细胞不完全相同的亲本细胞的任何后代。导入术语“导入”或其变化形式意指将DNA转移至细菌细胞。将DNA导入细菌细胞可通过本领域任何已知方法完成,包括但不限于转化、转染、转导、接合等。转化术语“转化”意指将纯化的DNA导入细菌细胞,从而使得DNA作为染色体整合体或作为自主复制的染色体外载体维持。术语“转化”应一般地理解为包括转染、转导、接合等。
转染术语“转染”意指用病毒核酸转化细菌细胞。转导术语“转导”意指将来自第一细菌细胞的DNA包装于病毒颗粒中,并将该细菌DNA通过用该病毒颗粒感染第二细菌细胞而转移至该第二细胞中。
接合术语“接合”意指将DNA通过细胞-细胞接触直接从一个细菌细胞转移至另一个细菌细胞。转化体术语“转化体”意指导入了 DNA的任何细菌细胞。因此,术语“转化体”包括转染体、接合体等。供体细胞术语“供体细胞”意指作为以任何方式导入另一种细胞的DNA的来源的细胞。受体细胞术语“受体细胞”意指导入DNA的细胞。修饰术语“修饰”意指在巯基-二硫键氧还酶基因,或其转录或翻译所需的调节元件中导入、取代或去除一个或多个(几个)核苷酸;基因破坏;基因转换;基因缺失;或巯基-二硫键氧还酶基因的随机或特异性诱变。巯基-二硫键氧还酶基因的缺失可为部分的 或完全的。在巯基-二硫键氧还酶产生方面是缺陷的短语“在巯基-二硫键氧还酶产生方 面是缺陷的”意指不产生可检测的由特定基因编码的巯基-二硫键氧还酶的细菌突变体细胞,或者,在相同条件下培养时相对于亲本细菌细胞产生优选减少至少约25%,更优选减少至少约50%,甚至更优选减少至少约75%,并且最优选减少至少约95%的由特定基因编码的巯基-二硫键氧还酶的细菌突变体细胞。由本发明的细菌突变体细胞产生的巯基-二硫键氧还酶的水平可使用本领域中公知的方法来确定(参见,例如Holmgren, 1979,见上文)。如用于本文和所附的权利要求书,除非上下文有明确的相反表示,单数形式“一种/ 一个(a,an) ”、“或(or) ”和“所述/该(the) ”亦包括复数个所指对象。除非另行定义或上下文有明确的相反表示,本文中使用的所有科技术语具有与本发明所属技术领域的一般技术人员通常所理解的含意相同的含意。发明详述本发明涉及亲本细菌细胞的分离的突变体,其包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,其中所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的。本发明还涉及产生异源多肽的方法,包括(a)在用于产生所述异源多肽的培养基中培养亲本细菌细胞的突变体,其中(i)所述突变体细胞包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,和(ii)所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的;和(b)从培养基回收所述异源多肽。本发明进一步涉及获得亲本细菌细胞的突变体的方法,包括(a)向所述亲本细菌细胞导入编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸;和(b)鉴定包含修饰的多核苷酸的来自步骤(a)的突变体细胞,其中所述突变体细胞在巯基-二硫键氧还酶产生方面是缺陷的。本发明的优点是消除或减少了可不利地影响异源多肽的产生的巯基-二硫键氧还酶,所述影响是通过不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成从而导致所述多肽不具有或具有较低的生物活性。所述巯基-二硫键氧还酶的产生方面的缺陷阻止了异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键的形成。将细菌突变体细胞在适用于产生目标异源多肽的营养培养基中使用本领域已知方法培养。例如,所述突变体细胞可以通过在合适培养基中和允许表达和/或分离所述目标多肽的条件下进行的摇瓶培养,或实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。目标多肽可从所述培养基或细菌突变体细胞直接回收。 目标异源多肽可使用对于多肽具特异性的本领域中的已知方法来检测。这些检测方法可包括例如使用特异性抗体,高效液相层析,毛细管层析,酶产物的产生,酶底物的消失,或SDS-PAGE。举例而言,可使用酶测定来确定酶活性。对于许多酶,确定酶活性的步骤在本领域中是已知的(参见,例如D. Schomburg and M. Salzmann(eds. ) ,Enzyme Handbook,Springer-Verlag, New York,1990)。可使用本领域中已知的方法来分离所得的多肽。举例而言,目标多肽可从培养基通过常规方法分离,所述方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后,分离的多肽可进一步通过多种本领域中已知的方法来纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦(IEF))、差示溶解度(例如,硫酸铵沉淀)、或提取(参见,例如,Protein Purification, J. -C. Janson 和 Lars Ryden, editors, VCH Publishers, NewYork, 1989)。亲本细菌细胞所述亲本细菌细胞可为任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽抱杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)细胞。革兰氏阴性细菌包括但不限于大肠杆菌(E. coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)细胞。在本发明的方法中,所述亲本细菌细胞可为野生型细菌细胞或其突变体。在本发明的方法中,所述亲本细菌细胞可为任何芽孢杆菌属(Bacillus)细胞。可用于本发明的实践的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽抱杆菌(Bacillus amyloliquefaciens)、短芽抱杆菌(Bacillusbrevis)、腊状芽抱杆菌(Bacillus cereus)、环状芽抱杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、Bacillus halodurans、灿烂芽抱杆菌(Bacillus lautus)、迟缓芽抱杆菌(Bacillus lentus)、地衣芽抱杆菌(Bacillus licheniformis)、巨大芽抱杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽抱杆菌(Bacillus subtilis)或苏云金芽抱杆菌(Bacillus thuringiensis)细胞。在一个方面,所述亲本芽孢杆菌属细胞是解淀粉芽孢杆菌细胞。在另一个方面,所述亲本芽孢杆菌属细胞是蜡状芽孢杆菌。在另一个方面,所述亲本芽孢杆菌属细胞是克劳氏芽孢杆菌细胞。在另一个方面,所述亲本芽孢杆菌属细胞是Bacillus halodurans。在另一个方面,所述亲本芽孢杆菌属细胞是迟缓芽孢杆菌细胞。在另一个方面,所述亲本芽孢杆菌属细胞是地衣芽孢杆菌细胞。在另一个方面,所述亲本芽孢杆菌属细胞是短小芽孢杆菌 细胞。在另一个方面,所述亲本芽孢杆菌属细胞是嗜热脂肪芽孢杆菌细胞。在另一个方面,所述亲本芽孢杆菌属细胞是枯草芽孢杆菌细胞。在本发明的方法中,所述亲本细菌细胞可为任何链球菌属细胞。可用于本发明的实践的链球菌属细胞包括但不限于似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)和马链球菌兽痕亚种(Streptococcus equi subsp. Zooepidemicus)细胞。在一个方面,所述亲本细菌细胞是似马链球菌细胞。在另一个方面,所述亲本细菌细胞是酿脓链球菌细胞。在另一个方面,所述亲本细菌细胞是乳房链球菌细胞。在另一个方面,所述亲本细菌细胞是马链球菌兽瘟亚种细胞。在本发明的方法中,所述亲本细菌细胞可为任何链霉菌属细胞。可用于本发明的实践的链霉菌属细胞包括但不限于不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)和浅青紫链霉菌(Streptomyces Iividans)细胞。在一个方面,所述亲本细菌细胞是不产色链霉菌细胞。在另一个方面,所述亲本细菌细胞是除虫链霉菌细胞。在另一个方面,所述亲本细菌细胞是天蓝链霉菌细胞。在另一个方面,所述亲本细菌细胞是灰色链霉菌细胞。在另一个方面,所述亲本细菌细胞是浅青紫链霉菌细胞。在本发明的方法中,所述亲本细菌细胞可为任何大肠杆菌细胞。在本发明的另一个方面,所述亲本细菌细胞可另外含有可对于目标异源多肽的产生、回收或应用有害的其他基因的修饰例如缺失或破坏。在一个优选的方面,所述亲本细菌细胞为蛋白酶缺陷细胞。在一个优选的方面,所述亲本芽孢杆菌属细胞包含aprE和nprE的破坏或缺失。在另一个优选的方面,所述亲本芽孢杆菌属细胞不产生孢子。在另一个更优选的方面,亲本芽孢杆菌属细胞包含spoIIAC的破坏或缺失。在另一个优选的方面,所述亲本芽孢杆菌属细胞包含一种涉及surfactin生物合成的基因,例如srfA、srfB、srfC和srfD的破坏或缺失。参见,例如美国专利号5,958,728。其他可对目标多肽的产生、回收或应用有害的基因,例如amyE基因亦可受破坏或缺失。
巯基-二硫键氧还酶缺陷细菌突变体细胞的构建所述巯基-二硫键氧还酶缺陷细菌突变体细胞可通过使用本领域中公知的方法,例如插入、破坏、替代或缺失来减少或消除亲本细菌细胞中巯基-二硫键氧还酶基因的表达来构建。待修饰或失活的基因的部分可为例如编码区或编码区表达所需的调节元件。此种调节或调控序列的实例可为启动子序列或其功能性部分,即足以影响核酸序列表达的部分。其他可修饰的调控序列包括但不限于前导序列、前肽序列、信号肽、转录终止子和转录激活子。所述细菌突变体细胞可通过基因缺失技术以消除或减少编码巯基-二硫键氧还酶的基因的表达来构建。基因缺失技术使得能够部分或完全去除巯基-二硫键氧还酶基因,由此消除其表达。在此类方法中,基因的缺失可以使用构建为连续地含有基因侧翼的5’和3'区的质粒通过同源重组来完成。例如,可将所述连续的5’和3'区导入细菌细胞中,例如,在允许质粒能够在细胞中成为确立的(become established)温度下导入温度敏感型质粒如PE194上。然后将细胞转移至非允许温度以选择在染色体中于同源侧翼区之一处整 通过将细胞转移至允许温度不进行选择地经过几代来刺激第二同源侧翼区的重组事件。将细胞铺板以获得单菌落,并检查菌落的选择性标志物的缺失(参见,例如,Perego, 1993,于A. L. Sonneshein, J. A. Hoch和R. Losick编,Bacillus subtilis and Other Gram-PositiveBacteria,第 42 章,American Society of Microbiology, Washington, D. C. , 1993)。所述细菌突变体细胞可通过巯基-二硫键氧还酶基因的缺失,即简单地用选择性标志物替代包含待缺失的基因的染色体区,来构建。这可通过将待缺失的基因侧翼的5’和3’区克隆入质粒,并在这两个区之间插入选择性标志物来完成。一旦构建了此种质粒,将其通过用在这些5’和3’侧翼区之外切割的限制性酶的消化来直链化。然后使用直链DNA转化细菌细胞以就在侧翼DNA的两个区之间包含的选择性标志物的存在进行选择。所述选择性标志物组入基因组的唯一方式是通过双交换事件(double crossover event),由此用所述选择性标志物替代待缺失的基因。所述细菌突变体细胞亦可通过在编码巯基-二硫键氧还酶的基因中或其转录或翻译所需的调节元件中导入、取代或去除一个或多个(几个)核苷酸来构建。举例而言,可插入或去除核苷酸以导致终止密码子的导入、起始密码子的去除,或开读框的移码。此种修饰可依照本领域中已知的方法通过定位诱变或PCR生成的诱变来实现。参见,例如Botstein和 Shortle, 1985, Science 229:4719; Lo 等,1985,Proceedings of the NationalAcademy oif Sciences USA 81:2285;Higuchi 等,1988, Nucleic Acids Research16:7351;Shimada, 1996, Meth. Mol. Biol. 57:157;Ho 等,1989,Gene 77:61;Horton等,1989,Gene 77:61;以及 Sarkar 和 Sommer, 1990,BioTechniques 8:404。所述细菌突变体细胞亦可通过基因破坏技术来构建,所述技术通过将含有同源于基因的核酸片段的整合型质粒插入编码巯基-二硫键氧还酶的基因来进行,所述核酸片段会导致同源区的重复,并在重复的区之间组入载体DNA。若插入的载体使基因启动子与编码区分离,或打断了编码区使得得到非功能性基因产物,则此种基因破坏可消除基因表达。破坏性的构建体可简单地为选择性标志物伴以同源于基因的5’和3’区。所述选择性标志物使得能够鉴定含有遭破坏的基因的转化体。
所述细菌突变体细胞亦可通过基因转换的方法来构建(参见,例如Iglesias和Trautner, 1983, Molecular General Genetics 189:73-76)。举例而言,在基因转换方法中,在体外诱变对应于所述基因的核酸序列以产生缺陷性核酸序列,然后将其转化入亲本细菌细胞,例如芽孢杆菌属细胞,以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源基因。可期望所述缺陷基因或基因片段亦编码可用于选择含有所述缺陷基因的转化体的标记。举例而言,可将所述缺陷基因与选择性标志物一同导入非复制或温度敏感性质粒上。对于质粒整合的选择通过在不允许质粒复制的条件下选择所述标记来实施。对于导致基因替代的第二重组事件的选择通过就选择性标志物的丧失和突变基因的获得来检查菌落而实施(参见,例如Perego,1993,见上文)。或者,所述缺陷核酸序列可含有基因的一个或多个(几个)核苷酸的插入、取代或缺失,如下所述。所述细菌突变体细胞亦可使用互补于所述基因核酸序列的核苷酸序列通过已确立的反义技术来构建(Parish 和 Stoker, 1997, FEMS Microbiology Letters 154:151-157)。更具体而言,细菌细胞例如芽孢杆菌属细胞对基因的表达,可通过导入互补于所述基因的核酸序列的核苷酸序列来减少或消除,所述核苷酸序列可在细胞中转录,并能够杂交于细胞中产生的mRNA。在允许互补性反义核苷酸序列杂交于所述mRNA的条件下,可由此减少或消除翻译的蛋白的量。所述细菌突变体细胞可进一步通过使用本领域公知的方法的随机或特异性诱变来构建,所述方法包括但不限于化学诱变(参见,例如Hopwood, The Isolation of Mutantsin Methods in Microbiology(J. R. Norris and D. ff. Ribbons, eds. )pp. 363-433, AcademicPress, New York, 1970)和转座(参见,例如 Youngman 等,1983, Proc. Natl. Acad. Sci. USA80:2305-2309)。对基因的修饰可通过对亲本细胞进行诱变并筛选其中基因的表达减少或消除的突变体细胞来进行。可通过例如使用合适的物理或化学诱变剂,使用合适的寡核苷酸,或对DNA序列进行PCR生成的诱变来进行特异性或随机诱变。此外,所述诱变可通过使用这些诱变方法的任何组合来进行。适用于本发明目的的物理或化学诱变剂的实例包括紫外(UV)辐照,羟胺,N-甲基-N’ -硝基-N-亚硝基胍(MNNG),N-甲基-N’ -亚硝基胍(NTG),O-甲基羟胺,亚硝酸,甲磺酸乙酯(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。当使用此类试剂时,诱变通常通过将待诱变的亲本细菌细胞在所选诱变剂的存在下在合适条件下温育,并选择呈现所述基因减少表达或无表达的突变体细胞来进行。在一个优选实施方案中,细菌突变体细胞中编码巯基-二硫键氧还酶的基因的修饰不受选择性标志物所标记。选择性标志物基因的去除可通过在反选择培养基上培养突变体来获得。在选择性标志物基因含有在其5’和3’端侧翼的重复时,当对突变体细胞进行反选择时,该重复会协助选择性标志物基因通过同源重组的圈出(looping out)。选择性标志物基因亦可通过同源重组去除,即将包含缺陷基因的5’和3’区、但缺乏选择性标志物基因的核酸片段导入突变体菌株,然后在反选择培养基上选择。通过同源重组,用缺乏选择性标志物基因的核酸片段替代了含有选择性标志物基因的缺陷基因。亦可使用其他本领域中已知的方法。应理解本发明的方法并不特别限于获得所述细菌突变体细胞。可在构建用于产生异源多肽的突变体细胞中的任意步骤向亲本细胞中导入编码巯基-二硫键氧还酶的基因的修饰。在一个方面,修饰了 bdbC基因或其同源物。在另一个方面,修饰了 bdbD基因或其同源物。在另一个方面,修饰了 bdbC基因或其同源物以及bdbD基因或其同源物。在另一个方面,修饰了一个或多个(几个)bdbC基因和/或一个或多个(几个)bdbD基因(或巯基-二硫键氧还酶基因)。在另一个方面,所述bdbC基因包含SEQ ID NO: 1,SEQ ID NO: 3,SEQ ID N0:49, SEQ ID N0:51, SEQ ID N0:53, SEQ ID N0:55, SEQ ID N0:57,或 SEQ IDNO: 59。在另一个方面,所述bdbD 基因包含 SEQ ID NO: 3, SEQ ID N0:61,SEQ ID NO:63, SEQID N0:65,或 SEQ ID N0:67。巯基-二硫键氧还酶及其基因在本发明的方法中,所述巯基-二硫键氧还酶可为任何通过不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成得到不具有或具有较低生物活性的多肽而不利地影响异源多肽的产生的巯基-二硫键氧还酶。 在第一个方面,所述巯基-二硫键氧还酶包含与SEQ ID N0:2, SEQ ID NO:4, SEQID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO: 62,SEQ ID NO: 64,SEQ ID NO: 66,或 SEQ ID NO: 68 的多肽具有至少 60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,并具有巯基-二硫键氧还酶活性的氨基酸序列。在一个方面,所述多肽与SEQ ID NO: 2, SEQ IDNO:4, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ IDNO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID N0:66,或SEQ ID NO:68 的成熟多肽相差不多于十个氨基酸,例如相差九个氨基酸,相差八个氨基酸,相差七个氨基酸,相差六个氨基酸,相差五个氨基酸,相差四个氨基酸,相差三个氨基酸,相差两个氨基酸,和相差一个氨基酸。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID NO: 2的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:2的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO: 2的成熟多肽。在另一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID NO:4的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:4的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:4的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID NO:50的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:50的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO: 50的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:52的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:52的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO: 52的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:54的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:54的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO: 54的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:56的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:56的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO: 56的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:58的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:58的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID NO:58的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:60的 氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:60的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:60的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:62的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:62的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:62的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:64的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:64的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:64的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:66的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:66的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:66的成熟多肽。在一个实施方案中,所述巯基-二硫键氧还酶优选包含或组成为SEQ ID N0:68的氨基酸序列或其等位变体;或它们具有巯基-二硫键氧还酶活性的片段。在一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:68的氨基酸序列。在另一个方面,所述巯基-二硫键氧还酶包含或组成为SEQ ID N0:68的成熟多肽。在第二个方面,所述巯基-二硫键氧还酶由在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件或非常高严格条件下与SEQ ID NO: I, SEQID N0:3, SEQ ID N0:49, SEQ ID N0:51, SEQ ID N0:53, SEQ ID N0:55, SEQ ID N0:57,SEQ ID NO:59, SEQ ID N0:61, SEQ ID N0:63, SEQ ID N0:65,或 SEQ ID NO:67 ;其成熟多肽编码序列;或其全长互补链杂交的多核苷酸所编码(J. Sambrook,E. F. Fritsch和T.Maniatis, 1989, Molecular Cloning, A Laboratory Manual,第 2 版,Cold SpringHarbor, New York)。SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:49,SEQ ID NO:51, SEQ ID NO:53,SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID N0:61, SEQ ID NO:63, SEQ ID N0:65,或 SEQID NO: 67 的多核苷酸;或其亚序列;以及 SEQ ID NO: 2,SEQ ID NO: 4,SEQ ID NO: 50,SEQID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQID NO:64, SEQ ID NO:66,或SEQ ID NO:68的氨基酸序列;或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码巯基-二硫键氧还酶的DNA0具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组DNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,或最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸长度。可使用甚至更长的探针,例如,优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个核苷酸长度的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。因此,可从由这些其它菌株制备的基因组DNA文库中筛选DNA,其中所述DNA与上述探针杂交并编码巯基-二硫键氧还酶。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通 过其它分离技术分离来自这些其它菌株的基因组DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与 SEQ ID NO: I, SEQ ID N0:3, SEQ ID N0:49, SEQ ID N0:51, SEQ ID N0:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID N0:61, SEQ ID NO:63, SEQ ID N0:65,或 SEQID NO:67或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于 SEQ ID N0:1,SEQ ID NO:3, SEQ ID NO:49, SEQ ID N0:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID N0:61,SEQ ID N0:63,SEQ ID N0:65,或SEQ ID NO:67,其成熟多肽编码序列;或它们的全长互补链;或它们的亚序列。可使用例如X射线片(X-ray gilm)检测在这些条件下与核酸探针杂交的分子。在一个方面,所述核酸探针是SEQ ID NO: I, SEQ ID NO:3,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID N0:61,SEQ IDN0:63, SEQ ID N0:65,或SEQ ID NO:67的成熟多肽编码序列。在另一个方面,所述核酸探针是编码 SEQ ID NO: 2,SEQ ID NO: 4,SEQ ID NO: 50, SEQ ID NO: 52,SEQ ID NO: 54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,或 SEQID N0:68的多肽的多核苷酸,或其亚序列。在另一个方面,所述探针是SEQ ID NO: I, SEQID NO:3, SEQ ID NO:49,SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQID NO:59, SEQ ID N0:61, SEQ ID NO:63,SEQ ID N0:65,或 SEQ ID N0:67。对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5X SSPE、0. 3%SDS、200 μ g/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2X SSC、0. 2%SDS在45。。(非常低严格性),在50°C (低严格性),在55°C (中严格性),在60°C (中-高严格性),在65°C (高严格性),并且在70°C (非常高严格性)将载体材料最终洗涤三次,每次15分钟。在第三个方面,所述巯基-二硫键氧还酶由多核苷酸编码,所述多核苷酸包含或组成为与 SEQ ID NO: I, SEQ ID N0:3, SEQ ID N0:49, SEQ ID N0:51, SEQ ID N0:53, SEQID N0:55, SEQ ID N0:57, SEQ ID NO:59, SEQ ID N0:61, SEQ ID N0:63, SEQ ID N0:65,或SEQ ID NO :67或其成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性程度,并且编码巯基-二硫键氧还酶的核苷酸序列。在一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO: I。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO: I的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID N0:2或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO: I或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO: I的亚序列,其编码SEQ ID NO:2具有巯基-二硫键氧还酶活性的片段。 在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO: 3。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO: 3的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID N0:4或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:3或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO: 3的亚序列,其编码SEQ ID NO:4具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:49。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:49的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 50或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID N0:49或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:49的亚序列,其编码SEQ ID NO:50具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:51。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:51的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 52或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:51或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:51的亚序列,其编码SEQ ID NO:52具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:53。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:53的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 54或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:53或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:53的亚序列,其编码SEQ ID NO:54具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:55。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:55的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 56或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:55或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:55的亚序列,其编码SEQ ID NO:56具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:57。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:57的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 58或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:57或其成熟多肽编码序列 由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:57的亚序列,其编码SEQ ID NO:58具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:59。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:59的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID N0:60或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID NO:59或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:59的亚序列,其编码SEQ ID NO:60具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:61。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:61的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 62或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID N0:61或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID N0:61的亚序列,其编码SEQ ID NO:62具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:63。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:63的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID N0:64或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID N0:63或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:63的亚序列,其编码SEQ ID NO:64具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:65。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:65的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID N0:66或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID N0:65或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:65的亚序列,其编码SEQ ID NO:66具有巯基-二硫键氧还酶活性的片段。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID N0:67。在另一个实施方案中,所述多核苷酸包含或组成为SEQ ID NO:67的成熟多肽编码序列。本发明还涵盖多核苷酸,其编码多肽,所述多肽包含或组成为SEQ ID NO: 68或其成熟多肽的氨基酸序列,所述多核苷酸与SEQ ID N0:67或其成熟多肽编码序列由于遗传密码的简并性存在差异。本发明还涉及SEQ ID NO:67的亚序列,其编码SEQ ID NO:68具有巯基-二硫键氧还酶活性的片段。
可使用来源于其他产生巯基-二硫键氧还酶的微生物来源的同源于本文中所述的编码巯基-二硫键氧还酶的多核苷酸的多核苷酸以在所选的细菌细胞中修饰相应基因。用于分离或克隆编码巯基-二硫键氧还酶的多核苷酸的技术是本领域内已知的,并包括从基因组DNA分离。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis 等,1990,PCR:A Guide to Methods and Application, AcademicPress, New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription ;LAT)和基于核苷酸序列的扩增(NASBA)。可以从细菌菌株例如芽孢杆菌属克隆多核苷酸,并且因此可为例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。在一个实施方案中,所述编码巯基-二硫键氧还酶的多核苷酸优选包含或组成为与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55, SEQ ID N0:57, SEQ ID NO:59, SEQ ID N0:61, SEQ ID N0:63, SEQ ID N0:65,或 SEQ IDNO: 67,或其成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,并编码巯基-二硫键氧还酶的核苷酸序列。在另一个实施方案中,所述编码巯基-二硫键氧还酶的多核苷酸优选在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件或非常高严格条件下与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQID NO:57, SEQ ID NO:59, SEQ ID N0:61, SEQ ID NO:63,SEQ ID N0:65,或 SEQ ID NO:67 ;或其成熟多肽编码序列;或它们的全长互补链;或其等位变体和亚序列杂交(Sambrook等,1989,见上文),如本文中所述。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 2的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO: I。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 50的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:49。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 52的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:51。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 54的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:53。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 56的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:55。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID NO: 58的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:57。在一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:60的巯基-二硫键氧还酶的bdbC基因。在另一个方面,所述bdbC基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:59。在另一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:4的巯基-二硫键氧还酶的bdbD基因。在另一个方面,所述bdbD基因 包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:3。在另一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:62的巯基-二硫键氧还酶的bdbD基因。在另一个方面,所述bdbD基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:61。在另一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:64的巯基-二硫键氧还酶的bdbD基因。在另一个方面,所述bdbD基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:63。在另一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:66的巯基-二硫键氧还酶的bdbD基因。在另一个方面,所述bdbD基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:65。在另一个方面,所述巯基-二硫键氧还酶基因是编码SEQ ID N0:68的巯基-二硫键氧还酶的bdbD基因。在另一个方面,所述bdbD基因包含多核苷酸,所述多核苷酸包含或组成为 SEQ ID NO:67。多肽所述异源多肽可为任何具有目标生物活性的多肽。术语“异源多肽”在本文中定义为对于宿主细胞不是天然的多肽;其中进行结构修饰例如缺失、取代和/或插入而发生改变的天然多肽;或其表达由于通过重组DNA技术例如较强的启动子、DNA的多重拷贝等操纵编码多肽的DNA的结果而在数量上改变的天然多肽。所述多肽可为下文提及的多肽的天然出现的等位和工程变体。术语“多肽”在本文中并不刻意指示编码产物的具体长度,因此,涵盖肽、寡肽和蛋白。在一个方面,所述多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫调节剂(immunodiIator)、神经递质、受体、报道蛋白、结构蛋白或转录因子。在另一个方面,所述多肽是氧还酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在另一个方面,所述多肽是α-葡糖苷酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、甲壳酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、α-葡糖苷酶、β -葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶水解酶、过氧化物酶、磷脂酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。在另一个方面,所述多肽是白蛋白、胶原蛋白、原弹性蛋白、弹性蛋白或明胶。在另一个方面,所述多肽是包含两种或更多种(几种)多肽的部分的杂合多肽,例如,其中一种多肽的一部分融合于另一种多肽的一部分的N端或C端。一种或多种(几种)多肽对于细菌细胞可为异源的。在另一个方面,所述多肽为融合多肽或可切割的融合多肽,其中一种多肽融合于另一种多肽的N端或C端。用于产生融合多肽的技术在本领域是已知的,并包括连接编码所述多肽的编码序列,从而使得其在框内,且融合多肽的表达处于相同启动子和终止子调控之下。融合多肽亦可使用内蛋白(intein)技术来构建,其中融合体在翻译后构建(Cooper等,1993,EMBO J. 12:2575-2583;Dawson 等,1994,Science 266:776-779)。融合多肽可进一步在两个多肽之间包含切割位点。在融合蛋白分泌之后,该位点受切割,释放所述两个多肽。切割位点的实例包括但不限于公开于Martin等,2003,J.Ind. Microbiol. Biotechnol. 3:568-576 ;Svetina 等,2000,J.Biotechnol. 76:245-251 ;Rasmussen-WiIson 等,1997,Appl.Environ. Microbiol. 63:3488-3493 ;ffard等,1995,Biotechnology 13:498-503 ;and Contreras 等,1991,Biotechnology9:378-381 ; Eaton 等,1986,Biochemistry 25:505-512 ; Co 11ins-Racie等,1995, Biotechnology 13:982-987 ;Carter等,1989, Proteins: Structure, Function, a nd Genetics 6:240-248 ;以及 Stevens, 2003,Drug Discovery World 4:35-48 的位点。核酸构建体可以以多种方式操纵编码目标异源多肽的多核苷酸以提供所述多核苷酸在本发明的细菌突变体细胞中的表达。取决于核酸构建体或载体或细菌突变体细胞,在插入核酸构建体或载体之前对所述多核苷酸的核苷酸序列的操纵可为理想的或必需的。使用克隆方法修饰核苷酸序列的技术在本领域中是公知的。可将包含编码目标异源多肽的多核苷酸的核酸构建体可操作地连接于一个或多个(几个)调控序列,所述调控序列能够在与调控序列相容的条件下指导编码序列在细菌突变体细胞中的表达。每个调控序列对于编码目标多肽的多核苷酸可为天然的或外源的。此类调控序列包括但不限于前导序列、启动子、信号序列和转录终止子。最低限度,所述调控序列包括启动子、和转录和翻译停止信号。所述调控序列可与接头一并提供,以供导入便于将所述调控序列与多核苷酸的编码区连接的特定限制性位点。所述调控序列可为合适的启动子序列,其为由细菌突变体细胞识别,用于表达多核苷酸的核苷酸序列。启动子序列含有介导目标多肽表达的转录调控序列。启动子可为任何在细菌突变体细胞中显示转录活性的核苷酸序列,并可从指导具有生物活性、对细菌突变体细胞同源或异源的胞外或胞内多肽的合成的基因获得。用于在细菌细胞中指导核酸构建体转录的合适的启动子的实例为从如下获得的启动子大肠杆菌Iac操纵子、天蓝链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α -淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(PenP)、枯草芽孢杆菌xylA和xylB基因和原核β -内酰胺酶基因(Villa-Kamaroff 等,1978,Proceedings of the National Academy of Sciences USA75:3727-3731),以及 tac 启动子(DeBoer 等,1983,Proceedings of the National Academyof Sciences USA 80:21-25)。另外的启动子在"Useful proteins from recombinantbacteria"于 Scientific American, 1980,242:74-94 中;和在 J. Sambrook, E. F. Fritsch和T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold SpringHarbor, New York 中描述。所述调控序列亦可为合适的转录终止子序列,其为细菌细胞识别以终止转录的序列。所述终止子序列可操作地连接于编码目标多肽的多核苷酸序列的3’端。任何在细菌突变体细胞中具功能性的终止子可用于本发明。所述调控序列亦可为合适的前导序列,其为mRNA的不翻译区,对细菌细胞的翻译是重要的。所述前导序列可操作地连接于编码具有生物活性的多肽的多核苷酸的5’端。任何在细菌突变体细胞中具功能性的前导序列可用于本发明。所述调控序列亦可为信号肽编码区,其编码连接于多肽氨基端的氨基酸序列,所述序列可指导表达的多肽进入细胞分泌途径。所述信号肽编码区可对于所述多肽是天然的,或可从外源获得。多核苷酸的编码序列的5’端可固有地含有信号肽编码区,其天然地 在翻译阅读框内与编码分泌的多肽的编码区的片段相连接。或者,编码序列的5’端可含有信号肽编码区,其对于编码序列的该部分是外源的,并编码分泌的多肽。当编码序列通常不含有信号肽编码区时,可能需要外源信号肽编码区。或者,可简单地用所述外源信号肽编码区替代天然信号肽编码区,以获得相对于与编码序列通常相关的天然信号肽编码区而言多肽分泌的增强。所述信号肽编码区可从来自芽孢杆菌属菌种的淀粉酶或蛋白酶基因获得。然而,任何能够指导表达的多肽进入细菌突变体细胞的分泌途径的信号肽编码区可用于本发明。对于细菌细胞例如芽孢杆菌属细胞有效的信号肽编码区是从如下基因获得的信号肽编码区来自芽孢杆菌属NCIB 11837的产麦芽糖淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT, nprS, nprM)和枯草芽孢杆菌prsA基因。另外的信号妝由 Simonen 和 Palva, 1993,Microbiological Reviews 57:109-137 描述。所述调控序列亦可为mRNA稳定化序列。术语“mRNA稳定化序列”在本文中定义为位于启动子区下游和多核苷酸编码序列上游的序列,启动子区与该序列可操纵的连接,使得所有从启动子区合成的mRNA可经加工生成在转录物5’端具有稳定子序列的mRNA转录物。此种稳定子序列在mRNA转录物5’端的存在增加了其半寿期(Agaisse和Lereclus, 1994,supra, Hue 等,1995,Journal of Bacteriology 177:3465-3471)。所述mRNA加工/稳定化序列互补于细菌16S核糖体RNA的3’端。在一个方面,所述mRNA加工/稳定化序列生成基本上单一一种大小的转录物,在转录物的5’端具有稳定化序列。所述mRNA加工/稳定化序列优选为互补于细菌16S核糖体RNA 3’端的序列。参见,美国专利号6,255,076 和 5,955,310。对于细菌细胞有效的mRNA加工/稳定化序列为公开于WO 94/25612的苏云金芽孢杆菌cryIIIA mRNA加工/稳定化序列,或其保留mRNA加工/稳定功能的部分,或者为公开于 Hue 等,1995,Journal of Bacteriology 177:3465-3471 的枯草芽抱杆菌 SP82mRNA加工/稳定化序列,或其保留mRNA加工/稳定功能的部分。然后可使用本领域已知方法或本文中所述的那些方法将核酸构建体导入细菌细胞,以供表达目标多肽。
重组表达载体在本发明的方法中,包含编码目标异源多肽的多核苷酸,启动子和转录和翻译终止信号的重组表达载体可用于重组产生所述多肽。上文中所述的多种核酸和调控序列可连接在一起以产生重组表达载体,所述载体可包含一个或多个(几个)便利的限制性位点以允许在此类位点插入或取代编码目标多肽的多核苷酸。或者,所述多核苷酸可通过将包含所述序列的核苷酸序列或核酸构建体插入合适的供表达的载体来表达。在构建所述表达载体时,编码序列位于载体中,使得编码序列可操作地连接于对于表达以及可能的分泌合适的调控序列。所述重组表达载体可为任何可方便地接受重组DNA方法,并可导致多核苷酸表达的载体。对载体的选择通常会取决于载体与导入载体的细菌突变体细胞的相容性。载体可为直链的或闭合环状的质粒。载体可为自主复制的载体,即作为染色体外实体存在、其复制独立于染色体复制的载体,例如质粒、染色体外元件、微型染色体或人工染色体。所述载体可含有任何确保自主复制的元件(means)。或者,所述载体可为当导入细菌突变体细胞时,整合入基因组并与其整合入的染色体一同复制的载体。所述载体系统可为单个载体或质 粒,或者一同含有待导入细菌细胞基因组的总DNA的两个或更多个载体或质粒,或转座子。所述载体优选含有允许将载体整合入细菌细胞基因组或允许载体在细菌细胞中独立于其基因组自主复制的元件。为了整合入细菌细胞基因组,所述载体可依赖于编码多肽的多核苷酸的序列或其他任何载体元件以供通过同源或非同源重组整合入基因组。或者,所述载体可含有其他核苷酸序列以供指导通过同源重组在染色体的精确位置处整合入宿主细胞的基因组。为了增加在精确位置处整合的可能性,整合元件应优选含有充足数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,并与对应的靶序列具有高度的序列同一性程度以增强同源重组的可能性。所述整合元件可为任何与细菌细胞基因组中的靶序列同源的序列。此外,所述整合元件可为非编码或编码的核苷酸序列。为了进行自主复制,所述载体可进一步包含使得所述载体能够在细菌细胞中自主复制的复制起点。所述复制起点可为任何介导在细菌细胞中具功能的自主复制的质粒复制子。术语“复制起点”或“质粒复制子”在本文中定义为使得质粒或载体能够在体内复制的核苷酸序列。细菌复制起点的实例为允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUBllO、pE194、pTA1060和ρΑΜβ I的复制起点。所述复制起点可为具有使其在细菌细胞中的功能具温度敏感性的突变的复制起点(参见,例如 Ehrlich, 1978,Proceedings of the National Academy ofSciences USA 75:1433-1436)。可将多于一个拷贝的编码目标多肽的多核苷酸导入细菌细胞以扩增所述多核苷酸的表达。多核苷酸的稳定扩增可通过使用本领域中公知的方法将至少一个附加拷贝的序列整合入细菌细胞基因组并选择转化体来获得。实现扩增的方便方法描述于WO 94/14968。所述载体优选含有一个或多个(几个)允许方便地选择转化细胞的选择性标志物。选择性标志物是其产物提供杀生物剂抗性、重金属抗性、针对营养缺陷型的原养型等的基因。细菌选择性标志物的实例为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性如氨苄青霉素、卡那霉素、红霉素、氯霉素或四环素抗性的标记。此外,选择可通过共转化,例如如WO 91/09129中所述的来完成,其中所述选择性标志物在不同的载体上。用于连接上述元件以构建重组表达载体的方法对于本领域技术人员是公知的(参见,例如,Sambrook等,1989,见上)。可通过如下方法实现将DNA导入芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang 和 Cohen, 1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young 和 Spizizen, 1961, Journal of Bacteriology81:823-829 或 Dubnau 和 Davidoff-Abelson, 1971,Journal of Molecular Biology56:209-221),电穿孔(参见,例如,Shigekawa 和 Dower, 1988,Biotechniques6:742-751)或接合(参见,例如,Koehler 和 Thorne, 1987,Journal of Bacteriology169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan, 1983, J. Mol. Biol. 166:557-580)或电穿孔(参见,例如,Dower 等,1988,Nucleic Acids Res. 16:6127-6145)。可通过如下方法实现将 DNA 引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,Folia Microbiol. (Praha) 49:399-405),接合(参见,例如,Mazodier 等,1989,J.Bacteriol. 171:3583-3585),或转导(参见,例如,Burke 等,2001,Proc. Natl. Acad. Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞例如电穿孔(参见,例如,Choi 等,2006,J. Microbiol. Methods 64:391-397)或接合(参见,例如,Pinedo 和 Smets, 2005, Appl. Environ. Microbiol. 71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(natural competence)(参见,例如,Perry和 Kuramitsu, 1981, Infect. Tmmun. 32:1295-1297),原生质体转化(参见,例如,Catt 和Jollick, 1991, Microbios. 68:189-207),电穿孑L (参见,例如,Buckley 等,1999, Appl.Environ. Microbiol. 65:3800-3804)或接合(参见,例如,Clewell, 1981, Microbiol.Rev. 45:409-436)。本发明进一步通过下述实例来描述,其不应视作对本发明的范围的限制。
实施例使用Anagnostopoulos和Spizizen,1961,Journal of Bacteriology 81:741-746所述的方法使枯草芽孢杆菌成为感受态。DNA 测序用 ABI 3700Sequencing(Applied Biosystems, Inc. , Foster City,CA, USA)进行。培养基2X YT琼脂平板的构成为16g的胰蛋白胨,IOg的酵母提取物,5g的氯化钠,15g的Bactoagar,和去离子水加至I升。LB培养基的构成为IOg的胰蛋白胨,5g的酵母提取物,IOg氯化钠,和去离子水加至 I 升(pH 7. 4)。实施例I :枯草芽孢杆菌菌株SM025的构建如下所述构建了枯草芽孢杆菌菌株SM025以缺失枯草芽孢杆菌菌株Α164Δ10中的胞内丝氨酸蛋白酶(ispA)基因(Bindel-Connelly等,2004,J.Bacteriol. 186:4159 - 4167)。
通过藉由重叠延伸(SOE) (Horton等,1989,Gene 77:61-8)的剪接构建了缺失质粒pNNB194-ispAA。ispA基因的5’和3’的侧翼DNA序列通过PCR扩增分别使用如下所示的引物对994525/994526和994527/994528从来源于枯草芽孢杆菌菌株164Λ5(美国专利号5,891,701)的染色体DNA获得。染色体DNA根据Pitcher等,1989,Lett. Appl.Microbiol. 8:151-156 的步骤获得。引物994525:5’-GGATCCATTATGTAGGGCGTAAAGC-3’ (SEQ ID NO:5)引物994526:5’-TTAGCAAGCTTAATCACTTTAATGCCCTCAG-3’ (SEQ ID NO:6)引物994527: 5’-TGATTAAGCTTGCTAATCCGCAGGACACTTC-3’ (SEQ ID NO:7)引物994528:5’-GGTACCAACACTGCCTCTCTCATCTC-3’ (SEQ ID NO:8)PCR扩增在50 μ I反应中进行,其构成为IOng的枯草芽孢杆菌菌株164Λ 5染色体 DNA,各 O. 4 μ M 的引物,各 200 μ M 的 dATP、dCTP、dGTP 和 dTTP,含 2. 5mM MgCl2 的IX PCR 缓冲液 II (Applied Biosystems, Inc. , Foster City, CA, USA),和 2. 5 单位的AmpliTaq GOLD DNA 聚合酶(Applied Biosystems, Inc. , Foster City, CA, USA)。该反应在ROBOCYCLER_ 〖0温度循环仪(Stratagene,Corp.,La Jolla, CA, USA)中进行,其程序如下1个循环,在95°C进行10分钟;25个循环,每个在95°C进行I分钟,50°C进行I分钟和72°C进行I分钟;和I个循环,在72 °C进行7分钟。通过使用0. 5X TBE缓冲液(50mM Tri s碱-50mM硼酸-ImM EDTA 二钠盐)的0.8%琼脂糖凝胶电泳解析PCR产物。将使用针对ispA基因5’侧翼DNA序列的引物对994525/994526获得的大约400bp的条带从凝胶切出,并使用Ql AQUICK 凝胶提取试剂盒(QIAGEN Inc.,Valencia, CA, USA)提取。将使用针对ispA基因3’侧翼DNA序列的引物对994527/994528获得的大约400bp的条带从凝胶切出,并使用QIAQUICK' 凝胶提取试剂盒提取。使用与上述相同的步骤用作为模板的400bp片段和如上所示的引物994525和994528扩增最终SOE片段,以产生ispA缺失片段。通过使用0. 5XTBE缓冲液的0. 8%琼脂糖凝胶电泳来解析大约800bp的PCR产物。将最终800bpSOE 片段使用TA-TOPO_ 克隆试剂盒(Invitrogen, Inc.,Carlsbad, CA, USA)克隆入pCR 2. I (Invitrogen, Inc. , Carlsbad, CA, USA),并依照生产商的指不转化入 ONE SHOTΡ10 化学感受态大肠杆菌细胞(Invitrogen, Inc. , Carlsbad, CA, USA)。在补充每ml 100 μ g的氨苄青霉素的2XYT琼脂平板上选择转化体并在37°C温育16小时。克隆的片段的DNA序列用M13正向和反向引物(Invitrogen, Inc. , Carlsbad, CA, USA)通过DNA测序验证。将所述质粒命名为pCR_ 2. 1-ispAA。将质粒pCR2. Ι-ispA Δ用Bam HI和Asp718消化,并对其进行使用0. 5XTBE缓冲液的0. 8%琼脂糖凝胶电泳以分离ispA缺失片段。将对应于ispA缺失片段的SOObp片段从凝胶切出,并使用QlAQUICK 凝胶提取试剂盒提取。用Bam HI和Asp718消化温度敏感性质粒pNNB194(pSK+/pE194 ;美国专利号5,958,728),并通过使用O. 5X TBE缓冲液的O. 8%琼脂糖凝胶电泳解析以分离载体片段。将PNNB194的6. 6kb载体片段从凝胶切出并使用QIAQUICK 凝胶提取试剂盒提取。将ispA缺失片段和pNNB194片段使用快速DNA连接试剂盒(Roche AppliedScience, Indianapolis, IN, USA)连接在一起,并将连接混合物转化入依照生产商的指示就氨节青霉素抗性选择的大肠杆菌SURE 细胞(Stratagene Corp. , La Jolla, CA, USA)。从八个转化体使用BlOROB()T_ 9600 (QIAGENInc.,Valencia, CA, USA)分离质粒 DNA,用 BamHI和Asp718消化,并如上所述通过琼脂糖凝胶电泳分析以鉴定携带ispAA片段的质粒。鉴定了一个转化体并命名为pNNB194-ispAA (图I)。将质粒pNNB194_ispAA通过在补充每ml I μ g的红霉素和25 μ g的林可霉素的Tryptose血琼脂基础(TBAB)平板上在45°C进行选择性生长来导入枯草芽孢杆菌A164 Δ 10 (Bindel-Connelly 等,2004,J. Bacteriol. 186:4159-4167)并整合于 ispA 基因座。然后将整合的质粒通过在34°C在LB培养基上非选择性生长而切出。依照Pitcher等,1989,见上文的方法从几个红霉素敏感克隆分离染色体DNA,并使用引物994525和994528依照如上所述的相同方法通过PCR进行分析以确证ispA缺失的存在。一种该克隆 命名为枯草芽孢杆菌SM025。实施例2 :pRB219的构建质粒pRB219基于pM0L2657(图2 ;SEQ ID N0:9),其为携带编码JEl α -淀粉酶(SP722 α -淀粉酶的变体),和来自地衣芽孢杆菌的prsA分子伴侣(Rey等,2004, GenomeBiology 5:R77)的转录操纵子的基于pUC19的质粒(W099/23211) jrsA基因编码必需的膜结合脂蛋白,所述膜结合脂蛋白假定为协助输出蛋白的转位后折叠,并使其在细胞质膜和细胞壁之间的腔室中稳定化。所述转录操纵子的上游为来自苏云金芽孢杆菌tenebrionis亚种cryIIIA基因(W0 99/43835A)的mRNA稳定化序列,其在本文中称为“cryIIIA mRNA稳定化序列”。JEla-淀粉酶通过直接插入成熟位点上游的序列融合于地衣芽孢杆菌α-淀粉酶(amyL)基因的信号肽(美国专利申请2009/0263881)。质粒DRB216 :用Not I消化质粒pM0L2657,并将其末端平端化,即在111与了40嫩聚合酶(Roche Applied Science, Indianapolis, IN, USA)和各 25 μ M 的 dATP、dCTP、dGTP和dTTP温育20分钟,继以通过在75°C温育10分钟来使T4DNA聚合酶热失活。将消化的质粒使用Q丨AQUICK DNA纯化试剂盒(QIAGEN Inc.,Valencia, CA, USA)依照生产商的指示进行纯化。将纯化的质粒用T4DNA连接酶处理,然后依照生产商的指示转化入大肠杆菌 XL-IBlue 感受态细胞(Invitrogen, Inc. , Carlsbad, CA, USA)。在补充每 ml 100 μ g 的氨苄青霉素的2X YT平板上选择氨苄青霉素抗性转化体。从八个转化体使用BIOROBOT 9600分离质粒DNA,并通过无法用Not I消化质粒DNA来确证Not I位点的破坏。将质粒DNA亦用BglII消化,并如上所述通过琼脂糖电泳分析以确证质粒的身份。将具有预期的大约3. 2kb和2. 7kb的限制性片段的质粒命名为pRB216。质粒pRB217 :质粒pRB217通过使用如下所示的引物prsA-lF和prsA_2R从质粒PRB216PCR扩增prsA基因来构建。引物prsA-lF中组入了 Eco RI,Mlu I和Hpa I限制性位点,而引物prsA-2R中组入了 Not I限制性位点。引物prsA-lF:5’ -GAATTCACGCGTGTTAACTATGATTAGGAGTGTTTGCATT-3’ (SEQ ID NO:10)
引物prsA_2R:5’ -GCGGCCGCTATACTAGTTATCTCAACGAAATTTATAAGAC-3’ (SEQ ID NO:11)PCR扩增在50 μ I反应中重复三次进行,所述反应的构成为Ing的pRB216DNA,各O. 4 μ M 的引物PrsA-IF和 prsA-2R,各 200 μ M 的 dATP、dCTP、dGTP和 dTTP,含 2. 5mM MgCl2 的IX PCR缓冲液II,和2. 5单位的AmpliTaqGOLD DNA聚合酶。反应在ROBOCYCLER 40温度循环以中进行,其程序为1个循环,在95 °C进行2分钟;30个循环,每循环在95 °C进行I分钟,55 °C进行I分钟,和72°C进行3分钟;和I个循环,在72 °C进行3分钟。PCR产物通过使用O. 5X TBE缓冲液的O. 8%琼脂糖凝胶电泳分离。从凝胶切出大约I. Okb的片段,并使用QIAQUICK 凝胶提取试剂盒提取。将所得的PCR产物使用TOPO TA克隆试剂盒依照生产商的指示克隆入pCR 2.1-TOPO ,并依照生产商的指示转化入ONE SHOT T0P10化学感受态大肠杆菌细胞。将转化体在补充每ml 100 μ g的氨苄青霉素的2X YT琼脂平板上进行选择。从八个转化体使用BIOROBOT 9600分离质粒DNA,并通过EcoRI消化继以使用O. 5X TBE缓冲液的O. 8%琼脂糖凝胶电泳来验证含·有prsA片段。鉴定了一个具有预期的大约3. 9kb和I. Okb的限制性片段的质粒,并命名为pRB217(图3)。克隆的片段的DNA序列使用M13正向和反向引物通过DNA测序来验证。质粒DRB219:用 Eco RI 和Not I 消化质粒pDG268MCS Λ neo-crylllA stab/SAV (美国专利号5,955,310)和pRB217。对消化的质粒进行使用O. 5X TBE缓冲液的O. 8%琼脂糖凝胶电泳。将来自PDG268 Δ neo-cryIIIA stab/SAV的8. Okb载体片段和来自pRB217的I. OkbprsA插入片段从凝胶切出并使用QIAQUICK 凝胶提取试剂盒提取。将载体片段和prsA插入片段使用快速DNA连接试剂盒连接在一起并将连接混合物转化入依照生产商的指示就氨苄青霉素抗性选择的大肠杆菌SURE 细胞。从几个转化体使用BIOROBOT 9600纯化质粒DNA,并通过Xho I消化继以使用O. 5X TBE缓冲液的O. 8%琼脂糖凝胶电泳来进行分析。鉴定了一个具有预期的大约5. 5kb和3. 5kb的限制性片段的质粒,并命名为pRB219(图 4)。实施例3 :枯草芽孢杆菌EXP01955的构建使用直链整合载体系统以供野生型嗜热网球菌(Dictyoglomus thermophilum)家族11木聚糖酶基因(SEQ ID NO: 12 [DNA序列]和SEQ ID NO: 13 [推导的氨基酸序列])的合成型式的表达克隆。所述合成基因编码不具有结合域并不具有信号肽的蛋白质(SEQID NO: 14[DNA序列]和SEQ ID NO: 15 [推导的氨基酸序列])。所述合成基因序列基于公开的基因序列 UNIPR0T:P77853。遵循 Gustafsson 等,2004,Trends in Biotechnology22:346-353的推荐对所述合成基因进行密码子优化以供在枯草芽孢杆菌中的表达。所述合成基因由DNA2. O (Menlo Park, CA, USA)生成,并作为其标准克隆载体(卡那霉素抗性)中的克隆片段交付。所述木聚糖酶基因作为不具有结合域而具有来自克劳氏芽孢杆菌丝氨酸蛋白酶基因(aprH, SAVINASE , Novo Nordisk A/S, Bagsvaerd, Denmark)的信号妝(包含于侧翼区)的截短的基因克隆。基因设计为含有C端HQHQHQHQP标记以便于纯化。正向引物设计为使得将基因从信号肽切割位点扩增,并具有26个碱基的悬突(在下表中显示为斜体)。该悬突互补于两个直链载体片段之一的一部分,并在组装PCR片段和载体片段(如下所述)时使用。反向引物设计为扩增基因的截短型式,并含有由编码HQHQHQHQP标记的30bp和终止密码子组成的悬突(悬突在下表中显示为斜体)。该悬突互补于两个直链载体片段之一的一部分,并在组装PCR片段和载体片段(如下所述)时使用。所述直链整合构建体是通过将两个枯草芽孢杆菌同源染色体区之间的每个基因与强启动子和氯霉素抗性标志物一同融合而制成的PCR融合产物。该融合是通过藉由重叠延伸(SOE) (Horton等,1989,supra)的剪接制成的。SOEPCR方法亦描述于WO2003/095658。将每个基因在三重启动子系统(描述于WO 99/43835)的调控下表达,所述系统由来自地衣芽孢杆菌α-淀粉酶基因(amyL)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子,以及含有mRNA稳定化序列的苏云金芽孢杆菌cryIIIA启动子组成。编码氯霉素乙酰转移酶的基因用作标志物(例如,由Diderichsen等,1993,Plasmid30:312描述)。通过同源重组将最终基因构建体整合入芽孢杆菌属染色体的果胶酸裂合酶基因座。使用下表I中所示的引物通过PCR从质粒7587扩增了 GHll木聚糖酶基因。质粒7587含有不具结合域并不具信号肽的合成的嗜热网球菌GHll木聚糖酶基因(SEQ IDNO:14)。 PCR扩增了三个片段以制备构建体含有截短的木聚糖酶基因的基因片段,和作为悬突包含于引物中的26bp和30bp侧翼DNA序列,上游侧翼片段(包含来自克劳氏芽孢杆菌aprH基因并用引物260558和iMB1361Uni2扩增的信号肽序列)和下游侧翼片段(用引物260559和HQHQHQHQP-f扩增)。侧翼片段从菌株iMB1361的基因组DNA扩增(描述于WO 2003/095658的实施例4)。所有使用的引物列于下表I。基因片段使用PHUSION DNA聚合酶(Finnzymes,Finland)依照生产商的指示进行扩增。两个侧翼DNA片段使用EXPAND 高保真PCR系统(Roche-Applied-Science,Indianapolis, IN, USA)依照生产商的推荐进行扩增。PCR条件如下所述1个循环,在94°C进行2分钟;10个循环,每循环在94°C进行15秒,50°C进行45秒,和68°C进行4分钟;20个循环,每循环在94°C进行15秒,50°C进行45秒,和68°C进行4分钟(每循环+20秒延伸);和I个循环,在68°C进行10分钟。对3个PCR片段进行后续的通过重叠延伸(SOE)PCR反应进行的剪接以将3个片段组装入一个直链载体构建体。SOE通过将3个片段以等摩尔比例混合进行,并在下述条件下进行新的PCR反应1个循环,在94°C进行2分钟;10个循环,每循环在94°C进行15秒,50°C进行45秒,和68°C进行5分钟;10个循环,每循环在94°C进行15秒,50°C进行45秒,和68°C进行8分钟;和15个循环,每循环在94°C进行15秒,50°C进行45秒,和68°C进行8分钟(每循环再增加20秒)。在第一个循环之后,添加两个末端引物260558和260559(各20pMol)。将两μ I的PCR产物转化入枯草芽孢杆菌PL4250 (AprE-, NprE-, SrfC-, SpoIIAC-, AmyE-, comS+)。在补充每ml 6 μ g的氯霉素的LB平板上选择转化体。通过同源重组将截短的木聚糖酶构建体整合入枯草芽孢杆菌PL4250的基因组。选择一个转化体EXP01955用于进一步研究。对该转化体中的木聚糖酶编码区进行测序,并发现其含有一个使得HQHQHQHQP-标记变为HQHQHQHQQ-标记的突变,但未观察到其他突变。表I:引物
权利要求
1.一种亲本细菌细胞的分离的突变体,包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,其中所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的。
2.权利要求I的突变体,其中所述巯基-二硫键氧还酶基因选自下组 (a)编码巯基-二硫键氧还酶的基因,所述巯基-二硫键氧还酶包含氨基酸序列,所述氨基酸序列与 SEQ ID N0:2, SEQ ID NO:4, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,或SEQ ID NO :68 ;或其成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性; (b)编码巯基-二硫键氧还酶的基因,其包含核苷酸序列,所述核苷酸序列在至少低严格条件,例如中等严格条件,中-高严格条件,高严格条件或非常高严格条件下与SEQ IDNO: I, SEQ ID NO:3, SEQ ID N0:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ IDNO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65,或 SEQ ID NO:67 ;其成熟多肽编码序列;或其全长互补链杂交;和 (c)编码巯基-二硫键氧还酶的基因,其包含核苷酸序列,所述核苷酸序列与SEQIDNO: I, SEQ ID NO:3, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ IDNO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65,或 SEQ ID NO:67 ;或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
3.权利要求I或2的突变体,其中所述第一多核苷酸编码的多肽是抗原、酶、生长因子、激素、免疫调节剂(immunodilator)、神经递质、受体、报道蛋白、结构蛋白或转录因子。
4.权利要求1-3任一项的突变体,其中所述亲本细菌细胞是芽孢杆菌属(Bacillus)细胞。
5.权利要求4的突变体,其中所述芽孢杆菌属细胞是枯草芽孢杆菌(Bacillussubtilis)细胞或地衣芽抱杆菌(Bacillus licheniformis)细胞。
6.权利要求1-5任一项的突变体,其在相同条件下培养时,与亲本细菌细胞相比产生至少约25%更少的所述巯基-二硫键氧还酶,或不产生可检测到的所述巯基-二硫键氧还酶。
7.—种产生异源多肽的方法,包括 (a)在用于产生所述异源多肽的培养基中培养权利要求1-6任一项的突变体;和 (b)从培养基回收所述异源多肽。
8.一种获得亲本细菌细胞的突变体的方法,包括 (a)向所述亲本细菌细胞导入编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸;和 (b)鉴定包含修饰的多核苷酸的来自步骤(a)的突变体细胞,其中所述突变体细胞在巯基-二硫键氧还酶产生方面是缺陷的。
9.权利要求8的方法,其中所述巯基-二硫键氧还酶基因选自下组 (a)编码巯基-二硫键氧还酶的基因,所述巯基-二硫键氧还酶包含氨基酸序列,所述氨基酸序列与 SEQ ID N0:2, SEQ ID NO:4, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,或SEQ ID NO :68 ;或其成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性; (b)编码巯基-二硫键氧还酶的基因,其包含核苷酸序列,所述核苷酸序列在至少低严格条件,例如中等严格条件,中-高严格条件,高严格条件或非常高严格条件下与SEQ ID NO: I, SEQ ID NO:3, SEQ ID N0:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ IDNO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65,或 SEQ ID NO:67 ;其成熟多肽编码序列;或其全长互补链杂交;和 (c)编码巯基-二硫键氧还酶的基因,其包含核苷酸序列,所述核苷酸序列与SEQIDNO: I, SEQ ID NO:3, SEQ ID N0:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ IDNO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65,或 SEQ ID NO:67 ;或其成熟多肽编码序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
10.权利要求8或9的方法,其中所述第一多核苷酸编码的多肽是抗原、酶、生长因子、激素、免疫调节剂(immunodilator)、神经递质、受体、报道蛋白、结构蛋白或转录因子。
11.权利要求8-10任一项的方法,其中所述亲本细菌细胞是芽孢杆菌属细胞。
12.权利要求11的方法,其中所述芽孢杆菌属细胞是枯草芽孢杆菌细胞或地衣芽孢杆菌细胞。
13.权利要求8-12任一项的方法,其在相同条件下培养时,与亲本细菌细胞相比产生至少约25%更少的所述巯基-二硫键氧还酶,或不产生可检测到的所述巯基-二硫键氧还酶。
全文摘要
本发明涉及产生异源多肽的方法,包括(a)在用于产生异源多肽的培养基中培养亲本细菌细胞的突变体,其中(i)所述突变体细胞包含编码包含两个或更多个(几个)半胱氨酸的异源多肽的第一多核苷酸,和包含编码不正确地催化所述异源多肽的两个或更多个(几个)半胱氨酸之间的一个或多个(几个)二硫键形成的巯基-二硫键氧还酶的基因的修饰的第二多核苷酸,和(ii)所述突变体细胞在相同条件下培养时相对于亲本细菌细胞在巯基-二硫键氧还酶产生方面是缺陷的,和(b)从培养基回收所述异源多肽。本发明还涉及此类细菌突变体和产生此类细菌突变体的方法。
文档编号C12N15/53GK102762723SQ201080064301
公开日2012年10月31日 申请日期2010年12月17日 优先权日2009年12月21日
发明者B.克里斯坦森, W.韦德纳 申请人:诺维信公司, 诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1