生产蛋白质的方法

文档序号:555120阅读:1971来源:国知局
专利名称:生产蛋白质的方法
技术领域
本发明涉及在棒状杆菌型细菌中分泌生产(产生并分泌)异源蛋白质的方法,并更具体地,涉及在棒状杆菌型细菌中分泌生产异源蛋白质,包括工业上有用的酶和生理学活性蛋白质的方法。
背景技术
棒状杆菌型细菌作为L-氨基酸如L-谷氨酸和L-赖氨酸以及核酸的生产菌在发酵工业中是非常有用的。此外,棒状杆菌型细菌与被认为更优选用于分泌异源蛋白质的霉菌、酵母和芽孢杆菌细菌相比固有地向细胞外分泌极低水平的蛋白,这使得在生产和分泌异源蛋白质的情况中简化或省略纯化步骤成为可能。棒状杆菌型细菌也可以在含有糖、氨和无机盐的简单培养基中快速生长,这使得它们在培养基成本、培养方法和培养物生产力方面是优越的,而且也被认为在异源蛋白质的产生中是极为有用的细菌。
使用棒状杆菌型细菌有效地生产并分泌异源蛋白质的方法的实例包括通过谷氨酸棒杆菌(Corynebacterium glutamicum)(缩写为C.glutamicum)分泌核酸酶和脂肪酶(美国专利No.4965197,J.Bacteriol.,174,1854-1861(1992)),分泌蛋白酶例如枯草杆菌蛋白酶(subtilisin)(App.Environ.Microbiol.,61,1610-1613(1995)),分泌棒状杆菌型细菌的细胞表层蛋白(日本国际专利申请公开No.H6-502548),使用棒状杆菌型细菌分泌纤连蛋白结合蛋白(fibronectin-bound protein)(Appi.Environ.Microbiol.,63,4392-4400(1997)),使用突变的分泌元件(component)分泌蛋白质的方法(日本专利申请公开No.H11-169182),生产并分泌转谷氨酰胺酶(transglutaminase)的方法(Appl.Environ.Microbiol.,69,358-366(2003)),以及使用突变菌株生产并分泌转谷氨酰胺酶的方法(WO 02/81694)。对于积累的蛋白质的量来说,使用源自枯草芽孢杆菌(Bacillus subtilis)的枯草杆菌蛋白酶基因(aprE)的启动子,核糖体结合位点和信号肽序列在谷氨酸棒杆菌中表达源自节瘤偶蹄形菌(Dichelobacter nodosus)的碱性蛋白酶基因,已观察到约2.5mg/ml的积累(Appl.Environ.Micribiol.,61,1610-1613(1995))。对于转谷氨酰胺酶的分泌,已经证实了930mg/L的最大分泌积累(WO 02/81694)。
在棒状杆菌型细菌中先前已知的蛋白分泌途径是称为Sec系统(机制)的途径。Sec机制存在于内细胞质膜,并由一些元件组成,所述元件主要含有SecY(日本专利申请公开No.H6-169780)、SecE(日本专利申请公开No.H6-277073)和SecG(日本专利申请公开No.H11-169182),其作为蛋白质分泌通道起作用,以及SecA(日本专利申请公开No.H7-107981),其作为蛋白透过的驱动力来源起作用。这个系统存在于广泛的微生物中,从包括大肠杆菌(Escherichia coli)和枯草芽孢杆菌的原核生物到包括酵母、霉菌和人的真核生物,是最重要和最常见的蛋白质分泌途径。
然而,已知某些蛋白质难以在棒状杆菌型细菌中通过Sec系统分泌,这种蛋白质的实例包括工业上有用的蛋白质,例如异麦芽糖葡聚糖酶和蛋白转谷氨酰胺酶。
近来在植物细胞叶绿体的类囊体膜(thylakoid membrane)中发现了与Sec系统完全不同的蛋白质分泌途径(EMBO J.,14,2715-2722(1995))。对于通过这个途径分泌的蛋白质的信号序列,一种精氨酸-精氨酸序列是共同的(EMBO J.,14,2715-2722(1995)),因此,这个途径被称为Tat系统(双精氨酸转位系统,Twin-Arginine Translocation system)。随后,这种Tat系统被确定为特异性地参与具有共有的精氨酸-精氨酸信号序列的蛋白质的分泌,所述蛋白质例如大肠杆菌还原激酶(reductokinase)、硝酸还原酶(nitratereductase)、枯草芽孢杆菌硫辛酸(lipoic acid)合成酶和磷酸二酯酶(Science,278,1467-1470(1997),美国专利No.6022952,美国专利No.6335178,J.Biol.Chem.,275,41350-41357,国际专利公开No.WO 02/22667)。
另外,与蛋白质在Sec系统中在形成高级结构前被分泌相对的,Tat系统的特征在于通过细胞膜分泌形成高级结构后的蛋白质(J.Biol.Chem.,25,273(52),34868-74(1998))。
虽然与编码Tat系统元件的基因具有高同源性的基因已经被证明也存在于棒状杆菌型细菌中,其包括tatA(GENEBANK cg103060 1571065-1571382)、tatB(GENEBANK cg103060 1167110-1167580)、tatC(GENEBANK cg1030601569929-1570873)和tatE(gi|41223046|emb|CAF18991.1),但它们的功能是未知的,而且不知道在棒状杆菌型细菌中蛋白质是否通过Tat系统途径分泌。
另外,虽然有通过将表达编码Tat系统分泌元件的tatA、tatB和tatC基因的质粒导入到大肠杆菌中,观察到改善了由Tat途径分泌到周质中的量的报道,但积累的量仅有5到10mg/L,这没有达到工业上的实用水平(Biochem.Biophys.Res.Commun.,304,279-284(2003))。

发明内容
本发明的目的是提供在棒状杆菌型细菌中有效地在细胞外分泌(分泌生产)工业上有用的异源蛋白质的方法,所述蛋白质难以使用分泌蛋白质的途径之一的Sec系统来分泌。
更具体地,本发明的目的是提供通过在棒状杆菌型细菌中产生并有效地分泌(分泌生产)工业上有用的异源蛋白质来有效地生产异源蛋白质的方法,所述异源蛋白质难以通过蛋白质分泌途径之一的Sec系统来分泌。
作为致力于棒状杆菌型细菌中蛋白质分泌途径的机制的结果,本发明人发现,一种不同于先前已知的Sec系统的蛋白质分泌途径-Tat系统,在棒状杆菌型细菌中是有功能的。更具体地,本发明人发现这样的现象通过在被认为构成棒状杆菌型细菌蛋白质分泌途径Tat系统的蛋白质的编码基因中引起缺陷,使先前被分泌的蛋白质不再被分泌。这证实了在棒状杆菌型细菌中Tat系统也是有功能的。此外,本发明人发现了Tat系统依赖性信号序列,并且发现,通过将表达构建体导入棒状杆菌型细菌并培养得到的转化的棒状杆菌型细菌可以有效地分泌目标蛋白质,所述表达构建体含有连接到编码所述信号的序列下游的目标蛋白质的基因序列,所述蛋白质难以用先前已知的蛋白质分泌途径Sec系统来分泌。本发明人还发现,难以通过Sec系统的常规蛋白质分泌途径分泌的异源蛋白质,例如,异麦芽糖葡聚糖酶和蛋白-谷氨酰胺酶,可以通过使用Tat系统有效地分泌,所述Tat系统是在棒状杆菌型细菌中新发现的蛋白质分泌途径,由此产生了本发明。此外,本发明人还发现,在棒状杆菌型细菌中通过扩增编码Tat系统分泌元件的基因,使用Tat系统可以提高可分泌蛋白质的量。
本发明是生产异源蛋白质的方法,其包括培养携带表达遗传构建体的棒状杆菌型细菌并通过所述棒状杆菌型细菌生产并分泌异源蛋白质,所述表达遗传构建体在5′-端到3′-端方向上含有在棒状杆菌型细菌中起作用的启动子序列、编码Tat系统依赖性信号肽区域的核酸序列和编码异源蛋白质的核酸序列。
更具体地,本发明是以上说明的用于生产异源蛋白质的方法,其中所述Tat系统依赖性信号肽含有SEQ ID NO.31或32中描述的序列。
再更具体地,本发明是以上说明的用于生产异源蛋白质的方法,其中所述Tat系统依赖性信号肽含有SEQ ID NO.28到30中描述的任一序列。
具体地,本发明是以上说明的用于生产异源蛋白质的方法,其中所述Tat系统依赖性信号肽是异麦芽糖葡聚糖酶的信号肽或三甲胺-N-氧化物还原酶的信号肽。
更具体地,本发明是上述用于生产异源蛋白质的方法,其中所述异麦芽糖葡聚糖酶的Tat系统依赖性信号肽具有SFQ ID NO.6中描述的氨基酸序列,或者三甲胺-N-氧化物还原酶的信号肽具有SEQ ID NO.8中描述的氨基酸序列。
优选实施方式的说明在本发明的方法中,棒状杆菌型细菌被用作宿主载体;产生表达构建体,在所述表达构建体中待分泌的目标蛋白的基因被连接到棒状杆菌型细菌的Tat系统依赖性信号肽的下游;这个表达构建体被插入到棒状杆菌型细菌中并且被表达以在细胞外分泌目标蛋白。
如在本说明书中使用的,“分泌”蛋白质或肽是指蛋白质或肽的分子被转运到细菌细胞的外部(在细胞外),而且它包括这样的情况,其中蛋白质或肽分子最终以完全游离的形式置于培养基中,以及这样的情况,其中仅蛋白质的一部分处在细菌的外部,和这样的情况,其中蛋白质存在于细菌的表层。
已知分泌性蛋白质通常被翻译成前肽(prepeptide)或前肽原(prepropeptide),之后它们成为成熟的蛋白质。即,一般地,在被翻译为前肽或前肽原之后,信号肽(前体区域(pre-region))通常被切断以产生成熟的肽或肽原(propeptide),已知肽原的原体区域(pro-region)进一步由蛋白酶切断而产生成熟肽。此外,如本说明书中使用的“信号序列”是指存在于分泌性蛋白质前体的N-末端上但不存在于天然存在的成熟蛋白质中的序列,而“信号肽”是指从这种蛋白质前体切下来的肽。一般地,信号序列伴随着细胞外分泌而被蛋白酶(通常称为信号肽酶)切断。虽然这种信号肽在生物物种之间在序列上具有恒定的、共同的特征,但是在某些生物物种中显示分泌功能的信号肽不一定在另一个生物物种中显示分泌功能。
在本发明中,同时具有信号肽和原体区域的蛋白质,即初步翻译产物(primary translation product),可被称为“前蛋白质原(preproprotein)”,而具有原体区域而没有信号肽的蛋白质可以称为“蛋白质原(proprotein)”。蛋白质的原体区域可以被称为“原体结构部分(pro-structural portion)”或简称“原体结构(pro-structure)”,而如在本说明书中使用的,蛋白质的“原体结构部分/原体结构”和蛋白质的“原体区域”可互换地使用。在前蛋白质原或前蛋白(preprotein)中,信号肽可以是天然地存在于目标蛋白质中的信号肽,或可以是不同蛋白质的信号肽,其优选来自所使用的宿主的分泌性蛋白质。可选择地,它也可以被修饰以具有相应于所使用宿主的密码子使用习惯(codon usage)的最适密码子。此外,可用于本发明的信号肽可以部分地含有天然存在的成熟蛋白质的N-末端氨基酸序列,所述信号肽源自所述成熟蛋白质。在信号肽源自不同蛋白质的情况中,前蛋白可以被具体地称为“异源融合前蛋白原”。
例如,在蛋白质是蛋白-谷氨酰胺酶的情况下,它分别被称为“前蛋白原-谷氨酰胺酶”、“蛋白原-谷氨酰胺酶”和“异源融合前蛋白-谷氨酰胺酶”。此外,其中“原体部分被切断”的蛋白质包括通过肽键的切断已经从其上除去了构成原体区域的至少一个氨基酸的蛋白质,还包括其N-末端区域完全相应于天然存在的成熟蛋白质的N-末端区域的蛋白质,并且只要保持了蛋白质的活性,它还包括与天然存在的蛋白质相比,其在N-末端上具有源自原体部分的一个多个多余氨基酸的蛋白质,以及氨基酸序列比天然存在的蛋白质短的蛋白质。
在本发明中,“Tat系统”是一种也被称为“双精氨酸转位途径(twin-arginine-translocation pathway)”的途径,是指这样的机制或途径,其识别在信号肽中保守的精氨酸-精氨酸保留区域,并通过这种途径,蛋白质通过包括TatA、B、C和E的膜蛋白分泌。此外,“Tat系统分泌元件”是指含有TatA、B、C和E的膜蛋白。这些TatA、B、C和E是位于细胞膜中的跨膜蛋白。它们被认为形成复合物,在细胞膜上形成孔洞供蛋白质穿过。此外,对于当蛋白质转运穿过细胞膜时TatA、B、C和E的详细的高级结构和功能,研究正在进行中。在谷氨酸棒杆菌ATCC13869中,编码TatA的基因和编码TatC的基因位置极其接近。编码TatA和其5′-上游区域的基因序列,以及编码TatC的基因序列,在SEQ ID NO.38中示出。此外,TatA的氨基酸序列在SEQ ID NO.46中示出,而TatC的氨基酸序列在SEQ ID NO.10中示出。编码TatB和其5′-上游区域的基因序列在SEQ ID NO.41中示出,TatB的氨基酸序列在SEQ ID NO.47中示出,编码TatE的基因序列在SEQ ID NO.48中示出,TatE的氨基酸序列在SEQ ID NO.49中示出。TatA和TatE享有极高程度的同源性,而在大肠杆菌中,已知TatA和TatE的功能是功能上互补的(EMBO J.,117(13)3640-3650(1998))。
在本发明使用的棒状杆菌型细菌中,可以扩增的Tat系统分泌元件不限于谷氨酸棒杆菌中的Tat系统分泌元件,包括能在棒状杆菌型细菌中起作用的任何Tat系统分泌元件,包括其中元件的氨基酸序列部分缺失或添加的情况。
根据这种系统的分泌信号具有“Tat系统依赖性信号肽”(也称为“双精氨酸信号肽”)。“Tat系统依赖性信号肽”是指被Tat系统识别的信号肽,而且其中存在精氨酸-精氨酸的保守区域。“Tat依赖性信号肽”的实例包括大肠杆菌的三甲胺-N-氧化还原酶(TorA)、大肠杆菌的SufI(ftsI的抑制物ftsI抑制物)、枯草芽孢杆菌的PhoD(磷酸二酯酶)、LipA、和来自球形节杆菌(Arthrobacter globiformis)的异麦芽糖葡聚糖酶(IMD)的信号肽。这些信号肽的氨基酸序列如下所示TorA信号肽MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(SEQ ID NO.8)SufI信号肽MSLSRRQFIQASGIALCAGAVPLKASA(SEQ ID NO.28)PhoD信号肽MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS(SEQ ID NO.29)LipA信号肽MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH(SEQID NO.30)IMD信号肽MMNLSRRTLLTTGSAATLAYALGMAGSAQA(SEQ ID NO.6)此外,在本说明书中,当涉及TorA信号肽、SufI信号肽、PhoD信号肽、LipA信号肽或IMD信号肽时,除了分别具有上述SEQ ID NO.8、28、29、30或6的肽之外,包括在每个序列中具有一个或几个氨基酸的取代、缺失、插入或添加的肽。术语“几个”通常是指1到7个,优选1到5个,特别优选1到2个左右的氨基酸,而这取决于在这些Tat系统依赖性信号肽中氨基酸残基的位置和种类。此外,信号肽可以是具有氨基酸序列的信号肽,所述氨基酸序列通常与SEQ ID NO.8、28、29、30或6中所示氨基酸序列具有85%或更高,优选90%或更高,更优选95%或更高的同源性。
编码具有这种取代、缺失、插入或添加的信号肽的核酸序列可以从大肠杆菌、枯草芽孢杆菌和球形节杆菌的变体、天然突变株或人工突变株,除了球形节杆菌的节杆菌菌种和除了枯草芽孢杆菌的芽孢杆菌菌种获得。此外,编码具有取代、缺失、添加或插入的Tat系统依赖性信号肽的核酸序列可以体外诱变或位点特异性诱变核酸来获得,所述核酸编码具有SEQ ID NO.8、28、29、30或6所示的氨基酸序列的Tat系统依赖性信号肽。这种诱变可由本领域技术人员使用通常已知的方法来进行。
上述取代、删除、插入或添加是保守的突变,从而保留了以下将描述的共有基序。保守的突变通常是保守性取代。取代这些信号肽的原有氨基酸并认为是保守性取代的氨基酸的实例包括,从Ala到Ser或Thr的取代、从Arg到Gln、His或Lys的取代、从Asn到Glu、Gln、Lys、His或Asp的取代、从Asp到Asn、Glu或Gln的取代、从Cys到Ser或Ala的取代、从Gln到Asn、Glu、Lys、His、Asp或Arg的取代、从Glu到Asn、Gln、Lys或Asp的取代、从Gly到Pro的取代、从His到Asn、Lys、Gln、Arg或Tyr的取代、从Ile到Leu、Met、Val或Phe的取代、从Leu到Ile、Met、Val或Phe的取代,从Lys到Asn、Glu、Gln、His或Arg的取代、从Met到Ile、Leu、Val或Phe的取代、从Phe到Trp、Tyr、Met、Ile或Leu的取代、从Ser到Thr或Ala的取代、从Thr到Ser或Ala的取代、从Trp到Phe或Tyr的取代、从Tyr到His、Phe或Trp的取代以及从Val到Met、Ile或Leu的取代。
在“Tat系统依赖性信号肽”中,共有基序S/T-R-R-X-F-L-K(SEQ ID NO.31)或R-R-X-#-#(#疏水性残基)(SEQ ID NO.32)的疏水性区域是保守的。然而,即使这些共有基序是保守的,它们也受到待分泌的蛋白质的影响。例如,虽然枯草芽孢杆菌的信号肽WprA和WapA具有双精氨酸基序,已经证明了它们依赖SRP/Sec系统而不是Tat系统分泌(Biochem Biophys ResCommun.2003 Apr25304(1)48-54)。可以在Tat系统中分泌的蛋白质的实例包括,但不限于,来自大肠杆菌的TorA和SufI、来自枯草芽孢杆菌的PhoD和来自枯草芽孢杆菌的LipA。具体地在棒状杆菌型细菌中,可以使用Tat系统分泌的蛋白质的实例包括各种酶,例如异麦芽糖葡聚糖酶、蛋白-谷氨酰胺酶(protein-glutaminase)和转谷氨酰胺酶。具体的实例包括,但不限于,来自球形节杆菌T6(NRRL B-4425,IMA12103)的异麦芽糖葡聚糖酶,优选具有SEQ ID NO.2中描述的氨基酸序列的异麦芽糖葡聚糖酶,Chryseobacterium proteolyticum的蛋白-谷氨酰胺酶,优选具有SEQ ID NO.4中所示氨基酸序列的蛋白-谷氨酰胺酶,GFP(绿色荧光蛋白),和WO 02/81694中所示的茂原链轮丝菌(Streptoverticillium mobaraense)的转谷氨酰胺酶。球形节杆菌菌株T6以登记号no.NRRL B-4425被保藏在Northern UtilizationResearch and Development Division。Chryseobacterium roteollyticum已经于2000年11月8日作为FERM BP-3523保藏在工业技术院生命工学工业技术研究所(当前为国际专利生物保藏中心,国家先进工业科技研究所,TsukubaCentral 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)。
异麦芽糖葡聚糖酶是一种有效地从葡聚糖等等产生异麦芽糖的酶。异麦芽糖葡聚糖酶是工业上有用的酶,因为通过使这种酶作用于葡聚糖等等来获得的异麦芽糖是工业上有用的,而且它具有防龋效果(参见日本专利申请公开No.5 8-76063)和对在人体中有用的肠细菌双歧杆菌的增殖效果(参见日本专利申请公开No.61-22777)。蛋白-谷氨酰胺酶是作为谷氨酰胺酶起作用的酶,是极为有用的,因为它直接作用于蛋白质中存在的谷氨酰胺残基而不降低蛋白质的分子量,并且具有脱酰胺功能而不切断肽键或伴随蛋白质交联(日本专利申请公开No.2001-218590)。GFP是指来自水母(jellyfish)的绿色荧光蛋白,当通过与其他蛋白融合来插入到细胞中时,能够在细胞内的任意位置产生荧光,从而展现了在体内特定结构的荧光标记方面的有效性,这使它能用于许多研究中。这些酶不由常规的Sec系统分泌,但是仅能通过使用Tat系统分泌。然而,通过本发明有效生产的蛋白质不限于这些酶,它们可以是可使用Tat系统通过棒状杆菌型细菌分泌的任何蛋白质。
在本发明中棒状杆菌型细菌是需氧的、革兰氏阳性的杆菌,虽然其通常被分类为短杆菌属(Brevibacterium)菌种,当前包括并入棒杆菌属(Corynebacterium)的细菌(Int.J.Syst.Bacteriol.,41,255(1981)),和与棒杆菌属菌种极其类似的短杆菌属菌种的细菌。使用棒状杆菌型细菌的益处包括这样的事实,与已被认为适合于分泌异源蛋白质的霉菌、酵母和芽孢杆菌属菌种的细菌相比,它们原本分泌极少量的细胞外蛋白,因而使得在异源蛋白质的分泌生产中简化或缩短纯化过程成为可能。此外,由于棒状杆菌型细菌可以容易地在含有糖类、氨或无机盐等的简单培养基中生长,在培养基成本、培养方法和培养物生产力方面它们也是优越的。棒状杆菌型细菌的实例包括以下菌种。
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophylum),醋谷棒杆菌(Corynebacterium acetoglutamicum),烷醇棒杆菌(Corynebacterium alkanolyticum),美棒杆菌(Corynebacterium callunae),谷氨酸棒杆菌(Corynebacterium glutamicum),百合花棒杆菌(Corynebacterium lilium),栖糖蜜棒杆菌(Corynebacterium melassecola),嗜热产氨棒杆菌(Corynebacterium thermoaminogenes),力士棒杆菌(Corynebacterium herculis),二歧短杆菌(Brevibacterium divaricatum),黄色短杆菌(Brevibacterium flavum),Brevibacterium immariophilum乳发酵短杆菌(Brevibacterium lactofermentum),玫瑰色短杆菌(Brevibacterium roseum),解糖短杆菌(Brevibacterium saccharolyticum),生硫短杆菌(Brevibacterium thiogenitalis),产氨棒杆菌(Corynebacterium ammoniagenes),白色短杆菌(Brevibacterium album),蜡状短杆菌(Brevibacterium cerinum),嗜氨微杆菌(Microbacterium ammoniaphilum)。
具体的实例包括下列的菌株。
嗜乙酰乙酸棒杆菌ATCC 13870,醋谷棒杆菌ATCC 15806,烷醇棒杆菌ATCC 21511,美棒杆菌ATCC 15991,谷氨酸棒杆菌ATCC 13020,ATCC 13032,ATCC 13060,百合花棒杆菌ATCC 15990,
栖糖蜜棒杆菌ATCC 17965,Corynebacterium efficiens AJ12340(FERM BP-1539),力士棒状杆菌ATCC 13868,二歧短杆菌ATCC 14020,黄色短杆菌ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205),Brevibacterium immariophilum ATCC 14068,乳发酵短杆菌ATCC 13869,玫瑰色短杆菌ATCC 13825,解糖短杆菌ATCC 14066,生硫短杆菌ATCC 19240,产氨棒杆菌ATCC 6871,ATCC 6872,白色短杆菌ATCC 15111,蜡状短杆菌ATCC 15112,和嗜氨微杆菌ATCC 15354。
这些生物体可以从例如美国典型培养物保藏中心(American Type CultureCollection)获得。即,已经给每个微生物菌株分配了保藏号,在美国典型培养物保藏中心的目录中描述了这些保藏号,这允许通过参考这些编号来提供每种微生物菌株。
具体地,作为链霉素(Sm)抗性突变菌株从野生菌株谷氨酸棒杆菌ATCC13869分离的谷氨酸棒杆菌AJ12036(FERM BP-734)(最初于1984年3月26日保藏)(当前保藏在国际专利生物保藏中心,国家先进工业科技研究所,Tsukuba Central 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)预期在涉及蛋白质分泌的功能基因中含有突变,而且对于在最佳培养条件下积累的量而言,展现了极高的异源蛋白质生产和分泌能力,比亲本菌株(野生菌株)高2到3倍,因而使得它适合作为宿主生物体(参见,WO 02/081694)。
此外,特别优选使用经过修饰从而不产生细胞表层蛋白的这种微生物菌株作为宿主,因为其分泌到培养基中的异源蛋白质的纯化变得容易。可以使用诱变或基因重组方法通过将突变导入细胞表层蛋白中或导入其位于染色体上的表达调控区域中来进行这种修饰。已经被修饰而不产生细胞表层蛋白质的棒状杆菌型细菌的实例是谷氨酸棒杆菌菌株YDK010,一种来自AJ12036(国际公开WO 02/081694)的破坏了细胞表层蛋白(PS2)的菌株。
在本发明中使用的遗传构建体通常含有启动子、编码适合的信号肽的序列、编码目标蛋白质的核酸片段、和在棒状杆菌型细菌中表达目标蛋白质所需的控制序列(例如操纵子或终止子),其位于处于适合的位置从而它们能够起作用。目标蛋白可以在N-末端上具有原体结构(pro-structure)。在用于此构建体的载体上没有特别的限制,可以是染色体外自我复制的载体,例如质粒,或掺入到细菌染色体中的载体,只要它可以在棒状杆菌型细菌内起作用。这些载体的实例包括PAM330(日本专利申请公开No.58-067699)、pHM1519(日本专利申请公开No.58-77895)和pSFK6(日本专利申请公开No.2000-262288)。此外,当将在这个质粒上赋予在棒状杆菌型细菌中自我复制能力的DNA片段从这些载体上切下并插入到上述大肠杆菌载体中时,所述载体可被用做所谓的穿梭载体(shuttle vector),其能在大肠杆菌和棒状杆菌型细菌中复制。此外,也可以使用人工的转座子等等。在使用转座子的情况下,目标基因将通过同源重组或通过其可转座能力被导入到染色体中。
在可用于本发明的启动子上没有特别的限制,可以使用任何启动子,只要它能在棒状杆菌型细菌细胞中起作用,而且也可以是异源启动子,例如tac启动子或来自大肠杆菌的其他启动子。强启动子例如tac启动子是更优选的。源自棒状杆菌型细菌的启动子的实例包括细胞表层蛋白PS1、PS2和SlpA的基因启动子、各种氨基酸生物合成系统的每种启动子,所述合成系统例如涉及谷氨酸生物合成系统的谷氨酸脱氢酶基因、涉及谷氨酰胺生物合成系统的谷氨酰胺合成酶基因、涉及赖氨酸生物合成系统的天冬氨酸激酶基因、涉及苏氨酸生物合成系统的高丝氨酸脱氢酶基因、涉及异亮氨酸和缬氨酸生物合成系统的乙酰羟酸合成酶基因、涉及亮氨酸生物合成系统的2-异丙基苹果酸合成酶基因、涉及脯氨酸和精氨酸生物合成系统的谷氨酸激酶基因、涉及组氨酸生物合成系统的磷酸核糖-ATP焦磷酸化酶基因、涉及芳香族氨基酸,例如色氨酸、酪氨酸和苯丙氨酸的生物合成系统的deoxyarabinoheptutonate(DAHP)基因,和涉及核酸生物合成例如次黄嘌呤核苷酸(inosinic acid)和鸟嘌呤核苷酸(guanylic acid)生物合成系统的磷酸核糖焦磷酸(PRPP)氨基转移酶基因、肌苷酸脱氢酶基因和鸟苷酸合成酶基因。
在用于本发明的信号肽上没有特别的限制,只要它是能在棒状杆菌型细菌细胞中起作用的Tat系统依赖性信号肽。可以使用在棒状杆菌型细菌细胞内起作用的任何Tat系统依赖性信号肽。因而,异源来源的Tat系统依赖性信号肽例如来自大肠杆菌或枯草芽孢杆菌的Tat系统依赖性信号肽可以用于本发明中,只要它可以在棒状杆菌型细菌细胞内起作用。信号肽可以含有分泌性蛋白质的N-末端氨基酸序列的部分,所述信号肽是来自所述分泌性蛋白质的。当翻译的产物被分泌到细菌细胞外时,信号序列被信号肽酶切断。此外,虽然天然存在形式的基因可以用作编码信号肽的基因;它也可以被修饰以具有取决于所使用宿主的密码子使用习惯的最适密码子。在使用这些信号肽的情况下,编码目标蛋白质的基因将被定位,以使该基因连接到编码信号肽的基因的3’-末端并且表达受到上述启动子的控制。
可以根据本发明生产并分泌的有用蛋白质包括任何蛋白质,无论它们原本是以Tat系统分泌的还是以Sec系统分泌的,包括来自动植物和微生物的细胞内蛋白质,只要它们是由核酸编码的蛋白质,所述核酸可包括在与编码上述Tat系统依赖性信号肽的编码核酸序列相同的基因构建体中。可以根据本发明分泌和生产的蛋白质的实例包括蛋白酶、氨肽酶、羧肽酶、胶原酶和几丁质酶。具体地,不能用常规的Sec系统分泌的蛋白质适合于根据本发明来生产并分泌。编码这些蛋白质的基因可以取决于使用的宿主和/或为了获得期望的活性而被修饰。所述修饰包括一个或多个氨基酸添加、缺失或取代等等。如果需要,取决于宿主的密码子使用习惯,可以转换为最适密码子。这些通常的分子生物学技术,包括修饰技术、基因克隆技术和产生的蛋白质的检测技术,是本领域技术人员公知的,人们可以参考例如Sambrook et al.,1989,Molecular CloningA Laboratory Manual,Second Edition(1989)Cold SpringHarbor Laboratory Press,Cold Spring Harbor New York;DNA CloningAPractical Approach,Volumes I and II(D.N Clover ed.1985);FM.Ausubel et at(eds),Current Protocols in Molecular Biology John Wiley & Sons,Inc.(1994);PCR TechnologyPrinciples and Application for DNA Amplification,H Erich,ed.,Stockton Press。
在将可用于本发明的基因构建体导入棒状杆菌型细菌的方法方面没有特别的限制,并可以采用通常使用的方法,例如,原生质体法(Gene,39,281-286(1985))和电穿孔(Bio/Technology,7,1067-1070(1989))。
此外,在本发明中,棒状杆菌型细菌可以是其中tat系统分泌元件已经被扩增了的菌株,即,其中构成tat系统分泌元件的包括TatA、B、C和E的膜蛋白已经被扩增的菌株。通过增强编码亲本菌株的tat系统分泌元件的含有tatA、tatB、tatC和tatE的基因组中一种或多种基因的表达,获得这种棒状杆菌型细菌。
增强编码tat系统分泌元件的基因,包括tatA、tatB、tatC和tatE(它们的每一种都被称为“tat基因”)的表达通过提高一种或多种tat基因的拷贝数来实现。例如,可将编码含有tatA的基因的片段或编码含有连接的tatA和tatB的基因的片段连接到在棒状杆菌型细菌中起作用的载体,优选多拷贝载体,以产生重组DNA,其随后被导入和转化入如上所述的棒状杆菌型细菌。在此时使用的载体与可用于上述的基因构建体的载体是相同的。此外,通过将编码tat系统分泌元件的基因的一个或多个拷贝转移到染色体中来实现增加拷贝数。将tat基因的多个拷贝插入到棒状杆菌型细菌的染色体DNA中,这通过使用存在于染色体DNA上的多拷贝序列作为目标的同源重组来进行。对于存在于染色体DNA中的多拷贝序列,可以使用存在于可转座因子的末端的重复DNA或反向重复。可选择地,如在日本专利申请公开No.2-109985中公开的,通过将tat基因加载到转座子上并转移转座子,也可以将多拷贝插入到染色体DNA中(日本专利申请公开No.2-109985;日本专利申请公开No.7-107976;Vertes,A.A.,Asai,Y.,Inui,M.,Kobayashi,M.,Kurusu,Y.and Yukawa,H.Mol.Gen.Genet.,245,397-405(1994))。将tat基因导入到染色体上可以通过使用tat基因的一部份作为探针进行Southern杂交来证实。
除了如上所述的基因扩增之外,通过用更强大的表达调控序列取代位于染色体DNA上或质粒上的表达调控序列,例如tat基因的启动子,或通过修饰涉及调节tat基因表达的因子,例如操纵子或抑制物(repressor),也可以实现tat系统分泌元件的提高的表达(Hamilton et al.Journal of Bacteriology1714617-4622)。强启动子的已知实例包括lac启动子、trp启动子和trc启动子。评估启动子强度的方法和强启动子的实例在例如Goldstein et al.(Prokaryotic promoters in biotechnology.Biotechnol.Annu.Rev.,1995,1,105-128)中描述。此外,如在国际公开WO 00/18935中公开的,通过导入几个核苷酸的核苷酸取代到目标基因的启动子区域,可将启动子修饰成更强的启动子。此外,已知在核糖体结合位点(RBS)和起始密码子之间的间隔区中的取代,特别是紧靠起始密码子上游的序列中几个核苷酸的取代,对mRNA翻译效率显示出极大的影响,因而也可以修饰这些间隔区和核苷酸。使用启动子检测载体或遗传分析软件例如GENETYX,可以确定tat基因的启动子或其他表达调控序列。例如,表达调控序列的取代也可以按照与使用上述温度敏感质粒的基因取代相同的方式来进行。
得到的导入了基因的转化体可以根据通常使用的方法和条件来培养。例如,转化体可以在含有碳源、氮源和无机离子的普通培养基中培养。此外,为了获得高生长,如果需要,也可以添加有机痕量营养物例如维生素和氨基酸。可以使用的碳源的实例包括碳水化合物如葡萄糖和蔗糖、有机酸如乙酸、醇类和其他碳源。可以使用的氮源的实例包括氨气、氨水、铵盐和其他氮源。如果需要,可以适当地使用的无机离子的实例包括钙离子、镁离子、磷酸根离子、钾离子和铁离子。培养可以在好氧条件下、在pH5.0到8.5的适合范围内、在15到37℃的温度下进行,培养时间可以是约1到7天。作为在这种条件下培养转化体的结果,在细胞中大量产生目标蛋白质,并被高效地在细胞外分泌。
在培养之后,根据本领域技术人员公知的方法,可以从培养基分离和纯化分泌到根据本发明的培养基中的蛋白质。例如,在通过离心分离等除去细菌细胞之后,通过适合的已知方法,例如盐析、乙醇沉淀、超滤、凝胶过滤层析、离子交换柱层析、亲和层析、中高压液相层析、反相层析或疏水层析或它们的组合,可以分离和纯化蛋白质。在通过本领域技术人员公知的方法,例如提高盐浓度或使用表面活性剂来溶解蛋白质之后,按照与分泌到培养基中的情况相同的方式,也可以分离和纯化根据本发明分泌到细胞表层的蛋白质。此外,在某些情况下,也可以不用溶解而使用分泌到细胞表层的蛋白质,例如,作为固定的酶。
虽然以下使用随后的实施例提供了本发明的更详细的说明,在任何情况下本发明不应被理解为受到这些实施例的限制。
实施例1-使用来自球形节杆菌的异麦芽糖葡聚糖酶的信号序列分泌表达异麦芽糖葡聚糖酶(1-1)使用谷氨酸棒杆菌的异麦芽糖葡聚糖酶的信号序列构建用于异麦芽糖葡聚糖酶的分泌表达的质粒早先已经测定了球形节杆菌菌株T6衍生的异麦芽糖葡聚糖酶基因(EC.3.2.1.94;1,6-α-D-葡聚糖异麦芽糖-葡聚糖酶)的序列(Joumal ofBacteriology,176,7730-7734(1994))。参考这个序列,合成具有SEQ ID NO.11(5′-ATGATGAACCTGTCCCGCCG-3′)和SEQ ID NO.12(5′-CGCGGATCCCTGAGGGCGGGAAC-3′)所示的序列的引物,使用根据普通方法(Saitoh和Miura的方法,(Biochim.Biophys Acta,72,619(1963))制备的球形节杆菌的染色体DNA作为模板,通过PCR来扩增编码异麦芽糖葡聚糖酶的区域。使用Pyrobest DNA聚合酶(Takara)用于PCR反应,反应条件根据制造商建议的方案。SEQ ID NO.12的序列含有BamHI限制性内切酶识别序列。
此外,使用上述的pPKSPTG1(描述于WO 01/23591中)作为模板,使用SEQ ID NO.14(5′-AAATTCCTGTGAATTAGCTGATTTAG-3′)和SEQ IDNO.16(5′-GGCGGGACAGGTTCATCATAGAGGCGAAGGCTCCTTGAA-3′)所示的引物,通过PCR来扩增编码启动子和信号序列的区域。SEQ ID NO.16所示的序列含有编码异麦芽糖葡聚糖酶的信号序列的N-末端区的区域。
将用具有SEQ ID NO.11和SEQ ID NO.12所示序列的引物扩增的PCR产物和用SEQ ID NO.14和SEQ ID NO.16的引物扩增的PCR产物混合,这些被用做模板使用SEQ ID NO.12和SEQ ID NO.14所示的引物来进行交叉PCR。在用限制性内切酶ScaI和BamHI消化这个PCR产物之后,通过琼脂糖凝胶电泳回收约2.5kb的DNA片段,并将这个片段插入pPKSPTG1(描述于WO 01/23591中)的ScaI-BamHI区域中来构建异麦芽糖葡聚糖酶表达质粒pPKI-IMD。使用DyeTerminator Cycle测序试剂盒(PE Applied Biosystems)和DNA测序仪377A(PE Applied Biosystems)来测定插入到构建的质粒中的基因的序列。作为测定核苷酸序列的结果,显示了产生的异麦芽糖葡聚糖酶基因部分地不同于报道的序列。新测定的异麦芽糖葡聚糖酶基因的序列在SEQ ID NO.1中示出,而氨基酸序列在SEQ ID NO.2中示出。
(1-2)使用IMD信号序列通过谷氨酸棒杆菌分泌IMD谷氨酸棒杆菌菌株YDK010(WO 01/23591)是链霉素(Sm)抗性菌株AJ12036的破坏了细胞表层蛋白(PS2)的菌株,AJ12036本身来自谷氨酸棒杆菌ATCC13869,用构建的质粒pPKI-IMD转化谷氨酸棒杆菌菌株YDK010,挑选在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株。选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在完成培养之后,通过SDS-PAGE分析10μl培养物上清液。使用12.5%凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,并用考马斯亮蓝染色检测蛋白质条带。结果,检测到具有约65kDa的预计分子量的条带。作为通过反相色谱分析定量蛋白质的结果,蛋白质浓度被确定为约120mg/l。此外,根据Journal of Bacteriology,176,7730-7734(1994)中描述的方法测量异麦芽糖葡聚糖酶的酶活性,产生的蛋白质被证实实际上具有异麦芽糖葡聚糖酶的酶活性。
此外,用蛋白质测序仪分析了分泌的异麦芽糖葡聚糖酶的N-末端氨基酸序列。结果,证实分泌了从SEQ ID NO.2所示氨基酸序列的第31位Ala开始的异麦芽糖葡聚糖酶。因而,证实了信号序列区是SEQ ID NO.5(核苷酸序列)和SEQ ID NO.6(氨基酸序列)所示的序列。
参考实施例A使用来自产氨棒杆菌(Corynebacterium ammoniagenes)的细胞表层蛋白质SlpA的信号序列分泌表达异麦芽糖葡聚糖酶(A-1)来自球形节杆菌菌株T6(NRRL B-4425,IMA12103)异麦芽糖葡聚糖酶基因的获取合成具有SEQ ID NO.11和SEQ ID NO.12所示序列的引物,通过PCR从根据常规方法(Saitch和Miura的方法(Biochim.Biophys.Acts 72,619(1963))制备的球形节杆菌的染色体DNA扩增编码异麦芽糖葡聚糖酶的区域。使用Pyrobest DNA聚合酶(Takara)用于PCR反应,反应条件根据制造商建议的方案。此外,SEQ ID NO.12的序列含有限制性内切酶BamHI识别序列。
然后,使用通过PCR扩增的DNA片段作为模板,使用SEQ ID NO.13(5′-GTCCCCGTCACGGCCGCGCC-3′)和SEQ ID NO.12所示的引物进行PCR来扩增编码无信号序列的成熟异麦芽糖葡聚糖酶的区域。
(A-2)使用SlpA信号序列构建用于在谷氨酸棒杆菌中分泌生产异麦芽糖葡聚糖酶的质粒使用WO 01/23591中描述的质粒pPKSPTG1作为模板,使用具有SEQ IDNO.14和SEQ ID NO.15(5′-CCCGGGCGGGCGGTGACGGCGGTGGCTGCCGTTGCC ACAGGTGCGG-3′)所示序列的引物通过PCR扩增编码启动子和信号序列的区域。用作模板的质粒pPKSPTG1含有来自谷氨酸棒杆菌的细胞表层蛋白质PS2的启动子、编码来自产氨棒杆菌(C.ammoniagenes)的细胞表层蛋白质SlpA的信号序列的区域,和编码来自茂原链轮丝菌(S.mobaraense)的转谷氨酰胺酶原的区域。通过上述的PCR来扩增这个质粒中含有PS2启动子和编码SlpA信号序列的区域的片段。SEQ ID NO.15所示的引物含有编码成熟异麦芽糖葡聚糖酶的N-末端侧氨基酸区域的序列。
然后,将使用具有(A-1)中SEQ ID NO.13和SEQ ID NO.12所示序列的引物扩增的PCR产物和使用具有SEQ ID NO.14和SEQ ID NO.15所示序列的引物扩增的PCR产物混合,并使用它们作为模板;使用具有SEQ ID NO.14和SEQ ID NO.12所示序列的引物进行交叉PCR来扩增PS2启动子、SlpA信号肽序列和成熟异麦芽糖葡聚糖酶的融合基因。在用限制性内切酶ScaI和BamHI消化这个PCR产物之后,通过琼脂糖凝胶电泳回收约2.5kb的DNA片段,并将它插入到日本专利申请公开No.9-322774中描述的质粒pPK4中的ScaI-BamHI位点来构建成熟异麦芽糖葡聚糖酶的表达质粒pPKSIMD。
(A-3)使用来自产氨棒杆菌的细胞表层蛋白质SlpA的信号序列分泌IMD谷氨酸棒杆菌菌株YDK010(在WO 02/081694中描述)是链霉素(Sm)抗性菌株AJ12036破坏了细胞表层蛋白(PS2)的菌株,AJ12036本身来自谷氨酸棒杆菌ATCC13869,用构建的质粒pPKSIMD转化谷氨酸棒杆菌菌株YDK010,挑选在含有25mg/l卡那霉素的CM2G琼脂培养基(酵母提取物10g,胰蛋白胨10g,葡萄糖5g,NaCl5g,琼脂15g,用水添加到1升体积)上生长的菌株。选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在完成培养之后,通过SDS-PAGE分析10μl培养物上清液。使用12.5%凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,用考马斯亮蓝染色检测蛋白质条带。结果,在约65kDa检测到极其微弱的条带。此外,作为通过反相色谱分析定量蛋白质的结果,浓度被测定为约10mg/l。这证明了,与使用来自球形节杆菌的IMD信号序列的情况相比,分泌的蛋白质的量降低。反相层析的条件如下所示。
柱蛋白C4 214TP5410(Vydac)洗脱条件24-80%乙腈线性梯度/0.1%三氟乙酸流速1.0ml/min此外,根据Joumal of Bacteriology,176,7730-7734(1994)中描述的方法测量异麦芽糖葡聚糖酶的酶活性,证实分泌的蛋白实际上具有异麦芽糖葡聚糖酶的酶活性。
实施例2-使用来自球形节杆菌的IMD信号序列表达和分泌具有原体结构的蛋白-谷氨酰胺酶(2-1)从Chryseobacterium proteolyticum获取蛋白谷氨酰胺酶基因早先已经测定了来自Chryseobacterium proteolyticum的蛋白-谷氨酰胺酶(EC.3.5.1)基因的序列(Eur.J.Biochem.268.1410-1421(2001))。参照这个序列,通过将密码子转换为谷氨酸棒杆菌中高度使用的那些密码子来构建SEQ ID NO.3中所示的基因序列。这个序列含有编码蛋白-谷氨酰胺酶的信号序列(前体区域)、原体区域和成熟蛋白-谷氨酰胺酶的区域。通过合成来制备这个完整的基因序列。
根据构建的SEQ ID NO.3的基因序列数据,合成具有SEQ ID NO.17(5′-CATGAAGAACCTTTTCCTGTC-3′)和 SEQ ID NO.18(5′-GTAAAAGGATCCATTAATTAAAATCC-3′)所示序列的引物。SEQ ID NO.17所示的引物含有蛋白-谷氨酰胺酶的信号序列的N-末端序列,而SEQ ID NO.18所示的引物含有成熟蛋白-谷氨酰胺酶的C-末端和BamHI识别序列。使用具有SEQID NO.3所示序列的DNA作为模板,使用具有SEQ ID NO.17和SEQ ID NO.18的序列的引物进行PCR来扩增编码蛋白-谷氨酰胺酶的原体部分和成熟蛋白-谷氨酰胺酶的区域。将这个PCR片段插入到日本专利申请公开No.9-070291中描述的pVC7的SmaI位点中之后,将它导入大肠杆菌JM109(Takara)的感受态细胞中。获得携带质粒的微生物菌株,所述质粒中克隆了蛋白-谷氨酰胺酶基因,并回收质粒。测定克隆到这个质粒中的片段的核苷酸序列,证实与SEQ ID NO.3所示序列相符。
(2-2)使用IMD信号序列构建用于分泌表达具有原体结构的蛋白-谷氨酰胺酶的质粒使用实施例1的(1-1)中描述的IMD表达质粒pPKI-IMD作为模板,使用具有SEQ ID NO.14和SEQ ID NO.21(5′-CCTGGTTGCCGTTGGAATCGGCCTGGG CGGAGCCTGCC-3′)所示序列的引物通过PCR扩增了编码启动子和信号肽的区域。扩增的区域含有编码PS2启动子和IMD信号肽的区域。此外,SEQ ID NO.21所示序列含有编码具有原体结构的蛋白-谷氨酰胺酶基因的区域的5′末端序列。然后,使用其中克隆了蛋白-谷氨酰胺酶的质粒作为模板,使用具有SEQ ID NO.20(5′-GATTCCAACGGCAACCAGGA-3′)和SEQ ID NO.18的序列的引物通过PCR扩增编码具有原体结构的蛋白-谷氨酰胺酶基因的区域。此外,将用具有SEQ ID NO.14和21的序列的引物获得的PCR产物和用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物获得的PCR产物以1∶1的比例混合,然后使用它们作为模板,使用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物进行交叉PCR,来扩增含有PS2启动子区域、IMD信号序列和编码具有原体结构的蛋白-谷氨酰胺酶的基因的融合基因。在用限制性内切酶ScaI和BamHI消化这个交叉PCR产物之后,通过琼脂糖凝胶电泳检测到约1.6kbp的DNA片段。然后从琼脂糖凝胶上切下这个DNA片段,使用EasyTrap Ver.2(Takara)来回收,通过将片段插入日本专利申请公开No.9-322774中描述的质粒pPK4的ScaI-BamHI位点中,来构建用于具有原体结构的蛋白-谷氨酰胺酶的表达质粒pPKI-PPG。作为测定插入到构建的质粒中的基因序列的核苷酸序列的结果,证实构建了预定的融合基因。
(2-3)使用IMD信号序列通过谷氨酸棒杆菌分泌具有原体结构的蛋白-谷氨酰胺酶菌株YDK010(在国际公开WO 02/081694中描述)是从来自谷氨酸棒杆菌的突变菌株YSr获得的,在用构建的质粒pPKI-PPG转化菌株YDK010之后,如实施例1的(1-3)所述选择在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株。选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在完成培养之后,通过SDS-PAGE分析10μl的培养物上清液。使用4-20%梯度凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝进行蛋白质染色。结果,在约35kDa的预定分子量处检测到条带。作为通过反相HPLC分析100μl培养物上清液的结果,蛋白质浓度是约20mg/l。反相HPLC的条件如下所示。
柱CARCELL PAK C18 SG300,4.6×150mm(Shiseido)
洗脱条件32-48%乙腈线性梯度/0.1%三氟乙酸(15min)流速1.0ml/min此外,在使用Ultrafree(Millipore)对培养物上清液进行脱盐和浓缩处理之后,用放线菌来源的蛋白酶SAM-P45(在国际公开WO 01/23591中描述)酶法消化蛋白质,以切断蛋白谷氨酰胺酶的原体结构部分来获得成熟蛋白质。根据日本专利申请公开No.2000-50887中描述的方法测量成熟蛋白质的活性,并证实分泌的蛋白质实际上具有蛋白-谷氨酰胺酶活性。
参考实施例B使用来自产氨棒杆菌的细胞表层蛋白SlpA的信号序列分泌和表达Chryseobacterium preteolyticum的蛋白-谷氨酰胺酶(B-1)来自Chryseobacterium preteolyticum蛋白-谷氨酰胺酶基因的获取参考Chryseobacterium preteolyticum(Eur.J.Biochem.268,1410-1421(2001))的蛋白-谷氨酰胺酶(EC.3.5.1)的序列,通过将密码子转换为谷氨酸棒杆菌中高度使用的那些来产生SEQ ID NO.3所示的序列。这个序列含有编码蛋白-谷氨酰胺酶的信号序列(前体部分)、原体部分和成熟蛋白-谷氨酰胺酶的区域。通过合成来制备含有这个完整基因序列的核酸分子。
根据制备的SEQ ID NO.3的基因序列数据合成具有SEQ ID NO.17和SEQ ID NO.18所示序列的引物。具有SEQ ID NO.17所示序列的引物含有蛋白-谷氨酰胺酶的信号序列的N-末端序列,而具有SEQ ID NO.18所示序列的引物含有成熟蛋白-谷氨酰胺酶的C-末端和BamHI识别序列。使用具有SEQID NO.3所示序列的DNA作为模板,使用具有SEQ ID NO.17和SEQ ID NO18的序列的引物进行PCR来扩增编码蛋白-谷氨酰胺酶的原体部分和成熟蛋白-谷氨酰胺酶的区域。将这个PCR片段插入到日本专利申请公开No.9-070291中描述的pVC7的SmaI位点中之后,将它导入大肠杆菌JM109(Takara)的感受态细胞中。获得携带质粒的微生物菌株,所述质粒中克隆了蛋白转谷氨酰胺酶基因,并从该菌株中回收质粒。测定包含在这个质粒中的片段的克隆核苷酸序列,证实该序列与SEQ ID NO.3所示序列相符。
(B-2)使用SlpA信号序列构建用于通过谷氨酸棒杆菌分泌表达蛋白-谷氨酰胺酶的质粒使用WO 01/23591中描述的质粒pPKSPTG1作为模板,使用具有SEQ IDNO.14和SEQ ID NO.19(5′-TCCTGGTTGCCGTTGGAATCTGCCGTTGCCACAGGTGCGG-3′)所示序列的引物通过PCR扩增编码启动子和信号肽的区域。扩增的区域含有编码PS2启动子和SlpA信号肽的区域。SEQ ID NO.19所示序列含有编码具有原体结构的蛋白-谷氨酰胺酶基因的区域的5′末端序列。
然后,使用在参考实施例B-1中获得的其中克隆了蛋白-谷氨酰胺酶的质粒作为模板,使用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物通过PCR来扩增编码具有原体结构的蛋白-谷氨酰胺酶基因的区域。此外,将用具有SEQ ID NO.14和19所示序列的引物获得的PCR产物和用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物获得的PCR产物以1∶1的比例混合,然后使用它们作为模板,使用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物进行交叉PCR,来扩增包括序列的融合基因,所述序列含有PS2启动子区域、SlpA信号序列和编码具有原体结构的蛋白-谷氨酰胺酶的基因。在用限制性内切酶ScaI和BamHI消化这个交叉PCR产物之后,通过琼脂糖凝胶电泳检测到约1.6kbp的DNA片段。然后从琼脂糖凝胶上切下这个DNA片段,并使用EasyTrap Ver.2(Takara)来回收,通过将该片段插入日本专利申请公开No.9-322774中描述的质粒pPK4的ScaI-BamHI位点中,来构建用于具有原体结构的蛋白-谷氨酰胺酶的表达质粒pPKS-PPG。作为测定插入到构建的质粒中的基因序列的核苷酸序列的结果,证实构建了预定的融合基因。
(B-3)使用SlpA信号序列通过谷氨酸棒杆菌分泌具有原体结构的蛋白-谷氨酰胺酶在用构建的质粒pPKS-PPG转化从源自谷氨酸棒杆菌的突变菌株获得的菌株YDK010(描述于WO 02/081694中)之后,如在实施例1的(1-3)中所述选择在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株。将选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在培养完成之后,通过SDS-PAGE分析10μl的培养物上清液。使用12.5%凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝和荧光染料SYPRO Orange(Molecular Probes)进行蛋白质染色。结果,通过两种着色方法都没有在预定的分子量位置附近检测到条带。
实施例3-使用来自大肠杆菌的TorA(三甲胺-N-氧化还原酶)信号序列分泌表达蛋白-谷氨酰胺酶(3-1)获取编码来自大肠杆菌的TorA信号肽的基因早先已经测定了含有来自大肠杆菌的TorA信号肽的TorA基因的序列(Mol.Microbiol.111169-1179(1994))。参考这个序列,合成SEQ ID NO.22(5′-ATGAACAATAACGATCTCTTTCAGG-3′)和SEQ ID NO.23(5′-CCGGATCCTGGTCATGATTTCACCTG-3′)所示序列的引物,使用根据普通方法(Saitoh和Miura的方法,(Biochim.Biophys Acta,72,619(1963))制备的大肠杆菌菌株W3110的染色体DNA,通过PCR来扩增一区域,所述区域含有编码TorA和位于其上游的信号序列的区域。使用Pyrobest DNA聚合酶(Takara)用于PCR反应,反应条件根据制造商建议的方案。SEQ ID NO.23的序列含有限制性内切酶BamHI识别序列。编码TorA的信号序列的DNA序列在SEQ ID NO.7中示出。
(3-2)使用TorA信号序列构建用于分泌表达具有原体结构的蛋白-谷氨酰胺酶(PPG)的质粒使用WO 01/23591中描述的质粒pPKSPTG1作为模板,使用具有SEQ IDNO.14和SEQ ID NO.24(5′-AAGAGATCGTTATTGTTCATAGAGGCGAAGGCTCCTTGAATAG-3′)所示序列的引物通过PCR扩增编码启动子和信号肽的区域。SEQ ID NO.24的序列含有编码TorA信号肽的基因的5′-末端序列。然后以1∶1的比例将这个PCR产物与含有基因序列及其上游的信号序列的PCR产物混合,然后使用它们作为模板,用具有SEQ ID NO.14和SEQ IDNO.23所示序列的引物进行交叉PCR,所述基因序列是在实施例3的(3-1)中获得的并编码TorA以及其上游的信号序列,所述TorA是用具有SEQ ID NO.22和SEQ ID NO.23所示序列的引物扩增的。结果,扩增了含有一区域的融合基因,所述区域含有PS2启动子区域、TorA信号序列和编码TorA的序列。在用限制性内切酶ScaI和BamHI消化这个交叉PCR产物之后,通过琼脂糖凝胶电泳检测到约3.1kbp的DNA片段。然后从琼脂糖凝胶上切下这个DNA片段,并使用EasyTrap Ver.2(Takara)来回收,通过将该片段插入日本专利申请公开No.H9-322774中描述的质粒pPK4的ScaI-BamHI位点中,来获得质粒pPKT-TorA。作为测定插入到这个质粒中的基因序列的核苷酸序列的结果,证实构建了预定的融合基因。然后使用这个质粒作为模板,使用具有SEQID NO.14和SEQ ID NO.25(5′-GATTTCCTGGTTGCCGTTGGAATCCGCAGTCGCACGTCGCGGCG-3′)所示序列的引物通过PCR扩增一种片段,所述片段含有PS2启动子区域和编码TorA信号肽的区域。然后使用这个PCR产物和具有SEQ ID NO.20和SEQ ID NO.18所示序列的引物,按照与实施例2的(2-2)相同的方式,通过PCR来扩增编码具有原体结构的蛋白-谷氨酰胺酶的区域。然后以1∶1的比例混合这些PCR产物,并通过使用这些PCR产物作为模板,用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物进行交叉PCR。
在用限制性内切酶ScaI和BamHI消化这个PCR产物之后,通过进行琼脂糖凝胶电泳检测到约3.1kbp的DNA片段。然后从琼脂糖凝胶上切下这个DNA片段,使用EasyTrap Ver.2(Takara)来回收,通过将该片段插入日本专利申请公开No.9-322774中描述的质粒pPK4的ScaI-BamHI位点中,来获得质粒pPKT-PPG。作为测定质粒中这个插入序列的核苷酸序列的结果,证实构建了预定的融合基因。
(3-3)使用TorA信号序列通过谷氨酸棒杆菌分泌具有原体结构的蛋白-谷氨酰胺酶菌株YDK010(在WO 02/081694中描述)是从来自谷氨酸棒杆菌ATCC13869的链霉素(Sm)抗性菌株AJ12036获得的,而谷氨酸棒杆菌ATCC13869是谷氨酸棒杆菌的突变菌株,用构建的质粒pPKT-PPG转化菌株YDK010,并选择在含有25mg/l卡那霉素的CM2G培养基上生长的微生物菌株。将选择的微生物菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在培养完成之后,通过SDS-PAGE分析10μl的培养物上清液。使用4-20%梯度凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝进行蛋白质染色。结果,在约35kDa处检测到条带,其在预定分子量的附近。作为通过反相HPLC分析100μl培养物上清液的结果,蛋白质浓度是约20mg/l。
此外,在如实施例2的(2-2)所述用Ultrafree(Millipore)对培养物上清液进行处理之后,用源自放线菌的蛋白酶SAM-P45酶法消化蛋白质,以切断蛋白-谷氨酰胺酶的原体结构区域以获得成熟蛋白质。根据日本专利申请公开No.2000-50887中描述的方法测量成熟蛋白质的活性,证实分泌的蛋白质实际上具有蛋白-谷氨酰胺酶活性。
具有原体结构的蛋白-谷氨酰胺酶的氨基酸序列在SEQ ID NO.4中示出。
实施例4-制备TatC缺陷菌株(4-1)制备破坏了来源于谷氨酸棒杆菌AJ12036的tatC基因的菌株进行了研究来确定上述连接到IMD信号序列的异麦芽糖葡聚糖酶和连接到TorA信号序列的蛋白-谷氨酰胺酶是否分别由Tat系统分泌。
虽然已经清楚地证明了tatA(GENEBANK cg103060 1571065-1571382)、tatB(GENEBANK cg103060 1167110-1167580)、tatC(GENEBANK cg1030601569929-1570873)和tatE(gi41223046 emb CAF18991.1)作为棒状杆菌型细菌的tat系统基因同源物的存在,但是它们的功能还有待鉴定。
因而,决定通过破坏tat基因来证实在以上的实施例中已被证实分泌的酶是否由Tat系统分泌。
使用如下所述的同源重组从菌株YDK010获得TatC缺陷菌株。
使用根据Saitoh和Miura的方法(Biochim Biophys Acta.72,619(1963))制备的谷氨酸棒杆菌ATCC13869的染色体DNA作为模板,使用具有SEQ IDNO.26(5′-ggcggtaccgttaagcgccctcggcgagttatct-3′)和SEQ ID NO.27(5′-gcctctagactagagcacgtcaccgaagtcggcg-3′)所示序列的引物的组合进行PCR。
然后用KpnI和XbaI消化这个片段并插入到pHS4(美国专利No.5,616,480)的KpnI-XbaI位点中,来构建pHStatC,所述pHS4是来自质粒pHM1519的温度敏感性质粒载体。用质粒pHS4转化的大肠杆菌AJ12570已经于1990年10月11日作为FERM BP-3523保藏在工业技术院生命工学工业技术研究所(当前为国际专利生物保藏中心,国家先进工业科技研究所,Tsukuba Central 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)。
然后,用NdeI和ScaI消化pHStatC,通过除去约70bp的DNA片段删除tatC基因的内部区域,使其重新环化以产生质粒pHSΔtatC。通过电穿孔将此质粒导入到YDK010中来通过如日本专利No.2763054中描述的同源重组获得tatC缺陷菌株,YDK011。
(4-2)TatC缺陷菌株中的分泌和表达(4-2-1)比较用含有SlpA衍生的信号序列的异麦芽糖葡聚糖酶(IMD)分泌表达质粒pPKS-IMD转化的菌株与用含有IMD信号序列的IMD分泌表达质粒pPKI-IMD转化的菌株之间的IMD分泌用在参考实施例A中产生的pPKS-IMD转化上述TatC缺陷菌株,所述pPKS-IMD是具有来自产氨棒杆菌的细胞表层蛋白SlpA的信号序列的异麦芽糖葡聚糖酶分泌和表达质粒,并选择在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株,以获得菌株YDK011/pPKS-IMD。此外,用实施例1中产生的pPKI-IMD类似地转化TatC缺陷菌株YKD011来获得菌株YKD011/pPKI-IMD,所述pPKI-IMD是具有IMD信号序列的IMD分泌和表达质粒。获得的两种菌株都在MM培养基中在30℃培养48小时,并比较分泌到培养物上清液中的IMD的量。通过施加到SDS-PAGE上来分析每个菌株的10μl培养物上清液,然后使用SYPRO Orange(Molecular Probes)进行蛋白质染色。结果,对于菌株YDK011/pPKS-IMD的培养物上清液,在IMD的分子量附近检测到非常微弱的条带,对于菌株YDK011/pPKI-IMD的培养物上清液在IMD的分子量附近没有检测到条带。
(4-2-2)比较用含有IMD信号序列的蛋白-谷氨酰胺酶分泌表达质粒pPKI-PPG转化的菌株和用含有TorA信号序列的蛋白-谷氨酰胺酶分泌表达质粒pPKT-PPG转化的菌株之间的蛋白-谷氨酰胺酶分泌用实施例2中产生的含有IMD信号序列的IMD分泌和表达质粒pPKI-PPG转化TatC缺陷菌株YDK011来获得YDK011/pPKI-PPG。此外,用含有TorA信号的蛋白-谷氨酰胺酶(PPG)表达质粒pPKT-PPG(实施例3)转化TatC缺陷菌株YDK011来获得YDK011/pPKT-PPG,所述TorA信号是来自大肠杆菌的Tat系统信号。这样获得的转化的菌株都在基本液体培养基中在30℃培养48小时,分析培养物上清液中的PPG的分泌量。
将菌株YOK011/pPKI-PPG和菌株YDK011/pPKT-PPG的10μl每种培养物上清液施加到SDS-PAGE上,然后用SYPRO Orange进行蛋白质染色。结果,在菌株YDK011/pPKI-PPG或菌株YDK011/pPKT-PPG的培养物上清液中都未能检测到35kDa分子量附近的PPG条带。
然后,通过用蛋白-谷氨酰胺酶免疫兔子来产生抗蛋白-谷氨酰胺酶多克隆抗体。作为使用这种多克隆抗体进行Western印迹的结果,虽然在实施例2和3中产生的两种菌株YDK010/pPKI-PPG或YDK010/pPKT-PPG的培养物上清液检测到了条带,但在菌株YDK011/pPKI-PPG或菌株YDK011/pPKT-PPG的培养物上清液中都没有检测到PPG条带。此外,在培养之后通过超声处理破碎各自的细菌细胞,并通过SDS-PAGE分析细胞内的蛋白质。作为按照对培养物上清液所进行的相同的方式对每种转化菌株的细胞中存在的蛋白进行Western印迹的结果,对于来自菌株YDK011/pPKI-PPG和菌株YDK011/pPKT-PPG的破碎细胞,在35kDa分子量附近检测到了PPG条带。
在使用IMD信号和TorA信号的情况下,PPG或IMD蛋白被分泌到具有正常TatC的每种转化菌株的培养物上清液中,而PPG蛋白或IMD蛋白未被分泌到每种转化的TatC缺陷菌株的培养物上清液中,以上的结果表明IMD信号和TorA信号涉及IMD或PPG通过Tat途径的分泌。
实施例5-在谷氨酸棒杆菌ATCC13869中分泌表达蛋白-谷氨酰胺酶(5-1)使用TorA信号序列在谷氨酸棒杆菌中分泌具有原体结构的蛋白-谷氨酰胺酶YDK010(描述于WO 02/081694中)是从链霉素(Sm)-抗性菌株AJ12036获得的,AJ12036本身是谷氨酸棒杆菌ATCC13869的突变菌株,用实施例3的(3-2)中构建的质粒pPKT-PPG转化谷氨酸棒杆菌ATCC13869和YDK010,如实施例1的(1-3)中所述选择在含25mg/l卡那霉素的CM2G琼脂培养基中生长的细菌菌株。将选择的微生物菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在培养完成之后,通过SDS-PAGE分析10μl的培养物上清液。使用4-20%梯度凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝进行蛋白质染色。结果,在两种菌株的培养物上清液中在约35kDa预定分子量的位置都检测到条带。通过将100μl每种培养物上清液施加到反相HPLC上来分析蛋白质浓度,作为结果,在携带pPKT-PPG的谷氨酸棒杆菌菌株YDK010的培养物上清液中的蛋白质浓度为约20mg/l,而在携带相同的pPKT-PPG的谷氨酸棒杆菌菌株ATCC13869的培养物上清液中蛋白质浓度为约70mg/l。
此外,在如实施例2的(2-2)中所述使用Ultrafree(Millipore)对培养物上清液进行处理之后,用源自放线菌的蛋白酶SAM-P45酶法消化该蛋白质,以切断蛋白-谷氨酰胺酶的原体结构区域以获得成熟蛋白质。根据日本专利申请公开No.2000-50887中描述的方法测量这个成熟蛋白-谷氨酰胺酶的活性,并证实分泌的蛋白质实际上具有蛋白-谷氨酰胺酶活性。
实施例6Tat系统分泌元件的扩增对使用来自大肠杆菌的TorA信号序列的蛋白-谷氨酰胺酶的分泌量的影响(1)TatC表达质粒的构建编码TatA的基因存在于编码谷氨酸棒杆菌的TatC的基因序列5′上游区域。通过PCR扩增含有TatA基因的上游启动子区域的基因序列。根据Saitoh和Miura的方法制备的谷氨酸棒杆菌ATCC13869的染色体DNA被用做模板;使用具有SEQ ID NO.33(5′-GCTTGATCATTCCTTTAAGG-3′)和SEQ IDNO.34(5′-ATGTGCTCAACAATGGACATGTGGTCTACTCCAAATTCAC-3′)所示序列的引物。SEQ ID NO.34含有tatC的5′-末端的序列。此外,通过参考谷氨酸棒杆菌ATCC13032中tatC(SEQ ID NO.35)的基因序列产生具有SEQ ID NO.36(5′-ATGTCCATTGTTGAGCACATC-3′)和SEQ ID NO.37(5′-CTAGAGCACGTCACCGAAGT-3′)所示序列的引物,通过PCR扩增编码TatC的基因。此外,将用SEQ ID NO.33和SEQ ID NO.34扩增的PCR产物以及用SEQ ID NO.36和SEQ ID NO.37扩增的PCR产物以1∶1的比例混合,它们被用做模板用SEQ ID NO.33和SEQ ID NO.37来进行交叉PCR,以扩增含有tatA启动子区域和编码TatC的基因的融合基因。对这个PCR产物进行琼脂糖凝胶电泳,并回收了约1.8kb的DNA片段。通过将回收的DNA片段插入到日本专利申请公开No.H9-070291中描述的质粒pVC7的SmaI位点中,构建了TatC表达质粒pVtatC。使用与实施例1中类似的方法证实构建的质粒含有插入位点的核苷酸序列。
(2)构建TatA和TatC表达质粒使用谷氨酸棒杆菌ATCC13869的染色体DNA作为模板,使用具有SEQID NO.33和SEQ ID NO.37所示序列的引物通过PCR扩增一区域,所述区域含有编码TatA的基因序列和其5′上游区域和编码TatC的基因序列。通过对这个PCR产物进行琼脂糖凝胶电泳回收了大约2.4kb的DNA片段。通过将回收的DNA片段插入到日本专利申请公开No.H9-070291中描述的质粒pVC7的SmaI位点中,构建了TatA和TatC表达质粒pVtatAC。使用与实施例1相同的方法证实了构建的质粒中插入的基因的核苷酸序列。结果,显示了tatA的核苷酸序列稍微不同于谷氨酸棒杆菌ATCC13032中tatA的预计序列。编码这个TatA的基因序列和其5′上游区域,以及编码TatC的基因序列,在SEQ ID NO.38中示出。
(3)构建TatA、TatB和TatC表达质粒通过使用具有以下SEQ ID NO.39(5′-GAGGCGCTGCCTGAAGATTA-3′)和SEQ ID NO.40(5′-GACAGGTGAAGAGGTCAAGG-3′)所示序列的引物通过PCR扩增一区域,所述区域含有编码谷氨酸棒杆菌ATCC13032中预计的TatB的基因序列和其5′-上游区域。通过琼脂糖凝胶电泳从扩增的PCR产物回收大约1.7kb的DNA片段。通过将回收的DNA片段插入到日本专利申请公开No.9-070291中描述的质粒pVC7的SmaI位点中,构建了TatB表达质粒pVtatB。使用与实施例1相同的方法证实了构建的质粒的插入DNA片段的核苷酸序列。在SEQ ID NO.41中描述了编码TatB的基因序列和其5′-上游区域的基因序列。用限制性内切酶KpnI消化这个TatB表达质粒pVtatB,并通过琼脂糖凝胶电泳回收大约1.5kb的DNA片段。这个DNA片段含有tatB启动子区域和编码TatB的基因序列。通过将这个片段插入到实施例6的(2)中产生的质粒pVtatAC的KpnI位点中,构建了表达TatA、TatB和TatC的质粒pVtatABC。
(4)通过已经扩增了Tat系统分泌元件的菌株分泌表达蛋白-谷氨酰胺酶用实施例3的(3-2)中产生的pPKT-PPG转化谷氨酸棒杆菌ATCC13869来产生13869/pPKT-PPG,所述pPKT-PPG是具有原体结构的蛋白-谷氨酰胺酶的表达质粒。此外,选择分别用上述质粒pVtatC、pVtatAC和pVtatABC转化的在含有25mg/l的卡那霉素和5mg/l的氯霉素的CM2G琼脂培养基上生长的微生物菌株,以分别获得13869/pPKT-PPG/pVtatC、13869/pPKT-PPG/pVtatAC和13869/pPKT-PPG/pVtatABC。这些菌株在含有25mg/l卡那霉素和5mg/l氯霉素的MM培养基中在30℃培养48小时。在培养完成之后,作为使用实施例2的(2-3)中描述的方法通过SDS-PAGE分析10μl培养物上清液的结果,观察到其中已经扩增了Tat系统分泌元件的13869/pPKT-PPG/pVtatC、13869/pPT-KPPG/pVtatAC和13869/pPKT-PPG/pVtatABC与扩增Tat系统分泌元件之前的菌株13869/pPKT-PPG相比显示显著更大量的分泌。作为在实施例2中描述的条件下通过反相HPLC分析每种上清液的结果,观察到在13869/pPKT-PPG/pVtatC和13869/pPKT-PPG/pVtatAC中的分泌量是在13869/pPKT-PPG中的大约三倍,在13869/pPKT-PPG/pVtatABC中的分泌量是在13869/pPKT-PPG中的大约十倍。
实施例7-Tat系统分泌元件的扩增对使用来自球形节杆菌的IMD信号的转谷氨酰胺酶的分泌量的影响(1)产生使用来自球形节杆菌的IMD信号的转谷氨酰胺酶分泌表达质粒使用实施例1中制备的异麦芽糖葡聚糖酶分泌表达质粒pPKI-IMD作为模板,使用具有SEQ ID NO.14和SEQ ID NO.42(5′-GTCTCTTCCCCCGCGCCATTGTCGGCCTGGGCGGAGCCTGC-3′)所示序列的引物扩增含有IMD信号序列和其5′-上游区域的CspB启动子的区域。SEQ ID NO.42含有编码IMD信号序列的C-末端侧的基因序列和编码转谷氨酰胺酶的原体序列的N-末端侧的基因序列。此外,使用pPKSPTG1(在WO01/23591中描述)作为模板,使用具有SEQ VID NO.43(5′-GACAATGGCGCGGGGGAAG-3′)和SEQ ID NO.44(5′-GACAATGGCGCGGGGGAAG-3′)所示序列的引物进行PCR,来扩增编码具有原体结构的转谷氨酰胺酶的基因序列。将用具有SEQ ID NO.14和SEQID NO.42所示序列的引物扩增的PCR产物以及用具有SEQ ID NO.43和SEQID NO.44所示序列的引物扩增的PCR产物以1∶1的比例混合,并用作模板,使用具有SEQ ID NO.14和SEQ ID NO.44所示序列的引物进行交叉PCR,来扩增含有CspB启动子、IMD信号和编码具有原体结构的转谷氨酰胺酶的基因的融合基因。用限制性内切酶ScaI和EcoO65I切断这个PCR产物,并通过琼脂糖凝胶电泳回收大约700bp的基因片段。通过将回收的DNA片段插入到pPKSPTG1(在WO 01/23591中描述)的ScaI-EcoO65I位点中,来产生带有原体结构的转谷氨酰胺酶的表达质粒pPKI-PTG1。根据实施例1中描述的方法测定产生的质粒的核苷酸序列,并证实已经构建了预定的融合基因。
(2)在具有扩增的Tat系统分泌元件的菌株中使用IMD信号分泌表达转谷氨酰胺酶通过用(1)中产生的质粒pPKI-PTG1转化谷氨酸棒杆菌ATCC13869产生菌株13869/pPKIPTG1。在用实施例6的(3)中产生的表达Tat分泌元件TatA、TatB和TatC的表达质粒pVtatABC进一步转化这个菌株之后,选择在含有25mg/l卡那霉素和5mg/l氯霉素的GM2G琼脂培养基上生长的微生物菌株,来获得扩增了Tat系统分泌元件的菌株13869/pPKI-PTG1/pVtatABC。
将13869/pPKI-PTG1和13869/pPKI-PTG1/pVtatABC在含有25mg/l卡那霉素和5mg/l氯霉素的MM培养基中在30℃培养48小时。在完成培养之后,作为使用实施例2的(2-3)中描述的方法对培养物上清液进行SDS-PAGE的结果,与2256/pPKI-PTG1相比,在2256/pPKI-PTG1/pVtatABC中观察到具有原体结构的转谷氨酰胺酶的分泌量增加。此外,作为在参考实施例A-3中描述的条件下通过反相HPLC分析培养物上清液的结果,在Tat系统分泌元件增强的菌株中的分泌量大约高7倍。
实施例8-Tat系统分泌元件的扩增对使用来自大肠杆菌的TorA信号的转谷氨酰胺酶的分泌量的影响(1)使用来自大肠杆菌的TorA信号构建转谷氨酰胺酶的表达质粒使用根据实施例3的(3-2)生产的使用TorA信号的蛋白谷氨酰胺酶的分泌表达质粒pPKT-PPG作为模板,通过具有SEQ ID NO.14和SEQ ID NO.45(5′-CTTCCCCCGCGCCATTGTCCGCAGTCGCACGTCGCGGCG-3′)所示序列的引物来扩增含有TorA信号序列和其5′-上游区域的CspB启动子的区域。SEQ ID NO.45中描述的序列含有编码TorA信号序列的C-末端的基因和编码转谷氨酰胺酶的原体序列的N-末端的基因。此外,使用pPKSPTG1(在WO 01/23591中描述)作为模板,使用具有SEQ ID NO.43和SEQ ID NO.44所示序列的引物进行PCR来扩增编码具有原体结构的转谷氨酰胺酶的基因序列。将用具有SEQ ID NO.14和SEQ ID NO.45所示序列的引物扩增的PCR产物以及用具有SEQ ID NO.43和SEQ ID NO.44所示序列的引物扩增的PCR产物以1∶1的比例混合,并用作模板,使用具有SEQ ID NO.14和SEQ IDNO.44所示序列的引物进行交叉PCR,来扩增含有CspB启动子、TorA信号和编码具有原体结构的转谷氨酰胺酶的基因的融合基因。用限制性内切酶ScaI和EcoO65I切断这个PCR产物,并通过琼脂糖凝胶电泳回收大约700bp的基因片段。通过将这个回收的DNA片段插入到pPKSPTG1(在WO 01/23591中描述)的ScaI-EcoO65I位点中,来产生带有原体结构的转谷氨酰胺酶的表达质粒pPKT-PTG1。根据早先描述的方法测定产生的质粒的核苷酸序列,证实已经构建了预定的融合基因。
(2)在具有扩增的Tat系统分泌元件的菌株中使用TorA信号分泌表达转谷氨酰胺酶通过用实施例8的(1)中产生的质粒pPKT-PTG1转化谷氨酸棒杆菌ATCC13869来产生菌株13869/pPKT-PTG1。在用实施例8中产生的Tat分泌元件TatA、TatB和TatC的表达质粒pVtatABC进一步转化这个菌株之后,选择在含有25mg/l卡那霉素和5mg/l氯霉素的CM2G琼脂培养基上生长的微生物菌株,来获得增强了Tat系统分泌元件的菌株13869/pPKT-PTG1/pVtatABC。
13869/pPKI-PTG1和13869/pPKT-PTG1/PVtatABC在含有25mg/l卡那霉素和5mg/l氯霉素的MM培养基中在30℃培养48小时。在完成培养之后,作为使用实施例2的(2-3)中描述的方法对10μl培养物上清液进行SDS-PAGE的结果,与13869/pPKT-PTG1相比,在13869/pPKT-PTG1/PVtatABC中观察到具有原体结构的转谷氨酰胺酶的分泌量增加。此外,作为在参考实施例A-3中描述相同条件下通过反相HPLC分析培养物上清液的结果,在Tat系统分泌元件增强的菌株中分泌量大约高40倍。
实施例9-在使用TorA信号序列分泌生产蛋白-谷氨酰胺酶中改变原体序列的C-末端(1)改变蛋白-谷氨酰胺酶的原体序列的C-末端分析在实施例3和5中证实了活性的蛋白-谷氨酰胺酶的N-末端氨基酸序列,揭示了与天然存在的蛋白-谷氨酰胺酶相比,该序列(NKLASV)具有两个额外的氨基酸。因此,改变原体序列的C-末端序列,使得该原体序列被切割后产生与天然存在的蛋白-谷氨酰胺酶的N-末端序列相同的N-末端序列。虽然天然存在的蛋白-谷氨酰胺酶的原体序列的C-末端序列是“QTNK”,它被改变成“FGPK”,预计其可以容易地被SAM-P45切断,或改变成“FGPF”、“FAPF”、“FAPY”、“AHAY”、“AHAL”、“AAPF”、“AAPY”或“AAPM”,其预计可以用含有枯草杆菌蛋白酶作为其主要成分的Atkalase(Novozymes)容易地切断。通过使用具有SEQ ID NO.50(CTT GGG GCC GAA GCC CTTGAC TTC TTT GGT CAG)和SEQ ID NO.51(TTC GGC CCC AAG TTG GCGTCC GTC ATT CCA GAT)所示序列的引物,进行向“FGPK”的改变。SEQ IDNO.50的序列是用于扩增原体序列区域的引物;而SEQ ID NO.51是用于扩增成熟区的引物。使用在实施例3的(3-2)中构建的质粒pPKT-PPG作为模板,使用具有SEQ ID NO.20和SEQ ID NO.50所示序列的引物来扩增蛋白-谷氨酰胺酶的原体序列区域,而使用具有SEQ ID NO.51和SEQ ID NO.18所示序列的引物来扩增蛋白-谷氨酰胺酶的成熟区域。此外,这些PCR产物以1∶1的比例混合,然后使用它们作为模板,使用具有SEQ ID NO.20和SEQID NO.18所示序列的引物进行交叉PCR,来扩增具有原体结构的蛋白-谷氨酰胺酶基因,其中原体序列的C-末端已经被改变成FGPK。
将交叉PCR产物克隆到pUC18的SmaI位点中(pUCPPG(FGPK)),并测序来证实该原体序列已经改变。然后,将pPKT-PPG的AatII-BstPI(大)片段和pUCPG(FGPK)的AatII-BstPI(小)片段连接产生pPKT-PPG(FGPK)。类似地,为了改变成“FGPF”,使用具有SEQ ID NO.52(GAA GGG GCC GAAGCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.53(TTC GGC CCC TTCTTG GCG TCC GTC ATT CCA GAT)所示序列的引物,为了改变成“FAPF”,使用具有SEQ ID NO.54(GAA GGG CGC GAA GCC CTT GAC TTC TTTGGT CAG)和SEQ ID NO.55(TTC GCG CCC TTC TTG GCG TCC GTC ATTCCA GAT)所示序列的引物,为了改变成“FAPY”,使用具有SEQ ID NO.56(GTA GGG CGC GAA GCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.57(TTC GCG CCC TAC TTG GCG TCC GTC ATT CCA GAT)所示序列的引物,为了改变成“AHAY”,使用具有SEQ ID NO.58(GTA CGC GTG CGC GCCCTT GAC TTC TTT GGT CAG)和SEQ ID NO.59(GCG CAC GCG TAC TTGGCG TCC GTC ATT CCA GAT)所示序列的引物,为了改变成“AHAL”使用具有SEQ ID NO.60(CAA CGC GTG CGC GCC CTT GAC TTC TTT GGTCAG)和SEQ ID NO.61(GCG CAC GCG TTG TTG GCG TCC GTC ATT CCAGAT)所示序列的引物,为了改变成“AAPF”使用具有SEQ ID NO.62(GAAGGG CGC CGC GCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.63(GCGGCG CCC TTC TTG GCG TCC GTC ATT CCA GAT)所示序列的引物,为了改变成“AAPY”使用具有SEQ ID NO.64(GTA GGG CGC CGC GCC CTTGAC TTC TTT GGT CAG)和SEQ ID NO.65(GCG GCG CCC TAC TTG GCGTCC GTC ATT CCA GAT)所示序列的引物,以及,为了改变成“AAPM”使用具有SEQ ID NO.66(CAT GGG CGC CGC GCC CTT GAC TTC TTT GGTCAG)和SEQ ID NO.67(GCG GCG CCC ATG TTG GCG TCC GTC ATT CCAGAT)所示序列的引物。SEQ ID NO.52、54、56、58、60、62、64和66的序列是用于扩增原体序列区域的引物,而SEQ ID NO.53、55、57、59、61、63、65和67是用于扩增成熟区的引物。使用在实施例3的(3-2)中构建的质粒pPKT-PPG作为模板,分别地,用具有SEQ ID NO.20和SEQ ID NO.52所示序列的引物来扩增蛋白-谷氨酰胺酶的原体序列区域,而用具有SEQ IDNO.53和SEQ ID NO.18所示序列的引物来扩增蛋白-谷氨酰胺酶的成熟区域。这些PCR产物以1∶1的比例混合,然后使用它们作为模板,使用具有SEQID NO.20和SEQ ID NO.18所示序列的引物进行交叉PCR,来扩增具有原体结构其中原体序列的C-末端已经被改变成FGPF的蛋白-谷氨酰胺酶基因。将交叉PCR产物克隆到pUC18的SmaI位点中(pUCPG(FGPF)),并测序来证实原体序列已经改变。然后,将pPKT-PPG的AatII-BstPI(大)片段和pUCPPG(FGPF)的AatII-BstPI(小)片段连接产生pPKT-PPG(FGPF)。根据类似的步骤,构建pPKT-PPG(FAPF)、pPKT-PPG(FAPY)、pPKT-PPG(AHAY)、pPKT-PPG(AHAL)、pPKT-PPG(AAPF)、pPKT-PPG(AAPY)和pPKT-PPG(AAPM)。
(2)分泌和表达其中原体序列C-末端已经改变成“FGPK”的蛋白-谷氨酰胺酶用构建的质粒pPKT-PPG(FGPK)转化谷氨酸棒杆菌ATCC13869,选择在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株。将选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在培养完成之后,通过SDS-PAGE分析10μl的培养物上清液。使用4-20%梯度凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝进行蛋白质染色。结果,在约35kDa附近检测到条带,其接近预定分子量。作为通过反相HPLC分析100μl培养物上清液的结果,发现蛋白质浓度为约20mg/l。
此外,在如实施例2的(2-2)所述使用Ultrafree(Millipore)对培养物上清液进行处理之后,用源自放线菌的蛋白酶SAM-P45酶法消化蛋白质,以切断蛋白-谷氨酰胺酶的原体结构区域并获得成熟蛋白质。使用日本专利申请公开No.2000-50887中描述的方法测量这个成熟蛋白质的活性,并证实分泌的蛋白质实际上具有蛋白-谷氨酰胺酶活性。此外,作为分析成熟蛋白质的N-末端氨基酸序列的结果,证实了N-末端是LASV,与天然存在的形式相同。此外,还证实了,当使用胰蛋白酶或蛋白酶M(Protease M)(Amano Enzyme)进行成熟化(maturation)时也获得了与天然存在形式相同的N-末端。
(3)分泌表达具有改变的原体序列C-末端的蛋白-谷氨酰胺酶和它通过Alkalase的成熟化分别用构建的质粒pPKT-PPG(FGPF)、pPKT-PPG(FAPF)、pPKT-PPG(FAPY)、pPKT-PPG(AHAY)、pPKT-PPG(AHAL)、pPKT-PPG(AAPF)、pPKT-PPG(AAPY)和pPKT-PPG(AAPM)转化谷氨酸棒杆菌ATCC13869,选择在含有25mg/l卡那霉素的CM2G琼脂培养基上生长的微生物菌株。将每个选择的菌株在含有25mg/l卡那霉素的MM液体培养基中在30℃培养48小时。在完成培养之后,通过SDS-PAGE来分析10μl培养物上清液。使用4-20%梯度凝胶(Daiichi Pure Chemicals)进行SDS-PAGE,随后用考马斯亮蓝进行蛋白质染色。结果,在约35kDa附近检测到条带,其接近预定分子量。作为通过反相HPLC分析100μl培养物上清液的结果,发现蛋白质浓度为约20mg/l。
此外,按照与实施例2的(2-2)相同的方式用Ultrafree(Millipore)对培养物上清液进行处理之后,用枯草杆菌蛋白酶(Sigma)或Alkalase(Novozymes)酶法消化蛋白质,以切断蛋白-谷氨酰胺酶的原体结构区域并获得成熟蛋白质。使用日本专利申请公开No.2000-50887中描述的方法测量这个成熟蛋白质的活性,并证实分泌的蛋白质实际上具有蛋白-谷氨酰胺酶活性。此外,作为分析成熟蛋白质的N-末端氨基酸序列的结果,证实了N-末端是LASV,与天然存在的形式相同。
根据本发明,通过棒状杆菌型细菌中的蛋白质分泌途径Sec系统很难分泌的工业上有用的异源蛋白质,例如异麦芽糖葡聚糖酶或蛋白-谷氨酰胺酶,可以有效地细胞外地生产并分泌(分泌和生产)。即,根据本发明,提供了有效地生产异源蛋白质的方法,所述异源蛋白质难以通过Sec系统分泌生产。
参考文献1.美国专利No.49651972.日本国际专利申请公开No.6-5025483.日本国际专利申请公开No.H11-1691824.国际公开WO 02/816945.日本专利申请公开No.H6-1697806.日本专利申请公开No.H6-2770737.日本专利申请公开No.H11-1691828.日本专利申请公开No.H7-1079819.美国专利No.602295210.美国专利No.633517811.国际公开WO 02/2266712.Liebl W,Sinskey AJ,Schleifer KH,Expression,secretion,and processingof staphylococcal nuclease by Corynebacterium glutamicum,J.Bacteriology(1992)174,1854-186113.Billman-Jacobe H,Wang L,Kortt A,Stewart D,Radford A,Expressionand secretion of heterologous proteases by Corynebacterium glutamicum,AppliedEnvironmental Microbiology(1995)61,1610-161314.Salim K,Haedens V,Content J,Leblon G,Huygen K,Heterologousexpression of the Mycobacterium tuberculosis gene encoding antigen 85A inCorynebacterium glutamicum,Applied Environmental Microbiology,(1997),63,4392-440015.Kikuchi Y,Date M,Yokoyama K,Umezawa Y,Matsui H,Secretion ofactive-form Streptoverticillium mobaraense transglutaminase by Corynebacteriumglutamicumprocessing of the pro-transglutaminase by a cosecreted subtilisin-likeprotease from Streptomyces albogriseolus,Applied Environmental Microbiology,(2003),69,358-36616.Chaddock AM,Mant A,Karnnauchov I,Brink S,Herrmann RG,KlosgenRB,Robinson C,A new type of signal peptidecentral role of a twin-argininemotif in transfer signals for the delta pH-dependent thylakoidal protein translocase,EMBO Journal,(1995),14,2715-272217.Mark Settles,Ann Yonetani,Aimee Baron Daniel R.Bush-Kenneth Clineand Rob Martienssen,Sec-Independent Protein Translocation by the MaizeHcf106 Protein,Science(1997),278,1467-147018.Jongbloed JD,Martin U,Antelmann H,Hecker M,Tjalsma H,VenemaG,Bron S,van Dijl JM,Muller J,TatC is a specificity determinant for proteinsecretion via the twin-arginine translocation pathway,Journal of BiologicalChemistry,275,41350-4135719.Hynds PJ,Robinson D,Robinson C,The sec-independent twin-argininetranslocation system can transport both tightly folded and malfolded proteinsacross the thylakoid membrane.J.Biol Chem.(1998)25;273(52)34868-7420.Barrett,C.M.,N.Ray,J.D.Thomas,C.Robinson,and A.Bolhius,Quantitative export of a reporter protein,GFP,by the twin-arginine translocationpathway in Escherichia coil.(2003)Biochem.Biophys.Res.Commun.304279-284<序列表自由本文(free text)>
SEQ ID NO.11-27,33,34,36,37,39,40,42-45,和50-67合成的寡核苷酸序列表<110>味之素株式会社(Ajinomoto Co.,Inc.)<120>生产蛋白质的方法<130>OP06151<150>JP2004-124196<151>2004-04-20<150>JP2005-5896<151>2005-01-13<160>67<170>PatentIn version3.2<210>1<211>1911<212>DNA<213>球形节杆菌<220>
<221>misc_feature<223>IMD酶;核苷酸序列<400>1atgatgaacc tgtcccgccg cacattgctc accaccggca gcgccgccac cctcgcctac 60gccttgggca tggcaggctc cgcccaggcc gccaccgccg tcaccgcccg cccgggcgtc 120cccgtcacgg ccgcgccgcc cttgcgcctg gccagccgga acagcgtgtt cacccgcagc 180ggtgccggcc cccggtactg gaacatctac ggctactcgt tcccgcacaa cgcccccatt 240ccggaaaacg agtggaaggc caacatcgac tggctggccg gaaacttcgc cgatttcggt 300tacgacatcg cctgcaccga cggctggatc gaaggctcca gccgcaccac cggcaacggc 360tacatcacca gctacaacga ttcctggcag cacgactggg cttactgggc aaactacctg 420gccgcgcgga agatgaagct gggtgtctac tacaaccccc tctgggtgca ccgggccgcc 480gtcgaagacg cttccaagac cgtcctgggc cggcccgacg tcaagatcgc ggacctggtg 540gtgcccgggg acttcttcgc ccgggacatc ggcggaaacc agctgtactg gctggacgtg 600accaagtccg gcgccaagga atacgtccag ggctacgtgc gctacttcaa ggacctcggc 660gttccctacc tgcggatcga cttcctctcc tggtacgagg acggaaggga cgcgaacatc 720gggcaggtca acgcaccgca cggccgggcc aactacgaac tcgccctctc ctggatcaac 780gaggccgccg gcgaggacat ggaagtttcg ctcgtaatgc cgcacatgtt ccaggacggt 840tccgcggaac tggccaacgg cgacctggtg cggatcaatg ccgacgccga caagggcggc 900tgggaccggc tgagcgggat gcgccagaac tggcaggacg cgtggcccaa ctgggccaac 960ccgttctgcg ggttcaccgg atggtcccac cgcaacggca ggggccagct gatcctggac1020ggcgacttca tgcgcgccag cacctttgcc agcgacgagg aacgcaagac catgatgaac1080ctgatggtcg cggccggatc acccttggcc atcgctgaca cctaccagca aatcggcaac1140aacgcctggg tttacaccaa caaggaagtc ctccagctca atgccgacgg cctggtgggc1200aagcccctct accggtccgc caccccgttc tccaaggacc ccggctcccg cgacaccgaa1260cgctgggccg ggcagcttcc ggacggttcg tggggcgttg cgctcttcaa ccgcagcgac1320actgaaacgg tcaccaagac catcgacttc gcaaaggacc tcggcctggc aaccggcggc1380aacgtccggg acctctggga gcacaggaac ctgggcatgg actcccgcgc cacggccgcg1440
ctggccccgc acgcctcggc catcttccgc gtcactccgc cgaagatgca cggcaccacc 1500cggtaccccg cggccttcgc agcctgggga ggcggggccg gcttcaacaa caaccacccc 1560gggtatgacg gcaacggctt cgtggacgga ctccaggcgg gctccggcag cgcggacccg 1620ctggtcacgt tcgcggtcca ggtgccgcac cgcggcagct acgccatccg ctaccggtat 1680gccaatgcca ccggcgatac cagcaccatg acggtcaccg ccgaaaaggc ggaccgttcc 1740accgtggacg gtccggtcca cgtcagcttc ccgggcctgg ccacctggga cacctggggc 1800gtggcggacg gcaccatcac gctcgatgcc ggcctgaacc tggtcaccat cggcaggggc 1860gccacggaca agggagccat caacctgaac tggatagagt tggacatgtg a 1911<210>2<211>636<212>PRT<213>球形节杆菌<220>
<221>MISC_FEATURE<223>IMD酶;氨基酸序列<400>2Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala1 5 10 15Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala Ala Thr20 25 30Ala Val Thr Ala Arg Pro Gly Val Pro Val Thr Ala Ala Pro Pro Leu35 40 45Arg Leu Ala Ser Arg Asn Ser Val Phe Thr Arg Ser Gly Ala Gly Pro50 55 60Arg Tyr Trp Asn Ile Tyr Gly Tyr Ser Phe Pro His Asn Ala Pro Ile65 70 75 80Pro Glu Asn Glu Trp Lys Ala Asn Ile Asp Trp Leu Ala Gly Asn Phe85 90 95Ala Asp Phe Gly Tyr Asp Ile Ala Cys Thr Asp Gly Trp Ile Glu Gly100 105 110Ser Ser Arg Thr Thr Gly Asn Gly Tyr Ile Thr Ser Tyr Asn Asp Ser115 120 125Trp Gln His Asp Trp Ala Tyr Trp Ala Asn Tyr Leu Ala Ala Arg Lys130 135 140Met Lys Leu Gly Val Tyr Tyr Asn Pro Leu Trp Val His Arg Ala Ala145 150 155 160Val Glu Asp Ala Ser Lys Thr Val Leu Gly Arg Pro Asp Val Lys Ile165 170 175Ala Asp Leu Val Val Pro Gly Asp Phe Phe Ala Arg Asp Ile Gly Gly180 185 190Asn Gln Leu Tyr Trp Leu Asp Val Thr Lys Ser Gly Ala Lys Glu Tyr195 200 205Val Gln Gly Tyr Val Arg Tyr Phe Lys Asp Leu Gly Val Pro Tyr Leu210 215 220Arg Ile Asp Phe Leu Ser Trp Tyr Glu Asp Gly Arg Asp Ala Asn Ile225 230 235 240Gly Gln Val Asn Ala Pro His Gly Arg Ala Asn Tyr Glu Leu Ala Leu245 250 255
Ser Trp Ile Asn Glu Ala Ala Gly Glu Asp Met Glu Val Ser Leu Val260 265 270Met Pro His Met Phe Gln Asp Gly Ser Ala Glu Leu Ala Asn Gly Asp275 280 285Leu Val Arg Ile Asn Ala Asp Ala Asp Lys Gly Gly Trp Asp Arg Leu290 295 300Ser Gly Met Arg Gln Asn Trp Gln Asp Ala Trp Pro Asn Trp Ala Asn305 310 315 320Pro Phe Cys Gly Phe Thr Gly Trp Ser His Arg Asn Gly Arg Gly Gln325 330 335Leu Ile Leu Asp Gly Asp Phe Met Arg Ala Ser Thr Phe Ala Ser Asp340 345 350Glu Glu Arg Lys Thr Met Met Asn Leu Met Val Ala Ala Gly Ser Pro355 360 365Leu Ala Ile Ala Asp Thr Tyr Gln Gln Ile Gly Asn Asn Ala Trp Val370 375 380Tyr Thr Asn Lys Glu Val Leu Gln Leu Asn Ala Asp Gly Leu Val Gly385 390 395 400Lys Pro Leu Tyr Arg Ser Ala Thr Pro Phe Ser Lys Asp Pro Gly Ser405 410 415Arg Asp Thr Glu Arg Trp Ala Gly Gln Leu Pro Asp Gly Ser Trp Gly420 425 430Val Ala Leu Phe Asn Arg Ser Asp Thr Glu Thr Val Thr Lys Thr Ile435 440 445Asp Phe Ala Lys Asp Leu Gly Leu Ala Thr Gly Gly Asn Val Arg Asp450 455 460Leu Trp Glu His Arg Asn Leu Gly Met Asp Ser Arg Ala Thr Ala Ala465 470 475 480Leu Ala Pro His Ala Ser Ala Ile Phe Arg Val Thr Pro Pro Lys Met485 490 495His Gly Thr Thr Arg Tyr Pro Ala Ala Phe Ala Ala Trp Gly Gly Gly500 505 510Ala Gly Phe Asn Asn Asn His Pro Gly Tyr Asp Gly Asn Gly Phe Val515 520 525Asp Gly Leu Gln Ala Gly Ser Gly Ser Ala Asp Pro Leu Val Thr Phe530 535 540Ala Val Gln Val Pro His Arg Gly Ser Tyr Ala Ile Arg Tyr Arg Tyr545 550 555 560Ala Asn Ala Thr Gly Asp Thr Ser Thr Met Thr Val Thr Ala Glu Lys565 570 575Ala Asp Arg Ser Thr Val Asp Gly Pro Val His Val Ser Phe Pro Gly580 585 590Leu Ala Thr Trp Asp Thr Trp Gly Val Ala Asp Gly Thr Ile Thr Leu595 600 605Asp Ala Gly Leu Asn Leu Val Thr Ile Gly Arg Gly Ala Thr Asp Lys610 615 620Gly Ala Ile Asn Leu Asn Trp Ile Glu Leu Asp Met625 630 635<210>3<211>963<212>DNA<213>Chryseobacterium proteolyticum
<220>
<221>misc_feature<223>蛋白谷氨酰胺酶;核苷酸序列<400>3atgaagaacc ttttcctgtc catgatggcc ttcgtgaccg tcctcacctt caactcctgc 60gccgattcca acggcaacca ggaaatcaac ggcaaggaga agctttccgt taacgattct 120aagctgaagg atttcggcaa gaccgttccg gttggcatcg acgaagagaa cggcatgatc 180aaggtgtcct tcatgttgac tgcgcagttc tacgagatca agccaaccaa ggaaaacgag 240cagtacatcg gtatgcttcg ccaggctgtt aagaacgaat ctccagtcca cattttcctc 300aagccaaaca g1aatgaaat cggcaaggtg gagtctgcat ccccagagga cgtccgctac 360ttcaagacga tcctgaccaa agaagtcaag ggccagacca acaaattggc gtccgtcatt 420ccagatgtgg ctaccctcaa ctctctcttc aaccaaatca agaaccagtc ttgcggtacc 480tctacggcgt cctccccatg catcaccttc cgctacccag tcgacggctg ctacgcacgc 540gcccacaaga tgcgccagat cttgatgaac aacggctatg actgtgagaa gcaattcgtg 600tacggtaacc tcaaggcatc caccggcacc tgctgcgtgg cgtggagcta ccacgttgca 660atcttggtga gctacaaaaa cgcttccggc gtgacggaaa aacgcattat tgatccatcc 720cttttttcca gcggtcctgt gaccgatacc gcatggcgca acgcttgcgt taacacctct 780tgcggctctg catccgtttc ctcttacgct aacaccgcag gaaatgttta ttaccgctcc 840ccatccaatt cttacctgta tgacaacaat ctgatcaata ccaactgtgt cctgactaaa 900ttctccctgc tttccggctg ttctccttca cctgcaccgg atgtctccag ctgtggattt 960taa 963<210>4<211>320<212>PRT<213>Chyrseobacterium proteolyticum<220>
<221>MISC_FEATURE<223>蛋白谷氨酰胺酶;氨基酸序列<400>4Met Lys Asn Leu Phe Leu Ser Met Met Ala Phe Val Thr Val Leu Thr1 5 10 15Phe Asn Ser Cys Ala Asp Ser Asn Gly Asn Gln Glu Ile Asn Gly Lys20 25 30Glu Lys Leu Ser Val Asn Asp Ser Lys Leu Lys Asp Phe Gly Lys Thr35 40 45Val Pro Val Gly Ile Asp Glu Glu Asn Gly Met Ile Lys Val Ser Phe50 55 60Met Leu Thr Ala Gln Phe Tyr Glu Ile Lys Pro Thr Lys Glu Asn Glu65 70 75 80Gln Tyr Ile Gly Met Leu Arg Gln Ala Val Lys Asn Glu Ser Pro Val85 90 95His Ile Phe Leu Lys Pro Asn Ser Asn Glu Ile Gly Lys Val Glu Ser100 105 110Ala Ser Pro Glu Asp Val Arg Tyr Phe Lys Thr Ile Leu Thr Lys Glu115 120 125
Val Lys Gly Gln Thr Asn Lys Leu Ala Ser Val Ile Pro Asp Val Ala130 135 140Thr Leu Asn Ser Leu Phe Asn Gln Ile Lys Asn Gln Ser Cys Gly Thr145 150 155 160Ser Thr Ala Ser Ser Pro Cys Ile Thr Phe Arg Tyr Pro Val Asp Gly165 170 175Cys Tyr Ala Arg Ala His Lys Met Arg Gln Ile Leu Met Asn Asn Gly180 185 190Tyr Asp Cys Glu Lys Gln Phe Val Tyr Gly Asn Leu Lys Ala Ser Thr195 200 205Gly Thr Cys Cys Val Ala Trp Ser Tyr His Val Ala Ile Leu Val Ser210 215 220Tyr Lys Asn Ala Ser Gly Val Thr Glu Lys Arg Ile Ile Asp Pro Ser225 230 235 240Leu Phe Ser Ser Gly Pro Val Thr Asp Thr Ala Trp Arg Asn Ala Cys245 250 255Val Ash Thr Ser Cys Gly Ser Ala Ser Val Ser Ser Tyr Ala Asn Thr260 265 270Ala Gly Asn Val Tyr Tyr Arg Ser Pro Ser Asn Ser Tyr Leu Tyr Asp275 280 285Asn Asn Leu Ile Asn Thr Asn Cys Val Leu Thr Lys Phe Ser Leu Leu290 295 300Ser Gly Cys Ser Pro Ser Pro Ala Pro Asp Val Ser Ser Cys Gly Phe305 310 315 320<210>5<211>90<212>DNA<213>球形节杆菌<220>
<221>misc_feature<223>IMD信号序列;核苷酸序列<400>5atgatgaacc tgtcccgccg cacattgctc accaccggca gcgccgccac cctcgcctac 60gccttgggca tggcaggctc cgcccaggcc 90<210>6<211>30<212>PRT<213>球形节杆菌<220>
<221>MISC_FEATURE<223>IMD信号肽<400>6Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala1 5 10 15Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala20 25 30<210>7<211>117<212>DNA<213>大肠杆菌
<220>
<221>misc_feature<223>TorA信号序列;核苷酸序列<400>7atgaacaata acgatctctt tcaggcatca cgtcggcgtt ttctggcaca actcggcggc 60ttaaccgtcg ccgggatgct ggggccgtca ttgttaacgc cgcgacgtgc gactgcg117<210>8<211>39<212>PRT<213>大肠杆菌<220>
<221>MISC_FEATURE<223>TorA信号肽<400>8Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala1 5 10 15Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu20 25 30Thr Pro Arg Arg Ala Thr Ala35<210>9<211>945<212>DNA<213>谷氨酸棒杆菌<220>
<221>misc_feature<223>tatC基因序列<400>9atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720cagttctgtcgt ttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210>10<211>314<212>PRT<213>谷氨酸棒杆菌<220>
<221>MISC_FEATURE<223>tatC氨基酸序列<400>10Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile1 5 10 15Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr20 25 30Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp35 40 45Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser50 55 60Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu65 70 75 80Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val85 90 95Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn100 105 110Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe115 120 125Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu13O 135 140Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly145 150 155 160Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val165 170 175Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile180 185 190Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile195 200 205Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr210 215 220Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu225 230 235 240Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu245 250 255Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala260 265 270Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu275 280 285Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys290 295 300Pro Gly Arg Ala Asp Phe Gly Asp Val Leu305 310<210>11<211>20<212>DNA
<213>人工序列<220>
<223>合成的寡核苷酸<400>11atgatgaacc tgtcccgccg 20<210>12<211>23<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>12cgcggatccc tgagggcggg aac 23<210>13<211>20<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>13gtccccgtca cggccgcgcc 20<210>14<211>26<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>14aaattcctgt gaattagctg atttag 26<210>15<211>46<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>15cccgggcggg cggtgacggc ggtggctgcc gttgccacag gtgcgg 46<210>16<211>39<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>16ggcgggacag gttcatcata gaggcgaagg ctccttgaa 39<210>17<211>21<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸
<400>17catgaagaac cttttcctgt c21<210>18<211>26<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>18gtaaaaggat ccattaatta aaatcc 26<210>19<211>40<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>19tcctggtt gccgttggaatc tgccgttgcc acaggtgcgg40<210>20<211>20<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>20gattccaacg gcaaccagga 20<210>21<211>38<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>21cctggttgcc gttggaatcg gcctgggcgg agcctgcc 38<210>22<211>25<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>22atgaacaata acgatctctt tcagg25<210>23<211>26<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>23ccggatcctg gtcatgattt cacctg 26<210>24
<211>43<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>24aagagatcgt tattgttcat agaggcgaag gctccttgaa tag43<210>25<211>44<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>25gatttcctgg ttgccgttgg aatccgcagt cgcacgtcgc ggcg 44<210>26<211>34<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>26ggcggtaccg ttaagcgccc tcggcgagtt atct 34<210>27<211>34<212>DNA<213>人工序列<220>
<223>合成的寡核苷酸<400>27gcctctagac tagagcacgt caccgaagtc ggcg 34<210>28<211>27<212>PRT<213>大肠杆菌<220>
<221>MISC_FEATURE<223>SufI信号肽<400>28Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu1 5 10 15Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala20 25<210>29<211>48<212>PRT<213>枯草芽孢杆菌<220>
<221>MISC_FEATURE<223>PhoD信号肽<400>29
Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu1 5 10 15Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly20 25 30Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser35 40 45<210>30<211>34<212>PRT<213>枯草芽孢杆菌<220>
<221>MISC_FEATURE<223>LipA信号肽<400>30Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met1 5 10 15Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala20 25 30Glu His<210>31<211>6<212>PRT<213>人工序列<220>
<223>tatC依赖性信号肽基序<220>
<221>MISC_FEATURE<222>(1)..(1)<223>Ser或Thr<220>
<221>MISC_FEATURE<222>(3)..(3)<223>任何氨基酸<400>31Xaa Arg Xaa Phe Leu Lys1 5<210>32<211>5<212>PRT<213>人工序列<220>
<223>tatC依赖性信号肽基序<220>
<221>MISC_FEATURE<222>(3)..(3)<223>任何氨基酸<220>
<221>MISC_FEATURE<222>(4)..(4)<223>疏水性氨基酸
<220>
<221>MISC_FEATURE<222>(5)..(5)<223>疏水性氨基酸<400>32Arg Arg Xaa Xaa Xaa1 5<210>33<211>20<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>33gcttgatcat tcctttaagg 20<210>34<211>40<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>34atgtgctcaa caatggacat gtggtctact ccaaattcac40<210>35<211>945<212>DNA<213>谷氨酸棒杆菌<220>
<221>misc_feature<223>tatC基因序列<400>35atgtccattg ttgagcacat caaagagttt cgacgccgac ttctcatcgc tctggcgggc 60atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120actttgggcg agctgctgag ggatccgtac tgttctttgc ctgctgaatc ccgctgggcc 180atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540ccactggtga tcggcatgct caacattgtg ggtatcttgc cctacgatgc cattaaagat 600aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtgga gcttgccctg 720cagttctgtc gcttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210>36<211>21<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>36atgtccattg ttgagcacat c21<210>37<211>20<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>37ctagagcacg tcaccgaagt 20<210>38<211>2402<212>DNA<213>人工的<220>
<223>tatA+tatC<400>38gcttgatcat tcctttaagg aagtaaaaat ccacaatgct caaggcatgg ataaaccctt 60gcgcctcaca ccaactgaag ccggtgtttt gctgctgaca cttgaatccc tggaatccct 120ccccggtatt gcgaaacagg aagcggtcgt atctgctgcg aacaagctac gcgccatcat 180gggagagtat tcctcgactg ttttcgactc cactggagaa gacctcgacg ctgaagttct 240agagatcatc cgcgacgcca tggatttaca ccagcaggtc agttttgaat accactcgca 300cagatcagac aacaccagcc tgaggcaagt cagccctgct catatcttca cccatgaagg 360cgaaacctac atcaaagcct gggaagaagc tgtgaaacaa tggcggacgt ttaggcttga 420tcgcatccga agcattgtgc ttcttgacag caaagcagtg cacccggcgc gaggggtttc 480agtatccacg gacgatcctt ttgagttcgc aaaatcttcc gatattgcca cgttattgct 540acgtgaggac gcaatgtggt taggcaatta catggccatg gaggtggatg aaacggtgga 600accgattcgc gatagcgacg gattcagctg gcacacagtc cactttccgc tgctttctag 660ggattggttc gtccgattcg cgattggcca tgctgagcat ttgaaagtaa ctagtcccga 720agatcttcgg aaatgcataa agcaaaaggc tcttagtggt ttgtcagcgt atgatcatca 780cgtagagtaa cacccaagag taagacgcaa catcaatcaa tgtgcaaggg tttcatttct 840ggaaatcgtg gtcaccccac attcaccagt catggacaag cttgtttaat gtgaatttgg 900agtagaccac atgcccactc tcggaccatg ggaaatcgcg atcattgtcc tgctgatcat 960tctgctgttc ggcgcgaaga agctgcctga tgcagctcgt tccatcggcc gttccatgcg1020catcttcaag tctgaagtca aagaaatgaa caaggacggc gataccccag aacaacaaca1080gcagcagcct cagcagcagc agcagattgc gcccaaccag atcgaggctc ctcagccagt1140tcagcagcca gcgcaacagt caaactttga gcagcactac cagggccagc aggttcagca1200gcctcagaac cctcagaccc ctgactaccg tcagaactac gaggatccaa accgcacctc1260
ctaaagttgg gcagtttgca tctaaaaaat aaagtcatcg caccgtaaca gctacctttt1320gttgcggtgc gtcgtagtct gtacataaaa acgcaggtag gacgttcaag gaattggctg1380aatcaacaag cgccaaggtg gttaagcgcc ctcggcgagt tatctcagaa aagaagaaga1440agtctcctac gggagagatg tccattgttg agcacatcaa agagtttcga cgccgacttc1500tcatcgctct ggcgggcatc ctcgtgggca ccattatcgg ctttatttgg tacgatttct1560cattttggca gatccccact ttgggcgagc tgctgaggga tccgtactgt tctttgcctg1620ctgaatcccg ctgggccatg agcgactcag aggaatgtcg actgctcgca accggcccgt1680ttgatccatt catgcttcgc cttaaagtag cggcgttggt gggtatggtt cttggctcac1740ccgtgtggct gagccagctg tggggcttta tcaccccagg tttgatgaag aatgagcgcc1800gttacaccgc aatcttcgtc acgattgctg ttgtgctgtt tgtcggcggt gctgttcttg1860cgtacttcgt cgttgcatat ggtttggagt tcctccttac cattggtgga gacacccagg1920cagcggccct gactggtgat aagtacttcg gattcttgct cgcgttgttg gcgattttcg1980gcgtgagctt cgaagttcca ctggtgatcg gcatgctcaa cattgtgggt atcttgccct2040acgatgccat taaagataag cgacgcatga tcatcatgat tttgttcgtg ttcgctgctt2100tcatgacacc cggccaggat cctttcacca tgttggtgtt ggcgctttca ctcaccgttc2160tggtggagct tgccctgcag ttctgtcgct tcaacgacaa acgccgggac aagaagcgcc2220cagaatggct tgatggcgat gacctctctg catcaccact ggatacttct gctggtggag2280aagatgctcc aagcccagtc gaaaccccag aggcggtgga gccttcgcgg atgctgaacc2340caagtgggga ggcgtcgata agctataaac ccgggcgcgc cgacttcggt gacgtgctct2400ag 2402<210>39<211>20<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>39gaggcgctgc ctgaagatta 20<210>40<211>20<212>DNA<213>人工的<220>
<223>合成的寡核苷酸<400>40gacaggtgaa gaggtcaagg 20<210>41<211>1710<212>DNA<213>谷氨酸棒杆菌<220>
<221>misc_feature<223>tatB基因序列<400>41gaggcgctgc ctgaagatta tgagcgcgtt ccgggcaatg acatcacccc agagcaggca 60
tacaccgaag ctcaccttga cccagctctg caggcagccc tcgatgagtt gagcccagac 120ttccgcgtgg ccgtgatcct gtgtgacgtt gttggtatga gctatgacga aatcgcagag 180accctcggag tgaagatggg taccgtgcgt tcccgtattc accgtggacg cagccagctt 240cgtgcaagtt tggaagctgc agcaatgacc agcgaggaag tttctttgtt ggtcccaacc 300cactaaagct ggtgtgtttt ctgacacgac aaacgcaaat gtcgtgtcat ttttgcagct 360cagtgcatta ttttggggtt cgtggtgcgg acagggaact tatcgcaggc gacatccgtt 420ttgagtagta ggtatcttgg ataagaagtt acccacatcc ttgaaagtcg agacacagga 480ggtcatcgga agatatgttc aattccgaca ccaccgcgaa tctccaagct aaaagtcgag 540atcgtgcagg atctaaagca aagcgcagca ggccaagttt tgattcagta gcgcgggatg 600ttttggatgt tcgaacaaaa acagcacaag ttaaaaacaa ggctaaagag ttttcctctg 660ttgatcacct ttcagcagac gccgcagcca tgtttgtaga caatgaactg tcccgtggcg 720ccatgcatcg cgccaggctg cacattgtgc actgcgctga atgtagggaa gagattaacc 780gtcagcagga aaccgtcgat tatctccgct cagagtgcaa aaacgaagaa gtgtccgccc 840caatggacct caaagcacgg cttgccagcc tcgccactga gtgcatgcct ggccctggcg 900cagagaattt agcaatgcag cgcccagagt cttttgtggc taaagttgag tccgtagtgc 960gcgcagttcg taagaaccaa ggccgctaat ttttaatcct tatttacatt ttctgtgaca1020ttctctgaaa gaccggtctg atgttttcta gcgtgggttg gggagagatc ttcctcttag1080tcgttgtggg ccttgttgtc atcggcccgg aacggttgcc tcgtttgatc caggacgcac1140gcgctgcgct gctcgctgca cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg1200attttggttc ggaatttgat gaaatccgaa agccactaac ccaggttgca cagtacagcc1260ggatgagccc caagacggcc atcactaagg cgttgtttga taatgattcc tcgttcctgg1320atgactttga tccaaagaag atcatggccg aaggaacaga aggcgaagct cagcgccaca1380agcaggcagc tgacaacaat gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac1440gcccaacgca aaacgatcca aaagacggcc cgaattactc aggcggcgtc tcttggaccg1500atattattta gcttttattt aacgccaagc ccaagcgttt tacccaccag cgataccttg1560cggtgggcta ggtgttcagc gatctcattg atcgctgcag cggttgggga gtgtggttca1620gaaatcgcaa taggatttcc cacatcgcca ccgatacgca ggttcggatc caatggaaca1680gatccgatga ccttgacctc ttcacctgtc 1710<210>42<211>41<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物<400>42gtctcttccc ccgcgccatt gtcggcctgg gcggagcctg c 41<210>43<211>19<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物
<400>43gacaatggcg cgggggaag 19<210>44<211>28<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物<400>44cgctcacatc acggccagcc ctgcttta 28<210>45<211>39<212>DNA<213>人工的<220>
<223>引物<400>45cttcccccgc gccattgtcc gcagtcgcac gtcgcggcg 39<210>46<211>117<212>PRT<213>谷氨酸棒杆菌<220>
<221>MISC_FEATURE<223>tatA氨基酸序列<400>46Met Pro Thr Leu Gly Pro Trp Glu Ile Ala Ile Ile Val Leu Leu Ile1 5 10 15Ile Leu Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile20 25 30Gly Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys35 40 45Asp Gly Asp Thr Pro Glu Gln Gln Gln Gln Gln Pro Gln Gln Gln Gln50 55 60Gln Ile Ala Pro Asn Gln Ile Glu Ala Pro Gln Pro Val Gln Gln Pro65 70 75 80Ala Gln Gln Ser Asn Phe Glu Gln His Tyr Gln Gly Gln Gln Val Gln85 90 95Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln Asn Tyr Glu Asp100 105 110Pro Asn Arg Thr Ser115<210>47<211>157<212>PRT<213>谷氨酸棒杆菌<220>
<221>MISC_FEATURE<223>tatB氨基酸序列<400>47
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val1 5 10 15Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp20 25 30Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys35 40 45Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys50 55 60Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala65 70 75 80Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe85 90 95Aso Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg100 105 110His Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala115 120 125Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro130 135 140Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile Leu145 150 155<210>48<211>225<212>DNA<213>谷氨酸棒杆菌<220>
<221>misc_feature<223>tatE基因序列<400>48atgacgcctg caggtccagc acaattactc attgttgctc ttgtagtaat tgtcctcttt 60ggttctaata agttgcctga tgttgctcgg tccgttggcc gttcgatgcg cattttcaaa 120tctgagatca aagagatgaa caaggatcag atcgaaagct ccgatcagac cttgaagaac 180taaggttcct cgcatctaaa aaaaccgcct gccttctctg tttag 225<210>49<211>60<212>PRT<213>谷氨酸棒杆菌<220>
<221>MISC_FEATURE<223>tatE氨基酸序列<400>49Met Thr Pro Ala Gly Pro Ala Gln Leu Leu Ile Val Ala Leu Val Val1 5 10 15Ile Val Leu Phe Gly Ser Asn Lys Leu Pro Asp Val Ala Arg Ser Val20 25 30Gly Arg Ser Met Arg Ile Phe Lys Ser Glu Ile Lys Glu Met Asn Lys35 40 45Asp Gln Ile Glu Ser Ser Asp Gln Thr Leu Lys Asn50 55 60
<210>50<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物,对于FGPK<400>50cttggggccg aagcccttga cttctttggt cag 33<210>51<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物,对于FGPK<400>51ttcggcccca agttggcgtc cgtcattcca gat 33<210>52<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于FGPF<400>52gaaggggccg aagcccttga cttctttggt cag 33<210>53<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于FGPF<400>53ttcggcccct tcttggcgtc cgtcattcca gat 33<210>54<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于FAPF<400>54gaagggcgcg aagcccttga cttctttggt cag 33<210>55<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸, 引物对于FAPF<400>55ttcgcgccct tcttggcgtc cgtcattcca gat 33<210>56<211>33<212>DNA<213>人工的
<220>
<223>合成的寡核苷酸,引物对于FAPY<400>56gtagggcgcg aagcccttga cttctttggt cag 33<210>57<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于FAPY<400>57ttcgcgccct acttggcgtc cgtcattcca gat 33<210>58<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AHAY<400>58gtacgcgtgc gcgcccttga cttctttggt cag 33<210>59<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AHAY<400>59gcgcacgcgt acttggcgtc cgtcattcca gat 33<210>60<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AHAL<400>60caacgcgtgc gcgcccttga cttctttggt cag 33<210>61<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AHAL<400>61gcgcacgcgt tgttggcgtc cgtcattcca gat 33<210>62<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPF<400>62gaagggcgcc gcgcccttga cttctttggt cag 33
<210>63<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPF<400>63gcggcgccct tcttggcgtc cgtcattcca gat 33<210>64<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPY<400>64gtagggcgcc gcgcccttga cttctttggt cag 33<210>65<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPY<400>65gcggcgccct acttggcgtc cgtcattcca gat 33<210>66<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPM<400>66catgggcgcc gcgcccttga cttctttggt cag 33<210>67<211>33<212>DNA<213>人工的<220>
<223>合成的寡核苷酸,引物对于AAPM<400>67gcggcgccca tgttggcgtc cgtcattcca gat 3权利要求
1.生产异源蛋白质的方法,其包括培养携带表达基因构建体的棒状杆菌型细菌并通过所述棒状杆菌型细菌生产并分泌异源蛋白质,所述表达遗传构建体在5′-端到3′-端方向上含有在棒状杆菌型细菌中起作用的启动子序列、编码Tat系统依赖性信号肽区域的核酸序列和编码异源蛋白质的核酸序列。
2.根据权利要求1的方法,其中所述信号肽含有SEQ ID NO.31或32所示的序列。
3.根据权利要求1的方法,其中所述信号肽含有SEQ ID NO.28到30中任一个所示的序列。
4.根据权利要求1的方法,其中所述信号肽是异麦芽糖葡聚糖酶的信号肽。
5.根据权利要求4的方法,其中所述异麦芽糖葡聚糖酶的信号肽是含有SEQ ID NO.6所示氨基酸序列的肽。
6.根据权利要求1的方法,其中所述信号肽是三甲胺-N-氧化物还原酶的信号肽。
7.根据权利要求6的方法,其中所述三甲胺-N-氧化物还原酶的信号肽是含有SEQ ID NO.8所示氨基酸序列的肽。
8.根据权利要求1到7中任一项的方法,其中所示异源蛋白质是蛋白-谷氨酰胺酶。
9.根据权利要求1到7中任一项的方法,其中所述异源蛋白质是异麦芽糖葡聚糖酶。
10.根据权利要求1到9中任一项的方法,其中所示棒状杆菌型细菌是在其中扩增了编码tat系统分泌元件的一个或多个基因的菌株。
11.根据权利要求10的方法,其中所述编码tat系统分泌元件的基因选自由tatA、tatB、tatC和tatE组成的组。
全文摘要
本发明提供了通过使用棒状杆菌型细菌有效地生产工业上有用的蛋白质的方法,更具体的,提供了有效地生产通过常规的蛋白质分泌途径难以分泌的蛋白质的方法。更具体来说,本发明提供了有效地生产蛋白质的方法,其包括培养含有表达基因构建体的棒状杆菌型细菌,然后使所述棒状杆菌型细菌产生并分泌外源蛋白质,所述表达基因构建体在5′-端到3′-端方向上携带在棒状杆菌型细菌中起作用的启动子序列、编码Tat系统依赖性信号肽区域的核酸序列和编码外源蛋白质的核酸序列。
文档编号C12N15/74GK1973046SQ200580020379
公开日2007年5月30日 申请日期2005年4月20日 优先权日2004年4月20日
发明者伊达雅代, 菊池庆实, 板屋宽, 中村奈巳 申请人:味之素株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1