来自谷氨酸棒杆菌的丙酮酸羧化酶的制作方法

文档序号:453063阅读:557来源:国知局
专利名称:来自谷氨酸棒杆菌的丙酮酸羧化酶的制作方法
技术领域
本发明中的政府权利声明本发明研发过程的部分工作使用了美国政府基金。美国政府对本发明具有部分权利。
背景技术
发明领域本发明涉及到一种谷氨酸棒杆菌(Corynebacteriumglutamicum)丙酮酸羧化酶蛋白和编码这种蛋白质的多核苷酸。
背景技术
丙酮酸羧化酶是一种重要的添补酶,它在生长,或者工业发酵生产脯氨酸或者谷氨酸的过程中,补充因生物合成所消耗掉的草酰乙酸。
丙酮酸羧化酶所催化的两步反应的机制如下(2)在反应(1)中,依赖于ATP的生物素羧化酶结构域羧化生物素辅基,该生物素辅基连接在生物素-羧基-载体蛋白(BCCP)结构域的一个特定的赖氨酸残基上。乙酰基-辅酶A通过提高依赖于碳酸氢盐的ATP裂解的速率来激活反应(1)。在反应(2)中,BCCP结构域在被转羧基酶结构域催化的反应中,提供CO2给丙酮酸(Actwood,P.,V.,Int..J.Biochem.Cell.Biol.27231-249(1995))。
丙酮羧化酶基因已经被从下列中克隆和测序Rhizobium etli(Dunn,M..F.等,J.Bateriol,1785960-5970(1996)),嗜热脂肪杆菌(Bacillus Stearothermophilus)(Kondo,H.,等,Gene19147-50(1997),枯草杆菌(Genbank登记号Z97025),结核分枝杆菌(Mycobaterium tuberculosis)(Genbank登记号Z83018),和嗜热碱甲烷杆菌(Methanbacterium thermoautrophicum)(Mukhopadhyay,B,J.Biol.Chem.2735155-5166(1998))。以前在乳发酵短杆菌(Brevibacterium lactofermentum)(Tasaka,0,等,Agric.Biol.Chem.431513-1519(1979))和谷氨酸棒杆菌(Corynebacterium glutamicum)中测定了丙酮酸羧化酶活性(Peters-Wendisch,P.G.,等,Microbiology1431095-1103(1997))。
先前的研究显示,天冬氨酸家族氨基酸的生产力和产量决定性地依赖于通过添补途径的碳流(Vallino,J.J,和Stephanopoulos,G.Biotechnol.Bioeng.41633-646(1993))。基于代谢平衡,可以显示出赖氨酸产生的速率,小于或者等于通过添补途径草酰乙酸合成的速率。
发明概述本发明提供了一种分离的核酸分子,该核酸分子含有编码一种丙酮酸羧化酶多肽的多核苷酸,该多肽有如

图1所示(SEQ ID NO2)的氨基酸序列,或者ATCC保藏号_的细菌宿主保藏的粘粒所编码的氨基酸序列。通过测序保藏的丙酮酸羧化酶粘粒克隆确定的核苷酸序列,如图1(SEQ ID NO1)所示,含有编码一个1140个氨基酸残基的多肽的可读框,该多肽的推定的分子量为大约1234kDa。预测的丙酮酸羧化酶蛋白质的1140个氨基酸的序列如图1和(SEQ ID NO2)所示。
因此,本发明的一方面提供了分离的核酸分子,该核酸分子包括一种多核苷酸,具有选自如下的核苷酸序列(a)一种编码丙酮酸羧化酶多肽的核苷酸序列,该丙酮酸羧化酶多肽具有SEQ ID NO2中的完整的氨基酸序列;(b)一种编码丙酮酸羧化酶多肽的核苷酸序列,该丙酮酸羧化酶多肽具有ATCC保藏号_中的粘粒克隆所编码的完整的氨基酸序列;以及(c)与上述的(a)或者(b)中的核苷酸序列任何一种互补的核苷酸序列。
本发明更进一步的实施方案包括分离的核酸分子,这些分子包含的多核苷酸与上述(a)、(b)或者(c)中的任意多核苷酸序列具有至少90%,和更优选至少95%、97%、98%或者99%的同一性,或者这些分子包含一种多核苷酸,它们在严谨杂交条件下能够和具有的核苷酸序列与上述的(a)、(b)或者(c)中的核苷酸序列具有同一性的多核苷酸杂交。这些杂交的多核苷酸在严谨杂件交条件下不与具有仅由A残基或仅由T残基组成的核苷酸序列的多核苷酸杂交。
发明还涉及到含有本发明分离的核酸分子的重组载体,含有这些重组载体的宿主细胞,以及通过重组技术制备这些载体和宿主细胞的方法和使用它们生产丙酮酸羧化酶多肽或者肽的方法。
本发明还提供分离的丙酮酸羧化酶多肽,该丙酮酸羧化酶多肽具有的氨基酸序列选自(a)具有图1所示(SEQ ID NO2)氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;以及(b)具有完整的,由ATCC保藏号_中包含的粘粒克隆所编码的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列。本发明的多肽还包括所具有的氨基酸序列与上面所述(a)或者(b)中的氨基酸序列有至少90%相似性的,更优选95%相似性的多肽,以及所具有的氨基酸序列与上面所述的有至少70%同一性,更优选90%同一性,更优选95%,97%、98%和99%同一性的多肽。
附图的简要说明图1显示了通过测序包含在ATCC保藏号_中的DNA克隆所确定的完整的丙酮酸羧化酶蛋白的核苷酸序列(SEQ ID NO1)和推定的氨基酸序列(SEQ ID NO2)。蛋白质序列具有大约1140个氨基酸残基,推定的分子量为大约123.6kDa。
发明的详述本发明提供了分离的核酸分子,包括通过对克隆的粘粒进行测序得到的编码具有如图1(SEQ ID NO2)所示的氨基酸序列的丙酮酸羧化酶蛋白的多核苷酸。本发明的丙酮酸羧化酶蛋白与结核分枝杆菌(Mycobaterium tuberculosis)的和人的丙酮酸羧化酶蛋白共享序列同源性。通过对编码一种丙酮酸羧化酶多肽的粘粒III F10进行测序所获得的核苷酸序列如图1(SEQ ID NO1)所示,该粘粒保藏在美国典型培养物保藏中心(ATCC),10801University Blvd,Manassas,VA20110-2200,所给予的登记号为_。
核酸分子除非另外说明,本文所有的核苷酸序列都是使用自动DNA测序仪(例如ABI Prism377)进行DNA分子测序而得到的,本文所有由测定的DNA分子所编码多肽的氨基酸序列都是由上面测定的DNA序列翻译预测而得的。因此,如本领域中所知的,通过这种自动设备测定的任何DNA序列,本文测定的任何核苷酸序列都可能含有一些错误。自动测序获得的核苷酸序列和要测序的DNA分子的真实序列典型地有至少大约90%,更典型地有至少大约95%至至少大约99.9%的同一性。真实的核苷酸序列可以通过其它方法,包括本领域中众所周知的人工DNA测序法更精确地测定。如本领域中所知的,较之于实际序列,在测定的核苷酸序列中单个的插入或者缺失,会导致核苷酸序列翻译时移码,从而使预测的由测定的核苷酸序列编码的氨基酸序列,从这个插入或者缺失位点开始会完全不同于测序的DNA分子真正编码的氨基酸序列。
除非另外说明,本文所提到的“核苷酸序列”代表一个脱氧核糖核苷酸(缩写为A、G、C、和T)的序列。然而,核酸分子或者多核苷酸的“核苷酸序列”指,DNA分子或多核苷酸,脱氧核糖核苷酸的序列,以及RNA分子,或者多核苷酸,其中特定的脱氧核苷酸序列中的每个胸腺嘧啶脱氧核苷酸(T)都被尿嘧啶核糖核苷酸(U)所替代的对应的核糖核苷酸(A、G、C和U)的序列。例如,参照具有使用脱氧核糖核苷酸缩写表示出的SEQ ID NO1序列的RNA分子,指的是一种RNA分子,在它的序列中SEQ ID NO1的每个脱氧核苷酸A、G或C被相应的核糖核苷酸A、G或C替代,而每个脱氧核苷酸T被核糖核苷酸U替代。
使用本文所提供的资料,例如图1中的核苷酸序列,通过应用常规的克隆和筛选方法,例如使用mRNA作为起始材料克隆DNA的方法,可以获得本发明的编码丙酮酸羧化酶多肽的核酸分子。图1所示的丙酮酸羧化酶蛋白(SEQ ID NO2)和结核分枝杆菌(Mycobateriumtuberculosis)具有63%的同一性,和人具有44%的同一性。根据如上讨论的可能的测序错误,以及不同的已知蛋白中前导序列裂解位点的变化,普通技术人员会理解保藏的粘粒编码的真实的丙酮酸羧化酶多肽包含大约1140个氨基酸,但是可以是1133-1147个氨基酸的范围内的任意值。
如上所示的,本发明的核酸分子可以是以RNA的形式,例如mRNA,或者以DNA的形式,包括例如通过克隆或者合成得到的cDNA和基因组DNA。DNA可以是双链的或者单链的。单链DNA或者RNA可以是编码链,也被称为正义链,或者也可以是非编码链,也被称为反义链。
术语“分离”的核酸分子,指的是一种核酸分子,DNA或者RNA,被从它的天然环境中分离出来。例如,为本发明的目的分离的包含在载体中的重组DNA分子。分离的DNA分子的更多的例子包括维持在异源宿生组胞中的重组DNA分子,和在溶液中的部分或基本纯化的DNA分子。分离的RNA分子包括本发明的DNA分子在体内或者体外的RNA转录体。本发明的分离的核酸分子还包括通过合成产生的这些分子。
本发明中分离的核酸分子包括DNA分子,它们含有从图1所示核苷酸序列(SEQ ID1)的199-201位作为起始密码的可读框;DNA分子,它们含有图1(SEQ ID NO2)所示的丙酮酶酸羧化酶蛋白的编码序列;以及DNA分子,它们含有的序列基本上不同于上面所提到的那些,可是根据遗传密码的简并性,他们同样编码丙酮酸羧化酶蛋白。当然,遗传密码是为本领域众所周知的。因此,产生上述的简并变异体对本领域的技术人员来说是常规技术。
另一方面,本发明提供了分离的核酸分子,该核酸分子所编码的丙酮酸羧化酶多肽具有保藏在ATCC登记号_中的粘粒克隆所编码的氨基酸序列。优选地,该核酸分子编码上述保藏的克隆所编码的多肽。本发明还提供了分离的核酸分子,该核酸分子具有如1(SEQ ID NO1)所示的核酸序列,或者具有上述保藏克隆含有的丙酮酸羧化酶DNA的核苷酸序列,或者该核酸分子具有的序列与上述序列的任何一种互补。
另一方面,本发明提供了一种分离的核酸分子,包括能够在严谨杂交条件下与上述本发明的核酸分子的一部分多核苷酸,例如保藏在ATCC登记号_中的粘粒克隆的一部分多核苷酸进行杂交的多核苷酸。“严谨杂交条件”指的是42℃,在溶液中温育过夜,溶液中含有50%甲酰胺,5×SSC(150mM NaCl,15mM的柠檬酸三钠),50mM的磷酸钠(PH7.6),5×的Denhardt溶液,10%的硫酸葡聚糖,和20mg/ml的变性的,切碎的鲑鱼精DNA;然后用0.1×SSC在大约65℃清洗滤膜。可与一种多核苷酸的“一部分”杂交的多核苷酸,指的是一种多核苷酸(DNA或者RNA)能够和参照多核苷酸的至少大约15个核苷酸(nt)杂交,更优选至少大约20个nt,更优选至少大约30个nt,以及更优选至少大约30-70nt。这些可用作诊断探针和引物。
当然,依照本发明,可与参照多核苷酸(如保藏的粘粒克隆)的较大部分,例如长度为50-750nt的一段,甚至可与参照多核苷酸的全长杂交的多核苷酸,也可以用作探针,同样,对应于保藏的DNA或者图1所示的核苷酸序列(SEQ ID NO1)的大部分,如果不是全部的话,的多核苷酸也可以。例如,“至少长度为20nt”的一部分多核苷酸,指的是一段来自参照多核苷酸核苷酸序列(例如保藏的DNA,或者如图1(SEQ ID NO1)所示的核苷酸序列)的20个或者更多的邻接的核苷酸。如上所述,根据传统的DNA杂交技术,这些部分可在诊断上用作探针,或者作为引物用于通过聚合酶链式反应技术(PCR)扩增靶序列,参见如Sambrook,J.,Fricsch,E.F和Maniatis,T.,(1989)编《分子克隆实验手册》第二版,冷泉港出版社,其完整的公开内容在本文引入作为参考。
既然已经保藏了丙酮酸羧化酶粘粒克隆,它的已经测定的核苷酸序列显示在图1(SEQ ID NO1),那么产生与丙酮酸羧化酶DNA分子的一部分进行杂交的多核苷酸,对于本领域的技术人员来说就属于常规技术了。例如,通过限制内切酸裂解或者超声波切碎丙酮酸羧化酶粘粒克隆,就可以很容易得到不同大小的DNA部分,其是可以与丙酮酸羧化酶DNA分子的部分进行杂交的多核苷酸。可以供选择地,本发明的杂交的多核苷酸,可以根据已知技术通过合成的方法获得。
如上面所述的,编码丙酮酸羧化酶蛋白的多肽的本发明的核酸分子,可以包括,但是不限于编码该多肽氨基酸序列的那些自身;该多肽和附加序列的编码序列,例如,前-,原-或者前原-蛋白序列;带有或不带有上述附加编码序列的多肽的编码序列,其带有附加的非编码序列,包括例如,但不限于内含子和非编码5’和3’序列,例如在转录,mRNA加工中起重要作用的转录的,非翻译的序列,mRNA加工包括剪接和聚腺苷酸化信号,例如-核糖体接合和mRNA的稳定性;附加编码序列,其编码附加氨基酸,例如这些提供附加官能度的氨基酸。因此,编码多肽的序列可被融合于一个标记序列,例如编码便于纯化融合蛋白的多肽的序列。在本发明的一个特定的实施方案中,标记的氨基酸序列为六-组氨酸肽,例如pQE(Qiangen,Inc)载体中提供的标记物,其它的一些有很多是商业上可获得的。如Gentz等,Proc.Natl.Acad.Sci,USA86821-824(1989)所叙述的,例如,六-组氨酸提供了这种融合蛋白方便的纯化方法。“HA”标记是另一种用于纯化的肽,它与来自流感病毒血凝素蛋白的一种抗原决定簇对应,已被Wilson等,CELL,37767(1984)所述。
本发明还涉及到本发明的核酸分子的变异体,它们编码丙酮酸羧化酶蛋白的部分,类似物或者衍生物。变异体可以是天然存在的,例如天然的等位变异体。等位变异体指的是占据一种生物体中染色体给定位点的基因的几种替代形式中的一种。GenesII,Lewin,编。非天然存在的变异体可以通过方法上已知的诱变技术获得。
这些变异体包括由核苷酸替换,缺失或者添加所得到的那些。这些替换,缺失或者添加可以涉及一个或者更多个核苷酸。变异体可以是在编码区或者非编码区,或者二者同时改变。编码区的变化可以产生保守的或者非保守的氨基酸替换,缺失或者添加。其中特别优选的是沉默替换,缺乏或者添加,其不会改变丙酮酸羧化酶蛋白或者它的部分的特征和活性。这方面同样特别优选的是保守替换。最优选的是编码具有如图1所示的氨基酸序列(SEQ ID NO2)的丙酮酸羧化酶蛋白的核酸分子。
此外,优选是丙酮酸羧化酶的优选表达比谷氨酸棒杆菌中高2到20倍的突变体或者变异体,以及反馈抑制突变体。
本发明更进一步的实施方案包括分离的核酸分子,包括一种多核苷酸,其具有与下面的序列有至少90%的同一性,更优选有至少95%,97%,98%或者99%的同一性的核苷酸序列(a)一种核苷酸序列,它所编码的丙酮酸羧化酶多肽具有完整的SEQ ID NO2的氨基酸序列;(b)一种核苷酸序列,它所编码的丙酮酸羧化酶多肽具有包含于ATCC保藏号_中的粘粒克隆编码的完整的氨基酸序列;或者(c)与上面的(a)或者(b)中的核苷酸任何一种互补的核苷酸序列。
一种具有与编码丙酮酸羧化酶多肽的参照核苷酸序列有至少例如95%的“同一性”的核苷酸序列的多核苷酸指的是,除了该多核苷酸序列每100个编码丙酮酸羧化酶多肽的参照核苷酸序列的核苷酸中有最多为5个的点突变外,该多核苷酸序列的核苷酸序列与参照序列是一致的。换句话说,为得到具有与参照核苷酸序列有至少95%核苷酸序列同一性的多核苷酸,参照序列中的高至5%的核苷酸可以删除或者用另外的核苷酸替换,或者至多占参照序列总核苷酸5%的数目的核酸可以插入到参照序列中。这些参照序列的突变可以发生在参照核苷酸序列的5’或者3’端的位置,或者散布在这些末端位置之间的任意位置,或者单个地存在于参照序列的核苷酸间,或者以一个或更多个邻接的组群存在于参照序列中。
特别地,可以使用已知的计算机程序,例如Bestfit程序(Wisconsin序列分析软件包,UUNIX用8版,遗传学计算机小组,University Research Park,575Science Drive,Madison WI53711),方便地测定是否特定的核酸分子与图1所示的核苷酸序列或者保藏的粘粒克隆的核苷酸序列有例如至少90%,95%,97%,98%或者99%的同一性。Bestfit程序使用Smith和Waternan运算法(Advaces inApplied Mathematics2482 489(1981))来寻找两个序列之间的最合适的同源性片段。根据本发明,当使用Bestfit或者任何其它的序列比较程序来确定是否特定的序列与本发明的参照序列有例如95%的同一性时,当然,参数的设置使得同一性的百分比是相对于全长参照序列来计算的且与参照序列核苷酸总数至多5%的同源性缺口是允许的。
本申请指定的核酸分子与图1所示的核酸序列(SEQ ID NO1)或者保藏的DNA的核酸序列有至少90%,95%,97%、98%或者99%的同一性,而不论它们是否编码具有丙酮酸羧化酶活性的多肽。这是因为甚至当特定的核酸分子不编码具有丙酮酸羧化酶活性的多肽时,本领域中的技术人员仍然知道如何利用这些核酸分子,例如,用作杂交探针,或者聚合酶链式反应的引物。
然而,优选的是,核酸分子与图1所示的核酸序列(SEQ ID NO1)或者保藏的DNA的核酸序列有至少90%、95%、97%、98%或者99%的同一性,它们实际上的确编码具有丙酮酸羧化酶蛋白活性的多肽。“具有丙酮酸羧化酶活性的多肽”指的是多肽具有的活性,通过特定的生物学方法测定,与本发明的丙酮酸羧化酶蛋白相似,但是不是必须一致的。
当然,根据遗传密码的简并性,本领域普通的技术人员可以立即识别与保藏的DNA的核酸序列或者图1所示的核酸序列(SEQ ID NO1)具有至少90%、95%、97%、98%或者99%同一性的大量核酸分子会编码具有丙酮酸羧化酶蛋白活性多肽。实际上,既然这些核酸序列简并变异体都编码相同的多肽,甚至不用上述的比较方法,技术人员也可以明白这一点。本领域中还进一步认识到甚至于对那些不是简并变异体的核酸分子来说,合适量的这种分子也可以编码具有丙酮酸羧化酶蛋白活性的多肽。这是因为技术人员充分认识到很少会或者不会显著影响蛋白质的功能的氨基酸替代(例如,第二种脂族氨基酸替换一种脂族氨基酸)。
例如,Bowie.J.U,等“Deciphering the Message in ProteinSequencesTolerance to Amino Acid Substtutions,”Science,2471306-1310(1990),一文中给出了如何产生表型沉默氨基酸替换的指导,其中作者指出了两种主要的研究氨基酸序列改变的耐性的方法。第一种方法依赖于进化过程,其中的突变被自然选择所接受或者抛弃。第二种方法使用遗传工程将氨基酸变化导入克隆基因的特定位点上,并通过选择和筛选来鉴定保持功能的序列。如作者所述,这些研究显示出蛋白质对于氨基酸替换有惊人的忍耐性。作者还指出在一定位点的氨基酸变化是更有可能被接受的。例如,大多数埋入的氨基酸残基要求非极性侧链,而表面侧链通常只有很少特征是保守的。Bowie.J.U,等在上文中叙述了其它的这种表型沉默替换,上面列出了参考文献。
载体和宿主细胞本发明还涉及到载体,其包括本发明的分离的DNA分子,用重组载体进行了遗传改造的宿主细胞,以及通过重组技术生产丙酮酸羧化酶多肽或其部分。
可以使用众所周知的技术,例如,感染,转导,转染,转位,结合,电穿孔和转化将重组结构导入宿主细胞。载体可以是,例如,噬菌体,质粒,病毒或者反转录病毒。
多核苷酸可以连接带有可筛选标记的载体,以在宿主细胞中增殖。通常地将质粒载体导入沉淀,例如磷酸钙沉淀,或者带电的脂质复合体。如果载体是病毒,可以使用合适的包装细胞系在体外进行包装,然后转导到宿主细胞中。
优选载体含有对目的多核苷酸的顺式作用调控区。合适的反式作用因子可以由宿主,载体或者基于导入宿主的载体自身提供。
在这部分特定的优选实施方案中,载体提供了专一性的表达,表达可以是受到诱异的,或细胞类型专一性的。在这些载体中特别优选的是易于操作的被环境因子诱导的那些载体,例如受温度和营养添加物诱导的载体。
本发明中使用的表达载体包括染色体-,游离型-和病毒-来源的载体,例如来自细菌质粒,噬菌体,酵母附加体,酵母染色体因子,病毒,例如杆状病毒,乳多空病毒,痘苗病毒,腺病毒,禽痘病毒,假狂犬病毒,和反转录病毒的载体,和由它们组合而衍生的载体,例如粘粒和噬菌粒。
DNA插入片段应该有效地连在合适的启动子上,例如菌体λPL启动子,大肠杆菌Lac,trp和tae启动子,SV40早期和晚期启动了和反转录病毒LTPs启动子,此处列出了一些。其它的合适的启动子为本领域的技术人员所知。表达构建体还包括转录起始点,终止位点和在被转录区的翻译所需的核糖结合位点。由此构建体所表达的成熟转录体的编码部分包括在要翻译多肽开始部位的翻译起始密码子(AUG或者GUG)和适当地位于要翻译多肽末端合适部位的终止密码子。
如已说明的,表达载体优选包括至少一个选择性标记。这些标记包括真核细胞培养所需的二氢叶酸还原酸酶或者新霉素抗性,以及大肠杆菌和其它细菌培养所需的四环素,青霉素,氯霉素和卡那霉素抗性基因。合适的宿主细胞的代表性例子包括细菌细胞,例如大肠杆菌,谷氨酸棒状杆菌(C.glutamicum),链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)等的细胞;真菌细胞,例如酵母细胞。上述宿主细胞的合适的培养基和培养条件为本领域已知。
细菌中使用的优选的载体包括从Qiagen公司获得的pA2,pQE70和pQE60和pQE-9;从Stratagene公司获得的pBS载体,Phagescript载体,Bluescript载体,pNH8A,pNH16a,pNH18A,pNH46A,从Pharmacia公司获得的ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5。优选的真核载体包括从Stratagene公司获得的pWLNEO,pSV2CAT,pOG44,pXT1和pSG;可从Pharmalia公司获得的pSVK3,pBPV,pMSG和pSVL。其它合适的载体也为技术人员所知。
本发明使用的合适的细菌启动子包括大肠杆菌lacI和lacZ启动子,T3和T7启动子,gpt启动子和λPR和PL启动子和trp启动子。合适的真核启动了包括CMV立即早期启动子,HSV胸苷激酶启动子,早期和晚期SV40启动子,反转录病毒LTRs启动子,例如Rous肉瘤病毒(RSV)的那些,和金属硫蛋白启动子,比如鼠金属硫蛋白-I启动子。
使用磷酸钙转染法,DEAE-葡萄糖介导的转染法,阳离子脂质介导的转染法,电穿孔,转导,感染或者其它方法,可以有效地将重组结构转化到宿主细胞中。例如在许多标准实验手册中途述的方法,如Davis等,分子生物学基本方法”(1986)。
在高等真核生物中,通过向载体中插入增强子序列可以提高编码本发明多肽的DNA的转录。增强子是DNA的顺式作用元件,通常大约10至300bp,它在一定的宿主细胞类型中提高启动子的转录活性。增强子的例子包括SV40增强子,它位于复制起始点晚侧100至270bp处,巨细胞病毒早期启动子增强子,在复制起始位点的晚期侧的多瘤病毒增强子,和腺病毒病毒增强子。
为了使转录的蛋白质分泌入内质网的腔中,周质空间或者细胞外环境中,可以将合适的分泌信号引入到表达的多肽上。这些信号对于多肽来说可以是内源的或者它们也可以是外源信号。
多肽可以以修饰的形式表达,例如融合蛋白,可以不但包括分泌信号,而且有附加的异源功能区。因此,例如,可以将附加的氨基酸区,特别是带电的氨基酸加到多肽的N-端,以提高在纯化过程中,或者在后面的操作和贮存过程中多肽的稳定性和持久性。而且,可以将肽部分加到多肽上以便于纯化。
丙酮酸羧化酶蛋白可以通过众所周知的方法从重组细胞培养物中回收和纯化,包括硫酸铵和乙醇沉淀,酸抽提,阴离子或者阳离子交换层析,磷酸纤维素层析,亲和层析,疏水相互作用层析,羟基磷灰石层析和凝集素层析。最优选地,使用高效液相层析(HPLC)进行纯化。
本发明的多肽包括天然纯化的产物,化学合成获得的产物,和利用重组技术在原核和真核宿主,包括例如细菌,酵母,高等植物,昆虫和哺乳动物细胞中产生的产物。依赖于重组生产过程中使用的宿主,本发明的多肽可以是糖基化的或者可以是非糖基化的,而且,在一些情况下作为宿主介导的过程的结果,本发明的多肽可以包括起始修饰的甲硫氨酸残基。
丙酮酸羧化酶多肽和肽本发明还提供了一种分离的丙酮酸羧化酶多肽,其有保藏的DNA所编码的氨基酸序列,或者图1所示的氨基酸序列(SEQ ID NL2),或者是含有上面多肽一部分的肽或多肽。名词“肽”和“寡肽”是同义的(如通称所认识的),两个名词可交换使用,作为一个概念,表示至少两个氨基酸由肽键连结而成的链。名词“多肽”此处用于表示由多于10个氨基酸残基构成的链。此处所有的寡肽和多肽的式和序列都是从左向右书写,在方向上是从氨基端到羧基端。
本领域可以认识到丙酮酸羧化酶多肽的一些氨基酸序列可以变化,而对于蛋白的结构和功能没有明显的影响。如果考虑这种序列的变化,应该记住蛋白质上存在决定活性的关键区域。通常,如果使用表现出相似的功能的酸残基,是可能替换形成三级结构的氨基酸残基的。在其它的例子中,如果变化处于蛋白质的非关键区域,则残基的类型可以是完全不重要的。
因此,本发明还提供了丙酮酸羧化酶多肽的变异体,它们显示出丙酮酸化酶的基本活性,或者它们包括丙酮酸化酶蛋白的一些区域,例如如下所讨论的区域。这些突变包括缺失,插入,倒置,重复和类型替换(例如,用一个亲水残基替换另一个,但是作为一个规则,不用强亲水性的替换强疏水性的)。小的变化或者这些“中性”氨基酸的替换通常对活性只有很小的影响。
通常所见到的保守替换是,脂族氨基酸Ala,val,leu和Ile中的一个替换另一个;带羟基残基Ser和Thr的相互替换,酸性残基Asp和Glu的交换,酰胺残基Asn和Gln的取代,碱性残基Lys和Arg的交换和芳族氨基酸Phe和Tyr的替换。
如上面所详述的,更多的关于氨基酸改变可能是表型沉默(即对于功能不可能具有明显的有害效果)的指导可以在例如,Bowie.J.U,等“Deciphering the Message in Protein SequencesTolerance toAmino Acid Substtutions,”Science,2471306--1310(1990),中找到。
本发明的多肽优选以分离的形式提供,且优选以基本纯化形式提供。如Smith和Johnson,Gene6731-40(1998)所叙述的,一种重组产生的丙酮酸羧化酶多肽,可以通过一步法得到基本上的纯化。
本发明的多肽包括保藏的DNA编码的多肽,SEQ ID NO2的多肽,以及与上述多肽有至少90%相似性,更优选有至少95%相似性,更优选有至少97%,98%或99%相似性的多肽。本发明更多的多肽包括与保藏DNA编码的多肽,SE ID NO2多肽有70%同一性,更优选有至少90%或者95%同一性,更优选至少97%、98%、或99%同一性的多肽,也包括有至少30个氨基酸,更优选至少50个氨基酸的这些多肽的一部分。
两种多肽%相似性”指的是,通过使用Bestfit程序(Wisconsin序列分析软件包,UNIX用8版,遗传学计算机小组,UniversityResearch Park,575Science Drive,Madison WI53711)和确定相似性的缺席设置对两种多肽的氨基酸序列进行比较而得到的一种相似性分数。Bestfit使用Smith和Waternan局部同源性运算法(Advaces inApplied Mathematics 2482-489(1981))来寻找两个序列之间的最好的相似性片段。
一种多肽具有的氨基酸序列与丙酮酸羧化酶多肽的氨基酸序列,有例如至少95%的“同一性”,指的是,除了每100个参照丙酮酸羧化酶多肽氨基酸序列的氨基酸中有最多为5个氨基酸的改变外,该多肽的氨基酸序列与参照序列是一致的。换句话说,为得到氨基酸序列与参照氨基酸序列有至少95%同一性的多肽,参照序列中的高至5%的氨基酸残基可以删除或者用其他的氨基酸替换,或者最多占参照序列总氨基酸残基数5%的氨基酸数可以插入到参照序列中。这些参照序列的改变可以发生参照氨基酸序列的氨基端或者羧基端的位置,或者散布在这些末端位置之间的任意位置—或者单个地存在于参照序列的残基中,或者以一个或更多个相邻接的组群存在于参照序列中。
特别地,可以使用已知的计算机程序,例如Bestfit程序(Wisconsin序列分析软件包,UNIX用8版,遗传学计算机小组,University Research Park,575Science Drive,Madison WI 53711),可以方便地测定是否特定的多肽与图1所示的氨基酸序列(SEQ IDNO2)或者保藏的粘粒克隆编码的氨基酸序列有至少90%,95%,97%,98%或者99%的同一性。根据本发明,当使用Bestfit或者任何其它的序列比较程序来确定是否特定的序列与本发明的参照序列有例如95%的同一性时,当然,参数的设置使得同一性的百分比是相对于全长参照氨基酸序列来计算的。与参照序列氨基酸残基总数高至5%的同源性空隙是允许的。
用于棒状杆菌(Corynebaterium)操作的遗传工具为制造出在棒状杆菌(Corynebaterium)中代谢工程所必需的遗传变化,研究者需要鉴定和克隆涉及到目的途径的基因。他们还需要一些方法来改变这些基因以影响他们编码的酶的调节或水平,然后将改变了的基因重新导入棒状杆菌(Corynebaterium)中,以检查它们对于氨基酸生物合成的效果。因此,代谢工程需要在其处理时能同时在棒状杆菌(Corynebaterium)和其它更易于操作的宿主中,比如大肠杆菌中进行复制的一批质粒。同时需要编码,例如,抗生素抗性的选择性标记,可以对变化的基因进行调节的良好表征的转录启动子,以及能将质粒插入目的棒状杆菌(Corynebaterium)株中的有效的转化和接合系统。
质粒已经分离和发展了几种不同的可以将基因导入并在棒状杆菌(Corynebaterium)中表达的质粒(Sonnen,H.等,Gene10769-74(1991))。这些大部分原始被鉴定为小的(3-5Kb),隐蔽性的质粒,来自谷氨酸棒状杆菌(C.glutamicum),美棒状杆菌(C.callunae),和乳发酵棒状杆菌(C.lactofermentum)。它们分为四个相容组群,分别以质粒pCC1,PBL1,PHM1519和pGA1为例子。通过将已知大肠杆菌质粒的元件(特别是来自pBR322或者pUC18的ColE1复制起始位点),以及抗生素抗性标记引入,可以这些隐蔽性质粘开发出能同时在棒状杆菌(Corynebaterium)和大肠杆菌中复制的质粒 穿梭载体。第5个对于棒状杆菌(Corynebaterium)的操作非常有用的质粒是基于pNG2构建的,最初分离自白喉棒状杆菌(Corynebaterium diptheriae)(Serwold-Davis,T.M等,Proc,Natl,Acad,Sci,USA,844964-4968(1987))的质粒。这个质粒和它的衍生物能在许多种的棒状杆菌(Corynebaterium)和大肠杆菌中有效地复制。既然pNG2(一个仅1.8kbp的元件)的单独的复制起始点能够同时在革兰氏阳性和革兰氏阴性宿主中起作用,那么不需要给它另外添加ColE1型的元件。因此,pNG2衍生物(如pEP2)比其它的棒状杆菌(Corynebaterium)穿梭载体小得多,因此更容易操作。
选择性标记几种赋予抗生素抗性的基因已被证明可用于在棒状杆菌(Corynebaterium)中的质粒筛选和其他的重组DNA工作。这些基因包括来自Tn903的卡那霉素抗性决定子,分离自吸湿链霉菌(Streptomyces bygroscopicus)的潮霉素抗性标记,来自淀粉链球菌(Streptococcus faecalis)的四环素抗性基因,来自Tn5的博来霉素抗性标记,来自Streptomyces acrimycini的氯霉素抗性标记。在许多大肠杆菌质粒,如P3R322中使用的β-内酰胺酶基因在棒状杆菌(Corynebaterium)中不赋予氨苄青霉素抗性。
转化系统 几种方法被设计用于将外源DNA导入棒状杆菌(Corynebaterium)中。最早的常规采用的方法是基于已在其它革兰氏阳性种中获得成功的方法,包括在DNA和聚乙二醇存在的情况下温育原生质球(Yoshihama,M等,J,Bacteriol,162591-597(1985))。虽然这种方法可以使用,但是它的效率通常是比较低的,常常用每毫克DNA只能获得少于105个转化体。棒状杆菌(Corynebaterium)原生质球的电穿孔被证明为一种更有效和更可靠的转化方法。原生质球的制备产生通常是将细胞培养在丰富培养基上,培养基含有甘氨酸和或低浓度的其他的细胞壁生物合成抑制剂的,比如异烟肼,氨苄青霉素,青霉素G,或者吐温-80。然后用含有甘油的低盐缓冲液清洗原生质球,在电穿孔前将原生质球与DNA混合。据报道,使用这种方法的转化效率可以高达每微克质粒DNA107个转化体。
第三种将DNA转入棒状杆菌(Corynebaterium)的方法涉及到转接合。这种方法利用携带RP4质粒衍生物的各种大肠杆菌菌株的混杂。在大肠杆菌中,RP4编码许多功能,这些功能介导质粒从宿主菌株向大肠杆菌的其他受体菌株,甚至其它种中接合转移。这些“tra功能”介导菌毛形成和质粒转移。RP4还带有转移起始区,Ori T,一个被转移设置识别的顺式作用元件,它使得质粒通过菌毛传导并进入受体菌株。从这一系统,Simon等(Bio/Technology 1784-791(1985)开发出一种有用的用于将质粒从大肠杆菌转移到棒状杆菌(Corynebaterium)的转接合工具。他们将从RP4来的tra功能重新定位到一株被命名为S17-1的大肠杆菌菌株的染色体中。带有RP4oriT的质粒,能被从S17-1高效地转入其它的受体。尽管此方法已被证明对于导入复制质粒到棒状杆菌是有用的,其被证明对产生基因破坏更为有用。此可以通过导入一个可选择性的标记到棒状杆菌基因的克隆中来完成,其中的基因是破坏的目标。此构建物然后被连接于携带RP4oriT但缺少来支持在棒状杆菌复制的起点的大肠杆菌质粒。携带此质粒的S17-1然后被与受体菌株温育,且混合物然后转入到选择性培养基上。因为被导入的质粒不能在棒状杆菌(Corynebaterium)中复制,表达选择性标记的转接合体非常有可能在基因组DNA内发生了交换重组。
限制性缺陷株尽管使用了这种转化系统,在文献中有很明显的先例就是棒状杆菌(Corynebaterium)能将大肠杆菌来源的DNA识别为外源DNA并通常降解它。这个功能是由棒状杆菌(Corynebaterium)的限制和修饰系统造成的。为克服这一系统的作用,一些转化和转接合方法要求在转化前对受体菌株进行简短地加热。热处理大概能失活负责限制性系统的酶,使导入的DNA在酶被周转之前变成确定的。另一个用来提高DNA转移效率的策略是分离棒状杆菌(Corynebaterium)突变体,其中的限制性系统是缺陷的。这些菌株以和已在棒状杆菌(Corynebaterium)中扩增的质粒几乎同样的效率引入在大肠杆菌扩增的质粒。在另一个用于克服棒状杆菌(Corynebaterium)中的限制性系统的策略中,Leblon和其同事发展了一种基因破坏的“整合子”系统(Reyes,O.等,GENE10761-68(1991))。整合子是与目的宿主DNA有相同的限制/修饰特性的DNA分子,它所携带的DNA与宿主基因组的一部分(即基因组要被破坏的一个区域)同源,不能在宿主细胞中复制。一个从棒状杆菌(Corynebaterium)中克隆的基因,首先在一个可以在棒状杆菌(Corynebaterium)菌株中复制的质粒中用选择性标记间断。这个构建体然后被从棒状杆菌(Corynebaterium)质粒上切割下来,并自连接形成一个非复制的环状分子。这个整合子然后通过电穿孔被导入限制性宿主中。DNA的修饰使得整合子可以躲避宿主的限制性系统,并且它进入宿主基因组中的重组,使选择性标记得到表达。
启动子 外源基因在棒状杆菌(Corynebaterium)中的表达需要可靠的转录启动子。对一些特定实验来说,也需要它的活性可以在特定的培养条件下被诱导的受调节的启动子。来自棒状杆菌(Corynebaterium)基因的启动子,例如fda,thrC和hom启动子被证明可用于外源基因表达。来自大肠杆菌的可诱导的启动子,例如,当lac抑制子(LacI)存在时受异丙基硫代半乳糖苷(IPTG)诱导的Plac和Ptrc启动子;当Trp抑制子(trpR)存在时对诱导物吲哚丙烯酸响应的Ptrp启动子;当温度敏感的λ抑制子(cI857)存在时受到抑制的λPL,都被用于在棒状杆菌(Corynebaterium)中调节基因表达。
基因鉴定 虽然存在所有其它的遗传工具,鉴定来自棒状杆菌(Corynebaterium)的相关基因仍然是一个挑战。在大肠杆菌中,一些已用于分离基因的来源是转导噬菌体,转座因子,从转导和转结合实验得到的大肠杆菌染色体的遗传图谱,以及最近,完整的染色体的物理和序列图。目前从棒状杆菌(Corynebaterium)中鉴定和回收基因的最成功的方法是使用棒状杆菌(Corynebaterium)基因组DNA补充(Complement)已知的大肠杆菌的营养缺陷型。在这个实践中,带有棒状杆菌(Corynebaterium)基因组片段的质粒文库,被导入特定的酶或者功能缺陷的大肠杆菌菌株中。不再显示出营养缺陷型(例如,高丝氨酸缺陷)的转化体,可能带有来自棒状杆菌(Corynebaterium)的互补基因。这种策略导致大量的棒状杆菌(Corynebaterium)基因被分离,包括几种来自负责天冬氨酸衍生的和芳香族氨基酸的合成途径,中间代谢和其它的细胞过程的基因。这一策略的一个限制是,不是所有的棒状杆菌(Corynebaterium)基因都可以在大肠杆菌宿主中表达的。因此,尽管一个基因可能显示于质粒文库中,它可能不能补充大肠杆菌的突变,因此不能过筛选来回收。为克服这个限制,一小部分基因是通过类似的策略鉴定的,这里将野生型棒状杆菌(Corynebaterium)的质粒文库,直接用于补充其它棒状杆菌(Corynebaterium)的突变。尽管这一策略避免了在营养缺陷型宿主中基因表达的量不够的问题,它的应用仍然被营养缺陷型中质粒转化效率低的问题所限制。还有其它的一些基因是通过与基于其它物种同源基因的核酸探针杂交,以及使用聚合链式反应和简并寡核苷酸引物进行直接扩增而鉴定的。
转座因子转座因子在基因鉴定中是非常有力的工具,因为它们偶联基因恢复和诱变。不象经典的诱变技术那样在基因中产生点突变或者小的缺失,当转座因子插入基因中时,它们形成大的破坏,因此“标记”变化的基因以更易于被鉴定。已有一定数量的在棒状杆菌(Corynebaterium)中转位的转座因子被发现。在C.xerosi的pTP10质粒和白喉棒状杆菌(C.diphtherine)的PNG2质粒中发现的转位子,显示出可以在谷氨酸棒状杆菌(C.glutamicum)中转位并赋予红霉素抗性。日本Mitsubishi化学公司的一个小组从他们在谷氨酸棒状杆菌(C.glutamicum)中发现的一个插入序列,IS31831,开发出一系列的人工转位子(Vertes,A.A等,Mol.Gen.Genet.245397-405(1994)).在向IS31831的倒转重复间插入一个选择性标记后,这些研究者将获得的在一个大肠杆菌质粒上(不能在棒状杆菌(Corynebaterium)中复制)的转位子,通过电穿孔的方法导入谷氨酸棒状杆菌(C.glutamicum)菌株中。他们发现选择性标记以大约4×104突变体/毫克DNA的频率插入目的细胞的基因组中。使用这些转位子产生棒状杆菌(Corynebaterium)营养缺陷型,由此分离出几种负责氨基酸生物合成,和棒状杆菌(Corynebaterium)中其它功能的基因。
转导噬菌体转导噬菌体已用于其它系统中对遗传基因座作图和分离基因。1976年,日本Ajinomoto公司的研究者们研究了150株经鉴定和未经鉴定的各种产谷氨酸的棒状杆菌菌株,鉴定可能用于转导的噬菌体(Mornose等,.J.Gen.Appl.microbiol.Rev,16243-252(1995))。从这些筛选中回收的24个不同的噬菌体分离物中,只有3个可以以明显频率将trp标记从trp+供体转入trp-受体中,尽管甚至这个效率也只有10-7或者更少。这些研究者通过加入4mM环状腺苷酸(cAMP)和1.2mM氯化镁,稍微提高了转导的效率。一些不同的研究者试图从一些来源比如污染的工业发酵物,土壤和动物废物中分离corynephage开发可靠的转导方法。尽管分离和鉴定出了许多噬菌体,但是几乎没有与转导相关,开发出可普遍用于谷氨酸-产生细菌的可靠的高效的转导系统的机会仍然是存在的。
实施例下列实施例列出了以下的实验方案和实验细节。
细菌菌株和质粒谷氨酸棒状杆菌(C.glutamicum)21253(hom,赖氨酸过量生产者)被用于制备染色体DNA。大肠杆菌DH5α(hsdR-,recA-)(Hanahan,D.,J.mol.Biol166-577(1983))被用于转化。质粒pCR2.1TOPO(Invitrogen公司)被用于克隆聚合酶链式反应(PCR)产物。本研究构建了pRR850质粒,它含有一个克隆进pCR2.1TOPO质粒的850bp的片段。
培养基和培养条件大肠杆菌菌株在37℃生长在Luria-Bertani(LB)培养基中(Sambrook,J,等,Molecular cloninga laboratory manual,2ndedn,.Cold Spring Habour Laboratory,Cold Spring Habour,NY(1989))。谷氨酸棒状杆菌(C.glutamicum)在30℃生长在LB培养基中。当提到时,氨苄青霉素以下列浓度使用平板上100μg/ml和液体培养基中50μg/ml。
DNA操作如Tomioka,等所述从谷氨酸棒状杆菌(C.glutamicum)中分离了基因组DNA(Tomioka,N,等,Mol,gen.Genet.184359-363(1980).根据供应商操作手册将PCR片段克隆入pCR2.1TOPO载体中。粘粒和质粒DNA使用Qiaprep spin柱制备,用Qiaex试剂盒(Qiagen公司)从琼脂糖凝胲中抽提DNA。测序所需的粘粒的大规模高纯度制备,使用Promega Wizard试剂盒(Promega公司)。使用标准技术进行大肠杆菌转化和琼脂糖凝胶电泳(Sambrook,J,等,Molecular cloningalaboratory manual,2nd edn,.Cold Spring Habour Laboratory,ColdSpring Habour,NY(1989))。限制酶购自Boehringer Mannheim公司或者New England Bioabs公司。
粘粒文库所用的粘粒文库是通过将谷氨酸棒状杆菌(C.glutamicum)染色体DNA,克隆入Supercos载体而构建的(Stratagene公司)。
聚合酶链式反应技术(PCR)PCR是使用Boehringer Mannheim PCR core试剂盒依照制造商的说明进行的。当在谷氨酸棒状杆菌(C.glutamicum)染色体DNA上进行PCR反应时,每一反应中加入约1μg DNA。PCR反应所用的正向引物为5’GTCTTCATCGAGATGAATCCGCG 3’反向引物为5’CGCAGCGCCACATCGTAAGTCGC 3’斑点印迹分析含有本研究中鉴定的粘粒DNA的斑点印迹和作为正对照的探针用S&S小倍量仪(Schleicher & Schull公司)制备。编码谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因的一部分的一段850bp片段作为探针。如制造商所述,探针在一个随机引发的DNA标记反应用地高辛配基-11-duTP(Boehringer monabeim公司)进行标记。斑点印迹的杂交,清洗和比色检测使用Boehringer公司的Genius系统,遵照他们的滤膜杂交用户指导的方法进行。291个粘粒起始杂交,在65℃进行过夜,在杂交温度清洗。用于第二轮筛选的17个粘粒的杂交,在65℃下进行杂交,但是只杂交8小时,胶片暴光的时间也减少。
用Western印迹检测含生物素的蛋白质如Jetten和Sinskey所述制备谷氨酸棒状杆菌(C.gluamicum)细胞抽提物(Jetten,M.S.M,和Sinstrey,A.J.,FEMS,MicrobiolLett.111183-188(1993))。细胞抽提物中的蛋白质,使用十二烷基硫酸纳(SDS)/7.5%聚丙烯胺凝胶,在BioRad微型凝胶装置上进行分离,然后使用BioRad微型转膜装置电转移到硝酸纤维膜上,如Towin等所述(Towbin,H.等,Proc,Natl,Acad,Sci,USA764350-4353(1979))。生物素化的蛋白使用Biorad公司抗生物素蛋白结合的碱性磷酸酶和Schleicher&Schull公司的5-溴-4-氯-3-吲哚磷酸-对-甲苯胺盐/氯化氮蓝四唑进行检测。
DNA测序使用ABIPrism377DNA测序仪由MIT生物聚合物设备进行自动DNA测序。
序列分析使用DNA strider1.0版本程序(法国,Institut de RechercheFondamentale)进行DNA序列的倒转,互补,翻译和在序列中寻找可读框。使用国家生物技术信息中心(NCBI)的BLAST程序(Altsschul,S.F.等,J.Mol.Biol,215403-410(1990))比较蛋白质和DNA序列。使用MACAW软件(NCBI)进行蛋白质的同源性搜索。使用Biosoft International的Primer Prenier软件设计PCR引物。使用Genevn大学的Expasy分子生物学服务器上的计算PI/MW工具来预测推定的氨基酸序列的分子量和pI。
实施例1Western印迹检测生物素化的酶既然已知丙酮酸羧化酶含有生物素,就可以用Western印迹来检测谷氨酸棒状杆菌(C.glutamicum)中生物素化的蛋白的产生。从LB培养基中培养的细胞中制备的抽提物中检测到了两种生物素化的蛋白质,(资料来显示)和以前的报告一致。大约位于80kDa的一条带鉴定为乙酰基辅酶A羧化酶的生物素羧基载体结构域(BCCP)(Jager,W.等,Arch.Microbiol 16676-82(1996))。在120kDa的第二条带相信是丙酮酸羧化酶,因为这些蛋白在113-130kDa的范围内(Actwood,P.V.Int,J.Biochem.Cell.Biol.,27231-249(1995))。
实施例2PCR和克隆基于以前已克隆出基因高度保守区的同源性克隆了谷氨酸棒状杆菌(C.glutamicum)的丙酮酸羧化酶基因。检测了13种生物体的丙酮酸羧化酶基因,设计了相应于丙酮酸羧化酶中保守的ATP结合亚基序,和紧靠丙酮酸结合基序(表1)的区域的引物。当氨基酸不同时,基于结核分枝杆菌(M.glutamicum)来设计引物,因为它和产谷氨酸棒状细菌(C.glutamicum)的近亲缘关系。从谷氨酸棒状杆菌(C.glutamicum)的基因组DNA中用PCR扩增了一个850bp的片段,并克隆到Invitrogen公司的pCR2.1TOPO载体上构建了pBR850质粒。引物还可以基于保守的生物素结合位点和丙酮酸结合位点(资料来显示)设计。
实施例3;分离含有谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因的粘粒。
含有谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶基因一部分的850碱基对的片段被用作探针检测谷氨酸棒状杆菌(C.glutamicum)基因组文库。在第一轮筛选中,斑点印迹中的291个粘粒中的17个表现为阳性。对这17个粘粒进行第二轮筛选,使用相同的探针,但是更严谨的杂交条件,获得4个有阳性信号的粘粒。为确证这些粘粒确实含有丙酮酸羧化酶基因,使用4个阳性粘粒作为模板,用于制备探针的相同引物进行PCR。从所有4个阳性相斯质粒中扩增出了850bp的片段,命名为IIIF10,IIE9,IIIG7和IIIB7。

表1,使用NASAW软件对13种生物的丙酮酸羧化酶序列(来自Genbank)进行比较。选出两个高度保守的区,基于与这些区域相对应的结核分枝杆菌DNA序列设计了寡核苷酸生物。正向引物基于对应于保守区A的DNA序列。反向引物基于对应于保守区B的DNA序列。实施例4测序策略使用M13正向和M13反向引物对质粒pRR850中的850bp的插入片段进行了测序。基于这个序列设计了Begrev1和Endfor1引物,用于对丙酮酸羧化酶基因的850bP部分的开始和终止位点之外的序列的测序。粘粒IIIF10被用作测序模板。通过设计新的引物(表2)并“步移”过整个基因而连续测序。
实施例5序列分析测序粘粒IIIF10的3637个bp的序列。鉴定出了一个3420bp的读码框,预测它编码一个1140个氨基酸的蛋白质。推断的蛋白质和结核分枝杆菌(M tuberculosis)的丙酮酸羧化酶有63%的同一性,和人的丙酮酸羧化酶有44%的同一性,基于此同源性命名为谷氨酸棒状杆菌(C.glutamicum)基因pc。预测推断的蛋白质的pI为5.4,分子量为123.6KDa,它与通过SDS/聚丙烯酰胺凝胶电泳得到的估计为120KDa的亚基的分子量是类似的。起始甲硫氨基酸的上游显示出具有共有核糖体结合位点AAGGAA。基于和结核分枝杆菌(M tuberculosis)序列的同源性,预测的翻译起始位点是GTG密码子,它也在其它的细菌序列中被观察到(Stryer,L.,Biocbemistry,3rd edn,Freeman,NY(1988);Keilhauer,C,等,J.Bacterio,1755595-5603(1993))。该DNA序列被递交给GenBank并被给与的登记号为AF038548。
谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶的氨基端节段含有六肽GGGGRG,它与发现在所有生物素给合蛋白中的GGGG(R/K)G序列相匹配,相信是一个ATP结合位点(Fry,D.C.,等Proc Nal AcadSci USA 83907-911(1986);Post,L.E,等,J.Biol.Chem2657742-7747(1990)。第二个被提出与ATP结合有关,且存在于生物素依赖性的羧化酶和氨甲酰基磷酸合成酶中的区域在谷氨酸棒状杆菌(C.glutamicum)序列中是保守的(Lim F,等,J.Biol.chem.26311493-11497(1988))。预测的谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶蛋白也含有推定的丙酮酸结合基序,FLFEDPWDR,它在分枝杆菌,根瘤菌和人丙酮酸羧化酶的转羧基酶结构域是保守的(Dunn,N,F等,J.Bacteriol 1785960-1970(1996). 用转羧基酶的色氨酸荧光的研究表明,在这个基序中的Trp残基与丙酮酸的结合有关(Kumer,G.K等,Biochemistry272978-5983(1988))。该酶的羧基端节段含有推定的生物素结合位点,AMKM,它与在其它丙酮酸羧化酶以及其它生物素赖性酶的生物素羧基载体蛋白(BCCP)结构域中发现的是一致的。

表2,用于得到粘粒IIIF10中的丙酮酸羧酶基因的引物的DNA序列。
以前的研究表明磷酸烯醇丙酮酸羧化酶(ppc)不是谷氨酸棒状杆菌(C.glutamicum)中主要的添补酶,因为缺少它并不影响赖氨酸的生成(Gubler,M等,Appl,Microbiol,Biotechnol.40857--863(1994);Peters-Wendisch,P.G.等,Microbiol,lett.11269-274(1993)).而且,大量研究表明了存在丙酮酸羧化的酶,研究使用13C标记实验和NMR和GC-MS分析(Park,S.M.等,Apllied,Microbiol,Biotechnol,47430-440(1997b);Peters-Wendisch,P.G.等,Arch,Microbiol,165387-396(1996)),或者使用无细胞抽提物(Tosaka,O,Agri,Boil.Chem,431513-1519(1979))和可通透细胞(Peters-Wendisch,P.G等,Microbiol,1431095-1103(1997)的酶学实验。在无细胞抽提物中只能检测到很低的丙酮酸羧化酸活性。而这与非常的ATP背景并不脱离。很可能测得的这种活性是由于可逆的葡糖异生酶,比如草酰乙酸脱羧化酶和苹果酸酶。谷氨酸棒杆菌中丙酮酸羧化酶的存在,使上述的葡萄糖异生酶满足这株细菌的添补的需要成为很不可能。
推断的谷氨酸棒状杆菌(C.glutamicum)丙酮酸羧化酶的基因的氨基酸序列和来自不同种群生物的丙酮酸羧化酶序列有显著的相似性。它含有在N一端区域的生物素羧化酶结构域,在C端区域的BCCP结构域,和在中间区域的具有丙酮酸特异结合位点的转羧基酶结构域。谷氨酸棒状杆菌(C.glutamicum)的丙酮酸羧化酶蛋白和结核分枝杆菌和人的丙酮酸羧化酶显示出强烈的同源性(Wexler,I,D等,Biochem.Biophys.Acta,12274652(1994))。
有先例发现谷氨酸棒状杆菌(C.glutamicum)含有不止一种行使再生草酰乙酸的添补功能的酶。产香茅醇假单胞菌(Pseudomonascitronellolis),荧光假单胞菌(Pseudomonas fuorscens),棕色固氮菌和新型硫杆菌(Thiobacillus novellus)含有ppc和丙酮酸羧化酶(O’Brien,R,W,等,J.Biol Chem 2521257-1263(1977));Scrutton,M.C.和Taylor,B.L.Arch,Biochem.Biophys,164641--654(1974),Milrad de Forcheet,SR,和Cazullo,J.J.J.Gen,Microbiol,9375-81(1976);Charles,A.M,和Wiler,D.W,Can,J,Microbiol,30532-539(1984)。玉米含有ppc的三种同功酶(Toh,H.等,Plant Cell Environ 1731-43(1994).酿酒酵母(Saccharomyces Cerevisiae)中含有两种丙酮酸羧化酶的同功酶(Brewser,N,K等,Arch.Biochem.Biophys31162-71(1994)),每种被示差调节。已发现丙酮酷羧化酶基因存在于谷氨酸棒状杆菌(C.glutamicum)中,可相互转化磷酸烯醇丙酮酸,草酰乙酸和丙酮酸的酶在此菌株中的数量达到6个。在一种生物体中存在全部6种酶的情况还没有被报道过。产香茅醇假单胞菌含有相互转化草酰乙酸,PEP和丙酮酸的5种酶,即丙酮酸激酶,PEP合成酶,PEP羧化酶,草酰乙酸脱羧酶和丙酮酸羧化酶(O’Brien,R,W,等,J.BiolChem2521257-1263(1997).固氮菌含有上面除了PEP合成酶以外的所有酶(Scrutton,M.C.和Taylor,B.L.Arch,Biochem.Biophys,164641-654(1974))。
谷氨酸棒状杆菌(C.glutamicum)中6种代谢相关的酶的存在,提示了通过效应子进行调节这些酶是重要的。所有6种相关的酶与其它下游活性协调的生化和遗传学研究可以导致对于最大化这种工业上重要的生物体的初级代谢物的产量必要的准确过程的阐明。
实施例6丙酮酸羧化酶突变体的构建应用PCR扩增了丙酮酸羧化酶从180到3630位核苷酸的完整的可读框。设计PCR使用的寡核甘酸引物,通过沉默诱变去除编码序列中的SalI位点,并在可续框的上游和下游分别导入EcoRV和SalI位点。用EcoRV和SalI消化PCR产物并克隆到pBluescript载体上。获得pPCBluescript质粒。为获得在质粒携带的pyc的破坏,构建了pPCBluescript的衍生物,其中的pyc基因的中间部分被删除并替换上了tsr基因,它编码对于抗生素硫链丝菌肽的抗性。然后将RP4mob元件插入质粒中,得到pAL240。这个质粒能够经结合转移到棒状杆菌中,但是它转入后不能复制,因为它仅仅具有ColE1复制起始位点。经转接合将pAL240从大肠杆菌S17-1转入谷氨酸棒状杆菌中,然后在含有硫链丝菌肽和萘啶酮酸的培养基上筛选转结合体。
在确证每一个转接合体的药物抗性表型之后,检测它们在不同碳源上生长的能力。因为pAL240不能在棒状杆菌中复制,能够存活的那些细胞应是其基因组和质粒进行了重组的。鉴定出的几种侯选物具有合适的表型它们具有对硫链丝菌肽和萘啶酮酸的抗性,在含有葡萄糖和醋酸作为单一碳源的极限平板上生长良好,在含有乳酸作为单一碳源的极限平板上生长较差或者根本不在生长。应用Southern杂交和基于PCR的实验来确证是否仅有一个拷贝的丙酮酸羧化酶基因存在于基因组中,以及是否它被硫链丝菌肽抗性标记破坏了。检测这一菌殊中的赖氨酸的合成和生物素化蛋白的产生,Δpyc菌株作为活性实验的负对照,和互补实验的宿主株。
实施例7开发过量表达的菌株为了检测丙酮酸羧化酶水平的增加会导致赖氨酸产量的增加这一假说,有必要构建菌株,其中的丙酮酸羧化酶基因的表达是处在诱导型启动子的控制下。
载体pAPE12,它具有NG2的复制起始位点和IPTG控制的Trp启动子的下游的多克隆位点,被用作谷氨酸棒状杆菌中的表达载体。构建了pAPE12的衍生物,其中含有的丙酮酸羧化酶位于Ptrc的下游。将pyc基因从pPCBluescript上,用SalI和XbaI切下,并连接到用同样酶切割的pAPE12上,形成pLW305。pPCBluescript上的丙酮酸羧化酶基因(因此,同样地pLW305上)具有野生型的GTG起始密码子,并且存在于靠近野生型基因的5’端的SalI限制性位点,被通过在丙酮酸羧化酶基因的扩增中引入一个碱基的沉默突变而消除掉了。
pLW305和pAPE12被通过电穿孔导入几种其它的棒状杆菌的遗传背景中。
因为pLW305中的丙酮酸羧化酶基因具有GTG起始密码子,并在trc启动子和起始密码间含有一些间插DNA,设计一种丙酮酸羧化酶过表达质粒,pXL1,其消除了这些缺点。使用寡核苷酸引物,从pLW305扩增该基因的5’端时,同时,将GTG启始密码子变成了ATG并引入了BspLU11-I限制性位点,其与NcoI相容。然后用BspLU11-I和AfeI切割PCR产物,并连入pLW305的用NcoI部分消化后用AfeI完全切割所得到的7.5Kb的骨架上。两个独立套的连接和转化得到了推定的pXL1克隆。
实施例8发酵结果已经显示出,当基因从其天然谷氨酸棒状杆菌C.glutamicum启动子表达时,丙酮酸羧化酶的活性水平随碳源的不同而有很大的变化。因此,检测了在这些碳源上生长的各个菌株的丙酮酸羧化酶的产量。
菌株NRRL B-11474,NRRLB-11474(pLW305),和NRRL B-11474Δpyc侯选物35在具两种不同碳源,葡萄糖和乳酸的烧瓶中于NRRLB-11474的极限培养基上生长。生长结果和氨基酸产生量列出如下。

NRRL B-11474和pLW305在葡萄糖上表现出相同的行为。两株都产生相同的生物量和赖氨酸。在乳酸上也具有相似的赖氨酸产量。在相同的时期中,NRRL B-11474(pLW305)消耗了培养基中所有的乳酸,而野生型的NRRL-11474消耗少40%的乳酸。通过计算得到NRRLB-11474以0.37克乳酸/小时的速率消耗乳酸,而NRRL B-11474(pLW305)菌株以0.65克乳酸/小时的速率消耗是这种基质。
NRRL B-11474Δpyc不在乳酸上生长,这与预期的表型是一致的。它的葡萄糖上的生长非常低,且该菌株不产生赖氨酸。进行动力学研究可以获知这些菌株行为的更多的特征。
实施例9目测观察生物素化的蛋白丙酮酸羧化酶含有生物素。因此通过监测细胞中特定的生物素化产物的出现,应该可以测定这种酶的积累。
实施例10电泳凝胶为在电泳凝胶中检测生物素化的蛋白质,使用了一种商业来源的连接着碱性磷酸酶的链霉抗生物素蛋白。经过诱导或者未诱导的大肠杆菌DH5α或者含有pAPE12或者pLW305的NRRL B-11474的培养物的粗蛋白裂解物在双份的7.5%聚丙烯胺变性电泳胶上分离蛋白质。每对之一的凝胶用考马斯亮兰染色以观察所有的蛋白质,并保证每一上样孔中所上样的蛋白质量是一样的。其它的凝胶用能够结合生物素化蛋白的链霉抗生物素蛋白质-碱性磷酸酶试剂处理。给碱性磷酸酶提供比色底物,5-溴-4-氯-3-引哚磷酸(BCIP)可以目测观察到这些蛋白质的位置。与其它人所报道的一样,检测到了两种主要的生物素化蛋白。高分子量的那种(大约120KDa)显示为丙酮酸羧化酶,低分子量的那种(大约60KDa)是生物素化的乙酰辅酶A羧化酶亚基。
此处提到的所有出版物作为参考引入本文。
尽管为了阐明和理解的目的已用一些细节描述了前述发明,但阅读本说明书的本领域的技术人员会充分理解各种形式和细节的变化并非脱离本发明和所附权利要求的范围。
序列表<110>Sinskey,Anthony J.
Lessard,Philip A.
Willis,Laura B.
Stephanopoulos,Gregory<120>来自谷氨酸棒杆菌的丙酮酸羧化酶<130>1533.079CN00<140><141><160>36<170>PatentIn Ver.2.0<210>1<211>3621<212>DNA<213>谷氨酸棒杆菌<220><221>CDS<222>(199)..(3621)<400>1tggggcgggg ttagatcctg gggggtttat ttcattcact ttggcttgaa gtcgtgcagg 60tcaggggagt gttgcccgaa aacattgaga ggaaaacaaa aaccgatgtt tgattggggg 120aatcgggggt tacgatacta ggacgcagtg actgctatca cccttggcgg tctcttgttg 180aaaggaataa ttactcta gtg tcg act cac aca tct tca acg ctt cca gca 231Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala1 5 10ttc aaa aag atc ttg gta gca aac cgc ggc gaa atc gcg gtc cgt gct 279Phe Lys Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala15 20 25ttc cgt gca gca ctc gaa acc ggt gca gcc acg gta gct att tac ccc 327Phe Arg Ala Ala Leu Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro30 35 40cgt gaa gat cgg gga tca ttc cac cgc tct ttt gct tct gaa gct gtc 375Arg Glu Asp Arg Gly Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val45 50 55cgc att ggt acc gaa ggc tca cca gtc aag gcg tac ctg gac atc gat 423Arg Ile Gly Thr Glu Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp60 65 70 75gaa att atc ggt gca gct aaa aaa gtt aaa gca gat gcc att tac ccg471Glu Ile Ile Gly Ala Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro80 85 90gga tac ggc ttc ctg tct gaa aat gcc cag ctt gcc cgc gag tgt gcg519Gly Tyr Gly Phe Leu Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala95 100 105gaa aac ggc att act ttt att ggc cca acc cca gag gtt ctt gat ctc567Glu Asn Gly Ile Thr Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu110 115 120acc ggt gat aag tct cgc gcg gta acc gcc gcg aag aag gct ggt ctg615Thr Gly Asp Lys Ser Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu125 130 135cca gtt ttg gcg gaa tcc acc ccg agc aaa aac atc gat gag atc gtt663Pro Val Leu Ala Glu Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val140 145 150 155aaa agc gct gaa ggc cag act tac ccc atc ttt gtg aag gca gtt gcc711Lys Ser Ala Glu Gly Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala160 165 170ggt ggt ggc gga cgc ggt atg cgt ttt gtt gct tca cct gat gag ctt759Gly Gly Gly Gly Arg Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu175 180 185cgc aaa tta gca aca gaa gca tct cgt gaa gct gaa gcg gct ttc ggc807Arg Lys Leu Ala Thr Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly190 195 200gat ggc gcg gta tat gtc gaa cgt gct gtg att aac cct cag cat att855Asp Gly Ala Val Tyr Val Glu Arg Ala Val Ile Asn Pro Gln His Ile205 210 215gaa gtg cag atc ctt ggc gat cac act gga gaa gtt gta cac ctt tat903Glu Val Gln Ile Leu Gly Asp His Thr Gly Glu Val Val His Leu Tyr220 225 230 235gaa cgt gac tgc tca ctg cag cgt cgt cac caa aaa gtt gtc gaa att951Glu Arg Asp Cys Ser Leu Gln Arg Arg His Gln Lys Val Val Glu Ile240 245 250gcg cca gca cag cat ttg gat cca gaa ctg cgt gat cgc att tgt gcg999Ala Pro Ala Gln His Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala255 260 265gat gca gta aag ttc tgc cgc tcc att ggt tac cag ggc gcg gga acc1047Asp Ala Val Lys Phe Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr
270 275 280gtg gaa ttc ttg gtc gat gaa aag ggc aac cac gtc ttc atc gaa atg1095Val Glu Phe Leu Val Asp Glu Lys Gly Ash His Val Phe Ile Glu Met285 290 295aac cca cgt atc cag gtt gag cac acc gtg act gaa gaa gtc acc gag1143Asn Pro Arg Ile Gln Val Glu His Thr Val Thr Glu Glu Val Thr Glu300 305 310 315gtg gac ctg gtg aag gcg cag atg cgc ttg gct gct ggt gca acc ttg1191Val Asp Leu Val Lys Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu320 325 330aag gaa ttg ggt ctg acc caa gat aag atc aag acc cac ggt gca gca1239Lys Glu Leu Gly Leu Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala335 340 345ctg cag tgc cgc atc acc acg gaa gat cca aac aac ggc ttc cgc cca1287Leu Gln Cys Arg Ile Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro350 355 360gat acc gga act atc acc gcg tac cgc tca cca ggc gga gct ggc gtt1335Asp Thr Gly Thr Ile Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val365 370 375cgt ctt gac ggt gca gct cag ctc ggt ggc gaa atc acc gca cac ttt1383Arg Leu Asp Gly Ala Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe380 385 390 395gac tcc atg ctg gtg aaa atg acc tgc cgt ggt tcc gac ttt gaa act1431Asp Ser Met Leu Val Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr400 405 410gct gtt gct cgt gca cag cgc gcg ttg gct gag ttc acc gtg tct ggt1479Ala Val Ala Arg Ala Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly415 420 425gtt gca acc aac att ggt ttc ttg cgt gcg ttg ctg cgg gaa gag gac1527Val Ala Thr Asn Ile Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp430 435 440ttc act tcc aag cgc atc gcc acc gga ttc att gcc gat cac ccg cac1575Phe Thr Ser Lys Arg Ile Ala Thr Gly Phe Ile Ala Asp His Pro His445 450 455ctc ctt cag gct cca cct gct gat gat gag cag gga cgc atc ctg gat1623Leu Leu Gln Ala Pro Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp460 465 470 475tac ttg gca gat gtc acc gtg aac aag cct cat ggt gtg cgt cca aag1671Tyr Leu Ala Asp Val Thr Val Asn Lys Pro His Gly Val Arg Pro Lys
480 485 490gat gtt gca gct cct atc gat aag ctg cct aac atc aag gat ctg cca1719Asp Val Ala Ala Pro Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro495 500 505ctg cca cgc ggt tcc cgt gac cgc ctg aag cag ctt ggc cca gcc gcg1767Leu Pro Arg Gly Ser Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala510 515 520ttt gct cgt gat ctc cgt gag cag gac gca ctg gca gtt act gat acc1815Phe Ala Arg Asp Leu Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr525 530 535acc ttc cgc gat gca cac cag tct ttg ctt gcg acc cga gtc cgc tca1863Thr Phe Arg Asp Ala His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser540 545 550 555ttc gca ctg aag cct gcg gca gag gcc gtc gca aag ctg act cct gag1911Phe Ala Leu Lys Pro Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu560 565 570ctt ttg tcc gtg gag gcc tgg ggc ggc gcg acc tac gat gtg gcg atg1959Leu Leu Ser Val Glu Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met575 580 585cgt ttc ctc ttt gag gat ccg tgg gac agg ctc gac gag ctg cgc gag2007Arg Phe Leu Phe Glu Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu590 595 600gcg atg ccg aat gta aac att cag atg ctg ctt cgc ggc cgc aac acc2055Ala Met Pro Asn Val Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr605 610 615gtg gga tac acc ccg tac cca gac tcc gtc tgc cgc gcg ttt gtt aag2103Val Gly Tyr Thr Pro Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys620 625 630 635gaa gct gcc agc tcc ggc gtg gac atc ttc cgc atc ttc gac gcg ctt2151Glu Ala Ala Ser Ser Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu640 645 650aac gac gtc tcc cag atg cgt cca gca atc gac gca gtc ctg gag acc2199Asn Asp Val Ser Gln Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr655 660 665aac acc gcg gta gcc gag gtg gct atg gct tat tct ggt gat ctc tct2247Asn Thr Ala Val Ala Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser670 675 680gat cca aat gaa aag ctc tac acc ctg gat tac tac cta aag atg gca2295Asp Pro Asn Glu Lys Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala
685 690 695gag gag atc gtc aag tct ggc gct cac atc ttg gcc att aag gat atg2343Glu Glu Ile Val Lys Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met700 705 710 715gct ggt ctg ctt cgc cca gct gcg gta acc aag ctg gtc acc gca ctg2391Ala Gly Leu Leu Arg Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu720 725 730cgc cgt gaa ttc gat ctg cca gtg cac gtg cac acc cac gac act gcg2439Arg Arg Glu Phe Asp Leu Pro Val His Val His Thr His Asp Thr Ala735 740 745ggt ggc cag ctg gca acc tac ttt gct gca gct caa gct ggt gca gat2487Gly Gly Gln Leu Ala Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp750 755 760gct gtt gac ggt gct tcc gca cca ctg tct ggc acc acc tcc cag cca2535Ala Val Asp Gly Ala Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro765 770 775tcc ctg tct gcc att gtt gct gca ttc gcg cac acc cgt cgc gat acc2583Ser Leu Ser Ala Ile Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr780 785 790 795ggt ttg agc ctc gag gct gtt tct gac ctc gag ccg tac tgg gaa gca2631Gly Leu Ser Leu Glu Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala800 805 810gtg cgc gga ctg tac ctg cca ttt gag tct gga acc cca ggc cca acc2679Val Arg Gly Leu Tyr Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr815 820 825ggt cgc gtc tac cgc cac gaa atc cca ggc gga cag ttg tcc aac ctg2727Gly Arg Val Tyr Arg His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu830 835 840cgt gca cag gcc acc gca ctg ggc ctt gcg gat cgt ttc gaa ctc atc2775Arg Ala Gln Ala Thr Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile845 850 855gaa gac aac tac gca gcc gtt aat gag atg ctg gga cgc cca acc aag2823Glu Asp Asn Tyr Ala Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys860 865 870 875gtc acc cca tcc tcc aag gtt gtt ggc gac ctc gca ctc cac ctc gtt2871Val Thr Pro Ser Ser Lys Val Val Gly Asp Leu Ala Leu His Leu Val880 885 890ggt gcg ggt gtg gat cca gca gac ttt gct gcc gat cca caa aag tac2919Gly Ala Gly Val Asp Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr
895 900 905gac atc cca gac tct gtc atc gcg ttc ctg cgc ggc gag ctt ggt aac2967Asp Ile Pro Asp Ser Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn910 915 920cct cca ggt ggc tgg cca gag cca ctg cgc acc cgc gca ctg gaa ggc3015Pro Pro Gly Gly Trp Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly925 930 935cgc tcc gaa ggc aag gca cct ctg acg gaa gtt cct gag gaa gag cag3063Arg Ser Glu Gly Lys Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln940 945 950 955gcg cac ctc gac gct gat gat tcc aag gaa cgt cgc aat agc ctc aac3111Ala His Leu Asp Ala Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn960 965 970cgc ctg ctg ttc ccg aag cca acc gaa gag ttc ctc gag cac cgt cgc3159Arg Leu Leu Phe Pro Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg975 980 985cgc ttc ggc aac acc tct gcg ctg gat gat cgt gaa ttc ttc tac ggc3207Arg Phe Gly Asn Thr Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly990 9951000ctg gtc gaa ggc cgc gag act ttg atc cgc ctg cca gat gtg cgc acc3255Leu Val Glu Gly Arg Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr100510101015cca ctg ctt gtt cgc ctg gat gcg atc tct gag cca gac gat aag ggt3303Pro Leu Leu Val Arg Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly1020 102510301035atg cgc aat gtt gtg gcc aac gtc aac ggc cag atc cgc cca atg cgt3351Met Arg Asn Val Val Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg104010451050gtg cgt gac cgc tcc gtt gag tct gtc acc gca acc gca gaa aag gca3399Val Arg Asp Arg Ser Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala105510601065gat tcc tcc aac aag ggc cat gtt gct gca cca ttc gct ggt gtt gtc3447Asp Ser Ser Asn Lys Gly His Val Ala Ala Pro Phe Ala Gly Val Val107010751080acc gtg act gtt gct gaa ggt gat gag gtc aag gct gga gat gca gtc3495Thr Val Thr Val Ala Glu Gly Asp Glu Val Lys Ala Gly Asp Ala Val108510901095gca atc atc gag gct atg aag atg gaa gca aca atc act gct tct gtt3543Ala Ile Ile Glu Ala Met Lys Met Glu Ala Thr Ile Thr Ala Ser Val1100 110511101115gac ggc aaa atc gat cgc gtt gtg gtt cct gct gca acg aag gtg gaa3591Asp Gly Lys Ile Asp Arg Val Val Val Pro Ala Ala Thr Lys Val Glu112011251130ggt ggc gac ttg atc gtc gtc gtt tcc taa3621Gly Gly Asp Leu Ile Val Val Val Ser11351140<210>2<211>1140<212>PRT<213>谷氨酸棒杆菌<400>2Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala Phe Lys Lys Ile Leu1 5 10 15Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala Phe Arg Ala Ala Leu20 25 30Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro Arg Glu Asp Arg Gly35 40 45Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val Arg Ile Gly Thr Glu50 55 60Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp Glu Ile Ile Gly Ala65 70 75 80Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro Gly Tyr Gly Phe Leu85 90 95Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala Glu Asn Gly Ile Thr100 105 110Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu Thr Gly Asp Lys Ser115 120 125Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu Pro Val Leu Ala Glu130 135 140Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val Lys Ser Ala Glu Gly145 150 155 160Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala Gly Gly Gly Gly Arg165 170 175Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu Arg Lys Leu Ala Thr180 185 190Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly Asp Gly Ala Val Tyr195 200 205Val Glu Arg Ala Val Ile Asn Pro Gln His Ile Glu Val Gln Ile Leu210 215 220Gly Asp His Thr Gly Glu Val Val His Leu Tyr Glu Arg Asp Cys Ser225 230 235 240Leu Gln Arg Arg His Gln Lys Val Val Glu Ile Ala Pro Ala Gln His245 250 255Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala Asp Ala Val Lys Phe260 265 270Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr Val Glu Phe Leu Val275 280 285Asp Glu Lys Gly Asn His Val Phe Ile Glu Met Asn Pro Arg Ile Gln290 295 300Val Glu His Thr Val Thr Glu Glu Val Thr Glu Val Asp Leu Val Lys305 310 315 320Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu Lys Glu Leu Gly Leu325 330 335Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala Leu Gln Cys Arg Ile340 345 350Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro Asp Thr Gly Thr Ile355 360 365Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val Arg Leu Asp Gly Ala370 375 380Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe Asp Ser Met Leu Val385 390 395 400Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr Ala Val Ala Arg Ala405 410 415Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly Val Ala Thr Asn Ile420 425 430Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp Phe Thr Ser Lys Arg435 440 445Ile Ala Thr Gly Phe Ile Ala Asp His Pro His Leu Leu Gln Ala Pro450 455 460Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp Tyr Leu Ala Asp Val465 470 475 480Thr Val Asn Lys Pro His Gly Val Arg Pro Lys Asp Val Ala Ala Pro485 490 495Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro Leu Pro Arg Gly Ser500 505 510Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala Phe Ala Arg Asp Leu515 520 525Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr Thr Phe Arg Asp Ala530 535 540His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser Phe Ala Leu Lys Pro545 550 555 560Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu Leu Leu Ser Val Glu565 570 575Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met Arg Phe Leu Phe Glu580 585 590Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu Ala Met Pro Asn Val595 600 605Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr Val Gly Tyr Thr Pro610 615 620Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys Glu Ala Ala Ser Ser625 630 635 640Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu Asn Asp Val Ser Gln645 650 655Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr Asn Thr Ala Val Ala660 665 670Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser Asp Pro Asn Glu Lys675 680 685Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala Glu Glu Ile Val Lys690 695 700Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met Ala Gly Leu Leu Arg705 710 715 720Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu Arg Arg Glu Phe Asp725 730 735Leu Pro Val His Val His Thr His Asp Thr Ala Gly Gly Gln Leu Ala
740 745 750Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp Ala Val Asp Gly Ala755 760 765Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro Ser Leu Ser Ala Ile770 775 780Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr Gly Leu Ser Leu Glu785 790 795 800Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala Val Arg Gly Leu Tyr805 810 815Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr Gly Arg Val Tyr Arg820 825 830His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu Arg Ala Gln Ala Thr835 840 845Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile Glu Asp Asn Tyr Ala850 855 860Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys Val Thr Pro Ser Ser865 870 875 880Lys Val Val Gly Asp Leu Ala Leu His Leu Val Gly Ala Gly Val Asp885 890 895Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr Asp Ile Pro Asp Ser900 905 910Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn Pro Pro Gly Gly Trp915 920 925Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly Arg Ser Glu Gly Lys930 935 940Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln Ala His Leu Asp Ala945 950 955 960Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn Arg Leu Leu Phe Pro965 970 975Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg Arg Phe Gly Asn Thr980 985 990Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly Leu Val Glu Gly Arg99510001005Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr Pro Leu Leu Val Arg101010151020Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly Met Arg Asn Val Val025103010351040Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg Val Arg Asp Arg Ser104510501055Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala Asp Ser Ser Asn Lys106010651070Gly His Val Ala Ala Pro Phe Ala Gly Val Val Thr Val Thr Val Ala107510801085Glu Gly Asp Glu Val Lys Ala Gly Asp Ala Val Ala Ile Ile Glu Ala109010951100Met Lys Met Glu Ala Thr Ile Thr Ala Ser Val Asp Gly Lys Ile Asp105111011151120Arg Val Val Val Pro Ala Ala Thr Lys Val Glu Gly Gly Asp Leu Ile112511301135Val Val Val Ser1140<210>3<211>23<212>DNA<213>人工序列<220><223>人工序列的描述正向DNA引物<400>3gtcttcatcg agatgaatcc gcg 23<210>4<211>23<212>DNA<213>人工序列<220><223>人工序列的描述反向DNA引物<400>4cgcagcgcca catcgtaagt cgc 23<210>5<211>8<212>PRT<213>Caenorhabditis elegans<400>5Tyr Phe Ile Glu Val Asn Ala Arg1 5<210>6<211>7<212>PRT<213>Caenorhabditis elegans<400>6Ala Thr Phe Asp Val Ser Met1 5<210>7<211>8<212>PRT<213>Aedes aegypti<400>7Tyr Phe Ile Glu Val Asn Ala Arg1 5<210>8<211>7<212>PRT<213>Aedes aegypti<400>8Ala Thr Phe Asp Val Ala Leu1 5<210>9<211>8<212>PRT<213>结核分枝杆菌<400>9Val Phe Ile Glu Met Asn Pro Arg1 5<210>10<211>7<212>PRT<213>结核分枝杆菌<400>10Ala Thr Tyr Asp Val Ala Leu1 5<210>11<211>8<212>PRT<213>嗜热脂肪杆菌<400>11Tyr Phe Ile Glu Val Asn Pro Arg1 5<210>12<211>7<212>PRT<213>嗜热脂肪杆菌<400>12Ala Thr Phe Asp Val Ala Tyr1 5<210>13<211>8<212>PRT<213>巴斯德毕赤酵母<400>13Tyr Phe Ile Glu Ile Asn Pro Arg1 5<210>14<211>7<212>PRT<213>巴斯德毕赤酵母<400>14Ala Thr Phe Asp Val Ser Met1 5<210>15<211>8<212>PRT<213>Mus musculus<400>15Tyr Phe Ile Glu Val Asn Ser Arg1 5<210>16<211>7<212>PRT<213>Mus musculus<400>16Ala Thr Phe Asp Val Ala Met1 5<210>17<211>8<212>PRT<213>Rattus norvegicus<400>17Tyr Phe Ile Glu Val Asn Ser Arg1 5<210>18<211>7<212>PRT<213>Rattus norvegicus<400>18Ala Thr Phe Asp Val Ala Met1 5<210>19<211>8<212>PRT<213>酿酒酵母1<400>19Tyr Phe Ile Glu Ile Asn Pro Arg1 5<210>20<211>7<212>PRT<213>酿酒酵母1<400>20Ala Thr Phe Asp Val Ala Met1 5<210>21<211>8<212>PRT<213>酿酒酵母2<400>21Tyr Phe Ile Glu Ile Asn Pro Arg1 5<210>22<211>7<212>PRT<213>酿酒酵母2<400>22Ala Thr Phe Asp Val Ala Met1 5<210>23<211>8<212>PRT<213>Rhizobium etli<400>23Tyr Phe Ile Glu Val Asn Pro Arg1 5<210>24<211>7<212>PRT<213>Rhizobium etli<400>24Ala Thr Phe Asp Val Ser Met1 5<210>25<211>8<212>PRT<213>人<400>25Tyr Phe Ile Glu Val Asn ser Arg1 5<210>26<211>7<212>PRT<213>人<400>26Ala Thr Phe Asp Val Ala Met1 5<210>27<211>8<212>PRT<213>粟酒裂殖酵母<400>27Tyr Phe Ile Glu Ile Asn Pro Arg1 5<210>28<211>7<212>PRT<213>粟酒裂殖酵母<400>28Ala Thr Phe Asp Val Ser Met1 5<210>29<211>9<212>PRT<213>谷氨酸棒杆菌<400>29Phe Leu Phe Glu Asp Pro Trp Asp Arg1 5<210>30<211>18<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>30ttcaccaggt ccacctcg18<210>31<211>18<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>31cgtcgcaaag ctgactcc 18<210>32<211>22<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>32gatgcttctg ttgctaattt gc22<210>33<211>20<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>33ggccattaag gatatggctg 20<210>34<211>19<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>34gcggtggaat gatccccga19<210>35<211>18<213>人工序列<220><223>人工序列的描述DNA引物<400>35accgcactgg gccttgcg18<210>36<211>18<212>DNA<213>人工序列<220><223>人工序列的描述DNA引物<400>36tcgccgcttc ggcaacac18
权利要求
1.一种分离的核酸分子,包括与选自下列的序列具有至少95%的同一性的多核苷酸(a)一种编码具有SEQ ID NO2中的氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列;(b)一种编码具有ATCC保藏号_中所含的粘粒克隆所编码的完整的氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列;以及(c)一种和(a)或者(b)中的任一种核苷酸序列互补核苷酸序列。
2.权利要求1的核酸分子,其中所说的多核苷酸具有SEQ ID NO1中的完整的核苷酸序列。
3.权利要求1的核酸分子,其中所说的多核苷酸具有编码具有SEQ ID NO2中的氨基酸序列的丙酮酸羧化酶多肽的SEQ ID NO1中的核苷酸序列。
4.权利要求1的核酸分子,其中所说的多核苷酸具有编码具有包含在ATCC保藏号_中的粘粒克隆所编码的全部氨基酸序列的丙酮酸羧化酶多肽的核苷酸序列。
5.一种分离的核酸分子,包括在严谨杂交条件下与具有相同于权利要求1的(a),(b)或(c)中的核苷酸序列的核苷酸序列的杂交的多核苷酸,其中所说的杂交的多核苷酸在严谨杂交条件下不与具有仅由A残基或仅由T残基组成的核苷酸序列的多核苷酸杂交。
6.权利要求1的分离的核酸分子,其中所说的多核苷酸是DNA。
7.权利要求1的分离的核酸分子,其中所说的多核苷酸是RNA。
8.一种制备重组载体的方法,包括将权利要求1的一种分离的核酸分子插入到载体中。
9.由权利要求8的方法所制备的重组载体。
10.一种制备重组宿主细胞的方法,包括将权利要求9的重组载体导入到宿主细胞中。
11.由权利要求10的方法所制备的重组宿主细胞。
12.一种制备丙酮酸羧化酶多肽的重组方法,包括将权利要求11的重组宿主细胞在一定条件下培养,从而使该多肽得到表达,并回收该多肽。
13.权利要求12的方法,其中所说的丙酮酸羧化酶的表达比它在谷氨酸棒杆菌中的表达高2-20倍。
14.一种分离的丙酮酸羧化酶多肽,它具有与选自下列的序列有至少95%的同一性的氨基酸序列(a)具有SEQ ID NO2中的完整的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;(b)具有包含在ATCC保藏号_中的粘粒克隆所编码的完整的氨基酸序列的丙酮酸羧化酶多肽的氨基酸序列;以及
15.一种制备氨基酸的方法,包括表达权利要求1的核苷酸序列并回收所说的氨基酸。
16.权利要求15的方法,其中所说的氨基酸是赖氨酸。
17.权利要求15的方法,其中所说的丙酮酸羧化酶多肽的表达比它在谷氨酸棒杆菌中的表达高2-20倍。
全文摘要
本发明涉及到一种来自谷氨酸棒状杆菌的添补酶,它可在赖氨酸和谷氨酸的工业发酵生产中补充消耗的草酰乙酸。特别地,本发明提供了编码丙酮酸羧化酶蛋白的分离的核酸。本发明还提供了丙酮酸羧化酶多肽。
文档编号C12N15/09GK1336958SQ9881437
公开日2002年2月20日 申请日期1998年12月23日 优先权日1998年12月23日
发明者A·J·辛斯基, P·A·莱萨德, L·B·威利斯 申请人:麻省理工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1