使编码乙酸苯酯分解代谢酶的基因失活的方法和质粒以及用其转化的菌株的制作方法

文档序号:452648阅读:582来源:国知局
专利名称:使编码乙酸苯酯分解代谢酶的基因失活的方法和质粒以及用其转化的菌株的制作方法
技术领域
本发明的基础是鉴定了新的DNA化合物和重组DNA分子,它们编码从丝状真菌构巢曲霉(Aspergillus nidulans)和产黄青霉(Penicilliumchrysogenum)得到的乙酸苯酯2-羟化酶,用前述DNA化合物转化生产青霉素的菌株能使这一抗生素的产量提高。
已有技术在某些丝状真菌中,苯青霉素(青霉素G)生物合成途径的最后步骤包括在异青霉素N转换成青霉素G的步骤中。这包括酰基移转反应,在这个反应中,用一个苯乙酸替代了异青霉素N中的L-氨基己二酸侧链。催化这一反应的酶(酰基-辅酶A异青霉素N酰基转移酶)利用活化的以辅酶A(CoA)的硫酯形式的苯乙酸作为它的底物之一。
用于工业生产青霉素的真菌产黄青霉,和构巢曲霉不能合成乙酸苯酯。结果是,为了促进青霉素G的生物合成,必须在产黄青霉的工业培养物中加入过量的乙酸苯酯。过量的乙酸苯酯能防止不需要的其它具有脂肪族侧链的青霉素的合成,但增加了发酵过程的最终成本。
加入到青霉素生产的培养物中的部分乙酸苯酯可能参与了代谢。在产黄青霉发酵中积累相当量的2-羟基乙酸苯酯是一个完全确定的事实。这一侧链的前体组分显然在青霉素G的生物合成中没有贡献。
构巢曲霉和产黄青霉都通过同样的酶步骤从三个前体氨基酸合成青霉素。另外,当在培养物中加入过量的乙酸苯酯时,构巢曲霉和产黄青霉一样,将乙酸苯酯转换成2-羟基乙酸苯酯。构巢曲霉除了将乙酸苯酯转换成2-羟基乙酸苯酯,也可以分解代谢这一最后化合物,事实上,构巢曲霉能利用乙酸苯酯作为唯一的碳源。构巢曲霉中的分解代谢途径如下图所示乙酸苯酯↓乙酸苯酯羟化酶2-羟基乙酸苯酯↓2-羟基乙酸苯酯羟化酶匀浆物↓匀浆物 双加氧酶马来酰乙酰乙酸↓马来酰乙酰乙酸异构酶富马酰乙酰乙酸↓富马酰乙酰乙酸水解酶富马酸+乙酰乙酸这一途径的第一步是乙酸苯酯的邻位羟基化作用。第二个羟基化反应将2-羟基乙酸苯酯转换成2,5-二羟基乙酸苯酯(=匀浆物)。匀浆物通过富马酰乙酰乙酸分解代谢成富马酸和乙酰乙酸,这两个产物参与了Krebs循环(参见Fernandez Canon y Penalva,美国核酸科学进程92:9132-9136,1995)。
所述的丝状真菌部分地或完全分解代谢乙酸苯酯的能力是青霉素生产过程中的不利特征。由于这一原因,完全或部分地去除这一特征将产生青霉素G生产能力提高的菌株。
在生产青霉素的真菌中进行经典的诱变去除这一不利特征(也就是部分或完全分解代谢乙酸苯酯的能力)需要在大量的菌株中进行艰巨的选择工作。不管怎样,所述的诱变经常产生继发突变,这些继发突变可能会去除亲本菌株的有用的特征,例如产生营养缺陷型突变或生长活力或孢子形成减弱的突变,而生长活力和孢子的形成是工业发酵的关键。所以,为了部分或完全去除分解代谢乙酸苯酯的能力,使用基因工程技术是恰当的,这些技术没有所述的局限性。进行涉及的基因工程的基本需要是克隆和鉴定基因,该基因或这些基因传递前面所述的生产青霉素的真菌的不利特征。
发明的详细说明本发明的目的是解决本领域现存的前面所述的问题。包括鉴定真菌中的基因,该基因编码乙酸苯酯2-羟化酶活性,催化曲霉和青霉中乙酸苯酯分解代谢的第一个酶解步骤的酶,和使用该基因通过重组DNA技术去除生产青霉素的真菌的基因组中存在的该基因。本专利叙述了在基因工程构建的菌株中这一基因是如何失活的。这一基因工程菌株不能分解代谢乙酸苯酯,产生的青霉素水平比亲本菌株高。另外,这一重组菌株的最大青霉素产量需要的乙酸苯酯超额量比亲本菌株需要的小。利用上面的DNA化合物使乙酸苯酯分解代谢失活,导致青霉素产量的明显提高。
SEQ ID NO:1显示了来自构巢曲霉的1986个碱基对(bp)的基因组DNA片断的序列,该序列中包括用于本发明的新基因。将该基因称为phacA(phac是由于使用乙酸苯酯phenylacetate),它编码将乙酸苯酯邻位羟基化的酶(这一反应是构巢曲霉中乙酸苯酯分解代谢的第一步)。与基因组DNA互补的DNA(cDNA)克隆的核苷酸序列覆盖了整个编码区和它们随后的排列,并暴露了这一基因具有下面的特征-该基因编码具有518个氨基酸的多肽。第一个甲硫氨酸由位置82的ATG三联体编码,而终止密码(TAG)位于位置1810。这些位置与SEQ ID NO:1.中显示的核苷酸序列匹配。
-编码区被三个长度为65,56和53个核苷酸的内含子(SEQ ID NO:1)中断。
-在SEQ ID NO:1中,以对应的外显子下面的三字母氨基酸密码表示了推断的518个残基的多肽,该多肽也在SEQ ID NO:2中单独以氨基酸密码表示了。推断的蛋白质的分子量是58,495克/摩尔。利用国家生物技术信息中心(NCBI,美国)的公共可得服务BLAST,在蛋白质序列的数据库(如SwissProt和PIR)中,和在DNA序列的数据库(如,基因库和EMBL数据库)的概念性翻译中,对六个可能的读码框架进行的研究表明该氨基酸序列与细胞色素P450家族的成员(血硫蛋白)相似。这些蛋白质通常参与氧化过程。事实上,与残基431和439之间的序列相对应的含有氨基酸半胱氨酸的肽,Gly-X-Gly-X-X-X-Cys-X-Gly(其中X指任何氨基酸),该肽参与了血红素基团的结合,这是这些血硫蛋白的特征。
新的DNA化合物可以从天然微生物中分离,也可以利用自动DNA合成仪全部合成,SEQ ID NO:1详细叙述了它的结构。另外,由于遗传密码的简并性,新DNA化合物编码的蛋白质可以由替代的DNA序列编码。这些也包括在本发明中。另一方面,任何起源于上面叙述的新DNA化合物的天然遗传突变体将认为是它的等同物。这些遗传突变体包括从进化角度上与构巢曲霉密切相关的有机体如产黄青霉中的同源基因。如下所述,利用来自构巢曲霉的DNA化合物作为杂交探针可以容易地鉴定这些基因。
可以将构巢曲霉的phacA基因用作分子探针通过杂交在其它真菌品种的基因组DNA和cDNA文库中寻找功能同源基因。所以,例如,本发明叙述了利用该基因对产黄青霉DNA文库的筛选,表明从产黄青霉的工业菌株中可以分离到与构巢曲霉的phacA同源的基因。SEQ ID NO:3显示了来自产黄青霉的基因组的2558bp的DNA片断的序列,该片断是通过与phacA基因探针杂交分离得到的。将与构巢曲霉的phacA同源的产黄青霉基因命名为pahA(由于乙酸苯酯羟基化作用phenylacetatehydrixylation)。产黄青霉的pahA基因编码含有516个氨基酸的多肽,该多肽显示了与PhacA的氨基酸序列有84%的同一性,PhacA的氨基酸序列即构巢曲霉的phacA基因的蛋白质产物。SEQ ID NO:4显示了产黄青霉的pahA基因的产物的序列。如前所述,这一从产黄青霉分离的新DNA化合物也包括在本发明中,如其它同源基因一样,这些同源基因是通过同样的方法从真菌的其它种类中分离得到的。
通过反向遗传学可以将已经克隆的这些基因用于产生失去功能的突变。为了这一目的,可以在携带截短的该真菌基因的大肠杆菌载体中构建新的重组DNA分子,这样的载体可以通过转化使该内源基因失活。例如,这一重组质粒可以含有构巢曲霉的phacA基因的5’区,接着对phacA基因编码区修饰,该修饰包括用含有构巢曲霉的argB+基因的3.2kb XbaⅠ片断替代289bp的Nae Ⅰ-kpnⅠ片断(参见

图1)。然后是phacA基因的3’区。这一突变的phacA基因的表达将产生PhacA蛋白,该蛋白在残基297处截短,结果是缺乏221个羧基末端的残基。突变蛋白中缺乏的后面的这些残基包括前面提到的肽,该肽包含参与血红素基团的结合的Cys残基,该残基是这一类型的蛋白质活性的关键。
通过适当的限制酶可以从载体的序列中分离到含有上面提到的区域的线性DNA片断,然后通过标准技术纯化。这一线性片断可以用于将构巢曲霉的argB+菌株转化成精氨酸原养型。由于用于转化的DNA缺乏自我复制需要的序列。原养型转化体是从将该DNA片断整合进基因组得到的。如图1所示,一个可能的整合方法是在线性DNA分子与存在于真菌基因组中的phacA座位之间的双交叉连接,这一方法将产生argB+表现型。这一双交叉连接发生导致体外产生的截短的基因替代了原初的phacA基因,引起phacA功能的丢失。通过它们的杂交方式可以识别携带这一替代(即失去功能的突变)基因的转化体,在这一方法中,利用了适当的限制酶消化基因组DNA,然后利用32P放射性标记的phacA或argB基因作为探针,通过Southern技术杂交分析。通过这种方式,可以容易地将其它类型的转化体的杂交方式与对应于基因替代的那些杂交方式区别开。利用标准技术可以纯化通过phacA基因提供的缺乏功能的转化体,用于进一步测试。
与野生型菌株不同,通过反向遗传学产生的构巢曲霉转化体缺乏phacA基因的功能,所以这些转化体在乙酸苯酯作为唯一碳源时不能生长。但是,它们却可以在2-羟基乙酸苯酯或2,5-二羟基乙酸苯酯中生长。这种情况表明新DNA化合物(构巢曲霉的phacA基因)编码乙酸苯酯的邻位羟基化所需要的酶活性,乙酸苯酯的邻位羟基化是构巢曲霉中利用乙酸苯酯的基本步骤。产黄青霉确实不利用乙酸苯酯作为唯一碳源,但如前面所示,产黄青霉含有编码酶PhacA的同系物的基因。所以,新的DNA化合物提供了去除侧向的代谢转化的方法,该方法可以降低青霉素生物合成中乙酸苯酯的积累。
在产黄青霉中,利用与前叙的相似的方法使pahA基因失活,其中利用了本发明中包括的新产黄青霉DNA化合物和任何已经得到的产黄青霉转化标记,例如trpC基因。同样令人满意的是除了argB(在构巢曲霉中)或trpC(在产黄青霉中)以外的转化标记可以用于中断新DNA化合物的编码区。这些转化标记包括其它营养缺陷型标记(例如pyrG或riboB)和抗生素抗性基因(例如在真菌中授予fleomycin或潮霉素B抗性的基因)。这些方法基本上与这里所用的并包括在本发明中的那些方法相当。图2显示了这些方法中的一个方法,该方法用于改变产黄青霉的pahA基因。在这种情况下,在失活的构建体中,嵌合基因已经替代了pahA基因的内部区域,在嵌合基因中,产黄青霉的gdh基因(编码谷氨酸脱氢酶活性的基因)的启动子控制了细菌bleR基因的表达,该基因的表达授予了对抗生素fleomycin的抗性。含有失活构建体的质粒被称为pALP696。所以,由转化体在含有fleomycin的培养基中的生长能力可以选择转化体(Kolar,M.,Punt,P.J.,van del Hondel,C.A.M.J.J.和Schwab,H.基因62:127-134,1988)。
另外,通过反向遗传学在已经克隆和鉴定的基因中可以利用其它策略产生失去功能的突变。例如,利用携带靶基因的内部片断的环状质粒的转化,在转化体DNA的单一拷贝的同源整合后,产生该基因的两个不完全的拷贝,如果质粒中包括的片断是经过适当选择的,这两个拷贝缺乏功能。通过反向遗传学在需要的基因中利用这些或其它策略产生失去功能的突变的方法也包括在本发明中。
去除了参与在乙酸苯酯的修饰或分解代谢过程中的酶的真菌菌株显示了其具有提高青霉素产量的特性。况且这些真菌菌株在青霉素生产培养基中的生长能力与亲本菌株没有区别。例如,含有如上所述的phacA替代基因的构巢曲霉转化体(即,缺乏乙酸苯酯2-羟化酶活性)产生3到8倍于亲本菌株所产生的青霉素,而且较小地依赖于加入的乙酸苯酯的量(参见图3)。以这种方式,当把乙酸苯酯从0.125%(w/v)减少到0.0625%(w/v),在野生菌株中会导致青霉素产量的下降时,缺乏phacA基因功能的转化体在两个浓度的乙酸苯酯中都产生了高水平的青霉素。
最后,本发明不仅仅涉及phacA基因和它的同系物。这里我们正利用编码乙酸苯酯2-羟化酶的基因,因为该酶催化乙酸苯酯分解代谢途径的第一步骤,并且产黄青霉生产菌株分泌大量的2-羟基乙酸苯酯。当它们一旦被鉴定后,利用与本文所述的相似的方法也可以使其它参与乙酸苯酯代谢的基因失活。本发明,即通过利用反向遗传学,使真菌有机体的个别乙酸苯酯代谢基因失活,就可以提高这些真菌产生青霉素的产量,因此本发明也包括这些替代的可能性。
实施例1.克隆和鉴定构巢曲霉的phacA基因采取了下述的步骤通过从cDNA文库特异选择可以分离对应于phacA基因的cDNA克隆a)获得对应于基因转录物的cDNA群体,当真菌在存在乙酸苯酯时生长时,这些基因转录物得到优选表达(用作筛选DNA文库的“+”探针)。
将构巢曲霉A26菌株在37℃,在适当补充的最小培养基中培养,该菌株来自真菌遗传原种收藏中心(堪萨斯大学的药学中心,微生物系),该培养基含有(克/升)KPO4H2,13.6;(NH4)2SO4,2.0;MgSO4×7H2O,0.25和Fe×7H2O,0.0005,碳源是0.3%(w/v)的葡萄糖。通过分析培养基中的葡萄糖浓度确定利用葡萄糖的时间(利用酶试剂盒)。这通常是在不断搅拌温育18小时后。2小时后在培养物中加入乙酸苯酯,直到最后浓度10毫摩尔/升,在37℃,再搅拌1小时,目的是诱导所述的基因的表达。在这一时间段后,过滤收集菌丝体,用水洗涤,在液氮中冷冻。冷冻干燥用于分离总RNA。将总RNA制备物通过oligo-dT纤维素亲和层析分离得到poly(A+)mRNA。在存在禽成髓细胞瘤病毒逆转录酶(商业来源)时制备了单链cDNA作为引物,这一制备过程利用了2微克来自乙酸苯酯诱导的菌丝体和oligo-dT(15聚合体)分离的所述mRNA作为模板。将反应物在42℃,在缓冲液中温育1小时,缓冲液含有10毫摩尔/升Tris-HCl,pH8.8(在25℃),50毫摩尔/升KCl,0.1%Triton X-100,5毫摩尔/升MgCl2,10毫摩尔/升每种dNTP,和0.5单位的RNasin。在第一条链合成后,在60℃,与3摩尔/升NaOH温育1小时去除模板RNA。在中和(用酸)后,通过用2.5倍体积的纯乙醇在-80℃沉淀2小时,并离心回收单链DNA。用30倍过量的poly(A+)RNA除去这种cDNA,poly(A+)RNA是从开始利用葡萄糖时回收的菌丝体分离得到的,所用的方法如Sargent,T.D.,酶学方法152:423-432,1987所述。在68℃,通过羟磷灰石层析分离cDNA-RNA杂合分子,并丢弃。如上所述将留下的cDNA与过量的poly(A+)RNA杂交,这时的poly(A+)RNA来自缺乏乙酸苯酯时培养的菌丝体。再次丢弃。如上所述,回收剩余的单链cDNA群体,这些cDNA代表了在存在乙酸苯酯时优先表达的基因的转录物。利用[α-32P]dCTP和过量的所有其它dNTP,在存在DNA聚合酶的Klenow片断和作为引物的任意序列的六核苷酸时均一地标记这种cDNA。将得到的32P标记的cDNA群体(特异活性>108cpm/毫克)用作探针,去筛选如c)部分所述构建的cDNA文库。
b)得到对应于缺乏乙酸苯酯时转录的基因的cDNA探针(“-”探针)。
如a)部分所述合成单链cDNA并用32P标记,但是利用的mRNA来自在含有葡萄糖培养基中的葡萄糖用尽时并在缺乏乙酸苯酯情况,在37℃再温育1小时所得到的菌丝体。
c)在λgt10载体中构建cDNA文库,构建过程利用的cDNA来自加入10毫摩尔/升乙酸苯酯作为唯一碳源时培养的菌丝体。
为了构建这种cDNA文库,如前面所述方法进行第一条cDNA链的合成反应。将得到的cDNA-RNA杂合体转化成双链cDNA,方法是利用Rnase H在RNA链中导入任意裂口,将这些裂口用作引物点,并利用大肠杆菌DNA聚合酶Ⅰ。为了在这一末端平齐化的cDNA制备物中加上EcoRⅠ末端,将含有平齐化磷酸化末端的合成受接合体具有双链cDNA的EcoRⅠ突出端在加入T4 DNA连接酶情况下温育。然后纯化具有EcoRⅠ末端的cDNA,并用T4多聚核苷酸激酶和ATP磷酸化。将磷酸化的cDNA与λgt10载体的群体混合,这一载体已经预先用EcoRⅠ消化并脱磷酸化,用混合物与T4 DNA连接酶一起温育。利用商业包装提取物,体外包装重组DNA分子。由于在大肠杆菌hfl菌株(F-,thi-1,leuB6,lacYl,tonA21,supE44,hflA150,[chr::Tn10]中的溶菌表现型选择出重组噬菌体,在这些噬菌体中cDNA插入片断已经使cⅠ基因失活(其中存在EcoRⅠ位点)。通过这种方法,得到了总共107个重组克隆。
d)cDNA文库筛选利用在大肠杆菌C600hfl+菌株中形成的溶菌斑选出cDNA文库,并将得到的溶菌斑转印到硝基纤维滤膜上。一个复膜与“+”cDNA探针(a)中所述)杂交,另一个复膜与“-”cDNA探针(b)中所述)杂交。然后选择与“+”探针杂交,与“-”探针不杂交的克隆并纯化。
e)对应于phacA基因的cDNA鉴定利用了包含在EcoRⅠ接合体的NotⅠ切割位点,通过用内切核酸酶NotⅠ消化,从载体中切出了cDNA插入片断。在用NotⅠ消化的pBluescript SK(+)质粒选择克隆的插入片断被亚克隆化,然后通过标准方法对它们测序。在六个可能的读码框架中翻译cDNA插入片断的序列,并将该序列与利用BLAST公式,在公共可得的DNA序列数据库GenBank和EMBL的六个读码框架中的概念性翻译比较或与蛋白质序列数据库SwissProt和PIR比较。cDNA插入片断的一个序列产生了扩展的开放读码框架,这一框架没有被终止密码子中断。推断的氨基酸序列表现了与细胞色素P450家族中的蛋白质的氨基酸序列明显的同一性,该家族蛋白通常参与氧化反应。正如后面将显示的(参见实施例3),该开放读码框架编码乙酸苯酯2-羟化酶。通过杂交,利用这一cDNA插入片断得到了对应于这一基因的新cDNA克隆。对这些克隆的两条链测序,得到的核苷酸序列显示了长度为1554个bp的完全开放的读码框架(没有翻译终止密码),这一读码框架编码518个氨基酸的多肽(SEQ ID NO:2)。这一序列与细胞色素P450蛋白质家族成员的同一性明确地决定了这一推断的蛋白质代表这一家族的新成员。
f)phacA基因的克隆利用对应于几乎完全的转录物的32P-标记的cDNA探针在λEMBL4载体中筛选构建的构巢曲霉基因组DNA文库。纯化阳性克隆,利用限制性酶消化和与上面提到的探针杂交鉴定它们的插入片断。以这种方法,将两个邻接的长度为2.4kb和1.9kb的BamHⅠ片断的杂交区图谱定位。图4显示了含有这些片断的基因组区的限制图谱。将所述的BamHⅠ片断亚克隆进pBluescript SK(+)。将含有2.4kb的BamHⅠ片断的重组质粒命名为pBS-FG4A,而携带1.9kb BamHⅠ片断的质粒命名为pBS-FG4B。
实施例2.克隆和鉴定产黄青霉的pahA基因,该基因是构巢曲霉的phacA基因的功能同系物a)克隆和确定产黄青霉的pahA基因的核苷酸序列利用(32P)放射性标记的探针筛选产黄青霉威斯康星54-1255的基因组DNA文库,该文库是利用克隆进λEMBL4的BamHⅠ位点的部分Sau3A片断构建的,该探针含有长度差不多完全的phacA基因的cDNA。通过标准技术约将12,000个克隆转移到纤维素滤膜上。然后,在37℃,在缓冲液中杂交24小时,缓冲液含有50%甲酰胺,5×Denhart溶液,5×SSC,0.1%SDS,50微克/毫升超声波处理的鲱鱼精子单链DNA和50纳克标记探针。杂交滤过物在0.2×SSC,0.1%SDS中,在37℃进行最后洗涤。用这一方法纯化了10个克隆,分离它们的DNA。然后,利用限制酶消化和与前面所述探针杂交鉴定所述克隆的插入片断。杂交区定位于2.55kbXhoⅠ片断中,图5显示了这一片断的限制性图谱。将这一DNA片断亚克隆进质粒pBluescript SK(+)中,产生的质粒称为pALP520。通过二脱氧核苷酸方法可以确定XhoⅠ片断的核苷酸序列,该片断含有pahA基因(图5)(Sanger,F.,Nicklen,S.和Coul son,A.R.(1977)美国核酸科学进程74,5463-5467)。
b)在青霉素生产条件下,从纯化的RNA构建产黄青霉cDNA文库和鉴定对应于pahA基因的cDNA。
产黄青毒的工业菌株的发酵罐培养物在青毒素G生产条件下温育100,124和148小时后,收集生长的菌丝体,并利用Poly(A)Quick mRNA纯化试剂盒(Stratagene)从中得到poly(A+)mRNA。根据制造商的说明,利用Zap-cDNA合成试剂盒(Stratagene),将上面poly(A+)mRNA作为模板构建cDNA文库。将此双链cDNA插入在噬菌体载体λZAP的EcoRⅠ和XhoⅠ限制位点之间,转录物的5’区定位于EcoRⅠ位点一侧。利用GigapackⅡGold包装提取物(Stratagene)包装cDNA文库,产生约106个独立的克隆。
利用标准方法(Sambrook,J.Fritsch,E.F.和Maniatis,T.(1989),分子克隆实验室手册,第二版,冷泉港实验室出版,纽约)进行这种cDNA文库的筛选,其中利用了含有pahA基因的1174bp的EcoRV片断作为探针(图5)。以这种方法,分离了12个阳性重组克隆(称为#1到#12),选择含有最大尺寸(约1600bp)的插入片断的克隆用于鉴定。然后确定这一克隆的全部核苷酸序列,从它的序列观察到它包括1548个bp的开放读码框架(ORF),这一ORF编码516个氨基酸的多肽,多肽的分子量为58,112道尔顿,与构巢曲霉的phacA基因编码的蛋白质有84%的同一性。正如它的同源构巢曲霉基因的情况一样,数据库的研究表明在pahA蛋白和P450蛋白家族之间有相当大的同一性。PahA蛋白含有序列Gly-X-Gly-X-X-X-Cys-X-Gly(残基430-438,SEQ ID NO:4),这一序列是这一类型的蛋白质的特征(参见本发明的详细说明)。从这些结果可以得出结论,产黄青霉的pahA基因是构巢曲霉的pahA基因的同系物。
实施例3.通过反向遗传学使构巢曲霉的phacA基因失活用突变等位基因替代构巢曲霉的phacA基因的野生型等位基因,在突变等位基因中,可能是它的功能的关键的编码区的一部分(SEQ ID NO:1中的残基298到392)受到抑制,被argB+基因替代。这一遗传操作在密码子297将phacA基因截短,产生了无效的突变等位基因。
另外,从pBS-FG4B纯化出1.7kb的KpnⅠ-EcoRⅠ片断(图4)并亚克隆进pUC18,该质粒已经用上面两种酶消化,产生质粒pUCB。然后从pBS-FG4A纯化出1.9kb的NaeⅠ片断(图4)并克隆进用SmaⅠ消化的pBluescriptSK(+)中。选择质粒,该质粒中的不完全的phacA基因的编码链(从NaeⅠ位点开始)的定向与载体中的编码β-半乳糖苷酶的基因相同取向。这一质粒称为pBSA。从pBSA中纯化XbaI-HindⅢDNA片断,插入用XbaⅠ-HindⅢ消化的pUCB中,产生质粒pUCA-B。最后,在pUCA-B的唯一XbaⅠ位点插入含有构巢曲霉的argB+基因的3.2kb的DNA片断,产生pPhacA::argB+。从pUC18的lacZ启动子开始,pPhacA::argB包括phacA基因的5’区的0.94kb的片断,随后接着质粒的基因组序列开始的297个密码子,含有argB基因的3.2kb的片断,对应于密码子393-518的phacA基因的基因组序列和phacA基因的3’区1.2kb。通过EcoRⅠ消化,从质粒中纯化出含有所有这些区域的线性片断(图6)。
同样,转化方法可以用于构建含有破坏-缺失突变的phacA基因的构巢曲霉的菌株,其中利用了上面的线性EcoRⅠ片断和上面所述的图中概括的方案。为了这一目的,利用2微克所述的DNA片断转化构巢曲霉biAl,methG1,argB2的菌株的原生质体,所用的方案来自Tilburn,J.,Scazzocchio,C.,Taylor,G.G.,Zabicky-Zissman,J.H.,Lockington,R.A.和Davies,R.W.(1983)基因26:205-211。利用适当的选择培养基选择精氨酸原养型转化体,然后纯化。从对应于一系列转化体的菌丝体中分离DNA,用PstⅠ消化,利用特异的phacA和argB基因探针,通过Southern杂交分析。如图1所示,许多转化体显示了希望得到的成功的双互交的杂交方式。例如,利用phacA基因的0.9kb的PstⅠ片断作为探针(参见图4),发现在转化体中3.8kb的带已经替代了受体菌株中单一的0.9kb PstⅠ杂交带,这展示了图1显示的整合类型。这一带也与argB探针杂交。选择这些转化体中的两个,随后鉴定,命名为ΔphacA#1和ΔphacA#2。这些转化体菌株在将丙氨酸苯酯,2-羟基乙酸苯酯或2,5-二羟基乙酸苯酯作为唯一碳源的培养基中具有生长能力,但与此相反,它们在将乙酸苯酯作为唯一碳源的培养基中不能生长。这支持了这样的结论,即构巢曲霉的phacA基因编码的细胞色素P450酶(扩展到产黄青霉的pahA基因编码的一个)具有将乙酸苯酯羟基化成为2-羟基乙酸苯酯的活性,这一活性催化构巢曲霉中乙酸苯酯利用途径的第一个步骤(参见以前的技术部分)。构巢曲霉菌株ΔphacA#1与ΔphacA#2在表现型上有区别,与构巢曲霉biA1 veA1 methG1 argB2 phacA::[pPhacA::argB+]一样,构巢曲霉菌株ΔphacA#1于1996年6月19日保藏在西班牙培养物类型收藏处(CECT),Valencia大学,研究大楼,Burjasot Campus,46100,Valencia,登记号为CECT 20195。获得含有失活的pahA基因的产黄青霉转化体的方法是本领域任何技术人员所非常熟悉的。简单地,该方法将包括分离产黄青霉的pahA基因,方法是与存在于转化体CECT20195中的构巢曲霉的phacA基因杂交或选择性地与根据SEQ ID NO:1合成的低聚核苷酸杂交。如本发明的图7所示,利用质粒pALfleo7(保藏于西班牙培养物类型收藏处,Valencia大学,研究大楼,Burjasot Campus,46100,Valencia,1997年2月20日,登记号为CECT 4849),可以构建质粒pALP696。
实施例4失活phacA基因的功能和增加青霉素产量的实验为了证实是否去除由phacA基因编码的乙酸苯酯2-羟化酶活性可以使青霉素产量提高,我们进行了实验,测量菌株ΔphacA生产的青霉素水平并和菌株phacA+比较。在烧瓶中的最小培养基中发酵比较两个菌株,最小培养基含有2.5%(w/v)乳糖作为基本碳源,和2.5%(w/v)玉米浸渍液,和如标明的不同量的乙酸苯酯钠(w/v)。在所有情况中,都用相等数目的活的分生孢子(2×106个/毫升)接种培养物,在37℃,有规律地搅拌(250rpm)温育。在各种时间取样,通过Miracloth过滤,上清液用于生物测试,测量生产的青霉素。
在生物测试中,将生长到0D600=6的藤黄微球菌的培养物1毫升与Antibiotic1号培养基(Difco)1升在50℃混合。将这一混合物注入13.6厘米的培养皿(65毫升/盘)中。将10微升来自培养物的上清液的样品(适当用10毫摩尔/升,pH6.8磷酸钠缓冲液稀释)分配在8毫米直径的孔中。平板在4℃,温育2小时,然后在37℃再温育22小时。最后,测量由于样品中存在的青霉素引起的细菌生长抑制区的直径,与校正线比较估算抗生素的量,校正线是利用不同量的青霉素G钾制作的。
图3显示了在生产培养基中利用0.125%的乙酸苯酯培养24小时后,得到与菌株phacA+相对应的菌株最高水平的青霉素产量。这时得到的青霉素产量是1.8微克/毫升。将乙酸苯酯的浓度减半,使这一菌株产生的青霉素的最高水平减少到1.1微克/毫升。
图3也显示,在菌株ΔphacA的培养物中青霉素的最高水平与亲本菌株有明显差别,达到5.6微克/毫升,即比亲本菌株高3.1倍。另外,作为失活phacA基因的结果,将乙酸苯酯的开始浓度减少到0.0625%不影响青霉素产量的增加。
结论是如图1所示通过反向遗传学技术进行编码乙酸苯酯2-羟化酶活性的phacA基因的破坏-缺失突变,至少在构巢曲霉生产青霉素过程中产生两个优点(ⅰ)青霉素水平有相当大的提高和(ⅱ)青霉素水平更少地依赖于乙酸苯酯的外部供应。
附图的详细说明图1通过同源重组在构巢曲霉的phacA基因中产生破坏-缺失突变的方案。用黑体的大叉表示推断的交互连接。
图2通过同源重组在产黄青霉的pahA基因中产生破坏-缺失突变的方案。大的虚线叉表示了推断的交互连接。
图3与野生型菌株(phacA+)比较构巢曲霉的转化phacA::argB菌株的青霉素产量。横坐标时间,小时(h);纵坐标青霉素产量(微克/毫升)。连续的实线乙酸苯酯浓度为0.125%;断线乙酸苯酯浓度为0.0625%。
图4含有构巢曲霉的phacA基因的基因组区的限制图谱,显示了亚克隆产生pFG4A和pFG4B的片断,黑区是3个内含子。
图5含有产黄青霉的pahA基因的基因组区的限制图谱。显示了亚克隆产生pALP520的2.55kb的XhoⅠ片断。黑区是3个内含子。
图6:pPhacA::argB+失活构建体的限制图谱和相关的特征。黑区是含有phacA基因的测序区;空白区是在phacA基因前后的侧接区;条纹区是argB+区。
图7:pALP696失活构建体的限制图谱和相关特征。黑区是含有pahA基因的测序区(1745bp);空白区是pahA基因前后的侧接区(4143bp);条纹区是fleomycin抗性区,基因bleR(2048bp)。
序列表总的情况申请人姓名抗生素有限公司(ANTIBIOTICOS,S.A.U)街道Avda.de Burgos,8-A城市马德里州或省马德里国家西班牙邮政编码28036电话91-3841200传真91-3841220题目“使编码乙酸苯酯分解代谢酶的基因失活的方法,包括质粒,和用它们转化的菌株”序列数4通讯地址收信人抗生素有限公司(ANTIBIOTICOS,S.A.U)街道Avda.de Burgos,8-A城市马德里州或省马德里国家西班牙邮政编码28036机器可读形式介质类型3.5”软盘计算机PC操作系统WINDOWS软件WORD律师/代理人的情况姓名阿伯特 伊丽沙白(ALBERTO DE ELZABURU)登记号232/1登记号PCT-42电信资料电话91 7009400传真91 3193810电子信箱elzaburu@elzaburu.esSEQ ID N0:1的特征长度1986个碱基对类型核苷酸链数2构型线性分子类型基因组DNA假设没有反义链没有原始来源构巢曲霉直接来源质粒pPhacA::argB+
基因组的位置未知特征名称/关键词编码序列定位820…1810其它信息phacA基因序列描述SEQ ID NO:1C CAGCCAGATA TAAAGGCCGT 21CCTTAGACGA CTTGATCTTA CTCTGGTTTC TAAAAGTTCA CTGATTATCG CAAGGTATCC 81ATG TCT CTT CAA ACA ATC GGG ATC GCC GCT GTC GCG GTG GTC TAT TTT 129Met Ser Leu Gln Thr Ile Gly Ile Ala Ala Val Ala Val Val Tyr Phe5 10 15CTC ATC CGC TAC TTC AAC CGC ACA GAC ATC CCA AAG ATC AAG GGT CTC 177Leu Ile Arg Tyr Phe Asn Arg Thr Asp Ile Pro Lys Ile Lys Gly Leu20 25 30CCT GAA GTT CCA GGC GTA CCG ATC TTT GGC AAC CTC ATC CAG CTC GGT 225Pro Glu Val Pro Gly Val Pro Ile Phe Gly Asn Leu Ile Gln Leu Gly35 40 45GAC CAG CAC GCG ACC GTA GCG CAG AAA TGG GCG AAG AAA TTT GGA CCT 273Asp Gln His Ala Thr Val Ala Gln Lys Trp Ala Lys Lys Phe Gly Pro50 55 60GTT TTC CAG GTT CGC ATG GGGAAT AAA GTGAGTTCAG TGTCTGCATT TGTAAC 326Val Phe Gln Val Arg Met Gly Asn Lys65 70AGAC GACAATATTG CGAGAATAAT TCTGACCTAA CACAG CGC GTT GTC TTC GCA 380Arg Val Val Phe Ala75AAC ACC TTC GAC TCT GTC CGT CAG CTA TGG ATC AAA GAT CAG TCC GCG 428Asn Thr Phe Asp Ser Val Arg Gln Leu Trp Ile Lys Asp Gln Ser Ala80 85 90CTC ATC TCC CGG CCG ACC TTT CAC ACC TTC CAC AGT GTA GTT TCC AGC 476Leu Ile Ser Arg Pro Thr Phe His Thr Phe His Ser Val Val Ser Ser95 100 105 110TCT CAG GGA TTC ACC ATC GGA ACG TCG CCG TGG GAC GAG TCG TGC AAG 524Ser Gln Gly Phe Thr Ile Gly Thr Ser Pro Trp Asp Glu Ser Cys Lys115 120 125CGT CGT CGG AAG GCT GCA GCT ACA GCC TTG AAC CGC CCG GCT ACC CAG 572Arg Arg Arg Lys Ala Ala Ala Thr Ala Leu Asn Arg Pro Ala Thr Gln130 135 140TCG TAT ATG CCT ATT ATC GAT CTT GAG TCG ATG TCG AGT ATC CGG GAA 620Ser Tyr Met Pro Ile Ile Asp Leu Glu Ser Met Ser Ser Ile Arg Glu145 150 155TTG CTC AGG GAT AGC GCG AAT GGA ACA ATG GAT ATC AAC CCG ACA GCG 668Leu Leu Arg Asp Ser Ala Asn Gly Thr Met Asp Ile Asn Pro Thr Ala160 165 170TAC TTC CAG CGG TTC GCG TTG AAC ACG AGC TTA ACA TTG AAC TAT GGA 716Tyr Phe Gln Arg Phe Ala Leu Asn Thr Ser Leu Thr Leu Asn Tyr Gly175 180 185 190ATC CGA ATC GAG GGC AAT GTG AAC GAT GAG CTT TTG CGC GAA ATT GTC 764Ile Arg Ile Glu Gly Asn Val Asn Asp Glu Leu Leu Arg Glu Ile Val195 200 205GAT GTC GAG CGC GGG GTG TCG AAC TTC CGG AGT ACC AGC AAC CAG TGG 812Asp Val Glu Arg Gly Val Ser Asn Phe Arg Ser Thr Ser Asn Gln Trp210 215 220CAG GAC TAT ATC CCG CTC CTG AGA ATC TTC CCG AAG ATG AAC CGC GAG 860Gln Asp Tyr Ile Pro Leu Leu Arg Ile Phe Pro Lys Met Asn Arg Glu225 230 235GCT GAG GAG TTC CGG GTG CGG AGA GAC AAG TAT CTT ACC TAT CTT TTG 908Ala Glu Glu Phe Arg Val Arg Arg Asp Lys Tyr Leu Thr Tyr Leu Leu240 245 250GAT GTT CTC AAG GAT CGC ATT GCA AAG GGA ACC GAC AAG CCC TGT ATT 956Asp Val Leu Lys Asp Arg Ile Ala Lys Gly Thr Asp Lys Pro Cys Ile255 260 265 270ACT GGA AAC ATC CTC AAA GAC CCT GAG GCT AAG CTC AAT GAT G GTATG1004Thr Gly Asn Ile Leu Lys Asp Pro Glu Ala Lys Leu Asn Asp275 280CCGTC CGGTCCTGTC CGCGCTTGAA GGAAAATAAA GATTAACAGA GTCTAG CC GAG 1060Ala Glu285ATT AAA TCG ATC TGC TTG ACC ATG GTC TCC GCC GGC CTC GAT ACT GTT 1108Ile Lys Ser Ile Cys Leu Thr Met Val Ser Ala Gly Leu Asp Thr Val290 295 300CCG GGC AAC TTG ATC ATG GGC ATC GCG TAC CTC GCC TCC GAA GAC GGC 1156Pro Gly Asn Leu Ile Met Gly Ile Ala Tyr Leu Ala Ser Glu Asp Gly305 310 315CAA AGG ATC CAG AAG CGC GCC CAC GAC GAG ATC ATG AAA GTC TAC CCG 1204Gln Arg Ile Gln Lys Arg Ala His Asp Glu Ile Met Lys Val Tyr Pro320 325 330GAC GGC GAT GCA TGG GAG AAA TGC CTG CTC GAA GAG AAA GTC CCC TAC 1252Asp Gly Asp Ala Trp Glu Lys Cys Leu Leu Glu Glu Lys Val Pro Tyr335 340 345 350GTC ACA GCT TTG GTC AAA GAA ACC CTC CGC TTC TGG ACT GTC ATT CCC 1300Val Thr Ala Leu Val Lys Glu Thr Leu Arg Phe Trp Thr Val Ile Pro355 360 365ATC TGT CTG CCT AGA GAA AAC ACC AAG GAT ATT GTC TGG AAC GGA GCC 1348Ile Cys Leu Pro Arg Glu Asn Thr Lys Asp Ile Val Trp Asn Gly Ala370 375 380GTT ATC CCT AAG GGA ACG ACC TTT TTC ATG AAC GCC TAC GCT GCA GAC 1396Val Ile Pro Lys Gly Thr Thr Phe Phe Met Asn Ala Tyr Ala Ala Asp385 390 395TAC GAC GAA ACA CAC TTC ACC AAT CCA CAC GCC TTT GAA CCA GAA CGC 1444Tyr Asp Glu Thr His Phe Thr Asn Pro His Ala Phe Glu Pro Glu Arg400 405 410TAC CTC ACC GCC TCA TCT GAC GGC TCC GGC ACT CCA CAC TAC GGC TAC 1492Tyr Leu Thr Ala Ser Ser Asp Gly Ser Gly Thr Pro His Tyr Gly Tyr415 420 425 430GGC GCG GGC TCG CGC ATG GTACCTCCCC CACAACCCAC ATGTTATATA GACAAT 1546Gly Ala Gly Ser Arg Met435ACTG ATTTATTATG AAG TGC GCT GGC TCG CAT CTT GCG AAC CGC GAG CTC 1596Cys Ala Gly Ser His Leu Ala Asn Arg Glu Leu440 445TTC ACC GCT TAC GTC CGT CTG ATC ACA GCA TTT ACC ATG CAT CCA GCT 1644Phe Thr Ala Tyr Val Arg Leu Ile Thr Ala Phe Thr Met His Pro Ala450 455 460AAG AGG GCT GAG GAT CGG CCG ATC CTC GAT GCG ATT GAG TGT AAT GCG 1692Lys Arg Ala Glu Asp Arg Pro Ile Leu Asp Ala Ile Glu Cys Asn Ala465 470 475ATC CCG ACC GCT TTG ACG ACG GAG CCG AAG CCC TTC AAG GTT GGG TTT 1740Ile Pro Thr Ala Leu Thr Thr Glu Pro Lys Pro Phe Lys Val Gly Phe480 485 490 495AAA CCG AGA GAT CCT GTC TTG GTA AGG AAA TGG ATT GCG GAG AGT GAG 1788Lys Pro Arg Asp Pro Val Leu Val Arg Lys Trp Ile Ala Glu Ser Glu500 505 510GAG AGG ACG AAG CAC CTG AAT TAGTTTTTCT TTTCTTTCTT GCGTGCAAGT TAC 1842Glu Arg Thr Lys His Leu Asn515AGCGCAATTT ATACTTAGCT GGGACATGGT CGATTGGAGT ATACTGATTT CAGCAACAGC 1902GCAAATAAAA ATAAGGCAAC CAATAGAAAT GCAACAATAT GCAATCTCCC AAGACCATTA 1962AATGGTTGAT CAGATGATCC CAAG1986SEQ ID NO:2的资料序列的特征长度518个氨基酸类型氨基酸链数1构型线性分子类型肽原始来源构巢曲霉特征其它信息乙酸苯酯2-羟化酶的氨基酸序列特征其它信息分子量58495道尔顿序列描述SEQ ID NO:2Met Ser Leu Gln Thr Ile Gly Ile Ala Ala Val Ala Val Val Tyr5 10 15Phe Leu Ile Arg Tyr Phe Ash Arg Thr Asp Ile Pro Lys Ile Lys20 25 30Gly Leu Pro Glu Val Pro Gly Val Pro Ile Phe Gly Asn Leu Ile35 40 45Gln Leu Gly Asp Gln His Ala Thr Val Ala Gln Lys Trp Ala Lys50 55 60Lys Phe Gly Pro Val Phe Gln Val Arg Met Gly Asn Lys Arg Val65 70 75Val Phe Ala Asn Thr Phe Asp Ser Val Arg Gln Leu Trp Ile Lys80 85 90Asp Gln Ser Ala Leu Ile Ser Arg Pro Thr Phe His Thr Phe His95 100 105Ser Val Val Ser Ser Ser Gln Gly Phe Thr Ile Gly Thr Ser Pro110 115 120Trp Asp Glu Ser Cys Lys Arg Arg Arg Lys Ala Ala Ala Thr Ala125 130 135Leu Asn Arg Pro Ala Thr Gln Ser Tyr Met Pro Ile Ile Asp Leu140 145 150Glu Ser Met Ser Ser Ile Arg Glu Leu Leu Arg Asp Ser Ala Asn155 160 165Gly Thr Met Asp Ile Asn Pro Thr Ala Tyr Phe Gln Arg Phe Ala170 175 180Leu Asn Thr Ser Leu Thr Leu Asn Tyr Gly Ile Arg Ile Glu Gly185 190 195Asn Val Asn Asp Glu Leu Leu Arg Glu Ile Val Asp Val Glu Arg200 205 210Gly Val Ser Asn Phe Arg Ser Thr Ser Asn Gln Trp Gln Asp Tyr215 220 225Ile Pro Leu Leu Arg Ile Phe Pro Lys Met Asn Arg Glu Ala Glu230 235 240Glu Phe Arg Val Arg Arg Asp Lys Tyr Leu Thr Tyr Leu Leu Asp245 250 255Val Leu Lys Asp Arg Ile Ala Lys Gly Thr Asp Lys Pro Cys Ile260 265 270Thr Gly Asn Ile Leu Lys Asp Pro Glu Ala Lys Leu Asn Asp Ala275 280 285Glu Ile Lys Ser Ile Cys Leu Thr Met Val Ser Ala Gly Leu Asp290 295 300Thr Val Pro Gly Asn Leu Ile Met Gly Ile Ala Tyr Leu Ala Ser305 310 315Glu Asp Gly Gln Arg Ile Gln Lys Arg Ala His Asp Glu Ile Met320 325 330Lys Val Tyr Pro Asp Gly Asp Ala Trp Glu Lys Cys Leu Leu Glu335 340 345Glu Lys Val Pro Tyr Val Thr Ala Leu Val Lys Glu Thr Leu Arg350 355 360Phe Trp Thr Val Ile Pro Ile Cys Leu Pro Arg Glu Asn Thr Lys365 370 375Asp Ile Val Trp Asn Gly Ala Val Ile Pro Lys Gly Thr Thr Phe380 385 390Phe Met Asn Ala Tyr Ala Ala Asp Tyr Asp Glu Thr His Phe Thr395 400 405Asn Pro His Ala Phe Glu Pro Glu Arg Tyr Leu Thr Ala Ser Ser410 415 420Asp Gly Ser Gly Thr Pro His Tyr Gly Tyr Gly Ala Gly Ser Arg425 430 435Met Cys Ala Gly Ser His Leu Ala Asn Arg Glu Leu Phe Thr Ala440 445 450Tyr Val Arg Leu Ile Thr Ala Phe Thr Met His Pro Ala Lys Arg455 460 465Ala Glu Asp Arg Pro Ile Leu Asp Ala Ile Glu Cys Asn Ala Ile470 475 480Pro Thr Ala Leu Thr Thr Glu Pro Lys Pro Phe Lys Val Gly Phe485 490 495Lys Pro Arg Asp Pro Val Leu Val Arg Lys Trp Ile Ala Glu Ser500 505 510Glu Glu Arg Thr Lys His Leu Asn515SEQ ID NO:3的资料序列的特征长度2558个碱基对类型核苷酸链数2构型线性分子类型基因组DNA假设没有反义链没有原始来源产黄青霉直接来源质粒pALP520基因组中的位置未知特征名称/关键词编码序列定位371…2094其它信息pahA基因序列描述SEQ ID NO:3CTCGAGAAGG TCTGTTGACA CGAGTCCACA AGATGTTGCG AAGTATATAA TATGAGAAAT 60GGATATACAG CGGAAAATTG AAGTTTCATT CCGCGGGGGC GGGGAACAAG AGGAAGCGCG 120GAATGAACAT TCCGTCTATG CGCGGTGGAG AGATCTTCGA ACTGGGGACT TGTGGACTTG 180GACCTATGAG AGAGCTGCCT TTACTGATTC TGGGACTTGT GGCCAATGAA ACATGTCATG 240GATGTTACAG CTTTCTTTAT GCGACTCTCT AAACTCGGAA ATATGCCGTA GCCGAAATGC 300AGGAAAGGCT GGGCTATAAG AGATGCATGC TCCCACCGAA CGTCTGCAAT TCCTTGTTTC 360ACTCTATATC ATG GCC ATC CAA ACA CTC GCA GTC GCC GTG ATC ACG GTG GTC412Met Ala Ile Gln Thr Leu Ala Val Ala Val Ile Thr Val Val5 10TAT TTC GTC ATT CGA TAC TTC AAC CGC ACT GAT ATC CCT AAG ATT AAA 460Tyr Phe Val Ile Arg Tyr Phe Asn Arg Thr Asp Ile Pro Lys Ile Lys15 20 25 30GGC CTC CCG GAG ATT CCT GGT ATA CCC ATA TTT GGC AAT CTA TTG CAG 508Gly Leu Pro Glu Ile Pro Gly Ile Pro Ile Phe Gly Asn Leu Leu Gln35 40 45CTA GGA GAT CAA CAT GCC ACA GTC ACG GGG AAA TGG GCA AAG AAA TTT 556Leu Gly Asp Gln His Ala Thr Val Thr Gly Lys Trp Ala Lys Lys Phe50 55 60GGC CCA GTT TTC CAA GTG CGC ATG GGA AAC AAG GTAAGTAATC AAATAATCTT 609Gly Pro Val Phe Gln Val Arg Met Gly Asn Lys65 70TTAAATCGGA CATTCTGATA ATCTAATGCC CTTTTAG CGC ATC GTG TTC GCC AAC 664Arg Ile Val Phe Ala Asn75GGC TTT GAC TCC GTT CGT CAA TTG TGG ATT AAG GAC TCG TCG GCT CTG 712Gly Phe Asp Ser Val Arg Gln Leu Trp Ile Lys Asp Ser Ser Ala Leu80 85 90 95ATC TCC CGC CCA ACT TTC CAC ACT TTC CAC AGC GTC GTC TCC AGT TCA 760Ile Ser Arg Pro Thr Phe His Thr Phe His Ser Val Val Ser Ser Ser100 105 110CAG GGC TTC ACG ATC GGA ACT TCC CCG TGG GAT GAT TCC TGT AAG AAA 808Gln Gly Phe Thr Ile Gly Thr Ser Pro Trp Asp Asp Ser Cys Lys Lys115 120 125CGT CGC AAG GCA GCT GCC ACT GCG CTG AAT CGA CCG GCC GTG CAA TCG 856Arg Arg Lys Ala Ala Ala Thr Ala Leu Asn Arg Pro Ala Val Gln Ser130 135 140TAT ATG CCC ATC ATC GAT CTT GAA TCC AAT TCC AGC ATC AAA GAA CTG 904Tyr Met Pro Ile Ile Asp Leu Glu Ser Asn Ser Ser Ile Lys Glu Leu145 150 155TAC CGG GAC AGC CAA AAT GGC AAA CGT GAT GTG AAT CCC ACT GCA TAC 952Tyr Arg Asp Ser Gln Asn Gly Lys Arg Asp Val Asn Pro Thr Ala Tyr160 165 170 175TTC CAG CGA TAC GCT TTC AAC ACC AGT TTG ACT TTG AAC TAT GGA TTC 1000Phe Gln Arg Tyr Ala Phe Asn Thr Ser Leu Thr Leu Asn Tyr Gly Phe180 185 190CGC ATC GAG GGC AAT GTG GAT GAT ACG CTG CTG CAT GAG ATT GTG GAT 1048Arg Ile Glu Gly Asn Val Asp Asp Thr Leu Leu His Glu Ile Val Asp195 200 205GTG GAG CGT GGT GTG TCC AAC TTC CGC AGC ACT TCG AAC AAC TGG CAG 1096Val Glu Arg Gly Val Ser Asn Phe Arg Ser Thr Ser Asn Asn Trp Gln210 215 220GAC TAC ATT CCC CTA TTG CGC ATT TTC CCC AAG ATG AAC AAT GAG GCC 1144Asp Tyr Ile Pro Leu Leu Arg Ile Phe Pro Lys Met Asn Asn Glu Ala225 230 235GCT GAC TTC CGG GGT CGC CGT GAT AAA TAT CTG ACC TAC TTG CTC GAT 1192Ala Asp Phe Arg Gly Arg Arg Asp Lys Tyr Leu Thr Tyr Leu Leu Asp240 245 250 255ATG CTC AAG GAT CGA ATC GCC AAG GGA ACC GAT AAG CCT TGC ATC ACT 1240Met Leu Lys Asp Arg Ile Ala Lys Gly Thr Asp Lys Pro Cys Ile Thr260 265 270GGT AAT ATC TTG AAG GAT CCC GAG GCT AAG CTG AAT GAT G GTGAGTTACA 1290Gly Asn Ile Leu Lys Asp Pro Glu Ala Lys Leu Asn Asp275 280AAATCTCGCG AAATCTTTGT GAATGTTGGT ATTGAGTACT CATCTATCGT CTAG CC 1346Ala285GAG GTG AAA TCG ATC TGT TTG ACT ATG GTG TCG GCT GGC CTT GAC ACC 1394Glu Val Lys Ser Ile Cys Leu Thr Met Val Ser Ala Gly Leu Asp Thr290 295 300GTT CCG GGC AAC TTG ATT ATG GGA ATT GCC TAC CTG GCA TCT GAA GAC 1442Val Pro Gly Asn Leu Ile Met Gly Ile Ala Tyr Leu Ala Ser Glu Asp305 310 315GGC CAA AGA ATT CAG AAA AAG GCC TAT GAT GCA ATC ATG GAG GTA TAC 1490Gly Gln Arg Ile Gln Lys Lys Ala Tyr Asp Ala Ile Met Glu Val Tyr320 325 330CCG GAC GGC GAT GCT TGG GAG AAA TGT TTG GTG GAG GAG AAG GTC CCT 1538Pro Asp Gly Asp Ala Trp Glu Lys Cys Leu Val Glu Glu Lys Val Pro335 340 345TAT GTG ACG GCA CTG GTC AAG GAG GTC TTG CGC TTC TGG ACG GTC ATT 1586Tyr Val Thr Ala Leu Val Lys Glu Val Leu Arg Phe Trp Thr Val Ile350 355 360 365CCT ATT TGT CTG CCA CGC GAG AGC ACC AAG GAT ATC CAG TGG AAT GGA 1634Pro Ile Cys Leu Pro Arg Glu Ser Thr Lys Asp Ile Gln Trp Asn Gly370 375 380GCT ACA ATC CCT GCC GGG ACG ACC TTT TTC ATG GTATGTTGCG CCTTGCTTCT 1687Ala Thr Ile Pro Ala Gly Thr Thr Phe Phe Met385 390GTCCCTTTCG GGACGTTGCT AACAGGATCT GATAG AAT GTT TGG GCT GCC GAT1740Asn Val Trp Ala Ala Asp395TAC GAT GAA GAT CAC TTT AAG GAT GCC GAT AAA TTC ATC CCG GAG CGT 1788Tyr Asp Glu Asp His Phe Lys Asp Ala Asp Lys Phe Ile Pro Glu Arg400 405 410TAT TTG GAG GCC AGT GAG GGT GCA GGC ACT CCA CAC TAT GCA TAT GGA 1836Tyr Leu Glu Ala Ser Glu Gly Ala Gly Thr Pro His Tyr Ala Tyr Gly415 420 425 430GCG GGA TCA CGT ATG TGT GCA GGC TCA CAT CTC GCC AAT CGC GAG CTG 1884Ala Gly Ser Arg Met Cys Ala Gly Ser His Leu Ala Asn Arg Glu Leu435 440 445TTC ACT GCT TTT ATC CGC CTC GTC ACT GCT TTC AAC ATG CAC ACG GCG 1932Phe Thr Ala Phe Ile Arg Leu Val Thr Ala Phe Asn Met His Thr Ala450 455 460AAG GAG ACG GCC GAC CGA CCG ATT CTG AAT GCA ATT GAG TGC AAT TTG 1980Lys Glu Thr Ala Asp Arg Pro Ile Leu Asn Ala Ile Glu Cys Asn Leu465 470 475ATT CCG ACA GCC TTG ACA ACC GAG CCG AAG CCA TTC AAG GTT GGC TTT 2028Ile Pro Thr Ala Leu Thr Thr Glu Pro Lys Pro Phe Lys Val Gly Phe480 485 490AGT GCA CGC GAC CCT AAG AAG CTT GAG CAG TGG ATT GCT GAG AGC GAT 2076Ser Ala Arg Asp Pro Lys Lys Leu Glu Gln Trp Ile Ala Glu Ser Asp495 500 505 510GAA CGG ACC AAA GAT CTA TAAGAGGAAG TTTTATCTGA TATGATTCCC TTTTTTTTTTGlu Arg Thr Lys Asp Leu515TCGGAGGCTA TTTATGTATC TACTTGAATA TATGTGAAAT AAAGGCAATG AAGTATAGAT 2194ATAGACCTGC CCAGGTGAGA CCTACATGTA TGTAATCGAC GTCTCCCAGT ACCTATTTAG 2254GAACCGAATA GAAATTTGAG TGATGAAGGG TGAAGAATAA CCTCAGAGAA CATAGGTCTA 2314CTAAGATCTG CTAATTCTTA GACTCCTTTC CCTGAATTAT TGCCAATTTC CCCAGTTGTC 2374TCTCTCCTCT ATGACTCCCG GCCTTGTCAC ACCGGCGGAA TCTCCCCGCA TTTTCCTCGA 2434CCTCACCCTT TTCTTCCTCT TCACCCTCTC CCCATCCACT TGAAATGAAC CTCTGATCGC 2494AATCAATTGC ATCCCGAAGT CATTTTGGAT GATGAATAAT CCGCAGATGT ACCCTGTCCT 2554CGAG 2558SEQ ID NO:4的资料序列的特征长度516个碱基对类型氨基酸链数1构型线性分子类型肽特征其它信息乙酸苯酯2-羟化酶的氨基酸序列特征其它信息分子量58112道尔顿序列的描述SEQ ID NO:4Met Ala Ile Gln Thr Leu Ala Val Ala Val Ile Thr Val Val Tyr Phe1 5 10 15Val Ile Arg Tyr Phe Asn Arg Thr Asp Ile Pro Lys Ile Lys Gly Leu20 25 30Pro Glu Ile Pro Gly Ile Pro Ile Phe Gly Asn Leu Leu Gln Leu Gly35 40 45Asp Gln His Ala Thr Val Thr Gly Lys Trp Ala Lys Lys Phe Gly Pro50 55 60Val Phe Gln Val Arg Met Gly Asn Lys Arg Ile Val Phe Ala Asn Gly65 70 75 80Phe Asp Ser Val Arg Gln Leu Trp Ile Lys Asp Ser Ser Ala Leu Ile85 90 95Ser Arg Pro Thr Phe His Thr Phe His Ser Val Val Ser Ser Ser Gln100 105 110Gly Phe Thr Ile Gly Thr Ser Pro Trp Asp Asp Ser Cys Lys Lys Arg115120 125Arg Lys Ala Ala Ala Thr Ala Leu Asn Arg Pro Ala Val Gln Ser Tyr130 135 140Met Pro Ile Ile Asp Leu Glu Ser Asn Ser Ser Ile Lys Glu Leu Tyr145 150 155 160Arg Asp Ser Gln Asn Gly Lys Arg Asp Val Asn Pro Thr Ala Tyr Phe165 170 175Gln Arg Tyr Ala Phe Asn Thr Ser Leu Thr Leu Asn Tyr Gly Phe Arg180 185 190Ile Glu Gly Asn Val Asp Asp Thr Leu Leu His Glu Ile Val Asp Val195 200 205Glu Arg Gly Val Ser Asn Phe Arg Ser Thr Ser Asn Asn Trp Gln Asp210 215 220Tyr Ile Pro Leu Leu Arg Ile Phe Pro Lys Met Asn Asn Glu Ala Ala225 230 235 240Asp Phe Arg Gly Arg Arg Asp Lys Tyr Leu Thr Tyr Leu Leu Asp Met245 250 255Leu Lys Asp Arg Ile Ala Lys Gly Thr Asp Lys Pro Cys Ile Thr Gly260 265 270Asn Ile Leu Lys Asp Pro Glu Ala Lys Leu Asn Asp Ala Glu Val Lys275 280 285Ser Ile Cys Leu Thr Met Val Ser Ala Gly Leu Asp Thr Val Pro Gly290 295 300Asn Leu Ile Met Gly Ile Ala Tyr Leu Ala Ser Glu Asp Gly Gln Arg305 310 315 320Ile Gln Lys Lys Ala Tyr Asp Ala Ile Met Glu Val Tyr Pro Asp Gly325 330 335Asp Ala Trp Glu Lys Cys Leu Val Glu Glu Lys Val Pro Tyr Val Thr340 345 350Ala Leu Val Lys Glu Val Leu Arg Phe Trp Thr Val Ile Pro Ile Cys355 360 365Leu Pro Arg Glu Ser Thr Lys Asp Ile Gln Trp Asn Gly Ala Thr Ile370 375 380Pro Ala Gly Thr Thr Phe Phe Met Asn Val Trp Ala Ala Asp Tyr Asp385 390 395 400Glu Asp His Phe Lys Asp Ala Asp Lys Phe Ile Pro Glu Arg Tyr Leu405 410 415Glu Ala Ser Glu Gly Ala Gly Thr Pro His Tyr Ala Tyr Gly Ala Gly420 425 430Ser Arg Met Cys Ala Gly Ser His Leu Ala Asn Arg Glu Leu Phe Thr435 440 445Ala Phe Ile Arg Leu Val Thr Ala Phe Asn Met His Thr Ala Lys Glu450 455 460Thr Ala Asp Arg Pro Ile Leu Asn Ala Ile Glu Cys Asn Leu Ile Pro465 470 475 480Thr Ala Leu Thr Thr Glu Pro Lys Pro Phe Lys Val Gly Phe Ser Ala485 490 495Arg Asp Pro Lys Lys Leu Glu Gln Trp Ile Ala Glu Ser Asp Glu Arg500 505 510Thr Lys Asp Leu51权利要求
1.在微生物中使一些基因失活的方法,这些基因编码乙酸苯酯分解代谢酶,该酶与青霉素生物合成酶竞争乙酸苯酯,该方法包括通过同源重组整合转化,这种重组发生在至少一个外源DNA化合物和至少待失活基因的部分序列之间。
2.根据权利要求1所述的方法,其中转化体DNA化合物是环状分子,至少含有一个待失活的基因的表达片断。
3.根据权利要求1所述的方法,其中转化体DNA化合物是线性分子,至少含有一个不包括在待失活基因的序列中的DNA片断,但至少含有一个转化标记,该标记中断其编码序列。
4.根据前面几项权利要求所述的方法,其中转化体DNA分子,含有全部或部分待失活基因的序列的拷贝,失活的方法是突变,优选地是读码框架移动突变,没有有义或缺失,这将导致所述基因失去功能性表现型。
5.根据前面的任何一项权利要求所述的方法,其中能够产生青霉素G或V的微生物是转化的目标,在转化中基因失活。
6.根据权利要求5所述的方法,其中产生青霉素G或V的微生物是真菌。
7.根据权利要求1到6所述的方法,其中转化的微生物是构巢曲霉。
8.根据权利要求1到6所述的方法,其中转化的微生物是产黄青霉。
9.根据权利要求1到7所述的方法,其中所用的转化体DNA化合物可以全部或部分地包括在载体中,优选地在质粒pPhacA::argB中。
10.根据权利要求1到6和8所述的方法,其中所用的转化体DNA化合物可以全部或部分地包括在载体中,优选地在质粒pALP696中。
11.根据权利要求1到7和9所述的方法,其中失活的基因通过SEQ IDNO:1,它的突变基因序列和/或同源基因代表。
12.根据权利要求11所述的方法,其中失活的基因编码SEQ ID NO:2表示的多肽,或表达P450乙酸苯酯2-羟化酶活性的相似的序列。
13.根据权利要求1到6,8和10所述的权利要求,其中失活的基因通过SEQ ID NO:3,它的突变基因序列和/或同源基因代表。
14.根据权利要求13所述的方法,其中失活基因编码SEQ ID NO:4代表的多肽或表达P450乙酸苯酯2-羟化酶活性的相似的序列。
15.构巢曲霉的转化菌株和起源于该菌株的突变体,该菌株至少掺入了一个外源DNA化合物,该DNA化合物包括在至少一个基因的截短的,不完全的或失活的序列中,该基因编码乙酸苯酯分解代谢酶,在它同源重组整合后,使内源基因失活。
16.根据权利要求15所述的构巢曲霉的转化菌株,其中待失活的基因编码传导乙酸苯酯羟化作用的酶。
17.根据权利要求15和16所述的构巢曲霉的转化菌株,其中失活基因是phacA和在SEQ ID NO:1中,它的突变基因序列和同源基因叙述的该基因的序列和侧接区。
18.根据权利要求17所述的构巢曲霉的转化菌株,其中失活基因与phacA同源,来源不是构巢曲霉,该基因与构巢曲霉的phacA基因的DNA序列的同源性足以介导与构巢曲霉的内源基因的同源重组。
19.根据权利要求15到18所述的构巢曲霉的转化菌株,其中失活的基因编码蛋白质序列SEQ ID NO:2代表的多肽,或表达P450乙酸苯酯2-羟化酶活性的相似的序列。
20.根据权利要求15到19所述的转化菌株,特征是它包括在构巢曲霉CECT20195纯化菌株,它的突变体和/或转化衍生物中。
21.如图6的限制图谱所示,失活构巢曲霉的phcA基因的质粒pPhacA::argB,它包括在质粒pUC18中,该质粒含有6.8kb EcoRⅠ插入片断,该3.2kb片断含有构巢曲霉的phacA基因,该基因通过插入3.2kb的片断而失活,该片断含有构巢曲霉的argB基因。
22.产黄青霉的转化菌株和起源于该菌株的突变体,含有包括在截短,不完全或失活的基因的序列中的DNA化合物,该基因编码乙酸苯酯分解代谢酶,并在通过同源重组整合该基因后,使内源基因失活。
23.根据权利要求22所述的产黄青霉的转化菌株,其中待失活的基因编码传导乙酸苯酯羟化作用的酶。
24.根据权利要求22和23所述的产黄青霉的转化菌株,其中基因是phcA和在该基因SEQ ID NO:3,它的突变基因序列和/或同源基因所述序列和它的侧接区。
25.根据权利要求22到24所述的产黄青霉的转化菌株,其中失活的基因编码蛋白质序列SEQ ID NO:4代表的多肽,或表达确定的P450乙酸苯酯2-羟化酶活性的相似序列。
26.根据权利要求24所述的产黄青霉的转化菌株,其中该基因是构巢曲霉的phacA基因或任何其它从不同于产黄青霉的来源中分离的同源DNA化合物,它与产黄青霉的pahA的DNA序列的同源性足以传导与产黄青霉的内源基因的同源重组。
27.图7限制图谱所表明的失活产黄青霉pabA基因的质粒pALP696,该质粒包括质粒pBC KS+,pBC KS+包含具有产黄青霉的pahA基因的7.9kb的SaⅡ插入片断,然后通过插入2.0kb含有产黄青霉的gdh启动子控制下表达的S.hindustanus的bleR基因使PahA基因失活。
全文摘要
本发明涉及一种使编码乙酸苯酯分解代谢酶的基因失活的方法和含有它的质粒以及其转化的菌株。该方法选择性地用于构巢曲霉pahcA基因及产黄青霉的pahA基因。这两种基因分别编码同青霉素合成酶竞争底物的竞争酶。使这两种酶不表达将有利于这种抗生素的合成,即在青霉素生产中在培养其中加入少量的乙酸苯酯即可增加青霉素的产量。
文档编号C12R1/82GK1226932SQ9880060
公开日1999年8月25日 申请日期1998年4月17日 优先权日1997年4月18日
发明者何塞·曼努埃尔·费尔南德斯·卡农, 马特·罗德里格斯·塞斯, 布鲁诺·戴伊斯·加西亚, 何塞·路易斯·巴雷多·富恩特, 亚历杭德罗·维塔莱·阿尔瓦, 福兰西斯科·塞托马尔多纳多, 米格尔·安赫尔·佩尼亚尔瓦·索托, 何塞·曼努埃尔·明戈特·阿森桑 申请人:抗生素有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1