生产己二酰基-7-adca的菌株的制作方法

文档序号:580842阅读:373来源:国知局
专利名称:生产己二酰基-7-adca的菌株的制作方法
技术领域
本发明涉及生产N-己二酰化的β-内酰胺化合物的微生物菌株,它们的构建方 法,以及鉴定与过表达涉及将来自发酵培养基的己二酸并入N-己二酰化的β -内酰胺化合 物的基因和酶的方法。
背景技术
半合成的β -内酰胺抗生素(SSA’ S)从β -内酰胺中间产物开始以工业规模生 产,例如6-氨基青霉烷酸(6-ΑΡΑ)、7-氨基-去乙酰氧基-头孢烷酸(7-ADCA)、7-氨基头 孢烷酸(7-ACA)和7-氨基-3-氯-3-头孢烯-4-羧酸酯/盐(7-ACCA)、7_氨基_3_[ (Z/ E)-l_丙烯-1-基]-3-头孢烯-4-羧酸酯/盐(7-PACA)、7-氨基去乙酰基头孢烷酸 (7-ADAC)、7_氨基-3-氨甲酰基氧甲基-3-头孢烯-4-羧酸(7-ACCCA)等等。第一代7-ADCA制品衍生自PenG,其中5_元青霉烯环到6_元头孢烯环的扩环 和随后苯乙酰基-7-ADCA苯乙酸侧链的切割均使用化学反应进行。下一代7-ADCA制品 仍然从PenG获得,但是在化学扩环之后,使用合适的(青霉素)酰基酶酶促切除苯乙酰 基-7-ADCA的苯乙酸侧链。已开发出其它方法,其中使用合适的扩环酶体外进行PenG到苯 乙酰基-7-ADCA的扩环,但是这些方法仅具有很低的工业重要性。最近期和最精致的7-ADCA生产方法包括培养下述Penicillium chrysogenum, 所述Penicillium chrysogenum用编码合适扩环酶的基因转化并表达所述基因。该经改 造的Penicillium chrysogenum菌株在存在己二酸作为侧链前体时在发酵管中生长时, 生产并分泌己二酰基-7-ADCA-见W093/05158。在该生产过程中,从发酵液中回收己二酰 基-7-ADCA,对其进行合适的酰基酶处理,从而切除己二酸侧链,之后进一步纯化、结晶和 干燥由此获得的7-ADCA。其它侧链前体已公开于W095/0414W2-(羧乙基硫代)乙酸和 3_(羧甲基硫代)_丙酸)、W095/04149Q-(羧乙基硫代)丙酸)、W096/38580 (苯乙酸)和 W098/048034和W098/048035 (多种二羧酸)中。扩环酶负责多种N-酰基化青霉烷酸5元 环的扩环,从而得到相应的N-酰化去乙酰氧基头孢烷酸。然而,除了被用作侧链前体以外,己二酸盐可以被降解并在初级代谢中被用作碳 源。这由 Robin et al. (Appl. Microbiol. Biotechnol. (2001) 57,357-362))在使用蔗糖 作为主要碳源的分批培养物中证实。耗尽(源自蔗糖的)葡萄糖和果糖后,开始形成己二 酰基-6-APA和己二酰基-7-ADCA,并且在这一阶段中,仅至多2%的己二酸被并入β -内 酰胺化合物中,而剩余部分被用作碳源。作者提出,由于己二酸和脂肪酸之间的相似性, 己二酸降解很可能通过β-氧化而发生。在较晚的研究中,Thykaer et al. (Metabolic Engineering(2002) ,4,151-158)以生产己二酰基-7-ADCA 的Penicillium chrysogenum菌 株的代谢网络分析为基础得出下述结论己二酸盐降解通过氧化酶发生在微体(乙醛 酸循环体)中,而不是胞质溶胶或线粒体中。通常(丝状)真菌和酵母中,特别是Penicillium chrysogenum中,在细胞内定位、 涉及的酶以及氧化通路在微生物总体代谢中的作用方面,氧化通路的本质仍然是 不清楚的。为了减少己二酸降解,Thykaer et al. (2002)已提出缺失负责己二酸盐降解的酶,然而没有将任何此类酶指定为合适的候选者。因为与葡萄糖或甘油相比,己二酸盐是昂贵的,所以己二酸盐的降解是不想要的。 取而代之,从工业生产工艺的观点来看,人们非常希望己二酸盐向N-己二酰化的β -内酰 胺化合物的并入产率(incorporation yield)接近100%。我们惊讶地发现,在能够生产N-己二酰化的β -内酰胺化合物的微生物菌株中过 表达编码己二酰基-CoA形成酶的基因导致突变体微生物菌株具有经改进的由来自培养基 的己二酸进入N-己二酰化的β -内酰胺化合物的并入。发明详述本发明第一方面提供了用于鉴定能够生产N-己二酰化的β -内酰胺化合物的微 生物菌株的一个或多个基因的方法,所述基因编码涉及在包含己二酸的培养基中培养时微 生物菌株将来自培养基的己二酸并入N-己二酰化的β -内酰胺化合物的一种或多种酶。将 来自培养基的己二酸并入N-己二酰化的β-内酰胺化合物可包括以下步骤1.将己二酸从培养基转运至微生物细胞内部。2.通过酶,例如CoA连接酶(EC 6. 2. 1. xx)或CoA-转移酶(EC2. 8. 3. xx),将细胞 内己二酸转化成己二酰基-CoA。3.通过酶酰基辅酶A 异青霉素N酰基转移酶(EC 2. 3. 1. 164),将来自己二酰 基-CoA的己二酰基片段转移至异青霉素N,得到己二酰基-6-APA。4.任选地,可以借助于扩环酶(EC 1. 14. 20. 1)将己二酰基_6_APA转化成己二酰 基-7-ADCA。用于鉴定微生物菌株的编码涉及将来自培养基的己二酸并入N-己二酰化的 β-内酰胺化合物的一种或多种酶的一个或多个基因的方法可包括以下步骤a.选择涉及将酸活化成各自酰基-CoA化合物的一个或多个已知基因的核苷酸序 列和/或任选地由所述基因编码的一个或多个已知酶的氨基酸序列;b.使用从步骤(a)中选择的序列作为BLAST搜索中的探针,用于在能够生产N-己 二酰化的内酰胺化合物的微生物菌株的可获得的核苷酸或氨基酸序列中鉴定同源序 列。在一个优选的实施方案中,编码涉及将来自培养基的己二酸并入N-己二酰化的 内酰胺化合物的一种或多种酶的基因可以选自由以下组成的组编码能够催化细胞内
己二酸转化成己二酰基-CoA的酶(例如CoA-连接酶和CoA-转移酶)的基因。CoA-连接酶(EC 6. 2. 1. xx)优选地具有合成二羧酸(如草酸、丙二酸、琥珀酸、戊 二酸、羧基-甲基-硫代-丙酸、硫代-二-丙酸、反式-β -氢粘康酸和/或己二酸)的 CoA-衍生物的能力。高度优选的CoA-连接酶(EC 6. 2. 1. xx)具有合成己二酰基-CoA的能 力。CoA-转移酶(EC 2. 8. 3. xx)优选地具有合成二羧酸(如草酸、丙二酸、琥珀酸、 戊二酸和/或己二酸)的能力。高度优选的CoA-转移酶(EC2.8.3.XX)具有合成己二酰 基-CoA的能力。在一个优选的实施方案中,所选择的序列(探针)是已知的基因核苷酸序列,或已 知的酶氨基酸序列(任选地由所述基因编码),并且可选自(但不限于)由以下基因组成的 组
探针A.来自 Saccharomyces cerevisiae 的乙酰-辅酶 A 合成酶(EC6. 2. 1. 1) (Entrez 登记号 AAB35143)。探针B.来自 Penicillium chrysogenum 的苯乙酸-CoA 连接酶(EC6. 2. 1. 30) (Entrez 登记号 CAA04820)。探针C.来自Saccharomyces cerevisiae的极长链脂肪酰基-CoA合酶 (EC6. 2. 1. 3) (Entrez 登记号 CAA84983)探针D.来自 Aspergillus oryzae 的酰基-CoA 合成酶(Entrez 登记号 Q2UHE5)探针E.来自Homo sapiens的琥珀酰基-CoA :3_酮酸-辅酶A转移酶A亚基(EC 2. 8. 3. 5) (Entrez 登记号 BAB40810)探针F.来自 Escherichia coli 的甲酰-辅酶-A 转移酶(EC 2. 8. 3. 2) (Entrez 登记号P69902)在一个优选的实施方案中,所述方法利用来自&iccharomyces cerevisiae的乙酰 基-辅酶A合成酶(EC 6. 2. 1. 1) (Entrez登记号AAB35143)的氨基酸序列作为探针(探针 A)和 / 或来自 Penicillium chrysogenum 的苯乙酸-CoA 连接酶(EC 6. 2. 1. 30) (Entrez 登 记号CAA04820)的氨基酸序列作为探针(探针B)。就本发明的目的而言,使用BLAST算法鉴定同源序列(Altschul, et al.,1990, J. Mol. Biol. 215 :403-410)。用于进行BLAST分析的软件是公众可以通过National Center for Biotechnology Information (http://www. ncbi. nlm. nih. gov/)获得的。BLAST 算 法参数W、T和X确定比对的灵敏度和速度。BLAST程序使用下述作为默认词长(W)ll、 BL0SUM62 评分矩阵(见 Henikoff&HenikofT,Proc. Natl. Acad. Sci. USA89 10915 (1989))、 比对(B) 50、预期(E) 10、M= 5、N = -4和并比较两条链。除了上述本发明的方法以外,可以基于在含有己二酸的培养基中培养亲本菌株时 基因的转录水平与在不含己二酸的对照培养基中培养亲本菌株时基因的转录水平的比例 (本文中定义为“己二酸盐/对照”比例),来进一步选择编码涉及将来自培养基的己二酸并 入N-己二酰化的内酰胺化合物的的一种或多种酶的基因。优选地,此类基因具有大于 1,优选地>2,优选地>3,优选地>4,优选地>5,优选地> 10,优选地> 15,优选地>20, 优选地> 30,优选地> 40,优选地大于> 50,优选地> 60,优选地> 70,优选地> 80,最优 选地彡90的“己二酸盐/对照”比例。作为第二对照,可以测定在含有苯乙酸的培养基中 培养亲本菌株时基因的转录水平与在不含苯乙酸的对照培养基中培养亲本菌株时基因的 转录水平的比例(称作“ΡΑΑ/对照”比例)。可以通过用“己二酸盐/对照”比例除以“ΡΑΑ/对照”比例从而得到“己二酸盐/ ΡΑΑ”比例,来计算第三比例。优选地,本发明的基因具有彡1,优选地彡2,优选地彡3,优选 地> 4,优选地> 5,优选地> 10,优选地> 15,优选地> 20,优选地> 30,优选地> 40,优 选地大于> 50,优选地> 60,优选地> 70,优选地> 80,最优选地> 90的“己二酸盐/ΡΑΑ” 比例。优选的基因将组合高“己二酸盐/对照”比例与低“ΡΑΑ/对照”比例。例如,具有50 左右“己二酸盐/对照”比例和10左右“ΡΑΑ/对照”比例(即己二酸盐/PAA为5)的基因 比己二酸盐/对照比例在50左右且PAA/对照比例在50左右(即己二酸盐/PAA为1)的 基因更加优选。本发明第二方面中提供了编码涉及将来自培养基的己二酸并入N-己二酰化的β -内酰胺化合物的多肽的基因。优选地,编码涉及将来自培养基的己二酸并入N-己二酰 化的β -内酰胺化合物的一种或多种酶的基因可选自由以下组成的组编码能够催化细胞 内己二酸转化成己二酰基-CoA的酶(例如CoA-连接酶和CoA-转移酶)的基因。在一个实施方案中,编码是具有CoA-连接酶(EC 6. 2. 1. xx)活性的酶的多肽的基 因, 可具有选自下组的基因组核苷酸序列,所述组由以下组成Pcl3gl4420(SEQ ID No 1) ;Pc21g22010(SEQ ID No 2) ;Pc22g20270(SEQ ID No 3) ;Pc22g00960(SEQ ID No: 4) ;Pcl2g05520(SEQ ID No 5) ;Pcl3gl2270(SEQ ID No 6) ;Pcl8g05710(SEQ ID No 7);
Pc20gl3500(SEQIDNo8);Pcl3g01890(SEQIDNo9) ;Pc20gl0840(SEQIDNo:10)Pcl3g05130(SEQIDNo:11);Pcl3gl0810(SEQIDNo12) ;Pc22g06680(SEQIDNo:13)Pc22gl4900(SEQIDNo:14);Pc22gl6410(SEQIDNo15) ;Pc21gl3540(SEQIDNo:16)Pc21g20650(SEQIDNo:17);Pc21g23730(SEQIDNo18) ;Pc21g21960(SEQIDNo:19)Pc22g24780(SEQIDNo:20);Pc06g01160(SEQIDNo21) ;Pcl2g09980(SEQIDNo:22)Pcl5g00420(SEQIDNo 23);Pc21g07810(SEQIDNo 24)和Pc21g09470(SEQ ID No25)
或·可具有选自下组的相应的cDNA核苷酸,所述组由以下组成SEQ ID No :32 ;SEQ ID No 33 ;SEQ ID No 34 ;SEQ ID No 35 ;SEQ ID No 36 ;SEQ ID No 37 ;SEQ ID No 38 ; SEQ ID No 39 ;SEQ ID No 40 ;SEQ ID No 41 ;SEQ ID No 42 ;SEQ ID No 43 ;SEQ ID No 44 ;SEQ ID No 45 ;SEQ ID No 46 ;SEQ ID No 47 ;SEQ ID No 48 ;SEQ ID No 49 ;SEQ ID No 50 ;SEQ ID No 51 ;SEQ ID No 52 ;SEQ ID No 53 ;SEQ ID No 54 ;SEQ ID No 55 ;SEQ ID No 56 ;·可编码选自下组的相应氨基酸序列,所述组由以下组成SEQ ID No :63 ;SEQ ID No 64 ;SEQ ID No 65 ;SEQ ID No 66 ;SEQ ID No 67 ;SEQ ID No 68 ;SEQ ID No 79 ;SEQ ID No 70 ;SEQ ID No 71 SEQ ID No 72 ;SEQ ID No 73 ;SEQ ID No 74 ;SEQ ID No 75 ; SEQ ID No 76 ;SEQ ID No 77 ;SEQ ID No 78 ;SEQ ID No 79 ;SEQ ID No 80 ;SEQ ID No 81 ;SEQ ID No82 ;SEQ ID No83 ;SEQ ID No 84 ;SEQ ID No 85 ;SEQ ID No 86 ;SEQ ID No 87 ;在第二个实施方案中,编码是具有CoA-转移酶(EC 2. 8. 3. xx)活性的酶的多肽的 基因, 可具有选自下组的基因组核苷酸序列,所述组由以下组成Pc20gl5639(SEQ ID No 26) ;Pcl3g02780(SEQ ID No :27) ;Pc22gl3680(SEQ ID No :28) ;Pc22g03940 (SEQ ID No 29) ;Pc 14g00590(SEQ ID No :30) ;Pcl6g00210(SEQ ID No :31)。·可具有选自下组的相应的cDNA核苷酸,所述组由以下组成SEQ ID No :57 ;SEQ ID No 58 ;SEQ ID No 59 ;SEQ ID No 60 ;SEQ ID No 61 ;SEQ ID No 62 ;·可编码选自下组的相应氨基酸序列,所述组由以下组成SEQ ID No :88 ;SEQ ID No 89 ;SEQ ID No 90 ;SEQ ID No 91 ;SEQ ID No92 ;SEQ ID No 93表1和表2展示了基因组核苷酸序列、cDNA序列和氨基酸序列的SEQ ID No如何 彼此相关。本发明的核苷酸序列不限于上文所列的序列,其还包括与所述序列“基本同源”的序列,前提是所述基因分别编码具有CoA-连接酶(EC6. 2. 1. xx)活性或CoA-转移酶(EC 2. 8. 3. xx)的酶。氨基酸序列不限于上文所列序列,而是还包括与所述序列“基本同源”的序列,前 提是具有此类氨基酸序列的多肽分别具有CoA-连接酶(EC6. 2. 1. xx)活性或CoA-转移酶 (EC 2. 8. 3. xx)活性。当序列1具有与序列2至少75 %,优选地至少80 %,优选地至少85 %,优选地至少 90 %,优选地至少95 %,仍然更优选地至少96 %,仍然更优选地至少97 %,仍然更优选地至 少98%和最优选地至少99%的同一性程度时,在本文中定义为一条序列(序列1)与另一 序列(序列幻“基本同源”。“基本同源”的所述定义适用于核苷酸序列以及氨基酸序列。本发明提供了编码CoA-连接酶(EC 6. 2. 1. xx)的以下基因1.具有SEQ ID No. 1中所示基因组核苷酸序列和SEQ ID No. 32中所示相应的 cDNA序列和SEQ ID No. 63中所示相应的氨基酸序列的Pcl3gl4420,以及与这些序列大于 阳%同源,更优选地与这些序列大于60 %,更优选地大于70 %,更优选地大于80 %,更优选 地大于90 %,更优选地大于95 %同源的序列。2.具有SEQ ID No. 2中所示基因组核苷酸序列和SEQ ID No. 33中所示相应的 cDNA序列和SEQ ID No. 64中所示相应的氨基酸序列的Pc21g22010,以及与这些序列大于 45 %同源,更优选地与这些序列大于50 %,更优选地大于60 %,更优选地大于70 %,更优选 地大于80 %,更优选地大于90 %,更优选地大于95 %同源的序列。3.具有SEQ ID No. 3中所示基因组核苷酸序列和SEQ ID No. 34中所示相应的 cDNA序列和SEQ ID No. 65中所示相应的氨基酸序列的Pc22g20270。4.具有SEQ ID No. 4中所示基因组核苷酸序列和SEQ ID No. 35中所示相应的 cDNA序列和SEQ ID No. 66中所示相应的氨基酸序列的Pc22g00960,以及与这些序列大于 70 %同源,更优选地与这些序列大于80 %,更优选地大于90 %,更优选地大于95 %同源的 序列。5.具有SEQ ID No. 5中所示基因组核苷酸序列和SEQ ID No. 36中所示相应的 cDNA序列和SEQ ID No. 67中所示相应的氨基酸序列的Pcl2g05520,以及与这些序列大于 85 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。6.具有SEQ ID No. 6中所示基因组核苷酸序列和SEQ ID No. 37中所示相应的 cDNA序列和SEQ ID No. 68中所示相应的氨基酸序列的Pcl3gl2270,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。7.具有SEQ ID No. 7中所示基因组核苷酸序列和SEQ ID No. 38中所示相应的 cDNA序列和SEQ ID No. 69中所示相应的氨基酸序列的Pcl8g05710,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。8.具有SEQ ID No. 8中所示基因组核苷酸序列和SEQ ID No. 39中所示相应的 cDNA序列和SEQ ID No. 70中所示相应的氨基酸序列的Pc20gl3500,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。9.具有SEQ ID No. 9中所示基因组核苷酸序列和SEQ ID No. 40中所示相应的 cDNA序列和SEQ ID No. 71中所示相应的氨基酸序列的Pcl3g01890,以及与这些序列大于 75 %同源,更优选地与这些序列大于80 %,更优选地大于95 %同源的序列。
10.具有SEQ ID No. 10中所示基因组核苷酸序列和SEQ ID No. 41中所示相应的 cDNA序列和SEQ ID No. 72中所示相应的氨基酸序列的Pc20gl0840,以及与这些序列大于 阳%同源,更优选地与这些序列大于60 %,更优选地大于70 %,更优选地大于80 %,更优选 地大于90 %,更优选地大于95 %同源的序列。11.具有SEQ ID No. 11中所示基因组核苷酸序列和SEQ ID No. 42中所示相应的 cDNA序列和SEQ ID No. 73中所示相应的氨基酸序列的Pcl3g05130,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。12.具有SEQ ID No. 12中所示基因组核苷酸序列和SEQ ID No. 43中所示相应的 cDNA序列和SEQ ID No. 74中所示相应的氨基酸序列的Pcl3gl0810,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。13.具有SEQ ID No. 13中所示基因组核苷酸序列和SEQ ID No. 44中所示相应的 cDNA序列和SEQ ID No. 75中所示相应的氨基酸序列的Pc22g06680。14.具有SEQ ID No. 14中所示基因组核苷酸序列和SEQ ID No. 45中所示相应的 cDNA序列和SEQ ID No. 76中所示相应的氨基酸序列的Pc22gl4900。15.具有SEQ ID No. 15中所示基因组核苷酸序列和SEQ ID No. 46中所示相应的 cDNA序列和SEQ ID No. 77中所示相应的氨基酸序列的Pc22gl6410,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。16.具有SEQ ID No. 16中所示基因组核苷酸序列和SEQ ID No. 47中所示相应的 cDNA序列和SEQ ID No. 78中所示相应的氨基酸序列的Pc21gl3540,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。17.具有SEQ ID No. 17中所示基因组核苷酸序列和SEQ ID No. 48中所示相应的 cDNA序列和SEQ ID No. 79中所示相应的氨基酸序列的Pc21g20650,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。18.具有SEQ ID No. 18中所示基因组核苷酸序列和SEQ ID No. 49中所示相应的 cDNA序列和SEQ ID No. 80中所示相应的氨基酸序列的Pc21g23730,以及与这些序列大于 85 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。19.具有SEQ ID No. 19中所示基因组核苷酸序列和SEQ ID No. 50中所示相应的 cDNA序列和SEQ ID No. 81中所示相应的氨基酸序列的Pc21g21960,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。20.具有SEQ ID No. 20中所示基因组核苷酸序列和SEQ ID No. 51中所示相应的 cDNA序列和SEQ ID No. 82中所示相应的氨基酸序列的Pc22g24780,以及与这些序列大于 70%同源,更优选地与这些序列大于80 %,更优选地大于90 %,更优选地大于95 %同源的 序列。21.具有SEQ ID No. 21中所示基因组核苷酸序列和SEQ ID No. 52中所示相应的 cDNA序列和SEQ ID No. 83中所示相应的氨基酸序列的Pc06g01160,以及与这些序列大于 65 %同源,更优选地与这些序列大于70 %,更优选地大于80 %,更优选地大于90 %,更优选 地大于95%同源的序列。22.具有SEQ ID No. 22中所示基因组核苷酸序列和SEQ ID No. 53中所示相应的 cDNA序列和SEQ ID No. 84中所示相应的氨基酸序列的Pcl2g09980,以及与这些序列大于45 %同源,更优选地与这些序列大于50 %,更优选地大于60 %,更优选地大于70 %,更优选 地大于80 %,更优选地大于90 %,更优选地大于95 %同源的序列。23.具有SEQ ID No. 23中所示基因组核苷酸序列和SEQ ID No. 54中所示相应的 cDNA序列和SEQ ID No. 85中所示相应的氨基酸序列的Pcl5g00420,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。24.具有SEQ ID No. 24中所示基因组核苷酸序列和SEQ ID No. 55中所示相应的 cDNA序列和SEQ ID No. 86中所示相应的氨基酸序列的Pc21g07810,以及与这些序列大于 70%同源,更优选地与这些序列大于80 %,更优选地大于90 %,更优选地大于95 %同源的 序列。25.具有SEQ ID No. 25中所示基因组核苷酸序列和SEQ ID No. 56中所示相应的 cDNA序列和SEQ ID No. 87中所示相应的氨基酸序列的Pc21g09470,以及与这些序列大于 70%同源,更优选地与这些序列大于80 %,更优选地大于90 %,更优选地大于95 %同源的 序列。本发明提供了编码CoA-转移酶(EC 2. 8. 3. xx)的以下基因26.具有SEQ ID No. 26中所示基因组核苷酸序列和SEQ ID No. 57中所示相应的 cDNA序列和SEQ ID No. 88中所示相应的氨基酸序列的Pc20gl5630,以及与这些序列大于 60 %同源,更优选地与这些序列大于70 %,更优选地大于80 %,更优选地大于90 %,更优选 地大于95%同源的序列。27.具有SEQ ID No. 27中所示基因组核苷酸序列和SEQ ID No. 58中所示相应的 cDNA序列和SEQ ID No. 89中所示相应的氨基酸序列的Pcl3g02780,以及与这些序列大于 85 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。28.具有SEQ ID No. 28中所示基因组核苷酸序列和SEQ ID No. 59中所示相应的 cDNA序列和SEQ ID No. 90中所示相应的氨基酸序列的Pc22gl3680,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。29.具有SEQ ID No. 29中所示基因组核苷酸序列和SEQ ID No. 60中所示相应的 cDNA序列和SEQ ID No. 91中所示相应的氨基酸序列的Pc22g03940,以及与这些序列大于 95%同源的序列。30.具有SEQ ID No. 30中所示基因组核苷酸序列和SEQ ID No. 61中所示相应的 cDNA序列和SEQ ID No. 92中所示相应的氨基酸序列的Pcl4g00590,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。31.具有SEQ ID No. 31中所示基因组核苷酸序列和SEQ ID No. 62中所示相应的 cDNA序列和SEQ ID No. 93中所示相应的氨基酸序列的Pcl6g00210,以及与这些序列大于 80 %同源,更优选地与这些序列大于90 %,更优选地大于95 %同源的序列。就本发明的目的而言,两条氨基酸序列之间的同源性是指两条序列之间相同的 氨基酸的百分比。使用BLAST算法测定同源性,所述BLAST算法在Altschul et al. (J. Mol. Biol. 215 :403-410(1990))中描述。用于进行BLAST分析的软件是公众可以通过 National Center for Biotechnology Information(http://www. ncbi. nlm. nih. gov/)获 得的。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLAST程序使用下述作为默认 词长(W) 1UBL0SUM62 评分矩阵(见 Henikoff & Henikoff,Proc. Natl. Acad. Sci. USA 89 10915 (1989))、比对(B) 50、预期(E) 10、M = 5、N = _4 和并比较两条链。
基本同源的多肽包括可由于天然等位基因变异或株系内变异而存在于来自不同 种群的细胞中或存在于种群中的多态现象。除了所述特定的氨基酸和/或DNA序列的来源 真菌以外,基本同源的多肽可还衍生自其它真菌,或者可以由人工设计和合成的DNA序列编码。 就本发明的目的而言,两条核苷酸序列之间的同源性是指两条序列之间相同的碱 基的百分比。与特定的DNA序列相关并通过遗传密码子简并性获得的DNA序列也是本发明 的一部分。同源物也可以包括全长序列的具有生物活性的片段。基本同源的多肽可仅含有特定氨基酸序列的一个或多个氨基酸的保守取代,或非 必需氨基酸的取代、插入或缺失。因此,非必需的氨基酸是在这些序列之一中可以被改变 而不显著改变生物功能的残基。例如,涉及如何制造表型沉默氨基酸取代的指南在Bowie, J.U.et al. , Science 247 :1306-1310(1990)中提供,其中作者指出存在两种研究氨基酸 序列对改变的耐受的途径。第一种方法依赖于进化过程,其中突变被自然选择接受或拒绝。 第二种途径使用基因工程在被克隆的基因的特定位置上引入氨基酸改变,并选择或筛选以 鉴定维持功能性的序列。如作者所述,这些研究解释了蛋白质惊人地耐受氨基酸取代。作 者还指出在蛋白质的某位置上何种改变可能是允许的。例如,大部分被埋藏的氨基酸残基 需要非极性侧链,而表面侧链通常很少有特征是保守的。其它这类表型沉默取代被描述于 Bowie et al和其中所引用的参考文献中。术语“保守取代”旨在表示下述取代,其中氨基酸残基被替换为具有相似侧链的氨 基酸残基。这些家族是本领域已知的,并包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸 和组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电的极性侧链的氨 基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性 侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨 酸)、具有β-支链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香族侧链的氨基酸 (例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。导致经改进的催化功能(即己二酸盐转化成为己二酰基-CoA)的本发明的氨基酸 序列的变体可以通过修饰本发明的相应基因来获得。此类修饰包括1.易错PCR,以引入随机突变,之后筛选获得的变体(基本如实施例4中所述),并 分离具有经改进的动力学特性的变体2.对编码己二酰基-CoA形成酶的基因的相关变体进行家族改组,之后筛选获得 的变体(基本如实施例4中所述),并分离具有经改进的动力学特性的变体导致提高的mRNA和/或蛋白质水平,导致更多酶活性(即己二酸盐转化成为己二 酰基-CoA)的本发明的基因的变体可以通过修饰所述基因的多核苷酸序列来获得。此类修 饰为1.以下述方式改进密码子选择,所述方式使得密码子(最优地)适应亲本微生物宿主。2.以下述方式改进密码子对选择,所述方式使得密码子(最优地)适应亲本微生 物宿主。3.对编码己二酰基-CoA形成酶的基因组信息添加稳定化序列,得到具有提高的半衰期的mRNA分子。用于分离具有改进的催化特性或提高的mRNA或蛋白质水平的变体的优选方法描 述于W003010183和W00301311中。优化亲本微生物菌株中密码子选择的优选方法描述于 PCT/EP2007/05594中。对编码己二酰基-CoA形成酶的基因基因添加稳定化元件的优选方 法描述于W02005059149中。本发明在第三方面提供了源自亲本微生物菌株的突变体微生物菌株,所述亲本微 生物菌株在包含己二酸的培养基中培养时能够生产N-己二酰基化的β -内酰胺化合物,其 特征是所述突变体微生物菌株与亲本微生物菌株相比,具有经改进的由来自培养基的己二 酸向N-己二酰化的β -内酰胺化合物的并入产率。并入产率在本文中被定义为相对于消耗的己二酸的总摩尔量,被并入N-己二酰 化的内酰胺化合物中的己二酸的摩尔百分比。消耗的己二酸的总量等于添加至发酵过 程中的己二酸的总摩尔量减去发酵过程后残余的己二酸的摩尔量。经改进的并入产率可以 被表述为突变体微生物菌株与亲本微生物菌株相比的相对改进。例如,当亲本微生物菌株 具有上文定义的5 %的并入产率而突变体微生物菌株具有6 %的并入产率时,突变体的经 改进的并入产率为20% (6/5*100-100)。优选地,本发明的突变体菌株具有至少5 %,更优选地至少7. 5%,更优选地至少 10 %,更优选地至少15 %,更优选地至少20 %,更优选地至少30 %,更优选地至少40 %,更 优选地至少50 %,更优选地至少60 %,更优选地至少70 %,更优选地至少80 %,更优选地至 少90 %,更优选地至少95 %,更优选地至少97 %,更优选地至少98 %,更优选地至少99 %, 更优选地至少100%的经改进的并入产率。能够获得的最大的经改进的并入产率取决于亲本微生物菌株的实际并入产率。当 亲本微生物菌株具有5%的并入产率且理论最大并入产率为100%时,则突变体微生物菌 株可具有1900% (100/5*100-100)的最大经改进的并入产率。类似地,当亲本微生物菌株 已经具有50%的并入产率并且理论最大并入产率为100%时,则突变体微生物菌株可具有 100% (100/50*100-100)的最大经改进的并入产率。在一个优选的实施方案中,前文概括的、通过前文所述的本发明方法鉴定的、编码 一个或多个涉及将来自培养基的己二酸并入N-己二酰化的β -内酰胺化合物的一种或多 种酶(优选地CoA-连接酶和/或CoA-转移酶)的本发明的一个或多个基因,与其中所述 基因未被过表达的亲本微生物菌株相比,在本发明的突变体微生物菌株中被过表达。基因的过表达在本文中被定义为下述基因表达,所述表达会导致突变体微生物菌 株中所述基因编码的酶的活性至少是亲本微生物中酶活性的1. 5倍;优选地,所述酶的活 性是亲本微生物中酶活性的至少2倍,更优选地至少3倍,更优选地至少4倍,更优选地至 少5倍,进一步更优选地至少10倍和最优选地至少20倍。由微生物菌株生产的β -内酰胺化合物可以是任何N-己二酰化的β -内酰胺,其 中所述β -内酰胺片段是青霉烯或头孢烯。优选的N-己二酰化的β -内酰胺化合物是之 前所列中间产物的己二酰基衍生物6-氨基青霉烷酸(6-APA)、7_氨基-去乙酰氧基-头 孢烷酸(7-ADCA)、7_氨基头孢烷酸(7-ACA)和7-氨基-3-氯-3-头孢烯-4-羧酸酯/盐 (7-ACCA)、7-氨基-3- [ (Z/E) 丙烯 基]_3_ 头孢烯-4-羧酸酯 / 盐(7-PACA)、7-氨基 去乙酰基头孢烷酸(7-ADAC)、7_氨基-3-氨甲酰基氧甲基-3-头孢烯-4-羧酸(7-ACCCA)及其它。最优选的是N-己二酰基化的头孢菌素,最优选的是己二酰基-7-ADCA。能够生产N-己二酰化的β -内酰胺化合物的微生物菌株可以选自由真菌、细菌 或酵母组成的组。优选地,本发明的微生物菌株是真菌,优选地是丝状真菌。一种优选的 丝状真菌可选自由 Aspergillus、Acremonium、Trichoderma 禾P Penicillium 组成的组。 更优选地,本发明的突变体微生物菌株属于Penicillium物种,最优选地为Penicillium chrysogenum。一禾中优选的细菌可以选自由 Streptomyces、Nocardia 或 Flavobacterium 组 成的组。在一个优选的实施方案中,能够生产N-己二酰化的β -内酰胺化合物的本发明 的突变体微生物菌株属于Penicillium物种,最优选地是Penicillium chrysogenum,所 述微生物菌株已用编码扩环酶的基因、优选地用Sti^ptomyces clavuligerus cefE基 因转化过,所述编码扩环酶的基因使得菌株在存在前体己二酸时培养时能够生产己二酰 基-7-ADCA。在另一实施方案中,能够生产N-己二酰化的β -内酰胺化合物的本发明的突变 体微生物菌株属于Penici 11 ium物种,最优选地是Penici 11 ium chrysogenum,并且除了扩 环酶基因(优选Mi^ptomyces clavuligerus cefE基因)以外,还经羟化酶基因(优选 Streptomyces clavuligerus cefF基因)转化过,所述羟化酶基因的表达产物将己二酰 基-7-ADCA的3-甲基侧链转化为3-羟甲基,得到己二酰基-7-氨基去乙酰基头孢烷酸(己 二酰基-7-ADAC)。在另一个实施方案中,能够生产N-己二酰化的β -内酰胺化合物的本发明的突变 体微生物菌株属于Penicillium物种,最优选地是Penicillium chrysogenum,并且经扩环 酶/羟化酶基因(优选Acremonium chrysogenum cefEF基因)转化过,所述基因的表达产 物将己二酰基-7-ADCA的3-甲基侧链转化成3-羟甲基,得到己二酰基-7-氨基去乙酰基 头孢烷酸(己二酰基-7-ADAC)。在另一实施方案中,能够生产N-己二酰化的β -内酰胺化合物的本发明的突变体 微生物菌株属于Penicillium物种,最优选地是Penicillium chrysogenum,并且除了编码 扩环酶的基因(优选Mi^ptomyces clavuligerus cef基因)和羟化酶基因以外,还经乙 酰基转移酶基因(优选Mi^ptomyces clavuligerus cefG基因)转化过,所述乙酰基转移 酶基因的表达产物(即酰基转移酶)将3-羟甲基侧链转化为3-乙酰氧甲基侧链,得到己 二酰基-7-ACA。在又一个实施方案中,能够生产N-己二酰化的β -内酰胺化合物的本发明的突变 体微生物菌株属于Penicillium物种,最优选地是Penicillium chrysogenum,并且用编码 扩环酶的基因(优选Mi^ptomyces clavuligerus cefE基因)、编码羧化酶的基因(优选 Streptomyces clavuligerus cefF基因)和O-氨甲酰基转移酶的基因(优选Sti^ptomyces clavuligerus cmcH基因)转化过,从而得到己二酰基-7-氨基-3-氨甲酰基氧甲基-3-头 孢烯-4-羧酸。在另一个实施方案中,本发明的突变体微生物菌株属于Penicillium物种,最优 选地为Penicillium chrysogenum,任选地用编码扩环酶、羟化酶、扩环酶/羟化酶、乙酰基 转移酶和/或O-氨甲酰基转移酶的一个或多个上述基因转化过,另外在编码涉及己二酸消 耗的酶的一个或多个基因中具有缺失。此类修饰的优选的例子是(但不限于)氧化编码酶。涉及的各种酶可以分别是CoA连接酶(EC 6. 2. 1. XX),酰基-CoA脱氢酶(EC1. 3. 99. XX),酰基-CoA氧化酶(EC 1.3. 3. XX),烯酰基-CoA水合酶(EC4. 2. 1. 17),3-羟基酰基-CoA 脱氢酶(EC 1. 1. 1. 35)或乙酰基-CoA C-酰基转移酶(EC 2. 3. 1. 16)。在又一个实施方案中,本发明的突变体微生物菌株属于Penicillium物种,最优 选地为Penicillium chrysogenum,任选地用编码扩环酶、羟化酶、扩环酶/羟化酶、乙酰基 转移酶、O-氨甲酰基转移酶的一个或多个上述基因转化过,和/或在编码涉及己二酸消耗 的酶的基因中含有缺失,另外还用编码能够提高培养基中N-己二酰化的β -内酰胺分泌的 酶的基因转化过。此类基因的优选的例子是(但不限于)=Acremonium chrysogenum cefT 基因或其同源物或Acremonium chrysogenum cefM基因或其同源物。本发明的突变体微生物菌株的一种高度优选的实施方案具有以下特征1)其属于 Penicillium 物种,最优选地为 Penicillium chrysogenum,和,2)任选地用编码以下的基因转化a.扩环酶,优选地为 Sti^ptomyces clavuligerus cefE 基因;b.羟化酶,优选地为 Sti^ptomyces clavuligerus cefF 基因;c.扩环酶 / 羟化酶,优选地为 Acremonium chrysogenum cefEF 基因;d.乙酰基转移酶基因,优选地为Sti^ptomyces clavuligerus cefG基因,和/或e. O-氨甲酰基转移酶,优选地为 Sti^ptomyces clavuligerus cmcH 基因;f. N-己二酰基β -内酰胺转运蛋白,优选地为Acremonium chrysogenum cefT基 因,包括能够(通过上文列出的方法)从这些例子获得的经优化的变体。3.任选地,编码己二酸盐降解酶或己二酸盐消耗酶的基因也以下述方式被修饰, 所述方式使得与亲本微生物菌株相比降解或消耗被降低。本发明第四方面提供了构建本发明的突变体微生物菌株的方法。使用核酸构建体 例如表达构建体获得本发明基因在本发明突变体微生物菌株中的功能性过表达,所述核酸 构建体含有一个或多个所选择的基因,各自与一个或多个控制序列可操作地连接,所述控 制序列指导编码的多肽在合适的表达宿主中表达。核酸构建体可以在一个DNA片段上,或 优选地在独立的片段上。表达应被理解为包括多肽生产中涉及的任何步骤,并可包括转录、 转录后修饰、翻译、翻译后修饰和分泌。当核酸构建体含有编码序列在特定宿主生物中表 达所需的所有控制序列时,术语“核酸构建体”与术语“表达载体”或“盒”同义。术语“控 制序列”在本文中被定义为包括对多肽的表达来说必需的或有利的所有组件。每种控制序 列对编码多肽的核酸而言可以是内源的(native)或外源的(foreign)。这类控制序列可 包括,但不限于启动子、前导序列、最适翻译起始序列(如Kozak, 1991,J. Biol. Chem. 266 19867-19870中所述)、分泌信号序列、前肽序列、多聚腺苷酸化序列、转录终止子。控制序 列至少包括启动子以及转录和翻译终止信号。术语“可操作地连接”在本文中被定义为下 述构型,其中控制序列被适当地置于与DNA序列的编码序列相关的位置,使得控制序列能 指导多肽的生产。控制序列可包括含有转录控制序列的适当的启动子序列。启动子可以是在细胞中 显示转录调控活性的任何核酸序列,包括突变的、截短的和杂交的启动子,它们可得自编码 细胞外或细胞内多肽的基因。启动子对细胞或多肽而言可以是同源的或异源的。
丝状真菌细胞优选的启动子是本领域已知的,并且可以是例如葡萄糖-6-磷酸 脱氢酶gpdA启动子;蛋白酶启动子如ρ印Α、ρ印B、ρ印C ;葡糖淀粉酶glaA启动子;淀粉酶 amyA.amyB启动子;过氧化氢酶catR或catA启动子;葡萄糖氧化酶goxC启动子;β -半乳 糖苷酶IacA启动子;α-葡糖苷酶aglA启动子;翻译延伸因子tefA启动子;木聚糖酶启 动子如xlnA、xlnB、xlnC、xlnD ;纤维素酶启动子如eglA、eglB、cbhA ;转录调节子启动子如 areA、creA、xlnR、pacC、prtT等或任何其它,并且可在诸如NCBI的网站上找到(http:// www, ncbi. nlm. nih. rov/entrez/)。在一个优选的实施方案中,启动子可源于被高度表达的基因(在本文中定义为 mRNA浓度至少为总细胞mRNA的0. 5% (w/w))。在另一个优选的实施方案中,启动子可源于 被中度表达的基因(在本文中定义为mRNA浓度至少为总细胞mNRA的0.01%至0.5% (w/ w))0在另一优选的实施方案中,启动子可源于被低表达的基因(在本文中定义为mRNA浓 度低于总细胞mRNA的0. 01 % (w/w))。在一个进一步更优选的实施方案中,使用微阵列数据选择基因,并进而选择这些 基因的启动子,所述启动子具有确定的转录水平和调节。藉此,可以使基因表达盒最适地适 应其应当发挥功能的条件。其中要通过该方法选择的合适启动子是具有非常高的如上文解 释的“己二酸盐/对照”比例的基因的启动子。另外,由W02007071399分离和/或公开的 强和/或组成型启动子可以被考虑作为合适的启动子。或者,可将随机的DNA片段克隆在本发明的多核苷酸之前。使用W02007118836公 开的乙酰胺平板实验,可以容易地筛选活性启动子,因为这些启动子应当促进在乙酰胺作 为唯一氮源上的生长。这些DNA片段可衍生自许多来源,即不同的物种,由PCR扩增得来, 合成得来等等。控制序列还可以包括合适的转录终止子序列,这是被丝状真菌细胞识别为终止转 录的序列。终止子序列与编码多肽的核酸序列的3’末端可操作地连接。在细胞中有功能的 任何终止子都可用于本发明中。对丝状真菌细胞而言优选的终止子得自编码Aspergillus oryzae TAKA 淀粉酶,Aspergillus niger 葡糖淀粉酶,Aspergillus nidulans 氨基苯甲酸 合酶,Aspergillus niger α -葡糖苷酶,trpC基因禾口 Fusarium oxysporum胰蛋白酶样蛋 白酶的基因。控制序列也可以包括合适的前导序列,mRNA的非翻译区,其对于丝状真菌细胞 的翻译而言是重要的。前导序列与编码多肽的核酸序列的5’ -端可操作地连接。在细胞 中有功能的任何前导序列都可以用于本发明中,对丝状真菌细胞而言优选的前导序列得 自编码Aspergillus oryzae TAKA淀粉酶和Aspergillus nidulans丙糖磷酸异构酶和 Aspergillus niger glaA的基因。其它优选的起始序列由W02006077258分离和/或公开。控制序列也可以包括多聚腺苷酸化序列,所述序列与核酸序列的3’ -端可操作地 连接,并且在被转录后被丝状真菌细胞识别为对经转录的mRNA添加多聚腺苷酸化残基的 信号。在细胞中有功能的任何多聚腺苷酸化序列都可用于本发明中。对丝状真菌细胞而言 优选的多聚腺苷酸化序列得自编码Aspergillus oryzae TAKA淀粉酶,Aspergillus niger 葡糖淀粉酶,Aspergillus nidulans氨基苯甲酸合酶,Fusarium oxysporum胰蛋白酶样蛋 白酶和Aspergillus niger α-葡糖苷酶的基因。核酸构建体可以是表达载体。表达载体可以是任何载体(例如质粒或病毒),其可便利地进行重组DNA步骤并可导致编码多肽的核酸序列的表达。载体的选择应典型地取决 于载体与要引入载体的细胞的相容性。载体可以是线性的或闭合环状质粒。载体可以是自主复制的载体,即作为染色体外实体存在的载体,其复制不依赖于 染色体的复制,例如质粒、染色体外元件、小染色体或人工染色体。用于丝状真菌的自主维 持的克隆载体可包含AMAl-序列(参阅例如Aleksenko and Clutterbuck (1997),Fungal Genet. Biol. 21 :373-397)。或者,载体可以是下述载体,当其被引入细胞时整合进基因组中,并与其被整合在 其中的染色体一起复制。整合型克隆载体可以随机或在预先确定的靶基因座上整合进宿主 细胞的染色体中。在本发明的一个优选的实施方案中,整合型克隆载体包括与宿主细胞基 因组中预先确定的靶基因座中的DNA序列同源的DNA片段,用于将克隆载体的整合靶向该 预先确定的基因座上。为了促进定向整合,克隆载体优选地在转化宿主细胞前被线性化。优 选地进行线性化使得克隆载体的至少一端(但是优选任一端)侧翼是与靶基因座同源的序 列。靶基因座侧翼的同源序列的长度优选地至少0. 11Λ,进一步优选地至少0. 21Λ,还更优 选地至少0. 51Λ,进一步更优选地至少11Λ,最优选地至少21Λ。优选地,如W0050956M和/ 或TO2007115886所述,针对改进的靶向DNA整合频率修饰亲本微生物菌株。载体系统可以是单个载体或质粒,或者可以是两个或多个载体或质粒,其共同含 有要被引入宿主细胞基因组中的总DNA。 DNA构建体可在附加型载体上使用。然而在本发明中,构建体优选地被整合进宿主 菌株的基因组中。本发明在第五方面提供了本发明的基因用于构建在包含己二酸的培养基中培养 时能够生产N-己二酰化的β -内酰胺化合物的本发明的突变体微生物的用途,其中所述突 变体微生物菌株与亲本微生物菌株相比,具有经改进的由来自培养基的己二酸向N-己二 酰化的内酰胺化合物的并入产率。在一个实施方案中,突变体微生物菌株可含有多于一个本发明的基因,所述基因 均被过表达,并且其组合导致与亲本微生物菌株相比经改进的由来自培养基的己二酸向 N-己二酰化的β -内酰胺化合物的并入产率。在另一个实施方案中,本发明的突变体微生物菌株含有编码能够催化细胞内己二 酸转化成己二酰基-CoA的酶(如前文所述的CoA-连接酶和CoA-转移酶)的一个或多个 本发明的基因,以及被功能性失活的编码涉及一个或多个己二酸降解通路的酶的基因。一 个单一微生物菌株中功能性失活的涉及己二酸降解的基因与涉及己二酸并入N-己二酰化 的内酰胺化合物的基因的过表达的组合导致与亲本微生物菌株相比进一步改进的由 来自培养基的己二酸向N-己二酰化的内酰胺化合物的并入产率。“功能性失活的”在 本文中被定义为基因的失活,这导致所编码的酶的残余活性优选地少于50%、更优选地少 于40 %、更优选地少于30 %、更优选地少于20 %、更优选地少于10 %、更优选地少于5 %、更 优选地少于2%。“基因的失活”在本文中被定义为修饰基因,从而获得如上文定义的功能 性失活的基因。用于修饰基因从而获得功能性失活的基因的方法是本领域已知的,并且可 包括通过导致(过早)终止或读码框位移的碱基对突变使基因失活;突变编码一个或多 个关键氨基酸(例如水解酶的催化三联体)的一个或多个碱基;引起酶氨基酸序列中突变 的基因突变,这导致酶的半衰期降低;以下述方式修饰mRNA分子,所述方式使得mRNA半衰期降低;插入破坏开放读码框的第二序列(即选择标记物基因);基因的部分或完全去除;基 因启动子的去除/突变;使用反义DNA或可比较的RNA抑制方法降低细胞中mRNA的有效量。 最优选地,通过缺失使基因功能性失活,导致编码的多肽和由此造成的酶活性完全不存在。本发明第六方面提供了通过培养本发明的突变体微生物菌株生产N-己二酰化的 β -内酰胺化合物的方法,其中用于生产N-己二酰化的β -内酰胺化合物的方法与使用亲 本微生物菌株生产N-己二酰化的β -内酰胺化合物的方法相比,具有经改进的由来自培养 基的己二酸进入N-己二酰化的β -内酰胺化合物的并入产率。

图1展示了涉及缺失Penicillium chrysogenum基因Pc22g20270的步骤。图例·实心箭头,Pc22g20270启动子;·空心箭头,Pc22g202700RF ; 阴影框,trpC终止子; 虚线框,ccdA基因; 实心框,Iox位点; 交叉,重组事件; 向下的箭头,过程中的先后步骤REKR和KRAM,重叠无功能amdS选择标记物片段; REKRAM,功能性amdS选择标记物基因。数字指示寡核苷酸的SEQ ID NO。“标签”指示可用于突变体鉴定的特异性核苷酸 序列的存在。图2展示了涉及验证Penicillium chrysogenum基因Pc22g20270实际缺失的步 骤。图例实心箭头,Pc22g20270启动子;空心箭头,Pc22g202700RF ;阴影框,trpC终止子; 实心框,Iox位点;REKRAM,功能性amdS选择标记物基因。数字指出所示三个PCR反应的寡 核苷酸的SEQ ID NO (见表4)。一般材料和方法BLAST 算法被用于鉴定同源序列(Altschul,et al. ,1990, J. Mol. Biol. 215 403-410) ο 公众可通过 National Center for Biotechnology Information (http: //www, ncbi. nlm. nih. rov/)获得进行BLAST分析的软件。BLAST算法参数W、T和X决定算法的灵 敏度和速度。BLAST程序使用下述作为默认词长(W)11、BL0SUM62评分矩阵(见HenikofT & Henikoff, Proc. Natl. Acad. Sci. USA 89 10915 (1989))、比对(B) 50、预期(E) 10,M = 5, N = -4和并比较两条链。如别处所述进行标准步骤(Sambrook,J. et al. (1989),Molecular cloning -.a laboratory manual, 2nd Ed.,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York)。根据制造商的流程使用校正读码聚合酶 Turbo-Pfu-Polymerase (Stratagene,荷兰)或 Phusion (Finnzymes)进行 DNA 扩增,但 是构建好的菌株和质粒的验证通过使用Taq聚合酶实现。限制性酶来自^witrogen 或 New England Biolabs0 对常规克隆而言,使用 Escherichia coli 菌株 I^oplO 和 DHlOB(Invitrogen)。构建好的质粒的验证通过限制性分析和随后的测序进行。
实施例实施例1
鉴定编码推定的己二酰基-CoA-合成酶的Penicillium chrysogenum基因1. CoA 连接酶(EC 6. 2. 1. xx)使用探针Α、探针B、探针C和探针D (见上下文)搜索Penicillium chrysogenum 菌株WisC0nsin54-1255的基因组,随后的注解揭示了编码推定的CoA-连接酶活性(EC 6. 2. 1. xx)的25个基因;见表1。2. CoA-转移酶(EC 2. 8. 3. xx)使用探针E和探针F(见上下文)搜索Penicillium chrysogenum菌株 Wiscons54-1255的基因组,揭示了编码推定的CoA-转移酶(EC 2. 8. 3. xx)的6个基因;见表2。实施例2编码推定的CoA连接酶(EC 6. 2. l.xx)和/或CoA转移酶(EC 2. 8. 3. xx)的 Penicillium chrysogenum基因的微阵列分析为了鉴定31个经鉴定的推定的己二酰基-CoA合成酶尤其是CoA连接酶(EC 6.2.1)和/或CoA转移酶(EC 2. 8. 3. xx)中哪些是用于过表达从而提高N-乙酰基化的 β -内酰胺化合物的合适候选者,进行微阵列研究。使用Affymetrix Custom GeneChip程序 (Affymetrix, Inc. , Santa Clara, CA) =GeneChip, DSM_PENa520255F, P. chrysogenum 基因组序列制备专有的DNA微阵列。将含有或不含有编码扩环酶的Sti^ptomyces clavuligerus cefE基因的 P. chrysogenum菌株接种于含有25ml β -内酰胺生产培养基(如US20020039758中所述) 的IOOml摇瓶中,所述培养基含有10g/l己二酸盐,3g/l苯乙酸(PAA)或不含前体(对照)。 将培养物在25°C下孵育,每分钟旋转280次。90小时后对总发酵液取样并迅速冷却。洗涤 细胞并将细胞沉淀物冷冻于液氮中。随后通过用研钵和研杵研磨冷冻的沉淀物来破碎细 胞,并使用iTrizol分离RNA。在Bioanalyzer(Agilent)上常规检查总RNA的品质和数量。 使用20微克总RNA进行标准cDNA合成和标记反应(根据Affymetrix说明书)。根据供应 商的说明书(Affymetrix,Santa Clara, USA)进行 GeneChips 的杂交。使用 Affymetrix GeneChip OperatingSoftware (GCOS, Affymetrix, Santa Clara, USA)扫描和分析经杂交 的阵列。所有实验一式三份完成,并采取三次测量的平均作为转录本的相对水平。通过测定含己二酸盐的培养基上的转录本水平和含PAA或对照培养基上的转录 本水平之间的比例,来鉴定由己二酸盐特异性诱导的基因。使用含PAA的培养基,通过注意 对照培养基上的转录本水平和含PAA的培养基上的转录本水平之间的比例,来鉴定特异性 应答。结果展示于表1和表2中。表1编码具有推定的CoA连接酶活性(EC 6.2.1.XX)的酶的Penicillium chrysogenum基因的转录本水平
权利要求
1.用于鉴定微生物菌株的一个或多个下述基因的方法,所述基因编码涉及将来自培养 基的己二酸并入N-己二酰化的β -内酰胺化合物的一种或多种酶,所述方法可包括以下步 骤a.选择涉及将酸活化成各自酰基-CoA化合物的一个或多个已知基因的核苷酸序列和 /或任选地由所述基因编码的一个或多个已知酶的氨基酸序列;b.使用从步骤(a)中选择的序列作为BLAST搜索中的探针,用于在能够生产N-己二酰 化的内酰胺化合物的微生物菌株的可获得的核苷酸或氨基酸序列中鉴定同源序列。
2.根据权利要求1的方法,编码涉及将来自培养基的己二酸并入N-己二酰化的β-内 酰胺化合物的一种或多种酶的所述基因选自下组,所述组由编码能够催化细胞内己二酸转 化成己二酰基-CoA的酶如CoA-连接酶和CoA-转移酶的基因组成。
3.在包含己二酸的培养基中培养时能够生产N-己二酰化的β-内酰胺化合物的突变 体微生物菌株,其特征是所述菌株与非突变体亲本菌株相比,具有改进的将来自培养基的 己二酸向N-己二酰化的β -内酰胺化合物的并入产率。
4.根据权利要求1的菌株,其特征是所述经改进的己二酸盐并入产率为至少5%。
5.前述权利要求中任一项的突变体菌株,其中所述突变体菌株的编码涉及将来自培养 基的己二酸并入N-己二酰化的β -内酰胺化合物的一种或多种酶并且用根据权利要求1 或2的方法鉴定的一个或多个基因,与其中所述基因未被过表达的亲本微生物菌株相比, 在所述突变体菌株中被过表达。
6.根据权利要求3的菌株,其中涉及将来自培养基的己二酸并入N-己二酰化的β-内 酰胺化合物的所述酶是己二酰基-CoA形成酶,优选地是酸性CoA连接酶(EC 6. 2. 1. xx)和 /或酸性-CoA转移酶(EC 2. 8. 3. xx)。
7.根据权利要求4的菌株,其中所述编码酸性CoA连接酶(EC6.2.l.XX)的基因选自 由以下组成的组Pcl3gl4420(SEQ ID No 1) ;Pc21g22010 (SEQ ID No 2) ;Pc22g20270 (SEQ ID No 3) ;Pc22g00960(SEQ ID No :4) ;Pcl2g05520(SEQ ID No :5) ;Pcl3gl2270(SEQ ID No 6) ;Pcl8g05710(SEQ ID No :7) ;Pc20gl3500(SEQ ID No :8) ;Pcl3g01890(SEQ ID No: 9) ;Pc20gl0840(SEQ ID No :10) ;Pcl3g05130(SEQ ID No :11) ;Pcl3gl0810(SEQ ID No: 12) ;Pc22g06680(SEQ ID No :13) ;Pc22gl4900(SEQ ID No :14) ;Pc22gl6410(SEQ ID No: 15) ;Pc21gl3540(SEQ ID No :16) ;Pc21g20650(SEQ ID No :17) ;Pc21g23730(SEQ ID No: 18) ;Pc21g21960(SEQ ID No :19) ;Pc22g24780(SEQ ID No :20) ;Pc06g01160(SEQ ID No: 21) ;Pcl2g09980(SEQ ID No :22) ;Pcl5g00420(SEQ ID No :23) ;Pc21g07810(SEQ ID No: 24)和Pc21g09470(SEQ ID No 25)和与所述序列基本同源的序列。
8.根据权利要求4的菌株,其中所述编码酸性-CoA转移酶(EC2.8. 3. xx)的基 因选自由以下组成的组Pc20gl5639(SEQ ID No :26) ;Pcl3g02780 (SEQ ID No :27); Pc22gl3680(SEQ ID No :28) ;Pc22g03940(SEQ ID No :29) ;Pcl4g00590(SEQ ID No :30); Pcl6g00210(SEQ ID No :31)和与所述序列基本同源的序列。
9.根据前述权利要求中任一项的菌株,其中所述N-己二酰化的内酰胺化合物 选自由己二酰基-6-ΑΡΑ,己二酰基-7-ADCA,己二酰基-7-ACA,己二酰基-7-ACCA,己二酰 基-7-PACA,己二酰基-7-ADAC,己二酰基- -ACCCA组成的组。
10.根据前述权利要求中任一项的菌株,其中所述菌株是真菌、细菌或酵母。
11.根据前述权利要求中任一项的菌株,其中所述真菌属于Penicillium物种。
12.根据前述权利要求中任一项的菌株,其中所述真菌是Penicilliumchrysogenum, 优选地其经编码扩环酶或扩环酶/水解酶的基因转化过并且表达编码扩环酶或扩环酶/水 解酶的基因。
13.用于构建权利要求1-10中任一项所定义的突变体菌株的方法,所述方法包括过表 达编码涉及将来自培养基的己二酸并入N-己二酰化的β -内酰胺化合物的一种或多种酶 的一个或多个基因。
14.根据权利要求11的方法,其中涉及将来自培养基的己二酸并入N-己二酰化的 β -内酰胺化合物的所述酶是己二酰基-CoA形成酶,优选地是酸性CoA连接酶(EC 6. 2. 1) 和/或酸性-CoA转移酶(EC 2. 8. 3)。
15.一种基因,其编码酸性CoA连接酶(EC 6. 2.1. XX)并且选自由Pcl3gl4420 (SEQ ID No 1) ;Pc21g22010(SEQ ID No 2) ;Pc22g20270(SEQ ID No 3) ;Pc22g00960(SEQ ID No 4) ;Pc 12g05520(SEQ ID No 5) ;Pcl3gl2270(SEQ ID No 6) ;Pcl8g05710(SEQ ID No 7) ;Pc20gl3500(SEQ ID No 8) ;Pcl3g01890(SEQ ID No 9) ;Pc20gl0840(SEQ ID No :10); Pcl3g05130(SEQ ID No :11) ;Pcl3gl0810(SEQ ID No :12) ;Pc22g06680(SEQ ID No :13); Pc22gl4900(SEQ ID No :14) ;Pc22gl6410(SEQ ID No :15) ;Pc21gl3540(SEQ ID No :16); Pc21g20650(SEQ ID No :17) ;Pc21g23730(SEQ ID No :18) ;Pc21g21960(SEQ ID No :19); Pc22g24780(SEQ ID No :20) ;Pc06g01160(SEQ ID No :21) ;Pcl2g09980(SEQ ID No :22); Pcl5g00420(SEQ ID No :23) ;Pc21g07810(SEQ ID No :24)和 Pc21g09470(SEQ ID No 25) 和与所述序列基本同源的序列构成的组,或者编码酸性-CoA转移酶(EC 2. 8. 3. xx)且选自 Pc20gl5639(SEQ ID No :26) ;Pcl3g02780(SEQ ID No :27) ;Pc22gl3680(SEQ ID No :28); Pc22g03940(SEQ ID No :29) ;Pcl4g00590(SEQ ID No :30) ;Pcl6g00210(SEQ ID No :31)禾口 与所述序列基本同源的序列构成的组。
16.编码酸性-CoA转移酶(EC2. 8. 3. xx)并且选自下组的基因,所述组由以下组成 Pc20gl5639(SEQ ID No :26) ;Pcl3g02780(SEQ ID No :27) ;Pc22gl3680(SEQ ID No :28); Pc22g03940(SEQ ID No :29) ;Pcl4g00590(SEQ ID No :30) ;Pcl6g00210(SEQ ID No :31)禾口 与所述序列基本同源的序列。
17.由根据权利要求14或15中定义的基因编码的多肽。
18.用于生产N-己二酰化的β-内酰胺化合物的方法,所述方法包括在包含己二酸的 发酵培养基中培养根据权利要求1-10中任一项定义的菌株。
全文摘要
本发明涉及突变体微生物菌株,其源自在包含己二酸的培养基中培养时能够生产N-己二酰化的β-内酰胺化合物的亲本微生物菌株的,其特征是所述突变体微生物菌株具有经改进的将来自培养基的己二酸向N-己二酰化的β-内酰胺化合物的并入。
文档编号C12N9/10GK102131921SQ200980130996
公开日2011年7月20日 申请日期2009年8月4日 优先权日2008年8月5日
发明者德 勃戈 马尔科·亚历山大·范, 鲁洛夫·阿利·兰斯·伯韦比格 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1