诺卡噻唑菌素的生物合成基因簇及其应用的制作方法

文档序号:585026阅读:319来源:国知局
专利名称:诺卡噻唑菌素的生物合成基因簇及其应用的制作方法
技术领域
本发明属于微生物基因资源和基因工程领域,具体涉及硫肽类抗生素诺卡噻唑菌 素(Nocathiacins)的生物合成基因簇的克隆,序列分析,基因功能研究及其应用。
背景技术
诺卡噻唑菌素(Nocathiacins)是一类富含元素硫,氨基酸残基被高度修饰的 环肽类抗生素,它们作为硫肽家族中十分重要的成员,最初是在筛选对有新青霉素抗性 的金黄色葡萄球菌(Methicillin-Resistant Staphylococcus aureus, MRSA)禾口有多种 耐药性的粪肠球菌(Multi-Drug Resistant Enterococcus faecium, MREF)的生长有 Φ 制作用的抗生素的过程中,从土壤样品中发现的[J.Antibiot. 1998,51,715]。1998年, Tokushima研究中心率先从拟无枝酸菌(Amycolatopsis sp. MJ347-81F4)中分离纯化到了 MJ347-81F4-A(Nocathiacin I )和B,并完成了它们的发酵、活性测试和结构测定,但没有 确定其绝对构型。2003年,Bristol-Myers Squibb药物研究所又从诺卡氏菌(Nocardia sp.ffff-12651)中发现了 Nocathiacin I、II、III,并对其进行了发酵、分离纯化和活性测 试,还利用NMR、X-ray等方法首次确定了其绝对构型(图1) [J. Antibiot. · 2003,56,226, 232 ;Clough, B. J. Org. Chem. 2002,67,8699]。诺卡噻唑菌素与硫肽家族其他抗生素一样也拥有一个以三取代的吡啶为核心,由 多个噻唑及脱水氨基酸所构成的环肽中心。其中Nocathiacin I在结构上与该家族的另一 成员糖硫己糖二酐α极其相似,不同之处在于多了一个2,3_脱氢丙氨酰胺的边链,吲哚酸 单元与大环相连部分的酯键替代了原来的硫酯键。研究表明诺卡噻唑菌素可以很好地抑制革兰氏阳性菌的生长,特别是对多种耐药 性的条件致病菌具有极强的杀伤作用。其中Nocathiacin I对MRSA的MIC值为0. 003 μ g/ mL,对有青霉素抗性的月市炎链球菌(penicillin-resistant Streptococcus pneumoniae, PRSP)的MIC值达到0.001 μ g/mL,比万古霉素高出10-20倍。同时,它还对近期出现的有 万古霉素(Vancomycin)抗性的獎肠球菌(vancomycin-resistant Enterococci faeccium, VREF)具有良好的抗性,MIC值为0.015 μ g/mL。而且与万古霉素相比,诺卡噻唑菌素对感 染MRSA的小鼠具有更加显著的疗效,Nocathiacin I、IIJIIW PD5tl值分别为0. 8,0. 62、 0. 89mg/kg,万古霉素在同样条件下仅为1. 3mg/kgo Nocathiacin I和II作为硫肽家族抗菌 活性最好的两个化合物,在较低PH下还比其他成员具有更好的水溶性,可能是因为分子中 含有一个二甲基氨基己糖的缘故[Med. Chem. Lett. 2004. 14. 171-175]。近期发现这类抗生素的作用机制与硫链丝菌肽类似,也是与50S亚基的23S rRNA-Ll 1蛋白复合物结合,通过阻止或促进Ll 1构象的变化,影响aa_tRNA. Ef-Tu. GTP复合 物的识别及延伸因子的GTPase活性,从而抑制细菌体内蛋白质的合成来发挥活性作用的 [J. Am. Chem. Soc. 2008,130,12102-12110]。目前其具体的构效关系还不是很清楚,但据推 测它们相似的环肽中心可能是其具有优越活性的关键结构。诺卡噻唑菌素作为新一代抗感染药物的先导化合物,自发现之日起就引起了科学家们的浓厚兴趣。考虑到它们的溶解度尚未达到静脉注射药剂的要求,不少化学家对其进 行了化学半合成改造。Bristol-Myers Squibb药物研究所通过在Nocathiacin I上添加 了一些极性水溶性基团,来提高它们的生物利用度如在吡啶环的羟基上或在吲哚酸侧链 的氮上烷氧化[Bioorganic & Medicinal Chemistry Letters. 2004,14,3743-3746];通 过Michael加成在2,3_脱氢丙氨酰胺边链上添加氨或硫醇[Tetrahedron Letters. 2004, 5,1059-1063];或者用化学法或酶法去掉2,3-脱氢丙氨酰胺,得到Nocathiacin IV,再进 一步烷氧化或添加烃基胺[J. Org. Chem. 2002,67,8789]。但这些方法往往很难在提高水 溶性的同时保持原始结构良好的抗菌活性。而这类抗生素的化学结构极其复杂,二十多 年来人们只完成了部分模块和酸性水解产物的合成[Tetrahedron Lett. 1984,25,2127 ; J. Org. Chem. 1996,61,4623 ;J. Org. Lett. 2003,5,4421 ;Tetrahedron Lett. 1991,32,4263 ; Angewandte Chemie. 2005,117,3802-3806 ;Chem. Commun. 2008,591-593]。直到近几年有机 合成大师Moody和Nicolaou等人才完成了启动噻星A、淀硫霉素D、硫链丝菌肽、盐屋霉素 A、GE2270A/T的全合成,诺卡噻唑菌素的全合成还没有人报道[Angew. Chem. Int. Ed. 2007, 46, 7930-7954] 0并且由于该类抗生素复杂的多环结构,众多的手性中心,使得单纯利用全 合成的方法进行改造步骤繁多,实际生产成本过高。而近年来随着基因组学和蛋白质组学的深入研究以及新型生物技术的快速发展, 使我们利用微生物作为“细胞工厂”,通过遗传控制来大量合成具有良好生物活性和新型作 用机制的天然产物及其类似物成为可能。这也为我们在微生物体内获得所需要的新型硫肽 类抗生素提供了一条新的思路。因此我们以微生物来源的诺卡噻唑菌素为目标分子,从克隆诺卡噻唑菌素的生物 合成基因簇出发,采用微生物学、分子生物学、生物化学以及有机化学相结合的方法来研究 其生物合成,阐明其生物合成途径及调节机制,在此基础上运用代谢工程的原理,合理修饰 诺卡噻唑菌素的生物合成途径,探索生物利用度更好、并能通过微生物发酵大量生产的新 型药物。

发明内容
本发明涉及一类由诺卡氏菌产生的具有良好抗菌活性的抗生素_诺卡噻唑菌素 (Nocathiacins)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。本发明中整个基因簇共包含37个基因的核苷酸序列或互补序列(序列1) (SEQ ID NO :1),其中有 8 个基因 noc28, noc20, noc21, noc22, noc23, noc9, noc24 禾口 noc30 负责 Nocathiacin I大环骨架的生物合成;4个基因noc25,noc26, noc27和noc29负责吲哚酸 侧链的生物合成;6个基因noc6,noclO, nocll, nocl2, nocl3和nocl4负责4_N,N- 二甲 基-2,4,6-脱氧己糖的生物合成;5个细胞色素P450氧化还原酶基因noc7,nocl5, nocl6, nocl8, nocl9,负责Nocathiacin I的氧化还原后修饰;2个甲基转移酶基因noc8,noc36, 分别负责Nocathiacin I的甲基化后修饰和自身的抗性;2个抗性基因nOC17,nOC37 ;3个 调节基因noc5,noc33, noc34 ;4个与转录翻译有关的基因nocl,noc2, noc3, noc4 ;以及3 个未知功能的基因noc31,noc32, noc35。本发明还提供了一个编码诺卡噻唑菌素前体肽的核苷酸序列,由序列2中的氨基 酸序列组成,命名为noc28,其基因的核苷酸序列位于序列1中第38432-38581碱基处。
6
本发明还提供了一个编码诺卡噻唑菌素噻唑环形成的环化酶的核苷酸序列, 由序列3中的氨基酸序列组成,命名为n0C23,其基因的核苷酸序列位于序列1中第 30980-32875 碱基处。本发明还提供了一个编码诺卡噻唑菌素噻唑环形成的NADH脱氢酶的核苷酸序 列,由序列4中的氨基酸序列组成,命名为n0C22,其基因的核苷酸序列位于序列1中第 29544-30767 碱基处。本发明还提供了一个编码诺卡噻唑菌素大环骨架形成的脱水酶的核苷酸序 列,由序列5中的氨基酸序列组成,命名为n0c21,其基因的核苷酸序列位于序列1中第 26965-29523 碱基处。本发明还提供了一个编码诺卡噻唑菌素大环骨架形成的脱水酶的核苷酸序 列,由序列6中的氨基酸序列组成,命名为nOc20,其基因的核苷酸序列位于序列1中第 25968-26960 碱基处。本发明还提供了一个编码自由基SAM硫胺合成酶的核苷酸序列,由序列7中的氨 基酸序列组成,命名为noc27,其基因的核苷酸序列位于序列1中第36848-37948碱基处。本发明还提供了一个编码酰基-CoA合成酶的核苷酸序列,由序列8中的氨基酸序 列组成,命名为noc25,其基因的核苷酸序列位于序列1中第34680-35912碱基处。本发明还提供了一个编码酰基转移酶的核苷酸序列,由序列9中的氨基酸序列组 成,命名为noc26,其基因的核苷酸序列位于序列1中第35933-36820碱基处。本发明还提供了一个编码SAM依赖的氧化酶或甲基转移酶的核苷酸序列,由序列 10中的氨基酸序列组成,命名为n0c29,其基因的核苷酸序列位于序列1中第38714-39976 碱基处。本发明还提供了一个编码N-双甲基转移酶的核苷酸序列,由序列11中的氨基酸 序列组成,命名为noclO,其基因的核苷酸序列位于序列1中第14990-15703碱基处。本发明还提供了一个编码NDP-己糖3位C上的甲基转移酶的核苷酸序列,由序列 12中的氨基酸序列组成,命名为nocll,其基因的核苷酸序列位于序列1中第15728-16972 碱基处。本发明还提供了一个编码NDP-己糖-3-酮还原酶的核苷酸序列,由序列13中的 氨基酸序列组成,命名为nocl2,其基因的核苷酸序列位于序列1中第16984-17970碱基处。本发明还提供了一个编码dTDP-4-酮-6-脱氧葡萄糖2,3_脱水酶的核苷酸序 列,由序列14中的氨基酸序列组成,命名为n0cl3,其基因的核苷酸序列位于序列1中第 17988-19418 碱基处。本发明还提供了一个编码NDP-6-脱氧-D-葡萄糖4位C上的氨基转移酶的核苷 酸序列,由序列15中的氨基酸序列组成,命名为nocl4,其基因的核苷酸序列位于序列1中 第19424-20560碱基处。本发明还提供了一个编码糖基转移酶的氨基转移酶的核苷酸序列,由序列16中 的氨基酸序列组成,命名为noc6,其基因的核苷酸序列位于序列1中第11505-12683碱基 处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列17中 的氨基酸序列组成,命名为noc7,其基因的核苷酸序列位于序列1中第12704-13912碱基
7处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列18中 的氨基酸序列组成,命名为nocl5,其基因的核苷酸序列位于序列1中第20591-21703碱基 处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列19中 的氨基酸序列组成,命名为nocl6,其基因的核苷酸序列位于序列1中第21696-22934碱基 处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列20中 的氨基酸序列组成,命名为nocl8,其基因的核苷酸序列位于序列1中第23507-24649碱基 处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列21中 的氨基酸序列组成,命名为nocl9,其基因的核苷酸序列位于序列1中第24646-25947碱基 处。本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列22中的氨基酸序列 组成,命名为noc8,其基因的核苷酸序列位于序列1中第13909-14532碱基处。本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列23中的氨基酸序列 组成,命名为noc36,其基因的核苷酸序列位于序列1中第43983-44768碱基处。本发明还提供了一个编码博来霉素抗性蛋白的核苷酸序列,由序列24中的氨基 酸序列组成,命名为nocl7,其基因的核苷酸序列位于序列1中第22956-23480碱基处。本发明还提供了一个编码磷酸盐ABC transporter的核苷酸序列,由序列25中的 氨基酸序列组成,命名为noc37,其基因的核苷酸序列位于序列1中第44914-45423碱基处。本发明还提供了一个编码SARP家族的转录调节蛋白的核苷酸序列,由序列26中 的氨基酸序列组成,命名为noc5,其基因的核苷酸序列位于序列1中第10404-11387碱基 处。本发明还提供了一个编码热休克蛋白的核苷酸序列,由序列27中的氨基酸序列 组成,命名为noc33,其基因的核苷酸序列位于序列1中第42031-42456碱基处。本发明还提供了一个编码hsplS转录调节因子的核苷酸序列,由序列28中的氨基 酸序列组成,命名为noc34,其基因的核苷酸序列位于序列1中第42565-43173碱基处。本发明还提供了一个编码RNA聚合酶ECF-亚族的信号因子的核苷酸序列,由序列 29中的氨基酸序列组成,命名为n0C3,其基因的核苷酸序列位于序列1中第8731-9867碱 基处。本发明还提供了一个编码ATP酶的信号因子的核苷酸序列,由序列30中的氨基酸 序列组成,命名为noc4,其基因的核苷酸序列位于序列1中第9968-10387碱基处。本发明还提供了一个编码DGPFAETKE家族蛋白的核苷酸序列,由序列31中的氨基 酸序列组成,命名为noc2,其基因的核苷酸序列位于序列1中第8282-8725碱基处。本发明还提供了一个编码50S核糖体蛋白L18的核苷酸序列,由序列32中的氨基 酸序列组成,命名为nocl,其基因的核苷酸序列位于序列1中第7731-8084碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列33中的氨基酸序 列组成,命名为noc9,其基因的核苷酸序列位于序列1中第14529-14984碱基处。
本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列34中的氨基酸序 列组成,命名为noc24,其基因的核苷酸序列位于序列1中第32902-34683碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列35中的氨基酸序 列组成,命名为noc30,其基因的核苷酸序列位于序列1中第40174-40914碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列36中的氨基酸序 列组成,命名为noc31,其基因的核苷酸序列位于序列1中第41001-41408碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列37中的氨基酸序 列组成,命名为noc32,其基因的核苷酸序列位于序列1中第41492-41953碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列38中的氨基酸序 列组成,命名为noc35,其基因的核苷酸序列位于序列1中第43228-43758碱基处。在另一优选例中,所述基因簇包括由n0C6至nOC30构成的结构基因;或包括由 nocl至n0C37构成的结构基因、抗性基因和调控基因。在另一优选例中,所述的基因簇的核苷酸序列如SEQ ID NO :1中第7731-45423 位、SEQ ID NO 1 中第 11505-40916 位、或 SEQ ID NO 1 中第 1-44560 位所示。本发明还提供了本发明上述的诺卡噻唑菌素的生物合成基因簇的编码蛋白。较佳 地,所述的编码蛋白的氨基酸序列如SEQ ID N0:2-38所示。本发明还提供了含有上述的诺卡噻唑菌素的生物合成基因簇的表达载体。较佳 地,所述的表达载体是粘粒。本发明还提供了重组的含有上述的表达载体或染色体上整合有上述的诺卡噻唑 菌素的生物合成基因簇的宿主细胞。较佳地,所述的宿主细胞是链霉菌。本发明还提供了一种产生诺卡噻唑菌素的方法,包括步骤培养上述的宿主细胞 从而表达诺卡噻唑菌素,以及从培养液中分离诺卡噻唑菌素。本发明还提供了上述的诺卡噻唑菌素的生物合成基因簇或其部分基因的用途,它 们被用于在S.actuosus ATCC 25421相关基因缺失的突变株中进行异源互补,从而恢复产 生诺肽菌素;或者将后修饰基因在S.actuosus ATCC 25421中进行异源表达产生,从而产 生诺肽菌素的结构类似物。序列1的互补序列可根据DNA碱基互补原则得到。序列1的核苷酸序列或部分核 苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶消化相应的DNA片段或 利用其他合适的技术得到。本发明还提供了获得至少包含部分序列1中DNA片段的重组质 粒的途径。本发明还提供了诺卡噻唑菌素生物合成的微生物体途径,至少其中之一的基因包 含有序列1中的核苷酸序列。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的 方法或包含本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与诺 卡噻唑菌素生物合成基因相似的基因。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从诺 卡氏菌Nocardia sp. ffff-12651基因组文库中定位更多的文库质粒。这些文库质粒至少包 含本发明中的部分序列,也包含有Nocardia sp. ffff-12651基因组中以前邻近区域未克隆的 DNA。
本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些 途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性 突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化 (DNAshuffling),或通过紫外线或化学试剂诱变等。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合 适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性或产量的代谢产 物。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些 氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特 征或其他致力于得到的性质。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在 异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通 过遗传重组来构建重组质粒以获得其生物合成途径,也可以通过插入、置换、缺失或失活进 而获得新的生物合成途径。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段 可以通过中断诺卡噻唑菌素生物合成的一个或几个步骤而得到新的诺卡噻唑菌素结构类 似物。包含DNA片段或基因可以用来提高诺卡噻唑菌素或其衍生物的产量,本发明提供了 在基因工程微生物中提高产量的途径。本发明所提供的核苷酸序列编码核糖体机制诺卡噻唑菌素生物合成的前体肽 可以通过插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性 突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化 (DNAshuffling),紫外线或化学试剂诱变等方法来产生新的硫肽类抗生素或其他多肽类代 谢产物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成噻唑环、羟化吡啶环、 吲哚酸等结构单元,并可以通过与其他天然产物的生物合成途径或部分生物合成途径重 组,来获得包含有着这些结构单元并且具有更好生物活性的代谢产物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成诺卡噻唑菌素的大环 骨架和其结构类似物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成4-N,N-二甲基_2,4, 6-脱氧己糖,并可以通过与其他天然产物的生物合成途径或部分生物合成途径重组,来获 得新的糖基化产物。本发明所提供的诺卡噻唑菌素的后修饰基因提供了通过遗传修饰得到类似物的 途径,所包含的氧化还原反应也可有其他应用。总之,本发明所提供的包含诺卡噻唑菌素生物合成相关的所有基因和蛋白信息可 以帮助人们理解硫肽类抗生素的生物合成机制,为进一步遗传改造提供了材料和知识。本 发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或 基因、蛋白。
10


图1 诺卡噻唑菌素的化学结构。图2 诺卡噻唑菌素生物合成基因簇的基因结构和限制性内切酶谱。(A)6个交叠 的黏粒代表了诺卡氏菌Nocardia sp. ffff-12651基因组45kb的DNA区域,S代表限制性内 切酶Smal,实体表示已被DNA测序的部分,黑色粗竖线表示标记的探针部分;(B)诺卡噻唑 菌素生物合成基因簇的基因组成。图3 提出的诺卡噻唑菌素大环骨架的生物合成途径。图4 提出的诺卡噻唑菌素吲哚酸侧链的生物合成途径。图5 提出的诺卡噻唑菌素4-N,N- 二甲基_2,4,6_脱氧己糖的生物合成途径。图6 发酵产物Nocathiacin I的高效液相色谱-质谱(HPLC-MS)分析。(A)高效液相色谱;⑶质谱图7 与诺卡噻唑菌素大环骨架生物合成相关的部分基因对诺肽菌素基因簇中相 似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌Str印tomyces actuosus ATCC25421野生型发酵产物的 HPLC-MS 检测(B)诺肽菌素nosE同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素n0c21异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素nosD同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素nOc20异源回补突变株发酵产物的HPLC-MS检测图8 与诺卡噻唑菌素吲哚酸侧链生物合成相关的部分基因对诺肽菌素基因簇中 相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌Str印tomyces actuosus ATCC25421野生型发酵产物的 HPLC-MS 检测(B)诺肽菌素nosl同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素n0c25异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素nosL同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素n0c27异源回补突变株发酵产物的HPLC-MS检测图9 诺卡噻唑菌素生物合成基因簇中部分P450氧化还原后修饰基因对诺肽菌素 基因簇中相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌Str印tomyces actuosus ATCC25421野生型发酵产物的 HPLC-MS 检测(B)诺肽菌素nosC同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素n0cl9异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素nosB同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素n0C7异源回补突变株发酵产物的HPLC-MS检测图10 诺卡噻唑菌素生物合成基因簇中部分P450氧化还原后修饰基因在诺肽菌 素产生菌Str印tomyces actuosus ATCC25421中的异源表达。(A)诺肽菌素产生菌Str印tomyces actuosus ATCC25421野生型发酵产物的
11HPLC-MS 检测(B)诺卡噻唑菌素nocie异源表达突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素noclS异源表达突变株发酵产物的HPLC-MS检测诺肽菌素结构类似物A的化学结构诺肽菌素结构类似物B的化学结构。图11 诺卡噻唑菌素生物合成基因簇中与丝氨酸边链剪切相关的基因对诺肽菌 素基因簇中相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌Str印tomyces actuosus ATCC25421野生型发酵产物的 HPLC-MS 检测(B)诺肽菌素nosA同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素n0C9异源回补突变株发酵产物的HPLC-MS检测符号说明图INocathiacin I 诺卡噻唑菌素I ;Nocathiacin II:诺卡噻唑菌素II; Nocathiacin III 诺卡噻唑菌素III ;MJ347-81F4-B 诺卡噻唑菌素I的去甲基化产物。图 2 (A) B3 黏粒 pDY2-61-B3, D2 黏粒 pDY2_61_D2,C2 黏粒 pDY2_61_C2,A1 黏粒 pDY2-61-Ai; C4 黏粒 pDY2-61-C4 ;字母 S 代表 SmaI 限制性酶切位点;⑶ suger 4-N,N- 二 甲基-2,4,6-脱氧己糖生物合成基因cyclop印tide诺卡噻唑菌素大环骨架生物合成基因 oxidation诺卡噻唑菌素P450氧化还原后修饰基因Indole acid诺卡噻唑菌素吲哚酸侧链 生物合成基因resistance抗性基因regulation调节基因Unknown未知基因。图3Noc20、21、22、23分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基因 nOC20、21、22、23所编码的蛋白,LP表示诺卡噻唑菌素的信号肽。图4Noc25、26、27、29分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基因 noc25、26、27、29所编码的蛋白,Ado ·表示自由基。图5Noc6、10、12、13、14分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基 因noc6、10、12、13、14所编码的蛋白。图 6(A) 15min 为 Nocathiacin I 的保留时间(B) 1437 为 Nocathiacin I 的分子 离子峰。
具体实施例方式以下结合附图对本发明进一步详细说明。1.诺卡噻唑菌素生物合成基因簇中N,N-二甲基酶基因片段的克隆尽管有关硫肽类抗生素生物合成方面的研究早在上世纪70年代末就已开始,但 是迄今为止关于它们在微生物体内代谢途径的研究都未能有效突破。早期的研究者主要 完成了硫链丝菌肽(Thiostr印ton)、诺肽菌素(Nosih印tide)、硫肽霉素I (sulfomycin I )、GE2270A、A10255G/B/E、诺卡噻唑菌素(Nocathiacins)等的氨基酸前体标记实验 (C13、C14、H2、H3、N15等),并由此推测了它们部分主要结构可能的生物合成途径如认为 其中的噻唑或噻唑啉环来源于半胱氨酸和丝氨酸;而吲哚酸或喹哪酸结构则是由色氨酸 经过多步转化得到的;还认为它们核心结构的氮杂六元环是通过[4+2]环加成反应形成 的[J. Am. Chem. Soc. 1979,101,5069 ;1988,110,5800 ; 1993,115,7557 ; 1993,115,7992 ;1995,117,7606 ;1996,118,11363 ;Biorg.Med. Chem. 1996,4,1135 J. Antibiot. 1992,45, 1499 ;2001,54,1066 J. Chem.Soc.Chem. Commun. 1993,1612 ;Acc.Chem. Res. 1993,26,116 ; Tetrahedron Letters. 2008,49,6265-6268.]。标记实验同样也显示这类抗生素大多具有相似的氨基酸前体,这在一定意义上说 明它们在微生物体内可能是采用相似的生物合成途径得到的。而微生物体内典型的聚肽类 天然产物的生物合成途径大体上可以分为两类核糖体途径和非核糖体途径。Floss小组 曾根据氯霉素抑制实验的结果推测这类抗生素可能是采用非核糖体途径合成的。随后研究 者们尝试了大量的方法来克隆这类抗生素的生物合成基因簇,如突变株互补、反向遗传学、 抗性基因为探针、编码核糖体途径前体肽的基因片段为探针、非核糖体途径生物合成基因 的保守序列为引物、转座子随机中断等方法,但是都没有成功。这就提示我们需要寻找一条 全新的途径来克隆这类抗生素的生物合成基因簇。根据糖肽类抗生素的糖基和母体骨架的生物合成基因大都连锁分布在染色体的 同一区域上这一特点,本发明人决定从克隆Nocathiacin I中脱氧氨基糖的生物合成基 因出发,来克隆整个分子的生物合成基因簇。我们首先根据大量微生物来源的天然产物脱 氧糖基的生物合成途径[Antimicrobial Agents And Chemotherapy, 1999,43,1565-1573 ; Chemistry& Biology,2004,11,959—969 ;Molecular Microbiology,2000,37,752-762.] 推测了 Nocathiacin I中4_N,N-二甲基-2,4,6_脱氧己糖可能的生物合成途径,并选取 可能存在于该途径催化后期的N,N- 二甲基转移酶的保守序列,设计了简并性的PCR引物 Dimeth-Forl 5 ‘ -GCTGAC GTCGCCTGCGGSAC(C/G)GG(A/T/C/G)(G/A/T)(A/T/C/G)(A/T/C/ G)CA-3和 Dimeth-Rev2 5' -CGCG AACGT(G/C)TC(G/C)GG(A/G)AA CCACCA(A/T/G/C)GG(A/ T/G/C)TC-3',然后以Nocardia sp.ffff-12651的总DNA为模板进行PCR扩增,得到约0. 3kb 的PCR产物,克隆入pSP72载体,经测序分析发现与已知的N,N- 二甲基转移酶基因具有很 高的同源性。2.诺卡噻唑菌素生物合成基因簇的克隆,序列分析及功能分析将上述克隆到的N,N-二甲基酶基因片段用地高辛标记为探针,对构建好的 Nocardiasp. WW-12651的基因组文库进行筛选,共得到6个插入片段互相重叠的黏粒,分别 为=CDYAAeHT-Ap B3> C2, C4, D2, D4,涵盖了染色体约 50kb 的 DNA 区域(图 2A 和 2B)(制 法见实施例2)。选取限制性酶切物理图谱中最左端和最右端的黏粒cDY446-2-47-B3、C2进 行亚克隆测序,通过生物信息分析发现,测定的45. 560kb的DNA区域,GC含量为73. 3%,共 包含了 44个开放式读码框(open reading frame,0RF),其中与诺卡噻唑菌素生物合成相 关的有37个。各个基因的功能分析见表1。表1诺卡噻唑菌素生物合成基因簇中各基因及编码蛋白的功能分析
权利要求
一种具有良好抗菌活性的抗生素 诺卡噻唑菌素的生物合成基因簇,其特征在于,包括编码诺卡噻唑菌素生物合成所涉及的37个基因,具体为1)负责诺卡噻唑菌素I大环骨架生物合成的基因,即noc28,noc20,noc21,noc22,noc23,noc9,noc24,noc30共8个基因noc28位于基因簇核苷酸序列第38434 38581个碱基处,长度为150个碱基对,编码诺卡噻唑菌素的前体肽,长度为49个氨基酸;noc23位于基因簇核苷酸序列第30980 32875个碱基处,长度为1896个碱基对,编码杂环化蛋白,长度为631个氨基酸;noc22位于基因簇核苷酸序列第29544 30983个碱基处,长度为1440个碱基对,编码NADH脱氢酶,长度为479个氨基酸;noc21位于基因簇核苷酸序列第26965 29523个碱基处,长度为2559个碱基对,编码脱水酶,长度为852个氨基酸;noc20位于基因簇核苷酸序列第25968 26960个碱基处,长度为993个碱基对,编码脱水酶,长度为330个氨基酸;noc9位于基因簇核苷酸序列第14529 14584个碱基处,长度为456个碱基对,编码未知功能蛋白,长度为151个氨基酸;noc24位于基因簇核苷酸序列第32902 34683个碱基处,长度为1782个碱基对,编码未知功能蛋白,长度为593个氨基酸;noc30位于基因簇核苷酸序列第40176 40916个碱基处,长度为741个碱基对,编码未知功能蛋白,长度为246个氨基酸;2)负责诺卡噻唑菌素I吲哚酸侧链生物合成的基因,即noc25,noc26,noc27,noc29,共4个基因noc27位于基因簇核苷酸序列第36848 37948个碱基处,长度为1101个碱基对,编码自由基SAM硫胺合成酶,长度为366个氨基酸;noc25位于基因簇核苷酸序列第34680 35912个碱基处,长度为1233个碱基对,编码酰基 CoA合成酶,长度为410个氨基酸;noc26位于基因簇核苷酸序列第35933 36820个碱基处,长度为888个碱基对,编码酰基转移酶,长度为295个氨基酸;noc29位于基因簇核苷酸序列第38714 39976个碱基处,长度为1263个碱基对,编码SAM依赖的甲基转移酶,长度为420个氨基酸;3)负责诺卡噻唑菌素I脱氧糖基生物合成的基因,即noc6,noc10,noc11,noc12,noc13,noc14,共6个基因noc10位于基因簇核苷酸序列第14990 15703个碱基处,长度为714个碱基对,编码N 双甲基转移酶,长度为237个氨基酸;noc11位于基因簇核苷酸序列第15728 16972个碱基处,长度为1245个碱基对,编码NDP 己糖3位C上的甲基转移酶,长度为414个氨基酸;noc12位于基因簇核苷酸序列第16984 17970个碱基处,长度为987个碱基对,编码NDP 己糖 3 酮还原酶,长度为328个氨基酸;noc13位于基因簇核苷酸序列第17988 19418个碱基处,长度为1431个碱基对,编码dTDP 4 酮 6 脱氧葡萄糖2,3 脱水酶,长度为476个氨基酸;noc14位于基因簇核苷酸序列第19424 20560个碱基处,长度为1137个碱基对,编码NDP 6 脱氧 D 葡萄糖4位C上的氨基转移酶,长度为378个氨基酸;noc6位于基因簇核苷酸序列第11505 12683个碱基处,长度为1179个碱基对,编码糖基转移酶,长度为392个氨基酸;4)细胞色素P450氧化还原酶基因,即noc7,noc15,noc16,noc18,noc19,共5个基因noc7位于基因簇核苷酸序列第12704 13912个碱基处,长度为1209个碱基对,编码细胞色素P450氧化还原酶,长度为402个氨基酸;noc15位于基因簇核苷酸序列第20591 21703个碱基处,长度为1113个碱基对,编码细胞色素P450氧化还原酶,长度为370个氨基酸;noc16位于基因簇核苷酸序列第21696 22934个碱基处,长度为1239个碱基对,编码细胞色素P450氧化还原酶,长度为412个氨基酸;noc18位于基因簇核苷酸序列第23507 24649个碱基处,长度为1143个碱基对,编码细胞色素P450氧化还原酶,长度为380个氨基酸;noc19位于基因簇核苷酸序列第24646 25926个碱基处,长度为1281个碱基对,编码细胞色素P450氧化还原酶,长度为426个氨基酸;5)甲基转移酶基因,即noc8,noc36,共2个基因noc8位于基因簇核苷酸序列第13909 14532个碱基处,长度为624个碱基对,编码甲基转移酶,长度为207个氨基酸;noc36位于基因簇核苷酸序列第43983 44768个碱基处,长度为786个碱基对,编码甲基转移酶,长度为261个氨基酸;6)抗性基因,即noc17,noc37,共2个基因noc17位于基因簇核苷酸序列第22956 23480个碱基处,长度为525个碱基对,编码博来霉素抗性蛋白,长度为174个氨基酸;noc37位于基因簇核苷酸序列第44914 45423个碱基处,长度为510个碱基对,编码磷酸盐ABC transporter,长度为169个氨基酸;7)调节基因,即noc5,noc33,noc34,共3个基因noc5位于基因簇核苷酸序列第10404 11387个碱基处,长度为984个碱基对,编码SARP家族的转录调节蛋白,长度为327个氨基酸;noc33位于基因簇核苷酸序列第42031 42456个碱基处,长度为426个碱基对,编码热休克蛋白,长度为141个氨基酸;noc34位于基因簇核苷酸序列第42565 43173个碱基处,长度为609个碱基对,编码hsp18转录调节因子,长度为202个氨基酸;8)负责转录翻译的基因,即noc1,noc2,noc3,noc4共4个基因noc1位于基因簇核苷酸序列第7731 8084个碱基处,长度为354个碱基对,编码50S核糖体蛋白L18,长度为117个氨基酸;noc2位于基因簇核苷酸序列第8282 8785个碱基处,长度为444个碱基对,编码DGPFAETKE家族蛋白,长度为147个氨基酸;noc3位于基因簇核苷酸序列第8731 9867个碱基处,长度为1137个碱基对,编码RNA聚合酶ECF 亚族的信号因子,长度为378个氨基酸;noc4位于基因簇核苷酸序列第9968 10387个碱基处,长度为420个碱基对,编码ATP酶,长度为139个氨基酸;9)未知功能基因,即noc31,noc32,noc35,共3个基因noc31位于基因簇核苷酸序列第41003 41410个碱基处,长度为408个碱基对,编码未知功能蛋白,长度为135个氨基酸;noc32位于基因簇核苷酸序列第41492 41953个碱基处,长度为462个碱基对,编码未知功能蛋白,长度为153个氨基酸;noc35位于基因簇核苷酸序列第43228 43758个碱基处,长度为531个碱基对,编码未知功能蛋白,长度为176个氨基酸。
2.根据权利要求1所述的基因簇,其特征在于,所述基因簇包括由noce至nOc30构成 的结构基因;或包括由nocl至n0C37构成的结构基因、抗性基因和调控基因。
3.根据权利要求1所述的基因簇,其特征在于,所述的基因簇的核苷酸序列如SEQID NO :1 中第 7731-45423 位、SEQ ID NO :1 中第 11505-40916 位、或SEQ ID NO 1 中第 1-44560 位所示。
4.根据权利要求1所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白。
5.根据权利要求4所述的编码蛋白,其特征在于,所述的编码蛋白的氨基酸序列如SEQ ID NO 2-38 所示。
6.根据权利要求1所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成 抗生素诺卡噻唑菌素及类似物;用于催化合成噻唑环;用于催化合成羟化吡啶环肽中心; 用于催化合成吲哚酸结构单元;用于催化合成诺卡噻唑菌素的大环骨架;和/或用于催化 合成4-N,N- 二甲基-2,4,6-脱氧己糖。
7.一种含有权利要求1所述的诺卡噻唑菌素的生物合成基因簇的表达载体。
8.—种重组的含有权利要求7所述的表达载体或染色体上整合有权利要求1所述的诺 卡噻唑菌素的生物合成基因簇的宿主细胞。
9.一种产生诺卡噻唑菌素的方法,其特征在于,包括步骤培养权利要求8所述的宿主 细胞从而表达诺卡噻唑菌素,以及从培养液中分离诺卡噻唑菌素。
10.根据权利要求1所述的诺卡噻唑菌素的生物合成基因簇或其部分基因的用途,其 中,用于在S.actuosus ATCC 25421相关基因缺失的突变株中进行异源互补,从而恢复产生 诺肽菌素;或者将后修饰基因在S.actuosus ATCC 25421中进行异源表达产生,从而产生 诺肽菌素的结构类似物。
全文摘要
本发明涉及诺卡噻唑菌素的生物合成基因簇及其应用,具体地提供了一类由诺卡氏菌产生的具有良好抗菌活性的抗生素-诺卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含37个基因8个与大环骨架生物合成相关的基因,4个与吲哚酸侧链合成相关的基因,6个与糖基合成相关的基因,5个P450氧化还原后修饰酶基因,2个甲基转移酶基因,2个抗性基因,3个调节基因,3个未知功能的基因以及4个与转录翻译有关的基因。通过对上述生物合成基因的异源表达可产生一系列新型硫肽类抗生素。本发明所提供的基因及其蛋白可以用来寻找和发现用于医药、工业或农业的化合物或基因、蛋白。
文档编号C12N15/31GK101962647SQ20101024088
公开日2011年2月2日 申请日期2010年7月23日 优先权日2009年7月24日
发明者丁莹, 刘 文, 潘海学, 虞沂 申请人:中国科学院上海有机化学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1