三欣卡辛的生物合成基因簇及其应用

文档序号:9195842阅读:962来源:国知局
三欣卡辛的生物合成基因簇及其应用
【技术领域】
[0001] 本发明属于微生物基因资源和基因工程领域,具体涉及抗菌抗疟及抗肿瘤抗生素 三欣卡辛(Trioxacarcin)的生物合成基因簇的克隆、分析、功能研究及其应用,三欣卡辛的 产量提高以及中间体化合物的结构阐明。
【背景技术】
[0002] 三欣卡辛类化合物(Trioxacarcins,结构如图1所示),是1981年由日本科 学家Fusao Tomita从北海道札幌市土壤中分离得到。这类化合物呈现淡黄色到黄色, 在 366nm 下发出淡绿色荧光[J. Antibiot. (Tokyo) 12, 1519-1524 (1981) ]。Rajendra P. Maskey等人随后在2004年也对这类化合物在另外一个海洋来源的链霉菌Streptomyces sp. isolateB86523 进行分离[J. Antibiot. (Tokyo) 57, 71 (2004)]。
[0003] 三欣卡辛类化合物它是由链霉菌Streptomyces bottropensis D0-45所产生 的一类化合物,具有良好的抗菌、抗疟及抗肿瘤活性。其中对于革兰氏阳性菌(Bacillus subtilis, Staphylococcus aureus)均有一定的活性,对革兰氏阴性菌(Escherichia coli)也具有中等的活性。trioxacarcin A,trioxacarcin D具有非常高的抗痕活性,与 青蒿素(artemisinin)活性相当;对于肺癌肿瘤细胞,有良好的活性(IC90=0.74ng/ml)。 [Nucleic Acids Research, 2008, 36, 3508 - 3514]
[0004] 人们在随后的发酵中分离发现七种三欣卡辛类似物,包括trioxacarcins A_F[58]及gutingimycin,它们具有共同的蒽醌骨架结构,其中含氧三元环是最重要的 活性位点,同时糖苷配基上的乙酰基也是非常重要的活性基团,它的药效作用机理可能 是与DNA结合,最终鸟嘌呤核苷酸中含氮碱基七位氮原子亲核进攻三元含氧环,发生 开环后鸟噪呤碱基留在三欣卡辛分子结构上形成gutingimycin。[Angew. Chem. Int. Ed. 2004, 43, 1281 - 1281]
[0005] 三欣卡辛分子由三部分组成:蒽环骨架、三并含氧螺环结构以及两个不同的酰基 化修饰的脱氧己糖单元。其中的蒽环骨架是以II型PKS的方式合成的。II型PKS由miniPKS 以及相关的负责折叠、环化、氧化还原以及其他修饰的后修饰酶组成。人们认为miniPKS 一般由丙二酰-ACP经过脱羧产生的乙酸单元转移至KS活性位点而起始,而后KS催化ACP 上丙二酰硫酯脱去二氧化碳形成碳负离子与KS上酰基发生Claisen缩合在ACP上形成相 应的硫酯结构,接着转移至KS活性位点而完成两碳单元的延伸。当聚酮通道充满时,聚酮 酰-ACP离开体系发生随后的酮基还原、环化、氧化等后修饰。阐明蒽环骨架的合成机理对 于丰富人们对蒽环类天然产物的认识、改造蒽环类天然产物的合成路径以产生价值更高的 "非天然"天然产物都有重要意义。
[0006] 分子的三元含氧螺环和脱氧糖基均是药效基团,而且结构比较新颖,但是目前的 对其合成途径还不甚了解,推测其合成机制是比较独特的。因此,阐明这两个基团的合成过 程,理解其生物合成的酶学机制,将大大提升人们对抗菌抗肿瘤天然产物构效关系及生物 合成原理的认识。在阐明了三欣卡辛生物合成的酶学机制的基础上,人们还可以通过敲除 和添加相关的生物合成基实现对三欣卡辛分子的改造,以期获得活性更高、专一性更强、毒 性更低的中间体和衍生物。同时,三欣卡辛生物合成机理的阐明,对人们深入理解芳香聚酮 类化合物、理解复杂的氧化后修饰作用必然会起到很大的帮助。进一步还可以将三欣卡辛 生物合成基因簇中负责含氧杂环和负责脱氧糖基合成的基因应用到现有的某些药物的生 物合成过程中,通过组合生物合成改造现有的某些药物,提高其生理活性或降低其对人体 的毒性。

【发明内容】

[0007] 本发明的目的是提供三欣卡辛生物合成相关的基因簇及其应用。
[0008] 本发明的第一方面,提供了一种三欣卡辛的生物合成基因簇,所述基因簇包括以 下三欣卡辛生物合成所涉及的56个基因 :
[0009] 1) 13 个 II 型聚酮合成酶 PKS 相关基因:即 txn5_8, txnl3, txnl7, txnl9, txn27, txn36, txn39, txn41, txn43, txn46 :
[0010] txn5位于基因簇核苷酸序列第19560-17875位,编码酰基转移酶,长度为562个氨 基酸;
[0011] txn6位于基因簇核苷酸序列第19990-19718位,编码酰基承载蛋白,长度为91个 氨基酸;
[0012] txn7位于基因簇核苷酸序列第21275-20055位,编码链延伸因子,长度为407个氨 基酸;
[0013] txn8位于基因簇核苷酸序列第22534-21272位,编码酮基合成酶,长度为421个氨 基酸;
[0014] txnl3位于基因簇核苷酸序列第28909-27953位,编码芳香化酶,长度为319个氨 基酸;
[0015] txnl7位于基因簇核苷酸序列第33234-34016位,编码酮基还原酶,长度为261个 氨基酸;
[0016] txnl9位于基因簇核苷酸序列第35711-36748位,编码脱氢酶,长度为346个氨基 酸;
[0017] txn27位于基因簇核苷酸序列第45439-44318位,编码环氧水解酶,长度为374个 氨基酸;
[0018] txn36位于基因簇核苷酸序列第55665-55138位,编码芳香环羟化双加氧酶亚基, 长度为176个氨基酸;
[0019] txn39位于基因簇核苷酸序列第57618-58403位,编码短链脱氢酶,长度为262个 氨基酸;
[0020] txn41位于基因簇核苷酸序列第58987-59901位,编码环化酶,长度为305个氨基 酸;
[0021] txn43位于基因簇核苷酸序列第61547-61101位,编码芳香环羟化双加氧酶亚基, 长度为149个氨基酸;
[0022] txn46位于基因簇核苷酸序列第64276-63554位,编码氧化还原酶,长度为241个 氨基酸;
[0023] 2)4个负责起始单元合成相关基因;即txnl2, txnl4_16 ;
[0024] txnl2位于基因簇核苷酸序列第27815-26076位,编码苹果酸辅酶A (CoA)合成酶, 长度为580个氨基酸;
[0025] txnl4位于基因簇核苷酸序列第30020-28986位,编码3-氧代酰基-酰基承载蛋 白(ACP)合成酶,长度为345个氨基酸;
[0026] txnl5位于基因簇核苷酸序列第31680-30049位,编码2-异苹果酸合酶,长度为 544个氨基酸;
[0027] txnl6位于基因簇核苷酸序列第33014-31761位,编码酰基辅酶A转移酶,长度为 418个氨基酸;
[0028] 3) 13个负责边链糖基合成相关基因,即txnl-4, txn28-32, txn42,45,49,50 ;
[0029] txnl位于基因簇核苷酸序列第12861-13853位,编码dTDP-葡萄糖4, 6-脱水酶, 长度为331个氨基酸;
[0030] txn2位于基因簇核苷酸序列第14848-13976位,编码dTDP葡萄糖合酶,长度为 291个氨基酸;
[0031] txn3位于基因簇核苷酸序列第15503-16486位,编码丙酮酸脱氢酶α亚基,长度 为328个氨基酸;
[0032] txn4位于基因簇核苷酸序列第16520-17557位,编码丙酮酸脱氢酶β亚基,长度 为346个氨基酸;
[0033] txn28位于基因簇核苷酸序列第46543-45557位,编码NAD-己糖-4-酮基还原酶, 长度为329个氨基酸;
[0034] txn29位于基因簇核苷酸序列第47181-46540位,编码dTDP-4-脱氧葡萄 糖-3, 5-异构酶,长度为214个氨基酸;
[0035] txn30位于基因簇核苷酸序列第48428-47187位,编码NDP-己糖-3碳-甲基转移 酶,长度为414个氨基酸;
[0036] txn31位于基因簇核苷酸序列第48662-50128位,编码NDP-脱氧葡萄糖-2, 3-脱 水酶,长度为489个氨基酸;
[0037] txn32位于基因簇核苷酸序列第50125-51090位,编码NDP-己糖-3-酮基还原酶, 长度为322个氨基酸;
[0038] txn42位于基因簇核苷酸序列第61080-59929位,编码糖基转移酶,长度为384个 氨基酸;
[0039] txn45位于基因簇核苷酸序列第63460-62186位,编码糖基转移酶,长度为425个 氨基酸;
[0040] txn49位于基因簇核苷酸序列第68041-66848位,编码酰基转移酶,长度为398个 氨基酸;
[0041] txn50位于基因簇核苷酸序列第69353-68070位,编码糖基转移酶,长度为428个 氨基酸;
[0042] 4) 13个负责复杂的三并元含氧螺环后修饰基因,即txn21, txn23_26,txn35, txn3 7,txn40,txn44, txn47, txn51-53 ;
[0043] txn21位于基因簇核苷酸序列第38405-37200位,编码p450细胞色素氧化酶,长度 为402个氨基酸;
[0044] txn23位于基因簇核苷酸序列第40945-39710位,编码铁氧化还原蛋白,长度为 412个氨基酸;
[0045] txn24位于基因簇核苷酸序列第41268-40945位,编码铁氧化还原蛋白,长度为 108个氨基酸;
[0046] txn25位于基因簇核苷酸序列第41505-42989位,编码三肽氨基肽酶,长度为495 个氨基酸;
[0047] txn26位于基因簇核苷酸序列第44290-43061位,编码p450细胞色素氧化酶,长度 为410个氨基酸;
[0048] txn35位于基因簇核苷酸序列第55060-53840位,编码p450细胞色素氧化酶,长度 为407个氨基酸;
[0049] txn37位于基因簇核苷酸序列第56938-55823位,编码氧化酶,长度为372个氨基 酸;
[0050] txn40位于基因簇核苷酸序列第58430-58966位,编码黄素还原酶类似的氧化还 原酶,长度为179个氨基酸;
[0051] txn44位于基因簇核苷酸序列第61741-62106位,编码未知功能蛋白,长度为122 个氨基酸;
[0052] txn47位于基因簇核苷酸序列第65379-64357位,编码氧甲基转移酶,长度为341 个氨基酸;
[0053] txn51位于基因簇核苷酸序列第70423-69404位,编码氧甲基转移酶,长度为340 个氨基酸;
[0054] txn52位于基因簇核苷酸序列第71697-70474位,编码p450细胞色素氧化酶,长度 为408个氨基酸;
[0055] txn53位于基因簇核苷酸序列第72753-71731位,编码氧甲基转移酶,长度为341 个氨基酸;
[0056] 5) 2 个抗性基因,即 txn33, txn38 ;
[0057] txn33位于基因簇核苷酸序列第52661-51159位,编码抗性蛋白,长度为501个氨 基酸;
[0058] txn38位于基因簇核苷酸序列第57431-56967位,编码抗性蛋白,长度为155个氨 基酸;
[0059] 6) 7 个调苄基因,即 txnO, txn9_ll, txnl8, txn34, txn55 ;
[0060] txnO位于基因簇核苷酸序列第11766-12050位,编码LuxR家族调节因子,长度为 93个氨基酸;
[0061] txn9位于基因簇核苷酸序列第23673-22882位,编码SARP家族调控因子,长度为 264个氨基酸;
[0062] txnlO位于基因簇核苷酸序列第24216-25400位,编码双组份激酶,长度为395个 氨基酸;
[0063] txnll位于基因簇核苷酸序列第25422-26033位,编码双组份激酶调节因子,长度 为204个氨基酸;
[0064] txnl8位于基因簇核苷酸序列第34147-35649位,编码外排蛋白,长度为501个氨 基酸;
[0065] txn34位于基因簇核苷酸序列第53757-52738位,编码转录因子调节蛋白,长度为 340个氨基酸;
[0066] txn55位于基因簇核苷酸序列第74585-73725位,编码SARP家族调控因子,长度为 287个氨基酸;
[0067] 7)其他未知功能基因,即 txn20, txn22, txn48, txn54 ;
[0068] txn2
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1