一种芳香聚酮类非典型角环素fluostatins的生物合成基因簇及其应用

文档序号:9447768阅读:639来源:国知局
一种芳香聚酮类非典型角环素fluostatins的生物合成基因簇及其应用
【技术领域】
[0001] 本发明属于微生物基因工程领域,具体设及一种芳香聚酬类非典型角环素 fluostatins的生物合成基因簇及其应用。
【背景技术】
[0002]Fluostatins是从一株南海稀有放线菌--小单抱菌(Micromonosporarosaria) SCSION160的培养物中分离到的芳香聚酬类化合物。从该菌中能制备多种抗生素,该菌 已经申请专利,名称为"一种小单抱菌及利用该菌制备多种抗生素的方法",申请专利号 为:201210467946.X。已报道发现的fluostatins类化合物主要来源于放线菌,例如最早 分离自链霉菌streptomycessp.TA-3391的fluostatinA,B;研究发现该2种化合物具 有酶抑制剂活性,其中fluostatinA还具有一定肿瘤细胞毒活性。随后从Streptomyces StrainActa1383分到fluostatinC~E,最近的一个例子是从宏基因组文库筛选的2个 cosmids拼接成的基因簇在S.a化US中异源表达出fluostatinF~H,之后我们课题组从 MicromonosporarosariaSCSI0N160 中分到fluostatinI~K,及两个结构相关化合物 r油elomycin,地enant虹oviridone,且地enant虹oviridone具有明显的肿瘤细胞毒活性。 最近研究表明由fluostatins类似物kinamycin的单体形成的二聚体化合物lomaiviticin 具有较强的细胞毒活性,其作用机制在于可W引起细胞中DM双键断裂。
[0003] 近十多年来发展起来的组合生物合成技术为改造复杂天然产物提供了新的思路 和方法。在阐明了自然界的生物合成途径、克隆和鉴定微生物天然产物生物合成基因簇的 基础上,采用组合生物合成技术对发现的生物合成基因、调控基因进行体内敲除、突变、置 换和重组等操作,不但能够生产"非天然"的天然产物结构类似物,而且还可W提高天然产 物的产量,或定向积累所需要的天然产物,为天然产物的发现和药物开发提供分子和活性 多样性。
[0004] 迄今为止,关于具体的fluostatins基因簇,及fluostatins类化合物中设及到的 开环重排机制,重氮原子的引入机制鲜有报道。

【发明内容】

[0005] 本发明的第一个目的是提供一种芳香聚酬类非典型角环素fluostatins的生物 合成基因簇,其来源于南海稀有放线菌--小单抱菌(Micromonosporarosaria)SCSI0 N160〇
[0006] 本发明的fluostatins的生物合成基因簇,其特征在于,该生物合成基因簇的核 巧酸序列如SEQIDNO. 1的第1~40128位的碱基序列所示,包含36个基因,具体为:
[0007] (1)负责聚酬链骨架合成及合成过程中进行修饰的基因,即flsD、flsE、flsC、 flsB、flsA、flsl共 6 个基因:
[0008]flsD位于基因簇核巧酸序列第6028-6978个碱基处,长度为951个碱基对,编码芳 香化酶,316个氨基酸;
[0009]flsE位于基因簇核巧酸序列第7005-7787个碱基处,长度为783个碱基对,编码酬 基还原酶,260个氨基酸;
[0010]flsC位于基因簇核巧酸序列第7801-8076个碱基处,长度为276个碱基对,编码酷 基载体蛋白,91个氨基酸;
[0011]flsB位于基因簇核巧酸序列第8119-9357个碱基处,长度为1239个碱基对,编码 链延伸因子,412个氨基酸;
[0012] flsA位于基因簇核巧酸序列第9357-10625个碱基处,长度为1269个碱基对,编码 酬脂酷合成酶,422个氨基酸;
[0013]flsl位于基因簇核巧酸序列第10622-10951个碱基处,长度为330个碱基对,编码 聚酬环化酶,109个氨基酸;
[0014] (2)氧化还原相关基因,即fls02、fls03、flsLflsOl、flsG、fls04、flsP、fls05 共8个基因:
[0015]fls02位于基因簇核巧酸序列第3059-4525个碱基处,长度为1467个碱基对,编码 聚酬加氧酶,488个氨基酸;
[0016]fls03位于基因簇核巧酸序列第4538-6031个碱基处,长度为1494个碱基对,编码 聚酬加氧酶,497个氨基酸;
[0017]flsL位于基因簇核巧酸序列第12350-12751个碱基处,长度为402个碱基对,编码 FMN结合的氧化相关的酶,133个氨基酸;
[0018]flsOl位于基因簇核巧酸序列第12877-14370个碱基处,长度为1494个碱基对,编 码聚酬加氧酶,497个氨基酸;
[0019]flsG位于基因簇核巧酸序列第14412-15125个碱基处,长度为714个碱基对,编码 单加氧酶,237个氨基酸;
[0020]fls04位于基因簇核巧酸序列第17957-19447个碱基处,长度为1491个碱基对,编 码聚酬加氧酶,496个氨基酸;
[0021]flsP位于基因簇核巧酸序列第19664-20896个碱基处,长度为1233个碱基对,编 码FAD依赖的氧化还原酶,410个氨基酸;
[0022] fls05位于基因簇核巧酸序列第24357-25847个碱基处,长度为1491个碱基对,编 码聚酬加氧酶,496个氨基酸;
[0023] (3)编码调控子和转运子的基因,即flsRl、flsR2、flsR3共3个基因:
[0024]flsRl位于基因簇核巧酸序列第11354-11980个碱基处,长度为627个碱基对,编 码反应调控蛋白,208个氨基酸;
[00巧]flsR2位于基因簇核巧酸序列第25894-26919个碱基处,长度为1026个碱基对,编 码StrR家族调控蛋白,341个氨基酸;
[0026]flsR3位于基因簇核巧酸序列第36470-37159个碱基处,长度为690个碱基对,编 码反应调控蛋白re姑3, 229个氨基酸;
[0027] (4)与氮原子引入相关的基因,即flsNl、flsN2、flsT、flsS、flsN3、flsM、flsV、 flsU2共8个基因:
[0028]flsNl位于基因簇核巧酸序列第27274-28485个碱基处,长度为1212个碱基对,编 码NO合酶氧化酶,403个氨基酸;
[0029]flsN2位于基因簇核巧酸序列第28492-29313个碱基处,长度为822个碱基对,编 码碳氮水解酶,273个氨基酸;
[0030] f 1st位于基因簇核巧酸序列第29303-29704个碱基处,长度为402个碱基对,编码 乙酷基转移酶家族蛋白,133个氨基酸;
[0031]flsS位于基因簇核巧酸序列第29701-30975个碱基处,长度为1275个碱基对,编 码腺巧酸基班巧酸裂解酶,424个氨基酸;
[0032]flsN3位于基因簇核巧酸序列第31223-32602个碱基处,长度为1380个碱基对,编 码谷氨酷胺氨基转移酶亚基A,459个氨基酸;
[0033]flsM位于基因簇核巧酸序列第32610-34133个碱基处,长度为1524个碱基对,编 码谷氨酷胺合成酶,507个氨基酸;
[0034]flsV位于基因簇核巧酸序列第34196-34582个碱基处,长度为387个碱基对,编码 4Fe-4S结合的铁氧还蛋白,128个氨基酸;
[0035]flsU2位于基因簇核巧酸序列第34579-36447个碱基处,长度为1869个碱基对,编 码未知功能蛋白,622个氨基酸;
[0036] (5)其他后修饰基因及功能未知基因,即flsF、flsK、flsUl、flsQl、flsM、flsH、 flsQ2共7个基因:
[0037]flsF位于基因簇核巧酸序列第1498-3057个碱基处,长度为1560个碱基对,编码 簇基转移酶,519个氨基酸;
[0038]flsK位于基因簇核巧酸序列第15183-15734个碱基处,长度为552个碱基对,编码 未知功能蛋白,183个氨基酸;
[0039]flsUl位于基因簇核巧酸序列第15934-17037个碱基处,长度为1104个碱基对,编 码未知功能蛋白,367个氨基酸;
[0040]flsQl位于基因簇核巧酸序列第17119-17889个碱基处,长度为771个碱基对,编 码短链脱氨酶家族蛋白,256个氨基酸;
[0041]flsM位于基因簇核巧酸序列第20943-21950个碱基处,长度为1008个碱基对,编 码氧甲基转移酶,335个氨基酸;
[0042]flsH位于基因簇核巧酸序列第22223-23002个碱基处,长度为780个碱基对,编码 水解酶,259个氨基酸;
[0043]flsQ2位于基因簇核巧酸序列第23599-24354个碱基处,长度为756个碱基对,编 码短链脱氨酶家族蛋白,251个氨基酸;
[0044](6)在fluostatins生物合成基因簇的上下游基因,即orf(-2)、orf(-1)、orfl、 orf2共4个基因:
[0045] 0计(-2)位于基因簇核巧酸序列第1-1161个碱基处,长度为1161个碱基对,编码 辅酶A转移酶III家族蛋白,386个氨基酸;
[0046] 0计(-1)位于基因簇核巧酸序列第1307-1501个碱基处,长度为195个碱基对,编 码未知功能蛋白,64个氨基酸;
[0047]orfl位于基因簇核巧酸序列第37835-38107个碱基处,长度为273个碱基对,编码 未知功能蛋白,90个氨基酸;
[0048] orf2位于基因簇核巧酸序列第38869-40128个碱基处,长度为1260个碱基对,编 码3-憐莽草酸-1-簇乙締基转移酶,419个氨基酸;
[0049]SE
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1