用于羊毛硫抗生素107891的生物合成的基因和蛋白质的制作方法

文档序号:439540阅读:390来源:国知局
专利名称:用于羊毛硫抗生素107891的生物合成的基因和蛋白质的制作方法
用于羊毛硫抗生素107891的生物合成的基因和蛋白质概述本发明涉及羊毛硫抗生素(lantibiotics)的领域,更特别地涉及编码羊毛硫 抗生素107891和其同系物的生物合成途径所需的酶的核酸分子的分离。公开的是涉及 107891产生的基因产物的功能。本发明提供了 107891产生所必需的新的生物合成基因、编 码的多肽、包含编码所述多肽的核酸序列的重组载体、用所述载体转化的宿主细胞以及利 用所述转化的宿主细胞生产羊毛硫抗生素的方法,包括生产107891、其前体、其衍生物、或 不同于107891的修饰的羊毛硫抗生素或其前体的方法。
背景技术
对现有抗生素有抗性的病原细菌的持续增多是全球性的卫生问题,因而存在着发 现和开发对抗性细菌有活性的新化合物的迫切需求。这重新引起了对天然产物的兴趣,这 些天然产物过去是抗生素如青霉素、大环内酯类和糖肽的丰富来源。吸引人的候选物还有 抗微生物肽以及在它们之中被称为羊毛硫抗生素的那些,即含羊毛硫氨酸的抗生素。羊毛 硫抗生素形成抗微生物肽内的特殊基团,通过几个特征来辨别,例如一级和立体结构特征、 独特的生物合成途径以及肽修饰反应和强力的抗细菌活性。这些是由革兰氏阳性细菌分 泌的、并主要作用于革兰氏阳性细菌的一组肽衍生的抗微生物化合物。羊毛硫抗生素作为 前原肽(pr印rop印tide)由核糖体合成,所述前原肽被翻译后修饰为它们的生物学活性形 式。前肽(pr印印tide)由N-末端前导序列和C-末端区域(原肽(prop印tide))组成,所 述N-末端前导序列不经历任何翻译后修饰,在从细胞分泌期间或之后被裂解,所述C-末端 区域被翻译后修饰。羊毛硫抗生素由不同的细菌产生这些化合物的共同特征是一个或更 多个羊毛硫氨酸残基的存在,羊毛硫氨酸残基由通过硫醚键共价交联的两个丙氨酸残基组 成。当半胱氨酸残基与脱氢丙氨酸或脱氢氨基丁酸部分反应来分别形成羊毛硫氨酸或甲基 羊毛硫氨酸残基时形成硫醚键。脱氢氨基酸残基依次分别通过丝氨酸和苏氨酸的脱水来形 成。根据它们的结构和功能性质,羊毛硫抗生素通常被分为两类,A型和B型。A型羊毛硫 抗生素是长度从20到34个氨基酸残基的长形的阳离子肽乳链菌肽、枯草菌素、表皮素和 Pep5是这个类别的成员。B型是具有净负电荷的球形的肽这个羊毛硫抗生素类别的实例 有mersacidin、肉桂霉素、乳链球菌素481和actagardine。这些结构上的不同反映在了作 用的机制上。通过可能由或不由对细胞靶脂质II的先期对接所辅助的一种机制,A型化合 物通过阻断细胞壁生物合成和通过在细胞膜中形成孔来发挥它们的抗微生物活性。B型羊 毛硫抗生素还通过抑制肽聚糖生物合成来发挥它们的抗微生物活性,但是这些化合物在与 脂质II结合时不形成孔。羊毛硫抗生素已经显示了具有作为食品添加剂和抗菌剂的效力和用途。最多研 究的羊毛硫抗生素乳链菌肽由乳酸乳球菌(Lactococcus lactis)产生,在低浓度(低 纳摩尔MIC)下针对多种革兰氏阳性细菌包括药物抗性菌株和食物传染的病原体肉毒杆 菌(Clostridium botulinum)和单核细胞增生利斯特氏菌(Listeria monocytogenes) 具有活性。它已经广泛地用作食品防腐剂而没有细菌抗性的实质性发生。其他的 羊毛硫抗生素显示了感兴趣的生物学活性例如,表皮素显示了针对疮疱丙酸杆菌(Propionibacteriumacnes)的高效力;肉桂霉素和耐久霉素抑制磷脂酶A2和血管紧张肽 转变酶,分别提供了作为抗炎剂和用于血压调节的应用潜力;mersacidin抑制许多革兰氏 阳性细菌,包括甲氧西林抗性金黄葡萄球菌(Staphylococcus aureas) (MRSA)。对羊毛硫抗生素的生物合成负责的基因以成为基因座符号lan的聚簇来组织,对 每种羊毛硫抗生素具有更为具体的遗传型名称(例如,乳链菌肽为nis,gallidermin为 gdm,肉桂霉素为cin)。许多lan基因已经被测序,证明了在基因结构上高水平的相似性。 每个聚簇包括编码前肽的结构基因lanA ;以及在LanA的原肽部分中Ser和Thr残基的 脱水和硫醚形成所需的一或多个基因。对于A型羊毛硫抗生素,LanB进行脱水反应,LanC 致力于硫醚键连,而在B型羊毛硫抗生素中,单个LanM酶催化这两种反应。其他基因通常 存在于羊毛硫抗生素聚簇中lanT编码用于羊毛硫抗生素的分泌的ABC转运蛋白,通常与 由lariETO基因编码的第二转运系统组合;lanP编码加工蛋白酶,但是某些聚簇缺少这一基 因,其可以是lanT的部分或它的功能由细胞的蛋白酶提供;lanl编码涉及自我保护的蛋白 质;lanKR对调节lan基因的表达负责。存在着通过操作天然化合物来获得改进的羊毛硫抗生素的可能性和实用性。然 而,羊毛硫抗生素是结构上复杂的肽,它们对化学作用的可接近性限于分子中的一些位置。 化学作用的主要局限性之一是改变肽主链中存在的氨基酸的类型或顺序。鉴于此,希望的 是拥有对于在羊毛硫抗生素形成中重定向这些步骤有用的基因和酶,以获得通过化学手段 难以或不可能制得的衍生物。因而,直接通过使用精确工程化的菌株的发酵过程来设计新 的羊毛硫抗生素衍生物的一般方法将是高度期望的。实际上,在羊毛硫抗生素中的异常氨基酸单独地促进了它们的生物学活性并且还 增强它们的结构稳定性。涉及羊毛硫抗生素生物合成的酶表现了通过将异常氨基酸导入期 望的肽中用于肽工程化的高度潜力。羊毛硫抗生素107891显示了针对革兰氏阳性细菌包括甲氧西林和万古霉素抗 性菌株的抗细菌活性,但是对革兰氏阴性细菌示出了有限的活性(例如某些莫拉氏菌属 (Moraxella spp.)、奈瑟氏菌属(Neisseria spp.)禾口嗜血杆菌属(Haemophilus spp.))。 107891 分离自小双孢菌(Microbispora sp.)PTA-5024 的发酵物(W0 2005/04628A1)。它 由紧密相关的因子A1和A2的复合物组成,它的结构可以重新推导为肽骨架,长度24个氨 基酸,含有羊毛硫氨酸和甲基羊毛硫氨酸作为组成部分。此外,氯原子和一个或两个-0H残 基存在于分子上。107891复合物的组分的结构由图3的式1代表,其中R代表
和因 子A1 (R = 0H)、因子A2 (R = -(0H)2)。107891看起来组合了 A型和B型羊毛硫抗生素的元 件107891中的环A和B与A型化合物中的等价的环高度相关;然而,如在B型羊毛硫抗生 素中的,107891是更为球形的,它缺少柔性C-末端尾部并且缺乏带电的氨基酸残基。因此, 不能预测致力于107891形成的lan聚簇是编码单独的LanM酶还是独立的LanB和LanC蛋 白。此外,对于含氯的羊毛硫抗生素没有先例,因而对这种翻译后修饰负责的基因无法从现 有数据预测。抗生素生产的工业过程的设计是相对成功的,产生了抗生素滴度达到每升几克 的水平的大规模发酵。这主要是通过经验性的、尝试与错误的方法来实现的,缺少理论基 础。因而新工艺的开发和现有技术的改进仍然是费时的,可能产生不稳定的细菌培养物、不 一致地进行和积累不需要的副产品。近年来,已经成功地应用了理论方法来提高链霉菌属(Streptomycesspp.)产生的抗生素的水平,其通常涉及感兴趣的基因簇内存在的关键调节 元件的操作或途径中限速步骤的过表达。因而,编码这样的聚簇相关的调节物或合成限制 步骤的基因可能成为产量改进的有效工具。然而,迄今为止在放线菌中鉴定的聚簇相关的 调节物属于几个不同的蛋白质家族。甚至在一个家族内部,存在着序列相同性方面相当大 的变异。因而,聚簇相关的调节物的存在、性质、数量和序列不能通过与其他聚簇比较来预 测,甚至是指定了相关抗生素的那些。举例来说,泰乐菌素基因簇编码四种不同的调节物, 而在指定相关的大环内脂类抗菌素红霉素的聚簇中都没有发现。类似地,生物合成途径中 限速步骤的性质和原因不能先验地确定。因而,提高107891产量的工具是高度期望的。然而,没有来自小双孢菌属的其他 成员的聚簇的实例。因而,不能预测生产者菌株保护自身免于107891作用、调节其他lan 基因表达、或lan基因与它的其他细胞过程配合表达的机制。与这些相关的信息对于优化 生产过程将是非常有用的。发明描述本发明提供了微生物中羊毛硫抗生素107891的生物合成所需的一组分离的多核 苷酸分子。因而,根据一个方面,本发明涉及选自连续DNA序列(SEQ ID NO 1)的多核苷酸分 子,所述DNA序列代表了分离自小双孢菌(Microbisporasp. )PTA-5024的、由编码107891 形成所需多肽的17个0RF组成的mlb基因簇。由所述17个0RF编码的多肽的氨基酸序列在SEQ ID NO 2到18中提供。本发明还提供了包含选自由以下组成的组中的核苷酸序列的分离的核酸a)编码107891和其同系物的合成所需的多肽的mlb基因簇(SEQ IDN0 1);b)编码由mlb基因簇(SEQ ID NO 1)编码的相同多肽、与mlb基因簇自身的核苷 酸序列不同的核苷酸序列;c)mlb 0RF 1到17的任何核苷酸序列,编码由SEQ ID NO 2到18编码的多肽;d)编码由mlb 0FR 1到17的任一个编码的相同的多肽(SEQ ID NO 2到18)、与 所述0RF的核苷酸序列不同的核苷酸序列。本发明的进一步的主题是提供了包含选自由以下组成的组中的核苷酸序列的分 离的核酸e)编码一多肽的核苷酸序列,所述多肽在其全长上在氨基酸序列上与mlb 0RF 1 到17的任一个编码的多肽(SEQ ID NO 2到18)至少具有65%、优选86%、更优选90%、 最优选95%或更高的相同性。在一个实施方案中,本发明的分离的核酸包含选自0RF 1到17(SEQ IDN0:2到18) 的0RF,其编码107891的前原肽的合成所需的多肽。在另一个实施方案中,所述核酸包含选自0RF 1到17(SEQ ID NO :2到18)的0RF, 其编码107891脱水酶的合成所需的多肽。在又一个实施方案中,所述核酸包含选自0RF 1 到17(SEQ ID NO 2到18)的0RF,其编码107891的羊毛硫氨酸和甲基-羊毛硫氨酸残基 的合成所需的多肽。根据另一个实施方案,在本发明的核酸中,提供了选自0RF 1到17(SEQ ID NO 2 到18)的0RF,其编码107891的氨基酸4的色氨酸残基的氯化所需的多肽。
在又一个实施方案中,提供了包含选自0RF 1到17(SEQ ID NO 2到18)的0RF的 核酸,其编码107891的氨基酸14的脯氨酸残基的羟基化所需的多肽。在又一个实施方案中,提供了包含选自0RF 1到17(SEQ ID NO 2到18)的0RF的 核酸,其编码氧化脱羧作用所需的黄素蛋白,氧化脱羧作用在107891的位置21和24产生 S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸(AviMeCys)残基。根据另一个实施方案,在本发明的核酸中,提供了选自0RF 1到17(SEQ ID NO 2 到18)的0RF,其编码黄素蛋白还原所需的多肽。根据又一个实施方案,提供了核酸,其包含选自0RF 1到17(SEQ IDN0 2到18)的 0RF的组合,编码对107891的输出和抗性所需的多肽。在又一个实施方案中,提供了核酸,其包含选自0RF 1到17(SEQ IDN0 2到18)的 0RF的组合,编码调节mlb基因簇表达所需的多肽。本领域技术人员理解的是,已经提供了编码107891生物合成途径的多肽的核苷 酸序列,本发明还提供了编码来自这样的多肽的片段的核苷酸。根据本发明,本领域技术人 员理解的是,由于遗传密码是简并性的,由SEQID NO 2到18所编码的相同的多肽可以由 0RF 1到17的天然或人工变体编码,即由0RF 1到17所指定的基因组核苷酸序列之外的、 但是编码相同的多肽的核苷酸序列编码。此外,还要理解的是,天然发生的或人工制造的变体可以出自SEQ IDN0:2到18编 码的多肽,所述变体具有与上述原始多肽相同的一或多种功能,但是含有对于折叠或催化 功能非关键的氨基酸的添加、缺失或取代,或必需氨基酸的保守性取代。本领域技术人员还理解的是,提供了 107891生物合成所需的全部聚簇的核苷酸 序列,本发明还提供了所述聚簇中存在的基因的表达所需的核苷酸序列。这样的调节序列 包括但不限于启动子和增强子序列、反义序列、转录终止子和抗终止子序列。这些序列对于 调节mlb基因簇中存在的基因的表达是有用的。带有单独的或与其他核苷酸序列融合的所 述核苷酸序列的细胞也在本发明的范围之内。在一个方面,本发明提供了包含核苷酸序列的分离的核酸,所述核苷酸序列编码 0RF6多肽(SEQ ID NO :7)、或所述多肽的天然发生的变体或衍生物,编码107891的前原肽。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码0RF7 多肽(SEQ ID NO :8)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中丝 氨酸和苏氨酸残基的脱水化是有用的。在又一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码0RF8 多肽(SEQ ID NO :9)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中羊 毛硫氨酸和甲基_羊毛硫氨酸形成是有用的。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码 0RF9多肽(SEQ ID NO :10)、或所述多肽的天然发生的变体或衍生物,对于抗生素前体中 AviMeCys形成是有用的。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸 序列编码0RF15多肽(SEQ IDN0:16)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫 抗生素前体中色氨酸残基的氯化是有用的。在又一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码0RF2 多肽(SEQ ID NO :3)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中脯氨酸残基的羟基化是有用的。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码0RF1、 10到11、13到14和17(SEQ ID NO :2、11到12、14到15、和18)所指定的多肽,或所述多肽 的天然或人工发生的变体或衍生物,对于107891或107891前体的细胞输出是有用的。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码0RF3 和5多肽(SEQ ID NO :4和6)、或所述多肽的天然或人工发生的变体或衍生物,对于调节羊 毛硫抗生素产生是有用的。在一个实施方案中,本发明提供了带有核苷酸序列的额外的拷贝的羊毛硫抗生素 生产菌株,所述核苷酸序列指定选自0RF 1到17(SEQ ID N0:2到18)的任一个的至少一个 0RF。在一个优选的实施方案中,这样的羊毛硫抗生素生产菌株是属于放线菌目 (Actinomycetales)的任何菌株。在又一个优选的实施方案中,这样的羊毛硫抗生素生产菌株是小双孢菌属的成
员O在一个优选的实施方案中,本发明提供了小双孢菌菌株,其含有SEQ IDN0 1中指 定的核苷酸序列中的一个或更多个变异,所述变异引起0RF 1到17(SEQ ID NO :2到18)的 一个或更多个的提高或降低的表达。在一个优选的实施方案中,本发明提供了携带在一个或更多个载体上的包含SEQ ID NO 1指定的核苷酸序列或其部分的核酸,对于通过其他细胞生产107891、一种或更多 种的其前体或其衍生物是有用的。在一个优选的实施方案中,所述核苷酸序列或其部分被携带在单个载体上。适合 的载体是能够携带此处定义的完整mlb聚簇的任何粘粒、F粘粒、BAC、PAC、ESAC载体。适 合的载体是本领域技术人员公知的,在文献(Kieser et al.,2000,以及其中描述的参考文 献)中描述。在一个方面,本发明提供了提高107891的产生的方法,所述方法包括以下步骤-用重组DNA载体转化微生物,所述微生物通过生物合成途径生产107891或其 同系物或107891的前体或其同系物,所述载体包含DNA序列,所述DNA序列选自0RF 1到 17(SEQ ID N0:2到18)的任一个,其编码所述途径中速率限制性的活性。-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因 并产生所述抗生素或抗生素前体。适合的宿主细胞是放线菌目,到链孢囊菌科(Str印tosporangiaceae)、小单 抱菌禾斗(Micromonosporaceae)、假诺卡氏菌禾斗(Pseudonocardiaceae)和链霉菌科 (Streptomycetaceae),到小双孢菌属(Microbispora)、游云力放线菌属(Actinoplanes)、游动单胞菌属(Planomonospora)、链霉菌属(Streptomyces)等等。在另一个方面,本发明提供了生产107891的衍生物和其同系物的方法,所述方法 包括以下步骤-在适合的载体中克隆选自SEQID NO :1所定义的核苷酸序列的片段,所述片段 含有0RF 1到17(SEQ ID NO 2到18)之一的至少一部分,所述0RF编码多肽,所述多肽催 化希望绕过的生物合成步骤;
-通过除去或置换一个或更多个指定氨基酸的密码子来失活所述0RF,所述氨基 酸对于所述多肽的活性是必需的;-用所述重组DNA载体转化微生物,所述微生物通过生物合成途径生产107891或 其同系物或其107891前体;-在所述产生的转化体中筛选出所述DNA序列被突变的拷贝置换的那些转化体;-在适合于细胞生长的条件下培养突变细胞,表达所述途径并生产所述途径类似 物。在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下 步骤-用重组DNA载体转化微生物,所述微生物通过生物合成途径生产羊毛硫抗生素 或其同系物或其前体,所述载体包含一个或更多个0RF,所述0RF选自0RF 1到17 (SEQ ID NO 2到18),其编码能够修饰所述羊毛硫抗生素或羊毛硫抗生素前体的一或多种酶;-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因 并产生所述羊毛硫抗生素或其同系物或其羊毛硫抗生素前体。在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下 步骤-用重组DNA载体转化微生物,所述载体包含一个或更多个0RF,所述0RF选自0RF 1到17(SEQ ID NO :2到18),其编码能够修饰羊毛硫抗生素或羊毛硫抗生素前体的一或多 种酶;-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,在存在所述羊 毛硫抗生素或羊毛硫抗生素前体的情况下表达所述基因。在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下 步骤-用重组DNA载体转化微生物,所述载体包含一个或更多个0RF,所述0RF选自0RF 1到17(SEQ ID NO :2到18),其编码修饰羊毛硫抗生素或羊毛硫抗生素前体的一种或更多 种多肽;-在适合于一或多种活性多肽的存在的条件下制备所述微生物的细胞提取物或细 胞级分,所述细胞提取物或细胞级分至少含有所述一或多种多肽;-将羊毛硫抗生素或羊毛硫抗生素前体添加到所述细胞提取物或细胞级分中,在 所述一或多种多肽可以修饰所述羊毛硫抗生素或羊毛硫抗生素前体的条件下保温所述混 合物。本发明的进一步的方面包括涉及107891的生物合成途径的分离的多肽,选自-由mlb0RF 1到17(SEQ ID NO 2到18)的任一个编码的0RF多肽,禾口-一多肽,所述多肽在其全长上在氨基酸序列上与mlb0RF 1到17(SEQID N0:2到 18)的任一个、优选 mlb 0RF 1 到 3、5 到 11、13 到 17 (SEQID NO :2 到 4、6 到 12、14 到 18)的 任一个编码的多肽具有至少65%、优选95%或更高的相同性。优选的多肽组包含由mlb 0RF 1到3、5到11、13到17(SEQ ID NO 2到4、6到12、 14到18)的任一个编码的任何0RF多肽,或在其全长上在氨基酸序列上与所述mlb 0RF的 任一个编码的多肽具有至少65%、优选86%、更优选90%、最优选95%或更高的相同性的
10任何多肽。定义术语“分离的核酸”在此是指DNA分子,作为基因组DNA或互补DNA (cDNA),其可以 是单链或双链的、天然或合成来源的。该术语还指天然或合成来源的RNA分子。术语“核苷酸序列”在此是指此处公开的0RF的全长或部分长度序列以及基因间 区域。术语“核苷酸序列”在此还指和/或包含序列表中所示的本发明的核苷酸序列的 任一个。序列表的任一核苷酸序列是A)编码序列,B)来自(A)转录的RNA分子,C)利用了遗传密码的简并性来编码相同多肽的编码序列,D)基因间区域,含有启动子、增强子、终止子和抗终止子序列。术语“基因簇”、“聚簇”和“生物合成聚簇”在此是指微生物的基因组的连续片段, 其含有次级代谢产物的合成所需的全部基因。术语“mlb”在此是指对小双孢菌PTA-5024中的107891生物合成负责的遗传元件。 该术语是 Microbispora LantiBiotic 的简称。术语“0RF”在此是指编码一个多肽的基因组核苷酸序列。在本发明的上下文中, 术语0RF与“基因”同义。术语“ 0RF多肽”在此是指由0RF编码的多肽。术语“mlb 0RF”在此是指包含在mlb基因簇之内的0RF。术语“次级代谢产物”在此是指微生物通过由基因簇指定的一组基因的表达产生 的生物学活性物质。术语“载体”在此被定义为包括特别是任何质粒、粘粒、噬菌体,其可以通过整合到 细胞基因组中或染色体外地存在(例如,具有复制起点的自主复制质粒)来转化原核宿主。术语“生产宿主”、“宿主细胞”在此是微生物,其中次级代谢产物的形成由来自供 体微生物的基因簇指导。术语“同系物”在此是指由生物合成基因簇编码的多肽,其在其全长上与由mlb聚 簇编码的任何多肽享有至少65%的序列相同性。附图简述附

图1显示了来自小双孢菌PTA-5024的染色体的分离的DNA片段。粗线表示了 SEQ ID N0:1中描述的片段。带有所述分离的DNA片段的粘粒被称为1G6和6H6。附图2显示了 mlb聚簇的遗传结构。每个0RF由箭头表示,如表1中的编号(附 图4)。取向与附图1中相同。标尺条上的数字表示序列坐标(按照kb)。附图3显示了 107891复合物的成分的结构。附图4显示了 0RF的主要特征。A.分离自小双孢菌的mlb基因107891是小双孢菌PTA-5024产生的紧密相关的肽抗生素的复合物。本发明提供 了用于107891生物合成的mlb基因簇的核酸序列和表征。mlb基因簇的物理组织与侧翼 DNA序列一起在附图1中报告,其说明了来自小双孢菌PTA-5024的基因组的20_kb基因组片段、以及定义这样的片段的两个粘粒的物理图谱。调节107891生物合成的DNA片段的遗 传组织结构在附图2中示出,它的核苷酸序列由SEQ ID NO 1报告。聚簇的精确边界可以根据它的基因产物的功能来建立。因此,在左侧末端(附图 l),mlb聚簇由mlb ORFl划界,编码ABC转运蛋白(SEQ IDNO :2),涉及107891的输出。在 右侧,mlb聚簇由mlb ORF 17划界,一种膜离子反向转运蛋白(SEQ ID N0:18)。mlb聚簇 跨越大约20,000个碱基对,含有17个0RF,称为mlb ORFl到mlb 0RF17。SEQ ID NO 1的 连续核苷酸序列(20000个碱基对)编码17种推断的蛋白质,列于SEQ IDNO 2到18中。ORFl (SEQ ID NO 2)代表从核苷酸67到969翻译SEQ ID NO 1推断出的300个 氨基酸。0RF2 (SEQ ID NO :3)代表从核苷酸 966 到 2210 翻译 SEQ ID NO :1 推断出的 414
个氨基酸。0RF3 (SEQ ID NO 4)代表从核苷酸 2941 到 3723 翻译 SEQ ID NO 1 推断出的 260
个氨基酸。0RF4 (SEQ ID NO 5)代表从核苷酸 3948 到 4614 翻译 SEQ ID NO 1 推断出的 221
个氨基酸。0RF5 (SEQ ID NO 6)代表在互补链上从核苷酸5283到4621翻译SEQ ID NO :1推 断出的220个氨基酸。0RF6 (SEQ ID NO :7)代表从核苷酸 5414 到 5587 翻译 SEQ ID NO :1 推断出的 57
个氨基酸。0RP7 (SEQ ID NO 8)代表从核苷酸 5706 到 9053 翻译 SEQ ID NO :1 推断出的 1115
个氨基酸。0RF8 (SEQ ID NO 9)代表从核苷酸 9080 到 10507 翻译 SEQ ID NO 1 推断出的 475
个氨基酸。0RF9 (SEQ ID NO 10)代表从核苷酸 10537 到 11184 翻译 SEQ ID NO 1 推断出的 215个氨基酸。ORE 10 (SEQ ID NO :11)代表从核苷酸 11181 到 12131 翻译 SEQ IDN0:1 推断出的
316个氨基酸。ORFll (SEQ ID NO 12)代表从核苷酸 12253 到 12981 翻译 SEQ ID NO :1 推断出的
242个氨基酸。ORF12 (SEQ ID NO 13)代表从核苷酸 13357 到 13992 翻译 SEQ ID NO :1 推断出的 211个氨基酸。ORF13 (SEQ ID NO 14)代表从核苷酸 14795 到 15544 翻译 SEQ ID NO :1 推断出的 249个氨基酸。ORF14 (SEQ ID NO 15)代表从核苷酸 15546 到 16256 翻译 SEQ ID NO :1 推断出的 236个氨基酸。ORF15 (SEQ ID NO 16)代表从核苷酸 16370 到 17995 翻译 SEQ ID NO :1 推断出的
541个氨基酸。0RF16 (SEQ ID NO 17)代表从核苷酸 17992 到 18528 翻译 SEQ ID NO :1 推断出的 178个氨基酸。
12
ORF17 (SEQ ID NO 18)代表从核苷酸 18525 到 19817 翻译 SEQ ID NO :1 推断出的
430个氨基酸。mlb聚簇的基因组结构和一级序列将107891置于A型羊毛硫抗生素中。mlb和其他羊毛硫抗生素基因簇之间的比较揭示了重要的不同。实际上,mlb聚簇 的特征在于在其他羊毛硫抗生素聚簇中没有找到同系物的几种ORF的存在。这些包括ORF 1到6、12、15到18 (SEQ ID NO :2到7、13、16到19)。总之,此处描述的mlb聚簇的结构实 质上不同于其他羊毛硫抗生素的合成中所涉及的其他聚簇的结构。因而它代表了具有这样 的基因组结构的聚簇的第一个实例。B. mlb基因的作用本发明公开了负责107891的前原肽前体的合成的DNA序列。107891前原肽由 33-aa长度的前导肽和24_aa的原肽组成。在此所指的核酸序列是编码107891前原肽或 其片段的那些。57-aa的107891前原肽代表了新的元件,其在它的全长上与来自鸡葡萄球 菌(Staphylococcus gallinarum)的羊毛硫抗生素 gallidermin 的前原肽、UniProt 登记 号P21838仅具有41 %的相同性。mlb聚簇中存在的其他基因代表了对于提高107891的产生或合成新的代谢物有 用的新的遗传元件。在这些之中,mlb ORF 7到8(SEQ ID NO :8到9)编码涉及mlb 0RF6 的翻译产物的翻译后修饰的蛋白质,在成熟的107891中导入羊毛硫氨酸残基。特别是,mlb 0RF7多肽负责107891的前原肽部分中Ser和Thr残基的脱水,分别产生脱氢丙氨酸和脱氢 氨基丁酸残基。mlb 0RF8多肽催化前原肽内部半胱氨酸残基对脱氢氨基酸残基的亲核攻 击。这些基因可以在异源宿主中克隆和表达以产生能够将羊毛硫氨酸残基导入其他前原肽 的有活性的酶。本发明的另一个优选的核酸分子包括mlb 0RF9 (SEQ ID NO 10),其编码在产生 S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸残基(式I)的氧化脱羧作用中涉及的 蛋白质。本发明的又一个优选的核酸分子包括mlb 0RF16 (SEQ ID NO 17),其编码色氨酸 卤化酶(halogenase),负责将氯原子加到107891的氨基酸4。mlb ORF 16代表新的和独特 的遗传元件,早先在其他羊毛硫抗生素聚簇中没有报道。实际上,氯化是107891在已知的 羊毛硫抗生素中相当独特的特征。这个基因可以在异源宿主中克隆和表达,产生能够氯化 羊毛硫抗生素分子的色氨酸残基的活性酶。或者,mlb 0RP16可以在生产菌株中失活,导致 缺乏附着于氨基酸4的氯的107891衍生物的形成。本发明的又一个优选的核酸分子包括mlb 0RF2 (SEQ ID NO :3),其编码对107891 前原肽的翻译后修饰负责的细胞色素P450羟化酶,通过添加一个或两个氧到位置14的脯 氨酸残基。mlb 0RF2代表新的和独特的遗传元件,在其他羊毛硫抗生素聚簇中从未被报道 过。实际上,107891脯氨酸羟基化谱在羊毛硫抗生素中相当独特的。这个基因可以在异源 宿主中克隆和表达,产生能够氧化羊毛硫抗生素分子中存在的脯氨酸残基的活性酶。或者, mlb 0RP2可以在生产菌株中失活,导致氨基酸14处缺乏氧原子的107891衍生物的形成。mlb聚簇还包括许多调节基因,对107891生产期间直接或间接地活化生物合成和 抗性基因的表达负责。这些基因包括mlb ORF 3和5(SEQ IDNO :4和6) :mlb 0RF3 (SEQ ID NO 4)代表独立的群体感应(quorum-sensing)肽,对107891生产的调节部分地负责;mlb0RF5 (SEQID NO 6)是与Sigma_70高度相关的,Sigma_70是一种作为正转录调节物的RNA 聚合酶sigma因子的细胞质外功能家族。mlb ORF 3和5代表了其他羊毛硫抗生素聚簇没 有的新的遗传元件。这两个基因,mlb ORF 3和5可以单独地或按它们任何的组合在另一 个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。宿主菌株包括但不限于属于放线菌目的菌株,属于链孢囊菌科、小单孢菌科、假诺 卡氏菌科和链霉菌科的菌株,属于小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属的 菌株等等。或者,这些基因可以单独地或它们的任何组合在107891生产菌株中过表达来提 高107891的产量。mlb聚簇还包括对输出羊毛硫抗生素中间物或终产物到细胞质外负责的、以及对 生产者细胞赋予抗性负责的许多基因。这些基因包括mlb ORF 1、10到11、13到14和17(SEQ ID NO :2、11 至Ij 12、14 到 15 禾口 18)。mlb 0RF1U0 到 11、13 到 14 编码 ABC 类别的转运蛋白, 对107891或它的中间物的ATP依赖性排出负责。mlb 0RF17编码Na/K离子反向转运蛋白, 对于对抗质子梯度输出107891或它的中间物负责。这些基因可以单独地或按它们任何组 合在另一个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。宿主菌株包 括但不限于属于放线菌目的菌株,属于链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科 的菌株,属于小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属的菌株等等。或者,这些基因可以单独地或它们的任何组合地在107891生产菌株中过表达来 提高107891的产量。C. mlb聚簇的用途本发明还提供了用于完整107891分子、其任何前体或其衍生物的表达的核酸。这 样的核酸包括一或多个分离的基因簇,所述基因簇包含编码足以指导107891组装的多肽 的0RF。在一个实例中,完整的mlb聚簇(SEQID NO 1)可以被导入适合的载体中,用于转化 期望的生产宿主。在另一个方面,mlb聚簇作为两个独立的片段克隆到两个不同的载体中, 所述载体在期望的生产宿主中是相容的。在又一个方面,mlb聚簇可以分成三个片段,各自 克隆到独立的、相容的载体中。一、二或三载体系统的使用的实例已经在文献中描述了。一旦mlb聚簇被适当地克隆到一个或更多个载体中,它可以被导入许多适合的生 产宿主中,在其中羊毛硫抗生素的生产可以以比天然宿主中更高的效率发生。优选的宿主 细胞是可以有效地表达放线菌基因的那些物种或菌株。这样的宿主包括但不限于属于放线 菌目,链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科,小双孢菌属、游动放线菌属、游 动单胞菌属、链霉菌属等等。或者,被克隆到一个或更多个适合的载体中的mlb聚簇的第二 拷贝可以被导入107891生产菌株中,在其中mlb基因的第二拷贝将提高107891的产量。生产能力向良好表征的宿主的转移可以实质上改善导致优化和发展的过程的几 个部分生产菌株中天然产物的滴度可以更有效地提高;天然产物的纯化可以在可能干扰 活性的已知背景中进行;复合物的组成可以更有效地控制;天然产物的改变的衍生物可以 通过发酵条件的操作或通过途径工程化来更有效地产生。或者,生物合成基因簇可以被修饰,插入到宿主细胞中,用于合成或化学地修饰各 种各样的代谢物例如,开放阅读框可以被重新排序,修饰,和与其他羊毛硫抗生素生物合 成基因簇组合。使用在此提供的信息,107891核酸的克隆和表达可以利用常规和公知的方法实现。在另一个可能的用途中,从mlb基因簇选择的ORF可以通过使用常规的分子生物 学技术来分离和失活。克隆在含有DNA片段的适合的载体中的突变的ORF被导入所述小双 孢菌菌株中,所述DNA片段侧翼于小双孢菌PTA-5024染色体中的所述0RF,其中同源重组 的两次交叉事件引起所述生产者菌株中所述ORF的失活。这个过程对于以有效的方式生产 107891的前体或衍生物是有用的。在另一种可能的用途中,从mlb基因簇选择的ORF被分离并置于期望的启动子的 控制下。克隆在适合的载体中的工程化的ORF然后被导入小双孢菌PTA-5024,通过如上所 述置换原始0RF、或作为所述ORF的另外的拷贝。这个操作对于提高或降低对107891分子、 其前体或衍生物的生产是关键的ORF的表达水平是有用的。实验小节以下实施例用来说明鉴定出107891基因簇的原理和方法,以及鉴定和分析所有 mlb基因的原理和方法。这些实施例用来说明本发明的原理和方法,但是不意味着限制它的 范围。一般方法除非另外指出,细菌菌株和克隆载体全部可以从公众保藏机构或商业来源获得。 使用分子生物学的标准方法。小双孢菌属在HT琼脂和在V6培养基(20g/l葡萄糖,5g/l酵 母提取物,3g/l酪蛋白水解物,5g/l肉类提取物,5g/l蛋白胨,1.5g/l NaCl,0.5%甘油)中 生长。根据公开的过程分离羊毛硫抗生素。使用标准程序进行序列分析。在公众站点使用 Blast或Fasta程序进行数据库检索。实施例1-107891生物合成基因的分离使用来自小双孢菌PTA-5024的DNA在接合粘粒载体Supercos 3中制备基因组文 库。这通过将来自 pSET152 的 aacIV-oriT-intOC31 盒插入 Supercos 1 (Stratagene, La Jolla, CA 92037)中来构建如下aacIV-oriT_intOC31 盒通过 PCR 从载体 pSET152 作为 3. 8kb长的NruI片段获得,插入到supercosl的相同位点中。来自小双孢菌PTA-5024的总 DNA用Sau3AI部分地消化以将片段大小优化在40kb范围内。部分消化的DNA用碱性磷酸 酶处理,连接到早先用BamHI消化的SuperC0S3。连接混合物体外包装,用于转染大肠杆菌 (E. coli)XLlBlue细胞。产生的粘粒文库通过与寡核苷酸探针5‘ -GTS ACS WSS TGG WSS YTS WSS ACS GGS CCS TGCACS WSS CCS GGS GGS WSS AAC WSS WSS TCC WSS TG_3' (SEQ IDNO 19)杂交来筛选。根据从107891的结构推测出的氨基酸序列设计寡核苷酸。分离出 对于该探针为阳性的两个粘粒,用限制性内切酶物理作图。根据这样的实验,鉴定了附图1 中报道的粘粒。由此从小双孢菌PTA-5024的基因组鉴定的片段含有对抗生素107891的合 成负责的mlb基因簇。以上实施例用来说明mlb聚簇被分离的原理和方法。本领域技术人员将想到的是 mlb聚簇可以克隆在多种载体中。然而,本领域技术人员将理解,考虑到mlb聚簇的20-kb 大小,优选的载体是能够携带大的插入物的那些,例如lambda、粘粒和BAC载体。本领域技 术人员理解,其他探针可用于从这样的文库鉴定mlb聚簇。根据在SEQ ID NO :1中报告的 序列,任何片段可以从小双孢菌PTA-5024DNA中PCR扩增,用于筛选使用这些DNA制得的文 库。从所述文库可以鉴定出包括SEQ ID NO :1覆盖的任何片段的一个或更多个克隆。此外,还可能的是通过使用异源探针例如来自其他Ian聚簇的那些利用表1中提供的信息鉴 定mlb聚簇。或者,指导次级代谢产物的合成的其他基因簇含有与mlb基因足够相关的基 因以允许异源杂交。所有这些变体属于本发明的范围。实施例2-107891基因簇的序列分析如实施例1所述鉴定的mlb聚簇通过鸟枪法测序。mlb聚簇的序列在此由SEQ ID NO 1提供。分析产生的DNA序列来鉴定可能的编码序列,编码序列与其他Ian聚簇比较或 针对GenBank来检索。每个ORF的确切起始密码子通过相关序列的多次比对或通过搜索上 游核糖体结合位点来确定。总共鉴定了 17个0RF,命名为mlb ORF 1到ORF 17。这些分析 的结果在表1中概述,在此在序列表中作为SEQ ID NO :2到SEQ ID N0:18来提供。详述如 下。2A. 107891前原肽的合成mlb ORF 6对前原肽的合成负责。前原肽含有49_aa的前导序列和24_aa的原肽 (SEQ ID NO :7),原肽被翻译后修饰来产生成熟的羊毛硫抗生素。羊毛硫抗生素前导肽的两 个共同特征在107891中被保留A型羊毛硫抗生素的保守序列(例如,F-D/N-L-D/E基序) 和在位置-2的脯氨酸残基。前原肽(SEQ ID NO 7)的C-末端部分与公开的107891 —级 结构以及它的预定的原肽序列相一致。2B. 107891原肽的翻译后修饰由 mlb ORF 7 至Ij 9 禾口 mlb ORF 17 编码的四种蛋白质(SEQ ID NO :8 至Ij 10 禾口 SEQ ID NO 18)涉及107891前原肽的翻译后修饰。这些基因产物的同系物在许多羊毛硫抗生 素聚簇中发现。根据与其他羊毛硫抗生素聚簇中发现的脱水酶和环化酶的序列相同性以及 它们的作用,可以进行以下的预测。mlb 0RF7多肽对107891原肽的位置3、5、13、18和21 处的丝氨酸残基以及位置2和8处的苏氨酸残基的脱水负责,产生相应的脱水的残基。mlb 0RF8多肽催化107891原肽中存在的半胱氨酸残基向四个脱氢丙氨酸和一个脱氢氨基丁酸 残基的区域和立体特异共轭加成,产生相应的五个硫醚。特别地,mlb ORF 8多肽涉及3-7、 13-20、18-23和21-24羊毛硫氨酸的形成和8_11甲基羊毛硫氨酸的形成。在表皮素和mersacidin聚簇编码的脱羧酶观察到的序列相同性的基础上,mlb 0RF9编码对21-24羊毛硫氨酸部分的脱羧作用负责的酶。在其他抗生素聚簇编码的黄素还 原酶观察到的序列相同性的基础上,mlb 0RF16编码黄素蛋白还原酶。考虑到在表皮素和 mersacidin形成期间氧化脱羧作用预计的作用,mlb 0RF9和16多肽催化107891中存在的 S- [ (Z) -2-氨基乙烯基]-D-半胱氨酸残基的形成(式I)。2C. β -羟脯氨酸和色氨酸氯化的形成由mlb ORF 2和15 (SEQ ID NO :3和16)编码的两种蛋白质涉及一个或两个β羟 基基团向位置14处的脯氨酸残基的添加和107891原肽的位置4处的色氨酸残基的氯化。 mlb 0RF2多肽显示了与P450单加氧酶的显著的相同性(表1),涉及脯氨酸残基的羟基化。 在其他羊毛硫抗生素聚簇中没有发现mlb 0RF2的同系物,因而这个基因代表了涉及羊毛硫 抗生素分子的羟基化的P450单加氧酶的独特实例。此外,在与其他卤化酶的相同性水平的 基础上,mlb 0RF15多肽涉及色氨酸氯化,代表了羊毛硫抗生素分子的修饰中涉及的卤化酶 的独特实例。2D.输出和抗性
16
由 ORF 1、10、11、13、14 和 17 (SEQ ID NO :2、11、12、14、15 和 18)编码的五种蛋白 质涉及将107891或它的前体输出到细胞质外部,以及涉及为生产菌株赋予抗性。它们预测 的作用如下。ORFl (SEQ ID NO 2)的同系物在其他羊毛硫抗生素聚簇中不存在。这个基因编 码另外的ABC型转运蛋白(表1),因而涉及在生产菌株小双孢菌PTA中赋予对107891的 抗性。ORF 10、13到14和17 (SEQ ID NO :11、14到15和18)的同系物存在于其他羊毛硫 抗生素聚簇中(表1)。它们分别编码ABC-型和离子依赖性跨膜转运蛋白。因而它们涉及 107891或其前体的输出或区室化。mlb 0RF17编码Na/K离子反向转运蛋白,对抗质子梯度 输出107891或它的中间物负责。2E.调节ID NO :4和6)编码的两种蛋白质涉及调节一种或更多种mlb基 因的表达。mlb 0RF5多肽(SEQ ID NO 6)代表新的遗传元件,其同系物在其他羊毛硫抗生 素聚簇中没有发现。这种蛋白质属于作为正转录调节物起作用的sigma因子的细胞质外功 能家族。0RF3多肽(SEQID NO 4)属于LuxR型转录调节物的家族。0RF3 (SEQ ID NO 4)因 而可能是一种或更多种mlb基因的表达所需的。2F.其他功能在mlb聚簇中存在两个另外的ORF:0RF4(SEQ ID NO 5)和ORF12 (SEQ ID N0:13)。 两个 ORF 分别与 Salinispora tropica 禾口产二素链霉菌(Streptomyces ambofaciens)中 存在的未知功能的蛋白质相关(表1)。然而,它们在107891生物合成中的确切作用还不能 预测。实施例3-通过基因置换的107891途径的操作使用实施例2中提供的信息,如下构建0RF2中的符合读框的缺失。通过用寡聚物 5' -AAGCTTGCATCTGCGTGGGCGTCCTGC-3‘ (SEQ ID NO 20)和5‘ -TCTAGACGGTCCGAAGATCAT GGCCGCGG-3 ‘ (SEQ ID NO :21)扩增获得片段A ;用寡聚物 5 ‘ -TCTAGATCCATGTGAACCGGCGGG TGGCCG-3‘ (SEQ ID NO 22)和 5' -GAATTCCGGTCGCTCTCCTCGTCCTTTGCC-3‘ (SEQ ID NO 23)扩增片段B。然后,用EcoRI和XbaI消化片段A,用XbaI和HindIII消化片段B,都连接到早先 用EcoRI和HindIII消化的pSET152。在转化大肠杆菌DH5 α细胞之后,产生的质粒称为 pDMl,通过在用EcoRI和HindIII消化后4kb和1. 5kb的片段的存在来识别。pDMl的等份转 移到大肠杆菌ET12567(pUB307)细胞中,产生菌株DM1。然后,来自LB中的过夜培养物的约 IO8CFU的DMl细胞与在Rare3培养基中生长约80h的约IO7CFU的小双孢菌PTA 5024混合。 产生的混合物涂布在HT平板上,其然后在28°C保温约20h。在用水柔和洗涤除去过量的大 肠杆菌细胞后,平板用含有200 μ g萘啶酸和15 μ g/ml安普霉素的3mL软琼脂覆盖。在28°C 进一步保温3-5周后,小双孢菌外接合体在含有安普霉素的新鲜培养基上划线。一株这样 的的外接合体,称为菌株Mb-DMl,被进一步处理。菌株Mb-DMl然后在没有安普霉素的HT 培养基中生长几个传代,合适的稀释物平铺在没有安普霉素的HT琼脂上。然后使用寡聚物 5' -CGCGCTGCTCGGGGCCAAC-3‘ (SEQID NO :24)和 5‘ -AGGAAACGGCCAGCCCGTGG-3‘ (SEQ ID NO 25)通过PCR分析单独的菌落。含有0RF2的缺失的等位基因的菌落通过1. 5kb条 带的存在来识别。一种这样的菌落,称为Mb-DM2,在HT培养基中生长,通过与可信的标准比
17较来确认脱羟基-107891的形成。上述实施例用来说明原理和方法,通过所述原理和方法在SEQ ID NO :2到18所指 定的当中选择的ORF可以被107891生产菌株小双孢菌PTA5024中突变的拷贝来置换。本 领域技术人员想得到的是0RF2 (SEQ ID NO :3)是在SEQ ID NO :1说明的聚簇中产生符合读 框的缺失的方法的实例。本领域技术人员还理解的是,符合读框的缺失仅仅是产生突变的一种方法,包括 但不限于移码突变、插入和定点突变的其他方法也可以用于产生SEQ ID NO :2到18所指定 的任何ORF中的无效突变体。本领域技术人员还理解,建立了在SEQ ID NO 1指定的任何ORF中产生突变的方 法,这些相同的方法可以用于改变这些同样的ORF的表达水平。如何实现这一点的实例包 括但不限于所述ORF的多个拷贝整合到小双孢菌PTA 5024基因组的任何地方,改变控制所 述ORF的表达的启动子,除去干扰它们的表达的反义RNA或转录终止子。最后,用于将突变的等位基因导入小双孢菌PTA5024中的载体、所述供体和接受 体菌株的接合和培养的条件、挑选和筛选外接合体和它们的衍生物的方法中的改变都属于 本发明的范围内。实施例4-羊毛硫抗生素的体外卤化使用实施例2中提供的信息,mlb 0RF15(SEQ ID NO 16)在大肠杆菌中如下过表 达。通过用寡聚物 5' -TTTTTCATATGGGTGGGAGTGATCGGCGGCG-3' (SEQ ID NO 26)和 5 ‘ -T TTTTGTCGACCTACTGCTGGCCGCGGTCCGGACT-3‘ (SEQ ID NO 27)扩增获得的 1. 6kb片段用 NcoI 和SalI消化,连接到预先用NcoI和XhoI消化的pET22b。在转化大肠杆菌DH5 α细胞之 后,可通过用NdeI和XhoI消化后5. 5kb和1. 6kb片段的存在来识别的、产生的质粒pHAL 被导入大肠杆菌BL21(DE3)细胞。带有pHAL的大肠杆菌BL21(DE3)细胞的培养物在LB中 在20°C生长到0.6的0D600。然后,IPTG添加到ImM,细胞进一步生长6h。收获细胞,通过 超声处理破裂,从Ni-琼脂糖柱回收His标签标记的0RF15多肽。进行底物例如乳链球菌 素481或97518的卤化,通过MS分析确定羊毛硫抗生素的氯衍生物的形成。以上实施例用来说明原理和方法,通过所述原理和方法在SEQ ID NO :2到18指定 的那些中选择的任何ORF可以在方便的宿主中过表达,产生过量生产的酶并用于将羊毛硫 抗生素天然产物转化成不同的化合物。本领域技术人员将想到的是,0RF15(SEQ ID NO 16) 仅仅是用作过量生产SEQID NO :1编码的任何多肽的方法的实例。本领域技术人员还理解 的是,过量生产蛋白质的其他方法包括但不限于利用不同的亲和标签、利用不同的载体、不 同的宿主菌株和诱导方法也可以用于过量产生ORF 1到17 (SEQ IDNO 2到18)指定的多 肽。本领域技术人员将想到的是,含有或没有色氨酸残基的其他羊毛硫抗生素底物可 以用于通过0RF15(SEQ ID N0:16)添加氯原子。本领域技术人员还将想到的是,mlb聚簇 (SEQ ID NO 1)指定的其他ORF多肽可以用于其他羊毛硫抗生素前原肽的翻译后修饰。可 以用于这个目的的ORF多肽包括但不限于0RF2 (SEQ ID NO 3)。特别地,ORF 7和8 (SEQ IDNO 8和9)可用于在其他羊毛硫抗生素前原肽中脱水和引入硫醚键;0RF9和16 (SEQ ID NO :10和17)可以用于使其他含有C-末端Cys残基的羊毛硫抗生素脱羧基;ORF 2 (SEQ ID NO 3)可以用于羟化其他含有脯氨酸的羊毛硫抗生素。
实施例5-mlb聚簇在异源宿主中的表达使用实施例1和2中提供的信息,含有所有mlb聚簇(SEQ ID NO 1)的粘粒1G6 (附 图1)通过如Kieser et al.,2000所描述的接合来导入白色链霉菌(Sti^ptomyces albus) 中。安普霉素抗性接合后体在合适的条件下生长,如所述纯化107891。本领域技术人员还理解白色链霉菌仅是一种生产者菌株,其他菌株也可以用于导 入全部mlb聚簇(SEQ ID NO=D和用于107891的生产。优选的宿主细胞是可以有效地表 达放线菌基因的那些物种或菌株。这样的宿主包括但不限于放线菌目,链孢囊菌科、小单 孢菌科、假诺卡氏菌科和链霉菌科,小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属等 等。本领域技术人员理解只要适合的启动子置于mlb操纵子前,生产宿主不必限于可有效 地表达放线菌基因的那些细胞。这后一类别的适合的生产宿主可以在易于遗传学操作的那 些、或天然地生产其他羊毛硫抗生素的那些中找到。这样的生产宿主的实例包括但不限于 大肠杆菌和相关物种,芽胞杆菌、链球菌、乳杆菌、葡萄球菌等等。本领域技术人员还理解,使用在该实施例中描述的方法,mlb聚簇可以作为第二拷 贝被导入原始的107891生产者菌株小双孢菌PTA 5024,其中mlb基因的第二拷贝将提高 107891的产量。本领域技术人员还理解不同的载体、导入mlb聚簇的不同方法、选择带有mlb聚簇 的重组克隆的不同的方法、生长所述重组克隆的不同方法和条件、检测107891生产的不同 方法对于mlb聚簇在异源宿主中的表达是有效的。实施例6-107891变体文库的产生使用实施例2、3和5中提供的信息,如下修饰mlb ORF 6 (SEQ ID NO :7)来 产生107891的变体。首先,利用片段A的寡聚物5 ‘ -GCAGCCAGGCTCGCACCGGC-3 ‘和 CGCCCGTAACGAGCGA (SEQ ID NO 28 和 29)和片段 B 的寡聚物 5' -GCAGCTTCTGCTGCTGA-3 ‘ 和 5' -TCCCGGCCAGCCACTT-3 ‘ (SEQ ID NO 30 和 31)根据实施例 3 的方法扩增 0RF6 来构建在ORF 6 (SEQ ID NO 7)中带有符合读框的缺失的载体。产生的构建体用于根 据实施例3的方法置换如实施例5中所描述获得的白色链霉菌菌株中的0RF6,产生 SA-D6 菌株。然后,通过用寡聚物 5' -CCGGAAAGGAGCGAGCATATG-3 ‘ (SEQ ID NO 32)禾口 5' -CAGATCTGCCAATACAGT-3‘ (SEQ ID NO :33)扩增获得的 mlb 0RF6 (SEQ ID NO 7)的 前肽部分用NdeI和BglII消化并连接到用NdeI和BglII预先消化的pIJ8600 (Kieser et al. ,2000)产生质粒pPREl。在平行的实验中,寡聚物A 5' -C GGT GTC GAG GAG ATC ACCGCC GGG CCG GCG NNN NNN AGC NNN NNN NNN TGC ACC NNNNNN TGC NNN AGC NNN NNN NNN NNN AGC NNN TGC AGC NNNTGC TGC TGA AGA TCT-3‘和寡聚物B 5' -T TCA GCA GCA NNN GCT GCANNN GCT NNN NNN NNN NNN GCT NNN GCA NNN NNN GGT GCANNN NNN NNN GCT NNN NNN CGC CGG CCC GGC GGT GAT CTC CTCGAC ACC GAT CGA-3 ‘ (SEQ ID 34 和 35)被变 性和退火来产生DNA片段(SEQ ID NO 36)的混合物,其编码多肽,所述多肽具有在预计涉 及硫醚形成的0RF6多肽的原肽区域(特别是氨基酸3、7、8、11、13、18、20、21、23和24)的 氨基酸序列中所有可能的改变。这种DNA片段的混合物连接到预先用BSA OI和BglII消 化的质粒PPRE1,来产生质粒的文库,所述质粒的文库带有融合到编码前导肽的0RF6片段 的、编码原肽的0RF6片段的所有可能的变体形式(预期(甲基)羊毛硫氨酸桥)。该质粒 文库被导入SA-D6菌株中,在存在μ g/ml硫链丝菌肽的情况下生长产生的接合外体通过生物学分析或HPLC分析来筛选107891变体的产生。通过测序0RF6变体的原肽部分和通过 结构推测来进一步表征感兴趣的变体。本领域技术人员理解0RF6多肽的前导肽部分也可以被修饰,只要在翻译后修饰 中涉及的酶(SEQ ID N0:8和9)可以识别所述不同的前导肽。在0RF6多肽的前导肽部分 中的改变属于本发明的范围。本领域技术人员将想到的是其他方法可以用于构建ORF 6变体的文库,包括但不 限于使用不同的寡聚物、载体、诱导系统和宿主菌株。此外,本领域技术人员理解甲基羊毛 硫氨酸残基可以被羊毛硫氨酸残基置换,反之亦然,产生另外的ORF 6变体。本领域技术人 员还理解的是定点诱变可以用于产生导致指定的107891衍生物的生产的ORF 6的选定的 变体。
权利要求
一种分离的核酸,包含选自以下序列组成的组中的核苷酸序列a)编码107891和其同系物的合成所需的多肽的mlb基因簇(SEQ ID NO1);b)编码由mlb基因簇(SEQ ID NO1)编码的相同多肽、与mlb基因簇的核苷酸序列不同的核苷酸序列;c)mlb ORF 1到17的任何核苷酸序列,编码由SEQ ID NO2到18编码的多肽;和d)编码由mlb OFR 1到17的任一个编码的相同的多肽(SEQ ID NO2到18)、与所述ORF的核苷酸序列不同的核苷酸序列。
2.一种分离的核酸,包含选自以下序列组成的组中的核苷酸序列e)编码一多肽的核苷酸序列,所述多肽在其全长上在氨基酸序列上与mlbORF 2、6到 9、15到16 (SEQ ID NO :3、7到10、16到17)的任一个编码的多肽具有至少65%、至少86%、 至少90%和至少95%或更高的相同性。
3.根据权利要求1或2的分离的核酸,包含编码由mlb0RF6 (SEQ ID NO :7)组成的、 107891前原肽的合成所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的 核苷酸序列的核苷酸序列的组合。
4.根据权利要求1或2的分离的核酸,包含由mlbORF 9和16 (SEQ IDN0:10和17)组 成的、编码0RF6多肽的C-末端Cys残基的氧化脱羧作用所需的多肽的核苷酸序列、或编码 相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
5.根据权利要求1或2的分离的核酸,包含由mlbORF 7和8 (SEQ IDNO 8和9)组成 的、编码107891原肽部分的脱水和(甲基)羊毛硫氨酸形成所需的多肽的核苷酸序列、或 编码相同多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
6.根据权利要求1或2的分离的核酸,包含由mlbORF 15 (SEQ ID NO 16)组成的、编 码氨基酸4的芳香族残基的氯化所需的多肽的核苷酸序列、或编码相同的多肽的但不同于 所述ORF的核苷酸序列的核苷酸序列的组合。
7.根据权利要求1或2的分离的核酸,包含由mlbORF 2 (SEQ ID NO 3)组成的、编码 107891的氨基酸14的脯氨酸残基的羟基化所需的多肽的核苷酸序列、或编码相同的多肽 的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
8.根据权利要求1或2的分离的核酸,包含由mlbORF 1、10、11、13、14和17 (SEQ ID NO :2、11、14、15和18)组成的、编码107891或某些它的前体向细胞质外的输出所需的和赋 予生产菌株对107891的抗性所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所 述ORF的核苷酸序列的核苷酸序列的组合。
9.根据权利要求1或2的分离的核酸,包含由mlbORF 3和5 (SEQ ID NO :4和6)组 成的、编码调节mlb基因簇的一个或更多个基因的表达所需的多肽的核苷酸序列、或编码 相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
10.根据权利要求1或2的分离的核酸,包含由编码107891的合成所需的多肽的mlb 基因簇组成的核苷酸序列,其中符合读框的缺失被导入到编码脯氨酸残基的羟基化所需的 多肽的核苷酸序列中。
11.根据权利要求1或2的分离的核酸序列,包含带有以下序列的至少一个额外拷贝的 核苷酸序列mlb ORF 1到17 (SEQ ID NO 2到18)中至少一个或编码与所述mlb ORF所编 码的相同多肽的但不同于所述mlb ORF的核苷酸序列的核苷酸序列。
12.权利要求1到11任一项的分离的核酸,其中所述核苷酸序列是DNA序列。
13.重组DNA载体,其包含权利要求12中定义的DNA序列。
14.用权利要求13的载体转化的宿主细胞。
15.根据权利要求14的转化的宿上细胞,其属于放线菌目。
16.根据权利要求15的转化的宿主细胞,其属于选自链孢囊菌科、小单孢菌科、假诺卡 氏菌科和链霉菌科的科。
17.根据权利要求16的转化的宿主细胞,其属于选自小双孢菌属、游动放线菌属、游动 单胞菌属、链霉菌属等等的属。
18.根据权利要求14的转化的宿主细胞,其属于芽孢杆菌目。
19.根据权利要求18的转化的宿主细胞,其属于选自芽胞杆菌科、乳杆菌科、链球菌科 或葡萄球菌科的科。
20.根据权利要求19的转化的宿主细胞,其属于选自芽胞杆菌属、乳杆菌属、链球菌 属、葡萄球菌属等等的属。
21.根据权利要求14的转化的宿主细胞,其属于大肠杆菌物种。
22.一种通过生物合成途径的方式通过能够生产107891或其前体的微生物提高 107891或其同系物的生产的方法,所述方法包括-用权利要求13的重组DNA载体转化通过生物合成途径生产107891或107891前体的 微生物,其中所述DNA载体编码在所述途径中速度限制型活性的表达;_在适于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产生 所述抗生素或抗生素前体。
23.—种生产107891或其同系物或其前体或衍生物的转化的微生物,其中在其基因组 中107891生物合成基因已经通过插入权利要求10的核苷酸序列而被修饰。
24.一种生产107891或其前体或衍生物的方法,其包括培养权利要求23的转化的 107891生产微生物。
25.一种在基因组中具有107891生物合成基因的转化的107891生产微生物,其中选自 mlb ORF 1到17 (SEQ ID NO 2到18)的107891生物合成基因的至少一个被破坏。
26.根据权利要求25的转化的微生物,其中被破坏的生物合成基因是涉及氯残基的附着的基因。
27.一种生产107891前体或衍生物的方法,其包括权利要求25的转化的107891生产 微生物。
28.—种生产不同于107891或其前体的羊毛硫抗生素的方法,所述方法包括-用重组DNA载体转化通过生物合成途径产生不同于107891或其前体的羊毛硫抗生素 或羊毛硫抗生素前体的微生物,所述载体或其部分包含权利要求1到11任一项的核苷酸序 列,所述核苷酸序列编码修饰所述羊毛硫抗生素或羊毛硫抗生素前体的酶活性的表达;和-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产 生所述抗生素或抗生素前体。
29.分离的多肽,选自-由mlb ORF 1到17 (SEQ ID NO 2到18)的任一个编码的ORF多肽;禾口-选自由在氨基酸序列上与mlb ORF 1到17 (SEQ ID NO 2到18)的任一个编码的ORF多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的 相同性的多肽组成的组中的多肽。
30.权利要求29的分离的多肽,其是mlbORF 2、6到9、15到16 (SEQ ID N0:3、7到10、 16到17)的任一个。
31.权利要求29的分离的多肽,包含mlbORF 2、6到9、15到16 (SEQ ID N0:3、7到10、 16到17)的任一个编码的mlb ORF多肽,或选自由在氨基酸序列上与所述mlb ORF的任一 个编码的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95% 或更高的相同性的多肽组成的组中的多肽。
32.权利要求29的分离的多肽,包含mlbORF UlO到11、13到14禾口 17 (SEQ ID NO 2、11到12、14到15和18)的任一个编码的mlb ORF多肽,或选自由在氨基酸序列上与所述 mlb ORF的任一个编码的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和 具有至少95%或更高的相同性的多肽组成的组中的多肽。
33.权利要求29的分离的多肽,包含mlbORF 3和5 (SEQ ID NO :4和6)的任一个编 码的mlb ORF多肽,或选自由在氨基酸序列上与所述mlbORF的任一个编码的多肽具有至少 65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽 组成的组中的多肽。
34.分离的多肽,包含选自权利要求1到12任一项的任何核酸所编码的多肽的、涉及 107891的生物合成途径的多肽。
全文摘要
本发明涉及羊毛硫抗生素领域,更特别地涉及编码羊毛硫抗生素107891和其同系物的生物合成途径所需的酶的核酸分子的分离。
文档编号C12N15/76GK101939328SQ200780100776
公开日2011年1月5日 申请日期2007年8月3日 优先权日2007年8月3日
发明者D·梅尔科里洛, M·索西奥, S·塞丽娜, S·多纳迪奥 申请人:森蒂内拉制药公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1