硫肽前体蛋白质、编码该蛋白质的基因及其用途的制作方法

文档序号:3574664阅读:245来源:国知局

专利名称::硫肽前体蛋白质、编码该蛋白质的基因及其用途的制作方法硫肽前体蛋白质、编码该蛋白质的基因及其用途本发明涉及用于硫肽(thiop印tide)生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理硫肽前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物制备中的用途。硫肽是天然的、富含硫的、高度修饰的大环肽,许多所述硫肽具有有效的抗生素活性。这些复杂的天然产物根据抗生素的Berdy化学分类分为噻唑肽(BerdyJ.‘Recentdevelopmentsofantibioticresearchandclassificationofantibioticsaccordingtochemicalstructure.'AdvApplMicrobiol.1974;18(0):309_406·)并包括硫链丝菌肽、诺雪七肽、微球菌素、nocathiacin、amythiamicin、GE2270A等。硫肽共有许多共同结构特征聚集在中心多吡咯结构域中的三元或四元取代的氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架(framework)的一部分。硫肽的该大环标志使得它们与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17区分开来。Hensens首先建议根据中心杂环结构域的结构和氧化状态对硫肽抗生素进行分类(0.D.Hensens禾口G.Albers-Schoenberg.'Totalstructureofthepeptideantibioticcomponentsofthiopeptinby1Hand13CNMRspectroscopy.,TetrahedronLett.1978,3649)。来自CardiffUniversity的MarkBagley和同事的近期综述已经扩展了Hensens的分类系统,以描述5个不同的中心杂环结构域四元取代脱氢哌啶或饱和哌啶、二氢咪唑哌啶、三元取代吡啶和四元取代羟基吡啶(Bagley等‘Thiop印tideantibiotics.,ChemRev.2005年2月;105(2):685_714)。尽管具有大量结构同源性,硫肽抗生素的作用(对蛋白质合成的抑制)位点和方式可分为两个功能类结合称为Lll结合结构域的23S核糖体RNA区域的那些和结合参与延伸循环的Ef-Tu蛋白质复合体的那些。经常认为在1954年首次分离为远青链霉菌(Streptomycesazureus)次生代谢物的硫链丝菌肽是硫肽家族的原型化合物(Donovick等iThiostrepton,anewantibiotic.,AntibiotAnnu.1955-1956;3554-9禾口Bagley等‘硫肽antibiotics.,ChemRev.2005年2月;105(2):685_714)。假定硫肽通过利用称为非核糖体肽合成酶(NRPS)的大的多酶复合体的非核糖体方法合成(Mocek等'BiosynthesisofthemodifiedpeptideantibioticthiostreptoninStreptomycesazureusandStreptomyceslaurentii'.J.Am.Chem.Soc.1993,115,7992-8001)。NRPS装配大环的实例是由真菌多孢木霉菌(Tolypocladiuminflatum)产生的免疫抑制肽环胞菌素。NRPS装配肽不限于通常见于蛋白质的常见的20种L氨基酸。相反,这些酶具有掺入数百种不常见氨基酸及衍生残基的更广泛的所有成分的生物合成能力。Washington大学的HeinzFloss等人指导的预实验揭示了硫肽的确由非核糖体途径产生。该研究组用抑制核糖体蛋白质合成水平的氯霉素处理培养物。然而,硫肽的从头产生仍然继续。当用于探测来自各生产生物的基因组DNA的Southern印迹时,来自代表硫链丝菌肽或相关诺雪七肽的氨基酸序列的寡核苷酸不能与任何同源序列杂交(Τ.Μ.Smith,Y.-F.Jiang,H.G.Floss.'ThiopeptideAntibiotics"in"BiotechnologyofAntibiotics"W.R.Strohl,编著,第2版,Marcel-Dekker,NewYork,1997,第393-413页)。此外,在生成菌株中已经鉴定了假定编码微球菌素合成酶复合体组件的NRPS基因片段(Carnio等iPyridinylpolythiazoleclasspeptideantibioticmicrococcinPl,secretedbyfoodborneStaphylococcusequorumffS2733,isbiosynthesizednonribosomally.,EurJBiochem.2001年12月;268(24):6390_401·)。然而,至今仍未有硫肽生物合成途径的出版说明书。因此,需要鉴定参与硫肽生物合成的基因,其将为有效的硫肽制备提供工具并为产生可选的硫肽结构提供可能性。本发明满足了该需要并第一次公开了用于硫肽生物合成的染色体编码骨架(backbone)以及参与硫肽生物合成的核心生物合成酶。1.作为硫肽生物合成起始材料的染色体编码骨架本发明人确实已经发现了这样的确凿证据,例如在放线菌物种中染色体编码骨架是用于硫肽生物合成的起始材料。第一方面,本发明涉及包含选自以下的氨基酸序列的硫肽前体蛋白质(i)SEQIDNO1;(ii)SEQIDNO5;(iii)SEQIDNO:11;和(iv)任何所述氨基酸序列的变体。如本文所用,术语“硫肽”指根据抗生素的Berdy’s化学分类的噻唑肽,与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17相反,其特征在于聚集在中心多吡咯结构域中的三元或四元取代氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架的一部分。术语“硫肽前体蛋白质”指可用作体外或体内硫肽合成起始材料的基因编码多肽骨架。优选地,所述硫肽前体是细菌延伸因子Ef-tu的抑制剂的前体。Ef-tu抑制剂描述于例如HoggT,MestersJR禾口HilgenfeldR.('InhibitorymechanismsofantibioticstargetingelongationfactorTu.,CurrProteinPeptSci.2002年2月;3(1)121-31)的综述中。众所周知的Ef-tu抑制剂的实例是GE2270A(如Selva等'AntibioticGE2270A:anovelinhibitorofbacterialproteinsynthesis.I.Isolationandcharacterization.,JAntibiot(Tokyo).1991B;44(7)693-701中定义)、GE37648A(如Stella等‘AntibioticGE37468A:anewinhibitorofbacterialproteinsynthesis.I.Isolationandcharacterization.'JAntibiot(Tokyo).1995^8月;48(8)780-6、Erratum:JAntibiot(Tokyo)1995年12月;48(12):C_3中定义)禾口Amythiamicin(如(‘Novelantibiotics,amythiamicins.,JAntibiot(Tokyo).1994年6月;47(6):668-74,1145-52和1153-9中定义)。新的Ef-tu抑制剂也描述于2007年12月19日提交的国际专利申请号PCT/US07/025955中。此类新Ef-tu抑制剂更特异地包括如下表示的通式I到XI的化合物(包括其可药用盐,以及其对映异构体、立体异构体、旋转异构体、互变异构体、非对映体或外消旋物)<formula>formulaseeoriginaldocumentpage10</formula><formula>formulaseeoriginaldocumentpage11</formula><formula>formulaseeoriginaldocumentpage12</formula>这种前体蛋白的氨基酸序列对硫肽的最终结构至关重要。如将在下文中详细描述的,本发明的硫肽前体蛋白质可用于再生新鉴定的硫肽的骨架或产生已知硫肽的新衍生物,其例如具有改良性质。本发明因此不仅涉及SEQIDNO:1、SEQIDNO5或SEQIDNO11的前体蛋白,也涉及可用于硫肽衍生物生物合成的任何变体。本领域技术人员将知道怎样根据待合成硫肽的氨基酸骨架设计所述变体。在SEQIDN0:1中,在14氨基酸骨架中发现的六个半胱氨酸是修饰这些分子的噻唑杂环的前体。此外,两个丝氨酸残基参与吡啶环系在大环和侧链交界处的形成。在GE2270A分子的硫肽侧链中发现了额外的噁唑啉,并在通式(I)到(XI)的新Ef-tu抑制剂中发现了分别通过丝氨酸的杂环化和脱水形成的脱氢丙氨酸残基。在特定实施方案中,当与原始序列相比时,SEQIDN0:1、SEQIDN05或SEQIDNO11的变体具有不超过1、2、3、4、5、6或10个缺失、插入或取代的氨基酸。取代的氨基酸可以是具有等同功能团或不同功能团的天然氨基酸或非天然氨基酸。下表1给出了可用于相应特定硫肽生物合成的硫肽前体蛋白质序列(SEQIDNO1-14)的指示。表1.硫肽氨基酸骨架的一级序列比对。所述比对集中在形成标记多取代氮杂环的两个不变丝氨酸分子结合的大环周围。硫链丝菌肽具有4个氨基酸的额外氨基延伸。<table>tableseeoriginaldocumentpage13</column></row><table>在本申请中使用以下标准密码字母用于描述任何氨基酸、肽和蛋白质序列A,丙氨酸;R,精氨酸;N,天冬酰胺;D,天冬氨酸;C,半胱氨酸;Q,谷氨酰胺;E,谷氨酸;G,甘氨酸;H,组氨酸;I,异亮氨酸;L,亮氨酸;K,赖氨酸;M,甲硫氨酸;F,苯丙氨酸;P,脯氨酸;S,丝氨酸;T,苏氨酸;W,色氨酸;Y,酪氨酸;V,缬氨酸。更普遍地,在一个特定实施方案中,氨基酸序列SEQIDNO:1的所述变体具有以下通式SXNCXCXXCCSCSX,其中X可以是任何氨基酸。更优选地,SEQIDNO1的所述变体包含以下通式SXiNCX2CX3X4CCSCSX5,其中Xi是C或S,X2是V或F,X3是G或Y,X4是aF,P、I或V并且&是?或S。此类变体的实例是SEQIDN0:2-4的前体蛋白。在另一特定实施方案中,氨基酸序列SEQIDNO:5的所述变体包含以下通式SCX2X3CX4CX5X6X7X8,其中Xi是T或V,优选T,X2是T或G,优选T,X3是C或S,优选C,X4是任何氨基酸,优选V、I、E或A,X5是任何氨基酸,优选T、C、V或A,X6和X7独立地是C或S,优选C,&是(或S,并且X9是任何非氨基酸残基,或T或S。此类变体的实例是SEQIDNO6-10的前体蛋白。在另一特定实施方案中,氨基酸序列SEQIDNO11的所述变体包含以下通式SCX2SX3X4X5X6SSSSSS,其中Xi是!1或V,优选!^是!1或G,优选!\&是5、6或六,父4是V、C或4,&是5、1~或々,乂6是(或S。此类变体的实例是SEQIDNO12-14的前体蛋白。2.编码硫肽前体蛋白质的基因的核酸本发明还提供编码硫肽前体蛋白质的基因和/或可读框的核酸。更具体是,本发明提供包含编码如上所定义的硫肽前体蛋白质的核苷酸序列的核酸。“核酸”指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯多聚体形式,或其任何磷酸酯类似物,如单链形式或双链螺旋的硫代磷酸酯类和硫代酸酯类。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋(helices)是可能的。术语核酸,具体而言DNA或RNA分子仅指分子的一级和二级结构,并不限于任何特定三级形式。因此,该术语包括尤其是见于线性(例如限制性片段)或环形DNA分子、质粒和染色体中的双链DNA。“重组DNA分子”是已经进行分子生物学操作的DNA分子。“多核苷酸”或“核苷酸序列”是核酸,如DNA和RNA中的一系列核苷酸碱基(也称作“核苷酸”),并表示两个或更多个核苷酸的任何链。核苷酸序列通常携带遗传信息,包括用于产生蛋白质和酶的细胞装置的信息。这些术语包括双链或单链基因组和cDNA、RNA、任何合成的和遗传处理的多核苷酸,以及正义和反义多核苷酸(尽管此处仅表示了正义链)。这包括单链和双链分子,即DNA-DNA、DNA-RNA和RNA-RNA杂合体。这也包括含有修饰碱基,例如硫代尿嘧啶、硫代鸟嘌呤和氟代尿嘧啶的核酸。本文中核酸的侧翼可以是天然调节(表达控制)序列,或可以与包括启动子、其他核糖体结合位点序列、调节响应元件、信号序列等的异源序列连接。也可通过本领域已知的任何手段修饰所述核酸。此类修饰的非限制性实例包括甲基化、“帽子”、类似物对一个或多个天然核苷酸的取代和核苷酸间修饰,如具有不带电连接(例如甲基化磷酸酯类、磷酸三酯类、氨基磷酸盐类、氨基甲酸酯类等)和带电连接(例如硫代磷酸酯类、二硫代磷酸酯类等)的那些。术语“基因”,也称为“结构基因”表示编码或对应于包含一个或多个蛋白质所有或部分的氨基酸特定序列的DNA序列,并可以包括或可以不包括调节DNA序列,如启动子序列,其决定例如基因表达的条件。非结构基因的一些基因可以从DNA转录成RNA,但不翻译成氨基酸序列。其他基因可以作为结构基因的调节物或DNA转录的调节物起作用。“编码序列”或“编码”表达产物如RNA、多肽、蛋白质或酶的序列,是当表达时产生所述RNA、多肽、蛋白质或酶的核苷酸序列,即所述核苷酸序列编码所述多肽、蛋白质或酶的氨基酸序列。蛋白质的编码序列可包括起始密码子(一般是ATG或GTG)和终止密码子。当RNA聚合酶转录所述编码序列成为RNA,尤其是mRNA,并翻译成所述编码序列编码的蛋白质时,编码序列在细胞中处于表达控制序列的“控制下”或“有效连接”表达控制序列。术语“异源的”指非天然元件的组合。例如,异源DNA指非天然定位于细胞,或所述细胞的染色体位点中的DNA。优选地,所述异源DNA包括对细胞外源的基因。例如,本发明包括包含DNA序列和非DNA序列部分的异源DNA序列的嵌合DNA分子。在该上下文中,所述异源DNA序列指非天然定位于硫肽生物合成基因簇序列中的DNA序列。或者,所述异源DNA序列可以天然定位于其非天然位置处的生物合成基因簇中。异源表达调节元件是与不同基因而非自然界中有效连接的基因有效连接的元件。在本发明的上下文中,编码目的蛋白质的基因对所述基因插入其中用于克隆或表达的载体DNA是异源的,并且其对含有所述基因在其中表达的该载体的宿主细胞是异源的。术语“表达控制序列”指组合以调节编码序列转录的启动子、任何增强子元件或抑制元件(例如复制起始区)。术语“表达”表示允许或引起基因或DNA序列中的信息表现出来,例如通过激活参与相应基因或DNA序列转录和翻译的细胞功能来产生蛋白质。在细胞中或由细胞表达DNA序列以形成“表达产物”如蛋白质。表达产物本身,例如所得蛋白质也可称作由细胞“表达”。表达产物的特征可以是细胞内的、细胞外的或分泌的。术语“细胞内的”表示在细胞内的某些东西。术语“细胞外的”表示细胞外的某些东西。如果物质从细胞上或细胞内到细胞外以显著量出现,那么其由细胞“分泌”。术语“转化”表示“外源”(即外部的或细胞外的)基因、DNA或RNA序列引入细胞中,使得宿主细胞表达所述引入基因或序列,以产生期望物质,通常是所述引入基因或序列编码的蛋白质或酶。所述引入基因或序列也可称作“克隆”或“外源”基因或序列,可包括调节或控制序列,如起始序列、终止序列、启动子序列、信号序列、分泌序列或细胞遗传装置使用的其他序列。所述基因或序列可包括非功能序列或功能未知的序列。接受并表达引入DNA或RNA的宿主细胞已经被“转化”并且是“转化体”或“克隆”。引入宿主细胞的DNA或RNA可以来自任何来源,包括与宿主细胞相同的属或种的细胞,或不同属或种的细胞。本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了小的结构基因,其编码SEQIDN0:1和SEQIDNO3的整个肽骨架。前体前蛋白原的预测大小分别是57和49个氨基酸,并分别描述于SEQIDNO19和SEQIDNO20中。然而,存在表明可选翻译起始位点的许多起始密码子。所述14氨基酸硫肽前体序列位于C末端。已经从如实施例4中所示的远青链霉菌ETH28555物种中鉴定了不相关的硫肽硫链丝菌肽的相似结构基因,并且其编码SEQIDNO:6的整个肽骨架。硫链丝菌肽的前体前蛋白原的预测大小是60个氨基酸并描述于SEQIDNO65中。在一个实施方案中,本发明的所述核酸包含编码SEQIDN0:1的14氨基酸硫肽前体的SEQIDNO:15的核苷酸序列。在另一实施方案中,本发明的所述核酸包含编码SEQIDNO3的14氨基酸硫肽前体的SEQIDN016的核苷酸序列。本发明还包括编码SEQIDNO:1、SEQIDNO5和SEQIDNO11的硫肽前体及其任何变体(如表1描述的那些前体变体)的任何核苷酸序列。此类核苷酸序列的实例描述于SEQIDNO:17和18或SEQIDNO65中,分别编码SEQIDNO1和SEQIDNO3和SEQIDN06的硫肽前体蛋白质。以来自SEQIDNO:15_18的探针或引物开始从已知硫肽产生菌中分离并鉴定本发明此类核苷酸序列的方法为本领域所熟知,并且该方法的一个实例示于实施例4中。例如,可使用编码14氨基酸前体蛋白质的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从本文公开的SEQIDNO17或SEQIDNO18进行测定。在另一实施方案中,本发明的所述核酸包含分别编码57个氨基酸或49个氨基酸的前蛋白原的SEQIDNO:17或SEQIDNO18的核苷酸序列,或包含至少SEQIDNO:15或SEQIDNO16的其任何片段。还包括的是所述核酸的修饰。此类修饰包括,例如本领域已知的标记、甲基化和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加所选表达系统中的表达、产量和/或提高纯化,或用于另一期望目的。在另一实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选,其为表达载体。如本文使用,术语“表达载体”指载体,通过所述载体可以将核酸弓丨入宿主细胞,导致引入序列的表达。在一个实施方案中,载体包含启动子和一个或多个控制元件(例如增强子元件),其对引入的核酸是异源的,但被宿主细胞识别和使用。在另一实施方案中,引入载体的序列保留由宿主细胞识别并表达的其天然启动子。在一个实施方案中,与本发明相容的载体是穿梭载体PSET152、p0J436、pOJ446(Bierman等‘PlasmidcloningvectorsfortheconjugaltransferofDNAfromEscherichiacolitoStreptomycesspp.'Gene.1992¥7月1日;116(1)43-9),pHMlla(Motamedi^'IntegrativevectorsforheterologousgeneexpressioninStreptomycesspp.,Gene.1995年7月4日;160(1)25-31)和pIJ8600(Sun等‘GreenfluorescentproteinasareporterforspatialandtemporalgeneexpressioninStreptomycescoelicolorA3(2).'Microbiology.1999年9月;145(Pt9):2221_7)及其衍生物。在另一实施方案中,所述载体是粘粒。“启动子”或“启动子序列”是在细胞中能够结合RNA聚合酶并起始下游(3'方向)编码序列转录的DNA调节区域。为定义本发明的目的,所述启动子序列在其3'末端结合转录起始位点,并向上游(5'方向)延伸以包括起始高于背景的可检测水平的转录必需的最小数量的碱基或元件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1作图方便地进行定义),以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。所述启动子可有效连接其他表达控制序列,包括增强子和阻抑物序列。载体的常见类型是“质粒”,其一般是双链DNA(其可以是环形)的自携分子,通常是细菌来源,其可容易地接受额外的(外源的)DNA并且可容易地被引入合适的宿主细胞中。质粒载体经常含有编码DNA和启动子DNA,并具有适合于插入外源DNA的一个或多个限制性位点。重组克隆载体将经常包括用于克隆或表达的一个或多个复制系统、用于在宿主中选择的一个或多个标记,例如抗生素抗性,以及一个或多个表达盒。可使用本领域内的常规分子生物学和重组DNA技术产生载体构建体。在文献中详细解释了此类技术。参阅例如Sambrook,Fritsch&Maniatis,MolecularCloning:ALaboratoryManual,第二片反(1989)ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(^^I^J"Sambrook1989");DNACloning:APracticalApproach,第I和II卷(D.N.Glover编著1985);F.M.Ausubel等(编著),CurrentProtocolsinMolecularBiology,Johnffiley&Sons,Inc.(1994)。或者,可使用建构生物学公司如CodonDevices(Cambridge,MA,USA;http://www,codondevices.com/)或BlueHeronBiotechnology(Bothwel1,WA,USA;http://www.blueheronbio.com/)DNA地或完全地合成载体构建体。3.用于从硫肽前体产生核心大环的核心生物合成酶来自两种不同硫肽产生菌株的两个硫肽生物合成基因簇的表征允许本发明人鉴定两种菌株中的高度保守基因,因此提示这些基因编码核心硫肽分子从硫肽前体进行合成需要的酶。图2和图3显示了从两种不同硫肽产生菌株表征的生物合成基因簇的可读框(0RF)的位置。另一方面,本发明涉及用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列(i)SEQIDNO:23_34的任一个;禾口(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应的野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸。这些多肽可在体外或体内用于进行一个或多个反应步骤,所述反应步骤使用硫肽前体蛋白质作为硫肽分子合成的起始材料。变体多肽可保留与野生型相应序列基本上相同的催化活性,或具有提高的或改善的催化活性。仅为便于阅读,在下文中将这些多肽称作“核心生物合成酶”。下表2描述了可用于硫肽生物合成的核心生物合成酶(SEQIDN0:23_34)的实例及其在生物合成途径中的可能功能。所述可能功能进一步描述于下文实施例5.1和5.2中。表2用于从硫肽前体蛋白质开始生物合成硫肽的核心酶的实例<table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table>4.编码核心生物合成酶的基因本发明进一步提供编码核心生物合成酶的基因和/或可读框的核酸。更特别地,本发明提供包含编码如上定义的任何一种核心生物合成酶的核苷酸序列的核酸。本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了结构基因,其可能编码相应的Ef-tu抑制剂进行生物合成的必需酶。在一个实施方案中,编码用于Ef-tu抑制剂生物合成的酶的所述核酸包含选自如表2中所述SEQIDNO62的基因组片段的0RF9、0RF10、0RF11、0RF12、0RF13和0RF15的核酸。在另一实施方案中,所述本发明核酸包含选自如表2中所述SEQIDN0:63的基因组片段的0RF6、0RF7、0RF8、0RF9、0RF10和0RF11。在表2中也报道了相应的基因组片段(从5’到3’)中各基因的0RF(可读框)的核苷酸位置(坐标)。从已知的硫肽产生菌株并使用来自SEQIDNO35-46的探针或引物分离并鉴定本发明这类核苷酸序列的方法为本领域所熟知。例如,可使用编码各基因保守区的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从公开的核苷酸序列进行测定。也包括的是所述核酸的修饰。此类修饰包括,例如,本领域已知的标记、甲基化,和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加在所选表达系统中的表达、产量,和/或提高纯化,或用于另一期望目的。在一个实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选地,其为适合于在宿主细胞中表达全部或部分核心生物合成酶的表达载体。5.硫肽前体蛋白质及相应硫肽的产生染色体编码骨架的测定以及因此本发明人进行硫肽生物合成的核糖体途径允许本领域的一名普通技术人员在一个实施方案中克隆并表达硫肽生物合成途径,即生物合成基因簇,并因此在修饰的宿主细胞或异源生物中产生硫肽化合物。本发明还允许产生待在异源宿主细胞,即另一菌株而非天然产生菌株中表达的硫肽前体。尽管如本文所述,实施例说明了细菌菌株的用途,可使用任何生物或表达系统。生物的选择取决于技术人员的需要。例如,可使用易于遗传操作的菌株,以利于硫肽化合物的修饰和产生。因此,另一方面,本发明涉及包含如上所述编码硫肽前体蛋白质和/或核心生物合成酶的一个或多个核酸的宿主细胞,其中所述核酸并非天然发现于所述宿主细胞的基因组中和/或所述宿主细胞并不天然产生相应的硫肽。或者,可能通过提供包含适当量的如上所述硫肽前体蛋白质的培养基,并在所述培养基中培养微生物来完成硫肽或硫肽衍生物的制备,其中所述微生物还包含硫肽生物合成需要的其他基因,例如编码核心生物合成酶的基因。如本文使用,术语“宿主细胞”或“微生物”表示以任何方式选择、修饰、转化、培养或使用或操作用于通过细胞产生硫肽前体或硫肽及其衍生物的任何生物的任何细胞。例如,宿主细胞可以是进行处理以表达特定基因、DNA或RNA序列、蛋白质或酶的一个细胞。宿主细胞可进一步用于筛选或下文所述的其他测定。可在体外或非人动物(例如转基因动物或瞬时转染动物)中一个或多个细胞中培养宿主细胞。宿主细胞或微生物本身可选自任何生物体,包括原核(例如细菌)细胞、植物细胞,和真核细胞,所述真核细胞包括昆虫细胞、酵母细胞和哺乳动物细胞。适当宿主细胞的代表性实例包括细菌细胞,如大肠杆菌(E.coli)、链霉菌(Str印tomyces)和枯草芽孢杆菌(Bacillussubtilis)细胞;真菌细胞,如酵母细胞,如毕赤酵母(Pichia)或酿酒酵母(Saccharomyces)细胞,丝状真菌如木霉(Trichoderma)或曲霉细胞(Aspergillus);和昆虫细胞如果蝇(DrOSOphila)S2和SpodopteraSf9细胞。优选地,所述宿主细胞选自已知合成硫肽衍生物或被描述对所述硫肽具有抗性的宿主细胞,如Str印tomycesramocissimus禾口天蓝色链霉菌(Streptomycescoelicolor)(01sthoorn-Tie1eman等'ElongationfactorTu3(EF-Tu3)fromthekirromycinproducerStreptomycesramocissimusisresistanttothreeclassesofEF-Tu-specificinhibitors.,JBacterid.2007年5月;189(9):3581-90.)。在一些实施方案中,所述宿主细胞选自针对硫肽提供抗性的菌株。为菌株提供抗性的方法为本领域所熟知[KieserT,BibbMJ,ButtnerMJ,ChaterKF,HopwoodD.PracticalStreptomycesGenetics.JohnInnesFoundation,Norwich(2000)]并且在下文实施例中给出了该方法的实例。在制备方法的一些实施方案中,所述宿主细胞还包含硫肽生物合成需要的其他基因。生物合成需要的其他基因可包括例如编码如上述核心生物合成酶的一个或多个基因。所述宿主细胞例如选自野野村氏菌属物种(Nonomuraeaap.)、游动双孢菌属物种(Planobisporasp.)、拟无枝酸菌属物种(Amycolatopsisp.)和链霉素属物种(Str印tomycessp.)。本文包括的特定宿主细胞包括,但不限于链?包囊菌亚目(Streptosporangineae)链孢子囊菌(actinomycete)的生物,包括诺卡(氏)土壤菌禾斗(Nocardiopsaceae)、链孢囊菌禾斗(Streptosporangiaceae)禾口高温单孢菌禾斗(Thermomonosporaceae),其优选禾中包括Acrocarpospora、马杜拉放线菌属(Actinomadura)、Herbidospora、小双孢菌属(Microbispora)、小四孢菌属(Microtetraspora)、诺卡(氏)土壤菌属(Nocardiopsis)、里予野村氏菌((Nonomuriasic,由Chiba等(1999)校正为野野村氏菌)ZhenshuiZhang,YueWang和JishengRuan在theInternationalJournalofSystematicBacteriology(1998),48,411-422)中报道的重新分类属)、游动双孢菌属(Planobispora)、游动单孢菌属(Planomonospora)、Planopolyspora、Planotetraspora胃属(Streptosporangium)M胃@的i,B*f述术语旨在包括含有产生硫肽化合物必需的遗传信息的所有生物。该宿主细胞的实例包括在2006年11月30日保藏的野野村氏菌微生物菌株Bp3714-39,保藏号为第德意志微生物保藏中心DSM18831号。用于蛋白质如本发明硫肽前体蛋白质的合适产生技术为本领域技术人员所熟知。参阅例如Sambrook等,MolecularCloning:ALaboratoryManual,ColdSpringHarborPress(ColdSpringHarbor,N.Y.)。可使用多种技术容易地产生本文提供的任何氨基酸序列的序列。这些和其他合适的产生方法为本领域技术人员所知。一方面,通过在所选宿主细胞中表达一个或多个0RF或基因产生本发明的氨基酸序列。本发明因此涉及用于产生硫肽前体蛋白质的方法,所述方法包括步骤在适合于产生所述硫肽前体蛋白质的条件下培养能够表达编码如上述硫肽前体蛋白质的核酸,和任选地,编码核心生物合成酶的一个或多个核酸的宿主细胞。在该方法中,所述宿主细胞并非所述硫肽前体蛋白质的天然产生菌株,或当所述宿主细胞是所述硫肽前体蛋白质的天然产生菌株时,编码硫肽前体蛋白质的所述核酸是重组核酸或异源核酸。根据所用的宿主细胞,可通过所述宿主细胞从硫肽前体完成硫肽化合物生物合成。为此目的,本领域的技术人员可以使用天然合成硫肽前体蛋白质进行翻译后修饰需要的酶的宿主细胞,或在产生菌株中引入硫肽生物合成进行翻译后修饰需要的所述基因。在一个特定实施方案中,上文定义的方法还包括分离基本上纯形式的所述硫肽前体或硫肽化合物。在一个特定实施方案中,本发明涉及本发明宿主细胞用于产生硫肽化合物的用途,所述硫肽化合物选自GE2270A、GE37648A、Amythiamicin和如上述通式I到XI中表示的新Ef-tu抑制剂、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins,nocathiacins、伯尔尼霉素、A10255B禾口radamycin。一方面,本发明提供产生硫肽衍生物的方法,其包括i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体序列,在宿主细胞中合成改变的硫肽前体,ii)从所述改变的硫肽前体合成所述硫肽衍生物;和/或iii)通过一种或更多种核心生物合成酶修饰所述改变的硫肽前体。如本文使用,“改变的硫肽前体”是非天然发现于产生所述硫肽前体的菌株,即产生菌中的硫肽前体。用于合成改变的硫肽前体的方法进一步描述于下文中。优选地,所述改变的硫肽衍生物前体是如上所述的SEQIDNOSEQIDNO:5或SEQIDN0:11的变体。步骤ii)在体外,即宿主细胞外;或在与步骤i)相同的宿主细胞中体内进行。在与步骤i)相同的宿主细胞中,通过所述宿主细胞天然地或从重组DNA合成一种或更多种核心生物合成酶。在产生硫肽衍生物的方法中,使用例如旋转振荡器或搅拌釜发酵罐在有氧条件下温育接种本发明宿主细胞的培养基。在温育过程中通过向接种的培养基注射空气、氧气或适当的气体混合物完成通气。一旦已经积累足够量的硫肽衍生物,就以常规且平常的方式,例如通过萃取和层析方法、沉淀或结晶、和/或本文公开的方式从培养物中浓缩并分离它们。作为萃取的实例,培养物可与合适的有机溶剂如正丁醇、乙酸乙酯、环己烷、正己烷、甲苯、乙酸正丁酯或4-甲基-2-亚硝酸异戊酯混和并搅拌,可在减压情况下通过去除溶剂回收有机层中的硫肽衍生物。可任选地用例如水、乙醇、甲醇或其混合物重新溶解所得残余,并用合适的有机溶剂如己烷、四氯化碳、氯乙烯、二氯甲烷或其混合物重新萃取。去除溶剂后,例如通过层析方法进一步纯化化合物。作为层析的实例,可应用固定相如硅胶或氧化铝,并具有有机洗脱溶剂或其混合物,包括醚、酮、酯、卤代烃或卤代醇;或应用反相层析,其基于具有多种功能基团的修饰的硅胶,并用有机溶剂或其水性混合物,像乙睛、甲醇或不同PH的四氢呋喃洗脱。另一实例是例如固体-液体或液体-液体模式的分配层析。也可应用例如使用S印hadexLH-20(Sigma-AldriCh)并用不同溶剂,优选用醇洗脱的分子排阻层析。因为在本领域比较常见,可通过多种分析方法,包括生物测定、TLC、HPLC或其组合并应用不同检测方法(对TLC通常用UV灯、碘吸入剂或喷雾显色试剂,对HPLC通常用UV灯、质量灵敏的或光散射方法)监测产生以及回收和纯化过程。例如,通过使用具有功能化硅胶的反相柱并应用特定PH下极性水可混和溶剂和水的线性梯度混合物的洗脱剂,和利用不同波长UV灯和质量灵敏监测器的检测方法表示HPLC技术。所得纯化的化合物不含细胞和细胞物质、副产物、试剂和其他外来物质,必要时允许处理并配制化合物用于实验室和/或临床目的。优选用于本发明的化合物的纯度具有以重量计高于80%的纯度;更优选地以重量计至少90%,甚至更优选以重量计高于95%;甚至更优选以重量计至少99%。在一个实施方案中,本发明提供含有本发明化合物的组合物,不管产生多少化合物。宿主细胞生物合成的化合物可任选地进行随机和/或定向化学修饰,以形成是衍生物或结构类似物的化合物。可使用本领域已知的方法和本文描述的方法任选地修饰所述化合物。6.能够产生硫肽前体蛋白质用于硫肽衍生物产生的突变体微生物根据本发明的教导,现在可以遗传处理能够产生硫肽前体蛋白质的微生物,例如目的在于提高硫肽产生或调整硫肽结构。因此,在其他方面,本发明提供突变体微生物,其中所述突变体微生物在编码硫肽前体蛋白质的基因中和/或在编码核心生物合成酶的一个或多个基因中具有突变。所述突变可以是单个或多个核苷酸缺失、插入或取代。其也可以是编码所述硫肽前体蛋白质的基因片段或完整基因的缺失。优选地,所述突变体微生物与相应的野生型微生物相比时,不再表达编码本发明硫肽前体蛋白质的基因。优选地,为了避免极化影响,所述突变是编码所述硫肽前体蛋白质的基因内的框内缺失。所述突变体生物是例如链孢囊菌亚目链孢子囊菌的生物,包括诺卡(氏)土壤菌科、链孢囊菌科和高温单孢菌科,其优选种包括Acrocarpospora、马杜拉放线菌属、Herbidospora、小双孢菌属、小四孢菌属、诺卡(氏)土壤菌属、野野村氏菌((Nonomuriasic,由Chiba等(1999)校正为野野村氏菌)ZhenshuiZhang,YueWang和JishengRuan在theInternationalJournalofSystematicBacteriology(1998),48,411-422)中艮道的重新分类属)、游动双孢菌属、游动单孢菌属、Planopolyspora、Planotetraspora或链孢囊菌属。在特定实施方案中,所述突变体微生物是野野村氏菌属物种,例如野野村氏菌微生物菌株Bp3714-39,其于2006年11月30日保藏,保藏号为DSM18831,并且所述突变是包含SEQIDNO15或SEQIDNO16的基因的破坏,例如包含SEQIDNO17或SEQIDNO18的基因的突变。在另一特定实施方案中,可以用编码如上述任何硫肽前体蛋白质的核酸进一步转化本发明的突变体微生物。该方法允许提供能够从任何硫肽前体蛋白质,包括如上述SEQIDNO=USEQIDN05或SEQIDNO:11的变体生物合成硫肽的微生物。在另一实施方案中,所述突变体微生物还天然或重组表达至少一个或多个编码核心生物合成酶的基因,例如编码选自SEQIDN0:23-34的多肽的一个或多个基因。在一个实施方案中,所述突变体微生物天然或重组表达至少编码SEQIDN0:23-28的多肽的基因。在另一实施方案中,所述突变体微生物天然或重组表达至少编码SEQIDNO35-46的多肽的基因。7.筛选产生新硫肽化合物的新菌株本发明人鉴定的基因可进一步用作鉴定能够产生硫肽衍生物的其他微生物的工具。例如,本发明涉及允许鉴定具有与(i)SEQIDN0:17或SEQIDNO:18的基因并更优选SEQIDN0:15或SEQIDN0:16的片段,或(ii)SEQIDNO:35_46任一个中定义的核心基因基本类似的基因的细胞的任意方法。在特定实施方案中,如通过序列比较算法,如BLAST、FASTA,DNAStrider等测定,当至少约80%,并最优选至少约90%或95%的核苷酸在DNA序列的确定长度内匹配时,则两条DNA序列“基本同源”或“基本类似”。该序列的实例是本发明特定基因的等位基因或物种变体。通过使用可从序列数据库中获得的标准软件比较,或在例如为特定系统规定的严格条件下的Southern杂交实验中鉴定基本同源的序列。在核酸序列的上下文中,术语“序列同一性”“序列同一性百分比”或“相同性百分比”指当比对最大相似性时两条序列中的相同残基。序列同一性比较的长度可以在基因组全长范围内,期望在基因编码序列的全长或至少约500到5000个核苷酸的片段范围内。然而,也期望例如至少约9个核苷酸,一般至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36或更多个核苷酸的更小片段的同一性。类似地,可容易地测定蛋白质全长或其片段范围内的氨基酸序列的“百分之序列同一性”。适当时,片段长度为至少约8个氨基酸,更优选至少约14个氨基酸,并可高达约700个氨基酸。合适片段的实例如下文所述。在一个实施方案中,鉴定能够产生硫肽衍生物的方法包括以下步骤⑴将来自分离细胞的基因组DNA或RNA与SEQIDNO15或SEQIDNO16或其特异片段的核酸探针温育,用于探针与同源DNA区域的特异杂交;并(ii)鉴定包含与步骤(i)的所述探针特异性杂交的基因组DNA区域或RNA的细胞。当单链形式的核酸分子可以与其他核酸分子在温度和溶液离子强度的适当条件下退火时,核酸分子与另一核酸分子如cDNA、基因组DNA或RNA“特异性杂交”(参I^lSambrookMolecularCloning:ALaboratoryManual,^Hjx(1989)ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(本文为"Sambrook等,1989")。温度和离子强度的状况决定杂交的“严格性”。为了对同源核酸进行初筛,可使用对应Tm(解链温度)55°C的低严格杂交条件,例如5XSSC、0.1%SDS,0.25%奶,并且没有甲酰胺;或30%甲酰胺、5XSSC、0.5%SDS)。中等严格的杂交条件对应于更高的Tm,例如40%甲酰胺、5X或6XSCC。高严格杂交条件对应于最高的Tm,例如50%甲酰胺、5X或6XSCC。SCC是0.15MNaCl、0.015M柠檬酸钠。杂交需要两条核酸包含互补序列,尽管根据杂交的严格性,两个碱基之间的错配是可能的。用于杂交核酸的适当严格性取决于本领域熟知的变量核酸的长度和互补的程度。两条核苷酸序列之间的相似性或同源性的程度越高,具有这些序列的核酸的杂交的Tm值越大。核酸杂交的相对稳定性(对应于更高的Tm)以以下顺序降低RNARNA、DNARNA、DNA:DNA。对于长度大于100个核苷酸的杂合体,衍生了用于计算Tm的方程式(参阅Sambrook等,上文,9.50-9.51)。对于更短核酸,即寡核苷酸的杂交,错配的位置变得更重要,并且寡核苷酸的长度决定了它的特异性(参阅Sambrook等,上文,11.7-11.8)。杂交核酸的最小长度是至少约10个核苷酸;优选至少约15个核苷酸;并更优选所述长度是至少约20个核苷酸。在特定实施方案中,使用标准的杂交条件。术语“标准杂交条件”指55°C的Tm,并利用如上文阐明的条件。在优选实施方案中,所述Tm是60°C;在更优选的实施方案中,所述Tm是65°C。在特定实施方案中,使用“高严格条件”。用于寡核苷酸(例如寡核苷酸探针或引物)的合适的杂交条件通常与全长核酸(例如全长cDNA)多少有些不同,因为寡核苷酸具有更低的解链温度。因为寡核苷酸的解链温度将取决于所涉及的寡核苷酸序列的长度,所以合适的杂交温度将根据所用的寡核苷酸分子不同而不同。示例性温度可以是37°C(对于14碱基的寡核苷酸)、48°C(对于17碱基寡核苷酸)、55°C(对于20碱基的寡核苷酸)和60°C(对于23碱基的寡核苷酸)。用于寡核苷酸的示例性合适的杂交条件包括在6XSSC/0.05%磷酸钠中洗涤,或提供等同程度杂交的其他条件。在本方法的一个优选实施方案中,设计对编码硫肽前体的基因特异的寡核苷酸并用于鉴定能够产生硫肽化合物的新细胞。此类寡核苷酸可用于编码硫肽前体蛋白质的基因片段的PCR扩增。优选地,筛选更低等的真核细胞,并更优选来自放线菌类的细胞。8.编码硫肽前体蛋白质的基因的遗传操作和用于筛选新硫肽衍生物的用途在另一实施方案中,本发明提供修饰编码硫肽前体蛋白质的基因和/或可读框的一个或多个核苷酸序列的方法。例如,此类修饰或改变可用于在所选表达系统中提高表达或产生新硫肽衍生物的目的。可进行其他改变以消减、修饰或增强硫肽化合物的功能,包括提高抗生素功能或减少非期望的性质。一方面,从修饰编码硫肽前体蛋白质的核酸序列完成改变的硫肽前体的合成。在一个实施方案中,改变的核酸序列在所选宿主细胞中可通过合适的载体向如上述异源宿主细胞提供,并用于表达相应产物。或者,可直接在产生硫肽的菌株携带的天然基因中例如通过所述菌株的遗传操作进行所述改变。本发明包括改变编码本发明前体蛋白的任何核酸序列的任何方法。更具体地是,本发明包括在本发明蛋白质中插入氨基酸、缺失氨基酸或取代氨基酸的任何方法。可在核酸水平上进行修饰。通过标准技术进行这些修饰并为本领域所熟知。因此,本发明提供方法,以产生编码硫肽衍生物的前体的核酸,所述方法包括步骤对各核酸,通过在所述序列(其编码SEQIDNO1-14中任意序列)的至少一个密码子中进行核苷酸取代,产生具有改变核苷酸序列的多个核酸。此类核酸文库可有利地用于筛选新的硫肽衍生物,例如具有改善性质的Ef-tu抑制剂。改变的核酸或核酸文库然后可用于转化宿主细胞用于如上所述的硫肽产生。优选,核酸文库的各核酸具有单个核苷酸取代,使得与野生型相应序列相比时,编码SEQIDNO:1-14任意序列的仅一个密码子突变。产生位点定向诱变或核酸文库的方法为本领域所熟知并例如描述于Biotechniques出版的Hogrefe等的文章中(‘CreatingrandomizedaminoacidlibrarieswiththeQuikChangeMultiSite-DirectedMutagenesisKit.,2002年11月;33(5):1158_60,1162,1164-5)。在一个特定实施方案中,所述核苷酸取代在编码SEQIDNO:1_4任意序列的位置2、5、7、8、14的氨基酸残基的一个或多个密码子中进行。优选地,宿主细胞能够合成硫肽化合物,即还包含硫肽生物合成所需的其他基因。例如,硫肽生物合成所需的其他基因可包含编码选自SEQIDNO23-34的多肽的一个或多个基因。更优选地,改变的核酸与表达载体一起进行转化,因此转化后从所述表达载体合成相应的硫肽前体蛋白质。所得表达文库可用作筛选新硫肽衍生物,例如新Ef-tu抑制剂的工具。9.特定生物合成基因的克隆当对来自产生不同硫肽化合物的两菌株的生物合成基因簇进行表征时,本发明人鉴定了很可能参与硫肽生物合成但却是菌株特异性的0RF。因此提出这些基因很可能编码特定多肽,主要是参与核心硫肽结构的基因调节和酶促修饰的酶和转录调节物,以产生最终的菌株特异性硫肽化合物。表3和表4描述了本发明这些特定多肽的核酸和相应的多肽序列。表3用于从菌I生物合成硫肽的特定多肽的实例<table>tableseeoriginaldocumentpage25</column></row><table>表4用于从菌株II生物合成硫肽的特定多肽的实例<table>tableseeoriginaldocumentpage26</column></row><table>在一个实施方案中,在表3或4中列出的一个或多个多肽用于如上定义通式(I)到(XI)的化合物的体外或体内合成。本发明也涉及表3或4中报道的此类酶的任何功能变体,其保留基本上相同的酶促活性。本发明也涉及表3或4中报道的任何转录调节物的任何功能变体,其保留基本上相同的转录活性。在一个实施方案中,此类多肽与上表列出的原始多肽相比时含有不少于1、2、3、4或5个缺失、插入或取代的氨基酸。在另一实施方案中,此类功能变体与上文列出的一个多肽具有至少80或90%的同一性。这些序列可用于使得能够产生缺少特定步骤的突变体菌株,例如以避免产生非期望副产物。在一个实施方案中,本发明涉及能够产生在上表中列出一个或多个特定基因的表达中有缺陷的硫肽的突变体菌株。在一个特定实施方案中,所述突变体菌株在0RF2-II或0RF3-II(分别是SEQIDNO58和SEQIDNO59)或0RF4-I(SEQIDNO50)编码基因的表达中有缺陷。如本文所用,“缺陷表达”表示与野生型菌株相比时,突变体菌株不再表达对应的多肽,或如在用于定量mRNA表达的常规方法中测定,与野生型菌株稳定状态mRNA相比时,所述相应多肽具有超过50%或超过90%减少的稳定状态mRNA量。例如,基因被阻断,或部分或完全缺失,使得不再合成功能性蛋白质。这些序列可进一步用于与编码前体蛋白的基因和编码核心酶的基因组合,以改造能够产生特异硫肽衍生物的宿主细胞。在一个实施方案中,本发明涉及含有如表2、3和4中所述重组可读框ORFl-II到0RF12-II,或具有相应野生型序列的至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。在另一实施方案中,本发明涉及含有表2、3和4中所述重组ORFl-I到0RF18-I,或与相应野生型序列具有至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。在另一实施方案中,分离的特定酶可单独使用或在例如使用硫肽前体蛋白质作为起始材料的体外方法,例如用于产生硫肽的方法,例如用于产生E-FTu抑制剂的方法的化学反应步骤中组合作为催化剂使用。附图简述图1.硫肽结构基因。可能的起始位点为粗体。14个氨基酸的骨架下面为下划线。图2.来自硫肽产生菌株I的生物合成基因簇。箭头代表假设的启动子。空心箭头代表可读框黑色实心箭头表示系列I结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。HindIII和EcoRI是基因簇侧翼的唯一限制性位点。图3.来自硫肽产生菌株11(菌株Bp3714_39)的生物合成基因簇。箭头代表假设的分散的启动子。空心箭头代表可读框黑色实心箭头表示系列II结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。基因簇的侧翼是PstI限制性位点ο实施例还通过特定实施例来描述本发明。然而,此类实施例的使用仅在于说明而绝不在于限制本发明或任何示例性术语的范围和意义。1.在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因使用PCR方法来分离编码硫肽骨架的染色体序列。从来自中国湖北省的产生硫肽的野野村氏菌菌株中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuickDNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过将摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接到片段化的DNA上来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫肽大环设计的简并引物(CFGCVCNC5‘-CARAAICCRCAIACRCARTTRCA)来扩增硫肽结构基因。在寡核苷酸中包括肌苷以降低简并性。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下95°C15分钟;94°C30秒,55°C30秒,及72°C1分钟,30个循环;以及72°C10分钟。衔接头上的3’氨基修饰阻断延伸并防止由衔接头引物进行的衔接头与衔接头的扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因(图1)的实验成功进行。该前体蛋白质的预测大小为57个氨基酸。然而,存在许多可能表示可选翻译起始位点的起始密码子。14个氨基酸的硫肽序列位于C末端并确定了合成方向。硫肽骨架的一级氨基酸序列以整合到吡啶环的丝氨酸开始并环绕大环以逆时针方向继续并以侧链末端的最后一个氨基酸结束。公共数据库中的同源性搜索揭示没有亲缘关系近的同系物。2.编码硫肽前体蛋白质的基因的遗传破坏自杀载体pSET152-Hind可在大肠杆菌中复制,赋予阿泊拉霉素抗性并携带允许从大肠杆菌向放线菌种进行属间(intergeneric)结合的转移起点(oriT)。pSET152-Hind为广谱宿主性载体PSET152的衍生载体。通过去除HindIII片段从pSET152上删除允许位点特异性整合(int)的基因。可用插入失活或缺失两种方法中的一种来破坏编码硫肽前体蛋白质的基因。第一种方法需要将不具有起始密码子或终止密码子的基因内部片段克隆至pSET152-Hind中。随后可通过细胞接合作用将该质粒导入硫肽产生菌株中。利用阿泊拉霉素选择将鉴定具有插入硫肽结构基因中的载体骨架的突变体。此类事件将抑制转录和翻译并阻止产生硫肽。第二种方法需要将突变体等位基因构建到pSET152-HindIII中并随后转移至产生菌株内。突变体等位基因将包含结构基因的上游和下游序列,但具有优选在框内缺失的可读框。可由赋予对如潮霉素或硫链丝菌肽的抗生素抗性的基因标记/取代该缺失。在结合到产生菌株中,质粒抗生素标记的选择将选择在染色体中具有野生型和突变体等位基因的菌株。在上游或下游序列中质粒和染色体之间的同源重组会导致部分二倍体。载体抗生素标记丢失的选择及后续的PCR筛选缺失或对标记突变体等位基因的抗生素选择将鉴定期望的第二次重组事件,该事件将去除野生型等位基因并保留结构基因的缺失等位基因。或者,现今DNA合成技术的进展允许DNA大片段的合成组装,并且此类服务是可通过商业途径获得的。通过从头化学合成可重新改造硫肽基因簇,用于在替代宿主中进行异源表达和硫肽产生。此类宿主如天蓝色链霉菌(Str印tomycescoelicolor)或变铅青链霉菌(Str印tomyceslividans)将具有良好建立的遗传工具并肯定对硫肽具有抗性或针对硫肽提供抗性。通过在含高于硫肽最小抑制浓度的硫肽浓度的琼脂平板上按IOw至IO11细胞/孢子量铺板来分离抗性菌株。可通过在选择性平板上的菌落生长来鉴定在赋予抗性的群体中预先存在的稀有自发突变体。可通过将细胞暴露于化学诱变剂来提高突变率的频率。硫肽基因簇的化学合成允许引入更优调控元件、基因缺失、去除或引入限制性位点及改变密码子选择。克隆到整合穿梭载体P0J436或游离穿梭载体P0J446上的基因簇的功能性合成拷贝将具有引入到结构基因的限制性位点以允许产生框内缺失。此外,通过在表达噬菌体衍生蛋白质对、或来自Rac原噬菌体的RecE/RecT或来自λ噬菌体的Reda/Redii的大肠杆菌菌株中进行同源重组来精确地处理硫肽基因簇的克隆拷贝或合成版本。该技术称为Red/ETRecombineering或λ介导的重组(Muyrers,J.P.P.,Zhang,Y.,Stewart,Α.F.ETcloning:Thinkrecombinationfirst.GeneticEngineering,PrinciplesandMethods(J.K.Setlow编著),22,77-98KluwerAcademic/PlenumPublishers,NY.(2000))。3.异源表达结构基因以产生可选硫肽结构天然产生菌株或表达硫肽核心和特定生物合成基因但在前体结构基因中具有框内缺失的异源宿主是有用的工具菌株。这些工具菌株可用于产生具有可选结构的硫肽。结构基因的位点定向诱变可用于向硫肽中取代或引入新氨基酸。通过结合或转化将在pHMlla或pSET152中克隆的结构基因的突变版本重新引入表达硫肽生物合成酶的工具菌株中。或者,可产生编码硫肽骨架每一位置上可选氨基酸的文库。可通过基因合成或简并PCR来化学产生该变体文库。PCR方法需要硫肽结构基因的扩增以在硫肽编码骨架中掺入变异并在如PHMlla或PSET152的质粒中掺入用于克隆及表达的限制性酶切位点。PCR引物中的一条引物将是简并的,用于掺入所有氨基酸取代。可改变简并度以允许在骨架的所选位置上进行取代,即不在编码认为是不变量氨基酸上进行取代,如不在形成硫肽大环的噻唑的半胱氨酸的位置上进行取代。两条引物都将标记限制性酶切位点以允许将PCR产物直接克隆至表达载体中。将所有大肠杆菌转化体混合并分离DNA来产生变体文库。文库将转化到工具菌株中并且生物测定可用于鉴定携带支持产生具有可选结构的活性硫肽的结构基因的克隆。4.编码硫链丝菌肽骨架多肽的基因的分离使用PCR方法来分离编码硫链丝菌肽骨架的染色体序列。从硫链丝菌肽产生菌远青链霉菌ETH28555中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuickDNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接片段化DNA来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫链丝菌肽大环设计的简并引物(CTTCICTC:5,-CACGTGCAGATRCANGTNGTRCA-3,)来从该文库中扩增硫链丝菌肽结构基因。根据C0DEH0P原则设计具有5’非简并性夹板结构(consensusclamp)和3’简并核心的简并引物(Rose等C0DEH0P(COnsensus-DEgenerateHybridOligonucleotidePrimer)PCRprimerdesign.NucleicAcidsRes.2003年7月1日;31(13):3763_6)。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下95°C15分钟;94°C30秒,550C30秒,及72°C1分钟,40个循环;以及72°C10分钟。衔接头上的3,氨基修饰阻断了延伸并防止由衔接头引物进行的衔接头与衔接头扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。该策略在鉴定编码硫链丝菌肽大环的基因组片段中证明是成功的。随后使用基因特异引物向上游和下游步移来鉴定全长硫链丝菌肽结构基因。5.来自硫肽产生菌株I和II的生物合成基因簇5.1菌株I图2描述了来自包含用于硫肽合成的生物合成基因簇的菌株I基因组DNA的一个分离的BAC(SEQIDNO62)中可读框的位置。在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。系列I的合成方案(A)0RF9,ORF10,ORF1UORF12,ORF13和0RF14编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。<formula>formulaseeoriginaldocumentpage30</formula>(B)0RF2和0RF3编码很可能参与将修饰掺入尾部的酶。丝氨酸残基的环化脱水作用产生噁唑啉环。由于尾部脯氨酸的存在,尾部额外丝氨酸脱水成脱氢丙氨酸可能需要单独步骤,该步骤很可能在肽中引起出现构象纽接。0RF18可能参与了去除末端序列而留下酰胺基。<formula>formulaseeoriginaldocumentpage30</formula>(C)0RF4、0RF6、0RF7、ORF16和0RF17编码很可能参与特定修饰的酶。0RF4苯丙氨酸的羟化。0RF5天冬酰胺的甲基化。0RF7噻唑的甲基化。0RF16和0RF17向噻唑添加甲氧乙基。<formula>formulaseeoriginaldocumentpage31</formula>5.2菌株II图3描述了来自包含用于硫肽合成的生物合成基因簇的菌株II基因组DNA的一个分离的BAC(SEQIDNO63)中ORF的位置。在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。系列II的合成方案(A)0RF6、0RF7、0RF8、0RF9、0RF10和ORFll编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。<formula>formulaseeoriginaldocumentpage32</formula>(B)0RF12编码切割末端丙氨酸的肽酶。(C)0RFU0RF2和0RF3编码了可能参与特定修饰的酶。噻唑的0RF1甲基化及0RF2和0RF3参与苯丙氨酸和异亮氨酸的羟基化。异亮氨酸羟基化两次并分解产生环氧化物。6.硫肽衍生物的产生培养基组分(a)种子培养基<table>tableseeoriginaldocumentpage34</column></row><table>(b)生产培养基A<table>tableseeoriginaldocumentpage35</column></row><table>将如实施例3所述宿主细胞的冰冻悬液(1.5mL)接种至含有500mL种子培养基的两升无挡板摇瓶。该摇瓶30°C下在摇床中以200转/分钟和50mm振幅温育3天。通过按每瓶40mL将第一阶段的种子接种至每个含有500mL种子培养基的8个两升无挡板摇瓶中进行第二个种子阶段。该摇瓶在30°C的摇床中以200转/分钟和50mm振幅温育2天。通过按每瓶4升将第二阶段的种子接种至每个含有100升种子培养基的2个150升规模的搅拌釜发酵罐中进行第三个种子阶段。按以下参数操作150升规模的发酵罐3天温度=30°C、搅拌=80转/分钟、空气流动=25slpm及压力=0.5bar。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制PH值。用200升来自第三个种子阶段的种子接种含有3500升生产培养基A的5500升规模的搅拌釜发酵罐。5500升规模的发酵罐操作参数如下温度=30°C、空气流动=1050slpm及压力=0.5bar。搅拌控制在60转/分钟并在44小时之后增加到80转/分钟。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制PH值。温育5天后收集含3500升发酵液的发酵罐。7.硫肽衍生物的分离通过在搅拌槽中加入乙酸乙酯过夜收集并提取发酵液。在提取过程中将混合物流经连续DispaX反应器(Jahnke&Kunkel,德国)用于最大剪力(sheerforce)及最佳混和。在连续Westfalia分离器SA20(WestfaliaS印aratorAG,0elde,德国)上分离两相后,通过减压下的蒸发来浓缩乙酸乙酯相。蒸发过程中形成经过滤分离的沉淀。将根据如上描述的方法从培养液的提取物中获得的沉淀溶解于比例为955的二噁烷/水中并过滤去除不可溶成分。在减压及硅藻(diat0me)8(Isolute0,InternationalSorbentTechnologyLtd.,HengoedMidGlam,UK)Wff液。将所获的粉末应用到在比例为90100.5的二氯甲烷/甲醇/乙酸溶液中制备的硅胶层析柱(例如0.040-0.063mm,柱子大小为5x25cm)上。用比例为90100.5的二氯甲烷/甲醇/乙酸溶液以35mL/分钟的流速洗脱柱子。收集30mL经HPLC分析的级分。向含化合物I的混和级分中加入20mL异丙醇并在减压条件下浓缩直至化合物从残留的异丙醇中沉淀出来。通过离心从沉淀中分离出溶剂后,在减压条件下干燥残留物,产生半纯化的硫肽衍生物。权利要求包含选自以下的氨基酸序列的硫肽前体蛋白质(i)SEQIDNO1;(ii)SEQIDNO5;(iii)SEQIDNO11;(iv)或当与SEQIDNO1、SEQIDNO5或SEQIDNO11相比时,具有不超过1、2、3、4、5、6或10个缺失、插入和/或取代氨基酸的所述氨基酸序列的变体。2.权利要求1的硫肽前体蛋白质,其中所述前体是Ef-tu硫肽抑制剂的生物合成前体。3.权利要求2的硫肽前体蛋白质,其中所述Ef-tu抑制剂选自GE2270A、GE37648A、Amythiamicin或如以下任意通式I_XI中的任意通式所示的化合物<image>imageseeoriginaldocumentpage3</image><image>imageseeoriginaldocumentpage4</image><formula>formulaseeoriginaldocumentpage5</formula>4.核酸,其包含编码权利要求1-3中任一项的硫肽前体蛋白质的核苷酸序列。5.权利要求4的核酸,其包含SEQIDNO5的核苷酸序列。6.权利要求5的核酸,其包含SEQIDNO6的核苷酸序列或包含至少SEQIDNO5的其任何片段。7.权利要求4-6中任一项的核酸,其中所述核酸序列有效连接异源转录和翻译控制序列。8.权利要求7的核酸,其中所述核酸是表达载体。9.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列(i)SEQIDNO:23-34中的任一个,(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6、或10个缺失、插入或取代氨基酸,并保留基本上相同的酶功能。10.核酸,其包含编码权利要求9的多肽的核苷酸序列。11.权利要求10的核酸,其中所述核酸序列有效连接异源转录和翻译序列。12.包含权利要求1-86中任一项的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。13.权利要求12的宿主细胞,其还包含硫肽生物合成所需的其他基因。14.权利要求13的宿主细胞,其中硫肽生物合成所需的所述其他基因包含权利要求10或11定义的核酸。15.权利要求13或14的宿主细胞,其选自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种、大肠杆菌(Escherichiacoli)、棒杆菌属物种(Corynebacteriumsp.)、芽孢杆菌属物种(Bacillussp.)和链霉菌属物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌(Streptomycesalbus)、Streptomycesramocissimus、丘链霉菌(Streptomycescollinus)、弗氏链霉菌(Streptomycesfradiae)、远青链霉菌或灰色链霉菌(Str印tomycesgriseus),并且其中所述宿主细胞针对所述硫肽提供抗性。16.突变体微生物,其中与相应野生型微生物相比时,所述突变体微生物不再表达编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因。17.权利要求16的突变体微生物,其中所述突变在相应野生型微生物中是编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因的破坏。18.权利要求17的突变体微生物,其中所述微生物是野野村氏菌属物种并且所述突变是包含SEQIDNO15或SEQIDNO16的基因的破坏。19.权利要求16-18中任一项的突变体微生物,其中用权利要求1-8中任一项的核酸进一步转化所述突变体。20.突变体微生物,其中所述突变体微生物不再表达编码如权利要求9定义的一个或多个多肽的一个或多个基因。21.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列(i)SEQIDNO:47-60的中任一个,(ii)(i)中列出的氨基酸序列的变体,与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸,并保留基本上相同的酶促功能或调节功能,(iii)(i)中列出的氨基酸序列的变体,其与(i)中列出的一个多肽具有至少80%或至少90%的同一性,并保留基本上相同的酶促功能或调节功能。22.包含编码权利要求21的多肽的核苷酸序列的核酸。23.权利要求22的核酸,其中所述核酸序列有效连接异源转录和翻译序列。24.包含权利要求22或23的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。25.权利要求24的宿主细胞,其还包含硫肽生物合成需要的其他基因。26.权利要求25的宿主细胞,其中硫肽生物合成需要的所述其他基因选自编码权利要求4-8中任一项的硫肽前体蛋白质的核酸和权利要求10-11的核酸。27.突变体微生物,其能够产生一个或多个特定基因的表达有缺陷的硫肽,所述特定基因编码如权利要求21中所定义的一个或多个多肽。28.用于产生硫肽前体蛋白质的方法,所述方法包括在适合于产生所述硫肽前体蛋白质的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。29.产生硫肽化合物的方法,所述方法包括在适合于产生所述硫肽前体化合物的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。30.权利要求28或29的方法,其还包括分离基本纯形式的所述硫肽前体或硫肽化合物。31.权利要求29或30的方法,其中所述硫肽化合物选自GE2270A、GE37648A、如权利要求5中任意通式I-X中任意通式所示的化合物、amythiamicin、微球菌素、硫链丝菌肽、诺雪七月太、高硫青毒素、thiocins、nocathiacins、伯尔尼毒素、A10255B禾口radamycin。32.产生硫肽衍生物的方法,其包括(i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体的序列,在宿主细胞中合成改变的硫肽前体,()从所述改变的硫肽前体合成所述硫肽衍生物。33.权利要求32的方法,其中所述改变的硫肽衍生物前体是如权利要求1-11中任一项定义的SEQIDNO:1、SEQIDNO5或SEQIDNO11的变体。34.权利要求32或33的方法,其中步骤ii)在体外进行。35.权利要求32或33的方法,其中步骤ii)在与步骤i)相同的宿主细胞中体内进行。36.产生硫肽或硫肽衍生物的方法,其包括(i)提供包含如1-11中任一项中定义的硫肽前体蛋白质的培养基,(ii)在所述培养基中培养微生物,其中所述微生物还包含硫肽生物合成所需的其他基因。37.权利要求36的方法,其中硫肽生物合成所需的所述其他基因选自编码下述多肽的那些基因,所述多Jj太选自SEQIDN0:23-34和SEQIDNO:47_60。38.权利要求36或37的方法,其中所述微生物选自自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种和链霉素物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌、Streptomycesramocissimus、丘链霉菌、弗氏链霉菌、远青链霉菌或灰色链霉菌,其中所述微生物是选择为对所述硫肽或硫肽衍生物有抗性的菌株。全文摘要本发明涉及用于硫肽生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理该前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物产生中的用途。文档编号C07K14/435GK101809030SQ200880102696公开日2010年8月18日申请日期2008年8月6日优先权日2007年8月9日发明者R·莫里斯申请人:诺瓦提斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1