参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用的制作方法

文档序号:564876阅读:376来源:国知局

专利名称::参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用的制作方法参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用本申请是中国专利申请200380102966.6的分案申请,原申请的申请曰是2003年10月8日,发明名称是"参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用"。本发明涉及螺旋霉素生物合成途径中新基因的分离和鉴定,并涉及参与该生物合成的新多肽。本发明还涉及这些基因用于增加所产生的螺旋霉素的产量和纯度水平的用途。本发明还涉及这些基因用于构建能够导致新抗生素合成或螺旋霉素衍生形式的突变体的用途。本发明还涉及过量表达这些基因所产生的分子,并且最终涉及过量表达此类基因所产生的分子的药学活性组合物。链霉菌属(Streptomyces)是革兰阳性丝状土壤细菌。由于它们分泌多种降解酶,所以在有机物质的分解和矿化中具有重要的作用。链霉菌属表现出形态学上的分化现象,这在原核生物中是唯一的,同时链霉菌属具有以产生化学结构和生物学活性显著不同的次级代谢物为特征的代谢上的分化。在这些代谢物中,存在由细菌生二素链霉菌(Streptomycesambofaciens)天然合成的螺旋霉素。螺旋霉素是大环内酯类抗生素,在兽医药和人类医药方面都具有用途。大环内酯的特征在于存在其上连接有一个或多个糖的内酯环。生二素链霉菌天然产生螺旋霉素I、II和III(参照图1);然而,螺旋霉素I的抗生素活性明显高于螺旋霉素II和III的抗生素活性(Liu等,1999.)。螺旋霉素I分子由基于内酯的大环(称为platenolide)和三个糖即forosamine、碳霉糖和mycarose组成(参照图1)。螺旋霉素的抗生素活性是由于在原核生物中通过有关将该抗生素结合到细菌核糖体上的机制而抑制蛋白质合成。属于大环内酯家族成员并也具有内酯环的某些化合物在抗生素领域之外越来越多地^^使用。因此,产物FK506具有免疫抑制剂作用并且在器官移植领域、类风湿关节炎领域,更加普遍的是对与自身免疫反应相关的病理疾病具有治疗应用前景。其他大环内酯,例如除虫菌素,具有杀虫和抗蠕虫活性。到目前为止已对许多生物合成途径在链霉菌属中进行了研究,其中所(综述见K,Chater,1990)。然而,到目前为止,螺:旋霉素生物合成途径的了解还是非常有限的。螺旋霉素生物合成是包括许多步骤并涉及许多酶的复杂过程(Omura等,1979a,Omura等,1979b)。螺旋霉素属于一大类聚酮化合物(polyketide),这类聚酮化合物包括在土壤中发现的微生物中特别丰富的复杂分子。这些分子归为一类不是由于结构类似,而是由于它们的生物合成途径的步骤中的某点相似性。具体而言,聚酮化合物是通过复杂的一系列反应产生的,其中共同的方面是,在它们的生物合成途径中,有一系列反应是由一种或多种称为"聚酮化合物合酶"(PKS)的酶催化的。在生二素链霉菌中,螺旋霉素基于内酯的大环(platenolide)的生物合成是通过一系列由五个PKS基因编码的八个组件进4亍的(S.Kuhstoss,1996,美国专利5,945,320)。螺旋霉素是从该内酯环得到的。然而,参与糖合成的多个步骤和酶,以及它们与内酯环连接并对该环进行々务饰以至于获得螺旋霉素目前仍然是未知的。美国专利5,514,544描述了生二素链霉菌中称为srmR的序列的克隆。在那个专利中,提出了srmR基因所编码的蛋白质调控参与大环内酯生物合成的基因的转录的假说。1987年,Richardson及其同事(Richardson等,1987)研究表明生二素链霉菌的螺旋霉素抗性是由至少三个基因赋予的;所述基因称为srmA、srmB和srmC。美国专利4,886,757更加具体地描述了生二素链霉菌含有srmC基因的DNA片段的特点。然而,该基因的序列未公开。1990年,Richardson及其同事(Richardson等,1990)提出了srmB附近的三个基因参与螺旋霉素生物合成的假说。美国专利5,098,837报告了可能参与螺旋霉素生物合成的五个基因的克隆。这些基因命名为srmD、srmE、srmF、srmG和srmH。产生诸如螺旋霉素的化合物的主要困难之一在于产生相对少量产物必需非常大的发酵量这样一个事实。因此期望能够增加此类分子产生的效率以降低其生产成本。螺旋霉素生物合成途径是复杂的过程并且期望鉴定和去除在该过程中可能存在的伴生反应。此种操作的目的是获得更纯的抗生素和/或提高产量。在这方面,生二素链霉菌天然产生螺旋霉素I、II和III(参照图l);然而,螺旋霉素I的抗生素活性明显高于螺旋霉素II和III(Liu等,1999)。因此期望能够有仅产生螺旋霉素I的菌林。由于大环内酯抗生素的商业价值,迫切需要产生新衍生物,特别是具有有利特性的螺旋霉素类似物。期望能够以足够的量产生螺旋霉素或螺旋霉素衍生物生物合成途径的生物合成中间体,特别是为了产生螺旋霉素衍生的杂化抗生素(hybridantibiotics)。本发明涉及对其产物参与螺旋霉素生物合成的基因的克隆。首先,本发明涉及螺旋霉素生物合成途径的新基因和参与该生物合成的新多肽。生物合成途径的基因和相关编码序列已经克隆并且已经确定了每个基因的DNA序列。下文中将所克隆的编码序列称为orfl*c,orf2*c,orf3*c,orf4六c,orf5、orf6orf7六c,or仿orf9*,orfl0orfl,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orfllc,orfl2,orfl3c,orfl4,orfl5c,orfl6,orfl7,orfl8,orfl9,orf20,orf21c,orf22c,orf23e,orf24c,orf25c,orf26,orf27,orf28c,orf29,orf30c,orBl,orf32c,orf33和orf34c。由这些序列所编码的蛋白质在螺旋霉素生物合成途径中的功能在下文中进行讨论,由图4、5、6和8图解i兌明。发明概述1)本发明的第一主题涉及编码参与螺旋霉素生物合成的多肽的多核苷酸,其中所述多核苷酸的序列是(a)序列SEQIDNo.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一,(b)由序列(a)的变体组成的序列之一,(c)由于遗传密码简并性而衍生自序列(a)和(b)的序列之一。2)本发明的主题还涉及在高严格杂交条件下,与至少一条根据以上段落l)的多核苷酸杂交的多核苷酸。3)本发明还涉及与包含以上段落l)的多核苷酸中的至少10,12,15,18,20到25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,卯0,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苷酸具有至少70%,80%,85%,90%,95%或98%核苦酸同一性的多核苷酸。4)本发明还涉及根据以上段落2)或3)的多核苷酸,所述多核苷酸从链霉菌属的细菌分离。5)本发明还涉及根据以上段落2)、3)或4)的多核苷酸,所述多核苷酸编码参与大环内酯生物合成的蛋白质。6)本发明还涉及根据以上段落2)、3)或4)的多核苷酸,所述多核苷酸编码的蛋白质具有的活性类似于与其杂交或与其呈现同一性的多核苷酸所编码的蛋白质。7)本发明还涉及表达根据以上段落1),2),3),4),5)或6)的多核苷酸所得到的多肽。8)本发明的另一方面涉及参与螺旋霉素生物合成的多肽,其中所述多肽的序列是(a)序列SEQIDNo.4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150之一,(b)如(a)中定义的序列之一,但是在所述全长序列中已对一个或多个氨基酸进行了替换、插入或删除而不影响其功能特性,(c)由序列(a)和(b)的变体组成的序列之一。9)本发明的另一主题涉及与包含以上段落8)的多肽中的至少10,15,20,30到40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640个连续氨基酸的多肽具有至少70%,80%,85%,卯%,95%或98%氨基酸同一性的多肽。10)本发明的另一方面还涉及根据以上段落9)的多肽,所述多肽从链霉菌属的细菌分离得到。11)本发明的另一方面还涉及根据以上段落9)或IO)的多肽,所述多肽编码参与大环内酯生物合成的蛋白质。12)本发明的另一方面还涉及根据以上段落9),10)或ll)的多肽,所述多肽具有的活性类似于与其呈现同一性的多肽所具有的活性。13)本发明的另一方面还涉及重组DNA,其含有至少一条根据以上段落1),2),3),4),5)和6)之一的多核苷酸。14)本发明的另一方面涉及根据以上段落13)的重组DNA,其中所述重组DNA包含于载体内。15)本发明的另一方面涉及根据以上段落14)的重组DNA,其中所述栽体选自噬菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC和PAC。16)本发明的另一方面涉及根据以上段落15)的重组DNA,该重組DNA选自pOS49.1,pOS49.ll,pOSC49.12,pOS49.14,pOS49.16,pOS49.28,pOS44.1,pOS44.2,pOS44.4,pSPM5,pSPM7,pOS49.67,pOS49.88,pOS49.106,pOS49.120,pOS49.107,pOS49.32,pOS49.43,pOS49.44,pOS49.50,pOS49.99,pSPM17,pSPM21,pSPM502,pSPM504,pSPM507,pSPM508,pSPM509,pSPMl,pBXLllll,pBXL1112,pBXL1113,pSPM520,pSPM521,pSPM522,pSPM523,pSPM524,pSPM525,pSPM527,pSPM528,pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44,pSPM45,pSPM47,pSPM48,pSPM50,pSPM51,pSPM52,pSPM53,pSPM55,pSPM56,pSPM58,pSPM72,pSPM73,pSPM515,pSPM519,pSPM74,pSPM75,pSPM79,pSPM83,pSPM107,pSPM543和pSPM106。17)本发明的另一方面涉及表达栽体,其中含有至少一条编码才艮据以上段落7)、8)、9)、10)、ll)或12)的多肽的核酸序列。18)本发明还涉及表达系统,其包含适当的表达载体和允许一条或多条才艮据以上段落7)、8)、9)、10)、11)或12)的多肽表达的宿主细胞。19)本发明还涉及根据以上段落18的表达系统,该系统选自原核表达系统和真核表达系统。20)本发明还涉及根据以上段落19)的表达系统,该系统选自在细菌大肠杆菌(E.coli)中表达的系统、允许在昆虫细胞中表达的杆状病毒表达系统、允许在酵母细胞中表达的表达系统和允许在哺乳动物细胞中表达的表达系统。21)本发明还涉及已经将根据以上段落l)、2)、3)、4)、5)、6)、13)、14)、15)、16)和17)之一的至少一条多肽和/或至少一条重组DNA和/或至少一个表达载体导入了的宿主细胞。22)本发明还涉及产生根据以上段落7)、8)、9)、10)、11)或12)的多肽的方法,其中所述方法包括以下步骤a)将至少一条编码所述多肽的核酸插入适当的载体;b)在适当的培养基中培养预先用步骤a)的载体转化或转染的宿主c)回收条件培养基或细胞提取物;d)从步骤c)获得的所述培养基中或者细胞提取物中分离并纯化所述多肽;e)根据需要,表征所产生的重组多肽。23)本发明的另一方面涉及阻断了至少一种大环内酯的生物合成步骤的微生物。24)本发明的另一方面涉及根据以上段落23)的微生物,所述微生物是通过在产生这种(这些)大环内酯的孩t生物中失活至少一种参与这种(这些)大环内酯生物合成的蛋白质的功能而获得的。25)本发明的另一方面涉及根据以上段落24)的微生物,其中这种(这些)蛋白质的失活是通过诱变编码所述蛋白质的基因或者过量表达一条或多条与编码所述蛋白质的信使RNA互补的反义RNA而实施的。26)本发明的另一方面涉及根据以上段落25)的微生物,其中这种(这些)蛋白质的失活是通过辐射诱变、化学诱变剂、定点诱变或基因置换而实施的。27)本发明的另一方面涉及根据以上段落25)或26)的微生物,其中一个诱变或多个诱变是在体外或在原位通过对特定基因中一个或多个碱基的抑制、替代、删除和/或添加或者通过基因失活而实施的。28)本发明的另一方面涉及根据以上段落23)、24)、25)、26)或27)的微生物,其中所迷微生物是链霉菌属的细菌。29)本发明的另一方面涉及才艮据以上段落23)、24)、25)、26)、27)或28)的微生物,其中大环内酯是螺旋霉素。30)本发明的另一方面涉及才艮据以上段落23)、24)、25)、26)、27)、28)或29)的微生物,其中所述微生物是生二素链霉菌菌林。31)本发明的另一方面涉及根据以上段落23)、24)、25)、26)、27)、28)、29)或30)的微生物,其中诱变是在至少一个含有根据以上段落l)、2)、3)、4)、5)和6)之一的序列的基因中进行的。32)本发明的另一方面涉及才艮据以上段落25)、26)、27)、28)、29)、30)或31)的孩i生物,其中诱变是在一个或多个含有对应于一个或多个序列SEQIDNo.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一的基因中进行的。33)本发明的另一方面涉及根据以上段落25)、26)、27)、28)、29)、30)、31)或32)的微生物,其中诱变为对包含对应于序列SEQIDNo.13的序列的基因进行基因失活。34)本发明的另一方面涉及生二素链霉菌菌株,所述菌林选自在国立孩炎生物保藏中心[NationalCollectionofCulturesandMicroorganisms](CNCM)保藏的、保藏日为2002年7月10日、保藏号为1-2卯9,1-2911,1-2912,1-2913,1-2914,1-2915,1-2916或1-2917的菌林之一。35)本发明的另一方面涉及制备大环内酯生物合成中间体的方法,该方法包括以下步骤a)在适当的培养基中,培养根据以上段落23),24),25),26),27),28),29),30),31),32),33)或34)之一的微生物,b)回收条件培养基或细胞提取物,c)从步骤b)中获得的所述培养基或者细胞提取物中分离并纯化所述生物合成中间体。36)本发明的另一方面涉及制备衍生自大环内酯的分子的方法,其中生物合成中间体是按照以上段落35)的方法制备的并且如此所产生的中间体是经修饰的。37)本发明的另一方面涉及根据以上段落36)的制备方法,其中所述中间体是经化学、生物化学、酶学和/或微生物学修饰的。38)本发明的另一方面涉及根据以上段落36)或37)制备的方法,其中将一个或多个这样的基因导入所述微生物,其中所述基因编码的蛋白质能以中间体作为底物而对所述中间体进行修饰。39)本发明的另一方面涉及根据以上段落36)、37)或38)制备的方法,其中大环内酯是螺旋霉素。40)本发明的另一方面涉及根据以上段落36)、37)、38)或39)制备的方法,其中所使用的微生物是生二素链霉菌菌林。41)本发明的另一方面涉及产生螺旋霉素I但不产生螺旋霉素II和III的孩i生物。42)本发明的另一方面涉及根据以上段落41)的微生物,该微生物含有生物合成螺旋霉素I所需的全部基因,但是其中含有序列SEQIDNo.13或其变体之一、或者由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQIDNo.14或其变体之一的多肽的基因不表达或者已经被失活。43)本发明的另一方面涉及根据以上段落42)的微生物,其中所述的失活是通过在编码所述蛋白质的基因内诱变或过量表达与编码所述蛋白质的信使RNA互补的反义RNA而进行的。44)本发明的另一方面涉及根据以上段落43)的微生物,其中所述的诱变是该基因的启动子中、编码序列中或非编码序列中进行的,从而使编码的蛋白质失活或阻止由其表达或其翻译。45)本发明的另一方面涉及根据以上段落43)或44)的微生物,其中诱变是通过辐射、化学诱变剂的作用、定点诱变或基因置换而进行的。46)本发明的另一方面涉及根椐以上段落43)、44)或45)的微生物,其中诱变是在体外或在原位通过对特定基因中一个或多个碱基的抑制、替代、删除和/或添加或者通过基因失活而进行的。47)本发明的另一方面涉及根据以上段落41)或42)的孩t生物,其中所述微生物是过量表达螺旋霉素生物合成途径中的基因获得的,其中所述基因不包括含有对应于SEQIDNo.13或其变体序列、或由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQIDNo.14或其变体之一的多肽的基因的这些基因。48)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)或47)的微生物,其中所述微生物是链霉菌属的细菌。49)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)、47)或48)的微生物,其中所述微生物是由产生螺旋霉素I、II和III的起始菌林获得的。50)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)、47)、48)或49)的微生物,所述微生物是通过在含有对应于SEQIDNo.13或其变体序列、或由于遗传密码筒并性而由其衍生的序列之一、并且编码序列SEQIDNo.14或其具有相同功能的变体之一的多肽的基因中进行诱变而获得的。51)本发明的另一方面涉及根据以上段落41)、42)、43)、44)、45)、46)、47)、48)、49)或50)的微生物,其中所述微生物是从产生螺旋霉素I、II和III的生二素链霉菌菌株获得的,其中对含有对应于SEQIDNo.13或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。52)本发明的另一方面涉及生二素链霉菌菌林,所述菌林是于2002年7月10日保藏在国立微生物保藏中心(CNCM)的菌林,保藏号为1-2910。53)本发明的另一方面涉及产生螺旋霉素I的方法,该方法包括以下步骤(a)在适当的培养基中,培养根据以上段落41)、42)、43)、44)、45)、46)、47)、48)、49)、50)、51)和52)之一的微生物,(b)回收条件培养基或细胞提取物,(c)从步骤b)获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素I。54)本发明的另一方面涉及根据以上段落l)、2)、3)、4)、5)和6)之一的多核苷酸的用途,用于提高微生物的大环内酯生产量。55)本发明的另一方面涉及产生大环内酯的突变微生物,该突变微生物在至少一个含有对应于根据以上段落l)、2)、3)、4)、5)和6)之一的序列的基因中进行了遗传修饰并且过量表达至少一个含有根据以上段落1)、2)、3)、4)、5)和6)之一的序列的基因。56)本发明的另一方面涉及才艮据以上段落55)的突变微生物,其中遗传修饰由在特定基因中一个或多个碱基的抑制、替代、删除和/或添加组成,目的为表达一个或多个具有更高活性的蛋白质或表达更高水平的这种或这些蛋白质。57)本发明的另一方面涉及根据以上段落55)的突变微生物,其中特定基因的过量表达是通过增加基因拷贝数和/或导入比野生型启动子活性更强的启动子而获得的。58)本发明的另一方面涉及根据以上段落55)或57)的突变孩吏生物,其中特定基因的过量表达是通过用根据以上段落13、14或17的重组DNA构建体转化产生大环内酯的微生物,允许该基因过量表达而获得的。59)本发明的另一方面涉及根据以上段落55)、56)、57)或58)的突变微生物,其中遗传f"饰是在一个或多个含有对应于一个或多个序列SEQIDNo.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一或其变体之一或由于遗传密码简并性而由其衍生的序列之一的基因中进行的。60)本发明的另一方面涉及才艮据以上段落55)、56)、57)、58)或59)的突变微生物,其中微生物过量表达一个或多个含有对应于一个或多个序列SEQIDNo.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一或其变体之一或由于遗传密码简并性而由其衍生的序列之一的基因。61)本发明的另一方面涉及才艮据以上段落55)、56)、57)、58)、59)或60)的突变微生物,其中所述微生物是链霉菌属的细菌。62)本发明的另一方面涉及根据以上段落55)、56)、57)、58)、59)、60)或61)的突变樣t生物,其中大环内酯是螺旋霉素。63)本发明的另一方面涉及根据以上段落55)、56)、57)、58)、59)、60)、61)或62)的突变微生物,其中所述微生物是生二素链霉菌菌林。64)本发明的另一方面涉及产生大环内酯的方法,该方法包括以下步骤(a)在适当的培养基中培养根据以上段落55)、56)、57)、58)、59)、60)、61)、62)、63)或64)之一的微生物,(b)回收条件培养基或细胞提取物,(c)自步骤b)获得的所述培养基或者细胞提取物中分离并纯化所产生的大环内酯。65)本发明的另一方面涉及根据以上段落l)、2)、3)、4)、5)、6)、7)、8)、9)、10)、11)、12)、13)、14)、15)、16)和17)之一的序列和/或重组DNA和/或载体的用途,用于制备杂化抗生素。66)本发明的另一方面涉及根据以上段落l)、2)、3)、4)、5)、6)、7)、8)、9)、10)、11)、12)、13)、14)、15)、16)、17)和21)之一的至少一条多核苷酸和/或至少一个重组DNA和/或至少一个表达栽体和/或至少一条多肽和/或至少一种宿主细胞的用途,用于进行一种或多种生物转化。67)本发明的另一方面涉及多核苷酸,所述多核苷酸是与根据以上段落l)、2)、3)、4)、5)或6)的多核苷酸之一互补的多核苷酸。68)本发明的另一方面涉及产生至少一种螺旋霉素的微生物,所述微生物过量表达-通过聚合,式反应(PCR)使用以下序列引物对5'AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3"(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因,-或者由于遗传密码简并性而由其衍生的基因。69)本发明的另一方面涉及根据段落68或卯的微生物,该微生物是链霉菌属的细菌。70)本发明的另一方面涉及根据段落68、69或90的微生物,该微生物是生二素链霉菌种的细菌。71)本发明的另一方面涉及根据段落68、69、70或90的微生物,其中所述基因的过量表达是通过用表达载体转化所述^:生物而获得的。72)本发明的另一方面涉及生二素链霉菌菌株,所述菌株是菌林OSC2/pSPM75(l)或菌林OSC2/pSPM75(2),保藏在国立微生物保藏中心(CNCM)[NationalCollectionofCulturesandMicroorganisms]巴^t德、研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年10月6日,保藏号为1-3101。73)本发明的另一方面涉及重组DNA,其包含-通过聚合酶链式反应(PCR)使用以下序列引物对5"AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3"(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的多核苷酸,画或者该多核苷酸中至少10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1460,1470,1480,14卯或1500个连续核苷酸的片段。74)本发明另一方面涉及根据段落73或91的重组DNA,所述重组DNA是载体。75)本发明另一方面涉及根椐段落73、74或91的重组DNA,所述重组DNA是表达载体。76)本发明另一方面涉及已经将至少一个根据段落73、74、75或91的重组DNA导入其中的宿主细胞。77)本发明另一方面涉及产生多肽的方法,其中所述方法包括以下步骤a)用至少一个根据段落75的表达栽体转化宿主细胞;b)在适当培养基中培养所述宿主细胞;c)回收条件培养基或细胞提取物;d)从步骤c)获得的所述培养基或者细胞提取物中分离并纯化所述多肽;e)根据需要,表征所产生的重組多肽。78)本发明另一方面涉及根据段落51的微生物,其中基因失活是通过同相(in-phase)删除含有对应于SEQIDNo.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因部分而进行的。79)本发明另一方面涉及根据段落41、42、43、44、45、46、47、48、49、50、51和78之一的孩i生物,该#:生物也过量表达-通过聚合酶链式反应(PCR)使用以下序列引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SE()IDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3'(SEQEDNo.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因,-或者由于遗传密码简并性而由其衍生的基因。80)本发明另一方面涉及表达载体,其中序列SEQIDNo.47的多核苷酸或由于遗传密码简并性而由其衍生的多核苦酸,是置于允许生二素链霉菌中由所述多核苷酸编码的蛋白质表达的启动子控制之下的。81)本发明另一方面涉及根据段落80的表达载体,该载体是质粒pSPM524或pSPM525。82)本发明另一方面涉及用根据段落80或81的载体转化了的生二素链霉菌菌林。83)本发明另一方面涉及才艮据段落41、42、43、44、45、46、47、48、49、50、51、78、79和92之一的樣i生物,所述微生物也过量表达具有编码序列SEQIDNo.47或由于遗传密码简并性由其衍生的编码序列的基因。84)本发明另一方面涉及根据段落83的微生物,该微生物是菌林SPM502pSPM525,保藏在国立微生物保藏中心(CNCM)巴斯德研究所,25rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年2月26日,保藏号为1-2977。85)本发明另一方面涉及产生螺旋霉素的方法,该方法包括以下步骤(a)在适当培养基中培养根据段落68、69、70、71、72、78、79、82、83、84、90和92之一的^效生物,(b)回收条件培养基或细胞提取物,(C)从步骤b)获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素。86)本发明另一方面涉及多肽,其序列包括序列SEQIDNo.112或序列SEQIDNo.142。87)本发明另一方面涉及多肽,其序列对应于从以下编码序列翻译的序列-通过聚合酶链式反应(PCR)使用以下序列引物对5"AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3"(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因的序列,-或者由于遗传密码简并性而由其衍生的基因的序列。88)本发明另一方面涉及允许根据段落86、87或93的多肽在生二素链霉菌中表达的表达载体。89)本发明另一方面涉及根据段落88的表达载体,该表达载体;ljt粒pSPM75。卯)本发明另一方面涉及根据段落68的微生物,其中能够通过聚合i^式反应获得的基因是编码序列SEQIDNo.141的基因或由于遗传密码简并性由其4汙生的基因。91)本发明另一方面涉及根据段落73的重组DNA,其中能够通过聚合酶链式反应获得的多核苷酸;l^列SEQIDNo.141的多核苷酸。92)本发明另一方面涉及根据段落79的微生物,其中能够通过聚合酶链式反应获得的基因是编码序列SEQIDNo.141的基因或由于遗传密码简并性由其^t生的基因。93)本发明另一方面涉及多肽,其序列是SEQIDNo.142。总体定义为了本发明的目的,术语"分离的"表示已经从其原来的环境(其天然存在的环境)移出的生物物质(核酸或蛋白质)。例如,以天然状态存在于植物或动物中的多核苷酸是未分离的。从其离的"。此种多核苷酸能够包括在载体中和/或此种多核苷酸能够包括于组合物中,然而由于载体或组合物不构成其天然环境的事实此种多核苷酸依然为分离状态。术语"纯化的,,不要求物质以排除其它化合物存在的绝对纯形式存在。它更多地是一个相对的定义。从起始物质或天然物质纯化之后处于"纯化的"状态的多核苷酸至少提高一个数量级,优选地为2或3,并且更加优选地为4或5个数量级。对于本发明的目的,术语ORF("开放阅读框")已经用于具体地表示基因的编码序列。对于本发明的目的,表述的"核苷酸序列"能够等同地用于表示多核苷酸或者核酸。表述的"核苷酸序列"包括遗传物质本身但并不因此而限于与其序列相关的信息。术语"核酸"、"多核苷酸"、"寡核苦酸"或作为选择的"核芬酸序列"包括RNA、DNA或cDNA序列或者核苷酸的RNA/DNA杂合序列,同样包括单链形式或双链形式。术语"核苷酸"即表示天然核苷酸(A,T,G,C)并且也表示包含至少一种修饰例如(l)噤呤类似物、(2)嘧啶类似物或(3)糖类似物的核苷酸,此类修饰的例子描述于诸如PCT申请WO95/04064中。对于本发明的目的,当第一多核苷酸的每个碱基配对于第二多核苦酸的互补碱基,它们的方向是相反的,则认为第一多核苦酸与第二多核苦酸"互补"。互补碱基是A和T(或A和U),或C和G。术语"螺旋霉素生物合成途径的基因"也包括调节基因和赋予生产者微生物抗性的基因。根据本发明,术语参照核酸的"片段"意思是指比参照核酸短的核苷酸序列并且在相同的部分包含与参照核酸相同的核苷酸序列。根据本发明,此种核酸"片段",根据需要,可以作为其组分包括于更大的多核苷酸中。此类片段包含或者可以说由根据本发明的核酸的长度范围从8,10,12,15,18,20到25,30,40,50,60,70,80,卯,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,卯O,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核普酸组成。根据本发明,术语多肽的"片段"意思是指比参照多肽短的多肽氨基酸序列并且在与参照多肽相同的所有部分包含相同的氨基^列。此类片段,根据需要,可以作为其部分包括于更大的多肽中。根据本发明的多肽的此类片段氨基酸长度可以是IO,15,20,30到40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640。对于本发明的目的,表达"高严格性杂交条件"意思是指不利于非同源核酸链杂交的杂交条件。例如,高严格性杂交条件可以描述为在Church和Gilbert(Church&Gilbert,1984)所述的緩沖液中温度在55。C和65匸之间的杂交条件;优选地为杂交温度是55'C,甚至更加优选地为杂交温度是60'C,并且最优选地为杂交温度是65'C,之后在2XSSC緩沖液(IXSSC緩冲液对应于0.15MNaCl,15mM柠檬酸钠的水溶液)中进行一次或多次洗涤,温度为55'C和65'C之间;优选地该温度是55'C,甚至更加优选地该温度是60。C,并且最优选地为该温度是65。C,之后在0.5XSSC緩沖液中进行一次或多次洗涤,温度为55。C和65。C之间;优选地该温度是55。C,甚至更加优选地该温度是60。C,并且最优选地为该温度是65t:。不用说,4艮据本领域技术人员熟知的技术能够将上述的杂交条件能够调整为所寻找的杂交的核酸长度的函数。例如,可根据F.Ausubel等(2002)的工作调整适宜的杂交条件。根据本发明术语核酸的"变体"意思是指与参照多核苷酸存在一个或多个碱基不同的核酸。变体核酸可以是天然来源的,例如天然发现的等位基因变体,或者也可以是诸如通过诱变技术获得的非天然变体。一般而言,参照核酸与变体核酸之间的不同是很小的,以至于参照核酸的核苷酸序列与变体核酸的核苷酸序列非常相近,并且在一些区域是相同的。存在于变体核酸中的核苷酸修饰可以是沉默的,这意味着它们不改变由所述变体核酸编码的氨基酸序列。然而,变体核酸中的核苷酸改变也可以导致与由参照核酸编码的肽相比由变体核酸编码的多肽中的替代、添加和/或删除。此外,编码区中的核苦酸修饰可以在氨基酸序列中产生保守或非保守的替代。优选地,才艮据本发明变体核酸编码基本上保留与参照核酸的多肽相同的功能和生物学活性的多肽,或者所编码的多肽能被针对起始核酸所编码的多肽的抗体识别。因此一些变体核酸编码突变形式的多肽,这方面的系统研究将可能推导出正在谈论的蛋白质的结构-活性关系。根据本发明,术语多肽的"变体"意思主要是指其氨基酸序列与参照多肽的氨基酸序列相比,含有一个或多个至少一个氨基酸残基的替代、添加或删除的多肽,可以理解氨基酸替代可以随便是保守的或非保守的。优选地,根据本发明的变体多肽基本上具有与参照多肽相同的功能或活性,或者保留被针对起始多肽的抗体识别的能力。对于本发明的目的,与参照多肽"活性相似"的多肽意思是指在适于测定参照多肽生物学活性的生物学分析中进行测定时,具有与参照多肽活性相近但不必须完全相同的生物学活性的多肽。对于本发明的目的,术语"杂化抗生素"意思是指通过使用重组DNA技术构建人工生物合成途径而产生的化合物。发明详述本发明的主题更加具体地是如以下发明详述所呈现的螺旋霉素生物合成途径的新基因和参与该生物合成的新多肽。克隆了生物合成途径的基因并确定了这些基因的DNA序列。利用FramePlot程序(J.Ishikawa和K.Hotta,1999)分析所获得的序列。在这些开放阅读框中,鉴定了那些呈现典型链霉菌密码子选择的开放阅读框。该分析表明该区域含有44个定位于5个编码酶"聚酮化合物合酶"(PKS)的基因任意一侧的ORF,并且呈现了典型的链霉菌密码子选择。在这5个编码PKS的任意一侧,分别鉴定了下游和上游10和34个ORF(通过全部以相同方向定位的5个PKS基因的方向定义上游和下游)(参照图3和37)。因此,这种类型的34个开放阅读框,占据大约41.7kb的区域(见呈现含有25个ORF的31kb的第一个区域的SEQIDNo.1和呈现大约12.1kb的SEQIDNo.140,其中1.4kb重叠上財列(SEQIDNo.l)并且其中大约10.7kb与随后的序列一致,大约10.7kb的后一部分含有9个额外ORF的部分(包括一个ORF的部分序列)也见下面的图3和37)鉴定为5个编码PKS的基因的上游,并且占据大约11.1kb区域的10个ORF(SEQIDNo.2和图3)鉴定为PKS基因的下游。定位于5个PKS基因下游的10个基因命名为orfl*c,orf2*c,orf3*c,orf4*c,orf5*,ori"6*,orf7*c,or*,orf9*和orflO*(SEQIDNo.3,5,7,9,11,13,15,17,19和21)。对于正在讨论的ORF,基因名称中加入的"c,,表示编码序列是反向的(因此编码链是与SEQIDNo.2中给出的这些基因的序列互补的链)。使用相同的命名法,PKS基因上游的34个ORF命名为orfl,orO,orf3,orf4,orf5,orf6,orf7,or伤,orf9c,orf10,orfllc,orfl2,orfl3c,orfl4,orfl5c,orfl6,orfl7,orfl8,orfl9,orf20,orf21c,orf22c,orf23c,orG4c,orf25c,orf26,orf27,orf28c,orf29,orf30c,ori31,orf32c,orf33和orB4c(SEQIDNos23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149)(参照图3和37)。使用各种程序将从这些开放阅读框推导出的蛋白质序列与各种数据库中存在的蛋白质序列进行比较BLAST(Altschul等,l"0)(Altschul等,1997)、CD-搜索、COGs(ClusterofOrthologousGroups)(这三个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995)),(这两个程序尤其可以从INFOBIOGEN资源中心,Evry,France获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。定位于编码PKS的基因下游的基因在图3中给出了该区域组成结构的图解说明。如下将阐明,在编码PKS的基因的下游鉴定的IO个基因中,9个显示参与螺旋霉素生物合成或螺旋霉素抗性。它们是下面9个基因orfl*c,orf2*c,orf3*c,orf4*c,orf5*,orf6*,orf7Ac,orf8*和orf9A。在下面的表l中给出了在5个PKS基因下游鉴定出的10个基因的参照DNA序列和氨基酸序列。表l基因在序列SEQIDNo.2中的位置DNA序列多狀序列orflAc10882-10172SEQIDNo.3SEQIDNo.4orf2*c10052-8781SEQIDNo.5SE(JIDNo.6orf^c8741-7476SEQIDNo.7SEQIDNo.8orf47459-6100SEQIDNo.9SEQIDNo.10orf5*5302-5976SEQIDNo.11SEQIDNo.12orf6A4061-5305SEQIDNo.13SEQIDNo.14orf^c3665-2817SEQIDNo.15SEQIDNo.161925-2755SEQIDNo.17SEQIDNo.18orf9*1007-1888SEQIDNo.19SEQIDNo.20orflO*710-937SE(JIDNo.21SEQIDNo.22基因名称中加入的"c"表示编码序列是反向的(因此编码链是与SEQIDNo.2中给出的这些基因的序列互补的链)。为了测定所鉴定的多肽的功能,开展了三种类型的实验将所鉴定的序列与已知功能的序列进行比较,基因失活实验导致构建突变菌林,和分析由这些突变菌株产生的螺旋霉素和螺旋霉素生物合成中间体。首先使用不同程序将从这些开放阅读框推导出的蛋白质序列与不同数据库中存在的蛋白质序列进行比较BLAST(Altschul等,19卯)(Altschul等,1997)、CD-search、COGs(ClusterofOrthologousGroups)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995))。这些比较使得能够明确描述关于这些基因的产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。表2显示了与定位于5个PKS基因下游的10个基因的产物呈现强相似性的蛋白质。表2<table>tableseeoriginaldocumentpage30</column></row><table>*较大的序列相似性与较高的BLAST分值有关(Altschul等,1990)。为了确证这些结果进行了基因失活实验。所使用的方法在于进行基因置换。使用赋予其抗生素(例如阿泊拉霉素、遗传霉素或潮霉素)抗性的盒中断的该基因的拷贝替换要中断的粑基因。所使用的盒在任意一侧紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。将盒插入耙基因可以伴有或者可以不伴有在该靶基因中的删除。盒两侧区域的大小可以从几百个到几千个碱基对。第二种类型的盒能够用于基因失活盒称为"可切除盒,,。这些盒在被导入生二素链霉菌基因组之后具有通过位点特异性重组在链霉菌中被切除的优点。目的是失活链霉菌菌林中的某些基因而不在最终的菌林中留下不属于该菌抹的选择性标记或大的DNA序列。切除之后,仅大约30个碱基对的短序列(称为"瘢痕"位点)残存在菌林的基因组中(参照图10)。该系统的用途最初在于用已经将可切除盒插入到该靶基因中的构建体替换靶基因的野生型拷贝(由于两个同源重组事件,参照图9)。该盒的插入伴有耙基因中的删除(参照图9)。其次,引起从菌株的基因组切除可切除盒。可切除盒通过位点专一重组系统发挥作用并且具有能够获得最终不携带抗性基因的链霉菌突变体的优点。也避免了对定位于失活基因下游的基因表达可能产生的极性影响(参照图10)。如此构建的菌林用于测试它们的螺旋霉素产量。由于序列比较实验使得能够确定orfl*c、orf2*c、orf3*c和orf4*c基因与参与较近似的抗生素生物合成的基因具有相对高的相似性,所以不失活orfl、orf2*c、orf3*c和orf4*c基因。因此,orfl*c基因编码与tylMI基因所编码的蛋白质呈现66%同一性(利用BLAST程序测定)的蛋白质,其中tylMI基因编码N-甲基转移酶,该酶参与泰乐菌素的生物合成并催化弗氏链霉菌的碳霉糖产生过程中3-N-甲基化作用(A,R.Gandecha等,1997;GenBank登录号CAA57473;BLAST分值287)。这种与参与另一种较相关抗生素生物合成途径的蛋白质的相似性,以及更加具体地参与碳霉糖生物合成,暗示出orfl*c基因编码负责forosamine或碳霉糖生物合成中N-甲基化作用的N-甲基转移酶(参照图5和6)。由orf^c基因编码的蛋白质与其它有机体中其它具有相似功能的蛋白质呈现高度相似性这一事实支持这种假说(参照表3)。表3<table>tableseeoriginaldocumentpage32</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf2*c基因编码的蛋白质与编码在弗氏链霉菌中参与泰乐菌素生物合成的NDP己糖3,4-异构酶的tylMIII基因所编码的蛋白质呈现相对强相似性(35%同一性)(A.R.Gandecha等,1997;GenBank登录号CAA57471;BLAST分值130)。其与参与另一种相关抗生素生物合成途径,更加具体而言是参与碳霉糖生物合成的蛋白质的相似性,强烈暗示orf2、基因编码在一种螺旋霉素的糖可能是碳霉糖生物合成过程中负责异构化作用的NDP己糖3,4-异构酶(参照图5和6)。ori3*c基因編码的蛋白质与编码在弗氏链霉菌中参与泰乐菌素生物合成的糖基转移酶的tylMII基因所编码的蛋白质呈现相对强相似性(59%同一性)(A.R.Gandecha等,1997;GenBank登录号CAA57472;BLAST分值448)。其与参与另一种相关抗生素生物合成途径蛋白质的相似性强烈暗示orG基因编码糖基转移酶。由orf3、基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表4)。表4<table>tableseeoriginaldocumentpage33</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。orf4*c基因编码与巴豆酰-CoA还原酶呈现相对强相似性的蛋白质。具体而言,orf4*c编码的蛋白质与来自天蓝色链霉菌的巴豆酰-CoA还原酶(M.Redenbach等,1996;GenBank登录号NP—630556;BLAST分值772)具有相当高的相似性。其与参与另一种相关抗生素生物合成途径蛋白质的相似性强烈暗示orf4*c基因也编码巴豆酰-CoA还原酶。由orf4*c基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表5)。表5<table>tableseeoriginaldocumentpage33</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。orf6头基因与存在于生米卡链霉菌中产生大环内酯抗生素的mdmB基因(Hara和Hutchinson,1992;GenBank登录号A42719;BLAST分值:489)呈现某种相似性。在该生产者中,所述基因参与内酯环的酰化作用。因此认为orf6+基因编码酰基转移酶。由orf6+基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表6)。表6<table>tableseeoriginaldocumentpage34</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。通过同相删除/倒位可产生orf6+基因的失活并且表明所得到的菌林不再产生螺S走霉素II和III而仅产生螺旋霉素I(参照图1)。这证实orf6*基因确实参与螺旋霉素II和III的合成。由该基因编码的酶负责通过将乙酰基或丁酰基连接于3-位的碳上而形成螺旋霉素II和III。由于不再表达由orf6头基因编码的蛋白质的菌林不再产生螺旋霉素II和III而仅产生螺旋霉素I,所以它们是特别有利的。如上面所指出,螺旋霉素I的抗生素活性明显大于螺旋霉素II和III(Liu等,1999)。orf5w基因编码与几种0-甲基转移酶至现相对强相似性的蛋白质。具体而言,orf5A编码的蛋白质与来自生米卡链霉菌的O-曱基转移酶(EC2丄l.-)MdmC(Hara和Hutchinson,1992;GenBank登录号B42719;BLAST分值355)具有相当高的相似性。其与参与另一种抗生素生物合成途径的蛋白质的相似性强烈暗示orf5+基因也编码O-甲基转移酶。认为orf5六基因参与合并入内酯环的前体的形成。事实上,根据序列比较,orf5A基因的产物也相对近似于FkbG,依据文献FkbG负责羟基丙二酰-ACP的甲基化作用(Wu等,2000;Hoffmeister等,2000;GenBank登录号AAF86386;BLAST分值247)(参照图8)。由orf5A基因所編码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表7)。表7<table>tableseeoriginaldocumentpage35</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。由于非切除盒插入orf6*基因的极性效应,已经可确定orf5*基因对于螺旋霉素的生物合成途径是必需的。更明确地讲,可切除盒插入orf6*基因的编码部分导致螺旋霉素产生完全停止。然而,一旦所插入的盒被切除(并因此当仅orf6+基因失活时,参照实施例14和15),则再次观察到螺旋霉素I产生。这表明orf5*基因对于螺旋霉素的生物合成途径是必需的,因此该基因的失活导致螺旋霉素产生完全停止。orf5*基因编码与几种O-曱基转移酶呈现相对强相似性的蛋白质。认为orf5*基因是直接参与platenolide合成或者参与通过PKS合并入platenolide的曱基化前体(甲氧基丙二酰,参照图8)合成的O-曱基转移酶。为了证明该假说,对基因型为orf6勺:attlfthyg+的生二素链霉菌菌林进行了LC/SM和NMR分析实验。在该菌林中,由于含有转录终止子的盒插入到orf6+基因中的极性效应,orf5*基因不表达(参照实施例27)。已经表明该菌林产生一种其紫外光镨看起来与螺旋霉素I紫外光谱相似的分子,但质语在829处显示分子离子。与螺旋霉素质量相比存在的14个质量的差异能够解释为在内酯环4号碳负荷的氧上甲基的删除(在图39中给出了该化合物的结构)。由NMR所获得的结果与该假说相一致。在829处存在的化合物使得确认orf5+在螺旋霉素的作用的假说成为可能。此外,当在微生物藤黄微球菌(Micrococcusluteus)进行测试时,与未修饰的螺旋霉素相比,相应于不舍曱基的螺旋霉素的产物呈现非常弱的微生物学活性(弱10倍)。orf7、基因编码与生米卡链霉菌的mdmA基因所编码的蛋白质呈现相对强相似性的蛋白质,后者基因编码生产者的酶中参与麦迪霉素抗性的蛋白质(Hara等,1990;GenBank登录号A60725;BLAST分值380)。这种与参与另一种抗生素生物合成途径的蛋白质的相似性强烈暗示orf7、基因也编码参与螺旋霉素抗性的蛋白质。更加具体而言,由orf7^基因所编码的酶具有甲基转移酶活性并且在生二素链霉菌中参与螺旋霉素抗性。已经证明该基因赋予MLSI型抗性,已知该抗性是由于在23S核糖体RNA的A2058位置单甲基化作用产生的(Pernodet等,1996)。由orf7头基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该4艮说(参照表8)。表8<table>tableseeoriginaldocumentpage36</column></row><table>较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。ori^基因编码与灰色链霉菌中ABC转运子型蛋白质呈现相对强相似性的蛋白质(Campelo,2002,GenBank登录号CAC22119;BLAST分值:191)。这种与ABC转运子型蛋白质的相似性强烈暗示ori^基因也编码可能参与螺旋霉素抗性的ABC转运子型蛋白质。由01仿*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表9)。表9<table>tableseeoriginaldocumentpage37</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。orfl(^基因编码与一种未知功能蛋白质呈现相对强相似性的蛋白质。然而,在参与抗生素生物合成的基因的几组基因中间发现了与orfl(^相似的基因。因此,与orfl(^近似的基因发现于天蓝色链霉菌(Redenbach等,1996,GenBank登录号NP—627432,BLAST分值109)。近似基因(CouY)也发现于利尻链霉菌(S.rishiriensis)中(Wang等,2000,GenBank登录号AAG29779,BLAST分值97)。定位于编码PKS的基因上游的基因在定位于编码PKS的基因上游的DNA序列中(通过全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图3),已经鉴定了34个ORF(参照上面)。因此,该类型的34个开放阅读框占据了大约41.7kb的区域(参照SEQIDNo.1呈现含有25个ORF的31kb第一区和SEQIDNo.140呈现大约12.1kb的区域,其中1.4kb与先前序列(SEQIDNo.1)重叠并且其中大约10.7kb对应于随后的序列),大约10.7kb的较后面部分含有9个另外的ORF(包括ORF部分序列),也参照下面的图3和37)。在图5和37中图解说明了该区域的组成。所鉴定的34个基因命名为orfl,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orfllc,orfl;orfl3c,orfl4,orfl5c,orfl6,orfl7,orfl8,oril9,orf20,orf21c,orf22c,orf23c,orf24c,orf25c,orf26,orf27,orf28c,orf29,orD0c,orf31,orf32c,orf33和orf3<4c。下面表11中给出了在5个PKS基因上游所鉴定出的34个基因的参考DNA和氨基酸序列。表ll<table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table>1基因名称中加的"c,,表示编码序列是反向的(因此编码链与SEQIDNo.1或SEQIDNo.140所给出的这些基因的序列互补)。2当几个蛋白质序列表明处于同一个开放阅读框时,相应的蛋白质来自几个可能的翻译起始位点。为了确定上面表ll中所鉴定的多肽的功能,进行了三种类型的实验比较所鉴定的具有已知功能序列的序列的同一性、基因失活实验、和通过这些突变林分析螺旋霉素的产生。利用各种程序BLAST(Altschul等,1990)(Altschul等,1997)、CD-查找、COGs(定向进化同源群聚类簇)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)、BEAUTY(K.C.Worley等,1995))(参照上面),首先将从这些开放阅读框推导出的蛋白质序列与多种数据库已经存在的序列进行比较。这些比较使得能够明确描述关于这些基因产物功能的假说并鉴定那些倾向于参与螺旋霉素生物合成的基因。表12列出了与定位在5个PKF基因上游的34个基因呈现强相似性的蛋白质。表12<table>tableseeoriginaldocumentpage40</column></row><table><table>tableseeoriginaldocumentpage41</column></row><table><table>tableseeoriginaldocumentpage42</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。为了证实这些结果进行了基因失活实验。所用方法在于进行基因置换。用由赋予抗生素(例如阿泊拉霉素或潮霉素)抗性的盒打断的该基因的拷贝代替要打断的耙基因。所使用的盒在任意一侧紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。将盒插入靶基因可能伴有或者也可能不伴有该靶基因中的删除。盒两侧区域的大小可以从几百到几千个碱基对。可以用于基因失活的第二种类型的盒是称为"可切除盒"(参照上面)的盒。如此构建的菌林用于测定它们螺旋霉素的产生。orfl基因编码与几种细胞色素P450呈现相对强相似性的蛋白质。具体而言,orfl基因编码蛋白质与弗氏链霉菌中参与泰乐菌素生物合成的tyll基因所编码的蛋白质(L.A.Merson-Davies等,1994;GenBank登录号S4卯51;BLAST分值530)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orfl基因也编码细胞色素P450。orfl基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表13)。表13<table>tableseeoriginaldocumentpage43</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。Orf2基因编码与嗜气热硫胺素芽孢杆菌(Aneurinibacillusthermoaerophilus)的dTDP-6-脱氧-3,4-酮己酮糖异构酶(Pfoestl,A等,2003,GenBank登录号AAO06351;BLAST分值118)呈现相对强相似性的蛋白质。这种相似性强烈暗示Orf2基因编码异构酶,其负责螺旋霉素分子中存在的一种糖生物合成所必需的异构化反应,该糖可能是mycarose(参照图5)。进行orf2基因失活。失活实验能够显示所得到的菌株不再产生螺旋霉素。这证实orf2基因确实参与螺旋霉素生物合成。Orf3基因编码与几种氨基转移酶呈现相对强相似性的蛋白质。具体而言,orf3编码的蛋白质与参与竹桃霉素生物合成的抗生链霉菌氨基转移酶(G.Draeger等,1999;GenBank登录号AAF59939;BLAST分值431)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orB基因编码负责螺旋霉素一种氨基糖的生物合成所必需的氨基转移反应的3-氨基转移酶(参照图5)。Orf3基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表15)。表15<table>tableseeoriginaldocumentpage44</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。失活orf3基因。因此有可能显示所得到的菌林不再产生螺旋霉素。这证实orB基因确实参与螺旋霉素生物合成。因此由该基因编码的酶明确地负责螺旋霉素生物合成所必需的生物转化步骤。表达弗氏链霉菌的TylB蛋白质能够补偿螺旋霉素的产生(参照实施例23)。这表明orf3基因编码负责碳霉糖生物合成所必需的氨基转移反应的3-氨基转移酶(参照图5)。由于碳霉糖是第一个待连接到platenolide上的糖,所以预期orf3敲除菌林(OS49.67)可积累platenolide。已经研究了orO基因敲除菌林的生物合成中间体(参照实施例20)。这些实验使得能够证明该菌株产生两种形式的platenolide:platenolideA和platenolideB,图36中给出了所推导出的这两种分子的结构。该菌林也产生platenolideA+mycarose和platenolideB+mycarose(参照实施例20和图40)。这些化合物含有糖,但不含任何碳霉糖。此外,如果将它们与螺旋霉素相比较(参照图1),这些化合物含有mycarose而不含有碳霉糖。这些结果与orB基因产物参与碳霉糖生物合成并且具有3氨基转移酶的作用以负责碳霉糖生物合成所必需的氨基转移反应是一致的(参照图5)。可以注意到,由于发现了一些分子其mycarose连接在正常情况应由碳霉糖占用的位置,所以显示出糖基化作用的特异性不是绝对的(参照图40)。orf4基因编码与几种NDP-葡萄糖合成酶呈现相对强相似性的蛋白质。具体而言,orf4编码的蛋白质与委内瑞拉链霉菌的a-D-葡萄糖-l-磷酸胸苷转移酶(Y.Xue等,1998;GenBank登录号AAC68682;BLAST分值404)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf4基因编码NDP-葡萄糖合成酶,该酶负责合成掺入螺旋霉素分子的三种非典型糖生物合成所必需的NDP-葡萄糖(参照图4、5和6)。orf4基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表16)。表16呈现显著相似性的蛋白质GenBank登录号BLAST+分值所报道的功能葡萄糖-1-磷酸胸苷转移酶(除虫链霉菌)BAA84594402葡萄糖-l-磷酸胸苷转移酶AclY(加利利链霉菌)BAB72036400dTDP-l-葡萄糖合成酶预测的葡萄糖-l-磷酸胸苷转移酶(刺糖多孢菌)AAK83289399葡萄糖-l-磷酸胸苷转移酶*较大的序列相似性与较高的BLAST分值相关(AItschul等,1990)。Orf5基因编码与几种葡萄糖脱水酶呈现相对强相似性的蛋白质。具体而言,orf5编码的蛋白质与黑暗链霉菌的dTDP-葡萄糖4,6-脱水酶(T.B.Li等,2001;GenBank登录号AAG18457,BLAST分值476)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf5基因编码NDP-葡萄糖脱水酶,该酶对于掺入螺旋霉素分子的三种非典型糖的生物合成是必需的(参照图4、5和6)。Orf5基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表17)。表17<table>tableseeoriginaldocumentpage46</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。Orf6基因编码与几种硫酯酶呈现相对强相似性的蛋白质。具体而言,orf6编码的蛋白质与除虫链霉菌硫酯酶(S.Omura等,2001;GenBank登录号BAB69315;BLAST分值234)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf6基因编码硫酯酶。Orf6基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表18)。表18<table>tableseeoriginaldocumentpage47</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。Orf7基因编码与几种己糖脱水酶呈现相对强相似性的蛋白质。具体而言,orf7编码的蛋白质与参与泰乐菌素生物合成的弗氏链霉菌的dNTP-己糖2,3-脱7K酶(由TylCVI基因编码)(L.A.Merson國Davies等,1994;GenBank登录号AAF29379;BLAST分值461)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf7基因也编码己糖2-3-脱7jC酶,该酶对于掺入螺旋霉素分子的两种非典型糖的生物合成是必需的(参照图4和6)。Orf7基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表19)。表19<table>tableseeoriginaldocumentpage47</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。Orf8基因编码与几种氨基转移酶呈现相对强相似性的蛋白质。具体而言,orf8编码的蛋白质与刺糖多孢菌中可能参与forosamine生物合成的氨基转移酶(C.Waldron等,2001;GenBank登录号AAG23279;BLAST分值465)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示or仿基因编码4-氨基转移酶,该酶负责forosamine生物合成所必需的氨基转移反应(参照图6)。Orf8基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表20)。表20<table>tableseeoriginaldocumentpage48</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。失活orf8基因。因此有可能显示所得到的菌林不再产生螺旋霉素。这证实or仿基因确实参与螺旋霉素生物合成。因此由该基因编码的酶明确地负责螺旋霉素生物合成所必需的生物转化步骤。orf8基因失活突变体产生forocidin,从而该突变体阻断于forocidin阶段且不产生任何新-螺旋霉素,这一事实对orf8基因产物在forosamine生物合成中具有作用的假说进行了证实(参照图7和实施例25)。这些结果与or仿基因产物参与forosamine生物合成是一致的(参照图6)。已经鉴定了生二素链霉菌中的orf9c基因并由Geistlich等(M.Geistlich等,1992)命名为srmX。由该基因所编码的蛋白质与几种参与其它相近抗生素生物合成途径的甲基转移酶的这种相似性强烈暗示orf9c8基因编码甲基转移酶,该酶负责碳霉糖或forosamine生物合成所必需的曱基化反应(参照图5和6)。orf9c基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表21)。表21<table>tableseeoriginaldocumentpage49</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。已经鉴定了生二素链霉菌中的orflO基因并由Geistlich等(M.Geistlich等,1992)命名为srmR。由该基因所编码的蛋白质参与生二素链霉菌中螺旋霉素生物合成途径的调控。失活orflO基因。因此有可能显示所得到的菌林不再产生螺旋霉素。这证实ori10基因确实参与螺旋霉素生物合成。因此由该基因编码的蛋白对于螺旋霉素生物合成显然是必需的。此外,确定了orflO的翻译起始位点并且有可能表明该基因的过量表达导致螺旋霉素产量的提高。翻译起始位点相当于定位在Geistlich等(M.Geistlich等,1992)所提出的ATG上游的ATG。由于5'-截短的信使是无活性的,还证明了该5,末端对于OrflO的功能是必需的(参照实施例17)。因此为了获得螺旋霉素产量方面的预期效果,过量表达有效的orf10而注意不表达orf105,-截短的信使是必要的。已经鉴定了生二素链霉菌中的orfllc基因并由Geistlich等(M.Geistlich等,1992)和Schone等(B.Schoner等,1992)命名为srmB。由该基因所编码的蛋白质在生二素链霉菌中参与螺旋霉素抗性并且是ABC-型转运子。Orfl2基因编码与几种己糖脱水酶呈现相对强相似性的蛋白质。具体而言,orfl2编码的蛋白质与弗氏链霉菌UrdQ基因所编码的NDP-己糖3,4-脱水酶具有相当高的相似性并参与乌达霉素生物合成(D.Hoffmeister等,2000;GenBank登录号AAF72550;BLAST分值634)。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orfl2基因编码3,4-脱水酶,该酶负责forosamine生物合成所必需的脱水反应(参照图6)。Orf12基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表22)。表22<table>tableseeoriginaldocumentpage50</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。失活orfl2基因。有可能显示所得到的菌林不再产生螺旋霉素。这证实orfl2基因确实参与螺旋霉素生物合成。因此由该基因编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。orfl2基因失活突变体不再产生forosamine的事实对Orfl2在forosamine生物合成具有作用的假说提供证据。然而,突变体产生少量forocidin。因此该突变体在forocidin阶段阻断且不产生任何新-螺旋霉素(参照图7和实施例26)。该突变体也产生具有图38所示结构的化合物。后者化合物含有两种糖,即碳霉糖和但不含有任何forosamine。此外,如果与螺旋霉素的结构相比较(参照图1),该化合物在forosamine的预期位置含有mycarose。这些结果与orfl2基因产物参与forosamine生物合成是一致的(参照图6)。可以注意到,由于观察到一些分子中mycarose连接在通常情况下由forosamine占用的位置上,所以糖基化作用的特异性不是绝对的(见图38)。orfl3c基因编码与天蓝色链霉菌中一种未知功能蛋白质呈现相对强相似性的蛋白质。该蛋白质命名为SC4H2.17(GeneBank登录号T35116;BLAST分值619)。由orfl3c基因所编码的蛋白质也与其它有机体的其它蛋白质呈现强相似性(参照表23)。表23<table>tableseeoriginaldocumentpage51</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。仍然没有鉴定出与orfl3c编码蛋白质接近的蛋白质的确切功能。为了研究该基因在生二素链霉菌螺旋霉素生物合成途径中的功能,对orfl3c基因进行失活。有可能显示所得到的菌林产生螺旋霉素。这表明orfl3c基因对于螺旋霉素生物合成不是必需的,并且该基因对于细菌的存活也是非必需的。因此由该基因编码的酶显然不负责螺旋霉素生物合成所必需的生物转化步骤。orfl4基因编码与推定的还原酶呈现相对强相似性的蛋白质(M.Redenbach等,1996;Bentley等,2002;GenBank登录号CAB90862;BLAST分值147)。失活orfl4基因。因此有可能显示所得到的菌林不再产生螺旋霉素。这证实orfl4基因确实参与螺旋霉素生物合成。因此由该基因编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。研究了ori!4基因敲除菌林的生物合成中间体(参照实施例20)。这些实验使得有可能表明该菌林产生platenolideA而不产生platenolideB(参照图36)。orfl5c基因编码与几种酮还原酶呈现相对强相似性的蛋白质。具体而言,orfl5c编码的蛋白质与抗生链霉菌3-酮还原酶(GenBank登录号:T51102,BLAST分值285)具有相当高的相似性。这种相似性强烈暗示orfl5c基因编码3-酮还原酶,该酶负责forosamine生物合成所必需的还原反应(参照图6)。orfl5c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表24)。表24<table>tableseeoriginaldocumentpage52</column></row><table>orfl6基因编码与几种异构酶呈现相对强相似性的蛋白质。具体而言,orfl6编码蛋白质与弗氏链霉菌NDP-己糖3,4-异构酶(Gandecha等,1997;GenBank登录号CAA57471,BLAST分值209)具有相当高的相似性。这种相似性强烈暗示orfl6基因编码参与螺旋霉素的一种糖的生物合成的蛋白质(参照图5和6)。orfl6基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表25)。表25<table>tableseeoriginaldocumentpage53</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orfl7基因编码与几种糖基转移酶呈现相对强相似性的蛋白质。具体而言,orfl7编码蛋白质与委内瑞拉链霉菌糖基转移酶(Y.Xue等,1998;GenBank登录号AAC68677;BLAST分值400)具有相当高的相似性。orfl7基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种糖基转移酶的相似性强烈暗示该基因也编码糖基转移酶。orfl7基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现某些相似性的事实支持该假说(参照表26)。表26<table>tableseeoriginaldocumentpage53</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orfl8基因编码与几种糖基转移酶呈现相对强相似性的蛋白质。具体而言,orfl8编码蛋白质与利尻链霉菌糖基转移酶(Wang等,2000;GenBank登录号AAG29785;BLAST分值185)具有相当高的相似性。orfl8基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种糖基转移酶的相似性强烈暗示该基因也编码糖基转移酶。orfl8基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表27)。表27<table>tableseeoriginaldocumentpage54</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orfl9基因编码与几种酮还原酶呈现相对强相似性的蛋白质。具体而言,orfl9编码的蛋白质与弗氏链霉菌NDP-己糖4-酮还原酶(TylCIV)(Bate等,2000;GenBank登录号AAD41822;BLAST分值266)具有相当高的相似性。orfl9基因编码的蛋白质与参与其它相近抗生素生物合成途径的这种酮还原酶的相似性强烈暗示该基因也编码4-酮还原酶,该酶负责mycarose生物合成所必需的还原反应(参照图4)。orfl9基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表28)。表28<table>tableseeoriginaldocumentpage55</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf20基因编码与几种己糖还原酶呈现相对强相似性的蛋白质。具体而言,orf20编码蛋白质与红色糖多孢菌编码dTDP-4-酮-L-6-脱氧己糖2,3-还原酶的EryBII(R.G.Summers等,1997),GenBank登录号AAB84068;BLAST分值491)具有相当高的相似性。orf20c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种己糖还原酶的相似性强烈暗示该基因编码2,3-还原酶,该酶负责mycarose生物合成所必需的还原反应(参照图4)。orO0c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表29)。表29<table>tableseeoriginaldocumentpage55</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf21c基因编码与几种己糖曱基转移酶呈现相对强相似性的蛋白质。具体而言,orf21c编码的蛋白质与弗氏链霉菌编码NDP-己糖3-C-甲基转移酶的TylCIII基因(N.Bate等,2000;GenBank登录号AAD41823;BLAST分值669)的EryBII具有相当高的相似性。orf21c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种己糖甲基转移酶的相似性强烈暗示该基因编码己糖甲基转移酶,该酶负责mycarose生物合成所必需的曱基化反应(参照图4)。orf21c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表30)。表30<table>tableseeoriginaldocumentpage56</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf22c基因编码的蛋白质与吸水链霉菌子嚢霉素变种(Streptomyceshygroscopicusvar.ascomyceticus)中编码参与曱氧基丙二酰基生物合成的酶的fkbH基因所编码的蛋白质(K.Wu等,2000;GenBank登录号AAF86387;BLAST分值463)呈现相对强相似性。orf22c基因所编码的蛋白质与参与其它相关大环内酯生物合成途径的蛋白质的相似性强烈暗示该基因也编码生二素链霉菌中参与甲氧基丙二酰基生物合成的酶(参照图8)。orf23c基因编码的蛋白质与吸水链霉菌子嚢霉素变种中编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶的ikbl基因所编码的蛋白质(K.Wu等,2000;GenBank登录号AAF86388;BLAST分值387)呈现相对强相似性。orf23c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种脂酰辅酶A脱氢酶的相似性强烈暗示该基因编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶(参照图8)。orf23c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表31)。表31呈现显著相似性的蛋白质GcnB3nk登录号BLAST*分值所报道的功能脂酰辅酶A脱氢酶(纤维素多囊菌(Polyangiumcellulosum))AAK19892171脂酰辅酶A脱氢酶可能的脂酰辅酶A脱氢酶-(天蓝色链霉菌)T36802160脂酰辅酶A脱氢酶*较大的序列相似性与较高的BLAST分值相关(Altschul等,19卯)。orf24c基因编码的蛋白质与吸水链霉菌子嚢霉素变种中被认为编码参与曱氧基丙二酰基生物合成的酰基载体蛋白(ACP)的fkbJ基因所编码的蛋白质(K.Wu等,2000;GenBank登录号AAF86389;BLAST分值87)呈现相对强相似性。orf24c基因编码的蛋白质与参与另一种相近大环内酯生物合成途径的蛋白质的相似性强烈暗示该基因编码参与生二素链霉菌中甲氧基丙二酰基生物合成的蛋白质(参照图8)。orf25c基因编码的蛋白质与吸水链霉菌子嚢霉素变种中编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶的fkbK基因所编码的蛋白质(K.Wu等,2000;GenBank登录号AAF86390;BLAST分值268)呈现相对强相似性。orf25c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种脂酰辅酶A脱氢酶的相似性强烈暗示该基因编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶(参照图8)。orf25c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表32)。表32<table>tableseeoriginaldocumentpage58</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf26基因所编码的蛋白质与弗氏链霉菌中编码参与泰乐菌素生物合成的mycarose糖基转移酶的tylCV基因所编码的蛋白质(N.Bate等,2000;GenBank登录号AAD41824,BLAST分值471)呈现65%的同一性(使用BLAST程序确定)。更加具体而言,TylCV是在泰乐菌素合成过程中结合mycarose分子的糖基转移酶。这种与参与另一相对相近抗生素生物合成途径的蛋白质更加具体而言是mycarose转运子的相似性暗示orf26基因是糖基转移酶。orf26基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表33)。表33<table>tableseeoriginaldocumentpage58</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。orf27基因所编码的蛋白质与弗氏链霉菌中编码参与泰乐菌素生物合成的NDP-己糖3,5-(或5-)差向异构酶的tylCVII基因所编码的蛋白质(N.Bate等,2000;GenBank登录号AAD41825,BLAST分值243)呈现70%的同一性(使用BLAST程序确定)。更加具体而言,TylCVII是参与mycarose生物合成的己糖3,5-(或5-)差向异构酶。这种与参与另一相对相近抗生素生物合成途径更加具体而言是mycarose生物合成的蛋白质的相似性暗示orf27基因是差向异构酶。orf27基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表34)。利用BLAST程序对所获得的相近序列进行的分析强烈暗示orf27基因编码5-差向异构酶,该酶负责mycarose生物合成所必需的差向异构反应(参照图4)。表34<table>tableseeoriginaldocumentpage59</column></row><table>*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。最初仅部分测定了orf28c的序列,大约450个碱基区域的序列是在重新序列分析后确定的(在不完全序列SEQIDNo.106中该区域用"N"表示)。虽然如此仍将该ORF的部分序列(SEQIDNo.lll)用于使用如上所述多种计算机程序分析。因此可通过所确定的序列(SEQIDNo.112,该序列是Orf28c蛋白质的部分序列),确定orf28c基因编码的蛋白质与耐热链霉菌中编码参与碳霉素生物合成的调节蛋白质的acyB2基因所编码的蛋白质(A.Arisawa等,1993;GenBank登录号JC2032,BLAST分值:329)呈现64%的同一性(使用BLAST程序确定)。这种与参与另一相对相近抗生素生物合成途径的蛋白质的相似性暗示orf28c基因编码参与螺旋霉素生物合成的调节蛋白质。orf28c基因所编码的蛋白质也与Ty股蛋白质呈现强相似性的事实支持该假说,TylR蛋白质是弗氏链霉菌中参与泰乐菌素生物合成的调节蛋白质(N.Bate等,1999;GenBank登录号AAF29380,BLAST分值167)。利用定位于未确定序列两侧的寡核苷酸扩增orf28c基因并将其亚克隆入表达载体是可能的。因此有可能证明orf28c基因过量表达显著提高OSC2菌林中螺旋霉素的产量(参照实施例24)。这表明过量表达orf28c导致螺旋霉素产量增加并证实了其作为螺旋霉素生物合成途径的调解子的作用。随后完成了orf28c的部分序列并确定了大约450个碱基对的未知区域(参照SEQIDNo.140和SEQIDNo.141)。使用上述多种计算机程序将该ORF的完整序列(SEQIDNo.141)进行分析。因此有可能确定orf28c基因所编码的蛋白质与耐热链霉菌中编码参与碳霉素生物合成的调节蛋白质的acyB2基因所编码的蛋白质(Arisawa,A.等,1993;GenBank登录号JC2032,BLAST分值451)在所确定的序列上(SEQIDNo.142,该序列是Orf28c蛋白质的完整序列)呈现69%的同一性(利用BLAST程序确定)。这种与参与调节相对相近抗生素生物合成的蛋白质的相似性暗示orf28c基因编码参与螺旋霉素生物合成的调节蛋白质。orf28c基因所编码的蛋白质也与TylR蛋白质呈现强相似性的事实支持该假说,TylR蛋白质是弗氏链霉菌中参与调节泰乐菌素生物合成的调节蛋白质(N.Bate等,1999;GenBank登录号AAF29380,BLAST分值224)。过量表达该基因的结果证实了该基因作为螺旋霉素生物合成途径的调节子的作用(参照实施例24)。失活orf28c基因。这样有可能显示所得到的菌林不再产生螺旋霉素。这证实orf28c基因显然参与螺旋霉素生物合成并且对于螺旋霉素生物合成是必需的。将这些结果结合该基因过量表达的结果(参照实施例24)表明Orf28c作为螺旋霉素生物合成所必需的激活子的作用。orf29基因所编码的蛋白质与纤维素嚢菌中定位于参与soraphenA(—种聚酮化合物类抗真菌剂)生物合成的基因群中的可能的糖基水解酶(J.Ligon等,2002;GenBank登录号AAK19890,BLAST分值139)呈现31%的同一性(使用BLAST程序确定)。这种与参与相对相近分子生物合成途径的蛋白质的相似性暗示orf29基因编码具有糖基水解酶活性的蛋白质。orf29基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表35)。利用CD-搜索程序(参照上面)对orf29所编码的蛋白质的序列进行分析也表明orf29基因编码糖基水解酶。表35<table>tableseeoriginaldocumentpage61</column></row><table>*较大的序列相似性与较高的BLAST分值相关(AItschul等,1990)。使用SignalP程序(http:〃www.cbs.dtu.dk/services/SignalP/)(Nielsen,H.等,1997),分析由or09所推导出的蛋白质序列显示该蛋白质具有在30和31位(QSA/QA)之间含有预测切割位点的C-末端信号序列。可以预测该蛋白质是细胞外蛋白质。作为糖基水解酶,该蛋白质可能在通过糖基转移酶GimA和/或GimB进行糖基化作用而失活的螺旋霉素的再活化过程中具有作用(Gourmelen等,1998)。Orf30c基因所编码的蛋白质与谷氨酸棒杆菌中的核苦-二磷酸糖差向异构酶(GenBank登录号NP—6005卯,BLAST分值89)呈现31%的同一性(使用BLAST程序确定)。这种相似性暗示orf30c基因编码差向异构酶。利用CD-搜索程序(参照上面)对该序列进行分析的事实支持该假说,也表明orO0c基因编码差向异构酶。orB0c呈现两个可能的起始密码子(参照SEQIDNo.115),这使得可形成两种可能的分别为345和282个氨基酸的蛋白质(SEQIDNo.116和117)。然而,典型链霉菌的密码子选择仅从第二个ATG开始;此外,从第一个ATG和第二个之间的序列推导出的蛋白质序列不能与所鉴定的相近序列进行比对,反之最短的蛋白质序列(从第二个ATG起始SEQIDNo.144)能与这些蛋白质正确比对。因此能够由此得出结论第二个ATG是正确的起始密码子,并且该orf的序列如SEQIDNo.143所示,一旦进行翻译,其相应的蛋白质序列为SEQIDNo.I",Orf31基因所编码的蛋白质与天蓝色链霉菌中的氧化还原酶(GenBank登录号NP—631148,BLAST分值261)呈现52%的同一性(使用BLAST程序确定)。这种相似性暗示orf31基因编码还原酶。利用CD-搜索程序(参照上面)对该序列进行分析的事实支持该假说,也表明orf31基因编码还原酶。由orf31基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实也支持该假说(参照表36)。表36呈现显著相似性的蛋白质GenBank登录号BLAST*分值所报道的功能推定的氧化还原酶(灰色链霉菌)BAB79295173氧化还原酶MocA(地毯草黄单胞菌(Xanthomonasaxonopodis))NP一640644171氧化还原酶*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。失活orl31基因。如此有可能显示所得到的菌林不再产生螺旋霉素。这证实orf31基因确实参与螺旋霉素生物合成。因此由该基因所编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。首先部分确定了orB2c的序列(参照实施例19),而5'位置的编码序列在第二步骤中才确定。然而,该orf的部分序列(SEQIDNo.l20)已用上述的多种计算机程序进行了分析。因此有可能确定ori32c基因编码的蛋白质在已测定的序列范围内(SEQIDNo.121,该序列是Orf32c蛋白质的部分序列),与天蓝色链霉菌中GntR家族的调节蛋白质(GenBank登录号:NP_625576,BLAST分值229)呈现47%的同一性(利用BLAST程序确定)。这种相似性暗示orB2c基因编码GntR家族的转录调节子。orf32c基因编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说。随后又测定完成了orB2c的部分序列并测定了未知的区域(参照SEQIDNo.140和SEQIDNo.145)。该orf全部序列编码与除虫链霉菌中GntR家族的调节蛋白质(GenBank登录号NP—824604,BLAST分值282)呈现44%的同一性(利用BLAST程序确定)。这种相似性暗示orf32c基因编码GntR家族的转录调节子。orf32c基因编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表37)。表37呈现显著相似性的蛋白质GenBank登录号BLAST*分值所报道的功能GntR家族的调节蛋白质(除虫链霉菌)NP—828241270GntR家族的调节蛋白质GntR家族的调节蛋白质(天蓝色链霉菌)NP—625576266GntR家族的调节蛋白质SC5G8.04(天蓝色链霉菌)NP—628991258GntR家族的调节蛋白质转录调节子(委内瑞拉链霉菌)AAF01064224转录调节子GntR家族调节蛋白质(除虫链霉菌)NP_827432239GntR家族的调节蛋白质*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。为了研究该基因在生二素链霉菌的螺旋霉素生物合成途径中的功能,将orf32c基因进行失活。可显示所得到的菌林产生螺旋霉素。这表明orf32c基因对于螺旋霉素生物合成不是必需的并且该基因对于细菌的生存也不是必需的。orf33基因所编码的蛋白质与野油菜黄单胞菌的推定蛋白质(GenBank登录号NP—635564,BLAST分值54)呈现49%的同一性(利用BLAST程序确定)。orf34c的序列是部分序列。事实上,在该orf的产物与数据库之间进行的比较表明该蛋白质的C-末端部分不是由核苷^列推导出的产物,因此该orf应更长并含有已测序区域以外的部分。然而,将该ORF的部分序列用上述多种计算机程序进行了分析。有可能确定orB4c基因所编码的蛋白质,在全部已确定的序列范围内(SEQIDNo.150,该序列是Orf34c蛋白质的部分序列),与来自天蓝色链霉菌的阿拉伯呋喃糖苷酶(Bentley等,2002;GenBank登录号NP—630049,BLAST分值654)呈现91%的同一性(利用BLAST程序确定)。在天蓝色链霉菌中,编码该阿拉伯呋喃糖苷酶的基因显示不参与次级代谢物的生物合成。所以在生二素链霉菌中该基因可能不参与螺旋霉素生物合成。本发明的主题也为这样的多核苷酸,在高度严格条件下,这些多核苷酸至少与序列SEQIDNos3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149中的多核苷酸之一或其变体之一或由于遗传密码简并性从其衍生的序列之一进行杂交。优选地,这些所述多核苷酸是从链霉菌属细菌分离得到的,更加优选地这些多核苷酸编码参与大环内酯生物合成的蛋白质,并且甚至更加优选地这些多核苷质。高严格杂交条件可以定义为不利于非同源核酸链进行杂交的杂交条件。例如,高严格杂交条件可以描述为这样的杂交条件在Church和Gilbert(Church和Gilbert,1984)所述的緩冲液中温度在55。C和65"C之间;杂交温度优选地为55x:,杂交温度更加优选地为6or:,杂交温度最优选地为65接下来用2XSSC緩沖液在55'C和65'C之间的温度进行一次或多次洗涤;该温度优选地为55°C,该温度更加优选地为60。C并且该温度最优选地为65°C,接下来用0.5XSSC緩沖液在55。C和65。C之间的温度进行一次或多次洗涤;该温度优选地为55°C,该温度更加优选地为60"C并且该温度最优选地为65。C。上述杂交条件能够根据预杂交核酸的长度,或根据所选标记类型而按照本领域技术人员熟知的技术进行调整。例如,适当的杂交条件可以按照F.Ausubel等,2002的工作进行调整。本发明还涉及与包含选自核苷醋列SEQIDNos3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的多核苷酸或者互补序列的多核苷酸中的至少10,12,15,18,20至25,30,40,50,60,70,80,卯,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苦酸具有至少70%,更加优选地为80。/。,更加优选地为85。/。,甚至更加优选地为90%,甚至更加优选地为95%,并且最优选地为98%核苷酸同一性的多核苷酸。优选地,这些所述多核苷酸是从链霉菌属细菌分离得到的,更加优选地是这些多核苷酸编码参与大环内酯生物合成的蛋白质,并且甚至更加优选地是这些多核苷酸所编码的蛋白质具有的活性类似于与其呈现同一性的多核香酸所编码的蛋白质。最优选地是,根据本发明的多核苷酸选自核苷^f列SEQIDNos3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149,或者互补序列的多核苷酸。利用已知的算法,例如FASTA软件包的算法(W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),具体而言可由法国Evry的INFOBIOGEN资源中心得到,能够在计算机上对用于比较的序列进行最佳比对。通过举例说明,利用LFASTA(K,M.Chao等,1992)或LALIGN(X.Huang和W.Miller,1991)软件可以确定序列同一性百分率。LFASTA和LALIGN程序是FASTA软件包的一部分。LALIGN提供最佳局部比对,该程序比LFASTA更加精确,但速度较慢。本发明的另一方面涉及过量表达如上面所定义的核酸序列而得到的多肽。优选地是,根据本发明的这些多肽与包含选自SEQIDNo4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150、或在所述序列中已进行了一个或多个氨基酸替换、插入或删除而不影响其功能特性的这些序列之一、或这些序列的变体之一中的至少10,15,20,30至40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640个连续氨基酸的多肽呈现至少70%,更加优选地为80%,更加优选地为85%,甚至更加优选地为90%,甚至更加优选地为95%并且最优选地为98%的氨基酸同一性。优选地是,根据本发明的这些多肽由链霉菌属细菌以天然状态表达,更加优选地是这些多肽参与大环内酯的生物合成,并且甚至更加优选地是这些多肽具有的活性类似于与其具有同一性的多肽。优选地,根据本发明的所述多肽选自多肽序列SEQIDNo4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150、或在所述序列中已进行了一个或多个氨基酸替换、插入或删除而不影响其功能特性的这些序列之一、或这些序列的变体之一。更加优选地,根据本发明的所述多肽选自多肽序列SEQIDNo4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150。利用已知的算法,例如FASTA软件包的算法(W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,19卯),具体而言可由法国Evry的INFOBIOGEN资源中心得到,能够在计算机上对用于比较的序列进行最佳比对。通过举例说明,利用LFASTA(K.-M.Chao等,1992)或LALIGN(X.Huang和W.Miller,1991)软件使用INFOBIOGEN资源中心,Evry,法国所定义的缺省参数可以确定序列同一性百分率。LFASTA和LALIGN程序是FASTA软件包的一部分。LALIGN提供最佳局部比对;该程序比LFASTA更精确,但速度较慢。本发明的另一方面涉及含有至少一个上述多核苷酸的重組DNA。优选地是,该重组DNA是载体。甚至更加优选地是,该栽体选自嗟菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC(细菌人工染色体)和PAC(Pl-来源的人工染色体)通过举例说明,入噬菌体和M13噬菌体可以描述为细菌噬菌体。关于质粒,可提及的是在大肠杆菌(E.coli)中复制的质粒,例如pBR322及其衍生物、pUC18及其衍生物、pUC19及其衍生物、pGB2及其衍生物(G.Churchward等,1984)、pACYC177(GenBank登录号X06402)及其衍生物、和pACYC184(GenBank登录号X06403)及其衍生物。可提及的是在链霉菌中复制的质粒,例如pIJ101及其衍生物、pSG5及其衍生物、SLP1及其衍生物、和SCP2^^及其衍生物(Kieser等,2000)。关于噬菌粒,通过举例说明,可提及的是pBluescriptII及其衍生物(特别是由Stratagene(LaJolla,California,USA)公司出售)、pGEM-T及其ff生物(由Promega(Madison,Wisconsin,USA)乂A司出售)、[lacunalIS117整合系统(Kieser等,2000)。关于fosmids,通过举例说明,可提及的是fosmidpFOSl(由NewEnglandBioloabs有限公司,Beverly,Massachussetts,USA公司出售)及其衍生物。关于粘粒,通过举例说明,可提及的是粘粒SuperCos及其衍生物(特别是由Stratagene(LaJolla,California,USAV^司出售)和粘粒pWED15(Wahl等,1987)及其衍生物。关于穿梭载体,通过举例说明,可提及的是大肠杆菌/链霉菌穿梭质粒,例如,pIJ卯3及其4汙生物、质粒pUWL、pCA0106、pWHM3和pOJ446系列及其衍生物(Kieser等,2000),以及大肠杆菌/链霉菌穿梭BAC,例如,在专利申请WO01/40497中所述的穿梭BAC。关于BAC(细菌人工染色体),通过举例说明,可提及的是BACpBeloBACll(GenBank登录号U51113)。关于PAC(Pl-来源的人工染色体),通过举例说明,可提及的是载体pCYPAC6(GenBank登录号AF133437)。最优选地是,根据本发明的载体选自pOS49.1,pOS49.ll,pOSC49.12,pOS49.14,pOS49.16,pOS49.28,pOS44.1,pOS44.2,pOS44.4,pSPM5,pSPM7,pOS49.67,pOS49.88,pOS49.106,pOS49.120,pOS49.107,pOS49.32,pOS49.43,pOS49.44,pOS49.50,pOS49.99,pSPM17,pSPM21,pSPM502,pSPM504,pSPM507,pSPM508,pSPM509,pSPMl,pBXLllll,pBXL1112,pBXL1113,pSPM520,pSPM521,pSPM522,pSPM523,pSPM524,pSPM525,pSPM527,pSPM528,pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44,pSPM45,pSPM47,pSPM48,pSPM50,pSPM51,pSPM52,pSPM53,pSPM55,pSPM56,pSPM58,pSPM72,pSPM73,pSPM515,pSPM519,pSPM74,pSPM75,pSPM79,pSPM83,pSPM107,pSPM543和pSPM106。本发明的另一方面涉及含有适当表达载体和允许一个或多个上述多肽在生物系统中表达的宿主细胞的表达系统。根据本发明的表达载体包含编码一个或多个上述多肽的核酸序列,并且表达载体可以有目的地在本领域技术人员熟知的多种宿主细胞中表达多种多肽。通过举例,可提及的是原核表达系统(例如在细菌大肠杆菌中的表达系统)和真核表达系统,例如允许在昆虫细胞中表达的杆状病毒表达系统、以及允许在酵母细胞中表达的表达系统、或者允许在哺乳动物细胞,尤其是人类细胞中表达的表达系统。能够用于此类系统的表达载体是本领域技术人员所熟知的,关于原核细胞,通过举例说明,可提及的是大肠杆菌中的表达载体,例如Stratagene(LaJolla,California,USA)7>司出售的pET、Invitrogen(Carlsbad,California,USA)公司出售的GATEWAY系列载体、Invitrogen(Carlsbad,California,USA)公司出售的pBAD系列载体、NewEnglandBioloabs有限公司(Beverly,Massachussetts,USA)公司出售的pMAL系列载体,以及在B.Wilms等(2001)的出版物中提及的鼠李糖-可诱导表达载体及其衍生载体;所提及的内容还包括链霉菌中的表达载体,例如栽体pIJ4123,pIJ6021,pPM927,pANT849,pANT850,pANT851,pANT1200,pANT1201和pANT1202及其衍生物(Kieser等,2000)。关于酵母细胞,通过举例说明,所谈及的内容包括Stratagene(LaJolla,California,USA)公司出售的载体pESC。关于允许在昆虫细胞中表达的杆状病毒表达系统,通过举例说明,所i炎及的内容包括BDBiosciencesClontech,(PaloAlto,California,USA)公司出售的载体BacPAK6。关于哺乳动物细胞,通过举例说明,所谈及的内容包括含有CMV(巨细胞病毒(Cytomegalovirus))早期即刻基因启动子的栽体(例如由Stratagene(LaJolla,California,USA)公司出售的载体pCMV及其4汙生物),或者猿猴空泡病毒(vacuolatingsimianvirus)的SV40早期启动子(例如由Stratagene(LaJolla,California,USA)公司出售的载体pSG5)。本发明还涉及产生如上所述多肽的方法,所述方法包括以下步骤a)将编码所述多肽的核酸插入适当的载体;b)在适当的培养基中,培养预先用步骤a)中的载体转化或转染的宿主细胞;c)回收条件培养基或细胞提取物,例如通过超声法或通过渗透压休克法;d)从在步骤c)中获得的所述培养基中或细胞提取物中分离并纯化所述多肽;e)根据需要,鉴定所产生的多肽的特性。按照本领域才支术人员熟知并在诸如F.Ausubel等,(2002)中所述的方法,通过穿过一系列适当的层析柱能够纯化本发明的重组多肽。通过举例说明,所谈及的内容包括"组氨酸-标签"技术,该技术在于将短的多聚组氨酸序列加到所产生的多肽上,使得该多肽有可能在镍柱上被纯化。根据本发明的多肽也可以通过体外合成技术进行制备。对此类技术的举例说明,利用由RocheDiagnosticsFranceS.A.,Meylan,France公司出售的"快速翻译系统(RTS)"也可以制备本发明的多肽。本发明的另一方面涉及已经将本发明的至少一个多核苷酸和/或至少一个重组DNA和/或至少一个表达载体导入其中的宿主细胞。本发明的另一方面涉及阻断了至少一种大环内酯生物合成途径的步骤的微生物。优点首先在于研究突变蛋白质的功能并且,其次在于产生能产生生物合成中间体的微生物。通过向生产培养基中加入特殊成分,或者通过将突变了其它基因(这些基因编码通过利用中间体作为底物而能够对其进行修饰的蛋白质)导入微生物,能够修饰这些中间体,任选地在分离之后修饰。因此能够对这些中间体进行化学、生物化学、酶学和/或微生物学修饰。通过在产生该种或这些大环内酯的^:生物中失活一种或多种参与该种或这些大环内酯生物合成的蛋白质的功能,能够获得大环内酯生物合成途径的步骤阻断的微生物。根据所失活的蛋白质,从而可以获得该种或这些大环内酯生物合成途径不同步骤阻断的微生物。通过本领域技术人员熟知的任意方法能够进行该种或这些蛋白质的失活,例如通过在编码所述蛋白质的基因中进行诱变或者通过表达与编码所述蛋白质的信使RNA互补的一条或多条反义RNA而失活。例如,通过辐射、通过诱变化学试剂的作用、通过定点诱变、通过基因置换或本领域技术人员熟知的任意其它方法,能够进行诱变。例如,按照T.Kieser等(2000)和Ausubel等(2002)所做工作中的教导,能够调整适合用于此种诱变的条件。通过在考虑的基因中进行抑制、替换、删除和/或添加一个或多个碱基,或者通过基因失活,能够在体外或原位进行诱变。在含有上述序列的基因中能够进行该种诱变。优选地是,大环内酯生物合成途径步骤阻断的樣i生物是链霉菌属的细菌。更加优选地是,通过诱变对参与所讨论的大环内酯生物合成的一种或多种蛋白质的功能进行失活。甚至更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行一次诱变或多次诱变的微生物是生二素链霉菌菌株。更加优选地是,在含有对应于SEQIDNo3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149一个或多个序列的序列之一的一个或多个基因中进行诱变。优选地是,通过基因失活进行一次诱变或多次诱变。最优选地是,诱变由对含有对应于序列SEQIDNo.13的序列的基因进行基因失活组成。通过举例说明,以下微生物可以作为此类微生物的例子被提及OS49.16(orf3::.hyg,参照实施例2)、OS49.67(orf3同相删除,参照实施例6)、OS49.107(or仿:.hyg,参照实施例7)、OS49.50(orfl0:.:hyg,参照实施例8)、SPM21(orf2::att3Qaac-,参照实施例10)、SPM22(orf2::att3同相删除,参照实施例10)、SPM501(orf"6*::attlhyg+,参照实施例14)、SPM502(orf6*::attl同相删除,参照实施例14)、SPM507(orfl2::att3Qaac-,参照实施ll)、SPM508(orfl3c::att3Daac-,参照实施例12),和SPM509(orfl4::att3Qaac-,参照实施13),SPM107(orf28c::att3aac+,参照实施例29)、SPM543(orf31::att3aac+,参照实施30)、SPM106(orf32c::att3aac+,参照实施例31)。本发明的另一方面涉及制备大环内酯生物合成中间体的方法,该方法使用上述大环内酯生物合成途径的步骤阻断的微生物。该方法包括在适当的培养基中培养上述大环内酯生物合成途径的步骤阻断的微生物,回收条件培养基或细胞提取物,例如通过超声法或渗透压休克法,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化所述生物合成中间体。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其可以参照Kieser等,(2000)的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的中间体。例如,本领域的技术人员可参照美国专利3,000,785中所教导的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。本发明的另一个主题涉及制备衍生于大环内酯的分子的方法,该方法使用上述该大环内酯生物合成途径的步骤阻断的微生物。该方法包括按照上面的方法获得生物合成中间体和修饰如此产生的中间体,任选地在从培养基中分离出来之后修饰。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域熟知的技术具体而言可以参照Kieser等,(2000)的工作。通过在生产培养基中加入适当成分或者通过将其它基因(这些基因编码通过利用中间体作为底物而能够对其进行修饰的蛋白质)导入微生物,可以修饰所产生中间体,任选地在分离之后修饰。因此能够对这些中间体进行化学、生物化学、酶学和/或微生物学修饰。更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行一次或多次诱变的微生物是生二素链霉菌菌抹。本发明还涉及产生螺旋霉素I但不产生螺旋霉素II和III的孩t生物。该微生物含有生物合成螺旋霉素I但不产生螺旋霉素II和III所必需的所有基因,这是由于含有对应于SEQIDNo.13的序列或其变体之一或由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQIDNo.14的多肽或其变体之一的基因是不表达的或者已经被失活。通过任意本领域技术人员熟知的任一方法能够进行该蛋白质的失活,例如通过在编码所述蛋白质的基因中进行诱变,或者过量表达与编码所述蛋白质的信使RNA互补的反义RNA,这可以理解为如果由该操作影响orf5头的表达,将必须进行另一种修饰从而使0^5*基因正确表达。为了使所编码的蛋白质失活或者阻止其表达或由其翻译,可以在编码序列中或非编码序列中进行诱变。通过定点诱变、基因置换或任意本领域技术人员熟知的其它方法,可以进行诱变。例如,按照T.Kieser等(2000)和Ausubel等2002的工作中所教授的内容,可以调整适于此种诱变的条件。通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活,可以在体外或原位进行诱变。过量表达螺旋霉素生物合成途径的基因,而不表达含有序列SEQIDNo.13、或其变体之一、或由于遗传密码简并性而由衍生的序列之一、并编码序列SEQIDNo.14的多肽或其变体之一的基因,也可以获得该微生物。优选地是,微生物是链霉菌属的细菌。更加优选地是,该种仅产生螺旋霉素I而不产生螺旋霉素II和III的微生物是从产生螺旋霉素I、II和III的起始微生物获得的。甚至更加优选地是,通过在含有对应于SEQIDNo.13的序列,或其变体之一,或由于遗传密码简并性而由其衍生的序列之一,并编码序列SEQIDNo.14的多肽或其具有相同功能的变体之一,的基因中进行诱变获得该微生物。甚至更加优选地是,通过基因失活进行该诱变。优选地,从产生螺旋霉素I、II和III的生二素链霉菌菌林获得所述微生物,其中对含有对应于SEQIDNo.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。最优选地,通过同相删除含有对应于SEQIDNo.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因的一部分,进行基因失活。通过举例说明,菌林SPM502(orf6*::attl,参照实施例14)可以描述为产生螺旋霉素I而不产生螺旋霉素II和III的微生物。本发明还涉及上述的产生螺旋霉素I而不产生螺旋霉素II和III的微生物,该微生物也过量表达-利用以下序列的引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3'(SEQIDNo.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码序列SEQIDNo.141的基因,-或者由于遗传密码的简并性而由其衍生的基因。在SEQIDNo.lll(DNA)中给出了此种基因的序列的例子;然而,由于该序列不含相应编码序列的3'部分,所以该序列是部分序列。SEQIDNo.112给出了该编码序列部分所翻译成的蛋白质。具体而言利用实施例24中所教授的内容,本领域的技术人员将能够容易地完成这项工作。在第二步骤中确定了SEQIDNo.Ill中未确定的序列,并且在SEQIDNo.141中给出了该orf(orf28c)的完整序列。SEQIDNo.142给出了该编码序列所翻译成的蛋白质。实施例24给出了克隆orf28c基因的方法和产生允许orf28c表达的表达栽体的方法。该实施例还表明在菌林OSC2中过量表达orf28c基因导致该菌林中螺旋霉素产量增加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得orf28c基因过量表达。优选地,通过将允许该基因过量表达的重组DNA构建体导入微生物获得所述基因的过量表达。优选地,该重组DNA构建体增加所述基因的拷贝数并使得能够获得所述基因的过量表达。在该重组DNA构建体中,能够将该基因的编码序列置于比野生型启动子活性更强的启动子的控制之下。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)及ermE头启动子。因此,优选地,所导入的一个或多个orf28c基因拷贝置于ermE夫启动子的控制之下,如在构建体pSPM75中的情况(参照实施例24)。本发明还涉及如上所述产生螺旋霉素I而不产生螺旋霉素II和III的-欽生物,该^:生物也过量表达具有编码序列SEQIDNo.47或具有由于遗传密码简并性而由其衍生的编码序列的基因。优选地是,该微生物是菌林SPM502pSPM525,其保藏于国立微生物保藏中心[NationalCollectionofCulturesandMicroorganisms](CNCM)巴斯德'研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年2月26日,4呆藏号为1-2977。本发明还涉及产生螺旋霉素I的方法;该方法包括在适当的培养基中,培养如上所述螺旋霉素I而不产生螺旋霉素II和III的^t生物,回收条件培养基或细胞提取物,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素I。按照本领域技术人员熟知的技术可以确定培养此种微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员具体而言可以参照Kieser等,2000的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的螺旋霉素I。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。本发明的另一方面涉及根据本发明的核苷酸序列用于增加微生物大环内酯产量的用途。因此,本发明涉及产生大环内酯的突变微生物,该微生物在至少一个含有上述序列的基因中进行了遗传修饰,并且/或者该微生物过量表达至少一个含有上述序列的基因。为了表达一个或多个具有更高活性的蛋白质或者表达更高水平的该蛋白质或这些蛋白质,遗传修饰可以包括在所讨论的基因中进行一个或多个碱基的抑制、替换、删除和/或添加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得所讨论的基因的过量表达。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)和ermE*启动子(Bibb等,1985),(Bibb等,1994)。因此,通过将根据本发明的允许该基因过量表达的重组DNA构建体导入所考虑的产生大环内酯的微生物,能够获得所考虑的基因的过量表达。具体而言,大环内酯生物合成的某些步骤是是限制步骤并且,如果表达了参与这些限制步骤的一种或多种比野生型蛋白质具有更高活性或更高表达水平的蛋白质,有可能提高所涉及的大环内酯的产量。例如,通过复制编码限制性甲基转移酶(该酶将大菌素转化成泰乐菌素)的基因,已经在弗氏链霉菌中获得了增加了的泰乐菌素产率(R.Baltz,1997)。尤其是通过诱变能够获得活性更高的蛋白质的表达;例如,本领域的技术人员可以参照F.Ausubel等,(2002)的相关工作。优选地是,大环内酯产量得到提高的这些突变微生物是链霉菌属细菌。更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行了一次或多次诱变的樣t生物是生二素链霉菌菌抹。更加优选地是,在一个或多个含有对应于一个或多个序歹'JSEQIDNo3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的基因中进行了遗传修饰。优选地,该微生物过量表达一个或多个含有对应于一个或多个序列SEQIDNo3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的基因。优选地,该微生物过量表达含有对应于SEQIDNo.Ill或141的序列、或其变体之一、或由于遗传密码筒并性而由其4汙生的序列之一的基因。SEQIDNo.Ill中给出的序列是部分序列;然而,本领域的技术人员尤其可利用实施例24中所给出的技术将能够容易地完成该序列。在第二步骤中确定了SEQIDNo.Ill中未确定的序列,并且在SEQIDNo.141中给出了该orf(orf28c)的完整序列。SEQIDNo.142给出了该编码序列所翻译成的蛋白质。实施例24给出了克隆orf28c基因的方法和产生允许orf28c表达的表达载体的方法。该实施例还表明在菌林OSC2中过量表达orf28c基因导致该菌林中螺旋霉素产量增加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得orf28c基因过量表达。优选地,通过将允许该基因过量表达的重组DNA构建体导入微生物获得所述基因的过量表达。优选地,该重组DNA构建体增加所述基因的拷贝数并使得能够获得所述基因的过量表达。在该重组DNA构建体中,能够将该基因的编码序列置于比野生型启动子活性更强的启动子的控制之下。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)及ermE力启动子。因此,优选地,所导入的一个或多个orf28c基因拷贝置于ermE女启动子的控制之下,如在构建体pSPM75中的情况(参照实施例24)。本发明的另一方面涉及利用先前段落中所述的微生物产生大环内酯的方法。该方法包括在适当的培养基中培养先前段落中所定义的微生物,回收条件培养基或细胞提取物,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化所产生的大环内酯。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其可以参照Kieser等,2000的工作。通过任意本领域技术人员熟知的技术能够回收所产生的大环内酯。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。优选地是,在此种方法中所使用的微生物是链霉菌属的细菌。更加优选地是,所讨论的大环内酯是螺旋霉素,并且其螺旋霉素产量得到提高的突变微生物是生二素链霉菌菌林。本发明的另一方面涉及根据本发明的序列和/或载体用于制备杂化抗生素的用途。具体而言,根据本发明的多核苷酸可以用于获得微生物,这些微生物表达一个或多个在底物特异性方面产生修饰的突变蛋白质,或者为了产生杂化抗生素可以在许多产生抗生素的微生物中表达这些多核苷酸。因此,通过生产樣i生物之间的基因转移,可以使得根据本发明的多核苷酸能够产生具有有利药理学特性的杂化抗生素(Hopwood等,1985a,Hopwood等,1985b,Hutchinson等,1989)。Hopwood(Hopwood1981)首先提议利用该原则,基因工程能够引起产生杂化抗生素。因此提出参与抗生素生物合成的酶常常接受结构上相关但不同于其天然底物的底物。普遍认为抗生素生物合成途径的基因所编码的酶比基本代谢的酶具有更不严格的底物特异性(Hopwood1981,Hutchinson1988,Robinson1988)。因此已经表明有可能通过产抗生素微生物、其突变体或所纯化的这些抗生素生物合成途径的酶转化大量非天然底物(Hutchinson1988)。利用该教导,本领域的技术人员可以构建表达一种或多种在底物特异性上产生修饰的突变蛋白质的微生物,以产生杂化抗生素。本发明还涉及根据本发明的至少一条多核苷酸和/或至少一个重组DNA和/或至少一个表达载体和/或至少一条多肽和/或至少一种宿主细胞用于进行一种或多种生物转化的用途。因此,本发明佳:得有可能构建这样的细菌或真菌菌林,其中根据本发明的一个或多个蛋白质在适当表达信号的控制下进行表达。然后此类菌林能够用于进行一种或多种生物转化。使用全细胞或者^f吏用所述细胞的无细胞提取物,可以进行这些生物转化。这些生物转化使得有可能利用生物合成途径的酶将分子转化成衍生形式。例如,Carreras等(Carreras等,2002)描述了红色糖多孢菌和天蓝色链霉菌菌株用于产生新的红霉素衍生物的用途。Walczak等(Walczak等,2001)描述了链霉菌P450单加氧酶用于将desacetyladriamycin(蒽环霉素类似物)生物转化成新的蒽环霉素的用途。Olonao等(Olonao等,1999)描述了浅青紫链霉菌(Streptomyceslividans)修饰的菌林用于将£-紫红霉酮生物转化成紫红菌素D的用途。本领域的技术人员可以将这些原则应用于任意生物合成中间体。本发明还涉及这样的重組DNA,其包含-利用具有以下序列的引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139),并以粘粒pSPM36或生二素链霉菌的总DNA为模板,通过聚合酶链式反应能够获得的多核苷酸,更加优选地该多核苷酸是序列SEQIDNo.141的多核苷酸,-或者至少有所述多核苷酸中的10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,卯0,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1460,1470,1480,1490或1500个连续核苷酸的片段。优选地是,该重组DNA是载体。甚至更优选地是,该载体选自噬菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC(细菌人工染色体)和PAC(Pl-来源的人工染色体)。通过举例说明,X噬菌体和M13噬菌体可以描述为细菌噬菌体。作为质粒,可提及的是在大肠杆菌中复制的质粒,例如pBR322及其衍生物、pUC18及其衍生物、pUC19及其衍生物、pGB2及其衍生物(G.Churchward等,1984)、pACYC177(GenBank登录号X06402)及其衍生物、和pACYC184(GenBank登录号X06403)及其衍生物。还可提及的是在链霉菌中复制的质粒,例如pIJ101及其衍生物、pSG5及其衍生物、SLP1及其衍生物、和SCP2A及其衍生物(Kieser等,2000)。关于噬菌粒,通过举例说明,可提及的是pBluescriptII及其矛汴生物(尤其是由Stratagene(LaJolla,California,USAV〉司出售)、pGEM-T及其衍生物(由Promega(Madison,Wisconsin,USA)^^司出售)、和1ZAPII及其f汴生物(尤其是由Stratagene(LaJolla,California,USA)^司出售)。关于整合载体,通过举例说明,可提及的是在链霉菌中整合的载体,例如来源于SLP1的载体(Kieser等,2000)、来源于pSAM2的栽体(Kieser等,2000)、使用PhiC31噬菌体整合系统(Kieser等,2000)(例如pSET152(Bierman等,1992))或VWB整合系统(L.vanMellaert等,1998)的载体,并且还包括使用IS117整合系统(Kieser等,2000)的载体。关于fosmids,通过举例说明,可提及的是fosmidpFOSl(由NewEnglandBioloabs有限乂>司,Beverly,Massachussetts,USA公司出售)及其衍生物。关于粘粒,通过举例说明,可提及的是粘粒SuperCos及其4汙生物(尤其是由Stratagene(LaJolla,California,USA)公司出售)和粘粒pWED15(Wahl等,1987)及其衍生物。关于穿梭载体,通过举例说明,可提及的是大肠杆菌/链霉菌穿梭质粒,例如,pIJ903及其4汙生物、质粒pUWL、pCA0106、pWHM3和pOJ446系列及其衍生物(Kieser等,2000),以及大肠杆菌/链霉菌穿梭BAC,例如,在专利申请WO01/40497中所述的穿梭BAC。关于BAC(细菌人工染色体),通过举例说明,可提及的是BACpBeloBACll(GenBank登录号U51113)。作为PAC(Pl-来源的人工染色体),通过举例说明,可提及的是载体pCYPAC6(GenBank登录号AF133437)。更加优选地是,该重组DNA是表达载体。能够用于此类系统的表达栽体是本领域技术人员所熟知的;关于原核细胞,通过举例说明,可提及的是大肠杆菌中的表达载体,例如Stratagene(LaJolla,California,USA)乂〉司出售的pET、Invitrogen(Carlsbad,California,USA)公司出售的GATEWAY系列载体、Invitrogen(Carlsbad,California,USA)公司出售的pBAD系列载体、NewEnglandBioloabs有限公司(Beverly,Massachussetts,USA)公司出售的pMAL系列载体,以及在B.Wilms等(2001)的出版物中提及的鼠李糖-可诱导表达载体及其衍生载体;所提及的内容还包括链霉菌中的表达载体,例如载体pIJ4123,pIJ6021,pPM927,pANT849,pANT850,pANT851,pANT1200,pANT1201和pANT1202及其衍生物(Kieser等,2000)。关于酵母细胞,通过举例说明,所谈及的内容包括Stratagene(LaJolla,California,USA)公司出售的载体pESC。关于允许在昆虫细胞中表达的杆状病毒表达系统,通过举例^兌明,所i炎及的内容包4舌BDBiosciencesClontech,(PaloAlto,California,USA)公司出售的载体BacPAK6。关于哺乳动物细胞,通过举例说明,所谈及的内容包括含有CMV(巨细胞病毒(Cytomegalovirus))早期即刻基因启动子的载体(例如由Stratagene(LaJolla,California,USA)公司出售的载体pCMV及其衍生物),或者猿猴空泡病毒的SV40早期启动子(例如由Stratagene(LaJolla,California,USA)^>司出售的载体pSG5)。本发明的另一方面涉及已经将至少一个该段落中所述的重组DNA导入其中的宿主细胞。本发明还涉及产生多肽的方法,其中所述方法包括以下步骤a)用至少一个上面段落中所述的表达载体转化宿主细胞;b)在适当的培养基中培养所述宿主细胞;c)回收条件培养基或细胞提取物;d)从步骤c)中获得的所述培养基中或细胞提取物中分离并纯化所述多肽;e)根据需要,鉴定所产生的重组多肽的特性。按照本领域冲支术人员熟知并在诸如F.Ausubel等,(2002)中所述的方法,通过穿过一系列适当的层析柱,能够纯化所产生的重组多肽。通过举例说明,所谈及的内容包括"组氨酸-标签,,技术,该技术在于将短的多聚组氨酸序列加到所产生的多肽上,使得该多肽有可能在镍柱上被纯化。通过体外合成技术也可以制备多肽。通过此类技术的举例说明,利用"快速翻译系统(RTS)",尤其是由RocheDiagnosticsFranceS.A.,Meylan,France7〉司出售,也可以制备多肽。本发明的另一方面涉及产生至少一种螺旋霉素的微生物,该微生物过量表达-利用以下序列的引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码序列SEQIDNo.141的基因,-或者由于遗传密码简并性而由其衍生的基因。在SEQIDNo.lll(DNA)中给出了此种基因的序列的例子;然而,由于该序列不含相应编码序列的3,部分,所以该序列是部分序列。SEQIDNo.112给出了该编码序列部分所翻译成的蛋白质。尤其是利用实施例24中所教授的内容,本领域的技术人员将能够容易地完成该序列。因此该实施例给出了用于克隆orf28c基因的方法和用于产生允许orf28c表达的表达载体的方法。该实施例还表明在菌林OSC2中过量表达orf28c基因导致该菌林中螺旋霉素产量增加。优选地,过量表达以下基因-利用以下序列的引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3'(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码预序列SEQIDNo.141的基因,-或者由于遗传密码简并性而由其衍生的基因,的微生物是链霉菌属细菌;甚至更加优选地是,该微生物是生二素链霉菌物种的细菌。优选地,通过用表达载体转化所述微生物获得所述基因的过量表达;最优选地,微生物菌林是菌林OSC2/pSPM75(1)或菌林OSC2/pSPM75(2),保藏于国立微生物保藏中心(CNCM)[NationalCollectionofCulturesandMicroorganisms]巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年10月6日,保藏号为1-3101。本发明的另一方面涉及产生螺旋霉素的方法,该方法使用先前段落中所述的微生物。该方法包括在适当的培养基中培养先前段落中所定义的4敞生物,回收条件培养基或细胞提取物,以及从所述培养基或者从先前步骤中获得的细胞提取物中分离并纯化螺旋霉素。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其是可以参照Kieser等,(2000)的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的螺旋霉素。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。优选地是,用于此种方法的^f敖生物是链霉菌属细菌。更加优选地是,该微生物是生二素链霉菌菌林。本发明的另一方面涉及表达载体,其中序列SEQIDNo.47的多核苷酸或由于遗传密码简并性而由其衍生的多核苷酸置于允许所述多核苷酸所编码的蛋白质在生二素链霉菌中表达的启动子的控制之下。上面已经给出了能够用于链霉菌的表达载体的例子。优选地是,此种表达载体为质粒pSPM524或pSPM525。本发明的另一方面涉及用先前段落中所定义的载体转化了的生二素链霉菌菌抹。本发明的另一方面涉及其序列包括序列SEQIDNo.112的多肽。本发明还涉及其序列对应于从以下编码序列所翻译的序列的多肽-利用以下序列引物对5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3'(SEQIDNo.138)和5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因的多肽,更加优选地是编码序列SEQIDNo.141的基因,-或者由于遗传密码简并性而由其衍生的基因。优选地是,由链霉菌属细菌以天然状态表达这些多肽,更加优选地是,这些多肽参与螺旋霉素生物合成。本发明的另一方面涉及允许先前段落中所定义的多肽在生二素链霉菌中表达的表达载体。上面已经给出了能够用于链霉菌的表达载体的例子。优选地是,所讨论的表达栽体是质粒pSPM75。附图简述图1:螺旋霉素I、II和III的化学结构。图2:用于对区域进行序列分析的粘粒。图3:参与螺旋霉素生物合成途径的基因群的组成图。图4:所提出的mycarose生物合成途径。图5:所提出的碳霉糖生物合成途径。图6:所提出的forosamine生物合成途径。图7:将糖添加到螺旋霉素分子和中间体上的优选顺序。图8:所提出的生二素链霉菌中甲氧基丙二酰的生物合成途径。通过与吸水链霉菌子嚢霉素变种中甲氧基丙二酰的生物合成(K.Wu等,2000)类比提出该途才圣。图9:导致基因失活的步骤A)将靶基因克隆入在大肠杆菌中复制而不在链霉菌中复制的载体中;B)将抗性盒插入靶基因(通过短相同序列之间的克隆或重组);C)将质粒导入生二素链霉菌(通过转化或与大肠杆菌接合)和选择具有整合盒的克隆,然后筛选丢失载体部分从而具有基因置换的克隆;D)突变体菌抹的染色体区域,其中靶基因已通过基因置换失活。图10:根据图9中所述方法进行基因失活之后的任选步骤,如果可切除盒已经用于打断草a基因,可以实施这些步骤;E)将携带有pSAM2的xis和int基因的质粒pOSV508导入突变体菌林,其产物通过盒边侧的attL和attR序列之间的定点重组将允许进行有效的切除;F)产生已丢失可切除盒并对针对盒所提供抗性敏感的抗生素的克隆;G)在不含抗生素的固体培养基上生长和形成芽孢之后,质粒pOSV508以高频率被丢失。因此有可能获得硫链丝菌肽敏感的克隆,其中把基因含有同相删除。通过PCR扩增和PCR产物的序列分析能够控制删除靶基因的序列。图11:扩增可切除盒以将其用于同源重组实-验。Chaveroche等,2000已经描述了通过短同源序列进行同源重组的技术。定位于这些寡核苷酸5,末端的39或40个脱氧核苷酸包含对应于将要失活的基因序列的序列,并且定位于大部分3,末端的20个脱氧核苷酸对应于可切除盒末端之一的序列。图12:利用Chaveroche等,2000所述的技术产生用于失活靶基因的构建体。图13:质粒pWHM3的图谱。Streptoori:链霉菌复制起点。图14:质粒pOSV508的图镨。图15:可切除盒结构的例子。它包括边侧是attR和attL位点(Raynal等,1998)的llhyg盒(Blondelet-Rouault等,1997),由于xis和int基因的表达,在attR和attL位点之间的重组事件将允许盒的切割。图16:质粒pBXLllll的图傳。图17:质粒pBXL1112的图i普。图18:微生物学测试螺旋霉素产量,基于藤黄微球菌菌林对螺旋霉素的敏感性。所用藤黄樣i球菌菌林是天然对螺旋霉素敏感而对杀刚锥虫素具抗性的菌林。所测试的多林链霉菌菌株培养于含有70mlMP5培养基的500ml锥形瓶中,以2.5x106芽孢/ml的起始浓度接种并以250转/分钟定轨振荡在27。C生长。培养48、72和96小时之后,取出发酵液样本并离心。将用无菌培养基10倍稀释的这些上清用于测试。抗杀刚锥虫素但对螺旋霉素敏感的藤黄微球菌指示菌(Gourmelen等,1998)培养于面积为12x12cm的平皿中。用70[il10倍稀释的每种上清浸湿WhatmanAA滤紙盘并放置于平亚表面。将用不同浓度(MP5培养基中2-4-8照/ml)的螺旋霉素溶液浸湿的盘稀释为标准范围。将皿在37'C孵育24-48小时。如果滤纸盘含有螺旋霉素,它将扩散进入琼脂并抑制藤黄微球菌指示菌的生长。这种抑制在滤紙盘周围产生"晕",晕反映了藤黄微球菌菌林不生长的区域。因此这种晕的存在是存在螺旋霉素的指示并且使得能够确定所讨论的生二素链霉菌菌林是否是或者不是螺旋霉素生产菌。将所获得的抑制直径与标准范围进行比较使得能够获得对该菌林所产生的螺旋霉素量的指示。图19:菌林OSC2的经过滤培养上清液的HPLC色谱图。图20:菌抹SPM501的经过滤培养上清液的HPLC色谦图。图21:菌林SPM502的经过滤培养上清液的HPLC色镨图。图22:菌林SPM507的经过滤培养上清液的HPLC色语图。图23:菌林SPM508的经过滤培养上清液的HPLC色镨图。图24:菌抹SPM509的经过滤培养上清液的HPLC色i昝图。图25:使用FASTA程序对所产生的弗氏链霉菌的TylB蛋白质(SEQIDNo.87)与OrB蛋白质(SEQIDNo.29)的比对。图26:使用FASTA程序产生的SrmD蛋白质(SEQIDNo.16)与生米卡链霉菌的MdmA蛋白质(SEQIDNo.88)的比对。图27:可切除盒切除后残余位点的序列的例子。以粗体表示的是Raynal等,1998中所定义的最小att26位点。SEQIDNo.104中给出了相位l(attl)33个核苷酸的序列,SEQIDNo.105中给出了相位2(att2)34个核苷酸的序列,并且SEQIDNo.95中给出了相位3(a"3)35个核苷酸的序列。图28:orfl0基因、所用PCR引物的定位和由每对引物所获得的构建体的图解说明。图29:pac-oritT盒的构建。图30:粘粒pWED2的图镨。图31:图解说明参与螺旋霉素生物合成途径的基因群和用于分离大肠杆菌中生二素链霉菌OSC2菌林的基因组DNA文库的粘粒的三个探针的定位(参照实施例19)。图32:从大肠杆菌中生二素链霉菌OSC2菌林的基因组DNA文库分离的粘粒的插入位点(参照实施例19)。图33:粘粒pSPM36Pstl-Pstl片段的亚克隆(质粒pSPM58插入),粘粒pSPM36Stul-Stul片段的亚克隆(质粒pSPM72插入)和EcoRI-StuI片段的亚克隆(质粒pSPM73插入)。图34:质粒pSPM58的Pstl-Pstl插入和质粒pSPM73的EcoRI-StuI插入中所鉴定的开放阅读框的定位。图35:在238和280nm产生的菌林OS49.67经过滤培养上清液的HPLC色镨图的叠置(上面)和33.4分钟和44.8分钟时洗脱的分子的UV谱(下面)。图36:platenolideA和platenolideB分子的分子结构。图37:参与螺旋霉素生物合成途径的基因群的组成图。图38:菌林SPM507所产生的生物合成中间体的分子结构。图39:来自过度产生螺旋霉素菌林的基因型为orf6^:attlfthyg+的生二素链霉菌菌抹所产生的生物合成中间体的结构。将盒attlQhyg+插入orf6*产生阻止orf5先表达的极性效应。图40:由菌4木OS49.67所产生的platenolideA+mycarose和platenolideB+mycarose分子的分子结构。图41:粘粒pSPM36Pstl-Pstl片段的亚克隆(质粒(pSPM79)插入),质粒pSPM79的Pstl-Pstl插入中所鉴定的开》欠阅读框的定位和序列SEQIDN°140的定位。通过以下实施例对本发明进行说明,这些实施例可视为非限制性举例说明。总之,螺旋霉素生物合成途径的基因是从生二素链霉菌的基因组DNA文库中分离得到的。通过使用BamHI限制性酶对生二素链霉菌基因组DNA进行部分消化获得了该文库。将大的DNA片段,平均35-45kb,克隆入由粘粒pWED15(Wahl等,1987)衍生的粘粒pWEDl(Gourmelen等,1998)中。^:用噬菌体颗粒将这些粘粒导入大肠杆菌。将如此获得的文库用对应于弗氏链霉菌tylB基因(Merson-Davies和Cundliffe,1994,GenBank登录号U08223)部分的探针(序列SEQIDNo.86)进行杂交。杂交之后,在与挥:针杂交的4个粘粒中更加具体地选择一个粘粒。然后用Sacl消化命名为pOS49.1的该粘粒,并将包含与该探针杂交区域的3.3kb片段亚克隆入载体pUC19并测序。鉴定出了4个开放阅读框并且其中一个编码与弗氏链霉菌TylB蛋白质(SEQIDNo.87)呈现强相似性的蛋白质(SEQIDNo.29)(参照图25)。该基因命名为orf3(SEQIDNo.28)并在生二素链霉菌中失活该基因。有可能证明其中orB基因失活的克隆不再产生螺旋霉素。这表明orf3基因或定位于下游的基因参与螺旋霉素生物合成。一旦上述方面已经得到确认,将粘粒pOS49.1的较大区域,即以前研究的SacI片段的任意一侧,进行测序。因此,有可能从粘粒pOS49.1获得包含7个完整开放阅读框和定位于这7个完整开放阅读框任意一侧的其它2个不完整开放阅读框区域的序列。通过在数据库中搜索,可表明一个不完整开放阅读框对应于srmG基因座(编码称为"聚酮化合物合酶"(PKS)的酶的区域)。利用S.Burgett等,1996(美国专利5,945,320)的方法将相应基因进行亚克隆。而且,在数据库中没有发现其它开放阅读框,命名为orfl,orf2,orf3,orf4,orf5,orf6和orf7(SEQIDNo.23,25,28,30,34,36,40)的7个完整的ORF和命名为or仿(序列SEQIDNo.43)的第8个ORF的起点。随后,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉菌基因组片段的其它粘粒。为此,使用3个探针在菌落上进行了另外一系列杂交。第1个探针对应从pOS49.1亚克隆的包含orfl,orf2和orf3起点的3.7kbDNA片段。第2个探针对应从pOS49.1亚克隆的包含orf7—部分和or仿一部分的2kbDNA片段。还使用了第3个探针。后一探针对应含有srmD基因的1.8kbDNA片段。srmD基因是从生二素链霉菌分离得到的能够赋予螺旋霉素抗性的基因。具体而言,先前的研究已使得能够克隆生二素链霉菌的几个抗性决定簇,所述抗性决定簇赋予灰浅红黄链霉菌菌林(螺旋霉素-敏感菌林)螺旋霉素抗性(Pemodet等,1993)(Pernodet等,1999)。为了分离抗性基因,已经在粘粒pKC505中产生了生二素链霉菌菌林基因组DNA的粘粒文库(RichardsonMA等,1987)。已经将该粘粒库导入天然对螺旋霉素敏感的灰浅红黄链霉菌。如此已经获得了5个能够赋予灰浅红黄链霉菌阿泊拉霉素抗性和螺旋霉素抗性的粘粒。在这5个粘粒中,命名为pOS44.1的粘粒,在其插入片段中含有srmD基因,该基因编码的蛋白质与生米卡链霉菌mdmA基因所编码的且在该生产者中参与麦迪霉素抗性的蛋白质(Hara等,1990,GenBank登录号A60725)(图26)呈现某种相似性。用于定位螺旋霉素生物合成基因的第3个探针是包含srmD基因的大约1.8kb片段的插入。将这三个探4f用于杂交上述的基因组DNA文库并且有可能选出两个粘粒(pSPM7和pSPM5),它们倾向于含有最长的插入片段并且没有共同的条带。粘粒pSMP5与第一和第二个探针杂交,但不与第三个探针杂交,而粘粒pSPM7仅与第三个探针杂交。使用"鸟枪法序列分析"技术对这两个粘粒进行完全测序。这两个粘粒pSPM7和pSPM5插入的序列能够进行组合,尽管它们不重叠,但每个插入片段在其一个末端都包含已知的序列。具体而言,每个插入片段都包含一个编码称为"聚酮化合物合酶"(PKS)的基因的序列片段。S.Burgett等,1996(美国专利5,945,320)克隆了这五个基因(参照图2)。因此,有可能确定单一生二素链霉菌基因组DNA序列。SEQIDNo.1中给出了在5,位置从EcoRI位点起始定位于第一个PKS基因并且延伸至3,位置BamHI位点的30943个核普酸的序列(参照图2和3)。SEQIDNo.2中给出了在5'位置从Pstl位点起始并延伸至3,位置BstEII位点、定位于第五个PKS基因的11171个核苷酸的第二个区域。该区域是PKS基因下游区域(下游和上游由5个PKS基因的方向定义或以相同方向定向)(参照图2和3)。然后,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉菌基因组片段的其它粘粒(参照实施例18和19)。实施例1:大肠杆菌中生二素链霉菌菌林ATCC23877的基因组DNA文库的构建1.1.生二素链霉菌菌抹ATCC23877基因组DNA的提取。生二素链霉菌菌林ATCC23877(尤其可由美国典型培养物保藏中心(ATCC)(Manassas,Virginia,USA)获得,保藏号为23877)培养于YEME(酵母提取物-麦芽浸膏)(Kieser,T等,2000),并按照裂解和沉淀的标准技术(KieserT等,2000)提取并纯化该菌林的基因組DNA。1.2.基因组DNA文库的构建用BamHI限制性酶部分消化如上分离的生二素链霉菌菌林ATCC23877基因组DNA,从而获得大小在大约35和45kb之间的DNA片段。将这些片段克隆入预先用BamHI消化了的粘粒pWEDl(Gourmelen等,1998)。通过删除含有在哺乳动物中具活性的表达模件的4.1kbHpal-Hpal片段(Gourmelen等,1998),从粘粒pWE15(Wahl等,1987)得到粘粒pWEDl。然后,利用Promega公司出售的"PackageneADNA包装系统,,,按照制造商推荐的步骤,在体外将连接混合物包装入入噬菌体颗粒内。将所得到的噬菌体颗粒用于感染Stratagene公司(LaJoHa,California,USA)出售的大肠杆菌SURE⑧菌林。由于粘粒pWEDl赋予了氨苄青霉素抗性,所以在LB培养基+氨苄青霉素(50照/ml)的平板上筛选克隆。实施例2:生二素链霉菌中参与螺旋霉素生物合成的基因的分离和表征2.1生二素链霉菌ATCC23877基因组文库大肠杆菌克隆的菌落杂交将上面得到的文库的大约2000个大肠杆菌克隆转移到滤膜上进行杂交。用于杂交的探针包含弗氏链霉菌一部分tylB基因的Nael-NaelDNA片段(SEQIDNo.86)。该片段对应于L.A.Merson画Davies和E.Cundliffe所述的核苷酸2663-3702的DNA片段(L.A.Merson-Davies和E.Cundliffe,1994,GenBank登录号U08223),其中tylB基因的编码序列对应于核苦酸2677-3843。使用随机引物技术(Roche公司出售的试剂盒)用32P标记弗氏链霉菌tylB基因部分的Nael-NaelDNA片段(SEQIDNo.86),并将其作为探针杂交文库的2000个克隆,转移至滤膜上。所用的膜是Amersham公司(AmershamBiosciences,Orsay,France)出售的HybondN尼龙膜并且在Church和Gilbert(Church和Gilbert,1984)所述的緩沖液中在55。C进行杂交。在2XSSC中55'C洗涤15分钟,然后55'C在0.5XSSC中连续洗两次,每次15分钟。在这些杂交和洗涤条件下,在2000个杂交克隆中有4个克隆呈现强杂交信号。将这4个克隆培养于LB培养基+氨千青霉素(50照/ml)中,并且通过标准碱性裂解(Sambrook等,1989)提取相应的4个粘粒。然后证明了杂交确实是由于存在于这4个粘粒中插入的DNA片段。为此,分别用几种酶(BamHI,Pstl和Sacl)消化粘粒。在琼脂糖凝胶上分离消化产物,转移到尼龙膜上,并且在上述相同的条件下与包含弗氏链霉菌tylB基因部分(参照上面)的NaeI-NaeIDNA片段杂交。这有可能验证这4个粘粒并且更加具体而言是选择这些粘粒中的一个且命名为pOS49丄2.2验证所鉴定区域的参与和对粘粒pOS49.1插入部分的序列分析亚克隆粘粒pOS49.1插入部分的几个片段并确定它们的序列。用Sacl酶消化粘粒pOS49.1,并且通过在上述条件下进行的Southern印迹表明3.3kb片段包含与tylB探针杂交的区域。通过从0.8%琼脂糖凝胶上电洗脱分离该3Jkb片段,然后将其克隆入栽体pUC19(GenBank登录号M77789)并测序。如此得到的质粒命名为pOS49.ll。使用FramePlot程序(J.Ishikawa和K.Hotta,1999),在该片段中能够鉴定出4个呈现典型的链霉菌密码子选择的开放阅读框(两个完整的和两个截短的开放阅读框)。利用FASTA程序(参见(W.R.Pearson&D.JLipman,1988)和(W.R.Pearson,1990),尤其可自法国Evry的INFOBIOGEN资源中心获得)进行的序列比较使得能够表明由这4个开放阅读框之一推导出的蛋白质与弗氏链霉菌TylB蛋白质(SEQIDNo.87;GenBank登录号U08223)呈现强序列相似性(参照图25)。该蛋白质命名为Orf3(SEQIDNo.29)。为了测试相应基因(orf3基因(SEQIDNo.28))是否参与生二素链霉菌中的螺旋霉素生物合成,用fthyg盒(M-H.Blondelet-Rouault等,1997,GenBank登录号X99315)打断该基因。为此,用Xhol酶消化质粒pOS49.ll,并将包含这4个开放阅读框(两个完整的和两个截短的开放阅读框,包括全长orB)的片段亚克隆入Stratagene公司(LaJoHa,California,USA)出售的载体pBCSK+的Xhol位点。如此得到的质粒命名为pOS49.12。为了失活orf3,通过钝末端克隆将fthyg盒克隆入后一质粒以代替orf3内的PmlI-BstEII片段。为此,用PmII和BstEII酶消化质粒pOS49.12,在orf3基因编码序列中仅有一个PmlI和BstEII位点。通过用Klenow酶(DNA聚合酶I大片段)处理相应载体片段的末端产生钝末端。通过用BamHI酶消化质粒pHP45fthyg(Blondelet-Rouault等,1997,GenBank登录号X99315)得到Qhyg盒。在琼脂糖凝胶上回收相应fthyg盒的片段,并且通过用Klenow酶处理使其末端成为钝末端。将如此获得的两个钝末端片段(ilhyg盒和质粒pOS49.12)连接并将连接产物用于转化大肠杆菌细菌。如此得到的质粒命名为pOS49.14并且该质粒包含用已Hhyg盒间断的orfi基因。将以Xhol-Xhol片段形式存在且其两端通过Klenow酶处理形成非粘性末端的质粒pOS49.14插入片段克隆入质粒pOJ260的EcoRV位点(质粒pOJ260是能够在大肠杆菌中复制而不能在生二素链霉菌中复制的接合质粒(M.Bierman等,1992)。该质粒在大肠杆菌和链霉菌中赋予阿泊拉霉素抗性)。所得到的质粒(将质粒pOS49.14的插入片段克隆入质粒pOJ260)命名为pOS49.16。使用接合的大肠杆菌菌林S17-1,如Mazodier等(Mazodieretal.,1989)所述,通过接合将后一质粒转移入生二素链霉菌菌林ATCC23877。大肠杆菌菌林S17-l来源于大肠杆菌菌林294(Simon等,l983)(Simon等,l986)。有可能获得反式接合克隆,这些克隆具有Qhyg盒所携带的潮霉素抗性标记并且已丢失了载体pOJ260所携带的阿泊拉霉素抗性标记。为此,接合之后,选择具有潮霉素抗性的克隆。然后将潮霉素-抗性克隆分别传代培养于具有潮霉素(抗生素B)和具有阿泊拉霉素(抗生素A)的培养基上(参照图9)。大体而言,对潮霉素(HygR)具有抗性且对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生了双重重组事件并因此而拥有被Qhyg盒间断的orB基因的克隆。通过两个连续的杂交证明野生型oH3拷贝已由间断的拷贝所替换。因此,为了证明在所得克隆的基因组DNA中存在盒,用多种酶消化所得克隆的总DNA,在琼脂糖凝胶上进行分离,将其转移到膜上并与对应Qhyg盒(参照上面)的探针进行杂交。使用含有四个开放阅读框(两个完整的和两个截短的,包含全部orf3)的质粒pOS49.ll的Xhol-Xhol片段作为探针,进行第二次杂交。通过本领域技术人员熟知的任意方法,且尤其是通过利用适当寡核苷酸的PCR和对PCR产物的序列分析,也能够进行基因型的验证。选择了如此得到的一个orf3:.:lihyg克隆并将其命名为OS49.16,对该克隆的基因型已经进行了验证。使用下迷的生产量测试方法测定了如此所得OS49.16克隆的螺旋霉素产量(参照实施例15)。因此有可能证明该菌株不再产生螺旋霉素,证实orf3和/或定位于下游的基因例如orf4参与螺旋霉素生物合成。一旦已经得到这种证实,就对粘粒pOS49.1的较大区域,在以前研究的Sacl片段任意一側,进行了序列分析。因此,有可能从粘粒pOS49.1获得这个区域的序列,该区域包含七个完整开放阅读框和其它两个定位于这七个开放阅读框任意一侧的不完整开放阅读框。通过在数据库中搜索,有可能表明不完整开放阅读框之一对应于srmG基因座(编码称为"聚酮化合物,,(PKS)的酶的区域)。S.Burge"等,1996(美国专利5,945,320)克隆了相应基因。而且,在数据库中没发现其它开放阅读框七个完整ORF命名为orfl,orf2,orB,orf4,orf5,orf6和orf7(SEQIDNo23,25,28,30,34,36和40),和命名为orf8的第八个ORF的起点(SEQIDNo.43中给出了该orf的全部序列)。实施例3:参与生二素链霉菌中螺旋霉素生物合成的其它基因的分离和表征其次,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉茵基因組片段的其它粘粒。为此,使用以下三个探针进行了另外一系列菌落杂交國所使用的第一条探针对应3.7kb的含有PKS基因片段的BamHI-PstIDNA片段(S.Burgett等,1996(美国专利5,945,320)克隆了相应PKS基因),从pOS49.1亚克隆的orfl、orf2和orB起点,涵盖定位于SEQIDNo.1中定义为位置1的EcoRI位点上游1300个碱基对的BamHI位点,到定位于2472位置(SEQIDNo.l)的Pstl位点。将该BamHI-PstI片段从pOS49.1亚克隆入质粒pBCSK+,这使得有可能得到质粒pOS49.28。画所使用的第二条探针对应大约2kb的含有orf7和orf8片段的Pstl-BamHIDNA片段,该片段是从pOS49.1亚克隆得到的,涵盖从定位于SEQIDNo.1的6693位置的Pstl位点到定位于SEQIDNo.1的8714位置的BamHI位点。将该Pstl-BamHI片段从pOS49.1亚克隆入质粒pBCSK+,这使得有可能得到质粒pOS49.76。画还使用了第三条探针。该探针对应1.8kb的包含srmD基因的EcoRI-HindIIIDNA片段。srmD基因是从生二素链霉菌分离得到的能够赋予螺旋霉素抗性的基因。具体而言,先前的研究已经使得能够克隆生二素链霉菌的几个抗性决定簇,所述抗性决定簇赋予灰浅红黄链霉菌(S.griseofuscus)菌林(螺旋霉素敏感菌林)螺旋霉素抗性(Pernodet等,I993)(Pernodet等,1999)。为了分离抗性基因,已经在粘粒pKC505中制备了生二素链霉菌菌株ATCC23877基因组DNA的粘粒文库(M.A,Richardson等,1987)。因此,为了得到大小在大约30和40kb之间的片段,已经用Sau3AI对生二素链霉菌菌林ATCC23877基因组DNA进行了部分消化。已经将如此消化的基因组DNA(3照)与预先用BamHI酶消化的1jugpKC505进行连接(Pernodet等,1999)。然后将连接混合物体外包装入噬菌体颗粒中。所获得的噬菌体颗粒已经用于感染大肠杆菌菌株HB101(尤其可自美国典型培养物保藏中心(ATCC)(Manassas,Virginia,USA)获得,保藏号为33694)。已经收集了大约20000个阿泊拉霉素抗性大肠杆菌克隆并且已经提取了这些克隆的粘粒。通过原生质体转化已经将该粘粒库导入灰浅红黄链霉菌菌株DSM10191(K丄.Cox和R.H.Baltz,1984),该菌林天然对螺旋霉素敏感(R.N.Rao等,1987,该菌抹尤其是从德国微生物和细胞培养物保藏中心(DeutscheSammlungvonMikro-organismenundZellkulturenGmbH,DSMZ),(Braunschweig,Germany)获得的,编号为DSM10191)。在含有阿泊拉霉素的培养基上筛选了转化体。已经将1300个在含有阿泊拉霉素的培养基上生长的克隆转移到含5照/ml螺旋霉素的培养基上。有几个阿泊拉霉素抗性克隆生长于含螺旋霉素的培养基上,并且已经提取了这些菌落的粘粒并将其用于转化大肠杆菌和灰浅红黄链霉菌(Pernodet等,1999)。因此已经获得了5个能够赋予大肠杆菌阿泊拉霉素抗性并赋予灰浅红黄链霉菌阿泊拉霉素和螺旋霉素共同抗性的粘粒。在这5个粘粒中,确定了命名为pOS44.1的粘粒,在其插入片段中,含有基因(SEQIDNo.15),该基因所编码的蛋白质(SEQIDNo.16)与生米卡链霉菌mdmA基因所编码的蛋白质(SEQIDNo.88)呈现某种相似性;该基因命名为srmD(参照图26中所示的使用FASTA程序进行的比对(参照(W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),尤其可获自法国Evry的INFOBIOGEN资源中心))。为了分离包含于质粒pOS44.1中的抗性决定簇,用Sau3AI限制性酶部分消化该质粒以获得大小为大约1.5-3kb的片段,并将这些片段连接入用BamHI酶线性化的载体pIJ486中(Ward等,1986)。根据其在天然对螺旋霉素敏感的灰浅红黄链霉菌菌林DSM10191(参照上面)中赋予螺旋霉素抗性的能力选择质粒(R.N.Rao等,1987)。为此,通过原生质体转化,将相应的已连接入载体pIJ486中的pOS44.1Sau3AI片段的质粒库(参照上面)导入菌林DSM10191,并筛选其硫链丝菌肽抗性(由于pIJ486携带的tsr基因)。将生长于含硫链丝菌肽培养基上的克隆转移至含螺旋霉素培养基上。几个疏链丝菌肽抗性克隆也生长于含螺旋霉素的培养基上并提取这些菌落的质粒。选择能赋予抗性且含有大约1.8kb插入片段的质粒并命名为pOS44.2。由于载体中插入部分两侧存在Hindlll位点和EcoRI位点,所以能够容易地切除该1.8kb插入片段。将该1.8kbHindIII-EcoRI插入片段进行序列分析并将其含有的抗性基因命名为srmD。因此能够容易地将含有srmD基因的该片段亚克隆入用EcoRI-HindIII切开的载体pUC19(GenBank登录号M77789)中并将所得质粒命名为pOS44.4。该质粒中含有srmD基因的1.8kbHindIII-EcoRI插入片段用作探针以定位螺旋霉素生物合成基因(参照下面)。含有质粒pOS44.4的大肠杆菌DH5a菌林的样本保藏于国立微生物保藏中心[NationalCollectionofCulturesandMicroorganismsl(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2918。按照常规技术(Sambrook等,1989),将上面(参照实施例1)所获得的文库的大约2000个克隆转移至滤膜上以进行菌落杂交。使用随机引物技术(Roche出售的试剂盒)用32P标记上述三个探针并用于杂交文库的2000个克隆,然后转移至滤膜上。在Church和Gilbert(Church和Gilbert,1984)所述的緩冲液中在65。C进行杂交。用2XSSC65。C洗涤15分钟且然后用0.5XSSC65。C连续洗涤两次,每次洗涤15分钟。在这些杂交和洗涤条件下,所杂交的2000个克隆中的16个克隆与至少一个揮:针呈现强杂交信号。然而,没有与三个探针均杂交的粘粒。提取这16个粘粒并用BamHI限制性酶消化。将这些不同粘粒的限制性酶切图镨彼此进行比较使得选择出两个粘粒,它们倾向于含有最大插入区并且没有相同的条带。因此,选择这两个粘粒,一个命名为pSPM5并且另一个命名为pSPM7。粘粒pSPM5与探针orfl-orf4和探针or仿杂交,但不与探针srmD杂交。pSPM7仅与探针srmD杂交而不与其它两个探针杂交。使用"鸟枪序列分析"技术对这2个粘粒进行完全序列分析。尽管这2个粘粒pSPM7和pSPM5,插入部分的序列不重叠,但在每个插入部分的一个末端都包含已知序列,所以能够将这2个粘粒插入部分的序列进行组合排列。具体而言,每个插入部分都包含一个编码称为"聚酮化合物合酶"(PKS)的酶的基因的序列片段。S.Burgett等,1996(美国专利5,945,320)克隆了这5个基因(参照图2)。因此,有可能确定单个生二素链霉菌基因组DNA序列。SEQIDN。1中给出了30943个核苷酸的序列,该序列在5,位置从定位于第一个PKS基因中的EcoRI位点起始并延伸至3,位置的BamHI位点。该序列对应PKS基因上游的区域(参照图2和3)。SEQIDNo.2中给出了11171个核苦酸的笫二序列区域,该区域从5,位置Pstl位点起始并延伸至3'位置定位于第五个PKS基因中的Ncol位点。该第二序列区域是PKS基因下游的区域(由全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图2和3)。实施例4:参与螺旋霉素生物合成的基因的核苷酸序列分析、开放阅读框的确定和表征使用FramePlot程序分析所得序列(J.Ishikawa和K.Hotta1999)。这有可能从开放阅读框中鉴定出呈现典型的链霉菌密码子选择的开放阅读框。该分析有可能确定该区域包含定位于编码"聚酮化合物合酶"(PKS)的5个基因任意一侧的35个ORF。在这些基因的下游和上游分别鉴定出10个和25个ORF(由全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图3)。因此,在5个PKS基因上游鉴定出占据大约31kb区域的该类型25个开放阅读框(SEQIDNo.1和图3)并且在PKS基因下游鉴定出占据大约11.1kb区域的该类型10个开i文阅读框(SEQIDNo.2和图3)。上游区域的基因命名为orfl,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orfllc,orfl2,orfl3c,orfl4,orfl5c,orfl6,orfl7,orfl8,orfl9,orf20,orf21c,orf22c,orf23c,orf24c和orf25c(SEQIDNo23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82和84)。下游区域的基因命名为orfl*c,orO*c,orf3*c,orf4*c,orf5*,orf6*,orf7*c,orf8*,orf^和orflO*(SEQIDNo3,5,7,9,11,13,15,17,19和21)。对于所讨论的ORF,加到基因名称中的"c"意思是指编码序列是反方向的(因此编码链是与SEQIDNo.1或SEQIDNo.2中所给出的这些基因的序列互补的链)(参照图3)。使用各种程序将由这些开放阅读框所推导出的蛋白质序列与多种数据库中所存在的那些序列进行比较BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索、COGs(ClusterofOrthologousGroups)(这三个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)得到)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995)),(这两个程序尤其可以从INFOBIOGEN资源中心,Evry,France得到)。这些比较使得能够明确描述关于这些基因产物的功能假说和鉴定那些可能参与螺旋霉素生物合成的基因。实施例5:基因失活构建敲除生二素链霉菌菌林的原则所用方法包括进行基因置换。如图9中所示,用能赋予抗生素(例如阿泊拉霉素或潮霉素)抗性的盒打断的靶基因的拷贝替换要打断的耙基因。所使用的盒在任意一倒紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。将盒插入耙基因可以伴有或者可以不伴有在该靶基因中的删除。盒两侧区域的大小可以从几百个到几千个碱基对。用盒失活基因所需的构建体是在大肠杆菌中获得的,大肠杆菌是获得重组DNA构建体的参照有机体。在能够在大肠杆菌中复制而不能在链霉菌中复制的质粒中得到被打断的基因。然后将构建体亚克隆入载体以允许转化和生二素链霉菌中目的基因的失活。为此,使用了两种质粒pOJ260(M.Bierman等,1992)(参照实施例2),该质粒在大肠杆菌和链霉菌中赋予阿泊拉霉素抗性并且当靶基因用能赋予潮霉素抗性的盒打断时使用该质粒。pOSK1205(4726bp)。该质粒来源于质粒pBK-CMV(由Stratagene公司(LaJolla,California,USA)出售),其中含有编码新霉素/卡那霉素抗性的序列的AvrII片段已经由编码潮霉素抗性的序列代替,而同时保留了PSV40启动子。为此,用Notl和Pflml酶消化质粒pHP45-ilhyg(Blondelet-Rouault等,1997),并且当已经用Klenow酶处理使所有末端成为钝末端后,将赋予潮霉素抗性的片段亚克隆入载体pBK-CMV的AvrII位点。在pOSK1205中,pSV40启动子在赋予潮霉素抗性的盒前面。该质粒在大肠杆菌和链霉菌中赋予潮霉素抗性并且在靶基因被赋予阿泊拉霉素抗性的盒打断时使用。通过该靶基因中存在的限制性酶切位点进行克隆,或者通过上述短的相同序列之间的重组,例如通过Chaveroche等(M.K.Chaverocheetal.,2000)的方法,将盒导入耙基因中。然后,例如通过大肠杆菌和链霉菌之间的接合作用(P.Mazodier等,1989),能够将携带着被盒打断的基因的质粒导入生二素链霉菌。当基本载体是载体pOJ260时使用该技术。为了增加如Oh和Chater(Oh&Chater,1997)所述重组的频率,也可以使用第二个技术通过碱处理变性DNA(T.Kieser等,2000)后的原生质体转化技术。当基本载体是pOJ260或pOSK1205时使用该技术(参照下面)。然后用相应于耙基因中所存在的盒的抗生素(参照图9,抗生素B)筛选这些转化体。如此选择出克隆混合物,其中已经通过一次或两次重组事件进行了整合。接下来,找出了对载体中所存在的抗性基因(重组盒之外)的抗生素(参照图9,抗生素A)敏感的克隆。因此原则上有可能筛选出一些这样的克隆,其中已经进4亍了两次重组事件,导致野生型基因由被盒打断的拷贝所替换。这些步骤图解显示于图9。几个盒能够用于打断靶基因。例如能够使用赋予潮霉素抗性的flhyg盒(Blondelet-Rouault等,1997,GenBank登录号X99315)。实施例6:在orf3基因中具有同相敲除的生二素链霉菌菌抹的构建已经用ilhyg盒打断orf3基因(参照实施例2.2),并且有可能证明orf3:.:Qhyg菌林不再产生螺旋霉素,这证实所克隆区域的一个或多个基因参与螺旋霉素生物合成(参照实施例2.2)。考虑到它们的方向,可共转录ORFl-7(参照图3),并且所观察到的表现型(非螺旋霉素生产菌)可能是由于一个或多个与or!3共转录的基因的失活。为了证实orf3参与螺旋霉素生物合成,进行了orf3基因的另一次失活,后一失活是同相进行的。为此,删除了orf3内504个碱基对的DraIII片段。将由pOS49.1得到的DNA片段克隆入质粒pOJ260(M.Bierman等,1992),该DNA片段涵盖从位于位置1(SEQIDNo.l)的EeoRI位点到位于位置5274(SEQIDNo.l)的Sacl位点,并且在位置2563和3067的两个DraIII位点之间包含删除(去除了504个核苷酸)。如此获得的质粒命名为pOS49.67。所以pOS49,67的插入部分包括生二素链霉菌的下迷DNA片段,该片段包含orfl基因、orO基因、具有同相删除的orf3基因、orf4基因和orf5的一部分。其中对该插入部分进行亚克隆的载体是pOJ260,因此质粒pOS49.67可赋予阿泊拉霉素抗性并通过原生质体转化将其导入菌林OS49.16(参照实施例2)。由于菌株OS49.16是潮霉素抗性的,得到了hygR和apraR转化体。将此类克隆在非选择培养基上传代两次后,就找到了对阿泊拉霉素和潮霉素(apraS和hygS)敏感的克隆。在一些克隆中,同源序列之间的重组事件事实上预期导致用载体上存在的具有同相删除的orf3拷贝替换用!2hyg盒打断的orf3拷贝(包含于菌林OS49.16基因组中)。除去载体序列后期望由该重组得到的克隆是apraS和hygS。通过杂交或者通过PCR和PCR产物序列分析能够获得该菌林的基因型(证明在所得克隆的基因组中仅存在一个同相删除的orf3拷贝)。因此获得了仅具有同相删除的orf3拷贝的克隆并证实了它们的基因型。更加特别地是还筛选到呈现预期特性的克隆并命名为OS49.67。菌林OS49.67的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,<呆藏日为2002年7月10日,保藏号为1-2916。实施例7:具有orf8基因中的敲除的生二素链霉菌菌林的构建为了进行orf8基因失活,获得了其中将fthyg盒导入orf8编码序列的构建体。为此,首先构建了质粒pOS49.88。通过将含有orf7末端、or仿和orf9起始端的3.7kb片段(从粘粒pSPM5得到的PstI-EcoRI片段)克隆入pUC19的PstI-EcoRI位点,从pUC19(GenBank登录号M77789)得到质粒pOS49.88。通过用Klenow酶处理〗吏所有末端钝末端化后,将Qhyg盒(以通过用Klenow酶处理钝末端化的BamHI片段的形式)克隆入定位于orf8的pOS49.88的唯一Sail位点。由于克隆是钝末端的,依赖于盒插入的方向获得了两种类型的质粒pOS49.106,其中hyg和or伤基因是同向的,和pOS49.120,其中hyg和orf8基因是反向的。然后将质粒pOS49.106的插入部分亚克隆入质粒pOJ260,以产生pOS49.107。为此,用Asp7181酶消化质粒pOS49.106并且通过用Klenow酶处理使末端钝末端化;用Pstl酶再次消化该消化产物并且将含有其中已插入^ihyg盒的orf8基因的片段克隆入载体pOJ260(参照上面)。为此,用EcoRV和Pstl酶消化栽体pOJ260并用于连接。由于这两个片段中的每一片段均为一侧是钝末端而另一侧是Pstl酶切末端,因此该操作使得能够获得定向连接。所得质粒命名为pOS49.107。通过原生质体转化将质粒pOS49.107导入生二素链霉菌菌林ATCC23877(T.Kieser等,2000)。原生质体转化之后,篩选具有潮霉素抗性的克隆。然后分别在含有潮霉素(抗生素B)的培养基和含有阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。基本上,对潮霉素(HygR)具有抗性而对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生双交换事件并且含有由ilhyg盒打断的or仿基因的克隆。通过Southern印迹法验证了由fthyg盒打断的or仿拷贝代替了or仿野生型拷贝。因此,为了验证所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应Qhyg盒的探针进行杂交。使用质粒pOS49.88的PstI-EcoRI插入部分作为探针,该部分大小为大约3.7kb,包含orf7末端、orf8和orf9起始部分,进行第二次杂交。通过本领域技术人员熟知的任意方法,且尤其是通过利用适当寡核苷酸进行的PCR和对PCR产物进行序列分析,能够进行基因型的验证。筛选出or仿::nhyg克隆并命名为OS49.107。菌抹OS49.107的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为I2917。实施例8:构建orfl0基因中具有敲除的生二素链霉菌菌林通过以生二素链霉菌基因组DNA为模板,使用以下引物进行PCR获得了orf10基因内1.5kbDNA片段SRMR1:5,CTGCCAGTCCTCTCCCAGCAGTACG3'(SEQIDNo.89)S腹R2:5,TGAAGCTGGACGTCTCCTACGTCGG3,(SEQIDNo.90)将来自PCR的DNA片段克隆入Invitrogen公司(Carlsbad,California,USA)所出售的栽体pCR2.1。如此获得的质粒命名为pOS49.32。通过用Klenow酶处理将所有末端钝末端化之后,将Qhyg盒(以BamHI片段形式,参照上面)克隆入orfl0基因片段内唯一的BstEII位点。由于克隆是钝末端的,根据盒插入的方向获得了两种类型的质粒pOS49.43,其中hyg和orfl0基因是同向的,和pOS49.44,其中hyg和orflO基因是反向的。将质粒pOS49.43的插入部分(以Asp718I-Xbal片段形式,通过用Klenow酶处理已将其末段钝末端化了)转移入质粒pOJ260的EcoRV位点,这使得有可能获得质粒pOS49.50。将含有已由!2hyg盒打断的orfl0基因片段的质粒pOS49.50导入生二素链霉菌菌林ATCC23877。转化后,筛选具有潮霉素抗性的克隆。然后分别在含有潮霉素(抗生素B)的培养基和含有阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。原则上,对潮霉素(HygR)具有抗性而对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生双交换事件并且含有由ilhyg盒打断的orfl0基因的克隆。如此获得了含有盒携带的潮霉素抗性标记而丢失了载体pOJ260携带的阿泊拉霉素抗性标记的克隆。通过Southern印迹法验证了由orfl0::l"ihyg盒打断的orflO拷贝代替or仿野生型拷贝的事件。因此,为了验证所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应Qhyg盒的探针进行杂交。以orf!0基因中1.5kbPCR产物作为探针进行第二次杂交(参照上面)。更加特别地是篩选到了呈现出预期特性(orflO::Qhyg)的克隆并命名为OS49,50。通过两轮杂交,实际上有可能验证Qhyg盒确实存在于该克隆的基因组中,并且验证了当双重组事件之后,在该克隆的基因组中用由fthyg盒打断的拷贝替换野生型基因的情况下,确实获得了预期的消化谱。通过本领域技术人员熟知的任意方法,且具体而言是通过利用适当寡核苷酸的PCR和对PCR产物的序列分析,也能够进行基因型的验证。实施例9:基因失活按照"可切除盒"技术构建敲除的生二素链霉菌菌林的原理(参照图9和10)能够用于基因失活的第二种类型的盒称为"可切除盒"的盒。这些盒具有这样的优点在被导入生二素链霉菌基因组后,通过位点专一重组事件能够在链霉菌中将其切除。目的是失活链霉菌菌林中的某些基因而在最终的菌林中不丢失选择标记或存在不属于该菌林的大DNA序列。切除后,仅大约30左右碱基对(称为"瘢痕"位点)的短序列保留在菌林基因组中(参照图10)。实施该系统首先包括将野生型靶基因拷贝用其中已插入可切除盒的构建体(通过两个同源重组事件,参照图9)替代。该盒的插入同时伴随有乾基因中的删除(参照图9)。其次,进行从菌林基因组切除可切除盒。可切除盒通过位点专一重组系统行使功能,并且具有获得最终不携带抗性基因的链霉菌突变体的优点。也避免了表达定位于失活基因下游的基因的极性效应(参照图10)。已经描述了可切除盒的应用并且可切除盒可用于多种有机体,包括哺乳动物细胞和酵母细胞、以及大肠杆菌中(Bayley等,1992;Bnmelli和Pall,1993;Camilli等,1994;Dale和Ow,1991;Russell等,1992;Lakso等,1992)。这些可切除盒全部4吏用对lox位点起作用的Cre位点专一重组酶。该重组系统源于Pl细菌噬菌体。为了在链霉菌中构建"可切除盒"型系统,开发了用于生二素链霉菌可动遗传因子pSAM2(Boccard等,1989a和b)的位点专一重组系统。该系统的建立最初包括构建含有被打断基因的重组载体,其中插入了可切除盒。将可切除盒插入靶基因伴随有把基因中的删除。通过使用乾基因中所存在的限制性酶切位点进行克隆,或者通过例如Chaveroche等(ChaverocheMK等,2000)所述的短相同序列之间的重组,能够进行这种插入。例如,使用Qhyg盒能够构建可切除盒(BlondeletRouault等,1997)。该盒边缘是attR和attL序列,这两个序列正常情况下位于整合的pSAM2拷贝的侧翼(参照图15)。attR和attL序列包含允许切除pSAM2或位于这两个区域之间的任意DNA片段的位点专一重组所需的全部位点(Sezonov等,1997,Raynal等,1998)。很明显,此种盒的构建不局限于使用ilhyg盒,其它抗性盒也可以用作基本盒以构建此种盒(例如Qaac或Qvph盒(BlondeletRouault等,1997))。已经获得该构建体后,用该重组质粒转化链霉菌菌林。然后使用针对耙基因中所存在的盒的抗生素筛选转化体(参照图9,抗生素B,例如如果可切除盒来源于Qhyg盒,这涉及使用潮霉素筛选)。因此筛选了其中已经通过单一或两次重组事件进行整合的克隆混合物。随后,找到了对针对载体中存在的抗性基因(重组盒外面)的抗生素(参照图9,抗生素A)敏感的克隆。因此由可能筛选到这样一些克隆,其中基本上已经进行了两次重组事件,导致野生型基因被由盒打断的基因拷贝所替换。图9中图解说明了这些步骤;通过Southern印迹法验证了如此所得克隆的基因型并筛选出了呈现预期特性(由可切除盒打断的拷贝替换了野生型基因)的菌林。其次,用允许xis和int基因表达的质粒转化上面所筛选到的菌株,xis和int基因对于attR和attL位点之间的位点专一重组都是必需的。该重组导致可切除盒通过重组事件离开菌林基因组(参照图10)(Raynal等,1998)。从在链霉菌中相对稳定的载体(例如来源于链霉菌载体pWHM3的载体,(Vara等,1989))中选择携带xis和int基因的载体是有利的,这使得有可能获得这样的菌林,在缺乏选择压力条件下进行几个芽孢形成循环后,该菌林丟失了后一载体。为了切除盒,例如有可能使用质粒pOSV508(参照图14),通过原生质体转化将该质粒导入含有可切除盒打断的基因的生二素链霉菌菌林。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),在该质粒中已经加入了pSAM2的xis和int基因(F.Boccard等,1989b),并置于ptrc启动子的控制之下(E.Amann等,1988)。将置于ptrc启动子控制之下的xis和int基因从质粒pOSint3亚克隆入质粒pWHM3(Raynal等,1998)(参照图14)。将携带有pSAM2xis和int基因的质粒pOSV508导入突变体菌林,将允许通过位点专一重组,在盒两侧的attL和attR位点之间进行可切除盒的有效切除(A.Raynal等,1998)(图10)。在这些转化体中,选择对硫链丝菌肽产生抗性并对盒存在所产生抗性的抗生素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生(参照图10)。切除是有效的并且观察到90%以上的转化体属于该种类型。在缺乏硫链丝菌肽的固体培养基上经过一轮以上生长和芽孢形成循环后,获得了已丢失质粒pOSV508的克隆。通过它们对疏链丝菌肽的敏感性能够检测这些克隆。通过PCR和对PCR产物的序列分析能够验证所删除的靶基因的序列。最后,所得到的菌株,在失活的耙基因内(例如内部删除),携带一个对应最小attB位点的"瘢痕"att位点(Raynal等,1998),该位点来源于attR和attL位点之间的重组。该残余的最小attB位点与生二素链霉菌、始旋链霉菌(Streptomycespristinaespiralis)和浅青紫链霉菌中天然存在的该位点相似(Sezonov等,1997)。期望其失活的基因能够与定位于下游的其它基因共转录。为了避免对操纵子下游基因的表达具有极性效应的基因之一的失活,重要的是切除盒之后获得同相删除。上述可切除盒系统使得有可能满足该需求。实际上,本领域的技术人员可以很容易地构建三个不同的可切除盒,所述盒在切除之后分别残存33、34或35个核苷酸的序列,且在任何阅读框中都不含终止密码子。如果知道了靶基因的序列和与盒插入部分相关的删除部分的大小,则有可能在这三个可切除盒之间进行选择以至于切除产生同相删除。在所加入的33、34或35个核苷酸中有26个核苷酸对应于最小attB序歹'J(参照图27)。关于本申请,^使用了两个可切除盒。这两个盒如下attUlhyg+(SEQIDNo.91)和att3Qaac國(SEQIDNo,92);切除后这些盒分别残存33和35个核苷酸。它们分别包含fthyg盒或llaac盒,+和-符号对应抗性盒的方向。构建这两个盒并将其克隆入载体pBCSK+的EcoRV位点,其HindIII位点被预先删除。所得质粒分别命名为pattlilhyg+和patt3ftaac-。通过用EcoRV消化质粒,能够很容易地获得可切除盒。实施例10:构建orf2基因中具有敲除的生二素链霉菌菌抹使用可切除盒技术进行orf2基因的失活(参照上面)。所用起始菌林是来源于菌抹ATCC23877的生二素链霉菌菌林OSC2。然而,菌林OSC2不同于菌抹ATCC23877,因为菌林OSC2已经丟失了可移动的遗传因子pSAM2(Boccard等,1989a和b)。在原生质化作用(溶菌酶消化细菌壁和片段化菌丝体的作用(Kieseretal.,2000))和菌林ATCC23877原生质体再生期间,可能自发性丢失该可移动因子。为了选择已经丢失了pSAM2元件的克隆,基于KorSA转录抑制子对pra基因的抑制作用,建立了一种筛选(Sezonov等,1995)(G.Sezonov等,2000)。为此,将含有置于aph基因(赋予卡那霉素抗性并缺乏其自己的启动子)上游的pra基因启动子的DNA片段克隆入不稳定载体pWHM3Hyg,后者来源于质粒pWHM3(Vara等,1989),其中tsr基因已经由hyg基因(赋予潮霉素抗性)所替换。如此获得的质粒命名为pOSV510。当对菌林ATCC23877进行原生质体化作用后,用质粒pOSV510转化菌林ATCC23877。启动子Pra是一种受KorSA阻遏物阻遏的启动子,编码后者的基因被置于pSAM2可移动元件中(SezonovG.等,2000)。当用质粒pOSV510转化后,转化后的细菌由于其具有卡那霉素抗性(源于由pOSV510携带的aph基因)而被筛选出来。具有pSAM2整合元件丢失的克隆已经丢失了KorSA阻遏物,并且Pra启动子不再被阻遏并允许表达aph卡那霉素抗性基因。用质粒pOSV510转化后再用卡那霉素筛选使得有可能篩选出那些已丟失pSAM2整合元件(并且因此而丢失KorSA)并含有质粒pOSV510的克隆。由于质粒pOSV510不稳定,在不含抗生素条件下经过几轮芽孢形成之后,在含卡那霉素的培养基上、含潮霉素的培养基上和不含抗生素的培养基上传代培养所分离到的克隆。对卡那霉素和潮霉素敏感的克隆已经丟失了pOSV510。通过杂交和PCR验证了pSAM2元件的删除。选择到呈现预期特性的克隆并命名为OSC2。菌林OSC2的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2908。使用可切除盒技术进行orf2基因的失活(参照上面和图10)。为此,将4.5kb插入部分,其序列起始于定位于位置1的EcoRI位点,终止于定位于位置4521(SEQIDNo.l)的BamHI位点,亚克隆入来自粘粒pSPM5的质粒pUC19(GenBank登录号M77789)的EcoRI和BamHI位点。如此所得质粒命名为pOS49.99。将该质粒导入大肠杆菌菌林KS272,该菌林已含有质粒pKOBEG(Chaveroche等,2000)(参照图12)。与此平行,利用质粒pOSK1102(质粒pOSK1102是来源于载体pGP704Not的质粒(Chaveroche等,2000)(V.L.Miller和J.J.Mekalanos,1988),其中att3ilaac-盒已经作为EcoRV片段克隆入pGP704Not中唯一的EcoRV位点)作为才莫板并利用如下引物,通过PCR扩增att3ftaac-可切除盒(SEQIDNo.92,参照上面)ORF2AGCGCGCTTCGTTCGG隱3'(SEQIDNo.93)ORF2B5'GCTCCGTGCGTCATGCAGGAAGGTGTCGTAGTCGCGGTAGATCTGCCTCTTCGTCCCGAA-3'(SEQIDNo.94)定位于这些寡核苷酸5'末端的40个脱氧核苷酸包含对应于靶基因(本例子中是orf2)中序列的序列,并且定位于最3,位置的20个脱氧核苷酸(上面粗体所示)对应att3Ilaac-可切除盒一个末端的序歹'j(参照图11)。将如此获得的PCR产物用于转化含有上述质粒pKOBEG和pOS49.99的大肠杆菌菌林(Chaveroche等,2000)(参照图12)。因此,通过电穿孔转化细菌并筛选其阿泊拉霉素抗性。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3ftaac-)已经插入靶基因(orf2),即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化镨与预期消化镨相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM17。该质粒来源于pOS49.99,其中orf2已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orf2中编码部分的核苷酸211和492之间的删除。用EcoRI酶消化质粒pSPM17并通过用Klenow酶处理将末端钝末端化;然后用Xbal酶消化该消化该产物并将含有经删除orf2基因的插入部分克隆入载体pOSK1205(参照上面)。为此,用BamHI酶消化载体pOSK1205并通过用Klenow酶处理将末端钝末端化;然后用Xbal酶消化该消化该产物并将其与如上从pSPM17获得插入部分连接。由于这两个片段的每一个在一侧是钝末端且另一侧是Xbal末端,因此该操作使得有可能获得定向连接。如此获得的质粒命名为pSPM21;它携带潮霉素抗性基因(载体部分)和其中具经删除的orf2基因已由att3S2aac-盒替换的插入部分。通过原生质体转化(T.Kieser等,2000)将载体pSPM21导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生一个双交换事件并含有由att3ftaac-盒间断orf2基因的克隆。选择到这些克隆并验证了盒打断拷贝对orf2野生型拷贝的替换。通过菌落PCR验证了att3ilaac-盒的存在。还进行了杂交。为此,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应质粒pOS49.99插入部分EcoRI-BamHI片段的探针进行杂交(参照上面)。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。选择呈现预期特性的克隆并命名为SPM21。利用PCR和杂交,有可能证明该克隆基因组中确实存在att3ilaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3ilaac-盒打断拷贝替换野生型基因后所预期得到的消化镨。因此该克隆具有基因型orf2::att3Qaac-。菌林SPM21的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2914。为了产生盒的切除,通过原生质体转化法,用载体pOSV508转化菌林SPM21(参照图14)。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),其中已经加入了pSAM2(F.Boccard等,1989b)的xis和int基因并置于ptrc启动子的控制之下(E.Ama肌等,1988)(参照图14)。通过位点专一重组,将携带pSAM2xis和int基因的质粒pOSV508导入菌林SPM21允许有效切除该盒两侧attL和attR位点之间的可切除盒(A.Raynal等,1998)(图10)。在这些转化体中,选择对疏链丝菌肽产生抗性并对阿泊拉霉素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生,阿泊拉霉素抗性由att3Qaac-盒所携带的抗性基因赋予;事实上切除导致阿泊拉霉素抗性基因的删除(参照图10)。质粒pOSV508是不稳定的并且,在不含抗生素的培养基上进行两轮连续传代之后,在含硫链丝菌肽的培养基上和不含硫链丝菌肽的培养基上传代培养所分离的克隆。石克链丝菌肽敏感克隆已经丢失了pOSV508。通过PCR和PCR产物序列分析,验证了切除该盒确实导致orf2基因中的同相删除;切除盒事实上留下了特征"瘢痕"att3序列(attL和attR位点之间发生重组之后,该序列与attB的起始位点相似)5,ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT3,(SEQIDNo.95)。如此获得的具有预期基因型(orf2::att"的菌林命名为SPM22。菌林SPM22的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2915。实施例ll:构建orfl2基因中具有敲除的生二素链霉菌菌林为了失活orfl2、orfl3c和orfl4,相同的起始质粒(pSPM504)用于在不同的位置导入"可切除盒,,类型的盒。该质粒包含对应从orf7到orfl7区域的15.1kb插入部分。为了构建该质粒,将从消化粘粒pSPM7(参照上面)得到的15.1kbBglII片段克隆入用BamHI消化的质粒pMBL18(Nakano等,1995)。由于BamHI和BglII末端是兼容的,连接后得到质粒pSPM502。然后将pSPM502的全部插入部分(以HindlII/Nhel片段形式)亚克隆入质粒pOSK1205(用HindlII/Nhel消化),这使得有可能获得质粒pSPM504。将该质粒导入已经含有质粒pKOBEG的大肠杆菌菌林KS272(Chaveroche等,2000)(参照图12)。与此平行,利用质粒pOSK1102(质粒pOSK1102是来源于载体pGP704Not的质粒(Chaveroche等,2000)(V丄.Miller和J.J.Mekalanos,1988),其中att3Haac-盒已经作为EcoRV片段克隆入pGP704Not中唯一的EcoRV位点)作为模板并利用如下引物,通过PCR扩增att3naac-可切除盒EDR8:5,GCGCTTCGTTCGG3,(SEQIDNo.96)EDR9:5,TCTTCGTCCCGAA3,(SEQIDNo.97)定位于这些寡核苦酸5,末端的40个(对于EDR8仅39个)脱氧核苷酸包含对应于靶基因(本例子中是orf!2)中序列的序列,并且定位于最3,位置的20个脱氧核苷酸(上面粗体所示)对应于att3Qaac-可切除盒一个末端的序列(参照图11)。将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌林KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM507)。因此,通过电穿孔转化细菌并筛选其阿泊拉霉素抗性。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3Ilaac-)已经插入耙基因(orf12),即如果在PCR产物和耙基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化语与预期消化谱相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM507。该质粒来源于pSPM504,其中orfl2已由att3Qaac-盒打断(参照图12)。盒的插入伴随着orfl2中的删除,打断开始于orfl2的第三十个密码子。盒后面保存了orfl2最后46个密码子。通过原生质体转化(T.Kieser等,2000)将载体pSPM507导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性篩选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3Qaac-盒打断的orfl2基因的克隆。更加特别的是选择到这些克隆并通过杂交验证了盒打断拷贝对orfl2野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3Qaac-盒的探针进行杂交。以通过PCR获得的且对应orfl2基因编码序列非常大部分的DNA片段作为探针,进行了第二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。更加具体而言篩选到呈现预期特性的克隆(orf!2::att3ilaac-)并命名为SPM507。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att3ftaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Qaac-盒打断的拷贝替换野生型基因后所预期得到的消化谦。因此该克隆具有基因型orfl2::att3Qaac-并命名为SPM507。给出了这些基因的方向(参照图3),不需要切除该盒以研究orfl2失活的效应。具体而言,orfl3c与orfl2以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除筛选标记的可能性成为可能,尤其是通过转化质粒pOSV508。菌抹SPM507的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,^f呆藏日为2002年7月10日,保藏号为1-2911。实施例12:构建orfl3c基因中具有敲除的生二素链霉菌菌林利用质粒pOSKl102(参照上面)作为模板,并使用以下引物,通过PCR扩增att3Qaac-可切除盒EDR3:5,CTCTTCGTCCCGAA3,(SEQIDNo.98)EDR4:5'GCGCGCTTCGTTCGG3,(SEQIDNo.99)定位于这些寡核苷酸5,末端的40个脱氧核苷酸包含对应靶基因(本例子中是orfl3c)中序列的序列,并且定位于最3,位置的20个脱氧核香酸(上面粗体所示)对应att3ftaac-可切除盒一个末端的序列(参照图11)。将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌林KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM508)。因此,通过电穿孔法用该PCR产物转化细菌并筛选阿泊拉霉素抗性的克隆。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3ftaac-)已经插入靶基因(orfl3c),即如果在PCR产物和耙基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化镨与预期消化镨相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM508。该质粒来源于pSPM504,其中orfl3c已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orfl3c基因中的删除,打断开始于orfl3c的第六个密码子。盒后面保留了orfl3c最后3个密码子。通过原生质体转化(T.Kieser等,2000)将载体pSPM508导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3ilaac-盒打断的orfl3c基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对orfl3c野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3ilaac-盒的探4十进4亍杂交。以对应涵盖orfl3c编码序列上游和下游大约一百个碱基对序列的PCR产物作为探针,进行了笫二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCT产物序列分析,也能够进行基因型的^ii。更加具体而言篩选到呈现预期特性的克隆(orfl3c::att3Qaac-)并命名为SPM508。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att3Qaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Qaac-盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型orfl3c::att3Qaac-并命名为SPM508。给出了这些基因的方向(参照图3),不需要切除该盒以研究orf!3c失活的效应。orfl4与orf!3c以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除篩选标记的可能性成为可能。菌林SPM508的样本保藏于国立孩t生物保藏中心(CNCM)巴斯德研究所,25,meduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2912。实施例13:构建orfl4基因中具有敲除的生二素链霉菌菌林利用质粒pOSK1102(参照上面)作为模板,并使用以下引物,通过PCR扩增att3Qaac-可切除盒EDR5:GCGCGCTTCGTTCGG3,(SEQIDNo.100)EDR6:CCTCTTCGTCCCGAA3,(SEQIDNo.101)定位于这些寡核苷酸5'末端的40个脱氧核苷酸包含对应靶基因(本例子中是orfl4)中序列的序列,并且定位于最3'位置的20个脱氧核苷酸(上面粗体所示)对应att3ftaac-可切除盒一个末端的序列(参照图11)。将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌林KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM509)。因此,通过电穿孔法用该PCR产物转化细菌并筛选阿泊拉霉素抗性的克隆。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3flaac-)已经插入耙基因(orf14),即如果在PCR产物和革巴基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,且尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM509。该质粒来源于pSPM504,其中orfl4已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orfl4基因中的删除,打断开始于orfl4的第四个密码子。盒后面保留了orfl3c最后的密码子。通过原生质体转化(T.Kieser等,2000)将载体pSPM509导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性篩选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3Qaac-盒打断的orfl4基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对orfl4野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3ilaac-盒的探针进行杂交。以对应涵盖orfl4编码序列上游和下游大约一百个碱基对序列的PCR产物作为探针,进行了第二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCT产物序列分析,也能够进行基因型的-验证。更加具体而言筛选到呈现预期特性的克隆(orfl4::att3ftaac-)并命名为SPM509。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att311aac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Haac-盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型orfl4::att3Qaac-并命名为SPM509。给出了这些基因的方向(参照图3),不需要切除该盒以研究orfl4失活的效应。orfl5c与orfl4以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除筛选标记的可能性成为可能。菌林SPM509的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedexl5,法国,保藏日为2002年7月10日,保藏号为1-2913。实施例14:构建orf6+基因中具有敲除的生二素链霉菌菌林使用可切除盒技术进行orf6A基因的失活(参照上面和图10)。为此,使用粘粒pSPM7作为模板并使用以下寡核苷酸扩增orf6A基因的片段C9583:5,CTGCAGGTGCTCCAGCGCGTCGATCT3,(有意寡核苷酸)(SEQIDNo.102)C9584:5,CTGCAGACGGAGGCGGACCTGCGGCT3,(反义寡核苷酸)(SEQIDNo.103)定位于这些寡核普酸3,末端的20个脱氧核苦酸对应定位于orf6+基因编码部分的序列(SEQIDNo.13)并且定位于最5,位置的6个脱氧核苷酸对应利于克隆的Pstl位点的序列。扩增的DNA片段大小为约1.11kb。将PCR产物克隆入栽体pGEM-TEasy(由Promega公司(Madison,Wisconsin,USA)出售),这使得有可能获得命名为pBXLllll的质粒(参照图16)。然后将attUlhyg+可切除盒导入orf6头基因编码序列。为此,用Smal和Asp7181限制性酶消化质粒pBXLllll并用Klenow酶处理消化产物。该操作使得有可能在0^6*基因编码序列内产生120bp的内部删除(参照图15)。此外,在限制性酶切位点的两侧,分别保留了511bp和485bp的orf6*序列,这将允许进行同源重组以失活orf6+基因。通过用EcoRV消化该质粒,从质粒pattlQhyg+(参照上面)制备得到attlQhyg+可切除盒。然后将后者亚克隆入如上所述预先制备(Smal和Asp718I消化并且然后用Klenow酶处理)的载体pBXLllll。所得质粒命名为pBXL1112(参照图17)。在该构建体中,0忖6*基因包含120bp的删除并^f皮attlQhyg+盒打断。然后用Pstl酶(该位点在盒边側,从而存在于PCR寡核苷酸中)消化质粒pBXL1112,并且然后将含有已由attlQhyg+盒打断的orf6头部分的3.7kbPstl插入片段克隆入质粒pOJ260的Pstl位点(参照上面)。如此得到的质粒命名为pBXL1113。通过原生质体转化(T.Kieser等,2000)将载体pBXL1113导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其潮霉素抗性筛选这些克隆。然后分别在含有潮霉素(抗生素B)的培养基上和含阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。原则上,对潮霉素具有抗性(HygR)并对阿泊拉霉素敏感(ApraS)的克隆是那些其中已经发生双交换事件并含有由attlQhyg+盒打断的orf6+基因的克隆。更加具体而言是选择到这些克隆并通过Southern印迹技术验证了盒打断拷贝对orf6+野生型拷贝的替换。因此,为了证明所得克隆的基因組DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应hyg基因的探针(通过PCR获得)进行杂交。利用由质粒pBXLllll获得的含有orf6+基因的Pstl-Pstl插入片段(大小为大约1.1kb)作为探针,进行了第二次杂交(参照上面和图16)。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。更加具体而言筛选到呈现预期特性(orf6乞:attlDhyg+)的克隆并命名为SPM501。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在attlQhyg+盒并且确实获得了在该克隆基因组中由于双重组事件后用attlQhyg+盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型orf6^:attlDhyg+并命名为SPM501。菌林SPM501的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2909。为了切除盒,通过原生质体转化,用载体pOSV508转化菌林SPM501(参照图14)。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),在该质粒中已经加入了pSAM2的xis和int基因(F.Boccard等,1989b),并置于ptrc启动子的控制之下(E.Amann等,1988)。将携带有pSAM2xis和int基因的质粒pOSV508导入菌林SPM501,将允许通过位点专一重组,在盒两側的at仏和attR位点之间进行可切除盒的有效切除(A.Raynal等,1998)(图10)。在这些转化体中,选择对疏链丝菌肽产生抗性并对潮霉素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生,潮霉素抗性由attlQhyg+盒所携带的抗性基因赋予;事实上该切除导致抗性基因的删除(参照图10)。质粒pOSV508是不稳定的并且,在不含抗生素的培养基上经过两轮连续传代后,将所分离到的克隆在含硫链丝菌肽的培养基上和不含硫链丝菌肽的培养基上传代培养。硫链丝菌肽敏感克隆已经丟失了pOSV508。通过PCR和PCR产物序列分析,-睑证了在orf6A基因中确实同相发生了盒的切除。打断开始于第158个密码子,删除了40个密码子(120bp),盒的切除保留了33bp的特征性"瘢痕"attl序列5'ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT3'(SEQIDNo.104)。如此获得的且具有预期基因型(orf6乞:attl)的菌林命名为SPM502。菌林SPM502的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2002年7月10日,保藏号为1-2910。实施例15:在orf2、orf3、or仿、orf10、orfl2、orfl3c、orfl4或orf6*基因内具有敲除的生二素链霉菌菌林的分析为了测试所获得的多株茵林的螺旋霉素产量,研发了基于藤黄微球菌菌林敏感性的微生物学测试(参照(A.Gourmelen等,1998))。所用藤黄微球菌菌林衍生自天然对螺旋霉素敏感的菌株DSM17卯(该菌株尤其可获自德国微生物和细胞培养物保藏中心(DeutscheSammlungvonMikro-organismenundZellkulturenGmbH,DSMZ),(Braunschweig,Germany),保藏号为DSM1790);因为本测试中所用菌林对杀刚锥虫素具有抗性,所以不同于菌林DSM1790。该菌抹是通过在含有渐增剂量杀刚锥虫素的培养基上进行选择而获得的自发突变林。鉴于生二素链霉菌产生螺旋霉素和杀刚锥虫素二者的事实,篩选到了该菌林。由于目的是为了使用基于藤黄微球菌菌林敏感性的微生物学测试对所获得的多林菌林的螺旋霉素产量进行测定,所以有必要得到杀刚锥虫素-抗性菌林。将所要测试的多林链霉菌菌林培养于含有70mlMP5培养基的具档板500ml锥形瓶(带档板的锥形瓶)中(Pemodet等,1993)。将多林生二素链霉菌菌林以2.5x106芽孢/ml的起始浓度接种于带档板的锥形瓶中并在27'C250转/分钟定轨振荡生长培养48、72和96小时后取出2ml悬浮液样本并离心。然后将各种上清液冻存于-20。C。将用无菌培养基10倍稀释的这些上清液用于测试(参照图18)。将对杀刚锥虫素具有抗性而对螺旋霉素敏感的藤黄微球菌指示菌在含有5fig/ml杀刚锥虫素的2TY培养基(Sambrook等,1989)中37。C培养48小时。测定培养物的光密度(OD)并稀释该培养物以将光密度调整至4。将0.4ml该预培养物稀释于40mlDAM5培养基(Difco抗生素培养基5,由Difco公司出售)中,预先使温度达到大约45°C。然后将该培养基倒入12x12cm平亚中并将其置于室温。一旦培养基冷却并凝固,将直径为12mm的WhatmanAA滤纸盘(参照A.Gourmelen等,1998)用70jil10倍稀释的每种上清液浸湿,并放置于平皿表面。将用不同浓度(在MP5培养基中2-4-8ng/ml)螺旋霉素溶液浸湿的滤纸盘用作标准滤纸盘。为了允许抗生素分散入琼脂,将这些平皿置于4'C2小时并且然后在3"C孵育24-48小时。如果该滤纸盘含有螺旋霉素,螺旋霉素扩散进入琼脂并抑制藤黄微球菌指示菌的生长。这种抑制作用在滤纸盘周围产生"晕",该晕反映了藤黄微球菌菌林不生长的区域。因此该晕的存在是螺旋霉素存在的指示,并且使得有可能确定对应所讨论的滤紙盘的生二素链霉菌菌林是否是或者不是螺旋霉素生产菌。将所获得的抑制直径与标准滤纸盘的抑制直径相比较使得有可能获得由该菌林产生的螺旋霉素的量的指示。为了检测其螺旋霉素产量,该测试中使用了先前实施例中所述的多林菌抹。所得结果归纳于表38。表38<table>tableseeoriginaldocumentpage119</column></row><table>这些结果使得有可能得出与参与螺旋霉素生物合成的各种基因的功能相关的一定数量的结论。因此,orB基因对于螺旋霉素生物合成是必需的。具体而言,该基因内的同相失活导致形成不再产生螺旋霉素的菌林(OS49.67,(参照实施例6))。同相失活使得有可能放弃导入的盒有可能影响定位于orf3下游的基因表达这一假说。同样地,由于菌林OS49.107和OS49.50具有非生产菌表现型,所以or仿和orf10基因编码螺旋霉素生物合成所必需的蛋白质。此外,在这两个菌林中,由于考虑到不同orf的方向(参照图3),很明显负责该非生产菌表现型的相应基因是失活的,所导入的构建体不可能具有极性效应。对具有可切除盒的菌林的研究使得有可能得出一定数量与被打断基因的功能相关的结论。菌抹SPM507具有基因型orf!2::att3Qaac-。考虑到基因的方向(参照图3),认为没有必要切除盒以研究orfl2失活的效应。orfl3c与orfl2以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM507的表现型是非生产菌;因此可以由其推断出orfl2基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。菌林SPM508具有基因型orfl3c::att3Qaac-。考虑到基因的方向(参照图3),认为没有必要切除盒以研究orfl3c失活的效应。orfl4与orfl3c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM508的表现型是生产菌;因此可以由其推断出orfl3c基因不是生二素链霉菌中螺-旋霉素生物合成所必需的基因。菌林SPM509具有基因型orfl4::att3Qaac-。考虑到基因的方向(参照图3),i人为没有必要切除盒以研究orfl4失活的效应。orfl5c与orfl4以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM509的表现型是非生产菌;因此可以由其推断出orfl4基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。菌林SPM21具有基因型orf2::a"3Qaac-。该菌林具有螺旋霉素非生产菌表现型。然而,基因orfl到or伤的方向暗示这些基因是共转录的。因此,所观察到的表现型可能是由于导入orf2的盒对定位于该操纵子下游的基因的表达具有极性效应。菌抹SPM22具有基因型orf2::att3,并且是所导入的盒同相切除后获得的。盒的切除仅残留了特征性"瘢痕"序列(参照实施例IO)。由于菌林SPM22也具有非生产菌表现型,可以由其得出结论orf2基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。这里仅观察了由orf2失活引起的效应。菌林SPM501具有基因型orf6*::attlQhyg+。该菌抹具有螺旋霉素非生产菌表现型。然而,由于orf5+和orf6A基因(参照图3)具有相同的方向,所观察到的表现型可能是由于导入orf6^的盒对orf5+的表达具有极性效应。这些基因的排列暗示它们可能是共转录的。为了回答该问题,同相切除所导入的盒后获得了菌林SPM502。在该菌林中,仅观察了由orf6A失活引起的效应。该菌林具有基因型orf6*::attl(参照实施例14)。盒的切除仅残留了同相"瘢痕"序列(参照实施例14)。菌林SPM502具有生产菌表现型(然而,该菌林仅产生螺旋霉素I(参照*实施例16))。因此可以由其得出结论orf5A基因是生二素链霉菌中螺旋霉素生物合成所必需的基因,由于在菌抹SPM501中将它间接失活导致非生产菌表现型。另一方面,orf6+基因不是生二素链霉菌中螺旋霉素I生物合成所必需的基因(另一方面,它是产生螺旋霉素II和III所必需的(参照实施例16))。实施例16:所获得的突变体菌林中螺旋霉素I、II和III产量的测定将所要测试的多林菌林各自培养于7个含有70mlMP5培养基(Pernodet等,1993)的500ml具档板锥形瓶中。将多林生二素链霉菌菌林以2,5xl06芽孢/ml接种于锥形瓶中并在27。C250转/分钟定轨振荡生长72小时。收集对应相同克隆的培养物,任选地通过打褶的滤器过滤,并7000转/分钟离心15分钟。然后将各种上清液储存于-30°C。通过离子配对高压液相色镨(HPLC)进行测定。培养基的HPLC分析使得有可能精确测定三种形式螺旋霉素的浓度。用Nucleosil辛基接枝的二氧化硅相填充所用柱子(Macherey-Nagel)。颗粒大小为5并且孔大小为100A。柱子的内径为4.6mm且长度为25cm。流动相是H;jP04緩冲液(pH2.2)和含有6.25g/LNaC104高氯酸盐的乙腈以70/30(v/v)混合的混合物。以固定的1m!7分钟的流速在恒溶剂系统中进行分析。将柱子温控于23。C。在238nm通过紫外分光光度计检测。在+10'C冷藏样品并通过峰的面积测定定量(通过外部校准)。在这些情况下,螺旋霉素I、II和III的保留时间分别是大约17;21和30分钟,这使用含有三种形式螺旋霉素的商品化样本能够进行证明。菌林OSC2具有螺旋霉素生产菌表现型。使用它作为亲本菌林以获得具有可切除盒的菌林(参照实施例15)。因此该菌林用作产生三种形式螺旋霉素的阳性对照。很明显该菌林产生三种形式的螺旋霉素,通过HPLC证明了这一点(参照图19)。研究具有可切除盒的菌林使得有可能得出一定数量有关所打断基因的功能的结论。菌林SPM507具有基因型orfl2::att3Qaac-。菌抹SPM507的表现型是非生产菌(参照实施例15);因此可以由此推断出orfl2基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌林不再产生螺旋霉素,这通过HPLC可以证明(参照图22)。该结果证实螺旋霉素生物合成中orfl2基因的必要性。菌林SPM508具有基因型orfl3c::att3Qaac-。菌林SPM508的表现型是螺旋霉素生产菌表现型(参照实施例15);因此可以由此推断出orfl3c基因不是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌林产生螺旋霉素I、II和III,这通过HPLC可以证明(参照图23)。该结果证实orf!3c基因不是生二素链霉菌中螺旋霉素I、II和III生物合成所必需的基因。菌抹SPM509具有基因型orfl4::att3Qaac-。菌株SPM509的表现型是非生产菌;因此可以由此推断出orfl4基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌林不再产生螺旋霉素,这通过HPLC可以证明(参照图24)。该结果证实螺旋霉素生物合成中orfl4基因的必要性。菌林SPM501具有基因型orf6*::attlQhyg+。该菌林具有螺旋霉素非生产菌表现型。该菌株不再产生螺旋霉素,这通过HPLC可以证明(参照图20)。然而,由于orf5头和orf6A基因(参照图3)具有相同的方向,所观察到的表现型可能是由于导入orf6+的盒对操纵子中orf5A表达的极性效应。这暗示这些基因是共转录的。为了回答该问题,通过切除导入的盒,使得在or6+基因中产生同相删除而恢复orf5A的表达,获得了菌林SPM502。该菌林具有基因型orf6、:attl(参照实施例14和15)。盒的切除仅残留了同相"瘢痕"att序歹'j(参照实施例14)。菌林SPM502具有螺旋霉素生产菌表现型。然而,如通过HPLC所证明,该菌林仅产生螺旋霉素I而不产生螺旋霉素II和III(参照图21)。因此由这些结果可以推论出orf5*基因是生二素链霹菌中螺旋霉素生物合成所必需的基因,由于在菌林SPM501中将它间接失活导致螺旋霉素非生产菌表现型(参照图20)。另一方面,01伤*基因不是生二素链霉菌中螺旋霉素I生物合成所必需的基因,由于失活该基因导致螺旋霉素I生产菌表现型(参照图21)。然而,orf6力是产生螺旋霉素II和III所必需的(参照实施例16)。因此很明显orf6免基因编码负责在位置3修饰platenolide的酰基转移酶(参照图1)。实施例17:确定orf10的翻译起始位点和提高螺旋霉素产量17.1质粒pSPM523、pSPM524和pSPM525的构建在生二素链霉菌中鉴定了orflO基因并由Geistlich等(M.Geistlich等,1992)命名为srmR。进行了orfl0基因的失活(参照实施例8)。因此有可能表明所得菌林不再产生螺旋霉素(参照实施例15)。这证实orf10基因显然参与螺旋霉素生物合成。因此显然由该基因所编码的蛋白质对于螺旋霉素生物合成是必需的。然而,序列分析显示定位于相同阅读框中的2个ATG密码子可以用于orf10的翻译(参照图28)。2个可能的密码子之一(最上游的密码子)起始于SEQIDNo.1中所给出序列的10656位置,而另一个可能的密码子,定位于较下游,起始于10809位置(参照SEQIDNo.1)。在测试过量表达srmR对螺旋霉素产量的可能作用之前,重要地是首先确定翻译起始位点。为了确定翻译起始位点,产生了含有三种形式orflO的三个构建体。通过利用含有HindIII限制性酶切位点或含有BamHI限制性酶切位点的寡核苷酸的PCR获得了这几种形式。用于扩增的第一对引物对应以下寡核苷酸EDR39:GC3,(SEQIDNo.122)(粗体表示HindIII位点)EDR42:GC3,(SEQIDNo.123)(粗体表示BamHI位点)1该对引物EDR39-EDR42允许扩增orfl0片段,其含有定位于最3'位置的ATG(SEQIDNo.1中所给出序列的10809位置)(参照图28)。所得片段大小为大约2kb并且后来被称为"短orfl0";该片段不含orf10启动子。将该2kb片段克隆入载体pGEM-Teasy,以产生质粒pSPM520。用于扩增的笫二对引物对应以下寡核苷酸EDR40:C3,(SEQIDNo.124)(粗体表示HindIII位点)EDR42:GC3,(SEQIDNo.123)(粗体表示BamHI位点)该对引物EDR40-EDR42允许扩增orfl0片段,其含有定位于最5,位置的ATG(SEQIDNo.1中所给出序列的10656位置)(参照图28)。将该2.2kb片段,后来被称为"长orfl0"克隆入载体pGEM-Teasy,以产生质粒pSPM521;该质粒不含orfl0启动子。用于扩增的第三对引物对应以下寡核苷酸EDR41:5'-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTCAAGT-3,(SEQIDNo.125)(粗体表示HindIII位点)EDR42:5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3,(SEQIDNo.123)(粗体表示BamHI位点)该对引物EDR41-EDR42允许扩增具有两个ATG的orfl0基因,并且还含有其自己的启动子(参照图28)。将该2.8kb片段,下文中被称为"原orfl0"克隆入载体pGEM-Teasy,以产生质粒pSPM522。利用菌抹OSC2染色体DNA作为模板获得了"原orfl0"片段。利用预先纯化的"原orfl0"片段DNA作为模板获得了"短orfl0"和"长orfl0"片段自身。然后将质粒pSPM520、pSPM521和pSPM522的HindIII-BamHI插入片段亚克隆入用HindlII-BamHI酶预先消化了的载体pUWL201(来源于质粒pUWL199(U.F.Wehmeier,1995)的质粒,其中已经导入了ermE启动子区域的KpnI-BamHI片段(参照Bibb等,1985,具体而言是图2),该片段携带有增加启动子强度的突变(ermEA启动子)(Bibb等,l"4)(参照Doumith等,;2000))。因此,获得了三个质粒pSPM523(来源于pUWL201,其具有"短orflO"形式的插入部分)、pSPM524(来源于pUWL201,其具有"长orflO"形式的插入部分)和pSPM525(来源于pUWL201,其具有"原orflO"形式的插入部分)(图28)。17.2用构建体pSPM523、pSPM524和pSPM525转化菌林OS49.50:通过原生质体转化作用(T.Kieser等,2000),分别用质粒pSPM523、pSPM524和pSPM525转化菌林OS49.50(在orflO基因中具有敲除的菌林,参照实施例8)。通过用不含插入部分的质粒pUWL201转化菌抹OS49.50也制备了阴性对照。原生质体转化之后,通过其硫链丝菌肽抗性筛选了这些克隆。通过提取这些质粒验证了使用每一种质粒转化的克隆。因此,获得了4林新菌林菌林OSC49.50pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;菌株OSC49.50pSPM523,来源于使用质粒pSPM523进行的转化;菌林OSC49.50pSPM524,来源于使用质粒pSPM524进行的转化;和最后菌林OS49.50pSPM525,来源于使用质粒pSPM525进行的转化。通过HPLC测试这四林菌林中每一林的螺旋霉素产量。为此,将所要测试的多林链霉菌菌林培养于含有70mlMP5培养基(Pernodet等,1993)的具档板的500ml锥形瓶(带档板的锥形瓶)中。当菌林含有质粒pUWL201或其衍生物之一时,加入5照/ml硫链丝菌肽。将各种生二素链霉菌菌林以2.5x106芽孢/ml的起始浓度接种于带档板的锥形瓶中,并在27。C以250转/分钟定轨振荡孵育这些培养物96小时。然后通过离心从培养基中分离细胞并通过HPLC(参照实施例16)分析上清液以测定所产生的螺旋霉素的量。根据标准样品和测量峰的面积,有可能测定由这些菌株所产生的每种螺旋霉素的量。表39中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素的总产量(通过将螺旋霉素I、II和III的产量相加获得)。表39.来源于OS49.50的菌株的螺旋霉素产量,(结果表示为mg/1)。<table>tableseeoriginaldocumentpage126</column></row><table>如表39中给出的结果所示,阴性对照(用质粒pUWL201转化的菌株0849.50)不产生螺旋霉素。当将质粒pSPM523(其含有"短orf10,,形式)导入菌林OS49.50时,观察到无螺旋霉素产生。另一方面,存在质粒pSPM524(其含有"长orfl0"形式)和质粒pSPM525(其含有"原orfl0"形式)可恢复宿主菌林OS49.50中螺旋霉素的产生。因此,仅含有最上游ATG的orf10片段使得有可能恢复螺旋霉素合成作用。为了证实这些结果,用Xhol限制性酶(该酶在该质粒中具有唯一^"个位点,定位于两个ATG之间(参照图28))消化质粒pSPM521(含有"长orfl0"形式的质粒pGEM-Teasy)。然后通过Klenow酶处理使Xhol末端钝末端化。然后通过T4DNA连接酶的作用使质粒自身闭合,以形成质粒pSPM527。如果最上游的ATG(SEQIDNo.1中给出的序列位置10656)确实用作翻译起始位点,该处理将导致阅读框中在Xhol位点的移位并且将具有产生呈现无激活活性的蛋白质的作用。另一方面,如果翻译起始发生于最下游的ATG(SEQIDNo.1中给出的序列位置10809),该处理对Orfl0(已给出转录起始位点)的表达将具有很小或没有作用,并且对所产生的蛋白质也没有作用。然后pSPM527的BamHI-HindIII插入片段亚克隆入载体pUWL201,以产生质粒pSPM528。将该质粒导入菌株OS49.50并且更加具体而言是筛选到了具有预期质粒的克隆。然后通过HPLC测试所得菌林的螺旋霉素产量(参照实施例16和上面)。不同于使用质粒pSPM524所观察到的结果(参照表39),菌林OS49.50中存在质粒pSPM528不恢复螺旋霉素产量。这证实orflO基因的翻译起始位点是定位于最下游位置的ATG(ATG1,参照图28)。17.3提高生二素链霉菌菌林OSC2中的螺旋霉素产量为了测试过量表达orf10基因对螺旋霉素产量的影响,将质粒pSPM523、pSPM524、pSPM525和pSPM528导入菌林OSC2。为此,用质粒pSPM523、pSPM524、pSPM525和pSPM528分别独立地转化菌林OSC2的原生质体(T.Kieser等,2000)。通过用不含插入部分的质粒pUWL201转化菌林OSC2也制备了阴性对照。原生质体转化之后,通过其硫链丝菌肽抗性筛选了这些克隆。通过提取这些质粒验证了使用每一种质粒转化的克隆。这样,获得了五个新的菌林菌林OSC2pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;菌林OSC2pSPM523,来源于使用质粒pSPM523进行的转化;菌林OSC2pSPM524,来源于使用质粒pSPM524进行的转化;菌林OSC2pSPM525,来源于使用质粒pSPM525进行的转化;和,最后,菌林OSC2pSPM528,来源于使用质粒pSPM528进行的转化。然后通过HPLC(以与实施例17.2相同的方式)分析了这些菌林的螺旋霉素产量。为了平行比较还进行了菌林OSC2螺旋霉素产量的分析。表40中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素的总产量(通过将螺旋霉素I、II和III的生产量相加获得)。表40.来源于OSC2的菌林的螺旋霉素产量,(结果表示为mg/1).<table>tableseeoriginaldocumentpage127</column></row><table><table>tableseeoriginaldocumentpage128</column></row><table>因此,观察到质粒pSPM524或质粒pSPM525的存在显著增加菌林OSC2的螺旋霉素产量。这清楚地证明过量表达OrflO对螺旋霉素产量具有正效应。另一方面,质粒pSPM528对螺旋霉素产量没有作用。以相同的方式,将质粒pSPM525和pUWL201导入菌林SPM502(参照实施例14)。这样,获得了两个新的菌抹菌林SPM502pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;和菌林SPM502pSPM525,来源于使用质粒pSPM525进行的转化。菌林SPM502pSPM525(该菌林含有质粒pSPM525,参照上面)的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年2月26日,保藏号为1-2977。通过HPLC(以与实施例17.2相同的方式)分析了这些菌林SPM502UWL201和SPM502pSPM525的螺旋霉素产量。为了平行比较还进行了菌林SPM502螺旋霉素产量的分析。表41中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素I的生产量。事实上,这些菌株中没有产生螺旋霉素II和III的菌林。表41.来源于SPM502的菌林的螺旋霉素I产量(结杲表示为mg/1).<table>tableseeoriginaldocumentpage128</column></row><table>因此,有可能观察到在菌林SPM502中过量表达orfl0基因显著增加螺旋霉素I的产量。实施例18:在大肠杆菌中构建位于粘粒pWED2中的生二素链霉菌菌株OSC2的基因组DNA文库。18.1粘粒pWED2的构建为了促进链霉菌中基因的失活,构建了携带质粒RK2oriT序列(该序列允许通过接合从适当的大肠杆菌菌林导入链霉菌)并携带在链霉菌中赋予可检测表现型的针对抗生素的抗性基因的粘粒。此种含有较大的生二素链霉菌基因组DNA插入片段的粘粒能够用于基因失活实验。为了构建该栽体,将pac-oriT盒(EcoRV片段)在唯一的Hpal位点导入来源于粘粒pWED15(Wahl等,1987)的粘粒pWEDl(Gourmelen等,1998)。通过PCR获得了pac-oriT盒。为此,通过PCR从质粒pVF10.4(Vara等,1985;Lacalle等,1989)扩增了pac基因,使用了作为第一引物的引物A(序列为5'-CCAGTAGATATCCCGCCAACCCGGAGCTGCAC-3,(SEQIDNo.126),EcoRV限制性酶切位点已在下面划线并且粗体的20个核苷酸序列对应pac基因启动子的上游区域),和作为第二引物的引物B(序列为5,GAAAAGATCCGTCATGGGGTCGTGCGCTCCTT-3,(SEQIDNo.127),在其5,末端,包含对应oriT序列起始端的12个核苷酸序列(双下划线)和对应pac基因末端的20个核苷酸序列(粗体)(参照图29,第一轮PCR)。关于oriT基因,通过PCR从质粒pPM803(P.Mazodier等,1989)扩增了该基因,使用了作为第一引物的引物C(序列为5,-CACGACCCCATGACGGATCTTTTCCGCTGCAT-3,(SEQIDNo.128)),该引物在其5,末端包含对应pac基因编码序列下游序列的12个核苷酸序列(粗体)和对应oriT序列起始端的20个核苷,列,和作为第二引物的引物D(序列为5,-GAGCCGGATATCATCGGTCTTGCCTTGCTCGT-3,(SEQIDNo.129)),该引物包含EcoRV限制性酶切位点(单下划线)和对应oriT序列末端的20个核苷酸序列(双下划线)(参照图29,第二轮PCR)。使用引物A和B获得的扩增产物和使用引物C和D获得的扩增产物,在它们的一个末端,含有24个核苷酸的共同序列。通过混合先前获得的这两个扩增产物和使用引物A和D作为引物,进行了第三轮PCR(参照图29,第三轮PCR)。这使得有可能获得对应pac+oriT组合的扩增产物。然后将pac-oriT片段克隆入栽体pGEM-TEasy(由Promega>司(Madison,Wisconsin,USA)出售),这使得有可能获得质粒pGEM-T-pac-oriT。然后将该质粒的插入部分亚克隆入粘粒pWEDl。为此,用EcoRV酶消化质粒pGEM-pac-oriT并将含有组合pac+oriT的EcoRV插入部分插入预先用Hpal酶切开的粘粒pWEDl。如此所得粘粒命名为pWED2(参照图30)。该粘粒使得其可利于链霉菌中基因的失活。具体而言,该粘粒携带oriT序列,该序列不仅允许通过接合从适当的大肠杆菌菌林导入链霉菌,还携带在链霉菌中赋予可检测表现型的针对抗生素的抗性基因。此种含有较大的生二素链霉菌基因组DNA插入片段的粘粒能够用于基因失活实验。因此,按照Chaveroche等,2000所述的技术,例如可以将含有耙基因的4汙生自pWED2的粘粒导入含有质粒pKOBEG的大肠杆菌菌林KS272(参照Chaveroche等,2000)并且盒将导入靶基因中。然后可以将通过该技术获得的粘粒(其中靶基因失活的粘粒)导入诸如S17.1菌林的大肠杆菌菌林或者使得有可能通过接合将含有oriT序列的质粒转移入链霉菌的任意其它菌林。大肠杆菌和链霉菌之间进行接合后,如实施例12中所述可以获得链霉菌克隆,其中靶基因的野生型拷贝已经由打断的拷贝所替换。存在于该新粘粒上的在链霉菌中表达的抗性基因是白黑链霉菌(Streptomycesalboniger)的pac基因(J.Vara等,1985;Lacalle等,1989),该基因编码嘌呤霉素N-乙酰基转移酶并赋予嘌呤霉素抗性。在基因失活实验中,找到了其中已经发生了双重组事件的克隆。这些克隆将已经去除了粘粒pWED2并且将因此已经变得又对噪呤霉素敏感。18.2在大肠杆菌中构建位于粘粒pWED2中的生二素链霉菌菌林OSC2基因组的DNA文库为了获得大小在大约35和45kb之间的DNA片段,使用BamHI限制性酶部分消化生二素链霉菌菌林OSC2的基因组DNA。然后将这些片段克隆入粘粒pWED2,后者已经预先用BamHI消化了,并且用碱性磷酸酶处理。然后利用Promega公司(Madison,Wisconsin,USA)出售的"PackageneXDNA包装系",按照制造商的推荐,将连接混合物体外包装于X噬菌体颗粒中。将所获得的噬菌体颗粒用于感染Stratagene公司(LaJolla,California,USA)出售的大肠杆菌菌抹SURE。在LB培养基+氨节青霉素(50fig/ml)平板上筛选这些克隆,粘粒pWED2赋予氨苄青霉素抗性。实施例19:分离包含覆盖螺旋霉素生物合成途径区域的新文库的粘粒、这些粘粒中片段的亚克隆和序列分析。19.1对生二素链霉菌OSC2基因组文库的菌落进行的杂交分离了生二素链霉菌OSC2的新文库的粘粒(参照实施例18),该文库覆盖orfi^到orflO*或覆盖orfl到orf25c的部分或全部,或覆盖orf25c更上游区域。为此,使用以下3个探针对按照实施例18所获得的大肠杆菌的菌落进行了依次杂交(参照图31):-所用的第一条探针对应通过PCR扩增到的大约0.8kbDNA片段,其中所述PCR使用粘粒pSPM5为模板,并使用了以下引物ORF23c:5,画ACGTGCGCGGTGAGTTCGCCGTTGC-3,(SEQIDNo.130)和ORF25c:5'-CTGAACGACGCCATCGCGGTGGTGC-3,(SEQIDNo.131)。如此获得的PCR产物包含含有orf23c起始端、orf24c全部和orf25c末端部分的片段(参照图31,探针I)。-所用的第二条探针对应通过PCR扩增到的大约0.7kbDNA片段,其中所述PCR使用生二素链霉菌菌林ATCC23877总DNA为模板,并使用了以下引物ORFl*c:5,-GACCACCTCGAACCGTCCGGCGTCA-3,(SEQIDNo.132)和ORF2承c:5,-GGCCCGGTCCAGCGTGCCGAAGC-3,(SEQIDNo.133)。如此获得的PCR产物包含含有orflL*c末端和orf2*c起始端部分的片段(参照图31,探针II)。画所用的第三条探4h对应通过消化质粒pOS49.99所获得的含有orfl、orf2和orf3的大约3kb的EcoRI-BamHI片段(参照图31,探针III)。按照常规技术(Sambrook等,1989),将实施例18.2中所获得文库的大约2000个克隆转移到滤膜上用于菌落杂交。转移到滤膜上之后,通过随机引物技术(Roche公司出售的试剂盒)用32P标记第一条探针(参照图31,探针I)并将该探针用于对文库的2000个克隆进行杂交。在Church和Gilbert(Church和Gilbert,1984)所述的緩沖液中65C时进行杂交。在含有0.1%SDS的2xSSC中65'C时进行两次洗涤,第一次洗涂10分钟且第二次20分钟,然后在含有0.1%SDS的0.2XSSC中65'C时进行持续30分钟的第三次洗涤。在这些杂交和洗涤条件下,在所杂交的2000个克隆中有20个克隆与第一条探针呈现强杂交信号。将这20个克隆培养于LB+氨苄青霉素(50照/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的20个粘粒并用BamHI限制性酶进行消化。然后将消化产物在琼脂糖凝胶上进行分离,转移至尼龙膜上并在上述相同条件下与第一条探针进行杂交(参照上面PCR产物ORF23c-ORF25c,探针I)。12个粘粒包含与所用探针强杂交的BamHI片段。这12个粘粒命名为pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44和pSPM45。用BamHI消化后,将这12个粘粒的消化语彼此相比较并与粘粒pSPM5的消化i普相比较。此外,使用对应在orfl-orf25c区域内已鉴定出来的不同基因的不同引物进行的PCR扩增实验使得有可能定位这些彼此相关的粘粒的插入部分并且也有可能确定已知orfl-orf25c区域内这些插入部分的位置(参照图32)。更加具体而言是选择到了粘粒pSPM36,该粘粒倾向于含有较大的orf25c上游区域(参照图31和32)。其次,4吏用与上迷条件相同的条件,用对应PCR产物ORF"c-ORF2、的第二条探针(参照图31,探针II)与生二素链霉菌OSC2文库的2000个克隆进行杂交。该杂交使得有可能分离到其插入部分定位于从orfPc到orfl0*c区域内的粘粒。在所用杂交条件下,在所杂交的2000个克隆中有16个克隆与第二条探针呈现强杂交信号。将这16个克隆培养于LB+氨千青霉素(50照/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的16个粘粒并用BamHI限制性酶进行消化。将这16个粘粒的消化谦(用BamHI消化之后)彼此相比较并与粘粒pSPM7的消化谱相比较。使用引物ORFl*c和ORF2*c进行的PCR扩增实验使得有可能选择到两个明显含有orfl*c和orf2*c基因的粘粒并且它们的消化谱既有相同的条带也有不同的条带。此外,使用对应在orfl*c到orfl0*c区域内已鉴定出来的不同基因的不同引物进行PCR扩增实验使得有可能定位这些彼此相关的粘粒的插入部分并且也有可能确定已知orfl*c到orflO*区域内这些插入部分的位置(参照图32)。更加具体而言筛选到的这2个粘粒命名为pSPM47和pSPM48(参照图32)。使用与上迷相同的条件,用对应质粒pOS49.99EcoRI-BamHIDNA片段的第三条探针(参照图31,探针III)与生二素链霉菌OSC2文库的2000个克隆进行杂交。该杂交使得有可能分离到含有从orfl至orf3区域的粘粒,并且这些粘粒倾向于含有PKS基因的较大部分或者含有螺旋霉素生物合成途径基因orfl到orf25c的较大部分。在这些杂交条件下,在所杂交的2000个克隆中有35个克隆与第三条探针呈现强杂交信号。将这35个克隆培养于LB+氨千青霉素(50ng/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的35个粘粒并用BamHI限制性酶进行消化。用BamHI消化之后,将这35个粘粒的消化镨彼此相比较并与粘粒pSPM5的消化谦相比较。此外,使用对应在orfl到orf25c区域内所鉴定出来的不同基因的不同引物进行的PCR扩增实验使得有可能确证这些粘粒已包含来自区域orfl到orf25c的插入片段,并且使得有可能定位这些粘粒的插入片段相互间的及相对于已知区域orfl到orf25c的位置(参照图32)。更加具体而言筛选到了5个粘粒,它们命名为pSPM50,pSPM51,pSPM53,pSPM55和pSPM56(参照图32)。19.2部分粘粒pSPM36插入片段的亚克隆和序列分析使用引物ORF23c和ORF25c通过PCR获得的大约0.8kb的探针(参照上面和图31,探针I)也用于对用Pstl酶消化了的生二素链霉菌OSC2总DNA进行Southern印迹实验。在上述杂交条件下,当对用Pstl酶消化了的生二素链霉菌OSC2总DNA进行杂交时,该探针显示单一一个大约6kb的Pstl片段。Pstl位点存在于orf23c区域内(参照SEQIDNo.80),但是直到已知序列的末端(BamHI位点)都不存在其它Pstl位点(参照SEQIDNo.l)。该Pstl-BamHI片段大小为大约1.4kb。因此该与用Pstl酶消化了的生二素链霉菌OSC2总DNA进行杂交的6kbPstl片段含有定位于orf25c上游的大约4.6kb区域。该区域倾向于含有其产物参与螺旋霉素生物合成途径的其它基因。通过消化验证了粘粒pSPM36确实含有该6kbPstl片段。为了确定orf25c更上游的序列,从pSPM36分离得到该片段。为此,用Pstl限制性酶消化粘粒pSPM36。通过电洗脱从0.8%琼脂糖凝胶上分离得到大小为大约6kb的Pstl-Pstl片段,并且然后将其克隆入载体pBK-CMV(4512bp)(由Stratagene公司(LaJolla,California,USA)出售)。如此获得的质粒命名为pSPM58(参照图33)并确定了其插入部分的序列。SEQIDNo.134中给出了该插入部分的序列。然而,并非所有序列都确定了,还有大约450个核苷酸的缺口未确定,在相应序列中序列未确定的部分用连续的"N"表示。19.3新核苦酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征使用FramePlot程序(J.Ishikawa和K.Hotta1999)分析了所得粘粒pSPM58的插入部分的序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定该插入部分包含orf25c上游的4个新ORF(参照图34)。这些基因命名为orf26(SEQIDNo.107)、orf27(SEQIDNo.109)、orf28c(SEQIDNo.111,该orf的序列未口未测序,这450个核苷酸以一系列"N"的形式出现于序列SEQIDNo.111)和orf29(对该orf的插入部分,序列是不完整的)。基因名称中加入"c"意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图34)。W鸟库中所存在的那些序列进行比较BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,19卯)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。19.4另一部分粘粒pSPM36插入片段的亚克隆和序列分析使用引物ORF23c和ORF25c通过PCR获得的大约0.8kb的探针(参照上面和图31,探针I)也用于与用Stul酶消化了的菌株OSC2总DNA进行Southern印迹实验。在上述用于该探针的杂交条件下,当对用StuI酶消化了的菌林OSC2总DNA进行杂交时,该探针显示单——个大约10kb的Stul片段。由于orf23c中存在Stul位点(参照SEQIDNo.80)并且该位点的定位与Pstl位点相关,所以该10kb片段包括先前研究的所有Pstl片段(pSPM58插入部分)并且使得有可能获得约4kb仍未研究的区域(参照图33)。通过消化验证了粘粒pSPM36确实含有该10kb的Stul片段。为了确定orf29末端的序列和orf29更上游其它基因的序列,从pSPM36分离得到该片段。为此,用Stul限制性酶消化粘粒pSPM36。通过电洗脱从0.8%琼脂糖凝胶上分离得到大小为大约10kb的Stul-Stul片段,并且然后将其克隆入载体pBK-CMV(4512bp)(由Stratagene公司(LaJolla,California,USA)出售)。如此获得的质粒命名为pSPM72(参照图33)。然后用EcoRI(pSPM58插入部分中的EcoRI位点)和HindIII(载体多克隆位点中的HindIII位点,紧接着插入部分末端的Stul位点之后)消化后一质粒(参照图33)。如此获得的EcoRI-HindIIIDNA片段对应质粒pSPM72插入部分的片段(参照图33)并将其亚克隆入预先用EcoRI和HindIII消化了的载体pBC陽SK十(由Stratagene公司(LaJolla,California,USA)出售)。如此所得质粒命名为pSPM73并确定了其插入部分的序列。SEQIDNo.135中给出了该插入部分的序列。SEQIDNo.106中给出了pSPM58和pSPM73插入部分的序列的组合排列。该序列起始于orf23c中的Pstl位点(参照SEQIDNo.80)并延伸至orB2c中的Stul位点(参照图34)。由于orf28c的序列(SEQIDNo.lll)是不完整的(参照实施例19.3),其中大约450个核苷酸的区域未进行序列分析,在序列SEQIDNo.106中这450个核苷酸以一系列"N"的形式出现。19.5新核苷酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征使用FramePlot程序(J.Ishikawa和K.Hotta1999)分析了所得粘粒pSPM73的插入部分的部分序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定包含4个ORF(—个不完整的和三个完整的ORF)的该插入部分(参照图34)。不完整的ORF对应orf29编码序列的3,部分,这使得有可能根据在质粒pSPM58插入部分序列分析中获得的同一orf的部分序列(参照实施例19.2和19.3),完成该基因的序列;因此两个序列的组合使得有可能获得orf29的完整序列。因此这4个基因命名为orf29(SEQIDNo.113),orf30c(SEQIDNo.115),orm(SEQIDNo.118)和orf32c(SEQIDNo.120)。基因名称中加入"c,,意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图34)。使用各种程序将由这些开放阅读框所推导出的蛋白质序列(对应orf29的SEQIDNo.114,对应orf30c的SEQIDNo.116和117,对应orf31的SEQIDNo.119和对应orB2c的SEQIDNo.121)与各种数据库中所存在的那些序列进行比较BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。19.6粘粒pSPM36插入片段笫三部分的亚克隆和序列分析。通过PCR获得了对应orf32c内部序列的探针(0.8kbDNA片段),PCR反应使用生二素链霉菌菌林总DNA为模板并使用以下引物KF36:5'-TTGCCGTAGCCGAGGACCAGCG-3'(SEQIDNo.151)和KF37:5'-CACATGGCCCTGGAGGACCCTG-3'(SEQIDNo.152)。如此获得的PCR产物代表orB2c内部序列。该4采针用于与用Pstl酶消化了的菌林OSC2染色体DNA和粘粒pSPM36DNA进行Southern印迹实验。使用与上述条件相同的杂交条件(参照实施例19.1),当对用Pstl酶消化了的菌林OSC2总DNA和粘粒pSPM36DNA进行杂交时,该探针显示大约为3.4kb和2.5kb的两个Pstl片段。由于所用探针中存在Pstl位点,能够解释这些结果。笫一个DNA片段,大小为大约3.4kb,是其序列已经完全已知的片段。2.5kb片段的序列仅部分已知,对700bp的区域已知。为了确定orf32c末端的序列和后者上游其它基因的序列,从粘粒pSPM36分离得到该片段。为此,用Pstl限制性酶消化粘粒pSPM36。通过纯化从0.8%琼脂糖凝胶上分离得到大小为大约2.5kb的Pstl-Pstl片段,并且然后将其克隆入载体pBK-CMV(4518bp)(由Stratagene公司(LaJolla,California,USA)出售)。如此获得的质粒命名为pSPM79(参照图41)并确定了其插入部分的序列。orf28c的序列(SEQIDNo.lll)是不完整的(参照实施例193)。具体而言,已经不可能确定大约450个核苷酸的区域,在序列SEQIDNo.106中这450个核苷酸以一系列"N"的形式出现。通过对该区域再次进4亍序列分析,确定了该全部未知区域的序列。因此,全部确定了pSPM58和pSPM73插入部分的序列。SEQIDNo.141中给出了orf28c编码部分的完整序列并且SEQIDNo.142中给出了由该序列推导出的蛋白质。SEQIDNo.161中给出了质粒pSPM79插入部分的序列。SEQIDNo.140中给出了pSPM58,pSPM73和pSPM79插入部分的序列的组合(参照图41)。该序列起始于orf23c中的Pstl位点(参照SEQIDNo.80)并延伸至ori34c中的Pstl位点(参照图41)。19.7新核苷酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征使用FramePlot程序(J.Ishikawa和K.Hotta1999)分析了所得质粒pSPM79的插入部分的序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定包含3个ORF的该插入部分,两个不完整的ORF(orB2c和orf34c)和一个完整的ORF(orB3)(参照图41)。第一个不完整的ORF对应orf32c编码序列的5,部分。这使得有可能根据在质粒pSPM73插入部分的序列分析中获得的同一orf的部分序列(参照实施例19.4和19.5),完成该基因的序列,因此两个序列的组合使得有可能获得orf32c的完整序列(SEQIDNo.145)。基因名称中加入"c"意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图41)。完整orf称为orf33(SEQIDNo.147)。第三个ORF称为orf34c(SEQIDNo,149)。基因名称中加入"c"意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图37)。在该orf的产物和数据库之间进行的比较表明该蛋白质C-末端部分不在由核苷酸序列所推导出的产物中,并且因此还表明该orf更长且持续至已进行序列分析的区域之后。使用多种程序将由这些开放阅读框所推导出的蛋白质序列与多种数据库中所存在的那些序列进行比较BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。实施例20:分析产生的螺旋霉素生物合成中间体20.1样品制备将所要测试的多林菌株各自培养于7个含有70mlMP5培养基(Pernodet等,1993)的500ml具档板锥形瓶中。将多林生二素链霉菌菌林以2.5x106芽孢/ml接种于锥形瓶中并在27。C250转/分钟定轨振荡生长96小时。收集对应相同克隆的培养物,任选地通过打褶的滤器过滤,并7000转/分钟离心15分钟。然后用氢氧化钠将上清液的pH值调整至9并用甲基异丁酰酮(MIBK)抽提上清液。然后回收有机相(MIBK)并蒸发干燥。然后将干提取物溶于lml乙腈,然后在用于液相色镨/质谱测量(LC/MS)分析之前,稀释至1/10(用水将100pl稀释至1ml)。20.2通过LC/MS分析样本为了测定由所测试的菌林合成的多种产物的质量,通过LC/MS分析样本。所用高效液相色i普法柱是KromasilC8150*4.6mmm,5mmm,100A柱子。流动相是由乙腈和0.05。/。三氟乙酸水溶液的混合物组成的梯度溶液,流速固定为lml/分钟。柱恒温器的温度维持在30"C。在两个不同的波长238nm和280nm下,在柱流出口进行UV检测。连接到色语柱上的质谱仪是Agilent公司出售的SingleQuadripole设备,锥体电压在30和70V。203分析由菌林OS49.67产生的生物合成中间体其中ori3基因已通过同相删除被失活的菌林OS49.67不产生螺旋霉素(参照实施例6和15)。按照上述方法(参照段落20.1)制备样品并如上述通过LC/MS进行分析(参照段落20.2)。更加具体而言,在梯度溶剂相中通过色镨法进行分析,如流动相从时间为T-O到5分钟为20%的乙腈,然后在T-35分钟时线性增加至30%,随后维持至T=50分钟。在这些条件下,更加显著地观察到两个产物238nm处的吸收(保留时间为33.4分钟)和280nm处的吸收(保留时间为".8分钟)(参照图35)。图35显示了在238和280nm处产生的HPLC色i普图的叠合(顶部)并显示了在33.4分钟和44.8分钟时洗脱出的分子的UV光谱(底部)。联用的质谱测量法分析条件如下以扫描方式进行扫描,涵盖质量范围在100和1000Da之间。电子倍增器的增益为1V。关于电子喷雾源,雾化气体的压力是35psig,干燥气体的流速是12.01/分钟,干燥气体的温度是350。C,且毛细管电压为+/-3000V。这些实验使得有可能确定所分离到的两种产物的质量。其质量分别为第一洗脱产物([]\1-1120+=353主要产物)370g/mo1和第二产物368g/mol([M-H201+=351主要产物)。为了得到它们的结构,分离上述产物并在以下条件下进行纯化流动相是0.05。/。三氟醋酸水溶液和乙腈的70/30(v/v)混合物。在恒溶剂系统中以固定流速lml/分钟进行色语分析。在这些条件下,2个产物的保留时间分别为8和13.3分钟。此外,在这种情况下,注射入10pi样品之前不用水稀释所制备的样品(参照段落20.1)。在色镨柱的输出口回收这2个产物并在以下条件下进行分离依次用1ml乙腈、1ml水/乙腈(20v/80v)和1ml80/207JC/乙腈平衡OasisHLB1cc30mg柱(Waters)。然后加入样品并依次用1ml水/乙腈(95/5)和1ml水/氖化乙腈(95/5)洗涤柱,然后用600pi40/60的1ml水/氘化乙腈洗脱。然后通过NMR直接分析回收的溶液。对于这两个化合物,所获得的NMR光谱如下-第一洗脱产物PlatenolideA:(谗9646V)CD3CN中的1H谦(化学迁移ppm):0.90(3H,t,J=6Hz),0.93(3H,d,J=5Hz),1.27(3H,d,J=5Hz),1.27和1.40之间(3H,m),1.51(1H,m),1.95(1H,m),2.12(1H,m),2.30(1H,d,J=12Hz),2.50(1H,d,J=llHz),2.58(1H,dd,J=9和12Hz),2.96(1H,d,J=7Hz),3.43(3H,s),3.70(1H,d,J=9Hz),3.86(1H,d,J=7Hz),4.10(IH,m),5.08(1H,m),5.58(1H,dt,J=3和12Hz),5.70(IH,dd,J=8和12Hz),6.05(IH,dd,J=9和12Hz),6.24(IH,dd,J-9和12Hz)。-第二洗脱产物PlatenolideB:(语9647V)CD3CN中的IH语(化学迁移ppm):0.81(3H,t,J=6Hz),0.89(IH,m),1.17(3H,d,J=5Hz),1.30(4H,m),1.47(2H,m),1.61(IH,t,J=10Hz),2.20(IH,m),2.38(IH,d,J=13Hz),2.52(1H,m),2.58(IH,m),2.68(1H,dd,J=8和13Hz),3.10(IH,d,J=7Hz),3.50(3H,s),3.61(1H,d,J=8Hz),3.82(IH,d,J=7Hz),5.09(1H,m),6,20(IH,m),6.25(IH,dd,J=9和12Hz),6.58(IH,d,J=12Hz),7.19(IH,dd,J=9和12Hz)。这些实验使得有可能确定这两个化合物的结构。第一洗脱产物是platenolideA且第二洗脱产物是platenolideB;图36中给出了所推导出的这两个分子的结构。使用结合NMR的LC/MS技术,在略微不同于上述那些条件的条件下,但这些条件的确立是本领域技术人员所熟知的,还有可能确定除了platenolideA和B之外,菌林OS49.67还产生这两种化合物的衍生物。它们是platenolideA+mycarose和platenolideB+mycarose(图40中给出了这两种化合物的结构)。表42中给出了对菌株OS49.67的上清液进行分析的结果。表42.菌林OS49.67的上清液的LC/MS分析结果<table>tableseeoriginaldocumentpage141</column></row><table>20.4分析由菌株SPM509所产生的生物合成中间体其中orfl4基因已失活(orfl4::att3ftaac-)的菌株SPM509不产生螺旋霉素(参照实施例13、15和16)。按照上述方法(参照段落20.1)制备样品并如上述通过LC/MS进行分析(参照段落20.2和20.3)。对在MP5培养基中培养的菌林SPM509的培养上清液中存在的生物合成中间体的分析表明该菌林仅产生形式B的platenolide("platenolideB",参照图36)而不产生形式A的platenolide("platenolideA,,,参照图36)。实施例21:在具有orf3基因内敲除的菌林(OS49.67)中间断orfl4基因orfl4基因的产物是螺旋霉素生物合成所必需的(参照实施例13,15和16:其中该基因被打断的菌株SPM509不再产生螺旋霉素)。对在MP5培养基中培养的菌林SPM509的培养上清液中存在的生物合成中间体的分析表明该菌林仅产生形式B的platenolide而不产生形式A的platenolide(参照实施例20)。可以解释该观察结果的假说之一是orf14的产物参与通过酶还原步骤将形式Bplatenolide转化为形式Aplatenolide。为了验证该假说,将orH4基因在不产生螺旋霉素但是产生形式A和B的platenolide的突变体中失活。这就是菌林OS49.67的情况(参照实施例6和20),该菌林中通过同相删除失活了orf3基因(Aorf3)。为了失活该菌株中的orfl4基因,通过原生质体转化将质粒pSPM509导入菌林OS49.67(T.Kieser等,2000)。orfl4基因的失活已经描述于菌抹OSC2的例子中(参照实施例13)并且相同步骤也用于失活菌林OS49.67中的orfl4基因。用质粒pSPM509转化之后,通过其阿泊拉霉素抗性对这些克隆进行了筛选。然后,将阿泊拉霉素抗性的克隆分别在含有阿泊拉霉素的培养基上和含有潮霉素的培养基上传代培养。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生了双交换事件并且其中orfl4基因已被由att3Qaac-盒打断的orfl4拷贝所替换的那些克隆。更加具体而言是筛选到了这些克隆并且通过杂交验证了盒打断拷贝对野生型orfl4拷贝的替换。因此,为了验证确实发生了基因替换,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上进行分离,转移至膜上并用对应att3Qaac-盒的探针进行杂交。通过本领域技术人员熟知的任意方法,并且尤其是通过使用适当寡核苷酸的PCR和对PCR产物进行序列分析,也能够进行基因型的验证。更加具体而言是筛选到了呈现预期特性(Aorf3,orfl4::att3Qaac-)的克隆被命名为SPM510。通过两轮杂交事实上有可能验证att3Qaac-盒确实存在于该克隆的基因组中,并且有可能验证确实获得了所预期的消化谱,即在该克隆的基因组中,经过两轮重组事件之后,由att3Qaac-盒打断的拷贝替换了野生型orfl4基因后的消化傳。实施例22:打断orfl4基因的功能性补偿22.1构建质粒pSPM519:使用以下寡核苷酸对EDR31:5,CCCAAGCTTCTGCGCCCGCGGGCGTGAA3'(SEQIDNo.136)和EDR37:5'GCTCTAGAACCGTGTAGCCGCGCCCCGG3'(SEQIDNo.137),以菌抹OSC2染色体DNA为模板,通过PCR扩增orfl4基因。寡核普酸EDR31和EDR37分别携带HindIII和Xbal限制性酶切位点(粗体序列)。将如此获得的1.2kb片段克隆入载体pGEM-Teasy(由Promega公司(Madison,Wisconsin,USA)出售),以形成质粒pSPM515。然后用HindIII和XbaI限制性酶消化该质粒。将所获得的1.2kbHindlII/Xbal插入部分克隆入预先用相同的酶消化了的载体pUWL201(参照实施例17.1)。如此所得质粒命名为pSPM519。22.2用质粒pSPM519转化菌林SPM509和SPM510:通过原生质体转化(T.Kieser等,2000)将质粒pSPM519导入菌林SPM509(参照实施例13)和SPM510(参照实施例17)。转化之后,通过其硫链丝菌肽抗性篩选这些克隆。然后将这些克隆在含有硫链丝菌肽的培养基上传代培养。菌林SPM509是螺旋霉素非生产菌菌株(参照实施例13,15和16和图24)。通过在存在硫链丝菌肽的MP5培养基中培养该菌林,分析了用栽体pSPM519转化的菌株SPM509(菌林命名为SPM509pSPM519)的螺旋霉素产量。然后通过HPLC分析培养上清液(参照实施例16和17)。表43中给出了该分析的结果,数据表示为mg每升上清液。结果对应总螺旋霉素产量(通过将螺旋霉素I,II和III的产量相加获得)。观察到菌林SPM509中存在的载体pSPM519可恢复螺旋霉素产量(参照表43)。表43.用载体pSPM519转化的菌抹SPM509的螺旋霉素产量(结果表示为mg/l上清液)。_<table>tableseeoriginaldocumentpage144</column></row><table>用质粒pSPM519转化的菌林SPM510命名为SPM510pSPM509。实施例23:通过弗氏链霉菌的tylB基因功能性补偿orf3基因的打断23.1构建质粒?0849.52:质粒pOS49.52对应允许在生二素链霉菌中表达TylB蛋白质的质粒。为了构建该质粒,将弗氏链霉菌tylB基因的编码序歹ij(Merson-Davies和Cundliffe,1994,GenBank登录号U08223(该区域的序列),SFU08223(DNA序列)和AAA21342(蛋白质序列))导入质粒pKC1218(Bierman等,1992,Kieser等,2000,含有该质粒的大肠杆菌菌林尤其可从ARS(NRRL)AgriculturalResearchServiceCultureCollection)(Peoria,Illinois,USA)获得,保藏号为B-14790)。此外,该编码序列置于ermEA启动子控制之下(参照上面,具体而言是实施例111,Bibb等,I985,Bibb等,I994)23.1用质粒pOS49,52转化菌林OS49,67:其中orf3基因通过同相删除被失活的菌林OS49.67不产生螺旋霉素(参照实施例6和15)。通过原生质体转化(T.Kieser等,2000)将质粒pOS49.52导入菌林OS49.67。转化之后,通过其阿泊拉霉素抗性筛选这些克隆。然后将这些克隆在含有阿泊拉霉素的培养基上传代培养。更加特异地筛选到该克隆并命名为OS49.67pOS49,52。如上所阐明,菌林OS49.67不产生螺旋霉素(参照实施例6和15)。通过实施例15中所述的技术分析用载体pOS49.52转化的菌林OS49.67的螺旋霉素产量。因此有可能证明该菌林具有螺旋霉素生产菌表现型。因此,TylB蛋白质允许功能性补偿orf3基因的打断。实施例24:通过过量表达orf28c基因提高螺旋霉素产量24.1构建质粒pSPM75:使用含有HindIII限制性酶切位点或BamHI限制性酶切位点的一对寡核苷酸,通过PCR扩增orf28c基因。这些引物具有如下序列KF30:5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SEQIDNo.138),具有Hindlll限制性酶切位点(粗体所示)KF31:5,GGATCCCGCGACGGACACGACCGCCGCGCA3,(SEQIDNo.139),具有BamHI限制性酶切位点(粗体所示)。引物KF30和KF31分别携带Hindlll和BamHI限制性酶切位点(粗体序列)。KF30和KF31引物对使得有可能扩增含有orf28c基因大小为大约1.5kb的DNA片段,利用粘粒pSPM36作为模板(参照上面)。将如此获得的1.5kb片段克隆入载体pGEM-Teasy(由Promega公司(Madison,Wisconsin,USA)出售)以产生质粒pSPM74。然后用Hindlll和BamHI限制性酶消化质粒pSPM74并将所获得的约1.5kbHindlII/BaraHI插入部分亚克隆入预先用相同酶消化了的载体pUWL201(参照实施例17.1)。如此所得质粒命名为pSPM75;该质粒包含置于ermEA启动子控制之下的orf28c全部编码序列。24.2用质粒pSPM75转化菌林OSC2:通过原生质体转化(T.Kieser等,2000)将质粒pSPM75导入菌林OSC2。原生质体转化之后,通过其硫链丝菌肽抗性筛选这些克隆。然后将这些克隆在含有硫链丝菌肽的培养基上传代培养并通过质粒提取验证了用质粒进行的转化。更加显著地筛选到两个克隆并命名为OSC2/pSPM75(1)和OSC2/pSPM75(2)。菌林OSC2/pSPM"("的样本保藏于国立微生物保藏中心(CNCM)[NationalCollectionofCulturesandMicroorganisms]巴斯德研究所,25,rueduDocteurRoux75724ParisCedex15,法国,保藏日为2003年10月6日,保藏号为1-3101。为了测试过量表达orf28c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试OSC2/pSPM75(l)和OSC2/pSPM75(2)克隆的螺旋霉素产量。与此平行还分析了菌林OSC2的螺旋霉素产量以进行比较。因此有可能观察到质粒pSPM75的存在显著增加菌林OSC2的螺旋霉素产量。这证明orf28c过量表达导致螺旋霉素产量增加并且证实该基因作为调节子的作用。还通过HPLC分析了OSC2/pSPM75(l)和OSC2/pSPM75(2)克隆的螺旋霉素产量(以与实施例17.2中相同的方式)。与此平行还分析了菌林OSC2的螺旋霉素产量以进行比较。表44中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素总产量(通过将螺旋霉素I,II和III的生产量相加获得)。表43.来源于OSC2的用载体pSPM75转化的菌林的螺旋霉素产量(结果表示为mg/1)。<table>tableseeoriginaldocumentpage146</column></row><table>因此,观察到质粒pSPM75的存在显著增加菌林OSC2的螺旋霉素产量。这清楚地证明orf28c过量表达对螺旋霉素产量具有正效应。实施例25:通过其orf8基因已经失活的菌林分析螺旋霉素生物合成中间体的产量菌林OS49.107,其中orf8基因通过插入Qhyg盒而失活,不产生螺旋霉素(参照实施例7和15)。or仿基因编码与几种氨基转移酶呈现相对强相似性的蛋白质并且强烈暗示orf8基因编码负责forosamine生物合成所必需的氨基转移反应的4-氨基转移酶(参照图6)。因此预期螺旋霉素生物合成将阻断于forocidin阶段(参照图7)。因此螺旋霉素非生产菌菌林OS49.107将产生forocidin。按照上述方法制备菌抹OS49.107的上清液样品(参照实施例16,不进在SIM模式下,选择了对应forocidin分子离子的质量558并检测到几个峰。质量558化合物的存在与or仿在forosamine合成中具有作用的假说相一致。实施例26:通过其orfl2基因已经失活的菌株分析螺旋霉素生物合成中间体的产量菌林SPM507,其中orfl2基因失活,不产生螺旋霉素(参照实施例11和15)。认为orfl2基因编码负责forosamine生物合成所必需的脱水反应的3,4-脱水酶(参照图6)。因此预期螺旋霉素生物合成将阻断于forocidin阶段(参照图7)。因此螺旋霉素非生产菌菌株SPM507将产生forocidin。按照上述方法制备菌林SPM507的上清液样品(参照实施例16,不进行MIBK抽提)并且如上述通过LC/MS进行分析(参照段落20.2和20.3)。在这些条件下,forocidin保留时间为大约12.9分钟。在SIM模式下,选择了对应forocidin分子离子[M+Hj+的质量558并检测到几个峰。558处化合物的存在使得有可能验证orfl2的产物在螺旋霉素生物合成中具有作用的假说。然而,forocidin以相对低的量存在并且,在这些条件下,更加显著地观察到了在238nm处有吸收的产物(保留时间是17.1分钟)。LC/MS分析使得有可能确定该化合物的质量,为744.3g/mol([M+Hl+=744.3,主要产物)。为了获得结构,分离上述产物并在上述条件下纯化(参照段落20.1)。然后回收有机相(MIBK)并蒸发干燥。将干燥的提取物溶于水并用庚烷进行抽提。然后通过结合到OasisHLB1g柱(WatersSAS,St-Quentinen-Yvelines,France)抽提该水溶液。通过用30/70水/乙腈混合物洗脱回收该化合物。然后将该溶液注射(100pl)入分析柱并在OasisHLB1cc30mg柱(Waters)上回收级分。在4吏用之前,将OasisHLB1cc30mg柱(Waters)依次用乙腈、然后是水/乙腈混合物(20v/80v)和80/20水/乙腈混合物进行调节。然后依次用1ml7K/乙腈(95/5)和1ml水/氘化乙腈(95/5)洗涤OasisHLB1cc30mg柱(Waters),然后用600pi40/60水/氘化乙腈洗脱。然后将回收的溶液直接通过NMR进行分析。所得该化合物的NMR镨如下(19312VNMR镨)CD3CN/D20中的1H镨(化学迁移ppm):0.92(3H,d,J=6Hz),1.10(1H,未分辨峰),1.14(3H,s),1.17(3H,d,J=6Hz),1.22(3H,d,J=6Hz),1.25(3H,d,J=6Hz),1.40(1H,未分辨峰),1.75(IH,dd,J=12和2Hz),1.81(1H,未分辨峰),l.卯(1H,d,J=12Hz),2.05(1H,未分辨峰),2.12(3H,s),2.15(1H,未分辨峰),2.35(2H,未分辨峰),2.45(6H,宽s),2.53(IH,未分辨峰),2.64(IH,dd,J=12和9Hz),2.80(1H,dd,J=9和16Hz),2.95(1H,d,J=8Hz),3.23(2H,未分辨峰),3.34(1H,d,J=7Hz),3.45(3H,s),3.49(IH,未分辨峰),3.93(IH,dd,J=7and3Hz),4.08(1H,未分辨峰),4.37(1H,d,J=6Hz),4.88(IH,未分辨峰),5.05(2H,未分辨峰),5.65(2H,未分辨峰),6.08(IH,dd,J=8和12Hz),6.40(1H,dd,J=12和9Hz),9.60(1H,s)。这些实验使得有可能确定该化合物的结构,图38中给出了该结构。实施例27:通过其orf5叭基因已经失活的菌林分析螺旋霉素生物合成中间体的产生菌株SPM501具有基因型orf6*::attinhyg+。根据attlfthyg+盒插入到orf6A基因的极性效应,有可能确定orf5A基因是螺旋霉素生物合成途径所必需的。具体而言,根据对orf5A基因表达的极性效应,可切除盒插入到orf6*基因编码序列导致螺旋霉素生产完全阻断。然而,一旦切除了插入的盒(并且因此当仅失活orf6*基因时,参照实施例14和15),螺旋霉素I的产生恢复。这证明orf5*基因是螺旋霉素生物合成所必需的,因为该基因的失活导致螺旋霉素产生完全阻断。orf5*基因编码与几种O-曱基转移酶呈现相对强相似性的蛋白质。认为orf5*基因是参与platenolide生物合成的O-甲基转移酶。为了验证该假说,对从过量生产螺旋霉素的菌株获得的、基因型为orf6*::attinhyg+的生二素链霉菌菌林进行了LC/MS和NMR分析实验。按照上述方法制备菌林上清液的样品(参照实施例16,不进行MIBK抽提)并通过上述的LC/MS进行分析(参照段落20.2和20.3)。然而,所用柱子为X-Terra柱(WatersSAS,St-Quentinen-Yvelines,法国),光谱计的維体电压(conevoltage)设置为380V以获得所分析化合物的发酵。在这些条件下,观察到保留时间为大约13.1分钟的产物。该化合物的质谱与螺旋霉素I的质谱具有表观相似性,但分子离子是829。与螺旋霉素的质量相比有14质量的差异能够解释为在内酯环4号碳所负荷的氧上缺乏甲基(图39中给出了该化合物的结构)。在829处存在化合物使得有可能确认orf5+在螺旋霉素生物合成中具有作用的假说。利用敏感菌林藤黄微球菌进行微生物学测试,证明了菌林orK*::ftatthyg+所产生的中间体分子(不含甲基的螺旋霉素,图39中给出了该结构)比位置4处具有曱基的螺旋霉素活性弱(弱10倍)。实施例28:构建新的"可切除盒"构建了新的可切除盒。这些盒与实施例9中已经描述的可切除盒非常相似。前者盒与新盒之间的主要不同是在后者中缺乏对应ft插入子(interposon)末端的序列,该序列包含来源于T4噬菌体的转录终止子。在不含终止子的盒中,赋予抗生素抗性的基因的两侧是允许切除的attR和attL序列。抗性基因是编码赋予阿泊拉霉素抗性的乙酰基转移酶的aac(3)IV基因。该基因存在于Qaac盒(GenBank登录号X99313,Blondelet-Rouault,M,H.等,1997)并通过PCR扩增获得,PCR反应以质粒pOSK1102(参照上面)作为才莫板,以分别在5'位置含有HindIII限制性酶切位点(粗体)(AAGCTT)的寡核苷酸KF42和KF43作为引物KF42:5'-AAGCTTGTACGGCCCACAGAATGATGTCAC-3'(SEQIDNo.153),和KF43:5'-AAGCTTCGACTACCTTGGTGATCTCGCCTT-3'(SEQIDNo.154)。将所获得的大约1kb的PCR产物克隆入大肠杆菌载体pGEMTEasy,以产生质粒pSPM83。用HindlII限制性酶消化栽体pSPM83。通过纯化从0.8%琼脂糖凝胶上分离Hindlll-Hindlll片段,然后将其克隆入定位于多种携带不同可切除盒的质粒的attL和attR序列之间的HindIII位点(参照实施例9和图27),以便用仅对应aac基因的HindIII片段替换对应Hacc的HindIII片段。这使得有可能获得attlaac,att2aac和att3aac盒(根据目的,参照实施例9)。才艮据aac基因相对attL和attR序列的方向不同,attlaac+,attlaac-,att2aac+,att2aac-,att3aac+和att3aac-是有区别的(按照在实施例9中所采用的相同的惯例)。实施例29:构建orf28c基因中具有敲除的生二素链霉菌菌林利用可切除盒技术失活orf28c基因。通过PCR扩增可切除盒att3aac+(参照实施例28),PCR反应以质粒pSPM101(质粒pSPM101是来源于载体pGP704Not的质粒(Chaveroche等,2000)(MillerVL和MekalanosJJ,1988),其中att3aac+盒作为EcoRV片段已克隆入pGP,(HNot中唯一的EcoRV位点)为模板,并使用如下引物KF32:CGCGCTTCGTTCGGGACGAA3'(SEOIDNo.155)和KF33:CTCTTCGTCCCGAAGCAACT3(SEQIDNo.156)定位于这些寡核苷酸序列5'末端的39个核苷酸包含对应orf28c基因中序列的序列并且定位于最3'位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+—个末端的序列。将如此所得PCR产物用于转化含有粘粒pSPM36的超重组大肠杆菌菌株DY330(Yu等,2000)(该菌林含有3t噬菌体的exo,bet和gam基因,整合入其染色体,这些基因在42X:时表达,该菌林用于代替大肠杆菌菌抹KS272(Chaveroche等,2000))。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用BamHI限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orf28c基因,即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化镨相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化谱的克隆并将相应粘粒命名为pSPM107。该粘粒是pSPM36的衍生物,其中orf28c已由att3aac+盒打断。盒的插入伴随着orf28c基因中的删除,打断起始于orf28c的笫28个密码子。盒后面保留了orf28c的最后137个密码子。在第一步中,将粘粒pSPM107导入大肠杆菌菌株DH5a,并且然后通过原生质体转化导入生二素链霉菌菌林OSC2。转化后,通过其阿泊拉霉素抗性篩选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有嘌呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对噤呤霉素敏感的(PuroS)克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf28c基因的克隆。更加特别的是选择到这些克隆并通过杂交IHit了盒打断拷贝对野生型orf28c拷贝的替换。因此,为了证明在所得克隆的基因组DNA中的预期基因座存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。更加具体而言篩选到呈现预期特性(orf28c::att3aac+)的克隆并命名为SPM107。因此该克隆具有基因型orf28c::att3aac+并命名为SPM107。考虑到基因的方向(参照图3),没有必要切除盒以研究orf28c失活的效应。orf29与orf28c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过同质粒pOSV508进行转化,使得有可能获得在任何时刻去除筛选标记的可能性。为了测试关闭orf28c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试菌林SPM107的螺旋霉素产量。因此有可能证明该菌林具有螺旋霉素非生产菌表现型。这证明orf28c基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。实施例30:构建在orf31基因中具有敲除的生二素链霉菌菌林利用可切除盒技术失活orfil基因。通过PCR扩增可切除盒att3aac+,PCR反应以质粒pSPM101为模板并且以寡核苷酸EDR71和EDR72为引物。EDR71:GCGCGCTTCGTTCGGGACGAA3,(SEQIDNo.157)EDR72:CTCTTCGTCCCGAAGCAACT3,(SEQIDNo.158)定位于这些寡核苷酸序列5'末端的39个核苷酸包含对应orf31基因中序列的序列并且定位于最3,位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+—个末端的序列。如Chaveroche等(Chaverocheetal.,2000)所述,将如此所得PCR产物用于转化含有质粒pKOBEG和粘粒pSPM36的大肠杆菌菌林KS272(参照图12的原理,质粒pOS49.99将由粘粒pSPM36替换并且所得质粒不再是pSPM17而是pSPM543)。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用几种限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orfil基因,即如果在PCR产物和靶基因的末端之间确实发生了同源重组,则所得到的消化谱与预期消化镨相符合。通过本领域技术人员已知的方法,具体而言是通过利用适当寡核苦酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化语的克隆并将相应粘粒命名为pSPM543。该粘粒是pSPM36的衍生物,其中orf31已由att3aac+盒打断(参照图12)。盒的插入伴随着orf31基因中的删除,该打断起始于orf31第36个密码子。盒后面保留了orf31最后33个密码子。通过原生质体转化(Kieser,T等,2000)将pSPM543导入生二素链霉菌菌林OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有噪呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对噤呤霉素敏感(PuroS)的克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf31基因的克隆。更加特别的是选择到这些克隆并通过杂交验证了盒打断拷贝对野生型orBl拷贝的替换。因此,为了证明在所得克隆的基因组DNA中的预期基因座存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。以通过PCR获得且对应orf31基因编码序列非常大部分的DNA片段作为探针,进行了第二轮杂交。通过本领域技术人员已知的任意方法,具体而言是通过利用适当寡核苦酸的PCR和PCR产物序列分析,也能够进行基因型的验证。更加具体而言篩选到呈现预期特性(orf31c::att3aac+)的克隆并命名为SPM543。通过两轮杂交,事实上有可能验证att3aac+盒确实存在于该克隆的基因組中并且验证当双重组事件之后,在该克隆的基因组中用由att3aac+盒打断的拷贝替换野生型基因的情况下,确实获得了预期的消化谱。因此该克隆具有基因型orDl::att3aac+并命名为SPM543。考虑到基因的方向(参照图3),没有必要切除盒以研究orf31失活的效应。orf32c与orBl以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过用质粒pOSV508进行转化,使得有可能获得在任何时刻去除筛选标记的可能性。为了测试关闭orf31基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试了菌林SPM543的螺旋霉素产量。因此有可能证明该菌林具有螺旋審素非生产菌表现型。这证明orGl基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。实施例31:构建在orf32c基因中具有敲除的生二素链霉菌菌林利用可切除盒技术失活orf32c基因。通过PCR扩增可切除盒att3aac+,PCR反应以质粒pSPM101为模板并且使用以下引物KF52:GCGCGCTTCGTTCGGGACGAA3'(SEQIDNo.159)和KF53:GCCTCTTCGTCCCGAAGCAACT3'(SEQIDNo.160).定位于这些寡核苷酸序列5'末端的40个核普酸包含对应orf32c基因中序列的序列并且定位于最3'位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+—个末端的序列。将如此所得PCR产物用于转化含有粘粒pSPM36的超重組大肠杆菌菌林DY330(Yu等,2000)。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用BamHI限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orf32c基因,即如果在PCR产物和耙基因的末端之间确实发生了同源重组,则所得到的消化谦与预期消化i普相符合。通过本领域技术人员已知的方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化谱的克隆并将相应粘粒命名为pSPM106。该粘粒是pSPM36的衍生物,其中orB2c已由att3aac+盒打断。盒的插入伴随着orB2c基因中的删除,该打断起始于orf32c第112个密码子。盒后面保留了orf32c最后91个密码子。在第一步中,将粘粒pSPM106导入大肠杆菌菌林DH5(x,并且然后通过转化将其导入生二素链霉菌菌林OSC2。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有嘌呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对嘌呤霉素敏感(PuroS)的克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf32c基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对野生型orB2c拷贝的替换。因此,为了证明在所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。通过本领域^^支术人员已知的任意方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。更加具体而言篩选到呈现预期特性(or02c::att3aac+)的克隆。因此该克隆具有基因型orf32c::att3aac+并命名为SPM106。考虑到基因的方向(参照图3),没有必要切除盒以研究orf32c失活的效应。orf33与orf32c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过用质粒pOSV508进行转化,《吏得有可能获得在任何时刻去除筛选标记的可能性。为了测试关闭orf32c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试了菌林SPM106的螺旋霉素产量。因此有可能证明该菌林具有螺旋霉素生产菌表现型。这证明orf32c基因不是生二素链霉菌中螺旋霉素生物合成所必需的基因。本申请中所述的构建体的列表缩略语列表Am:氨千青霉素;Hyg:潮霉素;Sp:螺旋霉素;Ts:硫链丝菌肽;Cm:氯霉素;Kn:卡那霉素;Apra:阿泊拉霉素。_<table>tableseeoriginaldocumentpage156</column></row><table><table>tableseeoriginaldocumentpage157</column></row><table><table>tableseeoriginaldocumentpage158</column></row><table><table>tableseeoriginaldocumentpage159</column></row><table><table>tableseeoriginaldocumentpage160</column></row><table><table>tableseeoriginaldocumentpage161</column></row><table>pSPM53Am在BamHI位点具有插入的pWED2实施例19pSPM55Am在BamHI位点具有插入的pWED2实施例19pSPM56Am在BamHI位点具有插入的pWED2实施例19pSPM58KnpBK-CMV中pSPM36的大约6kb的Pstl-Pstl片段实施例19pSPM72KnpBK-CMV中pSPM36的大约10kb的Stul-Stul片段实施例19pSPM73CmpBC-SK+中pSPM72插入部分的EcoRI-HindIII片段实施例19pSPM515AmpGEM-Teasy中通过EDR31-EDR37扩增的PCR片段实施例22pSPM519Am,TspUWL201中pSPM515的HindlII/Xbal插入部分实施例22pOS49.52Apra质粒pKC1218中在ermE*启动子控制下的tylB编码序列实施例23pSPM74AmpGEM-Teasy中通过KF30-KF31扩增的PCR片段实施例24pSPM75Am,TspUWL201中pSPM74的HindlII/BamHI插入部分实施例24pSPM79KnpBK-CMV中pSPM36插入部分的大约2.5kb的PstI画PstI片段实施例19pSPM83AmpGEM國Teasy中通过KF42-KF43扩增的PCR片段实施例28<table>tableseeoriginaldocumentpage163</column></row><table>生物材料的保藏以下生物体根据布达佩斯条约于2002年7月10日保藏在国立微生物保藏中心[NationalCollectionofCulturesandMicroorganisms](CNCM),25rueduDocteurRoux,75724ParisCedex15,法国。-菌林OSC2,保藏号为I-2卯8。-菌林SPM501,保藏号为1-2909。-菌林SPM502,保藏号为1-2910。-菌林SPM507,保藏号为1-2911。-菌株SPM508,保藏号为1-2912。-菌才朱SPM509,保藏号为1-2913。-菌株SPM21,保藏号为1-2914。-菌林SPM22,保藏号为1-2915。-菌抹OS49.67,保藏号为1-2916。-菌林OS49.107,保藏号为1-2917。-含有质粒pOS44.4的大肠杆菌菌株DH5a,保藏号为1-2918。以下生物体根据布达佩斯条约于2003年2月26日保藏在国立微生物保藏中心(CNCM),25rueduDocteurRoux,75724ParisCedex15,法国。-菌株SPM502pSPM525,保藏号为1-2977。以下生物体根椐布达佩斯条约于2003年10月6日保藏在国立微生物保藏中心(CNCM),25rueduDocteurRoux,75724ParisCedex15,法国。-菌林OSC2/pSPM75(2),保藏号为1-3101。所有出版物和专利在本申请中引用作为参考。参考文献-AltschulSF,GishW,MillerW,MyersEW,LipmanDJ.局部比对的基础搜索工具.JMolBiol.(1990).215(3):403-410.-AltschulSF,MaddenTL,SchafferAA,ZhangJ,ZhangZ,MillerW,LipmanDJ.缺口BLAST和PSI-BLAST:蛋白质数据库的新基因配给搜索程序.NucleicAcidsRes.(1997).25(17):3389画402.陽Amann,E.,Ochs,B.和Abel,K.J.在大肠杆菌中用于未融合的和融合的蛋白质表达的紧密调节tac启动子载体.Gene(1988)69(2),301-315.-Arisawa,A.,Kawamura,N.,Tsunekawa,H.,Okamura,K.,Tone,H.和Okamoto,R.来自耐热链霉菌参与大环内酯抗生素4"-0-酰化作用的两个基因的克隆和核苷酸序列.Biosci.Biotechnol.Biochem.(1993).57(12):2020-2025.-ArisawaA,KawamuraN,TakedaK,TsunekawaH,OkamuraK,OkamotoR.来自耐热链霉菌编码3-0-酰基转移酶的大环内酯抗生素生物合成基因acyA的克隆及其对于杂交大环内酯抗生素的直接发酵产品的用途.ApplEnvironMicrobiol.(1994).60(7):2657-2660.-August,P.R.,Tang,L.,Yoon,Y.J.,Ning,Streptomyces,Mueller,R.,Yu,T.W.,Taylor,M.,Hoffmann,D.,Kim,C.G.,Zhang,X.,Hutchi謂n,C.R.和Floss,H.G.袢霉素(ansamycin)抗生素利福霉素的生物合成推导自地中海拟无枝酸菌S699rif生物合成基因簇分子分析.Chem.Biol.(1998)5(2),69-79.-AusubelFredM.,BrentRoger,KingstonRobertE.,MooreDavidD.,SeidmanJ.G.,SmithJohnA.,StruhlKevin(Editeurs).分子生物学最新方法,JohnWiley&SonsInc.CurrentProtocolsCustomerService,605ThirdAvenue,9thFloorNewYork,NY10158USA出版(最新版本,2002年3月).-BaltzRH,McHenneyMA,CantwellCA,QueenerSW,SolenbergPJ.转座诱变在产抗生素链霉菌中的应用.AntonieVanLeeuwenhoek.(1997).71(1-2):179-187.-BateN,ButlerAR,GandechaAR,CundliffeE.弗氏链霉菌泰乐菌素生物合成基因簇中的多重调控基因.ChemBiol.(1999).6(9):617-624.-Bate,N.,Butler,A.R.,Smith,LP.和Cundliffe,E.泰乐菌素生产菌弗氏链霉菌的mycarose-生物合成基因.Microbiology(2000).146(Pt1),139-146.-BayleyC.,Morgan,DaleE.C.,OwD.W.通过Cre-lox位点专一系统催化形成的转基因植物中基因活性的互换.PlantMol.Biol(1992).18:353-361.-Bentley,S.D.,Chater,K.F.,Cerdeno-Tarraga,A.M.,Challis,G丄.,Thomson,N.R.,James,K.D.,Harris,D.E.,Quail,M.A.,Kieser,H.,Harper,D,,Bateman,A.,Brown,S"Chandra,G.,Chen,C.W.,Collins,M.,Cronin,A.,Fraser,A.,Goble,A.,Hidalgo,J.,Hornsby,T.,Howarth,S.,Huang,C.H.,Kieser,T.,Larke,L.,Murphy,L.,Oliver,K.,O,Neil,S.,Rabbinowitsch,E.,Rajandream,M.A.,Rutherford,K.,Rutter,S.,Seeger,K.,Saunders,D.,Sharp,S.,Squares,R.,Squares,S.,Taylor,K.,Warren,T.,Wietzorrek,A.,Woodward,J.,Barrell,B.G.,Parkhill,J.和Hopwood,D.A.才莫式放线菌天蓝色链霉菌A3(2)的全基因组序歹'J.Nature(2002).417(6885),141-147.-BibbMJ,FindlayPR,JohnsonMW.细菌基因中碱基组成和密码子选择之间的关系及其用于简单并可靠鉴定蛋白质编码序列的用途.Gene.(1984)30(1國3):157-166.-BibbMJ,JanssenGR,WardJM.红霉素链霉菌(Streptomyceserythraeus)中红霉素抗性基因(ermE)启动子区域的克隆和分析.Gene.(1985).38(1-3):215-26.-BibbMJ,WhiteJ,WardJM,JanssenGR.缺乏常规核糖体结合位点时翻译红色糖多孢菌ermE基因编码的23SrRNA甲基化酶的mRNA.MolMicrobiol.(1994).14(3):533-45.-BiermanM,LoganR,O'BrienK,SenoET,RaoRN,SchonerBE.用于将DNA从大肠杆菌接合转移至链霉菌物种的质粒克隆载体.Gene.1992;116(1):43誦9.-Blondelet-RouaultM-H.,WeiserJ.,LebrihiA.,BrannyP.和PernodetJ-L.来源于Q插入子的抗生素抗性基因盒用于大肠杆菌和链霉菌.Gene(1997)l卯315-317.-BoccardF.,SmokvinaT.,J.-L.,PernodetFridmannA.,和Gu6rineauM.,链霉菌中参与pSAM2位点专一整合的基因座的结构分析.Plasmid,(1989a).21:59-70.-BoccardF.,SmokvinaT.,J.-L.,PernodetFridmannA.,和Gu6rineauM..与温和噬菌体相关的生二素链霉菌的整合型接合质粒pSAM2.EMBOJ.(1989b)8:973-980.-BrunelliJ.P.,PallM丄,,设计用于cDNA定向克隆和cre/lox介导的质粒切除的一系列酵母/大肠杆菌X表达载体.Yeast.(1993)9:1309-1318.-CamilliA"BeattieD.T.和MekalanosJ.J.遗传重组作为基因表达报告子的用途.Proc.Natl.Acad.Sci.USA(1994)91(7),2634-2638.-Campelo,A.B.和Gil,J.A.来自灰色链霉菌IMRU3570的杀假丝菌素基因簇.Microbiology(2002)148(Pt1),51-59.-CarrerasC,FrykmanS,OuS,CadapanL,ZavalaS,WooE,LeafT,CarneyJ,BurlingameM,PatelS,AshleyG,LicariP.红色糖多孢菌-催化的6-脱氧红诺霉素B类似物转化为新红霉素产物的生物转化作用.JBiotechnol.(2002).92(3):217-28.-ChaoK.-M"PearsonW.R"MillerW.在特定斜角带中比对两个序列.Comput.Appl.Biosci.(1992)8:481-487.-ChaterK.F.越来越多的在产抗生素链霉菌类中通过基因工程增加产量的展望.Biotechnology.(1990).8(2):115-121.-ChaverocheMK,GhigoJM,d,EnfertC.在丝状真菌构巢曲霉(Aspergillusnidulans)中进行有效基因替换的快速方法.NucleicAcidsRes.2000;28(22):E97.-ChurchGM,GilbertW.基因组序列分析.ProcNatlAcadSeiUSA.(1984)81(7):1991-5.-ChurchwardG,BelinD,NagamineY.与其他通常所用的克隆载体不具有序列同一性的pSC101衍生质粒.Gene.(1984)31(1-3):165-71.画Comstock,L.E.,Coyne,M.J.,Tzianabos,A.O.和Kasper,D丄.脆弱拟杆菌(Bacteroidesfragilis)多糖B生物合成基因座的菌林内变化菌林638R该区域的特征.J.Bacteriol.(1999).181(19):6192-6196.國CoxKL,BaltzRH.链霉菌物种中噬菌斑形成的局限.JBacteriol.(1984)159(2):499-504.-DaleE.C.,OwD.W.,通过随后从宿主基因组中去除选择基因进行的基因转移.Proc.Natl,Acad.Sci.USA(1991).88:10558-10562.-DoumithM,WeingartenP,WehmeierTJF,Salah-BeyK,BenhamouB,CapdevilaC,MichelJM,PiepersbergW,RaynalMC.参与6-脱氧己糖生物合成并转移至红色糖多孢菌的基因的分析.MolGen基因t.(2000)264(4):477-485.-Draeger,G.,Park,Streptomyces-H.H.和Floss,H.G.抗生素榴菌素和竹桃霉素脱氧己糖部分生物合成中的2-脱氧作用步骤的机制.J.Am.Chem.Soc.(1999)121:2611-2612.國Gandecha,A.R.,Large,S丄.和Cundliffe,E.来自弗氏链霉菌基因组tylLM区域的4个泰乐菌素生物合成基因的分析.Geng.(l"7).l糾(2):197-203.-Geistlich,M.,Losick,R.,Turner,J.R.和Rao,R.N.生二素链霉菌中控制聚酮化合物合酶基因表达的新调控基因的特性.Mol.Microbiol.(1992).6(14):2019-2029.-GourmelenA,Blondelet-RouaultMH,PernodetJL.来自生二素链霉菌由gimA编码的可失活大环内酯的糖基转移酶的特性.AntimicrobAgentsChemother.(1998).42(10):2612-9.-HuangX.和MillerW.时间-效率、线性-空间局部相似性的算法.Adv.Appl.Math.(1991).12:337-357.-HaraO和HutchinsonCR.来自生米卡链霉菌、浅青紫链霉菌和天蓝色链霉菌A3(2)的麦迪霉素(MLS)-抗性基因的克隆.JAntibiot(Tokyo).(1990).43(8):977-991.画HaraO和HutchinsonCR.来自产麦迪霉素的生米卡链霉菌的3画0誦酰基转移酶基因.JBacteriol.(1992).174(15):5141-5144.-HoffmeisterD,IchinoseK,DomannS,FaustB,TrefzerA,DragerG,KirschningA,FischerC,KunzelE,BeardenD,RohrJ和BechtholdA.NDP-糖共同底物的浓度和酶表达水平影响糖基转移酶的底物特异性乌达霉素生物合成基因簇脱氧糖生物合成基因的克隆和特性.ChemBiol.(2000).7(11):821-831.-Hopwood,D.A.在P-内酰胺抗生素中通过遗传工程发现新抗生素的未来可能性.由M.R.J.Salton和G.D.Shockman编辑.NewYork:AcademicPress.(1981).585-598.-HopwoodD.A.,MalpartidaF.,KieserH.M.,IkedaH.,DuncanJ.,FujiiI"RuddA.M.,FlossH.G.和OmuraS.通过遗传工程产生'杂化,抗生素.Nature.(1985a).314(6012):642-644.-HopwoodD,A,,MalpartidaF.,KieserH.M.,IkedaH.和OmuraS.(1985b)微生物学(S.Silver编辑).美国微生物协会,WashingtonD.C.,409-413.-HoubenWeyl,1974,MethodederOrganischenChemie有机化学方法,E.Wunsch编辑,15-1和15-11巻.-Hutchinson,C.R.通过产抗生素细菌的遗传工程发现新(杂化)抗生素的展望.MedResRev.(1988).8(4):557-567.-HutchinsonC.R.,BorellC.W.,OttenS.L,Stutzman画EngwallK.J.和WangY.通过产抗生素微生物的遗传工程进行药物发现和研发.J.Med.Chem.(1989)32(5):929-937.画IshikawaJ,HottaK.FramePlot:对高G+C含量细菌DNA中通过新的框架分析预测蛋白质编码区域.FEMSMicrobiolLett.(1999)174(2):251画3.-Kieser,T,Bibb,MJ,ButtnerMJ,ChaterKF,HopwoodDA.实用链霉菌遗传学.2000.TheJohnI騰sFoundation,NorwichUK.-Kuhstoss等,通过构建杂化聚酮化合物合酶产生新的聚酮化合物.Gene.(1996).183(1-2):231-236.-LacalleRA,PulidoD,VaraJ,ZalacainM,JimenezA.分子分析来自白黑链霉菌的编码噤呤霉素N-乙酰基转移酶的pac基因.Gene.(1989).79(2):375國380.-LaksoM,SanerB,MosingerBJr,LeeEJ,ManningRW,YuSH,MulderKL,WestphalH.在转基因鼠中通过位点专一重组单巴向活化癌基因.ProcNatlAcadSciUSA.(1992)89(14):6232-6.-Li,T.B.,Shang,G.D"Xia,H.Z.和Wang,Y.G.克隆来自黑暗链霉菌H6的糖相关生物合成基因蔟.ShengWuGongChengXueBao(2001).17(3):329-331.-Ligon,J.,HiIl,S.,Beck,J.,Zirkle,R.,Molnar,I"Zawodny,J.,Money,S.和Schupp,T.来自纤维素嚢菌Soce26的抗真菌聚酮化合物soraphenA生物合成基因簇的特性.Gene(2002).285(1-2),257-267.-LiuL,SaevelsJ,LouisP,NelisH,RicoS,DierickK,GuyomardS,RoetsE,HoogmartensJ.比较螺旋霉素I,II和III微生物学潜能的实验室研究.JPharmBiomedAnal.(1999).20(1画2):217國24.-MazodierP,PetterR,ThompsonC.大肠杆菌和链霉菌之间的基因间接合.JBacteriol.(1989).171(6):3583画5.曙MerrifieldRB,1965a,Nature,207(996):522-523.-MerrifieldRB.,1965b,Science,150(693):178-185.-Merson-Davies,L.A.和Cundliffe,E.来自弗氏链霉菌基因组tyllBA区域的5个泰乐菌素生物合成基因的分析,MoleculorMicrobiology.(1994).13(2):349-355.-MillerVL,MekalanosJJ.—种新自杀载体及其在构建插入突变中的用途霍乱弧菌(Vibriocholerae)中外膜蛋白质的渗透调节和毒力决定簇需要toxR.JBacteriol.(1988)170(6):2575-83.-Nakano,Y.,Yoshida,Y.,Yamashita,Y.&Koga,T.一系列pACYC-来源的质粒载体的构建.Gene(1995).162:157-8.-NielsenH.,EngelbrechtJ.,BrunakS.etvonHeijneG.原核和真核信号肽的鉴定和其切割位点的预测.ProteinEngineering.(1997).10:1-6.-OhSH,ChaterKF.环状和线性DNA的变性作用有利于天蓝色链霉菌A3(2)的靼向性整合型转化与其他有机体可能的相关性.JBacteriol.1997;179(1):122-7.-OlanoC,LomovskayaN,FonsteinL,RollJT,HutchinsonCR.—种用于聚酮化合物抗生素糖基化作用的双质粒系统s-紫红霉酮生物转化为紫红菌素D,ChemBiol.(1999).6(12):845-55.-OmuraS,KitaoC,HamadaH,IkedaH.16元环大环内酯抗生素的生物转化和生物合成.X.在螺旋霉素生物合成的最后步骤使用酶抑制剂浅蓝菌素.ChemPharmBull(Tokyo).(1979a).27(1):176-82.-OmuraS,IkedaH,KitaoC.来自生二素链霉菌的螺旋霉素I3-羟基酰基酶的分离和特性.JBiochem(Tokyo).(1979b).86(6):1753-8.-Omura,S.,Ikeda,H.,Ishikawa,J.,Hanamoto,A.,Takahashi,C.,Shinose,M.,Takahashi,Y.,Horikawa,H.,Nakazawa,H.,Osonoe,T.,Kikuchi,H.,Shiba,T.,Sakaki,Y.和Hattori,M.工业微生物除虫链霉菌的基因组序列推断其产生次级代谢物的能力.Proc.Natl.Acad.Sci.U.S.A.(2001).98(21),12215-12220.-PearsonW.R.和D.J.Lipman.用于生物学序列分析的改良工具.Proc.Natl.Acad.Sci.USA1988,85:2444-2448.-PearsonW.R.使用FASTP和FASTA进行快速和灵敏的序列比较.MethodsinEnzymology.1990,183:63-98.-PernodetJL,SimonetJM,GuerineauM.在生二素链霉菌不同菌株中的质粒质粒pSAM2的游离和整合形式.MolGenGenet.(1984);198(1):35-41.-PernodetJL,AlegreMT,BIondelet國RouaultMH,GuerineauM.在生产微生物生二素链霉菌中,对螺旋霉素的抗性涉及到至少两种不同的机制.JGenMicrobiol.(1993);139(Pt5):1003-11.-PernodetJL,FishS,Blondelet-RouaultMH,CundliffeE.通过使用特定删除的浅青紫链霉菌抗生素敏感菌林赋予大环内酯-lincosaide-链阳性菌素B抗性表现型.AntimicrobAgentsChemother.(1996),40(3):581-5.-PernodetJL,GourmelenA,Blondelet-RouaultMH,CundliffeE.在螺旋霉素生产菌生二素链霉菌中由srmA赋予对螺旋霉素的非必需核糖体抗性.Microbiology.(1999),145(Pt9):2355画64.-Pfoestl,A.,Hofinger,A.,Kosma,P.和Messner,P.嗜气热石克胺素芽孢杆菌L420-91T中dTDP-3-乙酰胺-3,6-二脱氧-a-D-半乳糖的生物合成.J.Biol.Chem.(2003),278(29):26410-26417.-RaoRN,RichardsonMA,KuhstossS.用于克隆和分析链霉菌DNA的粘粒穿梭载体.MethodsEnzymol.(1987);153:166-98.-RaynalA,TuphileK,GerbaudC,LutherT,GuerineauM,和PernodetJL.染色体用于pSAM2插入位点的结构在大肠杆菌中的功能分析.MolecularMicrobiology(1998)28(2)333-342.-Redenbach,M.,Kieser,H.M.,Denapaite,D.,Eichner,A.,Cullum,J.,Kinashi,H.和Hopwood,D.A.—组有序粘粒和8Mb天蓝色链霉菌A3(2)染色体的详细遗传图诿和物理图i普.Mol.Microbiol.(1996).21(1):77-96.-RichardsonMA,KuhstossS,SolenbergP,SchausNA,RaoRN.用于链霉菌类的一种新的穿梭粘粒载体pKC505:其在从生二素链霉菌文库中克隆三个不同螺旋霉素-抗性基因的用途.Gene.(1987);61(3):231-41.-Robinson,J.A.微生物中次生代谢的酶.ChemSocRev.(1988).17:383-452.-RussellSH,HoopesJL,OdellJT.从植物基因组进行直接的转基因切除.MolGenGenet.(1992).234(1):49-59.-SambrookJ,FrischEF,ManiatisT.分子克隆实验指南第二版.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYorkUSA(1989).-SchonerB,GeistlichM,RosteckPJr,RaoRN,SenoE,ReynoldsP,CoxK,BurgettS和HershbergerC.大环内酯-抗性决定簇和ATP陽结合转运蛋白质的序列相似性.Gene.(1992).115(1-2),93-96.-SezonovG,HagegeJ,PernodetJL,FriedmannA和GuerineauM.作为pSAM2中复制控制基因及生二素链霉菌整合元件的pra的特性.MolMicrobiol.(1995).17(3):533-44.-SezonovG.,BlancV.,Bamas誦JacquesN.,FriedmannA.,PernodetJ丄.和M.Guerineau,通过过量表达始旋链霉菌生物合成基因使抗生素前体完全转化为普那霉素IIA,NatureBiotechnology.(1997)15:349-353.-SezonovG,PossozC,FriedmannA,PernodetJL,GuerineauM.来自链霉菌整合元件pSAM2的KorSA是一种中心转录抑制子靶基因和结合位点.JBacteriol.(2000).182(5):1243-50.画SimonR.,PrieferU和Piihler.用于体内遗传工程的一种广镨宿主范围可动系统革兰氏阴性细菌中的转座子请变.Bio/Technology(1983).1:784-791.-Simon等,用于根瘤菌(rhizobia)和其他革兰氏阴性细菌的遗传分析和操作的质粒载体,在A.Weissbach,和H.Weissbach(编辑)的酶学方法,118巻,AcademicPress,Inc.,Orlando,1986—书中的640-659页.-Summers,R.G.,Donadio,Staver,M.J.,Wendt-Pienkowski,E.,Hutchinson,C.R.和Katz,L.对红色糖多孢菌中红霉素生物合成基因簇中涉及L-mycarose和D-红霉脱氧糖胺产生的基因的序列分析和请变.Microbiology(1997).143(Pt10):3251-3262.画VanMellaertL,MeiL,LammertynE,SchachtS,AnneJ.谨菌体VWB基因组对委内瑞拉链霉菌的位点专一整合和基于VWB的整合栽体的构建.Microbiology.(1998).144(Pt12):3351-8.-VaraJ,Lewandowska-SkarbekM,WangYG,DonadioS,HutchinsonCR.红色糖多孢菌(红霉素链霉菌)中控制红霉素生物合成途径中脱氧糖部分的基因的克隆.JBacteriol.(1989).171(11):5872-81.-VaraJ,MalpartidaF,HopwoodDA,JimenezA.来自白黑链霉菌的噤呤霉素N-乙酰基转移酶基因在浅青紫链霉菌和大肠杆菌中的克隆和表达.Gene.(1985).33(2):197-206.-Wahl,G.M.,K.A.Lewis,J.C.Ruiz,B.Rothenberg,J.Zhao,和G.A.Evans.用于快速基因组步移、限制性酶图谦和基因转移的粘粒载体.Proc.Natl.Acad.Sci.USA(1987).84:2160-2164.画Waldron,C.,Matsushima,P.,Rosteck,P.R.,Broughton,M.C.,Turner,J.,Madduri,K.,Crawford,K.P.,Merlo,D.J.和Baltz,R.H.刺糖多孢菌(l)中spinosad生物合成基因簇的克隆和分析.Chem.Biol.(2001)8(5):487-499.画WalczakRJ,HinesJV,StrohlWR,PriestleyND.,通过重组DoxA,一种来源于链霉菌菌株C5的P450-单加氧酶,对蒽环霉素类似物desacetyladriamycin的生物转化作用.OrgLett.(2001).3(15):2277-9.-Wang,Z.X.,Li,S.M.和Heide,L.利尻链霉菌DSM40489香豆霉素A(l)生物合成基因簇的鉴定.Antimicrob.AgentsChemother.(2000)44(11),3040-3048.-Ward,J.M.,Janssen,G.R.,Kieser,T,Bibb,M.J,Buttner,M.J.&Bibb,M.J.使用源于Tn5的氨基糖甙磷酸转移酶作为指示剂,用于链霉菌的一系列多拷贝启动子探针质粒载体的构建和表征.MolGenGenet(1986).203:468-478.-WehmeierUF.新的允许在XGal板上进行兰-白斑筛选的多功能大肠杆菌-链霉菌穿梭栽体.Gene.(1995).165(1):149-150.-WilmsB,HauckA,ReussM,SyldatkC,MattesR,SiemannM,AltenbuchnerJ.>使用一种基于大肠杆菌启动子的表达系统进行高细胞密度发酵以产生L-N-氨曱酰基酶.BiotechnolBioeng.(2001).73(2):95-103.-WorleyK.C.,WieseB.A.,和SmithR.F.BEAUTY:将多种生物学信息资源与序列相似性查找结果相结合产生的一种加强型基于BLAST的搜索工具.GenomeResearch(1995).5:173-184.-WuK,ChungL,RevillWP,KatzL和ReevesCD.吸水链霉菌子嚢霉素变种(ATCC14891)的FK520基因簇含有用于罕见聚酮化合物延伸单位生物合成的基因.Gene.(2000).251(1):81-90.-XueY,ZhaoL,LiuHW和ShermanDH.委内瑞拉链霉菌中用于大环内酯抗生素生物合成的基因簇代谢多样性的体系结构.ProcNatlAcadSciUSA.(1998).95(21):12111-12116.YuD,EllisHM,LeeEC,JenkinsNA,CopelandNGetCourtDL.一种用于在大肠杆菌中进行染色体工程的有效重组系统.ProcNatlAcadSciUSA.(2000).97(11):5978-83.序列表<110〉安万特医药股份有限公司科学研究国家中心<120>参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用<130>螺旋霉素生物合成(2)<140〉<141><150〉FR0212489<151〉2002-10-08<160〉139<170>Patentln版本2.1<210>1<211>30943<212〉DNA<213>生二素链霉菌(Streptomycesambofaciens)<400>1attcccggggcgccgggaaaccggcacgccattccgaccacggcaacggc60gtcggaccggtcgtcactgcggg犯3tcgcgagttctccagacacctgcatccctcatat120gttcgccgtaccacgccgtggcttttctgccttttcttgatcttcccgagcgtacagcgg180gcgaactgccgggcgacaggaacggccggtg犯cgacaatcaattgtgtcaagttcggag240attgtccaccgattctxgtcaccgg卿cggcgcgggatcatgcgggaccacacggcatc300gcaccaggtccgcagggtcggcgctccgacgtcccggccggtcgcgcactccggtgacct360gcacgcggagtcctgggcgatttcagtacctcgcggcgcgggacaaccac420ttcgcgacgaatatgtcaggtctccccgagcggtccgtgccgccccgccctgacccgtcc480gcgcccgtcccgctccgccccggtcgtcatctcggccggaatttcagtcggcagctcettt540gtgtcaggttcgccttgccgacattctccggagattcctaagctctgccggt犯ccggga600ccgg犯ccaccgtgccgcgcgttcggtccacacaccgcttttcg鄉agtccgactgatg660ggtgaggccgtgacgggaccgatggagctggacgcggacgcccgggggctgctt720gagtggttcgcgtacaacaggacgcgtcatccggtgttctgggacg柳cccgacaggcg780tggcaggtcttcggctacgacgactacgtgacggtgtcgaacaacccgcagttcttctcc840tcggacttcaacatggtgatgccgacgccgcccgaactggagatgatcatcggtccgggc900acgatcggcgcgctggacccgcccgcgcacggaccgatgcgcaagctggtgagcc柳cg960ttcaccccccg3Cgg3tCgCccggct哪gcccagggtgcgcgcgatcaccgaggagctc1020ctggacaaggtggggcagcaggacgtcgtcgacgccgtgggtgacctgtcctacgcgctg1080ccggtcatcgtgatcgccgaactgctgggcatacccgccggcgaccgtgacctgttccgg1140gagtgggtcgacaccctgctgacg獄gagggcctggagtacccgaacctcccggacaac1200ttcaccgagacgatcgcgcccgcgctc犯ggagatgaccgactacctcctgaagcaga/tc1260cacgccaagcgggacgcgcccgccgacgacctggtcagcgggctggtccaggcggagcag1320gacggccgccggctgaccgacgtcgagatcgtcaacatcgtcgcgctgctCCtg3CggCg1380gggcacgtctcctccagcaccctgctcagcaacctgttcctggtcctggaggag肌cccg1440caggcgctgga柳cctgcgggccgatcgctccctggtgcccggcgcgatcgagg卿cg1500ctgcgctaccgcagccccttcaacaacatcttccggttcgtc卿gaggacaccaccgtc1560ctcggtccgctcatggagaagggcc卿tggtgatcgcctggagccagtccgccaaccgg1620gacccccggcacttcccggacccggacaccttcgacatccgccgctcggacggcacccgg1680cacatggccttcgggcacggcatccaccax:tgcctgggtgccgccctcgcccgcctggag1740ggcaaggtcatgctcgaactcctcctggaccgggtcc犯ggcttccgcatcgaccacgag1800cacaccgtgttCt3Cg3ggCcgaccagctcactccgaagtacctgcccgtccgggtcgac1860tggaactgaacccgagggtctcgtcccggagtccagggccgtcccgagccggccctggac1920ctcacgaccgcccgataaggagcgccgccatcgccgagaacacagccgagctccctgccc1980ggcgggtcggcaggatcaagccgtgccggctgatcaggctcgagcagcacatcgacccgc2040gcggcagcctctccgtgatcgagtccggcgtgaccgtggacttccccgtccgacgcgtct2100actacatgcatggccagacccagtcctctcccccgcgcggcctgcacgcgC3CCgC3CCC2160tggaacaactcgtcatcgccgtccacggcgccttctccatcaccctcgacgacggcttcc2220agcacgccacctaccgtctggacgaacccggagccggactctgcatcggccccatggtct2280ggcgcgtcctgaaggacttcgaccccgacaccgtggccctggtcctcgcctcgcagcact2340ac柳gagtccgactactaccgcgactacgacaccttcctgcatgacgcacggagcctcei2400catgaccatccccttcctcgacgcgggcgccggctaccgggagttgcgagccgagatcga2460cgcggccctgcagcgggtgtccgcctccggccgctatctgctcgacgcggaactcgcggc2520cttcgaggaggagttcgccgcgtactgcgaca^cgaccactgtgtggcggtgggcagtgg2580ctgcgacgcgctggagctgtccctgcgggcgctggacatcggtcccggggscgaggtggt2640ggtgcccgcgcacaccttcatcgggacctggctggccgtgtccgctaccggggcacggcc2700ggtggccgtcgacccgacgccggacgggctctccctcgacccggcgctggtggaggcggc2760gctcacccctcggaccagagccctgatgccggtgcacctgcacgggcacccggccgacct2820cgacccgctactggcgatcgccggacggcacggcctggccgtggtcgaggacgccgcgca2880ggcccacggcgcccgttaccggggCCgC3ggatcggctcgggccacgtggtcgcgttcag2940cttctaccccggcaagaacctcggcgccatggggg3CggCggcgcggtggtcacgggtga3000ctccggtgtggccgagcggatccggttgctgcgcaactgcggctcgcgggagaagtaccg3060gcacgaggtgcgctcgacccactcccggctcgacgagttccaggcggccgtgctgcgggc3120caaactgccgcggctcgacgcgtggaacgcccgccgggccggcacggccg咖ggtacgg3180gcgggccctgggtccggtaccgcagatcgccgtcccggtcaccgctccctgggccgaccc3240ggtgtggcacctgtacgtgatccgctgcgcggagcg卿cgagctgcgccgccggctgga3300acgagccggggtccagaccctgatccactaccccgtgcccccgcaccggtccccggccta3360cgccgacgacccggccggcgcaccggcggggacccacccgctcagtgagcgcctggcggc3420gcagagcctcagccttcccctgggaccgcacctcggggaggacgaggcccgcgccgtxgt3480ggcggcggtccgggcggcgtccgcagggctggcggcgtacccgacgccggacggccagcg3540ttttcctctagtgacgg卿aacgatgaccgaggtcatgtcagggcgtcccgg肌tgaaa3600gggatcatcctcgcaggcggcggagggacccgcctacgccccttgaccggcacgctgtcc3660aagcaactgctgcccgtctacgacaagccgatgatctactacccgctgtccgtcctgatg3720ctgggcggcacggctgctggcccgagggcagcgctcatccagcatccgcctacggcgtcgcggccccgctatcgccaagaacctacctgggacatgggcacgcggccgacaccc3tgg3ggtggcggccgacggcttcgtg犯cgctcgacgcgccggctgcgggggggtcgeiccgccgacgccggccgtacgcggaggggtccggcgtcctcccacccgctgccaccagcagccgeictggctggcccggcgaggcgtctgctggggccacgacgccgcggatccgcgtggtggctcgacctgtttcccgcacgcggatcgagggtcgacaccacccccggtgggcgctccagcgccgtcgacccgcaagctcgctgcccgtgaccgctggactgaggcggcggggccacttctgagccgctgccacggtcgagtccgcgagatgcgscggctctagcgcaggctgggcgacaaacctcgacgggcgagatcgaccaacctcgcacatccggccagc8ga犯cgcccacgactctgcggatcgctccaccggctCC3CCCgtgCccgccggcccgcgctgctggctcacctacgatcttcccggctggtggtgcttcgtgcgcacccgggctgttggcccgagggacctgctggtccaacaactctcctcgacgcacgtggacggtctacaacaaaactgtgcgcggcgctactaccatcgacggcgcccgcgaggctccgccgcgggcggctctcgtggccgttcgagggacttgctgttcggggcggggagcggccgatgacacggcaccgatccgc肌cg3gccccctcaccctggcacgatcccgtacca"tgtcggccggtacgccgtcccctcgtcgtcccgcctcggccatcaccatccatcttccacctgtgtgctgcgacc鄉gccgtcaccggcctcggcgcgccgcccggctccctcctccagctgcatcgagcggccgcgaaaggcaccgaaggatcctcgtacggctccctcgggcaacctgggacatccgacttcgcggcccaacgtgcttcgtgcacgtagcacccgctcgctggcccaacgggccctagcgggaccgtaccactgccgtcggcggcgggagccgactgccgtcgactaaagggctggagtaccagccgggcgagttcgccagtaccccggccgagcccgcacagcatgggctccggtgcgtgcacctccagccaggtgctaccgggcccgtgttcaxxggcggcggcggcggaccgcggacgcgcggtaccggcgtactcctccacccctcgacatcaggcaccgaccggccccggctttcggctaccgtactgctgtctctacctctggcgaactcgatcga^ctggggcggccagtgagatcgcccctgggcaccttg卿cgccgcaccgggggcgccggagttcggccaatctgcgaccgcggccgagtcgcacgggcacccagctcgacggacg肌ccccsacccaccgcacgCC3gt3CCCgcccgctctacgggcatcgcccaccgagctggtcggcggtgcaccaagatcgcggaccgtgatgacggtgatccgcgtcacttcctgccgtgggcgccaggctggccggccggcgcgctggcgcctggtggtacgacgacgttcgccgatcgtggcggcctggcgccgacgtccgacgtcggaggtgtgcggtccggcgggcgcggaacggagcacatcgacctacgccga3catcggcgatctcggccgtcggtcagcgaccctggaggaacgacaacgaagatcacggagccacggcttacgtccagcttgcgcatgggccggatacggcgccggcccggccggcttcaggcaaacccggccccggtgggcggtcacccgtggaccgctgtcctcctccgaggtgtacgtcgccctacgcacggactgcgagaagatcaggggacggcgctggtggcccagcaacgtcgcggcgggtgcgcggacgagccactggtacccgaccgcatcccgccgtccgtcacccggcaaccgcaggagtgctggaggctggcctacgatctccgggcgaccggctggtcggagctgctacgcccaccgaccccsccgtagacgcgcacgggccctggttccgcccggggtgagggtctgctgttccag3780acaggccgag3840ctcaccggtc3900gctccagggc3960cccgaagcgc4020gaaaccggcc4080cgtggtcgac4140cgtcaacagg4200cgcctggctc4260catcgagcag4320cttcatcgac4380cgcgtacctg4440cccgctccgc4500tcggctcgcg4560aggtgagggt4620gcgactgtcc4680aggcgatggc4740cgatcgacga4800aggaggcact4860gctccatcga4920ccgcctcgaa4980cggtgtgcgt5040tcccgctgtt5100gcaaccggcg5160ggggcggccg5220agctcacgga5280ccgaccgcaa5340tgggttacgc5400ggg&g犯ccg5460cgtggacccg5520gctggtgtgc5580gctgccggac5640cgaaccgctg5700gcaggccggc5760ggtcgcccgc5820ccgggccccc5880cgaggaactc5940ccggctggtg6000cccgggggcg6060gaccgcggcc6120cttccccggt6180cgacacgctc6240gtgacgtggg6300ccgccgacac6360cctggacagcccggtcaccgcgctggcggaggtgccccgctggctgg鄉aataccaccg6420ggcgcaccgcttccacgtcgagccgatccccttcgaccggctccggcggtggtccttcga6480gccgggcaccggcgacctgcggcacgagacgggccgcttcttctccgtggaggggctgcg6540caccagctcggacgccgatccggtcgcccgtgtccagccgatcatcgtgcagcccgaggt6600ggggctgctcggcatcctggcccgggagttcgacggggtgctgcacttcctgatgcaggc6660caaacccgagcccggcaacgtc犯cgggctgcagatctcccccacggtgcaggccacgcg6720cagcaacttcgacgaggtgcaccacggccggtccaccccgttcctcgaccacttcatcca6780ccgccccggccgccgggtcctgatcgacagcatccagtccgaacagggcgactggttcct6840gcacaagcgctggtcgtcgagatcgacaccgacatcgaggccgacgccgc6900gttccgctggctgaccctcgggcagatccgccggctgatgctccagga_cgacctcgtcaa6960catggacacccgcagtgtgctggcctgtctgcccaccgcgcacggcacgcccgacgacgg7020tgacgactccttcccggcggcgctgcgccgctccctctacgggg柳ccgcgccgttgca7080cgatctgcacgccatcaccagctgcctcaccgacgtccgggcgctgcgggtgctgcgcca7140gc卿gcgtgccgctcgacgacgcccggcgggacggctgggagcggaccggg3gcgcgst7200ccggcatcgcagcggcaggcatttcgagatcatggcggtgg3ggtg3CCgcggagcgccg7260tg卿tggcctcgtggacccagccgttgctgcgcccgtgctcgcagggactggcggccct7320gatcacccggcggatcaacggggtgctgcacgccctggtggcggcgcggtcggaggtcgg7380cacgctcaacgtcgccgagttcggaccgaccgtccagtgccggcccgacgaggcggacgg7440ccetgtcgcccccgtacctggaccgggtgctgacggccggagccgaccgcgtccgctacga7500cgtggtgcagtcggaggagggcgggcgcttctaccacgcgcgcaaccgctatctggtggt7560cgaggcggggccggagctcgacacgggctgcccgcccggcttctgctgggctaccttcgg7620ccagctcaccg犯ctgctcgcgcacggcaactatctcaacgtcgaactccgcaccctcat7680ggcgtgcgcacacgcctcctactgaatggtcacgaaagctgcaccgcgcggg柳atcgg7740cagcgcgccaccggccggccggcacccggaagg恤agcgccgttctcccgcatcggcgc7800cctgcgggaaacggcgg犯cggccggcccggaccgcgcgcaattcccggcgggacacggt7860gggagcccgcacgaggaaccgctttccccgccttcggtgcgcccggccgcgggaccaccc7920ccgcctcccggccgggccgcggaatacgacgggggcggccgaggacattcctttcccgcc7980tccggaaaagcgcgccccgagggcccccga3tgccgggcgggacggacggcgactgcgcg8040cggacggcggcccggcgtcgaacgcacctgcccgagtccgg£LCgag£lC£Lgcgcgacgcga8100gaggcgaaaatgatcaatctcttccagccccagatgggggggcggcggtg8160tccgaggtcttcgacgaccaatggctcggtcacggaccccggaccgcggcgttcgagtcc8220gcgttcgccgagcacctcggggtcggccccgagcacgtcgtcttcctcaactcgggcacc8280gccggcctcttcctggccctggagtcgctcggcctgcggcccggcgacgaggtcgtgctc8340ccctcgcccagcttcctcgccgcggcg犯cgccgtacagctctcgggagcgcgcccggtg8400ttctgcgacaccgacccgcggacgctgaaccccgccctggagcacatcgaggcggccgtc8460accccgcgcaccagggccgtcatcgcgctccactacggcggccaccccggcgacatcgtg8520cgcatcgccg柳gctgccgggagcggggcatcaccctgatcg柳acgccgcgtgctcc8580gtggcctcccgcgtcgacggccgaccggtcggcaccttcggcgacctcgccatgtggagc8640ttcgacgccatg犯ggtcctggtcaccggcgacggsgggatgatctacgtcaaggacccc8700ggggcggccgcccggatccggcgcctcgcctaccacggcctcacgcggtccagcggcctg8760ggatacgccagggtctcggcgcgctggtggg卿tggacgtccccgaaccgggccgccgc8820gtcatcgggaacgacctcaccgcggccatcggcgcggtccagttgcgccggcttcccggc8880ttcgtggcccgccgc鄉gagatcgtcgccctgtacgacagcgaactgagctcgctggag8940ggcgtgctgacaccgcccgcgccacccgcggggcacgagtccacgcactacttctactgg9000atccagctggtacaccacctgaactgcccgctgtcggacggatccggcccggacaggggcgtcagcgacgcgtccaggccagtccacctcccatccgggtccggtgccgtaccacggttccgtcctccagcgtcgaacgtggagccgctccgtagagctttggccgcgtcagtccttgcgtgggaatcctcgctcggggcacagttcacggcccccgggggccggaaatcggttgaagaggc肌caccc3accctctcttacgaacggtcctttggtaaa鄉ggtccg3cggcaccacgaggaccggattcgagtaccgtcgtcgccgctgctgaagcttgctgagcgcgcggactggggggacaacagcccccggcgttccgctacgcgcgtggagcgccgacgtccgccgcctgacgcgtggcgcgtcgtgccgaggggccttgcgggctgcggtgcccgcccgcccccgcagggcggacggccagggtcggccgtgctcgccgaggctcggcgcggggcgaaggcccggcgtacgtgtcctggtagccgggccgtggggggcggccccgagccgggcggggcgcgcacggtgtggcgcagccttcactgaaggacggtcgaatagaacctcggtcggcacagggat卿agacgaggagcgaatacgcgccgactgccgcgaccggccggcggggcggacgtctcccgacggcaaccgccatggtgcttcacgcacccgggaccggacctctgcacggcgtccgaacaccgtcgtgcgcgcacgcgcctgcggacgaagaagcccgtacgcggcctcggatgccct"tcccgggtcgtgggtgg柳acaccgtccggtCtCC3ggttcgaacgcccgccgcc自ctccaggtgggtcccggatcaagcaggtcgt卿ggggaactgccgccggcgtcsagg肌ccggcgacgcgccccgggccaaccccggcccgccggatatcgta/tgtcctcatcteigacgggggggtgccttcggacgacggaccggctcagagcgcttcagaggcggagcaaggacctgctacgtcggccgcggtcaaggcgcacctgccgtcgaggccggtggcacgcg犯ggtgcccgcggaccctgttcctccctgcccacggccccgtccgggccagtgagccctccgtactccgcccgcggtgtgagtgggagaccgtggccgtccggtcaggtgacccgatcgagcatgtcaccactcggacagtaccggtgccggtcggtgacagacctcggccgtgggtctgccctcgcgatgacggggtggcacggattcgccgggtagctggcctttatgggccatgaagcgctgaagccaatccttgaagcgggatgagcactcgcctttggcccgcgcaccggctcgctcgcggcccttggagtccattgcacgaggatcgccg柳ggcgctccctttcgacgacatacctgctcaccctacggccagcctgcccctgcagagcccttgtcccggcgccccgccgtxgcccgtcacgacgcgag犯ccgcgatcaggacgggcgacgcagg卿gtgccgcgccatggctgaacatggcggtggaggctccaggccggC3CgCg3tgccgggcggccggcactgtcggatctccgtatcagtcaagtgccaaccggttatgcctcgtgaattcatttccccggccttgccg犯gacgagcgt犯tagtgacctgggtcctcgagttccgaacgctcgcctcaccgcgggtcgacgcccgcccgcagaggaccggcccctaccggctgctggaccccgcgtccgcgccgcgcggtcctccgaccgtcaatctggccgcggcaactgcgccgacctccatcgcgacggcggccgtcccgggtgcggcatggtggcgatcccaggacatcgtcgcacctgcgccg鄉cgctgtgcgccgctgacccccagagcgcaaccggcgaggcccgtcacgcaggctcggcggcgggggcgaaccacgaggtcacggctggtcgagcaccgcccttgatggacaggagccggcctgatgggggtccctgctgtgcggagctccaccgcgcgcaccgcgcggcgccgtgcagcccgcgacggcatc9060caccggaggc9120gcaccccggc9180gagcgccgcg9240gtgaccgccg9300ccgtcggtgc9360acgtactcga9420agcgtgaggt9480tagtggatct9540ccctggtcgc9600tcggggaagt9660gcggcgscgg9720cagaccacgg9780gtgacgccgg9840ctcacgcggt9900tcgagcaggc9960tcacccgcgt10020ttctcgtaca10080gtgcgccgtg10140cggacaccca10200cgggcgctcc10260tgctcgttcc10320tcaccgcagc10380ccaccgtgcc10440tcagccaggc10500gac卿gggg10560cctgtcaatg10620tctggtg肌g10680atcgcccggt廳Oggcgccgacg10800cagtcgatga10860gcgcacgagt10920gcacggctgc10980ggcacggtgg11040ccggccgacg11100gactacctcg11160gaaggcctgc11220ctctacgtcg11280tcgctcgccg11340gacaccatcg11400cgcaggtccg11460gactcgttac11520ctcgggcgcc11580cgctcgccgagtacgggaccctgcgccccggccgggccgccgagaccggccggcccaccttgcttcccgggggcaacgccggcttcctgcccgccgtccccctgctcccgatggtcgcccacgacgactcccccaaggcgcagagccacccccgctcacccacgctcctcagggaacgcgcgcacgtggtgctggtggcggacggaccccgcgccgactacgcgaaggagctxggcgggctgctgctgcccggcgacgaccccgtcgccgaccgcgccgggcaccccgtcaccgtgggggtcgccgacgcgcaccgtgaggccgcgaagtacggcggcaccgcgtgcgcctccgacctggacgacgtccccggttacatcaggacgacgagcttcacggatctggttcccactctgaggggtgccgcagagacactgcgcgtgcacccgagcgtactgctgggagaggactggcagtcactgcggctctatcaggtgcgctcggcgctcttgctcggatcgctgcgcgagtgacctctccgatcgcgccgacaggcgggcgttgaccaccgggcccgcgtggttcagccggcgctgaactgggcgccggtgaaccgggaccgcatccgacggtagtccgcgagtgcctgctccaactcctgctcgtccagcagcagcaggtccatcgggtggcgctgcccgtaggacagatccttcacgccgagcgacagcagtttctccgcgtggtcctcccgcagcacggtcagtccgggcgcccaggggcagccgacgcgcaccgagccgccgtccgaggtggacttgcccgcaccgttgggacctgtcagggagtccacggcgagccgacccgcgacctccgcctccgggcccgcggtgtcgatgccgtggaccgggttctcggtcagctgcgccatcgcgccgtggtcgcgccctcgcctgcggttcttgcgcgggatgccgtccatccgcgccacgagttcggcacgccactcctcgtactcccccgtcaggtagccctcgtagccgttgccgtggatcgtggtggtgagccggtcgagg卿acgcggtggccggccaggtggtcctccagcctcggttcgtccaggagcagcagctccggcggggagcgttcgccaccggagagggttccgacgaggccgtgcagcgcgacctccacgcgcaactgctcgaccagagcggcgtagcgctggatctcgtcgctctcgcccagctccgcctcggggtcggacagggccaggtcgacggcgtccttctgcgccaggtagccgacgccgccgggagtcgcccccacgg犯ctgcgcgcggcgtgcc11640ccgtggccccgggggtctggacggtgcccc11700tgaccgacctCggtCCgg3Cgcggaccaca11760gcaccctcgcgctgcacctgcgcgtccagc11820a>gga>gttcttcgacgacctgatcggggcgc11880ccctgatgttctccctcagcttccgccgcc11940gcgggacctcgccgcggctggaggcctccg12000tgtgcagcgtgcgggacggcgccgtcgtcc12060tggcgc柳ccgccgccccggagctgaccg12120tcgcgggccccgcctcgaccgtCg8CggC312180gtctgg柳ccctccgcgcgctcggcggcg12240gtttcctcggcatgctcctcgccgagg卿12300tcggccccgtggtcgactac12360tgtacctggagtcgggcaggagccccacgc12420acaccgtctcacggcggctggagcgcatcg12480cggagcgggtgctggacatacaactggccc12540cctcgcaaccggcgtccgagacccgggccg12600ggC3CgggCggcgccccgcccgtcggcgcg12660ggccaccggtcccccgtacgacgaggtccc12720cggcgatgcgcccgtctcccatggtcagcc12780ggtcgtgggtgeicgaccacgacggcgccgc12840ccax:ca^c3ccggggtgaggtggttggtgg12900cgctcaccagccgggcgatctcgatccggc12960gtcgccgcaggtCggELCgggctgaacaggc13020CC£lggt£lgCCctcccggccctgggcg,g13080gcgtctcgtcctgccgcagatgaccgaccc13140gctccagttccccggEicagca<cccgc^ca_13200tgacgagcagccgttcgccgggccggatcg13260cgcgcacgtcggtgagttcggccaccgcct13320gggcggcgaaggacaacgggtcggcgggag13380cgcgttgcttcgcgttgcggatccgcacca13440aggcgccgtggccgaacacg13500cgttggaggtgatcagcccgcggttgcggt13560gcagccgccgctcgcgttccacggccttgg136203gCgggtg3Cgctgccggagtcgacctcca13680cccggtcgtgggtgELCCgCgatcaccgtgc13740attccatcgcccggtcgtcgaggtcgttgg13800acgaggcgagggtcgcggcg3gcgcg鄉c13860gcttgcggtcgcggtccaggctcggcagtc13920cgtcggcctcgtagccgccacgcgcctggt13980ggccggcggacagctcgcgctcggagccgt14040cctcgcgcatcgccgcttcgagctcgcgca14100ggacggtggcgtc哪gggcagttccagtg14160cgaccacggtgagcgcgccgttgtcgggct14220ccacgcggccggcgaggatcttgagcagcgtggacttgccgg認cgttgtcgccgatca14280cgccgaccttctcgcccggcttga/tgctgaaaccgacccggtcgagcacgacacagtcgt14340ggtagcgcttcgtgatgtcgtgtagggcgtattgcgc犯tcgacacgcgtaagtctcctg14400tttccacgatgaggatgagtggatgcgtgagcgcgctcgcag3犯gaacggaaagcag犯14460gggacgccaccactgcggacatggccggtcagggggtgtcacgagcacgctgctggatgc14520ggcaggcggagtcagctcaacgccgggcatcctcatctatcacagagatcccatgcgaag14580aactatagccgtgctacccggtgccgcgcaacggtatgcgtgtcgcaccggccgacgtga14640tgcagtcggaccgggatgatcgcttgtccggcggccggatgcctagcctcgggagcaacc14700acagcggtctttcacgagaggggtcgaccatgggcgatctcagg犯ccgcatcaccgagc14760tggtccgcgcgtaccaccgggaacaggcgcccgggggcttcgttcccgggacgacgcacg14820taccggtctccggcgcggtgctgagcgaggaggaccggctggcgctggtggagacggcgc14880tgg卿tgcggatcgcggccggcccggcctcccggggcttcgagcggcagttcgcccggt14940acctcgggctccggaaggcgcacctgaccaactccggttcctccgccaacctcctcgccc画Otcggcgcgctcacctcgccgcagctggaggag卿cggctgcgtccgggggacgaggtcg15060tcacggtcgccgccgggttccccacgacggtcaacccgatcttccacaacgggctggtgc15120ccgtcttcgtggacgtcgagctcggcacgtgcccgagcgcatcgagcggg15180ccatcggcccccggaccagggcgatcatgatcgcgcacgccctgggcaaccccttcgagg15240ccga卿ggtggcccgcctcgcggacgagcgggagctgttcctcatcgaggacaactgcg15300acgcggtggggtcccgctaccggggcaggctcaccggctccttcggcgacctgtcgaccg15360tcagcttctatcccgcgcaccacatcgcgatgggtgaggggggctgcgtgctcaccgaca15420acctggccctggcgcggatcgtggaatcactgcgcgactgggggcgcgactgctggtgcg15480agccgggtgaggacaaccgctgcctcaagcggttcgaccagaagatgggtgacctgccgc15540ccgggtacgaccacaagtacatcttctcgcacgtcggttacaacctgaagtcgaccgacc15600tgcaggcggccctcgggctgtcccagctgacccggatcgaggagttcaccgaggccaggc15660gcgccaactggCggC3tCtgcgcgccgcgttggacgggctgcccggtctgctgctgcctc15720atgccacaccgggcagcgatccgagctggttcgggttcctcatcaccgtggacccggacg15780ccgcgtacagcagggcggccctggtcgaccacctggaatcgcgccggatcagcacccgcc15840gcctgttcgggggcaacctcgtgcggcaccccgcctacaccgaccgtcggtaccgggtgt15900ccggctccctggag認agcgacctgatcaccgaccagacgttctggatcggggtcttcc15960ccggcatcaccccgg卿tgatcgcctacgtcggcgacacgatccgggagtgcgtgctca薩Oagcactcctgaggggcggcggtacgggggtgcgcgtggaggggaggaccggggcggtcct16080cctccggggcgtcacggccgcgg肌gcgtccgaagctccgaggcg鄉tcggggtggacc16140cgcgcggtgagcagggtgccctccggcgtgtgctcggtgctgagcacctcgccctcgtcg16200tgcacccgcgccaccaggctcccctcgtcgt3ggggdtC8cgacctccacctccacctcg16260gggtgcggcagcaggcggtcgatcagttcccgcagctcgtcgatgccccgacccgaacgg16320gcggacacgacgatcgcgtccggctcctgctccagcagacgggcg鄉acgtccgggtcc16380gcgacatcggccttgttgacgaccacgacctcggtggactcgccggcgcccacgtcccgc16440agcacctcgcgcaccgaggccagctgcgcgccggggtccgggtgcg犯ccgtcgaccacg■0tgcagcaccagatgcgcgtccgcgacctcttcgatcgtggaacggaacgcctccaccagg16560tggtgcgggaggtggcgtacga^gcccacggtgtcggcgatggtgtaggggcgcccgctc16620ggcgtcgtcgcccgccgcacggtcgtgtccacagggcgttctccaccagc16680acgccggctccggtgaggcggatgacttgccggcgttggtgtagccggcg16740agggcgaccgacagcaccttgttgcgccgtcgctcctcccggttcacgtcccggccggtc16800ttcagctgctccagctcccggcggagcctggccatcttgtcgttgatccgccgccggtcc16860gtctcgatcttcgtctcaccgggaccgcgcgtggccatgccaccgccgccaccgccgccc16920atctgccgggacagcgactggccccagccgcgcagccgcggcagcatgtactgcatctgc16980gccagcgccacctgcgccttgccctcccgggactgggcgtgctgcgcg犯gatgtccagg17040atcagggccgtgcggtccacgaccttgaccccgacgacctcctccaggtgcatcagctga17100ctggggctcagttccccgtcgcacaccacggtgtcggcgccggtctcctcgacgatgtcg17160cgcagctgcgacgccttgcccgagccgatgtacgtcgccgggtccggcttctgccggcgc17220tgcacgacgccgtccagcacgagggcgcccgcggtctcggcgagcgccgccagctcggcg17280agcgaactgtcggcctccgcggccgttcccgaggtccagatgccgacgagC3CC3CCCgC17340tcgagtcgcagctggcggtactcgacctcggagacgtcggtcagttcggtgg卿gcccc17400gcgacgcggcggagggaggcccggtcctcgcggtctaactgatcgccgtcccattcctcg17460gcgtcggcgccggccatcgtgtcgtccatcagtgcgtcggctcgctgcgtgccggcgaag17520tcctcgggatgcgtcaaagtacttccaatctggggggttcgagagcgttccggggcgggg17580cgcgtccggcctgcggggccgggcgcggggccggggggtcggggccgacgtgtccgcacc17640tcgccgtcgggggccggtgccgtgg鄉tcgctgccggaactcacatgccgtccacccta17700gccatgtcgccggggtgtgc肌ggacgta^cggcgatcacctccccagctgac卿gtgt17760gcaccgggtactgcgcccgcgggcgtg鄉cgggcgsgtgtggatgtcatgcgagtactc17820attatcgggggttcacagttcgtgggccgggccttcgccgccgaggcactggccgcgggg17880caccgggtcaccacgttcaaccggggtgtcagcggcaccgacctgcccggcgtcgaggcg17940gtcaggggcgaccgcgaggtggccggcgacctggagcggctggtgtccggaaggcactgg18000gacgcggtcgtggacacctgcggttacgtgccccgcacggtgggggcctcggccgcggcg18060ctgtccgggcacgcggacacctacctctacgtctccagcatcgcctgcctgcccgsctgg18120gcgcaggcggtccgtccggtggacgacgactcacctgcccacgactgcccgccggacgcc18180ggaccggaccacgccgacggtgactacggcgtcctgaaggccggctgcgagcgcgccgtg18240gaccggcacttcgcgggccggaccctgcacctgcgggccggtgtcatcctcgggccgcac18300gacaccatgcgcatgctcgacgcctggctgtggcgcatgcgcgtcgccgagggggagcac18360cgccgggtgctcgccccgggcaaccccgaggtgggcatgcgcctgatcgacgtacgcgat18420gtcgccgtcttcggcctcgactgcctcgcggacggccgtaccggcgccttcatcgtcaac18480ccgccggagacttcggggagttgctcacggagtgcgtcaaggccaccggt18540tcggccgcggagccggtgtgggtcgacgaggggttcctcgccgagcacggcgtgagtccg18600tggacggacctgccgatgtgggtgcccgacaccgcgcgggacaccctcgtgtgggcggcc18660ggagcaccgcgcgcccgggccgcgggtctggcctgccggcccttctccgacaccgtgcgg18720gacgcctgggaggtcgtccgggaccggcccgtcccggaactgccgctcgcggccggctgc18780ggcctgtccctgagccgggagaaggagctgctcgccgcctgggacgctcgcggcggtgcg18840gcggcgggctgacgcggcccccgaggagtgcgacgccgtttcccgctcgcggggagcggc18900gctcgcgtgtccgccccgcggcccggcggcgcgtcctgtgtcccggcgcccggggcgcgg18960ctacacggtgaaggtctcggCgCgggCCSLCgatctcgtcgaccagccccgcctggcgcag19020cgcggcgtacgactcggcggagacgtcctcggccc卿tcaccgcacggcggaagaccga19080caggatgttcacgaagtgccggtccacgggcaggacgcgctcctcccggtggtcctggcg19140ggacagccgcagtacggggtggtggctgtccggggtcgtga卿cgtggctcagggcgag19200cgagccggtgctgccgtgcagctcgtacgccgagcggtagccgtgttccatgccgaaggc19260g鄉tgggcggccacgccctggggggcggcgagcaggacgctgccggagaccacgacgcc19320ccggcggcggtcacggcgcagcacggcgccggtcaggcgcagttcgggtc19380cagcgcggcccgcagcgggtagacgccgttgtcgagcagtgcgccgccgccgatgtcggg19440tcggtagcgcatgtcgtcgtcggcgcgcggcagctctccgatggcaccggcctccaacaggaggaacatgaagttctccatcagtaccagggccgcgtcggcgtggttggcggcggcgggcagcgccgccgcggcccattcggcgtgcagcacgtcggggcgttccagcagggcctcgtagcccagggccttggcccggtccgcgtcgcgggtgg卿gcagggcgggcagggtgcgacggaagcgcagcaccggggacgcttccggccgagaagtacccagggcggtcatggatggttccgtggtgaacggccggcgcacacccacgagacccggcggcccgacgcgacggcaaggccgcggtgccccgcgtacccgctgacctgacacgccgcccgggttaggtgagcgcggcgcccgctcggggcacgccgttggag卿gg卿cggccgaccgcgaactggggcgcagactgcacaaccacggtgacccgtacgccctcatcctggaggagcgggtccgcgagggcgggccgctggcggacccggaggtggccgcggccgtgctggccggacggcgcccggaggagtacctccagcgcgccgcgtacgcgcgtctgcggcgggtggccgcgtggcgccggctcggcgaggacgtcggcctcgacctgacggcggacttcgcccgcctcggggtgccgggcgaacggtgcgacgagctgctggacggtctgctgtgtccgcagacggccgaggggctgcgcgcgctgttggacgaggagggtgcggtggcccgcatggtcggcgccgccgtgtgcctggcgctctcggccgtcgaacggctgctgctcgaccgacccgagtggtggccggccgcggtccggcacaccctgcggcacgcccacgaggacgtgacggtggcggatcgtctcgtgggcgcggcacggcgcgcgggcgccgcaccggcggcggagctgccggacgacctgcgtgccgccg卿ccgcgctgggcgtgctgggcgacatcgtccggcggcgccgttccccggcgtactcctgacgggcccgcggccggcgtggagtgccgtgcgcgtcctggtgacctccataccgctgatctgggctctgcgtgcctcggcgctggtcgacgccatcaccgccagcggcacgctggcgcagatcttcgaggaggtcgaggacgagttcgacttcttcggcaccctgaaggagcaggtgatcctgtccggcctgtggctgggcatcgtcgacttcgcccgggcctggaagcatgcggggccggtggcggcccgggcgtgcgcgggstggtg犯ggcggcggagaaggtgcg19500ggctttgacggtggcgtgttgagagtggtg19560tccgcgctcccgggccatggcgaacaggcg19620cttctccacg柳acgtgtttgcccgcccg19680catgctgggcaccgcgatgt柳cggcgtc19740gggcgcgaccgcctcgcagtcgaagtgcct19800gctgccgacgcaggtcagcacggtgccggg19860gcccgcgatgtcgccgcagccgatcgctcc19920cggcgggccgggtgcggcgaacggttcagc19980cgtcaatcggtccggatggtcacggcacag20040tcgcttccggcaatgggcggccctgaagct20100atctgacacagtgccgcgccgagggaccgt20160tacgccgaccaatctgtggacggggcggtg20220cggtgaccgcgELCgCCggtCcgaagcggcc20280cgggtgscggacgcgatcacgaccgagctg20340cggatacgcggcgtccactggtatttcggc20400cgcggtcagaccgacgacccgtcggtgtac20460ttccgcagccgt織gggacctgggtgacc20520ggcgactcgcgcttcggtgcgctggaccgc20580ccgtcgcccgccacgtacctggggctggsc20640gccgagcccgtgctgggcgcggacgccgcc20700gggcgccggctgctcgccggccgcggttcc20760cggctgccggcattggtcctggccgcgtgg20820tgggaggagtcgctgcgggcggcggggccg20880ctggcggccacccgtgcggcggactcggcc20940gtggtcgccgcgcgtcccggcgggtccggc21000ggagccgcccccgacgacgcggtggccgcc21060ccgacgacgaccctggtgtgcgaagcggtc21120cggcggttgtgcgactcccccgctctggcg21180gcgcccccggtgcggctggagagccgggtg21240ccgctgcccgccgggagccacgtggtggtg21300ccggccgcggagccggcggacctggcgggc21360tggttcgcgctgtccggggagttcgtcggc21420gccgaggccgccccgggactgCggCgggEIC21480gtcctcggcaggtacgcgcggttccccgtc21540cccctcagtcccccacgacgtttcatgaaa21600tcccgcaccacacgcactactaccacctgg21660ggcacg鄉tggtggcggccggccagccgt21720tcccggcgttcgccctggccgaggaggagt21780gcgatctccagccgtatcagcetcggcatcg21840acgagctggactgggag卿ctgctcgccc21900aaccgctcaacggcgccacgaccctcgaca21960ccgacctggtgctgtgggagccgttcacct22020gggccgcgcacgcccgcgtcctgtgggggc22080cggacacgatagcaccgggaacttccgggagtctgggccttgatccccgatgtcctcgcgccgatctcgaggatcccggagctcggcgattgccgcagatagaactccgccgctggtgcgggatgcgggcagcaxxgccggactctcgcgcgacactggatccgctggtgccgggaggacgcccgccgcgggcggaggctgggggtgcgggttcgccgggggtctcgtccggcgctcggcgctgcgccggcgcccccgtccggcaccatgggcgg卿ccgcggtggccggctgcccgcgggccgcgggtggcwtggcgcgtggccgcggctcgccgagcccggggcccatctggaagtcgtccggcttgggcggtggcgccgggcggatcgtgcacctcgctgcgggtggcccgccccagggcccgtaaggaggtggtcgggctgctgcgacccggtcgga,cgtgcgacctgccgctggctgaccggagcacagtcatcgagctgcaacacgcgcC8tca^ccaccatcctcggccgccctcacccctgctcgagcatgcccagcggcgtgttgatgtgatcgatgtgctgatgccccatcgcgtttcgtgccgggacctggcggcggggggtcccggctggcggccgctggtcgctggaggagtctcgaccggtccggacgcggcccgactgggctgccccggtcgcgg鄉ggtcgctgcccttgcgacgcggcggccgcagggcggcggggggggtgcgccgg卿tggcgcgggccggacaactcaaccgtcatcgggtccccggcgcgagcctcgcccggcgccgcccacg咖gtcggtggccgtggtccgcccggcagccgcggcgtccggacg犯gtgcggagtggactcggtcagtaccgtcccgagaggaaccgagaggacgagggtggcgacccatcgtcgactagcggttcggggcatcctggUcgctccgggagccgcggtccggccgggaaccggcgcgcctcgtcgactgggccctcttgggccctgcgtcgccctgcggcgcggccgatgagcggggcacgcctggcgcggcggccctaccggcgagctcccggaggctcgcccacgacgttcacgcgacggcgccgcactgcgaactccgcggtgcgtggtgcaccatcgtcatggccggccctgct犯gtgCtggEltgctgccgtctgccgcggagtcgaacgatcgccctggtcgeicccccgttcccggacgsggatcggcggcgctgctgcgcgctggccagtaaagtcggcgggtgctgcggctccttcaggctgacctgggcgg鄉gtgg3tgcgctacacaacggcctcgtcccggtgcatggacgacgctcgtgcccatgcacgtgcaaacgccgccgttccgcgacggtcgtgccgacgggcccgtgccagccgtggacacgaccgcgggcggccggcgtcggggctgggcgggggcggctggcgcgcgccggatctgcggggtcccgggccgaggccggcgcgcgtgcggggtccggcggtcgcgggcgggatggccgctcgtggcggtacgccggccggcgggcaggcggctcgaccgtaccgccggaacgccctggccgtcggcgttacccgaaccgcgcgggccccgagctggcccgcgggggctcggggccgccgcggtcgtga^cgtggccgaccctccaggcccgagg鄉ttgccgaccgtccaggcgcgtcctggcgcgccccgatggcgcccgtacaacggtctgcctggaggtttatcccagcgggacggacgcgttgcaccgccgcgacggcagcaccggcgcgtcgcgcgcggcggcctggagcgccggcggtgacccggttcgccccgctcgcggcacgaggtacccgtccgcctctcgcgcggcgtcgcccgggatcgtcagcgtgggtccgctgagttcgcgcctcgatccgtcacgtaccggccgcggatctgacttcctgagtcgacgacgcggctgccgcggcacgtcccgaccagttcgtcccgggccatatgccaagggcggtcggacg3gg3tgcggggtgstcacggcgcatgccgacgggccgcccgtcgagggggcgcgcggcccgcgttccggcggcgtcgagcctgctgcggctacgggcgccagcccgagg22140tacgggtgcg22200gagggcgtca22260gggtcggcgg22320accctggggg22380gaggcgctgg22440ctgctgccga22500ctgccgacgt22560ctgcacgggg22620atgttcgcgc22680ctgaggagcg22740ctg肌ggagc22800ctcacggccc22860cgcccgaccc22920tgtccgcgcc22980gccacctgct23040tggtggcgac23100cgtgcgggcc23160cccgcgg服c23220gcagtctggc23280aacgggccga23340accactggtc23400ccgagctggc23460ggccggtgtc23520cccacgggga23580gcgtgacgct23640cggagctggt23700acgtcgtcgc23760tggcggaggt23820tgaccgcgct23880acaacgcgcg23940ctcccgcggc24000cggcagccgg24060tcctggaaca24120tgtgacgtgs24180gtggtcggcg24240gtgcggctgc24300gtcgaggtcc24360gcggacgccg24420gacgagcggt24480gaccgctcgg24540ctgtcccggc24600gccgcctccg24660agcccgctga24720ccgggtggacgggccgcggggtggtcgcgtcggtggcacggcaggccgtctcgggcgagc24780cggtcacgatgtggcacgacggcacggtcgggcgcgatctgctccacgtgg鄉acgcgg24840cccgcgccttcgcggcggcgctcggtcacgtggagcggctggacggcggcacgtggtccg24900tcggtacgggccggctggagcccttgggagaggtgttctcggccctcgccgggctggtgg24960ccgagcgg3cgggg鄉ccccccgtaccggtggtctccacggagccgcccgaccatgccg25020aggcgggcgacttcgagagcgcggtctgtgacccctccgcgUccgcgcggtgaccgggt25080ggtctcccctcgttccgttgcgggcggggctcggcgccgtggtgg聊cgatggtggccg25140acggagcgaggggtgggatccgaacgtgagcacggaccggg鄉鄉ccgcgcacacgcg25200gctcggtcgcagcgcgaccctggtgagccggctctggctgggcaccgtgaacttcagcgg25260ccgggtcgaggacggtgacgcgatgcagctgatgg鄉cggcggtcgaccgcggcatcaa25320ctgcatcgacax:cgcggacatctacggctggcggatccacaagggccacaccgaggaact25380ggtgggccggtggctggcca,gcgccgcgcggcggg兆gacgtcctgctggccaccaa25440ggtcggcgggg3C3tg£LgCga^cggctcaacgacggcggcctgtcggcgcggcacatcgt25500cacggcctgcgagcagtcgctgcggcgcctgggcgtggaccacatcgacctgtaccagat25560gcaccgcgtcgaccacgccgcgccgtgggacg卿tctggcaggcgatggaccgtctggt25620ggcgagcggc犯ggtg3CCtacgtggggtcgtcgaacttcgccggctggaacgtcgccgc25680cgcgcaggacgcggcccggcggcgccagtccctcggtctggtgtccgagcagtgcctgta25740caacctggcggtgcgccacgccgagctggaactgctgccggccgcccaggcgtacggact25800gggcgtgttcgcctggtcgccgctgcacggcgggctgctcagcggggtgctgcgcaagct25860cgcggcgggcgtcgcggtgaagtcggcacaggggcgggcccagctgctgctgcccgagct25920gcgcgcgacgatcgaggcgtacgaggggttctgcggccggatcggcgcggatccggccga25980ggtcggtctggcctgggtgctgtcccggccggggatcagcggcgcggtgatcggtccgcg26040cacggtggaccagctggactcggcgctgcggtccctggacctggtcctcggggaggccga26100actggccgagctggacgccatcttcccgcccctgggcaagggcggccgggcgccggacgc26160gtggatcagctgaagggggtgcatcggccgacgtcacgccggccgatgccgccggtcaca26220cgacgtcgagcgcgggcagcgggaagaccagtcggccgccgccgtcgaggaactcccgct26280cccgttcgacgaacccgtcccggtagatccagggcaggaccagcaactggtccggcttct26340gcgccttcgcgtcctcctcggacacgatggggatgcccgtcccgggggtgaaacgccccg26400ccttctcctcgctcacctcgccgatgcacggcaggtcccgttcggtgatcccgcagtact26460ggaggatgacgttgcccttggtgg鄉cgccgtacccgagggtcagcaggccctcttggc26520ggg兆cggtccaggaagccgcgcagggcgtcccgctggtcggcgacgcggcgggcgaagg26580cctcgaacggtgccatgccgtccagtcccgcggcggcctcggcggcccggatgcgggcca26640ggcccgcctcgtccctcgggtgccgggaaccggtcctggcgagcgtgacgcacaggctgc26700cgccgtacacctcggtgagctcggcccggatgacggtgaggccgacgcgttccgccatcc26760actcgatctggcgcagcgcgtagtactccaggtgctcgtggc卿cgatgtcgtacgcgt26820cggcttcgagcatggcgggcaggtagctctgctccatcatccagacgccgtcctcggcga26880ggacgtcgcggacgtcgctcatgaagcgcagcgggtccggC鄉tCgt3gaacatcgcga26940tgg鄉tgacggccttcgcccgccgcgccccgaagcggttctcgaaggtcgcgcgggtgs27000agtagtccscgaccaactcggcgttcggcgggtacaggtcgcggaacttgccgccggtcg27060ggtcgatgccgaccagtcgcgggccgtcggCgggg"UgCCgtggcgtcgt27120tgctgccgatgtcgaggaccaggtcgtccgggccgaggtccaccagccggcggacggcgg27180cgaccttgccatgcaggtggtcgaccatgaagggccggatgcccgagcggtagccgtagc27240cctcgccgtacatgaggtccgggtcgggggtgtggcgcagttgcacgaggccgcatccgg27300<formula>formulaseeoriginaldocumentpage187</formula>acggcg犯caggtcctggtcgcgctcccaggtggtcttggtgcggtcctcgaggaacccg30000agcagttccccggcgacctcgtcggcggtgggggtcgtgccggtggggtcgggccgaccg30060gacgtcgtggtcatcgcgtggcctcctggtagtcgtagaatccccggccgctcttgcggc30120cgagcaggccctggcggaccttgtccagcagcagctcgctcgggcggsgcgccggatcgc30180cggtccgttcgtgcatcacccgcagcgagtcggccaggttgtccagtccgateaggtegg30240ccgtggccaggggtccggtgcggtggccgatgC3gtCgCgcatcagcgcgtccacggtct30300ccggggtggcccggccctcgtgcaccaccgcgatggcgtcgttcagcatceggtgeagea30360ggcggctggtcacgaagccggcgccgtcgccgacgacgatgccccggcggcccaggccgg30420acagcaggtcccgggtggcccgggcggccgcctctccgctgcgcggtccgaggaccacct30480cgaccgtggggatcacgtacgcggggttcatgaagtgcacgCCgElCg3ggtcctcggggc30540gggggscggcgtcggccagctcgtcgatggggacgcccgaggtgttgctgac靴c兆cg30600tccccgggcgcgccacggacgcc鄉tccgccagcacctcggccttccgctcggggtcct30660cggtgacggcctcgatcacggcggtcgcggtggcgacggcggccggcgcctcctcgacgg30720tcagctccccgggcgggcggtcgtggggcagcgcgcccatcagccgggccgtcegcagat30780gcagcgcgaccgcgtcgggggcggccgcgcgcgccccggcggaggtgtcgaccagtgtga30840ccgggtgcccgtgtccgacggcgagtgccgcgatggccgtgcccatgacgcccgcgccga30900gCELCgaCgagcggag犯ttttccttggaatcgggcacggatec30943<210〉2〈211〉11171〈212〉DNA<213〉生二素链霉菌<400〉2ctgc鄉cgcgcgggctgctcgggc鄉aggcgcccgccgagagectegacgegatgate60gacgactactgcgcgcagatccgcgaggtccagcccgagggcccgtaccggctgctcggc120tggtccatgggcgggctgctcgcgcaccgggtcgccacccgcctccagcgggcggggcag180cgcgtcgacctgctcgcgatcgtcgacgcctatccgcccgcctcggtgcgggccgactgg240gELCgCggCgg卿tggtggcgcggatcggtgagg肌ctgggettcgaegtggaccgggtc300ggccccggccaggaggaggcgctgctcgcggatctgcgggcg犯ggggcatcccctgggg360catctgccgggcggtgaca/tcggcgcggcggtccgcgtgtaegtcaacagctcgcgcctg420acgaggaacctgcggcccgaggcgttcgacgg哪cgtcctcttcttcgcctccgggscc480tcgttcgccgaggacgaccaggttcacgacgtcgccgcctggcggccgtscgtcaccggg540cagatcaccgagcacgtgatcgaccacctccacgaggacctcttgatcgaaccggccgcg600gtcacggccatctccgacgtgctcgtcgggcatctgcccgcggacgacacaccccgcgcg660tccggcgcaccccgcgcacctcgcgcatcccgatgagg犯ggaaacatcatgagcaaccc720gttcgaggacacgg犯gccacctacgtcgtgctggtcaacgacgaggggcagcactcgct780gtggccgtcgttcgcggaggtcccggcgggctggtccgtcgtggtgccgga>ga>cgg3ccg840gcagtcgtgcctggactacatcaacgagaactggaccgacatgcgccccaeigagcctcgt900cgaggcgatggcgacggccgggC鄉3CgCCCCttg3gCCaggacgecatgatcegggeg960gtcggcgtccgcaagagcttgcggcgEicgtccacgccctcgacggcgtggacatcgaggt1020cg犯cggggccgggtgctcgggctgctgggtcacaacggggccggca卿cgaccttggt1080gaacatccttgccacggtctccccggcgtccgcgggcacggtgacegtegccggtttcga1140cgtcgcgacgcagggcgccgagatccgcgcgcgcatcggggtgaccggccagttcgcgtc1200ggtggacgagtacctgagcggattccgcaacctcgtcctgatcggccgcctcctcggggc1260gggacggcgtgaggcggcggcccgggccaccgagctcctggagctgttcgagctgaccgg1320ggcggcccaccagccctcccgcacctactcgggcgggatgcgccgacggctcgacctcgc1380cgccagcctggtcggccggccggacgtgctgttcctcgacgagccgacgaccgggctgga1440cccggcgacccggatcgccctgtgggagacggtgg柳agctggtggcgggcggcacgac1500cgtcctgctgaccacccagtacctggacgaggcggaccggctggccgactggatcaccgt1560cctgtcgaagggccgggtggtggcctcggacaccaccgaccggctcaaggccgacctggg1620CC3CCggtCggtgcgggtggtccttccgcccgccgccgacctgacggccgccgccgccgc1680gctcaccgccggcgggttccgtccgcggtcCg3CgCCggggagcacgcgctgaccacgcc1740cgtggacacctcggccggtatcgcgggcgtcatccgcgcgctggacaccgtcggaacgca1800ggccgtcgagctgaccgtcaaggagccgtccctggacgacgtctacctggcgctcaccca1860tccctcacccgccgccgacgcggcctg自cccaggagttccgttggccatccaggagcg1920cgccgtgaaggaggtggcggtcgacaccggtaccccggccggccccgtgtggcgtggtgc1980cggcctcggcacccagctgtgggtactgaccgcgcggcagatccgttccatgtacggcga2040ccgccgcctggcgctgttcagcctgatgcaaccggtgatcatgctgttgctgctgagcga2100gatcttcggcagcatggccgacccggacgacttcccgcagggcgtgcgctacatcgacta2160cgtggtgcccgcgctgctggtcaccaccggcatcggctcggcccagggcgcgggggtggg2220cctggtcagggacatggacaacgggatggtggcgcgcttccgcgtcctgccggcccggct2280gttcctggtgctggtcgcccggtcgctggccgatctggtccgtgtgttcaccgagttggt2340cgtcctcgtggccgtcggtgtgatcctgctgggcttccgtccggccgggggtttgtgggg2400cacgtccgccgccctgttgctcaccctgttcgtcatctggtcgctgatctgggggttcat2460cgccctcgcggcgtggctgcgcagcgtggaggtgatgtccagcctcgcggttctggtgat2520gttcccgctcatgttcgcctccagtgcgttcgtcccgctggacgccctcccggagtggct2580gcgctcggtggcgcacctcaaccccgtgacgtacgcggtcgacagcgcccgccgcctggc2640gctggactgggacccggggtggagcgtgcccggcgcgctgctgaccagcaccgcgctcat2700ggcggtggggatgtacgtcgccgggcgttccttcaagaggcccccgaacgaatgattccg2760gcgaacgggtccgtcgcctgcccctccgggctcgcccgggggaggcgggcgcggtctcag2820cggtcggccgtccgcccgtaggcgcgga^gagtgcggtccactccgggaccgtgaggtcc2880ttgacccggtcggccggcctcacgcccgccccgcgcacgaactgggcgtgtccgcggcgc2940agcaccttccgcgcggcgtcgcccaccgtcatctggccggtgtcgaagacccgttggacg3000aaccgctggtaggcggccttctcacgccagggcacggacggcctgcggtgcggggcgacc3060atcagggtctgggtgtccgcgcgcggtacgggggtgaagtcctggcgtgag卿gccagg3120ccccggtcgaacgagtaccacggctcccactgggcgttgaagaggtttccgccccaggct3180ccggtccgctttcccacgtactcccgctgcaacaggaacacgccctgccgcatgcgcgcc3240ggacccatgtcgaggcagcgcctcagcattctggtgccggtgacgaagggaagattcccg3300atgagtctgaccggctgcccgggcagttgcagggtc鄉aaatcctcgttcacceiccgtg3360acgtccggcagcgattcggcggccagccgccgagcccagcggggatctatttccaccgcg3420agtaaaggcgtcccgggtgaggcgagcactttggtcacccgccctgatcccgcgcctatt3480tcgacggtcatcaggtcattcgg,atcgggc柳atggtgtccgaaccgtccagctga3540gcggagaaacgacaggccgcggcggctgtacgaaagaagttctgaccccattctctccgc3600gcggtgctgcgtgaatcagcgggtgcggag3Cgg3ttgCggtggcagtggggatttcaat3660gtcacctcggcgacattaccaagtcttgacCC£l£LCggtCCatcaaccaccggtatacccc3720atgcaattcagccaccgtccggcccgatcccgacgttcggccgcgggcctttcgggcccg3780accggtgaccagcgcgcg犯ccggagttcccggcgatatttccggctcctggcgactcgc3840cacagtctcgtcgggggcggccggcgccatgactccgacgggggcgattcccggccgact3900tcgtcaggtccggagggtcccccgggcggcgcgggccgatggccgctgactgtgtcatct3960gcgggttgtcggccgaacacaccgcgccccaggatgactcagccgttcctgcggtcgtcc4020cgaccccggtccca_cccccga犯柳ggagcgagaatccagtgctccagcgcgtcgatct4080gtcgtcactcaxxggcctccgctggtatgcggcgctgacggtattcgcctgtcacatcgc4140ccsgcagggcttcttcgccgaccagcaggtgggcagcgcactgctgcacatcaccccgct4200cggttccatggcggtctcgatcttcttcatactgagtgga"ttcgtcctcgcctggtcggc4260ccgcgacgaggactccgtgccgactttctggcggcgccgcatcgcga^gatctatccgct4320gcatctcgcgacgttcggcatcgcggctctcatcattttctccctgtcggagccggtact4380tcccggcggttccgtatgggacgggctggtgcccaatgttctgctcgtgcagtcctggct4440tcccgacgcgaccctcacggccagtttcaaC3CgCCC3gCtggtcgctctcctgtgagat4500cgccttctatctgtcgttcccgctgtggtaccggctggtgcgcaggattcccgcacggcg4560gctgtggtggtgcgccgcggggatcgccgtggccgtgacgtgtgtgcccctgctggcggg4620cctgctcccggcgagcgaggaggtggcccccgggatgtcgctcaacgaggtctggttcgc4680gtactggcttccgccggtgcgcstgctggagttcgtcctcggcatcgtgatggcgctgat4740cctgcgcgcggggstctggs3gggCCCCggtccggcggtctgcacggcgctcctcgccgc4800gagttacggcctcacccagatggtgcccccgatcttcaccctcgtcgcctgctccgtcgt4860accggccgcgctgctgatcacggcgctggccgacgccgacgtgcacggccggcgcacggg4920gctgcgttcggcgacgctggtgcggctgggccagtggtccttcgccttctacctggtcca4980cttcctgatcatccgctacggacaccggctgatgggcggcgatctgggctac眺cggca5040gtggagcaccccggccgcgatcgcgctgtccctggggatgctgggggtggcggtcctggc5100cggcggtctgctgcacaccgtcgtcgaacagccctgcatgcgcctgttcggcagccgcag5160gtccgcctcccgtccgaagcccggcgccaccgcggctccccggaactcacccgcggccga5220cgcggccggcgtgcccctgctcccgggcgtacccgggcccgcgcacacccccgcagcgac5280gaacgaacccaccccgagaggatgatgagcgtggc卿ccagacggctctcagccccgcg5340ctgctggagtacgcccggagcgtcgcgctgcgggacgacggcctgctgcgcgaactgcac5400gaggtgeiccgccgggctccccggcggccgggccatgcagatcatgcccgaggaggcgcag5460ttcctcgccctgctgatxcggctcgtcggtgcccggcgggtgctggagatcggcaccttc5520acggggtacagcacgctgtgcatggcgcgggcactgcccgccgacggcaccgtcgtcacc5580tgcgacatcagcgacaggtggcccggcgtcggcgcaccgtactggcgccgggccggggtg5640gagtcccggatcgacctgcgcgtcggcgacgccgtccggaccctcgccgagctccgcgag5700cacgagggggacggctcgttcgacctggtcttcgtcgacgccgacaagaccgggtacccg5760cactactacgagc鄉cgctggccctggtacgccccggcggactggtggcggtcgacaac5820accctgttcttcggccgggtggccgacccggccgtcgaggacgccgacaccgtcgccgtg5880cgcgcgctcaacgagctgctgcgcgacgacg認gcgtggacatcgccctgctgacggtc5940gccgacgggatCELCtC"tggCccgccggcgggagtgagtccgcacggggtgcggeigcacct6000ggtgccgtcaccggcccgcacacgtccgccgccgeicctgcccgggcaggtcgccgagctg6060ctgccctggcgtggccggccctcgtcgagggccgcgcggtcagcggaaccggttgatcgc6120gtcgatgtgccgcgcccgcttctcctcgtcgcgcacgcccagcccctccgtgggcgccag6180gcagagcacgccgaccttgccctggtgctggttgccgtgcacgtcgtgcacggcaaccgc6240cgtgtcggccagcgggt鄉tgcgcg卿gggtggggtggatcctccccttggcgscgag6300ccggttcgcctcccacgcctcgcggtagttggcgaagtgggtgccgacgatacgcttgag6360gtgcatccaggacgatcgtggtgctcgaaggcgcttccacggagcggtcgggagaccacgcaggccgccggcgggccccaggtcagacaggcccccggtcgtgcccggggtttccaggaggatgtggcaggaagccgggagctggccgtcgacgtgcggtgtcctctgtcctcggggttcgggcatgaggcgctccaagccgccgcgagaccgcgcgtgctgcgcctcgcagggcggagcagcgcgtcggtcgagcttccagcagttgtgccgcccgttgtctgcgcgggcccgtaccggtggcatcccgtcacaggatgccagggttcccatcgtggcggagcaggtacttggtaggggacccaccggtagccacccgtatagtgggtgtggggcgtacgaccggtgaccgccgtgaccttgcggtccgtaggtagcggtccgcccctgcacgatgtcgatcccgcgggtatgatggcctccggggtctggcgcccc,tggcggttgggccgcctaagttggtcttcggggctctacgttcacgctacggcaggtaacgtcgggaatcaccgcgaagggacttgcttgcggacgggtgcggtccggaacggtctcgggtggggatcgcccgccctccgtgagcgttgagcggcgctggaccaggtcgagcggtacgggtgtccggagtaggacgcggggccgggtcgatccagcgtccacgagggcggcgcgcgtgggcacacgaccagcgccgttgaacccaggtggtcgaggtcgctcggcggtcagcctcgtgccctgtgggcgaggscggcgggggcggccgggtggaccgcggtcggcgccccctgtcgaactcgggtgacgtacgtcctcgcccctgggtgtcccgcgcccatgggccccgccagatcagcacetggcggtggatgggcatcagcgaagccccaccagctccaccgggtcccgtcgtggcgcgcggggctcgaaccagcgcctcgcgggtcctttcacggcgcgcggcggtgatcgatcgctcggatcccggcggatcgcggggcgccgcgggcgtcccacagggcccgctccggaagtccacgcagggtggccgaccgcgtcggcggtcgggcgC3C3tgggCC3CCC3g"tgggccgagccatgaggagcggcaccgcaggtcgggccgccggggcggctcctcctcggcccatctcggccggtggagggcggcgcgcggatgtcagctcatcccgggcggcggtggtggcggccgagcggctccgtggcggaaggacggacgcccccggtgaccctcgtcgctcggcccggcacggcgsgggccgttgtcgcccgttgaccagactggttggacgatgcgctggcgacagacaggcgcagcaccggccagcggcg8tgg3gg3Ccccgggccccgtccgcgctcgaaggactcgcgcggcgagctgtcgtcaggggcgtggggttcgtgcacggaggtcgaaccgagggc£Lgca_ccgtggtggaggcacgacgtaccacctcgacggccgtaggttcttgccgaaccgtggtctccgagcacgttcggcgatggaggcgggagcgcgcgggccgcagccacgggcacgcggctctccacctgcgagcagctgtgatgacgtagcgcccaggaggacgcgcatggacccggaccctcggcccaggcggatcaggcccggggacccgaggtggccgaaggtcttcgcggatgccagaagcggtacctcggcctagctgggtggtgcttcatgcccgggcgcggttgacgaggggccgggtcgatgcgcgacgaacgccggacagaggtgcgcccagaccgtgtacttcgggcaggcatcccgcggCggC3agcgcgctcttggcccggtgcggcgagcatccgtgtgcaccggcggacagggatctgcggtgatcgcggctgtcggggagtgtccagccgtctcgcgggcgccagggttcggcccaggtccgcgttcgtcggtcctcgcggtccgatggccgaccggccccgaagtcgacccatcatgctcaccgaactcccgcggccggCggtg3ggg3cgaggggcaccagcggctccggcgggcgcagcaggccggggcgggagggctctcccgtcccgct6420cccggccggg6480gcttgccgaa6540agtcctcggc6600tgcgcgcgct6660cgtacgagcc6720cggcgccgtt6780cggcctcctc6840ccacctcggc6900gcatggtgtc6960cctcgtcacc7020ggtcggc7080cgtagcgctc7140tgtagttgac7200gcggcacctc7260ggaacatgtc7320gcgccgcgat7380gcgcatggct7440cagggcggtg7500ctcctcgctc7560cgcgtcggcc7620gcgctggsgt7680cactccgtgg7740gcagctcggc7800ggtgccc7860gccgagcgcc7920ggacacgccg7980gatcacggag8040gaggcgggtg8100gaaggcgagc8160cagttcctcc8220gtcggggccc8280cgcgtsggtc8340gatctcgtcc8400ctgctggccg8460gaagccccgc8520tcggtcgtcg8580gggcgggctc8640cctgtag8700ggtctgggag8760ggcgcccagg8820ccggccg8880gagcgccagg8940認cggcggcc9000agcaccacgacgtgctcgtcggcggtgatccggcggccgccgagttcgaggccggtgtgc9060gcgscccggttctccagccgggccggggggcgctcgcgcagcacctggtcgacggcgttc9120gccgcggccggcgtccggcgggccctctcccactcccccggccggccgagcagccggtgg9180accgtgtgcgcgacggcggtgacgacgggttcgggtgcgccgaccgcgaggagcagcgcg9240atgcgctcgacgtcgccgggggcgscgccgtcgtgc鄉aggagggcgagcacgtcgtcg9300ggccggggctcggcgttcccgaggccccgggacttctccgcgacgagctcggggaccagg9360tcggccagtgtgcggacggcgtcggcggactcccgggccacggtcagcagttgcggggcc9420atccgggcgtcgagctgggggccgcaggcggcgagtgcccgcgcggcggtggcgcggtcg9480cggcccggcactccgaggagcctgagcatcagctcgacggcgtagggccgggcgacctcg9540ccgacaaggtcgaacccggcgtcaccggtgggcagcaggcggccgagcactctgcgggcg9600gtggtgcgcgCCgCgC3gggcgcctgggccggggcgtaccggctgagcaccggggcggcc恥60agcgcccgcaggcgtacgagctccgcgcgttcgtggtgggggaacgcctcggcgaggggc9720agcagttcctcgtccgggcggcgtccggcccggtccagcgtgccgaagcgcgggtcggcc9780aggacggccgccgccacctcggggtccgcggtcacccaggcgtccagctgttcgctgcgg9840aaccacggtccgcgggcccggatctcccgttcgaacggctcggggtcggcgacggcgcgc9900aggatcagcgcgtacgggtcgccctggttgccggcgcaccagtgtgcggcccgggtcagc9960tggagccga^cggccgagcgcacggacgcccgtgctcgtgtccgcgctcgtgctcgtgctc10020gcgggggccgtttccgtggc犯gggtgggcatggctgccctgcctttcttctcgggtcga10080tgggggcgctcgcacgatcgggggacccgggtgtgccgggtgggtcggggcaacccgcct10140ccgggccgcggcggtccgcgtcggcaxxgggtcagcggcgggtgccgatgaacagcccgc10200gaccggacgggccgccttcctggtagaccacgtcgcetgccggcgcgctcgaaggccgcct10260cgtagtcggcgcgcgggaacagggtgatggtgtggtcctcggtc鄉tgacggacgccgc10320cgggtccggcgaggaggtagtgcacctcgatgcgggtggcgttcccctcccgtacggagt10380gcgageicccggc卿cggtgcgctcgcccgcctccgtgeitgctggcgccgacgtaaccgg10440gggtgaaggactcggggaaccaccagggttcgacgacgatgacgccggacggttcgaggt翻Oggtcggtg肌ggcccgcagcgtgctgtcgagttcgtcggtggtccgcaggtggcctatgg10560gcaggtcaccgcgtcgaaccggcgtcccagggagaacgagcgcatgtccc10620cttggtggaaggtgacaccggggttccggccggtcgcgagggccagcatgtcggcgg柳10680gttccaggccctcgacgtggtcga柳ggccgtccaggtggtgc鄉tgctggccggtgc10740cgcaggccacgtcgagcagggtccgggcgcccggccggtggacgcgcacgagtgcggcgs10800tctcctcggcctcctgccggtagtccttccccttcccctcgtgg6LCC6Lggtcgtagacgg10860ccgcgatgtcgtcggcgtacatcagtgtttccctccggtgagcggggcgggaccgggctg10920gtgcggg鄉ctgtccagccattcgtgcaccagggacgcggtgtgccgggcgtgttcggt10980gagcatggtg,tggttgccgggcacgtcggcgacggtccgtgcgaacggg3CCtggg311040ccgccagtcgccccgcgccccgcccgcgggcggccacgcgcacaggggttcggacgcccg11100ggccagcaggacgggggcttcgagggcggtgagccgggttccgagcaccagccgctgata11160gccggccatgg11171<210>3<211〉711<212>腿<213〉生二素链霉菌<220><221>CDS〈222〉(1)..(711)<400〉3atgtacgccgacgacatcgcggccgtctacgacctggtccacgagggg48MetTyrAlaA印AsplieAlaAlaValTyrAspLeuValHisGluGly151015aagggg卿gactaceggcaggaggccgaggagategccgcaetcgtg96LysGlyLysAspTyrArgGinGluAlaGluGlulieAlaAlaLeuVal202530cgcgtccaceggccgggcgcceggaccctgetcgacgtggcctgcggc144ArgValHisArgProGlyAlaArgThrLeuLeuAspValAlaCysGly354045accggccagcacctgcaccacctggacggcetcttcgaccacgtcgag192ThrGlyGinHisLeuHisHisLeuAspGlyLeuPheAspHisValGlu505560ggcctggaaetctecgccgacatgctggccetcgcgaccggceggaac240GlyLeuGluLeuSerAlaAspMetLeuAlaLeuAlaThrGlyArgAsn65707580cccggtgtcaccttccaccaaggggacatgcgctcgttctecctggga288ProGlyValThrPheHisGinGlyAspMetArgSerPheSerLeuGly859095cgceggttcgacgcggtgacctgcatgttcagetecataggccacctg336ArgArgPheAspAlaValThrCysMetPheSerSerlieGlyHisLeu100105110eggaccaccgacgaaetcgacageacgctgegggccttcaccgaccac384ArgThrThrAspGluLeuAspSerThrLeuArgAlaPheThrAspHis115120125etcgaaccgtecggcgtcategtcgtcgaaccctggtggttccccgag432LeuGluProSerGlyVallieValValGluProTrpTrpPheProGlu130135140tecttcacccccggttacgtcggcgccageateacggaggcgggcgag480SerPheThrProGlyTyrValGlyAlaSerlieThrGluAlaGlyGlu145150155160cgcaccgtctgcegggtctegcactecgtaegggaggggaacgccacc528ArgThrValCysArgValSerHisSerValArgGluGlyAsnAlaThr165170175cgcategaggtgcactacetcetcgccggacccggcggcgtccgtcac576ArglieGluValHisTyrLeuLeuAlaGlyProGlyGlyValArgHis180185190ctgaccgaggaccacaccateaccctgttcccgcgcgccgactacgag624LeuThrGluAspHisThrlieThrILeuPheProArgAlaAspTyrGlu195200205gcggccttcgagcgcgccggctgcgacgtggtctaccaggaaggcggc672AlaAlaPheGluArgAlaGlyCysAspValValTyrGinGluGlyGly210215220ccgtecggtcgcgggctgttcateggcacccgccgctga711ProSerGlyArgGlyLeuPhelieGlyThrArgArg225230235<210>4<211〉236<212〉PRT<213>生二素链霉菌<400>4MetTyrAlaAspAsplieAlaAlaValTyrAspLeuValHisGluGly151015LysGlyLysAspTyrArgGinGluAlaGluGlulieAlaAlaLeuVal202530ArgValHisArgProGlyAlaArgThrLeuLeuAspValAlaCysGly354045ThrGlyGinHisLeuHisHisLeuAspGlyLeuPheAspHisValGlu505560GlyLeuGluLeuSerAlaAspMetLeuAlaLeuAlaThrGlyArgAsn65707580ProGlyValThrPheHisGinGlyAspMetArgSerPheSerLeuGly859095ArgArgPheAspAlaValThrCysMetPheSerSerlieGlyHisLeu100105110ArgThrThrAspGluLeuAspSerThrLeuArgAlaPheThrAspHis115120125LeuGluProSerGlyVallieValValGluProTrpTrpPheProGlu130135140SerPheThrProGlyTyrValGlyAlaSerlieThrGluAlaGlyGlu145150155160ArgThrValCysArgValSerHisSerValArgGluGlyAsnAlaThr165170175ArglieGluValHisTyrLeuLeuAlaGlyProGlyGlyValArgHis180185190LeuThrGluAspHisThrlieThrLeuPheProArgAlaAspTyrGlu195200205AlaAlaPheGluArgAlaGlyCysAspValValTyrGinGluGlyGly210215220ProSerGlyArgGlyLeuPhelieGlyThrArgArg225230235<210〉5<211>1272<212〉DNA<213>生二素链霉菌<220〉<221〉CDS<222>(1)..(1272)<400〉5atgcccacccttgccacggaaacggcccccgcgageacgageacgage48MetProThrLeuAlaThrGluThrAlaProAlaSerThrSerThrSer1015gcgAlagacAsp3CgThrageSer20acgThrggcGlygtcValcgtArggcgAla25etcggcGlycgtArgeggArgetcLeu30cagGinctgLeu96accThreggArggccAla35gcaAlaceicHistggTrptgcCysgccAla40ggcGlyaacAsncagGinggcGlygacAsp45ccgProtacTyrgcgAla144ctgLeuatelie50ctgLeucgcArggccAlagtcValgccAla55gacAspcccProg站GluccgProttcPhe60g幼GlueggArggagGluatelie192egg65gccAlacgcArgggaGlyccgProtggTrp70ttcPhecgcArg3gCSerg33GluC3gGin75ctgLeug3CAspgccAlatggTrpgtgVal80240accThrgcgAlagacAspcccProgagGlu85gtgValgcgAlagcgAlagccAlagtcVal90ctgLeugccAlagacAspccgProcgcArg95ttcPhe288ggcGly3CgThrctgLeugacAsp100eggArggccAlaggaGlycgcArgcgcArg105ccgProgacAspgagGluGluctgleu110ctgLeucccPro336etcLeugccAlagagGlu115gcgAlattcPhecccProC3CHisC3CHis120gaaGlucgcArggcgAlagagGluetcLeu125gtaValcgcArgctgLeu384eggArggcgAla130ctgLeugccAlagccAlaccgProgtgVal135etcLeuageSereggArgtacTyrgccAla140ccgProgccAlacagGingcgAla432cccPro145tgcCysgcgAlagcgAlacgcArg3CCThr1503CCThrgccAlacgcArg卿ArggtgVal155etcLeuggcGlycgcArgctgctgLeu160■cccPro3CCThrggtGlygacAspgccAla165gggGlyttcPhegacAspcttLeugtcVal170ggcGlygagGlugtcValgccAlaeggArg175cccPro528tacgccgtcgagctgatgetcaggetcetcggagtgccgggccgcgac576TyrAlaValGluLeuMetLeuArgLeuLeuGlyValProGlyArgAsp180185190cgcgccaccgccgcgegggcaetcgccgcctgcggcccccagetcgac624ArgAlaThrAlaAlaArgAlaLeuAlaAlaCysGlyProGinLeuAsp195200205gcceggatggccccgcaactgctgaccgtggccegggagtecgccgac672AlaArgMetAlaProGinLeuLeuThrValAlaArgGluSerAlaAsp210215220gccgtccgcacactggccgacctggtccccgagetcgtcgcggagaag720AlaValArgThrLeuAlaAspLeuValProGluLeuValAlaGluLys225230235240teceggggcetcgggaacgccgagccceggcccgacgacgtgetcgcc768SerArgGlyLeuGlyAsnAlaGluProArgProAspAspValLeuAla245250255etcetcctgcacgacggcgtcgcccccggcgacgtcgagcgcategcg816LeuLeuLeuHisAspGlyValAlaProGlyAspValGluArglieAla260265270ctgetcetcgcggtcggcgcacccgaacccgtcgtcaccgccgtcgcg864LeuLeuLeuAlaValGlyAlaProGluProValValThrAlaValAla275280285cacacggtccaceggctgetcggceggccgggggagtgggagagggcc912HisThrValHisArgUuLeuGlyArgProGlyGluTrpGluArgAla290295300cgceggacgccggccgcggcgaacgccgtcgaccaggtgctgcgcgag960ArgArgThrProAlaAlaAlaAsnAlaValAspGinValLeuArgGlu305310315320cgccccccggcceggctggagaacegggtcgcgcacaccggcetcgaa1008ArgProProAlaArgLeuGluAsnArgValAlaHisThrGlyLeuGlu325330335etcggcggccgceggateaccgccgacgagcacgtcgtggtgctggcc1056LeuGlyGlyArgArglieThrAlaAspGluHisValValValLeuAla340345350gccgccggaegggagatecccgggccggagccgetcgggggcgccgac1104AlaAlaGlyArgGlulieProGlyProGluProLeuGlyGlyAlaAsp355360365ggaccgcacctggcgetcgccetcccgctgatecgcctggccgccacc1152GlyProHisLeuAlaLeuAlaLeuProLeulieArgLeuAlaAlaThr370375380accgcggtccaggtcacggccggccgcctgcccggcctgegggccgag1200ThrAlaValGinValThrAlaGlyArgLeuProGlyLeuArgAlaGlu385390395400ggaccgcccctgacceggccgeggteaccggtcctgggcgcctgcgcc1248GlyProProLeuThrArgProArgSerProValLeuGlyAlaCysAla405410415cgcetcegggtccacccgggatga1272ArgLeuArgValHisProGly420〈210〉6<211>423<212〉PRT<213>生二素链霉菌<400>6MetProThrLeuAlaThrGluThrAlaProAlaSerThrSerThrSer151015AlaAspThrSerThrGlyValArgAlaLeuGlyArgArgLeuGinLeu202530ThrArgAlaAlaHisTrpCysAlaGlyAsnGinGlyAspProTyrAla354045LeulieLeuArgAlaValAlaAspProGluProPheGluArgGlulie505560ArgAlaArgGlyProTrpPheArgSerGluGinLeuAspAlaTrpVal65707580ThrAlaAspProGluValAlaAlaAlaValLeuAlaAspProArgPhe859095GlyThrLeuAspArgAlaGlyArgArgProAspGluGluLeuL_euPro100105110LeuAlaGluAlaPheProHisHisGluArgAlaGluLeuValArgLeu115120125ArgAlaLeuAlaAlaProValLeuSerArgTyrAlaProAlaGinAla130135140ProCysAlaAlaArgThrThrAlaArgArgValLeuGlyArgLeuLeu145150155160ProThrGlyAspAlaGlyPheAspLeuValGlyGluValAlaArgPro165170175TyrAlaValGluLeuMetLeuArgLeuLeuGlyValProGlyArgAsp180185190ArgAlaThrAlaAlaArgAlaLeuAlaAlaCysGlyProGinLeuAsp195200205AlaArgMetAlaProGinLeuLeuThrValAlaArgGluSerAlaAsp210215220AlaValArgThrUuAlaAspLeuValProGluLeuValAlaGluLys225230235240SerArgGlyLeuGlyAsnAlaGluProArgProAspAspValLeuAla245250255LeuLeuLeuHisAspGlyValAlaProGlyAspValGluArglieAla260265270LeuLeuLeuAlaValGlyAlaProGluProValValThrAlaValAla275280285HisThrValHisArgLeu!LeuGlyArgProGlyGluTrpGluArgAla290295300ArgArgThrProAlaAlaAlaAsnAlaValAspGinValLeuArgGlu305310315320ArgProProAlaArgLeuGluAsnArgValAlaHisThrGlyLeuGlu325330335LeuGlyGlyArgArglieThrAlaAspGluHisValValValLeuAla340345350AlaAlaGlyArgGlulieProGlyProGluProLeuGlyGlyAlaAsp355360365GlyProHisLeuAlaLeuAlaLeuProLeulieArgLeuAlaAlaThr370375380ThrAlaValGinValThrAlaGlyArgLeuProGlyLeuArgAlaGlu385390395400GlyProProLeuThrArgProArgSerProValLeuGlyAlaCysAla405410415ArgLeuArgValHisProGly420<210>7<211>1266<212〉DNA<213>生二素链霉菌<220〉<221>CDS<222〉(l)..(1266)〈400〉7gtgcgcgtcctgctgacatecetcValArgValLeuLeuThrSerLeu15ctggtgcccetcgcctgggcgctgLeuValProLeuAlaTrpAlaLeu20gtggcgageccgccctecetcaccValAlaSerProProSerLeuThr3540accgccgtaccggtgggcgacgacgcccacaacacccactactacagt48AlaHisAsnThrHisTyrTyrSer1015cgcgccgccgggcacgaggtaegg96ArgAlaAlaGlyHisGluValArg2530gacgtcateacctecaccggcctg144AspVallieThrSerTkrGlyLeu45cgaccggccgcggagctgetcgcc192ThrAlaValProValGlyAspAspArgProAlaAlaGluLeuLeuAla505560gagatgggcagegacetcgtcccctaccageggggcttcgagttcggt240GluMetGlySerAspLeuValProTyrGinArgGlyPheGluPheGly65707580gaggtggagagegaggaggagaccacctgggagtacctgetcggccag288GluValGluSerGluGluGluThrThrTrpGluTyrLeuLeuGlyGin859095cagageatgatggccgccctgtgcttcgccccgttcaacggcgccgcc336GinSerMetMetAlaAlaLeuCysPheAlaProPheAsnGlyAlaAla100105110acgatggacgagategtcgacttcgcccgtggctggeggcccgacctg384ThrMetAspGlulieValAspPheAlaArgGlyTrpArgProAspLeu115120125gtcgtgtgggaaccctggacctacgcggggccggtcgcggcccgcgcc432ValValTrpGluProTrpThrTyrAlaGlyProValAlaAlaArgAla130135140tgcggtgccgcccacgcgcgcatectgtggggccccgacgccategga480CysGlyAlaAlaHisAlaArglieLeuTrpGlyProAspAlalieGly145150155160cgcteccgcctgcgcttcetcgccgccetcgacgggatgccggaggaa528ArgSerArgLeuArgPheLeuAlaAlaLeuAspGlyMetProGluGlu165170175ctgcgcgaggaccccategccgaatggetcggctggacgctggacegg576LeuArgGluAspProlieAlaGluTrpLeuGlyTrpThrLeuAspArg180185190tacgggetcgccttcgacgaacgcgacgtgetcggccactgggtgate624TyrGlyLeuAlaPheAspGluArgAspValLeuGlyHisTrpVallie195200205gacccgggcccgcgcageacccgcetcgacctgggccagaccacggtg672AspProGlyProArgSerThrArgLeuAspLeuGlyGinThrThrVal210215220<formula>formulaseeoriginaldocumentpage202</formula>gaccccacgcccgccgggateatecccaccctggagcgcetcaccgcc1248AspProThrProAlaGlylielieProThrLeuGluArgLeuThrAla405410415ctgcacegggccacctga1266LeuHisArgAlaThr420<210>8<211>421<212>PRT<213>生二素链霉菌<400>8ValArgValLeuLeuThrSerLeuAlaHisAsnThrHisTyrTyrSer151015LeuValProLeuAlaTrpAlaLeuArgAlaAlaGlyHisGluValArg202530ValAlaSerProProSerLeuThrAspVallieThrSerThrGlyLeu354045ThrAlaValProValGlyAspAspArgProAlaAlaGluLeuLeuAla505560GluMetGlySerAspLeuValProTyrGinArgGlyPheGluPheGly65707580GluValGluSerGluGluGluThrThrTrpGluTyrLeuLeuGlyGin859095GinSerMetMetAlaAlaLeuCysPheAlaProPheAsnGlyAlaAla100105110ThrMetAspGlulieValAspPheAlaArgGlyTrpArgProAspLeu115120125ValValTrpGluProT卬ThrTyrAlaGlyProValAlaAlaArgAla130135140CysGlyAlaAlaHisAlaArglieLeuTrpGlyProAspAlalieGly145150155160ArgSerArgLeuArgPheLeuAlaAlaLeuAspGlyMetProGluGlu165170175LeuArgGluAspProlieAlaGluTrpLeuGlyTrpThrLeuAspArg180185190TyrGlyLeuAlaPheAspGluArgAspValLeuGlyHisTrpVallie195200205AspProGlyProArgSerThrArgLeuAspLeuGlyGinThrThrVal210215220ProMetCysTyrValProTyrAsnGlyArgSerVallieGluProTrp225230235240LeuGlyLysLysProAspArgProArgValCysLeuThrLeuGlyVal245250255SerAlaArgGluThrTyrGlyArgAspAlaValSerTyrSerGluLeu260265270LeuGluAlaLeuGlyArgLeuAsplieGluValValAlaThrLeuAsp275280285ThrSerGinLeuAspArgLeuGlyThrLeuProAspAsnValValPro290295300ValAspPheValProLeuAspAlaLeuLeuProSerCysAlaAlalie305310315320lieHisHisGlyGlyAlaGlyThrTrpSerThrAlaLeuArgHisGly325330335ValProGinlieLeuLeuProSerLeuTrpAspAlaProLeuLysAla340345350GinGinLeuGinArgLeuSerAlaGlyPheAspLeuProAlaAlaThr355360365UuThrAlaArgGlyLeuAlaAspAlaValHisThrAlaValHisAsp370375380ProAlalieArgAlaGlyAlaArgArgLeuSerGluGluMetLeuAla385390395400AspProThrProAlaGlylielieProThrLeuGluArgLeuThrAla405410415LeuHisArgAlaThr420〈210〉9<211>1350<212>腿<213>生二素链霉菌<220〉<221>CDS<222>(1)..(1350)<400>9atgcccgaaagecatgcgcagagegcgctgetcgccgcgateaccgcc48MetProGluSerHisAlaGinSerAlaLeuLeuAlaAlalieThrAla151015gcggaccgcacccccgaggacategcggcgctgcccctgcccgagtec96AlaAspArgThrProGluAsplieAlaAlaLeuProLeuProGluSer202530ttccgcgccgtgaccgtccgcaaagaggacaccgacatgttccgcggg144PheArgAlaValThrValArgLysGluAspThrAspMetPheArgGly354045atgccgagegcggacaaggacccgcgcaagtecctgcacgtcgacgag192MetProSerAlaAspLysAspProArgLysSerLeuHisValAspGlu505560gtgccgctgcccgaagtggggcccggggaggcgctggtcgcggtgatg240ValProLeuProGluValGlyProGlyGluAlaLeuValAlaValMet65707580gccagetecgtcaactacaacacggtctggtectecatettcgagccc288AlaSerSerValAsnTyrAsnThrValTrpSerSerliePheGluPro859095etcccgacgttcggcttcctggagcgctacgggcgcacctegccgctg336LeuProThrPheGlyPheLeuGluArgTyrGlyArgThrSerProLeu100105110gccgcgcgccacgacctgccgtaccacateetcggttecgacctgtec384AlaAlaArgHisAspLeuProTyrHislieLeuGlySerAspLeuSer115120125ggcgtggtgctgcgcacgggacccggcgtgaacgtctggaaacccggt432GlyValValLeuArgThrGlyProGlyValAsnValTrpLysProGly130135140gacgaggtcgtcgcgcactgtctgteggtggagctggagagecccgac柳AspGluValValAlaHisCysLeuSerValGluLeuGluSerProAsp145150155160gggcacgacgacaccatgetcgacccggcccagcgcatetggggcttc528GlyHisAspAspThrMetLeuAspProAlaGinArglieTrpGlyPhe165170175gagaccaacttcgggggcctggccgaggtggccetcgtcaagtecaac576GluThrAsnPheGlyGlyLeuAlaGluValAlaLeuValLysSerAsn180185190cagctgatgcccaaggcggcccatctgacctgggaggaggccgccgcg624GinLeuMetProLysAlaAlaHisLeuThrTrpGluGluAlaAlaAla195200205cccggtctggtcaactecaccgcctaccgccagctggtcteccgcaac672ProGlyLeuValAsnSerThrAlaTyrArgGinLeuValSerArgAsn210215220ggcgccggcatgaagcagggcgacaacgtgctgatetggggcgccage720GlyAlaGlyMetLysGinGlyAspAsnValLeulieTrpGlyAlaSer225230235240ggcggcctgggctegtacgccacccagctggccetcgccggcggggcc768GlyGlyLeuGlySerTyrAlaThrGinLeuAlaLeuAlaGlyGlyAla245250255caccccgtctgcgtggtctecagegcgcgcaaggccgaggtgtgcegg816HisProValCysValValSerSerAlaArgLysAlaGluValCysArg260265270gccatgggcgcggaggccateategaccgctecgccgaggactaccgc864AlaMetGlyAlaGluAlalielieAspArgSerAlaGluAspTyrArg275280285ttctggagegacgaggacacccaggacccgegggagtggaagcgcttc912PheTrpSerAspGluAspThrGinAspProArgGluTrpLysArgPhe290295300ggcaagcgcatecgcgaggtcaccgggggcgaggacgtcgacategtc960GlyLysArglieArgGluValThrGlyGlyGluAspValAsplieVal305310315320ttcgagcaccccggcegggagaccttcggggcgtecgtctacgtcacc1008PheGluHisProGlyArgGluThrPheGlyAlaSerValTyrValThr325330335cgcaggggcggcacgategtcacctgcgcctecacctegggcttccgc1056ArgArgGlyGlyThrlieValThrCysAlaSerThrSerGlyPheArg340345350cacgagttcgacaaccgctacetctggatgcacetcaagcgtategtc1104HisGluPheAspAsnArgTyrLeuTrpMetHisLeuLysArglieVal355360365ggcacccacttcgccaactaccgcgaggcgtgggaggcgaaceggetc1152GlyThrHisPheAlaAsnTyrArgGluAlaTrpGluAlaAsnArgLeu370375380gtcgccaaggggaggatecaccccaccetctegcgcacctacccgctg1200ValAlaLysGlyArglieHisProThrLeuSerArgThrTyrProLeu385390395400gccgacacggcggttgccgtgcacgacgtgcacggcaaccagcaccag1248AlaAspThrAlaValAlaValHisAspValHisGlyAsnGinHisGin405410415ggcaaggtcggcgtgetctgcctggcgcccacggaggggctgggcgtg1296GlyLysValGlyValLeuCysLeuAlaProThrGluGlyLeuGlyVal420425430cgcgacgaggagaagegggcgeggcacategacgcgateaaceggttc1344ArgAspGluGluLysArgAlaArgHislieAspAlalieAsnArgPhe435440445cgctga1350Arg450<210><211〉<212〉<213〉10449PRT生二素链霉菌<400>10MetProGluSerHisAlaGinSerAlaLeuLeuAlaAlalieThrAla151015AlaAspArgThrProGluAsplieAlaAlaLeuProLeuProGluSer202530PheArgAlaValThrValArgLysGluAspThrAspMetPheArgGly354045MetProSerAlaAspLysAspProArgLysSerLeuHisValAspGlu505560ValProLeuProGluValGlyProGlyGluAlaLeuValAlaValMet65707580AlaSerSerValAsnTyrAsnThrValTrpSerSerliePheGluPro859095LeuProThrPheGlyPheLeuGluArgTyrGlyArgThrSerProLeu100105110AlaAlaArgHisAspLeuProTyrHislieLeuGlySerAspLeuSer115120125GlyValValLeuArgThrGlyProGlyValAsnValTrpLysProGly130135140AspGluValValAlaHisCysLeuSerValGluLeuGluSerProAsp145150155160GlyHisAspAspThrMetLeuAspProAlaGinArglieTrpGlyPhe165170175GluThrAsnPheGlyGlyLeuAlaGluValAlaUuValLysSerAsn180185190GinLeuMetProLysAlaAlaHisLeuThrTrpGluGluAlaAlaAla195200205ProGlyLeuValAsnSerThrAlaTyrArgGinLeuValSerArgAsn210215220GlyAlaGlyMetLysGinGlyAspAsnValLeulieTrpGlyAlaSer225230235240GlyGlyLeuGlySerTyrAlaThrGinLeuAlaLeuAlaGlyGlyAla245250255HisProValCysValValSerSerAlaArgLysAlaGluValCysArg260265270AlaMetGlyAlaGluAlalielieAspArgSerAlaGluAspTyrArg275280285PheTrpSerAspGluAspThrGinAspProArgGluTrpLysArgPhe290295300GlyLysArglieArgGluValThrGlyGlyGluAspValAsplieVal305310315320PheGluHisProGlyArgGluThrPheGlyAlaSerValTyrValThr325330335ArgArgGlyGlyThrlieValThrCysAlaSerThrSerGlyPheArg340345350HisGluPheAspAsnArgTyrLeuTrpMetHisLeuLysArglieVal355360365GlyThrHisPheAlaAsnTyrArgGluAlaTrpGluAlaAsnArgLeu370375380ValAlaLysGlyArglieHisProThrLeuSerArgThrTyrProLeu385390395400AlaAspThrAlaValAlaValHisAspValHisGlyAsnGinHisGin405410415GlyLysValGlyValLeuCysLeuAlaProThrGluGlyLeuGlyVal420425430ArgAspGluGluLysArgAlaArgHislieAspAlalieAsnArgPhe435440445Arg<210>11<211〉675<212〉DNA<213>生二素链霉菌<220><221〉CDS<222>(1).,(675)<400〉11atgatgagegtggcagaccagacggetetcagecccgcgctgctggag48MetMetSerValAlaAspGinThrAlaLeuSerProAlaLeuL_euGlu151015tacgcceggagegtcgcgctgegggacgacggcctgctgcgcgaactg96TyrAlaArgSerValAlaLeuArgAspAspGlyLeuLeuArgGluLeu202530cacgaggtgaccgccgggetccccggcggcegggccatgcagateatg144HisGluValThrAlaGlyLeuProGlyGlyArgAlaMetGinlieMet354045cccgaggaggcgcagttcetcgccctgctgateeggetcgtcggtgcc192ProGluGluAlaGinPheLeuAlaLeuLeulieArgLeuValGlyAla505560eggegggtgctggagateggcaccttcacggggtacageacgctgtgc240ArgArgValLeuGlulieGlyThrPheThrGlyTyrSerThrLeuCys65707580atggcgegggcactgcccgccgacggcaccgtcgtcacctgcgacate288MetAlaArgAlaLeuProAlaAspGlyThrValValThrCysAsplie859095agegacaggtggcccggcgtcggcgcaccgtactggcgcegggccggg336SerAspArgTrpProGlyValGlyAlaProTyrTrpArgArgAlaGly100105110gtggagteceggategacctgcgcgtcggcgacgccgtceggaccetc384ValGluSerArglieAspLeuArgValGlyAspAlaValArgThrLeu115120125gccgagetccgcgagcacgagggggacggctegttcgacctggtcttc432AlaGluLeuArgGluHisGluGlyAspGlySerPheAspLeuValPhe130135140gtcgacgccgacaagaccgggtacccgcactactacgagcaggcgctg480ValAspAlaAspLysThrGlyTyrProHisTyrTyrGluGinAlaLeu145150155160gccctggtacgccccggcggactggtggcggtcgacaacaccctgttc528AlaLeuValArgProGlyGlyLeuValAlaValAspAsnThrLeuPhe165170175ttcggcegggtggccgacccggccgtcgaggacgccgacaccgtcgcc576PheGlyArgValAlaAspProAlaValGluAspAlaAspThrValAla180185190gtgcgcgcgetcaacgagctgctgcgcgacgacgaacgcgtggacate624ValArgAlaLeuAsnGluLeuLeuArgAspAspGluArgValAsplie195200205gccctgctgacggtcgccgacgggateactctggcccgceggegggag672AlaLeuLeuThrValAlaAspGlylieThrLeuAlaArgArgArgGlu210215220225675<210〉12<211>224<212>PRT<213>生二素链霉菌<400〉12MetMetSerValAlaAspGinThrAlaLeuSerProAlaLeuLeuGlu151015TyrAlaArgSerValAlaLeuArgAspAspGlyLeuLeuArgGluLeu202530HisGluValThrAlaGlyLeuProGlyGlyArgAlaMetGinlieMet354045ProGluGluAlaGinPheLeuAlaLeuLeulieArgLeuValGlyAla505560ArgArgValLeuGlulieGlyThrPheThrGlyTyrSerThrLeuCys65707580MetAlaArgAlaLeuProAlaAspGlyThrValValThrCysAsplie859095SerAspArgTrpProGlyValGlyAlaProTyrTrpArgArgAlaGly100105110ValGluSerArglieAspLeuArgValGlyAspAlaValArgThrLeu115120125AlaGluLeuArgGluHisGluGlyAspGlySerPheAspLeuValPhe130135140ValAspAlaAspLysThrGlyTyrProHisTyrTyrGluGinAlaLeu145150155160AlaLeuValArgProGlyGlyLeuValAlaValAspAsnThrLeuPhe165170175PheGlyArgValAlaAspProAlaValGluAspAlaAspThrValAla180185190ValArgAlaLeuAsnGluLeuLeuArgAspAspGluArgValAsplie195200205AlaLeuLeuThrValAlaAspGlylieThrLeuAlaArgArgArgGlu210215220<210><211><212><213>131245DNA生二素链霉菌<220><221〉<222>CDS(l).,(1245)<400〉13gtgetccagLeuVal1GincgcArggtcVal5g3tctgAspLeutegSerteaSeretcaccggcLeuThrGly10etcLeucgctggTrp15tatTyr48gcgAlagcgAlactg二euacgThr20gtaValttcgccPheAlatgtCysC3CHis25ategcccaglieAlaGincagGinggcGly30ttcPhettcPhe96gccAlag3CAspC3gGin35cagGingtgValggcageGlySergC3Ala40ctgLeuctgcacateLeuHislie3CCThr45ccgProetcLeuggtGly144tecSeratgMet50gcgAlagtcValtegSeratettcliePhe55ttcPheataliectgagtggaLeuSerGly60UcPhegtcValetcLeugccAla192tggTrp65tegSergccAlacgcArggacAspgaggacGluAsp70tecSergtgValccgactttcProThrPhe75tggTrpeggcgcArgArgcgcArg80240ateliegcgAla犯gLysatelietatTyr85ccgctgProLeucatHisetcLeugcgacgttcAlaThrPhe90ggcGlyategcglieAla95getAla288etcLeuatelieattliettcPhe100tecSerctgtegLeuSergagGluccgPro105gtacttcccValLeuProggcGlyggttecGlySer110gtaVal336tgggacgggctggtgcccaatgttctgetcgtgcagtectggcttccc384TrpAspGlyLeuValProAsnValLeuLeuValGinSerTrpLeuPro115120125gacgcgaccetcacggccagtttcaacacgcccagetggtcgetctec432AspAlaThrLeuThrAlaSerPheAsnThrProSerTrpSerLeuSer130135140tgtgagategccttctatctgtcgttcccgctgtggtaceggctggtg480CysGlulieAlaPheTyrLeuSerPheProCeuTrpTyrArgLeuVal145150155160cgcaggattcccgcaeggeggctgtggtggtgcgccgcggggategcc528ArgArglieProAlaArgArgLeuTrpTrpCysAlaAlaGlylieAla165170175gtggccgtgacgtgtgtgcccctgctggcgggcctgetcccggcgage576ValAlaValThrCysVaJProLeuLeuAlaGlyLeuLeuProAlaSer180185190gaggaggtggcccccgggatgtcgetcaacgaggtctggttcgcgtac624GluGluValAlaProGlyMetSerLeuAsnGluValTrpPheAlaTyr195200205tggcttccgccggtgcgcatgctggagttcgtcetcggcategtgatg672TrpLeuProProValArgMetLeuGluPheValLeuGlylieValMet210215220gcgctgatectgcgcgcggggatetggaagggccccggtccggcggtc,AlaLeulieLeuArgAlaGlylieTrpLysGlyProGlyProAlaVal225230235240tgcacggcgetcetcgccgcgagttacggcetcacccagatggtgccc768CysThrAlaLeuLeuAlaAlaSerTyrGlyLeuThrGinMetValPro245250255ccgatettcaccetcgtcgcctgctecgtcgtaccggccgcgctgctg816ProliePheThrLeuValAlaCysSerValValProAlaAlaLeuLeu260265270ateacggcgctggccgacgccgacgtgcacggceggcgcacggggctg鹏lieThrAlaLeuAlaAspAlaAspValHisGlyArgArgThrGlyLeu275280285cgttcggcgacgctggtgeggctgggccagtggtecttcgccttctac912ArgSerAlaThrLeuValArgLeuGlyGinTrpSerPheAlaPheTyr290295300ctggtccacttcctgateatecgctacggacaceggctgatgggcggc960LeuValHisPheLeulielieArgTyrGlyHisArgLeuMetGlyGly305310315320gatctgggctacgageggcagtggageaccccggccgcgategcgctg1008AspLeuGlyTyrGluArgGinTrpSerThrProAlaAlalieAlaLeu325330335tecctggggatgctgggggtggcggtcctggccggcggtctgctgcac1056SerLeuGlyMetLeuGlyValAlaValLeuAlaGlyGlyLeuLeuHis340345350accgtcgtcgaacagccctgcatgcgcctgttcggcagecgcaggtec1104ThrValValGluGinProCysMetArgLeuPheGlySerArgArgSer355360365gccteccgtccgaagcccggcgccaccgcggetccceggaacteaccc1152AlaSerArgProLysProGlyAlaThrAlaAlaProArgAsnSerPro370375380gcggccgacgcggccggcgtgcccctgetcccgggcgtacccgggccc1200AlaAlaAspAlaAlaGlyValProLeuLeuProGlyValProGlyPro385390395400gcgcacacccccgcagcgacgaacgaacccaccccgagaggatga1245AlaHisThrProAlaAlaThrAsnGluProThrProArgGly405410415<210>14<211>414<212〉PRT<213>生二素链霉菌<400〉14ValLeuGinArgValAspLeuSerSerLeuThrGlyLeuArgTrpTyr151015AlaAlaLeuThrValPheAlaCysHislieAlaGinGinGlyPhePhe202530AlaAspGinGinValGlySerAlaLeuLeuHislieThrProLeuGly354045SerMetAlaValSerliePhePhelieLeuSerGlyPheValLeuAla505560TrpSerAlaArgAspGluAspSerValProThrPheTrpArgArgArg65707580lieAlaLyslieTyrProLeuHisLeuAlaThrPheGlylieAlaAla859095LeulieliePheSerLeuSerGluProValLeuProGlyGlySerVal100105110TrpAspGlyLeuValProAsnValLeuLeuValGinSerTrpLeuPro115120125AspAlaThrLeuThrAlaSerPheAsnThrProSerTrpSerLeuSer130135140CysGlulieAlaPheTyrLeuSerPheProLeuTrpTyrArgLeuVal145150155160ArgArglieProAlaArgArgLeuTrpTrpCysAlaAlaGlylieAla165170175ValAlaValThrCysValProLeuLeuAlaGlyLeuLeuProAlaSer180185190GluGluValAlaProGlyMetSerLeuAsnGluValTrpPheAlaTyr195200205TrpLeuProProValArgMetLeuGluPheValLeuGlylieValMet210215220AlaLeulieLeuArgAlaGlylieTrpLysGlyProGlyProAlaVal225230235240CysThrAlaLeuLeuAlaAlaSerTyrGlyLeuThrGinMetValPro245250255ProliePheThrLeuValAlaCysSerValValProAlaAlaLeuLeu260265270lieThrAlaLeuAlaAspAlaAspValHisGlyArgArgThrGlyLeu275280285ArgSerAlaThrLeuValArgLeuGlyGinTrpSerPheAlaPheTyr290295300LeuValHisPheLeulielieArgTyrGlyHisArgLeuMetGlyGly305310315320AspLeuGlyTyrGluArgGinTrpSerThrProAlaAlalieAlaLeu325330335SerLeuGlyMetLeuGlyValAlaValLeuAlaGlyGlyLeuLeuHis340345350ThrValValGluGinProCysMetArgLeuPheGlySerArgArgSer355360365AlaSerArgProLysProGlyAlaThrAlaAlaProArgAsnSerPro370375380AlaAlaAspAlaAlaGlyValProLeuLeuProGlyValProGlyPro385390395400AlaHisThrProAlaAlaThrAsnGluProThrProArgGly405410<210>15<211>849<212〉DNA<213〉生二素链霉菌<220><221>CDS<222〉(1)..(849)<400>15gtgacattgaaatecccactgccaccgcaatecgtctecgcacccget48ValThrLeuLysSerProLeuProProGinSerValSerAlaProAla151015gatteacgcageaccgcgeggagagaatggggtcagaacttctttcgt96AspSerArgSerThrAlaArgArgGluTrpGlyGinAsnPhePheArg202530acagccgccgcggcctgtcgtttctecgetcagctggacggttcggac144ThrAlaAlaAlaAlaCysArgPheSerAlaGinLeuAspGlySerAsp354045accattccgcccgattctccgaatgacctgatgaccgtcgaaataggc192ThrlieProProAspSerProAsnAspLeuMetThrValGlulieGly505560gcgggateagggegggtgaccaaagtgetcgccteacccgggacgcct240AlaGlySerGlyArgValThrLysValLeuAlaSerProGlyThrPro65707580ttaetcgcggtggaaatagatccccgctgggeteggeggctggccgcc288LeuLeuAlaValGlulieAspProArgTrpAlaArgArgLeuAlaAla859095gaatcgctgccggacgtcacggtggtgaacgaggatttcctgaccctg336GluSerLeuProAspValThrValValAsnGluAspPheLeuThrLeu100105110caactgcccgggcagccggtcagaetcategggaatcttcccttcgtc384GinUuProGlyGinProValArgLeulieGlyAsnUuProPheVal115120125accggcaccagaatgctgaggcgctgcetcgacatgggtccggcgcgc432ThrGlyThrArgMetLeuArgArgCysLeuAspMetGlyProAlaArg130135140atgeggcagggcgtgUcctgttgcagegggagtacgtggga卿egg480MetArgGinGlyValPheLeuLeuGinArgGluTyrValGlyLysArg145150155160accggagcctggggcggaaacetcttcaacgcccagtgggagccgtgg528ThrGlyAlaTrpGlyGlyAsnLeuPheAsnAlaGinTrpGluProTrp165170175tactcgttcgaceggggcctggccttcteacgccaggacttcaccccc576TyrSerPheAspArgGlyLeuAlaPheSerArgGinAspPheThrPro180185190gtaccgcgcgcggacacccagaccctgatggtcgccccgcaccgcagg624ValProArgAlaAspThrGinThrLeuMetValAlaProHisArgArg195200205ccgtecgtgccctggcgtgagaaggccgcctaccageggttcgtccaa672ProSerValProTrpArgGluLysAlaAlaTyrGinArgPheValGin210215220egggtcttcgacaccggccagatgacggtgggcgacgccgcgeggaag720ArgValPheAspThrGlyGinMetThrValGlyAspAlaAlaArgLys225230235240gtgctgcgccgcggacacgcccagttcgtgcgcggggcgggcgtgagg768ValLeuArgArgGlyHisAlaGinPheValArgGlyAlaGlyValArg245250255ccggccgacegggtcaaggacetcacggtcccggagtggaccgcaetc816ProAlaAspArgValLysAspLeuThrValProGluTrpThrAlaLeu260265270ttccgcgcctacgggeggacggccgaccgctga849PheArgAlaTyrGlyArgThrAlaAspArg275280<210>16<211〉282〈212〉PRT〈213〉生二素链霉菌<400>16ValThrLeuLysSerProLeuProProGinSerValSerAlaProAla151015AspSerArgSerThrAlaArgArgGluTrpGlyGinAsnPhePheArg202530ThrAlaAlaAlaAlaCysArgPheSerAlaGinLeuAspGlySerAsp354045ThrlieProProAspSerProAsnAspLeuMetThrValGlulieGly505560AlaGlySerGlyArgValThrLysValLeuAlaSerProGlyThrPro65707580LeuLeuAlaValGlulieAspProArgTrpAlaArgArgLeuAlaAla859095GluSerLeuProAspValThrValValAsnGluAspPheLeuThrLeu100105110GinLeuProGlyGinProValArgLeulieGlyAsnLeuProPheVal115120125ThrGlyThrArgMetLeuArgArgCysLeuAspMetGlyProAlaArg130135140MetArgGinGlyValPheLeuLeuGinArgGluTyrValGlyLysArg145150155160ThrGlyAlaTrpGlyGlyAsnLeuPheAsnAlaGinTrpGluProTrp165170175TyrSerPheAspArgGlyLeuAlaPheSerArgGinAspPheThrPro180185190ValProArgAlaAspThrGinThrLeuMetValAlaProHisArgArg195200205ProSerValProTrpArgGluLysAlaAlaTyrGinArgPheValGin210215220ArgValPheAspThrGlyGinMetThrValGlyAspAlaAlaArgLys225230235240ValLeuArgArgGlyHisAlaGinPheValArgGlyAlaGlyValArg245250255ProAlaAspArgValLysAspLeuThrValProGluTrpThrAlaLeu260265270PheArgAlaTyrGlyArgThrAlaAspArg275280<210>17<211〉831<212>DNA<213〉生二素链霉菌<220><221〉CDS<222>(1)..(831)<400>17gtgaaggaggtggcggtcgacaccggtaccccggccggccccgtgtgg48ValLysGluValAlaValAspThrGlyThrProAlaGlyProValTrp151015cgtggtgccggcetcggcacccagctgtgggtactgaccgcgeggcag96ArgGlyAlaGlyLeuGlyThrGinLeuTrpValLeuThrAlaArgGin202530atecgttecatgtacggcgaccgccgcctggcgctgttcagectgatg144lieArgSerMetTyrGlyAspArgArgLeuAlaLeuPheSerLeuMet354045caaccggtgateatgctgttgctgctgagegagatettcggcageatg192GinProVallieMetLeuLeuLeuLeuSerGluliePheGlySerMet505560gccgacccggacgacttcccgcagggcgtgcgctacategactacgtg240AlaAspProAspAspPheProGinGlyValArgTyrlieAspTyrVal65707580gtgcccgcgctgctggtcaccaccggcateggcteggcccagggcgcg288ValProAlaLeuLeuValThrThrGlylieGlySerAlaGinGlyAla859095ggggtgggcctggtcagggacatggacaacgggatggtggcgcgcttc336GlyValGlyLeuValArgAspMetAspAsnGlyMetValAlaArgPhe100105110cgcgtcctgccggcceggctgttcctggtgctggtcgcceggtegctg384ArgValLeuProAlaArgLeuPheLeuValLeuValAlaArgSerLeu115120125gccgatctggtccgtgtgttcaccgagttggtcgtcetcgtggccgtc432AlaAspLeuValArgValPheThrGluLeuValValLeuValAlaVal130135140ggtgtgatectgctgggcttccgtccggccgggggtUgtggggcacg480GlyVallieLeuLeuGlyPheArgProAlaGlyGlyLeuTrpGlyThr145150155160tecgccgccctgttgetcaccctgttcgtcatetggtegctgatetgg528SerAlaAlaLeuLeuLeuThrLeuPheVallieTrpSerLeulieTrp165170175gggttcategccetcgcggcgtggctgcgcagegtggaggtgatgtec576GlyPhelieAlaLeuAlaAlaTrpLeuArgSerValGluValMetSer180185190ageetcgcggttctggtgatgttcccgetcatgttcgcctecagtgcg624SerLeuAlaValLeuValMetPheProLeuMetPheAlaSerSerAla195200205ttcgtcccgctggacgccetcccggagtggctgcgcteggtggcgcac672PheValProLeuAspAlaLeuProGluTrpLeuArgSerValAlaHis210215220etcaaccccgtgacgtacgcggtcgacagegcccgccgcctggcgctg720LeuAsnProValThrTyrAlaValAspSerAlaArgArgLeuAlaLeu225230235240gactgggacccggggtggagegtgcccggcgcgctgctgaccageacc768AspTrpAspProGlyTrpSerValProGlyAlaLeuLeuThrSerThr245250255gcgetcatggcggtggggatgtacgtcgccgggcgttecUcaagagg816AlaLeuMetAlaValGlyMetTyrValAlaGlyArgSerPheLysArg260265270cccccgaacgaatga831ProProAsnGlu275<210>18<211〉276<212〉PRT<213〉生二素链霉菌<400>18ValLysGluValAlaValAspThrGlyThrProAlaGlyProValTrp151015ArgGlyAlaGlyLeuGlyThrGinLeuTrpValLeuThrAlaArgGin202530lieArgSerMetTyrGlyAspArgArgLeuAlaLeuPheSerLeuMet354045GinProVallieMetLeuLeuLeuLeuSerGluliePheGlySerMet505560AlaAspProAspAspPheProGinGlyValArgTyrlieAspTyrVal65707580ValProAlaLeuLeuValThrThrGlylieGlySerAlaGinGlyAla859095GlyValGlyLeuValArgAspMetAspAsnGlyMetValAlaArgPhe100105110ArgValLeuProAlaArgLeuPheLeuValL_euValAlaArgSerLeu115120125AlaAspLeuValArgValPheThrGluLeuValValLeuValAlaVal130135140GlyVallieLeuLeuGlyPheArgProAlaGlyGlyLeuTrpGlyThr145150155160SerAlaAlaI>euLeuLeuThrLeuPheVallieTrpSerLeulieTrp165170175GlyPhelieAlaLeuAlaAlaTrpLeuArgSerValGluValMetSer180185190SerLeuAlaValLeuValMetPheProLeuMetPheAlaSerSerAla195200205PheValProLeuAspAlaLeuProGluTrpLeuArgSerValAlaHis210215220LeuAsnProValThrTyrAlaValAspSerAlaArgArgLeuAlaLeu225230235240AspTrpAspProGlyTrpSerValProGlyAlaLeuLeuThrSerThr245250255AlaLeuMetAlaValGlyMetTyrValAlaGlyArgSerPheLysArg260265270ProProAsnGlu275<210>19<211>882<212>腿<213〉生二素链霉菌<220〉〈221>CDS<222〉(1),.(882)<400〉19gtggacategaggtcgaaeggggcegggtgetcgggctgctgggtcac48ValAsplieGluValGluArgGlyArgValLeuGlyLeuLeuGlyHis151015aacggggccggcaagacgaccttggtgaacatecttgccacggtctec96AsnGlyAlaGlyLysThrThrLeuValAsnlieLeuAlaThrValSer202530ccggcgtecgcgggcacggtgaccgtcgccggtttcgacgtcgcgacg144ProAlaSerAlaGlyThrValThrValAlaGlyPheAspValAlaThr354045cagggcgccgagatecgcgcgcgcateggggtgaccggccagttcgcg192GinGlyAlaGlulieArgAlaArglieGlyValThrGlyGinPheAla505560teggtggacgagtacctgageggattccgcaacetcgtcctgateggcMOSerValAspGluTyrLeuSerGlyPheArgAsnLeuValLeulieGly65707580cgcetcetcggggcgggaeggcgtgaggcggcggccegggccaccgag288ArgLeuLeuGlyAlaGlyArgArgGluAlaAlaAlaArgAlaThrGlu859095etcctggagctgttcgagctgaccggggcggcccaccagcccteccgc336LeuLeuGluLeuPheGluLeuThrGlyAlaAlaHisGinProSerArg100105110acctactcgggcgggatgcgccgaeggetcgacetcgccgccagectg384ThrTyrSerGlyGlyMetArgArgArgLeuAspLeuAlaAlaSerLeu115120125gtcggceggccggacgtgctgttcetcgacgagccgacgaccgggctg432ValGlyArgProAspValLeuPheLeuAspGluProThrThrGlyLeu130135140gacccggcgacceggategccctgtgggagacggtggagaagctggtg480AspProAlaThrArglieAlaLeuTrpGluThrValGluLysLeuVal145150155160gcgggcggcacgaccgtcctgctgaccacccagtacctggacgaggcg528AlaGlyGlyThrThrValLeuLeuThrThrGinTyrLeuAspGluAla165170175gaceggctggccgactggateaccgtcctgtcgaagggcegggtggtg576AspArgLeuAlaAspTrplieThrValLeuSerLysGlyArgValVal180185190gcctcggacaccaccgaceggetcaaggccgacctgggccaceggtcg624AlaSerAspThrThrAspArgLeuLysAlaAspLeuGlyHisArgSer195200205gtgegggtggtccttccgcccgccgccgacctgacggccgccgccgcc672ValArgValValLeuProProAlaAlaAspLeuThrAlaAlaAlaAla210215220gcgetcaccgccggcgggttccgtccgeggtecgacgccggggagcac720AlaLeuThrAlaGlyGlyPheArgProArgSerAspAlaGlyGluHis225230235240gcgctgaccacgcccgtggacacctcggccggtategcgggcgtcate768AlaLeuThrThrProValAspThrSerAlaGlylieAlaGlyVallie245250255cgcgcgArgAlagagccgGluProgccgccAlaAla290ctgHeutecSer275gacAspgacAsp260ctgLeugcgAla3CCThrAspgccAlagtcggaacgcaggccgtcgagctgValGlyThrGinAlaValGluLeu265gacgtctacctggcgetcacccatAspValTyrLeuAlaLeuThrHis280285tgaaccgtcaag816ThrValLys270cccteaccc864ProSerPro882<210〉20<211〉293<212〉PRT<213>生二素链霉菌<400>20ValAsplie1GluVal5GluArgGlyArgValLeuGlyLeu10LeuGlyHis15AsnGlyAlaGlyLysThrThrLeuValAsnlieLeuAlaThrValSer202530ProAlaSerAlaGlyThrValThrValAlaGlyPheAspValAlaThr354045GinGlyAlaGlulieArgAlaArglieGlyValThrGlyGinPheAla505560SerValAspGluTyrLeuSerGlyPheArgAsnLeuValLeulieGly65707580ArgLeuLeuGlyAlaGlyArgArgGluAlaAlaAlaArgAlaThrGlu859095LeuLeuGluLeuPheGluLeuThrGlyAlaAlaHisGinProSerArg100105110ThrTyrSerGlyGlyMetArgArgArgLeuAspLeuAlaAlaSerLeu115120125ValGlyArgProAspValLeuPheLeuAspGluProThrThrGlyLeu130135140AspProAlaThrArglieAlaLeuTrpGluThrValGluLysLeuVal145150155160AlaGlyGlyThrThrValLeuLeuThrThrGinTyrLeuAspGluAla165170175AspArgLeuAlaAspTrplieThrValLeuSerLysGlyArgValVal180185190AlaSerAspThrThrAspArgLeuLysAlaAspLeuGlyHisArgSer195200205ValArgValValLeuProProAlaAlaAspLeuThrAlaAlaAlaAla210215220AlaLeuThrAlaGlyGlyPheArgProArgSerAspAlaGlyGluHis225230235240AlaLeuThrThrProValAspThrSerAlaGlylieAlaGlyVallie245250255ArgAlaLeuAspThrValGlyThrGinAlaValGluLeuThrValLys260265270GluProSerLeuAspAspValTyrLeuAlaLeuThrHisProSerPro275280285AlaAlaAspAlaAla290<210〉21<211〉228<212>DNA<213〉生二素链霉菌<220〉<221〉CDS<222〉(1)..(228)<400>21atgageaacccgttcgaggacacggaagccacctacgtcgtgctggtc48MetSerAsnProPheGluAspThrGluAlaThrTyrValValLeuVal151015aacgacgaggggcagcactegctgtggccgtegttcgcggaggtcccg96AsnAspGluGlyGinHisSerLeuTrpProSerPheAlaGluValPro202530gcgggctggtecgtcgtggtgccggagacggaceggcagtegtgcctg144AlaGlyTrpSerValValValProGluThrAspArgGinSerCysLeu354045gactacateaacgagaactggaccgacatgcgccccaagageetcgtc192AspTyrlieAsnGluAsnTrpThrAspMetArgProLysSerLeuVal505560gaggcgatggcgacggccgggcaggacgccccttga228GluAlaMetAlaThrAlaGlyGinAspAlaPro657075<210>22<211〉75<212>PRT<213>生二素链霉菌<400>22MetSerAsnProPheGluAspThrGluAlaThrTyrValValLeuVal151015AsnAspGluGlyGinHisSerLeuTrpProSerPheAlaGluValPro202530AlaGlyTrpSerValValValProGluThrAspArgGinSerCysLeu354045AspTyrlieAsnGluAsnTrpThrAspMetArgProLysSerLeuVal505560GluAlaMetAlaThrAlaGlyGinAspAlaPro657075<210〉23<211〉1212<212〉DNA<213>生二素链霉菌〈220〉<221>CDS<222〉(1)..(1212)〈400〉23atgggtgaggccgtgacgggaccgatggagctgageaaggacgcggac48MetGlyGluAlaValHirGlyProMetGluLeuSerLysAspAlaAsp151015gccegggggctgcttgagtggttcgcgtacaacaggacgcgtcatccg%AlaArgGlyLeuLeu&luTrpPheAlaTyrAsnArgThrArgHisPro202530gtgttctgggacgagacccgacaggcgtggcaggtcttcggctacgac144ValPheTrpAspGluThrArgGinAlaTrpGinValPheGlyTyrAsp354045gactacgtgacggtgtegaacaacccgcagttcttctecteggacttc192AspTyrValThrValSerAsnAsnProGinPhePheSerSerAspPhe505560aacatggtgatgccgacgccgcccgaactggagatgateateggtccg240AsnMetValMetProThrProProGluLeuGluMetlielieGlyPro65707580ggcacgateggcgcgctggacccgcccgcgcacggaccgatgcgcaag288GlyThrlieGlyAlaLeuAspProProAlaHisGlyProMetArgLys859095ctggtgagecaggcgttcaccccccgaeggategcceggctggagccc336LeuValSerGinAlaPheThrProArgArglieAlaArgLeuGluPro100105110agggtgcgcgcgateaccgaggagetcctggacaaggtggggcagcag384ArgValArgAlalieThrGluGluLeuLeuAspLysValGlyGinGin115120125gacgtcgtcgacgccgtgggtgacctgtectacgcgctgccggtcate432AspValValAspAlaValGlyAspUuSerTyrAlaLeuProVallie130135140gtgategccgaactgctgggcatacccgccggcgaccgtgacctgttc480VallieAlaGluLeuLeuGlylieProAlaGlyAspArgAspLeuPhe145150155160egggagtgggtcgacaccctgctgacgaacgagggcctggagtacccg528ArgGluTrpValAspThrLeuLeuThrAsnGluGlyLeuGlu丁yrPro165170175aacetcccggacaacttcaccgagacgategcgcccgcgetcaaggag576AsnLeuProAspAsnPheThrGluThrlieAlaProAlaLeuLysGlu180185190atgaccgactacetcctgaagcagatecacgccaagegggacgcgccc624MetThrAspTyrLeuLeuLysGinlieHisAlaLysArgAspAlaPro195200205gccgacgacctggtcagegggctggtccaggcggagcaggacggccgc672AlaAspAspLeuValSerGlyLeuValGinAlaGluGinAspGlyArg210215220eggctgaccgacgtcgagategtcaacategtcgcgctgetcctgacg720ArgLeuThrAspValGlulieValAsnlieValAlaLeuLeuLeuThr225230235240gcggggcacgtctectecageaccctgetcageaacctgttcctggtc768AlaGlyHisValSerSerSerThrLeuLeuSerAsnLeuPheLeuVal245250255ctggaggagaacccgcaggcgctggaggacctgegggccgatcgctec816LeuGluGluAsnProGinAlaLeuGluAspLeuArgAlaAspArgSer260265270ctggtgcccggcgcgategaggagacgctgcgctaccgcagecccttc,LeuValProGlyAlalieGluGluThrLeuArgTyrArgSerProPhe275280285aacaacatettceggttcgtcaaggaggacaccaccgtcetcggtccg912AsnAsnliePheArgPheValLysGluAspThrThrValLeuGlyPro290295300etcatggagaagggccagatggtgategcctggagecagtecgccaac960LeuMetGluLysGlyGinMetVallieAlaTrpSerGinSerAlaAsn305eggArgtegSerctgLeuetcLeuttcPhe385g3CAspg3CAspggtGlyctgLeu370tacTyrcccProggcGlygccAla355AspgagGlueggArg3CCThr340gccAlaeggArggccAlaC3CHis325eggArgetcLeugtcValg3CAsp310ttcPhegactggaactgaAspTrpAsn<210>24〈211>403<212>PRT<213>生二素链霉菌<400〉24MetGlyGluAlaVal15caaGincagGin390ccgProC3CHisgccAlaatgMetcgcArgggcGly375etcLeugacAspgccAlactgLeu360ttcPheactThrccgProttcPhe345g站GlucgcArgccgProgacAsp330gggGlyggcGlyatelie3153CCThr犯gLysUcPheC3CHissagLysAsptacTyr395ggcGlygtcValcacHis380ctgLeugacateAsplieatecaclieHis350atgetcMetLeu365gagcacGluHiscccgtcProValcgcArg335cacHisgasGluThreggArg320cgc1008Argtgc1056Cysetc1104Leugtg1152Valgtc1200Val4001212ThrGlyProMetGluLeuSerLysAsp10AlaAsp15AlaArgGlyLeuLeuGluTrpPheAlaTyrAsnArgThrArgHisPro202530ValPheTrpAspGluThrArgGinAlaTrpGinValPheGlyTyrAsp354045AspTyrValThrValSerAsnAsnProGinPhePheSerSerAspPhe505560AsnMetValMetProThrProProGluLeuGluMetlielieGlyPro65707580GlyThrlieGlyAlaLeuAspProProAlaHisGlyProMetArgLys859095LeuValSerGinAlaPheThrProArgArglieAlaArgLeuGluPro100105110ArgValArgAlalieThrGluGluLeuLeuAspLysValGlyGinGin115120125AspValValAspAlaValGlyAspLeuSerTyrAlaLeuProVallie130135140VallieAlaGluLeuLeuGlylieProAlaGlyAspArgAspLeuPhe145150155160ArgGluTrpValAspThrLeuLeuThrAsnGluGlyLeuGluTyrPro165170175AsnLeuProAspAsnPheThrGluThrlieAlaProAlaLeuHysGlu180185190MetThrAspTyrLeuLeuLysGinlieHisAlaLysArgAspAlaPro195200205AlaAspAspLeuValSerGlyLeuValGinAlaGluGinAspGlyArg210215220ArgLeuThrAspValGlulieValAsnlieValAlaLeuLeuLeuThr225230235240AlaGlyHisValSerSerSerThrLeuLeuSerAsnLeuPheLeuVal245250255LeuGluGluAsnProGinAlaLeuGluAspLeuArgAlaAspArgSer260265270LeuValProGlyAlalieGluGluThrLeuArgTyrArgSerProPhe275280285AsnAsnliePheArgPheValLysGluAspThrThrValLeuGlyPro290295300LeuMetGluLysGlyGinMetVallieAlaT卬SerGinSerAlaAsn305310315320ArgAspProArgHisPheProAspProAspThrPheAsplieArgArg325330335SerAspGlyThrArgHisMetAlaPheGlyHisGlylieHisHisCys340345350LeuGlyAlaAlaLeuAlaArgLeuGluGlyLysValMetLeuGluLeu355360365LeuLeuAspArgValGinGlyPheArglieAspHisGluHisThrVal370375380PheTyrGluAlaAspGinLeuThrProLysTyrLeuProValArgVal385AspTrpAsn390395400<210><211〉<212><213><220><221><222><220><221〉<222〉25540DNA生二素链霉菌CDS(l)..(540)CDS(190).<400〉25ctgaacccgLeuAsnPro1(540)agggtctegteceggagtccagggccgteccgagccggc48ArgValSerSerArgSerProGlyProSerArgAlaGly51015cctggacctcacgaccgcccgataaggagegccgccategccgagaac96ProGlyProHisAspArgProlieArgSerAlaAlalieAlaGluAsn202530acagccgagetccctgcceggegggtcggcaggateaagccgtgcegg144ThrAlaGluLeuProAlaArgArgValGlyArglieLysProCysArg354045ctgateaggetcgagcagcacategacccgcgcggcageetctecgtg192LeulieArgLeuGluGinHislieAspProArgGlySerLeuSei*Val505560ategagtecggcgtgaccgtggacttccccgtccgacgcgtctactac240lieGluSerGlyValThrValAspPheProValArgArgValTyrTyr65707580atgcatggccagacccagtectctcccccgcgcggcctgcacgcgcac288MetHisGlyGinThrGinSerSerProProArgGlyLeuHisAlaHis859095cgcaccctggaacaaetcgtcategccgtccacggcgccttctecate336ArgThrLeuGluGinLeuVallieAlaValHisGlyAlaPheSerlie100105110accetcgacgacggcttccagcacgccacctaccgtctggacgaaccc384ThrLeuAspAspGlyPheGinHisAlaThrTyrArgLeuAspGluPro115120125ggagccggaetctgcateggccccatggtctggcgcgtcctgaaggac432GlyAlaGlyLeuCyslieGlyProMetValTrpArgValLeuLysAsp130135140ttcgaccccgacaccgtggccctggtcetcgcctegcagcactacgag480PheAspProAspThrValAlaLeuValLeuAlaSerGinHisTyrGlu145150155160gagtecgactactaccgcgactacgacaccttcctgcatgacgcaegg528GluSerAspTyrTyrArgAspTyrAspThrPheLeuHisAspAlaArg165170175ageetcacatga540SerLeuThr180〈210〉26<211〉179<212>PRT<213>生二素链霉菌<400〉26LeuAsnProArgValSerSerArgSerProGlyProSerArgAlaGly151015ProGlyProHisAspArgProlieArgSerAlaAlalieAlaGluAsn202530ThrAlaGluLeuProAlaArgArgValGlyArglieLysProCysArg354045LeulieArgLeuGluGinHislieAspProArgGlySerLeuSerVal505560lieGluSerGlyValThrValAspPheProValArgArgValTyrTyr65707580MetHisGlyGinThrGinSerSerProProArgGlyLeuHisAlaHis859095ArgThrLeuGluGinLeuVallieAlaValHisGlyAlaPheSerlie100105110ThrLeuAspAspGlyPheGinHisAlaThrTyrArgLeuAspGluPro115120125GlyAlaGlyLeuCyslieGlyProMetValTrpArgValLeuLysAsp130135140PheAspProAspThrValAlaLeuValLeuAlaSerGinHisTyrGlu145150155160GluSerAspTyrTyrArgAspTyrAspThrPheLeuHisAspAlaArg165170175SerLeuThr<210>27<211〉116<212>PRT<213>生二素链霉菌<400>27VallieGluSerGlyValThrValAspPheProValArgArgValTyr151015TyrMetHisGlyGinThrGinSerSerProProArgGlyLeuHisAla202530HisArgThrLeuGluGinLeuVallieAlaValHisGlyAlaPheSer354045lieThrLeuAspAspGlyPheGinHisAlaThrTyrArgLeuAspGlu505560ProGlyAlaGlyLeuCyslieGlyProMetValTrpArgValLeuLys65707580AspPheAspProAspThrValAlaLeuValLeuAlaSerGinHisTyr859095GluGluSerAspTyrTyrArgAspTyrAspThrPheLeuHisAspAla100105110ArgSerLeuThr115<210>28<211>1167<212〉DNA<213>生二素链霉菌<220〉<221〉CDS<222>(1)..(1167)<400>28atgaccatecccttcetcgacgcgggcgccggctacegggagttgcga48MetThrlieProPheLeuAspAlaGlyAlaGlyTyrArgGluLeuArg151015gccgagategacgcggccctgcagegggtgtecgcctecggccgctat96AlaGlulieAspAlaAlaLeuGinArgValSerAlaSerGlyArgTyr202530ctgLeuetcLeugscAsp35gcgAlagaeiGluetcLeugcgAlagccAla40ttcPhegagGlug3gGlugagGluttcPhe45gccAlagcgAlatacTyr144tgcCysAsp50AsngacAspC3CHistgtCysgtgVal55gcgAlagtgValggcGlyagtSerggcGly60tgcCysg3CAspgcgAlactg二eu192gagGlu65ctgLeutecSerctgLeueggArggcgAla70ctgLeugacAspatelieggtGlycccPro75gggGlyg3CAspgagGlugtgValgtgVal80240gtgValcccProgcgAlacacHis3CCThr85ttcPheateliegggGly3CCThrtggTrp90ctgLeugccAlagtgValtecSergetAla953CCThr288gggGlygcaAlaeggArgccgPro100gtgValgccAlagtcValgacAspccgPro1053CgThrccgProg3CAspgggGlyetcLeu110tecSeretcLeu336gacccggcgctggtggaggcggcgetcaccccteggaccagagccctg384AspProAlaUuValGluAlaAlaLeuThrProArgThrArgAlaLeu115120125atgMetccgPro130gtgcsicHisctg'LeuC3CHisgggGly135C3CHisccgProgccAlagacAspetc'Leu140gacAspccgProeta一LeuctgLeu432gcgAla145ateliegccAlagg3GlyeggArgC3CHis150ggcGlyctgLeugccAlagtgValgtcVal155gagGluAspgccAlagcgAlaC3gGin160480gccAlacacHisggcGlygccAlacgtArg165tacTyreggArgggcGlycgcArgaggArg170atelieggcGlytegSerggcGlycacHis175gtgVal528gtcValgcgAlattcPheageSer180ttcPhetacTyrcccProggcGly肌gLys185AsnetcLeuggcGlygccAla3tgMet190gggGlyg3CAsp576<formula>formulaseeoriginaldocumentpage238</formula>gggctggcgGlyLeuAla370acggagaaaThrGluLys385■gcgtacccgacgccggacggccagcgttttcctetagtg1152AlaTyrProThrProAspGlyGinArgPheProLeuVal375380cgatga1167Arg<210〉<211〉〈212〉<213〉29388PRT生二素链霉菌<400〉29MetThrlieProPheLeuAspAlaGlyAlaGlyTyrArgGluLeuArg151015AlaGlulieAspAlaAlaLeuGinArgValSerAlaSerGlyArgTyr202530LeuLeuAspAlaGluLeuAlaAlaPheGluGluGluPheAlaAlaTyr354045CysAspAsnAspHisCysValAlaValGlySerGlyCysAspAlaLeu505560GluLeuSerLeuArgAlaLeuAsplieGlyProGlyAspGluValVal65707580ValProAlaHisThrPhelieGlyThrTrpLeuAlaValSerAlaThr859095GlyAlaArgProValAlaVaJAspProThrProAspGlyLeuSerLeu100105110AspProAlaLeuValGluAlaAlaLeuThrProArgThrArgAlaLeu115120125MetProValHisLeuHisGlyHisProAlaAspLeuAspProLeuLeu130135140AlalieAlaGlyArgHisGlyLeuAlaValValGluAspAlaAlaGin145150155160AlaHisGlyAlaArgTyrArgGlyArgArglieGlySerGlyHisVal165170175ValAlaPheSerPheTyrProGlyLysAsnLeuGlyAlaMetGlyAsp180185190GlyGlyAlaValValThrGlyAspSerGlyValAlaGluArglieArg195200205LeuLeuArgAsnCysGlySerArgGluLysTyrArgHisGluValArg210215220SerThrHisSerArgLeuAspGluPheGinAlaAlaValLeuArgAla225230235240LysLeuProArgLeuAspAlaTrpAsnAlaArgArgAlaGlyThrAla245250255GluArgTyrGlyArgAlaLeuGlyProValProGinlieAlaValPro260265270ValThrAlaProTrpAlaAspProValTrpHisLeuTyrVallieArg275280285CysAlaGluArgAspGluLeuArgArgArgLeuGluArgAlaGlyVal290295300GinThrLeulieHisTy:rProValProProHisArgSerProAlaTyr305310315320AlaAspAspProAlaGlyAlaProAlaGlyThrHisProLeuSerGlu325330335ArgLeuAlaAlaGinSerLeuSerLeuProLeuGlyProHisLeuGly340345350GluAspGluAlaArgAlaValValAlaAlaValArgAlaAlaSerAla355360365GlyLeuAlaAlaTyrProThrProAspGlyGinArgPheProLeuVal370375380ThrGluLysArg385<210〉30<211〉909<212>腿<213〉生二素链霉菌<220><221〉CDS<222>(1)..(909)〈220〉<221>CDS<222>(10)..(909)<220><221>CDS<222>(28)..(909)<400>30atgaccgagMetThrGlu1gtcatgValMet5teaSergggcgtGlyArgcccggaatgProGlyMet10aaa匕ysgggGlyatelieatelie15etcLeu48gcaggcAlaGlyggcGlyggaGly20gggGly3CCThrcgcArgetaLeucgcArg25cccProttgLeu£LCCThrggcGlyacgThr30ctgLeutecSer96犯gc犯LysGinctgLeu35ctgLeucccProgtcValtacTyrgacAsp40卿LysccgProatgMetatelietacTyr45tacTyrccgProctgLeu144tecgtcSerVal50ctgLeu3tgMetctgLeuggcGlyggcGly55ateliecgcArg眺GluatelieetcLeu60gtcValgtcValtecSertecSer192a_cccagThrGin65C3CHisa/tcliegagGluctgLeu70ttcPhecagGineggArgctgLeuctgLeu75ggcGlygacAspggcGlytecSercgcArg80240etcggcetcgacateacctacgecgaacaggecgagcccgagggcata288LeuGlyLeuAsplieThrTyrAlaGluGinAlaGluProGluGlylie<image>imageseeoriginaldocumentpage242</image>ArglieAlaCyslieGluGlulieAlaLeuArgMetGlyPhelieAsp260265270gccgacAlaAspaccetccacThrLeuHis275eggetcArgLeuggcGly280cgcArgg犯ctgGluLeuggcGly3CCThr285tecggatac864SerGlyTyrggcgcgGlyAla290tacctgatgTyrLeuMetgaggtgGluVal295gccAlaaccThrcgtgcaArgAlaggcGly300accThrg肪Glutg3909<210〉31<211〉302<212>PRT<213>生二素链霉菌<400>31MetThrGluValMetSerGlyArgProGlyMetLysGlylielieLeu151015AlaGlyGlyGlyGlyThrArgLeuArgProLeuThrGlyThrLeuSer202530LysGinLeuLeuProValTyrAspLysProMetlieTyrTyrProLeu354045SerValLeuMetLeuGlyGlylieArgGlulieLeuValValSerSer505560ThrGinHislieGluLeuPheGinArgLeuLeuGlyAspGlySerArg65707580LeuGlyLeuA印lieThrTyrAlaGluGinAlaGluProGluGlylie859095AlaGinAlalieThrlieGlyThrAspHislieGlyAspSerProVal100105110AlaLeulieLeuGlyAspAsnliePheHisGlyProGlyPheSerAla115120125ValLeuGinGlySerlieArgHisLeuAspGlyCysValLeuPheGly130135140TyrProValSerAspProLysArgTyrGlyValGlyGlulieAspAsp145150155160GinGlyValLeuLeuSerLeuGluGluLysProAlaArgProArgSer165170175AsnLeuAlaValThrGlyLeuTyrLeuTyrAspAsnAspValValAsp180185190lieAlaLysAsnlieArgProSerAlaArgGlyGluLeuGlulieThr195200205AspValAsnArgThrTyrLeuGluGinLysArgAlaArgLeulieGlu210215220LeuGlyHisGlyPheAlaTrpLeuAspMetGlyThrHisAspSerLeu225230235240LeuGinGlyGlyGinTyrValGinLeulieGluGinArgGinGlyVal245250255ArglieAlaCyslieGluGlulieAlaLeuArgMetGlyPhelieAsp260265270AlaAspThrLeuHisArgLeuGlyArgGluLeuGlyThrSerGlyTyr275280285GlyAlaTyrLeuMetGluValAlaThrArgAlaGlyThrGlu290295300<210>32<211〉299<212>PRT〈213〉生二<400〉32素链霉菌ValMetSerGlyArgProGlyMetLysGlylielieLeuAlaGlyGly151015GlyGlyThrArgLeuArgProLeuThrGlyThrLeuSerLysGinLeu202530LeuProValTyrAspLysProMetlieTyrTyrProLeuSerValLeu354045MetLeuGlyGlylieArgGlulieLeuValValSerSerThrGinHis505560lieGluLeuPheGinArgLeuLeuGlyAspGlySerArgLeuGlyLeu65707580AsplieThrTyrAlaGluGinAlaGluProGluGlylieAlaGinAla859095lieThrlieGlyThrAspHislieGlyAspSerProValAlaLeulie100105110LeuGlyAspAsnliePheHisGlyProGlyPheSerAlaValLeuGin115120125GlySerlieArgHisLeuAspGlyCysValLeuPheGlyTyrProVal130135140SerAspProLysArgTyrGlyValGlyGlulieAspAspGinGlyVal145150155160LeuLeuSerLeuGluGluLysProAlaArgProArgSerAsnLeuAla165170175ValThrGlyLeuTyrLeuTyrAspAsnAspValValAsplieAlaLys180185190AsnlieArgProSerAlaArgGlyGluLeuGlulieThrAspValAsn195200205ArgThrTyrLeuGluGinLysArgAlaArgLeulieGluLeuGlyHis210215220GlyPheAlaTrpLeuAspMetGlyThrHisAspSerLeuLeuGinGly225230235240GlyGinTyrValGinLeulieGluGinArgGinGlyValArglieAla245250255CyslieGluGlulieAlaLeuArgMetGlyPhelieAspAlaAspThr260265270LeuHisArgLeuGlyArgGluLeuGlyThrSerGlyTyrGlyAlaTyr275280285LeuMetGluValAlaThrArgAlaGlyThrGlu290295<210>33<211〉293〈212〉PRT<213>生二<400〉33素链霉菌GlyMetLysGlylielieLeuAlaGlyGlyGlyGlyThrArgLeuArg151015ProLeuThrGlyThrLeuSerLysGinLeuLeuProValTyrAspLys202530ProMetlieTyrTyrProLeuSerValLeuMetLeuGlyGlylieArg354045GlulieLeuValValSerSerThrGinHislieGluLeuPheGinArg505560LeuLeuGlyAspGlySerArgLeuGlyLeuAsplieThrTyrAlaGlu65707580GinAlaGluProGluGlylieAlaGinAlalieThrlieGlyThrAsp859095HislieGlyAspSerProValAlaLeulieLeuGlyAspAsnliePhe100105110HisGlyProGlyPheSerAlaValLeuGinGlySerlieArgHisLeu115120125AspGlyCysValLeuPheGlyTyrProValSerAspProLysArgTyr130135140GlyValGlyGlulieAspAspGinGlyValLeuLeuSerLeuGluGlu145150155160LysProAlaArgProArgSerAsnLeuAlaValThrGlyLeuTyrLeu165170175TyrAspAsnAspValValAsplieAlaLysAsnlieArgProSerAla180185190ArgGlyGluLeuGlulieThrAspValAsnArgThrTyrLeuGluGin195200205LysArgAlaArgLeulieGluLeuGlyHisGlyPheAlaTrpLeuAsp210215220MetGlyThrHisAspSerLeuLeuGinGlyGlyGinTyrValGinLeu225230235240lieGluGinArgGinGlyValArglieAlaCyslieGluGlulieAla245250255LeuArgMetGlyPhelieAspAlaAspThrLeuHisArgLeuGlyArg260265270GluLeuGlyThrSerGlyTyrGlyAlaTyrLeuMetGluValAlaThr275280285ArgAlaGlyThrGlu290<210><211><212〉<213〉<220><221>〈222〉<400〉341038舰生二素链霉菌CDS(1)..(1038)34gtgcaggcaccgaatgagacgccgcgceggcccgcccgctecgccggc48ValGinAlaProAsnGluThrProArgArgProAlaArgSerAlaGly151015cgaeggccgccggcceggateetcgtcaccgggggcgccggcttcate96<formula>formulaseeoriginaldocumentpage248</formula>ValCysValThrArgCysSerAsnAsnTyrGlyProTyrGinTyrPro195200205gagaagateateccgctgttcaccageageetcetcgacggcgggacc672GluLyslielieProLeuPheThrSerSerLeuLeuAspGlyGlyThr210215220gtcccgetctacggggacggcggcaaceggcgcgactggctgcacgtg720ValProLeuTyrGlyAspGlyGlyAsnArgArgAspTrpLeuHisVal225230235240gacgaccactgceggggcategccctggtggcceggggcggceggccc768AspAspHisCysArgGlylieAlaLeuValAlaArgGlyGlyArgPro245250255ggcgaggtctac犯categgcggcggcaccgagctgageaacgtcgag816GlyGluValTyrAsnlieGlyGlyGlyThrGluLeuSerAsnValGlu260265270etcacggagcgtctgctgaaactgtgcggagccgactggteggcggtg864LeuThrGluArgLeuLeuLysLeuCysGlyAlaAspTrpSerAlaVal275280285eggegggtgcccgaccgca_agggccacgaceggcgctactecgtcgac912ArgArgValProAspArgLysGlyHisAspArgArgTyrSerValAsp290295300tacaccaagategcggacgagctgggttacgcgccgeggateaccate960TyrThrLyslieAlaAspGluLeuGlyTyrAlaProArglieThrlie305310315320gacgaa_gggctggageggaccgtgcactggtacegggagaaccgcgcg1008AspGluGlyLeuGluArgThrValHisTrpTyrArgGluAsnArgAla325330335tggtgggcgcccgcg,gggcg3tgs1038TrpTrpAlaProAlaLysArgGlyArg340345〈210>35<211〉345〈212〉PRT<213>生二素链霉菌<400>35ValGinAlaProAsnGluThrProArgArgProAlaArgSerAlaGly151015ArgArgProProAlaArglieLeuValThrGlyGlyAlaGlyPhelie202530GlySerArgPheValAsnAlaLeuLeuAspGlySerLeuProGluPhe354045GlyLysProGluValArgValLeuAspAlaLeuThrTyrAlaGlyAsn505560LeuAlaAsnLeuAlaProValGlyAspCysProArgLeuArgliePhe65707580ProGlyAsplieArgAspArgGlyAlaValThrGinAlaMetAlaGly85恥95ValAspLeuValValHisPheAlaAlaGluSerHisValAspArgSer100105110lieAspAspAlaAspAlaPheValArgThrAsnValLeuGlyThrGin115120125ValLeuLeuGinGluAlaLeuAlaValArgProGlyLeuPheValHis130135140ValSerThrAspGluValTyrGlySerlieGluGluGlySerTrpPro145150155160GluGluHisProLeuAsnProAsnSerProTyrAlaAlaSerLysAla165170175SerSerAspLeuLeuAlaLeuAlaHisHisArgThrHisGlyLeuPro180185190ValCysValThrArgCysSerAsnAsnTyrGlyProTyrGinTyrPro195200205GluLyslielieProLeuPheThrSerSerLeuLeuAspGlyGlyThr210215220ValProLeuTyrGlyAspGlyGlyAsnArgArgAspTrpLeuHisVal225230235240AspAspHisCysArgGlylieAlaLeuValAlaArgGlyGlyArgPro245250255GlyGluValTyrAsnlieGlyGlyGlyThrGluLeuSerAsnValGlu260265270LeuThrGluArgLeuLeuLysLeuCysGlyAlaAspTrpSerAlaVal275280285ArgArgValProAspArgLysGlyHisAspArgArgTyrSerValAsp290295300TyrThrLyslieAlaAspGluLeuGlyTyrAlaProArglieThrlie305310315320AspGluGlyLeuGluArgThrValHisTrpTyrArgGluAsnArgAla325330335TrpTrpAlaProAlaLysArgGlyArg340345<210〉<211〉<212〉<2i3〉<220><221><222><220〉<221〉<222><220><221〉<222〉36804DNA生二素链霉菌CDS(l)..(804)CDS(7)..(804)CDS(22)..(804)<400〉36atgacggtga_cgaccgcatecgtggacccgetcgacctgtggetccgc48MetThrValThrThrAlaSerValAspProLeuAspLeuTrpLeuArg151015eggtaccagccgtecgcgteacccgccgtceggctggtgtgcttcccg96ArgTyrGinProSerAlaSerProAlaValArgLeuValCysPhePro202530cacgcgggcggcteggcgagttegttcctgccgttcacceggcagctg144HisAlaGlyGlySerAlaSerSerPheLeuProPheThrArgGinLeu354045ccggaceggategaggtcgtggccgtccagta_ccccgggcgccaggac192ProAspArglieGluValValAlaValGinTyrProGlyArgGinAsp505560cgcaggageg犯ccgctggtcgacaccategagggactggccgagccc240ArgArgSerGluProLeuValAspThrlieGluGlyLeuAlaGluPro65707580ctggccggcctgctggaggcgcaggccggccccccggtggtgctgttc288LeuAlaGlyLeuLeuGluAlaGinAlaGlyProProValValLeuPhe859095gggcacageatgggcgcgctggtggcctacgaggtcgcccgcgcgetc336GlyHisSerMetGlyAlaLeuValAlaTyrGluValAlaArgAlaLeu100105110cageggeggggagcggetccggtgcgcctggtggtctecgggcgcegg384GinArgArgGlyAlaAlaProValArgLeuValValSerGlyArgArg115120125gcccccgccgtcgaceggccgatgaccgtgcacetctacgacgacgac432AlaProAlaValAspArgProMetThrValHisLeuTyrAspAspAsp130135140eggctggtcgagg犯etccgc犯getcgscggcsecgac3gccaggtg480ArgLeuValGluGluLeuArgLysLeuAspGlyThrAspSerGinVal145150155160ttcgccgstccggagctgetceggctggtgctgcccgtgatecgc朋c528PheAlaAspProGluLeuLeuArgLeuValLeuProVallieArgAsn165170175gacAsptacTyreggArggccAla180gtggCggCCt3CValAlaAlaTyrgccAla185C3CHiscgcArgccgProgggGlygcgAla190ccgProctgLeu576gactgccccetcaccgtgttcaccggcgccgacgaccccaccgtgaccAspCysProLeuThrValPheThrGlyAlaAspAspProThrValThr195200205624gcggccgaggcggcggcctggcacgaggcggcggcgtecgacgtcgagAlaAlaGluAlaAlaAlaTrpHisGluAlaAlaAlaSerAspValGlu210215220672acgcgcaccttccccggtggccacttcttcccgtaccageggaccgcgThrArgThrPheProGlyGlyHisPhePheProTyrGinArgThrAla225230235240720gaggtgtgcggggccctggtcgacacgetcgagccgctgctgteggccGluValCysGlyAlaLeuValAspThrLeuGluProLeuLeuSerAla245250255768gggGly3CgThrcgcArgggtGly260gtceggegggtcValArgArgValcgcArg265ccgProgggGlytg3804<210>37<211>267〈212〉PRT<213〉生二素链霉菌<400〉37MetThrValThrThrAlaSerValAspProLeuAspLeuTrpLeuArg151015ArgTyrGinProSerAlaSerProAlaValArgLeuValCysPhePro202530HisAlaGlyGlySerAlaSerSerPheLeuProPheThrArgGinLeu354045ProA印ArglieGluValValAlaValGinTyrProGlyArgGinAsp505560ArgArgSerGluProLeuValAspThrlieGluGlyLeuAlaGluPro65707580LeuAlaGlyLeuLeuGluAlaGinAlaGlyProProValValLeuPhe859095GlyHisSerMetGlyAlaLeuValAlaTyrGluValAlaArgAlaLeu100105110GinArgArgGlyAlaAlaProValArgLeuValValSerGlyArgArg115120125AlaProAlaValAspArgProMetThrValHisLeuTyrAspAspAsp130135140ArgLeuValGluGluLeuArgLysLeuAspGlyThrAspSerGinValM5150155160PheAlaAspProGluLeuLeuArgLeuValLeuProVallieArgAsn165170175AspTyrArgAlaValAlaAlaTyrAlaHisArgProGlyAlaProLeu180185190AspCysProLeuThrValPheThrGlyAlaAspAspProThrValThr195200205AlaAlaGluAlaAlaAlaTrpHisGluAlaAlaAlaSerAspValGlu210215220ThrArgThrPheProGlyGlyHisPhePheProTyrGinArgThrAla225230235240GluValCysGlyAlaLeuValAspThrLeuGluProLeuLeuSerAla245250255GlyThrArgGlyValArgArgValArgProGly260265<210>38<211〉265<212>PRT<213>生二素链霉菌<400〉38ValThrThrAlaSerValAspProLeuAspLeuTrpLeuArgArgTyr151015GinProSerAlaSerProAlaValArgLeuValCysPheProHisAla202530GlyGlySerAlaSerSerPheLeuProPheThrArgGinLeuProAsp354045ArglieGluValValAlaValGinTyrProGlyArgGinAspArgArg505560SerGluProLeuValAspThrlieGluGlyLeuAlaGluProLeuAla65707580GlyLeuLeuGluAlaGinAlaGlyProProValValLeuPheGlyHis859095SerMetGlyAlaLeuValAlaTyrGluValAlaArgAlaLeuGinArg100105110ArgGlyAlaAlaProValArgLeuValValSerGlyArgArgAlaPro115120125AlaValAspArgProMetThrValHisLeuTyrAspAspAspArgLeu130135140ValGluGluLeuArgLysLeuAspGlyThrAspSerGinValPheAla145150155160AspProGluLeuLeuArgLeuValLeuProVallieArgAsnAspTyr165170175ArgAlaValAlaAlaTyrAlaHisArgProGlyAlaProLeuAspCys180185190ProUuThrValPheThrGlyAlaAspAspProThrValThrAlaAla195200205GluAlaAlaAlaTrpHisGluAlaAlaAlaSerAspValGluThrArg210215220ThrPheProGlyGlyHisPhePheProTyrGinArgThrAlaGluVal225230235240CysGlyAlaLeuValAspThriLeuGluProLeuLeuSerAlaGlyThr245250255ArgGlyValArgArgValArgProGly260265<210>39<211>260<212>PRT<213〉生二<400〉39素链霉菌ValAspProLeuAspLeuTrpLeuArgArgTyrGinProSerAlaSer151015ProAlaValArgLeuValCysPheProHisAlaGlyGlySerAlaSer202530SerPheLeuProPheThrArgGinLeuProAspArglieGluValVal354045AlaValGinTyrProGlyArgGinAspArgArgSerGluProLeuVal505560AspThrlieGluGlyLeuAlaGluProLeuAlaGlyLeuLeuGluAla65707580GinAlaGlyProProValValLeuPheGlyHisSerMetGlyAlaLeu859095ValAlaTyrGluValAlaArgAlaLeuGinArgArgGlyAlaAlaPro100105110ValArgLeuValValSerGlyArgArgAlaProAlaValAspArgPro115120125MetThrValHisLeuTyrAspAspAspArgLeuValGluGluLeuArg130135140LysLeuAspGlyThrAspSerGinValPheAlaAspProGluLeuLeu145150155160ArgLeuValLeuProVallieArgAsnAspTyrArgAlaValAlaAla165170175TyrAlaHisArgProGlyAlaProLeuAspCysProLeuThrValPhe180185190ThrGlyAlaAspAspProThrValThrAlaAlaGluAlaAlaAlaTrp195200205HisGluAlaAlaAlaSerAspValGluThrArgThrPheProGlyGly210215220HisPhePheProTyrGinArgThrAlaGluValCysGlyAlaLeuVal225230235240AspThrLeuGluProLeuLeuSerAlaGlyThrArgGlyValArgArg245250255ValArgProGly260<210〉40<211〉1410<212>DNA<213>生二素链霉菌<220〉<221〉CDS<222>(1)..(1410)<220><221>CDS<222〉(46).(1410)<400>40gtgggcacggtcgagtacgccgtccaceggcgtaccgcggaaegggtg48ValGlyThrValGluTyrAlaValHisArgArgThrAlaGluArgVal151015agggtctecgccgacaccctggacageccggtcaccgcgctggcggag96ArgValSerAlaAspThrLeuAspSerProValThrAlaLeuAlaGlu202530gtgccccgctggctggaggaataccacegggcgcaccgcttccacgtc144ValProArgTrpLeuGluGluTyrHisArgAlaHisArgPheHisVal354045gagccgatecccttcgaceggetceggeggtggtecttcgagccgggc192GluProlieProPheAspArgLeuArgArgTrpSerPheGluProGly505560accggcgacctgeggcacgagacgggccgcttcttctecgtggagggg240ThrGlyAspLeuArgHisGluThrGlyArgPhePheSerValGluGly65707580ctgcgcaccageteggacgccgatccggtcgcccgtgtccagccgate288LeuArgThrSerSerAspAlaAspProValAlaArgValGinProlie859095ategtgcagcccgaggtggggctgetcggcatectggccegggagttc336lieValGinProGluValGlyLeuLeuGlylieLeuAlaArgGluPhe100105110gacggggtgctgcacttcctgatgcaggccaaacccgagcccggcaac384AspGlyValLeuHisPheLeuMetGinAlaLysProGluProGlyAsn115120125gtcaacgggctgcagateteccccacggtgcaggcca_cgcgca_gcaac432ValAsnGlyLeuGinlieSerProThrValGinAlaThrArgSerAsn130135140ttcgacgaggtgcaccacggceggtecaccccgttcetcga_ccacttc犯OPheAspGluValHisHisGlyArgSerThrProPheLeuAspHisPhe145150155160atecaccgccccggccgcegggtcctgategacageatecagtecgaa528lieHisArgProGlyArgArgValLeulieAspSerlieGinSerGlu165170175ca_gggcgactggttcctgcacaagcgcaaccgcaacatggtcgtcg兆576GinGlyAspTrpPheLeuHisLysArgAsnArgAsnMetValValGlu180185190atcgacaccgacategaggecgacgecgcgttccgctggctgaccetc624lieAspThrAsplieGluAlaAspAlaAlaPheArgTrpLeuThrLeu195200205gggcagatecgceggctgatgetccaggacgacetcgtcaacatggac672GlyGinlieArgArgLeuMetLeuGinAspAspLeuValAsnMetAsp210215220acccgcagtgtgctggectgtctgcccaccgcgcacggcacgcccgac720ThrArgSerValLeuAlaCysLeuProThrAlaHisGlyThrProAsp225230235240gacggtgacgactecttcccggcggcgctgcgccgctecetctacggg768AspGlyAspAspSerPheProAlaAlaLeuArgArgSerLeuTyrGly245250255gagaccgcgccgttgcacgatctgcacgecateaccagetgcetcacc816GluThrAlaProLeuHisAspLeuHisAlalieThrSerCysLeuThr260265270gacgtcegggcgctgegggtgctgcgccagcagagegtgccgetcgac864AspValArgAlaLeuArgValLeuArgGinGinSerValProLeuAsp275280285gacgeceggegggacggctgggageggaccgggagegcgateeggcat912AspAlaArgArgAspGlyTrpGluArgThrGlySerAlalieArgHis290295300cgcageggcaggcatttcgagateatggcggtggaggtgaccgcggag960ArgSerGlyArgHisPheGlulieMetAlaValGluValThrAlaGlu305310315320cgccgtgaagtggectegtggacccagccgttgctgcgcccgtgcteg1008ArgArgGluValAlaSerTrpThrGinProLeuLeuArgProCysSer325330335cagggactggcggecctgateacceggeggateaacggggtgctgcac1056GinGlyLeuAlaAlaLeulieThrArgArglieAsnGlyValLeuHis340345350gecctggtggcggcgeggteggaggtcggcacgetcaacgtcgecgag1104AlaLeuValAlaAlaArgSerGluValGlyThrLeuAsnValAlaGlu355360365ttcggaccgaccgtccagtgceggcccgacgaggcggacggccagteg1152PheGlyProThrValGinCysArgProAspGluAlaAspGlyGinSer370375380cccccgtacctggacegggtgctgacggccggagccgaccgcgtccgc1200ProProTyrLeuAspArgValLeuThrAlaGlyAlaAspArgValArg385390395400tacgacgtggtgcagteggaggagggcgggcgcttctaccacgcgcgc1248TyrAspValValGinSerGluGluGlyGlyArgPheTyrHisAlaArg40541041533Ccgctstctggtggtcgsggcggggccgg站etcgacacgggctgc1296AsnArgTyrLeuValValGluAlaGlyProGluLeuAspThrGlyCys420425430ccgcccggcttctgctgggetaccttcggccagctcaccgaactgctc1344ProProGlyPheCysTrpAlaThrPheGlyGinLeuThrGluLeuLeu435440445gcgcacggcaactatctcaacgtcgaactccgcaccctcatggcgtgc1392AlaHisGlyAsnTyrLeuAsnValGluLeuArgThrLeuMetAlaCys450455460gcacacgcctectactga1410AlaHisAlaSerTyr465470<210>41<21D469<212>PRT<213〉生二素链霉菌<400>41ValGlyThrValGluTyrAlaValHisArgArgThrAlaGluArgVal151015ArgValSerAlaAspThrLeuAspSerProValThrAlaLeuAlaGlu202530ValProArgTrpLeuGluGluTyrHisArgAlaHisArgPheHisVal354045GluProlieProPheAspArgLeuArgArgTrpSerPheGluProGly505560ThrGlyAspLeuArgHisGluThrGlyArgPhePheSerValGluGly65707580LeuArgThrSerSerAspAlaAspProValAlaArgValGinProlie859095lieValGinProGluValGlyLeuLeuGlylieLeuAlaArgGluPhe100105110AspGlyValLeuHisPheLeuMetGinAlaLysProGluProGlyAsn115120125ValAsnGlyLeuGinlieSerProThrValGinAlaThrArgSerAsn130135140PheAspGluValHisHisGlyArgSerThrProPheLeuAspHisPhe145150155160lieHisArgProGlyArgArgValLeulieAspSerlieGinSerGlu165170175GinGlyAspTrpPheLeuHisLysArgAsnArgAsnMetValValGlu180185190lieAspThrAsplieGluAlaAspAlaAlaPheArgTrpLeuThrLeu195200205GlyGinlieArgArgLeuMetLeuGinAspAspLeuValAsnMetAsp210215220ThrArgSerValLeuAlaCysLeuProThrAlaHisGlyThrProAsp225230235240AspGlyAspAspSerPheProAlaAlaLeuArgArgSerLeuTyrGly245250255GluThrAlaProLeuHisAspLeuHisAlalieThrSerCysLeuThr260265270AspValArgAlaLeuArgValLeuArgGinGinSerValProLeuAsp275280285AspAlaArgArgAspGlyTrpGluArgThrGlySerAlalieArgHis290295300ArgSerGlyArgHisPheGlulieMetAlaValGluValThrAlaGlu305310315320ArgArgGluValAlaSerTrpThrGinProLeuLeuArgProCysSer325330335GinGlyLeuAlaAlaLeulieThrArgArglieAsnGlyValLeuHis340345350AlaLeuValAlaAlaArgSerGluValGlyThrLeuAsnValAlaGlu355360365PheGlyProThrValGinCysArgProAspGluAlaAspGlyGinSer370375380ProProTyrLeuAspArgValLeuThrAlaGlyAlaAspArgValArg385390395400TyrAspValValGinSerGluGluGlyGlyArgPheTyrHisAlaArg405410415AsnArgTyrLeuValValGluAlaGlyProGluLeuAspThrGlyCys420425430ProProGlyPheCysTrpAlaThrPheGlyGinLeuThrGluLeuLeu435440445AlaHisGlyAsnTyrLeuAsnValGluLeuArgThrLeuMetAlaCys450455460AlaHisAlaSerTyr465<210>42<211>454<212>PRT<213>生二素链霉菌2<400>42ValArgValSerAlaAspThrLeuAspSerProValThrAlaLeuAla151015GluValProArgTrpLeuGluGluTyrHisArgAlaHisArgPheHis202530ValGluProlieProPheAspArgLeuArgArgTrpSerPheGluPro354045GlyThrGlyAspLeuArgHisGluThrGlyArgPhePheSerValGlu505560GlyLeuArgThrSerSerAspAlaAspProValAlaArgValGinPro65707580lielieValGinProGluValGlyLeuLeuGlylieLeuAlaArgGlu859095PheAspGlyValLeuHisPheLeuMetGinAlaLysProGluProGly100105110AsnValAsnGlyLeuGinlieSerProThrValGinAlaThrArgSer115120125AsnPheAspGluValHisHisGlyArgSerThrProPheLeuAspHis130135140PhelieHisArgProGlyArgArgValLeulieAspSerlieGinSer145150155160GluGinGlyAspTrpPheLeuHisiLysArgAsnArgAsnMetValVal165170175GlulieAspThrAsplieGluAlaAspAlaAlaPheArgTrpLeuThr180185190LeuGlyGinlieArgArgLeuMetLeuGinAspAspLeuValAsnMet195200205AspThrArgSerValLeuAlaCysLeuProThrAlaHisGlyThrPro210215220<formula>formulaseeoriginaldocumentpage264</formula>450<210>43<211>1248<212>DNA<213>生二素链霉菌<220><221>CDS<222〉(1).(1248)<400〉43atgccgggcgggacggacggcgactgcgcgcggacggcggcccggcgt48MetProGlyGlyThrAspGlyAspCysAlaArgThrAlaAlaArgArg151015cgaacgcacctgcccgagtecggacgagacagegcgacgcgagaggcg96ArgThrHisLeuProGluSerGlyArgAspSerAlaThrArgGluAla202530aaaatgateaatetcttccagccccagatgggggccgaggaactggcg144LysMetlieAsnLeuPheGinProGinMetGlyAlaGluGluLeuAla354045gcggtgtecgaggtcttcgacgaccaatggetcggtcacggaccccgg192AlaValSerGluValPheAspAspGinTrpLeuGlyHisGlyProArg505560accgcggcgttcgagtecgcgttcgccgagcacetcggggtcggcccc240ThrAlaAlaPheGluSerAlaPheAlaGluHisLeuGlyValGlyPro65707580gagcacgtcgtcttcetcaactegggcaccgccggcetcttcctggcc288GluHisValValPheLeuAsnSerGlyThrAlaGlyLeuPheLeuAla859095ctggagtegetcggcctgcggcccggcgacgaggtcgtgetccccteg336LeuGluSerLeuGlyLeuArgProGlyAspGluValValLeuProSer100105110cccagettcetcgccgcggcgaacgccgtacagetctegggagcgcgc384ProSerPheLeuAlaAlaAlaAsnAlaValGinLeuSerGlyAlaArg115120125ccggtgttctgcgacaccgacccgeggacgctgaaccccgccctggag432ProValPheCysAspThrAspProArgThrLeuAsnProAlaLeuGlu130135140cacategaggcggccgtcaccccgcgcaccagggccgtcategcgetc480HislieGluAlaAlaValThrProArgThrArgAlaVallieAlaLeu145150155160cactacggcggccaccccggcgacategtgcgcategccgagcgctgc528HisTyrGlyGlyHisProGlyAsplieValArglieAlaGluArgCys165170175egggageggggcateaccctgategaggacgccgcgtgctecgtggcc576ArgGluArgGlylieThrLeulieGluAspAlaAlaCysSerValAla180185190teccgcgtcgacggccgaccggtcggcaccttcggcgacetcgcca_tg624SerArgValAspGlyArgProValGlyThrPheGlyAspLeuAlaMet195200205tggagettcgacgccatgaaggtcctggtcaccggcgacggagggatg672TrpSerPheAspAlaMetLysValLeuValThrGlyAspGlyGlyMet210215220atetacgtcaaggaccccggggcggccgcceggateeggcgcetcgcc720lieTyrValLysAspProGlyAlaAlaAlaArglieArgArgLeuAla225230235240taccacggcetcacgeggtecageggcctgggatacgccagggtcteg768TyrHisGlyLeuThrArgSerSerGlyLeuGlyTyrAlaArgValSer245250255gcgcgctggtgggagatggacgtccccgaaccgggccgccgcgtcate816AlaArgTrpTrpGluMetAspValProGluProGlyArgArgVallie260265270gggaacgacetcaccgcggccateggcgcggtccagttgcgceggctt864GlyAsnAspLeuThrAlaAlalieGlyAlaValGinLeuArgArgLeu275280285cccggcttcgtggcccgccgcagggagategtcgccctgtacgacage912ProGlyPheValAlaArgArgArgGlulieValAlaLeuTyrAspSer290295300ga_a_ctgGluLeu305ageSertcgctgSerLeuGlu310ggcGlygtgValctgLeuThrccgPro315cccgcgcca_cccProAlaProProgcgAla320960gggcacgagtecacgcactacttctactggatecagctggcccccggc1008GlyHisGluSerThrHisTyrPheTyrTrplieGinLeuAlaProGly325330335gtceggValArggacAspegggtgArgVal340gcaAlacgcArggacAspctgLeu345etcLeu3CCThrgacggca_tcAspGlylie350tacTyr8CCThr1056accttcThrPhecgc355tacgcaTyrAlacctProctgLeucax:His360卿LysgtgValcccProgcctacggcAlaTyrGly365C3CHisThr1104ggaggcGlyGly370GluctgcccLeuProggcGlygtgVal375GlueggArggcgAlatecSergaaeggaccGluArgThr380ctgLeutgcCys1152ctgcccLeuPro385ctgLeuC3CcccHisProggcGly390ctgLeutcgSergacAspgccAlaAsp395gtccgcaccValArgThrgtcValgtgVal4001200tectecSerSerctgLeucgcagaArgArg405gccAlactgLeuageSergccAlagcgAla410gatAspccggcccccProAlaProgccAla415tga1248<210〉44<211>415<212〉PRT<213>生二素链霉菌<400〉44MetProGlyGlyThrAspGlyAspCysAlaArgThrAlaAlaArgArg151015ArgThrHisLeuProGluSerGlyArgAspSerAlaThrArgGluAla202530LysMetlieAsnLeuPheGinProGinMetGlyAlaGluGluLeuAla354045AlaValSerGluValPheAspAspGinTrpLeuGlyHisGlyProArg505560ThrAlaAlaPheGluSerAlaPheAlaGluHisLeuGlyValGlyPro65707580GluHisValValPheLeuAsnSerGlyThrAlaGlyLeuPheLeuAla859095LeuGluSerLeuGlyLeuArgProGlyAspGluValValLeuProSer100105110ProSerPheLeuAlaAlaAlaAsnAlaValGinLeuSerGlyAlaArg115120125ProValPheCysAspThrAspProArgThrLeuAsnProAlaLeuGlu130135140HislieGluAlaAlaValThrProArgThrArgAlaVallieAlaLeu145150155160HisTyrGlyGlyHisProGlyAsplieValArglieAlaGluArgCys165170175ArgGluArgGlylieThrLeulieGluAspAlaAlaCysSerValAla180185190SerArgValAspGlyArgProValGlyThrPheGlyAspILeuAlaMet195200205TrpSerPheAspAlaMetLysValLeuValThrGlyAspGlyGlyMet210215220lieTyrValLysAspProGlyAlaAlaAlaArglieArgArgLeuAla225230235240TyrHisGlyLeuThrArgSerSerGlyLeuGlyTyrAlaArgValSer245250255AlaArgTrpTrpGluMetAspValProGluProGlyArgArgVallie260265270GlyAsnAspLeuThrAlaAlalieGlyAlaValGinLeuArgArgLeu275280285ProGlyPheValAlaArgArgArgGlulieValAlaLeuTyrAspSer290295300GluLeuSerSerLeuGluGlyValLeuThrProProAlaProProAla305310315320GlyHisGluSerThrHisTyrPheTyrTrplieGinLeuAlaProGly325330335ValArgAspArgValAlaArgAspLeuLeuThrAspGlylieTyrThr340345350ThrPheArgTyrAlaProLeuHisLysValProAlaTyrGlyHisThr355360365GlyGlyGluLeuProGlyValGluArgAlaSerGluArgThrLeuCys370375380LeuProLeuHisProGlyLeuSerAspAlaAspValArgThrValVal385390395400SerSerLeuArgArgAlaLeuSerAlaAlaAspProAlaProAla405410415<210>45<211>720<212>賺<213>生二素链霉菌<220〉<221>CDS<222>(1)..(720)<400>45atgtacgagaacgacagtgccgccgaggtctacgacctgetctaccag48MetTyrGluAsnAspSerAlaAlaGluValTyrAspLeuLeuTyrGin151015<formula>formulaseeoriginaldocumentpage270</formula>ateeggcaccgcagegaggtggactacetcacgctgttctegcgtgcg624lieArgHisArgSerGluValAspTyrLeuThrLeuPheSerArgAla195200205gagtacgaggccgcgtaccgcaaggccggcctggacgtcgagtacgtc672GluTyrGluAlaAlaTyrArgLysAlaGlyLeuAspValGluTyrVal210215220gtgacgggcgagggcteaccgggcttcttcetcggcacgcgtcgctga720ValThrGlyGluGlySerProGlyPhePheLeuGlyThrArgArg225230235240<210〉46<211>239<212〉PRT〈213〉生二素链霉菌<400〉46MetTyrGluAsnAspSerAlaAlaGluValTyrAspLeuLeuTyrGin151015AspArgLysAspTyrAlaGlyGluAlaAlaArgValThrAspLeulie202530ArgGluArgThrProAspAlaAlaSerLeuLeuAsplieAlaCysGly354045ThrGlyThrHisLeuGluAlaPheAlaLysLeuTyrAspArgValSer505560GlyLeuGluLeuSerGluTrpMetAlaAlaArgAlaGluGluArgLeu65707580ProGlyValThrLeuHisArgGlyAspMetArgAlaPheAspLeuGly859095GluThrPheAspAlaValValCysMetPheSerSerlieGlyTyrLeu100105110GluThrThrAlaAspLeuGluAspAlaValAlaAlaMetAlaArgHis115120125LeuThrAlaAspGlyValLeuAlaValGluProTrpTyrPheProAsp130135140ThrPheLeuAspGlyHisValSerThrHisAlaLeuArgThrAlaPro145150155160GlyAspGinGlyValAlaArgValSerHisSerThrArgGluGlyGly165170175ArgThrArgMetGlulieHisTyrLeulieAlaHisThrAlaGluGly180185190lieArgHisArgSerGluValAspTyrLeuThrLeuPheSerArgAla195200205GluTyrGluAlaAlaTyrArgLysAlaGlyLeuA印ValGluTyrVal210215220ValThrGlyGluGlySerProGlyPhePheLeuGlyThrArgArg225230235<210>47<211>1968<212>DNA<213>生二素链霉菌<220><221>CDS<222>(1)..(1968)<400>47atgagtgacctgggttctggtgaagaagggtecgaagaagacgagteg48MetSerAspLeuGlySerGlyGluGluGlySerGluGluAspGluSer151015gacgacgcaetcgccttcetcgagttcategcceggteggcaccaegg96AspAspAlaLeuAlaPheGluPhelieAlaArgSerAlaProArg202530agegaatacgaceggetcatggcccgcgccgaacgctegggcgccgac144SerGluTyrAspArgLeuMetAlaArgAlaGluArgSerGlyAlaAsp354045gaggaceggatgcgccgactggagcgcttcaaceggetcgccetcacc192GluAspArgMetArgArgLeuGluArgPheAsnArgLeuAlaLeuThr505560gcgcagtegatgategagtaccgccgcgacegggaggcggagetcgcg240AlaGinSerMetlieGluTyrArgArgAspArgGluAlaGluLeuAla65707580gccctggtcgacgccgcgcacgagttcgtcgccgcceggeggggcaag288AlaLeuValAspAlaAlaHisGluPheValAlaAlaArgArgGlylys859095gacctgctggagtecategcccgcagagcaeggctgctgctgaagctg336AspLeuLeuGluSerlieAlaArgArgAlaArgLeuLeuLeuLysLeu100105110gacgtctectacgtcggcctgcacgsgg兆gaceggcccggca_cggtg384AspValSerTyrValGlyLeuHisGluGluAspArgProGlyThrVal115120125gtgctgagegccgacggcaacgcggtc犯ggtcgccgagagetacegg432ValLeuSerAlaAspGlyAsnAlaValLysValAlaGluSerTyrArg130135140ctgccggccgacggcggactgggcgccatggtgcgcetcctgccgcget480LeuProAlaAspGlyGlyLeuGlyAlaMetValArgThrCysArgAla145150155160cccttctggaccccggactacetcggggacaacagettcacgcacgtc528ProPheTrpThrProAspTyrLeuGlyAspAsnSerPheThrHisVal165170175gaggccgtcgacgacategtccgcgccgaaggcctgcgcgcggtcctg576GluAlaValAspAsplieValArgAlaGluGlyLeuArgAlaValUu180185190gccgtcccgctgtgcgccgggggcg犯ccgatgggggtcetcteicgtc624AlaValProLeuCysAlaGlyGlyGluProMetGlyValLeuTyrVal195200205gccgaccgtcaggtgeggcatctgacccccaacgaggtcaccctgctg672AlaAspArgGinValArgHisLeuThrProAsnGluValThrLeuLeu210215220tgctcgetcgccgatctggccgcggtggcgategagcgcaaceggctg720CysSerLeuAlaAspLeuAlaAlaValAlalieGluArgAsnArgLeu225230235240gtcgaggagetccacgacaccategggcaactgcgccaggacateggc768ValGluGluLeuHisAspThrlieGlyGinLeuArgGinAsplieGly245250255gaggcccgca_ccgccetcgcgcgcacccgcaggtecgccgacetccag816GluAlaArgThrAlaLeuAlaArgThrArgArgSerAlaAspLeuGin260265270tcgcacctggtcacgcaggtgatggacaggcgcggcgccgactcgtta864SerHisLeuValThrGinValMetAspArgArgGlyAlaAspSerLeu275280285etcgcgacggccgccgaggcgetcggcggcggagccggcctgtgcage912LeuAlaThrAlaMaGluAlaLeuGlyGlyGlyAlaGlyLeuCysSer290295300ccgetcgggcgcccgetcgccgagtacgggaccctgcgccccgtcgcc960ProLeuGlyArgProLeuAlaGluTyrGlyThrLeu八rgProValAla305310315320cccacggaactgcgcgcggcgtgccgcegggccgccgagaccggcegg1008ProThrGluLeuArgAlaAlaCysArgArgAlaAlaGluThrGlyArg325330335cccacctecgtggccccgggggtctggacggtgcccctgcttcccggg1056ProThrSerValAlaProGlyValTrpThrValProLeuLeuProGly340345350ggc犯cgccggcttcctgctgaccgacetcggtccggacgcgg£tCC£LC1104GlyAsnAlaGlyPheLeuLeuThrAspLeuGlyProAspAlaAspHis355360365accgccgtccccctgetcccgatggtcgcccgcaccetcgcgctgcac1152ThrAlaValProLeuLeuProMetValAlaArgThrleuAlaLeuHis370375380ctgcgcgtccagcacgacgacteccccaaggcgcaga_gcca_cca_ggag1200LeuArgValGinHisAspAspSerProLysAlaGinSerHisGinGlu385390395400ttcttcgacgacctgateggggcgccccgcteacccacgetcetcagg1248PhePheAspAspLeulieGlyAlaProArgSerProThrLeuLeuArg405410415g犯cgcgccctgatgttctecetcagettccgccgcccgcacgtggtg1296GluArgAlaLeuMetPheSerLeuSerPheArgArgProHisValVal420425430ctggtggcggacggaccccgcgggacctegccgeggctggaggcctec1344LeuValAlaAspGlyProArgGlyThrSerProArgLeuGluAlaSer435440445ggcgccgactacgcgaaggagetcggcgggctgtgcagegtgegggac1392GlyAlaAspTyrAlaLysGluLeuGlyGlyLeuCysSerValArgAsp450455460ggcgccgtcgtcctgctgctgcccggcgacgaccccgtcgccgtggcg1440GlyAlaValValLeuLeuUuProGlyAspAspProValAlaValAla465470475480cagaccgccgccccggagctgaccgaccgcgccgggcaccccgtcacc1488GinThrAlaAlaProGluLeuThrAspArgAlaGlyHisProValThr485490495gtgggggtcgcgggccccgcctegaccgtcgacggcategccgacgcg1536ValGlyValAlaGlyProAlaSerThrValAspGlylieAlaAspAla500505510caccgtgaggccgcg犯gtgtctggagaccetccgcgcgetcggcggc1584HisArgGluAlaAlaLysCysLeuGluThrLeuArgAlaLeuGlyGly515520525gacggcggcaccgcgtgcgcctecgacctgggtttcetcggcatgetc1632AspGlyGlyThrAlaCysAlaSerAspLeuGlyPheLeuGlyMetLeu530535540etcgccgaggag犯cgacgtccccggttacateaggacgacgateggc1680LeuAlaGluGluAsnAspValProGlyTyrlieArgThrThrlieGly545550555560cccgtggtcgactacgacacccaccgcttcacggatctggttcccact1728ProValValAspTyrAspThrHisArgPheThrAspLeuValProThr565570575ctgagggtgtacctggagtegggcaggagecccacgcgtgccgcagag1776LeuArgValTyrLeuGluSerGlyArgSerProThrArgAlaAlaGlu580585590acactgcgcgtgcacccgaacaccgtcteaeggeggctggagcgcate1824ThrLeuArgValHisProAsnThrValSerArgArgLeuGluArglie595600605ggcgtactgctgggagaggactggcagteaccggagegggtgctggac1872GlyValLeuLeuGlyGluAspTrpGinSerProGluArgValLeuAsp610615620atacaactggccctgeggetctatcaggtgcgcteggcgetctecteg1920lieGinLeuAlaLeuArgLeuTyrGinValArgSerAlaLeuSerSer625630635640caaccggcgtecgagaccegggccgtgetcggategctgcgcgagtga1968GinProAlaSerGluThrArgAlaValLeuGlySerLeuArgGlu645650655<210〉48<211〉655<212>PRT<213>生二素链霉菌<400>48MetSerAspLeuGlySerGlyGluGluGlySerGluGluAspGluSer151015AspAspAlaLeuAlaPheLeuGluPhelieAlaArgSerAlaProArg202530SerGluTyrAspArgLeuMetAlaArgAlaGluArgSerGlyAlaAsp354045GluAspArgMetArgArgLeuGluArgPheAsnArgLeuAlaLeuThr505560AlaGinSerMetlieGluTyrArgArgAspArgGluAlaGluLeuAla65707580AlaLeuValAspAlaAlaHisGluPheValAlaAlaArgArgGlyLys859095AspLeuLeuGluSerlieAlaArgArgAlaArgLeuLeuLeuLysLeu100105110AspValSerTyrValGlyLeuHisGluGluAspArgProGlyThrVal115120125ValLeuSerAlaAspGlyAsnAlaValLysValAlaGluSerTyrArg130135140LeuProAlaAspGlyGlyLeuGlyAlaMetValArgThrCysArgAla145150155160ProPheTrpThrProAspTyrLeuGlyAspAsnSerPheThrHisVal165170175GluAlaValAspAsplieValArgAlaGluGlyLeuArgAlaVal180185190AlaValProLeuCysAlaGlyGlyGluProMetGlyValLeuTyrVal195200205AlaAspArgGinValArgHisLeuThrProAsnGluValThrLeuLeu210215220CysSerLeuAlaAspLeuAlaAlaValAlalieGluArgAsnArg!Leu225230235240ValGluGluLeuHisAspThrlieGlyGinLeuArgGinAsplieGly245250255GluAlaArgThrAlaLeuAlaArgThrArgArgSerAlaAspLeuGin260265270SerHisLeuValThrGinValMetAspArgArgGlyAlaAspSerLeu275280285LeuAlaThrAlaAlaGluAlaLeuGlyGlyGlyAlaGlyLeuCysSer290295300ProLeuGlyArgProLeuAlaGluTyrGlyThrLeuArgProValAla305310315320ProThrGluLeuArgAlaAlaCysArgArgAlaAlaGluThrGlyArg325330335ProThrSerValAlaProGlyValTrpThrValProLeuLeuProGly340345350GlyAsnAlaGlyPheLeuLeuThrAspLeuGlyProAspAlaAspHis355360365ThrAlaValProLeuLeuProMetValAlaArgThrLeuAlaLeuHis370375380LeuArgValGinHisAspAspSerProLysAlaGinSerHisGinGlu385390395400PhePheAspAspLeulieGlyAlaProArgSerProThrLeuLeuArg405410415GluArgAlaLeuMetPheSerLeuSerPheArgArgProHisValVal420425430LeuValAlaAspGlyProArgGlyThrSerProArgLeuGluAlaSer435440445GlyAlaAspTyrAlaLysGluLeuGlyGlyLeuCysSerValArgAsp450455460GlyAlaValValLeuLeuLeuProGlyAspAspProValAlaValAla465470475480GinThrAlaAlaProGluLeuThrAspArgAlaGlyHisProValThr485490495ValGlyValAlaGlyProAlaSerThrValA印GlylieAlaAspAla500505510HisArgGluAlaAlaLysCysLeuGluThrLeuArgAlaLeuGlyGly515520525AspGlyGlyThrAlaCysAlaSerAspLeuGlyPheLeuGlyMetLeu530535540LeuAlaGluGluAsnAspValProGlyTyrlieArgThrThrlieGly545550555560ProValValAspTyrAspThrHisArgPheThrAspLeuValProThr565570575LeuArgValTyrLeuGluSerGlyArgSerProThrArgAlaAlaGlu580585590ThrLeuArgValHisProAsnThrValSerArgArgLeuGluArglie595600605GlyValLeu!LeuGlyGluAspTrpGinSerProGluArgValLeuAsp610615620lieGinLeuAlaLeuArgLeuTyrGinValArgSerAlaLeuSerSer625630635640GinProAlaSerGluThrArgAlaValLeuGlySerLeuArgGlu645650655<210〉49<211>1749<212>DNA<213>生二素链霉菌<220〉<221〉CDS<222〉(1)..(1749)<220〉〈221〉CDS<222〉(76)..(1749)<220〉<221〉CDS<222>(97)..(1749)<400>49atgtecgcagtggtggcgteccttctgctttecgttctttctgcgage48MetSerAlaValValAlaSerLeuLeuLeuSerValLeuSerAlaSer151015gcgetcacgcatccaetcateetcategtggaaacaggagacttacgc96AlaLeuThrHisProLeulieLeulieValGluThrGlyAspLeuArg202530gtgtegattgcgcaatacgccetacacgacateacgaagcgctacceic144ValSerlieAlaGinTyrAlaLeuHisAsplieThrLysArgTyrHis354045gactgtgtcgtgetcgacegggtcggtttcageateaagccgggcgag192A印CysValValLeuAspArgValGlyPheSerlieLysProGlyGlu505560aaggtcggcgtgateggcgacaacggttecggcaagtecacgctgetc240LysValGlyVallieGlyAspAsnGlySerGlyLysSerThrLeuLeu65707580aagateetcgccggccgcgtggagcccgacaacggcgcgetcaccgtg288LyslieLeuAlaGlyArgValGluProAspAsnGlyAlaLeuThrVal859095gtcgetcccggcggcgtcggctacctggcgcagacactggaactgccc336ValAlaProGlyGlyValGlyTyrLeuAlaGinThrLeuGluLeuPro100105110etcgacgccaccgtccaggacgccgtcgacctggccctgtecgacctg384LeuAspAlaThrValGinAspAlaValAspLeuAlaLeuSerAspLeu115120125cgcgagetcgaagcggcgatgcgcgaggccgaggcggagctgggcgag432ArgGluLeuGluAlaAlaMetArgGluAlaGluAlaGluLeuGlyGlu130135140agegacgagaacggctecgagcgcgagctgtecgccggcetccagcgc480SerAspGluAsnGlySerGluArgGluLeuSerAlaGlyLeuGinArg145150155160tacgccgetctggtcgagcagtaccaggcgcgtggcggctacgaggcc528TyrAlaAlaLeuValGluGinTyrGinAlaArgGlyGlyTyrGluAla165170175gacgtgcgcgtggaggtcgcgctgcacggcetcggactgccgagectg576AspValArgValGluValAlaLeuHisGlyLeuGlyLeuProSerLeu180185190gaccgcgaccgcaagetcgga_accetctecggtggcg犯cgcteccgc624AspArgAspArgLysLeuGlyThrLeuSerGlyGlyGluArgSerArg195200205etcgcgetcgccgcgaccetcgcctegtegccggagctgctgetcctg672LeuAlaLeuAlaAlaThrLeuAlaSerSerProGluLeuLeuLeuLeu210215220gacgaaccgaccaacgacetcgacgacegggcgatggaa_tggctggag720AspGluProThrAsnAspLeuAspAspArgAlaMetGluTrpLeuGlu225230235240gaccacctggccggccaccgcggcacggtga_tcgcggtcacccacgac768AspHisLeuAlaGlyHisArgGlyThrVallieAlaValThrHisAsp245250255egggtcttcetcgaceggetcaccaccacgatectggaggtcgactec816ArgValPheLeuAspArgLeuThrThrThrlieLeuGluValAspSer260265270ggcagegtcacccgctacggcaacggctacgagggctacctgacggcc864GlySerValThrArgTyrGlyAsnGlyTyrGluGlyTyrLeuThrAla275280285卿gccgtgg犯cgcgageggeggctgegggagt已cgaggagtggcgt912LysAlaValGluArgGluArgArgLeuArgGluTyrGluGluTrpArg290295300gccgaaetcgaccgcaaccgcgggctgateacctecaacgtggcgegg960AlaGluLeuAspArgAsnArgGlyLeulieThrSerAsnValAlaArg305310315320atggacggcateccgcgcaagatgtecetctecgtgttcggccacggc1008MetAspGlylieProArgLysMetSerLeuSerValPheGlyHisGly325330335gcctaccgcaggcgagggcgcgaccelcggcgcgatggtgeggatecgc1056AlaTyrArgArgArgGlyArgAspHisGlyAlaMetValArglieArg340345350aacgcgaagcaacgcgtggcgcagctgacegaga_acccggtccacget1104AsnAlaLysGinArgValAlaGinLeuThrGluAsnProValHisAla355360365cccProgccAla370g3CAspccgProttgLeutecSerUcPhe375gccAlagccAlacgcArgateliegacAsp380accThrgcgAlaggcGlyccgPro1152g3gGlu385gcgAlagagGlugagGlugcgAlagtgVal390gccAlag犯GluetcLeu3CCThrg3CAsp395gtgValcgcArggtcValgcgAlaggtGly4001200eggArgetcLeugccAlagtgValgacAsp405tecSerctgLeuacgThratelieeggArg410cccProggcGlyg朋GlueggArgctgLeu415etcLeu1248gtcValThrggtGlycccPro420肪cAsnggtGlygcgAlaggcGly卿Lys425tecSer3CCThrttgLeuttgLeueggArg430gtgValctgLeu1296tecSergggGlyg朋Glu435ctgLeugagGluccgProgacAspggcGly440ggcGlytegSergtgValcgcArggtcVal445ggcGlytgcCyseggArg1344gtcValggtGly450catHisctgLeueggArgC3gGingacAsp455gagGlu3CgThrcccProtggTrpgcgAla460cccProgg3GlyctgLeuaccThr1392gtgVal465ctgLeueggArggccAlattcPhegccAla470cagGinggcGlyeggArggagGluggcGly475tacTyrctgLeugagGlugacAspC3CHis4801440gcgAlagagGluctgLeuctgLeu485tegSeretcLeuggcGlyctgLeuUcPhe490ageSerccgProtecSergacAspctgLeu495eggArg1488cgaArgcgcArggtgVal卿Lys500gatAspctgLeutecSertacTyrgggGly505cagGincgcArgcgcArgeggArgatelie510g兆Gluatelie1536gccAlaeggArgctgLeu515gtgValageSergacAspccgProatgMet520gacAspctgLeuctgLeuctgLeuctgLeu525gacAspGlucccPro1584a_ccThr肌cAsn530ca_cHisetcLeu3CCThrccgProgtgVal535ctgLeugtgValgagGluGluttgLeu540g兆GlucagGingcaAlaetcLeu1632gcggactaccgcggcgccgtcgtggtcgtcacccacgaccgtAlaAspTyrArgGlyAlaValValValValThrHisAspArg545550555eggatg1680ArgMet560eggtecArgSereggArgttcPheaccThr565ggcGlygccAlaeggctgArgLeu3CCThr570atgggagacgggMetGlyAspGlycgcateArglie5751728gccgagAlaGluttcPhe3gCSer580gccAlaggcGlytg31749<210>50<211>582<212>PRT<213>生二素链霉菌<400>50MetSerAlaValValAlaSerLeuLeuLeuSerValLeuSerAlaSer151015AlaLeuThrHisProLeulieLeulieValGluThrGlyAspLeuArg202530ValSerlieAlaGinTyrAlaLeuHisAsplieThrLysArgTyrHis354045AspCysValValLeuAspArgValGlyPheSerlieLysProGlyGlu505560LysValGlyVallieGlyAspAsnGlySerGlyLysSerThrLeuLeu65707580LyslieLeuAlaGlyArgValGluProAspAsnGlyAlaLeuThrVal859095ValAlaProGlyGlyValGlyTyrLeuAlaGinThrLeuGluLeuPro100105110LeuAspAlaThrValGinAspAlaValAspLeuAlaLeuSerAspLeu115120125ArgGluLeuGluAlaAlaMetArgGluAlaGluAlaGluLeuGlyGlu130135140SerAspGluAsnGlySerGluArgGluLeuSerAlaGlyLeuGinArg145150155160TyrAlaAlaLeuValGluGinTyrGinAlaArgGlyGlyTyrGluAla165170175AspValArgValGluVaJAlaLeuHisGlyLeuGlyLeuProSerLeu180185190AspArgAspArgLysLeuGlyThrLeuSerGlyGlyGluArgSerArg195200205LeuAlaLeuAlaAlaThrLeuAlaSerSerProGluLeuLeuLeuLeu210215220AspGluProThrAsnAspLeuAspAspArgAlaMetGluTrpLeuGlu225230235240AspHisLeuAlaGlyHisArgGlyThrVallieAlaValThrHisAsp245250255ArgValPheLeuAspArgLeuThrThrThrlieLeuGluValAspSer260265270GlySerValThrArgTyrGlyAsnGlyTyrGluGlyTyrLeuThrAla275280285LysAlaValGluArgGluArgArgLeuArgGluTyrGluGluTrpArg290295300AlaGluLeuAspArgAsnArgGlyLeulieThrSerAsnValAlaArg305310315320MetAspGlylieProArgLysMetSerLeuSerValPheGlyHisGly325330335AlaTyrArgArgArgGlyArgAspHisGlyAlaMetValArglieArg340345350AsnAlaLysGinArgValAlaGinLeuThrGluAsnProValHisAla355360365ProAlaAspProLeuSerPheAlaAlaArglieAspThrAlaGlyPro370375380GluAlaGluGluAlaValAlaGluLeuThrAspValArgValAlaGly385390395400ArgLeuAlaValAspSerLeuThrlieArgProGlyGluArgLeuLeu405410415ValThrGlyProAsnGlyAlaGlyLysSerThrLeuLeuArgValLeu420425430SerGlyGluLeuGluProAspGlyGlySerValArgValGlyCysArg435440445ValGlyHisLeuArgGinAspGluThrProTrpAlaProGlyLeuThr450455460ValLeuArgAlaPheAlaGinGlyArgGluGlyTyrLeuGluAspHis465470475480AlaGluLysLeuLeuSerLeuGlyLeuPheSerProSerAspLeuArg485490495ArgArgValLysAspLeuSerTyrGlyGinArgArgArg工leGlulie500505510AlaArgLeuValSerAspProMetAspLeuLeuLeuLeuAspGluPro515520525ThrAsnHisLeuThrProValLeuValGluGluLeuGluGinAlaLeu530535540AlaAspTyrArgGlyAlaValValValValThrHisAspArgArgMet545550555560ArgSerArgPheThrGlyAlaArgLeuThrMetGlyAspGlyArglie565570575AlaGluPheSerAlaGly580<210>51<211>557<212>PRT<213>生二<400>51素链霉菌ValGluThrGlyAspLeuArgValSerlieAlaGinTyrAlaLeuHis151015AsplieThrLysArgTyrHisAspCysValValLeuAspArgValGly202530PheSerlieLysProGlyGluLysValGlyVallieGlyAspAsnGly354045SerGlyLysSerThrLeuLeuLyslieLeuAlaGlyArgValGluPro505560AspAsnGlyAlaLeuThrValValAlaProGlyGlyValGlyTyrLeu65707580AlaGinThrLeuGluLeuProLeuAspAlaThrValGinAspAlaVal859095AspLeuAlaLeuSerAspLeuArgGluLeuGluAlaAlaMetArgGlu100105110AlaGluAlaGluLeuGlyGluSerAspGluAsnGlySerGluArgGlu115120125LeuSerAlaGlyLeuGinArgTyrAlaAlaLeuValGluGinTyrGin130135140AlaArgGlyGlyTyrGluAlaAspValArgValGluValAlaLeuHis145150155160GlyLeuGlyLeuProSerLeuAspArgAspArgLysLeuGlyThrLeu165170175SerGlyGlyGluArgSerArgLeuAlaLeuAlaAlaThrLeuAlaSer180185190SerProGluLeuLeuLeuLeuAspGluProThrAsnAspLeuAspAsp195200205<formula>formulaseeoriginaldocumentpage287</formula>435440445GluGlyTyrLeuGluAspHisAlaGluLysLeuLeuSerLeuGlyLeu450455460PheSerProSerAspLeuArgArgArgValLysAspLeuSerTyrGly465470475480GinArgArgArglieGlulieAlaArgLeuValSerAspProMetAsp485490495LeuLeuLeuLeuAspGluProThrAsnHisLeuThrProValLeuVal500505510GluGluLeuGluGinAlaLeuAlaAspTyrArgGlyAlaValValVal515520525ValThrHisAspArgArgMetArgSerArgPheThrGlyAlaArgLeu530535540ThrMetGlyAspGlyArglieAlaGluPheSerAlaGly545550555<210〉52<211>550〈212〉PRT<213〉生二素链霉菌<400>52ValSerlieAlaGinTyrAlaLeuHisAsplieThrLysArgTyrHis151015AspCysValValLeuAspArgValGlyPheSerlieLysProGlyGlu202530LysValGlyVallieGlyAspAsnGlySerGlyLysSerThrLeuLeu354045LyslieLeuAlaGlyArgValGluProAspAsnGlyAlaLeuThrVal505560ValAlaProGlyGlyValGlyTyrLeuAlaGinThrLeuGluLeuPro65707580<formula>formulaseeoriginaldocumentpage289</formula>305310315320AsnAlaLysGinArgValAlaGinLeuThrGluAsnProValHisAla325330335ProAlaAspProLeuSerPheAlaAlaArglieAspThrAlaGlyPro340345350GluAlaGluGluAlaValAlaGluLeuThrAspValArgValAlaGly355360365ArgLeuAlaValAspSerLeuThrlieArgProGlyGluArgLeuLeu370375380ValThrGlyProAsnGlyAlaGlyLysSerThrLeuLeuArgValLeu385390395400SerGlyGluLeuGluProAspGlyGlySerValArgValGlyCysArg405410415ValGlyHisLeuArgGinAspGluThrProTrpAlaProGlyLeuThr420425430ValLeuArgAlaPheAlaGinGlyArgGluGlyTyrLeuGluAspHis435440445AlaGluLysLeuLeuSerLeuGlyLeuPheSerProSerAspLeuArg450455460ArgArgValLysAspLeuSerTyrGlyGinArgArgArglieGlulie465470475480AlaArgLeuValSerAspProMetAspLeuLeuLeuLeuAspGluPro485490495ThrAsnHisLeuThrProValLeuValGluGluLeuGluGinAlaLeu500505510AlaAspTyrArgGlyAlaValValValValThrHisAspArgArgMet515520525ArgSerArgPheThrGlyAlaArgLeuThrMetGlyAspGlyArglie530535540I6Sgi01SI84sc-lMe。3.;B3.;3:533:-M31.加3.33SPBIMS:5BM33spss〈oo寸〉言)<l〉〈0〇(,)(s<zs〉s。〕〈Im<§〉(到),-芽)〇2〉S8<IZ2〉A§〉<§〉a§)(91)〈zzz>sa〕<IZZ〉〈s>(IS寸I).(I)〇z〉sa。<Ig〉〈固〉極緣盟條u州〈els〉VNO〈〇〉,〈m〉s〈012〉OSs寸s:K:6st/s8s城浮每£AsnHisSerGlyLeuSerArgGluGlySerThrMetGlyAspLeuArg354045aaccgcateaccgagctggtccgcgcgtaccacegggaacaggcgccc192AsnArglieThrGluLeuValArgAlaTyrHisArgGluGinAlaPro505560gggggcttcgttcccgggacgacgcacgtaccggtctecggcgcggtg240GlyGlyPheValProGlyThrThrHisValProValSerGlyAlaVal65707580ctgagegag眺gaceggctggcgctggtggagacggcgctggagatg288LeuSerGluGluAspArgLeuAlaLeuValGluThrAlaLeuGluMet859095eggategcggccggcccggccteceggggcttcgageggcagttcgcc336ArglieAlaAlaGlyProAlaSerArgGlyPheGluArgGinPheAla100105110eggtacetcgggetceggaaggcgcacctgaccaactecggttectec384ArgTyrLeuGlyLeuArgLysAlaHisLeuThrAsnSerGlySerSer115120125gccaacetcetcgccetcggcgcgetcacctegccgcagctggaggag432AlaAsnLeuLeuAlaLeuGlyAlaLeuThrSerProGinLeuGluGlu130135140,eggctgcgtccgggggacgaggtcgtcacggtcgccgccgggUc柳ArgArgLeuArgProGlyAspGluValValThrValAlaAlaGlyPhe145150155160cccacgacggtc犯cccgatettccacaacgggctggtgcccgtcttc528ProThrThrValAsnProliePheHisAsnGlyl>euValProValPhe165170175gtggacgtcgagetcggcacgtacaacacgacgcccgagcgcategag576ValAspValGluLeuGlyThrTyrAsnThrThrProGluArglieGlu180185190egggcca_tcggcccceggacca_gggcgateatgategcgcacgccctg624ArgAlalieGlyProArgThrArgAlalieMetlieAlaHisAlaLeu195200205ggcaaccccttcgaggccg犯gaggtggcccgcetcgcggacgagegg672GlyAsnProPheGluAlaGluGluValAlaArgLeuAlaAspGluArg210215220gagctgttcetcategaggacaactgcgacgcggtggggteccgctac720GluLeuPheLeulieGluAspAsnCysAspAlaValGlySerArgTyr225230235240eggggcaggetcaccggctecttcggcgacctgtegaccgtcagettc768ArgGlyArgLeuThrGlySerPheGlyAspLeuSerThrValSerPhe245250255tatcccgcgcaccacategcgatgggtgaggggggctgcgtgetcacc816TyrProAlaHisHislieAlaMetGlyGluGlyGlyCysValLeuThr260265270gacaacctggccctggcgeggategtggaateactgcgcgactggggg864AspAsnLeuAlaLeuAlaArglieValGluSerLeuArgAspTrpGly275280285cgcgactgctggtgcgagccgggtgaggacaaccgctgcetcaagegg912ArgAspCysTrpCysGluProGlyGluAspAsnArgCysLeuLysArg290295300ttcgaccagaagatgggtgacctgccgcccgggtacgaccacaagtac960PheAspGinLysMetGlyAspLeuProProGlyTyrAspHisLysTyr305310315320atettctegcacgtcggttacaacctgaagtegaccgacctgcaggcg1008liePheSerHisValGlyTyrAsnLeuLysSerThrAspLeuGinAla325330335gccetcgggctgteccagctgacceggategaggagttcaccgaggcc1056AlaLeuGlyLeuSerGinLeuThrArglieGluGluPheThrGluAla340345350aggcgcgccaactggeggcatctgcgcgccgcgttgga_cgggctgccc1104ArgArgAlaAsnTrpArgHisLeuArgAlaAlaLeuAspGlyLeuPro355360365ggtctgctgctgcctcatgccacaccgggcagegatccgagetggttc1152GlyLeuLeuLeuProHisAlaThrProGlySerAspProSerTrpPhe370375380gggttcetcateaccgtggacccggacgccgcgtacageagggcggcc1200GlyPheLeulieThrValAspProAspAlaAlaTyrSerArgAlaAla385390395400ctggtcgaccacctggaatcgcgceggateageacccgccgcctgttc1248LeuValAspHisLeuGluSerArgArglieSerThrArgArgLeuPhe405410415gggggcaacctcgtgeggcaccccgcctacaccgaccgteggtacegg1296GlyGlyAsnLeuValArgHisProAlaTyrThrAspArgArgTyrArg420425430gtgtecggctecctggagaacagegacctgateaccgaccagacgttc1344ValSerGlySerLeuGluAsnSerAspLeulieThrAspGinThrPhe435440445tggTrpatelie450ggggtcttcGlyValPhecccProggcGly455atelie3CCThrccgProgagGluatgMet460ategcctacgtc1392lieAlaTyrValggcGly465g3CAspacgateeggThrlieArggagGlu470ttcPhegtgValctcLeu肌gLyscacHis475tecSertga1431<210>54<211>476<212>PRT<213〉生二素链霉菌<400〉54ValProArgAsnGlyMetArgValAlaProAlaAspValMetGinSer151015AspArgAspAspArgLeuSerGlyGlyArgMetProSerLeuGlySer202530AsnHisSerGlyLeuSerArgGluGlySerThrMetGlyAspLeuArg354045AsnArglieThrGluLeuValArgAlaTyrHisArgGluGinAlaPro505560GlyGlyPheValProGlyThrThrHisValProValSerGlyAlaVal65707580LeuSerGluGluAspArgLeuAlaLeuValGluThrAlaLeuGluMet859095ArglieAlaAlaGlyProAlaSerArgGlyPheGluArgGinPheAla100105110ArgTyrLeuGlyLeuArgLysAlaHisLeuThrAsnSerGlySerSer115120125AlaAsnLeuLeuAlaLeuGlyAlaLeuThrSerProGinLeuGluGlu130135140ArgArgLeuArgProGlyAspGluValValThrValAlaAlaGlyPhe145150155160ProThrThrValAsnProliePheHisAsnGlyLeuValProValPhe165170175ValAspValGluLeuGlyThrTyrAsnThrThrProGluArglieGlu180185190ArgAlalieGlyProArgThrArgAlalieMetlieAlaHisAlaLeu195200205GlyAsnProPheGluAlaGluGluValAlaArgLeuAlaAspGluArg210215220GluLeuPheLeulieGluAspAsnCysAspAlaValGlySerArgTyr225230235240ArgGlyArgLeuThrGlySerPheGlyAspLeuSerThrValSerPhe245250255TyrProAlaHisHislieAlaMetGlyGluGlyGlyCysValLeuThr260265270AspAsnLeuAlaLeuAlaArglieValGluSerLeuArgAspTrpGly275280285ArgAspCysTrpCysGluProGlyGluAspAsnArgCysLeuLysArg290295300PheAspGinLysMetGlyAspLeuProProGlyTyrAspHisLysTyr305310315320liePheSerHisValGlyTyrAsnLeuLysSerThrAspLeuGinAla325330335AlaLeuGlyLeuSerGinLeuThrArglieGluGluPheThrGluAla340345350ArgArgAlaAsnTrpArgHisLeuArgAlaAlaLeuAspGlyLeuPro355360365GlyLeuLeuLeuProHisAlaThrProGlySerAspProSerTrpPhe370375380GlyPheLeulieThrValAspProAspAlaAlaTyrSerArgAlaAla385390395400LeuValAspHisLeuGluSerArgArglieSerThrArgArgLeuPhe405410415GlyGlyAsnLeuValArgHisProAlaTyrThrAspArgArgTyrArg420425430ValSerGlySerLeuGluAsnSerAspLeulieThrAspGinThrPhe435440445TrplieGlyValPheProGlylieThrProGluMetlieAlaTyrVal450455460GlyAspThrlieArgGluPheValLeuLysHisSer465470475<210>55<211〉471<212>PRT<213>生二素链霉菌<400>55MetArgValAlaProAlaAspValMetGinSerAspArgAspAspArg151015LeuSerGlyGlyArgMetProSerLeuGlySerAsnHisSerGlyLeu202530SerArgGluGlySerThrMetGlyAspLeuArgAsnArglieThrGlu354045LeuValArgAlaTyrHisArgGluGinAlaProGlyGlyPheValPro505560GlyThrThrHisValProValSerGlyAlaValLeuSerGluGluAsp65707580ArgLeuAlaLeuValGluThrAlaLeuGluMetArglieAlaAlaGly859095ProAlaSerArgGlyPheGluArgGinPheAlaArgTyrLeuGlyLeu100105110ArgLysAlaHisLeuThrAsnSerGlySerSerAlaAsnLeuLeuAla115120125LeuGlyAlaLeuThrSerProGinLeuGluGluArgArgLeuArgPro130135140GlyAspGluValValThrValAlaAlaGlyPheProThrThrValAsn145150155160ProliePheHisAsnGlyLeuValProValPheValAspValGluLeu165170175GlyThrTyrAsnThrThrProGluArglieGluArgAlalieGlyPro180185l恥ArgThrArgAlalieMetlieAlaHisAlaLeuGlyAsnProPheGlu195200205AlaGluGluValAlaArgLeuAlaAspGluArgGluLeuPheLeulie210215220GluAspAsnCysAspAlaValGlySerArgTyrArgGlyArgLeuThr225230235240GlySerPheGlyAspLeuSerThrValSerPheTyrProAlaHisHis245250255lieAlaMetGlyGluGlyGlyCysValLeuThrAspAsnLeuAlaLeu260265270AlaArglieValGluSerLeuArgAspTrpGlyArgAspCysTrpCys275280285GluProGlyGluAspAsnArgCysLeuLysArgPheAspGinLysMet290295300GlyAspLeuProProGlyTyrAspHisLysTyrliePheSerHisVal305310315320GlyTyrAsnLeuLysSerThrAspLeuGinAlaAlaLeuGly!>euSer325330335GinLeuThrArglieGluGluPheThrGluAlaArgArgAlaAsnTrp340345350ArgHisLeuArgAlaAlaLeuAspGlyLeuProGlyLeuLeuLeuPro355360365HisAlaThrProGlySerAspProSerTrpPheGlyPheLeulieThr370375380ValAspProAspAlaAlaTyrSerArgAlaAlaLeuValAspHisLeu385390395400GluSerArgArglieSerThrArgArgLeuPheGlyGlyAsnLeuVal405410415ArgHisProAlaTyrThrAspArgArgTyrArgValSerGlySerLeu420425430GluAsnSerAspLeulieThrAspGinThrPheTrplieGlyValPhe435440445ProGlylieThrProGluMetlieAlaTyrValGlyAspThrlieArg450455460GluPheValLeuLysHisSer465470<210>56<211〉464<212〉PRT<213〉生二素链霉菌<400〉56ValMetGinSerAspArgAspAspArgLeuSerGlyGlyArgMetPro151015SerLeuGlySerAsnHisSerGlyLeuSerArgGluGlySerThrMet202530GlyAspLeuArgAsnArglieThrGluLeuValArgAlaTyrHisArg354045GluGinAlaProGlyGlyPheValProGlyThrThrHisValProVal505560SerGlyAlaValLeuSerGluGluAspArgLeuAlaLeuValGluThr65707580AlaLeuGluMetArglieAlaAlaGlyProAlaSerArgGlyPheGlu859095ArgGinPheAlaArgTyrLeuGlyLeuArgLysAlaHisLeuThrAsn100105110SerGlySerSerAlaAsnLeuLeuAlaLeuGlyAlaLeuThrSerPro115120125GinLeuGluGluArgArgLeuArgProGlyAspGluValValThrVal130135140AlaAlaGlyPheProThrThrValAsnProliePheHisAsnGlyLeu145150155160ValProValPheValAspValGluLeuGlyThrTyrAsnThrThrPro165170175GluArglieGluArgAlalieGlyProArgThrArgAlalieMetlie180185190AlaHisAlaLeuGlyAsnProPheGluAlaGluGluValAlaArgLeu195200205AlaAspGluArgGluLeuPheLeulieGluAspAsnCysAspAlaVal210215220GlySerArgTyrArgGlyArgLeuThrGlySerPheGlyAspLeuSer225230235240ThrValSerPheTyrProAlaHisHislieAlaMetGlyGluGlyGly245250255CysValLeuThrAspAsnLeuAlaLeuAlaArglieValGluSerLeu260265270ArgAspTrpGlyArgAspCysTrpCysGluProGlyGluAspAsnArg275280285CysLeuLysArgPheAspGinLysMetGlyAspLeuProProGlyTyr290295300AspHisLysTyrliePheSerHisValGlyTyrAsnLeuLysSerThr305310315320AspLeuGinAlaAlaLeuGlyLeuSerGinLeuThrArglieGluGlu325330335PheThrGluAlaArgArgAlaAsnTrpArgHisLeuArgAlaAlaLeu340345350AspGlyLeuProGlyLeuLeuLeuProHisAlaThrProGlySerAsp355360365ProSerTrpPheGlyPheLeulieThrValAspProAspAlaAlaTyr370375380SerArgAlaAlaLeuValAspHisLeuGluSerArgArglieSerThr385390395400ArgArgLeuPheGlyGlyAsnLeuValArgHisProAlaTyrThrAsp405410415ArgArgTyrArgValSerGlySerLeuGluAsnSerAspLeulieThr420425430AspGinThrPheTrplieGlyValPheProGlylieThrProGluMet<formula>formulaseeoriginaldocumentpage301</formula>165170175ArglieGluArgAlalieGlyProArgThrArgAlalieMetlieAla180185190HisAlaLeuGlyAsnProPheGluAlaGluGluValAlaArgLeuAla195200205AspGluArgGluLeuPheLeulieGluAspAsnCysAspAlaValGly210215220SerArgTyrArgGlyArgLeuThrGlySerPheGlyAspLeuSerThr225230235240ValSerPheTyrProAlaHisHislieAlaMetGlyGluGlyGlyCys245250255ValLeuThrAspAsnLeuAlaLeuAlaArglieValGluSerLeuArg260265270AspTrpGlyArgAspCysTrpCysGluProGlyGluAspAsnArgCys275280285LeuLysArgPheAspGinLysMetGlyAspLeuProProGlyTyrAsp290295300HisLysTyrliePheSerHisValGlyTyrAsnLeuLysSerThrAsp305310315320LeuGinAlaAlaLeuGlyLeuSerGinLeuThrArglieGluGluPhe325330335ThrGluAlaArgArgAlaAsnTrpArgHisLeuArgAlaAlaLeuAsp340345350GlyLeuProGlyLeuLeuLeuProHisAlaThrProGlySerAspPro355360365SerTrpPheGlyPheLeulieThrValAspProAspAlaAlaTyrSer370375380ArgAlaAlaLeuValAspHisLeuGluSerArgArglieSerThrArg385390395400ArgLeuPheGlyGlyAsnLeuValArgHisProAlaTyrThrAspArg舰410415ArgTyrArgValSerGlySerLeuGluAsnSerAspLeulieThrAsp420425430GinThrPheT卬lieGlyValPheProGlylieThrProGluMetlie435440445AlaTyrValGiyAspThrHeArgGluPheValLeuLysHisSer450455460<210>58<211>450<212>PRT<213>生二<400〉58MetProSerLeuGlySerAsnHisSerGlyLeuSerArgGluGlySer151015ThrMetGlyAspLeuArgAsnArglieThrGluLeuValArgAlaTyr202530HisArgGluGinAlaProGlyGlyPheValProGlyThrThrHisVal354045ProValSerGlyAlaValLeuSerGluGluAspArgLeuAlaLeuVal505560GluThrAlaLeuGluMetArglieAlaAlaGlyProAlaSerArgGly65707580PheGluArgGinPheAlaArgTyrLeuGlyLeuArgLysAlaHisLeu859095ThrAsnSerGlySerSerAlaAsnLeuLeuAlaLeuGlyAlaLeuThr100105110SerProGinLeuGluGluArgArgLeuArgProGlyAspGluValVal115120125ThrValAlaAlaGlyPheProThrThrValAsnProliePheHisAsn13035140GlyLeuValProValPheValAspValGluLeuGlyThrTyrAsnThr145150155160ThrProGluArglieGluArgAlalieGlyProArgThrArgAlalie165170175MetlieAlaHisAlaLeuGlyAsnProPheGluAlaGluGluValAla180185190ArgLeuAlaAspGluArgGluLeuPheLeulieGluAspAsnCysAsp195200205AlaValGlySerArgTyrArgGlyArgLeuThrGlySerPheGlyAsp210215220LeuSerThrValSerPheTyrProAlaHisHislieAlaMetGlyGlu225230235240GlyGlyCysValLeuThrAspAsnLeuAlaLeuAlaArglieValGlu245250255SerLeuArgAspTrpGlyArgAspCysTrpCysGluProGlyGluAsp260265270AsnArgCysLeuLysArgPheAspGinLysMetGlyAspLeuProPro275280285GlyTyrAspHisLysTyrliePheSerHisValGlyTyrAsnLeuLys290295300SerThrAspLeuGinAlaAlaLeuGlyLeuSerGinLeuThrArglie305310315320GluGluPheThrGluAlaArgArgAlaAsnTrpArgHisLeuArgAla325330335AlaLeuAspGlyLeuProGlyLeuLeuLeuProHisAlaThrProGly340345350SerAspProSerTrpPheGlyPheLeulieThrValAspProAspAla355360365AlaTyrSerArgAlaAlaLeuValAspHisLeuGluSerArgArglie370375380SerThrArgArgLeuPheGlyGlyAsnLeuValArgHisProAlaTyr385390395400ThrAspArgArgTyrArgValSerGlySerLeuGluAsnSerAspLeu405410415lieThrAspGinThrPheTrplieGlyValPheProGlylieThrPro420425430GluMetlieAlaTyrValGlyAspThrlieArgGluPheValLeuLys435440445HisSer450<210>59<211>433<212>PRT<213>生二<400>59MetGlyAspLeuArgAsnArglieThrGluLeuValArgAlaTyrHis151015ArgGluGinAlaProGlyGlyPheValProGlyThrThrHisValPro202530ValSerGlyAlaValLeuSerGluGluAspArgLeuAlaLeuValGlu354045ThrAlaLeuGluMetArglieAlaAlaGlyProAlaSerArgGlyPhe505560GluArgGinPheAlaArgTyrLeuGlyLeuArgLysAlaHisLeuThr65707580AsnSerGlySerSerAlaAsnLeuLeuAlaLeuGlyAlaLeuThrSer859095ProGinLeuGluGluArgArgLeuArgProGlyAspGluValValThr100105110ValAlaAlaGlyPheProThrThrValAsnProliePheHisAsnGly115120125LeuValProValPheValAspValGluLeuGlyThrTyrAsnThrThr130135140ProGluArglieGluArgAlalieGlyProArgThrArgAlalieMet145150155160lieAlaHisAlaLeuGlyAsnProPheGluAlaGluGluValAlaArg165170175LeuAlaAspGluArgGluLeuPheLeulieGluAspAsnCysAspAla180185190ValGlySerArgTyrArgGlyArgLeuThrGlySerPheGlyAspLeu195200205SerThrValSerPheTyrProAlaHisHislieAlaMetGlyGluGly210215220GlyCysValLeuThrAspAsnLeuAlaLeuAlaArglieValGluSer225230235240LeuArgAspTrpGlyArgAspCysTrpCysGluProGlyGluAspAsn245250255ArgCysLeuLysArgPheAspGinLysMetGlyAspLeuProProGly260265270TyrAspHisLysTyrliePheSerHisValGlyTyrAsnLeuLysSer275280285ThrAspLeuGinAlaAlaLeuGlyLeuSerGinLeuThrArglieGlu290295300GluPheThrGluAlaArgArgAlaAsnTrpArgHisLeuArgAlaAla305310315320LeuAspGlyLeuProGlyLeuLeuLeuProHisAlaThrProGlySer325330335AspProSerTrpPheGlyPheLeulieThrValAspProAspAlaAla340345350TyrSerArgAlaAlaLeuValAspHisLeuGluSerArgArglieSer355360365ThrArgArgLeuPheGlyGlyAsnLeuValArgHisProAlaTyrThr370375380AspArgArgTyrArgValSerGlySerLeuGluAsnSerAspLeulie385390395400ThrAspGinThrPheTrplieGlyValPheProGlylieThrProGlu405410415MetlieAlaTyrValGlyAspThrlieArgGluPheValLeuLysHis420425430Ser<210>60<211〉1398<212>DNA<213>生二素链霉菌<220〉<221>CDS<222〉(1)..(1398)<400>60atggacgacacgatggccggcgccgacgccgaggaatgggacggcgat48MetAspAspThrMetAlaGlyAlaAspAlaGluGluTrpAspGlyAsp151015cagttagaccgcgaggacegggcctecetccgccgcgtcgcggggetc96GinLeuAspArgGluAspArgAlaSerLeuArgArgValAlaGlyLeu202530tecaccgaactgaccgacgtctecgaggtcgagtaccgccagctgcga144SerThrGluLeuThrAspValSerGluValGluTyrArgGinbeuArg<formula>formulaseeoriginaldocumentpage308</formula>210215220gagctggagcagctg卿accggcegggacgtgaacegggaggagcga720GluLeuGluGinLeuLysThrGlyArgAspValAsnArgGluGluArg225230235240eggcgcaacaaggtgctgteggtcgccetcgccggctacaccaacgcc768ArgArgAsnLysValLeuSerValAlaLeuAlaGlyTyrThrAsnAla245250255ggcaagteategctgetcaaccgcetcaccggagccggcgtgctggtg816GlyLysSerSerLeuLeuAsnArgLeuThrGlyAlaGlyValLeuVal260265270gagaacgccctgttcgccaccctggacacgaccgtgeggegggcgacg864GluAsnAlaLeuPheAlaThrLeuAspThrThrValArgArgAlaThr275280285acgccgagegggcgcccctacaccategccgacaccgtgggcttcgta912ThrProSerGlyArgProTyrThrlieAlaAspThrValGlyPheVal290295300cgccacetcccgcaccacctggtggaggcgttccgttecacgategaa%0ArgHisLeuProHisHisLeuValGluAlaPheArgSerThrlieGlu305310315320gaggtcgcggacgcgcatctggtgctgcacgtggtcgacggttegcac1008GluValAlaAspAlaHisLeuValLeuHisValValAspGlySerHis325330335ccggaccccggcgcgcagctggccteggtgcgcgaggtgctgegggac1056ProAspProGlyAlaGinLeuAlaSerValArgGluValLeuArgAsp340345350gtgggcgccggcgagtecaccgaggtcgtggtcgtc犯csaggccgat1104ValGlyAlaGlyGluSerThrGluValValValValAsnLysAlaAsp355360365gtcgcggacccggacgtcetcgcccgtctgctggagcaggagccggac1152ValMaAspProAspValLeuAlaArgLeuLeuGluGinGluProAsp370375380gcgategtcgtgtecgcccgttegggteggggcstcgacctgegg1200AlalieValValSerAlaArgSerGlyArgGlylieAspGluLeuArg385g朋GlugtgValggcGlygcgAlaccgPro465<210><211><212〉<213〉<400〉ctgLeuatelieateliecccProg3gGlueggArg450gtgVal435gtcValgacAsptacTyr420etcLeuC3CHiscgcArg405gacAsp3gCSer390ctgctgLeuLeucccProtg361465PRT生二素链霉菌61gaggggGluGlyaccgagThrGlugacetcAspLeu455ccgProageSerC3CHis440gccAla395caccccgaggtgHisProGluVal410ctggtggcgeggLeuValAhArg425acgccggagggcThrProGluGlyteggagctteggSerGluLeuArg460MetAspAsp1ThrMetAlaGlyAla5AspAlaGluGlu10g兆GlugtgVal3CCThr445£icgThrgtgValcacHis430ctgLeucttLeu400gaggtc1248GluVal415gacgag1296AspGluetcacc1344LeuThrccgegg1392ProArgTrpAsp1398GlyAsp15GinLeuAspArgGluAspArgAlaSerLeuArgArgValAlaGlyLeu202530SerThrGluLeuThrAspValSerGluValGluTyrArgGinLeuArg354045LeuGluArgValValLeuValGlylieTrpThrSerGlyThrAlaAla505560GluAlaAspSerSerLeuAlaGluLeuAlaAlaLeuAlaGluThrAla65707580GlyAlaLeuValLeuAspGlyValValGinArgArgGinLysProAsp859095ProAlaThrTyrlieGlySerGlyLysAlaSerGinLeuArgAsplie100105110ValGluGluThrGlyAlaAspThrValValCysAspGlyGluLeuSer115120125ProSerGinLeuMetHisLeuGluGluValValGlyValLysValVal130135140AspArgThrAlaLeulieLeuAspliePheAlaGinHisAlaGinSer145150155160ArgGluGlyLysAlaGinValAlaLeuAlaGinMetGinTyrMetLeu165170175ProArgLeuArgGlyTrpGlyGinSerLeuSerArgGinMetGlyGly180185190GlyGlyGlyGlyGlyMetAlaThrArgGlyProGlyGluThrLyslie195200205GluThrAspArgArgArglieAsnAspLysMetAlaArgLeuArgArg210215220GluLeuGluGinLeuLysThrGlyArgAspValAsnArgGluGluArg225230235240ArgArgAsnLysValLeuSerValAlaLeuAlaGlyTyrThrAsnAla245250255GlyLysSerSerLeuLeuAsnArgLeuThrGlyAlaGlyValLeuVal260265270GluAsnAlaLeuPheAlaThrLeuAspThrThrValArgArgAlaThr275280285ThrProSerGlyArgProTyrThrlieAlaAspThrValGlyPheVal290295300ArgHisLeuProHisHisLeuValGluAlaPheArgSerThrlieGlu305310315320GluValAlaAspAlaHisLeuValLeuHisValValAspGlySerHis325330335ProAspProGlyAlaGinLeuAlaSerValArgGluValLeuArgAsp340345350ValGlyAlaGlyGluSerThrGluValValValValAsnLysAlaAsp355360365ValAlaAspProAspValLeuAlaArgLeuLeuGluGinGluProAsp370375380AlalieValValSerAlaArgSerGlyArgGlylieAspGluLeuArg385390395400GluLeulieAspArgLeuLeuProHisProGluValGluValGluVal405410415VallieProTyrAspGluGlySerLeuValAlaArgValHisAspGlu420425430GlyGluValLeuSerThrGluHisThrProGluGlyThrLeuLeuThr435440445AlaArgValHisProAspLeuAlaSerGluLeuArgThrLeuProArg450455460Pro465<210>62<211〉1044<212〉DNA<213〉生二素链霉菌〈220〉<221>CDS<222〉(1).(1044)<400〉62atgcgagtaetcattategggggtteacagttcgtgggcegggccttc48MetArgValLeulielieGlyGlySerGinPheValGlyArgAlaPhe151015gccgccgaggcactggccgcggggcacegggtcaccacgttcaacegg96AlaAlaGluAlaLeuAlaAlaGlyHisArgValThrThrPheAsnArg202530ggtgtcageggcaccgacctgcccggcgtcgaggcggtcaggggcgac144GlyValSerGlyThrAspLeuProGlyValGluAlaValArgGlyAsp354045cgcgaggtggccggcgacctggageggctggtgtecggaaggcactgg192ArgGluValAlaGlyAspLeuGluArgLeuValSerGlyArgHisTrp505560gacgcggtcgtggacacctgcggttacgtgccccgcacggtgggggcc240AspAlaValValAspThrCysGlyTyrValProArgThrValGlyAla65707580teggccgcggcgctgtecgggcacgcggacacctacetctacgtctec288SerAlaAlaAlaLeuSerGlyHisAlaAspThrTyrLeuTyrValSer859095ageategcctgcctgcccgactgggcgcaggcggtccgtccggtggac336SerlieAlaCysLeuProAspTrpAlaGinAlaValArgProValAsp100105110gacgacteacctgcccacgactgcccgccggacgccggaccggaccac384AspAspSerProAlaHisAspCysProProAspAlaGlyProAspHis115120125gccgacggtgactacggcgtcctgaaggccggctgcgagcgcgccgtg432AlaAspGlyAspTyrGlyValLeuLysAlaGlyCysGluArgAlaVal130135140gaceggAspArg145cacHisttcPhegcgAlaggcGly150eggArgaccThrctgLeuC3CHisctgLeu155eggArggccAlaggtGlygtcValatelie160480etcgggLeuGlyccgProescHisgacAsp1653CCThr3tgMetcgcArg3tgMetetcLeu170gacAspgccAlatggTrpctgLeutggTrp175cgcArg528atgcgcgtcgccgagggggagcaccgcegggtgetcgccccgggcaac576MetArgValAlaGluGlyGluHisArgArgValLeuAlaProGlyAsn180185190cccgagProGlugtgVal195ggcGly3tgMetcgcArgctgLeuatelie200gacAspgtacgcVslArgAspgtcVal205gccAlagtcValttcPhe624ggcetcGlyLeu210g3CAsptgcCysetcLeugcgAlag3CAsp215ggcGlycgtArgaccggcThrGlygccAla220ttcPheateliegtcVal犯cAsn672ccgccgProPro225gagGlu卿33CAsn3CCThr2303CCThrttcPhegggGlygagttgGluLeu235etcLeu3CgThrGlutgcCysgtcVal240720aaggccLysAla3CCThrggtGlytegSer245gccAlagcgAlagagGluccgProgtgtggValTrp250gtcValgacAspg3gGlugggGly255ttcPhe768etcgccLeuAlagagGlucacHis260ggcGlygtgValagtSerccgProtggTrp265acggacThrAspctgLeuccgProatgMet270tggTrpgtgVal816CCCg3CProAsp3CCThr275gcgAlaeggArgg3CAspaccThretcLeu280gtgValtgggcgTrpAlagccAlaggaGly285gC3AlaccgProcgcArg864gcceggAlaArg290gccAlagcgAlaggtGlyctgLeugccAla295tgcCyseggArgcccttcProPhetecSer300giacAspaccThrgtgValeggArg912gacgccAspAla305tggTrpgagGlugtcValgtcVal310eggArggacAspeggArgcccgtcProVal315ccgProg肪GluctgLeuccgProetcLeu320960gcggccAlaAlaggcGlytgcCysggcGly325ctgLeutecSerctgLeuageSeregggagArgGlu330aagLysg3gGluctgLeuetcLeu335gccAla1008gcctggAlaTrpgacAspgetAla340cgcArgggcGlyggtGlygcgAlagcgAla345gcgggcAlaGlytga1044<210>63<211〉347<212〉PRT<213〉生二<400>63素链霉菌MetArgValLeulielieGlyGlySerGinPheValGlyArgAlaPhe151015AlaAlaGluAlaLeuAlaAlaGlyHisArgValThrThrPheAsnArg202530GlyValSerGlyThrAspLeuProGlyValGluAlaValArgGlyAsp354045ArgGluValAlaGlyAspLeuGluArgLeuValSerGlyArgHisTrp505560AspAlaValValA印ThrCysGlyTyrValProArgThrValGlyAla65707580SerAlaAlaAlaLeuSerGlyHisAlaAspThrTyrLeuTyrValSer859095SerlieAlaCysLeuProAspTrpAlaGinAlaValArgProValAsp100105110AspAspSerProAlaHisAspCysProProAspAlaGlyProAspHis115120125AlaAspGlyAspTyrGlyValLeuLysAlaGlyCysGluArgAlaVal130135140AspArgHisPheAlaGlyArgThrLeuHisLeuArgAlaGlyVallie145150155160LeuGlyProHisAspThrMetArgMetLeuAspAlaTrpLeuTrpArg165170175MetArgValAlaGluGlyGluHisArgArgValLeuAlaProGlyAsn180185190ProGluValGlyMetArgLeulieAspValArgAspValAlaValPhe195200205GlyLeuAspCysLeuAlaAspGlyArgThrGlyAlaPhelieValAsn210215220ProProGluLysAsnThrThrPheGlyGluLeuLeuThrGluCysVal225230235240LysAlaThrGlySerAlaAlaGluProValTrpValAspGluGlyPhe245250255LeuAlaGluHisGlyValSerProTrpThrAspLeuProMetTrpVal260265270ProAspThrAlaArgAspThrLeuValTrpAlaAlaGlyAlaProArg275280285AlaArgAlaAlaGlyLeuAlaCysArgProPheSerAspThrValArg290295300AspAlaTrpGluValValArgAspArgProValProGluLeuProLeu305310315320AlaAlaGlyCysGlyLeuSerLeuSerArgGluLysGluLeuLeuAla325330335AlaT卬AspAlaArgGlyGlyAlaAlaAlaGly340345〈210〉64<211>1041<212>DNA<213>生二素链霉菌<220〉<221>CDS<222>(1).■(1041)<400>64atgaccgccctgggtacttctgetgaaccgttcgccgcacccggcccg48MetThrAlaLeuGlyThrSerAlaGluProPheAlaAlaProGlyPro151015<formula>formulaseeoriginaldocumentpage317</formula>ggcGlygcaAlactgLeu195etcLeugacAsp犯cAsnggcGlygtcVal200tacTyrccgProctgLeuegggccgcgArgAlaAla205ctgLeucacHis624ttcPheetcLeu210ggaGlycccProg犯GluctgLeucgc215ctgLeua_ccThrggcGlygccAlagtgctgcgcValLeuArg220cgtArggacAsp672cgcArg225cgcArgeggArgggcGlygtcValgtgVal230gtcValtecSerggcGlyageSergtcVal235ctgetcgccLeuLeuAlsgccAlacccPro240720cagGinggcGlygtgValgccAlagccAla245ca_cHisetcLeugccAlattcPheggcGly250atgMetgaa_cacggcGluHisGlytacTyr255cgcArg768tcgSergcgAlatacTyrgagGlu260ctgLeuC3CHisggcGlyageSerThr265ggcGlytcgSeretcgccctgLeuAl已Leu270ageSerC3CHis816gtcValttcPheacgThr275ThrccgProgacAspageSerHis280ca_cHiscccProgtaValctgeggctgLeuArgLeu285tecSercgcArg864cagGingacAsp290HiseggArggagGlug邓GlucgcArg295gtcValctgLeucccProgtgValgaceggcacAspArgHis300ttcPhegtgVal912Asn305ateliectgLeutcgSergtcValUcPhe310cgcArgcgtArggcgAlagtgValatelie315egggccgagArgAlaGlugacAspgtcVal320960tecSergccAlaGlutcgSertacTyr325gccAlagcgAlactgLeucgcArgcagGin330gcgAlagggctggtcGlyLeuValgacAsp335g兆Glu1008ateliegtgValgccAlacgcArg340gccAlagagGlu3CCThrttcPhe£LCCThr345gtgValtag1041<210〉65<211>346<212>PRT<213>生二素链霉菌<400〉65MetThrAlaLeuGlyThrSerAlaGluProPheAlaAlaProGlyPro151015ProArgProGluAlaSerProValLeuArgPheGlyAlalieGlyCys202530GlyAsplieAlaGlyArgArgThrLeuProAlaLeuLeuSerThrPro354045GlyThrValLeuThrCysValGlySerArgAspAlaAspArgAlaLys505560AlaLeuGlyArgHisPheAspCysGluAlaValAlaProTyrGluAla65707580LeuLeuGluArgProAspValAspAlaValTyrlieAlaValProSer859095MetLeuHisAlaGluTrpAlaAlaAlaAlaLeuArgAlaGlyLysHis100105110ValLeuValGluLysProAlaAlaAlaAsnHisAlaAspAlaAlaArg115120125LeuPheAlaMetAlaArgGluArgGlyLeuValLeuMetGluAsnPhe130135140MetPheLeuHisHisSerGinHisAlaThrValLysAlaLeuLeuGlu145150155160AlaGlyAlalieGlyGluLeuArgThrPheSerAlaAlaPheThrlie165170175ProProArgAlaAspAspAspMetArgTyrArgProAsplieGlyGly180185190GlyAlaLeuLeuAspAsnGlyValTyrProLeuArgAlaAlaLeuHis195200205PheLeuGlyProGluLeuArgLeuThrGlyAlaValLeuArgArgAsp210215220ArgArgArgGlyValValValSerGlySerValLeuLeuAlaAlaPro225230235240GinGlyValAlaAlaHisLeuAlaPheGlyMetGluHisGlyTyrArg245250255SerAlaTyrGluLeuHisGlySerThrGlySerLeuAlaLeuSerHis260265270ValPheThrThrProAspSerHisHisProValLeuArgLeuSerArg275280285GinAspHisArgGluGluArgValLeuProValAspArgHisPheVal290295300AsnlieLeuSerValPheArgArgAlaVallieArgAlaGluAspVal305310315320SerAlaGluSerTyrAlaAlaLeuArgGinAlaGlyLeuValAspGlu325330335lieValAlaArgAlaGluThrPheThrVal340345<210〉66<211〉1239<212>DNA<213>生二素链霉菌<220><22DCDS<222>(1)..(1239)<400〉66gtgacggacgcgateacgaccgagctggccgaccgcgaactggggcgc48ValThrAspAlalieThrThrGluLeuAlaAspArgGluLeuGlyArg151015agactgcaceggatacgcggcgtccactggtatttcggcaaccacggt96ArgLeuHisArglieArgGlyValHisTrpTyrPheGlyAsnHisGly202530gscccgtacgccetcatectgcgcggtcagaccgacgacccgtcggtg144AspProTyrAlaLeulieLeuArgGlyGinThrAspAspProSerVal354045tacgaggagegggtccgcgagggcgggccgctgttccgcagecgtacc192TyrGluGluArgValArgGluGlyGlyProLeuPheArgSerArgThr505560gggacctgggtga_ccgcgg£icccggaggtggccgcggccgtgctgggc240GlyThrTrpValThrAlaAspProGluValAlaAlaAlaValLeuGly65707580gactcgcgcttcggtgcgctggaccgcgccggaeggcgcccggaggag288AspSerArgPheGlyAlaLeuAspArgAlaGlyArgArgProGluGlu859095tacetccagccgtcgcccgccacgtacctggggctggaccgcgccgcg336TyrLeuGinProSerProAlaThrTyrLeuGlyLeuAspArgAlaAla100105110teicgcgcgtctgeggegggtggccgagcccgtgctgggcgcggacgcc鹏TyrAlaArgLeuArgArgValAlaGluProValLeuGlyAlaAspAla115120125gccgccgcgtggcgceggetcggcgaggacgtcgggcgceggctgetc432AlaAlaAlaTrpArgArgLeuGlyGluAspValGlyArgArgLeuLeu130135140gccggccgcggttecggcetcgscctgacggcggacttcgcccgcegg480AlaGlyArgGlySerGlyLeuAspLeuThrAlaAspPheAlaArgArg145150155160ctgccggcattggtcctggccgcgtggetcggggtgccgggcgaaegg528LeuProAlaLeuValLeuAlaAlaTrpLeuGlyValProGlyGluArg165170175tgcgacgagtggg兆gagtcgctgegggcggcggggccgctgctggac576CysAspGluTrpGluGluSerLeuArgAlaAlaGlyProLeuLeuAsp180185190ggtctgctgtgtccgcagacgctggcggccacccgtgcggcggactcg624GlyLeuLeuCysProGinThrLeuAlaAlaThrArgAlaAlaAspSer195200205gccgccgaggggctgcgcgcgctgttggacgaggtggtcgccgcgcgt672AlaAlaGluGlyLeuArgAlaLeuLeuAspGluValValAlaAlaArg210215220cccggcgggtecggcgagggtgcggtggcccgcatggtcggcgccgga720ProGlyGlySerGlyGluGlyAlaValAlaArgMetValGlyAlaGly225230235240gccgcccccgacgacgcggtggccgccgccgtgtgcctggcgetcteg768AlaAlaProAspAspAlaValAlaAlaAlaValCysLeuAlaLeuSer245250255gccgtcgaaccgacgacgaccctggtgtgcgaagcggtceggctgctg816AlaValGluProThrThrThrLeuValCysGluAlaValArgLeuLeu260265270etcgaccgacccgagtggtggeggeggttgtgcgacteccccgetctg864LeuAspArgProGluTrpTrpArgArgLeuCysAspSerProAlaLeu275280285gcgccggccgcggtceggcacaccctgeggcacgcgcccccggtgegg912AlaProAlaAlaValArgHisThrLeuArgHisAlaProProValArg290295300ctggagageegggtggcccacgaggacgtgacggtggcggatcgtccg960LeuGluSerArgValAlaHisGluAspValThrValAlaAspArgPro305310315320ctgcccgccgggagecacgtggtggtgetcgtgggcgcggcaeggcgc1008LeuProAlaGlySerHisValValValLeuValGlyAlaAlaArgArg325330335gcgggcgccccggccgcggagccggcggacctggcgggcgcaccggcg1056AlaGlyAlaProAlaAlaGluProAlaAspLeuAlaGlyAlaProAla340345350gcggagctgccggacgacctgtggttcgcgctgtecggggagttcgtc1104AlaGluLeuProAspAspLeuTrpPheAlaLeuSerGlyGluPheVal355360365ggccgtgccgccgagaccgcgctgggcgtgctggccgaggccgccccg1152GlyArgAlaAlaGluThrAlaLeuGlyValLeuAlaGluAlaAlaPro370375380ggactgeggegggacggcgacategtceggeggcgccgttecccggtc1200GlyLeuArgArgAspGlyAsplieValArgArgArgArgSerProVal385390395400etcggcaggtacgcgeggttccccgtcgcgtactectga1239LeuGlyArgTyrAlaArgPheProValAlaTyrSer405410<210>67<211〉412〈212〉PRT<213>生二<400>67素链霉菌ValThrAspAlalieThrThrGluLeuAlaAspArgGluLeuGlyArg151015ArgLeuHisArglieArgGlyValHisTrpTyrPheGlyAsnHisGly202530AspProTyrAlaLeulieLeuArgGlyGinThrAspAspProSerVal354045TyrGluGluArgValArgGluGlyGlyProLeuPheArgSerArgThr505560GlyThrTrpValThrAlaAspProGluValAlaAlaAlaValLeuGly65707580AspSerArgPheGlyAlaLeuAspArgAlaGlyArgArgProGluGlu859095TyrLeuGinProSerProAlaThrTyrLeuGlyLeuAspArgAlaAla100105110TyrAlaArgLeuArgArgValAlaGluProValLeuGlyAlaAspAla115120125AlaAlaAlaTrpArgArgLeuGlyGluAspValGlyArgArgLeuLeu130135140AlaGlyArgGlySerGlyLeuAspLeuThrAlaAspPheAlaArgArg<formula>formulaseeoriginaldocumentpage324</formula>GlyLeuArgArgAspGlyAsplieValArgArgArgArgSerProVal385390395400LeuGlyArgTyrAlaArgPheProValAlaTyrSer405410<210〉68<211>1272<212>DNA<213>生二素链霉菌<220><221>CDS<222〉(1)..(1272)<400〉68gtgcgcgtcctggtgacctecateccgcaccacacgcactactaccac48ValArgValLeuValThrSerlieProHisHisThrHisTyrTyrHis151015ctggtaccgctgatetgggetctgcgtgccteggggcacgaggtggtg96LeuValProLeulieTrpAlaLeuArgAlaSerGlyHisGluValVal202530gcggccggccagccgtegctggtcgacgccateaccgccageggcate144AlaAlaGlyGinProSerLeuValAspAlalieThrAlaSerGlylie354045ccggcgttcgccctggccgaggaggagtegctggcgcagatettcgag192ProAlaPheAlaLeuAlaGluGluGluSerLeuAlaGinliePheGlu505560gaggtcgagggcgatetccagccgtatcagcacggcategacgagttc240GluValGluGlyAspLeuGinProTyrGinHisGlylieAspGluPhe65707580gscttcttcggcaccctgsaggacgagctggactgggsgaagctgetc288AspPhePheGlyThrLeuLysAspGluLeuAspTrpGluLysLeuLeu859095gcccagcaggtgatectgtecggcctgtggctggaaccgetcaacggc336AlaGinGinVallieLeuSerGlyLeuTrpLeuGluProLeuAsnGly100105110gccacgaccetcgacageategtcgacttcgccegggcctggaagccc384AlaThrThrLeuAspSerlieValAspPheAlaArgAlaTrpLysPro115120125gacctggtgctgtgggagccgttcacctatgcggggccggtggcggcc432AspLeuValLeuTrpGluProPheThrTyrAlaGlyProValAlaAla130135140egggcgtgcggggccgcgcacgcccgcgtcctgtgggggccggacacg480ArgAlaCysGlyAlaAlaHisAlaArgValLeuTrpGlyProAspThr145150155160ategggctgctgeggacgaagttccttcaggcccaggcgcgtcagccc528lieGlyLeuLeuArgThrLysPheLeuGinAlaGinAlaArgGinPro165170175g兆gagcacegggacgacccggtcgcggagtggatgacctgggccctg576GluGluHisArgAspAspProValAlaGluTrpMetThrTrpAlaLeu180185190gcgcgctacgggtgcgacttcegggaggaggacgtgetcggtcagtgg624AlaArgTyrGlyCysAspPheArgGluGluAspValLeuGlyGinTrp195200205agegtggacccgatggcggagggcgtcagtctgggcetcgacctgccg672SerValAspProMetAlaGluGlyValSerLeuGlyLeuAspLeuPro210215220accgtcccgatgcgctacaccccgtacaacgggtcggcggtgateccc720ThrValProMetArgTyrThrProTyrAsnGlySerAlaValliePro225230235240gactggctgaccgaggaaccgaaaeggcctegggtctgcctgaccctg768AspTrpLeuThrGluGluProLysArgProArgValCysLeuThrLeu245250255ggggtgtectcgegggagcacagtgaggacgaggtcccggtgcag鄉816GlyValSerSerArgGluHisSerGluAspGluValProValGinArg260265270tttategaggcgctggccgatetcgacategagctggtggcgaccctg864PhelieGluAlaLeuAlaAspLeuAsplieGluLeuValAlaThrLeu275280285gacgacgcccagegggacctgctgccgaggateccggacaacacgcgcAspAspAlaGinArgAspLeul>euProArglieProAspAsnThrArg290295300912ategtcgacttcgtgcccatggacgcgttgctgccgacgtgcteggcglieValAspPheValProMetAspAlaLeuLeuProThrCysSerAla305310315320960ateateaaccacageggttegggcacgtgcaacaccgccgcgctgcaclielieAsnHisSerGlySerGlyThrCysAsnThrAlaAlaLeuHis3253303351008ggggtgccgcagateateetcggcggcatectggacgccgccgtaeggGlyValProGinlielieLeuGlyGlylieLeuAspAlaAlaValArg3403453501056cagcacatgttcgcgcagaactecgccgccetcaccttcgetccggagGinHisMetPheAlaGinAsnSerAlaAlaLeuThrPheAlaProGlu3553603651104gaggtgaccggcgcgtegctgaggagegcgctggtgcgcctgetcgagGluValThrGlyAlaSerLeuArgSerAlaLeuValArgLeuLeuGlu3703753801152gagccgeggttccgcgacggcgcgeggeggctgaaggageggatgeggGluProArgPheArgAspGlyAlaArgArgLeuLysGluArgMetArg3853903954001200gccatgcccageccggccgggategtgccgsecctggagcgcetcscgAlaMetProSerProAlaGlylieValProThrLeuGluArgLeuThr4054104151248gcccagAlaGinC3CHiscgcArg420egggcgtgttgaArgAlaCys1272<210〉69<211>423<212>PRT<213〉生二素链霉菌<formula>formulaseeoriginaldocumentpage328</formula>235240AspTrpLeuThrGluGluProLysArgProArgValCysLeuThrLeu245250255GlyValSerSerArgGluHisSerGluAspGluValProValGinArg260265270PhelieGluAlaLeuAlaAspLeuAsplieGluLeuValAlaThrLeu275280285AspAspAlaGinArgAspLeuLeuProArglieProAspAsnThrArg290295300lieValAspPheValProMetAspAlaLeuLeuProThrCysSerAla305310315320lielieAsnHisSerGlySerGlyThrCysAsnThrAlaAlaLeuHis325330335GlyValProGinlielieLeuGlyGlylieLeuAspAlaAlaValArg340345350GinHisMetPheAlaGinAsnSerAlaAlaLeuThrPheAlaProGlu355360365GluValThrGlyAlaSerLeuArgSerAlaLeuValArgLeuLeuGlu370375380GluProArgPheArgAspGlyAlaArgArgLeuLysGluArgMetArg385390395400AlaMetProSerProAlaGlylieValProThrLeuGluArgLeuThr405AlaGinHisArgArgAlaCys420410415<210>70<211〉1179<212>DNA<213>生二素链霉菌<220〉〈221>CDS<222>(1)..(1179)<400〉70atgegggccetcttcacgaccgcgccgetcgcgggccacctgcttccg48MetArgAlaLeuPheThrThrAlaProLeuAlaGlyHisLeuLeuPro151015ctggtgcccategcgtgggccctgegggcggccggccacgaggtactg96LeuValProlieAlaTrpAlaLeuArgAlaAlaGlyHisGluValLeu202530gtggcgaccegggaggacttcgtgccggtcgccctgeggtcggggctg144ValAlaThrArgGluAspPheValProValAlaLeuArgSerGlyLeu354045ccgtecgcctcgtgcgggccgcccgccgcgg3Cctggcgggcgcggcc192ProSerAlaSerCysGlyProProAlaAlaAspLeuAlaGlyAlaAla505560gaggcgggggcgetcgcgeggccccgcggagcggcggaggeteggggg240GluAlaGlyAlaLeuAlaArgProArgGlyAlaAlaGluAlaArgGly65707580gtcctgageggggcgctggcgcgcgtcgcceggggcagtctggcgggg288ValLeuSerGlyAlaLeuAlaArgValAlaArgGlySerLeuAlaGly859095gtgeggeggctggcggacgcctggeggccggatctgategtcagegaa336ValArgArgLeuAlaAspAlaTrpArgProAspLeulieValSerGlu100105110egggccgagttcgccgggccgctggtcgcggcggccetcggggtcccg384ArgAlaGluPheAlaGlyProLeuValAlaAlaAlaLeuGlyValPro115120125tgggtccgctaccactggtcggtctcgtecctggaggagtaceggcga432TrpValArgTyrHisTrpSerValSerSerLeuGluGluTyrArgArg130135140gcggccgaggccgagttcgcgcccgagctggcggcgetcggcetcgac480AlaAlaGluAlaGluPheAlaProGluLeuAlaAlaLeuGlyLeuAsp145150155160eggttcccggaggcggcgcgcgtgetcgatccgtggccggtgtegctg528ArgPheProGluAlaAlaArgValLeuAspProTrpProValSerLeu165170175cgceggccggacgcggtcgcccacgacggggtceggcacgtaccggcc576ArgArgProAspAlaValAlaHisAspGlyValArgHisValProAla180185190cacggggacgcccccgtccccgactgggcgttcacgcgcggtcgcggg624HisGlyAspAlaProValProAspTrpAlaPheThrArgGlyArgGly195200205ccgeggatetgcgtgacgetcggcaccatgctgccceggtacggcgcc672ProArglieCysValThrLeuGlyThrMetLeuProArgTyrGlyAla210215220gccgggatggccgacUcctgacggagctggtggcggagacecgcgga720AlaGlyMetAlaAspPheLeuThrGluLeuValAlaGluThrArgGly225230235240ggggactgcgaactgetcgtggcggtcgacgacgacgtcgtcgcgegg768GlyAspCysGluLeuLeuValAlaValAspAspAspValValAlaArg245250255tggccgtegctgccctecgcggtgeggtacgccggceggctgccgctg816TrpProSerLeuProSerAlaValArgTyrAlaGlyArgLeuProLeu260265270gcggaggtgctgcccgcgtgcgacgcggtggtgcaccacggcgggcag864AlaGluValLeuProAlaCysAspAlaValValHisHisGlyGlyGin275280285ggcacgtecctgaccgcgctggccgcgggteggccgcaggtcgtcatg912GlyThrSerLeuThrAlaLeuAlaAlaGlyArgProGinValValMet290295300gcgeggetcgacgaccagttcgacaacgcgegggcactggcggcggcg960AlaArgLeuAspAspGinPheAspAsnAlaArgAlaLeuAlaAlaAla305310315320ggggcggccctgetcgtaccgccgtecegggccactcccgcggccgtg1008GlyAlaAlaLeuLeuValProProSerArgAlaThrProAlaAlaVal<formula>formulaseeoriginaldocumentpage332</formula>ValArgArgLeuAlaAspAlaTrpArgProAspLeulieValSerGlu100105110ArgAlaGluPheAlaGlyProLeuValAlaAlaAlaLeuGlyValPro115120125TrpValArgTyrHisTrpSerValSerSerLeuGluGluTyrArgArg130135140AlaAlaGluAlaGluPheAlaProGluLeuAlaAlaLeuGlyLeuAsp145150155160ArgPheProGluAlaAlaArgValLeuAspProTrpProValSerLeu165170175ArgArgProAspAlaValAlaHisAspGlyValArgHisValProAla180185190HisGlyAspAlaProValProAspTrpAlaPheThrArgGlyArgGly195200205ProArglieCysValThrLeuGlyThrMetLeuProArgTyrGlyAla210215220AlaGlyMetAlaAspPheLeuThrGluLeuValAlaGluThrArgGly225230235240GlyAspCysGluLeuLeuValAlaValAspAspAspValValAlaArg245250255TrpProSerLeuProSerAlaValArgTyrAlaGlyArgLeuProLeu260265270AlaGluValLeuProAlaCysAspAlaValValHisHisGlyGlyGin275280285GlyThrSerLeuThrAlaLeuAlaAlaGlyArgProGinValValMet290295300AlaArgLeuAspAspGinPheAspAsnAlaArgAlaLeuAlaAlaAla305310315320GlyAlaAlaLeuLeuValProProSerArgAlaThrProAlaAlaVal325330335AlaAlaGlyCysAlaGluValLeuGluAsnAlaLeuTyrAlaLysAla340345350AlaAlaGlyLeuAlaGluGluMetAlaLeuLeuProSerProSerAla355360365AlaValGlyLeuLeuGluHisProGlyProGlyProAspMetProArg370375380SerTyrProAsnGluAspAlaVal385390<210〉72<211〉993<212〉DNA<213〉生二素链霉菌<220><221>CDS<222>(1)..(993)<400>72gtgaatctggaagtaetcaaccgttegaacgatccgcgcgggccggtg48ValAsnLeuGluValLeuAsnArgSerAsnAspProArgGlyProVal151015ateacggtggtcggcgcgtecggcttcategggtecgccctggtcgcc96lieThrValValGlyAlaSerGlyPhelieGlySerAlaLeuValAla202530gagctggcgcgcatgccggtgeggctgegggcggtggcceggcgcgag144GluLeuAlaArgMetProValArgLeuArgAlaValAlaArgArgGlu354045acccccgttcccgcgggggcaegggccgccgtcgaggtccgcegggcg192ThrProValProAlaGlyAlaArgAlaAlaValGluValArgArgAla505560gacetcgcceggccggacgaggtcggggccgccgtcgagggggcggac240AspLeuAlaArgProAspGluValGlyAlaAlaValGluGlyAlaAsp65707580<image>imageseeoriginaldocumentpage335</image>etcgccgggctggtggccgageggacggggaggccccccgtaccggtg816LeuAlaGlyLeuValAlaGluArgThrGlyArgProProValProVal260265270gtctecacggagccgcccgaccatgccgaggcgggcgacttcgagage864ValSerThrGluProProAspHisAlaGluAlaGlyAspPheGluSer275280285gcggtctgtgacccctecgcgttccgcgcggtgaccgggtggtctccc912AlaValCysAspProSerAlaPheArgAlaValThrGlyTrpSerPro290295300etcgttccgttgegggcggggetcggcgccgtggtggagacgatggtg960LeuValProLeuArgAlaGlyLeuGlyAlaValValGluThrMetVal305310315320gccgacggagcgaggggtgggatecgaacgtga993AlaAspGlyAlaArgGlyGlylieArgThr325330<210>73<211>330<212>PRT<213〉生二素链霉菌<400〉73ValAsnLeuGluValLeuAsnArgSerAsnAspProArgGlyProVal151015lieThrValValGlyAlaSerGlyPhelieGlySerAlaLeuValAla202530GluLeuAlaArgMetProValArgLeuArgAlaValAlaArgArgGlu354045ThrProValProAlaGlyAlaArgAlaAlaValGluValArgArgAla505560AspUuAlaArgProAspGluValGlyAlaAlaValGluGlyAlaAsp65707580AlaValValHisLeuAlaAlaHislieGlyGlyAlaArgSerTrpArg859095AlaAlaAspGluArgSerLeuArgValAsnValGlyLeuLeuArgAsp100105110ValAlaAspAlaPheArgAspArgSerGlyProAlaProAlaValVal115120125LeuAlaSerThrLeuGinAlaGlyValGluLeuSerArgGinGlyPro130135140TyrAlaArgGinLysSerAlaAlaGluGluValLeuLeuArgAlaAla145150155160SerGluGluValValArgGlyValValLeuArgLeuProThrValTyr165170175GlyArgSerProLeuThrGlyTrpThrGlyArgGlyValValAlaSer180185190ValAlaArgGinAlaValSerGlyGluProValThrMetTrpHisAsp195200205GlyThrValGlyArgAspLeuLeuHisValGluA印AlaAlaArgAla210215220PheAlaAlaAlaLeuGlyHisValGluArgLeuAspGlyGlyThrTrp225230235240SerValGlyThrGlyArgLeuGluProLeuGlyGluValPheSerAla245250255LeuAlaGlyLeuValAlaGluArgThrGlyArgProProValProVal260265270ValSerThrGluProProAspHisAlaGluAlaGlyAspPheGluSer275280285AlaValCysAspProSerAlaPheArgAlaValThrGlyTrpSerPro290295300LeuValProLeuArgAlaGlyLeuGlyAlaValValGluThrMetVal305310315320AlaAspGlyAlaArgGlyGlylieArgThr325330<210〉<211><212><213〉741008DNA生二<220><221〉<222〉CDS(1)..(1008)<400>gtgVal1743gCSeracgThrAspeggArg5g恥GlucagGingccAlagcgAlacacHis10acgThreggArgetcLeuggtGlycgcArg15ageSer48gcgAla3CCThrctgLeugtgVal20ageSereggArgetcLeutggTrpctgLeu25ggcGly3CCThrgtgVal肌cAsnttcPhe30ageSerggcGly96eggArggtcValgagGlu35g3CAspggtGlygacAspgcgAla3tgMet40C3gGinctgLeu3tgMetgagGlugcgAla45gcgAlagtcValg3CAsp144cgcArgggcGly50atelieAsntgcCysateliegacAsp553CCThrgcgAlagacAspatelietacTyr60ggcGlytggTrpeggArgatelie192C3CHis65卿LysggcGlyC3CHis3CCThrgeigGlu70g肌GluctgLeugtgValggcGlyeggArg75tggTrpctgiLeugccAlaILysageSer80240gccgcgAlaAlaeggArgeggArggagGlu85gacAspgtcValctgLeuctgLeugccAla903CCThr幼gLysgtcValggcGlygggGly95gacAsp288atgageMetSerg犯GlueggArg100etcLeu33CAsng3CAspggcGlyggcGly105ctgLeutegSergcgAlaeggArgC3CHis110ateliegtcVal336acggcctgcgagcagtcgctgeggcgcctgggcgtggaccacategac384ThrAlaCysGluGinSerLeuArgArgLeuGlyValAspHislieAsp115120125ctgtaccagatgcaccgcgtcgaccacgccgcgccgtgggacgagate432LeuTyrGinMetHisArgValAspHisAlaAlaProTrpAspGlulie130135140tggc恥gcgatggaccgtctggtggcg3gcggc朋ggtgacctacgtg480TrpGinAlaMetAspArgLeuValAlaSerGlyLysValThrTyrVal145150155160gggtcgtcgaacttcgccggctgg犯cgtcgccgccgcgcaggacgcg528GlySerSerAsnPheAlaGlyTrpAsnValAlaAlaAlaGinAspAla165170175gcceggeggcgccagtecetcggtctggtgtecgagcagtgcctgtac576AlaArgArgArgGinSerLeuGlyLeuValSerGluGinCysLeuTyr180185190aacctggcggtgcgccacgccgagctggaactgctgccggccgcccag624AsnLeuAlaValArgHisAlaGluLeuGluLeuLeuProAlaAlaGin195200205gcgtacggactgggcgtgttcgcctggtcgccgctgcacggcgggctg6了2AlaTyrGlyLeuGlyValPheAlaTrpSerProLeuHisGlyGlyLeu210215220etcageggggtgctgcgcaagetcgcggcgggcgtcgcggtg卿tcg720LeuSerGlyValLeuArgLysLeuAlaAlaGlyValAlaValLysSer225230235240gcacaggggegggcccagctgctgctgcccgagctgcgcgcgacgate768AlaGinGlyArgAlaGinLeuLeuLeuProGluLeuArgAlaThrlie245250255gaggcgtacgaggggttctgcggceggateggcgcggatccggccgag816GluAlaTyrGluGlyPheCysGlyArglieGlyAlaAspProAlaGlu260265270gtcggtctggcctgggtgctgteceggccggggateageggcgcggtg864ValGlyLeuAlaTrpValLeuSerArgProGlylieSerGlyAlaVal275280285atcggtccgcgcacggtggaccagctggacteggcgctgeggtecctg912lieGlyProArgThrValAspGinLeuAspSerAlaLeuArgSer匕eu290295300gacctggtcetcggggaggccgaactggccgagctggacgccatettc960AspLeuValLeuGlyGluAlaGluLeuAlaGluLeuAspAlaliePhe305310315320ccgcccctgggcaagggcggcegggcgccggacgcgtggateagetga1008ProProLeuGlyLysGlyGlyArgAlaProAspAlaTrplieSer325330335<210>75<211>335<212>PRT<213>生二素链霉菌<400>75ValSerThrAspArgGluGinAlaAlaHisThrArgLeuGlyArgSer151015AlaThrLeuValSerArgLeuTrpLeuGlyThrValAsnPheSerGly202530ArgValGluAspGlyAspAlaMetGinLeuMetGluAlaAlaValAsp354045ArgGlylieAsnCyslieAspThrAlaAsplieTyrGlyTrpArglie505560HisLysGlyHisThrGluGluLeuValGlyArgTrpLeuAlaLysSer65707580AlaAlaArgArgGluAspValLeuLeuAlaThrLysValGlyGlyAsp859095MetSerGluArgLeuAsnAspGlyGlyLeuSerAlaArgHislieVal100105110ThrAlaCysGluGinSerLeuArgArgLeuGlyValAspHislieAsp115120125LeuTyrGinMetHisArgValAspHisAlaAlaProTrpAspGlulie130135140TrpGinAlaMetAspArgLeuValAlaSerGlyLysValThrTyrVal145150155160GlySerSerAsnPheAlaGlyTrpAsnValAlaAlaAlaGinAspAla165170175AlaArgArgArgGinSerLeuGlyLeuValSerGluGinCysLeuTyr180185190AsnLeuAlaValArgHisAlaGluLeuGluLeuLeuProAlaAlaGin195200205AlaTyrGlyLeuGlyValPheAlaTrpSerProLeuHisGlyGlyLeu210215220LeuSerGlyValLeuArgLysLeuAlaAlaGlyValAlaValLysSer225230235240AlaGinGlyArgAlaGinLeuLeuLeuProGluLeuArgAlaThrlie245250255GluAlaTyrGluGlyPheCysGlyArglieGlyAlaAspProAlaGlu260265270ValGlyLeuAlaTrpValLeuSerArgProGlylieSerGlyAlaVal275280285lieGlyProArgThrValAspGinLeuAspSerAlaLeuArgSerLeu290295300AspLeuValLeuGlyGluAlaGluLeuAlaGluLeuAspAlaliePhe305310315320ProProLeuGlyLysGlyGlyArgAlaProAspAlaTrplieSer325330335<210>76<211>1233<212>DNA<213〉生二素链霉菌<220〉<221>CDS<222〉(1)..(1233)<400>76atgattgccaccgcgtgccgcgtctgcggcaacaaggagctgetctec48MetlieAlaThrAlaCysArgValCysGlyAsnLysGluLeuLeuSer151015gtaetcgacctgggcgaacaggcgetcaccggggtgttcccggccgac%ValLeuAspLeuGlyGluGinAlaLeuThrGlyValPheProAlaAsp202530cgcgacgaggtcgtgccgtcggtcccgctggaaetcgtcgcgtgttec144ArgAspGluValValProSerValProUuGluLeuValAlaCysSer354045ccggccggatgcggcetcgtgcaactgcgccacacccccgacccggac192ProAlaGlyCysGlyLeuValGinLeuArgHisThrProAspProAsp505560etcatgtacggcgagggctacggctaccgctcgggcateeggcccttc240LeuMetTyrGlyGluGlyTyrGlyTyrArgSerGlylieArgProPhe65707580atggtcgaccacctgcatggcaaggtcgccgccgtccgceggctggtg288MetValAspHisLeuHisGlyLysValAlaAlaValArgArgLeuVal859095gacetcggcccggacgacctggtcetcgacateggcageaacgacgcc336AspLeuGlyProAspAspLeuValLeuAsplieGlySerAsnAspAla100105110acgetcetcaagggctaccccgccgacggcccgcgactggtcggcate384ThrLeuLeuLysGlyTyrProAlaAspGlyProArgLeuValGlylie115120125gacccgaccggcggcstagttccgcgacctgtacccgccgaacgccgag432AspProThrGlyGlyLysPheArgAspLeuTyrProProAsnAlaGlu130135140ttggtcgtggactacttcacccgcgcgaccttcgagaaccgcttcggg480LeuValValAspTyrPheThrArgAlaThrPheGluAsnArgPheGly145150155160gcgeggAlaArgeggArggcgAlaaagLys165gccAlagtcVal3CCThrtecSeratelie170gcgAlaatgMetttcPhetacTyrgacAsp175ctgLeu528ccggacProAspccgProctgLeu180cgcArgttcPheatgMetageSergacAsp185gtcValcgcArggacAspgtcValetcLeu190gccAlagagGlu576gacggcAspGlygtcVal195tggTrp3tgMet3tgMetg站GluC3gGin200站cSertacTyrctgLeucccProgccAla2053tgMetetcLeug朋Glu624gccgacAlaAsp210gcgAlatacTyrg3CAspateliegtcVal215tgcCysC3CHisgagGluC3CHisctgLeu220g站GlutacTyrtacTyrgcgAla672ctgcgcLeuArg225cagGinateliegagGlutggTrp2303tgMetgcgAlag肌GlucgcArggtcVal235ggcGlyetcLeu3CCThrgtcValatelie240720egggccArgAlagagGluetcLeu3CCThr245gagGlugtgValtacTyrggcGlyggcGly250ageSerctgtgcCysgtcValacgThr255etcLeu768gccaggAlaArgsecThrggtGly260tecSereggArgcacHisccgProaggArg265gacAspgagGlugcgAlaggcGlyctgLeu270gccAlacgcArg816ateegglieArggccAla275gccAlagagGlugccAlagccAlagcgAla280GlyctgLeug3CAspggcGlyatgMet285gcaAlaccgProttcPhe864gaggccGluAla290ttcPhegccAlacgcArgcgcArggtcVal295gccAlaAspC3gGineggArggacAsp300gccAlactgLeucgcArgggcGly912ttcctgPheLeu305gacAspcgcArgtecSercgcArg310GingfagGluggcGlyctgLeuctgLeu3153CCThretcLeugggGlytacTyrggcGly320gcctecaceaagggcaacgtcateetccagtactgcgggateaccgaa1008<formula>formulaseeoriginaldocumentpage344</formula>65707580MetValAspHisLeuHisGlyLysValAlaAlaValArgArgLeuVal859095AspLeuGlyProAspAspLeuValLeuAsplieGlySerAsnAspAla100105110ThrLeuLeuLysGlyTyrProAlaAspGlyProArgLeuValGlylie115120125AspProThrGlyGlyLysPheArgAspLeuTyrProProAsnAlaGlu130135140LeuValValAspTyrPheThrArgAlaThrPheGluAsnArgPheGly145150155160AlaArgArgAlaLysAlaValThrSerlieAlaMetPheTyrAspLeu165170175ProAspProLeuArgPheMetSerAspValArgAspValLeuAlaGlu180185190AspGlyValTrpMetMetGluGinSerTyrLeuProAlaMetLeuGlu195200205AlaAspAlaTyrAsplieValCysHisGluHisLeuGluTyrTyrAla210215220LeuArgGinlieGluTrpMetAlaGluArgValGlyLeuThrVallie225230235240ArgAlaGluLeuThrGluValTyrGlyGlySerLeuCysValThrLeu245250255AlaArgThrGlySerArgHisProArgAspGluAlaGlyLeuAlaArg260265270lieArgAlaAlaGluAlaAlaAlaGlyLeuAspGlyMetAlaProPhe275280285GluAlaPheAlaArgArgValAlaAspGinArgAspAlaLeuArgGly290295300PheLeuAspArgSerArgGinGluGlyLeuLeuThrLeuGlyTyrGly305310315320AlaSerThrLysGlyAsnVallieLeuGinTyrCysGlylieThrGlu325330335ArgAspLeuProCyslieGlyGluValSerGluGluLysAlaGlyArg340345350PheThrProGlyThrGlylieProlieValSerGluGluAspAlaLys355360365AlaGinLysProAspGinLeuLeuValLeuProTrplieTyrArgAsp370375380GlyPheValGluArgGluArgGluPheLeuAspGlyGlyGlyArgLeu385390395ValPheProLeuProAlaLeuAspValVal405410400<210〉78<211〉1116<212〉DNA<213〉生二素链霉菌<220><221〉CDS<222〉(1)..(1116)<400〉78gtgcacegggacaacgccgccgagccgttggtcaaatgcctggtctgg48ValHisArgAspAsnAlaAlaGluProLeuValLysCysLeuValTrp151015gacctggacaacaccetctggcagggcaccetcetcgaggaggacgag96AspLeuAspAsnThrLeuTrpGinGlyThrLeuLeuGluGluAspGlu202530gtceggetcgccccggacgtcctgeggaccateaccgagctggacgcg144ValArgLeuAlaProAspValLeuArgThrlieThrGluLeuAspAla354045cgcggcatectgcaggcggtggccageaagaacgaccacgatcacgcc192ArgGlylieLeuGinAlaValAlaSerLysAsnAspHisAspHisAla505560tgggcga_agetcgaacagetcggcgtcgccgagtacttcgtgetcccg240TrpAlaLysLeuGluGinLeuGlyValAlaGluTyrPheValLeuPro65707580aggateggctggggcccgaagtegaagteggtccgcgagategccgac288ArglieGlyTrpGlyProLysSerLysSerValArgGlulieAlaAsp859095eggctgaacttcgcgccgageaccetcgccttcategacgaccagccc336ArgLeuAsnPheAlaProSerThrLeuAlaPhelieAspAspGinPro100105110ttcgasegggccg兆gtcaccC3cgaactgccgg邓gtccgc£icctsc384PheGluArgAlaGluValThrHisGluLeuProGluValArgThrTyr115120125gccgccgagcaggcgacceggctgaccggcetcccggagttcageccg432AlaAlaGluGinAlaThrArgLeuThrGlyLeuProGluPheSerPro130135140ggcaccgtcaccgtcgactegacccgccgccgctecatgtaccaggcg480GlyThrValThrValAspSerThrArgArgArgSerMetTyrGinAla145150155160tecttccgcegggacgccgageggtecgacttcaccggacccgacgcg528SerPheArgArgAspAlaGluArgSerAspPheThrGlyProAspAla165170175gacttcctgcgctegctggacateeggatgeggateagecgcgccacg576AspPheLeuArgSerLeuAsplieArgMetArglieSerArgAlaThr180185190cccctggagctgtegegggtcgaggaactgaccctgcgcaccagecag624ProLeuGluLeuSerArgValGluGluLeuThrLeuArgThrSerGin195200205atgaacgcca_ccggagtgcactactecgaggacgagctgcgcgccetc672MetAsnAlaThrGlyValHisTyrSerGluAspGluLeuArgAlaLeu210215220atcgacgaccccgaccacgaggtgctggtcaccaccgtcaccgatcgc720lieAspAspProAspHisGluValLeuValThrThrValThrAspArg225230235240ttcggtccctacggcgcggtcggcgtcgtgctgctgeggcgcggcccc768PheGlyProTyrGlyAlaValGlyValValLeuLeuArgArgGlyPro245250255gaggcctggeggateaagctgctggccacctegtgcegggtggtgteg816GluAlaTrpArglieLysLeuLeuAlaThrSerCysArgValValSer260265270ctgggggccggcacggtgatectgcgctggctgacggaccaggcgcac8frlLeuGlyAlaGlyThrVallieLeuArgTrpLeuThrAspGinAlaHis275280285egggccggggtgcacetcggagccgacttcegggccaccgaacgcaac912ArgAlaGlyValHisLeuGlyAlaAspPheArgAlaThrGluArgAsn290295300eggatgatggaagtggcctaccgcttcgccggattcaccgacgatccc960ArgMetMetGluValAlaTyrArgPheAlaGlyPheThrAspAspPro305310315320tgcccgtgccaggacgcctecgccgccaccggcgcgateggccgcctg1008CysProCysGinAspAlaSerAlaAlaThrGlyAlalieGlyArgLeu325330335cacctggtgccgtecccceggcccgcccccgacaccetccgtctggaa1056HisLeuValProSerProArgProAlaProAspThrLeuArgLeuGlu340345350getcccgacctggccacgggceggeggcgccccggccaggatcccgaa1104AlaProAspLeuAlaThrGlyArgArgArgProGlyGinAspProGlu355360365aggaccccatga1116ArgThrPro370〈210〉79<211〉371<212>PRT<213〉生二素链霉菌<400>79ValHisArgAspAsnAlaAlaGluProLeuValLysCysLeuValTrp151015AspLeuAspAsnThrLeuTrpGinGlyThrLeuLeuGluGluAspGlu202530ValArgLeuAlaProAspValLeuArgThrlieThrGluLeuAspAla354045ArgGlylieLeuGinAlaValAlaSerLysAsnAspHisAspHisAla505560TrpAlaLysLeuGluGinLeuGlyValAlaGluTyrPheValLeuPro65707580ArglieGlyTrpGlyProLysSerLysSerValArgGlulieAlaAsp85恥95ArgLeuAsnPheAlaProSerThrLeuAlaPhelieAspAspGinPro100105110PheGluArgAlaGluValThrHisGluLeuProGluValArgThrTyr115120125AlaAlaGluGinAlaThrArgLeuThrGlyLeuProGluPheSerPro130135140GlyThrValThrValAspSerThrArgArgArgSerMetTyrGinAla145150155160SerPheArgArgAspAlaGluArgSerAspPheThrGlyProAspAla165170175AspPheLeuArgSerLeuAsplieArgMetArglieSerArgAlaThr180185190ProLeuGluLeuSerArgValGluGluLeuThrLeuArgThrSerGin195200205MetAsnAlaThrGlyValHisTyrSerGluAspGluLeuArgAlaLeu210215220lieAspAspProAspHisGluValLeuValThrThrValThrAspArg225230235240PheGlyProTyrGlyAlaValGlyValValLeuLeuArgArgGlyPro245250255GluAlaTrpArglieLysLeuLeuAlaThrSerCysArgValValSer260265270LeuGlyAlaGlyThrVallieLeuArgTrpLeuThrAspGinAlaHis275280285ArgAlaGlyValHisLeuGlyAlaAspPheArgAlaThrGluArgAsn290295300ArgMetMetGluValAlaTyrArgPheAlaGlyPheThrAspAspPro305310315320CysProCysGinAspAlaSerAlaAlaThrGlyAlalieGlyArgLeu325330335HisLeuValProSerProArgProAlaProAspThrLeuArgLeuGlu340345350AlaProAspLeuAlaThrGlyArgArgArgProGlyGinAspProGlu355360365ArgThrPro370<210〉80<211>1122<212〉DNA<213>生二素链霉菌<220><221>CDS<222〉(1).(1122)〈400〉80gtggetgacaccteccacgccgacggcaccgaggccgaggagctgttc48ValAlaAspThrSerHisAlaAspGlyThrGluAlaGluGluLeuPhe151015accgcgctggtcggcgacegggcggccgagtgggaceggacgggcgag96ThrAlaLeuValGlyAspArgAlaAlaGluTrpAspArgThrGlyGlu202530ctgcccetcggcctgctgcacgacetcggcteceggggcctgctgtgc144LeuProLeuGlyLeuLeuHisAspLeuGlySerArgGlyLeuLeuCys354045gcacaggcgcccgcggtccacggcggcetcggctggaccageeggcgc192AlaGinAlaProAlaValHisGlyGlyLeuGlyTrpThrSerArgArg505560aacggcgaaetcaccgcgcacgtcggcgccetctgcagetegttgegg240AsnGlyGluLeuThrAlaHisValGlyAlaLeuCysSerSerLeuArg65707580agegtcatgacctegcagggcatggccgcctggacgctgcgceggetc288SerValMetThrSerGinGlyMetAlaAlaTrpThrLeuArgArgLeu859095gccggagcggaccagcaggcctecctggtgccceggttgaccggcggc336AlaGlyAlaAspGinGinAlaSerLeuValProArgLeuThrGlyGly100105110gaactggccgccgtggcgttcaccgaggccggcgccggcagegacctg384GluLeuAlaAlaValAlaPheThrGluAlaGlyAlaGlySerAspLeu115120125tecgccctgcgcacccgcateacctecgacggcgacgaagtcgtcgtc432SerAlaLeuArgThrArglieThrSerAspGlyAspGluValValVal130135140gacggcgtcaaggtgtgggcgaccaacgccgcgtacgcggacctgctg480AspGlyValLysValTrpAlaThrAsnAlaAlaTyrAlaAspUuLeu145150155160gtggtcttcggccgcacggagcagggcgcgggcgccgtcgtggtgccc528ValValPheGlyArgThrGluGinGlyAlaGlyAlaValValValPro165170175gcctcggcccccggcgtacgcgtcgagcgcateaccgacgcgcacggc576AlaSerAlaProGlyValArgValGluArglieThrAspAlaHisGly180185190tgccgcgcggccggacacgccgacatecacctggacggggtceggctg624CysArgAlaAlaGlyHisAlaAsplieHisLeuAspGlyValArgLeu195200205ccggcagacgccctgetccagggccacgaccgcacccccgccctgctg672ProAlaAspAlaLeuLeuGinGlyHisAspArgThrProAlaLeuLeu210215220gtcaccaccgcgctgagetacggceggatgtcggtggcctggggctec720ValThrThrAlaLeuSerTyrGlyArgMetSerValAlaTrpGlySer225230235240ctgggca_tcctgcgcgcctgcctggccgccgccgcacgtcacgccggc768LeuGlylieLeuArgAlaCysLeuAlaAlaAlaAlaArgHisAlaGly245250255ggaeggga_gcagttcggcacgeggetctcggaccaccagetcgtcgcc816GlyArgGluGinPheGlyThrArgLeuSerAspHisGinLeuValAla260265270eggcacetcgccgaactgttcgtcgccgaacagcacgccgccegggcg864ArgHisLeuAlaGluLeuPheValAlaGluGinHisAlaAlaArgAla275280285tgcgagcacgccagegcccagtgggacgagggcagecccgacatggtg912CysGluHisAlaSerAlaGinTrpAspGluGlySerProAspMetVal290295300gtcgccgccgtcctggccaagcacgtcgcggccaccggcgccgcacgc960ValAlaAlaValLeuAlaLysHisValAlaAlaThrGlyAlaAlaArg305310315320ggggccgaaegggccgtgcaggtgctggcgtcggccggggcgegggag1008GlyAlaGluArgAlaValGinValLeuAlaSerAlaGlyAlaArgGlu325330335ggacacgtcgtcgcaegggcgcaccgcgacgccaagetcatggagate1056GlyHisValValAlaArgAlaHisArgAspAlaLysLeuMetGlulie340345350ategagggclieGluGly355atgtecgcgMetSerAla370ageaacgagatetgcgaactggtcctggcceggcacgtg1104SerAsnGlulieCysGluLeuValLeuAlaArgHisVal360365gccgggtga1122AlaGly<210〉81<211>373<212>PRT<213〉生二素链霉菌<400>81ValAlaAspThrSerHisAlaAspGlyThrGluAlaGluGluLeuPhe151015ThrAlaLeuValGlyAspArgAlaAlaGluTrpAspArgThrGlyGlu202530LeuProLeuGlyLeuLeuHisAspLeuGlySerArgGlyLeuLeuCys354045AlaGinAlaProAlaValHisGlyGlyLeuGlyTrpThrSerArgArg505560AsnGlyGluLeuThrAlaHisValGlyAlaLeuCysSerSerLeuArg65707580SerValMetThrSerGinGlyMetAlaAlaTrpThrLeuArgArgLeu859095AlaGlyAlaAspGinGinAlaSerLeuValProArgLeuThrGlyGly100105110GluLeuAlaAlaValAlaPheThrGluAlaGlyAlaGlySerAspLeu115120125SerAlaLeuArgThrArglieThrSerAspGlyAspGluValValVal130135140AspGlyValLysValTrpAlaThrAsnAlaAlaTyrAlaAspLeuLeu145150155160ValValPheGlyArgThrGluGinGlyAlaGlyAlaValValValPro165170175AlaSerAlaProGlyValArgValGluArglieThrAspAlaHisGly180185190CysArgAlaAlaGlyHisAlaAsplieHisLeuAspGlyValArgLeu195200205ProAlaAspAlaLeuLeuGinGlyHisAspArgThrProAlaLeuLeu210215220ValThrThrAlaLeuSerTyrGlyArgMetSerValAlaTrpGlySer225230235240LeuGlylieLeuArgAlaCysLeuAlaAlaAlaAlaArgHisAlaGly245250255GlyArgGluGinPheGlyThrArgLeuSerAspHisGinLeuValAla260265270ArgHisLeuAlaGluLeuPheValAlaGluGinHisAlaAlaArgAla275280285CysGluHisAlaSerAlaGinTrpAspGluGlySerProAspMetVal290295300ValAlaAlaValLeuAlaLysHisValAlaAlaThrGlyAlaAlaArg305310315320GlyAlaGluArgAlaValGinValLeuAlaSerAlaGlyAlaArgGlu325330335GlyHisValValAlaArgAlaHisArgAspAlaLysLeuMetGlulie340345350lieGluGlySerAsnGlulieCysGluLeuValLeuAlaArgHisVal355360365MetSerAlaAlaGly370<210>82<211>312<212〉DNA<213〉生二素链霉菌<220〉<221〉CDS<222〉(1)..(312)<400〉82atgaccacgacgtccggtcggcccgaccccaccggcacgacccccacc48MetThrThrThrSerGlyArgProAspProThrGlyThrThrProThr151015gccgacgaggtcgccggggaactgetcgggttcetcgaggaccgcacc96AlaAspGluValAlaGlyGluLeuLeuGlyPheLeuGluAspArgThr202530aagaccacctgggagcgcgaccaggacctgttcgccgtcggcgggatg144LysThrThrTrpGluArgAspGinAspLeuPheAlaValGlyGlyMet354045tcctegctgttcgccatgcagctcgtcgtgcacctggagaagacctac192SerSerLeuPheAlaMetGinLeuValValHisLeuGluLysThrTyr505560ggcategtcateageggcgccgacctgatgetcgacaacttccgcacc240GlylieVallieSerGlyAlaAspLeuMetLeuAspAsnPheArgThr65707580gtcgacgcgatggtceggctggtcggaeggctggccgcgcccggcgag288ValAspAlaMetValArgLeuValGlyArgLeuAlaAlaProGlyGlu859095gcgaccgggcacgcaggtggctga312AlaThrGlyHisAlaGlyGly100<210>83<211>103<212>PRT<213>生二素链霉菌<400>83MetThrThrThrSerGlyArgProAspProThrGlyThrThrProThr151015AlaAspGluValAlaGlyGluLeuLeuGlyPheLeuGluAspArgThr202530LysThrThrTrpGluArgAspGinAspLeuPheAlaValGlyGlyMet354045SerSerLeuPheAlaMetGinLeuValValHisLeuGluLysThrTyr505560GlylieVallieSerGlyAlaAspLeuMetLeuAspAsnPheArgThr65707580ValAspAlaMetValArgLeuValGlyArgLeuAlaAlaProGlyGlu859095AlaThrGlyHisAlaGlyGly100<210>84<211>867<212〉DNA<213>生二素链霉菌<220〉<221>CDS<222>(1)..(867)<400>84gtgcccgattecaaggaaaattctccgetcgtcgtgetcggcgcgggc化ValProAspSerLysGluAsnSerProLeuValValLeuGlyAlaGly151015gtcatgggcacggccategcggcaetcgccgtcggacacgggcacccg96ValMetGlyThrAlalieAlaAlaLeuAlaValGlyHisGlyHisPro202530gtcacactggtcgacacctecgccggggcgcgcgcggccgcccccgac144ValThrLeuValAspThrSerAlaGlyAlaArgAlaAlaAlaProAsp354045gcggtcgcgctgcatctgeggacggcceggctgatgggcgcgctgccc192AlaValAlaLeuHisLeuArgThrAlaArgLeuMetGlyAlaLeuPro505560cacgaccgcccgcccggggagctgaccgtcgaggaggcgccggccgcc240HisAspArgProProGlyGluLeuThrValGluGluAlaProAlaAla65707580gtcgccaccgcgaccgccgtgategaggccgtcaccgaggaccccgag288ValAlaThrAlaThrAlaVallieGluAlaValThrGluAspProGlu859095eggaaggccgaggtgctggcggacctggcgtecgtggcgcgcccgggg336ArgLysAlaGluValLeuAlaAspLeuAlaSerValAlaArgProGly100105110acgctgetcgtcageaacacctegggcgtccccategacgagctggcc384ThrLeuLeuValSerAsnThrSerGlyValProlieAspGluLeuAla115120125gacgccgtcccccgccccgaggacetcgtcggcgtgcacttcatg肌c432AspAlaValProArgProGluAspLeuValGlyValHisPheMetAsn130135140cccgcgtacgtgatecccacggtcgaggtggtcetcggaccgcgcage480ProAlaTyrVallieProThrValGluValValLeuGlyProArgSer145150155160ggagaggcggccgccegggccaccegggacctgctgtecggcctgggc528GlyGluAlaAlaAlaArgAlaThrArgAspLeuLeuSerGlyUuGly165170175cgceggggcategtcgtcggcgacggcgccggcttcgtgaccagecgc576ArgArgGlylieValValGlyAspGlyAlaGlyPheValThrSerArg180185190ctgctgcaceggatgctgaacgacgccategcggtggtgcacgagggc624LeuLeuHisArgMetLeuAsnAspAlalieAlaValValHisGluGly195200205<formula>formulaseeoriginaldocumentpage358</formula><formula>formulaseeoriginaldocumentpage359</formula><211>1040<212〉腿<213>弗氏链霉菌(Str印tomycesfradiae)<400〉86ggcagg邓ccacccgtgacagggctgccgcggcccgccgtccgggtgccgttccacgatc60tgcgggacgtgcacgcggccscgggggtggcggcggcgcgctgctgcgcg120tcgccgcgcgcgggcgctatctgctgggtgccgaactcgccgcgttcgaggagcggttcg180ccgagtactgcggcaacgcccactgtgtcgccgtgggcagcgggctcgacgacgctcgtc240tggcgctgtgggcgctcggggtgggcg鄉gcgacgaggtgatcgtgccctcgcacacgt300tcatcgcgtcctggctcgcggtgtcggcgscgggtgccaccccggtgccggtcgagcccg360gtgatcccggcgagccggggcccggggcgttcctgctcgaCCCgg3CCggctggaggccg420cgctgaccccgcggaccagggccgtgatgcccgtgcatctctacgggcacccggtggatc480tggacccggtcggggcgttcgcggagccgcacgggctggccgtcgtggaggacgcggcgc540aggccacggcccgttaccgctcggcagcggccaccgcacggcgttcagct600tctacccggggaagaacctgggcgcgctcggcgacggcggtgccgtggtc660cgga^ctcgcggaccggctgcggctgttgcgca^ctscggcgcccgggagaagtaccggc720tcccgcctggggcggccgtgctgtcggtca780agctgccgtacctggacgcctgga^CELCCCgccgccgggagatcgccgcccgctacggcg840鄉cgctggccggtctgccgggcgtcaccgtgccggagggccgcgtggcggagccggtct900ggcatc3gtscgtgctgcgcsgcccgtaccgcgaccggttgcggcggcggctggccgagg960cgggggtggagaccctggtccactatccggtggccgtgcacgcgtcgggcgcgtacgcgg1020gcgcggggccgtgtcccgcc1040〈210〉87<211>388<212>PRT<213>弗氏链霉菌<400>87MetThrGly1LeuProArgProAlaValArgVal510ProPheHisAspLeu15ArgAspValHisAlaAlaThrGlyValGluSerGlulieGlyGlyAla202530LeuLeuArgValAlaAlaArgGlyArgTyrteuLeuGlyAlaGluCeu354045AlaAlaPheGluGluArgPheAlaGluTyrCysGlyAsnAlaHisCys505560ValAlaValGlySerGlyLeuAspAspAlaArgLeuAlaLeuTrpAla65707580LeuGlyValGlyGluGlyAspGluVallieValProSerHisThrPhe859095lieAlaSerT卬LeuAlaValSerAlaThrGlyAlaThrProValPro100105110ValGluProGlyAspProGlyGluProGlyProGlyAlaPheLeuLeu115120125AspProAspArgLeuGluAlaAlaLeuThrProArgThrArgAlaVal130135140MetProValHisLeuTyrGlyHisProValAspLeuAspProValGly145150155160AlaPheAlaGluProHisGlyLeuAlaValValGluAspAlaAlaGin165170175AlaThrAlaArgTyrArgGlyArgArglieGlySerGlyHisArgThr180185190AlaPheSerPheTyrProGlyLysAsnLeuGlyAlaLeuGlyAspGly195200205GlyAlaValValThrSerAspProGluLeuAlaAspArgLeuArgLeu210215220LeuArgAsnTyrGlyAlaArgGluLysTyrArgHisGluGluArgGly225230235240ThrAsnSerArgLeuAspGluLeuGinAlaAlaValLeuSerValLys245250255LeuProTyrLeuAspAlaTrpAsnThrArgArgArgGlulieAlaAla260265270ArgTyrGlyGluAlaLeuAlaGlyLeuProGlyValThrValProGlu275280285GlyArgValAlaGluProValTrpHisGinTyrValLeuArgSerPro2恥295300TyrArgAspArgLeuArgArgArgLeuAlaGluAlaGlyValGluThr305310315320LeuValHisTyrProValAlaValHisAlaSerGlyAlaTyrAlaGly325330335AlaGlyProCysProAlaGlyGlyLeuProArgAlaGluArgLeuAla340345350GlyGluValLeuSerLeuProlieGlyProHisLeuProAspGluAla355360365ValGluValVallieAlaAlaValGinSerAlaAlaLeuAspSerTrp370375380GluGluGlyPro385<210>88<211>271<212>PRT<213>生米卡链霉菌(Str印tomycesmycarofaciens)<400〉88MetSerProlieSerAlaSerAlaProAlaAlaSerArgSerThrAla151015ArgArgGluLeuGlyGinAsnPhePheArgSerAlaAlaAlaAlaCys202530ArgPheSerAspGinLeuAspAlaPheCysAlaAspLeuProGlySer354045LeuAlaAspValLeuThrValGlulieGlyAlaGlySerGlyArgVal505560ThrLysAlaLeuAlaSerAlaGlyArgSerLeuLeuAlaValGlulie65707580AspAlaTyrTrpAlaArgArgLeuThrAlaGluSerLeuProAspVal859095ThrValValAsnGluAspPheLeuAsnLeuGinLeuProArgGinPro100105110lieArgLeulieGlyAsnLeuProPheValSerGlyThrLyslieLeu115120125ArgArgCysLeuGluLeuGlyProAsnArgMetCysGinAlaValPhe130135140LeuLeuGinArgGluTyrValGlyLysArgThrGlyAlaTrpGlyGly145150155160AsnLeuPheAsnAlaGinTrpGluProTrpTyrThrPheGluGlyGly165170175LeuAlaPheSerArgAsnGluPheSerProValProArgAlaAspThr180185190GinThrLeuValValMetProArgArgArgProSerValProTrpArg195200205GluArgThrAspTyrGinArgPheThrGinGinliePheAspThrGly210215220GinMetThrlieGlyGluAlaAlaArgLysValLeuArgArgGlyHis225230235240AlaGinPheValArgSerAlaGlyValArgProAlaAspArgValLys245250255AspLeuThrValArgAspTrpAlaAlateuPheArgAlaAsnPro260265270<210>89<211>25<212>DNA<213〉人工序列<220〉<223>人工序列描述寡核苷酸SRMRl<400>89ctgccagtcctctcccagcagtacg25<210>90〈211〉25<212>DNA<213〉人工序列<220><223>人工序列描述寡核苷酸SRMR2<400>90tgaagctggacgtctcctacgtcgg25<210>91<211〉2755<212>DNA<213>人工序列<220〉<223〉人工序列描述可切除盒〈400〉91gatatctacctcttcgtcccgaagcaacttgggtgggcgc"tcgaccttgggccagtgtgc60ttctcacctgcggcgccagtccatgggtgctcgcggttgtccgccgctgtgcgctggcgt120tgtcacgcagttagacactcaccttcccacgggcggtgtcgtBgggCtCggctaagttgc180ccgcatgactgacagggatccctcgagaagctttatgcttgtaaaccgttttgtgaaaaa240at1111aaaat已aaaaaggggacctctagggtccccaa/ttaattagtaat300犯aggtcattcaa犯ggtc3tccaccggatcaattcccctgctcgcgcaggctgggtgcc360aagctctcggggcccgatccttggagcccttgccctcccgca_cga_tgatc420gtgccgtgatcga肌tccagatccttgacccgcagttgcaaaccctcactg已tccgtaat480gtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatg540ttgtgtgg犯ttgtgagcggcacacaggaa£icagctatga_ccatgattac600gccaagctgcggtggcgtacaccgtcgcctcggtcggcccgt卿gattggcgatcccga660ccgcagcaccaccgagaacgtccccgacgtggccgaccagcccgtcatcgtcaacgcctg720accgcggtgcggacaggccgtgtcgcgaccggccgtgcggaattaagccggcccgtaccc780tgtg肌tagaggtccgctgtgacacaagaatccctgttacttctcgaccg840gatgattcctacgcgagcctgcggaacgaccaggaattctgggsgccgctggcccgccga900gccct卿ggagctcgggctgccggtgccgccggtgctgcgggtgcccggcgagagcacc960肌ccccgtactggtcggcgagcccgacccggtgatca兆ctgttcggcgagcactggtgc1020ggtccggagagcctcgcgtcggagtcggsggcgtacgcggtcctggcggacgccccggtg1080ccggtgccccgcctcctcggccgcggcgeigctgcggcccggcaccggagcctggccgtgg1140ccctacctggtgstgagccggatgaccggcaccacctggcggtccgcgatgg3CggC3Cg1200accgaccggaacgcgctgctcgccctggcccgcgaactcggccgggtgctcggccggctg1260cacagggtgccgctgaccgggaacaccgtgctcaccccccattccgaggtcttcccgg犯1320ctgctgcgggaacgccgcgcggcgaccgtcgaggaccaccgcgggtggggctacctctcg1380ccccggctgctggaccgcctgg鄉actggctgccggscgtggacacgctgctggccggc1440cgcgaaccccggttcgtccacggcgacctgcacgggaccaacatcttcgtggacctggcc1500gcgaccgaggtcaccgggatcgtcgacttcaccgacgtctatgcggg卿ctcccgctac1560agcctggtgcaactgcatctcaacgccttccggggcgaccgcgagatcctggccgcgctg1620ctcgacggggcgcsgtgg犯gcggaccgaggacttcgcccgcg肌ctgctcgccttcacc1680ttcctgcacgacttcgaggtgttcg郷agaccccgctggatctctccggcttcaccgat1740ccggagg犯ctggcgc兆ttcctctgggggccgccggacaccgcccccggcgcctgacgc1800cccgggccgcccggcgccgcccccggcccccggcggccgcccggagccccgcccgcgctc1860ggg兆ccccgggcccgcgccgaagcccgctgctgcgagcccggagcgggccggccgacgg1920cggtgcgggcccggcggcggacgctcagcagcggcgggcgtgaaaggccctggcatcctc1980gatcatctcctccagggtggtcggccgagcttccatcccagctcggcaaggatcgatccg2040cgcagatcagttggaagaatttgtccactacgtga卿gcgagatcacca哪tagtcgg2100gttcaagccgacgccgcttcgcggcgcggctt犯ctcaag2160cgttagatgcacta^gcacat犯ttgctcacagccaaactatcaggtcaagtctgctttt2220attatttttaagcgtgcata3t肌gccctacac犯attgggagatatatcatgaaaggct2280ggctttttcttgttatcgcaa^gt犯tcgc肌catccgca11aaaatcta2340gcgagggctttactaagctgatccggtggatgaccttttgaatgaccttt2400attactaatt肌ttggggaccctagaggtcccctttttta1111aaaaattttttcacaa2460aacggtttaccttgttaacagatctcccggctcgtcggacactccggtac2520ggccgtgactaccgg肌gcagatccggcccgtcatccagaccggcgctgt2580ggtcatggacggcatcttcaagcggggtccggcgcgatagtcacgcagatagacacgcac2640Cgt犯Cgtt3cggtctgcctcacctggtgtttctctgtcg2700gggtggcgggatttgaacccacgacctcttcgtcccgaacg犯gcgcgcg2755〈210〉92<211>2208<212〉DNA<213>人工序列<220〉<223〉人工序列描述—可切除盒〈400〉92gatatcgcgcgcgcttcgttcgggacg卿aggtcgtgggttcaaatcccgccaccccga60cagaga肌caccaggtgaggcagaccgtaacgttacggtctgcctcacctgttttctgtg120cgtgtctatctgcgtgactatcgcgccggaccccgcttgsagatgccgtccatgaccaca180gcgccggtctggatgacgggccggatctgcttccggta_ga_cctcctcagtcacggccgta240ccggagtgtccgacgagccgggagatctgttaacaagctttatgcttgtaaaccgttttg300tgaaaaaatttttaaaataactctagggtccccaattaat360atctattaaaggtcattcaaaaggtcatccaccggatc犯ttcccctgctcgcgcaggct420gggtgccaagctctcgggtaacatcaaggcccgatccttggagcccttgccctcccgcac480gatgatcgtgccgtgatcgaaatccagatccttgacccgcagttgcaaaccctcactgat540ccggctcacggtasctgatgccgtatttgcagtaccagcgtacggcccacagaatgatgt600cacgctgaaaatgccggcctttgaatgggttcatgtgcagctccatcagcaaaaggggat660tcaccaccgactatttgcaacagtgccgttgatcgtgctatgatcgactg720atgtcatcagcggtggagtgcaatgtcgtgggcgaaaagccgagctcatc780ggtcagcttctc犯ccttggggttacccccggcggtgtgctgctggtccacagctccttc840cgtagcgtccggcccctcga卿tgggccacttggactgatcgaggccctgcgtgctgcg900ctgggtccggg鄉gacgctcgtcatgccctcgtggtcaggtctggacgacgagccgttc960gatcctgccacgtcgcccgttacaccggaccttggagttgtctctgacacsttctggcgc1020ctgccaaatgta犯gcgcagcgccca_tccatttgcctttgcggcagcggggccacaggca1080gagcagatcatctctgatccattgcccctgccacctcactcgcctgcaagcccggtcgcc1140cgtgtccatga_actcgatgggcaggtacttctcctcggcgtgccaacacg1200acgctgcatcttgccgagttgatggca卿gttccctatggggtgccgagacactgcacc1260attcttcaggatggcaagttggtacgcgtcgattatctcgagaatgaccactgctgtgag1320cgctttgccttggcggacaggtggctcaaggagaagagccttcag肌ggaaggtccagtc1380ggtc已tgcctttgctcggttgatccgctcccgcgacattgtggcgacagccctgggtcaa1440ctgggccgagatccgttgatcttcctgcatccgcc卿gggcgggatgcgaagaatgcga1500tgccgctcgccagtcgattggctga_gctca_tg兆cgg卿acgagatgacgttgg兆ggg1560caaggtcgcgctgattgctggggcaacacgtgaaaggcgagatcacc犯ggtagtcggca1620a^t肌tgtctaacaattcgttcaagccgacgccgcttcgcggcgcggctt犯ctcaagcg1680ttagatgcacta^gcacataattgctcacagccaaactatcaggtcaagtctgcttttat1740tetttttaagcgtgcataataagccctacacaaattgggagatatatcatga卿gctgg1800ctttttcttgttatcgcaatagttggcgaagtaatcgc肌catccgcatt1860gagggctttactaagctgatccggtggatgaccttttgaatgacctttaa1920ttggggaccctagaggtccccttttttatttttcacaaaa1980cggtttacaagcat犯agcttctcg鄉gatccctgtcagtC3tgCgggCaacttagccg2040agccctacgacaccgcccgtgtgtctaactgCgtgaC33Cgccagcgcac2100agcggcggacaaccgcgagcacccatggactggcgccgcaggtg卿agcacactggccc2160aaggtcgagcgccceiccca^gttgcttcgggagg2208<210〉93<211〉60<212>DNA<213>人工序列<220><223〉人工序列描述:寡核苷酸0RF2A<■>93cccgcgcggcagcctctccgtgatcgagtccggcgtgaccatcgcgcgcgcttcgttcgg60<210>94<211>60<212>DNA<213〉人工序列<220><223〉人工序列描述寡核苷酸0RF2B<400>94gctccgtgcgtcatgcaggaaggtgtcgtagtcgcggtagatctgcctcttcgtcccgaa60<210〉95<211>35<212>DNA<213〉人工序列<220><223>人工序列描述瘢痕att3<400>95atcgcgcgcgcttcgttcgggacgaagaggtagat35<210>96<211〉59<212>DNA<213〉人工序列<220>〈223〉人工序列描述寡核苷酸EDR8<400>恥cgggatgatcgcttgtccggcggccggatgcctagcctcatcgcgcgcgcttcgttcgg59<210〉97<211〉60<212〉DNA<213〉人工序列<220〉〈223〉人工序列描述寡核苷酸EDR9<400>97cccgatccagaacgtctggtcggtgatcaggtcgctgttcatctgcctcttcgtcccgaa60<210>98<211〉60<212〉DNA<213〉人工序列<220〉<223〉人工序列描述寡核苷酸EDR3<400>98accggggcggtcctcccctccggggcgtcacggccgcggaatctgcctcttcgtcccgaa60〈210〉99<211〉60<212>DNA〈213>人工序列<220><223>人工序列描述寡核苷酸EDR4<400>99cacgcagcgagccgacgcactgatggacgacacgatggccatcgcgcgcgcttcgttcgg60<210〉100<211>60<212>DNA〈213〉人工序列<220〉<223>人工序列描述寡核苷酸EDR5<400>100gggcgtgaagcgggcgagtgtggatgtcatgcgagtactcatcgcgcgcgcttcgttcgg60〈210〉101<211>60<212>DNA<213〉人工序列<220>〈223〉人工序列描述寡核苷酸EDR6<400>101cgggaaacggcgtcgcactcctcgggggccgcgtcagcccatctgcctcttcgtcccgaa60<210>102<211>26<212〉DNA<213〉人工序列<220〉<223〉人工序列描述寡核苷酸C9583<400〉102ctgcaggtgctccagcgcgtcgatct26<210>103<211〉26<212〉DNA<213>人工序列<220〉<223>人工序列描述寡核苷酸C9584<400>103ctgcagacggaggcggacctgcggct26<210>104<21D33<212>腿<213〉人工序列<220〉〈223〉人工序列描述瘢痕attl<400>104atcgcgcgcttcgttcgggacgaagaggtagat33<210〉105<211>34<212>DNA<213>人工序列<220><223>人工序列描述瘢痕att2<400>105atcggcgcgcttxgttcgggacgaagaggtagat34<210>106<211〉10325<212>DNA<213>生二素链霉菌<400〉106ctgcag鄉gcgccgacgtgcgcggtgagttcgccgttgcgccggctggtccagccg鄉60ccgccgtggaccgcgggcgcctgtgcgcacagcaggccccggg观ccg3ggtcgtgcagc120aggccgaggggcagctcgcccgtccggtcccactcggccgcccggtcgccgaccagcgcg180gtgaacagctcctcggcctcggtgccgtcggcgtgggaggtgtcagccacctgcgtgccc240ggtcgcctcgccgggcgcggccagccgtccgaccagccggaccatcgcgtcgacggtgcg300g卿ttgtcgagcatcaggtcggcgccgctgatgacgatgccgtaggtcttctccaggtg360C3cga^cg兆ctgcatggcgacatcccgccgacggcgaacaggtcctggtc420gcgctcccaggtggtcttggtgcggtcctcgaggaacccgagcagttccccggcgacctc480gtcggcggtgggggtcgtgccggtggggtcgggccgaccggacgtcgtggtcatcgcgtg540gcctcctggttccccggccgctcttgcggccgagcaggccctggcggacc600ttgtccagca_gcagctcgctcgggcgg柳gccggatcgccggtccgttcgtgcatcacc660cgcagcgagtcggcc鄉ttgtCCELgtCCgatc柳tcggccgtggccaggggtccggtg720cggtggccgatgcagtcgcgcatcagcgcgtccacggtctccggggtggcccggccctcg780tgcaccaccgcgatggcgtcgttcagcatccggtgcagcaggcggctggtcacgaagccg840gcgccgtcgccgacgacgatgccccggcggcccaggccggacagcaggtcccgggtggcc900cgggcggccgcctctccgctgcgcggtccgaggaccacctcgaccgtggggatcacgtac960gcggggttcatgaagtgcacgCCgELCg3ggtcctcggggcgggggacggcgtcggccagc1020tcgtcgatgggg3CgCCCg3ggtgttgctg3c哪cagcgtccccgggcgcgccacggac画gccaggtccgccagcacctcggccttccgctcggggtcctcggtgacggcctcgatcacg1140gcggtcgcggtggcgacggcggccggcgcctcctcgacggtcagctccccgggcgggcgg1200tcgtggggcagcgcgcccatcagccgggccgtccgcagatgcagcgcgaccgcgtcgggg1260gcggccgcgcgcgccccggcaccagtgtg3ccgggtgcccgtgtccgacg簡gcgagtgccgcgatggccgtgcccatgacgcccgcgccgagcacgacgagcggag肌ttt1380tccttggaatcgggcacggatcctccagaatcccgggggcggcggctgtgcg肌atgctg1440tcccgaatcgcttccgcgctccatcacccgggcgtgactttgtcacctagc犯gcggtgg函gaggccgggcgg柳ctatgtcatctcggccttgtccgcttacgeigttccgtccttaaag1560tgcgcccggcgaacgc3cggcggaattgactcgccgtccgtcaaggacccgcggttcgaa1620ggacctcgacgC3tg卿ggtttcacatggctcatatcgcattcttcatccttccggttg1680ccgggcatgtgaatccgaccctgggagtcgccgaggaactggtcgcgcgcggccaccggg1740tgacgttcgcgctgtccgaggacctcgccgagcgggcccggctgatcggcgccgaggtgg1800tcacctatccggtgg織ggcaacggttccggtgccgcggcaggacgcgg1860acgagtacacggacg鄉acgagttcgtccgggtcctggagtggctgctg1920tgcagaccatggaaccgctggagaggcacttcgccggggaccggcccgacgtcgtcgtca1980acgatccgtcgtcgctgtggetcgggacggctgctggcggaccggtggggcatcccggtca2040tccgcagcactccgacctatgccgccaacgaacactggtcgctgcatccgccggtcgact2100cggccgagccgccggacgaccccgagctgcacaagctgctcgcgcggatcgagcggctgc2160gggcgtcgagcacgacctggccggcttcaccggggtcctgcacggcggtc2220cggccctgctgtacatgccccgctcgttccagtacgcgggcgagaccttcgacgcacagc2280accacttcgtcggcccctgcccgccccgcaccgcgttccacggcgagtgg郷ccggggg2340acgacgacggccggcccctggtgctggtgagtctcggaaccctgtacaacgaccggccgg2400acttcttccgcacctgcctggaggcgttcggcgacgagccctggaacgtgcttctggtgc2460tgggcggcggggtgcccgcggccgacctgggcccgcttcccggcaatgtccgggtgaccg2520acttcgtgtcgctgcgcgacgtcctgccgcacacggcggtggtggtg咖cacggtggga2580tgagcaccgccatggaggtgttctcgcacggtgtgccggtggtgg.cgatcccggtgatgc2640cggagccccgggccaccgcgcggcggatcgtcg咖tgggcctgggcgsccagctgctga2700actcggagctgacggccg已gtccctgcgtgCCELCggtaCggcgggtgctggcggactccg2760cgatcccggggaacalgcgcgggttccgggagc已gatcagggcggccggcggggcgcccg2820cggcggccgacgcgatcgagggactgctgccccgggtgggctgagacgtccgcgcccgac2880acgcgttcaccttccgaacggcgggatcgccccatgctcatcaccgaaaicagcagtgccc2940gacgtgttccgcatcgatccggaaccgctgccggaccaccggggccggttctacgaagcg3000gtgcgccgcgggccgctggaggccgccgtcgggcactcggtcgaggtccggcaggtccac3060tgcaccgtctccgggcgc犯cgtactgcgcggcctgcacgccaccaccctgccgccgggc3120caggccaagatcctcacctgtgtgcggggtgcggcgctgactatggtggt3180gtcgggtcaccgggcttcggacggtacgaggcggtgcggcaggatgccccgtcgggcacc3240gcgctctacctgccggacggcatcggcctgggctacgtggccctcgcggacgacacatgc3300Stg肌Ct3CCtgtgcaccgaggagtacgtcccgggcatggtcatcgacgtggacgccctg3360gaccccga^ctcggcctgccgtggggactgaccggggatcccgtccgctccgcccgggac3420gcggcggcgccgtccctgcgggcggccgcggcggcggg肌ttctgcccacgtacgaggac3480tgcttacgggtgcgcacgtccgtgcccgcccctcccgaccggactcggctctgacgcgac3540ggacacgaccgccgcgcatccgacgcgaatccgacgcg犯tccgaactcgatttcccgaa3600CCgtgg3Cggagcgcgtccnnrmnnnrmnnnnnnrmrmnnnnnnnnnnnnnnnnnnnnnn3660rmnnrmnrmnnnnrmrmnrmnrmrmnnrmnnnnnnnnnnnnrmnrmnrmnnnnnrmnnnn3720rmnnnnnrmnnnnnnnnrmnnnnnnnrmnnrmrmnrmnminnnrmnrmnnnnnnnrmrmn3780nnnnrmnrmnnnnrmrmnnnnnnnnnnnnnnrmrinnrmrmnnrmnrmnrmrmnrmnnrirm3840nnrmnrmrmnnnnnnrmnnnnrmnnrmrmnrnmnnnrmnnrmnnnnnrmnnnnnnrmnnn3900rmnnnnnnnnrmnrmrmnrmrmnnmirmnnnnrmnnnrmnnnnrmnrmrmnrmnnrmnnn3960nnn皿rmnrmnrmnnrmnrmnnrmnnnmmnnnrmnn皿nnnnnnrmnnnnrmrmnnnnn4020nrmrmnnrmnrmnnnnnnrmnnnnrmnrmnnnrmrmrmrmnnrmnnminccgccax:3ccc4080cccagcagcgtcagcgtccgcctcgggacca_cacccggcagggggtgcggggcg4140acgaggctgagggagccccgcaactccacggggcggctcaaccgcttgagctgctccatc4200肌ctgctgggccgaggtggtccccgtgtggtggtccaccgggccgcggccgctcgccgag4260gccagccggaggttcccgcccacccgcsccatg幼gggcaggcccgcgagaccgagccct4320cgcaccagtcgtggcagcacggccgcgcgtgcgtccatcaccacggggcgggcc卿gag4380cggttggcctg,ggcttcggccaccaggcggacgatgttctcctcctcaccgggtgcg4440ccggggtgccggggtgtgccctccccgctccggccgccgcccagcgtcaggcgccagctg4500accggggcggccgtcgtgcccg兆gccagccacagcccgtgactctgctggcagctcacc4560acccggcccaggtcgg卿cg卿cgccggctcaccccgacggagcgcacccccgccttg4620gagaccaccatcggccagatcacccaggcgtcgggggtcagcctgtcgtccacgtagcgg4680gccagcgcggcccgcacctcgccccagtcccaggtcgacccggcgacgaagtggtgcagg4740ctctgttccgccgcgccctctccgacg犯ggcggcgaggttccgggcggtcttgcgtccc4800tgtgccgtgagcagcccgcgtatgtactgctcacctcttctgcgctggtccgcccggcgg4860agcg肌ccg己gtaactccgcacatgcgtcgg卿cgagcg邓tcgaagtcgtgccgcgcg4920gcgggacccacggggggcgccgcgccggcgggtcg卿cgtgcgt卿gtcataggagtc4980ctcgtgggggcctcgtcatc£LCtgCgagtggactgcgaccagcatcgccaattcacccgt5040tgctccccaggt濃ccgggcacactcgttccgcttcgctcccccggcggcacggcccgc5100ctccccgctctccggacggtgggggggaagCCC3CCgC3Cgcgcgccggt5160agcggtgccggggccccaca3cccctcaccgacggggtccgttcgaccacatgccgtgst5220gatgccttcgccgcacggcctccttgaatgacggaccgtcagaaagacgtcactccgcgc5280gcgcccgctcccgccccgaccccgcccggccgccgtcccgcccccgcgaccctgtgggcc5340gacgccctcttgacggacccggMtCCCgggccgcgggacggaactcgat5400gccgc犯鄉ttccgcgtcctcaccggcacCtCCg兆3tCcagcgcascggcatcgccaa5460gctcctggctttccaccactgagccgcaccccctggcgagcagatccgggacaagacgcc5520accttcgcgacagtgtttaggt犯aga^ttccgcgagcggattgccaggg5580attgacgcgcaccggtgcagcggccacattgacggcacctgtcaagttcEL5640cccccagggLgcttggaatcccatgcaggcaattcggcatcacgtcatgctcgtcatggcc5700ttcgtgaccgtcgccacgactttccttctctggccgtcgacgcaatccgcgcaagcgttt5760CCCCCg3CCCggtactga^ccacctccgcgccatttccgg5820gtctccggac£igC£Lca_a_c33ggagcccgcctccgccccgggccagtacacccagcaggtc5880aaggacgtcaccgggcagtaccccggcctgtggggcggtgacctgatgttcgccgcggcg5940gacgtggccggccgccagcgcgtcgtcgacC3ggCC3gg3ccgagtgggcg肌cggatcg6000ctggtctcgctcacctggcacgtctgcccgccgaccggcggcagcacctgtgcgttcgag6060ggcggcgtcaagtccacgctg3Cg33CgCgcagttctcgcaggtcctcacgg3gggC3gt6120gccctgaacagCgC3tgg犯gcggcgcctggacgaggtcgtcccgtacctgcagcagctg6180g卿acgcgggcgtccccgtcctcttccggccgctgcacgagatgaacgaatcctggaac6240tggtgggg3aaccggcccggagcgaacggcagcgcacgcctctaccagatcacccgcgat6300cacctcgccgggacg肌agggctggacaatctgatctgggtctggaacgtccaggacaat6360ccggcgggaaactggaacagctactatccggg卿tcagtacgtggacgtcgtttcgctg6420gacgtctggtcccgagttccgccgactaccgagcatcgcg6480ccatggccctcgcggagctgggcaaastgccgaccgccgcgctgctggac6540agccagacgcggtggacatggttcatgatgtggtccg.atctgcgcggg肌c肌ttcc6600aacgccgaaatacagacggcgtatttccacccccgtgtactg咖cagggggaggtcgca6660ctgccctgacgctcggcgctgcccggctctctcacgcgcgttctgacaggacgtcgcgga6720gsgtgcggggcaagcggccggtgagctgggcgcagtcgtcgcggacccgatcccagcgct6780gttcgcgtaccgaggcgaacaggcgt卿gccaccagggatccaggccgg6840tcgccgctgtttcggcagagtacgtgtcggccgggatgtccacgtaggcgaccggtgtcc6900gccacacctccgccgccgtgg鄉cgatgcctgccaggtccgtcgactcgggtcccgtga6960tgtcgtggtgacggccggtcggcccgcccaccgcgagggcggcg邓ggcgcgggccacgt7020cgtcgcgcgccaccagggacacccggccatcggctgccggcagcctcagcagcccggtcg7080agcgcgcctgggtgagccagcctaggaagaactcgatgtacagcgaggccctggcg肌cg7140agcacggcacgccggaggcg3gcagc3g已tcctcggtgagccggttgacgacggcgtagc7200ag匿ggggaggccgagtcggcgtcgacgctgctcagtgccgcgacatggccgacgcgct7260cggccaccacggcggcgacg3CgttgCggtggtgC3gC兆cacccgtgcgtcgggcccgt7320cgctgg聊cgtgtccacgcccttcagcgccgcacgcagagcgggcgggt7380cggcgtagtcggcgscggcgC3CtCC3CCCccggcggtagtgcctcggcaggcagcttcc7440gcctggtcatcgccacgacgtccacgtcggcccggtccgcgagcagctgc3CC3CCCgCC7500tgcccagactgcccgccgcccctgtcaccgcgatacgcatcgtcgcccccgtcgccttgt7560cgtcggtcgtaccaccgtagggggccaaccgcgaccagggcttggaacgagccggcccgc7620cagggcacagacgcgcgatcggtccggtUtcccgtgctcttttggaccgggacgccgga7680ccgcttcctttCtELCggtggagccgttcccgcccgagcccgcacgtcatcgacgtgcggg7740gtgataccgatgctccgacgccgtctcggagggccgtcaggccccctcgt7800cagtgccctgtgcctgggcgcgatgcccttcggcaccaccgtcgacg卿agacgtcctt7860cgccatcctcgaccggttcgtcgaggccggcggcagtctcgtcgacaccgccgacaacta7920cgcgttctgggctcccggcgggaccggggaCg卿gCg3gaacaccgtcgggcgctggct7980ggcgagccgccgccgccgcg3Cg鄉tggtgatctccaccCCCgCCCC3C8040cgtccccggcagcggcctggagaccgccgaagggctgtcggctcccgtcat3Cgg肌ggC8100cgcggaggacagcctgcgacgcctgggcaccgatcgcatcgatctgtactggacccacat8160cgaggaccggaccgtccctct卿ggagacgctcggagctctcgacgagctggtcggcgg8220cggcaaggtggcggtgctgggctgctccaaccacgcgggctggcgcatcg縦gggcccg8280cgcgctcgcccggacc犯cggctggscggcgtacacctgcgtccagcagcgctactccta8340<formula>formulaseeoriginaldocumentpage374</formula>〈400〉107atggetcatategcattcttcatecttccggttgccgggcatgtgaat48MetAlaHislieAlaPhePhelieLeuProValAlaGlyHisValAsn151015ccgaccctgggagtcgccgagg肌ctggtcgcgcgcggccacegggtg96ProThrLeuGlyValAlaGluGluLeuValAlaArgGlyHisArgVal202530acgttcgcgctgtecgaggacetcgccgagegggcceggctgateggc144ThrPheAlaLeuSerGluAspLeuAlaGluArgAlaArgLeulieGly354045gccgaggtggtcacctatccggtggacaggcaaeggttcctggaccag192AlaGluValValThrTyrProValAspArgGinArgPheLeuAspGin505560atggtgccgeggcaggacgcggacgagtacacggacgaggacgagttc240MetValProArgGinAspAlaAspGluTyrThrAspGluAspGluPhe65707580gtcegggtcctggagtggctgctggacatgacggtgcagaccatggaa288ValArgValLeuGluTrpLeuLeuAspMetThrValGinThrMetGlu859095ccgctggagaggcacttcgccggggaceggcccgacgtcgtcgtcaac336ProLeuGluArgHisPheAlaGlyAspArgProAspValValValAsn100105110gatccgtcgtcgctgtggacgggaeggctgctggcggaceggtggggc384AspProSerSerLeuTrpThrGlyArgLeuLeuAlaAspArgTrpGly115120125ateccggtcatecgcageactccgacctatgccgccaacg犯cactgg432lieProVallieArgSerThrProThrTyrAlaAlaAsnGluHisTrp130135140tcgctgcatccgccggtcgactcggccgagccgccggacgaccccgag480SerLeuHisProProValAspSerAlaGluProProAspAspProGlu145150155160ctgcacaagctgetcgcgeggategageggctgctggaggagcagggc528LeuHisLysLeuLeuAlaArglieGluArgLeuLeuGluGluGinGly165170175gtcgagcacgacctggccggcttcaccggggtcctgcacggcggtccg576ValGluHisAspLeuAlaGlyPheThrGlyValLeuHisGlyGlyPro180185190gccctgctgtacatgccccgctegttccagtacgcgggcgagaccttc624AlaLeuLeuTyrMetProArgSerPheGinTyrAlaGlyGluThrPhe195200205gacgcacagcaccacttcgtcggcccctgcccgccccgcaccgcgttc672AspAlaGinHisHisPheValGlyProCysProProArgThrAlaPhe210215220cacggcgagtggaggccgggggacgacgacggceggcccctggtgctg720HisGlyGluTrpArgProGlyAspAspAspGlyArgProLeuValLeu225230235240gtgagtetcggaaccctgtacaacgaceggccggacttcttccgcacc768ValSerLeuGlyThrLeuTyrAsnAspArgProAspPhePheArgThr245250255tgcctggaggcgttcggcgacgagccctggaacgtgcttctggtgctg816CysLeuGluAlaPheGlyAspGluProTrpAsnValLeuLeuValLeu260265270ggcggcggggtgcccgcggccgacctgggcccgcttcccggcaatgtc864GlyGlyGlyValProAlaAlaAspLeuGlyProLeuProGlyAsnVal275280285egggtgaccgacttcgtgtegctgcgcgacgtcctgccgcacacggcg912ArgValThrAspPheValSerLeuArgAspValLeuProHisThrAla290295300gtggtggtgaaccacggtgggatgageaccgccatggaggtgttcteg960ValValValAsnHisGlyGlyMetSerThrAlaMetGluValPheSer305310315320cacggtgtgccggtggtggcgateccggtgatgccggag,cccegggcc1008HisGlyValProValValAlalieProValMetProGluProArgAla325330335accgcgeggeggategtcgaactgggcctgggcgaccagctgctgaac1056ThrAlaArgArglieValGluLeuGlyLeuGlyAspGinLeuLeuAsn340345350tcggagctgacggccgagtecctgcgtgccacggtaeggegggtgctgSerGluLeuThrAlaGluSerLeuArgAlaThrValArgArgValLeu3553603651104gcggactecgcgateccggggaacatgcgcgggttcegggagcagateAlaAspSerAlalieProGlyAsnMetArgGlyPheArgGluGinlie3703753801152agggcggccggcggggcgcccgcggcggccgacgcgategagggactg1200ArgAlaAlaGlyGlyAlaProAlaAlaAlaAspAlalieGluGlyLeu385390395400ctgLeucccProeggArggtgValggcGly405tg31218<210〉108<211〉405<212〉PRT<213〉生二素链霉菌<400>108MetAlaHislieAlaPhePhelieLeuProValAlaGlyHisValAsn151015ProThrLeuGlyValAlaGluGluLeuValAlaArgGlyHisArgVal202530ThrPheAlaLeuSerGluAspLeuAlaGluArgAlaArgLeulieGly354045AlaGluValValThrTyrProValAspArgGinArgPheLeuAspGin505560MetValProArgGinAspAlaAspGluTyrThrAspGluAspGluPhe65707580ValArgValLeuGluTrpLeuLeuAspMetThrValGinThrMetGlu859095ProLeuGluArgHisPheAlaGlyAspArgProAspValValValAsn100105110AspProSerSerLeuTrpThrGlyArgLeuLeuAlaAspArgTrpGly115120125lieProVallieArgSerThrProThrTyrAlaAlaAsnGluHisTrp130135140SerLeuHisProProValAspSerAlaGluProProAspAspProGlu145150155160LeuHisLysLeuLeuAlaArglieGluArgLeuLeuGluGluGinGly165170175ValGluHisAspLeuAlaGlyPheThrGlyValLeuHisGlyGlyPro180185190AlaLeuLeuTyrMetProArgSerPheGinTyrAlaGlyGluThrPhe195200205AspAlaGinHisHisPheValGlyProCysProProArgThrAlaPhe210215220HisGlyGluTrpArgProGlyAspAspAspGlyArgProLeuValLeu225230235240ValSerLeuGlyThrLeuTyrAsnAspArgProAspPhePheArgThr245250255CysLeuGluAlaPheGlyAspGluProTrpAsnValLeuLeuValLeu260265270GlyGlyGlyValProAlaAlaAspLeuGlyProLeuProGlyAsnVal275280285ArgValThrAspPheValSerLeuArgAspValLeuProHisThrAla290295300ValValValAsnHisGlyGlyMetSerThrAlaMetGluValPheSer305310315320HisGlyValProValValAlalieProValMetProGluProArgAla325330335ThrAlaArgArglieValGluLeuGlyLeuGlyAspGinLeuLeuAsn340345350SerGluLeuThrAlaGluSerLeuArgAlaThrValArgArgValLeu355360365AlaAspSerAlalieProGlyAsnMetArgGlyPheArgGluGinlie370375380ArgAlaAlaGlyGlyAlaProAlaAlaAlaAspAlalieGluGlyLeu385390395400LeuProArgValGly405<210>109<211〉621<212〉DNA<213>生二素链霉菌<220><221>CDS<222>(1)..(621)<400>109atgetcateaccgaaacagcagtgcccgacgtgttccgcategatccg48MetLeulieThrGluThrAlaValProAspValPheArglieAspPro151015gaaccgctgccggaccaceggggceggttctacgaagcggtgcgccgc96GluProLeuProAspHisArgGlyArgPheTyrGluAlaValArgArg202530gggccgctggsggccgccgtcgggcscteggtcgsggtceggcaggtc144GlyProLeuGluAlaAlaValGlyHisSerValGluValArgGinVal354045cactgcaccgtctecgggcgcaacgtactgcgcggcctgcacgccacc192HisCysThrValSerGlyArgAsnValLeuArgGlyLeuHisAlaThr505560accctgccgccgggccaggccaagateetcacctgtgtgeggggtgcg240ThrLeuProProGlyGinAlaLyslieLeuThrCysValArgGlyAla65707580gcgctgAlaLeuactThratgMetgtgVal85gtcgacatgValAspMet3ggArggtcVal90gggGlyteaSerccgProggcGlyttcPhe95ggaGly288eggtacArgTyrgagGlugcgAla100gtgValeggcaggatArgGinAspgccAla105ccgProtegSerggcGly3CCThrgcgAla110etcLeutacTyr336ctgccgLeuProgacAsp115ggcGlyatelieggcctgggcGlyLeuGly120tacTyrgtgValgccAlaetcLeugcgAla125gacAspAspThr384tgcatgaactacctgtgcaccgaggagtacgtcccgggcatggtcate432CysMetAsnTyrLeuCysThrGluGluTyrValProGlyMetVallie130135140gacgtggacgccctggaccccgaaetcggcctgccgtggggactgacc480AspValAspAlaLeuAspProGluLeuGlyLeuProTrpGlyLeuThr145150155160ggggatcccgtccgctecgccegggacgcggcggcgccgtecctgegg528GlyAspProValArgSerAlaArgAspAlaAlaAlaProSerLeuArg165170175gcggccgcggcggcgggaattctgcccacgtacgaggactgcttaegg576AlaAlaAlaAlaAlaGlylieLeuProThrTyrGluAspCysLeuArg180185190gtgcgcacgtecgtgcccgcccctcccgaceggacteggetctga621ValArgThrSerValProAlaProProAspArgThrArgLeu195200205<210>110<211>206<212>PRT<213>生二素链霉菌<400〉110MetLeulieThrGluThrAlaValProA印ValPheArglieAspPro151015GluProLeuProAspHisArgGlyArgPheTyrGluAlaValArgArg202530GlyProLeuGluAlaAlaValGlyHisSerValGluValArgGinVal354045HisCysThrValSerGlyArgAsnValLeuArgGlyLeuHisAlaThr505560ThrLeuProProGlyGinAlaLyslieLeuThrCysValArgGlyAla65707580AlaLeuThrMetValValA印MetArgValGlySerProGlyPheGly859095ArgTyrGluAlaValArgGinAspAlaProSerGlyThrAlaLeuTyr100105110LeuProAspGlylieGlyLeuGlyTyrValAlaLeuAlaAspAspThr115120125CysMetAsnTyrLeuCysThrGluGluTyrValProGlyMetVallie130135140AspValAspAlaLeuAspProGluLeuGlyLeuProTrpGlyLeuThr145150155160GlyAspProValArgSerAlaArgAspAlaAlaAlaProSerLeuArg165170175AlaAlaAlaAlaAlaGlylieLeuProThrTyrGluAspCysLeuArg180185l恥ValArgThrSerValProAlaProProAspArgThrArgLeu195200205<210>111<211>恥O<212>DNA<213>生二素链霉菌<220><221>CDS<222〉(1)(903)<400>111atgaccttacgcacgcttcgacccgccggcgcggcgccccccgtgggt48MetThrLeuArgThrLeuArgProAlaGlyAlaAlaProProValGly151015cccgccgcgeggcacgacttcgactegetcgtctecgacgcatgtgcg96ProAlaAlaArgHisAspPheAspSerLeuValSerAspAlaCysAla202530gagttaetcggttegetccgcegggcggaccagcgcagaagaggtgag144GluLeuLeuGlySerLeuArgArgAlaAspGinArgArgArgGlyGlu354045cagtacatacgcgggctgetcacggcacagggacgcaagaccgccegg192GinTyrlieArgGlyLeuLeuThrAlaGinGlyArgLysThrAlaArg505560aacetcgccgccttcgtcggagagggcgcggcggaacagagectgcac240AsnLeuAlaAlaPheValGlyGluGlyAlaAlaGluGinSerLeuHis65707580cacttcgtcgccgggtegacetgggactggggcgaggtgegggccgcg288HisPheValAlaGlySerThrTrpAspTrpGlyGluValArgAlaAla859095ctggcccgctacgtggacgacaggctgacccccgacgcctgggtgate336LeuAlaArgTyrValAspAspArgLeuThrProAspAlaTrpVallie100105110tggccgatggtggtctecaaggcgggggtgcgctecgtcggggtgage384TrpProMetValValSerLysAlaGlyValArgSerValGlyValSer115120125eggcgcttcgtctecgacctgggcegggtggtgagetgccagcagagt432ArgArgPheValSerAspLeuGlyArgValValSerCysGinGinSer130135140cacgggctgtggctggcctegggcacgacggccgccccggtcagetgg480HisGlyLeuTrpLeuAlaSerGlyThrThrAlaAlaProValSerTrp145150155160cgcctgacgctgggcggcggceggageggggagggcacaccceggcac528ArgLeuThrLeuGlyGlyGlyArgSerGlyGluGlyThrProArgHis165170175cccggcgcacccggtgaggaggagaacategtccgcctggtggccgaa576ProGlyAlaProGlyGluGluGluAsnlieValArgLeuValAlaGlu180185190gccgetcaggccaaccgctecttggcccgccccgtggtgatggacgca624AlaAlaGinAlaAsnArgSerLeuAlaArgProValValMetAspAla195200205cgcgcggccgtgctgccacgactggtgcgagggetcggtetcgcgggc672ArgAlaAlaValLeuProArgLeuValArgGlyLeuGlyiLeuAlaGly210215220ctgcccttcatggtgegggtgggcgggaacetceggctggccteggcg720LeuProPheMetValArgValGlyGlyAsnLeuArgLeuAlaSerAla225230235240ageggccgcggcccggtggaccaccacacggggaccaccteggcccag768SerGlyArgGlyProValAspHisHisThrGlyThrThrSerAlaGin245250255cagttgatggagcagetcaageggttgagecgccccgtggagttgegg816GinLeuMetGluGinLeuLysArgLeuSerArgProValGluLeuArg260265270ggctecetcageetcgtcgccccgcaccccgtcgtcctgccgggtgtg864GlySerLeuSerLeuValAlaProHisProValValLeuProGlyVal275280285gtcccgaggeggacgctgacgctgctggggggtgtggcggrmrmrmnrm913ValProArgArgThrLeuThrLeuLeuGlyGlyValAla2恥295300nnnrmnrmrmmirmnnrmrmnnnrmmmnnnnnnnrmrmnrmrmnrm粥O<210〉112<211>301<212〉PRT〈213〉生二素链霉菌<400>112MetThrLeuArgThrLeuArgProAlaGlyAlaAlaProProValGly151015ProAlaAlaArgHisAspPheAspSerLeuValSerAspAlaCysAla202530GluLeuLeuGlySerLeuArgArgAlaAspGinArgArgArgGlyGlu354045GinTyrlieArgGlyLeuLeuThrAlaGinGlyArgLysThrAlaArg505560AsnLeuAlaAlaPheValGlyGluGlyAlaAlaGluGinSerLeuHis65707580HisPheValAlaGlySerThrT卬AspT卬GlyGluValArgAlaAla859095LeuAlaArgTyrValAspAspArgLeuThrProAspAlaTrpVallie100105110TrpProMetValValSerLysAlaGlyValArgSerValGlyValSer115120125ArgArgPheValSerAspLeuGlyArgValValSerCysGinGinSer130135140HisGlyLeuTrpLeuAlaSerGlyThrThrAlaAlaProValSerTrp145150155160ArgLeuThrLeuGlyGlyGlyArgSerGlyGluGlyThrProArgHis165170175ProGlyAlaProGlyGluGluGluAsnlieValArgLeuValAlaGlu180185190AlaAlaGinAlaAsnArgSerLeuAlaArgProValValMetAspAla195200205ArgAlaAlaValLeuProArgLeuValArgGlyLeuGlyLeuAlaGly210215220LeuProPheMetValArgValGlyGlyAsnLeuArgLeuAlaSerAla225230235240SerGlyArgGlyProValAspHisHisThrGlyThrThrSerAlaGin245250255GinLeuMetGluGinLeuLysArgL_euSerArgProValGluLeuArg260265270GlySerLeuSerLeuValAlaProHisProValValLeuProGlyVal275280285ValProArgArgThrLeuThrLeuLeuGlyGlyValAla290295300<210>113<211>1008<212>DNA<213>生二素链霉菌<220>〈221〉CDS<222〉(1)..(1008)<400>113atgcaggcaatteggcatcacgtcatgetcgtcatggccttcgtgacc48MetGinAlalieArgHisHisValMetLeuValMetAlaPheValThr151015gtcgccacgactttccttetctggccgtegacgcaatecgcgcaagcg恥ValAlaThrThrPheLeuLeuTrpProSerThrGinSerAlaGinAla202530tttcccccgaccccgaagcagacggtactgaaccacetccgcgccatt144PheProProThrProLysGinThrValLeuAsnHisLeuArgAlalie354045tecgggaatcacategtctecggacagcacaacaaggagcccgcctec192SerGlyAsnHislieValSerGlyGinHisAsnLysGluProAlaSer505560<formula>formulaseeoriginaldocumentpage386</formula>225230235240tacTyrtatTyrccgProGlygatAsp245cagGintacTyrgtgValgacAspgtcVal250gttValtcgSerctgLeugacAspgtcVal255tggTrp768tacTyr犯gLysageSercacHis260ccgProagtSertecSergccAlagacAsp265tac丁yrcagGincagGinatgMeteggArg270ageSeratelie816gcgAlaGlya_ca_Thr275cccPro3tgMetgccAlaetcLeu280gcgAlagagGluctgLeuggcGlyLys285atgMetccgProa_ccThr864gccAlagcgAla290ctgLeuctgLeugacAspageSercagGin2953CgThreggArgtggTrpacaThrtggTrp300UcPheMetatgMettggTrp912tecSer305gagGlucatHisctgLeucgcArg鹏Gly310肌cAsnAsntecSerAsngccAla315g肌GluliecagGinacgThrgcgAla320960tatTyrUcPheHiscccPro325gtaValctgLeu肌cAsnc兆GingggGly330gagGlugtcValgcaAlactgLeucccPro335:ga1008〈210〉114<211〉335<212〉PRT<213〉生二素链霉菌<400>114MetGinAlalieArgHisHisValMetLeuValMetAlaPheValThr151015ValAlaThrThrPhe!LeuLeuTrpProSerThrGinSerAlaGinAla202530PheProProThrProLysGinThrValLeuAsnHisLeuArgAlalie354045SerGlyAsnHislieValSerGlyGinHisAsnLysGluProAlaSer505560AlaProGlyGinTyrThrGinGinValLysAspValThrGlyGinTyr65707580ProGlyLeuTrpGlyGlyAspLeuMetPheAlaAlaAlaAspValAla859095GlyArgGinArgValValAspGinAlaArgThrGluTrpAlaAsnGly100105110SerLeuValSerLeuThrTrpHisValCysProProThrGlyGlySer115120125ThrCysAlaPheGluGlyGlyValLysSerThrLeuThrAsnAlaGin130135140PheSerGinValLeuThrGluGlySerAlaLeuAsnSerAlaTrptys145150155160ArgArgLeuAspGluValValProTyrLeuGinGinLeuGluAsnAla165170175GlyValProValLeuPheArgProLeuHisGluMetAsnGluSerTrp180185190AsnTrpTrpGlyAsnArgProGlyAlaAsnGlySerAlaArgLeuTyr195200205GinlieThrArgAspHisLeuAlaGlyThrLysGlyLeuAspAsnLeu210215220lieTrpValTrpAsnValGinAspAsnProAlaGlyAsnTrpAsnSer225230235240TyrTyrProGlyAspGinTyrValAspValValSerLeuAspValTrp245250255TyrLysSerHisProSerSerAlaAspTyrGinGinMetArgSerlie260265270AlaGlyThrLysProMetAlaLeuAlaGluLeuGlyLysMetProThr275280285AlaAlaLeuLeuAspSerGinThrArgTrpThrTrpPheMetMetTrp290295300SerGluHisLeuArgGlyAsnAsnSerAsnAlaGlulieGinThrAla305310315320TyrPheHisProArgValLeuAsnGinGlyGluValAlaLeuPro325330335<210><211><212〉<2i3〉1151038DNA生二素链霉菌<220><221><222>CDS(l)..(1038)<220〉<221>〈222〉CDS(190).(1038)〈400〉atgacgMetThr1115tgcgggCysGlyetcgggegggaaeggetccaccgtagaaaggaagcg48LeuGlyArgGluArgLeuHisArgArgLysGluAla51015gtceggcgtcccggtccaaaagagcacgggaaaaccggaccgategcg96ValArgArgProGlyProLysGluHisGlyLysThrGlyProlieAla202530cgtctgtgccctggcgggccggetcgttecaagccctggtegeggttg144ArgLeuCysProGlyGlyProAlaArgSerLysProTrpSerArgLeu354045gcccccAlaPro50tacggtggtacgaccgacgacaaggcgacgggggcgacgatg192TyrGlyGlyThrThrAspAspLysAlaThrGlyAlaThrMet5560cgtategcggtgacaggggcggcgggcagtctgggcaggegggtggtg240ArglieAlaValThrGlyAlaAlaGlySerLeuGlyArgArgValVal65707580<formula>formulaseeoriginaldocumentpage390</formula>ateliegcgAlaacgThrtacTyr305eggArgetcLeuacgThrg恥GlutacTyr290gccAlagtcValcgcArggg3GlygtgVal275tctSerttcPhecgcArgg3CAspcccPro260tggTrpgccAlatecSergacAspgtcVal340g3gGlueggArgg肌GlutecSerg3CAsp325ctgLeutegacggacctgSerThrAspLeu265acaccggtcgccThrProValAla280acagcggcgaccThrAlaAlaThr295ctgttcgcctegLeuPheAlaSer310tgcgcccagetcCysAlaGinLeuteageiacgcgcgSerGluArgAla345<210〉116<211〉345<212〉PRT<213>生二素链霉菌<400>116MetThrCys1GlyLeu5gcaggcategccAlaGlylieAlatacgtggacateTyrValAsplie285ggcctggatcccGlyLeuAspPro300gtacgcgsacsgValArgGluGin315accggccgcttgThrGlyArgLeu330:gatecacgSerThr270ccggccProAlatggtggTrpTrpcgctggArgTrpccccgcProArg335GlyArgGluArggcgAlagacAspetcLeu816864912gatAsp320actThr恥OLeuHisArgArgLysGlu1015AlaValArgArgProGlyProLysGluHisGlyLysThrGlyProlieAla202530ArgLeuCysProGlyGlyProAlaArgSerLysProTrpSerArgLeu354045AlaProTyrGlyGlyThrThrAspAspLysAlaThrGlyAlaThrMet50556010081038ArglieAlaValThrGlyAlaAlaGlySerLeuGlyArgArgValVal65707580GinLeuLeuAlaAspArgAlaAspValAspValValAlaMetThrArg859095ArgLysLeuProAlaGluAlaLeuProProGlyValGluCysAlaVal100105110AlaAspTyrAlaAspProProAlaLeuArgAlaAlaLeuLysGlyVal115120125AspThrLeuValLeuValSerSerAspGlyProAspAlaArgValLeu130135140LeuHisHisArgAsnValValAlaAlaValValAlaGluArgValGly145150155160HisValAlaAlaLeuSerSerValAspAlaAspSerAlaSerProPhe165170175CysTyrAlaValValAsnArgLeuThrGluAspLeuLeuLeuAlaSer180185190GlyValProCysSerPheAlaArgAlaSerLeuTyrlieGluPhePhe195200205LeuGlyTrpLeuThrGinAlaArgSerThrGlyLeuLeuArgLeuPro210215220AlaAlaAspGlyArgValSerLeuValAlaArgAspAspValAlaArg225230235240AlaLeuAlaAlaLeuAlaValGlyGlyProThrGlyArgHisHisAsp245250255lieThrGlyProGluSerThrAspLeuAlaGlylieAlaSerThrAla260265270AlaGluValTrpArgThrProValAlaTyrValAsplieProAlaAsp275280285ThrTyrSerAlaGluThrAlaAlaThrGlyLeuAspProTrpTrpLeu290295300TyrAlaPheSerSerLeuPheAlaSerValArgGluGinArgTrpAsp305310315320ArgValArgAspAspCysAlaGinLeuThrGlyArgLeuProArgThr325330335LeuArgAspValLeuSerGluArgAla340345<210>117<211>282<212>PRT<213>生二<400>117MetArglieAla1ValThrGlyAlaAlaGlySerLeuGlyArgArgVal51015ValGinLeuLeuAlaAspArgAlaAspValAspValValAlaMetThr202530ArgArgLysLeuProAlaGluAlaLeuProProGlyValGluCysAla354045VslAlsAspTyrAlsAspProProAlaLeuArgAlsAlsLeuLysGly505560ValAspThrLeuValLeuValSerSerAspGlyProAspAlaArgVal65707580LeuLeuHisHisArgAsnValValAlaAlaValValAlaGluArgVal859095GlyHisValAlaAlaLeuSerSerValAspAlaAspSerAlaSerPro100105110PheCysTyrAlaValValAsnArgLeuThrGluAspLeuLeuLeuAla115120125SerGlyValProCysSerPheAlaArgAlaSerLeuTyrlieGluPhe130135140PheLeuGlyTrpLeuThrGinAlaArgSerThrGlyLeuLeuArgLeu145150155160ProAlaAlaAspGlyArgValSerLeuValAlaArgAspAspValAla165170175ArgAlaLeuAlaAlaLeuAlaValGlyGlyProThrGlyArgHisHis180185190AsplieThrGlyProGluSerThrAspLeuAlaGlylieAlaSerThr195200205AlaAlaGluValTrpArgThrProValAlaTyrValAsplieProAla210215220AspThrTyrSerAlaGluThrAlaAlaThrGlyLeuAspProTrpTrp225230235240LeuTyrAlaPheSerSerLeuPheAlaSerValArgGluGinArgTrp245250255AspArgValArgAspAspCysAlaGinLeuThrGlyArgLeuProArg260265270ThrLeuArgAspValLeuSerGluArgAla275280<210>118<211>975<212〉DNA<213>生二素链霉菌〈220><221〉CDS<222〉(1)..(975)<400〉118atgetccgacgccgtetcggagggccgteaggccccetcgtcagtgcc48MetLeuArgArgArgLeuGlyGlyProSerGlyProLeuValSerAla151015ctgtgcctgggcgcgatgcccttcggcaccaccgtcgacgagaagacg96LeuCysLeuGlyAlaMetProPheGlyThrThrValAspGluLysThr202530tecttcgccateetcgaceggttcgtcgaggccggcggcagtetcgtc144SerPheAlalieLeuAspArgPheValGluAlaGlyGlySerLeuVal354045gacaccgccgacaactacgcgttctgggetcccggcgggaccggggac192AspThrAlaAspAsnTyrAlaPheTrpAlaProGlyGlyThrGlyAsp505560gagagegagaacaccgtcgggcgctggctggcgagecgccgccgccgc240GluSerGluAsnThrValGlyArgTrpLeuAlaSerArgArgArgArg65707580gacgaggtggtga_tctecaccaaggtgggtgcccgccccaccgtcccc288AspGluValVallieSerThrLysValGlyAlaArgProThrValPro859095ggcageggcctggagaccgccgaagggctgteggetcccgtcataegg336GlySerGlyLeuGluThrAlaGluGlyLeuSerAlaProVallieArg100105110aaggccgcggaggacagectgcgacgcctgggcaccgatcgcategat384LysAlaAlaGluAspSerLeuArgArgLeuGlyThrAspArglieAsp115120125ctgtactggacccacategaggaceggaccgtccctctggaggagacg432LeuTyrTrpThrHislieGluAspArgThrValProLeuGluGluThr130135140etcggagetetcgacgagctggtcggcggcggc犯ggtggcggtgctg480LeuGlyAlaLeuAspGluLeuValGlyGlyGlyLysValAlaValLeu145150155160ggctgctecaaccacgcgggctggcgcategaaegggcccgcgcgetc528GlyCysSerAsnHisAlaGlyTrpArglieGluArgAlaArgAlaLeu165170175gcceggaccaacggctggacggcgtacacctgcgtccagcagcgctac576AlaArgThrAsnGlyTrpThrAlaTyrThrCysValGinGinArgTyr180185190tectaccttcagccgcgcttcgacgtcggactgccggagageggacac624SerTyrLeuGinProArgPheAspValGlyLeuProGluSerGlyHis195200205gtcValC3CHis210gcgaccAlaThrtecSerg肌GluetcLeu215etcLeugacAspC3CHisgtaValcgcArg220ageSergagcccGluProgacAsp672ctgLeu225acgThrctgctgLeuLeugccAlatacTyr230tegSertecSerctgLeuetcLeutegSer235ggcGlygcgAlateica_ccTyrThreggArg240720ccgProgacAspa^gsecLysThrctgLeu245tecSergccAlagccAlatacTyrgacAsp250HisccgProggcGlyaccgggThrGly255cagGin768eggArgctgLeusecgtgThrVal260ctgLeueggg兆GlugtgValgccAla265gccAlag服GluetcggtgccaccGlyAlaThr270gccAla816肌cAsncagGingtggtgValVal275ctgLeutecSertggTrpttgLeu280etcLeuGlyggtGlygatAspccgccggtgProProVal285atelie864ccgProatelie290gtggggValGlygtgValagtSertecSer295gtcValg邓GlucagGinctgLeugacAsp300gaggtgctgGluValLeugccAla912gccAla305gtcValg兆ctgGluLeug^gGluctgLeu310cccProeggArggagGluacgThr鄉Arg315gcaAlaeggctggacArgLeuAspetcLeu320960gccAlagggGlyeggggcArgGlytga325975<210>119<211〉324<212〉PRT<213〉生二<400〉119MetLeuArgArgArg15LeuGlyGlyProSer10GlyProLeuValSer15AlaLeuCysLeuGlyAlaMetProPheGlyThrThrValAspGluLysThr202530SerPheAlalieLeuAspArgPheValGluAlaGlyGlySerLeuVal354045AspThrAlaAspAsnTyrAlaPheTrpAlaProGlyGlyThrGlyAsp505560GluSerGluAsnThrValGlyArgTrpLeuAlaSerArgArgArgArg65707580AspGluValVallieSerThrLysValGlyAlaArgProThrValPro859095GlySerGlyLeuGluThrAlaGluGlyLeuSerAlaProVallieArg100105110LysAlaAlaGluAspSerLeuArgArgLeuGlyThrAspArglieAsp115120125LeuTyrTrpThrHislieGluAspArgThrValProLeuGluGluThr130135140LeuGlyAlaLeuAspGluLeuValGlyGlyGlyLysValAlaValLeu145150155160GlyCysSerAsnHisAlaGlyTrpArglieGluArgAlaArgAlaLeu165170175Ala.ArgThrAsnGlyTrpThrAlaTyrThrCysValGinGinArgTyr180185190SerTyrLeuGinProArgPheAspValGlyLeuProGluSerGlyHis195200205ValHisAlaThrSerGluLeuLeuAspHisValArgSerGluProAsp210215220LeuThrLeuLeuAlaTyrSerSerLeuLeuSerGlyAlaTyrThrArg225230235240ProAspLysThrLeuSerAlaAlaTyrAspHisProGlyThrGlyGin245250255ArgLeuThrValLeuArgGluValAlaAlaGluLeuGlyAlaThrAla260265270AsnGinValValLeuSerTrpLeuLeuGlyGlyAspProProVallie275280285ProlieValGlyValSerSerValGluGinLeuAspGluValLeuAla290295300AlaValGluCeuGluLeuProArgGluThrArgAlaArgLeuAspLeu305310315320AlaGlyArgGly<210>120<211〉1227<212〉DNA<213〉生二素链霉菌<220〉<221〉CDS<222>(1)..(1227)<400〉120gtgacgcccgaggcggacgtcggtacgeggtgggagccggagttcgac48ValThrProGluAlaAspValGlyThrArgTrpGluProGluPheAsp151015atgctgcccggcatacccgacctgegggcctttccccgcggaeggtgg96MetLeuProGlylieProAspLeuArgAlaPheProArgGlyArgTrp202530gcggacgcggtgegggaggccaccggcgcactgacctggggcgagetc144AlaAspAlaValArgGluAlaThrGlyAlaLeuThrTrpGlyGluLeu354045ggctaccccgatccggccggtetcgcceggetceggcageggetcgcg192GlyTyrProAspProAlaGlyLeuAlaArgLeuArgGinArgLeuAla505560gcctacetcgtgeggggacgcggcgcgtegctggaagcceggcagetc240AlaTyrLeuValArgGlyArgGlyAlaSerLeuGluAlaArgGinLeu65707580gtcgtctgcgcgggcacgctggacgcggtgcgcaggctgtgcegggtc288ValValCysAlaGlyThrLeuAspAlaValArgArgLeuCysArgVal859095ctgeggaccgagggccacacccacatggccctggaggaccctggctgg336LeuArgThrGluGlyHisThrHisMetAlaLeuGluAspProGlyTrp100105110tcgeggctgagegccacggtcggggcggaggggctggtgcccgtcccg384SerArgLeuSerAlaThrValGlyAlaGluGlyLeuValProValPro115120125gttcccgtggacggcgacggcctgegggtcgax:ctgctgeggcgcgcg432ValProValAspGlyAspGlyLeuArgValAspLeuLeuArgArgAla130135140cctcaggtceggtcggtgategtcgetcccgcccaccagttcccgacc480ProGinValArgSerVallieValAlaProAlaHisGinPheProThr145150155160ggtgtggtcetcgccccggcccgtcgcggcgagctggtcgcctgggcc528GlyValValLeuAlaProAlaArgArgGlyGluLeuValAlaTrpAla165170175cgcgaggtcgacggcctggtgctggaggacgactacgacgccgagttc576ArgGluValAspGlyLeuValLeuGluAspAspTyrAspAlaGluPhe180185190cgatacgaccgccaccccgtgggcgccctgcagggcatggcaccggag624ArgTyrAspArgHisProValGlyAlaLeuGinGlyMetAlaProGlu195200205cacgtcgcgctgctggggtcggtcageaagacgetctcgccggccctg672HisValAlaLeuLeuGlySerValSerLysThrLeuSerProAlaLeu210215220eggateggctgggcggtgaccccgccgcgctggaccgaggccctgggc720ArglieGlyTrpAlaValThrProProArgTrpThrGluAlaLeuGly225230235240gcggagcacgtcgggggcgtaccaccgcccgtcategaccaggaggcg768AlaGluHisValGlyGlyValProProProVallieAspGinGluAla245250255ttcgcceggttcctggcccgcgggtectacgaceggtacctgegggcg816PheAlaArgPheLeuAlaArgGlySerTyrAspArgTyrLeuArgAla260265270gcaeggctgcgctacaaaeggcgccgcgatcacetcatgggagaaetc864AlaArgLeuArgTyrLysArgArgArgAspHisLeuMetGlyGluLeu275280285gcggcgtegctgccggggttccaggtgtecggtgcggcggccggcttc912AlaAlaSerLeuProGlyPheGinValSerGlyAlaAlaAlaGlyPhe290295300cacctgctgctgtecctgacggactgcteggcgcccaccgtcgtcagg960HisLeuLeuLeuSerLeuThrAspCysSerAlaProThrValValArg305310315320gaggcggcgeggcgtgacgtgaggctggcggatetcgacgcctacegg1008GluAlaAlaArgArgAspValArgLeuAlaAspLeuAspAlaTyrArg325330335atggcgegggccgagcaccacccgacggccegggccggcgactecggc1056MetAlaArgAlaGluHisHisProThrAlaArgAlaGlyAspSerGly340345350ggggcgegggccgtggccgccgccggccccgcgctggtcetcggctac1104GlyAlaArgAlaValAlaAlaAlaGlyProAlaLeuValLeuGlyTyr355360365ggcaatctggcggaccacgccgtgcccggagccgtgeggcgcctggca1152GlyAsnLeuAlaAspHisAlaValProGlyAlaValArgArgLeuAla370375380caggccategacgcggcceggcgccacgaceggeggcacgtcgacgcc1200GinAlalieAspAlaAlaArgArgHisAspArgArgHisValAspAla385390395400gggegggccggggagegggccgactga1227GlyArgAlaGlyGluArgAlaAsp405<210>121<211〉408<212>PRT<213〉生二<400>121素链霉菌ValThrProGluAlaAspValGlyThrArgTrpGluProGluPheAsp151015MetLeuProGlylieProAspLeuArgAlaPheProArgGlyArgTrp202530AlaAspAlaValArgGluAlaThrGlyAlaLeuThrTrpGlyGluLeu354045GlyTyrProAspProAlaGlyLeuAlaArgLeuArgGinArgLeuAla505560AlaTyrLeuValArgGlyArgGlyAlaSerLeuGluAlaArgGinLeu65707580ValValCysAlaGlyThrLeuAspAlaValArgArgLeuCysArgVal85恥95LeuArgThrGluGlyHisThrHisMetAlaLeuGluAspProGlyTrp100105110SerArgLeuSerAlaThrValGlyAlaGluGlyLeuValProValPro115120125ValProValAspGlyAspGlyLeuArgValAspLeuLeuArgArgAla130135140ProGinValArgSerVallieValAlaProAlaHisGinPheProThr145150155160GlyValValLeuAlaProAlaArgArgGlyGluLeuValAlaTrpAla165170175ArgGluValAspGlyLeuValLeuGluAspAspTyrAspAlaGluPhe180185190ArgTyrAspArgHisProValGlyAlaLeuGinGlyMetAlaProGlu195200205HisValAlaLeuLeuGlySerValSerLysThrLeuSerProAlaLeu210215220ArglieGlyTrpAlaValThrProProArgTrpThrGluAlaLeuGly225230235240AlaGluHisValGlyGlyValProProProVallieAspGinGluAla245250255PheAlaArgPheLeuAlaArgGlySerTyrAspArgTyrLeuArgAla260265270AlaArgLeuArgTyrLysArgArgArgAspHisLeuMetGlyGluLeu275280285AlaAlaSerLeuProGlyPheGinValSerGlyAlaAlaAlaGlyPhe290295300HisLeuLeuLeuSerLeuThrAspCysSerAlaProThrValValArg305310315320GluAlaAlaArgArgAspValArgLeuAlaAspLeuAspAlaTyrArg325330335MetAlaArgAlaGluHisHisProThrAlaArgAlaGlyAspSerGly340345350GlyAlaArgAlaValAlaAlaAlaGlyProAlaLeuValLeuGlyTyr355360365GlyAsnLeuAlaAspHisAlaValProGlyAlaValArgArgLeuAla370375380GinAlalieAspAlaAlaArgArgHisAspArgArgHisValAspAla385390395400GlyArgAlaGlyGluArgAlaAsp405<210〉122<formula>formulaseeoriginaldocumentpage403</formula><223〉人工序列描述寡核苷酸EDR41<400〉125cccaagctttcaagg犯cgacggggtggtcagtcaagt38<210>126<211>32<212>DNA〈213〉人工序列<220><223〉人工序列描述寡核苷酸A<400>126ccagtagatatcccgccaacccggagctgcac32<210〉127<211>32<212〉腿<213〉人工序列<220〉<223>人工序列描述寡核苷酸B<400〉127gaaaagatccgtcatggggtcgtgcgctcctt32<210>128<211〉32<212〉DNA<213>人工序列<220><223〉人工序列描述寡核苷酸C<400>128cacgaccccatgacggatcttttccgctgcat32<210>129<211〉32<212〉腿<213>人工序列<220〉<223〉人工序列描述寡核苷酸D<400>129gagccggatatcatcggtcttgccttgctcgt32<210〉130<211>25<212>DNA<213〉人工序列<220><223〉人工序列描述寡核苷酸ORF23c<400〉130acgtgcgcggtgagttcgccgttgc25<210>131<211>25<212〉DNA〈213>人工序列<220〉<223>人工序列描述寡核苷酸0RF25c<400>131ctgaacgacgccatcgcggtggtgc25<210>132<211>25<212〉腿<213>人工序列<220><223〉人工序列描述寡核苷酸0RF1化<400〉132gaccacctcgaaccgtccggcgtca25<210>133<211>23<212〉DNA<213>人工序列<220〉<223>人工序列描述寡核苷酸0RF2*c<400>133ggcccggtccagcgtgccgaage23〈210〉134<2U〉6174<212〉DNA<213>生二素链霉菌<400>134ctgcagagggcgccgacgtgcgcggtgagttcgccgttgcgccggctggtccagccgagg60ccgccgtggaccgcgggcgcctgtgcgcacagcaggccccggg卿Cg3ggtcgtgcagc120gcagctcgcccgtccggtcccactcggccgcccggtcgccgaccagcgcg180gtgaacagctcctcggcctcggtgccgtcggcgtggg兆gtgtcagccacctgcgtgccc240ggtcgcctcgccgggcgcggccagccgtccgaccagccggaccatcgcgtcgacggtgcg300gaagttgtcgagcatcaggtcggcgccgctcegtaggtettctccaggtg360cacgacgagctgcatggcgsacagegaggacatcccgccgaeggegaacaggtcctggtc420gcgctcccaggtggtcttggtgcggtcctcgagg犯cccgagcagttccccggcgacctc480gtcggcggtgggggtcgtgccggtggggtcgggccgaccggacgtcgtggteatcgegtg540gcctcctggtagtcgtagaatccccggccgctcttgcggccgagcaggccctggcggacc600ttgtccagcagcagctcgctegggeggagegccggatcgccggtccgttcgtgcatcacc660CggCCELggUgtCCELgtCCgSLtcaggtcggccgtggccaggggtccggtg720cggtggccgatgcagtcgcgcatcagcgcgtccacggtctccggggtggcccggccctcg780tgcacraccgcgatggcgtcgttcagcatceggtgeageaggcggctggtcacgaagccg840gcgccgtcgccgacgacgatgccccggcggcccaggccggacagcaggtcccgggtggcc900cgggcggccgcctctccgctgcgcggtccgaggaccacctcgaccgtggggatcacgtac960gcggggttcatgaagtgcacgccgacg鄉tcctcggggcgggggacggcgtcggccagc1020tcgtcgatggggacgcccgaggtgttgctgacgagcagcgtccccgggcgcgccacggac1080gccaggtccgccagcacctcggccttccgctcggggtcctcggtgacggcctcgatcacg1140gcggtcgcggtggcgacggcggccggcgcctcctcgacggtcagctccccgggcgggcgg1200tcgtggggcagcgcgcccatcagccgggccgtccgcagatgcagcgcgaccgcgtcgggg1260gcggccgcgcgcgccccggcggaggtgtcgaccagtgtgaccgggtgcccgtgtccgacg1320gcgagtgccgcgatggccgtgcccatgacgcccgcgccgagcacgacgagcggaga^ttt1380tccttggaatCgggC3Cgg3tcctccagaatcccgggggcggcggctgtgcgsaatgctg1440tcccgaatcgcttccgcgctccatcacccgggcgtgactttgtcacctagcaagcggtgg1500眺gccgggcggaggctatgtcatctcggccttgtccgcttacgagttccgtccttaaag1560tgcgcccggcg咖gcacggcggaattgactcgccgtccgtcaaggacccgCggttCg3£l1620ggacctcgacgcatg犯gggtttcacatggctcatatcgcattcttcatccttccggttg1680ccgggcatgtgaatccgaccctgggagtcgggtcgcgcgcggccaccggg1740tgacgttcgcgctgtxcgaggacctcgccgagcgggcccggctgatcggcgccg郷tgg1800tcacctatccggtgg織ggcaacggttcctggaccagatggtgccgcggcaggacgcgg18603cg3gtacacggacg郷acgagttcgtccgggtcctggsgtggctgctggacatgacgg1920tgcagaccatgg犯ccgctgg卿ggcacttcgccggggaccggcccga_cgtcgtcgtca1980acgatccgtcgtcgctgtgg3Cggg3CggCtgctggcggaccggtggggcatcccggtca2040tccgcagcactccgacctatgccgccaacg犯cactggtcgctgcatccgccggtcgact2100cggccgagccgccggacgaccccgagctgcacaagctgctcgcgcggatcgagcggctgc2160tgg兆g兆C3gggcgtcgagcacgacctggccggcttcaccggggtcctgcacggcggtc2220cggccctgctgtacatgccccgctcgttcc敏3CgCgggcgagaccttcgacgcacagc2280accacttcgtcggcccctgcccgccccgcaccgcgttccacggcgagtgg郷ccggggg2340arg3Cgaxggccggcccctggtgctggtgagtctcggaaccctgtacaacgaccggccgg2400acttcttccgcacctgcctggaggcgttcggcgacgagccctgg肌cgtgcttctggtgc2460tgggcggcggggtgcccgcggccgacctgggcccgcttcccggcaatgtccgggtgaccg2520acttcgtgtcgctgcgcgacgtcctgccgcacacggcggtggtggtgaacC3Cggtggg32580tgagcaccgccatgg鄉tgttctcgcacggtgtgccggtggtggcgatcccggtgatgc2640cggagccccgggccaccgcgcggcggatcgtcg犯ctgggcctgggcgaccagctgctga2700actcggagctgacggccgagtccctgcgtgccacggtacggcgggtgctggcggactccg2760cgatcccgggg犯catgcgcgggttccgggagcsgatcagggcggccggcggggcgcccg2820cggcggccgacgcgatcgagggactgctgccccgggtgggctgagacgtccgcgcccgac2880acgcgttcaccttccgaacggcgggatcgccccatgctcatcaccgaaaceigcagtgccc2940gacgtgttccgcatcgatccggaaccgctgccggaccaccggggccggttCt3Cg犯gCg3000gtgcgccgcgggccgctggaggccgccgtcgggcactcggtcgaggtccggcaggtccac3060tgcaccgtctccgggcgc肌cgtactgcgcggcctgcacgCCSCC3CCCtgccgccgggc3120caggcc肌gatcctcacctgtgtgcggggtgcggcgctgactatggtggt3180gtcgggtxaccgggcttcggacggtacgaggcggtgcggcaggatgccccgtcgggcacc3240gcgctctacctgccggacggcatcggcctgggctacgtggccctcgcggacgELcacatgc3300tgtgcaccgaggagMcgtcccgggcatggtcatcgacgtggacgccctg3360gaccccgaactcggcctgccgtggggactgaccggggatcccgtccgctccgcccgggac3420gcggcggcgccgtccctgcgggcggccgcggcggcggg肌ttctgcccacgtacgaggac3480tgcmcgggtgcgcacgtccgtgcccgcccctcccgaccggactcggctCtg3CgCg8C3540ggacacgaccgccgcgcatcCg3CgCg犯tccgacgcgaatccg犯ctcgatttcccg犯3600ccgtggacggagcgcgtccnnnnnnrmnnnrmnnrmnnnnnrmnnnnnnnnnnnnnnnnn3660nnnnnnnnrmrmrmnrmrmnnrmnnnnnnnnnnnnrmnnnnrmnnrmnnnnnmumnnnn3720nnnnnnminnrmnnnnnrmnnnnnnnnrmnrmnnnrmrmnnnrmnnrmnnnrmnnnrmrm3780nnnnrmnnnnnnnnrmnnnnnnnrm皿nnnnnnnrmnnnnnnnnrmnnnnrmrmnnn皿n3840nnnnnnrmnnnnnnrmnnnnnrmnrmnnnnnrmnnnnnnnminnnrmnnnnnnnnnnnnn3900nnrmnnnnnnnnnrmnminnnnnrmrmnrmnrmrmrmmmrnirmnnnrmnnnnnnrmnrm3960nrmnnrmnnnnnrmnnnrmnnnrmnnnminrmnnnnnnrmnnnnnnnnnnminnrmrmrm4020nrmnrmrmnnnnnnnrmnnnnnnnnnrmnnnnnnrmnminnnrmnrmnnccgcca_ca_ccc4080cccagcagcgtceigcgtccgcctcgggaccacacccggcaggacgacggggtgcggggcg4140gggagccccgcaactccacggggcggctcaaccgcttgagctgctccatc4200咖tgctgggccg鄉tggtccccgtgtggtggtccaccgggccgcggccgctcgccgag4260gccagccggaggttcccgccC3CCCgC3CCatga£LgggC£LggcccgcgagELCCgagCCCt4320cgcaccagtcgtggc鄉acggccgcgcgtgcgtccatcaccacggggcgggcc卿gag4380cggttggcctgagcggcttcggccacc鄉cggacgatgttctcctcctcaccgggtgcg4440CCggggtgCCggggtgtgccctccccgctccggccgccgcccagcgtcaggCgCCELgCtg4500accggggcggccgtcgtgcccgaggccagccacagcccgtgactctgctggcagctcacc4560acccggcccaggtcgg,cg,cgccggctcaccccgacggsgcgcacccccgccttg4620gagaccaccatcggccagatcacccaggcgtcgggggtcagcctgtcgtcC3CgtagCgg柳Ogccagcgcggcccgcacctcgccccagtcccaggtcgacccggcgacg肌gtggtgcagg4740ctctgttccgccgcgccctctccga_cga^ggcggcgaggttccgggcggtcttgcgtccc4800tgtgccgtgagc兆cccgcgtatgtactgctcacctcttctgcgctggtccgcccggcgg4860agcg犯ccgagt犯ctccgcacatgcgtcgg卿cgagcgagtcgaagtcgtgccgcgcg4920gcgggacccacggggggcgccgcgccggcgggtcg肌gcgtgcgt卿gtcataggagtc4980ctcgtgggggcctcgtcatcactgcgagtggactgcgaccagcatcgccaattcacccgt5040tgctccccaggtacaccgggcacactcgttccgcttcgctcccccggcggcacggcccgc5100gtgtggagcactccccgctctccggacggtgggggggaagcccaccgcacgcgcgccggt5160agcggtgccggggccccsca3cccctca_ccg已cggggtccgttcgaccacatgccgtgat5220gatgccttcgccgcacggcctccttgaatgacgga_ccgtcaga_a^gacgtcactccgcgc5280gcgcccgctcccgccccgaccccgcccggccgccgtcccgcccccgcgaccctgtgggcc5340gacgccctcttgacggacccgg3atcccgggccgcgggacg卿cggcgagg肌ctcgat5400gccgcaa^ggttccgcgtcctcaccggcacctccgagatccagcgcaacggcatcgccaa5460gctcctggctttccaccactgagccgcaccccctggcgagc卿tccgggacaagacgcc5520accttcgcgacagtgtttaggtaaagaattccgcgagcggattgcc鄉g55803g犯C幼CCCattgacgcgcaccggtgcagcggccacattgacggcacctgtca^gttca5640cccccaggagcttggaatcccatgc郎gcaattcggcatcacgtcatgctcgtcatggcc5700ttcgtgaccgtcgccacgactttccttctctggccgtcgacgcaatccgcgcaagcgttt5760cccccgacccggtactgaaccacctccgcgccatttccgggaatcacatc5820gtctccggacggagcccgcctccgccccgggccagtacacccagcaggtc5880犯ggacgtc已ccgggcagtaccccggcctgtggggcggtgacctgatgttcgccgcggcg5940gacgtggccggccgccagcgCgtCgtCgELCccgagtgggcg咖ggatcg6000ctggtctcgctcacctggcacgtctgcccgccgaccggcggcagcacctgtgcgttcgag6060ggCggCgtC3agtccacgctgscg犯cgcgcagttctcgcaggtcctcacggagggcagt6120gccctgaacagcgcatggaagcggcgcctggacgsggtcgtcccgtacct6174<210>135<211〉4770<212>DNA<213>生二素链霉菌<400〉135g犯ttccgcg兆Cgg3ttgC犯cccattgacgcgcaccggtgcagcggcc603cattgacggcacctgtcaagttcacccccaatcccatgcaggcaattcg120gcatcacgtcatgctcg"tcatggccttcgtgaccgtcgccacgactttccttctctggcc180gtcg£icgcaatccgcgc肌gcgtttcccccgaccccg犯gcagacggtactgaaccacct240ccgcgccatttccgggaatcacatcgtctccggscagcacccgcctccgc300cccgggcc已gtacacccagccgtcaccgggcagtaccccggcctgtgggg360cggtgacctgatgttcgccgcggcggacgtggccggccgccagcgcgtcgtcgaccaggc420caggaccgagtgggcg認ggatcgctggtctcgctcacctggcacgtctgcccgccgac480cggcggcagcacctgtgcgttcgagggcggcgtcaagtccacgctgacgaacgcgcagtt540ctcgcaggtcctcacggagggcagtgccctga^c3gcgc3tgg卿cggcgcctggacga600ggtcgtcccgtacctgcagcagctgg卿acgc鹏cgtccccgtcctcttccggccgct660gcacg聊tgaacgaatcctggaactggtgggg犯accggcccggagcgascggc兆cgc720acgcctctaccagatcacccgcgatc已cctcgccgggacg肌3gggctggElC肌tCtg3t780ctgggtctggaacgtccaggac犯tccggcggg咖ctggaacagctactatccggg卿840tcagtacgtggacgtcgtttcgctggacgtctggtacaagagccacccgagttccgccga900ctaccagcagatgcggagcatcgcgggaacaaaacccatggccctcgcggagctgggc肌960aatgccgaccgccgcgctgctggacagccagacgcggtggacatggttcatgatgtggtc1020cgagcatctgcgcggg肌caattccaacgcacggcgtatttccacccccg1080tgtactgaaccagggggaggtcgcactgccctgacgctcggcgctgcccggctctctcac1140gcgcgttctgacaggacgtcgcgg卿gtgcggggc卿cggccggtgagctgggcgcag1200tcgtcgcggaCCCgEltCCCELgcgctgttcgcgtaccg鄉gg卿鄉cg1260tagagccacc3ggg3tCCELggccggtcgccgctgtttcggca^gtacgtgtcggccggg1320atgtccacgtaggcgaccggtgtccgccacacctccgccgccgtgg郷cgatgcctgcc1380aggtccgtcgactcgggtcccgtgatgtcgtggtgacggccggtcggcccgcccaccgcg1440鄉gcggcgagggcgcgggccacgtcgtcgcgcgccaccagggacacccggccatcggct1500gccggcagcctcagcagcccggtcgagcgcgcctgggtgagccagcctaggaagaactcg1560atgtacsgcgaggccctggcgaacgagcacggcacgccggaggcgagcagcagatcctcg1620gtgagccggttgacgacggcgtagcagaacsgtcggcgtcgacgctgctc1680邓tgccgcgscatggccgacgcgctcggcc3CC3CggCggcgacgacgttgcggtggtgc1740agcagcacccgtgcgtcgggcccgtcgctgccagsgtgtccacgcccttc1800agcgccgcacgc卿gcgggcgggtcggcg"Ugtcggcgacggcgcactccacccccggc1860ggtagtgcctCggC郷C3gcttccgcctggtcatcgccacgacgtccacgtcggcccgg1920tccgcgagcagctgcaccacccgcctgcccagactgcccgccgcccctgtcaccgcgata1980cgcatcgtcgcccccgtcgccttgtcgtcggtcgtaccaccgtag鹏gccaaccgcgac2040cagggcttggaacgagccggcccgccagggcacagacgcgcgatcggtccggttttcccg2100tgctcttttggaccgggacgccggaccgcttcctttctacggtggagccgttcccgcccg2160agcccgcacgtcatcgacgtcagaggtgataccgatgctccgacgccgtc2220tcggagggccgtcaggccccctcgtcagtgccctgtgcctgggcgcgatgcccttcggca2280ccaccgtcgacgagaagacgtccttcgccatcctcgaccggttcgtcgaggccggcggca2340gtctcgtcgacaccgccgacaactacgcgttctgggctcccggcgggaccggggacg卿2400gcgagaacaccgtcgggcgctggctggcgagccgccgccgccgcgacgaggtggtgatct2460ccaccaaggtgggtgcccgccccaccgtccccggcagcggcctggagaccgccg卿ggc2520tgtcggctcccgtcatacgg卿gccgcggaggacagcctgcgacgcctgggcaccgatc2580gcatcgatctgtactggacccacatcgsggaccggaccgtccctctggagg卿cgctcg2640gagctctcgacgagctggtcggcggcggcaaggtggcggtgctgggctgctccaaccscg2700cgggctggcgcatcgaacgggcccgcgcgctcgcccggaccaacggctgg3CggCgt3C32760cctgcgtccagcagcgctactcctaccttcagccgcgcttcgscgtcggactgccggaga2820gcggacacgtccacgcgacctccgaactcctcgaccacgtacgcagcgagcccgacctga2880cgctgctggcctactcgtccctgctctcgggcgcgtacacccggccggac朋g3CCCtgt2940ccgccgcctacgaccacccgggcaccgggcagcggctgaccgtgctgcgggaggtggccg3000ccgagctcggtgccaccgcctgctgtcctggttgctcggaggtgatccgc3060cggtgatcccgatcgtgggggtgagttccgtcgagcagctggacgaggtgctggccgccg3120tcg兆ctggagctgccccggg卿cg郷gcacggctggacctcgccgggcggggctgac3180gggccacacaccgcccctcgcccgggacgggctgaccggccgcacaccgtccctcagccg3240ggacgggctgacggccacacacccgcccctcagcccggctgggctgggctgacggccaca3300cacccgctcctcagcccggctgggctgggctgacggccac3C3CCCgCCCctcagcccgg3360ctgggctgggctgacggccacacgccgtccctcgcccgggtcgggctgaccagccacacg3420CCgtCCCtCELgtcggcccgctccccggcccgcccggcgtcgacgtgccgccggtcgtggc3480gccgggccgcgtcgatggcctgtgccaggcgccgcacggctccgggcacggcgtggtccg3540ccagattgccgtagccgaggaccagcgcggggccggcggcggccacggcccgcgccccgc3600cggagtcgccggcccgggccgtcgggtggtgctcggcccgcgccatccggtaggcgtcga3660gatccgcc3gcctcacgtcacgccgcgccgcctccctgacgacggtgggcgccga_gca_gt3720ccgtcagggatggaagccggccgccgcaccggacacctggaaccccggca3780gCgELCgCCgCgagttctcccatgaggtgatcgcggcgccgtttgtagcgcagccgtgccg3840cccgcaggtaccggtcgtagg獄cgcgggccaggaaccgggcg犯cgcctcctggtcga3900tgacgggcggtggtacgcccccgacgtgctccgcgcccagggcctcggtccagcgcggcg3960gggtcaccgcccagccgatccgcagggccggcg卿gcgtcttgctgaccgaccccagca4020gcgcgacgtgctccggtgccatgccctgcagggcgcccacggggtggcggtcgtatcgga4080actcggcgtcgtagtcgtcctccagcEiccaggccgtcgacctcgcgggcccaggcgacca4140gctcgccgcgacgggccggggcg服gax:c3caccggtcgggaactggtgggcgggagcga4200cgatcaccgaccggacctgaggcgcgcgccgcagcaggtcg3Cgccgtcgccgt4260cc已cggg已accgggacgggcaccagcccctccgccccgaccgtggcgctcagccgcgacc4320agccagggtcctccagggccatgtgggtgtggccctcggtccgca_ggacccggcacagcc4380tgcgcaccgcgtccagcgtgcccgcgcagacgtgccgggcttccagcgacgcgc4440cgcgtccccgC3Cg3ggt3ggccgcgagccgctgccggagccgggcg卿ccggccggat4500cggggtagccgagctcgccccaggtcagtgcgccggtggcctcccgcaccgcgtccgccc4560accgtccgcgggga卿gcccgcaggtcggg"UtgCCgggcagcatgtcgaactccggct4620cccaccgcgtaccgacgtccgcctcgggcgtcaccggagcggggacggcctgcgccctga4680cccgggtggccgagccgctgCgCgCCtCCELggtacccctccgcgtgcgcgtagg4740ggggatcctctagagtcgacctgcaggcct4770<210〉136<211〉28<212>DNA<213〉人工序列<220><223>人工序列描述寡核苷酸EDR31<400>136cccaagcttctgcgcccgcgggcgtgaa28<210>137<211〉28<212>DNA<213〉人工序列<220><223>人工序列描述寡核苷酸EDR37<400>137gctctagaaccgtgtagccgcgccccgg28<210>138<211〉30<212>DNA<213>人工序列<220><223>人工序列描述寡核苷酸KF30<400〉138aagcttgtgtgcccggtgtacctggggagc30<210〉139<211>30<212〉DNA<213>人工序列<220〉<223〉人工序列描述寡核苷酸KF31<400〉139ggatcccgcgacggacacgaccgccgcgca<210〉140<211>12134<212〉DNA〈213〉生二素链霉菌<400〉140ctgc卿gggcgccgacgtgcgcggtgagtccgccgtggaccgcgggcgcctgtgcgcacaggccgaggggcagctcgcccgtccggtccgtgaacagctcctcggcctcggtgccgtcgggtcgcctcgccgggcgcggcc恥ccgtccgaagttgtcgagcatcaggtcggcgccgctcacgacgagctgcatggcgaacagcgaggagcgctcccaggtggtcttggtgcggtcctcgtcggcggtgggggtcgtgccggtggggtcgcctcctggtagtcgtagaatccccggccgttgtccagcagcagctcgctcgggcggagccgcagcgagtcggccaggttgtccagtccgcggtggccgatgcagtcgcgcatcagcgcgtgcaccaccgcgatggcgtcgttcagcatc30tcgccgttgcgccggctggtccagccgagg60agcaggccccgggagccgaggtcgtgcagc120cactcggccgcccggtcgccgaccagcgcg180gcgtgggaggtgtcagccacctgcgtgccc240gaccagccggaccatcgcgtcgacggtgcg300gatgacgatgccgtaggtcttctccaggtg360catcccgccgacggcgaacaggtcctggtc420gagg犯cccgagcagttccccggcgacctc480gggccgaccggacgtcgtggtcatcgcgtg540ctcttgcggccgagcaggccctggcggacc600gccggatcgccggtccgttcgtgcatcacc6603tc3ggtcggccgtggccaggggtccggtg720tccacggtctccggggtggcccggccctcg780cggtgcagcaggcggctggtcacgaagccg840gcgccgtcgccgacgacgatgccccggcggcccaggccggacagcaggtcccgggtggcc900cgggcggccgcctctccgctgcgcggtccgaggaccacctcgaccgtggggatcacgtac960gcggggttcatg卿tgcacgccgacgaggtcctcggggcgggggacggcgtcggccagc1020tcgtcgatggggacgcccgaggtgttgctgacgagcagcgtccccgggcgcgccacggac1080gccaggtccgccagcacctcggccttccgctcggggtcctcggtgacggcctcgatcacg1140gcggtcgcggtggcgacggcggccggcgcctcctcgacggtcagctccccgggcgggcgg1200tcgtggggcagcgcgcccatcagccgggccgtccgcagatgcagcgcgaccgcgtcgggg1260gcggccgcgcgcgccccggcggaggtgtcgaccagtgtgaccgggtgcccgtgtccgacg1320gcgagtgccgcgatggccgtgcccatgacgcccgcgccgagcacgacgagcggagaattt1380tccttggaatcgggcacggatcctccagaatcccgggggcggcggctgtgcgaaatgctg1440tcccgaatcgcttccgcgctccatcacccgggcgtgactttgtcacctagcaagcggtgg1500gaggccgggcggaggctatgtcatctcggccttgtccgcttacgagttccgtcctta肌g1560tgcgcccggcgaacgcacggcggaattgactcgccgtccgtcaaggacccgcggttcgaa1620ggacctcgacgcatgaagggtttcacatggctcatatcgcattcttcatccttccggttg1680ccgggcatgtgaatccgaccctgggagtcgccgaggaactggtcgcgcgcggccaccggg1740tgacgttcgcgctgtccgaggacctcgccgagcgggcccggctgatcggcgccgaggtgg1800tcacctatccggtggacaggc肌cggttcctggaccagatggtgccgcggcaggacgcgg1860acgagtacacggacgaggacgagttcgtccgggtcctggagtggctgctggacatgacgg1920tgcagaccatggaaccgctggagaggcacttcgccggggaccggcccgacgtcgtcgtca1980acgatccgtcgtcgctgtggacgggacggctgctggcggaccggtggggcatcccggtca2040tccgcagcactccgacctatgccgccaacgaacactggtcgctgcatccgccggtcg已ct2100cggccgagccgccggacgaccccgagctgcacaagctgctcgcgcggatcgagcggctgc2160tggaggagcagggcgtcgagcacgacctggccggcttcaccggggtcctgcacggcggtc2220cggccctgctgtacatgccccgctcgttccagtacgcgggcgagaccttcgacgcacagc2280accacttcgtcggcccctgcccgccccgcaccgcgttccacggcgagtggaggccggggg2340acgacgacggccggcccctggtgctggtgagtctcggaaccctgtac朋cgaccggccgg2400acttcttccgcacctgcctggaggcgttcggcgacgagccctggaacgtgcttctggtgc2460tgggcggcggggtgcccgcggccgacctgggcccgcttcccggc犯tgtccgggtgaccg2520acttcgtgtcgctgcgcgacgtcctgccgcacacggcggtggtggtgaaccacggtggga2580tgagcaccgccatggaggtgttctcgcacggtgtgccggtggtggcgatcccggtgstgc2640cggagccccgggccaccgcgcggcggatcgtcgaactgggcctgggcgaccagctgctga2700actcggagctgacggccgagtccctgcgtgccacggtacggcgggtgctggcggactccg2760cgstcccggggaacatgcgcgggttccgggagc卿tcagggcggccggcggggcgcccg2820cggcggccgacgcgatcgagggactgctgccccgggtgggctgagacgtccgcgcccgac2880acgcgttcaccttccgaacggcgggatcgccccatgctcatcaccgaaacagcagtgccc2940gacgtgttccgcatcgatccggaaccgctgccggaccaccggggccggttctacgaagcg3000gtgcgccgcgggccgctggaggccgccgtcgggcactcggtcgaggtccggcaggtccac3060tgcaccgtctccgggcgcaacgtactgcgcggcctgcacgccaccaccctgccg'ccgggc3120caggccaagatcctcacctgtgtgcggggtgcggcgctgactatggtggtcgacatgagg3180gtcgggtcaccgggcttcggacggtacgaggcggtgcggcaggatgccccgtcgggcacc3240gcgctctacctgccggacggcatcggcctgggctacgtggccctcgcggacgacacatgc3300atgaactacctgtgcaccgaggagtacgtcccgggcatggtcatcgacgtggacgccctg3360gaccccg犯ctcggcctgccgtggggactgaccggggatcccgtccgctccgcccgggac3420gcggcggcgccgtccctgcgggcggccgcggcggcgggaattctgcccacgtacgaggac3480tgcttgicgggtgcgcacgtccgtgcccgcccctcccgaccggactcggctctgacgcgac3540ggacacgaccgccgcgcatccgacgcgaatccgacgcgaatccgaactcgatttcccgaa3600ccgtggacggagcgcgccgaggagcggaaaggtctgccgcagaaacaggctgcggccctt3660tctttccgctttttccggtaccgggacggccgttccgatgaaagcgaacgtccgcatgcg3720acggccgtccctcccgtacgctcctcccccgtcgcggccggccgggcgggcgggccggcc3780gaccgcgacggggcggggcggggtcacaccgccgtcgccccaccgaggtcgccgcgcgcg3840gagggctgcgccagccgcagcgtgtgggcgatggacgccagggtcacgtgccggtgccag3900ccctggaacgaccgtccttcgaagtcgcgcatgcccacgcccacgctcacccggtcgaag3960tcggcgtcgacctgttcggtgagcatcgccagccgcagcagggcgccgcggtcccaggac4020gtgaggtcggtcagccacaggtcggcggggcgccggcggttgccccgccacacccccagc4080agcgtcagcgtccgcctcgggaccscacccggcaggacgacggggtgcggggcgacgagg4140ctgagggagccccgcaactccacggggcggctcaaccgcttgagctgctccatcaactgc4200tgggccgaggtggtccccgtgtggtggtccaccgggccgcggccgctcgccgaggccagc4260cggaggttcccgcccacccgcaccatgaagggcaggcccgcgagaccgagccctcgcacc4320agtcgtggcagcacggccgcgcgtgcgtccatcaccacggggcgggccaaggagcggttg4380gcctgagcggcttcggccaccaggcggacgatgttctcctcctcaccgggtgcgccgggg4440tgccggggtgtgccctccccgctccggccgccgcccagcgtcaggcgccagctgaccggg4500gcggccgtcgtgcccgaggccagccacagcccgtgactctgctggcagctcaccacccgg4560cccaggtcggagacgaagcgccggctcaccccgacggagcgcacccccgccttggagacc4620accatcggccagstcacccaggcgtcgggggtcagcctgtcgtccacgtagcgggccagc4680gcggcccgcacctcgccccagtcccaggtcgacccggcgacgaagtggtgcaggctctgt4740tccgccgcgccctctccgacgaaggcggcgaggttccgggcggtcttgcgtccctgtgcc4800gtgagcagcccgcgtatgtactgctcacctcttctgcgctggtccgcccggcggagcgaa4860ccgagtaactccgcacatgcgtcggagacgagcgagtcgaagtcgtgccgcgcggcggga4920cccacggggggcgccgcgccggcgggtcgaagcgtgcgtaaggtcataggagtcctcgtg4980ggggcctcgtcatcactgcgagtggactgcgaccagcatcgccaattcacccgttgctcc5040ccaggtacaccgggcacactcgttccgcttcgctcccccggcggcacggcccgcgtgtgg5100agcactccccgctctccggacggtggggggg犯gcccaccgcacgcgcgccggtagcggt5160gccggggccccacaacccctcaccgacggggtccgttcgaccacatgccgtgatgatgcc5220ttcgccgcacggcctccttg肌tgacggaccgtcagaaagacgtcactccgcgcgcgccc5280gctcccgccccgaccccgcccggccgccgtcccgcccccgcgaccctgtgggccgacgcc5340ctcttgacggacccggaatcccgggccgcgggacgggacggcgagg犯ctcgatgccgca5400aaggttccgcgtcctcaccggcacctccgagatccagcgcaacggcatcgccaagctcct5460ggctttccaccactgagccgcaccccctggcgagcagatccgggacaagacgccaccttc5520gcgacagtgtttaggaaaagttaagtaaagaattccgcgagcggattgccagggagaaca5580acccattgacgcgcaccggtgcagcggccscattgscggcacctgtc犯gttcaccccca5640ggagcttggaatcccatgcaggcaattcggcatcacgtcatgctcgtcatggccttcgtg5700accgtcgccacgactttccttctctggccgtcgacgcaatccgcgcaagcgtttcccccg5760accccgaagcagacggtactgaaccacctxcgcgccatttccgggaatcacatcgtctcc5820ggacagcacaacaaggagcccgcctxcgccccgggccagtacacccagcaggtcaaggac5880gtcaccgggcagtaccccggcctgtggggcggtgacctgatgttcgccgcggcggacgtg5940gccggccgccsgcgcgtcgtcgscraggcc3gg3ccg兆tgggcg朋cgg3tcgctggtc6000tcgctcacctggcacgtctgcccgccgaccggcggcagcacctgtgcgttcgagggcggc6060gtcaagtccacgctgacgaacgcgcagttctcgcaggtcctcacggagggcagtgccctg6120aacagcgcatggaagcggcgcctggacgaggtcgtcccgtacctgcagcagctggagaac6180gcgggcgtccccgtcctcttccggccgctgcacg柳tgaacgaatcctggaactggtgg6240gg犯accggcccggagcgaacggcagcgcacgcctctaccagatcacccgcgatcacctc6300gccgggacgaaagggctggacaatctgatctgggtctggaacgtccaggacaatccggcg6360gg肌actggaacagctactatccggg兆atcagtacgtggacgtcgtttcgctggacgtc6420tggtacaagagccacccgagttccgccgactaccagcagatgcggagcatcgcgggaaca6480aaacccatggccctcgcggagctgggcaaaatgccgaccgccgcgctgctggacagccag6540acgcggtggacatggttcatgatgtggtccgagcatctgcgcgggaacaattccaacgcc6600gaaatacagacggcgtatttccacccccgtgtactgaaccagggggaggtcgcactgccc6660tgacgctcggcgctgcccggctctctcacgcgcgttctgacaggacgtcgcggagagtgc6720ggggcaagcggccggtgagctgggcgcagtcgtcgcggacccgatcccagcgctgttcgc6780gtaccgaggcgaacagggaggag肌ggcgtagagccaccagggatccaggccggtcgccg6840ctgtttcggcagagtacgtgtcggccgggatgtccacgtaggcgaccggtgtccgccaca6900cctccgccgccgtggaggcgatgcctgccaggtccgtcgactcgggtcccgtgatgtcgt6960ggtgacggccggtcggcccgcccaccgcgagggcggcgagggcgcgggccacgtcgtcgc7020gcgccaccagggacacccggccatcggctgccggcagcctcagcagcccggtcgagcgcg7080cctgggtgagccagcctaggaagaactcgatgtacagcgaggccctggcgaacgagcacg7140gcacgccggaggcgagcagcagatcctcggtgagccggttgacgacggcgtagcagaacg7200gggaggccgagtcggcgtcgacgctgctcagtgccgcgacatggccgacgcgctcggcca7260ccacggcggcgacgacgttgcggtggtgcagcagcacccgtgcgtcgggcccgtcgctgg7320agacgaggaccagagtgtccacgcccttcagcgccgcacgcagagcgggcgggtcggcgt7380agtcggcgacggcgcactccacccccggcggtagtgcctcggcaggcagcttccgcctgg7440tcatcgccacgacgtccacgtcggcccggtccgcgagcagctgcaccacccgcctgccca7500gactgcccgccgcccctgtcaccgcgatacgcatcgtcgcccccgtcgccttgtcgtcgg7560tcgtaccaccgtagggggccaaccgcgaccagggcttggastcgagccggcccgccagggc7620acagacgcgcgatcggtccggttttcccgtgctcttttggaccgggacgccggaccgctt7680cctttctacggtggagccgttcccgcccgagcccgcacgtcatcgacgtgcggggaagac77408g3ggtgataccgatgctccgacgccgtctcggagggccgtcaggccccctcgtcagtgc7800cctgtgcctgggcgcgatgcccttcggcaccaccgtcgacgagaagacgtccttcgccat7860cctcgaccggttcgtcgaggccggcggcagtctcgtcgacaccgccgacaactacgcgtt7920ctgggctcccggcgggaccggggacg柳gcg卿acaccgtcgggcgctggctggcgag7980ccgccgccgccgcgacgaggtggtgatctccaccaaggtgggtgcccgccccaccgtccc8040cggcagcggcctggagaccgccgaagggctgtcggctcccgtcatacggaaggccgcgga8100ggacagcctgcg'acgcctgggcaccgatcgcatcgatctgtactggacccacatcgagga8160ccgg'accgtxcctctggaggagacgctcggagctctcgacgagctggtcggcggcggc幼8220ggtggcggtgctgggctgctccaaccacgcgggctggcgcatcgaacgggcccgcgcgct8280cgcccggaccaacggctggacggcgtacacctgcgtccagcagcgctactcctaccttca8340gccgcgcttcgacgtcggactgccggagagcggacacgtccacgcgacctccgaactcct8400cgaccacgtacgcagcgagcccgacctgacgctgctggcctactcgtccctgctctcggg8460cgcgtacacccggccggacaagaccctgtccgccgcctacgaccacccgggcaccgggca8520gcggctgaccgtgctgcgggaggtggccgccgagctcggtgccaccgccaacc郷tggt8580gctgtcctggttgctc鹏ggtgatccgccggtgatcccgatcgtgggggtgagttxcgt8640cgagcagctggacg鄉tgctggccgccgtcgagctggagctgccccggg卿cgagggc8700acggctggacctcgccgggcggggctgacgggccacacaccgcccctcgcccgggacggg8760ctgaccggccgcacaccgtccctcagccgggacgggctgacggccacacacccgcccctc8820agcccggctgggctgggctgacggccacacacccgctcctcagcccggctgggctgggct8880gacggccacacacccgcccctcagcccggctgggctgggctgacggccacacgccgtccc8940tcgcccgggtcgggctgaccagccacacgccgtccctcagtcggcccgctccccggcccg9000cccggcgtcgacgtgccgccggtcgtggcgccgggccgcgtcgatggcctgtgccaggcg9060ccgcacggctccgggcacggcgtggtccgccagattgccgtagccgaggaccagcgcggg9120gccggcggcggccacggcccgcgccccgccggagtcgccggcccgggccgtcgggtggtg9180ctcggcccgcgccatccggtaggcgtcgagatccgccagcctcacgtcacgccgcgccgc9240ctccctgacgacggtgggcgccgagcagtccgtcagggacagcagcaggtggaagccggc9300cgccgcaccggacacctggaaccccggcagcgacgccgcgagttctcccatgaggtgatc9360gcggcgccgtttgtagcgcagccgtgccgcccgcaggtaccggtcgtaggacccgcgggc9420caggaaccgggcgaacgcctcctggtcgatgacgggcggtggtacgcccccgacgtgctc9480cgcgcccagggcctcggtccagcgcggcggggtcaccgcccagccgatccgcagggccgg9540cgagagcgtcttgctgaccgaccccagcagcgcgacgtgctccggtgccatgccctgcag9600ggcgcccacggggtggcggtcgtatcggaactcggcgtcgtagtcgtcctccagcaccag9660gccgtcgacctcgcgggcccaggcgaccagctcgccgcgacgggccggggcgaggaccsc9720accggtcggg咖tggtgggcgggagcgacgatcaccgaccggacctgaggcgcgcgccg柳Ocagcaggtcgacccgcaggccgtcgccgtccacgggaaccgggacgggcaccagcccctc9840cgccccgaccgtggcgctcagccgcgaccagccagggtcctccagggccatgtgggtgtg9900gccctcggtccgcaggacccggcacagcctgcgcaccgcgtccagcgtgcccgcgcagac9960gacgagctgccgggcttccagcgacgcgccgcgtccccgcacgaggtaggccgcgagccg10020ctgccggagccgggcgagaccggccggatcggggtagccgagctcgccccaggtcagtgc10080<formula>formulaseeoriginaldocumentpage420</formula>tcgatcgggccggtgtcggatcctgagatgctcccggtgaacaacggctgcggagccgac11460cagccgttggggttggccgggtcgctggacgtgcggt柳cgaagggccacgcgccccac11520tggtacgccagcacccagacgttcttgggcgcgaagtagaacagggtgggcgccaccgcc11580gcctgactcatcccggtctggccggccgacgccatgtccgaccagttcgtgaaggggctg11640aacatcatcgagccgtaggacgaccccgacacgttcgacgcgtagaccaggtgcttgccg11700ttgtgggtcacggtgg"tgaagtccttgaccgccgcccacccgttcgccggctgcgccagc11760acacccgtcgacgaccaccggtacgccgacgg犯gggcacacgccccgtccgtcgggggc11820gtxccggtcEiggccggaccacttctgcccgctgccaccgacgcacgtcccggitctgcacc11880gccgtgccgttggccgtaccggcgcccgcggcctccaggcacagcccggactccacgccg11940acgaccgtgccgtcggagttcacccgccactgctggttcgcaccgccggaacagctccag12000atctgcacccgcgtcccgggtgtggtggcgtgacccggaacgtccaggcacttgttgccg12060tacacggtcagccgacggtcgtccg'tcaacgtccactgctgattgctcccgccccagcag12120tcgtatatctgcag12134<210〉141<211>1164<212〉DNA<213〉生二素链霉菌〈220〉<221〉CDS〈222〉(1),.(1164)<400〉141atgaccttacgcacgcttcgacccgccggcgcggcgccccccgtgggt48MetThrLeuArgThrLeuArgProAlaGlyAlaAlaProProValGly151015cccgccgcgeggcacgacttcgactegetcgtctecgacgcatgtgcg96ProAlaAlaArgHisAspPheAspSerLeuValSerAspAlaCysAla202530gagttaetcggttegetccgcegggcggaccagcgc卿agaggtgag144GluLeuL>euGlySerLeuArgArgAlaAspGinArgArgArgGlyGlu354045cagtacatacgcgggctgetcacggcacagggacgcaagaccgccegg192GinTyrlieArgGlyLeuLeuThrAlaGinGlyArgLysThrAlaArg505560aacetcgccgccttcgtcggagagggcgcggcggaacagagectgcac240AsnLeuAlaAlaPheValGlyGluGlyAlaAlaGluGinSerLeuHis65707580cacttcgtcgccgggtegacctgggactggggcgaggtgegggccgcg娜HisPheValAlaGlySerThrTrpAspTrpGlyGluValArgAlaAla859095ctggcccgctacgtggacgacaggctgacccccgacgcctgggtgate336LeuAlaArgTyrValAspAspArgLeuThrProAspAlaTrpVallie100105110tggccgatggtggtctec卿gcgggggtgcgctecgtcggggtgage384TrpProMetValValSerLysAlaGlyValArgSerValGlyValSer115120125eggcgcttcgtctecgacctgggcegggtggtgagetgccagcagagt432ArgArgPheValSerAspLeuGlyArgValValSerCysGinGinSer130135140cacgggctgtggctggcctegggcacgacggccgccccggtcagetgg480HisGlyLeuTrpLeuAlaSerGlyThrThrAlaAlaProValSerTrp145150155160cgcctgacgctgggcggcggceggageggggagggcacaccceggcac528ArgLeuThrLeuGlyGlyGlyArgSerGlyGluGlyThrProArgHis165170175cccggcgcacccggtgaggaggagaacategtccgcctggtggccgaa576ProGlyAlaProGlyGluGluGluAsnlieValArgLeuValAlaGlu180185190gccgetcaggccaaccgctecttggcccgccccgtggtgatggacgca624AlaAlaGinAlaAsnArgSerUuAlaArgProValValMetAspAla195200205cgcgcggccgtgctgccacgactggtgcgagggetcggtetcgcgggc672ArgAlaAlaValLeuProArgLeuValArgGlyLeuGlyLeuAlaGly210215220ctgcccttcatggtgegggtgggcgggaacetceggctggcctcggcg720LeuProPheMetValArgValGlyGlyAsnLeuArgLeuAlaSerAla225230235240ageggccgcggcccggtggaccaccacacgggga_ccacctcggcccag768SerGlyArgGlyProValAspHisHisThrGlyThrThrSerAlaGin245250255cagttgatggagcagetc肌geggttgagecgccccgtggagttgegg816GinLeuMetGluGinLeuLysArgLeuSerArgProValGluLeuArg260265270ggctecetcageetcgtcgccccgcaccccgtcgtcctgccgggtgtg864GlySerLeuSerLeuValAlaProHisProValValLeuProGlyVal275280285gtcccgaggeggacgctgacgctgctgggggtgtggeggggc亂cgc912ValProArgArgThrLeuThrLeuLeuGlyValTrpArgGlyAsnArg290295300eggcgccccgccgacctgtggctgaccgacetcacgtectgggaccgc960ArgArgProAlaAspLeuTrpLeuThrAspLeuThrSerTrpAspArg305310315320ggcgccctgctgeggctggcgatgetcaccgaacaggtcgacgccgac1008GlyAlaLeuLeuArgLeuAlaMetLeuThrGluGinValAspAlaAsp325330335ttcgacegggtga_gcgtgggcgtgggcatgcgcgacttcgaaggaegg1056PheAspArgValSerValGlyValGlyMetArgAspPheGluGlyArg340345350tcgttccagggctggcaceggcacgtgaccctggcgtecategcccac1104SerPheGinGlyTrpHisArgHisValThrLeuAlaSerlieAlaHis355360365acgctgeggctggcgcagccctecgcgcgcggcgacetcggtggggcg1152ThrLeuArgLeuAlaGinProSerAlaArgGlyAspLeuGlyGlyAla370375380acggcggtgtga1164ThrAlaVal385<210><211><212><213>142387PRT生二素链霉菌<400>142MetThrLeuArgThrLeuArgProAlaGlyAlaAlaProProValGly151015ProAlaAlaArgHisAspPheAspSerLeuValSerAspAlaCysAla202530GluLeuLeuGlySerLeuArgArgAlaAspGinArgArgArgGlyGlu354045GinTyrlieArgGlyLeuLeuThrAlaGinGlyArgLysThrAlaArg505560AsnLeuAlaAlaPheValGlyGluGlyAlaAlaGluGinSerLeuHis65707580HisPheValAlaGlySerThrTrpAspTrpGlyGluValArgAlaAla859095LeuAlaArgTyrValAspAspArgLeuThrProAspAlaTrpVallie100105110TrpProMetValValSerLysAlaGlyValArgSerValGlyValSer115120125ArgArgPheValSerAspLeuGlyArgValValSerCysGinGinSer130135140HisGlyLeuTrpLeuAlaSerGlyThrThrAlaAlaProValSerTrp145150155160ArgLeuThrLeuGlyGlyGlyArgSerGlyGluGlyThrProArgHis165170175ProGlyAlaProGlyGluGluGluAsnlieValArgLeuValAlaGlu180185190AlaAlaGinAlaAsnArgSerLeuAlaArgProValValMetAspAla195200205ArgAlaAlaValLeuProArgLeuValArgGlyLeuGlyLeuAlaGly210215220LeuProPheMetValArgValGlyGlyAsnLeuArgLeuAlaSerAla225230235240SerGlyArgGlyProValAspHisHisThrGlyThrThrSerAlaGin245250255GinLeuMetGluGinLeuLysArgCeuSerArgProValGluLeuArg260265270GlySerLeuSerLeuValAlaProHisProValValLeuProGlyVal275280285ValProArgArgThrLeuThrLeuLeuGlyValTrpArgGlyAsnArg290295300ArgArgProAlaAspLeuTrpLeuThrAspLeuThrSerTrpAspArg305310315320GlyAlaLeuLeuArgLeuAlaMetLeuThrGluGinValAspAlaAsp325330335PheAspArgValSerValGlyValGlyMetArgAspPheGluGlyArg340345350SerPheGinGlyTrpHisArgHisValThrLeuAlaSerlieAlaHis355360365ThrLeuArgLeuAlaGinProSerAlaArgGlyAspLeuGlyGlyAla370375380ThrAlaVal385<210〉<211><212><213><220〉<221><222>143849DNA生二素链霉菌CDS(1)..(849)<400>143atgcgtateMetArglie1gtgcagctgVaJGinLeugcggtgacaggggcggcgggcagtctgggcaggegggtg化AlaValThrGlyAlaAlaGlySerLeuGlyArgArgVal51015etcgcggacegggccgacgtggacgtcgtggcgatgacc96LeuAlaAspArgAlaAspValAspValValAlaMetThr202530aggeggaagctgcctgccgaggcaetaccgccgggggtggagtgcgcc144ArgArgLysLeuProAlsGluAlsLeuProProGlyVslGluCysAls354045gtcgccgactacgccgacccgcccgetctgcgtgcggcgctg卿ggc192ValAlaAspTyrAlaAspProProAlaLeuArgAlaAlaLeuLysGly505560gtggacactctggtcetcgtctecagegacgggcccgacgcaegggtg240ValAspThrLeuValLeuValSerSerAspGlyProAspAlaArgVal65707580ctgctgcaccaccgcaacgtcgtcgccgccgtggtggccgagcgcgtc288LeuUuHisHisArgAsnValValAlaAlaValValAlaGluArgVal859095ggccatgtcgcggcactgageagegtcgacgccgacteggcctecccg336GlyHisValAlaAlaLeuSerSerValAspAlaAspSerAlaSerPro100105110ttctgctacgccgtcgtcaaceggetcaccgaggatctgctgetcgcc384PheCysTyrAlaValValAsnArgLeuThrGluAspLeuLeuLeuAla115120125tecggcgtgccgtgctegttcgccagggcctegctgtacategagttc432SerGlyValProCysSerPheAlaArgAlaSerLeuTyrlieGluPhe130135140ttcetaggctggetcacccaggcgcgctegaccgggctgctgaggctg480PheLeuGlyTrpLeuThrGinAlaArgSerThrGlyLeuLeuArgLeu145150155160ccggcagccgatggcegggtgtecctggtggcgcgcgacgscgtggcc528ProAlaAlaAspGlyArgValSerLeuValAlaArgAspAspValAla165170175cgcgccetcgccgccetcgcggtgggcgggccgaccggccgtcaccac576ArgAlaLeuAlaAlaLeuAlaValGlyGlyProThrGlyArgHisHis180185190gacateacgggacccgagtegacggacctggcaggcategcctecacg624AsplieThrGlyProGluSerThrAspLeuAlaGlylieAlaSerThr195200205gcgAlagcgAla210gagGlugtgValtggTrpeggArgseaThr215ccgProgtcValgccMatacTyrgtgVal220gacAspatelieccggccProAla672gacAsp225ThrtacTyrtctSergccAlag肌Glu230ThrgcgAlagcgAlasecThrggcGly235ctgLeugatAspcccProtggtggTrpTrp240720etcLeutacTyrgccAlattcPhetecSer245tecSerctgLeuttcPhegccAlategSer250gtaValcgcGlucagGincgctggArgTrp255768gatAspegggtcValcgc八rg260AspgacAsptgcCysgccAlacagGin265etcLeuThrggcGlycgcArgttgLeu270ccccgcProArg816actThretcLeucgcArg275gacAspgtcValctgLeuteaSerg肌Glu280cgcArggcgAlatga849〈210〉144<211〉282<212〉PRT〈213〉生二素链霉菌<400〉144MetArglieAlaValThrGlyAlaAlaGlySerLeuGlyArgArgVsd151015ValGinLeuLeuAlaAspArgAlaAspValAspValValAlaMetThr202530ArgArgLysLeuProAlaGluAlaLeuProProGlyValGluCysAla354045ValAlaAspTyrAlaAspProProAlaUuArgAlaAlaLeuLysGly505560ValAspThrLeuValLeuValSerSerAspGlyProAspAlaArgVal65707580LeuLeuHisHisArgAsnValValAlaAlaValValAlaGluArgVal859095GlyHisValAlaAlaLeuSerSerValAspAlaAspSerAlaSerPro100105110PheCysTyrAlaValValAsnArgLeuThrGluAspLeuLeuLeuAla115120125SerGlyValProCysSerPheAlaArgAlaSerLeuTyrlieGluPhe130135140PheLeuGlyTrpLeuThrGinAlaArgSerThrGlyLeuLeuArgLeu145150155160ProAlaAlaAspGlyArgValSerLeuValAlaArgAspAspValAla165170175ArgAlaLeuAlaAlaLeuAlaValGlyGlyProThrGlyArgHisHis180185190AsplieThrGlyProGluSerThrAspLeuAlaGlylieAlaSerThr195200205AlaAlaGluValT卬ArgThrProValAlaTyrValAsplieProAla210215220AspThrTyrSerAlaGluThrAlaAlaThrGlyLeuAspProTrpTrp225230235240<formula>formulaseeoriginaldocumentpage430</formula>ageggcteggccaccegggtcagggcgcaggccgtccccgetccggtg288SerGlySerAlaThrArgValArgAlaGinAlaValProAlaProVal859095acgcccgaggcggacgtcggtacgeggtgggagccggagttcgacatg336ThrProGluAlaAspValGlyThrArgTrpGluProGluPheAspMet100105110ctgcccggcatacccgacctgegggcctttccccgcggaeggtgggcg384LeuProGlylieProAspLeuArgAlaPheProArgGlyArgTrpAla115120125gacgcggtgegggaggccaccggcgcactgacctggggcgagetcggc432AspAlaValArgGluAlaThrGlyAlaLeuThrT卬GlyGluLeuGly130135140taccccgatccggccggtetcgcceggetceggcageggetcgcggcc480TyrProAspProAlaGlyLeuAlaArgLeuArgGinArgLeuAlaAla145150155160tacetcgtgeggggacgcggcgcgtegctggaagcceggcagetcgtc528TyrLeuValArgGlyArgGlyAlaSerLeuGluAlaArgGinLeuVal165170175gtctgcgcgggcacgctggacgcggtgcgcaggctgtgcegggtcctg576ValCysAlaGlyThrLeuAspAlaValArgArgLeuCysArgValLeu180185190eggaccgagggccacacccacatggccctggaggaccctggctggteg624ArgThrGluGlyHisThrHisMetAlaLeuGluAspProGlyTrpSer195200205eggctgagegccacggtcggggcggaggggctggtgcccgtcccggtt672ArgLeuSerAlaThrValGlyAlaGluGlyLeuValProValProVal210215220cccgtggacggcgacggcctgegggtcgacctgctgeggcgcgcgcct720ProValAspGlyAspGlyLeuArgValAspLeuLeuArgArgAlaPro225230235240caggtceggteggtgategtcgetcccgcccaccagttcccgaccggt768GinValArgSerVallieValAlaProAlaHisGinPheProThrGly245250255gtggtcetcgccccggcccgtcgcggcgagctggtcgcctgggcccgc816ValValLeuAlaProAlaArgArgGlyGluValAlaTrpAlaArg260265270gaggtcgacggcctggtgctggaggacgactacgacgccgagttccga864GluValAspGlyLeuValLeuGluAspAspTyrAspAlaGluPheArg275280285tacgaccgccaccccgtgggcgccctgcagggcatggcaccggagcac912TyrAspArgHisProValGlyAlaLeuGinGlyMetAlaProGluHis290295300gtcgcgctgctggggteggtcageaagacgetctegccggccctgegg960ValAlaLeuL_euGlySerValSerLysThrLeuSerProAlaLeuArg305310315320ateggctgggcggtgaccccgccgcgctggacegaggccctgggcgcg1008lieGlyTrpAlaValThrProProArgTrpThrGluAlaLeuGlyAla325330335gagcacgtcgggggcgtaccaccgcccgtcategaccaggaggcgttc1056GluHisValGlyGlyValProProProVallieAspGinGluAlaPhe340345350gcceggttcctggcccgcgggtectacgaceggtacctgegggcggca1104AlaArgPheLeuAlaArgGlySerTyrAspArgTyrLeuArgAlaAla355360365eggctgcgctacaaaeggcgccgcgatcacetcatgggagaaetcgcg1152ArgLeuArgTyrLysArgArgArgAspHisLeuMetGlyGluLeuAla370375380gcgtegctgccggggttccaggtgtecggtgcggcggccggcttccac1200AlaSerLeuProGlyPheGinValSerGlyAlaAlaAlaGlyPheHis385390395400ctgctgctgtecctgacggactgcteggcgcccaccgtcgtcagggag1248LeuLeuLeuSerLeuThrAspCysSerAlaProThrValValArgGlu405410415gcggcgeggcgtgacgtgaggctggcggatetcgacgcctaceggatg1296AlaAlaArgArgAspValArgLeuAlaAspLeuAspAlaTyrArgMet420425430gcgegggccgagcaccacccgacggccegggccggcgactecggcggg1344AlaArgAlaGluHisHisProThrAlaArgAlaGlyAspSerGlyGly435440445gcgegggccgtggccgccgccggccccgcgctggtcetcggct3Cggc1392AlaArgAlaValAlaAlaAlaGlyProAlaLeuValLeuGlyTyrGly450455460aatctggcggaccacgccgtgcccggagccgtgeggcgcctggcacag1440AsnLeuAlaAspHisAlaValProGlyAlaValArgArgLeuAlaGin465470475480gccategacgcggcceggcgccacgaceggeggcacgtcgacgccggg1488AlalieAspAlaAlaArgArgHisAspArgArgHisValAspAlaGly485490495egggccggggagegggccgeictga1512ArgAlaGlyGluArgAlaAsp500<210>146<211>503<212>PRT<213〉生二素链霉菌<400〉146ValGlyAspAspArgThrAspProAlaTrpGlyThrPheLeuGluLeu151015GlyGlyProAlaAspGlyProLeuHisValArgLeuSerArgAlaLeu202530ArgAlaAlaValThrGlyGlyArglieAlaSerGlySerAlaLeuPro354045ProSerArgAlaLeuAlaAlaAspLeuGlyCysSerArgTrpValVal505560ThrGluAlaTyrAlaGinLeuValAlaGluGlyTyrLeuGluAlaArg65707580SerGlySerAlaThrArgValArgAlaGinAlaValProAlaProVal859095ThrProGluAlaAspValGlyThrArgTrpGluProGluPheAspMet100105110LeuProGlylieProAspLeuArgAlaPheProArgGlyArgTrpAla115120125AspAlaValArgGluAlaThrGlyAlaLeuThrTrpGlyGluLeuGly130135140TyrProAspProAlaGlyLeuAlaArgLeuArgGinArgLeuAlaAla145150155160TyrLeuValArgGlyArgGlyAlaSerLeuGluAlaArgGinLeuVal165170175ValCysAlaGlyThrLeuAspAlaValArgArgLeuCysArgValLeu180185190ArgThrGluGlyHisThrHisMetAlaLeuGluAspProGlyTrpSer195200205ArgLeuSerAlaThrValGlyAlaGluGlyLeuValProValProVal210215220ProValAspGlyAspGlyLeuArgValAspLeuLeuArgArgAlaPro225230235240GinValArgSerVallieValAlaProAlaHisGinPheProThrGly245250255ValValLeuAlaProAlaArgArgGlyGluLeuValAlaTrpAlaArg260265270GluValAspGlyLeuValLeuGluAspAspTyrAspAlaGluPheArg275280285TyrAspArgHisProValGlyAlaLeuGinGlyMetAlaProGluHis290295300ValAlaLeuLeuGlySerValSerLysThrLeuSerProAlaLeuArg305310315320lieGlyTrpAlaValThrProProArgTrpThrGluAlaLeuGlyAla325330335GluHisValGlyGlyValProProProVallieAspGinGluAlaPhe340345350AlaArgPheLeuAlaArgGlySerTyrAspArgTyrLeuArgAlaAla355360365ArgLeuArgTyrLysArgArgArgAspHisLeuMetGlyGluLeuAla370375380AlaSerLeuProGlyPheGinValSerGlyAlaAlaAlaGlyPheHis385390395400LeuLeuLeuSerLeuThrAspCysSerAlaProThrValValArgGlu405410415AlaAlaArgArgAspValArgLeuAlaAspLeuAspAlaTyrArgMet420425430AlaArgAlaGluHisHisProThrAlaArgAlaGlyAspSerGlyGly435440445AlaArgAlaValAlaAlaAlaGlyProAlaLeuValLeuGlyTyrGly450455460AsnLeuAlaAspHisAlaValProGlyAlaValArgArgLeuAlaGin465470475480AlalieAspAlaAlaArgArgHisAspArgArgHisValAspAlaGly485490495ArgAlaGlyGluArgAlaAsp500<210>147<211〉276<212>DNA<213>生二素链霉菌〈220〉〈221〉CDS<222〉(1)..(276)<400>147gtggcggagacggaceggcatetcgaccageggctggagcaggccate48ValAlaGluThrA印ArgHisLeuAspGinArgLeuGluGinAlalie151015atggacctgctggagcgaegggcggccactgcctegatetgtccgtec96MetAspLeuLeuGluArgArgAlaAlaThrAlaSerlieCysProSer202530gacgccgcgcgtegggtccacgagggtgacgacgagggctggcgagcc144AspAlaAlaArgArgValHisGluGlyAspAspGluGlyTrpArgAlactgctgLeuLeu50gaggtcGluVal65cgcgggArgGly35g33CCCGluProg3ggtgGluValcccgtcProVal4045gcgcgccgngcggcctggcgtctggtggggtecggc192AlaArgArgAlaAlaTrpArgLeuValGlySerGly55603CCC3ggccggceggCCCgtC3CgC3ggccgaggcc240ThrGinAlaGlyArgProValThrGinAlaGluAla707580cgcattcgtegggcgggttectgaArglieArgArgAlaGlySer8590<210〉148<211>91<212>PRT<213>生二素链霉菌<400>148ValAlaGluThrAspArgHisLeuAspGinArgLeuGluGinAlalie151015MetAspLeuLeuGluArgArgAlaAlaThrAlaSerlieCysProSer202530AspAlaAlaArgArgValHisGluGlyAspAspGluGlyTrpArgAla354045LeuLeuGluProAlaArgArgAlaAlaTrpArgLeuValGlySerGly505560GluValGluValThrGinAlaGlyArgProValThrGinAlaGluAla65707580ArgGlyProValArglieArgArgAlaGlySer2768590<210>149<211〉1236〈212>DNA<213〉生二素链霉菌<220><22DCDS<222>(1)..(1236)<400>149ctgcagatatacgactgctggggcgggagcaatcagcagtggacgttg48LeuGinlieTyrAspCysTrpGlyGlySerAsnGinGinTrpThrLeu151015acggacgaccgteggctgaccgtgtacggcaacaagtgcctggacgtt96ThrAspAspArgArgLeuThrValTyrGlyAsnLysCysLeuAspVal202530ccgggtcacgccaccacacccgggacgegggtgcagatetggagctgt144ProGlyHisAlaThrThrProGlyThrArgValGinlieTrpSerCys354045tecggcggtgcgaaccagcagtggegggtgaactecgacggcacggtc192SerGlyGlyAlaAsnGinGinTrpArgValAsnSerAspGlyThrVal505560gtcggcgtggagtecgggctgtgcctggaggccgcgggcgccggtacg240ValGlyValGluSerGlyLeuCysLeuGluAlaAlaGlyAlaGlyThr65707580gcc匿ggcacggcggtgcagategggacgtgcgtcggtggcagcggg288AlaAsnGlyThrAlaValGinlieGlyThrCysValGlyGlySerGly859095cagaagtggtecggcctgaccgggacgcccccgacggacggggcgtgt336GinLysTrpSerGlyLeuThrGlyThrProProThrAspGlyAlaCys100105110gcccttccgteggcgtaceggtggtegtegacgggtgtgctggcgcag微AlaLeuProSerAlaTyrArgTrpSerSerThrGlyValLeuAlaGin115120125ccggcgaacgggtgggcggcggtcaaggacttcaccaccgtgacccac432ProAlaAsnGlyTrpAlaAlaValLysAspPheThrThrValThrHis130135140aacggcaagcacctggtctacgcgtcgaacgtgtcggggtcgtectac480AsnGlyLysHisLeuValTyrAlaSerAsnValSerGlySerSerTyr145150155160ggctcgatgatgttcagecccttcacgaactggtcggacatggcgtcg528GlySerMetMetPheSerProPheThrAsnTrpSerAspMetAlaSer165170175gccggccagaccgggatgagtcaggcggcggtggcgcccaccctgttc576AlaGlyGinThrGlyMetSerGinAlaAlaValAlaProThrLeuPhe180185190tacttcgcgcccaagaacgtctgggtgctggcgtaccagtggggcgcg624TyrPheAlaProLysAsnValTrpValLeuAlaTyrGinTrpGlyAla195200205tggcccttcgtctaccgcacgtecagegacccggccaaccccaacggc672TrpProPheValTyrArgThrSerSerAspProAlaAsnProAsnGly210215220tggtcggetccgcagccgttgttcaccgggageateteaggatecgac720TrpSerAlaProGinProLeuPheThrGlySerlieSerGlySerAsp225230235240accggcccgategaccagaccctgategccgacggacagaacatgtac768ThrGlyProlieAspGinThrLeulieAlaAspGlyGinAsnMetTyr245250255ctgttcttcgccggtgacaacggcaagatetacegggcgageatgccg816LeuPhePheAlaGlyAspAsnGlyLyslieTyrArgAlaSerMetPro260265270ategggaacttcccgggcagettcggctcgtcgtacacgacgateatg864lieGlyAsnPheProGlySerPheGlySerSerTyrThrThrlieMet275280285agegacacgaaggccaacctgttcgagggcgtgcaggtctacaaggtt912SerAspThrLysAlaAsnLeuPheGluGlyValGinValTyrLysVal295300cagGin305ggcGlycagGin肌ccagAsnGinTyr310ctgLeuatgMetateliegtcValgagGlu315gcgAlaatgMetggcGlygcgAla肌cAsn320960GlycgcArgtacTyrttccgtPheArg325tecSerttcPheacgThrgccAlatecSer330ageSerctgLeuageSerggcGlytegSer335tggTrp1008accThrccgProcagGingccgcgAlaAh340ageSergagGluageSer幼cAsn345cccProttcPhegcgAlaggcGly卿Lys350gccAlaAsn1056ageSergggGlygccAla355acctggThrTrpaccThra^cAsngacAsp360atelieageSerescHisggtGlygacAsp365ctgLeugtcValcgcArg1104gacAspAsn370cccProgacca_gAspGin3CC丁hratgMet375accThrgtcValgacAspcccProtgcCys380肌cAsnctgLeueggArgttcPhe1152etcLeu385tacTyrcagGinggc卿GlyLysteaSer390cccPro£LCCThrAlaggcGlyggcGly395cccProtacTyrAspc站GinctgLeu4001200ccgProtggTrpeggArgccgggtProGly405gtgValetcLeu3CCThrLeueggArg410cgcArgtga1236<210〉150<211〉411<212〉PRT<213〉生二素链霉菌<400〉150LeuGinlieTyrAspCysTrpGlyGlySerAsnGinGinTrpThrLeu151015ThrAspAspArgArgLeuThrValTyrGlyAsnLysCysLeuAspVal202530ProGlyHisAlaThrThrProGlyThrArgValGinlieTrpSerCys354045SerGlyGlyAlaAsnGinGinTrpArgValAsnSerAspGlyThrVal505560ValGlyValGluSerGlyLeuCysLeuGluAlaAlaGlyAlaGlyThr65707580AlaAsnGlyThrAlaValGinlieGlyThrCysValGlyGlySerGly859095GinLysTrpSerGlyLeuThrGlyThrProProThrAspGlyAlaCys100105110AlaLeuProSerAlaTyrArgTrpSerSerThrGlyValLeuAlaGin115120125ProAlaAsnGlyTrpAlaAlaValLysAspPheThrThrValThrHis130135140AsnGlyLysHisLeuValTyrAlaSerAsnValSerGlySerSerTyr145150155160GlySerMetMetPheSerProPheThrAsnTrpSerAspMetAlaSer165170175AlaGlyGinThrGlyMetSerGinAlaAlaValAlaProThrLeuPhe180185190TyrPheAlaProLysAsnValTrpValL_euAlaTyrGinTrpGlyAla195200205TrpProPheValTyrArgThrSerSerAspProAlaAsnProAsnGly210215220TrpSerAlaProGinProLeuPheThrGlySerlieSerGlySerAsp225230235240ThrGlyProlieAspGinThrLeulieAlaAspGlyGinAsnMetTyr245250255LeuPhePheAlaGlyAspAsnGlyLyslieTyrArgAlaSerMetPro260265270lieGlyAsnPheProGlySerPheGlySerSerTyrThrThrlieMet275280285SerAspThrLysAlaAsnLeuPheGluGlyValGinValTyrLysVal290295300GinGlyGinAsnGinTyrLeuMetlieValGluAlaMetGlyAlaAsn305310315320GlyArgTyrPheArgSerPheThrAlaSerSerLeuSerGlySerTrp325330335ThrProGinAlaAlaSerGluSerAsnProPheAlaGlyLysAlaAsn340345350SerGlyAlaThrTrpThrAsnAsplieSerHisGlyAspLeuValArg355360365AspAsnProAspGinThrMetThrValAspProCysAsnLeuArgPhe370375380LeuTyrGinGlyLysSerProThrAlaGlyGlyProTyrAspGinLeu385390395400ProTrpArgProGlyValLeuThrLeuArgArg405410〈210〉151<211〉22<212〉腿<213〉人工序列<220〉<223>人工序列描述寡核苷酸KF36<400>151ttgccgtagccgaggaccageg22<210>152<211>22<212〉廳<213>人工序列<220〉<223>人工序列描述寡核苷酸KF37<400>152cacatggccctggaggaccctg22<210>153<211>30<212>廳<213〉人工序列<220><223>人工序列描述寡核苷酸KF42<400>153aagcttgtacggcccacagaatgatgtcac30<210>154<211>30<212>DNA<213>人工序列<220><223>人工序列描述寡核苷酸KF43<400>154aagcttcgactaccttggtgatctcgcctt30<210>155<211〉65<212〉DNA<213>人工序列<220><223>人工序列描述寡核苷酸KF32<400〉155caaccgcttgagctgctccatcaactgctgggccgaggtatcgcgcgcgcttcgttcggg60acg肌65<210>156<211>65<212>腿<213〉人工序列<220〉<223>人工序列描述寡核苷酸KF33<400〉156tgggtcccgccgcgcggcacgacttcgactcgctcgtctatctgcctcttcgtcccgaag60caact65<210>157<211〉65〈212>DNA<213>人工序列<220><223〉人工序列描述寡核苷酸EDR71<400>157cgtcatcgacgtgcggggaagacagaggtgataccgatgatcgcgcgcgcttcgttcggg60acgaa65〈210〉158<21D65〈212>DNA<213〉人工序列<220><223〉人工序列描述寡核苷酸EDR72<400>158gccagcacctcgtccagctgctcgacggaactcacccccatctgcctcttcgtcccgaag60C33Ct<210><211〉<212><213〉<220><223>6515966腿人工序列人工序列描述:寡核苷酸KF52<400>159gatccgccagcctcacgtcacgccgcgccgcctccctgacatcgcgcgcgcttcgttcgg60gacgaa66〈210〉160<211〉66〈212〉腿<213>Artificialsequnce<220〉<223〉人工序列描述寡核苷酸KF53<400〉160gaggcggacgtcggtacgcggtgggagccggagttcgacaatctgcctcttcgtcccg肌60gcaact66<210〉161<211〉2540〈212〉DNA〈213〉生二素链霉菌<400〉161ctgcagggcgcccacggggtggcggtcgtatcggaactcggcgtcgtagtcgtcctccag60caccaggccgtcgacctcgcgggcccaggcgaccagctcgccgcgacgggccggggcgag120gaccacaccggtcgggaactggtgggcgggagcgacgatcaccgaccggacctgaggcgc180gcgccgcagcaggtcgacccgcaggccgtcgccgtccacgggaaccgggacgggcaccag240CCCCtCCgCCCCgELCCgtggCgCtC3gCCgCgaCC兆CCagggtCCtCCagggCCEltgtg300ggtgtggccctcggtccgcaggacccggcacagcctgcgcaccgcgtccagcgtgcccgc兆Ogcagacgacgagctgccgggcttccagcgacgcgccgcgtccccgcacgaggtaggccgc420gagccgctgccggagccgggcgagaccggccggatcggggtagccgagctcgccccaggt480csgtgcgccggtggcctcccgcaccgcgtccgcccaccgtccgcggggaaaggcccgcag540gtcgggtatgccgggcagcatgtcgaactccggctcccaccgcgtaccgacgtccgcctc600gggcgtcaccggagcggggacggcctgcgccctgacccgggtggccgagccgctgcgcgc,ctccaggtacccctccgcgacgagctgcgcgtaggcctccgtcaccacccaccgcgagca720gcccaggtccgccgccagcgccctgctcggcggcagcgcgctgccggaggcgatccgccc780accggtcaccgccgcccgcagggcacggctcagccggacgtgcagcgggccgtccgccgg840cccgcccagttcgagaaaggttccccatgccgggtcggtccggtcgtcgcccacggcagc900cgatgctacccaccgccccgcgacggccgggcggcggcgtccacgggcccggtgcacact960ggatggcgtggcggagacggaccggcatctcgaccagcggctggagcaggccatcatgga1020cctgctggagcgacgggcggccactgcctcgatctgtccgtccgscgccgcgcgtcgggt1080ccacgagggtgacgacgagggctggcgagccctgctggaacccgcgcgccgagcggcctg1140gcgtctggtggggtccggcgaggtcgaggtgacccaggccggccggcccgtcacgcaggc1200cgaggcccgcgggcccgtccgcattcgtcgggcgggttcctgacggctcgatccgaaggc1260ggaactcccgtgccccggcggcacgggagctcgscgccgggaggtcagcgccgcagggtg1320agcacacccggccgccacggcagctggtcgtaggggccgcccgcggtgggtgacttgccc1380tggt卿ggaaccgcaggttgcaggggtcgacggtcatggtctggtcggggttgtcgcgg1440accaggtcaccgtggctgatgtcgttggtccaggtggccccgctgttggccttgcccgcg1500aaggggttgctctcgctcgcggcctgcggggtccacgagccgctcaggctggaggccgtg1560aaggaacggaagtagcgtccgttcgcgcccatcgcctcgacgatcatcaggtactggttc1620tggccctgaaccttgtagacctgcacgccctcgaacaggttggccttcgtgtcgctcatg1680atcgtcgtgtacgacgagccgaagctgcccgggaagttcccgatcggcatgctcgcccgg1740tagatcttgccgttgtcaccggcgaagaacaggtacatgttctgtccgtcggcgatcagg1800gtctggtcgatcgggccggtgtcggatcctgagstgctcccggtgaacaacggctgcgga1860gccgaccagccgttggggttggccgggtcgccccactggtacgccagcacccagacgttcaccgccgcctgactcatcccggtctggccggggctgaacatcatcgagccgtaggacgacttgccgttgtgggtcacggtggtg卿tccgccagcacacccgtcgacgaccaccggtacgggggcgtcccggtcaggccggaccacttctgcaccgccgtgccgttggccgtaccggcgacgccgacgaccgtgccgtcggagttcaccctccagatctgcacccgcgtcccgggtgtgttgccgtacacggtcagccgacggtcgtcccagcagtcgtatatctgcagctggacgtgcggtagacgaagggccacgcg1920ttgggcgcgaagtag獄agggtgggcgcc1980gccgacgccatgtccgaccagttcgtgaag2040cccgacacgttcgacgcgtagaccaggtgc2100ttgaccgccgcccacccgttcgccggctgc2160gccgacggaagggcacacgccccgtccgtc2220tgcccgctgccaccgacgcacgtcccgatc2280cccgcggcctccaggcacagcccggactcc2340cgccactgctggttcgcaccgccggaaca_g2400gtggcgtgacccgg犯cgtccaggcacttg2460gtcaacgtccactgctgattgctcccgccc25202540权利要求1.编码参与螺旋霉素生物合成的多肽的多核苷酸,其中所述多核苷酸的序列为(a)选自SEQIDNo.111和141的序列之一,(b)由于遗传密码的简并性而衍生自序列(a)的序列之一。2.多核苷酸,其与权利要求1所述的多核苷酸呈现至少70%,80%,85%,90%,95%或98%的核苷酸同一性。3.如权利要求2所述的多核苷酸,其分离自链霉菌属(Streptomyces)的细菌。4.如权利要求2所述的多核苷酸,其编码参与大环内酯生物合成的蛋白质。5.如权利要求2所述的多核苷酸,其编码的蛋白质所具有的活性与可与该多核苷酸杂交或与该多核苷酸呈现同一性的多核苷酸所编码的蛋白质的活性相同。6.由权利要求l、2、3、4或5所述多核苷酸的表达而产生的多肽。7.参与螺旋霉素生物合成的多肽,其中所述多肽的序列为选自SEQIDNo.112和142的序列之一。8.多肽,其与权利要求7所述的多肽呈现至少70%,80%,85%,90%,95%或98%的氨基酸同一性。9.如权利要求8所述的多肽,其分离自链霉菌属的细菌。10.如权利要求8或9所述的多肽,其编码参与大环内酯生物合成的蛋白质。11.如权利要求8或9所述的多肽,其具有的活性与与其具有同一性的多肽具有的活性相似。12.重组DNA,其包含至少一条如权利要求1,2,3,4或5中任一项所述的多核苷酸。13.如权利要求12所述的重组DNA,其中所述重组DNA包括于载体内。14.如权利要求13所述的重组DNA,其中所述载体选自噬菌体、质粒、噬菌粒、整合型载体、fosmids、粘粒、穿梭载体、BAC和PAC.15.如权利要求14所述的重组DNA,其选自pSPM36,pSPM58,pSPM74,pSPM75和pSPM107。16.表达载体,其包含至少一段编码如权利要求6,7,8,9,10或11中所述多肽的核酸序列。17.表达系统,其包含适当的表达载体和允许一条或多条如权利要求6,7,8,9,10或11中所述多肽表达的宿主细胞。18.如权利要求17中所述的表达系统,其选自原核表达系统和真核表达系统。19.如权利要求18所述的表达系统,其选自在细菌大肠杆菌中表达的系统、允许在昆虫细胞中表达的杆状病毒表达系统、允许在酵母细胞中表达的表达系统和允许在哺乳动物细胞中表达的表达系统。20.宿主细胞,其中已经导入了如权利要求1,2,3,4,5,12,13,14,15和16中任意一项所述的至少一条多核香酸和/或至少一个重组DNA和/或至少一个表达载体。21.产生如权利要求6,7,8,9,10或11所述多肽的方法,其中所述方法包括以下步骤a)将至少一种编码所述多肽的核酸插入适当的载体;b)在适当的培养基中,培养预先用步骤a)的载体转化或转染的宿主细胞;c)回收条件培养基或细胞提取物;d)从步骤c)获得的所迷培养基或细胞提取物分离并纯化所述多肽;e)根据需要,表征所产生的重组多肽。22.在至少一种大环内酯的生物合成途径步骤中受阻断的微生物。23.如权利要求22所述的微生物,该微生物是通过在产生这种(这些)大环内酯的微生物中失活至少一种参与这种(这些)大环内酯生物合成的蛋白质的功能而获得的。24.如权利要求23所述的微生物,其中这种(这些)蛋白质的失活是通过在编码所述蛋白质的基因中诱变或者通过表达一条或多条与编码所述蛋白质的信使RNA互补的反义RNA而实施的。25.如权利要求24所述的微生物,其中这种(这些)蛋白质的失活是通过辐射诱变、通过诱变化学剂的作用、通过定点诱变或通过基因替换而实施的。26.如权利要求24或25所述的微生物,其中一个或多个基因诱变是在体外或原位通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活而实施的。27.如权利要求22,23,24,25或26所述的微生物,其中所述微生物是链霉菌属细菌。28.如权利要求22,23,24,25,26或27所述的孩i生物,其中大环内酯是螺旋霉素。29.如权利要求22,23,24,25,26,27或28所述的微生物,其中所述樣£生物是生二素链霉菌(S.ambofaciens)菌林。30.如权利要求22,23,24,25,26,27,28或29所述的微生物,其中诱变是在至少一个包含如权利要求1,2,3,4和5中任意一项所述的序列的基因中进行的。31.如权利要求24,25,26,27,28,29或30所述的微生物,其中诱变是在一个或多个这样的基因中进行的,所述一个或多个基因包含对应于一个或多个序列SEQIDNo.111和141的序列之一。32.如权利要求24,25,26,27,28,29,30或31所述的微生物,其中诱变为对包含对应于一个或多个序列SEQIDNo.111和141的序列的基因进行基因失活。33.生二素链霉菌菌林,其为于2002年7月10日保藏在国立微生物保藏中心(CNCM)[NationalCollectionofCulturesandMicroorganisms]的保藏号为I-2卯9的菌林。34.制备大环内酯生物合成中间体的方法,其包括以下步骤a)在适当的培养基中,培养如权利要求22,23,24,25,26,27,28,29,30,31,32或33中任意一项所述的微生物,b)回收条件培养基或细胞提取物,c)从步骤b)中获得的所述培养基或细胞提取物中分离并纯化所述生物合成中间体。35.制备衍生自大环内酯的分子的方法,其中根据权利要求34中所述的方法制备生物合成中间体,并^奮饰如此产生的中间体。36.如权利要求35所述的制备方法,其中所述中间体经化学、生物化学、酶学和/或微生物学修饰。37.如权利要求35或36所述的制备方法,其中将一个或多个这样的基因导入所述#:生物,所述一个或多个基因编码能够通过利用中间体作为底物而修饰所述中间体的蛋白质。38.如权利要求35,36或37所述的制备方法,其中大环内酯是螺旋霉素。39.如权利要求35,36,37或38所述的制备方法,其中所用微生物是生二素链霉菌菌林。40.微生物,其产生螺旋霉素I而不产生螺旋霉素II和III。41.如权利要求40所述的微生物,其包含螺旋霉素I生物合成所需的全部基因,但是其中包含序列SEQIDNo.111或141、或由于遗传密码简并性而由其衍生的序列之一并编码序列SEQIDNo.112或142的多肽的基因是不表达的或者已经使其失活了。42.如权利要求41所述的微生物,其中所述失活是通过在编码所述蛋白质的基因中诱变或者通过表达与编码所述蛋白质的信使RNA互补的反义RNA而实施的。43.如权利要求42所述的微生物,其中所述诱变是在该基因的启动子中、编码序列中或非编码序列中进行的,从而使所编码的蛋白质失活或者阻止其表达或阻止由其翻译。44.如权利要求42或43所述的微生物,其中诱变是通过辐射、通过化学诱变剂的作用、通过定点诱变或通过基因替换而进行的。45.如权利要求42,43或44所述的微生物,其中诱变是在体外或原位通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活而进行的。46.如权利要求40或41所述的微生物,其中所述微生物是通过表达螺旋霉素生物合成途径的基因而获得的,其中所述基因不包括包含对应于SEQIDNo.111或141的序列、或由于遗传密码的简并性而由其衍生的序列之一并且编码序列SEQIDNo.112或142的多肽的基因。47.如权利要求40,41,42,43,44,45或46所述的微生物,其中所述微生物是链霉菌属的细菌。48.如权利要求40,41,42,43,44,45,46或47所述的微生物,其中所述微生物是从产生螺旋霉素I、II和III的起始菌抹获得的。49.如权利要求40,41,42,43,44,45,46,47或48所述的微生物,其是通过在包含对应于SEQIDNo.Ill或141的序列、或由于遗传密码简并性而由其衍生的序列之一,并且编码序列SEQIDNo.112或142的多肽或其具有相同功能的变体之一的基因中进行诱变获得的。50.如权利要求40,41,42,43,44,45,46,47,48或49所述的孩吏生物,其中所述微生物是从产生螺旋霉素I、II和III的生二素链霉菌菌林获得的,其中对含有对应于SEQIDNo.Ill或141的序列或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。51.生二素链霉菌菌林,其为2002年7月10日保藏于国立微生物保藏中心(CNCM)的保藏号为1-2910的菌林。52.产生螺旋霉素I的方法,其包括以下步骤(a)在适当的培养基中,培养如权利要求40,41,42,43,44,45,46,47,48,49,50和51中4壬意一项所述的孩i生物,(b)回收条件培养基或细胞提取物,(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化螺旋霉素I。53.如权利要求1,2,3,4和5中任意一项所述的多核苷酸的用途,用于提高微生物的大环内酯产量。54.产大环内酯的突变微生物,其在至少一个包含如权利要求1,2,3,4或5中任意一项所述序列的基因中具有遗传修饰和/或其过量表达至少一个包含如权利要求1,2,3,4或5中任意一项所述序列的基因。55.如权利要求54中所述的突变微生物,其中遗传修饰由在所考虑的基因中的一个或多个碱基的抑制、替换、删除和/或添加组成,目的在于表达一个或多个具有更高活性的蛋白质或者表达更高水平的这种(这些)蛋白质。56.如权利要求54中所述的突变微生物,其中所考虑基因的过量表达是通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更高的启动子而获得的。57.如权利要求54或56中所述的突变微生物,其中所考虑基因的过量表达是通过用如权利要求12、13或16中所述的允许该基因过量表达的重组DNA构建体转化产大环内酯微生物而获得的。58.如权利要求54,55,56或57中所述的突变微生物,其中遗传修饰是在一个或多个这样的基因中进行的,所述一个或多个基因包含对应于一个或多个序列SEQIDNo.111和141的序列之一、或由于遗传密码筒并性而由其衍生的序列之一。59.如权利要求54,55,56,57或58中所述的突变微生物,其中微生物过量表达一个或多个这样的基因,所述一个或多个基因包含对应于一个或多个序列SEQIDNo.111和141的序列之一、或其变体之一、或由于遗传密码筒并性而由其4汙生的序列之一。60.如权利要求54,55,56,57,58或59中所述的突变微生物,其中所述微生物是链霉菌属的细菌。61.如权利要求54,55,56,57,58,59或60中所述的突变微生物,其中大环内酯是螺旋霉素。62.如权利要求54,55,56,57,58,59,60或61中所述的突变微生物,其中所述微生物是生二素链霉菌菌林。63.产生大环内酯的方法,其包括以下步骤(a)在适当的培养基中,培养如权利要求54,55,56,57,58,59,60,61和62中任意一项所述的微生物,(b)回收条件培养基或细胞提取物,(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化产生的所述大环内酯。64.如权利要求1,2,3,4,5,6,7,8,9,10,11,12,13,14,15和16中任意一项所述的序列和/或重组DNA和/或载体的用途,用于制备杂化抗生素。65.如权利要求1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16和20中任意一项所述的至少一种多核普酸和/或至少一种重组DNA和/或至少一种表达载体和/或至少一种多肽和/或至少一种宿主细胞的用途,用于进行一种或多种生物转化。66.多核苷酸,其为与如权利要求1,2,3,4或5中所述的多核苷酸之一互补的多核苷酸。67.如权利要求50中所述的微生物,其中基因失活是通过同相删除包含对应于SEQIDNo.Ill或141的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因的一部分而进行的。68.如权利要求40,41,42,43,44,45,46,47,48,49,50或67中任意一项所述的^L生物,其也过量表达-使用以下序列引物对并且以粘粒pSPM36或生二素链霉菌总DNA为模板通过聚合酶链式反应(PCR)能够获得的基因5,AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3,(SEGIDNo.138)和5'GGATCCCGCGACGGACACGACCGCCGCGCA3'(SEQIDNo.139),-或由于遗传密码简并性而由其衍生的基因。69.如权利要求40,41,42,43,44,45,46,47,48,49,50,67和68中任意一项所述的微生物,其也过量表达具有编码序列SEQIDNo.47或具有由于遗传密码简并性而由其衍生的编码序列的基因。70.如权利要求69中所述的微生物,其为菌林SPM502pSPM525,于2003年2月26日保藏在国立微生物保藏中心(CNCM)巴斯德研究所,25rueduDocteurRoux75724ParisCedex15,法国,保藏号为1-2977。71.产生螺旋霉素的方法,其包括以下步骤(a)在适当的培养基中,培养如权利要求67,68,69和70中任意一项所述的微生物,(b)回收条件培养基或细胞提取物,(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化螺旋霉全文摘要本发明设计螺旋霉素生物合成途径新基因的分离和鉴定并且涉及参与该生物合成的新多肽。本发明还涉及产生所述多肽的方法。它还涉及所述基因用于增加所产生的螺旋霉素的产率和纯度的用途。本发明尤其涉及产生螺旋霉素I而不产生螺旋霉素II和III的微生物,以及此种微生物的用途。本发明还涉及螺旋霉素生物合成途径的基因用于构建能够导致新抗生素合成或螺旋霉素衍生形式合成的突变体的用途。本发明最后涉及过量表达所述基因所产生的分子并涉及过量表达此类基因所产生的分子的药学活性组合物。文档编号C12N15/31GK101302528SQ20081008239公开日2008年11月12日申请日期2003年10月8日优先权日2002年10月8日发明者A·贡德朗,C·热尔博,E·达尔邦-龙热尔,F·卡拉伊,H·多明格斯,J-L·佩尔诺代,K·蒂皮海尔,M-H·布隆德莱-鲁奥,N·厄斯特赖歇尔-梅尔梅-布维耶,P·拉克鲁瓦申请人:安万特医药股份有限公司;科学研究国家中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1