环噻唑霉素生物合成功能基因簇的制作方法

文档序号:577102阅读:558来源:国知局
专利名称:环噻唑霉素生物合成功能基因簇的制作方法
技术领域
本发明涉及一种基因工程技术领域的基因簇,具体是一种环噻唑霉素生物合成功 能基因簇。
背景技术
硫肽类抗生素是一类通常由微生物次级代谢产生的多肽类抗生素,具有如下结 构特点(Chem Rev(2005) 105,685 714)富含经高度修饰且含硫的大环形多肽;在空间 结构的中心位置是一个被三位或者四位噻唑环取代的含氮杂环(如吡啶和脱水哌啶);在 这个中心杂环的周围分布着众多被修饰过的异分子间形成的环状氨基酸残基,包括噻唑, 噁唑,脱氢氨基酸。除了诸多的结构共性之外,大多数硫肽类抗生素的生物活性也有共同 的特点几乎对革兰氏阴性菌没有毒性,而是通过干扰蛋白质的合成来抑制革兰氏阳性 菌的生长。具体到医学和农业领域的应用上来说,硫肽类抗生素所覆盖的领域非常的广 泛硫连丝菌素thiostr印ton能够抑制核糖体合成蛋白(J Mol Biol (1998) 276,391 404),还能诱导变铅链霉菌中TipA蛋白的大量合成(J Bacteriol (1989) 171,1459 1466);环噻唑霉素cyclothiazomycin则是一种具有潜在应用前景的肾素抑制剂(renin inhibitor),同时对水稻胡麻等农作物致病真菌也有杀灭作用(J Antibiot (1991) 44, 582-8 ;Bioorg MedChem(2006) 14,8259-70);在硫肽类抗生素这个大家族中,有相当多 的成员对各种高耐药性致病菌株都有抑制作用,包括MRSA(methicil 1 in-resistant Staphylococcus aureus), PRSP(penicillin-resistant Streptococcus pneumoniae) 禾口 VRE(vancomycin-resistant enterococci)(Chem Rev(2005) 105, 685 714 ;Chem Biol (2009) 16,141 147)。在细菌细胞内部,普通的L型氨基酸残基,是通过何种方式经由哪些酶类催化, 进行哪些生物化学反应,形成分子间的芳香环从而构建出复杂的空间结构,最终表现出 各种不同的生物活性硫肽类抗生素正是引发这一系列有趣问题的经典代表,一直以来, 有机化学家们都致力于在实验室中人工合成这种高度修饰的多肽(Angew Chem Int Ed Engl (2007) 46,7930 7954)。相较之下,生物学家们对之生物合成途径的研究成果就要匮 乏的多,这与之在医药农业领域的应用潜力极不相称。很长时间以来,对于硫肽类抗生素体 内合成的研究都仅仅止步于体内喂养实验的范围内(J. Am. Chem. Soc. (1993) 115,7992 8001 ;J. Am. Chem. Soc. (1996) 118,11363 11368 ;Bioorg Med Chem(1996)4,1135 1147),直到最近两年,随着多个核糖体合成肽类抗生素基因簇的克隆和报道,随着基因组 测序的进行,越来越多的可能编码硫肽类抗生素合成酶的基因簇出现在科学家的视线里 (Proc NatlAcad Sci U S A (2008) 105,5879 5884),为此类抗生素分子合成机制的深入 研究奠定了一定的基础。同时也为基于生物合成机制开展生物工程的实践探索打开了通 道。环噻唑霉素(cyclothiazomycin,CLT)是一种较为特别的硫肽类抗生素,它的结 构特点非常鲜明唯一拥有三环结构的硫肽(unique tricyclic structure),且在中心pyridine环的取代基团上,CLT并没有典型硫肽的2-和3-噻唑环取代,而是代之以丙氨 酸衍生出来的分子间环形残基(R-),游离的羧基端也因为碳硫键的存在而呈现出半游离状 态,且分子内并非都是还原状态的噻唑环,而是包含了 3个噻唑环和3个噻唑啉。环噻唑 霉素具有相当的抑制人体肾素的活性,且对很多农作物真菌病也有杀灭作用,所以环噻唑 霉素的应用潜力相当大。通过DNA重组技术可以对抗生素化学结构进行改造,提高效价、 扩大抗菌谱、降低毒性,同时对调节基因的遗传工程改造还可以提高抗生素的产量,这方 面的先驱Hopwood等利用来自不同链霉菌菌株的结构基因转移产生出新的杂合的抗生素 (Nature (1985) 314,642 644)。抗生素生物合成的相关基因,包括结构基因,抗性基因以 及调节基因一般都成簇存在(Annu. Rev. Microbiol. (1989) 43,173 206)。环噻唑霉素的 生物合成方面的研究未见任何报道。经对现有技术的文献检索发现,尚未见到与本发明的环噻唑霉素生物合成基因簇 有
关的报道。

发明内容
本发明的目的在于克服现有技术的不足,提供一种环噻唑霉素生物合成功能基因 簇、重组载体及宿主。本发明的基因簇包含了环噻唑霉素生物合成的所有遗传元件,实现了 环噻唑霉素的生物合成。本发明是通过以下的技术方案实现的本发明涉及一种环噻唑霉素生物合成基因簇,该基因簇包含分别编码如下氨基酸 序列的17个基因,所述氨基酸序列具体为=SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ IDNO :5、SEQ ID NO :6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9、SEQ ID NO :10、SEQ ID N0:11、SEQ ID NO 12,SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO 15,SEQID NO : 16、SEQ ID NO :17、SEQ ID NO :18。进一步地,所述环噻唑霉素生物合成基因簇包含如下17个基因,所述17个基因的 碱基序列具体为(I)SEQ ID NO :1 第 16526 16705 位所示碱基序列、(2) SEQ ID NO :1 第 14372 16411 位所示碱基序列、(3) SEQ ID NO :1 第 16870 18555 位所示碱基序列、(4) SEQ ID NO :1第1邪93 2O533位所示碱基序列、(5) SEQ ID NO :1 第 11730 14354 位所示碱基序列、(6) SEQ ID NO :1 第 10733 11755 位所示碱基序列、(7) SEQ ID NO :1第%01 IO625位所示碱基序列、(8) SEQ ID NO 1第4875 5妨2位所示碱基序列、(9) SEQ ID NO 1第4404 4了36位所示碱基序列、(IO)SEQ ID NO :1 第 20695 21204 位所示碱基序列、(Il)SEQ ID NO :1 第 1857 2747 位所示碱基序列、(12) SEQ ID NO :1 第 6629 9424 位所示碱基序列、(13) SEQ ID NO :1 第 2829 4262 位所示碱基序列、(14) SEQ ID NO :1 第 5867 6442 位所示碱基序列、
(15) SEQ ID NO 1 第 21712 22153 位所示碱基序列、(16) SEQ ID NO :1 第 1182 1541 位所示碱基序列、(17) SEQ ID NO :1 第 21248 21601 位所示碱基序列。所述环噻唑霉素生物合成基因簇的碱基序列如SEQ ID NO=I所示。与现有技术相比,本发明具有如下的有益效果本发明得到的基因簇通过异源表 达的方式在异源宿主变铅青链霉菌1326中实现了环噻唑霉素的生产,异源表达生测抑菌 圈和发酵物提取物的质谱检测都证实了该基因簇在异源宿主中的功能性,也即其包含了环 噻唑霉素生物合成的所有遗传元件。


图1为环噻唑霉素的化学结构图;图2为环噻唑霉素的生物活性测定结果图;图3为10-22发酵物甲醇提取物的Q-TOF检测的离子流图;图4为图3的离子流提取放大以及同位素丰度示意图;图5为环噻唑霉素分子的简单示意图;图6为二级质谱分析图;图7为环噻唑霉素基因簇的结构图;图8为异源表达定位出环噻唑霉素的完整合成基因簇图;图9为异源表达的1326: :pJTU4892发酵提取物质谱分析图;图10为环噻唑霉素生物合成途径示意图。
具体实施例方式下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明 而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条 件,例如 Sambrook 等分子克隆实验室手册(New York Co Id Spring Harbor Laboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。实施例1环噻唑霉素生物合成功能基因簇的获得本实施例中的环噻唑霉素生物合成功能基因簇的序列如SEQ ID NO :1所示,得到该基因簇的步骤如下步骤一,环噻唑霉素产生菌吸水链霉菌10-22总DNA的提取接种10-22至TSBY(10. 3%蔗糖)培养基于含有弹簧的三角瓶中30°C培养48h。 离心收集菌体,重悬于 5ml SET 缓冲液中(75mM NaCl, 25mM EDTA pH8. 0,20mM Tris-HCl ρΗ7· 5)。加入100 μ 1溶菌酶溶液(50mg/ml),置37°C约60分钟。溶菌后然后加入140 μ 1 蛋白酶K溶液(20mg/ml)混均勻,再加600 μ 1 10% SDS,通过颠倒混勻,置55°C温浴2h,期 间偶尔颠倒几次。再加入2ml 5M NaCl,彻底混勻,冷却置37°C后,加入5ml氯仿,于室温轻 轻混勻。20°C、4500g离心15分钟。转移上清至新管中,加入0. 6倍体积的异丙醇颠倒混 勻,约3分钟后用玻棒挑取至含70%乙醇的新管中洗涤,重复2次,空气中干燥,溶解在TE 中。
步骤二,吸水链霉菌10-22菌基因组文库的构建(1)吸水链霉菌10-22总DNA的部分酶解和大片段DNA的回收 将提取的10-22总DNA用Sau3AI部分酶解,用1 %低熔点琼脂糖凝胶,在装有0. 5 倍 TBE 电泳缓冲液的脉冲场电泳(Pulse Field Gel Electrophoresis, PFGE, Bio-Rad) 中分离。回收约40kb大小的DNA片段。用热敏的碱性磷酸酶(APex Heat-Lab i 1 e AlkalinePhosphatase, EPICENTRE Biotechnologies 公司)处理是末端去磷酸化,供和载 体的连接及包装转染用。(2)连接和包装将处理好的10-22基因组DNA (大小约40kb)和经BamHI酶切并用CIAP处理的柯 斯质粒PHZ1358按照1 1分子数比例用T4连接酶(NEB公司)连接。将在冰上溶解的噬
(MaxPlax Lambda Packing Extracts, EPICENTRE Biotechnologies ^W]) 加入连接产物中,混勻,避免产生气泡,短暂离心,在30°C中温浴90分钟,再加入另一份包 装蛋白,继续温浴90分钟后加入噬菌体稀释缓冲液(Phage Dilution Buffer, lOOmM NaCl, IOmM MgCiaOmM Tris-HCl ρΗ8· 3)至 lml,并加入 25 μ 1 氯仿,4°C保存。(3)转染与保存将大肠杆菌EPI300(见表2-1)培养至OD6tltl = 0. 8 1. 0作为感受态菌,可在4°C 保存72h。将包装产物与感受态菌混合,37°C温浴20分钟后涂含阿伯拉抗生素的LB平板。 37°C培养过夜。挑取单克隆至含抗生素的LB培养基96孔板中继续培养18小时,加入灭菌 的甘油至终浓度20%,于-70°C中保存。步骤三,基因组文库的筛选采用PCR的方法从基因组文库中筛选所需要的柯斯质粒。为筛选基因组文库,从 每个板的96孔孔中取出等量菌液混合,接种培养,提取质粒为一个模板进行PCR筛选,在得 到的阳性平板中,从每排的12个孔中取出等量菌液混合,接种培养,提取质粒为一个模板 进行PCR筛选。然后在那些阳性的排中进行单个的PCR筛选,直至筛出所有阳性克隆。步骤四,环噻唑霉素生物合成基因簇分析在异源宿主1326 (Antimicrob Agents Chemother (1992) 36 (5) 1119 ? 124)中一 系列表达载体的实验结果表明,环噻唑霉素基因簇主要由两大部分组成,一部分是负责环 噻唑霉素框架结构形成的8个蛋白CltB/C/D/E/F/G/M/N,另一部分则是一些辅助抗生素合 成的因子,包括转录调节因子、转运蛋白,以及可能帮助基因簇发生水平迁移的转座酶等。在环噻唑霉素的合成基因簇中,有一个巨大的操纵子(operon) :cltD/C/A/B/E/ F/G,这一特征和其他已知基因簇的硫肽类抗生素非常相像(Chem Biol (2009) 16,141 147),和其他同样也是核糖体合成的多肽类抗生素的基因分布也相当类似(Proc Natl Acad SciU S A (2008) 105,5879 5884);考虑到在原核生物中,一个操纵子编码的产物在 空间分布上聚合在一起的可能性很大,故而可认为这6个蛋白组成一个大的合酶系统,将 前体肽CltA包围在其中,对其进行翻译后修饰,这个后修饰的过程包括固定CLT前体、Ser 和Thr的脱水、Cys脱水环化形成噻唑啉、进一步脱水形成噻唑、中心位置吡啶环的合成、游 离的羧基端硫酯键的形成、前导肽的切除和最终产物的释放。在CLT的基因簇中发现了两个调节蛋白,CltH/P,这在已报道的硫肽类抗生素基因 簇中的唯一的(Chem Biol (2009) 16,141 147 ;Proc Natl Acad Sci U S A(2009) 106 (8),2549 2553)。其中CltH隶属于LuxR转录调节因子家族,与多烯类抗生素nystatin 生物合成基因簇中的正调节因子NysI有32%的同源性(J Bacteriol (2004) 186 (5), 1345-54)。CltP则与一个属于XRE家族的DNA结合蛋白/转录调节因子有43%的同源 性。CltO是基因簇中唯一的一个转运蛋白,也是目前已知硫肽基因簇中唯一一个转运 蛋白,它包含一个糖转运家族的结构域(a sugar-transport family domain),但是无 法判断出明显的底物识别区域,该区域在Iantibiotic前体肽的延伸过程中是必需的 (Biochemistry (2008) 47 (28),7352 7363)。CLT生物合成基因簇还有一个很特征,在其中 散布着4个转座酶,其中有两对,Cltl/L以及CltQ/L,正好分别将主体框架合成酶(I和L) 以及所有的合成酶(Q和L)包围在其中。这种在硫肽类抗生素中罕见的现象说明CLT的生 物合成基因簇很可能部分或者全部都源自种属间的水平基因转移。步骤五,环噻唑霉素生物合成途径推导通过基于精确的异源表达的基因簇组成蛋白分析以及CltM/N的缺失表达突变株 产素分析,我们对环噻唑霉素的合成途径推导见图10,首先应该是各个氨基酸残基自身的 脱水和环化。其中,CltE和CltF负责了 Ser和Thr脱水生成Dha和Dhb (见图5中的反 应c),这个过程在Iantibiotics的生物合成途径中已有报道。CltB和CltC则与MccB17, streptolysin S(Proc Natl Acad Sci U S A(2008)105,5879 5884)和thiocillins(Proc Natl AcadSci U S A (2009) 106 (8),2549 2553)基因簇中负责氨基酸残基间异源环合成 的酶同源。而CltB中,两个不同的domain则很可能在噻唑类环形成的过程中扮演不同的 角色DFU181在空间上固定住前体肽,YcaO则将目标残基进行脱水环化(见图10中的反应 a) οCltC也包含了两个domain,两个都属于mcbC-like domain家族,从环噻唑霉素中 噻唑啉和噻唑环的分布特征来看,很可能两个domain特异识别一对并排的噻唑啉为底物, 而仅有其中一个domain对N端的噻唑啉催化使之脱氢生成噻唑,而保持另一个C端的噻唑 啉还原状态不变(见图10中的反应b)。如此往复,造成了环噻唑霉素分子结构中不寻常的 噻唑啉和噻唑并存的状态(见图10中的数字标识8)。 硫肽类抗生素的结构特征之一就是取代吡啶或者是脱水哌啶(Chem Rev(2005) 105,685 714),那么在CLT的合成过程中,哌啶很有可能扮演一个中间 产物的角色。体外实验已经证明一个分子间异源的DA反应(an intramolecular hetero-Diel-Alder reaction)能够合成一个哌啶环(见图10中的反应d)。同源性比 较分析揭示了 CltD也是一个双结构域组成的蛋白,值得注意的是,其N端与一个肽酶(a putative peptidase M14, carboxyp印tidase Α)有41%的相似性。这个肽酶结构域的发 现在硫肽基因簇中尚属首次,它表明LP的切除很可能由该亚基来完成。而CltD的C端则 被YcaO家族结构域占据,这个前文中已经讨论被认为是环化脱水酶的一个亚基,因此我们 推测该结构域在吡啶的形成中也执行类似的功能即将参与哌啶形成的几个氨基酸残基固 定在一个相邻的位置上进行DA反应成环后再脱水,从而生成了一个脱水哌啶的中间产物 9(见图10)。在Thio和thiocillins的基因簇功能探讨中,LP的切除普遍都被认为是成 熟抗生素合成的最后一步,而在CLT的生物合成中,由于两种不同功能的结构域共存于一 个ORF中,因此我们相信这个肽链剪切过程发生在吡啶的合成过程中。CltG与已知蛋白没 有明显的同源性,在这里可能是催化LP被切除后的脱氨基过程(见图10中的反应e)。
CLT的化学结构中还有另一个不寻常的硫醚键存在,它是由脱水的S5和C18两个残基组成,跟Iantibiotics中常见的β位硫醚键不同,这里是C18上的硫元素和S5上α 位的碳原子之间形成的叔碳硫醚键(tertiary thioester)(具体见图1)。在Iantibiotic 的生物合成过程中,分子间的硫醚键是由Cys上的硫通过麦克尔加成(Michael Addition) 的方式加到折叠后处于临近位置的Ser和Thr上的β位碳上去的[Org Lett (2007) 9 (17), 3343-6]。CLT中这个α位上的硫醚键很可能源自β位的硫醚键,是通过一个重排反应生 成的(见图10中的反应g)。基因簇中的CltN与EthD有34 %的序列同源性,EthD是一个能够将石油污 染物乙基叔丁基醚(ETBE)降解的细胞色素P-450基因簇中一个必需的蛋白。在EthD 缺失的情况下,基因簇中的其他基因不能够回补一株ETBE缺陷菌株的降解活性(J Bacteriol (2001) 183 (22),6551-7)。虽然EthD的生物学功能并没有解释清楚,但是它参与 的反应中出现了叔丁基的身影,这给了我们一些启示CltN很可能就是负责重排生成这个 叔碳硫醚键的催化蛋白。而与之共处于一个操纵子之中的CltM,则可能就是参与到上述的 麦克尔加成中的蛋白(见图10中的反应f)。与前面讨论的大分子蛋白不同,无论是CltM 还是CltN都是小分子酶,都没有类似YcaO的固定结构域,这意味着已经完成吡啶合成后的 未成熟CLT已经正确折叠到合适的位置,使得S5和C18得以相邻,以供上述两个蛋白完成 催化叔碳硫醚键形成的功能。经过上述后修饰过程,成熟的环噻唑霉素被切掉前提肽后结 合到转运蛋白CtlO上,运输至胞外执行抗菌功能。步骤六,环噻唑霉素生物合成基因簇中基因的制备以环噻唑霉素生物合成基因簇的序列SEQ ID NO 1为模板,设计引物,采用PCR方 法可分别得到如下17个基因(1)负责环噻唑霉素前体多肽生物合成的结构基因1个cltA ;所述基因cltA, 位于SEQ ID NO :1的第16526 16705位;编码的蛋白的序列如SEQ ID NO :2所示;功 能编码环噻唑霉素前体肽。PCR扩增引物序列为F (5 ’ ATGGAGAAGGAACTCGTCCT 3 ’)和 R (5,TCAGCAGCAACAGCACGAGCA 3,),扩增条件为 95 °C 5 分钟,95°C 30 秒 60 °C 30 秒 72 °C 30 秒共30个循环,最后72 °C 5分钟。(2)负责环噻唑霉素翻译后修饰的酶基因cltB,位于SEQ ID NO 1的第14372 16411位,编码的蛋白的序列如SEQ ID NO 3所示;功能编码NADH氧化酶,该氧化酶负责 催化噻唑啉脱氢生成噻唑。PCR扩增引物序列为F (5 ’ GTGACCGTGACCGACACCGCCGC3,)和 R(5,TCACGGGAACGGGTGCGG3,),扩增条件为 95°C 5 分钟,95°C 30 秒 64°C 30 秒 72°C 90 秒共 30个循环,最后72 °C 5分钟。(3)负责环噻唑霉素翻译后修饰的酶基因cltC,位于SEQ ID NO 1的第16870 18555位,编码的蛋白的序列如SEQ ID NO :4所示;功能编码环化肽酶,该酶负责催化中央 吡啶的环化和前导链的切除。PCR扩增所用引物序列为F(5’GTGGCCGACGCGGACGCCGACA 3’) 和 R(5,TCACCATGTCAGCGGCAT3,),扩增条件为 95°C 5 分钟,95°C 30 秒 64°C 30 秒 72°C 90 秒共30个循环,最后72 °C 5分钟。(4)负责环噻唑霉素翻译后修饰的酶基因cltD,位于SEQ ID NO 1的第18593 20533位,编码的蛋白的序列如SEQ ID NO :5所示;功能编码氨基酸(丝氨酸/苏氨酸) 脱水酶的核苷酸序列,该酶负责催化丝氨酸和苏氨酸的脱水。PCR扩增所用引物序列为F (5,ATGGCCGTGACAATCGCCAGA 3,)和 R (5,CTAGTCATCGAGGACCACGAC 3,),扩增条件为 95 °C 5 分钟,95°C 30秒62 °C 30秒72 °C 120秒共30个循环,最后72 °C 5分钟。(5)负责环噻唑霉素翻译后修饰的酶基因cltE,位于SEQ ID NO 1的第11730 14354位,编码的蛋白的序列如SEQ ID NO :6所示;功能编码氨基酸脱水酶的核苷酸序列, 该酶负责催化丝氨酸和苏氨酸的脱水。PCR扩增所用弓I物序列为F (5 ’ ATGACCGAGAACCACACCA 3,)禾口 R(5‘ TCAAGCGGGCCGCTGTCGTTCT 3,),扩增条件为 95°C 5 分钟,95°C 30 秒 62°C 30 秒 720 C 180秒共30个循环,最后72°C 5分钟。(6)负责环噻唑霉素翻译后修饰的酶基因cltF,位于SEQ ID NO :1的第 10733 11755位,编码的蛋白的序列如SEQ ID NO 7所示;功能编码脱氨基酶的核苷 酸序列,该酶负责催化完成形成吡啶的最后一个脱氨基步骤。PCR扩增所用引物序列为 F(5‘ ATGCCGGAGAACGACAGC 3,)和 R(5,TCACGAGGCGGCCAGTGCCT 3,),扩增条件为 95°C 5 分 钟,95°C 30秒64°C 30秒72 °C 40秒共30个循环,最后72 °C 5分钟。(7)负责环噻唑霉素翻译后修饰的酶基因cltG,位于SEQ ID NO :1的第 9501 10625位,编码的蛋白的序列如SEQ ID NO :8所示;功能编码LuxR家族的 转录调节蛋白,该酶参与了环噻唑霉素合成的调节过程。PCR扩增所用引物序列为 F (5,GTGGCACCGTGGGCCGAG 3,)禾口 R(5,TCAGCCGGCTCCGCCGGC 3,),扩增条件为 95°C 5 分 钟,95°C 30秒68 °C 100秒共30个循环,最后72 °C 5分钟。(8)负责环噻唑霉素翻译后修饰的酶基因cltM,位于SEQ ID NO=I的第4875 5462位,编码的蛋白的序列如SEQ ID NO :14所示;功能编码的蛋白该酶参与了环噻 唑霉素中硫醚键的形成。PCR扩增所用引物序列为F (5 ’ GTGCGCTGCGACTTCCGGT 3 ’)和 R(5‘TCATCGACGACACGGTTCA 3,),扩增条件为 95°C 5 分钟,95°C 30 秒 64°C 30 秒 72°C 30 秒 共30个循环,最后72°C5分钟。(9)负责环噻唑霉素翻译后修饰的酶基因cltN,位于SEQ ID NO=I的第4404 4736位,编码的蛋白的序列如SEQ ID NO :15所示;功能编码类似ETBE降解相关蛋白 (Ethyltert-butyl ether degradation EthD),该酶可能参与了环噻唑霉素中硫醚键的形 成。PCR 扩增所用弓丨物序列为 F (5,ATGATCATTACGCTCAAGC 3,)和 R (5,TCATCGGCCGTCGATGACT 3,),扩增条件为95°C 5分钟,95°C 30秒58°C 30秒72°C 30秒共30个循环,最后72°C 5分 钟。(10)负责环噻唑霉素翻译后修饰的酶基因cltJ,位于SEQ ID NO 1的第20695 21204位,编码的蛋白的序列如SEQ ID NO 11所示;功能环氧化物水解酶,该酶可能参与 了环噻唑霉素中硫醚键的形成。PCR扩增所用引物序列为F(5’ ATGCGCCGGCACCGCTCGA 3’) 禾口 R (5,CTACCTCGACCGGACGAT 3,),扩增条件为 95 °C 5 分钟,95°C 30 秒 60 °C 30 秒 72 °C 30 秒共30个循环,最后72 °C 5分钟。(11)负责环噻唑霉素生物合成的调节基因cltP,位于SEQ ID NO 1的第1857 2747位;编码的蛋白的序列如SEQ ID NO :17所示;功能XRE family转录调节因子,该因子 参与了环噻唑霉素合成的调节过程。PCR扩增所用弓I物序列为F (5’ ATGATCGTTGCCATGGCGGA 3,)禾口 R(5‘ TCAGGTTGCTGCAAGCAGGTGC 3,),扩增条件为 95°C 5 分钟,95°C 30 秒 62°C 30 秒 72 0C 50秒共30个循环,最后72 °C 5分钟。(12)负责环噻唑霉素生物合成的调节基因cltH,位于SEQ ID NO 1的第6629 9424位;编码的蛋白的序列如SEQ ID NO 9所示;功能LuxR家族的转录调节蛋白。PCR 扩增所用引物序列为 F(5’ ATGATCGTTGCCATGGCGGA 3’)和 R(5’ TTGACCTCAGTCGATCGAATCG 3,),扩增条件为95°C 5分钟,95°C 30秒62°C 30秒72°C 150秒共30个循环,最后72°C 5 分钟。(13)环噻唑霉素生物合成后负责产物运输的转运蛋白基因cltO,位于SEQ ID NO 1的第2829 4262位;编码的蛋白的序列如SEQ ID NO 16所示;功能转运蛋白,负责环 噻唑霉素生成后的外运过程。PCR扩增所用弓I物序列为F (5 ’ GTGAGTGCATGCAACGGACCT 3 ’) 禾口 R (5,TCAATCGAGTGCCTCCGT 3,),扩增条件为 95 °C 5 分钟,95°C 30 秒 62 °C 30 秒 72 °C 90 秒共30个循环,最后72 °C 5分钟。(14)转座酶基因cltl,位于SEQ ID NO :1的第5867 6442位;编码 的蛋白的序列如SEQ ID NO :10所示;功能转座酶。PCR扩增所用引物序列为 F (5,ATGGGCCGCCTGCGCGTT3,)和 R (5,TCATCCGTCCGTGCCCGCC 3,),扩增条件为 95 °C 5 分 钟,95°C 30秒68 °C 60秒30个循环,最后72 °C 5分钟。(15)转座酶基因cltL,位于SEQ ID NO :1的第21712 22153位;编码的蛋白的 序列如SEQ ID NO :13所示;功能IS1648转座酶,该酶可能参与了基因簇的水平转移。PCR 扩增所用引物序列为 F(5,GTGAGTAACGGGCGTTGC 3,)和 R(5,TCAAGGCGGACCGATGTG 3,),扩 增条件为95 °C 5分钟,95°C 30秒68 °C 40秒共30个循环,最后72 °C 5分钟。(16)转座酶基因cltQ,位于SEQ ID NO 1的第1182 1541位;编码的蛋白的序 列如SEQ ID NO :18所示,功能转座酶,该酶可能参与了基因簇的水平转移。PCR扩增所用 引物序列为 F(5,ATGGAGGCGATCCGGGTGC 3’)和 R(5’ TCACGCCCACATCAGTAG 3’),扩增条件 为95°C 5分钟,95°C 30秒63°C 30秒72°C 40秒共30个循环,最后72°C 5分钟。(17)氮还原酶基因cltK,位于SEQ ID NO 1的第21248 21601位;编码的蛋白 的序列如SEQ ID NO :12所示;功能氮还原酶(nitroreductase)家族蛋白。PCR扩增所用 引物序列为 F(5,ATGGACGTATATGAGGCCGT 3’)和 R(5’ TCAAGGTAGCGATCTTCCT 3’),扩增条 件为95°C 5分钟,95°C 30秒60°C 30秒72°C 40秒共30个循环,最后72°C 5分钟。实施例2环噻唑霉素生物合成功能基因簇功能的验证步骤一,吸水链霉菌10-22及变铅青链霉菌1326异源生产株的培养将吸水链霉菌10-22及变铅青链霉菌1326异源生产株(Antimicrob Agents Chemother (1992) 36 (5) :1119 1124)接种于SFM固体培养基平板上,30°C培养5 7天, 用打孔器将培养物打成菌块备用。将PDA固体培养基平板上活化的吸水霉素生物学活性测 定指示灰霉菌(Botrytis cinerea Persoon)菌丝体收集到0. 5ml无菌水中混勻打碎,均勻 混于60°C左右尚未凝固的PDA培养基中,混勻后倒板,在合适的位置上放置待测的链霉菌 菌块,30°C培养48h后观察结果,结果见图2。步骤二,环噻唑霉素的快速提取取培养7天的固体发酵物,用两倍体积的甲醇浸泡过夜,并将浸泡液以15000g离 心10分钟2次,用无水硫酸钠去水,然后用真空旋转蒸发仪将其旋干,再以等体积甲醇将 剩余物重新溶解,样品用0. 2微米的一次性过滤器过滤,进行质谱检测。利用LC-ES-Q-TOF 对环噻唑霉素进行高精度质谱检测分析,LC-ES-Q-TOF分析采用的是安捷伦公司Agilent1200 系统,柱子规格为 2· IX 30mm C18 reverse-phase column (Agilent Co.CA),流速为 0. 3ml/min。A泵溶液为10%的乙腈溶液(含0. 1 %甲酸),B泵溶液为含0. 甲酸的乙腈。 梯度洗脱条件是,0 10分钟内溶液B的浓度从0 90%。质谱检测是通过安捷伦公司的 6530Accurate-Mass Q-TOF质谱检测仪;二级质谱是采用指定靶点依赖的模式进行。检测 结果见图3,图4将图3的离子流峰进行放大后得到的一价和二价正离子的分布以及同位素 峰图。二级质谱的具体结果和分析见图5和图6。异源表达菌株的CLT质谱分析结果见图 9。
步骤三,异源表达双功能质粒载体的构建本实施例中用于异源表达载体的构建采用酶切连接的方法。因为构建文库所用 的柯斯质粒(PHZ1358)是一种大肠杆菌链霉菌的穿梭质粒,具有在链霉菌中遗传不稳定 的特点,在非抗性选择的条件下,质粒极容易丢失,所以不适合用于异源表达。本实施例采 用的是以PSET152为载体,将基因组文库中筛选到的负责环噻唑霉素生物合成的柯斯质 粒酶切,连接到经相应限制性内切酶酶切的PSET152载体上见图8,构建了载体pJTU4891 和pJTU4892。pJTU4894是作为基因缺失质粒构建的,采用了 PCR-Targeting的方法在将 PJTU4891转化至含有pIJ790质粒的大肠杆菌BW25113中(E. coli BW25113/pIJ790)中制 备成感受态细胞,以通过PCR扩增的pIJ779或pIJ778中含有的aac基因(带有与目的替 换基因两侧同源的尾端)DNA进行电转化,得到基因置换质粒pJTU4894。所有的异源表达载 体构建成功后都转化到大肠杆菌ET12567中以消除DNA甲基化影响,然后用接合转移的方 法转化变铅青链霉菌1326。步骤四,环噻唑霉素的异源表达确定了一个完整的生物合成基因簇从吸水链霉菌10-22基因组文库中用基于环化脱水酶的保守序列设计的引物筛 选得到两个阳性cosmids,其中含有较长插入片段的一个质粒14E6测序后进行后续的分 析。将14E6用XbaI和EcoRI双酶切后与穿梭载体pSET152双酶切后的片段连接,构 建出含有27kb插入序列的重组质粒PJTU4891,将之通过大肠杆菌ET12567介导转入异源宿 主变铅青链霉菌1326中,对照是空载体pSET152转入1326。生测实验表明pJTU4891使得 1326具有了抑制灰霉菌的活性,作为对照的含空载体菌株则没有活性(图7,8)。这一结果表明27kb的插入片段中包含了完整的环噻唑霉素生物合成基因簇。在 此克隆的基础上,进一步构建了多个衍生质粒,确认一段22kb的序列包含了基本最小化的 环噻唑霉素生物合成基因簇。其中含有最小基因簇的PJTU4892在1326中的表达产物质谱 分析如图9。序列表<110>上海交通大学<120>环噻唑霉素生物合成功能基因簇<160>18<170>PatentIn version 3. 3<210>1<211>34982<212>DNA
<213>Streptomyces hygroscopicus 10-22<400>1ggatcttttccgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtat atc60catcctttttcgcacgatat acaggatttt gccaaagggt tcgtgtagac tttccttggt120gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt180ccttcttcactgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag240gctggccggctaccgccggc gtaacagatg agggcaagcg gatggctgat gaaaccaagc300caaccaggaa gggcagccca cctatcaagg tgtactgcct tccagacgaa cgaagagcga360ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc420agggctacaaaatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca480atggcgacctgggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca540cggcgcggttcggtgatgcc acgatcctcg ccctgctggc gaagatcgaa gagaagcagg600acgagcttggcaaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt660agccgctaaaacggccgggg ggtgcgcgtg attgccaagc acgtccccat gcgctccatc720aagaagagcgacttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgat780ccccggggacctgcaggtcg actctagagg atcgtgtgga agttccgtac cgggacggcc840tggcgggatgtgcctgagcg gtacgggccg tgggccacgc tgtacacccg ttttcgccgg900tgggcggcggacggcacgtt cgaacggatg ctccgcgccg cgcagtcccg ggtcgacgcc960gtcggtgacatcgactggct ggtgtcggtc gactccacca tcgtccgcgc ccaccagcat1020gccgccggtgctcgaaaagg gggctccgca gcccagctct cgggcgctcc cgaggcggcc1080tgaccagcaagattcacctg gcctgcgacg gtgccggccg cccgctcgcc ttcatcgtca1140cgggcggcaacgccaacgac tgcacccagt tctccgctgt gatggaggcg atccgggtgc1200cccgcccaggcccggggcgg ccccgggtgc ggccctcgca cgtcctgggc gacaagggct1260acagctccagggcgatccgc agctggctgc gtcggcgcgg gatcagccac accattcccg1320agcgagccgatcaggtccgc aaccggctga accgcggcag ccgtggcgga cggcccccgg1380ccttcgaccgcgacacctac aagcggcgca acgtggtgga acggtgcttc aacaagctga1440agcagtggcgcggcatcgcc acccggtacg acaagaccac cgagtcctac caagcagccg1500tcaccctcgcagccctactg atgtgggcgt gacgtttgac gacaggacct aggcccaggt1560gccgtccgccgaccagcggc gatgccgttc agagaccgtc ttccaggccc cgtagcgttc1620cggcaggtcacgccacggga caccggtgcg gacccggaac aggatcccgt tgaccaccct1680gcgatggtcgctccaccggc ctcgccgacg gcccgccgag ggcagatgcg attcgagtag1740cgaccactcgcgattcgtca gatcgccgac ccatgccccg tccaacgagc aaccggtcgg1800agagtcacatgatccgtcgg acagtgcctg gccgcgggcc tcgaccggcc tcctcaggtt1860gctgcaagcaggtgccgcac acgcgcaggg ccgtcgatgg tgccgcgggc gatgcggtgg1920gccagctcttcgagccgttc ctgggtcgtg cgatccgccg gttggtacac gacgacgcgg1980gtacggggattctcctctag cagcagggtg atggcgcgca cggacaggct gccgacgtgc2040cgtgaccggatgcgcttcac acgtccgggc tcggtggaca catccgcctg ctcccacagg2100cgcacgaacagcggtgactc ctcgcggagc cgggccagca acggcgccca cgccggatcg2160gtgaccgactcgccgtggta cgcgcgcagt ttggccacga cggccgcgca ttcctgttcg2220
tggtcggagtgtgcggcgat ccagtcgggg tgcgtgaaat gcaggtaggc gcagttgcga2280tcggccggaggcagtgcctc caggtcgtcg atcatgaagc ggaacggcgc gttgtaggcc2340agaggctcgaaccaggggtt catcaccacc gccgggtgcg gagagaggct gtccagcagc2400gtctgcacccggccgcttgt cccttcgcag tttgagggtg gttctgcgtc cgggtgtccg2460ccgaggaggaacaggtgccg gcgctcgctg ctcgacaggc gcaacgcgtc cgcgatcgcg2520gccagcacctcgacgctcgg ccgcacgtca cgtccctgtt cgagccaggt gtaccagctc2580gacccgacattcgcgagaac cgcgacctcc tcccggcgca gtcccttcac ccgacgccgg2640ccgccaccgtcgggcagacc cacgtccgcg ggcgagagcc ggtcacgtcg tgcccgcagg2700tacgcgccgagttcgcgaga tcgtacatcc gccatggcaa cgatcatcgc acggtgagac2760caggccggactggtggtccg agcaccagca tcaccgcact ctgggtcgtg gcccgccgga2820cgcgcagggtgagtgcatgc aacggacctg gtcggtttta cgtcgcggca ttcggcgcga2880cgtacacgttcagtatcggc aatgtcaccg ccccgcgcct cggaccggaa ctgggcgcca2940gtcgtggcgaagtcgccctc gtgctcgccg cgttcgcggt gtcgttcgcg gccgggctga3000tcctcgccggccgcctcggt gaccggtatg gccgcaggcg gctgctgggc atcgggcttc3060ttgcgctcgcactgacgtcg gcgctggccg cggcggcacc cggtctgtgg ctgctggtcg3120ctgcccgcgtcctgcaaggc gcgtcctccg cgatcgtgat gccccagacc ctggcgatca3180tccagaccttgggcagcgag cccgcccggg cacgtgggct cgcggcgttc accgcgagtt3240ccggcgtaggaacagtggcg ggccaagtcg tcggcggcct cgtcatgggg ctcggcctgc3300ccttcgcgggatggcgaggg gcggccctga cctccgcgat ccccagtgtg ctggcgctgc3360tcggtgtgcgccgacttctg gttcatccgc cgagcagcac cgaacggccc gacctcggcg3420gcgcgcttgggctgggcact tcgctcctgg ctctggttgc cgggctgtcg ctcggcccgg3480caacgggctgggcctggtgg gcgtcggcgc tggtggcact ggggttcctt gggttgtacg3540gtttctggctcgaccaggga cggcgcgagc gtgcgggacg tccggttctc gtcgcgccct3600ccagcctgcggctgccctcg gttcggctcg gcctgctgat ggctgtgctg cttttcgccg3660gctacggcgcgttcagctac gagtactcga tgctcaccca ggtcggcctc gggttgacac3720cggtccagtccggtctcgcg ctgaccgcgt tcgcggggac cttcgtactc gccgggcttc3780acatgccgggcatcatgtcg cggttcggcg agcgcacaat ggagctggct gcggtcctgc3840tgtgtgccggcctgacactg ctcggcgtgg cctcgtggtt cgctcagggc aagagcgtcg3900cgatctgggtcggttgcttc gaagtgctcg gcgtactcct cggcgcggcg caggcgagcc3960agtacggccccctcgtcggg acggtcatgg cagcggtgcc ccaccgtgtc gcgggcctgg4020ccggcggtctgttcacgacg gcgcaacagg cctcgctggg actcggcatc gccaccatcg4080gcggagtcttcgggactctg gcccccagac tcggctggga gcacgccttc gcggtcgccc4140tcggcgtccagctgatcacc accgtgctct tctgggtcct cgcacgacgc ctccgcagcc4200gaccacgtgcctgcggcacc gtccttgctc cgggcgtaca gcacaggacg gaggcactcg4260attgaccacatccccgcccg cgggcgcagg ctcgatcaga gccggacctg tcgcgtcccg4320ctcacctgtccacgaagtgc ctgcgcactg tcccggccag cagaactcca gccagcagaa4380ggagacatcccgccgtgatc aagatgatca ttacgctcaa gcgtcgtgaa ggcatgaccc4440acgacgagttcaagcactac cagcagaaca tccaccgccc gctgctcatg tcgattccgg4500
aagcagaccggtacatccgc cggttcgtcg tgtcgtatcc cgttccggca ccgcgctacc4560
cggaaccggagtacgactcg gtggtcgaag cgtggttcga caccatggcc gacctcgaag4620ccttgttcttcagcgacaac ttcctgaaga ccgtcgaccc ggatcacggg aacttcatcg4680atctgtcgacgttcgggcgc gtcatcaccg aggaggacgt agtcatcgac ggccgatgaa4740tgcgcaccggcgcatcggtg tgcgagccgg ttgaccaccg atacgcggcc ggcgccatgt4800gcagatcgcagagccggagg tggaggtcgc ccgccgcgcg agccgttggc cgcgcggcgg4860ggcaggtccggtcagtgcgc tgcgacttcc ggtcgtcatc acggcggcga cgaggtcgcg4920ccctttcgtcccttctcttc aggaggcggc agcggttacg gatgccgcaa aggggcctgg4980tagtccgggggcccggtccc cttcacggcc gggggccggc gcccggccgc cggccggtcg5040cggagggcaggagggcaagc ctgatggtgg gcaagcgcat ggagaacgag gcgggatcga5100gcaacgatccgcgcgcggat gtgctgcgcg tcctggggat gctgaaggtc gccaccgccg5160accggatcaagcggctgtcc tcgccgcacc cggcctaccg gcacacgacc aagccgacgg5220cggccaagaaggaagcccgg accgcctccc accgcgccgc ggtgcacgac cttcggctgc5280acggcctggctgtggagggc ggccggacgc ggggaggggg aagagacccg gctggtcacg5340aagaaggtctggccaccgcc gcgatcgact tggaccgcga gatagaggag atgggcggca5400ttgcccaagagggtgggccg ctccggcgcc tcgcacgcga tgacggtgaa ccgtgtcgtc5460gatgatcagcacccgtcggg ccccagctgt tccgccacgt aatcacggac gtcgtcacgc5520agggcgtccgcgtcccagac gccgctgttc agcagccgct ggaagccgtc cggagtgcgg5580tgcgctgcccattccgcgag ctgccagcca ttcttgcgtg tcgaccgccc cagcagacca5640cggacgcagtcccgcatccg ccaccgcaga tccgcccgag cgaaccggcc cgccacccga5700gcgaacaccgactccaactc agctgcccag agcgctattt gacgaccacg ccatcggccg5760gtcccgcggcggaccgacga caaaggtccg cctcgccgcc gatgcccgct gccggcccct5820cgcatccgtaggccaagccg gtgacgcacc tgccttcacc gccgtcatgg gccgcctgcg5880cgttccccgtcggcgaggac acccccgcac caggccggat ccggtcctgg ccgacaaggc5940gtactcctcccacgcgatcc gcgagcacct gcgcaagcgc ggtatccggg cggtgatccc6000cgtcccaggcggaccagcgc agccaccggc tccgccaggg cggccgaggc ggcaggccac6060cggccttcgaccgcgagacc cacaagcagc gcaacaccgt cgagcggtgc atcgaccgcc6120tcaagcagtggcgaggcatc gccacccagt gcgagaaggc cgcgccggcg cggcgcatct6180cggacgcggaggtgtccaca acggcgtccc atacttcacc ggtcagtgtc agggtggcgt6240ggtcccgtcgacgtgccggc accggcccgg ccttcgcgcg cgggcgccgc ggacgggcgt6300caggtcttttcggagccggc cgcaggaagg cggcgcccca cccgcggcgg ggctcggccg6360ctcccccggtgagggaagca ttgctcggtt cgcgcctaat ccttcggccg ctcgtccccg6420ttcggcggcgggcacggacg gatgaggagc aggccgcagt cgaggtatga cgggcctggc6480ctggtgcgagcactgtgcgc cggaatgctc gctttcaggt catgttgcgt cgatcctcac6540atcctcccaggtcaacgcca ctaaattgag gtgctcgtac atccggttga ccgcggatgc6600acggtacgtcgtgcaaggag gcgagcagtt gacctcagtc gatcgaatcg ggcacgcacg6660cgagcgggcacggcttctgg ccgtcatcga cagagcacgc gggggacggg gtccggcgag6720catcgtcatcaggggagagc gggggatcgg caagtcggcc ctgctgggcg agttcgcgtc6780gctcgccgccgacgccgggt tccgagtgtc cgccgtgtcg gcagggaccc agcccggtga6840cccgctcggc gccgccctcc gcgtcgtcag ccgactggac gcgaggtgca ccgagcccgc6900
cgagggcacggcgctccacc ggccggcgcc ggccggcgaa cccgtgcccc accgtgccgc6960cccgagcgaggaagtgctcc gcgaactcgt ggagaccgtg tgccggcagg ccaggcggac7020gccggtcgcgatctgcctgg acgacgccgg acatctcgac ccgtggtcgc tgcactggct7080
ctcgggactgtactccgcag cttccgacct gcccctggcc atcgccctga ccggcgggga7140catcgcggcggcggaccagg acccgtggcc ccccgcactc gccgcggccg cagagcacat7200cgcactgtccgggctggacc cggaggaggt gggcgccttc gcggcggcgt accgcaacgt7260cccgctcgacgcgccgaccg cccaactgtg ccacgagttg accggcggca acccggccct7320gctgctgtccctgctcgcgt gtcacaccgg cacggccccc accgccgacg ccctgcgcga7380caccgccgcgtcggcggtac tgcccggtgc cgatcgctgg ctggccgggc tcgggggagc7440cgccctcgggctggcacggg ccgtcgccgt cctcggcccc caggcggaga tcacccagtg7500cgccgaactggcagggctct ccgtacggga ggcgctgccc ctgatcgacg agttggtcgc7560ccgctcgctgttcgccaacc gcaccccgct gtccttccgc caccccctgc tcgccgggat7620ggtcatcagccgcgtcccgg ccggtacccg ggctgccctg cacctcaccg ccgccgggat7680cctgcgcgacgggcacttcg gcgccaccca cgtggcacgg cacctggtcg ccgccggacc7740gctcggcctcgcctggaccg tccggccgtt acggatcgcg gcgaaccaac tggagcgcga7800gggcaggcatgaggaggccg ccggacatct gcgcgggatg ctgcgggaac gtctgcgccc7860gcgggtccgctcgtccgtcc agtgccagct cgccgcgctg gacgggttcg ccgcccccga7920cagcgccgtacgccggttgg acgccgcgcg gcgcgaggcc gacgacccgc gctgcgccac7980cgactacgccgtggccctcg gcaccctgct ggccgagtgc ggacggcccg aggacgcggt8040ggccgtactcgacgacaccg ccgagcggct gggtccgcaa gcggcggccc agcgctggcg8100gctccggctgcgcaaggcgc tcctctgcct gggcggaccg gtcccttccg tcctccccgc8160cgatctgcccgacagtctgg ccgcgcaggc cccgtccgac gacgaggccc gacgggagct8220gtcggcgctgcgggccgtgc acgccctgcg cgacggcacc gaccgggacg ccgccgtggg8280acacgcgcgcggagcgttga ccgggagcga ggaccccggc cgcctgttgt ggcacggctg8340cgaggtcctgatccgtgccg acgaactcgc cgaggcgtgg tcgtactgca gccgggcccg8400cctgctggaccagtcccggc ccggcacgtg gggagacgtc ggcgtcggtc tgctgcgtgc8460cctcgtcctgtacgcccgcg gcagcctcac cgccgccgac gccgccctga ccccgctggc8520ggacctgctgcgcccggccg ccgaggccgc ccggctgccg gccaccctca ccgtggcggt8580cctggccgaggtgcgggccc agaccggtgc cacggacgca gccctcgccc tcctcgccga8640ctgcggactggacggcgagc tgccggcccg ccaggacacc gtggcggtcc tgggcgcccg8700cgccgccgtgtgggaacagg ccggggacac cgctcgcgcc ctggaggacc tctacgccgc8760tggacggctgctggccgact cccgggtgcg caaccccgcg gtgctgccgt ggcggtcccg8820cgccgcccggttgctggctt ctcgcggcga cctgaccgag gcgtccgggc tcgccgccgc8880cgagtgggaggacgcgcgcc gctggggaac cccgcgcgcg gtcggcacgg cccagcacgc8940gctcgccctgaccgagacgg ggggccgccg gctccgccgt ctcgccacgg ccgtggagac9000cctggcccactcgcccgccc ggctggaact ggcttacgcc cgccgtgatc tcggggccgc9060gctgagcgaggctggacgcg ccgacgccgc gcgcacggag ttccgcgcgg cgctctccct9120ggccaagtcctgcggagcgc agccgctggt gcgccgcgtc cccttggacc gcgaatgtct9180ctggccggtggtggacgacg accggggctc gcccgcgctg agcggcctca ccccccagga9240
acagcggatc ctgggcctgg cgcgagccgg gcacaccaac aaggccatcg cgggcaagct9300gttcgtcacc gtgcggaccg tggagttcca tctctcgggt gcctaccgca agctcggcat9360ctccggacgc gaccagctgg ccgatgtcat ccccgcaccc ttgggcaccg gcggcggccg9420ggcgtagcgg cgcggcgggg gaggcgccgg gccggagcct ccccccgcca ctgccggagc9480gggccgtacg gcggtgttca gccggctccg ccggcggccc acgcctcgcc gatacggcgc9540cactcgggcc gttccgagga ggggtcgacg gaggcgacgt accgctggaa gctgccgacc9600gcgtcaacgc cgtgcaccgc ctcgacggtg agcgccgcca gatggcacag cagcgcccgg9660tcgaccggct tgagtccgag ccggttgagg tgcaggtaga ggtagttcat catgaggcgg9720aacgaggcga accagtcgtc cgtccgtacg aagtcctcgt gcccgtggtc cgaccgcagg9780accgcgtgga actcgctcgt ccgacgcgtc ggcatccgag gtgcccgggc ggccccgccc9840atcgacacct cgccggaggc cagcagcggg tgcgcgatcc gctggtggtg gcgcaccgcg9900gccgcccatt ccgtgacgaa cggcaccacg tcaccgactg cctccgagcg gtccgaccgg9960tccgagcgat ccgctccgtc cccttcagtc gctccgtccg agagggccgc ttccacggac10020cgcagccgct cgcacagcac cgtctcctgc cgccggaacc ggtcgtcgaa agcggcccgc10080acggccaccg ggtcccgggt gcgggacagg aacgcgtcgg catgcgatcg caacgacagg10140aagccacgct cgatcggctc cccgcccgtg gtgaagggga cagccgcgac ggacgtcgtc10200gtccacatca ggtccaaagc gagcagcgac agcgcgccgc ccgcccgcac ccgctcgtac10260gcccggaaag cctggccgtt ggtgtcgctg aggaagccgg ccaacagctc gctcgcccgc10320agcgactcca gcacgggcag ccggtgatcg tacggccgtt ccagcaccgt attgtcgggc10380acccacgggt gtctcgggcc ggtctccatc tccagctccg caagccgggc gtgcaccggg10440gcgagcgcgc cctcgtccag ccgtgccgcg gagggacggg cgcgcaggta gtccgtcacg10500atcccggtca ccgtcggccg gacgcgctcc tcccagtccg tgccgcgaca gcggaagttc10560agccgcagat gcggaccgcg caaccagtgc cggccgaacc aggccgcctc ggcccacggt10620gccacggcct cgaaggccgg ccggacggcg cgcaggacca gttccggctc ggcttcctcg10680tcgtggtgat ggacatggag gctgtaccag ctcgatcccg ccgtcccgtt cacgaggcgg10740ccagtgcctc gggcagctca gcgagcaccc ggccgaccag gaaccgcagt tggttctcct10800gccacagggt cagccccagc cggttgctga ccaggtgggc acagcgcagc agcaccagac10860tcgtgcccgg atgacgggtg tcggacagtc cgaggggctc cgccagcgga gaccccgccc10920acgcggaggt gaacacgccc gtctcctcca gggcgtgcaa ccgctcgcgc agccgccgca10980ccgaagccag ccagtacgcc cgctgatcgt gcccgcccgc cccggggtcc tccgccatcc11040gccaggtcag gcgggcccgc gcacgcagct tgtcgcgctg tgccagatag cgcggggcga11100cgtcctcggc ctcgggaccg ctgccgaacg gaagtggcgg tccgccgtgc cgcgcccact11160ggtcgcggac ctcctcgcac aacgcgaaca caccgacgac caggtcgaag gccagcagcg11220cacgctgctc caccgtcgcc ccggccgcga ccacggacag cgcgagccgg ctcgactcga11280agaagtgctg ctccacggcg gcgatcgccg caccccgccc gtagtcgtcg tactcgcgtt11340catagggcag gaactccacg gagttgttgg ggcggaccag gacgtcgtgg ccgctgcggc11400cctccagacc ggccagtccg gcggcgacct gggtgaagcg ggaccggtcc accacgtccg11460cggccggggt gctggccagg aactcccgga tgcgtttccc ggtccgcagc tcgatcgccg11520agcggtcggc gctcgccgcg ggcagcagcc gcagccgcac atggggcccg ccctcccagt11580
accgcaggaa gaagtaccgc tgcaccagcc cgtcggcggt cagctccgcg accaggggcc11640tgacacagtc ggtcagcagc agatcctggt cggtgtcgta gaagatgtgc gcgcacaccc11700agtccgcgcc ccgggcggcc tcggggtcaa gcgggccgct gtcgttctcc ggcatcctgt11760cctccgttga tctcgatcag aaactcggtc acccggggtc cgctgtcccc gtagccgggc11820atgccgtccg ggccgggcag tgcctcctgg aggaacagca cctgcccgtc gccggccacc11880gcccgttcga acacgccggc cagcagcagg ttcgcgaagt cgacgtagag cggcttgcgc11940gacttgatcc gccacacgct gcccccgacc acggaggccg ggtccagggc gcgtacgaag12000cagcggcgcg ggatgccgtg ctcgcgcagc cagccggcca gtcgcagcag gtgcgcccgg12060tcgctcgcgc ccttctcgcg gaccggaacg gcggacgccg ggaacaccca ctgacggcgg12120ctgaccgtgg tcgcgccgac cgtcacacgg ggttcggcca gcacgccgcc cacctcggcc12180agggacgggt ccccgaacat ccggcggccc gggatgagca ggttggacgt cgctccgaac12240acctggagca gcagccggat cgcgggtggg agccacagct ccgcgatgag gttgggatgc12300accgggcgca cctcggtgtc gcgaccgcgc gaccacagga cgagcaggcc ccgcgcggga12360tcgtggcgca ccagcaggtc cgacagcgga atgcggtgct cggccgcgcg ctcgctgtgc12420ccttccgggt agtcgatctc ggcggcgacg gcggaccgcc gtagccccac gttgctgccg12480aagtgccggc aggtgtccgc gacgatcact gcgtcgtccg gtgcggctgt cttcgcccgg12540gcctcggtac cggcctgcgt cagcaggcgg ctgatgcggt cgcgccctcg gccgtgcccg12600gagttgaccg cgttgaccac gaaccgggcg tccggcccgt cgagcggctg cccgtagaac12660gccacggagt ccggcgcccg catccagcgc ggccagccgt cggccagatc ggccagccgc12720gccgggtcca gccgcaccac gccgtcctcg tcggcgtgga ccggtgcggc tagcgcgcac12780aggtcggccc gtcgggcggc gagttcacgg atgcggggga ggcggtggtc cagcagggac12840gcgtagccgt gggtcgcgat ggacagcagg cctggcagct ccgggtcctc gcgcagccac12900tcctgcaccg tgcggtggaa ggtcagcagg ggcatgctgg caccagtgcc cacgcgttcg12960gcgaaggtgt ctgcgagggc cacccggccg ggcagcgccg ggtccagtac cgcgtagcag13020cggcggacgg tgtcgaggtc ccgcaggacc ggctcccagt cctgccggac cgggcccgcc13080aggggctccg ccagcaacgc gttctcgatg acgctgttct tggcgggcag ctggatctgc13140tcgggcccgg ccaggtcccg tacgcggcgc agcacctcct cgatcgccgt gccgcaccgc13200agccggtccg ccgcgtccgg cagcgtcggg taccgcgcca ccagggccgc cagcgcgtcg13260acctcaccga caagcgccgc cgtgtcgggg cccgcgccgg ccagccagtc tcgcagggcg13320gcgagcgggt ccagcgcctg gtcggcgaag ggacgctcgg cctccagcag tcccagttcc13380accagtcggc ccaggtacgt gtcggcggcg tccacgccgt tcccggtgcg cgtcgcgatc13440tcgcgcgcgg cgtccgcacg gacccgcccg gcctcgccga ccgcggccac acaggccgcg13500accgcggctc ccgccggcag cctccgcaac ggctcctccg gccccgtgcc gaggaactcc13560cagcgcccgt ccgccagatg ggcgctgggg ttgagacgca gccgcatccg ggcggccagc13620acggggcgca ggctcagctg ccgtaccact tgctgcacca cccacacgtt gatctccgcg13680accgtcacca cggcgagtcc cggggcgggc gcgggagcgg ggcgcgcgtc cggctcccgc13740cagacaccga gaccgctgac tgtgaaggtg ctgaaggggc tggtcttcat ggtgacccgg13800gccaggtact tcgccaggcg cagggccagc gagtggtccg gcaccgcctc gtccggacgc13860gccagccact tgcggacctg ccggtagaga accggactgc tgagcaccag gccgtgctgg13920
aagcccgggt cggcgaccgc cttgcgcagc agcaggtgctgctcggccgt ccggtgcgcc13980accagctcgt ccagtcgggc ggtggcccgc tcatgttccg cgagcagttc cgtccaggac14040
cgcacgccgg cggtcacggc gggcggcagc gacgccctta cctcgtcgtt ccagtaccgg14100tcggtcaggg cgcgccggtt gtggacggcc cggcgcagcg ccaccagccg ggacttgcct14160gtcgtggcct gcccgatcag cccgtacagc gcgtcggaca gtccggcctc cgcggcgccg14220agcgcccgct cgccgtccag gaccgtcccg acctggttccacagctccgg tgagctcatg14280tcgtcgagca gcggtaccgg caggccgccg acgcgcacgccgaagacgtc cggggtggtg14340tggttctcgg tcatggccgg ctccagtgtc acgggaacgg gtgcgggtgc gggttgatgt14400ccgacgggga cagcggcccg gcccggtagc ccagcagcgcgggcagccgc agcagccggg14460gcagtccgtg ggtgcggcgc atgccgtggc cgaaggtcatgggcagcaga ccggggacga14520tcaccttcgc gcaggcaagt ccgccggccc ggtgctcgtccgtggtctgg tccaccacga14580tcacgtcctg gccgcggcgg gtgaaccggg tcaccacctcgatgaggtcg tcccgcagat14640ccgtgccgcg cggccggcag tccgcgcgcg cgaacgcctcctccaccggg aggcccggcg14700cgccggtgcc gggaggcccg tcgccgagga ggaagccgaa ccggtcgaac gcggcggggt14760ggcagtacag cagggcgtgg tcccgcatgt cccgcacctg gtccgggtcg gtcaccatcg14820ccccgatccg ctcccgctcc tcgcggtagg cgtcacggttccagcccagg ttggcggtca14880gctccagcag gccgttcagc aacgcctgtt cgggatcgaa gtgcgctcct gcggcacaga14940cggcggccgg ttccgcccgc gggtccccgg gtgcggggaa gaggcgtgcg gtggggtgca15000ccgccatgac ccacgcggtg gggatgccgt gctccggcgtggtggcgaag gccaggaccc15060ggtgcccgct gtcctgccgg atgcgctcgg ccagcaccgcgatacgcggg tcggtcaccg15120tcgccaggtc cacccggggc gcgggcagcc gcgcgtacca ggtgagcagg aacgcgtccc15180gctccgccag ctccaccagc ccgtgcagcg ccgcctcctccagacagccg cccagagcgc15240acccgttgga cacctcgtac gccagcggcc gggcgtccgg attgccgtgc cgggtgcggt15300agtacgcgta gtcctcgggt acgaggacgg gcgcgtcgcg ggcgaaggag tgcccccaca15360cccagtcgag ggccattccc gggtcgaacg gcgggtaggg gaagccgggt gcgtcgtacc15420gctcggacgg atacaggccc agctccaccg gacacagcgcctggtcggcg acctcgcggt15480aggaggcccg caccgtcgtg cgccggccgc cggggcgggcgccgccgagt cgctccaacg15540cctcggccag cgcggtgcgt tcacaggagg cgtaggcgag gttccggccg aagccggcct15600cctgctgtcc gtccggcagg tgcagcgggg cggacaccatcggatagcgg tagtcggtgc15660gtacgtcgag ttggcggacc actccggtgt gtccgtcgacgtacgtccgg gtcaacgcct15720cccagtcggc ccgcagatcg cggacccggt aggtgtcccg gtcgggtttg ggccgggcgg15780tgccgagcag ctccggcggc cggtcgtccg ggagcccgccgcactcgggg cagcgcgggt15840cgggcaggaa gggatgggcg tcgaccgtca tggtcgtcag tgacagcatc accagaccgc15900accgggtcag ccgtcctccg gggaagcgga gttcgtccgccaccagttcc gcgaccgcgt15960cgcacgccca ggccgtcagc acaggggcgg ggtggtcggcgaggcgctca ccgaatcgcc16020gtaccagttc ggcccggggg ctgtccggcc ccactgcccg ctcccggcgg gtgcgggcgc16080accgggcgca gcccgcgcgc ccgggcacga ccatgggccccacgaccacc ctgcccaact16140ccacccggac gggcaggcgg ggcgtctgcg cggagacgatggccgagtcg tcggcccagc16200cgtcgtcggc gacgacggtc acggcagggg agccgctgtcggggccggtg aggccgatcc16260
cgttcgtggc gccggtggcg tcttcgccaccggtcccggccggtgtcccg tggctgcggg16320
agagcaccgc ccggacagcg gtggcgagcaggcccttgcccaggaccgcc gccgtggcgg16380ggcggactgc ggcggtgtcg gtcacggtcacttccctcgtcggtgggagc ggtgccgtgt16440ccggcgggcg caccgcccgc cggacacggctgtgcgatgtgtgccgcttc agctgtgcgg16500cgcatgccgc ttcagcgccg cgtcagcagcaacagcacga gcagcagctc gccggggtac16560cggtcgaggt gcagttggac gcgccgatctcgaccatcgcgtgacccacg ttgatcgact16620ccaggccggc gcccggggag gtcggcagcacgtcgagttcgtcgacgctg aggtcggcga16680ggtcgaggac gagttccttc tccatcggattcccctttccgcgttgtcgg ttgtgcccaa16740ggccaggaat ctggccgtgt ccgatgttcgagcggaacgg ggcccggggt cttcacggtg16800cgaccgcagt cccgcccgta ggatcgagcggctacgggcccggggccgcc cccggggagc16860cgcggttcac catgtcagcg gcatctcgtactgcgccgtg gccctgcggc ggccgacggc16920catgcagaac acgggtacgt acgccgcgtcggcgacacccatcaactcgc ggacgactcc16980ctcgtggtag ccgttggtga tgcgcacagagcgtcccactgcggccgcga gcacgctgat17040gcgctgggcc acgatcccgc tctcctggtgcaggatccgg taaccgcggg ccccgaacgc17100ccgctccccc tcgacccggt tcacggtcaggaacacgatcgcgtcggcct tcgcggagtt17160cacggcaggg gtccggtcgc agagcatcgcgaggacgccg cgccagtttg gtcccggcac17220gcgcgccagc acgggggcgg gggccgggtgcagccggtacagcccggtgt cgaggccgtc17280gacgcggagg gcgagcacat ggcagtcgacgagcgggcgg cagacccggc tggtgtgatc17340ggacggcacg ggctccaggg catgccgcagaacggaggcg agccggtgca cgggcagcgg17400atccccgccc ggcaggaaca tccggccaccggagtcacga gtccgcagcg tggcggccaa17460ctcgatctcg ccggggccgg gttcggtcggcgtcgccagg gacagttgcc gttcaccgcc17520ccgcacgccg gccgggaggt ggaaggcccgtgggtccaccgccgggcgcc cggccgccca17580ggtccgcctg gcggcccggt cgacttccagcagtcccgaccaggcggcgg gatcaaccgc17640gttggtccgc acgtgcgccg cccggatggcaggcagggcg gtggccggcg acgctttgcc17700ggcggcgccg gccggcggtg gggaaggtgcgggacgctgcgcggccggga cgggcgcggg17760cagtggaccg gtgcgcagat cgaggacggcgaccgaggtctcctcggacg cgtccagccc17820tagagcccgg ttgacgacct cgtcgtcgaaccggtggtgcacacgggccc gcagcccgag17880cgcgcccgcg gcgagcaggg cgttgccgaccgtcataccg gcctcctggg cgcacagccg17940gtacgcgtag tcgcggtagc ggaaggccgccttgcggaag cagaccgccg ccacgagcag18000ggcgtcggga gcgtcgtgcg ctccgggggccacggcggcg ggccgttcca ctccgacggc18060ggcgactagc acatccggca gaccaccctcccgcagcctg gtcaggacgt ggtgcgcggg18120gtcgtagtgg tagcagccgg cgcccagttcgccggccggtcgcgccgtcc acagatacag18180ctcgaccgga tagaagcagc gggccgaggccaccagccgg tgatacggcc agacggcgtg18240cggtcccacc tccatgcgac ccatcccgtagacgcagtgcagcagcaccg acacggcggg18300ctcttcgaga cggtccaggc acggcgcaccgccggggtgcgcccggcgga aggaggcgaa18360ggaccatcgc gcgtcgccca ccgcacgggccggcgcgctcaacggatgcc ggggcagccc18420gcggtacgtc ttggccggca gcggatcgtccgccccgccctcctccccgt ggccctccgc18480gaagagttcc cggacgccct cgaaggtgcggtgccagaag cggagtccga cggtgtcggc18540gtccgcgtcg gccacaccgt gcgccgccccggcgccgtgg tccgcggtgc tagtcatcga18600
ggaccacgac ccggagcagg gagggcagca cttcgtgcac ggcggggtcg tggtccagcg18660gcagggccac cggtcgcagg ccgcgggccc gcaggcagtc caccatgcgc tccggcccgg18720gtgcggacgg ccacggagca ccggccgccg gtccctcccc gggcggtgac cccaaccccg18780ccacggtcgg cggcgcgtac gcaggctcgc cggtgatgac ggcctgccgg tccagcaggg18 840ctcgctccag accgtccgcg accgcgtccg gaccgcaggt cgccgccacc gcacggccgc18900cctgccacca ggccagcacc ggcaccccga gcgcgccccc cacgtcggcc acccgcaccg18960atcccccggc cgcccgcagc agaccgagga gcgacttcgc gcgggcgtcg aacacggcgg19020tggcgaggtc caggccggcg ggctcgacgc gcccgtcggc cacgtccgca acggccagcc19080ggacgcagtg ctgggccagc ccgtcggtca ccgcgtcgtc ccagccgagc cgcgccgcca19140ccccgggtcc gaggcccgac gccacggacg tgggaacgcg ccgcgcgcac ccgtccggga19200cgtcccaacc ccacacggtg gcgtccgcgt ccacgcggcg cgggtcggtg aaccgtgccg19260cgtacaccgc gattccgcgc aaggcggccg cgcggcgggc ctcggcgaaa ctcgtcccgg19320cgccgaacac acgcggagca ccgtcgtccg tgggccggac cgcttcggtg acgttcagcg19380gcacctgcgt gaactcacct tcctccaggc tgcgcagcac cccgagatga ggatcgaagc19440agcgcgccgc acgcgcggag aactcctgct cgccgaccgg tccggccgcc cggagcgcgc19500ggacccggct gacgaactcc tcttcccgct ccgggcgcac ggccagggcg tccgggtggg19560gcaggaacgc gtgagccgag gtgcgcagcg tctccaggtc gatacgggtc agctccgtct19620cgtgggaacc gctgatcccg gtgcgggcct tgaacgcggc gagtccgaga tgaccggcga19680cgacggcggc ggccggcccg ccgaggaagc ggctggaccg gtacggcccc gccgccccca19740gccgggacca ggccgacgcc caaccggggc cgcacgggcc cagccaggcg acgtcggcga19800ggaccaggcc ctgcaccagg agggcgccgg agtcccggca gagccggtcc agccgcaccg19860cacgatcgac gcgatcaccg gcggagacga cgtgcaggac gacatcggca cgggccgccg19920ctgcctcctc ctccggggac cagacggcat gctccacttc ctggtccggg tcgcggtgca19980gcgcctcggc ggccagttcc gtcagccgcc ccgagtccgt cgccgcttcc gtcgtccgca20040ccgcccgcag ccgccgcacc ccggagtgca gcgccgagca gaccagcgag acgaacactg20100ggcccgcacc cattacgacg acctcgctgt cgcggtaggt ctcgaaccgc ctcggagcgg20160agtcgaggtg gtactcgacg aacgcgatct cggccgcgta ggtctccagc tcccggtcgg20220tcaggccgtg cgggaggtcg tcggcggcgt ccaggacgca tccggccgcg cgcagccgct20280ccaccagggc gtccacgatc tgccgtttct cctccggcag gccccgcacc aggtcctcca20340actcggtccg gccgtcgaag tgcggggcga gccggtcgag ccattgatag gcggcccggc20400cgcgcagggc cacatcggct cccgccccga acacatgtac tccgttgtcg gtcggcacgt20460acagcacgtc ggacttgagt ttgggacgca tcgccagcct ccgattcggt ggtctggcga20520ttgtcacggc catcgccccg cccgtcctga cgggaccacc gaagaacctg ccacaggatc20580aataccgaag gagccaccca tgacccacct ccactcgggc accgtgcggc acggacccgg20640gcgacccccg atcaaccgcg cgagatgacg ccgagtgata cccgtgaaca gctgatgcgc20700cggcaccgct cgatcgacca tgaacgtcac agccggatcg tgccagctgc cggacacgcc20760tcacccgctg ttccgcacca actcgtaaat gaccggggcc aggccgctgt cctcgcccgc20820gaacgcactg ctggcacaag gtctcggtcc gctccgggag gtcattcgtc gccgttcacg20880cccaccgggc agttgtcccg gagaaggcgt cctggggaac atcgccggga cgcgcatcag20940
tgtcgcttcg agcgaacgag aggacgaccg agcatgatca gcgtggaaca cgccactccc21000ccagtcgtgg aggagtcggt actcgaagac ctgcgcgcac gcctgcgcgg ctaccgccgg21060gtcgacgtcc ccgccgggtt cggttgggcg cgcggtgtcg acggtgaccg cctcgcggac21120ctgatctccc attgggccag catgaccgtc tgcaagtaca tctccgcgtc accccactgt21180cccggcccca tcgtccggtc gaggtagcag aacaagacga ccggagcccc gaacgcctcg21240aagttcaagg tagcgatctt cctgggccgg tcggggtcgt cgcgtgcgat cccagcgctt21300cgtaccgctg ggccgccgca gcggagaagc ggtccgtgta cagcaaggcc agttcgtccg21360ggtacatcgg atactgccgc tcatcacccg ggtcgctcgc cagtgccctt gcggtcgtgc21420gcctcttcag ttcagccaag ggttcgccgg tcacgacgta catatgccac ggctggaggt21480tcccgctgga tggagcccgc gtcgctgcgg tcagcactcg ttcgagaacc tccttgggca21540ccggctcatc gctgaacgcc cgcacggccc ggcgactgtc cacggcctca tatacgtcca21600tgtctcgcgc cctctcatcc aaccgaaccc cgccaccgta ttcggcggtc agcaccgagc21660gtcgccgggg actgggcgac gacccgacga ccagtcagtc gttgatacga ccatggggag21720caggagtgat ctgacggata cccaatggga gcggtcaaat tctgccggtg agtaacgggc21780gttgcggcag gcggcaggac caccaccagg tcgtgaacgg ggcgctgtac cggatacgga21840cgggcatgca atggcgtgat ctgcctgatc ggcacgcacc gtggaagaca gtggacgagc21900ggcatcgccg ctggtcgatg aacagaacgt gggaggtgct cctgcgccaa gtcgaggccg21960actctgggct gactgggcct cccgaccaca tcggtccgcc ttgaataagc tctcggtact22020gaagagcgat ctgcgtgatc tcagcagttt tattggactc accggtcatg ggtctccttc22080ctggtctgtt cgggtcatgt ggcgcggccg ccgactggag cactcgcctg gtaggcgccg22140ctgctcgggt ctgatgacct gtgcgcgccc cggaatccgg gaaccactgt gtgatcgtcc22200acagaggaca ggaggcgctc gccgagcacc gcgccgactg acccgacccc gcggcccgac22260agccgcaccg ccccgcaccc ggatcgccgg cctcgcgacc cgcccccaga acatcgtcaa22320ctcggccttg cacacccgca cgaccgccgt cccgggactg gctcgcccgc ctcgaacacc22380tgaccaaagt ccagttcaag cagacggctc gtccaagcac cgccgcatac gaacgaccac22440tcaagctgaa ccttgcgcag cgcagatgaa acgaccagat cacccaacca gctaactgac22500aaagccgcag gccagaccct gctccagcag cgcccacaat cactgcagcc actggcactc22560ccccactcac cgccgcacta caaactgatc agtgcaggcc agaccaccaa ctactgatca22620gaaaaaccgc tcctggacac cgaactcgac caaatcgaca tgcgctggta acccgaccgg22680acaccgaagg ggtgacgggc agcgaacgcc gccacccgtg aacctgatca cctagccaac22740agaggaccgc aggcacggtt caggccgcca ggatgcgtaa ctgctggaag cggacctccg22800tctgccgacc ctcggtcagg gtgtggaagg cggcggattc accgccccgg ccttgtgcgc22860cgtacgccac gccagccggg ccgccgccat ccgctgtcgt tcagcgggtt ggacgtacaa22920aaccagtacc ggctacttga tcaggtcagc gacgtcggcg atctcgtcgg gcgcgtactc22980caggccgtcg tggacggagt cgttgccgag caggcgggcc tcgtggaatc cgtcaatcac23040cgactgaggc acatcgagcc gggccaaatc gccgatcacc gcgtgcaggc tcttccccgc23100ggctccgcgc tccttgcagc tagcttccac cacggaccgg tagccgaccc cggccagccg23160gaaggcagcc gccgcctcgg ctcgcccagc ctccagaaag aggtcgcgga tctcatctgg23220ggcgtcctgc gaatgtggac gcggctcctg ctccggccac actcgacaga tgagcgtctg23280
ctcccgatcg tcggtgatgtgcttgttgcc cttcatcgga aagcggatga ctgagtacag23340ctcgatcacc gccatgtcgcaaaagtcgca tgaccagacc tgctcctcca catgtcggcc23400tggccgttgc atagcgcccg gagttttcgg ttcgggatgg atccagcgga ggttgcgcag23460ggagatcgcg acccgattcg agcagtgcgg gcactcggcc tggcgcttgg ggccgagctt23520ggggaggaag gtgtcctgatccggcatagc gatcaggtag ccacagaatc ccctaatcgc23580caaaccattt ggccagggtctcggctggcg gcccgcctgc cacttcacga aggacggtac23640agggcggccg acgcttccaa gtcccacgct cccccgctca gccggcagct cgcgccctgc23700tccggagcga cgacggcttcggccttgagg acctcggcgc gggtgttaca accgtccttg23760tccgcatcga cccagtgcttgaacttcgtg cgctcgtacc cggtgcggtc ctcgctgcgg23820accgggagct gggtgagagcgtcctggacg ggcagggtgc cggtatcccg cgacgcggcg23880ggggccgggg gggcgtgcgcggttgtaggg gtgagagggg cggcaagtac ggcagccgca23940gcgatggtgg tgcgggcgag gcgcacgagc ggggtcctcc cgaaagatca cggacagttc24000gtgatcttcg tagcgactcccgcacgcgac ccgcccggca accggcacca accccacccg24060atcgggggtt gcatccgatcgtcgacacgc gcagaggacc atttgacggg caggcaccgg24120gtcttctccg gaggacccgctctcgggatc tatggcgcgc tccggaccgg aacaccccag24180ggccggcgga gaagacagacgagcacgttc ctcaactctc gcgcccacgg aacacccccg24240cgtcggcggg gaggacgggg gcccggagga atcccgcagg tgacgcgtgt gtggtcgaac24300gtagttgacg agtttggtcg gcgatagttg gcgggcccat cgccgttggg tgctgctcct24360ctgaagtgaa ggtcgtggatcaggcggtca gtctgaatgt ggcctggtca gggttggata24420gaggcgttcg tgttcgcggg cggtgtgata ggtgaagtag gcgtcgacag acggccgcgg24480ggtttgagga cggcttcagcgccaccgacg ggacgacgtc gactacgccg acgtgaaagc24540cctcataacc ggctgcctgg tccggacgga gggccgcacg gacgcggacc tggcggcgct24600ggagcgggtc accgagatcg tgtgcgaggg actgcgcgcg aggtgagccc ccggcacgcc24660gtgtaccggc acggggccga ggaccggcgc acggcgctcc gaatggcagc ttcttgtctt24720ccatggaggc atccggaggtgcttaatggt gcacccggta cgcacagtga gctgccaagg24780acacgggggg cgcatgaacg acacagggaa cctcggcgta tcgccgcccg accctccgag24840aacgcccgca ccgccgcgaccgcaggaacc gccggaacta ctcacgacac ccgcacgctc24900cgaggacaag cgaaccctgg ttctcaaggt cagccgccgc atgctgtggg tggggacagc24960ggcactcccg ctgcacaaca tcaccagtgt cgacgccttc aaggcgagga ctgactgggg25020caaagcgtgc atgcgtttcctcacggggct gttcggtgct cttctgctct tcgcgtggct25080gaaccgcgcg ggggacggcg gggatcacct cggggacctg ctcatcgtcg tcgtgatcgc25140cgcggccgcg ttcgccttca aggacgtgtt caggccgagg ccggtgctga ccgtcgagac25200ggccagcggt tccagggtgg ccctgaccct gccgagcatg gacgagttgc aacagatcgc25260cgaacggata gcacaggcca tcgacaaccc ggaagccgag ttcaagacgc tcgtgcagca25320gctcaacagc aacaacacga acaactacgg ccccgtcgtc catatgaacg gcggccgcgg25380aaacacgggg ttcagactatgagcgatgcg tcgaactact acgggccggt ggtcaacatg25440aacggcggcc gcgagaacgtcggcatcaac tacggcaccg tcggcggtgc ccaggacgtc25500gaggtccgtg ccgccgtaaa cgaactcaag ggcctcctgg gcgagttgcg tccacacctc25560acccgggaac aggaccgcaccgtcgaggag gccctgcccg aactcacccc agaccgcgaa25620
gcgttgcgca gtcggggtctcgtcctggcc tccgtcgctc agatcgcgtc ggccgtcggc25680gcggtgggcc agcccgtcgctgaggccgtg ggacggctgc tcgctctgct gggctgagca25740gccggacacg gcgaggacca ccggagccga cgaagcgctg acgagtatcc gtgcgggaag25800 cgctggagcg gcctccggctgtggaccagg cgctgcgcat tccgtgctcg tggaggggtg25860ggcgccctcc cggtggctgg gccccgcgcc gtcaccagca acggcgacct cgacgcctac25920ttcggctatc acaccgcccg cgaacacgga cggctctctg atccgcggac aggtcagccg25980cctccgccgg ctgcccggag gggtccggac ttctcgcctt ggagacctgt gcgggccggg26040catccgggtg gtgcatcagccaccggatcg agcgctcccg cctctccccg ccctgatccc26100gcggcctgac ctgaccggtctgaggcagga cctcctcgac cgtccagcaa acgccgttga26160gcagcagacc cgagcccggg gccagctcaa gaagccccct ttcggtcacc gtcggactcc26220tgcgcccggc cagacctcgg aggcgtcccg caggggctcg cccaggtcgg ccccgagctg26280ccggtgccag atcaggtgca gggcatgcgc gcgggccacg accggcaaag ctgtcgccgc26340gaccaggtcg ccgaagcgca ccgaccggcc ttccgctgcc agcagcagct gagcctgcag26400cgcgagggga tcgtccaggtctcggcgctg agccgagatc gcgtccagca cccccatcgc26460gtgcggccgc cagcccgtca ccaccgagta gcgccagccg caggcggccg ccgcctccac26520ggtcgcggcg aacttgagcg cgtccgcgtg ctcgatgagc cggcgcggcc ggacatcgaa26580cagccaccgg cgccgtcggg catgacggcc aggaagtccg gcgtgtgctc ggcgcgtcct26640gcagcgtgct cgaaccccag ccggaacgac tgcggcaaca cctccgccac ccgcaggaag26700tccagcgcga gcaacagccg ctgttcctcc agcgactcga acccatgatg ccggcgcgtc26760gagaccatga actgcatacccggccggtgc cgttgccggg cccgccaggt gaaccgtcgt26820accggttccg aggagaacaccggcacctca gccagatcac gaaccggcca gaccacctcg26880tccccggcaa accgccacgtcgtcgcccaa cgtcggggcc aggattctcc cagcgtcagc26940agatcccgtg ccgcctcctcgatcccgtac ggaacgacga gatcgtccag cccgcacgta27000tcggaccgca cgacggcccctgcccgcgta ctcacgacga caagcagacc accgtcgcct27060ccccgcgaag cgtggatctccgtacacgat cacaagcgac gcgatctgac cgcgtacgga27120gcgtcactcg ccaactatca gtggccaacc gccaactatc gctggccgtc gcagggggga27180gagccctcct ccgtcggcgccggactctgt ccacagggca gcacgcccag catcagattc27240gaggccgcca cgatcagcgg ggcggcccgt acgttgagga gccgacatgc ccgacaccac27300gccactcgcc ccgatgaccccgcccgcggc catcagcgcc ttcagctacc tccgggccgt27360ccaggccgac gacgtcgacg ccgcccgcga attcgccggc gctgaaccgc ggatgcccga27420actgctcatc gacgccgcga cgcggatcgt cgtcccggtc accgcgctgc ccggcccgga27480ggccggcgag ccgtgcgagg acaccttcgc cctggaggcc ctcggacgcg tcttcgtgac27540ctcgctgcgg atctgggcgcaggccgggcc ggacacggct gagggcatcg cccgcgccgt27600catcgacttc gcgcagcagttactcaacga ggaccacgag gaggactgct gcagcgaggg27660aaggcgggtg atgtgttggcggagcccgcg gtgccgaggt ggcgcatcag gtgtcgacct27720acgaggcctg ctctgcttga ccgccagcca ttgtcgcctc acccccggaa cgccctcgtc27780tcaccgctgc gccccctgcg cggcagtgtc tctggcgtgg gcgccgtgct ggtatcggct27840ccgtccctgg ctgggccaca tggacttgag tgctcgctcg ggccgcagag tccaggacgg27900ggtagcggcg aggatgaagg cgatgcggga ggcgaagcgg gcttcgggga gagggatttc27960
gcccggcgcg tcgtcgagca gcaggccgtc cggcagcttg acgctggatc gcagaggagg28020agcggcggga ggcggagcgg cgccgaggtg agcagatgcg gctggcccct gcggactggc28080tgatccagca cggcctcaaccaggccaacg tcgacgccgt ccacgtaggc ggctgctggg28140ccgcgaagaa gagcggccga tgccgccccg ccacgcgcga gcaggccctc gacgcgctcc28200gaaaccaggt gccgccctgcgtgcactgcc aacccgacca cagcctgcgg catcgactga28260aacgagaacg ccccggccag catgctggcc ggggctgaac ccgcaaaggg gtgagatcgt28320gaagggcggt cgcctgcgcg gcgaaaggca atgcgaggct tcagccgaac gatcgtcctc28380gcatgcgata gatgaggcccggggacactg ttcccttcac catcacggct ggttcaacca28440cacctgcccg gcgaacattcccgcgcgccc tacggggttc ctgagatgtt cccgggcgct28500gcaccgcttc cgtcgtcgccgcgaggtagc cctactcggt cgggtgatcc cgccaggagg28560ggagaactgc gcgcggcaccgacgcgtgat gtccggtatg aagccgatca gcgaagtgca28620tgtggcggaa ccaggcctgg ccgtcgtcga ggtcgcggcc tgtgatgacg agacggcatt28680cgcggcccag gaactgctcg ccagccggtc ccgcccccgt ggagcacgtg cagggccgcg28740acggggccgt gtgccgaccg ggccctcggg tcccgacggg agcggaggca ggccggcacg28800gaagtccccg tgtacgccta cttcttgagc ctgcggctcc cggcgtgcca gtcctcggtc28860ttgcccgtct cctgcgctgtgacgccgaac gacgccagct gcggccgctc acgcaggctg28920cgcttgatct cggcgaagccggggaaccgg gcgaggccga tgacgtggtc ccacagcact28980cccgcctgct cctcgtcggg cagccggctg atcaccggtc cgaagaacgc gacgccctcg29040ggcggttcga agtgcacgatcggggtgccg acgtccttgc ctgtcagcga caacgcctcg29100tcggactcgg cctggatcccggcatcacgg gtcacgtcgt cgagcgcgtc gacgagcgaa29160gccggcaggc cggcctcggccagggcgtcg gagacgaggg cggggctgcc ctgccacccg29220ggggtccggc cctcgtcggg cccggcctcc atgatgcgcg cgccgaagac ctcgtagagc29280gggccgaccg cctctcgtccgtgcttctcc cggacggccg aagccacccg cagcagccgc29340aggcccgcgg tgtgctgggcgtcgtactct ggggggaagt gcgtgtcgta atcgaggtgc29400gcgttgatca gtcgcaagga gatgaaccgc cagtcgacgg tgtactcgcg ctgcgcctgg29460acgatccgta tccacttgctcgtcatccac gcgaaggggc agacgggatc gaaatagaaa29520ttgatgtcgg ccttctctgccatcatgtcc acaatcgtag gttcgactaa tgctccgggc29580gggtggtgct gtcgtggcgg gtggaccacc gcgggctcag tagaccaagg tctgccagcc29640cttcatgtag ttgatgaagcgctcgctcag tcctcccgcg cgcaagtact gtgcggtgac29700gggaagttgc gggctctcgtaccgcgggtc ggccctcacc tgccggggga agtcccgctg29760caggattcct gcgcggccga tcagcacgaa gtcacagccc tcgtccagca actgaccggc29820acgctgggcg gtcctgacctttcccgcagc gcccacgcgc acgctcttcc gggggatgtc29880ggtgaagacg ctgagcatcg tcttcccgcg aaactctccc tcctggacga tctgcgcaga29940gtcccacagg gccaggtcga ggtaatcgat cagttcccgg tcgaggatct cggtgacgat30000ctcgcgcagt tctgccaggcgcagtccgta gcgctcgacg gacaggcgcc agccgatctg30060gaagtcggga ccgcatgccttgcggattcc ttcgatcacc tcgatggtga ggcgggctcg30120gttctcggta cttccgccgtacttgtccgt acggtcgttg agcatggggg acatgaactc30180cgacaggatc cacccgaaag cgccgtgcac ggacaccccg tcgaatccgg ccttctcggc30240tctcaccgcg gcggcgatga aactgtcgcg gattccttcg acttcttccg tcgtgagcgc30300
gtcggtgccc ggcacggtgg tgctggacgc cggagccgga acgccgccca gttccgggcg30360
ggcgcggtgc ccggcgtggtgcagctgtac cgccgacaga ccgccgcctt cccgcaccga30420cgcggccatg cgggtcaggccgggaatgtg ttcgtcgctg tggataccga gctggcgcac30480gaatgccttg gcgccgggttcgacggtggc ggcagcggtc tggatcaagg cgtagtcgcc30540ctgggcgagt tgtctgatccattcctggtc gaaaggagag gccgaaccgt cgtgctcact30600ttgctgattg gtgagcggcg ccagcatgaa tcggttccgc atggctgggc cgtgcgcgag30660tgtgaggggc ttgaacaggtcggggaccga catcagaact ccagatggtc gtggtcgcga30720ggggcgtggc cgcgcacgcg tgcgggccgg gtgagggggt ggggcgcaac gcgtccgacg30780ccacacggag ttgacggatcggacggtcat ttcccggcgc ctacgccgcg cctctcgcgc30840cgttggcgcc cggccggacctcgccccggg gtggggacga gaccactccg gcggccgccc30900gtagttgaac gggacggccg tcggcgggaa cggacccgta tgccccgggt ggggtgatcg30960gatcggccgt agcctctgcg tccgttcccg ggggttcagt ccgcccggcc gggttcgggg31020gcgggcggag ggcgaagtgccgtcagaagg tcaggatccg gtagccggcc tccaccagtt31080cccggatgct cgcgacacccggggtgccgg gcgcctggtt ctggccgatc tgcttgatcc31140cctcgccctc gatgcccttg ttcgcgccga agacggtcgt gcagccggag gaggccaccg31200tggcgacctg cttcttcaccgccgtgtaga gctcgtgggc ggggtgctcg gagtcggcca31260gcacggcggg ccagcgcgta ccggttccct ggaacagcac cagggcctcg ccgtcctgcg31320cgaactccca ggcggtggcg agggcgtcga agacgcggcc tagcgcttcg tcggtgccgg31380tcgacgggtc ggacaggacg acgactgcgg tcttgttgct cattgcggat gctcctcgat31440cgggtgaggt ggacgaattcatttttaccg tacgttcggt aattttgtaa aagtgacgcc31500gatcacacct cggggacggcctgtcggagt ggaggaggcg cggtcgcggc cgcctacgtt31560cacggcggtc gccggcgccccgacggcggg cacgacgacc gcgtccgcat cgtcccgaac31620gatgccggtg acccgcaccctgtcgtagaa gggcggcggg cgcggagggc gacgtcatcg31680gccgctgcgg tccgcagcacgcgcgcggag cggtcgacac cgctcccggc ggctcaccct31740ggcgcgccgc gcgtggtggg tcacctgcgc gacggcgtgc aggtgacatc cgccgttcag31800gcccccacgc ggggtgagta cgtgcgagac ggtgctggtc ggttgcgacc agttcggccc31860gcacggtcat gccgtacggccggacggcgg gacgcgtcgc gttgcgcgtc gcccgcggtc31920gcggctcgtg cttccggcgg aggtccgcta gtgctctgac cgggaaggtt cgccgggttc31980ggccttgttc taggatcctctggctatggg gggatctttt cgtgaccggt ggcgcctgac32040tcgtgccgtt gctgtggcgctggccgtgat cgtgttactg ggcgtcgtgc tcctggttct32100tccggggctg atagtcgaccacgacctcgc aggtggccac ctcgctgcag cggaccggtt32160gaacgcggtg aacaacgtgcgcaccacgct tctgcagacg gtcggcggtg cggtcgtcat32220gttcggcgcc tatgccacatggcggcagct gcgcgtcagc caagacgggc tgaacgcaac32280ccgagagggg aacatcaccg atcgcttcag ccgggccgtg gatcagctcg gcagtgacaa32340gctggacgtg cggatcggag gcatctacgc gctgtggcgg attgcggatc actccgaccg32400cgaccgcgag gcggtcgtctccatcatggc ggcgtatctg cggacacacc ttccctggcc32460gccgcaggaa cccgcagtgccggcggcgga cgtgtccatt aacgcggtgc ccccgttgga32520gacccgcgcc gcggacgctcagacagcgct gacctgcctc ggggtcctat accaggaacg32580ccgtccggag tggctcaacg tcagtttgac cgacctgcgc cgggccgact gtgacggatt32640
gtggctgcac ggagtcaacttcgacggcgc atgcctggaa gcggcgagcg tctaccaggt32700caacctgagc aaggcgtcactgatcgccgc caacctgcgg catgccgaac tcggcacttc32760cattctccac caggtccgctgtctgcaagc cgatctgcgc ggtgcacgcc tggtcaaagc32820
cgacttgagg tcggcggacttctccggtgc ggacctgcgg gaggcgaacc ttcgcaaggc32880tcgtgcccag ggtgccgtgttcgtcggcgc ggacctgcgg ttggccgacc tccggggctg32940cgacctcacc gagactgacctgcgagaggc gaggctggaa gacgcgctgg cgagcgacct33000tacgatctgg ccgaccggcttcgacgctca agcagccggc gtcgttgtca cggcggaccc33060cggcatcgaa ccggacaatctgcttccggc tgccgcgctc acgaggcgag tcccgctgct33120gcaatcagag ccgatgcatg gtccgtcagc gtcggcgaat tgagcaatca ggcagcgcag33180tcgatgggct gcccgcccca gcggatgccc ttctcgctgc ggatgcgggc gcgttccctg33240cgctgggctg cgagcacatcagggtgacgg gcgttgacgt tgcgccagcg caggtagcgg33300tgcagggcct gggtctgcgcgggatggctt cggtggtgtg agttggccag ggtgaactgc33360cgcagcgggc cgaagtgcgcctcgatcggg ttggcccagg aggcgtagga cgggggtgaa33420acacagttcg accttgttcttcttcgccca gcggcggatg tccgcgccgg tgtgggcgga33480gaggttgtcc agaatgaggtagatcggtgc gccgtcgggt cgggcagcac ggatggactt33540caaggcagcg aggctgttgg cggtgccttt gcggcggcgg ttgactcccc acagccggtc33600gtcgccgacg gagtagcaaccgtggaagta ggtgacgccg ggggtgcggt ggtaggtggc33660cggcaggcgg ttgggcttgccctgttcggc ccagcaggaa ccgccggtgg gtcggatccc33720gagcgggccg aactcgtcaa aggcgaagac ccggtccggg aagcgttcca gcacctgctc33780gatacggtcg agcttggcgtcgcggtctgg gtcaggggac tccttccatg tcttggtgcg33840ctggaaggtg atgccacggcactggagcag gcaccgtaag gcctcacggc cgatgcggat33900gacgcgtcca tgcacgcggcgcaggtaggc ggcgagtttg cggatcgacc agcgggtgaa33960gggctggccg agcttggtgg ggcgggtggt ggccgtctgg acgacgaagt cctcgtctca34020ggcttgagca ggcggggacg gcctcccgcc cagcgagggt tcaggcaggc caggccgatc34080tcgttgaacc ggtggatcacctcccgcacc gtgtcctcgt cggcctggac cagctgggcg34140atcaccggga cgcggtttccgccggcggac gcgagcagca tcatcgcccg gcgaaagcgc34200accgagctgg tactgccccg gcgcacgatc tgctgcagct tctgcccttc ctggtcggtc34260aacctgcgca cacggacagg ctcggccacc acacccccaa cggtcggacg gacgccaccg34320acatccaacc gccacaacag ccaacccggc gaaccttccc ggtcagagca ctagtcctgc34380tcgggtgcca gcaggcgcgg caggagcgcc acggcttgtg cgaacggctc cgtgtcaccc34440agcacccggg ccagcaccag ggctccctcg atccgcagga aggcgtcctt ggcggcgcgc34500tgtgcgtctt ccggccggca cccggcccgc tgtgcggctt cggccatcgc ctcgatccac34560gtcatggcga gcgagcgggcatgctcgcgg accttctccg gggcccccgc cagcgtcatc34620gtgtcgagga cgcacgacag ggctcccgcc ccgtagaagt cgctcagtct gcgcgcggtc34680tcttccgtcc cccgcgagacgtcggagtcc gtccgcatcg gctccaggat ccacaggaag34740cggtcgccca ccttggtgag gaccgcctcc gcgatccctt ccttgccggc ggggaagcgg34800tggtagagac tcgcccgctg caggccggag gccgccgaga ggtcgccgat gagggctccc34860tcgaagcctt tctcccggaa cacgggcatg agcaggtcga gcagctgggc ctcatcgatg34920gaggggggac gcgccatgctgcaaggttac cgaactttcg gtaactttgg gggcggagct34980
eg34982<210>2<211>60<212>PRT<213>Streptomyces hygroscopicus 10-22<400>2Met Glu Lys Glu Leu Val Leu Asp Leu Ala Asp Leu Ser Val Asp Glu151015Leu Asp Val Leu Pro Thr Ser Pro Gly Ala Gly Leu Glu Ser lie Asn202530Val Gly His Ala Met Val Glu lie Gly Ala Ser Asn Cys Thr Ser Thr354045Gly Thr Pro Ala Ser Cys Cys Ser Cys Cys Cys Cys505560<210>3<211>680<212>PRT<213>Streptomyces hygroscopicus 10-22<400>3Val Thr Val Thr Asp Thr Ala Ala Val Arg Pro Ala Thr Ala Ala Val 151015Leu Gly Lys Gly Leu Leu Ala Thr Ala Val Arg Ala Val Leu Ser Arg202530Ser His Gly Thr Pro Ala Gly Thr Gly Gly Glu Asp Ala Thr Gly Ala354045Thr Asn Gly lie Gly Leu Thr Gly Pro Asp Ser Gly Ser Pro Ala Val505560Thr Val Val Ala Asp Asp Gly Trp Ala Asp Asp Ser Ala lie Val Ser65707580Ala Gln Thr Pro Arg Leu Pro Val Arg Val Glu Leu Gly Arg Val Val859095Val Gly Pro Met Val Val Pro Gly Arg Ala Gly Cys Ala Arg Cys Ala100105110Arg Thr Arg Arg Glu Arg Ala Val Gly Pro Asp Ser Pro Arg Ala Glu115120125Leu Val Arg Arg Phe Gly Glu Arg Leu Ala Asp His Pro Ala Pro Val130135140Leu Thr Ala Trp Ala Cys Asp Ala Val Ala Glu Leu Val Ala Asp Glu145150155160
Leu Arg Phe Pro Gly Gly Arg Leu Thr Arg Cys Gly Leu Val Met Leu165170175Ser Leu Thr Thr Met Thr Val Asp Ala His Pro Phe Leu Pro Asp Pro180185190Arg Cys Pro Glu Cys Gly Gly Leu Pro Asp Asp Arg Pro Pro Glu Leu195200205Leu Gly Thr Ala Arg Pro Lys Pro Asp Arg Asp Thr Tyr Arg Val Arg210215220Asp Leu Arg Ala Asp Trp Glu Ala Leu Thr Arg Thr Tyr Val Asp Gly225230235240His Thr Gly Val Val Arg Gln Leu Asp Val Arg Thr Asp Tyr Arg Tyr245250255Pro Met Val Ser Ala Pro Leu His Leu Pro Asp Gly Gln Gln Glu Ala260265270Gly Phe Gly Arg Asn Leu Ala Tyr Ala Ser Cys Glu Arg Thr Ala Leu275280285Ala Glu Ala Leu Glu Arg Leu Gly Gly Ala Arg Pro Gly Gly Arg Arg290295300Thr Thr Val Arg Ala Ser Tyr Arg Glu Val Ala Asp Gln Ala Leu Cys305310315320Pro Val Glu Leu Gly Leu Tyr Pro Ser Glu Arg Tyr Asp Ala Pro Gly325330335Phe Pro Tyr Pro Pro Phe Asp Pro Gly Met Ala Leu Asp Trp Val Trp340345350Gly His Ser Phe Ala Arg Asp Ala Pro Val Leu Val Pro Glu Asp Tyr355360365Ala Tyr Tyr Arg Thr Arg His Gly Asn Pro Asp Ala Arg Pro Leu Ala370375380Tyr Glu Val Ser Asn Gly Cys Ala Leu Gly Gly Cys Leu Glu Glu Ala385390395400Ala Leu His Gly Leu Val Glu Leu Ala Glu Arg Asp Ala Phe Leu Leu405410415Thr Trp Tyr Ala Arg Leu Pro Ala Pro Arg Val Asp Leu Ala Thr Val420425430Thr Asp Pro Arg lie Ala Val Leu Ala Glu Arg lie Arg Gln Asp Ser435440445Gly His Arg Val Leu Ala Phe Ala Thr Thr Pro Glu His Gly lie Pro450455460Thr Ala Trp Val Met Ala Val His Pro Thr Ala Arg Leu Phe Pro Ala
465470475480
Pro Gly Asp Pro Arg Ala Glu Pro Ala Ala Val Cys Ala Ala Gly Ala485490495His Phe Asp Pro Glu Gln Ala Leu Leu Asn Gly Leu Leu Glu Leu Thr500505510Ala Asn Leu Gly Trp Asn Arg Asp Ala Tyr Arg Glu Glu Arg Glu Arg515520525lie Gly Ala Met Val Thr Asp Pro Asp Gln Val Arg Asp Met Arg Asp530535540His Ala Leu Leu Tyr Cys His Pro Ala Ala Phe Asp Arg Phe Gly Phe545550555560Leu Leu Gly Asp Gly Pro Pro Gly Thr Gly Ala Pro Gly Leu Pro Val565570575Glu Glu Ala Phe Ala Arg Ala Asp Cys Arg Pro Arg Gly Thr Asp Leu580585590Arg Asp Asp Leu lie Glu Val Val Thr Arg Phe Thr Arg Arg Gly Gln595600605Asp Val lie Val Val Asp Gln Thr Thr Asp Glu His Arg Ala Gly Gly610615620Leu Ala Cys Ala Lys Val lie Val Pro Gly Leu Leu Pro Met Thr Phe625630635640Gly His Gly Met Arg Arg Thr His Gly Leu Pro Arg Leu Leu Arg Leu645650655Pro Ala Leu Leu Gly Tyr Arg Ala Gly Pro Leu Ser Pro Ser Asp lie660665670Asn Pro His Pro His Pro Phe Pro675680<210>4<211>562<212>PRT<213>Streptomyces hygroscopicus 10-22<400>4Val Ala Asp Ala Asp Ala Asp Thr Val Gly Leu Arg Phe Trp His Arg151015Thr Phe Glu Gly Val Arg Glu Leu Phe Ala Glu Gly His Gly Glu Glu202530Gly Gly Ala Asp Asp Pro Leu Pro Ala Lys Thr Tyr Arg Gly Leu Pro354045Arg His Pro Leu Ser Ala Pro Ala Arg Ala Val Gly Asp Ala Arg Trp
505560Ser Phe Ala Ser Phe Arg Arg Ala His Pro Gly Gly Ala Pro Cys Leu65707580Asp Arg Leu Glu Glu Pro Ala Val Ser Val Leu Leu His Cys Val Tyr859095
Gly Met Gly Arg Met Glu Val Gly Pro His Ala Val Trp Pro Tyr His100105110Arg Leu Val Ala Ser Ala Arg Cys Phe Tyr Pro Val Glu Leu Tyr Leu115120125Trp Thr Ala Arg Pro Ala Gly Glu Leu Gly Ala Gly Cys Tyr His Tyr130135140Asp Pro Ala His His Val Leu Thr Arg Leu Arg Glu Gly Gly Leu Pro145150155160Asp Val Leu Val Ala Ala Val Gly Val Glu Arg Pro Ala Ala Val Ala165170175Pro Gly Ala His Asp Ala Pro Asp Ala Leu Leu Val Ala Ala Val Cys180185190Phe Arg Lys Ala Ala Phe Arg Tyr Arg Asp Tyr Ala Tyr Arg Leu Cys195200205Ala Gln Glu Ala Gly Met Thr Val Gly Asn Ala Leu Leu Ala Ala Gly210215220Ala Leu Gly Leu Arg Ala Arg Val His His Arg Phe Asp Asp Glu Val225230235240Val Asn Arg Ala Leu Gly Leu Asp Ala Ser Glu Glu Thr Ser Val Ala245250255Val Leu Asp Leu Arg Thr Gly Pro Leu Pro Ala Pro Val Pro Ala Ala260265270Gln Arg Pro Ala Pro Ser Pro Pro Pro Ala Gly Ala Ala Gly Lys Ala275280285Ser Pro Ala Thr Ala Leu Pro Ala lie Arg Ala Ala His Val Arg Thr290295300Asn Ala Val Asp Pro Ala Ala Trp Ser Gly Leu Leu Glu Val Asp Arg305310315320Ala Ala Arg Arg Thr Trp Ala Ala Gly Arg Pro Ala Val Asp Pro Arg325330335Ala Phe His Leu Pro Ala Gly Val Arg Gly Gly Glu Arg Gln Leu Ser340345350Leu Ala Thr Pro Thr Glu Pro Gly Pro Gly Glu lie Glu Leu Ala Ala355360365
Thr Leu Arg Thr Arg Asp Ser Gly Gly Arg Met Phe Leu Pro Gly Gly370375380
Asp Pro Leu Pro Val His Arg Leu Ala Ser Val Leu Arg His Ala Leu385390395400Glu Pro Val Pro Ser Asp His Thr Ser Arg Val Cys Arg Pro Leu Val405410415Asp Cys His Val Leu Ala Leu Arg Val Asp Gly Leu Asp Thr Gly Leu420425430Tyr Arg Leu His Pro Ala Pro Ala Pro Val Leu Ala Arg Val Pro Gly435440445Pro Asn Trp Arg Gly Val Leu Ala Met Leu Cys Asp Arg Thr Pro Ala450455460Val Asn Ser Ala Lys Ala Asp Ala lie Val Phe Leu Thr Val Asn Arg465470475480Val Glu Gly Glu Arg Ala Phe Gly Ala Arg Gly Tyr Arg lie Leu His485490495Gln Glu Ser Gly lie Val Ala Gln Arg lie Ser Val Leu Ala Ala Ala500505510Val Gly Arg Ser Val Arg lie Thr Asn Gly Tyr His Glu Gly Val Val515520525Arg Glu Leu Met Gly Val Ala Asp Ala Ala Tyr Val Pro Val Phe Cys530535540Met Ala Val Gly Arg Arg Arg Ala Thr Ala Gln Tyr Glu Met Pro Leu545550555560Thr Trp<210>5<211>647<212>PRT<213>Streptomyces hygroscopicus 10-22<400>5Met Ala Val Thr lie Ala Arg Pro Pro Asn Arg Arg Leu Ala Met Arg151015Pro Lys Leu Lys Ser Asp Val Leu Tyr Val Pro Thr Asp Asn Gly Val202530His Val Phe Gly Ala Gly Ala Asp Val Ala Leu Arg Gly Arg Ala Ala354045Tyr Gln Trp Leu Asp Arg Leu Ala Pro His Phe Asp Gly Arg Thr Glu505560Leu Glu Asp Leu Val Arg Gly Leu Pro Glu Glu Lys Arg Gln lie Val80
ProLeuAsnValThrGluAlaValArgProThrAspAspGlyAlaPro
385390395400
ArgValPheGlyAlaGlyThrSerPheAlaGluAlaArgArgAlaAla
405410415
AlaLeuArgGlylieAlaValTyrAlaAlaArgPheThrAspProArg
420425430
ArgValAspAlaAspAlaThrValTrpGlyTrpAspValProAspGly
435440445
CysAlaArgArgValProThrSerValAlaSerGlyLeuGlyProGly
450455460
ValAlaAlaArgLeuGlyTrpAspAspAlaValThrAspGlyLeuAla
465470475480
GinHisCysValArgLeuAlaValAlaAspValAlaAspGlyArgVal
485490495
GluProAlaGlyLeuAspLeuAlaThrAlaValPheAspAlaArgAla
500505510
LysSerLeuLeuGlyLeuLeuArgAlaAlaGlyGlySerValArgVal
515520525
AlaAspValGlyGlyAlaLeuGlyValProValLeuAlaTrpTrpGin
530535540
GlyGlyArgAlaValAlaAlaThrCysGlyProAspAlaValAlaAsp
545550555560
GlyLeuGluArgAlaLeuLeuAspArgGinAlaVallieThrGlyGlu
565570575
ProAlaTyrAlaProProThrValAlaGlyLeuGlySerProProGly
580585590
GluGlyProAlaAlaGlyAlaProTrpProSerAlaProGlyProGlu
595600605
ArgMetValAspCysLeuArgAlaArgGlyLeuArgProValAlaLeu
610615620
ProLeuAspHisAspProAlaValHisGluValLeuProSerLeuLeu
625630635640
ArgValValValLeuAspAsp
645
<210>6
<211>875
<212>PRT
<213>Streptomyces hygroscopicus10-22
<400>6
3053103153201001]LeuGlyArgLeuValGluLeuGlyLeuLeuGluAlaGluArgProPhe1002]3253303351003]AlaAspGinAlaLeuAspProLeuAlaAlaLeuArgAspTrpLeuAla1004]3403453501005]GlyAlaGlyProAspThrAlaAlaLeuValGlyGluValAspAlaLeu1006]3553603651007]AlaAlaLeuValAlaArgTyrProThrLeuProAspAlaAlaAspArg1008]3703753801009]LeuArgCysGlyThrAlalieGluGluValLeuArgArgValArgAsp1010]3853903954001011]LeuAlaGlyProGluGinlieGinLeuProAlaLysAsnSerVallie1012]4054104151013]GluAsnAlaLeuLeuAlaGluProLeuAlaGlyProValArgGinAsp1014]4204254301015]TrpGluProValLeuArgAspLeuAspThrValArgArgCysTyrAla1016]4354404451017]ValLeuAspProAlaLeuProGlyArgValAlaLeuAlaAspThrPhe1018]4504554601019]AlaGluArgValGlyThrGlyAlaSerMetProLeuLeuThrPheHis1020]4654704754801021]ArgThrValGinGluTrpLeuArgGluAspProGluLeuProGlyLeu1022]4854904951023]LeuSerlieAlaThrHisGlyTyrAlaSerLeuLeuAspHisArgLeu1024]5005055101025]ProArglieArgGluLeuAlaAlaArgArgAlaAspLeuCysAlaLeu1026]5155205251027]AlaAlaProValHisAlaAspGluAspGlyValValArgLeuAspPro1028]5305355401029]AlaArgLeuAlaAspLeuAlaAspGlyTrpProArgTrpMetArgAla1030]5455505555601031]ProAspSerValAlaPheTyrGlyGinProLeuAspGlyProAspAla1032]5655705751033]ArgPheValValAsnAlaValAsnSerGlyHisGlyArgGlyArgAsp1034]5805855901035]ArglieSerArgLeuLeuThrGinAlaGlyThrGluAlaArgAlaLys1036]5956006051037]ThrAlaAlaProAspAspAlaVallieValAlaAspThrCysArgHis1038]6106156201039]PheGlySerAsnValGlyLeuArgArgSerAlaValAlaAlaGlulie1040]6256306356401041]AspTyrProGluGlyHisSerGluArgAlaAlaGluHisArgliePro1042]6456506551043]LeuSerAspLeuLeuValArgHisAspProAlaArgGlyLeuLeuVal1044]6606656701045]LeuTrpSerArgGlyArgAspThrGluValArgProValHisProAsn1046]6756806851047]LeulieAlaGluLeuTrpLeuProProAlalieArgLeuLeuLeuGin1048]6906957001049]ValPheGlyAlaThrSerAsnLeuLeulieProGlyArgArgMetPhe1050]7057107157201051]GlyAspProSerLeuAlaGluValGlyGlyValLeuAlaGluProArg1052]7257307351053]ValThrValGlyAlaThrThrValSerArgArgGinTrpValPhePro1054]7407457501055]AlaSerAlaValProValArgGluLysGlyAlaSerAspArgAlaHis1056]7557607651057]LeuLeuArgLeuAlaGlyTrpLeuArgGluHisGlylieProArgArg1058]7707757801059]CysPheValArgAlaLeuAspProAlaSerValValGlyGlySerVal1060]7857907958001061]TrpArglieLysSerArgLysProLeuTyrValAspPheAlaAsnLeu1062]8058108151063]LeuLeuAlaGlyValPheGluArgAlaValAlaGlyAspGlyGinVal1064]8208258301065]LeuPheLeuGinGluAlaLeuProGlyProAspGlyMetProGlyTyr1066]8358408451067]GlyAspSerGlyProArgValThrGluPheLeulieGlulieAsnGly1068]8508558601069]GlyGinAspAlaGlyGluArgGinArgProAla1070]8658708751071]<210>71072]<211>3411073]<212>PRT1074]<213>Streptomyces hygroscopicus10-221075]<400>71076]Met Pro Glu Asn Asp Ser Gly ProLeu AspProGluAlaAlaArgGly 1077]151015
361078]AlaAspTrpValCysAlaHisliePheTyrAspThrAspGinAspLeu1079]2025301080]LeuLeuThrAspCysValArgProLeuValAlaGluLeuThrAlaAsp1081]3540451082]GlyLeuValGinArgTyrPhePheLeuArgTyrTrpGluGlyGlyPro1083]5055601084]HisValArgLeuArgLeuLeuProAlaAlaSerAlaAspArgSerAla1085]657075801086]lieGluLeuArgThrGlyLysArglieArgGluPheLeuAlaSerThr1087]8590951088]ProAlaAlaAspValValAspArgSerArgPheThrGinValAlaAla1089]1001051101090]GlyLeuAlaGlyLeuGluGlyArgSerGlyHisAspValLeuValArg1091]1151201251092]ProAsnAsnSerValGluPheLeuProTyrGluArgGluTyrAspAsp1093]1301351401094]TyrGlyArgGlyAlaAlalieAlaAlaValGluGinHisPhePheGlu1095]1451501551601096]SerSerArgLeuAlaLeuSerValValAlaAlaGlyAlaThrValGlu1097]1651701751098]GinArgAlaLeuLeuAlaPheAspLeuValValGlyValPheAlaLeu1099]1801851901100]CysGluGluValArgAspGinTrpAlaArgHisGlyGlyProProLeu1101]1952002051102]ProPheGlySerGlyProGluAlaGluAspValAlaProArgTyrLeu1103]2102152201104]AlaGinArgAspLysLeuArgAlaArgAlaArgLeuThrTrpArgMet1105]2252302352401106]AlaGluAspProGlyAlaGlyGlyHisAspGinArgAlaTyrTrpLeu1107]2452502551108]AlaSerValArgArgLeuArgGluArgLeuHisAlaLeuGluGluThr1109]2602652701110]GlyValPheThrSerAlaTrpAlaGlySerProLeuAlaGluProLeu1111]2752802851112]GlyLeuSerAspThrArgHisProGlyThrSerLeuValLeuLeuArg1113]2902953001114]CysAlaHisLeuValSerAsnArgLeuGlyLeuThrLeuTrpGinGlu1115]3053103153201116]AsnGinLeuArgPheLeuValGlyArgValLeuAlaGluLeuProGlu1117]3253303351118]AlaLeuAlaAlaSer1119]3401120]<210>81121]<211>3751122]<212>PRT1123]<213>Streptomyces hygroscopicus10-221124]<400>81125]ValAlaProTrpAlaGluAlaAlaTrpPheGlyArgHisTrpLeuArg1126]1510151127]GlyProHisLeuArgLeuAsnPheArgCysArgGlyThrAspTrpGlu1128]2025301129]GluArgValArgProThrValThrGlylieValThrAspTyrLeuArg1130]3540451131]AlaArgProSerAlaAlaArgLeuAspGluGlyAlaLeuAlaProVal1132]5055601133]HisAlaArgLeuAlaGluLeuGluMetGluThrGlyProArgHisPro1134]657075801135]TrpValProAspAsnThrValLeuGluArgProTyrAspHisArgLeu1136]8590951137]ProValLeuGluSerLeuArgAlaSerGluLeuLeuAlaGlyPheLeu1138]1001051101139]SerAspThrAsnGlyGinAlaPheArgAlaTyrGluArgValArgAla1140]1151201251141]GlyGlyAlaLeuSerLeuLeuAlaLeuAspLeuMetTrpThrThrThr1142]1301351401143]SerValAlaAlaValProPheThrThrGlyGlyGluProlieGluArg1144]1451501551601145]GlyPheLeuSerLeuArgSerHisAlaAspAlaPheLeuSerArgThr1146]1651701751147]ArgAspProValAlaValArgAlaAlaPheAspAspArgPheArgArg1148]1801851901149]GinGluThrValLeuCysGluArgLeuArgSerValGluAlaAlaLeu1150]1952002051151]SerAspGlyAlaThrGluGlyAspGlyAlaAspArgSerAspArgSer1152]2102152201153]AspArgSerGluAlaValGlyAspValValProPheValThrGluTrp1154]2252302352401155]AlaAlaAlaValArgHisHisGinArglieAlaHisProLeuLeuAla[1156]245250255[1157]SerGlyGluValSerMetGlyGlyAlaAlaArgAlaProArgMetPro[1158]260265270[1159]ThrArgArgThrSerGluPheHisAlaValLeuArgSerAspHisGly[1160]275280285[1161]HisGluAspPheValArgThrAspAspTrpPheAlaSerPheArgLeu[1162]290295300[1163]MetMetAsnTyrLeuTyrLeuHisLeuAsnArgLeuGlyLeuLysPro[1164]305310315320[1165]ValAspArgAlaLeuLeuCysHisLeuAlaAlaLeuThrValGluAla[1166]325330335[1167]ValHisGlyValAspAlaValGlySerPheGinArgTyrValAlaSer[1168]340345350[1169]ValAspProSerSerGluArgProGluTrpArgArglieGlyGluAla[1170]355360365[1171]TrpAlaAlaGlyGlyAlaGly[1172]370375[1173]<210>9[1174]<211>932[1175]<212>PRT[1176]<213>Streptomyces hygroscopicus10-22[1177]<400>9[1178]LeuThrSerValAspArglieGlyHisAlaArgGluArgAlaArgLeu[1179]151015[1180]LeuAlaVallieAspArgAlaArgGlyGlyArgGlyProAlaSerlie[1181]202530[1182]VallieArgGlyGluArgGlylieGlyLysSerAlaLeuLeuGlyGlu[1183]354045[1184]PheAlaSerLeuAlaAlaAspAlaGlyPheArgValSerAlaValSer[1185]505560[1186]AlaGlyThrGinProGlyAspProLeuGlyAlaAlaLeuArgValVal[1187]65707580[1188]SerArgLeuAspAlaArgCysThrGluProAlaGluGlyThrAlaLeu[1189]859095[1190]HisArgProAlaProAlaGlyGluProValProHisArgAlaAlaPro[1191]100105110[1192]SerGluGluValLeuArgGluLeuValGluThrValCysArgGinAla[1193]115120125[1194]ArgArgThrProValAlalieCysLeuAspAspAlaGlyHisLeuAsp
391195]1301351401196]ProTrpSerLeuHisTrpLeuSerGlyLeuTyrSerAlaAlaSerAsp1197]1451501551601198]LeuProLeuAlalieAlaLeuThrGlyGlyAsplieAlaAlaAlaAsp1199]1651701751200]GinAspProTrpProProAlaLeuAlaAlaAlaAlaGluHislieAla1201]1801851901202]LeuSerGlyLeuAspProGluGluValGlyAlaPheAlaAlaAlaTyr1203]1952002051204]ArgAsnValProLeuAspAlaProThrAlaGinLeuCysHisGluLeu1205]2102152201206]ThrGlyGlyAsnProAlaLeuLeuLeuSerLeuLeuAlaCysHisThr1207]2252302352401208]GlyThrAlaProThrAlaAspAlaLeuArgAspThrAlaAlaSerAla1209]2452502551210]ValLeuProGlyAlaAspArgTrpLeuAlaGlyLeuGlyGlyAlaAla1211]2602652701212]LeuGlyLeuAlaArgAlaValAlaValLeuGlyProGinAlaGlulie1213]2752802851214]ThrGinCysAlaGluLeuAlaGlyLeuSerValArgGluAlaLeuPro1215]2902953001216]LeulieAspGluLeuValAlaArgSerLeuPheAlaAsnArgThrPro1217]3053103153201218]LeuSerPheArgHisProLeuLeuAlaGlyMetVallieSerArgVal1219]3253303351220]ProAlaGlyThrArgAlaAlaLeuHisLeuThrAlaAlaGlylieLeu1221]3403453501222]ArgAspGlyHisPheGlyAlaThrHisValAlaArgHisLeuValAla1223]3553603651224]AlaGlyProLeuGlyLeuAlaTrpThrValArgProLeuArglieAla1225]3703753801226]AlaAsnGinLeuGluArgGluGlyArgHisGluGluAlaAlaGlyHis1227]3853903954001228]LeuArgGlyMetLeuArgGluArgLeuArgProArgValArgSerSer1229]4054104151230]ValGinCysGinLeuAlaAlaLeuAspGlyPheAlaAlaProAspSer1231]4204254301232]AlaValArgArgLeuAspAlaAlaArgArgGluAlaAspAspProArg1233]435440445
40[1234]CysAlaThrAspTyrAlaValAlaLeuGlyThrLeuLeuAlaGluCys[1235]450455460[1236]GlyArgProGluAspAlaValAlaValLeuAspAspThrAlaGluArg[1237]465470475480[1238]LeuGlyProGinAlaAlaAlaGinArgTrpArgLeuArgLeuArgLys[1239]485490495[1240]AlaLeuLeuCysLeuGlyGlyProValProSerValLeuProAlaAsp[1241]500505510[1242]LeuProAspSerLeuAlaAlaGinAlaProSerAspAspGluAlaArg[1243]515520525[1244]ArgGluLeuSerAlaLeuArgAlaValHisAlaLeuArgAspGlyThr[1245]530535540[1246]AspArgAspAlaAlaValGlyHisAlaArgGlyAlaLeuThrGlySer[1247]545550555560[1248]GluAspProGlyArgLeuLeuTrpHisGlyCysGluValLeulieArg[1249]565570575[1250]AlaAspGluLeuAlaGluAlaTrpSerTyrCysSerArgAlaArgLeu[1251]580585590[1252]LeuAspGinSerArgProGlyThrTrpGlyAspValGlyValGlyLeu[1253]595600605[1254]LeuArgAlaLeuValLeuTyrAlaArgGlySerLeuThrAlaAlaAsp[1255]610615620[1256]AlaAlaLeuThrProLeuAlaAspLeuLeuArgProAlaAlaGluAla[1257]625630635640[1258]AlaArgLeuProAlaThrLeuThrValAlaValLeuAlaGluValArg[1259]645650655[1260]AlaGinThrGlyAlaThrAspAlaAlaLeuAlaLeuLeuAlaAspCys[1261]660665670[1262]GlyLeuAspGlyGluLeuProAlaArgGinAspThrValAlaValLeu[1263]675680685[1264]GlyAlaArgAlaAlaValTrpGluGinAlaGlyAspThrAlaArgAla[1265]690695700[1266]LeuGluAspLeuTyrAlaAlaGlyArgLeuLeuAlaAspSerArgVal[1267]705710715720[1268]ArgAsnProAlaValLeuProTrpArgSerArgAlaAlaArgLeuLeu[1269]725730735[1270]AlaSerArgGlyAspLeuThrGluAlaSerGlyLeuAlaAlaAlaGlu[1271]740745750[1272]TrpGluAspAlaArgArgTrpGlyThrProArgAlaValGlyThrAla1273]7557607651274]GinHisAlaLeuAlaLeuThrGluThrGlyGlyArgArgLeuArgArg1275]7707757801276]LeuAlaThrAlaValGluThrLeuAlaHisSerProAlaArgLeuGlu1277]7857907958001278]LeuAlaTyrAlaArgArgAspLeuGlyAlaAlaLeuSerGluAlaGly1279]8058108151280]ArgAlaAspAlaAlaArgThrGluPheArgAlaAlaLeuSerLeuAla1281]8208258301282]LysSerCysGlyAlaGinProLeuValArgArgValProLeuAspArg1283]8358408451284]GluCysLeuTrpProValValAspAspAspArgGlySerProAlaLeu1285]8508558601286]SerGlyLeuThrProGinGluGinArglieLeuGlyLeuAlaArgAla1287]8658708758801288]GlyHisThrAsnLysAlalieAlaGlyLysLeuPheValThrValArg1289]8858908951290]ThrValGluPheHisLeuSerGlyAlaTyrArgLysLeuGlylieSer1291]9009059101292]GlyArgAspGinLeuAlaAspVallieProAlaProLeuGlyThrGly1293]9159209251294]GlyGlyArgAla1295]9301296]<210>101297]<211>1921298]<212>PRT1299]<213>Streptomyces hygroscopicus10-221300]<400>101301]MetGlyArgLeuArgValProArgArgArgGlyHisProArgThrArg1302]1510151303]ProAspProValLeuAlaAspLysAlaTyrSerSerHisAlalieArg1304]2025301305]GluHisLeuArgLysArgGlylieArgAlaVallieProValProGly1306]3540451307]GlyProAlaGinProProAlaProProGlyArgProArgArgGinAla1308]5055601309]ThrGlyLeuArgProArgAspProGinAlaAlaGinHisArgArgAla1310]657075801311]ValHisArgProProGinAlaValAlaArgHisArgHisProValArg1312]8590951313]GluGlyArgAlaGlyAlaAlaHisLeuGlyArgGlyGlyValHisAsn1314]1001051101315]GlyValProTyrPheThrGlyGinCysGinGlyGlyValValProSer1316]1151201251317]ThrCysArgHisArgProGlyLeuArgAlaArgAlaProArgThrGly1318]1301351401319]ValArgSerPheArgSerArgProGinGluGlyGlyAlaProProAla1320]1451501551601321]AlaGlyLeuGlyArgSerProGlyGluGlySerlieAlaArgPheAla1322]1651701751323]ProAsnProSerAlaAlaArgProArgSerAlaAlaGlyThrAspGly1324]1801851901325]<210>111326]<211>1701327]<212>PRT1328]<213>Streptomyces hygroscopicus10-221329]<400>111330]MetArgArgHisArgSerlieAspHisGluArgHisSerArglieVal1331]1510151332]ProAlaAlaGlyHisAlaSerProAlaValProHisGinLeuValAsn1333]2025301334]AspArgGlyGinAlaAlaValLeuAlaArgGluArgThrAlaGlyThr1335]3540451336]ArgSerArgSerAlaProGlyGlyHisSerSerProPheThrProThr1337]5055601338]GlyGinLeuSerArgArgArgArgProGlyGluHisArgArgAspAla1339]657075801340]HisGinCysArgPheGluArgThrArgGlyArgProSerMetlieSer1341]8590951342]ValGluHisAlaThrProProValValGluGluSerValLeuGluAsp1343]1001051101344]LeuArgAlaArgLeuArgGlyTyrArgArgValAspValProAlaGly1345]1151201251346]PheGlyTrpAlaArgGlyValAspGlyAspArgLeuAlaAspLeulie1347]1301351401348]SerHisTrpAlaSerMetThrValCysLysTyrlieSerAlaSerPro1349]1451501551601350]HisCysProGlyProlieValArgSerArg
431351]1651701352]<210>121353]<211>1181354]<212>PRT1355]<213>Streptomyces hygroscopicus10-221356]<400>121357]Met Asp ValTyrGluAlaValAspSerArgArgAlaValArgAlaPhe1358]1510151359]Ser Asp GluProValProLysGluValLeuGluArgValLeuThrAla1360]2025301361]Ala Thr ArgAlaProSerSerGlyAsnLeuGinProTrpHisMetTyr1362]3540451363]Val Val ThrGlyGluProLeuAlaGluLeuLysArgArgThrThrAla1364]5055601365]Arg Ala LeuAlaSerAspProGlyAspGluArgGinTyrProMetTyr1366]657075801367]Pro Asp GluLeuAlaLeuLeuTyrThrAspArgPheSerAlaAlaAla1368]8590951369]Ala Gin ArgTyrGluAlaLeuGlySerHisAlaThrThrProThrGly1370]1001051101371]Pro Gly ArgSerLeuPro1372]1151373]<210>131374]<211>781375]<212>PRT1376]<213>Streptomyces hygroscopicus10-221377]<400>131378]Val Ser AsnGlyArgCysGlyArgArgGinAspHisHisGinValVal1379]1510151380]Asn Gly AlaLeuTyrArglieArgThrGlyMetGinTrpArgAspLeu1381]2025301382]Pro Asp ArgHisAlaProTrpLysThrValAspGluArgHisArgArg1383]3540451384]Trp Ser MetAsnArgThrTrpGluValLeuLeuArgGinValGluAla1385]5055601386]Asp Ser GlyLeuThrGlyProProAspHislieGlyProPro1387]6570751388]<210>141389]<211>196[1390]<212>PRT[1391]<213>Streptomyces hygroscopicus10-22[1392]<400>14[1393]ValArgCysAspPheArgSerSerSerArgArgArgArgGlyArgAla[1394]151015[1395]LeuSerSerLeuLeuPheArgArgArgGinArgLeuArgMetProGin[1396]202530[1397]ArgGlyLeuValValArgGlyProGlyProLeuHisGlyArgGlyPro[1398]354045[1399]AlaProGlyArgArgProValAlaGluGlyArgArgAlaSerLeuMet[1400]505560[1401]ValGlyLysArgMetGluAsnGluAlaGlySerSerAsnAspProArg[1402]65707580[1403]AlaAspValLeuArgValLeuGlyMetLeuLysValAlaThrAlaAsp[1404]859095[1405]ArglieLysArgLeuSerSerProHisProAlaTyrArgHisThrThr[1406]100105110[1407]LysProThrAlaAlaLysLysGluAlaArgThrAlaSerHisArgAla[1408]115120125[1409]AlaValHisAspLeuArgLeuHisGlyLeuAlaValGluGlyGlyArg[1410]130135140[1411]ThrArgGlyGlyGlyArgAspProAlaGlyHisGluGluGlyLeuAla[1412]145150155160[1413]ThrAlaAlalieAspLeuAspArgGlulieGluGluMetGlyGlylie[1414]165170175[1415]AlaGinGluGlyGlyProLeuArgArgLeuAlaArgAspAspGlyGlu[1416]180185190[1417]ProCysArgArg[1418]195[1419]<210>15[1420]<211>111[1421]<212>PRT[1422]<213>Streptomyces hygroscopicus10-22[1423]<400>15[1424]MetlielieThrLeuLysArgArgGluGlyMetThrHisAspGluPhe[1425]151015[1426]LysHisTyrGinGinAsnlieHisArgProLeuLeuMetSerliePro[1427]202530[1428]GluAlaAspArgTyrlieArgArgPheValValSerTyrProValPro
45[1429]354045[1430]AlaProArgTyrProGluProGluTyrAspSerValValGluAlaTrp[1431]505560 [1432]PheAspThrMetAlaAspLeuGluAlaLeuPhePheSerAspAsnPhe[1433]65707580[1434]LeuLysThrValAspProAspHisGlyAsnPhelieAspLeuSerThr[1435]859095[1436]PheGlyArgVallieThrGluGluAspValVallieAspGlyArg[1437]100105110[1438]<210>16[1439]<211>478[1440]<212>PRT[1441]<213>Streptomyces hygroscopicus10-22[1442]<400>16[1443]ValSerAlaCysAsnGlyProGlyArgPheTyrValAlaAlaPheGly[1444]151015[1445]AlaThrTyrThrPheSerlieGlyAsnValThrAlaProArgLeuGly[1446]202530[1447]ProGluLeuGlyAlaSerArgGlyGluValAlaLeuValLeuAlaAla[1448]354045[1449]PheAlaValSerPheAlaAlaGlyLeulieLeuAlaGlyArgLeuGly[1450]505560[1451]AspArgTyrGlyArgArgArgLeuLeuGlylieGlyLeuLeuAlaLeu[1452]65707580[1453]AlaLeuThrSerAlaLeuAlaAlaAlaAlaProGlyLeuTrpLeuLeu[1454]859095[1455]ValAlaAlaArgValLeuGinGlyAlaSerSerAlalieValMetPro[1456]100105110[1457]GinThrLeuAlalielieGinThrLeuGlySerGluProAlaArgAla[1458]115120125[1459]ArgGlyLeuAlaAlaPheThrAlaSerSerGlyValGlyThrValAla[1460]130135140[1461]GlyGinValValGlyGlyLeuValMetGlyLeuGlyLeuProPheAla[1462]145150155160[1463]GlyTrpArgGlyAlaAlaLeuThrSerAlalieProSerValLeuAla[1464]165170175[1465]LeuLeuGlyValArgArgLeuLeuValHisProProSerSerThrGlu[1466]180185190[1467]ArgProAspLeuGlyGlyAlaLeuGlyLeuGlyThrSerLeuLeuAla1468]1952002051469]LeuValAlaGlyLeuSerLeuGlyProAlaThrGlyTrpAlaTrpTrp1470]2102152201471]AlaSerAlaLeuValAlaLeuGlyPheLeuGlyLeuTyrGlyPheTrp1472]2252302352401473]LeuAspGinGlyArgArgGluArgAlaGlyArgProValLeuValAla1474]2452502551475]ProSerSerLeuArgLeuProSerValArgLeuGlyLeuLeuMetAla1476]2602652701477]ValLeuLeuPheAlaGlyTyrGlyAlaPheSerTyrGluTyrSerMet1478]2752802851479]LeuThrGinValGlyLeuGlyLeuThrProValGinSerGlyLeuAla1480]2902953001481]LeuThrAlaPheAlaGlyThrPheValLeuAlaGlyLeuHisMetPro1482]3053103153201483]GlylieMetSerArgPheGlyGluArgThrMetGluLeuAlaAlaVal1484]3253303351485]LeuLeuCysAlaGlyLeuThrLeuLeuGlyValAlaSerTrpPheAla1486]3403453501487]GinGlyLysSerValAlalieTrpValGlyCysPheGluValLeuGly1488]3553603651489]ValLeuLeuGlyAlaAlaGinAlaSerGinTyrGlyProLeuValGly1490]3703753801491]ThrValMetAlaAlaValProHisArgValAlaGlyLeuAlaGlyGly1492]3853903954001493]LeuPheThrThrAlaGinGinAlaSerLeuGlyLeuGlylieAlaThr1494]4054104151495]lieGlyGlyValPheGlyThrLeuAlaProArgLeuGlyTrpGluHis1496]4204254301497]AlaPheAlaValAlaLeuGlyValGinLeulle Thr Thr Val Leu Phe1498]4354404451499]TrpValLeuAlaArgArgLeuArgSerArgProArgAlaCys Gly Thr1500]4504554601501]ValLeuAlaProGlyValGinHisArgThrGluAlaLeuAsp1502]4654704751503]<210>171504]<211>2971505]<212>PRT1506]<213>Streptomyces hygroscopicus10-221507]<400>171508]MetlieValAlaMetAlaAspValArgSerArgGluLeuGlyAlaTyr1509]1510151510]LeuArgAlaArgArgAspArgLeuSerProAlaAspValGlyLeuPro1511]2025301512]AspGlyGlyGlyArgArgArgValLysGlyLeuArgArgGluGluVal1513]3540451514]AlaValLeuAlaAsnValGlySerSerTrpTyrThrTrpLeuGluGin1515]5055601516]GlyArgAspValArgProSerValGluValLeuAlaAlalieAlaAsp1517]657075801518]AlaLeuArgLeuSerSerSerGluArgArgHisLeuPheLeuLeuGly1519]8590951520]GlyHisProAspAlaGluProProSerAsnCysGluGlyThrSerGly1521]1001051101522]ArgValGinThrLeuLeuAspSerLeuSerProHisProAlaValVal1523]1151201251524]MetAsnProTrpPheGluProLeuAlaTyrAsnAlaProPheArgPhe1525]1301351401526]MetlieAspAspLeuGluAlaLeuProProAlaAspArgAsnCysAla1527]1451501551601528]TyrLeuHisPheThrHisProAspTrplieAlaAlaHisSerAspHis1529]1651701751530]GluGinGluCysAlaAlaValValAlaLysLeuArgAlaTyrHisGly1531]1801851901532]GluSerValThrAspProAlaTrpAlaProLeuLeuAlaArgLeuArg1533]1952002051534]GluGluSerProLeuPheValArgLeuTrpGluGinAlaAspValSer1535]2102152201536]ThrGluProGlyArgValLysArglieArgSerArgHisValGlySer1537]2252302352401538]LeuSerValArgAlalieThrLeuLeuLeuGluGluAsnProArgThr1539]2452502551540]ArgValValValTyrGinProAlaAspArgThrThrGinGluArgLeu1541]2602652701542]GluGluLeuAlaHisArglieAlaArgGlyThrlieAspGlyProAla1543]2752802851544]ArgValArgHisLeuLeuAlaAlaThr1545]2902951546]<210>181547]<211>1161548]<212>PRT1549]<213>Streptomyces hygroscopicus10-221550]<400>181551]Met GluAlalieArgValProArgProGlyProGlyArgProArgVal1552]1510151553]Arg ProSerHisValLeuGlyAspLysGlyTyrSerSerArgAlalie1554]2025301555]Arg SerTrpLeuArgArgArgGlylieSerHisThrlieProGluArg1556]3540451557]Ala AspGinValArgAsnArgLeuAsnArgGlySerArgGlyGlyArg1558]5055601559]Pro ProAlaPheAspArgAspThrTyrLysArgArgAsnValValGlu1560]657075801561]Arg CysPheAsnLysLeuLysGinTrpArgGlylieAlaThrArgTyr1562]8590951563]Asp LysThrThrGluSerTyrGinAlaAlaValThrLeuAlaAlaLeu1564]1001051101565]Leu MetTrpAla1566]115
49
权利要求
一种环噻唑霉素生物合成基因簇,其特征在于,该基因簇包含分别编码如下氨基酸序列的17个基因,所述氨基酸序列具体为SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ IDNO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18。
2.一种根据权利要求1所述的环噻唑霉素生物合成基因簇,其特征在于,该基因簇包 含如下17个基因,所述17个基因的碱基序列具体为⑴SEQIDNO1 第 16526 16705位所示碱基序列、(2) SEQIDNO1 第 14372 16411位所示碱基序列、(3) SEQIDNO1 第 16870 18555位所示碱基序列、(4) SEQIDNO1 第 18593 20533位所示碱基序列、(5) SEQIDNO1 第 11730 14354位所示碱基序列、(6)SEQIDNO1 第 10733 11755位所示碱基序列、(7) SEQIDNO1第9501 10625位所示碱基序列、(8)SEQIDNO1第4875 5462位所示碱基序列、(9)SEQIDNO1第4404 4736位所示碱基序列、(10)SEQID NO :1第20695 21204位所示碱基序列、(11)SEQID NO :1第1857 2747位所示碱基序列、(12)SEQID NO :1第6629 9424位所示碱基序列、(13)SEQID NO :1第2829 4262位所示碱基序列、(14)SEQ ID NO :1第5867 6442位所示碱基序列、(15)SEQID NO :1第21712 22153位所示碱基序列、(16)SEQID NO :1第1182 1541位所示碱基序列、(17)SEQID NO :1第21248 21601位所示碱基序列。
3.根据权利要求2所述的环噻唑霉素生物合成基因簇,其特征在于,该基因簇的碱基 序列如SEQ ID NO 1所示。
全文摘要
一种基因工程技术领域的环噻唑霉素生物合成功能基因簇、重组载体及宿主;本发明涉及一种环噻唑霉素生物合成基因簇,该基因簇包含分别编码如SEQ ID NO2~SEQ ID NO18所示氨基酸序列的17个基因;本发明还涉及一种包含该基因簇的重组载体;本发明还包含一种包含该基因簇的宿主。本发明的基因簇包含了环噻唑霉素生物合成的所有遗传元件,实现了环噻唑霉素的生物生产。
文档编号C12N15/11GK101838642SQ20091031159
公开日2010年9月22日 申请日期2009年12月16日 优先权日2009年12月16日
发明者王绛, 贺新义, 邓子新, 黄曦 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1