产生疏螺旋体素的聚酮化合物合酶及其用途的制作方法

文档序号:3060004阅读:528来源:国知局
专利名称:产生疏螺旋体素的聚酮化合物合酶及其用途的制作方法
技术领域
本发明涉及制备聚酮化合物(polyketides)的材料和方法。提供了用于制备聚酮化合物尤其是聚酮化合物大环内酯疏螺旋体素的酶系统、核酸、载体和细胞。
背景技术
聚酮化合物是多种生物尤其微生物产生的天然产物。聚酮化合物具有许多重要的药学、兽医和农业用途。聚酮化合物包括大范围的化学结构空间,并且具有多种相关的生物学活性。用于医疗的聚酮化合物包括抗生素、免疫抑制剂、抗肿瘤剂、其他化疗剂、及具有广泛治疗和生物学性质的其他化合物。革兰氏阳性细菌链霉菌属及其近亲的属是聚酮化合物的优秀生产者,并且这些生物中聚酮化合物生物合成的遗传学和生物化学是相对良好表征的(Hopwood,1997)。链霉菌属中聚酮化合物生物合成的基因是成簇的,DNA技术的开发已经使得可能用编码负责它们生物合成的基因的DNA探针筛选基因文库分离全部生物合成基因簇。从而,链霉菌属及其他微生物中越来越多用于聚酮化合物生物合成的基因簇已经被分离并序列,这些基因簇包括例如聚醚莫能菌素(WO 01/68867)、多烯制霉菌素(WO01/59126)和雷帕霉素(Schwecke等人,1995)的基因簇。
通过含有羧酸功能的结构单元反复缩合合成聚酮化合物。在该过程的每个阶段,这导致生长链中形成新的β-酮官能和α-侧链分支。聚酮化合物的结构多样性来自它们生物合成途径的许多方面,包括在它们的生物合成中可以利用的起始单元多样性;可能的聚酮化合物链的不同长度;聚酮化合物链装配期间或之后导入的多种α-侧链;聚酮化合物链装配期间或之后导入的多种β-取代;β-酮基可以经历多种加工程度(酮基、羟基、烯酰基和亚甲基);以及在α-和β-中心可能的多种立体化学。
聚酮化合物的合成由称作聚酮化合物合酶(PKS)的酶或者酶复合体以类似物脂肪酸生合成的方式催化。链霉菌属和相关属PKSs分成三个主要类别I型、II型和III型。III型PKSs是与最近发现的植物查耳酮合酶有关的小蛋白质(Moore和Hopke,2000)。III型系统参与少数次级代谢物的生物合成但是可能更普遍地是参与可溶色素的生物合成(Cortés等人,2002)。II型PKS由一些单功能蛋白质组成,这些蛋白质作为多个多肽复合体。简单的芳香族聚酮化合物如放线菌紫素通过几轮链装配形成,该装配由一组II型PKS酶反复执行,这些酶由一组PKS基因编码(Hopwood,1997)。I型PKS是多功能蛋白并且是更复杂的聚酮化合物如红霉素和雷帕霉素的合成所需的。作为本专利的焦点,下面详细描述I型PKS的组织和功能I型PKS组织为多个组件(module),其中每个组件由一些催化性“结构域”组成,这些结构域是实施一轮链装配所需的(Staunton & Wilkinson,1997)。通常,组件化PKS含有正确数目的组件(装载组件(load module)和延伸组件)以选择和缩合正确数目的装载和延伸单元。例如,红霉素PKS由7个组件(一个装载组件和六个延伸组件)组成以选择和缩合红霉素前体6-脱氧红诺霉素(erythronolide)B的生物合成所需的一个起始单元和六个延伸单元。从而,PKS中存在的组件数和所掺入的单元数之间存在一对一的关系。该一对一关系被描述为“同线性”。
如此处所用的术语“延伸组件”指从β-酮酰基-酰基载体蛋白合酶(KS)结构域到下一个酰基载体蛋白(ACP)结构域的一组连续结构域,其完成一轮聚酮化合物链延伸。如此处所用的术语“装载组件”指任一组连续结构域,其完成起始单元向PKS的装载从而使得该起始单元可以被第一个延伸组件的KS结构域利用。除了下一个延伸的羧酸(或者酮化物(ketide))单元缩合到增长的聚酮化合物链上(通过基本KS结构域的催化活性实施),I型PKS的组件还可以含有具有β-酮还原酶(KR)、脱水酶(DH)和烯酰还原酶(ER)活性的结构域,这些结构域负责链延伸期间新近形成的β-酮基的进一步加工。每个组件中存在的酰基转移酶(AT)和ACP结构域分别负责延伸单元的选择,并在延伸单元向PKS传递过程中限制该增长链。也发现组件化PKS的AT结构域为离散的蛋白(Cheng等人,2003)。所完成的聚酮化合物链通常通过末端硫酯酶(TE)结构域的作用从PKS释放,该末端硫酯酶结构域也通常参与终产物的环化(内酯化)。还使用其他链终止/环化策略,如对雷帕霉素所观察到的加入氨基酸残基和大内酰胺形成的策略(Schwecke等人,1995),对利福霉素所观察到的大内酰胺形成策略(August等人,1998),和对粘球酰胺生物合成所观察到的氨基酸掺入然后还原消除策略(Silakowski等人,2001)。总之,在生物合成期间对于每个连续的催化步骤PKS上存在单一酶促结构域,并且这些结构域以明确的顺序使用,该顺序取决于它们在该蛋白内的位置和它们所执行的具体功能。该机理被称为“向前的(processive)”。
通过对组件5的KR结构域的一个区域进行符合读框的缺失突变红霉素PKS(也称为6-脱氧红诺霉素(erythronolide)B合酶,DEBS)首先证实了I型PKS的组件化排列(Donadio等人,1991)。由于在向前生物合成的该阶段所突变的KR结构域不能还原β-酮基5,这导致产生红霉素类似物5,6-二脱氧-3-α-mycarosyl-5-氧代红诺霉素B和5,6-二脱氧-5-氧代红诺霉素B。同样地,通过相应编码PKS的DNA进行基因工程并将该DNA导入红色糖多孢菌(Saccharopolyspora erythraea),改变DEBS2的组件4的ER结构域中的活性部位残基导致产生6,7-脱水红霉素C(Donadio等人,1993)。此外,通过将DEBS3的TE结构域特异重定位到DEBS1的末端改变了DEBS所形成的聚酮化合物链的长度;预期的三酮化物内酯产物产率良好(Cortés等人,1995)。应该指出所描述的变化包括通过序列的缺失、通过序列特异性失活或者通过相同PKS簇内DNA序列的备选并置导致的改变(即它们被认为是“同源改变”)。在WO 93/13663中描述了红霉素PKS的其他此类“同源”改变。
I型PKS基因的组件化组织导致这些基因自身的操作而产生改变的聚酮化合物结构。I型PKSs代表聚酮化合物生物合成的装配线,通过改变组件的数目;改变它们针对不同羧酸起始单元和延伸单元的特异性;通过失活、突变、除去、交换或者插入具有不同活性和特异性的结构域;以及通过改变终止或环化结构域的位置改变链或环大小,可以操作聚酮化合物生物合成(Staunton & Wilkinson,1997)。
WO 98/01546描述了包含掺入了异源DNA的杂化PKS基因(hybridPKS gene)装配体的产生,其。WO 98/01546描述了产生杂化PKS的方法,其中用编码异源组件、亚组件或结构域的基因替换天然基因产生了具有结构改变的新聚酮化合物。特别地,例如,来自雷帕霉素或莫能菌素PKS的异源DNA的AT结构域可以与红霉素PKS的天然AT结构域交换以便产生具有改变的烷基分支的新聚酮化合物。这种AT结构域交换代表产生真实杂化PKS的第一个实例(Oliynyk等人,1996)。WO 98/01546还一般性地描述了含有装载组件和至少一个延伸组件的杂化PKS装配体的产生。它特别描述了通过将对生产除虫菌素的PKS的宽特异性装载组件嫁接到红霉素PKS的第一个蛋白(DEBS1)以代替正常的装载组件而构建杂化PKS基因装配体(也见Marsden等人,1998)。还描述了额外的实例,其中包括对底物特异的装载组件的交换(WO 00/00618;US 5876991;Kuhstoss等人,1996)。WO 00/01827描述了通过交换“还原性环”的能力改变PKS组件的β-酮加工能力的方法,交换“还原性环”的能力即能够快速并以组合的方式改变组件内酮还原酶、脱水酶和烯酰还原酶结构域的数目和类型的能力。除了改变β-酮基加工的水平外,这些改变也可以导致所改变的组件形成的α-烷基和β-羟基的立体化学。
尽管组件化PKS以如上述的同线性和向前的方式“正常地”运行,但是已经描述并在下面讨论了偏离该运行模式的实例。
委内瑞拉链霉菌(Streptomyces venezuelae)中苦霉素PKS基因簇负责苦霉素(一种14元七酮化物大环内酯)和酒霉素(一种12元六酮化物大环内酯)的生物合成(Xue等人,1998)。单一PKS产生具有不同环大小的两种相关的大环内酯的能力来自最后的PKS基因pikA4的备选表达(Xue &Sherman,2000)。当发生“正常”表达并形成全长PikA4时,掺入第六个延伸单元并产生苦霉素苷元(aglycone);当发生备选表达并产生PikA4的N-末端截断形式时,不掺入第六个延伸单元并且正在生长的聚酮化合物链直接传到TE结构域,其导致形成酒霉素苷元。从而,发生同线性的破坏并形成“环收缩的”产物。已经研究了该现象的生化基础并且表明其是ACP5向ACP6转移,遗漏了与间插KS6结构域的共价结合;这种同线性的破坏被称为“跳跃”(Beck等人,2002)。
当雷帕霉素PKS的额外延伸组件被插入红霉素PKS以便将天然产生七酮化物的PKS转化成产生八酮化物的PKS时,也观察到发生跳跃(Rowe等人,2001)。产生所预期的八酮化物—一种16元大环内酯,但是主要产物是通常的七酮化物产物6-脱氧红诺霉素。认为发生该插入组件的“跳跃”是由于所插入的组件在一些情况下作为“梭子”,其将来自前面组件的生长链传递到下面的下游组件而不执行一轮链延伸。随后表明跳跃期间所插入组件的ACP结构域对于从前面的ACP结构域传递生长聚酮化合物链并将其传代到后面组件的KS结构域是必需的(Thomas等人,2002),该机理类似于关于上面的酒霉素生物合成所描述的机理。已经表明可以不用KS结构域的活化部位亲核体而发生跳跃。已经报导了来自链霉菌属土壤分离物的被化学突变修饰的一个突变株的环收缩的(跳跃的)杀线虫菌素(nemadectin)(一种抗寄生虫大环内酯)(Rudd等人,1990);天然PKS产物的生物合成被消除。
一个备选方式涉及到对组件的反复操作,在该备选方式中,组件化PKS偏离同线性操作。例如,红霉素PKS的组件4似乎以低水平反复地操作而产生一种环扩大的与6-脱氧红诺霉素B相关的16元八酮化物大环内酯(Wilkinson等人,2000)。红霉素PKS执行该操作的能力被称为“打滑(stuttering)”。红霉素PKS的“打滑”被认为是一种异常过程,因为该打滑的产物以低产率形成并且红霉素PKS的主要产物是通过同线性操作形成的正常七酮化物6-脱氧红诺霉素B。也已经报导似乎通过打滑和跳跃形成的产物是埃坡霉素(epothilone)生产者纤维素堆囊菌(Sorangiumcellulosum)的次要组分(Hardt等人,2001)。橙色标桩菌(Stigmatellaaurantiaca)的标桩菌素生物合成簇编码含有10个(一个装载和九个延伸)组件的PKS(Gaitatzis等人,2002);然而,基于结构阐明和添加稳定的同位素标记底物,发现标桩菌素从11个组件化衍生的单元形成。从而,似乎标桩菌素PKS组件之一反复操作(两次)。
因为本申请的优先权提交,已经描述了负责娄彻氏链霉菌(Streptomyces rochei)的大环内酯兰卡杀菌素的生物合成的PKS的序列(Mochizuki等人,2003)。与兰卡杀菌素生物合成所需的延伸循环数相比,该PKS所含组件似乎也太少,尽管该生物合成的机理还不清楚。
通过不同于PKS的酶修饰聚酮化合物可以产生额外的结构多样性,该修饰可以在如在一些袢霉素的生物合成期间所看到的链装配期间(Floss,2001)进行或者在链装配从PKS释放后进行。这些非-PKS介导的反应可以包括,但不限于下面的反应还原、氧化、羟基化、酰化、烷基化、氨基化、脱羧、脱水、双键异构/迁移、环化、环切割、共轭、糖基化、还原性去除和它们的任一组合。当这些反应在链装配后发生时,它们被称为后-PKS(post-PKS)或者剪裁步骤。这些剪裁步骤通常,但不是总是,对于赋予聚酮化合物天然产物生物活性是必需的。
此外,通过使用明确的异源后-PKS剪裁酶以及通过使用天然修饰天然聚酮化合物的那些剪裁酶可以进一步增强生物合成可以得到的聚酮化合物的结构多样性(Gaisser等人,2000)。WO 01/79520描述了通过糖基化、环氧化、羟基化和甲基化异源修饰聚酮化合物大环内酯结构。已经报导了通过用备选脱氧己糖取代基糖基化可以产生农业化合物spinosyn(Gaisser等人,2002)。
疏螺旋体素(

图1)是一些细菌菌株产生的19元大环内酯,这些菌株包括,但不限于娄彻氏链霉菌ATCC23956、小链霉菌(Streptomycesparvulus)Tü113和小链霉菌Tü4055。此处表明疏螺旋体素来自一个反式-环戊烷-1,2-二羧酸起始酸、三个丙二酰CoA和五个甲基丙二酰CoA延伸单元(见图2)。根据基于晶体结构并最近通过总合成证实的疏螺旋体素的绝对立体化学,预测实际的起始酸是反式-环戊烷-(1R,2R)-二羧酸。添加稳定同位素标记的乙酸盐和丙酸盐底物后分离的疏螺旋体素清楚地表明这些结构单元的预期掺入;此外,在本申请中已经阐明添加反式-环戊烷-1,2-二羧酸足够重建突变株中的疏螺旋体素的生物合成,其中在所述突变株中认为与起始单元的形成有关的特定基因已经被破坏。疏螺旋体素含有连接到C12位的一个腈基,在文中表明通过剪裁酶作用于存在该位置的甲基丙二酰-CoA来源的甲基分支产生该腈基。疏螺旋体素的总体结构首先在1967年被阐明(Keller-Scheirlein,1967),并随后通过详细NMR分析改进(Kuo等人,1989)。通过X射线晶体学证实了疏螺旋体素的绝对构型(Anderson等人,1989)。已经验证了其作为抗生素密螺霉素的共同身份(Maehr&Evans,1987)。
许多研究小组已经报导了疏螺旋体素结构的片段的合成,并且因为本申请的优先权提交,已经报导了疏螺旋体素的两种独立的全合成(Hanessian等人,2003;Duffey等人,2003)。
疏螺旋体素由于其抗细菌活性而首次被发现(Berger等人,1949),尽管该抗细菌活性仅延伸到有限数目的球菌,并且没有发现针对所有常见受试细菌的活性。在敏感微生物中的作用模式包括选择性抑制苏氨酰tRNA合成酶(Paetz & Nass,1973)。已经报导了针对密螺旋体属的螺旋体(Singh等人,1985;US 4,759,928)、针对病毒(Dickinson等人,1965)、用于控制动物害虫和杂草(DE 3607287)和用作农业杀真菌剂(DE 19835669;US6,193,964)的其他活性。此外,由于本申请的优先权提交,已经报导疏螺旋体素具有针对药物抗性恶性疟原虫(Plasmodium falciparum)株的抗疟疾活性(Otoguro等人,2003)。所有这些报导中仅有两个报导了经合成修饰的衍生物。第一篇报导描述了苯甲基酯和其二-O-(4-硝基苯甲酰)衍生物(Berger等人,1949)。第二篇报导描述了疏螺旋体素甲基酯、甲基酯二O-乙酰基衍生物和甲基酯Δ14-15-二氢-、Δ14-15,12-13-四氢-、和Δ14-15,12-13-四氢-C12-氨基衍生物(Anderton & Rickards,1965)。没有报导这些化合物的生物学活性。
最近尤其重要的一个公开是发现疏螺旋体素显示出抗血管生成活性(Wakabayashi等人,1997)。血管生成是形成新血管的一种过程。血管生成在成年人中仅局部和暂时的发生,其与例如局部创伤后的修复和女性生殖周期有关。已经确定血管生成是一些病理过程的关键组分,这些病理过程包括癌、类风湿性关节炎和糖尿病性视网膜病。Folkman(Folkman,1986)证实血管生成在使得肿瘤能够生长到超过1-2cm的直径方面的重要性,并且肿瘤对缺氧的应答引起血管生成。在其下游结果中,血管生成主要是一种来自宿主的过程,从而对血管生成的抑制在癌症的治疗、避免对其他抗癌治疗模式产生障碍,如癌类型的多样化和药物抗性中提供了重要潜能(Matter,2001)。还重要的是最近的出版物已经描述了酪氨酸基-和色氨酰tRNA合成酶在血管生成的调节中的功能相关性(Wakasugi等人,2002;Otani等人,2002)。
在血管生成的大鼠主动脉基质培养物中,疏螺旋体素显示出强烈的血管生成抑制效果并且还通过诱导毛细血管形成细胞的凋亡以依赖剂量的方式导致所形成的毛细血管的破坏(Wakabayashi等人,1997)。疏螺旋体素抑制毛细血管形成的IC50值为0.4ng/ml(0.8nM)。在相同的研究中,在细胞生长测定中疏螺旋体素表现出具有针对人脐静脉内皮细胞(HUVEC)的抗增殖活性;测量的IC50值6ng/ml比在相同介质中测量的抗血管生成活性低15倍。表明疏螺旋体素的该抗增殖活性一般针对多种细胞系。除了这些数据,作者报导疏螺旋体素抑制培养的大鼠细胞中tRNA合成酶和蛋白质合成;然而抗血管生成活性的IC50值(0.4ng/ml)比所报导的抑制蛋白质合成的IC50值(20ng/ml)低50倍,表明该化合物的不同活性。
使用小鼠背部气囊模型,疏螺旋体素在体内也显示出对血管生成的强烈抑制(Funahashi等人,1999),该小鼠背部气囊模型检查VEGF-诱导的血管生成并且是研究肿瘤-血管生成的极好的模型。通过腹膜内注射以1.8mg/kg的剂量使用疏螺旋体素并且疏螺旋体素表现出显著减小WiDr细胞诱导的血管体积的增加,并且减小的程度较TNP-470高,TNP-470是临床试验中的经合成血管生成抑制剂。详细对照证实这些数据是血管生成抑制并且不是肿瘤细胞生长抑制的数据。作者还表明疏螺旋体素在相同剂量下通过抑制与B16-BL6黑素瘤细胞的自发性肺转移形成有关的血管生成过程而有效抑制B16-BL6黑素瘤细胞的自发性肺转移的形成。
JP 9-227,549和JP 8-173,167证实疏螺旋体素有效针对人结肠癌的WiDr细胞系并且也针对人前列腺癌的PC-3细胞系。JP 9-227,549描述了通过娄彻氏链霉菌Mer-N7167(Ferm P-14670)产生疏螺旋体素及其从所得发酵培养基的分离。除了疏螺旋体素1,还描述了12-脱腈-12-羟基疏螺旋体素2(可能是生物合成中间体或旁路代谢物)、10-脱甲基疏螺旋体素2(可能是疏螺旋体素PKS的组件4中备选丙二酰-CoA延伸单元的错误掺入导致的生物合成类似物)、11-表疏螺旋体素4和C15,C15-顺式疏螺旋体素类似物5(见图1)。从而JP 9-227,549详细说明了疏螺旋体素和疏螺旋体素类似物,其中腈或羧基在C12处连接至碳骨架,氢原子或低级烷基连接到C10的碳骨架。
WO 01/09113公开了疏螺旋体素类似物的制备,该类似物在环戊烷环的羧酸部分经历合成修饰。使用内皮细胞增殖和内皮细胞毛细管形成测定以类似于上面描述的方式检查了这些化合物的活性。通常,羧基部分的修饰提高了抑制毛细血管形成的选择性该选择性提高的主要原因是通过细胞增殖抑制活性的减小,而毛细血管形成抑制活性被改变的程度低得多。具体地,对于疏螺旋体素的毛细血管抑制活性与对细胞增殖比较,疏螺旋体素-吗啉代乙酯表现出60倍选择性指数,疏螺旋体素-酰胺表现出37倍选择性指数,疏螺旋体素-(2-吡啶)-乙酯表现出7.5倍选择性指数,疏螺旋体素-吗啉代乙酰胺表现出6倍选择性指数。使用微血管形成测定证实这些和其他疏螺旋体素衍生物的毛细血管形成抑制活性。此外,作者证明当使用Lewis肺腺癌模型时,除去原代肿瘤后,疏螺旋体素轻微抑制转移性瘤的增殖。然而,报导腹膜内以及以亚毒性剂量口服施用后,疏螺旋体素-(3-吡啶甲基酰胺)衍生物非常显著地抑制大鼠中微转移的增加。类似地,使用结肠38脾脏肝脏模型,用该疏螺旋体素衍生物的亚毒性剂量治疗后,移植到小鼠脾脏的小鼠结肠腺癌细胞的转移-形成能力显著降低。这些数据证实了更早报导的疏螺旋体素和其衍生物抑制转移形成的能力。
疏螺旋体素还被鉴定为酿酒酵母的依赖细胞周期蛋白的激酶Cdc28/Cln2的抑制剂,IC50值为12μg/ml(24μM)(Tsuchiya等人,2001)。表明在不影响总体蛋白质生物合成的浓度下,疏螺旋体素抑制晚G1期(与α-交配信息素不能区别的时间点)的单倍体和二倍体细胞。这些数据表明疏螺旋体素具有作为开发抗肿瘤剂的首要化合物的潜力。
由于本申请的优先权提交,已经发表了关于疏螺旋体素的生物合成的另外两个报导。第一个报导指出疏螺旋体素的抗血管生成作用通过不同的途径介导(Kawamura等人,2003)。发现高浓度苏氨酸削弱疏螺旋体素抑制大鼠主动脉培养模型中毛细血管形成和HUVEC细胞增殖;然而,其不影响疏螺旋体素瓦解所形成的毛细血管或者诱导HUVEC中凋亡的能力。还发现疏螺旋体素激活caspase-3和caspase-8,并且这些抑制的疏螺旋体素的抑制剂诱导HUVEC的凋亡。第二篇论文使用总细胞mRNA图谱的方法研究疏螺旋体素对酿酒酵母的影响(Eastwood和Schaus,2003)。该分析表明当用疏螺旋体素处理时以依赖时间的方式诱导氨基酸生物合成酶,并且证明该途径的诱导涉及到GCN4转录因子。
总之,疏螺旋体素的血管生成抑制作用是针对增殖和毛细血管形成的成对肿瘤-生物学效应。此外,已经表明疏螺旋体素及其衍生物抑制癌转移的增殖。疏螺旋体素还用于细胞周期调节。从而,疏螺旋体素和相关化合物是尤其有用的研究靶标以作为治疗肿瘤组织的治疗剂、作为单一试剂或者用作其他治疗的辅助剂。此外,它们可用于治疗血管生成与病理过程有关的其他疾病,这些疾病包括,但不限于,下面所列疾病类风湿性关节炎、牛皮癣、动脉硬化、糖尿病性视网膜病和多种眼科失调。
发明概述本发明提供了负责控制小链霉菌Tü4055中聚酮化合物大环内酯疏螺旋体素合成的生物合成基因簇的完整核酸序列。还提供了所克隆的DNA和其核酸序列的所有或部分的用途,用于特异检测其他聚酮化合物生物合成基因簇,用于工程化小链霉菌的突变株系和其他适宜的宿主株系,这些株系用于产生水平提高的疏螺旋体素或者产生修饰的或者新的聚酮化合物,和编码用于生物合成修饰的或新聚酮化合物的PKS系统的重组基因。
本发明提供了含有疏螺旋体素生物合成基因簇的全部和部分的经分离核酸分子。
在SEQ ID No.1中显示了来自小链霉菌Tü4055的疏螺旋体素生物合成基因簇全部核苷酸序列。其组织在图3中给出并且含有下文指定的基因和可读框borA1、borA2、borA3、borA4、borA5、borA6、borB、borC、borD、borE、borF、borG、borH、borI、borJ、borK、borL、borM、borN、borO、orfB1、orfB2、orfB3、orfB4、orfB5、orfB6、orfB7、orfB8、orfB9、orfB10、orfB11、orfB12、orfB13、orfB14、orfB15、orfB16、orfB17、orfB18、orfB19、orfB20、orfB21和orfB22。
在图4(起始单元的所提议的生物合成)、5(疏螺旋体素PKS的组织和前-疏螺旋体素的生物合成)和6(C12-腈部分的导入)和下文中描述了克隆的基因的所提议功能。
从而本发明提供了分离的核酸分子,该核酸分子含有(a)如SEQ ID No.1中所示的核苷酸序列,或者其部分或片段;或(b)与SEQ ID No.1的互补核苷酸序列,或者其部分或片段;或(c)与SEQ ID No.1的编码序列简并的核苷酸序列,或者其部分或片段。
如此处所用的,关于核苷酸序列的术语“片段”指核酸残基延伸的一段序列,其长为至少10、优选至少20、优选至少30、优选至少50、优选至少75、优选至少100、优选至少150、或优选至少200个核苷酸。SEQ IDNO1的优选部分或片段是SEQ ID No.1的7603至59966位核苷酸之间的序列。
该序列可以编码聚酮化合物生物合成基因簇的多肽或者其一部分,或者与编码聚酮化合物生物合成基因簇分的多肽或者其一部的序列互补。“聚酮化合物生物合成基因簇的多肽”指聚酮化合物生物合成基因簇尤其疏螺旋体素生物合成基因簇的一个或多个可读框编码的多肽。
聚酮化合物生物合成基因簇是一个DNA片段,其含有编码在聚酮化合物或大环内酯部分的生物合成中具有活性的多肽的许多基因。这不限于在聚酮化合物主链的合成和侧链的还原性加工中起作用的聚酮化合物合酶(PKS),而且还包括在该聚酮化合物的合成中具有辅助功能的多肽。从而,该生物合成基因簇的多肽也可以在参与大环内酯环或聚酮化合物链修饰(例如,催化疏螺旋体素的C12腈部分形成的反应)、聚酮化合物或大环内酯部分的前体或起始单元的合成(例如,催化疏螺旋体素PKS的反式-环戊烷-1,2-二羧酸起始单元的合成中的反应,或者负责活化诸如链的起始和延伸单元的辅酶-A硫酯的分子)、调节活性(例如,调节与聚酮化合物或大环内酯合成有关的基因或蛋白质的表达)、转运蛋白活性(例如,将聚酮化合物或大环内酯的底物转运到细胞,或者将合成产物如聚酮化合物或大环内酯分子输出细胞),和赋予生产细胞对合成产物的抗性(例如,通过特异结合到所合成的分子,或者作为其他内源蛋白的替代者,所合成的分子可以在细胞内或外结合到该替代者)。
该基因簇还可以包括非编码区,如与基因簇的编码区可操作地连接的启动子或其他转录调节序列。技术人员将能够基于本文提供的信息鉴定这些元件,并且这些元件在本发明的范围内。
SEQ ID No.1内编码的基因和可读框代表SEQ ID No.1的优选部分或片段。从而,分离的核酸分子可以含有编码来自疏螺旋体素生物合成基因簇的多肽的序列,其中所述多肽具有选自SEQ ID No.2到43和113的的氨基酸序列。
在优选的实施方案中,该核酸序列含有选自SEQ ID NO1的可读框的可读框,SEQ ID NO1的可读框由borA1、borA2、borA3、borA4、borA5、borA6、borB、borC、borD、borE、borF、borG、borH、borI、borJ、borK、borL、borM、borN、borO、orfB1、orfB2、orfB3、orfB4、orfB5、orfB6、orfB7、orfB8、orfB9、orfB10、orfB11、orfB12、orfB13a、orfB13b、orfB14、orfB15、orfB16、orfB17、orfB18、orfB19、orfB20、orfB21和orfB22组成,所述可读框分别由SEQ ID No.1的碱基16184*-18814、18875-23590、23686-34188、34185*-39047、39122*-45514、45514-50742、7603-8397c、8397-9194c、9244-9996c、9993-11165c、11162-11980c、11992-13611c、13608-15659*c、50739*-52019、52113-53477、53486-54466、54506-56176、56181*-57098、57112-57858、57939-59966、2-313(不完整)、501*-3107、3172-3810c、3935-4924c、5123-5953、5961-6518*c、6564*-7538、60153-60533*c、60620-61003、61188*-61436、61526-61738、61767-62285c、62750-63067c、62586-62858c、63155-65071c、65374-65871、65942-68305*c、68290-68910*c、69681-70436、70445-71848、71851-72957、73037-73942和73995-74534c描述。
在上面的列表中,“c”表明该基因由SEQ ID NO1中所示的互补链编码。上面的每个可读框代表存在的最长的可能的可读框。有时候可以鉴定一个以上的潜在起始密码子。本领域技术人员将认识到这一点并能够鉴定备选可能的起始密码子。具有一个以上的可能起始密码子的那些基因用“*”符号指示。我们已经全部指出了我们所认为的起始密码子,然而,本领域技术人员将明白使用备选起始密码子可能产生活性蛋白,认为用这些备选起始密码子产生的蛋白质也在本发明的范围内。
应该注意许多这些可读框以不同于更通常的ATG起始密码子的密码子(GTG、CTG或TTG)开始。熟知在一些细菌体系中这些密码子(通常表示缬氨酸(GTG)或亮氨酸(CTG、TTG)可以被读做起始密码子,其编码多肽链的N末端的甲硫氨酸。在此处提供的氨基酸序列(SEQ ID No2到43和113)中,这些密码子因此被翻译为甲硫氨酸。
还提供了含有此处鉴定的可读框的一部分的核酸分子。例如,这种核酸序列可以含有来自此处鉴定的可读框的一个或多个分离的结构域。可读框的这些分离的部分所编码的多肽可以具有独立的活性,例如,催化活性。具体地,组成疏螺旋体素PKS的多肽具有组件化结构,在该结构中各自结构域具有如上面提出的特定催化活性。从而这些结构域的任一个都可以单独表达或者与来自此处描述的疏螺旋体素PKS的其他多肽或者其结构域,或者与来自其他聚酮化合物的PKS的多肽联合表达。具体地,这些结构域的任一个可以被疏螺旋体素PKS或者其他聚酮化合物合酶内的等同结构域置换并且来自其他PKS的额外等同结构域可以被疏螺旋体素PKS内的结构域置换。在本文中,等同结构域包括具有相同类型的功能但是在例如,它们的特异性方面不同的结构域,本发明所考虑的置换的一个实例包括用丙二酰-CoA特异的AT结构域置换甲基丙二酰-CoA特异的AT结构域,或者用仅含有KR结构域的还原性环置换含有KR、DH和ER的还原性环。在优选实施方案中,所表达的结构域代表如下描述的至少一个PKS组件。
如此处所用的术语“PKS结构域”指这样的多肽序列,其能够独立于PKS的剩余部分折叠,并且具有单一的明显酶促活性或者具有在聚酮化合物或大环内酯合成中的其他功能,这些功能包括,但不限于β-酮酰基-酰基载体蛋白合酶(KS)、酰基载体蛋白(ACP)、酰基转移酶(AT)、β-酮还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER)或末端硫酯酶(TE)。
因此,本发明还提供了(a)分离的核酸分子,该核酸分子含有编码选自AT0和ACP0的PKS结构域的序列,所述结构域分别由SEQ ID No.2的氨基酸322-664和694-763描述。在优选实施方案中,PKS结构域含有选自SEQ ID No.1的碱基17147-18175和18263-18472的序列;(b)分离的核酸分子,该核酸分子含有编码选自KS1、AT1、KR1和ACP1的PKS结构域的序列,所述结构域分别由SEQ IDNo.3的氨基酸34-459、557-885、1136-1379和1419-1486描述。在优选实施方案中,PKS结构域含有选自SEQ ID No.1的碱基18974-20251、20543-21529、22280-23011和23129-23332的序列。
(c)分离的核酸分子,该核酸分子含有编码选自KS2、AT2、DH2、KR2、ACP2、KS3、AT3、DH3、KR3和ACP3的PKS结构域的序列,所述结构域分别由SEQ ID No.4的氨基酸34-459、559-887、903-1050、1354-1597、1628-1694、1724-2149、2245-2576、2593-2734、3060-3307和3340-3406描述。在优选实施方案中,PKS结构域含有选自SEQ ID No.1的碱基23785-25062、25360-26346、26392-26835、27745-28476、28567-28767、28855-30132、30418-31413、31462-31887、32863-33606和33703-33903的序列。
(d)分离的核酸分子,该核酸分子含有编码选自KS4、AT4、KR4和ACP4的PKS结构域的序列,所述结构域分别由SEQ ID No.5的氨基酸34-459、555-886、1179-1423和1459-1525描述。在优选实施方案中,PKS结构域含有选自SEQ ID No.1的碱基34284-35561、35847-36842、37719-38453和38559-38759的序列。
(e)分离的核酸分子,该核酸分子含有编码选自KS5、AT5、DH5、ER5、KR5和ACP5的PKS结构域的序列,所述结构域分别由SEQ ID No.6的氨基酸34-457、553-888、905-1046、1401-1690、1696-1942和1975-2041描述。在优选实施方案中,PKS结构域含有选自SEQ ID No.1的碱基39221-40492、40778-41785、41834-42259、43322-44191、44207-44947和45044-45244的序列。
(f)分离的核酸分子,该核酸分子含有编码选自KS6、AT6、KR6、ACP6和TE的PKS结构域的序列,所述结构域分别由SEQID No.7的氨基酸37-457、555-883、1101-1335、1371-1437和1461-1708描述。在优选实施方案中,PKS结构域含有选自SEQID No.1的碱基45622-46884、47176-48162、48814-49518、49624-49824和49894-50637的序列。
本发明的另一方面提供了分离的核酸分子,其含有编码PKS组件的序列,所述组件选自SEQ ID No.2的氨基酸322-763、SEQ ID No.3的34-1486、SEQ ID No.4的34-1694、SEQ ID No.4的1724-3406、SEQ ID No.5的34-1525、SEQ ID No.6的34-2041和SEQ ID No.7的37-1437或1708。在优选实施方案中,该组件含有选自SEQ ID No.1的碱基17147-18472、18974-23332、23785-28767、28855-33903、34284-38759、39221-45244、45622-49824或50637的序列。
如此处所用的术语“组件”指单个多肽,其含有许多PKS结构域,每个结构域具有聚酮化合物或大环内酯合成中的单一明显的酶促活性,这些酶促活性包括,但不限于β-酮酰基-酰基载体蛋白合酶(KS)、酰基转移酶(AT)、酰基载体蛋白(ACP)、β-酮还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER)或末端硫酯酶(TE)。延伸组件通常含有KS、AT、和ACP结构域(尽管一些组件化PKS可能将它们的AT结构域作为独立蛋白编码)。延伸组件可以还含有能够将β-酮基还原成羟基、烯酰基或亚甲基的一个或多个结构域(所述结构域组在此处被称为“还原性环”)。从而,含有还原性环的组件通常含有KR结构域、含有KR和DH结构域、或含有KR、DH和ER结构域。
PKS可以还含有TE结构域以实施终产物的链终止和/或环化,或者备选地,其可以含有另一功能性,已知该功能性执行下述类似功能,如对雷帕霉素所观察到的加入氨基酸残基和大内酰胺形成(Schwecke等人,1995),对利福霉素所观察到的大内酰胺形成(August等人,1998),和对粘球酰胺生物合成所观察到的氨基酸掺入然后还原除去(Silakowski等人,2001)。
还提供了编码聚酮化合物合酶的核酸分子,该核酸分子含有编码上述一个或多个结构域或组件的序列。
此处提供的序列提供了操作和/或增强聚酮化合物合成的方法。从而,提供了修饰亲本聚酮化合物合酶的方法,该方法包括在表达所述亲本聚酮化合物合酶的宿主细胞中表达来自如此处描述的疏螺旋体素聚酮化合物合酶或者其衍生物的结构域,从而该结构域掺入所述亲本聚酮化合物合酶中。还提供了修饰亲本聚酮化合物合酶的方法,该方法包括向宿主细胞中导入编码来自疏螺旋体素聚酮化合物合酶结构域的核酸或者其衍生物,其中该宿主细胞含有编码所述亲本聚酮化合物合酶的核酸,从而,当表达时,该结构域掺入所述亲本聚酮化合物合酶。除了亲本PKS的天然结构域外,还可以掺入疏螺旋体素PKS结构域,或者疏螺旋体素PKS结构域可以代替天然亲本结构域。通常,亲本PKS将是I型PKS。本发明还提供了修饰亲本疏螺旋体素PKS的方法。供体结构域(例如,来自I型PKS)可以在表达所述亲本疏螺旋体素PKS的宿主细胞中表达。还提供了修饰亲本疏螺旋体素聚酮化合物合酶的方法,该方法包括向宿主细胞导入编码来自供体聚酮化合物合酶的结构域的核酸,其中该宿主细胞含有编码所述亲本聚酮化合物合酶的核酸,从而,当表达时,该结构域掺入所述亲本聚酮化合物合酶。
额外地或备选地,亲本PKS的结构域可以被缺失或失活;例如,亲本结构域可以被简单地缺失,或者被来自供体PKS的结构域代替,或者来自供体PKS的结构域可以加入亲本PKS。当一个结构域被加入或代替时,供体结构域可来自亲本合酶,或者来自不同的合酶。
这些方法可用于增强疏螺旋体素的生物合成,以产生新的疏螺旋体素衍生物或类似物,或者其他新的聚酮化合物或大环内酯结构。可以改变组件的数目和性质以改变所募集的延伸单元的数目和类型,和改变多种合成酶、还原酶和脱水酶活性,这些酶活性决定聚酮化合物链的结构。通过改变组成PKS的组件的顺序、通过重复或除去组成PKS的组件、从异源来源导入组件、或者通过这些方法的一些组合可以进行这些改变。
从而疏螺旋体素PKS的结构域或组件可以被缺失、重复或者与来自疏螺旋体素PKS或者来自负责其他聚酮化合物的合成的PKS系统(异源PKS系统,尤其I型PKS系统)的其他结构域或组件交换,该其他PKS系统可以来自不同的细菌株系或种类。备选地,来自疏螺旋体素PKS的结构域或组件可以导入异源PKS系统以便产生新的聚酮化合物或大环内酯。组合组件也可以在疏螺旋体素聚酮化合物合酶和其他聚酮化合物合酶之间交换,这些组件在两种天然类型的组件的相应结构域之间延伸,例如,从一个组件的AT到另一个组件的AT。
例如,一个特定延伸组件可以与对不同延伸单元具有特异性的延伸组件(如,例如,WO98/01571和WO98/01546中描述的)交换,或者被突变而显示出对不同延伸单元(例如,如下描述的)的特异性或选择性。额外或备选地,结构域或组件,如负责对给定β-酮部分的加工KR、DH和ER结构域的导入、缺失、交换或突变可以用于改变聚酮化合物合成期间延伸单元的还原性加工的水平。这些改变也可导致所改变的组件形成的α-烷基和β-羟基的立体化学改变。在优选实施方案中,BorA5组件可被导入亲本PKS以提供延伸单元向聚酮化合物主链的反复加入,例如,相对于亲本PKS产生的聚酮化合物扩大大环内酯聚酮化合物的环大小。
疏螺旋体素装载组件是被鉴定对脂环族二羧酸起始单元具有特异性的第一个PKS装载组件。从而,该组件或者其衍生物可用于将脂环族起始单元导入异源聚酮化合物合酶中。这不必局限于使用通常用作疏螺旋体素起始单元的反式-环戊烷-1,2-二羧酸。此处表明疏螺旋体素装载组件也能够指导掺入其他起始单元,这些起始单元包括反式-环丁烷-1,2-二羧酸、2,3-甲基琥珀酸和2-甲基琥珀酸。疏螺旋体素起始单元也可以在疏螺旋体素生产细胞中被修饰,或者被异源装载组件代替,以将备选起始单元导入疏螺旋体素合成途径。
可以选择PKS的装载组件的位置(例如通过将其融合到PKS内的具体位置)以便控制所得聚酮化合物/大环内酯分子的环大小。
决定羧酸-CoA硫酯延伸单元的AT结构域可以被修饰或替换。该ACP结构域也可以被缺失、修饰或替换。此外,可以插入非正常地存在于该疏螺旋体素PKS但是在其他组件化PKS和/或混合PKS/NRPS体系中发现的结构域。实例包括但不限于O-甲基转移酶结构域、C-甲基转移酶结构域、表异构化结构域、单加氧酶结构域和脱氢酶结构域、转氨酶结构域和非核糖体肽合成酶结构域。
此外,可以改变或换位(例如融合到PKS内所选的位置)疏螺旋体素PKS的硫酯酶结构域以便改变其专一性和/或以便释放具有所选的环大小的聚酮化合物/大环内酯分子。备选地,可以将异源硫酯酶结构域插入疏螺旋体素PKS以产生相对于亲本PKS正常产生的分子环大小改变的分子,或者产生游离酸。
在再一个备选方案,可以将来自混合NRPS/PKS体系的氨基酸掺入结构域和大内酰胺形成结构域(如雷帕霉素的结构域,或者有关体系如利福霉素生物合成和myxalamid生物合成相关的结构域)或者来自NRPS体系的组件(如博来霉素生物合成的组件)插入PKS以产生混合起源的新聚酮化合物相关分子。
此处描述的编码PKS的可读框可以还含有编码非酶活性部分的部分,其仍然具有作为支架区的功能角色,该支架区将PKS的酶活性结构域和/或组件间隔并稳定在适当的距离和方向,并且可能具有识别和停靠功能,该功能将PKS的结构域和组件排列在正确的空间布局。从而本发明的核酸序列含有编码这些支架区的序列,这些序列是单独的或者与编码如上所述的结构域或者组件的序列组合。应该明白对PKS编码序列的多种操作可以导致杂化PKS基因或者系统。从而本发明还提供了编码这样的杂化PKS体系的核酸。因此本发明提供了核酸构建体,其含有编码疏螺旋体素PKS的至少一个结构域的至少一个第一核酸部分和编码至少一个I型PKS结构域的第二核酸部分,该I型PKS结构域与所述疏螺旋体素PKS是异源的。在优选实施方案中提供了核酸构建体,其含有杂化聚酮化合物合酶基因,所述基因编码疏螺旋体素PKS的至少一个结构域和至少一个I型PKS结构域,该I型PKS结构域与所述疏螺旋体素PKS是异源的。其他优选实施方案如上所述。
另一方面,本发明提供了分离的核酸分子,其含有编码一种多肽的序列,该多肽催化聚酮化合物合成的起始单元或者底物的合成中的一个步骤,优选被疏螺旋体素PKS用作起始单元的反式-环戊烷-1,2-二羧酸部分的合成中的一个步骤。该多肽可以具有脱氢酶、3-氧代酰基-ACP-还原酶、环化酶、依赖F420的脱氢酶、或者2-羟基庚-2,4-二烯-1,7-二羧酸异构酶的活性。优选地,该多肽含有选自由如SEQ ID NO8、9、10、12、13、14、17、18、19或者20中所示的borC、borD、borE、borF、borG、borH、borK、borL、borM和borN的基因之一编码的序列。
这些基因可以在疏螺旋体素产生细胞中被缺失、破坏、或者失活以便废除疏螺旋体素产生。这些改变导致的细胞系可以通过加入外源羧酸在化学上补充,这些外源羧酸可以被掺入而代替天然起始单元。从而,可以合成新的疏螺旋体素相关分子,这些分子是从外源加入的羧酸开始合成的。这种方法被称为突变合成。负责反式环戊烷-1,2-二羧酸合成的基因可以被导入异源聚酮化合物生产细胞以允许该细胞合成脂环族二羧酸作为其自身PKS的起始单元。
从而本发明还提供了生产滴定度(titre)提高的疏螺旋体素和疏螺旋体素类似物的方法,所述方法包括破坏宿主菌株中的borG,发酵所得细胞系并且喂饲外源羧酸。在多种优选实施方案中,该外源羧酸是反式-环戊烷-1,2-二羧酸或者该外源羧酸选自反式-环丁烷-1,2-二羧酸、2,3-二甲基琥珀酸和2-甲基琥珀酸和/或该方法还包括缺失、修饰或者替换一个或多个疏螺旋体素生物合成基因,或者疏螺旋体素聚酮化合物合酶结构域或者组件。本领域技术人员知道聚酮化合物合酶还可以在异源宿主中表达,因此本发明同时考虑了在异源宿主中产生更高滴定度的疏螺旋体素和疏螺旋体素类似物的方法,所述方法包括用除了borG之外的全部疏螺旋体素基因簇转化宿主细胞或者一旦该基因簇已经被转移就原位破坏borG基因。
备选地,负责起始单元合成的基因可以被过量表达以便提高疏螺旋体素或者疏螺旋体素相关分子的发酵滴定度。从而本发明还提供了增加疏螺旋体素和疏螺旋体素衍生物或者疏螺旋体素相关分子和它们的衍生物的滴定度的方法,所述方法包括上调与起始单元的产生有关的疏螺旋体素生物合成基因,所述基因选自borC、borD、borE、borF、borH、borK、borL、borM和borN,在优选实施方案中,上调的基因是borE或borL。
在另一个方法中,负责起始单元合成的基因可以被修饰或者被指导改变的羧酸产生的其他合成基因替代,导致产生疏螺旋体素相关分子。通过修饰如上所述的PKS的装载组件可以实现这些技术。
另一方面,本发明提供了分离的核酸分子,其含有编码一种多肽的序列,该多肽催化对聚酮化合物分子侧链修饰的一个步骤,例如甲基向腈部分的转化(例如前疏螺旋体素的C12处)(14)。该多肽可以具有细胞色素P450氧化酶、氨基转移酶、或者NAD/醌氧化还原酶的活性。优选地,该多肽含有如SEQ ID NO15、16或者17所示的borI、borJ和borK基因之一编码的序列。
多种这些基因可以被缺失/失活从而积累疏螺旋体素-相关分子或者其旁路代谢物,它们代表导入腈部分这一过程的中间阶段。这些体系加入异源基因可以允许备选完善任何积累的生物合成中间物或者其旁路代谢物。备选地,可以突变这些基因以便改变它们的底物特异性,从而它们在前疏螺旋体素分子的备选位置上作用以便提供疏螺旋体素相关分子。此外,负责氰基形成的基因可以被过量表达以便提高疏螺旋体素或者疏螺旋体素-相关分子的发酵滴定度。
备选地,一个、一些或者所有这些基因可以被导入能够产生其他聚酮化合物的细胞以提供对聚酮化合物目的侧链的加工,例如导入腈部分。这使得可能向聚酮化合物,尤其在来源于甲基丙二酰辅酶A或者乙基丙二酰辅酶A延伸单元的侧链处导入腈部分的特定生物合成。纯化的酶(见下文)也可以用于实现体外聚酮化合物侧链向腈部分的转化。
另一方面,本发明提供了分离的核酸分子,其含有与赋予疏螺旋体素抗性有关的多肽的序列。该多肽可以具有与苏氨酰tRNA合酶的同源性,并且优选具有苏氨酰tRNA合酶活性。优选地,该多肽含有如SEQ ID NO21中所示的borO基因编码的序列。适宜的载体(见下文)上携带的抗性基因诸如borO可以被用作选择标记。从而用这种载体转化的细胞可以通过一定浓度的疏螺旋体素的存在下进行阳性选择,该浓度的疏螺旋体素抑制没有这种基因的细胞的生长,或者杀死这些细胞。
另一方面,本发明提供了分离的核酸分子,其含有编码多肽的序列,该多肽涉及疏螺旋体素基因簇的一种或多种基因表达的调节。在优选实施方案中,该多肽含有如SEQ ID NO18中所示的borL基因编码的序列,或者如SEQ ID NO29或者33中所示的orfB8或者orfB12编码的序列。可以工程化调节基因以增加疏螺旋体素和疏螺旋体素衍生物、或者疏螺旋体素相关分子和所得细胞系发酵产生的它们的衍生物的滴定度。例如,阻遏物可以被缺失失活、和/或活化子可以被上调或者过表达,例如,通过增加基因拷贝数目或者将编码序列置于强组成型活性的或者可诱导的启动子的控制下实现上调或者过表达。borL基因或其者部分也可以用作杂交探针以鉴定位于其他生物合成基因簇内或外的类似的调节基因。
另一方面,本发明提供了分离的核酸分子,其含有编码具有II型硫酯酶活性的多肽的序列。在优选实施方案中,该多肽含有如SEQ ID NO8中所示的borB基因编码的序列。这核酸可以被导入宿主细胞以调节该细胞合成的聚酮化合物的滴定度。具体地,通过“编辑”不需要的副反应的产物(例如,除去连接于KS结构域的延伸单元的不适当的脱羧作用所形成的酰基)可以增加滴定度。然而在许多方面可能希望从生产者细胞除去这种活性,例如以增加该细胞产生的聚酮化合物产物的多样性,或者促进产生天然产生的聚酮化合物的类似物,其中该聚酮化合物的天然产生通常受到这种编辑活性的阻断。
本发明的核苷酸序列可以是SEQ ID NO1中所示的序列部分,或者其互补序列,或者这些序列的突变株、变体、衍生物或者等位基因。该序列可以与对显示序列的一个或多个核苷酸进行一个或多个添加、插入、删除和替换的改变所示序列不同。编码核苷酸序列的改变可能导致在蛋白水平的氨基酸改变或者无改变,这可通过遗传密码的冗余性确定。从而,根据本发明的核酸可以包括不同于SEQ ID NO1中所示序列的序列,然而仍然编码具有相同氨基酸序列的多肽。优选地,所提供序列的突变株、变体、衍生物或者等位基因编码与此处描述的多肽具有相同酶活性的多肽。
当该序列是编码序列时,所编码的多肽可以含有这样的氨基酸序列,该氨基酸序列与SEQ ID NO2到43和113中所示氨基酸序列相差一个或多个氨基酸残基。本发明还提供了一种多肽的核酸,该多肽是所示序列的任一种氨基酸序列的突变株、变体、衍生物或者等位基因。下面讨论这些多肽。编码这种多肽的核酸可以显示出与SEQ ID NO1的编码序列具有大于约60%同一性,大于约70%同一性,大于约80%同一性,或者大于约90%、91%、92%、93%、94%、95%、96%、97%、98%或者99%同一性。利用诸如可以从the University of Wisconsin得到的GeneticsComputer Group(GCG)版本10软件包中的BLAST或者BestFit的程序之一,使用默认参数可以计算百分比同一性。
在优选实施方案中,不论编码还是非编码的,本发明的核苷酸序列能够与SEQ ID NO1的序列或者其互补序列的至少一部分特异杂交。
例如,根据Sambrook等人(Sambrook等人.,1989)的方法,使用含有5×SSC、5×Denhart试剂,0.5-1.0%SDS、100μg/ml变性的、片段化鲑鱼精子DNA,0.05%焦磷酸钠和高达50%甲酰胺的杂交溶液实施杂交。在37-42℃实施杂交至少六小时。杂交后,如下洗涤滤器(1)在2×SSC和1%SDS中在室温下5分钟;(2)在2×SSC和0.1%SDS中室温下15分钟;(3)在1x SSC和1%SDS中37℃下30分钟-1小时;(4)在1x SSC和1%SDS中42-65℃2小时,每30分钟更换溶液。
计算具有特定序列同源性核酸分子之间实现杂交所要求的严格条件的一个常用公式是(Sambrook等人,1989)Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.63(%甲酰胺)-600/双链体中#bp作为对上述公式的阐述,利用[Na+]=
和50%甲酰胺,GC含量42%和平均探针大小200个碱基,计算得到Tm是57℃。同源性每下降1%,DNA双链体Tm减小1-1.5℃。从而,使用42℃的杂交温度将观察到靶标的序列同一性大于约75%。将认为这种杂交对本发明的核酸序列基本上特异。
本发明的核酸优选地含有SEQ ID NO1的至少15个相邻核苷酸。它们可以含有SEQ ID NO1的20、25、30、35、40、45、50、60、70、80、90、100、120、150、200、300、500个或更多的相邻核苷酸。
这些核酸可以用作例如,引物或者探针以从聚酮化合物或者大环内酯生物合成基因簇鉴定新的基因或者其他遗传元件,诸如翻译调节序列,例如编码PKS的酶,或者其结构域或者组件、与起始单元的生物合成有关的酶、修饰聚酮化合物部分侧链的酶、转运蛋白、如所描述的抗性基因和调节分子的序列。
从而本发明提供了鉴定新的聚酮化合物生物合成基因簇或者其部分的方法,该方法包括将靶核酸的样品与本发明的核酸杂交,本发明的该核酸能够与具有SEQ ID NO1的序列或者其部分的核酸特异杂交。该靶核酸可以是任何适宜的核酸,并且优选为细菌的基因组DNA。
一般,该方法还包括检测核酸样品和本发明的核酸之间的杂交的步骤。本领域技术人员可以使用多种技术的任一种测量杂交。例如,探针可以被放射性地、荧光地或者酶标记。不使用探针标记的其他方法包括使用PCR扩增、RNA酶切割和等位基因特异的寡核苷酸探测。
方法可以包括一种或多种(例如,两种)探针或者引物与靶核酸杂交。当核酸为双链DNA时,通常在杂交前变性以产生单链DNA。杂交可以是PCR程序的一部分,或者作为不包括PCR的探测程序的一部分。一个实例方法是PCR和低严格杂交的组合。从本领域技术人员可以得到的许多程序的一种筛选程序被用于鉴定成功的杂交事件和分离的杂交核酸。
本领域技术人员考虑诸如如上所述的寡核苷酸长度和碱基组成、温度等等将能够使用用于选择性杂交的所希望的严紧性的适宜条件。
本发明的分离的核酸分子可以是分离的天然存在的核酸分子(即,从在自然中通常发现的组分分离或分开的),如除了用于表达的可能的一个或多个调节序列,细菌基因组中该基因侧翼没有或者基本上没有核酸。核酸可以是完全或者部分合成的并且可以包括基因组DNA、cDNA或RNA。当根据本发明的核酸包括RNA时,所示序列的参考应该被理解为对RNA等同物的参考,用U代替T。
本发明还提供了含有根据本发明的核酸的载体。该载体优选为表达载体,其含有编码聚酮化合物生物合成基因簇(优选疏螺旋体素生物合成基因簇)的多肽的核酸,或者其一部分,如所述。可以选择或者构建含有用以导入细菌或真核宿主细胞的核酸的适宜载体,该核酸含有适宜的调节序列,包括启动子序列、终止子序列、增强子序列、标记基因和其他适宜的序列。载体可以是质粒,适宜时为病毒、“噬菌体”或“噬菌粒”。细节见,例如,Sambrook等人,1989。在Short Protocols in Molecular Biology,第二版,Ausubel等人编,John Wiley & Sons 1992中详细描述了操作核酸,例如,制备核酸构建体、诱变、测序、将DNA导入细胞和基因表达、以及蛋白质分析的许多公知技术和方案。Sambrook等人和Ausubel等人的公开在此处被并入作为参考。
本发明的另一方面提供了如此处描述的本发明核酸分子编码的分离的多肽。更具体地,提供了分离的多肽,该多肽含有如SEQ ID No.2到43和113的任何一个或多个所示的氨基酸序列或者其一部分。如上面所陈述的,这些氨基酸序列代表SEQ ID NO1和其互补序列中存在的最长可能的可读框的翻译。第一个氨基酸总是以Met显示,不管启动密码子是ATG、GTG、TG或TTG。
如此处所用的术语“多肽”包括肽、多肽和蛋白,除非另外说明,这些术语可以互换使用。
作为所示氨基酸的任一个的氨基酸序列变体、等位基因、衍生物或突变株的多肽可以显示出与SEQ ID No.2到43和113的任一个的多肽或者其部分具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。特定的氨基酸序列变体可以通过1个氨基酸、2、3、4、5-10、10-20、20-30、30-50、50-100、100-150、或者150个以上氨基酸的插入、添加、缺失或替换而与那些所显示的氨基酸序列不同。利用诸如可以从the University of Wisconsin得到的Genetics Computer Group(GCG)版本10软件包中的BLAST或者BestFit的程序之一,使用默认参数可以计算百分比同一性。
本发明还包括本发明多肽的活性部分、片段和衍生物。
“活性部分”指一种肽,其小于全长多肽,但是保持该多肽的基本生物学活性的至少一部分。例如,如上面描述PKS的分离的结构域或组件可以被认为是PKS的活性部分。
“片段”指氨基酸残基的一段序列,该序列具有至少5个、至少6个,或者至少7个相邻氨基酸,通常至少8个或至少9个相邻氨基酸,通常至少10个、至少13个相邻氨基酸,最优选地,至少20、至少25、至少30、至少50、至少75、至少100或更多相邻氨基酸。该序列的片段可以含有抗原决定簇或表位,该抗原决定簇或表位可用于产生针对相关多肽的一部分的抗体。从而,该多肽不必含有SEQ ID No.2到43和113的任一个中提供的完整序列,而是可以含有其一部分,该部分具有目的活性,例如,分离的结构域或组件,如上面描述的PKS的那些分离的结构域或组件。应该注意到术语部分和片段在该说明书中互换使用;在任何具体上下文中这些术语之一的特定使用没有特定的重要性。
本发明多肽或者其片段的“衍生物”指通过改变该蛋白质的氨基酸序列,例如,通过操作编码该蛋白质的核酸或者通过改变该蛋白质自身修饰的多肽,天然氨基酸序列的这些衍生物可以包括插入、添加、缺失或替换1、2、3、5或更多氨基酸,而不根本地改变野生型多肽的基本活性。
本发明的多肽以分离的形式提供,例如,分离自通常发现与其通常结合的一种或多种组分。这些多肽可以分离自宿主,它们在该宿主中天然地表达,或者这些多肽可以是合成的或重组的。
本发明还包括制备多肽(如所公开的)的方法,该方法包括表达编码该多肽的核酸(通常根据本发明的核酸)。通过将含有如上面描述的表达载体的宿主细胞在培养基中于适宜条件下培养方便地实现该目的,其中该适宜的条件导致或者允许该多肽的表达。多肽也可以在体外系统,如网织红细胞裂解物系统中表达。
该方法可以包括将核酸导入宿主细胞的步骤。该导入(尤其体外导入)通常被称为(但不限制)“转化”,该导入可以使用任一种可利用的技术。对于真核细胞,适宜的技术可以包括磷酸钙转染、DEAE-葡聚糖、电穿孔、脂质体介导的转染和使用逆转录病毒或其他病毒,例如,牛痘病毒转导或者,对于昆虫细胞,使用杆状病毒转导。对于细菌细胞,适宜的技术可以包括氯化钙转化、接合、电穿孔和使用噬菌体转染。作为备选方案,可以使用核酸的直接注射。标记基因诸如抗生素抗性或敏感基因可用于鉴定含有目标核酸的克隆,这是本领域中熟知的。
优选的宿主细胞包括放线菌,优选链霉菌,尤其选自红色糖多孢菌、天蓝色链霉菌(Streptomyces coelicolor)、阿维链霉菌(Streptomycesavermitilis)、灰褐链霉菌(Streptomyces griseofuscus)、肉桂地链霉菌(Streptomyces cinnamonensis)、灰红小单孢菌(Micromonosporagriseorubida)、吸水链霉菌(Streptomyces hygroscopicus)、弗氏链霉菌(Streptomyces fradiae)、黄色长孢链霉菌(Streptomyceslongisporonavus)、Streptomyces lasaliensis、筑波链霉菌(Streptomycestsukubaensis)、灰色链霉菌(Streptomyces griseus)、委内瑞拉链霉菌、抗生链霉菌(Streptomyces antibioticus)、变铅青链霉菌(Streptomyceslividans)、龟裂链霉菌(Streptomyces rimosus)和白色链霉菌(Streptomycesalbus.)、娄彻氏链霉菌ATCC23956、小链霉菌Tü113和小链霉菌Tü4055,更优选选自娄彻氏链霉菌ATCC23956、小链霉菌Tü113和小链霉菌Tü4055的链霉菌。
根据本发明的多肽、肽片段、等位基因、突变株或变体可以用作免疫原或者用于得到特定抗体,这些抗体可用于多肽和肽的纯化和其他操作、筛选或其他应用。
本发明的另一方面提供了可以从本发明的主题得到的分子和从这些分子形成的修饰化合物和它们的产生方法。从本发明主题得到的分子通过式1显示并且还包括其可药用盐,其中式1 其中R1是不同大小(n=1-2)的环烷基并且被如下所示地取代
其中R1可以任选被一个或多个卤原子或者一个或多个C1到C3烷基取代;R2、R3、R6、R7、R8、R9或R11每个独立地为H、OCH3、CH3或CH2CH3;R4为CN、CO2H、CHO、CH3、CONH2、CHNH;R5,R10为OH;或者与如图2中所示的一个或多个酮化物单元的氧化状态中的相应“天然”化合物不同的类似物(即从基团-CO-、-CH(OH)-、=CH-、和-CH2-选择备选基团),条件是所述化合物不是如图1中所示的疏螺旋体素(1)、12-脱腈-12-羧基疏螺旋体素(2)、10-去甲基疏螺旋体素(3)、11-表疏螺旋体素(4)或C14,C15-顺式疏螺旋体素类似物(5)。在优选实施方案中(a).R7,R8和R9都是CH3。
(b).R4是CH3或COOH(c).R7,R8和R9都是CH3,R4是CH3或COOH(d).R1是环丁烷-1’-羧酸(e).R1是环丁烷-1’-羧酸并且R7、R8和R9都是CH3。
(f).R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R1是环戊烷-1’-羧酸或环丁烷-1’-羧酸(g).R1是环丁烷-1’-羧酸,R7、R8和R9都是CH3,且R4是CH3或COOH。
本发明还提供了式2的化合物和其可药用盐,其中式2
R2、R3、R6、R7、R8、R9或R11每个独立地为H,OCH3、CH3或CH2CH3;R4为CN、CO2H、CHO、CH3、CONH2、CHNH;R5,R10为OH;或者与如图2中所示的一个或多个酮化物单元的氧化状态中的相应“天然”化合物不同的类似物(即从基团-CO-、-CH(OH)-、=CH-、和-CH2-选择备选基团),R12和R13独立地为H或C1-C4烷基,其可以任选被OH、F、Cl、SH取代),条件是R12和R13不同时为H。
在优选实施方案中,(a).R7,R8和R9都是CH3。
(b).R4是CH3或COOH(c).R7、R8和R9都是CH3,R4是CH3或COOH(d).R12和R13独立地为CH3或H(e).R12和R13独立地为CH3或H并且R7、R8和R9都是CH3。
(f).R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R12和R13独立地为CH3或H(g).R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R12和R13都是CH3(h).R12和R13独立地为CH3或H,R7、R8和R9都是CH3,并且R4是CH3或COOH本发明的化合物可以具有tRNA合成酶抑制活性(例如,它们可以抑制苏氨酰-、酪氨酰-、或色氨酰-tRNA合成酶)。它们可以显示出抗微生物活性,包括针对细胞内或细胞外寄生虫和诸如细菌、螺旋体(例如,密螺旋体)、疟疾、病毒和真菌的活性。额外或备选地,它们可以作为tRNA合成酶抑制的结果或者通过某种其他作用模式而具有针对哺乳动物细胞的抗增殖活性和/或抗血管生成活性。这可以使得本发明的化合物尤其适于作为抗癌试剂(例如,治疗肠癌、前列腺癌和其他癌的药剂),并且还可以用于治疗其他增殖性失调,如牛皮癣,或者其中发生不适当的血管形成的病症,如牛皮癣、类风湿性关节炎、动脉硬化和糖尿病性视网膜病。
例如,通过将本发明化合物与可药用赋形剂、载体、缓冲剂、稳定剂或本领域中技术人员熟知的其他材料混合可以将本发明的化合物配制成可药用组合物。这些组合物也属于本发明的范围。
这些可药用物质应该是无毒的并且不应该干扰活性成分的效能。载体和其他物质的精确性质将取决于使用途径,例如,经口、静脉内、经皮或皮下、经鼻、肌内、腹膜内途径。
经口施用的药物组合物可以是片剂、胶囊剂、粉剂或液体的形式。片剂可以包括固态载体如明胶或佐剂。液态药物组合物通常包括液态载体如水、石油、动物或植物油、矿物油或合成油。也可以包括生理盐水溶液、右旋糖或其他糖溶液或者二元醇,如乙二醇、丙二醇或聚乙二醇。
对于皮下、经皮或皮下注射,或者在痛苦部位的注射,活性成分可以是肠胃外可接受的水性溶液,其是无致热原的并且具有适宜的pH、等渗性和稳定性。本领域相关技术人员使用例如,等渗载体能够制备适宜的溶液,这些等渗载体为诸如氯化钠注射液、林格注射液、乳酸化林格注射液。如需要,可以包含防腐剂、稳定剂、缓冲剂、抗氧化剂和/或其他添加剂。上面提到的技术和方案的实例可以在Remington’s Pharmaceutical Sciences,第20版,2000,pub.Lippincott,Williams & Wilkins中找到。
本发明还提供了上面描述的化合物和组合物,它们用于医学治疗方法中。还提供了本发明化合物的用途,用于制备药物,该药物用于治疗微生物病症(包括疟疾),抑制血管生成,治疗增殖性失调,或者治疗以不适当的血管形成表征的病症,如上述。
附图简述图1图解了疏螺旋体素和从产生疏螺旋体素的生物分离的一些相关代谢物的结构。
图2图解了13C稳定同位素标记的延伸底物的掺入模式和来自反式-环戊烷-1,2-二羧酸起始单元的碳的位置。
图3图解了疏螺旋体素生物合成基因簇的组织。限制性位点B,BamHI;Bc,BclI;E,EcoRI;X,XhoI。
图4图解了显示反式-环戊烷-1,2-二羧酸起始单元的所提议生物合成途径的方案。
图5图解了疏螺旋体素PKS的组织和前疏螺旋体素分子的生物合成。
图6图解了在疏螺旋体素的C12位导入腈部分的所提议的生物合成途径。
图7图解了分子6的所提议的结构。
图8图解了分子7和8的所提议的结构。
图9图解了大肠杆菌W中4-羟基苯乙酸代谢途径的分子特征。
图10图解了分子18-20的结构。
图11图解了分子21到26的结构。
发明详述使用Gigapack_III Gold Packaging Extract试剂盒(Stratagene)将小链霉菌Tü4055基因组DNA用Sau3AI部分消化得到的片段克隆到pWE15并导入大肠杆菌细胞构建小链霉菌Tü4055基因组DNA的粘粒文库。用标记探针对3000个大肠杆菌转化体的文库筛选同源性,该探针是用DIGDNA和检测试剂盒(Roche)产生的。所用探针是1.7kbp BglII-BamHI片段,该片段来自编码抗生链霉菌(Swan等人,1994)的竹桃霉素PKS的第三个亚单位的组件6的基因。
选择具有阳性应答的克隆并分离粘粒DNA。将粘粒DNA用BamHI消化并将小于3kbp的片段亚克隆到pOJ260(Bierman等人,1992)。然后将该质粒用于转化小链霉菌Tü4055原生质体并筛选所述突变株产生疏螺旋体素的能力。鉴定了两个突变株是疏螺旋体素非-生产者,它们都来自含有cosBoR32A2的片段的质粒。这两个片段大小分别为1.97和2.80kbp,并且后来被鉴定为编码疏螺旋体素PKS的部分(borA2 & borA3)的相邻片段。使用cosBoR32A2作为探针,从原始文库鉴定了另一重叠粘粒cosBoR19B9。这两种粘粒足够覆盖完整疏螺旋体素生物合成基因簇(见图3)。
通过对每一粘粒的Sau3AI-延伸的亚克隆文库的鸟枪测序确定了cosBoR32A2和cosBoR19B9的全部核苷酸序列,它们由pHSG397(Takeshita等人,1987)中的1.5-2.0kbp片段组成。特定细节在实施例3中提供。cosBoR32A2和cosBoR19B9的完整、重叠的核苷酸编码序列如SEQ ID No.1中给出。粘粒cosBoR32A2所编码的区域代表来自SEQ ID No.1的核苷酸位置0-40217bp的序列。粘粒cosBoR19B9编码的区域与该区域有4452个核苷酸重叠,并且其区域相应于SEQ ID No.1的核苷酸位置35766-74787bp。如在下文中更详细描述的,我们对被鉴定在SEQID No.1内编码的许多orf实施了基因失活实验,并且这导致鉴定了该簇的界限。疏螺旋体素生物合成基因簇包含在SEQ ID No.1的核苷酸位置7603到59966之间(borB到borO,其包括borA区域)。从而,这些努力综合在一起导致我们鉴定了包括完整疏螺旋体素生物合成基因簇的DNA区域并对其测序,还导致鉴定并描述了该区域内编码的功能序列。
PKS基因SEQ ID No.1的16184-50742位之间编码的是6个可读框,它们显示出与编码公知的产生大环内酯的生物的PKSs基因高度同源性。这些基因被称为borA1、borA2、borA3、borA4、borA5和borA6,并且编码疏螺旋体素PKS,这通过上面的破坏borA2内的1.97kbp区域所阐明。这六个可读框以从头到尾的方式排列并且每一个通过符合读框的终止密码子结束。核苷酸序列和相应多肽序列详情如下面的表1中所示表1
基因borA1编码起始或装载组件(SEQ ID No.1,16184-18814位)。起始密码子的分配对于该可读框不明显。这里给出的起始密码子是我们认为的真实密码子,但是在第一个起始密码子和AT0的结构域序列的开始处至少有另外三个可能的起始密码子,并且本领域技术人员将明白使用这些备选起始密码子之一可能产生活性蛋白。此处给出的起始密码子在AT0结构域的前面留下了一个明显的由321个氨基酸组成的N-末端尾。为了比较,红霉素装载组件的AT0前面的N-末端尾是108个氨基酸,除虫菌素装载组件的是28个氨基酸。因此可能其他候选启动密码子之一是正确的;最可能的这些起始密码子在SEQ ID No.1的16298、16607和16901位。N-末端尾的长度表明其可能代表催化活性,尽管其与数据库中其他序列没有任何显著同源性。在下面的表2中标识了起始组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列表2
基因borA2编码第一个延伸组件(SEQ ID No.1,18875-23590位)。在下面的表3中标识了第一个延伸组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列表3
基因borA3编码第二和第三个延伸组件(SEQ ID No.1,23686-34188位)。下面的表4中标识了第二和第三个延伸组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列表4
基因borA4编码第四个延伸组件(SEQ ID No.1,34185-39047位)。下面的表5中标识了第四个延伸组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列表5
基因borA5编码第5个延伸组件(SEQ ID No.1,39122-45514位)。下面的表6中标识了第5个延伸组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列
表6
基因borA6编码第6个延伸组件(SEQ ID No.1,45514-50742位)。下面的表7中标识了第6个延伸组件内每个功能结构域的核苷酸序列位置和相应氨基酸序列表7
基于与其他组件PKS如雷帕霉素(Schwecke等人,1995;Aparicio等人,1996)和红霉素(Cortés等人,1990)生物合成的组件PKS的保守氨基酸序列的相似性确定如前面描述的功能结构域的身份和它们的界限。基于其他PKS簇的同源性确定催化结构域的界限并且结构域开始或结束的选择点不被绝对限定,而是基于前述考虑选择。对于β-酮加工结构域的情况最不明显,因为在KR结构域前面通常有第一个大区域,其不被分配到功能结构域。该区域可能在结构上重要,或者是PKS二体稳定性所需的。疏螺旋体素PKS的一个不寻常的特征是所有单个酶结构域基于它们的核苷酸/氨基酸序列似乎都是能够催化的,并且所有都是必需的以便提供产生在疏螺旋体素中观察到的官能团所需的β-酮加工。这是相当不寻常的,因为迄今报导的主要组件化PKS序列都含有一个或多个无活性结构域,一个例外是spinosyn PKS(Waldron等人,2001;US 6,274,50)。
本领域技术人员熟悉遗传密码的简并性,因此,技术人员可以修饰本公开所提供的特定DNA序列以提供与此处特别提供的那些多肽相比具有相同或改变的或者改善的特征的蛋白质。本领域技术人员还可以修饰这些DNA序列以表达与此处提供的相同的多肽,但是这些多肽以更高水平表达。此外,本领域技术人员熟悉部分或完全合成制备DNA序列的方法,这些DNA序列将用于制备重组DNA载体和编码序列,这些重组DNA载体和编码序列也被本发明所包括。额外地,修饰所提供的DNA序列可以包括例如定点缺失或定点诱变。这些技术是本领域中技术人员熟知的并且不需要在这里进一步解释。因此,如此处所用的,从天然来源分离的、合成或半合成制备的,或者通过重组DNA方法修饰的DNA在本发明的范围内。
同样,本领域技术人员将认识到可以重组表达本发明的多肽。备选地,通过常规公知的非重组技术,例如,固相合成,可以完全或部分合成那些多肽。从而本发明不应被理解为必然受到任何特定载体构建或者产生特定生物合成簇分子(包括所示例的聚酮化合物合酶分子)的方法的限制。
疏螺旋体素PKS的装载组件作为离散蛋白存在。这是相当不寻常的,因为多数装载分子被发现在和第一个延伸组件相同的蛋白上面。该情况的例外包括,例如,制菌菌素(Brautaset等人,2000)和两性霉素(Caffrey等人,2001)PKS。该装载组件(由AT-ACP二结构域组成)类似于除虫菌素PKS的宽特异性装载组件,其接受许多备选起始酸,并可用于产生新聚酮化合物的文库(Marsden等人,1998;Pacey等人,1998)。疏螺旋体素PKS装载组件的AT结构域与大多数AT结构域不同,因为其活性部位丝氨酸残基被半胱氨酸替换从而活性部位基序是GXCXG(特别是GHCYG)。在多数可得到的I型PKS AT结构域序列中,保守活性部位基序是GXSXG;在脂酶、脂肪酸合酶和多数硫酯酶中观察到相同基序。两个NRPS硫酯酶,特别是负责产生分支菌素和绿脓杆菌螯铁蛋白的合成酶的结构域中亲核的丝氨酸被半胱氨酸替换(Shaw-Reid等人,1999)。在bialaphos簇的ORF1的类硫酯酶结构域中也观察到GXCXG基序(Raibaud等人,1991)。已经提出因为不可能通过单个碱基改变而在两类丝氨酸密码子之间移动,所以含有必需丝氨酸残基的活性部位可能位于远古祖先酶的后代的两个谱系之间,该远古祖先酶在其活性部位具有一个半胱氨酸而不是丝氨酸(Brenner,1988)。存在活性部位含有半胱氨酸的酶支持该观点。可能备选地,半胱氨酸在这些活性部位存在是因为通过半胱氨酸可能从一种类型的丝氨酸密码子通过仍保留活性的半胱氨酸转移到另一密码子。
PKSs的AT结构域选择了一个特定羧酸单元作为底物。已经表明该选择性与AT结构域的某些基序特征相关(Reeves等人,2001;WO 02/14482)。疏螺旋体素装载组件AT结构域基序与迄今描述的任一AT结构域基序都不同,这并不令人惊奇,因为该AT结构域是第一个被测序的选择脂环族二羧酸的结构域。疏螺旋体素PKS延伸组件的AT结构域表现出预期的活性部位基序GXSXG,并且每个结构域包含所预期的基序以选择丙二酰基辅酶A或者甲基丙二酰辅酶A(Reeves等人,2001;WO 02/14482)。丙二酰基辅酶A选择性AT结构域(AT1、AT2和AT6)显示出在蛋白质和DNA水平上都非常高的相互相似性。对于甲基丙二酰辅酶A选择性AT结构域(AT3、AT4和AT5)同样如此;这些AT结构域中的两个结构域(AT3和AT4)在整个保守区具有相同的氨基酸序列。AT5到AT3和AT4的高相似性证明组件5中所选延伸单元是甲基丙二酰辅酶A,而且由此掺入的疏螺旋体素C12-甲基在掺入PKS后被随后修饰成腈基。
为了阐明我们可以改变疏螺旋体素的PKS衍生的结构,使用置换策略(见实施例6)将组件4的AT结构域(borA4编码的AT结构域)用雷帕霉素PKS(rapAT2)的组件2的AT结构域置换。这产生株系小链霉菌Tü4055/467。在该突变株的发酵和培养提取物的LCMS分析时,可以确定产生了一些疏螺旋体素并且也观察到一种新的、更有极性的化合物,其m/z值低于疏螺旋体素的m/z值14单位。这与PKS的组件4掺人丙二酸盐而不是甲基丙二酸延伸单元而产生10去甲基疏螺旋体素3一致。
除了通过结构域交换方法产生外,通过向组件4AT结构域选择性基序导入特异突变也可以产生3(Reeves等人,2001;WO 02/14482)(见实施例7)。这种改变影响AT结构域的选择性从而它优先选择丙二酰基辅酶A而不是甲基丙二酰辅酶A作为底物分子。从而,SEQ ID No.5的739到742位氨基酸基序YASH是突变成HAFH而产生菌株S parvulus Tü4055/472。在该突变株的发酵和培养提取物的LCMS分析时,可以确定产生疏螺旋体素以及一种新的、更有极性的化合物,其m/z值低于疏螺旋体素的m/z值14单位。该新化合物与如上所述的相同从而与PKS的组件4掺人丙二酸而不是甲基丙二酸延伸单元而产生3一致。
这些结果清楚地表明疏螺旋体素PKS受到基因操作的作用并且将天然序列与异源株系的序列交换。本领域技术人员明白通过如上所述的方法对疏螺旋体素PKS的生物合成工程化将导致产生新的类似疏螺旋体素的分子。
疏螺旋体素装载组件由于其关连(cognate)底物的独特结构而是重要的。为了研究其在其他体系中的潜在用途,在红色糖多孢菌中将红霉素PKS的天然装载组件用疏螺旋体素装载组件替换;该实验类似于以前用除虫菌素装载组件所做的那些实验WO 98/01546;Marsden等人,1998等人,1998)。我们预期该新株系能够产生新的类似红霉素的分子,其中C13-乙基被替换为外源供给的外消旋反式-环戊烷-1,2-二羧酸部分。用于实施该实验的方法类似于WO 98/01546中所描述的,但是使用突变株红色糖多孢菌DM(Gaisser等人,2000)实施,该突变株积累苷元产物红诺霉素B而不是充分加工的大环内酯,还使用了红色糖多孢菌野生型(WT)。该实验在实施例8中描述。
从SEQ ID No.1不明显的是,SEQ ID No.1的四个候选启始密码子对于borA1是正确的。这四个最明显的候选启始密码子在SEQ ID No.1的核苷酸16184、16298、16607和16901。这些可能的起始密码子的最先的一个被用于给出SEQ ID No.2的氨基酸序列。该装载组件与红霉素和除虫菌素的堆叠表明AT0结构域从SEQ ID No.2的321位开始,并且有一个长N-末端尾。对于borA1的头298个氨基酸没有发现显著同源性。疏螺旋体素装载组件由一个离散org编码,并且为了保持该结构,将疏螺旋体素PKS装载组件序列连接到红霉素PKS装载组件序列所选的剪接位点在borA2的KS1结构域的同源区的开始部位,为SEQ ID No.3的氨基酸42-44。该方法将推定的停靠区保持在BorA1的末尾和BorA2的开始处,认为这对于产生功能PKS装配是必需的。为了维持该实验的连续性,将装载组件融合到eryA1的KS1结构域开始处的等同位点。将所得突变红色糖多孢菌DM/CJM400-403发酵并通过负离子LCMS使用标准方案分析。该分析清楚地表明存在新的化合物,其具有如所预期的m/z=485.3(图7)。本领域技术人员明白使用适宜的株系如红色糖多孢菌JC2(Rowe等人,1998)可以将这些实验的产物生物转化以提供新的、具有生物活性的红霉素类似物。本领域技术人员还明白疏螺旋体素装载分子可用于其他PKSs(即,不是疏螺旋体素PKS)的生物合成工程以产生具有反式-环戊烷-1,2-二羧酸部分的新聚酮化合物。还明白通过外源喂饲不同于关连底物的羧酸可以进一步增加来自疏螺旋体素装载组件的杂化PKSs产生产物的多样性。
疏螺旋体素的最显著特征是与I型组件化PKSs的正常同线性、持续运行模式的明显分歧。疏螺旋体素是一种壬酮化物(预期的一个装载加八个延伸步骤),但是在该簇中仅存在7个组件(一个装载组件加六个延伸组件)。关于疏螺旋体素化学结构的PKS结构域的分析与第五个延伸组件(BorA5)联系起来,BorA5被反复用于三轮链延伸,如图5所示。从而,链延伸的第5、6和7轮在BorA5上发生,掺入三个甲基丙二酰-CoA延伸单元,并且β-酮基被完全还原性加工成亚甲基部分。如前所述,与组件化PKSs的同线性操作的分歧是不寻常的并且局限于一些实例。本发明是有趣的,因为其发生在一个组件上,该组件将β酮基完全还原成亚甲基部分并且接着是生长链的蛋白质间而不是蛋白质内转移。对于红霉素(Wilkinson等人,2000)和埃坡霉素(Hardt等人,2001)PKSs错误的反复利用I型组件的这两个公知的实例也是这种情况。值得注意的是该完全还原使得组件在功能上等同于脂肪酸合酶(FAS)。可以反复操作的I型PKS可能保留了类似FAS的活性。
尽管似乎BorA5被反复(三次)利用,考虑到疏螺旋体素生物合成簇中存在的基因,两种其他可能的情况可以解释疏螺旋体素生物合成。首先,两个组件可以从该簇“遗漏”,但是可以在基因簇的某一其他位置存在。然而,在多数所研究的情况中,放线菌中次级代谢物的生物合成所需的基因在一个基因座上聚簇。第二个可能性是三个单独的BorA5二聚体装配,并且每个二聚体催化一轮链延长;从而该过程将是持续的。然而,该情况需要相对于其他PKS蛋白产生BorA5的三倍量,但是疏螺旋体素基因簇的组织不表明borA5的调节与任何其他PKS基因不同。此外,该情况不符合通常所认为的蛋白质间停靠结构域的角色,这提示需要相互作用的生物合成复合体的蛋白质的N-和C-末端之间的特异识别,该特异识别使得不同蛋白质上编码的组件之间特异结合(Ranganathan等人,1999;Wu等人,2001;Broadhurst等人,2003)。
为了解释上面描述的观点,经基因水平上操作borA4和borA5编码的两种蛋白融合而产生株系小链霉菌Tü4055/borA4-A5(见实施例9),以类似方式分别地将borA5和borA6编码的两种蛋白融合而产生小链霉菌Tü4055/borA5-A6(见实施例10)。此外,产生了双突变株,其中上述融合被组合而产生一种株系,该株系中borA4、borA5和borA6被融合而产生株系小链霉菌Tü4055/borA4-A5-A6(见实施例11)。因此,该新的、融合的二-和三-组件基因使得不可能装配三个单独的BorA5分子,或者远离疏螺旋体素簇的一个或多个基因编码的另一种或几种蛋白不可能与BorA5串联作用。发酵株系小链霉菌Tü4055/borA4-A5、/borA5-A6、和/borA4-A5-A6后提取并分析,当与野生型株系相比时,证实了疏螺旋体素的产量减少但是仍以显著水平产生(分别为21±4%、27±4%和18±5%)。从而,这些突变株的疏螺旋体素的产量表明所融合的BorA4-A5或BorA5-A6的组件5以反复的方式操作。因为本申请的优先权提交,已经公开了这些有限数据(Olano等人,2003)。
BorA5能够反复操作为异源PKS的工程化以提供具有更大环的大环内酯提供了巨大潜力。为了检查该可能性,将BorA5交换到红霉素PKS中以代替DEBS2的组件4。这通过置换红霉素生产者红色糖多孢菌WT和红色糖多孢菌DM两者中的适宜基因片段来实现。之所以选择该实验是因为两个组件都募集甲基丙二酰-CoA延伸单元并将所形成的β-酮官能加工成亚甲基。此外,聚酮化合物链中所得甲基的立体化学在两种情况中相同。最重要的是公知DEBS2的组件4执行链延长的错误的反复轮(Wilkinson等人,2000),表明这种过程实际上可以在PKS的该位置发生并且产生的产物可以被DEBS3完全加工,使得其是一个有吸引力的靶标以导入异源组件的特定反复利用而合成16-和18-元大环内酯。
简言之,编码borA5的DNA区域与编码eryA2的组件4的DNA区域交换,编码eryA2的组件4的DNA区域编码红霉素PKS的DEBS2的C-末端部分(见实施例12)。生长并提取所得突变株红色糖多孢菌DM/421以产生红色糖多孢菌株系的代谢物(Wilkinson等人,2000),然后通过LCMS分析。观察到两种新的重要化合物,它们比红诺霉素B的极性小。它们的m/z分别为435.5(7,[MNa+])和477.5(8,[MNa+]),这与产生两种新的环增大的红诺霉素B类似物(图8)一致。m/z=435.5的化合物7与存在16元环增大的红诺霉素B相关大环内酯一致,该红诺霉素B相关大环内酯以前被报导为红色糖多孢菌WT发酵的次要组分(Wilkinson等人,2000)。本领域技术人员明白通过用适宜的生物实施生物转化可以将这些新产物转化成抗细菌分子。本领域技术人员还清楚这种组件包含到红霉素PKS的其他位置,或者包含到其他PKS,可以允许以类似方式产生新的、环增大的聚酮化合物。此外,通过仅交换从KS4的保守区开始到ACP4结构域的末端的DEBS组件4的区域可实施该实验;该排列分别保留了DEBS2和DEBS3末端的C-和N-末端区,以确保这些蛋白质的相互识别和停靠。
非PKS基因PKS编码基因的上游和下游都是与疏螺旋体素的生物合成有关的其他orfs。Orf被指定为由至少100个相邻核苷酸组成,其以适宜的起始密码子开始并以适宜的终止密码子结束,并且对一种生物的蛋白质编码区具有适宜的密码子偏倚性,该生物的DNA富含鸟嘌呤和胞嘧啶核苷酸。在DNA序列中疏螺旋体素PKS基因(borA1-borA6)的上游和下游都有许多orfs,可以通过与NCBI数据库中的其他序列比较鉴定这些orfs(见图3)。这些orfs的核苷酸序列细节在下面的表8中给出表8 使用BLAST搜索从NCBI数据库得到了所预测多肽(SEQ ID No.7到43)的潜在功能。在下表9中描述了从这些搜索得到的最佳匹配表9
对推定的基因产物功能的分析表明基因borB到borO最可能形成疏螺旋体素生物合成簇的界限。支持该观点的证据来自borB2的破坏,borB2的破坏产生的疏螺旋体素的水平与野生型亲本株系的水平不相上下。此外,borB3到borB7具有质粒SCF76上编码的天蓝色链霉菌A3(2)基因组中的同源物;存在相同orfs,但是它们处于不同的顺序。Orfs borB8到borB10与天蓝色链霉菌A3(2)粘粒SC5E3中的同源物排列相同。Orfs borB18到borB21与天蓝色链霉菌A3(2)粘粒SC1A2中的对应物排列类似。orfborB13含有移码并从而任何基因产物将最可能无活性。此外,不能容易地推断出在疏螺旋体素生物合成期间这些orfs产物的功能。
起始单元生物合成基因为了鉴定与反式-环戊烷-1,2-二羧酸起始单元的生物合成有关的基因,将基因borB到borN的每一个都破坏(见,实施例13-25)。这样做在某种意义上是为了使极性效应的可能性最小,这通过与置于ermE*启动子控制下的该破坏基因的全长拷贝产生成功的反式互补而被证实,该互补在每种情况下恢复到疏螺旋体素产生的约WT水平。
如实施例1中描述的,每一种破坏的突变株一式三份地生长,并评估疏螺旋体素的产量。并行地,每种突变株一式三份地生长,并在24小时后补加外源起始酸至终浓度1mM,并评估疏螺旋体素的产量。在下面的表10中描述了疏螺旋体素的提取和分析所得到的数据
表10 基于表10中的数据,本领域技术人员清楚基因产物BorC-F和K-M对于反式-环戊烷-1,2-二羧酸的生物合成是必需的或者非常重要的,因为在不添加外源起始酸的情况下这些突变株不产生或者产生非常低的疏螺旋体素,而加入外源起始酸时,它们产生的疏螺旋体素的水平接近或者好于WT生物的水平。此外,基因产物BorG、H和N似乎参与起始单元的生物合成,但是不是必需的,因为如果不加入外源起始酸,它们产生显著更低的疏螺旋体素水平,而加入外源起始酸后,它们产生的疏螺旋体素的水平接近或者好于WT生物的水平;这对于BorG-突变株的情况尤其明显。
BorN同源物的正常代谢功能是产生2-氧代庚-3-烯-1,7-二酸10,这是酪氨酸通过4-羟苯基乙酸9(图9)分解代谢的一个关键步骤(Prieto等人,1996)。因此,10可能是反式-环戊烷-1,2-二羧酸的生物合成途径中的一种中间物。在borN中破坏的突变株产生疏螺旋体素(尽管以低水平产生)的能力最可能在于在用于酪氨酸的分解代谢中初级代谢期间所用的基因组中的别处存在同源物。
中间物10含有最终形成反式-环戊烷-1,2-二羧酸所需的所有官能性。该生物合成的最可能的下一步是在类似于烯酰基还原酶催化的反应中还原3-烯位置。负责该步骤的可能的酶是BorC、BorD、BorK或BorM;如从表10中的数据看到的,这些酶都参与疏螺旋体素起始单元生物合成。所形成的2-氧代庚-1,7-二酸11是通过C6和C2之间形成新的C-C键而环化的一种可能的底物。该环化的另一可能的底物是2-羟基庚-1,7-二酸12或其某种活性形式。12将可能通过氧化还原酶如BorC、BorD或BorM的作用从11形成。
关键的环化步骤最可能由BorE催化,BorE显示出与O-琥珀酰苯甲酰-CoA合酶和氯粘康酸环化异构酶的相似性。这些酶属于烯醇化酶超家族,其成员都能够稳定在与羧酸基团相邻的碳原子上形成的阴离子(Schmidt.等人,2001)。还值得注意的是氯粘康酸环化异构酶的底物是己-1,6-二酸,其在总体结构上类似于11和12。在11或12(或者其活化形式,例如13)的C6上夺取质子并形成等价阴离子并随后环化到C2提供了正确取代的环戊烷环结构,尽管作为底物的11的中间性将需要进一步加工被取代的环戊烷,最可能通过除去水而得到对称的环戊-1-烯-1,2-二羧酸,或者可能地Δ1-未饱和的化合物、环戊-1-烯-1,2-二羧酸。然而,当用环戊-1-烯-1,2-二羧酸或者其乙酯喂饲在BorC-E之一中被破坏的小链霉菌Tü4055株系,或者喂饲WT株系时,这些株系不产生疏螺旋体素或者与未喂饲的对照相比产生的疏螺旋体素的量无增加。这些数据表明该化合物可能不是起始单元生物合成中的中间物,并且BorE的底物可能是2-羟基庚-1,7-二酸12,或者其活化形式(例如,13)。反式-环戊烷-1,2-二羧酸的生物合成途径的推定的途径在图4中显示。
反式-环戊烷-1,2-二羧酸的生物合成步骤所需的组合的特定基因还不清楚,但是可能被borC-H、borK、borM和borN的某一组合所编码。与4-羟苯基乙酸9的分解代谢有关并且在该途径中BorN之前作用的这些基因的某些同源基因的缺乏最可能表明了初级代谢基因执行这些任务。将外源反式-环戊烷-1,2-二羧酸加入小链霉菌Tü4055株系和相关株系在我们的条件下将疏螺旋体素的滴定度增加了2到3个数量级,这表明起始酸的生物合成是疏螺旋体素生物合成中的限制因素。这些数据与酪氨酸的初级代谢分解是反式-环戊烷-1,2-二羧酸的来源相一致。
在试图进一步阐明哪些基因可能特异负责起始单元的生物合成中,用不同突变株的组合实施共培养实验——这些实验需要知道borI和borJ的基因产物特异参与C12-腈部分的形成,这可以通过下面章节给出的数据联合表10的数据一起阐明。总之,突变株borE-&borD-和borE-&borM-的共培养不能产生疏螺旋体素,而突变株borM-&borI-和borM-&borK-的共培养产生了约WT水平的疏螺旋体素。这些数据,联合表10和下文中的数据清楚地表明borD、borE和borM参与起始单元生物合成,而borI和可能地borK参与疏螺旋体素的C12上腈部分的形成。
从表10中的数据可知外源加入反式-环戊烷-1,2-二羧酸足够在突变株中重建产生疏螺旋体素为约WT水平或者更好的水平,其中这些突变株中参与起始单元的生物合成的基因已经被破坏。这些数据表明小链霉菌Tü4055无疑主动摄入所加入的羧酸,并且存在能够将该羧酸转化成CoA硫酯当量的活性。从而,考虑到突变合成的公知技术,对本领域技术人员显然的是,将外源羧酸加入上述突变株之一(例如,实施例16中描述的borE-株系小链霉菌Tü4055/borEaac3(IV))可以导致产生疏螺旋体素类似物,其中起始单元羧酸部分被来自外源加入的羧酸的部分置换。
为了检查该可能性,根据实施例1中描述的方案对株系小链霉菌Tü4055/borEaac3(IV)喂饲反式-环丁烷-1,2-二羧酸然后如实施例4中描述的分析。图10中描述的结构18显示出喂饲该羧酸所得到的新的疏螺旋体素结构;该化合物18显示出疏螺旋体素的所预期UV生色团,但是在较早的保留时间被洗脱并且通过LCMS显示出所预期的质量(m/z=474.3[M-H]-XX)。对18的产生、分离和表征(实施例33)验证了该方法。(RS)-2。本领域中技术人员明白其他羧酸也可用于类似的喂饲实验中以提供其他新的疏螺旋体素类似物。尽管使用此处描述的准确的方法学不可能掺入所有羧酸,但是本领域技术人员知道可以利用许多方法增强所喂饲的起始单元的掺入。
除了使用borE中缺失的株系,还观察到(见表10)株系小链霉菌Tü4055/borGaac3(IV)(其中borG已经被缺失)当被喂饲bor PKS的天然起始单元反式-环戊烷-1,2-二羧酸时,产生的疏螺旋体素的滴定度显著用高于喂饲(增加4倍)或不喂饲(增加15倍)的野生型生物所看到的滴定度。为了进一步检查该现象,使用天然和非天然起始酸作为外源底物平行地喂饲野生型、borE突变株和borG突变株重复该实验。所得结果在表11中描述。
表11
从表11可以看出,用小链霉菌Tü4055/borGaac3(IV)而不是用小链霉菌Tü4055/borEaac3(IV)进行突变合成使滴定度增加了约19倍,并且用天然起始酸喂饲的小链霉菌Tü4055/borGaac3(IV)比野生型产生38倍以上的疏螺旋体素A,或者比用相同量环戊烷反式-1,2-二羧酸喂饲的野生型株系产生13倍以上的疏螺旋体素A。这些数据清楚地表明株系小链霉菌Tü4055/borGaac3(IV)用于突变合成实验对于产生疏螺旋体素类似物的更高滴定度是有益的。该方法总体上适用于产生疏螺旋体素和疏螺旋体素类似物。
基于该发现,在小链霉菌Tü4055/borGaac3(IV)中用备选羧酸重复喂饲实验,并且还包括2,3-二甲基琥珀酸和2-甲基琥珀酸;分别从这些备选起始单元的掺入得到的新化合物19和20在图10中描述。
为了通过其他方法提高小链霉菌Tü4055的发酵培养中产生的疏螺旋体素的滴定度,将载体中基因borE和borL的额外拷贝导入生物将这些基因置于强组成型启动子ermE*的控制下。预期这些基因的过表达将增加起始酸的细胞内水平,该起始酸似乎限制疏螺旋体素的产生。
分别如实施例29和30中描述的,通过PCR扩增基因borE和borL,并它们克隆到载体pEM4,然后导入小链霉菌Tü4055。此外,仅将载体pEM(不含有任何插入序列)也导入小链霉菌Tü4055并用作对照。如实施例1和4中描述的生长、提取和分析所得菌株。作为对照导入的载体不显著影响疏螺旋体素产生水平。然而,borE或borL的额外拷贝以这种方法的表达导致相对于野生型菌株疏螺旋体素的滴定度分别增加4.2±0.3和4.3±0.7倍。它们的基因产物所催化的生物合成的步骤可能是限速的,或者备选地,它们的基因产物可能具有正调节功能。例如,borL显示出与来自植物的植物生长素应答蛋白的最大同源性。植物生长素是参与植物中多种细胞过程的调节的激素,并且borL可能代表在细菌中具有调节功能的相关基因的第一个实例。作为对照,向小链霉菌Tü4055导入处于pEM4中ermE*控制下的borJ、borO和borA5的额外拷贝,但是这些拷贝对疏螺旋体素滴定度没有显著影响。这是预料中的,因为预期这些基因产物没有一种参与起始单元生物合成。此外,推定的“打滑”PKS组件(borA5)的上调并不增加疏螺旋体素滴定度,这进一步表明发生了该组件的反复使用,而不是三个独立的拷贝被利用。当borO被上调时对滴定度没有影响表明很可能不会由于生产微生物中的毒性而对疏螺旋体素产生造成限制,因此表明对于滴定度提高还有余地。
C12处腈部分的形成对疏螺旋体素PKS组件3的AT结构域的序列分析表明用于第三轮链延伸的底物是甲基丙二酰-CoA。从而,腈部分的碳原子最可能来自甲基丙二酰-CoA的甲基。这通过稳定同位素喂饲实验来验证。向小链霉菌Tü113喂饲[2,3-13C2]丙酸钠产生疏螺旋体素,其显示出在C4-C24、C6-C25、C8-C26、C10-C27和C12-C28处碳的完整标记,和预期的相同特定掺入(在我们实验方法的极限内测定)一致(图2)。这些数据表明C12-甲基的转化在链装配期间第三个延伸单元掺入之时或之后发生、或者在聚酮化合物链装配完并从PKS释放之后发生。基于对疏螺旋体素生物合成基因的功能分配,结合表10中描述的基因破坏数据,可清楚地发现borI和borJ都与C12处腈部分的形成有关,而其他基因如borK也可能有关。
细胞色素P450羟化酶BorI与TylHI具有最大的相似性,TylHI催化泰乐菌素大环内酯的外环甲基的羟基化,之后加入脱氧己糖部分(Fouces等人,1999)。因此认为BorI催化疏螺旋体素生物合成期间C12-甲基的氧化。与这一致的是borI-突变株小链霉菌Tü4055/borI∷aac3(IV)不能产生疏螺旋体素但是积累一种新产物14(图6),其极性比疏螺旋体素的小。当对borE-突变株小链霉菌Tü4055/borE∷aac3(IV)喂饲14时,14被容易地转化成疏螺旋体素,该突变株不能合成PKS起始单元,但是剩下的疏螺旋体素生物合成基因保持完整。将小链霉菌Tü4055/borI∷aac3(IV)发酵然后提取并分离得到~30mg 14(实施例31)。对14的完整结构分析鉴定其是12-脱腈-12-甲基疏螺旋体素(前-疏螺旋体素)。这与所提议的BorI在疏螺旋体素生物合成中的角色一致,并且提供了新的疏螺旋体素类似物的途径,其中该类似物的大环内酯环的C12处连接有甲基。
认为推定的依赖PLP的氨基转移酶BorJ催化疏螺旋体素中所活化的C28位处导入氮原子,该导入可能通过C12-甲酰基部分。与这一致的是borJ-突变株小链霉菌Tü4055/borJ∷aac3(IV)不产生疏螺旋体素并积累一种极性大于疏螺旋体素的新化合物。该新化合物蛋白被喂饲于突变株小链霉菌Tü4055/borE∷aac3(IV)时不被转化成疏螺旋体素,这表明其可能是疏螺旋体素生物合成中的一种旁路代谢物而不是中间物。对小链霉菌Tü4055/borJ∷aac3(IV)发酵后分离到17mg积累的化合物(实施例32)。详细的结构分析鉴定该积累产物是12-脱腈-12-羧基疏螺旋体素2。
除了从疏螺旋体素生物合成基因的突变分离的化合物外,还从小链霉菌Tü113的发酵上清液分离到12-脱腈-12-甲酰基疏螺旋体素15。用于这些实验的发酵培养基和条件与我们目前在此处描述的那些培养基和条件不同,但是被设计用以最大化疏螺旋体素的产量。我们提出该改变的培养基,联合在该特定发酵中所观察到的溶解氧浓度的降低,促进了15的积累。15当被喂饲于突变株小链霉菌Tü4055/borE∷aac3(IV)时被容易地转化成疏螺旋体素,该突变株不能合成PKS起始单元,但是剩余的疏螺旋体素生物合成基因保持完整。
上面的数据导致我们提出如图6中给出的疏螺旋体素的腈部分的生物合成途径。前疏螺旋体素14的C12-甲基碳首先被BorI氧化而在C28导入烯丙基羟基(16)。然后用一种方法将羟基转化成连接到C12的甲酰基部分(15),所用方法包括自发氧化(包括一些背景酶介导的氧化)疏螺旋体素生物合成基因簇的特定基因的作用;从而候选基因产物是BorI自身,以多功能方式作用并通过在C12形成偕二醇结构,然后脱水;或者备选地,通过一种氧化还原酶编码基因如borC或borK。预期下一步是BorJ-催化的15的转氨基作用以便在C28以胺的形式通过磷酸吡哆胺介导的过程导入氮原子。然后推定的产物胺17经历氧化,该氧化可能是自发的,但是最可能通过酶活性如BorI(与植物中腈的生物合成有一定的相似性(Celenza,2001;Hahn等人,1999;Nielson和M_ller,1999))或通过一种氧化还原酶编码基因的产物例如borC或borK或者通过蛋白体(proteome)内的常规氧化还原酶发生。
为了更详细地检查该提议的途径,使用前-疏螺旋体素14作为底物实施许多生物转化实验以单独和联合地研究borI-K的作用,用pEM4作为载体,白色链霉菌J1074(Chater & Wilde,1980)作为表达菌株。加入14时borI或borJ单独的表达不产生疏螺旋体素。BorI的生物转化(并且不在任何对照实验中)期间加入的14仅被消耗;所加入的14被鉴定转化为旁路代谢物2。然而,borI & borJ的共表达没有将所加入的14转化成疏螺旋体素。从而似乎白色链霉菌中BorI或一般的蛋白体活性能够氧化所提议的疏螺旋体素生物合成途径中的胺中间物17。除了喂饲前疏螺旋体素14,还向上述三种菌株喂饲12-脱腈-12-羧基疏螺旋体素2。在这些实验中没有观察到2向疏螺旋体素的转化,这加强了2是旁路代谢物这一想法。
使用多种限制性消化并随后通过DNA印迹分析对来自三种疏螺旋体素生产菌株娄彻氏链霉菌ATCC23956、小链霉菌Tü113和小链霉菌Tü4055的基因组DNA的详细研究表明这三种生物的疏螺旋体素生物合成基因簇非常密切相关地保守。因此似乎这些株系的疏螺旋体素生物合成途径非常类似。该设想使得我们认为从不同株系得到的上面的数据可应用于单一生物合成途径。
本领域技术人员明白操作与疏螺旋体素的C12-腈部分的形成有关的基因(例如,borI或borJ)通常是一种有用的方法,其可用于产生在C12处功能性改变的新疏螺旋体素相关分子和疏螺旋体素衍生物。此外,将这些基因转移到产生其他天然或工程化聚酮化合物产物的其他生物中可能允许腈部分向这些化合物的掺入。
作为该工作的继续,在株系小链霉菌Tü4055/borGaac3(IV)中分别破坏borI和borJ以得到双突变的株系小链霉菌Tü4055/borGaac3(IV)/borI∷hyg和小链霉菌Tü4055/borGaac3(IV)/borJ∷hyg(分别在实施例27和28中)。对这些株系喂饲备选羧酸反式-环丁烷-1,2-二羧酸、2,3-二甲基琥珀酸和2-甲基琥珀酸(如上述)并发现产生突变合成的疏螺旋体素类似物,它们携带C12处的甲基(分别21、22和23)或羧基官能(分别为24、25和26)以代替腈基,并且它们也来自相应于外源提供的羧酸的备选起始单元。在图11中描述了新化合物的正交文库并且显示了每种化合物所观察到的UV生色团和质谱数据。
与疏螺旋体素产生相关的其他基因除了疏螺旋体素PKS的I型末端硫酯酶结构域,离散的II-型硫酯酶位于生物合成基因簇的上游界限并且被基因borB编码。该离散的II型TE蛋白通常被发现与I型PKSs结合并且被认为通过除去短链酰基而起PKSs的“编辑”作用,这些短链酰基是附着到KS结构域的延伸单元通过不需要的脱羧基作用形成的(Heathcote等人,2001)。苦霉素(Xue等人,1998)和泰乐霉素(Butler等人,1999)生物合成簇中这些离散的II型TE的破坏导致两种大环内酯的滴定度都显著减小。根据这些结果,破坏borB(实施例13)得到的突变株产生的滴定度是亲本野生型滴定度的43-75%。
小链霉菌株系对疏螺旋体素的自身抗性最可能是由于borO的产物,borO编码苏氨酰tRNA合成酶同系物。苏氨酰tRNA合成酶是敏感菌株中疏螺旋体素的分子靶标(Paetz & Ness,1973)。预测BorO对疏螺旋体素的作用具有抗性,并且发挥作用而在合成疏螺旋体素的细胞中产生苏氨酰tRNA,有效互补了被抑制的正常苏氨酸-tRNA。为了验证该假说,将borO通过PCR扩增并克隆到表达载体pEM4A,该表达载体将borA置于强组成型启动子ermE*的控制下(实施例26)。然后将所得载体pborOR转化到疏螺旋体素敏感株系白色链霉菌J1074(Chater & Wilde,1980)。使用浸湿盘生物测定,将该株系与仅含有表达载体pEM4A的株系比较清楚地表明borO的表达赋予了疏螺旋体素抗性。
实施例一般方法限制酶、其他分子生物学试剂、抗生素和化学试剂是从标准商业来源购买。限制性内切核酸酶消化和连接按照标准方法(Sambrook,J.等人,1989)。
实施例1小链霉菌株系的发酵下列方法通常可用于培养小链霉菌以产生疏螺旋体素和/或疏螺旋体素类似物从工作原种(0.5ml)接种含有NYG培养基(250ml锥形烧瓶中30ml)的种子烧瓶。NYG培养基含有(去离子水中)牛肉浸膏(0.3%)、细菌培养用胨(0.5%)、葡萄糖(1%)和酵母抽提物(0.5%)。在旋转培养箱(2-英寸偏心度;30℃;250转/分钟)中摇动2天后,所得膏状培养物用于接种PYDG生产培养基(250ml锥形烧瓶中30ml;10%接种物)。PYDG培养基含有每升去离子水胨化奶营养物(1.5%)、酵母自溶物(0.15%)、糊精(4.5%)和葡萄糖(0.5%),调节到pH7.0。在旋转培养箱(2-英寸偏心度以后;30℃;250转/分钟)上摇动5天后,收获培养物以用于如实施例4中描述的分析,或者根据需要用于分离目的。一式三份地实施这些实验的定量分析。
下列方法用于将外源羧酸喂饲给小链霉菌株系如上所述地生长小链霉菌株系。在PYDG生产培养基中生长24小时后,将所选羧酸作为50μl单一的等分试样(用5N NaOH中和后的70%甲醇中的0.6M溶液)加入。经过5天总发酵后收获所得培养物并且如实施例4中描述的分析。为了定量研究,这些实验一式三份地实施,并且等同的喂饲和未喂饲的野生型(WT)株系作为对照。
实施例2小链霉菌株系的深低温保藏工作原种通过将生长在NGY培养基(0.5ml)的2天陈种培养物与深低温保藏液(0.5ml)混合制备营养菌丝体的工作原种。深低温保藏液由去离子水中的20%甘油和10%乳糖组成。
孢子原种在HA琼脂板上30℃下孵育小链霉菌的株系。14天后,从单个平板收获所得孢子并且悬浮在深低温保藏液(1ml)中。HA琼脂含有去离子水中0.4%酵母抽提物,1%麦芽膏,0.4%右旋糖和1.5%琼脂,调节pH7.3。
实施例3疏螺旋体素生物合成基因簇的克隆和borA2 & borA3的破坏粘粒文库产生使用Gigapack_III Gold Packaging Extract kit根据生产商的手册(Stratagene)。在pWE15粘粒载体中构建粘粒文库。根据标准方案(Kieser等人,2000)从小链霉菌Tü4055提取染色体DNA并将其用Sau3AI处理后克隆到pWE15。挑选许多所得大肠杆菌转化株(3300)并将其转移到含有Luria肉汤(LB)培养基(0.1ml/孔)与氨苄青霉素(100μg/ml)的96孔微量滴定板中。所得克隆在含有氨苄青霉素(100μg/ml)的Luria琼脂(LA)板中复制。37℃过夜孵育后,根据所出版的方案(Sambrook等人,1989)将菌落转移到尼龙滤膜以实施原位菌落杂交分析。
文库筛选使用用DIG DNA标记的探针和检测试剂盒(Roche)根据生产商的使用说明书产生的探针筛选粘粒文库。所用探针是BglII-BamHI片段(1.7kbp),该片段来自编码抗生链霉素的竹桃霉素PKS的第三个亚单位的组件6的基因(Swan等人,1994)。
疏螺旋体素生物合成基因簇的破坏将如上述筛选时产生阳性应答的粘粒用BamHI消化并将小于3kbp的片段亚克隆到pOJ260(Bierman等人,1992)。然后如实施例5中描述的将它们用于转化小链霉菌Tü4055的原生质体。评估所得转化株产生疏螺旋体素的能力。两个克隆是非疏螺旋体素生产者;它们都来自cosBoR32A2并且含有组件化PKS的典型序列。然后使用从两种BamHI片段得到的探针筛选剩余的粘粒,这鉴定了重叠的粘粒cosBoR19B9,其含有剩余的疏螺旋体素生物合成簇。
cosBoR32A2和cosBoR19B9的测序将粘粒cosBoR32A2和cosBoR19B9转化到大肠杆菌DH10B中并将所得克隆在37℃下生长于含有氨苄青霉素的2xTY培养基(30ml)中。15小时后,收获细胞并将Qiagen Tip 100试剂盒用于制备粘粒DNA。用Sau3AI(1U)消化约5μg粘粒DNA。酶加入后在2、4、6、8和10分钟间隔处取样并用等体积冰冷却的0.5M EDTA淬灭反应。将样品混合并通过凝胶电泳分析,从凝胶回收1.5-2.0kbp的那些片段。将片段克隆到线性化和去磷酸化的pHSG397(Takeshita等人,1987),并转化到大肠杆菌DH10B。含有插入片段的所得克隆在含有氯霉素(30μg/ml)的2xTY培养基(2ml)中生长并用Wizard试剂盒(Promega)纯化。
用Applied Biosystems 800Molecular Biology CATALYST机器人进行双脱氧终止反应,然后将其上样入ABI Prism 3700自动测序仪(AppliedBiosystems)而实施DNA测序。用Staden软件包处理原始数据。用GAP(Genome Assembly Program)4.2版(Bonfield等人,1995)实施装配和cotig编辑。GCG包(Devereux等人,1984)10.0版用于序列分析。
实施例4小链霉菌株系的化学分析下面的方法用于分析产生天然疏螺旋体素和工程化疏螺旋体素类似物的发酵(见实施例1)在2ml Eppendorf管中,通过加入90%甲酸(约20μl)将约5天的发酵培养液(1ml)的等分试样调节到pH~3。向样品加入乙酸乙酯(1ml)并用涡旋盘剧烈混合10分钟。通过在微量离心机中离心分离混合物并将上层相转移到干净的2ml Eppendorf管中。用Speed-Vac蒸发除去乙酸乙酯。将残渣溶于甲醇(250μl)并用微量离心机澄清。如下面描述的用Agilent HP1100HPLC系统实施分析。
注射体积 50μl柱静止相 150×4.6mm柱,碱失活的反相硅胶,3μm颗粒大小(Hypersil C18-BDS)
移动相A 10%乙腈90%水,含有10mM乙酸铵和0.1%TFA移动相B 90%乙腈10%水,含有10mM乙酸铵和0.1%TFA移动相梯度T=0分钟,25%B;T=15,100%B;T=19,100%B;T=19.5,25%B;T=25,25%B流速1ml/分钟检测258nm处UV(190-600nm之间的DAD获取);在m/z范围100-1000amu下通过电喷雾离子化进行MS检测,+/-ve离子模式转换。
实施例5小链霉菌Tü4055的原生质体转化方案从工作原种(0.15ml)接种含有胰蛋白胨大豆肉汤(TSB)培养基(100ml锥形烧瓶中10ml)的种子烧瓶。在旋转培养箱30℃,250转/分钟)摇动3天后,5ml该培养物用于接种R5培养基(Kieser等人,2000)(250ml锥形烧瓶中50ml),然后将其在旋转培养箱上摇动24小时(30℃,250转/分钟)。然后根据标准的出版方案(Kieser等人,2000)实施原生质体的PEG介导转化。
实施例6用rapAT2替换borAT4-C10-去甲基疏螺旋体素的产生如下用雷帕霉素聚酮化合物合酶的AT2结构域替换疏螺旋体素PKSAT4结构域用EcoRI消化CosBoR32A2并分离5429bp带。这用作PCR的模板,使用寡核苷酸CM410(5’-AAAATGCATTCGGCCTGAACGGCCCCGCTGTCA-3’)(SEQ ID No.44)和CM411(5’-AAATGGCCAGCGAACACCAACACCACACCACCA-3’)(SEQ ID No.45)。CM410导入用于克隆目的的NsiI限制性位点,CM411导入MscI位点用于导入异源AT。将~1.1kbp产物克隆到用SmaI消化并脱磷酸的pUC18中。插入片段可以以两个方向连接并通过限制酶分析和插入片段测序筛选相反取向。一个正确的质粒称为pCJM462。通过使质粒经过大肠杆菌ET12567传代分离pCJM462和pCJR26(Rowe等人1998)的甲基化缺陷DNA(特别是dcm-)。然后用MscI和XbaI消化每种质粒并将来自pCJR26的~7.8kbp片段(含有雷帕霉素AT2和pCJR26中的下游序列)连接到通过pCJM462消化产生的~3.8kbp主链中。通过限制性分析鉴定质粒pCJM463。
用EcoRI和EcoRV消化CosBoR32A2并且分离2871bp带。这用作PCR的模板,使用寡核苷酸CM412(5’-AAAGTCCTAGGCGGCGGCCGGCGGGTCGACCT-3’)(SEQ IDNo.46)和CM413(5’-TTTAGATCTCGCGACGTCGCACGCGCCGAACGTCA-3’)(SEQ ID No.47)。CM412导入一个AvrII限制位点,其符合读框地将下游疏螺旋体素同源序列连接到异源AT,CM413导入用于克隆目的的一个BglII位点。将~1.1kbp产物克隆到用SmaI消化并脱磷酸的pUC18中。插入片段可以以两个方向连接并通过限制酶分析和插入片段测序筛选相反取向。一个正确的质粒称为pCJM464。
用AvrII和XbaI消化质粒pCJM463和pCJM464并且将来自pCJM464的~1.1kbp片段连接到pCJM463的~4.7kbp主链得到pCJM465,其通过限制酶分析鉴定。pCJM465含有具有疏螺旋体素序列侧翼区的杂化雷帕霉素AT2,该侧翼区提供整合和二次重组所需的同源性。
用NsiI和BglII消化质粒pCJM465并将~3kbp片段克隆到事先用NsiI和BamHI消化的pSL1180以得到pCJM466。然后用NsiI消化质粒pCJM466并且阿泊拉霉素盒被掺入到来自pEFBA(Lozano等人2000)的PstI片段而得到置换载体pCJM467。通过如实施例5中描述的原生质体转化将pCJM467导入小链霉菌Tü4055。先鉴定抗阿泊拉霉素(25μg/ml)的菌落,然后通过没有抗生素选择的MA培养基传代若干次以便促进第二次重组(Fernandez等人1998)。分离若干阿泊拉霉素-敏感菌落并且通过PCR和DNA印迹分析。该新的突变株称为小链霉菌Tü4055/467。
如实施例1描述的分析小链霉菌Tü4055/467并且发现其产生具有正确UV光谱的混合化合物。新的主要组分之一比疏螺旋体素更具极性,其具有10-去甲基疏螺旋体素3的正确保留时间。LCMS分析表明如所预期的,化合物的m/z比值比疏螺旋体素的低14个质量单位,并且具有合适的质量裂解方式。疏螺旋体素本身也被产生,但是水平比野生型生物的低。
实施例7突变borAT4的甲基丙二酰辅酶A选择性基序以产生10-去甲基疏螺旋体素酰基转移酶结构域的定点诱变也可以用于改变AT的特异性。在该实施例中,borAT4的特异性从甲基-丙二酰基辅酶A转向丙二酰基辅酶A。已经鉴定指导AT特异性的氨基酸在序(Reeves等人,2001;WO 02/14482)。在甲基丙二酰辅酶A特异的ATs中发现基序YASH(如在borAT4中观察到的)并且在该实施例中,该基序被改变为HAFH,其中在丙二酰基-辅酶A特异的ATs中发现HAFH。
用NcoI消化CosBoR32A2并分离5167bp带。这用作PCR的模板,使用引物CM414(5’-AAACTGCAGAGTCGAACATCGGTCACACGCAGGC-3’)(SEQ ID No.48)和CM415(5’-AAAATGCATGATCCACATCGATACGACGCGCCCGA-3’)(SEQ ID No.49)。CM414导入用于克隆目的的PstI限制位点,CM415是诱变引物,其覆盖AT的基序编码区,该引物将实现氨基酸改变并且含有用于克隆目的的NsiI位点。将~1.1kbp片段克隆到用SmaI消化并脱磷酸的pUC18中。插入片段可以以任一方向连接并通过限制酶分析和插入片段测序筛选正向取向。一个正确的质粒被指定为pCJM468。
使用CosBoR32A2的5167bp NcoI片段和引物CM416(5’-TAAATGCATTCCATTCGGTGCAGGTGGAGTTGATCC-3’)(SEQID No.50)和CM417(5’-ATAGGATCCCCTCCGGGTGCTCCAGACCGGCCACCC-3’)(SEQ ID No.51)实施另一PCR反应。CM416导入NsiI限制位点并且也是覆盖AT的基序编码区的基序诱变引物,CM417导入用于克隆目的的BamHI位点。将~1.1kbp片段克隆到事先用SmaI消化并脱磷酸的pUC18中。插入片段可以以两个方向连接并通过限制酶分析和插入片段测序筛选正向取向。一个正确的质粒被指定为pCJM469。
用NsiI和XbaI消化质粒pCJM468和pCJM469并且将来自pCJM468的~1.1kbp片段连接到pCJM469的~3.8kbp主链得到pCJM470,其通过限制酶分析鉴定。pCJM470含有borAT4的突变基序,其任一边上具有~1.1kbp同源DNA,其提供整合和二次重组所需的同源性。
用PstI和BglII消化质粒pCJM470并将~2.2kbp片段克隆到事先用PstI和BamHI消化的pSL1180(Amersham Biosciences)以得到pCJM471。然后用PstI消化质粒pCJM471并且阿泊拉霉素盒被掺入到来自pEFBA(Lozano等人2000)的PstI片段而得到置换载体pCJM472。
通过如实施例5中描述的原生质体转化将置换载体pCJM472导入小链霉菌Tü4055中。先鉴定阿泊拉霉素抗性菌落,然后通过没有抗生素选择的MA培养基传代几次以促进二次重组(Fernandez等人,1998)。分离了一些阿泊拉霉素敏感菌落并通过PCR和DNA印迹分析,并选择了一个菌落,其含有新的AT4序列,该序列含有突变的基序和NsiI位点。该新突变株被称为小链霉菌Tü4055/472。
如实施例1中描述的生长和分析小链霉菌Tü4055/472并且表明其产生具有疏螺旋体素的正确UV图谱的化合物的混合物。该新的主要组分之一(即比疏螺旋体素更具极性)具有真实的3的正确保留时间。LCMS分析表明如所预期的,化合物的m/z比值比疏螺旋体素的低14个质量单位,并且具有适宜的质量裂解方式。疏螺旋体素本身也被产生,但是水平比WT生物的低。
实施例8疏螺旋体素装载组件导入红霉素PKS对于4种推定的起始密码子的每一种扩增疏螺旋体素装载组件。PCR模板是cosBoR32A2的3376bp BamHI片段,其覆盖SEQ ID No.1的核苷酸15858到19234的区域。反向引物CM368(5’-TTTCCTGCAGGCCATCCCCACGATCGCGATCGGCT-3’)(SEQ ID No52)在相应于borA2的KS1起始的序列(保守MACRL基序)处导入一个SbfI位点并且与正向引物CM369(5’-TTTCATATGACAGGCAGTGCTGTTTCGGCCCCATT-3’)(SEQ ID No.53)、CM370(5’-TTTCATATGGCGGATGCCGTACGTGCCGCCGGCGCT-3’)(SEQ ID No.54)、CM371(5’-TTTCATATGCCCCAGGCGATCGTCCGCACCAC-3’)(SEQ IDNo.55)和CM372(5’-TTTCATATGGTCTCGGCCCCCCACACAAGAGCCCTCCGGGC-3’)(SEQ ID No56)中的每一种一起使用。将4种PCR产物(分别地为2834、2720、2411和2117bp)克隆到预先用SmaI消化并且脱磷酸的pUC18中。所得质粒称为pCJM370(其含有最大的插入片段)、pCJM371、pCJM372和pCJM373(其含有最小的插入片段)。
将4种疏螺旋体素装载组件片段导入载体pKS1W,其在保守MACRL基序中DEBS1-TE的eryKS1开始处含有一个PstI位点(Rowe等人,2001);PstI产生与SbfI相同的突出端。pKS1W是一种基于pT7的质粒,其在NdeI/XbaI片段上含有DEBS1-TE、在装载组件侧翼具有独特位点、一个独特PstI位点在DEBS1-TE编码基因的1698位核苷酸处、一个独特NdeI位点在起始密码子处。如下切除疏螺旋体素装载组件片段用NdeI和SbfI消化pCJM370,用NdeI和PstI消化pCJM371和pCJM373,并用NdeI、PstI和DraI消化pCJM372。将含有装载组件的每一片段克隆到用NdeI和PstI预先消化的pKS1W。所得质粒称为pCJM384(其含有最大的插入片段),然后是pCJM386、pCJM388和pCJM390(其含有最小的插入片段)。
将杂化PKS片段转移到pCJR24,其是红色糖多孢菌(S.erythraea)WT和红色糖多孢菌DM的转化和所得杂化PKS的表达的适宜载体(WO98/01546)。切除每个装载组件构建体以及来自DEBS1DNA的2346bp片段以便允许整合到染色体。为了实现该目的,用XbaI消化pCJR24并且使用DNA聚合酶I的Klenow片段填充末端。然后将其用NdeI消化以得到主链片段。向该主链片段克隆入4种杂化PKS片段,这些片段含有疏螺旋体素装载组件加上用于整合的DEBS1序列的区域,这些片段分别为来自pCJM384、pCJM386、pCJM388和pCJM390的NdeI/EcoRV片段,分别得到pCJM400、pCJM401、pCJM402和pCJM403。
通过如其他人描述的(Gaisser等人,2000)转化红色糖多孢菌DM原生质体的方法将质粒pCJM400、pCJM401、pCJM402和pCJM403导入红色糖多孢菌。通过PCR和DNA印迹分析突变株以证实染色体上存在该质粒并且确定已经发生了正确的整合。通过这些方法鉴定了许多正确的突变株,根据关于从红色糖多孢菌株系产生聚酮化合物的标准方法(Wilkinson等人,2000)生长、提取和分析这些突变株。当使用LCMS方法与对照株系比较时,这些突变株中有一些的提取物含有合理水平的新化合物。分析它们的MS谱表明存在一种化合物,在阴离子模式下m/z=485.3([M-H]-,6)。这与所预期的产物化合物一致(M=486.3)。
实施例9PKS组件4和5的融合(小链霉菌Tü4055/borA4-A5)为了研究组件5的反复作用,通过基因水平上的操作将编码组件4和5的两种分离的蛋白质融合到一起。通过基因置换实施融合,其中borA4的最后~1kbp和borA5的头~1kbp融合,其中该融合是通过将重叠的终止密码子和起始密码子分别转化成精氨酸残基,导入一个新的XbaI位点并且将两个分别的orfs转化成一个orf实现的。
在诱变的第一步,实施两个单独的PCR扩增。在第一个PCR反应中,模板DNA是cosBoR19B9,引物是B1819A(5′-GTCATGCATGCGGCGGGCTC-3′)(SEQ ID No.57)和B1819B(5′-GGTCTAGAACGGCCGAACTT-3′)(SEQ ID No.58)。将1063bp产物纯化,用NsiI-XbaI消化并且克隆到类似消化的pSL1180(AmershamBiosciences)中得到质粒pSL18-19AB。在第二个PCR反应中,扩增borA5片段并且使用引物B1819C(5′-GTTCTAGAACCTCGGTCGGC-3′)(SEQID No.59)和B1819D(5′-CTGGATCCCACGCTGCTGCG-3′)(SEQ IDNo.60)。将1033bp产物纯化,用XbaI-BamHI消化并且克隆到已经类似消化的pSL18-19AB,得到质粒pSL18-19ABCD。最后,将来自pEFBA(Lozano等人,2000)的阿泊拉霉素盒作为PstI片段切除并且克隆到用NsiI消化的pSL18-19ABCD以得到置换载体pSL18-19Apra。
通过如实施例5中描述的原生质体转化将置换载体pSL18-19Apra导入小链霉菌Tü4055。初步选择抗阿泊拉霉素(25μg/ml)的菌落,然后通过没有选择的MA培养基传代几次。得到若干阿泊拉霉素-敏感菌落,其中的两株产生疏螺旋体素,而其他的不产生。
从所有阿泊拉霉素敏感菌落提取染色体DNA并且最初通过PCR使用引物BLDA(5′-GGAGACTTACGGGGGATGC-3′)(SEQ ID No.61)和BLDB(5′-CTCCAGCAGCGACCAGAAC-3′)(SEQ ID No.62)检查,这些引物具有对装载组件(borA1)的选择性。从对照和这两株疏螺旋体素生产突变株观察到一个2.9kbp片段,但是非生产株系没有该片段。该结果是染色体中非特异缺失的情况和特征。
还通过PCR使用引物B19A(5′-CCCATGCATCACCGACATAC-3′)(SEQ ID No.63)和B19B(5′-GCGATATCCCGAAGAACGCG-3′)(SEQ IDNo.64)进一步分析这两株疏螺旋体素-生产菌落以便检查融合位点。方法如上所述。这两株菌落和对照都产生1010bp的PCR产物,但是用XbaI消化时,仅携带融合-生产突变的菌落下消化时得到600和400bp片段。疏螺旋体素-生产菌落仅一株含有该融合,而另一个已经回复到野生型。使用来自borA5的BamHI-XhoI内部片段作为探针对用XbaI和BclI消化的染色体DNA实施DNA分析以最后证实。对照和野生型回复体菌落显示出所预期的11.5kbp片段,而融合突变株显示出如所预期的7.8kbp片段。该新突变株称为小链霉菌Tü4055/borA4-A5。按照实施例1中描述的方案,表明小链霉菌Tü4055/borA4-A5产生的疏螺旋体素的滴定度为WT滴定度的26±5%。
实施例10PKS组件5和6的融合(小链霉菌Tü4055/borA5-A6)由于和上面实施例9相同的理由,并且以类似的反式实施该实验。除了基因水平上新的SpeI位点,这些orfs的融合还将额外的亮氨酸残基导入新蛋白质的融合位点。在该过程的第一步中,使用cosBoR19B9作为模板产生两种PCR片段。第一个PCR反应扩增borA5区域并且使用了引物B1920A(5′-GCCAAGCTTCCTCGACGCGC-3′)(SEQ ID No.65)和B1920B(5′-CACTAGTGCCTCACCCAGTT-3′)(SEQ ID No.66)。纯化804bp产物并且用HindIII-SpeI消化。第二个PCR反应扩增borA6区域并且使用引物B1920C(5′-CACTAGTGACGGCCGAAGCG-3′)(SEQ IDNo.67)和B1920D(5′-TCGGATCCGTCAGACCGTTC-3′)(SEQ IDNo.68)。纯化960bp产物并且用SpeI BamHI消化。然后将这两种纯化并且消化的基因产物一起克隆到已经用HindIII-BamHI消化的pOJ260以得到置换载体pOJF19-20。通过原生质体转化将pOJF19-20导入小链霉菌Tü4055以产生阿泊拉霉素抗性菌落。将一个该菌落通过没有选择的MA培养基传代若干次以便促进双重组。获得两个阿泊拉霉素敏感菌落,并且通过DNA杂交研究这些菌落的染色体DNA以检查3.2kbp BamHI片段(为了控制装载组件中不希望有的缺失)和3.4kbp SpeI-BamHI片段的存在以验证borA5-A6融合的正确导入(WT中为5.8kbp BamHI片段)。一个阿泊拉霉素菌落携带没有缺失的正确突变并且被称为小链霉菌Tü4055/borA5-A6。按照如实施例1中描述的方案,表明小链霉菌Tü4055/borA5-A6产生的疏螺旋体素的滴定度为WT滴定度的25±4%。
实施例11PKS组件4、5和6的融合(小链霉菌Tü4055/borA4-A5-A6)为了产生株系小链霉菌Tü4055/borA4-A5-A6,我们利用了前面获得株系小链霉菌Tü4055/borA4A5(实施例9)和质粒pOJF19-20(实施例10)。通过原生质体转化将pOJF19-20导入小链霉菌Tü4055/borA4-A5以得到阿泊拉霉素抗性菌落。将一个该菌落通过没有选择的MA培养基传代若干次以便促进双重组。获得一个阿泊拉霉素敏感菌落,并且通过DNA杂交研究该菌落的染色体DNA以检查3.2kbp BamHI片段(为了控制装载组件中不希望有的缺失)、3.4kbp SpeI-BamHI片段的存在以验证borA5-A6融合(WT中5.8kbp BamHI片段)和6.4kbp SpeI-XbaI的正确导入以验证在相同株系中存在两个融合borA4-A5和borA5-A6。按照实施例1中描述的方案,表明小链霉菌Tü4055/borA4-A5-A6产生的滴定度为WT滴定度的18+5%。
实施例12用疏螺旋体素PKS的组件5置换红霉素PKS组件4-产生环扩大的大环内酯实施例12描述用疏螺旋体素组件5置换红霉素组件4。认为在疏螺旋体素PKS内,疏螺旋体素组件5负责以反复的方式对甲基丙二酰辅酶A进行三轮缩合。以前,已经表明红霉素组件4偶然以反复的方式′错误′-掺入另一甲基丙二酰辅酶A以从红霉素PKS产生非常少量的16元大环内酯。在一种株系中,红霉素组件被疏螺旋体素组件5替代,通过如下置换策略并基于关于组件插入到红霉素PKS所描述的衍生方法(Rowe等人,2001)将该株系工程化最初,产生一系列质粒以便产生这样的质粒,其中疏螺旋体素组件5的侧翼是来自红霉素PKS的同源序列的适当区域。为了促进该操作,通过用PstI消化首先从pUC18的多接头处除去SbfI位点,用T4聚合酶对末端补平并重连接。通过限制酶消化鉴定该新质粒pCJM409。
通过将4个PCR片段连接在一起对SbfI片段分离疏螺旋体素组件5。通过使用cosBoR19B9的6062bp XcmI片段作为模板和引物CM384(5’-AACCTGCAGGTACCCCGGTGGGGTGCGGTCGCCCGA-3’)(SEQID No.69)和CM385(5’-CGCCGCACGCGTCGAAGCCAACGA-3’)(SEQID No.70)扩增疏螺旋体素组件5开始的~1.4kb产生PCRA。CM384在疏螺旋体素组件5的开始处保守氨基酸序列中导入一个SbfI位点。CM385掺入了天然存在的MluI位点,该位点用于克隆策略。将PCRA用T4多核苷酸激酶(T4PNK,NEB)处理并且克隆到预先用SmaI消化并用虾碱性磷酸酶(SAP,Roche)脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆插入片段,并通过测序验证一个正确克隆的插入片段。该质粒被指定为pCJM410。
通过使用cosBoR19B9的6062bp XcmI片段作为模板和引物CM386(5’-TGTGGGCTGGTCGTTGGCTTCGAC-3’)(SEQ ID No.71)和CM387(5’-GGTGCCTGCAGCGTGAGTTCCTCGACGGATCCGA-3’)(SEQ IDNo.72)扩增疏螺旋体素组件5邻近的~1.4kb产生PCRB。CM386结合到CM385所含有的同一MluI位点的上游,该位点用于克隆策略。CM387用于除去疏螺旋体素PKS组件5内部的SbfI位点而留下用于克隆的重叠PstI位点。将PCRB用T4PNK处理并克隆到预先用SmaI消化并用SAP脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆插入片段,并通过测序验证一个正确克隆的插入片段。该质粒被指定为pCJM411。
通过使用cosBoR19B9的6062bp XcmI片段作为模板和寡核苷酸CM388(5’-GAGGAACTCACCCTGCAGGCACCGCT-3’)(SEQ IDNo.73)和CM395(5’-CGAACGTCCAGCCCTCGGGCATGCGT-3’)(SEQID No.74)扩增疏螺旋体素组件5下游邻近的~1.5kb产生PCRC。CM388结合和CM387相同的SbfI位点,但是不被诱变并且保持该SbfI位点。CM395掺入一个用于克隆目的的SphI位点。将PCRC用T4PNK处理并克隆到预先用SmaI消化并用SAP脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆的插入片段,并通过测序验证一个正确克隆的插入片段。该质粒被指定为pCJM412。
通过使用cosBoR19B9的7211bp BbvCI片段作为模板和引物CM396(5’-TGGCACGCATGCCCGAGGGCTGGACGTT-3’)(SEQ ID No.75)和CM397(5’-TTTCCTGCAGGCCATGCCGACGATCGCGACAGGCT-3’)(SEQ ID No.76)扩增疏螺旋体素组件5下游邻近的~2.1kb产生PCRD。CM396含有用于克隆目的的SphI位点,CM397在疏螺旋体素组件5的末端保守氨基酸序列MxCR中导入一个SbfI位点。将PCRD用T4PNK处理并克隆到预先用SmaI消化并用SAP脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆插入片段,并通过测序验证一个正确克隆的插入片段,该质粒被指定为pCJM413。
如下将4种PCR产物(PCRA-D用于构建在SbfI片段上的疏螺旋体素组件5。
用SphI消化pCJM412并将分离的~1.5kb片段克隆到预先用SphI消化并且用SAP脱磷酸的pCJM413中。这产生质粒pCJM414,将其通过限制酶消化鉴定。
用SbfI消化pCJM414并将分离的~3.6kb片段克隆到预先用PstI消化并且用SAP脱磷酸的pCJM411中。这产生质粒pCJM415,将其通过限制酶消化鉴定。
用MluI和HindIIII消化pCJM410并将分离的~1.4kb片段克隆到预先用MluI和HindIIII消化的pCJM415中。这产生pCJM416,将其通过限制酶消化鉴定。pCJM416是一种基于pUC18的质粒,其含有作为SbfI片段的疏螺旋体素组件5。
为了通过置换策略将疏螺旋体素组件5导入红霉素PKS,如下掺入来自红霉素PKS的同源侧翼区域用于重组通过使用pIB023的6428bp XmnI片段作为模板和引物CM398(5’-AAACATATGGTCCTGGCGCTGCGCAACGGGGAACTG-3’)(SEQID No.77)和CM399(5’-TTTCCTGCAGGCGATGCCGACGATGGCGATGGGCT-3’)(SEQ ID No.78)扩增组件4KS紧挨着的上游的红霉素PKS的~3.3kb产生PCRE。CM398含有用于克隆目的的一个NdeI位点并且CM399在红霉素组件4开始的保守氨基酸序列M/IxCR中导入一个SbfI位点。将PCRE用T4PNK处理并克隆到预先用SmaI消化并用SAP脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆插入片段,并通过测序验证一个正确克隆的插入片段,该质粒被指定为pCJM417。
通过使用pIB023的7875bp XmnI/NheI片段作为模板和引物CM400(5’-AAACCTGCAGGTTCCCCGGCGACGTGGACTCGCCGGAGTCGTT-3’)(SEQ ID No.79)和CM401(5’-TTTTCTAGAGCGACGTCGCAGGCGGCGATGGTCACGCCCGT-3’)(SEQ ID No.No.80)扩增组件5KS紧挨着的下游的红霉素PKS的~3.4kb产生PCRF。CM400在红霉素组件4开始的保守氨基酸序列M/IxCR中导入一个SbfI位点,并且引物CM401含有用于克隆目的的一个XbaI位点。将PCRF用T4PNK处理并克隆到预先用SmaI消化并用SAP脱磷酸的pCJM409中。通过限制酶消化筛选以正向克隆插入片段,并通过测序验证一个正确克隆的插入片段。该质粒被指定为pCJM418。
用NdeI和SbfI消化pCJM417并且将~3.3kb片段克隆到用NdeI和SbfI消化pCJM418(~5.8kbp)以产生pCJM419,将其通过限制性消化图谱鉴定。pCJM419含有一个独特的SbfI位点,该位点可用于接受具有SbfI(或者PstI)侧翼位点的任一完整组件,该侧翼位点用于符合读框地将引入的组件精确地置于KS结构域的保守区域中。
从pCJM416克隆具有侧翼SbfI位点的疏螺旋体素组件5,将其作为SbfI片段克隆到pCJM419(已经用SAP脱磷酸)的该独特的SbfI位点以产生pCJM420,将其通过限制酶分析鉴定以证实插入片段的存在和正确方向。从而pCJM420含有具有同源侧翼区的疏螺旋体素组件5,以将疏螺旋体素组件5导入红霉素PKS的组件3和5之间的读框内。将全部插入片段作为NdeI/XbaI片段从pCJM420除去并且克隆到用NdeI和XbaI消化的pCJM24以产生最后的质粒pCJM421。pCJR24,并且因此pCJM421含有一个适宜的抗性标记用以选择红色糖多孢菌转化体。
质粒pCJM421用于转化红色糖多孢菌株系NRRL2338(野生型),和红色糖多孢菌DM(eryCIII-,eryBV-)原生质体(Yamamoto等人,1986;Rowe等人,1998)。选择具有硫链丝菌肽(50mg/L)抗性的整合体并且还通过DNA印迹分析整合体(典型地5-8)以证实这些株系是正确的并且鉴定整合位点。将两个正确的整合体在每种情况下在没有抗生素选择的TSB液体培养基中传代培养以便促进第二次重组。分离一些硫链丝菌肽敏感菌落并且通过PCR和DNA印迹分析,并且在每种情况下选择含有正确插入的新组件的菌落。这产生了株系红色糖多孢菌WT/421和红色糖多孢菌DM/421。
将株系红色糖多孢菌DM/421在适于产生红诺霉素的条件下培养(Wilkinson等人,2000)。使用LCMS方法分析发酵液提取物表明当与对照株系比较时存在两个新的明显峰,并且这两个峰的极性小于红诺霉素B的极性。它们的m/z分别是435.5(MNa+)和477.5(MNa+),这与产生新的环扩大红诺霉素B类似物相一致。m/z=435.5的化合物(7)与存在16-元环-扩大的红诺霉素B相关的大环内酯相一致,该大环内酯以前被报导为红色糖多孢菌WT发酵的次要组分(Wilkinson等人,2000);m/z=477.5的化合物(8)与环扩大两倍的红诺霉素B相关大环内酯(参见图8)相一致。本领域技术人员很清楚通过用适当的生物生物转化,或者通过株系红色糖多孢菌WT/421的发酵可以将这些新产物转化成抗细菌分子。本领域技术人员还清楚将这种组件包含到红霉素PKS的其他位置或者其他PKSs可以允许以类似方式产生新的、环扩大的聚酮化合物。
为产生该杂化PKS的一个备选策略是在含有全部杂化PKS的大质粒中掺入疏螺旋体素组件5以代替红霉素组件4,然后转化eryA-红色糖多孢菌株系。这种适当存在的eryA-是红色糖多孢菌JC2(Rowe等人,1998)和含有处于actI启动子下的eryA基因的质粒pIB023其也含有一个硫链丝菌肽抗性基因和actII-ORF4激活子。如下实施该策略用NdeI和BsmI消化pIB023并且将该13.4kbp片段克隆到用NdeI和BsmI消化的pCJM419以产生质粒pCJM425。用BbvCI和XbaI消化pIB023并且将该约6kbp片段克隆到用BbvCI和XbaI消化的pCJM425以产生质粒pCJM426。将来自pCJM426的NdeI/XbaI片段克隆到用NdeI和XbaI消化的pCJM395。pCJM395是通过将pCJR24用SbfI消化,用T4聚合酶末端补平并重连接得到的一种质粒,其是没有用SbfI切割的pCJR24的一种形式。所得质粒pCJM427含有红霉素PKS的工程化形式,其中组件4被除去。该主链准备接受具有适宜的侧翼位点(SbfI或者PstI)的任一完整组件以产生杂化PKS。用SbfI消化pCJM427,用SAP使主链脱磷酸,并连接到来自pCJM416的SbfI片段中而产生pCJM430。
质粒pCJM430用于转化红色糖多孢菌JC2。选择具有硫链丝菌肽(50mg/L)抗性的整合体并且还通过DNA印迹分析整合体(一般5-8个)以证实这些株系是正确的并且鉴定整合位点。将所得正确的株系红色糖多孢菌JC2/430培养在适于产生红霉素的条件下(Wilkinson等人,2000)并分析新化合物7&8的产生。
实施例13borB(小链霉菌Tü4055/borB∷aac3(IV))的破坏为了破坏borB,通过PCR使用引物B5B(5-‘AACTAGTCCGCAGTGGACCG-3’)(SEQ ID No.91)和B5A(5’-TCGATATCCTCACCGCCCGT-3’)(SEQ ID No.92)和粘粒BoR32A2作为模板扩增含有borB的一个2751bp的区域。将PCR产物纯化,然后在侧翼位点SpeI-EcoRV消化并亚克隆到用相同限制酶消化的pSL1180以产生pSLB。将含有borB的5′-末端的来自pSLB的一个SpeI-AgeI片段(后一位点在插入片段的内部)亚克隆到pEFBA的SpeI-XmaI位点(位于阿泊拉霉素内抗性基因aac(3)IV的上游)以产生pEB1。将含有borB的3′-末端的来自pSLB的一个BsaAI-EcoRV片段(前一位点在插入片段的内部)以正确方向亚克隆到pEB1的aac(3)IV下游EcoRV位点,以产生pEB2。这样,borB内部的一个741bp AgeI-BsaAI片段被缺失并被aac(3)IV替代。最后,从pEB2拯救SpeI-EcoRV片段并与含有来自pLHyg的hyg基因的PstI-SpeI片段一起亚克隆到pSL1180的PstI-EcoRV位点以产生pSLBR1。使用该方法是为了避免可能的极化效应。
通过如实施例5中描述的原生质体转化将载体pSLBR1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将该新突变株称为小链霉菌Tü4055/borB∷aac3(IV)。如实施例1中描述的生长、提取物和分析株系小链霉菌Tü4055/borB∷aac3(IV)。观察疏螺旋体素产生并与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borB∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
实施例14borC(小链霉菌Tü4055/borC∷aac3(IV))的破坏为了破坏borC,通过PCR使用引物B6B(5’AACTAGTGTGGCAGACGGTC-3’)(SEQ ID No.93)和B5A(5’-TCGATATCCTCACCGCCCGT-3’)(SEQ ID No.94)和粘粒BoR32A2作为模板扩增含有borC的一个3553bp的区域。将PCR产物纯化,然后在侧翼位点SpeI-EcoRV消化并亚克隆到pSL1180的相同限制位点以产生pSLC。将来自质粒pSLC的SpeI-SphI和BalI-EcoRV片段(分别含有borC的5′-末端和3′-末端)以正确的方向逐步克隆到pEFBA的SpeI-SphI和EcoRV位点。这样,borC的302bp SphI-BalI内部片段被aac(3)IV基因替代。然后用SpeI和EcoRV消化所得质粒并将所得片段与如上所述的hyg基因一起亚克隆到pSL1180,产生最后的构建体pSLCr1。使用该方法是为了避免可能的极化效应。
通过如实施例5中描述的原生质体转化将载体pSLCr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将该新突变株称为小链霉菌Tü4055/borC∷aac3(IV)。如实施例1中描述的生长、提取物和分析株系小链霉菌Tü4055/borC∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borC∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borC的一个全长拷贝反式导入该破坏的突变株。通过PCR使用引物B6T1(5′-CGGATGCATCACCGGCACGG-3′)(SEQ ID No.95)和B6T2(5’-TGGGATCCGCGGGGCGGTAC-3’)(SEQ ID No.96)并使用粘粒BoR32A2作为模板扩增全长borC。纯化943bp产物并用NsiI-BamHI消化并和来自pLHyg(携带hyg基因)的BamHI-SpeI片段一起亚克隆到预先用PstI-XbaI消化的pIJ2925。然后分离BglII片段(使用来自载体的该位点)并以正确的方向亚克隆到pEM4以定位处于启动子ermE*控制下的borC。通过如实施例5中描述的原生质体转化将质粒pborCH和对照质粒pEM4导入小链霉菌Tü4055/borC∷aac(3)IV。如实施例1中描述的分析所得株系小链霉菌Tü4055/borC∷aac(3)IV/pborCH并且表明其产生疏螺旋体素的滴定度与WT对照的相似。
实施例15borD的破坏(小链霉菌Tü4055/borD∷aac3(IV))
为了破坏borD,通过PCR使用引物BBB(5’AACTAGTGCGATCCCGGGGA-3’)(SEQ ID No.97)和BBA(5’-CGTCGATATCCTCCAGGGGC-3’)(SEQ ID No.98)和粘粒BoR32A2作为模板扩增一个2777bp的片段。将PCR产物纯化,然后用SpeI-EcoRV消化并亚克隆到pSL1180以产生pSLD。用NdeI-StuI将其消化以删除borD的一个内部679bp区域,该区域被从含有aac(3)IV基因的pEFBA分离的一个SmaI-NdeI片段替代。用SpeI-EcoRV消化所得构建体并将4.3kb片段与来自含有hyg基因的pLHyg的PstI-SpeI片段一起亚克隆到用PstI-EcoRV消化的pSL1180。这一步导致最终的质粒pSLDr1。使用该方法是为了避免可能的极化效应。
通过如实施例5中描述的原生质体转化将载体pSLDr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将该新突变株命名为小链霉菌Tü4055/borD∷aac3(IV)。如实施例1中描述的生长提取和分析株系小链霉菌Tü4055/borD∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borD∷aac3(Ⅳ)在化学上与反式-1,2-二环戊烷二羧酸互补。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borD的一个全长拷贝反式导入该破坏的突变株。通过PCR使用引物BBT1(5′-TACTGCAGCACACCCGGTGC-3′)(SEQ ID No.99)和BBT2(5’-TGGGATCCGCTGTGTCATAT-3’)(SEQ ID No.100)并使用粘粒BoR32A2作为模板扩增全长borD。纯化816bp PCR产物并用PstI-BamHI消化,并和含有来自pLHyg的hyg基因的BamHI-SpeI片段一起亚克隆到用PstI-XbaI消化的pIJ2925以产生pIJDH。然后将来自pIJDH的BglII片段(使用来自载体的该位点)以正确的方向亚克隆到pEM4(用BamHI预先消化)以产生pborDH。通过如实施例5中描述的原生质体转化将质粒pborDH和对照质粒pEM4导入小链霉菌Tü4055/borD∷aac(3)IV。如实施例1中描述的分析所得株系小链霉菌Tü4055/borD∷aac(3)IV/pborDH并且表明其产生的疏螺旋体素滴定度类似于WT对照的滴定度。
实施例16borE的破坏(小链霉菌T ü4055/borE∷aac3(IV))为了破坏borE,通过PCR使用引物B25A(5′-TTCTGCAGCCGCGGCCTTCG-3′)(SEQ ID No.81)和B25B(5′-AGAATTCGCCGGCGCCGCTG-3′)(SEQ ID No.82)并使用cosBoR32A2作为模板扩增该基因的一个内部761bp片段。将产物纯化,用PstI-EcoRI消化并克隆到已经同样消化的pOJ260ermE*以提供pOJEd1。使用该方法是为了避免可能的极化效应。通过如实施例5中描述的原生质体转化将载体pOJEd1导入小链霉菌Tü4055,并在R5上然后在MA琼脂上筛选阿泊拉霉素抗性菌落。通过DNA杂交验证破坏并将该新突变株命名为小链霉菌Tü4055/borE∷aac3(IV)。如实施例1中描述的生长、提取并分析株系小链霉菌Tü4055/borE∷aac3(IV)。没有观察到疏螺旋体素产生而野生型对照产生所预期的疏螺旋体素。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borE的一个全长拷贝反式导入该破坏的突变株。通过PCR使用引物B7T1(5′-GGCTGCAGACGCGGCTGAAG-3′)(SEQ ID No.83)和B7T2(5′-CCGGATCCCAGAGCCACGTC-3′)(SEQ ID No.84)并使用cosBoR32A2作为模板扩增全长borE。将该1216bp产物纯化、用PstI-BamHI消化并与含有潮霉素抗性盒的来自pLHyg的BamHI-SpeI消化的片段一起克隆到PstI-XbaI消化的pIJ2925(Janssen & Bibb,1993)以产生pIJEH。从pIJEH切除一个2.8kbp BamHI片段并克隆到已经被同样消化的pEM4(Quiros等人,1998)以产生pborEH(其中为了基因表达,borE基因以正确方向被克隆)。通过实施例5中描述的原生质体转化将pborEH和对照质粒pEM4导入小链霉菌Tü4055/borE∷aac(3)IV。如实施例1中描述的分析所得株系小链霉菌Tü4055/borE∷aac(3)IV/pborEH并且表明其产生的疏螺旋体素的滴定度类似于WT对照;对照株系小链霉菌Tü4055/borE∷aac(3)IV/pEM4不产生疏螺旋体素。
按照实施例1中描述的方案表明小链霉菌Tü4055/borE∷aac3(IV)与反式-1,2-二环戊烷二羧酸化学互补,这表明如此生长的株系能够产生的疏螺旋体素产量为WT亲本对照的122±23%。从而,borE是反式-环戊烷-1,2-二羧酸的生物合成所需的。
实施例17borF的破坏(小链霉菌Tü4055/borF∷aac3(IV))为了破坏borF,通过PCR使用引物BCB(5’CACTAGTCCTCGCCGGGCAC-3’)(SEQ ID No.101)和BCA(5’-GAGGATCCCGGTCAGCGGCA-3’)(SEQ ID No.102)和粘粒BoR32A2作为模板扩增含有borF的一个区域。将所得2132bp产物纯化,然后用SpeI-BamHI消化并亚克隆到pSL1180的相同限制位点产生pSLF。然后将来自pEFBA的aac(3)IV基因作为SphI片段亚克隆到pSLF的SphI位点,该位点位于borF编码区的内部。最后,将BamHI-SpeI片段亚克隆到用BamHI-NheI消化的pLHyg以产生pLHFr1。
通过如实施例5中描述的原生质体转化将载体pLHFr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并且将该新突变株命名为小链霉菌Tü4055/borF∷aac3(IV)。如实施例1中描述的生长、提取并且分析株系小链霉菌Tü4055/borF∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055borF∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borF的一个全长拷贝反式导入该破坏的突变株。通过PCR使用引物BCT1(5′-GCCTGCAGCGACCTCGCCGG-3′)(SEQ ID No.103)和BCT2(5’-CGGGATCCCGTGGCGTGGTC-3’)(SEQ ID No.104)并使用粘粒BoR32A2作为模板扩增全长borF。该1048bp PCR产物纯化然后用PstI-BamHI消化并和如上所述的hyg基因一起亚克隆到pIJ2925。然后分离BglII片段并亚克隆到pEM4以产生pborFH。这用于互补株系SPMF。通过如实施例5中描述的原生质体转化将质粒pborFH和对照质粒pEM4导入小链霉菌Tü4055borF∷aac(3)IV。如实施例1中描述的分析所得株系小链霉菌Tü4055/borF∷aac(3)IV/pborFH并且表明其产生的疏螺旋体素的滴定度与WT对照的相似。
实施例18borG的破坏(小链霉菌Tü4055/borG∷aac3(IV))为了破坏borG,通过PCR使用引物B23A(5’-ATCTGCAGCGGCATCGGTGT-3’)(SEQ ID No.105)和B23B(5’-AGAATTCTCCACTGCGGTCG-3’)(SEQ ID No.106)和粘粒BoR32A2作为模板扩增885bp的内部区域。纯化所得产物并在侧翼位点PstI-EcoRI消化然后亚克隆到pOJ260P中启动子ermE*的下游以产生pOJGd1。
通过如实施例5中描述的原生质体转化将载体pOJGd1导入小链霉菌Tü4055。在MA琼脂上筛选阿泊拉霉素抗性菌落。通过DNA杂交验证破坏并将该新突变株命名为小链霉菌Tü4055/borG∷aac3(IV)。如实施例1中描述的生长、提取并分析株系小链霉菌Tü4055/borG∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borG∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
实施例19borH的破坏(小链霉菌Tü4055/borH∷aac3(IV))为了破坏borH,通过PCR使用引物B9A(5’-ACCTGCAGGCCGGGCTCATC-3’)(SEQ ID No.107)和B9B(5’-AGAATTCGGGCGAGCCGCCG-3’)(SEQ ID No.108)和粘粒BoR32A2作为模板扩增697bp的内部区域。纯化所得产物并用PstI-EcoRI消化然后亚克隆到pOJ260P中启动子ermE*的下游以产生pOJHd2。
通过如实施例5中描述的原生质体转化将载体pOJHd2导入小链霉菌Tü4055。在MA琼脂上筛选阿泊拉霉素抗性菌落。通过DNA杂交验证破坏并将该新突变株命名为小链霉菌Tü4055/borH∷aac3(IV)。如实施例1中描述的生长、提取并分析株系小链霉菌Tü4055/borH∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borH∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
实施例20borI的破坏(小链霉菌Tü4055/borI∷aac3(IV))使用PCR引物BP4501(5′-CGTATGCATGGCGCCATGGA-3′)(SEQID No.85)和BP4502(5′-AGCCAATTGGTGCACTCCAG-3′)(SEQ IDNo.86)从cosBoR19B9扩增基因borI和周围DNA。纯化2.32kbp产物,用NsiI-MfeI消化并克隆到NsiI-EcoRI消化的pSL1180以产生质粒pSLI。将阿泊拉霉素抗性盒作为EcoRI片段从pEFBA切除并克隆到用EcoRI消化的pSLI以产生质粒pSLIA。最后,从pLHyg切除SpeI-PstI潮霉素抗性盒并克隆到已经用NsiI-SpeI消化的pSLIA以产生质粒pSLIr1。
通过如实施例5中描述的原生质体转化将置换载体pSLIr1导入小链霉菌Tü4055。选择阿泊拉霉素(25μg/ml)抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将该新突变株命名为小链霉菌Tü4055/borI∷aac3(IV)。
如实施例1中描述的生长并分析小链霉菌Tü4055/borI∷aac3(IV)。没有观察到疏螺旋体素产生而观察到明显较低水平的一些新化合物。极性较小的化合物之一表现出240nm处UV吸收最大值,LCMS分析表明m/z比疏螺旋体素的低11个质量单位,这与在C12存在甲基而不是腈基团相一致。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borI的一个全长拷贝反式导入该破坏的突变株。从pSLI回收含有borI的2.1kbNsiI-AvrII片段并将其与含有hyg基因的来自pLHyg的NheI-SpeI片段一起亚克隆到pEM4的PstI-XbaI位点。两种片段以相同方向亚克隆,产生pborIH。如实施例5中描述的原生质体转化将质粒pborIH和对照质粒pEM4导入小链霉菌Tü4055/borI∷aac(3)IV。如实施例1和4中描述的分析所得株系小链霉菌Tü4055/borI∷aac(3)IV/pborIH,并且表明其产生的疏螺旋体素滴定度类似于WT对照的。
实施例21borJ的破坏(小链霉菌Tü4055/borJ∷aac3(IV))使用PCR引物BNHT1(5′-GTCATGCATCAGCGCACCCG-3′)(SEQID No.87)和BNHT2(5′-GTGCAATTGCCCTGGTAGTC-3′)(SEQ IDNo.88)从cosBoR19B9扩增基因borJ和周围DNA。纯化2.75kbp产物,用NsiI-MfeI消化并克隆到已经用NsiI-EcoRI消化的pSL1180以产生质粒pSL。从pLHyg切除潮霉素抗性盒作为PstI-SpeI片段并克隆到用NsiI-SpeI消化的pSL以产生pSLJH。最后,用SpeI-BamHI从pEFBA切除该阿泊拉霉素抗性盒并克隆到已经用AvrII-BglII预消化的pSLJH以便从borJ除去453bp片段,产生质粒pSLJr1。
通过如实施例5中描述的原生质体转化将置换载体pSLJr1导入小链霉菌Tü4055。选择阿泊拉霉素(25μg/ml)抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换。该新突变株被命名为小链霉菌Tü4055/borJ∷aac3(IV)。
如实施例1中描述的生长并分析小链霉菌Tü4055/borJ∷aac3(IV)。没有观察到疏螺旋体素产生,但是观察到一种比疏螺旋体素更具极性的新化合物,其在262nm具有最大UV吸收。LCMS分析表明其是508amu的一种母体化合物,这与在C12为羧酸而非腈官能相一致。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borJ的一个全长拷贝反式导入该破坏的突变株。将含有borJ的来自pSLJ的一个2.4kb NsiI-SphI片段与来自pLHyg的hyg基因的SphI-SpeI片段一起亚克隆到pEM4的PstI-XbaI位点;两个片段以和基因转录相同的方向亚克隆。最终构建体设计为pborJH。通过如实施例5中描述的原生质体转化将质粒pborJH和对照质粒pEM4导入小链霉菌Tü4055/borJ∷aac(3)IV。如实施例1和4中描述的分析所得株系小链霉菌Tü4055/borI∷aac(3)IV/pborIH,并且表明其产生的疏螺旋体素滴定度类似于WT对照的。
实施例22borK的破坏(小链霉菌Tü4055/borK∷aac3(IV))为了破坏borK,通过PCR使用引物B231(5’-ATCAAGCTTCGTGTCCATGG-3’)(SEQ ID No.109)和B232(5’-GTCATGCATCAGGCGTTCGG-3’)(SEQ ID No.110)和粘粒BoR19B9作为模板扩增一个2680bp片段。纯化所得PCR产物并将其用HindIII-NsiI消化并亚克隆到pSL1180的相同位点以产生pSLK。MluI消化pSLK并用Klenow片段处理后,将来自pEFBA的aac(3)IV基因作为SmaI-EcoRV片段亚克隆,导致pSLKa。最后,将含有hyg基因的来自pLHyg的PstI-SpeI片段亚克隆到NsiI-XbaI消化的pSLKa得到pSLKr1。
通过如实施例5中描述的原生质体转化将载体pSLKr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并且将该新突变株命名为小链霉菌Tü4055/borK∷aac3(IV)。如实施例1中描述的生长、提取和分析株系小链霉菌Tü4055/borK∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borK∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borK的一个全长拷贝反式导入该破坏的突变株。将来自pSLK的2.2kb BglII(钝末端化)-NsiI片段与含有hyg基因的来自pLHyg的1.6kb PstI-SpeI片段一起亚克隆到用PstI(用Klenow片段处理)然后XbaI消化的pEM4中。该最终载体被命名为pborKH。通过如实施例5中描述的原生质体转化将质粒pborKH和对照质粒pEM4导入小链霉菌Tü4055/borK∷aac(3)IV。如实施例1和4中描述的分析所得株系小链霉菌Tü4055/borK∷aac(3)IV/pborKH,并且表明其产生的疏螺旋体素滴定度类似于WT对照的。
实施例23borL的破坏(小链霉菌Tü4055/borL∷aac3(IV))为了破坏borL,将cosBoR19B9的3.95kbp片段(其含有全长borL)亚克隆到同样消化的pSL1180。通过限制性消化分析所得克隆并选择表现出正确方向的一个克隆以提供pSL395。用NheI并SpeI消化pSL395,并随后再连接以除去borM的包括BglII位点的一个片段,产生pSLL。用KpnI从pEFBA(Lozano等人,2000)切除阿泊拉霉素抗性盒并将其克隆到已用KpnI消化的pSL,产生pSLLA。将pSLLA用BglII消化然后按照生产商的指导(Roche)进行klenow处理;然后将从pLHyg分离的含有潮霉素抗性盒的EcoRV片段克隆到该制备的载体以产生pSLLr1。
通过原生质体转化将置换载体pSLL r1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换。该新突变株被命名为小链霉菌Tü4055borL∷aac3(IV)。
如实施例1中描述的生长、提取并分析小链霉菌Tü4055/borL∷aac3(IV)。没有观察到疏螺旋体素产生而野生型对照产生所预期的疏螺旋体素。使用如实施例1中描述的天然起始酸对小链霉菌Tü4055/borL∷aac(IV)的化学互补表明如此生长的株系能够产生的疏螺旋体素为WT亲本对照滴定度的408±70%。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borL的一个全长拷贝反式导入该破坏的突变株。如实施例30中描述的产生含有全长borL的载体。通过如实施例5中描述的原生质体转化将质粒pborLH和对照质粒pEM4导入小链霉菌Tü4055/borL∷aac(3)IV。如实施例1中描述的分析所得株系小链霉菌Tü4055/borL∷aac(3)IV/pborLH。
实施例24borM的破坏(小链霉菌Tü4055/borM∷aac3(IV))为了破坏borM,通过PCR使用引物B251(5’-CTTCTAGATGAACCCCTCCA-3’)(SEQ ID No.111)和B252(5’-GGGCAATTGCGCGGCAGCTT-3’)(SEQ ID No.112)和粘粒BoR19B9作为模板扩增一个含有borM的2870bp片段。将所得产物纯化,然后用XbaI-MfeI消化并亚克隆到pSL1180的XbaI-EcoRI位点,产生pSLM。然后将borM的内部780bp SphI-NheI片段用通过从pEFBA亚克隆的作为SpeI-XbaI片段的aac(3)IV基因替代,产生pSLMA。用NsiI-XbaI消化pSLMA并与来自pLHyg的SpeI片段的hyg基因亚克隆以产生pSLMr1。
通过如实施例5中描述的原生质体转化将载体pSLMr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将新突变株命名为小链霉菌Tü4055/borM∷aac3(IV)。如实施例1中描述的生长、提取并分析株系小链霉菌Tü4055/borM∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borM∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
为了验证没有导入极化效应,将处于ermE*启动子控制下的borM的一个全长拷贝反式导入该破坏的突变株。将全长borM作为来自pSLM的2.0kb XbaI-AgeI片段并和来自pLHyg的作为XmaI-EcoRV片段的hyg基因一起亚克隆到pEM4的EcoRI(用Klenow填充末端)-XbaI,产生pborMH。通过如实施例5中描述的原生质体转化将质粒pborMH和对照质粒pEM4导入小链霉菌Tü4055/borM∷aac3(IV)。如实施例1中描述的分析所得株系小链霉菌Tü4055/borM∷aac(3)IV/pborMH,并且表明其产生的疏螺旋体素滴定度类似于WT对照的。
实施例25borN的破坏(小链霉菌Tü4055/borN∷aac3(IV))为了破坏borN,将来自pSLM的1201bp BamHI片段(含有borM的3′末端和borN的头161个密码子)以正确方向亚克隆到pSL1180的BglII-BamHI位点以产生pSLMN。将来自pborOR(见下文)的含有borO的BamHI-EcoRI片段(使用来自多接头的位点)亚克隆到pSLMN的BamHI-EcoRI位点,产生pSLNO。用EcoRI消化pSLNO并用Klenow片段填充末端后,从pLHyg亚克隆作为EcoRV片段的hyg基因,得到pSLNOH。最后,将aac3(IV)基因作为来自pEFBA的NcoI-BamHI片段亚克隆到用相同限制酶消化的pSLNOH,产生pSLNr1。
通过如实施例5中描述的原生质体转化将载体pSLNr1导入小链霉菌Tü4055。选择阿泊拉霉素抗性菌落,然后通过没有选择的MA培养基传代若干次。通过DNA杂交验证置换并将新命名为小链霉菌Tü4055/borN∷aac3(IV)。如实施例1中描述的生长、提取和分析株系小链霉菌Tü4055/borN∷aac3(IV)。将疏螺旋体素产量与野生型对照比较。此外,按照实施例1中描述的方案,小链霉菌Tü4055/borN∷aac3(IV)与反式-1,2-二环戊烷二羧酸在化学上互补。
实施例26borO在白色链霉菌J1074中的异源表达为了研究推定的抗性蛋白BorO是否对疏螺旋体素敏感生物赋予抗性,在白色链霉菌J1074中表达borO。通过PCR使用引物BTRNAS1(5′-TGTCTAGACTCGCGCGAACA-3′)(SEQ ID No.89)和BTRNAS2(5′-TGAATTCCGAAGGGGGTGGT-3′)(SEQ ID No.90)并使用cosBoR19B9作为模板扩增基因borO。纯化产物,用XbaI-EcoRI消化并克隆到已经类似地消化的pEM4A以产生质粒pborOR,该质粒使borO处于启动子ermE*的控制下。通过原生质体转化(Chater & Wilde,1980)将载体pborOR导入白色链霉菌J1074并选择阿泊拉霉素抗性。该新株系被命名为白色链霉菌J1074/pborOR。
在含有25μg/ml阿泊拉霉素的贝纳特氏琼脂上测定疏螺旋体素抗性。将白色链霉菌J1074/pborOR和对照白色链霉菌J1074/pEM4A的孢子涂在平板上,然后将含有100 & 200μg/ml疏螺旋体素的圆盘放置在孢子菌苔上并在30℃过夜孵育。对于含有pEM4A的对照株系观察到指示生长抑制的晕圈,但是对于白色链霉菌J1074/pborOR却没有观察到。
实施例27borG和borI的破坏(小链霉菌Tü4055/borG∷aac3(IV)/borI∷hyg)从pLHyg分离作为EcoRV片段的hyg基因并克隆到用EcoRI消化且用Klenow片段处理的pSLI(实施例20)以产生pSLIH;以和borI相同的方向克隆hyg基因。通过如实施例5中描述的原生质体转化将pSLIH导入小链霉菌Tü4055/borG∷aac3(IV),并选择阿泊拉霉素和潮霉素抗性,然后通过没有选择的MA培养基传代若干次以便促进双重组。通过DNA杂交和PCR分析阿泊拉霉素和潮霉素抗性菌落以验证置换。
实施例28borG和borJ的破坏(小链霉菌Tü4055/borG∷aac3(IV)/borJ∷hyg)从pLHyg分离作为EcoRV片段的hyg基因并且克隆到用AvrII-BglIII消化且用Klenow处理的pSLJ(实施例21)以产生pSLJH;以和borI相同的方向克隆hyg基因。通过如实施例5中描述的原生质体转化将pSLJH导入小链霉菌Tü4055/borG∷aac3(IV),并选择阿泊拉霉素和潮霉素抗性,然后通过没有选择的MA培养基传代若干次以便促进双重组。通过DNA杂交和PCR分析阿泊拉霉素和潮霉素抗性菌落以验证置换。
实施例29小链霉菌Tü4055中BorE上调产生的影响为了研究反式-1,2-环戊烷二羧酸起始单元可能对于疏螺旋体素产生具有限制性影响,将borE在亲本株系中上调并分析对疏螺旋体素滴定度的影响。所用的载体pborEH在实施例16中描述。
载体pborEH和pEM4(对照)用于转化小链霉菌Tü4055的原生质体以分别得到株系小链霉菌Tü4055/pborEH和小链霉菌Tü4055/pEM4。从每次转化挑选一些菌落,将它们一式三份地生长,然后如实施例1中描述的分析。与对照株系相比,borE的上调引起疏螺旋体素滴定度增加4.2±0.3倍。
实施例30小链霉菌Tü4055中BorL上调产生的影响为了研究borL在疏螺旋体素的生产中可能具有调节功能或者某种其他相关功能,将该基因在亲本株系中上调并分析对疏螺旋体素滴定度的影响。
如下产生表达载体pborLH将pSLL用NotI消化,用Klenow片段处理然后用BamHI消化得到含有borL的2190bp片段。将该片段与来自pLHyg的BamHI-SpeI hyg基因一起亚克隆到用PstI(用Klenow处理)-XbaI消化的pEM4,得到pborLH。
载体pborLH和pEM4(对照)用于转化小链霉菌Tü4055的原生质体以分别得到株系小链霉菌Tü4055/pborLH和小链霉菌Tü4055/pEM4。从每次转化挑选一些菌落,将它们一式三份地生长,然后如实施例1中描述的分析。与对照株系相比,borL的上调引起疏螺旋体素滴定度增加4.3±0.7倍。
实施例3112-脱腈-12-甲基疏螺旋体素14(前-疏螺旋体素)的产生如实施例1中描述的将小链霉菌Tü4055/borI∷aac3(IV)的工作原种(0.5ml)接种到NYG的原代营养性预培养物中。制备继代预培养物(如实施例1,但是使用2升锥形烧瓶中的250ml NYG)。如实施例1制备PYDG生产培养基(4升)并加入0.01% Plutronic L0101以控制泡沫,将该培养基用继代预培养物接种(12.5%接种物)。平行地安装另一个发酵罐,该发酵罐含有中点(centre-point)培养基(4升)和用于控制泡沫的0.01% PlutronicL0101,并将该发酵罐用继代预培养物(12.5%接种物)接种。中点生产培养基每升去离子水含有Tesco氏脱脂奶粉(1.5%),Avidex W-80(4.5%),葡萄糖(0.5%)和酵母自溶物(0.15%),用5M NaOH调节到pH7.0。
这些批的每一批都在7升Applikon发酵罐中30℃下发酵6.5天。气流设定为0.75vvm(体积/体积/分钟),挡板倾斜,并且叶轮速度控制在400到800转/分钟以保持溶解氧张力为空气饱和度的30%或以上。不进一步加入抗泡沫剂。发酵22小时后,通过内嵌的滤器(0.22μm)将起始酸即反式-环戊烷-1,2-二羧酸作为1∶1MeOH/5M NaOH中和的溶液加入。发酵罐中外源起始酸的终浓度为0.5mM。
发酵6.5天后,合并发酵液并用浓盐酸(~6ml)酸化到pH3.5,然后通过以3,500转/分钟离心10分钟澄清。将上清液萃取到乙酸乙酯(3×1体积当量,每次4小时)并将细胞沉淀在甲醇中浸渍(2×1.5升,每次4小时)。将有机物合并并在减压下除去以得到焦油状树胶。将树胶重悬在0.1M硼砂缓冲液(500ml,pH9.4)并用己烷(500ml)和乙酸乙酯(500ml)洗涤。然后将水相用浓盐酸酸化到pH3.5并用乙酸乙酯(3×500ml)萃取,将其合并并干燥。将所得树胶溶于甲醇(15ml),用水(285ml)稀释,并在重力下加入C18-反相柱(50g,在5%水性甲醇中制备)。将柱用20%和50%水性甲醇洗涤(每次300ml),并用100%甲醇(500ml)洗脱。将最后的部分减压下干燥得到黑色树胶状油(600mg),将其置于甲醇中。最后通过连续的制备性反相HPLC(用实施例4的移动相洗脱,不加TFA,在40%B等梯度洗脱)纯化该残渣。合并活性级分并在C18-柱(1g)上脱盐,得到28mg黑色油(3.5mg/l分离的产率)。表12概述了CDCl3中12-脱腈-12-甲基疏螺旋体素14的1H和13C NMR化学偏移数据。
表12
化学偏移参照CDCl3(对于1H在7.26ppm下,对于13C在77.0ppm下)
实施例3212-脱腈-12-羧基疏螺旋体素2的产生如实施例1中描述的将小链霉菌Tü4055/borJ∷aac3(IV)的工作原种(0.5ml)接种到NYG的原代营养性预培养物中。制备继代预培养物(如实施例1,但是使用2升锥形烧瓶中的250ml NYG)。如实施例1制备PYDG生产培养基(4升)并加入0.01% Plutronic L0101以控制泡沫,将该培养基用继代预培养物接种(10%接种物)。将其在7升Applikon发酵罐中30℃下发酵6天。气流设定为0.75vvm,挡板倾斜,并且叶轮速度控制在250到600转/分钟以保持溶解氧张力为空气饱和度的30%或以上。不进一步加入抗泡沫剂。和上面完全一样实施另一发酵,但是接种60小时后每12小时用0.2mol葡萄糖水溶液分批补料。
发酵6天后,收获发酵产物并合并。通过离心(3,500转/分钟,10分钟)澄清发酵液。将所得上清液用10M HCl(aq)酸化到pH~3.5。然后通过搅拌将该溶液萃取到乙酸乙酯(3×1体积当量,每次4小时)。将细胞沉淀在1∶1甲醇/乙酸乙酯(500ml)中浸渍提取两次。将所有有机物合并并在减压下除去以得到水性浆液。将该浆液用水稀释到500ml,用10M HCl盐酸酸化到pH~3.5并萃取到乙酸乙酯(3×300ml)中。将有机物减压下浓缩到~300ml并用0.1M硼砂(3×150ml,pH=9.4)萃取。用10M HCl将合并的硼砂溶液酸化到pH~3.5并用6×300ml乙酸乙酯萃取。分析性HPLC表明一些积累物仍然保留在硼砂溶液,因此将该溶液在重力下加到C18-反相柱(50g)。用水洗涤柱并用100%甲醇洗脱积累物。将含有积累物的有机物合并并减少到40ml甲醇溶液。将该溶液加到Sephadex LH-20柱(70g,在甲醇中过夜膨胀,柱60cm×2.5cm),用100%甲醇洗脱柱子;合并活性级分并干燥。然后将该物质通过制备性反相HPLC(用实施例4的移动相洗脱,不加TFA,在40%B等梯度洗脱)进一步处理。合并活性级分并干燥,溶于甲醇(4ml)并用水洗脱(200ml)。将该混合物分成2个相等级分,并且每一级分在重力下加到C18-反相柱(20g)。然后用5%、10%、20%、30%、40%、50%、60%、75%、90%和100%水性甲醇的3个柱体积洗脱。积累物在60%到100%甲醇的所有级分被洗脱,将这些级分合并并干燥。然后将积累物(溶于DMSO)最后通过连续制备性反相HPLC(用用于实施例4的移动相洗脱,不加TFA,在40%B等梯度洗脱)纯化。合并活性级分并在C18-柱(1g)上脱盐,得到17mg褐色油(2.1mg/l分离的产率)。表13概述了d4-甲醇中12-脱腈-12-羧基疏螺旋体素2的1H和13C NMR化学偏移数据。
表13
化学偏移参照甲醇(对于1H在3.35ppm(五重峰)下,对于13C在49.0ppm(七重峰)下);*被溶剂信号d4-甲醇模糊。
实施例33通过突变合成产生17-脱-(环戊烷-2’-羧酸)-17-(环丁烷-2’-羧酸)疏螺旋体素18如实施例1中描述的将小链霉菌Tü4055/borE∷aac3(IV)的工作原种(0.5ml)接种到NYG的原代营养性预培养物中。制备继代预培养物(如实施例1,但是使用2升锥形烧瓶中的250ml NYG)。如实施例1制备PYDG生产培养基(4升)并加入0.01% Plutronic L0101以控制泡沫,将该培养基用继代预培养物接种(12.5%接种物)。以相同方式安装另外两个生物反应器。这些批的每一批都允许在7升Applikon发酵罐中30℃下发酵5天。气流设定为0.75vvm(体积/体积/分钟),挡板倾斜,并且叶轮速度控制在400到700转/分钟以保持溶解氧张力为空气饱和度的30%或以上。不进一步加入抗泡沫剂。发酵22小时后,将起始酸反式-环丁烷-1,2-二羧酸作为1∶1MeOH/5M NaOH中和的溶液加入。发酵罐中外源起始酸的终浓度为0.5mM。
发酵5天后,将发酵液合并并用浓盐酸酸化到pH4.0,然后通过以3,500转/分钟离心10分钟澄清。将上清液吸收到diaion HP-20SS树脂(1升),该树脂已经用甲醇(2l)然后用5%水性甲醇(2l)预处理,以约100ml/分钟的速度过滤。用20%水性甲醇(2.5升)然后用80%水性丙酮(4.5升)洗脱树脂。从水性丙酮除去有机溶剂并将所得水性浆液(1升)萃取到乙酸乙酯(3×1升)。合并有机物并真空浓缩得到黄褐色油(1.7g)。同时,将细胞沉淀用甲醇-乙酸乙酯,1∶1浸渍(3×1升,每次4小时),所得有机上清液真空浓缩得到水性浆液(400ml)。将该颗粒状物质溶于甲醇(50ml),然后返回到水性浆液,将其用水加至500ml。将该浆液在diaion HP-20SS树脂(300ml)上吸收,其中所述树脂已经用甲醇(500ml)然后用5%水性甲醇(500ml)预处理。然后用20%水性甲醇(1升)和80%水性丙酮(1.5升)洗脱树脂。从水性丙酮除去有机溶剂并将所得水性浆液(补充到750ml)萃取到乙酸乙酯(3×750ml)。合并有机物并真空浓缩得到黄褐色油(1.7g)。合并粗提取物(3.4g),溶于乙酸乙酯(10ml),然后吸收到二氧化硅柱(5cm ID×10cm,用EtOAc处理),用EtOAc洗脱。合并活性级分并真空除去溶剂得到褐色树胶(1.08g)。通过连续的制备性反相HPLC(用用于实施例4中的移动相洗脱,不加入TFA,使用线性梯度在25分钟内从25%B到75%B)最后纯化该残渣。合并活性级分并在C18-筒(5g)上脱盐,得到83.9mg(或7.0mg/l分离的产率)。表14中显示了18的13C-NMR光谱。
表14
CDCl3中的13C-NMR分配,使用δC=77.7ppm下的碳信号作为参比。
参考文献Anderson,B.F.,Herlt,A.J.,Rickards,R.W.,和Robertson,G.B.(1989)大环内酯抗生素疏螺旋体素的两种同晶型溶剂化物的晶体和分子结构通过晶格中手性溶剂的掺入确定绝对构型.Aust.J.Chem.42717-730.Anderton,K.,和Rickards,R.W.(1965)一种抗病毒抗生素疏螺旋体素的一些结构特征.Nature 206269.
Aparicio,J.F.,Molnár,I.,K_nig,A.,Haydock,S.H.,Khaw.,L.E.,Staunton,J.,和Leadlay,P.F.(1996)吸水链霉菌中雷帕霉素的生物合成基因簇的组织分子聚酮化合物合酶中酶结构域的分析.Gene 1699-16.
August,P.R.,Tang,L.,Yoon,Y.J.,Ning,S.,Müller,R.,Yu,T.-W.,Taylor,M.,Hoffmann,D.,Kim,C.G.,Zhang,X.H.,Hutchinson,C.R.,和Floss,H.G.(1998)袢霉素抗生素利福霉素的生物合成Amycolatopsis mediterraneiS699的rif生物合成基因簇的分子分析的推导.Chem.Biol.569-79.
Beck,J.B.,Yoon,Y.J.,Reynolds,K.A.,和Sherman,D.H.(2002)结构域跳跃的隐藏步骤苦霉素调节性聚酮化合物合酶中的环大小确定.Chem.Biol.9575-583.
Berger,J.,Jampolsky,L.M.,和Goldberg,M.W.(1949)疏螺旋体素—具有抗疏螺旋体活性和青霉素加强性质的一种新的抗生素.Arc.Biochem.22476-478.
Bierman,M.,Logan,R.,O’Brian,K.,Seno,E.T.,Rao,N.,和Schoner,B.E.(1992)用于DNA从大肠杆菌到链霉素变种的接合转移的质粒载体。Gene 11643-49.
Bonfield,J.K.,Smith,K.F.,和Staden,R.(1995)一种新的DNA序列装配程序.Nucleic Acids Research 234992-4999.
Brautaset,T.,Sekurova,O.N.,Sletta,H.,Ellingsen,T.E.,Str_m,A.R.,Valla,S.和Zotchev,S.B.(2000),诺尔斯氏链霉菌(Streptomyces noursei)ATCC 11455中多烯抗真菌抗生素制霉菌素的生物合成基因簇的分析和生物合成途径的推导.Chem.Biol.7395-403.
Brenner,S.(1998)基因和蛋白质的分子进化关于两种丝氨酸.Nature334528-530.
Broadhurst,R.W.,Nietlispach,D.,Wheatcroft,M.P.,Leadlay,P.F.,和Weissman,K.J.(2003)组件化聚酮化合物合酶中停靠结构域的结构。Chem.Biol.10723-731.
Brosius,J.(1989),克隆和表达载体中的超多接头.DNA 8759-777.Butler,A.R.,Bate,N.,和Cundliffe,E.(1999)弗氏链霉菌中硫酯酶活性对泰乐菌素生物合成的影响.Chem.Biol.6287-292.
Caffrey,P.,Lynch,S.,Flood,E.,Finnan,S.,和Oliynyk,M.(2001)结节链霉菌(Streptomyces nodosus)中两性霉素生物合成从聚酮化合物合酶和晚基因分析的推导.Chem.Biol.8713-723.
Celenza,J.L.(2001),酪氨酸和色氨酸的代谢—旧途径的新基因。Curr.Opin.Plant Biol.4234-240
Chater,K.F.和Wilde,L.C.(1980)SalG1限制性修饰系统中白色链霉菌G突变体缺陷。J.Gen.Microbiol.116323-334.
Cheng,Y.Q.,Tang,G.L.,和Shen B.(2003)I型聚酮化合物合酶需要一种离散的酰基转移酶用于聚酮化合物生物合成.Proc.Natl.Acad.Sci.USA.1003149-3154.
Cortés J.,Haydock,S.F.,Roberts,G.A.,Bevitt,D.J.,和Leadlay,P.F.(1990)红色糖多孢菌的产生红霉素的聚酮化合物合酶中一种不寻常的大的多功能多肽。Nature 348176-178.
Cortés,J.,Weissman,K.E.H.,Roberts,G.A.,Brown,M.J.B.,Staunton,J.,和Leadlay,P.F.(1995)一种结构域在组件化聚酮化合物合酶中的换位以促进特异链切割.Science 2681487-1489.
Cortés,J.,Velasco,J.,Foster,G.,Blackaby,A.P.,Rudd,B.A.M.,和Wilkinson,B.(2002)鉴定和克隆红色糖多孢菌中可扩散的色素生物合成中所需的III型聚酮化合物合酶。Mol.Micro.441213-1224.
Devereux,J.,Heaberli,P.,和Smithies,O.(1984)用于VAX的一组全貌的序列分析程序。Nucleic Acids Research 12387-395.
Dickinson,L.,Griffiths,A.J.,Mason,C.G.,和Mills,R.F.(1965)从链霉菌属物种分离的两种抗生素的抗病毒活性。Nature 206265-268.
Donadio,S.,Staver,M.J.,McAlpine,J.B.,Swanson,S.J.,和Katz,L.(1991)复杂聚酮化合物生物合成所需的基因的组件化组织。Science252675-679.
Donadio,S.,McAlpine,J.B.,Sheldon,P.J.,Jackson,M.,和Katz,L.(1993)通过聚酮化合物合成的再编程产生的红霉素类似物Proc.Nat.Acad.Sci.USA 907119-7123.
Duffey,M.O.,LeTiran,A.,和Morken,J.P.(2003)疏螺旋体素的对映选择性全合成.J.Am.Chem.Soc.1251458-1459.
Eastwood,E.L.和Schaus,S.E.(2003)疏螺旋体素诱导氨基酸合成酶通过依赖GCN4的途径转录。Bioorg.Med.Chem.Lett.132235-2237.
Fern和ez,E.,Weissbach,U.,Sanchez-Reillo,C.,Brana,A.F.,Mendez,C.,Rohr,J.,和Salas,J.A.(1998)从Streptomyces argillaceus鉴定在抗肿瘤药物光神霉素的生物合成期间编码参与二糖转移的糖基转移酶的两种基因。J.Bacteriol.1804929-4937.
Floss,H.G.(2001)抗生素合成从天然到非天然的化合物。J.Ind.Micro.Biotech.27183-194.
Fouces,R.,Mellado,E.,Diez,B.,和Barredo,J.L.(1999)来自弗氏链霉菌的泰乐霉素生物合成簇左区的基因组织。Microbiology 145855-868.
Folkman,J.(1986)正常和瘤性组织中血管生长是怎样被调节的?G.H.A.Cloves Memorial Lecture.Cancer Res.51467-473.
Funahashi,Y.,Wakabayashi,T.,Semba,T.,Sonoda,J.,Kitoh,K.,和Yoshimatsu,K.(1999)建立定量小鼠背部气囊模型及其用于评价新的血管生成抑制剂。Oncol.Res.11319-329.
Gaisser,S.,Reather,J.,Wirtz,G.,Kellenberger,L.,Staunton,J.,和Leadlay,P.F.(2000)红色糖多孢菌中杂化大环内酯生物合成的一种明确系统Mol.Microbiol.36391-401.
Gaisser,S.,Martin,C.J.,Wilkinson,B.,Sheridan,R.M.,Lill,R.E.,Weston,A.J.,Ready,S.J.,Waldron,C.,Crouse,G.C.,Leadlay,P.F.,和Staunton,J.(2002)具有改变的脱氧己糖取代基的新spinosyns的工程化生物合成。Chem.Commun.618-619.
Gaitatzis,N.,Silakowski,B.,Kunze,B.,Nordsiek,G.,Bl_cker,H.,H_fle,G.,和Mfüller,R.(2002)芳香族粘细菌(myxobacterial)电子转运抑制剂标桩菌素的生物合成受到一种新型组件化聚酮化合物合酶的指导。J.Biol.Chem.27713082-13090.
Hanessian,S.,Yang,Y.,Giroux,S.,Mascitti,V.,Ma,J.,和Raeppel,F.(2003)构象设计在无环立体选择中的应用疏螺旋体素作为结晶的苯溶剂化物的合成。J.Am.Chem.Soc.12513784-13792.
Hardt,I.H.,Steinmetz,H.,Gerth,K.,Sassa,F.,Reichenbach,H.,和H_fle,G.(2001)来自纤维素堆囊菌株系So ce90/B2和So ce90/D13的新天然埃坡霉素分离、结构阐明和SAR研究。J.Nat.Prod.64847-856.Heathcote,M.L.,Staunton,J.,和Leadlay,P.F.(2001),II型硫酯酶的角色链延伸单元的异常脱羧基化产生的短酰基链的除去的证据。Chem.Biol.8207-220.
Hopwood,D.(1997)理解聚酮化合物生物合成的基因贡献。Chem.Rev.972465-2497.
Hunziker,D.,Yu,T.-W.,Hutchinson,C.R.,Floss,H.G.,和Khosla,C.(1998)生物合成中引物单位特异性主要在于生物合成途径的晚期阶段。J.Am.Chem.Soc.1201092-1093.
Janssen,G.R.,Bibb,M.J.,(1993)具有修饰的克隆位点的侧翼BglII位点并且保持通过大肠杆菌菌落的视觉筛选鉴定重组克隆的能力的pUC18的衍生物。Gene 124133-134.
Kahn,R.A.,Fahrendorf,T.,Halkier,B.A.,和M_ller,B.L.(1999)与Sorghum bicolour(L.)中生腈葡糖苷蜀黍氰苷的生物合成有关的细胞色素P450酶CYP79A1和CYP71E1的底物特异性Moench.Arch.Biochem.Biophys.3639-18.
Kawamura,T.,Liu,D.,Towle,M.J.,Kageyama,R.,Tsukahara,N.,Wakabayashi,T.,和Littlefield,B.A.(2003)疏螺旋体素的抗血管生成作用通过不同途径介导苏氨酰-tRNA合成酶和caspases独立地参与内皮细胞中增殖抑制和凋亡的诱导。J.Antibiot.56709-715.
Kieser,T.,Bibb,M.J.,Buttner,M.J.,Chater,K.F.,和Hopwood,D.A.(2000)实用链霉菌遗传学。The John Innes Foundation.Norwich.
Keller-Scheirlein,W.(1967)抗生素疏螺旋体素的组成。Helv.Chim.Acta.50731-753.
Kuo,M.S.,Yurek,D.A.,和Kloosterman,D.A.(1989)疏螺旋体素中1H和13C NMR信号的分配和C-7处的烯烃几何。J.Antibiot.421006-1007.Kuhstoss,S.,Huber,M.,Turner,J.R.,Paschal,J.W.,和Rao,R.N.(1996)通过构建杂化聚酮化合物合酶产生新的聚酮化合物。Gene183231-236.
Lozano,M.J.,Remsing,L.L.,Quiros,L.M.,Brana,A.F.,Fern和ez,E.,Sanchez,C.,Mendez,C.,Rohr,J.,和Salas,J.A.(2000)与Streptomycesargillaceus的的抗肿瘤药物光神霉素的生物合成有关的两种聚酮化合物甲基转移酶的表征。J.Biol.Chem.2753065-3074.
Maehr,H.,和Evans,R.H.(1987)疏螺旋体素和密螺霉素的特性。J.Antibiot.401455-1456.
Marsden,A.F.,Wilkinson,B.,Cortés,J.,Dunster,N.J.,Staunton,J.,和Leadlay,P.F.(1998)对生产抗生素的聚酮化合物合酶的更宽特异性的工程化.Science 279199-202.
Matter,A,.(2001)肿瘤血管生成作为治疗靶标。Drug Dis.Today61005-1024.
Mochizuki,S.,Hiratsu,K.,Suwa,M.,Ishii,T.,Sugino,F.,Yamada,K.和Kinashi,H.(2003)娄彻氏链霉菌的大线性质粒pSLA2-L具有用于次级代谢的不寻常浓缩的基因组织。Mol Microbiol.481501-1510.
Moore,B.S.,和Hopke,J.N.(2000)发现新的细菌聚酮化合物生物合成途径。Chembiochem 235-38.Nielsen,J.S.,和M_ller,B.L(1999)Triglochin maritime中生腈葡糖苷的生物合成和细胞色素P450酶的参与。Arch.Biochem.Biophys.368121-130.
Olano,C.,Wilkinson,B.,Moss,S.J.,Brana,A.F.,Mendez,C.,Leadlay,P.F.,和Sala,J.A.(2003)来自工程化基因融合的关于组件化聚酮化合物合酶中组件的重复使用的证据。Chem.Commun.2780-2782.
Oliynyk,M.,Brown,M.J.B.,Cortés,J.,Staunton.,J.,和Leadlay,P.F.(1996)Chem.Biol.3833-839.
Otani,A.,Slike,B.M.,Dorrell,H.I.,Hood,J.,Kinder,K.,Cheresh,D.A.,Schimmel,P.,和Friedl和er,M.(2002)作为眼血管生成的强烈拮抗剂的人TrpRS的片段。Proc.Nat.Acad.Sci.USA 99178-183.
Otoguru,K.,Ui,H.,Ishiyama,A.,Kobayashi,M.,Togashi,H.,Takahashi,Y.,Masuma,R.,Tanaka,H.,Tomado,H.,Yamada,H.,和 S.(2003)一种非糖苷18元大环内酯抗生素疏螺旋体素针对疟原虫的药物抗性株的体外和体内抗疟疾活性。J.Antibiot.56727-729.
Pacey,M.S.,Dirlam,J.P.,Geldart,L.W.,Leadlay,P.F.,McArthur,H.A.I.,McCormick,E.L.,Monday,R.A.,O’Connell,T.N.,Staunton,J.,和Winchester,T.J.(1998)来自红色糖多孢菌株NRRL 2338 pIG1 I的发酵的新的红霉素、分离和生物学活性,J.Antibiot.511029-1034.
Paetz,W.,和Nass,G.(1973)大肠杆菌K12的两种疏螺旋体素抗性突变株的苏氨酰-tRNA合成酶的生化和免疫学表征。Eur.J.Biochem.35331-337.
Prieto,M.A.,Díaz,E.,和García,J.L.(1996)大肠杆菌W的4-羟苯基乙酸分解代谢途径的分子表征工程化可动的芳香性衍生物簇.J.Bacteriol.178111-120.
Quiros,L.M.,Aguirrezabalaga,I.,Olano,C.,M和ez,C.,和Salas,J.A.(1998)在抗生链霉菌的竹桃霉素生物合成期间两种糖基转移酶和一种糖苷酶参与竹桃霉素修饰。Mol.Microbiol.281177-1185.
Raibaud,A.,Zalacain,M.,Holt,T.G.,Tizard,R.,和Thompson,C.J.(1991)核苷酸序列分析解释了吸水链霉菌的bialophos生物合成基因簇编码的连接的N-乙酰基水解酶、硫酯酶、转运和调节基因。J.Bacteriol.1734454-4463.
Ranganathan,A.,Timoney,M.,Bycroft,M.,Cortés,J.,Thomas,I.P.,Wilkinson,B.,Kellenberger,L.,Hanefeld,U.,Galloway,I.S.,Staunton,J.,和Leadlay,P.F.(1999)基于结构域和组件交换的二组件和三组件聚酮化合物合酶的基于知识的设计简化他汀类似物的一种途径。Chem.Biol.6731-741.
Reeves,C.D.,Murli,S.,Ashley,G.W.,Piagentini,M.,Hutchinson,C.R.,和McDaniel,R.(2001)通过定点突变改变组件化聚酮化合物合酶酰基转移酶结构域的底物特异性。Biochemistry 4015464-15470.
Rowe,C.J.,B_hm,I.U.,Thomas,I.P.,Wilkinson,B.,Rudd,B.A.M.,Foster,G.,Blackaby,A.P.,Sidebottom,P.J.,Roddis,Y.,Buss,A.D.,(2001)Chem.Biol.8475-485.
Rowe,C.J.,Cortés,J.,Gaisser,S.,Staunton,J.,和Leadlay,P.F.(1998)构建用于在放线菌中高水平表达的新载体。Gene 216215-223.
Rudd,B.A.M.,Noble,D.,Foster,S.J.,Webb,G.,Haxell,M.(1990)一类抗寄生虫大环内酯的生物合成,Proceedings of the 6th InternationalSymposium on the Genetics of Industrial Microorganisms.Strausbourg,France.Abstract A70.p.96.ISBN 2-87805-004-5.
Sambrook,J.,Fritsch,E.F.,和Maniatis,T.(1989)Molecular cloningalaboratory manual.第二版Cold Spring Harbour,Laboratory Press.NewYork.
Schmidt,D.M.Z.,Hubbard,B.K.,和Gerlt,J.A.(2001)烯醇化酶超家族的酶活性的进化枯草杆菌和大肠杆菌中作为L-Ala-D/L-Glu表异构酶的位置蛋白的功能分配。Biochemistry 4015707-15715.
Schwecke,T.,Aparicio,J.F.,Molnár,I.,K_nig,A.,Khaw,L.E.,Haydock,S.F.,Oliynyk,M.,Caffrey,P.,Cortés,J.,Lester,J.B.,B_hm,G.A.,Staunton,J.,和Leadlay,P.F.(1995)聚酮化合物免疫抑制雷帕霉素的生物合成基因簇。Proc.Nat.Acad.Sci.USA 927839-7843.
Shaw-Reid,C.A.,Kelleher,N.L.,Losey,H.C.,Gehring,A.M.,Berg,C.,和Walsh,C.T.(1999)多组件非核糖体肽合成酶的装配线酶学大肠杆菌EntF的硫酯酶结构域催化延长和环内酯化。Chem.Biol.6385-400.
Silakowski,B.,Nordsiek,G.,Kunze,B.,Bl_cker,H.,和Müller,R(2001)组合的聚酮化合物合酶/非核糖体肽合成酶中新的特征粘杆菌橙色标桩囊菌(Stigmatella aurantica)Sga15的myxalamid生物合成基因簇。Chem.Biol.859-69.
Singh,S.K.,Gurusiddaiah,S.,和Whalen,J.W.(1985)密螺霉素—针对Treponema hyodysenteriae的腈抗生素活性。Antimicrob.Agents Chemother.27239-245.
Staunton,J.,和Wilkinson,B.(1997)红霉素和雷帕霉素的生物合成。Chem.Rev.972611-2629.
Swan,D.G.,Rodriguez,A.M.,Vilches,C.,Mendez,C.,和Salas,J.A.(1994)编码I型聚酮化合物合酶具有不寻常编码序列的抗生链霉菌基因的表征。Mol.Gen.Genet.242258-362。
Takeshita,S.,Sato,M.,Toba,M.,Masahashi,W.,和Hashimoto-Gotoh,T。(1987)用于lacZ α-互补和氯霉素或卡那霉素抗性选择的高拷贝数和低拷贝数质粒载体。Gene 6163-74.
Thomas,I.,Martin(née Rowe),C.J.,Wilkinson,C.J.,Staunton,J.,和Leadlay,P.F.(2002)杂化聚酮化合物合酶中的跳跃ACP向ACP链转移的证据。Chem.Biol.9781-787.
Tsuchiya,E.,Yukawa,M.,Miyakawa,T.,Kimura,K.I.,和Takahashi,H.(2001)疏螺旋体素抑制酿酒酵母的依赖细胞周期蛋白的激酶(CDK)Cdc28/Cln2.J.Antibiot.5484-90.
Wakasugi,K.,Slike,B.M.,Hood,J.,Otani,A.,Ewalt,K.L.,Friedl和er,M.,Cheresh,D.A.,和Schimmel,P.(2002)作为血管生成调节剂的人氨酰基-tRNA合成酶。Proc.Nat.Acad.Sci.USA 99173-177.
Wakabayashi,T.,Kageyama,R.,Naruse,N.,Tsukahara,N.,Funahashi,Y.,Kitoh,K.,和Watanabe,Y.(1997)疏螺旋体素是一种血管生成抑制剂;大鼠主动脉基质培养模型中血管生成毛细血管的破坏。J.Antibiot.50671-676.
Waldron,C.,Matsushima,P.,Rosteck,P.R.,Broughton,M.C.,Turner,J.,Madduri,K.,Crawford,K.P.,Merlo,D.J.和Baltz,R.H.(2001)Saccharopolyspora spinosa的spinosad生物合成基因簇的克隆和分析。Chem.Biol.8487-499.
Wilkinson,B.,Foster,G.,Rudd,B.A.M.,Taylor,N.L.,Blackaby,A.P.,Sidebottom,P.J.,Dawson,M.J.,Buss,A.D.,Gaisser,S.,B_hm,I.U.,Rowe,C.J.,Cortés,J.,Leadlay,P.F.,和Staunton,J.(2000)与6-脱氧红诺霉素B相关的新八酮化物大环内酯提供了红霉素聚酮化合物合酶的反复操作的证据。Chem.Biol.7111-117.
Wu,N.,Tsuji,S.Y.,Cane,D.E.,和Khosla,C.(2001)评估聚酮化合物合酶组件之间中间物的通道化中蛋白质-蛋白质相互作用和酶-底物相互作用之间的平衡。J.Am.Chem.Soc.1236465-6474.
Xue,Y.Q.,Zhao,L.S.,Liu,H.-W.,和Sherman,D.H.(1998)委内瑞拉链霉菌中大环内酯抗生素生物合成的基因簇代谢多样性的构造。Proc.Nat.Acad.Sci.USA 9512111-12116.
Xue,Y.Q.,和Sherman,D.H.(2000)备选的组件化聚酮化合物合酶表达控制大环内酯结构。Nature 403571-575.
Yamamoto,H.,Maurer,K.H.,Hutchinson,C.R.(1986)红霉素链霉菌(Streptomyces erythraeus)的转化J.Antibiot.391304-1313.
序列表<110>百奥帝卡技术有限公司奥维耶多大学<120>产生疏螺旋体素的聚酮化合物合酶及其用途<130>GRF/FPBP6194559<150>GB0230217.2<151>2002-12-27<160>113<210>1<211>74787<212>DNA<213>小链霉菌(Streptomyces parvulus)Tü4055<400>1gatcccgcgc ggcatcgccg tcgacgtgct gcgggccggc gaccgctggc cccacagcgc 60ggcaccgcgc caccggggac tcctcaacgc ctggtggggc gcctgggtct gggccacggt 120cttcgaccgc tacgcgtcga ggacctacga cgacgcccag gacgtcgacg cgatccacga 180cgcggcggga ctggtcatgg ccggtgccgg attcgacatc ctcgccgccg tgctcgcgat 240cctcttcgtg cgccggctga ccgccgcaca gcacgcgaag gccctcgcgg ggcccacccc 300gccgacgcac tgagccgccc gcacccgtga tcccgccccg cgatccccgg gcccgataaa 360tgcgttggcc ccggcgcgcg cctgtggtgg gatgagcggc gacgggggcg gctccccggc 420gtgcatcctt ctcaccttcc tgcaaagatc ccgcgcgccc actctccgcc cccgttcttc 480cgtcccgagc cgtcgccgcc gtggaggctt tcctgttgct cgccgccgag tccgtactgc 540tgcgccgtga ccagagcgtc tacgtgaccc cggggtccga gccggacggt ccgccgaggg 600ccgcactgcg ccggctcgag gccgaactgc tcggccgcgg ccacgccgtc tccgcgccgc 660tgcacgcggt cctcgcctcc ttggactccg aggaactggc ggccgcccac gtacgcctcg 720tcggactcgt cgacgacctg ctcggctccg accgcaccca caccccgctc ttccgccgct 780tcccgcgcac cgtgccgcgc gacaccgagg cgctgtacgt ggaccgcgtc ttcgccttcc 840tgctgcagca gcccgagcag ccctgcgtgc tgtgcggcga ggcgcgcacc gtcctgcccg 900tgtcaccctg cgcgcacctg gtctgccggc tgtgctggga cggctccgac tacgcgggat 960gcccgctgtg ccaccgcagg atcgacgggg acgacccctt cctgcgtccg gtccgtgccg1020tcggcgccgc cagggcgacc gtaccgggcc cgctgcgact gctgcgcctg ggcaccgaca1080tgaccgccga cgccaccacg gcggtggacg ccctgctggc ccgccgcacc ccgctctccc1140cgcaggaccg ggacgacctg ctcaccctgt tgccgctcac accggccggc cggggcgacc1200tgccgcagga catcccggtc cgcgagacca aggcgctggt cctgggcgcg ctggtgcgcc1260
gggcaccgtc gcggccggcc ctgcggaggc tgctcgccga gcggctcacc accgccaccg1320acgtgctgcg gctgctcgcc gtgctctcgg gcggcgacgc cgggctggtg acaccggcac1380ggttcacgaa cgttccccgt tccctgcggc gtgacctgct cgccgtcctc gacggactgc1440cggcgccgta cctggtcgag gacatgctgc ggcaccccac ggcgtggaag cgggccgcgg1500aggtgctgca ccccttcgag gggcacaccc ggcacccgcg cgccgcgctc gccaccgccg1560tgctgcgcgc cacaccgttg gacccggaca ccgccttcgg cgccgccctg ctgaccacgg1620ccgccgcgca cccggacgcc gtgcgcccgg acggcacccg agtccgcccg gccacctggg1680cgggacggct ggagcaggcg atggccgagg gggacgccgc tcgggccgcg gccctcgccg1740gggagcggcc cggcgaactg gtgcgccgcc tggacgtgtt gctgcgcctg cacaccgacg1800aggcgctcgt gccggagctg gagaaggccc tgcggcacgg gctgccgaag gtgggcccgg1860gcccgctgct gtcggcgctc ggggcgctgc ggacacgcac cgaggaccgc accgggaccc1920ggcgcgtgtt cttcccgcgg ggcgacgtca cccgggccct gtccgtcccc gagcggcgcc1980ccgccctgcc cgccgggccg gtgtccgagg tggtcgccct gctggagggg gaactgctgc2040gccggttcgc cgccgggcgg ccctacgagc tgtcggtgct ggacgccgga ctgaccgacc2100tcaccgtgcc gttcaccgag cggaccgccg ccaaggccct ggtgaccgtg ggccgcggca2160gcgtccaggc actccccgag ggctccgtgc tccgactgtt cctgcactgg acggaacccc2220ggggcaaccg caccgacctg gacctgtccg tcgccttctt cgacgccgag tggacgttca2280ccggcctgtg cgactacacg aacctggtgc acggtccgga cgcggcgatc cactccggcg2340acctcacgtc ggccccggcg ccgcgcggcg ccaccgagta cgtggacctc gacctggagc2400ggctggcgcg gcggggagac acctacgccg tcccgctggt gttcagctac aacaacgtcc2460cgttcgagga actgccggac gccttcgccg ggttcatggc gctgcccgcg gaaggcccgc2520gcgacgcgac ctacgacccg cgcaccgtgc ggcagcgctt cgacctcgcg ggcgactcca2580aggtgtgcct gccgatgatc gtggacctgg cccgccggcg ggcgttgtgg accgacaccc2640acctgccgtc cgcgggcggc ttccagagca tcggttcgca cggcggcggt gagctggccg2700cggtggccgg tgacctctgg cagcagttca cctcgggcgg ccgggcgacc ctgtgggacc2760tcgccgtcct gcgggcggcc gccctctcgc cggaggtggc ggtggtgtcc cgggagccgg2820agcccgcggt gctgcgttac cggcggcggg cggccgagag cgaggccgcg ttcgccgtcc2880gagtcgcgtc ccacaaggac gccgaggaac ggctggcgca caccgacccc gactcggccg2940cggccgggct cgccgccggc cggcgggtct tcctcgcgac ggtccacggt gacgtccggc3000cgccgggggc gtcgggcacg tcctaccggc tcttccccgg ggccggggac gcctcaccga3060ccctgacccg cgtgaccgcc ggggacctgc tcgccgagct gggctgagcc aggcgccggc3120
ccgcgccggc ccgcgccggc ccgtccctgc ccgtgccgga gggctcgccg gtcactccgg3180ccaggcggag ttctcgatga cctcgacgaa gtccgtacgc cggaagccgg gcgcgaagtg3240ctccagcaca tccgcgttca ccgtgccgaa ggtggtcgcg ggccggtgct cgaacccctc3300ggtgaacgcc cgcaggatct gcttcttgaa gtccgggcgg ggatgcgcgg cggtgaccgc3360gtcgatctgg gcccgggtga gattgcccag ccgcaggccg agcacgtcgg tctccacgcc3420ggcggtggtc gccgcgatct cgggggccat ccggtacggc acctccggag tggtgtgcag3480ggcgacggcc gtccacacgg tgtccgcgtc ggcctcgggg atgccgtggg cgagcaggaa3540ggcgtgggcc tggtcggcac cgtccatctc gaagcgctgg tcgtcaccgc ggtagggcgg3600caccaggccg gtgtcgtgga agagcgcggc gatgtacagc agctccgggt cggggcggat3660gcccagggcg gcggcctgga ggctgccgaa gaggtacaca cggcgtgagt ggtggaagat3720cagcggcgga gtggtgtcgc ggatcaggtc ggtcgcctcc cgcgccggcg cgctgtcggg3780aatctcgatg ccggcgatct gctcggccat ggctgccctc cggggaatcg gtgccgtcgt3840tgctgcctcc accctccgcc cggcgcgacc ccggcgtccg ctacccgatg gccgacaacc3900ccttacaagc ggccatgtgc cccgcgccgc cgcctcagcc gccgtccggg cgcgggccgg3960cgtccggcac ggtggtggcg aagcgctgcc ggtagcgggt gggcgacagc cccagatgac4020gggcgaaggc ccggcgcagg ctctcgtagc tggggaaacc cgacagcgcg gcggcctcgg4080tggcgttgtg cccggagtcg agcagcgcct tggcgatgtc gaaacggatc agctccacgt4140acttcacggg cgtgacgtcc agctcggccc ggaacatccg ggtcagatgc cgggggctga4200cccgcacgcg cgccgccaac gccgccagac tgtggtcggc ggccggatcg gcctgtacgg4260cgtcctggac ctgccgcagc acgggcgtcc gcggcgccgg gccccgcaac gaggcggaga4320actgcgactg gccgccggcc cgctgcaggt acaccaccag cgagcgcgcg accctgcggg4380cgagatcggg cccgtggtcc tcctccagca gcgcgagggc caggtcgatg cccgccgtca4440cgccggcgga cgtgtaggtc gccccgtcct tgacgaagat cgcgtcgggc tccacgcgtg4500tcgacggaca gcggcgggcc agcgcggtgg tgtgctgcca gtgcgtcgtc gcccgtctgc4560cctccagcag acccgcggca cccagcacga aggcgccggt gcacaccgag gcgacgcgtc4620cggcccgggc cgccagcgcc ttcgcggcgt cgatgagccg tgggtcgacg ggcgagccgg4680gcagcgcgtc accgccgacg acgacgagcg tgtccggcgg gccggcggaa cgcgcgtccg4740cctcggccgg gaccagcagg ccgatggacg aacgcaccgg cgccccgtcc ggggagacga4800cgccgagccg gtaccgggcc ccgaaccggt tggcctccgc gaagacctcc gccggccccg4860acaggtcgag catcttcatg ccgtcgaaga ccaggatgcc cacgctgtgc gctctcgccg4920tcatgtctcc ctctccgcgg gccggcgggc ccctgcgcgc cattgtcccg ccggccgtcc4980acgccggcgg ccggcggcgc gggcggccgg cggtcggaat gaggcgcgcc ggacatcggc5040
gtagggtggc gagcgtgtgt tcggccgcgg tcccggagac cgcggaacgc aggacctttg5100gcaggcacgc ggaaggacag cgatgggtac ggtcaccacc tccgacggca cgagcatctt5160ctacaaggac tggggcccgc gcgacgcccc gccgatcgtc ttccaccacg gctggccgct5220caccgcggac gactgggaca accagatgct gttcttcctc tcgcacggct accgtgtgat5280cgcccacgac cggcgcggcc acggccgctc gggccagccc tcgacgggcc acgagatgga5340cacctacgcc gccgacgtcg cggcgctgac cgaagcgctc gacctgcggg acgccgtcca5400catcgggcat tcgaccggcg gcggcgaggt cgcgcgctat gtggcgcgcg ccgaaccggg5460ccgggtcgcc aaggccgtgc tggtcggcgc cgtgccgccg gtgatggtca agtccgacgc5520caaccccggc ggcaccccga tcgaggtctt cgacgggttc cgcacggccc tggccgccaa5580ccgggcccag ttctacatcg acgtgccctc cggccccttc tacggattca accgggaggg5640cgcgaaggtc tcccagggcc tgatcgacaa ctggtggcgg cagggcatgt cgggcgcggc5700caacgcccac tacgagtgca tcaaggcgtt ctccgagacc gacttcaccg aggacctcaa5760ggccatcgac gtgccggtgc tggtcgcgca cggcaccgac gaccaggtcg tgccctacgc5820ggactcggcg ccgctgtcgg tgaagctcct gaagaacggc accctcaagt cgtacgaagg5880gctcccgcac ggcatgctct ccacccaccc cgaggtggtc aaccccgacc tcctggactt5940cgtgaggtcc tagtcggcgc tcacgccggc gacacgggag cgggtgcggc gccgcgcacc6000gggtgcttgc tcaggacgga gacccggttg aaggcgttga tgctgatcgc cacccagatc6060acggcggaga cctcgtcgtc cgacaggacg ccccgtgcct gcgcgtaggc ggcgctctgc6120gcggcggcgt ccgccggacg ggtggtcgcc tccgcgaggg cgagcgccgc ccgctcccga6180gcggtgaaca gctcggtgtc ccgccaggcg ggcagcaccg ccaggcgctg ggtcgtctcg6240ccggcccgca gcgccgccct ggtgtgcaga ctgagacagt aggcacaggc attgagttgg6300gagacgcgga tgttcaccag ttccacgagg aggcggtcca ggccggccgc cgcggcggcc6360tcccgcaccg attccgccgc ggccacgaac gctttgtacg cgccgggggt ctgcttgtcg6420acgaagaccc gccgctcgtc cgtcgccacc ggggcctgct gtgtcacgtg gtctccttcg6480tcgcgctctc ttccggcggg tcctatcatc acccccatgg atgttgaaag tgaaactttc6540aggtcggggc cggacggggg cgcgtggtga gcaacacgga gacacggccc gcggagatgc6600ggtgcggcgc cctcgaagac gaggtgcccg ccgcgggcgt cgaagtcctc accgcccgtg6660acgtccccct cggcggcccg cgcgccatga ccgtgcggcg cacgctgccc cagcgggccc6720ggacgctgat cggagcctgg tgcttcgccg accactacgg tcccgacgac gtggccgcgt6780cgggcggcat ggacgtcgcc ccgcacccgc acatcggcct gcagacggtc agctggctgt6840tcagcgggga gatcgagcac cgggacagcc tcggcaccca cgccttcgtc aggcccggcg6900
aactcaacct gatgaccggc ggcttcggca tcgcccactc cgaggtctcg acccccgaca6960ccactgtcct gcacggcgtc cagctctggg tggcgctgcc ggaggagcac cgcgacaccg7020gccgcgactt ccagcaccac gcacccgcgc cggtcgcctt cgacggcggc acggcacgcg7080tcttcctcgg ctcgctcgcc ggggacacct cgcccgtgag caccttcacg ccgctgctgg7140gcgccgagtt gacgctggtg ccgggcggca ccgccaccct ggacgtcgac cccggcttcg7200agcacggcgt cctcgtcgac agcggtgacg tacgcgtcga gggcgccgtc gtgcgaccgg7260ccgaactggg ctacgtcgcg ccgggtcgcg cgacgctgac cctgaccaac gagtcggccg7320cacccgcccg gctcatcctc ctcggcggcc ccccgttccc cgaggagatc atcatgtggt7380ggaacttcat cggccggtcg cacgacgaga tcgtgcgggc ccgcgaggac tggatgaagg7440gcgaccgctt cggcgaggtg cacggctacg acggggcacc cctgcccgcg ccggaactgc7500cgaacgcacc cttgaagccg cgacgaaggg cgcgctgatc tgcggggaca tgggttggca7560ccaagggttt cggcgctgct cgatcaccga acccaccgcg agtcactctc gggtgagtcc7620cgaacggtcg ccgggagcgc gtgagcacgt gcgcagatgc tcggcgatga tgccgagaat7680cgcatcccgg tgctccagca ggtagaagtg accacccgcg aaggtgtcga gtgtgaacgg7740gccgtccgtg tgttcggacc atgcccgggc ctcgaccggg gtgaccatcg ggtcatcatc7800cccggtcaag gcatggatgg ggcaccgcag cttcgggccc ggtcggtagc ggtaggtctc7860ggcggccctg tagtcgccgc ggatggcggg gagggccata cgcaccagct cctcgtcgtg7920gaagacctgc tccgcggtgc cgtcgagggt cctcagctcg gccaccaact cctcgtccga7980caggaggtgc accgtacccc ccgtcctctg ccgggacggt gcgggcctgg ccgagacgag8040gagtgcctcc agggagatgc ccgcactctc gaaccgtcgg gccagttcga aggcgagggt8100ggcgcccatg ctgtgtccga acagcgcgac cggctggtga acacgggccc gcagcacggg8160gaagagctgg ttcgcgagtt cgtcgatgtc ctccaggggc ttctccgcgc gccggtcctg8220ccggccgggg tactggaccg cgagcacgtc gcaccggggt gccagcgcgg cagccacggg8280gtggtagaac gtcgcggagc cgccggcgtg cggcagacag atcaactggg gtgccgtggg8340atgtgcgggg cggtactgcc tgatccacac gtcgctgtgg gtgttcgtac cggtcatcag8400cggtgctgcc cttccggcgt ggcgttggtg cgggggatgg ccgatccggc cgtgacgcct8460ccgtcgaccc cgagggtctg cccggtgacg taggcggcga gggggctgag cagccagacg8520accgcgttgg ccacctcctc gcacttgccc aggcggccca gcggagcccg gcgcgcccgt8580tgtgcgaggg cgctgggatc ggcgtacagg ctgcgcagca tgggggtgtc ggtcgaaccg8640gggctgacca cgttgacgcg gatgccgtcg cccgcgtact gcagggccac cgacttgctc8700aggccgatga ccgcgtgctt ggtggccgag tagagcgggc tctgggcgtg gccgatgtgc8760ccggccactg atgcgcagtt cacgatcgcg ccgccgccgg ccgtcagcat ggcctcgatc8820
tgtccgcgca tgcacgacca gaccccacgc aggttggtgg cgatcacgcg gtcgaagttg 8880tcggcggtgt cctggtgcag cggaccgaac gagccgaagg tcccggcgtt gttgaacgcc 8940ccgtccagcc gtccgaaccg gctcaccgcc cgggccacgc agtccgccac ctgcttgtcg 9000tcaccgacgt cgcagggcac caccaagtgg tgcgaggagg gtagtccggc ggttgtctcc 9060gtgagggccg actcggtgcg gcccaccagg acgacgcgtg ctccgtgccc cacgaggagc 9120cgggccgcgg cccggccgat gccgctgccc gctccggtga ccatcatcac gcggtcggtg 9180agttccagac tcatcgttgt tccaacgctc cgtccctgct cgtcggatgt gcgatccgct 9240gtgtcatatg tgcagtccgc cgttgacgtc gacgaccgtg ccggtggtgt atccggcgtc 9300ctcgccgcac agatggcaga ccatgcccgc ggcctcggcg acgctgccga agcggccggc 9360ggggatgtgg ctgacgcggt cggcggtcca ctgcgggggc ttgtcctccc aagcccggcg 9420gatgcgctcg gtgccgatga cgccgtgggc gaccgcgttg accgtcacgc cgtgcggggc 9480cagttcgtag gcgcactgct tggtgaaccc gatgacgccg gccttggcgg cgacgtaggc 9540ggcattgctg aaccgggtgt acgtgcgacc ggccacggac gccaggttga cgaccctgcc 9600ccaccccgcc gcgaccatcg ccgggacgca cagccgggtc atggtgaaca cgctcgccag 9660gttgtgcgtg acggcctcct ggaggtcggc ctcggtcagt tcggtcaccg agcgggcccg 9720ggtgtcgcca ccgacgccgt tgaccaggac gcccggccgg tgctgcgggg cgagcgagtc 9780gacggcggac gccagggcgt gagggtcggt cacgtcggcg accagcgggt cccgggccag 9840ccggtcgccg agcccgtccg cgacccggtg caccgcctcg gcgtccttgt cgagcaggac 9900cacccgcagg ccccgggccg ccaggcctcg ggcgacctcc gcgcagatgc cgctgcccgc 9960tccggtcacc agagccacgt cgtgtcgtgc cgtcatgtgt tcctccgcca gccgccgccg 10020gattcccagg tggccgcgca ccgggtgtgt cgcagtagtt cttcggtcgg ttcgatgccc 10080gtgcccggac cggtcaaggg ttcgacccgg tgcagtgacc ggtcgacggt gaacgccggc 10140gtggtcagtg gcacggggaa ccactcgtcg gcccggcccg cctcgaccgt ctgccacagg 10200tcccatgcgg tggccagggt gcgcccggcc gcccacagcg gccccacctc ggccacgtga 10260acgccgagct ggcaaccgac gccgagctcg tcggcgcgca gtgccaggcg tgccgcggcg 10320aggaacccgc cgcacttcga cagccgtacg ttgatgtggc tggcggcgcc gctggtggcg 10380gcggcgtgga ggtcggccgg tccggtacag gactcgtcga gcatgacggg cagaccggtg 10440gcccgccgca gccggcccaa ctcgggccag gaccgcggcg ggagcggctc ctccacccac 10500cccacgccgt ccagttcgcc cgcgaccttc tccgcttcct cggccgtcca ggcgccgttg 10560acgtccagtg agacacgggt gtcggcgggg aggcggtcct gggccgccgt cagccggtcc 10620accgccccgg ccgggtccgc caccttgatc ttcacgtgcc gcaacgccgc cagcgcccgc 10680
ggcgtgagtg cgtccaggac ggtcgcgacg tcgcgcgaga ggtggatcac gaggctgacg 10740gacgtcggtc cgtcccgccg tgatcgggca ggcggggcca ggacccgcag gacgtcggcg 10800agcggccggg cgaaatgccg gcacaccgcg tcgagcaggg cgatctccac ggcggccgcc 10860gccgacgagc cgtcgacgag cccggtcagc ggcagctgtg cgatcgaggc gacggcgctc 10920tcgaagtccc gccactcgat gcgctcggcc agctccccgg gatcgcaggc ctggacggct 10980cgcaccgcgc cgtccagggt ctcaccggtg acgtagtcgc ggggcgctcc ctctccccat 11040ccgcgggtgc ccgccagctc gatctcgacc agcagggacg ccgcgctgcg acgggagcgc 11100gtggcgtggt cgaaggccgc ggccatgggc acgacggcgg tgtgcagccg tacgcgacgg 11160atcacgcttc ctccttcagc cgcgtggcca gccagtccca gtacgccgtc cgggccgacg 11220tgaactccac gtagtgccga tccgtggcga agacctcctc gtgcacggct gacgtcagac 11280gccgcagcat cgctcgcgcg gccgacaggt cgatgatcgg gtcgtgagtg gggagcgcca 11340ggtcgacggg gagccgggtg cggggggcac cgcgggcata gtggtcctcc aggtgcacga 11400gcgtcgcctg cgtggccgag gtgacctcgc gcagcatcag gtgatccccg gtgaggaact 11460cccggtagcg cggcaggtcg gtgtagtcgc cgtcggcgag ccccacgggc cgtagcccgc 11520tgccggtgag cgcgcggcgc tcggcgagcg tgtccgcggt gtggcgcgcc cgctgctgtc 11580ccagcgcggg cgcgcacagg accaacctgc ggacgggcag atcgcgggtg caccagagcg 11640cggccagcac gctgccgccg aggctctgcc ccagggcgac cggcccggca ccgccgacct 11700cggccgtcac ggcgtcgagg gcgcgggcgt agtcgtcgag gacgagatcg gccgacggca 11760ggtggccgcg aggcccctcg ctgcggcccg agcctctgcg gtccagggcg tagacgtcga 11820tgccgcgtgc gttgagctcg ggccccgtct cgaacagcca gcccgcgtgg ctctggatgc 11880cgtggaggta gaagacggcc gaggtggcgc cgggcgtggt ccagtggtgc agggtgagcc 11940cggtgccgtc ggcagcggtc agcatgctcg tggtgggcat gggctgcctc ctcagtaccg 12000gacgagattg acgtcggggt ccagccggac gtcgacgagg agcggtcctt cgagcgtcga 12060caacaggtcg ccgacggcgt cgagttcttc cgccttgcgg acggtgaggg cacgtgcgcc 12120catcgccgtg gccagcccgg cgaggtcggg ccaggcgaac gccgagtacg ccgggtcgta 12180gccgtggttc ctgagtttgt agtgctcggc tccgtacgcc ccgtcgttga gtacgaccac 12240gacgagcggc agccggtacc gtaccgccgt cgtgaactcc gacaggtgca tcatgaagcc 12300gccgtccccc acggcggcga ccacgggccg gccggtcccg gccgtcgccg cgccgatcgc 12360cccggcgacg ccgagcccga tcgagccgaa gccgcccatg acggtgaagt gcagcgggtc 12420cgccacgcgc agatacggcc agacacccac gtcgaagcgg ccgatatcgc tgacgacact 12480gcgctcggcg ggcagtatcc ggtccagccg gatcatggcc gtccggatgt cgacggtctc 12540cgctccactg cggtcgtcga cgtcgtcctg cggcgagaac ccggccagtt gcccggcgac 12600
gcgctccgcc caggcgccgt tggccgcggt gactccggcc tgatccagca ggacgttcat 12660ggtctcggcc gtgcggcggg catccccggc cacgggctcg tcgacggggc tgtacgagcc 12720gaaccgtgcc ggatcggtgt ccacgtgcac gactctcttg ccgcggagca gctcgccgtt 12780gagcacggtc cacatgttca ggctcgcccc gaacgcgatc acgcagtccg actcggcgat 12840gaccgtgctc gccacgctgt gcgcgagcga gccgaagatg ccgacgtcgc gggggtgacc 12900ggcgaacatc tccttgccga gcacggtggt ggccagcgct gctccggtac ggtccgccag 12960ctccaccagg gcctctcgcg caccggcgac ggccgcaccg tgcccggcga ggaccagcgg 13020ccgcttggcc gagccgatca gccccagcgc gccgtccagc gcctcggcct ccggagcggc 13080cagaggaccc ggcgccaccg ggagcgtgac cggcgcctgc tcgcccgcct ccgcctgcat 13140gaggtcgatc ggcacattga gtacgacggg ccgccgctcg gccacgatcc gctggacggc 13200ccggttcagg tccgcgacga gcgaggccgg tctgtggacg cgttcgtacc ccgcgcccgc 13260cgcggccgcg accgtcgcga tgtcgaagtg gtggaagtgc gtgggcaccg gtggcggatc 13320acctgtgatc agcaggacct ggctgtggct acgagccgct tccacaagag gggtcaaggc 13380gttggtgaaa gccggcccgt gcgtcacgga cgccacaccg atgccgccgc acatacgtgc 13440gcggccgtcg gccatggcga cggcgcccgc ctcgtgggcg accgccacga accgtccgcc 13500cgcgtcggcg aaggcgggca gatagagcag attggcgttg cccatgagac cgaagacggt 13560atcgacgccg tgtgcggtca gagcgtcggc gagcgcgtgg aaaaccttca ttgctgtccc 13620tcggtcgggg cgggctggag ccagacggga tcgttctggt cgaccggcgc gcaggtgggt 13680ggcgggtcct cgcggagcag ggaacgcagg tggttgccgg tgatgagcac ggtggttccg 13740gcgcagtccc gggcgacggc catccgccgg gcgagaactt gggggtgccg caccgcgcgg 13800gtcaggtcgt gcagcggggc cgcgggcacg ccgacggctg ccgccgcgtc cagtacggcg 13860gcgacggggc cctcggcccg cggtggcggg ccttccgcgt cgacgaggac cgtgccgtcc 13920gccgcccgga cgaggtgggg ggcccgtgcg ggtggggcgg tgaaccagcg gtcctgggtg 13980agccagacag cgctgtcgaa cagcgcgacg tcggcggcgc atccgtgctc ggtgcgcaga 14040cggacgtagg tggacacgac ggcggcggca gcggccaggt aggcaccgag gacgtcggcg 14100ctggacactg gagtcctcag cccggcgccc gggccgccga cgaggcgcat gatgcccgac 14160tcggcctgga tcacggtgtc gacgctgcgg tcggcggcgg ccaggccatg gccggtgacc 14220gtgcagtgca cgacgccgtg ccgggacagg atctgatcgg gggcgaggcc ctgcgcggtg 14280agtgtgtcgg ccgcgaggtt ggtgagcacg atgtcgcatc cggcgagcag ccgctcgaac 14340ccggcccggt cctcggcgtc ggcgaggtcg agccgacagg agcgtttgcc cgcgttgttg 14400acgtagtaga ggtagccgac cccggccacc tgctgggcga gccgccggga cccttcgccg 14460
tgcggcggct ccaccttcag tacgtcggcg ccgagttggg ccagcagccg gcccgcgtgc 14520ggtccggccg tgtacgagcc gacctccagc aggcggacgc cgcgcagcgg aggagtgccg 14580cgcgcgatcg gctcccagag gccgccctgc cggggcatcg gaccgtcggt gacggcgggt 14640atgagggaac gcagtgggct gcccggtgta ccggacgggt cggtgaccag gccgcgacgc 14700cgggcggcgg ctccgtcgcg tacctcctcg ggggccgcga cctgggcgca cgggatgccg 14760gcggcccgca gggcggtcac cacgtccacg gcccgctgcc cggcggtcca cttgccgagg 14820atctcgtcga gctcgtcggc gttgcggacg cgggcggcgg tgtcggcgaa gcgagggtcg 14880tcggggaggt cccgtcgtcc caggactgcg gtcagcctgt gccatatcgg ctcgcccatc 14940gtgcagatga cgacaggggc gtcctggcac gtgtagctgt tccagggtgc cgccatgccg 15000tgtcggttgc cggtacgacg tggcggacga ccggcgagcg cgacgctcgg aagcaaggtg 15060cccgtcagag tgaacaggct gtcgaactcg gcgatgtcca ggtagtcccc gcctcctccg 15120cgctcgcggc cgatgagccc ggccacgacg gcgatcagac cggacagggc cgccgtacgc 15180gacgccaggc ccaccacgga gaggaccgat ggttccccct cggtgccggt cgccgaggtc 15240aggcccgcca gcgcctgcaa ggtccgctcg gtggccgggg cgtcacgcag cgggccggtg 15300agcccgaacg cgctcagccg caccgcgacc aactcggggc tgcgatgcgg aagttccggc 15360gccccgagcc ccagagcggc gagccgctca tcgccctccg cgtcgcacac cagcacatcg 15420gccgtctgca gcagacgcga tgcctggtcc caaccggacg ccgactgcgc ggcggagtgc 15480agccaccgct cgaacgggcc cccgtgatcg ggtgatcggc agagcgtcac gacacgtgcc 15540ccgaggtccg cgagcagtct ccccagcagt gcggctggtg tactgcggcc ggccatgagt 15600acggcgatgc cctcgagcgg ccctgccctt gtcatggaat tctccctcgc tccgcgcacc 15660gatgcgggcg tcggtcgtca ccgctgattg gtcgtggacg tcggccgtga ggcgaccgcc 15720agggaaatca caccggcgcc gcccgcatcc gcgggggatc tggccggcag tcccgatgcg 15780ccattaaagc gcgcatgatt cgttccgtgc cgaccgtagc accgagacgg cggaaaatca 15840tcgcacaccc ctgctccgga tccggaaacc ctgctcaggg ggcaaggggg agggggtccg 15900taatggccaa aacgaaattt tacggagctt tacgtttgct ggacgatcta ttggtgagcg 15960cctcgacggg ctggacatgg cagtagtgaa tgtccgcatt catggctatt agtaccgtga 16020ccctgatcac acgagccctg gttgacgggt gaaatttggg gctggcagag tgatgacgag 16080cttccgtccg caaagtggtt gaataactgt tccgaaatct tcggcaattc aaaggagact 16140tacgggggat gcctctatta atgtattgct gtagggcgaa ataatgacag gcagtgctgt 16200ttcggcccca ttcctgcagc ctcccgaacc cgtctcaggg cactccgaac ggaaaagcga 16260tcccgtcctt ctcgtcggcg ccggacgccg tgcccgcatg gcggatgccg tacgtgccgc 16320cggcgctcag gcgggcatcg acccggccgt cctacggcgc acccgggcca ccttgatcac 16380
cgcggggagc gcgggagccg caggccggct cgccgccgcc ctgcgcctga ccggcgccac 16440gatctctctg gacacccgcg agacacccac actgctcgcc ctgcacctcg ccgcccaagc 16500gctgcgggcg ggcgacacct cttacgccgt cgtcggtgcc gaacttcccg acgggaactg 16560cgcgttgatc ctggccaggc agtcagcggc aaccgccgag ggggctgtgc cccaggcgat 16620cgtccgcacc accacggcgg accgcaccac cacggcggat cacgcccctg cgcccgacga 16680ccacggcagc ccggcccgtg aagccccgca tgccacccgc acgttgtccc caggcatcac 16740ccaggccccc gccgagggct tcccgggcct gctggcgacc ctgcacgacg acacacccct 16800gcgccccacc gcggtcaccg agcacggcag cgacgccacc accgtcctcg tcctcctcga 16860ccagccccag gacgccgcac ccgcggcacc gctcccctgg gtggtctcgg ccccccacac 16920ccgcgccctc cgggccacgg ccgcgaccct ggccgtccac ctcgacacca caccggccgc 16980acccgccgac gtcgcgcaca ccctgctcac cgcgcgcccc gaccgccacc gtgccgccgt 17040cgtcggcgcg gaccgggcca ccctcaccga cggactgcgc gcactcgcca ccggaggcga 17100cgcgccccac ctcgtccacg gcaccgccac cggatcgccg cgtcccgtct tcgtcttccc 17160cggccagggg tcgcagtggc ccggtatggc cgccgaactc ctcgaaacca gcgagccctt 17220tcacgacagc gtgcacgctt gcgccgacgc gctggccgag ttcgtcgact ggtcggttct 17280cgacgtcctg cgccaggcac cggacgcgcc acccctgcgc cgggtggacg ttctccagcc 17340caccctgtgg gcgacgatgg tctccctggc cgaggtctgg cgctcgtacg gcgtggaacc 17400ggccgccgtc gtcggccact gctacggcga gatcgccgcc gcgcaggtag ccggcgccct 17460cgacatgcgt gacgccgccc gactgctcgc ccaccgcagc cgggcctggc tgcgactggt 17520gggcaagggc acggtcatct ccgtcgccac ctcgggacag gacatcaccc ggcgcatggc 17580ggcctggccc gactccgtcg aactggccgc gctcaacggc ccgcgctccg tggcgctcgc 17640aggcccgccc gacgtcctgg acggcatcgt caacgacctg accgaccagg gcatccacgc 17700caaacgcatc cccggcgtgg acaccgtcgg ccactgctcc caggtcgagg tcctccgcga 17760ccacctgctg gacgtcctgc gcccggtctc gccccggccc gccgccgtgc cgttctactc 17820caccgtcgac ggaaccgaac gcgacaccac cacgctggac accgactact ggtacctcaa 17880cacccgcagc caggtccgct tccaccaggc cgtgcggaac ctgctcgccg ccggacaccg 17940ctcgttcgtc gaggtgagcc cgcacccgct gctcggagcc tccatcgagg acaccgcggc 18000cgagttcggc ctcgacgacg tggccgccgt cggcaccctg cgtcgaggcc agggcggcac 18060ccgccgggtc ctgacctcgg tggcggaggc gtatgtccac ggcatcgaca tcgacttcac 18120gcccgccttc accggcacga cccccaaccg catcgacctt ccgaccgtcg aggaccacgg 18180catcgagggt cacggcgacg acggcggcga gacatggacc gaccgcgtca gaaccctccc 18240
ggacgagcag cgcgaagagg ctttgctgga cctcgtgtgc cgcaccgtcg ccgcggtgct 18300cgaagcggac ccggccggca cggcggacgc cgtcgccccc gacacggcgt tcaaggagat 18360gggcctcggc tcactgagcg cggtccggct gcgcaacggc ctccgcgagg ccaccggcgc 18420ccacctgccg gccaccatcg cctacgacca ccccaccccg gccgctctgg cccgccacct 18480ggcgatgacc ctgttcgacg cgacgggcgc cgccccggcg gtcccggcac cgagccgcga 18540cgacgaaccg atcgacgccg agaccgctgt gctgaccgcg ctggaacggg ccgacgaggc 18600gctggaacgg ttgcgggccc cgcacgcccg cacgccccgg caggagaccg gccggcggat 18660cgacgagctg ctgcggtccc tgaccgacaa ggccaggcgg atgagacagg ccgacgccgt 18720cgatgatgtc gatgatccgg ccaccgaccg gttcgccgca gccaccgacg acgagatgtt 18780cgaactcctc gagaaacgtt tcggcatctc ctgaggcgcg ccgacctccc gcactgcgag 18840tcgcttcccc cacgatcccc gaaggcggca accgatggca catgaagaca aactgcgcca 18900cctcctcaag cgtgtcagtg ctgaactcga cgacacccag cgccgggtgc gtgagatgga 18960ggagagcgag cgcgagccga tcgcgatcgt ggggatgagc tgccgtctgc ccggcggggt 19020gaacagcccg ggggagttct ggtcgctgct ggaggccggg acggacgccg tctcggagtt 19080cccgcgggac cgtggctggg atgtggagaa cctctacgac ccggacccgg acgcccccgg 19140gcggtcgtac gtccgcgagg gcggattcct ggacggggcc ggacagttcg acgccgcctt 19200cttcggaatc tcgccccgtg aggcgctggc gatggatccg cagcagcggc tgctgctgga 19260gtgctcgtgg gaggcgatcg agcggtcgcg gatcgacccg aagaccctgc acggcagccg 19320gaccggcgtc ttcgcgggct ccaactggca ggactacaac accctgttgc tgaacgccga 19380ggagcgctcc cagagctacc tggccaccgg cgcctccgga agcgtgctgt ccgggcgcgt 19440ctcgtacacg ctgggcatgg aagggcccgc gatcaccgtg aacacggcgt gctcgtcctc 19500tctggtcgcc gtccacctgg cggcccgttc cctgcgggcg ggggagtgcg acctcgccct 19560ggccggcgcc gtcacggtca tgtccacacc gcagcttccg gtcgccttct cccggcagcg 19620cggactcgcc cctgacggtc gctcgaaagc cttcgcggtt tcggccgacg gcatgggctt 19680cggcgagggg gtgggcgtgc ttgtgctgga gcggttgtcg gtggcgcggc ggaacggtca 19740tcgggtgttg gcggtggtgc ggggttcggc ggtgaaccag gacggtgcgt cgaacggtct 19800gacggcgccg aacggtccgt cgcagcagcg ggtgatacgt gcggcgttgg cgagtgccgg 19860gctgggtccg gccgatgtgg atgtggtgga ggcgcacggt acggggacgc ggttgggtga 19920tccgatcgag gcgcaggcgt tgctggcgac gtacgggcgg ggccgggacg cggagcgtcc 19980gttgtggctg gggtcggtga agtcgaacat cggtcatgcg caggctgctg ccggtgtcgc 20040cggtgtcatc aagatggtgc tggccatgga gaagggccgt ctccctcgga cgctgcatgt 20100ggatgagccg tcgggtgagg tggactggga ctcgggtgcg gtgcggctgc tgaccgaggc 20160
gcgggactgg ccgtcggagg aaggtcgtct gcggcgggcc ggtgtgtcgt cgttcgggat 20220ctcaggcacc aacgcgcacg tgatcatcga ggaagcaccg gaagaggggg aggaaccgga 20280gtccgacgcg ggtggtgtgg tgccgtgggt gctctccgcg cggacggaag gggcactgca 20340agcacaggcg gtgcaactga gcgagttcgt cggcgagtcg agtccggtgg atgtgggttg 20400gtcgttggtt tcgacgcgtg cggcgttcga gcatcgggcc gtggtggtgg ggcgcgggcg 20460ggacgagttg gtgcggggct tgtccgaggt cgcgcagggt cggggcgtga ggggtgtcgc 20520gtcttcggcg tcgggtggtc tcgcgtttgt ttttgctggt cagggcagtc agcggttggg 20580gatggggcgg gggttgtatg agcggttccc ggtgtttgcc gaggcgttcg acgaggtgtg 20640tgggcgggtc ggtccggggg tgcgggaggt tgttttcggt tcggatgcgg gtgagttgga 20700ccggacggtg tgggcgcagg cggggttgtt cgcgttggag gtggcgctgt ttcggttgtt 20760ggagtcctgg ggtgtgcggc cgggttgtct gatcgggcat tcggtcggtg agttgtcggc 20820ggcgtgtgtg gcggggttgt ggtcgttgga ggatgcgtgt cgggtcgtgg ctgcccgggc 20880gcggttgatg caggcgttgc cggcgggtgg ggtgatggtc gcggttcggg ccgaggcggg 20940ggagctggcc ggtttcctcg gtgaggacgt ggtgatcgcg tcggtgaacg cgccggggca 21000ggtggtgatc gctggtcctg aggggggtgt ggagcgtgtg gtggctgctt gtggggcgcg 21060gtcgcgtcgt ctggcggtct cgcatgcttt tcattcgcct ttggtggagc cgatgcttgg 21120ggagttccgt cgggttgtgg agtcggtggc gttcggtgtg ccgtcgttgc gggtggtttc 21180caatgtcacg ggtgcgtggg tggatccgga ggagtggggg acgccggagt actgggtgcg 21240tcaggtccgt gagccggtgc gtttcgccga cggggtcgcc acgttgctcg acgcgggtgt 21300gaggacgttc gtcgagctgg gtcccgccgg ggcgctcact tcgatggtca gccactgcgc 21360ggacgccacc gccacttcgg tgacggctgt acctaccttg cgccccgatc acgatgagtc 21420gcggaccgtg ttgagtgccg cagcgtcctt gtacgtccag ggtcacccgg tcgactgggc 21480cccgctgttc ccgcgggccc gcacggtgga cctgcccacc taccccttcc agcaccagca 21540ctactggctc gacgtacctc ctctgttcac cgcctcctcg gcggcccagg acggtggctg 21600gcgataccgc atccactggc ggcggctcgg cacgagggac tccggggacc ggctctccgg 21660ccgctggttg ctgctggtgc ccgagtcgga cgggacggag ccctgggtgg agggggccga 21720gaagatgctg gccgagcgcg ggtgcgaagt cgtccacgtg ccgatcgcgg cgacggccga 21780ccgggacgcg atggtcggag ccgtgcgtga gagcgtcgag gacggtcggg tcgacggtgt 21840gctcagcctg ctggcgctcg acggccgccc gcaccccgat gcggctgcgg tgccgacagg 21900gttggtcgcc acggcgcagg ttgtgcaggt cagtgacgag ctgggcatcg gcccgctgtg 21960ggtcgccacc cgacaggcgg tctccgtcga cggggccgat gaggctgacg gggccggtag 22020
gaccaggaag gccgacgacc ccgccgatgt cgcgcaggcc gctgtgtggg ggctcggccg 22080ggtcgccgcg ctggagaagc ctcggttgtg gggcggcctc gtcgacctgc ccgcacgtgc 22140cgacgaacgg atgcgggacc tggtggctca ggccctcacc gctcccgacg ccgaggacca 22200acttgccgtg cgggccgacg gcatcgccgt tcgccgactg gtacgctccg ccgcgtcggc 22260cccggccgac gactggcagc cgagcggcac cgtgctggtc accggcggca ccggaggcgt 22320cggagccaac gtggcgcgtt ggctggtcac ccaggacatc cagcacctgt tgctggtcag 22380ccggcgcggc ccggacgccc ccggagccgc tgagctgctg gccgaactca gcgcctcagg 22440aacgtccgtg accatcgagc cctgcgacgt caccgacgcg gacgcggtac ggcgcctgat 22500cggcgccgta ccggccgaac ggccgctgag cacggtcgtc cacgccgcgg gcgtactgga 22560cgactgcttg atcgacgccc tgaccccgca gcgcctcgcc gccgcactgg aggtcaaggc 22620caagggcgca ctgaacctcc acgaggcggc cggggaagcc cacttggtgc tcttctcctc 22680gctggccgga acaaccggaa ccaagggaca gggcaactac gccgccgcaa acgcctatct 22740cgacgctctg gccgaacggc ggcgtgctga cggcctgccc gccacttcgg tcgcctgggg 22800cgcctggcag ggcgcgggca tggtggccga cgccgccgta gcccaccgca cgcgccgtta 22860tggcctcccg ctcatgagcc ccgaccgcgc cgtcgccacc ctgcggcagg tcatggccga 22920gccggtggcc acgcaggtgg tggcggacgt cgactggcag cgattcgtcg ccgacttcac 22980cgcggtgcgc cccagccgcc tcctcgccga cctgccggaa gtgcgctccc tgggcgagca 23040gcgaaaggac ggcccgggcg gtcagggcga ggaggacggc ttggccagca agctggcagc 23100cctgcccgaa gccgaccgcc gacgagccgt gctggacctc gtggaggaac tcgtcctcgg 23160ggttctgggc cacgagacgc gcgcggcgat cggcccggac agttccttcc acgccatcgg 23220cttcgactcg ctcaccgccg tcgaactgcg caacctgctg accgtacgcc tcgggatgaa 23280gctgcccgcg accctcgtct acgatcaccc gaccctgtcg tcgctggccg accacctgca 23340cgagcaactg gttatcgacg gcacccccat gacggacacc gcggccgacc tgctcgccga 23400actcgacgca ctcgcggcga gactcgccgc cgtcgggctg gaaccggagg cgcgcgcccg 23460catcggacgc aggctcaagg acatgcagac cgcctgcgaa cccaggtcgg agtcctcacg 23520cgacctgaag tccgcctcac gcaccgaagt gctcgacttc ctcaccaacg aactcggcat 23580ctcccgctga ccagttgacc gaccgcgacg aacggcgcac ctggctgcgg ctcgtccacg 23640ccgaccttcg accttgcccg acgcccccgg gagcggacta ccaccatgcc caacgacgaa 23700gaactcctcg actacctgaa gcggactgcc tcgaacctcc aggaggcgcg gcagcgggtg 23760cacgaactgg aggagagcga gcgcgagccg atcgcgatcg tggggatgag ctgccgtctg 23820cccggcgggg tgaacagccc ggaagagttc tggtcgctgc tggaggccgg gacggacgcc 23880gtctcggagt tcccgcggga ccgtggctgg gacgtggagc ggctgtacga cccggacccg 23940
gacgcccccg gcaagtcgta cgtgcgggaa ggcggattcc tcgacggcgc gggccggttc 24000gaccccgcgt tcttcggtat ctccccgcgg gaggccgtgg tcatggatcc gcagcagcgg 24060ctgctgctgg agtgctcgtg ggaggcgatc gagcggtcgc ggatcgaccc gaagaccctg 24120cacggcagcc gcgcgggcgt gttcgtgggc tcgaacggcc aggactacgg gacgcttctc 24180ctgcgtgccg acgaccgctc ccacgcctac ctcgccacgg gcgcctccgc gagcgtgctc 24240tccggccgca tctcctacac gctcggactg gagggccctg cggtcacgat cagtacggcc 24300tgctcgtcct cactggtcgc cctccacctg gcggcccgcg ccctgcgggc gggggagtgc 24360gagctggcgc tcgccggcgg tgtgacggtc atgccgacga cccgcctgtt cgaggtcttc 24420tcccggcagc gtggcctggc cggtgacggc cgctgcaagg ccttcgcggc cggggccgac 24480ggcactggct ggggcgaggg cgtgggcgta ctcgtcctgg agcggttgtc ggtggcgcgg 24540cggaacggtc atcgggtgtt ggcggtggtg cggggttcgg cggtgaacca ggacggtgcg 24600tcgaacggtc tgacggcgcc gaacggtccg tcgcagcagc gggtgatccg cgcggccttg 24660gccagtgcac gcctggcccc cgaggacgtg gacgccgtag aggcacacgg cacggggacc 24720tccctgggcg acccgatcga ggcgcaggcg ttgctggcga cgtacgggcg gggccgggac 24780gcggagcgtc cgttgtggct ggggtcggtg aagtcgaaca tcggtcacgc gcaggccgct 24840gccggtgtcg ccggtgtcat caagatggtc aaggcgatgc aggcgggcac gctgccccgg 24900acgctgcatg tggatgagcc gtcgggtgag gtggactggg actcgggtgc ggtgcggctg 24960ctgaccgagg cgcgggactg gccgtcggag gaaggtcgtc tgcggcgggc cggtgtgtcg 25020tcgttcggga tctccggcac caacgcgcac gtgattctcg aggagccgcc ggcggaggac 25080gcggtaccgg agcctgaagc gggtgatgtg gtgccgtggg ttctttcggc gcggtcggct 25140gaggcgttgc gggagcaggc tgcccggctg gcgtcggtgg ctggtgggtt gaacgtggtg 25200gatgtgggct ggtcgttggc ttcgacgcgt gcggcgttcg agcaccgggc cgtagtggtg 25260gggcgggagc gggaagagct gctcgcgggt ctgttcgctg tggctgcggg acgcccggct 25320gcgaacgtgg tgacggggcc cgtcagctcc ggtcggcccg cctttgtttt tgctggtcag 25380ggcagtcagc ggttggggat ggggcggggg ttgtatgagc ggttcccggt gtttgccgag 25440gcgttcgacg aggtgtgtgg gcgggtcggt ccgggggtgc gggaggttgt tttcggttcg 25500gatgcgggtg agttggaccg gacggtgtgg gcgcaggcgg ggttgttcgc gttggaggtg 25560gcgctgtttc ggttgttgga gtcctggggt gtgcggccgg gttgtctgat cgggcattcg 25620gtcggtgagt tgtcggcggc gtgtgtggcg gggttgtggt cgttggagga tgcgtgtcgg 25680gtcgtggctg cccgggcgcg gttgatgcag gcgttgccgg cgggtggggt gatggtcgcg 25740gttcgggccg aggcggggga gctggccggt ttcctcggtg aggacgtggt gatcgcgtcg 25800
gtgaacgcgc cggggcaggt ggtgatcgct ggtcctgagg ggggtgtgga gcgtgtggtg 25860gctgcttgtg gggcgcggtc gcgtcgtctg gcggtctcgc atgcttttca ttcgcctttg 25920gtggagccga tgcttgggga gttccgtcgg gttgtggagt cggtggcgtt cggtgtgccg 25980tcgttgcggg tggtttccaa tgtcacgggt gcgtgggtgg atccggagga gtgggggacg 26040ccggagtact gggtgcgtca ggtccgtgag ccggtgcgtt tcgccgacgg ggtcgccacg 26100ttgctcgacg cgggtgtgag gacgttcgtc gagctgggtc ccgctgggac gctcacttcg 26160atggtcagcc actgcgcgga cgccaccgcc acttcggtga cggctgtacc taccttgcgc 26220cccgatcacg atgagtcgcg gaccgtgttg agtgccgcag cgtccttgta cgtccagggt 26280cacccggtcg actgggcccc gctgttcccg cgggcccgca cggtggacct gcccacctac 26340cccttccagc accagcacta ctggatgatg aacaccggaa gtgccgccga gccggcggag 26400ctggggctcg gcgatgcccg tcatccgctg ctcggttccg tcgtcaccgt cgcgggggac 26460gacaaggtcg tcttcgccgg gcggctggcg ctgcgcacac acccctggct ggccgaccac 26520accgtgctcg acgcggtctt gctgcccgct acggccttcc tcgaactggc cgtgcgcgcc 26580ggtgaggagg tgagctgtcc ggtcgtacac gacctgacgc tgcaccgacc gctggtcgta 26640cccgagcggg gcgccgtgca ggtacagatg gctgtgggcg caccggaagc cgatgggcga 26700cgtgaggtcc gggtgtactc ccgccccgac gacgacgcgg agcacgagtg gacgctgcac 26760gccgctggac tgctggcgtc ggccgccacg gcggagcccg ccgtggcggc cggtgcctgg 26820ccgccgccgg aggcgcaggc cgtggacctc gacggcttct acgccggact cgccgagcac 26880ggctaccact acggcccgct gttccagggc gtccgggccg cgtggcggct gggcgacgac 26940gttctcgccg agatcgtgct gcccgaggcg gccggcgccg acgccgcccg gtacggcatg 27000catccggccc tgctcgacgc cgtcctgcac gcggcacggc tgggcgcctt ccgtgagcgg 27060tcggaggaga agtacctgcc gttcgcctgg gaaggcgtga ccctgcgtac caggggagcg 27120accgccgtac gtgctcgaat ctcccgggcc ggtaccgacg ccatccggct ggacgtcacc 27180gacaccgcgg accggccggt cctcacggcc gaatcgctca cgctgcgacc ggtctccgcc 27240ggtcagctca tggccgtccc gcgcgactca ctgttccggg tcgactgggt ttccgcgccc 27300gccgcgaacg gtcccggcct gcggctggcc cgtgccgcca ccgtggaggc ggccctcgcg 27360gcggacgccg acatcgtggt cgtgccatgc ctcgacagtg agggtccgca tcaggcgacg 27420taccaggcac tggagctgct acagcgctgg ctggccgccg acaccggtac caccacgctc 27480gccctgctca cccaccgtgc cgtggcggtc ggcgacgacg tccacgacct ccaccacgcg 27540cctctgtggg gcctggtccg caccgcccag accgaacacc ccggctgctt ccggctcgtc 27600gactcggacg accccgaccc gacgacggac gtcctggccg cggcgctcgc caccggggaa 27660ccccaggtcg cgatccgtga cggcgccgtc ctggccccgc ggctgaccgc ggcctccgcg 27720
ccgcgggagc cggccgagtg ggacgccgag ggaacagtcc tcatcaccgg cggatcgggc 27780gccctcgcag ggatcgtggc ccagcacctc gtcgcacgtc acggcgtacg ccgactcgtc 27840ctcgcgagcc gcagcggcag gcccgcaccg ggggccgacc tgctcgacgc cgacgtcacg 27900gccgtgtcct gcgacgtctc cgaccgcgac gccgtggccg cgctgctcgc ctccgtgccg 27960gacgaacacc cgctcaccgc cgtcgtgcac accgcaggcg tactggacga cggcgtcctg 28020cacgccctca cgaccgagcg catcgacacc tcgttcgcgg cgaaggtcga cggcgcccgt 28080catctccacg aactcacctc ccacctggat ctcaccgcgt tcgtgctgtt ctcctccgcg 28140tcggccgtgc tgggcgccgc cggacagggc aactacgccg cggccaacgc ctacctcgac 28200gcgctcgccg cccaccgtcg cagcaacgac ctgcccgccg tgtctctcgc gtgggggctg 28260tgggccgagc acgagggcat ggcccgcgga ctcggtgacg ccgagctgac gcgtatttcc 28320cggatcggcg tcaccgcgct gagcgcggag gacggcatgc ggctgttcga cgccggatgc 28380gccggcgatc agtcacagct cgtgccgatg cgggtggaca ccgcggcgct gcgcgcacgg 28440cgtgaccacc ttcccgcacc gatgtggagc ctggtccccg agcggacccg agcggcacgt 28500acacagcctg ccgcctcgct tcgggacagg ctcgccgaac tgaccgcccc cgaacgcaag 28560cgcacggtcc tcaacctggt gcgcaacgcg gtcgccgaca cactcggcca caacgccgcc 28620gacggagtac cgcccgacca gagcctcgac gccgccgggt tcgactcgct caccgccgtc 28680gagttccgca accggctctc cgccgtcacc gacctgcgcc tgcccgccac cctcacctac 28740gatcacccca cccccgcggc catcgccgag cacatcctga cccgcctcac cctgctgaag 28800gagaccgccg ccccggccgt cggcaccgcc ccggttgcgg cgccgaccga agacgatgcg 28860atcgtcatcg tgggcatggc gggccgcttc cctggcggcg tgcgcacacc cgaaggtctt 28920tgggacctcg tccactccgg cacggacgcc atctcggagt ggcccaccga ccgcggctgg 28980gacgtggaga acctctacga cccggacccc gacgccgtcg gcaagtccta cgtacggcac 29040ggcggattcc tgcacgacgt cgccggcttc gacgcgggct tcttcgggat ctcgccgcgt 29100gaggcgctgg cgatggaccc gcagcagcgg ctcctgctgg agtgctcgta cgaggccctg 29160gagcgggcgg gcatcgaccc ggccacgctc agaggcagcc ggtcgggcgt gtacgccgga 29220gtgatgtacc acgagtacgc ctcccggctg ggcgccacgc ccgcaggctt cgaaggcaca 29280ctcggcaccg gaagctcggg cagcatcgcc tccgggcgca tctcctacac attcgacctc 29340accgggcccg cggtcaccgt cgacaccgca tgttccacct ccctcgtagg cctgcacctg 29400gccgtgcagg ctctgcgggc cggtgagtgc gaactggccc tcgccggcgg cgtcaccgtc 29460atgcacacgc cgcgcccctt cgtcgagttc tcccgccagc gcggcctggc cgcggacggc 29520cggagcaagg ccttcgcggc ctccgccgac ggggtggcct gggccgaagg cgccggaatc 29580
ctcgtcctgg agcggctgtc ggcggcgcgg cggaacggtc atcgggtgtt ggcggtggtg 29640cggggttcgg cggtgaacca ggacggtgcg tcgaacggtc tgacggcgcc gaacggtccg 29700tcgcagcagc gggtgatacg tgcggccttg gcgagtgccg ggctgggtcc ggccgatgtg 29760gatgtcgtcg aggcccacgg caccggcacg gccctcggcg atccgatcga ggcgcaggcg 29820ttgctggcga cgtacgggcg ggggcgtgac gcggatcgtc cgttgtggct ggggtcggtg 29880aagtcgaaca tcggtcacac gcaggcggcc gcgggtgtgg caagcgtgat caagatggtg 29940caggcgatgc aggcgggcgt gctgccgcgg acgctgcatg tggacgagcc gtcgggtgag 30000gtggattggg actcgggtgc ggtgcggctg ctgaccgagg cgcgcgagtg gccgtcgggg 30060gaggggcgtg tgcggcgggc gggtgtgtcg tcgttcggga tctccgggac gaacgcgcac 30120gtgatccttg aggagccgcc ggcggaggac gcgctgccgg agcctgaagc gggtgatgtg 30180gtgccgtggg ttctttcggc gcggtcggca gaggcgttgc gggagcaggc tgcccggctg 30240gcgtcggtgg ctggtgggtt gaacgtggtg gatgtgggct ggtcgttggc ttcgacgcgt 30300gcggcgttcg agcaccgggc cgtcgtcgtg ggaggcgatc gggaagagct cctggggaag 30360ctttcctcgg tttcgggggt cgaggtcggg gtcggggtcg gtgccggtgg tggtgtggtg 30420ttggtgttcg ccggtcaggg gtgtcagtgg gtcggtatgg ggcgggagtt gctgggttcc 30480tcgctggtgt tcgcggagtc gatgcgggag tgcgcggcgg ctctgtcgcc gtttgtggac 30540ttttctgtgg tggatgttct gggttcggct ggggagttgg gtcgggtcga ggtggttcag 30600cctgcgttgt gggcggtgat ggtgtcgctg gcgcgggtgt ggcggtcgtg gggtgttccg 30660gttgctgcgg tggtgggtca ttcgcagggt gagattgccg cggcgacggt ggcgggtgcg 30720ttgagtgtgg gtgatgcggc gcgggtggtg gcgttgcgga gccgtttgat cgcggagcgt 30780ctgtcggggc tgggtgggat ggtttcggtg gcgttgtcgc gtgagcgggt ggtgtcgttg 30840atcgcgggtg tgccgggtgt gtcggtggcg gcggtgaacg gttcttcgtc gacggtggtc 30900tcgggtgagg ccgcggggct ggagagggtg ctggccgcgt gtgtgtcgtc gggggttcgg 30960gcgcgtcgta tcgatgtgga ttacgcctcg cattcggtgc aggtggagtt gatccgtgag 31020gagttgttgg gggttctgga cgggatcgtc ccgcgctcgg gtgagattcc gttcgtgtcc 31080acggtgacgg gtgagcggat cgacactgtc gagctggggg cggagtactg gtaccgcaat 31140ctccgtcaga cagtggaatt ccagtcggtg gtggagggtc tggtcgctca ggggtgtcgg 31200gtgttcctgg agtccagtcc gcatccggtg ttgacggtcg gcatcgagga gtccgcggat 31260cgggtcgtgg cgttggagtc gctgcgtcgt ggcgagggtg gtctgcggcg gttggtggat 31320gcggccggtg aggcgtgggt gcgtggggtg ccgatcgact gggcggggat gctcgccggc 31380ggccggcggg tcgacctgcc cacctatccc ttccaacacc agccctactg gctcgactca 31440ccacgacacc ctgccggaga cgtgaccgcc gtcggtctca cagaggccgg tcacgcgttc 31500
gtgccggcgg cggtcgacct gccggacggg cagcgggtct ggacgggacg actgtcgctt 31560ccctcctacc cgtggctggc cgatcatcag gtgctcgggc aggtgctgct ccccggcgtg 31620gtctgggtcg aactcgccct gcacgcgggg caccaggccg gatgcgactc tgtcgatgag 31680ctcaccctac agtcgccgct cgtgctcggt gcgtccgaca ccgtacaggt gagggtcgtc 31740gtcacggaga ccgaagagcc cggcacccgc accgtgtcga tgcactcgcg ccgtgacgac 31800ggcagctggg tgactcacgc cgaggggatc ctcggggcgg gcgggccgcc gccggagccg 31860ctgccggaat ggccgccgac cggcgccatg cccctcgatg tcgagggctt ctacgacgag 31920ctcgcggcgg gcggctacca ctacgggcct cagttccgct gcctgcggcg cgcctggcgt 31980gccggtgagg atctcgtcgc cgagatctcg ctgccggagg gcaccgacgt cgatgcgtac 32040ggcctgcacc ctggactctt cgacgcggcg gtgcacagcg tggcctgcgc ccggacgagc 32100gcgggggccg gcgatgacgg tccccggctg ccgttcgcct tctcggacgt ccggctcttc 32160gcgaccgggg tgacctcgct acgggtccgg atcgatccgc agaactcctc gtggcaggcg 32220tgggacgaat ccgggctgcc ggtcctcacc atcgggcggc tcgccggccg gcctgtcgac 32280gccgatcagt tcgccgtgcg gcgggcgggc cacctcttcc gcgtcgaaac gcggcacgaa 32340gccctggccg gcccggcccc cgcctcctgg gcggtcatcg gagcggaccc ggccgggtac 32400gccgcagccc tggaggccac gggcgcgcag gtgacgacgg ctgccgacct ggccggtctc 32460acatcggcac ccgaagccgc cctgttcacg ctccccggca caaaggacgc gggggtcacc 32520gaggaggtgc cgaccgctgt ccgggaggcg accgctcagg tgctggaggt gctgcaggac 32580tggctcaccg acggacgttt cgacgatgcc cgactggtcg tcgtaagccg cgaagcggaa 32640gacggcgatc tcctccacgg aacggcgcgc ggactgctgc gcgccgcaca ggccgagcac 32700ccggaccgca tcacccttgt cgacctcgat gctcatcccg cctcgctcac ggcccttccc 32760ggtttcgccc tcggtcccga accggaggtc gtcgtacgcg cgggagacgg cagggcaccg 32820cgcctggccc gggcgcaggc ccccaccgga gcgggctcac tgggcacggg cacggtcctg 32880atcaccggag gcacgggcac cctcggggga ctgctcgccc ggcacctggt ggagacgcac 32940ggagtcaccc ggctgctgct ggtcagccga cgaggaccgg ccgccgacgg cgcggaccgg 33000ctgcacgccg agctcaccgg gcatggcgca cacgtcgaca tcgtggcggc cgacctcggc 33060gaccgcacga gcgtggccgc gctcctcgcc acggtcgacg ccgaccaccc cctgtcggcc 33120gtcgtgcacg ccgccggagc gctggacgac ggcgtgctcg gcacccggtc cgccgactgg 33180ctcgacccgg tcctgcgccc caaggcggac gccgcttggc acctgcacga actcaccgcc 33240gaactgcctc tgaccgcctt cgtcatgttc tcctcggccg catccgtgct cggcgcggcg 33300ggacaggcca actacgccgc ggccaacgga tttctggacg cactggccgc ccatcgtgcc 33360
gcccggggac tgcccgggac ctcgctggcc tgggggctgt gggagcaccg cagcgaactg 33420acccggcaca cgggctcccc ctcccgcagc atcgcggccg tcggcgctct gtccaccgcg 33480gaggcccttg ccgccttcga cgccggcctg gcctccgggg agccgctggc agtgccgatc 33540cggctggagt cgacatccag tgaggaggta ccgccgatgc tgcgcggcct ggtccgcgta 33600cgccgccggg ccgccaccgg cacggaaccc gcggcgagcg cgggcgccgc gcaggaggtc 33660cggcagctgg ccgagttggg cgccgacgag cgacagcggc gcgtgcagcg gatcgtgctc 33720gacaccgcgg cggccgtcct cggccatgac agccacgacg ccatccccct cacccggggc 33780ttcctggagc tggggttcga ctccctgaca gcggtacggc tgcgcaaccg gctcgcccgc 33840cgactggggc tgcgcctgcc ggccacggtg gtgttcgacc accccagccc ggccgccctg 33900gccgcccacc tggtcgagca tctcgtgggc accgtcgacc cgaccgcgca ggccatggag 33960cagctggagg ctctgcgccg cagcgtgcac gcagccacac ccgccggtgg cctggaccgc 34020gccctggtga cccaacgcct gacggccctg ctcgacgaaa tgcggcacgt cgacggcccc 34080ggcggcaccg aaggccccga cggctccggg gacgacctgg agaacgcgac agcggacgag 34140atctacgccc tcatcgacaa cgaactgggc atcgggggta cgcagtgaac ggcgacgaca 34200aagcactggc ctatctcaag cgggtgaccg cggacctgcg gtcggcgaga gccaggctgc 34260aggaactgga gtccgccgac accgacccca tcgccatcat cggcatgggc tgccgtctgc 34320ccggtggcgt gcgcaccccc gaggacctgt gggacctcgt ggagaagaag catgacgcga 34380tcggcccctt ccccgccgac cgcggatggg acctcgagaa cctgtacgac cccgacccgg 34440acgcgccggg caaggcctac gtccgcgaag gtgggttcgt ccacgacgtc gccggcttcg 34500acgcgggctt cttcggaatc tcgccgcgtg aggcgctggc gatggacccg caacaccggc 34560ttctgctgga gtgctcgtgg gaggccctgg agcgggcggg catcgaccct tcctccctcg 34620agggcacccg caccggcgtc tacaccgggc tcatgaccca tgaatacgcg acccgactgc 34680cctcgatcga cgaggagttg gagggtgtca tcggcatcgg caacgccgga agcgttgcct 34740cgggccgcgt ctcctacacg ctcggcctga acggccccgc tgtcaccgtc gacacggcct 34800gctcctcctc gctcgtcgcc ctgcacctcg ccgcccaagc cctgcgccag ggccagtgca 34860cccttgcgct ggccggaggt gcctccgtca tcgcggcgcc gaccgtgttc gccaccttca 34920gccgacagcg gggcctcgcc cccgacggcc gctgcaaggc gttctcgtcc acgaccgacg 34980gcacgggctt cggcgagggg gtgggcgtac tggtcctgga gcgcctctcg gacgcccgtc 35040gcaacggaca cgaggtcctg gccgtcgtac ggggctcggc ggtcaaccag gacggagcca 35100gcagcggatt caccgccccg aacggaccgt cccagcagga cgtcatccgc gaggccttgg 35160ccgacggtcg actgacccct gcggacgtgg acgtcgtgga gggtcacggt acggggacgc 35220ggttgggtga tccgatcgag gcgcaggcgt tgctggcgac gtacgggcgg gggcgtgacg 35280
cggatcgtcc gttgtggctg gggtcggtga agtcgaacat cggtcacacg caggcggccg 35340cgggtgtggc aagcgtgatc aagatggtgc aggcgatgca ggcgggcgtg ctgccgcgga 35400cgctgcatgt ggacgagccg tcgggtgagg tggattggga ctcgggtgcg gtgcggctgc 35460tgaccgaggc gcgcgagtgg ccgtcggggg aggggcgtgt gcggcgggcg ggtgtgtcgt 35520cgttcgggat ctccgggacg aacgcgcacg tgatccttga ggagccgccg gcggaggacg 35580cgctgccgga gcctgaagcg ggtgatgtgg tgccgtgggt tctttcggcg cggtcggcag 35640aggcgttgcg ggagcaggct gcccggctgg cgtcggtggc tggtgggttg aacgtggtgg 35700atgtgggctg gtcgttggct tcgacgcgtg cggcgttcga gcaccgggcc gtcgtcgtgg 35760gaggcgatcg ggaagagctc ctggggaagc tttcctcggt ttcgggggtc gaggtcgggg 35820tcggggtcgg tgccggtggt ggtgtggtgt tggtgttcgc cggtcagggg tgtcagtggg 35880tcggtatggg gcgggagttg ctgggttcct cgctggtgtt cgcggagtcg atgcgggagt 35940gcgcggcggc tctgtcgccg tttgtggact tttctgtggt ggatgttctg ggttcggctg 36000gggagttggg tcgggtcgag gtggttcagc ctgcgttgtg ggcggtgatg gtgtcgctgg 36060cgcgggtgtg gcggtcgtgg ggtgttccgg ttgctgcggt ggtgggtcat tcgcagggtg 36120agattgccgc ggcgacggtg gcgggtgcgt tgagtgtggg tgatgcggcg cgggtggtgg 36180cgttgcggag ccgtttgatc gcggagcgtc tgtcggggct gggtgggatg gtttcggtgg 36240cgttgtcgcg tgagcgggtg gtgtcgttga tcgcgggtgt gccgggtgtg tcggtggcgg 36300cggtgaacgg ttcttcgtcg acggtggtct cgggtgaggc cgcggggctg gagagggtgc 36360tggccgcgtg tgtgtcgtcg ggggttcggg cgcgtcgtat cgatgtggat tacgcctcgc 36420attcggtgca ggtggagttg atccgtgagg agttgttggg ggttctggac gggatcgtcc 36480cgcgctcggg tgagattccg ttcgtgtcca cggtgacggg tgagcggatc gacactgtcg 36540agctgggggc ggagtactgg taccgcaatc tccgtcagac agtggaattc cagtcggtgg 36600tggagggtct ggtcgctcag gggtgtcggg tgttcctgga gtccagtccg catccggtgt 36660tgacggtcgg catcgaggag tccgcggatc gggtcgtggc gttggagtcg ctgcgtcgtg 36720gcgagggtgg tctgcggcgg ttggtggatg cggccggtga ggcgtgggtg cgtggggtgc 36780cgatcgactg ggcggggatg ctcgccggcg gccggcgggt cgacctgccc acctatccct 36840tccaacacca gccctactgg ctcgactcac cacgacaccc tgccggagac gtgaccggcc 36900cgggcgacga cgagttctgg gcggccgtgg agcacggtga ggcgaccgag ttggcggacc 36960tgctccggag gtcggcggcg gagccggggc aggatcttca cgcacccgtc gcggccctgc 37020tgccgacgct tgcaacgtgg cgtcgggacc ggcagcgcag ggcggctgtg gactcctggc 37080ggtaccggat cgtatggcgt ccggtcgcca cgccctcgta cgacagggtg ctgtcggggc 37140
gctgggctgt cgtcgtgccc gccggtcacg aggacgaccc cgtcgtcgac tgggtctgct 37200cggcgctgcg ggaccacggg ggcgagcccg aacgcatggt gctgggcccg cgggagagcc 37260gttcggcgct ggccacgcgg ctggccgccg atccccccgg gggcgtggtc tccctgctcg 37320gactgagcgg ggcggcgcac cccgaccacg aggtgctgcc cagtgccgtc gccggtaccg 37380tcctgcttgc ccaggccctc tccgacggcg ccgtacgagc accggtgtgg accctgaccc 37440gcaacggtgt gtccgcgacg gcgacggacc cggtggctcc cacgcacgcc gcgcaggtgt 37500gggccgtggc acgggtggcc ggtctggagc acccggaggc gtggggtggt ctgctcgacc 37560tgccggaccg tctcgacgac cgcgcggccg cccggttcgc cgcggtcctg tccgcgggcg 37620aggacgagga ccaactggca ttacgcgacg ctgggttgct ggcacgaagg ctggtgcgtg 37680cccccgttcc gcgcgacgcg gtgaccgccg gctggcagcc ccgcgacaca gcgctcgtca 37740cgggcggcac cggcggtctc ggcgggcagg tcgcccgctg gctggcggcc gcgggcgtac 37800ggcacctcgt gctggtcagc cgtcgggggg cggaggcgga gggcgcagac cgtctgcgcg 37860acgacctcac cgccctcggc gtacaggtga cgttcggcgc gtgcgacgtc gcggaccgcg 37920ccgcgctctc ggcgctcctc gaccgggttc aggaggacgg cccgccgatc cgcacggtcg 37980tgcacgcggc gggctccggt cgcgccgcca ggctgctgga caccgacgcc gaggagaccg 38040cggcggtgct gcgggcgaag tcggccggag cccggaacct gcacgaactc ctcgatgacg 38100tggacgcgtt cgtgctgttc tcctccggag cgggtgtgtg gggaagcagc gcccagggcg 38160cctacgcggc ggccaacgcc tacctggacg cactggccga acagcgcagg ggccaggggc 38220ggccggcgac ctccgtcgcc tggggcgcct gggccggtga cggcatgaca gccgccgccg 38280gcgaggaatg gtggagcagg cagggtctgc ggttcatggc ccctgaggcc gccctcgacg 38340cgctgcgcca ggccgtcgac cgcgccgaga gcacgctcgt cgtcgcagac atcgactgga 38400agacgttcgc tcccctcttc acgtcggccc gcagccgccc cctcatcacc gacatacctg 38460aagcccgccc cgaaccgagg ccggaaggcg cggaccagcc tacgcagggc ctcgtggcca 38520agctggcggt gctgtccgcg gacgaacggc ggcgcgccct gctcgccgag gtgcgggcgc 38580aggcagcggt ggtgctcggc caccccggcg cggacgccgt accggtcgac cggccgttcc 38640gcgagctcgg attcgactcc ctcagcgcgg tgaaactgcg caacaggatc gttgctgcca 38700ccgggctcga gcttccggcc accctggtct tcgaccaccc cacgtccacg gcgctcgccg 38760cctacctggg cgcccggctc ggaatcgacg gcgcccccgc ggggtccact ctgctggaag 38820acctcgcgcg gctcgagtcc accgtcgcca ccctgaccgc ggcacctctc gcagagaccg 38880tgccggacgc ccgggaccgc gcggcgctca ccacacggct gcgggcgttg ctggagcggt 38940gggaccaggc cgatggcgag gaccaggccg ccgcccgaga agaactcgac gatctgagcg 39000acgacgacct cttcgacttc atcgacgcga agttcggccg ttcgtgacct cggtcggccg 39060
ccgccaactc cacgtacacc ccgaagacca cgatcaccac gcgaaaagga cgggcctctc 39120catgggggac gagcagaaac tccgcaccta cctccggcgc gtcactgccg acctggccga 39180cgtgacggag cggttgcagc gagcagagga caagaacgcc gagccgatcg cgatcgtcgg 39240catggggtgc cgctaccccg gtggggtgcg gtcgcccgag gagttctgga acctgctcga 39300cgaaggcgtc gacgcagtgg ccggcttccc cgaggaccgt ggctgggacc tggagaacct 39360gtacgacccc gaccccgacg agccgggtaa gtgctatgcc cgcgaaggcg ggttcctcta 39420cgacgcgggc gagttcgacg ccgcgttctt cgggatatcg ccccgcgagg ccctgtccat 39480ggacccgcag cagcggctgc tgctggagtg ctcctggagt gccctcgagc gggcgggcat 39540cgacccgggc tcgctgcgcg gcaaagacgt cggcgtgtac gtcggcgcat ggaacagcaa 39600ctacggcagg ggcggcgggg cggagagctc cgagggccac ctgctgaccg gcaacgcctc 39660cagcgtggtc tcgggtcgcg tggcgtacgt gctggggctc gaaggccccg ccgtcaccat 39720cgacaccgcc tgttcctcct ccctggtcgg cctgcacctg gccgcccagg ccctcaggtc 39780cggcgagtgc ggtcttgcgc tggccggcgg cgtcaccgtg atgtccaccc ctctgtcgct 39840ggtgtccttc tcccggcagc gggggctcgc acaggacggt cgttccaagg cgttctcggc 39900ggacgccgat ggcatgggca tggccgaagg tgtaggcgta ctggtcctgg agcgcctctc 39960ggaggcgcgc cgcaacgggc acgaggtcct ggccgtcctg cggagctcgg ccgtgaacca 40020ggatggtgcc tcgaacggtc tgagcgcccc gaacgggccg gcgcagcagc gtgtcatcca 40080gtccgccctg accgtcggcc gtctcgcccc ctccgacatc gacgtcgtcg aggcccacgg 40140caccggcacg gccctcggcg atccgatcga ggcgcaggcg ttgctggcga cgtacgggcg 40200ggggcgtgat gcggatcgtc cgttgtggct ggggtcggtg aagtcgaaca tcggtcacac 40260gcaggcggcc gcgggtgtgg ccggggtcat caagatggtg ctggccctgc gcaagggcgt 40320actgccgcgg acgttgcatg tggatgagcc aaccggtgag gtggattggg actcgggtgc 40380ggtgcggctg ctgaccgagg cgcgcgagtg gccgtcgggg gaggggcgtg tgcggcgggc 40440gggtgtgtcg tcgttcggga tctccgggac gaacgcgcat gtgatcgtcg aggaggctcc 40500ggaggaggag ccccggccgg aggctccttc cgtcgacgtg gtgccgtggg ttctttcggc 40560gcggtcggca gaggcgttgc gggagcaggc tgcccggctg gcgtcggtgg ctggtgggtt 40620gaacgtggtg gatgtgggct ggtcgttggc ttcgacgcgt gcggcgttcg agcaccgggc 40680cgtggtggtg gggcgggact ccgaggaatt ggtgtcgggg ctttcctcgg tttcgggggt 40740cgaggtcggg gtcggggtcg gtgccggtgg tggtgtggtg ttggtgttcg ccggtcaggg 40800gtgtcagtgg gtcggtatgg ggcgggagtt gctgggttcc tcgctggtgt tcgcggagtc 40860gatgcgggag tgtgcggcgg ctctgtcgcc gtttgtggac ttttctgtgg tggatgttct 40920
gggttcggct ggggagttgg gtcgggtcga ggtggttcag cctgcgttgt gggcggtgat 40980ggtgtcgctg gcgcgggtgt ggcggtcgtg gggtgttccg gttgctgcgg tggtgggtca 41040ttcgcagggt gagattgccg cggcgacggt ggcgggtgcg ttgagtgtgg gtgatgcggc 41100gcgggtggtg gcgttgcgga gccgtttgat cgcggagcgt ctgtcggggc tgggtgggat 41160ggtttcggtg gcgttgtcgc gtgagcgggt ggtgtcgttg atcgcgggtg tgccgggtgt 41220gtcggtggcg gcggtgaacg gttcttcgtc gacggtggtc tcgggtgagg ccgcggggct 41280ggagagggtg ctggccgcgt gtgtgtcgtc gggggttcgg gcgcgtcgta tcgatgtgga 41340ttacgcctcg cattcggtgc aggtggagtt gatccgtgag gagttgttgg gggttctgga 41400cgggatcgtc ccgcgctcgg gtgagattcc gttcgtgtcc acggtgacgg gtgagcggat 41460cgacactgtc gagctggggg cggagtactg gtaccgcaat ctccgtcaga cagtggaatt 41520ccaagcatcc gtgcagacgc tcctcgccca ggggcaccag gtcttcctgg agtccagtcc 41580gcacccggtt ctcaccgtcg gcatcgagga gaccgttcac gagagcgccg cacaggccgt 41640cgttctggga agcctgcggc gggacgaggg tgccctcacc cggctcgtca cctccgccgg 41700tgaggcatgg gcgcgcggtg tgcccgtcga ctgggcgggc atgctcgccg gcggcaggcg 41760ggtcgagttg cccacgtatc ccttcctccg ggagcggctg tggctggagc cgtcgcgctc 41820ccgcaccggg aacctcaaca tggccgggct ggtcgaagcc ggacatgaaa tcctgcccgc 41880cgcagtggag ttgcccggag agcagtgggt gtggaccggc gagctgtcgc tctccgcgta 41940cccgtggctg gccgatcacc aggtgctcgg gcagaccctg gtgccgggcg tggcgtgggt 42000cgaactcgcc ctgcacgcgg gccaccagct cggtttcgga tccgtcgagg aactcaccct 42060gcaggcaccg ctcgtgctcg gcgagtccga cgccgtgcag gtcagagtcg ttgtctccga 42120tctcggggag agtgatcgcc gggcagtgtc ggtgcactcg cgtggtgacg accagacgtg 42180ggtgacccat gcggagggat tcctcaccgc gaaaggggcg cagccggaga ccatggccgt 42240gtggccgccg tccggtgcgg agccggtgga ggctgacggg ttctacgaac gcctcgccga 42300tgcggggtac cactatggcc cggtcttcca gggcgtgagc aaggtctggc gagctggcga 42360ggagatctac gccgaggtcg ggctgctcga cgacgccgac gtggacggct tcggcatcca 42420ccccgccctg ctcgacgccg ccctgcagac cgcctacgtc gcccaacggg gccccgcaga 42480gacgaagttg cctttcgcgt tcggcgatgt acagctgttc gccaccggtg cccggtcgct 42540ccgcgtacgg gtctcgccgg ccgctcagca ggggatggcg tgggaggcct gggaccccac 42600cggacttccg gtgttctccc tcgggtacct ggcgacccgg ccggtcgacc gcggccagct 42660gaccgtgaag cggcccgagt cgctgttcaa ggtggcctgg gacgagaccg tccccgtcgt 42720cgggaatgcg accgccgcgc atggcgtcgt gctgggcgac gacccgttcg ccctcggtgc 42780cgcgctgcgc gcggcgggct gggaggtcgg ggccgccccg gaacccgcgt ccgccgacac 42840
cgccgccgaa gtactgctgc tgccctgcac cgcgcccggc gagccggacg cggacctgcc 42900caccgcggtc agggccgtga ctgctcgggt gctcggcgtc ctacaggagt ggctcgccga 42960cgaacggctc gccggcaccc gactggccgt cgtgacccgc aacgccctgc cgggtgacct 43020cctgcacagc cccgtctggg gtctcgtgcg ctccgcccag accgagaacc ccgggcgcat 43080caccctcgtc gacctcgacg accaccccga ctcggcggcc gtccttgccg aggccgtcca 43140gtccgacgag ccgcgcatca tggtccgcga gggccggccc accgccgccc gcctggtccg 43200tgccaccgca cccgagctgg tgccgcccgc cggagccgat gcctggcgcc tcgagatcac 43260cgaaccgggc acgttcgaca acctcacgct gggcgtctac ccgcacgccg agaagaccct 43320cgccgacaac gaggtccggg tcgccgtcca cgcgggcggc ctcaacttcc acgacgtggt 43380cgccgcactc ggcatggtcg aggacgacct gaccctcggc cgtgaggcgg ccggcgtcgt 43440cgtcgaggtc ggagacgccg tgccggatct gacccccggc gaccacgtga tgggcatcct 43500gtcctccggc ttcgggccgc tcgccgtcac cgatcaccgc tacctggcac gcatgcccga 43560gggctggacg ttcgcccagg cggcttcggt gcccgccgcg ttcctgacgg cctactacgg 43620gctgtgcgac ctcggcggca tccgcgcggg cgaccgcgtc ctcatccacg cggccgccgg 43680cggtgtcggc atggccgccg tacagatcgc ccggcacctc ggggcggagg tgttcggcac 43740cgccagcccg cgcaagtggg gcgcgctgcg cgccctgggg ctcgacgacg cccacctgtc 43800ctcctcccgc accctcgact tcgagcagga gttcctggac gccaccgacg gcaggggagt 43860cgacctcgtt ctgaactcgc tggcccggga gttcgtcgac gcctcgctgc ggctgatgcc 43920cggcggcggc cggttcgtgg acatgggcaa gaccgacatc cggcggccgg aacaggtggc 43980ggaggaccac ggcggagtcg cctaccaggc attcgacctc gtcgaggccg ggccgcagcg 44040cacgggggag atgctcgccg agatcgtccg gctcttccaa gccggcgcgt tccggccgct 44100gccgatcacc cagtgggacg tgcgccgggc gccggaggcc ttccgacaca tcagccaggc 44160caagcacata ggcaagatcg tcctcaccgt gccccggccc atcgacaccg acggcaccgt 44220catggtcacc ggcgccaccg ggaccctggg cggcttcgtc gcccggcacc tggtcaccca 44280tcacggcata cgacgactgc tgctggtcag ccgcagcgcg gagcgcaccg acctggtgcg 44340ggaactcacc gagctgggcg ccgacgtcac ctgggcctcc tgcgacctag ccgacgccac 44400cgccgtcgaa gagaccgttc ggtccgtcga cgaacggcat ccgctcgtgg ccgtcgtcca 44460ctctgcggga gtactcgacg acggcgtcat cgacaagcag agccccgaac ggctcgacac 44520cgtgatgcgt cccaaggtcg acgccgcctg gaatctgcac cgactcctcg acaacgcccc 44580gctggccgac ttcgtgctct tctcctccgc cagcggcgtg ctcggtggcg ccggacagtc 44640caactacgcg gccgccaacg ccttcctcga cgcgctcgcc gagcaccgcc gtgcacaggg 44700
cctcgccgga caggcgctcg cctggggact gtggtccgac cgcagcacga tgacgggaca 44760gctcggctcc accgaactcg cccggatcgc ccgcaacggc gtcgccgaga tgtccgagac 44820ggagggcctg gccctcttcg acgccgcccg ggacaccgcc gaggcggtgt tgctgcccat 44880gcacctggac gtcgcgaggc tccgcagccg caacggagag gtacccgcgg tgttccgccg 44940gctgatccac gccacggccc gccgcaccgc gagcaccgcg gtccgcagcg ccggcctcga 45000acagcagctc gcctcgctgt ccggccccga acgcacggag ctgctcctgg gactggtgcg 45060cgaccatgcc gccgcggtgc tcggccacgg cacctccgac gccgtctcgc cggaccggcc 45120cttccgcgac ctgggtttcg actccctgac tgccgtggag ctgcgtaaca ggttcgccgc 45180cctcaccggc ctgcgtctgc cggccacgct cgtcttcgac cacccgagcc cgacggccct 45240cgccgggcac ctcgccggcc tgctgggcgc cgcgacgccc tccgcggccg agccggtcct 45300ggccgccgtc ggacggctgc gcgccgacct ccggtcgctc accccggacg ccgagggcgc 45360cgaggacgtg acgatccagc tggaggccct cctcgccgag tggcgggagg ccgcggagaa 45420gcgggctccg gaggcggtcg gtgacgagga cctgtccacc gccaccgacg acgagatctt 45480cgcgctcgtc gacagcgaac tgggtgaggc ctgatgacgg ccgaagcgtc tcaggacaag 45540ctgcgtgact atctgcgaaa gaccctcgcc gacctgcgga ccaccaagca acggctacgc 45600gacaccgaac gcagggcgac cgagcctgtc gcgatcgtcg gcatgagctg ccgactgccc 45660ggcgacgtac ggacaccgga gcggttctgg gaactcctcg acactggaac cgacgccctg 45720acgcccttgc ccaccgaccg cggctggaat ctcgacacgg cgttcgacga cgaacggccg 45780taccggcgcg aaggcggatt cctttacgac gccggacggt tcgacgccga gttcttcggc 45840atctcgcccc gtgaggcgct ggccatggac cctcagcagc ggctgctcct cgaaagctcg 45900tgggaggcga tcgagcacgc ccgcatcgac cccaggtccc tgcacggcag tcgcaccggc 45960gtctggttcg gcacgatcgg ccaggactac ttctccctct tcgccgcatc cggcggcgag 46020cacgccaact acttggccac cgcctgctcg gccagcgtga tgtccggccg cgtctcgtac 46080gtgctcggcc tggaggggcc cgctgtcacg gtcgacacgg cgtgctcgtc ctccctggtc 46140gccctccact ccgccgtaca ggccctgagg tccggcgagt gcgaactggc tctcgccggg 46200ggcgccacgg tcatggccac cccgacggtg ttcaccgcct tctcccatca gcgtggcctg 46260gccggtgacg gccgctgcaa ggccttcgcg gcgggtgccg acggggcggg cttcgccgag 46320ggggtgggcg tgctggtgct ggagcggttg tcggtggcgc ggcggaacgg tcatcgggtg 46380ttggcggtgg tgcggggttc ggcggtgaac caggacggtg cgtcgaacgg tctgacggcg 46440ccgaacggtc cgtcgcagca gcgggtgatc cgcgcggcgc tggccaacgc gcgcttggcg 46500ccggaggacg tggacgctgt cgaaggccac ggcacgggga cttcgctggg cgacccgatc 46560gaggcgcagg cgttgctggc gacgtacggg cggggccggg acgcggagcg tccgttgtgg 46620
ctggggtcgg tgaagtcgaa catcggtcat gcgcaggctg ctgccggtgt cgccggtgtc 46680atcaagatgg tgctggccat ggagaagggc cgtctccctc ggacgctgca tgtggatgag 46740ccgtcgggtg aggtggactg ggactcgggt gcggtacggc tgctgaccga ggcgcgggac 46800tggccgtcgg gggaggggcg ggtgcggcgg gcgggagtgt cgtcgttcgg gatctccggg 46860acgaacgcgc acgtgatcat cgaggagccg caggaggagg aagcggcacc ggattcctct 46920gcttcgggtg ccgtgccgtg ggtgctctcg gcgcgatcgg ccgaagcgtt gcaggctctg 46980gcttcacaac tcgccgacca cagcgccaaa tcgagtccgg tggatgtggg ttggtcgttg 47040gtttcgacgc gtgcggcgtt cgagcatcgg gccgtggtgg tggggcgcgg gcgggacgag 47100ttggtgcggg gcttgtccga ggtcgcgcag ggtcggggcg tgaggggtgt cgcgtcttcg 47160gcgtcgggtg gtctcgcgtt tgtttttgct ggtcagggca gtcagcggtt ggggatgggg 47220cgggggttgt atgagcggtt cccggtgttt gccgaggcgt tcgacgaggt gtgtgggcgg 47280gtcggtccgg gggtgcggga ggttgttttc ggttcggatg cgggtgagtt ggaccggacg 47340gtgtgggcgc aggcggggtt gttcgcgttg gaggtggcgc tgtttcggtt gttggagtcc 47400tggggtgtgc ggccgggttg tctgatcggg cattcggtcg gtgagttgtc ggcggcgtgt 47460gtggcggggt tgtggtcgtt ggaggatgcg tgtcgggtcg tggctgcccg ggcgcggttg 47520atgcaggcgt tgccggcggg tggggtgatg gtcgcggttc gggccgaggc gggggagctg 47580gccggtttcc tcggtgagga cgtggtgatc gcgtcggtga acgcgccggg gcaggtggtg 47640atcgctggtc ctgagggggg tgtggagcgt gtggtggctg cttgtggggc gcggtcgcgt 47700cgtctggcgg tctcgcatgc ttttcattcg cctttggtgg agccgatgct gggggagttc 47760cgtcgggttg tggagtcggt ggcgttcggt gtgccgtcgt tgcgggtggt ttccaatgtc 47820acgggtgcgt gggtggatcc ggaggagtgg gggacgccgg agtactgggt gcgtcaggtc 47880cgtgagccgg tgcgtttcgc cgacggggtc gccacgttgc tcgacgcggg tgtgaggacg 47940ttcgtcgagc tgggtcccgc tgggacgctc acttcgatgg tcagccactg cgcggacgcc 48000accgccactt cggtgacggc tgtacctacc ctgcgccccg atcacgacga gtcgcggacc 48060gtgttgagtg ccgcagcgtc cttgtacgtc cagggtcacc cggtcgactg ggccccgctg 48120ttcccgcggg cccgcacggt ggacctgccc acctacccct tccagcacca gcactactgg 48180atggaaagcg ccgcccggcc caccgtcgag gacaccccgc gcgagcccct cgacggctgg 48240acgcaccgca tcgactgggt gccgctggtg gacgaggaac cggcgcccgt cctggccggt 48300acctggctgc tcgttcgtcc cgaagaaggt ccccgcccgc tcgccgacgc cgtcgcggac 48360gcgctgaccc ggcacggcgc ctccgtcgtc gaggccgctc gtgtcccgca ccaatccgac 48420accgagctga ccggagtcgt ctctctgctg ggcccgggcg ccgacggcga cggcggcctg 48480
gacgcgaccc tgcggctggt acaggacttg gccaccgccg ggtccaccgc gcccttgtgg 48540atcgtcacca gcggagccgt ggccgtcggt acgtccgaca ccgtgccgaa ccccgagcag 48600gcgacgctct gggggttggc ccgggcggcg gccaccgagt ggcccggcct gggggcggcg 48660cgcatcgacc tgcccgccga cctcaccgag caggtcggac gtcggctctg cgcccggctg 48720ctcgaccgga gtgagcagga gacggcggtc cgacaggccg gggtgttcgc caggcggctg 48780gtccgtgccc gtaccagcga cggccggtgg acgccgcgcg gcaccgtgct ggtcaccggc 48840gggaccggcg cgctcgccgg acacgtcgcg cgatggctgg cggaggaggg ggccgagcac 48900atcgtgctgg ccgggcgcag agggcccgac ggtcagggcg ccgaggcgct gcgcgccgac 48960ctggtcgccg caggggtcaa ggcgacgatc gtgcgctgcg acgtcgccga ccgggatgcc 49020gtacgtctgc tcctggacgc acaccggccc agcgccatcg tgcacacggc cggggtcgtc 49080gacgacggac tgctcacctc gctgacgccc gcccaggtcg agcgggtgct gcggcccaag 49140ctgctcggcg ccaggaacct gcatgagctg acccgggacc gggaactgga cgccttcgtg 49200ctgttctcct ccctcgccgg agtcctcggc ggggcagggc aggccaacta cgccgctgcc 49260aacgcctact tggacgccct ggccgcacac cgcaccgcgc atgggctgcc ggcggcctcg 49320ctggcatggg ggccgtggga gggcgacggc atggccgcgg cgcaggaggc cgccgaccgg 49380ctccgccgca gcggtctcac cccgctgccg ccggagcagg ccgtacgggc cctcggccgg 49440ggccacgggc cgctggtggt ggccgacgcg gactgggcgc ggctggccgc cggctcgacg 49500cagcgcctgc tcgacgagct tcccgaggtg cgtgcggtca ggccggcgga gcctgctgtc 49560ggacagcgcc ccgacctacc ggcccggttg gcggggcgtc cggccgagga gcagtccgcg 49620gtactgctgg aggcggtccg ggaggagatc gccgccgtac tgcgttacgc cgatccggcg 49680cggatcggcg ccgatcacga gttcctcgcc ctcggcttcg actcgctgac atcgatcgaa 49740ctgcgcaaca ggcttgccac gcgcatcggt ctgacgcttc ccgcgacgct caccctggaa 49800cagcgcaccc ctgccgggct cgccgcgcac ctgcgcgagc ggatcgcgga ccggcccgtc 49860gggtccggtg ccgtcccggt gcccgggagc gctgatgtcc cggaggcggg cggcggtagc 49920ggcctcggtg agctgtggca ggaagccgac cggcacggcc ggcggctgga gttcatcgac 49980gtactcaccg cggccgccgc cttccggccc gcctaccgtg aaccggccga gctggagctg 50040ccgcctctac ggctcacctc cggcggggac gagccgcccc tgttctgcat cccctcgcac 50100ctcggcaagg ccgacccgca caagttcctg cggttcgccg cggccctgcg gggacggcgg 50160gacgtcttcg tcctgcgcca gcccggcttc gtacccgggc agcccctgcc cgcgggcctc 50220gacgtcctgc tcgacaccca cgcgcgggcc atggccgggc acgaccggcc cgtgctgctc 50280ggctactcgg ccggcggtct tgccgcgcag gcgttggccg cccgactcgc cgagctcggc 50340aggccgccgg cggccgtcgt gctcgtcgac acctatgccc ccgacgagac ggaggtgatg 50400
gcccgtatcc agggcgccat ggagcagggc cagcgcgatc gcgacggcag gaccggtgcc 50460gccttcggtg aggcctggct caccgcgatg ggccactact tcggcttcga ctggaccccg 50520tgtccggtcg acgtgccggt gctgcacgta cgcgccggcg accccatgac cggtatgccc 50580gtcgaagggc ggtggcaggc gcgctggaac ctgccgcaca ccgccgtcga cgtgcccgga 50640gaccacttca cgatgatgga ggatcacgcc ccgcgcaccg ccgacaccgt gcacgactgg 50700ctcggcacgg ccgtccgccg ccctgagaga acccgcgact gacgactcgc cggcgacagc 50760ggcatcccgc cctgtcccct tcctgtccgt ccgttccctt tcctctcctc gaaacggagt 50820tcgttctcat gccttccttc cccgtacgcc ggtccgtgcc cgacactccg cccgccgagc 50880acctcgaact gctcaaggag agcggcggcg tctgcccctt caccatggag gacggccgtc 50940cggcctggct cgcggccagc cacgacgccg tgcgctccct gctcgccgac cgccgtatca 51000gcaacaaccc ggcgaagacg ccgcccttct cgcagcggga ggccctgcag aaggagcggg 51060gccagttcag ccgtcacctg ttcaacatgg actcgccgga gcacgacgtg gcccgccgca 51120tgatcgcgga ggacttcact ccccggcacg ccgaggcggt ccggccgtac ttcgaggagg 51180tgttcggcga gatcgtcgac gaagtggtcc acaagggccc accggccgag atgatcgagt 51240cgttcgcctt cccggtcgcc acccgcacca tctgcaaggt gctggacatt ccggaggacg 51300actgcgagta cttccagaag cgcaccgagc agatcatcga gatggaccgc ggcgaggaga 51360acctcgaagc cgtcgtcgaa ctgcgccgct acgtcgacag cgtcatgcag cagcgcaccc 51420gcaagcccgg cgacgacctg ctcagcagga tgatcgtcaa ggcgaaggcg tccaaggaga 51480tcgagctcag cgacgccgac ctggtcgaca acgcgatgtt cctgctggtg gccgggcacg 51540agccgtcggc caacatgctg ggcctcggcg tgctcgccct cgccgaattc ccggacgtgg 51600ccgaggaact gcgggccgag ccgcacctgt ggccgggcgc gatcgacgag atgctccgct 51660actacaccat cgcccgggcc accaagcggg tcgcggccgc cgacatcgag tacgaggggc 51720acacgatcaa ggagggggac gccgtcatcg tgctcctcga caccagcaac cgcgacccga 51780aggtgcacgc cgaaccgaac cggctcgaca tccaccgctc ggcgggcaac cacctggcct 51840tcagccacgg accgcaccag tgcctgggca agcacctcgt ccgggtccaa ctggagatcg 51900cgctgcgggc tgtcgccgag cggctgcccg gcctgcgcct ggacatcgcc aaggaggaca 51960tccccttccg cggtgacgcc ctgtcctacg ggccgcgcca gctgcgcgtc acctggtaac 52020agccaccatc ggcccccgcc gcggaccggg cagcacgacc cggtccgcgg cgggggcacc 52080accaccgtca acatccccag agaggcttcc ccgtggagaa gaccgacgtc gaccggctgc 52140gcacactcga ccgagagcac atgtggtacc cgtggacgcc gatgaccgag tggatggccc 52200gtgatcagct cgtcgtcgaa cgcgccgaag gctgctggct gatcgacgca gacggtaagc 52260
gctacctcga cggccgctcg tcgatgggca tgaacctgca cggccacggc cgcagcgaga 52320tagtcgaggc cctggtcgcc caggcgcgca aggccggtga gaccacgctc taccgcgtct 52380cgcacccggc ggcggtggaa ctcgccgccc gcctggcatc gatggcgccg gccgggctcc 52440agcgcgtctt cttcgccgag tccggatcga ccgcggtgga gacggctctc aaggctgcct 52500acgcctactg ggtcgcgaag ggcgaaccgc agcgatccac cttcgtgtcc atggagggcg 52560gttaccacgg cgagacccta ggcacggtca gcctgcgcgg caccaacggc gaacaggtcg 52620acatgatccg caagacctac gagccactgt tgttcccctc cctctccttc caccagcccc 52680actgctaccg gtgtcccgtc ggccagtcgt cggacagcga ctgcgggctg gagtgcaccg 52740attcgctgga gaacctcctc acccgggaga agggccggat cgccgcggtc atcgtcgagc 52800cgcgggtcca ggccctcgcc ggagtgatca ccgccccgga gggacacctc gcgaaggtcg 52860cggagatcac ccgcaggcac ggagtgctcc tcatcgtcga cgaggtcctc accggctggg 52920cccgcaccgg cccgacgttc tcctgcgagg ccgagggcgt cacaccggat ctgatgacgg 52980tgggcaaggc gctgaccggc ggatatctgc cgctgtcggc caccttggcc acggaggaga 53040tcttcggagc cttccgtgag agcgtcttcc tcagcggcag cacctactcc ggatacgcgc 53100tcggggcggc cgtcgccctg gccagcctcg acctgttcga gaaggaggac gtaccggccc 53160gggccaaggc gctcgccgac gtgctcacca ccgcactgga acccttccgc gcgctcaccc 53220acgtcggtga cgtccggcag ctcggcctca tcgccggcgt cgagctggtg gccgaccggg 53280agacccgcgc cccctacccg ccccaggagc gcgtcgtcga tcgcatctgc accctggcca 53340gggacaacgg cgtgctggtc aacgcggtcc ccggggacgt gatcaccatg ctgccctcac 53400cgtcgatgag ccccgacgac ctgcgcttcc tcaccggcac cctgtacacg gccgtccgag 53460aggtgaccga agagtgaaag ggctgatgcg ggcggccgtc atccgtgcct ggggcggccc 53520cgagcggctg accctggacc gggtcgaacg gccgtcaccc ccgcccggat ggatcgccgt 53580acgcgtcgag gcctgcgccc tgaaccacct cgacatccac gtgcgcaacg ggcttccggg 53640cgtacggctg gaactcccgc acgtctccgg cggcgacgtc gtcggcgtcg tcgagcaggc 53700caccgacgag gcgggggaga gactgctcgg cagccgtgtg ctgctcgacc cgatgatcgg 53760gcgcggcatc ctcggcgagc actactgggg cgggctcgcc gagtacgtcg tcgcacccgc 53820ccacaacgcg ctccccgtcc ccgatcagga cgcggacccg gcacgctacg ccgcactgcc 53880catctcctac ggcacggccc agcgcatgct cttcagccgc gcccggctgc gtcccggcga 53940gagcgtgctg ctgttcggcg cgaccggcgg cgtcggcgtc gcctgcgccc agctcgccct 54000gcgtgccggg gcccggatca tcgcctgctc cggatcaccg gccaagctcg cccggctgcg 54060ccgactcggc gtgatcgaca cgatcgacac cggcaccgag gacgtacggc gcagggtccg 54120cgaactcacg gacggcggtg ccgacctggt cgtcgactac cagggcaagg acacctggcc 54180
cgtctccctg cgctcggcgc gcgccggcgg ccgcatcgtc acctgcggcg cgaccaccgg 54240gtacgaggcg acgaccgacc tgcgctacgt gtggtcgcgt cagctggaca tcctcggctc 54300caacgcgtgg caccgcgacg atctgcacac gctggtcgac ctggtggcca ccgacgccct 54360ggaaccggtg gtgcacgccg acttcccact ctcccgcgcc cccgaggcgg tcgccgaact 54420ggaggagcgc cgggcgttcg ggaaggtcgt gatccgcacg gcgtgaactc actcatgtcc 54480cggctcgatc ccagggggaa acagcgtgac cggcaacacc acatccgccg ccttcctgcg 54540gcggacacag aacgcgctcg ccatgcagcg caagatatgc gcccagcccg aggagaccgc 54600ggagcgcgtg ttctccgaca tcctctcggt gtcacgagac accggcttcg gccgcgaaca 54660cggcctcgcc ggggtccgca cccgccagga gtggcggcgt gccgtgccca tccgcaccta 54720cgacgaactg gccccctacg tcgagcggca gttctccggc gaacgccgcg tgctcaccac 54780cgacgacccc cgcgccttcc tgcgcacctc gggatcgacc ggccgcgcga agctggtacc 54840caccaccgat cactggcgcc gtgtctaccg cggaccggcg ctgtacgcgc agtgggggct 54900ctacttcgaa cagatcggca cgcatcggct caccggcgac gaggtcctcg acctgtcctg 54960ggagcccggc cccatccggc accgactgcg cggcttcccc gtctacagca tcaccgagcg 55020ccccgtgtcg gacgaccccg acgactggaa cccgccgtgg cgtcacgcga ggtggttcac 55080ccgcgatgcc ggtgccgcga ccatggccga cctgctctac ggcaaactgc tgcggctggc 55140cgcccacgac ctgagactga tcgtctcggt gaacccctcc aagatcgtcc tgctcgccga 55200gacactgaag gagaacgccg aacgcctgat ccaggacctg cacgacggcc acggcacgga 55260ccgggcagcc cgcccggact tcctccgccg cctcaccgcc gccttcgacc gcaccggagg 55320ccgtccgctg ctcaccgacc tgtggcccgg cctgcgtctg ctcgtctgct ggaactccgc 55380ctccgcggcg ctgtacgggc cctggctgtc ccggctcgcg accggcgtgg cggcactgcc 55440gttcagcacc acgggcaccg agggaatcgt cacgctgccc gtcgacgacc acctctcggc 55500ggggccgctc gctgtcgacc aggggcattt cgaattcgtt ccgtggcagg acctggacga 55560cggcagccct ctgcccgagg acacccccac cctcggctat gacgaactcg aactcggcgc 55620cgactaccgg ctcgtcatga gccaggccaa cgggctctac cgctacgacg tgggcgacgt 55680gtaccgcgtc gtcggagcgg tcggcgccac gccacggctg gagtttctgg gacgcgcggg 55740attccagtcc tccttcaccg gcgagaagct caccgaatcc gatgtgcaca ccgccgtgat 55800gcgggtcctc ggcagcgaac gcaccgacca cccgcacttc tccggcatcc cggtctggga 55860caccccgccc cactacctcg tcgccatcga atgggctgac gcccacggca cgttgaacgt 55920gcaggacaca gcccgccgca tcgacgcgac tctccaggaa gtcaacgtgg aatacgccga 55980caagcgccgc agcggacgac tgcggcccct gcagatcctg cccctggtgc ccggcgcttt 56040
cggccagatc gccgaacgaa ggttccgcca gggcaccgcg ggagcccaga tcaaacacca 56100ctggctgcag aaggactcgg cgttcctcga cacgctgcgc gacctcgacc tcgtccgcgc 56160ccgcccgggg acgtgacggc atgcgcatcg gattcgccgc acccatgtcc ggcccctggg 56220ccaccccgga caccgccgtg cacgtcgccc gcaccgccga acagctcgga tacgcctcgc 56280tctggaccta ccagcgagtc ctcggcgcgc ccgacgactc ctggggcgag gccaaccgca 56340gcgtccacga ccccctgacc accttggcct tcctggccgc gcacaccacc gggatccggc 56400tcggtgtcgc cgttctgatc atgccgctgc acacccccgc ggtgctggcc aagcagctca 56460ccaccctcga cctgctctcc ggcggccgac tcgacgtggg cctcggcaac ggctgggccg 56520ccgaggagta cgccgccgcc ggcgtgaccc ccaccgggct cagccgccgc gccgaggact 56580tcctcgcctg tctgcgggcc ctgtggggtg agcagaccgt ggtggaacac gacggcccct 56640tctaccgggt cccgcccgcc cgcttcgacc cgaagcccgc ccagtccccg cacccgccgc 56700tgctcctggg cggcgccgcg cccggcgcac tgcgccgcgc cggccgcctg tgcgacggct 56760ggatcgcgag cagcaaggcc ggcccggccg ccatccgcga cgccatcacc gtcgtacgcg 56820acagcgctga gcgaaccgga cgcgaccccg cgaccctgag gttcgtctgc cgcgccccgg 56880tccggctgcg gacccggtcg gcccccaacg agccgccgct gaccggcacc gcggagacga 56940tccgggccga tctcgccgcg ctagccgaca ctggcctgac cgagatcttc ctggacccca 57000acttcgaccc cgagatcggc tcaccggacg cgccgaccgg cgacgtgcga caccgcgttg 57060atctgctgct gcacgaactg gcccccgcaa actggtgaga ggaagagaac agtgctgatc 57120gcgcgcgccg ccgtcggaga agaccgaacg tacgcccgcg tcgacacgga cacagggctg 57180atccacctcc tggccggcac tccctacgac gagatccggc cgaccggcga aaccagaccg 57240cttgccgagg cccgcctgct cgcaccggtc gaacccagca aagtgctggt cgcaggacgc 57300aattacggcg atgtcgtcac accggacctg gtggtcttca tgaagccgtc cacctctgtc 57360gtcggcccca ggagcaccgt cctgctgccg gcggaggcca agcaggtccg gtacgaggga 57420gaactcgccg tggtgatcgg gcgccgctgc aaagacgtcc ccgaagacac cgcggaccag 57480gccgtgttcg gctacacctg cgccaacgac gtcaccgcct gggacgtcgg ggaaccgaag 57540ggccactgga ccaaggcgaa gagcttcgac acattctgcc cgctgggacc atggatccgc 57600accgatctcg accccgctga cctcgtcctg cgcacaaccg tgaacggcac gctgcgccag 57660gacggctcca ccaaggaaat gaacaggaat gtccgcgccc tcgtgtcccg ttgcagctca 57720ctgatgacgc tgctgcccgg agacgtgatc ctcaccggca caccggcggg cgccggcgtg 57780ctgcgtccgg gtgacgaggt cgtcgtcgag attgacggga tcggttcgct cgcgaatccg 57840atcggcgtgg ccaagtagtt cactgactac actcgcgcga acaacacggg cccgtctgcg 57900gcgcttcgag ctgcgccgat ccccgaggag agattccagt gtctgtaatc cgtcccaccg 57960
ccgaaaccga acgcgcagtc gtggtggtcc cggctgggac gacgtgcgcc gacgcggtca 58020ccgcggcaaa gctgccgcgc aatggcccca acgcgatcgt cgtggtgcga gacccgtccg 58080gcgccctgcg tgacctcgac tggacccccg attccgacgt cgaggtcgag gccgtcgcgt 58140tgtccagcga ggacggcctc acggtgctgc gccactccac ggcacacgta ctggcccagg 58200cggtccagca actctggccg gaggccaggc tcggtatcgg cccgccgatc gagaacggct 58260tctactacga cttcgacgtg gagcgcccct tccagccaga ggacctcgag cgcgtcgagc 58320agcggatgaa ggagatcatc aagtccggcc agcgcttctg ccgccgcgag ttccccgatc 58380gggaagcggc ccgtgccgag cttgccaagg agccgtacaa gctcgagctc gttgacctca 58440agggcgacgt ggacgccgcc gaggcaatgg aggtcggcgg gagcgacctg acgatctacg 58500acaacctcga cgcgagaact ggagatgtgt gctggtccga cctctgccgc ggcccccact 58560tgccgtcgac ccgcctgatc ccggcgttca agctgctgcg caacgcggca gcctactggc 58620gcggcagcga gaagaacccc caactgcagc gcatctacgg cacggcctgg ccgacccgcg 58680acgagctcaa gtcccatctc gccgccttgg aggaggccgc caagcgtgac caccgccgca 58740tcggcgagga actcgacctc ttcgcgttca acaaggagat cggccgcggc ctgccgctgt 58800ggctgcccaa cggcgcgatc atccgcgacg aactcgagga ctgggcccgc aagaccgaac 58860gcaagctcgg ctacaagcgc gtcgtcaccc cgcacatcac ccaggaggac ctttactacc 58920tctcaggcca tctgccttac tacgcggagg acctgtacgc gccgatcgac atcgacggcg 58980agaagtacta tctcaagccg atgaactgcc cgcaccacca catggtgtac aaggcgcgcc 59040cgcacagcta tcgcgacctg ccctacaagg tcgccgaata cggcacggtg taccgattcg 59100agcgcagcgg tcagctgcac ggcatgatgc gtacgcgcgg tttcagccag aatgacgcgc 59160acatctactg cacggcggac caggccaagg accagttcct ggaagtcatg cgcatgcacg 59220cggactacta ccgcactctg gggatcagcg acttctacat ggtgctcgcg ctgcgtgact 59280cggcgaacaa ggacaagtac cacgacgacg agcagatgtg ggaggacgct gagcggatca 59340cccgggaggc catggaagag tccgacatcc ccttccagat cgacctgggc ggtgccgcgc 59400actacggccc gaaggtcgac ttcatgatcc gagccgtcac cggcaaggag ttcgccgcct 59460ccaccaacca ggtcgacctg tacaccccgc agcgtttcgg gctgacctac cacgactccg 59520acggcaccga gaagcccgtc gtggtgatcc atcgcgctcc gctcggctcg cacgagcgct 59580tcaccgccta tctcaccgag cacttcgcag gtgccttccc ggtgtggttg gcgccggagc 59640aggtccggat cattccgatc gtggaggaac tcacggacta cgccgaggaa gtccgcgaca 59700tgctgctgga cgcggacgtg cgtgccgacg tcgatgccgg cgacggccgg ctgaatgcca 59760aggtacgcgc ggccgtcacc cggaagatcc cgctcgtcgt ggtggtcggc aggcgagagg 59820
ctgagcagcg caccgtaacc gtgcgcgacc gctccggcga ggagaccccg atgtccctgg 59880agaagttcgt ggcccatgtc actggactca tcaggaccaa gagcctggac ggcgccggcc 59940acatccgtcc gctgtccaag gcctgaccca cagccacggg gccccggcag gtgtcccgcc 60000tcggaccacc cccttcggtc ctcagccgac ggcgggctca tggcagccgc ccgacctgcc 60060ggtgccgtgg ctgttcggca acccgtgggc gccgcccgcc gaggagaccg cgcgctgccg 60120ggggatgatc tcgtccggcc cgcgccccgg gctcaccggg cggcgctgga gcgggccgga 60180cgggagccgg gaccggccga ccgtccgtgg tcggtctcgt cccggacgag cagggacagc 60240agtgcggcca cggtgaggcc cgcttccgcc gggtggcgca ggaccttgtc cggttcgacg 60300cggtagatgt tgctgcgccc gtcacgggtg tgggagagat agccgtcctg ctccaggtcc 60360gagatgatcc gctggacggc gcgctcggtg agtctgcagt gggcggcgat gtcgcggatc 60420cgcacgttcg gattgtcggc gatggccgcc agtacacgcg cgtggttggt gacgaacgtc 60480catccggagt gagattcagg cactgcaacc atgcacagca ttgtagggac catctttgcc 60540ggacagccaa tacatgacat acttttcgcg ttaagagtgg catgttctgt cccatgggca 60600actgagaagg gacccgaggg tgtctttgga tgaagcggtc gcggggtgct cgcgccacac 60660cggccggcgt cggctcccgg ccgcggagca acccacgcag gcgcagtacg aagcgcacgg 60720cgcctgggtc gtcagcgcac ggggcgcata cgacatgaac tcggtcgagc ccttggccga 60780cgcgttgaaa gacgcggccg agaagtctcc gaaggtggta ctggacgcct ccggcatcac 60840cttcgccgac tccaccctgc tgagtctgct gatcctcacc caccaggcga cggacttccg 60900ggtggccgcg ccgacgtggc aagtgatgcg gctcatgcaa ctgacgggcg tcgacgcctt 60960cttgaaggta cgggccacgg tggaagaggc cgccaccgct taggggcacg gcgtgccggg 61020cctcggctga cgcaagccga tggcttggag ctgagaattc cgggcattcg acgttctgcc 61080tggcccccgg ccgtcgatgg tggccggcca ggcgtgatga agacagtcac ctcctcgagg 61140cgcgatcgac cgcgcctcgg gggagggcgg ttgacgggag agggaaggtg tccatgattc 61200tgccggcgga gaaggaactg cgtgccgtgc tggctcggtt cgctcaggcg cgcatcgacc 61260acgacgtacg tcccagcggc tgcaccagca ggctcctcga ggacgccacg tacaccctgt 61320gcgtgatgac cggtgcccgt accgccgaac aggctctgcg tacggcggac gaacttctcg 61380cacagttcgc cgagcgcacc gctgcccccg tggaggacga agccctggcc gcgtgagccg 61440acggcacaca cctgcggcgc ctcgcgtggc aggtgtgtgc ctgccggcgg gcggacgcga 61500gcacctgagg aaatgagaga gagtcatgag cgatacccgg cttcggcagc gcgatgagac 61560gtcgaagggg ccggccaccg agatcccggc gccgcagtgg cgggacctct tcctcgcccc 61620cgactggggc ggcactgatg agcaggtgat cgtcgccgaa gaggcgcgcg ggcccgagca 61680cttcaccgga gcgcgccgtc cgcgcggcgg ccgccgatcg agtcgacggg ccgcgtgatg 61740
cgcggccctg ccgcgacggc cgcaggtcag gtgagggcga tccgtgcggt gatgcgcttg 61800ccggacggct cgggccggat ctcgacggcc tggctcagcg ccgccacgat ctccagaccg 61860tgctgaccca cccgggcggg atcggcgggc cggggagcgg gcagggtggt gtcaccgtct 61920cgcacggtga cagtcaccgc gtcgtccgtg aggctcaggg tgagttctat ggggtcggcc 61980ccgtacttga ccgcgttcgt gatcagctcg ctcaccacca ggtggacggc ctccgacgct 62040ctctccggca ccggcgaccg aaggtcccgc tgtgaacggg tgaggtagtc ggtcgcgaag 62100tgacgggcgt cggcgatccg cagcgcttcc cgccggtacg tcaccgaggc cgcccgcgga 62160tccgcaccct ccggtgcccg ctgtgtcgac gaaccgtcca gtccggtctc acccatgtca 62220accgccacgt tacccccgag ccacgcacgc gcgccgacgc ctcccgcgcg atgagaacat 62280ctcatgtgtt cctacgatag ttctgctttc cgtcggtcac cgcacccgtc ggccagggag 62340aaagcggggg cctggacgtg atccgggcct caggccgtgc tgagcacgcc tccgcgcaag 62400cgggccggca gccgctccgg aatccgtgcg gtcgtcgtcg ccatgatgtc cctccccgtt 62460ccgatggccc gctcgcgtga cgggccactc ggcggctacc ccctgcgcgg gctcgcatgc 62520acggaggcgg agatcttgtc cgaggccgtt ccgctcccgc ccgcgcgacg tgatcaggtc 62580ggcggttacg ggatcaggaa ttccagcacg ggtcggtccc aggccaccgc gggcgggttc 62640gcgcgggcgg ttccggtggg cagggcgccc acagcgcggt agaagccctc ggccggaggg 62700tgcgacacca cccggacacg gtccagccct gccgcgcggg cccgcctctt catgtgatcg 62760acaagcagcc gtccgatgcc gcggccctgg gtaccgtcct ggacgaacag caggtccagc 62820tccgccggcg cgaggagcag cgcgtagaag ccgagcaccc ggtccgtggc gtcctcggcg 62880tcgacgctac gaagacctgg tggttctcga tgtagtcggg cccgacgcgg tagtcggaga 62940ccatcgccgc gtacgggccc tcgtaggctc gtgagccgcg tacgagacgc gagagccgct 63000tggcgtcccg ggcgaccgcc cggcggatga cgatctcgcc ccgtacggac gcggaactcg 63060attgcacggg gagcagtcta cgcgtccggg acgggccggg acctccgcgg gctccgtccg 63120agccttccgt cagtccgtcc cgatgacgac cacctcagtc cgtcccgatg acgaccacct 63180cgtcctcggc cgtccaccgg cgccgctcgc gtttgggcgg attgatccgc actccgtagt 63240gggggcgcgt cgacgcgtcg gcgtggtcgc ggtaaccgat ggcgcactcg ccgcgacggc 63300gtgccgcggc cacgacggtg gcgaaggacg tggtgctccc tggcaacagg tagtcggtcg 63360ccggccgcag gcggaccccg gcgccctcgg cggagaacag ttcctcgaag accgcggcca 63420ggtgccggtt ctgggagatc tgggacatga gcaggccgat gagcttgccg ctgatgatga 63480cgtcggcccc ggggccgatg ggggccagcg cccggttgcg gtcgtcgatc agttcggtga 63540cgaccggcag ctcgcgcccg gtggcttctt ccagttggcg caggagcaga agggtgacga 63600
gcgtgcggtt gtcgggatcg tccggcggtt ggcccggggc ggggtcccgc cccagcacga 63660tcacgctgtc gtaggagtgg acgtccaggc gccgcagcgt ctcgggacgg gtgatgtccc 63720cgtggtgcag agccaggctc aggccgttcc caccgttctc cccgtttccg ctgtccgctt 63780cggcctcgct gatctcgcgg atcgtcgcct cgcccggttc cgccacgacg tcgacggccg 63840aaccgggccg ggcgcgtcgg tgcaactggt cgaccacgag cggcgctcgg cggttccagc 63900ccagtagcag aatccgctcc gccggcgcgg gcgtcggagg gcgggaggcc accgcggcct 63960tctcgaccga ctccgcacag tcgtccagcc gggccgtgtc gtcgtcgccg gtgatgacga 64020cgagcaggtc gtccggggcg accggcgtcg tcggcggcgg gttgagcaag ggggtgcagc 64080cgcgcatcag tccgacgacg ctcgtcgtcg agtaggacag gagaacctcg ccgaacgggc 64140ggccggtcag ggccggctcg ctgatcagat agaactcgtc tccggcgaag tcgaggagtt 64200cccggtggac gagggagatc ccggggcggc gggcggcctg gacgatcagc cgggcggtga 64260cggtgtcact ctccaggacg acgccgtcgg gtccggcggc gagacaggcg gccaggcggt 64320accggtcgtc ccggacggcg gcgacgacgg gcggacgcgg tttcgccccg gccagagcgg 64380cccgcagcgc cagcagtgtc ttcaccacct ccgcgtcggc gtgcggctcg tccggaggca 64440gaaccagcac gacaccggcc gtggccgggc tggtcaacgg caacacggcc gggtcggtgg 64500tggggccgct gcggcagatc aaccgcgtac cgccgcagga gcccaccttc gtgcccaggg 64560actcctccat gacggtcttg tcccggtcgg ccagcaccac caccgccgcg ccgcgctggt 64620tgacgttggc ggccaccagc tcgctcacca ccgtgaagac ctgttccgac catccgagga 64680ccacggcgtg cccctgttcc agcacggtgg aacggccccg ccgcaacgag gtgagccgct 64740ccgtgagcgc cgtcgtgatc aggccgacga gcgtggagac gtagagcagg gtgaccagcg 64800cgagcagcac cgacaacatc gcccgcagcg gcgtacccgt ggcaccgccc agccgtagcg 64860tctccccggt gagacgccac acctccgcca gccgctccgc gagggacggc ggggcatccg 64920ggtcggtcca caccatcacc gcgctggccg gcacgacgac ggccagggac agcagcgcca 64980tccagccgac gagcgcggcg gcaccgcggg ccagggtgct gtcgaaccag taacgggccc 65040tgtcaccgaa cggagtccgc cgctgcgcca cccgtccccc ttccgtctcc ccgtactccc 65100accaggccgc gtcggcaccg cagcggcgcc gtgccgcgcg ggcctgcccc ggagcgcgga 65160cgtgggcacg catgtcgcag tgtgggggat cgatcagggc cgcagacgac gttcgaccag 65220ccttcatccc ttcgggtagc cgcgtcctcc acggcggcgg acctgcgaag acgcccggct 65280cggacacgca gatgaaagcc gccgggcctc attcgcggaa cgccgggtat ccgcgagacc 65340ggatcaccgt cacacacagc gaggagagac cctgtgccgt ccaccgatgt cgtcgaactc 65400atcctgcggg accaccgccg tatggaggaa ctgttccgca ccctgcgcaa cgtcgaagcg 65460gaccgtgccg cggccctgac ggagttcgcg gacctgctca tcgcgcacgc ctcggccgag 65520
gaggacgagg tctaccccgc cctgcgtcgg tacaagaacg tcgagggtga ggatgtcgac 65580cacagcgtcc acgagcacca cgaggccaac gaggcgctgc tggccctgct cgaggtggag 65640gacaccgctt ccgacgagtg ggatgacaag ctcgaagagc tggtcacggc ggtcaaccac 65700cacgccgacg aggaggaacg aacactcctc aacgacgccc gggagaacgt cgccgacgac 65760cgccgccggg aactggggca gaagttccag gaggcgcgtt cgcggtatct ggagaccggc 65820tgcggcagtg tcgagaacgt gcgcaagctg gtcgccgccg ccgacgactg acccgcgtcg 65880gcgacgtccg ggcgcggagg ggagccgccg ccgtcgggcc ccctcgccgg gcgtaccgcg 65940gtcaggcggg tgagggctgc gtccggtccg ggacgggttc gaggcggacg acgatgccct 66000tggacgtggg ctgattgctg atgtccgcga cgctgtccag cggtaccagg acgttggtct 66060cgggatagta ggcggcggcc gagcccttgg ccgccgggta gggaacgacc tggaagttct 66120cggcccggcg ctcggtgccg tccgcccaga cgctcacgag gtcgacgcga tcgccctggg 66180cgaggccgag ttcgctcagg tcggccgggt tgacgaggac gacgtggcgg ctgccgtgga 66240tgccgcggta gcgatcgttg tcggtgtagg ggacggtgtt ccactggtcg tgcgaacgca 66300gtgtctgcag cagcagatga ccttcgggcg cccgtgggac cacgctctcg ttgcgagtga 66360acagggcctt gccgacctcg gtgttgaaga cgccttcgtt gaccgggttg ggcagttgga 66420agccaccggg ccgggtcacg cgtgcgttga agtcgtggaa gccgggcacg atgcgcgcga 66480tgcggtcgcg gatggtgtgg tagtcgcctt cgaaggtctc ccaggggatc tccaccctgc 66540cgtccagggt gagccgggcg agccggcaca ggatcgcgat ctcgctcagc agcatggggg 66600aggcgggggc caggcggccc cgggaggtgt gcacctcgct catggagttc tcgacggtga 66660cgaactgctc gccgtcggcc tggacgtcgc gctcggtgcg tcccagcgtc ggcaggatca 66720acgcggtgtc accgcagacg gtgtgcgagc ggttgagctt ggtcgagatg tgggcggtca 66780gccggcacga gcgcatcgcc tcctcggtga cctcgctgtc gggcgccgcc cggacgaagt 66840tcccggccag ggcgaggaag accttgacgc ggccctcgcg cattgccttg atcgagttca 66900ccgagtccag gccgtgggcc cgcggcggct cgaagccgaa ctcgtcccgc agggcgtcca 66960ggaaggtgtc cggcatctgc tcccagatgc ccatggtgcg gtcgccctgg acgttgctgt 67020ggccgcgcac cgggcaggcg ccggtgccgg cgcgtcccag gttgccgcgg agcatcagga 67080agttgacgat ctcccggacg gtgggcacgc cgtgcttgtg ctgggtgatg cccatcgccc 67140agcagacgac gacgcgttcg ctgtcgagga cctcgtcgcg taccttctcg atctcctcgc 67200gggtcagtcc ggtcgccgcg cgcacgtcgt cccagtccac cgtgcgggcg tgccgggcga 67260actcctcgaa gccggtggtg tgggcgtcga tgaagtcgtg gtccaggacg gtgccgggcc 67320gggcgtcctc ggcctccagc agcagtcggt tgagggcctg gaagagggcg aggtcgccac 67380
cgggcttgat gtgcaggaaa cggtcggcga tccgggtgcc gcgcccgacg accccgcgcg 67440gctgctgcgg gttcttgaag cgtcgcagcc cggcctcggg aagcgggttc acggccacga 67500tccgggcgcc gttccgcttg gcctcctcca gcgcgctgag ctggcgcggg tggttgctgc 67560cggggttctg cccgaccagg aagatcagat cggcgtggtg gaggtcgtcg agaccgacgg 67620tgcccttgcc ggtccccagg gtctcgctca gggcgaagcc gctggactcg tggcacatgt 67680tgctgcagtc gggcaggttg ttggtgccga aggcgcgggc gaagagctgc agcacgaagg 67740cggcctcgtt gctggcgcgg cccgaggtgt agaacaccgc ctcgtcgggg gaggccagcg 67800acttgagctc ctccgcgagg acccccaggg cgtcgttcca gccgatgggc tcgtagtgcg 67860cggagccggg ccgtttgatc atcggctcgg tgagccggcc ctgctggttg agccacatgt 67920cggagcggcc ggcgaggtcg gcgacgctgt gctcgcggaa gaagtcggcg gtcacccgcc 67980gtgtggtcgc ctcgtcgttg atgtgcttgg cgccgttctc gcagtactcg ttgcggtggc 68040gccgtcccgg ggccgggtcc gcccacgcgc agccggggca gtcgatgccg cccacctggt 68100tcatggtcag cagatccacc ccggtcctgc gcggggacgt ctgctccaag gagtactcca 68160gcgcgtgcac gaccgcgggg acgccggcgg cccacttctt cggcggtgtc acggagaggc 68220tggtctccga ctcctcaccg tgcggcttct gcatgtgttc gcctttctct cgccgtgtcc 68280ggccctcggt cagccgacgg gccaccgggc caccctgctc ctgggcggtt ccggtcgatc 68340gtgttgcacg cggccgttgc ggatggtgcc gcgccaggcg ccgccctctt gtcccagtcc 68400ctccatgaac cgtttgaatc tcgtcagctc gccgtggacc agtcgggtgg tcagccggac 68460cgcccgcgag gaacgggtga ggatcctcgc ggctccccgc ggttccagaa gcacccggac 68520ggtgatcgcg gtgccgccgg actccgtcgg cctgaactcg acctctcccc ggtgccacgg 68580cctctgctcc aggccgcgcc aggccaggta ggcgtcgggg tcctgctcca ggatctcgac 68640cgcgaagcgg cggcgcaggg ggccgtaacc gagggtccag gcggtcacgg tgggccggac 68700ctgctcgacg tcgcggacca cggccgagaa ccgagggaag gacttgaact gcgtccactg 68760gttgtacgcc gtccgtacgg gcaccgccac ctcgaccgtc tggtcgacgt gccgctcgcg 68820cagcggacga cggcccgtgc tcctgtcacc gctggtgcgc gcccccggtg tgtccggcac 68880ggcccgcggg ccctcgtgct gctccgccat cgtggtctct cctcctgtgg ggggaaccag 68940gcgtccaggc tctcgacgtc tcctcgtgcg tcagggtccc ctcgtgcgtc agggttttcc 69000cctcccggtt cccacctccg gcgtttcgag tcacctcggt cccgccgcgt cctcgtgcgc 69060gtcggcctcc gacgccccgc ccggagagat ccggctcgac gtcggcctgg tcgctccggc 69120gggcggtgag cagcaggtac tcccagtcga tggccccgtc ccgcagcgcg ccggccgcga 69180ggtcggtgag ggccgcgtcc agggcggcgg cgcgctcggt gtcgtcgccg atgtaccggt 69240agacggcgat gatcggcccg taggcggcct tgaagaactc aaggaagtcc ccccttcgag 69300
cggcgctcgg gaccgggggt gcgccggccg gcctgatgac cagcgtcgac ggggtcgtga 69360gagcgtgatc gaggtgctcg acgagccgga gccaccgcag gagagtcgcg ggcagcgctc 69420tctccagcaa cccagccttc gcacacccgt gcgcggcgca aggggcgtac gtcccctgcg 69480caaaggggcg gctggaggcc ggtgccccac gcctcgtctc cgcacggcgc gtcggacggg 69540gggagaacgc gtccgatgaa cacggtgtgc gccctcccga ttcctctccg tgacgtcaat 69600gatgagccca ccgcgcctgg gtcaggcgat ccgcggtccc ctgccgctcg gtcaggggcc 69660ggtgacggaa ggagtccacg gtgttgcttc tcatctctcc ggacggtgtc gaggaagccc 69720tcgactgcgc gaaggcggcg gagcacctcg acatcgtcga cgtgaagaag cccgacgagg 69780gctcgctggg cgcgaacttc ccgtgggtca tcagggagat ccgcgacgcg gtgccggcgg 69840acaagccggt ctcggccacc gtgggggacg tcccgtacaa gcccggcacg gtggcgcagg 69900ccgcgctggg cgcggtcgtc tcgggggcca cgtacatcaa ggtcggcctc tacggatgca 69960cgacgcccga acagggcatc gcggtcatgc gcgcggtggt ccgggcggtg aaggaccacc 70020gtcccgaagc gctcgtcgtc gcgtccggtt acgccgacgc ccaccggatc ggctgcgtca 70080acccgctcgc cctgcccgac atcgccgccc gctccggcgc cgacgccgcg atgctcgaca 70140ccgcggtcaa ggacgggacg cggctgttcg atcacgttcc gccggacacc tgcgccgagt 70200tcgtccgtcg cgcccacgcc gccggcctgc tcgccgccct cgcgggcagc gtcaggcaga 70260ccgacctcgg ccggctgacc cggatcggca cggacatcgt cggggtgcgc ggagcggtct 70320gcgagggcgg cgaccgcaac gccggacgca tccggccgca cctggtggcc gccttccgga 70380gcgagatgga ccggcacgcc cgcgagcacc gggccggcgt caccaccgcg agctgaccgc 70440cggtatgccg acccccgcac ccgaccacgc ccccgcacag cgggccgcgc ctctcgcggt 70500cgtcgatccg gccaccggaa cggtcttcga cgaggccccc gaccagggac cggacgtgct 70560ggacgccgtc gtcgaccggg cccgccgggc ctggcacggc tggcgcgccg atcccgacgc 70620ccgtaccacc gcgctgcgct cggcggccga cgcggtcgag gccgccgggg acgacctcgc 70680ccgtctcctc acccgggaac agggaaagcc cctggccgaa tcgcatgcgg aggtcgcccg 70740gacggcggcc cgcctgcgct acttcgccgg cctggccccc cggacccggc gcatcaccga 70800cgggcggccg gtgcgcagcg aggtccgctg gcgccccctc ggacccgtcg ccgcgatcgt 70860gccgtggaac ttccccctcc aactcgcgtc ggcgaagttc gcgcccgcgc tcgccgcggg 70920caacaccatg gtcctcaaac cctccccctt caccccgctc gccacccggc tgctcgggtc 70980cgtcctcgcc accgccctgc ccgaggacgt cctgacggtc gtcaccggcc gcgagccact 71040cggcgcccgc ctcgccgcac accccggcat ccgccacgtc accttcaccg gatcggtgcc 71100cacgggccgg gccgtcgccc gagcggcggc ggcctcgctc gcccgggtca ccctggaact 71160
gggcggcaac gacgccgcgg tcctgctgga cgacgtcgaa gtggaccgga tcgccgaccg 71220gctgttctgg gccgcgttcc gcaactgcgg gcaggtctgc atggcggtca agcgcgtcta 71280cgcaccggcc cgtctgcacg cacaggtcgt cgaagccctc accgagcgcg ccaaggccgt 71340cgccgtcggg cccggcctcg acccccgcac ccggctggga ccggtcgcca acgcccccca 71400gctggcccgg gtcgagcaga tcacccggcg cgccctggcg gacggcgccc gggcggcggc 71460cggcggccac cggctggacg ggccgggctg cttcttcgcc cccacgatcc tcaccgacgt 71520cccgcccgac agcccggtgg tgaccgagga gcagttcggg ccggtactgc cggtgctgcc 71580gtaccggagc ctggacgaag ccgtcgacgc ggccaacggc acgggattcg ggctgggggg 71640ctccgtatgg ggcaccgacc tcgaccgggc cgaggcggtg gccgaccggc tggaatgcgg 71700cacggcctgg gtcaaccacc acgccgagct gtccctcgcc cagcccttcg ccggcgacaa 71760ggacagcggg gtcggcgtcg cgggcgggcc gtggggactg tacggcaacc tccgtccgtt 71820cgtcgtccac cgaccgcggg gggagtgacg gtgagcttcc gggcggccgt actgcgcggg 71880tacgaggacc ccttcacggt cgaggaggtg accctgggga cggagcccgg cgcaggggag 71940atcctggtcg agatcgccgg ctgcggaatg tgccggaccg atctcgcggt ccggcgctcg 72000gccggccgga gcccgctgcc ggcggtgctc ggccacgagg gctccggggt ggtggtgcgg 72060acgggcggcg gcccggacac cgcgatcggc gtcggtgacc acgtggtgct gagcttcgac 72120tcctgcgggc actgccgcaa ctgccgcgcg gcggcccccg cctactgtga ttccttcgcc 72180tccctcaacc tcttcggggg ccgtgcggag gacccgccgc ggctcaccga cgggtcgggg 72240gcggcactgg ctccccggtg gttcggacag tccgccttcg ccgagtacgc gctcgtctcc 72300gcccgcaacg ccgttcgggt cgaccccgcc ctgcccgtcg aactgctcgg gccgctgggc 72360tgcggcttcc tcaccggagc cggagccgtg ctcaacacct tcgccgccgg gccgggcgac 72420accctcgtcg tgctcggcgc gggcgccgtg ggcctggccg cggtgatggc ggccaccgcc 72480gccggcgcac cgtccgtggc cgtggaccgc aacccccgtc gcctggagct ggccgagcgg 72540ttcggcgcgg tcccgctgcc cgccgcgacg gccggactgg ccgagcggat ccggcggctc 72600acggacggcg gcgcgcggta cgcactggac acgaccgcct ccgtcccact gatcaacgag 72660gcgctgcgcg cactgcgtcc caccggcgct ctcggcctgg tggcacggct ccacaccgcg 72720ctgcccctgg aaccgggcac gctcgaccgg gggcgcagca tccgccacgt ctgcgagggg 72780gacgcggtac ccggtctgct gataccgcag ctgacccggc tctggcaggc cggacgcttc 72840cccttcgacc agctcgtccg tacctacccg ctggccgaca tcaacgaggc ggagcgcgac 72900tgcgacgccg gcctcgtggt caaacccgtg ctgctcccgc ccgcgaggag ccggtgagta 72960cggcgcacgg caccgcggtc cgaccgcatc cgacgagcag gaagctcgcg gccccacttc 73020cgccaacgga ggagacatga ccggcacggc gccgcagtac acggacgtgg aaggcgtgaa 73080
cggaggtgtg ggcctgacgg ccttcctggt cgccgccgcg cgggcgatcg agacccatcg 73140cgacgacagt ctggcccagg acgtctacgc ggaacacttc gtgcgcgccg ccccggcgtg 73200cgcggactgg ccggtgcgca tcgagcaggt ccccgacggg gacggcaacc cgctgtgggg 73260acggttcgcc cgctatttcg gcctgcggac ccgggccctc gacgacttcc tgctccggtc 73320ggtccggacg ggcccccgac aggtggtgct gctgggcgcg gggttggaca cccgtgcctt 73380ccggctcgac tggccgtcgc agtgcgcggt cttcgagatc gaccggacgg gcgtgctcgc 73440cttcaaacag caggtgctca cggacctggc ggcaaccccg agagtggagc gcgtccccgt 73500tccggtcgat ctgcgcgcgg actgggccgg cgcgctgacc gcggccggct tcgaccccgc 73560ggcgcccagc gtctggctgg ccgagggact gctcttctat ctgccgggcc ccgccgagtc 73620gcttctcgtc gacacggtgg accggctgac caccgacggc agcgcgctgg ccttcgaggc 73680caagctggag aaggacctgc tggcgtaccg cgacagtgcg atctacacgg cgacgcgcga 73740gcagatcggc atcgacctcc tccgcctctt cgacaagggg ccccgacccg actccgcggg 73800tgagctggcg gccagaggct ggtccacctc gatgcacacg cccttcgtct tcacccaccg 73860gtacggacgc ggtcccctcc ccgagccgaa cgacgcgctg gaggggaacc gatgggtctt 73920cgcccgcaag cccgggccct gacgtgccgg ccgcgcttgc cgcccacgcc cggggacgcc 73980gctgacgagc ggtgtcagac ggtccgggcg gccaccagcc ggtcgcccgg gatcccggcc 74040aggtccggcg cgtagtagtc ctcgatgccg gaggcccacg cggccacggt gatgcggtcc 74100gcggcgtccg gggcgaaggc gtcgaacagc gcgtggatgt tcgcttcctc gaaaccgatc 74160gccttcatca gcgcgacgaa gaggggacgc tcgatcagcc cgtccccgtc gggatcgccg 74220agcgcggaca gtgcccgagc gaactcggcg atggtgggac cgaagcgctc gggatcgagt 74280acgaacggac ggaactcctc cacggtgatc acgccgtcgc cgtcggcgtc cagttcggtg 74340gccagcgtgg tccagtagcg gcggaacgcg gcccggacgg cggccttggc gctgtcgtcc 74400gacccggccg ccgccgcaac gacccggtcg gtcatcaggt cgaagtcgtc ggagtcgatg 74460actccgttgc cgttggcgtc gaagagggag aagaccagct cgacccgctt ggcggcctca 74520tctcgcatgc acatcacctg tcttctacgg cccggtcttc gcgggcccgg ccccatgaat 74580gctctgcgtg accgagcggg gcaggacgaa agcctccgag cggtcgcgtc ccagagaacc 74640accatgaatg tccctgaact gcagatcggg catctgctgg cctggtgcgg gcgggggctg 74700gcccggtgcg gcaggggagt gctctggtgc ctgggcaagg ccgtcacggg gatcatcctg 74760ctcgccatct tcgcgtccgc gatgatc 74787<210>2<211>876<212>PRT
<213>小链霉菌Tü4055<400>2Met Thr Gly Ser Ala Val Ser Ala Pro Phe Leu Gln Pro Pro Glu Pro1 5 10 15Val Ser Gly His Ser Glu Arg Lys Ser Asp Pro Val Leu Leu Val Gly20 25 30Ala Gly Arg Arg Ala Arg Met Ala Asp Ala Val Arg Ala Ala Gly Ala35 40 45Gln Ala Gly Ile Asp Pro Ala Val Leu Arg Arg Thr Arg Ala Thr Leu50 55 60Ile Thr Ala Gly Ser Ala Gly Ala Ala Gly Arg Leu Ala Ala Ala Leu65 70 75 80Arg Leu Thr Gly Ala Thr Ile Ser Leu Asp Thr Arg Glu Thr Pro Thr85 90 95Leu Leu Ala Leu His Leu Ala Ala Gln Ala Leu Arg Ala Gly Asp Thr100 105 110Ser Tyr Ala Val Val Gly Ala Glu Leu Pro Asp Gly Asn Cys Ala Leu115 120 125Ile Leu Ala Arg Gln Ser Ala Ala Thr Ala Glu Gly Ala Val Pro Gln130 135 140Ala Ile Val Arg Thr Thr Thr Ala Asp Arg Thr Thr Thr Ala Asp His145 150 155 160Ala Pro Ala Pro Asp Asp His Gly Ser Pro Ala Arg Glu Ala Pro His165 170 175Ala Thr Arg Thr Leu Ser Pro Gly Ile Thr Gln Ala Pro Ala Glu Gly180 185 190Phe Pro Gly Leu Leu Ala Thr Leu His Asp Asp Thr Pro Leu Arg Pro195 200 205Thr Ala Val Thr Glu His Gly Ser Asp Ala Thr Thr Val Leu Val Leu210 215 220Leu Asp Gln Pro Gln Asp Ala Ala Pro Ala Ala Pro Leu Pro Trp Val225 230 235 240Val Ser Ala Pro His Thr Arg Ala Leu Arg Ala Thr Ala Ala Thr Leu245 250 255Ala Val His Leu Asp Thr Thr Pro Ala Ala Pro Ala Asp Val Ala His260 265 270Thr Leu Leu Thr Ala Arg Pro Asp Arg His Arg Ala Ala Val Val Gly275 280 285Ala Asp Arg Ala Thr Leu Thr Asp Gly Leu Arg Ala Leu Ala Thr Gly290 295 300Gly Asp Ala Pro His Leu Val His Gly Thr Ala Thr Gly Ser Pro Arg305 310 315 320
Pro Val Phe Val Phe Pro Gly Gln Gly Ser Gln Trp Pro Gly Met Ala325 330 335Ala Glu Leu Leu Glu Thr Ser Glu Pro Phe His Asp Ser Val His Ala340 345 350Cys Ala Asp Ala Leu Ala Glu Phe Val Asp Trp Ser Val Leu Asp Val355 360 365Leu Arg Gln Ala Pro Asp Ala Pro Pro Leu Arg Arg Val Asp Val Leu370 375 380Gln Pro Thr Leu Trp Ala Thr Met Val Ser Leu Ala Glu Val Trp Arg385 390 395 400Ser Tyr Gly Val Glu Pro Ala Ala Val Val Gly His Cys Tyr Gly Glu405 410 415Ile Ala Ala Ala Gln Val Ala Gly Ala Leu Asp Met Arg Asp Ala Ala420 425 430Arg Leu Leu Ala His Arg Ser Arg Ala Trp Leu Arg Leu Val Gly Lys435 440 445Gly Thr Val Ile Ser Val Ala Thr Ser Gly Gln Asp Ile Thr Arg Arg450 455 460Met Ala Ala Trp Pro Asp Ser Val Glu Leu Ala Ala Leu Asn Gly Pro465 470 475 480Arg Ser Val Ala Leu Ala Gly Pro Pro Asp Val Leu Asp Gly Ile Val485 490 495Asn Asp Leu Thr Asp Gln Gly Ile His Ala Lys Arg Ile Pro Gly Val500 505 510Asp Thr Val Gly His Cys Ser Gln Val Glu Val Leu Arg Asp His Leu515 520 525Leu Asp Val Leu Arg Pro Val Ser Pro Arg Pro Ala Ala Val Pro Phe530 535 540Tyr Ser Thr Val Asp Gly Thr Glu Arg Asp Thr Thr Thr Leu Asp Thr545 550 555 560Asp Tyr Trp Tyr Leu Asn Thr Arg Ser Gln Val Arg Phe His Gln Ala565 570 575Val Arg Asn Leu Leu Ala Ala Gly His Arg Ser Phe Val Glu Val Ser580 585 590Pro His Pro Leu Leu Gly Ala Ser Ile Glu Asp Thr Ala Ala Glu Phe595 600 605Gly Leu Asp Asp Val Ala Ala Val Gly Thr Leu Arg Arg Gly Gln Gly610 615 620Gly Thr Arg Arg Val Leu Thr Ser Val Ala Glu Ala Tyr Val His Gly625 630 635 640Ile Asp Ile Asp Phe Thr Pro Ala Phe Thr Gly Thr Thr Pro Asn Arg645 650 655Ile Asp Leu Pro Thr Val Glu Asp His Gly Ile Glu Gly His Gly Asp
660 665 670Asp Gly Gly Glu Thr Trp Thr Asp Arg Val Arg Thr Leu Pro Asp Glu675 680 685Gln Arg Glu Glu Ala Leu Leu Asp Leu Val Cys Arg Thr Val Ala Ala690 695 700Val Leu Glu Ala Asp Pro Ala Gly Thr Ala Asp Ala Val Ala Pro Asp705 710 715 720Thr Ala Phe Lys Glu Met Gly Leu Gly Ser Leu Ser Ala Val Arg Leu725 730 735Arg Asn Gly Leu Arg Glu Ala Thr Gly Ala His Leu Pro Ala Thr Ile740 745 750Ala Tyr Asp His Pro Thr Pro Ala Ala Leu Ala Arg His Leu Ala Met755 760 765Thr Leu Phe Asp Ala Thr Gly Ala Ala Pro Ala Val Pro Ala Pro Ser770 775 780Arg Asp Asp Glu Pro Ile Asp Ala Glu Thr Ala Val Leu Thr Ala Leu785 790 795 800Glu Arg Ala Asp Glu Ala Leu Glu Arg Leu Arg Ala Pro His Ala Arg805 810 815Thr Pro Arg Gln Glu Thr Gly Arg Arg Ile Asp Glu Leu Leu Arg Ser820 825 830Leu Thr Asp Lys Ala Arg Arg Met Arg Gln Ala Asp Ala Val Asp Asp835 840 845Val Asp Asp Pro Ala Thr Asp Arg Phe Ala Ala Ala Thr Asp Asp Glu850 855 860Met Phe Glu Leu Leu Glu Lys Arg Phe Gly Ile Ser865 870 875<210>3<211>157l<212>PRT<213>小链霉菌Tü4055<400>3Met Ala His Glu Asp Lys Leu Arg His Leu Leu Lys Arg Val Ser Ala1 5 10 15Glu Leu Asp Asp Thr Gln Arg Arg Val Arg Glu Met Glu Glu Ser Glu20 25 30Arg Glu Pro Ile Ala Ile Val Gly Met Ser Cys Arg Leu Pro Gly Gly35 40 45Val Asn Ser Pro Gly Glu Phe Trp Ser Leu Leu Glu Ala Gly Thr Asp50 55 60Ala Val Ser Glu Phe Pro Arg Asp Arg Gly Trp Asp Val Glu Asn Leu65 70 75 80Tyr Asp Pro Asp Pro Asp Ala Pro Gly Arg Ser Tyr Val Arg Glu Gly85 90 95
Gly Phe Leu Asp Gly Ala Gly Gln Phe Asp Ala Ala Phe Phe Gly Ile100 105 110Ser Pro Arg Glu Ala Leu Ala Met Asp Pro Gln Gln Arg Leu Leu Leu115 120 125Glu Cys Ser Trp Glu Ala Ile Glu Arg Ser Arg Ile Asp Pro Lys Thr130 135 140Leu His Gly Ser Arg Thr Gly Val Phe Ala Gly Ser Asn Trp Gln Asp145 150 155 160Tyr Asn Thr Leu Leu Leu Asn Ala Glu Glu Arg Ser Gln Ser Tyr Leu165 170 175Ala Thr Gly Ala Ser Gly Ser Val Leu Ser Gly Arg Val Ser Tyr Thr180 185 190Leu Gly Met Glu Gly Pro Ala Ile Thr Val Asn Thr Ala Cys Ser Ser195 200 205Ser Leu Val Ala Val His Leu Ala Ala Arg Ser Leu Arg Ala Gly Glu210 215 220Cys Asp Leu Ala Leu Ala Gly Ala Val Thr Val Met Ser Thr Pro Gln225 230 235 240Leu Pro Val Ala Phe Ser Arg Gln Arg Gly Leu Ala Pro Asp Gly Arg245 250 255Ser Lys Ala Phe Ala Val Ser Ala Asp Gly Met Gly Phe Gly Glu Gly260 265 270Val Gly Val Leu Val Leu Glu Arg Leu Ser Val Ala Arg Arg Asn Gly275 280 285His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly290 295 300Ala Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ser Gln Gln Arg Val305 310 315 320Ile Arg Ala Ala Leu Ala Ser Ala Gly Leu Gly Pro Ala Asp Val Asp325 330 335Val Val Glu Ala His Gly Thr Gly Thr Arg Leu Gly Asp Pro Ile Glu340 345 350Ala Gln Ala Leu Leu Ala Thr Tyr Gly Arg Gly Arg Asp Ala Glu Arg355 360 365Pro Leu Trp Leu Gly Ser Val Lys Ser Asn Ile Gly His Ala Gln Ala370 375 380Ala Ala Gly Val Ala Gly Val Ile Lys Met Val Leu Ala Met Glu Lys385 390 395 400Gly Arg Leu Pro Arg Thr Leu His Val Asp Glu Pro Ser Gly Glu Val405 410 415Asp Trp Asp Ser Gly Ala Val Arg Leu Leu Thr Glu Ala Arg Asp Trp420 425 430
Pro Ser Glu Glu Gly Arg Leu Arg Arg Ala Gly Val Ser Ser Phe Gly435 440 445Ile Ser Gly Thr Asn Ala His Val Ile Ile Glu Glu Ala Pro Glu Glu450 455 460Gly Glu Glu Pro Glu Ser Asp Ala Gly Gly Val Val Pro Trp Val Leu465 470 475 480Ser Ala Arg Thr Glu Gly Ala Leu Gln Ala Gln Ala Val Gln Leu Ser485 490 495Glu Phe Val Gly Glu Ser Ser Pro Val Asp Val Gly Trp Ser Leu Val500 505 510Ser Thr Arg Ala Ala Phe Glu His Arg Ala Val Val Val Gly Arg Gly515 520 525Arg Asp Glu Leu Val Arg Gly Leu Ser Glu Val Ala Gln Gly Arg Gly530 535 540Val Arg Gly Val Ala Ser Ser Ala Ser Gly Gly Leu Ala Phe Val Phe545 550 555 560Ala Gly Gln Gly Ser Gln Arg Leu Gly Met Gly Arg Gly Leu Tyr Glu565 570 575Arg Phe Pro Val Phe Ala Glu Ala Phe Asp Glu Val Cys Gly Arg Val580 585 590Gly Pro Gly Val Arg Glu Val Val Phe Gly Ser Asp Ala Gly Glu Leu595 600 605Asp Arg Thr Val Trp Ala Gln Ala Gly Leu Phe Ala Leu Glu Val Ala610 615 620Leu Phe Arg Leu Leu Glu Ser Trp Gly Val Arg Pro Gly Cys Leu Ile625 630 635 640Gly His Ser Val Gly Glu Leu Ser Ala Ala Cys Val Ala Gly Leu Trp645 650 655Ser Leu Glu Asp Ala Cys Arg Val Val Ala Ala Arg Ala Arg Leu Met660 665 670Gln Ala Leu Pro Ala Gly Gly Val Met Val Ala Val Arg Ala Glu Ala675 680 685Gly Glu Leu Ala Gly Phe Leu Gly Glu Asp Val Val Ile Ala Ser Val690 695 700Asn Ala Pro Gly Gln Val Val Ile Ala Gly Pro Glu Gly Gly Val Glu705 710 715 720Arg Val Val Ala Ala Cys Gly Ala Arg Ser Arg Arg Leu Ala Val Ser725 730 735His Ala Phe His Ser Pro Leu Val Glu Pro Met Leu Gly Glu Phe Arg740 745 750Arg Val Val Glu Ser Val Ala Phe Gly Val Pro Ser Leu Arg Val Val755 760 765
Ser Asn Val Thr Gly Ala Trp Val Asp Pro Glu Glu Trp Gly Thr Pro770 775 780Glu Tyr Trp Val Arg Gln Val Arg Glu Pro Val Arg Phe Ala Asp Gly785 790 795 800Val Ala Thr Leu Leu Asp Ala Gly Val Arg Thr Phe Val Glu Leu Gly805 810 815Pro Ala Gly Ala Leu Thr Ser Met Val Ser His Cys Ala Asp Ala Thr820 825 830Ala Thr Ser Val Thr Ala Val Pro Thr Leu Arg Pro Asp His Asp Glu835 840 845Ser Arg Thr Val Leu Ser Ala Ala Ala Ser Leu Tyr Val Gln Gly His850 855 860Pro Val Asp Trp Ala Pro Leu Phe Pro Arg Ala Arg Thr Val Asp Leu865 870 875 880Pro Thr Tyr Pro Phe Gln His Gln His Tyr Trp Leu Asp Val Pro Pro885 890 895Leu Phe Thr Ala Ser Ser Ala Ala Gln Asp Gly Gly Trp Arg Tyr Arg900 905 910Ile His Trp Arg Arg Leu Gly Thr Arg Asp Ser Gly Asp Arg Leu Ser915 920 925Gly Arg Trp Leu Leu Leu Val Pro Glu Ser Asp Gly Thr Glu Pro Trp930 935 940Val Glu Gly Ala Glu Lys Met Leu Ala Glu Arg Gly Cys Glu Val Val945 950 955 960His Val Pro Ile Ala Ala Thr Ala Asp Arg Asp Ala Met Val Gly Ala965 970 975Val Arg Glu Ser Val Glu Asp Gly Arg Val Asp Gly Val Leu Ser Leu980 985 990Leu Ala Leu Asp Gly Arg Pro His Pro Asp Ala Ala Ala Val Pro Thr99510001005Gly Leu Val Ala Thr Ala Gln Val Val Gln Val Ser Asp Glu Leu Gly101010151020Ile Gly Pro Leu Trp Val Ala Thr Arg Gln Ala Val Ser Val Asp Gly1025 103010351040Ala Asp Glu Ala Asp Gly Ala Gly Arg Thr Arg Lys Ala Asp Asp Pro104510501055Ala Asp Val Ala Gln Ala Ala Val Trp Gly Leu Gly Arg Val Ala Ala106010651070Leu Glu Lys Pro Arg Leu Trp Gly Gly Leu Val Asp Leu Pro Ala Arg107510801085Ala Asp Glu Arg Met Arg Asp Leu Val Ala Gln Ala Leu Thr Ala Pro109010951100
Asp Ala Glu Asp Gln Leu Ala Val Arg Ala Asp Gly Ile Ala Val Arg1105 111011151120Arg Leu Val Arg Ser Ala Ala Ser Ala Pro Ala Asp Asp Trp Gln Pro112511301135Ser Gly Thr Val Leu Val Thr Gly Gly Thr Gly Gly Val Gly Ala Asn114011451150Val Ala Arg Trp Leu Val Thr Gln Asp Ile Gln His Leu Leu Leu Val115511601165Ser Arg Arg Gly Pro Asp Ala Pro Gly Ala Ala Glu Leu Leu Ala Glu117011751180Leu Ser Ala Ser Gly Thr Ser Val Thr Ile Glu Pro Cys Asp Val Thr1185 119011951200Asp Ala Asp Ala Val Arg Arg Leu Ile Gly Ala Val Pro Ala Glu Arg120512101215Pro Leu Ser Thr Val Val His Ala Ala Gly Val Leu Asp Asp Cys Leu122012251230Ile Asp Ala Leu Thr Pro Gln Arg Leu Ala Ala Ala Leu Glu Val Lys123512401245Ala Lys Gly Ala Leu Asn Leu His Glu Ala Ala Gly Glu Ala His Leu125012551260Val Leu Phe Ser Ser Leu Ala Gly Thr Thr Gly Thr Lys Gly Gln Gly1265 127012751280Asn Tyr Ala Ala Ala Asn Ala Tyr Leu Asp Ala Leu Ala Glu Arg Arg128512901295Arg Ala Asp Gly Leu Pro Ala Thr Ser Val Ala Trp Gly Ala Trp Gln130013051310Gly Ala Gly Met Val Ala Asp Ala Ala Val Ala His Arg Thr Arg Arg131513201325Tyr Gly Leu Pro Leu Met Ser Pro Asp Arg Ala Val Ala Thr Leu Arg133013351340Gln Val Met Ala Glu Pro Val Ala Thr Gln Val Val Ala Asp Val Asp1345 135013551360Trp Gln Arg Phe Val Ala Asp Phe Thr Ala Val Arg Pro Ser Arg Leu136513701375Leu Ala Asp Leu Pro Glu Val Arg Ser Leu Gly Glu Gln Arg Lys Asp138013851390Gly Pro Gly Gly Gln Gly Glu Glu Asp Gly Leu Ala Ser Lys Leu Ala139514001405Ala Leu Pro Glu Ala Asp Arg Arg Arg Ala Val Leu Asp Leu Val Glu141014151420Glu Leu Val Leu Gly Val Leu Gly His Glu Thr Arg Ala Ala Ile Gly1425 143014351440
Pro Asp Ser Ser Phe His Ala Ile Gly Phe Asp Ser Leu Thr Ala Val144514501455Glu Leu Arg Asn Leu Leu Thr Val Arg Leu Gly Met Lys Leu Pro Ala146014651470Thr Leu Val Tyr Asp His Pro Thr Leu Ser Ser Leu Ala Asp His Leu147514801485His Glu Gln Leu Val Ile Asp Gly Thr Pro Met Thr Asp Thr Ala Ala149014951500Asp Leu Leu Ala Glu Leu Asp Ala Leu Ala Ala Arg Leu Ala Ala Val1505 151015151520Gly Leu Glu Pro Glu Ala Arg Ala Arg Ile Gly Arg Arg Leu Lys Asp152515301535Met Gln Thr Ala Cys Glu Pro Arg Ser Glu Ser Ser Arg Asp Leu Lys154015451550Ser Ala Ser Arg Thr Glu Val Leu Asp Phe Leu Thr Asn Glu Leu Gly155515601565Ile Ser Arg1570<210>4<211>3500<212>PRT<213>小链霉菌Tü4055<400>4Met Pro Asn Asp Glu Glu Leu Leu Asp Tyr Leu Lys Arg Thr Ala Ser1 5 10 15Asn Leu Gln Glu Ala Arg Gln Arg Val His Glu Leu Glu Glu Ser Glu20 25 30Arg Glu Pro Ile Ala Ile Val Gly Met Ser Cys Arg Leu Pro Gly Gly35 40 45Val Asn Ser Pro Glu Glu Phe Trp Ser Leu Leu Glu Ala Gly Thr Asp50 55 60Ala Val Ser Glu Phe Pro Arg Asp Arg Gly Trp Asp Val Glu Arg Leu65 70 75 80Tyr Asp Pro Asp Pro Asp Ala Pro Gly Lys Ser Tyr Val Arg Glu Gly85 90 95Gly Phe Leu Asp Gly Ala Gly Arg Phe Asp Pro Ala Phe Phe Gly Ile100 105 110Ser Pro Arg Glu Ala Val Val Met Asp Pro Gln Gln Arg Leu Leu Leu115 120 125Glu Cys Ser Trp Glu Ala Ile Glu Arg Ser Arg Ile Asp Pro Lys Thr130 135 140Leu His Gly Ser Arg Ala Gly Val Phe Val Gly Ser Asn Gly Gln Asp145 150 155 160
Tyr Gly Thr Leu Leu Leu Arg Ala Asp Asp Arg Ser His Ala Tyr Leu165 170 175Ala Thr Gly Ala Ser Ala Ser Val Leu Ser Gly Arg Ile Ser Tyr Thr180 185 190Leu Gly Leu Glu Gly Pro Ala Val Thr Ile Ser Thr Ala Cys Ser Ser195 200 205Ser Leu Val Ala Leu His Leu Ala Ala Arg Ala Leu Arg Ala Gly Glu210 215 220Cys Glu Leu Ala Leu Ala Gly Gly Val Thr Val Met Pro Thr Thr Arg225 230 235 240Leu Phe Glu Val Phe Ser Arg Gln Arg Gly Leu Ala Gly Asp Gly Arg245 250 255Cys Lys Ala Phe Ala Ala Gly Ala Asp Gly Thr Gly Trp Gly Glu Gly260 265 270Val Gly Val Leu Val Leu Glu Arg Leu Ser Val Ala Arg Arg Asn Gly275 280 285His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly290 295 300Ala Ser Asn Gly Leu Thr Ala Pro Asn Gly Pro Ser Gln Gln Arg Val305 310 315 320Ile Arg Ala Ala Leu Ala Ser Ala Arg Leu Ala Pro Glu Asp Val Asp325 330 335Ala Val Glu Ala His Gly Thr Gly Thr Ser Leu Gly Asp Pro Ile Glu340 345 350Ala Gln Ala Leu Leu Ala Thr Tyr Gly Arg Gly Arg Asp Ala Glu Arg355 360 365Pro Leu Trp Leu Gly Ser Val Lys Ser Asn Ile Gly His Ala Gln Ala370 375 380Ala Ala Gly Val Ala Gly Val Ile Lys Met Val Lys Ala Met Gln Ala385 390 395 400Gly Thr Leu Pro Arg Thr Leu His Val Asp Glu Pro Ser Gly Glu Val405 410 415Asp Trp Asp Ser Gly Ala Val Arg Leu Leu Thr Glu Ala Arg Asp Trp420 425 430Pro Ser Glu Glu Gly Arg Leu Arg Arg Ala Gly Val Ser Ser Phe Gly435 440 445Ile Ser Gly Thr Asn Ala His Val Ile Leu Glu Glu Pro Pro Ala Glu450 455 460Asp Ala Val Pro Glu Pro Glu Ala Gly Asp Val Val Pro Trp Val Leu465 470 475 480Ser Ala Arg Ser Ala Glu Ala Leu Arg Glu Gln Ala Ala Arg Leu Ala485 490 495
Ser Val Ala Gly Gly Leu Asn Val Val Asp Val Gly Trp Ser Leu Ala500 505 510Ser Thr Arg Ala Ala Phe Glu His Arg Ala Val Val Val Gly Arg Glu515 520 525Arg Glu Glu Leu Leu Ala Gly Leu Phe Ala Val Ala Ala Gly Arg Pro530 535 540Ala Ala Asn Val Val Thr Gly Pro Val Ser Ser Gly Arg Pro Ala Phe545 550 555 560Val Phe Ala Gly Gln Gly Ser Gln Arg Leu Gly Met Gly Arg Gly Leu565 570 575Tyr Glu Arg Phe Pro Val Phe Ala Glu Ala Phe Asp Glu Val Cys Gly580 585 590Arg Val Gly Pro Gly Val Arg Glu Val Val Phe Gly Ser Asp Ala Gly595 600 605Glu Leu Asp Arg Thr Val Trp Ala Gln Ala Gly Leu Phe Ala Leu Glu610 615 620Val Ala Leu Phe Arg Leu Leu Glu Ser Trp Gly Val Arg Pro Gly Cys625 630 635 640Leu Ile Gly His Ser Val Gly Glu Leu Ser Ala Ala Cys Val Ala Gly645 650 655Leu Trp Ser Leu Glu Asp Ala Cys Arg Val Val Ala Ala Arg Ala Arg660 665 670Leu Met Gln Ala Leu Pro Ala Gly Gly Val Met Val Ala Val Arg Ala675 680 685Glu Ala Gly Glu Leu Ala Gly Phe Leu Gly Glu Asp Val Val Ile Ala690 695 700Ser Val Asn Ala Pro Gly Gln Val Val Ile Ala Gly Pro Glu Gly Gly705 710 715 720Val Glu Arg Val Val Ala Ala Cys Gly Ala Arg Ser Arg Arg Leu Ala725 730 735Val Ser His Ala Phe His Ser Pro Leu Val Glu Pro Met Leu Gly Glu740 745 750Phe Arg Arg Val Val Glu Ser Val Ala Phe Gly Val Pro Ser Leu Arg755 760 765Val Val Ser Asn Val Thr Gly Ala Trp Val Asp Pro Glu Glu Trp Gly770 775 780Thr Pro Glu Tyr Trp Val Arg Gln Val Arg Glu Pro Val Arg Phe Ala785 790 795 800Asp Gly Val Ala Thr Leu Leu Asp Ala Gly Val Arg Thr Phe Val Glu805 810 815Leu Gly Pro Ala Gly Thr Leu Thr Ser Met Val Ser His Cys Ala Asp820 825 830
Ala Thr Ala Thr Ser Val Thr Ala Val Pro Thr Leu Arg Pro Asp His835 840 845Asp Glu Ser Arg Thr Val Leu Ser Ala Ala Ala Ser Leu Tyr Val Gln850 855 860Gly His Pro Val Asp Trp Ala Pro Leu Phe Pro Arg Ala Arg Thr Val865 870 875 880Asp Leu Pro Thr Tyr Pro Phe Gln His Gln His Tyr Trp Met Met Asn885 890 895Thr Gly Ser Ala Ala Glu Pro Ala Glu Leu Gly Leu Gly Asp Ala Arg900 905 910His Pro Leu Leu Gly Ser Val Val Thr Val Ala Gly Asp Asp Lys Val915 920 925Val Phe Ala Gly Arg Leu Ala Leu Arg Thr His Pro Trp Leu Ala Asp930 935 940His Thr Val Leu Asp Ala Val Leu Leu Pro Ala Thr Ala Phe Leu Glu945 950 955 960Leu Ala Val Arg Ala Gly Glu Glu Val Ser Cys Pro Val Val His Asp965 970 975Leu Thr Leu His Arg Pro Leu Val Val Pro Glu Arg Gly Ala Val Gln980 985 990Val Gln Met Ala Val Gly Ala Pro Glu Ala Asp Gly Arg Arg Glu Val99510001005Arg Val Tyr Ser Arg Pro Asp Asp Asp Ala Glu His Glu Trp Thr Leu101010151020His Ala Ala Gly Leu Leu Ala Ser Ala Ala Thr Ala Glu Pro Ala Val1025 103010351040Ala Ala Gly Ala Trp Pro Pro Pro Glu Ala Gln Ala Val Asp Leu Asp104510501055Gly Phe Tyr Ala Gly Leu Ala Glu His Gly Tyr His Tyr Gly Pro Leu106010651070Phe Gln Gly Val Arg Ala Ala Trp Arg Leu Gly Asp Asp Val Leu Ala107510801085Glu Ile Val Leu Pro Glu Ala Ala Gly Ala Asp Ala Ala Arg Tyr Gly109010951100Met His Pro Ala Leu Leu Asp Ala Val Leu His Ala Ala Arg Leu Gly1105 111011151120Ala Phe Arg Glu Arg Ser Glu Glu Lys Tyr Leu Pro Phe Ala Trp Glu112511301135Gly Val Thr Leu Arg Thr Arg Gly Ala Thr Ala Val Arg Ala Arg Ile114011451150Ser Arg Ala Gly Thr Asp Ala Ile Arg Leu Asp Val Thr Asp Thr Ala115511601165
Asp Arg Pro Val Leu Thr Ala Glu Ser Leu Thr Leu Arg Pro Val Ser117011751180Ala Gly Gln Leu Met Ala Val Pro Arg Asp Ser Leu Phe Arg Val Asp1185 119011951200Trp Val Ser Ala Pro Ala Ala Asn Gly Pro Gly Leu Arg Leu Ala Arg120512101215Ala Ala Thr Val Glu Ala Ala Leu Ala Ala Asp Ala Asp Ile Val Val122012251230Val Pro Cys Leu Asp Ser Glu Gly Pro His Gln Ala Thr Tyr Gln Ala123512401245Leu Glu Leu Leu Gln Arg Trp Leu Ala Ala Asp Thr Gly Thr Thr Thr125012551260Leu Ala Leu Leu Thr His Arg Ala Val Ala Val Gly Asp Asp Val His1265 127012751280Asp Leu His His Ala Pro Leu Trp Gly Leu Val Arg Thr Ala Gln Thr128512901295Glu His Pro Gly Cys Phe Arg Leu Val Asp Ser Asp Asp Pro Asp Pro130013051310Thr Thr Asp Val Leu Ala Ala Ala Leu Ala Thr Gly Glu Pro Gln Val131513201325Ala Ile Arg Asp Gly Ala Val Leu Ala Pro Arg Leu Thr Ala Ala Ser133013351340Ala Pro Arg Glu Pro Ala Glu Trp Asp Ala Glu Gly Thr Val Leu Ile1345 135013551360Thr Gly Gly Ser Gly Ala Leu Ala Gly Ile Val Ala Gln His Leu Val136513701375Ala Arg His Gly Val Arg Arg Leu Val Leu Ala Ser Arg Ser Gly Arg138013851390Pro Ala Pro Gly Ala Asp Leu Leu Asp Ala Asp Val Thr Ala Val Ser139514001405Cys Asp Val Ser Asp Arg Asp Ala Val Ala Ala Leu Leu Ala Ser Val141014151420Pro Asp Glu His Pro Leu Thr Ala Val Val His Thr Ala Gly Val Leu1425 143014351440Asp Asp Gly Val Leu His Ala Leu Thr Thr Glu Arg Ile Asp Thr Ser144514501455Phe Ala Ala Lys Val Asp Gly Ala Arg His Leu His Glu Leu Thr Ser146014651470His Leu Asp Leu Thr Ala Phe Val Leu Phe Ser Ser Ala Ser Ala Val147514801485Leu Gly Ala Ala Gly Gln Gly Asn Tyr Ala Ala Ala Asn Ala Tyr Leu149014951500
Asp Ala Leu Ala Ala His Arg Arg Ser Asn Asp Leu Pro Ala Val Ser1505 151015151520Leu Ala Trp Gly Leu Trp Ala Glu His Glu Gly Met Ala Arg Gly Leu152515301535Gly Asp Ala Glu Leu Thr Arg Ile Ser Arg Ile Gly Val Thr Ala Leu154015451550Ser Ala Glu Asp Gly Met Arg Leu Phe Asp Ala Gly Cys Ala Gly Asp155515601565Gln Ser Gln Leu Val Pro Met Arg Val Asp Thr Ala Ala Leu Arg Ala157015751580Arg Arg Asp His Leu Pro Ala Pro Met Trp Ser Leu Val Pro Glu Arg1585 159015951600Thr Arg Ala Ala Arg Thr Gln Pro Ala Ala Ser Leu Arg Asp Arg Leu160516101615Ala Glu Leu Thr Ala Pro Glu Arg Lys Arg Thr Val Leu Asn Leu Val162016251630Arg Asn Ala Val Ala Asp Thr Leu Gly His Asn Ala Ala Asp Gly Val163516401645Pro Pro Asp Gln Ser Leu Asp Ala Ala Gly Phe Asp Ser Leu Thr Ala165016551660Val Glu Phe Arg Asn Arg Leu Ser Ala Val Thr Asp Leu Arg Leu Pro1665 167016751680Ala Thr Leu Thr Tyr Asp His Pro Thr Pro Ala Ala Ile Ala Glu His168516901695Ile Leu Thr Arg Leu Thr Leu Leu Lys Glu Thr Ala Ala Pro Ala Val170017051710Gly Thr Ala Pro Val Ala Ala Pro Thr Glu Asp Asp Ala Ile Val Ile171517201725Val Gly Met Ala Gly Arg Phe Pro Gly Gly Val Arg Thr Pro Glu Gly173017351740Leu Trp Asp Leu Val His Ser Gly Thr Asp Ala Ile Ser Glu Trp Pro1745 175017551760Thr Asp Arg Gly Trp Asp Val Glu Asn Leu Tyr Asp Pro Asp Pro Asp176517701775Ala Val Gly Lys Ser Tyr Val Arg His Gly Gly Phe Leu His Asp Val178017851790Ala Gly Phe Asp Ala Gly Phe Phe Gly Ile Ser Pro Arg Glu Ala Leu179518001805Ala Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Cys Ser Tyr Glu Ala181018151820Leu Glu Arg Ala Gly Ile Asp Pro Ala Thr Leu Arg Gly Ser Arg Ser1825 183018351840
Gly Val Tyr Ala Gly Val Met Tyr His Glu Tyr Ala Ser Arg Leu Gly184518501855Ala Thr Pro Ala Gly Phe Glu Gly Thr Leu Gly Thr Gly Ser Ser Gly186018651870Ser Ile Ala Ser Gly Arg Ile Ser Tyr Thr Phe Asp Leu Thr Gly Pro187518801885Ala Val Thr Val Asp Thr Ala Cys Ser Thr Ser Leu Val Gly Leu His189018951900Leu Ala Val Gln Ala Leu Arg Ala Gly Glu Cys Glu Leu Ala Leu Ala1905 191019151920Gly Gly Val Thr Val Met His Thr Pro Arg Pro Phe Val Glu Phe Ser192519301935Arg Gln Arg Gly Leu Ala Ala Asp Gly Arg Ser Lys Ala Phe Ala Ala194019451950Ser Ala Asp Gly Val Ala Trp Ala Glu Gly Ala Gly Ile Leu Val Leu195519601965Glu Arg Leu Ser Ala Ala Arg Arg Asn Gly His Arg Val Leu Ala Val197019751980Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Asn Gly Leu Thr1985 199019952000Ala Pro Asn Gly Pro Ser Gln Gln Arg Val Ile Arg Ala Ala Leu Ala200520102015Ser Ala Gly Leu Gly Pro Ala Asp Val Asp Val Val Glu Ala His Gly202020252030Thr Gly Thr Ala Leu Gly Asp Pro Ile Glu Ala Gln Ala Leu Leu Ala203520402045Thr Tyr Gly Arg Gly Arg Asp Ala Asp Arg Pro Leu Trp Leu Gly Ser205020552060Val Lys Ser Asn Ile Gly His Thr Gln Ala Ala Ala Gly Val Ala Ser2065 207020752080Val Ile Lys Met Val Gln Ala Met Gln Ala Gly Val Leu Pro Arg Thr208520902095Leu His Val Asp Glu Pro Ser Gly Glu Val Asp Trp Asp Ser Gly Ala210021052110Val Arg Leu Leu Thr Glu Ala Arg Glu Trp Pro Ser Gly Glu Gly Arg211521202125Val Arg Arg Ala Gly Val Ser Ser Phe Gly Ile Ser Gly Thr Asn Ala213021352140His Val Ile Leu Glu Glu Pro Pro Ala Glu Asp Ala Leu Pro Glu Pro2145 215021552160Glu Ala Gly Asp Val Val Pro Trp Val Leu Ser Ala Arg Ser Ala Glu216521702175
Ala Leu Arg Glu Gln Ala Ala Arg Leu Ala Ser Val Ala Gly Gly Leu218021852190Asn Val Val Asp Val Gly Trp Ser Leu Ala Ser Thr Arg Ala Ala Phe219522002205Glu His Arg Ala Val Val Val Gly Gly Asp Arg Glu Glu Leu Leu Gly221022152220Lys Leu Ser Ser Val Ser Gly Val Glu Val Gly Val Gly Val Gly Ala2225 223022352240Gly Gly Gly Val Val Leu Val Phe Ala Gly Gln Gly Cys Gln Trp Val224522502255Gly Met Gly Arg Glu Leu Leu Gly Ser Ser Leu Val Phe Ala Glu Ser226022652270Met Arg Glu Cys Ala Ala Ala Leu Ser Pro Phe Val Asp Phe Ser Val227522802285Val Asp Val Leu Gly Ser Ala Gly Glu Leu Gly Arg Val Glu Val Val229022952300Gln Pro Ala Leu Trp Ala Val Met Val Ser Leu Ala Arg Val Trp Arg2305 231023152320Ser Trp Gly Val Pro Val Ala Ala Val Val Gly His Ser Gln Gly Glu232523302335Ile Ala Ala Ala Thr Val Ala Gly Ala Leu Ser Val Gly Asp Ala Ala234023452350Arg Val Val Ala Leu Arg Ser Arg Leu Ile Ala Glu Arg Leu Ser Gly235523602365Leu Gly Gly Met Val Ser Val Ala Leu Ser Arg Glu Arg Val Val Ser237023752380Leu Ile Ala Gly Val Pro Gly Val Ser Val Ala Ala Val Asn Gly Ser2385 239023952400Ser Ser Thr Val Val Ser Gly Glu Ala Ala Gly Leu Glu Arg Val Leu240524102415Ala Ala Cys Val Ser Ser Gly Val Arg Ala Arg Arg Ile Asp Val Asp242024252430Tyr Ala Ser His Ser Val Gln Val Glu Leu Ile Arg Glu Glu Leu Leu243524402445Gly Val Leu Asp Gly Ile Val Pro Arg Ser Gly Glu Ile Pro Phe Val245024552460Ser Thr Val Thr Gly Glu Arg Ile Asp Thr Val Glu Leu Gly Ala Glu2465 247024752480Tyr Trp Tyr Arg Asn Leu Arg Gln Thr Val Glu Phe Gln Ser Val Val248524902495Glu Gly Leu Val Ala Gln Gly Cys Arg Val Phe Leu Glu Ser Ser Pro250025052510
His Pro Val Leu Thr Val Gly Ile Glu Glu Ser Ala Asp Arg Val Val251525202525Ala Leu Glu Ser Leu Arg Arg Gly Glu Gly Gly Leu Arg Arg Leu Val253025352540Asp Ala Ala Gly Glu Ala Trp Val Arg Gly Val Pro Ile Asp Trp Ala2545 255025552560Gly Met Leu Ala Gly Gly Arg Arg Val Asp Leu Pro Thr Tyr Pro Phe256525702575Gln His Gln Pro Tyr Trp Leu Asp Ser Pro Arg His Pro Ala Gly Asp258025852590Val Thr Ala Val Gly Leu Thr Glu Ala Gly His Ala Phe Val Pro Ala259526002605Ala Val Asp Leu Pro Asp Gly Gln Arg Val Trp Thr Gly Arg Leu Ser261026152620Leu Pro Ser Tyr Pro Trp Leu Ala Asp His Gln Val Leu Gly Gln Val2625 263026352640Leu Leu Pro Gly Val Val Trp Val Glu Leu Ala Leu His Ala Gly His264526502655Gln Ala Gly Cys Asp Ser Val Asp Glu Leu Thr Leu Gln Ser Pro Leu266026652670Val Leu Gly Ala Ser Asp Thr Val Gln Val Arg Val Val Val Thr Glu267526802685Thr Glu Glu Pro Gly Thr Arg Thr Val Ser Met His Ser Arg Arg Asp269026952700Asp Gly Ser Trp Val Thr His Ala Glu Gly Ile Leu Gly Ala Gly Gly2705 271027152720Pro Pro Pro Glu Pro Leu Pro Glu Trp Pro Pro Thr Gly Ala Met Pro272527302735Leu Asp Val Glu Gly Phe Tyr Asp Glu Leu Ala Ala Gly Gly Tyr His274027452750Tyr Gly Pro Gln Phe Arg Cys Leu Arg Arg Ala Trp Arg Ala Gly Glu275527602765Asp Leu Val Ala Glu Ile Ser Leu Pro Glu Gly Thr Asp Val Asp Ala277027752780Tyr Gly Leu His Pro Gly Leu Phe Asp Ala Ala Val His Ser Val Ala2785 279027952800Cys Ala Arg Thr Ser Ala Gly Ala Gly Asp Asp Gly Pro Arg Leu Pro280528102815Phe Ala Phe Ser Asp Val Arg Leu Phe Ala Thr Gly Val Thr Ser Leu282028252830Arg Val Arg Ile Asp Pro Gln Asn Ser Ser Trp Gln Ala Trp Asp Glu283528402845
Ser Gly Leu Pro Val Leu Thr Ile Gly Arg Leu Ala Gly Arg Pro Val285028552860Asp Ala Asp Gln Phe Ala Val Arg Arg Ala Gly His Leu Phe Arg Val2865 287028752880Glu Thr Arg His Glu Ala Leu Ala Gly Pro Ala Pro Ala Ser Trp Ala288528902895Val Ile Gly Ala Asp Pro Ala Gly Tyr Ala Ala Ala Leu Glu Ala Thr290029052910Gly Ala Gln Val Thr Thr Ala Ala Asp Leu Ala Gly Leu Thr Ser Ala291529202925Pro Glu Ala Ala Leu Phe Thr Leu Pro Gly Thr Lys Asp Ala Gly Val293029352940Thr Glu Glu Val Pro Thr Ala Val Arg Glu Ala Thr Ala Gln Val Leu2945 295029552960Glu Val Leu Gln Asp Trp Leu Thr Asp Gly Arg Phe Asp Asp Ala Arg296529702975Leu Val Val Val Ser Arg Glu Ala Glu Asp Gly Asp Leu Leu His Gly298029852990Thr Ala Arg Gly Leu Leu Arg Ala Ala Gln Ala Glu His Pro Asp Arg299530003005Ile Thr Leu Val Asp Leu Asp Ala His Pro Ala Ser Leu Thr Ala Leu300530153020Pro Gly Phe Ala Leu Gly Pro Glu Pro Glu Val Val Val Arg Ala Gly3025 303030353040Asp Gly Arg Ala Pro Arg Leu Ala Arg Ala Gln Ala Pro Thr Gly Ala304530503055Gly Ser Leu Gly Thr Gly Thr Val Leu Ile Thr Gly Gly Thr Gly Thr306030653070Leu Gly Gly Leu Leu Ala Arg His Leu Val Glu Thr His Gly Val Thr307530803085Arg Leu Leu Leu Val Ser Arg Arg Gly Pro Ala Ala Asp Gly Ala Asp309030953100Arg Leu His Ala Glu Leu Thr Gly His Gly Ala His Val Asp Ile Val3105 311031153120Ala Ala Asp Leu Gly Asp Arg Thr Ser Val Ala Ala Leu Leu Ala Thr312531303135Val Asp Ala Asp His Pro Leu Ser Ala Val Val His Ala Ala Gly Ala314031453150Leu Asp Asp Gly Val Leu Gly Thr Arg Ser Ala Asp Trp Leu Asp Pro315531603165Val Leu Arg Pro Lys Ala Asp Ala Ala Trp His Leu His Glu Leu Thr317031753180
Ala Glu Leu Pro Leu Thr Ala Phe Val Met Phe Ser Ser Ala Ala Ser3185 319031953200Val Leu Gly Ala Ala Gly Gln Ala Asn Tyr Ala Ala Ala Asn Gly Phe320532103215Leu Asp Ala Leu Ala Ala His Arg Ala Ala Arg Gly Leu Pro Gly Thr322032253230Ser Leu Ala Trp Gly Leu Trp Glu His Arg Ser Glu Leu Thr Arg His323532403245Thr Gly Ser Pro Ser Arg Ser Ile Ala Ala Val Gly Ala Leu Ser Thr325032553260Ala Glu Ala Leu Ala Ala Phe Asp Ala Gly Leu Ala Ser Gly Glu Pro3265 327032753280Leu Ala Val Pro Ile Arg Leu Glu Ser Thr Ser Ser Glu Glu Val Pro328532903295Pro Met Leu Arg Gly Leu Val Arg Val Arg Arg Arg Ala Ala Thr Gly330033053310Thr Glu Pro Ala Ala Ser Ala Gly Ala Ala Gln Glu Val Arg Gln Leu331533203325Ala Glu Leu Gly Ala Asp Glu Arg Gln Arg Arg Val Gln Arg Ile Val333033353340Leu Asp Thr Ala Ala Ala Val Leu Gly His Asp Ser His Asp Ala Ile3345 335033553360Pro Leu Thr Arg Gly Phe Leu Glu Leu Gly Phe Asp Ser Leu Thr Ala336533703375Val Arg Leu Arg Asn Arg Leu Ala Arg Arg Leu Gly Leu Arg Leu Pro338033853390Ala Thr Val Val Phe Asp His Pro Ser Pro Ala Ala Leu Ala Ala His339534003405Leu Val Glu His Leu Val Gly Thr Val Asp Pro Thr Ala Gln Ala Met341034153420Glu Gln Leu Glu Ala Leu Arg Arg Ser Val His Ala Ala Thr Pro Ala3425 343034353440Gly Gly Leu Asp Arg Ala Leu Val Thr Gln Arg Leu Thr Ala Leu Leu344534503455Asp Glu Met Arg His Val Asp Gly Pro Gly Gly Thr Glu Gly Pro Asp346034653470Gly Ser Gly Asp Asp Leu Glu Asn Ala Thr Ala Asp Glu Ile Tyr Ala347534803485Leu Ile Asp Asn Glu Leu Gly Ile Gly Gly Thr Gln349034953500<210>5
<211>1620<212>PRT<213>小链霉菌Tü4055<400>5Met Asn Gly Asp Asp Lys Ala Leu Ala Tyr Leu Lys Arg Val Thr Ala1 5 10 15Asp Leu Arg Ser Ala Arg Ala Arg Leu Gln Glu Leu Glu Ser Ala Asp20 25 30Thr Asp Pro Ile Ala Ile Ile Gly Met Gly Cys Arg Leu Pro Gly Gly35 40 45Val Arg Thr Pro Glu Asp Leu Trp Asp Leu Val Glu Lys Lys His Asp50 55 60Ala Ile Gly Pro Phe Pro Ala Asp Arg Gly Trp Asp Leu Glu Asn Leu65 70 75 80Tyr Asp Pro Asp Pro Asp Ala Pro Gly Lys Ala Tyr Val Arg Glu Gly85 90 95Gly Phe Val His Asp Val Ala Gly Phe Asp Ala Gly Phe Phe Gly Ile100 105 110Ser Pro Arg Glu Ala Leu Ala Met Asp Pro Gln His Arg Leu Leu Leu115 120 125Glu Cys Ser Trp Glu Ala Leu Glu Arg Ala Gly Ile Asp Pro Ser Ser130 135 140Leu Glu Gly Thr Arg Thr Gly Val Tyr Thr Gly Leu Met Thr His Glu145 150 155 160Tyr Ala Thr Arg Leu Pro Ser Ile Asp Glu Glu Leu Glu Gly Val Ile165 170 175Gly Ile Gly Asn Ala Gly Ser Val Ala Ser Gly Arg Val Ser Tyr Thr180 185 190Leu Gly Leu Asn Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser195 200 205Ser Leu Val Ala Leu His Leu Ala Ala Gln Ala Leu Arg Gln Gly Gln210 215 220Cys Thr Leu Ala Leu Ala Gly Gly Ala Ser Val Ile Ala Ala Pro Thr225 230 235 240Val Phe Ala Thr Phe Ser Arg Gln Arg Gly Leu Ala Pro Asp Gly Arg245 250 255Cys Lys Ala Phe Ser Ser Thr Thr Asp Gly Thr Gly Phe Gly Glu Gly260 265 270Val Gly Val Leu Val Leu Glu Arg Leu Ser Asp Ala Arg Arg Asn Gly275 280 285His Glu Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly290 295 300Ala Ser Ser Gly Phe Thr Ala Pro Asn Gly Pro Ser Gln Gln Asp Val
305 310 315 320Ile Arg Glu Ala Leu Ala Asp Gly Arg Leu Thr Pro Ala Asp Val Asp325 330 335Val Val Glu Gly His Gly Thr Gly Thr Arg Leu Gly Asp Pro Ile Glu340 345 350Ala Gln Ala Leu Leu Ala Thr Tyr Gly Arg Gly Arg Asp Ala Asp Arg355 360 365Pro Leu Trp Leu Gly Ser Val Lys Ser Asn Ile Gly His Thr Gln Ala370 375 380Ala Ala Gly Val Ala Ser Val Ile Lys Met Val Gln Ala Met Gln Ala385 390 395 400Gly Val Leu Pro Arg Thr Leu His Val Asp Glu Pro Ser Gly Glu Val405 410 415Asp Trp Asp Ser Gly Ala Val Arg Leu Leu Thr Glu Ala Arg Glu Trp420 425 430Pro Ser Gly Glu Gly Arg Val Arg Arg Ala Gly Val Ser Ser Phe Gly435 440 445Ile Ser Gly Thr Asn Ala His Val Ile Leu Glu Glu Pro Pro Ala Glu450 455 460Asp Ala Leu Pro Glu Pro Glu Ala Gly Asp Val Val Pro Trp Val Leu465 470 475 480Ser Ala Arg Ser Ala Glu Ala Leu Arg Glu Gln Ala Ala Arg Leu Ala485 490 495Ser Val Ala Gly Gly Leu Asn Val Val Asp Val Gly Trp Ser Leu Ala500 505 510Ser Thr Arg Ala Ala Phe Glu His Arg Ala Val Val Val Gly Gly Asp515 520 525Arg Glu Glu Leu Leu Gly Lys Leu Ser Ser Val Ser Gly Val Glu Val530 535 540Gly Val Gly Val Gly Ala Gly Gly Gly Val Val Leu Val Phe Ala Gly545 550 555 560Gln Gly Cys Gln Trp Val Gly Met Gly Arg Glu Leu Leu Gly Ser Ser565 570 575Leu Val Phe Ala Glu Ser Met Arg Glu Cys Ala Ala Ala Leu Ser Pro580 585 590Phe Val Asp Phe Ser Val Val Asp Val Leu Gly Ser Ala Gly Glu Leu595 600 605Gly Arg Val Glu Val Val Gln Pro Ala Leu Trp Ala Val Met Val Ser610 615 620Leu Ala Arg Val Trp Arg Ser Trp Gly Val Pro Val Ala Ala Val Val625 630 635 640Gly His Ser Gln Gly Glu Ile Ala Ala Ala Thr Val Ala Gly Ala Leu
645 650 655Ser Val Gly Asp Ala Ala Arg Val Val Ala Leu Arg Ser Arg Leu Ile660 665 670Ala Glu Arg Leu Ser Gly Leu Gly Gly Met Val Ser Val Ala Leu Ser675 680 685Arg Glu Arg Val Val Ser Leu Ile Ala Gly Val Pro Gly Val Ser Val690 695 700Ala Ala Val Asn Gly Ser Ser Ser Thr Val Val Ser Gly Glu Ala Ala705 710 715 720Gly Leu Glu Arg Val Leu Ala Ala Cys Val Ser Ser Gly Val Arg Ala725 730 735Arg Arg Ile Asp Val Asp Tyr Ala Ser His Ser Val Gln Val Glu Leu740 745 750Ile Arg Glu Glu Leu Leu Gly Val Leu Asp Gly Ile Val Pro Arg Ser755 760 765Gly Glu Ile Pro Phe Val Ser Thr Val Thr Gly Glu Arg Ile Asp Thr770 775 780Val Glu Leu Gly Ala Glu Tyr Trp Tyr Arg Asn Leu Arg Gln Thr Val785 790 795 800Glu Phe Gln Ser Val Val Glu Gly Leu Val Ala Gln Gly Cys Arg Val805 810 815Phe Leu Glu Ser Ser Pro His Pro Val Leu Thr Val Gly Ile Glu Glu820 825 830Ser Ala Asp Arg Val Val Ala Leu Glu Ser Leu Arg Arg Gly Glu Gly835 840 845Gly Leu Arg Arg Leu Val Asp Ala Ala Gly Glu Ala Trp Val Arg Gly850 855 860Val Pro Ile Asp Trp Ala Gly Met Leu Ala Gly Gly Arg Arg Val Asp865 870 875 880Leu Pro Thr Tyr Pro Phe Gln His Gln Pro Tyr Trp Leu Asp Ser Pro885 890 895Arg His Pro Ala Gly Asp Val Thr Gly Pro Gly Asp Asp Glu Phe Trp900 905 910Ala Ala Val Glu His Gly Glu Ala Thr Glu Leu Ala Asp Leu Leu Arg915 920 925Arg Ser Ala Ala Glu Pro Gly Gln Asp Leu His Ala Pro Val Ala Ala930 935 940Leu Leu Pro Thr Leu Ala Thr Trp Arg Arg Asp Arg Gln Arg Arg Ala945 950 955 960Ala Val Asp Ser Trp Arg Tyr Arg Ile Val Trp Arg Pro Val Ala Thr965 970 975Pro Ser Tyr Asp Arg Val Leu Ser Gly Arg Trp Ala Val Val Val Pro
980 985 990Ala Gly His Glu Asp Asp Pro Val Val Asp Trp Val Cys Ser Ala Leu99510001005Arg Asp His Gly Gly Glu Pro Glu Arg Met Val Leu Gly Pro Arg Glu101010151020Ser Arg Ser Ala Leu Ala Thr Arg Leu Ala Ala Asp Pro Pro Gly Gly1025 103010351040Val Val Ser Leu Leu Gly Leu Ser Gly Ala Ala His Pro Asp His Glu104510501055Val Leu Pro Ser Ala Val Ala Gly Thr Val Leu Leu Ala Gln Ala Leu106010651070Ser Asp Gly Ala Val Arg Ala Pro Val Trp Thr Leu Thr Arg Asn Gly107510801085Val Ser Ala Thr Ala Thr Asp Pro Val Ala Pro Thr His Ala Ala Gln109010951100Val Trp Ala Val Ala Arg Val Ala Gly Leu Glu His Pro Glu Ala Trp1105 111011151120Gly Gly Leu Leu Asp Leu Pro Asp Arg Leu Asp Asp Arg Ala Ala Ala112511301135Arg Phe Ala Ala Val Leu Ser Ala Gly Glu Asp Glu Asp Gln Leu Ala114011451150Leu Arg Asp Ala Gly Leu Leu Ala Arg Arg Leu Val Arg Ala Pro Val115511601165Pro Arg Asp Ala Val Thr Ala Gly Trp Gln Pro Arg Asp Thr Ala Leu117011751180Val Thr Gly Gly Thr Gly Gly Leu Gly Gly Gln Val Ala Arg Trp Leu1185 119011951200Ala Ala Ala Gly Val Arg His Leu Val Leu Val Ser Arg Arg Gly Ala120512101215Glu Ala Glu Gly Ala Asp Arg Leu Arg Asp Asp Leu Thr Ala Leu Gly122012251230Val Gln Val Thr Phe Gly Ala Cys Asp Val Ala Asp Arg Ala Ala Leu123512401245Ser Ala Leu Leu Asp Arg Val Gln Glu Asp Gly Pro Pro Ile Arg Thr125012551260Val Val His Ala Ala Gly Ser Gly Arg Ala Ala Arg Leu Leu Asp Thr1265 127012751280Asp Ala Glu Glu Thr Ala Ala Val Leu Arg Ala Lys Ser Ala Gly Ala128512901295Arg Asn Leu His Glu Leu Leu Asp Asp Val Asp Ala Phe Val Leu Phe130013051310Ser Ser Gly Ala Gly Val Trp Gly Ser Ser Ala Gln Gly Ala Tyr Ala
131513201325Ala Ala Asn Ala Tyr Leu Asp Ala Leu Ala Glu Gln Arg Arg Gly Gln133013351340Gly Arg Pro Ala Thr Ser Val Ala Trp Gly Ala Trp Ala Gly Asp Gly1345 135013551360Met Thr Ala Ala Ala Gly Glu Glu Trp Trp Ser Arg Gln Gly Leu Arg136513701375Phe Met Ala Pro Glu Ala Ala Leu Asp Ala Leu Arg Gln Ala Val Asp138013851390Arg Ala Glu Ser Thr Leu Val Val Ala Asp Ile Asp Trp Lys Thr Phe139514001405Ala Pro Leu Phe Thr Ser Ala Arg Ser Arg Pro Leu Ile Thr Asp Ile141014151420Pro Glu Ala Arg Pro Glu Pro Arg Pro Glu Gly Ala Asp Gln Pro Thr1425 143014351440Gln Gly Leu Val Ala Lys Leu Ala Val Leu Ser Ala Asp Glu Arg Arg144514501455Arg Ala Leu Leu Ala Glu Val Arg Ala Gln Ala Ala Val Val Leu Gly146014651470His Pro Gly Ala Asp Ala Val Pro Val Asp Arg Pro Phe Arg Glu Leu147514801485Gly Phe Asp Ser Leu Ser Ala Val Lys Leu Arg Asn Arg Ile Val Ala149014951500Ala Thr Gly Leu Glu Leu Pro Ala Thr Leu Val Phe Asp His Pro Thr1505 151015151520Ser Thr Ala Leu Ala Ala Tyr Leu Gly Ala Arg Leu Gly Ile Asp Gly152515301535Ala Pro Ala Gly Ser Thr Leu Leu Glu Asp Leu Ala Arg Leu Glu Ser154015451550Thr Val Ala Thr Leu Thr Ala Ala Pro Leu Ala Glu Thr Val Pro Asp155515601565Ala Arg Asp Arg Ala Ala Leu Thr Thr Arg Leu Arg Ala Leu Leu Glu157015751580Arg Trp Asp Gln Ala Asp Gly Glu Asp Gln Ala Ala Ala Arg Glu Glu1585 159015951600Leu Asp Asp Leu Ser Asp Asp Asp Leu Phe Asp Phe Ile Asp Ala Lys160516101615Phe Gly Arg Ser1620<210>6<21l>2130<212>PRT<213>小链霉菌Tü4055
<400>6Met Gly Asp Glu Gln Lys Leu Arg Thr Tyr Leu Arg Arg Val Thr Ala1 5 10 15Asp Leu Ala Asp Val Thr Glu Arg Leu Gln Arg Ala Glu Asp Lys Asn20 25 30Ala Glu Pro Ile Ala Ile Val Gly Met Gly Cys Arg Tyr Pro Gly Gly35 40 45Val Arg Ser Pro Glu Glu Phe Trp Asn Leu Leu Asp Glu Gly Val Asp50 55 60Ala Val Ala Gly Phe Pro Glu Asp Arg Gly Trp Asp Leu Glu Asn Leu65 70 75 80Tyr Asp Pro Asp Pro Asp Glu Pro Gly Lys Cys Tyr Ala Arg Glu Gly85 90 95Gly Phe Leu Tyr Asp Ala Gly Glu Phe Asp Ala Ala Phe Phe Gly Ile100 105 110Ser Pro Arg Glu Ala Leu Ser Met Asp Pro Gln Gln Arg Leu Leu Leu115 120 125Glu Cys Ser Trp Ser Ala Leu Glu Arg Ala Gly Ile Asp Pro Gly Ser130 135 140Leu Arg Gly Lys Asp Val Gly Val Tyr Val Gly Ala Trp Asn Ser Asn145 150 155 160Tyr Gly Arg Gly Gly Gly Ala Glu Ser Ser Glu Gly His Leu Leu Thr165 170 175Gly Asn Ala Ser Ser Val Val Ser Gly Arg Val Ala Tyr Val Leu Gly180 185 190Leu Glu Gly Pro Ala Val Thr Ile Asp Thr Ala Cys Ser Ser Ser Leu195 200 205Val Gly Leu His Leu Ala Ala Gln Ala Leu Arg Ser Gly Glu Cys Gly210 215 220Leu Ala Leu Ala Gly Gly Val Thr Val Met Ser Thr Pro Leu Ser Leu225 230 235 240Val Ser Phe Ser Arg Gln Arg Gly Leu Ala Gln Asp Gly Arg Ser Lys245 250 255Ala Phe Ser Ala Asp Ala Asp Gly Met Gly Met Ala Glu Gly Val Gly260 265 270Val Leu Val Leu Glu Arg Leu Ser Glu Ala Arg Arg Asn Gly His Glu275 280 285Val Leu Ala Val Leu Arg Ser Ser Ala Val Asn Gln Asp Gly Ala Ser290 295 300Asn Gly Leu Ser Ala Pro Asn Gly Pro Ala Gln Gln Arg Val Ile Gln305 310 315 320Ser Ala Leu Thr Val Gly Arg Leu Ala Pro Ser Asp Ile Asp Val Val
325 330 335Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp Pro Ile Glu Ala Gln340 345 350Ala Leu Leu Ala Thr Tyr Gly Arg Gly Arg Asp Ala Asp Arg Pro Leu355 360 365Trp Leu Gly Ser Val Lys Ser Asn Ile Gly His Thr Gln Ala Ala Ala370 375 380Gly Val Ala Gly Val Ile Lys Met Val Leu Ala Leu Arg Lys Gly Val385 390 395 400Leu Pro Arg Thr Leu His Val Asp Glu Pro Thr Gly Glu Val Asp Trp405 410 415Asp Ser Gly Ala Val Arg Leu Leu Thr Glu Ala Arg Glu Trp Pro Ser420 425 430Gly Glu Gly Arg Val Arg Arg Ala Gly Val Ser Ser Phe Gly Ile Ser435 440 445Gly Thr Asn Ala His Val Ile Val Glu Glu Ala Pro Glu Glu Glu Pro450 455 460Arg Pro Glu Ala Pro Ser Val Asp Val Val Pro Trp Val Leu Ser Ala465 470 475 480Arg Ser Ala Glu Ala Leu Arg Glu Gln Ala Ala Arg Leu Ala Ser Val485 490 495Ala Gly Gly Leu Asn Val Val Asp Val Gly Trp Ser Leu Ala Ser Thr500 505 510Arg Ala Ala Phe Glu His Arg Ala Val Val Val Gly Arg Asp Ser Glu515 520 525Glu Leu Val Ser Gly Leu Ser Ser Val Ser Gly Val Glu Val Gly Val530 535 540Gly Val Gly Ala Gly Gly Gly Val Val Leu Val Phe Ala Gly Gln Gly545 550 555 560Cys Gln Trp Val Gly Met Gly Arg Glu Leu Leu Gly Ser Ser Leu Val565 570 575Phe Ala Glu Ser Met Arg Glu Cys Ala Ala Ala Leu Ser Pro Phe Val580 585 590Asp Phe Ser Val Val Asp Val Leu Gly Ser Ala Gly Glu Leu Gly Arg595 600 605Val Glu Val Val Gln Pro Ala Leu Trp Ala Val Met Val Ser Leu Ala610 615 620Arg Val Trp Arg Ser Trp Gly Val Pro Val Ala Ala Val Val Gly His625 630 635 640Ser Gln Gly Glu Ile Ala Ala Ala Thr Val Ala Gly Ala Leu Ser Val645 650 655G1V Asp Ala Ala Arg Val Val Ala Leu Arg Ser Arg Leu Ile Ala Glu
660 665 670Arg Leu Ser Gly Leu Gly Gly Met Val Ser Val Ala Leu Ser Arg Glu675 680 685Arg Val Val Ser Leu Ile Ala Gly Val Pro Gly Val Ser Val Ala Ala690 695 700Val Asn Gly Ser Ser Ser Thr Val Val Ser Gly Glu Ala Ala Gly Leu705 710 715 720Glu Arg Val Leu Ala Ala Cys Val Ser Ser Gly Val Arg Ala Arg Arg725 730 735Ile Asp Val Asp Tyr Ala Ser His Ser Val Gln Val Glu Leu Ile Arg740 745 750Glu Glu Leu Leu Gly Val Leu Asp Gly Ile Val Pro Arg Ser Gly Glu755 760 765Ile Pro Phe Val Ser Thr Val Thr Gly Glu Arg Ile Asp Thr Val Glu770 775 780Leu Gly Ala Glu Tyr Trp Tyr Arg Asn Leu Arg Gln Thr Val Glu Phe785 790 795 800Gln Ala Ser Val Gln Thr Leu Leu Ala Gln Gly His Gln Val Phe Leu805 810 815Glu Ser Ser Pro His Pro Val Leu Thr Val Gly Ile Glu Glu Thr Val820 825 830His Glu Ser Ala Ala Gln Ala Val Val Leu Gly Ser Leu Arg Arg Asp835 840 845Glu Gly Ala Leu Thr Arg Leu Val Thr Ser Ala Gly Glu Ala Trp Ala850 855 860Arg Gly Val Pro Val Asp Trp Ala Gly Met Leu Ala Gly Gly Arg Arg865 870 875 880Val Glu Leu Pro Thr Tyr Pro Phe Leu Arg Glu Arg Leu Trp Leu Glu885 890 895Pro Ser Arg Ser Arg Thr Gly Asn Leu Asn Met Ala Gly Leu Val Glu900 905 910Ala Gly His Glu Ile Leu Pro Ala Ala Val Glu Leu Pro Gly Glu Gln915 920 925Trp Val Trp Thr Gly Glu Leu Ser Leu Ser Ala Tyr Pro Trp Leu Ala930 935 940Asp His Gln Val Leu Gly Gln Thr Leu Val Pro Gly Val Ala Trp Val945 950 955 960Glu Leu Ala Leu His Ala Gly His Gln Leu Gly Phe Gly Ser Val Glu965 970 975Glu Leu Thr Leu Gln Ala Pro Leu Val Leu Gly Glu Ser Asp Ala Val980 985 990Gln Val Arg Val Val Val Ser Asp Leu Gly Glu Ser Asp Arg Arg Ala
99510001005Val Ser Val His Ser Arg Gly Asp Asp Gln Thr Trp Val Thr His Ala101010151020Glu Gly Phe Leu Thr Ala Lys Gly Ala Gln Pro Glu Thr Met Ala Val1025 103010351040Trp Pro Pro Ser Gly Ala Glu Pro Val Glu Ala Asp Gly Phe Tyr Glu104510501055Arg Leu Ala Asp Ala Gly Tyr His Tyr Gly Pro Val Phe Gln Gly Val106010651070Ser Lys Val Trp Arg Ala Gly Glu Glu Ile Tyr Ala Glu Val Gly Leu107510801085Leu Asp Asp Ala Asp Val Asp Gly Phe Gly Ile His Pro Ala Leu Leu109010951100Asp Ala Ala Leu Gln Thr Ala Tyr Val Ala Gln Arg Gly Pro Ala Glu1105 111011151120Thr Lys Leu Pro Phe Ala Phe Gly Asp Val Gln Leu Phe Ala Thr Gly112511301135Ala Arg Ser Leu Arg Val Arg Val Ser Pro Ala Ala Gln Gln Gly Met114011451150Ala Trp Glu Ala Trp Asp Pro Thr Gly Leu Pro Val Phe Ser Leu Gly115511601165Tyr Leu Ala Thr Arg Pro Val Asp Arg Gly Gln Leu Thr Val Lys Arg117011751180Pro Glu Ser Leu Phe Lys Val Ala Trp Asp Glu Thr Val Pro Val Val1185 119011951200Gly Asn Ala Thr Ala Ala His Gly Val Val Leu Gly Asp Asp Pro Phe120512101215Ala Leu Gly Ala Ala Leu Arg Ala Ala Gly Trp Glu Val Gly Ala Ala122012251230Pro Glu Pro Ala Ser Ala Asp Thr Ala Ala Glu Val Leu Leu Leu Pro123512401245Cys Thr Ala Pro Gly Glu Pro Asp Ala Asp Leu Pro Thr Ala Val Arg125012551260Ala Val Thr Ala Arg Val Leu Gly Val Leu Gln Glu Trp Leu Ala Asp1265 127012751280Glu Arg Leu Ala Gly Thr Arg Leu Ala Val Val Thr Arg Asn Ala Leu128512901295Pro Gly Asp Leu Leu His Ser Pro Val Trp Gly Leu Val Arg Ser Ala130013051310Gln Thr Glu Asn Pro Gly Arg Ile Thr Leu Val Asp Leu Asp Asp His131513201325Pro Asp Ser Ala Ala Val Leu Ala Glu Ala Val Gln Ser Asp Glu Pro
133013351340Arg Ile Met Val Arg Glu Gly Arg Pro Thr Ala Ala Arg Leu Val Arg1345 135013551360Ala Thr Ala Pro Glu Leu Val Pro Pro Ala Gly Ala Asp Ala Trp Arg136513701375Leu Glu Ile Thr Glu Pro Gly Thr Phe Asp Asn Leu Thr Leu Gly Val138013851390Tyr Pro His Ala Glu Lys Thr Leu Ala Asp Asn Glu Val Arg Val Ala139514001405Val His Ala Gly Gly Leu Asn Phe His Asp Val Val Ala Ala Leu Gly141014151420Met Val Glu Asp Asp Leu Thr Leu Gly Arg Glu Ala Ala Gly Val Val1425 143014351440Val Glu Val Gly Asp Ala Val Pro Asp Leu Thr Pro Gly Asp His Val144514501455Met Gly Ile Leu Ser Ser Gly Phe Gly Pro Leu Ala Val Thr Asp His146014651470Arg Tyr Leu Ala Arg Met Pro Glu Gly Trp Thr Phe Ala Gln Ala Ala147514801485Ser Val Pro Ala Ala Phe Leu Thr Ala Tyr Tyr Gly Leu Cys Asp Leu149014951500Gly Gly Ile Arg Ala Gly Asp Arg Val Leu Ile His Ala Ala Ala Gly1505 151015151520Gly Val Gly Met Ala Ala Val Gln Ile Ala Arg His Leu Gly Ala Glu152515301535Val Phe Gly Thr Ala Ser Pro Arg Lys Trp Gly Ala Leu Arg Ala Leu154015451550Gly Leu Asp Asp Ala His Leu Ser Ser Ser Arg Thr Leu Asp Phe Glu155515601565Gln Glu Phe Leu Asp Ala Thr Asp Gly Arg Gly Val Asp Leu Val Leu157015751580Asn Ser Leu Ala Arg Glu Phe Val Asp Ala Ser Leu Arg Leu Met Pro1585 159015951600Gly Gly Gly Arg Phe Val Asp Met Gly Lys Thr Asp Ile Arg Arg Pro160516101615Glu Gln Val Ala Glu Asp His Gly Gly Val Ala Tyr Gln Ala Phe Asp162016251630Leu Val Glu Ala Gly Pro Gln Arg Thr Gly Glu Met Leu Ala Glu Ile163516401645Val Arg Leu Phe Gln Ala Gly Ala Phe Arg Pro Leu Pro Ile Thr Gln165016551660Trp Asp Val Arg Arg Ala Pro Glu Ala Phe Arg His Ile Ser Gln Ala
1665 167016751680Lys His Ile Gly Lys Ile Val Leu Thr Val Pro Arg Pro Ile Asp Thr168516901695Asp Gly Thr Val Met Val Thr Gly Ala Thr Gly Thr Leu Gly Gly Phe170017051710Val Ala Arg His Leu Val Thr His His Gly Ile Arg Arg Leu Leu Leu171517201725Val Ser Arg Ser Ala Glu Arg Thr Asp Leu Val Arg Glu Leu Thr Glu173017351740Leu Gly Ala Asp Val Thr Trp Ala Ser Cys Asp Leu Ala Asp Ala Thr1745 175017551760Ala Val Glu Glu Thr Val Arg Ser Val Asp Glu Arg His Pro Leu Val176517701775Ala Val Val His Ser Ala Gly Val Leu Asp Asp Gly Val Ile Asp Lys178017851790Gln Ser Pro Glu Arg Leu Asp Thr Val Met Arg Pro Lys Val Asp Ala179518001805Ala Trp Asn Leu His Arg Leu Leu Asp Asn Ala Pro Leu Ala Asp Phe181018151820Val Leu Phe Ser Ser Ala Ser Gly Val Leu Gly Gly Ala Gly Gln Ser1825 183018351840Asn Tyr Ala Ala Ala Asn Ala Phe Leu Asp Ala Leu Ala Glu His Arg184518501855Arg Ala Gln Gly Leu Ala Gly Gln Ala Leu Ala Trp Gly Leu Trp Ser186018651870Asp Arg Ser Thr Met Thr Gly Gln Leu Gly Ser Thr Glu Leu Ala Arg187518801885Ile Ala Arg Asn Gly Val Ala Glu Met Ser Glu Thr Glu Gly Leu Ala189018951900Leu Phe Asp Ala Ala Arg Asp Thr Ala Glu Ala Val Leu Leu Pro Met1905 191019151920His Leu Asp Val Ala Arg Leu Arg Ser Arg Asn Gly Glu Val Pro Ala192519301935Val Phe Arg Arg Leu Ile His Ala Thr Ala Arg Arg Thr Ala Ser Thr194019451950Ala Val Arg Ser Ala Gly Leu Glu Gln Gln Leu Ala Ser Leu Ser Gly195519601965Pro Glu Arg Thr Glu Leu Leu Leu Gly Leu Val Arg Asp His Ala Ala197019751980Ala Val Leu Gly His Gly Thr Ser Asp Ala Val Ser Pro Asp Arg Pro1985 199019952000Phe Arg Asp Leu Gly Phe Asp Ser Leu Thr Ala Val Glu Leu Arg Asn
200520102015Arg Phe Ala Ala Leu Thr Gly Leu Arg Leu Pro Ala Thr Leu Val Phe202020252030Asp His Pro Ser Pro Thr Ala Leu Ala Gly His Leu Ala Gly Leu Leu203520402045Gly Ala Ala Thr Pro Ser Ala Ala Glu Pro Val Leu Ala Ala Val Gly205020552060Arg Leu Arg Ala Asp Leu Arg Ser Leu Thr Pro Asp Ala Glu Gly Ala2065 207020752080Glu Asp Val Thr Ile Gln Leu Glu Ala Leu Leu Ala Glu Trp Arg Glu208520902095Ala Ala Glu Lys Arg Ala Pro Glu Ala Val Gly Asp Glu Asp Leu Ser210021052110Thr Ala Thr Asp Asp Glu Ile Phe Ala Leu Val Asp Ser Glu Leu Gly211521202125Glu Ala2130<210>7<211>1742<212>PRT<213>小链霉菌Tü4055<400>7Met Thr Ala Glu Ala Ser Gln Asp Lys Leu Arg Asp Tyr Leu Arg Lys1 5 10 15Thr Leu Ala Asp Leu Arg Thr Thr Lys Gln Arg Leu Arg Asp Thr Glu20 25 30Arg Arg Ala Thr Glu Pro Val Ala Ile Val Gly Met Ser Cys Arg Leu35 40 45Pro Gly Asp Val Arg Thr Pro Glu Arg Phe Trp Glu Leu Leu Asp Thr50 55 60Gly Thr Asp Ala Leu Thr Pro Leu Pro Thr Asp Arg Gly Trp Asn Leu65 70 75 80Asp Thr Ala Phe Asp Asp Glu Arg Pro Tyr Arg Arg Glu Gly Gly Phe85 90 95Leu Tyr Asp Ala Gly Arg Phe Asp Ala Glu Phe Phe Gly Ile Ser Pro100 105 110Arg Glu Ala Leu Ala Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Ser115 120 125Ser Trp Glu Ala Ile Glu His Ala Arg Ile Asp Pro Arg Ser Leu His130 135 140Gly Ser Arg Thr Gly Val Trp Phe Gly Thr Ile Gly Gln Asp Tyr Phe145 150 155 160Ser Leu Phe Ala Ala Ser Gly Gly Glu His Ala Asn Tyr Leu Ala Thr
165 170 175Ala Cys Ser Ala Ser Val Met Ser Gly Arg Val Ser Tyr Val Leu Gly180 185 190Leu Glu Gly Pro Ala Val Thr Val Asp Thr Ala Cys Ser Ser Ser Leu195 200 205Val Ala Leu His Ser Ala Val Gln Ala Leu Arg Ser Gly Glu Cys Glu210 215 220Leu Ala Leu Ala Gly Gly Ala Thr Val Met Ala Thr Pro Thr Val Phe225 230 235 240Thr Ala Phe Ser His Gln Arg Gly Leu Ala Gly Asp Gly Arg Cys Lys245 250 255Ala Phe Ala Ala Gly Ala Asp Gly Ala Gly Phe Ala Glu Gly Val Gly260 265 270Val Leu Val Leu Glu Arg Leu Ser Val Ala Arg Arg Asn Gly His Arg275 280 285Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala Ser290 295 300Asn Gly Leu Thr Ala Pro Asn Gly Pro Ser Gln Gln Arg Val Ile Arg305 310 315 320Ala Ala Leu Ala Asn Ala Arg Leu Ala Pro Glu Asp Val Asp Ala Val325 330 335Glu Gly His Gly Thr GIy Thr Ser Leu Gly Asp Pro Ile Glu Ala Gln340 345 350Ala Leu Leu Ala Thr Tyr Gly Arg Gly Arg Asp Ala Glu Arg Pro Leu355 360 365Trp Leu Gly Ser Val Lys Ser Asn Ile Gly His Ala Gln Ala Ala Ala370 375 380Gly Val Ala Gly Val Ile Lys Met Val Leu Ala Met Glu Lys Gly Arg385 390 395 400Leu Pro Arg Thr Leu His Val Asp Glu Pro Ser Gly Glu Val Asp Trp405 410 415Asp Ser Gly Ala Val Arg Leu Leu Thr Glu Ala Arg Asp Trp Pro Ser420 425 430Gly Glu Gly Arg Val Arg Arg Ala Gly Val Ser Ser Phe Gly Ile Ser435 440 445Gly Thr Asn Ala His Val Ile Ile Glu Glu Pro Gln Glu Glu Glu Ala450 455 460Ala Pro Asp Ser Ser Ala Ser Gly Ala Val Pro Trp Val Leu Ser Ala465 470 475 480Arg Ser Ala Glu Ala Leu Gln Ala Leu Ala Ser Gln Leu Ala Asp His485 490 495Ser Ala Lys Ser Ser Pro Val Asp Val Gly Trp Ser Leu Val Ser Thr
500 505 510Arg Ala Ala Phe Glu His Arg Ala Val Val Val Gly Arg Gly Arg Asp515 520 525Glu Leu Val Arg Gly Leu Ser Glu Val Ala Gln Gly Arg Gly Val Arg530 535 540Gly Val Ala Ser Ser Ala Ser Gly Gly Leu Ala Phe Val Phe Ala Gly545 550 555 560Gln Gly Ser Gln Arg Leu Gly Met Gly Arg Gly Leu Tyr Glu Arg Phe565 570 575Pro Val Phe Ala Glu Ala Phe Asp Glu Val Cys Gly Arg Val Gly Pro580 585 590Gly Val Arg Glu Val Val Phe Gly Ser Asp Ala Gly Glu Leu Asp Arg595 600 605Thr Val Trp Ala Gln Ala Gly Leu Phe Ala Leu Glu Val Ala Leu Phe610 615 620Arg Leu Leu Glu Ser Trp Gly Val Arg Pro Gly Cys Leu Ile Gly His625 630 635 640Ser Val Gly Glu Leu Ser Ala Ala Cys Val Ala Gly Leu Trp Ser Leu645 650 655Glu Asp Ala Cys Arg Val Val Ala Ala Arg Ala Arg Leu Met Gln Ala660 665 670Leu Pro Ala Gly Gly Val Met Val Ala Val Arg Ala Glu Ala Gly Glu675 680 685Leu Ala Gly Phe Leu Gly Glu Asp Val Val Ile Ala Ser Val Asn Ala690 695 700Pro Gly Gln Val Val Ile Ala Gly Pro Glu Gly Gly Val Glu Arg Val705 710 715 720Val Ala Ala Cys Gly Ala Arg Ser Arg Arg Leu Ala Val Ser His Ala725 730 735Phe His Ser Pro Leu Val Glu Pro Met Leu Gly Glu Phe Arg Arg Val740 745 750Val Glu Ser Val Ala Phe Gly Val Pro Ser Leu Arg Val Val Ser Asn755 760 765Val Thr Gly Ala Trp Val Asp Pro Glu Glu Trp Gly Thr Pro Glu Tyr770 775 780Trp Val Arg Gln Val Arg Glu Pro Val Arg Phe Ala Asp Gly Val Ala785 790 795 800Thr Leu Leu Asp Ala Gly Val Arg Thr Phe Val Glu Leu Gly Pro Ala805 810 815Gly Thr Leu Thr Ser Met Val Ser His Cys Ala Asp Ala Thr Ala Thr820 825 830Ser Val Thr Ala Val Pro Thr Leu Arg Pro Asp His Asp Glu Ser Arg
835 840 845Thr Val Leu Ser Ala Ala Ala Ser Leu Tyr Val Gln Gly His Pro Val850 855 860Asp Trp Ala Pro Leu Phe Pro Arg Ala Arg Thr Val Asp Leu Pro Thr865 870 875 880Tyr Pro Phe Gln His Gln His Tyr Trp Met Glu Ser Ala Ala Arg Pro885 890 895Thr Val Glu Asp Thr Pro Arg Glu Pro Leu Asp Gly Trp Thr His Arg900 905 910Ile Asp Trp Val Pro Leu Val Asp Glu Glu Pro Ala Pro Val Leu Ala915 920 925Gly Thr Trp Leu Leu Val Arg Pro Glu Glu Gly Pro Arg Pro Leu Ala930 935 940Asp Ala Val Ala Asp Ala Leu Thr Arg His Gly Ala Ser Val Val Glu945 950 955 960Ala Ala Arg Val Pro His Gln Ser Asp Thr Glu Leu Thr Gly Val Val965 970 975Ser Leu Leu Gly Pro Gly Ala Asp Gly Asp Gly Gly Leu Asp Ala Thr980 985 990Leu Arg Leu Val Gln Asp Leu Ala Thr Ala Gly Ser Thr Ala Pro Leu99510001005Trp Ile Val Thr Ser Gly Ala Val Ala Val Gly Thr Ser Asp Thr Val101010151020Pro Asn Pro Glu Gln Ala Thr Leu Trp Gly Leu Ala Arg Ala Ala Ala1025 103010351040Thr Glu Trp Pro Gly Leu Gly Ala Ala Arg Ile Asp Leu Pro Ala Asp104510501055Leu Thr Glu Gln Val Gly Arg Arg Leu Cys Ala Arg Leu Leu Asp Arg106010651070Ser Glu Gln Glu Thr Ala Val Arg Gln Ala Gly Val Phe Ala Arg Arg107510801085Leu Val Arg Ala Arg Thr Ser Asp Gly Arg Trp Thr Pro Arg Gly Thr109010951100Val Leu Val Thr Gly Gly Thr Gly Ala Leu Ala Gly His Val Ala Arg1105 111011151120Trp Leu Ala Glu Glu Gly Ala Glu His Ile Val Leu Ala Gly Arg Arg112511301135Gly Pro Asp Gly Gln Gly Ala Glu Ala Leu Arg Ala Asp Leu Val Ala114011451150Ala Gly Val Lys Ala Thr Ile Val Arg Cys Asp Val Ala Asp Arg Asp115511601165Ala Val Arg Leu Leu Leu Asp Ala His Arg Pro Ser Ala Ile Val His
117011751180Thr Ala Gly Val Val Asp Asp Gly Leu Leu Thr Ser Leu Thr Pro Ala1185 119011951200Gln Val Glu Arg Val Leu Arg Pro Lys Leu Leu Gly Ala Arg Asn Leu120512101215His Glu Leu Thr Arg Asp Arg Glu Leu Asp Ala Phe Val Leu Phe Ser122012251230Ser Leu Ala Gly Val Leu Gly Gly Ala Gly Gln Ala Asn Tyr Ala Ala123512401245Ala Asn Ala Tyr Leu Asp Ala Leu Ala Ala His Arg Thr Ala His Gly125012551260Leu Pro Ala Ala Ser Leu Ala Trp Gly Pro Trp Glu Gly Asp Gly Met1265 127012751280Ala Ala Ala Gln Glu Ala Ala Asp Arg Leu Arg Arg Ser Gly Leu Thr128512901295Pro Leu Pro Pro Glu Gln Ala Val Arg Ala Leu Gly Arg Gly His Gly130013051310Pro Leu Val Val Ala Asp Ala Asp Trp Ala Arg Leu Ala Ala Gly Ser131513201325Thr Gln Arg Leu Leu Asp Glu Leu Pro Glu Val Arg Ala Val Arg Pro133013351340Ala Glu Pro Ala Val Gly Gln Arg Pro Asp Leu Pro Ala Arg Leu Ala1345 135013551360Gly Arg Pro Ala Glu Glu Gln Ser Ala Val Leu Leu Glu Ala Val Arg136513701375Glu Glu Ile Ala Ala Val Leu Arg Tyr Ala Asp Pro Ala Arg Ile Gly138013851390Ala Asp His Glu Phe Leu Ala Leu Gly Phe Asp Ser Leu Thr Ser Ile139514001405Glu Leu Arg Asn Arg Leu Ala Thr Arg Ile Gly Leu Thr Leu Pro Ala141014151420Thr Leu Thr Leu Glu Gln Arg Thr Pro Ala Gly Leu Ala Ala His Leu1425 143014351440Arg Glu Arg Ile Ala Asp Arg Pro Val Gly Ser Gly Ala Val Pro Val144514501455Pro Gly Ser Ala Asp Val Pro Glu Ala Gly Gly Gly Ser Gly Leu Gly146014651470Glu Leu Trp Gln Glu Ala Asp Arg His Gly Arg Arg Leu Glu Phe Ile147514801485Asp Val Leu Thr Ala Ala Ala Ala Phe Arg Pro Ala Tyr Arg Glu Pro149014951500Ala Glu Leu Glu Leu Pro Pro Leu Arg Leu Thr Ser Gly Gly Asp Glu
1505 151015151520Pro Pro Leu Phe Cys Ile Pro Ser His Leu Gly Lys Ala Asp Pro His152515301535Lys Phe Leu Arg Phe Ala Ala Ala Leu Arg Gly Arg Arg Asp Val Phe154015451550Val Leu Arg Gln Pro Gly Phe Val Pro Gly Gln Pro Leu Pro Ala Gly155515601565Leu Asp Val Leu Leu Asp Thr His Ala Arg Ala Met Ala Gly His Asp157015751580Arg Pro Val Leu Leu Gly Tyr Ser Ala Gly Gly Leu Ala Ala Gln Ala1585 159015951600Leu Ala Ala Arg Leu Ala Glu Leu Gly Arg Pro Pro Ala Ala Val Val160516101615Leu Val Asp Thr Tyr Ala Pro Asp Glu Thr Glu Val Met Ala Arg Ile162016251630Gln Gly Ala Met Glu Gln Gly Gln Arg Asp Arg Asp Gly Arg Thr Gly163516401645Ala Ala Phe Gly Glu Ala Trp Leu Thr Ala Met Gly His Tyr Phe Gly165016551660Phe Asp Trp Thr Pro Cys Pro Val Asp Val Pro Val Leu His Val Arg1665 167016751680Ala Gly Asp Pro Met Thr Gly Met Pro Val Glu Gly Arg Trp Gln Ala168516901695Arg Trp Asn Leu Pro His Thr Ala Val Asp Val Pro Gly Asp His Phe170017051710Thr Met Met Glu Asp His Ala Pro Arg Thr Ala Asp Thr Val His Asp171517201725Trp Leu Gly Thr Ala Val Arg Arg Pro Glu Arg Thr Arg Asp173017351740<210>8<211>264<212>PRT<213>小链霉菌Tü4055<400>8Met Thr Gly Thr Asn Thr His Ser Asp Val Trp Ile Arg Gln Tyr Arg1 5 10 15Pro Ala His Pro Thr Ala Pro Gln Leu Ile Cys Leu Pro His Ala Gly20 25 30Gly Ser Ala Thr Phe Tyr His Pro Val Ala Ala Ala Leu Ala Pro Arg35 40 45Cys Asp Val Leu Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg Ala50 55 60Glu Lys Pro Leu Glu Asp Ile Asp Glu Leu Ala Asn Gln Leu Phe Pro
65 70 75 80Val Leu Arg Ala Arg Val His Gln Pro Val Ala Leu Phe Gly His Ser85 90 95Met Gly Ala Thr Leu Ala Phe Glu Leu Ala Arg Arg Phe Glu Ser Ala100 105 110Gly Ile Ser Leu Glu Ala Leu Leu Val Ser Ala Arg Pro Ala Pro Ser115 120 125Arg Gln Arg Thr Gly Gly Thr Val His Leu Leu Ser Asp Glu Glu Leu130 135 140Val Ala Glu Leu Arg Thr Leu Asp Gly Thr Ala Glu Gln Val Phe His145 150 155 160Asp Glu Glu Leu Val Arg Met Ala Leu Pro Ala Ile Arg Gly Asp Tyr165 170 175Arg Ala Ala Glu Thr Tyr Arg Tyr Arg Pro Gly Pro Lys Leu Arg Cys180 185 190Pro Ile His Ala Leu Thr Gly Asp Asp Asp Pro Met Val Thr Pro Val195 200 205Glu Ala Arg Ala Trp Ser Glu His Thr Asp Gly Pro Phe Thr Leu Asp210 215 220Thr Phe Ala Gly Gly His Phe Tyr Leu Leu Glu His Arg Asp Ala Ile225 230 235 240Leu Gly Ile Ile Ala Glu His Leu Arg Thr Cys Ser Arg Ala Pro Gly245 250 255Asp Arg Ser Gly Leu Thr Arg Glu260<210>9<211>265<212>PRT<213>小链霉菌Tü4055<400>9Met Ser Leu Glu Leu Thr Asp Arg Val Met Met Val Thr Gly Ala Gly1 5 10 15Ser Gly Ile Gly Arg Ala Ala Ala Arg Leu Leu Val Gly His Gly Ala20 25 30Arg Val Val Leu Val Gly Arg Thr Glu Ser Ala Leu Thr Glu Thr Thr35 40 45Ala Gly Leu Pro Ser Ser His His Leu Val Val Pro Cys Asp Val Gly50 55 60Asp Asp Lys Gln Val Ala Asp Cys Val Ala Arg Ala Val Ser Arg Phe65 70 75 80Gly Arg Leu Asp Gly Ala Phe Asn Asn Ala Gly Thr Phe Gly Ser Phe85 90 95Gly Pro Leu His Gln Asp Thr Ala Asp Asn Phe Asp Arg Val Ile Ala
100 105 110Thr Asn Leu Arg Gly Val Trp Ser Cys Met Arg Gly Gln Ile Glu Ala115 120 125Met Leu Thr Ala Gly Gly Gly Ala Ile Val Asn Cys Ala Ser Val Ala130 135 140Gly His Ile Gly His Ala Gln Ser Pro Leu Tyr Ser Ala Thr Lys His145 150 155 160Ala Val Ile Gly Leu Ser Lys Ser Val Ala Leu Gln Tyr Ala Gly Asp165 170 175Gly Ile Arg Val Asn Val Val Ser Pro Gly Ser Thr Asp Thr Pro Met180 185 190Leu Arg Ser Leu Tyr Ala Asp Pro Ser Ala Leu Ala Gln Arg Ala Arg195 200 205Arg Ala Pro Leu Gly Arg Leu Gly Lys Cys Glu Glu Val Ala Asn Ala210 215 220Val Val Trp Leu Leu Ser Pro Leu Ala Ala Tyr Val Thr Gly Gln Thr225 230 235 240Leu Gly Val Asp Gly Gly Val Thr Ala Gly Ser Ala Ile Pro Arg Thr245 250 255Asn Ala Thr Pro Glu Gly Gln His Arg260 265<210>10<211>250<212>PRT<213>小链霉菌Tü4055<400>10Met Thr Ala Arg His Asp Val Ala Leu Val Thr Gly Ala Gly Ser Gly1 5 10 15Ile Cys Ala Glu Val Ala Arg Gly Leu Ala Ala Arg Gly Leu Arg Val20 25 30Val Leu Leu Asp Lys Asp Ala Glu Ala Val His Arg Val Ala Asp Gly35 40 45Leu Gly Asp Arg Leu Ala Arg Asp Pro Leu Val Ala Asp Val Thr Asp50 55 60Pro His Ala Leu Ala Ser Ala Val Asp Ser Leu Ala Pro Gln His Arg65 70 75 80Pro Gly Val Leu Val Asn Gly Val Gly Gly Asp Thr Arg Ala Arg Ser85 90 95Val Thr Glu Leu Thr Glu Ala Asp Leu Gln Glu Ala Val Thr His Asn100 105 110Leu Ala Ser Val Phe Thr Met Thr Arg Leu Cys Val Pro Ala Met Val115 120 125Ala Ala Gly Trp Gly Arg Val Val Asn Leu Ala Ser Val Ala Gly Arg
130 135 140Thr Tyr Thr Arg Phe Ser Asn Ala Ala Tyr Val Ala Ala Lys Ala Gly145 150 155 160Val Ile Gly Phe Thr Lys Gln Cys Ala Tyr Glu Leu Ala Pro His Gly165 170 175Val Thr Val Asn Ala Val Ala His Gly Val Ile Gly Thr Glu Arg Ile180 185 190Arg Arg Ala Trp Glu Asp Lys Pro Pro Gln Trp Thr Ala Asp Arg Val195 200 205Ser His Ile Pro Ala Gly Arg Phe Gly Ser Val Ala Glu Ala Ala Gly210 215 220Met Val Cys His Leu Cys Gly Glu Asp Ala Gly Tyr Thr Thr Gly Thr225 230 235 240Val Val Asp Val Asn Gly Gly Leu His Ile245 250<210>11<211>390<212>PRT<213>小链霉菌Tü4055<400>11Met Ile Arg Arg Val Arg Leu His Thr Ala Val Val Pro Met Ala Ala1 5 10 15Ala Phe Asp His Ala Thr Arg Ser Arg Arg Ser Ala Ala Ser Leu Leu20 25 30Val Glu Ile Glu Leu Ala Gly Thr Arg Gly Trp Gly Glu Gly Ala Pro35 40 45Arg Asp Tyr Val Thr Gly Glu Thr Leu Asp Gly Ala Val Arg Ala Val50 55 60Gln Ala Cys Asp Pro Gly Glu Leu Ala Glu Arg Ile Glu Trp Arg Asp65 70 75 80Phe Glu Ser Ala Val Ala Ser Ile Ala Gln Leu Pro Leu Thr Gly Leu85 90 95Val Asp Gly Ser Ser Ala Ala Ala Ala Val Glu Ile Ala Leu Leu Asp100 105 110Ala Val Cys Arg His Phe Ala Arg Pro Leu Ala Asp Val Leu Arg Val115 120 125Leu Ala Pro Pro Ala Arg Ser Arg Arg Asp Gly Pro Thr Ser Val Ser130 135 140Leu Val Ile His Leu Ser Arg Asp Val Ala Thr Val Leu Asp Ala Leu145 150 155 160Thr Pro Arg Ala Leu Ala Ala Leu Arg His Val Lys Ile Lys Val Ala165 170 175Asp Pro Ala Gly Ala Val Asp Arg Leu Thr Ala Ala Gln Asp Arg Leu
180 185 192Pro Ala Asp Thr Arg Val Ser Leu Asp Val Asn Gly Ala Trp Thr Ala195 200 205Glu Glu Ala Glu Lys Val Ala Gly Glu Leu Asp Gly Val Gly Trp Val210 215 220Glu Glu Pro Leu Pro Pro Arg Ser Trp Pro Glu Leu Gly Arg Leu Arg225 230 235 240Arg Ala Thr Gly Leu Pro Val Met Leu Asp Glu Ser Cys Thr Gly Pro245 250 255Ala Asp Leu His Ala Ala Ala Thr Ser Gly Ala Ala Ser His Ile Asn260 265 270Val Arg Leu Ser Lys Cys Gly Gly Phe Leu Ala Ala Ala Arg Leu Ala275 280 285Leu Arg Ala Asp Glu Leu Gly Val Gly Cys Gln Leu Gly Val His Val290 295 300Ala Glu Val Gly Pro Leu Trp Ala Ala Gly Arg Thr Leu Ala Thr Ala305 310 315 320Trp Asp Leu Trp Gln Thr Val Glu Ala Gly Arg Ala Asp Glu Trp Phe325 330 335Pro Val Pro Leu Thr Thr Pro Ala Phe Thr Val Asp Arg Ser Leu His340 345 350Arg Val Glu Pro Leu Thr Gly Pro Gly Thr Gly Ile Glu Pro Thr Glu355 360 365Glu Leu Leu Arg His Thr Arg Cys Ala Ala Thr Trp Glu Ser Gly Gly370 375 380Gly Trp Arg Arg Asn Thr385 390<210>12<211>272<212>PRT<213>小链霉菌Tü4055<400>12Met Pro Thr Thr Ser Met Leu Thr Ala Ala Asp Gly Thr Gly Leu Thr1 5 10 15Leu His His Trp Thr Thr Pro Gly Ala Thr Ser Ala Val Phe Tyr Leu20 25 30His Gly Ile Gln Ser His Ala Gly Trp Leu Phe Glu Thr Gly Pro Glu35 40 45Leu Asn Ala Arg Gly Ile Asp Val Tyr Ala Leu Asp Arg Arg Gly Ser50 55 60Gly Arg Ser Glu Gly Pro Arg Gly His Leu Pro Ser Ala Asp Leu Val65 70 75 80Leu Asp Asp Tyr Ala Arg Ala Leu Asp Ala Val Thr Ala Glu Val Gly
85 90 95Gly Ala Gly Pro Val Ala Leu Gly Gln Ser Leu Gly Gly Ser Val Leu100 105 110Ala Ala Leu Trp Cys Thr Arg Asp Leu Pro Val Arg Arg Leu Val Leu115 120 125Cys Ala Pro Ala Leu Gly Gln Gln Arg Ala Arg His Thr Ala Asp Thr130 135 140Leu Ala Glu Arg Arg Ala Leu Thr Gly Ser Gly Leu Arg Pro Val Gly145 150 155 160Leu Ala Asp Gly Asp Tyr Thr Asp Leu Pro Arg Tyr Arg Glu Phe Leu165 170 175Thr Gly Asp His Leu Met Leu Arg Glu Val Thr Ser Ala Thr Gln Ala180 185 190Thr Leu Val His Leu Glu Asp His Tyr Ala Arg Gly Ala Pro Arg Thr195 200 205Arg Leu Pro Val Asp Leu Ala Leu Pro Thr His Asp Pro Ile Ile Asp210 215 220Leu Ser Ala Ala Arg Ala Met Leu Arg Arg Leu Thr Ser Ala Val His225 230 235 240Glu Glu Val Phe Ala Thr Asp Arg His Tyr Val Glu Phe Thr Ser Ala245 250 255Arg Thr Ala Tyr Trp Asp Trp Leu Ala Thr Arg Leu Lys Glu Glu Ala260 265 270<210>13<2ll>539<212>PRT<213>小链霉菌Tü4055<400>13Met Lys Val Phe His Ala Leu Ala Asp Ala Leu Thr Ala His Gly Val1 5 10 15Asp Thr Val Phe Gly Leu Met Gly Asn Ala Asn Leu Leu Tyr Leu Pro20 25 30Ala Phe Ala Asp Ala Gly Gly Arg Phe Val Ala Val Ala His Glu Ala35 40 45Gly Ala Val Ala Met Ala Asp Gly Arg Ala Arg Met Cys Gly Gly Ile50 55 60Gly Val Ala Ser Val Thr His Gly Pro Ala Phe Thr Asn Ala Leu Thr65 70 75 80Pro Leu Val Glu Ala Ala Arg Ser His Ser Gln Val Leu Leu Ile Thr85 90 95Gly Asp Pro Pro Pro Val Pro Thr His Phe His His Phe Asp Ile Ala100 105 110Thr Val Ala Ala Ala Ala Gly Ala Gly Tyr Glu Arg Val His Arg Pro
115 120 125Ala Ser Leu Val Ala Asp Leu Asn Arg Ala Val Gln Arg Ile Val Ala130 135 140Glu Arg Arg Pro Val Val Leu Asn Val Pro Ile Asp Leu Met Gln Ala145 150 155 160Glu Ala Gly Glu Gln Ala Pro Val Thr Leu Pro Val Ala Pro Gly Pro165 170 175Leu Ala Ala Pro Glu Ala Glu Ala Leu Asp Gly Ala Leu Gly Leu Ile180 185 190Gly Ser Ala Lys Arg Pro Leu Val Leu Ala Gly His Gly Ala Ala Val195 200 205Ala Gly Ala Arg Glu Ala Leu Val Glu Leu Ala Asp Arg Thr Gly Ala210 215 220Ala Leu Ala Thr Thr Val Leu Gly Lys Glu Met Phe Ala Gly His Pro225 230 235 240Arg Asp Val Gly Ile Phe Gly Ser Leu Ala His Ser Val Ala Ser Thr245 250 255Val Ile Ala Glu Ser Asp Cys Val Ile Ala Phe Gly Ala Ser Leu Asn260 265 270Met Trp Thr Val Leu Asn Gly Glu Leu Leu Arg Gly Lys Arg Val Val275 280 285His Val Asp Thr Asp Pro Ala Arg Phe Gly Ser Tyr Ser Pro Val Asp290 295 300Glu Pro Val Ala Gly Asp Ala Arg Arg Thr Ala Glu Thr Met Asn Val305 310 315 320Leu Leu Asp Gln Ala Gly Val Thr Ala Ala Asn Gly Ala Trp Ala Glu325 330 335Arg Val Ala Gly Gln Leu Ala Gly Phe Ser Pro Gln Asp Asp Val Asp340 345 350Asp Arg Ser Gly Ala Glu Thr Val Asp Ile Arg Thr Ala Met Ile Arg355 360 365Leu Asp Arg Ile Leu Pro Ala Glu Arg Ser Val Val Ser Asp Ile Gly370 375 380Arg Phe Asp Val Gly Val Trp Pro Tyr Leu Arg Val Ala Asp Pro Leu385 390 395 400His Phe Thr Val Met Gly Gly Phe Gly Ser Ile Gly Leu Gly Val Ala405 410 415Gly Ala Ile Gly Ala Ala Thr Ala Gly Thr Gly Arg Pro Val Val Ala420 425 430Ala Val Gly Asp Gly Gly Phe Met Met His Leu Ser Glu Phe Thr Thr435 440 445Ala Val Arg Tyr Arg Leu Pro Leu Val Val Val Val Leu Asn Asp Gly
450 455 460Ala Tyr Gly Ala Glu His Tyr Lys Leu Arg Asn His Gly Tyr Asp Pro465 470 475 480Ala Tyr Ser Ala Phe Ala Trp Pro Asp Leu Ala Gly Leu Ala Thr Ala485 490 495Met Gly Ala Arg Ala Leu Thr Val Arg Lys Ala Glu Glu Leu Asp Ala500 505 510Val Gly Asp Leu Leu Ser Thr Leu Glu Gly Pro Leu Leu Val Asp Val515 520 525Arg Leu Asp Pro Asp Val Asn Leu Val Arg Tyr530 535<210>14<211>683<212>PRT<213>小链霉菌Tü4055<400>14Met Arg Gly Ala Arg Glu Asn Ser Met Thr Arg Ala Gly Pro Leu Glu1 5 10 15Gly Ile Ala Val Leu Met Ala Gly Arg Ser Thr Pro Ala Ala Leu Leu20 25 30Gly Arg Leu Leu Ala Asp Leu Gly Ala Arg Val Val Thr Leu Cys Arg35 40 45Ser Pro Asp His Gly Gly Pro Phe Glu Arg Trp Leu His Ser Ala Ala50 55 60Gln Ser Ala Ser Gly Trp Asp Gln Ala Ser Arg Leu Leu Gln Thr Ala65 70 75 80Asp Val Leu Val Cys Asp Ala Glu Gly Asp Glu Arg Leu Ala Ala Leu85 90 95Gly Leu Gly Ala Pro Glu Leu Pro His Arg Ser Pro Glu Leu Val Ala100 105 110Val Arg Leu Ser Ala Phe Gly Leu Thr Gly Pro Leu Arg Asp Ala Pro115 120 125Ala Thr Glu Arg Thr Leu Gln Ala Leu Ala Gly Leu Thr Ser Ala Thr130 135 140Gly Thr Glu Gly Glu Pro Ser Val Leu Ser Val Val Gly Leu Ala Ser145 150 155 160Arg Thr Ala Ala Leu Ser Gly Leu Ile Ala Val Val Ala Gly Leu Ile165 170 175Gly Arg Glu Arg Gly Gly Gly Gly Asp Tyr Leu Asp Ile Ala Glu Phe180 185 190Asp Ser Leu Phe Thr Leu Thr Gly Thr Leu Leu Pro Ser Val Ala Leu195 200 205Ala Gly Arg Pro Pro Arg Arg Thr Gly Asn Arg His Gly Met Ala Ala
210 215 220Pro Trp Asn Ser Tyr Thr Cys Gln Asp Ala Pro Val Val Ile Cys Thr225 230 235 240Met Gly Glu Pro Ile Trp His Arg Leu Thr Ala Val Leu Gly Arg Arg245 250 255Asp Leu Pro Asp Asp Pro Arg Phe Ala Asp Thr Ala Ala Arg Val Arg260 265 270Asn Ala Asp Glu Leu Asp Glu Ile Leu Gly Lys Trp Thr Ala Gly Gln275 280 285Arg Ala Val Asp Val Val Thr Ala Leu Arg Ala Ala Gly Ile Pro Cys290 295 300Ala Gln Val Ala Ala Pro Glu Glu Val Arg Asp Gly Ala Ala Ala Arg305 310 315 320Arg Arg Gly Leu Val Thr Asp Pro Ser Gly Thr Pro Gly Ser Pro Leu325 330 335Arg Ser Leu Ile Pro Ala Val Thr Asp Gly Pro Met Pro Arg Gln Gly340 345 350Gly Leu Trp Glu Pro Ile Ala Arg Gly Thr Pro Pro Leu Arg Gly Val355 360 365Arg Leu Leu Glu Val Gly Ser Tyr Thr Ala Gly Pro His Ala Gly Arg370 375 380Leu Leu Ala Gln Leu Gly Ala Asp Val Leu Lys Val Glu Pro Pro His385 390 395 400Gly Glu Gly Ser Arg Arg Leu Ala Gln Gln Val Ala Gly Val Gly Tyr405 410 415Leu Tyr Tyr Val Asn Asn Ala Gly Lys Arg Ser Cys Arg Leu Asp Leu420 425 430Ala Asp Ala Glu Asp Arg Ala Gly Phe Glu Arg Leu Leu Ala Gly Cys435 440 445Asp Ile Val Leu Thr Asn Leu Ala Ala Asp Thr Leu Thr Ala Gln Gly450 455 460Leu Ala Pro Asp Gln Ile Leu Ser Arg His Gly Val Val His Cys Thr465 470 475 480Val Thr Gly His Gly Leu Ala Ala Ala Asp Arg Ser Val Asp Thr Val485 490 495Ile Gln Ala Glu Ser Gly Ile Met Arg Leu Val Gly Gly Pro Gly Ala500 505 510Gly Leu Arg Thr Pro Val Ser Ser Ala Asp Val Leu Gly Ala Tyr Leu515 520 525Ala Ala Ala Ala Ala Val Val Ser Thr Tyr Val Arg Leu Arg Thr Glu530 535 540His Gly Cys Ala Ala Asp Val Ala Leu Phe Asp Ser Ala Val Trp Leu
545 550 555 560Thr Gln Asp Arg Trp Phe Thr Ala Pro Pro Ala Arg Ala Pro His Leu565 570 575Val Arg Ala Ala Asp Gly Thr Val Leu Val Asp Ala Glu Gly Pro Pro580 585 590Pro Arg Ala Glu Gly Pro Val Ala Ala Val Leu Asp Ala Ala Ala Ala595 600 605Val Gly Val Pro Ala Ala Pro Leu His Asp Leu Thr Arg Ala Val Arg610 615 620His Pro Gln Val Leu Ala Arg Arg Met Ala Val Ala Arg Asp Cys Ala625 630 635 640Gly Thr Thr Val Leu Ile Thr Gly Asn His Leu Arg Ser Leu Leu Arg645 650 655Glu Asp Pro Pro Pro Thr Cys Ala Pro Val Asp Gln Asn Asp Pro Val660 665 670Trp Leu Gln Pro Ala Pro Thr Glu Gly Gln Gln675 680<210>15<211>426<212>PRT<213>小链霉菌Tü4055<400>15Met Thr Thr Arg Arg Arg Gln Arg His Pro Ala Leu Ser Pro Ser Cys1 5 10 15Pro Ser Val Pro Phe Pro Leu Leu Glu Thr Glu Phe Val Leu Met Pro20 25 30Ser Phe Pro Val Arg Arg Ser Val Pro Asp Thr Pro Pro Ala Glu His35 40 45Leu Glu Leu Leu Lys Glu Ser Gly Gly Val Cys Pro Phe Thr Met Glu50 55 60Asp Gly Arg Pro Ala Trp Leu Ala Ala Ser His Asp Ala Val Arg Ser65 70 75 80Leu Leu Ala Asp Arg Arg Ile Ser Asn Asn Pro Ala Lys Thr Pro Pro85 90 95Phe Ser Gln Arg Glu Ala Leu Gln Lys Glu Arg Gly Gln Phe Ser Arg100 105 110His Leu Phe Asn Met Asp Ser Pro Glu His Asp Val Ala Arg Arg Met115 120 125Ile Ala Glu Asp Phe Thr Pro Arg His Ala Glu Ala Val Arg Pro Tyr130 135 140Phe Glu Glu Val Phe Gly Glu Ile Val Asp Glu Val Val His Lys Gly145 150 155 160Pro Pro Ala Glu Met Ile Glu Ser Phe Ala Phe Pro Val Ala Thr Arg
165 170 175Thr Ile Cys Lys Val Leu Asp Ile Pro Glu Asp Asp Cys Glu Tyr Phe180 185 190Gln Lys Arg Thr Glu Gln Ile Ile Glu Met Asp Arg Gly Glu Glu Asn195 200 205Leu Glu Ala Val Val Glu Leu Arg Arg Tyr Val Asp Ser Val Met Gln210 215 220Gln Arg Thr Ar G Lys Pro Gly Asp Asp Leu Leu Ser Arg Met Ile Val225 230 235 240Lys Ala Lys Ala Ser Lys Glu Ile Glu Leu Ser Asp Ala Asp Leu Val245 250 255Asp Asn Ala Met Phe Leu Leu Val Ala Gly His Glu Pro Ser Ala Asn260 265 270Met Leu Gly Leu Gly Val Leu Ala Leu Ala Glu Phe Pro Asp Val Ala275 280 285Glu Glu Leu Arg Ala Glu Pro His Leu Trp Pro Gly Ala Ile Asp Glu290 295 300Met Leu Arg Tyr Tyr Thr Ile Ala Arg Ala Thr Lys Arg Val Ala Ala305 310 315 320Ala Asp Ile Glu Tyr Glu Gly His Thr Ile Lys Glu Gly Asp Ala Val325 330 335Ile Val Leu Leu Asp Thr Ser Asn Arg Asp Pro Lys Val His Ala Glu340 345 350Pro Asn Arg Leu Asp Ile His Arg Ser Ala Gly Asn His Leu Ala Phe355 360 365Ser His Gly Pro His Gln Cys Leu Gly Lys His Leu Val Arg Val Gln370 375 380Leu Glu Ile Ala Leu Arg Ala Val Ala Glu Arg Leu Pro Gly Leu Arg385 390 395 400Leu Asp Ile Ala Lys Glu Asp Ile Pro Phe Arg Gly Asp Ala Leu Ser405 410 415Tyr Gly Pro Arg Gln Leu Arg Val Thr Trp420 425<210>16<211>454<212>PRT<213>小链霉菌Tü4055<400>16Met Glu Lys Thr Asp Val Asp Arg Leu Arg Thr Leu Asp Arg Glu His1 5 10 15Met Trp Tyr Pro Trp Thr Pro Met Thr Glu Trp Met Ala Arg Asp Gln20 25 30Leu Val Val Glu Arg Ala Glu Gly Cys Trp Leu Ile Asp Ala Asp Gly
35 40 45Lys Arg Tyr Leu Asp Gly Arg Ser Ser Met Gly Met Asn Leu His Gly50 55 60His Gly Arg Ser Glu Ile Val Glu Ala Leu Val Ala Gln Ala Arg Lys65 70 75 80Ala Gly Glu Thr Thr Leu Tyr Arg Val Ser His Pro Ala Ala Val Glu85 90 95Leu Ala Ala Arg Leu Ala Ser Met Ala Pro Ala Gly Leu Gln Arg Val100 105 110Phe Phe Ala Glu Ser Gly Ser Thr Ala Val Glu Thr Ala Leu Lys Ala115 120 125Ala Tyr Ala Tyr Trp Val Ala Lys Gly Glu Pro Gln Arg Ser Thr Phe130 135 140Val Ser Met Glu Gly Gly Tyr His Gly Glu Thr Leu Gly Thr Val Ser145 150 155 160Leu Arg Gly Thr Asn Gly Glu Gln Val Asp Met Ile Arg Lys Thr Tyr165 170 175Glu Pro Leu Leu Phe Pro Ser Leu Ser Phe His Gln Pro His Cys Tyr180 185 190Arg Cys Pro Val Gly Gln Ser Ser Asp Ser Asp Cys Gly Leu Glu Cys195 200 205Thr Asp Ser Leu Glu Asn Leu Leu Thr Arg Glu Lys Gly Arg Ile Ala210 215 220Ala Val Ile Val Glu Pro Arg Val Gln Ala Leu Ala Gly Val Ile Thr225 230 235 240Ala Pro Glu Gly His Leu Ala Lys Val Ala Glu Ile Thr Arg Arg His245 250 255Gly Val Leu Leu Ile Val Asp Glu Val Leu Thr Gly Trp Ala Arg Thr260 265 270Gly Pro Thr Phe Ser Cys Glu Ala Glu Gly Val Thr Pro Asp Leu Met275 280 285Thr Val Gly Lys Ala Leu Thr Gly Gly Tyr Leu Pro Leu Ser Ala Thr290 295 300Leu Ala Thr Glu Glu Ile Phe Gly Ala Phe Arg Glu Ser Val Phe Leu305 310 315 320Ser Gly Ser Thr Tyr Ser Gly Tyr Ala Leu Gly Ala Ala Val Ala Leu325 330 335Ala Ser Leu Asp Leu Phe Glu Lys Glu Asp Val Pro Ala Arg Ala Lys340 345 350Ala Leu Ala Asp Val Leu Thr Thr Ala Leu Glu Pro Phe Arg Ala Leu355 360 365Thr His Val Gly Asp Val Arg Gln Leu Gly Leu Ile Ala Gly Val Glu
370 375 380Leu Val Ala Asp Arg Glu Thr Arg Ala Pro Tyr Pro Pro Gln Glu Arg385 390 395 400Val Val Asp Arg Ile Cys Thr Leu Ala Arg Asp Asn Gly Val Leu Val405 410 415Asn Ala Val Pro Gly Asp Val Ile Thr Met Leu Pro Ser Pro Ser Met420 425 430Ser Pro Asp Asp Leu Arg Phe Leu Thr Gly Thr Leu Tyr Thr Ala Val435 440 445Arg Glu Val Thr Glu Glu450<210>17<211>326<212>PRT<213>小链霉菌Tü4055<400>17Met Arg Ala Ala Val Ile Arg Ala Trp Gly Gly Pro Glu Arg Leu Thr1 5 10 15Leu Asp Arg Val Glu Arg Pro Ser Pro Pro Pro Gly Trp Ile Ala Val20 25 30Arg Val Glu Ala Cys Ala Leu Asn His Leu Asp Ile His Val Arg Asn35 40 45Gly Leu Pro Gly Val Arg Leu Glu Leu Pro His Val Ser Gly Gly Asp50 55 60Val Val Gly Val Val Glu Gln Ala Thr Asp Glu Ala Gly Glu Arg Leu65 70 75 80Leu Gly Ser Arg Val Leu Leu Asp Pro Met Ile Gly Arg Gly Ile Leu85 90 95Gly Glu His Tyr Trp Gly Gly Leu Ala Glu Tyr Val Val Ala Pro Ala100 105 110His Asn Ala Leu Pro Val Pro Asp Gln Asp Ala Asp Pro Ala Arg Tyr115 120 125Ala Ala Leu Pro Ile Ser Tyr Gly Thr Ala Gln Arg Met Leu Phe Ser130 135 140Arg Ala Arg Leu Arg Pro Gly Glu Ser Val Leu Leu Phe Gly Ala Thr145 150 155 160Gly Gly Val Gly Val Ala Cys Ala Gln Leu Ala Leu Arg Ala Gly Ala165 170 175Arg Ile Ile Ala Cys Ser Gly Ser Pro Ala Lys Leu Ala Arg Leu Arg180 185 190Arg Leu Gly Val Ile Asp Thr Ile Asp Thr Gly Thr Glu Asp Val Arg195 200 205Arg Arg Val Arg Glu Leu Thr Asp Gly Gly Ala Asp Leu Val Val Asp
210 215 220Tyr Gln Gly Lys Asp Thr Trp Pro Val Ser Leu Arg Ser Ala Arg Ala225 230 235 240Gly Gly Arg Ile Val Thr Cys Gly Ala Thr Thr Gly Tyr Glu Ala Thr245 250 255Thr Asp Leu Arg Tyr Val Trp Ser Arg Gln Leu Asp Ile Leu Gly Ser260 265 270Asn Ala Trp His Arg Asp Asp Leu His Thr Leu Val Asp Leu Val Ala275 280 285Thr Asp Ala Leu Glu Pro Val Val His Ala Asp Phe Pro Leu Ser Arg290 295 300Ala Pro Glu Ala Val Ala Glu Leu Glu Glu Arg Arg Ala Phe Gly Lys305 310 315 320Val Val Ile Arg Thr Ala325<210>18<211>556<212>PRT<213>小链霉菌Tü4055<400>18Met Thr Gly Asn Thr Thr Ser Ala Ala Phe Leu Arg Arg Thr Gln Asn1 5 10 15Ala Leu Ala Met Gln Arg Lys Ile Cys Ala Gln Pro Glu Glu Thr Ala20 25 30Glu Arg Val Phe Ser Asp Ile Leu Ser Val Ser Arg Asp Thr Gly Phe35 40 45Gly Arg Glu His Gly Leu Ala Gly Val Arg Thr Arg Gln Glu Trp Arg50 55 60Arg Ala Val Pro Ile Arg Thr Tyr Asp Glu Leu Ala Pro Tyr Val Glu65 70 75 80Arg Gln Phe Ser Gly Glu Arg Arg Val Leu Thr Thr Asp Asp Pro Arg85 90 95Ala Phe Leu Arg Thr Ser Gly Ser Thr Gly Arg Ala Lys Leu Val Pro100 105 110Thr Thr Asp His Trp Arg Arg Val Tyr Arg Gly Pro Ala Leu Tyr Ala115 120 125Gln Trp Gly Leu Tyr Phe Glu Gln Ile Gly Thr His Arg Leu Thr Gly130 135 140Asp Glu Val Leu Asp Leu Ser Trp Glu Pro Gly Pro Ile Arg His Arg145 150 155 160Leu Arg Gly Phe Pro Val Tyr Ser Ile Thr Glu Arg Pro Val Ser Asp165 170 175Asp Pro Asp Asp Trp Asn Pro Pro Trp Arg His Ala Arg Trp Phe Thr
180 185 190Arg Asp Ala Gly Ala Ala Thr Met Ala Asp Leu Leu Tyr Gly Lys Leu195 200 205Leu Arg Leu Ala Ala His Asp Leu Arg Leu Ile Val Ser Val Asn Pro210 215 220Ser Lys Ile Val Leu Leu Ala Glu Thr Leu Lys Glu Asn Ala Glu Arg225 230 235 240Leu Ile Gln Asp Leu His Asp Gly His Gly Thr Asp Arg Ala Ala Arg245 250 255Pro Asp Phe Leu Arg Arg Leu Thr Ala Ala Phe Asp Arg Thr Gly Gly260 265 270Arg Pro Leu Leu Thr Asp Leu Trp Pro Gly Leu Arg Leu Leu Val Cys275 280 285Trp Asn Ser Ala Ser Ala Ala Leu Tyr Gly Pro Trp Leu Ser Arg Leu290 295 300Ala Thr Gly Val Ala Ala Leu Pro Phe Ser Thr Thr Gly Thr Glu Gly305 310 315 320Ile Val Thr Leu Pro Val Asp Asp His Leu Ser Ala Gly Pro Leu Ala325 330 335Val Asp Gln Gly His Phe Glu Phe Val Pro Trp Gln Asp Leu Asp Asp340 345 350Gly Ser Pro Leu Pro Glu Asp Thr Pro Thr Leu Gly Tyr Asp Glu Leu355 360 365Glu Leu Gly Ala Asp Tyr Arg Leu Val Met Ser Gln Ala Asn Gly Leu370 375 380Tyr Arg Tyr Asp Val Gly Asp Val Tyr Arg Val Val Gly Ala Val Gly385 390 395 400Ala Thr Pro Arg Leu Glu Phe Leu Gly Arg Ala Gly Phe Gln Ser Ser405 410 415Phe Thr Gly Glu Lys Leu Thr Glu Ser Asp Val His Thr Ala Val Met420 425 430Arg Val Leu Gly Ser Glu Arg Thr Asp His Pro His Phe Ser Gly Ile435 440 445Pro Val Trp Asp Thr Pro Pro His Tyr Leu Val Ala Ile Glu Trp Ala450 455 460Asp Ala His Gly Thr Leu Asn Val Gln Asp Thr Ala Arg Arg Ile Asp465 470 475 480Ala Thr Leu Gln Glu Val Asn Val Glu Tyr Ala Asp Lys Arg Arg Ser485 490 495Gly Arg Leu Arg Pro Leu Gln Ile Leu Pro Leu Val Pro Gly Ala Phe500 505 510Gly Gln Ile Ala Glu Arg Arg Phe Arg Gln Gly Thr Ala Gly Ala Gln
515 520 525Ile Lys His His Trp Leu Gln Lys Asp Ser Ala Phe Leu Asp Thr Leu530 535 540Arg Asp Leu Asp Leu Val Arg Ala Arg Pro Gly Thr545 550 555<210>19<211>305<212>PRT<213>小链霉菌Tü4055<400>19Met Arg Ile Gly Phe Ala Ala Pro Met Ser Gly Pro Trp Ala Thr Pro1 5 10 15Asp Thr Ala Val His Val Ala Arg Thr Ala Glu Gln Leu Gly Tyr Ala20 25 30Ser Leu Trp Thr Tyr Gln Arg Val Leu Gly Ala Pro Asp Asp Ser Trp35 40 45Gly Glu Ala Asn Arg Ser Val His Asp Pro Leu Thr Thr Leu Ala Phe50 55 60Leu Ala Ala His Thr Thr Gly Ile Arg Leu Gly Val Ala Val Leu Ile65 70 75 80Met Pro Leu His Thr Pro Ala Val Leu Ala Lys Gln Leu Thr Thr Leu85 90 95Asp Leu Leu Ser Gly Gly Arg Leu Asp Val Gly Leu Gly Asn Gly Trp100 105 110Ala Ala Glu Glu Tyr Ala Ala Ala Gly Val Thr Pro Thr Gly Leu Ser115 120 125Arg Arg Ala Glu Asp Phe Leu Ala Cys Leu Arg Ala Leu Trp Gly Glu130 135 140Gln Thr Val Val Glu His Asp Gly Pro Phe Tyr Arg Val Pro Pro Ala145 150 155 160Arg Phe Asp Pro Lys Pro Ala Gln Ser Pro His Pro Pro Leu Leu Leu165 170 175Gly Gly Ala Ala Pro Gly Ala Leu Arg Arg Ala Gly Arg Leu Cys Asp180 185 190Gly Trp Ile Ala Ser Ser Lys Ala Gly Pro Ala Ala Ile Arg Asp Ala195 200 205Ile Thr Val Val Arg Asp Ser Ala Glu Arg Thr Gly Arg Asp Pro Ala210 215 220Thr Leu Arg Phe Val Cys Arg Ala Pro Val Arg Leu Arg Thr Arg Ser225 230 235 240Ala Pro Asn Glu Pro Pro Leu Thr Gly Thr Ala Glu Thr Ile Arg Ala245 250 255Asp Leu Ala Ala Leu Ala Asp Thr Gly Leu Thr Glu Ile Phe Leu Asp
260 265 270Pro Asn Phe Asp Pro Glu Ile Gly Ser Pro Asp Ala Pro Thr Gly Asp275 280 285Val Arg His Arg Val Asp Leu Leu Leu His Glu Leu Ala Pro Ala Asn290 295 300Trp305<210>20<211>248<212>PRT<213>小链霉菌Tü4055<400>20Met Leu Ile Ala Arg Ala Ala Val Gly Glu Asp Arg Thr Tyr Ala Arg1 5 10 15Val Asp Thr Asp Thr Gly Leu Ile His Leu Leu Ala Gly Thr Pro Tyr20 25 30Asp Glu Ile Arg Pro Thr Gly Glu Thr Arg Pro Leu Ala Glu Ala Arg35 40 45Leu Leu Ala Pro Val Glu Pro Ser Lys Val Leu Val Ala Gly Arg Asn50 55 60Tyr Gly Asp Val Val Thr Pro Asp Leu Val Val Phe Met Lys Pro Ser65 70 75 80Thr Ser Val Val Gly Pro Arg Ser Thr Val Leu Leu Pro Ala Glu Ala85 90 95Lys Gln Val Arg Tyr Glu Gly Glu Leu Ala Val Val Ile Gly Arg Arg100 105 110Cys Lys Asp Val Pro Glu Asp Thr Ala Asp Gln Ala Val Phe Gly Tyr115 120 125Thr Cys Ala Asn Asp Val Thr Ala Trp Asp Val Gly Glu Pro Lys Gly130 135 140His Trp Thr Lys Ala Lys Ser Phe Asp Thr Phe Cys Pro Leu Gly Pro145 150 155 160Trp Ile Arg Thr Asp Leu Asp Pro Ala Asp Leu Val Leu Arg Thr Thr165 170 175Val Asn Gly Thr Leu Arg Gln Asp Gly Ser Thr Lys Glu Met Asn Arg180 185 190Asn Val Arg Ala Leu Val Ser Arg Cys Ser Ser Leu Met Thr Leu Leu195 200 205Pro Gly Asp Val Ile Leu Thr Gly Thr Pro Ala Gly Ala Gly Val Leu210 215 220Arg Pro Gly Asp Glu Val Val Val Glu Ile Asp Gly Ile Gly Ser Leu225 230 235 240Ala Asn Pro Ile Gly Val Ala Lys
245<210>21<21l>675<212>PRT<213>小链霉菌Tü4055<400>21Met Ser Val Ile Arg Pro Thr Ala Glu Thr Glu Arg Ala Val Val Val1 5 10 15Val Pro Ala Gly Thr Thr Cys Ala Asp Ala Val Thr Ala Ala Lys Leu20 25 30Pro Arg Asn Gly Pro Asn Ala Ile Val Val Val Arg Asp Pro Ser Gly35 40 45Ala Leu Arg Asp Leu Asp Trp Thr Pro Asp Ser Asp Val Glu Val Glu50 55 60Ala Val Ala Leu Ser Ser Glu Asp Gly Leu Thr Val Leu Arg His Ser65 70 75 80Thr Ala His Val Leu Ala Gln Ala Val Gln Gln Leu Trp Pro Glu Ala85 90 95Arg Leu Gly Ile Gly Pro Pro Ile Glu Asn Gly Phe Tyr Tyr Asp Phe100 105 110Asp Val Glu Arg Pro Phe Gln Pro Glu Asp Leu Glu Arg Val Glu Gln115 120 125Arg Met Lys Glu Ile Ile Lys Ser Gly Gln Arg Phe Cys Arg Arg Glu130 135 140Phe Pro Asp Arg Glu Ala Ala Arg Ala Glu Leu Ala Lys Glu Pro Tyr145 150 155 160Lys Leu Glu Leu Val Asp Leu Lys Gly Asp Val Asp Ala Ala Glu Ala165 170 175Met Glu Val Gly Gly Ser Asp Leu Thr Ile Tyr Asp Asn Leu Asp Ala180 185 190Arg Thr Gly Asp Val Cys Trp Ser Asp Leu Cys Arg Gly Pro His Leu195 200 205Pro Ser Thr Arg Leu Ile Pro Ala Phe Lys Leu Leu Arg Asn Ala Ala210 215 220Ala Tyr Trp Arg Gly Ser Glu Lys Asn Pro Gln Leu Gln Arg Ile Tyr225 230 235 240Gly Thr Ala Trp Pro Thr Arg Asp Glu Leu Lys Ser His Leu Ala Ala245 250 255Leu Glu Glu Ala Ala Lys Arg Asp His Arg Arg Ile Gly Glu Glu Leu260 265 270Asp Leu Phe Ala Phe Asn Lys Glu Ile Gly Arg Gly Leu Pro Leu Trp275 280 285Leu Pro Asn Gly Ala Ile Ile Arg Asp Glu Leu Glu Asp Trp Ala Arg
290 295 300Lys Thr Glu Arg Lys Leu Gly Tyr Lys Arg Val Val Thr Pro His Ile305 310 315 320Thr Gln Glu Asp Leu Tyr Tyr Leu Ser Gly His Leu Pro Tyr Tyr Ala325 330 335Glu Asp Leu Tyr Ala Pro Ile Asp Ile Asp Gly Glu Lys Tyr Tyr Leu340 345 350Lys Pro Met Asn Cys Pro His His His Met Val Tyr Lys Ala Arg Pro355 360 365His Ser Tyr Arg Asp Leu Pro Tyr Lys Val Ala Glu Tyr Gly Thr Val370 375 380Tyr Arg Phe Glu Arg Ser Gly Gln Leu His Gly Met Met Arg Thr Arg385 390 395 400Gly Phe Ser Gln Asn Asp Ala His Ile Tyr Cys Thr Ala Asp Gln Ala405 410 415Lys Asp Gln Phe Leu Glu Val Met Arg Met His Ala Asp Tyr Tyr Arg420 425 430Thr Leu Gly Ile Ser Asp Phe Tyr Met Val Leu Ala Leu Arg Asp Ser435 440 445Ala Asn Lys Asp Lys Tyr His Asp Asp Glu Gln Met Trp Glu Asp Ala450 455 460Glu Arg Ile Thr Arg Glu Ala Met Glu Glu Ser Asp Ile Pro Phe Gln465 470 475 480Ile Asp Leu Gly Gly Ala Ala His Tyr Gly Pro Lys Val Asp Phe Met485 490 495Ile Arg Ala Val Thr Gly Lys Glu Phe Ala Ala Ser Thr Asn Gln Val500 505 510Asp Leu Tyr Thr Pro Gln Arg Phe Gly Leu Thr Tyr His Asp Ser Asp515 520 525Gly Thr Glu Lys Pro Val Val Val Ile His Arg Ala Pro Leu Gly Ser530 535 540His Glu Arg Phe Thr Ala Tyr Leu Thr Glu His Phe Ala Gly Ala Phe545 550 555 560Pro Val Trp Leu Ala Pro Glu Gln Val Arg Ile Ile Pro Ile Val Glu565 570 575Glu Leu Thr Asp Tyr Ala Glu Glu Val Arg Asp Met Leu Leu Asp Ala580 585 590Asp Val Arg Ala Asp Val Asp Ala Gly Asp Gly Arg Leu Asn Ala Lys595 600 605Val Arg Ala Ala Val Thr Arg Lys Ile Pro Leu Val Val Val Val Gly610 615 620Arg Arg Glu Ala Glu Gln Arg Thr Val Thr Val Arg Asp Arg Ser Gly
625 630 635 640Glu Glu Thr Pro Met Ser Leu Glu Lys Phe Val Ala His Val Thr Gly645 650 655Leu Ile Arg Thr Lys Ser Leu Asp Gly Ala Gly His Ile Arg Pro Leu660 665 670Ser Lys Ala675<210>22<211>103<212>PRT<213>小链霉菌Tü4055<400>22Met Pro Arg Gly Ile Ala Val Asp Val Leu Arg Ala Gly Asp Arg Trp1 5 10 15Pro His Ser Ala Ala Pro Arg His Arg Gly Leu Leu Asn Ala Trp Trp20 25 30Gly Ala Trp Val Trp Ala Thr Val Phe Asp Arg Tyr Ala Ser Arg Thr35V 40 45Tyr Asp Asp Ala Gln Asp Val Asp Ala Ile His Asp Ala Ala Gly Leu50 55 60Val Met Ala Gly Ala Gly Phe Asp Ile Leu Ala Ala Val Leu Ala Ile65 70 75 80Leu Phe Val Arg Arg Leu Thr Ala Ala Gln His Ala Lys Ala Leu Ala85 90 95Gly Pro Thr Pro Pro Thr His100<210>23<21l>868<212>PRT<213>小链霉菌Tü4055<400>23Met Glu Ala Phe Leu Leu Leu Ala Ala Glu Ser Val Leu Leu Arg Arg1 5 10 15Asp Gln Ser Val Tyr Val Thr Pro Gly Ser Glu Pro Asp Gly Pro Pro20 25 30Arg Ala Ala Leu Arg Arg Leu Glu Ala Glu Leu Leu Gly Arg Gly His35 40 45Ala Val Ser Ala Pro Leu His Ala Val Leu Ala Ser Leu Asp Ser Glu50 55 60Glu Leu Ala Ala Ala His Val Arg Leu Val Gly Leu Val Asp Asp Leu65 70 75 80Leu Gly Ser Asp Arg Thr His Thr Pro Leu Phe Arg Arg Phe Pro Arg85 90 95Thr Val Pro Arg Asp Thr Glu Ala Leu Tyr Val Asp Arg Val Phe Ala
100 105 110Phe Leu Leu Gln Gln Pro Glu Gln Pro Cys Val Leu Cys Gly Glu Ala115 120 125Arg Thr Val Leu Pro Val Ser Pro Cys Ala His Leu Val Cys Arg Leu130 135 140Cys Trp Asp Gly Ser Asp Tyr Ala Gly Cys Pro Leu Cys His Arg Arg145 150 155 160Ile Asp Gly Asp Asp Pro Phe Leu Arg Pro Val Arg Ala Val Gly Ala165 170 175Ala Arg Ala Thr Val Pro Gly Pro Leu Arg Leu Leu Arg Leu Gly Thr180 185 190Asp Met Thr Ala Asp Ala Thr Thr Ala Val Asp Ala Leu Leu Ala Arg195 200 205Arg Thr Pro Leu Ser Pro Gln Asp Arg Asp Asp Leu Leu Thr Leu Leu210 215 220Pro Leu Thr Pro Ala Gly Arg Gly Asp Leu Pro Gln Asp Ile Pro Val225 230 235 240Arg Glu Thr Lys Ala Leu Val Leu Gly Ala Leu Val Arg Arg Ala Pro245 250 255Ser Arg Pro Ala Leu Arg Arg Leu Leu Ala Glu Arg Leu Thr Thr Ala260 265 270Thr Asp Val Leu Arg Leu Leu Ala Val Leu Ser Gly Gly Asp Ala Gly275 280 285Leu Val Thr Pro Ala Arg Phe Thr Asn Val Pro Arg Ser Leu Arg Arg290 295 300Asp Leu Leu Ala Val Leu Asp Gly Leu Pro Ala Pro Tyr Leu Val Glu305 310 315 320Asp Met Leu Arg His Pro Thr Ala Trp Lys Arg Ala Ala Glu Val Leu325 330 335His Pro Phe Glu Gly His Thr Arg His Pro Arg Ala Ala Leu Ala Thr340 345 350Ala Val Leu Arg Ala Thr Pro Leu Asp Pro Asp Thr Ala Phe Gly Ala355 360 365Ala Leu Leu Thr Thr Ala Ala Ala His Pro Asp Ala Val Arg Pro Asp370 375 380Gly Thr Arg Val Arg Pro Ala Thr Trp Ala Gly Arg Leu Glu Gln Ala385 390 395 400Met Ala Glu Gly Asp Ala Ala Arg Ala Ala Ala Leu Ala Gly Glu Arg405 410 415Pro Gly Glu Leu Val Arg Arg Leu Asp Val Leu Leu Arg Leu His Thr420 425 430Asp Glu Ala Leu Val Pro Glu Leu Glu Lys Ala Leu Arg His Gly Leu
435 440 445Pro Lys Val Gly Pro Gly Pro Leu Leu Ser Ala Leu Gly Ala Leu Arg450 455 460Thr Arg Thr Glu Asp Arg Thr Gly Thr Arg Arg Val Phe Phe Pro Arg465 470 475 480Gly Asp Val Thr Arg Ala Leu Ser Val Pro Glu Arg Arg Pro Ala Leu485 490 495Pro Ala Gly Pro Val Ser Glu Val Val Ala Leu Leu Glu Gly Glu Leu500 505 510Leu Arg Arg Phe Ala Ala Gly Arg Pro Tyr Glu Leu Ser Val Leu Asp515 520 525Ala Gly Leu Thr Asp Leu Thr Val Pro Phe Thr Glu Arg Thr Ala Ala530 535 540Lys Ala Leu Val Thr Val Gly Arg Gly Ser Val Gln Ala Leu Pro Glu545 550 555 560Gly Ser Val Leu Arg Leu Phe Leu His Trp Thr Glu Pro Arg Gly Asn565 570 575Arg Thr Asp Leu Asp Leu Ser Val Ala Phe Phe Asp Ala Glu Trp Thr580 585 590Phe Thr Gly Leu Cys Asp Tyr Thr Asn Leu Val His Gly Pro Asp Ala595 600 605Ala Ile His Ser Gly Asp Leu Thr Ser Ala Pro Ala Pro Arg Gly Ala610 615 620Thr Glu Tyr Val Asp Leu Asp Leu Glu Arg Leu Ala Arg Arg Gly Asp625 630 635 640Thr Tyr Ala Val Pro Leu Val Phe Ser Tyr Asn Asn Val Pro Phe Glu645 650 655Glu Leu Pro Asp Ala Phe Ala Gly Phe Met Ala Leu Pro Ala Glu Gly660 665 670Pro Arg Asp Ala Thr Tyr Asp Pro Arg Thr Val Arg Gln Arg Phe Asp675 680 685Leu Ala Gly Asp Ser Lys Val Cys Leu Pro Met Ile Val Asp Leu Ala690 695 700Arg Arg Arg Ala Leu Trp Thr Asp Thr His Leu Pro Ser Ala Gly Gly705 710 715 720Phe Gln Ser Ile Gly Ser His Gly Gly Gly Glu Leu Ala Ala Val Ala725 730 735Gly Asp Leu Trp Gln Gln Phe Thr Ser Gly Gly Arg Ala Thr Leu Trp740 745 750Asp Leu Ala Val Leu Arg Ala Ala Ala Leu Ser Pro Glu Val Ala Val755 760 765Val Ser Arg Glu Pro Glu Pro Ala Val Leu Arg Tyr Arg Arg Arg Ala
770 775 780Ala Glu Ser Glu Ala Ala Phe Ala Val Arg Val Ala Ser His Lys Asp785 790 795 800Ala Glu Glu Arg Leu Ala His Thr Asp Pro Asp Ser Ala Ala Ala Gly805 810 815Leu Ala Ala Gly Arg Arg Val Phe Leu Ala Thr Val His Gly Asp Val820 825 830Arg Pro Pro Gly Ala Ser Gly Thr Ser Tyr Arg Leu Phe Pro Gly Ala835 840 845Gly Asp Ala Ser Pro Thr Leu Thr Arg Val Thr Ala Gly Asp Leu Leu850 855 860Ala Glu Leu Gly865<210>24<211>212<212>PRT<213>小链霉菌Tü4055<400>24Met Ala Glu Gln Ile Ala Gly Ile Glu Ile Pro Asp Ser Ala Pro Ala1 5 10 15Arg Glu Ala Thr Asp Leu Ile Arg Asp Thr Thr Pro Pro Leu Ile Phe20 25 30His His Ser Arg Arg Val Tyr Leu Phe Gly Ser Leu Gln Ala Ala Ala35 40 45Leu Gly Ile Arg Pro Asp Pro Glu Leu Leu Tyr Ile Ala Ala Leu Phe50 55 60His Asp Thr Gly Leu Val Pro Pro Tyr Arg Gly Asp Asp Gln Arg Phe65 70 75 80Glu Met Asp Gly Ala Asp Gln Ala His Ala Phe Leu Leu Ala His Gly85 90 95Ile Pro Glu Ala Asp Ala Asp Thr Val Trp Thr Ala Val Ala Leu His100 105 110Thr Thr Pro Glu Val Pro Tyr Arg Met Ala Pro Glu Ile Ala Ala Thr115 120 125Thr Ala Gly Val Glu Thr Asp Val Leu Gly Leu Arg Leu Gly Asn Leu130 135 140Thr Arg Ala Gln Ile Asp Ala Val Thr Ala Ala His Pro Arg Pro Asp145 150 155 160Phe Lys Lys Gln Ile Leu Arg Ala Phe Thr Glu Gly Phe Glu His Arg165 170 175Pro Ala Thr Thr Phe Gly Thr Val Ash Ala Asp Val Leu Glu His Phe180 185 190Ala Pro Gly Phe Arg Arg Thr Asp Phe Val Glu Val Ile Glu Asn Ser
195 200 205Ala Trp Pro Glu210<210>25<211>329<212>PRT<213>小链霉菌Tü4055<400>25Met Thr Ala Arg Ala His Ser Val Gly Ile Leu Val Phe Asp Gly Met1 5 10 15Lys Met Leu Asp Leu Ser Gly Pro Ala Glu Val Phe Ala Glu Ala Asn20 25 30Arg Phe Gly Ala Arg Tyr Arg Leu Gly Val Val Ser Pro Asp Gly Ala35 40 45Pro Val Arg Ser Ser Ile Gly Leu Leu Val Pro Ala Glu Ala Asp Ala50 55 60Arg Ser Ala Gly Pro Pro Asp Thr Leu Val Val Val Gly Gly Asp Ala65 70 75 80Leu Pro Gly Ser Pro Val Asp Pro Arg Leu Ile Asp Ala Ala Lys Ala85 90 95Leu Ala Ala Arg Ala Gly Arg Val Ala Ser Val Cys Thr Gly Ala Phe100 105 110Val Leu Gly Ala Ala Gly Leu Leu Glu Gly Arg Arg Ala Thr Thr His115 120 125Trp Gln His Thr Thr Ala Leu Ala Arg Arg Cys Pro Ser Thr Arg Val130 135 140Glu Pro Asp Ala Ile Phe Val Lys Asp Gly Ala Thr Tyr Thr Ser Ala145 150 155 160Gly Val Thr Ala Gly Ile Asp Leu Ala Leu Ala Leu Leu Glu Glu Asp165 170 175His Gly Pro Asp Leu Ala Arg Arg Val Ala Arg Ser Leu Val Val Tyr180 185 190Leu Gln Arg Ala Gly Gly Gln Ser Gln Phe Ser Ala Ser Leu Arg Gly195 200 205Pro Ala Pro Arg Thr Pro Val Leu Arg Gln Val Gln Asp Ala Val Gln210 215 220Ala Asp Pro Ala Ala Asp His Ser Leu Ala Ala Leu Ala Ala Arg Val225 230 235 240Arg Val Ser Pro Arg His Leu Thr Arg Met Phe Arg Ala Glu Leu Asp245 250 255Val Thr Pro Val Lys Tyr Val Glu Leu Ile Arg Phe Asp Ile Ala Lys260 265 270Ala Leu Leu Asp Ser Gly His Asn Ala Thr Glu Ala Ala Ala Leu Ser
275 280 285Gly Phe Pro Ser Tyr Glu Ser Leu Arg Arg Ala Phe Ala Arg His Leu290 295 300Gly Leu Ser Pro Thr Arg Tyr Arg Gln Arg Phe Ala Thr Thr Val Pro305 310 315 320Asp Ala Gly Pro Arg Pro Asp Gly Gly325<210>26<211>276<212>PRT<213>小链霉菌Tü4055<400>26Met Gly Thr Val Thr Thr Ser Asp Gly Thr Ser Ile Phe Tyr Lys Asp1 5 10 15Trp Gly Pro Arg Asp Ala Pro Pro Ile Val Phe His His Gly Trp Pro20 25 30Leu Thr Ala Asp Asp Trp Asp Asn Gln Met Leu Phe Phe Leu Ser His35 40 45Gly Tyr Arg Val Ile Ala His Asp Arg Arg Gly His Gly Arg Ser Gly50 55 60Gln Pro Ser Thr Gly His Glu Met Asp Thr Tyr Ala Ala Asp Val Ala65 70 75 80Ala Leu Thr Glu Ala Leu Asp Leu Arg Asp Ala Val His Ile Gly His85 90 95Ser Thr Gly Gly Gly Glu Val Ala Arg Tyr Val Ala Arg Ala Glu Pro100 105 110Gly Arg Val Ala Lys Ala Val Leu Val Gly Ala Val Pro Pro Val Met115 120 125Val Lys Ser Asp Ala Asn Pro Gly Gly Thr Pro Ile Glu Val Phe Asp130 135 140Gly Phe Arg Thr Ala Leu Ala Ala Asn Arg Ala Gln Phe Tyr Ile Asp145 150 155 160Val Pro Ser Gly Pro Phe Tyr Gly Phe Asn Arg Glu Gly Ala Lys Val165 170 175Ser Gln Gly Leu Ile Asp Asn Trp Trp Arg Gln Gly Met Ser Gly Ala180 185 190Ala Asn Ala His Tyr Glu Cys Ile Lys Ala Phe Ser Glu Thr Asp Phe195 200 205Thr Glu Asp Leu Lys Ala Ile Asp Val Pro Val Leu Val Ala His Gly210 215 220Thr Asp Asp Gln Val Val Pro Tyr Ala Asp Ser Ala Pro Leu Ser Val225 230 235 240Lys Leu Leu Lys Asn Gly Thr Leu Lys Ser Tyr Glu Gly Leu Pro His
245 250 255Gly Met Leu Ser Thr His Pro Glu Val Val Asn Pro Asp Leu Leu Asp260 265 270Phe Val Arg Ser275<210>27<211>185<212>PRT<213>小链霉菌Tü4055<400>27Met Gly Val Met Ile Gly Pro Ala Gly Arg Glu Arg Asp Glu Gly Asp1 5 10 15His Val Thr Gln Gln Ala Pro Val Ala Thr Asp Glu Arg Arg Val Phe20 25 30Val Asp Lys Gln Thr Pro Gly Ala Tyr Lys Ala Phe Val Ala Ala Ala35 40 45Glu Ser Val Arg Glu Ala Ala Ala Ala Ala Gly Leu Asp Arg Leu Leu50 55 60Val Glu Leu Val Asn Ile Arg Val Ser Gln Leu Asn Ala Cys Ala Tyr65 70 75 80Cys Leu Ser Leu His Thr Arg Ala Ala Leu Arg Ala Gly Glu Thr Thr85 90 95Gln Arg Leu Ala Val Leu Pro Ala Trp Arg Asp Thr Glu Leu Phe Thr100 105 110Ala Arg Glu Arg Ala Ala Leu Ala Leu Ala Glu Ala Thr Thr Arg Pro115 120 125Ala Asp Ala Ala Ala Gln Ser Ala Ala Tyr Ala Gln Ala Arg Gly Val130 135 140Leu Ser Asp Asp Glu Val Ser Ala Val Ile Trp Val Ala Ile Ser Ile145 150 155 160Asn Ala Phe Asn Arg Val Ser Val Leu Ser Lys His Pro Val Arg Gly165 170 175Ala Ala Pro Ala Pro Val Ser Pro Ala180 185<210>28<211>324<212>PRT<213>小链霉菌Tü4055<400>28Met Val Ser Asn Thr Glu Thr Arg Pro Ala Glu Met Arg Cys Gly Ala1 5 10 15Leu Glu Asp Glu Val Pro Ala Ala Gly Val Glu Val Leu Thr Ala Arg20 25 30Asp Val Pro Leu Gly Gly Pro Arg Ala Met Thr Val Arg Arg Thr Leu
35 40 45Pro Gln Arg Ala Arg Thr Leu Ile Gly Ala Trp Cys Phe Ala Asp His50 55 60Tyr Gly Pro Asp Asp Val Ala Ala Ser Gly Gly Met Asp Val Ala Pro65 70 75 80His Pro His Ile Gly Leu Gln Thr Val Ser Trp Leu Phe Ser Gly Glu85 90 95Ile Glu His Arg Asp Ser Leu Gly Thr His Ala Phe Val Arg Pro Gly100 105 110Glu Leu Asn Leu Met Thr Gly Gly Phe Gly Ile Ala His Ser Glu Val115 120 125Ser Thr Pro Asp Thr Thr Val Leu His Gly Val Gln Leu Trp Val Ala130 135 140Leu Pro Glu Glu His Arg Asp Thr Gly Arg Asp Phe Gln His His Ala145 150 155 160Pro Ala Pro Val Ala Phe Asp Gly Gly Thr Ala Arg Val Phe Leu Gly165 170 175Ser Leu Ala Gly Asp Thr Ser Pro Val Ser Thr Phe Thr Pro Leu Leu180 185 190Gly Ala Glu Leu Thr Leu Val Pro Gly Gly Thr Ala Thr Leu Asp Val195 200 205Asp Pro Gly Phe Glu His Gly Val Leu Val Asp Ser Gly Asp Val Arg210 215 220Val Glu Gly Ala Val Val Arg Pro Ala Glu Leu Gly Tyr Val Ala Pro225 230 235 240Gly Arg Ala Thr Leu Thr Leu Thr Asn Glu Ser Ala Ala Pro Ala Arg245 250 255Leu Ile Leu Leu Gly Gly Pro Pro Phe Pro Glu Glu Ile Ile Met Trp260 265 270Trp Asn Phe Ile Gly Arg Ser His Asp Glu Ile Val Arg Ala Arg Glu275 280 285Asp Trp Met Lys Gly Asp Arg Phe Gly Glu Val His Gly Tyr Asp Gly290 295 300Ala Pro Leu Pro Ala Pro Glu Leu Pro Asn Ala Pro Leu Lys Pro Arg305 310 315 320Arg Arg Ala Arg<210>29<211>126<212>PRT<213>小链霉菌Tü4055<400>29Met Val Pro Thr Met Leu Cys Met Val Ala Val Pro Glu Ser His Ser
1 5 10 15Gly Trp Thr Phe Val Thr Asn His Ala Arg Val Leu Ala Ala Ile Ala20 25 30Asp Asn Pro Asn Val Arg Ile Arg Asp Ile Ala Ala His Cys Arg Leu35 40 45Thr Glu Arg Ala Val Gln Arg Ile Ile Ser Asp Leu Glu Gln Asp Gly50 55 60Tyr Leu Ser His Thr Arg Asp Gly Arg Ser Asn Ile Tyr Arg Val Glu65 70 75 80Pro Asp Lys Val Leu Arg His Pro Ala Glu Ala Gly Leu Thr Val Ala85 90 95Ala Leu Leu Ser Leu Leu Val Arg Asp Glu Thr Asp His Gly Arg Ser100 105 110Ala Gly Pro Gly Ser Arg Pro Ala Arg Ser Ser Ala Ala Arg115 120 125<210>30<21l>127<212>PRT<213>小链霉菌Tü4055<400>30Met Ser Leu Asp Glu Ala Val Ala Gly Cys Ser Arg His Thr Gly Arg1 5 10 15Arg Arg Leu Pro Ala Ala Glu Gln Pro Thr Gln Ala Gln Tyr Glu Ala20 25 30His Gly Ala Trp Val Val Ser Ala Arg Gly Ala Tyr Asp Met Asn Ser35 40 45Val Glu Pro Leu Ala Asp Ala Leu Lys Asp Ala Ala Glu Lys Ser Pro50 55 60Lys Val Val Leu Asp Ala Ser Gly Ile Thr Phe Ala Asp Ser Thr Leu65 70 75 80Leu Ser Leu Leu Ile Leu Thr His Gln Ala Thr Asp Phe Arg Val Ala85 90 95Ala Pro Thr Trp Gln Val Met Arg Leu Met Gln Leu Thr Gly Val Asp100 105 110Ala Phe Leu Lys Val Arg Ala Thr Val Glu Glu Ala Ala Thr Ala115 120 125<210>31<211>82<212>PRT<213>小链霉菌Tü4055<400>31Met Ser Met Ile Leu Pro Ala Glu Lys Glu Leu Arg Ala Val Leu Ala1 5 10 15Arg Phe Ala Gln Ala Arg Ile Asp His Asp Val Arg Pro Ser Gly Cys
20 25 30Thr Ser Arg Leu Leu Glu Asp Ala Thr Tyr Thr Leu Cys Val Met Thr35 40 45Gly Ala Arg Thr Ala Glu Gln Ala Leu Arg Thr Ala Asp Glu Leu Leu50 55 60Ala Gln Phe Ala Glu Arg Thr Ala Ala Pro Val Glu Asp Glu Ala Leu65 70 75 80Ala Ala<210>32<211>70<212>PRT<213>小链霉菌Tü4055<400>32Met Ser Asp Thr Arg Leu Arg Gln Arg Asp Glu Thr Ser Lys Gly Pro1 5 10 15Ala Thr Glu Ile Pro Ala Pro Gln Trp Arg Asp Leu Phe Leu Ala Pro20 25 30Asp Trp Gly Gly Thr Asp Glu Gln Val Ile Val Ala Glu Glu Ala Arg35 40 45Gly Pro Glu His Phe Thr Gly Ala Arg Arg Pro Arg Gly Gly Arg Arg50 55 60Ser Ser Arg Arg Ala Ala65 70<210>33<211>172<212>PRT<213>小链霉菌Tü4055<400>33Met Arg Cys Ser His Arg Ala Gly Gly Val Gly Ala Arg Ala Trp Leu1 5 10 15Gly Gly Asn Val Ala Val Asp Met Gly Glu Thr Gly Leu Asp Gly Ser20 25 30Ser Thr Gln Arg Ala Pro Glu Gly Ala Asp Pro Arg Ala Ala Ser Val35 40 45Thr Tyr Arg Arg Glu Ala Leu Arg Ile Ala Asp Ala Arg His Phe Ala50 55 60Thr Asp Tyr Leu Thr Arg Ser Gln Arg Asp Leu Arg Ser Pro Val Pro65 70 75 80Glu Arg Ala Ser Glu Ala Val His Leu Val Val Ser Glu Leu Ile Thr85 90 95Asn Ala Val Lys Tyr Gly Ala Asp Pro Ile Glu Leu Thr Leu Ser Leu100 105 110Thr Asp Asp Ala Val Thr Val Thr Val Arg Asp Gly Asp Thr Thr Leu115 120 125
Pro Ala Pro Arg Pro Ala Asp Pro Ala Arg Val Gly Gln His Gly Leu130 135 140Glu Ile Val Ala Ala Leu Ser Gln Ala Val Glu Ile Arg Pro Glu Pro145 150 155 160Ser Gly Lys Arg Ile Thr Ala Arg Ile Ala Leu Thr165 170<210>34a<21l>105<212>PRT<213>小链霉菌Tü4055<400>34aMet Gln Ser Ser Ser Ala Ser Val Arg Gly Glu Ile Val Ile Arg Arg1 5 10 15Ala Val Ala Arg Asp Ala Lys Arg Leu Ser Arg Leu Val Arg Gly Ser20 25 30Arg Ala Tyr Glu Gly Pro Tyr Ala Ala Met Val Ser Asp Tyr Arg Val35 40 45Gly Pro Asp Tyr Ile Glu Asn His Gln Val Phe Val Ala Ser Thr Pro50 55 60Arg Thr Pro Arg Thr Gly Cys Ser Ala Ser Thr Arg Cys Ser Ser Arg65 70 75 80Arg Arg Ser Trp Thr Cys Cys Ser Ser Arg Thr Val Pro Arg Ala Ala85 90 95Ala Ser Asp Gly Cys Leu Ser Ile Thr100 105<210>35<211>638<212>PRT<213>小链霉菌Tü4055<400>35Met Ala Gln Arg Arg Thr Pro Phe Gly Asp Arg Ala Arg Tyr Trp Phe1 5 10 15Asp Ser Thr Leu Ala Arg Gly Ala Ala Ala Leu Val Gly Trp Met Ala20 25 30Leu Leu Ser Leu Ala Val Val Val Pro Ala Ser Ala Val Met Val Trp35 40 45Thr Asp Pro Asp Ala Pro Pro Ser Leu Ala Glu Arg Leu Ala Glu Val50 55 60Trp Arg Leu Thr Gly Glu Thr Leu Arg Leu Gly Gly Ala Thr Gly Thr65 70 75 80Pro Leu Arg Ala Met Leu Ser Val Leu Leu Ala Leu Val Thr Leu Leu85 90 95Tyr Val Ser Thr Leu Val Gly Leu Ile Thr Thr Ala Leu Thr Glu Arg
100 105 110Leu Thr Ser Leu Arg Arg Gly Arg Ser Thr Val Leu Glu Gln Gly His115 120 125Ala Val Val Leu Gly Trp Ser Glu Gln Val Phe Thr Val Val Ser Glu130 135 140Leu Val Ala Ala Asn Val Asn Gln Arg Gly Ala Ala Val Val Val Leu145 150 155 160Ala Asp Arg Asp Lys Thr Val Met Glu Glu Ser Leu Gly Thr Lys Val165 170 175Gly Ser Cys Gly Gly Thr Arg Leu Ile Cys Arg Ser Gly Pro Thr Thr180 185 190Asp Pro Ala Val Leu Pro Leu Thr Ser Pro Ala Thr Ala Gly Val Val195 200 205Leu Val Leu Pro Pro Asp Glu Pro His Ala Asp Ala Glu Val Val Lys210 215 220Thr Leu Leu Ala Leu Arg Ala Ala Leu Ala Gly Ala Lys Pro Arg Pro225 230 235 240Pro Val Val Ala Ala Val Arg Asp Asp Arg Tyr Arg Leu Ala Ala Cys245 250 255Leu Ala Ala Gly Pro Asp Gly Val Val Leu Glu Ser Asp Thr Val Thr260 265 270Ala Arg Leu Ile Val Gln Ala Ala Arg Arg Pro Gly Ile Ser Leu Val275 280 285His Arg Glu Leu Leu Asp Phe Ala Gly Asp Glu Phe Tyr Leu Ile Ser290 295 300Glu Pro Ala Leu Thr Gly Arg Pro Phe Gly Glu Val Leu Leu Ser Tyr305 310 315 320Ser Thr Thr Ser Val Val Gly Leu Met Arg Gly Cys Thr Pro Leu Leu325 330 335Asn Pro Pro Pro Thr Thr Pro Val Ala Pro Asp Asp Leu Leu Val Val340 345 350Ile Thr Gly Asp Asp Asp Thr Ala Arg Leu Asp Asp Cys Ala Glu Ser355 360 365Val Glu Lys Ala Ala Val Ala Ser Arg Pro Pro Thr Pro Ala Pro Ala370 375 380Glu Arg Ile Leu Leu Leu Gly Trp Asn Arg Arg Ala Pro Leu Val Val385 390 395 400Asp Gln Leu His Arg Arg Ala Arg Pro Gly Ser Ala Val Asp Val Val405 410 415Ala Glu Pro Gly Glu Ala Thr Ile Arg Glu Ile Ser Glu Ala Glu Ala420 425 430Asp Ser Gly Asn Gly Glu Asn Gly Gly Asn Gly Leu Ser Leu Ala Leu
435 440 445His His Gly Asp Ile Thr Arg Pro Glu Thr Leu Arg Arg Leu Asp Val450 455 460His Ser Tyr Asp Ser Val Ile Val Leu Gly Arg Asp Pro Ala Pro Gly465 470 475 480Gln Pro Pro Asp Asp Pro Asp Asn Arg Thr Leu Val Thr Leu Leu Leu485 490 495Leu Arg Gln Leu Glu Glu Ala Thr Gly Arg Glu Leu Pro Val Val Thr500 505 510Glu Leu Ile Asp Asp Arg Asn Arg Ala Leu Ala Pro Ile Gly Pro Gly515 520 525Ala Asp Val Ile Ile Ser Gly Lys Leu Ile Gly Leu Leu Met Ser Gln530 535 540Ile Ser Gln Asn Arg His Leu Ala Ala Val Phe Glu Glu Leu Phe Ser545 550 555 560Ala Glu Gly Ala Gly Val Arg Leu Arg Pro Ala Thr Asp Tyr Leu Leu565 570 575Pro Gly Ser Thr Thr Ser Phe Ala Thr Val Val Ala Ala Ala Arg Arg580 585 590Arg Gly Glu Cys Ala Ile Gly Tyr Arg Asp His Ala Asp Ala Ser Thr595 600 605Arg Pro His Tyr Gly Val Arg Ile Asn Pro Pro Lys Arg Glu Arg Arg610 615 620Arg Trp Thr Ala Glu Asp Glu Val Val Val Ile Gly Thr Asp625 630 635<210>36<211>165<212>PRT<213>小链霉菌Tü4055<400>36Met Pro Ser Thr Asp Val Val Glu Leu Ile Leu Arg Asp His Arg Arg1 5 10 15Met Glu Glu Leu Phe Arg Thr Leu Arg Asn Val Glu Ala Asp Arg Ala20 25 30Ala Ala Leu Thr Glu Phe Ala Asp Leu Leu Ile Ala His Ala Ser Ala35 40 45Glu Glu Asp Glu Val Tyr Pro Ala Leu Arg Arg Tyr Lys Asn Val Glu50 55 60Gly Glu Asp Val Asp His Ser Val His Glu His His Glu Ala Asn Glu65 70 75 80Ala Leu Leu Ala Leu Leu Glu Val Glu Asp Thr Ala Ser Asp Glu Trp85 90 95Asp Asp Lys Leu Glu Glu Leu Val Thr Ala Val Asn His His Ala Asp
100 105 110Glu Glu Glu Arg Thr Leu Leu Asn Asp Ala Arg Glu Asn Val Ala Asp115 120 125Asp Arg Arg Arg Glu Leu Gly Gln Lys Phe Gln Glu Ala Arg Ser Arg130 135 140Tyr Leu Glu Thr Gly Cys Gly Ser Val Glu Asn Val Arg Lys Leu Val145 150 155 160Ala Ala Ala Asp Asp165<210>37<211>787<212>PRT<213>小链霉菌Tü4055<400>37Met Ala Arg Arg Leu Thr Glu Gly Arg Thr Arg Arg Glu Lys Gly Glu1 5 10 15His Met Gln Lys Pro His Gly Glu Glu Ser Glu Thr Ser Leu Ser Val20 25 30Thr Pro Pro Lys Lys Trp Ala Ala Gly Val Pro Ala Val Val His Ala35 40 45Leu Glu Tyr Ser Leu Glu Gln Thr Ser Pro Arg Arg Thr Gly Val Asp50 55 60Leu Leu Thr Met Asn Gln Val Gly Gly Ile Asp Cys Pro Gly Cys Ala65 70 75 80Trp Ala Asp Pro Ala Pro Gly Arg Arg His Arg Asn Glu Tyr Cys Glu85 90 95Asn Gly Ala Lys His Ile Asn Asp Glu Ala Thr Thr Arg Arg Val Thr100 105 110Ala Asp Phe Phe Arg Glu His Ser Val Ala Asp Leu Ala Gly Arg Ser115 120 125Asp Met Trp Leu Asn Gln Gln Gly Arg Leu Thr Glu Pro Met Ile Lys130 135 140Arg Pro Gly Ser Ala His Tyr Glu Pro Ile Gly Trp Asn Asp Ala Leu145 150 155 160Gly Val Leu Ala Glu Glu Leu Lys Ser Leu Ala Ser Pro Asp Glu Ala165 170 175Val Phe Tyr Thr Ser Gly Arg Ala Ser Asn Glu Ala Ala Phe Val Leu180 185 190Gln Leu Phe Ala Arg Ala Phe Gly Thr Asn Asn Leu Pro Asp Cys Ser195 200 205Asn Met Cys His Glu Ser Ser Gly Phe Ala Leu Ser Glu Thr Leu Gly210 215 220Thr Gly Lys Gly Thr Val Gly Leu Asp Asp Leu His His Ala Asp Leu
225 230 235 240Ile Phe Leu Val Gly Gln Asn Pro Gly Ser Asn His Pro Arg Gln Leu245 250 255Ser Ala Leu Glu Glu Ala Lys Arg Asn Gly Ala Arg Ile Val Ala Val260 265 270Asn Pro Leu Pro Glu Ala Gly Leu Arg Arg Phe Lys Asn Pro Gln Gln275 280 285Pro Arg Gly Val Val Gly Arg Gly Thr Arg Ile Ala Asp Arg Phe Leu290 295 300His Ile Lys Pro Gly Gly Asp Leu Ala Leu Phe Gln Ala Leu Asn Arg305 310 315 320Leu Leu Leu Glu Ala Glu Asp Ala Arg Pro Gly Thr Val Leu Asp His325 330 335Asp Phe Ile Asp Ala His Thr Thr Gly Phe Glu Glu Phe Ala Arg His340 345 350Ala Arg Thr Val Asp Trp Asp Asp Val Arg Ala Ala Thr Gly Leu Thr355 360 365Arg Glu Glu Ile Glu Lys Val Arg Asp Glu Val Leu Asp Ser Glu Arg370 375 380Val Val Val Cys Trp Ala Met Gly Ile Thr Gln His Lys His Gly Val385 390 395 400Pro Thr Val Arg Glu Ile Val Asn Phe Leu Met Leu Arg Gly Asn Leu405 410 415Gly Arg Ala Gly Thr Gly Ala Cys Pro Val Arg Gly His Ser Asn Val420 425 430Gln Gly Asp Arg Thr Met Gly Ile Trp Glu Gln Met Pro Asp Thr Phe435 440 445Leu Asp Ala Leu Arg Asp Glu Phe Gly Phe Glu Pro Pro Arg Ala His450 455 460Gly Leu Asp Ser Val Asn Ser Ile Lys Ala Met Arg Glu Gly Arg Val465 470 475 480Lys Val Phe Leu Ala Leu Ala Gly Asn Phe Val Arg Ala Ala Pro Asp485 490 495Ser Glu Val Thr Glu Glu Ala Met Arg Ser Cys Arg Leu Thr Ala His500 505 510Ile Ser Thr Lys Leu Asn Arg Ser His Thr Val Cys Gly Asp Thr Ala515 520 525Leu Ile Leu Pro Thr Leu Gly Arg Thr Glu Arg Asp Val Gln Ala Asp530 535 540Gly Glu Gln Phe Val Thr Val Glu Asn Ser Met Ser Glu Val His Thr545 550 555 560Ser Arg Gly Arg Leu Ala Pro Ala Ser Pro Met Leu Leu Ser Glu Ile
565 570 575Ala Ile Leu Cys Arg Leu Ala Arg Leu Thr Leu Asp Gly Arg Val Glu580 585 590Ile Pro Trp Glu Thr Phe Glu Gly Asp Tyr His Thr Ile Arg Asp Arg595 600 605Ile Ala Arg Ile Val Pro Gly Phe His Asp Phe Asn Ala Arg Val Thr610 615 620Arg Pro Gly Gly Phe Gln Leu Pro Asn Pro Val Asn Glu Gly Val Phe625 630 635 640Asn Thr Glu Val Gly Lys Ala Leu Phe Thr Arg Asn Glu Ser Val Val645 650 655Pro Arg Ala Pro Glu Gly His Leu Leu Leu Gln Thr Leu Arg Ser His660 665 670Asp Gln Trp Asn Thr Val Pro Tyr Thr Asp Asn Asp Arg Tyr Arg Gly675 680 685Ile His Gly Ser Arg His Val Val Leu Val Asn Pro Ala Asp Leu Ser690 695 700Glu Leu Gly Leu Ala Gln Gly Asp Arg Val Asp Leu Val Ser Val Trp705 710 715 720Ala Asp Gly Thr Glu Arg Arg Ala Glu Asn Phe Gln Val Val Pro Tyr725 730 735Pro Ala Ala Lys Gly Ser Ala Ala Ala Tyr Tyr Pro Glu Thr Asn Val740 745 750Leu Val Pro Leu Asp Ser Val Ala Asp Ile Ser Asn Gln Pro Thr Ser755 760 765Lys Gly Ile Val Val Arg Leu Glu Pro Val Pro Asp Arg Thr Gln Pro770 775 780Ser Pro Ala785<210>38<21l>206<212>PRT<213>小链霉菌Tü4055<400>38Met Ala Glu Gln His Glu Gly Pro Arg Ala Val Pro Asp Thr Pro Gly1 5 10 15Ala Arg Thr Ser Gly Asp Arg Ser Thr Gly Arg Arg Pro Leu Arg Glu20 25 30Arg His Val Asp Gln Thr Val Glu Val Ala Val Pro Val Arg Thr Ala35 40 45Tyr Asn Gln Trp Thr Gln Phe Lys Ser Phe Pro Arg Phe Ser Ala Val50 55 60Val Arg Asp Val Glu Gln Val Arg Pro Thr Val Thr Ala Trp Thr Leu
65 70 75 80Gly Tyr Gly Pro Leu Arg Arg Arg Phe Ala Val Glu Ile Leu Glu Gln85 90 95Asp Pro Asp Ala Tyr Leu Ala Trp Arg Gly Leu Glu Gln Arg Pro Trp100 105 110His Arg Gly Glu Val Glu Phe Arg Pro Thr Glu Ser Gly Gly Thr Ala115 120 125Ile Thr Val Arg Val Leu Leu Glu Pro Arg Gly Ala Ala Arg Ile Leu130 135 140Thr Arg Ser Ser Arg Ala Val Arg Leu Thr Thr Arg Leu Val His Gly145 150 155 160Glu Leu Thr Arg Phe Lys Arg Phe Met Glu Gly Leu Gly Gln Glu Gly165 170 175Gly Ala Trp Arg Gly Thr Ile Arg Asn Gly Arg Val Gln His Asp Arg180 185 190Pro Glu Pro Pro Arg Ser Arg Val Ala Arg Trp Pro Val Gly195 200 205<210>39<211>251<212>PRT<213>小链霉菌Tü4055<400>39Met Leu Leu Leu Ile Ser Pro Asp Gly Val Glu Glu Ala Leu Asp Cys1 5 10 15Ala Lys Ala Ala Glu His Leu Asp Ile Val Asp Val Lys Lys Pro Asp20 25 30Glu Gly Ser Leu Gly Ala Asn Phe Pro Trp Val Ile Arg Glu Ile Arg35 40 45Asp Ala Val Pro Ala Asp Lys Pro Val Ser Ala Thr Val Gly Asp Val50 55 60Pro Tyr Lys Pro Gly Thr Val Ala Gln Ala Ala Leu Gly Ala Val Val65 70 75 80Ser Gly Ala Thr Tyr Ile Lys Val Gly Leu Tyr Gly Cys Thr Thr Pro85 90 95Glu Gln Gly Ile Ala Val Met Arg Ala Val Val Arg Ala Val Lys Asp100 105 110His Arg Pro Glu Ala Leu Val Val Ala Ser Gly Tyr Ala Asp Ala His115 120 125Arg Ile Gly Cys Val Asn Pro Leu Ala Leu Pro Asp Ile Ala Ala Arg130 135 140Ser Gly Ala Asp Ala Ala Met Leu Asp Thr Ala Val Lys Asp Gly Thr145 150 155 160Arg Leu Phe Asp His Val Pro Pro Asp Thr Cys Ala Glu Phe Val Arg
165 170 175Arg Ala His Ala Ala Gly Leu Leu Ala Ala Leu Ala Gly Ser Val Arg180 185 190Gln Thr Asp Leu Gly Arg Leu Thr Arg Ile Gly Thr Asp Ile Val Gly195 200 205Val Arg Gly Ala Val Cys Glu Gly Gly Asp Arg Asn Ala Gly Arg Ile210 215 220Arg Pro His Leu Val Ala Ala Phe Arg Ser Glu Met Asp Arg His Ala225 230 235 240Arg Glu His Arg Ala Gly Val Thr Thr Ala Ser245 250<210>40<211>467<212>PRT<213>小链霉菌Tü4055<400>40Met Pro Thr Pro Ala Pro Asp His Ala Pro Ala Gln Arg Ala Ala Pro1 5 10 15Leu Ala Val Val Asp Pro Ala Thr Gly Thr Val Phe Asp Glu Ala Pro20 25 30Asp Gln Gly Pro Asp Val Leu Asp Ala Val Val Asp Arg Ala Arg Arg35 40 45Ala Trp His Gly Trp Arg Ala Asp Pro Asp Ala Arg Thr Thr Ala Leu50 55 60Arg Ser Ala Ala Asp Ala Val Glu Ala Ala Gly Asp Asp Leu Ala Arg65 70 75 80Leu Leu Thr Arg Glu Gln Gly Lys Pro Leu Ala Glu Ser His Ala Glu85 90 95Val Ala Arg Thr Ala Ala Arg Leu Arg Tyr Phe Ala Gly Leu Ala Pro100 105 110Arg Thr Arg Arg Ile Thr Asp Gly Arg Pro Val Arg Ser Glu Val Arg115 120 125Trp Arg Pro Leu Gly Pro Val Ala Ala Ile Val Pro Trp Asn Phe Pro130 135 140Leu Gln Leu Ala Ser Ala Lys Phe Ala Pro Ala Leu Ala Ala Gly Asn145 150 155 160Thr Met Val Leu Lys Pro Ser Pro Phe Thr Pro Leu Ala Thr Arg Leu165 170 175Leu Gly Ser Val Leu Ala Thr Ala Leu Pro Glu Asp Val Leu Thr Val180 185 190Val Thr Gly Arg Glu Pro Leu Gly Ala Arg Leu Ala Ala His Pro Gly195 200 205Ile Arg His Val Thr Phe Thr Gly Ser Val Pro Thr Gly Arg Ala Val
210 215 220Ala Arg Ala Ala Ala Ala Ser Leu Ala Arg Val Thr Leu Glu Leu Gly225 230 235 240Gly Asn Asp Ala Ala Val Leu Leu Asp Asp Val Glu Val Asp Arg Ile245 250 255Ala Asp Arg Leu Phe Trp Ala Ala Phe Arg Asn Cys Gly Gln Val Cys260 265 270Met Ala Val Lys Arg Val Tyr Ala Pro Ala Arg Leu His Ala Gln Val275 280 285Val Glu Ala Leu Thr Glu Arg Ala Lys Ala Val Ala Val Gly Pro Gly290 295 300Leu Asp Pro Arg Thr Arg Leu Gly Pro Val Ala Asn Ala Pro Gln Leu305 310 315 320Ala Arg Val Glu Gln Ile Thr Arg Arg Ala Leu Ala Asp Gly Ala Arg325 330 335Ala Ala Ala Gly Gly His Arg Leu Asp Gly Pro Gly Cys Phe Phe Ala340 345 350Pro Thr Ile Leu Thr Asp Val Pro Pro Asp Ser Pro Val Val Thr Glu355 360 365Glu Gln Phe Gly Pro Val Leu Pro Val Leu Pro Tyr Arg Ser Leu Asp370 375 380Glu Ala Val Asp Ala Ala Asn Gly Thr Gly Phe Gly Leu Gly Gly Ser385 390 395 400Val Trp Gly Thr Asp Leu Asp Arg Ala Glu Ala Val Ala Asp Arg Leu405 410 415Glu Cys Gly Thr Ala Trp Val Asn His His Ala Glu Leu Ser Leu Ala420 425 430Gln Pro Phe Ala Gly Asp Lys Asp Ser Gly Val Gly Val Ala Gly Gly435 440 445Pro Trp Gly Leu Tyr Gly Asn Leu Arg Pro Phe Val Val His Arg Pro450 455 460Arg Gly Glu465<210>41<211>368<212>PRT<213>小链霉菌Tü4055<400>41Met Ser Phe Arg Ala Ala Val Leu Arg Gly Tyr Glu Asp Pro Phe Thr1 5 10 15Val Glu Glu Val Thr Leu Gly Thr Glu Pro Gly Ala Gly Glu Ile Leu20 25 30Val Glu Ile Ala Gly Cys Gly Met Cys Arg Thr Asp Leu Ala Val Arg
35 40 45Arg Ser Ala Gly Arg Ser Pro Leu Pro Ala Val Leu Gly His Glu Gly50 55 60Ser Gly Val Val Val Arg Thr Gly Gly Gly Pro Asp Thr Ala Ile Gly65 70 75 80Val Gly Asp His Val Val Leu Ser Phe Asp Ser Cys Gly His Cys Arg85 90 95Asn Cys Arg Ala Ala Ala Pro Ala Tyr Cys Asp Ser Phe Ala Ser Leu100 105 110Asn Leu Phe Gly Gly Arg Ala Glu Asp Pro Pro Arg Leu Thr Asp Gly115 120 125Ser Gly Ala Ala Leu Ala Pro Arg Trp Phe Gly Gln Ser Ala Phe Ala130 135 140Glu Tyr Ala Leu Val Ser Ala Arg Asn Ala Val Arg Val Asp Pro Ala145 150 155 160Leu Pro Val Glu Leu Leu Gly Pro Leu Gly Cys Gly Phe Leu Thr Gly165 170 175Ala Gly Ala Val Leu Asn Thr Phe Ala Ala Gly Pro Gly Asp Thr Leu180 185 190Val Val Leu Gly Ala Gly Ala Val Gly Leu Ala Ala Val Met Ala Ala195 200 205Thr Ala Ala Gly Ala Pro Ser Val Ala Val Asp Arg Asn Pro Arg Arg210 215 220Leu Glu Leu Ala Glu Arg Phe Gly Ala Val Pro Leu Pro Ala Ala Thr225 230 235 240Ala Gly Leu Ala Glu Arg Ile Arg Arg Leu Thr Asp Gly Gly Ala Arg245 250 255Tyr Ala Leu Asp Thr Thr Ala Ser Val Pro Leu Ile Asn Glu Ala Leu260 265 270Arg Ala Leu Arg Pro Thr Gly Ala Leu Gly Leu Val Ala Arg Leu His275 280 285Thr Ala Leu Pro Leu Glu Pro Gly Thr Leu Asp Arg Gly Arg Ser Ile290 295 300Arg His Val Cys Glu Gly Asp Ala Val Pro Gly Leu Leu Ile Pro Gln305 310 315 320Leu Thr Arg Leu Trp Gln Ala Gly Arg Phe Pro Phe Asp Gln Leu Val325 330 335Arg Thr Tyr Pro Leu Ala Asp Ile Asn Glu Ala Glu Arg Asp Cys Asp340 345 350Ala Gly Leu Val Val Lys Pro Val Leu Leu Pro Pro Ala Arg Ser Arg355 360 365<210>42
<2ll>301<212>PRT<213>小链霉菌Tü4055<400>42Met Thr Gly Thr Ala Pro Gln Tyr Thr Asp Val Glu Gly Val Asn Gly1 5 10 15Gly Val Gly Leu Thr Ala Phe Leu Val Ala Ala Ala Arg Ala Ile Glu20 25 30Thr His Arg Asp Asp Ser Leu Ala Gln Asp Val Tyr Ala Glu His Phe35 40 45Val Arg Ala Ala Pro Ala Cys Ala Asp Trp Pro Val Arg Ile Glu Gln50 55 60Val Pro Asp Gly Asp Gly Asn Pro Leu Trp Gly Arg Phe Ala Arg Tyr65 70 75 80Phe Gly Leu Arg Thr Arg Ala Leu Asp Asp Phe Leu Leu Arg Ser Val85 90 95Arg Thr Gly Pro Arg Gln Val Val Leu Leu Gly Ala Gly Leu Asp Thr100 105 110Arg Ala Phe Arg Leu Asp Trp Pro Ser Gln Cys Ala Val Phe Glu Ile115 120 125Asp Arg Thr Gly Val Leu Ala Phe Lys Gln Gln Val Leu Thr Asp Leu130 135 140Ala Ala Thr Pro Arg Val Glu Arg Val Pro Val Pro Val Asp Leu Arg145 150 155 160Ala Asp Trp Ala Gly Ala Leu Thr Ala Ala Gly Phe Asp Pro Ala Ala165 170 175Pro Ser Val Trp Leu Ala Glu Gly Leu Leu Phe Tyr Leu Pro Gly Pro180 185 190Ala Glu Ser Leu Leu Val Asp Thr Val Asp Arg Leu Thr Thr Asp Gly195 200 205Ser Ala Leu Ala Phe Glu Ala Lys Leu Glu Lys Asp Leu Leu Ala Tyr210 215 220Arg Asp Ser Ala Ile Tyr Thr Ala Thr Arg Glu Gln Ile Gly Ile Asp225 230 235 240Leu Leu Arg Leu Phe Asp Lys Gly Pro Arg Pro Asp Ser Ala Gly Glu245 250 255Leu Ala Ala Arg Gly Trp Ser Thr Ser Met His Thr Pro Phe Val Phe260 265 270Thr His Arg Tyr Gly Arg Gly Pro Leu Pro Glu Pro Asn Asp Ala Leu275 280 285Glu Gly Asn Arg Trp Val Phe Ala Arg Lys Pro Gly Pro290 295 300<210>43
<211>179<212>PRT<213>小链霉菌Tü4055<400>43Met Cys Met Arg Asp Glu Ala Ala Lys Arg Val Glu Leu Val Phe Ser1 5 10 15Leu Phe Asp Ala Asn Gly Asn Gly Val Ile Asp Ser Asp Asp Phe Asp20 25 30Leu Met Thr Asp Arg Val Val Ala Ala Ala Ala Gly Ser Asp Asp Ser35 40 45Ala Lys Ala Ala Val Arg Ala Ala Phe Arg Arg Tyr Trp Thr Thr Leu50 55 60Ala Thr Glu Leu Asp Ala Asp Gly Asp Gly Val Ile Thr Val Glu Glu65 70 75 80Phe Arg Pro Phe Val Leu Asp Pro Glu Arg Phe Gly Pro Thr Ile Ala85 90 95Glu Phe Ala Arg Ala Leu Ser Ala Leu Gly Asp Pro Asp Gly Asp Gly100 105 110Leu Ile Glu Arg Pro Leu Phe Val Ala Leu Met Lys Ala Ile Gly Phe115 120 125Glu Glu Ala Asn Ile His Ala Leu Phe Asp Ala Phe Ala Pro Asp Ala130 135 140Ala Asp Arg Ile Thr Val Ala Ala Trp Ala Ser Gly Ile Glu Asp Tyr145 150 155 160Tyr Ala Pro Asp Leu Ala Gly Ile Pro Gly Asp Arg Leu Val Ala Ala165 170 175Arg Thr Val<210>44<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM410<400>44aaaatgcatt cggcctgaac ggccccgctg tca 33<210>45<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM411<400>45aaatggccag cgaacaccaa caccacacca cca 33<210>46
<211>32<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM412<400>46aaagtcctag gcggcggccg gcgggtcgac ct32<210>47<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM413<400>47tttagatctc gcgacgtcgc acgcgccgaa cgtca 35<210>48<211>34<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM414<400>48aaactgcaga gtcgaacatc ggtcacacgc aggc 34<210>49<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM415<400>49aaaatgcatg atccacatcg atacgacgcg cccga 35<210>50<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM416<400>50taaatgcatt ccattcggtg caggtggagt tgatcc36<210>51<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM417
<400>51ataggatccc ctccgggtgc tccagaccgg ccaccc 36<210>52<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM368<400>52tttcctgcag gccatcccca cgatcgcgat cggct35<210>53<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM369<400>53tttcatatga caggcagtgc tgtttcggcc ccatt35<210>54<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM370<400>54tttcatatgg cggatgccgt acgtgccgcc ggcgct 36<210>55<211>32<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM371<400>55tttcatatgc cccaggcgat cgtccgcacc ac 32<210>56<211>41<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM372<400>56tttcatatgg tctcggcccc ccacacaaga gccctccggg c 41<210>57<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述寡聚物B1819A<400>57gtcatgcatg cggcgggctc 20<210>58<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1819B<400>58ggtctagaac ggccgaactt 20<210>59<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1819C<400>59gttctagaac ctcggtcggc 20<210>60<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1819D<400>60ctggatccca cgctgctgcg 20<210>61<211>19<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BLDA<400>61ggagacttac gggggatgc 19<210>62<211>19<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BLDB<400>62ctccagcagc gaccagaac 19
<210>63<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B19A<400>63cccatgcatc accgacatac 20<210>64<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B19B<400>64gcgatatccc gaagaacgcg 20<210>65<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1920A<400>65gccaagcttc ctcgacgcgc 20<210>66<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1920B<400>66cactagtgcc tcacccagtt 20<210>67<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1920C<400>67cactagtgac ggccgaagcg 20<210>68<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B1920D
<400>68tcggatccgt cagaccgttc20<210>69<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM384<400>69aacctgcagg taccccggtg gggtgcggtc gcccga 36<210>70<211>24<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM385<400>70cgccgcacgc gtcgaagcca acga 24<210>71<211>24<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM386<400>71tgtgggctgg tcgttggctt cgac 24<210>72<211>34<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM387<400>72ggtgcctgca gcgtgagttc ctcgacggat ccga34<210>73<211>26<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM388<400>73gaggaactca ccctgcaggc accgct 26<210>74<211>26<212>DNA
<213>人工序列<220>
<223>人工序列的描述寡聚物CM395<400>74cgaacgtcca gccctcgggc atgcgt26<210>75<211>28<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM396<400>75tggcacgcat gcccgagggc tggacgtt 28<210>76<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM397<400>76tttcctgcag gccatgccga cgatcgcgac aggct 35<210>77<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM398<400>77aaacatatgg tcctggcgct gcgcaacggg gaactg 36<210>78<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM399<400>78tttcctgcag gcgatgccga cgatggcgat gggct 35<210>79<211>43<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM400<400>79
aaacctgcag gttccccggc gacgtggact cgccggagtc gtt43<210>80<211>41<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物CM401<400>80ttttctagag cgacgtcgca ggcggcgatg gtcacgcccg t 41<210>81<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B25A<400>81ttctgcagcc gcggccttcg 20<210>82<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B25B<400>82agaattcgcc ggcgccgctg 20<210>83<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B7T1<400>83ggctgcagac gcggctgaag 20<210>84<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B7T2<400>84ccggatccca gagccacgtc 20<210>85<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述寡聚物BP4501<400>85cgtatgcatg gcgccatgga 20<210>86<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BP4502<400>86agccaattgg tgcactccag 20<210>87<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BNHT1<400>87gtcatgcatc agcgcacccg 20<210>88<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BNHT2<400>88gtgcaattgc cctggtagtc 20<210>89<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BTRNAs1<400>89tgtctagact cgcgcgaaca 20<210>90<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BTRNAs2<400>90tgaattccga agggggtggt 20<210>91
<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B5B<400>91aactagtccg cagtggaccg20<210>92<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B5A<400>92tcgatatcct caccgcccgt20<210>93<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B6B<400>93aactagtgtg gcagacggtc20<210>94<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B5A<400>94tcgatatcct caccgcccgt20<210>95<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B6T1<400>95cggatgcatc accggcacgg20<210>96<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B6T2
<400>96tgggatccgc ggggcggtac20<210>97<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BBB<400>97aactagtgcg atcccgggga20<210>98<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BBA<400>98cgtcgatatc ctccaggggc20<210>99<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BBT1<400>99tactgcagca cacccggtgc20<210>100<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BBT2<400>100tgggatccgc tgtgtcatat20<210>101<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BCB<400>101cactagtcct cgccgggcac20<210>102<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述寡聚物BCA<400>102gaggatcccg gtcagcggca 20<210>103<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BCT1<400>103gcctgcagcg acctcgccgg 20<210>104<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物BCT2<400>104cgggatcccg tggcgtggtc 20<210>105<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B23A<400>105atctgcagcg gcatcggtgt 20<210>106<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B23B<400>106agaattctcc actgcggtcg 20<210>107<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B9A<400>107acctgcaggc cgggctcatc 20
<210>108<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B9B<400>108agaattcggg cgagccgccg20<210>109<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B231<400>109atcaagcttc gtgtccatgg20<210>110<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B232<400>110gtcatgcatc aggcgttcgg20<210>111<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B251<400>111cttctagatg aacccctcca20<210>112<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述寡聚物B252<400>112gggcaattgc gcggcagctt20<210>113<211>90<212>PRT<213>小链霉菌Tü4055<400>113Met Leu Gly Phe Tyr Ala Leu Leu Leu Ala Pro Ala Glu Leu Asp Leu
1 5 10 15Leu Phe Val Gln Asp Gly Thr Gln Gly Arg Gly Ile Gly Arg Leu Leu20 25 30Val Asp His Met Lys Arg Arg Ala Arg Ala Ala Gly Leu Asp Arg Val35 40 45Arg Val Val Ser His Pro Pro Ala Glu Gly Phe Tyr Arg Ala Val Gly50 55 60Ala Leu Pro Thr Gly Thr Ala Arg Ala Asn Pro Pro Ala Val Ala Trp65 70 75 80Asp Arg Pro Val Leu Glu Phe Leu Ile Pro85 90
权利要求
1.分离的或重组的核酸分子,其包含(a)如SEQ ID No.1中所示的核苷酸序列;(b)核苷酸序列,其是SEQ ID No.1的互补序列;(c)核苷酸序列,其是SEQ ID No.1的简并序列;(d)核苷酸序列,其在高严格条件下与(a)、(b)或(c)或者从SEQ IDNo.1或者其互补序列衍生的杂交探针杂交;(e)核苷酸序列,其与SEQ ID No.1具有至少80%的序列同一性;(f)上述(a)、(b)、(c)、(d)或(e)的片段,该片段长为至少10个核苷酸。
2.根据权利要求1的核酸,该核酸编码由疏螺旋体素生物合成基因簇的可读框编码的多肽或其结构域,其中所述多肽具有选自SEQ ID No.2到43和113的氨基酸序列,或者与所述氨基酸序列具有至少80%同一性。
3.根据权利要求1或权利要求2的核酸,该核酸包含编码选自AT0和ACP0的PKS结构域的序列,所述结构域分别由SEQ ID No.2的氨基酸322-664和694-763描述。
4.根据权利要求3的核酸,该核酸包含选自SEQ ID No.1的碱基17147-18175和18263-18472的序列。
5.根据权利要求1或权利要求2的核酸,该核酸包含编码选自KS1、AT1、KR1和ACP1的PKS结构域的序列,所述结构域分别由SEQ ID No.3的氨基酸34-459、557-885、1136-1379和1419-1486描述。
6.根据权利要求5的核酸,该核酸包含选自SEQ ID No.1的碱基18974-20251,20543-21529,22280-23011和23129-23332的序列。
7.根据权利要求1或权利要求2的核酸,该核酸包含编码选自KS2、AT2、DH2、KR2、ACP2、KS3、AT3、DH3、KR3和ACP3的PKS结构域的序列,所述结构域分别由SEQ ID No.4的氨基酸34-459、559-887、903-1050、1354-1597、1628-1694、1724-2149、2245-2576、2593-2734、3060-3307和3340-3406描述。
8.根据权利要求7的核酸,该核酸包含选自SEQ ID No.1的碱基23785-25062、25360-26346、26392-26835、27745-28476、28567-28767、28855-30132、30418-31413、31462-31887、32863-33606和33703-33903的序列。
9.根据权利要求1或权利要求2的核酸,该核酸包含编码选自KS4、AT4、KR4和ACP4的PKS结构域的序列,所述结构域分别由SEQ IDNo.5的氨基酸34-459、555-886、1179-1423和1459-1525描述。
10.根据权利要求9的核酸,该核酸包含选自SEQ ID No.1的碱基34284-35561、35847-36842、37719-38453和38559-38759的序列。
11.根据权利要求1或权利要求2的核酸,该核酸包含编码选自KS5、AT5、DH5、ER5、KR5和ACP5的PKS结构域的序列,所述结构域分别由SEQ ID No.6的氨基酸34-457、553-888、905-1046、1401-1690、1696-1942和1975-2041描述。
12.根据权利要求11的核酸,该核酸包含选自SEQ ID No.1的碱基39221-40492、40778-41785、41834-42259、43322-44191、44207-44947和45044-45244的序列。
13.根据权利要求1或权利要求2的核酸,该核酸包含编码选自KS6、AT6、KR6、ACP6和TE的PKS结构域的序列,所述结构域分别由SEQID No.7的氨基酸37-457、555-883、1101-1335、1371-1437和1461-1708描述。
14.根据权利要求13的核酸,该核酸包含选自SEQ ID No.1的碱基45622-46884、47176-48162、48814-49518、49624-49824和49894-50637的序列。
15.根据前述权利要求中任意一项所述的核酸,该核酸包含编码PKS组件的序列,所述组件选自SEQ ID No.2的氨基酸322-763、SEQ ID No.3的34-1486、SEQ ID No.4的34-1694、SEQ ID No.4的1724-3406、SEQ IDNo.5的34-1525、SEQ ID No.6的34-2041和SEQ ID No.7的37-1437或1708。
16.根据权利要求15的核酸,该核酸包含选自SEQ ID No.1的碱基17147-18472、18974-23332、23785-28767、28855-33903、34284-38759、39221-45244、45622-49824或50637的序列。
17.如前述权利要求中任意一项所述的分离的或重组的核酸,其中所述核酸序列选自borA1(SEQ ID NO1的16184-18814)、borA2(SEQ IDNO1的18875-23590)、borA3(SEQ ID NO1的23686-34188)、borA4(SEQ ID NO1的34185-39047)、borA5(SEQ ID NO1的39122-45514)、borA6(SEQ ID NO1的45514-50742)、borB(SEQ ID NO1的互补链的7603-8397)、borC(SEQ ID NO1的互补链的8397-9194)、borD(SEQ ID NO1的互补链的9244-9996)、borE(SEQ ID NO1的互补链的9993-11165)、borF(SEQ ID NO1的互补链的11162-11980)、borG(SEQ ID NO1的互补链的11992-13611)、borH(SEQ ID NO1的互补链的13608-15659)、borI(SEQ ID NO1的50739-52019)、borJ(SEQ IDNO1的52113-53477)、borK(SEQ ID NO1的53486-54466)、borL(SEQID NO1的54506-56176)、borM(SEQ ID NO1的56181-57098)、borN(SEQ ID NO1的57112-57858)、borO(SEQ ID NO1的57939-59966)、orfB1(SEQ ID NO1的2-313)、orfB2(SEQ ID NO1的501-3107)、orfB3(SEQ ID NO1的互补链的3172-3810)、orfB4(SEQ ID NO1的互补链的3935-4924)、orfB5(SEQ ID NO1的5123-5953)、orfB6(SEQID NO1的互补链的5961-6518)、orfB7(SEQ ID NO1的6564-7538)、orfB8(SEQ ID NO1的互补链的60153-60533)、orfB9(SEQ ID NO1的60620-61003)、orfB10(SEQ ID NO1的61188-61436)、orfB11(SEQ IDNO1的61526-61738)、orfB12(SEQ ID NO1的互补链的61767-62285)、orfB13a(SEQ ID NO1的互补链的62750-63067)、orfB13b(SEQ ID NO1的互补链的62586-62858)、orfB14(SEQ ID NO1的互补链的63155-65071)、orfB15(SEQ ID NO1的65374-65871)、orfB16(SEQ ID NO1的互补链的65942-68305)、orfB17(SEQ ID NO1的互补链的68290-68910)、orfB18(SEQ ID NO1的69681-70436)、orfB19(SEQ ID NO1的70445-71848)、orfB20(SEQ ID NO1的71851-72957)、orfB21(SEQ IDNO1的73037-73942)和orfB22(SEQ ID NO1的互补链的73995-74534)。
18.前述权利要求中任意一项所述的核酸序列编码的分离的多肽。
19.修饰亲本聚酮化合物合酶的方法,该方法包括向宿主细胞中导入编码疏螺旋体素聚酮化合物合酶结构域的核酸或者该核酸的衍生物,其中所述宿主细胞含有编码所述亲本聚酮化合物合酶的核酸,从而,当所述导入的核酸或核酸衍生物表达时,所述结构域被掺入所述亲本聚酮化合物合酶。
20.根据权利要求19的方法,其中疏螺旋体素PKS结构域被插入而添加到亲本PKS的天然结构域。
21.根据权利要求19的方法,其中疏螺旋体素PKS结构域被插入而代替亲本PKS的天然结构域。
22.根据权利要求21的方法,其中亲本聚酮化合物合酶的结构域被失活、缺失或改变。
23.根据权利要求19到22任一项的方法,该方法包括向所述宿主细胞导入编码所述疏螺旋体素聚酮化合物合酶组件的核酸或者该核酸的衍生物。
24.根据权利要求23的方法,其中所述组件是包含至少ACP、AT和KS结构域的延伸组件。
25.根据权利要求24的方法,其中所述组件还包含KR结构域。
26.根据权利要求25的方法,其中所述组件还包含DH结构域。
27.根据权利要求26的方法,其中所述组件还包含ER结构域。
28.根据权利要求24到27任一项的方法,其中所述组件还包含TE结构域。
29.修饰亲本疏螺旋体素聚酮化合物合酶的方法,该方法包括向宿主细胞中导入编码供体聚酮化合物合酶的结构域的核酸,其中宿主细胞含有编码所述亲本疏螺旋体素聚酮化合物合酶的核酸,从而,当导入的核酸表达时,其结构域被掺入所述亲本疏螺旋体素聚酮化合物合酶。
30.根据权利要求29的方法,其中供体PKS结构域被插入而添加到亲本疏螺旋体素PKS的天然结构域。
31.根据权利要求29的方法,其中供体PKS结构域被插入而代替亲本疏螺旋体素PKS的天然结构域。
32.根据权利要求29到31任一项的方法,其中供体PKS结构域选自O-甲基转移酶结构域、C-甲基转移酶结构域、表异构化结构域、单加氧酶结构域、脱氢酶结构域、转氨酶结构域或非核糖体肽合成酶结构域。
33.根据权利要求29到32任一项的方法,该方法包括向所述宿主细胞导入编码所述供体聚酮化合物合酶的组件的核酸或者该核酸的衍生物。
34.根据权利要求33的方法,其中所述组件是包含至少ACP、AT和KS结构域的延伸组件。
35.根据权利要求34的方法,其中所述组件还包含KR结构域。
36.根据权利要求35的方法,其中所述组件还包含DH结构域。
37.根据权利要求36的方法,其中所述组件还包含ER结构域。
38.根据权利要求33到37任一项的方法,其中所述组件还包含TE结构域。
39.根据权利要求29到31任一项的方法,其中供体PKS是疏螺旋体素PKS。
40.核酸构建体,其包含至少一个编码疏螺旋体素PKS的至少一个结构域的第一核酸部分并包含编码与所述疏螺旋体素PKS异源的至少一个I型PKS结构域的一个或多个第二核酸部分。
41.权利要求40的构建体,其包含杂化聚酮化合物合酶基因,所述基因编码疏螺旋体素PKS的至少一个结构域和与所述疏螺旋体素PKS异源的至少一个I型PKS结构域。
42.在表达聚酮化合物合酶的宿主细胞中增加宿主细胞产生疏螺旋体素或者疏螺旋体素衍生物或类似物的能力的方法,所述方法包括上调参与所述细胞中疏螺旋体素起始单元产生的疏螺旋体素生物合成基因。
43.根据权利要求42的方法,其中所述基因选自borC、borD、borE、borF、borH、borK、borL、borM和borN。
44.根据权利要求43的方法,其中该基因是borE或borL。
45.根据权利要求42到44任一项的方法,该方法包括向所述细胞导入编码将要被上调的基因的核酸。
46.修饰宿主细胞以增加其产生疏螺旋体素、疏螺旋体素衍生物或类似物的能力的方法,其中所述宿主细胞能够表达疏螺旋体素或所述衍生物或类似物的聚酮化合物合酶,该方法包括缺失、破坏或者失活参与所述细胞中疏螺旋体素起始单元产生的疏螺旋体素生物合成基因,其中所述基因为borG。
47.根据权利要求46的方法,该方法包括发酵所得细胞并喂饲外源羧酸。
48.权利要求47的方法,其中外源羧酸选自反式-环丁烷-1,2-二羧酸、2,3-二甲基琥珀酸、2-甲基琥珀酸和反式-环戊烷-1,2-二羧酸。
49.根据权利要求44到48任一项的方法,其中该方法还包括缺失、修饰或替换一个或多个疏螺旋体素生物合成基因或者疏螺旋体素聚酮化合物合酶结构域或组件。
50.在表达疏螺旋体素或其衍生物的PKS的宿主细胞中产生经修饰的疏螺旋体素聚酮化合物或者其衍生物的方法,该方法包括缺失或失活负责疏螺旋体素的C12位腈官能团形成的基因。
51.权利要求50的方法,该方法包括向所述宿主细胞导入编码一个或多个异源基因的核酸以允许备选地产生任何累积的生物合成中间体或旁路代谢物。
52.载体,其包含如权利要求1到17任一项定义的核酸分子或者如权利要求40或权利要求41定义的构建体。
53.包含权利要求52的载体的宿主细胞。
54.权利要求53的宿主细胞,其中该宿主细胞是放线菌科(Actinomycete)。
55.权利要求53的宿主细胞,其中该宿主细胞是链霉菌科(Streptomycete)。
56.权利要求55的宿主细胞,其中该宿主细胞选自红色糖多孢菌(Saccharopolyspora erythraea)、天蓝色链霉菌(Streptomyces coelicolor)、阿维链霉菌(Streptomyces avermitilis)、灰褐链霉菌(Streptomycesgriseofuscus)、肉桂地链霉菌(Streptomyces cinnamonensis)、灰红小单孢菌(Micromonospora griseorubida)、吸水链霉菌(Streptomyceshygroscopicus)、弗氏链霉菌(Streptomyces fradiae)、黄色长孢链霉菌(Streptomyces longisporoflavus)、Streptomyces lasaliensis、筑波链霉菌(Streptomyces tsukubaensis)、灰色链霉菌(Streptomyces griseus)、委内瑞拉链霉菌(Streptomyces venezuelae)、抗生链霉菌(Streptomycesantibioticus)、变铅青链霉菌(Streptomyces lividans)、龟裂链霉菌(Streptomyces rimosus)和白色链霉菌(Streptomyces albus.)、娄彻氏链霉菌(Streptomyces rochei)ATCC23956、小链霉菌(Streptomycesparvulus)Tü113和小链霉菌Tü4055。
57.合成聚酮化合物的方法,该方法包括培养权利要求53到56任一项的宿主细胞。
58.式I的化合物或者其可药用盐,其中式1 其中R1是多种大小(n=1-2)的环烷基并且被如下所示地取代 其中R1可以任选被一个或多个卤原子或者一个或多个C1到C3烷基取代;R2、R3、R6、R7、R8、R9或R11每个独立地为H、OCH3、CH3或CH2CH3;R4为CN、CO2H、CHO、CH3、CONH2、CHNH;R5,R10为OH;或者与一个或多个酮化物单元的氧化状态中的相应“天然”化合物不同的类似物(即从基团-CO-,-CH(OH)-,=CH-,和-CH2-选择备选基团),条件是所述化合物不是如图1中所示的疏螺旋体素(1)、12-脱腈-12-羧基疏螺旋体素(2)、10-去甲基疏螺旋体素(3)、11-表疏螺旋体素(4)或C14,C15-顺式疏螺旋体素类似物(5)。
59.式2的化合物或其可药用盐,其中式2 R2、R3、R6、R7、R8、R9或R11每个独立地为H、OCH3、CH3或CH2CH3;R4为CN、CO2H、CHO、CH3、CONH2、CHNH;R5,R10为OH;或者与一个或多个酮化物单元的氧化状态中的相应“天然”化合物不同的类似物(即从基团-CO-、-CH(OH)-、=CH-、和-CH2-选择备选基团),R12和R13独立地为H或C1-C4烷基,其可以任选被OH、F、Cl、SH取代),条件是R12和R13不同时为H。
60.根据权利要求58或59的化合物或盐,其中R7、R8和R9都是CH3。
61.根据权利要求58或59的化合物或盐,其中R4是CH3或COOH。
62.根据权利要求60的化合物或盐,其中R4是CH3或COOH。
63.根据权利要求58或59的化合物或盐,其中R4是CN。
64.根据权利要求60的化合物或盐,其中R4是CN。
65.根据权利要求58的化合物或盐,其中R1是环丁烷-1’-羧酸。
66.根据权利要求60的化合物或盐,其中R1是环丁烷-1’-羧酸。
67.根据权利要求66的化合物或盐,其中R4是CH3或COOH。
68.根据权利要求58的化合物或盐,其中R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R1是环戊烷-1’-羧酸或环丁烷-1’-羧酸。
69.根据权利要求59的化合物或盐,其中R12和R13独立地为CH3或H。
70.根据权利要求60的化合物或盐,其中R12和R13独立地为CH3或H。
71.根据权利要求70的化合物或盐,其中R4是CH3或COOH。
72.根据权利要求59的化合物或盐,其中R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R12和R13独立地为CH3或H。
73.根据权利要求59的化合物或盐,其中R6、R7、R8和R9都是CH3,R2和R11是H,R5和R10是OH,R4是CH3、COOH或CN,R12和R13都是CH3。
全文摘要
本发明涉及聚酮化合物的生物合成并且本发明通过克隆编码聚酮化合物合酶和参与聚酮化合物疏螺旋体素合成的其他相关蛋白的核酸而实施。还提供了包括酶系统、核酸、载体和细胞的材料和方法,以制备包括疏螺旋体素和其类似物和衍生物在内的聚酮化合物。还提供了新的聚酮化合物分子。
文档编号C07D313/00GK1732264SQ200380107717
公开日2006年2月8日 申请日期2003年12月24日 优先权日2002年12月27日
发明者J·A·萨拉斯, C·门德斯, C·奥拉诺, C·桑切斯, A·F·布拉尼亚, B·威尔金森, C·J·马丁, S·莫斯, P·F·利德雷, M·奥利尼克 申请人:百奥帝卡技术有限公司, 奥维耶多大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1