诺卡噻唑菌素的生物合成基因簇的制作方法

文档序号:572813阅读:1023来源:国知局

专利名称::诺卡噻唑菌素的生物合成基因簇的制作方法
技术领域
:本发明属于微生物基因资源和基因工程领域,具体涉及硫肽类抗生素诺卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆,序列分析,基因功能研究及其应用。
背景技术
:诺卡噻唑菌素(Nocathiacins)是一类富含元素硫,氨基酸残基被高度修饰的环肽类抗生素,它们作为硫肽家族中十分重要的成员,最初是在筛选对有新青霉素抗性的金黄色葡萄球菌(Methicillin-ResistantS/c[p/^/ococcw51awwiw'MRSA)和有多种耐药性的粪肠球菌(Multi-DrugResistant£"feracoccws/aec^/w,MREF)的生长有抑制作用的抗生素的过程中,从土壤样品中发现的[J.1998,57,715]。1998年,Tokushima研究中心率先从拟无枝酸菌Uw_yco/Wo;w&sp.MJ347-81F4)中分离纯化到了MJ347-81F4-A(NocathiacinI)和B,并完成了它们的发酵、活性测试和结构测定,但没有确定其绝对构型。2003年,Bristol-MyersSquibb药物研究所又从诺卡氏菌(iVocfl^/flsp.WW-12651)中发现了NocathiacinI、II、III,并对其进行了发酵、分离纯化和活性测试,还利用NMR、X-ray等方法首次确定了其绝对构型[J爿油'Wo/..2003,56,226,232;Clough,B.;JOg.CAew.2002,67,8699]。诺卡噻唑菌素与硫肽家族其他抗生素一样也拥有一个以三取代的吡啶为核心,由多个噻唑及脱水氨基酸所构成的环肽中心。其中NocathiacinI在结构上与该家族的另一成员糖硫己糖二酐a极其相似,不同之处在于多了一个2,3-脱氢丙氨酰胺的边链,吲哚酸单元与大环相连部分的酯键替代了原来的硫酯键。研究表明诺卡噻唑菌素可以很好地抑制革兰氏阳性菌的生长,特别是对多种耐药性的条件致病菌具有极强的杀伤作用。其中NocathiacinI对MRSA的MIC值为0.003ng/mL,对有青霉素抗性的肺炎链球菌(penicillin-resistantS/re/^ococow;wet/wo"/fle,PRSP)的MIC值达到0.001ng/mL,比万古霉素高出10-20倍。同时,它还对近期出现的有万古霉素(Vancomycin)抗性的粪肠球菌(vancomycin-resistant五"ferococcf々ecc/w附,VREF)具有良好的抗'性,MIC值为0.015pg/mL。而且与万古霉素相比,诺卡噻唑菌素对感染MRSA的小鼠具有更加显著的疗效,Nocathiacinl、II、IH的PD5o值分别为0.8、0.62、0.89mg/kg,万古霉素在同样条件下仅为1.3mg/kg。Nocathiacinl和n作为硫肽家族抗菌活性最好的两个化合物,在较低pH下还比其他成员具有更好的水溶性,可能是因为分子中含有一个二甲基氨基己糖的缘故[Afec.171-175]。近期发现这类抗生素的作用机制与硫链丝菌肽类似,也是与50S亚基的23SrRNA-Lll蛋白复合物结合,通过阻止或促进L11构象的变化,影响aa-tRNA-Ef-Tu-GTP复合物的识别及延伸因子的GTPase活性,从而抑制细菌体内蛋白质的合成来发挥活性作用的[JJ附.C/ze附.Soc.2OO8,"0,121O2-12110]。目前其具体的构效关系还不是很清楚,但据推测它们相似的环肽中心可能是其具有优越活性的关键结构。诺卡噻唑菌素作为新一代抗感染药物的先导化合物,自发现之日起就引起了科学家们的浓厚兴趣。考虑到它们的溶解度尚未达到静脉注射药剂的要求,不少化学家对其进行了化学半合成改造。Bristol-MyersSquibb药物研究所通过在Nocathiacinl上添加了一些极性水溶性基团,来提高它们的生物利用度如在吡啶环的羟基上或在吲哚酸侧链的氮上烷氧化[Bioorganic&MedicinalChemistryLetters.2004,14,3743-3746];通过Michael加成在2,3-脱氢丙氨酰胺边链上添加氨或硫醇[re/raZ/Wra"2004,5,1059-1063];或者用化学法或酶法去掉2,3-脱氢丙氨酰胺,得到NocathiacinIV,再进一步垸氧化或添加烃基胺[JOg.C/ie/n.2002,67,8789]。但这些方法往往很难在提高水溶性的同时保持原始结构良好的抗菌活性。而这类抗生素的化学结构极其复杂,二十多年来人们只完成了部分模块和酸性水解产物的合成[re/ra/iec/raw2:e".1984,25,2127;/Org.C/ze附.1996,6丄4623;J.Og.丄饥2003,5,4421;r自/^腦1991,32,4263;2005,117,3802-3806;Comm朋.2008,591—593]。直到近几年有机合成大师Moody和Nicolaou等人才完成了启动噻星A、淀硫霉素D、硫链丝菌肽、盐屋霉素A、GE2270A/T的全合成,诺卡噻唑菌素的全合成还没有人报道[J"gew.Oie/n./W.£ca007,46,7930-7954]。并且由于该类抗生素复杂的多环结构,众多的手性中心,使得单纯利用全合成的方法进行改造步骤繁多,实际生产成本过高。而近年来随着基因组学和蛋白质组学的深入研究以及新型生物技术的快速发展,使我们利用微生物作为"细胞工厂",通过遗传控制来大量合成具有良好生物活性和新型作用机制的天然产物及其类似物成为可能。这也为我们在微生物体内获得所需要的新型硫肽类抗生素提供了一条新的思路。因此我们以微生物来源的诺卡噻唑菌素为目标分子,从克隆诺卡噻唑菌素的生物合成基因簇出发,采用微生物学、分子生物学、生物化学以及有机化学相结合的方法来研究其生物合成,阐明其生物合成途径及调节机制,在此基础上运用代谢工程的原理,合理修饰诺卡噻唑菌素的生物合成途径,探索生物利用度更好、并能通过微生物发酵大量生产的新型药物。
发明内容本发明涉及一类由诺卡氏菌产生的具有良好抗菌活性的抗生素一诺卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。本发明中整个基因簇共包含37个基因的核苷酸序列或互补序列(序列1),其中有8个基因woc28,膨20,騰21,膨22,膨23,膨9,woc24和woc30负责NocathiacinI大环骨架的生物合成;4个基因noc25,《oc26,noc27和"oc29负责吲哚酸侧链的生物合成;6个基因"oc6,woc10,wocll,"ocl2,wocl3和"ocl4负责4-N,N-二甲基-2,4,6-脱氧己糖的生物合成;5个细胞色素P450氧化还原酶基因woc7,wocl5,wcl6,膨18,wocl9,负责NocathiacinI的氧化还原后修饰;2个甲基转移酶基因wocS,woc36,分别负责NocathiacinI的甲基化后修饰和自身的抗性;2个抗性基因"oc/7,"oc37;3个调节基因"oc5,woc33,朋c34;4个与转录翻译有关的基因wocl,woc2,朋d,wo";以及3个未知功能的基因woc31,woc32,woc35。本发明还提供了一个编码诺卡噻唑菌素前体肽的核苷酸序列,由序列2中的氨基酸序列组成,命名为"oc28,其基因的核苷酸序列位于序列1中第38432-38581碱基处。本发明还提供了一个编码诺卡噻唑菌素噻唑环形成的环化酶的核苷酸序列,由序列3中的氨基酸序列组成,命名为《oc23,其基因的核苷酸序列位于序列1中第30980-32875碱基处。本发明还提供了一个编码诺卡噻唑菌素噻唑环形成的NADH脱氢酶的核苷酸序列,由序列4中的氨基酸序列组成,命名为朋c22,其基因的核苷酸序列位于序列1中第29544-30767碱基处。本发明还提供了一个编码诺卡噻唑菌素大环骨架形成的脱水酶的核苷酸序列,由序列5中的氨基酸序列组成,命名为朋c21,其基因的核苷酸序列位于序列1中第26965-29523碱基处。本发明还提供了一个编码诺卡噻唑菌素大环骨架形成的脱水酶的核苷酸序列,由序列6中的氨基酸序列组成,命名为朋c20,其基因的核苷酸序列位于序列1中第25968-26960碱基处。本发明还提供了一个编码自由基SAM硫胺合成酶的核苷酸序列,由序列7中的氨基酸序列组成,命名为woc27,其基因的核苷酸序列位于序列1中第36848-37948碱基处。本发明还提供了一个编码酰基-CoA合成酶的核苷酸序列,由序列8中的氨基酸序列组成,命名为"oc25,其基因的核苷酸序列位于序列1中第34680-35912碱基处。本发明还提供了一个编码酰基转移酶的核苷酸序列,由序列9中的氨基酸序列组成,命名为朋c26,其基因的核苷酸序列位于序列1中第35933-36820碱基处。本发明还提供了一个编码SAM依赖的氧化酶或甲基转移酶的核苷酸序列,由序列10中的氨基酸序列组成,命名为"oc29,其基因的核苷酸序列位于序列1中第38714-39976碱基处。本发明还提供了一个编码N-双甲基转移酶的核苷酸序列,由序列11中的氨基酸序列组成,命名为"oc10,其基因的核苷酸序列位于序列1中第149卯-15703碱基处。本发明还提供了一个编码NDP-己糖3位C上的甲基转移酶的核苷酸序列,由序列12中的氨基酸序列组成,命名为"ocll,其基因的核苷酸序列位于序列1中第15728-16972碱基处。本发明还提供了一个编码NDP-己糖-3-酮还原酶的核苷酸序列,由序列13中的氨基酸序列组成,命名为wocl2,其基因的核苷酸序列位于序列1中第16984-17970碱基处。本发明还提供了一个编码dTDP-4-酮-6-脱氧葡萄糖2,3-脱水酶的核苷酸序列,由序列14中的氨基酸序列组成,命名为wocl3,其基因的核苷酸序列位于序列1中第17988-19418碱基处。本发明还提供了一个编码NDP-6-脱氧-D-葡萄糖4位C上的氨基转移酶的核苷酸序列,由序列15中的氨基酸序列组成,命名为朋cl4,其基因的核苷酸序列位于序列1中第19424-20560碱基处。本发明还提供了一个编码糖基转移酶的氨基转移酶的核苷酸序列,由序列16中的氨基酸序列组成,命名为woc6,其基因的核苷酸序列位于序列1中第11505-12683碱基处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列17中的氨基酸序列组成,命名为"oc7,其基因的核苷酸序列位于序列1中第12704-13912碱基处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列18中的氨基酸序列组成,命名为"ocl5,其基因的核苷酸序列位于序列1中第20591-21703碱基处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列19中的氨基酸序列组成,命名为"ocl6,其基因的核苷酸序列位于序列1中第21696-22934碱基处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列20中的氨基酸序列组成,命名为wocl8,其基因的核苷酸序列位于序列1中第23507-24649碱基处。本发明还提供了一个编码细胞色素P450氧化还原酶的核苷酸序列,由序列21中的氨基酸序列组成,命名为"ocl9,其基因的核苷酸序列位于序列1中第24646-25947碱基处。本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列22中的氨基酸序列组成,命名为"oc8,其基因的核苷酸序列位于序列1中第13909-14532碱基处。本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列23中的氨基酸序列组成,命名为"oc36,其基因的核苷酸序列位于序列1中第43983-44768碱基处。本发明还提供了一个编码博来霉素抗性蛋白的核苷酸序列,由序列24中的氨基酸序列组成,命名为"ocl7,其基因的核苷酸序列位于序列1中第22956-23480碱基处。本发明还提供了一个编码磷酸盐ABCtransporter的核苷酸序列,由序列25中的氨基酸序列组成,命名为"oc37,其基因的核苷酸序列位于序列1中第44914-45423碱基处。本发明还提供了一个编码SARP家族的转录调节蛋白的核苷酸序列,由序列26中的氨基酸序列组成,命名为"oc5,其基因的核苷酸序列位于序列1中第10404-11387碱基处。本发明还提供了一个编码热休克蛋白的核苷酸序列,由序列27中的氨基酸序列组成,命名为"oc33,其基因的核苷酸序列位于序列1中第42031-42456碱基处。本发明还提供了一个编码hspl8转录调节因子的核苷酸序列,由序列28中的氨基酸序列组成,命名为"oc34,其基因的核苷酸序列位于序列1中第42565-43173碱基处。本发明还提供了一个编码RNA聚合酶ECF-亚族的信号因子的核苷酸序列,由序列29中的氨基酸序列组成,命名为"oc3,其基因的核苷酸序列位于序列1中第8731-9867碱基处。本发明还提供了一个编码ATP酶的信号因子的核苷酸序列,由序列30中的氨基酸序列组成,命名为"oc4,其基因的核苷酸序列位于序列1中第9968-10387碱基处。本发明还提供了一个编码DGPFAETKE家族蛋白的核苷酸序列,由序列31中的氨基酸序列组成,命名为"oc2,其基因的核苷酸序列位于序列1中第8282-8725碱基处。本发明还提供了一个编码50S核糖体蛋白L18的核苷酸序列,由序列32中的氨基酸序列组成,命名为"ocl,其基因的核苷酸序列位于序列1中第7731-8084碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列33中的氨基酸序列组成,命名为woc9,其基因的核苷酸序列位于序列1中第14529-14984碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列34中的氨基酸序列组成,命名为"oc24,其基因的核苷酸序列位于序列1中第32902-34683碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列35中的氨基酸序列组成,命名为"oc30,其基因的核苷酸序列位于序列1中第40174-40914碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列36中的氨基酸序列组成,命名为"oc31,其基因的核苷酸序列位于序列1中第41001-41408碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列37中的氨基酸序列组成,命名为"oc32,其基因的核苷酸序列位于序列1中第41492-41953碱基处。本发明还提供了一个编码未知功能蛋白的核苷酸序列,由序列38中的氨基酸序列组成,命名为"oc35,其基因的核苷酸序列位于序列1中第43228-43758碱基处。序列1的互补序列可根据DNA碱基互补原则得到。序列l的核苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶消化相应的DNA片段或利用其他合适的技术得到。本发明还提供了获得至少包含部分序列1中DNA片段的重组质粒的途径。本发明还提供了诺卡噻唑菌素生物合成的微生物体途径,至少其中之一的基因包含有序列1中的核苷酸序列。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与诺卡噻唑菌素生物合成基因相似的基因。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从诺卡氏菌iVoc^W/flsp.WW-12651基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有iVocflW/flsp.WW-12651基因组中以前邻近区域未克隆的DNA。本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNAshuffling),或通过紫外线或化学试剂诱变等。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性或产量的代谢产物。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得其生物合成途径,也可以通过插入、置换、缺失或失活进而获得新的生物合成途径。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断诺卡噻唑菌素生物合成的一个或几个步骤而得到新的诺卡噻唑菌素结构类似物。包含DNA片段或基因可以用来提高诺卡噻唑菌素或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。本发明所提供的核苷酸序列编码核糖体机制诺卡噻唑菌素生物合成的前体肽可以通过插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNAshuffling),紫外线或化学试剂诱变等方法来产生新的硫肽类抗生素或其他多肽类代谢产物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成噻唑环、羟化吡啶环、吲哚酸等结构单元,并可以通过与其他天然产物的生物合成途径或部分生物合成途径重组,来获得包含有着这些结构单元并且具有更好生物活性的代谢产物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成诺卡噻唑菌素的大环骨架和其结构类似物。包含本发明所提供的核苷酸序列编码的蛋白可以催化合成4-N,N-二甲基-2,4,6-脱氧己糖,并可以通过与其他天然产物的生物合成途径或部分生物合成途径重组,来获得新的糖基化产物。本发明所提供的诺卡噻唑菌素的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的氧化还原反应也可有其他应用。总之,本发明所提供的包含诺卡噻唑菌素生物合成相关的所有基因和蛋白信息可以帮助人们理解硫肽类抗生素的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。图l:诺卡噻唑菌素的化学结构。图2:诺卡噻唑菌素生物合成基因簇的基因结构和限制性内切酶谱。(A)6个交叠的黏粒代表了诺卡氏菌iVoca^/flsp.WW-12651基因组45kb的DNA区域,S代表限制性内切酶SmaI,实体表示已被DNA测序的部分,黑色粗竖线表示标记的探针部分;(B)诺卡噻唑菌素生物合成基因簇的基因组成。图3:提出的诺卡噻唑菌素大环骨架的生物合成途径。图4:提出的诺卡噻唑菌素吲哚酸侧链的生物合成途径。图5:提出的诺卡噻唑菌素4-N,N-二甲基-2,4,6-脱氧己糖的生物合成途径。图6:iVocaWflsp.WW-12651野生型发酵产物NocathiacinI的高效液相色谱-质谱(HPLC-MS)分析。(A)高效液相色谱;(B)质谱图7:与诺卡噻唑菌素大环骨架生物合成相关的部分基因对诺肽菌素基因簇中相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌S/re/tow,ycesac加o犯sATCC25421野生型发酵产物的HPLC-MS检测(B)诺肽菌素nosE同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素"oc21异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素mwD同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素"oc20异源回补突变株发酵产物的HPLC-MS检测图8:与诺卡噻唑菌素吲哚酸侧链生物合成相关的部分基因对诺肽菌素基因簇中相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌S/re/7to/w;;cMac加(wtwATCC25421野生型发酵产物的HPLC-MS检测(B)诺肽菌素"osI同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素"oc25异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素"cwL同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素朋c27异源回补突变株发酵产物的HPLC-MS检测图9:诺卡噻唑菌素生物合成基因簇中部分P450氧化还原后修饰基因对诺肽菌素基因簇中相似基因同框缺失突变株的异源互补。(A)诺肽菌素产生菌S/re;/o/w;;cMa"twiATCC25421野生型发酵产物的HPLC-MS检测(B)诺肽菌素"o;yC同框缺失突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素"ocl9异源回补突变株发酵产物的HPLC-MS检测(D)诺肽菌素"osB同框缺失突变株发酵产物的HPLC-MS检测(E)诺卡噻唑菌素"oc7异源回补突变株发酵产物的HPLC-MS检测图10:诺卡噻唑菌素生物合成基因簇中部分P450氧化还原后修饰基因在诺肽菌素产生菌S/re/^o/wycesatc加cwmsATCC25421中的异源表达。(A)诺肽菌素产生菌5^印towycesac加omyATCC25421野生型发酵产物的HPLC-MS检测(B)诺卡噻唑菌素"ocl6异源表达突变株发酵产物的HPLC-MS检测(C)诺卡噻唑菌素"ocl8异源表达突变株发酵产物的HPLC-MS检测诺肽菌素结构类似物A的化学结构诺肽菌素结构类似物B的化学结构。符号说明图lNocathiacinI:诺卡噻唑菌素I;NocathiacinII:诺卡噻唑菌素II;NocathiacinIII:诺卡噻唑菌素III;MJ347-81F4-B:诺卡噻唑菌素I的去甲基化产物。图2(A)B3:黏粒pDY2-61-B3,D2:黏粒卩0丫2-61-D2,C2:黏粒pDY2-61-C2,A1:黏粒pDY2-61-A!,C4:黏粒0丫2-61-C4;字母S代表S/mrf限制性酶切位点;(B)suger4-N,N-二甲基-2,4,6-脱氧己糖生物合成基因cyclopeptide诺卡噻唑菌素大环骨架生物合成基因oxidation诺卡噻唑菌素P450氧化还原后修饰基因Indoleacid诺卡噻唑菌素吲哚酸侧链生物合成基因resistance抗性基因regulation调节基因Unknown未知基因。图3Noc20、21、22、23分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基因noc20、21、22、23所编码的蛋白,LP表示诺卡噻唑菌素的信号肽。图4Noc25、26、27、29分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基因noc25、26、27、29所编码的蛋白,Ado.表示自由基。图5Noc6、10、12、13、14分别对应本说明书中描述的诺卡噻唑菌素基因簇中的基因noc6、10、12、13、14所编码的蛋白。图6(A)15min为Nocathiacinl的保留时间(B)1437为NocathiacinI的分子离子峰。具体实施例方式以下结合图1-图6对本发明进一步详细说明。1.诺卡噻唑菌素生物合成基因簇中N,N-二甲基酶基因片段的克隆尽管有关硫肽类抗生素生物合成方面的研究早在上世纪70年代末就已开始,但是迄今为止关于它们在微生物体内代谢途径的研究都未能有效突破。早期的研究者主要完成了硫链丝菌肽(Thiostrepton)、诺肽菌素(Nosiheptide)、硫肽霉素I(sulfomycinl)、GE2270A、A10255G/B/E、诺卡噻唑菌素(Nocathiacins)等的氨基酸前体标记实验(C13、C14、H2、H3、N"等),并由此推测了它们部分主要结构可能的生物合成途径如认为其中的噻唑或噻唑啉环来源于半胱氨酸和丝氨酸;而吲哚酸或喹哪酸结构则是由色氨酸经过多步转化得到的;还认为它们核心结构的氮杂六元环是通过[4+2]环加成反应形成的[j:CAew.1979,/W,5069;1988,110,5800;1993,〃5,7557;1993,7",7992;1995,〃7,7606;1996,77S,11363;历org.MedCTjew.1996,《1135;JJ"riWof.1992,45,1499;2001,5《1066;JC/^/w.Soc.C/ie附.awwm".1993,1612;CAe/M.1993,26,116;rerm/zefifrw72008,49,6265~6268.]。标记实验同样也显示这类抗生素大多具有相似的氨基酸前体,这在一定意义上说明它们在微生物体内可能是采用相似的生物合成途径得到的。而微生物体内典型的聚肽类天然产物的生物合成途径大体上可以分为两类核糖体途径和非核糖体途径。Floss小组曾根据氯霉素抑制实验的结果推测这类抗生素可能是采用非核糖体途径合成的。随后研究者们尝试了大量的方法来克隆这类抗生素的生物合成基因簇,如突变株互补、反向遗传学、抗性基因为探针、编码核糖体途径前体肽的基因片段为探针、非核糖体途径生物合成基因的保守序列为引物、转座子随机中断等方法,但是都没有成功。这就提示我们需要寻找一条全新的途径来克隆这类抗生素的生物合成基因簇。根据糖肽类抗生素的糖基和母体骨架的生物合成基因大都连锁分布在染色体的同一区域上这一特点,本发明人决定从克隆NocathiacinI中脱氧氨基糖的生物合成基因出发,来克隆整个分子的生物合成基因簇。我们首先根据大量微生物来源的天然产物脱氧糖基的生物合成途径[J"rtw/croWa/^gew"Jm/C7ie附o^iera;^,1999,U,1565—1573;C/zew&^j&5zo/ogy,2004,77,959—969;Mo/ecw/arMz'cro6/o/ogy,2000,37,752-762.]推测了NocathiacinI中4-N,N-二甲基-2,4,6-脱氧己糖可能的生物合成途径,并选取可能存在于该途径催化后期的N,N-二甲基转移酶的保守序列,设计了简并性的PCR引物Dimeth-Forl:5'-GCTGACGTCGCCTGCGGSAC(CG)GG(ATCG)(GAT)(ATCG)(ATCG)CA-3和Dimeth陽Rev2:5'-CGCGAACGT(GC)TC(GC)GG(AG)AACCACCA(ATGC)GG(ATGC)TC-3,,然后以iVocanft'asp.WW-12651的总DNA为模板进行PCR扩增,得到约0.3kb的PCR产物,克隆入pSP72载体,经测序分析发现与已知的N,N-二甲基转移酶基因具有很高的同源性。2.诺卡噻唑菌素生物合成基因簇的克隆,序列分析及功能分析将上述克隆到的N,N-二甲基酶基因片段用地高辛标记为探针,对构建好的iVocflW/asp.WW-12651的基因组文库进行筛选,共得到6个插入片段互相重叠的黏粒,分别为cDY446-2-47-A"B3、C2、C4、D2、D4,涵盖了染色体约50kb的DNA区域(图2-A)。选取限制性酶切物理图谱中最左端和最右端的黏粒CDY446-2-47-B3、C2进行亚克隆测序,通过生物信息分析发现,测定的45.560kb的DNA区域,GC含量为73.3%,共包含了44个开放式读码框(openreadingframe,ORF),其中与诺卡噻唑菌素生物合成相关的有37个。各个基因的功能分析见表l。表1诺卡噻唑菌素生物合成基因簇中各基因及编码蛋白的功能分析<table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table>3.诺卡噻唑菌素生物合成基因簇边界确定根据基因编码蛋白的功能分析,我们初步判定诺卡噻唑菌素的生物合成基因簇为从基因"oc7到woc37,共37个开放式读码框。其中1个基因("oc2S)负责编码诺卡噻唑菌素的前体肽,7个基因("oc28,"oc20,woe21,"oc22,woe23,"oc9,"oc24和woc30)负责对"oc2S编码的前体肽进行修饰,形成整个大环骨架;4个基因("oc25,"oc26,膨27和膨29)负责以色氨酸为前体,合成吲哚酸侧链;6个基因("oc6,woclO,"ocll,wocl2,"ocl3和"ocl4)负责4-N,N画二甲基-2,4,6-脱氧己糖的生物合成;5个细胞色素P450氧化还原酶基因(《oc7,wocl5,wocl6,wocl8,wocl9)负责NocathiacinI的氧化还原后修饰;2个甲基转移酶基因("ocS,"od6)分别负责NocathiacinI的甲基化后修饰和自身的抗性;此外还有2个抗性基因(woc/7,"oc37);3个调节基因("oc5,ttoc^,"oc34);4个与转录翻译有关的基因(nocl,"oc2,wc3,wo^);以及3个未知功能的基因(woc31,《oc32,"oc35)。因为o//60-o//为与甲氧基丙二酸生物合成相关的基因,而基因《ocl-"oc3则分别编码50S核糖体L18蛋白、DGPFAETKE家族蛋白及ECF亚家族RNA聚合酶信号因子,这些基因可能与诺卡噻唑菌素前体肽的转录法翻译有关。所以诺卡噻唑菌素生物合成基因簇的右侧边界应该在"9之间。该序列右侧的基因朋c31-37为一些调节基因及抗性基因,我们还不能确定它们与诺卡噻唑菌素生物合成的相关性,所以诺卡噻唑菌素生物合成基因簇的左侧边界还不是很清楚,有待进一步的探究。4.诺卡噻唑菌素大环骨架的生物合成诺卡噻唑菌素的生物合成基因簇中共有8个基因与其大环骨架的生物合成相关。其中mc2S,编码诺卡噻唑菌素的前体肽,其C端结构肽序列SCTTCECSCSCSS与诺卡噻哇菌素大环骨架的氨基酸前体顺序完全吻合,而N端富含疏水氨基酸的信号肽部分,则主要负责前体肽的识别,并介导其在胞内转运的。这也从基因水平上证实了诺卡噻唑菌素的大环骨架应该是按照核糖体机制来合成的。该过程类似于细胞肽和蛋白质的合成,首先在核糖体中经转录翻译逐步形成诺卡噻唑菌素的聚肽链前体。接着该前体从核糖体上水解释放,再由"oc2编码的环化脱水酶催化其中半胱氨酸上的巯基进攻临位丝氨酸上的羰基,形成5元N杂环,接着脱去一分子水,形成噻唑啉。然后由"oc22编码的NADH依赖的氧化还原酶作用脱去一分子氢,将噻唑啉转变为噻唑。接下来在"oc20或"oc"编码的脱水酶的催化下,脱去丝氨酸残基上的羟基,形成2,3-脱氢丙氨酸,进一步通过分子内Diels-Alder反应形成羟化脱氢哌啶六元环。然后再在"oc30编码的未知蛋白及一系列脱水酶和氧化还原酶的作用下经多步反应形成羟化吡啶环肽中心,从而构建了诺卡噻唑菌素中最大的一个环肽结构。整个过程如图3所示。5.甲基吲哚酸结构单元的生物合成甲基吲哚酸结构单元的生物合成途径如图4所示。首先以色氨酸为前体,经woc27编码的radicalS-adenosylmethionine(AdoMet)类型的蛋白的催化发生一系列分子内重排,再水解脱羧形成3-甲基d引哚-2-甲酸结构。接着通过"o"5编码的酰基-CoA合成酶活化刚哚酸的羧基,将其转变成CoA-硫酯键。然后在"oc26编码的酰基转移酶的作用下,形成吲哚酸侧链与诺卡噻唑菌素大环骨架间的硫酯键连接。进一步由"oc29编码的甲基转移酶转移甲硫氨酸上的甲基到吲哚酸4位的碳上,再由基因簇中的氧化还原酶作用在4位碳上上一个羟基,最后在一系列相关酶的作用下实现吲哚酸侧链与大环骨架间的酯键连接。其中吲哚酸4位的甲基化可能发生在侧链与大环骨架硫酯键连接前或者是连接后。6.4-N,N-二甲基-2,4,6-脱氧己糖单元的生物合成诺卡噻唑菌素的生物合成基因簇中共有6个基因与其糖基的生物合成相关。首先一分子磷酸化的D-葡萄糖在dNDP-D-葡萄糖合成酶的作用下被活化,接着由dNDP-D-葡萄糖-4,6-脱水酶催化脱水在4位形成酮基,再由"ocl3编码的2,3-脱水酶作用脱去另一分子水形成3,4-酮-6-脱氧己糖中间体,然后在wocl2编码的3-酮-还原酶的催化下3位被还原成羟基,经3,5异构酶的作用发生差向异构化后,又在"ocll编码的甲基转移酶的作用下在3位上一个甲基,再由wocl4编码的氨基转移酶催化在4位上一个氨基,然后在wclO编码的N,N-二甲基转移酶的作用下在氨基上加两个甲基,最后由woc6编码的糖基转移酶转移该糖基到诺卡噻唑菌素的大环骨架上,整个过程如图5所示。7.诺卡噻唑菌素的后修饰过程诺卡噻唑菌素的生物合成基因簇中共有5个细胞色素P450氧化还原酶基因woc7,wocl5,wocl6,wocl8,wocl9,可能与诺卡噻唑菌素生物合成途径中的一系列氧化还原后修饰相关。其中"oc7和"ocl9分别催化诺卡噻唑菌素吡啶环上的羟化和谷氨酸Y位的羟化,"ocl6和"ocl8分别催化吲哚酸N上的羟化和3位甲基上的羟化。在该基因簇中还存在一个未知蛋白"oc9,可能是负责丝氨酸边链的剪切形成酰胺结构的。8.诺卡噻唑菌素生物合成基因簇的应用在克隆、分析诺卡噻唑菌素生物合成基因簇的基础上,我们还发展了一套快速克隆其他硫肽类抗生素生物合成基因簇的通用方法。如利用其中与噻唑环形成相关的环化脱水酶Noc23的氨基酸保守序列,设计PCR引物克隆了硫链丝菌肽、诺肽菌素、盐屋霉素等的生物合成基因簇,同时还利用与诺卡噻唑菌素大环骨架生物合成相关的基因序列通过基因组扫描的方法克隆了硫代菌素的生物合成基因簇。在此基础上,我们进一步分析比较了这些基因簇和生物合成途径的相似性。如诺卡噻唑菌素与诺肽菌素的生物合成基因簇中一共有15个功能相似的基因(表2),其中包含了8个与大环骨架生物合成相关的基因,4个与吲哚酸侧链合成相关的基因,2个P450氧化还原酶基因以及1个调节基因,并且这些基因的排列顺序和转录方向也基本相似。我们首先通过在诺肽菌素产生菌的体系中对部分功能相似基因的同框缺失初步证实了这些基因与诺肽菌素生物合成的相关性,在此基础上我们又将诺卡噻唑菌素基因簇中的相似基因导入到这些同框缺失突变株中进行异源互补,经发酵和LC-MS检测,恢复产生了诺肽菌素,进一步证实了这些相似基因与大环骨架及吲哚酸侧链合成的相关性。同时我们还通过2个P450氧化还原酶基因"ocl6和"ocl8在诺肽菌素产生菌体系中的异源表达,初步证实了它们可能的功能。表2诺卡噻哇菌素与诺肽菌素生物合成基因簇中功能相似基因的同源性比较<table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table>以下进一步提供实施实例,这些实施实例有助于理解本发明,仅用作说明而不限制本发明的应用范围。实施例l诺卡噻唑菌素产生菌诺卡氏菌iVocflrc^sp.WW-12651总DNA的提取将100[iLMcfl/^fl^7.WW-12651菌丝悬液接种到3mLTSB液体培养基中,30°C,250rpm,振荡培养约36hr,达到对数生长期后期。取3mL接种到50mLTSB中(含5mMMgCl2,0.5。/。甘氨酸),30'C,250rpm,振荡培养约25hr后达到稳定生长期前期,呈乳白色浑浊,并有大量菌丝悬浮物。将菌液于4t:,3500rpm,离心15min收集菌丝,用裂解缓冲液洗涤两次,得到菌丝约2.5mL。向2.5mL菌丝中加入10mL裂解缓冲液(含溶菌酶5mg/mL),涡旋至均一,再加入无色肽酶(Achromopeptidase)至3mg/ml,混匀。37。C水浴30min。加入O.lmL蛋白酶K(20mg/mL,用裂解缓冲液新鲜配制)、lmL10。/。的SDS,混匀后迅速放入70'C水浴,15min,至基本澄清,置冰上冷却。加入2.5mL5M的KAc溶液,冰上冷却15min。加入15mLTris饱和的酚,轻轻混匀,再加入15mL氯仿,轻轻混匀,20000rpm,4°C,离心20min。用破口的枪头将水相吸出置于新的离心管中,加入等体积的氯仿异戊醇=24:l混合液抽提,轻轻混匀,12000rpm,4°C,离心10min。再用破口的枪头将水相吸出置于新的离心管中,加入2倍体积的无水乙醇,混匀,有大团的DNA出现。将其钩出,置于新的离心管中,加入5mL700/0的乙醇洗涤,将液体倾出,用枪吸干。再加入5mLTE溶解(添加无DNase活性的RNaseA至终浓度为50pg/mL),37'C水浴0.5hr。用等体积的饱和酚抽提两次,再用等体积的氯仿异戊醇=24:l的混合液抽提两次,向水相中加入O.l倍体积3M的NaAc溶液,2倍体积的无水乙醇,轻轻混匀,有絮状DNA出现。用700/。乙醇洗漆DNA沉淀,吸出液体。再加lmL无水乙醇洗涤,吸出液体,超净台中吹干,溶于适当体积的TE(pH8.0)中。若难以溶解,可在55'C水浴2hr,最后保存于4'C。实施例2诺卡噻唑菌素产生菌诺卡氏菌sp.WW-12651基因组文库的构建首先通过一系列的稀释实验来确定Sfl"3AI的用量,在此基础上大量酶切得到的DNA片段略大于40kb,脱磷。载体pOJ446先用从两个cos序列中间切开并脱磷,然后再从多克隆位点处用B"附HI切开,获得两条连接臂,与制备好的长约40kb的DNA片段连接过夜。从一80'C取出包装试剂盒(PromegaPackageneExtract)放到冰上,待其恰好融化,立即加入5uL上述连接液,轻弹混匀,注意不要产生气泡,室温(约22'C)放置3hr。加入445uLPhage缓冲液,上下颠倒混匀。再加入25uL氯仿,上下颠倒混匀,使其缓慢划过整个液体以终止反应,用离心机轻甩,使氯仿沉于底部,保存于4'C。将试剂盒所带的Ea^LE392菌种在LB平板上划线接种进行培养。挑单菌落到3mLLB中(添加30^LlM的MgSO4溶液和30nL20。/。的麦芽糖溶液),37°C,250rpm,振荡培养过夜。再转接500pL菌液到50mL的LB中(添加500pL的MgS04溶液和500^20%的麦芽糖溶液),37。C,250rpm,振荡培养至OD6()()=0.6-0.8。取2.5pL包装液,加入97.5pLphage缓冲液和100nL五.Co//LE392(OD600=0.67),轻轻混匀,22。C水浴0.5hr。再加入100^L的LB混匀,37°C,水浴75min,涂布到LB平板上(含Aml00pg/mL),37。C培养过夜,至有菌落长出。平板长有超过50000个克隆,用LB刮下,加入甘油(终浓度18%)和Apramycin(终浓度50ug/ml),按每管200uL分装,于一80'C保存。随机从平板中调取10个克隆,接种于LB培养基中培养,按大肠杆菌质粒的碱法小量制备抽提重组黏粒。/feelll酶切鉴定,并用0.7%的琼脂糖凝胶电泳检测。根据电泳图谱加合各DNA片段的长度,估算每个黏粒插入片段的大小约为35-40kb,并以此计算文库的效价约为30000cfii4igDNA。因为大多数放线菌染色体DNA的大小约为8Mb,对于插入片段为20kb的文库而言,其效价为20005000cfWpgDNA就足以代表整个基因组。根据以上实验,我们建立的文库效价达到30000cfi4igDNA,插入片段约为40kb左右,这表明我们建立的文库具有良好的质量,能够满足文库筛选的需要。实施例3诺卡噻唑菌素产生菌诺卡氏菌A^cflW/flsp.WW-12651的发酵、产物分离纯化与鉴定首先将300nL-80。C冻存的iVocaW!》WW-12651菌丝悬液,接种到25mL的种子培养基中(可溶性淀粉2%、葡萄糖0.5%、N-ZCase0.3%、酵母提取物0.2%、鱼肉提取物0.5%、碳酸钙0.3%),32'C,250rpm培养3天。从中取2mL转接到50mL的发酵培养基中(葡萄糖2%、HY-酵母4121。/。、营养大豆1%),30°C,250rpm培养4-5天。然后将发酵液合并,转移到离心管中,3800rpm,离心15min,弃去菌丝沉淀。上层清液用等体积的乙酸乙酯萃取两次,合并有机相。用无水MgS04或无水Na2S04干燥,过滤,37'C减压浓縮至干。将样品溶于氯仿甲醇=9:1的混合溶剂中,初步用TLC板检测发酵液的提取物中是否有Nocathiacins存在(在长波紫外线下NocathiacinI、II、III会发出黄绿色荧光,TLC展开剂氯仿甲醇甲酸=90:10:0.1),进一步可以用S.ceo//co/orM110进行生物活性检测(Nocathiacins可以抑制S.ceo//co/wM110的生长,形成抑菌圈)。在此基础上将2L发酵液的乙酸乙酯粗提物,溶于氯仿/甲醇的混合溶剂中,100-200目硅胶拌样后,用300-400目的硅胶进行柱层析,洗脱条件己烷/氯仿=1:1,100ml;氯仿100ml;氯仿/甲醇=99:1,100ml;氯仿/甲醇=98:2,300ml;氯仿/甲醇=97:3,200ml;氯仿/甲醇=95:5,300ml;氯仿/甲醇=90:10,200ml。其中在氯仿/甲醇=95:5的组分中,检测到了黄绿色荧光的点。收集该组分,30°C减压浓縮至干,进行HPLC半制备柱分离纯化。检测波长UV=220nm;柱子AgilentZORAXSB-C185pm4.6x250mm,PN880975-902,SNUSCL024998:LNB07051;流动相条件v=lmL/min;A=H20(0.1%TFA);B=CH3CN;时间(min)03625273032B(%)0154070909015收集HPLC保留时间为15min的组分,进行HPLC-MS(ESI)鉴定,为NocathiacinI,对应的[M+H]+分子离子峰为m/z=1437.3。同时我们还用类似方法从iVocflW/flsp.WW-12651的发酵液中分离纯化到了NocathiacinII、III、MJ347-81F4-B等组分,并进行了HPLC-MS(ESI)鉴定,对应的[M+H]+分子离子峰依次为m/z=1421.3、1266.2、1368.3。实施例4PCR克隆诺卡噻唑菌素的生物合成基因PCR体系包含DMSO(8%,v/v),MgCl2(1.5mM),dNTP(0.2mM),兼并性引物(0.2^M),TaqDNA聚合酶(2u)及适量模板iVocarc//asp.WW-12651总DNA。首先95。C,5min,1轮;然后94。C,lmin,63。C,lmin,72°C,lmin,10轮;94°C,lmin,55°C,lmin,72°C,lmin,20轮;最后72。C,10min,1轮。PCR结束后,1.5%琼脂糖电泳检査结果。低熔点胶回收预期大小的DNA片段,与载体pSP72的&oRV消化,CIAP脱磷的2.4kbDNA片段连接,转化大肠杆菌DH5a感受态细胞,涂布在含有适当抗生素的LB平板上,37'C培养至转化子长出。挑取单菌落到液体LB中培养过夜,抽提质粒,5g/II和五coRV双酶切鉴定是否含有预期大小的DNA插入片段。并将插入有预期大小DNA片段的质粒进行测序。实施例5核酸分子杂交l)DIGDNA标记将待标记的DNA用无菌水稀释至总体积15pL,沸水浴中加热变性10分钟,立即置于冰盐浴中冷却。接着加入HexanucleotideMix(lOx)2pL、dNTPLabelingMix2jiL、Klenowenzymelabelinggrade1蚪L,混合均匀后,37。C水浴约16小时。加入0.8nL0.8MEDTA(pH8.0)以终止反应,加入2.5^L4MLiCl,混合均匀,再加入75jiL预冷的无水乙醇沉淀标记后的DNA,置于一80'C沉降40分钟。4°C,12000ipm离心20分钟收集DNA,用预冷的70%乙醇洗涤DNA沉淀,真空干燥后重新溶于5(HiLTE((pH8.0)中。2)DIGDNA探针标记后的质量检测:稀释标记的DNA探针至以下六个梯度,1、10"、10-2、l(T3、IO"4、l(T5。稀释标记的对照DNA分别至以下浓度lpg/mL,100ng/mL,10ng/mL,lng/mL,0.1ng/mL,0.01ng/mL。分别取lpL上述浓度的DNA样品点在杂交用的尼龙膜上,根据7)所述步骤进行显色反应,对比标记的DNA探针和DIG标记的对照DNA的显色强度以决定标记的DNA探针浓度。3)菌落杂交(文库筛选)的膜转移从中取50pL,加450nLLB稀释得到10"的稀释倍数,再倍比稀释得到l(T2、l(T3、IO"4、l(T5、IO"6。从中分别取300pL涂一块规格为15cmxl5cm的LB平板(含阿泊拉霉素50ng/mL)。37'C培养过夜,至有菌落长出。选取合适的稀释比例,使每块平板约1200—1500个克隆。用LB照选定的比例稀释文库,均匀涂布四块平板,37'C培养过夜。根据平板的大小剪取尼龙膜,小心地覆盖于平板表面不要产生气泡,做好位置标记,1分钟后取下尼龙膜置于干燥滤纸上,干燥10分钟直至菌落结合在尼龙膜上。原始的平板置于培养箱中4一5hr,使克隆重新生长作为原平板。将尼龙膜置于变性液(0.25MNaOH,1.5MNaCl)饱和的滤纸上15分钟(不要浸过膜),转移至中和液(1.0MTris.HCl,1.5MNaCl,pH7.5)饱和的滤纸上5分钟。转移至2xSSC(20xSSC储备液(L"):NaCl,175.3g,柠檬酸钠,88.2g,pH=7.0)饱和的滤纸上自然风干。取下尼龙膜置于烘箱中,120'C固定45分钟。常温下于3xSSC/0.1%SDS溶液中振荡洗涤3小时,以除去细胞碎片。4)Southem杂交的膜转移DNA样品在适当浓度的琼脂糖凝胶上电泳至适当距离,做好标记。浸泡于400mL0.25M的HC1中脱嘌呤20min,使溴酚蓝变黄,用去离子水洗数次。室温下浸入碱性缓冲液中(NaOH0.5M、NaCl1M)15min,并轻轻振荡。更换碱性缓冲液后继续浸泡凝胶20min,并轻轻振荡,用去离子水洗三次。取一张每边都比凝胶大lmm的尼龙膜,用去离子水完全浸湿,做好标记。采用向上毛细管转移方法,用10xSSC的转移缓冲液转移8-24hr。用2xSSC略微洗膜,120'C烘烤30min。5)预杂交和杂交预热杂交液(20mL/100cm2)至杂交温度68'C,放入杂交尼龙膜,轻轻振荡并保温30分钟。将DIG标记的DNA探针在沸水浴中变性5分钟,立即置于冰盐浴中冷却。冷却后,将DNA探针与合适体积的DIG杂交液(2.5mL/100cm"混合均匀。去除预杂交液并立即把DNA探针/DIG杂交液加入,轻轻振荡保持杂交温度64'C或68'C约16小时。6)杂交后严紧洗脱室温下用2xSSC/0.1%SDS漂洗两次,每次5分钟。68'C,用0.1xSSC/0.1%SDS振荡漂洗两次,每次15分钟。7)显色反应和检测严紧洗脱后的尼龙膜在洗涤缓冲液(0.1M马来酸,0.15MNaCl,pH=7.5,0.3%(v/v)Tween20)中平衡1-5分钟,接着在封闭缓冲液(封闭试剂以10%的浓度溶于0.1M马来酸,0.15MNaCl,pH=7.5)中封闭30分钟,然后在抗体中浸泡30分钟。用洗涤缓冲液漂洗尼龙膜两次后,用检测缓冲液(0.1MTris-HCl,0.1MNaCl,pH=9.5)中平衡2-5分钟,最后将尼龙膜置于10mL新配制的显色溶液中[NBT(nitrobluetetrazoli鹏chloride)溶于70%DMF,浓度为70mg/mL,BCIP(5-bromo-4-chloro-3-indolyl-phosphate)溶于水,浓度为50mg/mL。用时lOmL显色溶液中加45pLNBT,35nLBCIP],置于黑暗中显色。显色合适后用去离子水漂洗以终止反应。实施例6异源互补突变菌株的获得及发酵产物分析首先在诺肽菌素产生菌S^ptom少c"ac加cm^ATCC25421的体系中构建目标基因同框缺失的突变株。所用载体为含温敏型复制子的质粒pKC1139,将构建好的用于同框缺失的质粒,通过五.co/z'S17-l和5^epto7wycesfl"twiATCC25421属间接合转移的方法(见下)导入到诺肽菌素的产生菌中,3CTC培养4-5天,筛选具有Am抗性的接合子。然后将获得的接合子接种到TSB液体培养基(阿泊拉霉素50pg/ml)中30。C振荡培养2-3天。再涂布于含有阿泊拉霉素100pg/ml的MS平板上,在42'C整合使之发生单交换。将获得的单交换突变株在30'C进行10—20轮的松弛培养(不加阿泊拉霉素),再通过抗性筛选得到对阿泊拉霉素敏感的突变株。抽提总DNA,进行PCR筛选,获得发生双交换的突变株。并对获得的双交换突变株进行PCR测序在基因型上加以验证,确实发生了同框缺失,并且内部基因无突变。然后通过发酵和LC-MS检测,在表型上加以验证,不再产生诺肽菌素,就得到了目标基因同框缺失的突变株。在此基础上,将诺卡噻唑菌素生物合成基因簇中功能相似的基因和来自于pLL6212的红霉素启动子ErmE+克隆到整合型载体pSET152的相应位点中,得到用于异源互补的质粒。将构建好的用于异源互补的质粒通过属间接合转移的方法导入到诺肽菌素相应基因同框缺失的突变株中,经阿泊拉霉素抗性筛选,得到异源互补突变株。所得的突变株在基因型上进行验证后,进行发酵和LC-MS检测,恢复产生了诺肽菌素,说明这些基因的功能是一致的。S17-l和诺肽菌素产生菌S/reptomycejac加o幼sATCC25421及同框缺失突变株属间接合转移的方法如下从含有适当质粒的大肠杆菌培养平板上挑取单菌落接种到试管中培养过夜,吸取200-300^1菌液转接到20mlLB中,置于37'C摇床中培养至00600为0.3-0.4。将菌液离心沉淀,用等体积的LB洗涤两次,然后用2ml的LB重悬,作为大肠杆菌供体细胞。取50pl冻存于一80'C、20%甘油保存的S/re/7tomycesflc加tmwATCC25421或同框缺失突变株的孢子悬液(2-3xl(^个/ml),用H20稀释10倍至50(Hd,然后用等体积的TES缓冲液(0.05M,pH8.0)洗涤两次,重悬于等体积的TES缓冲液中,50。C热激10min使孢子萌发。然后加入等体积的TSB培养基,37'C温浴3—4小时,离心重悬于500^1LB中作为链霉菌受体细胞。将不同浓度的受体细胞10(HiL与等体积的供体细胞混合,直接涂布在含有10mMMgCl2的IWL—4(SolubleStarch10g/L,K2HP04lg/L,MgS04lg/L,NaCllg/L,(NH4)S042g/L,CaC032g/L,Yeastextract0.5g/L,tryptonelg/L,FeS04.7H200.001g/L,MnCl2.7H200.001g/L,ZnS04.7H200.001g/L,agarpowder20g/L,pH=7.2)或AS—l(Yeastextractlg/L,L-alanine0.2g/L,L-arginine0.5g/L,SolubleStarch5g/L,NaC12.5g/L,Na2SO410g/L,agarpowder20g/L,pH=7.5)平板上,30'C培养12-16个小时。用无菌水轻轻洗涤平板表面以洗去大部分大肠杆菌,然后在每一平板的表面覆盖lmL含萘啶酮酸(终浓度为50ng4iL)和相应抗生素的无菌水。30'C培养5天以上挑取接合子。诺肽菌素产生菌S/r印to/^cesflc加(w^ATCC25421及突变株的发酵和发酵产物的分析鉴定方法取lOOulS/reptowycMac加tw^ATCC25421或突变株的孢子悬液接种到装有50ml种子培养基(Sucrose20g/L,cornsteepliquor30ml/L,peptone5g/L,CaCO35g/L;PH7.0)的250ml锥瓶中,30。C,270rpm培养24-48小时,转接10ml菌丝悬液到装有50ml发酵培养基(Glucose30g/L,Cottonmeal10g/L,NaCl3g/L,2xtraceelement5ml/L,CaC033g/L;PH7.0)的锥形瓶中,28。C,270rpm培养96-120小时。发酵好的菌液离心,弃去上清,向菌丝沉淀中加入适当体积的THF,搅拌30min,抽滤,去除固体沉淀,收集有机相,旋干得固体粉末,溶于适当体积的THF中。取20nl进行HPLC-MS检观!l,检测波长UV=220nm;柱子AgilentZORAXSB-C185拜4.6x250mm,PN880975-902,SNUSCL024998,LNB07051;流动相条件v=lmL/min;A=H20(含0.1%HCOOH);B=CH3CN(含0.1%HCOOH);时间(min)0361219222830B(%)015404055858515实施例7异源表达突变菌株的获得及发酵产物分析将诺卡噻唑菌素生物合成基因簇中的目标基因和来自于pLL6212的红霉素启动子ErmEt克隆到整合型载体pSET152的相应位点中,得到用于异源表达的质粒。将构建好的质粒通过实施例6中属间接合转移的方法导入到诺肽菌素的产生菌S/r印to/^cMfl"wcmwATCC25421中,经阿泊拉霉素抗性筛选,得到异源表达突变株。通过基因型验证正确后,再参照实施例6中的发酵和检测方法进行表型上的分析,通过LC-MS检测新产生的诺肽菌素的结构类^l物来推测目标基因的功能。以下根据本
发明内容提供的基因和蛋白序列氨基酸/核苷酸序列表SEQUENCELISTING<110>中国科学院上海有机化学研究所<120>诺卡噻唑菌素(Nocathiacins)的生物合成基因簇<130>说明书、权利要求书<160>1<170>Patentlnversion3.3<210>1<211>45560<212>DNA<213>诺卡氏菌iVocar&asp.WW-12651<400>1GCTGCAGCGGCCGCACTAGTGGATCCCGAAACCGGACACCGCGGCGCGTCTCGGCCTGCC60CAGCTCCGGCCACGGCCGAGCCTCGGTCAGCAGCGACACCGCGCCCGCCGACCAGTCCAC120CGCCTGCGATGGCGCGTCGACATGCAGGGTCTTGGGCATGACCCCGTTGCGCAGGGCCAT180CACCAGCTTGATGACGCCGCCCACGCCTGCGGCGGCCTGCGTGTGGCCGACGTTGGACTT240GMCGAGCCCAGCCGCAGCGGCTCCTCGCGTTCCTGGCCGTAGGCGGCCAGCAGTGCCTG300CGCTTCGATCGGGTCGCCGAGCCTGGTGCCAGTGCCGTGCGCGTCCACCAGGTCCACTTC360GGATGGCGAGAGTCCGGCGTCGGCCAGCGCCTGGCGGATGACCCGCTGCTGTGACGGGCC420GTTGGGGGCGGTGAGCCCGTTGGACGCGCCGTCGGAGTTCACCGCGGAGCCGCGCACGAC480GGCCAGCACCGGGTGCCCGTTGGCGAGCGCGTCGGAGAGCCGTTCCAGGACGACGAACCC540GGCCCCCTCCGACCAGCCCGTGCCGTCGGCCGCAGCGGCGMCGCCTTGCACCGGCCGTC600GGCGGACAGGCCACGCTGGCGGGAGAACTCGATGMCGTGTCCGGCGTCGGCATGACGGT660GGCCCCGCCCGCCAGCGCCAGCCCGCATTCGCCGCGGCGCAGCGCCTGCACGGCCAGGTG720CACGGCGACCAGCGACGACGAGCAGGCCGTGTCGACCGTCATCGACGGCCCTTCGAGGCC780CAGGGTGTAGGAGACCCGGCCGGAGGCGACGCTGGCCGCGCCACCGGTCACCCCGAAGCC840CTCACCGCCCTGCTCGTCCGCGCCGAGCCCGTAGCGCTGGCCGCGGTGGCCCATCAGCCC900GGCGTAGACGCCGGTCGCGGTTCCCCTGAGCGAGCGCGGATCGATCCCGGAGCGCTCCAG960CGACTCCCACGCGGTCTCCAGCAGCAGCCGCTGCTGCGGGTCCATCGCCAGGGCCTCGCG簡CGGGGAGACCCCGAAGMGCCCGCGTCGMCCCGGGGGCGTCGTGCAGGAAGCCCCCGCC1080GCGGGCGTAGTAGCGGCCGGGCAGTCCGGGTTCGGGGTCGAAAAGGCCGTCGACATCCCA1140GCCGCGGTCGCGCGGGAACTCCCCGATCGCGTCCCCGCCGGAGGCGACGAGCTCCCACAG1200CTGCTCCGGCGTGCCGACGCCACCGGGGAACCGGCAGGCCATGCCGACGATCGCMTGGG1260CGCTCCCTGCACATCGCGCAGCTTGTCGCGCGCCTCCTGCAGCTCGGAGACCGCGCGCCG1320GAGGTAGTCCCGGAGCTTGCCCTCGTTCTCCATCGTGTCGCMCCCCCTGCTGACCGGTG1380ACAGGCGCCAATGGCCMTCCMCCGGGGCAGCAGGCGGTGCGGCGGTGCTGCGGMCCA1440ATTCCGGACCGGGAAACTGGTCTCCCGTCAAGGGCGGGGAGACCGGTCACCGCGGATATG1500ATGCTCGGGCTGAGGTCAGGAGACCCGGGTCGCGGCGGCCGGGGTCGGGAACCCCTCGGG1560CAGGTCGTCCAGGGTCATCGTGGTGATGTGCGGTCTGCCCGCGCCCCATTCGGGCCTGCG1620CAGGMCAGGCCGGGGTCGGCGGCGGCCACCACCAGCAGCGGTGCGGTCGCAGGCGGGTC1680GAGCAGCTCCTCGACGMGTCGAGCATGGCGTCGTCGGCCAGGTGCAGGTCGTCAGCGAG1740CACCACGAGCGGGCGGGGCGCGGCCAGCCCGGCCACGACCGTCCACCAGTCGGCCACCAC1800CGACTCCTCGGTGTGGCAGGTCGMTCCGGCTCGACGMCGCGCGCAGCCGGGACAGCAC1860GCCCGCGGCGGTGCGGCGGTCGCCCACCACGCCGCGCACCGCACGGTGCAGCTTGTCCCT1920GGCCACGTCGCGGCTGTCCTCGCCGCCGACCCCGCAGCAGGCGAACAGGATCTCCCCGCG1980CAGCCGCGCCGTGGTCGCGAGCACGCGGCCGGTCAGCCTCGGGCCGATCGCCGCGATCCG2040GCTCGCACGCCGTTCAAAAGCCGAGAGCAGCCACGACTTGCCCATCCCCGGGCCACCGAG2100CACCGACACCAGGTGCGGTCGTCCCCGGCTGCGGACGCGTTCCAGMCGCTGTCCAGCAC2160GTCGAGTTCCGGCCTGCGGTCCACCGCCACCATCCTCGGGTGGATGCCCGCCCCGATCAG2220CTCGCGGGTGCGTTCGCAGACGGCGATCTCGTTGGTGTCGGCGGCCAGCACCAACGTCTC2280GGACTCCACCAGCAGCGCGCCGCCGATGTCGAGGGCGTCGGTCACGTCCGCGGGCGGCTC2340CCCGGTGACCACGGCCACCCGCAGCACGTGCCGGGCGTGGTGCGGGGACGCCGAGMGCA2400GAGCCGGTCGCGCAGGGCGACGGCGGCGCGCACCGCGCGCTCAGCGCAGCTCGCACGGTC2460GGGTTCGTCCCGGAAGACAGCCAGCGACATGGTTCCCATCGACTGGGTGAGGGTGCCGCC2520GMCAGCGTCACCTCCTCCGCGACCGCGGCGATGACGTCAGCGAGCACACCGTCGACGGC2580CGACCGCGCGCTTGGCCCGACCTCCACCCCGATGAGGATCGCGCTGACCCTGCCGGGCCG2640CTGCGGCCTCGGGGCCAGCCGAACCGGCGCCGTGTCCGACGCAGGCGCCTCGTCCMCGG2700CCGCGGGCCGAGGACCAGCGCCGGGTCGTGGGCGAGGATCGCGTGCTGCAACACCCGCAG2760GTCCCGCCCTGGCTCCAGGCCGAGCGTGCCGACCAGGGCCGAGCGCACCCGCTGGTAGAC2820GGCGAGCGCGTCGGCCTGCCTGCCGCTGCGGTAGAGCGCGAGCATGAGCTGGCGGCCGAG2880CCGTTCGCGCAGCGGTTCCGACTCGGCGACCCTGCCGTTCGCCAGTTCCGCCTCGMGTACACCGCGGTCAGCTCGGCCCAGTCGTAGCCGCGCCACAGGGCCAGCGCGGAGCGCAGGATGAGTTCGGCCCTGCCCTGCTCGGCGAGCTGCTCCATGCGCAGCACGTACCCGGGCGACTGTCCGGCGMCACGACACGCAGCCCGCGCACCGGCGCGTTGTCCTCGCCCCACAGCCCGTCGACATGCMCAAAAGCATCCCGAGCGTGGCTTGGCCGCCGCCATCGGCCTCCAGCGGGCCGCTCACGTCGCCGTGCCCCCGCACGCGGCCGCGCTTCACCACCGGTGTGCGGTTCGGGCGGGGGCGACGGGACCMGTGCAGGTATTCGACGCTCGTGTCAAACCCGGTCAGGCAGCCGCAGGCGACCTCCATCATCCGGTTGCGGTCGGCGGCGCCAGCGGCCTGATCGGTGAGCCAGCCGACCCGGCACGAGGTGGCCAGCAGCTTCAGCATGACCCCGACCGCGCCGTGCGGGCCGACGTGGCGCGGGTCGGAGACGAGCGCGCGCACGTTCATCTGGCTGGTGCGAAGGGTCAGCTCCGTCCCGATGCGCATGACCAAGTCCAGCGGCTCCTCGCGCTCTGCGTCGCGGCGGAAGCCGTCGACGGTCACCACCGCAGGGCTG嫩TTCGCGTCGMGCAGCGCACCTCGGGCAGGTGGTCGTCGATGAACGCMTGGTCTTCAGCGCCGAGTTCGATTTGGCGCCCCAGTGGATGCGCCGCTCCAGCATGGCCCACGCGTGGTCGTTGCCGCGCGCATCCAGTTCCACGATGGTCTCGTCCTCCAGCAGGGTGCCTCGCCACAGCGCGACAGGGTGGTCGGACATGATCGTCTCCCGGCGGTCAGCTCGGCCAGCACGGCGAGATG2940GTCCTCCATGACGTCGAGCCGCAGGTCCTG3000GTCCTCCACCAGGTCGGCGAGGGCGGGACC3060CTTGGCGGCGGTCTTCGTGTGGCCCTCGGC3120CTGGAACTGGMCAGGTCGACCCGTTCCGG3180GGTCMCAGCCTCGGCGAGCCTCCGTGGTT3240CGCGTTCTGCAGCACCTTGCGTGCCGTCGG3300CAGCAGCGCGCTCGTGGGAACGGCTTTGTT3360GCGCTGGCGGCTGCCGCCGAGCTGMCCGG3420MGAACCCGAAAATGCATTCGTCCCCCCGC3480CGCGCTGTCAGGCTGAGGACCACTCGACAG3540CGMCACCGTCATCGTGGTCGGCGCCGCCT3600TCTCCACCCCTACTGTGCCGGCATCCGCAC3660AGTCCGCCTGCTCGMGCCCGCGMTCGGT3720TCCTGCGGMGTCCGCCACAAGGTGGGCCC3780GCAGCAGCACGGTGCCCGCGCCGMGGAGA3840GCCGCCACGCCGCGTCGCCGCGCTCGACGA3900ACCGGTCGGTGAGCGAGATCACCMCACGT3960GGTCGGCGTCCGMTAGTGGATTCCGGTGG4020CCTCGACCCTGGACAGGTCCTCCTCACGGG4080TGCGCAGAAAGTCCTCGTCCGCGCCCGCGT4140CCGCCTGGTACATCTCGCGGCGCCTGCGCG4200CGGGCATATGCGGCAACTGTTCGGCCTGCG4260GGTGGGCCACCTCGGCGCGCTCGGTCGGCA4320CGMGTTCAGCTCCGCGGCGATCTCGCGCA4380GCGGCAGCACGAAGTACTCAGCCACGCCCA4440GGTCGTTGCGGCTGGCCACCGATTGCAGGA4500TGCGCACGGCATCGCTGAGGCGGACCTCGC4560TGTTGTCCAGGTCCCAGACCAGGCACTTCA4620CCGATCAGGGGGCAGCGGCTTCGGCCAGGA4680TCAGCTGGCTGATCTCGGTGCTGCCCTCGACGCGCGCCACCACGTGCCCGTCCGCCGCGCCAGCACCGCGCGCCGCACCGCCCGAGGCGAGCCGCGGCGATCGCTCGTCCCATGCGGCACGCTCGGCGGCGTACAGCTCGGCCACGTGCCTGCCGMCTGGACGCGGGAGCCCGCGTGCTTTCCGACGCAGCCCCAGGCGACCGACAGCCTGGTGACCGGCTGGCCCGCGGCGGCCAGCAGGGTCACCGTGGCGTGGCCCGCCGCCCGACGCACGCCGGGGGCATCGGCGGGAACCACGAAGACGACMCCAGGTCGGCGTAGCAGGCCGCGACGTCGTCGCCGTCCTGGCGAATCGTCGCCGGCTCGCTGAAGGCGACCGCCGCCAGCGCCCGCTGGACGCGGTCGCCGAGGCGCTGGATGACGCTGCGCAGCGAGCTGCACAGGGCCCCACCGGACAGGTCGAGACCGCCGTGCTCGGCACCCAGCCCGCGCAGCACGTCGACCGGGACGTCGCCCACCGTCTCGGTGACGAGCGCGGAGCCGGGTCACCAGCGCGCTCATCGCGCGCGGTCCCTCGACGGCGATGTCGMCGCGCCCAGCGACGACACCACGCCGGAGGCGMCAAGTTGGCGGTCAGGMCTCCACCAGCTGCTCCCTTCCTCCGCTCAGATCGGGTTCTTGCGGGGGCACAGCTCGACCCGGTCATCGGCGCGCATGTCGGCGTCCTGGGCGTCCGGGTCTACGACCGCGAGACCGCCCGGCCGCAGGTGMGCACCTTGTCCGCGTCGATGAAGACGAGGTCGACCGCCGCCGTCCGCGCCCCGTCCCCGACCCGCTCCCAGTAGCGCCGGGCGATCCTGGTCCGTCCGCCTGGCGGGAGGGCACGGGCCATGCTGATCTCCATGAGTTTGGCGTCGCGGTAGG4740CCGCCGAGGCGAGCACCTGCACCGCCGAGG4800CGTGCTTGGCCAGCACCGCGGCGATCGCCT4860TGGCCTCGGCGCAGGTGTAGGTGGCCGAGC4920GGGCCACGAGCTGGTGCTCCAGCAGCCGCG4980CGACCGCCGCGCGCAGGCACGCGCGCAGM5040GCCCGTAGGTCAGGGCGATGGTGGTCAACA5100CGGCGTCTGCTGGCAGCCGCACGCTGTCGA5160AGCCCATCGGCTCGGGCACGCGGTCGATCC5220CCGCGGCGGCGCCGTTTCCGTAGCGGCCGA5280CGGTGATCCAGGTCTTCACCCCGTCGACGA5340TGGCCATCGCGGCCAGGTCGCTGCCCGCCC5400ACCCGCCGGTCAGCGCGGCCAGGTGCGTGG5460TCGTCCAGGCCGCCATGCCCTGCGAGGTCA5520CGGTGTGCGCGGTCAGCTCCCCGTTGTCCA5580CGGCGACCTCGGCGCACAGCAGGCCCTTGG5640TCTCACCCGCGACGTCCCACTCCCCCGCCG5700CCAGGTCAGACACCGGAGGGCTCCACGCGC5760ACCGTCCGGAAGTTGTCCAGCGCCAGGTCC5820TCCACGMCACGACCAGCTCCATCGTGMC5880TCGACGTCGGGTTCCCACACCACCTTGGTC5940TCGATCGCGTACGTCGTCAGGGACGTCATG6000CCAGGGTGATCCCGTCGGCCATCGGCAGCA6060GCGCGGCGTTGAGCCCGCGGATCGCGGTCG6120CGCGGCCGMGAACAGGGTGTTGTCCAGCA6180GCGCTTGCTCGTAGTAGGTCGGGTACCCGG6240ACGACCCCGGACCACGCTCGTCGAGCAGAT6300GCAGGACCACCCGGTCCGCCACCCCGGCGC6360AGCGCTCGCTGATGTCGCAGGTCACCACTC6420ACAGCGTGCCGTAGCCGGTGAACGTGCCCA6480GTTCCAGCACTTCCCGCGCGCCGGTCAGCCCGACCAGCATGGCCAGCAGCTGGCCCTGCT6540CTGGCATGGTGACCATCGCCGCCAGCGCGGGCATCGCCTCGGTCTCGGCGCGCAGGTCGC6600GCAGCAGGTCGTCCTCGCGGACGGACACCGCGCGCACGTACTCCACGAGGTCGTCGGTGA6660GCTGGACCTGACCCGCCATCAGAGGGCCCCGTACTCGTAGAACCCGCGCCCGGTCTTGCG6720GCCGTGGTGGCCGTCGGCGACCTTGCGCAGCAGCAGCCCGCTCGGCTTGCAGCCCTCGTC6780CCCGGTCCGCTCGTAGAGCACCCGCAAGGAGTCGACGAGGTTGTCGATGCCGATGAGGTC6840GGCGGTCTTCAGCGGACCGGTGCGGTGGCCGATGCAGTGCTCCATCAGCGCGTCCACGTC6900CTCGACGCTGGCCCTGCCCTCCTCGACCACCCTGGCCGCGTCGTTGATCATCCGGTGCAG6960GACCCGGCTGGTGACGAAGCCAGGGCCGTCGTTGACCACGATCGCCTTGCGTCCCAGCCG7020CTCCAGCAGCGCGCGCACGGCGACCATCGCCGCGTCCCCGGTGCGCGGTCCGCGCACGAC7080CTCCAGCGTCCCGATCAGGTACGGCGGGTTCATGAAGTGCACCCCGACCAGGMCTCCGG7140CCTCGGCACGTGCCCGGCCAGCTCGTCGACCGGGATGGAGGAGGTGTTGGTGATGCGCAG7200CGCATCCGGGGCGACGACGGCGGCGATCTCGTTCTGTGCCTTGACCTTCAGCTCGGCTGT7260CTCGGTGATCGCCTCGACGACGACCCCCGCGCCCGCCGCCGCGTCGACCGAGTCGGCGAG7320GTCCAGGTCGCCGATCGGGCCGTGTCGGGGGAGCGCGCCGAGGACGTGGGCCAAACGCAG7380CTCGTGCCGCACCCGCTTGCGCGCGGTGGCCAGCCGCTCCTCATCGACGTCCACCAGGGT7440CACCTGGACGCCGCGGCCGATCGCMGAGCGGTGATCCCCACCCCCATCACTCCGGCGCC7500GAGCACCGCGAGCCGGTCGGTCATGCTTCCCCCTCGGATGCGTGGTGTGCCCGGTCAAAT7560GAACACCACGCGGCGCGGGCGGCGAGTGCGCCTGCGCACCAAATCGGGCCTCGGGTTCTA7620GCCCCCGGTTCCAGTACCGCCCGCCGCGGGCCGACCTACCCTGCGAGCACACCGCGAGTG7680AGGAGCGCCATGCCAGACATCGATCCGGCACACTTCCGGCGGACCCTCGGCTACCTCCCC7740ACCGGCGTCACCATCGTCACTTCCACCGACGCGCGCGGTCTGCCGGTGGGCTTGGCCTGC7800MCTCGATCACGTCGGTGTCCCTCGACCCGCCCCTGGTGCTGGTGTGCGCGGCCMGTCG7860TCGTCCACCTGGCCCACCATCCGGCGGAGCGGCACGTTCACCGTCAACGTCCTCGACCGC7920GCGGGGGAACGGATCTGCCGCCGCTTCGCCGCCCGCGGCGTCGACCGCTTCGCCGGMCT7980CCCTGGACCCCGGCCCCCACCGGCCCCGAGCTGGACGAGGCCCTGGCCTGGATCTCCTGC8040GTCATCCACGCCGMCACGACGCGGGCGACCACGTGATCGTCATCGGCCGGGTCACCCGC8100CTCCTGCACTCGCCCCTCTCCGGCCCGCCGCTGGTCTTCCATCGCGGACGCTACGGCTCC8160TTCGCCCAGTCCGCCGTCGTCCCGGTGCCCGGCCTCATCTGACCGAGCGCCGCGAAGAAA8220TCTTGGACGGCGATGTCGAGMCCGGGGGCCTGCTCCGTCCTCGGGGTGACTGCGGCCAG8280AATGGGCCGCACCAGCACGAGGAGMCCACGATGGCCAAGTACCTGCTGCTCAAGCACTA8340CCGGGGCGCCCCGGCCGCCGCCAACGACGTGCCGATGGACCAGTGGACCCCGGAGGAGAT8400CACGGCGCACGTGCAGTACATGCGCGACTTCGCGGCCCGGCTGGAGGAGAGCGGCGAGTA8460CGTCGACGGCCAGGCGCTCGCCCCGGAGGGGATGTTCGTCCGCTACGACGGCGAGGGGCG8520TCCGCCGGTCACCGACGGCCCGTTCGCCGAGACCMGGACCTCATCGCGGGCTGGATGGT8580GATCGACGTCGACAGCCAGGACCGCGCCGTCGAGCTGGCCGGGGAGCTGTCGGCCGCGCC8640GGGGGCAGGCGGGMGCCGATCCACGAGTGGCTGGAGCTGCGCCCGTTCCTCGCCGCCCC8700GCCCACCATCACCGAGTGTCACTGAGCGAGATGGACGAGGTTCTGCTCAGGAGCCTCACG8760CCGAGCGTGATCGGCATCCTCGGCCGCCGCGGAGCTGACTTCGCGGCGGCTGAGGACGCC8820GTCCAGGACGCTCTGGTGGAGGCCGTCCGCGTCTGGCCTGCCGACCCGCCGCGCGACCCG8880MGGGCTGGCTGGTCGCTGTCGCCTGGCGTCGGTTCCTCGACGCGGCCCGGTCCGACTCC8940GCCCGCCGCAGGCGCGAGGACAGCGTCGACGGCGAGCCGGTCCCCGGGGAGGCGCCCGCG9000GTGGACGACACCCTCCAGCTCTACTTCCTGTGCGCCCACCCGTCGCTGACCCCGTCGTCG9060GCGGTCGCGCTCACGCTGCGCGCCGTCGGCGGGCTGACCACCCGGCAGATCGCCCAGGCG9120TATCTGGTGCCCGAGGCGACCATGGCCCAGCGCATCAGCCGGGCCMGCGCACCGTCGCG9180GGCGTGCGCCTGCACCAGCCGGGGGATGTCGCCACCGTGCTGCGCGTGCTCTACCTGGTC9240TTCMCGAGGGCTATTCCGGCGACGTCGACCTGGCCGCCGAGGCCATCCGGCTCACCAGG9300CAGCTCGCCGCCGCGATCGACCACCCTGAGGTCGCGGGCCTGCTCGCCCTCATGCTGCTG9360CACCACGCCCGCCGCACCGCCAGGACCGCCCCGGACGGCAGCCTGGTGCCGCTCGCCGAC9420CAGGACCGCTCCCGGTGGGACAACGCGCTGATCAGCGAGGGCGTCGCGGTCCTGCAGGCC9480GCCCTCTCCCGCGAACGCCTCGGCGAGTTCCAGGCCCAGGCGGCCATCGCCGCCCTGCAC9540GCCGACGCCCCGGCCGCGG(JGGMACCGACTGGGTGCAGATCGTCGAGTGGTACGACGM9600CTCGCCCGCCTGACCGACAACCCGATCGTCCTGCTCMCCGGGCGGTCGCCGTCGGCGAG9660GCCGACGGGCCCAGGGCGGGCCTGGCCGCTCTCGCCGCCCTGGACGACGCTCTCCCCCGC9720CACACCGCCGTCGCCGCCCACCTGCACGMCGCGACGGCGACCGCGCGAGAGCCGCCCGG9780CTCTACGCCGAGGCCGCCAGGAAAGCACCCMCCTGGCCGAACGCGACCACCTCACCCGC9840CAGGCCGCCCGCCTCMCACCCGCTGACCCCCGGCCCATCCGCCCGGTCGCCGTACCGTC9900CGGGGACGAGTCGACAGMGTCGCCGACAGAGAGCAGGMGCGATGCGCAACGAGGCMT9960GGCGCGGTTGGACGTCCTGACCGGATCGTGGCGGGCGACGCTGAGCAACGCCTGGTTCCT10020GGAGCCGCCGGACCAGGAGGTCGAGGGCACGGCGACGGCCGMTGGCTCGCCGACGCGTT10080CGTGGTCTTCGGTCATCGGCTGTGMCCGCCCCCGACCTGGGAGGCGTCGGGCGTAGCGCGTGGCGGCCATGCCAGGTGTCGGCGCAGCGCGGTAGACCTGCGCAGAGGCTCGTAGTGCCGCCTCCTGCAGGGCCGCCGCCCGGACTCCCGACGGCTCGTACGCTCTCGGATGACGTAGGGCGATGATCGGTGCGCGGCTCCMGMCGCCCTCCCCCCGATTGCAGGAGGGTGCGCTGGCGCCCGAGGTTGCTCGCGCAGCCTCCCGCAGCGACCACCCGCCCAGTGCATGTTCGAGGACGCTGGACGACGCAGCGACGGTCTTCGCCATTCCAGCGATCAGGACCGCGCTGCCCGCCCGGTCGGCCGGCGGTGAGGTCCGGGGGACGGCCAGGGCTTCCCTCGTGGGTTGCCMGGCGGGCGCTTGGCGCCACCAGGCGCTCGCGGTGCGGCGGACAGGTGCGTCGACTCTGGACGACCGTCGAGCGGTCGTCGCCGAGGATCTTCAGGMGAACCGCTTGCCMTCCCACTTCAGGCAGGACTCGATTCTCGGCGACGCCGCCCTACTGGCGTGGATGACCGGTCATCGGCCGCGTGTCAGCGGCGACCMCGACGCTGACCTTCGATCGTCGCCGAGCTCGACCTGCGGTCAGTTGGATAGGGCCAGGTCGGGGCGCTCCAGGGCCGGAGCGCCTGGGGGTAGCGGCAGGTCGACCGTAGGAGTTCGAGCGCGTCGGCCCGCGGTGCACGTAGCCGGCGACCGGCGCGCGCGGGCGGACAACCGTGAGGCGCGACGCATGATCTCGTTCCGCCGAGGGAAACAGGCAATCAGATTGCTCCTCAGCGGGCGGTCCGGCTGCACGTCCGTCGACCAGCCACGCTGCCGCGAAACCCAGGCCAGGCACGCTACACCGCCCGCCGCGCGGCGTCACGCCAGCGCAAGGACCTAGCGATCGGCAGGCTTGCCGGTCGGAGAAGCTCGGCGACCGGAGCGGTTTGACCAGGGTCGATGCGCCAGGACGGCGCCTGMGCTGCGTCAGCCGCTCCGGGCTGGGAGCACCTTGGCTGCGCGGCGTTCGCGTTGAGAGACGTCATTGMTCCCCTTATGCCAGGCGCGCCGCGCGCGGAGAGCATGCCTTCGCCGATTGCGGTGTGCCACCTCGAGGGGTCACCGAGTCCGCCGTCGGTGCACCTGCCACGACGGCTCTACCACGTGGACGATGAGGCCGCGTCATTCGACCTCGCCGGGTGGATGCGGCGGGACCCAGCATCGATCATGCGGGCAGAGGGCGAGCGGTCAGCTCGGTCCAGCGCCGGTCTGCACGGGAGGCGGCCGMCGCCCATGCGCACCAGCCGCCTGCTTTCGTGTCCCCTCGCCAGCAGCGTGCGCGACCTCCCCTGTCMCTCACGACCCGCCACTCCCACTTCACGCCGCCACCCGCCGTTCGCCACCGCGCGTGCCGCACGACCACGGGTGACGAGCGACATTCGGAGATGGTCCTACGAGCGC(JGGCCGCGCGGACCGGCCGCTGTCTTCGAGCGGTCCCAGCTCGACGGTGGCCGCGGTGCAGGGCGGACGTCGCATGAGGTGGGCCGAGCAGCGTTGAGGTGGGTCCAGCAGACACCAGATCGGGCGTCCACGTTCGCGGGCCGCGCAGTTGCCCACAGCTCGCGCCAGMCCTTCCAGCGGCGCCCCAGGCTCGGCGTCCCCAGGGAGCGGCTATCGCCACCGTGCCGGATGCTGGTCCACCGAGACCGAGGCACCGGTGTCTGCGCTGGCGCGGCAGTTCG101401020010260103201038010440105001056010620106801074010800108601092010980110401110011160112201128011340114001146011520115801164011700117601182011880CCCMTACGGGCGAAATCGCGAGATAAGCATTGGGCAGGCMCGCCGACGACCGGCATGTACCGCGCCGGMCTGGTCGGGCGATGAGCCTCCCCGTAGGAAGTTGGCCAGACTCGTACGGCCGGGTACGACCACGTGGCGCTCGMGGCTGACGACCTCCAAAGCCCTCTGCCGMGGACGACGCGGCCGGATCGTCGTTGCCCGCTTGCCGCGAGCCTGCACCGCGCCTCTCGCTGAGCGGCGGGCTTCGMCGCCTCGGCGCAGGTCCGAACTCGGCCGGCCAGCTCCGACCAGCCGACGGATCGACGGACGCAGGACCACGGGCMACGGGCCGACGCAGGMGACCGATGCCGTGGGTCGCGCCCTGTAGACCGGTGCCGATCCCCCGCGCGGACCCGGGTCGCCGCAGCACCCGTGACGCGGTGCGTGCGAGGCCCAGGTGGTGGTCCGGCCGGCTGCAGCTCGCAGGTGCCCGGGGGTCGCGGGCCGCCGAGGGGCGTAGCGCGGCGAGCTGGGGTCTCGTACCCGGTCCCCGGCGGGCGACCCATCGATCCGGGCGGGGACGCATGMGTCGGCGCACGGCGCCGCCAGCGCGCCATCGCCGTCGGMGAAATTCGGACGCAGMGACGTAGGATGTTGAGCGCGGCCGAGCCATCGGGCCCGGTCGGGATGGTTCGCCATCGGCGCGCAGGGCCGCCGAGCCGCGCCGGTCGCCCCTGGCCCATGCTGACGGGCAGTTCCGACGGCGGCGCACGCGGGCCACCTGCCGCGCCCAGCGGCGTTCGACGTCCGAGGACTTCCTTCCGGGTGCTCCGGCGATGCTCGGGCCCGCMTTCCCGCGGCCGCGCCGCGCGTAGAGCGACCGGCCCGCGGCCGGACGGTCGTGGTCGGAGCGAGATCATCGACATTCTGGCGGGCGCCCGCTCGCCCAGCCTCGCTGGGCGTCCTGCACTGGCCTTCCGTCTGGACGATGGTCGTAGAATCGCCGCGCGCCCCGGTGATCGGCGACGGACCAGTTCCTMCMGATGTCCGGGTAGMGCAGGCCAGGGCGGCGCGCCCCCTGGCCAGCGAGGGAGATCGCTGGTGTACGACGGCGGCGGMCAGGGCTGAGCAGCACGCACCTCGGCCGGCGTCGTGGCAGCCCGGCCGCAGAGCACCCCGATCGGCACTCGGCGTGCCGGGTCGGCCCACATGCCACGTTGTAAACATTCCCCMGGCTTCTCCGCTGGCGGCCAGTGCGCGCGTGCGGTGTTGTCCGGGCACGCCCCACCAGATCCCTCGGCCAGGCTGCCGCCCCGGTGGCGTACCGCCACGCCCGCTCATCGGGCTGAACATCCAGGCCGCGGGAGGCAGTAGGTCGAACTCGCAGCACCTGGGGTCATCCCGGGCGATGTCGCAGCAGGCCGCACGGTCGACCAGCGCGGGGCAGGGTGCGCCGCCCAGGCGGTCCAGCGGTGAGCCTGCCCGCGGGGGTTGGATGGCGAGGCGCGCCATCGGGTCCCGAGCGMGTCTCGCGTCCTGCTGGGTACTCGGCGCGCGGCGGCGCTCGGCCCAGCCATTCGGCCGGGACGCCTGGAACAGCTCGGACCAGCACCGTCACCCGCCCAGCGTGGGCGCGTCCGTTCGTGCGGCCCAACGAGCGCGGTGCCTGCCGCTGCGGGCGCTGCGTGCGCCGGCGAAACCGGACCTCGCCCGTTGCCGMCTACCMTTCGGAGCACGCCGTATGGCGGCGCTCGMCGCGGAGCCGGMGGACGGCGGCACAGCACCTGGCCCGAAGTCGA119401200012060121201218012240123001236012420124801254012600126601272012780128401290012960130201308013140132001326013320133801344013500135601362013680ACCCGCCGCCCGGCCAGCACGCAGCCGCACTGMCGGGCACCTGGTCATCGGCCGAGACGGAGCGGGCCCGACGCCCTCGGAGCAGGAAGGACGMCTCGCGGCGCGATGGCCGGTGCCGCAGCGCGACGCGCCGCGTTGGGTCTCGCTCAGCGTGMCGGCCGGATCGGCCCGCCTCGACTGGACACCCCCCCAGGTCTGTCGCGGAGTTGGTCGGACTCGCCGACGAGCCCGCTCGMGGMCGTGCGCGTCGCGCCGGCCCGCCGACCTCCCCCTGGCGGGCATGTACGMGGCGCGGCCCGGCTTGCGTGCGCACCCGGGGCGACCCCTGACCGGGCGGTACCACAAGGTCCCAGTTTGGTGMCGGCGTAGCGGGTCGTACGGGCACGTCGACGCTCGGCTCCGGCAGCCCAGGTAGTTCGGGCATACACTTTGGATCGGCCGTCCCGACGCCCCTGMCGCCAGCGCTGMGTACGGGCGGGCGCGCCTTCCGGACGCCTCGACCGGCCAGATCGTAGCCGGGGCGCCGCGCGGGATGCCGTCGCACGGAGTGGGTAGCCGTCGCGACAGGTGCGGCGATGGCGCATGTCGCCAGCAGCCCGCTTGCTCGTGCCGGCTCCTCGCMCGGGTAGGTCGGTCCGGCGCGGGGCGMCGTAGAGGTACTTTGGCCTCCGCCGAGCGCCCGCGTCCCCTGACCGACCACCAGCGCGCGTAGGCGGACCACACCMCTTTCCTCCCTGCTGGCGGGTTGGCCGAGCCCGGCTGCGCTGGGCCGTAGGCGGCCGGTGTTGGGCGTAGTCGCCACAGGATGTGCGCGTCGCTACTGCGCGTGCGTCGGCGAGTGACGCGGGATGMCTCCTGCGGCCATCCAAGCCGAGGCGGGTGCACCTCCCGGGCGGGCGCTGACCAGGGCTGAGCCGTCGCGGCGTCGTCCGGGGTGCGCGGTGTCGCAGCGTCGCGGTCGCGCAGGGCCCGCGGGGGGCGCGCTTGGCCGTGCTCGGCCGGGGGCGGAGGTCCCAGGGACGACCTGTTCGGCGACCAACTCCATCGGCGAGCGCGCGTCGGCGCGTGCCTTCTCGTGCCACCCAGACGCAGGTAGGATCGTCAGGTGGTCGTGCACCGGTGMCAGCCACGAAGTGAGATCACCAGCCGGCCCCCATGGCCACGGCAGGTGACCGCGGCCTGCGCCCCGCCTGCTGCCAGGCGGGTTTCCAGCTCAGGCGCGGGTCCGGCGGACGCATCTCCTCGGCCCGGCGCGGCTGTGCGAGCATGTCGACCACGGGCGCGGCGCCAGGTAGAAGCCGGTCGGGGGGAGMCCGCCGTCCTGGCCGCCACCACGCCTGCGCATCTGCGAGCGGAGCCGATCAGCGTCCCACAGCCTTCTGCCGAGCGCAGCGAGCACCGCCGTCCTGGTCACCGGTGTTGGTCGATGCGCATGGCCGTCCTCGCCACGGCTCGGGCGTCGAGGGTCGMGGTGGATCCGGTCGAAGCGCTCGTGCGCCGGTCGTCCGGCAGGGATGCCGCCCGTGCCGGGCACGCCGCACGCTCCACGCCTGCAGCCGMGTCGGTCGCACTCGCAGCGCTTCTCGACTTGCCGGCCCTCGATCCACCTTGTAACGTCTTGGCGTCGGCGCGCCGGCTCGGCCCCCGTCGGCCCTCGACCACCGTAGACCGCGCAGGCCGGGTCGCGACGGTCCACCCCTTGAGCGAGCCCGGTCGTCCTCGTTGGGTCGCGCCGCACCAGGTACGACCAGCAGCGGCGGTGTCGGCCGAGGTGCGGCGATCT137401380013860139201398014040141001416014220142801434014400144601452014580146401470014760148201488014940150001506015120151801524015300153601542015480CGCGCATGGCCTCGGCAGGCTCGACGCCCGCGACGGCGGCGMGGTCTTGGCGMGGTCA15540CCAGGTGGGCCCCGGTGCCGCAGCCGACGTCCAGCAGGGTCGCCGCCGCGGGCGCGCGGT15600CGCGCACCAGCGCGGCGATCCGCGCGGACTCGGCGGGCCAATCCTTGCCCCGGCTGCGGA15660ACACCAGGTCGTAGTGCTCGGCGTGGGCGTGGCCGTAGGTCATGGCGGCCTCCTCTCTCA15720GGTCGTCTCAGATGACGCGGACTTCGGGGACGTAGGTGATCCAGCGCCCGCCCGCCTCGG15780TGMGGCGTGCTCCTTGGCGAGGATTTCCTCGGTGTGGTTCCAGGCGMCAGCAGCGCGT15840AGTCCGGGTACGGCTCCGCGMGGCCGACGACGAGCGGACGGGGATGCCCGAGCCGGGGG15900CGAGCTTGCCGTGCTTCTCCGGGGTGGAGTCGCAGATGTAGGGCACCAGTTCCGGGGTGA15960TGCCGCAGTAGTTGATGGTGGTGGCGCTCTTGGCCGTCGCGCCGTACCCGACGACGGAGC16020GCCCCTCGGCGCGCAGTCCGCGCAGCAGCGCGACCAGTTCGTCGCGGGCGTGGCGCACCC16080GGCCGCCGAACGCCTCCAGGGTGGCCGGGTCGGCGAGGCCGCCCGCCTGTTCGGCGTGCA16140GCCGCTCGGTCACCGCGGCGCTCGGCTCGGCGCCTGCCCGCGCGATGGTGMCCGGATGG16200TGCCGCCGTGCACCGGCAGCCGGGTGATGTCGACCAGCTCGMGCCGMGCGGCGGGCCA16260GGTTGCGCACCGACGTCACCGAGMCAGGTAGAAGTGCTCGTCGTACACCTGGTCGAAGG16320CGGTGTTCGCCACGATGTCGCCGAGGTAGCGGTCTTCCACGACGMGACGCCGTCCGGGG16380CCAGCAGCGCGTCCACCCCGGCGMGATCGAGTCCAGGTAGGCGATGTGGCTGACCGTGT16440TGGCCGAGAAGACGACGTCGGCCGGACCGTGCTCGGCGCGCGCGGCGCGGGCGGTGCGCT16500CCTCGMGMGTCGACCACCACCGACACCCCGGCCGCCCGCGCGGAGTCTGCCGCGCCGC16560CGGAGGGCTCGMGCCCAGGTGCCGCACGCCCGCGCCGCCGATGGTGCGCAGCATGACGC16620CGTCGTTGCAGCCGATCTCGACCACGMCGGGTCCGCTCCGGCGAGGCGGGTGTCGAGCA16680GGTGGTGGGCGTACGCCTCGMGTGCTTGCGGCTGCCGGAAGACAGCGAGGACCGGTAGG16740GGTACTCGCTGTGGMCATCTGCGCCCGCGGCACTTCGGTCAGCTGCTGCACCATCGCGC16800ATCCGCCGCAGACGCCGATCCTGAGGTCGTAGTGGAACTCCGGGGAGGTGTCCGCCGGGT16860CGCGGMCGCGTCGGACACCGGCTGTCGGCCGMGTCGMGMCTCGCGGACCGGTCCGC16920TGCAGAGTCGACATGCGCCCATGCCGGTGAGGCTACGGTCGTGCTGCGTCATCGTCGTGG16980CTCCTAGAGGGGCGTTATAGCGGCATTCGACCGGTGCTGTGCGCGGTCGCGTGCCTCGTC17040GAGMGTTCCAGCGCGCGCACGCTCACGGCCAGTTCTCCTGCGAGGTGGTCAGCGGATCG17100GGTGCCGCCGCGCACGGCCGAGGCGMCTCGGCCATCACGGCGGCGAACTGGTCGAACGG17160CGCGATCCCGACGCGCCGCGACCCGCCGGGGCGCTCGAGCACCACCTCGGTGGCCGCCGA17220CGGCGGCGGCGTGTACGCCCGCGCCGCGGTGACGGCCCCCGCGGTCCCGCACAGCTCGTA17280GGCGGCGCGGGCTCAGCAGCGCCGTCCAGGGACGTCGAGCCGGCGGGATCCGCGTCGCGCCAGCCCGGCCCGGCTTCTCCCAGGCCGGTGGTAGCCGTGCGCGGCTGGCGGCGGCGGGCGCTGCCGGGCAACCAGGTCCGGTCGGGCCGGAACCGGCCGCAGGACGGCGTGTGCACTGCATGGAGCAGCGTCGCGCACGGGACACCCCGAGACCAGCCCGGCGGAGGTGACCGGGGAGCGTCCTCGGCGAGCTGTCGMCMCTCGCTGCCCCTGCTCGGTCCAGGTACGACGGTCGGCGTAGTGGTGGTAGCGCGCCGCCGCACGTCATAGTGCTCCGCGTCATGCCAGACGACCCGGTCGCTCGGCGCACCAGCACGTGGCACCGCGAACCGCGGCGCACGGCGACCGATGTCGGCGCGGCAGGCCAGCGGCCTGGTGTGTCGGCCGCCCTCCTCGGACCAGGMGCGCGGTCGGCGCCGTGCTGGACCGAGCATGGGCGACCTCGMTGAGTCCGCGTCCAGCTCMGCAGCGGCMGGAGGCGGCGCGTCCGCTCCTGTCCMCTCACTGGCGCACGCACCGCGGCAGAGCTGGACCGATGCCGMCGAGGTCGACGACCGAGCAGCGCCGAGGTCCCGAGAGCACGCTGCGGGTGGCTCGGCGAGGCTTGCCCGCTGTAGACGGCAGCCGAACTCTCACCGTGCTAGCCCAGCACCAGGCTGCGGCAGGGCGACCGCTGTCCTCCCATGGTGGCGGGGCCGGGCCCAGCTCGGCGGCCGCCGATGCTGCGTCCACGMCAGCCCGCAGCGGCGACCAGCTCCCGCACAGGACAGCGACGGTGGCCGCCGCTGTCCGATGACCATGGTCGGCGATGGCCGCCGTGCGCCGTTGCAGGGTCAGGTGCGCCCAGGCGCCAGMGCGCGGGCGCGGTAGCCTGGGCAGGCCTGGTGMCCGCGGCGGCGCGCCAGCGCCCTCGACGGCACGCGCCGMCCGCGCAGGCGCCCGACCCGCGCCTGGATGTCACTTGAACCACGACCAGGTTCGMCAGGATCGGCGGGCAACGTCGAGGCCGGCGCACCATCGGCGACCTCTGTCGTGGCCTGCGCACGTGTCGGGTGCAACGGTGCGGGAGGGTGAGCCACCTCGCTGCTTGCGGTTGCACGCGGGCCGACCCTGGTGTTTGCCCGGCTGCGACCGCGCTCGTCCCGCTGTGTGCAGCGCGMTGTCGTCCGATCTCGCATCCGGTTCTTCGGCGGCGGTCGGCGGCCCTCGTCGGCGAGCGGCGGCCTGCCAGCGCGGAGCGGCCTCATCAGGTAGTGCGGCGCGCTCAGCGGGTGCGCCCGCTCGGCGGMGCCGTAAGCCTGGTTCGGMCGCGACCCCGGCCGCAGGATCGCGCCCGATCTCCGCGGCTGCCGTCCGTCCATGTTAGCAGMGCCTGTCCMCTCGCTTGCGCAGGGTCCGGCTCAGTTGCTGCGCGGCCTTGGCCCCGAGCCGTCCACCACGGCGGTAGTAGCCCGGCGGGGCGCGCGCGCCACCCATCAGCACTGGCCGCCATACTCGGCGTGGCAGCGCGCGTGGCCGCGCTGCAGCGCGCGCCCGTCCGCCGCTGTGCCGCCAGGTCCCCGGGCGTGGTAGGGGCGCGGAGGTTCGCGGGGGGGGCGGACCCAGGCCGACGCGCGCGCACCGTCGGCCTGGCGCGGTGCGCGTCCGCCTCGGATCAGGTCGGTCCCTGGCCGCTGCTGTCCGMCCACGCGCAGGAAGTGCGGTGGCCTGCCTGCATGAGC421734017400174601752017580176401770017760178201788017940180001806018120181801824018300183601842018480185401860018660187201878018840189001902019080AGGTGCAGGATTGATGATCGTGCACGGTGACAGCCGCGCATCGGCCAGCCTCGGCGAGGCCGGTGCGGGCAAAGGCCCTGGCTCGGCCGTAGATGCCGCGCCCAGTAGMGGTCGGCGMCCAGTCTGCCGGGAGMCGAAGCCGCTGGTGGTCGCGGGCTCCACACGCCCGTTGGCCGCCGACCTGGCCGCGCCGCCTCCCGGGCGCGCGCACGACGTCTGCAGGTGTCCCTCGAACTCCGGCGGCCAGCCCAGGATCGGCTGGAGCGCCCACCTGCGCTGTTCTCCGCCGGCGTTGACCGCCGTCGAAGCTGGCTCCAAGAACTTGCCGGTCGGCCAGAGGCGTGCACGGGCGCCGATGGCGAGCGCCGTGCATCGGCGGAGCCGMCCTGGTAGAGGGTAGTGCGAGCTCGCGGTCGCAGCTGCACGGGAGACCTCGCTGCTCCAGGGTGCAGCATGGMGTCGCCGGTCCTCGATGGGGGTGGCCGGACGTGCTCGGCCGTGCGCGGTCGCCCGGCGGCGGACATCGGCGACCCGATTCCTCCGCGTCAGCGGTAGGCCGAGGTCGGCGGGCGCTGGCGCGAGCGGCGCCGGGATGCTCGGCGACGGCCGGGCACCGCTGCGGTGGCGGGACGCGCGTCCGGCGGCCGCGCCCCTGGCCTTGAGCCAGGCAGAGCGGCGGCGACCCTCGCGGGCGACCGCGGTGTCTAGTGCGCCGCAGCCGATGGMGTCCCACCCCGAGGTAGGCCGCCGTCGAMGGTTCCGCAGCAGCAGCCCCGTAGTGCAGCGGTCGGGTGCCACCGCGTCCGACCCCGGAGGTGCCCTCGGACCCTTGCCCCAGCGACGTGCAGGGCGGAGGTCCGGTCGCCGCGCCGACCGGGGCAGATCGACCACGAGCGATGCCCAGGTCCGGCCGCCGATGTCGCTCGACGTGCATCGACGGCGGGCGAGCATCCCGTCGACCACTGCGCTCCGCGGTGCAGCGACCTCGTCGCGCGGCCGGCAGACACCTCGGCCGGCCAGCACAGCGCGTCGCCGAGCTTGCGCCGAGACGGCAGGCGCGGTCCGCGCTCGGTGCACCACCACTGAGCGTGCGTGGCGGCGCTCCAGGCGCATCGCCGACACCCCACCCAGTTGCTGGMCACTGATGGACTGGCGCGGCGAGGGCAGTAGTGACGCGGCCGGTCGCCGTGCGGCACACCGACGGTCGCGCACCGGTCTCCGGTCCACGCCCGTCGGCCCGGACGGTCATCGCCGCGGTGACGGGCGTGGTCCCGGGTAGCGGCAGGTGCGGCCGGCGGCGGGGCGCCGGGTCGTCGTTCATCGGCCCGCTCGCCCGCGCTCGGATCTTGCCGGCCGATGGCGGCACAGCGCGCGCCTTGGTGCGGGTCGACGGACGMGCAGCGCCAGGAACGAGGTGCGCGGGACGCGMGATTGATCATCCGCGMCCCGCAGCCCGCGCCGCGCCCTTGGTCGGCCACCCGGCTCCAGCCTCGGGCTGGGTCGATGCCGATCGGCAGCCCTCGCGCTGCCGCGGCGGACGCCACCCCCGTCGGCGTCGGGCCCCGGGGATAGGTCGTGTGGCAGCTGGAATGTCGACCAAGGAACTCGCACCGAGCGGCGCCTGGGCGAATGTGCTCTGTGGTCGAAGCGAGGCGGGCGGCMTCCGGTGCCGGGGTGATCGCAGAACAACGGTGGGCAGTGGCCTCGGGCGAAGCGGGACCTCGCCCATCGGGCCTCCTCGTCGGCGCAGCGCGGCGACCGMGGTGATTCGCCGGGTCGGACACCGA191401920019260193201938019440195001956019620196801974019800198601992019980200402010020160202202028020340204002046020520205802064020700207602082020880GGCAGTCGCATCGCCTCCTCCGTGCGCCGCCGACGGTGGCCGGCGGCCAGACGCCAGCACAGCGCTGCTTGCGCCGGGMCCACCAGGTCCGGGGGCGMTCGGGTGGTTCGTCCGCGCCGGTCGCGCAGCCCGCCAGAGAGGTGGACGGGACGACGGCGTGCCGCGACAGCCGCGGCGCTCGCGGTTGGTCGATGACCAAGCCCTTCCTCCCGGGTGCCGTGACCAGGGCCGCCCCCGGTCGCGGAGCCCGCTGGTCGGGGCAGGTCGGGCGTAGTCGGCGGCAGGCGGCCGGTGGTGCCGGCTCGGTGCGCCACCCCGCACCGCGATCCACGTCCGCCCGGGGTCGGGCGAGCCGMCGATCACGMCGCCCATGAACGCCTTCGGCGCGCCGCCACCGGCCCCGCGCCGGCGTCGGCCACGGTGTCGCAGGCCGTGCGCAGGGCGGTTCACCGCGTCTCGCCGCGCCGGGTGTCCCGCCGAGCCGACCATCGGCGCGCGACCGCGCCTGGCGAGCGCAGATCATCAGTGAGCGTGCCTGCCGACGGCCCGCATCGGCCGTCGGCGATCGACGACGTCCGGCGMGCCGCCTGCCCTGACCCAGCCGAGCGAGGTCCGCCGGTCTCCACACGGGATCTTCGGGCGCGGGCGGCGCGCTATCAGCACCCCGGMGGTGCGGCAGCGCCTGCTGCGGCGCCGGTACCACAACGGCCGCCCGCCACCTCGTGGCGGCGCCTGTAGCCGCGCCGCCGCGTCGCAGGCAGGACGCCGACGTCGCAGGCACAGCGGCGAGCCTGGGGAACCAGCGTCGACCAGCCCCGGTGCCGCGGGTTGGCGGCTGCGGGCCAGGCGGGCCGGGCCATCAGGCACCGGGCCTCGGCCACAGCGGCCCGGTGCAGATCCCGAGCCCCGACCGCCCTGCGGCACCGCCGTCGGCCCAGCGCCTCGGCGCTGCGGGGTACGACTTTGTCCAGGGCCGGCCAGCTCTGTAGGCCGCGCTCGMGMGGTCGGGGTCGGGTGGTGACGGGTGTCAGCGTCATGMCTACGAGCGCGGGTCGCGCCCCMGGTGTCCGACCAGCCCGCCCCAGCGCCTGCGCGGTCGGGTGCCGMGCAGCACGMCTACCAGGTGGCAGCAGCTCGCTACCCGCTTTTCGGCGAGCAGGCCGGGCGGCCGTCGACGTGCGGACGCGTGMCGGCGGCCTCCGGCCGGGCCCGCGGCGCTCGGCCTGCGGCGGTGGCGCAGGTCGAGCCGCCAGGTTGGMCGGCGCGCCTGGCCCTGGCGCAGGCGGCTGCGACACCGAGCGCGGTGCACCCACTGGCATCGCTCCTCCGGGAAGCGCCAGCATGTGAGCCGMCGTCGTCCGGCCACCGCCGGGATGCGTGGACGGCGCGCACCCTTGAGCACCAGCCAGGTGCTCCGATGAAGTCGGATGCCGCGCCGCCCACGCGCCGGGTAGCCGAGGTCGGCAGCCGGTGGACGGGCTCCGGGCGAGCCGCAGTCAGCAGCGAGCAGCTGCCGCCAGGAACGTCGCGCAGGAACGCCGAGGAGCCTGGTGCCATGMGTCCGGCCTCGMCGTGCTTGMCGGTCGGCACGTCCGATGTGCGTTGGTCTCGGCGCCGGGGTCGACGGCGCCGCGACATGGCCCAGGTGCCGGCTGCGCCGGGCGGCGTGCCGGTCGTAGCGCGGCGTACTGAGCCCTGGTGGCCCGACGCCGCTGGGTGGGCCACGATCCGGCCGGMCGCGCAGCGGGATGGGCCAGCTCCCAGCGCCCGCCGGCGGCTCC209402100021060211202118021240213002136021420214802154021600216602172021780218402190021960220202208022140222002226022320223802244022500225602262022680GGCAGGGCGTTGGCCCACCGGCGMCCAGCTAGTGCGGGTATCGTGGTGGTCGTCGGCGAGTCAGCACGAGTGGCGAGCGCGCATCGACGGGACCGTCCAAGGTGGATGAAGGCCGTCGATTCGGCATGTTGGTTGGCGTGTGCCCGGACGCAGGCCCGGTGTTGGCGCCCCGGGCAGCCCGATCGCCACCGAACCGGMCTGCGTCGACGGCTGGCGATTGAGCGCGGCCGMCGGGGACCGCGGCGMTGMCAGGTGCGCCGATCATCGCCGTCGGCAGGAGTCCGCTGTCCGAGACAGGAGCGCGCCGGAGAACCGAGTCCCACACACGGGTTCTCTCATGGCGGTGCACGCTCTTCGACGTAGCCGGCCGTTGACCCTCGGTCTCGCGGCTCGCGCGGCGATCTGCGTACCACTGCGGGGATGTCGGGTGGTCACTTCTTTGAGGCCGGGCGGTGCAGGCAGTAGGCGCACGGGCGATCGTGCCCCACGTTGCCGCTCGCCTGCGGGCCCCGCCGGATCGGCCAGGTCGGCTTCGCGCGGCCTGCGATGACCAGCGGCGMGGTGGGGCAGCGCGGGAGCGGATGCGTGTACCACGCCGGAGACCGCTGTCGCCGCGACGAGCGCGACGAGCGCGTGCCTCGGCGCTTCAGCTCCGTCCGGGTCGGGTGCCCTGCGGCGTTGAGCGGCCGGGCGCCCCGTCCGGGCAGCGACTTCGTCGMGCCGGGCGGTTCCCTTGTTGTGGGACCMGGCGCTGCCCGCCCCGCGGTCGGCCGGCTCCAGCGMCGGCGGGCCGCAGCAGGCACGATCATCGGTGCTGCGGTGCCAGCAGCCTCGCGCGCGCTTGGCGACCTCTGTCCATGAGCGGCGCGCTGTGAACACCTAGCTCGAAGAACCGCGGCTTMCACCGCGTACCGGGGCGCGCGTCGGCGATCCTCTCAGGGACCAGGTGCGTGGCCTCCAGGCAGCGCCCGTGAAGCTGAAGCAGCATGTCCGGTGAGCTTCCAGGTCGGACGCCCTCGGTTTCCCGGGTTGTCGATGCGGCAGCGCGGCGGCCGAAGGTCGCTCTCGGCGCACGCCCAGTCTGCCGCATCGGGCAGTTCGCTCGATCCCCCATCGCCGAGGTCGGTGAGCGTAGTCGGTTGGTCAGGTTAGAACGGCGACGGCGGCCATTGCGCAGCTCACTGGGTGATGCAGGCCGCGGGCACTGGGCCCGCGCCGCGGGTCGACCGGAGTCCAGCTGGCGCCCGGTCCGTCGACGGTCGGCGCGCGCTCCGCACGCCCCCGGTACTGTCTTCTCGATAGACGAGCAGGTGCGGCCTCGGGTCGTCAGCACGGCGGCCGGCGACCTGGCAGCACCGCGCAGGTTGACGGCACGAGCACGCACTCCTCGCGGGTCGGACGGCCATGAGCGAGCCTGCGGGTCCTTGAGGGACGCCGAGGCGGCCAGTCCGAAGTAGTCGCCGCTCGAACGGTGTTGMCGCTCGGCGTCCAGCATCGGCGTGGGTGGCGCAGCCGCGCGCTCGACGGGGGACCGGGGTGGGCGACGGTCGTTCCACGGGGGCGATCTCCCCTGCCGAGCGGCGCGGCGCCCAGMGCCGCACGGCGMGGTGGCTGGGGCTGTAGGGCAGGATCGATGCCGGCGAGCGGGTTGGCCGCAGCCTCGGTGTGGCTCCGCGAGCGACCTCGCCAGACCATCCAGCTGCCCGAGCGGCGTCGATAGCGCATGAAGCTGCTGCTGCCTCCGGCACGCGCCAGGTATGTCCACATGGCGCGTAGTGCGTTCTCCT227402280022860229202298023040231002316023220232802334023400234602352023580236402370023760238202388023940240002406024120241802424024300243602442024480CCGGCATGGCCGCGCAGCACCCCAGCGCAGGAGTTCCCTGGTCGTAGCGCGCGGGCCAGCCGGGGCGACCGTTGCCGGAGCGGGATGTCCCAGGATCTCCCTCGGGGTGGGCCCGCCATCGTCGTCGTCGGCGGACGATGGMCCCGGACGCTCTCGTTCGTCCGCCATCGTGCCTGGCGGATGCGCCGCCGGGCTGGAGGGTGCGGCTGCCAGGCCAGGGGCGAACTCCCAGGCCCACTGGTCACTGTGATCAGCTGCGGCGCACCCGCAGGCCAAAGCGCCGCGGACGTGCACCCTGGCGTGGCCATGGACGTCGGCCCCCGTCGGGCGGGTAGTAGGAGGTTCGGGAGCCGCGCCGACTGGTGACGTCCGAGCGAGATCGGTGGCGATCCACCGCGCCGGMCAGCGAGCAGCAGGACGGAGCTGGAAGCCCGACGGTGCATGTCGCGGGATGCCCAAGGTCGMCGATCTCGGCGCCAGCGGGTGTCGGTCGGCGGMGCGGTCGTTCCCCGCTCTTCGGGCATGGGTGCTGTCCTTTGTCCTGGGCGCGGTGCGATCAGCACGTGGGTTGTTGTGCGTCATCGCCCCCACGCGCGCCTGCGCGGCAGCGCCGGGCAGCGCGGTGGTGMCAGGTTACCGGGTCAGGGCAGMGTGCGAACTTCTCCGMCACGGTACTTGGCCACCGCCGATCAGCGTAGMCGCTGACCGTGGATGAGCGTGCTCGTAGCGGCCGGCGGGTCAGGCAGGTCGCAACGGCCCGCGGCATCGCGTCGGCCGGGCGGAGMCCCGGTCGCCGAGCGCGCAGCTTCACCGMCGGGCAGGCTGTCTTGTGCTCACTGCGCGGACGCGGGTGGCCCAGGCGTGTGCAGGCGCCAGCCTCGCCCACGGCGTGCGGTCGACTGAGCACCTTCGGCGAGTGCGCTCGCCAGCCAGGCGCAGGCGGGCCGCTGGGCGTCGGGGGCCGCCCGCCCGCGMGCCGCTCGGGCCGCGTTGCCGMCCACCAGCTCCCAGCAGGTCGGATGCCCTGCCTTGGCGGCCGATGATCCGGCGCTTCCAGCGGCCTGCCGCCTGGGAGATCGTCGACGCGGGGCCTTGACGCTGCGCCACCCTTGCGCTCGGCCGTCCTGGGGTCTCCCCTGATTCCAGGCTACCCCAGGATAGGACACGAACCCGGTCCATCGTGCATCGCCCGGTGATGGAGCCGGTTGGACGCTCATGGGGACCGCGTATGCCCTCCTCCGMGGCGACCGMCACCTGGGATGGTGGGTGCCCATCTTCGCGCAGCATGCACGGCGGTCGTTGGACATCGCCGAGGTAGCGCCTCGCAGCTCGGTGAATGGGCAGCTTCGTCGAGCATGGGTGAACGGAGCCGCCGAGCCGCGCCCTTCGCCGTACTGGCTCGTTCTAACGGGTAGGCTGTCCTGGCGTGGTGGTCACCGCGTCGACACGCCTCCAGGCAGCACCTGGCACCGCGGGGGTCGCCCGCATGTGCGGGTCGGCCCGCGTCGATCACCGGCGAGGTCGCCGCATCTCCGCGCTGGCGGGCCCTGGTCGCGCGCCCGGCATGCGCCCAGCGGCGCCAGCTGTGCTCTCGTAGCTGGGTCTCTCTTGCGCTTCGAACGCGGCACTCCGGCCTTGTAGGCGTACCTCCTCGGTCCTTGTTGACAGGTGAACACCGCGGTTGATTGGTGATCAGCCCGCGCCCATCTTGCCGGTCGTCCTGGGTTGGCGTGCCGGGGCGTGCCACTCCGGGATGCGCGCGCCGGACCGGCCTCGGAGCGCGCCC24540246002466024720247802484024900249602502025080251402520025260253202538025440255002556025620256802574025800258602592025980260402610026160262202628046CGGTTGGCCAGCAGGCCAGGGCGMGAACGATGCCGTAGCACCACGATGGCCGTACTTGTTCCTCGGCGGTCGGCGTCGAACCTCCCCGATGCCCGCCCTAGCTCCAGCAACGTGCAGCGGACGMGAACTTCCTGCACGCAGGAACGGGCAGCGCCCACGGCGACGACCCTCGGCCAGCCGGCAGCCGCGGCCGGGGCGGGGCGCGMCCAGCGGGGCCGGTCGGGTCGCTGCACCGAGCAGGCCGAGCCAGCGACCCGGACTCCGTGCGTAGGCGGTGATGCGCCGGGGTCGCGGCGCGGACGGCCTCCGTCGAGGMCGGCCATCTCCCATGCCGGTCGCTGCTGTCCGTGCTCGGGCGGTGCCCTCACTGCTCGGCCGACCGCGTCGCCAGTAGCGCGGGCGCTATCCCGCCACACTCCTCGGCGCACGACGTGACTTGGCCGCGTTCGCGGGTCTCGGMGMCGGCGGTCAGCTCACGAGCGGCAGCCCGGCGCGCGCAGAGGAAGGTCGATCCGCGCGGACGACCGGGGTAGAGCGGCGGTGAGCCAGGTCGACCGGTGGTGAGAGCGCCACGTCGAGCACCAAGGGCCAGCAGGTGTGCGCGGCCGTCGMGGGCGGGCGTCGCGCTTGCTCGCCGMGTAGGGCGTACTCGCAGCGCCGCCCGCCGGGTGCGGCGTCGGTCCAGGMGMCCCCGTCGGTGGGGTTCACCGTCCCGGCGCCCGCCGGGGGTCGAGGTAGTGCGGCGGCGTACGTGCCGGGGCCTGGCGCTCGGTCCAGCACGGTCGAGCTGACCGGTAGAGGCTCACCGTCCGAGGTCGGCCGACCTCCAGTGTCGGCCTGACCGACCGCCTGCCGTTGACGCACGACCGTGTTCGCCGTCCGTGCTGGGCCGCAGCGGAGACGTACGGCGAGGTCGGTGGGACTTGCCGCTCCTCGGCGAACGCGGCGGAATCGTCGGCTTCGGCCAGGTTCGGCGACCCCACCCGTGGAATCAGGGTGTGGCATCGCAAGGAGGCGTAGGGCGCGGGCCCGGCTTGTGCGTCGCGCTCGCAGCCCGGCCCAGCCCGTCCCAGCCCGCCGGTCCCACAGCCATCGGCGCGCTGTGTGGACCAGGGTCAGCCGGGGTCAGCCCTCGGCGTGACCCAGCAGACACGGTGAGGCGGCGGCAGCGGCGCGCTGGGTGCGGGTCGCCGAGTGCTCACCAGATCACCGCACAGGCCCGACCGCGCGCAGCCACGCCCGCTGTCCGGGCGCCTCGCGAGGCGCGCAGGCATCCGCACTCGCGCCGGACCTGGTCGGCCCTCCGGTMCCCTCAGCTCTGCTTGGCCAAGCCGGGCGCCCGTCGGCGCGCGCGCCGCCAGCGCGGGCAAGCCGCACCCCCGCCCCGGTGCGGCCGGGTCACAGGGCCAACGCCGGTCGCTCGGGTGCATGCCTGGCGATCGCAGTAGCTCGTCGGCCTGCGTCGACCATCGCGGACCCCCGACACCGCGGCGAGCAGGGCAGTAGTGGGCGCAGCATCCAGCGCGTCGGTCCGGCCCGCGGGTGGATCGTGGMCTCCCTTGCCATCGCCGGATGTGGCTCGCGCAGCGTAGCGGTGCGGGTGTGCTCCGGGGAGGCAGCACGTGCAGTGCGCGCCTGGCACCGGCGGACGCGTCGMGGTCGGCCACTCGGCCGGTCAGGTGCGGGTACAGGAAGTTGGCGGCGGGTCGCCGGGGCGGGTTGMGTTTCGTGTCGCGGGGAAAAGMGCTGCACCCGCCGAGGCCAGAGCCGAGGAAACATCACCGC263402640026460265202658026640267002676026820268802694027000270602712027180272402730027360274202748027540276002766027720277802784027900279602802028080GCTCGCCTCGCGCGTGGTCCGGCGTCGTCCCAGCAGCGCGGGCGCGCATGCAGCGCGCGCGTCCTCGACGCACGGCCGCCGAGGCCGCGGGGCGGCCAGCGGCGAGCAGAGGGCCGGMCGCGCACGGCGGTGCAGCTGGCTCCCCCGCCCGGCGAGGGCCCGCTTGGCAGTGCACGTCCGGCCAGCGCCCAGCTCCGCGGGGCAGCGGCCACGGCCCTGGCGGGCGCGCGGTGCGCGTCCACGTGCGGAGGACGGACGGGCCAGGTCGAGTGGCGGCCACCCGCGGCGCTCCGGGTTGAGCGGGCGAGATCGCCGAAGCAGCAGCGGCAGGCCGCCAGCGCCTCGCGGGAGCTCGGCCAGCTTGCAGGCAGCCTGCTGGTGGCACAGCCCCGGCGTCGACCGACGAGCACCGTCGTCGGAGGGAGTTGTTGGGTCATCCGCGGGCGCCGTTGMGACGAGGCTTGCGGGTCGCCGGAGATTGCGCGCGCCCGCGCCTGCGGMCCGACGCGCTCGGCGTAGCGGCTCGCGGCACCAGGCCTGMCTCCCCGCCCACGCATCGGGCCGACGGCACACCGCCGCCCGCGMGCGACTCGGCGCGCGGAGAAGGTCGGCGMCCAGGCGCTGTGTCGGCGTGCGGGCGGCGGGCAGCCCGGTCGGTGMCACCGACCTCCTCCGGCGCGGACCGAGCCGGGCCCCGCACCAGCGCCCTCCAGTGAGCCGCACAGGCGAGCAGCCCCCCAGGGCGCGGTAGGCTGGTGTCGMGCTGCACGCCTCTCCAGCTCGCGCCGCGACCGGGAACGCGCGGCCACCTCGGACGGCGCGCCGCCAGCGCCGCTCATCGCCACCTGCGCGGTCGMGCCCCTCCACCACCGTCGACGGGGGAACAGCGCGCGCCTCGTACGMCGCGTACGAGCAGGTCCCGCGCGGGTGGCAGCCGACGGCGCCGCGCGCTCGGCGCAGGGCGACCCGGGAGCTGGTCGGCGCAGGTCGCGGCGAGTTCCGGCCTGCGCCCGCAGCAGCGCCGACGCTGCTGGGCCCCGGMGCTGGTGCGGGTCGCCCGCGCTGGMGGGCGGCGTAGCCACTCGCCGGTCGTTGTGCGGGGACGACGCTCGGCGTCGGGGCAGGCCGGGCATCACCGTGGACCCCTCAGGACGGCGTGCGCCGACGCCCGGTGACGTCGCCGCAGCAAGCTCCACGAAGGCCCAGCTAGGTTCTCCCCCGACGTCCTACCTCCACGAGCGGGCGCGTGCCAGCGCCTTCGGCCTGGTATGGTGCCAGTCCTCGGTGCTTGGCCCGGAACGGAGACGGGCACCCGCGCAGCCGCGCCCATCTCGGTGAATCGTGCTCTGCGTACGCGGTCCTCGCCGAACCTCCTCGGACCCGCTCGGACGTCGCGGCGCGTGCAGGGGCGGCGGCCAATGGTGCCGCCGACCTCCCAGGTCGGCTGGGGCCGCTGAGCGAGCTGGCGGGACGGTGAACCGGGCCGGGCAGGMCACCTCTCCACGATGGTCGCGCTCCGTACAGCGCACCGGGCCACCGGCGAAGGCGCGCGGTGCCCGGGCAGGCCCCGCGGCGTCGGTCGTGGTCTCACCTGGTCCGTGCTCGCCCGTCGACCCGGCGCGACCCGACGCGCCGAACCGCCCTGCGTGACCTCCCGGGGCGACGGCCCAGCGCCTCCGAGGTCGCCGCAGCTTCAGCGTCGGACAGGCAGCTCCCAGCCGGMCAGGTGGGTGCTCCAGGGCGTAGCCGCGCCGCGGGCGCGGTATCGCGGCCAGCGTCGTCCTCG281402820028260283202838028440285002856028620286802874028800288602892028980290402910029160292202928029340294002946029520295802964029700297602982029880GCGACCGGGACGCACGGCGCCGGGCCGCCGGCTCCGGTGATCCAGCGGTCGCGGCCTCGGACCGGGGGCGAGCTCGACCGGCCGCGGCGTGCCGCCCGGCTACTTGTAGGGCGTCGGCGGTCGACCAGCTACGTACGCCTCGCTCCCCCATCGMCCGGACGGCCMGCGCAGTCGACGCTGCTCGGCGACGACCAGTCCTGCGCCGGTTAGGTCAGGCCCCGCGGCCAGCGCGCAGCGTACGACCAGCGTCATCAGCGCGCCGGGTGGCGGTCCGGGTGCGACGAGCCAAGCCGGTGAACGAGCGCGCCAGCACAGCCCCCTCTGCCGCACCGGCGGCCCGCGCACGGCTCAGCGCGCTGCGCGGCGCGCCGCGMCACCCAGGTCGACCCAGCGCGACCGTTCTTCCAGCTCGCCGAGCGTGCCGGTACGGTCGGGTAGGTGCGTCGGCGGCGGTCATGGGTGCGTACGCCAGCCGTCGGTCGCCGGTGGACCGGTAGGCGGTGGCCGGTTGCGGCGCCACGCCGGACGCCGGGCACGCTCGCGGGCCCGGGTCGGCGGAGCACGCTGCGCCCCGGCTGGTACACGGCCAGCTCCGCCGTCGMGCGGGGCCTCCGCGGTGCAGCAGGGTGCGAGCCCGGCGGGCCGGCAGGCCGGGCCTCGGCGGGCGGCCTCGTCGCAGGACGGCGCCCGGTGTCCGAACCGGTTGCGCGGCCCGCCGGGTCGTAGCATCGACCCGCGTCGGGTTGGCCGAAGGTGGCCGCCCGCGGGGGTTGGCGCACGGGMCGGGCAGTCCCGMCGTCATCGAGTTCTGGCAACGGCGACGTTCGGCCAGGGTCGGGCAGCGAGCATGGCCACCGATCAGCTCCGGCGMGAATTCGATACTTTGCGCAGCATACCAGCCGGCCGACCGCGCACGGCCTCGACGGCGCACCATCGACGGCCAAGCCGCCGGAGGCTCGGCCGCGCCCGTCGAATGTCGCCGAACCGCGCCGAGCCACCAGCAAGCGCGGCGCTGGCTGACCCCCGGACGGGATCCGGTGTGGAACAGCAGCATAGACCTTGACCCTGCGGGTGGTGCGGCACCGCCGCCCGCGGACCGCGCCTGGTCTGGTCCGAGGTCGGCCGACCCGCCCCGCCGACCAGGCCCGTCGGCCGTGCAGACCCGCGCGGCCCCCATAGTGGAGCGCGTCCAGGGGCCAGCCCCGCCGGAGACCGTCGGCCAGTGACGCCGGGCCGGCTCGGCCAGCGCGCGAGGCAGTCCCGGGCCGAGCAGAGGCCGCCTCGCCGGGCGGCGCACGGCCGGGGGGCGCGGGGGCCCGCTTCTCGGCCTGCGACGGCATGCCGCCGGTCCAGCCGGCCACGGCGCGGCGCAGGCATCCCGGCCAGGCGGGGCGGGCACGACGGACCACGAGCGCGCAGGTCGCGCATCCGCGGGAGTGGTCTGCGCCTGCGCGCCCGCGATGGTCGTCGAGCCAGGAAAGCCCCCGGCGTCCCTCGACGCGGCGCCGCCAGCCCGCACCGGGGTCCAGCAGGGGGCTGGCGGGCGCTCCAGCCCGACGCCCCGTCCTCGACCGGCGACGCGGGAACTCGCCGGGGCAGCGGGGCGGCCCAGGGGTGTCCACGCGGGGCGTAGGCCCGCCGGGCGCGCCCGCGTCCGTCGGCCCGACTCGGTGTCCTCCCCGTAGGTCGCGGGACCCGCACGCACGTCCATGCGGCTCGCGCTTCCAGCAGGATCCATCCTGGTCGTAGGAGTGCCTGCACCGCTGCTCTCCGCGGMGCGGAGCGCCCACCA299403000030060301203018030240303003036030420304803054030600306603072030780308403090030960310203108031140312003126031320313803144031500315603162031680TGTCGATCTCCGACCTCGCGTGGAGGTGTCGCTCCGGCAGCGGTGTCCCGGGGTGCCCAGCCGGGGCGCTCGATGGTGCGACCGGGTGCCCCTTGAACAGCGGCGGTGCGCCGGCACGGTCCTGCCGGTCCAGGGCCGTCGCACGCCCGGCGCCGCGCAGACCCCGGCACCGMCAGCAGTGCGGTCCAGGCCTGCCCAGTGATCACCGGGTCGCCGAGGGCGGACCGCGGTCGCCGCGCGCCGACGCCCGGGCAGCGCCGAGGAAGCCGAGGCGGCAGGGCCCGCTCCCCCACTCCAGCGGGCAGGGCGCAGCCCGTGCGTAGAGGMCCAGCACCCGCGTCGMCCGGCGTCGTCGGGCCGGCCGCCGGCTGCTGCGGCAGTTCCACCCCCGATCCCGCAGCGAGCGCGTCCGCCTCGGACGGTCGCCCGGACCGCTGCCCGAGGGTGGTCCGGGCCGCCGGCTCGCCCGGCCTGCCACTCGGCGACCCTCGTCGGCGAGCCGAGAGGMCGGCAGCAGCGACCGCCTCCGGCGACGGTCGGCGACCTTCCAGCGCGGTGCACGGGGTGCGAGCGAGGCAGGCCGCGTGCGGCCAGCAAGCCTGCGGTAGCACGGCCTGCGGTCTCACTCGCCGCGGCCGGAAACGGATCGATCGCCCCGGTGCAGCCTAGGTGCGGCGAGCAGGCGCGCGMCAGGTGGGCCGAGCTGCCCCGCCGCGTCACGCCGTTCGGCCATCCMCGTGGCGGMCGGCGAGTCACAGCGGTCGTGCCCMGCAGCACGGTGTAGGMGCCGGGTCACCGGGCGGTGGGTCACCCGGCCAGGTCGCGCAGCAGCGAAGTCCGCTCGCCGTCCACAGCCCCGTGCCGCGGCGACCCGCCGGGCCCGACCTGGTTACCAGGCCATCCTCCGCGGACGTCGTGGCGGCATCGAGTAAGCCCGGCTCGGTCGGCGACCGGCGTAGCGCCCGGCCGATCGATTGGGCTAGTCCTTGGCTGGGCAGCGGAGCTCGCGCACGACCACGGTGCTCGCGCACTGTCGCGCCGTCGCCGTGCGCGATGTAGACACTCCACGATCGACGCCCGCTGCCCGCGACACCTCCCGGGGTCGGCTGGCGGCGACCGGTCGCGTTGCCGGGTGCGCACCCGGGCGTCCCCGGCTCGGCGCGCCCGGTACGACGCCGTGGGCGCGCTTCCCAGGMCGAGGTTGCCGAGCGGGGCCCCAGCGCCCACACCGGCGTAGGACGTCGGCGTAGCTCCAGGCCCGGCGGGCTCGCTGCAGGTCCGACGGTGTCGCACCTCCCTCGGTGGAGTCGCACCTCGCAGCAGCCGCTCGCGAGGACTCCGGTGACCAGGCAGCGAGCGGCAGGTCGTGGGGGCGGGTCGCTGCGGGGCCATGGCGGCGATCGGGCGGGCGGGGCCAGGTACGGCGTGCGCGCGCCCGGTTCGGCGGCGAGACTGCCAGCCACGCCTCCGTCGGCGAGCCCGCGGCGACATCGCGCTCGGGCGCAGCCGTMCGCGGCCCCAGTCCACGAGCCTCGGGGTCAGGCCCGCATCCAGGACGGCGCCTGCCCCTGGCGGACCTGCGTCCAGTTGGGGTGAACAGGCAGCAGCATCCGGGCTGCACGGCGGCCAGGGGCGGTGTCAGTGCGGGCTAGGTGCCGATGCTCGCCGAGCGGAGAGCCGCCACGTGGGGGCACGCGGCGGCCCTGGGCGGGCGACGGCCTGCGTCGATGCAGGCCGGTGGGTGTCGGTTCAGCGACGCCCGACGTCCATGCCAGCGGTCCGCGCGGCA31740318003186031920319803204032100321603222032280323403240032460325203258032640327003276032820328803294033000330603312033180332403330033360334203348050GACGAGCAGCCGGGAGCTGGCCAGCCCGCGCGGGGCCGGGGCCGTGGCGCCGGCTCGGCCGACGTGCTGGGGTGGCCCCGCACTCCGGACCGGGCTGCCGGTCGACGGCCGTGGTCGAGGGGCCTCGGGACAGCGCGGCGGGTCATCCTGGCGCTCGCGCGTTGCCCGCCGGCGCACAGGTTCGTAGGCGGTCGTCGTGGCATGACAGCTACGCGGCTGGGACGCCGAGCGCGACCTTGGTAGACGAGGACCCTCGGCGTGCCTCCCCCGATCCCGTCGGTGCTGGTTGTAGGTTGCGCACTGCTGGCGCTCTGCCTCGCGTGGCGCCGAACGTCCGGGCCTGCACATCGGAGGTGAGCAGCGACGTGCACCGACGGGGGGGCGGCGCGGGTGGCGCGCAAGCACGACCTGTCCAGGCCATCGGTGGAGACGCAGCGCCAGTGACCGGCCATCCAGTCGGAGCGTGTCGATCGGCGACGCCCCTTGCCCCCGGACGMGATCCCGTTCGGGCCGCTCGGCCGACGACGCGCGTCGGCGACCGCCGTGCAGCGMGCGCCCGCCGCCAGGTGGTCGGTCCCGGCCGGGGTCCCGACACCCCGCTCCACCGGCTTCGCCGAGCGATCCGGTCGCACCGGCTCGGTGCCGCCTGCCCGGCGCCGCGCGGCCAGCCGCGACGACCGGCCACCAGGCCGCCACTGCGTCGGTGTCGGTGCGGGTCCGATCCTGGCCCCCGGAGCCGGTCGGCGTGGGGCGTGCTCTCAGCCGGGCTGCGCTCGCCGGATGGAGMACGCGTCGGCGCTGTAGGCGCTCCGGCAGCGGCCACGAGGGCCGGGCAGCCTTCTCGCCGGTAGTCGGTGGCCCAGGCAGCTCCAGCCAGCTGGTCGACGGGAGMGCGCGTCGGCGATCGGAGAGCAGCGGACACCGCGGACCCGCTCGGCCGGTGTGCGTCGAGGTCGCGCGGCCGGGCGAGCGGTGCGTAGCCGGAGCAGGTCGGCGGGGGAACTCGGCGCTCGGCCGGTGGCGATGGCCGACGAGCGTGGTCGAGGGACCGGGTGCGACGGAGCGGGTCGAGGTGGGGAGCCGTGGCTTGACGGCGGCCAGGGCCAGCGGCGCAGTTGCTCMGGCGCGAGCAGGTCCGTCCACGCGAGGCGACGTCAGTCCGGGCACGGCTTTGCGCGACGGCGCTCCCGCACCAAGGCAGGTGCGGGCCGACCAGTCAGCCGCGACCACCGCGGGTGCGCACCAACCTCGGCGAGTCGCCGCCGACGCACTCCCACCGTGGCGAAGGGCGGCCGGCGAACGCCGGCCTCGGCGACCGAACTCGGACCGGGCGGGMCGCCAGGTTCCACGCGCTCTCGGGCCGTGCGMCACGGTCGTTGCGCAMGCAGCGGGGTTCCTCCGGGCTCGCGGACCGGTGTCGGCGGCGCTCGACGGCCTTCCAGAGCCGCCGTTCCGCGACGGCCCGCGACCGGCGGTCTCGGCTCCGGACGCGTGGCCGAGAGCCTGGTCGGTGCGGGTCCTGCCGTCGCCGCCCGGGGCCAGGGCGGGCGAAGGGCCAGCCCAGCACCAGTCGCACGGCGACGGTCGGCGTCCCAGGTCGGCCCACGACGGCCCAGCGCGTCTCCGCACCCTGGGCCGGGTATGAGGMGCCCGGGCAGCCCTCTCCACCAGGCCAGACGCCTGTCGGCGCTCACGCATTCGGTCGTCGGCCGCGGTGGATGGGCCCTCGGGGCAGAGCCTGGCGGCGCAGCGACCGCGCCGGACGCCGACGGGTGCCGTAGCTCGGCGCCC51335403360033660337203378033840339003396034020340803414034200342603432034380344403450034560346203468034740348003486034920349803504035100351603522035280AAGTGCCCGCAGGCACGCCGTCGGCGTGCGAGGCTCGGGAAGCACCGGCGGCGATGGACTGAGGTCGCCAGCCAGGCCGGGCCACGGTGGCGGTAGGCCCTCCCAGGTCGCGAGTGAACGCGGGTTCCCGGCGAGTCCAGGCCAGMCTCCCGCGCCGTCCCTCGCGCTCCGAGCCGCTCACTCCGCGAGCGGGGTTCTCCGGCTCCGGGCGAGCCGCACAGTGGTCCACCGACCGGGCAACGCGGCGATACACCGGGGATCCTGCCTCACCTTGGTGCCCCAGGMCTGCGTCCGGGCTCGCCGAGGAACGGCGGCGAGCGGCCGACCAGCACGGTCATGCATGCCGTCCCCAGGAGTCCACCCCACMGGGCCAGCTCCCACCGCGAAGCTGCGGGGCCGCTCTCCCCCCGCAGCGCCCTGCGCGAGGCGGCCGGGCCCTCGACGGCGGAGGAGCACCCGCGGACTTGGGCAGCGATCCGTGGTGCGCCTCGACCAGGGAAGMGCCGGGCCAGCGGTCAGGGCCGCGCCGGCCGTGGCTGCGCGCCGACTGCCGTCCGCCGATCGGGGCCCGCCTCGCGAGGTCGTCGCCCGGGCTGCAGCGTTATGCGCGGGGACCGTCGTGCGCCGMGMGGMGGCGGAGCAGGGCGTGGCCGCGGGCGCTCCGCGCCCGCCCCAGCGAGACCGACCAGCGCGGCCCCAGCGCCATGCCACCCCCCTTGCGGGGGGTCGTTCTGCGGTGAACGCCGTGCACGCAGCGTGCCGTCTGGCGCGGTCAGCGGCCGGACCCCGMCCGTCAGCACCACCGCCGAGGTACGTACTCCACCGGGCAGGTMGTGGCCGTCCGGCCGCCTATGACGGCCGATGCGGCCCATCCTCGTTGCATGACGCCCGCGGCTCGCGTGCCAGCACGGGGGMGACCAGCGGAGMCTTCGCCGTAGAATGGCCAGCTAGCGGCCCGTGGCCCGGMGAGCGACTCCAGAGCGCTCGCACGCCAGTGTACCCTTCGATTCAGGTAGGACGCGCAGCAGCCTCGGGCGCGGGGGCCGTATGACCAGCAGCGTCGMCTCGGTGCAGCCGCGTCGAGCAGGCGACTCCACGGGAGGCCGCGTGCGGTGTCCGACCGGCACAGGCGGTGCCCGCGCGACATCGCCCACCGAGGATGTGCCGGGGCCTGCGACCAGGCCGATCGACCTGGCGCGATGTCGCGGCAGGTCGCGGCAGCGGMGGGGAGCGCTCTCGCGTTGCCCGACCGGCAGACCACAGCAGGCCCGGCTGCGGCCCCGGTCCCGCGCGCCGCGTCGACGGCCAGCGCGGTCCGCGCGCAGCGTCGTGCGAGGGAGCGCGCCCACGTCGCAGCGCCGTGGCGGTCGTACTCGCCGCGCGMCCAGCTCCGGCGACCAGGTGGCAGGTAGTCCCACCCGGCGCGAGCAGGCCGCGTGATTCCTCGGGTTGGCGGGGCCTGCGCGTCGGCGCGGCGCCTGGTCCGTCCATCGTCCTCGGCGGCCGCGCAGGMCGCAGGTGGCCGTAGTGCAGCGGTGCTGCCCGTCGGCCTCGCACCGTGTCCCGGGTCGACCGAGCAGTTCGGGCTAGGAAACTGTCCCCGGACCGACTCCAGCCGCGCCGAGCGATGTGGCGCCAGCGCGGCCGAGCGCGCTGCCCGCTGAGCGGCGAGTTGACTCCCGGTCGCGCCTCGGCCGGGGCCGAGGCCCGGCGTCGCCCCGACCTGCAGGAAGTCCGGGAGTCGMGTGGCCGAAGGTCGGCGATAGGGCGCCATGGMCTCCT52353403540035460355203558035640357003576035820358803594036000360603612036180362403630036360364203648036540366003666036720367803684036900369603702037080GCGGCTCGCGGGTGGTCAGCACCAGGCGCTGCTCGGGGCAGGTGAAGGCGAGCACGGCCA37140TGAGCCGCATGTACTCGTCGTCCTTGATCCGGGTGCTGTCCCGCGAGCTCATGGCCGGGC37200GCATGCGCGGCACCGACAGGTCCACGACGGCGTCGCGGTCCTTCAGGTGCGCCCCGTGCG37260CGACCAGGGTGACCAGCTCGGCGGCCACATCCAGGTGCAGTCCGATGAGGACACCGGGGT37320TGACGTAGCGGMCCCCTTGTCGAGCCAGCGGTCGMGGACACGACGCGGCGGTCGTAGT37380CGGCCTTGGGCACGCCGCTGACCGTGTCGCCCATGMCTTGCTGTAGGAGTCGCGGTCGT37440AGGTCTCCTGGMCACGCACATGGTGACCGGGTCGTCGCGGCGGACCCACTCGGCGAGCA37500CGTCGATCTCGTCGGGCTCCATGCTGCCGATGTTGMGTAGACCCGCTCGMGCCCATGT37560CCAGCGCGGTGCGGATCGCCCAGCCGATGCGGMGGCGGTCGAGAGCCGGGTGTACTTGT37620CCTCGTACTCGCCGGTGAGGMGCCGACGCCGCGCACGCCCTCGTGCTCGMCAGGATGC37680GCAGCTGGTCGATGATCTCGTCGCGGCCGGAGMCTTGCGCTCCATGCGGGCGTTGCCCT37740TGCGCATCGAGCACATCTTGCACTCGGAGTCGCAGTGGTTGGTCGTGTAGAGCGGGACGA37800ACGTGTGCAGCCGGGGCGTGCGCTCCGCGCAGCGCAGCTCCGCGGCGGCGACCAGCTCCG37860CGGTGCTCACCGACTCGTCCTCCCAGAGCGCCAGCGCGACCGCGGGCCGGGACGCGCCCG37920GCTCGTCGTCCGGGCCCAGCGCGAGCACCGCACGGGTGTCGACGGTCGCCGCCTCGATGC37980GCACCTGAGCCAGATCCGGCAGCACGMGTCGGGATGACCGGTACCGGGGTATTCCGCCA38040TGACTAGTTCCTTCCCGCGTTGCGCGGCAGATCCGCACMATGGGTTCGCTGCTTGATTC38100GACTATCGGGGCCAGATATCGCCGMCCGGCCGCGCCAGTGGCCCAGCACGTTCGAGGTA38160ACACGACCCCGGCAGGCCGTGTCATGGGGAAGTTCCTGCAACTAGGCCGCTGACCAGGGA38220ATTTACTTGTGCCAGTAGCTCAGATTCATGGCGCGTGAGCCGAATCGATGGCGATCGTAG38280AGCGGTTATATAGCGTTCTTTCGTCGCCACCGAGMTCTTGGCCGCMGTTCGGAGACTG38340CTTGACACCCCGGTCGCCGGATCMTMCTTCGGTGTCGGGGCCAGGCGAATCCGGTACG38400MCCACMGCCCATMGAAAGAGGTGTTTCCATGTCCGCTGACCTGTCTGCGCTGMCAT38460CGACTCCCTGGAGATCTCGGAGTTCCTGGACGACAGCCGCCTGGAGGACAGCGAGGTCGT38520GGCCAAGGTCATGTCGGCCTCCTGCACCACCTGCGAGTGCTCCTGCAGCTGCTCGTCCTG38580ATCAGCCCGAGGGGTTTCCCCCCTCGCGTGCGGTGACGTGCGGTCCCGCGACCTTCCCGG38640CCCAGCCTGGCCACCGGAGGGTTGCGGGACCGCCGCCCGCGGTCAGGCGCGGACCACGAG38700AAAGGACCGACCCATGTCGACCGCCGTGTCTCTATCGTCCCTTGTGGACGTGGTGCCCGC38760GCCAGCGCCGMCCTGCCGTCCTCGACCGACGAGCAGCACATGCTGATGCTCTACGTGCA38820CGTCCCGTTCTGCCACTCCAAGTGCACCTTCTGCGACTGGGTGCAGGCGATCCCGACCM38880GGACCTGCTGCGCMGCCCGAGGACTCGGTCCGCAAGMCTACATCCGCGCCCTGGTCAC38940CGAGATCGAGACCCGGGGCGCGCAGCTTCGGGCCGCTGGCCAGGTGCCCTACGTCGTCTA39000CTGGGGCGGCGGCACCGCGTCCAGCCTGGACMCGCCGAGGCCGAGGCGATCTGGGGCGC39060GCTGGACTCCGCGTTCGACCTCAGCACCGTCGCCGAGGCGACCATCGAGTGCAGCCCCGA39120CACCGTCGACAAGGCCMGCTGGAGTTCTTCCGCGGCCTGGGCTTCAACCGCGTCTCCAG39180CGGCGTGCAGTCCTTCGACGACGCGCGCCTGCGCAGGCTCGGCAGGCGCCACACCGCGGG39240CGAGGCCGACCGCATCGTGCACCACGCCCGCGAGGCGGGCTTCGACGAGGTGTCCATCGA39300CATCATGTCCGGCTTCCCCGACCAGGAGCTGGACGAGCTGCGCGCGACCGTCGAGAAGGC39360GGTGTCGCTGCCGCTGACCCACCTGTCGCTGTACTCCTTCCGCCCGACGCCGGGCACGTT39420CATGCGCCGCAAGCTCGCGGGCACCGAGMGCGCGCGTACCTGCGCAAGCAGCAGGCCCT39480GTTCACCGAGGCCCGCCGCATGATCATCGACGCCGGCCTGCCCGAGTACGCCTCCGGCTA39540CTTCGGCAGGGTGTCGCCGTTCGCGGCCATGTACTTCCAGCTGCGCGCCGACACCGCGGG39600CTTCGGCTCCGGCGCGATCTCCCTGGTCGACCGCCAGTTCCTCTCCCACGCCAAGGGCM39660GCTGCACGCCTACATCCAGGACCCGCTGGCCTACGACATCGATGTGCCCGCAGGCCMGA39720CCGCGTGCTGGTCTCGTTCCTGCAGGCAGGCCTCGCCATGTTCGACGGCGTCCTGCGCGA39780GGAGTGGCGCGTCTCCACCGGCACCGACCTCGACGAGGTGCTCACCCGCCCGTCGATCGC39840CCCGCTCGCGGACTTCCTGCGCGGGCGCGGCCTGATCGAGGACGAGCGCGGCATCCGCCT39900CGACCCCCGGCTGGCCGGGCTGACCCTGATCGAGCTGGCCTTCGAGATGGCCATGTCCCA39960GCCGGAGTCGGCGTGACCTGGACGGMCTGGTCTTCCCGGCGACCCAGGACGAGCAGCCC40020GGCCTGGTCGCCGGGGTGCTCGCCCCGCTGCTGGCCGACCTCGACCGCCCCGGCCTGTTC40080CTGCGCGAACTCGGCCCCGAGGGCGCCACCCGACTGCTGCTCCMGTCCGCGACGCCCCA40140CCGGACCTGCCGACCAGGACCGCGGCCCTGCCCGTGCAGCCGACGGCCGTGCGCGCTGCC40200ACCGTCGCCCCGCTGGGCGGCCCGGTCTTCGACGGCCCCGGCCTGGACGAGACCACCCGC40260GGCTTCCTGGCGGACACCGCGCCGGTGGCCGTCGACCTGTCCACCCGCCCCGACCGCACC40320GGCGCGGCCCTGACCCTGATGACCGCCCACCTCGCCGCGGTGGCCGACCCGGCCCGCTCC40380GGCGACGGCCCTCCGCTGAGCTTCCTCAGCTTCCGCTCCCACGCCGAGGCGTTCCTGGCC40440ACCACCCGCGACCCGMCGCCGCCCGGCACGCCTTCGACACCCGCTACACCGACCACCGC40500虹ACCGTCGMGCCGCCGTCCGGGCGATCCTGCTCGACGGCGACCCTGGCGACGCCGCG40560CCCTGGTCCGCCGCGGCCCGCGCCGCGAAACCCCGGTTCACCGCGGGCTTCGCCAGCGCG40620GACCTGGTCGCCCACACCGGCTACACCCGCGACCACCTCCGGGMCGCACGGACTTCGCG40680GGCGCTCGGCCCAGCCGCCGCGCGGACCGCCGAGGTAGCCGCTCGCTCCACCGACACCGGCCACGGCGGCTCGMGTGATGTGGGCGTCGGTCCGCGCCTGGTGAGGACGGMCAGCTGGGCCCACGGCGGTCGATGGCCCCGGTAGGCGCAGTCGATCCTCCACAGCAGTCCTGGCGACGCCTGATGCAACGTCGACAGGCCGCTCCCGCGCTTGCTGCACGCCTCGGCCGCACCGCTTGGGCGGTGCGCGCTGCGCACACGCGGTACATGCCGGTCTCGCCTTGCTCCATCGCCGCAGCGACCGCGGGGTCGAGGTCGGTCGGCCAGGGAGGACGGTCGAGGAGGGCGAGGACCGAGGGACGTACTCGCATGTCGTGGGGCGCCCACCGCGACGGAGACCGTTCTCGTCGGGAGMGAGTGGGCCTGCTCCGAGGTCATCCATCGGCAAGCTCCCGGAGGCGGGCGCGCCGCCTGCTCGCGCTACTTCCATGAGCCTGTCAGCGGGGGTCAGCGCAAGGCACGTGCGGGCAGGCCAGGTCGGGAGAGCGCAGTCGACCCGTCTGGGCAGTTCGAGGCGCTCCGTGATTGAAACGTGCGAGGGGGCACAGTGGAGCGCGMGCGGGCGAAGGGCCGGGTGCGTCGCGGCTCGACCGCGCCCGAGGTTGCCCGTGCCTGGCCCGCGGGGCTCTTGCGGGGACGCGGCCTGCGCCGTGCGGGCTCGGCCTTCGCCGGGCAGTCGCCGCTGGACGGGTCGGTTCCGAGCAGCACCAGCCTGCCTCTGCCACGCTGGCAGACCCGGCGCCGCGGTCGTGAGCACAGTGCTCGTGCGCACGTTTACGCGGCCGGMCTCGGCGACACTCGAAGCTGCGGGTGGGCGTCGACCGCCTCACCGGCCGGTCACGCMGGTGCGGCGGCCGCGTTCGGGGCTTTCGGTCCGCTATGCGTCGCGGCCGGGTTCCACTGCTCGGTTCGGTTCAGGCGTCGCTTGGCCCGTGATGCGGTCGGCGCTCGGCGGACGGTGAGGGTCGMGACGACGGGTCCATGCGCATCMCTACAGGCGTATCTACGTGACCCATAGCCAATGGCGGTCGGGTGTCGGATCGGTCTCGGCAGGTGGTCGGCCCAGCAGGGCTCGTCTCGCACCGACGGCTCACGCCTCGATACTCCMCATGCAGCCTGCGACCGCCGGTCGCCCGCTGGCCTCGATGCGGGGGCGGGAGGGGCGACGGACCTGGTCCACCTCCCGCCCCGCGGGTCGTTGGGGGACAGGCATCTGCTTGGTCGGCCACCGGTGTCCAGACATCTGCGTCTACGTTGCGCTACGACGAACTGTGCCGMCAATGTCCGGTCCCTGGGCGGCCCTGCACTCGGGCCTGCGAGGTAGCCCGGAATCCGTCGCGGGCCCGCTCGGTGCTCGGCGTCGMTCACGCACGTCGGCGGCCGAGACAGGCACGCCGCCCTGGGTTGCGCTCCCCATGGGCGGCGACCGAGGTAGGCGAAGGGGAAGTCAGGTCGGGGCCAGCCGTGCCGCGAGGTAGAACGGCGTCGCACGTCGAGCGAGAGCAGGGGGCTCGGCCGGGGATGCGGAGCGTCGCCGAGCGGCGCCCTCCGATGTCGAGCGTCGCCCTGCCTGCTGGGTACCTCCTGGT40740408004086040920409804104041100411604122041280413404140041460415204158041640417004176041820418804194042000420604212042180422404230042360424204248055TGTCGTAGGGCTGTGATGTCCGCTACGGGGCCGGCGCACGCTGGAGCCGCCCCGCGCTCGGACGACGACCGACCGGGCCGCAGGTCGCGGACGGCGCTGGCACCTGCGCGACCCGCCTGCGGTCCGCCGTGTCGTCCTGGMGCGMCCCACCCTGGCGAGCGGTGCTGGCGCCGAGCCGGCCATGCGGGTCCGGCGGCCATCACCACCGCACGACACCCGCATTCATTGGGGAGCGGGCCGGCGGCGGCACGTGGACAGCCCAGGCGCTCCGGTGAGCGGGCGGGTCGGTGGCCCTGGCGTGTCAATGCMCCAGAGGAACGTCCCCTCTGCTGTCGGCAGCTGATCGCGCGTGGCGAGACGCCACCGGTCACCGCGTGGCCTGCCCCAGCGGCGACCGCCGCCCACCCGCCACGCCTCAACGGGTAAGTCGGCCTTCCTGGCCAAGATCCATCCTCCTTGGCCGCCCATGAAATCCACAACAGCGCGTTTGACCAGGTGCAAAGCGGGGCGGCTGACCACGTTCATCGTATGCGGGATGACAGCGGTGTTCCTTCGGCCGCCGCCTCGGGTGCTGGACGCCGACCGGCGMTMGGCGAGCACGACTCCGACATGGAGCATGCAACTCCCTGGTCCTGCGCCGCGCGCCCGCCAGGCCCGAGGAGCGCGGCGGCCCGCCCTGACCGGCGGCGAGCGACCGGCCTCGCCCCGCGACCGCCACCTGCATGCGCGTACGCGGMCGCCTTCGACCTCGAACGTTCGCCGTCCCCGACGCTGGACCAGGTCGAGCCGCGGTCGGACTCCACACGCCGCGAGGATGMGCGTTCAGGACAGTGGCCCAGGGTGGTCGGTCTGTCTGGGCTGCGCTGGGCTCCGMGGCGTACGAGCGCGGGCGCGTTGTAGCATATCAGGMGGTCGAGGACGGTCCGGCACCGAGCGGGGCGGCCGAGCGCCGTCCGCGCCGMCTCCGCCGGACGCCCGCCCTCCTGGCCCGACCGCATCGTGACGGGCCGTTCTTCGATTACCCTGGTGCGACCTGGTGGGTCGCCCTGGGCATGGGCGGCTGGCCCGCCGAGATACTCCGTGCTGGMAGCCCTGTCCGCAGGGCACTTGTACCGTTCCCACTGCGCGAGGGGCGGATGACGGGGAGCAGGMCCCGACGCGGCGGGATGCGTGGACATCGGACMCGTTGTCGTCGMCCCGCGACGATCGCCCGGGGTGCGCGCGCATCAGCTGGGCGCTACCTGCGAACGCGACCGCGCTGCGCGGGCACCGCCGACCCTGCACGAACGCCGTCACCGCGGCCCAGCGTGGACCGGTGGCGCTGCGTCACCGTGGCCTGAGGGCATCCGTCCGCTCACGGCCGACTAGGCCGTCCGCCGACGGCAGACGTGACGGAGGACGGCGCCATCGATCACCCGAGGTCCGCTTGCGGCCCAGGACCGGGACCGCGGTCGCCCGACGTGCTGGACCGACGAGCGAGTTCCTCACGATGACMCCTGAGCCCGCGAGGCTGACCCTCGGCGAACCGCCTGGCCCCTGCGCCCCGCGGGCGGGCACTCGCGGGCCGACGTCCACCGCCGCCCCGCGCCGAGACCCCCTGCGTGATCTCGTGCGGTCTGTCCGGCCCTGGGCTCCCTTCGCCATGCCCCCGCATCGGACGAGGACGTCCGCGGGCCCTCAGCGTCCGTGCCACGACMCCCCACACTCGATCAAAGGTCGGTACGGAGCTGATCGGGACTGCCCGGAGTTGCGCGCTGTCGGCGCATGCTGGCCCAAGGGCACCA425404260042660427204278042840429004296043020430804314043200432604332043380434404350043560436204368043740438004386043920439804404044100441604422044280TCGAGGCGCTGCCGCTGCCCGCTGGCACGATCGACGTGGTGATCTCCMCTGCGTGATCA44340ACCTGTCGGTGGACAAGCCCGCGGTGTTCGCCGAGATGTTCCGGGTGCTCGCCCCCGGCG44400GCCGGATCGGCGTGTCGGACGTGGTGGCCGAGGATGCGCTCAGCGCGACCGAGCGCGCTG44460AGCGCGGCTCCTACGTGGAGTGCATCGCCGGAGCGCTGACCTTCGCCGAGTACCGCCGCG44520GCCTGGAACGGGCCGGGTTCGCCGACGTCGACATCACCGCGACCCACCAGGTGGCCGACG44580GGATGCACTCGGCGATCGTGCGGGCGGTCAAGCCCGCCACCGGGCCGGTCGCCGAGCCCG44640CGGCCGTCGCGGCCTCCGGATCGTGCTGCGGGGTGAGCGCGTGCTGCACGCCTGCCGAGT44700CGGCGCTGGACCGGTCGAGCACGGTGGCCGAAGCGAAGGCCGCTTCCGGTTGCGGCTGCC44760AGAGCTGAGCACGTGCGGGCGGGCCCGCGGTGCGGACTCGGMGGCAGGCCCACCGCGGG44820CGCGCCCCCGCGACGCCGCACCGCCGGGCCTGGCGGTGCCMGGTCCGTCTATGGTTTGA44880CCGACTCGGGTAGCGCAGCACCGGCCATCCGCGGTGTTCCGGCGATGGCACGGCGGTCCA44940GGTGCCGATGGMGGMCACCCCTGTGACGACCAGGCCGCGGATCACGGCGTCGGCGCTG45000ACCCTGGCGGGCGCCCTGGTGCTGTCCGCCTGTGGCAGCGACGACMCCGGGACACGATC45060AAGTGGACCCTCGACAAGGGGMCGTTCCGGTTCCCACCGCGACGATCCCGATCGACTGC45120GGCGGCACGCGAGCACTGACCGGCGAGGGCTCCACCGCCCAGAAGGGCGCGATGGACGTG45180TTCGTCGCCGCCTACACCCAGCAGTGCCCCGGCCAGCAGATGGCGTACACGGCCAGCGGC45240TCGGGCGCGGGGGTCMGCAGTTCCTCGCCGGGCTGGTCGACATCGGCGGCAGCGACTCG45300GCGCTCAAGCCGGAGCGGGGCGAGGTCACCGACGCCGCCGCGCGCTGCGGCGGCMCCCG45360GCCTGGAACCTGCCCCTGGTGTTCGGTCCGGTCGCCGTGGTCTACCAGATCCGATATCTC45420TAGAGCCGCCCGCAGGACGCTTCCGCMGGCAGCTTTCTGGACCACTCCGGAAGCGGTCC45480TCCGTTGCTGTCGMGGGACCCTGTCCGCCCTGGGAGATCTGGCAGCCCGGGCCCCCGCT45540TTTCGCGTCTTGATCGGGAC45560<210>2<211>49<212>PRT<213>iVocaWflsp.WW-12651<400>1MetSerAlaAspLeuSerAlaLeuAsnlieAspSerLeuGlulieSer151015GluPheLeuAspAspSerArgLeuGluAspSerGluValValAlaLys202530ValMetSerAlaSerCysThrThrCysGluCysSerCysSerCysSer354045Ser<210>3<211>631<212>PRT<213>iVoc^/flsp.WW-12651<400>1ValAlaAlaProGinValAlaGlyThrGlyPheLeuAlaAspGluLeu151015GlyArgArgLeuSerAlaAspProProAlaGlyValAspThrValLeu202530ValAlaGluLeuAspArglieGlyGluHisHisAspLeulieValGlu354045CysLeuGlyThrGlyArgProLeuLeuPheValGlyThrTyrArgSer505560LeuValTyrlieGlyProLeuTrpAlaSerArgValProGlyCysPro65707580HisCysLeuValThrArgThrAlaAsnSerProPheGlyProAspLeu859095ArgGlyAspThrAlaProGluSerSerArgArgAspThrAlaThrPhe100105110ThrLeuGlyProGlyValLeuAlaAlaValGluArgLeuValArgGlu115AlaAspSerGlyArgMet130ThrValValAsp120AspGlyProGlyVal145LeuProAspSerPro135ValThrAlaThr125ProAspCysGluGly150CysAlaSerCysSer140AspArgGinValThr165ThrProArgGluVal155GlyAlaGluAlaValProValPhe180ArgThrAlaGluGly170ProLeuProLysArgTyrSerLeu195PheVal185AspAlaAspThrAsp175GlyLeu160ThrProLeu210SerProlieAlaGlylieGin225ArgArgGluProGlyGlyLeu200LeuPheLysGluLeu190AlaLysAspGly215CysSerValGluVal205ArgGinAspLeuAla230lieGlyArgGlyVal220GlyThrArgTrpAla245LeuGluGlyLeuLeu235ThrTyrArgSerThrlieAlaVal260SerAlaProValArg250ArgTyrAlaGlyGlyArgAla305AspGlyAla290Glu275lieGlu265AlaCysTyrAlaSer255HisGly240ArgArgAspProThrGlyTrpValTrpArg280LeuGlyThrHisLeu270ValAlaAspProGlyPheThr295PheArgArgPheAsp285GluAlaSerTyrArg310TyrSerMetArgPro300ArgAspThrValProGluArgAla340Ala325AlaPheT卬GlyAsp315GlyGluArgValPro345Arg330ArgHisAspArgGlyGlu350Leu335ThrVal320LeuAlaPheLeuTyrAspThrSerAsnGlyCysAlaLeuGlyAsnSerAlaGlu355ValLeuHisGlyGluAla370MetAlaTrpTyrGly360ArgGluValAlaLeu385GlyAlsAspAlaLeu375ArgArgLeuAlaLeu390LeuAspAlaLeuGlu380GluAsn365ArglieAspMetThrGlyPheCysGly405PheArgAlaPhePro395ArgLysAlaGluAspSerPheAspProValArg420TrpLeuValAlaThr435AlaGlyAlaGlyPhe450GlyLeuHisGluGly465TyrGluArgArgLeu470AlaAla455lieGlu440HisLeu425SerLeu410SerThrMetGluLeu415ArgVal400PheMetArgLeuAspAspProAspProTyr430AspGlyProArg445GinAlalieAlaAspGlyLeuArg485MetGluAspHisGlySerValGlyVal460AlaThrArgHisLeuMetThrArg500ArgTrpSerPheAlaArgGlu515AlaAspValProSer505LeuAla490LeuLeu475MetL>euAlaAspValGlyAlaGlyAspAlaAspPro495ProSer480AlaGluAlaLeu530ArgAlaAspLeuAsp545AspValLeuValLeu520ThrLeuArgGluGly535AlaValSerGlyAla525GluVal550AspGinThrMetArg540LeuAlsAleiLeu510GlyArgValProAspLeuVal565LeuThrCysValArgValValValProGlyAlaValProMetThrPhePro570GlyVal555GluLeuArgArgAspGlyAsn575ThrMet560GlyGlyHisArgAsnArgArgThrArgAspLeuProArgLeuAlaGlyGly595600605AlaGlyLeuProTyrArgSerGlyLeuValAspGlyGluGluProGly610615620CysValProHisProPhePro625630<210>4<211>479<212〉PRT<213>A/bcmftflsp.WW-12651<400>1ValThrGlyAspLeuAlaGluHisThrGluSerLeuArgArgAspPro151015GinGlyAlaAsnProAspGlyTrpArgValAspTrpAlaAspGlyPro202530TrpProValLysValTyrAlaGlyGlyValArgThrProLeuGlyArg354045AlaGlyAlaLeuAspArgLeuLeuLe.uPheThrPheGlyMetThrAla505560ValArgPheAspProAlaGlyGlyMetProSerThrProAspAsnPro65707580ThrProThrHisLeuGlyGluArgTyrAlaProArgArgProliePro859095SerGlyGlySerMetTyrProThrGluAlaTyrValValAspThrGlu100105110AlaGlyArg'ValSerHisTyrAspProTyrArgHisGluLeuValAsp61LeuPro145PheGly130Ala115ArgProAlaPro120AlaAlaLeuArgAspAlaProLysArg135ProProAlaVal125AlaLeuGlyGluTrpLysAsnLeu150TyrLysTyxGlyAla140LeuValAlaAsnAla165GlyValAlaLeuLeu155PheAlaAlaArgAlaValAspThr180AlaAlaPheGlyAsplieAla195ValGluAspLeuLeuGlyGly185LeuGlu170ArgAlaAlaArgLeu175AlaArg160GlyGluGlu210ValGluLeu'GlyVal200AspGlyArgValAspLeuAla225GluArgAlaAlaLeu215ArgArgAspCysAspAspVal190AlaAlaAlaAsp205AlaValPheAlaArg230ProProValLeuGlu220AlaGluProProPro245LeuSerAlaLeuPro235ArgSerArgAlaArgLeuProGly260AlaValAspArgGlu250GluAlaAlaArgGluProVal275AspProGlyValThr265AlaAlaValArgVal255ProAla240AlaLeuLeu290ThrGlyAlaProPro280ValArgArgGlyGin270ProLeuAspPhe305HisAlaAlaGluValGlyAlaGlu340Val310AlaMet295ArgLeuAlaAspGly285HisGlyArgArgSer300GluAlaValLeuAla325AlaGlyLeuAlaArgLeuArgCysVal315AlaValSerGlyCys345AlaAlaValSerGlyGly330335AlaValArgArgValGluVal350Leu320AlaGlyLeuAlaProGlyTrpTyrArgPheAspGlyAlaLeuValProValAla355360365GluAspAspProGlyProValLeuArgArgAlaLeuPheAlaGluSer370375380LeuAsnProGluLeuAlaAlaPheThrValHisValThrGlyProVal385390395400AspPheAlaGlyGlyAlaAlaGlyTyrArgAlaArgGinLeuGlyVal405410415GlyAlaValValGluAlaValCysUuAlaAlaThrAlaAlaArgUu420425430SerGlyHisAlaValLeuGlyPheAspValGlyProlieAspLeuAla435440445TyrAlaLeuProAlaAspArgGlyValHisAlaGinValCysValGly450455460AlaValArgProSerThrHisTrpGluValAlaValMetProArg465470475<210>5<211>852<212>PRT<213>iVooiWflsp.WW-12651<400>1ValLeuPheArgArgGlyThrlieGlyLeuProAlaLeuAlaGlyLeu151015ValProThrArgThrTrpGluUuLeuAlaAlaAlaAspAlaGluArg202530AlaValArgGluProLeuArgAlaArgLeuSerAspAlaLeuHisAla354045Arg65ProAsp55AspArgValProValValProGluValAlaAspAlaGluArgArgAlaValLeuLysLeu50ArgAspValHisGlyAspLeuGlyAsn70GluArgValGlyAla60SerValProProArgGlyAlaAla85LeuGluAlaLeuAla75TrpValAlaAlaGlu100AlaArgLysAlaGlu90GluGluValTyrLeuGluSer115ArgGlyValGinPheGin130ThrAla145ArgArgArgAlaAla105LeuAlaAlaValAla120SerGlyGluAspArg95AlaLeu80ArgGluAla110GlyGluAspTyrAlaGlyArgLeu135ProPheAspThrLeu125HisArgGluValAsp150SerThrlieThrVal140ArgLysProAlaGlu165ProPheGlyAlaThr155PheAlaTyrArgPheLysProSer180TrpGlyAlaAlaProAlaAla195GlyLeuLeuAlaSer170ThrGlulieGlyPhe185GluArgValAlaVal175GinLys160ValProSerGly225ArgVal210AlaGlyAlaLeuGly200MetThrHisGinAla190AlaArgLeuGlyGluHisAspGlyPheAla245ProTrp215LeuArgValArgLeu230ValSerValArgArg205HisArgValAspLeu220AsnAsnSerLeuAlaVal235240ArgProLeuGluGlyAlaAsp250255ArgAlaLysAsnSerProLeuArgProAspGinVallieArgAlaLysAsnSer260265270ValArgValLeuValGlyLeuLeuAlaAspHisAspArgThrGluAsp275ArgAlaArgLeuAspLeu290GlyThrlieAspAla305LeuGlyLeuProGin310GinVal295Leu280AspAlaGlyLeuValArgAla285AlaAspAlaAlaArgAlaAspArgAla300LeuCysHisAsp325ValGlyThrAlaArgLeuAlaAla340PheThrGlyLeuGinAlaVal355ArgThrGlyLeuGly315ValAlaGluGluVal330AlaLeuAlaCysGin345AspAlaPheAlaAlaArg370PheValGluValVal385AlaAlaLeuTyrGlu360AlaGluLeuArgArgGly320AlaSer335AlaGluVal350AlaProAlaLeu375CysProProProAsp365LeuValAlaArgGly390AspValGlyThrAla380ArgGluAlaGlu405LeuGluArgAspAla395AlaHisAlaAspArgProAlaLeu420ProLeuLeuAspArg410GluAsnLeuAspArgLeuVal435TyrAlaPhePheAlaAspArg425AlalieValGluMetArg400SerTrp415LeuGinAla450ValGluLeuTyrAsp440PheGlyGluAspLeu430LeuGlyLeuVal465SerAlaValMetAlaLeuArgArg500Arg455AlaPheSerAlaGlu470GlyValGlyAspCys485AspPheLeuGlyTrp505Leu475ProHis490ValArgAspGinLys445HisAlaGlyValPro460SerProAlaGluAla480AlaGinHisValLeu495ArgAlaAsp510Leu515ProThrValValGlyGluLeuValLeuAspProAlaHisLeuAlaSerValValAspAla520TrpArgSerThrLeuPro530GinAlaAspAspLeu545ValPhePheSerPro535ValValAsnGlyThr550TyrCysAspLeuAla540ThrVal525TyrArgV.alGinThrArg565LeuArgAspThrlie555GlyGlyGlyLeuAlaGlySer580■AlaAsplieThrAlaAlaLeu595ProLeuGluValLeu570AlaArgHisThrlie585LeuAsnPheAsnLeuThr610AlaThr625ThrThrGly600TyrProGlySerGlyHisGly560ArgPheAsp575ProArgGin590HisProArgGlyValLeuArgVal615LeuAlaAspLeuLeu605GinArgProGlyArgThr630AlaLeuTrpSerVal620ValArgAlaLeu645LeuAsnPheLeuVal635GinAspGlyGluAspLeuAlaPro660LeuCysAlsPheThr650ProAlaAlaAlaTyrArgPhe675AspGinLeuAspTyr665ProThrArgThrAspPro640Arglie655MetLeuLeuTrp690ArgValArgLeuGly705ProValAlaAspAla680AlaGlyLeuAlaArg695LeuValLeuAspPro670TyrArgGlyGly685AlaAspArgProLeu725GluGly710ProAlaLeuPro700ArgSerTrpAspThrAlaLeuAlaGluPheAspAlaTrpGly730ArgArg715LeuGluArgGinArgLeu720GluLeu735ArgAlaAlaGlyLeuProPhePheArgValArgHisAla755AspTyrAlaAlaGluArg770SerAlaArgLeuHis785LeuLeuHisValGlu775ProVal760ThrHis745AlaProPro750AlaAspGlyArgTyrLys790AlaLysGinAlaValArg765GluTrp.AlaLeuGinAlaArg780AlaAlaLeu805GluCysLeuProValValValGin820AlaGlySerAlaGluGluPhe835CysAspAlaArg850Phe840LeuAsp795ArgAlaThrPro810AlaGluGlyTyrGly825ValGluHisThrLeu845AsnProPhe800GlyGlyHis815AlaSerGly830ThrGlyGly<210>6<211>330<212>PRT<213>iVoc"幽sp.WW-12651<400>1ValTrpArgAlaLeuHisValHisArgTyrAlaAspGinAspThrLeu151015lieThrAspGlylieAlaProValLeuGluLeuLeuArgGluSerGly202530AlalieHisGlyTrpPhePheLeuArgTyrTrpGinGlyGlyHisHis354045lieArgValArgMetArgValAlaGluThrAspAlaAspAlaValVal50GluValAspGlyGly65AlaGluGinPhe55LysLeuArgAlaTyrLeu7075AlaGluGluPheHisArgAsp85GluGlyThrAlaMetAlaAlaLeu100ArgValGluTyrHis90GluGlulieHisSerValArg115GlyValAlaValAla105ProGluHisAsp60AlaGluHisProAla80GluAlaGinProThr95ProAspProlie145ThrAsp130ValValAspAlaGlyMetGlyAla120GluAspTyrPheAla135ArgAlaVal■Leu150GlyMetMetLeuTyrGlyPro110LysTyrGlyGly125AspSerSerAlaGly140LysSerSerTyr165GluMetAlaAlaGly155GlyLeuCysAlaUuThrProAla180TyrValPheAspArg170PheAlaHisTyrTrpSerPro195GluHisSerAlaLeuAla210AsnArgGlyAlaAla225ArgAlaTrpAlaPro215AlaGly200LeuPhe185PheLeuAspAlaLysArg160ThrAsp175VallieCys190ProAlaLeuGlyAspProLeu230ValHisGluAlaArgAlaHisAspTrp205GluAlaValLeuArg245GlyAsp.AspAlaMet235ProThr220HisAspAlaValArgLeuAla260LeuLeuValSerTyrLeuHis275Gly250AlaAlaArgArgThr280Ser265HisAsnAsnArgValGly240AlaValLeuAspArg255GinValPhe285Ala270GlyLeulieProGluLeuGluAlaPheLeuGlyTyrLeuGlyHisHisValLeuSer290295300GlyCysAlaGlyThrProValAspAlaGlyLeuGluSerArgValArg305310315320SerHisArgAlaGinLeulieGlyThrPro325330<210>7<211>366<212>PRT<213>Mowt/!asp.WW-12651<400>1ValLeuAlaLeuGlyProAspAspGluProGlyAlaSerArgProAla151015ValAlaLeuAlaLeuTrpGluAspGluSerValSerThrAlaGluLeu202530ValAlaAlaAlaGluLeuArgCysAlaGluArgThrProArgLeuHis354045ThrPheValProLeirTyrThrThrAsnHisCysAspSerGluCysLys505560MetCysSerMetArgLysGlyAsnAlaArgMetGluArgLysPheSer65707580GlyArgAspGlulielieAspGinLeuArglieLeuPheGluHisGlu859095GlyValArgGlyValGlyPheLeuThrGlyGluTyrGluAspLysTyr100105110ThrArgLeuSerThrAlaPheArglieGlyTrpAlalieArgThrAla115120125LeuAspMetGlyPheGluArgValTyrPheAsn130ProAspGlulieAsp145ValThrMetCysArgValTyrPheAsnlie135140LeuAlaGluTrpValArgVal150PheGinGluThrVal165AspThrValSerLysPheMetGly180ValSerPheAspArgArgVal195ProGlyValLeuGly185TrpTyr170ValVal155AspArgLysLeuAspLysGlySerMetGluArgAspAspAspSerProLysAlaTyr175TyrPro160SerAspValAsn210LeuValThrLeuVal225ValValAspLeuSer245lielie215HisArg200GlyLeuHisLeuAsp190PheArgTyrGly205ValAlaAlaGluAla230ValProArgMetAsp'SerThrArg260ThrCysProGluGlyAlaHisArgLysAspAspAsp220LysAspArgAspLeu235ProAlaMetSerArg250TyrMetArgLeuLeuAlaPhe275GluPheGinAspProGin290ProGlySerProAsp305AsnGluGluThrGin280AlaGlu265ArgLeuValLeuSer255AlaAla240ArgValMet270ThrArgGluGin295AlaProTyrlieGlyLeuVal310SerGinPheLeuGlyArgThr285GlyVallieSerAla300AspSerGinAlaArgHislieLeu340ProThr325GlyArglieGluAla315AlaAspLeuArgVal330GlyGlyThrLysAla345PheAlaAsnProSerValGlyAlaAlaVallieProlieVal350GlyArg335GlyArg320ProHis355<210>8<211>410<212>PRT<213>iVoawfftasp.WW-12651360365<400>1ValArgTrpGlyGlyGluSerAlaThrTrpAspGluLeuLeuAspArg1GlyArgGluAspProThrGlu65LeuVal50LeuAla35AlaArg20Ala5SerAla丄euValGlyLeuGluAspThrValAlaProGlyGluArgProAlaLysLeuHisTyrProMet145ProVal130ThrGlu115LeuAla100Leu85lieLeu70TrpLeu55AlaSer40LeuAla25Leu10ProGinArgAlaValSerTrpSerSerGluAlaAspGlyValAlaGlyHisAlaSerLeuTyrAlaThr.CysValLeuProSer150Leu135LeuGly120ProAsp105AspThr90SerLeu75SerLeuPhe45GlyPro60ProValTyr30AlaGlyAsp15ArgValValAlaGlySerThrTrpGluSerCysSerLeuGinPhePheLeuArgArg155AlaAsp125SerAla140AspLeulie110GlyGlyGlyGly95AlaArgPro80AsnLeuMetProSerPhePheLeuValAlaHisAspTrpSerAlaAlaHisAlaGluAlaAlaGluArgPhe160Asp165lieAlaValUuAlaValProAla180GinValAspAlaMetAspArg195LeuGlyAlaGlu170LeuAlaAlaAlaAla185ArglieThrLeuGlyHis210GlyValSerValArg225AlaValAspGinSer200ValArgMetValArg215LeuTyrGlyThrAlaGlyLysAla260ValAsp245ValAsn230ProGlyHisAsnAlaValAla275AlaGlyGlu290GlyArgPheAspAla305GlyGlyGluLysTrpLeuGluGlyLeuArgArgGin250ThrAla235HisArg220Glu175CysLeuThr190LeuGlyGlyArgPheSerGlyPhe205GluThrGlyAlaValGlyValGlyAspProAspAlaGlyProGly265CysCysLeuGlyAsp280GlyGlyTyrValAsn295GlyArgLeuCysGlu310HisGlyValLeuArgHisLeuLeu340AspLeu325■AlaLeuProGlyLeu315TyrAla300GluThr285SerGly270TrpPro255lieArgAspVal240ValGlyProThrAspTyrProArgAla.Val330AlaAspAlaLysGlyArgValArgHisArgAla355SerThrGlyLeuGlyAlaAspAspVal345HisLeuValAlaVal335AlaAsp320GlulieSerAla370AlaGluArgProSer385Glu360ArgGluHisCysVal350ValValGlyArg390Val375ValGluCysValPro395Arg365AlaAlaLeuProGlu380GluGluLeuAlaLeu400AlaAlaTyrSerProAsnGlyLysLeuSer405410<210>9<211>295<212>PRT<213>iVocflWasp.WW-12651<400>1MetSerArgGluAlaAlaGlyAspGlySerSerProValTyrPheLeu151015HisGlyLeuLeuGlyThrAlaTyrGlyHisPheGlyAlaGinlieAla202530AlaTrpSerGlyArgArgArgValValProValAspLeuProGlyHis354045GlyArgCysProValAspAlaGlyProAspTyrLeuAspThrAlaLeu505560GluTyrValAlaAlaLeuValAspHisPheGlyProGlyHisLeuVal65707580AlaAlaSerHisLeuGlyGlyProLeuAlaValArgLeuAlaGluAla859095ArgProGluLeuValGluSerLeuValLeuThrGlyPhePheProGly100105110AlaAspArgGluSerPheAlaArgLeuLeuAspGlyPheGlyValLeu115120125ValGluGluAsnProGluLeuAlaAlaGluTyrAspArgLeuHisPro130135140GlyArgTrpArgThrThrLeuAlaGluPheSerGlyHisAlaThrAla145150155160LeaLeu210ThrAlaGluPheAspAspArgAlaArglieAla165GlyCysAspValLeuLeuValAsnGly180185GluAlaAlaLeuAlaAlaArgSerTyr195200AspGlyAlaGlyHislieAla215AlaValGluGluPheTrp230GluAsnAspProAlaArg245LeuSerTyrLeuThrArg260265AspArgProSerThrlie280ArgArgSerLeuValSer290295Phe225LeuLeuArgValThrAlaProAlaGly275L>euArgArgAlaGluArgLeu170ThrLeuLysSerGlyProArgVal205SerHisAspAla220LeuGlyAlaAla235ProLeuAspSer250LysGlyLeuAlaGluGlyTrpVal285GlyAlaLeu175GluArgAla190HisGlyValProGluAlaLeuArgAla240LeuGluSer255GinArgGlu270AlaTrpAla<210>10<211>420<212>PRT<213>McaWasp.WW-12651<400>1LeuTyrValHisValProPheCysHis'SerLysCysThrPheCysAspGluAspVal35GinAlalieProTrpVal50SerValArgLysAsn65ArgGlyAlaGinCys40LysAspLeuLeuThr55lieArgAlaLeuThr45LysProTyr70ArgAlaAlaGly60ThrGlulieTrpGlylieTrpLeu85GlyGlyThrAlaSerSer100AlaLeuAspSerVal75ValProTyrValGin90AspAsnAlaGluGly115lieGluCysSerLeu105PheAspLeuSerGluThr80ValTyr95GluAlaAlaThr130PhePheArgGlyLeu145PheAspAla120AspThrValAspAla110ValAlaGluPro135PheAsnArgValThr125AlaLysLeuGluAspGluAlaAspAlaGly150LeuArgArgLeuLys140SerGlyValArg165lieValHisHisSer155ArgArgHisThr180AsplieMetSerGly170ArgGluAlaGlyValSerlie195AlaThrValGluAla185PheProAspGinGinSer160AlaGly175AspGluLeuArg210SerLeuTyrSerPhe225LeuAlaGlyThrGly200AlaValSerLeuPhe190LeuAspGluLys215ProThrProGlyGlu205LeuThrHisLeu230LysArgAlaTyrPro220PheMetArgArgLys240GluLysArgAlaTyrLeuArgLysGinGinAlaLeu245250255PheThrGluAlaArgArgMetlielieAspAlaGlyLeuProGluTyrThr235ArgLysGinGin260AlaSerGlyTyrPheGly275ArgAlaAspThrGinLeu290AspArgGinPheVal305lieGinAspProLeu325SerArgValLeuVal340GluGluTrpValLeuArg355ThrArgProSerValLeu370ArgGlyLeulieGlu385AlaGlyLeuThrLeu405ProGluSer.Ala420265ArgValSerPro280AlaGlyPheGly295SerHisAlaLys270PheAlaAlaMetTyrPhe285AlalieSerLeuLeu310AlaTyrAsplieAsp330PheLeuGinAlaGlyLeuAla345SerThrGlyThrSerGly300GlyLysLeuHis315ValProAlaGlyArgVal360lieAlaProLeu375GluArgGlylieAsp390lieGluLeuAlaPhe410MetPhe350AspLeu365PheLeuAlaAsp380ArgLeuAspPro395GluMetAlaMetAlaTyr320GinAsp335AspGlyAspGluArgGlyArgLeu400SerGin415<210>11〈211〉420〈212〉PRT〈213〉AbcaWasp.WW-12651〈400>1MetThrTyrGlyHisAlaHisAlaGluHisTyrAspLeuValPheArg1SerArgGly5AspTrpProAlaLys20ArgAlaProAla10SerAlaArglieValArgAsp35GlyAlaHisLeuGlu25AlaThrLeuLeu15AlaLeuGlyAla65lieThr50GlyValGluProAla40ThrPheAlaLysAla30ValGlyCysVal55GluAlaMetArgAsp45PheAlaAlaValGlyAlaGlyGlyArgThrAla70ValHisProGlyThr60lieAlaAlaAspGin85AspAlaValThrGlu75MetArgAlaPheMetProAsp115HisLeuSerProGlyGly130GluGluPhelieAsp145GlyLeuValliePhe100ThrAlaAlaLeuAsp90LeuGlyPheAlaCys105AlaAlaValAlaAsp95AlaArg80LeuTyrAsp120ValLeuValValGlu135TyrValGlyGlylie110MetAlaAlaGly150ArgVal'ThrHisSer165ThrHisMetArglieHisPheVal180GluAspGluThrHis155ValPro140LeuArg125TrpTrpGlyProValArgGluArgArgArgAspSer170AlaAspAlaAspThrPheHis195AlaPheGluArgVal185ThrLeuPheThrArg225Ala210AspAlaHisProAsn200GlyLeuAlaValGly190AlaGly175lieGinGly230Ala215TyrLeuValGlyVal235Thr220LysAsp205ArgValHisGlyAsp160AlaArgTyrAsp<210〉12〈211〉414<212〉PRT〈213〉Afecarf//asp.WW-12651<400>1MetThrGinHisAspArgSerLeuThrGlyMetGlyAlaCysArgLeu151015CysSerGlyProValArgGluPhePheAspPheGlyArgGinProVal202530SerAspAlaPheArgAspProAlaAspThrSerProGluPheHisTyr354045AspLeuArglieGlyValCysGlyGlyCysAlaMetValGinGinLeu'505560ThrGluValProArgAlaGinMetPheHisSerGluTyrProTyrArg65707580SerSerLeuSerSerGlySerArgLysHisPheGluAlaTyrAlaHis859095HisLeuLeuAspThrArgLeuAlaGlyAlaAspProPheValValGlu層105110lieGlyCysAsnAspGlyValMetLeuArgThrlieGlyGlyAlaGly115120125ValArgHisLeuGlyPheGluProSerGlyGlyAlaAlaAspSerAla130135140ArgAlaAlaGlyValSerValValValAspPhePheGluGluArgThr145150155160AlaArgAlaAlaArgAlaGluHisGlyProAlaAspValValPheSer165170175AlaAsnThrValSerHislieAlaTyrLeuAspSerliePheAla180LeuLeuAlaProValAspAla195GlyTyr185GlyValPheValTyrLeu210HisPheTyrLeuGlu225ArgPheGlyPheAsplieValTyrAsp200AsnThrAlaPheAla215SerValThrSerVal205GinPhe190GluValAspTyrPhe230Leu.ValAsplieAsp220ArgAsnLeuAlaGlu245PheThrlieAlaVal235ArgLeuProValGlyThrlieArg260AlaValThrGluArgLeuHis275ThrLeuGluAlaThr250AlaGlyAlaGluArg265GluGinAlaGlyHis255SerGlyArgAspArg240GlyAlaProAla290GluLeuValAlaLeu305ValGlyTyrGlyPhe295LeuArgGlyLeu310ThrAlaLysSerAla280GlyGlyArgValPro270LeuAlaAspArgGly285HisAlaArgAspArg300GluGlyArgSerAla325GlylieThrProGluLeuValProTyr340345LysLeuAlaProGlySerAla315ThrThrlieAsnAla330lieCysAspSerTyr335ProVal320CysGluLysHisGly355PheAlaGluProSerAla370HisThrGluGluGly360ProAspTyrAlalie390ThrTyr375LeuAlaLysGluGlylieProTyrThr350ArgSerSerVal365LeuPheAlaTrpAsn385GlyGlyArgTrplieThrTyrValProGluValArgVallieHis395ValLeu380AlaPheThrGluAla400405〈210〉13<211〉328<212>PRT<213>肠aWasp.WW—12651410〈400〉1ValLeu1AlaGlyAla65AlaTyr50ValAspGly145AspAla130MetGlyCysAlaAsplieAla5AlsCysAlaLysAla35ArgAla20AlaSerThrValThrAlaPheAlaLeuLeuProThrGlyGlyLysHisAspAlaAlaMetGluAsn115ValAla100ArgVal85LeuLeu70LeuGlyAla40AlaAsp55HisAlaValGluAlaGluArgMetPheAlaArgGlyThrlieProThrArg120Glulie135ArgProPro150LeuGlyGlyGly'AlaLeuLeuArgArg10ValAla25GluPheAspAlaGluTrpLysPro90AlaGlu105HisProGlyLeuAlsAspAspValArgAlaLeuProAlaLeu15ValAlaSerGlyCysValAla75MetGlu60AlaAla45AlaArg30AlaSerAlaValHisValTyrlieGluAlaLeuAlaAlaThrArgAlaGlyGinHisProAsp155GlyArg140lieArg125ValLeu110ValAla95ValAla80AlaLeuValArgLeuSerAlaArgTyrArgTyrTyrProLeuAla160His165ThrAlaLeuLeuLeuLeuGlyHis180AspGluArgLeu170ValArgLeuAspValGluArg195ThrLeuSer210HisTyrHis225ThrAlaAlaAlaArgArgAlaGlyGly200ValAsp185ValAspLeuAla215TyrGluLeuCysAla230TyrThrProProGlyGly205AlaHisUuThrPhe220ThrAlaArgAla245ValLeuGluArgProGlyGlySer260AlaAlaValMetGly235SerAlsAlsThr175GlyAlaVal190AlaLeuLeuGlylieAspGlyAspGlyGinPhe275ArgSerAlaAspThr290AlaLeuGluLeuArg305SerAsnAlaAlalie325Pro250ArgValGlylieAla280Leu265GluPheAlaAlaVal240GluVal255AlaProPhe270ValArgGlyHis295AspGluAlaArgLeu310ThrProLeuSerAla285AlaGlyGluLeuAlaValSerVal300ArgAlaGinAsp315HisArg320〈210〉14<211〉476〈212〉PRT〈213〉7V固Wasp.WW-12651<400〉1MetLeuAlaArgGlyAlalieGlyAlaArgLeuAlaGluSerAlaAla1SerGlyPro5ThrAlaValGluPro20GluArgAlaTrp10AspValHisAlaGluGinArg35ArgGlyTrpAlaPro25HisValGluArgAspLeu50SerGlyLysPheMet40AspProGluThrArg65AlaGlyProValAla55ThrValHisGlyPhe70GlyTrpSerGinGly60AspVal45Asp15TrpLeuAls30ProLeuAlalieGlyHisGlyValArgAspPro85GlylieAlaVallie75lielieAsnGinValGlyValLeu100GinAla丄ysAlaPro90GluPheAspGlyLeuLeuMet115ProThrValGinAla105ProGlyAsnLeuSer130GlyAlaAlaValGlu120ThrArgSerAsnAspCysPro95LeuPro80GluHisVal110GlyValGinGly145AlaArgVallieAla135TyrLeuGluHisAsn125ThrArgValHisPro150AspValArgGinTyr140LeuGluProAspAla165AsnArgAsnMetPhe155GluGinGlyAlaLeuArgLysArg180SerGluLeuAspSer170lieGluLeuAspLeuAspSer195SerThrAlaAlaAspThr225Gly210ValArgArgLeuSer200AspVal185SerGluValAspTrp175SerPro160PheGluSer190GlyGlyAlaLeu230Arg215AlaGluAspAspGlyPheCysAspAspLeu235Ser205LeuThrLeuAlaTrp220lieAsnMetAspAla240Ser245HisProThrArgArgThrValLeuSerCysLeuProLeuProLeuProGlyGluAlaAspAspGlySerLeu260AlaArgThrAlaAlaGlulie275GlyTrpSerGinPro250LeuGlyLeuSerTrpGlu265ValArgArgSerLeuThr290LeuPhePheGluVal305ValAlaGluTrpThr325ValAsp280AspGlyAlalielie270LeuAla255ThrArgAla295GlyValSerValPro285HisAspSerVal310GinProMetLeuArg300AlaCysGlyArgArg315ValArgAspValValAlaPheLeu340ProArgArglieArgGluProGlyAla330GlyValGinHisGinValArg355GinCysThrProGly345LeuAspValAlaGly335LeuSerGlyGlyGlu320LeuLeuThrVal370ArgProArgPheLeu385Leu'PheAspAlaCys360AsnTyrGlyPheAla350LeuAlaProAla375AlaValLeuSerGlu365ProAlaGluAlaAsp390MetSerGluGluLeu380ProAlaGluArgThr405ArgThrArgTyrLeuValValGlu420LeuGluArgAlaAla395GlyGlyArgPheTyrHis410415SerAlaAlaAspThrGlyThrGlyAsp435AlaAlaAspLeuValArgAsp425PheLysTrpValVal400AlaProAla450SerLeuLeuAla'CysLeuProGlyArgAlaAspHis455ProGly440SerHisTyrLeuAsn460GlyThr430AlaLeuHisGin445lieGinAlaArg465470<210〉15〈211>378〈212〉PRT〈213〉AfecaWasp.WW-12651<400>1ValPheGinProSerLeuGly15ValPheAlaSerAsnT卬Val475GluAlaSerGly65SerAla50ValArg35Asp20PheAlaAlaHisThrCysThrGlyProGlyAlaAlaAsnAspValAspAlaLeuHisLeu145AspPro130LeuThr115GlyPro100ProAla85ArgAsp70ValGlu55AspAlaThrLeuAlaThrLysGinValAspLeulieGluArg135AlaAsp150ArgAlaCysGlyThrPheAlaGluGluLeu10GlyLysGlyPro25LeuGlyValGly40AlaThrPheLeuValValLeuPro75AlaHisGlyAla90AsnProThrAla105AlaValValVal120lieAlaAlaLeuAlaAsnAla'Pro155GlyAspPheGlyAlaAlaValGlyGlu15ArgValAlaGluPhe30HisGlyAla60ThrGly45MetLeuMetArgLeuAlaValCysPheArgProValGluHisLeuCys140AlaHis125ThrVal110TyrGluPhe95GluGlySerAlalieValTrpSerPheVal80CysAlaGlyGlyGly160Asp200910055328.2AspProGluTrp225ValGin210AspHisAla305SerTyr290ArgLeuAla370Glu195Thrlie180His165AlaValSerVallieGluArgSerGlyPhePheGluValLeuAlaAlaLeuThrArgAspLeuVal275PheArg260Asplie245AlaSer230GlyAla215SerGly200GinAsp185Arg170GlyGlyMetLeuLysLeuAlaTyr205AlaCysValGinGluValSerlieProProTyrTrpValAspLeuTyrLeuHisArgAlaAspHisLeuSerAsp355AlaAla340AlaVal325AlaGin310AlaGin295ArgPro280LeuAla265LeuLeu250HisAlaPheGlyGluArgThrAspValThrArgThrAlaGly375Ala360ValLeu345ValSer330CysHis190Leu175AlaArgGlyLeuAlaGluArgPheSerArgArg235GlyAla220SerThrArgTrpValMetAsnArgLeuGlyTyrAspArgProAlaGlyProProHisGlylieTyrThr315ThrLeu300ThrHis285ArgGlu270ArgLeuProMetValAspGlyAlaArgLeu365His350LysGlu255PheAsp240PheAlaAspTyrArgTyrGlySerGluValAlsGluLeuPro335GinPro320GlyGlyAlaAla<210>16<211>392〈212〉PRT<213〉Afecar必3sp.WW-12651<400〉1MetAlsSerHisGlyHisValValProThrLeuGlyValAlaGluGlu1LeuValAlaAlaThrValVal65AlaLeu50AlaAla35ValArg20Val5GlyHisArgValAlaGluThrGlyArgGinAsnPheGluLeu55PheGly40ThrThr25Ala10TyrProAlaAlaArgValLeuGlyAlsLeuLeuAlaGluValArgAlaAspGinMetValProTrpPro145ArgAla130GlyVal115GluAla100ValAla85AsnLeu70TyrGlyAspArgGlylieGlyArg105ThrArg90LeuGly75ProGly60AlaPro45GlyGly30Tyr15AspTyrGluSerGlyAspProAlalieLeuAspLeuVallieAlaAlaGinThrlieAspAsnThrAlaValAlaHisGlylieGluAlaLeuAsn180Asp165lieAla150MetGly135AlaPro120LysProValTyrAlaArgGlyHisAlaArgProValAlaValPheLeuPro185Glu170SerMet155TyrPro140GinThr125MetGlu110AspVal95TrpArg80TyrGlyGinPheGlyArgAspAspAlsLeuLeuAlaAlaAlaPheGinGin190Thr175AspGly160SerAlaGluLysLeuGlyGluArgTyrValPheValGlyProCysLeuProLys195PheLeuGlyGluArgAsp210ValLeulieSerLeu225ArgSerCysValVal200ArgProProAlaTrp215ThrValTyrAsnCys205GluLeuProValGly230AspPheAlaAspSer220AsnValAspPheArg245GlyValAspProGlu235AlaTrpHisValSerLeuGlyAsp260ValHisArgTrpGly250ValLeuGlyGluAsnValGlu275AlaSerAlaLeuValThr290LeuHisTrpAlaThr305AsplieHisAlaSer265SerHisAlaAlaVal255ProPhe240lieProVal280GlyGlyLeuGlyLeu270LeuGluHisHis295ProValValValVal310ValValAlaLeuVal285ValMetThrGlySer300ValThrProLeuArg325GinValGlyArgPro315LeuGlyThrArgValAlaAspVal340ThrAlalieArgGly330ArgGluAlaValAlaAsnAsp355HisAlaGlyGlyLeu345AlaValAlaGluVal335GinVal320GluVallieArg370TyrLeuGlyArgVal385Ala390Ala375lieThr360AlaLysAlaAlaAlaAsp350ArgGluHisGlu380Met365GlulieGluSer<210>16<211〉392<212〉PRT<213〉AbcariZ/asp.WW—12651〈400〉1MetAlaSerHisGlyHisValValProThrLeuGlyValAlaGluGlu1LeuValAlaAlaThrValVal65AlaLeu50AlaAla35ValArg20Val5GlyHisArgValAlaGluThrGlyArgGinAsnPheGluValArgAlaAspGinMetValProTrpPro145ArgAla130GlyVal115GluAla100ValAla85AsnLeu70TyrLeu55PheGly40ThrThr25Ala10Tyr'ProAlaAlaArgValLeuGlyAlaLeuLeuAlaGluGlyAspArgGlylieGlyGinThrlieAspAsnThrAlaValAlaHisGlylieGluAlaLeuAsn180Asp165lieAla150MetGly135AlaPro120LysArg105ThrArg90LeuGly75ProGly60AlaPro45GlyGly30Tyr15AspTyrGluSerGlyAspProAlalieLeuAspLeuVsllieAlaAlaProValTyrAlsArgGlyHisAlaArgProValAlaValPheLeuPro185Glu170SerMet155TyrPro140GinThr125MetGlu110AspVal95TrpArg80TyrGlyGinPheGlyArgAspAspAlaLeuLeuAlaAlaAlaPheGinGin190Thr175AspGly160SerAlaGluLysUuGlyGluArgTyrValPheValGlyProCysLeuProLysLeu305AspTyr385Asp210Leu195PheLeuGlyGlu200ArgProProAlaTrp215ThrValTyrAsnValLeulieSerLeuGly225230ArgSerCysValArgAspPheAlaAsp245SerLeuGlyAspGlyValAspPro260ValHisArg205SerGluLeuProVal220AsnValAspPheGlu235AlaTrpHisPhe240lieGlyAlaTrpHisValVal250255ValLeuGlyGluLeuProProAsnValGlu275AlaLeuValThrTrpSer265SerHisAlaAlaAlaSer290HisVal280GlyGlyLeuGlyTrpHis295ValValValValAlaThrPro310lieHisAlaArgValValAlaLeu325ValAlaAspValGinVal340ThrAlalieLeu270ValLeuGluHis285SerValMetThrGly300ValThrProLeuPro315LeuGlyThrArgAlaAsnAsp355lieArgHisAlaGlyGlyGlyArgArgGly330ArgGluAlaValLeu345AlaValAlaGluVal335GinVal320GluValArg370LeuGlyArgValAla390Ala375lieThr360AlaLysAlaAlaAlaAsp350ArgGluHisGlu380Met365GlulieGluSer<210〉17〈211>402<212>PRT<213〉V固Wasp.WW—12651<400〉1MetThrArgAlaAspAlaAlaThrTyrProPheProValArgCysPro1PheThrLeuAlaProHisPro65GlyGlu50AlaVal35GinPro20Arg5AspGluLeuGluLeuProThrValArgThrArgGluArgLeuAlalieValGlyGinValArgGlyVal145AspPro130LeuGlu115ValVal100LeuAla85LeuAla70AspVal55AlaGly40LeuArg25Ala10LeuSerArgGluProAlaTrpLeu45Phe15ProAlaAspGluLysProGlyProAlaAspAsnProArgAlaGlyAlaAspPheMetCysAlaLeuAlaTrpAlaPheGlyAlaAlaArgLys195Ala180ProAla165MetTyr150GlyAla135AlaAla120GluHis105ValHis90AlaGly75GluArg60GlyGlyPheArgTrpArgGluSerValGlyArgLeuPheAlaPheValProAlaLeuArgGlyArgAlaAspGlyThrLeuVal200His185LeuAla170AspAsp155AlaArg140LeuAla125LeuArg110AspProLeuGlySerMetAlaAlaArgProAlaLeuAla205Glu190GluGlu175LeuValGlu30ValSerGlySerArgArgAspArg95ProArgArgProAlaPhe80LeuAlaGlyAspPhe160AlaValValArgGlyProAspGlyAspArgLeuSerGluThrGluLeuValSerThrVal210LeuLeuVal225AsnGlyLeuSerlieAla230LeuAlaLeu245AlaAlaGlyGluValAsp260AlaGlyThr215GlyTyrGlu220AlaValGinPheThrGlyAlaValGinPheGly235240PheGinHisProAspGinLeuAlaArgLeu250255AlaValGluGluValUuArglieAlaAla265TyrAlaGinAlaGlyThrGlyPheAlaGlyMetThr275280AspValAspLeuGlyGlyThrThrlieProAla290295SerLeuAspAlaAlaGlyArgAsplie'SerLeuAspAlaAla305310HisGluPheAspLeuAlaArgGlyAla325GlySerGlyArgHisTyr340GlyPheAlaVal270TyrThrSerAla285HisAlaGinValLeu300ArgValGluArgCysLeuGly345LeuGinGluGlyPheAlaAlaLeuVal355360ValArgProAspGluValVal375ProAlaGluLeuProThrThr390AlaPhe385AlaAla370TyrArgProGlyArgValGluArgPro315320AlaGlyGlyHisLeuSerPhe330335AlaProLeuAlaArgValGlu350LeuProGlyLeuArg365ArgThrMetPheSer380PheGluArgThrAsp400ArgGlyMetGlyTrpAla395〈210〉18<211〉370〈212〉PRT〈213〉yVocar&'asp.WW-1265191<400>1MetAlaAspThrGinAlaProProHisGlyLeuLeuTrpArgAlaGlu1ThrAsnGinArgAspProLeu65ArgThr50TrpPro35ProTrp20His510ValValThrThrHisGluValAlaAsplieGlyThrGlyAlaAspTyrArgArgAlaAlsTyrGluAlaArgLeuVaJPheArg145LeuMet130ValAla115GlyAla100AspSer85ArgGly70AlaAsp55AlaAla40Val25LeuAspProAspProThrValAsnHisProAlaAlaValGluLeuAlaPhelieAlaPheProAlaLeuMetPheProGinArgArgAspAlaAlaAlaAla195Thr180PheGin165AlaVal150ArgArg135liePro120HisGlu105PheAla90AlaThr75AlaSer60PheArg45GinThr30Ala15ValLeuAlaValPhePheGluLysHisArgPheAlaProLeuProAlsAlaLeuAspGinAlaAsnLysGinArgAlaAlaPheGluAla丄euLeuAlaGinAla200Ala185GluGly170AlaPhe155SerLeu140LeuSer125AlaGlu110ThrAla95GlyLeu80PheAspPheArgLysSerTyrGlyValLeuValLeuAlaProAspProAlaAspGlyGlu205Thr190liePhe175ProAsp160LeuLeuProTrpAlaAspValAlaThrValGlyGinLeuLeuAlaAlaGlyValProGin210215220ValGluThrGlylieAlaValAlaAlaHisAlaLeuLeuThrArgPro225230235240GluAlaValGlyAlaAspLeuAlaGlyValAlaGluGluAlaMetArg245250255LeuAlaProProPheLeuGlyliePheGlyTrpValThrGluProCys260265270AspCysLeuGlyValArgLeuGluProArgThrAlalieValValAsp275280285lieProAlaValAsnAlaAspProAlaLysValAlaAspProAlaAla290295300PheCysProGlyArgSerArgAlaGluAsnlieThrPheGlyLysGly305310315320AlaHisTyrCysLeuGlyAlaAlaSerAlaArgAlaGinValValAla325330335AlaLeuArgGlyLeuLeuAlaAlaArgProAspLeuAspLeuGlyAla340345350LeuGinArgAlaAspAspGlyPheAlaGinSerlieThrAlaLeuHis355360365Tyr'Arg370<210〉19〈211〉412<212>PRT〈213〉yVocaWasp.WW-12651<400>1MetThrThrThrlieProValGluProValAspLeuAlaAspAlaAla1LeuValGlu5ProTyrProHisAsn20ArgSerSerValAlsProVsl35CysHisAlaValAlaGin50ProMetLeuArgTrp40GlyGin65SerTyrAlaLeuPhe55LeuGinAlaAla10AlaArgLeuArgCysTrpPheAspSerArgTyr25Asp15GlyAlaGly30AlaThrHisAla45SerAlsVslGlyGly70GluProProProPhe60ValSerGlyAlaPro85ArgArgThrThrVal75ProAspAlaSerArgAlaGinGly100LeuTrpProGlyGlu90ArgAlaLeuSerValAspGly115LeuAlaAlaArgGly105AlaAlaAlaCysAla95GlyArg80HisTyrAlaAsp130AlalieProLeuAla145AspAlaAspLeuPhe120GlyProValAspThr110GluLeuAl3Pro135ArgLeuLeuAlaArg125VslAlsAspTyrThr150AlaPheArgAlaVal140LeuMetAlaliePro165AlaAlaAspGinAsp155AlaGluSerGlyProProAlaAsp180AlaArgSerAlaTrp170ArglieValArgGluLeuLeu195lieArg185GlyArgLeuArgTyr175lieAla160GlyArgAspGly225Phe210GlyValGlyGluGlyHisLeuGlyGluHis230Val200AlaAsnProGlyGly190ProThrGinVal215LeuGluPheValGlu205LeuThrGlyGlyLeu235Thr220GlyThrGlyLeuMet24094lieSerLeuValAspAleiAspArgAla275ThrValThr245LeuAla260LeuValHisGinArgHisProGlyProAsp305SerSer290GlyGinAlaLeuThrProlieAlaAsnValGlyArgGlyAlaHisSer385LeuMet370GlyThr355LeuArgAsp325AspThr340SerCysPro310ProGly295AlaAlaArgAlaLeuGlyAlaAlaLeuAlaValArgProValHisLeu405Phe390ThrVal375ProPro<210〉20<211〉380<212〉PRT<213>Abca/^'asp.WW-12651<400〉1GlyLeuVal250ProGlyGin265AlaValGlu280ArgLeuAlaGlyGlyLeuGinTrpPro330AlaAlaArg345AlaAlaMet360AspAlaAlaGluPheMetAlaArgSer410LeuSerPheGlyThrLeu255TyrAlaArgGluGlyArgVal315AspAla300LeuLeu285AspVal270ArgArgAlaTyrAspValVallieCysAlaAspThrLeuValHisLeuThrSerArgAspThr395AspAla380ArgGlyGin365ValPhe350AlaPhe335GlyGly320AspTrpMetSerThrProSerGlyTyrThrAla400MetSer1AspAlsGlyLeu5AsnArgLeuLysValAlaLeuAlaAlaThrAlaLeuProAspGlyLeuArgTrp15AlaAspArg20ArgAspProHisLeu10LeuSerProAlaValValLeu35AlaGlyMetAlaThrAla50ThrGinPhePheGlu65PheAsnThrGluVal25lieThrGlyVallie40MetProGluGluAsn55TrpTyrThrValLeu30AspArgSerArg45ThrProSerlieLeu70ArgLysValPheAla60AspAsnTyrLeu85PheGluArgMetSer75lieArgSerAlaTyrValAspMet100GlyAspLeuAlaThr90AlaGluArgAlaProAlaAsp115ThrPheAlaMetAla105AspTyrPheSerAlaPro80AspSer95AlaLeuAspSer130LeuThrLysValAla145LeuGlyValThrAsp165LeuArg120GlyValProGluAla110PhePheMetLys150Tyrlie135LeuVallieHisPro125AspTrpProAsnValMetArgTyrLeuLys180PheValAspAlaGlyAlaArgAspLeu155GinAla140PheLysGinLeuAspSerPro195TrpProlieAlaSerThr210lieGluAla215GlyAla200LeuThr185ArgGlu170AspArgLeuLeuGinLeu160AlaAlaPheAlaAla175GluAlaArgLeuSerGlyAspArgAlaGlyProMetlieValGlyGlyAlalieAlaSerArgMetValTrplieGlyGinLeu220SerAla205LeuAla190MetMet225230235240SerAspProGluLeuProGlyLeuLeuArgAlaGlyGluValAspAla245250255GlyGluValAlaGluGluCysMetArgGinSerProProPheGlyAsn260265270ValPheArgPheValAlaGluProCysSerCysLeuGlyValProLeu275280285GluProGlyThrlieValAlalieAspThrGluAlaValAsnLeuAla290295300GluSerGlyProThrAlaProValArgGlyCysProValArgProThr305310315320AlaValLeuThrPheGlyArgGlyGlyHisTyrCysLeuGlyAlaAsn325330335ThrAlaArgArgGinValAlaAlaAlaLeuArgAlaLeuValThrAla340345350ArgProGlyLeuArglieAspProAlaAlaValArglieAspThrHis355360365AsnAsnLeuLysGluValArgAlaLeuProTyrSer370375380<210>21〈211>426〈212〉PRT〈213〉7V織Wasp.WW—12651<400>1ValThrThrGinAspGlyGinAspSerGinAspGlyGin.AspSerGin151015AspSerThrValGlyLeuThrGlyLysThrTyrProPheGluArgLys20CysProPheAlaMetProGlu35AlaGinValLys25PheAlaTrpAlaProVal50LysTyrGlyAspGlu40GinSerGlyAspThr65ArgThrlieAsnLeu55LysAlaAlaLeu30ArgGluAsnGlu45AlaTrpLeulieVal70GluGlyAlaAla85SerProValPheAlaAspArgSer100HisThrArgTrpArg90PheGly75ValLeu60AspAspArgPheAspGlyThrArgGlyGlyGlySerProProGly115GinAlaAspAlaThr105ArglieValAsnPhe95SerSer80SerGinGinArg130ValLeuAspGluArg120ArgAlaGlulielie110AlaPheThrGlu145AlaAspTyrAlaMet135GluAlaArgGlyLys125ArgHisThrGluLeu150LysLeuProlieAla140SerPheAspLeuTyr165GluSerArgProPro155lielieCysAspGlylieProAsn180ArgAspMetGinArg170PheThrGluLeuLeuThrArg195■LeuGinGly210LysAsnLeuGly225AspAspGluThrGlu185GlyPheAlaAlaLeu175AlaMet160LeuLyslieGlyArgGlyAspGin245Ser200AlaValGlyLeuTyr215LeuLeuSerThrAla190PheGlyGluAla205ValArgLysArgAsp230LeuSerAsnGlulie220lieGinLeuArgGlu250LeulieGinLeuArgAsp235240LeuValSerThrVallieVal255UuLeuUuMetAlaGlyTyrGluSerThrAlaValGinPheGlyAsn260265270AlaPheTyrAlaLeuPheArgHisProGluGinLeuAlaLeuLeuArg275280285GluArgProGluLeulieGlyGlyAlaValGluGlulieLeuArgTrp290295300AlaGinMetGlyThrGlyPheAlaValAlaLysPheAlaThrGluAsp305310315320lieProMetProGlyAlaThrlieProAlaGlyGlyThrValPheVal325330335SerLeuGlySerGlyAsnArgAspGinGluValPheGlyProAspAla340345350GluLysPheAspValThrArgValAlaProAlaArgGinUuAlaPhe355360365GlySerGlyProHisPheCysLeuGlyAlaAlaLeuAlaArgAlaGlu370375380MetGinGluGlylieLeuArgLeuLeuThrArgPheProAsnLeuArg385390395400TyrAspGlyAspLeuAspAlaValProLeuAlaSerAsnLeuPheThr405410415TyrTyrProArgGluLeuProVallieAla420425<210〉22<211>207〈212〉PRT〈213〉AbcaWasp.WW-12651〈400〉199MetSerGluThrAlaLysThrSerArgThrAlaArgSerSerLysLeu151015ValSerLysValTyrAsnAlaAlaTyrLysValGlyPheSerProVal20AspLeuGlyProProMetPro35LeuAlaProGlyTyr25LeuValAlaLeuTrpAspArg50LysSerlieTyrGlu40AlaLeuAspLeuSer30GluGlyProGly65AsplieAlaProArg55AlaGluHisGlylie45CysGlyThrGlyLeu70AlaLeuArgArgGly60SerValThrGlyGlu85ValGluPheValTrp75ArgLysArgAlaAlaGlyValAsp100LeuGlyGlyProAla90CysAspLeuValAlaGlyAla115SerLeuArgAspGlu105AspPheLeuLeuSerHis130GlyValAlaAlaTyr120AlaLysAlaArgAla145LysGlyProLeuGlu135GlyAlaThrLeuAsp125AlaGly95lieGlyGluGlyValAsp110PheAla80AspProCysPro150ValArgProGluTyr140LeuTyrAlaPheSer165LeuValSerAlaTyr155lieAspThrAlaProHisTrpAsp180ProAspAlaGlyProMetTrp195Glu170ProGlySerValTyr200Val185ArgMetThrArgArg205Arg190AlaPhe175ArgAlaThr160AlaThr<210〉23<211>261<212>PRT<213〉W固Wasp.WW-12651<400〉1ValAspSerSerPheGlyValGlyLeuTyrGlyGluGinAspArgAsp151015GlyLeuProAlaGinAlaLeuAlaAlaSerLeuGlyCysGlyAsnPro202530ThrAlaValAlaGluLeuArgAlaGlyGluArgValLeuAspLeuGly354045SerGlyGlyGlylieAspValLeuLeuSerAlaArgArgValGlyPro505560ThrGlyLysAlaTyrGlyValAspMetThrAspGluMetLeuAlaLeu65707580AlaLeuAlaAsnLysAlaSerAlaGlyAlaAspAsnValGluPheLeu859095LysGlyThrlieGluAlaLeuProLeuProAlaGlyThrlieAspVal100105110VallieSerAsnCysVallieAsnLeuSerValAspLysProAlaVal115120125PheAlaGluMetPheArgValLeuAlaProGlyGlyArglieGlyVal130135140SerAspValValAlaGluAspAlaLeuSerAlaThrGluArgAlaGlu145150155160ArgGlySerTyrValGluCyslieAlaGlyAlaLeuThrPheAlaGlu165170175TyrArgArgGlyUuGluArgAlaGlyPheAlaAspValAsplieThr180185190AlaThrHisGinValAlaAspGlyMetHisSerAlalieValArgAla195200205ValLysProAlaThrGlyProValAlaGluProAlaAlaValAlaAla210215220SerGlySerCysCysGlyValSerAlaCysCysThrProAlaGluSer225230235240AlaLeuAspArgSerSerThrValAlaGluAlaLysAlaAlaSerGly245250255CysGlyCysGinSer260〈210>24<211>174〈212>PRT<213>yVoK//asp.WW—12651〈400〉1ValThrThrHisAlaAsnHisProSerHisGluAlaAlaProGluGly151015ValGlyPheAspAsplieProAspMetProAsnPheAlaValLeuLeu202530ValSerAspLeuGluLysSerLeuGinTrpTyrValAspGlyLeuGly354045PheTrplieGluLysLysLeuThrGlyProAspGlyGinlieAlaVal505560lieHisLeuArgArgAlaGln'TyrArgAspMetLeuLeuArgProAla65707580ArgGluProLeuAspGlyProLeuGlyArgGlyValArglieSerPhe859095ThrLeuAsnAlaGluThrGluAlaSerMetArgGlulieAlaAlaArg/114页AlaGlyAla115TrpAsnThr130ValLeuThr145LysSerVal100LeuProGinGly105ThrValAsn120AlaThrAspValAspValGlu135ThrValAlaAspArgAlaArg150LeuAlaAspAspThrProVal165170110GlyProUuAlaThrPro125ProAspGlyTyrValVal140ThrTrpSerGluLeuLys155160GinLeuAspSer〈210〉25<211〉169〈212〉PRT〈213>AbcaWasp.WW-12651<400〉1ValPheArgArgTrpHisGlyGlyProGlyAlaAspGlyArgAsnThr151015ProValThrThrArgProArglieThrAlaSerAlaLeuThrLeuAla202530GlyAlaLeuValLeuSerAlaCysGlySerAspAspAsnArgAspThr354045lieLysTrpThrLeuAspLysGlyAsnValProValProThrAlaThr505560lieProlieAspCysGlyGlyThrArgAlaLeuThrGlyGluGlySer65707580ThrAlaGinLysGlyAlaMetAspValPheValAlaAlaTyrThrGin859095GinCysProGlyGinGinMetAlaTyrThrAlaSerGlySerGlyAla103GlyValLys115LeuSerAla130CysGly145AlaValGlyVal100GinPheLeuAlaLysProGluArg135AsnProAlaTrp150TyrGinlieArg165105110GlyLeuValAsplieGlyGlySerAsp120125GlyGluValThrAspAlaAlaAlaArg140AsnLeuProLeuValPheGlyProVal155160TyrLeu〈210〉26〈211〉327<212>PRT〈213〉AbcaWasp.WW-12651〈400>1AlaAsnThrValValProLeuAspAlalielieAlaGluLeuTrpGly65707580AspThrThrProArgSerAlaArgAlaValValGinThrTyrValMet859095GinLeuArgLysGinAlaAlaLysValLeuAlaGlyArgValAspAla100105110ProGluSerValAlaArgGluLeuValArgThrGinProGlyGlyTyr115120125ValLeuSerAlaAspGluProSerValAspAlaTrpAlaPheGluArg130135140LeuThrThrAlaGlyHisArgGluArgGluSerGlyAspLeuValAla145150155160AlaSerArgSerPheSerAspAlaLeuAlaTrpTrpArgGlyGlyProLeuLeuLeuGinLeuVal225AlaArg210AsnLeuAspValAlaLeuThrPro305HisAsp290AlaAspVal180GluAla195LeuGlyArgTyrTyrArgArgAla260ArgArg275LeuThr165GinThrGlyAlaHisLeuAsnArgHisProSer245ArgThr230GlyGlyProlieProAlalieAla325Pro310SerTyr215HisLeuHisArgAspThr〈210>27〈211〉141<212〉PRT<213>TfecaWasp.WW—12651Ala200GluMetlieAlaTrp295AlaAsnSer280GinVal185LeuLeuLeuGlyGluGly.Leu170LeuAsnSerTyrAspArgArglie205GluLeu220AlaHisArgArgSerGlu265MetGlu250LeuCys235AlaLeuGluAlaLeuGluLeuValAlaThrValAspLeuAlaAla315SerAsp285ValPro300ThrSer175AlaLysArg190GluValAspThrAlaLeuLeuMetLeu240ValTyrArg255ProSerPro270ArgAlaProProArgLysTrpAsplie320〈400〉1MetArgThrAspProPheArgGluLeuAspArgLeuThrGinGinValPheGlyThrTrpThrArgProAlaAlaMetProMetAspAlaTyrArg202530GinGlyAspGluPheValValValPheAspLeuProGlyValThrSer354045GluAlalieAspLeuAsplieGluArgAsnValLeuThrValLysAla505560GluArgArgProThrAlaValGlyGluGlyAlaGluThrGinlieAla65707580GluArgProHisGlyValPheSerArgGinLeuPheLeuGlyAspGly859095UuAspThrAspArglieGinAlaAlaTyrGluAsnGlyValLeuThr100105110LeuArglieProValAlaGluArgAlaLysProArgLyslieSerVal115120125AlaGlyAlaAspProAlaGluProLysGinlieAspAla130135140〈210>28〈211〉202〈212〉PRT〈213>yVo度Jj'asp.WW-12651〈400>1MetGluTyrGinGluAlaArgAspAspLeuSerProArgTyrGlyAsp151015ValProSerMetGinLeuValGluAspValAlaArgGlyGluAlaAsp202530ProAlaHisValLeuSerAlaLeuValLeuValArgHisLeuArgAla10635GlyGluLeuGluHisLeu50ValSerTrpAlaGly65GinAlaAlaGlu40ProGinLeulieAla55ArgLeuAlaProAlaLeu7075ArgTyrLeuArgLeuArg45AlaArgGluArgAla60GlyValAlaSerArg85GluArgValArgAlaThrGlyGlu100ValThrAlaTrpLeu90GluArgAspProAspAspAspArgAla115AlaGlyGinValAla105AlaArgAsnSerAspArgGlyLeu130ArgThrAlaAspAla120GlyLeuProHis110AlaAsp95AlaLeuArg80HisGlyArgArg145SerAspLeuLeuAla135ValHisThrAlaAla125ThrGlyAspAlaAsp150ProLeuHisAspAla165LeuAlaAspArgAlaHisProGly180ThrArgLeuArgHisAlaSer195Arg200lie185AspLeu140GlyGlyAspArgLeu155AlaAlaProHisLeuArg170175AspAlaValThrAlaGluAla190ArgAla160AlaThr<210>29〈211>378<212>PRT<213>AbcaWasp.WW-12651<400>1MetAspGluValLeuLeuArgSerLeu1LeuGlyArg5GlyAlaAspPheArg20AspAlaLeuValGluAlaVal35LysGlyTrpLeu10AlaAlaGluAspAla25ValTrpProAla15ValGinAspPro50AlaArgSerAspArg40AlaValAlaTrpAla30ProProArgAla65GlyGluProValVal55AlaArgArgArgSer70GlyGluAlaProArg60GluAsp45ArgPheLeuAspPro85CysAlaiHisProArg75ValAspAspThrAspSerValAspLeuTyrPheLeu100LeuArgAlaValAlaValAsdAspThrLeu9095LeuThrProSerSerAlaAlaLeuThr115TyrLeuValProSer105GlyLeuThrThrAsp80GinValGinAla130AlaLysArgThrVal145AlaThrValLeuGly120AlaThrMetAlaGlu135GlyValArgLeuAla150ValLeuTyrLeuArg165GlyAspValAspLeuAlaAlaGlu180lieAspHisProHis155PheGin140GinSer110ArgGinlieAla125ArglieSerArgProGlyAspGlyAsnGluGlyVal170lieArgLeuThrAlaAlaAla195HisHisAlaArgAla185ValAlaGlyUuTyr175GinVal160SerLeuLeuLeu225Leu210ValProLeuAlaGlu200ThrAlaArgThrArg190AlaLeuMetAsp230Arg215GinAspArgSerLeu205ProAspGlySerArg235Ala220TrpAspAsnAlaLeu240lieSerGluGlyValAlaValLeuGinAlaAlaLeuSerArg245GinAlaGinLeuGlyGluPhe260AlaProAlaAlaGlyGluThr275LeuAlaAlaAla250lieAlaAlaAla265TrpValGinlieAspGlu290ValAlaValAsp280AspAsnProlieAla305LeuAlaAlaLeuHisLeuHisGlu340AlaGluAlaAlaArgLysAla355ThrArgGinAlaArgLeuThr295GlyGluAlaAspGlyPro310AspAspAlaLeuPro325ArgAspGlyLeuHis270ValGlu285LeuLeuAspArg370AlaArgLeu375Val300AlaGlyLeuArg315HisThrAlaValArg330AlaArgAlaArg345AsnLeuAlaGluPro360AsnThrArgGluArg255AlaAspTrpTyrAsnArgAlaAla320AlaAla335LeuTyrAlaArg350ArgAspHisLeu365<210>30<211>139<212>PRT<213>;VocaWasp眉一12651〈400〉1LeuAspValLeuThrGlySerTrpArgAlaThrLeuSerAsnAlaTrp151015PheLeuGluProProAspGinGluValGluGlyThrAlaThrAlaGlu202530TrpLeuAlaAspAlaPheValValPheArgTrpThrlieSerGlyGlu354045ProGlyThrAlaThrThrGluMetValLeuVallieGlyArgSerAsp505560AlaAsnAspAlaTyrThrAlaLeuTyrHisAspGluArgGlyValAsn65707580ArgValPheAlaMetThrPheAspAlaAlaArgTrpThrMetSerArg859095AlaAspProAspLeuPheGinArgPheValAlaAspValThrProGly100105110ArgValThrGlyArgTrpGluAlaSerGinAspArgGlySerThrTrp115120125ArgLysAspPheAspLeuValPheGluArgAla130135<210〉31〈211〉147〈212〉PRT<213>AbcaWasp.WW-12651〈400>1Met'GlyArgThrSerThrArgArgThrThrMetAlaLysTyrLeuLeu151015LeuLysHisTyrArgGlyAlaProAlaAlaAlaAsnAspValProMet202530AspGinTrpThrProGluGlulieThrAlaHisValGinTyrMetArg354045AspPheAlaAlaArgLeuGluGluSerGlyGluTyrValAspGlyGin505560ProProValThrAspGlyProPheAlaGluThrLysAspLeulieAla859095GlyTrpMetVallieAspValAspSerGinAspArgAlaValGluLeu100105110AlaGlyGluLeuSerAlaAlaProGlyAlaGlyGlyLysProlieHis115120125GluTrpLeuGluLeuArgProPheLeuAlaAlaPro.ProThrlie■Thr130135140GluCysHis145<210>32<211>117〈212>PRT<213〉W固Wasp.WW-12651〈400〉1MetThrlieThrTrpSerProAlaSerCysSerAlaTrpMetThrGin151015GlulieGinAlaArgAlaSerSerSerSerGlyProValGlyAlaGly202530ValGinGlyValProAlaLysArgSerThrProArgAlaAlaLysArg354045ArgGinlieArgSerProAlaArgSerArgThrLeuThr■ValAsnVal505560ProLeuArgArgMetValGlyGinValAspAspAspLeuAlaAlaHis65707580illThrSerThrArgGlyGlySerArgAspThrAspVallieGluLeuGin859095AlaLysProThrGlyArgProArgAlaSerValGluValThrMetVal100105110ThrProValGlyArg115<210>33<211>151<212>PRT〈213>〃ocaWasp.WW-12651〈400〉1ValHisLeuThrlie'lieLeuTrpAspLeuAlaGluSerAspGinThr151015ValAlaSerLeuArgSerTyrLeuArgAspTyrAlaValGluAlaTyr202530SerAlaThrProGlyLeuArgGinLysValTrpValAlaAsnThrGly354045ProGluGlyGluThrTrpGlyAlaValTyrLeuTrpAspAspGluLys505560AlaAlaTyrGlyArgProProGlyValSerArgValValGluLeulie65707580GlyTyrAlaProThrGinArgSerTyrPheSerValGluAlaGlyAla859095AspGlyProLeuAlaGlyAlaLeuAlaGlyLeuGlyLeuAlaPheThr100105110AspProAlaAlaGluProMetArgArgProMetGluPheAsnProPro115120125GlyAlaSerAlaPheThrLeuArgAlaAspValValAlaGlySerPro130135140LysGinGlyGlyAspGlyArg145150<210〉34〈211>593<212>PRT〈213>;Vocarc(/asp.WW-12651<400>1MetSerAlaAsp1ValArgHisSerlieHisAsp65AsnLeu50GlyArg35AspAsp20GlyThr5AspArgGlyValTrpLysGlyAlaGlyPheLeuTrpMetArgAlaAspLeuVal130Arg115GlyGlu100ProLys85ArgCysPheAlaValLysAlaAspAla10GlyGluProSerArgArgSer70ArgSer55ValGlySerGlyTyr40ValTyrProAlaValThrArgVal135Met120AlaLeu25GluArgValGluHisHis105ThrPro90LeuAsnAspHisLeuValGluAlaAsp丄euAlaArgLeulie75ValCys60AspThr45AlaArgValArgLeuArgAlaAla140Thr125LeuGly30ValGluHisAlaAlaPheLeuAsp110ArgPhePhe15SerPhePheAlaGlyLeuProThrLeuAlaGly80ProAsp95HisHisProValAspAlaLeu113AlaGluPheGlylieAlaThrAlaArglieValSerThrAspPro145AlaAlaValValAla150AlaGluAlaAlaVal165HisAlaAspLeuVal155ArgAspProHisTrpThrLeuAsp180ValValLeuAlaThrAspGlu195LeuGinTrpArgGlu170AlaAlaPheAlaGlu185AspAspAlaAspLeu175ProGlu160AlaAspAlaAsp210AlaThrValSerVal200ArgAlaThrGlyPhe190AlaAlaLeuLeu225ValAspTrpCysLeu215TyrLeuValAlaGly230GluCysValHisPro205SerProValAlaVal220AlaProProSerTrp245ThrGlyLeuAlaAla235SerValValAlaValGlyGlyAla260AlaAlaLeuHisValAlaGin275AspGlyAlaGlyArg250ProAlaAlaThrPro265ValPheAlaArgAla255AlaGly240ProLeuAspLeu290ValArgThrHisHis280LeuThrSerAlaAla270AlaGluValVal305GlyAlaAlaThrLeu295GlyArgArgHisThr310AlaValValGluLeu285GluProLeuAlaPro300MetCysArgArgAla325ProGinAspProPro315ValGluProValAspValProAla340GlyAlaThrAlaArg330ArgLeuThrAlaGly360GluPro345TrpThrAspGinArg335SerHis320ProAspArglieVal355LeuLeuSerLeuGlyGluGlyGluAlaAspGinLeuProLeuSer.AlaVal365ProVal350ValGlyPro370ThrCysLeulieSer385ValCysArgAlaAla390Ser375AspProValGlu380AlaSerArgLeuVal405TrpThrAlaProArgGluAlaAlaLeuGlu420AlaAlaTrpGlyProAlaAsp435AlaValAlaAlaTyrArg450TrpGinSerAlaSer465LeuThrAspThrAla455ProLeuGluAlaLeu500PheGluValAlaGluGlyAspGlyGlu515AlaLeuLeuArgAsn530LeuAlaProProArgGlyArg395ArgAsnGinValAla410LeuAlaAspHisArg425GlyTrpThrSerAla440SerLeuAlaLeuGly430GluVal415ValAlaLeu400LeuGlyTrpAla445ProAlaSerLeuGlu470LeuAlaAlaGlu485ProThrGlyLeuHisGlyAlaGlyGlyPro柳ProValHisGlyAsp475ProTrpThrAlaArg490ArgAlaArgValHis505GlylieAspAlaThr495ThrPhe480AlaAlaVal520ValAlaGlyArgArg510HisAlaValHis545ArgAlaGinGlyProPheLeuGly580ArgAla535AleiThrTrpProAla525AspAlaValAlaVal550ArgProProGluPro565AspAlaAlaCysLeu585Gly540AlaValAlaAlaGlu555AspValThrHisAla570AlaAlalieProGly590Leu575GlyVal560LeuAla<210〉35〈211>246〈212>PRT<213〉yV織Wasp.WW-12651〈400〉1ValGinProThrAlaValArgAlaAlaThrValAlaProLeuGlyGly151015ProValPheAspGlyProGlyLeuAspGluThrThrArgGlyPheLeu202530AlaAspThrAlaProValAlaValAspLeuSerThrArgProAspArg354045ThrGlyAlaAlaLeuThrLeuMetThrAlaHisLeuAlaAlaValAla505560AspProAlaArgSerGlyAspGlyProProLeuSerPheLeuSerPhe65707580ArgSerHisAlaGluAlaPheLeuAlaThrThrArgAspProAsnAla859095AlaArgHisAlaPheAspThrArgTyrThrAspHisArgThrThrVal100105110GluAlaAlaValArgAlalieLeuLeuAspGlyAspProGlyAspAla115120125AlaProTrpSer'AlaAlaAlaArgAlaAlaLysProArgPheThrAla130135140GlyPheAlaSerAlaAspLeuValAlaHisThrGlyTyrThrArgAsp145150155160HisLeuArgGluArgThrAspPheAlaAspAsnProPheHisSerArg165170175AlaGlyAlaSerGluGinLeuGinAlaTyrLeuGlyGlyAspProSerPheLeuAla195SerSerGly210AlaLys225AlsAsp180185190ThrArgLeuLeuThrSerLeuLeuTyrValThrLeuHis200205ValSerLeuMetGinArgTyrPheLeuCysHisAlalie215220AlaCysGluSerlieTyrHisValAspSerMetSerLeuLeu230235240GlyLeuAlaVal245<210〉36<211〉135〈212〉PRT<213>yVbca/Y/Zasp.丽—12651<400〉1MetGlyValAlaThrGinMetLeuGluSerHisProHisAlaSerAsn151015GluThrGlyThrAlaGluLeuAlaAlaCyslieGluAlaCysPheGlu202530CysAlaGinThrCysThrAlaCysAlaAspAlaCysLeuGlyGluPro354045SerVal'AlaGluLeuValAspCysValArgSerAspLeuAspCysAla505560AspValCysGluThrThrGlyArgValLeuSerArgArgThrAlaPro65707580AspGinAspVallieArgAlaLeuLeuGluThrCysAlaLeuAlaCys859095LysArgCysGlyAspGinCysAlaGluHisAlaAspHisHisGluHis100CysArgThrCysAlaGluAla115AspLeuLeuThrThrLeuArg130135Cys120105ArgArgCysGluArg125110AlaCysArg<210>37<211〉153<212>PRT<213>爆aWasp.WW—12651<400>1MetlieThrSerThrLeuAspValAsnAspProAlaValGluArgAsn151015LeuGlyGluTyrValAlaAlaValGlyAspAlaValGlyAlaGlyPro202530AlaAlaSerAlaValAspLeuGlyProProValSerValTyrLeuAla354045ValAspGinArglieAlaGlyArgAspAlaAlaLeuLeuTrpSerGlu505560ArgHisGlyTrpSerValAlaThrGluSerHisProAlaLeuThrVal65707580LeuGlyTyrLeuGlyProAspLeuLeuProProProAsnAlaValAla859095ArgPheLeuAlaAspAlaValArgGlyLeuProLeuArglieGluPro100105110ProHisProArgSerThrAspLeuAspArgArgLeuVal'AlaTyrLeu115120125ProAlaGlyLeuArgAspLeuCysProLeuProArgSerAlaGluArg130135ProValAlaAlaThrGlyGlyGlyArg145150<210〉38〈211〉176<212>PRT<213〉AbcaWasp.WW-12651〈400〉1MetPhePheAspSerTrpThrGlyLeu15Ala140LeuProAlaArgThr■LeuAla65ValLeu35SerTyr20AlaThrLysMetThrLeuAlaGly50GluGlyliePheAlaTrpAlaAla85LeuSerThrProMetArgSerAla130Glu115GlyThr100GinAla70ValLeuValArgSerGlyGlyLeuValLeu25AsnAlaPhe40ThrlieLeu55MetAlaValArgSerProAlaArgHis105ThrArgSer120LeuAspGin135ValArgVal10AlaLeuArgAspLeuValLeuLeuArg90GlyThrSer60ValAla75lieArgArgLeuValAlaAla140ValLeuValGly15LeuVal45AsnSer30ThrGlyLysValAlaValAlaLeuAlaGinPheGlulieLeuArgAspGin125ValAlaGlu110AlaVal95AspAla80LysAlaVaJArgValLeuGluThrAspGlySerLeuSerVallieThrThrGlyLysAlaGlyAspSer145150155160ThrAlaLeuSerAspValThrAspValProArgHisAspThrArgGly16517017权利要求1.一种具有良好抗菌活性的抗生素-诺卡噻唑菌素的生物合成基因簇,其特征在于编码诺卡噻唑菌素生物合成所涉及的37个基因,具体为1)负责诺卡噻唑菌素I大环骨架生物合成的基因,即noc28,noc20,noc21,noc22,noc23,noc9,noc24,noc30共8个基因noc28位于基因簇核苷酸序列第38434-38581个碱基处,长度为150个碱基对,编码诺卡噻唑菌素的前体肽,长度为49个氨基酸;noc23位于基因簇核苷酸序列第30980-32875个碱基处,长度为1896个碱基对,编码杂环化蛋白,长度为631个氨基酸;noc22位于基因簇核苷酸序列第29544-30983个碱基处,长度为1440个碱基对,编码NADH脱氢酶,长度为479个氨基酸;noc21位于基因簇核苷酸序列第26965-29523个碱基处,长度为2559个碱基对,编码脱水酶,长度为852个氨基酸;noc20位于基因簇核苷酸序列第25968-26960个碱基处,长度为993个碱基对,编码脱水酶,长度为330个氨基酸;noc9位于基因簇核苷酸序列第14529-14584个碱基处,长度为456个碱基对,编码未知功能蛋白,长度为151个氨基酸;noc24位于基因簇核苷酸序列第32902-34683个碱基处,长度为1782个碱基对,编码未知功能蛋白,长度为593个氨基酸;noc30位于基因簇核苷酸序列第40176-40916个碱基处,长度为741个碱基对,编码未知功能蛋白,长度为246个氨基酸;2)负责诺卡噻唑菌素I吲哚酸侧链生物合成的基因,即noc25,noc26,noc27,noc29,共4个基因noc27位于基因簇核苷酸序列第36848-37948个碱基处,长度为1101个碱基对,编码自由基SAM硫胺合成酶,长度为366个氨基酸;noc25位于基因簇核苷酸序列第34680-35912个碱基处,长度为1233个碱基对,编码酰基-CoA合成酶,长度为410个氨基酸;noc26位于基因簇核苷酸序列第35933-36820个碱基处,长度为888个碱基对,编码酰基转移酶,长度为295个氨基酸;noc29位于基因簇核苷酸序列第38714-39976个碱基处,长度为1263个碱基对,编码SAM依赖的甲基转移酶,长度为420个氨基酸;3)负责诺卡噻唑菌素I脱氧糖基生物合成的基因,即noc6,noc10,noc11,noc12,noc13,noc14,共6个基因noc10位于基因簇核苷酸序列第14990-15703个碱基处,长度为714个碱基对,编码N-双甲基转移酶,长度为237个氨基酸;noc11位于基因簇核苷酸序列第15728-16972个碱基处,长度为1245个碱基对,编码NDP-己糖3位C上的甲基转移酶,长度为414个氨基酸;noc12位于基因簇核苷酸序列第16984-17970个碱基处,长度为987个碱基对,编码NDP-己糖-3-酮还原酶,长度为328个氨基酸;noc13位于基因簇核苷酸序列第17988-19418个碱基处,长度为1431个碱基对,编码dTDP-4-酮-6-脱氧葡萄糖2,3-脱水酶,长度为476个氨基酸;noc14位于基因簇核苷酸序列第19424-20560个碱基处,长度为1137个碱基对,编码NDP-6-脱氧-D-葡萄糖4位C上的氨基转移酶,长度为378个氨基酸;noc6位于基因簇核苷酸序列第11505-12683个碱基处,长度为1179个碱基对,编码糖基转移酶,长度为392个氨基酸;4)细胞色素P450氧化还原酶基因,即noc7,noc15,noc16,noc18,noc19,共5个基因noc7位于基因簇核苷酸序列第12704-13912个碱基处,长度为1209个碱基对,编码细胞色素P450氧化还原酶,长度为402个氨基酸;noc15位于基因簇核苷酸序列第20591-21703个碱基处,长度为1113个碱基对,编码细胞色素P450氧化还原酶,长度为370个氨基酸;noc16位于基因簇核苷酸序列第21696-22934个碱基处,长度为1239个碱基对,编码细胞色素P450氧化还原酶,长度为412个氨基酸;noc18位于基因簇核苷酸序列第23507-24649个碱基处,长度为1143个碱基对,编码细胞色素P450氧化还原酶,长度为380个氨基酸;noc19位于基因簇核苷酸序列第24646-25926个碱基处,长度为1281个碱基对,编码细胞色素P450氧化还原酶,长度为426个氨基酸;5)甲基转移酶基因,即noc8,noc36,共2个基因noc8位于基因簇核苷酸序列第13909-14532个碱基处,长度为624个碱基对,编码甲基转移酶,长度为207个氨基酸;noc36位于基因簇核苷酸序列第43983-44768个碱基处,长度为786个碱基对,编码甲基转移酶,长度为261个氨基酸;6)抗性基因,即noc17,noc37,共2个基因noc17位于基因簇核苷酸序列第22956-23480个碱基处,长度为525个碱基对,编码博来霉素抗性蛋白,长度为174个氨基酸;noc37位于基因簇核苷酸序列第44914-45423个碱基处,长度为510个碱基对,编码磷酸盐ABCtransporter,长度为169个氨基酸;7)调节基因,即noc5,noc33,noc34,共3个基因noc5位于基因簇核苷酸序列第10404-11387个碱基处,长度为984个碱基对,编码SARP家族的转录调节蛋白,长度为327个氨基酸;noc33位于基因簇核苷酸序列第42031-42456个碱基处,长度为426个碱基对,编码热休克蛋白,长度为141个氨基酸;noc34位于基因簇核苷酸序列第42565-43173个碱基处,长度为609个碱基对,编码hsp18转录调节因子,长度为202个氨基酸;8)负责转录翻译的基因,即noc1,noc2,noc3,noc4共4个基因noc1位于基因簇核苷酸序列第7731-8084个碱基处,长度为354个碱基对,编码50S核糖体蛋白L18,长度为117个氨基酸;noc2位于基因簇核苷酸序列第8282-8785个碱基处,长度为444个碱基对,编码DGPFAETKE家族蛋白,长度为147个氨基酸;noc3位于基因簇核苷酸序列第8731-9867个碱基处,长度为1137个碱基对,编码RNA聚合酶ECF-亚族的信号因子,长度为378个氨基酸;noc4位于基因簇核苷酸序列第9968-10387个碱基处,长度为420个碱基对,编码ATP酶,长度为139个氨基酸;9)未知功能基因,即noc31,noc32,noc35,共3个基因noc31位于基因簇核苷酸序列第41003-41410个碱基处,长度为408个碱基对,编码未知功能蛋白,长度为135个氨基酸;noc32位于基因簇核苷酸序列第41492-41953个碱基处,长度为462个碱基对,编码未知功能蛋白,长度为153个氨基酸;noc35位于基因簇核苷酸序列第43228-43758个碱基处,长度为531个碱基对,编码未知功能蛋白,长度为176个氨基酸。2.根据权利要求1所述的诺卡噻唑菌素的生物合成基因簇,其特征在于所述的诺卡噻唑菌素的生物合成基因簇中编码核糖体机制的前体肽包含下述两个部分信号肽部分和结构肽部分。3.—种根据权利要求1所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成抗生素诺卡噻唑菌素及类似物。4.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成噻唑环。5.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成羟化吡啶环肽中心。6.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成吲哚酸结构单元。7.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成诺卡噻唑菌素的大环骨架。8.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的编码蛋白用于催化合成4-N,N-二甲基-2,4,6-脱氧己糖。9.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的用途,其中的部分基因在S.ac加cw"sATCC25421相关基因缺失的突变株中进行异源互补恢复产生诺肽菌素。10.根据权利要求3所述的诺卡噻唑菌素的生物合成基因簇的用途,其中的后修饰基因在S.a"wcmwATCC25421中进行异源表达产生诺肽菌素的结构类似物。全文摘要本发明涉及诺卡噻唑菌素的生物合成基因簇,具体地说是一类由诺卡氏菌产生的具有良好抗菌活性的抗生素-诺卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含37个基因8个与大环骨架生物合成相关的基因,4个与吲哚酸侧链合成相关的基因,6个与糖基合成相关的基因,5个P450氧化还原后修饰酶基因,2个甲基转移酶基因,2个抗性基因,3个调节基因,3个未知功能的基因以及4个与转录翻译有关的基因。通过对上述生物合成基因的异源表达可产生一系列新型硫肽类抗生素。本发明所提供的基因及其蛋白可以用来寻找和发现用于医药、工业或农业的化合物或基因、蛋白。文档编号C12P21/04GK101684471SQ200910055328公开日2010年3月31日申请日期2009年7月24日优先权日2009年7月24日发明者莹丁,文刘,潘海学,沂虞申请人:中国科学院上海有机化学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1