诺丝七肽的生物合成基因簇的制作方法

文档序号:572771阅读:375来源:国知局

专利名称::诺丝七肽的生物合成基因簇的制作方法
技术领域
:本发明属于微生物基因资源和基因工程领域,具体涉及抗革兰氏阳性菌抗生素诺丝七肽(Nosiheptide)的生物合成基因簇的克隆、分析、功能研究及其应用。
背景技术
:诺丝七肽(Nosiheptide)是硫肽类抗生素家族的一个著名成员,可由链霉菌5!fre/7to附戸pS""mosmsATCC25421、iS^repfomycesATCC14921、S^"e/^o,cesAowc^e腦'sATCC12236所产生。其分子结构式最先由Depaire.H等人分析鉴定[Depaire,H.;Thomas,J.-P.;Brun,A.;Olesker,A.;Lukacs,dTe/ra/iedro"1977,1397.]。结构上,Nosiheptide由五个噻唑环,一个吡啶环组成大环骨架结果,侧链是一个3_甲基_5_甲氧基_2_吲哚酸与主体大环结构通过硫酯键相连。诺丝七肽具有良好的生物活性。它对革兰氏阳性菌有广谱而且强有力的抑制作用,特别是对多种耐药性的条件致病菌具有极强的杀伤作用。诺丝七肽抑制革兰氏阳性菌的机制是因为它能与50S核糖体亚单元上的23SrRNA-Lll蛋白复合物结合,抑制延长因子的GTPase活性,从而抑制蛋白质的合成[</Mo/.历o/1998,276,391-401]。但是,由于诺丝七肽水溶性不好,生物利用度较低,大大限制了它的医药用途,目前只作为畜用抗生素。人们希望能获得一些它的结构类似物,从中筛选出活性更好,更有利于实际使用的分子。由于诺丝七肽极其复杂的分子结构,即使是在有机合成化学高度发达的今天,通过化学全合成来获得产品也是一项艰巨的挑战。直到2008年才首次报道了诺丝七肽的部分化学合成[MarcC.KimberandChristopherJ.Moody.Constructionofmacrocyclicthiodepsipeptides:synthesisofanosiheptide'southernhemisphere,modelsystem.CT;ew.Co附附ww.,2008,591-593.],整个合成过程操作繁琐,产率低下。通过化学合成所获得的结构类似物即使在活性和水溶性方面的性质得到改善,也可能因为合成的复杂性而使实际生产成本过高。我们以微生物来源的诺丝七肽为目标分子,从克隆生物合成基因簇出发,采用微生物学、分子生物学、生物化学及有机化学相结合的方法研究其生物合成,通过对其生物合成机制的研究揭示了其经由核糖体合成的生物合成机制,并揭示了包括喹萘啶酸在内的独特化学结构形成的酶学机理,在此基础上运用代谢工程的原理,合理修饰诺丝七肽的生物合成途径,探索水溶性好、生物利用度高、活性更好、并能通过微生物发酵大量生产的新型药物。
发明内容本发明涉及一种由链霉菌S/re;/owyceyac加twt^ATCC25421产生的具有抗革兰氏阳性菌活性的抗生素——诺丝七肽(Nosih邻tide)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。本发明中整个基因簇共包含16个基因的核苷酸序列或互补序列(序列1),其中一个基因("o;yM)负责编码诺丝七肽的前体肽,八个基因("o"、mw5、msC、mw£>、"as五、mwF、《<wG、负责对Mw/Z编码的前体肽进行后修饰,形成整个大环骨架;六个基因("<w/、ww/、ww《、ww丄、wosiV、负责以色氨酸为前体,合成吲哚酸结构单元;一个基因mwi>负责对诺斯七肽的生物合成进行调控。本发明还提供了一个编码未知蛋白的核苷酸序列,由序列2中的氨基酸序列组成,命名为"o",其基因的核苷酸序列位于序列l中第2704-2249碱基处。本发明还提供了一个编码P450氧化酶的核苷酸序列,由序列3中的氨基酸序列组成,命名为wcw5,其基因的核苷酸序列位于序列1中第4068-2701碱基处。本发明还提供了一个编码P450氧化酶的核苷酸序列,由序列4中的氨基酸序列组成,命名为wosC,其基因的核苷酸序列位于序列1中第5309-4083碱基处。本发明还提供了一个编码脱水酶的核苷酸序列,由序列5中的氨基酸序列组成,命名为wcwZ),其基因的核苷酸序列位于序列l中第6365-5328碱基处。本发明还提供了一个编码脱水酶的核苷酸序列,由序列6中的氨基酸序列组成,命名为mw五,其基因的核苷酸序列位于序列l中第9114-6352碱基处。本发明还提供了一个编码NADH依赖的脱氢酶的核苷酸序列,由序列7中的氨基酸序列组成,命名为mwF,其基因的核苷酸序列位于序列1中第10778-9129碱基处。本发明还提供了一个编码未知蛋白的核苷酸序列,由序列8中的氨基酸序列组成,命名为mwG,其基因的核苷酸序列位于序列l中第12800-10830碱基处。本发明还提供了一个编码未知蛋白的核苷酸序列,由序列9中的氨基酸序列组成,命名为"os//,其基因的核苷酸序列位于序列l中第14751-12797碱基处。本发明还提供了一个编码乙酰辅酶A合成酶的核苷酸序列,由序列10中的氨基酸序列组成,命名为mw/,其基因的核苷酸序列位于序列1中第16097-14763碱基处。本发明还提供了一个编码未知功能酶的核苷酸序列,由序列11中的氨基酸序列组成,命名为"oW,其基因的核苷酸序列位于序列1中第16297-16058碱基处。本发明还提供了一个编码水解酶的核苷酸序列,由序列12中的氨基酸序列组成,命名为mwK,其基因的核苷酸序列位于序列l中第17106-16294碱基处。本发明还提供了一个编码SAM自由基蛋白的核苷酸序列,由序列13中的氨基酸序列组成,命名为mw丄,其基因的核苷酸序列位于序列1中第18316-17114碱基处。本发明还提供了一个编码Nosiheptide前体肽的核苷酸序列,由序列14中的氨基酸序列组成,命名为"cwil/,其基因的核苷酸序列位于序列1中第18668-18820碱基处。本发明还提供了一个编码SAM依赖的甲基转移酶的核苷酸序列,由序列15中的氨基酸序列组成,命名为朋sW,其基因的核苷酸序列位于序列1中第18891-20078碱基处。本发明还提供了一个编码与后修饰相关的未知蛋白的核苷酸序列,由序列16中的氨基酸序列组成,命名为wcw(9,其基因的核苷酸序列位于序列1中第20075-21187碱基处。本发明还提供了一个编码SARP家族调控基因的核苷酸序列,由序列17中的氨基酸序列组成,命名为朋W,其基因的核苷酸序列位于序列1中第21497-22468碱基处。序列1的互补序列可根据DNA碱基互补原则随时得到。序列1的核苷酸序7列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶切相应的DNA或使用其他合适的技术得到。本发明提供了得到至少包含部分序列1中DNA序列的重组DNA质粒的途径。本发明还提供了产生诺丝七肽生物合成基因被中断、被置换或同框缺失的微生物体的途径,至少其中之一的基因包含有序列1中的核苷酸序列。本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与诺丝七肽生物合成基因相似的基因。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从链霉菌S/re;^o/MycMflcmo犯sATCC25421基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有5^印tow;;ceyfl"wcwwATCC25421基因组中邻近区域以前未克隆的DNA序列。包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,位点特异性突变,特别是可以通过定点突变编码前体肽的基因序来实现Nosiheptide大环骨架的改造,获得一系列的Nosiheptide类似物。还可以通过不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNAshuffling),或通过紫外线或化学试剂诱变等。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性或产量。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过缺失诺丝七肽生物合成中的一个或几个步骤而得到新的诺丝七肽结构类似物或前体。包含DNA片段或基因可以用来提高诺丝七肽或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。本发明所提供的诺丝七肽骨架的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的氧化还原反应也可有其他应用。总之,本发明所提供的包含诺丝七肽生物合成相关的所有基因和蛋白信息可以帮助人们理解诺丝七肽类天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。图l:诺丝七肽的化学结构图2:诺丝七肽生物合成基因簇的限制性内切酶谱。3个交叠的粘粒代表了抗生素产生菌基因组40kb的DNA区域,B代表限制性内切酶5cwnHI;图3:诺丝七肽生物合成基因簇的基因组成。图4:提出的诺丝七肽的大环骨架部分的生物合成途径。图5:提出的诺丝七肽的后修饰部分的生物合成途径。图6:诺丝七肽侧链甲基B引哚酸单元的合成途径。图7:与Nosiheptide生物合成相关的15个基因的同框缺失突变菌株发酵液的高效液相色谱(HPLC)分析。图8:基因缺失突变菌株产生的4个新化合物的可能结构与质谱分析。符号说明图1Nosiheptide:诺丝七肽。图3cyclopeptidecorebiosynthesis:大环骨架生物合成;indolicacidmoietybiosynthesis:D引哚酸单元生物合成;tailoring:后修饰;regulation:调控;unrelated:不相关基因。图4propeptide:前导肽;complexB:nosO基因同框缺失突变株的发酵液中分离出的化合物。图5complexB:nosO基因同框缺失突变株的发酵液中分离出的化合物;complexC-nosC基因同框缺失突变株的发酵液中分离出的化合物;complexD:nosB基因同框缺失突变株的发酵液中分离出的化合物;complexE:nosA基因同框缺失突变株的发酵液中分离出的化合物。图6Ado:由SAM蛋白所产生的自由基。图7complexE:nosA基因同框缺失突变株的发酵液中分离出的化合物;complexI:nosN基因同框缺失突变株的发酵液中分离出的化合物;complexB,complexF:nosO基因同框缺失突变株的发酵液中分离出的化合物;complexH:nosB基因同框缺失突变株的发酵液中分离出的化合物;complexG:nosC基因同框缺失突变株的发酵液中分离出的化合物。图8complexE:nosA基因同框缺失突变株的发酵液中分离出的化合物;complexI:nosN基因同框缺失突变株的发酵液中分离出的化合物;complexB,complexF:nosO基因同框缺失突变株的发酵液中分离出的化合物;complexH:nosB基因同框缺失突变株的发酵液中分离出的化合物;complexG:nosC基因同框缺失突变株的发酵液中分离出的化合物。具体实施例方式以下结合图1-图8对本发明进一步详细说明。101.克隆诺丝七肽的生物合成基因片断尽管在诺丝七肽的化学合成和作用机制方面的研究很多,但有关其生物合成起源方面的认识却非常少。之前,人们依据非核糖体聚肽合成酶的保守序列设计简并引物,希望用这种简并引物能扩增获得与诺丝七肽生物合成相关的基因,总是不能成功。本专利依据诺丝七肽分子中富含噻唑环这一特点,以噻唑环合成酶的保守序列设计简并引物,以S/r印to/^CMac加omy的总DNA为模板,成功克隆得到了负责催化噻唑环合成的环化酶基因。在5^印to/wyc^a""oms体内失活该基因,得到的突变体无法再产生诺丝七肽,证实了克隆到的基因与诺丝七肽生物合成相关。2.诺丝七肽生物合成基因簇的克隆,序列分析及功能分析将上述杂环合成酶基因片段用地高辛标记为探针,从Srr印fomycesac加osws的基因组文库约2000个克隆中筛选,分离得到的粘粒涵盖了染色体约40kb的区域。(图2)。DNA顺序分析了34,713bp的染色体区域,GC含量71.60/^生物信息学分析包含了26个开放读码框(图3)。开放读码阅读框详细的分析结果列于表l。表1Nosiheptide的生物合成基因簇中各基因及编码蛋白的功能分析<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table>129SC04653(NP—628814),from81/8650SribosomalproteinL7/L12or/7176SSEG_01531(YP_002208236),fromS/re/rfo附戸ssv!'eeus』rCC2卯W89/9650SribosomalproteinLIO一272SC04651(NP一628812),from65/78lipoprotein297SSEG_01533(YP—002208238),from55/70lipoprotein241SCO4649(NP_628810),fromiS/repto附戸scoe//co/or爿3092/9750SribosomalproteinLI3.Nosiheptide的生物合成基因簇边界的确定根据基因编码蛋白的功能分析以及和结构类似物Siomycin生物合成基因簇对比,诺丝七肽的生物合成基因簇被确定为从基因"oW到mw尸(图3),包含16个开放读码框。本发明中整个基因簇共包含16个基因的核苷酸序列或互补序列(序列1),其中一个基因(nosM)负责编码诺丝七肽的前体肽,五个基因("(wi)、"cwF、mwG、ww/f、负责对"fwM编码的前体肽进行修饰,形成整个大环骨架;五个基因("oW、mw丄"oy《、"仍Z、wwiVO负责以色氨酸为前体,合成甲基吲哚酸结构单元;一个基因"os户负责对整个生物合成进行正调控。其中基因m^M的同框缺失完全抑制了诺丝七肽的产生(图7),进一步证明了克隆到基因簇为诺丝七肽的生物合成基因簇。4.甲基B引哚酸结构单元的生物合成途径甲基吲哚酸结构单元的生物合成如图6所示。编码的自由基蛋白催化色氨酸发生自由基重排,ww《编码的水解酶使得色氨酸重排产物的亚氨基转化为羟基,然后在"o^所编码的蛋白作用下发生羟甲基化以形成侧链的最终结果,最后编码的酰基-CoA合成酶负责活化吲哚酸的羧基,将其转变成CoA-硫酯键。5.诺丝七肽骨架合成诺丝七肽生物合成基因簇中有一个基因mwA/编码诺丝七肽的前体肽,经核糖体将该前体肽合成之后,由"^G编码的环化酶负责催化前体肽中的巯基亲核进攻临位的羰基,然后脱去一份子水,形成噻唑啉,mwF负责编码的脱氢酶将13噻唑啉转变为噻唑,然后由mwD、"o^编码的脱水酶负责催化使得丝氨酸残基的羟基脱水,然后两个脱水丝氨酸残基发生D-A反应,形成第一个大环;然后在"^0编码的未知蛋白作用下,信号肽被切除,并形成完整的吡啶环中心。整个过程如图5所示。以下进一步提供实施实例,这些实施实例有助于理解本发明,仅用作说明而不限制本发明的应用范围。实施例l诺丝七肽产生菌链霉菌S/reptowycesa"wow^ATCC25421总DNA的提取将100lx108S.孢子悬液接种到3mLTSB液体培养基中,30°C,230rpm培养约24hr后达到对数生长期后期,取2mL接种到50mLTSB(含10mM氯化镁,0.1%甘氨酸),30'C,250rpm培养约23hr后达到稳定生长期前期,呈乳黄色浑浊,将菌液4'C,3500rpm,离心15min收集菌丝,用裂解液洗涤,收集淡乳黄色菌丝0.5mL。向1mL菌丝中加入10mL裂解液(含溶菌酶5mg/mL)共四管,涡旋至均一,37'C水浴15mim。加入0.1mL蛋白酶K(10mg/mL,用裂解液新鲜配制),lmL10%SDS,混匀后迅速放入70'C水浴15mim,呈澄清。置冰上冷却,加入2.5mL5MKAc,冰上冷却15min。加入10mL饱和酚,混匀,10mL氯仿,混匀,12000rpm,4'C离心20min。用破口的枪头将水相吸出置于新的离心管,加等量的CHClr异戊醇(24:1)抽提,12000rpm,4'C离心10min。用破口的枪头将水相吸出置于新的离心管,加2倍的无水乙醇,混匀,有大团的DNA出现。将其钩出置于新的离心管,力B5mL70。/。乙醇洗涤,将液体倾出,用枪吸净,加5mLTE溶解,加RNaseA使终浓度为50ng/mL,37'C温育0.5小时。依次用等体积的饱和酚抽提两次,CHCl3-异戊醇抽提两次,向水相中加入0.1体积的3MNaAc,2体积的无水乙醇,轻轻的混合充分,有絮状DNA出现。将四管DNA合并到两管(每管中有1mL70。/。乙醇用于洗涤),将液体吸出,再加1mL无水乙醇洗涤,吸出乙醇,超净台中吹干,溶于适当体积的TE(pH8.0)中。实施例2诺丝七肽产生菌链霉菌S/reptow少cesacmcwMATCC25421遗传转移系统的建立培养含有适当质粒的五.co//ET12567至OD6oo0.3-0.4,30mLLB培养液中的细菌细胞离心收集,用等体积的LB洗两次,重悬于2mLLB中,作为大肠杆菌供体细胞。取适量冻存于一8(TC的S/w/7to/^c^a""o;y^ATCC25421的20%甘油孢子悬液500nL,用等体积的TES缓冲液(50mMTESNa^pH8.0)洗两次,重悬于等体积的TES缓冲液,50'C热激10min使孢子萌发。再加等体积的TSB培养基,37'C温育2—5hr。离心重悬于0.5—lmLLB中作为链霉菌受体细胞。将不同浓度的受体细胞100pL与等体积的供体细胞混合直接涂布在含有lOmMMgCl2的平板上,3(TC温浴20hr后,采用无菌水轻轻洗涤平板表面以洗去大部分大肠杆菌,在每一平板的表面覆盖lmL含萘淀酮酸(终浓度为50ng4iL)和相应抗生素的无菌水。30'C培养5天以上挑取接合子。由于arewowycesac加o犯sATCC25421对阿泊拉霉素和红霉素都敏感,最后确定遗传转移所用抗生素的浓度阿泊拉霉素25pg/mL,红霉素10(Hig/mL。MS(甘露醇2,0g,黄豆粉2,0g,琼脂粉2,0g用自来水稀释至100mL,并调节pH=7)培养基最好,接合转移效率最高。在MS培养基上,无论是在链霉菌中可以自主复制的质粒pKC1139、自杀型质粒pOJ260都可以得到相应的接合子。实施例3诺丝七肽产生菌链霉菌S/r印to/wj;c^ac加cwt^ATCC25421基因组文库的构建首先用lml注射器吹吸S/re/7toT^cesac似owsATCC25421总DNA数次,使得总DNA随机断裂,使用蔗糖梯度离心对DNA进行梯度离心,收集略大于40kb的DNA片段,脱磷,待用。pJTU2554先用EcoRV从两个cos序列中间切开,与制备好的的40kb的DNA片段连接过夜。于冰上融化存于一80'C的PromegaPackageneexract,立即加入10ul连接产物,轻弹混匀,于室温(约22'C)放置3hr。加入445ulPhagebuffer,倒转混合;加入25ul氯仿终止反应,离心使氯仿沉于底部,4'C保存。将冻存于-80'(:的菌株£.0)11LE392涂布在LB培养基上复苏。调取单菌落接种于3MLLB培养基中(0.2Xmaltose10和mMMgS04),37°C,220rpm振荡培养过夜,转接1%到50MLLB培养基中(0.2%maltose10和mMMgS04),37°C,220rpm振荡培养至OD600=0.6—0.8。取5ul包装液,加入95ulphagebuffer,稀释,再加入100ul£.Co//LE392(OD600=0.67)混匀,37°C,30min,涂于LB(含100ug/mlApramycin)平板上。37'C倒置培养过夜,测定噬菌斑形成单位(pfix)以估算文库的效价。取100ul包装液加入3.9mlphagebuffer混匀,再加入4mlE.ColiLE392(OD600=0.72)菌液,室温,30min,加入4mlLB,37°C,75min;2500rpm,10min,去上清,剩余1-3ml涂于LB(含100ug/mlApramycin)平板上。37'C倒置培养过夜。用LB刮下平板上的菌株,加入甘油(终浓度18%)和Apramycin(终浓度50ug/ml),分装,于一80'C保存。随机从平板中挑取10个克隆,接种于LB培养基中培养,按大肠杆菌的质粒的碱法小量制备的方法抽提重组黏粒。用5"wM鉴定,于0.8%的琼脂糖凝胶上电泳,根据限制酶切的电泳分析图谱,我们判断出黏粒被酶切产生的片断大小,加和这些片断,从而推算出整个黏粒的大小,实验表明每个黏粒的插入片断约为40Kb左右。对于链霉菌而言,其染色体DNA的大小约为8Mb,如果插入片断为20kb的文库效价是2000—5000cfii,就足以代表它的整个基因组。根据以上实验,我们建立的文库效价超过为10000pfU/ugDNA,插入片断约为40kb左右,这表明我们建立的文库具有良好的质量,能够满足文库筛选的需要。实施例4诺丝七肽产生菌链霉菌S/re/^cw^ce5flc加cw^ATCC25421的发酵、产物分离纯化与鉴定取100ulS/r印to附ycMATCC25421孢子接入S.a"wos附一级发酵培养基(TSB15g,可溶性淀粉15g;蔗糖50g,蒸馏水定容到1L)28°C、250转每分钟培养48小时,取10ml种子培养液接入S.a""M附二级发酵培养基(TSB15g,CaS0415g,酵母提取物llg,葡萄糖50g,2x微量元素lml,蒸馏水定容到1L)28°C、250转每分钟培养72小时.发酵液以3800rpm的转速,离心15分钟;上清用等量的乙酸乙酯萃取两次,萃取后的乙酸乙酯用适量无水硫酸镁30'C蒸干,所得固体用3ml甲醇溶解。发酵产物分析取20pl进样,流动相为乙腈和水(含0.1XTFA)。HPLC洗脱条件为(紫外254nm处检测,柱子为NUCLEOSIL100-5C18)。<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table>实施例5PCR克隆诺丝七肽的生物合成基因PCR体系包含DMSO(8%,v/v),MgCl2(25mM),dNTP(2.5mM),简并性引物(40mM),TaqDNA聚合酶(2.5u)及适量模板Srr印fow[);cesATCC25421总DNA。首先95。C,3min,1轮;然后94。C,lmin,68'C,lmin,72。C,2min,5轮;94。C,lmin,65。C,lmin,72°C,2min,30轮;最后72。C,10min,1轮。PCR结束后,1%琼脂糖电泳检査结果。低熔点胶回收预期大小的DNA片段,与pMD19-Tvector连接,转化大肠杆菌DH5a感受态细胞,涂布在含有氨苄青霉素,IPTG(异丙基硫代-p—D-半乳糖苷)和X-gal(5—溴—4—氯—3—吲哚一p—D-半乳糖苷)的LB平板上进行蓝白斑筛选。挑取白色菌落过夜培养,抽提质粒,EcoRl酶切鉴定是否含有预期大小的DNA插入片段。插入有预期大小DNA片段的质粒测序。实施例6核酸分子杂交l)DIGDNA标记将待标记的DNA用无菌水稀释至总体积15nL,沸水浴中加热变性10分钟,立即置于冰盐浴中冷却。接着加入2pL引物混合物,2pLdNTP混合物,lpL酶,混合均匀后,37。C水浴约16小时。加入0.8pL0.8MEDTA(pH8.0)以终止反应,加入2.5nL4MLiCl混合均匀,再加入75^L预冷的无水乙醇沉淀标记后的DNA,置于一8(TC沉降40分钟。4°C,12000rpm离心20分钟收集DNA,用预冷的70。/。乙醇洗涤DNA沉淀,真空干燥后重新溶于50pLTE((pH8.0)中。2)DIGDNA探针标记后的质量检测稀释标记的DNA探针,至以下六个梯度,1、10"、l(T2、l(T3、IO"4、l(T5。稀释标记的对照DNA至浓度分别为以下浓度lpg/mL,100ng/mL,10ng/mL,lng/mL,0.1ng/mL,0.01ng/mL。分别取lpL上述梯度的DNA样品点在杂交用的尼龙膜上,根据7)所述步骤进行显色反应,对比标记的DNA探针和DIG标记的对照DNA的显色强度以决定标记的DNA探针浓度。3)菌落杂交(文库筛选)的膜转移将保存于一80'C的基因文库稍融,取50pL,用450pLLB稀释得到10"的稀释倍数,倍比稀释得到10-2,l(T3,IO"4,l(T5,IO"6。300pL涂平板(15cmxl5cm,平板为LB/50[ig/mL卡那霉素)。选取合适的比例,使每块平板约1200—1500个克隆。照选定的比例均匀涂布四块平板,37。C培养过夜。根据平板的大小剪取尼龙膜,小心地覆盖于平板表面不要产生气泡,做好位置标记,1分钟后取下尼龙膜置于干燥滤纸上,干燥10分钟直至菌落结合在尼龙膜上。原始的平板置于培养箱中4一5hr,使克隆重新生长作为原平板。将尼龙膜置于变性液(0.25MNaOH,1.5MNaCl)饱和的滤纸上15分钟(不要浸过膜),转移至中和液(1.0MTris.HCl,1.5MNaCl,pH7.5)饱和的滤纸上5分钟。转移至2xSSC(20xSSC储备液(L"):NaCl,175.3g,柠檬酸钠,88.2g,pH=7.0)饱和的滤纸上自然风干。取下尼龙膜置于烘箱中,120'C固定45分钟。常温下于3xSSC/0.1%SDS溶液中振荡洗涤3小时,以除去细胞碎片。4)Southem杂交的膜转移:DNA样品在适当浓度的琼脂糖凝胶上电泳至适当距离,做好标记。浸泡于400mL0.25MHCl中脱嘌呤20分钟,使溴酚蓝变黄,用去离子水洗数次。室温下浸入碱性缓冲液(0.5MNaOH,1MNaCl)15分钟并轻轻振荡。换液一次继续浸泡凝胶20分钟,并轻轻振荡,去离子水洗三次。取一张每边都比凝胶大lmm的尼龙膜,用去离子水完全浸湿,做好标记。采用向上毛细管转移方法,用10xSSC转移缓冲液转移8—24hr。用2xSSC略微洗膜,120'C烘烤30分钟。5)预杂交和杂交预热杂交液(20mL/100cm2)至杂交温度68",放入杂交尼龙膜,轻轻振荡并保温30分钟。将DIG标记的DNA探针在沸水浴中变性5分钟,立即置于冰盐浴中冷却。冷却后,将DNA探针与合适体积的DIG杂交液(2.5mL/100cm"混合均匀。去除预杂交液并立即把DNA探针/DIG杂交液加入,轻轻振荡保持杂交温度64-C或68'C约16小时。6)杂交后严紧洗脱室温下用2xSSC/0.1%SDS漂洗两次,每次5分钟。68'C,用0.1xSSC/0.1%SDS振荡漂洗两次,每次15分钟。7)显色反应和检测严紧洗脱后的尼龙膜在洗涤缓冲液(0.1M马来酸,0.15MNaCl,pH=7.5,0.3%(v/v)Tween20)中平衡1-5分钟,接着在封闭缓冲液(封闭试剂以10。/。的浓度溶于0.1M马来酸,0.15MNaCl,pH=7.5)中封闭30分钟,然后在抗体中浸泡30分钟。用洗涤缓冲液漂洗尼龙膜两次后,用检测缓冲液(0.1MTris-HCl,0.1MNaCl,pH-9.5)中平衡2-5分钟,最后将尼龙膜置于10mL新配制的显色溶液[NBT(nitrobluetetrazoliumchloride)溶于70%DMF,浓度为70mg/mL,BCIP(5-bromo-4-chloro-3-indolyl-phosphate)溶于水,浓度为50mg/mL。用时10mL显色溶液中加45^LNBT,35pLBCIP]中,置于黑暗中显色。显色合适后用去离子水漂洗以终止反应。实施例7基因中断突变菌株的获得将获得的转化子接种到TSB液体培养基(Am25pg/ml)中,30'C振荡约28hr。取出200^1涂布在ISP-2(Am50ng/ml)平板,30'C培养6-8天,收孢子,保存于-80°C;取出1(HU在ISP-2(Am50ng/ml)平板画线,37。C培养,放置2—3天。挑37'C整合生长的单菌落,接种至液体培养基ISP-2(Am25pg/ml),37'C,振荡2—3天。取出涂布在ISP-2平板(Am50^ig/ml),37'C整合2-3天,收孢子,保存于-80°C。基因中断或基因置换所用载体为pKC1139,基因置换用红霉素抗性基因替代目标基因中间的DNA片段。构建好的质粒通过实施例2所述属间接合转移的方式导入areptowycMa"wo做sATCC25421中得到双交换突变体,所得突变体通过Southern杂交在基因型上加以证明。以下根据本
发明内容提供的基因和蛋白序列氨基酸/核苷酸序列表:SEQUENCELISTING<110>中国科学院上海有机化学研究所<120>诺丝七肽的生物合成基因簇<130>说明书、权利要求书<160>1<170>PatentInversion3.3<210>1<211>34713<212>DNA<213>链霉菌S/re/7/o附ycesac加cwwjATCC25421<400>1CGCCAGCGCCGCGAGGGGCTCCTCGTCGGACGGCTTGCGCTTGATGACCTCTTCGGCGTT60GTCGACCGCGTGGCCCTCGATGGCCTCGATGTCGACCGGGGAGGGCAGGTAGCGCACGAC120CGCGTCGAGCAGGGGCTGGACGCCCTTGTTCTTGAACGCGGTGCCGCAGAAGACCGGGGT180CACCGTGGTGCCCTGGCCCTTGCCGGAAGCGATCGTGATACGGCGGATGGCCGCGTACAG240CTGCTCCTCGGAGGGCTCCTCGCCCTCCAGGTACAGCTCCATGATCTCTTCGTCGTTCTC300GGCGACGGCCTCGAGCAGCTTGCCGCGCCACTCCTCGGCGGCCTCGGTGTGCGTGGCCGG360GATGTCGACGACGTCGTACATCTCGCCCTTGGTCGCCTCGGCGGACCACACGAGCGCCTT420CATGCGGACCAGGTCCACGACGCCCTTGAAGTCGGCCTCAGCGCCGATCGGCAGCTGCAT480CACGATCGGCTGGGCACCCAGCCGGTCGCTGATCATGTCGACACAGCGGTGGAACTCGGC540ACCGGTGCGGTCGAGCTTGTTGACGAAGCAGATACGCGGAACGCCGTAGCGGTCCGCCTG600ACGCCACACCGTCTCGGACTGCGGCTCGACGCCGGCGACGCCGTCGAACACCGTCACGGC660ACCGTCGAGCACGCGCAGGGAACGCTCCACCTCGACGGTGAAGTCGACGTGACCCGGCGT720GTCGATGATGTTGATGGTGTGGTCGACGTCGTCCAGCGACCAGTGACAGGTGGTGGCAGC780AGAGGTGATCGTGATGCCACGCTCCTGCTCCTGCTCCATCCAGTCCATGGTGGCAGCGCC840GTCGTGGACCTCACCGATCTTGTAGGACACACCGGTGTAGAACAGGATCCGCTCGGTGGT900GGTCGTCTTGCCCGCGTCGATGTGGGCCATGATGCCGATGTTGCGCACCTTGGCCAGGTC960AAGCGAAGTGGTAGCCATAAGGCTTCAGTCTTCTCTCGGTTCTCGAAGGGGTTCCGACTA1020CCAGCGGTAGTGCGCGAAGGCCTTGTTGGACTCGGCCATCTTGTGCGTGTCCTCGCGCTT1080CTTCACCGCGGCGCCGAGGCCGTTGGAGGCGTCGAGGAGCTCGTTGAGCAGACGCTCGGT1140CATGGTCTTCTCGCGACGGGCGCGGGAGTAACCGACGAGCCAGCGCAGCGCCAGGGTGTT1200GGCACGGCCGGGCTTGACCTCGACCGGGACCTGGTAGGTGGCGCCACCGACACGGCGGGA1260CTTGACCTCGAGGGTCGGCTTGATGTTCTCGAGAGCGCGCTTGAGCGTGATGACCGGGTC1320GTTGCCGGTCTTCTCGCGCAGGCCCTCCATGGCGCCGTAGACGATGCGCTCGGCGGTGGA1380GCGCTTGCCGTTCAGCAGCACCTTGTTGATCAGGGAGGTCACCAGAGGAGAACCGTAGAC1440CGGGTCGATGATGACCGGGCGCTTCGGGGCGGGGCCCTTACGAGGCATTCTTACTTCTCC1500TTCTTGGCGCCGTAGCGGCTGCGGGCCTGCTTGCGGTTCTTGACACCCTGGGTGTCGAGC1560GAGCCACGGATGATCTTGTAGCGAACACCCGGCAGGTCCTTCACACGGCCGCCGCGCACG1620AGCACGATGGAGTGCTCCTGCAGGTTGTGTCCCTCACCCGGAATGTAAGCGGTGACCTCG1680ATCCCGCTGGTCAGACGCACACGCGCGACCTTACGCAGGGCCGAGTTCGGCTTCTTCGGG1740GTGGTCGTGAACACACGCGTGCAGACGCCACGACGCTGAGGGGAACCCTCGAGTGCGGGCl謂GTCTTGTTCTTCTCGACCTTGTCCTGCCGGCCCTTGCGGACCAGCTGCTGGATCGTAGGC1860ACTACTTCTCCGGTTTCTGTGTGCCGAATGGTGAAGCTAACCTGGAACGTCGCCGACCCA1920CGCGGTCGGGTGTGTCGAATCGTGCGGACTCCCGCCGCAAGGCAGAAAGAGGCGCAGATT1980GCGGTGGCCGGTGACGGCTCTCTGTGCGGTTGAAGGCACGCACGAGAGCCAGGGCACACC2040CCAGGCACAAGGTCTGAGCGTACCTAGCCCGTCAGCTCCGGTCAAAACAAATGGAACCCG2100CCCCGGTGGACCGGGGCCGCGAGCGCACCGCGTACCGATTCATCCCGGTACGTACGGTAC2160CCGGGCATGGCCGGAGCATGCCCGGGTACCGGGGGGCGCGCGAGGGGCGCGCGGAAGGCG2220CTGATTTTTGGTGGTGTCTCCGCTCGCGCTACGCCGGCGGCCGGGAGGGGATGAAGGCGT2280CGGCGCCCGGCGGTACGAACTCCTGCGGGCGGGTCAGCGGCTCGGGCGAGGCCGGGTCGA2340AGGCCAGGCCCAGCCCCTTGCCGAAGGGTGCGGCGGCAGCGGCGGGGCCCTCGGTGGCGG2400CCTCGACGCTGTAGTAGCGGCGCTCGGTCGGGCGGTAGCCGATCAGCTCCACGACCTTGG2460ACACGCCGGGCGGGCGGCCGTAGGCGGCCTCGGGCGAGTCCCAGAGGTAGACCGCGCCCC2520ACTGCTCGCCCTCGGGGCCGGTGGAGGAGATCCACGTCTTCTGCCGCAGGCCGGGCACGG2580TCGTGTACGCGTCCACGGCGTGGTCGCGCAGGTAGGCGCGCAGGGAGGCGACGGTCGCCG2640CGGAGCGGGACAGGTCCCACAGGACGACCGTGCAGTACAGCTGCTGTGCGGGGTGTTCGG2700TCATCGCAGGACCGCCTTCAGTTCGCGCGGGTACCGGTGGAAGAGGTTCGCGGTGAACTC2760CACGGCGGCCGGGTCGGCGGCCGGGGTGAGGGCGGGGAAGCGGCGCAGCAGCCGGCCGAA2820GCCCTCCTGGAGTTCCACGCGGGCGAGGGACGAGCCGAGGCAGTAGTGCGCGCCGGCGCC2880GAAGGTGAGGTGGGTGCGCGCGGCGCCCCGGGCCAGGTCGAAGGTGTCGGGGCGGTCGAC2940GTGCCGCTCGTCGCGGGCGGCGGAGTCGAGGGAGATGAAGACCGTGGCGCCCTCGGGGAG3000GGTGATGCCGCCGAGGGTCACCTCCTCGGTGGTGACGGTCGTCCCGGCGAAGCCGGTGCC3060GGCCTGGGCGTACCGCAGGATCTCCTCGACGGCGGCGGCCTCGGTGACGGTGCCGTCGCG3120CAGCCGGGCGAGCTGGTCGGGGTGCTGGAAGAGGGCGAGGAGTCCGTTGGCGAACTGGAC3180GGCGGTGGACTCGTAGCCGGCGGTGGCCAGCAGGACGACGGTGGAGACGAGTTCGTCGGC3240GGAGGGGCGGGCGTCCTCGTCGAGGCCCGCGATCAGGCTGCCGATCAGCCCGTCGCCGGG3300AGCGGCCAGCTCCTTCTCCACCAGCTGCCGGGCCACGCCGAACAGCGCGCCCATGGCCGC3360GCCGAAGGCGGCGGTCGACGGGGCGGCGGCCCGCACCTGGGCCGCCCACCCCCACAGCCC3420GGGGCGCAGCTCTTCGGGCAGGTCGAACAGCTCGCACAGCACGCGGACGGGCACCTGGTA3480GGCGAAGCCGGAGACCAGGTCGACGGGGTCCGGCCCCGCCTCGGCGAGCCCGTCCAGCAC3540CTCGTCCACCGCCTGCCCGACCGCCTTGCGCAGCGACTCGGCGTGCCGGGGGGTGAGGAC3600GGTGGCGAGGGTACGGCGCCACCGGGCGTGCCGCTCGGGGTCGGCCAGCGCCATCCCGAA3660GTCGAACCGCTGCCCGGGCCCCTTACCGGGGGCACCCGGGCCCACACTGGCTCCGCCCGG3720GCCGCCAGGCCCGGGCACCCCACCCGGCCAACCACCCTGCGGTGCACCCCCGGCGGAGCC3780GCCGGGGCCGCCCGGCCAACCGCCCTGCGGGGCACCCTCGGCGGAGCCGCCCGGGCCGCC3840CGGGCCGGGCGGGCCGCCCCGGAGGGCTCCCGCTCGGATCGCCGCGCGGCTGAAGCGGGG3900GTCGGTCAGGACCGTGCGGACGTCGTCGTGGCGGGTGACCAGCCAGGCCGTGGCGCCGTT3960CGCGAGGCGGATCTGTGAGACGGGGGCCTCGTCGCGGCGGCGGACCAGTTCATCGGGTGG4020GGCGAAGGGGCACTTCTGCTCGAAGGGGTACGTCGGGCTCTCGTCCATGGGGGCCTCCAC4080GCTCAGATCCGCACCGGCAGCTCGGCCGGATAGAAGGTGAACAGGTTGCTGGCGAGCGGC4140ACGCCGTCCAGGTCGGGCCCGTCGAACCGCAGGTCCGGGAAGCGGTTCAGCATGCGCGCG4200ATGCCCTCCTGCATCTCGACGCGGGCCAGCGCGGCGCCCAGGCAGTAGTGGGGGCCGTAG4260CCGAACGCGGTCTGCCGGTGGGCGCAGCCGCGGCCGACGTCGAAGCGGTCGGCGTCCTCG4320CCGAAGACCTTCTCGTCCCGGTTGGCCGACGCGAGGGAGACGAAGACGGTCGAGCCGGCC4380GGGACGGTCCCGCCGGACAGCTCGACGTCCTCGGTGGTGAACTTGGCGATGGCGTACCCG4440GTGCCCATCTGGGCGTACCGCAGGATCTCCTCGACGGCCTGGCCGATCAGCGCGGGCTCC4500TCGCGCAGCCGGCGCATCTGGGAGGGGTCGCGGAACAGGGCGTAGAAGGCGTTGCCGAGC4560TGGACGGCGGTGCTCTCGTAGCCGGCCATCAGCAGCAGGATGACCGTGGAGACCAGTTCC4620TCGTTGCTGAGCCGGCCGTCCTCCTCGTCGGTGAGGCCGATCAGCGTGCTGAGCAGGTCG4680TCGCCCAGGTTCTGCCGCTTGCGGACGATCAGCCCGATGGCGTACCGGCCGATCGCCTGG4740AGGGCCTGGCCGAACTCGACGAACGACGAGGTGAAGTCGCGGCGGGTGATCTGCGCGGCG4800AGCGCGGAGAACTCGGGGCGGGCGGTCTGCTCCAGTCCGAGCAGGTCGCAGATGACCCGG4860ATCGGCAGCTGGTAGGCGTAGTCGGCCATGAGGTCGAAGCGACCGCCGGCGCTTTCGAGG4920TCGTCGAGGAGGGCGTCGGTGTGGGCGGCGACGGCGGGCCGCATCGACTCGGCGTGGCGG4则GCGGTGAACGCCTGGTTGACCAGGCGGCGCCAGCGGGTGTGGCCGGGCGGTTCGGAGATG5040GAGCCGCCGAAGTTGAAGACGGGGCTGTCGGCGTCGGCCTGGAAGCCGGTGTCCACCCGG5100GCCGCGCCCTCCCGGTTGATGGTGCGGGAGAACCGCGGGTCGGTGAGGGCGGTGCGGACG5160TCCTCGTAGCGGGTGATCAGCCAGGCGGTGTCGCCGGTGGCGAGGCGGACCTGGGCGATG5220GGCCGGTTCTCGCGCAGCCAGGCGAACTCCTCCGGCATCTCGAACGGGGTGTGGCGGGTG5280AAGGGGTAGGTGCGCGCTTCGATGTCCACGGCAGGGGCTCCTGTCGGTCAGTGCTGGCCG5340GAGGGCAGATGGGCGGCGAGGCGTTCCCGGCGGTGGTCGCGGACCCGGTCGAGCAGGCCG5400GCGTCCGGGGCGAGGCCCGCGCAGTCGGCGACGACGTGGTGGCCGAGGTAGCCGAGGAAG5460GCCTCCTGCTCCGGGATGAGGCCCAGCCGGTTGTTGTGGGTGTGCAGATAGCTGAGGAGC5520ACGATCTGGCGGCGCCGCTCCGCCGGCGCGTCGGGGCCGCCGAGCGTGACCGCGGGCAGC5580ACGGTGTCCGCGGCCGTGTGCAGCGCCTGCCAGGCCTCGCCGACGGCCCGGCCGTAGGGG5640TCGTCGGG。GGCTGCGCGGCGGCGAGCAGCGGCCGCAGGTGGGCGGCGGCCGGGCCGCGG5700CGCTGGTCCAGCAGCTCGGGCCAGGTGTCGAGGAAGCTGTCGAAGACGTACGGCGACCAC5760ACCGCGCAGTAGTGGGCGAGGAACCCGGCCATGGCGGGCGGCGAGAGCCGGGCCGCGCAC5820AGGCCGCGCAGCGTCATGGTGAACGCGGCGCCCAGCCGGCGGGCCGGGCGGTCGCCGATG5880GCGCGCAGCGCGGACAGGGCGACGGCGCTGCTGCGGTCGAAGAACCGCTCGGCGACGGCG5940ACACCCTCCGGGCCGCCGTACTTGCCGTACTCGGGCTCGTAGCGGGCGGGGTGCACGGTG6000TCCGGCGGGAGCAGTTCGCCGGTCGCCTCCGACTCCAGTGCGGCCATGGTCAGCTGGGCC6060TCGCGGAACTCCTCGGGGTCGAGGTCTCCGTAGCCGCCGGGATGGGCGGCGAGGTGGCCG6120GCGAGGCGGTCGGCGACCTCGCGCACGGTGCGGGCGGCCTGCTCGGGGTCGTGGGCGGCG6180GGGCGCAGGCGGAGCCGGATGTGGTGGCCGCCCTGCCAGTACCGCAGGAAGAAGGAGCTC6240TCCAGCGCGCCGGAGGCGTGCAGCGGGGCGAGCACGGGGGCCAGCCCGTCCACGAGGAAC6300GCGTCCTGCCCGGCGTACCGGTGCAGGTGCAGGCTGTGCCAGGGGCCGGTCTCAGGGGCG6360GGCATGGGCGTCCTCCGTGGCCTGGGTTCCGGCGGGGGCGGGGGTGCCGAGGGTGTACTC6420GACGAAGAACTCCTCCGCGCCGGAGGTCCGGCCGTCCAGGTCGCCGGCGTGCGGCAGGCA6480CTCCTGGAAGGTGACGGTGGCGTCCGGGCCGGCCTCGGCGAGCCGGCGGGCGAAGACCTG6540GAGGAGGAAGGGGTTGCGGGCGTCGAGGTAGTGCGGTTTGTGCAGCCGGGCGGTGCGCGC6600CTCCAGCGCCCACTGCCGGGTCTCCGCCAGCAGGTCGCGCTCGCCGGCGGGCACGGGCGG6660GGGCGTGGTCAGCCGGAAGAAGGTGTGCCGGGGGMGCCGCGCTGCCCGAGCCAGCGGTC6720GAACGAGGCGAGGGCCGCCGCCTCCTGCCGTTCCAGGCCGTCGGTGTCCGGGACGTCCGC6780CGCGGGCAGCCGCCAGGAGGCCCGGTCGAGGACGAGGTCGCCGAGCAGTACCCGGGGCAG6840CGACCGGTGGGTGGCGGGGACGCCGGTGCGGCCGGCGGCCCGGCCCGCTTCCGCGTCGGC6900CCGGTCGAGCTGGTCCCACAGTCCGCCGCGGTAGGTGCGGGTGGGGGCGAAGGCGCACAG6960CAGCCGGTACAGGCCGGGTGCGGCGGCCGGGTAGAGGAAGTTGAGCGGTACGAGGTCCAG7020GGGCTGCCCGTCGCGGGTGCTGACCAGGGCCAGGGTGCGGCGGGCCGGGTCGGCGCGGAC7080GGCCAGGTCGGCGAGGGTCAGGGTGTGCTCGTCGGCGGCGCGCGGCACCGAGCCGGGGTA7140GACCAGCTCGTACGGGCTGAGCCGGGGGTGCAGGTTGAAGTTGAGGCCGAGGACGGCCGT7200GATGTCGCACTGGCGGGGCGTCGTGCGGGCGATGTGGCCGCGCAGCGCCTCGGTGAGGCT7260CCACTCGTGCGGCCCGTCCGGCTCCAGCAGGTCGCAGAACCGGGAGAAGAACACGCCGTG7320CCCGGTGGTGACGCCGTTGACGACGGCGTACGGCCGCTCGGGTTCCGCGGTGAACTGCAT7380CCGGTAGGCGGTGGACCGCCAGGGGGTCACCTCGGCGGGCAGCCGGTCGGCGAAGGCGCG7440CAGCCGCTCGGCGTCCAGGCGCAGCGCGCCGGTGTGTGCGCTGTCATGGGCGCGCAGTTC7500GGTGCGGAGGAGGTCGGCGAAGTCGGCGCGCAGCCGGCGGATGCGGTCGCTGTGCGGGTC7560GCCGACGCCGGAGGCCACGGCACTGGCCTCGGCGGGCGGCAGCGCGGCGAACCGGCGGTA7620GAACTCGATGAACGGGACGTCGCCGTCGCCGTCCGCCGCGCCGAAGTGCCGGGCGAAGAA7680GGCATACAGGCCCGCCTTCTCCACGCTCGCGTCGTCCAGCACCGGGACGATCCGCTGGAA7740CAGCTCCAGGGCCCAGCGGTTGGCGTGCAGCAGGTCCGGGTGCCAGCTGTGGGCGGGTTC7800GCGGGTGCCGACGTCCTCGTAGACGACGGAGCGCATGGCCTCGGGGGCGGGGGCGCGGCA7860GCCGACGGCCTCGACGAACACGGCGACCTGTTCGCGGATCTCGGCCAGCAGCGCGGCCCG7920CCGCCGCACGGGGGCGGCCGGGAAGGCGTCCTCGGCGGCCTGGAGCCGTTCGAAGACGAC7980GGCGCAGCGGCCGGCCTGGTCGGTGTCGAGGGTGCGCAGCCGCTGGGCGACGGCGAGCGC8040GGGGCGCGGGTGCTGGTCGGGGATGCCGAGCCCGCGTTCGCAGATCCCGGCGCGGACCAG8100CTTGTCCAGGGCGGTCGCCGCGGCCTGCGGGGAGAGTCCGGCGGCGGCCAGCCTCTCGCG8160CAGCTCGCGCTCGGGCAGCCCGCCGTCGGCGAGCAGGGACCGCAGCAGGCGCAGCAGGCC8220GGTGTCGCGGGCGGTCACCACCTGGGCGGTGCCGTAGGCCGCCTCGGGGGCGCCGTCCGG8280GGCCCGCCGTACGCACAGGGCCTGTTCCTCCCGGACGAGCAGGGAGTGGTTGAGCCGGAT8340CCGCATCAGCTCGTCGGCGCGGTCCAGGCGGTGCAGTTCGTACGTCATCCAGGACAGCAG8400TCCCGCGCTGAGCCGGGCCTGGACGGGGCGGGCCGGAGGGCGGTCGGCCGGTGCCGTGCC8460GTCGCCGGCGGGCGTCCAGGGGGCGGCGCCGATCTCGGTGAAGGAGGCGAACGGCGACGG8520CTTGAGGGCGACCCGGTAGGCGAAGCTGGTCAGCGTGTTCTCGGCGCGGCGCCGCTTGCT8580GGGCTTGCGGCGCGCGGAGAACGGGTCGGCGGCCCACTCGGTGACGGTCCGCCAGGTCCG8640CTCGTCGGATAGCTGGAGGCCGCGCTGGAAGAACTCCCCCGTCGCGATGGCCGCCAACGC8700CCTTCGACCCGCGTCGAGTTCGGCGGCGAGGGCCGCTTCGGCCTCCTTGTGCAGCCGGTT8760GCCCTCGGCGCGGTGCCGCAGCCAGTCCTCCAGCAGTTCCCGGCTCGCCGGGTCGAGCAG8820GCGGGCGGCGTCGGGGACGCCGGGGACGCGGTCGTTGTGGATGTCGCGCCGCAGCCGCAG糊OCAGTTCGTGGCGCCGGTCGGCGGGCAGCTCCGGCACGGCCGCGTGCAGCGCGTCCTCCAG8940GCGCCCGCGCAGCTCCTCCCGCCGCTGCCGGGTCTCCTCGGCCTCCGCGAGCAGCGCCCA9000GGTGCGCGCCGGGGTCAGCGCGGCCAGCTCGGACGGGCCGAGCGTGCCGCGGCGGTAGAG9060GTAGTAGGGGCTGAACCCGTCGGGCGCGCCGGCAGCGTCGGGCGCGCCGGGCACCCGGGT9120CGTGTCGTTCACCGTGGCATCACCGCAATCTCCCAGTTCGGGTCGGGGCGTACGGCGCCG9180ACGCAGATCTGCGCCTGGGTCCCGCCGTCCGTGTCCGCGCCGCCGTCGAGGCCGTACGCC9240GTGTCGATCCGGGTCACGTCGAACCCGAGGACGGCGTGGCCGCTGAGGCCCTCGGCGGCC9300GCGGCCAGCGTCACCGCCTCGATCGCCGCGCCCACGGCGAGCTGCTGCGCGCGGTAGGCG9360CGCGGGCCGCCCGCCGGCCGCCAGTCGGCCGGGGTCACCGGGTGGACGGTGAAGGCGGCC9420AGCTCGGCGTTGAAAGAGGCGGCGAACAGCGCCTCCTGCACCCGGCGCGCGCTGCCGGGC9480CCGGTCCCCTCCCCCACGGGCAGCAGCGCGCCCAGCTCGTGCGCGTACCGGTACCAGCCC9540GGCGGCACGCCGCGCACCCGGTGGACGGCGCAGTACAGGCGGGTCCGCGCGGCCCACCCG9600GCCGGCCCGTCCGCCCCGGCTCCGGCCAGCGCCCGCAGCGCCTCGGCCGCCTGCCCCAGC9660ACCCCCGCGAGGGCCTCCCCGTCGGCCTCGGCCCCGGTGAACAAGCGCCCCCGCGAGAAC9720CGCCGCGCGGCGGTCTCGGCGGCGAGGAGATCGAGGGCGCGGGGGGCGGGCAGCGGCACC9780GGGCCGACCGGCACGGCGTCCCCGGGCACGGGGCGGGGCGCGGCGGCCGACACGGCGTCC9840TCGTGCACGGGGCCGGGCGCGGCGGCCGGTCCGGCGTCCCCGGGCACGGGGCCGGGCGCG9900GTGGCCGGTACGGCGTCCTCGGGCGGCCGGGCGGGCGCGGCGGTGCTCGTGTCCTCGCGG9960GCCGCGCGCTGGAAGGCGGTGAAGCGGTCGGAGCGCCGTACCGTCCGGGAGCGCTCCAGC10020AGGGCGGGGCGGGGCGGGGCGTCGGGTCCGCCGGTGTCCGCCCTGTACGGGAGGTACGGT10080CCGAGCGTCACCGCCGCCCACGCGTTCTCCTCCTCCCCGTCGAGGCCGAGGCAGGCGTGC10140ACGGCCTCGTCGTCGAAGACCGTCCGCACCTCCGCGTGCTCCCACTCGGCCCGCGCGAGG10200CGGGCGGCGCGGCCGAGGGCGACCCCGGCGTCGACCAGGCCGAGGCGGGTCGCGAAGTCG10260CCGTACTTGTAGAAGTTCTTCCAGAAGCGGCTGGTCAGGACGAGCACCGCCGCGGGCGCC10320GCCTCCGTCGGCAGGTGCAGCGCGGCGCGCAGCCGGGCCGCCGCGTCGCCGCCGGCCAGC10380ACGGTCAGCTCGTGCCGGTAGGGGTCGTAGTGGCAGACCTGCCCGGTCGCGGTGAGGGCG10440GCGTACACCTCGGTCGGGTACATCGCCCCGCCCGACGGGACGGGCCGGCGCAACTGCACC10500TCGGGCCCGTGGTGCGGACGCGGGTCGGCCGGGGTGGCGGCGATGCCGCCGGACGGGTCG10560GTGCGGATCCGGCTGACGGCGAAGCCGCCGTGCAGGAGCCGGTGCAGGGCCGCGAGCGGC10620GGCGGTCCGTCGGGCCGCAGCGGCAGCCGCCGCGCTCCGCTGTAGACCTTCACCGGCCAG10680GGCCCGTCGGCCCAGTCCACCCGCCAGCCGTCCGGGTTGGCGGAGCGCGGGTCGAGCCGC10740AGCCCGGTGGTGTAGGTGTACGCCTCGTCGGTCGTCATGGTCATGGTCGTGCGGGTTCTC10,CTTGCCGGCTGGCCATCGGACGGCATGTCCTACGGGAAGGGGTGCGGGACGGCGCCGATC10860TCCCGGCCGGGGGCCAGCAGGCTGCGGTAGGGCAGGGTGGTGCCCTCCGTGAGCCGGGGC10920AGGCCGCAGGTACGGCGGTTGCGGTGGCCGAAGGTCATCGGGATCAGGCCCGGCACCAGC10980ACCCGGACGCAGTGCAGGCCGTTGCGGCGCAGCTCGGGCATGGTCTGGTCGACGACCAGG11040ACGTCGAGGCCGCAGTCGAGGACGCCGGAGACGGCCGCGTACAGGTCGGCCCGCAGGTCG11100GCGTCCTGCGTGCGGAGCGTCGAGCGGACCCGGCCGAGCGGGACGGGGGCGCCGGTGCGG11160GGCCGGTCGAGGAGGAAGGAGAAGCGGTCGCGGGCCTCGGGCAGCGCGCCGACCGTGGAG11220TGGTCCTCCATGCGGCGGATGAGGAACGGGTCGGCCAGCATGCGCAGCGCGTCGGGGCGG11280CGGCGCTCGTAGGCGTCCCGGGTGGCGAGGACCGTGCCCACCAGCTCGTGCAGGGCGCCG11340GTGACGGCCTGGACGGGGTCGGGGTGCGCGCCGCAGCCCGCGAAGAGCCGGGGCCCGTCG11400CCGCTGTCGTTCTCGGCGGTGAGCAGCAGCGCCGGGACGCCGTACTCCATCGTGGCGTCG11460AAGCAGCGGAAGTCGAAGCCGGTGAAGAGGCGGGACTTGGCCAGCAGGTGGTCCAGGGCG11520GGCGAGGTGCCGTCGAGGGCGACCTCTGGGACGTCGAGTTCGCGGTACCAGGTGAGCAGG11580AAGGCGTCCCGCTCGGCGAGTTCGCGCAGGCCGTGCAGGACGGCCTCCTCGACGCTGTTG11640CCGAGGGCGCAGCCGTTCGAGGTGTCGTAGAAGAAGGAGATCTCGTCGTCGTGGCGCGGT11700CCCCAGAACGCGGCGCGCTCCGGGACGAGGACGCGTCCGTCGCGGCGGAAGGAGTACGCG1176024CCCACCCAGTCGATCTCGGTGCCGGGGTCGAAGGGCCGGTACCGGAAGCCTTCGGAGGCG11820TAGCTCTCCTCCGGGTGGGTGCCCAGGTCCGGCGGGTACAGGGCCTGGTCGGCCACGTCC11880GCGTAGCGGGCCCGCACGGGGGGCAGGGTGCCGCCGCGGTGCAGGCCGGCGTAGCGCTCC11940AGGCCCTCCAGGACGGCGACGGTGCGGCTGGTGGCGTAGTCGGCGGCGCGGCCGATGGCG12000GGCTCGCGGCGGCCCCAGCGCGGCGGCAGCTCCACCGAGCAGGCCCCGAAGGGGCTCTGC12060AGGTCCTGCCGCAGCTCCTTGAACAGGCCGAGGCCGGCGTAGAGGTAGTCGCCGCGGACG12120GCGTCCGCGGGCAGCCGTCCGGTGCGCAGGGTGGCCGGGGTGAGCTTGGTGAGCGGGACG12180GCGGCGGGGGTCAGCGCGGGCACGGTGTCCTCGCGGAGGCTGCCGCAGTTCGGGCAGCCG12240GAGTCCGGCAGCAGGGTCTGCTGCTCGACCGTGCCGGCGGCGCCGTCGAGGACGAGGACG12300CGGCCGTCGGCCGGGCCGGCCGGGCCCTTGCAGGACGCGAGCCGGGCGCGGACGTACTCC12360TCGACCAGCCGCAGCACGCCGGGTCCCCAGATGCGGACGTCCGCGCCGTGCGGCCAGGAC12420TCGGCGAGGCTGTCGCCCTCCAGGCCGGGCCCGAAGGGCGAGTTGGCGGTCCGGGTCACC12480AGGCAGCGCGGGCAGCCCTGGGTGCCGGGGCGCCAGACGGGGCCGATGTAGACGAGCGAG12540CGCCAGCTGCCGACGAAGAGCAGGGAGCGTCCGGTGGCCAGGCAGTCGACGACGGTGTCC12600TGGAACTCGCCGAGCCCGTCGAGCCCGGCGACGAGCACGGTCGCCCCGGAGGACCGGCCG12660AAGCGTGCACCGCCGTCCGGGTCGGGGGTGTCGTCGCGGCCGAGGCGCCGGACCAGATGC12720TCGGCGAGCACGCCCCGCCCGACGACGACCGGCGGCCCGGCCGGCCCGGTGCGGGGCTGC12780GGGGTGGTCGCCGTACTCATGACGCCTCCTCGGACACGGGCAGGGCCACGACGCGGACGC12840GGGCACCGGCCTCTCCCCCGCTGCCGGTGCCGGTGCCGGTGCCGGTGCCGGTGTCGGTGT12900CGGTGAGGAAGGGCAGCAGGTCGGTGATCTCGCGTTCGCCTTCGGCGGTGGGCGCGGCGG12960TCCAGGTCGCGGTGGCCGGGGCCAGGAAGGCGGTGGCCTCCTGGGCGTTCCCGGGCAGCG13020GCAGGACGCGCGCCACCGCGTTGAGGAGGGCGTGTCCCACCGCCCGTTCCCGGTCGGTGC13080CCACGCCCGCGGTGACCGCGCCGTCGCGGGTGCGCACATGGGCGCGGACGACGCCGTCGG13140GCAGCTCCTCGGCGGCGGTGGCGGTCCAGGGCGTGCCCTCGGCGGCCAGCACCCCGGCGA13200GGTAGCCTGCCGCGGTGTCGCCGGGCGGCGGCTCCTCCGGCGCCGGAGCCCAGTGGAGGT13260CCGGCGTGGGCCGGCCGAGCGCCGCGTGCAGCCGGGCGCGCAGCCGGGCCTCGCCCAGGG13320ACCAGCCGGCGCCGACCGCGCCGTAGCGCGCGTCCCCTGCGGTGAGGCGGCCGGCCAGCG13380ACTCCACCGCGCACAGCACGACCTGGTTGCGGGCCTCGCGCGGGGACAGCGCCCGGCACA13440CCACGCCGAGGGCGGCGGGCGCGTCGGCGCCGCCGTCCGGGTCGGCGACCTGGCAGGCAC13500TGGCCGACAGCGGCAGCTGGGCCAGGTCCTCCTCGCCGAGCGCGAGCAGCGGGCCGGTGA13560CCGCGTCCGTCAGGGCGGCGCAGGCCGCCACGATCCGGTCGGAGATCCGCACCCGCTCGG13620GCGGGTCCTCGGAGCGCGGGATGTCGGGCCGCACGGCGTCCTCGGGTGCGGCGGCCCCGG13680CGGGCGGCAGCCGCCGCGGTACGGCGGGCTCGTGGTGCGGGCAGCGCGGGTGCCGCCGGG13740CGGCGTGGCCGCGCACCGCGGGGACGAGGGGTTCGACGGTGGTCACCGGCTTGTCCCCGG13800GCGGCCGGACCCCGGCCAGCCGGGCGAAGGTGTGCTGCGCGACCCGCAGCGCGCCGACCG13,CGGCCGGGGCGACCGCCGGGGCGAGGCCCGCGGTGTCGCCGGTGGCCCGGACGGCGATCG13920AGCGGTGCACGCACTCCCAGCAGTACGGGGTGCCCAGCCCGGGTTCGAGCGCGGTGACGA13980AGTCGCCGCACCGGGCGAGGACCCCGACGGTCACACCGTCGCGCCACAGCGCGTGCTGGG14040AGCGGGCCAGCGCGGCGGCGTCGGCGCTGTCGTAGGCGAGCAGGACGGCGTCGGCGCCCT14100CGACGTCGGGGTGTCCGGCCAGCGCGGCCGGTCCGTCCGCCGCGAGCGGGTCGCGCAGCC14160GCCAGCGCGCCCCGGGATCCGCCGCGGCGGTCTCCTTCAGCACCTGCTGTACGGCGGTCA14220GGTCGTCGTCGCCGTCCGGGACCACGTCGAGCCGGGCGATGCCGAACTCGCGCAGCGCGT14280CCAGCAGGGCGTGCAGCGCGGTGCCGCGGCCCGCGCACACCACGCGTGCCGTGCGGACCT14340GCTGGAGGCGGGTGACCGGGCGGTCGGCGTGGTGTTCGAGGAACGCCAGATGGGTGGCGT14400ACCGCTCGCGCATCCAGCCGGGCACCGGCTCGACGGGGTGGGCGACCTCCTTGATGAAGC14460CGTTGCGCAGCATGGCCCGCACCAGCCCCAGCACGGACCGGCGGGCCCGGTCGGGCAGGT14520CGCCGTAGAGGTCCTGGAGGGTGCGTTCGCCGTCCAGCCCGGCGAAGAGGGAGCTGACCA14580GCTGGTAGGCGCCCTGGCCGCGGACGGAGAAGGAGCCGGTGTTGTTGCCGAGCCAGACGC14640CGTCCTGCTGGCGGACGTAGAAGGCGTCGGCGCGGAGCCGGTAGGTGCGGGTGAGGGTGT14700CGGTCAGCGGGTCGGCGGCCGGGCCGGCCGGCTGTGCCCTGTCTGCTGCCACGTCTGTCA14760TGTCAGAGCTTCCCGTGCGCGCTGTAGACGGTTGCGGCCTCCTGCTCGGAGGCGCAGCTG14820ATCCGGCTGGGCCGGTGCTGTTCGGGGAGGGCGGCGCAGTGCGCGCGGACGGTGTCCGCG14880TCGACGCTGCCGACCACCGTGGCGGCCAGGAACTCCAGGCCGGTCGGGGCGGTCTCGACG14940GTGACCCGTACGTCGCTGACCCCGTCGAGCGCGAGGACGTGGCGCTCGATCTCCCGGGGC15000CGTACGAGCACTCCGGCGAGCTTCTCGGCGCCGTCGAGGCGGCCTTCGAGGCAGAGGTTG15060CCGTCGGCGTCGAAGCGGCCGTAGTCGGTGCCGGTCACGTGGTCGGCGGGGGCGGAGGGC15120GGGCTGCCGGGCCGCCAGGTGCGCCGGCAGCAGCCGGGGCCGGCGACGGCGACCGTGCCG15180ATGCCGCGTTCGTCGGTGCCGGTCAGCCACACGGACTTGCCGGGGATCGGCCGGCCGACG15240TGCCGGTTGTGGCCGGGGTCGTGGTCGAGGGCGATGGCGCCGGTCTCGGCGGTGCCGTAC15300AGGTTGCTGACGGCGGCGCCGGTGAAGTGGCGGCGGATCAGCTCGACCCGCGGGGCGCTG15360AGGTGGCCGCCGCCGAGGAACAGGGCGACGGAGCCGAGGTCGGTGGCGGCGGGCGCGGAC15420AGGCAGGCCGCCGCGGCCAGGGCCGGGACGCCGAGGGCCAGCACGCGCCGGTCGCGGGCG15480AGGTCGTACAGCGGGCTCCAGTCGTGCGGCGGGTGCACGACCAGGTCCCGTTTCAGGTAG15540AGGGCGGGCAGGACGCACATGAAGAACGCGGCGGAGAACCCCAGCGGCAGACAGGTGGCC15600AGCGCCTCGGGCGGGCCCGCGGGGAACGCGTCCGCGTACATCGCCGCCTCGGCGTGCAGG15660GCGATCTGCTCCCACTCGTCGGCGGGGCCGACGGCCACCTTGGGCGCGCCGGAGCTGCCG15720GAGGTGCACACGCCCCACAGCGGGCGCTCCTGTGCCGCGAGCGGTACGGACCCGTCGTCC15780GGGAGGGCGTGCAGCGCCGGGGCGATCTCCCGCCCGGTGACGCCGAGGGTGCGCGGCGAC15840GCCCAGAGCAGGACCGTGTCCGGCACGGTGGCCACGGCGAACAGCGCGGCCAGCGCGGGG15900AGTCCGGCGGTGGGGTCGATCGCGTACGCGCCGCCGGGACGCACCTGCGCGGCCAGGTCG15960CGGCCGGCGGTGAGCAGGTCGTCCCAGGCGGCGAAGTCGCCGCCCCAGCGGACGCCGGTC16020ACGGCACCGGCCCGGCCCGCCGGGAGGTGACGGGGGGTCAGGAAGCGCTGGAACGCTGGT16080CGGCCCATGTCACCCACCCCTCGATCGTGCGCGGCGCGTCGGGCAGTTCGGGCAGGGTCC16140GCCCGGGTGCCTGCCGGGCGAAGTACGACAGGACGACGACCGTCTCCAGCGAGTCGAGCC16200GCCGCCGCGGGTCGTCCTCCTGGAGCAGCCCGGCCAGCTCCTCCTGCAGGTCCGGTACGC16260CGTCCGGCGTCCGGGGTGTGGTGCGCTGAGATGTCACGTGTCGCCCTTCTGCGTCGTTCG16320GGGACCGGCGGGTGCGTCGTGCGCGGTGCGCCAGAAGTCCTCGACCGCCTCGTTGAACTC16380CCGCGGCCGGTCGTGGCCGACCAGATGGCCGGCGCCGGGGACGACCCGGCCGCGGACCCG16440GCCGCCCCAGCCGGGCGCCTGCTCGGCCGCCGCGCGTTCGACGGACTTCAGGGAGCCGTT16500GAGGACGAGCGTCGGGACGGTGAGCGCGGCCACGTCCGCCGCGCGGACCAGCGCGGTCCG16560CTCGAAGTCCCGCTCGACATGCCCGGTGACCGCGTCGAGCGTCCGCTTCCACCGGGTGCC16620GTGCAGCTGCTCGTACTCGGCGGCCAGGGCCGGCTGCTGCGCGGCGAGGCCCTCGAAACC16680GGCGATCAGCGAGAGGAACGCGTCGCGGGAGACGTCCGGCGCGAACCCGGTCAGCACCAG16740CGAGGAGACCAGGTCGGGCCGGGTGGCCGCGCAGCGGTGGGCGAGCGGCCCTCCCAGGTA16,GGAGGCGCCGATCAGCCGGCCGGGCCCGAAGCGTTCCAGCACGGCGACGAGGTAGCGCAG16860CGCGTCGTCGAAGTAGTCCTCGGCGGCGTCACGGCGGCAGCGGCCGTGACCGGGCAGATC16920CACGGGTACGGTCCGCAGCCGGCCGTGCCAGGCCCGGATCTGCGCGGCGAAGTGCCCGTG16980GCCGGTGCCCAGCAGCCCGTGCACCAGGTAGACGGTGGGCGTCTCCGGGCCCGTCGACAT1704026CCCGGTGTGCATCGGCGTCTCCGTGTCCCTCGGCGTCTCGGTGTCCATCGGCGTCTCCGC17100GTCCACCGGTGCCTCAGACCGCCCGGGACGCCTCGCCCGCGGGGTTCACGAAGTGGTCGA17160CGGGTGTGCCGGACGCCTCGATACGGCCGAGGATGTGCCGCGGCCGGCGCAGGTCGGCGA17220CGAGGAACTGGGAGGACTTCTCGTCGTTGCGGGCCTCGCAGCCGGCCCGGTAGGGGGCGA17280CGTCGGGGCTGCCGGGCGAGATCACGCCGGCCAGGCCCAGCGCGACGTCCTGGAACTCCT17340GCGGCTCCCGCGTGGTGAGGACGAGCCGCTGCTCGGGACAGGTGAAGGCGACCACCGACA17400TCAGCCGCAGGTAGTCGTCGTCGCCGACCCGCGTGGTGTCCCGGGACTTCATGGCCGGCC17460GCATCCGCGGCACCGACAGGTCGGCGGTCGCGCCCCGGGAGCGCAGGTGGTCGCCGTGCG17520CGACCAGGCTCACCAGCTCGGCGGAGAGGTCGTCGTGCAGCCCGACCAGCACCCCGGGGT17580TCACATACCGGTAGCCGGCGTCCAGCCAGCGGTCGAAGGAGACCACCCGGCGGTCGAAGT17640CGGCCTTGGGCACCCCGACGGAGGTCTTGCCCATGAAGCGGCGGTACGTCTCGCGGTCGT17700AGCTCTCCTGGAACACGCACATGGTGACCGGGTCCTCCCGGCCGATCCACTCGCCGAGGA17760CGTCGATCTCGTCCTGCTCCATGCTGCCGATGTTGAAGTAGACCCGCTCGAAGCCCAGGT17820CCAGGGCGGTGCGGATGGCCCAGCCGATCCGGAAGGCGGAGGCGAGCCGGGTGTGCTTGT17880CCTCGTACTCGCCGGTGAGGAAGCCGACCCCGCGGACGCCCTCGTGGTGGTAGAGGATCT17940CCAGCTGCTCGGTGATCTCCTTGCGGCCGGAGAACTTGCGGTCGAGGCGGTGGTTGCCCT18000TCCGCATGGAGCACATCTTGCACTCGGAGTCGCAGTAGTTGGTGGTGTAGAGCGGCACGA18060AGGTGTGCAGCCGGGGGCGGCGGGCCCCGCACCGGGCCTCCGCGGCCGCCTGCAGCTCGG18120CGGTGCCGATCGAGCGGTCCTCCCACAGGGCGAGCGCGACCGCCGCCCGCGACTCGGCCG18180GCTCCTCGCCCTCGGCGAGGGCGAGGACGGCACGGGTGTCCACCGTGGCCGCCTCGGCGC18240GTACGTCCTCCAGCTCCGGCAGGACGAAGTCACCGGTCATTGCGTGCGAGGTCATTGCCT18300GGGAGTTCTGCGTCATGTGAATTCCTCTGCGAACGGCCGGAAGGGACCCGGCCCATGTAA18360CGCCACCCGGGAATTCCGAACAAGACACCGAGGAAACGGAGCACTCTTTCTCCGTTACCC18420TCCCCACCTGCGCATTCACCCAGCCCTGAACCACCTCCACGGCGGTTGTGCAGCAGACCC18480GAAGCGCATGGTTAGCAGCGCTTTAGCGGCCttTTTGTGCCGTCACAGCAGTACAGCAGC18540GGGGAATCAGCAGAAATGCAAAAGGGCCGGAATCCTTGACTCACGGAAGACCCGCTGCAT18600AGCCTCCGAGGCACGCGCTGCAGGAAATGCGCGAAGTAAATTACCGTCGACATGGAAGGG18660GTTTCCGGTGGACGCTGCACACCTGTCCGACCTGGACATCGACGCTCTCGAGATCTCCGA18720GTTCCTGGACGAGAGCCGACTGGAGGACAGCGAGGTCGTGGCCAAGGTCATGTCGGCCTC18780GTGCACCACCTGCGAGTGCTGCTGTTCCTGCTCCTCCTGATGGAGACGGCGCCCTGTACC18840GGAGCGATCCGGTACAGGGCGCCGCTTTTCTCGACCCGAAAGGAATCCGCATGCGGCAGA18900ACCTGCTGATGATCTATGTGCACATCCCTTTCTGCCATTCGAAGTGCACGTTCTGCGACT18960GGGTCCAGGCCATCCCGACGAAGGATCTCCTGCGCAAGCCCGGTGACTCGGTGCGCCAGA19020AGTACATCTCCGCACTCTGCGCGGAAATCGCAGAGCGGGGCGCGATGCATCGCGCGGCAG19080GTGACATCCCCCATGTCCTCTACTGGGGCGGCGGCACGGCCAGCAGCCTCGACGAGCAGG19140AGACCGCGGCGGTCATGGAGGCGCTGCACTCCTCCTTCGACATGAGCACGGTGGCCGAGG19200CGACCATCGAGTGCAGCCCGGACACCGTCGACGAGCGGAAGCTGGCCTTCTACCGCGGTC19260TCGGATTCAACCGGGTCTCCAGCGGCGTGCAGTCCTTCGACGACGACCGGCTGCGCCGCC19320TGGGCCGCCGGCACACCGCGGAGCAGGCCGGGCGCATCGTGCACGCCGCGCGGGCTGCGG19380GTTTCGAGGACGTCTCCATCGACATCATGTCCGGCTTCCCCGACCAGGAGGCCGACGAGC19440TGGACCGGACCGTCGACCGTGCCCTTGAGCTGCCGGTCAACCACCTCTCGCTGTACTCGT19500TCCGGCCCACCCCGGGCACGTTCATGCGCCGCCGGATGGACTCCTCGGAGCGGCGGACGT19560ACCTGCGCCGCCAGCAGGCGCTGTTCACGCGGGCCCGCCGGGCGATCGAGGGCTTCGGCC19620TCAGCGAGTACGCCAACGGCTACTTCGGCAAGGTGTCGCCGTTCGCCTCCATGTACTTCCAGCACCGCGCCGACACCGTCGGCCTGGGCTCGGGCGCGATCTCCCTGGTGGACCAGCGGT19740TCAAGTCCCACCAGAAGGGCCTGCTGCACTCCTACGTCGACGATCCGCTCGCCTTCGACA19800TCGACGTGCCGGCGGGCCAGGACCGCGTCCTGGTGTCGCTGCTGCAGGCCGGGCTCGCCA19860TGTTCGACGGCATCCCCCGCGAGGACTGGCGGCAGCGCACCGGCACGGACCTCGCCGAGG19920TGCTGCTGCGGCCCACGGTCGCGCCCCTCGCGGACTTCCTGCGCGGCCGCGGCCTGGTCG19980AGGACGACCACGGCATCCGCCTGCCGCGTGACATCGCCGGTCTCACCCTGATCGAGCTGG20040CCTTCGAGATGGCCATGTCCCAGCCGGAGCTGGTGTGACCTCGGGACCGGGGCAGGCCCC20100GGCCGAGGCGGCACACGCAGCCGGGGCGGCCTGGCTGGAGATCGGGCTCGACGCCCCCGC20160CGACGCCGTACCCGCCCTGGTCGCCGGTGTCGTGCGGCCGCTGCTGCGGGAGCCCGCGGA20220GCCGGGGGCCGAGCCCGTGCCCGGGTTCTTCCTGCGGGGCGTCGGCGCGGCCCAGCCCGC20280CCTGGTCGTCCAGCTGGAGGTGACCCCCGGCACGGACCTCGCCGAGCCGTACGCCGCCCG20340GGCCCGCGCGCTCGCCGCCGGGCTGGGCCTCCCCGTGCAGGTCGCGGCCGGCCGGGCGAC20400GCTCGTCCCGCTCGCCGGCTCGGTCTTCGCGGGGGCGGCCCTCGGCCCGGTGACCCGCGC20460CGCGCTGGCCGCCGTATGCCCCGCGCTGCTCACCGCCACCGAGGCCGCGGAACAGGGCAG20520GCCCGCCCTGCTGGCCAGTGCCGCCGAACTCATGTCCGCGCATCTGCGCGCGGTCAGCGT20580CTCCGCGGCCCCCGGCCCCCGCCAGTGGGAGGAACTGCGCGAGGGCGTGCCGCTCGGCTT20640CCTCAGCTACCGCTCGCACGCGGAGGCGTTCCTGGCCTCCAGCCGCGACCCGAAGGCCGC20700GCAGGCGATGATGGACGCGAAGTACACCCGCGCCGCGGCCACCCTGGAGCGCCTGGTCGA20760CGGCGTCCTCACCCAGTGCGAGGAGCGCGGCCCGGTGGTCTCCCTGCCGGCGCGGCAGTG20820GTACGAGGCGATGCGCGCCGCCAAGCCCGCGGTGACCGAGCTGTTCCGCGCCGGAACCGA20880CCTCGCCCTGGACACCGAGGAGCAGCCCCCGGACACCGGCCCGGACGGCAAGGGCCTGTC20940CGAAAGCGCGTTCCACCGCATTGTCGAGGGCTCCGACGGGCTGCGTGACTTCCTCGACCG21000CGACCCGTCCTTTCTGGCCACCCGACTGCTGACCAGCCTGCTCTACCTTTCCCTGAGCAG21060CGTCGGCATCGCCCTGGCGGAACGGTMTTCCTCTGCTACGCGGTGAGCCGCGCCTGTGA21120GTCGATCTTCGACACCGACGCCCTCACCGTCCTGTCCGGTCTGGCCCGGACCTCCCTGGC21180GTCCTGACGCTCCGACACCCTCCCTGACGTCGGTTTTCGGCCGAATCCATGCCCGGAACC21240CGTGATCGACGGGCCGGGCGGGACCGGCCTCTTCCCATGCACCGGGCGCTCCCCGCAGAA21300TCACGTTCCGATATAAGGCCCGACCGGATACCGCCAAGCGGCGATCCGGCACCGGGACAC21360ATGAAGTAGCATCGCGCCCAGATAAGGACATTCACCGCCAGAAACGTTCAAAAAGATCAC21420CGAGAGATCACTGACCGAGCCTGCTCCACCACGAGCAATGGGGGAACATGAAAGCTCAAG21480AGCTGGAACGTGAGGCGTGATCCCGGCAGGGCGCCGCACGGCGCGGTCATCCCGCGCCCA21540CGCGGCGCCCTGCCGCGTATGCCGGTTTCCCCACGTCGCTTCCACACACCGGGAGATGCG21600ATGTCGTCAGCACGGTCGATCCACTTGTGCACCACCGCAACGGGGGAGTTCGATGGAGAT21660CGATGTCCTGGGACCGCTTGAGGTCTCGCAGAAGTCCGCTTCGATTGTCCCGACGGCTTC21720CAAGCCGCGCACCGTCCTGGCGATGCTCGCCGTCTACACCAACCGGCTGGTCCCCCTGCC21780CTCCCTCATGGGAGAACTCTGGGGACCCGAACCGCCGGCCACCGCGAAGACGGCCGTACA21840GGGGTACATCCTGCATCTGCGCAAACGTATCGCCGAGTCCGCCGCGCGCCGCCCACCGGG21900CCAGTTCCCCGAGGCCAAGGACATCCTGGTCACCCTCCCCGGCGGCTATCTGCTGCGCGC21960CCCGGGAACCGCGGTGGTCCTGGAGCAGTTCGAGCAGCTGGCCTGCGCCGGACACCGCGC22020CCGGGAGAAGGGCGACTTCGAGGCCGCCTCGCGGAGCTTCACCGAGGCCCTCGGCCTGTG22080GCGCGGCCGCGCCCTCGCCGACGTTGAGGTGGGCCCCCAGCTGGGCATAGAGGTGCAGCG22140GATCGAGGAGGCCCGGCTCAACGTCCTCGACCGCAGGATCGAGGCCGACCTCCGGCTCGG22200CCGCCATCACGAACTCCTCGGTGAGCTGCGGAGCGTCACCGCCCACCACCCCACCCATGA22260GGGCTTCTGCGCCCACCTCATGCTGGCGCTCTACCGCTCCGGCCGCCGCTGCGAGGCACT2232028CGACGCCTACCAGCGCATGCGCACCACGCTGGTGAACGAACTGGGACTGGAACCCTCCCC22380GTCCCTGCGCCGCCTCCAGCGCTCCCTGCTGGTCTCCGACCGCGAACTCGACGAACTCAA22440CGTCACCTGGGACGTCGCCACGTTCTGACCCCGCCCGGCGAACGCCGAAGGGCGGCCACC22500CCGCACGGGGTGACCGCCCTTCGTCTCATGCGATCGCTCGCTTACTGGTTGTACGGACCG22560TAGTCGTAGTCCTCCAGCGGAACGGCCTGGCCGGAGCCCGTGCCGAACGGCGAGTAGTCG22620ATGTCGTCGTAGCCGACGGCCGAGTACATCGCGGCCTTGGCCTCCTCGGTCGGCTCGACC22680CGGATGTTGCGGTAGCGGGACAGACCCGTACCGGCCGGGATGAGCTTACCGATGATGACG22740TTCTCCTTGAGGCCGATCAGGGAGTCGGACTTGGCGTTGATCGCCGCGTCCGTGAGGACC22800CTGGTCGTCTCCTGGAAGGACGCCGCCGACAGCCAGGACTCGGTCGCCAGCGAGGCCTTG22860GTGATACCCATGAGCTGCGGACGACCGGAGGCCGGGTGACCGCCCTCCTGGACCACACGA22920CGGTTCTCGTGCTCGAACTTCGAGCGCTCGACCAGCTCACCGGGCAGCAGCTCGGCGTCG22980CCGGACTCGATGATCGTCACACGGCGGAGCATCTGCCGGATGATGATCTCGATGTGCTTG23040TCGTGGATCGACACACCCTGCGAGTTGTACACCTTCTGGACCTCGCCGACCAGGTGGACC23100TGGACGGCACGCTGGCCCAGGATGCGCAGCACGTCGTGCGGGTTGGTGGCACCCACGGTG23160AGCTTCTGGCCCACCTCGACGTGCTCGCCCTCGCTGACCAGGAGACGGGCGCGCTTCGAG23220ATCGGGTACGCCGTCTCGTCGCTGCCGTCGTCCGGCGTGATGACGATCTTCTTGGTCTTC23280TCGGTCTCCTCGATCCGCACGCGGCCGGAGGCCTCGGAGATCGGGGCGACACCCTTCGGG23340GTACGGGCCTCGAAGAGCTCGACGACACGCGGCAGACCCTGGGTGATGTCGTCACCGGCC23400ACACCACCGGTGTGGAAGGTACGCATCGTCAGCTGGGTTCCGGGCTCACCGATGGACTGG23460GCGGCGATGATGCCGACCGCCTCACCGATGTCGACCAGCTTGCCGGTGGCGAGCGAACGG23520CCGTAGCACATCGCGCAGGTACCGACGGCGGACTCGCAGGTCAGGACCGAGCGGGTCTTG23580ACCTCCTCGACGCCGCGCTGGACGAGCTCCTCGATGAGGACGTCGCCCAGGTCGGTGCCG23640GCCGGGGCCAGCACCTGGCCGTCGACCACGATGTCCTCGGCGAGGCAGCGCGCGTACACG23700GACGTCTCGACGTCGTCCGCCTTGCGCAGCACGCCGTCCGCGCCCCGCTCCGCGATCTTG23760AGCTTGAGGCCGCGGTCGGTGCCGCAGTCCTCCTCGCGGATGATGACGTCCTGGGAGACG23820TCGACCAGACGACGGGTGAGGTAACCCGAGTCGGCGGTACGCAGAGCGGTGTCCGCCAGA23880CCCTTACGGGCACCGTGCGTGGAGATGAAGTACTCCAGCACGGACAGACCCTCACGGAAC23940GAGGCCTTGATGGGCCGCGGGATCGTCTCGTTCTTCGCGTTCGACACCAGACCACGCATA24000CCGGCGATCTGACGCATCTGCATCATGTTGCCTCGTGCACCCGAGTTCACCATCATGAAG24060ATCGGGTTGGTCTTCGGGAAGTTGTCGTTCATCGCCTCGGCGACCTCGTTGGTCGCCTTG24120GTCCAGATCGCGATGAGCTCCTGCGTGCGCTCGTCCTTGGTGATCAGACCGCGCTCQTAC24180TGCTTCTGGACCTTCTCGTCCTGCGCCTCGTAGCCCTTGACGATCTCCTTCTTCGCCTCG24240GGAACGACGACGTCGGAGATGGCCACGGTGACACCGGAACGGGTCGCCCAGTAGAAGCCG24300GACGCCTTCAGGTTGTCGAGCGTCGCCGCCACGATGACCTTCGGGTAGCGCTCGGCGAGG24360TCGTTGACGATCTCGGAGAGCTGCTTCTTGCCGACCTCGTAGTCGACGAACGGGTAGTCC24420TCGGGCAGCAGCTCGTTGAAGAGCGCACGGCCCAGCGTGGTCTTCAGGGTGAAGCTGTCA24480CCCTGCTGCCACTCCGGCTCGCCCTCCTCGCGCACCGGCGGGACCCAGCCGCGCGGCGGG24540ATGGTGCCCACCGGGAAGCGGATGTGCACCGGCGCCTGCAGCGACAGCTCGCCCGCGTCG24600AACGCCATGATCGCCTCGGCGACCGACGCGAACGCACGGTCCTCGCCCTTGACGCCCCGG24660CCCTCGGCGTCCGTGGTGAGGAAGAACAGACCGAGGACCATGTCCTGCGTCGGCATCGTC24720ACCGGACGGCCGTCGGCCGGCTTGAGGATGTTGTTCGAGGACAGCATCAGGATGCGGGCC24780TCGGCCTGCGCCTCCGCGGACAGCGGCAGGTGCACGGCCATCTGGTCACCGTCGAAGTCC24840GCGTTGAACGCGGTGCAGACGAGCGGGTGGATCTGGATGGCCTTGCCCTCGACCAGCTGC24900GGCTCGAAGGCCTGGATGCCCAGGCGGTGCAGGGTGGGCGCACGGTTCAGCAGCACCGGG2496029TGCTCGGCGACGCTTGGCGCGGCTTGAACAGGACCGACGACGGAAGCGGCGGACCGGTCAAGCATGCGCTAGACGGTTGTCGGCCACCGTAGGACCATGCTTGAGCGCACGCCTCCTCCTCCGTCGAAGTAGGTCCTGGACGCTGCGCACCGCACGTCGGGCGCGGGCCTTGCGCCTCCATACGCCGCGAAGCCGCGACGTGGCCCATCCATGATGCCCTGGACCGAAGAATGGTCTCCGAGACCGATCCGGGTTGTAAGTGCACCGAGTGGGACAGGTCTCTCGATGGACCTTGATGAGCGATGGCCTCCCTGGAGGGCGCTGGCCACCCGGTCGAGCGAGCCGACCGATGCCGGACGGCCGCGAGCTCCGACCTTGTCCGTCCCAGCCTTCGGGACGGACGGCATGTCCGAGCTTGTCTCACACCCGGTGCCGGTCTCTGACCTCTTCTCTTGATGTTGCTCCAGCGCCGATCACGGACCTGCTTGCCCCGGCCGGCCTCTCGTTGTTTGCGGTTGATCCAGCTGCACCCTTGGGGCTGGGTCTTCTTCCAGGTCGAAACGTGCCGAACCTTGAGGTTGGTCGCGCAGCCTTGGCACCCCAGGTCGGCGGGAGGGCAGAGTAGATGACGAACACCCTTGCTCACGGCGTGAAGCGGACTCTTCTCGCAGCTTCTTGACGGAGCTCGTCTCTTGGGGTCCCCCGTACCGGATACCGAGCCATGCCGTCCCACCTTGAAGGTAGACCTTCGTAGGCGGCGGAACTGGGCCGGCGTGCAGCGATCGGGTCCGAGCACCATGGTCCTCACGCGGCGCCGATCGCGGCTGGCGCACACCCAGCCTCGATCGGCACCGTCGGTGCGGCAGCTCGGCCGTGCGGCGAGGACGTCGCTGCGCGTGGCATCGCCTTCACGCGCCGAGCTTCAGCATGGCGACGACCGGACGATGATCGACACGGCGGCATCGGACGCGTTGGAGGTCCTGGCCCTTGGGACTCCAGGGCGGTCACGCCTTGAAGCGGCTGCTTCATCCTCGGCCTCCGTCCCGGCGGGTCGCGGGTACTTCTCCAGG-GAAGTACCAGCACCTTGGCGGCGCTTGTACGAAGAGTCCGCTCGCCGTGGGAAGAAGTTGTGAAACGGGGGACTCCCGTCTCCTCCGCAGGAGGACAGCAGACTCGGGAAACGCGGCCGGCCGTACGCCTTTACCACCCATTGTCGTCGAGGGAACGGCTCGCTCGCCGTGCACCGTCGAGCCTGGAGGCAGCCAGCCGAGGGTTGAGGAAGGATCTTGGATCTTGCGCTTCGCCCTCCTACCTTCAGCGTACACCACGGTTCAGGTCGAGGCAGACCGCTAGTCGACACTCGCTGAGGGTTGTCGAAGATCCGGAGCACTACAGGTCGTAGGTCCGGCGTGCAGGAACGCCGGTGCGGACGCTTCTGCAAGCTCGCGGTGTCCACACCTTCACGCTCGGAGCTCGGCCATTCTCGATCTCGGCGCTCCTTCCTTCGGGGATGTGCGTGACGGGTGACCTTTGCCGCAGTTCCTTTTCGGCTCCACTGACACGTCGAGCAGTCCTGGGGCAGACCTCTTCCGCGGAAGACCCTCCACGTTTGCCGGGCTCTGACGTCGTCCCAGCGCCCAGCGGCTGCTGCCAGGTGGTGCACCGCTACGCGCGGTTCGGAGACCGGGGTGCTGCGCCCAGGTGGATCTCTGATGTCGACAGATGACACCTCTGCGCGACCGCGGTCGAAAGGTGTCACGTGCGGCCACGCCAGGCGCTTACTGGTGCAGGCTTGCCGAGACTTCAGCGGGGGCGTCAACCCAGGTCGAGTCAGGTCGGAGGATGACCGGCCGAGACGACTGATCTCCCGGCGCCGCGGCAGAGCAGCTCCGTCGAGGCGCACCCTCGCGGGTCGGCCTCGCTGGCGCTCCGTCGACGTACGAGGTCGAGCGGGGGCGGCCGACGCCACAAGCACTCCCAGCTTGAGCGTGGATGTCGTCCTATGCGTCACGGCCGGGGAGACGCTGCTCGTCCTCGTCGGAGGCACAGGAGGGATGTTCGGACTTGATGCACCTCCATCGGTGATCATCCAGCTTCAGGGCCGTCGAACGATGGTGTGCGGCGACGTTGCTCGTCCGCCCAGGACCTGTC卿GTGCCGCTTGTTGCCGGTAGACGCGGGACGCGCACAGACCTCACGGCTCGACCATCCATCACGAACCTTCAGCTGCCAGGTTCTGAGCGGTTGCCGAGCCTCCTGACAGGCGCTTCGGTCGCGAAGGACGCAGTCCCTTCAGGCGCGAGCTTCTCCACCCATCGAAGTCGCCCTCCGTCGATCTCGCACCTTGCGGGAGCTTCTTGGACCGAGACGCGTGATCATGCAGGTAGCCCCAGCTCGATGGCGCTCGCAGGTCCCGGGTCGCGGTAGTTGAGCGGTGGCCATCCCTCTCACTCAGCGGAAGGCTCGCGCCGTGTCGCGCAGACTGCATTTTCGCCCTTGAGTCAGCAGCTTCACCGAAGCGAGTACGGACATGTACATGTAGTCGCGCCTTGCAGCAGACGTGCCGGGCTAGGCCGGAGACCCGGGTTCATCCTCCAGGATGACGGCCGGACCAGCTGGTCCGATGACCTGCCTTCTCAC2502025080251402520025260253202538025440255002556025620256802574025800258602592025980260402610026160262202628026340264002646026520265802664026700267602682026880269402700027060271202718027240273002736027420274802754027600CGAAGATGGCGCGCAGCAGGCGCTCCTCCGGCGTCAGCTCGGTCTCACCCTTGGGCGTGA27660CCTTGCCGACGAGGATGTCACCGGCGATGACCTCGGCACCGATGCGGATGATGCCGCGCT27720CGTCGAGGTCGGCGAGGACCTCCTCGGAGACGTTCGGGATGTCCCGGGTGATCTCCTCGG27780GGCCGAGCTTGGTGTCACGGGCGTCGACCTCGTGCTCCTCGATGTGGATCGAGGAGAGGA27840CGTCGTCCTGCACGAGGCGCTGCGACAGGATGATCGCGTCCTCGTAGTTGTGACCCTCCC27900ACGGCATGAACGCCACGAGCAGGTTCTTGCCGAGCGCCATCTCGCCGTTCTGGGTGGCCG27960GGCCGTCGGCGAGCACCTGGCCCGTGATGACGCGGTCGCCCTCGTTGACGATGACCTTCT28020GGTTGACCGAGGTGCCCTGGTTGGACCGGGAGAACTTGGCCAGGCGGTACGTGATGTACG2,0TGCCGTCGTCGTTGGCGGTGGTGATGTAGTCCGCGGAGACCTCCTGGACCACACCGTCCT28140TCTCGGCCTTGACCACGTCGCCGGCGTCGACGGCGGAGCGGTACTCCATGCCGGTGCCGA28200CGAGCGGGGCCTCGGACTTAATCAGCGGCACGGCCTGGCGCATCATGTTCGCGCCCATGA28260GGGCACGGTTGGCGTCGTCGTGCTCGAGGAACGGGATCATGGCGGTCGCGACCGACACCA28320TCTGGCGCGGCGAGACGTCCATGTAGTCCACGTCCTCGGGGGCGACGTAGTCGACCTCGC28380CGCCACGGCGGCGGACCAGGACGCGGGCCTCCTCGAACCGCATGTCGGCGGTGAGCGGCG28440CGTTGGCCTGCGCGATGACGAAGCGGTCCTCCTCGTCGGCGGTCAGGTAGTTCACCTCGT28500CGGTGACCTGGCCGTCGACGACCTTGCGGTACGGGGTCTCGACGAAGCCGAACGCGTTGA28560CGCGGCCGTAGGTGGCGAGCGAGCCGATCAGACCGATGTTCGGGCCTTCGGGGGTCTCGA28620TCGGGCACATGCGGCCGTAGTGCGACGGGTGGACGTCACGGACCTCGAAGCCGGCCCGCT28680CACGGGAGAGACCACCCGGGCCGAGCGCGGACAGACGACGCTTGTGCGTCAGCCCGGACA28740GCGGGTTGTTCTGGTCCATGAACTGGGACAGCTGGCTGGTGCCGAAGAACTCCTTGATGG28,AGGCGACGACCGGCCGGATGTTGATCAGGGTCTGCGGCGTGATCGCCTCGACGTCCTGGG28860TCGTCATCCGCTCGCGGACGACACGCTCCATACGGGCCAGACCCGTGCGGACCTGGTTCT28920GGATGAGCTCGCCGACGCTGCGCAGGCGGCGGTTGCCGAAGTGGTCGATGTCGTCGGTCT28980CGACGACGACCGGCTGGCCGTTGTCGCCGACGGTCTCGGTCTCACCGGCGTGCAGCTTCA29040CCAGGTACTTGATCGTCGCGATGATGTCCTCGACGGTCAGGATCCCGGCGTCCAGCGGGG29100TGTCCGTGCCCAGCTTCTTGTTGACCTTGTAGCGGCCGACCTTGGCCAGGTCGTAGCGCT29160TGGGGTTGAAGTAGAGGTTCTCCAGCAGCGTCTGCGCGGCCTCACGCGTGGGGGGCTCGC29220CCGGGCGCAGCTTGCGGTAGATGTCGAGCAGCGCGTCGTCCTGGCCCTGGGTGTGGTCCT29280TCTCCAGGGTGGCGCGCATGGACTCGTACTCGCCGAACTCCTCGAGGATCTGCTCGGTGG29340TCCAGCCGAGCGCCTTGAGCAGGACGGTCACGGACTGCTTGCGCTTGCGGTCGATGCGGA29400CACCGACCATGTCGCGCTTGTCGATCTCCATCTCCAGCCAGGCACCCCGGGACGGGATGA29楊TCTTGGCGGAGAAGATGTCCTTGTCGGACGTCTTGTCGATGCTGGAGTCGAAGTAGACAC29520CGGGGGAACGGACCAGCTGCGACACCACGACACGCTCGGTGCCGTTGATGACGAACGTGC29580CCTTGTTCGTCATGAGCGGGAAGTCGCCCATGAAGACGGTCTGGGACTTGATCTCGCCGG29640TCTCGTTGTTGGTGAACTCGGCCGTGACGAAGAGCGGCGCGGCGTAGGTGAAGTCGCGCT29700CCTTGCACTCGTCGATCGAGTTCTTCGGCGGCTCGAAGCGGTGGTCGCGGAAGGTCAGCG29760ACATCGACCCCGAGAAGTCCTCGATCGGGGAGATCTCCTCGAAGATCTCCTCGAGGCCGG29820ACTTGGTGGGGACGTCCTGACCGTTCTCGAGAGCCTCCTCGACCCGACTCTGCCAGGCGG29880TGTTGCCGAGCAGCCAGTCAAAGCTCTCGGTCTGCAGCGCGAGCAGGTTCGGAACCTCGA29940GAGGCTCCTTGATCTTTGCAAAGGAGATGCGCAGCGGGGCGGTGCTGGCGCCGTTGTTCG30000TMTCGCGGTCGAGGCAGTGCGCGAGGCGGCCAAGAGGGGGTCCTTCCGAGGGCTCGGAC30060TCACTACGCGCGTACCGGCCCCTCCCCCGTACACAGAGACAGAGATCCCAGGTCGGAGAT30120CATCTGTCGGTCAGTGCTCGAGTGAGGGCAGACCCCTGGTGACGGGCAGGGGACAGCTAA30180CAGGCAGCGCAAAGGGTCAGTGTAGCCACAAGGCACACTGATGTCCAGTCCCGCATTTTC3024031CTGTTCTCAACGCCTGCGGCATGCCTGCCCTCAACGCACGTTGATACTGC30300CCTCTTCGTCGTCGATCCATGCCTCGGATTCGGATCCTTGTGACGACGCGTCCTGAGAAT30360TGCGCGCTGCGTGCGGTTCGTCAAGGCCCCCCTTGCCCGAACCGGGGCGGCCGAGACACG30420ACGAAGATCACCTTACCCCTCACGAACACAGGTGCAAGGCAGCCCGGGCCGTCCCCCGGG30480GAACGCCGAAGGGCGACCACCCGGATGGATGATCGCCCTTCGGTGCGTTCGCGTTACAGC30540CCCTGAGGGCCGTTCATGCGGTCGCGAAGGTCTTACTTGACCTCGACGGAGGCGCCGGCG30600CCCTTGAGGGCCTCGGCGGCCTTGTCGGCCTGCTCCTTGTTGACCTTCTCGAGGACCGGC30660TTCGGGGTGCCGTCGACGAGGTCCTTGGCCTCCTTCAGGCCCAGGGAGGTCAGCTCACGC30720ACGACCTTGATGACCTGGATCTTCTTGTCGCCGGCGCCGGTGAGGATGACGTCGAACTCG30780TCCTTCTCCTCCTCGGCCTCGGCGGCGGCGCCACCGGCGGCACCACCGGCGACGACGACC30840GGCGCGGCAGCGGCGGCGGTGACGTCGAACTTCTCCTCGAACGCCTTCACGAACTCGGAG30900AGCTCGATGAGGGTCATCTCCTCGAACTGCGCGAGCAGCTCGTCCTGGGTCAGCTTCGCC30960ATGATGGCGGTCCTTCCACTCAATTCGGCAGGTGCCGGATGTACTGGATAAGGCGGGCGT31020ACGTCGGGCCCGCTAGGACCCTCGCCGGTCGGTCGGCGTGGGTCGGAAAGCGAGCCGAAT31080TACTCGGCACCGCCCTGCTCGGCCTGCTTGGCGCGCAGCGCGTCCACGGTGCGGACGAGC31140TTCGACGGCAGCGCCTGGAAGACGGAGGCAGCCTGGGACTGCTTCGCCTTGAAGGCACCG31200GCCAGCTTGCTGAGCAGAACCTCGCGGGACTCGAGGTCCGCAAGCTTCTTGATCTCGTCG31260GCGGACAGCGCCTTGCCGTCAAGGACACCGCCCTTGATGACGAGATTCGGGTTTTCCTTG31320GCGAAGTCACGGAGACCCTTCGCCGACTCCACCGGGTCACCGGTGACGAAGGCGACAGCC31380GTCGGACCGTTGAACAGGTCGTCCAGCGTCGTGATCCCGGCCTCGTTGGCCGCAATCTTG31440GTCAGCGTGTTCTTCACCACGGCGTACTGGGCGTTCTCACCGAGTGCGAGACGCAGCTTC31500CTGGTCTGCGCGACGGTGAGACCGCGGTACTCGGTCAGCACGGCAGCAGACGAGTTGCGG31560AACTTGTCCGTCAGCTCGGCAACCGCGGCAGCCTTGTCGGGCCTCGCCATAGAGCCTCGG31620CCTCCTTCCGGGTGATTCGGACCGCGCGGACCCGAAGGAGGACTGGGAAAAACGAAACGC31680CCCGGCGCAGGCGCACGGGGCGGACTCAACCGGTTCGCACGTGCGTGAACACACGTATGC31740TCCGGGAGTTCTTCCACAGTCACCTGCGCGGGTCGTCCGCATTGAACAGCGGATCCTTCG31800GCCACCGACCCCGAATGGGGCACGGCAACGACCAGCGGTCTT士GGCTTCTGTAGGAGAGT31860ACGGGACGGGTACGCCGTCAAGCAAATCGCCCCTACGGGCGTCAGCCCTGGACGCCCTTC31920ATCATCTCGGCGAGGTCGGCGACGTCCTTCGCCGGCGGCGCCGTGACGGTGACGGGCTTG31980TTCACGTCGTAGAAGGTGATCGTCATGTCGAGCGGGCCCTTGTCGGCGTCGCCGCGCATC32040CGGAACCGCTTGGTGTGGTCCTCGCCGTCGACCCACAGGTCCATGGAGAGCTTGTCGATG32100CCCAGCTTCTCGAACTCGTCGAGGCTCTTCTGCCGCTTGTCGCGACTCGCCTTGTCGGTG32160CCCTTCAGCGACTTCTCCAGGGCGTCGAGGGTGGCGGTGCCCTGGTAGTGGGTGGTCTTC32220ACCCCGTCGACGGTCTCGGCGCCGACCTCGCGCACGTCGTCGGCGCCGGCCAGGAAGGTG32280GACTGGGCCGCCGGGTTCTGCTCGGCCGTGGCCCCGGCCCCGGCGAGCGGGTTGGCCTCC32340TTGCCCGCCTTGGACATGTCGAACTTGATCCAGCTCTTGCCGTCCATCTCGCCGGCCGCC32400TCGGCGCCACCGTTGATGTACATCGCCTTGTCCACGAACCGGATCTCGACCTGTCCGGCG32460TCGGCCTGGTCCTCGGGCGTGATCTTCATGCTGAGGGCGGGCGGCTTCGTGCTCATCGCG32520GCCTCGCCGCGCACCCGGCCCTCGCCGGGCACCCGGCCGTCGAGCCGGTAGCGGAACGAG32580GTGACGGCGTCGGCGTTCTTCGCGGCCCGGGCGACGGCCGCCGCGGGCTCCAGGTCCGGA32640GACTGCTCGCCCTTGCCGCAGCCGACGGCACCCGCCAGGAGCAGCCCGGCGAGGGCAGCG32700GTGGACACGGCACGCTTCATCGATTTCCCCCCCAAGGAAACACATGGCCGCCACACAGCG32760GCCGGACGAGCCTAACCCGCGGGTTACCGATCAGTCGCTCGATTTGTCAGGACCCCTGGC32820CGCCCATCAGTGCCTCGAAGTCCTCGGTGTCCCCGTCCGGCGGCCGCTGTACGGCGACCC32880GCACGCCGTAGGTGTCGTAGTACGCCGTCTGGGTCATCGGGCCGGACGTCATCTCGGCCT32940TCTCCACCTTCTTGACCAGCAGATTCTTCTCGTCGACCCAGATGTCGACCTGCTCCGCGG33000TGACCCCGGCGTCGGTGAGCTGCCGGCGCAGGGCCACGTCGCCGAGCGCGGAGACGTCGA33060CGGTGCCGGTGTAGTGCCGGGTGGCGCGGCCCCCTACCGTCTCCCGGCCCGTCTCGCGCA33120CCGTGCCGGAGGCCAGCAGGAGCCGCACGGGCAGCACGGGCGCGGTGTCGCGGAGCTGGT33180CGCGGAGGTAGGCGCCGGAGTCGCCGGGCAGCTCGGCGAGGTCGTCGAAGTCGTAGCGGA33240TCCAGTGCCGGCCGCCCATCCGCCGGGCGAAGTCCTCGCCGACCCGGGCGTAGTAGGCGT33300CGGGCAGCAGACGGGCCTCCATGGTGGTGGTGCCGAGCTTGCGCAGGGGCTCGGTGAGGC33360TGCCGCCTGTGTAGGTGATGCGCAGGGTGCCGGTGGAGTCGCCGGCCCAGTCCAGGGCGC33420CCTCGGTGCGGGTGGAGAGCAGGTCGCCCATGGCCGTGGTGGAGCTGATCCGGGCCGAGC33480CCGCCCCGGCGACGGCCCGCTCGACGGCGCGCAGCGCGTCCGCCGTACGGGGATCGGGGC33540GCGGTGCGGCGCTCACGGTGCCGCCCGTGGCGTCCGGGCGGGCGGCGCCGTCGTCGGAGC33600CGCCGCACCCGGTCAGGGCCGTCAGCGCGGCGACGGCGGCCAGCAGGGCCGTCGTGGTCG33660GCGCGGCTCCCCGCGGGCGGGCGGTGCCCCTGTGCCTCATGTCTCCCCCTCGGTCCCCGT33720GATCGCCACGCTAACCCGGCGAGGGGCCCCGGGGGTACGGGAACGGGCCCCGCACCTGGG33780AAGGTGCGGGGCCCGTGACCGACTCGGTGAGCCGTCAGGCTCAGACCGCGGCCGGGTCCT33840CCTCGACGAGGAGGTTGCGGGTGCGGTTCGGGTCGACGGGGATGCCGGGGCCCATCGTGG33900TGGTGATGGCGGCCTTCTTGATGTAGCGACCCTTGGCGGCGGACGGCTTCAGACGGAGGA33960TCTCCTCCAGCGCGGCGCCGTAGTTCTCCACCAGCTTGGCGTCGTCGAAGGACGCCTTGC34020CGATGATGAAGTGCAGGTTCGAGTGCTTGTCGACGCGGAACTCGATCTTGCCGCCCTTGA34080TGTCGGTGACGGCCTTGGTCACGTCGGGGGTGACGGTGCCGGTCTTCGGGTTCGGCATCA34140GACCACGGGGACCGAGCACGCGGCCGAGGCGGCCGACCTTGCCCATGAGGTCCGGGGTGG34200CGACGACGGCGTCGAAGTCCAGGCGGCCCTTGGAGACCTCGTCGATCAGCTCGTCGGCGC34260CGACGATGTCGGCGCCCGCGGCACGCGCGGCCTCGGCACGGTCGCCGGTCGCGAAGACCA34320GGACCCGGGCGGTCTTACCGGTGCCGTGCGGAAGGTTCACGGTGCCACGGACCATCTGGT34380CGGCCTTGCGCGGGTCGACACCCAGACGGAAGGCGACCTCGACGGTGGCGTCGAACTTGG34440TCGTGGAGGTCTCCTTGGCGAGACGGACGGCCTCGAGCGGGGCGTACAGCTTCTCCCGGT34500CGACCTTGGCGTCCGCAGCCTTGAGAGCCTTGCTGCGCTTGCTCACGTGATGCTCCTGTG34560TTGGCTAGGAGTCGTGGTACGGGCCGAGCAGGCCCTTCCACGCTGTTCTGCAGGGGGGTT34620GAGGTCAGCCCTCGACGGTGACGCCCATGGAACGGGCGGTACCCTCGATGATCTTCGCCG34680CGGCGTCCAGGTCGTTGGCGTTGAGGTCGGGCA34713<210>2<211>151<212>PRT<213>Sfrepfomycesa"wosMSATCC25421<400>1MetThrGluHisProAlaGinGinLeuTyrCysThrValValLeuTrp151015AspLeuSerArgSerAlaAlaThrValAlaSerLeuArgAlaTyrLeu202530ArgAspHisAlaValAspAlaTyrThrThrValProGlyLeuArgGin354045LysVal65ValThrTrplieSerSerThrGlyProGluGlyGluGinTrpGlyAla505560TyrLeuTrpAspSerProGluAlaAlaTyrGlyArgPro7075SerLysValValGluLeulieGlyTyrArgProThrGlu8590TyrTyrSerValGluAlaAlaThrGluGlyProAlaAlaAla100105110ProPheGlyLysGlyLeuGlyLeuAlaPheAspProAlaSerProGly80ArgArg95AlaAlaProGluProlie145Leu130ProAla115120125ThrArgProGinGluPheValProProGlyAlaAspAlaPheSerArgProPro150135Ala140<210>3<211>455<212>PRT<213>iStre/^o/w^ceya"wo咖ATCC25421<■>lMetAspGluSerProThrTyrProPheGluGinLysCysProPheAla151015ProProAspGluLeuValArgArgArgAspGluAlaProValSerGin202530lieArgLeuAlaAsnGlyAlaThrAlaTrpLeuValThrArgHisAsp3435AspValArgThrValLeu50AlaGlyAlaLeuArg65GlySerAlaGlu40ThrAspProArgPhe55GlyGlyProProArg70GlyAlaProGinGly85GlyAlaProGin45SerArgAlaAlalie60ProGlyGlyProGlySerAlaGly100GlyProGlyGlyProGlyGly115ProGlyGinArgGlyProGlyGlyProGly7580GlyTrpProGlyGlyProGly9095GlyTrpProGlyGlyValProLysGly130GluArgHisAlaArg145ArgHisAlaGluGly105AlaSerValGlyPro120AspPheGlyMetPhe135TrpArgArgThrLeu150LeuArgLysAlaGly110GlyAlaProGly125LeuAlaAspProSer165ValLeuAspGlyLeuAlaGluAla180AlaTyrGinValAla140AlsThrValLeuThr155GlyGinAlaValSerGlyPhe195ProGluGluLeuVal170GlyProAspProVal185ValArgValLeuAsp175LeuPro160GluValAspLeu210ValArgAlaAlaAla225AlaLeuPheGlyPro200ArgProGlyLeuTrp215SerThrAlaAlaAsp190GluLeuPhePro230AlaArgGinLeuCys205GlyTrpAlaAlaGin220GlyAlaAlaMetVal245LeulieGlySerPheGlyAlaAlaMetGly235240ValGluLysGluLeuAlaAla250255lieAlaGlyLeuAspGluAspPraGlyAspGlyLeulieGlySerLeulieAlaGlyLeuAsp260265270AlaArgProSerAlaAspGluLeuValSerThrValValLeuLeuAla35275280285ThrAlaGlyTyrGluSerThrAlaValGinPheAlaAsnGlyLeuLeu290295300AlaLeuPheGinHisProAspGinLeuAlaArgLeuArgAspGlyThr305310315320ValThrGluAlaAlaAlaValGluGlulieLeuArgTyrAlaGinAla325330335GlyThrGlyPheAlaGlyThrThrValThrThrGluGluValThrLeu340345350GlyGlylieThrLeuProGluGlyAlaThrValPhelieSerLeuAsp355360365SerAlaAlaArgAspGluArgHisValAspArgProAspThrPheAsp370375380LeuAlaArgGlyAlaAlaArgThrHisLeuThrPheGlyAlaGlyAla385390395400HisTyrCysLeuGlySerSerLeuAlaArgValGluLeuGinGluGly405410415PheGlyArgLeuLeuArgArgPheProAlaLeuThrProAlaAlaAsp420425430ProAlaAlaValGluPheThrAlaAsnLeuPheHisArgTyrProArg435440445GluLeuLysAlaValLeuArg450455<210>4<211>鄉<212>PRT<213>S/re/^函戸51ac加逼ATCC25421<400>1ValAsplieGluAlaArgThrTyrProPheThrArgHisThrProPhe15lieAlaAla5GluPheAlaTrpGluMetProGlu20GinValArgLeuAlaThrGly35ValArgThrAlaPhe10ArgGluAsnArgGluAsp50AsnArgGluGlyAla65AspSerProValLeu25AspThrAlaTrpLeu40ThrAspProArgPhe85HisThrArgTrpArgArgLeuVal100MetArgProAlaLeu55AlaArgValAspThrGly7075AsnPheGlyGlySerliePro30lieThrArgTyr45SerArgThrlieSer90GinAlaPheThrAlaGluSer115AspAspLeuGluSerAla130AlaTyrGinLeuPro145GinThrAlaArgAsn105AlaAlaHisThrPhe60PheGinAlaAspAla80SerGluProProGly95ArgHisVal120GlyGlyArgPheAsp135ArgVallieCyslie150GluPheSerAlaPro165ArgAspPheThrSerSerPheVal180TyrAlalieGlyAsp155AlaLeu170PheGlyGinAlalieGlyArg195AspLeuLeuSerGlu185lieValArgLysAla110AspAlaLeuLeu125LeuMetAlaAspTyr140LeuLeuGlyLeuGlu160AlaGinlieThrArg175GinAlaGlyGly225Asp210ArgLeuSerAsnGlu230Leu200ThrLeulieGlyLeu215GluLeuValSerThr235Leu190ArgGinAsnLeu205AspGluGluAspThr220VallieLeuLeuLeu240MetAlaGlyTyrGluSerThrAlaValGinLeuGlyAsnAlaPheTyr250255ArgArgLeuArgGluGluProGlu245AspProSerGinAlaLeuPheArg260AlaLeulieGlyGinAlaVal275GlyTyrAlalieGlyThr290SerGlyGlyThrVal305SerAlaAsnArgMet265GluGlulieLeuArg280LysPheThrThrAla295ProAlaGlySerThr310GluLysValPheGlu270TyrAlaGinMet285AspValGluLeuAsp325AspValGlyArgGlyCysAlaHis340CysLeuGlyAlaGlu300ValPheValSerLeuAla315320GlyGluAspAlaAspArgPhe330335GinThrAlaPheGlyTyrGlyProHisTyr355AlaArgMetLeuArg345LeuAlaArgVaiGlylie370ProAspLeuAspGly385ProAlaGluLeuPro405Ala360AsnArgPheProAsp375ProLeuAlaSerVal390ValArglieAsn395Gly350GluMetGinGlu365ArgPheAspGlyLeu380LeuPheThrPheTyr400<210>5<211>345<212>PRT<213>iSfr取o附戸j1acft/osmATCC25421<400>1MetProAlaProGluThrGlyProTrpHisSerLeuHisLeuHisArg1TyrAlaGly5GinAspAlaPheLeu20HisAlaSerGlyAlaProLeu35GinGlyGlyHis10ValAspGlyLeuAla25LeuGluSerSer15ValLeuTyrTrp50HisAspProGluGin65LeuAlaGlyHisAla40HislieArgLeuArg55AlaArgThrValPro30PheLeuArgAla70AlaAlaHisProPhe45LeuArgProAlaAla60GluValAlaAspLeu85ProGluGluPheArgGluAlaGin100GlyGluLeuLeuArgGluValAlaAspArg7580GlyGlyTyrGlyAspLeuAsp9095ThrMetAlaAlaLeuGluSerGluAlaThr115ProGluTyrGlyLeu105ProAspThrValTyrGlu130AlaGluArgPhePhe145ArgAlalieGlyPro120LysTyrGlyGlyPro135ArgSerSerAlaAsp150ArgProAlaArgLeu110HisProAlaArg125GluGlyValAlaVal140AlaLeuSerAlaAsp165MetThrLeuArgGlyLeuCysAla180LeuAlaHisTyrValAlaLeuSerAlaLeu155160ArgLeuGlyAlaAlaPheThr170175ArgLeuSerProProAlaMetAlaGlyPhe195PheLeuAspThrAla185AlaValTrpSerAspSer210AlaAlaAlaHisLeu230ArgCys200TrpProGluLeuLeu215ArgProLeuLeuPro225AspAspProTyrGlyArgAlaValGlyGluAlaTrpGinAlaLeuAla235AlaPro190ProTyrValPhe205AspGinArgArgGly220AlaAlaGinProPro240His245ThrAlaAlaAspThrValLeuPro260GluArgArgArgAlaProAla275ThrHisAsnAsnArgLeu290GlyTyrLeuGlyHis305AspAlaGlyLeuGin280GlyLeu295ValValAlaAspHisValValAlaAspCys310315AspArgValArgAspHis250255AlaValThrLeuGlyGlyPro265270lieValLeuLeuSerTyrLeu285lieProGluGinGluAlaPhe300AlaGlyLeuAlaAlaAlaHisLeu340Leu325ProSerGlyGinAspHisArgArgGluArg330335AspHisLeuPro320LeuHis345<210>6<211>920<212>PRT<213>S/r印to附ycesfl"womsATCC25421<400>1ValProGlyAlaProAspAlaAlaGlyAlaProAspGlyPheSerPro151015TyrTyrLeuTyrArgArgGlyThrLeuGlyProSerGluLeuAlaAla202530LeuThrProAlaArgThrTrpAlaLeuLeuAlaGluAlaGluGluThr354045ArgGinArgArgGluGluLeuArgGlyArgLeuGluAspAlaLeuHis505560AlaAlaValProGluLeuProAlaAspArgArgHisGluLeuLeuArg65707580LeuArgArgAsplieHisAsnAspArgValProGlyValProAspAla859095AlaArgLeuLeuAspProAlaSerArgGluLeuLeuGluAspTrpLeuLeuAspProAlaSerArgGluLeuLeuGluAsp100105110ArgHisArgAlaGluGlyAsnArgLeuHisLysGluAlaGluAlaAla115120125AlaGluLeuAspAlaGlyArgArgAlaLeuAlaAlalieAlaLeuAlaAlaGluLeuAspAlaGlyArgArgAlaLeu130135140ThrGlyGluPhePheGinArgGlyLeuGinLeuSerAspGluArg145150155TrpArgThrValThrGluTrpAlaAlaAspProPheSerAlaArg165170175LysProSerLysArgArgArgAlaGluAsnThrLeuThrSerPheLysArgArgArgAlaGlu180185TyrArgValAlaLeuLysProSerProPheAlaSerPheThrGlulieSer190ThrThr160ArgAlaGlyValAlaLeuLysProSerProPheAlaSerPhe195200205AlaAlaProTrpThrProAlaGlyAspGlyThrAlaProAlaAsp210215220ArgProProAlaArgProValGinAlaArgLeuSerAlaGlyLeuLeu225230235240SerTrpMetThrTyrGluLeuHisArgLeuAspArgAlaAspGluLeuTyrGluLeuHisArgLeuAspArgAlaAspGlu245250255MetArglieArgLeuAsnHisSerLeuLeuValArgGluGluGinAla260265270LeuCysValArgArgAlaProAspGlyAlaProGluAlaAlaTyrGly275280285ThrAlaGinValValThrAlaArgAspThrGlyLeuLeuArgLeuLeuArg305AlaGinValValThrAlaArgAspThrGlyLeu290295300SerLeuLeuAlaAspGlyGlyLeuProGluArgGluLeuArgAsp310Glu315Glu320ArgLeuAlaAlaAlaGlyLeuSerProGinAlaAlaAlaThrAlaLeu325ArgAlaGlylieAspLysLeuVal340AspGinHisProArgProAla355ThrAspGinAlaGin330GluArgGlyLeuLeuAsp370GinAlaAlaGluAsp385AlaLeuLeuAlaCys345LeuAlaValAlaGin360ArgCysAlaValAla335lieProGly375AlaPheProAlaAla390lieArgGluGinGly350ArgLeuArgThr365PheGluArgLeuGlu405ValGlyCysArgAlaProAlaPro420GlyThrArgGluVal380ProValArgArgArg395AlaValPheValGluAspVal435AlaAsnArgTrpVal410GluAlaMetArgSer425AlaHisSerTrpGlu415ValAla400AlaTyrLeuHis450ValLeuAspAspAla465AlaArgHisPhePro440AlaLeuGluLeuPhe455ValGluLysAlaVal430ProAspLeuSer470AlaAlaAspGlyHis445GinArglieValPro460LeuTyrAlaPheGly485GluPheTyrArgArgPheAlaAla500GlyValGlyAspGlyLeuTyrAlaPhePhe475480AspGlyAspValProPhelie490495ProProAlaGluAlaSerAlaValAlaSer515AspPheAlaAspLeu505HisSerAspArgArgSer545Ala530AlaHisThrGlyAla550Pro520LeuLeuArgThrGlu535LeuArgLeuAspAla555Ala510lieArgArgLeu525LeuArgAlaHisAsp540GluArgLeuArgAla560PheAlaAspArgLeuProAlaGluValThrProTrpArgSerThrAla565PheThrAlaGluTyrArgMetGin580AsnGlyValThrThrGlyHis595GluProAspGlyThr570GluArgProTyrLeuLeu610ArgGlyHislieAla625ValLeuGlyLeuPro585GlyValPhePheSer600HisGluTrpSerThr575ValValPro615ArgThrThrProArg630PheAsnLeuHisAla590ArgPheCysAsp605ThrGluAlaLeuAsn645LeuValTyrProGlySerValPro660AspLeuAlaValLeu620GinCysAsplieThr635ArgLeuSerProThrLeuAla675ValSerThrArgProArgLeuSerProTyr650655ArgAlaAlaAspGluHisThr665670AlaAspProAlaArgArgThrLeuAla640GluLeuAlaLeu690AsnPheLeuTyrPro705AlaPheAlaProArg680AspGlyGinProLeu695AlaAlaProGlyAla710ArgThrTyrArgArg685AspLeuValProLeu700TyrArgLeuLeuThr725.AspArgAlaAspAlaGluAlaGly740HisArgSerLeuLeuTyrArgLeuLeuCys715720GlyGlyLeuTrpAspGinLeu730735AlaAlaGlyArgThrGlyValProAlaThr755ArgAlaSerTrpArg745ArgValLeuLeuLeuAsp785Asp770GlyLeuGluArgGin790Pro760ArgLeuProAlaAla775GluAlaAlaAlaLeu795Thr750GlyAspLeuVal765AspValProAspThr780AlaSerPheAspArg800TrpLeuGlyGinArgGlylieProArgHisThrPhePheArgLeuThr805810815ThrProProProValProAlaGlyGluArgAspLeuLeuAlaGluThr820825830ArgGinTrpAlaLeuGluAlaArgThrAlaArgLeuHisLysProHis835840845TyrLeuAspAlaArgAsnProPheLeuLeuGinValPheAlaArgArg850855860LeuAlaGluAlaGlyProAspAlaThrValThrPheGinGluCysLeu865870875880ProHisAlaGlyAspLeuAspGlyArgThrSerGlyAlaGluGluPhe885890895PheValGluTyrThrLeuGlyThrProAlaProAlaGlyThrGinAla900905910ThrGluAspAlaHisAlaArgPro915920<210>7<211>549<212>PRT<213>5!tre/7/o附戸sa"wos船ATCC25421<400>1MetThrThrAspGluAlaTyrThrTyrThrThrGlyLeuArgLeuAsp151015ProArgSerAlaAsnProAspGlyTrpArgValAspTrpAlaAspGly202530ProTrpProValLysValTyrSerGlyAlaArgArgLeuProLeuArg354045ProAspGlyProProProLeuAlaAlaLeuHisArgLeuLeuHisGly50PheAlaValSerGly65AlaThrProAlaLeu55lieArgThrAspArg70AspProArgProHis85ProSerGlyGlyArg60SerGlyGlylieArgArgProVal100AlaAlaLeuThrAlaThrGly115LeuThrValLeuProSerGlyGlylieAla7580HisGlyProGluValGinLeu9095MetTyrProThrGluValTyrHisGlu130AlaAlaLeuHisLeu145LeuThrSerArgAla105GinValCysHisTyr120GlyGlyAspAlaAla135ProThrGluAlaAla150TrpLysAsnPheGlu110AspProTyrArg125AlaArgLeuArgPhe165ThrArgLeuGlyLeuValAspAla180ArgAlaGluTrpAla140ProAlaAlaValLeu155LysTyrGlyAspArgLeuAla195AspAspGluAlaValHis210AsnAlaTrpAlaAla225AspThrGlyGlyTyr170GlyValAlaLeuGly185HisAlaGluValPhe175AlaVal160AlaAlaGlu200AlaCysLeuGlyLeu215ThrLeuGlyProArg190ThrValPheVal230AspAlaProProArg205AspGlyGluGluGlu220LeuProTyrArgPro245SerArgThrValArgArgSerAsp260AspThrSerThrTyrLeuProTyrArgAla235240ArgProAlaLeuLeuGluArg250255PheThrAlaPheGinArgAlaAlaArgGlu275Ala280Arg265AlaProAlaArgPro285Gin270ProGluAspAlaValProAlaThrAlaProGlyProValProGlyAspAlaGlyPro290AlaAlaProGlyAla305ProArgProValPro295ValHisGluAspPro310ProGlyAspAlaVal325AlaLeuAspLeuGly300ValSerAlaAlaProAlaProArg340ArgPheSerArgGlyArgLeu355AlaGlyValLeuAlaValSerAlaAlaAla315320ProValGlyProValProLeu330335AlaAlaGluThrAlaAlaArgAlaLeu370AlaGlyAlaGlyAla385LeuTyrCysAlaLeu345PheThrGlyAlaGlu360GinAlaAlaGluGly375AspGlyProAlaGly390HisArgValArgAla350AlaAspGlyGlu365LeuArgAlaLeuVal405ArgTyrAlaHisGluLeuGlyAla420SerAlaArgArgAla380TrpAlaAlaArgThr395ValProProGlyGlyProGly435PheAsnAlaGluLeuAla450AspTrpArgProAla465AlaValGlyAlaGly410LeuLeuProValGly425GinGluAlaLeuTrp415GlyArg400TyrThrVal440AlaPheThrValHis455GlyProArgAlaGlu430AlaAlaSerGly470lieGluAlaValPhe445ProValThrProAla460ArgAlaGinGinAla485GlyLeuSerGlyHisAlaValUu500GlyLeuAspGlyTyrArgAlaGinGinLeu475480ThrLeuAlaAlaAlaAlaGlu490495PheAspValThrArglieAspThrAlaTyr515Gly520Gly505AlaAspThrAspGly525Arg510GlyThrGinAlaGinlieCysValGlyAlaValArgProAspProAsnTrpGlulie530535540AlaValMetProArg545<210>8<211>656<212>PRT<213>S/re/rf謹戸jacft/o咖ATCC25421<400>1MetSerThrAlaThrThrProGinProArgThrGlyProAlaGlyPro151015ProValValValGlyArgGlyValLeuAlaGluHisLeuValArgArg202530LeuGlyArgAspAspThrProAspProAspGlyGlyAlaArgPheGly354045ArgSerSerGlyAlaThrValLeuValAlaGlyLeuAspGlyLeuGly505560GluPheGinAspThrValValAspCysLeuAlaThrGlyArgSerLeu65707580LeuPheValGlySerTrpArgSerLeuValTyrlieGlyProValTrp859095ArgProGlyThrGinGlyCysProArgCysUuValThrArgThrAla100105110AsnSerProPheGlyProGlyLeuGluGlyAspSerLeuAlaGluSer115120125TrpProHisGlyAlaAspValArglieTrpGlyProGlyValLeuArg130135140LeuValGluGluTyrValArgAlaArgLeuAlaSerCysLysGlyPro47145AlaGlyProAla150AspGlyArgValLeu165GinThrLeuLeuThrValGluGin180GlySerLeuArgGluAspThr195ThrLysLeuThr155160ValLeuAspGlyAlaAlaGly170175AspSerGlyCysProAsnCysProLeu210AlaAspAlaValArg225LysGluLeuArgPro185ValProAlaLeuThr200AlaThrLeuArgPro215GlyAspTyrLeuTyr230AspLeuGinSerPro190ProAlaAlaVal205GlyArgLeuProGin245GluLeuProProArgTrpGlyArg260AlaThrSerArgThr220AlaGlyLeuGlyLeu235PheGlyAlaCysAlaAspTyr275AlaGlyLeuHisPro250ArgGluProAlalie265ValAlaValLeuSer255ArgPhe240ValAlaArgTyr290ArgTyrAlaAspVal305ThrHisProGluThr280ArgGlyGlyThrLeu295AspGinAlaLeuGly270GlyLeuGluAla310SerTyrAlaSerGlu285ProProValArgAla300ProProAspLeuGlu325PheAspProGlyThrGlulieAsp340ArgAspGly,ArgValLeuVal355AspAspGlulieTyrProProAspLeuGly315320GluGlyPheArgTyrArgPro330335ValGlyAlaTyrSerPheArgArgPro360PheTrp345GluArgAlaSer350TrpGlyProAlaPhe365HisAspAspGlulieSerPhePheTyrAspThrSerAsnGlyCys370375380AlaLeuGlyAsnSerValGluGluAlaValLeuHisGlyLeuArgGlu385390395LeuAlaGluArgAspAlaPheLeuLeuThrTrpTyrArgGluAspAlaPheLeuLeuThrTrpTyrArgGluLeu405410415ValProGluValAlaLeuAspGlyThrSerProAlaLeuAspHis400AspLeuValAlaLeuAspGlyThrSerProAlaLeuAsp420425430LeuAlaLysSerArgLeuPheThrGlyPheAspPheArgCysPheAspLys435AlaThrMetGluTyrGlyVal455ArgThr440ProAlaLeuLeuThr450SerGlyAspGlyProArgLeuPheAlaGlyCysGlyAlaHisLeu460CysArg445ThrAlaGluAsnAspSerGlyAspGlyProArgLeuPheAlaGly465470475AspProValGinAlaValThrGlyAlaLeuHisGluLeuValGly485490495ValLeuAlaThrArgAspAlaTyrGluArgArgArgProAspAlaThrArgAspAlaTyrGlu500505ArgMetLeuAlaAspProPheLeulieArgArgMetGluAspHisSerAsp510AspPro480ThrLeuLeuAlaAspProPheLeulieArgArgMetGlu515520525ThrValGlyAlaLeuProGluAlaArgAspArgPheSerPheLeuLeu530535540AspArgProArgThrGlyAlaProValProLeuGlyArgValArgSer545550555560ThrLeuArgThrGinAspAlaAspLeuArgAlaAspLeuTyrAlaAla565570575ValSerGlyValLeuAspCysGlyLeuAspValLeuValValAspGinValLeuAspCysGlyLeuAspValLeuValVal580585590ThrMetProGluLeuArgArgAsnGlyLeuHisCysValArgValLeu595600605ValProGlyLeulieProMetThrPheGlyHisArgAsnArgArgThr610615620CysGlyLeuProArgLeuThrGluGlyThrThrLeuProTyrArgSer49625630635LeuLeuAlaProGlyArgGlulieGlyAlaVal645650640ProHisProPhePro655<210>9<211>654<212>PRT<213>S/re/to附ycesacft/oimATCC25421<楊>1MetThrAspValAlaAlaAspArgAlaGinProAlaGlyProAlaAla151015AspProLeuThrAspThrLeuThrArgThrTyrArgLeuArgAlaAsp202530AlaPheTyrValArgGinGinAspGlyValTrpLeuGlyAsnAsnThr354045GlySerPheSerValArgGlyGinGlyAlaTyrGinLeuValSerSer505560LeuPheAlaGlyLeuAspGlyGluArgThrLeuGinAspLeuTyrGly65707580AspLeuProAspArgAlaArgArgSerValLeuGlyLeuValArgAla859095MetLeuArgAsnGlyPhelieLysGluValAlaHisProValGluPro100105110ValProGlyTrpMetArgGluArgTyrAlaThrHisLeuAlaPheLeu115120125GluHisHisAlaAspArgProValThrArgLeuGinGinValArgThr130135140AlaArgValValCysAlaGlyArgGlyThrAlaLeuHisAlaLeuLeu145AspAlaLeuArg150GluPheGlylieAla165LeuThrAlaValGlyAspAspAsp180AlaAlaAspProGlyAlaArg195ProAlaAlaLeu155160ArgLeuAspValValProAsp170175GinValLeuLysGluThrAlaAspGly210AlaValLeuLeuAla225SerGinHisAlaGin185TrpArgLeuArgAsp200GlyHisProAspAla215TyrAspSerAlaAsp230TrpArgAspGlyGlu190ProLeuAlaAla205GluGlyAlaAspLeu245ArgCysGlyAspPheValThrAla260GluCysValHisVal220AlaAlaAlaLeuAla235ThrValGlyValTyrCysTrp275AlaGlyLeuAlaVal250LeuGluProGlyLeu265SerlieAlaValLeu255ThrArg240AlaProAspThr290LeuArgValAlaGin305ProGlyAspLysArg280ProAlaValAlaPro295ThrPheAlaArgGly270AlaThrGlyHis310ValThrThrValArg285AlaAlaValGlyAla300AlaGlyValArgPro325ArgGlyHisAlaAlaArgArgHis340ArgArgLeuProLeuAlaGlyValArgPro315320GluProUuValProAlaVal330335ArgCysProHisHisGluProAlaValPro355AlaValArgProAspliePro345AlaGlyAlaAlaPro375ValPro360ArgSerGluAspVal370ArglieSerAspArglieValAlaAlaCysAlaAlaLeuThrAspAlaPro380AlaHis350AlaProGluAsp365ProGluArgVal385ValThrGlyPro390LeuLeuAlaLeuGly405SerAlaCysGinProLeuSerAla420AspAlaProAlaAlaLeuGly435ArgAsnGinVal395400GluGluAspLeuAlaGinLeu410415AlaAspProAspGlyGlyAlaGluAla450ArgLeuThrAlaGly465SerLeuGlyGluVal425ValValCysArgAla440LeuCysAlaValVal455AspAlaArgTyrGly470ArgLeuArgAlaGly430LeuSerProArg445SerLeuAlaGlyAla485ArgProThrProAspLeuHisTrp500ThrAlaAlaGlyGlu460AlaValGlyAlaGly475LeuHisAlaAlaProGlyAsp515ProTrpThrAlaArg490AlaProAlaProGlu505LeuAlaGlyValLeu495ProTrp480GlyProGlyThr530ValArgAlaHisVal545GlyThrAspArgTyr520ThrAlaAlaGluGlu535ThrArgAspGlyGlu510AlaAlaGluArg550ArgAlaValGlyLeu525LeuProAspGlyVal540ValThrAlaGlyGlu565AlaArgValLeuProLeuProGly580AlaThrAlaThrAlaValThrAlaGlyVal555560HisAlaLeuLeuAsnAlaVal570575AlaGinGluAlaThrAlaPheLeuAlaPro595GluArgGlulieThrAspAsn585ThrAlaAlaProLeu615GlyTrp600LeuProPheLeuArg610GlyThrGlyThrGlyThrGlyThrGlySerGlyGlyGluAlaGlyAlaThr620GlyThr590ThrAlaGluGly605AspThrAspTh:r625630635ArgValArgValValAlaLeuProValSerGlu64565010444PRTSfre/rfow^cesa加(WtwATCC25421640GluAlaSer<210><211><212><213><400>ValGlyAspMetGlyArgProAlaPheGinArgPheLeuThr1His510LeuProAlaGlyArgAlaGlyAlaValThrGlyVal2025ProArg15TrpGlyArg30GlyAspPheAlaAlaTrpAspAspLeuLeuThrAlaGlyArgAspLeuAlaGly65ThrAla50Leu354045GinValArgProGlyGlyAlaTyrAlalieAspProThrAla55ProAlaLeuAlaAlaLeuPheAla70ValLeuLeuTrpAlaSerProArg85GlulieAlaProAlaLeuHisAlaLeu100105Thr90ProVal75Leu60AlaThrValGlyValThrAspAspGlySer110ProAsp80GlyArg95ValProLeuAlaAlaGinGluArgProLeuTrpGlyValCysThrSerGlySer115120125Serlie145GlyAlaProLysValAlaValGlyProAlaAspGluTrpGluGin130135140AlaLeuHisAlaGluAlaAlaMetTyrAlaAspAlaPhe150155ProAla160GlyProProGluAlaLeuAlaThrCysLeuProLeuGlyPheSerAla170175LeuTyrLeuLysArgAspLeuAlaPhePheMet180ProAla165CysValLeuProValValHis195ArgValLeuAlaAlaLeuTyrLeuLysArg185190ProHisAspTrpSerProLeuTyrAspLeuAlaArgAspLeu215AlaTrpSerProLeuTyrAsp200205GlyValProAlaLeuAlaAlaAlaAlaArg210LeuSerAlaProAlaAlaThrAspLeuGlySerValAlaLeuLeu220SerCysLeuSerAlaProAlaAlaThrAspLeuGly225230235LeuGlyGlyGlyHisLeuSerAlaProArgValGluLeuliePhe240ArgHisLeuSerAlaProArgValGluLeulieArg245250255HisPheThrGlyAlaAlaValSerAsnLeuTyrGlyThrAlaGluThr260265270GlyAlalieAlaLeuAspHisAspProGlyHisAsnArgHisValGly275280285ArgProlieProGlyLysSerValTrpLeuThrGlyThrAspGluArg290295300lieGlyThrValAlaValAlaGlyProGlyCysCysArgArgGlylieGlyThrValAlaValAlaGlyProGlyCysCysArgArgThr305310315320TrpArgProGlySerProProSerAlaProAlaAspHisValThrGlySerProProSerAlaPro325330ThrAspTyrGlyArgPheAspAlaAspGlyAsnLeuCysLeuGluGlyThr335GluGlyArgPheAspAlaAspGlyAsnLeuCysLeu340345350ArgLeuAspGlyAlaGluLysLeuAlaGlyValLeuValArgProArg355360365GlulieGluArgHisValLeuAlaLeuAspGlyValSerAspValArg370375380ThrValGluThrAlaProThrGlyLeuGluPheLeuAlaAlaVal385Ala390Glu395Thr400ValValGlySerValAspAlaAspThrValArgAlaHisCysAlaAla405410415LeuProGluGinHisArgProSerArglieSerCysAlaSerGluGin420425430GluAlaAlaThrValTyrSerAlaHisGlyLysLeu435440<210>11<211>79<212>PRT<213>Sifr印fo附ycesa"womsATCC25421<400>1ValThrSerLeuGinGluArgLeuAsp35GinAlaPro50lieGluGly65GinArgThrThr5GluLeuAlaGly20SerLeuGluThrGlyArgThrLeu55TrpValThrTrp70ProArgThrProAspGlyValProAsp1015LeuLeuGinGluAspAspProArgArg2530ValValValLeuSerTyrPheAlaArg4045ProGluLeuProAspAlaProArgThr60AlaAspGinArgSerSerAlaSer75<210>12<211>270<212>PRT<213>S5fr印fo附戸sac加o旭ATCC25421<400>1ValAspAlaGluThrProMetAspThrGluThrProArgAspThrGlu151015ThrTyrGinPro65AspArgAlaAlaGlu145LeuValAlaValArg225ProAspProLeulie50GlyAlaLeuAlaPro130GlyHisGluAlaGlu210GlyArgAlaMetVal35ArgHisLeulieThr115AspLeuGlyArgLeu195ArgArgGluProHis20HisAlaGlyArgGly100ArgValAlaThrAsp180ThrAlaValPheAla260ThrGlyTrpArgTyr85AlaProSerAlaArg165PheValAlaValAsn245GlyGlyLeuHisCys70LeuSerAspArgGin150TrpGluProAlaPro230GluProMetLeuGly55ArgValTyrLeuAsp135GinLysArgThrGlu215GlyAlaArgSerGly40ArgArgAlaLeuVal120AlaProArgThrLeu200GinAlaValThrThr25ThrLeuAspValGly105SerPheAlaThrAla185ValAlaGlyGluThr265GlyGlyArgAlaLeu90GlySerLeuLeuLeu170LeuLeuProHisAsp250GinProHisThrAla75GluProLeuSerAla155AspValAsnGlyLeu235PheLysGluThrPro30GlyHisPhe45ValProVal60GluAspTyrArgPheGlyLeuAlaHis110ValLeuThr125LeulieAla140AlaGluTyrAlaValThrArgAlaAla190GlySerLeu205TrpGlyGly220ValGlyHisTrpArgThrGlyAspThr270ThrAlaAspPhePro95ArgGlyGlyGluGly175AspLysArgAspAla255ValAlaLeuAsp80GlyCysPhePheGin160HisValSerValArg240His<210>13<211>400<212>PRT<213>浙取o附ycesw爿rCC25427<400>1MetThrGinAsnSerGinAlaMetThrSerHisAlaMetThrGlyAsp561PheAspSerThr65ProSerArgTyrGlu145lieGlyArgGluAla225GlyLeuSerMetLeu305ThrGlyCysValThrArg50AlaArgGlu匕ysHis130AspArgSerGluThr210AspTyrSerArgLys290MetThrValGluLeuArg35AlaGluLeuCysPhe115HisLysThrMetAsp195TyrPheArgAlaGly275SerSerArglieAlaPro20AlaAlaLeuHisLys100SerGluHisAlaGlu180ProArgAspTyrGlu260AlaArgValGluSer340Arg5GluValValGinThr85MetGlyGlyThrLeu165GinValArgArgVal245LeuThrAspValPro325ProAsnLeuLeuAlaAla70PheCysArgValArg150AspAspThrPheArg230AsnValAlaThrAla310GinGlyAspGluAlaLeu55AlaValSerLysArg135LeuLeuGluMetMet215ValProSerAspThr295PheGluSerGluAspLeu40AlaAlaProMetGlu120GlyAlaGlylieCys200GlyValGlyLeuLeu280ArgThrPheProLysVal25AlaLeuGluLeuArg105lieValSerPheAsp185ValLysSerValVal265SerValCysGinAsp345Ser10ArgGluTrpAlaTyr90LysThrGlyAlaGlu170ValPheThrPheLeu250AlaValGlyProAsp330ValSerAlaGlyGluArg75ThrGlyGluPhePhe155ArgLeuGinSerAsp235ValHisProAspGlu315ValAlaGinGluGluAsp60CysThrAsnGinLeu140ArgValGlyGluVal220ArgGlyGlyArgAsp300GinAlaProPheAlaGlu45ArgGlyAsnHisLeu125ThrlieTyrGluSer205GlyTrpLeuAspMet285AspArgLeuTyrLeuAla30ProSerAlaTyrArg110GluGlyGlyPheTrp190TyrValLeuHisHis270ArgTyrLeuGlyArg350Val15ThrAlalieArgCys95LeulieGluTrpAsn175lieAspProAspAsp255LeuProLeuValLeu335AlaAlaValGluGlyArg80AspAspLeuTyrAla160lieGlyArgLysAla240AspArgAlaArgLeu320AlaGly355360365LeuArgArgProArgHislieLeuGlyArglieGluAlaSerGlyThr370375380ProValAspHisPheValAsnProAlaGlyGluAlaSerArgAlaVal385390395400<210><211><212><213><400>ValAsp1SerGluLysValSerSer501450PRTSfre/f歸ycescrcft/cwusATCC25421AlaAlaHisLeuSerAspLeuAsplieAspAlaLeuGlulie51015PheLeuAspGluSerArgLeuGluAspSerGluValValAla202530MetSerAlaSerCysThrThrCysGluCysCysCysSerCys354045<210>15<211>395<212>PRT<213>S/re/^o附戸sATCC25421<400>1MetArgGinAsnLeuLeuMetlieTyrValHislieProPheCysHis151015SerLysCysThrPheCysAspTrpValGinAlalieProThrLysAspLeuLeuAsp65AspAspValValGly145ArgProGluGlyLeu225GlyProGlyLysAsp305GlyThrLeulieLeuCys50lieGluMetAspSer130ArgAlaAspLeuThr210ArgPhePheSerGly290ValLeuGlyAlaArgArg35AlaProGinSerGlu115SerArgAlaGinPro195PheArgGlyAlaGly275LeuProAlaThrAsp355Leu20LysGluHisGluThr100ArgGlyHisGlyGlu180ValMetGinLeuSer260AlaLeuAlaMetAsp340PheProProlieValThr85ValLysValThrPhe165AlaAsnArgGinSer245MetlieHisGlyPhe325LeuLeuArgGlyAlaLeu70AlaAlaLeuGinAla150GluAspHisArgAla230GluTyrSerSerGin310AspAlaArgAspAspGlu55TyrAlaGluAlaSer135GluAspGluLeuArg215LeuTyrPheLeuTyr295AspGlyGluGlylieSer40ArgTrpValAlaPhe120PheGinValLeuSer200MetPheAlaGinVal280ValArglieValArg360Ala25ValGlyGlyMetThr105TyrAspAlaSerAsp185LeuAspThrAsnHis265AspAspValProLeu345GlyGlyArgAlaGlyGlu90lieArgAspGlylie170ArgTyrSerArgGly250ArgGinAspLeuArg330LeuLeuLeuGinMetGly75AlaGluGlyAspArg155AspThrSerSerAla235TyrAlaArgProVal315GluArgValThrLysHis60ThrLeuCysLeuArg140lielieValPheGlu220ArgPheAspPheLeu300SerAspProGluLeuTyr45ArgAlaHisSerGly125LeuValMetAspArg205ArgArgGlyThrLys285AlaLeuTrpThrAsp365lie30lieAlaSerSerPro110PheArgHisSerArg190ProArgAlaLysVal270SerPheLeuArgVal350AspGluSerAlaSerSer95AspAsnArgAlaGly175AlaThrThrlieVal255GlyHisAspGinGin335AlaHisLeuAlaGlyLeu80PheThrArgLeuAla160PheLeuProTyrGlu240SerLeuGinlieAla320ArgProGlyAla59370375PheGluMetAlaMetSerGinProGluLeuVal385390395380<210><211><212><213><400>ValThrGlyAlaProAlaGluPro50AlaAla65AspLeuLeuGlyLeuAlaAlaAla130AlaGlu145SerAlaGinTrpArgSerAlaGlu210GluArg16370PRTiSfre/^簡ycesac加05mATCC25421SerGlyProGlyGinAlaProAlaGlu510AlaTrpLeuGlulieGlyLeuAspAla2025LeuValAlaGlyValValArgProLeu3540GlyAlaGluProValProGlyPhePhe55GinProAlaLeuValValGinLeuGlu7075AlaGluProTyrAlaAlaArgAlaArg8590LeuProValGinValAlaAlaGlyArg100105GlySerValPheAlaGlyAlaAlaLeu115120LeuAlaAlaValCysProAlaLeuLeu135GinGlyArgProAlaLeuLeuAlaSer150155HisLeuArgAlaValSerValSerAla165170GluGluLeuArgGluGlyValProLeu180185HisAlaGluAlaPheLeuAlaSerSer195200AlaMetMetAspAlaLysTyrThrArg215LeuValAspGlyValLeuThrGinCysAlaAlaHisAlaAla15ProAlaAspAlaVal30LeuArgGluProAla45LeuArgGlyValGly60ValThrProGlyThr80AlaLeuAlaAlaGly95AlaThrLeuValPro110GlyProValThrArg125ThrAlaThrGluAla140AlaAlaGluLeuMet160AlaProGlyProArg175GlyPheLeuSerTyr190ArgAspProLysAla205AlaAlaAlaThrLeu220GluGluArgGlyPro60225ValLysAspSerAsp305SerArgAspAlaValProThrGlu290PheLeuTyrThrSer370SerAlaGlu275SerLeuLeuPheAsp355LeuVal260GluAlaAspTyrLeu340AlaPro245ThrGinPheArgLeu325CysLeu230AlaGluProHisAsp310SerTyrThrArgLeuProArg295ProLeuAlaValGinPheAsp280lieSerSerValLeu360TrpArg265ThrValPheSerSer345SerTyr250AlaGlyGluLeuVal330ArgGly235GluGlyProGlyAla315GlyAlaLeuAlaMetThrAspAspGly285SerAsp300ThrArglieAlaCysGluAlaArg365ArgLeu270LysGlyLeuLeuSer350ThrAla255AlaGlyLeuLeuAla335lieSer240AlaLeuLeuArgThr320GluPheLeu<210>17<211>323<212>PRT<213>Str印fcw^cesac加as"sATCC25421<400>1VallieProAlaGlyArgArgThrAlaArgSerSerArgAlaHisAla151015AlaProCysArgValCysArgPheProHisValAlaSerThrHisArg202530GluMetArgCysArgGinHisGlyArgSerThrCysAlaProProGin354045ArgGlySerSerMetGlulieAspValLeuGlyProLeuGluValSer505560GinLysSerAlaSerlieValProThrAlaSerLysProArgThrVal65707580LeuAlaMetLeuAlaValTyrThrAsnArgLeuValProLeuProSer859095LeuMetGlyGluLeuTrpGlyProGluProProAlaThrAlaLysThr100105110AlaValGinGlyTyrlieLeuHisLeuArgLysArglieAlaGluSer115120125AlaAlaArgArgProProGlyGinPheProGluAlaLysAsplieLeu130135140ValThrLeuProGlyGlyTyrLeuLeuArgAlaProGlyThrAlaVal145150155160ValLeuGluGinPheGluGinLeuAlaCysAlaGlyHisArgAlaArg165170175GluLysGlyAspPheGluAlaAlaSerArgSerPheThrGluAlaLeu180185190GlyLeuTrpArgGlyArgAlaLeuAlaAspValGluValGlyProGin195200205LeuGlylieGluValGinArglieGluGluAlaArgLeuAsnValLeu210215220AspArgArglieGluAlaAspLeuArgLeuGlyArgHisHisGluLeu225230235240LeuGlyGluLeuArgSerValThrAlaHisHisProThrHisGluGly245250255PheCysAlaHisLeuMetLeuAlaLeuTyrArgSerGlyArgArgCys260265270GluAlaLeuAspAlaTyrGinArgMetArgThrThrLeuValAsnGlu275280285LeuGlyLeuGluProSerProSerLeuArgArgLeuGinArgSerLeu290295300LeuValSerAspArgGluLeuAspGluLeuAsnValThrTrpAspVal305310315320AlaThrPhe权利要求1.一种抗革兰氏阳性菌活性的抗生素-诺丝七肽的生物合成基因簇,其特征在于编码诺丝七肽生物合成所涉及的16个基因,具体为1)1个功能未知蛋白基因,即nosAnosA位于基因簇核苷酸序列第2704-2249个碱基处,长度为456个碱基对,编码一个功能未知蛋白,151个氨基酸;2)细胞色素P450氧化酶基因,即nosBnosB位于基因簇核苷酸序列第4068-2701个碱基处,长度为1368个碱基对,编码细胞色素P450氧化酶,455个氨基酸;3)类P450氧化酶基因,即nosCnosC位于基因簇核苷酸序列第5309-4083个碱基处,长度为1227个碱基对,编码P450氧化酶,408个氨基酸;4)脱水酶基因,即nosDnosD位于基因簇核苷酸序列第个6365-5328碱基处,长度为1038个碱基对,编码脱水酶,345个氨基酸;5)脱水酶基因,即nosEnosE位于基因簇核苷酸序列第个9114-6352碱基处,长度为2763个碱基对,编码脱水酶,920个氨基酸;6)NADH依赖的脱氢酶基因,即nosFNosF位于基因簇核苷酸序列第10778-9129个碱基处,长度为1650个碱基对,编码甲基基转移酶,549个氨基酸;7)与Nosiheptide主链生物合成相关但具体功能未知的基因,即nosGnosG位于基因簇核苷酸序列第12800-10830个碱基处,长度为1971个碱基对,编码一个未知功能蛋白,656个氨基酸;8)与Nosiheptide主链生物合成相关但具体功能未知的基因,即nosHnosH位于基因簇核苷酸序列第14761-12797个碱基处,长度为654个碱基对,编码一个未知功能蛋白,654个氨基酸;9)乙酰辅酶A合成酶基因,即nosInosI位于基因簇核苷酸序列第16097-14763个碱基处,长度为1335个碱基对,编码乙酰辅酶A合成酶,444个氨基酸;10)与Nosiheptide侧链生物合成相关但具体功能未知的基因,即nosJnosJ位于基因簇核苷酸序列第16297-16058个碱基处,长度为240个碱基对,编码一个未知功能蛋白,79个氨基酸;11)水解酶基因,即nosKnosK位于基因簇核苷酸序列第17106-16294个碱基处,长度为813个碱基对,编码水解酶,270个氨基酸;12)与侧链合成相关的SAM自由基蛋白基因,即nosLnosL位于基因簇核苷酸序列第18316-17114个碱基处,长度为1203个碱基对,编码一个SAM自由基蛋白,400个氨基酸;13)Nosihepide前体肽基因,即nosMnosM位于基因簇核苷酸序列第18668-18820个碱基处,长度为153个碱基对,编码Nosiheptide前体肽,50个氨基酸;14)SAM依赖的甲基转移酶基因,即nosNnosN位于基因簇核苷酸序列第18891-20078个碱基处,长度为1188个碱基对,编码SAM依赖的甲基转移酶,395个氨基酸;15)与Nosiheptide后修饰相关具体功能未知基因,即nosOnosO位于基因簇核苷酸序列第20075-21187个碱基处,长度为1113个碱基对,编码一个具体功能未知的蛋白,370个氨基酸;16)SARP家族调控基因,即nosPnosP位于基因簇核苷酸序列第21497-22468个碱基处,长度为972个碱基对,编码SARP家族调控基因,323个氨基酸。2.根据权利要求1所述的诺丝七肽的生物合成基因簇的用途,其编码蛋白用于催化合成抗生素诺丝七肽及其类似物、或者催化合成含噻唑、噻唑啉、吡啶杂环或甲基吲哚酸结构单元的大环骨架。3.根据权利要求2所述的诺丝七肽的生物合成基因簇的用途,其特征在于由核糖体依据所述的诺丝七肽的生物合成基因簇中编码诺丝七肽前体肽的基因合成出的相应的聚肽是诺丝七肽的前体肽;该前体肽经由后修饰酶的催化反应生成诺丝七肽。4.根据权利要求1所述的诺斯七肽的生物合成基因簇的编码蛋白用于催化合成抗生素诺斯七肽及其类似物。5.根据权利要求3所述的诺斯七肽的生物合成基因簇的编码蛋白用于催化合成含噻唑、噻唑啉、吡啶杂环、吲哚酸结构单元的大环骨架。全文摘要本发明涉及诺丝七肽的生物合成基因簇,具体说是一种由链霉菌产生的具有抗革兰氏阳性菌抗生素—诺丝七肽(Nosiheptide)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含16个基因6个与Nosiheptide大环生物合成相关基因,5个与侧链生物合成相关基因,4个与翻译后修饰相关基因,1个调控基因。通过对上述生物合成基因的遗传操作可阻断诺丝七肽的合成。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。文档编号C12N15/52GK101586112SQ20091005342公开日2009年11月25日申请日期2009年6月19日优先权日2009年6月19日发明者莹丁,文刘,廖日晶,炼段,沂虞,春雷申请人:中国科学院上海有机化学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1