本发明涉及双重作用的利用乳酸(la)的细菌,其被遗传修饰以分泌多糖降解酶,如纤维素酶、半纤维素酶和淀粉酶,用于处理有机废物以除去废物中存在的乳酸并降解复合多糖,由此为工业发酵方法提供底物,产生各种生物化学品,包括特定的乳酸对映体。
背景技术
近年来,由于能够在生物塑料的制造中使用乳酸作为基础材料,乳酸发酵,即通过微生物发酵从碳水化合物来源生产乳酸,已经引起人们的兴趣。乳酸可以聚合形成可生物降解和可回收的聚酯聚乳酸(pla),其被认为是由石油制造的塑料的潜在替代品。pla用于制造各种产品,包括食品包装、一次性用品、纺织品和卫生用品产业的纤维等。
由于各种考虑因素,包括环境问题、成本和通过化学合成产生对映体纯的乳酸的困难,通过发酵生物过程产生乳酸优于化学合成方法,这是大多数工业应用所需的。常规的发酵方法典型地基于产乳酸微生物在分批、补料分批、连续或半连续反应器中的厌氧发酵,例如乳杆菌属的细菌,其产生乳酸作为碳水化合物发酵的主要代谢终产物(abdel-rahmanetal.(2013)biotechnologyadvances,31:877–902;ghaffaretal.(2014)journalofradiationresearchandappliedsciences,7(2):222–229)。为了生产pla,通过各种方法将发酵过程中产生的乳酸与发酵液分离,例如包括溶剂萃取、电渗析、蒸馏的方法,或一种或多种方法组合。然后将纯化的乳酸进行聚合。
乳酸具有手性碳原子,因此以两种对映体形式存在,即d-和l-乳酸。为了产生适用于工业应用的pla,聚合方法应仅使用一种对映体。存在杂质或d-和l-乳酸的外消旋混合物导致聚合物具有不希望的特性,例如低结晶度和低熔融温度。因此,需要仅产生l-乳酸对映体或仅产生d-乳酸对映体的乳酸菌。
在目前可用的商业方法中,碳水化合物来源通常是含淀粉的可再生来源,例如玉米和木薯根。也已提出另外的来源,例如富含纤维素的甘蔗渣。典型地,乳酸菌可以利用还原糖如葡萄糖和果糖,但不具有降解多糖如淀粉和纤维素的能力。因此,为了利用这种多糖,该方法需要加入糖酵解酶,典型地与化学处理组合,以降解多糖并释放还原糖。
sakaietal.,2004journalofindustrialecology,7(3-4):63-74报道了一种市政食物废物回收系统,它结合发酵和化学方法生产聚l-乳酸(plla)。食物废物典型地包括不同比例的还原糖(葡萄糖,果糖,乳糖等)、淀粉和木质纤维素材料。sakai等人的方法包括用葡糖淀粉酶进行切碎和灭菌食物废物的处理,以将食物废物中的淀粉降解成可溶性葡萄糖,使用形成l-乳酸的细菌进行l-乳酸发酵,以及纯化和聚合步骤以获得plla。对于sakai等人使用的特定碳水化合物来源,即食物废物,由于食物废物含有为了获得最终的纯l-或d-乳酸而需要除去的内源性d-、l-乳酸(例如来自乳制品),因此该过程很复杂。因此,sakai等人的方法进一步包括在乳酸发酵步骤之前通过消耗乳酸作为碳源的丙酸杆菌从食物废物中除去内源性d-、l-乳酸。sakai等人的方法仅利用食物废物中50%的碳含量,并转化为乳酸。此外,虽然食物废物含有还原糖、淀粉和木质纤维素,但sakai等人的方法没有使用后者,因为乳酸菌不能直接利用这种碳水化合物来源。
us7,507,561公开了一种由可再生农业原料发酵生产聚乳酸的方法,该原料包含用作原料的糖蜜或甘蔗渣。
us8,119,376公开了一种生产乳酸或其盐的方法,其中淀粉经历同时糖化和发酵的过程,该方法包括在至少包含葡糖淀粉酶的培养基中糖化淀粉并同时使用微生物发酵淀粉,任选地从培养基中分离乳酸,其特征在于使用产生中等嗜热性乳酸的微生物。本发明进一步涉及在产生中等嗜热性乳酸的微生物存在下实施所述过程的方法,该微生物已适应了在工作ph下具有其最大性能。
ep2843039公开了一种制备产生d-乳酸的菌株的方法,该菌株经过修饰以抑制l-乳酸脱氢酶(l-ldh)活性并在产生l-乳酸的菌株中引入d-乳酸脱氢酶(d-ldh)活性;通过上述方法制备的突变的生产d-乳酸的菌株,和生产d-乳酸的方法,包括培养该菌株和从培养基中回收d-乳酸的步骤。
wo2011/098843公开了一种生产乳酸或其盐的方法。该方法描述了淀粉材料同时进行淀粉糖化以及由所选择的产生淀粉分解酶的细菌将其糖发酵成乳酸。
moraisetal.,2013appliedandenvironmentalmicrobiology,79(17):5242–5249报道了将编码纤维素酶或木聚糖酶的基因导入植物乳杆菌,并建立了分泌纤维素酶和木聚糖酶的双菌株细胞联合体。在麦秆中评估细胞联合体的酶活性。
wo2015011250公开了用于通过细菌产生和分泌目的物质的载体及其应用。
wo2015/097685公开了用于加工木质纤维素的乳酸细胞培养物。细菌培养物可包含生物质组合物和乳酸菌群,其包含:(i)第一种乳酸菌群,其已被遗传修饰以表达分泌的纤维素酶;和(ii)第二种乳酸菌群,其已被遗传修饰以表达分泌的木聚糖酶,其中选择第一群体:第二群体的比例,使得培养物中纤维素酶:木聚糖酶的比活性大于4:1或小于1:4。
wo2015/097686公开了乳酸菌培养物、细胞群和包含其的用于从木质纤维素产生乙醇的制品。
迄今描述的由可再生资源生产乳酸的方法具有许多缺点,例如碳—乳酸转化率低,需要许多单独步骤的复杂程序,成本相对高,和可以使用的碳水化合物来源有限。另外,一些方法是不利的,因为使用作为人类食物具有高价值的源材料。
因此需要用于有效处理各种含碳水化合物的来源的细菌、组合物和方法,例如包括富含淀粉的材料、富含木质纤维素的材料或其组合的有机废物,以获得适合用于工业发酵方法的大量可溶性还原糖。
技术实现要素:
根据一些方面,本发明提供了利用乳酸(la)的细菌,其被基因工程改造以产生一种或多种多糖降解酶,特别是糖苷水解酶,例如纤维素酶、半纤维素酶和淀粉酶。本文公开的基因工程改造的双重作用的利用la的细菌,除了它们选择性地消耗和代谢乳酸的天然能力,在某些条件下基本上不利用其他还原糖之外,还促进有机废物(例如食物和农业废物)中发现的复杂多糖的降解。这种利用la的基因工程细菌令人惊讶地提供了用于处理有机废物的改进方法,使废物糖化并除去废物中存在的内源性乳酸。然后,经处理的废物可用作工业发酵方法中的底物,特别是由产乳酸微生物生产特定的分离的乳酸对映体。
本文公开的利用la的细菌有利于处理各种有机废物,包括各种各样的食物废物以及植物材料和人造材料,例如纸。在一些实施方案中,本文公开的利用la的细菌特别适用于商业、工业和市政来源的混合食物废物。本文公开的利用la的细菌能够有效且成本效率高地处理有机废物,并且根据一些实施方案,有效且成本效率高地生产乳酸,其特征在于与其他方法相比碳—乳酸转化率提高。本文公开的利用la的细菌的其它优点是当用于处理废物时,该方法不需要向处理物中添加外来降解酶,因为这种酶由该细菌产生。因此,通过避免添加这种外来酶的需要(即,将酶添加到处理所发生的容器中),实现了有利的过程,其具有更高的成本效率并且更加稳健,因为污染的风险(包括向处理物中添加外来酶混合物)显著降低。另外,通过利用本文公开的利用la的细菌处理废物,实现了加工废物的粘度降低,因为糖化(通过细菌产生的降解酶实现)降低了粘度。这允许更有效地混合废物并引起终产物产量增加,例如分离的乳酸对映体。
根据一个方面,本发明提供了一种利用乳酸(la)的细菌,其被遗传修饰以表达和分泌一种或多种外源多糖降解酶,其中所述一种或多种外源多糖降解酶包括纤维素酶、半纤维素酶、淀粉酶或其组合。
如本文所用的术语“外源的”,当提及由利用la的细菌表达的多糖降解酶时,表明该多糖降解酶由导入所述细菌细胞的外源核酸编码。在一些实施方案中,所述外源多糖降解酶由导入所述细菌中的核酸编码,并且能够由所述细菌细胞分泌。在一些实施方案中,所述核酸可以在所述细菌中瞬时表达(即利用导入所述细菌中的表达载体)。在一些实施方案中,所述核酸可以整合到所述细菌的基因组中。在一些实施方案中,所述外源多糖降解酶不是天然存在于这些细菌中或不能天然地从其中分泌。
如本文所用的“多糖降解酶”是指催化糖类分解的水解酶(或其酶活性部分),包括双寡糖、低聚糖、多糖和糖复合物,选自糖苷水解酶、多糖裂解酶和碳水化合物酯酶组成的组。每种可能性代表本发明的单独实施方案。用于本发明的多糖降解酶选自对有机废物中发现的糖类(例如多糖)具有活性的酶,有机废物包括食物废物和植物材料。在一些实施方案中,多糖降解酶可以是修饰酶(即,已经被修饰并与其相应的野生型酶不同的酶)。在一些实施方案中,所述修饰可以包括导致酶的活性提高的一种或多种突变。在一些实施方案中,多糖降解酶是野生型(wt)酶。
在一些实施方案中,所述利用la的细菌选自丙酸杆菌属(propionibacterium)物种、巨球形菌属(megasphaera)物种、月形单胞菌属(selenomonas)物种和韦荣氏球菌属(veillonella)物种组成的组。每种可能性代表本发明的单独实施方案。在一些实施方案中,所述利用la的细菌是丙酸杆菌属(propionibacterium)物种。在一些具体实施方案中,利用la的细菌是费氏丙酸杆菌(propionibacteriumfreudenreichii)。
根据另一方面,本发明提供了利用乳酸(la)的细菌群,其被遗传修饰以表达和分泌包括纤维素酶、半纤维素酶、淀粉酶或其组合的多种外源多糖降解酶,其中所述细菌群包含多个利用la的细菌亚群,其中每个亚群被遗传修饰以表达和分泌不同的多糖降解酶。
例如,在一些实施方案中,提供了利用la的细菌群,其被遗传修饰以表达和分泌多种多糖降解酶,其中所述细菌群包含:
第一个利用la的细菌亚群,被遗传修饰以表达和分泌第一种多糖降解酶;
第二个利用la的细菌亚群,被遗传修饰以表达和分泌第二种多糖降解酶;和
第三个利用la的细菌亚群,被遗传修饰以表达和分泌第三种多糖降解酶,
其中所述第一种多糖降解酶是纤维素酶,所述第二种多糖降解酶是半纤维素酶,所述第三种多糖降解酶是淀粉酶。在一些实施方案中,所述半纤维素酶是木聚糖酶。
在一些实施方案中,所述亚群是相同细菌物种的亚群。在其他实施方案中,所述亚群是不同细菌物种的亚群。
在一些实施方案中,所述利用la的细菌选自丙酸杆菌属物种、巨球形菌属物种、月形单胞菌属物种和韦荣氏球菌属物种组成的组。在一些实施方案中,所述利用la的细菌选自丙酸杆菌属。在一些具体实施方案中,丙酸杆菌所述是费氏丙酸杆菌。
根据本发明使用的多糖降解酶可以是细菌酶。在一些实施方案中,所述多糖降解酶来自嗜热细菌。在一些实施方案中,所述嗜热细菌选自梭菌属物种(clostridiumsp.)、类芽孢杆菌属物种(paenibacillussp.)、褐色喜热裂孢菌(thermobifidafusca)、芽孢杆菌属物种(bacillussp.)、地芽孢杆菌属物种(geobacillussp.)、色盐杆菌属物种(chromohalobactersp.)和海洋红嗜热盐菌(rhodothermusmarinus.)组成的组。每种可能性代表本发明的单独实施方案。
在其他实施方案中,所述多糖降解酶来自嗜温细菌。在一些实施方案中,所述嗜温细菌选自克雷伯氏菌属物种(klebsiellasp.)、cohnella物种(cohnellasp.)、链霉菌属物种(streptomycessp)、解纤维素醋弧菌(acetivibriocellulolyticus)、白色瘤胃球菌(ruminococcusalbus);芽孢杆菌属物种(bacillussp.)和发酵乳杆菌(lactobacillusfermentum)组成的组。每种可能性代表本发明的单独实施方案。
在另外的实施方案中,所述多糖降解酶是真菌酶。在一些实施方案中,所述真菌选自里氏木霉(trichodermareesei),特异腐质霉(humicolainsolens),尖孢镰刀菌(fusariumoxysporum),米曲霉(aspergillusoryzae),瘿青霉(penicilliumfellutanum)和棉状嗜热丝孢菌(thermomyceslanuginosu)组成的组。每种可能性代表本发明的单独实施方案。
在一些实施方案中,选择被改造导入利用la的细菌中的所述多糖降解酶,使得它们在与所述利用la的细菌生长最佳的温度和ph范围相同的温度和ph范围内具有最佳活性。如本文所用,对于所述利用la的细菌的生长而言最佳的温度和ph范围也表示所述利用la的细菌选择性消耗乳酸作为碳源的温度和ph(如果选择性消耗需要特定条件)。
在其他实施方案中,选择所述多糖降解酶使得它们在不同于所述利用la的细菌生长的最佳温度和ph范围的温度和/或ph范围内具有最佳活性。例如,在一些实施方案中,所述多糖降解酶在高于所述利用la的细菌的最佳生长温度的温度下具有最佳活性。在另外的实施方案中,所述多糖降解酶在ph高于/低于所述利用la的细菌的最佳生长ph的ph下具有最佳活性。在一些实施方案中,所述多糖降解酶在所述利用la的细菌失活的温度和/或ph范围内具有最佳活性。
在一些实施方案中,所述利用la的细菌可以选择性地消耗乳酸,直到后者基本上耗尽并且此后才能消耗(发酵)还原糖。
根据另一方面,本发明提供了一种处理有机废物的方法,该方法包括在利用la的细菌消耗乳酸并且适合一种或多种多糖降解酶的表达和活性的条件下,使有机废物接触本发明所述利用la的细菌,该细菌被遗传修饰以表达和分泌所述一种或多种外源多糖降解酶,其中所述处理从有机废物中除去d-乳酸、l-乳酸或两者并且至少部分降解多糖以释放还原糖。在一些实施方案中,该处理在单容器(一锅法)中进行。
根据另一方面,本发明提供了一种处理有机废物的方法,该方法包括在利用la的细菌消耗乳酸并且适合多种多糖降解酶的表达和活性的条件下,使有机废物接触本发明的利用la的细菌群,所述细菌群被遗传修饰以表达和分泌所述多种多糖降解酶,其中所述处理从有机废物中除去d-乳酸、l-乳酸或两者并且至少部分地降解多糖以释放还原糖。在一些实施方案中,该处理在单容器(一锅法)中进行。
如本文所用,当提及从有机废物中“除去”d-乳酸、l-乳酸或两者时,“除去”是指减少至残留量,使得不会干扰生产分离的乳酸对映体的下游过程,并且随后聚合成适用于工业应用的聚乳酸。“残留量”表示小于约5%的乳酸,优选小于约3%,更优选小于约1%,甚至小于约0.5%的乳酸(w/w)。
用于本发明方法的有机废物包括复合多糖,包括淀粉、纤维素、半纤维素及其组合。在一些实施方案中,所述有机废物选自食物废物、市政废物、农业废物、植物材料及其组合。根据本发明的食物废物包括植物来源的食物废物。根据本发明的食物废物包括家庭食物废物、商业食物废物和工业食物废物。根据本发明的植物材料包括农业废物和人造产品,例如纸废物。
还原糖典型地包括c5糖(戊糖)、c6糖(己糖)或其组合。在一些实施方案中,所述还原糖包括葡萄糖。在一些实施方案中,所述还原糖包括木聚糖。
在一些实施方案中,糖化(多糖降解为可溶性还原糖)和从废物中除去乳酸相伴进行。根据这些实施方案,对所述利用la的细菌进行遗传修饰以表达和分泌在相同温度和ph范围内具有最佳活性的多糖降解酶,所述温度和ph范围对于利用la的细菌的生长是最佳的。根据这些实施方案,该方法包括在最适合所述利用la的细菌的生长和多糖降解酶的分泌的温度和ph下使有机废物接触所述利用la的细菌。接触足够的时间以从废物中除去乳酸(d-,l-或两者)并获得所需水平的还原糖。
在其他实施方案中,从废物中除去乳酸(在糖化之前)与糖化分开进行。根据这些实施方案,对所述利用la的细菌进行遗传修饰以表达和分泌多糖降解酶,该酶在与利用la的细菌生长的最佳温度和/或ph范围不同的温度和/或ph范围内具有最佳活性。
在一些实施方案中,除去废物中存在的d-乳酸、l-乳酸或其组合与降解废物中的多糖的相伴或相继进行。
在一些实施方案中,所述多糖降解酶在高于所述利用la的细菌的最佳生长温度的温度下具有最佳活性。根据这些实施方案,该方法包括:(i)在适合所述利用la的细菌生长和所述多糖降解酶表达的第一温度下,使所述有机废物与所述利用la的细菌接触足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和(ii)将温度升至第二温度,所述第二温度对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在第二温度下失活。
在一些实施方案中,所述多糖降解酶可以在高于/低于所述利用la的细菌的最佳(或其他合适的)生长ph的ph下具有最佳(或增强的)活性。根据这些实施方案,该方法包括:(i)在适合所述利用la的细菌生长和所述多糖降解酶表达的第一ph下,使所述有机废物与所述利用la的细菌接触足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和(ii)将ph降低/升高至第二ph,第二ph对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在第二ph下失活。
在一些实施方案中,所述方法还包括在所述接触之前测定所述有机废物中淀粉、纤维素和半纤维素中的至少一种的百分比,并根据测定的百分比选择待与所述有机废物接触的所述利用la的细菌或所述利用la的细菌群。在一些实施方案中,所述测定还包括测定可溶性还原糖的百分比。
根据另一方面,本发明提供了一种由有机废物制备分离的乳酸对映体的方法,该方法包括:
(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合和至少部分降解废物中的多糖以释放可溶性还原糖,通过在适合所述利用la的细菌消耗乳酸和适合所述多糖降解酶表达和活性的条件下,使所述有机废物接触被遗传修饰以表达和分泌多糖降解酶的本发明的所述利用la的细菌或本发明的所述利用la的细菌群;
(ii)灭活所述利用la的细菌;
(iii)用仅产生d-乳酸和l-乳酸之一的产乳酸微生物发酵(i)中得到的可溶性还原糖,得到分离的乳酸对映体;和
(iv)从发酵液中回收分离的乳酸对映体。
典型地,发酵步骤在厌氧或微需氧条件下进行。发酵步骤典型地选自分批、补料分批、连续和半连续发酵。每种可能性代表本发明的单独实施方案。
在一些实施方案中,所述多糖降解酶可以在不同于所述利用la的细菌生长最佳的(或其他合适的)温度/ph范围的温度和/或ph范围内具有最佳(或其他合适的)活性。根据这些实施方案,适合所述利用la的细菌消耗乳酸和所述多糖降解酶表达的条件不同于适合酶活性的条件。根据这些实施方案,步骤(i)包括:在适合所述利用la的细菌消耗乳酸和所述多糖降解酶表达的第一温度/ph下,接触有机废物足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和将温度/ph调节至第二温度/ph,所述第二温度/ph对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在所述第二温度/ph下失活。
在一些实施方案中,所述产乳酸微生物是细菌。在一些实施方案中,所述产乳酸细菌是乳杆菌属(lactobacillus)。在其他实施方案中,所述产乳酸细菌是芽孢杆菌属(bacillus)。
在一些实施方案中,所述产乳酸细菌是不同物种的乳酸菌的联合体。
回收乳酸典型地包括从发酵液中分离乳酸和纯化乳酸。乳酸的分离和纯化可以通过本领域已知的方法进行。
该方法典型地还包括预处理所述有机废物以减小颗粒大小和增加表面积,以及灭活废物中的内源细菌。预处理在用所述利用la的细菌处理废物之前进行。在一些实施方案中,所述有机废物在用所述利用la的细菌处理之前经历切碎、粉碎和灭菌。
灭菌可以通过本领域已知的方法进行,包括例如高压蒸汽、uv辐射或超声处理。
在一些实施方案中,该方法还包括在处理所述有机废物之前分析其组成,特别是糖含量。在一些实施方案中,该方法包括分析所述有机废物中淀粉、纤维素和半纤维素中至少一种的百分比。在另外的实施方案中,该方法包括分析还原糖的百分比。
在一些实施方案中,该方法还包括测定在发酵步骤之前由所述多糖降解酶释放的总可溶性还原糖的量。
在一些实施方案中,提供了一种从有机废物生产立体特异性乳酸的方法。如本文所用的关于乳酸的术语“立体特异性”是指乳酸的对映体(或分离的对映体)。
根据一些实施方案,本文公开的所述利用la的细菌可以进一步有利地用于增加从有机废物制备乳酸的总产率,通过所述利用la的细菌再次处理残留乳酸(其在从发酵液中回收乳酸后作为残留物保留)使乳酸再循环和用于培养产la微生物,从而产生高量多糖降解酶用于下一个乳酸生产循环。
根据另一方面,本发明提供了一种从有机废物制备聚乳酸的方法,该方法包括通过上述方法制备分离的乳酸对映体,并且还包括使分离的乳酸对映体聚合成聚乳酸。
在一些实施方案中,本发明提供了从有机废物制备聚乳酸的方法,该方法包括通过上述方法制备立体特异性乳酸,并且还包括将所述立体特异性乳酸聚合成聚乳酸。
根据另外的方面,提供了用于由丙酸杆菌表达和分泌外源多糖降解酶的表达载体,所述载体包含:
至少一种编码丙酸杆菌复制蛋白的核苷酸序列;
至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包含:
至少一种启动子核酸序列,其可操作地连接至:
至少一种编码丙酸杆菌信号肽(sp)的核酸序列,其翻译融合至:
至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解酶的核酸序列。
在一些实施方案中,所述编码丙酸杆菌复制蛋白的核苷酸序列包含seqidnos:84的核酸序列。在一些实施方案中,所述启动子核酸序列可选自seqidnos:27-32及其同源物组成的组。在一些实施方案中,sp氨基酸序列可选自seqidnos:87-179组成的组。在一些实施方案中,所述多糖降解酶序列可选自seqidnos:14-26及其同源物组成的组。在一些实施方案中,所述表达盒可包含seqidnos:33-49和/或其同源物中任一个所示的核酸序列,或由其组成。
在进一步的实施方案中,提供了包含表达载体的利用乳酸(la)的丙酸杆菌。
在一些实施方案中,提供了表达盒,其包含seqidnos:33-49中任一个所示的序列和/或其同源物,或由其组成。在进一步的实施方案中,提供了包含该表达盒的利用乳酸(la)的丙酸杆菌。
根据下面的详细说明书、实施例和权利要求,本发明的这些和其它方面和特征将变得显而易见。
附图说明
示例性实施例在参考附图中示出。通常选择附图中所示的部件和特征的尺寸是为了方便和清楚地呈现,并且不一定按比例示出。附图如下列出。
图1-根据一些实施方案的发酵系统的示意图,该发酵系统用于产生光学纯的乳酸和残留乳酸废物的再循环;
图2a-根据一些实施方案的载体的示意图;
图2b-根据一些实施方案的表达载体的示意图;
图3-对照lugol试验的象形图-在暴露于lugol溶液后含有yel培养基和0.5%淀粉的琼脂平板。所有含淀粉的区域都呈黑色。一圈降解淀粉(由葡糖淀粉酶降解)表现为无色。
具体实施方式
本发明首次公开了被遗传修饰以产生各种外源多糖降解酶的利用la的细菌,特别是能够降解存在于有机废物中的复合多糖的酶,例如食物废物和木质纤维素废物。本文公开的利用la的细菌特别有利于在废物作为生产分离的乳酸对映体的底物之前,用于处理各种来源的有机废物。这种利用la的基因工程细菌令人惊讶地提供了用于处理有机废物的改进方法,使得能够除去废物中存在的内源性乳酸以及废物的糖化。因此,本发明的新型双重作用细菌能够在“单容器”(“一锅”)方法中一起进行两个阶段的处理。“单容器方法”能够使用一个容器(例如,反应器,发酵罐或其他合适的操作单元)而不是两个容器,从而获得更经济的工业方法。这使得在一个反应器(一个容器)中伴随地进行两个阶段成为可能。由于这两个阶段有时可能具有不同的最佳反应温度和ph,因此有时推荐按顺序实施一锅法,首先除去废物中存在的内源性乳酸(在其最佳温度和ph下实施),然后在同一反应器中糖化废物,但是在糖化最佳的温度和ph下。
遗传修饰的利用乳酸(la)的细菌
利用la的细菌根据本发明被改造以产生一种或多种外源多糖降解酶。如本文使用的涉及外源多糖降解酶的“产生”表示表达(在细胞内产生蛋白)和任选的分泌。在一些实施方案中,将所述一种或多种外源多糖降解酶作为分泌酶改造到细菌中。根据这些实施方案,所述利用la的细菌被遗传修饰以表达和分泌一种或多种外源多糖降解酶。在其他实施方案中,将一种或多种外源多糖所述降解酶作为非分泌酶改造到细菌中,仅在所述利用la的细菌细胞裂解后才对有机废物中的多糖具有活性。根据这些实施方案,所述利用la的细菌被遗传修饰以表达一种或多种外源多糖降解酶。
用于根据本发明遗传修饰的利用la的细菌可选自丙酸杆菌属物种、巨球形菌属物种、月形单胞菌属物种和韦荣氏球菌属物种。每种可能性代表本发明的单独实施方案。
用于根据本发明遗传修饰的合适的利用la的细菌典型的特征在于具有明确的温度和/或ph范围,在该范围内它选择性消耗乳酸作为碳源。如本文所用,关于利用la的细菌消耗乳酸作为碳源的“选择性”表明细菌消耗乳酸而不消耗其环境中可用的还原糖,或者以非常慢的速度消耗可用的还原糖,以至于在数小时的时间内消耗水平不显著。因此,当在选择性消耗乳酸的条件下与有机废物接触时,所述利用la的细菌基本上从废物中除去乳酸而不影响废物中存在的还原糖的量。或者,合适的利用la的细菌选择性消耗乳酸作为碳源,而不管其环境中的特定条件和还原糖的存在。
在一些具体实施方案中,所述利用la的细菌是费氏丙酸杆菌。费氏丙酸杆菌的特征在于在某些条件下选择性消耗乳酸作为碳源,例如酸性条件(最佳ph值在ph=5.5-6.5范围内,例如ph=5.5)。
根据本发明的用于遗传修饰的利用la的细菌可以是仅消耗乳酸对映体之一的细菌,或消耗两者的细菌。
在一些实施方案中,本发明的遗传修饰的利用la的细菌典型地包含表达载体,所述表达载体包含编码多糖降解酶的多核苷酸序列。在一些实施方案中,所述表达载体包含编码多糖降解酶和融合在框架内的信号肽的多核苷酸序列,使得在多核苷酸序列转录和翻译时产生分泌的多糖降解酶。在一些实施方案中,所述表达载体还包含合适的选择启动子。在一些实施方案中,本发明的遗传修饰的利用la的细菌包含编码整合到其基因组中的多糖降解酶的多核苷酸序列。在一些实施方案中,本发明的遗传修饰的利用la的细菌包含整合到其基因组中的编码多糖降解酶和融合在框架内的信号肽的多核苷酸序列。
在一些实施方案中,术语“遗传修饰的”,“基因工程的”和“重组的”可互换使用。因此,遗传修饰的利用la的细菌在本文中也称为重组细菌或利用la的重组细菌。
利用la的细菌的遗传修饰可以使用本领域已知的用于利用la的细菌的表达载体、信号肽和方法进行,例如在kiatpapanandmurooka(2001)applmicrobiolbiotechnol.,56(1-2):144-9;bredeetal.,(2005)applenvironmicrobiol.,71(12):8077-84;mukdsietal.,(2014)applenvironmicrobiol.,80(2):751–756;和wo2015/011250中描述的。
如本文所提及的术语“核酸”、“核酸序列”、“多核苷酸”、“核苷酸”和“核苷酸序列”可互换使用。该术语是指脱氧核糖核苷酸(dna)、核糖核苷酸(rna)及其修饰形式,其形式为分离的片段或作为较大构建体的组分。该术语还包括由天然存在的碱基、糖和共价核苷间键组成的寡核苷酸,以及具有非天然存在部分的寡核苷酸,其功能类似于各自的天然存在部分。dna可包括例如基因组dna、质粒dna、重组dna或互补dna(cdna),rna可包括例如信使rna(mrna)、核糖体rna(rrna)或转运rna(trna)。在一些实施方案中,所述核酸序列可以是编码序列(即,可以编码细胞中终产物的序列,例如蛋白或肽)。在一些实施方案中,所述核酸序列可以是调节序列(例如,启动子)。
术语“多肽”、“肽”和“蛋白”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“氨基酸序列”是指由天然存在的氨基酸、已被化学修饰的氨基酸或合成氨基酸中的任何一种组成的序列。该术语是指肽和蛋白,以及肽和蛋白的片段、类似物、衍生物和组合。
在一些实施方案中,与对照序列“相似”或“同源”的序列(例如,核酸序列和氨基酸序列)在本文中是指序列之间的同一性百分比。同一性百分比可以是至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%。同一性百分比可以在全长序列上随机分布。因此,同源序列可包括例如与突变相关的变异(例如,至少一个氨基酸或至少一个核苷酸的截短、取代、缺失和/或添加)。类似的序列还可以包括与密码子使用和遗传密码变性相关的变异。例如,如果同源性(同一性/相似性)在全长序列上至少为80%,则称该序列与另一序列同源。
如本文所用,术语“构建体”是指人工组装或分离的核酸分子,其可包括一个或多个核酸序列,其中核酸序列可包括编码序列(即编码终产物的序列,例如,多糖降解酶)、调节序列(例如启动子)、非编码序列或其任何组合。术语构建体包括例如质粒和载体,但不应视为限于此。
“表达载体”和“重组载体”可以互换使用,并且是指具有在细菌细胞中表达异源(外源)核酸的能力的构建体。在一些实施方案中,表达载体可以在细胞中自主复制。在一些实施方案中,核酸可以整合到细菌细胞的基因组中。
如本文所用,术语“导入”和“转化”可互换使用,并指分子例如核酸、多核苷酸分子、载体等转移到细菌细胞中,更具体地说,转移到靶细胞的膜封闭空间的内部。可以通过本领域技术人员已知的任何方法将分子“导入”靶细胞中,例如sambrooketal.molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork(2001)所教导的。
术语“启动子”是指调节dna序列,其可以控制或指导编码序列的转录以在细胞中产生mrna。通常,启动子位于编码序列的5'区域(即,先于、位于上游)。启动子可以从天然来源整体衍生,或者由衍生自天然存在的不同启动子的不同成分组成,或甚至包含合成的核苷酸片段。启动子可以是组成型的(即启动子激活不受诱导剂调节,因此转录速率是恒定的),或诱导型的(即启动子激活受诱导剂调节)。在一些实施方案中,本发明的表达载体中可以使用各种类型和序列的启动子。在一些实施方案中,所述启动子可以衍生自各种来源、物种和生物。在一些实施方案中,本发明的表达载体中可以使用特定启动子和信号肽序列的组合。
在一些示例性实施方案中,所述启动子可以选自但不限于具有seqidnos:27-32和/或其同源物的中任一个所示核苷酸序列启动子。每种可能性都是单独的实施方案。
在一些实施方案中,所述启动子序列包含seqidnos:27-32中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。
在一些示例性实施方案中,所述启动子序列包含seqidno.31所示的核酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述启动子序列包含seqidno.27所示的核酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述启动子序列包含seqidno.28所示的核酸序列或其同源物,或由其组成。
术语“信号肽”和“sp”是指短的(通常长度5-30个氨基酸)肽,其可以存在于蛋白的n-末端并指导蛋白从细菌细胞分泌。在一些实施方案中,所述分泌物进入胞外基质。在一些实施方案中,所述sp序列可以从天然来源获得(按原样或经修饰)。在一些实施方案中,所述sp序列可以在计算机中设计。在一些示例性实施方案中,所述sp序列是丙酸杆菌属细菌来源。在一些实施方案中,所述sp序列与丙酸杆菌信号肽同源。在一些实施方案中,编码sp氨基酸序列的核酸序列可以包括在表达载体中,使得其与编码待分泌蛋白的序列在框内。在一些实施方案中,与本公开物中公开的sp的氨基酸序列具有至少60%、至少70%、至少80%、至少90%、至少95%同源性的氨基酸序列也是有功能的并包括在本文中。在一些实施方案中,与编码本公开物中公开的sp的核酸序列具有至少60%、至少70%、至少80%、至少90%、至少95%同源性的核酸序列也是包含在本文中。
在一些示例性实施方案中,所述sp可以选自但不限于具有seqidnos:87-179中任一个所示的氨基酸序列和/或其同源物的sp。每种可能性都是单独的实施方案。
在一些实施方案中,编码sp的所述核苷酸序列可选自编码seqidnos:87-179中任一个所示的氨基酸序列和/或其同源物的核酸。每种可能性都是单独的实施方案。
在一些实施方案中,编码sp的所述核苷酸序列可以选自如seqidnos:180-189所示的任何一种核酸和/或其同源物所示的核酸。每种可能性都是单独的实施方案。
在一些示例性实施方案中,所述sp包含seqidno.87所示的氨基酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述sp包含seqidno.88所示的氨基酸序列或其同源物,或由其组成。在一些示例性实施方案中,编码sp的核酸包含seqidno.180所示的核苷酸序列或其同源物,或由其组成。在一些示例性实施方案中,编码sp的核酸包含seqidno.181所示的核苷酸序列或其同源物,或由其组成。
在一些实施方案中,可以使用合适的表达载体(包括目的蛋白(例如,多糖降解酶)的合适编码序列、合适的信号肽序列(如果使用的话)和/或合适的启动子)对利用la的细菌进行遗传修饰,本领域已知的用于利用la的细菌的方法,例如在kiatpapanandmurooka(2001)applmicrobiolbiotechnol.,56(1-2):144-9;bredeetal.,(2005)applenvironmicrobiol.,71(12):8077-84;mukdsietal.,(2014)applenvironmicrobiol.,80(2):751–756;和wo2015/011250中描述。在一些实施方案中,表达载体允许将目的蛋白(和sp,如果使用的话)整合到细菌的基因组中。
在一些实施方案中,当确定用基因工程改造利用la的细菌的各种核酸序列时,可以应用合适的密码子使用,以允许优化细菌细胞中多糖降解酶和/或sp的表达和/或功能。
根据一些实施方案,提供了用于在细菌细胞中表达多糖降解酶的表达载体,该载体包含表达盒(在本文中也称为“插入物”),其包含至少一种合适的启动子核酸序列,可操作地连接到与编码信号肽(sp)的至少一种核酸序列,其与至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解酶的核酸序列翻译融合。
在一些实施方案中,所述表达载体包含质粒主链,一种或多种合适的复制起点(ori)序列,一种或多种抗生素抗性基因序列和一种或多种表达盒。在一些实施方案中,没有表达盒(插入物)的表达载体在本文中称为“穿梭载体”。在一些实施方案中,所述穿梭载体能够在各种细菌细胞类型中复制。
在一些实施方案中,所述表达载体适合于在丙酸杆菌中表达外源多糖降解酶。在一些实施方案中,丙酸杆菌是费氏丙酸杆菌。在一些实施方案中,适合在丙酸杆菌中表达外源多糖降解酶的表达载体包含编码丙酸杆菌复制蛋白的核酸序列。
在一些示例性实施方案中,所述表达载体是powr3载体,如下文进一步举例说明的。在一些实施方案中,此类表达载体包含编码丙酸杆菌复制蛋白的核酸序列(如seqidno:84所示)。在一些实施方案中,此类表达载体还包含一种或多种氯霉素抗性基因(例如来自纹带棒杆菌(corynebacteriumstriatum)pt10质粒的cmx(a)和cml(a))。在一些实施方案中,此类表达载体还包含丙酸杆菌复制起点(ori)序列。
在一些实施方案中,提供了用于由丙酸杆菌表达和分泌外源多糖降解酶的表达载体,所述载体包含:
至少一种编码丙酸杆菌复制蛋白的核苷酸序列;
至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包括:
至少一种启动子核酸序列,其可操作地连接至:至少一种编码丙酸杆菌信号肽(sp)(或其同源物)的核酸序列,其与至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解的核酸序列翻译融合。
在一些实施方案中,如本文进一步举例说明的,用于在丙酸杆菌中表达外源多糖降解酶的表达载体是有利的,因为它可以在例如大肠杆菌(原样或没有表达盒)和丙酸杆菌中复制。此外,这种载体是有利的,由于其结构和紧凑的大小(约5.6kb,(没有表达盒)),它允许改善细菌中多糖降解酶的表达(例如,高产率和质量)。此外,表达的多糖降解酶能够从细菌细胞中成功分泌并且能够降解底物中的多糖。此外,比在丙酸杆菌中表达的其他载体小是有利的,因为这使得更容易转化到细菌细胞并更容易通过无限制方法用于克隆。此外,用于插入表达盒的克隆区域通过终止信号界定(上游和下游),这可以防止极性效应中断并稳定细菌细胞中产生的多糖降解酶的mrna转录物,从而改善细胞中蛋白的表达。
在一些实施方案中,所述表达载体可包括一个以上表达盒,每个表达盒包含相同或不同的启动子、相同或不同的sp序列和不同的多糖降解酶序列。
在一些示例性实施方案中,所述表达盒可包含seqidnos:33-49中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。
在一些实施方案中,提供了表达盒,所述表达盒包含seqidnos:33-49中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。
在一些示例性实施方案中,表达盒包含seqidno:43所示的核苷酸序列或由其组成。
在一些实施方案中,当所述表达盒在靶细菌细胞中表达时,在表达盒的启动子序列的控制下,所述信号肽与多糖降解酶框内翻译连接。因此,包含信号肽序列和多糖降解酶序列的嵌合蛋白在细菌细胞中表达并且能够从其分泌。
在一些实施方案中,提供了包含本文公开的一种或多种表达载体的利用la的细菌。
在一些实施方案中,提供了包含本文公开的一种或多种表达盒的利用la的细菌。
在一些实施方案中,提供了包含一种或多种表达载体的丙酸杆菌,其中所述表达载体包含:至少一种编码丙酸杆菌复制蛋白的核苷酸序列;
至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包括:
至少一种启动子核酸序列,其可操作地连接至:至少一种编码丙酸杆菌信号肽(sp)的核酸序列,其与至少一种编码多糖降解酶的核酸序列翻译融合,所述多糖降解酶选自纤维素酶,半纤维素酶和淀粉酶。
在一些实施方案中,提供了分离的核酸分子,其包含选自seqidnos:33-49的序列及其同源物组成的组,或由其组成。
在一些实施方案中,所述多糖降解酶序列选自seqidnos:14-26及其同源物组成的组。
在一些实施方案中,编码多糖降解酶的核酸序列选自seqidnos:1-13及其同源物组成的组。
在一些实施方案中,利用la的细菌被基因工程改造以产生单一多糖降解酶。在其他实施方案中,利用la的细菌被基因工程改造以产生多种不同的多糖降解酶。“多种”表示至少两种。在一些实施方案中,为了在将多种酶改造到细菌中时控制每种多糖降解酶的表达水平,如本领域已知的,每种酶用不同效价的核糖体结合位点(rbs)进行改造。
在一些实施方案中,每种多糖降解酶可以用相似或不同的启动子进行改造。在一些实施方案中,如果使用信号肽的话,每种多糖降解酶可以用相似或不同的信号肽进行改造。
在一些实施方案中,产生包含多个亚群的利用la的细菌群,每个亚群被基因工程改造以表达和分泌不同的多糖降解酶。“多个”亚群表示至少两个亚群,例如两个、三个、四个亚群。亚群用作处理有机废物的共培养物。在一些实施方案中,群包含的每个亚群基本上等量。在其他实施方案中,群包含不同比例的亚群(即,每个亚群可以在群体内占有不同的百分比)。
如上所述,改造到所述利用la的细菌中的所述多糖降解酶可选自糖苷水解酶、多糖裂解酶和碳水化合物酯酶。根据标准分类系统(cantareletal.2009nucleicacidsres37:d233-238)将广泛的多糖降解酶组分成各类酶并进一步分为酶家族。这些酶的信息和更新分类可在碳水化合物-活性酶(carbohydrate-activeenzymes)(cazy)服务器(www.cazy.org)上获得。
在一些实施方案中,所述多糖降解酶是降解选自淀粉和非淀粉植物多糖的多糖的酶。
在一些实施方案中,改造到所述利用la的细菌中的所述多糖降解酶是糖苷水解酶。
在一些实施方案中,所述糖苷水解酶包含纤维素酶。纤维素酶可以是外切纤维素酶或内切纤维素酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单一纤维素酶。在其他实施方案中,利用la的细菌被遗传修饰以表达和分泌多种不同的纤维素酶。在一些实施方案中,纤维素酶可以选自但不限于:内切-(1,4)-β-d-葡聚糖酶、外切-(1,4)-β-d-葡聚糖酶、β-葡糖苷酶、羧甲基纤维素酶(cmcase);内切葡聚糖酶;纤维二糖水解酶、微晶纤维素酶、纤维糊精酶(celludextrinase)、纤维素酶a、cellulosinap、碱性纤维素酶和pancellasess。每种可能性都是单独的实施方案。
在一些实施方案中,编码纤维素酶的核酸可具有seqidnos:12-13中任一个所示的核酸序列或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,纤维素酶可具有seqidnos:25-26中任一个所示的氨基酸序列或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,纤维素酶包含seqidnos:25-26中任一个所示的氨基酸序列或其同源物,或由其组成。每种可能性都是单独的实施方案。
在另外的实施方案中,所述糖苷水解酶包含半纤维素酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单一半纤维素酶。在其他实施方案中,所述利用la的细菌被遗传修饰以表达和分泌多种不同的半纤维素酶。在一些实施方案中,所述半纤维素酶是木聚糖酶。其他半纤维素酶的非限制性实例包括阿拉伯呋喃糖苷酶(arabinofuranosidases)、乙酰酯酶、甘露聚糖酶、α-d-葡糖醛酸糖苷酶、β-木糖苷酶(β-xylosidases),β-甘露糖苷酶、β-葡糖苷酶、乙酰基-甘露糖苷酶(acetyl-mannanesterases)、α-半乳糖苷酶、-α-拉拉尼嗪酶(-α-larabinanases)和β-半乳糖苷酶。每种可能性代表本发明的单独实施方案。
在一些实施方案中,编码木聚糖酶的核酸可具有seqidno:11所示的核酸序列,或其同源物。在一些实施方案中,木聚糖酶可具有seqidno.24所示的氨基酸序列,或其同源物。每种可能性都是单独的实施方案。
在其他实施方案中,糖苷水解酶包含淀粉酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单个淀粉酶。在其他实施方案中,所述利用la的细菌被遗传修饰以表达和分泌多种不同的淀粉酶。在一些实施方案中,淀粉酶可以选自但不限于:α-淀粉酶;(1,4-α-d-葡聚糖葡聚糖水解酶;糖原酶)β-淀粉酶;(1,4-α-d-葡聚糖麦芽糖水解酶;糖原酶;糖原淀粉酶)γ-淀粉酶;(葡聚糖1,4-α-葡糖苷酶;淀粉葡萄糖苷酶;外切-1,4-α-葡糖苷酶;葡糖淀粉酶;溶酶体α-葡糖苷酶和1,4-α-d-葡聚糖葡糖水解酶。每种可能性是单独的实施方案。
在一些实施方案中,编码淀粉酶的核酸可具有seqidnos:1-10中任一个所示的核酸序列,或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,淀粉酶可具有seqidnos:14-23所示的氨基酸序列,或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,淀粉酶包含seqidnos:14-23所示的氨基酸序列或其同源物,或由其组成。每种可能性都是单独的实施方案。
改造到根据本发明的利用la的细菌的多糖降解酶可以来自细菌来源。在一些实施方案中,所述细菌来源是嗜热细菌。本文所用的术语“嗜热细菌”表示在高于约45℃,优选高于50℃的温度下繁殖的细菌。典型地,根据本发明的嗜热细菌具有约45℃至约75℃的最佳生长温度,优选约50℃至70℃。用于多糖降解酶的嗜热细菌来源的非限制性实例包括:纤维素酶和半纤维素酶—梭菌属物种(例如热解纤维梭菌(clostridiumthermocellum)),类芽孢杆菌属物种、褐色喜热裂孢菌;淀粉酶—芽孢杆菌属(例如嗜热脂肪芽孢杆菌(bacillusstearothermophilus))、地芽孢杆菌属物种(例如geobacillusthermoleovorans)、色盐杆菌属物种,海洋红嗜热盐菌。每种可能性都是单独的实施方案。
在另外的实施方案中,所述多糖降解酶的细菌来源是嗜温细菌。如本文所用的术语“嗜温细菌”表示在约20℃至45℃之间的温度下繁殖的细菌。多糖降解酶的嗜温细菌来源的非限制性实例包括:纤维素酶和半纤维素酶—克雷伯氏菌属(例如,肺炎克雷伯菌)、cohnella物种、链霉菌属、解纤维素醋弧菌、白色瘤胃球菌;淀粉酶—芽孢杆菌属(例如解淀粉芽孢杆菌(bacillusamyloliquefaciens)、枯草芽孢杆菌(bacillussubtilis)、地衣芽孢杆菌(bacilluslicheniformis)和发酵乳杆菌。本领域技术人员理解一些嗜温细菌(例如几种芽孢杆菌属)产生热稳定酶。
改造到根据本发明的利用la的细菌的多糖降解酶也可以来自真菌来源。多糖降解酶的真菌来源的非限制性实例包括:纤维素酶和半纤维素酶—里氏木霉、特异腐质霉、尖孢镰刀菌;淀粉酶—米曲霉、瘿青霉和棉状嗜热丝孢菌。
根据本发明使用的多糖降解酶的其他来源可以在例如上述cazy服务器中找到。
在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,该酶在适合所述利用la的细菌生长的相同温度和/或ph范围内具有合适的活性。在一些实施方案中,合适的活性是最佳活性。在一些实施方案中,合适的生长是最佳生长。在一些实施方案中,合适的条件是次优的。
在一些实施方案中,本发明的所述利用la的细菌被基因工程改造以产生在某温度和/或ph范围内具有最佳活性的多糖降解酶,所述温度和/或ph范围与所述利用la的细菌生长最佳的温度和/或ph范围相同。
在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,所述多糖降解酶在某温度和/或ph范围内具有合适的活性,所述温度和/或ph范围不同于所述利用la的细菌生长的合适的温度和/或ph范围。
在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,所述多糖降解酶在某温度和/或ph范围内具有最佳活性,所述温度和/或ph范围不同于所述利用la的细菌生长的最佳温度和/或ph范围。例如,来自嗜热源的多糖降解酶可以被改造为利用la的细菌,其典型地是嗜温菌。
加工有机废物
在一些实施方案中,待加工的有机废物典型地包含内源性d、l-乳酸。
在一些实施方案中,为了利用有机废物作为制备分离乳酸对映体的底物,需要在乳酸发酵之前选择性地除去至少不需要的对映体(为了将乳酸聚合成适合工业应用的聚乳酸,它应该是至少约95%光学纯,优选至少约99%光学纯)。应该从对有机废物中除去至少不需要的对映异构体,同时对原料总糖含量的影响最小。
在一些实施方案中,待加工的有机废物还包含不同比例的复合多糖和还原糖。这个组成取决于废物的来源,其中一些有机废物可能更富含淀粉(例如,来自面包店的食物废物、市政的混合食物废物),而其他有机废物可能富含木质纤维素材料(例如农业废物)。在一些实施方案中,待处理的有机废物包括来自不同来源的废物的组合。
在一些实施方案中,可以在处理之前使用本领域已知的方法测定有机废物中还原糖和多糖的组成,包括例如用葡萄糖氧化酶、己糖激酶或磷酸葡萄糖异构酶用于果糖的酶学试验(比色、荧光测定)。或者,可以使用hplc和/或还原糖连续传感器。总糖分析可以例如通过苯酚-硫酸试验进行。有机废物的组成,例如淀粉、纤维素和半纤维素中至少一种的百分比,可用于选择待与有机废物接触的利用la的细菌或利用la的细菌群。例如,对于包含纤维素百分比高于淀粉的有机废物,可以选择细胞联合体,其包含产生淀粉酶的第一亚群和产生纤维素酶的第二亚群,其中亚群之间的比例根据有机废物中淀粉和纤维素之间的比例而定。也可以使用产生所有必需酶的单一细菌,并且可以使用不同效价的核糖体结合位点(rbs)改变和调整酶的剂量和比例,如上所述。
在一些实施方案中,根据本发明的有机废物的处理典型地始于有机废物的预处理,以减小粒度和增加表面积,以及灭活废物内的内源细菌。预处理可包括例如通过本领域已知的方法切碎和灭菌。预处理还可包括使用废碎机(例如挤出机、超声波仪,粉碎机或搅拌机)伴随等量的水切碎。
根据一些实施方案,在预处理之后,将有机废物在反应器(发酵罐)中与本发明所述利用la的细菌混合,和细菌培养物在适合利用la的细菌消耗乳酸和适合产生改造的多糖降解酶的条件下繁殖。在一些实施方案中,此类条件可包括约30-40℃的温度及其任何子范围。每种可能性都是单独的实施方案。在一些实施方案中,此类条件可包括约5.5-6.5的ph及其任何子范围。每种可能性都是单独的实施方案。
在一些实施方案中,当所述多糖降解酶被分泌并具有合适的(例如,最佳的)温度和/或ph,该温度和/或ph类似于适合(例如最佳)所述利用la的细菌生长的温度和/或ph时,结果是伴随的乳酸除去和有机废物糖化。
在一些实施方案中,当所述多糖降解酶被分泌并且具有合适的(例如,最佳的)温度和ph,该温度和ph不同于适合(例如最佳)所述利用la的细菌生长的温度和ph时,酶被分泌但仍保留无活性或部分活性,直至条件调整为适合酶活性的条件,导致分开的除去乳酸和有机废物糖化。
在一些实施方案中,当所述多糖降解酶是非分泌的并仅在所述利用la的细菌细胞溶解后才释放时,结果还是分开除去乳酸和有机废物糖化。
在一些实施方案中,将培养物维持足够的时间以从废物中除去d-乳酸、l-乳酸或两者(取决于利用la的细菌的类型),并任选地获得期望水平的还原糖(乳酸除去和有机废物糖化相伴发生)。
在一些实施方案中,所述时间段可以为约2小时至约15小时或其间的任何量,优选为2-12小时、或2-10小时,例如2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时和10小时。
如本文所用,当提及可测量值时,术语“约”意指包括指定值的+/-10%,优选+/-5%,更优选+/-1%的变化,并且还更优选+/-0.1%。
有机废物典型地包括产生la的细菌所需的氮源和其他营养素,但是如果需要,这些营养素也可以分开提供。
在一些实施方案中,在上述处理之后,测定还原糖的量。这种测定对利用还原糖的下游发酵过程可能是有用的,能够控制补糖的浓度。
分离的乳酸对映体的制备
在一些实施方案中,有机废物的所述还原糖(最初在废物中发现的那些还原糖和通过多糖降解酶的作用而释放的那些还原糖)可以被产生la的微生物发酵成乳酸。为了仅产生一种分离的乳酸对映体,所用的产生la的微生物仅产生d-乳酸和l-乳酸对映体中的一种。产生la的微生物可以天然地仅产生一种对映体,或者可以被遗传修饰而仅产生一种对映体,例如通过敲除参与合成不需要的对映体的一种或多种酶。
在一些实施方案中,在乳酸发酵之前,灭活所述利用la的细菌以避免消耗发酵过程中产生的乳酸。例如,可以通过升高温度或将ph改变至所述利用la的细菌不可逆地灭活的温度/ph来进行灭活。可选地或另外地,灭活利用la的细菌可以通过细胞溶解来实施,例如超声处理。当所述利用la的细菌被改造以产生非分泌的多糖降解酶时,可以使用后者,并且细胞裂解使细菌失活,同时释放酶。在一些实施方案中,所述灭活包括灭菌或巴氏灭菌。
如本文所用,“灭活”表示死亡或垂死的细胞。典型地,至少80%的细胞被灭活,例如至少85%的细胞被灭活,至少90%的细胞被灭活,至少95%的细胞被灭活,或100%的细胞被灭活。每种可能性代表本发明的单独实施方案。
在一些实施方案中,乳酸发酵在相同的反应器(发酵罐)中进行,其中用所述利用la的细菌和多糖降解酶处理有机废物。在其他实施方案中,发酵在分开的反应器中进行。在一些实施方案中,过滤加工的有机废物以除去固体物质,并将过滤液与产生la的微生物混合用于发酵阶段。
产生la的微生物包括各种细菌(包括例如乳杆菌属物种和芽孢杆菌属物种)和真菌。
典型地,所述发酵步骤在厌氧或微需氧条件下进行,使用分批、补料分批、连续或半连续发酵。每种可能性代表本发明的单独实施方案。
在分批发酵中,将碳底物和其他成分装入反应器中,和当发酵完成时,收集产物。除了用于ph控制的中和剂之外,在反应完成之前不将其他成分添加到反应中。接种量典型地为反应器中液体体积的约5-10%。将发酵保持在基本恒定的温度和ph,其中通过添加合适的中和剂来维持ph,例如碱、碳酸盐或氨。
在补料分批发酵中,将底物连续或依次加入反应器中而不除去发酵液(即,产物保留在反应器中直至运行结束)。常见的补料方法包括间歇、恒速、脉冲和指数补料。
在连续发酵中,将底物以固定速率连续加入反应器中,并连续取出发酵产物。
在半连续过程中,每隔一段时间取出一部分培养物,并将新鲜培养基加入到系统中。可以无限期维持的重复补料分批培养是半连续过程的别称。
乳酸发酵典型地实施约1-4天或其间的任何量,例如1-2天,或2-4天,或3-4天。
根据一些实施方案,所述多糖降解酶可具有最佳温度和/或ph,其不同于分泌它们的所述利用la的细菌生长的最佳温度和/或ph,因此,在所述利用la的细菌处理过程中酶可以分泌,但它们保持无活性(或部分活性)并且基本上不降解有机废物中的多糖,或降解速率低。在一些实施方案中,所述多糖降解酶的最佳温度和/或ph类似于所述产生la的微生物发酵乳酸的最佳温度和/或ph。根据这些实施方案,酶可以在发酵液中保持无活性,直到加入产生la的微生物并调节条件以允许它们活化。这可引起同时糖化和发酵。
在一些实施方案中,所述多糖降解酶可以是非分泌的并且仅在利用la的细菌细胞溶解后释放到培养基中。在一些实施方案中,在所述利用la的细菌细胞裂解后,将产生la的微生物添加到培养基中,从而同时发生糖化和发酵。
根据这些实施方案,制备分离的乳酸对映体的方法包括:(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合,通过在适合所述利用la的细菌消耗乳酸和适合产生所述多糖降解酶的条件下,使有机废物接触本发明的所述利用la的细菌或本发明的利用la的细菌群;(ii)灭活所述利用la的细菌;(iii)降解废物中的多糖以释放还原糖,同时将释放的糖发酵成分离的乳酸对映体,通过在适合(i)中产生的多糖降解酶的活性和适合产生la的微生物发酵乳酸的条件下,使(i)中获得的有机废物接触仅产生d-乳酸对映体和l-乳酸对映体之一的产乳酸微生物;(iv)从发酵液中回收分离的乳酸对映体。
在其他实施方案中,在乳酸发酵(水解和发酵分开)之前将有机废物糖化。
根据这些实施方案,制备分离的乳酸对映体的方法包括:(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合并降解废物中的多糖以释放可溶性还原糖,通过在适合所述利用la的细菌消耗乳酸和适合多糖降解酶分泌和活性的条件下,使有机废物接触本发明的所述利用la的细菌或本发明的利用la的细菌群体;(ii)灭活所述利用la的细菌;(iii)用仅产生d-乳酸和l-乳酸之一的产乳酸微生物发酵(i)中得到的可溶性还原糖,得到分离的乳酸对映体;和(iv)从发酵液中回收分离的乳酸对映体。
在发酵完成后,含乳酸的发酵液典型地可以通过离心澄清或通过滤器以从发酵液体中分离固体残留物。滤液可以浓缩,例如,使用旋转真空蒸发器。
可以通过本领域已知的方法从发酵液中分离和纯化乳酸,包括蒸馏、萃取、电渗析、吸附、离子交换、结晶和这些方法的组合。例如,在ghaffaretal.(2014),前述;和lópez-garzónetal.(2014)biotechnoladv.,32(5):873-904的文章中综述了几种方法。或者,可以使用单独的步骤将乳酸回收并转化为丙交酯(dusselieretal.(2015)science,349(6243):78-80)。
在一些实施方案中,本文公开的用于处理废物的系统和方法特别适用于商业、工业和市政来源的混合食物废物。使用混合食物废物作为底物特别适合大规模工业发酵,因为它是不均匀的,因此它含有瘤胃来源的细菌发酵所需的大部分矿物质和维生素。此外,本文公开的系统和方法优于目前使用的方法,因为它们表现出使用化石燃料少,不使用有价值的耕地种植原料作物,水的使用率低,温室气体排放也低,并且所获得的产物是可生物降解的。
根据一些实施方案,本文公开的系统和方法是进一步有利的,因为它们允许组合单元操作进行工业处理,因为不需要外来添加多糖降解酶来利用废物。相反,这种酶的产生在发酵发生的相同容器中进行。
生产聚乳酸(pla)
为了产生适合工业应用的pla,聚合方法应仅使用一种对映体。存在杂质或d-和l-乳酸的外消旋混合物导致聚合物具有不希望的特性,例如低结晶度和低熔融温度。因此,需要仅产生l-乳酸对映体或仅产生d-乳酸对映体的乳酸菌。
pla的聚合可以通过本领域已知的方法进行。已知的方法包括通过丙交酯(二乳酸)形成的聚合和乳酸单体的直接缩合。例如,在
根据一些实施方案,本文公开的系统和方法可以产生最终产物,即从废物中完全再循环(即100%再循环)的聚乳酸(pla)。
根据一些实施方案,本文公开的利用la的细菌的各种方法和系统可以成功地用于生产乳酸和pla,其可以通过各种商业环境实施,包括室外,各种发酵罐和反应器,回收工厂等等。
在一些实施例中,可以在一个分离位置中执行方法中的各个步骤。在一些实施方案中,方法中的各个步骤可以在一个或多个操作单元中进行,例如发酵罐和反应器。在一些实施例中,可以同时或连续地执行方法中的各个步骤。例如,有机废物的尺寸减小可以与灭菌步骤在时间上和/或空间上组合。
在一些实施方案中,使用本发明所述利用la的细菌从有机废物中获得聚乳酸的方法中的步骤可包括以下一个或多个步骤:
1.获取有机废物。所述有机废物可选自住宅、商业或工业食物废物。所述有机废物可以是源分离的或机器分离的。
2.所述有机废物的尺寸减小—所述有机废物的粉碎和研磨,以获得均匀的半固体原料。进一步,也可以使用超声处理从而将尺寸减小与灭菌相结合。这可以在同一操作单元中执行。
3.灭菌—可以通过例如超声、加热、uv和/或压力来实现。这可以在发酵罐操作单元内原位进行,也可以在外部进行。在一些实施方案中,如上所述,该步骤可与尺寸减小步骤组合。
4.利用la的基因工程细菌的接种—利用la的基因工程细菌可以接种在种子发酵罐操作单元中以产生酶。另外,来自下游加工的乳酸盐副产物可以在该步骤中作为原料加入(如下面进一步详述的)。所述利用la的细菌也可以在限定的培养基上培养,例如yel。
5.多糖降解酶和二氧化碳的接种和共生—以及外消旋乳酸盐的消耗—将利用la的种子细菌接种在生产发酵罐中以进一步产生酶并在有机废物中消耗外消旋乳酸盐。
6.利用la的细菌的灭活—发酵罐中的温度可以增加(例如,至45-55℃),导致所述利用la的细菌灭活(灭菌)。有利地,这种升高的温度可以进一步增强分泌的多糖降解酶的活性,所述分泌的多糖降解酶由利用la的细菌分泌,为其活性提供改善的条件(例如最佳条件)。
7.接种产生乳酸的生物(产生纯l或纯d的生物)—因此,发酵培养基从外消旋乳酸中除去,并且还原糖(由分泌的降解酶形成)变得可用于乳酸发酵过程。
8.乳酸的回收和纯化—可以使用各种纯化方法(或其组合)来纯化对映体纯的乳酸。这些方法包括例如微/纳过滤、离心、离子层析、沉淀、结晶等等。
9.聚合为plla或pdla—使用本领域已知的方法实施纯化的乳酸聚合为pla,包括通过丙交酯(二乳酸)形成的聚合和乳酸单体的直接缩合。
在一些实施方案中,使用本发明的利用la的细菌可以有利地再循环和再利用在获得纯乳酸(和pla)的过程中形成的下游残留乳酸或乳酸盐废物的。在该过程中形成的这种下游残留乳酸或乳酸盐废物可以来自例如从发酵液中除去固体(例如,使用膜过滤或离心),剩余的固体含有未分离的有用乳酸盐。另外,当合成丙交酯时,一些乳酸分子可以进行外消旋化。这种残留的乳酸和/或乳酸盐废物发酵可有利地在该过程中再循环,例如,通过用作利用la的细菌生产酶的原料。当从发酵液中回收有机酸如乳酸时,通常产率不是100%并且存在残留的稀释乳酸。回收残留的有机酸是昂贵的,因此它可以再循环并用于另一发酵批次。回收残留物会重新引入残留物中也存在的矿物质和盐,这可能需要新发酵批次。连续和半连续发酵乳酸生产过程需要使用富含细菌和乳酸的发酵液样品接种进入的无菌发酵原料。连续或半连续方法使用有机废物生产乳酸的问题是进入的原料中存在不需要的对映体。如果富发酵液接种在原料中,则立即开始产生乳酸,则不需要的对映体作为杂质保留在该过程中。因此,在乳酸生产过程中使用利用乳酸盐的细菌允许所有这些资源的有效再循环。来自回收过程的残留乳酸和/或巴氏灭菌/灭菌的富含乳酸的发酵液可用于培养细菌并产生大量酶用于另一生产循环。这可以在原位或在单独的较小种子发酵罐中实现。在一些实施方案中,来自乳酸富发酵液的样品可以分成两部分,一部分经巴氏消毒并用于培养产酶的细菌。第二部分未经巴氏杀菌并且含有大量细菌细胞团,可用于接种已被利用la的细菌处理以除去对映体和/或用酶糖化的原料。
现在参考图1,图1是根据一些实施方案的用于产生乳酸的分离对映体和再循环残留乳酸盐废物的发酵系统的示意图。如图1所示,发酵系统包括种子发酵罐(10),其中接种利用la的基因工程细菌。培养基/液可以是减小尺寸和灭菌/巴氏杀菌的如上所述的各种来源的有机废物(14)、限定的培养基(例如,yel)(16)和/或尺寸减小和灭菌的有机废物和有益于利用la的细菌生长的合适营养素的组合(18)。在种子室中,实现分泌的多糖还原酶(由利用la的细菌产生)和co2共同产生,以及乳酸盐消耗(由利用la的细菌消耗)。然后将利用la的种子细菌转移到生产发酵罐(12)中,以进一步产生和分泌多糖还原酶并消耗外消旋乳酸盐。另外,可以将另外批量的尺寸减小和/或灭菌的有机废物(20)添加到生产发酵罐中。接下来,改变生产发酵罐中的条件(例如温度或ph)(例如,通过将温度升高至45-65℃(例如,55℃)),从而导致利用la的细菌灭活,和任选的,为分泌的多糖降解酶提供增强的工作条件。这导致发酵培养基从外消旋乳酸中被除去并富含可用于发酵的还原糖。产生la的微生物接种于培养基以产生光学纯的乳酸对映体,然后可以将其纯化并进一步加工,例如通过聚合成pla。有利地,过程中形成的下游残留乳酸和/或乳酸盐废物(22)通过加入到种子发酵罐和/或生产发酵罐中(如曲线箭头所示),可以再利用和再循环。
根据一些实施方案,因此提供了回收在制备光学纯乳酸对映体的过程中形成的残留乳酸和/或乳酸盐废物的系统和方法。
在一些实施方案中,该系统可包括一种或多种有机废物来源;一个或多个发酵罐;一种遗传修饰的利用la的细菌,其被修饰以表达和分泌一种或多种外源多糖降解酶,其中所述发酵罐配置成允许利用la的细菌在适合利用la的细菌消耗乳酸和适合多糖降解酶的表达和活性的条件下生长,其中这种加工从有机废物中除去d-乳酸、l-乳酸或两者,并降解废物中的多糖以释放可溶性还原糖;并且进一步配置成允许使利用la的细菌和可以接种在发酵罐中的产生la的微生物失活的条件,所述产生la的微生物能够发酵由分泌的多糖降解酶产生的可溶性还原糖以产生d-乳酸和l-乳酸之一,得到分离的乳酸对映体;其中将在该过程中形成的下游残留乳酸和/或乳酸盐废物加回到一个或多个发酵罐中,在该方法中重新用作底物。
术语“包括”、“包括”、“具有”及它们的结合词意味着“包括但不限于”。术语“包括”和“包含”在一些实施例中限于“由……组成”。属于“由……组成”意思是“包括但限于”。术语“基本上由……组成”是指可包括另外的成分、步骤和/或部分的组合物、方法或结构,但条件是另外的成分、步骤和/或部分不实质上改变声称的组合物、方法或结构的基本和新特征。
如本文所用,单数形式“一”、“一个”、“一种”和“该”包括复数指代,除非上下文另有明确说明。例如,术语“化合物”或“至少一种化合物”可包括多种化合物,包括其混合物。
具体实施方式的前述描述将充分揭示本发明的一般性质,以致其他人可通过应用当前知识,容易地改进和/或改变各种应用,这些具体实施方式无需过度实验且不脱离一般概念,并且因此,这些改变和改进应当并意欲解释在所公开的实施方案的等同物的含义和范围内。应理解,本文采用的措辞或术语是出于描述的目的而非限制。用于执行各种公开的化学结构和功能的方法、材料和步骤可以在不脱离本发明的情况下采用各种替代形式。
为了更全面地说明本发明的一些实施方案,提供以下实施例。然而,它们不应被解释为限制本发明的广泛范围。
实施例
实施例1-用于遗传修饰细菌的合适载体的构建
大肠杆菌—费氏丙酸杆菌穿梭载体的构建:
构建的载体在大肠杆菌和费氏丙酸杆菌中都可使用。
如下制备powr3载体(示意图显示在图2a中):丙酸杆菌复制蛋白序列(seqidno.84)和氯霉素抗性基因(来自纹状体棒状杆菌(corynebacteriumstriatum)pt10质粒的cmx(a)(seqidno:85)和cml(a)(seqidno:86))串联合成进入包含大肠杆菌复制起点(ori)和氨苄青霉素抗性盒(ampr)的载体。这导致在大肠杆菌和费氏丙酸杆菌中都能够复制的~5.6kbp的质粒。该载体还包括pb复制起点序列。得到的powr3载体比其他已知的费氏丙酸杆菌表达载体(5.6kbp对比6.2-8kbp)小,这使得它更容易转化入细菌细胞(例如,通过电穿孔)并且更容易用无限制方法进行克隆。此外,powr3的ampr基因序列区域用作克隆位点,用于插入表达盒(如下详述)。该区域通过终止信号界定(上游和下游),终止信号防止极性效应中断并稳定细菌细胞中产生的(多糖降解酶的)mrna转录物。
powr3载体转化费氏丙酸杆菌
通过电穿孔将powr3载体转化到费氏丙酸杆菌中。将费氏丙酸杆菌的浊培养物以1:125稀释至新鲜的yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐),在有氧条件下于30℃过夜培养。将培养物(o.d600=0.2-1.9)置于冰上30分钟,然后用相同体积的冰水(3000rpm,10分钟)洗涤两次。第三次洗涤使用相同体积的冷10%甘油(3000rpm,10分钟)。将沉淀在10%冷甘油中浓缩(原始培养物的0.01%)。将50μl电感受态的费氏丙酸杆菌在含有1000ngpowr3载体的管中混合。将细菌和载体混合物转移到0.1cm间隙比色杯(biorad)中并使用以下条件进行电穿孔:场强-20000v/cm,电阻-500欧姆,电容-25uf。加入900μlyel培养基,将细菌在有氧条件下于30℃温育3小时,然后在yel培养基+10ugr/ml氯霉素琼脂平板上铺板。
为了构建允许多糖降解酶表达和分泌的合适表达载体,通过用“表达盒”替换氨苄青霉素抗性基因来修饰powr3载体,所述“表达盒”包括,i)启动子序列,其可操作地连接到(ii)编码信号肽(sp)的核酸序列,其翻译连接到(iii)编码多糖降解酶的核苷酸序列。(图2b)。当所述表达盒在靶细胞中表达时,在启动子序列的控制下,信号肽与多糖降解酶框内翻译连接。换句话说,在细胞中表达包含sp肽序列和多糖降解酶肽序列的嵌合蛋白。
通过利用这种表达盒,可利用合适的启动子-sp-多糖降解酶组合基质。
实施例2—构建合适的表达盒和表达载体,用于遗传修饰细菌以表达和分泌多糖降解酶
下面列出的是用于产生表达载体中使用的表达盒的示例性多糖降解酶(葡糖淀粉酶、纤维素酶和半纤维素酶(木聚糖酶)、信号肽和启动子。
下表1中列出的以下示例性酶用于表达盒和用于遗传修饰细菌的表达载体。酶序列获自不同来源(生物)。除去每种所列酶的原始信号肽,并用外源(不同)信号肽代替。
表1-示例性多糖降解酶
以下启动子区域用于构建各种表达盒和表达载体:
-来自费氏丙酸杆菌atcc9614的pfreud_04850启动子(seqidno:27)
-来自费氏丙酸杆菌bia118的pfrud_04850启动子(seqidno:28)
-来自费氏丙酸杆菌atcc9614的pfreud_22150启动子(seqidno:29)
-pfreud_08450,来自费氏丙酸杆菌atcc9614的启动子。(seqidno:30)
-来自费氏丙酸杆菌atcc9614的pfreud_18290。(seqidno:31)。
-pgro启动子(来自丙酸丙酸杆菌(propionibacteriumacidipropionici)的pgro质粒)(seqidno:32)。
以下示例性信号肽(sp)氨基酸序列用于构建各种表达盒:
>cbl57338表面层蛋白a(s层蛋白a)pfreud_18290[费氏丙酸杆菌舍氏亚种(propionibacteriumfreudenreichiisubsp.shermanii)cirm-bia1](sedidno:87(氨基酸序列),seqidno:180(核苷酸序列))。
>cbl56016.1细胞壁肽酶,nlpc/p60家族分泌蛋白pfreud_04850[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:88(氨基酸序列),seqidno:181(核苷酸序列))。
>cbl56360.1dsba氧化还原酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:89(氨基酸序列),seqidno:182(核苷酸序列))。
cbl57333.1假定蛋白pfreud_18250[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:90(氨基酸序列),seqidno:183(核苷酸序列))
gi|296921799|emb|cbl56359.1|thiredoxine样膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:91(氨基酸序列),seqidno:184(核苷酸序列))
>gi|296923311|emb|cbl57911.1|rnd超家族的药物输出蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:92(氨基酸序列),seqidno:185(核苷酸序列))
>gi|296921405|emb|cbl55958.1|推定的羧酸酯水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1(seqidno:93(氨基酸序列),seqidno:186(核苷酸序列))。
gi|296921680|emb|cbl56237.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:94(氨基酸序列),seqidno:187(核苷酸序列))。
>gi|296922532|emb|cbl57105.1|s层结构域蛋白结构域蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:95(氨基酸序列),seqidno:188(核苷酸序列))。
>gi|296922233|emb|cbl56805.1|abc转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1]
mrlarrvaavllasvlaltvascagaarsapsl(seqidno:96(氨基酸序列),seqidno:189(核苷酸序列))。
>cbl57324.1假定蛋白pfreud_18170[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:97)。
>cbl57805.1极性氨基酸abc转运蛋白,结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:98)。
>cbl57413.1分选酶家族蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:99)。
>cbl57271.1可能的多药耐药转运蛋白,mfs超家族[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:100)。
>cbl57337.1假定蛋白pfreud_18280[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:101)。
gi|296922302|emb|cbl56874.1|推定的肽基-脯氨酰顺反异构酶,fkbp型(前体)[费氏丙酸杆菌舍氏亚种cirm-bia1]cirm-bia1(seqidno:102)。
gi|296923259|emb|cbl57856.1|细胞外溶质结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:103)。
gi|296923146|emb|cbl57733.1|假定蛋白pfreud_22300[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:104)。
gi|296921378|emb|cbl55931.1|假定蛋白pfreud_03980[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:105)。
gi|296921927|emb|cbl56487.1|假定膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:106)。
gi|296922947|emb|cbl57529.1|羧肽酶(丝氨酸型d-ala-d-ala羧肽酶)(d-丙氨酰-d-丙氨酸-羧肽酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:107)。
>gi|296923326|emb|cbl57926.1|abc转运蛋白,底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:108)。
>gi|296923322|emb|cbl57922.1|假定蛋白pfreud_24060[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:109)。
>gi|296922617|emb|cbl57194.1|假定蛋白pfreud_16830[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:110)。
>gi|296922915|emb|cbl57497.1|分泌的糖基水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:111)。
>gi|296921377|emb|cbl55930.1|假定蛋白pfreud_03970[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:112)。
>gi|296922301|emb|cbl56873.1|肽酰-脯氨酰-顺反式异构酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:113)。
>gi|296922866|emb|cbl57446.1|假定蛋白pfreud_19530[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:114)。
>gi|296922346|emb|cbl56918.1|假定蛋白pfreud_14190[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:115)。
>gi|296921344|emb|cbl55897.1|假定蛋白pfreud_03630[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:116)。
>gi|296922653|emb|cbl57230.1|假定蛋白pfreud_17190[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:117)。
>gi|296921113|emb|cbl55660.1|没有功能的细胞外蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:118)。
>gi|296921687|emb|cbl56244.1|假定蛋白pfreud_07130[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:119)。
>gi|296921593|emb|cbl56147.1|假定蛋白pfreud_06170[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:120)。
>gi|296922523|emb|cbl57096.1|假定蛋白pfreud_15980[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:121)。
>gi|296921018|emb|cbl55556.1|大表面蛋白a[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:122)。
>gi|296922853|emb|cbl57433.1|青霉素结合蛋白(转糖基酶/转肽酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:123)。
>gi|296921190|emb|cbl55739.1|假定蛋白pfreud_02240[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:124)。
>gi|296922847|emb|cbl57427.1|多铜氧化酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:125)。
>gi|296923003|emb|cbl57585.1|染色体浓缩调节蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:126)。
>gi|296923209|emb|cbl57803.1|极性氨基酸abc转运蛋白,结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:127)。
>gi|296923210|emb|cbl57804.1|极性氨基酸abc转运蛋白,结合蛋白成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:128)。
>gi|296921884|emb|cbl56444.1|abc转运蛋白金属结合脂蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:129)。
>gi|296921649|emb|cbl56206.1|铁abc运输系统,溶质结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:130)。
>gi|296922500|emb|cbl57073.1|肽酶m23b家族/金属内肽酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:131)。
>gi|296922061|emb|cbl56625.1|转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:132)。
>gi|296921977|emb|cbl56539.1|假定蛋白pfreud_10150[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:133)。
>gi|296921310|emb|cbl55863.1|假定蛋白pfreud_03320[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:134)。
>gi|296921967|emb|cbl56527.1|abc转运蛋白,底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:135)。
>gi|296921196|emb|cbl55745.1|假定蛋白pfreud_02300[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:136)。
>gi|296921666|emb|cbl56223.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:137)。
>gi|296921230|emb|cbl55780.1|abc转运蛋白,结合脂蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:138)。
>gi|296923102|emb|cbl57689.1|极性氨基酸abc转运蛋白,结合蛋白成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:139)。
>gi|296923079|emb|cbl57663.1|硫酸盐结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:140)。
>gi|296921569|emb|cbl56123.1|abc转运系统的溶质结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:141)。
>gi|296922906|emb|cbl57488.1|abc转运系统的磷酸结合转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:142)。
>gi|296920974|emb|cbl55511.1|膜蛋白(s层)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:143)。
>gi|296922551|emb|cbl57124.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:144)。
>gi|296923279|emb|cbl57879.1|青霉素结合蛋白(肽聚糖糖基转移酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:145)。
>gi|296921112|emb|cbl55659.1|atp结合区,atp酶样:组氨酸激酶,组氨酸激酶a样前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:146)
>gi|296922314|emb|cbl56886.1|钴通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:147)。
>gi|296922614|emb|cbl57191.1|假定蛋白pfreud_16800[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:148)。
>gi|296921959|emb|cbl56519.1|分泌蛋白酶与pdz结构域[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:149)。
>gi|296921835|emb|cbl56395.1|膜蛋白[费氏丙酸杆菌(费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:150)。
>gi|296921079|emb|cbl55620.1|分泌的转糖酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:151)。
>gi|296922047|emb|cbl56611.1|亮氨酸,异亮氨酸,缬氨酸,苏氨酸和丙氨酸结合蛋白[前体](livat-bp)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:152)。
>gi|296922667|emb|cbl57244.1|假定蛋白pfreud_17340[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:153)。
>gi|296922395|emb|cbl56967.1|假定蛋白pfreud_14680[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:154)。
>gi|296921224|emb|cbl55774.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:155)。
>gi|296921129|emb|cbl55676.1|abc转运蛋白通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:156)。
>gi|296921974|emb|cbl56536.1|胞外多糖生物合成蛋白前体(与n-乙酰葡糖胺-1-磷酸二酯α-n-乙酰氨基葡萄糖苷酶前体有关)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:157)。
>gi|296921168|emb|cbl55717.1|假定蛋白pfreud_02020[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:158)。
>gi|296921340|emb|cbl55893.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:159)。
>gi|296923123|emb|cbl57710.1|假定膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:160)。
>gi|296922282|emb|cbl56854.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:161)。
>gi|296921324|emb|cbl55877.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:162)。
>gi|296922572|emb|cbl57145.1|abc转运蛋白甘氨酸甜菜碱[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:163)。
>gi|296922949|emb|cbl57531.1|假定蛋白pfreud_20380[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:164)。
>gi|296921638|emb|cbl56194.1|abc运输系统成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:165)。
>gi|296922507|emb|cbl57080.1|假定蛋白pfreud_15820[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:166)。
>gi|296921133|emb|cbl55680.1|假定蛋白pfreud_01650[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:167)。
>gi|296921157|emb|cbl55704.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:168)。
>gi|296921592|emb|cbl56146.1|abc转运蛋白相关的通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:169)。
>gi|296923131|emb|cbl57718.1|假定蛋白pfreud_22150[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:170)。
>gi|296921360|emb|cbl55913.1|假定外膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:171)。
>gi|296921416|emb|cbl55969.1|假定蛋白pfreud_04350[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:172)。
>gi|296923120|emb|cbl57707.1|假定蛋白pfreud_22040[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:173)。
>gi|296921006|emb|cbl55544.1|假定蛋白pfreud_00440[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:174)。
>gi|296921415|emb|cbl55968.1|羧酸酯水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:175)。
>gi|296922150|emb|cbl56718.1|abc转运蛋白底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:176)。
>gi|296921167|emb|cbl55716.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:177)。
>gi|296923127|emb|cbl57714.1|假定蛋白pfreud_22110[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:178)。
>gi|296921375|emb|cbl55928.1|假定蛋白pfreud_03950[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:179)。
实施例3-利用信号肽和启动子的不同组合制备用于在pb中表达各种多糖降解酶的表达盒
使用合适的引物(列于表2中)和相应的模板,使用pcr反应获得各种启动子和多糖降解酶的核苷酸序列插入物。根据制造说明书,使用q5高保真dna聚合酶(newenglandbiolabs,m0491)进行pcr反应。pcr条件如下:初始变性-98℃1分钟,二次变性-98℃30秒,退火-60℃30秒,延伸-72℃50秒。pcr程序进行30个循环(第二次启动步骤至延伸步骤)。在琼脂糖凝胶上测试pcr产物,并使用wizardpcrcleanup试剂盒(promega)纯化。
实施例3.1-来自纤维复膜孢酵母(saccharomycopsisfibuligera)的葡糖淀粉酶gi113795与pfreud_18290启动子和pfreud_18290信号肽的表达
使用引物1和2从费氏丙酸杆菌扩增启动子和信号肽的序列(下表2)。使用引物3和4扩增葡糖淀粉酶(表2)。在终止密码子后加入21个核苷酸合成全部葡糖淀粉酶,以便能够使用共有的反向引物(引物4)进行扩增。由此获得的表达盒(即插入物)的dna序列如seqidno:33所示。
实施例3.2-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_18290启动子和pfreud_18290信号肽组合的表达:
使用引物1和5(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物6和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:34所示。
实施例3.3-来自梭菌属sp.5g000的葡糖淀粉酶gi231542与pfreud_18290启动子和pfreud_18290信号肽组合的表达:
使用引物1和7(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物8和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:35所示。
实施例3.4-来自clostiridiumthermohydrosulfuricum的葡糖淀粉酶gi490533596与pfreud_18290启动子和pfreud_18290信号肽组合的表达:
使用引物1和9(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物10和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:36所示。
实施例3.5-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_18290启动子和pfreud_18290信号肽组合的表达:
使用引物1和11(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物12和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:37所示。
实施例3.6-来自piccorilustorridusdsm9790的葡糖淀粉酶gi48431212与pfreud_18290启动子和pfreud_18290信号肽组合的表达:
使用引物1和13(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物14和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:38所示。
实施例3.7-来自纤维复膜孢酵母(saccharomycopsisfibuligera)的葡糖淀粉酶gi113795与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和16(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物3和4扩增葡糖淀粉酶。在终止密码子后添加21个核苷酸合成全部葡糖淀粉酶,以使得能够使用共有的反向引物(引物4)进行扩增。由此获得的表达盒(即插入物)的dna序列如seqidno:39所示。
实施例3.8-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和17(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物6和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:40所示。
实施例3.9-来自梭菌属sp.5g000的葡糖淀粉酶gi231542与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和18(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物8和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:41所示。
实施例3.10-来自clostiridiumthermohydrosulfuricum的葡糖淀粉酶gi490533596与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和19(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物10和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:42所示。
实施例3.11-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和20(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物12和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:43所示。
实施例3.12-来自干热嗜酸菌dsm9790的葡糖淀粉酶gi48431212与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和21(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物14和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:44所示。
实施例3.13-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_08450启动子和pfreud_04850信号肽组合的表达:
使用引物22和23(表2)从费氏丙酸杆菌扩增pfreud_08450启动子的序列。使用无限制克隆方法将扩增的寡核苷酸序列克隆到已经含有pfreud_04850信号肽和葡糖淀粉酶序列(来自实施例3.8)的powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增。然后转移到dam\dcm-大肠杆菌菌株中,繁殖并纯化,产生非甲基化载体。插入物的dna序列如seqidno:45所示。
实施例3.14-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_04850启动子和pfreud_18250信号肽组合的表达。
使用引物24和25(表2)从费氏丙酸杆菌扩增pfreud_18250信号肽的序列。使用无限制克隆方法将扩增的寡核苷酸序列克隆到已经含有pfreud_04850启动子和葡糖淀粉酶序列(来自实施例3.8)的powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增。然后转移到dam\dcm-大肠杆菌菌株中,繁殖并纯化,产生非甲基化载体。插入物的dna序列如seqidno:46所示。
实施例3.15-来自褐色喜热裂孢菌tm51的木聚糖酶eor70069-f与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和26(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物27和28扩增木聚糖酶。由此获得的表达盒(即插入物)的dna序列如seqidno:47所示。
实施例3.16-来自褐色高温单孢菌(thermomonosporafusca)的纤维素酶p26222与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和29(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物30和31扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:48所示。
实施例3.17-来自解纤维素梭菌(clostridiumcellulolyticum)的纤维素酶wp_015924277.1与pfreud_04850启动子和pfreud_04850信号肽组合的表达:
使用引物15和32(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物33和34扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:49所示。
表2.引物
实施例4-将表达盒(插入物)克隆到powr3载体中,在费氏丙酸杆菌中表达,并检测各种底物中的多糖降解活性
使用无限制克隆方法(pelegy,ungert.“aplicationoftherestriction-free(rf)cloningformulticomponentsassembly”.methodsmolbiol.2014;1116:73-87)将实施例3(实施例3.1-3.17)的各种扩增的核苷酸序列(表达盒)克隆到powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增,然后转移到dam\dcm-大肠杆菌菌株中,繁殖和纯化,以产生非甲基化载体。
使用如实施例1中所述的电穿孔方法将纯化的载体插入到费氏丙酸杆菌中。检查所得的重组费氏丙酸杆菌表达和分泌多糖降解酶的能力,以及由此产生的降解合适糖类(例如,淀粉、纤维素和木聚糖)的活性。
检查各种底物中的淀粉降解活性—检测所得重组费氏丙酸杆菌表达和分泌葡糖淀粉酶的能力,以及所得的降解淀粉的葡糖淀粉酶活性。
将重组费氏丙酸杆菌菌落转移到含有yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐)和0.5%淀粉的琼脂平板上过夜培养。通过将lugol溶液倒在琼脂平板上以观察淀粉来检测淀粉的降解。
在淀粉存在下,lugol形成黑色沉淀。在葡糖淀粉酶存在下,淀粉被降解并且观察到无色的晕圈。对照lugol试验在图3中示出,其显示暴露于lugol溶液的含有yel培养基和0.5%淀粉的琼脂平板。含有淀粉的所有区域以黑色显示,而在葡萄糖淀粉酶在琼脂平板中扩散的区域中可以看到无色圆圈,表明不存在淀粉。
另外,将得到的重组(基因工程)费氏丙酸杆菌转移到含有0.5-5%淀粉的液体yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐)中,在30℃-37℃下过夜培养,然后在55℃培养2小时。首先,通过比色测定法测试0.5ml温育后培养物的葡萄糖含量。在一些情况下,将试验与在相同条件下和/或相同培养基处理的野生型(未修饰的)费氏丙酸杆菌培养物的对照培养物进行比较,所述培养基不包括添加的细菌。分泌的葡糖淀粉酶降解培养基中的淀粉并产生可通过比色法检测的葡萄糖。其次,进行类似的测定,其中将温育后培养基离心,仅检查上清液的葡萄糖含量。此外,测试在最佳条件下葡糖淀粉酶活性的活性:将0.1ml过夜培养物与0.4ml1%淀粉溶液一起温育2小时,之后将管离心并通过比色法检测上清液的葡萄糖含量。
另外,将10^8cfu/ml重组费氏丙酸杆菌接种到切碎的有机废物(ph5.5)中,在30℃-37℃过夜培养,然后在55℃培养约2小时。离心0.5ml过夜培养物,并通过比色法检测上清液的葡萄糖含量。
实施例4.1-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_04850启动子和pfreud_04850信号肽组合在费氏丙酸杆菌中的表达,以及其淀粉降解活性的检测。
如上所述将实施例3.11中描述的表达盒(seqidno:43)克隆到powr3载体中,并转化入费氏丙酸杆菌。
检查所得重组费氏丙酸杆菌表达和分泌葡糖淀粉酶的能力,并检测降解淀粉的葡糖淀粉酶活性。
将10^6-10^9cfu/ml所得重组(基因工程)费氏丙酸杆菌或相应的野生型细菌(费氏丙酸杆菌对照)转移至含淀粉的液体yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐),在30-37℃培养,然后在55℃下进行另外的培养。
在孵育期后,验证培养物在重组和对照费氏丙酸杆菌中的相似cfu含量(对于每种温度和/或cfu/ml细菌)。通过比色测定法检测每种培养物的葡萄糖含量。与野生型费氏丙酸杆菌对照相比,在重组费氏丙酸杆菌处理的培养基中观察到葡萄糖含量显着增加(超过35倍)。
这些结果表明,基因工程细菌可以成功地表达和分泌活性多糖降解酶(在该实施例中为葡糖淀粉酶),并且分泌的酶具有活性,因为它能够成功降解底物中的淀粉以产生葡萄糖。
实施例5-顺序进行乳酸利用和有机废物的糖化
使用利用la的细菌以顺序操作模式利用乳酸和糖化有机废物中的多糖。
在optimumcommercialblender中以多个批次研磨混合食物废物,其包括1000ml水中有1000gr食物废物。将10l(工作体积)的半固体混合物引入发酵罐(newbrunswick15l容量)。测量ph为5.2。
培养基在121℃原位灭菌(通过高压灭菌)30分钟,以200rpm搅拌培养基。然后将发酵罐冷却至37℃并保持温度。气流保持在顶部空间中以维持发酵罐中的正压力。
利用乳酸的细菌起始剂制备—发酵的接种物以及通过利用乳酸的细菌(在该实施例中,费氏丙酸杆菌(atcc9614))利用乳酸在1l摇瓶中,在酵母提取物乳酸盐(yel)培养基中,在37℃100rpm进行。细胞生长至细胞密度1*108。
发酵—接种15ml用于10.8l发酵,37℃,ph5.5(由10%氨溶液控制),直至基本上完全利用培养基中存在的乳酸。测定乳酸和总葡萄糖和果糖。将发酵液样品在15℃以6000g离心10分钟,并在reflectoquant分析系统(rqflexplus10)中分析上清液。
然后将发酵罐加热至55℃持续2小时,以使细菌分泌的多糖降解酶(例如,葡糖淀粉酶)的活性达到最佳条件,并使细菌灭菌(费氏丙酸杆菌)。糖化后,将发酵罐冷却至37℃,通过利用产乳酸菌(lab)进一步处理和制备分离的乳酸对映体。
lab起始剂的制备—鼠李糖乳杆菌(atcc11443)l-乳酸盐发酵的接种物:1升摇瓶,条件包括在37℃以100rpm搅拌的mrs培养基。细胞生长至1*109的密度。将15ml起始培养物接种用于10l发酵。温度控制在37℃,通过氨溶液(10%)控制ph为6.5。当葡萄糖从培养基中耗尽时终止l-乳酸盐发酵,典型地在24至48小时后。
实施例6-利用乳酸和有机废物糖化相伴进行
使用利用la的细菌相伴进行利用乳酸和有机废物中的多糖糖化。
在optimumcommercialblender中以多个批次研磨混合食物废物,其包括1000ml水中有1000gr食物废物。将10l(工作体积)的半固体混合物引入发酵罐(newbrunswick15l容量)。测量ph为5.2。
培养基在121℃原位灭菌(通过高压灭菌)30分钟,以300rpm搅拌培养基。然后将发酵罐冷却至37℃并保持温度。
利用乳酸的细菌起始剂制备—发酵的接种物以及通过利用乳酸的细菌(在该实施例中,费氏丙酸杆菌(atcc9614))利用乳酸在1l摇瓶中,在酵母提取物乳酸盐(yel)培养基中,在37℃100rpm进行。细胞生长至细胞密度1*108。
发酵—接种15ml用于10.8l发酵,37℃,ph5.5(由10%氨溶液控制),直至基本上完全利用培养基中存在的乳酸,伴随细菌分泌的多糖降解酶(例如,葡糖淀粉酶)将多糖糖化。测定乳酸和总葡萄糖和果糖。将发酵液样品在15℃以6000g离心10分钟,并在reflectoquant分析系统(rqflexplus10)中分析上清液。
然后将发酵罐加热至55℃持续2小时,以允许细菌灭菌(费氏丙酸杆菌)。
其后,将发酵罐冷却至37℃,以允许利用产乳酸的细菌(lab)进一步处理和制备分离的乳酸对映体。
lab起始剂的制备—鼠李糖乳杆菌(atcc11443)l-乳酸盐发酵的接种物:1升摇瓶,条件包括在37℃以100rpm搅拌的mrs培养基。细胞生长至1*109的密度。将15ml起始培养物接种10l发酵。温度控制在37℃,通过氨溶液(10%)控制ph为6.5。当葡萄糖从培养基中耗尽时终止l-乳酸盐发酵,典型地在24至48小时后。
sequencelisting
<110>3plw有限责任公司(3plwltd.)
<120>被遗传修饰以分泌多糖降解酶的利用乳酸的细菌(lacticacid-utilizingbacteriageneticallymodifiedtosecretepolysaccharide-degradingenzymes)
<130>plw001pct
<150>us62/276985
<151>2016-01-11
<160>189
<170>patentinversion3.5
<210>1
<211>1652
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>1
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccctgcag120
gagggccccctgaacaagcgcgcctacccctccttcgaggcctactcgaactacaaggtg180
gaccgcaccgacctggaaaccttcctggacaagcagaaggaggtgtcgctgtattacctg240
ctgcagaacatcgcctaccccgagggccagttcaataatggcgtgcccggcaccgtgatc300
gcctcgccctcgacctcgaatcccgattactactaccagtggacccgtgactcagccatc360
accttcctgaccgtgctgtcggagctggaggacaacaacttcaacaccaccctggccaag420
gccgtggagtactacatcaacacctcgtacaacctgcagcgcacctcgaacccctccggc480
tcgttcgacgacgagaatcacaagggcctgggcgagccaaagtttaataccgacggttcg540
gcctataccggcgcatggggccgtccccaaaatgatggtcccgcactgcgtgcctacgcc600
atctcgcgctacctgaacgacgtgaattcgctgaacgagggcaagctggtgctgaccgac660
tcgggcgacatcaacttctcgtccaccgaggacatctacaagaacatcatcaagcccgac720
ctggagtacgtgatcggctactgggactcgaccggcttcgacctgtgggaggagaatcag780
ggccgtcacttcttcacctcgctggttcagcagaaggccctggcctatgccgtggatatc840
gccaagtcgttcgatgacggcgacttcgccaataccctgtcgtcgactgcctcgaccctg900
gagtcgtacctgtcgggttcggacggcggcttcgtgaacactgacgtgaaccacatcgtg960
gagaaccccgatctgctgcaacagaattcgcgccagggcctggactcggccacctacatc1020
ggtcccctgttgacccatgatatcggcgagtcatcgtcgacccccttcgacgtggacaac1080
gagtacgtgctgcagtcgtactacctgctgctggaggacaataaggaccgctactccgtg1140
aactcggcctactcggccggcgccgccatcggtcgttatccagaggatgtgtataatggc1200
gacggctcctcagaaggcaatccctggttcctggccaccgcatacgccgcacaggttccc1260
tacaagctggcctacgacgccaagtcagcctcgaatgacatcaccatcaacaagatcaac1320
tacgacttcttcaacaagtacatcgtggacctgtcgaccatcaactccgcctaccagtcg1380
tcggactcggtgaccatcaagtcgggctcggacgagttcaacaccgtggccgacaacctg1440
gtgaccttcggcgactcgttcctgcaggtcatcctggaccacatcaacgacgacggctcg1500
ctgaatgagcagctgaaccgttacaccggctactccaccggtgcctactcgctgacctgg1560
tcatcgggcgccttgttggaggccattcgtctgcgcaataaggtgaaggccctggcctga1620
tgatgccgatcacctacaactgaatcccatgg1652
<210>2
<211>2006
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>2
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatctcg120
aagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgccatc180
ctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtg240
gcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggcttg300
gtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgaccatc360
gagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacctg420
tcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactggc480
tcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtttc540
ggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccctg600
gtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgtgg660
gaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggt720
tcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaa780
atcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgactcg840
tcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacccc900
gaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatcac960
aaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagactcg1020
gaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggttc1080
ctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagcag1140
ggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacgcc1200
accggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagacc1260
ttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcg1320
gagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcatat1380
gccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtgag1440
acgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctactca1500
tcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccgcc1560
accccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaaag1620
acctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgaccttc1680
gacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgcag1740
ctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgtca1800
gatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttc1860
atccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtacacc1920
gtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgatgc1980
cgatcacctacaactgaatcccatgg2006
<210>3
<211>2165
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>3
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatcgac120
cgcttcaacaacatctccgccgtgaacggccccggcgaggaggatacctgggcctccgcc180
cagaagcaaggtgtgggcaccgccaataattacgtgtcaaaggtgtggttcaccctggca240
aacggcgccatctcggaggtgtactaccccaccatcgacaccgccgacgtgaaggagatc300
aagttcatcgtgaccgacggcaagtcgttcgtgtcggacgagacgaaggacaccatctcg360
aaggtggagaagttcaccgacaagtcgctgggctacaagctggtgaacaccgacaagaag420
ggccgctaccgcatcaccaaggagatcttcaccgacgtgaagcgcaactccctgatcatg480
aaggccaagttcgaggccctggagggctcgatccacgactacaagctgtacctggcctac540
gacccccacatcaagaaccagggctcgtacaatgagggctacgtgatcaaggccaacaac600
aacgagatgctgatggccaagcgcgacaacgtgtacaccgccctgtcgtcgaatatcggc660
tggaagggctactcgatcggctactacaaggtgaacgacatcatgaccgacctggacgag720
aacaagcagatgaccaagcactacgactccgcccgcggcaacatcatcgagggcgccgag780
atcgacctgaagaagaactcgcagttcgagatcgtgctgtcgttcggcaactccgaggac840
gaggccgtgaaggcctccatcgagacgctgtcggagaattacgactcgctgaagtcggcc900
tacatcgacgagtgggagaagtactgcaactcgctgaacaacttcaacggcaaggccaat960
tcgctgtactacaactccatgatgatcctgaaggcctcggaggacaagaccaataagggc1020
gcctacatcgcctcgctgtcgatcccctggggcgacggtcagggcgacgataataccggc1080
ggttaccaccttgtgtggtcacgtgatctgtaccacgtggccaatgccttcatcgccgcc1140
ggtgacgtggactcggccaaccgctcgctggactacctggccaaggtggtgaaggacaat1200
ggcatgattccccagaatacctggatctccggcaagccctactggaccggcatccagctg1260
gacgagcaagccgaccccattatcctgtcgtaccgcctgcgccgctatgacctgtatgac1320
tcgttggtgaagcccctggccgacttcatcatcaagatgggccccaaaactggtcaggaa1380
cgttgggaggagattggtggctattcacccgcaaccatggccgccgaggtggccggcttg1440
acctgtgccgcctacatcgccgagcagaataaggactacgagtcggcccagaagtatcag1500
gagaaggccgacaactggcagaagctgatcgacaacctgacctacaccgagcacggcccc1560
ctggagaacggtcagtactacatccgcattgccggcttgcccgatcccaatgccgacttc1620
accatctccatcgccaatggtggcggcgtgtatgaccagaaggagatcgtggacccctcg1680
ttcctggagctggttcgcctgggcgtgaagtcaccagacgaccccaagattctgaacacc1740
ctgcgcgtggtggactccaccatcaaggtggatacccccaagggcccctcgtggtaccgc1800
tacaaccatgacggctacggcgaaccatcgaagaccgaactgtaccatggcgcaggtaag1860
ggtcgtttgtggcccctgttgaccggcgagcgcggcatgtacgaaatcgccgcaggcaag1920
gatgccactccctatctgaaggccatggagaatttcgccaacgagggcggcattatctcg1980
gaacaagtgtgggaggataccggtctgcccaccgactcagcctcgcccttgaattgggcc2040
cacgccgagtacgtggtgctgttcccctcgaacatcgaacacaaggtgctggacatgccc2100
gacatcgtgtacaagcgctacgtggccaagtgatgatgccgatcacctacaactgaatcc2160
catgg2165
<210>4
<211>1238
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>4
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggag120
aacctggtcgagaagtcgatcaagatcatcaagaacaaccagtcggagtacggctccttc180
atcgcctcaccctcgttccccacctaccacttctcgtggttgcgcgacggctcgttcatc240
gcctactccatggacctggtggagcaatacgccgaggccaagaagttctaccgctgggtg300
aatgaggtgatcatccgctactcgtacaaggtggacaagatcatcgagaagatcaagaac360
ggcaacaagctggagcccaatgacttcctgtacgcccgctataccctggagggctacgag420
gagaaggattcgggctggggcaatttccaactggatggctacggcacctggctgtggggc480
ctgtcggaacacatcaagatcaccggcaagaccgagctgatcaacgacttcttcaagtcc540
atcgacatcaccatcaagtacatcgacaacctgtggtactaccccaacttcgacgtgtgg600
gaggagaactccgacaagatccacacctcgaccctggcctgcctgtacggcggcctgaac660
tcgatcaacaagtacctgaacgacgacaaggtgaaggagctggccaacaagatcaagacc720
tacatcctgaccaactgcgtggtggagaactcgttcgtgaagtacgtgggctcgaactcg780
gtggactcgtcgctgatctggctggccatccccttcgaggtggtggacgtgaatgacgag840
atcttcctgaacaccatcaagcgcatcgagaaggagctgctgcacaatggcggcatgcac900
cgttaccgcaaggacacctactacggcggcggccagtggattctgctgtccgcctggatg960
ggtctgtactactgcaagtcgggcgactacaagaaggccgaggaggtgaagaagtggatc1020
gaggagcaggccgacgagaacggctacctgcccgagcaggtcccctaccacctgaacaac1080
gaggtgtactacccctactgggtgaacaagtggggcaacatcgccaagcccctgctgtgg1140
tcgcacgccatgtacctggtgctggactacgagctgaagaaggccggcgtgcagctggag1200
gactgatgatgccgatcacctacaactgaatcccatgg1238
<210>5
<211>2183
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>5
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacatc120
tccaacatcaagatcgagcgcctgaataacgtgcaggccgtgaatggccccggtgaggcc180
gacacttgggccaaagcccagaagcagggtgtgggcaccgccaacaattacacctccaag240
gtgtggttcaccatcgcagacggtggcatctccgaggtgtactaccccaccatcgacacc300
gccgacgtcaaggacatcaagttcttcgtgaccgacggcaagaccttcgtgtccgacgag360
acgaaggacaccatcaccaaggtggagaagttcaccgagaagtccctgggctacaagatc420
atcaacaccgacaaggagggccgctacaagatcaccaaggagatcttcaccgacgtgaag480
cgcaactccctggtgatcaagaccaagttcgaggccctgaagggcaacgtggacgactac540
cgcctgtacgtgatgtgcgacccccacgtgaagaaccagggcaagtacaacgagggctac600
gccgtgaaggccaacggcaatgtggccctgatcgcagagcgcgacggtatctacaccgcc660
ctgtcgtccgacatcggttggaagaagtactcgatcggctactacaaggtgaacgacatc720
gaaaccgacctgtacaagaacatgcagatgacctacaactacgactccgcccgcggcaat780
atcatcgagggcgccgagatcgacctgaagaagaaccgccagttcgagatcgtgttgtcg840
ttcggccagtcggaggacgaggccgtgaagaccaatatggagacgctgaatgacaattac900
gactcgctgaagaaggcctacatcgaccagtgggagaagtactgcgactccctgaacgac960
ttcggcggcaaggccaactcgctgtacttcaactccatgatgatcctgaaggcctccgag1020
gacaagaccaacaagggcgcctacatcgcatcgctgtcgatcccctggggtgacggccag1080
gaagacgacaatatcggcggctaccacctggtttggtcccgcgacttgtaccacgtggcc1140
aatgccttcattgtggccggcgataccgactcggccaatcgcgccttggactacctggac1200
aaggtggtgaaggacaacggcatgatcccccagaacacctggatcaatggccgcccctac1260
tggaccggcattcagctggacgaacaggccgaccccatcatcctgtcataccgcctgaag1320
cgctacgacctgtacgagtcgctggtgaagcccctggccgacttcatcatgaagatcggc1380
cccaagaccggccaggaaagatgggaggaaattggtggctactcacccgccaccctggca1440
tcggaagttgccggcctgacctgtgcagcctacatcgccgagcagaacaaggacttcgag1500
tccgccaagaagtaccaggagaaggccgacaactggcagcgcctgatcgacaatctgacc1560
tacaccgaaaagggccccttgggcgacggccactactacatccgcattgccggcctgccc1620
gatcccaatgccgacttcatgatctcgatcgccaatggtggcggtgtgtacgaccaaaag1680
gagatcgtggacccctcgttcctggagctggtgcgcctgggtgttaagtccgccgacgac1740
cccaagatcctgaacaccctgaaggtggtggacgagactatcaaggtggacacccccaag1800
ggcccctcgtggtatcgttataatcacgacggctacggcgagatgtcgaagaccgaactg1860
taccacggcaccggcaagggccgtctgtggcccctgttgaccggtgaaagaggtatgtat1920
gagatcgccgccggtaaggacgccacctcgtatgtgaaggccatggagaacttcgccaat1980
gagtccggcatcatctcggaacaggtgtgggaagataccggcctgcccactgactccgcc2040
tcacccctgaattgggcccacgccgagtacgtgatcctgttcgcctccaatatcgagcac2100
aaggtgctggacatgcccgacatcgtgtacaagcgctacgcctcgaagtgatgatgccga2160
tcacctacaactgaatcccatgg2183
<210>6
<211>2183
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>6
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactccccctcatac120
gtgaaggtggagcatctggataagaccgaggcctcccagggtcccggcgaacgtgatacc180
tgggccaccgcccaaaagcagggtatcggcaccgccaataatgacgtttcgaaggtttgg240
ttcaccctggcccagggcgccctgtcggagatctactaccccaccatcgaccgcgccaac300
tcgaagttcctgaagttcatcgtgaccgacggcaagaccttcgtggccgacgaaaccacc360
gacaccgtgtcgaaggtcgagaagatcaacaaccgctcgctggcctaccgcctggtgaat420
atcgacaagcgcggccgctacaagatcaccaaggagatcttcaccgacccccgccgcaac480
tccgtggtgatgaaggtgcgcttcgaggccctgaagggcaagatggaggactacaagctg540
tacctggtgtacgacccccacatctcgaaccagggcgccgacaatgagggctacgtggtg600
aaggccaatggcgagtacggcttcatggcctgccgcaacaacgtgtactcggccctgatg660
accgatgccaagtggggctcgtactcggtgggctacaatggcgtgaacgaccccgtgtcg720
gatctgaagaagaacaagaagatgacctacaagttcgaccgcgccaagggcaatatcatc780
gagggcatcgagatcgacctgcgcgacaagaccgagttcaagaccgtgctgtcgttcggc840
gagtcggaggaggaggccctgaagaccgccctgtcaactctgaaggactcgtacgaccgc900
atgctgggcatctacatcgccgagtggaacaagtactgcgacggcctgaagaacttcggc960
ggcgaggccgacgagctgtactacacctcgctgatgttcctgaaggcctccgaggacaag1020
accaacaaaggcgccttcatcgcctcgctgtcgatcccctggggcgaaggtcagggcgac1080
gaaaataagggcggctaccacctggtgtgggcccgtgatctgtatcacatcgccaatgcc1140
ttcatcgccgccaaggacatcgactcggccaatcgcgccctggacttcctggccatggtg1200
gtggagaagaatggcttcatgccgcagaacacctggatcaacggcgacccctactggaac1260
ggcatccagatggacgagcaggccgaccccatcatcctggcctaccacctgaagcgctac1320
gacctgtacgagaagctggtgaagcccctggccgacttcatcgtgagagtgggtcccaag1380
actggccaagaacgttgggaagaagccggtggttattcgccagccaccatggcagcagag1440
gttgccggcctggtttgcgccgccgacatcgccaagcagaataaggatatggagcgcgcc1500
aagaagtacctggagacggccgacaagtggcaggagctgatcgacaagctgacctacacc1560
accaagggcccctacggtaatggccagtactatatccgcatcgccggcctgcccgatccc1620
gacgccgatttcctgatctccatcgcaaatggcggcggcgtgtatgaccaaaaggagatc1680
gtggacccctcgttcctggagctggtgcgcctgggcgtgaaggcctacgacgatcccaag1740
atcctgaataccatctcggtggtggactcgctgctgaaggtgaacacccccaagggcccc1800
tcgtggtaccgctacaaccacgacggttacggtgaaccagccaagggcgaactgtatcat1860
ggtaagggcaagggtcgcctgtggccactgttaaccggcgagcgcggtatgtacgagatc1920
gccgccggcaagaaggccgacgactacctggagtacatgcgcaatttcgccaacgagggc1980
ttcgtgctgtcagagcaaatctgggaggacaccggcttgcccaccgattcggcctccccc2040
ctgaattgggcacacgccgagtatgtggtgctgttcgcctccaatatcgagggcaaggtg2100
gtggacatgccccagatcgtgtacaagcgctacgtgctgggcgagcgctgatgatgccga2160
tcacctacaactgaatcccatgg2183
<210>7
<211>2057
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>7
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggtg120
cgctacatccccatgggcaacggcaagatcctggtgtccttcaacaacgactacaacctg180
accgacttctacttctcgaaggacatggccgagaaccactccgccggcaagcccttccgc240
tacggcgtgtcgatcaacgacaagttcacctggatcaacgcctcgaacatcgtgtcgaag300
gactactacgaccacaccatgatcggcatcgtgaagtacaacatcaacgacgtgtcgttc360
gaggacgacaacttcgtggacatctacgaggacgtgtacgcccgcaagatcaagatcacc420
aacaagcgcaaggagaagatcaacgtgaagctgttcttccaccagaacttctccatctac480
ggcaacaacatcggcgacaccggcttctactaccccgacaccaacgccatcgtgcactac540
aagggccgccgctacttcatcatctcgaccaccgacggcaagaactcgttcgaccagtac600
gccatcggcatcaaggacttcaacggcatggccggcacctggaaggacgccgaggacaat660
aatttgtcgatgggccccatcgccatcggctcggtggactccaccattcgtcactcgatc720
gacatcgatcccgagtcgcagaaggagctgtactactacatcgcctgcgcccgcgacttg780
gacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaatctggaccgcatgatgaag840
cgcaccgagaatttctgggagctgtgggtgtcgaagtcgcccctgaatctgaccgccgag900
ctgaacgagatgtacaagaagtcgctgttcatcatccgctcgcacatcaatgagaagggc960
gccgtgatggcctcctcggattcggatatcctgcgctcgaatatggactcgtactactac1020
tcatggccccgcgacgccggctacgcagccatctcaatgatcgtgtccgagcactcggac1080
cccgccaagctgttcttcgacttctgcatcaacaccatctccaaggacggctacttctac1140
cacaagtacaaccccgacggcaagattgcctcgtcgtggctgccctatatcatggacggc1200
aagcgcatcctgcccatccaggaggacgagtcagccatcgtgatcatcgccgcctggtac1260
tactactcgaccaacaatgacatcgagtacatctcctacctgtacgagcgcctgatcaag1320
cgcgtggccgagttcctgtacaacttcacctacgacaacggtctgcccaaggagtcattc1380
gacctgtgggaggagcgcttcggcatccacacctacaccgtggcctcggtgtacatcgcc1440
ctgatctatgccgccaatttcgccgagatcttcaacgagacggacctggcccgcaagtac1500
aagtccaaggccgacaagatgctggagtcgttcgagaagatgttctactcggacgacctg1560
ggctactacgcccgccgcatctacaacggcgacgtggacttcgtgctggactcatcggtg1620
ctgtggctggtgatcttcggcatcaagaagcccgatgacccacgcatcgtgtccaccgtg1680
aaggccatcgagaagaagctgtgggtgcccggcatcggtggtatcgccagatacgagggc1740
gactactaccagcgcatctcgggcaagaatatccccggcaacccctggatcatcactacc1800
ctgtggctggccgactattacatcatggccggcaataccggccgcgccctggagctgatc1860
aactgggtggttcagcactcagaggagtcgggcatcctgtcggagcagatcaatcccgat1920
aatggcgagcccatctcggtgtcccccctgatctggtcgcactcgcagctggtgctgact1980
ctgaagcgctacaaggacgccatcaagaacaagggcatccagtgatgatgccgatcacct2040
acaactgaatcccatgg2057
<210>8
<211>2567
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>8
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaattcg120
tacaagtcgtccgtggtgcccgtgaagaagaatatctacttcaccggcaacctgtcccgc180
gacttcgacggcaatatcatcggcatcaacaatcacgcctcgccctggggcgccaacaac240
gtgatcaagaagctgtacctggcctacaacgaaaccgacctgttcatcggcgtgtacgag300
aacatctcctacaactcgctgatgatcttcatcaccaacgtgaccaacgacatctacggc360
acctccaacatctcgaatatgaacacctggaaccgcgacatcaccttcgagggcaccatg420
aactacttctcggccgtgtacttcgacggcaacaacatcaatcccgccggctacggcacc480
tacgccatcatgtcgggcaagaattcgaccccactggccaagcccatcaactccaccttc540
gccttcttccccggcaataacaccaccgagatcgccatccccttctcacagatgttccag600
cacggcttcaatggcaatctgtcgttcggtatttcggccttcgtggtgggcggctcgggc660
ccatgggtgggctcaggcatcccctatcaccagaaaggcatctacaatgacggcaatcag720
gcctccttcctgatcaacgacaccatcgagatcaacatccccggcatccacgtgtcgccc780
ctgccctcgtacgtggactacccctcctacctgctgatgtccaactggaagaacaatgac840
ttctggatcgccaccggcatccccgactcgtacctgggcaactactcctacgtgcacctg900
tcgatgcagaccgtgaacatcgagaacaagatcctgcccctgaagttctacttcgacatc960
ttcggccactccatctcggcccgcctgacccccaacaacaccatcaacgtgcgcaccaac1020
aactcggagttcgagctgatcgaccccccctacatgaatcagaccgacgtgatccagaag1080
tccaagtccaccatctactcgtacatctccatgccctacatcaagtacaacgcctccggc1140
aaccagatctcgctgtacaagtacaatctgaccctgttcttcgtgaactcctcgtacaat1200
atcaacaacgactcgggcatgctgaatatctcgatcgtgtcgggccccggcacctcgatc1260
atcggcctgtcgaccaactcgacctacatgaacctggactacatcaaggacgtgaaccac1320
gccaacatcatgaagtggctgtccaagtcgaaggtgtcgatctccggccgctacttgatc1380
gagtacaacatgtcgcagctgctggtgaaggacgaccagaaccccttcaccggcgaaatc1440
gtggcctccccctcccccgtttacttctataattgggtgcgcgacgcctcgttctccgcc1500
atctcactgcaggactcaggccacattcgctcagccatgaagtattgggatttcatggcc1560
ggcgtgcagggcgtggacacctataatggcacctggcagacccgcttcaatttctggaat1620
ggctccgtggccggcttcgtgtatcccgagttcgactcggtgggcctgttcgagatcggc1680
atctacaacctgttccaggtgacccacaatatctccgtgatccagaagttcatgcccaac1740
atcctggcctcgctggagttccaggagaagtccatcaagaagtacggcttcatcgccgag1800
gaccactcgatctgggagatggagtacggctactggttctggacccaggccatcaattat1860
ctgggcattcgcgacatctcaagaatgcccatgatccagaatcacaatgccgttcccgtg1920
ccgcccggccccgtgccccccggtaacatgaataccgccatgatcgcccacaagctgaag1980
tcgaacatcatcaagtacttctacatggacaacatcttcgcccagtacctggtgcccgtc2040
accaaccagtacggcgacaacaactacacctacttcatggccaacaataccccggactcg2100
tcgcagatcctgcccattgccatgggcttcatcaacccctcgtcccccatggccacctcc2160
atcgtgcacaacatctacatgatcctgtggaactaccgcgtgggtggcctgccccgctac2220
tacaatgacctgtaccactacaccgaatacggcggctaccacgaatcatcaggtccctcg2280
cccccctggatcatcaccactctgttcctggccctgtacgacgagaagaccggtaatatg2340
accggcgccctgaatctgatgaagtggtcgtactcgcactcgcagtcgtggctgctgccc2400
gaggccgtggaccccaatttcggctcggtgattgcatcaacctcaccactgacctggtca2460
tcagccatgtatattatcgtttcgctgaattaccgcgccatgccccccgccccgctgccc2520
ccaggccccccctgatgatgccgatcacctacaactgaatcccatgg2567
<210>9
<211>2316
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>9
atgcgcacgttgaaaaccttcgccctggcctcggccgcgaccctgatcgccaccgccgcc60
caggccgcgcctacgacctgggcctattcggccaagaccggtgtcggcgcctcctacgag120
gcctatgtcgacggcgcctacaaggccggcggcaagaccggggcggtgtcgaaggtctgg180
ttctcgatcgccgacggggtcctcaccgagacgatgtacggcctgatccatgaggcgcag240
atcaagcagatgcgcgtcgccgtcgagacggcgagcggcctggccattgagggggcggat300
acgacctccaagaccgagtatctgcatgtggacgccgccggccggccgctgtctccggcc360
tacaagatcaccacgaccgatcgccaaggccggtttgtcatcgaaaagcgcatcttcacc420
gatcccgaccgcaatgcgctgttcgtgcgcgtgacggtgacggccctgaaaggcgcggtc480
acgccgaccctgctgctggagccgcacatggccaacaccggcggtggcgatgtgggcgcg540
gcctcggcctcggcgctcaccgcccacgagggcaaggcgttcctcagcctgaaggccagc600
aagccctttgcgaaagcctcggccagcgttctgaaggatggcgatgctctggcggctttg660
aaggcgaccacgacttcggccaagggcgcgatcgtgctggccggagagctgcccaaggtc720
gccaagtccgagacctttgacgtggtgatcggcttcggcgctgacgccaaggccgccgac780
cggaccgccgccgcgacgctgaagacgggctacgccgaggtcctggcccgctacaacggc840
gagggcgcgcatgtgggctgggaggactatctggcctcgctgaacgaactgccgcgactg900
cgcgacgcgtccgaggacggcggcaagcttctccaggccagcgctctgatgctcaaggtg960
caggaagaccgcacctatgccggcgccctgattgcctcgctgtccaacccctggggcgac1020
acggtcgacgcgaccaagtcctcgaccggctacaaggccgtctggccgcgcgacttctat1080
cagtgcgccatggccttggcggccctgggcgacaaggagacgccgctggcggccttccac1140
tatctgcccacggtccaggtcgggcccaagacgccgggcaacaagggcgacggcggctgg1200
ttcctgcagaagtcgcacgtcgacggcacgcccgagtgggtcggggtccagctcgaccag1260
acggccatgccgatcatgctgggctggaagctctggacgtggggctggctgccggacgcc1320
gagctgaaggcgttctacggcaagatgctgaagccggcggccgacttcctggtcaagggc1380
ggcaaggtcaatctggactggaacaccgcgaccatcactccgcccttcacccagcaggag1440
cgctgggaagaacagggcggccactcgccctcgacgaccgccgccgtcattgcaggcctg1500
gtggtcgccggcgacatcgccgaggccgccggcgacgccggctcggccgaactctatcgc1560
aagaccgccgacgactgcgccggcaagctcgaggcccggatggtcacgacgaaggggacc1620
ttcggcgacggccactattatctgcgtctcaacagtgaccaggacccgaacaacaagagc1680
ccggtcgaggcgcgtaacggccaggctccggtggccgaggacaagatgctggacgcgggc1740
ttcctggagctggtgcgctatggcgttcgccgcgccgatgatccggcgatcctggccagc1800
ctgccggagattgatgacgaggccctcgaagacctctaccgcgttcgctacagcttcacg1860
ttccctggcgtggagggcagcttccccggctggcgccgctacggcgtcgacggctacggc1920
gaggacaccaagaccggcgccaactacggcgccgacaaccagatgcgtcccggccaaagg1980
ggccgggtgtggccgatcttcaccggcgagcgtgggcactacgagctggccgtggcgggc2040
ctctcgggcaagcccgatcccaccgccgtgcagaagatccgcgatacctacgtcaaggcg2100
atggagttgttcgccaacgagggactgatgatccccgagcaggtctgggacggcgtcggg2160
accgacagcgctcatggctatgtccggggcgaggggaccgattcggccacgcccctggcc2220
tggagccacgcggagtacgtcaagctgctgcgatcggtcagcgacgggcaggtctgggat2280
cactatgcgcccgtaaaggcgcggtacgcgcgctag2316
<210>10
<211>1539
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>10
atgaaacaacaaaaacggctttacgcccgattgctgacgctgttatttgcgctcatcttc60
ttgctgcctcattctgcagcagcggcggcaaatcttaatgggacgctgatgcagtatttt120
gaatggtacatgcccaatgacggccaacattggaagcgtttgcaaaacgactcggcatat180
ttggctgaacacggtattactgccgtctggattcccccggcatataagggaacgagccaa240
gcggatgtgggctacggtgcttacgacctttatgatttaggggagtttcatcaaaaaggg300
acggttcggacaaagtacggcacaaaaggagagctgcaatctgcgatcaaaagtcttcat360
tcccgcgacattaacgtttacggggatgtggtcatcaaccacaaaggcggcgctgatgcg420
accgaagatgtaaccgcggttgaagtcgatcccgctgaccgcaaccgcgtaatttcagga480
gaacacctaattaaagcctggacacattttcattttccggggcgcggcagcacatacagc540
gattttaaatggcattggtaccattttgacggaaccgattgggacgagtcccgaaagctg600
aaccgcatctataagtttcaaggaaaggcttgggattgggaagtttccaatgaaaacggc660
aactatgattatttgatgtatgccgacatcgattatgaccatcctgatgtcgcagcagaa720
attaagagatggggcacttggtatgccaatgaactgcaattggacggtttccgtcttgat780
gctgtcaaacacattaaattttcttttttgcgggattgggttaatcatgtcagggaaaaa840
acggggaaggaaatgtttacggtagctgaatattggcagaatgacttgggcgcgctggaa900
aactatttgaacaaaacaaattttaatcattcagtgtttgacgtgccgcttcattatcag960
ttccatgctgcatcgacacagggaggcggctatgatatgaggaaattgctgaacggtacg1020
gtcgtttccaagcatccgttgaaatcggttacatttgtcgataaccatgatacacagccg1080
gggcaatcgcttgagtcgactgtccaaacatggtttaagccgcttgcttacgcttttatt1140
ctcacaagggaatctggataccctcaggttttctacggggatatgtacgggacgaaagga1200
gactcccagcgcgaaattcctgccttgaaacacaaaattgaaccgatcttaaaagcgaga1260
aaacagtatgcgtacggagcacagcatgattatttcgaccaccatgacattgtcggctgg1320
acaagggaaggcgacagctcggttgcaaattcaggtttggcggcattaataacagacgga1380
cccggtggggcaaagcgaatgtatgtcggccggcaaaacgccggtgagacatggcatgac1440
attaccggaaaccgttcggagccggttgtcatcaattcggaaggctggggagagtttcac1500
gtaaacggcgggtcggtttcaatttatgttcaaagatag1539
<210>11
<211>1359
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>11
gagtcgaccctgcgcgagctggccgcccagaacggcggccgccacttcggcaccgccatc60
gcctactcgcccctgaactcggacgcccagtaccgcaacatcgccgccacccagttctcg120
gccatcacccacgagaacgagatgaagtgggagtcgctggagccccagcgcggccagtac180
aactggtcgcaggccgacaacatcatcaacttcgccaaggccaacaaccagatcgtgcgc240
ggccacaccctggtgtggcactcgcagctgccctcgtggctgaacaacggcggcttctcg300
ggctcgcagctgcgctcgatcatggagaaccacatcgaggtggtggccggccgctaccgc360
ggcgacgtgtacgcctgggacgtggtgaacgaggccttcaacgaggacggcaccctgcgc420
gactcgatctggtaccgcggcatgggccgcgactacatcgcccacgccttccgcaaggcc480
cacgaggtggaccccgacgccaagctgtacatcaacgactacaacatcgagggcatcaac540
gccaagtcgaacggcctgtacaacctggtggtggacctgctgcgcgacggcgtgcccatc600
cacggcatcggcatccagtcgcacctgatcgtgggccaggtgccctcgaccttccagcag660
aacatccagcgcttcgccgacctgggcctggacgtggccatcaccgagctggacatccgc720
atgcagatgcccgccgaccagtacaagctgcagcagcaggcccgcgactacgaggccgtg780
gtgaacgcctgcctggccgtgacccgctgcatcggcatcaccgtgtggggcatcgacgac840
gagcgctcgtgggtgccctacaccttccccggcgagggcgcccccctgctgtacgacggc900
cagtacaaccgcaagcccgcctggtacgccgtgtacgaggccctgggcggcgactcgtcg960
ggcggcggccccggcgagcccggcggccccggcggccccggcgagcccggcggccccggc1020
ggccccggcgagcccggcggccccggcgacggcacctgcgccgtgaactacaccgtggtg1080
aacgactggggccacggcatgcagggcgccatcaccgtgtcgaacaccggctcgtcgccc1140
atcaacaactggaccctgcagttctcgttctcgggcgtgaacatctcgaacggctggaac1200
ggcgagtggtcgcagtcgggctcgcagatcaccgtgcgcgcccccgcctggaactcgacc1260
ctgcagcccggccagtcggtggagctgggcttcgtggccgacaagaccggcaacgtgtcg1320
cccccctcgcagttcaccctgaacggcgccacctgctcg1359
<210>12
<211>1230
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>12
aacgactcgcccttctacgtgaaccccaacatgtcgtcggccgagtgggtgcgcaacaac60
cccaacgacccccgcacccccgtgatccgcgaccgcatcgcctcggtgccccagggcacc120
tggttcgcccaccacaaccccggccagatcaccggccaggtggacgccctgatgtcggcc180
gcccaggccgccggcaagatccccatcctggtggtgtacaacgcccccggccgcgactgc240
ggcaaccactcgtcgggcggcgccccctcgcactcggcctaccgctcgtggatcgacgag300
ttcgccgccggcctgaagaaccgccccgcctacatcatcgtggagcccgacctgatctcg360
ctgatgtcgtcgtgcatgcagcacgtgcagcaggaggtgctggagaccatggcctacgcc420
ggcaaggccctgaaggccggctcgtcgcaggcccgcatctacttcgacgccggccactcg480
gcctggcactcgcccgcccagatggcctcgtggctgcagcaggccgacatctcgaactcg540
gcccacggcatcgccaccaacacctcgaactaccgctggaccgccgacgaggtggcctac600
gccaaggccgtgctgtcggccatcggcaacccctcgctgcgcgccgtgatcgacacctcg660
cgcaacggcaacggccccgccggcaacgagtggtgcgacccctcgggccgcgccatcggc720
accccctcgaccaccaacaccggcgaccccatgatcgacgccttcctgtggatcaagctg780
cccggcgaggccgacggctgcatcgccggcgccggccagttcgtgccccaggccgcctac840
gagatggccatcgccgccggcggcaccaaccccaaccccaaccccaaccccacccccacc900
cccacccccacccccacccccccccccggctcgtcgggcgcctgcaccgccacctacacc960
atcgccaacgagtggaacgacggcttccaggccaccgtgaccgtgaccgccaaccagaac1020
atcaccggctggaccgtgacctggaccttcaccgacggccagaccatcaccaacgcctgg1080
aacgccgacgtgtcgacctcgggctcgtcggtgaccgcccgcaacgtgggccacaacggc1140
accctgtcgcagggcgcctcgaccgagttcggcttcgtgggctcgaagggcaactcgaac1200
tcggtgcccaccctgacctgcgccgcctcg1230
<210>13
<211>2070
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>13
gccggcacctacaactacggcgaggccctgcagaagtcgatcatgttctacgagttccag60
cgctcgggcgacctgcccgccgacaagcgcgacaactggcgcgacgactcgggcatgaag120
gacggctcggacgtgggcgtggacctgaccggcggctggtacgacgccggcgaccacgtg180
aagttcaacctgcccatgtcgtacacctcggccatgctggcctggtcgctgtacgaggac240
aaggacgcctacgacaagtcgggccagaccaagtacatcatggacggcatcaagtgggcc300
aacgactacttcatcaagtgcaaccccacccccggcgtgtactactaccaggtgggcgac360
ggcggcaaggaccactcgtggtggggccccgccgaggtgatgcagatggagcgcccctcg420
ttcaaggtggacgcctcgaagcccggctcggccgtgtgcgcctcgaccgccgcctcgctg480
gcctcggccgccgtggtgttcaagtcgtcggaccccacctacgccgagaagtgcatctcg540
cacgccaagaacctgttcgacatggccgacaaggccaagtcggacgccggctacaccgcc600
gcctcgggctactactcgtcgtcgtcgttctacgacgacctgtcgtgggccgccgtgtgg660
ctgtacctggccaccaacgactcgacctacctggacaaggccgagtcgtacgtgcccaac720
tggggcaaggagcagcagaccgacatcatcgcctacaagtggggccagtgctgggacgac780
gtgcactacggcgccgagctgctgctggccaagctgaccaacaagcagctgtacaaggac840
tcgatcgagatgaacctggacttctggaccaccggcgtgaacggcacccgcgtgtcgtac900
acccccaagggcctggcctggctgttccagtggggctcgctgcgccacgccaccacccag960
gccttcctggccggcgtgtacgccgagtgggagggctgcaccccctcgaaggtgtcggtg1020
tacaaggacttcctgaagtcgcagatcgactacgccctgggctcgaccggccgctcgttc1080
gtggtgggctacggcgtgaaccccccccagcacccccaccaccgcaccgcccacggctcg1140
tggaccgaccagatgacctcgcccacctaccaccgccacaccatctacggcgccctggtg1200
ggcggccccgacaacgccgacggctacaccgacgagatcaacaactacgtgaacaacgag1260
atcgcctgcgactacaacgccggcttcaccggcgccctggccaagatgtacaagcactcg1320
ggcggcgaccccatccccaacttcaaggccatcgagaagatcaccaacgacgaggtgatc1380
atcaaggccggcctgaactcgaccggccccaactacaccgagatcaaggccgtggtgtac1440
aaccagaccggctggcccgcccgcgtgaccgacaagatctcgttcaagtacttcatggac1500
ctgtcggagatcgtggccgccggcatcgaccccctgtcgctggtgacctcgtcgaactac1560
tcggagggcaagaacaccaaggtgtcgggcgtgctgccctgggacgtgtcgaacaacgtg1620
tactacgtgaacgtggacctgaccggcgagaacatctaccccggcggccagtcggcctgc1680
cgccgcgaggtgcagttccgcatcgccgccccccagggcaccacctactggaaccccaag1740
aacgacttctcgtacgacggcctgcccaccacctcgaccgtgaacaccgtgaccaacatc1800
cccgtgtacgacaacggcgtgaaggtgttcggcaacgagcccgccggcggctcggagaac1860
cccgaccccgagatcctgtacggcgacgtgaactcggacaagaacgtggacgccctggac1920
ttcgccgccctgaagaagtacctgctgggcggcacctcgtcgatcgacgtgaaggccgcc1980
gacacctacaaggacggcaacatcgacgccatcgacatggccaccctgaagaagtacctg2040
ctgggcaccatcacccagctgccccagggc2070
<210>14
<211>519
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>14
metlyspheglyvalleupheservalphealaalailevalserala
151015
leuproleuglngluglyproleuasnlysargalatyrproserphe
202530
glualatyrserasntyrlysvalaspargthraspleugluthrphe
354045
leuasplysglnlysgluvalserleutyrtyrleuleuglnasnile
505560
alatyrprogluglyglnpheasnasnglyvalproglythrvalile
65707580
alaserproserthrserasnproasptyrtyrtyrglntrpthrarg
859095
aspseralailethrpheleuthrvalleusergluleugluaspasn
100105110
asnpheasnthrthrleualalysalavalglutyrtyrileasnthr
115120125
sertyrasnleuglnargthrserasnproserglyserpheaspasp
130135140
gluasnhislysglyleuglygluprolyspheasnthraspglyser
145150155160
alatyrthrglyalatrpglyargproglnasnaspglyproalaleu
165170175
argalatyralaileserargtyrleuasnaspvalasnserleuasn
180185190
gluglylysleuvalleuthraspserglyaspileasnpheserser
195200205
thrgluaspiletyrlysasnileilelysproaspleuglutyrval
210215220
ileglytyrtrpaspserthrglypheaspleutrpglugluasngln
225230235240
glyarghisphephethrserleuvalglnglnlysalaleualatyr
245250255
alavalaspilealalysserpheaspaspglyaspphealaasnthr
260265270
leuserserthralaserthrleuglusertyrleuserglyserasp
275280285
glyglyphevalasnthraspvalasnhisilevalgluasnproasp
290295300
leuleuglnglnasnserargglnglyleuaspseralathrtyrile
305310315320
glyproleuleuthrhisaspileglygluserserserthrprophe
325330335
aspvalaspasnglutyrvalleuglnsertyrtyrleuleuleuglu
340345350
aspasnlysaspargtyrservalasnseralatyrseralaglyala
355360365
alaileglyargtyrprogluaspvaltyrasnglyaspglyserser
370375380
gluglyasnprotrppheleualathralatyralaalaglnvalpro
385390395400
tyrlysleualatyraspalalysseralaserasnaspilethrile
405410415
asnlysileasntyraspphepheasnlystyrilevalaspleuser
420425430
thrileasnseralatyrglnserseraspservalthrilelysser
435440445
glyseraspglupheasnthrvalalaaspasnleuvalthrphegly
450455460
aspserpheleuglnvalileleuasphisileasnaspaspglyser
465470475480
leuasngluglnleuasnargtyrthrglytyrserthrglyalatyr
485490495
serleuthrtrpserserglyalaleuleuglualaileargleuarg
500505510
asnlysvallysalaleuala
515
<210>15
<211>639
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>15
metserpheargserleuleualaleuserglyleuvalcysthrgly
151015
leualaasnvalileserlysargalathrtrpaspsertrpleuser
202530
asnglualathrvalalaargthralaileleuasnasnileglyala
354045
aspglyalatrpvalserglyalaaspserglyilevalvalalaser
505560
proserthraspasnproasptyrphetyrthrtrpthrargaspser
65707580
glyleuvalleulysthrleuvalaspleupheargasnglyaspthr
859095
serleuleuserthrilegluasntyrileseralaglnalaileval
100105110
glnglyileserasnproserglyaspleuserserglyalaglyleu
115120125
glygluprolyspheasnvalaspgluthralatyrthrglysertrp
130135140
glyargproglnargaspglyproalaleuargalathralametile
145150155160
glypheglyglntrpleuleuaspasnglytyrthrserthralathr
165170175
aspilevaltrpproleuvalargasnaspleusertyrvalalagln
180185190
tyrtrpasnglnthrglytyraspleutrpgluvalasnglyserser
195200205
phephethrilealavalglnhisargalaleuvalgluglyserala
210215220
phealathralavalglysersercyssertrpcysaspserglnala
225230235240
progluileleucystyrleuglnserphetrpthrglyserpheile
245250255
leualaasnpheaspserserargseralalysaspalaasnthrleu
260265270
leuleuglyserilehisthrpheaspproglualaalacysaspasp
275280285
serthrpheglnprocysserproargalaleualaasnhislysglu
290295300
valvalaspserpheargseriletyrthrleuasnaspglyleuser
305310315320
aspserglualavalalavalglyargtyrprogluaspthrtyrtyr
325330335
asnglyasnprotrppheleucysthrleualaalaalagluglnleu
340345350
tyraspalaleutyrglntrpasplysglnglyserleugluvalthr
355360365
aspvalserleuaspphephelysalaleutyrseraspalathrgly
370375380
thrtyrserserserserserthrtyrserserilevalaspalaval
385390395400
lysthrphealaaspglyphevalserilevalgluthrhisalaala
405410415
serasnglysermetsergluglntyrasplysseraspglyglugln
420425430
leuseralaargaspleuthrtrpsertyralaalaleuleuthrala
435440445
asnasnargargasnvalvalproseralasertrpglygluthrser
450455460
alaserservalproglythrcysalaalathrseralaileglythr
465470475480
tyrserservalthrvalthrsertrpproserilevalalathrgly
485490495
glythrthrthrthralathrprothrglyserglyservalthrser
500505510
thrserlysthrthralathralaserlysthrserthrserthrser
515520525
serthrsercysthrthrprothralavalalavalthrpheaspleu
530535540
thralathrthrthrtyrglygluasniletyrleuvalglyserile
545550555560
serglnleuglyasptrpgluthrseraspglyilealaleuserala
565570575
asplystyrthrserseraspproleutrptyrvalthrvalthrleu
580585590
proalaglygluserpheglutyrlyspheileargilegluserasp
595600605
aspservalglutrpgluseraspproasnargglutyrthrvalpro
610615620
glnalacysglythrserthralathrvalthraspthrtrparg
625630635
<210>16
<211>702
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>16
metserarglysleuilelystyrleuproleuleuvalleualaser
151015
servalleuserglycysserasnasnvalserserilelysileasp
202530
argpheasnasnileseralavalasnglyproglyglugluaspthr
354045
trpalaseralaglnlysglnglyvalglythralaasnasntyrval
505560
serlysvaltrpphethrleualaasnglyalailesergluvaltyr
65707580
tyrprothrileaspthralaaspvallysgluilelyspheileval
859095
thraspglylysserphevalseraspgluthrlysaspthrileser
100105110
lysvalglulysphethrasplysserleuglytyrlysleuvalasn
115120125
thrasplyslysglyargtyrargilethrlysgluilephethrasp
130135140
vallysargasnserleuilemetlysalalyspheglualaleuglu
145150155160
glyserilehisasptyrlysleutyrleualatyraspprohisile
165170175
lysasnglnglysertyrasngluglytyrvalilelysalaasnasn
180185190
asnglumetleumetalalysargaspasnvaltyrthralaleuser
195200205
serasnileglytrplysglytyrserileglytyrtyrlysvalasn
210215220
aspilemetthraspleuaspgluasnlysglnmetthrlyshistyr
225230235240
aspseralaargglyasnileilegluglyalagluileaspleulys
245250255
lysasnserglnphegluilevalleuserpheglyasnsergluasp
260265270
glualavallysalaserilegluthrleusergluasntyraspser
275280285
leulysseralatyrileaspglutrpglulystyrcysasnserleu
290295300
asnasnpheasnglylysalaasnserleutyrtyrasnsermetmet
305310315320
ileleulysalasergluasplysthrasnlysglyalatyrileala
325330335
serleuserileprotrpglyaspglyglnglyaspaspasnthrgly
340345350
glytyrhisleuvaltrpserargaspleutyrhisvalalaasnala
355360365
pheilealaalaglyaspvalaspseralaasnargserleuasptyr
370375380
leualalysvalvallysaspasnglymetileproglnasnthrtrp
385390395400
ileserglylysprotyrtrpthrglyileglnleuaspgluglnala
405410415
aspproileileleusertyrargleuargargtyraspleutyrasp
420425430
serleuvallysproleualaasppheileilelysmetglyprolys
435440445
thrglyglngluargtrpglugluileglyglytyrserproalathr
450455460
metalaalagluvalalaglyleuthrcysalaalatyrilealaglu
465470475480
glnasnlysasptyrgluseralaglnlystyrglnglulysalaasp
485490495
asntrpglnlysleuileaspasnleuthrtyrthrgluhisglypro
500505510
leugluasnglyglntyrtyrileargilealaglyleuproasppro
515520525
asnalaaspphethrileserilealaasnglyglyglyvaltyrasp
530535540
glnlysgluilevalaspproserpheleugluleuvalargleugly
545550555560
vallysserproaspaspprolysileleuasnthrleuargvalval
565570575
aspserthrilelysvalaspthrprolysglyprosertrptyrarg
580585590
tyrasnhisaspglytyrglygluproserlysthrgluleutyrhis
595600605
glyalaglylysglyargleutrpproleuleuthrglygluarggly
610615620
mettyrgluilealaalaglylysaspalathrprotyrleulysala
625630635640
metgluasnphealaasngluglyglyileilesergluglnvaltrp
645650655
gluaspthrglyleuprothraspseralaserproleuasntrpala
660665670
hisalaglutyrvalvalleupheproserasnilegluhislysval
675680685
leuaspmetproaspilevaltyrlysargtyrvalalalys
690695700
<210>17
<211>363
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>17
metgluasnleuvalglulysserilelysileilelysasnasngln
151015
serglutyrglyserpheilealaserproserpheprothrtyrhis
202530
phesertrpleuargaspglyserpheilealatyrsermetaspleu
354045
valgluglntyralaglualalyslysphetyrargtrpvalasnglu
505560
valileileargtyrsertyrlysvalasplysileileglulysile
65707580
lysasnglyasnlysleugluproasnasppheleutyralaargtyr
859095
thrleugluglytyrgluglulysaspserglytrpglyasnphegln
100105110
leuaspglytyrglythrtrpleutrpglyleusergluhisilelys
115120125
ilethrglylysthrgluleuileasnaspphephelysserileasp
130135140
ilethrilelystyrileaspasnleutrptyrtyrproasnpheasp
145150155160
valtrpglugluasnserasplysilehisthrserthrleualacys
165170175
leutyrglyglyleuasnserileasnlystyrleuasnaspasplys
180185190
vallysgluleualaasnlysilelysthrtyrileleuthrasncys
195200205
valvalgluasnserphevallystyrvalglyserasnservalasp
210215220
serserleuiletrpleualaileprophegluvalvalaspvalasn
225230235240
aspgluilepheleuasnthrilelysargileglulysgluleuleu
245250255
hisasnglyglymethisargtyrarglysaspthrtyrtyrglygly
260265270
glyglntrpileleuleuseralatrpmetglyleutyrtyrcyslys
275280285
serglyasptyrlyslysalaglugluvallyslystrpilegluglu
290295300
glnalaaspgluasnglytyrleuprogluglnvalprotyrhisleu
305310315320
asnasngluvaltyrtyrprotyrtrpvalasnlystrpglyasnile
325330335
alalysproleuleutrpserhisalamettyrleuvalleuasptyr
340345350
gluleulyslysalaglyvalglnleugluasp
355360
<210>18
<211>710
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>18
metleuleuglualametlysleuasnarglysleuilelystyrleu
151015
provalleupheleualaserservalleuserglycysalaasnasn
202530
asnileserasnilelysilegluargleuasnasnvalglnalaval
354045
asnglyproglyglualaaspthrtrpalalysalaglnlysglngly
505560
valglythralaasnasntyrthrserlysvaltrpphethrileala
65707580
aspglyglyilesergluvaltyrtyrprothrileaspthralaasp
859095
vallysaspilelysphephevalthraspglylysthrphevalser
100105110
aspgluthrlysaspthrilethrlysvalglulysphethrglulys
115120125
serleuglytyrlysileileasnthrasplysgluglyargtyrlys
130135140
ilethrlysgluilephethraspvallysargasnserleuvalile
145150155160
lysthrlyspheglualaleulysglyasnvalaspasptyrargleu
165170175
tyrvalmetcysaspprohisvallysasnglnglylystyrasnglu
180185190
glytyralavallysalaasnglyasnvalalaleuilealagluarg
195200205
aspglyiletyrthralaleuserseraspileglytrplyslystyr
210215220
serileglytyrtyrlysvalasnaspilegluthraspleutyrlys
225230235240
asnmetglnmetthrtyrasntyraspseralaargglyasnileile
245250255
gluglyalagluileaspleulyslysasnargglnphegluileval
260265270
leuserpheglyglnsergluaspglualavallysthrasnmetglu
275280285
thrleuasnaspasntyraspserleulyslysalatyrileaspgln
290295300
trpglulystyrcysaspserleuasnasppheglyglylysalaasn
305310315320
serleutyrpheasnsermetmetileleulysalasergluasplys
325330335
thrasnlysglyalatyrilealaserleuserileprotrpglyasp
340345350
glyglngluaspaspasnileglyglytyrhisleuvaltrpserarg
355360365
aspleutyrhisvalalaasnalapheilevalalaglyaspthrasp
370375380
seralaasnargalaleuasptyrleuasplysvalvallysaspasn
385390395400
glymetileproglnasnthrtrpileasnglyargprotyrtrpthr
405410415
glyileglnleuaspgluglnalaaspproileileleusertyrarg
420425430
leulysargtyraspleutyrgluserleuvallysproleualaasp
435440445
pheilemetlysileglyprolysthrglyglngluargtrpgluglu
450455460
ileglyglytyrserproalathrleualasergluvalalaglyleu
465470475480
thrcysalaalatyrilealagluglnasnlysaspphegluserala
485490495
lyslystyrglnglulysalaaspasntrpglnargleuileaspasn
500505510
leuthrtyrthrglulysglyproleuglyaspglyhistyrtyrile
515520525
argilealaglyleuproaspproasnalaaspphemetileserile
530535540
alaasnglyglyglyvaltyraspglnlysgluilevalaspproser
545550555560
pheleugluleuvalargleuglyvallysseralaaspaspprolys
565570575
ileleuasnthrleulysvalvalaspgluthrilelysvalaspthr
580585590
prolysglyprosertrptyrargtyrasnhisaspglytyrglyglu
595600605
metserlysthrgluleutyrhisglythrglylysglyargleutrp
610615620
proleuleuthrglygluargglymettyrgluilealaalaglylys
625630635640
aspalathrsertyrvallysalametgluasnphealaasngluser
645650655
glyileilesergluglnvaltrpgluaspthrglyleuprothrasp
660665670
seralaserproleuasntrpalahisalaglutyrvalileleuphe
675680685
alaserasnilegluhislysvalleuaspmetproaspilevaltyr
690695700
lysargtyralaserlys
705710
<210>19
<211>703
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>19
metleulysargileglyileleuleuilepheilevalileglyval
151015
phevalleuserglycysseraspvalsertyrvallysvalgluhis
202530
leuasplysthrglualaserglnglyproglygluargaspthrtrp
354045
alathralaglnlysglnglyileglythralaasnasnaspvalser
505560
lysvaltrpphethrleualaglnglyalaleusergluiletyrtyr
65707580
prothrileaspargalaasnserlyspheleulyspheilevalthr
859095
aspglylysthrphevalalaaspgluthrthraspthrvalserlys
100105110
valglulysileasnasnargserleualatyrargleuvalasnile
115120125
asplysargglyargtyrlysilethrlysgluilephethrasppro
130135140
argargasnservalvalmetlysvalargpheglualaleulysgly
145150155160
lysmetgluasptyrlysleutyrleuvaltyraspprohisileser
165170175
asnglnglyalaaspasngluglytyrvalvallysalaasnglyglu
180185190
tyrglyphemetalacysargasnasnvaltyrseralaleumetthr
195200205
aspalalystrpglysertyrservalglytyrasnglyvalasnasp
210215220
provalseraspleulyslysasnlyslysmetthrtyrlyspheasp
225230235240
argalalysglyasnileilegluglyilegluileaspleuargasp
245250255
lysthrgluphelysthrvalleuserpheglygluserglugluglu
260265270
alaleulysthralaleuserthrleulysaspsertyraspargmet
275280285
leuglyiletyrilealaglutrpasnlystyrcysaspglyleulys
290295300
asnpheglyglyglualaaspgluleutyrtyrthrserleumetphe
305310315320
leulysalasergluasplysthrasnlysglyalapheilealaser
325330335
leuserileprotrpglygluglyglnglyaspgluasnlysglygly
340345350
tyrhisleuvaltrpalaargaspleutyrhisilealaasnalaphe
355360365
ilealaalalysaspileaspseralaasnargalaleuasppheleu
370375380
alametvalvalglulysasnglyphemetproglnasnthrtrpile
385390395400
asnglyaspprotyrtrpasnglyileglnmetaspgluglnalaasp
405410415
proileileleualatyrhisleulysargtyraspleutyrglulys
420425430
leuvallysproleualaasppheilevalargvalglyprolysthr
435440445
glyglngluargtrpgluglualaglyglytyrserproalathrmet
450455460
alaalagluvalalaglyleuvalcysalaalaaspilealalysgln
465470475480
asnlysaspmetgluargalalyslystyrleugluthralaasplys
485490495
trpglngluleuileasplysleuthrtyrthrthrlysglyprotyr
500505510
glyasnglyglntyrtyrileargilealaglyleuproaspproasp
515520525
alaasppheleuileserilealaasnglyglyglyvaltyraspgln
530535540
lysgluilevalaspproserpheleugluleuvalargleuglyval
545550555560
lysalatyraspaspprolysileleuasnthrileservalvalasp
565570575
serleuleulysvalasnthrprolysglyprosertrptyrargtyr
580585590
asnhisaspglytyrglygluproalalysglygluleutyrhisgly
595600605
lysglylysglyargleutrpproleuleuthrglygluargglymet
610615620
tyrgluilealaalaglylyslysalaaspasptyrleuglutyrmet
625630635640
argasnphealaasngluglyphevalleusergluglniletrpglu
645650655
aspthrglyleuprothraspseralaserproleuasntrpalahis
660665670
alaglutyrvalvalleuphealaserasnilegluglylysvalval
675680685
aspmetproglnilevaltyrlysargtyrvalleuglygluarg
690695700
<210>20
<211>636
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>20
metvalargtyrileprometglyasnglylysileleuvalserphe
151015
asnasnasptyrasnleuthraspphetyrpheserlysaspmetala
202530
gluasnhisseralaglylyspropheargtyrglyvalserileasn
354045
asplysphethrtrpileasnalaserasnilevalserlysasptyr
505560
tyrasphisthrmetileglyilevallystyrasnileasnaspval
65707580
serphegluaspaspasnphevalaspiletyrgluaspvaltyrala
859095
arglysilelysilethrasnlysarglysglulysileasnvallys
100105110
leuphephehisglnasnpheseriletyrglyasnasnileglyasp
115120125
thrglyphetyrtyrproaspthrasnalailevalhistyrlysgly
130135140
argargtyrpheileileserthrthraspglylysasnserpheasp
145150155160
glntyralaileglyilelysasppheasnglymetalaglythrtrp
165170175
lysaspalagluaspasnasnleusermetglyproilealailegly
180185190
servalaspserthrilearghisserileaspileaspprogluser
195200205
glnlysgluleutyrtyrtyrilealacysalaargaspleuaspthr
210215220
valleuargileasnargasnmetserthrglyasnleuaspargmet
225230235240
metlysargthrgluasnphetrpgluleutrpvalserlysserpro
245250255
leuasnleuthralagluleuasnglumettyrlyslysserleuphe
260265270
ileileargserhisileasnglulysglyalavalmetalaserser
275280285
aspseraspileleuargserasnmetaspsertyrtyrtyrsertrp
290295300
proargaspalaglytyralaalailesermetilevalsergluhis
305310315320
seraspproalalysleuphepheaspphecysileasnthrileser
325330335
lysaspglytyrphetyrhislystyrasnproaspglylysileala
340345350
sersertrpleuprotyrilemetaspglylysargileleuproile
355360365
glngluaspgluseralailevalileilealaalatrptyrtyrtyr
370375380
serthrasnasnaspileglutyrilesertyrleutyrgluargleu
385390395400
ilelysargvalalaglupheleutyrasnphethrtyraspasngly
405410415
leuprolysgluserpheaspleutrpglugluargpheglyilehis
420425430
thrtyrthrvalalaservaltyrilealaleuiletyralaalaasn
435440445
phealagluilepheasngluthraspleualaarglystyrlysser
450455460
lysalaasplysmetleugluserpheglulysmetphetyrserasp
465470475480
aspleuglytyrtyralaargargiletyrasnglyaspvalaspphe
485490495
valleuaspserservalleutrpleuvalilepheglyilelyslys
500505510
proaspaspproargilevalserthrvallysalaileglulyslys
515520525
leutrpvalproglyileglyglyilealaargtyrgluglyasptyr
530535540
tyrglnargileserglylysasnileproglyasnprotrpileile
545550555560
thrthrleutrpleualaasptyrtyrilemetalaglyasnthrgly
565570575
argalaleugluleuileasntrpvalvalglnhisserglugluser
580585590
glyileleusergluglnileasnproaspasnglygluproileser
595600605
valserproleuiletrpserhisserglnleuvalleuthrleulys
610615620
argtyrlysaspalailelysasnlysglyilegln
625630635
<210>21
<211>808
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>21
hisgluasnsertyrlysserservalvalprovallyslysasnile
151015
tyrphethrglyasnleuserargasppheaspglyasnileilegly
202530
ileasnasnhisalaserprotrpglyalaasnasnvalilelyslys
354045
leutyrleualatyrasngluthraspleupheileglyvaltyrglu
505560
asnilesertyrasnserleumetilepheilethrasnvalthrasn
65707580
aspiletyrglythrserasnileserasnmetasnthrtrpasnarg
859095
aspilethrphegluglythrmetasntyrpheseralavaltyrphe
100105110
aspglyasnasnileasnproalaglytyrglythrtyralailemet
115120125
serglylysasnserthrproleualalysproileasnserthrphe
130135140
alaphepheproglyasnasnthrthrgluilealailepropheser
145150155160
glnmetpheglnhisglypheasnglyasnleuserpheglyileser
165170175
alaphevalvalglyglyserglyprotrpvalglyserglyilepro
180185190
tyrhisglnlysglyiletyrasnaspglyasnglnalaserpheleu
195200205
ileasnaspthrilegluileasnileproglyilehisvalserpro
210215220
leuprosertyrvalasptyrprosertyrleuleumetserasntrp
225230235240
lysasnasnaspphetrpilealathrglyileproaspsertyrleu
245250255
glyasntyrsertyrvalhisleusermetglnthrvalasnileglu
260265270
asnlysileleuproleulysphetyrpheaspilepheglyhisser
275280285
ileseralaargleuthrproasnasnthrileasnvalargthrasn
290295300
asnsergluphegluleuileaspproprotyrmetasnglnthrasp
305310315320
valileglnlysserlysserthriletyrsertyrilesermetpro
325330335
tyrilelystyrasnalaserglyasnglnileserleutyrlystyr
340345350
asnleuthrleuphephevalasnsersertyrasnileasnasnasp
355360365
serglymetleuasnileserilevalserglyproglythrserile
370375380
ileglyleuserthrasnserthrtyrmetasnleuasptyrilelys
385390395400
aspvalasnhisalaasnilemetlystrpleuserlysserlysval
405410415
serileserglyargtyrleuileglutyrasnmetserglnleuleu
420425430
vallysaspaspglnasnprophethrglygluilevalalaserpro
435440445
serprovaltyrphetyrasntrpvalargaspalaserpheserala
450455460
ileserleuglnaspserglyhisileargseralametlystyrtrp
465470475480
aspphemetalaglyvalglnglyvalaspthrtyrasnglythrtrp
485490495
glnthrargpheasnphetrpasnglyservalalaglyphevaltyr
500505510
proglupheaspservalglyleuphegluileglyiletyrasnleu
515520525
pheglnvalthrhisasnileservalileglnlysphemetproasn
530535540
ileleualaserleuglupheglnglulysserilelyslystyrgly
545550555560
pheilealagluasphisseriletrpglumetglutyrglytyrtrp
565570575
phetrpthrglnalaileasntyrleuglyileargaspileserarg
580585590
metprometileglnasnhisasnalavalprovalproproglypro
595600605
valproproglyasnmetasnthralametilealahislysleulys
610615620
serasnileilelystyrphetyrmetaspasnilephealaglntyr
625630635640
leuvalprovalthrasnglntyrglyaspasnasntyrthrtyrphe
645650655
metalaasnasnthrproaspserserglnileleuproilealamet
660665670
glypheileasnproserserprometalathrserilevalhisasn
675680685
iletyrmetileleutrpasntyrargvalglyglyleuproargtyr
690695700
tyrasnaspleutyrhistyrthrglutyrglyglytyrhisgluser
705710715720
serglyproserproprotrpileilethrthrleupheleualaleu
725730735
tyraspglulysthrglyasnmetthrglyalaleuasnleumetlys
740745750
trpsertyrserhisserglnsertrpleuleuproglualavalasp
755760765
proasnpheglyservalilealaserthrserproleuthrtrpser
770775780
seralamettyrileilevalserleuasntyrargalametpropro
785790795800
alaproleuproproglypropro
805
<210>22
<211>771
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>22
metargthrleulysthrphealaleualaseralaalathrleuile
151015
alathralaalaglnalaalaprothrthrtrpalatyrseralalys
202530
thrglyvalglyalasertyrglualatyrvalaspglyalatyrlys
354045
alaglyglylysthrglyalavalserlysvaltrppheserileala
505560
aspglyvalleuthrgluthrmettyrglyleuilehisglualagln
65707580
ilelysglnmetargvalalavalgluthralaserglyleualaile
859095
gluglyalaaspthrthrserlysthrglutyrleuhisvalaspala
100105110
alaglyargproleuserproalatyrlysilethrthrthrasparg
115120125
glnglyargphevalileglulysargilephethraspproasparg
130135140
asnalaleuphevalargvalthrvalthralaleulysglyalaval
145150155160
thrprothrleuleuleugluprohismetalaasnthrglyglygly
165170175
aspvalglyalaalaseralaseralaleuthralahisgluglylys
180185190
alapheleuserleulysalaserlysprophealalysalaserala
195200205
servalleulysaspglyaspalaleualaalaleulysalathrthr
210215220
thrseralalysglyalailevalleualaglygluleuprolysval
225230235240
alalyssergluthrpheaspvalvalileglypheglyalaaspala
245250255
lysalaalaaspargthralaalaalathrleulysthrglytyrala
260265270
gluvalleualaargtyrasnglygluglyalahisvalglytrpglu
275280285
asptyrleualaserleuasngluleuproargleuargaspalaser
290295300
gluaspglyglylysleuleuglnalaseralaleumetleulysval
305310315320
glngluaspargthrtyralaglyalaleuilealaserleuserasn
325330335
protrpglyaspthrvalaspalathrlysserserthrglytyrlys
340345350
alavaltrpproargaspphetyrglncysalametalaleualaala
355360365
leuglyasplysgluthrproleualaalaphehistyrleuprothr
370375380
valglnvalglyprolysthrproglyasnlysglyaspglyglytrp
385390395400
pheleuglnlysserhisvalaspglythrproglutrpvalglyval
405410415
glnleuaspglnthralametproilemetleuglytrplysleutrp
420425430
thrtrpglytrpleuproaspalagluleulysalaphetyrglylys
435440445
metleulysproalaalaasppheleuvallysglyglylysvalasn
450455460
leuasptrpasnthralathrilethrproprophethrglnglnglu
465470475480
argtrpglugluglnglyglyhisserproserthrthralaalaval
485490495
ilealaglyleuvalvalalaglyaspilealaglualaalaglyasp
500505510
alaglyseralagluleutyrarglysthralaaspaspcysalagly
515520525
lysleuglualaargmetvalthrthrlysglythrpheglyaspgly
530535540
histyrtyrleuargleuasnseraspglnaspproasnasnlysser
545550555560
provalglualaargasnglyglnalaprovalalagluasplysmet
565570575
leuaspalaglypheleugluleuvalargtyrglyvalargargala
580585590
aspaspproalaileleualaserleuprogluileaspaspgluala
595600605
leugluaspleutyrargvalargtyrserphethrpheproglyval
610615620
gluglyserpheproglytrpargargtyrglyvalaspglytyrgly
625630635640
gluaspthrlysthrglyalaasntyrglyalaaspasnglnmetarg
645650655
proglyglnargglyargvaltrpproilephethrglygluarggly
660665670
histyrgluleualavalalaglyleuserglylysproaspprothr
675680685
alavalglnlysileargaspthrtyrvallysalametgluleuphe
690695700
alaasngluglyleumetileprogluglnvaltrpaspglyvalgly
705710715720
thraspseralahisglytyrvalargglygluglythraspserala
725730735
thrproleualatrpserhisalaglutyrvallysleuleuargser
740745750
valseraspglyglnvaltrpasphistyralaprovallysalaarg
755760765
tyralaarg
770
<210>23
<211>512
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>23
metlysglnglnlysargleutyralaargleuleuthrleuleuphe
151015
alaleuilepheleuleuprohisseralaalaalaalaalaasnleu
202530
asnglythrleumetglntyrpheglutrptyrmetproasnaspgly
354045
glnhistrplysargleuglnasnaspseralatyrleualagluhis
505560
glyilethralavaltrpileproproalatyrlysglythrsergln
65707580
alaaspvalglytyrglyalatyraspleutyraspleuglygluphe
859095
hisglnlysglythrvalargthrlystyrglythrlysglygluleu
100105110
glnseralailelysserleuhisserargaspileasnvaltyrgly
115120125
aspvalvalileasnhislysglyglyalaaspalathrgluaspval
130135140
thralavalgluvalaspproalaaspargasnargvalilesergly
145150155160
gluhisleuilelysalatrpthrhisphehispheproglyarggly
165170175
serthrtyrseraspphelystrphistrptyrhispheaspglythr
180185190
asptrpaspgluserarglysleuasnargiletyrlyspheglngly
195200205
lysalatrpasptrpgluvalserasngluasnglyasntyrasptyr
210215220
leumettyralaaspileasptyrasphisproaspvalalaalaglu
225230235240
ilelysargtrpglythrtrptyralaasngluleuglnleuaspgly
245250255
pheargleuaspalavallyshisilelyspheserpheleuargasp
260265270
trpvalasnhisvalargglulysthrglylysglumetphethrval
275280285
alaglutyrtrpglnasnaspleuglyalaleugluasntyrleuasn
290295300
lysthrasnpheasnhisservalpheaspvalproleuhistyrgln
305310315320
phehisalaalaserthrglnglyglyglytyraspmetarglysleu
325330335
leuasnglythrvalvalserlyshisproleulysservalthrphe
340345350
valaspasnhisaspthrglnproglyglnserleugluserthrval
355360365
glnthrtrpphelysproleualatyralapheileleuthrargglu
370375380
serglytyrproglnvalphetyrglyaspmettyrglythrlysgly
385390395400
aspserglnarggluileproalaleulyshislysilegluproile
405410415
leulysalaarglysglntyralatyrglyalaglnhisasptyrphe
420425430
asphishisaspilevalglytrpthrarggluglyaspserserval
435440445
alaasnserglyleualaalaleuilethraspglyproglyglyala
450455460
lysargmettyrvalglyargglnasnalaglygluthrtrphisasp
465470475480
ilethrglyasnargsergluprovalvalileasnsergluglytrp
485490495
glygluphehisvalasnglyglyservalseriletyrvalglnarg
500505510
<210>24
<211>491
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>24
metthrgluthrarghisargproserargargalaargargserleu
151015
serleuleuleuthrseralaleuthralaalaglyleuleuvalthr
202530
alaalaproalaglnalagluserthrleuarggluleualaalagln
354045
asnglyglyarghispheglythralailealatyrserproleuasn
505560
seraspalaglntyrargasnilealaalathrglnpheseralaile
65707580
thrhisgluasnglumetlystrpgluserleugluproglnarggly
859095
glntyrasntrpserglnalaaspasnileileasnphealalysala
100105110
asnasnglnilevalargglyhisthrleuvaltrphisserglnleu
115120125
prosertrpleuasnasnglyglypheserglyserglnleuargser
130135140
ilemetgluasnhisilegluvalvalalaglyargtyrargglyasp
145150155160
valtyralatrpaspvalvalasnglualapheasngluaspglythr
165170175
leuargaspseriletrptyrargglymetglyargasptyrileala
180185190
hisalaphearglysalahisgluvalaspproaspalalysleutyr
195200205
ileasnasptyrasnilegluglyileasnalalysserasnglyleu
210215220
tyrasnleuvalvalaspleuleuargaspglyvalproilehisgly
225230235240
ileglyileglnserhisleuilevalglyglnvalproserthrphe
245250255
glnglnasnileglnargphealaaspleuglyleuaspvalalaile
260265270
thrgluleuaspileargmetglnmetproalaaspglntyrlysleu
275280285
glnglnglnalaargasptyrglualavalvalasnalacysleuala
290295300
valthrargcysileglyilethrvaltrpglyileaspaspgluarg
305310315320
sertrpvalprotyrthrpheproglygluglyalaproleuleutyr
325330335
aspglyglntyrasnarglysproalatrptyralavaltyrgluala
340345350
leuglyglyaspserserglyglyglyproglygluproglyglypro
355360365
glyglyproglygluproglyglyproglyglyproglygluprogly
370375380
glyproglyaspglythrcysalavalasntyrthrvalvalasnasp
385390395400
trpglyhisglymetglnglyalailethrvalserasnthrglyser
405410415
serproileasnasntrpthrleuglnpheserpheserglyvalasn
420425430
ileserasnglytrpasnglyglutrpserglnserglyserglnile
435440445
thrvalargalaproalatrpasnserthrleuglnproglyglnser
450455460
valgluleuglyphevalalaasplysthrglyasnvalserpropro
465470475480
serglnphethrleuasnglyalathrcysser
485490
<210>25
<211>441
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>25
metserproargproleuargalaleuleuglyalaalaalaalaala
151015
leuvalseralaalaalaleualapheproserglnalaalaalaasn
202530
aspserprophetyrvalasnproasnmetserseralaglutrpval
354045
argasnasnproasnaspproargthrprovalileargaspargile
505560
alaservalproglnglythrtrpphealahishisasnproglygln
65707580
ilethrglyglnvalaspalaleumetseralaalaglnalaalagly
859095
lysileproileleuvalvaltyrasnalaproglyargaspcysgly
100105110
asnhisserserglyglyalaproserhisseralatyrargsertrp
115120125
ileaspgluphealaalaglyleulysasnargproalatyrileile
130135140
valgluproaspleuileserleumetsersercysmetglnhisval
145150155160
glnglngluvalleugluthrmetalatyralaglylysalaleulys
165170175
alaglyserserglnalaargiletyrpheaspalaglyhisserala
180185190
trphisserproalaglnmetalasertrpleuglnglnalaaspile
195200205
serasnseralahisglyilealathrasnthrserasntyrargtrp
210215220
thralaaspgluvalalatyralalysalavalleuseralailegly
225230235240
asnproserleuargalavalileaspthrserargasnglyasngly
245250255
proalaglyasnglutrpcysaspproserglyargalaileglythr
260265270
proserthrthrasnthrglyaspprometileaspalapheleutrp
275280285
ilelysleuproglyglualaaspglycysilealaglyalaglygln
290295300
phevalproglnalaalatyrglumetalailealaalaglyglythr
305310315320
asnproasnproasnproasnprothrprothrprothrprothrpro
325330335
thrproproproglyserserglyalacysthralathrtyrthrile
340345350
alaasnglutrpasnaspglypheglnalathrvalthrvalthrala
355360365
asnglnasnilethrglytrpthrvalthrtrpthrphethraspgly
370375380
glnthrilethrasnalatrpasnalaaspvalserthrserglyser
385390395400
servalthralaargasnvalglyhisasnglythrleuserglngly
405410415
alaserthrglupheglyphevalglyserlysglyasnserasnser
420425430
valprothrleuthrcysalaalaser
435440
<210>26
<211>725
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>26
metleulysthrlysarglysleuthrlysalaileglyvalalaleu
151015
serileserileleuserserleuvalserpheileproglnthrasn
202530
thrtyralaalaglythrtyrasntyrglyglualaleuglnlysser
354045
ilemetphetyrglupheglnargserglyaspleuproalaasplys
505560
argaspasntrpargaspaspserglymetlysaspglyseraspval
65707580
glyvalaspleuthrglyglytrptyraspalaglyasphisvallys
859095
pheasnleuprometsertyrthrseralametleualatrpserleu
100105110
tyrgluasplysaspalatyrasplysserglyglnthrlystyrile
115120125
metaspglyilelystrpalaasnasptyrpheilelyscysasnpro
130135140
thrproglyvaltyrtyrtyrglnvalglyaspglyglylysasphis
145150155160
sertrptrpglyproalagluvalmetglnmetgluargproserphe
165170175
lysvalaspalaserlysproglyseralavalcysalaserthrala
180185190
alaserleualaseralaalavalvalphelysserseraspprothr
195200205
tyralaglulyscysileserhisalalysasnleupheaspmetala
210215220
asplysalalysseraspalaglytyrthralaalaserglytyrtyr
225230235240
serserserserphetyraspaspleusertrpalaalavaltrpleu
245250255
tyrleualathrasnaspserthrtyrleuasplysalaglusertyr
260265270
valproasntrpglylysgluglnglnthraspileilealatyrlys
275280285
trpglyglncystrpaspaspvalhistyrglyalagluleuleuleu
290295300
alalysleuthrasnlysglnleutyrlysaspserileglumetasn
305310315320
leuaspphetrpthrthrglyvalasnglythrargvalsertyrthr
325330335
prolysglyleualatrpleupheglntrpglyserleuarghisala
340345350
thrthrglnalapheleualaglyvaltyralaglutrpgluglycys
355360365
thrproserlysvalservaltyrlysasppheleulysserglnile
370375380
asptyralaleuglyserthrglyargserphevalvalglytyrgly
385390395400
valasnproproglnhisprohishisargthralahisglysertrp
405410415
thraspglnmetthrserprothrtyrhisarghisthriletyrgly
420425430
alaleuvalglyglyproaspasnalaaspglytyrthraspgluile
435440445
asnasntyrvalasnasngluilealacysasptyrasnalaglyphe
450455460
thrglyalaleualalysmettyrlyshisserglyglyaspproile
465470475480
proasnphelysalaileglulysilethrasnaspgluvalileile
485490495
lysalaglyleuasnserthrglyproasntyrthrgluilelysala
500505510
valvaltyrasnglnthrglytrpproalaargvalthrasplysile
515520525
serphelystyrphemetaspleusergluilevalalaalaglyile
530535540
aspproleuserleuvalthrserserasntyrsergluglylysasn
545550555560
thrlysvalserglyvalleuprotrpaspvalserasnasnvaltyr
565570575
tyrvalasnvalaspleuthrglygluasniletyrproglyglygln
580585590
seralacysargarggluvalglnpheargilealaalaproglngly
595600605
thrthrtyrtrpasnprolysasnaspphesertyraspglyleupro
610615620
thrthrserthrvalasnthrvalthrasnileprovaltyraspasn
625630635640
glyvallysvalpheglyasngluproalaglyglysergluasnpro
645650655
aspprogluileleutyrglyaspvalasnserasplysasnvalasp
660665670
alaleuaspphealaalaleulyslystyrleuleuglyglythrser
675680685
serileaspvallysalaalaaspthrtyrlysaspglyasnileasp
690695700
alaileaspmetalathrleulyslystyrleuleuglythrilethr
705710715720
glnleuproglngly
725
<210>27
<211>420
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>27
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
<210>28
<211>413
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>28
ccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctgaac60
ctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgcaccc120
cgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgccggg180
gtggggaagcacgtcaacacggccttggatcacatcgggcgtcgaaaaacaacccccatt240
tccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaagttg300
ccgcacgttgtcccagttggggcgtggcctgctgcatacggggccggggacgcctcacct360
gggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac413
<210>29
<211>145
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>29
cysalacyscysglyglycyscyscysglyglycysalaglycysgly
151015
thrglycysalathrglycysglythrglycysalathrthrthrcys
202530
cysalacyscyscysthrcysalaalaglyalaalacyscysalathr
354045
thrglyalacysthrglyglycysglyalacysglycysglycysala
505560
glyglythrglyglyglyalaglyalaalathrthrglyalaalacys
65707580
thrglyalacysalaalacysalacysalaglycysglyglythrthr
859095
glythrcysalacyscyscysglyglycyscyscysglycysalaala
100105110
glyglycyscysglycysglyglycyscysglycysalathrcysgly
115120125
glythrthrcyscysglyalaalaglyglyalaglyglyalaalathr
130135140
cys
145
<210>30
<211>362
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>30
thrcysglyglythrcysglyglyglythrcyscysglyglyalacys
151015
glyglyglycysglyglythrcyscysalaalacyscyscysglycys
202530
cyscyscysalathrthrthrcysglythrglyglyglycysalaala
354045
cysalathrglycyscyscyscysalathrcysthrcyscysthrgly
505560
cyscyscysglyglyglyglyglyalathrglyglyglyglycysala
65707580
thrglyalacyscysalathrglycyscysglycysglythrcyscys
859095
glyglyglythrthrglyglythrcysalacyscysglycysglycys
100105110
glycyscysglycysalathrglythrglycyscysglyglycysgly
115120125
alathrglyalacysalaalacysglythrglyalathrthrthrgly
130135140
cyscysalathrcyscysglyglyglyglyglyglythrcysthrthr
145150155160
thrthrglycyscysthrcysalaglycysglythrglyalaalacys
165170175
cysglycysalacysalaglycysthralaglyalaalathrthrgly
180185190
glythrcysalaglycysglycyscysglythrglythralacysgly
195200205
cyscysglycysthrcyscysalaglyalacyscysthralaglythr
210215220
glythrglythrglyglycysglythrcysglythrthrglythrcys
225230235240
glyalathrglyglythrcyscysglyglycyscyscysglythrcys
245250255
cyscysthrglycysglyglyalacysglyglyalacysglyglygly
260265270
alaalathrthralathrcysglyglyglyalaglycysglyalaala
275280285
thrcysglycyscysglythrthrcyscysglythrthrcysalagly
290295300
cysglyglyglyalathrglycysglythrthrthrglycysglycys
305310315320
glycysglythrcysalacysalaalathrcysthrcysalacysala
325330335
thrcyscysalathrcyscysalaalacysalathrcysglyglyala
340345350
glycyscyscysthralacysthralacys
355360
<210>31
<211>549
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>31
ccccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccg60
gctctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctc120
gtcttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcg180
ggggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaa240
tagtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactaggg300
gaaacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctg360
gacgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctaggga420
acccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagc480
tcttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgt540
aggattgcg549
<210>32
<211>315
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>32
ctcgagttgcagggcgagggggcggggccgcaggtccatgctggcagcggccggcgacaa60
tcccgacgggagagtcggtcagggcgacggtagatcagcgcaggtgctgactagcggtcg120
tagtcggcctcggccagcccatcgcgggtgcggatcgacgtgtcggcggatgctgggcgg180
gtcggttcttgtgggggtgtgtgcgtgcgccgaacgtctcggaaaatgctgagcgtttcc240
tgagaatcggagacacacctcgtgcattcttagctgtctggcgcagttcatcgtccggac300
gatatggtttcgggt315
<210>33
<211>2122
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>33
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccctgcaggagggccccctgaacaagcgcgcctacccctccttcgaggc660
ctactcgaactacaaggtggaccgcaccgacctggaaaccttcctggacaagcagaagga720
ggtgtcgctgtattacctgctgcagaacatcgcctaccccgagggccagttcaataatgg780
cgtgcccggcaccgtgatcgcctcgccctcgacctcgaatcccgattactactaccagtg840
gacccgtgactcagccatcaccttcctgaccgtgctgtcggagctggaggacaacaactt900
caacaccaccctggccaaggccgtggagtactacatcaacacctcgtacaacctgcagcg960
cacctcgaacccctccggctcgttcgacgacgagaatcacaagggcctgggcgagccaaa1020
gtttaataccgacggttcggcctataccggcgcatggggccgtccccaaaatgatggtcc1080
cgcactgcgtgcctacgccatctcgcgctacctgaacgacgtgaattcgctgaacgaggg1140
caagctggtgctgaccgactcgggcgacatcaacttctcgtccaccgaggacatctacaa1200
gaacatcatcaagcccgacctggagtacgtgatcggctactgggactcgaccggcttcga1260
cctgtgggaggagaatcagggccgtcacttcttcacctcgctggttcagcagaaggccct1320
ggcctatgccgtggatatcgccaagtcgttcgatgacggcgacttcgccaataccctgtc1380
gtcgactgcctcgaccctggagtcgtacctgtcgggttcggacggcggcttcgtgaacac1440
tgacgtgaaccacatcgtggagaaccccgatctgctgcaacagaattcgcgccagggcct1500
ggactcggccacctacatcggtcccctgttgacccatgatatcggcgagtcatcgtcgac1560
ccccttcgacgtggacaacgagtacgtgctgcagtcgtactacctgctgctggaggacaa1620
taaggaccgctactccgtgaactcggcctactcggccggcgccgccatcggtcgttatcc1680
agaggatgtgtataatggcgacggctcctcagaaggcaatccctggttcctggccaccgc1740
atacgccgcacaggttccctacaagctggcctacgacgccaagtcagcctcgaatgacat1800
caccatcaacaagatcaactacgacttcttcaacaagtacatcgtggacctgtcgaccat1860
caactccgcctaccagtcgtcggactcggtgaccatcaagtcgggctcggacgagttcaa1920
caccgtggccgacaacctggtgaccttcggcgactcgttcctgcaggtcatcctggacca1980
catcaacgacgacggctcgctgaatgagcagctgaaccgttacaccggctactccaccgg2040
tgcctactcgctgacctggtcatcgggcgccttgttggaggccattcgtctgcgcaataa2100
ggtgaaggccctggcctgatga2122
<210>34
<211>2476
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>34
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccatctcgaagcgtgccacctgggactcgtggttgtcgaatgaggccac660
cgtggcccgcactgccatcctgaataatattggtgccgacggtgcctgggtgtcgggtgc720
cgattcaggtattgtggtggcctcgccctcgactgacaatcccgactacttctacacctg780
gacccgcgactcgggcttggtgctgaagaccctggtggacctgttccgcaacggcgacac840
ctcgctgctgtcgaccatcgagaattacatctcggcccaggccatcgtgcagggtatctc900
gaatccctcgggcgacctgtcatcgggcgccggcttgggtgagccaaagttcaatgtgga960
tgaaactgcctacactggctcgtggggccgtccccaaagagacggccccgccttacgtgc1020
caccgccatgatcggtttcggtcagtggctgttggacaatggctacacctccactgccac1080
cgacatcgtgtggcccctggtgcgcaatgacctgtcgtacgtggcccagtactggaacca1140
gaccggctacgacctgtgggaggtgaatggctcgtcgttcttcaccattgcagtgcagca1200
ccgtgccctggtggaaggttcggccttcgcaaccgccgtcggctcctcgtgctcatggtg1260
cgattcgcaagcacccgaaatcctgtgctacctgcagtcgttctggaccggctcgttcat1320
tctggccaacttcgactcgtcgcgctccgccaaggacgccaatactctgctgctgggctc1380
aatccacaccttcgaccccgaggccgcatgcgacgactcaaccttccaaccctgttcacc1440
ccgcgcactggccaatcacaaggaggtggtggactcgttccgctcgatctacaccttgaa1500
tgacggcctgtcagactcggaagccgtggccgtgggccgctaccccgaggacacttacta1560
taatggcaatccctggttcctgtgcaccttggccgcagccgagcagctgtacgacgcact1620
gtatcagtgggacaagcagggctcgctggaggtgaccgatgtgtcgctggacttcttcaa1680
ggccctgtattcggacgccaccggcacctactcctcctcgtcgtcgacctactcgtccat1740
cgtggacgccgtgaagaccttcgcagacggcttcgtgtcgatcgtggagactcacgccgc1800
ctcgaatggctccatgtcggagcagtacgacaagtcggatggcgaacagctgtcggcccg1860
cgacctgacctggtcatatgccgccttgctgactgccaataaccgtcgtaatgtggtgcc1920
ctcagcctcctggggtgagacgtcggcctcgtcggtgcccggtacttgtgcagccacctc1980
agccattggcacctactcatcagtgaccgtcacttcatggccatcgattgtggcaaccgg2040
cggcaccactaccaccgccaccccaactggctccggttcggttacttccacctcgaagac2100
caccgcaaccgcctcaaagacctcaacctcgacctcatccacctcatgcaccacccccac2160
cgccgtggcagtgaccttcgacctgaccgccaccactacctacggcgagaatatctacct2220
ggtgggttcgatctcgcagctgggcgactgggagacgtcagatggcatcgccctgtcagc2280
agacaagtacacctcgtcagatcccctgtggtatgtgaccgtgaccctgcccgccggcga2340
gtcgttcgagtacaagttcatccgcatcgaatcggacgattcagtggagtgggagtccga2400
tcccaatcgtgagtacaccgtgccacaggcctgcggcacctcaaccgccaccgtgaccga2460
cacctggcgctagtga2476
<210>35
<211>2635
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>35
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccatcgaccgcttcaacaacatctccgccgtgaacggccccggcgagga660
ggatacctgggcctccgcccagaagcaaggtgtgggcaccgccaataattacgtgtcaaa720
ggtgtggttcaccctggcaaacggcgccatctcggaggtgtactaccccaccatcgacac780
cgccgacgtgaaggagatcaagttcatcgtgaccgacggcaagtcgttcgtgtcggacga840
gacgaaggacaccatctcgaaggtggagaagttcaccgacaagtcgctgggctacaagct900
ggtgaacaccgacaagaagggccgctaccgcatcaccaaggagatcttcaccgacgtgaa960
gcgcaactccctgatcatgaaggccaagttcgaggccctggagggctcgatccacgacta1020
caagctgtacctggcctacgacccccacatcaagaaccagggctcgtacaatgagggcta1080
cgtgatcaaggccaacaacaacgagatgctgatggccaagcgcgacaacgtgtacaccgc1140
cctgtcgtcgaatatcggctggaagggctactcgatcggctactacaaggtgaacgacat1200
catgaccgacctggacgagaacaagcagatgaccaagcactacgactccgcccgcggcaa1260
catcatcgagggcgccgagatcgacctgaagaagaactcgcagttcgagatcgtgctgtc1320
gttcggcaactccgaggacgaggccgtgaaggcctccatcgagacgctgtcggagaatta1380
cgactcgctgaagtcggcctacatcgacgagtgggagaagtactgcaactcgctgaacaa1440
cttcaacggcaaggccaattcgctgtactacaactccatgatgatcctgaaggcctcgga1500
ggacaagaccaataagggcgcctacatcgcctcgctgtcgatcccctggggcgacggtca1560
gggcgacgataataccggcggttaccaccttgtgtggtcacgtgatctgtaccacgtggc1620
caatgccttcatcgccgccggtgacgtggactcggccaaccgctcgctggactacctggc1680
caaggtggtgaaggacaatggcatgattccccagaatacctggatctccggcaagcccta1740
ctggaccggcatccagctggacgagcaagccgaccccattatcctgtcgtaccgcctgcg1800
ccgctatgacctgtatgactcgttggtgaagcccctggccgacttcatcatcaagatggg1860
ccccaaaactggtcaggaacgttgggaggagattggtggctattcacccgcaaccatggc1920
cgccgaggtggccggcttgacctgtgccgcctacatcgccgagcagaataaggactacga1980
gtcggcccagaagtatcaggagaaggccgacaactggcagaagctgatcgacaacctgac2040
ctacaccgagcacggccccctggagaacggtcagtactacatccgcattgccggcttgcc2100
cgatcccaatgccgacttcaccatctccatcgccaatggtggcggcgtgtatgaccagaa2160
ggagatcgtggacccctcgttcctggagctggttcgcctgggcgtgaagtcaccagacga2220
ccccaagattctgaacaccctgcgcgtggtggactccaccatcaaggtggatacccccaa2280
gggcccctcgtggtaccgctacaaccatgacggctacggcgaaccatcgaagaccgaact2340
gtaccatggcgcaggtaagggtcgtttgtggcccctgttgaccggcgagcgcggcatgta2400
cgaaatcgccgcaggcaaggatgccactccctatctgaaggccatggagaatttcgccaa2460
cgagggcggcattatctcggaacaagtgtgggaggataccggtctgcccaccgactcagc2520
ctcgcccttgaattgggcccacgccgagtacgtggtgctgttcccctcgaacatcgaaca2580
caaggtgctggacatgcccgacatcgtgtacaagcgctacgtggccaagtgatga2635
<210>36
<211>1708
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>36
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccatggagaacctggtcgagaagtcgatcaagatcatcaagaacaacca660
gtcggagtacggctccttcatcgcctcaccctcgttccccacctaccacttctcgtggtt720
gcgcgacggctcgttcatcgcctactccatggacctggtggagcaatacgccgaggccaa780
gaagttctaccgctgggtgaatgaggtgatcatccgctactcgtacaaggtggacaagat840
catcgagaagatcaagaacggcaacaagctggagcccaatgacttcctgtacgcccgcta900
taccctggagggctacgaggagaaggattcgggctggggcaatttccaactggatggcta960
cggcacctggctgtggggcctgtcggaacacatcaagatcaccggcaagaccgagctgat1020
caacgacttcttcaagtccatcgacatcaccatcaagtacatcgacaacctgtggtacta1080
ccccaacttcgacgtgtgggaggagaactccgacaagatccacacctcgaccctggcctg1140
cctgtacggcggcctgaactcgatcaacaagtacctgaacgacgacaaggtgaaggagct1200
ggccaacaagatcaagacctacatcctgaccaactgcgtggtggagaactcgttcgtgaa1260
gtacgtgggctcgaactcggtggactcgtcgctgatctggctggccatccccttcgaggt1320
ggtggacgtgaatgacgagatcttcctgaacaccatcaagcgcatcgagaaggagctgct1380
gcacaatggcggcatgcaccgttaccgcaaggacacctactacggcggcggccagtggat1440
tctgctgtccgcctggatgggtctgtactactgcaagtcgggcgactacaagaaggccga1500
ggaggtgaagaagtggatcgaggagcaggccgacgagaacggctacctgcccgagcaggt1560
cccctaccacctgaacaacgaggtgtactacccctactgggtgaacaagtggggcaacat1620
cgccaagcccctgctgtggtcgcacgccatgtacctggtgctggactacgagctgaagaa1680
ggccggcgtgcagctggaggactgatga1708
<210>37
<211>2653
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>37
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccaacatctccaacatcaagatcgagcgcctgaataacgtgcaggccgt660
gaatggccccggtgaggccgacacttgggccaaagcccagaagcagggtgtgggcaccgc720
caacaattacacctccaaggtgtggttcaccatcgcagacggtggcatctccgaggtgta780
ctaccccaccatcgacaccgccgacgtcaaggacatcaagttcttcgtgaccgacggcaa840
gaccttcgtgtccgacgagacgaaggacaccatcaccaaggtggagaagttcaccgagaa900
gtccctgggctacaagatcatcaacaccgacaaggagggccgctacaagatcaccaagga960
gatcttcaccgacgtgaagcgcaactccctggtgatcaagaccaagttcgaggccctgaa1020
gggcaacgtggacgactaccgcctgtacgtgatgtgcgacccccacgtgaagaaccaggg1080
caagtacaacgagggctacgccgtgaaggccaacggcaatgtggccctgatcgcagagcg1140
cgacggtatctacaccgccctgtcgtccgacatcggttggaagaagtactcgatcggcta1200
ctacaaggtgaacgacatcgaaaccgacctgtacaagaacatgcagatgacctacaacta1260
cgactccgcccgcggcaatatcatcgagggcgccgagatcgacctgaagaagaaccgcca1320
gttcgagatcgtgttgtcgttcggccagtcggaggacgaggccgtgaagaccaatatgga1380
gacgctgaatgacaattacgactcgctgaagaaggcctacatcgaccagtgggagaagta1440
ctgcgactccctgaacgacttcggcggcaaggccaactcgctgtacttcaactccatgat1500
gatcctgaaggcctccgaggacaagaccaacaagggcgcctacatcgcatcgctgtcgat1560
cccctggggtgacggccaggaagacgacaatatcggcggctaccacctggtttggtcccg1620
cgacttgtaccacgtggccaatgccttcattgtggccggcgataccgactcggccaatcg1680
cgccttggactacctggacaaggtggtgaaggacaacggcatgatcccccagaacacctg1740
gatcaatggccgcccctactggaccggcattcagctggacgaacaggccgaccccatcat1800
cctgtcataccgcctgaagcgctacgacctgtacgagtcgctggtgaagcccctggccga1860
cttcatcatgaagatcggccccaagaccggccaggaaagatgggaggaaattggtggcta1920
ctcacccgccaccctggcatcggaagttgccggcctgacctgtgcagcctacatcgccga1980
gcagaacaaggacttcgagtccgccaagaagtaccaggagaaggccgacaactggcagcg2040
cctgatcgacaatctgacctacaccgaaaagggccccttgggcgacggccactactacat2100
ccgcattgccggcctgcccgatcccaatgccgacttcatgatctcgatcgccaatggtgg2160
cggtgtgtacgaccaaaaggagatcgtggacccctcgttcctggagctggtgcgcctggg2220
tgttaagtccgccgacgaccccaagatcctgaacaccctgaaggtggtggacgagactat2280
caaggtggacacccccaagggcccctcgtggtatcgttataatcacgacggctacggcga2340
gatgtcgaagaccgaactgtaccacggcaccggcaagggccgtctgtggcccctgttgac2400
cggtgaaagaggtatgtatgagatcgccgccggtaaggacgccacctcgtatgtgaaggc2460
catggagaacttcgccaatgagtccggcatcatctcggaacaggtgtgggaagataccgg2520
cctgcccactgactccgcctcacccctgaattgggcccacgccgagtacgtgatcctgtt2580
cgcctccaatatcgagcacaaggtgctggacatgcccgacatcgtgtacaagcgctacgc2640
ctcgaagtgatga2653
<210>38
<211>2527
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>38
ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60
tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120
cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180
ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240
gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300
aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360
cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420
ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480
ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540
gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600
gcctgcgaatgccatggtgcgctacatccccatgggcaacggcaagatcctggtgtcctt660
caacaacgactacaacctgaccgacttctacttctcgaaggacatggccgagaaccactc720
cgccggcaagcccttccgctacggcgtgtcgatcaacgacaagttcacctggatcaacgc780
ctcgaacatcgtgtcgaaggactactacgaccacaccatgatcggcatcgtgaagtacaa840
catcaacgacgtgtcgttcgaggacgacaacttcgtggacatctacgaggacgtgtacgc900
ccgcaagatcaagatcaccaacaagcgcaaggagaagatcaacgtgaagctgttcttcca960
ccagaacttctccatctacggcaacaacatcggcgacaccggcttctactaccccgacac1020
caacgccatcgtgcactacaagggccgccgctacttcatcatctcgaccaccgacggcaa1080
gaactcgttcgaccagtacgccatcggcatcaaggacttcaacggcatggccggcacctg1140
gaaggacgccgaggacaataatttgtcgatgggccccatcgccatcggctcggtggactc1200
caccattcgtcactcgatcgacatcgatcccgagtcgcagaaggagctgtactactacat1260
cgcctgcgcccgcgacttggacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaa1320
tctggaccgcatgatgaagcgcaccgagaatttctgggagctgtgggtgtcgaagtcgcc1380
cctgaatctgaccgccgagctgaacgagatgtacaagaagtcgctgttcatcatccgctc1440
gcacatcaatgagaagggcgccgtgatggcctcctcggattcggatatcctgcgctcgaa1500
tatggactcgtactactactcatggccccgcgacgccggctacgcagccatctcaatgat1560
cgtgtccgagcactcggaccccgccaagctgttcttcgacttctgcatcaacaccatctc1620
caaggacggctacttctaccacaagtacaaccccgacggcaagattgcctcgtcgtggct1680
gccctatatcatggacggcaagcgcatcctgcccatccaggaggacgagtcagccatcgt1740
gatcatcgccgcctggtactactactcgaccaacaatgacatcgagtacatctcctacct1800
gtacgagcgcctgatcaagcgcgtggccgagttcctgtacaacttcacctacgacaacgg1860
tctgcccaaggagtcattcgacctgtgggaggagcgcttcggcatccacacctacaccgt1920
ggcctcggtgtacatcgccctgatctatgccgccaatttcgccgagatcttcaacgagac1980
ggacctggcccgcaagtacaagtccaaggccgacaagatgctggagtcgttcgagaagat2040
gttctactcggacgacctgggctactacgcccgccgcatctacaacggcgacgtggactt2100
cgtgctggactcatcggtgctgtggctggtgatcttcggcatcaagaagcccgatgaccc2160
acgcatcgtgtccaccgtgaaggccatcgagaagaagctgtgggtgcccggcatcggtgg2220
tatcgccagatacgagggcgactactaccagcgcatctcgggcaagaatatccccggcaa2280
cccctggatcatcactaccctgtggctggccgactattacatcatggccggcaataccgg2340
ccgcgccctggagctgatcaactgggtggttcagcactcagaggagtcgggcatcctgtc2400
ggagcagatcaatcccgataatggcgagcccatctcggtgtcccccctgatctggtcgca2460
ctcgcagctggtgctgactctgaagcgctacaaggacgccatcaagaacaagggcatcca2520
gtgatga2527
<210>39
<211>2043
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>39
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccctgcag540
gagggccccctgaacaagcgcgcctacccctccttcgaggcctactcgaactacaaggtg600
gaccgcaccgacctggaaaccttcctggacaagcagaaggaggtgtcgctgtattacctg660
ctgcagaacatcgcctaccccgagggccagttcaataatggcgtgcccggcaccgtgatc720
gcctcgccctcgacctcgaatcccgattactactaccagtggacccgtgactcagccatc780
accttcctgaccgtgctgtcggagctggaggacaacaacttcaacaccaccctggccaag840
gccgtggagtactacatcaacacctcgtacaacctgcagcgcacctcgaacccctccggc900
tcgttcgacgacgagaatcacaagggcctgggcgagccaaagtttaataccgacggttcg960
gcctataccggcgcatggggccgtccccaaaatgatggtcccgcactgcgtgcctacgcc1020
atctcgcgctacctgaacgacgtgaattcgctgaacgagggcaagctggtgctgaccgac1080
tcgggcgacatcaacttctcgtccaccgaggacatctacaagaacatcatcaagcccgac1140
ctggagtacgtgatcggctactgggactcgaccggcttcgacctgtgggaggagaatcag1200
ggccgtcacttcttcacctcgctggttcagcagaaggccctggcctatgccgtggatatc1260
gccaagtcgttcgatgacggcgacttcgccaataccctgtcgtcgactgcctcgaccctg1320
gagtcgtacctgtcgggttcggacggcggcttcgtgaacactgacgtgaaccacatcgtg1380
gagaaccccgatctgctgcaacagaattcgcgccagggcctggactcggccacctacatc1440
ggtcccctgttgacccatgatatcggcgagtcatcgtcgacccccttcgacgtggacaac1500
gagtacgtgctgcagtcgtactacctgctgctggaggacaataaggaccgctactccgtg1560
aactcggcctactcggccggcgccgccatcggtcgttatccagaggatgtgtataatggc1620
gacggctcctcagaaggcaatccctggttcctggccaccgcatacgccgcacaggttccc1680
tacaagctggcctacgacgccaagtcagcctcgaatgacatcaccatcaacaagatcaac1740
tacgacttcttcaacaagtacatcgtggacctgtcgaccatcaactccgcctaccagtcg1800
tcggactcggtgaccatcaagtcgggctcggacgagttcaacaccgtggccgacaacctg1860
gtgaccttcggcgactcgttcctgcaggtcatcctggaccacatcaacgacgacggctcg1920
ctgaatgagcagctgaaccgttacaccggctactccaccggtgcctactcgctgacctgg1980
tcatcgggcgccttgttggaggccattcgtctgcgcaataaggtgaaggccctggcctga2040
tga2043
<210>40
<211>2398
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>40
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatctcg540
aagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgccatc600
ctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtg660
gcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggcttg720
gtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgaccatc780
gagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacctg840
tcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactggc900
tcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtttc960
ggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccctg1020
gtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgtgg1080
gaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggt1140
tcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaa1200
atcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgactcg1260
tcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacccc1320
gaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatcac1380
aaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagactcg1440
gaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggttc1500
ctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagcag1560
ggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacgcc1620
accggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagacc1680
ttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcg1740
gagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcatat1800
gccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtgag1860
acgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctactca1920
tcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccgcc1980
accccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaaag2040
acctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgaccttc2100
gacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgcag2160
ctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgtca2220
gatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttc2280
atccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtacacc2340
gtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2398
<210>41
<211>2556
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>41
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatcgac540
cgcttcaacaacatctccgccgtgaacggccccggcgaggaggatacctgggcctccgcc600
cagaagcaaggtgtgggcaccgccaataattacgtgtcaaaggtgtggttcaccctggca660
aacggcgccatctcggaggtgtactaccccaccatcgacaccgccgacgtgaaggagatc720
aagttcatcgtgaccgacggcaagtcgttcgtgtcggacgagacgaaggacaccatctcg780
aaggtggagaagttcaccgacaagtcgctgggctacaagctggtgaacaccgacaagaag840
ggccgctaccgcatcaccaaggagatcttcaccgacgtgaagcgcaactccctgatcatg900
aaggccaagttcgaggccctggagggctcgatccacgactacaagctgtacctggcctac960
gacccccacatcaagaaccagggctcgtacaatgagggctacgtgatcaaggccaacaac1020
aacgagatgctgatggccaagcgcgacaacgtgtacaccgccctgtcgtcgaatatcggc1080
tggaagggctactcgatcggctactacaaggtgaacgacatcatgaccgacctggacgag1140
aacaagcagatgaccaagcactacgactccgcccgcggcaacatcatcgagggcgccgag1200
atcgacctgaagaagaactcgcagttcgagatcgtgctgtcgttcggcaactccgaggac1260
gaggccgtgaaggcctccatcgagacgctgtcggagaattacgactcgctgaagtcggcc1320
tacatcgacgagtgggagaagtactgcaactcgctgaacaacttcaacggcaaggccaat1380
tcgctgtactacaactccatgatgatcctgaaggcctcggaggacaagaccaataagggc1440
gcctacatcgcctcgctgtcgatcccctggggcgacggtcagggcgacgataataccggc1500
ggttaccaccttgtgtggtcacgtgatctgtaccacgtggccaatgccttcatcgccgcc1560
ggtgacgtggactcggccaaccgctcgctggactacctggccaaggtggtgaaggacaat1620
ggcatgattccccagaatacctggatctccggcaagccctactggaccggcatccagctg1680
gacgagcaagccgaccccattatcctgtcgtaccgcctgcgccgctatgacctgtatgac1740
tcgttggtgaagcccctggccgacttcatcatcaagatgggccccaaaactggtcaggaa1800
cgttgggaggagattggtggctattcacccgcaaccatggccgccgaggtggccggcttg1860
acctgtgccgcctacatcgccgagcagaataaggactacgagtcggcccagaagtatcag1920
gagaaggccgacaactggcagaagctgatcgacaacctgacctacaccgagcacggcccc1980
ctggagaacggtcagtactacatccgcattgccggcttgcccgatcccaatgccgacttc2040
accatctccatcgccaatggtggcggcgtgtatgaccagaaggagatcgtggacccctcg2100
ttcctggagctggttcgcctgggcgtgaagtcaccagacgaccccaagattctgaacacc2160
ctgcgcgtggtggactccaccatcaaggtggatacccccaagggcccctcgtggtaccgc2220
tacaaccatgacggctacggcgaaccatcgaagaccgaactgtaccatggcgcaggtaag2280
ggtcgtttgtggcccctgttgaccggcgagcgcggcatgtacgaaatcgccgcaggcaag2340
gatgccactccctatctgaaggccatggagaatttcgccaacgagggcggcattatctcg2400
gaacaagtgtgggaggataccggtctgcccaccgactcagcctcgcccttgaattgggcc2460
cacgccgagtacgtggtgctgttcccctcgaacatcgaacacaaggtgctggacatgccc2520
gacatcgtgtacaagcgctacgtggccaagtgatga2556
<210>42
<211>1629
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>42
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggag540
aacctggtcgagaagtcgatcaagatcatcaagaacaaccagtcggagtacggctccttc600
atcgcctcaccctcgttccccacctaccacttctcgtggttgcgcgacggctcgttcatc660
gcctactccatggacctggtggagcaatacgccgaggccaagaagttctaccgctgggtg720
aatgaggtgatcatccgctactcgtacaaggtggacaagatcatcgagaagatcaagaac780
ggcaacaagctggagcccaatgacttcctgtacgcccgctataccctggagggctacgag840
gagaaggattcgggctggggcaatttccaactggatggctacggcacctggctgtggggc900
ctgtcggaacacatcaagatcaccggcaagaccgagctgatcaacgacttcttcaagtcc960
atcgacatcaccatcaagtacatcgacaacctgtggtactaccccaacttcgacgtgtgg1020
gaggagaactccgacaagatccacacctcgaccctggcctgcctgtacggcggcctgaac1080
tcgatcaacaagtacctgaacgacgacaaggtgaaggagctggccaacaagatcaagacc1140
tacatcctgaccaactgcgtggtggagaactcgttcgtgaagtacgtgggctcgaactcg1200
gtggactcgtcgctgatctggctggccatccccttcgaggtggtggacgtgaatgacgag1260
atcttcctgaacaccatcaagcgcatcgagaaggagctgctgcacaatggcggcatgcac1320
cgttaccgcaaggacacctactacggcggcggccagtggattctgctgtccgcctggatg1380
ggtctgtactactgcaagtcgggcgactacaagaaggccgaggaggtgaagaagtggatc1440
gaggagcaggccgacgagaacggctacctgcccgagcaggtcccctaccacctgaacaac1500
gaggtgtactacccctactgggtgaacaagtggggcaacatcgccaagcccctgctgtgg1560
tcgcacgccatgtacctggtgctggactacgagctgaagaaggccggcgtgcagctggag1620
gactgatga1629
<210>43
<211>2574
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>43
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacatc540
tccaacatcaagatcgagcgcctgaataacgtgcaggccgtgaatggccccggtgaggcc600
gacacttgggccaaagcccagaagcagggtgtgggcaccgccaacaattacacctccaag660
gtgtggttcaccatcgcagacggtggcatctccgaggtgtactaccccaccatcgacacc720
gccgacgtcaaggacatcaagttcttcgtgaccgacggcaagaccttcgtgtccgacgag780
acgaaggacaccatcaccaaggtggagaagttcaccgagaagtccctgggctacaagatc840
atcaacaccgacaaggagggccgctacaagatcaccaaggagatcttcaccgacgtgaag900
cgcaactccctggtgatcaagaccaagttcgaggccctgaagggcaacgtggacgactac960
cgcctgtacgtgatgtgcgacccccacgtgaagaaccagggcaagtacaacgagggctac1020
gccgtgaaggccaacggcaatgtggccctgatcgcagagcgcgacggtatctacaccgcc1080
ctgtcgtccgacatcggttggaagaagtactcgatcggctactacaaggtgaacgacatc1140
gaaaccgacctgtacaagaacatgcagatgacctacaactacgactccgcccgcggcaat1200
atcatcgagggcgccgagatcgacctgaagaagaaccgccagttcgagatcgtgttgtcg1260
ttcggccagtcggaggacgaggccgtgaagaccaatatggagacgctgaatgacaattac1320
gactcgctgaagaaggcctacatcgaccagtgggagaagtactgcgactccctgaacgac1380
ttcggcggcaaggccaactcgctgtacttcaactccatgatgatcctgaaggcctccgag1440
gacaagaccaacaagggcgcctacatcgcatcgctgtcgatcccctggggtgacggccag1500
gaagacgacaatatcggcggctaccacctggtttggtcccgcgacttgtaccacgtggcc1560
aatgccttcattgtggccggcgataccgactcggccaatcgcgccttggactacctggac1620
aaggtggtgaaggacaacggcatgatcccccagaacacctggatcaatggccgcccctac1680
tggaccggcattcagctggacgaacaggccgaccccatcatcctgtcataccgcctgaag1740
cgctacgacctgtacgagtcgctggtgaagcccctggccgacttcatcatgaagatcggc1800
cccaagaccggccaggaaagatgggaggaaattggtggctactcacccgccaccctggca1860
tcggaagttgccggcctgacctgtgcagcctacatcgccgagcagaacaaggacttcgag1920
tccgccaagaagtaccaggagaaggccgacaactggcagcgcctgatcgacaatctgacc1980
tacaccgaaaagggccccttgggcgacggccactactacatccgcattgccggcctgccc2040
gatcccaatgccgacttcatgatctcgatcgccaatggtggcggtgtgtacgaccaaaag2100
gagatcgtggacccctcgttcctggagctggtgcgcctgggtgttaagtccgccgacgac2160
cccaagatcctgaacaccctgaaggtggtggacgagactatcaaggtggacacccccaag2220
ggcccctcgtggtatcgttataatcacgacggctacggcgagatgtcgaagaccgaactg2280
taccacggcaccggcaagggccgtctgtggcccctgttgaccggtgaaagaggtatgtat2340
gagatcgccgccggtaaggacgccacctcgtatgtgaaggccatggagaacttcgccaat2400
gagtccggcatcatctcggaacaggtgtgggaagataccggcctgcccactgactccgcc2460
tcacccctgaattgggcccacgccgagtacgtgatcctgttcgcctccaatatcgagcac2520
aaggtgctggacatgcccgacatcgtgtacaagcgctacgcctcgaagtgatga2574
<210>44
<211>2448
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>44
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggtg540
cgctacatccccatgggcaacggcaagatcctggtgtccttcaacaacgactacaacctg600
accgacttctacttctcgaaggacatggccgagaaccactccgccggcaagcccttccgc660
tacggcgtgtcgatcaacgacaagttcacctggatcaacgcctcgaacatcgtgtcgaag720
gactactacgaccacaccatgatcggcatcgtgaagtacaacatcaacgacgtgtcgttc780
gaggacgacaacttcgtggacatctacgaggacgtgtacgcccgcaagatcaagatcacc840
aacaagcgcaaggagaagatcaacgtgaagctgttcttccaccagaacttctccatctac900
ggcaacaacatcggcgacaccggcttctactaccccgacaccaacgccatcgtgcactac960
aagggccgccgctacttcatcatctcgaccaccgacggcaagaactcgttcgaccagtac1020
gccatcggcatcaaggacttcaacggcatggccggcacctggaaggacgccgaggacaat1080
aatttgtcgatgggccccatcgccatcggctcggtggactccaccattcgtcactcgatc1140
gacatcgatcccgagtcgcagaaggagctgtactactacatcgcctgcgcccgcgacttg1200
gacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaatctggaccgcatgatgaag1260
cgcaccgagaatttctgggagctgtgggtgtcgaagtcgcccctgaatctgaccgccgag1320
ctgaacgagatgtacaagaagtcgctgttcatcatccgctcgcacatcaatgagaagggc1380
gccgtgatggcctcctcggattcggatatcctgcgctcgaatatggactcgtactactac1440
tcatggccccgcgacgccggctacgcagccatctcaatgatcgtgtccgagcactcggac1500
cccgccaagctgttcttcgacttctgcatcaacaccatctccaaggacggctacttctac1560
cacaagtacaaccccgacggcaagattgcctcgtcgtggctgccctatatcatggacggc1620
aagcgcatcctgcccatccaggaggacgagtcagccatcgtgatcatcgccgcctggtac1680
tactactcgaccaacaatgacatcgagtacatctcctacctgtacgagcgcctgatcaag1740
cgcgtggccgagttcctgtacaacttcacctacgacaacggtctgcccaaggagtcattc1800
gacctgtgggaggagcgcttcggcatccacacctacaccgtggcctcggtgtacatcgcc1860
ctgatctatgccgccaatttcgccgagatcttcaacgagacggacctggcccgcaagtac1920
aagtccaaggccgacaagatgctggagtcgttcgagaagatgttctactcggacgacctg1980
ggctactacgcccgccgcatctacaacggcgacgtggacttcgtgctggactcatcggtg2040
ctgtggctggtgatcttcggcatcaagaagcccgatgacccacgcatcgtgtccaccgtg2100
aaggccatcgagaagaagctgtgggtgcccggcatcggtggtatcgccagatacgagggc2160
gactactaccagcgcatctcgggcaagaatatccccggcaacccctggatcatcactacc2220
ctgtggctggccgactattacatcatggccggcaataccggccgcgccctggagctgatc2280
aactgggtggttcagcactcagaggagtcgggcatcctgtcggagcagatcaatcccgat2340
aatggcgagcccatctcggtgtcccccctgatctggtcgcactcgcagctggtgctgact2400
ctgaagcgctacaaggacgccatcaagaacaagggcatccagtgatga2448
<210>45
<211>2340
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>45
tcggtcgggtccggacgggcggtccaacccgccccatttcgtgggcaacatgccccatct60
cctgcccgggggatggggcatgaccatgccgcgtccgggttggtcaccgcgcgccgcatg120
tgccggcgatgacaacgtgatttgccatccggggggtcttttgcctcagcgtgaaccgca180
cagctagaattggtcagcgccgtgtacgccgctccagacctagtgtgtggcgtcgttgtc240
gatggtccggcccgtccctgcggacggacgggaattatcgggagcgaatcgccgttccgt300
tcagcgggatgcgtttgcgcgcgtcacaatctcacatccatccaacatcggagccctact360
acgtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggct420
cgctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatct480
cgaagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgcca540
tcctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtgg600
tggcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggct660
tggtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgacca720
tcgagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacc780
tgtcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactg840
gctcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtt900
tcggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccc960
tggtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgt1020
gggaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaag1080
gttcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccg1140
aaatcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgact1200
cgtcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacc1260
ccgaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatc1320
acaaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagact1380
cggaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggt1440
tcctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagc1500
agggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacg1560
ccaccggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaaga1620
ccttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgt1680
cggagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcat1740
atgccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtg1800
agacgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctact1860
catcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccg1920
ccaccccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaa1980
agacctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgacct2040
tcgacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgc2100
agctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgt2160
cagatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagt2220
tcatccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtaca2280
ccgtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2340
<210>46
<211>2383
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>46
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
atgctcactcgcaagagagtggttgcagcgggagctgccgccaccctgtccctcacggcg480
tttgccgggttgcagcccgccagcgccgccaccggccccatctcgaagcgtgccacctgg540
gactcgtggttgtcgaatgaggccaccgtggcccgcactgccatcctgaataatattggt600
gccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtggcctcgccctcgact660
gacaatcccgactacttctacacctggacccgcgactcgggcttggtgctgaagaccctg720
gtggacctgttccgcaacggcgacacctcgctgctgtcgaccatcgagaattacatctcg780
gcccaggccatcgtgcagggtatctcgaatccctcgggcgacctgtcatcgggcgccggc840
ttgggtgagccaaagttcaatgtggatgaaactgcctacactggctcgtggggccgtccc900
caaagagacggccccgccttacgtgccaccgccatgatcggtttcggtcagtggctgttg960
gacaatggctacacctccactgccaccgacatcgtgtggcccctggtgcgcaatgacctg1020
tcgtacgtggcccagtactggaaccagaccggctacgacctgtgggaggtgaatggctcg1080
tcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggttcggccttcgcaacc1140
gccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaaatcctgtgctacctg1200
cagtcgttctggaccggctcgttcattctggccaacttcgactcgtcgcgctccgccaag1260
gacgccaatactctgctgctgggctcaatccacaccttcgaccccgaggccgcatgcgac1320
gactcaaccttccaaccctgttcaccccgcgcactggccaatcacaaggaggtggtggac1380
tcgttccgctcgatctacaccttgaatgacggcctgtcagactcggaagccgtggccgtg1440
ggccgctaccccgaggacacttactataatggcaatccctggttcctgtgcaccttggcc1500
gcagccgagcagctgtacgacgcactgtatcagtgggacaagcagggctcgctggaggtg1560
accgatgtgtcgctggacttcttcaaggccctgtattcggacgccaccggcacctactcc1620
tcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagaccttcgcagacggcttc1680
gtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcggagcagtacgacaag1740
tcggatggcgaacagctgtcggcccgcgacctgacctggtcatatgccgccttgctgact1800
gccaataaccgtcgtaatgtggtgccctcagcctcctggggtgagacgtcggcctcgtcg1860
gtgcccggtacttgtgcagccacctcagccattggcacctactcatcagtgaccgtcact1920
tcatggccatcgattgtggcaaccggcggcaccactaccaccgccaccccaactggctcc1980
ggttcggttacttccacctcgaagaccaccgcaaccgcctcaaagacctcaacctcgacc2040
tcatccacctcatgcaccacccccaccgccgtggcagtgaccttcgacctgaccgccacc2100
actacctacggcgagaatatctacctggtgggttcgatctcgcagctgggcgactgggag2160
acgtcagatggcatcgccctgtcagcagacaagtacacctcgtcagatcccctgtggtat2220
gtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttcatccgcatcgaatcg2280
gacgattcagtggagtgggagtccgatcccaatcgtgagtacaccgtgccacaggcctgc2340
ggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2383
<210>47
<211>1893
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>47
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccgagtcg540
accctgcgcgagctggccgcccagaacggcggccgccacttcggcaccgccatcgcctac600
tcgcccctgaactcggacgcccagtaccgcaacatcgccgccacccagttctcggccatc660
acccacgagaacgagatgaagtgggagtcgctggagccccagcgcggccagtacaactgg720
tcgcaggccgacaacatcatcaacttcgccaaggccaacaaccagatcgtgcgcggccac780
accctggtgtggcactcgcagctgccctcgtggctgaacaacggcggcttctcgggctcg840
cagctgcgctcgatcatggagaaccacatcgaggtggtggccggccgctaccgcggcgac900
gtgtacgcctgggacgtggtgaacgaggccttcaacgaggacggcaccctgcgcgactcg960
atctggtaccgcggcatgggccgcgactacatcgcccacgccttccgcaaggcccacgag1020
gtggaccccgacgccaagctgtacatcaacgactacaacatcgagggcatcaacgccaag1080
tcgaacggcctgtacaacctggtggtggacctgctgcgcgacggcgtgcccatccacggc1140
atcggcatccagtcgcacctgatcgtgggccaggtgccctcgaccttccagcagaacatc1200
cagcgcttcgccgacctgggcctggacgtggccatcaccgagctggacatccgcatgcag1260
atgcccgccgaccagtacaagctgcagcagcaggcccgcgactacgaggccgtggtgaac1320
gcctgcctggccgtgacccgctgcatcggcatcaccgtgtggggcatcgacgacgagcgc1380
tcgtgggtgccctacaccttccccggcgagggcgcccccctgctgtacgacggccagtac1440
aaccgcaagcccgcctggtacgccgtgtacgaggccctgggcggcgactcgtcgggcggc1500
ggccccggcgagcccggcggccccggcggccccggcgagcccggcggccccggcggcccc1560
ggcgagcccggcggccccggcgacggcacctgcgccgtgaactacaccgtggtgaacgac1620
tggggccacggcatgcagggcgccatcaccgtgtcgaacaccggctcgtcgcccatcaac1680
aactggaccctgcagttctcgttctcgggcgtgaacatctcgaacggctggaacggcgag1740
tggtcgcagtcgggctcgcagatcaccgtgcgcgcccccgcctggaactcgaccctgcag1800
cccggccagtcggtggagctgggcttcgtggccgacaagaccggcaacgtgtcgcccccc1860
tcgcagttcaccctgaacggcgccacctgctcg1893
<210>48
<211>1764
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>48
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacgac540
tcgcccttctacgtgaaccccaacatgtcgtcggccgagtgggtgcgcaacaaccccaac600
gacccccgcacccccgtgatccgcgaccgcatcgcctcggtgccccagggcacctggttc660
gcccaccacaaccccggccagatcaccggccaggtggacgccctgatgtcggccgcccag720
gccgccggcaagatccccatcctggtggtgtacaacgcccccggccgcgactgcggcaac780
cactcgtcgggcggcgccccctcgcactcggcctaccgctcgtggatcgacgagttcgcc840
gccggcctgaagaaccgccccgcctacatcatcgtggagcccgacctgatctcgctgatg900
tcgtcgtgcatgcagcacgtgcagcaggaggtgctggagaccatggcctacgccggcaag960
gccctgaaggccggctcgtcgcaggcccgcatctacttcgacgccggccactcggcctgg1020
cactcgcccgcccagatggcctcgtggctgcagcaggccgacatctcgaactcggcccac1080
ggcatcgccaccaacacctcgaactaccgctggaccgccgacgaggtggcctacgccaag1140
gccgtgctgtcggccatcggcaacccctcgctgcgcgccgtgatcgacacctcgcgcaac1200
ggcaacggccccgccggcaacgagtggtgcgacccctcgggccgcgccatcggcaccccc1260
tcgaccaccaacaccggcgaccccatgatcgacgccttcctgtggatcaagctgcccggc1320
gaggccgacggctgcatcgccggcgccggccagttcgtgccccaggccgcctacgagatg1380
gccatcgccgccggcggcaccaaccccaaccccaaccccaaccccacccccacccccacc1440
cccacccccacccccccccccggctcgtcgggcgcctgcaccgccacctacaccatcgcc1500
aacgagtggaacgacggcttccaggccaccgtgaccgtgaccgccaaccagaacatcacc1560
ggctggaccgtgacctggaccttcaccgacggccagaccatcaccaacgcctggaacgcc1620
gacgtgtcgacctcgggctcgtcggtgaccgcccgcaacgtgggccacaacggcaccctg1680
tcgcagggcgcctcgaccgagttcggcttcgtgggctcgaagggcaactcgaactcggtg1740
cccaccctgacctgcgccgcctcg1764
<210>49
<211>2604
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>49
ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60
aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120
ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180
ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240
catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300
gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360
ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccgccggc540
acctacaactacggcgaggccctgcagaagtcgatcatgttctacgagttccagcgctcg600
ggcgacctgcccgccgacaagcgcgacaactggcgcgacgactcgggcatgaaggacggc660
tcggacgtgggcgtggacctgaccggcggctggtacgacgccggcgaccacgtgaagttc720
aacctgcccatgtcgtacacctcggccatgctggcctggtcgctgtacgaggacaaggac780
gcctacgacaagtcgggccagaccaagtacatcatggacggcatcaagtgggccaacgac840
tacttcatcaagtgcaaccccacccccggcgtgtactactaccaggtgggcgacggcggc900
aaggaccactcgtggtggggccccgccgaggtgatgcagatggagcgcccctcgttcaag960
gtggacgcctcgaagcccggctcggccgtgtgcgcctcgaccgccgcctcgctggcctcg1020
gccgccgtggtgttcaagtcgtcggaccccacctacgccgagaagtgcatctcgcacgcc1080
aagaacctgttcgacatggccgacaaggccaagtcggacgccggctacaccgccgcctcg1140
ggctactactcgtcgtcgtcgttctacgacgacctgtcgtgggccgccgtgtggctgtac1200
ctggccaccaacgactcgacctacctggacaaggccgagtcgtacgtgcccaactggggc1260
aaggagcagcagaccgacatcatcgcctacaagtggggccagtgctgggacgacgtgcac1320
tacggcgccgagctgctgctggccaagctgaccaacaagcagctgtacaaggactcgatc1380
gagatgaacctggacttctggaccaccggcgtgaacggcacccgcgtgtcgtacaccccc1440
aagggcctggcctggctgttccagtggggctcgctgcgccacgccaccacccaggccttc1500
ctggccggcgtgtacgccgagtgggagggctgcaccccctcgaaggtgtcggtgtacaag1560
gacttcctgaagtcgcagatcgactacgccctgggctcgaccggccgctcgttcgtggtg1620
ggctacggcgtgaaccccccccagcacccccaccaccgcaccgcccacggctcgtggacc1680
gaccagatgacctcgcccacctaccaccgccacaccatctacggcgccctggtgggcggc1740
cccgacaacgccgacggctacaccgacgagatcaacaactacgtgaacaacgagatcgcc1800
tgcgactacaacgccggcttcaccggcgccctggccaagatgtacaagcactcgggcggc1860
gaccccatccccaacttcaaggccatcgagaagatcaccaacgacgaggtgatcatcaag1920
gccggcctgaactcgaccggccccaactacaccgagatcaaggccgtggtgtacaaccag1980
accggctggcccgcccgcgtgaccgacaagatctcgttcaagtacttcatggacctgtcg2040
gagatcgtggccgccggcatcgaccccctgtcgctggtgacctcgtcgaactactcggag2100
ggcaagaacaccaaggtgtcgggcgtgctgccctgggacgtgtcgaacaacgtgtactac2160
gtgaacgtggacctgaccggcgagaacatctaccccggcggccagtcggcctgccgccgc2220
gaggtgcagttccgcatcgccgccccccagggcaccacctactggaaccccaagaacgac2280
ttctcgtacgacggcctgcccaccacctcgaccgtgaacaccgtgaccaacatccccgtg2340
tacgacaacggcgtgaaggtgttcggcaacgagcccgccggcggctcggagaaccccgac2400
cccgagatcctgtacggcgacgtgaactcggacaagaacgtggacgccctggacttcgcc2460
gccctgaagaagtacctgctgggcggcacctcgtcgatcgacgtgaaggccgccgacacc2520
tacaaggacggcaacatcgacgccatcgacatggccaccctgaagaagtacctgctgggc2580
accatcacccagctgccccagggc2604
<210>50
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>50
gatcggcacgtaagaggttccaactttcaccccgaggtccacacgccgg49
<210>51
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>51
ggcgcgcttgttcagggggccctcctgcagggcattcgcaggcgccatg49
<210>52
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>52
ctgcaggagggccccctgaacaagcgcgcc30
<210>53
<211>50
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>53
ctatttcgttcatccatagttgcctgactcatgggattcagttgtaggtg50
<210>54
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>54
ccacgagtcccaggtggcacgcttcgagatggcattcgcaggcgccatg49
<210>55
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>55
atctcgaagcgtgccacctgggactcgtgg30
<210>56
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>56
cacggcggagatgttgttgaagcggtcgatggcattcgcaggcgccatg49
<210>57
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>57
atcgaccgcttcaacaacatctccgccgtg30
<210>58
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>58
cttgatcgacttctcgaccaggttctccatggcattcgcaggcgccatg49
<210>59
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>59
atggagaacctggtcgagaagtcgatcaag30
<210>60
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>60
caggcgctcgatcttgatgttggagatgttggcattcgcaggcgccatg49
<210>61
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>61
aacatctccaacatcaagatcgagcgcctg30
<210>62
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>62
gccgttgcccatggggatgtagcgcaccatggcattcgcaggcgccatg49
<210>63
<211>30
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>63
atggtgcgctacatccccatgggcaacggc30
<210>64
<211>49
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>64
gatcggcacgtaagaggttccaactttcaccccaccgtgagctgcacct49
<210>65
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>65
ggcgcgcttgttcagggggccctcctgcagggcctgtgcaagtggtgcaaac52
<210>66
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>66
ccacgagtcccaggtggcacgcttcgagatggcctgtgcaagtggtgcaaac52
<210>67
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>67
cacggcggagatgttgttgaagcggtcgatggcctgtgcaagtggtgcaaac52
<210>68
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>68
cttgatcgacttctcgaccaggttctccatggcctgtgcaagtggtgcaaac52
<210>69
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>69
caggcgctcgatcttgatgttggagatgttggcctgtgcaagtggtgcaaac52
<210>70
<211>52
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>70
gccgttgcccatggggatgtagcgcaccatggcctgtgcaagtggtgcaaac52
<210>71
<211>50
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>71
gatcggcacgtaagaggttccaactttcacctcggtcgggtccggacggg50
<210>72
<211>54
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>72
cacgcgcgccgtcttgacgaagggattcacgtagtagggctccgatgttggatg54
<210>73
<211>43
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>73
cggccgcgggaaggaccagacatgctcactcgcaagagagtgg43
<210>74
<211>40
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>74
ccaggtggcacgcttcgagatggggccggtggcggcgctg40
<210>75
<211>55
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>75
gttctgggcggccagctcgcgcagggtcgactcggcctgtgcaagtggtgcaaac55
<210>76
<211>33
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>76
gagtcgaccctgcgcgagctggccgcccagaac33
<210>77
<211>55
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>77
tctatttcgttcatccatagttgcctgactcgagcaggtggcgccgttcagggtg55
<210>78
<211>55
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>78
catgttggggttcacgtagaagggcgagtcgttggcctgtgcaagtggtgcaaac55
<210>79
<211>33
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>79
aacgactcgcccttctacgtgaaccccaacatg33
<210>80
<211>55
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>80
tctatttcgttcatccatagttgcctgactcgaggcggcgcaggtcagggtgggc55
<210>81
<211>55
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>81
ctgcagggcctcgccgtagttgtaggtgccggcggcctgtgcaagtggtgcaaac55
<210>82
<211>33
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>82
gccggcacctacaactacggcgaggccctgcag33
<210>83
<211>51
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>83
tctatttcgttcatccatagttgcctgactgccctggggcagctgggtgat51
<210>84
<211>1212
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>84
tcagtccacctccaccaattcgtgttcgattccgtgctcttgcagccaccgcgccaagcc60
agcttgaccgcccaattcgcaacttcgcagacactcgtagagcttctgctgccccaccag120
gcgacgccatccgtcacccgtgatcaaagcgacagtgtcagcaacagacccgacttcctc180
agccgcgatcacgtcgtcagattcctcaaccatgaggccgagacggtccctcaaccccgc240
agaccagccaatctgtctgcgtccccggctacccttctcccactcgaaccagagaccaac300
ctctttcgccaagccgttggccgcgtcgcccaggacctcccaagtcgatcgagtcgagag360
cgcagaacgcgccgtcttgctctgggagttcgtcaactcgtggccgatcttcccctggaa420
ctgcgccttgctcaggtagcgcgcgaggtgatccaggccagttgctgcgctcatctgctg480
aacgtcttgcgcgcgagcaaggggagtcccgaggccagcagcgagcacgccgcgttccca540
acggccgaacatggaccggtgcagcgccagagcgtcgccgaagtcgccgaccaggaacac600
gagcacatgcagatgcacatgccacccattgcgcccgtgcgtaacctcgaccacacgcac660
gaagccctcgaccccgtgacggagctggtcagacgtccagcccttgcccgaagtgactcg720
ccgccaccccgaagcgacaccatcccaaacagccgtcaaggaatccttacgagagtgccg780
aaccgtgaacgtcatgaacgccacacgaccaccgtgcttagtccaggtctcgaccgccgc840
gccgagttcaaggccacgccgagccatgatcttcgcgttacacaccgggcaggcccagac900
cgatccgcagctctgcaacccagcgaaaccggcccggccgtcgctgcaccgcacaccaac960
cgaagcgaccgccgaggcggcaacacgaccgcagaacgcaacccgcttcaacgacgtatg1020
acgccacaaccaataacggaccgaaaaccggtgtttgcgcttgtcagcagccacttcacc1080
agcagccggcaccgcggaaggtgaaacattgttcgcatgattatctagggcgccccctag1140
cggggccaccgcagggctcccgcccccacacccccggacgccacgacttcgcgccctggc1200
atcgaccaccat1212
<210>85
<211>1176
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>85
tcaattggcctccgccgcggtcttcgtaagcgcgcgtctggtgagaagcatgatgacgag60
agcgatcgctgtcagcaccgaagcgacccaaaccggcgcgagcagccccagcccggtcgc120
gagcccgagcgcaccaagcacgggccccgctgcagctccgatattcaatgctgcggttgc180
gtacgaaccgcccatcgttggcgcacccgatgctgcatacagcacacgcgtgatcagagt240
actgccgacgccgaacgacaggaatccctgaacgaggacgaggacgataagcgcaacggg300
atgagatgcgaccactgccaacacgatccagcctgtcagcaatagcggtccgccgactgc360
gagcacgaggccaggtcgttgatctgatagtcgtcctgcgatcgtgacgccaaggaacga420
tccgatgccgaacatcaccagcgcgacggacacccacgcttcggccaagcccgcggtctc480
ggtcacgatgggtgccaggaaggtgaatgccgcaaaggtccctccgttgatcagcgctcc540
gagtgccatggccaggatgagccgcggcgtcgccaactggctgagctcgacacggagcct600
tggtgaggtcgcgctagtctcgctccgaccaacattgttcgtgacgccacgaatgactcc660
aacggccgcgggaatacagaggatggcgatcgcccagaacgtcgttcgccagcccagcgc720
tgtgccgagcagtgccccggcggggacgcccacgacggttgcgatcgtcgtgccggagag780
caggatcgacagtgcacgccccttctggttcgctggcacgagggtagtggccgtgctcag840
tgctacggcgaggaatcctgcgtttgcgagagcgctgagcacccgggtgatgagcaggag900
agagaacactggtgtcatcgctccgatgacgtggcttcccgcgaacacgagaaggcaaac960
gatcaatgtgagccgcggtggccaacggcgagcgaatgccgccatcactggcgcgccgac1020
gaccataccgactgcgaatgcggaggtcagcaggcccgcagtgccgaccgagacgtcaag1080
ttcggtcgcgatcgcggggagcaatcccgcgagcatgaattctgaagtgcccatgacgaa1140
gaccgccagggcaagcatgtagagggcaaaaggcat1176
<210>86
<211>54
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>86
tcaagaaatggttcttcttgtcaccacggccagcgccccgggtacgccagacat54
<210>87
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>87
metalathrglyalaalaalaalametphevalthrthrphealagly
151015
metalaproalaasnalalysgluvalalaser
2025
<210>88
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>88
metasnprophevallysthralaargvalalailethrserthrleu
151015
valalaglyserleualathralaserleuvalphealaproleuala
202530
glnalaasptyrserproleu
35
<210>89
<211>56
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>89
metalaserserasnalaalalysseralaserargarggluglnleu
151015
argalaalaarggluargglualaalaalaalaargarglysargile
202530
ileilevalthrvalvalvalvalileilealaalaleuvalalaval
354045
ilealametalaalaserglyval
5055
<210>90
<211>33
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>90
metleuthrarglysargvalvalalaalaglyalaalaalathrleu
151015
serleuthralaphealaglyleuglnproalaseralaalathrgly
202530
pro
<210>91
<211>58
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>91
metalaserserasnalaalalysseralaserargarggluglnleu
151015
argalaalaarggluargglualaalaalaalaargarglysargile
202530
thrvalvalalavalalavalvalvalalaalavalleuvalalaval
354045
ilealametalaalaglyglyvalphegly
5055
<210>92
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>92
metalalysleuleutyrargleuglyargglyalaalahisargala
151015
trpalavalileilecystrpleuilevalleualaalaalaglygly
202530
alatyralaalaphehisglythrleu
3540
<210>93
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>93
metserargserglyargargasnargleuvalalapheleuleuleu
151015
thralaleuvalalaserthrilemetleuglythrserseralahis
202530
alaaspaspglytrpserser
35
<210>94
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>94
metargargglyvalhisglyalavalvalleuleuleuglyalamet
151015
metalathrleutrpvalalaleuglyproglythrproalaargala
202530
glnthraspglnproval
35
<210>95
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>95
metargargphepheseralaalailealaileleuleualaalathr
151015
leuthrproalaleuasnalaprometalaseralaalaaspglnthr
202530
serala
<210>96
<211>33
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>96
metargleualaargargvalalaalavalleuleualaservalleu
151015
alaleuthrvalalasercysalaglyalaalaargseralaproser
202530
leu
<210>97
<211>62
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>97
metaspserproserargseraspalathrthraspglygluaspasp
151015
alametthralaglnserargargproglyglnalaalaargphegly
202530
argvalproilealavalleuvalthralaleuleuleuvalvalgly
354045
valleualaalathrproprothralaglyalathrprogly
505560
<210>98
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>98
metthrhisvalservalthrargproargargileglyalaleuala
151015
leualaalaalaalaalavalalaleuseralacysglyalasergly
202530
metleualaglnserpro
35
<210>99
<211>37
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>99
metserseralaargargalaargargproservalphethrleuval
151015
valvalglyvalvalalaleuvalleuvalleuglyalaalaalaala
202530
trpglnvaltrpgly
35
<210>100
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>100
metpheglylysargargilealaleuileleuleuserleuleuval
151015
alaglyservalvalalaalavalserproser
2025
<210>101
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>101
metalathralaalaalaalathrleuvalileserserleuglyval
151015
thralaseralaglyalaaspthrvallysgly
2025
<210>102
<211>54
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>102
metilemetproserserargargargproleuthrprothrproser
151015
glyvalargalasertrpthrargleuvalglyleualaalaleupro
202530
leuvalleuvalalaalaglycysalaalaserproglyserglythr
354045
serproseralaglythr
50
<210>103
<211>65
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>103
metasnprovalserproargasnseralaproserhisseralaser
151015
serglnglyseralaalaprohisvalleuserthrthrleuserarg
202530
argargleuleusermetalaalaleuglyalaglyalavalalaleu
354045
alaalacysalaglyproserthrserserglyalaserserserala
505560
ala
65
<210>104
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>104
metthrpheargleuargalaargprovalilealaalaleuserval
151015
leualaleualaalacysalaglnproproseralaarghisthrglu
202530
thrgly
<210>105
<211>35
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>105
metlysleuargproleuvalleuvalvalglyalaalaleuserval
151015
thrleuvalalaglycysglyglyasnserserglyglyalaserser
202530
seralapro
35
<210>106
<211>57
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>106
metthralaglyargproglyalaargglnargproproglyalaala
151015
prohisargargthrglyglyalathrargalaalaleumetglyphe
202530
leualaleuleumetvalalaleuglyleuthralaalaproglnarg
354045
alaleualaglnthrseraspserphe
5055
<210>107
<211>56
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>107
metlysseralathrargargproleuthrargtrpilevalalaphe
151015
glyvalvalleuvalleuvalilealaglyservalglyleuhisala
202530
serglyalaleuvalserglyglyalaserthrvalproalaglyval
354045
phealathrproalathrasnleu
5055
<210>108
<211>36
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>108
metargleuglnargargglyleuleualatrpalaglyalaalaala
151015
alaalaalathrleuseralacysglyglylysserserserserser
202530
thrleuserser
35
<210>109
<211>54
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>109
metserproarghisalaaspaspalaserglyaspargargargthr
151015
glyproglnalaargleuproargtrpleualaglyleuleucysile
202530
valleuthrthrleuserleuglyvalvalhisproalavalargala
354045
aspaspalathrleuasp
50
<210>110
<211>28
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>110
metlysargvalleuilevalvalleualaleuleuleuileileala
151015
glyglyleualaglyasnalapheargasnalaarg
2025
<210>111
<211>53
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>111
metgluserilevalvalthrproargasnprohisargserhisarg
151015
proargleuargargalaserargleualavalpheglymetalaleu
202530
alaleuvalthralacysseralaserproglyglyalaglyglyser
354045
thrseralaargasp
50
<210>112
<211>36
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>112
metlystyrargproleuvalvalleuglysercysalaleualaleu
151015
glyleuvalalaglycysseralalysproalavalserglyalagly
202530
serseralaser
35
<210>113
<211>51
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>113
metsermetthrasphisserasphisalaalaseralaseralaser
151015
arghisargtrpthrargtrpalaserleualaleuvalproileleu
202530
leuleualaalaglycysserlysseraspalaseralaserproser
354045
seralaser
50
<210>114
<211>49
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>114
metasnthrmetasnglyproglngluvalservalasnarghispro
151015
trpargargargphealaalaleuglyseralaalaalailealaleu
202530
glyglymetthrphevalserproalaglualaglnalaalaglyval
354045
gln
<210>115
<211>49
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>115
metlyshisalahisargileleualaleuvalalaalaalaproleu
151015
leuleuthralacysglyserasnaspglyserthrproalaserthr
202530
proserserserthrprothrthralaseralaserhisseralathr
354045
pro
<210>116
<211>49
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>116
metseraspthrproargproserhisaspproargprolysvalthr
151015
leuargthrvalleuilealaileglyvalvalleuvalvalleuile
202530
alaglyalailevalvalthrthrargasnalaserthrproaspthr
354045
asn
<210>117
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>117
metserhisthrvalargglytyrleuargalaleuglyalaproval
151015
alaleuvalphealavalthralacysglyalaproglnalaglygln
202530
alaserserseralathrthr
35
<210>118
<211>33
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>118
metserargargphealathrthrleualaalaseralaleuserleu
151015
valvalleualaglycysserthralathralaglyprosersergly
202530
thr
<210>119
<211>46
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>119
metglnalaserhisproserargserthrargtrpcysalaleuile
151015
alaglycysleuglyseralaleuvalleuseralacysseralagly
202530
serglyglyserthralaproalaserserserargalaala
354045
<210>120
<211>44
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>120
metlysserserprothrleualavalalaalaleuglyleucysala
151015
ilethralaleualaglycysserserserthrserglyserserser
202530
serproserasnthralathralaleusermetlys
3540
<210>121
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>121
metserleualaargargalaleuthrvalalaleualaglyalacys
151015
alaleuvalalaleuserglycysglyglyserthrserthralapro
202530
alaserthrproglyserhis
35
<210>122
<211>45
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>122
metleualaglyproserlyslysserileprotyrthrargthrala
151015
glypheileleualaalaileproalavalglyleuserleualaleu
202530
alaproserhisalaseralaaspthrvalsergluthr
354045
<210>123
<211>44
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>123
metserserargglnglyaspserargleutyrserphevalileleu
151015
alavalleuservalthrcysglyvalpheilealaglymetglyile
202530
prophealaalaleualaseraspalaalaglyser
3540
<210>124
<211>44
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>124
metalaasplyslysproglyargglyarglysilethrargargmet
151015
alathrvalleuvalglyalaleualaglyleuleuphevalalaala
202530
alathrthrserhisglyseraspleuargprothr
3540
<210>125
<211>44
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>125
metlysalathrargargservalleualaglysermetalavalala
151015
glysertrpleuleualaalacysseralaasnserproserasnser
202530
valserglnalaphealathrproseralaleuthr
3540
<210>126
<211>43
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>126
metasnvalileserproleuvalproserglyargserargileala
151015
cysleuvalalaalaalaleuilevalleuglyleuglyvalproala
202530
ileargalaalaalavalprothrproaspgln
3540
<210>127
<211>42
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>127
metserargserserleuargilealaalaalaglyleuvalalaval
151015
thrleuleuserthralaalacysserglyserserserserthrser
202530
serserseralaalaalaleuproserval
3540
<210>128
<211>42
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>128
metpheileserargpheargargalaalaalavalglyleualaala
151015
valthralaleuseralathralacysserglyserserserserser
202530
serserseralaserseralaleuproser
3540
<210>129
<211>43
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>129
metasnphethrproargthrargleuserargtrpalavalglyleu
151015
valleuglyalaleuilevalproleualaalacysserthrproser
202530
serserserseralaseralaglylysleuasn
3540
<210>130
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>130
metserserthrargphethrasnargglythrleualavalvalala
151015
leuseralaalaleuleualaglyglyleuthralacyssersergly
202530
alaglyseraspthrserproalathr
3540
<210>131
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>131
metalametargalaarghisglyvalvalargleuglyleuvalcys
151015
leuthralaleualavalpheglythralaasnvalserglyglnval
202530
alavalmetalagluglythraspala
3540
<210>132
<211>29
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>132
metthrarghisserargleuthrargpheleuleuvalleuleuala
151015
leuthrleuglythralametseralacysglyasngln
2025
<210>133
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>133
metasnleusertrpglnlysargleualaalaleualavalalaala
151015
thrleuthrglycysglyalathrthralaserserprothrthrthr
202530
alaseralaglnalaalaalathrser
3540
<210>134
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>134
metserargileglnleuproargleuserargilealailealaala
151015
alaalaseralaalaleuileglythrserpheilealaproalathr
202530
alaphealaalaproasnthrprothr
3540
<210>135
<211>40
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>135
metglypheargvalglyargargproleuileglyalavalleuala
151015
glysermetalathrleuvalglycysserthrserglyserglyser
202530
glyalaserserglnalahisasn
3540
<210>136
<211>40
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>136
metthrleuargarghisleualaproalaleuvalalaproalaleu
151015
alaalaalailepheleuglyglycysalaalaglnasnproarggly
202530
aspalaserserserglyalaser
3540
<210>137
<211>40
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>137
metleulysproargleuvalvalleuglyleuserleualaleuala
151015
metvalglycysalaargthrproproserserglyserserserala
202530
hisalaglnvallysalacysleu
3540
<210>138
<211>41
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>138
metthrleuargargalavalilealaleuilealaalametserleu
151015
leuleualaglycysserglyserserserserserlysserserala
202530
seralaserglyglyalaalaalagly
3540
<210>139
<211>40
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>139
metservalserleuserargilealacysvalglyalaleualathr
151015
alaleuvalleuserglycysserglyserserglyserglyalalys
202530
valalaseraspcyslysproala
3540
<210>140
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>140
metserargargargpheleuleuglyvalseralavalvalglyala
151015
seralaleuglyalaseralaleualaglycysserasnilealaser
202530
alaglythrargalaglygln
35
<210>141
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>141
metargserthrthrthrlysalaphealaglyvalalavalleuala
151015
leualaleualaglycysglyserasnserglyserserthrlysser
202530
alaaspserasnalalysleu
35
<210>142
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>142
metasnhisvalserleulysserargileleuvalalaalaleuala
151015
alaglymetleuglyleuseralacyssersergluglyproalaser
202530
seralasersersergly
35
<210>143
<211>39
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>143
metlysthrargvalargserarglysproalaalaglyleualagly
151015
ilealaleuphealaserglyleuserleumetserthrvalalaser
202530
argalaaspserglyleupro
35
<210>144
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>144
metalagluargthralaargargleuthrargargserleuleuala
151015
ileglyalavalglyserleuthralaleualaalacysalaglyala
202530
thrthrprophevalser
35
<210>145
<211>56
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>145
metalaasparglyslysserarglysproargargalaleualapro
151015
seralaserglnarghisglyprohisargthrlyslyslysalaser
202530
argalaargargvalvalthralailealailethrleualathrleu
354045
metilevalglyvalleuglyser
5055
<210>146
<211>37
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>146
metleuthrargargserilealaargargpheleuthrglyalaala
151015
valvalvalglyvalalavalvalthrilephevalvalaspalaleu
202530
valserproalaile
35
<210>147
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>147
methisargcysproleutrpvallystyrleuleuleuvalalaval
151015
glyvalvalprophephealalysasnvalproleuserleualaala
202530
phealavalalaalaval
35
<210>148
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>148
metlyslysleuleualaglyleuleuilevalleuilealavalala
151015
glyphealaglyglyasnleuleuargglnhisthrmetleualaasp
202530
glyalasertyrargphe
35
<210>149
<211>38
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>149
metthrargasnthrargthralailevalalaalaleucyspheval
151015
leuleualaglyalavalthrleuileproileprophevalalatrp
202530
serproglyvalthrtyr
35
<210>150
<211>37
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>150
metasnargservaltyrargthrleuleuargilevalglyileval
151015
leualaleuvalglyvalalaalavalpheglyglyvalphealahis
202530
asnasnvalthrasp
35
<210>151
<211>37
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>151
metserlysthrleuserargilealaservalalaservalalaala
151015
leualaglyserilethrvalilealaglyglnasnalaseralaasp
202530
servalasntrpasp
35
<210>152
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>152
metargargalavalseralavalleualaalavalvalglyleugly
151015
metvalalacysglyproasnlysvalasnseralavalglyaspthr
202530
ilelys
<210>153
<211>36
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>153
metserargargserleuleuvalargileglyvalproalaalaala
151015
leualametphealaglycysserproserproalathralaileglu
202530
leuaspglyala
35
<210>154
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>154
metprothrargargserpheleuphealaalaleuthrvalalaleu
151015
valglycysalaproserprovalvalasnalaproargalaarggly
202530
serval
<210>155
<211>35
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>155
metargargargvalserhisproleuargvalileleuvalglymet
151015
valvalleualacysleuvalleuthrglysertrpalaleuvalhis
202530
glyalaala
35
<210>156
<211>35
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>156
metleuargglnproargglnleuileseralaglyilealaileleu
151015
leuglyvalalaphevalalaalathrphevalpheseralaserleu
202530
asnalagly
35
<210>157
<211>35
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>157
metthrhisleuproserargpheserargargalavalleuthrgly
151015
alaglyvalalavalalaglyglyglyalaalatrpalaalagluarg
202530
pheleuile
35
<210>158
<211>29
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>158
metargargserargcysalaalaalavalpheserilealaleuala
151015
valglyalathrleuglyalavalthrvalphevalser
2025
<210>159
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>159
metalahishisargseralaglytrpleualaleualaalapheval
151015
alaalaservalleuvalglycysaspproproalathrthrglyser
202530
proser
<210>160
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>160
metalaserargalaleugluthrleuserargleuthralaleuval
151015
valglyphevalalametprothrproalavalargaspasphisgly
202530
alaarg
<210>161
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>161
metserthrglyargmetlyspheilelysleualavalprovalile
151015
valalacyscysleuthrprometalaalaleualaaspvalglyser
202530
progly
<210>162
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>162
metlysargileprovalalailevalglycysalavalalaleuval
151015
alaglyseralavalalaglyseralaalaargalaalaargleuasp
202530
alaval
<210>163
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>163
metargleuproargargalavalleuglyalaileglyleualathr
151015
leualaalacysserargasnaspproileglyalaserserserala
202530
serarg
<210>164
<211>34
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>164
metthrserglyhisargasplysmetcysaspvalseralatyrleu
151015
metleuleualaproseralaasnhisvaltyralaalagluthrala
202530
thrleu
<210>165
<211>33
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>165
metarglysleuleulysleuilealaalaleuglyalaphealaleu
151015
alaleuthrglycysserglyglyglyserglyseraspserglyser
202530
ser
<210>166
<211>33
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>166
metthrtrpalaarghisphetrpleulysvalvalseralavaltrp
151015
valleuvalalametglyserthralavalalaalaleuthrilethr
202530
val
<210>167
<211>32
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>167
metilealaleuilealaleuvalleuvalvalalaglythralaleu
151015
valvalhisserleuserthrserargaspalaproargaspmetala
202530
<210>168
<211>32
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>168
metargglyserthrlysmetileilevalglyalavalleuvalval
151015
alailemetvalalaglygluvaltrpglyalaglysersersergly
202530
<210>169
<211>21
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>169
metserargleuleuproargleualaalaprovalvalalaalapro
151015
alaservalhisarg
20
<210>170
<211>74
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>170
metmethisserargargargleuvaltyrlystrpvalthrilethr
151015
valleumetleuglyleualavalalaileaspvalmetileglyasp
202530
argargseraspileglutyrleumettrpservalthralaalaala
354045
ileglytyralaglyserpheglyhisasptrptrpvalargalagly
505560
pheserglyarghishisproleualagly
6570
<210>171
<211>31
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>171
metlysilethrargalaleualaalathralathrleuthralaleu
151015
leuvalglythrglyvalalaglyalaalaalaaspvalthrtrp
202530
<210>172
<211>30
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>172
metthrlysprotrpserargvalvalvalalavalleualaleuleu
151015
leuvalalaglyleuvalalaalaglyvalthrglyleuphe
202530
<210>173
<211>30
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>173
metargargvalleuserservalthrserleuleuvalleuleuala
151015
leuvalproglyglyalailealaleuvalhistrpglyarg
202530
<210>174
<211>30
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>174
mettrpasnalavalleuvalleuthrcysleuseralaglyleuleu
151015
valglythralavalglnalaargleuargalaproglycys
202530
<210>175
<211>29
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>175
metargargargthrthrilealaalaleualaalavalleuserphe
151015
serproleualaalaglnalaalaproalaseralaasp
2025
<210>176
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>176
metlysargargthrleuleuglythrleuglyilemetglyleuser
151015
valproleualaalacysserserlysserser
2025
<210>177
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>177
metthrvalalaglyleuvalthrleumetglyleuthrglycysval
151015
prophealacysseralaileglytrpserasn
2025
<210>178
<211>27
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>178
metalailevalleuleuthrcysalathrglyserproglyvalthr
151015
thrseralaleualaleuthrleucystrppro
2025
<210>179
<211>23
<212>prt
<213>artificialsequence
<220>
<223>artificialsequence
<400>179
metalaleuserleuvalalaalaglycysserserthrglyalathr
151015
alaservalprothrargser
20
<210>180
<211>66
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>180
gtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggcgcctgcg60
aatgcc66
<210>181
<211>114
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>181
gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60
ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactccccc114
<210>182
<211>168
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>182
atggcctcatccaacgccgccaagtcggcgagtcgccgcgagcagctgcgcgccgcccgt60
gaacgcgaggctgcggccgcccgccgcaagcgcatcatcatcgtgaccgtcgtggtcgtc120
atcatcgccgccctggttgccgtgatcgcgatggccgcctccggcgtc168
<210>183
<211>99
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>183
atgctcactcgcaagagagtggttgcagcgggagctgccgccaccctgtccctcacggcg60
tttgccgggttgcagcccgccagcgccgccaccggcccc99
<210>184
<211>174
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>184
atggcctcatccaacgccgccaagtcggcgagtcgccgcgagcagctgcgcgccgcccgt60
gaacgcgaggctgcggccgcccgccgcaagcgcatcaccgtcgtcgccgtggcggtggtc120
gttgcagcggtgttggtcgccgtgatcgccatggccgccggtggtgtgttcggg174
<210>185
<211>123
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>185
atggcgaagttgttgtaccggttgggccgaggggccgcacaccgggcctgggcggtgatc60
atctgctggctaatcgtgctggccgcagccggtggcgcctatgccgcgttccacggcacc120
ctg123
<210>186
<211>117
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>186
gtgagtcggtcgggacggcgcaaccggttggttgcgttcctgttgctgacggccctcgtg60
gcgtccaccatcatgctgggcacatcgtcagcgcacgccgacgacggctggtcgagc117
<210>187
<211>114
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>187
atgcgccgcggggttcacggtgccgtggtgctactgctcggcgccatgatggcgaccctg60
tgggtggccctcggccccggcacgccggcccgtgcccagaccgaccaaccggtg114
<210>188
<211>102
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>188
atgcgtcgattcttcagcgctgccatcgcaatcctgctggcagccaccctcacaccagcg60
ctcaacgcgcccatggcgagtgctgcggaccagacgtccgcg102
<210>189
<211>99
<212>dna
<213>artificialsequence
<220>
<223>artificialsequence
<400>189
atgaggctcgcccgcagggtggcggcagtgttgctggcttcggtgttggcgttgaccgtg60
gcgtcctgcgcaggtgcggcacggtcggcgcccagcctg99