被遗传修饰以分泌多糖降解酶的利用乳酸的细菌的制作方法

文档序号:15881941发布日期:2018-11-09 18:09阅读:359来源:国知局
被遗传修饰以分泌多糖降解酶的利用乳酸的细菌的制作方法

本发明涉及双重作用的利用乳酸(la)的细菌,其被遗传修饰以分泌多糖降解酶,如纤维素酶、半纤维素酶和淀粉酶,用于处理有机废物以除去废物中存在的乳酸并降解复合多糖,由此为工业发酵方法提供底物,产生各种生物化学品,包括特定的乳酸对映体。

背景技术

近年来,由于能够在生物塑料的制造中使用乳酸作为基础材料,乳酸发酵,即通过微生物发酵从碳水化合物来源生产乳酸,已经引起人们的兴趣。乳酸可以聚合形成可生物降解和可回收的聚酯聚乳酸(pla),其被认为是由石油制造的塑料的潜在替代品。pla用于制造各种产品,包括食品包装、一次性用品、纺织品和卫生用品产业的纤维等。

由于各种考虑因素,包括环境问题、成本和通过化学合成产生对映体纯的乳酸的困难,通过发酵生物过程产生乳酸优于化学合成方法,这是大多数工业应用所需的。常规的发酵方法典型地基于产乳酸微生物在分批、补料分批、连续或半连续反应器中的厌氧发酵,例如乳杆菌属的细菌,其产生乳酸作为碳水化合物发酵的主要代谢终产物(abdel-rahmanetal.(2013)biotechnologyadvances,31:877–902;ghaffaretal.(2014)journalofradiationresearchandappliedsciences,7(2):222–229)。为了生产pla,通过各种方法将发酵过程中产生的乳酸与发酵液分离,例如包括溶剂萃取、电渗析、蒸馏的方法,或一种或多种方法组合。然后将纯化的乳酸进行聚合。

乳酸具有手性碳原子,因此以两种对映体形式存在,即d-和l-乳酸。为了产生适用于工业应用的pla,聚合方法应仅使用一种对映体。存在杂质或d-和l-乳酸的外消旋混合物导致聚合物具有不希望的特性,例如低结晶度和低熔融温度。因此,需要仅产生l-乳酸对映体或仅产生d-乳酸对映体的乳酸菌。

在目前可用的商业方法中,碳水化合物来源通常是含淀粉的可再生来源,例如玉米和木薯根。也已提出另外的来源,例如富含纤维素的甘蔗渣。典型地,乳酸菌可以利用还原糖如葡萄糖和果糖,但不具有降解多糖如淀粉和纤维素的能力。因此,为了利用这种多糖,该方法需要加入糖酵解酶,典型地与化学处理组合,以降解多糖并释放还原糖。

sakaietal.,2004journalofindustrialecology,7(3-4):63-74报道了一种市政食物废物回收系统,它结合发酵和化学方法生产聚l-乳酸(plla)。食物废物典型地包括不同比例的还原糖(葡萄糖,果糖,乳糖等)、淀粉和木质纤维素材料。sakai等人的方法包括用葡糖淀粉酶进行切碎和灭菌食物废物的处理,以将食物废物中的淀粉降解成可溶性葡萄糖,使用形成l-乳酸的细菌进行l-乳酸发酵,以及纯化和聚合步骤以获得plla。对于sakai等人使用的特定碳水化合物来源,即食物废物,由于食物废物含有为了获得最终的纯l-或d-乳酸而需要除去的内源性d-、l-乳酸(例如来自乳制品),因此该过程很复杂。因此,sakai等人的方法进一步包括在乳酸发酵步骤之前通过消耗乳酸作为碳源的丙酸杆菌从食物废物中除去内源性d-、l-乳酸。sakai等人的方法仅利用食物废物中50%的碳含量,并转化为乳酸。此外,虽然食物废物含有还原糖、淀粉和木质纤维素,但sakai等人的方法没有使用后者,因为乳酸菌不能直接利用这种碳水化合物来源。

us7,507,561公开了一种由可再生农业原料发酵生产聚乳酸的方法,该原料包含用作原料的糖蜜或甘蔗渣。

us8,119,376公开了一种生产乳酸或其盐的方法,其中淀粉经历同时糖化和发酵的过程,该方法包括在至少包含葡糖淀粉酶的培养基中糖化淀粉并同时使用微生物发酵淀粉,任选地从培养基中分离乳酸,其特征在于使用产生中等嗜热性乳酸的微生物。本发明进一步涉及在产生中等嗜热性乳酸的微生物存在下实施所述过程的方法,该微生物已适应了在工作ph下具有其最大性能。

ep2843039公开了一种制备产生d-乳酸的菌株的方法,该菌株经过修饰以抑制l-乳酸脱氢酶(l-ldh)活性并在产生l-乳酸的菌株中引入d-乳酸脱氢酶(d-ldh)活性;通过上述方法制备的突变的生产d-乳酸的菌株,和生产d-乳酸的方法,包括培养该菌株和从培养基中回收d-乳酸的步骤。

wo2011/098843公开了一种生产乳酸或其盐的方法。该方法描述了淀粉材料同时进行淀粉糖化以及由所选择的产生淀粉分解酶的细菌将其糖发酵成乳酸。

moraisetal.,2013appliedandenvironmentalmicrobiology,79(17):5242–5249报道了将编码纤维素酶或木聚糖酶的基因导入植物乳杆菌,并建立了分泌纤维素酶和木聚糖酶的双菌株细胞联合体。在麦秆中评估细胞联合体的酶活性。

wo2015011250公开了用于通过细菌产生和分泌目的物质的载体及其应用。

wo2015/097685公开了用于加工木质纤维素的乳酸细胞培养物。细菌培养物可包含生物质组合物和乳酸菌群,其包含:(i)第一种乳酸菌群,其已被遗传修饰以表达分泌的纤维素酶;和(ii)第二种乳酸菌群,其已被遗传修饰以表达分泌的木聚糖酶,其中选择第一群体:第二群体的比例,使得培养物中纤维素酶:木聚糖酶的比活性大于4:1或小于1:4。

wo2015/097686公开了乳酸菌培养物、细胞群和包含其的用于从木质纤维素产生乙醇的制品。

迄今描述的由可再生资源生产乳酸的方法具有许多缺点,例如碳—乳酸转化率低,需要许多单独步骤的复杂程序,成本相对高,和可以使用的碳水化合物来源有限。另外,一些方法是不利的,因为使用作为人类食物具有高价值的源材料。

因此需要用于有效处理各种含碳水化合物的来源的细菌、组合物和方法,例如包括富含淀粉的材料、富含木质纤维素的材料或其组合的有机废物,以获得适合用于工业发酵方法的大量可溶性还原糖。



技术实现要素:

根据一些方面,本发明提供了利用乳酸(la)的细菌,其被基因工程改造以产生一种或多种多糖降解酶,特别是糖苷水解酶,例如纤维素酶、半纤维素酶和淀粉酶。本文公开的基因工程改造的双重作用的利用la的细菌,除了它们选择性地消耗和代谢乳酸的天然能力,在某些条件下基本上不利用其他还原糖之外,还促进有机废物(例如食物和农业废物)中发现的复杂多糖的降解。这种利用la的基因工程细菌令人惊讶地提供了用于处理有机废物的改进方法,使废物糖化并除去废物中存在的内源性乳酸。然后,经处理的废物可用作工业发酵方法中的底物,特别是由产乳酸微生物生产特定的分离的乳酸对映体。

本文公开的利用la的细菌有利于处理各种有机废物,包括各种各样的食物废物以及植物材料和人造材料,例如纸。在一些实施方案中,本文公开的利用la的细菌特别适用于商业、工业和市政来源的混合食物废物。本文公开的利用la的细菌能够有效且成本效率高地处理有机废物,并且根据一些实施方案,有效且成本效率高地生产乳酸,其特征在于与其他方法相比碳—乳酸转化率提高。本文公开的利用la的细菌的其它优点是当用于处理废物时,该方法不需要向处理物中添加外来降解酶,因为这种酶由该细菌产生。因此,通过避免添加这种外来酶的需要(即,将酶添加到处理所发生的容器中),实现了有利的过程,其具有更高的成本效率并且更加稳健,因为污染的风险(包括向处理物中添加外来酶混合物)显著降低。另外,通过利用本文公开的利用la的细菌处理废物,实现了加工废物的粘度降低,因为糖化(通过细菌产生的降解酶实现)降低了粘度。这允许更有效地混合废物并引起终产物产量增加,例如分离的乳酸对映体。

根据一个方面,本发明提供了一种利用乳酸(la)的细菌,其被遗传修饰以表达和分泌一种或多种外源多糖降解酶,其中所述一种或多种外源多糖降解酶包括纤维素酶、半纤维素酶、淀粉酶或其组合。

如本文所用的术语“外源的”,当提及由利用la的细菌表达的多糖降解酶时,表明该多糖降解酶由导入所述细菌细胞的外源核酸编码。在一些实施方案中,所述外源多糖降解酶由导入所述细菌中的核酸编码,并且能够由所述细菌细胞分泌。在一些实施方案中,所述核酸可以在所述细菌中瞬时表达(即利用导入所述细菌中的表达载体)。在一些实施方案中,所述核酸可以整合到所述细菌的基因组中。在一些实施方案中,所述外源多糖降解酶不是天然存在于这些细菌中或不能天然地从其中分泌。

如本文所用的“多糖降解酶”是指催化糖类分解的水解酶(或其酶活性部分),包括双寡糖、低聚糖、多糖和糖复合物,选自糖苷水解酶、多糖裂解酶和碳水化合物酯酶组成的组。每种可能性代表本发明的单独实施方案。用于本发明的多糖降解酶选自对有机废物中发现的糖类(例如多糖)具有活性的酶,有机废物包括食物废物和植物材料。在一些实施方案中,多糖降解酶可以是修饰酶(即,已经被修饰并与其相应的野生型酶不同的酶)。在一些实施方案中,所述修饰可以包括导致酶的活性提高的一种或多种突变。在一些实施方案中,多糖降解酶是野生型(wt)酶。

在一些实施方案中,所述利用la的细菌选自丙酸杆菌属(propionibacterium)物种、巨球形菌属(megasphaera)物种、月形单胞菌属(selenomonas)物种和韦荣氏球菌属(veillonella)物种组成的组。每种可能性代表本发明的单独实施方案。在一些实施方案中,所述利用la的细菌是丙酸杆菌属(propionibacterium)物种。在一些具体实施方案中,利用la的细菌是费氏丙酸杆菌(propionibacteriumfreudenreichii)。

根据另一方面,本发明提供了利用乳酸(la)的细菌群,其被遗传修饰以表达和分泌包括纤维素酶、半纤维素酶、淀粉酶或其组合的多种外源多糖降解酶,其中所述细菌群包含多个利用la的细菌亚群,其中每个亚群被遗传修饰以表达和分泌不同的多糖降解酶。

例如,在一些实施方案中,提供了利用la的细菌群,其被遗传修饰以表达和分泌多种多糖降解酶,其中所述细菌群包含:

第一个利用la的细菌亚群,被遗传修饰以表达和分泌第一种多糖降解酶;

第二个利用la的细菌亚群,被遗传修饰以表达和分泌第二种多糖降解酶;和

第三个利用la的细菌亚群,被遗传修饰以表达和分泌第三种多糖降解酶,

其中所述第一种多糖降解酶是纤维素酶,所述第二种多糖降解酶是半纤维素酶,所述第三种多糖降解酶是淀粉酶。在一些实施方案中,所述半纤维素酶是木聚糖酶。

在一些实施方案中,所述亚群是相同细菌物种的亚群。在其他实施方案中,所述亚群是不同细菌物种的亚群。

在一些实施方案中,所述利用la的细菌选自丙酸杆菌属物种、巨球形菌属物种、月形单胞菌属物种和韦荣氏球菌属物种组成的组。在一些实施方案中,所述利用la的细菌选自丙酸杆菌属。在一些具体实施方案中,丙酸杆菌所述是费氏丙酸杆菌。

根据本发明使用的多糖降解酶可以是细菌酶。在一些实施方案中,所述多糖降解酶来自嗜热细菌。在一些实施方案中,所述嗜热细菌选自梭菌属物种(clostridiumsp.)、类芽孢杆菌属物种(paenibacillussp.)、褐色喜热裂孢菌(thermobifidafusca)、芽孢杆菌属物种(bacillussp.)、地芽孢杆菌属物种(geobacillussp.)、色盐杆菌属物种(chromohalobactersp.)和海洋红嗜热盐菌(rhodothermusmarinus.)组成的组。每种可能性代表本发明的单独实施方案。

在其他实施方案中,所述多糖降解酶来自嗜温细菌。在一些实施方案中,所述嗜温细菌选自克雷伯氏菌属物种(klebsiellasp.)、cohnella物种(cohnellasp.)、链霉菌属物种(streptomycessp)、解纤维素醋弧菌(acetivibriocellulolyticus)、白色瘤胃球菌(ruminococcusalbus);芽孢杆菌属物种(bacillussp.)和发酵乳杆菌(lactobacillusfermentum)组成的组。每种可能性代表本发明的单独实施方案。

在另外的实施方案中,所述多糖降解酶是真菌酶。在一些实施方案中,所述真菌选自里氏木霉(trichodermareesei),特异腐质霉(humicolainsolens),尖孢镰刀菌(fusariumoxysporum),米曲霉(aspergillusoryzae),瘿青霉(penicilliumfellutanum)和棉状嗜热丝孢菌(thermomyceslanuginosu)组成的组。每种可能性代表本发明的单独实施方案。

在一些实施方案中,选择被改造导入利用la的细菌中的所述多糖降解酶,使得它们在与所述利用la的细菌生长最佳的温度和ph范围相同的温度和ph范围内具有最佳活性。如本文所用,对于所述利用la的细菌的生长而言最佳的温度和ph范围也表示所述利用la的细菌选择性消耗乳酸作为碳源的温度和ph(如果选择性消耗需要特定条件)。

在其他实施方案中,选择所述多糖降解酶使得它们在不同于所述利用la的细菌生长的最佳温度和ph范围的温度和/或ph范围内具有最佳活性。例如,在一些实施方案中,所述多糖降解酶在高于所述利用la的细菌的最佳生长温度的温度下具有最佳活性。在另外的实施方案中,所述多糖降解酶在ph高于/低于所述利用la的细菌的最佳生长ph的ph下具有最佳活性。在一些实施方案中,所述多糖降解酶在所述利用la的细菌失活的温度和/或ph范围内具有最佳活性。

在一些实施方案中,所述利用la的细菌可以选择性地消耗乳酸,直到后者基本上耗尽并且此后才能消耗(发酵)还原糖。

根据另一方面,本发明提供了一种处理有机废物的方法,该方法包括在利用la的细菌消耗乳酸并且适合一种或多种多糖降解酶的表达和活性的条件下,使有机废物接触本发明所述利用la的细菌,该细菌被遗传修饰以表达和分泌所述一种或多种外源多糖降解酶,其中所述处理从有机废物中除去d-乳酸、l-乳酸或两者并且至少部分降解多糖以释放还原糖。在一些实施方案中,该处理在单容器(一锅法)中进行。

根据另一方面,本发明提供了一种处理有机废物的方法,该方法包括在利用la的细菌消耗乳酸并且适合多种多糖降解酶的表达和活性的条件下,使有机废物接触本发明的利用la的细菌群,所述细菌群被遗传修饰以表达和分泌所述多种多糖降解酶,其中所述处理从有机废物中除去d-乳酸、l-乳酸或两者并且至少部分地降解多糖以释放还原糖。在一些实施方案中,该处理在单容器(一锅法)中进行。

如本文所用,当提及从有机废物中“除去”d-乳酸、l-乳酸或两者时,“除去”是指减少至残留量,使得不会干扰生产分离的乳酸对映体的下游过程,并且随后聚合成适用于工业应用的聚乳酸。“残留量”表示小于约5%的乳酸,优选小于约3%,更优选小于约1%,甚至小于约0.5%的乳酸(w/w)。

用于本发明方法的有机废物包括复合多糖,包括淀粉、纤维素、半纤维素及其组合。在一些实施方案中,所述有机废物选自食物废物、市政废物、农业废物、植物材料及其组合。根据本发明的食物废物包括植物来源的食物废物。根据本发明的食物废物包括家庭食物废物、商业食物废物和工业食物废物。根据本发明的植物材料包括农业废物和人造产品,例如纸废物。

还原糖典型地包括c5糖(戊糖)、c6糖(己糖)或其组合。在一些实施方案中,所述还原糖包括葡萄糖。在一些实施方案中,所述还原糖包括木聚糖。

在一些实施方案中,糖化(多糖降解为可溶性还原糖)和从废物中除去乳酸相伴进行。根据这些实施方案,对所述利用la的细菌进行遗传修饰以表达和分泌在相同温度和ph范围内具有最佳活性的多糖降解酶,所述温度和ph范围对于利用la的细菌的生长是最佳的。根据这些实施方案,该方法包括在最适合所述利用la的细菌的生长和多糖降解酶的分泌的温度和ph下使有机废物接触所述利用la的细菌。接触足够的时间以从废物中除去乳酸(d-,l-或两者)并获得所需水平的还原糖。

在其他实施方案中,从废物中除去乳酸(在糖化之前)与糖化分开进行。根据这些实施方案,对所述利用la的细菌进行遗传修饰以表达和分泌多糖降解酶,该酶在与利用la的细菌生长的最佳温度和/或ph范围不同的温度和/或ph范围内具有最佳活性。

在一些实施方案中,除去废物中存在的d-乳酸、l-乳酸或其组合与降解废物中的多糖的相伴或相继进行。

在一些实施方案中,所述多糖降解酶在高于所述利用la的细菌的最佳生长温度的温度下具有最佳活性。根据这些实施方案,该方法包括:(i)在适合所述利用la的细菌生长和所述多糖降解酶表达的第一温度下,使所述有机废物与所述利用la的细菌接触足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和(ii)将温度升至第二温度,所述第二温度对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在第二温度下失活。

在一些实施方案中,所述多糖降解酶可以在高于/低于所述利用la的细菌的最佳(或其他合适的)生长ph的ph下具有最佳(或增强的)活性。根据这些实施方案,该方法包括:(i)在适合所述利用la的细菌生长和所述多糖降解酶表达的第一ph下,使所述有机废物与所述利用la的细菌接触足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和(ii)将ph降低/升高至第二ph,第二ph对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在第二ph下失活。

在一些实施方案中,所述方法还包括在所述接触之前测定所述有机废物中淀粉、纤维素和半纤维素中的至少一种的百分比,并根据测定的百分比选择待与所述有机废物接触的所述利用la的细菌或所述利用la的细菌群。在一些实施方案中,所述测定还包括测定可溶性还原糖的百分比。

根据另一方面,本发明提供了一种由有机废物制备分离的乳酸对映体的方法,该方法包括:

(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合和至少部分降解废物中的多糖以释放可溶性还原糖,通过在适合所述利用la的细菌消耗乳酸和适合所述多糖降解酶表达和活性的条件下,使所述有机废物接触被遗传修饰以表达和分泌多糖降解酶的本发明的所述利用la的细菌或本发明的所述利用la的细菌群;

(ii)灭活所述利用la的细菌;

(iii)用仅产生d-乳酸和l-乳酸之一的产乳酸微生物发酵(i)中得到的可溶性还原糖,得到分离的乳酸对映体;和

(iv)从发酵液中回收分离的乳酸对映体。

典型地,发酵步骤在厌氧或微需氧条件下进行。发酵步骤典型地选自分批、补料分批、连续和半连续发酵。每种可能性代表本发明的单独实施方案。

在一些实施方案中,所述多糖降解酶可以在不同于所述利用la的细菌生长最佳的(或其他合适的)温度/ph范围的温度和/或ph范围内具有最佳(或其他合适的)活性。根据这些实施方案,适合所述利用la的细菌消耗乳酸和所述多糖降解酶表达的条件不同于适合酶活性的条件。根据这些实施方案,步骤(i)包括:在适合所述利用la的细菌消耗乳酸和所述多糖降解酶表达的第一温度/ph下,接触有机废物足够的时间,以从废物中除去d-乳酸、l-乳酸或两者;和将温度/ph调节至第二温度/ph,所述第二温度/ph对于所述多糖降解酶的活性是最佳的。典型地,所述利用la的细菌在所述第二温度/ph下失活。

在一些实施方案中,所述产乳酸微生物是细菌。在一些实施方案中,所述产乳酸细菌是乳杆菌属(lactobacillus)。在其他实施方案中,所述产乳酸细菌是芽孢杆菌属(bacillus)。

在一些实施方案中,所述产乳酸细菌是不同物种的乳酸菌的联合体。

回收乳酸典型地包括从发酵液中分离乳酸和纯化乳酸。乳酸的分离和纯化可以通过本领域已知的方法进行。

该方法典型地还包括预处理所述有机废物以减小颗粒大小和增加表面积,以及灭活废物中的内源细菌。预处理在用所述利用la的细菌处理废物之前进行。在一些实施方案中,所述有机废物在用所述利用la的细菌处理之前经历切碎、粉碎和灭菌。

灭菌可以通过本领域已知的方法进行,包括例如高压蒸汽、uv辐射或超声处理。

在一些实施方案中,该方法还包括在处理所述有机废物之前分析其组成,特别是糖含量。在一些实施方案中,该方法包括分析所述有机废物中淀粉、纤维素和半纤维素中至少一种的百分比。在另外的实施方案中,该方法包括分析还原糖的百分比。

在一些实施方案中,该方法还包括测定在发酵步骤之前由所述多糖降解酶释放的总可溶性还原糖的量。

在一些实施方案中,提供了一种从有机废物生产立体特异性乳酸的方法。如本文所用的关于乳酸的术语“立体特异性”是指乳酸的对映体(或分离的对映体)。

根据一些实施方案,本文公开的所述利用la的细菌可以进一步有利地用于增加从有机废物制备乳酸的总产率,通过所述利用la的细菌再次处理残留乳酸(其在从发酵液中回收乳酸后作为残留物保留)使乳酸再循环和用于培养产la微生物,从而产生高量多糖降解酶用于下一个乳酸生产循环。

根据另一方面,本发明提供了一种从有机废物制备聚乳酸的方法,该方法包括通过上述方法制备分离的乳酸对映体,并且还包括使分离的乳酸对映体聚合成聚乳酸。

在一些实施方案中,本发明提供了从有机废物制备聚乳酸的方法,该方法包括通过上述方法制备立体特异性乳酸,并且还包括将所述立体特异性乳酸聚合成聚乳酸。

根据另外的方面,提供了用于由丙酸杆菌表达和分泌外源多糖降解酶的表达载体,所述载体包含:

至少一种编码丙酸杆菌复制蛋白的核苷酸序列;

至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包含:

至少一种启动子核酸序列,其可操作地连接至:

至少一种编码丙酸杆菌信号肽(sp)的核酸序列,其翻译融合至:

至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解酶的核酸序列。

在一些实施方案中,所述编码丙酸杆菌复制蛋白的核苷酸序列包含seqidnos:84的核酸序列。在一些实施方案中,所述启动子核酸序列可选自seqidnos:27-32及其同源物组成的组。在一些实施方案中,sp氨基酸序列可选自seqidnos:87-179组成的组。在一些实施方案中,所述多糖降解酶序列可选自seqidnos:14-26及其同源物组成的组。在一些实施方案中,所述表达盒可包含seqidnos:33-49和/或其同源物中任一个所示的核酸序列,或由其组成。

在进一步的实施方案中,提供了包含表达载体的利用乳酸(la)的丙酸杆菌。

在一些实施方案中,提供了表达盒,其包含seqidnos:33-49中任一个所示的序列和/或其同源物,或由其组成。在进一步的实施方案中,提供了包含该表达盒的利用乳酸(la)的丙酸杆菌。

根据下面的详细说明书、实施例和权利要求,本发明的这些和其它方面和特征将变得显而易见。

附图说明

示例性实施例在参考附图中示出。通常选择附图中所示的部件和特征的尺寸是为了方便和清楚地呈现,并且不一定按比例示出。附图如下列出。

图1-根据一些实施方案的发酵系统的示意图,该发酵系统用于产生光学纯的乳酸和残留乳酸废物的再循环;

图2a-根据一些实施方案的载体的示意图;

图2b-根据一些实施方案的表达载体的示意图;

图3-对照lugol试验的象形图-在暴露于lugol溶液后含有yel培养基和0.5%淀粉的琼脂平板。所有含淀粉的区域都呈黑色。一圈降解淀粉(由葡糖淀粉酶降解)表现为无色。

具体实施方式

本发明首次公开了被遗传修饰以产生各种外源多糖降解酶的利用la的细菌,特别是能够降解存在于有机废物中的复合多糖的酶,例如食物废物和木质纤维素废物。本文公开的利用la的细菌特别有利于在废物作为生产分离的乳酸对映体的底物之前,用于处理各种来源的有机废物。这种利用la的基因工程细菌令人惊讶地提供了用于处理有机废物的改进方法,使得能够除去废物中存在的内源性乳酸以及废物的糖化。因此,本发明的新型双重作用细菌能够在“单容器”(“一锅”)方法中一起进行两个阶段的处理。“单容器方法”能够使用一个容器(例如,反应器,发酵罐或其他合适的操作单元)而不是两个容器,从而获得更经济的工业方法。这使得在一个反应器(一个容器)中伴随地进行两个阶段成为可能。由于这两个阶段有时可能具有不同的最佳反应温度和ph,因此有时推荐按顺序实施一锅法,首先除去废物中存在的内源性乳酸(在其最佳温度和ph下实施),然后在同一反应器中糖化废物,但是在糖化最佳的温度和ph下。

遗传修饰的利用乳酸(la)的细菌

利用la的细菌根据本发明被改造以产生一种或多种外源多糖降解酶。如本文使用的涉及外源多糖降解酶的“产生”表示表达(在细胞内产生蛋白)和任选的分泌。在一些实施方案中,将所述一种或多种外源多糖降解酶作为分泌酶改造到细菌中。根据这些实施方案,所述利用la的细菌被遗传修饰以表达和分泌一种或多种外源多糖降解酶。在其他实施方案中,将一种或多种外源多糖所述降解酶作为非分泌酶改造到细菌中,仅在所述利用la的细菌细胞裂解后才对有机废物中的多糖具有活性。根据这些实施方案,所述利用la的细菌被遗传修饰以表达一种或多种外源多糖降解酶。

用于根据本发明遗传修饰的利用la的细菌可选自丙酸杆菌属物种、巨球形菌属物种、月形单胞菌属物种和韦荣氏球菌属物种。每种可能性代表本发明的单独实施方案。

用于根据本发明遗传修饰的合适的利用la的细菌典型的特征在于具有明确的温度和/或ph范围,在该范围内它选择性消耗乳酸作为碳源。如本文所用,关于利用la的细菌消耗乳酸作为碳源的“选择性”表明细菌消耗乳酸而不消耗其环境中可用的还原糖,或者以非常慢的速度消耗可用的还原糖,以至于在数小时的时间内消耗水平不显著。因此,当在选择性消耗乳酸的条件下与有机废物接触时,所述利用la的细菌基本上从废物中除去乳酸而不影响废物中存在的还原糖的量。或者,合适的利用la的细菌选择性消耗乳酸作为碳源,而不管其环境中的特定条件和还原糖的存在。

在一些具体实施方案中,所述利用la的细菌是费氏丙酸杆菌。费氏丙酸杆菌的特征在于在某些条件下选择性消耗乳酸作为碳源,例如酸性条件(最佳ph值在ph=5.5-6.5范围内,例如ph=5.5)。

根据本发明的用于遗传修饰的利用la的细菌可以是仅消耗乳酸对映体之一的细菌,或消耗两者的细菌。

在一些实施方案中,本发明的遗传修饰的利用la的细菌典型地包含表达载体,所述表达载体包含编码多糖降解酶的多核苷酸序列。在一些实施方案中,所述表达载体包含编码多糖降解酶和融合在框架内的信号肽的多核苷酸序列,使得在多核苷酸序列转录和翻译时产生分泌的多糖降解酶。在一些实施方案中,所述表达载体还包含合适的选择启动子。在一些实施方案中,本发明的遗传修饰的利用la的细菌包含编码整合到其基因组中的多糖降解酶的多核苷酸序列。在一些实施方案中,本发明的遗传修饰的利用la的细菌包含整合到其基因组中的编码多糖降解酶和融合在框架内的信号肽的多核苷酸序列。

在一些实施方案中,术语“遗传修饰的”,“基因工程的”和“重组的”可互换使用。因此,遗传修饰的利用la的细菌在本文中也称为重组细菌或利用la的重组细菌。

利用la的细菌的遗传修饰可以使用本领域已知的用于利用la的细菌的表达载体、信号肽和方法进行,例如在kiatpapanandmurooka(2001)applmicrobiolbiotechnol.,56(1-2):144-9;bredeetal.,(2005)applenvironmicrobiol.,71(12):8077-84;mukdsietal.,(2014)applenvironmicrobiol.,80(2):751–756;和wo2015/011250中描述的。

如本文所提及的术语“核酸”、“核酸序列”、“多核苷酸”、“核苷酸”和“核苷酸序列”可互换使用。该术语是指脱氧核糖核苷酸(dna)、核糖核苷酸(rna)及其修饰形式,其形式为分离的片段或作为较大构建体的组分。该术语还包括由天然存在的碱基、糖和共价核苷间键组成的寡核苷酸,以及具有非天然存在部分的寡核苷酸,其功能类似于各自的天然存在部分。dna可包括例如基因组dna、质粒dna、重组dna或互补dna(cdna),rna可包括例如信使rna(mrna)、核糖体rna(rrna)或转运rna(trna)。在一些实施方案中,所述核酸序列可以是编码序列(即,可以编码细胞中终产物的序列,例如蛋白或肽)。在一些实施方案中,所述核酸序列可以是调节序列(例如,启动子)。

术语“多肽”、“肽”和“蛋白”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“氨基酸序列”是指由天然存在的氨基酸、已被化学修饰的氨基酸或合成氨基酸中的任何一种组成的序列。该术语是指肽和蛋白,以及肽和蛋白的片段、类似物、衍生物和组合。

在一些实施方案中,与对照序列“相似”或“同源”的序列(例如,核酸序列和氨基酸序列)在本文中是指序列之间的同一性百分比。同一性百分比可以是至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%。同一性百分比可以在全长序列上随机分布。因此,同源序列可包括例如与突变相关的变异(例如,至少一个氨基酸或至少一个核苷酸的截短、取代、缺失和/或添加)。类似的序列还可以包括与密码子使用和遗传密码变性相关的变异。例如,如果同源性(同一性/相似性)在全长序列上至少为80%,则称该序列与另一序列同源。

如本文所用,术语“构建体”是指人工组装或分离的核酸分子,其可包括一个或多个核酸序列,其中核酸序列可包括编码序列(即编码终产物的序列,例如,多糖降解酶)、调节序列(例如启动子)、非编码序列或其任何组合。术语构建体包括例如质粒和载体,但不应视为限于此。

“表达载体”和“重组载体”可以互换使用,并且是指具有在细菌细胞中表达异源(外源)核酸的能力的构建体。在一些实施方案中,表达载体可以在细胞中自主复制。在一些实施方案中,核酸可以整合到细菌细胞的基因组中。

如本文所用,术语“导入”和“转化”可互换使用,并指分子例如核酸、多核苷酸分子、载体等转移到细菌细胞中,更具体地说,转移到靶细胞的膜封闭空间的内部。可以通过本领域技术人员已知的任何方法将分子“导入”靶细胞中,例如sambrooketal.molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork(2001)所教导的。

术语“启动子”是指调节dna序列,其可以控制或指导编码序列的转录以在细胞中产生mrna。通常,启动子位于编码序列的5'区域(即,先于、位于上游)。启动子可以从天然来源整体衍生,或者由衍生自天然存在的不同启动子的不同成分组成,或甚至包含合成的核苷酸片段。启动子可以是组成型的(即启动子激活不受诱导剂调节,因此转录速率是恒定的),或诱导型的(即启动子激活受诱导剂调节)。在一些实施方案中,本发明的表达载体中可以使用各种类型和序列的启动子。在一些实施方案中,所述启动子可以衍生自各种来源、物种和生物。在一些实施方案中,本发明的表达载体中可以使用特定启动子和信号肽序列的组合。

在一些示例性实施方案中,所述启动子可以选自但不限于具有seqidnos:27-32和/或其同源物的中任一个所示核苷酸序列启动子。每种可能性都是单独的实施方案。

在一些实施方案中,所述启动子序列包含seqidnos:27-32中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。

在一些示例性实施方案中,所述启动子序列包含seqidno.31所示的核酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述启动子序列包含seqidno.27所示的核酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述启动子序列包含seqidno.28所示的核酸序列或其同源物,或由其组成。

术语“信号肽”和“sp”是指短的(通常长度5-30个氨基酸)肽,其可以存在于蛋白的n-末端并指导蛋白从细菌细胞分泌。在一些实施方案中,所述分泌物进入胞外基质。在一些实施方案中,所述sp序列可以从天然来源获得(按原样或经修饰)。在一些实施方案中,所述sp序列可以在计算机中设计。在一些示例性实施方案中,所述sp序列是丙酸杆菌属细菌来源。在一些实施方案中,所述sp序列与丙酸杆菌信号肽同源。在一些实施方案中,编码sp氨基酸序列的核酸序列可以包括在表达载体中,使得其与编码待分泌蛋白的序列在框内。在一些实施方案中,与本公开物中公开的sp的氨基酸序列具有至少60%、至少70%、至少80%、至少90%、至少95%同源性的氨基酸序列也是有功能的并包括在本文中。在一些实施方案中,与编码本公开物中公开的sp的核酸序列具有至少60%、至少70%、至少80%、至少90%、至少95%同源性的核酸序列也是包含在本文中。

在一些示例性实施方案中,所述sp可以选自但不限于具有seqidnos:87-179中任一个所示的氨基酸序列和/或其同源物的sp。每种可能性都是单独的实施方案。

在一些实施方案中,编码sp的所述核苷酸序列可选自编码seqidnos:87-179中任一个所示的氨基酸序列和/或其同源物的核酸。每种可能性都是单独的实施方案。

在一些实施方案中,编码sp的所述核苷酸序列可以选自如seqidnos:180-189所示的任何一种核酸和/或其同源物所示的核酸。每种可能性都是单独的实施方案。

在一些示例性实施方案中,所述sp包含seqidno.87所示的氨基酸序列或其同源物,或由其组成。在一些示例性实施方案中,所述sp包含seqidno.88所示的氨基酸序列或其同源物,或由其组成。在一些示例性实施方案中,编码sp的核酸包含seqidno.180所示的核苷酸序列或其同源物,或由其组成。在一些示例性实施方案中,编码sp的核酸包含seqidno.181所示的核苷酸序列或其同源物,或由其组成。

在一些实施方案中,可以使用合适的表达载体(包括目的蛋白(例如,多糖降解酶)的合适编码序列、合适的信号肽序列(如果使用的话)和/或合适的启动子)对利用la的细菌进行遗传修饰,本领域已知的用于利用la的细菌的方法,例如在kiatpapanandmurooka(2001)applmicrobiolbiotechnol.,56(1-2):144-9;bredeetal.,(2005)applenvironmicrobiol.,71(12):8077-84;mukdsietal.,(2014)applenvironmicrobiol.,80(2):751–756;和wo2015/011250中描述。在一些实施方案中,表达载体允许将目的蛋白(和sp,如果使用的话)整合到细菌的基因组中。

在一些实施方案中,当确定用基因工程改造利用la的细菌的各种核酸序列时,可以应用合适的密码子使用,以允许优化细菌细胞中多糖降解酶和/或sp的表达和/或功能。

根据一些实施方案,提供了用于在细菌细胞中表达多糖降解酶的表达载体,该载体包含表达盒(在本文中也称为“插入物”),其包含至少一种合适的启动子核酸序列,可操作地连接到与编码信号肽(sp)的至少一种核酸序列,其与至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解酶的核酸序列翻译融合。

在一些实施方案中,所述表达载体包含质粒主链,一种或多种合适的复制起点(ori)序列,一种或多种抗生素抗性基因序列和一种或多种表达盒。在一些实施方案中,没有表达盒(插入物)的表达载体在本文中称为“穿梭载体”。在一些实施方案中,所述穿梭载体能够在各种细菌细胞类型中复制。

在一些实施方案中,所述表达载体适合于在丙酸杆菌中表达外源多糖降解酶。在一些实施方案中,丙酸杆菌是费氏丙酸杆菌。在一些实施方案中,适合在丙酸杆菌中表达外源多糖降解酶的表达载体包含编码丙酸杆菌复制蛋白的核酸序列。

在一些示例性实施方案中,所述表达载体是powr3载体,如下文进一步举例说明的。在一些实施方案中,此类表达载体包含编码丙酸杆菌复制蛋白的核酸序列(如seqidno:84所示)。在一些实施方案中,此类表达载体还包含一种或多种氯霉素抗性基因(例如来自纹带棒杆菌(corynebacteriumstriatum)pt10质粒的cmx(a)和cml(a))。在一些实施方案中,此类表达载体还包含丙酸杆菌复制起点(ori)序列。

在一些实施方案中,提供了用于由丙酸杆菌表达和分泌外源多糖降解酶的表达载体,所述载体包含:

至少一种编码丙酸杆菌复制蛋白的核苷酸序列;

至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包括:

至少一种启动子核酸序列,其可操作地连接至:至少一种编码丙酸杆菌信号肽(sp)(或其同源物)的核酸序列,其与至少一种编码选自纤维素酶、半纤维素酶和淀粉酶的多糖降解的核酸序列翻译融合。

在一些实施方案中,如本文进一步举例说明的,用于在丙酸杆菌中表达外源多糖降解酶的表达载体是有利的,因为它可以在例如大肠杆菌(原样或没有表达盒)和丙酸杆菌中复制。此外,这种载体是有利的,由于其结构和紧凑的大小(约5.6kb,(没有表达盒)),它允许改善细菌中多糖降解酶的表达(例如,高产率和质量)。此外,表达的多糖降解酶能够从细菌细胞中成功分泌并且能够降解底物中的多糖。此外,比在丙酸杆菌中表达的其他载体小是有利的,因为这使得更容易转化到细菌细胞并更容易通过无限制方法用于克隆。此外,用于插入表达盒的克隆区域通过终止信号界定(上游和下游),这可以防止极性效应中断并稳定细菌细胞中产生的多糖降解酶的mrna转录物,从而改善细胞中蛋白的表达。

在一些实施方案中,所述表达载体可包括一个以上表达盒,每个表达盒包含相同或不同的启动子、相同或不同的sp序列和不同的多糖降解酶序列。

在一些示例性实施方案中,所述表达盒可包含seqidnos:33-49中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。

在一些实施方案中,提供了表达盒,所述表达盒包含seqidnos:33-49中任一个所示的核苷酸序列和/或其同源物,或由其组成。每种可能性都是单独的实施方案。

在一些示例性实施方案中,表达盒包含seqidno:43所示的核苷酸序列或由其组成。

在一些实施方案中,当所述表达盒在靶细菌细胞中表达时,在表达盒的启动子序列的控制下,所述信号肽与多糖降解酶框内翻译连接。因此,包含信号肽序列和多糖降解酶序列的嵌合蛋白在细菌细胞中表达并且能够从其分泌。

在一些实施方案中,提供了包含本文公开的一种或多种表达载体的利用la的细菌。

在一些实施方案中,提供了包含本文公开的一种或多种表达盒的利用la的细菌。

在一些实施方案中,提供了包含一种或多种表达载体的丙酸杆菌,其中所述表达载体包含:至少一种编码丙酸杆菌复制蛋白的核苷酸序列;

至少一种丙酸杆菌复制起点的核苷酸序列;和至少一个表达盒,包括:

至少一种启动子核酸序列,其可操作地连接至:至少一种编码丙酸杆菌信号肽(sp)的核酸序列,其与至少一种编码多糖降解酶的核酸序列翻译融合,所述多糖降解酶选自纤维素酶,半纤维素酶和淀粉酶。

在一些实施方案中,提供了分离的核酸分子,其包含选自seqidnos:33-49的序列及其同源物组成的组,或由其组成。

在一些实施方案中,所述多糖降解酶序列选自seqidnos:14-26及其同源物组成的组。

在一些实施方案中,编码多糖降解酶的核酸序列选自seqidnos:1-13及其同源物组成的组。

在一些实施方案中,利用la的细菌被基因工程改造以产生单一多糖降解酶。在其他实施方案中,利用la的细菌被基因工程改造以产生多种不同的多糖降解酶。“多种”表示至少两种。在一些实施方案中,为了在将多种酶改造到细菌中时控制每种多糖降解酶的表达水平,如本领域已知的,每种酶用不同效价的核糖体结合位点(rbs)进行改造。

在一些实施方案中,每种多糖降解酶可以用相似或不同的启动子进行改造。在一些实施方案中,如果使用信号肽的话,每种多糖降解酶可以用相似或不同的信号肽进行改造。

在一些实施方案中,产生包含多个亚群的利用la的细菌群,每个亚群被基因工程改造以表达和分泌不同的多糖降解酶。“多个”亚群表示至少两个亚群,例如两个、三个、四个亚群。亚群用作处理有机废物的共培养物。在一些实施方案中,群包含的每个亚群基本上等量。在其他实施方案中,群包含不同比例的亚群(即,每个亚群可以在群体内占有不同的百分比)。

如上所述,改造到所述利用la的细菌中的所述多糖降解酶可选自糖苷水解酶、多糖裂解酶和碳水化合物酯酶。根据标准分类系统(cantareletal.2009nucleicacidsres37:d233-238)将广泛的多糖降解酶组分成各类酶并进一步分为酶家族。这些酶的信息和更新分类可在碳水化合物-活性酶(carbohydrate-activeenzymes)(cazy)服务器(www.cazy.org)上获得。

在一些实施方案中,所述多糖降解酶是降解选自淀粉和非淀粉植物多糖的多糖的酶。

在一些实施方案中,改造到所述利用la的细菌中的所述多糖降解酶是糖苷水解酶。

在一些实施方案中,所述糖苷水解酶包含纤维素酶。纤维素酶可以是外切纤维素酶或内切纤维素酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单一纤维素酶。在其他实施方案中,利用la的细菌被遗传修饰以表达和分泌多种不同的纤维素酶。在一些实施方案中,纤维素酶可以选自但不限于:内切-(1,4)-β-d-葡聚糖酶、外切-(1,4)-β-d-葡聚糖酶、β-葡糖苷酶、羧甲基纤维素酶(cmcase);内切葡聚糖酶;纤维二糖水解酶、微晶纤维素酶、纤维糊精酶(celludextrinase)、纤维素酶a、cellulosinap、碱性纤维素酶和pancellasess。每种可能性都是单独的实施方案。

在一些实施方案中,编码纤维素酶的核酸可具有seqidnos:12-13中任一个所示的核酸序列或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,纤维素酶可具有seqidnos:25-26中任一个所示的氨基酸序列或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,纤维素酶包含seqidnos:25-26中任一个所示的氨基酸序列或其同源物,或由其组成。每种可能性都是单独的实施方案。

在另外的实施方案中,所述糖苷水解酶包含半纤维素酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单一半纤维素酶。在其他实施方案中,所述利用la的细菌被遗传修饰以表达和分泌多种不同的半纤维素酶。在一些实施方案中,所述半纤维素酶是木聚糖酶。其他半纤维素酶的非限制性实例包括阿拉伯呋喃糖苷酶(arabinofuranosidases)、乙酰酯酶、甘露聚糖酶、α-d-葡糖醛酸糖苷酶、β-木糖苷酶(β-xylosidases),β-甘露糖苷酶、β-葡糖苷酶、乙酰基-甘露糖苷酶(acetyl-mannanesterases)、α-半乳糖苷酶、-α-拉拉尼嗪酶(-α-larabinanases)和β-半乳糖苷酶。每种可能性代表本发明的单独实施方案。

在一些实施方案中,编码木聚糖酶的核酸可具有seqidno:11所示的核酸序列,或其同源物。在一些实施方案中,木聚糖酶可具有seqidno.24所示的氨基酸序列,或其同源物。每种可能性都是单独的实施方案。

在其他实施方案中,糖苷水解酶包含淀粉酶。在一些实施方案中,本发明的利用la的细菌被遗传修饰以表达和分泌单个淀粉酶。在其他实施方案中,所述利用la的细菌被遗传修饰以表达和分泌多种不同的淀粉酶。在一些实施方案中,淀粉酶可以选自但不限于:α-淀粉酶;(1,4-α-d-葡聚糖葡聚糖水解酶;糖原酶)β-淀粉酶;(1,4-α-d-葡聚糖麦芽糖水解酶;糖原酶;糖原淀粉酶)γ-淀粉酶;(葡聚糖1,4-α-葡糖苷酶;淀粉葡萄糖苷酶;外切-1,4-α-葡糖苷酶;葡糖淀粉酶;溶酶体α-葡糖苷酶和1,4-α-d-葡聚糖葡糖水解酶。每种可能性是单独的实施方案。

在一些实施方案中,编码淀粉酶的核酸可具有seqidnos:1-10中任一个所示的核酸序列,或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,淀粉酶可具有seqidnos:14-23所示的氨基酸序列,或其同源物。每种可能性都是单独的实施方案。在一些实施方案中,淀粉酶包含seqidnos:14-23所示的氨基酸序列或其同源物,或由其组成。每种可能性都是单独的实施方案。

改造到根据本发明的利用la的细菌的多糖降解酶可以来自细菌来源。在一些实施方案中,所述细菌来源是嗜热细菌。本文所用的术语“嗜热细菌”表示在高于约45℃,优选高于50℃的温度下繁殖的细菌。典型地,根据本发明的嗜热细菌具有约45℃至约75℃的最佳生长温度,优选约50℃至70℃。用于多糖降解酶的嗜热细菌来源的非限制性实例包括:纤维素酶和半纤维素酶—梭菌属物种(例如热解纤维梭菌(clostridiumthermocellum)),类芽孢杆菌属物种、褐色喜热裂孢菌;淀粉酶—芽孢杆菌属(例如嗜热脂肪芽孢杆菌(bacillusstearothermophilus))、地芽孢杆菌属物种(例如geobacillusthermoleovorans)、色盐杆菌属物种,海洋红嗜热盐菌。每种可能性都是单独的实施方案。

在另外的实施方案中,所述多糖降解酶的细菌来源是嗜温细菌。如本文所用的术语“嗜温细菌”表示在约20℃至45℃之间的温度下繁殖的细菌。多糖降解酶的嗜温细菌来源的非限制性实例包括:纤维素酶和半纤维素酶—克雷伯氏菌属(例如,肺炎克雷伯菌)、cohnella物种、链霉菌属、解纤维素醋弧菌、白色瘤胃球菌;淀粉酶—芽孢杆菌属(例如解淀粉芽孢杆菌(bacillusamyloliquefaciens)、枯草芽孢杆菌(bacillussubtilis)、地衣芽孢杆菌(bacilluslicheniformis)和发酵乳杆菌。本领域技术人员理解一些嗜温细菌(例如几种芽孢杆菌属)产生热稳定酶。

改造到根据本发明的利用la的细菌的多糖降解酶也可以来自真菌来源。多糖降解酶的真菌来源的非限制性实例包括:纤维素酶和半纤维素酶—里氏木霉、特异腐质霉、尖孢镰刀菌;淀粉酶—米曲霉、瘿青霉和棉状嗜热丝孢菌。

根据本发明使用的多糖降解酶的其他来源可以在例如上述cazy服务器中找到。

在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,该酶在适合所述利用la的细菌生长的相同温度和/或ph范围内具有合适的活性。在一些实施方案中,合适的活性是最佳活性。在一些实施方案中,合适的生长是最佳生长。在一些实施方案中,合适的条件是次优的。

在一些实施方案中,本发明的所述利用la的细菌被基因工程改造以产生在某温度和/或ph范围内具有最佳活性的多糖降解酶,所述温度和/或ph范围与所述利用la的细菌生长最佳的温度和/或ph范围相同。

在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,所述多糖降解酶在某温度和/或ph范围内具有合适的活性,所述温度和/或ph范围不同于所述利用la的细菌生长的合适的温度和/或ph范围。

在一些实施方案中,本发明的利用la的细菌被基因工程改造以产生多糖降解酶,所述多糖降解酶在某温度和/或ph范围内具有最佳活性,所述温度和/或ph范围不同于所述利用la的细菌生长的最佳温度和/或ph范围。例如,来自嗜热源的多糖降解酶可以被改造为利用la的细菌,其典型地是嗜温菌。

加工有机废物

在一些实施方案中,待加工的有机废物典型地包含内源性d、l-乳酸。

在一些实施方案中,为了利用有机废物作为制备分离乳酸对映体的底物,需要在乳酸发酵之前选择性地除去至少不需要的对映体(为了将乳酸聚合成适合工业应用的聚乳酸,它应该是至少约95%光学纯,优选至少约99%光学纯)。应该从对有机废物中除去至少不需要的对映异构体,同时对原料总糖含量的影响最小。

在一些实施方案中,待加工的有机废物还包含不同比例的复合多糖和还原糖。这个组成取决于废物的来源,其中一些有机废物可能更富含淀粉(例如,来自面包店的食物废物、市政的混合食物废物),而其他有机废物可能富含木质纤维素材料(例如农业废物)。在一些实施方案中,待处理的有机废物包括来自不同来源的废物的组合。

在一些实施方案中,可以在处理之前使用本领域已知的方法测定有机废物中还原糖和多糖的组成,包括例如用葡萄糖氧化酶、己糖激酶或磷酸葡萄糖异构酶用于果糖的酶学试验(比色、荧光测定)。或者,可以使用hplc和/或还原糖连续传感器。总糖分析可以例如通过苯酚-硫酸试验进行。有机废物的组成,例如淀粉、纤维素和半纤维素中至少一种的百分比,可用于选择待与有机废物接触的利用la的细菌或利用la的细菌群。例如,对于包含纤维素百分比高于淀粉的有机废物,可以选择细胞联合体,其包含产生淀粉酶的第一亚群和产生纤维素酶的第二亚群,其中亚群之间的比例根据有机废物中淀粉和纤维素之间的比例而定。也可以使用产生所有必需酶的单一细菌,并且可以使用不同效价的核糖体结合位点(rbs)改变和调整酶的剂量和比例,如上所述。

在一些实施方案中,根据本发明的有机废物的处理典型地始于有机废物的预处理,以减小粒度和增加表面积,以及灭活废物内的内源细菌。预处理可包括例如通过本领域已知的方法切碎和灭菌。预处理还可包括使用废碎机(例如挤出机、超声波仪,粉碎机或搅拌机)伴随等量的水切碎。

根据一些实施方案,在预处理之后,将有机废物在反应器(发酵罐)中与本发明所述利用la的细菌混合,和细菌培养物在适合利用la的细菌消耗乳酸和适合产生改造的多糖降解酶的条件下繁殖。在一些实施方案中,此类条件可包括约30-40℃的温度及其任何子范围。每种可能性都是单独的实施方案。在一些实施方案中,此类条件可包括约5.5-6.5的ph及其任何子范围。每种可能性都是单独的实施方案。

在一些实施方案中,当所述多糖降解酶被分泌并具有合适的(例如,最佳的)温度和/或ph,该温度和/或ph类似于适合(例如最佳)所述利用la的细菌生长的温度和/或ph时,结果是伴随的乳酸除去和有机废物糖化。

在一些实施方案中,当所述多糖降解酶被分泌并且具有合适的(例如,最佳的)温度和ph,该温度和ph不同于适合(例如最佳)所述利用la的细菌生长的温度和ph时,酶被分泌但仍保留无活性或部分活性,直至条件调整为适合酶活性的条件,导致分开的除去乳酸和有机废物糖化。

在一些实施方案中,当所述多糖降解酶是非分泌的并仅在所述利用la的细菌细胞溶解后才释放时,结果还是分开除去乳酸和有机废物糖化。

在一些实施方案中,将培养物维持足够的时间以从废物中除去d-乳酸、l-乳酸或两者(取决于利用la的细菌的类型),并任选地获得期望水平的还原糖(乳酸除去和有机废物糖化相伴发生)。

在一些实施方案中,所述时间段可以为约2小时至约15小时或其间的任何量,优选为2-12小时、或2-10小时,例如2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时和10小时。

如本文所用,当提及可测量值时,术语“约”意指包括指定值的+/-10%,优选+/-5%,更优选+/-1%的变化,并且还更优选+/-0.1%。

有机废物典型地包括产生la的细菌所需的氮源和其他营养素,但是如果需要,这些营养素也可以分开提供。

在一些实施方案中,在上述处理之后,测定还原糖的量。这种测定对利用还原糖的下游发酵过程可能是有用的,能够控制补糖的浓度。

分离的乳酸对映体的制备

在一些实施方案中,有机废物的所述还原糖(最初在废物中发现的那些还原糖和通过多糖降解酶的作用而释放的那些还原糖)可以被产生la的微生物发酵成乳酸。为了仅产生一种分离的乳酸对映体,所用的产生la的微生物仅产生d-乳酸和l-乳酸对映体中的一种。产生la的微生物可以天然地仅产生一种对映体,或者可以被遗传修饰而仅产生一种对映体,例如通过敲除参与合成不需要的对映体的一种或多种酶。

在一些实施方案中,在乳酸发酵之前,灭活所述利用la的细菌以避免消耗发酵过程中产生的乳酸。例如,可以通过升高温度或将ph改变至所述利用la的细菌不可逆地灭活的温度/ph来进行灭活。可选地或另外地,灭活利用la的细菌可以通过细胞溶解来实施,例如超声处理。当所述利用la的细菌被改造以产生非分泌的多糖降解酶时,可以使用后者,并且细胞裂解使细菌失活,同时释放酶。在一些实施方案中,所述灭活包括灭菌或巴氏灭菌。

如本文所用,“灭活”表示死亡或垂死的细胞。典型地,至少80%的细胞被灭活,例如至少85%的细胞被灭活,至少90%的细胞被灭活,至少95%的细胞被灭活,或100%的细胞被灭活。每种可能性代表本发明的单独实施方案。

在一些实施方案中,乳酸发酵在相同的反应器(发酵罐)中进行,其中用所述利用la的细菌和多糖降解酶处理有机废物。在其他实施方案中,发酵在分开的反应器中进行。在一些实施方案中,过滤加工的有机废物以除去固体物质,并将过滤液与产生la的微生物混合用于发酵阶段。

产生la的微生物包括各种细菌(包括例如乳杆菌属物种和芽孢杆菌属物种)和真菌。

典型地,所述发酵步骤在厌氧或微需氧条件下进行,使用分批、补料分批、连续或半连续发酵。每种可能性代表本发明的单独实施方案。

在分批发酵中,将碳底物和其他成分装入反应器中,和当发酵完成时,收集产物。除了用于ph控制的中和剂之外,在反应完成之前不将其他成分添加到反应中。接种量典型地为反应器中液体体积的约5-10%。将发酵保持在基本恒定的温度和ph,其中通过添加合适的中和剂来维持ph,例如碱、碳酸盐或氨。

在补料分批发酵中,将底物连续或依次加入反应器中而不除去发酵液(即,产物保留在反应器中直至运行结束)。常见的补料方法包括间歇、恒速、脉冲和指数补料。

在连续发酵中,将底物以固定速率连续加入反应器中,并连续取出发酵产物。

在半连续过程中,每隔一段时间取出一部分培养物,并将新鲜培养基加入到系统中。可以无限期维持的重复补料分批培养是半连续过程的别称。

乳酸发酵典型地实施约1-4天或其间的任何量,例如1-2天,或2-4天,或3-4天。

根据一些实施方案,所述多糖降解酶可具有最佳温度和/或ph,其不同于分泌它们的所述利用la的细菌生长的最佳温度和/或ph,因此,在所述利用la的细菌处理过程中酶可以分泌,但它们保持无活性(或部分活性)并且基本上不降解有机废物中的多糖,或降解速率低。在一些实施方案中,所述多糖降解酶的最佳温度和/或ph类似于所述产生la的微生物发酵乳酸的最佳温度和/或ph。根据这些实施方案,酶可以在发酵液中保持无活性,直到加入产生la的微生物并调节条件以允许它们活化。这可引起同时糖化和发酵。

在一些实施方案中,所述多糖降解酶可以是非分泌的并且仅在利用la的细菌细胞溶解后释放到培养基中。在一些实施方案中,在所述利用la的细菌细胞裂解后,将产生la的微生物添加到培养基中,从而同时发生糖化和发酵。

根据这些实施方案,制备分离的乳酸对映体的方法包括:(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合,通过在适合所述利用la的细菌消耗乳酸和适合产生所述多糖降解酶的条件下,使有机废物接触本发明的所述利用la的细菌或本发明的利用la的细菌群;(ii)灭活所述利用la的细菌;(iii)降解废物中的多糖以释放还原糖,同时将释放的糖发酵成分离的乳酸对映体,通过在适合(i)中产生的多糖降解酶的活性和适合产生la的微生物发酵乳酸的条件下,使(i)中获得的有机废物接触仅产生d-乳酸对映体和l-乳酸对映体之一的产乳酸微生物;(iv)从发酵液中回收分离的乳酸对映体。

在其他实施方案中,在乳酸发酵(水解和发酵分开)之前将有机废物糖化。

根据这些实施方案,制备分离的乳酸对映体的方法包括:(i)处理所述有机废物以除去废物中存在的d-乳酸、l-乳酸或其组合并降解废物中的多糖以释放可溶性还原糖,通过在适合所述利用la的细菌消耗乳酸和适合多糖降解酶分泌和活性的条件下,使有机废物接触本发明的所述利用la的细菌或本发明的利用la的细菌群体;(ii)灭活所述利用la的细菌;(iii)用仅产生d-乳酸和l-乳酸之一的产乳酸微生物发酵(i)中得到的可溶性还原糖,得到分离的乳酸对映体;和(iv)从发酵液中回收分离的乳酸对映体。

在发酵完成后,含乳酸的发酵液典型地可以通过离心澄清或通过滤器以从发酵液体中分离固体残留物。滤液可以浓缩,例如,使用旋转真空蒸发器。

可以通过本领域已知的方法从发酵液中分离和纯化乳酸,包括蒸馏、萃取、电渗析、吸附、离子交换、结晶和这些方法的组合。例如,在ghaffaretal.(2014),前述;和lópez-garzónetal.(2014)biotechnoladv.,32(5):873-904的文章中综述了几种方法。或者,可以使用单独的步骤将乳酸回收并转化为丙交酯(dusselieretal.(2015)science,349(6243):78-80)。

在一些实施方案中,本文公开的用于处理废物的系统和方法特别适用于商业、工业和市政来源的混合食物废物。使用混合食物废物作为底物特别适合大规模工业发酵,因为它是不均匀的,因此它含有瘤胃来源的细菌发酵所需的大部分矿物质和维生素。此外,本文公开的系统和方法优于目前使用的方法,因为它们表现出使用化石燃料少,不使用有价值的耕地种植原料作物,水的使用率低,温室气体排放也低,并且所获得的产物是可生物降解的。

根据一些实施方案,本文公开的系统和方法是进一步有利的,因为它们允许组合单元操作进行工业处理,因为不需要外来添加多糖降解酶来利用废物。相反,这种酶的产生在发酵发生的相同容器中进行。

生产聚乳酸(pla)

为了产生适合工业应用的pla,聚合方法应仅使用一种对映体。存在杂质或d-和l-乳酸的外消旋混合物导致聚合物具有不希望的特性,例如低结晶度和低熔融温度。因此,需要仅产生l-乳酸对映体或仅产生d-乳酸对映体的乳酸菌。

pla的聚合可以通过本领域已知的方法进行。已知的方法包括通过丙交酯(二乳酸)形成的聚合和乳酸单体的直接缩合。例如,在andstolt(2010)industrialproductionofhighmolecularweightpoly(lacticacid),in:poly(lacticacid):synthesis,structures,properties,processing,andapplications(edsr.auras,l.-t.lim,s.e.m.selkeandh.tsuji),johnwiley&sons,inc.,hoboken,nj,usa.中综述了几种方法。在一些实施方案中,pla是聚-l乳酸(plla)。在一些实施方案中,pla是聚-d乳酸(pdla)。

根据一些实施方案,本文公开的系统和方法可以产生最终产物,即从废物中完全再循环(即100%再循环)的聚乳酸(pla)。

根据一些实施方案,本文公开的利用la的细菌的各种方法和系统可以成功地用于生产乳酸和pla,其可以通过各种商业环境实施,包括室外,各种发酵罐和反应器,回收工厂等等。

在一些实施例中,可以在一个分离位置中执行方法中的各个步骤。在一些实施方案中,方法中的各个步骤可以在一个或多个操作单元中进行,例如发酵罐和反应器。在一些实施例中,可以同时或连续地执行方法中的各个步骤。例如,有机废物的尺寸减小可以与灭菌步骤在时间上和/或空间上组合。

在一些实施方案中,使用本发明所述利用la的细菌从有机废物中获得聚乳酸的方法中的步骤可包括以下一个或多个步骤:

1.获取有机废物。所述有机废物可选自住宅、商业或工业食物废物。所述有机废物可以是源分离的或机器分离的。

2.所述有机废物的尺寸减小—所述有机废物的粉碎和研磨,以获得均匀的半固体原料。进一步,也可以使用超声处理从而将尺寸减小与灭菌相结合。这可以在同一操作单元中执行。

3.灭菌—可以通过例如超声、加热、uv和/或压力来实现。这可以在发酵罐操作单元内原位进行,也可以在外部进行。在一些实施方案中,如上所述,该步骤可与尺寸减小步骤组合。

4.利用la的基因工程细菌的接种—利用la的基因工程细菌可以接种在种子发酵罐操作单元中以产生酶。另外,来自下游加工的乳酸盐副产物可以在该步骤中作为原料加入(如下面进一步详述的)。所述利用la的细菌也可以在限定的培养基上培养,例如yel。

5.多糖降解酶和二氧化碳的接种和共生—以及外消旋乳酸盐的消耗—将利用la的种子细菌接种在生产发酵罐中以进一步产生酶并在有机废物中消耗外消旋乳酸盐。

6.利用la的细菌的灭活—发酵罐中的温度可以增加(例如,至45-55℃),导致所述利用la的细菌灭活(灭菌)。有利地,这种升高的温度可以进一步增强分泌的多糖降解酶的活性,所述分泌的多糖降解酶由利用la的细菌分泌,为其活性提供改善的条件(例如最佳条件)。

7.接种产生乳酸的生物(产生纯l或纯d的生物)—因此,发酵培养基从外消旋乳酸中除去,并且还原糖(由分泌的降解酶形成)变得可用于乳酸发酵过程。

8.乳酸的回收和纯化—可以使用各种纯化方法(或其组合)来纯化对映体纯的乳酸。这些方法包括例如微/纳过滤、离心、离子层析、沉淀、结晶等等。

9.聚合为plla或pdla—使用本领域已知的方法实施纯化的乳酸聚合为pla,包括通过丙交酯(二乳酸)形成的聚合和乳酸单体的直接缩合。

在一些实施方案中,使用本发明的利用la的细菌可以有利地再循环和再利用在获得纯乳酸(和pla)的过程中形成的下游残留乳酸或乳酸盐废物的。在该过程中形成的这种下游残留乳酸或乳酸盐废物可以来自例如从发酵液中除去固体(例如,使用膜过滤或离心),剩余的固体含有未分离的有用乳酸盐。另外,当合成丙交酯时,一些乳酸分子可以进行外消旋化。这种残留的乳酸和/或乳酸盐废物发酵可有利地在该过程中再循环,例如,通过用作利用la的细菌生产酶的原料。当从发酵液中回收有机酸如乳酸时,通常产率不是100%并且存在残留的稀释乳酸。回收残留的有机酸是昂贵的,因此它可以再循环并用于另一发酵批次。回收残留物会重新引入残留物中也存在的矿物质和盐,这可能需要新发酵批次。连续和半连续发酵乳酸生产过程需要使用富含细菌和乳酸的发酵液样品接种进入的无菌发酵原料。连续或半连续方法使用有机废物生产乳酸的问题是进入的原料中存在不需要的对映体。如果富发酵液接种在原料中,则立即开始产生乳酸,则不需要的对映体作为杂质保留在该过程中。因此,在乳酸生产过程中使用利用乳酸盐的细菌允许所有这些资源的有效再循环。来自回收过程的残留乳酸和/或巴氏灭菌/灭菌的富含乳酸的发酵液可用于培养细菌并产生大量酶用于另一生产循环。这可以在原位或在单独的较小种子发酵罐中实现。在一些实施方案中,来自乳酸富发酵液的样品可以分成两部分,一部分经巴氏消毒并用于培养产酶的细菌。第二部分未经巴氏杀菌并且含有大量细菌细胞团,可用于接种已被利用la的细菌处理以除去对映体和/或用酶糖化的原料。

现在参考图1,图1是根据一些实施方案的用于产生乳酸的分离对映体和再循环残留乳酸盐废物的发酵系统的示意图。如图1所示,发酵系统包括种子发酵罐(10),其中接种利用la的基因工程细菌。培养基/液可以是减小尺寸和灭菌/巴氏杀菌的如上所述的各种来源的有机废物(14)、限定的培养基(例如,yel)(16)和/或尺寸减小和灭菌的有机废物和有益于利用la的细菌生长的合适营养素的组合(18)。在种子室中,实现分泌的多糖还原酶(由利用la的细菌产生)和co2共同产生,以及乳酸盐消耗(由利用la的细菌消耗)。然后将利用la的种子细菌转移到生产发酵罐(12)中,以进一步产生和分泌多糖还原酶并消耗外消旋乳酸盐。另外,可以将另外批量的尺寸减小和/或灭菌的有机废物(20)添加到生产发酵罐中。接下来,改变生产发酵罐中的条件(例如温度或ph)(例如,通过将温度升高至45-65℃(例如,55℃)),从而导致利用la的细菌灭活,和任选的,为分泌的多糖降解酶提供增强的工作条件。这导致发酵培养基从外消旋乳酸中被除去并富含可用于发酵的还原糖。产生la的微生物接种于培养基以产生光学纯的乳酸对映体,然后可以将其纯化并进一步加工,例如通过聚合成pla。有利地,过程中形成的下游残留乳酸和/或乳酸盐废物(22)通过加入到种子发酵罐和/或生产发酵罐中(如曲线箭头所示),可以再利用和再循环。

根据一些实施方案,因此提供了回收在制备光学纯乳酸对映体的过程中形成的残留乳酸和/或乳酸盐废物的系统和方法。

在一些实施方案中,该系统可包括一种或多种有机废物来源;一个或多个发酵罐;一种遗传修饰的利用la的细菌,其被修饰以表达和分泌一种或多种外源多糖降解酶,其中所述发酵罐配置成允许利用la的细菌在适合利用la的细菌消耗乳酸和适合多糖降解酶的表达和活性的条件下生长,其中这种加工从有机废物中除去d-乳酸、l-乳酸或两者,并降解废物中的多糖以释放可溶性还原糖;并且进一步配置成允许使利用la的细菌和可以接种在发酵罐中的产生la的微生物失活的条件,所述产生la的微生物能够发酵由分泌的多糖降解酶产生的可溶性还原糖以产生d-乳酸和l-乳酸之一,得到分离的乳酸对映体;其中将在该过程中形成的下游残留乳酸和/或乳酸盐废物加回到一个或多个发酵罐中,在该方法中重新用作底物。

术语“包括”、“包括”、“具有”及它们的结合词意味着“包括但不限于”。术语“包括”和“包含”在一些实施例中限于“由……组成”。属于“由……组成”意思是“包括但限于”。术语“基本上由……组成”是指可包括另外的成分、步骤和/或部分的组合物、方法或结构,但条件是另外的成分、步骤和/或部分不实质上改变声称的组合物、方法或结构的基本和新特征。

如本文所用,单数形式“一”、“一个”、“一种”和“该”包括复数指代,除非上下文另有明确说明。例如,术语“化合物”或“至少一种化合物”可包括多种化合物,包括其混合物。

具体实施方式的前述描述将充分揭示本发明的一般性质,以致其他人可通过应用当前知识,容易地改进和/或改变各种应用,这些具体实施方式无需过度实验且不脱离一般概念,并且因此,这些改变和改进应当并意欲解释在所公开的实施方案的等同物的含义和范围内。应理解,本文采用的措辞或术语是出于描述的目的而非限制。用于执行各种公开的化学结构和功能的方法、材料和步骤可以在不脱离本发明的情况下采用各种替代形式。

为了更全面地说明本发明的一些实施方案,提供以下实施例。然而,它们不应被解释为限制本发明的广泛范围。

实施例

实施例1-用于遗传修饰细菌的合适载体的构建

大肠杆菌—费氏丙酸杆菌穿梭载体的构建:

构建的载体在大肠杆菌和费氏丙酸杆菌中都可使用。

如下制备powr3载体(示意图显示在图2a中):丙酸杆菌复制蛋白序列(seqidno.84)和氯霉素抗性基因(来自纹状体棒状杆菌(corynebacteriumstriatum)pt10质粒的cmx(a)(seqidno:85)和cml(a)(seqidno:86))串联合成进入包含大肠杆菌复制起点(ori)和氨苄青霉素抗性盒(ampr)的载体。这导致在大肠杆菌和费氏丙酸杆菌中都能够复制的~5.6kbp的质粒。该载体还包括pb复制起点序列。得到的powr3载体比其他已知的费氏丙酸杆菌表达载体(5.6kbp对比6.2-8kbp)小,这使得它更容易转化入细菌细胞(例如,通过电穿孔)并且更容易用无限制方法进行克隆。此外,powr3的ampr基因序列区域用作克隆位点,用于插入表达盒(如下详述)。该区域通过终止信号界定(上游和下游),终止信号防止极性效应中断并稳定细菌细胞中产生的(多糖降解酶的)mrna转录物。

powr3载体转化费氏丙酸杆菌

通过电穿孔将powr3载体转化到费氏丙酸杆菌中。将费氏丙酸杆菌的浊培养物以1:125稀释至新鲜的yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐),在有氧条件下于30℃过夜培养。将培养物(o.d600=0.2-1.9)置于冰上30分钟,然后用相同体积的冰水(3000rpm,10分钟)洗涤两次。第三次洗涤使用相同体积的冷10%甘油(3000rpm,10分钟)。将沉淀在10%冷甘油中浓缩(原始培养物的0.01%)。将50μl电感受态的费氏丙酸杆菌在含有1000ngpowr3载体的管中混合。将细菌和载体混合物转移到0.1cm间隙比色杯(biorad)中并使用以下条件进行电穿孔:场强-20000v/cm,电阻-500欧姆,电容-25uf。加入900μlyel培养基,将细菌在有氧条件下于30℃温育3小时,然后在yel培养基+10ugr/ml氯霉素琼脂平板上铺板。

为了构建允许多糖降解酶表达和分泌的合适表达载体,通过用“表达盒”替换氨苄青霉素抗性基因来修饰powr3载体,所述“表达盒”包括,i)启动子序列,其可操作地连接到(ii)编码信号肽(sp)的核酸序列,其翻译连接到(iii)编码多糖降解酶的核苷酸序列。(图2b)。当所述表达盒在靶细胞中表达时,在启动子序列的控制下,信号肽与多糖降解酶框内翻译连接。换句话说,在细胞中表达包含sp肽序列和多糖降解酶肽序列的嵌合蛋白。

通过利用这种表达盒,可利用合适的启动子-sp-多糖降解酶组合基质。

实施例2—构建合适的表达盒和表达载体,用于遗传修饰细菌以表达和分泌多糖降解酶

下面列出的是用于产生表达载体中使用的表达盒的示例性多糖降解酶(葡糖淀粉酶、纤维素酶和半纤维素酶(木聚糖酶)、信号肽和启动子。

下表1中列出的以下示例性酶用于表达盒和用于遗传修饰细菌的表达载体。酶序列获自不同来源(生物)。除去每种所列酶的原始信号肽,并用外源(不同)信号肽代替。

表1-示例性多糖降解酶

以下启动子区域用于构建各种表达盒和表达载体:

-来自费氏丙酸杆菌atcc9614的pfreud_04850启动子(seqidno:27)

-来自费氏丙酸杆菌bia118的pfrud_04850启动子(seqidno:28)

-来自费氏丙酸杆菌atcc9614的pfreud_22150启动子(seqidno:29)

-pfreud_08450,来自费氏丙酸杆菌atcc9614的启动子。(seqidno:30)

-来自费氏丙酸杆菌atcc9614的pfreud_18290。(seqidno:31)。

-pgro启动子(来自丙酸丙酸杆菌(propionibacteriumacidipropionici)的pgro质粒)(seqidno:32)。

以下示例性信号肽(sp)氨基酸序列用于构建各种表达盒:

>cbl57338表面层蛋白a(s层蛋白a)pfreud_18290[费氏丙酸杆菌舍氏亚种(propionibacteriumfreudenreichiisubsp.shermanii)cirm-bia1](sedidno:87(氨基酸序列),seqidno:180(核苷酸序列))。

>cbl56016.1细胞壁肽酶,nlpc/p60家族分泌蛋白pfreud_04850[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:88(氨基酸序列),seqidno:181(核苷酸序列))。

>cbl56360.1dsba氧化还原酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:89(氨基酸序列),seqidno:182(核苷酸序列))。

cbl57333.1假定蛋白pfreud_18250[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:90(氨基酸序列),seqidno:183(核苷酸序列))

gi|296921799|emb|cbl56359.1|thiredoxine样膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:91(氨基酸序列),seqidno:184(核苷酸序列))

>gi|296923311|emb|cbl57911.1|rnd超家族的药物输出蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:92(氨基酸序列),seqidno:185(核苷酸序列))

>gi|296921405|emb|cbl55958.1|推定的羧酸酯水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1(seqidno:93(氨基酸序列),seqidno:186(核苷酸序列))。

gi|296921680|emb|cbl56237.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:94(氨基酸序列),seqidno:187(核苷酸序列))。

>gi|296922532|emb|cbl57105.1|s层结构域蛋白结构域蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:95(氨基酸序列),seqidno:188(核苷酸序列))。

>gi|296922233|emb|cbl56805.1|abc转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1]

mrlarrvaavllasvlaltvascagaarsapsl(seqidno:96(氨基酸序列),seqidno:189(核苷酸序列))。

>cbl57324.1假定蛋白pfreud_18170[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:97)。

>cbl57805.1极性氨基酸abc转运蛋白,结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:98)。

>cbl57413.1分选酶家族蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:99)。

>cbl57271.1可能的多药耐药转运蛋白,mfs超家族[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:100)。

>cbl57337.1假定蛋白pfreud_18280[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:101)。

gi|296922302|emb|cbl56874.1|推定的肽基-脯氨酰顺反异构酶,fkbp型(前体)[费氏丙酸杆菌舍氏亚种cirm-bia1]cirm-bia1(seqidno:102)。

gi|296923259|emb|cbl57856.1|细胞外溶质结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:103)。

gi|296923146|emb|cbl57733.1|假定蛋白pfreud_22300[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:104)。

gi|296921378|emb|cbl55931.1|假定蛋白pfreud_03980[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:105)。

gi|296921927|emb|cbl56487.1|假定膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:106)。

gi|296922947|emb|cbl57529.1|羧肽酶(丝氨酸型d-ala-d-ala羧肽酶)(d-丙氨酰-d-丙氨酸-羧肽酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:107)。

>gi|296923326|emb|cbl57926.1|abc转运蛋白,底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:108)。

>gi|296923322|emb|cbl57922.1|假定蛋白pfreud_24060[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:109)。

>gi|296922617|emb|cbl57194.1|假定蛋白pfreud_16830[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:110)。

>gi|296922915|emb|cbl57497.1|分泌的糖基水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:111)。

>gi|296921377|emb|cbl55930.1|假定蛋白pfreud_03970[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:112)。

>gi|296922301|emb|cbl56873.1|肽酰-脯氨酰-顺反式异构酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:113)。

>gi|296922866|emb|cbl57446.1|假定蛋白pfreud_19530[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:114)。

>gi|296922346|emb|cbl56918.1|假定蛋白pfreud_14190[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:115)。

>gi|296921344|emb|cbl55897.1|假定蛋白pfreud_03630[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:116)。

>gi|296922653|emb|cbl57230.1|假定蛋白pfreud_17190[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:117)。

>gi|296921113|emb|cbl55660.1|没有功能的细胞外蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:118)。

>gi|296921687|emb|cbl56244.1|假定蛋白pfreud_07130[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:119)。

>gi|296921593|emb|cbl56147.1|假定蛋白pfreud_06170[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:120)。

>gi|296922523|emb|cbl57096.1|假定蛋白pfreud_15980[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:121)。

>gi|296921018|emb|cbl55556.1|大表面蛋白a[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:122)。

>gi|296922853|emb|cbl57433.1|青霉素结合蛋白(转糖基酶/转肽酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:123)。

>gi|296921190|emb|cbl55739.1|假定蛋白pfreud_02240[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:124)。

>gi|296922847|emb|cbl57427.1|多铜氧化酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:125)。

>gi|296923003|emb|cbl57585.1|染色体浓缩调节蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:126)。

>gi|296923209|emb|cbl57803.1|极性氨基酸abc转运蛋白,结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:127)。

>gi|296923210|emb|cbl57804.1|极性氨基酸abc转运蛋白,结合蛋白成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:128)。

>gi|296921884|emb|cbl56444.1|abc转运蛋白金属结合脂蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:129)。

>gi|296921649|emb|cbl56206.1|铁abc运输系统,溶质结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:130)。

>gi|296922500|emb|cbl57073.1|肽酶m23b家族/金属内肽酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:131)。

>gi|296922061|emb|cbl56625.1|转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:132)。

>gi|296921977|emb|cbl56539.1|假定蛋白pfreud_10150[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:133)。

>gi|296921310|emb|cbl55863.1|假定蛋白pfreud_03320[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:134)。

>gi|296921967|emb|cbl56527.1|abc转运蛋白,底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:135)。

>gi|296921196|emb|cbl55745.1|假定蛋白pfreud_02300[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:136)。

>gi|296921666|emb|cbl56223.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:137)。

>gi|296921230|emb|cbl55780.1|abc转运蛋白,结合脂蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:138)。

>gi|296923102|emb|cbl57689.1|极性氨基酸abc转运蛋白,结合蛋白成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:139)。

>gi|296923079|emb|cbl57663.1|硫酸盐结合蛋白前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:140)。

>gi|296921569|emb|cbl56123.1|abc转运系统的溶质结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:141)。

>gi|296922906|emb|cbl57488.1|abc转运系统的磷酸结合转运蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:142)。

>gi|296920974|emb|cbl55511.1|膜蛋白(s层)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:143)。

>gi|296922551|emb|cbl57124.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:144)。

>gi|296923279|emb|cbl57879.1|青霉素结合蛋白(肽聚糖糖基转移酶)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:145)。

>gi|296921112|emb|cbl55659.1|atp结合区,atp酶样:组氨酸激酶,组氨酸激酶a样前体[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:146)

>gi|296922314|emb|cbl56886.1|钴通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:147)。

>gi|296922614|emb|cbl57191.1|假定蛋白pfreud_16800[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:148)。

>gi|296921959|emb|cbl56519.1|分泌蛋白酶与pdz结构域[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:149)。

>gi|296921835|emb|cbl56395.1|膜蛋白[费氏丙酸杆菌(费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:150)。

>gi|296921079|emb|cbl55620.1|分泌的转糖酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:151)。

>gi|296922047|emb|cbl56611.1|亮氨酸,异亮氨酸,缬氨酸,苏氨酸和丙氨酸结合蛋白[前体](livat-bp)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:152)。

>gi|296922667|emb|cbl57244.1|假定蛋白pfreud_17340[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:153)。

>gi|296922395|emb|cbl56967.1|假定蛋白pfreud_14680[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:154)。

>gi|296921224|emb|cbl55774.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:155)。

>gi|296921129|emb|cbl55676.1|abc转运蛋白通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:156)。

>gi|296921974|emb|cbl56536.1|胞外多糖生物合成蛋白前体(与n-乙酰葡糖胺-1-磷酸二酯α-n-乙酰氨基葡萄糖苷酶前体有关)[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:157)。

>gi|296921168|emb|cbl55717.1|假定蛋白pfreud_02020[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:158)。

>gi|296921340|emb|cbl55893.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:159)。

>gi|296923123|emb|cbl57710.1|假定膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:160)。

>gi|296922282|emb|cbl56854.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:161)。

>gi|296921324|emb|cbl55877.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:162)。

>gi|296922572|emb|cbl57145.1|abc转运蛋白甘氨酸甜菜碱[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:163)。

>gi|296922949|emb|cbl57531.1|假定蛋白pfreud_20380[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:164)。

>gi|296921638|emb|cbl56194.1|abc运输系统成分[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:165)。

>gi|296922507|emb|cbl57080.1|假定蛋白pfreud_15820[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:166)。

>gi|296921133|emb|cbl55680.1|假定蛋白pfreud_01650[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:167)。

>gi|296921157|emb|cbl55704.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:168)。

>gi|296921592|emb|cbl56146.1|abc转运蛋白相关的通透酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:169)。

>gi|296923131|emb|cbl57718.1|假定蛋白pfreud_22150[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:170)。

>gi|296921360|emb|cbl55913.1|假定外膜蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:171)。

>gi|296921416|emb|cbl55969.1|假定蛋白pfreud_04350[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:172)。

>gi|296923120|emb|cbl57707.1|假定蛋白pfreud_22040[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:173)。

>gi|296921006|emb|cbl55544.1|假定蛋白pfreud_00440[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:174)。

>gi|296921415|emb|cbl55968.1|羧酸酯水解酶[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:175)。

>gi|296922150|emb|cbl56718.1|abc转运蛋白底物结合蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:176)。

>gi|296921167|emb|cbl55716.1|假定的分泌蛋白[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:177)。

>gi|296923127|emb|cbl57714.1|假定蛋白pfreud_22110[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:178)。

>gi|296921375|emb|cbl55928.1|假定蛋白pfreud_03950[费氏丙酸杆菌舍氏亚种cirm-bia1](seqidno:179)。

实施例3-利用信号肽和启动子的不同组合制备用于在pb中表达各种多糖降解酶的表达盒

使用合适的引物(列于表2中)和相应的模板,使用pcr反应获得各种启动子和多糖降解酶的核苷酸序列插入物。根据制造说明书,使用q5高保真dna聚合酶(newenglandbiolabs,m0491)进行pcr反应。pcr条件如下:初始变性-98℃1分钟,二次变性-98℃30秒,退火-60℃30秒,延伸-72℃50秒。pcr程序进行30个循环(第二次启动步骤至延伸步骤)。在琼脂糖凝胶上测试pcr产物,并使用wizardpcrcleanup试剂盒(promega)纯化。

实施例3.1-来自纤维复膜孢酵母(saccharomycopsisfibuligera)的葡糖淀粉酶gi113795与pfreud_18290启动子和pfreud_18290信号肽的表达

使用引物1和2从费氏丙酸杆菌扩增启动子和信号肽的序列(下表2)。使用引物3和4扩增葡糖淀粉酶(表2)。在终止密码子后加入21个核苷酸合成全部葡糖淀粉酶,以便能够使用共有的反向引物(引物4)进行扩增。由此获得的表达盒(即插入物)的dna序列如seqidno:33所示。

实施例3.2-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_18290启动子和pfreud_18290信号肽组合的表达:

使用引物1和5(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物6和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:34所示。

实施例3.3-来自梭菌属sp.5g000的葡糖淀粉酶gi231542与pfreud_18290启动子和pfreud_18290信号肽组合的表达:

使用引物1和7(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物8和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:35所示。

实施例3.4-来自clostiridiumthermohydrosulfuricum的葡糖淀粉酶gi490533596与pfreud_18290启动子和pfreud_18290信号肽组合的表达:

使用引物1和9(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物10和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:36所示。

实施例3.5-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_18290启动子和pfreud_18290信号肽组合的表达:

使用引物1和11(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物12和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:37所示。

实施例3.6-来自piccorilustorridusdsm9790的葡糖淀粉酶gi48431212与pfreud_18290启动子和pfreud_18290信号肽组合的表达:

使用引物1和13(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物14和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:38所示。

实施例3.7-来自纤维复膜孢酵母(saccharomycopsisfibuligera)的葡糖淀粉酶gi113795与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和16(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物3和4扩增葡糖淀粉酶。在终止密码子后添加21个核苷酸合成全部葡糖淀粉酶,以使得能够使用共有的反向引物(引物4)进行扩增。由此获得的表达盒(即插入物)的dna序列如seqidno:39所示。

实施例3.8-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和17(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物6和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:40所示。

实施例3.9-来自梭菌属sp.5g000的葡糖淀粉酶gi231542与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和18(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物8和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:41所示。

实施例3.10-来自clostiridiumthermohydrosulfuricum的葡糖淀粉酶gi490533596与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和19(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物10和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:42所示。

实施例3.11-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和20(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物12和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:43所示。

实施例3.12-来自干热嗜酸菌dsm9790的葡糖淀粉酶gi48431212与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和21(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物14和4扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:44所示。

实施例3.13-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_08450启动子和pfreud_04850信号肽组合的表达:

使用引物22和23(表2)从费氏丙酸杆菌扩增pfreud_08450启动子的序列。使用无限制克隆方法将扩增的寡核苷酸序列克隆到已经含有pfreud_04850信号肽和葡糖淀粉酶序列(来自实施例3.8)的powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增。然后转移到dam\dcm-大肠杆菌菌株中,繁殖并纯化,产生非甲基化载体。插入物的dna序列如seqidno:45所示。

实施例3.14-来自黑曲霉的葡糖淀粉酶gi30025851与pfreud_04850启动子和pfreud_18250信号肽组合的表达。

使用引物24和25(表2)从费氏丙酸杆菌扩增pfreud_18250信号肽的序列。使用无限制克隆方法将扩增的寡核苷酸序列克隆到已经含有pfreud_04850启动子和葡糖淀粉酶序列(来自实施例3.8)的powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增。然后转移到dam\dcm-大肠杆菌菌株中,繁殖并纯化,产生非甲基化载体。插入物的dna序列如seqidno:46所示。

实施例3.15-来自褐色喜热裂孢菌tm51的木聚糖酶eor70069-f与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和26(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物27和28扩增木聚糖酶。由此获得的表达盒(即插入物)的dna序列如seqidno:47所示。

实施例3.16-来自褐色高温单孢菌(thermomonosporafusca)的纤维素酶p26222与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和29(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物30和31扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:48所示。

实施例3.17-来自解纤维素梭菌(clostridiumcellulolyticum)的纤维素酶wp_015924277.1与pfreud_04850启动子和pfreud_04850信号肽组合的表达:

使用引物15和32(表2)从费氏丙酸杆菌扩增启动子和信号肽的序列。使用引物33和34扩增葡糖淀粉酶。由此获得的表达盒(即插入物)的dna序列如seqidno:49所示。

表2.引物

实施例4-将表达盒(插入物)克隆到powr3载体中,在费氏丙酸杆菌中表达,并检测各种底物中的多糖降解活性

使用无限制克隆方法(pelegy,ungert.“aplicationoftherestriction-free(rf)cloningformulticomponentsassembly”.methodsmolbiol.2014;1116:73-87)将实施例3(实施例3.1-3.17)的各种扩增的核苷酸序列(表达盒)克隆到powr3载体中。将得到的载体插入并在dh5alfa细菌中扩增,然后转移到dam\dcm-大肠杆菌菌株中,繁殖和纯化,以产生非甲基化载体。

使用如实施例1中所述的电穿孔方法将纯化的载体插入到费氏丙酸杆菌中。检查所得的重组费氏丙酸杆菌表达和分泌多糖降解酶的能力,以及由此产生的降解合适糖类(例如,淀粉、纤维素和木聚糖)的活性。

检查各种底物中的淀粉降解活性—检测所得重组费氏丙酸杆菌表达和分泌葡糖淀粉酶的能力,以及所得的降解淀粉的葡糖淀粉酶活性。

将重组费氏丙酸杆菌菌落转移到含有yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐)和0.5%淀粉的琼脂平板上过夜培养。通过将lugol溶液倒在琼脂平板上以观察淀粉来检测淀粉的降解。

在淀粉存在下,lugol形成黑色沉淀。在葡糖淀粉酶存在下,淀粉被降解并且观察到无色的晕圈。对照lugol试验在图3中示出,其显示暴露于lugol溶液的含有yel培养基和0.5%淀粉的琼脂平板。含有淀粉的所有区域以黑色显示,而在葡萄糖淀粉酶在琼脂平板中扩散的区域中可以看到无色圆圈,表明不存在淀粉。

另外,将得到的重组(基因工程)费氏丙酸杆菌转移到含有0.5-5%淀粉的液体yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐)中,在30℃-37℃下过夜培养,然后在55℃培养2小时。首先,通过比色测定法测试0.5ml温育后培养物的葡萄糖含量。在一些情况下,将试验与在相同条件下和/或相同培养基处理的野生型(未修饰的)费氏丙酸杆菌培养物的对照培养物进行比较,所述培养基不包括添加的细菌。分泌的葡糖淀粉酶降解培养基中的淀粉并产生可通过比色法检测的葡萄糖。其次,进行类似的测定,其中将温育后培养基离心,仅检查上清液的葡萄糖含量。此外,测试在最佳条件下葡糖淀粉酶活性的活性:将0.1ml过夜培养物与0.4ml1%淀粉溶液一起温育2小时,之后将管离心并通过比色法检测上清液的葡萄糖含量。

另外,将10^8cfu/ml重组费氏丙酸杆菌接种到切碎的有机废物(ph5.5)中,在30℃-37℃过夜培养,然后在55℃培养约2小时。离心0.5ml过夜培养物,并通过比色法检测上清液的葡萄糖含量。

实施例4.1-来自热解淀粉梭菌的葡糖淀粉酶gi34146785与pfreud_04850启动子和pfreud_04850信号肽组合在费氏丙酸杆菌中的表达,以及其淀粉降解活性的检测。

如上所述将实施例3.11中描述的表达盒(seqidno:43)克隆到powr3载体中,并转化入费氏丙酸杆菌。

检查所得重组费氏丙酸杆菌表达和分泌葡糖淀粉酶的能力,并检测降解淀粉的葡糖淀粉酶活性。

将10^6-10^9cfu/ml所得重组(基因工程)费氏丙酸杆菌或相应的野生型细菌(费氏丙酸杆菌对照)转移至含淀粉的液体yel培养基(gr/l:10酵母提取物、10蛋白胨、10乳酸盐),在30-37℃培养,然后在55℃下进行另外的培养。

在孵育期后,验证培养物在重组和对照费氏丙酸杆菌中的相似cfu含量(对于每种温度和/或cfu/ml细菌)。通过比色测定法检测每种培养物的葡萄糖含量。与野生型费氏丙酸杆菌对照相比,在重组费氏丙酸杆菌处理的培养基中观察到葡萄糖含量显着增加(超过35倍)。

这些结果表明,基因工程细菌可以成功地表达和分泌活性多糖降解酶(在该实施例中为葡糖淀粉酶),并且分泌的酶具有活性,因为它能够成功降解底物中的淀粉以产生葡萄糖。

实施例5-顺序进行乳酸利用和有机废物的糖化

使用利用la的细菌以顺序操作模式利用乳酸和糖化有机废物中的多糖。

在optimumcommercialblender中以多个批次研磨混合食物废物,其包括1000ml水中有1000gr食物废物。将10l(工作体积)的半固体混合物引入发酵罐(newbrunswick15l容量)。测量ph为5.2。

培养基在121℃原位灭菌(通过高压灭菌)30分钟,以200rpm搅拌培养基。然后将发酵罐冷却至37℃并保持温度。气流保持在顶部空间中以维持发酵罐中的正压力。

利用乳酸的细菌起始剂制备—发酵的接种物以及通过利用乳酸的细菌(在该实施例中,费氏丙酸杆菌(atcc9614))利用乳酸在1l摇瓶中,在酵母提取物乳酸盐(yel)培养基中,在37℃100rpm进行。细胞生长至细胞密度1*108

发酵—接种15ml用于10.8l发酵,37℃,ph5.5(由10%氨溶液控制),直至基本上完全利用培养基中存在的乳酸。测定乳酸和总葡萄糖和果糖。将发酵液样品在15℃以6000g离心10分钟,并在reflectoquant分析系统(rqflexplus10)中分析上清液。

然后将发酵罐加热至55℃持续2小时,以使细菌分泌的多糖降解酶(例如,葡糖淀粉酶)的活性达到最佳条件,并使细菌灭菌(费氏丙酸杆菌)。糖化后,将发酵罐冷却至37℃,通过利用产乳酸菌(lab)进一步处理和制备分离的乳酸对映体。

lab起始剂的制备—鼠李糖乳杆菌(atcc11443)l-乳酸盐发酵的接种物:1升摇瓶,条件包括在37℃以100rpm搅拌的mrs培养基。细胞生长至1*109的密度。将15ml起始培养物接种用于10l发酵。温度控制在37℃,通过氨溶液(10%)控制ph为6.5。当葡萄糖从培养基中耗尽时终止l-乳酸盐发酵,典型地在24至48小时后。

实施例6-利用乳酸和有机废物糖化相伴进行

使用利用la的细菌相伴进行利用乳酸和有机废物中的多糖糖化。

在optimumcommercialblender中以多个批次研磨混合食物废物,其包括1000ml水中有1000gr食物废物。将10l(工作体积)的半固体混合物引入发酵罐(newbrunswick15l容量)。测量ph为5.2。

培养基在121℃原位灭菌(通过高压灭菌)30分钟,以300rpm搅拌培养基。然后将发酵罐冷却至37℃并保持温度。

利用乳酸的细菌起始剂制备—发酵的接种物以及通过利用乳酸的细菌(在该实施例中,费氏丙酸杆菌(atcc9614))利用乳酸在1l摇瓶中,在酵母提取物乳酸盐(yel)培养基中,在37℃100rpm进行。细胞生长至细胞密度1*108

发酵—接种15ml用于10.8l发酵,37℃,ph5.5(由10%氨溶液控制),直至基本上完全利用培养基中存在的乳酸,伴随细菌分泌的多糖降解酶(例如,葡糖淀粉酶)将多糖糖化。测定乳酸和总葡萄糖和果糖。将发酵液样品在15℃以6000g离心10分钟,并在reflectoquant分析系统(rqflexplus10)中分析上清液。

然后将发酵罐加热至55℃持续2小时,以允许细菌灭菌(费氏丙酸杆菌)。

其后,将发酵罐冷却至37℃,以允许利用产乳酸的细菌(lab)进一步处理和制备分离的乳酸对映体。

lab起始剂的制备—鼠李糖乳杆菌(atcc11443)l-乳酸盐发酵的接种物:1升摇瓶,条件包括在37℃以100rpm搅拌的mrs培养基。细胞生长至1*109的密度。将15ml起始培养物接种10l发酵。温度控制在37℃,通过氨溶液(10%)控制ph为6.5。当葡萄糖从培养基中耗尽时终止l-乳酸盐发酵,典型地在24至48小时后。

sequencelisting

<110>3plw有限责任公司(3plwltd.)

<120>被遗传修饰以分泌多糖降解酶的利用乳酸的细菌(lacticacid-utilizingbacteriageneticallymodifiedtosecretepolysaccharide-degradingenzymes)

<130>plw001pct

<150>us62/276985

<151>2016-01-11

<160>189

<170>patentinversion3.5

<210>1

<211>1652

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>1

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccctgcag120

gagggccccctgaacaagcgcgcctacccctccttcgaggcctactcgaactacaaggtg180

gaccgcaccgacctggaaaccttcctggacaagcagaaggaggtgtcgctgtattacctg240

ctgcagaacatcgcctaccccgagggccagttcaataatggcgtgcccggcaccgtgatc300

gcctcgccctcgacctcgaatcccgattactactaccagtggacccgtgactcagccatc360

accttcctgaccgtgctgtcggagctggaggacaacaacttcaacaccaccctggccaag420

gccgtggagtactacatcaacacctcgtacaacctgcagcgcacctcgaacccctccggc480

tcgttcgacgacgagaatcacaagggcctgggcgagccaaagtttaataccgacggttcg540

gcctataccggcgcatggggccgtccccaaaatgatggtcccgcactgcgtgcctacgcc600

atctcgcgctacctgaacgacgtgaattcgctgaacgagggcaagctggtgctgaccgac660

tcgggcgacatcaacttctcgtccaccgaggacatctacaagaacatcatcaagcccgac720

ctggagtacgtgatcggctactgggactcgaccggcttcgacctgtgggaggagaatcag780

ggccgtcacttcttcacctcgctggttcagcagaaggccctggcctatgccgtggatatc840

gccaagtcgttcgatgacggcgacttcgccaataccctgtcgtcgactgcctcgaccctg900

gagtcgtacctgtcgggttcggacggcggcttcgtgaacactgacgtgaaccacatcgtg960

gagaaccccgatctgctgcaacagaattcgcgccagggcctggactcggccacctacatc1020

ggtcccctgttgacccatgatatcggcgagtcatcgtcgacccccttcgacgtggacaac1080

gagtacgtgctgcagtcgtactacctgctgctggaggacaataaggaccgctactccgtg1140

aactcggcctactcggccggcgccgccatcggtcgttatccagaggatgtgtataatggc1200

gacggctcctcagaaggcaatccctggttcctggccaccgcatacgccgcacaggttccc1260

tacaagctggcctacgacgccaagtcagcctcgaatgacatcaccatcaacaagatcaac1320

tacgacttcttcaacaagtacatcgtggacctgtcgaccatcaactccgcctaccagtcg1380

tcggactcggtgaccatcaagtcgggctcggacgagttcaacaccgtggccgacaacctg1440

gtgaccttcggcgactcgttcctgcaggtcatcctggaccacatcaacgacgacggctcg1500

ctgaatgagcagctgaaccgttacaccggctactccaccggtgcctactcgctgacctgg1560

tcatcgggcgccttgttggaggccattcgtctgcgcaataaggtgaaggccctggcctga1620

tgatgccgatcacctacaactgaatcccatgg1652

<210>2

<211>2006

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>2

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatctcg120

aagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgccatc180

ctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtg240

gcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggcttg300

gtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgaccatc360

gagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacctg420

tcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactggc480

tcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtttc540

ggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccctg600

gtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgtgg660

gaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggt720

tcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaa780

atcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgactcg840

tcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacccc900

gaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatcac960

aaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagactcg1020

gaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggttc1080

ctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagcag1140

ggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacgcc1200

accggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagacc1260

ttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcg1320

gagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcatat1380

gccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtgag1440

acgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctactca1500

tcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccgcc1560

accccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaaag1620

acctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgaccttc1680

gacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgcag1740

ctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgtca1800

gatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttc1860

atccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtacacc1920

gtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgatgc1980

cgatcacctacaactgaatcccatgg2006

<210>3

<211>2165

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>3

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatcgac120

cgcttcaacaacatctccgccgtgaacggccccggcgaggaggatacctgggcctccgcc180

cagaagcaaggtgtgggcaccgccaataattacgtgtcaaaggtgtggttcaccctggca240

aacggcgccatctcggaggtgtactaccccaccatcgacaccgccgacgtgaaggagatc300

aagttcatcgtgaccgacggcaagtcgttcgtgtcggacgagacgaaggacaccatctcg360

aaggtggagaagttcaccgacaagtcgctgggctacaagctggtgaacaccgacaagaag420

ggccgctaccgcatcaccaaggagatcttcaccgacgtgaagcgcaactccctgatcatg480

aaggccaagttcgaggccctggagggctcgatccacgactacaagctgtacctggcctac540

gacccccacatcaagaaccagggctcgtacaatgagggctacgtgatcaaggccaacaac600

aacgagatgctgatggccaagcgcgacaacgtgtacaccgccctgtcgtcgaatatcggc660

tggaagggctactcgatcggctactacaaggtgaacgacatcatgaccgacctggacgag720

aacaagcagatgaccaagcactacgactccgcccgcggcaacatcatcgagggcgccgag780

atcgacctgaagaagaactcgcagttcgagatcgtgctgtcgttcggcaactccgaggac840

gaggccgtgaaggcctccatcgagacgctgtcggagaattacgactcgctgaagtcggcc900

tacatcgacgagtgggagaagtactgcaactcgctgaacaacttcaacggcaaggccaat960

tcgctgtactacaactccatgatgatcctgaaggcctcggaggacaagaccaataagggc1020

gcctacatcgcctcgctgtcgatcccctggggcgacggtcagggcgacgataataccggc1080

ggttaccaccttgtgtggtcacgtgatctgtaccacgtggccaatgccttcatcgccgcc1140

ggtgacgtggactcggccaaccgctcgctggactacctggccaaggtggtgaaggacaat1200

ggcatgattccccagaatacctggatctccggcaagccctactggaccggcatccagctg1260

gacgagcaagccgaccccattatcctgtcgtaccgcctgcgccgctatgacctgtatgac1320

tcgttggtgaagcccctggccgacttcatcatcaagatgggccccaaaactggtcaggaa1380

cgttgggaggagattggtggctattcacccgcaaccatggccgccgaggtggccggcttg1440

acctgtgccgcctacatcgccgagcagaataaggactacgagtcggcccagaagtatcag1500

gagaaggccgacaactggcagaagctgatcgacaacctgacctacaccgagcacggcccc1560

ctggagaacggtcagtactacatccgcattgccggcttgcccgatcccaatgccgacttc1620

accatctccatcgccaatggtggcggcgtgtatgaccagaaggagatcgtggacccctcg1680

ttcctggagctggttcgcctgggcgtgaagtcaccagacgaccccaagattctgaacacc1740

ctgcgcgtggtggactccaccatcaaggtggatacccccaagggcccctcgtggtaccgc1800

tacaaccatgacggctacggcgaaccatcgaagaccgaactgtaccatggcgcaggtaag1860

ggtcgtttgtggcccctgttgaccggcgagcgcggcatgtacgaaatcgccgcaggcaag1920

gatgccactccctatctgaaggccatggagaatttcgccaacgagggcggcattatctcg1980

gaacaagtgtgggaggataccggtctgcccaccgactcagcctcgcccttgaattgggcc2040

cacgccgagtacgtggtgctgttcccctcgaacatcgaacacaaggtgctggacatgccc2100

gacatcgtgtacaagcgctacgtggccaagtgatgatgccgatcacctacaactgaatcc2160

catgg2165

<210>4

<211>1238

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>4

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggag120

aacctggtcgagaagtcgatcaagatcatcaagaacaaccagtcggagtacggctccttc180

atcgcctcaccctcgttccccacctaccacttctcgtggttgcgcgacggctcgttcatc240

gcctactccatggacctggtggagcaatacgccgaggccaagaagttctaccgctgggtg300

aatgaggtgatcatccgctactcgtacaaggtggacaagatcatcgagaagatcaagaac360

ggcaacaagctggagcccaatgacttcctgtacgcccgctataccctggagggctacgag420

gagaaggattcgggctggggcaatttccaactggatggctacggcacctggctgtggggc480

ctgtcggaacacatcaagatcaccggcaagaccgagctgatcaacgacttcttcaagtcc540

atcgacatcaccatcaagtacatcgacaacctgtggtactaccccaacttcgacgtgtgg600

gaggagaactccgacaagatccacacctcgaccctggcctgcctgtacggcggcctgaac660

tcgatcaacaagtacctgaacgacgacaaggtgaaggagctggccaacaagatcaagacc720

tacatcctgaccaactgcgtggtggagaactcgttcgtgaagtacgtgggctcgaactcg780

gtggactcgtcgctgatctggctggccatccccttcgaggtggtggacgtgaatgacgag840

atcttcctgaacaccatcaagcgcatcgagaaggagctgctgcacaatggcggcatgcac900

cgttaccgcaaggacacctactacggcggcggccagtggattctgctgtccgcctggatg960

ggtctgtactactgcaagtcgggcgactacaagaaggccgaggaggtgaagaagtggatc1020

gaggagcaggccgacgagaacggctacctgcccgagcaggtcccctaccacctgaacaac1080

gaggtgtactacccctactgggtgaacaagtggggcaacatcgccaagcccctgctgtgg1140

tcgcacgccatgtacctggtgctggactacgagctgaagaaggccggcgtgcagctggag1200

gactgatgatgccgatcacctacaactgaatcccatgg1238

<210>5

<211>2183

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>5

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacatc120

tccaacatcaagatcgagcgcctgaataacgtgcaggccgtgaatggccccggtgaggcc180

gacacttgggccaaagcccagaagcagggtgtgggcaccgccaacaattacacctccaag240

gtgtggttcaccatcgcagacggtggcatctccgaggtgtactaccccaccatcgacacc300

gccgacgtcaaggacatcaagttcttcgtgaccgacggcaagaccttcgtgtccgacgag360

acgaaggacaccatcaccaaggtggagaagttcaccgagaagtccctgggctacaagatc420

atcaacaccgacaaggagggccgctacaagatcaccaaggagatcttcaccgacgtgaag480

cgcaactccctggtgatcaagaccaagttcgaggccctgaagggcaacgtggacgactac540

cgcctgtacgtgatgtgcgacccccacgtgaagaaccagggcaagtacaacgagggctac600

gccgtgaaggccaacggcaatgtggccctgatcgcagagcgcgacggtatctacaccgcc660

ctgtcgtccgacatcggttggaagaagtactcgatcggctactacaaggtgaacgacatc720

gaaaccgacctgtacaagaacatgcagatgacctacaactacgactccgcccgcggcaat780

atcatcgagggcgccgagatcgacctgaagaagaaccgccagttcgagatcgtgttgtcg840

ttcggccagtcggaggacgaggccgtgaagaccaatatggagacgctgaatgacaattac900

gactcgctgaagaaggcctacatcgaccagtgggagaagtactgcgactccctgaacgac960

ttcggcggcaaggccaactcgctgtacttcaactccatgatgatcctgaaggcctccgag1020

gacaagaccaacaagggcgcctacatcgcatcgctgtcgatcccctggggtgacggccag1080

gaagacgacaatatcggcggctaccacctggtttggtcccgcgacttgtaccacgtggcc1140

aatgccttcattgtggccggcgataccgactcggccaatcgcgccttggactacctggac1200

aaggtggtgaaggacaacggcatgatcccccagaacacctggatcaatggccgcccctac1260

tggaccggcattcagctggacgaacaggccgaccccatcatcctgtcataccgcctgaag1320

cgctacgacctgtacgagtcgctggtgaagcccctggccgacttcatcatgaagatcggc1380

cccaagaccggccaggaaagatgggaggaaattggtggctactcacccgccaccctggca1440

tcggaagttgccggcctgacctgtgcagcctacatcgccgagcagaacaaggacttcgag1500

tccgccaagaagtaccaggagaaggccgacaactggcagcgcctgatcgacaatctgacc1560

tacaccgaaaagggccccttgggcgacggccactactacatccgcattgccggcctgccc1620

gatcccaatgccgacttcatgatctcgatcgccaatggtggcggtgtgtacgaccaaaag1680

gagatcgtggacccctcgttcctggagctggtgcgcctgggtgttaagtccgccgacgac1740

cccaagatcctgaacaccctgaaggtggtggacgagactatcaaggtggacacccccaag1800

ggcccctcgtggtatcgttataatcacgacggctacggcgagatgtcgaagaccgaactg1860

taccacggcaccggcaagggccgtctgtggcccctgttgaccggtgaaagaggtatgtat1920

gagatcgccgccggtaaggacgccacctcgtatgtgaaggccatggagaacttcgccaat1980

gagtccggcatcatctcggaacaggtgtgggaagataccggcctgcccactgactccgcc2040

tcacccctgaattgggcccacgccgagtacgtgatcctgttcgcctccaatatcgagcac2100

aaggtgctggacatgcccgacatcgtgtacaagcgctacgcctcgaagtgatgatgccga2160

tcacctacaactgaatcccatgg2183

<210>6

<211>2183

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>6

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactccccctcatac120

gtgaaggtggagcatctggataagaccgaggcctcccagggtcccggcgaacgtgatacc180

tgggccaccgcccaaaagcagggtatcggcaccgccaataatgacgtttcgaaggtttgg240

ttcaccctggcccagggcgccctgtcggagatctactaccccaccatcgaccgcgccaac300

tcgaagttcctgaagttcatcgtgaccgacggcaagaccttcgtggccgacgaaaccacc360

gacaccgtgtcgaaggtcgagaagatcaacaaccgctcgctggcctaccgcctggtgaat420

atcgacaagcgcggccgctacaagatcaccaaggagatcttcaccgacccccgccgcaac480

tccgtggtgatgaaggtgcgcttcgaggccctgaagggcaagatggaggactacaagctg540

tacctggtgtacgacccccacatctcgaaccagggcgccgacaatgagggctacgtggtg600

aaggccaatggcgagtacggcttcatggcctgccgcaacaacgtgtactcggccctgatg660

accgatgccaagtggggctcgtactcggtgggctacaatggcgtgaacgaccccgtgtcg720

gatctgaagaagaacaagaagatgacctacaagttcgaccgcgccaagggcaatatcatc780

gagggcatcgagatcgacctgcgcgacaagaccgagttcaagaccgtgctgtcgttcggc840

gagtcggaggaggaggccctgaagaccgccctgtcaactctgaaggactcgtacgaccgc900

atgctgggcatctacatcgccgagtggaacaagtactgcgacggcctgaagaacttcggc960

ggcgaggccgacgagctgtactacacctcgctgatgttcctgaaggcctccgaggacaag1020

accaacaaaggcgccttcatcgcctcgctgtcgatcccctggggcgaaggtcagggcgac1080

gaaaataagggcggctaccacctggtgtgggcccgtgatctgtatcacatcgccaatgcc1140

ttcatcgccgccaaggacatcgactcggccaatcgcgccctggacttcctggccatggtg1200

gtggagaagaatggcttcatgccgcagaacacctggatcaacggcgacccctactggaac1260

ggcatccagatggacgagcaggccgaccccatcatcctggcctaccacctgaagcgctac1320

gacctgtacgagaagctggtgaagcccctggccgacttcatcgtgagagtgggtcccaag1380

actggccaagaacgttgggaagaagccggtggttattcgccagccaccatggcagcagag1440

gttgccggcctggtttgcgccgccgacatcgccaagcagaataaggatatggagcgcgcc1500

aagaagtacctggagacggccgacaagtggcaggagctgatcgacaagctgacctacacc1560

accaagggcccctacggtaatggccagtactatatccgcatcgccggcctgcccgatccc1620

gacgccgatttcctgatctccatcgcaaatggcggcggcgtgtatgaccaaaaggagatc1680

gtggacccctcgttcctggagctggtgcgcctgggcgtgaaggcctacgacgatcccaag1740

atcctgaataccatctcggtggtggactcgctgctgaaggtgaacacccccaagggcccc1800

tcgtggtaccgctacaaccacgacggttacggtgaaccagccaagggcgaactgtatcat1860

ggtaagggcaagggtcgcctgtggccactgttaaccggcgagcgcggtatgtacgagatc1920

gccgccggcaagaaggccgacgactacctggagtacatgcgcaatttcgccaacgagggc1980

ttcgtgctgtcagagcaaatctgggaggacaccggcttgcccaccgattcggcctccccc2040

ctgaattgggcacacgccgagtatgtggtgctgttcgcctccaatatcgagggcaaggtg2100

gtggacatgccccagatcgtgtacaagcgctacgtgctgggcgagcgctgatgatgccga2160

tcacctacaactgaatcccatgg2183

<210>7

<211>2057

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>7

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggtg120

cgctacatccccatgggcaacggcaagatcctggtgtccttcaacaacgactacaacctg180

accgacttctacttctcgaaggacatggccgagaaccactccgccggcaagcccttccgc240

tacggcgtgtcgatcaacgacaagttcacctggatcaacgcctcgaacatcgtgtcgaag300

gactactacgaccacaccatgatcggcatcgtgaagtacaacatcaacgacgtgtcgttc360

gaggacgacaacttcgtggacatctacgaggacgtgtacgcccgcaagatcaagatcacc420

aacaagcgcaaggagaagatcaacgtgaagctgttcttccaccagaacttctccatctac480

ggcaacaacatcggcgacaccggcttctactaccccgacaccaacgccatcgtgcactac540

aagggccgccgctacttcatcatctcgaccaccgacggcaagaactcgttcgaccagtac600

gccatcggcatcaaggacttcaacggcatggccggcacctggaaggacgccgaggacaat660

aatttgtcgatgggccccatcgccatcggctcggtggactccaccattcgtcactcgatc720

gacatcgatcccgagtcgcagaaggagctgtactactacatcgcctgcgcccgcgacttg780

gacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaatctggaccgcatgatgaag840

cgcaccgagaatttctgggagctgtgggtgtcgaagtcgcccctgaatctgaccgccgag900

ctgaacgagatgtacaagaagtcgctgttcatcatccgctcgcacatcaatgagaagggc960

gccgtgatggcctcctcggattcggatatcctgcgctcgaatatggactcgtactactac1020

tcatggccccgcgacgccggctacgcagccatctcaatgatcgtgtccgagcactcggac1080

cccgccaagctgttcttcgacttctgcatcaacaccatctccaaggacggctacttctac1140

cacaagtacaaccccgacggcaagattgcctcgtcgtggctgccctatatcatggacggc1200

aagcgcatcctgcccatccaggaggacgagtcagccatcgtgatcatcgccgcctggtac1260

tactactcgaccaacaatgacatcgagtacatctcctacctgtacgagcgcctgatcaag1320

cgcgtggccgagttcctgtacaacttcacctacgacaacggtctgcccaaggagtcattc1380

gacctgtgggaggagcgcttcggcatccacacctacaccgtggcctcggtgtacatcgcc1440

ctgatctatgccgccaatttcgccgagatcttcaacgagacggacctggcccgcaagtac1500

aagtccaaggccgacaagatgctggagtcgttcgagaagatgttctactcggacgacctg1560

ggctactacgcccgccgcatctacaacggcgacgtggacttcgtgctggactcatcggtg1620

ctgtggctggtgatcttcggcatcaagaagcccgatgacccacgcatcgtgtccaccgtg1680

aaggccatcgagaagaagctgtgggtgcccggcatcggtggtatcgccagatacgagggc1740

gactactaccagcgcatctcgggcaagaatatccccggcaacccctggatcatcactacc1800

ctgtggctggccgactattacatcatggccggcaataccggccgcgccctggagctgatc1860

aactgggtggttcagcactcagaggagtcgggcatcctgtcggagcagatcaatcccgat1920

aatggcgagcccatctcggtgtcccccctgatctggtcgcactcgcagctggtgctgact1980

ctgaagcgctacaaggacgccatcaagaacaagggcatccagtgatgatgccgatcacct2040

acaactgaatcccatgg2057

<210>8

<211>2567

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>8

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaattcg120

tacaagtcgtccgtggtgcccgtgaagaagaatatctacttcaccggcaacctgtcccgc180

gacttcgacggcaatatcatcggcatcaacaatcacgcctcgccctggggcgccaacaac240

gtgatcaagaagctgtacctggcctacaacgaaaccgacctgttcatcggcgtgtacgag300

aacatctcctacaactcgctgatgatcttcatcaccaacgtgaccaacgacatctacggc360

acctccaacatctcgaatatgaacacctggaaccgcgacatcaccttcgagggcaccatg420

aactacttctcggccgtgtacttcgacggcaacaacatcaatcccgccggctacggcacc480

tacgccatcatgtcgggcaagaattcgaccccactggccaagcccatcaactccaccttc540

gccttcttccccggcaataacaccaccgagatcgccatccccttctcacagatgttccag600

cacggcttcaatggcaatctgtcgttcggtatttcggccttcgtggtgggcggctcgggc660

ccatgggtgggctcaggcatcccctatcaccagaaaggcatctacaatgacggcaatcag720

gcctccttcctgatcaacgacaccatcgagatcaacatccccggcatccacgtgtcgccc780

ctgccctcgtacgtggactacccctcctacctgctgatgtccaactggaagaacaatgac840

ttctggatcgccaccggcatccccgactcgtacctgggcaactactcctacgtgcacctg900

tcgatgcagaccgtgaacatcgagaacaagatcctgcccctgaagttctacttcgacatc960

ttcggccactccatctcggcccgcctgacccccaacaacaccatcaacgtgcgcaccaac1020

aactcggagttcgagctgatcgaccccccctacatgaatcagaccgacgtgatccagaag1080

tccaagtccaccatctactcgtacatctccatgccctacatcaagtacaacgcctccggc1140

aaccagatctcgctgtacaagtacaatctgaccctgttcttcgtgaactcctcgtacaat1200

atcaacaacgactcgggcatgctgaatatctcgatcgtgtcgggccccggcacctcgatc1260

atcggcctgtcgaccaactcgacctacatgaacctggactacatcaaggacgtgaaccac1320

gccaacatcatgaagtggctgtccaagtcgaaggtgtcgatctccggccgctacttgatc1380

gagtacaacatgtcgcagctgctggtgaaggacgaccagaaccccttcaccggcgaaatc1440

gtggcctccccctcccccgtttacttctataattgggtgcgcgacgcctcgttctccgcc1500

atctcactgcaggactcaggccacattcgctcagccatgaagtattgggatttcatggcc1560

ggcgtgcagggcgtggacacctataatggcacctggcagacccgcttcaatttctggaat1620

ggctccgtggccggcttcgtgtatcccgagttcgactcggtgggcctgttcgagatcggc1680

atctacaacctgttccaggtgacccacaatatctccgtgatccagaagttcatgcccaac1740

atcctggcctcgctggagttccaggagaagtccatcaagaagtacggcttcatcgccgag1800

gaccactcgatctgggagatggagtacggctactggttctggacccaggccatcaattat1860

ctgggcattcgcgacatctcaagaatgcccatgatccagaatcacaatgccgttcccgtg1920

ccgcccggccccgtgccccccggtaacatgaataccgccatgatcgcccacaagctgaag1980

tcgaacatcatcaagtacttctacatggacaacatcttcgcccagtacctggtgcccgtc2040

accaaccagtacggcgacaacaactacacctacttcatggccaacaataccccggactcg2100

tcgcagatcctgcccattgccatgggcttcatcaacccctcgtcccccatggccacctcc2160

atcgtgcacaacatctacatgatcctgtggaactaccgcgtgggtggcctgccccgctac2220

tacaatgacctgtaccactacaccgaatacggcggctaccacgaatcatcaggtccctcg2280

cccccctggatcatcaccactctgttcctggccctgtacgacgagaagaccggtaatatg2340

accggcgccctgaatctgatgaagtggtcgtactcgcactcgcagtcgtggctgctgccc2400

gaggccgtggaccccaatttcggctcggtgattgcatcaacctcaccactgacctggtca2460

tcagccatgtatattatcgtttcgctgaattaccgcgccatgccccccgccccgctgccc2520

ccaggccccccctgatgatgccgatcacctacaactgaatcccatgg2567

<210>9

<211>2316

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>9

atgcgcacgttgaaaaccttcgccctggcctcggccgcgaccctgatcgccaccgccgcc60

caggccgcgcctacgacctgggcctattcggccaagaccggtgtcggcgcctcctacgag120

gcctatgtcgacggcgcctacaaggccggcggcaagaccggggcggtgtcgaaggtctgg180

ttctcgatcgccgacggggtcctcaccgagacgatgtacggcctgatccatgaggcgcag240

atcaagcagatgcgcgtcgccgtcgagacggcgagcggcctggccattgagggggcggat300

acgacctccaagaccgagtatctgcatgtggacgccgccggccggccgctgtctccggcc360

tacaagatcaccacgaccgatcgccaaggccggtttgtcatcgaaaagcgcatcttcacc420

gatcccgaccgcaatgcgctgttcgtgcgcgtgacggtgacggccctgaaaggcgcggtc480

acgccgaccctgctgctggagccgcacatggccaacaccggcggtggcgatgtgggcgcg540

gcctcggcctcggcgctcaccgcccacgagggcaaggcgttcctcagcctgaaggccagc600

aagccctttgcgaaagcctcggccagcgttctgaaggatggcgatgctctggcggctttg660

aaggcgaccacgacttcggccaagggcgcgatcgtgctggccggagagctgcccaaggtc720

gccaagtccgagacctttgacgtggtgatcggcttcggcgctgacgccaaggccgccgac780

cggaccgccgccgcgacgctgaagacgggctacgccgaggtcctggcccgctacaacggc840

gagggcgcgcatgtgggctgggaggactatctggcctcgctgaacgaactgccgcgactg900

cgcgacgcgtccgaggacggcggcaagcttctccaggccagcgctctgatgctcaaggtg960

caggaagaccgcacctatgccggcgccctgattgcctcgctgtccaacccctggggcgac1020

acggtcgacgcgaccaagtcctcgaccggctacaaggccgtctggccgcgcgacttctat1080

cagtgcgccatggccttggcggccctgggcgacaaggagacgccgctggcggccttccac1140

tatctgcccacggtccaggtcgggcccaagacgccgggcaacaagggcgacggcggctgg1200

ttcctgcagaagtcgcacgtcgacggcacgcccgagtgggtcggggtccagctcgaccag1260

acggccatgccgatcatgctgggctggaagctctggacgtggggctggctgccggacgcc1320

gagctgaaggcgttctacggcaagatgctgaagccggcggccgacttcctggtcaagggc1380

ggcaaggtcaatctggactggaacaccgcgaccatcactccgcccttcacccagcaggag1440

cgctgggaagaacagggcggccactcgccctcgacgaccgccgccgtcattgcaggcctg1500

gtggtcgccggcgacatcgccgaggccgccggcgacgccggctcggccgaactctatcgc1560

aagaccgccgacgactgcgccggcaagctcgaggcccggatggtcacgacgaaggggacc1620

ttcggcgacggccactattatctgcgtctcaacagtgaccaggacccgaacaacaagagc1680

ccggtcgaggcgcgtaacggccaggctccggtggccgaggacaagatgctggacgcgggc1740

ttcctggagctggtgcgctatggcgttcgccgcgccgatgatccggcgatcctggccagc1800

ctgccggagattgatgacgaggccctcgaagacctctaccgcgttcgctacagcttcacg1860

ttccctggcgtggagggcagcttccccggctggcgccgctacggcgtcgacggctacggc1920

gaggacaccaagaccggcgccaactacggcgccgacaaccagatgcgtcccggccaaagg1980

ggccgggtgtggccgatcttcaccggcgagcgtgggcactacgagctggccgtggcgggc2040

ctctcgggcaagcccgatcccaccgccgtgcagaagatccgcgatacctacgtcaaggcg2100

atggagttgttcgccaacgagggactgatgatccccgagcaggtctgggacggcgtcggg2160

accgacagcgctcatggctatgtccggggcgaggggaccgattcggccacgcccctggcc2220

tggagccacgcggagtacgtcaagctgctgcgatcggtcagcgacgggcaggtctgggat2280

cactatgcgcccgtaaaggcgcggtacgcgcgctag2316

<210>10

<211>1539

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>10

atgaaacaacaaaaacggctttacgcccgattgctgacgctgttatttgcgctcatcttc60

ttgctgcctcattctgcagcagcggcggcaaatcttaatgggacgctgatgcagtatttt120

gaatggtacatgcccaatgacggccaacattggaagcgtttgcaaaacgactcggcatat180

ttggctgaacacggtattactgccgtctggattcccccggcatataagggaacgagccaa240

gcggatgtgggctacggtgcttacgacctttatgatttaggggagtttcatcaaaaaggg300

acggttcggacaaagtacggcacaaaaggagagctgcaatctgcgatcaaaagtcttcat360

tcccgcgacattaacgtttacggggatgtggtcatcaaccacaaaggcggcgctgatgcg420

accgaagatgtaaccgcggttgaagtcgatcccgctgaccgcaaccgcgtaatttcagga480

gaacacctaattaaagcctggacacattttcattttccggggcgcggcagcacatacagc540

gattttaaatggcattggtaccattttgacggaaccgattgggacgagtcccgaaagctg600

aaccgcatctataagtttcaaggaaaggcttgggattgggaagtttccaatgaaaacggc660

aactatgattatttgatgtatgccgacatcgattatgaccatcctgatgtcgcagcagaa720

attaagagatggggcacttggtatgccaatgaactgcaattggacggtttccgtcttgat780

gctgtcaaacacattaaattttcttttttgcgggattgggttaatcatgtcagggaaaaa840

acggggaaggaaatgtttacggtagctgaatattggcagaatgacttgggcgcgctggaa900

aactatttgaacaaaacaaattttaatcattcagtgtttgacgtgccgcttcattatcag960

ttccatgctgcatcgacacagggaggcggctatgatatgaggaaattgctgaacggtacg1020

gtcgtttccaagcatccgttgaaatcggttacatttgtcgataaccatgatacacagccg1080

gggcaatcgcttgagtcgactgtccaaacatggtttaagccgcttgcttacgcttttatt1140

ctcacaagggaatctggataccctcaggttttctacggggatatgtacgggacgaaagga1200

gactcccagcgcgaaattcctgccttgaaacacaaaattgaaccgatcttaaaagcgaga1260

aaacagtatgcgtacggagcacagcatgattatttcgaccaccatgacattgtcggctgg1320

acaagggaaggcgacagctcggttgcaaattcaggtttggcggcattaataacagacgga1380

cccggtggggcaaagcgaatgtatgtcggccggcaaaacgccggtgagacatggcatgac1440

attaccggaaaccgttcggagccggttgtcatcaattcggaaggctggggagagtttcac1500

gtaaacggcgggtcggtttcaatttatgttcaaagatag1539

<210>11

<211>1359

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>11

gagtcgaccctgcgcgagctggccgcccagaacggcggccgccacttcggcaccgccatc60

gcctactcgcccctgaactcggacgcccagtaccgcaacatcgccgccacccagttctcg120

gccatcacccacgagaacgagatgaagtgggagtcgctggagccccagcgcggccagtac180

aactggtcgcaggccgacaacatcatcaacttcgccaaggccaacaaccagatcgtgcgc240

ggccacaccctggtgtggcactcgcagctgccctcgtggctgaacaacggcggcttctcg300

ggctcgcagctgcgctcgatcatggagaaccacatcgaggtggtggccggccgctaccgc360

ggcgacgtgtacgcctgggacgtggtgaacgaggccttcaacgaggacggcaccctgcgc420

gactcgatctggtaccgcggcatgggccgcgactacatcgcccacgccttccgcaaggcc480

cacgaggtggaccccgacgccaagctgtacatcaacgactacaacatcgagggcatcaac540

gccaagtcgaacggcctgtacaacctggtggtggacctgctgcgcgacggcgtgcccatc600

cacggcatcggcatccagtcgcacctgatcgtgggccaggtgccctcgaccttccagcag660

aacatccagcgcttcgccgacctgggcctggacgtggccatcaccgagctggacatccgc720

atgcagatgcccgccgaccagtacaagctgcagcagcaggcccgcgactacgaggccgtg780

gtgaacgcctgcctggccgtgacccgctgcatcggcatcaccgtgtggggcatcgacgac840

gagcgctcgtgggtgccctacaccttccccggcgagggcgcccccctgctgtacgacggc900

cagtacaaccgcaagcccgcctggtacgccgtgtacgaggccctgggcggcgactcgtcg960

ggcggcggccccggcgagcccggcggccccggcggccccggcgagcccggcggccccggc1020

ggccccggcgagcccggcggccccggcgacggcacctgcgccgtgaactacaccgtggtg1080

aacgactggggccacggcatgcagggcgccatcaccgtgtcgaacaccggctcgtcgccc1140

atcaacaactggaccctgcagttctcgttctcgggcgtgaacatctcgaacggctggaac1200

ggcgagtggtcgcagtcgggctcgcagatcaccgtgcgcgcccccgcctggaactcgacc1260

ctgcagcccggccagtcggtggagctgggcttcgtggccgacaagaccggcaacgtgtcg1320

cccccctcgcagttcaccctgaacggcgccacctgctcg1359

<210>12

<211>1230

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>12

aacgactcgcccttctacgtgaaccccaacatgtcgtcggccgagtgggtgcgcaacaac60

cccaacgacccccgcacccccgtgatccgcgaccgcatcgcctcggtgccccagggcacc120

tggttcgcccaccacaaccccggccagatcaccggccaggtggacgccctgatgtcggcc180

gcccaggccgccggcaagatccccatcctggtggtgtacaacgcccccggccgcgactgc240

ggcaaccactcgtcgggcggcgccccctcgcactcggcctaccgctcgtggatcgacgag300

ttcgccgccggcctgaagaaccgccccgcctacatcatcgtggagcccgacctgatctcg360

ctgatgtcgtcgtgcatgcagcacgtgcagcaggaggtgctggagaccatggcctacgcc420

ggcaaggccctgaaggccggctcgtcgcaggcccgcatctacttcgacgccggccactcg480

gcctggcactcgcccgcccagatggcctcgtggctgcagcaggccgacatctcgaactcg540

gcccacggcatcgccaccaacacctcgaactaccgctggaccgccgacgaggtggcctac600

gccaaggccgtgctgtcggccatcggcaacccctcgctgcgcgccgtgatcgacacctcg660

cgcaacggcaacggccccgccggcaacgagtggtgcgacccctcgggccgcgccatcggc720

accccctcgaccaccaacaccggcgaccccatgatcgacgccttcctgtggatcaagctg780

cccggcgaggccgacggctgcatcgccggcgccggccagttcgtgccccaggccgcctac840

gagatggccatcgccgccggcggcaccaaccccaaccccaaccccaaccccacccccacc900

cccacccccacccccacccccccccccggctcgtcgggcgcctgcaccgccacctacacc960

atcgccaacgagtggaacgacggcttccaggccaccgtgaccgtgaccgccaaccagaac1020

atcaccggctggaccgtgacctggaccttcaccgacggccagaccatcaccaacgcctgg1080

aacgccgacgtgtcgacctcgggctcgtcggtgaccgcccgcaacgtgggccacaacggc1140

accctgtcgcagggcgcctcgaccgagttcggcttcgtgggctcgaagggcaactcgaac1200

tcggtgcccaccctgacctgcgccgcctcg1230

<210>13

<211>2070

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>13

gccggcacctacaactacggcgaggccctgcagaagtcgatcatgttctacgagttccag60

cgctcgggcgacctgcccgccgacaagcgcgacaactggcgcgacgactcgggcatgaag120

gacggctcggacgtgggcgtggacctgaccggcggctggtacgacgccggcgaccacgtg180

aagttcaacctgcccatgtcgtacacctcggccatgctggcctggtcgctgtacgaggac240

aaggacgcctacgacaagtcgggccagaccaagtacatcatggacggcatcaagtgggcc300

aacgactacttcatcaagtgcaaccccacccccggcgtgtactactaccaggtgggcgac360

ggcggcaaggaccactcgtggtggggccccgccgaggtgatgcagatggagcgcccctcg420

ttcaaggtggacgcctcgaagcccggctcggccgtgtgcgcctcgaccgccgcctcgctg480

gcctcggccgccgtggtgttcaagtcgtcggaccccacctacgccgagaagtgcatctcg540

cacgccaagaacctgttcgacatggccgacaaggccaagtcggacgccggctacaccgcc600

gcctcgggctactactcgtcgtcgtcgttctacgacgacctgtcgtgggccgccgtgtgg660

ctgtacctggccaccaacgactcgacctacctggacaaggccgagtcgtacgtgcccaac720

tggggcaaggagcagcagaccgacatcatcgcctacaagtggggccagtgctgggacgac780

gtgcactacggcgccgagctgctgctggccaagctgaccaacaagcagctgtacaaggac840

tcgatcgagatgaacctggacttctggaccaccggcgtgaacggcacccgcgtgtcgtac900

acccccaagggcctggcctggctgttccagtggggctcgctgcgccacgccaccacccag960

gccttcctggccggcgtgtacgccgagtgggagggctgcaccccctcgaaggtgtcggtg1020

tacaaggacttcctgaagtcgcagatcgactacgccctgggctcgaccggccgctcgttc1080

gtggtgggctacggcgtgaaccccccccagcacccccaccaccgcaccgcccacggctcg1140

tggaccgaccagatgacctcgcccacctaccaccgccacaccatctacggcgccctggtg1200

ggcggccccgacaacgccgacggctacaccgacgagatcaacaactacgtgaacaacgag1260

atcgcctgcgactacaacgccggcttcaccggcgccctggccaagatgtacaagcactcg1320

ggcggcgaccccatccccaacttcaaggccatcgagaagatcaccaacgacgaggtgatc1380

atcaaggccggcctgaactcgaccggccccaactacaccgagatcaaggccgtggtgtac1440

aaccagaccggctggcccgcccgcgtgaccgacaagatctcgttcaagtacttcatggac1500

ctgtcggagatcgtggccgccggcatcgaccccctgtcgctggtgacctcgtcgaactac1560

tcggagggcaagaacaccaaggtgtcgggcgtgctgccctgggacgtgtcgaacaacgtg1620

tactacgtgaacgtggacctgaccggcgagaacatctaccccggcggccagtcggcctgc1680

cgccgcgaggtgcagttccgcatcgccgccccccagggcaccacctactggaaccccaag1740

aacgacttctcgtacgacggcctgcccaccacctcgaccgtgaacaccgtgaccaacatc1800

cccgtgtacgacaacggcgtgaaggtgttcggcaacgagcccgccggcggctcggagaac1860

cccgaccccgagatcctgtacggcgacgtgaactcggacaagaacgtggacgccctggac1920

ttcgccgccctgaagaagtacctgctgggcggcacctcgtcgatcgacgtgaaggccgcc1980

gacacctacaaggacggcaacatcgacgccatcgacatggccaccctgaagaagtacctg2040

ctgggcaccatcacccagctgccccagggc2070

<210>14

<211>519

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>14

metlyspheglyvalleupheservalphealaalailevalserala

151015

leuproleuglngluglyproleuasnlysargalatyrproserphe

202530

glualatyrserasntyrlysvalaspargthraspleugluthrphe

354045

leuasplysglnlysgluvalserleutyrtyrleuleuglnasnile

505560

alatyrprogluglyglnpheasnasnglyvalproglythrvalile

65707580

alaserproserthrserasnproasptyrtyrtyrglntrpthrarg

859095

aspseralailethrpheleuthrvalleusergluleugluaspasn

100105110

asnpheasnthrthrleualalysalavalglutyrtyrileasnthr

115120125

sertyrasnleuglnargthrserasnproserglyserpheaspasp

130135140

gluasnhislysglyleuglygluprolyspheasnthraspglyser

145150155160

alatyrthrglyalatrpglyargproglnasnaspglyproalaleu

165170175

argalatyralaileserargtyrleuasnaspvalasnserleuasn

180185190

gluglylysleuvalleuthraspserglyaspileasnpheserser

195200205

thrgluaspiletyrlysasnileilelysproaspleuglutyrval

210215220

ileglytyrtrpaspserthrglypheaspleutrpglugluasngln

225230235240

glyarghisphephethrserleuvalglnglnlysalaleualatyr

245250255

alavalaspilealalysserpheaspaspglyaspphealaasnthr

260265270

leuserserthralaserthrleuglusertyrleuserglyserasp

275280285

glyglyphevalasnthraspvalasnhisilevalgluasnproasp

290295300

leuleuglnglnasnserargglnglyleuaspseralathrtyrile

305310315320

glyproleuleuthrhisaspileglygluserserserthrprophe

325330335

aspvalaspasnglutyrvalleuglnsertyrtyrleuleuleuglu

340345350

aspasnlysaspargtyrservalasnseralatyrseralaglyala

355360365

alaileglyargtyrprogluaspvaltyrasnglyaspglyserser

370375380

gluglyasnprotrppheleualathralatyralaalaglnvalpro

385390395400

tyrlysleualatyraspalalysseralaserasnaspilethrile

405410415

asnlysileasntyraspphepheasnlystyrilevalaspleuser

420425430

thrileasnseralatyrglnserseraspservalthrilelysser

435440445

glyseraspglupheasnthrvalalaaspasnleuvalthrphegly

450455460

aspserpheleuglnvalileleuasphisileasnaspaspglyser

465470475480

leuasngluglnleuasnargtyrthrglytyrserthrglyalatyr

485490495

serleuthrtrpserserglyalaleuleuglualaileargleuarg

500505510

asnlysvallysalaleuala

515

<210>15

<211>639

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>15

metserpheargserleuleualaleuserglyleuvalcysthrgly

151015

leualaasnvalileserlysargalathrtrpaspsertrpleuser

202530

asnglualathrvalalaargthralaileleuasnasnileglyala

354045

aspglyalatrpvalserglyalaaspserglyilevalvalalaser

505560

proserthraspasnproasptyrphetyrthrtrpthrargaspser

65707580

glyleuvalleulysthrleuvalaspleupheargasnglyaspthr

859095

serleuleuserthrilegluasntyrileseralaglnalaileval

100105110

glnglyileserasnproserglyaspleuserserglyalaglyleu

115120125

glygluprolyspheasnvalaspgluthralatyrthrglysertrp

130135140

glyargproglnargaspglyproalaleuargalathralametile

145150155160

glypheglyglntrpleuleuaspasnglytyrthrserthralathr

165170175

aspilevaltrpproleuvalargasnaspleusertyrvalalagln

180185190

tyrtrpasnglnthrglytyraspleutrpgluvalasnglyserser

195200205

phephethrilealavalglnhisargalaleuvalgluglyserala

210215220

phealathralavalglysersercyssertrpcysaspserglnala

225230235240

progluileleucystyrleuglnserphetrpthrglyserpheile

245250255

leualaasnpheaspserserargseralalysaspalaasnthrleu

260265270

leuleuglyserilehisthrpheaspproglualaalacysaspasp

275280285

serthrpheglnprocysserproargalaleualaasnhislysglu

290295300

valvalaspserpheargseriletyrthrleuasnaspglyleuser

305310315320

aspserglualavalalavalglyargtyrprogluaspthrtyrtyr

325330335

asnglyasnprotrppheleucysthrleualaalaalagluglnleu

340345350

tyraspalaleutyrglntrpasplysglnglyserleugluvalthr

355360365

aspvalserleuaspphephelysalaleutyrseraspalathrgly

370375380

thrtyrserserserserserthrtyrserserilevalaspalaval

385390395400

lysthrphealaaspglyphevalserilevalgluthrhisalaala

405410415

serasnglysermetsergluglntyrasplysseraspglyglugln

420425430

leuseralaargaspleuthrtrpsertyralaalaleuleuthrala

435440445

asnasnargargasnvalvalproseralasertrpglygluthrser

450455460

alaserservalproglythrcysalaalathrseralaileglythr

465470475480

tyrserservalthrvalthrsertrpproserilevalalathrgly

485490495

glythrthrthrthralathrprothrglyserglyservalthrser

500505510

thrserlysthrthralathralaserlysthrserthrserthrser

515520525

serthrsercysthrthrprothralavalalavalthrpheaspleu

530535540

thralathrthrthrtyrglygluasniletyrleuvalglyserile

545550555560

serglnleuglyasptrpgluthrseraspglyilealaleuserala

565570575

asplystyrthrserseraspproleutrptyrvalthrvalthrleu

580585590

proalaglygluserpheglutyrlyspheileargilegluserasp

595600605

aspservalglutrpgluseraspproasnargglutyrthrvalpro

610615620

glnalacysglythrserthralathrvalthraspthrtrparg

625630635

<210>16

<211>702

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>16

metserarglysleuilelystyrleuproleuleuvalleualaser

151015

servalleuserglycysserasnasnvalserserilelysileasp

202530

argpheasnasnileseralavalasnglyproglyglugluaspthr

354045

trpalaseralaglnlysglnglyvalglythralaasnasntyrval

505560

serlysvaltrpphethrleualaasnglyalailesergluvaltyr

65707580

tyrprothrileaspthralaaspvallysgluilelyspheileval

859095

thraspglylysserphevalseraspgluthrlysaspthrileser

100105110

lysvalglulysphethrasplysserleuglytyrlysleuvalasn

115120125

thrasplyslysglyargtyrargilethrlysgluilephethrasp

130135140

vallysargasnserleuilemetlysalalyspheglualaleuglu

145150155160

glyserilehisasptyrlysleutyrleualatyraspprohisile

165170175

lysasnglnglysertyrasngluglytyrvalilelysalaasnasn

180185190

asnglumetleumetalalysargaspasnvaltyrthralaleuser

195200205

serasnileglytrplysglytyrserileglytyrtyrlysvalasn

210215220

aspilemetthraspleuaspgluasnlysglnmetthrlyshistyr

225230235240

aspseralaargglyasnileilegluglyalagluileaspleulys

245250255

lysasnserglnphegluilevalleuserpheglyasnsergluasp

260265270

glualavallysalaserilegluthrleusergluasntyraspser

275280285

leulysseralatyrileaspglutrpglulystyrcysasnserleu

290295300

asnasnpheasnglylysalaasnserleutyrtyrasnsermetmet

305310315320

ileleulysalasergluasplysthrasnlysglyalatyrileala

325330335

serleuserileprotrpglyaspglyglnglyaspaspasnthrgly

340345350

glytyrhisleuvaltrpserargaspleutyrhisvalalaasnala

355360365

pheilealaalaglyaspvalaspseralaasnargserleuasptyr

370375380

leualalysvalvallysaspasnglymetileproglnasnthrtrp

385390395400

ileserglylysprotyrtrpthrglyileglnleuaspgluglnala

405410415

aspproileileleusertyrargleuargargtyraspleutyrasp

420425430

serleuvallysproleualaasppheileilelysmetglyprolys

435440445

thrglyglngluargtrpglugluileglyglytyrserproalathr

450455460

metalaalagluvalalaglyleuthrcysalaalatyrilealaglu

465470475480

glnasnlysasptyrgluseralaglnlystyrglnglulysalaasp

485490495

asntrpglnlysleuileaspasnleuthrtyrthrgluhisglypro

500505510

leugluasnglyglntyrtyrileargilealaglyleuproasppro

515520525

asnalaaspphethrileserilealaasnglyglyglyvaltyrasp

530535540

glnlysgluilevalaspproserpheleugluleuvalargleugly

545550555560

vallysserproaspaspprolysileleuasnthrleuargvalval

565570575

aspserthrilelysvalaspthrprolysglyprosertrptyrarg

580585590

tyrasnhisaspglytyrglygluproserlysthrgluleutyrhis

595600605

glyalaglylysglyargleutrpproleuleuthrglygluarggly

610615620

mettyrgluilealaalaglylysaspalathrprotyrleulysala

625630635640

metgluasnphealaasngluglyglyileilesergluglnvaltrp

645650655

gluaspthrglyleuprothraspseralaserproleuasntrpala

660665670

hisalaglutyrvalvalleupheproserasnilegluhislysval

675680685

leuaspmetproaspilevaltyrlysargtyrvalalalys

690695700

<210>17

<211>363

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>17

metgluasnleuvalglulysserilelysileilelysasnasngln

151015

serglutyrglyserpheilealaserproserpheprothrtyrhis

202530

phesertrpleuargaspglyserpheilealatyrsermetaspleu

354045

valgluglntyralaglualalyslysphetyrargtrpvalasnglu

505560

valileileargtyrsertyrlysvalasplysileileglulysile

65707580

lysasnglyasnlysleugluproasnasppheleutyralaargtyr

859095

thrleugluglytyrgluglulysaspserglytrpglyasnphegln

100105110

leuaspglytyrglythrtrpleutrpglyleusergluhisilelys

115120125

ilethrglylysthrgluleuileasnaspphephelysserileasp

130135140

ilethrilelystyrileaspasnleutrptyrtyrproasnpheasp

145150155160

valtrpglugluasnserasplysilehisthrserthrleualacys

165170175

leutyrglyglyleuasnserileasnlystyrleuasnaspasplys

180185190

vallysgluleualaasnlysilelysthrtyrileleuthrasncys

195200205

valvalgluasnserphevallystyrvalglyserasnservalasp

210215220

serserleuiletrpleualaileprophegluvalvalaspvalasn

225230235240

aspgluilepheleuasnthrilelysargileglulysgluleuleu

245250255

hisasnglyglymethisargtyrarglysaspthrtyrtyrglygly

260265270

glyglntrpileleuleuseralatrpmetglyleutyrtyrcyslys

275280285

serglyasptyrlyslysalaglugluvallyslystrpilegluglu

290295300

glnalaaspgluasnglytyrleuprogluglnvalprotyrhisleu

305310315320

asnasngluvaltyrtyrprotyrtrpvalasnlystrpglyasnile

325330335

alalysproleuleutrpserhisalamettyrleuvalleuasptyr

340345350

gluleulyslysalaglyvalglnleugluasp

355360

<210>18

<211>710

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>18

metleuleuglualametlysleuasnarglysleuilelystyrleu

151015

provalleupheleualaserservalleuserglycysalaasnasn

202530

asnileserasnilelysilegluargleuasnasnvalglnalaval

354045

asnglyproglyglualaaspthrtrpalalysalaglnlysglngly

505560

valglythralaasnasntyrthrserlysvaltrpphethrileala

65707580

aspglyglyilesergluvaltyrtyrprothrileaspthralaasp

859095

vallysaspilelysphephevalthraspglylysthrphevalser

100105110

aspgluthrlysaspthrilethrlysvalglulysphethrglulys

115120125

serleuglytyrlysileileasnthrasplysgluglyargtyrlys

130135140

ilethrlysgluilephethraspvallysargasnserleuvalile

145150155160

lysthrlyspheglualaleulysglyasnvalaspasptyrargleu

165170175

tyrvalmetcysaspprohisvallysasnglnglylystyrasnglu

180185190

glytyralavallysalaasnglyasnvalalaleuilealagluarg

195200205

aspglyiletyrthralaleuserseraspileglytrplyslystyr

210215220

serileglytyrtyrlysvalasnaspilegluthraspleutyrlys

225230235240

asnmetglnmetthrtyrasntyraspseralaargglyasnileile

245250255

gluglyalagluileaspleulyslysasnargglnphegluileval

260265270

leuserpheglyglnsergluaspglualavallysthrasnmetglu

275280285

thrleuasnaspasntyraspserleulyslysalatyrileaspgln

290295300

trpglulystyrcysaspserleuasnasppheglyglylysalaasn

305310315320

serleutyrpheasnsermetmetileleulysalasergluasplys

325330335

thrasnlysglyalatyrilealaserleuserileprotrpglyasp

340345350

glyglngluaspaspasnileglyglytyrhisleuvaltrpserarg

355360365

aspleutyrhisvalalaasnalapheilevalalaglyaspthrasp

370375380

seralaasnargalaleuasptyrleuasplysvalvallysaspasn

385390395400

glymetileproglnasnthrtrpileasnglyargprotyrtrpthr

405410415

glyileglnleuaspgluglnalaaspproileileleusertyrarg

420425430

leulysargtyraspleutyrgluserleuvallysproleualaasp

435440445

pheilemetlysileglyprolysthrglyglngluargtrpgluglu

450455460

ileglyglytyrserproalathrleualasergluvalalaglyleu

465470475480

thrcysalaalatyrilealagluglnasnlysaspphegluserala

485490495

lyslystyrglnglulysalaaspasntrpglnargleuileaspasn

500505510

leuthrtyrthrglulysglyproleuglyaspglyhistyrtyrile

515520525

argilealaglyleuproaspproasnalaaspphemetileserile

530535540

alaasnglyglyglyvaltyraspglnlysgluilevalaspproser

545550555560

pheleugluleuvalargleuglyvallysseralaaspaspprolys

565570575

ileleuasnthrleulysvalvalaspgluthrilelysvalaspthr

580585590

prolysglyprosertrptyrargtyrasnhisaspglytyrglyglu

595600605

metserlysthrgluleutyrhisglythrglylysglyargleutrp

610615620

proleuleuthrglygluargglymettyrgluilealaalaglylys

625630635640

aspalathrsertyrvallysalametgluasnphealaasngluser

645650655

glyileilesergluglnvaltrpgluaspthrglyleuprothrasp

660665670

seralaserproleuasntrpalahisalaglutyrvalileleuphe

675680685

alaserasnilegluhislysvalleuaspmetproaspilevaltyr

690695700

lysargtyralaserlys

705710

<210>19

<211>703

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>19

metleulysargileglyileleuleuilepheilevalileglyval

151015

phevalleuserglycysseraspvalsertyrvallysvalgluhis

202530

leuasplysthrglualaserglnglyproglygluargaspthrtrp

354045

alathralaglnlysglnglyileglythralaasnasnaspvalser

505560

lysvaltrpphethrleualaglnglyalaleusergluiletyrtyr

65707580

prothrileaspargalaasnserlyspheleulyspheilevalthr

859095

aspglylysthrphevalalaaspgluthrthraspthrvalserlys

100105110

valglulysileasnasnargserleualatyrargleuvalasnile

115120125

asplysargglyargtyrlysilethrlysgluilephethrasppro

130135140

argargasnservalvalmetlysvalargpheglualaleulysgly

145150155160

lysmetgluasptyrlysleutyrleuvaltyraspprohisileser

165170175

asnglnglyalaaspasngluglytyrvalvallysalaasnglyglu

180185190

tyrglyphemetalacysargasnasnvaltyrseralaleumetthr

195200205

aspalalystrpglysertyrservalglytyrasnglyvalasnasp

210215220

provalseraspleulyslysasnlyslysmetthrtyrlyspheasp

225230235240

argalalysglyasnileilegluglyilegluileaspleuargasp

245250255

lysthrgluphelysthrvalleuserpheglygluserglugluglu

260265270

alaleulysthralaleuserthrleulysaspsertyraspargmet

275280285

leuglyiletyrilealaglutrpasnlystyrcysaspglyleulys

290295300

asnpheglyglyglualaaspgluleutyrtyrthrserleumetphe

305310315320

leulysalasergluasplysthrasnlysglyalapheilealaser

325330335

leuserileprotrpglygluglyglnglyaspgluasnlysglygly

340345350

tyrhisleuvaltrpalaargaspleutyrhisilealaasnalaphe

355360365

ilealaalalysaspileaspseralaasnargalaleuasppheleu

370375380

alametvalvalglulysasnglyphemetproglnasnthrtrpile

385390395400

asnglyaspprotyrtrpasnglyileglnmetaspgluglnalaasp

405410415

proileileleualatyrhisleulysargtyraspleutyrglulys

420425430

leuvallysproleualaasppheilevalargvalglyprolysthr

435440445

glyglngluargtrpgluglualaglyglytyrserproalathrmet

450455460

alaalagluvalalaglyleuvalcysalaalaaspilealalysgln

465470475480

asnlysaspmetgluargalalyslystyrleugluthralaasplys

485490495

trpglngluleuileasplysleuthrtyrthrthrlysglyprotyr

500505510

glyasnglyglntyrtyrileargilealaglyleuproaspproasp

515520525

alaasppheleuileserilealaasnglyglyglyvaltyraspgln

530535540

lysgluilevalaspproserpheleugluleuvalargleuglyval

545550555560

lysalatyraspaspprolysileleuasnthrileservalvalasp

565570575

serleuleulysvalasnthrprolysglyprosertrptyrargtyr

580585590

asnhisaspglytyrglygluproalalysglygluleutyrhisgly

595600605

lysglylysglyargleutrpproleuleuthrglygluargglymet

610615620

tyrgluilealaalaglylyslysalaaspasptyrleuglutyrmet

625630635640

argasnphealaasngluglyphevalleusergluglniletrpglu

645650655

aspthrglyleuprothraspseralaserproleuasntrpalahis

660665670

alaglutyrvalvalleuphealaserasnilegluglylysvalval

675680685

aspmetproglnilevaltyrlysargtyrvalleuglygluarg

690695700

<210>20

<211>636

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>20

metvalargtyrileprometglyasnglylysileleuvalserphe

151015

asnasnasptyrasnleuthraspphetyrpheserlysaspmetala

202530

gluasnhisseralaglylyspropheargtyrglyvalserileasn

354045

asplysphethrtrpileasnalaserasnilevalserlysasptyr

505560

tyrasphisthrmetileglyilevallystyrasnileasnaspval

65707580

serphegluaspaspasnphevalaspiletyrgluaspvaltyrala

859095

arglysilelysilethrasnlysarglysglulysileasnvallys

100105110

leuphephehisglnasnpheseriletyrglyasnasnileglyasp

115120125

thrglyphetyrtyrproaspthrasnalailevalhistyrlysgly

130135140

argargtyrpheileileserthrthraspglylysasnserpheasp

145150155160

glntyralaileglyilelysasppheasnglymetalaglythrtrp

165170175

lysaspalagluaspasnasnleusermetglyproilealailegly

180185190

servalaspserthrilearghisserileaspileaspprogluser

195200205

glnlysgluleutyrtyrtyrilealacysalaargaspleuaspthr

210215220

valleuargileasnargasnmetserthrglyasnleuaspargmet

225230235240

metlysargthrgluasnphetrpgluleutrpvalserlysserpro

245250255

leuasnleuthralagluleuasnglumettyrlyslysserleuphe

260265270

ileileargserhisileasnglulysglyalavalmetalaserser

275280285

aspseraspileleuargserasnmetaspsertyrtyrtyrsertrp

290295300

proargaspalaglytyralaalailesermetilevalsergluhis

305310315320

seraspproalalysleuphepheaspphecysileasnthrileser

325330335

lysaspglytyrphetyrhislystyrasnproaspglylysileala

340345350

sersertrpleuprotyrilemetaspglylysargileleuproile

355360365

glngluaspgluseralailevalileilealaalatrptyrtyrtyr

370375380

serthrasnasnaspileglutyrilesertyrleutyrgluargleu

385390395400

ilelysargvalalaglupheleutyrasnphethrtyraspasngly

405410415

leuprolysgluserpheaspleutrpglugluargpheglyilehis

420425430

thrtyrthrvalalaservaltyrilealaleuiletyralaalaasn

435440445

phealagluilepheasngluthraspleualaarglystyrlysser

450455460

lysalaasplysmetleugluserpheglulysmetphetyrserasp

465470475480

aspleuglytyrtyralaargargiletyrasnglyaspvalaspphe

485490495

valleuaspserservalleutrpleuvalilepheglyilelyslys

500505510

proaspaspproargilevalserthrvallysalaileglulyslys

515520525

leutrpvalproglyileglyglyilealaargtyrgluglyasptyr

530535540

tyrglnargileserglylysasnileproglyasnprotrpileile

545550555560

thrthrleutrpleualaasptyrtyrilemetalaglyasnthrgly

565570575

argalaleugluleuileasntrpvalvalglnhisserglugluser

580585590

glyileleusergluglnileasnproaspasnglygluproileser

595600605

valserproleuiletrpserhisserglnleuvalleuthrleulys

610615620

argtyrlysaspalailelysasnlysglyilegln

625630635

<210>21

<211>808

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>21

hisgluasnsertyrlysserservalvalprovallyslysasnile

151015

tyrphethrglyasnleuserargasppheaspglyasnileilegly

202530

ileasnasnhisalaserprotrpglyalaasnasnvalilelyslys

354045

leutyrleualatyrasngluthraspleupheileglyvaltyrglu

505560

asnilesertyrasnserleumetilepheilethrasnvalthrasn

65707580

aspiletyrglythrserasnileserasnmetasnthrtrpasnarg

859095

aspilethrphegluglythrmetasntyrpheseralavaltyrphe

100105110

aspglyasnasnileasnproalaglytyrglythrtyralailemet

115120125

serglylysasnserthrproleualalysproileasnserthrphe

130135140

alaphepheproglyasnasnthrthrgluilealailepropheser

145150155160

glnmetpheglnhisglypheasnglyasnleuserpheglyileser

165170175

alaphevalvalglyglyserglyprotrpvalglyserglyilepro

180185190

tyrhisglnlysglyiletyrasnaspglyasnglnalaserpheleu

195200205

ileasnaspthrilegluileasnileproglyilehisvalserpro

210215220

leuprosertyrvalasptyrprosertyrleuleumetserasntrp

225230235240

lysasnasnaspphetrpilealathrglyileproaspsertyrleu

245250255

glyasntyrsertyrvalhisleusermetglnthrvalasnileglu

260265270

asnlysileleuproleulysphetyrpheaspilepheglyhisser

275280285

ileseralaargleuthrproasnasnthrileasnvalargthrasn

290295300

asnsergluphegluleuileaspproprotyrmetasnglnthrasp

305310315320

valileglnlysserlysserthriletyrsertyrilesermetpro

325330335

tyrilelystyrasnalaserglyasnglnileserleutyrlystyr

340345350

asnleuthrleuphephevalasnsersertyrasnileasnasnasp

355360365

serglymetleuasnileserilevalserglyproglythrserile

370375380

ileglyleuserthrasnserthrtyrmetasnleuasptyrilelys

385390395400

aspvalasnhisalaasnilemetlystrpleuserlysserlysval

405410415

serileserglyargtyrleuileglutyrasnmetserglnleuleu

420425430

vallysaspaspglnasnprophethrglygluilevalalaserpro

435440445

serprovaltyrphetyrasntrpvalargaspalaserpheserala

450455460

ileserleuglnaspserglyhisileargseralametlystyrtrp

465470475480

aspphemetalaglyvalglnglyvalaspthrtyrasnglythrtrp

485490495

glnthrargpheasnphetrpasnglyservalalaglyphevaltyr

500505510

proglupheaspservalglyleuphegluileglyiletyrasnleu

515520525

pheglnvalthrhisasnileservalileglnlysphemetproasn

530535540

ileleualaserleuglupheglnglulysserilelyslystyrgly

545550555560

pheilealagluasphisseriletrpglumetglutyrglytyrtrp

565570575

phetrpthrglnalaileasntyrleuglyileargaspileserarg

580585590

metprometileglnasnhisasnalavalprovalproproglypro

595600605

valproproglyasnmetasnthralametilealahislysleulys

610615620

serasnileilelystyrphetyrmetaspasnilephealaglntyr

625630635640

leuvalprovalthrasnglntyrglyaspasnasntyrthrtyrphe

645650655

metalaasnasnthrproaspserserglnileleuproilealamet

660665670

glypheileasnproserserprometalathrserilevalhisasn

675680685

iletyrmetileleutrpasntyrargvalglyglyleuproargtyr

690695700

tyrasnaspleutyrhistyrthrglutyrglyglytyrhisgluser

705710715720

serglyproserproprotrpileilethrthrleupheleualaleu

725730735

tyraspglulysthrglyasnmetthrglyalaleuasnleumetlys

740745750

trpsertyrserhisserglnsertrpleuleuproglualavalasp

755760765

proasnpheglyservalilealaserthrserproleuthrtrpser

770775780

seralamettyrileilevalserleuasntyrargalametpropro

785790795800

alaproleuproproglypropro

805

<210>22

<211>771

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>22

metargthrleulysthrphealaleualaseralaalathrleuile

151015

alathralaalaglnalaalaprothrthrtrpalatyrseralalys

202530

thrglyvalglyalasertyrglualatyrvalaspglyalatyrlys

354045

alaglyglylysthrglyalavalserlysvaltrppheserileala

505560

aspglyvalleuthrgluthrmettyrglyleuilehisglualagln

65707580

ilelysglnmetargvalalavalgluthralaserglyleualaile

859095

gluglyalaaspthrthrserlysthrglutyrleuhisvalaspala

100105110

alaglyargproleuserproalatyrlysilethrthrthrasparg

115120125

glnglyargphevalileglulysargilephethraspproasparg

130135140

asnalaleuphevalargvalthrvalthralaleulysglyalaval

145150155160

thrprothrleuleuleugluprohismetalaasnthrglyglygly

165170175

aspvalglyalaalaseralaseralaleuthralahisgluglylys

180185190

alapheleuserleulysalaserlysprophealalysalaserala

195200205

servalleulysaspglyaspalaleualaalaleulysalathrthr

210215220

thrseralalysglyalailevalleualaglygluleuprolysval

225230235240

alalyssergluthrpheaspvalvalileglypheglyalaaspala

245250255

lysalaalaaspargthralaalaalathrleulysthrglytyrala

260265270

gluvalleualaargtyrasnglygluglyalahisvalglytrpglu

275280285

asptyrleualaserleuasngluleuproargleuargaspalaser

290295300

gluaspglyglylysleuleuglnalaseralaleumetleulysval

305310315320

glngluaspargthrtyralaglyalaleuilealaserleuserasn

325330335

protrpglyaspthrvalaspalathrlysserserthrglytyrlys

340345350

alavaltrpproargaspphetyrglncysalametalaleualaala

355360365

leuglyasplysgluthrproleualaalaphehistyrleuprothr

370375380

valglnvalglyprolysthrproglyasnlysglyaspglyglytrp

385390395400

pheleuglnlysserhisvalaspglythrproglutrpvalglyval

405410415

glnleuaspglnthralametproilemetleuglytrplysleutrp

420425430

thrtrpglytrpleuproaspalagluleulysalaphetyrglylys

435440445

metleulysproalaalaasppheleuvallysglyglylysvalasn

450455460

leuasptrpasnthralathrilethrproprophethrglnglnglu

465470475480

argtrpglugluglnglyglyhisserproserthrthralaalaval

485490495

ilealaglyleuvalvalalaglyaspilealaglualaalaglyasp

500505510

alaglyseralagluleutyrarglysthralaaspaspcysalagly

515520525

lysleuglualaargmetvalthrthrlysglythrpheglyaspgly

530535540

histyrtyrleuargleuasnseraspglnaspproasnasnlysser

545550555560

provalglualaargasnglyglnalaprovalalagluasplysmet

565570575

leuaspalaglypheleugluleuvalargtyrglyvalargargala

580585590

aspaspproalaileleualaserleuprogluileaspaspgluala

595600605

leugluaspleutyrargvalargtyrserphethrpheproglyval

610615620

gluglyserpheproglytrpargargtyrglyvalaspglytyrgly

625630635640

gluaspthrlysthrglyalaasntyrglyalaaspasnglnmetarg

645650655

proglyglnargglyargvaltrpproilephethrglygluarggly

660665670

histyrgluleualavalalaglyleuserglylysproaspprothr

675680685

alavalglnlysileargaspthrtyrvallysalametgluleuphe

690695700

alaasngluglyleumetileprogluglnvaltrpaspglyvalgly

705710715720

thraspseralahisglytyrvalargglygluglythraspserala

725730735

thrproleualatrpserhisalaglutyrvallysleuleuargser

740745750

valseraspglyglnvaltrpasphistyralaprovallysalaarg

755760765

tyralaarg

770

<210>23

<211>512

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>23

metlysglnglnlysargleutyralaargleuleuthrleuleuphe

151015

alaleuilepheleuleuprohisseralaalaalaalaalaasnleu

202530

asnglythrleumetglntyrpheglutrptyrmetproasnaspgly

354045

glnhistrplysargleuglnasnaspseralatyrleualagluhis

505560

glyilethralavaltrpileproproalatyrlysglythrsergln

65707580

alaaspvalglytyrglyalatyraspleutyraspleuglygluphe

859095

hisglnlysglythrvalargthrlystyrglythrlysglygluleu

100105110

glnseralailelysserleuhisserargaspileasnvaltyrgly

115120125

aspvalvalileasnhislysglyglyalaaspalathrgluaspval

130135140

thralavalgluvalaspproalaaspargasnargvalilesergly

145150155160

gluhisleuilelysalatrpthrhisphehispheproglyarggly

165170175

serthrtyrseraspphelystrphistrptyrhispheaspglythr

180185190

asptrpaspgluserarglysleuasnargiletyrlyspheglngly

195200205

lysalatrpasptrpgluvalserasngluasnglyasntyrasptyr

210215220

leumettyralaaspileasptyrasphisproaspvalalaalaglu

225230235240

ilelysargtrpglythrtrptyralaasngluleuglnleuaspgly

245250255

pheargleuaspalavallyshisilelyspheserpheleuargasp

260265270

trpvalasnhisvalargglulysthrglylysglumetphethrval

275280285

alaglutyrtrpglnasnaspleuglyalaleugluasntyrleuasn

290295300

lysthrasnpheasnhisservalpheaspvalproleuhistyrgln

305310315320

phehisalaalaserthrglnglyglyglytyraspmetarglysleu

325330335

leuasnglythrvalvalserlyshisproleulysservalthrphe

340345350

valaspasnhisaspthrglnproglyglnserleugluserthrval

355360365

glnthrtrpphelysproleualatyralapheileleuthrargglu

370375380

serglytyrproglnvalphetyrglyaspmettyrglythrlysgly

385390395400

aspserglnarggluileproalaleulyshislysilegluproile

405410415

leulysalaarglysglntyralatyrglyalaglnhisasptyrphe

420425430

asphishisaspilevalglytrpthrarggluglyaspserserval

435440445

alaasnserglyleualaalaleuilethraspglyproglyglyala

450455460

lysargmettyrvalglyargglnasnalaglygluthrtrphisasp

465470475480

ilethrglyasnargsergluprovalvalileasnsergluglytrp

485490495

glygluphehisvalasnglyglyservalseriletyrvalglnarg

500505510

<210>24

<211>491

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>24

metthrgluthrarghisargproserargargalaargargserleu

151015

serleuleuleuthrseralaleuthralaalaglyleuleuvalthr

202530

alaalaproalaglnalagluserthrleuarggluleualaalagln

354045

asnglyglyarghispheglythralailealatyrserproleuasn

505560

seraspalaglntyrargasnilealaalathrglnpheseralaile

65707580

thrhisgluasnglumetlystrpgluserleugluproglnarggly

859095

glntyrasntrpserglnalaaspasnileileasnphealalysala

100105110

asnasnglnilevalargglyhisthrleuvaltrphisserglnleu

115120125

prosertrpleuasnasnglyglypheserglyserglnleuargser

130135140

ilemetgluasnhisilegluvalvalalaglyargtyrargglyasp

145150155160

valtyralatrpaspvalvalasnglualapheasngluaspglythr

165170175

leuargaspseriletrptyrargglymetglyargasptyrileala

180185190

hisalaphearglysalahisgluvalaspproaspalalysleutyr

195200205

ileasnasptyrasnilegluglyileasnalalysserasnglyleu

210215220

tyrasnleuvalvalaspleuleuargaspglyvalproilehisgly

225230235240

ileglyileglnserhisleuilevalglyglnvalproserthrphe

245250255

glnglnasnileglnargphealaaspleuglyleuaspvalalaile

260265270

thrgluleuaspileargmetglnmetproalaaspglntyrlysleu

275280285

glnglnglnalaargasptyrglualavalvalasnalacysleuala

290295300

valthrargcysileglyilethrvaltrpglyileaspaspgluarg

305310315320

sertrpvalprotyrthrpheproglygluglyalaproleuleutyr

325330335

aspglyglntyrasnarglysproalatrptyralavaltyrgluala

340345350

leuglyglyaspserserglyglyglyproglygluproglyglypro

355360365

glyglyproglygluproglyglyproglyglyproglygluprogly

370375380

glyproglyaspglythrcysalavalasntyrthrvalvalasnasp

385390395400

trpglyhisglymetglnglyalailethrvalserasnthrglyser

405410415

serproileasnasntrpthrleuglnpheserpheserglyvalasn

420425430

ileserasnglytrpasnglyglutrpserglnserglyserglnile

435440445

thrvalargalaproalatrpasnserthrleuglnproglyglnser

450455460

valgluleuglyphevalalaasplysthrglyasnvalserpropro

465470475480

serglnphethrleuasnglyalathrcysser

485490

<210>25

<211>441

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>25

metserproargproleuargalaleuleuglyalaalaalaalaala

151015

leuvalseralaalaalaleualapheproserglnalaalaalaasn

202530

aspserprophetyrvalasnproasnmetserseralaglutrpval

354045

argasnasnproasnaspproargthrprovalileargaspargile

505560

alaservalproglnglythrtrpphealahishisasnproglygln

65707580

ilethrglyglnvalaspalaleumetseralaalaglnalaalagly

859095

lysileproileleuvalvaltyrasnalaproglyargaspcysgly

100105110

asnhisserserglyglyalaproserhisseralatyrargsertrp

115120125

ileaspgluphealaalaglyleulysasnargproalatyrileile

130135140

valgluproaspleuileserleumetsersercysmetglnhisval

145150155160

glnglngluvalleugluthrmetalatyralaglylysalaleulys

165170175

alaglyserserglnalaargiletyrpheaspalaglyhisserala

180185190

trphisserproalaglnmetalasertrpleuglnglnalaaspile

195200205

serasnseralahisglyilealathrasnthrserasntyrargtrp

210215220

thralaaspgluvalalatyralalysalavalleuseralailegly

225230235240

asnproserleuargalavalileaspthrserargasnglyasngly

245250255

proalaglyasnglutrpcysaspproserglyargalaileglythr

260265270

proserthrthrasnthrglyaspprometileaspalapheleutrp

275280285

ilelysleuproglyglualaaspglycysilealaglyalaglygln

290295300

phevalproglnalaalatyrglumetalailealaalaglyglythr

305310315320

asnproasnproasnproasnprothrprothrprothrprothrpro

325330335

thrproproproglyserserglyalacysthralathrtyrthrile

340345350

alaasnglutrpasnaspglypheglnalathrvalthrvalthrala

355360365

asnglnasnilethrglytrpthrvalthrtrpthrphethraspgly

370375380

glnthrilethrasnalatrpasnalaaspvalserthrserglyser

385390395400

servalthralaargasnvalglyhisasnglythrleuserglngly

405410415

alaserthrglupheglyphevalglyserlysglyasnserasnser

420425430

valprothrleuthrcysalaalaser

435440

<210>26

<211>725

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>26

metleulysthrlysarglysleuthrlysalaileglyvalalaleu

151015

serileserileleuserserleuvalserpheileproglnthrasn

202530

thrtyralaalaglythrtyrasntyrglyglualaleuglnlysser

354045

ilemetphetyrglupheglnargserglyaspleuproalaasplys

505560

argaspasntrpargaspaspserglymetlysaspglyseraspval

65707580

glyvalaspleuthrglyglytrptyraspalaglyasphisvallys

859095

pheasnleuprometsertyrthrseralametleualatrpserleu

100105110

tyrgluasplysaspalatyrasplysserglyglnthrlystyrile

115120125

metaspglyilelystrpalaasnasptyrpheilelyscysasnpro

130135140

thrproglyvaltyrtyrtyrglnvalglyaspglyglylysasphis

145150155160

sertrptrpglyproalagluvalmetglnmetgluargproserphe

165170175

lysvalaspalaserlysproglyseralavalcysalaserthrala

180185190

alaserleualaseralaalavalvalphelysserseraspprothr

195200205

tyralaglulyscysileserhisalalysasnleupheaspmetala

210215220

asplysalalysseraspalaglytyrthralaalaserglytyrtyr

225230235240

serserserserphetyraspaspleusertrpalaalavaltrpleu

245250255

tyrleualathrasnaspserthrtyrleuasplysalaglusertyr

260265270

valproasntrpglylysgluglnglnthraspileilealatyrlys

275280285

trpglyglncystrpaspaspvalhistyrglyalagluleuleuleu

290295300

alalysleuthrasnlysglnleutyrlysaspserileglumetasn

305310315320

leuaspphetrpthrthrglyvalasnglythrargvalsertyrthr

325330335

prolysglyleualatrpleupheglntrpglyserleuarghisala

340345350

thrthrglnalapheleualaglyvaltyralaglutrpgluglycys

355360365

thrproserlysvalservaltyrlysasppheleulysserglnile

370375380

asptyralaleuglyserthrglyargserphevalvalglytyrgly

385390395400

valasnproproglnhisprohishisargthralahisglysertrp

405410415

thraspglnmetthrserprothrtyrhisarghisthriletyrgly

420425430

alaleuvalglyglyproaspasnalaaspglytyrthraspgluile

435440445

asnasntyrvalasnasngluilealacysasptyrasnalaglyphe

450455460

thrglyalaleualalysmettyrlyshisserglyglyaspproile

465470475480

proasnphelysalaileglulysilethrasnaspgluvalileile

485490495

lysalaglyleuasnserthrglyproasntyrthrgluilelysala

500505510

valvaltyrasnglnthrglytrpproalaargvalthrasplysile

515520525

serphelystyrphemetaspleusergluilevalalaalaglyile

530535540

aspproleuserleuvalthrserserasntyrsergluglylysasn

545550555560

thrlysvalserglyvalleuprotrpaspvalserasnasnvaltyr

565570575

tyrvalasnvalaspleuthrglygluasniletyrproglyglygln

580585590

seralacysargarggluvalglnpheargilealaalaproglngly

595600605

thrthrtyrtrpasnprolysasnaspphesertyraspglyleupro

610615620

thrthrserthrvalasnthrvalthrasnileprovaltyraspasn

625630635640

glyvallysvalpheglyasngluproalaglyglysergluasnpro

645650655

aspprogluileleutyrglyaspvalasnserasplysasnvalasp

660665670

alaleuaspphealaalaleulyslystyrleuleuglyglythrser

675680685

serileaspvallysalaalaaspthrtyrlysaspglyasnileasp

690695700

alaileaspmetalathrleulyslystyrleuleuglythrilethr

705710715720

glnleuproglngly

725

<210>27

<211>420

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>27

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

<210>28

<211>413

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>28

ccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctgaac60

ctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgcaccc120

cgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgccggg180

gtggggaagcacgtcaacacggccttggatcacatcgggcgtcgaaaaacaacccccatt240

tccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaagttg300

ccgcacgttgtcccagttggggcgtggcctgctgcatacggggccggggacgcctcacct360

gggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac413

<210>29

<211>145

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>29

cysalacyscysglyglycyscyscysglyglycysalaglycysgly

151015

thrglycysalathrglycysglythrglycysalathrthrthrcys

202530

cysalacyscyscysthrcysalaalaglyalaalacyscysalathr

354045

thrglyalacysthrglyglycysglyalacysglycysglycysala

505560

glyglythrglyglyglyalaglyalaalathrthrglyalaalacys

65707580

thrglyalacysalaalacysalacysalaglycysglyglythrthr

859095

glythrcysalacyscyscysglyglycyscyscysglycysalaala

100105110

glyglycyscysglycysglyglycyscysglycysalathrcysgly

115120125

glythrthrcyscysglyalaalaglyglyalaglyglyalaalathr

130135140

cys

145

<210>30

<211>362

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>30

thrcysglyglythrcysglyglyglythrcyscysglyglyalacys

151015

glyglyglycysglyglythrcyscysalaalacyscyscysglycys

202530

cyscyscysalathrthrthrcysglythrglyglyglycysalaala

354045

cysalathrglycyscyscyscysalathrcysthrcyscysthrgly

505560

cyscyscysglyglyglyglyglyalathrglyglyglyglycysala

65707580

thrglyalacyscysalathrglycyscysglycysglythrcyscys

859095

glyglyglythrthrglyglythrcysalacyscysglycysglycys

100105110

glycyscysglycysalathrglythrglycyscysglyglycysgly

115120125

alathrglyalacysalaalacysglythrglyalathrthrthrgly

130135140

cyscysalathrcyscysglyglyglyglyglyglythrcysthrthr

145150155160

thrthrglycyscysthrcysalaglycysglythrglyalaalacys

165170175

cysglycysalacysalaglycysthralaglyalaalathrthrgly

180185190

glythrcysalaglycysglycyscysglythrglythralacysgly

195200205

cyscysglycysthrcyscysalaglyalacyscysthralaglythr

210215220

glythrglythrglyglycysglythrcysglythrthrglythrcys

225230235240

glyalathrglyglythrcyscysglyglycyscyscysglythrcys

245250255

cyscysthrglycysglyglyalacysglyglyalacysglyglygly

260265270

alaalathrthralathrcysglyglyglyalaglycysglyalaala

275280285

thrcysglycyscysglythrthrcyscysglythrthrcysalagly

290295300

cysglyglyglyalathrglycysglythrthrthrglycysglycys

305310315320

glycysglythrcysalacysalaalathrcysthrcysalacysala

325330335

thrcyscysalathrcyscysalaalacysalathrcysglyglyala

340345350

glycyscyscysthralacysthralacys

355360

<210>31

<211>549

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>31

ccccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccg60

gctctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctc120

gtcttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcg180

ggggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaa240

tagtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactaggg300

gaaacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctg360

gacgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctaggga420

acccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagc480

tcttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgt540

aggattgcg549

<210>32

<211>315

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>32

ctcgagttgcagggcgagggggcggggccgcaggtccatgctggcagcggccggcgacaa60

tcccgacgggagagtcggtcagggcgacggtagatcagcgcaggtgctgactagcggtcg120

tagtcggcctcggccagcccatcgcgggtgcggatcgacgtgtcggcggatgctgggcgg180

gtcggttcttgtgggggtgtgtgcgtgcgccgaacgtctcggaaaatgctgagcgtttcc240

tgagaatcggagacacacctcgtgcattcttagctgtctggcgcagttcatcgtccggac300

gatatggtttcgggt315

<210>33

<211>2122

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>33

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccctgcaggagggccccctgaacaagcgcgcctacccctccttcgaggc660

ctactcgaactacaaggtggaccgcaccgacctggaaaccttcctggacaagcagaagga720

ggtgtcgctgtattacctgctgcagaacatcgcctaccccgagggccagttcaataatgg780

cgtgcccggcaccgtgatcgcctcgccctcgacctcgaatcccgattactactaccagtg840

gacccgtgactcagccatcaccttcctgaccgtgctgtcggagctggaggacaacaactt900

caacaccaccctggccaaggccgtggagtactacatcaacacctcgtacaacctgcagcg960

cacctcgaacccctccggctcgttcgacgacgagaatcacaagggcctgggcgagccaaa1020

gtttaataccgacggttcggcctataccggcgcatggggccgtccccaaaatgatggtcc1080

cgcactgcgtgcctacgccatctcgcgctacctgaacgacgtgaattcgctgaacgaggg1140

caagctggtgctgaccgactcgggcgacatcaacttctcgtccaccgaggacatctacaa1200

gaacatcatcaagcccgacctggagtacgtgatcggctactgggactcgaccggcttcga1260

cctgtgggaggagaatcagggccgtcacttcttcacctcgctggttcagcagaaggccct1320

ggcctatgccgtggatatcgccaagtcgttcgatgacggcgacttcgccaataccctgtc1380

gtcgactgcctcgaccctggagtcgtacctgtcgggttcggacggcggcttcgtgaacac1440

tgacgtgaaccacatcgtggagaaccccgatctgctgcaacagaattcgcgccagggcct1500

ggactcggccacctacatcggtcccctgttgacccatgatatcggcgagtcatcgtcgac1560

ccccttcgacgtggacaacgagtacgtgctgcagtcgtactacctgctgctggaggacaa1620

taaggaccgctactccgtgaactcggcctactcggccggcgccgccatcggtcgttatcc1680

agaggatgtgtataatggcgacggctcctcagaaggcaatccctggttcctggccaccgc1740

atacgccgcacaggttccctacaagctggcctacgacgccaagtcagcctcgaatgacat1800

caccatcaacaagatcaactacgacttcttcaacaagtacatcgtggacctgtcgaccat1860

caactccgcctaccagtcgtcggactcggtgaccatcaagtcgggctcggacgagttcaa1920

caccgtggccgacaacctggtgaccttcggcgactcgttcctgcaggtcatcctggacca1980

catcaacgacgacggctcgctgaatgagcagctgaaccgttacaccggctactccaccgg2040

tgcctactcgctgacctggtcatcgggcgccttgttggaggccattcgtctgcgcaataa2100

ggtgaaggccctggcctgatga2122

<210>34

<211>2476

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>34

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccatctcgaagcgtgccacctgggactcgtggttgtcgaatgaggccac660

cgtggcccgcactgccatcctgaataatattggtgccgacggtgcctgggtgtcgggtgc720

cgattcaggtattgtggtggcctcgccctcgactgacaatcccgactacttctacacctg780

gacccgcgactcgggcttggtgctgaagaccctggtggacctgttccgcaacggcgacac840

ctcgctgctgtcgaccatcgagaattacatctcggcccaggccatcgtgcagggtatctc900

gaatccctcgggcgacctgtcatcgggcgccggcttgggtgagccaaagttcaatgtgga960

tgaaactgcctacactggctcgtggggccgtccccaaagagacggccccgccttacgtgc1020

caccgccatgatcggtttcggtcagtggctgttggacaatggctacacctccactgccac1080

cgacatcgtgtggcccctggtgcgcaatgacctgtcgtacgtggcccagtactggaacca1140

gaccggctacgacctgtgggaggtgaatggctcgtcgttcttcaccattgcagtgcagca1200

ccgtgccctggtggaaggttcggccttcgcaaccgccgtcggctcctcgtgctcatggtg1260

cgattcgcaagcacccgaaatcctgtgctacctgcagtcgttctggaccggctcgttcat1320

tctggccaacttcgactcgtcgcgctccgccaaggacgccaatactctgctgctgggctc1380

aatccacaccttcgaccccgaggccgcatgcgacgactcaaccttccaaccctgttcacc1440

ccgcgcactggccaatcacaaggaggtggtggactcgttccgctcgatctacaccttgaa1500

tgacggcctgtcagactcggaagccgtggccgtgggccgctaccccgaggacacttacta1560

taatggcaatccctggttcctgtgcaccttggccgcagccgagcagctgtacgacgcact1620

gtatcagtgggacaagcagggctcgctggaggtgaccgatgtgtcgctggacttcttcaa1680

ggccctgtattcggacgccaccggcacctactcctcctcgtcgtcgacctactcgtccat1740

cgtggacgccgtgaagaccttcgcagacggcttcgtgtcgatcgtggagactcacgccgc1800

ctcgaatggctccatgtcggagcagtacgacaagtcggatggcgaacagctgtcggcccg1860

cgacctgacctggtcatatgccgccttgctgactgccaataaccgtcgtaatgtggtgcc1920

ctcagcctcctggggtgagacgtcggcctcgtcggtgcccggtacttgtgcagccacctc1980

agccattggcacctactcatcagtgaccgtcacttcatggccatcgattgtggcaaccgg2040

cggcaccactaccaccgccaccccaactggctccggttcggttacttccacctcgaagac2100

caccgcaaccgcctcaaagacctcaacctcgacctcatccacctcatgcaccacccccac2160

cgccgtggcagtgaccttcgacctgaccgccaccactacctacggcgagaatatctacct2220

ggtgggttcgatctcgcagctgggcgactgggagacgtcagatggcatcgccctgtcagc2280

agacaagtacacctcgtcagatcccctgtggtatgtgaccgtgaccctgcccgccggcga2340

gtcgttcgagtacaagttcatccgcatcgaatcggacgattcagtggagtgggagtccga2400

tcccaatcgtgagtacaccgtgccacaggcctgcggcacctcaaccgccaccgtgaccga2460

cacctggcgctagtga2476

<210>35

<211>2635

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>35

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccatcgaccgcttcaacaacatctccgccgtgaacggccccggcgagga660

ggatacctgggcctccgcccagaagcaaggtgtgggcaccgccaataattacgtgtcaaa720

ggtgtggttcaccctggcaaacggcgccatctcggaggtgtactaccccaccatcgacac780

cgccgacgtgaaggagatcaagttcatcgtgaccgacggcaagtcgttcgtgtcggacga840

gacgaaggacaccatctcgaaggtggagaagttcaccgacaagtcgctgggctacaagct900

ggtgaacaccgacaagaagggccgctaccgcatcaccaaggagatcttcaccgacgtgaa960

gcgcaactccctgatcatgaaggccaagttcgaggccctggagggctcgatccacgacta1020

caagctgtacctggcctacgacccccacatcaagaaccagggctcgtacaatgagggcta1080

cgtgatcaaggccaacaacaacgagatgctgatggccaagcgcgacaacgtgtacaccgc1140

cctgtcgtcgaatatcggctggaagggctactcgatcggctactacaaggtgaacgacat1200

catgaccgacctggacgagaacaagcagatgaccaagcactacgactccgcccgcggcaa1260

catcatcgagggcgccgagatcgacctgaagaagaactcgcagttcgagatcgtgctgtc1320

gttcggcaactccgaggacgaggccgtgaaggcctccatcgagacgctgtcggagaatta1380

cgactcgctgaagtcggcctacatcgacgagtgggagaagtactgcaactcgctgaacaa1440

cttcaacggcaaggccaattcgctgtactacaactccatgatgatcctgaaggcctcgga1500

ggacaagaccaataagggcgcctacatcgcctcgctgtcgatcccctggggcgacggtca1560

gggcgacgataataccggcggttaccaccttgtgtggtcacgtgatctgtaccacgtggc1620

caatgccttcatcgccgccggtgacgtggactcggccaaccgctcgctggactacctggc1680

caaggtggtgaaggacaatggcatgattccccagaatacctggatctccggcaagcccta1740

ctggaccggcatccagctggacgagcaagccgaccccattatcctgtcgtaccgcctgcg1800

ccgctatgacctgtatgactcgttggtgaagcccctggccgacttcatcatcaagatggg1860

ccccaaaactggtcaggaacgttgggaggagattggtggctattcacccgcaaccatggc1920

cgccgaggtggccggcttgacctgtgccgcctacatcgccgagcagaataaggactacga1980

gtcggcccagaagtatcaggagaaggccgacaactggcagaagctgatcgacaacctgac2040

ctacaccgagcacggccccctggagaacggtcagtactacatccgcattgccggcttgcc2100

cgatcccaatgccgacttcaccatctccatcgccaatggtggcggcgtgtatgaccagaa2160

ggagatcgtggacccctcgttcctggagctggttcgcctgggcgtgaagtcaccagacga2220

ccccaagattctgaacaccctgcgcgtggtggactccaccatcaaggtggatacccccaa2280

gggcccctcgtggtaccgctacaaccatgacggctacggcgaaccatcgaagaccgaact2340

gtaccatggcgcaggtaagggtcgtttgtggcccctgttgaccggcgagcgcggcatgta2400

cgaaatcgccgcaggcaaggatgccactccctatctgaaggccatggagaatttcgccaa2460

cgagggcggcattatctcggaacaagtgtgggaggataccggtctgcccaccgactcagc2520

ctcgcccttgaattgggcccacgccgagtacgtggtgctgttcccctcgaacatcgaaca2580

caaggtgctggacatgcccgacatcgtgtacaagcgctacgtggccaagtgatga2635

<210>36

<211>1708

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>36

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccatggagaacctggtcgagaagtcgatcaagatcatcaagaacaacca660

gtcggagtacggctccttcatcgcctcaccctcgttccccacctaccacttctcgtggtt720

gcgcgacggctcgttcatcgcctactccatggacctggtggagcaatacgccgaggccaa780

gaagttctaccgctgggtgaatgaggtgatcatccgctactcgtacaaggtggacaagat840

catcgagaagatcaagaacggcaacaagctggagcccaatgacttcctgtacgcccgcta900

taccctggagggctacgaggagaaggattcgggctggggcaatttccaactggatggcta960

cggcacctggctgtggggcctgtcggaacacatcaagatcaccggcaagaccgagctgat1020

caacgacttcttcaagtccatcgacatcaccatcaagtacatcgacaacctgtggtacta1080

ccccaacttcgacgtgtgggaggagaactccgacaagatccacacctcgaccctggcctg1140

cctgtacggcggcctgaactcgatcaacaagtacctgaacgacgacaaggtgaaggagct1200

ggccaacaagatcaagacctacatcctgaccaactgcgtggtggagaactcgttcgtgaa1260

gtacgtgggctcgaactcggtggactcgtcgctgatctggctggccatccccttcgaggt1320

ggtggacgtgaatgacgagatcttcctgaacaccatcaagcgcatcgagaaggagctgct1380

gcacaatggcggcatgcaccgttaccgcaaggacacctactacggcggcggccagtggat1440

tctgctgtccgcctggatgggtctgtactactgcaagtcgggcgactacaagaaggccga1500

ggaggtgaagaagtggatcgaggagcaggccgacgagaacggctacctgcccgagcaggt1560

cccctaccacctgaacaacgaggtgtactacccctactgggtgaacaagtggggcaacat1620

cgccaagcccctgctgtggtcgcacgccatgtacctggtgctggactacgagctgaagaa1680

ggccggcgtgcagctggaggactgatga1708

<210>37

<211>2653

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>37

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccaacatctccaacatcaagatcgagcgcctgaataacgtgcaggccgt660

gaatggccccggtgaggccgacacttgggccaaagcccagaagcagggtgtgggcaccgc720

caacaattacacctccaaggtgtggttcaccatcgcagacggtggcatctccgaggtgta780

ctaccccaccatcgacaccgccgacgtcaaggacatcaagttcttcgtgaccgacggcaa840

gaccttcgtgtccgacgagacgaaggacaccatcaccaaggtggagaagttcaccgagaa900

gtccctgggctacaagatcatcaacaccgacaaggagggccgctacaagatcaccaagga960

gatcttcaccgacgtgaagcgcaactccctggtgatcaagaccaagttcgaggccctgaa1020

gggcaacgtggacgactaccgcctgtacgtgatgtgcgacccccacgtgaagaaccaggg1080

caagtacaacgagggctacgccgtgaaggccaacggcaatgtggccctgatcgcagagcg1140

cgacggtatctacaccgccctgtcgtccgacatcggttggaagaagtactcgatcggcta1200

ctacaaggtgaacgacatcgaaaccgacctgtacaagaacatgcagatgacctacaacta1260

cgactccgcccgcggcaatatcatcgagggcgccgagatcgacctgaagaagaaccgcca1320

gttcgagatcgtgttgtcgttcggccagtcggaggacgaggccgtgaagaccaatatgga1380

gacgctgaatgacaattacgactcgctgaagaaggcctacatcgaccagtgggagaagta1440

ctgcgactccctgaacgacttcggcggcaaggccaactcgctgtacttcaactccatgat1500

gatcctgaaggcctccgaggacaagaccaacaagggcgcctacatcgcatcgctgtcgat1560

cccctggggtgacggccaggaagacgacaatatcggcggctaccacctggtttggtcccg1620

cgacttgtaccacgtggccaatgccttcattgtggccggcgataccgactcggccaatcg1680

cgccttggactacctggacaaggtggtgaaggacaacggcatgatcccccagaacacctg1740

gatcaatggccgcccctactggaccggcattcagctggacgaacaggccgaccccatcat1800

cctgtcataccgcctgaagcgctacgacctgtacgagtcgctggtgaagcccctggccga1860

cttcatcatgaagatcggccccaagaccggccaggaaagatgggaggaaattggtggcta1920

ctcacccgccaccctggcatcggaagttgccggcctgacctgtgcagcctacatcgccga1980

gcagaacaaggacttcgagtccgccaagaagtaccaggagaaggccgacaactggcagcg2040

cctgatcgacaatctgacctacaccgaaaagggccccttgggcgacggccactactacat2100

ccgcattgccggcctgcccgatcccaatgccgacttcatgatctcgatcgccaatggtgg2160

cggtgtgtacgaccaaaaggagatcgtggacccctcgttcctggagctggtgcgcctggg2220

tgttaagtccgccgacgaccccaagatcctgaacaccctgaaggtggtggacgagactat2280

caaggtggacacccccaagggcccctcgtggtatcgttataatcacgacggctacggcga2340

gatgtcgaagaccgaactgtaccacggcaccggcaagggccgtctgtggcccctgttgac2400

cggtgaaagaggtatgtatgagatcgccgccggtaaggacgccacctcgtatgtgaaggc2460

catggagaacttcgccaatgagtccggcatcatctcggaacaggtgtgggaagataccgg2520

cctgcccactgactccgcctcacccctgaattgggcccacgccgagtacgtgatcctgtt2580

cgcctccaatatcgagcacaaggtgctggacatgcccgacatcgtgtacaagcgctacgc2640

ctcgaagtgatga2653

<210>38

<211>2527

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>38

ccgaggtccacacgccgggccgaggcgggtacacctgccgggcaggccgggggttccggc60

tctgggaatggagctgttcggttatccaccatgtggacgacacgcaggcaccatgctcgt120

cttcgagcggaatcacgggccccgataactgtgtgatttgtgcgtgaaggccgattcggg180

ggccgtttgagcggcgcgccgcacggataacagcgttctatgccaccgataacaccaata240

gtccccaagtgcttgacaggactcttcgaagcctctttgaagatggctctgactagggga300

aacagtcctcagtagtcaccgcgaaggagcagtggctctgttactgttctagcggctgga360

cgggtagttcgattgatgatgctcttgcctcggcatagtgcgtcgccaatcctagggaac420

ccatcgaaggccatgaattttcccagaggacatgggtgttcgaacatcccggcagagctc480

ttgaaggtcggccgtgcacccttgtccaggcttgaaaggaaacaagttgtctgttcgtag540

gattgcggtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggc600

gcctgcgaatgccatggtgcgctacatccccatgggcaacggcaagatcctggtgtcctt660

caacaacgactacaacctgaccgacttctacttctcgaaggacatggccgagaaccactc720

cgccggcaagcccttccgctacggcgtgtcgatcaacgacaagttcacctggatcaacgc780

ctcgaacatcgtgtcgaaggactactacgaccacaccatgatcggcatcgtgaagtacaa840

catcaacgacgtgtcgttcgaggacgacaacttcgtggacatctacgaggacgtgtacgc900

ccgcaagatcaagatcaccaacaagcgcaaggagaagatcaacgtgaagctgttcttcca960

ccagaacttctccatctacggcaacaacatcggcgacaccggcttctactaccccgacac1020

caacgccatcgtgcactacaagggccgccgctacttcatcatctcgaccaccgacggcaa1080

gaactcgttcgaccagtacgccatcggcatcaaggacttcaacggcatggccggcacctg1140

gaaggacgccgaggacaataatttgtcgatgggccccatcgccatcggctcggtggactc1200

caccattcgtcactcgatcgacatcgatcccgagtcgcagaaggagctgtactactacat1260

cgcctgcgcccgcgacttggacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaa1320

tctggaccgcatgatgaagcgcaccgagaatttctgggagctgtgggtgtcgaagtcgcc1380

cctgaatctgaccgccgagctgaacgagatgtacaagaagtcgctgttcatcatccgctc1440

gcacatcaatgagaagggcgccgtgatggcctcctcggattcggatatcctgcgctcgaa1500

tatggactcgtactactactcatggccccgcgacgccggctacgcagccatctcaatgat1560

cgtgtccgagcactcggaccccgccaagctgttcttcgacttctgcatcaacaccatctc1620

caaggacggctacttctaccacaagtacaaccccgacggcaagattgcctcgtcgtggct1680

gccctatatcatggacggcaagcgcatcctgcccatccaggaggacgagtcagccatcgt1740

gatcatcgccgcctggtactactactcgaccaacaatgacatcgagtacatctcctacct1800

gtacgagcgcctgatcaagcgcgtggccgagttcctgtacaacttcacctacgacaacgg1860

tctgcccaaggagtcattcgacctgtgggaggagcgcttcggcatccacacctacaccgt1920

ggcctcggtgtacatcgccctgatctatgccgccaatttcgccgagatcttcaacgagac1980

ggacctggcccgcaagtacaagtccaaggccgacaagatgctggagtcgttcgagaagat2040

gttctactcggacgacctgggctactacgcccgccgcatctacaacggcgacgtggactt2100

cgtgctggactcatcggtgctgtggctggtgatcttcggcatcaagaagcccgatgaccc2160

acgcatcgtgtccaccgtgaaggccatcgagaagaagctgtgggtgcccggcatcggtgg2220

tatcgccagatacgagggcgactactaccagcgcatctcgggcaagaatatccccggcaa2280

cccctggatcatcactaccctgtggctggccgactattacatcatggccggcaataccgg2340

ccgcgccctggagctgatcaactgggtggttcagcactcagaggagtcgggcatcctgtc2400

ggagcagatcaatcccgataatggcgagcccatctcggtgtcccccctgatctggtcgca2460

ctcgcagctggtgctgactctgaagcgctacaaggacgccatcaagaacaagggcatcca2520

gtgatga2527

<210>39

<211>2043

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>39

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccctgcag540

gagggccccctgaacaagcgcgcctacccctccttcgaggcctactcgaactacaaggtg600

gaccgcaccgacctggaaaccttcctggacaagcagaaggaggtgtcgctgtattacctg660

ctgcagaacatcgcctaccccgagggccagttcaataatggcgtgcccggcaccgtgatc720

gcctcgccctcgacctcgaatcccgattactactaccagtggacccgtgactcagccatc780

accttcctgaccgtgctgtcggagctggaggacaacaacttcaacaccaccctggccaag840

gccgtggagtactacatcaacacctcgtacaacctgcagcgcacctcgaacccctccggc900

tcgttcgacgacgagaatcacaagggcctgggcgagccaaagtttaataccgacggttcg960

gcctataccggcgcatggggccgtccccaaaatgatggtcccgcactgcgtgcctacgcc1020

atctcgcgctacctgaacgacgtgaattcgctgaacgagggcaagctggtgctgaccgac1080

tcgggcgacatcaacttctcgtccaccgaggacatctacaagaacatcatcaagcccgac1140

ctggagtacgtgatcggctactgggactcgaccggcttcgacctgtgggaggagaatcag1200

ggccgtcacttcttcacctcgctggttcagcagaaggccctggcctatgccgtggatatc1260

gccaagtcgttcgatgacggcgacttcgccaataccctgtcgtcgactgcctcgaccctg1320

gagtcgtacctgtcgggttcggacggcggcttcgtgaacactgacgtgaaccacatcgtg1380

gagaaccccgatctgctgcaacagaattcgcgccagggcctggactcggccacctacatc1440

ggtcccctgttgacccatgatatcggcgagtcatcgtcgacccccttcgacgtggacaac1500

gagtacgtgctgcagtcgtactacctgctgctggaggacaataaggaccgctactccgtg1560

aactcggcctactcggccggcgccgccatcggtcgttatccagaggatgtgtataatggc1620

gacggctcctcagaaggcaatccctggttcctggccaccgcatacgccgcacaggttccc1680

tacaagctggcctacgacgccaagtcagcctcgaatgacatcaccatcaacaagatcaac1740

tacgacttcttcaacaagtacatcgtggacctgtcgaccatcaactccgcctaccagtcg1800

tcggactcggtgaccatcaagtcgggctcggacgagttcaacaccgtggccgacaacctg1860

gtgaccttcggcgactcgttcctgcaggtcatcctggaccacatcaacgacgacggctcg1920

ctgaatgagcagctgaaccgttacaccggctactccaccggtgcctactcgctgacctgg1980

tcatcgggcgccttgttggaggccattcgtctgcgcaataaggtgaaggccctggcctga2040

tga2043

<210>40

<211>2398

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>40

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatctcg540

aagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgccatc600

ctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtg660

gcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggcttg720

gtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgaccatc780

gagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacctg840

tcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactggc900

tcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtttc960

ggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccctg1020

gtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgtgg1080

gaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggt1140

tcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaa1200

atcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgactcg1260

tcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacccc1320

gaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatcac1380

aaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagactcg1440

gaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggttc1500

ctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagcag1560

ggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacgcc1620

accggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagacc1680

ttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcg1740

gagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcatat1800

gccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtgag1860

acgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctactca1920

tcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccgcc1980

accccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaaag2040

acctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgaccttc2100

gacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgcag2160

ctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgtca2220

gatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttc2280

atccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtacacc2340

gtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2398

<210>41

<211>2556

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>41

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatcgac540

cgcttcaacaacatctccgccgtgaacggccccggcgaggaggatacctgggcctccgcc600

cagaagcaaggtgtgggcaccgccaataattacgtgtcaaaggtgtggttcaccctggca660

aacggcgccatctcggaggtgtactaccccaccatcgacaccgccgacgtgaaggagatc720

aagttcatcgtgaccgacggcaagtcgttcgtgtcggacgagacgaaggacaccatctcg780

aaggtggagaagttcaccgacaagtcgctgggctacaagctggtgaacaccgacaagaag840

ggccgctaccgcatcaccaaggagatcttcaccgacgtgaagcgcaactccctgatcatg900

aaggccaagttcgaggccctggagggctcgatccacgactacaagctgtacctggcctac960

gacccccacatcaagaaccagggctcgtacaatgagggctacgtgatcaaggccaacaac1020

aacgagatgctgatggccaagcgcgacaacgtgtacaccgccctgtcgtcgaatatcggc1080

tggaagggctactcgatcggctactacaaggtgaacgacatcatgaccgacctggacgag1140

aacaagcagatgaccaagcactacgactccgcccgcggcaacatcatcgagggcgccgag1200

atcgacctgaagaagaactcgcagttcgagatcgtgctgtcgttcggcaactccgaggac1260

gaggccgtgaaggcctccatcgagacgctgtcggagaattacgactcgctgaagtcggcc1320

tacatcgacgagtgggagaagtactgcaactcgctgaacaacttcaacggcaaggccaat1380

tcgctgtactacaactccatgatgatcctgaaggcctcggaggacaagaccaataagggc1440

gcctacatcgcctcgctgtcgatcccctggggcgacggtcagggcgacgataataccggc1500

ggttaccaccttgtgtggtcacgtgatctgtaccacgtggccaatgccttcatcgccgcc1560

ggtgacgtggactcggccaaccgctcgctggactacctggccaaggtggtgaaggacaat1620

ggcatgattccccagaatacctggatctccggcaagccctactggaccggcatccagctg1680

gacgagcaagccgaccccattatcctgtcgtaccgcctgcgccgctatgacctgtatgac1740

tcgttggtgaagcccctggccgacttcatcatcaagatgggccccaaaactggtcaggaa1800

cgttgggaggagattggtggctattcacccgcaaccatggccgccgaggtggccggcttg1860

acctgtgccgcctacatcgccgagcagaataaggactacgagtcggcccagaagtatcag1920

gagaaggccgacaactggcagaagctgatcgacaacctgacctacaccgagcacggcccc1980

ctggagaacggtcagtactacatccgcattgccggcttgcccgatcccaatgccgacttc2040

accatctccatcgccaatggtggcggcgtgtatgaccagaaggagatcgtggacccctcg2100

ttcctggagctggttcgcctgggcgtgaagtcaccagacgaccccaagattctgaacacc2160

ctgcgcgtggtggactccaccatcaaggtggatacccccaagggcccctcgtggtaccgc2220

tacaaccatgacggctacggcgaaccatcgaagaccgaactgtaccatggcgcaggtaag2280

ggtcgtttgtggcccctgttgaccggcgagcgcggcatgtacgaaatcgccgcaggcaag2340

gatgccactccctatctgaaggccatggagaatttcgccaacgagggcggcattatctcg2400

gaacaagtgtgggaggataccggtctgcccaccgactcagcctcgcccttgaattgggcc2460

cacgccgagtacgtggtgctgttcccctcgaacatcgaacacaaggtgctggacatgccc2520

gacatcgtgtacaagcgctacgtggccaagtgatga2556

<210>42

<211>1629

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>42

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggag540

aacctggtcgagaagtcgatcaagatcatcaagaacaaccagtcggagtacggctccttc600

atcgcctcaccctcgttccccacctaccacttctcgtggttgcgcgacggctcgttcatc660

gcctactccatggacctggtggagcaatacgccgaggccaagaagttctaccgctgggtg720

aatgaggtgatcatccgctactcgtacaaggtggacaagatcatcgagaagatcaagaac780

ggcaacaagctggagcccaatgacttcctgtacgcccgctataccctggagggctacgag840

gagaaggattcgggctggggcaatttccaactggatggctacggcacctggctgtggggc900

ctgtcggaacacatcaagatcaccggcaagaccgagctgatcaacgacttcttcaagtcc960

atcgacatcaccatcaagtacatcgacaacctgtggtactaccccaacttcgacgtgtgg1020

gaggagaactccgacaagatccacacctcgaccctggcctgcctgtacggcggcctgaac1080

tcgatcaacaagtacctgaacgacgacaaggtgaaggagctggccaacaagatcaagacc1140

tacatcctgaccaactgcgtggtggagaactcgttcgtgaagtacgtgggctcgaactcg1200

gtggactcgtcgctgatctggctggccatccccttcgaggtggtggacgtgaatgacgag1260

atcttcctgaacaccatcaagcgcatcgagaaggagctgctgcacaatggcggcatgcac1320

cgttaccgcaaggacacctactacggcggcggccagtggattctgctgtccgcctggatg1380

ggtctgtactactgcaagtcgggcgactacaagaaggccgaggaggtgaagaagtggatc1440

gaggagcaggccgacgagaacggctacctgcccgagcaggtcccctaccacctgaacaac1500

gaggtgtactacccctactgggtgaacaagtggggcaacatcgccaagcccctgctgtgg1560

tcgcacgccatgtacctggtgctggactacgagctgaagaaggccggcgtgcagctggag1620

gactgatga1629

<210>43

<211>2574

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>43

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacatc540

tccaacatcaagatcgagcgcctgaataacgtgcaggccgtgaatggccccggtgaggcc600

gacacttgggccaaagcccagaagcagggtgtgggcaccgccaacaattacacctccaag660

gtgtggttcaccatcgcagacggtggcatctccgaggtgtactaccccaccatcgacacc720

gccgacgtcaaggacatcaagttcttcgtgaccgacggcaagaccttcgtgtccgacgag780

acgaaggacaccatcaccaaggtggagaagttcaccgagaagtccctgggctacaagatc840

atcaacaccgacaaggagggccgctacaagatcaccaaggagatcttcaccgacgtgaag900

cgcaactccctggtgatcaagaccaagttcgaggccctgaagggcaacgtggacgactac960

cgcctgtacgtgatgtgcgacccccacgtgaagaaccagggcaagtacaacgagggctac1020

gccgtgaaggccaacggcaatgtggccctgatcgcagagcgcgacggtatctacaccgcc1080

ctgtcgtccgacatcggttggaagaagtactcgatcggctactacaaggtgaacgacatc1140

gaaaccgacctgtacaagaacatgcagatgacctacaactacgactccgcccgcggcaat1200

atcatcgagggcgccgagatcgacctgaagaagaaccgccagttcgagatcgtgttgtcg1260

ttcggccagtcggaggacgaggccgtgaagaccaatatggagacgctgaatgacaattac1320

gactcgctgaagaaggcctacatcgaccagtgggagaagtactgcgactccctgaacgac1380

ttcggcggcaaggccaactcgctgtacttcaactccatgatgatcctgaaggcctccgag1440

gacaagaccaacaagggcgcctacatcgcatcgctgtcgatcccctggggtgacggccag1500

gaagacgacaatatcggcggctaccacctggtttggtcccgcgacttgtaccacgtggcc1560

aatgccttcattgtggccggcgataccgactcggccaatcgcgccttggactacctggac1620

aaggtggtgaaggacaacggcatgatcccccagaacacctggatcaatggccgcccctac1680

tggaccggcattcagctggacgaacaggccgaccccatcatcctgtcataccgcctgaag1740

cgctacgacctgtacgagtcgctggtgaagcccctggccgacttcatcatgaagatcggc1800

cccaagaccggccaggaaagatgggaggaaattggtggctactcacccgccaccctggca1860

tcggaagttgccggcctgacctgtgcagcctacatcgccgagcagaacaaggacttcgag1920

tccgccaagaagtaccaggagaaggccgacaactggcagcgcctgatcgacaatctgacc1980

tacaccgaaaagggccccttgggcgacggccactactacatccgcattgccggcctgccc2040

gatcccaatgccgacttcatgatctcgatcgccaatggtggcggtgtgtacgaccaaaag2100

gagatcgtggacccctcgttcctggagctggtgcgcctgggtgttaagtccgccgacgac2160

cccaagatcctgaacaccctgaaggtggtggacgagactatcaaggtggacacccccaag2220

ggcccctcgtggtatcgttataatcacgacggctacggcgagatgtcgaagaccgaactg2280

taccacggcaccggcaagggccgtctgtggcccctgttgaccggtgaaagaggtatgtat2340

gagatcgccgccggtaaggacgccacctcgtatgtgaaggccatggagaacttcgccaat2400

gagtccggcatcatctcggaacaggtgtgggaagataccggcctgcccactgactccgcc2460

tcacccctgaattgggcccacgccgagtacgtgatcctgttcgcctccaatatcgagcac2520

aaggtgctggacatgcccgacatcgtgtacaagcgctacgcctcgaagtgatga2574

<210>44

<211>2448

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>44

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatggtg540

cgctacatccccatgggcaacggcaagatcctggtgtccttcaacaacgactacaacctg600

accgacttctacttctcgaaggacatggccgagaaccactccgccggcaagcccttccgc660

tacggcgtgtcgatcaacgacaagttcacctggatcaacgcctcgaacatcgtgtcgaag720

gactactacgaccacaccatgatcggcatcgtgaagtacaacatcaacgacgtgtcgttc780

gaggacgacaacttcgtggacatctacgaggacgtgtacgcccgcaagatcaagatcacc840

aacaagcgcaaggagaagatcaacgtgaagctgttcttccaccagaacttctccatctac900

ggcaacaacatcggcgacaccggcttctactaccccgacaccaacgccatcgtgcactac960

aagggccgccgctacttcatcatctcgaccaccgacggcaagaactcgttcgaccagtac1020

gccatcggcatcaaggacttcaacggcatggccggcacctggaaggacgccgaggacaat1080

aatttgtcgatgggccccatcgccatcggctcggtggactccaccattcgtcactcgatc1140

gacatcgatcccgagtcgcagaaggagctgtactactacatcgcctgcgcccgcgacttg1200

gacaccgtgctgcgcatcaaccgcaacatgtcgaccggcaatctggaccgcatgatgaag1260

cgcaccgagaatttctgggagctgtgggtgtcgaagtcgcccctgaatctgaccgccgag1320

ctgaacgagatgtacaagaagtcgctgttcatcatccgctcgcacatcaatgagaagggc1380

gccgtgatggcctcctcggattcggatatcctgcgctcgaatatggactcgtactactac1440

tcatggccccgcgacgccggctacgcagccatctcaatgatcgtgtccgagcactcggac1500

cccgccaagctgttcttcgacttctgcatcaacaccatctccaaggacggctacttctac1560

cacaagtacaaccccgacggcaagattgcctcgtcgtggctgccctatatcatggacggc1620

aagcgcatcctgcccatccaggaggacgagtcagccatcgtgatcatcgccgcctggtac1680

tactactcgaccaacaatgacatcgagtacatctcctacctgtacgagcgcctgatcaag1740

cgcgtggccgagttcctgtacaacttcacctacgacaacggtctgcccaaggagtcattc1800

gacctgtgggaggagcgcttcggcatccacacctacaccgtggcctcggtgtacatcgcc1860

ctgatctatgccgccaatttcgccgagatcttcaacgagacggacctggcccgcaagtac1920

aagtccaaggccgacaagatgctggagtcgttcgagaagatgttctactcggacgacctg1980

ggctactacgcccgccgcatctacaacggcgacgtggacttcgtgctggactcatcggtg2040

ctgtggctggtgatcttcggcatcaagaagcccgatgacccacgcatcgtgtccaccgtg2100

aaggccatcgagaagaagctgtgggtgcccggcatcggtggtatcgccagatacgagggc2160

gactactaccagcgcatctcgggcaagaatatccccggcaacccctggatcatcactacc2220

ctgtggctggccgactattacatcatggccggcaataccggccgcgccctggagctgatc2280

aactgggtggttcagcactcagaggagtcgggcatcctgtcggagcagatcaatcccgat2340

aatggcgagcccatctcggtgtcccccctgatctggtcgcactcgcagctggtgctgact2400

ctgaagcgctacaaggacgccatcaagaacaagggcatccagtgatga2448

<210>45

<211>2340

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>45

tcggtcgggtccggacgggcggtccaacccgccccatttcgtgggcaacatgccccatct60

cctgcccgggggatggggcatgaccatgccgcgtccgggttggtcaccgcgcgccgcatg120

tgccggcgatgacaacgtgatttgccatccggggggtcttttgcctcagcgtgaaccgca180

cagctagaattggtcagcgccgtgtacgccgctccagacctagtgtgtggcgtcgttgtc240

gatggtccggcccgtccctgcggacggacgggaattatcgggagcgaatcgccgttccgt300

tcagcgggatgcgtttgcgcgcgtcacaatctcacatccatccaacatcggagccctact360

acgtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggct420

cgctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccatct480

cgaagcgtgccacctgggactcgtggttgtcgaatgaggccaccgtggcccgcactgcca540

tcctgaataatattggtgccgacggtgcctgggtgtcgggtgccgattcaggtattgtgg600

tggcctcgccctcgactgacaatcccgactacttctacacctggacccgcgactcgggct660

tggtgctgaagaccctggtggacctgttccgcaacggcgacacctcgctgctgtcgacca720

tcgagaattacatctcggcccaggccatcgtgcagggtatctcgaatccctcgggcgacc780

tgtcatcgggcgccggcttgggtgagccaaagttcaatgtggatgaaactgcctacactg840

gctcgtggggccgtccccaaagagacggccccgccttacgtgccaccgccatgatcggtt900

tcggtcagtggctgttggacaatggctacacctccactgccaccgacatcgtgtggcccc960

tggtgcgcaatgacctgtcgtacgtggcccagtactggaaccagaccggctacgacctgt1020

gggaggtgaatggctcgtcgttcttcaccattgcagtgcagcaccgtgccctggtggaag1080

gttcggccttcgcaaccgccgtcggctcctcgtgctcatggtgcgattcgcaagcacccg1140

aaatcctgtgctacctgcagtcgttctggaccggctcgttcattctggccaacttcgact1200

cgtcgcgctccgccaaggacgccaatactctgctgctgggctcaatccacaccttcgacc1260

ccgaggccgcatgcgacgactcaaccttccaaccctgttcaccccgcgcactggccaatc1320

acaaggaggtggtggactcgttccgctcgatctacaccttgaatgacggcctgtcagact1380

cggaagccgtggccgtgggccgctaccccgaggacacttactataatggcaatccctggt1440

tcctgtgcaccttggccgcagccgagcagctgtacgacgcactgtatcagtgggacaagc1500

agggctcgctggaggtgaccgatgtgtcgctggacttcttcaaggccctgtattcggacg1560

ccaccggcacctactcctcctcgtcgtcgacctactcgtccatcgtggacgccgtgaaga1620

ccttcgcagacggcttcgtgtcgatcgtggagactcacgccgcctcgaatggctccatgt1680

cggagcagtacgacaagtcggatggcgaacagctgtcggcccgcgacctgacctggtcat1740

atgccgccttgctgactgccaataaccgtcgtaatgtggtgccctcagcctcctggggtg1800

agacgtcggcctcgtcggtgcccggtacttgtgcagccacctcagccattggcacctact1860

catcagtgaccgtcacttcatggccatcgattgtggcaaccggcggcaccactaccaccg1920

ccaccccaactggctccggttcggttacttccacctcgaagaccaccgcaaccgcctcaa1980

agacctcaacctcgacctcatccacctcatgcaccacccccaccgccgtggcagtgacct2040

tcgacctgaccgccaccactacctacggcgagaatatctacctggtgggttcgatctcgc2100

agctgggcgactgggagacgtcagatggcatcgccctgtcagcagacaagtacacctcgt2160

cagatcccctgtggtatgtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagt2220

tcatccgcatcgaatcggacgattcagtggagtgggagtccgatcccaatcgtgagtaca2280

ccgtgccacaggcctgcggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2340

<210>46

<211>2383

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>46

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

atgctcactcgcaagagagtggttgcagcgggagctgccgccaccctgtccctcacggcg480

tttgccgggttgcagcccgccagcgccgccaccggccccatctcgaagcgtgccacctgg540

gactcgtggttgtcgaatgaggccaccgtggcccgcactgccatcctgaataatattggt600

gccgacggtgcctgggtgtcgggtgccgattcaggtattgtggtggcctcgccctcgact660

gacaatcccgactacttctacacctggacccgcgactcgggcttggtgctgaagaccctg720

gtggacctgttccgcaacggcgacacctcgctgctgtcgaccatcgagaattacatctcg780

gcccaggccatcgtgcagggtatctcgaatccctcgggcgacctgtcatcgggcgccggc840

ttgggtgagccaaagttcaatgtggatgaaactgcctacactggctcgtggggccgtccc900

caaagagacggccccgccttacgtgccaccgccatgatcggtttcggtcagtggctgttg960

gacaatggctacacctccactgccaccgacatcgtgtggcccctggtgcgcaatgacctg1020

tcgtacgtggcccagtactggaaccagaccggctacgacctgtgggaggtgaatggctcg1080

tcgttcttcaccattgcagtgcagcaccgtgccctggtggaaggttcggccttcgcaacc1140

gccgtcggctcctcgtgctcatggtgcgattcgcaagcacccgaaatcctgtgctacctg1200

cagtcgttctggaccggctcgttcattctggccaacttcgactcgtcgcgctccgccaag1260

gacgccaatactctgctgctgggctcaatccacaccttcgaccccgaggccgcatgcgac1320

gactcaaccttccaaccctgttcaccccgcgcactggccaatcacaaggaggtggtggac1380

tcgttccgctcgatctacaccttgaatgacggcctgtcagactcggaagccgtggccgtg1440

ggccgctaccccgaggacacttactataatggcaatccctggttcctgtgcaccttggcc1500

gcagccgagcagctgtacgacgcactgtatcagtgggacaagcagggctcgctggaggtg1560

accgatgtgtcgctggacttcttcaaggccctgtattcggacgccaccggcacctactcc1620

tcctcgtcgtcgacctactcgtccatcgtggacgccgtgaagaccttcgcagacggcttc1680

gtgtcgatcgtggagactcacgccgcctcgaatggctccatgtcggagcagtacgacaag1740

tcggatggcgaacagctgtcggcccgcgacctgacctggtcatatgccgccttgctgact1800

gccaataaccgtcgtaatgtggtgccctcagcctcctggggtgagacgtcggcctcgtcg1860

gtgcccggtacttgtgcagccacctcagccattggcacctactcatcagtgaccgtcact1920

tcatggccatcgattgtggcaaccggcggcaccactaccaccgccaccccaactggctcc1980

ggttcggttacttccacctcgaagaccaccgcaaccgcctcaaagacctcaacctcgacc2040

tcatccacctcatgcaccacccccaccgccgtggcagtgaccttcgacctgaccgccacc2100

actacctacggcgagaatatctacctggtgggttcgatctcgcagctgggcgactgggag2160

acgtcagatggcatcgccctgtcagcagacaagtacacctcgtcagatcccctgtggtat2220

gtgaccgtgaccctgcccgccggcgagtcgttcgagtacaagttcatccgcatcgaatcg2280

gacgattcagtggagtgggagtccgatcccaatcgtgagtacaccgtgccacaggcctgc2340

ggcacctcaaccgccaccgtgaccgacacctggcgctagtgat2383

<210>47

<211>1893

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>47

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccgagtcg540

accctgcgcgagctggccgcccagaacggcggccgccacttcggcaccgccatcgcctac600

tcgcccctgaactcggacgcccagtaccgcaacatcgccgccacccagttctcggccatc660

acccacgagaacgagatgaagtgggagtcgctggagccccagcgcggccagtacaactgg720

tcgcaggccgacaacatcatcaacttcgccaaggccaacaaccagatcgtgcgcggccac780

accctggtgtggcactcgcagctgccctcgtggctgaacaacggcggcttctcgggctcg840

cagctgcgctcgatcatggagaaccacatcgaggtggtggccggccgctaccgcggcgac900

gtgtacgcctgggacgtggtgaacgaggccttcaacgaggacggcaccctgcgcgactcg960

atctggtaccgcggcatgggccgcgactacatcgcccacgccttccgcaaggcccacgag1020

gtggaccccgacgccaagctgtacatcaacgactacaacatcgagggcatcaacgccaag1080

tcgaacggcctgtacaacctggtggtggacctgctgcgcgacggcgtgcccatccacggc1140

atcggcatccagtcgcacctgatcgtgggccaggtgccctcgaccttccagcagaacatc1200

cagcgcttcgccgacctgggcctggacgtggccatcaccgagctggacatccgcatgcag1260

atgcccgccgaccagtacaagctgcagcagcaggcccgcgactacgaggccgtggtgaac1320

gcctgcctggccgtgacccgctgcatcggcatcaccgtgtggggcatcgacgacgagcgc1380

tcgtgggtgccctacaccttccccggcgagggcgcccccctgctgtacgacggccagtac1440

aaccgcaagcccgcctggtacgccgtgtacgaggccctgggcggcgactcgtcgggcggc1500

ggccccggcgagcccggcggccccggcggccccggcgagcccggcggccccggcggcccc1560

ggcgagcccggcggccccggcgacggcacctgcgccgtgaactacaccgtggtgaacgac1620

tggggccacggcatgcagggcgccatcaccgtgtcgaacaccggctcgtcgcccatcaac1680

aactggaccctgcagttctcgttctcgggcgtgaacatctcgaacggctggaacggcgag1740

tggtcgcagtcgggctcgcagatcaccgtgcgcgcccccgcctggaactcgaccctgcag1800

cccggccagtcggtggagctgggcttcgtggccgacaagaccggcaacgtgtcgcccccc1860

tcgcagttcaccctgaacggcgccacctgctcg1893

<210>48

<211>1764

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>48

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccaacgac540

tcgcccttctacgtgaaccccaacatgtcgtcggccgagtgggtgcgcaacaaccccaac600

gacccccgcacccccgtgatccgcgaccgcatcgcctcggtgccccagggcacctggttc660

gcccaccacaaccccggccagatcaccggccaggtggacgccctgatgtcggccgcccag720

gccgccggcaagatccccatcctggtggtgtacaacgcccccggccgcgactgcggcaac780

cactcgtcgggcggcgccccctcgcactcggcctaccgctcgtggatcgacgagttcgcc840

gccggcctgaagaaccgccccgcctacatcatcgtggagcccgacctgatctcgctgatg900

tcgtcgtgcatgcagcacgtgcagcaggaggtgctggagaccatggcctacgccggcaag960

gccctgaaggccggctcgtcgcaggcccgcatctacttcgacgccggccactcggcctgg1020

cactcgcccgcccagatggcctcgtggctgcagcaggccgacatctcgaactcggcccac1080

ggcatcgccaccaacacctcgaactaccgctggaccgccgacgaggtggcctacgccaag1140

gccgtgctgtcggccatcggcaacccctcgctgcgcgccgtgatcgacacctcgcgcaac1200

ggcaacggccccgccggcaacgagtggtgcgacccctcgggccgcgccatcggcaccccc1260

tcgaccaccaacaccggcgaccccatgatcgacgccttcctgtggatcaagctgcccggc1320

gaggccgacggctgcatcgccggcgccggccagttcgtgccccaggccgcctacgagatg1380

gccatcgccgccggcggcaccaaccccaaccccaaccccaaccccacccccacccccacc1440

cccacccccacccccccccccggctcgtcgggcgcctgcaccgccacctacaccatcgcc1500

aacgagtggaacgacggcttccaggccaccgtgaccgtgaccgccaaccagaacatcacc1560

ggctggaccgtgacctggaccttcaccgacggccagaccatcaccaacgcctggaacgcc1620

gacgtgtcgacctcgggctcgtcggtgaccgcccgcaacgtgggccacaacggcaccctg1680

tcgcagggcgcctcgaccgagttcggcttcgtgggctcgaagggcaactcgaactcggtg1740

cccaccctgacctgcgccgcctcg1764

<210>49

<211>2604

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>49

ccaccgtgagctgcacctgaatcagctgagaatgccctgaaccctcaaacccgcaccctg60

aacctcaaccttgcgttgaacccgaggggtgcgggttggacgcgcaccccgaccactgca120

ccccgcggggcgcccctgtgacgaccatggtctgattcacgcctgaaatcactccccgcc180

ggggtggagaaccacgtcaacgcggccgtggatcacatcgggcgtcgaaaaacaaccccc240

catttccccaaccctcaacctgatcctgcactgttgtcgggtttgctgagagccgcctaa300

gctgccgcacgttgtcccagttggggcgtggcctgctgcatacggggccgggaaagacgc360

ctcacctgggatgacgcggaccattggacacggcctttccggccgcgggaaggaccagac420

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg480

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactcccccgccggc540

acctacaactacggcgaggccctgcagaagtcgatcatgttctacgagttccagcgctcg600

ggcgacctgcccgccgacaagcgcgacaactggcgcgacgactcgggcatgaaggacggc660

tcggacgtgggcgtggacctgaccggcggctggtacgacgccggcgaccacgtgaagttc720

aacctgcccatgtcgtacacctcggccatgctggcctggtcgctgtacgaggacaaggac780

gcctacgacaagtcgggccagaccaagtacatcatggacggcatcaagtgggccaacgac840

tacttcatcaagtgcaaccccacccccggcgtgtactactaccaggtgggcgacggcggc900

aaggaccactcgtggtggggccccgccgaggtgatgcagatggagcgcccctcgttcaag960

gtggacgcctcgaagcccggctcggccgtgtgcgcctcgaccgccgcctcgctggcctcg1020

gccgccgtggtgttcaagtcgtcggaccccacctacgccgagaagtgcatctcgcacgcc1080

aagaacctgttcgacatggccgacaaggccaagtcggacgccggctacaccgccgcctcg1140

ggctactactcgtcgtcgtcgttctacgacgacctgtcgtgggccgccgtgtggctgtac1200

ctggccaccaacgactcgacctacctggacaaggccgagtcgtacgtgcccaactggggc1260

aaggagcagcagaccgacatcatcgcctacaagtggggccagtgctgggacgacgtgcac1320

tacggcgccgagctgctgctggccaagctgaccaacaagcagctgtacaaggactcgatc1380

gagatgaacctggacttctggaccaccggcgtgaacggcacccgcgtgtcgtacaccccc1440

aagggcctggcctggctgttccagtggggctcgctgcgccacgccaccacccaggccttc1500

ctggccggcgtgtacgccgagtgggagggctgcaccccctcgaaggtgtcggtgtacaag1560

gacttcctgaagtcgcagatcgactacgccctgggctcgaccggccgctcgttcgtggtg1620

ggctacggcgtgaaccccccccagcacccccaccaccgcaccgcccacggctcgtggacc1680

gaccagatgacctcgcccacctaccaccgccacaccatctacggcgccctggtgggcggc1740

cccgacaacgccgacggctacaccgacgagatcaacaactacgtgaacaacgagatcgcc1800

tgcgactacaacgccggcttcaccggcgccctggccaagatgtacaagcactcgggcggc1860

gaccccatccccaacttcaaggccatcgagaagatcaccaacgacgaggtgatcatcaag1920

gccggcctgaactcgaccggccccaactacaccgagatcaaggccgtggtgtacaaccag1980

accggctggcccgcccgcgtgaccgacaagatctcgttcaagtacttcatggacctgtcg2040

gagatcgtggccgccggcatcgaccccctgtcgctggtgacctcgtcgaactactcggag2100

ggcaagaacaccaaggtgtcgggcgtgctgccctgggacgtgtcgaacaacgtgtactac2160

gtgaacgtggacctgaccggcgagaacatctaccccggcggccagtcggcctgccgccgc2220

gaggtgcagttccgcatcgccgccccccagggcaccacctactggaaccccaagaacgac2280

ttctcgtacgacggcctgcccaccacctcgaccgtgaacaccgtgaccaacatccccgtg2340

tacgacaacggcgtgaaggtgttcggcaacgagcccgccggcggctcggagaaccccgac2400

cccgagatcctgtacggcgacgtgaactcggacaagaacgtggacgccctggacttcgcc2460

gccctgaagaagtacctgctgggcggcacctcgtcgatcgacgtgaaggccgccgacacc2520

tacaaggacggcaacatcgacgccatcgacatggccaccctgaagaagtacctgctgggc2580

accatcacccagctgccccagggc2604

<210>50

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>50

gatcggcacgtaagaggttccaactttcaccccgaggtccacacgccgg49

<210>51

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>51

ggcgcgcttgttcagggggccctcctgcagggcattcgcaggcgccatg49

<210>52

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>52

ctgcaggagggccccctgaacaagcgcgcc30

<210>53

<211>50

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>53

ctatttcgttcatccatagttgcctgactcatgggattcagttgtaggtg50

<210>54

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>54

ccacgagtcccaggtggcacgcttcgagatggcattcgcaggcgccatg49

<210>55

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>55

atctcgaagcgtgccacctgggactcgtgg30

<210>56

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>56

cacggcggagatgttgttgaagcggtcgatggcattcgcaggcgccatg49

<210>57

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>57

atcgaccgcttcaacaacatctccgccgtg30

<210>58

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>58

cttgatcgacttctcgaccaggttctccatggcattcgcaggcgccatg49

<210>59

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>59

atggagaacctggtcgagaagtcgatcaag30

<210>60

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>60

caggcgctcgatcttgatgttggagatgttggcattcgcaggcgccatg49

<210>61

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>61

aacatctccaacatcaagatcgagcgcctg30

<210>62

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>62

gccgttgcccatggggatgtagcgcaccatggcattcgcaggcgccatg49

<210>63

<211>30

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>63

atggtgcgctacatccccatgggcaacggc30

<210>64

<211>49

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>64

gatcggcacgtaagaggttccaactttcaccccaccgtgagctgcacct49

<210>65

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>65

ggcgcgcttgttcagggggccctcctgcagggcctgtgcaagtggtgcaaac52

<210>66

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>66

ccacgagtcccaggtggcacgcttcgagatggcctgtgcaagtggtgcaaac52

<210>67

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>67

cacggcggagatgttgttgaagcggtcgatggcctgtgcaagtggtgcaaac52

<210>68

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>68

cttgatcgacttctcgaccaggttctccatggcctgtgcaagtggtgcaaac52

<210>69

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>69

caggcgctcgatcttgatgttggagatgttggcctgtgcaagtggtgcaaac52

<210>70

<211>52

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>70

gccgttgcccatggggatgtagcgcaccatggcctgtgcaagtggtgcaaac52

<210>71

<211>50

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>71

gatcggcacgtaagaggttccaactttcacctcggtcgggtccggacggg50

<210>72

<211>54

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>72

cacgcgcgccgtcttgacgaagggattcacgtagtagggctccgatgttggatg54

<210>73

<211>43

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>73

cggccgcgggaaggaccagacatgctcactcgcaagagagtgg43

<210>74

<211>40

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>74

ccaggtggcacgcttcgagatggggccggtggcggcgctg40

<210>75

<211>55

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>75

gttctgggcggccagctcgcgcagggtcgactcggcctgtgcaagtggtgcaaac55

<210>76

<211>33

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>76

gagtcgaccctgcgcgagctggccgcccagaac33

<210>77

<211>55

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>77

tctatttcgttcatccatagttgcctgactcgagcaggtggcgccgttcagggtg55

<210>78

<211>55

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>78

catgttggggttcacgtagaagggcgagtcgttggcctgtgcaagtggtgcaaac55

<210>79

<211>33

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>79

aacgactcgcccttctacgtgaaccccaacatg33

<210>80

<211>55

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>80

tctatttcgttcatccatagttgcctgactcgaggcggcgcaggtcagggtgggc55

<210>81

<211>55

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>81

ctgcagggcctcgccgtagttgtaggtgccggcggcctgtgcaagtggtgcaaac55

<210>82

<211>33

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>82

gccggcacctacaactacggcgaggccctgcag33

<210>83

<211>51

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>83

tctatttcgttcatccatagttgcctgactgccctggggcagctgggtgat51

<210>84

<211>1212

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>84

tcagtccacctccaccaattcgtgttcgattccgtgctcttgcagccaccgcgccaagcc60

agcttgaccgcccaattcgcaacttcgcagacactcgtagagcttctgctgccccaccag120

gcgacgccatccgtcacccgtgatcaaagcgacagtgtcagcaacagacccgacttcctc180

agccgcgatcacgtcgtcagattcctcaaccatgaggccgagacggtccctcaaccccgc240

agaccagccaatctgtctgcgtccccggctacccttctcccactcgaaccagagaccaac300

ctctttcgccaagccgttggccgcgtcgcccaggacctcccaagtcgatcgagtcgagag360

cgcagaacgcgccgtcttgctctgggagttcgtcaactcgtggccgatcttcccctggaa420

ctgcgccttgctcaggtagcgcgcgaggtgatccaggccagttgctgcgctcatctgctg480

aacgtcttgcgcgcgagcaaggggagtcccgaggccagcagcgagcacgccgcgttccca540

acggccgaacatggaccggtgcagcgccagagcgtcgccgaagtcgccgaccaggaacac600

gagcacatgcagatgcacatgccacccattgcgcccgtgcgtaacctcgaccacacgcac660

gaagccctcgaccccgtgacggagctggtcagacgtccagcccttgcccgaagtgactcg720

ccgccaccccgaagcgacaccatcccaaacagccgtcaaggaatccttacgagagtgccg780

aaccgtgaacgtcatgaacgccacacgaccaccgtgcttagtccaggtctcgaccgccgc840

gccgagttcaaggccacgccgagccatgatcttcgcgttacacaccgggcaggcccagac900

cgatccgcagctctgcaacccagcgaaaccggcccggccgtcgctgcaccgcacaccaac960

cgaagcgaccgccgaggcggcaacacgaccgcagaacgcaacccgcttcaacgacgtatg1020

acgccacaaccaataacggaccgaaaaccggtgtttgcgcttgtcagcagccacttcacc1080

agcagccggcaccgcggaaggtgaaacattgttcgcatgattatctagggcgccccctag1140

cggggccaccgcagggctcccgcccccacacccccggacgccacgacttcgcgccctggc1200

atcgaccaccat1212

<210>85

<211>1176

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>85

tcaattggcctccgccgcggtcttcgtaagcgcgcgtctggtgagaagcatgatgacgag60

agcgatcgctgtcagcaccgaagcgacccaaaccggcgcgagcagccccagcccggtcgc120

gagcccgagcgcaccaagcacgggccccgctgcagctccgatattcaatgctgcggttgc180

gtacgaaccgcccatcgttggcgcacccgatgctgcatacagcacacgcgtgatcagagt240

actgccgacgccgaacgacaggaatccctgaacgaggacgaggacgataagcgcaacggg300

atgagatgcgaccactgccaacacgatccagcctgtcagcaatagcggtccgccgactgc360

gagcacgaggccaggtcgttgatctgatagtcgtcctgcgatcgtgacgccaaggaacga420

tccgatgccgaacatcaccagcgcgacggacacccacgcttcggccaagcccgcggtctc480

ggtcacgatgggtgccaggaaggtgaatgccgcaaaggtccctccgttgatcagcgctcc540

gagtgccatggccaggatgagccgcggcgtcgccaactggctgagctcgacacggagcct600

tggtgaggtcgcgctagtctcgctccgaccaacattgttcgtgacgccacgaatgactcc660

aacggccgcgggaatacagaggatggcgatcgcccagaacgtcgttcgccagcccagcgc720

tgtgccgagcagtgccccggcggggacgcccacgacggttgcgatcgtcgtgccggagag780

caggatcgacagtgcacgccccttctggttcgctggcacgagggtagtggccgtgctcag840

tgctacggcgaggaatcctgcgtttgcgagagcgctgagcacccgggtgatgagcaggag900

agagaacactggtgtcatcgctccgatgacgtggcttcccgcgaacacgagaaggcaaac960

gatcaatgtgagccgcggtggccaacggcgagcgaatgccgccatcactggcgcgccgac1020

gaccataccgactgcgaatgcggaggtcagcaggcccgcagtgccgaccgagacgtcaag1080

ttcggtcgcgatcgcggggagcaatcccgcgagcatgaattctgaagtgcccatgacgaa1140

gaccgccagggcaagcatgtagagggcaaaaggcat1176

<210>86

<211>54

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>86

tcaagaaatggttcttcttgtcaccacggccagcgccccgggtacgccagacat54

<210>87

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>87

metalathrglyalaalaalaalametphevalthrthrphealagly

151015

metalaproalaasnalalysgluvalalaser

2025

<210>88

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>88

metasnprophevallysthralaargvalalailethrserthrleu

151015

valalaglyserleualathralaserleuvalphealaproleuala

202530

glnalaasptyrserproleu

35

<210>89

<211>56

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>89

metalaserserasnalaalalysseralaserargarggluglnleu

151015

argalaalaarggluargglualaalaalaalaargarglysargile

202530

ileilevalthrvalvalvalvalileilealaalaleuvalalaval

354045

ilealametalaalaserglyval

5055

<210>90

<211>33

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>90

metleuthrarglysargvalvalalaalaglyalaalaalathrleu

151015

serleuthralaphealaglyleuglnproalaseralaalathrgly

202530

pro

<210>91

<211>58

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>91

metalaserserasnalaalalysseralaserargarggluglnleu

151015

argalaalaarggluargglualaalaalaalaargarglysargile

202530

thrvalvalalavalalavalvalvalalaalavalleuvalalaval

354045

ilealametalaalaglyglyvalphegly

5055

<210>92

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>92

metalalysleuleutyrargleuglyargglyalaalahisargala

151015

trpalavalileilecystrpleuilevalleualaalaalaglygly

202530

alatyralaalaphehisglythrleu

3540

<210>93

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>93

metserargserglyargargasnargleuvalalapheleuleuleu

151015

thralaleuvalalaserthrilemetleuglythrserseralahis

202530

alaaspaspglytrpserser

35

<210>94

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>94

metargargglyvalhisglyalavalvalleuleuleuglyalamet

151015

metalathrleutrpvalalaleuglyproglythrproalaargala

202530

glnthraspglnproval

35

<210>95

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>95

metargargphepheseralaalailealaileleuleualaalathr

151015

leuthrproalaleuasnalaprometalaseralaalaaspglnthr

202530

serala

<210>96

<211>33

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>96

metargleualaargargvalalaalavalleuleualaservalleu

151015

alaleuthrvalalasercysalaglyalaalaargseralaproser

202530

leu

<210>97

<211>62

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>97

metaspserproserargseraspalathrthraspglygluaspasp

151015

alametthralaglnserargargproglyglnalaalaargphegly

202530

argvalproilealavalleuvalthralaleuleuleuvalvalgly

354045

valleualaalathrproprothralaglyalathrprogly

505560

<210>98

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>98

metthrhisvalservalthrargproargargileglyalaleuala

151015

leualaalaalaalaalavalalaleuseralacysglyalasergly

202530

metleualaglnserpro

35

<210>99

<211>37

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>99

metserseralaargargalaargargproservalphethrleuval

151015

valvalglyvalvalalaleuvalleuvalleuglyalaalaalaala

202530

trpglnvaltrpgly

35

<210>100

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>100

metpheglylysargargilealaleuileleuleuserleuleuval

151015

alaglyservalvalalaalavalserproser

2025

<210>101

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>101

metalathralaalaalaalathrleuvalileserserleuglyval

151015

thralaseralaglyalaaspthrvallysgly

2025

<210>102

<211>54

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>102

metilemetproserserargargargproleuthrprothrproser

151015

glyvalargalasertrpthrargleuvalglyleualaalaleupro

202530

leuvalleuvalalaalaglycysalaalaserproglyserglythr

354045

serproseralaglythr

50

<210>103

<211>65

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>103

metasnprovalserproargasnseralaproserhisseralaser

151015

serglnglyseralaalaprohisvalleuserthrthrleuserarg

202530

argargleuleusermetalaalaleuglyalaglyalavalalaleu

354045

alaalacysalaglyproserthrserserglyalaserserserala

505560

ala

65

<210>104

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>104

metthrpheargleuargalaargprovalilealaalaleuserval

151015

leualaleualaalacysalaglnproproseralaarghisthrglu

202530

thrgly

<210>105

<211>35

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>105

metlysleuargproleuvalleuvalvalglyalaalaleuserval

151015

thrleuvalalaglycysglyglyasnserserglyglyalaserser

202530

seralapro

35

<210>106

<211>57

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>106

metthralaglyargproglyalaargglnargproproglyalaala

151015

prohisargargthrglyglyalathrargalaalaleumetglyphe

202530

leualaleuleumetvalalaleuglyleuthralaalaproglnarg

354045

alaleualaglnthrseraspserphe

5055

<210>107

<211>56

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>107

metlysseralathrargargproleuthrargtrpilevalalaphe

151015

glyvalvalleuvalleuvalilealaglyservalglyleuhisala

202530

serglyalaleuvalserglyglyalaserthrvalproalaglyval

354045

phealathrproalathrasnleu

5055

<210>108

<211>36

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>108

metargleuglnargargglyleuleualatrpalaglyalaalaala

151015

alaalaalathrleuseralacysglyglylysserserserserser

202530

thrleuserser

35

<210>109

<211>54

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>109

metserproarghisalaaspaspalaserglyaspargargargthr

151015

glyproglnalaargleuproargtrpleualaglyleuleucysile

202530

valleuthrthrleuserleuglyvalvalhisproalavalargala

354045

aspaspalathrleuasp

50

<210>110

<211>28

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>110

metlysargvalleuilevalvalleualaleuleuleuileileala

151015

glyglyleualaglyasnalapheargasnalaarg

2025

<210>111

<211>53

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>111

metgluserilevalvalthrproargasnprohisargserhisarg

151015

proargleuargargalaserargleualavalpheglymetalaleu

202530

alaleuvalthralacysseralaserproglyglyalaglyglyser

354045

thrseralaargasp

50

<210>112

<211>36

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>112

metlystyrargproleuvalvalleuglysercysalaleualaleu

151015

glyleuvalalaglycysseralalysproalavalserglyalagly

202530

serseralaser

35

<210>113

<211>51

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>113

metsermetthrasphisserasphisalaalaseralaseralaser

151015

arghisargtrpthrargtrpalaserleualaleuvalproileleu

202530

leuleualaalaglycysserlysseraspalaseralaserproser

354045

seralaser

50

<210>114

<211>49

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>114

metasnthrmetasnglyproglngluvalservalasnarghispro

151015

trpargargargphealaalaleuglyseralaalaalailealaleu

202530

glyglymetthrphevalserproalaglualaglnalaalaglyval

354045

gln

<210>115

<211>49

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>115

metlyshisalahisargileleualaleuvalalaalaalaproleu

151015

leuleuthralacysglyserasnaspglyserthrproalaserthr

202530

proserserserthrprothrthralaseralaserhisseralathr

354045

pro

<210>116

<211>49

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>116

metseraspthrproargproserhisaspproargprolysvalthr

151015

leuargthrvalleuilealaileglyvalvalleuvalvalleuile

202530

alaglyalailevalvalthrthrargasnalaserthrproaspthr

354045

asn

<210>117

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>117

metserhisthrvalargglytyrleuargalaleuglyalaproval

151015

alaleuvalphealavalthralacysglyalaproglnalaglygln

202530

alaserserseralathrthr

35

<210>118

<211>33

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>118

metserargargphealathrthrleualaalaseralaleuserleu

151015

valvalleualaglycysserthralathralaglyprosersergly

202530

thr

<210>119

<211>46

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>119

metglnalaserhisproserargserthrargtrpcysalaleuile

151015

alaglycysleuglyseralaleuvalleuseralacysseralagly

202530

serglyglyserthralaproalaserserserargalaala

354045

<210>120

<211>44

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>120

metlysserserprothrleualavalalaalaleuglyleucysala

151015

ilethralaleualaglycysserserserthrserglyserserser

202530

serproserasnthralathralaleusermetlys

3540

<210>121

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>121

metserleualaargargalaleuthrvalalaleualaglyalacys

151015

alaleuvalalaleuserglycysglyglyserthrserthralapro

202530

alaserthrproglyserhis

35

<210>122

<211>45

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>122

metleualaglyproserlyslysserileprotyrthrargthrala

151015

glypheileleualaalaileproalavalglyleuserleualaleu

202530

alaproserhisalaseralaaspthrvalsergluthr

354045

<210>123

<211>44

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>123

metserserargglnglyaspserargleutyrserphevalileleu

151015

alavalleuservalthrcysglyvalpheilealaglymetglyile

202530

prophealaalaleualaseraspalaalaglyser

3540

<210>124

<211>44

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>124

metalaasplyslysproglyargglyarglysilethrargargmet

151015

alathrvalleuvalglyalaleualaglyleuleuphevalalaala

202530

alathrthrserhisglyseraspleuargprothr

3540

<210>125

<211>44

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>125

metlysalathrargargservalleualaglysermetalavalala

151015

glysertrpleuleualaalacysseralaasnserproserasnser

202530

valserglnalaphealathrproseralaleuthr

3540

<210>126

<211>43

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>126

metasnvalileserproleuvalproserglyargserargileala

151015

cysleuvalalaalaalaleuilevalleuglyleuglyvalproala

202530

ileargalaalaalavalprothrproaspgln

3540

<210>127

<211>42

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>127

metserargserserleuargilealaalaalaglyleuvalalaval

151015

thrleuleuserthralaalacysserglyserserserserthrser

202530

serserseralaalaalaleuproserval

3540

<210>128

<211>42

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>128

metpheileserargpheargargalaalaalavalglyleualaala

151015

valthralaleuseralathralacysserglyserserserserser

202530

serserseralaserseralaleuproser

3540

<210>129

<211>43

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>129

metasnphethrproargthrargleuserargtrpalavalglyleu

151015

valleuglyalaleuilevalproleualaalacysserthrproser

202530

serserserseralaseralaglylysleuasn

3540

<210>130

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>130

metserserthrargphethrasnargglythrleualavalvalala

151015

leuseralaalaleuleualaglyglyleuthralacyssersergly

202530

alaglyseraspthrserproalathr

3540

<210>131

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>131

metalametargalaarghisglyvalvalargleuglyleuvalcys

151015

leuthralaleualavalpheglythralaasnvalserglyglnval

202530

alavalmetalagluglythraspala

3540

<210>132

<211>29

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>132

metthrarghisserargleuthrargpheleuleuvalleuleuala

151015

leuthrleuglythralametseralacysglyasngln

2025

<210>133

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>133

metasnleusertrpglnlysargleualaalaleualavalalaala

151015

thrleuthrglycysglyalathrthralaserserprothrthrthr

202530

alaseralaglnalaalaalathrser

3540

<210>134

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>134

metserargileglnleuproargleuserargilealailealaala

151015

alaalaseralaalaleuileglythrserpheilealaproalathr

202530

alaphealaalaproasnthrprothr

3540

<210>135

<211>40

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>135

metglypheargvalglyargargproleuileglyalavalleuala

151015

glysermetalathrleuvalglycysserthrserglyserglyser

202530

glyalaserserglnalahisasn

3540

<210>136

<211>40

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>136

metthrleuargarghisleualaproalaleuvalalaproalaleu

151015

alaalaalailepheleuglyglycysalaalaglnasnproarggly

202530

aspalaserserserglyalaser

3540

<210>137

<211>40

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>137

metleulysproargleuvalvalleuglyleuserleualaleuala

151015

metvalglycysalaargthrproproserserglyserserserala

202530

hisalaglnvallysalacysleu

3540

<210>138

<211>41

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>138

metthrleuargargalavalilealaleuilealaalametserleu

151015

leuleualaglycysserglyserserserserserlysserserala

202530

seralaserglyglyalaalaalagly

3540

<210>139

<211>40

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>139

metservalserleuserargilealacysvalglyalaleualathr

151015

alaleuvalleuserglycysserglyserserglyserglyalalys

202530

valalaseraspcyslysproala

3540

<210>140

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>140

metserargargargpheleuleuglyvalseralavalvalglyala

151015

seralaleuglyalaseralaleualaglycysserasnilealaser

202530

alaglythrargalaglygln

35

<210>141

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>141

metargserthrthrthrlysalaphealaglyvalalavalleuala

151015

leualaleualaglycysglyserasnserglyserserthrlysser

202530

alaaspserasnalalysleu

35

<210>142

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>142

metasnhisvalserleulysserargileleuvalalaalaleuala

151015

alaglymetleuglyleuseralacyssersergluglyproalaser

202530

seralasersersergly

35

<210>143

<211>39

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>143

metlysthrargvalargserarglysproalaalaglyleualagly

151015

ilealaleuphealaserglyleuserleumetserthrvalalaser

202530

argalaaspserglyleupro

35

<210>144

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>144

metalagluargthralaargargleuthrargargserleuleuala

151015

ileglyalavalglyserleuthralaleualaalacysalaglyala

202530

thrthrprophevalser

35

<210>145

<211>56

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>145

metalaasparglyslysserarglysproargargalaleualapro

151015

seralaserglnarghisglyprohisargthrlyslyslysalaser

202530

argalaargargvalvalthralailealailethrleualathrleu

354045

metilevalglyvalleuglyser

5055

<210>146

<211>37

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>146

metleuthrargargserilealaargargpheleuthrglyalaala

151015

valvalvalglyvalalavalvalthrilephevalvalaspalaleu

202530

valserproalaile

35

<210>147

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>147

methisargcysproleutrpvallystyrleuleuleuvalalaval

151015

glyvalvalprophephealalysasnvalproleuserleualaala

202530

phealavalalaalaval

35

<210>148

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>148

metlyslysleuleualaglyleuleuilevalleuilealavalala

151015

glyphealaglyglyasnleuleuargglnhisthrmetleualaasp

202530

glyalasertyrargphe

35

<210>149

<211>38

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>149

metthrargasnthrargthralailevalalaalaleucyspheval

151015

leuleualaglyalavalthrleuileproileprophevalalatrp

202530

serproglyvalthrtyr

35

<210>150

<211>37

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>150

metasnargservaltyrargthrleuleuargilevalglyileval

151015

leualaleuvalglyvalalaalavalpheglyglyvalphealahis

202530

asnasnvalthrasp

35

<210>151

<211>37

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>151

metserlysthrleuserargilealaservalalaservalalaala

151015

leualaglyserilethrvalilealaglyglnasnalaseralaasp

202530

servalasntrpasp

35

<210>152

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>152

metargargalavalseralavalleualaalavalvalglyleugly

151015

metvalalacysglyproasnlysvalasnseralavalglyaspthr

202530

ilelys

<210>153

<211>36

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>153

metserargargserleuleuvalargileglyvalproalaalaala

151015

leualametphealaglycysserproserproalathralaileglu

202530

leuaspglyala

35

<210>154

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>154

metprothrargargserpheleuphealaalaleuthrvalalaleu

151015

valglycysalaproserprovalvalasnalaproargalaarggly

202530

serval

<210>155

<211>35

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>155

metargargargvalserhisproleuargvalileleuvalglymet

151015

valvalleualacysleuvalleuthrglysertrpalaleuvalhis

202530

glyalaala

35

<210>156

<211>35

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>156

metleuargglnproargglnleuileseralaglyilealaileleu

151015

leuglyvalalaphevalalaalathrphevalpheseralaserleu

202530

asnalagly

35

<210>157

<211>35

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>157

metthrhisleuproserargpheserargargalavalleuthrgly

151015

alaglyvalalavalalaglyglyglyalaalatrpalaalagluarg

202530

pheleuile

35

<210>158

<211>29

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>158

metargargserargcysalaalaalavalpheserilealaleuala

151015

valglyalathrleuglyalavalthrvalphevalser

2025

<210>159

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>159

metalahishisargseralaglytrpleualaleualaalapheval

151015

alaalaservalleuvalglycysaspproproalathrthrglyser

202530

proser

<210>160

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>160

metalaserargalaleugluthrleuserargleuthralaleuval

151015

valglyphevalalametprothrproalavalargaspasphisgly

202530

alaarg

<210>161

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>161

metserthrglyargmetlyspheilelysleualavalprovalile

151015

valalacyscysleuthrprometalaalaleualaaspvalglyser

202530

progly

<210>162

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>162

metlysargileprovalalailevalglycysalavalalaleuval

151015

alaglyseralavalalaglyseralaalaargalaalaargleuasp

202530

alaval

<210>163

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>163

metargleuproargargalavalleuglyalaileglyleualathr

151015

leualaalacysserargasnaspproileglyalaserserserala

202530

serarg

<210>164

<211>34

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>164

metthrserglyhisargasplysmetcysaspvalseralatyrleu

151015

metleuleualaproseralaasnhisvaltyralaalagluthrala

202530

thrleu

<210>165

<211>33

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>165

metarglysleuleulysleuilealaalaleuglyalaphealaleu

151015

alaleuthrglycysserglyglyglyserglyseraspserglyser

202530

ser

<210>166

<211>33

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>166

metthrtrpalaarghisphetrpleulysvalvalseralavaltrp

151015

valleuvalalametglyserthralavalalaalaleuthrilethr

202530

val

<210>167

<211>32

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>167

metilealaleuilealaleuvalleuvalvalalaglythralaleu

151015

valvalhisserleuserthrserargaspalaproargaspmetala

202530

<210>168

<211>32

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>168

metargglyserthrlysmetileilevalglyalavalleuvalval

151015

alailemetvalalaglygluvaltrpglyalaglysersersergly

202530

<210>169

<211>21

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>169

metserargleuleuproargleualaalaprovalvalalaalapro

151015

alaservalhisarg

20

<210>170

<211>74

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>170

metmethisserargargargleuvaltyrlystrpvalthrilethr

151015

valleumetleuglyleualavalalaileaspvalmetileglyasp

202530

argargseraspileglutyrleumettrpservalthralaalaala

354045

ileglytyralaglyserpheglyhisasptrptrpvalargalagly

505560

pheserglyarghishisproleualagly

6570

<210>171

<211>31

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>171

metlysilethrargalaleualaalathralathrleuthralaleu

151015

leuvalglythrglyvalalaglyalaalaalaaspvalthrtrp

202530

<210>172

<211>30

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>172

metthrlysprotrpserargvalvalvalalavalleualaleuleu

151015

leuvalalaglyleuvalalaalaglyvalthrglyleuphe

202530

<210>173

<211>30

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>173

metargargvalleuserservalthrserleuleuvalleuleuala

151015

leuvalproglyglyalailealaleuvalhistrpglyarg

202530

<210>174

<211>30

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>174

mettrpasnalavalleuvalleuthrcysleuseralaglyleuleu

151015

valglythralavalglnalaargleuargalaproglycys

202530

<210>175

<211>29

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>175

metargargargthrthrilealaalaleualaalavalleuserphe

151015

serproleualaalaglnalaalaproalaseralaasp

2025

<210>176

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>176

metlysargargthrleuleuglythrleuglyilemetglyleuser

151015

valproleualaalacysserserlysserser

2025

<210>177

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>177

metthrvalalaglyleuvalthrleumetglyleuthrglycysval

151015

prophealacysseralaileglytrpserasn

2025

<210>178

<211>27

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>178

metalailevalleuleuthrcysalathrglyserproglyvalthr

151015

thrseralaleualaleuthrleucystrppro

2025

<210>179

<211>23

<212>prt

<213>artificialsequence

<220>

<223>artificialsequence

<400>179

metalaleuserleuvalalaalaglycysserserthrglyalathr

151015

alaservalprothrargser

20

<210>180

<211>66

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>180

gtggccacaggtgctgcggccgccatgtttgtgacgacgtttgcgggcatggcgcctgcg60

aatgcc66

<210>181

<211>114

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>181

gtgaatcccttcgtcaagacggcgcgcgtggctatcacctcgacgctggtggcaggctcg60

ctcgccactgccagcctcgtgtttgcaccacttgcacaggccgattactccccc114

<210>182

<211>168

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>182

atggcctcatccaacgccgccaagtcggcgagtcgccgcgagcagctgcgcgccgcccgt60

gaacgcgaggctgcggccgcccgccgcaagcgcatcatcatcgtgaccgtcgtggtcgtc120

atcatcgccgccctggttgccgtgatcgcgatggccgcctccggcgtc168

<210>183

<211>99

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>183

atgctcactcgcaagagagtggttgcagcgggagctgccgccaccctgtccctcacggcg60

tttgccgggttgcagcccgccagcgccgccaccggcccc99

<210>184

<211>174

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>184

atggcctcatccaacgccgccaagtcggcgagtcgccgcgagcagctgcgcgccgcccgt60

gaacgcgaggctgcggccgcccgccgcaagcgcatcaccgtcgtcgccgtggcggtggtc120

gttgcagcggtgttggtcgccgtgatcgccatggccgccggtggtgtgttcggg174

<210>185

<211>123

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>185

atggcgaagttgttgtaccggttgggccgaggggccgcacaccgggcctgggcggtgatc60

atctgctggctaatcgtgctggccgcagccggtggcgcctatgccgcgttccacggcacc120

ctg123

<210>186

<211>117

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>186

gtgagtcggtcgggacggcgcaaccggttggttgcgttcctgttgctgacggccctcgtg60

gcgtccaccatcatgctgggcacatcgtcagcgcacgccgacgacggctggtcgagc117

<210>187

<211>114

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>187

atgcgccgcggggttcacggtgccgtggtgctactgctcggcgccatgatggcgaccctg60

tgggtggccctcggccccggcacgccggcccgtgcccagaccgaccaaccggtg114

<210>188

<211>102

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>188

atgcgtcgattcttcagcgctgccatcgcaatcctgctggcagccaccctcacaccagcg60

ctcaacgcgcccatggcgagtgctgcggaccagacgtccgcg102

<210>189

<211>99

<212>dna

<213>artificialsequence

<220>

<223>artificialsequence

<400>189

atgaggctcgcccgcagggtggcggcagtgttgctggcttcggtgttggcgttgaccgtg60

gcgtcctgcgcaggtgcggcacggtcggcgcccagcctg99

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1