使用新模块二十二碳六烯酸(DHA)合酶生成多不饱和脂肪酸(PUFAS)的制作方法

文档序号:14023816阅读:701来源:国知局
使用新模块二十二碳六烯酸(DHA)合酶生成多不饱和脂肪酸(PUFAS)的制作方法
对相关申请的交叉引用本申请要求2015年6月6日提交的美国临时专利申请号62/172,049的优先权和申请日的权益,其公开内容在此通过提及并入本文。发明领域本发明涉及参与pufa,特别是dha生成的二十碳六烯酸(dha)合酶的分离的核酸分子和多肽。本发明涉及包含核酸分子的载体和宿主细胞、由核酸分子编码的多肽、包含核酸分子或多肽的组合物、以及其制备和使用方法。发明背景多不饱和脂肪酸(pufa)认为可用于营养应用、药物应用、工业应用和其它目的。然而,目前从天然来源和化学合成供应pufa不足以满足长期的商业需求。已经通过表达参与pufa合成途径的外源基因来努力在油籽作物植物或微藻中生产pufa。在用于pufa合成的常规或标准途径中,通过一系列延长和去饱和反应来修饰中等链长饱和脂肪酸(脂肪酸合酶(fas)系统的产物)。用于伸长反应的底物是脂肪酰基-coa(要延长的脂肪酸链的活化形式)和丙二酰基-coa(每个延长反应期间添加的两个碳的来源)。延长酶反应的产物是直链中具有两个另外的碳的脂肪酰基-coa。去饱和酶通过在氧依赖性反应中提取两个氢而在预先存在的脂肪酸链中创建顺式双键。已经描述了用于pufa合成的替代途径(metz等,science,第293卷,no.5528(2001年7月13日),第290-293页)。此系统通过称为pufa合酶的多域酶进行脂肪酸的从头合成。这些合酶包含与i型和ii型聚酮化合物合酶(pks)系统和ii型fas系统中发现的域或个别酶最密切相关的域。pufa合酶是迭代的i型系统(见下面的描述)。pufa合酶的域含量和构造代表了一种新的系统,其不适合先前描述的fas或pks系统。pufa合酶途径与上文描述的延长酶/去饱和酶途径是根本不同的途径。它不参与预先制备的短链脂肪酸的修饰,并且也不需要分子氧。在一些海洋细菌中以及还在一些破囊壶菌(thraustochytrids)中发现pufa合成酶。破囊壶菌是真核海藻,并且假设通过侧向基因转移从细菌中获得pufa合酶系统。已经开发了几种破囊壶菌作为富含pufa的油的商业来源。这些油中的pufa(主要是二十碳六烯酸(dha,c22:6,n-3)、二十二碳五烯酸(dpan-6,c22:5,n-6)和二十碳五烯酸(epa,c20:5,n-3))由存在于这些生物中的pufa合酶产生。与上文提及的破囊壶菌一样,寇氏隐甲藻(c.cohnii)已经开发成为高度富含pufa(特别是dha)的油的商业来源。发现dha是此种油中大量存在的唯一pufa,并且它可以占油中存在的总脂肪酸的50%以上。在本公开之前,尚未描述用于寇氏隐甲藻中合成dha的酶途径。对腰鞭毛虫(dinoflagellates)中脂肪酸合成的分子遗传学的研究才开始。近来已经进行了装配和分析基因组的努力(shoguchi等,currentbiology,第23卷,(2013),第15期(2013年8月5日),第1399-1408页)。然而,已经预测了腰鞭毛虫基因组的过度大小和特性将使遗传水平上生物合成途径的鉴定和表征至少具有挑战性(kellmann等,mar.drugs第8卷,no.4(2010年3月26日),第1011-1048页)。已经报告了关于寇氏隐甲藻脂肪酸生物合成的生物化学的若干研究。发现寇氏隐甲藻不能通过已知的去饱和酶介导的和延长酶介导的途径合成dha(beach等,biochimbiophysacta第369卷(1974年10月16日),第16-24页)。还发现了基于当补料放射性标记的潜在前体时放射性标记的dha的检测缺乏,寇氏隐甲藻不能将外部补料的脂肪酸(例如c16:0、c18:0、c18:1、c18:2和c18:3)转化为dha(lippmeier,j.c.,ph.d.主题名称为“fattyacidmetabolismofmarinemicroalgae”,universityofhull,(2007))。在这些报告中也没有指出dha合成的生物化学基础可以如何。在本发明之前尚未鉴定与dha合成有关的基因或蛋白质。用来自标准延长酶/去饱和酶途径和来自pufa合酶途径的蛋白质序列进行了对源自寇氏隐甲藻mrna的est文库的查询,但没有观察到使用任一途径的dha合成系统的明确的遗传证据(lippmeier,j.c.博士,主题名称为“fattyacidmetabolismofmarinemicroalgae”,universityofhull,(2007),第5章)。在此,我们描述了使用生物化学和生物信息学方法的组合来鉴定与寇氏隐甲藻中的dha合成相关的单一非常大的蛋白质。对此蛋白质中存在的酶域的分析揭示其落入称为模块i型pks的酶类。聚酮化合物是一类具有广泛结构的(主要)次级代谢物。产生这些化合物的多域酶称为聚酮化合物合酶(pks)。尽管pks系统的产物差别巨大,但是它们是通过类似于脂肪酸生物合成的机制来合成的。在fas中,延长循环由引物(乙酸单元)或更长的脂肪酰基链(其被酯化成β-酮酰基-acp合酶(ks)的活性位点)和与酰基载体蛋白(acp)连接的丙二酸单元之间的脱羧缩合反应启动。此反应在acp上产生酰基链,其具有2个添加的碳(源自丙二酸单元)并且在β碳上具有酮基。在标准延长循环中,β-酮还原酶(kr,以产生β-醇基团)、脱水酶(dh,以除去水分子并且导致插入碳链中的双链)和最后烯酰还原酶(er)的序贯作用产生完全还原的β-碳。聚酮化合物与脂肪酸生物合成之间的差异在于使用的酰基前体的数目和类型、酮基还原的程度和位置、以及随后的(pks后)修饰。pks系统已经在文献中描述为落入几种基本类型之一,通常称为i型(模块或迭代)、ii型和iii型。i型pks系统的特征在于具有大的多域蛋白来进行产物合成所需要的酶促反应。各自进行独特类型的酶促反应的酶域进行合成。如果系统是模块i型pks系统,则仅在终产物的生成中使用一次与延长循环相关的每个酶促域。如果该系统是迭代的i型pks系统,则这些延长循环域中的一些多次使用以生成终产物。ii型系统的特征在于可分离的蛋白质,每种蛋白质进行独特类型的酶促反应。这些酶协同起作用以生成终产物,并且系统的每种单独的酶通常多次参与生成终产物。iii型系统属于植物查尔酮合酶缩合酶家族。iii型pks在迭代缩合反应中利用酰基-coa底物以产生终产物。如上文指示,本发明中描述的寇氏隐甲藻dha合酶落入称为模块i型pks的酶类。这些系统的一个令人感兴趣的特征是,其产物结构的某些方面经常可以通过其域的存在和排列来预测。在模块类型ipks中,这些域构造成模块-与特定的一组反应相关的域簇。在许多情况下,模块与伸长反应有关。这些模块都含有ks和acp域,它们进行缩合反应,并且产生β-碳上具有酮基基团的伸长碳链。如果模块还含有活性kr、dh和er域,则会完全还原β-碳。如果该模块仅含有额外的kr和dh域,则碳链中将保留双键。如果模块仅含有额外的kr域,则β-酮基将仅还原为羟基。然后,将具有酮基、或羟基、或双键、或完全还原的β-碳的伸长的碳链传递到下一个模块上。除了那些与伸长反应相关的域外,其它域经常存在于模块i型pks系统中。需要酰基转移酶(at)域来给acp加载延长单元(例如丙二酸)并且加载引发分子(例如乙酸)。最终模块经常含有硫酯酶(te)域,其可以以游离脂肪酸释放产物。另外,与产物的进一步修饰相关的域可与pks系统结合。在“发明详述”和“实施例”部分中,描述了负责寇氏隐甲藻中产生dha的pks系统的域结构和构造以及合成的原理。提出10个伸长模块序贯起作用以产生在直链中具有22个碳的脂肪酸分子。域结构指示在该22碳脂肪酸链中的特定位置处,伸长模块中的三个将留下羟基并且三个将留下反式双键。进一步提出具有这些羟基和双键的脂肪酸可通过一系列异构化和脱水反应转化为dha。域存在于与氧依赖性去饱和酶有关的合酶的n-末端附近。o2-依赖性去饱和酶代表一大类酶,其包括许多已经显示出进行我们提出的类型的异构酶和脱水反应的实例。我们将此域称作“去饱和酶相关的异构酶和脱水酶”(drid)域。这是第一次显示了此类域是模块i型pks系统的一部分。pks系统的产物通常与次级代谢有关,并且通常仅积累少量的产物。因此,令人惊讶的是来自寇氏隐甲藻的模块dha合酶产生分子dha,其通常与初级代谢相关并且它在该生物体中积累到非常高的水平。在此意义上,它类似于破囊壶菌中的pufa合酶系统。然而,两种系统的独特之处在于pufa合酶是迭代的i型系统,而模块dha合酶明显是模块i型pks系统。因此,本报告中描述的系统代表了一种新的系统,并且是异源生物体中具有产生dha的某些优点的系统。发明概述本发明基于来自寇氏隐甲藻的新的模块二十二碳六烯酸(dha)合酶的鉴定。单独或与其它辅助蛋白组合在宿主生物体中表达新的模块dha合酶以增加或改善宿主生物体中dha或其它pufa的生成。因而,本发明涉及:选自下组的分离的核酸分子:(a)核酸分子,所述核酸分子包含编码具有seqidno:1的氨基酸序列的蛋白质的多核苷酸序列;(b)核酸分子,所述核酸分子包含编码蛋白质的多核苷酸序列,所述蛋白质具有seqidno:1的氨基酸序列中具有一个或几个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列,所述蛋白质具有模块二十二碳六烯酸(dha)合酶活性;(c)核酸分子,所述核酸分子包含编码蛋白质的多核苷酸序列,所述蛋白质与seqidno:1的氨基酸序列具有至少85%同一性,所述蛋白质具有模块二十二碳六烯酸(dha)合酶活性;(d)核酸分子,所述核酸分子包含seqidno:2的多核苷酸序列。在一些实施方案中,由上文提及的核酸分子编码的氨基酸序列与seqidno:1是至少70%、至少80%、至少90%、或至少95%相同的。本发明还涉及具有seqidno:6的核酸序列的分离的核酸分子。在一个实施方案中,上文提及的蛋白质在与4'-磷酸泛酰巯基乙胺基转移酶(ppt酶)共表达时具有模块dha合酶活性。在一个实施方案中,ppt酶具有seqidno:5的氨基酸序列。本发明还涉及重组核酸分子,其包含根据上文提及的分离的核酸分子的核酸分子,并且与一种或多种表达控制序列可操作连接。本发明还涉及包含上述重组核酸分子的重组宿主细胞。在一些实施方案中,宿主细胞可以是微生物细胞或植物细胞。本发明还涉及经遗传修饰的生物体,其中生物体经遗传修饰而表达上文提及的重组核酸分子。在一些实施方案中,生物体选自下组:植物、微生物和动物。例如,微生物可以是微藻、细菌或破囊壶菌。植物可以是大豆植物或柯罗纳(canola)植物。在一个实施方案中,经遗传修饰的生物体包含dha。在另一个实施方案中,经遗传修饰的生物体包含至少一种选自下组的多不饱和脂肪酸(pufa):dpa(c22:5,n-6或n-3)、epa(c20:5,n-3)、ara(c20:4,n-6)、gla(c18:3,n-6)、ala(c18:3,n-3)和sda(c18:4,n-3)。本发明还涉及经遗传修饰的生物体,其中生物体经遗传修饰以缺失或失活上文提及的核酸分子。本发明还涉及生成至少一种pufa的方法,所述方法包括:在有效生成pufa的条件下在宿主细胞中表达模块dha合酶基因,其中所述模块dha合酶基因包含一种或多种上文提及的核酸分子,并且其中生成至少一种pufa。在一些实施方案中,上文提及的宿主细胞选自下组:植物细胞、动物细胞和微生物细胞。生成的至少一种pufa是二十二碳六烯酸(dha)。本发明还涉及生成富集dha的脂质的方法,所述方法包括:在有效生成脂质的条件下在宿主细胞中表达模块dha合酶基因,其中所述模块dha合酶基因包含一种或多种上文提及的核酸分子,并且其中生成富含dha的脂质。本发明还涉及制备重组载体的方法,所述方法包括将上文提及的分离的核酸分子之一插入载体中。本发明还涉及制备重组宿主细胞的方法,所述方法包括将上文提及的重组载体导入宿主细胞中。在一些实施方案中,上文提及的宿主细胞选自下组:植物细胞、动物细胞和微生物细胞。本发明还涉及增加具有模块dha合酶活性的生物体中的dha生成的方法,所述方法包括:在有效生成dha的条件下在所述生物体中表达一种或多种上文提及的分离的核酸分子,其中所述模块dha合酶活性替换无活性或缺失的活性,引入新活性,或者增强所述生物体中现有的活性,并且其中增加所述生物体中的dha生成。本发明还涉及用于转化生物体以生成pufa的方法,所述方法包括用至少一种上文提及的分离的核酸分子转化生物体。本发明还涉及从上文提及的经遗传修饰的生物体之一获得的油。在一个实施方案中,生成的油含有dha。本发明还涉及食物产品或饲料产品,其含有上文提及的油,或含有上文提及的经遗传修饰的生物体。本发明还涉及含有上文提及的油的产品。本发明涉及模块dha合酶,其催化一种或多种具有至少18个碳和至少3个碳-碳双键的线性脂肪酸的从头合成,其中所述合成反应使用丙二酰基-coa作为延长反应的碳源,并且不需要分子氧,并且所述合酶包含如seqidno:1中列出的氨基酸序列或其功能性片段、衍生物、等位基因、同源物或同工酶。在一些实施方案中,上述合酶可以包含经由如seqidno:2中列出的核苷酸序列或同源核苷酸序列编码的氨基酸序列,所述同源核苷酸序列编码与seqidno:1的氨基酸序列至少约85%相同的氨基酸序列。在一些实施方案中,上述核苷酸序列可以是核酸分子的部分。因此,本发明还涉及经遗传修饰的生物体,其中生物体经遗传修饰而表达此类重组核酸分子。在一些实施方案中,上述经遗传修饰的生物体可以选自下组:植物、微生物和动物。因而,此类经遗传修饰的生物体可以具有改变或增加的pufa含量。此类经遗传修饰的生物体可以使其模块dha合酶得到改变,特征在于基因表达、催化活性和/或所述酶活性的调节中的改变。本发明涉及用于生成pufa的方法,其包括在表达上文提及的模块dha合酶的条件下培养上文提及的经遗传修饰的生物体。在一个实施方案中,通过上述方法生成pufa。本发明涉及在细胞或生物体中使用本申请中描述的模块dha合酶或编码此类模块dha合酶的核酸序列并且引起此细胞或生物体的pufa含量改变,优选增加。本发明涉及选自下组的分离的核酸分子:(a)包含多核苷酸序列的核酸分子,所述多核苷酸序列编码具有seqidno:4的氨基酸序列的蛋白质;(b)包含多核苷酸序列的核酸分子,所述多核苷酸序列编码在seqidno:4的氨基酸序列中具有一个或几个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列的蛋白质,所述蛋白质具有脱水酶和异构酶活性;和(c)包含多核苷酸序列的核酸分子,所述多核苷酸序列编码与seqidno:4的氨基酸序列具有至少85%、至少90%、至少95%同一性的蛋白质,所述蛋白质具有脱水酶和异构酶活性。本发明还涉及重组核酸分子,其包含与表达控制序列可操作连接的上文提及的分离的核酸分子。本发明还涉及经遗传修饰的生物体,其中生物体经遗传修饰而表达上文提及的分离的核酸分子。在一些实施方案中,生物体选自下组:植物、微生物和动物。在一些实施方案中,微生物是微藻、细菌或破囊壶菌。在一些实施方案中,生物体是植物,并且重组核酸分子编码靶向到所述植物的质体的蛋白质。在一些实施方案中,生物体是植物,并且所述重组核酸分子编码所述植物的胞质溶胶中表达的蛋白质。在一些实施方案中,植物是大豆或柯罗纳(canola)。在一个实施方案中,经遗传修饰的生物体包含dha。本发明还涉及生成至少一种pufa的方法,其包括:在有效生成pufa的条件下在宿主细胞中表达脱水酶/异构酶基因,其中所述脱水酶/异构酶基因在所述宿主细胞中包含上文提及的分离的核酸分子,且其中生成至少一种pufa。在一些实施方案中,上述宿主细胞选自下组:植物细胞、动物细胞和微生物细胞。在一些实施方案中,至少一种pufa包含二十二碳六烯酸(dha)。本发明还涉及用于转化生物体以表达pufa的方法,其包括用至少一种核酸分子多核苷酸序列转化生物体,所述多核苷酸序列编码与seqidno:4的氨基酸序列具有至少85%、至少90%、至少95%同一性的蛋白质,并且所述蛋白质具有脱水酶和异构酶活性。附图简述图1显示了源自寇氏隐甲藻的ko和ko-5菌株的各种级分中的脂肪酸合成。图1a显示了具有级分的参考编号的细胞匀浆分级方案。图1b显示了己烷可提取脂质的体外合成,所述己烷可提取脂质在用溶剂a和b(在图中显示为缓冲液a和b)在ag-ionspe筒上分离后来自ko和ko-5菌株的图1a中指出的各种级分(以每分钟计数(cpm)表示)中掺入了来自[1-14c]-丙二酰基-coa的标记物。图1c显示了在使用反相tlc分离之后从ko菌株的选择级分中检测到的放射性(图1c中的数字指图1a中的数字,a和b分别指示通过溶剂a或b从ag-ionspe筒洗脱的脂质)。在tlc板的左侧部分上存在几种放射性标记的fame标准品。图2显示了寇氏隐甲藻(crypthecodiniumcohnii)dha合成活性的体外测定法的反应混合物组分要求。图3显示了uno1阴离子交换柱上富含dha合成活性的样品的层析分级。图4显示了在预包装有superose6b的tricorn柱上源自寇氏隐甲藻ko-5菌株的富含dha合成活性的样品的层析分级。图5显示了选自图4中显示的层析分离的级分的sds-page分析。图6显示了将通过寇氏隐甲藻模块dha合酶的模块m1到m10的序贯作用产生的分子的结构。图7显示了由图6中的分子形成dha的方案。seqid的列表:seqidno:1-寇氏隐甲藻模块dha合酶的氨基酸序列(15,896个氨基酸)seqidno:2-编码seqidno:1的seqidno:3的可读框(orf)的核苷酸序列(47,688个碱基,没有终止密码子)seqidno:3-47,866个碱基的完全装配cdna序列(seqidno:2orf包埋于此之中)。它包含上游和下游非编码序列,但是不包含多聚a尾部的a。seqidno:4-seqidno:1的“drid”域的氨基酸序列(即,91个氨基酸-所述序列的区域450-540)。seqidno:5-用于异源表达的寇氏隐甲藻ppt酶的氨基酸序列。seqidno:6-核苷酸序列编码seqidno:4。seqidno:7-残基编号5306-531指seqidno:1。seqidno:8-残基编号5795-5817指seqidno:1。seqidno:9-残基编号5935-5965指seqidno:1。seqidno:10-残基编号7154-7168指seqidno:1。seqidno:11-残基编号7195-7204指seqidno:1。seqidno:12-残基编号7712-7725指seqidno:1。seqidno:13-残基编号9287-9304指seqidno:1。seqidno:14-残基编号9499-9510指seqidno:1。seqidno:15-残基编号10018-10032指seqidno:1。seqidno:16-残基编号13106-13124指seqidno:1。seqidno:17-残基编号13484-13496指seqidno:1。seqidno:18-残基编号13500-13517指seqidno:1。seqidno:19-残基编号14350-14362指seqidno:1。seqidno:20-残基编号14789-14810指seqidno:1。seqidno:21-残基编号4717-4728指seqidno:1。seqidno:22-残基编号10104-10118指seqidno:1。发明详述本发明一般涉及在经遗传修饰而生产此类pufa的宿主生物体中提供多肽和编码此类多肽的核酸分子,用于改善多不饱和脂肪酸(pufa)(特别是二十碳六烯酸(dha))的生产。本发明还涉及经遗传修饰以表达某些此类多肽的生物体,以及制备和使用此类多肽和生物体的方法。本发明还涉及此类多肽的修饰,使得产生与dha不同的分子(例如,其它pufa或聚羟基脂肪酸)。寇氏隐甲藻可产生多不饱和脂肪酸,特别是营养上重要的多不饱和脂肪酸dha。寇氏隐甲藻可以在大规模发酵罐中培养,并且已经用于商业生产富含dha的油。然而,关于寇氏隐甲藻中脂肪酸合成的生物化学和遗传学知之甚少。本发明人第一次鉴定出编码参与寇氏隐甲藻中的dha生成的酶的cdna序列。使用生物化学和生物信息学方法的组合实现了cdna序列的鉴定。使用生物化学方法来鉴定与源自寇氏隐甲藻细胞的提取物中体外dha合成活性相关的单一非常大的蛋白质。候选蛋白质的氨基酸序列通过从所述蛋白质生成的胰蛋白酶肽的基于ms的测序用cdna序列数据库作为参照导出。用于产生该数据库的cdna源自从寇氏隐甲藻细胞中提取的rna样品。cdna序列的特征指示它对应于源自核基因组中编码的基因的单一mrna种类的序列。发明人还使用生物信息学方法来测定蛋白质序列中存在的酶域并推断其生物化学功能。还描述了在异源宿主细胞中表达酶的策略。如本文所用,术语“模块dha合酶”指参与dha的从头生成的模块i型pks合酶。术语“寇氏隐甲藻模块dha合酶”具体指氨基酸序列在seqidno:1中显示的模块i型pks合酶。通过翻译寇氏隐甲藻衍生的cdna重叠群中存在的单一的大的可读框(orf)导出seqidno:1的氨基酸序列。在seqidno:2中显示了翻译产生seqidno:1的氨基酸序列的orf的序列。含有seqidno:2orf的完全装配的cdna序列如seqidno:3所示。本文呈现的数据描述了用于pufa(特别是dha)合成的第三种独特的途径和牵涉从头合成的第二种途径。本发明人在单细胞异养涡鞭藻寇氏隐甲藻中发现了此途径。本发明部分涉及一组新的酶和编码此类酶的核酸,称为模块dha合酶。模块dha合酶催化使用丙二酰基-coa作为延伸反应的底物对pufa的从头生成。模块dha合酶属于称为模块i型聚酮化合物合酶的一大类酶。本发明中公开的模块dha合酶的新特征包括:其特定的氨基酸序列、其酶促域的特定构造、其天然产物(即pufa,例如dha)及其域之一,特别是“去饱和酶相关异构酶和脱水酶”(drid)域。在一些实施方案中,主题模块dha合酶催化具有至少18个碳和至少3个碳-碳双键的一种或多种线性脂肪酸的从头合成。合成反应使用丙二酰基-coa作为延伸反应的碳源,并且不需要分子氧。合酶包含如seqidno:1中列出的氨基酸序列或其功能片段、衍生物、等位基因、同源物或同工酶。在一些实施方案中,合酶包含经由如seqidno:2中列出的核苷酸序列或同源核苷酸序列编码的氨基酸序列,所述同源核苷酸序列编码与seqidno:1的氨基酸序列具有至少60%、至少65%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%相同的氨基酸序列。本发明还涉及编码上述寇氏隐甲藻模块dha合酶的核苷酸序列(seqidno:2)。在一些实施方案中,本发明涉及分离的核酸分子,其包含在seqidno:1的氨基酸序列中具有一个或几个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列的多核苷酸序列。在一个实施方案中,上述蛋白质具有模块二十二碳六烯酸(dha)合酶活性。在一些实施方案中,本发明涉及分离的核酸分子,其包含编码与seqidno:1的氨基酸序列具有至少60%;至少65%;至少70%;至少75%;至少80%;至少81%;至少82%;至少83%;至少84%;至少85%;至少86%;至少87%;至少88%;至少89%;至少90%;至少91%;至少92%;至少93%;至少94%;至少95%;至少96%;至少97%;至少98%;或至少99%同一性的蛋白质的多核苷酸序列。在一个实施方案中,上述蛋白质具有模块二十二碳六烯酸(dha)合酶活性。本发明还部分涉及由seqidno:1的约450至约540的氨基酸区域编码的酶促域。该域称为drid域,并且推断具有反式-顺式双键异构酶活性和还有脱水酶活性,如下文所述。在seqidno:4中显示了该区域的示例性序列。在seqidno:6中显示了编码drid域的核酸序列。其活性从将寇氏隐甲藻dha合酶的延长模块的预测产物(图6中所示)转化为dha结构(图7中所示)需要的反应以及o2-依赖性去饱和酶中包含的酶家族的建立特征推断,如下文所述。表1中提供了在寇氏隐甲藻模块dha合酶中检测到的域的序贯列表。表1中的数据包括:检测到的酶家族(如通过与pfam数据库比较限定)、与那些酶具有同源性的区域的近似边界的指示、与所述域相关的基序以及所列出的基序中存在的一个氨基酸的参考位置。在蛋白质中检测到的第一个域是上文描述的drid域。drid域与o2-依赖性脂肪酸去饱和酶家族具有同源性,并且覆盖了seqidno:1的约氨基酸450-540。o2-依赖性脂肪酸去饱和酶依赖于分子氧原子的活化以促进从碳链对氢的能量要求的初始提取。三个组氨酸盒基序与该反应所需要的氧的结合相关。drid域序列与o2-依赖性去饱和酶实例的比对揭示了drid域序列完全缺乏这些组氨酸盒基序中的两个,并且第三个基序(hxxhh)由部分序列(hxxh)表示。在表1中标示了此部分基序的位置。一组完整的组氨酸盒基序的缺乏指示drid域的功能不与o2-依赖性双键形成相关。这与o2-不是体外dha合成所需要的观察结果一致(参见实施例2)。如上文所述,o2-依赖性去饱和酶的酶家族包括在其去饱和酶活性外还拥有进行碳-碳双键异构化以及还有羟基化和脱水反应的能力的实例(shanklin,等,j.biol.chem.,第284卷(2009年7月10日),第18559-18563页)。在模块dha合酶的情况下,由于可以预测生成已经含有羟基和双键的脂肪酸结构,不需要从饱和碳链对氢的o2依赖性初始提取。我们提出了drid域的功能是进行预先形成的双键的反式-顺式异构化并进行插入额外的顺式双键从而形成dha终产物的脱水反应(除去hoh)。这些提议与模块dha合酶的延长循环的预期产物(参见下文)以及与这类酶相关的反应一致。本发明第一次鉴定drid域及其序列和功能为模块i型pks系统的组分。在seqidno:1中检测到并列于表1中的剩余的48个域全都与通常在模块i型pks中发现的酶类有关。与drid域的情况中一样,表1中的数据指示seqidno:1中氨基酸区域的近似值,其与已知为那些类别的其它蛋白质显示同源性。列出的每种酶类(即ks、kr、dh、er、acp、at和te)拥有特定的氨基酸基序,其可以充当所述类型的域的标识符,并且可以是它具有与所述域相关的酶活性或功能的指标。以下基序与表1中列出的域相关:模块i型pks系统的关键特征是伸长反应的装配线方面。特别地,与每个伸长循环相关的域一起聚簇成模块。这些模块含有ks和acp域以进行缩合反应,并且还可以具有与β-碳的进一步修饰有关的域。序贯利用伸长模块,从蛋白质的n端向c端行进。序列中的第一伸长模块催化引物单元与延伸分子的缩合。该伸长模块的产物然后传递到下一个模块。表2显示了寇氏隐甲藻dha合酶模块的域构造的模型。该模型基于表1中所示的域的序贯列表,并基于与其它充分表征的模块i型pks蛋白比较(例如schwecke等,proc.natl.acad.sci.usa,第92卷(1995年8月),第7839-7843页)。表2包括每个模块(m0、m1到m10和m-最终)的名称、每个模块包括的域、以及该模块的提出功能。提示了第一模块m0包含drid域和acp域,而提出最后一个模块m-最终仅由te域组成。提出每个伸长模块m1到m10以acp域结束。模块的域内容的备选模型是可能的(例如,将acp转变到伸长模块的开始),然而,这不会改变以下讨论。有串联acp域的两种情况(表2中有下划线)。串联acp域在pks系统中的作用是一个持续争论的问题。在许多模块i型pks系统中,at域与每个伸长模块相关。还有下述实例,其中与将延伸单元加载到acp域上相关的at酶编码为单独的酶(cheng,等,proc.natl.acad.sci.usa,第100卷(2003年3月18日),第3149–3154页)。相反,寇氏隐甲藻dha合酶确实含有at域(在表2中用斜体表示),然而它仅有它们中的三个。生物化学数据提示,dha合成不需要分开的at蛋白(参见实施例3)。这些数据提示合酶中的一个(或多个)at域能够给合适的内部acp域加载延伸单位。10个模块m1至m10与碳链形成相关。以乙酸为引物(源自乙酰-coa或经由从丙二酰基-coa的丙二酸脱羧)和每次伸长2个碳(使用丙二酰基-acp经由脱羧反应衍生),这些延伸反应将产生22碳脂肪酸。如表2中所示,伸长模块的域含量指示,源自缩合反应的β-碳在4种情况下会被完全还原,在3种情况下保留羟基基团并且在3种情况下与双键有关。图6中显示了会源自10个伸长模块的序贯活性的脂肪酸结构。提出drid域的活性将伸长循环过程中创建的羟基和反式双键转化为dha分子,其6个亚甲基中断顺式双键,如图7中图示。此转化可以在脂肪酸链形成过程中或在完成延长反应后发生。寇氏隐甲藻dha合酶的最终域是te域(模块m-最终)。提出te域通过水解将它栓系到acp域的硫酯键释放合成反应的dha产物。表2模块名称域功能,或β-碳状态m0drid,acp异构化和脱水反应m1ks,at,dh,er,kr,acp:完全还原m2ks,at,dh,kr,acp:双键m3ks,kr,acp:羟基基团m4ks,dh,er,kr,acp-acp:完全还原m5ks,dh,kr,acp:双键m6ks,kr,acp:羟基基团m7ks,dh,er,kr,acp-acp:完全还原m8ks,dh,kr,acp:双键m9ks,kr,acp:羟基基团m10ks,at,dh,er,kr,acp:完全还原m-最终te以游离脂肪酸释放终产物假设寇氏隐甲藻模块dha合酶以及可以在其它生物体中发现的同源酶将可用于修饰表达此类酶的宿主中的dha积累。例如,在不产生dha的异源宿主细胞中表达寇氏隐甲藻模块dha合酶可以导致细胞产生dha。作为另一个实例,在已经产生dha的异源宿主细胞中表达寇氏隐甲藻模块dha合酶可以引起dha积累的增加。用于在异源宿主中表达蛋白质的技术是本领域已知的,但是在成功表达仍然是功能性的非常大的蛋白质方面仍存在重大挑战。在实施例部分中给出了可用于异源宿主中寇氏隐藻藻模块dha合酶的异源表达的一些具体方案。本发明还部分地涉及可产生与dha不同的化合物的一组经修饰的模块dha合酶。改变dha合酶以使其产生其它分子的策略可以包括(但不限于):除去或增加特定的伸长模块、特定域如er、dh或kr域中任一种的失活、或drid域的失活。在一些实施方案中,此类改变导致可以产生与dha不同的pufa(例如但不限于ara(c20:4,n-6)、dpa(c22:5,n-6或n-3)、epa(c20:5,n-3)、γ-亚麻酸(gla)(c18:3,n-6)、γ-亚麻酸(ala)(c18:3,n-3)、和/或十八碳四烯酸(sda)(c18:4,n-3)或含有羟基和/或反式双键的分子的酶。在一个实施方案中,此类经修饰的模块dha合酶是经修饰的寇氏隐甲藻模块dha合酶。本发明的发明人在本文中还第一次发现并公开了模块i型pks合酶中的drid域。不受理论束缚,认为drid域将脂肪酸链的羟基转化为顺式c=c键,并且在伸长过程期间或者在通过模块m1-m10的催化完全形成dha分子的c22主链后在向甲基末端迁移的情况下将反式双键异构化为顺式双键。换言之,提出本文中公开的drid域负责dha合成过程中的异构化反应和脱水反应。drid域及其功能的发现提示其可以不依赖于模块dha合酶使用。例如,可以将drid域克隆到载体中并转化到宿主细胞中,所述宿主细胞已经产生一种或多种在合适的构造中含有羟基基团和/或反式双键的分子,使得它们可以充当底物并转化成顺式双键。因此,本发明部分涉及异源表达的多肽,其包含drid域(seqidno:4),或其经修饰的形式之一。在一些实施方案中,本发明涉及分离的核酸分子,其包含编码在seqidno:4的氨基酸序列中具有一个或几个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列的蛋白质的多核苷酸序列。在一个实施方案中,上述蛋白质具有脱水酶和异构酶活性。在一些实施方案中,本发明涉及分离的核酸分子,其包含与seqidno:4的氨基酸序列具有至少60%;至少65%;至少70%;至少75%;至少80%;至少81%;至少82%;至少83%;至少84%;至少85%;至少86%;至少87%;至少88%;至少89%;至少90%;至少91%;至少92%;至少93%;至少94%;至少95%;至少96%;至少97%;至少98%;或至少99%同一性的蛋白质的多核苷酸序列。在一个实施方案中,上述蛋白质具有脱水酶和异构酶活性。寇氏隐甲藻模块dha合酶含有多个acp域。这些域需要磷酸泛酰巯基乙胺辅因子与保守的丝氨酸残基的共价附接来活化。通过磷酸泛酰巯基乙胺基转移酶(ppt酶)酶家族的成员的翻译后修饰实现此活化,所述成员将4’-磷酸泛酰巯基乙胺基部分从辅酶a转移到acp域。为了在寇氏隐甲藻中产生dha,寇氏隐甲藻模块dha合酶必须与ppt酶蛋白一起起作用,所述ppt酶蛋白活化其acp域。已经详细描述了ppt酶的结构和功能特征(例如lambalot等,chemistry&biology,第3卷(1996),第923-936页和beld等,naturalproductsreports,第31卷(2014),第61-108页)。已经在一些i型fas和i型pks蛋白中发现了ppt酶域,然而在寇氏隐甲藻dha合酶的蛋白序列中没有检测到ppt酶域。这指示在分开的基因中编码负责其acp域活化的ppt酶。因此,可以认为寇氏隐甲藻模块dha合酶系统包括至少一种分开编码的ppt酶。本发明人通过用几种已知的ppt酶序列查询寇氏隐甲藻rna衍生的cdna序列数据库(用于鉴定dha合酶序列)鉴定了寇氏隐甲藻ppt酶。seqidno:5中显示了此蛋白质的氨基酸序列。该序列具有ppt酶特征性的基序,并通过与pfam数据库比较而鉴定为属于所述酶家族。此类ppt酶有可能负责体内活化寇氏隐甲藻模块dha合酶的acp域。当在异源生物体中表达具有acp域的蛋白质时,可能的是该宿主的内源性ppt酶可以识别新的acp序列并活化那些域。也可能的是内源性ppt酶可以不识别外来acp序列。在该情况下,将需要提供异源ppt酶(将那些acp识别为底物的ppt酶)。因此,本发明的一个实施方案涉及经遗传修饰的宿主细胞或微生物,其中宿主细胞或微生物经遗传修饰而表达如本文中所述的模块dha合酶,以及还有如本文中所述的ppt酶。可以在与编码pufa合酶蛋白的一种或多种核酸分子相同或不同的构建体上表达ppt酶。上文描述了合适的ppt酶(seqidno:5),并且本领域中描述了可以符合此目的的其它酶。在一个实施方案中,ppt酶是寇氏隐甲藻的天然ppt酶。在另一个实施方案中,ppt酶是具有如文献中所述的宽底物范围的酶(例如,来自枯草芽孢杆菌的sfp或来自轮枝链霉菌的svp-参见:sanchez等,chemistry&biology,第8卷,第7期(2001年7月),第725-738页)。因此,本发明部分涉及异源表达的多肽,其包含ppt酶(seqidno:5),或其经修饰的形式之一。在一些实施方案中,本发明涉及分离的核酸分子,其包含编码在seqidno:5的氨基酸序列中具有一个或几个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列的蛋白质的多核苷酸序列。在一个实施方案中,上述蛋白质具有ppt酶活性。本发明包括与ppt酶一起表达如本文中所述的模块dha合酶以在异源宿主中生成dha。本发明还包括与ppt酶一起表达如本文中所述的模块dha合酶以增加异源宿主中的dha生成和/或积累。本发明的另一个方面涉及基因构建体,其包含与另一种核酸元件可操作连接的本发明的核酸分子。术语可操作连接意指例如启动子、编码序列、终止子和/或其它调节元件的系列构造,使得每种元件在核酸分子的表达期间可以满足其初始功能。此外,本发明中涵盖包含本文中所述的核酸分子的载体。这还包括表达载体以及还包含选择标志物基因和/或用于在宿主细胞中复制和/或整合到宿主细胞基因组中的核苷酸序列的载体。在本发明中也涵盖制备上述载体的方法。此类方法包括将主题核酸分子插入载体中的步骤。在一些实施方案中,所述方法还包括将所得重组载体导入宿主细胞中的步骤。此外,本发明涉及含有上文所述的核酸分子和/或所述基因构建体和/或所述载体的宿主细胞或生物体。本发明中也涵盖用于制备上述宿主细胞的方法。方法包括将上文提及的重组载体导入宿主细胞中的步骤。本发明还提供了生成至少一种pufa的方法,所述方法包括:在有效生成pufa的条件下在宿主细胞中表达pufa合酶基因,其中pufa合酶基因包含宿主细胞中的上文所述的核酸分子和/或所述基因构建体和/或所述载体,并且其中生成至少一种pufa。本发明还提供了生成富集dha的脂质的方法,其包括:在有效生成脂质的条件下在宿主细胞中表达模块dha合酶基因,其中模块dha合酶基因包含上文描述的核酸分子,且其中生成富含dha的脂质。本发明还提供增加具有模块dha合酶活性的生物体中dha生成的方法,包括:在有效生成dha的条件下在生物体中表达上文所述的核酸分子,其中模块dha合酶活性替换无活性或删除的活性,引入新的活性,或增强生物体中的现有活性,并且其中增加生物体中的dha生成。另外,可以使用本文中公开的寇氏隐甲藻模块dha合酶或其模块来鉴定自然界中的其它模块dha合酶同源物。例如,可以使用本文中公开的寇氏隐甲藻模块dha合酶核酸序列来分离编码同源蛋白质的基因。使用序列依赖性方案分离同源基因是本领域中已知的。序列依赖性方案的例子包括例如但不限于:核酸杂交方法;dna和rna扩增方法,如通过核酸扩增技术(例如聚合酶链式反应(pcr)、连接酶链式反应(lcr)和链置换扩增)的各种用途例示;和文库构建和通过互补的筛选的方法。还有,可以使用寇氏隐甲藻模块dha合酶氨基酸序列来查询数据库并鉴定具有相似域构造和内容的同源物。另外,可以使用drid域氨基酸序列来查询数据库和鉴定其它模块i型pks蛋白,其可以拥有与所述特定域具有同源性的区域。经遗传修饰的细胞和生物体根据本发明,经遗传修饰而表达模块dha合酶的生物体的生物体就用模块dha合酶对生物体的修饰而言在本文中可以称为“异源”宿主生物体,其中生物体不天然(内源,在无遗传修饰的情况下)表达此类系统。本文中的实施方案包括经遗传修饰而表达模块dha合酶的宿主生物体(例如微生物、植物和动物)。在一些实施方案中,生物体经遗传修饰而表达异源寇氏隐甲藻模块dha合酶,例如包含模块dha合酶和至少一种辅助蛋白(例如ppt)的其功能性异源蛋白质系统。因此,本发明涵盖通过如下制备经遗传修饰的生物体的方法:表达本文所述的一种或多种模块dha合酶或其功能片段、衍生物、等位基因、同源物或同功酶。在一个实施方案中,任何外源导入的核酸序列都可以针对密码子选择或宿主中改善的表达进行优化。在一个实施方案中,任何导入的核酸序列可以靶向到生物体中的一种或多种细胞器。上文已经详细描述了此类序列、遗传修饰生物体的方法,特定修饰及其组合的各种实施方案,并且在本文涵盖。通常,使用方法来产生生成特定的生物活性分子的特定经遗传修饰的生物体。优选的经遗传修饰的生物体包括经遗传修饰的微生物和经遗传修饰的植物。优选地,本发明的经遗传修饰的生物体生成一种或多种多不饱和脂肪酸,包括但不限于dha(c22:6,n-3)、dpa(c22:5,n-6或n-3)、epa(c20:5,n-3)、花生四烯酸(ara)(c20:4,n-6)、gla(c18:3,n-6)、ala(c18:3,n-3)、和/或sda(c18:4,n-3)、和(更优选地)一种或多种较长链的pufa,包括但不限于dha(c22:6,n-3)、dpa(c22:5,n-6或n-3)、ara(c20:4,n-6)、或epa(c20:5,n-3)、或其任何组合。在特别优选的实施方案中,本发明的经遗传修饰的微生物生成dha(c22:6,n-3)。根据本发明,经遗传修饰的生物体包括已经使用重组技术或通过经典诱变和筛选技术修饰的生物体。如本文所用,导致基因表达,基因功能或基因产物(即由基因编码的蛋白质)功能降低的遗传修饰可称为基因的失活(完全或部分)、缺失、中断、阻断或下调。例如,导致由此类基因编码的蛋白质的功能降低的基因中的遗传修饰可以是基因完全缺失的结果(即基因不存在,因此蛋白质不存在),导致蛋白质的不完全翻译或不翻译(例如不表达蛋白质)的基因中的突变或降低或消除蛋白质的天然功能(例如表达具有降低的酶活性或作用或没有酶活性或作用的蛋白质)的基因突变。导致基因表达或功能增加的遗传修饰可以称为基因的扩增、过度生成、过表达、活化、增强、添加或上调。经遗传修饰的微生物如本文所用,经遗传修饰的微生物可以包括经遗传修饰的细菌、原生生物、微藻、藻类、真菌或其它微生物。此类经遗传修饰的微生物具有从其正常(即,野生型或天然存在)形式修饰(即,突变或改变),使得实现期望的结果(即降低或修饰的模块dha合酶活性和/或使用模块dha合酶系统生成和积累期望的产物)的基因组。微生物的遗传修饰可以使用经典菌株开发和/或分子遗传技术完成。此类技术是本领域中已知的,并且对于微生物通常公开于例如sambrook等,molecularcloning:alaboratorymanual,coldspringharborlabspress,1989。经遗传修饰的微生物可以包括微生物,其中已经以下述方式插入、删除或修饰(即,突变;例如通过核苷酸的插入、缺失、取代和/或倒位)核酸分子,使得此类修饰在微生物内提供期望的效果。适用于遗传修饰的宿主微生物的实例包括但不限于酵母,包括酿酒酵母(saccharomycescerevisiae)、卡尔酵母(saccharomycescarlsbergensis)、或其它酵母,如假丝酵母属(candida)、克鲁维酵母属(kluyveromyces)或其它真菌,例如丝状真菌如曲霉属(aspergillus)、链孢霉属(neurospora)、青霉属(penicillium)等。细菌细胞也可以用作宿主。这些包括但不限于可用于发酵过程的大肠杆菌。或者,仅举例而言,可使用宿主如乳杆菌属(lactobacillus)菌种或芽孢杆菌属(bacillus)菌种的作为宿主。本发明中使用的其它宿主包括来自包括但不限于下列各项的属的微生物:破囊壶菌科(thraustochytriaceae)内的破囊壶菌属(thraustochytrium)、日本壶菌属(japonochytrium)、不动壶菌属(aplanochytrium)、elina和裂殖壶菌属(schizochytrium),和网粘菌科(labyrinthulaceae)内的labyrinthula、labyrinthuloides、和labyrinthomyxa。破囊壶菌目(thraustochytriales)的特别优选的菌株包括但不限于:裂殖壶菌(schizochytriumsp.)(s31)(atcc20888);裂殖壶菌(atccpta-9695);裂殖壶菌(s8)(atcc20889);裂殖壶菌(lc-rm)(atcc18915);裂殖壶菌(pta-10212);裂殖壶菌(pta-10208);裂殖壶菌(sr21);裂殖壶菌n230d,聚生裂殖壶菌(schizochytriumaggregatum)(atcc28209);schizochytriumlimacinum(ifo32693);裂殖壶菌(23b)(atcc20891或atcc20892);纹状破囊壶菌(thraustochytriumstriatum)(atcc24473);金黄破囊壶菌(thraustochytriumaureum)(atcc34304);粉红色破囊壶菌(thraustochytriumroseum)(atcc28210);和日本壶菌属种(l1)(atcc28207)。其它优选的宿主包括那些已知产生用作药剂、调味剂、营养剂、功能性食品成分或化妆品活性剂的化合物的微生物或经遗传工程化改造而产生这些化合物/药剂的微生物。在本发明的一个实施方案中,将模块dha合酶外源导入具有内源pufa合酶系统的宿主微生物中以增加产生的pufa的量。在另一个实施方案中,将外源模块dha合酶导入没有任何pufa合成系统的宿主微生物中以产生可检测量的pufa。异源序列还可包括编码天然寇氏隐甲藻模块dha合酶的经修饰的功能域(同源物)的序列。可导入宿主基因组的其它异源序列包括ppt酶。因此,本发明的目的是通过对如本文中所述的微生物的遗传操作产生包括dha的pufa以及通过延伸,从包含这些pufa的此类微生物获得的油。可由本发明产生的pufa的实例包括但不限于dha、dpa(c22:5,n-6或n-3)、ara、epa、gla、ala、sda及其任何组合。通过本发明人经由使用生成dha的模块dha合酶和生成其它pufa的经修饰的模块dha合酶开发经遗传修饰的微生物,本发明允许生产富含一种或多种期望(主要)pufa的商业上有价值的脂质。经遗传修饰的植物本发明的另一个实施方案涉及经遗传修饰的植物或植物部分,其中所述植物经遗传修饰而重组表达模块dha合酶,包括ppt酶,如本文中所述,用于改善宿主的pufa生成和/或积累。在另一个实施方案中,经遗传修饰的植物具有内源pufa生成系统或先前引入的异源pufa生产系统,并且将如本文中所述的模块dha合酶或经修饰的模块dha合酶导入植物中以改善的pufa,特别是dha的生成和/或积累。如本文中所用,经遗传修饰的植物可以包括任何经遗传修饰的植物,包括高等植物,特别是任何可食用植物或可用于生成本发明的期望生物活性分子(例如,pufa)的植物。如本文中所用,“植物部分”包括植物的任何部分,包括但不限于种子(包括成熟种子和未成熟种子)、花粉、胚、花、果实、枝条、叶、根、茎、外植体等。经遗传修饰的植物具有从其正常(即,野生型或天然存在)形式修饰(即突变或改变)的基因组,使得实现期望的结果(即增加或修饰的pufa合成活性和/或使用模块dha合酶系统生成和/或积累期望的产物)。可以使用经典菌株开发和/或分子遗传技术来完成植物的遗传修饰。用于产生转基因植物的方法是本领域已知的,其中将编码期望氨基酸序列的重组核酸分子引入植物的基因组中。根据本发明遗传修饰的优选植物优选为适合动物(包括人类)食用的植物。根据本发明遗传修饰的优选植物(即植物宿主细胞)包括但不限于任何高等植物,包括双子叶植物和单子叶植物两者,特别是可食用植物,包括作物植物,尤其是为了得到油使用的植物。此类植物可包括但不限于例如:柯罗纳(canola)、大豆、油菜籽、亚麻籽、玉米、红花、向日葵和烟草。因此,可以选择任何植物物种或植物细胞。本文中使用的特定细胞以及由其生长或衍生的植物包括但不限于可从下列各项获得的细胞:柯罗纳(canola)(例如芜菁(brassicarapa)或芸苔(brassicanapus));大豆(glycinemax);油菜(brassicaspp.);亚麻籽/亚麻(linumusitatissimum);玉蜀黍(玉米)(zeamays);红花(carthamustinctorius);向日葵(helianthusannuus);烟草(nicotianatabacum);拟南芥(arabidopsisthaliana),巴西坚果(betholettiaexcelsa);蓖麻子(riccinuscommunis);椰子(cocusnucifera);芫荽子(coriandrumsativum);棉花(gossypiumspp.);落花生(arachishypogaea);好好霸树(simmondsiachinensis);芥菜(芸苔属种和白芥(sinapisalba));油棕(elaeisguineeis);橄榄(oleaeurpaea);稻(oryzasativa);南瓜(cucurbitamaxima);大麦(hordeumvulgare);小麦(traeticumaestivum);和浮萍(lemnaceaesp.)。应该指出的是,根据本文,植物物种内的遗传背景可以变化。根据本文可以产生、选择或鉴定来自这些植物的针对特别期望的性状(例如疾病抗性,植物转化的容易性,油含量或概貌等)优化的植物品系。优选的植物品系可以通过植物育种或通过诸如标志物辅助育种和耕耘的方法来选择。应该指出的是,相对于任何本文提到的辅助蛋白质、对途径的靶向抑制和/或模块dha合酶显示调节活性的植物品系是特别有用的。一些实施方案包括将异源模块dha合酶的表达靶向到宿主的一个或多个细胞器。例如,在一些实施方案中,将异源模块dha合酶的表达靶向到植物的质体。几种质体靶向序列在本领域中是已知的,并且可用于异源宿主是植物或植物细胞并且期望靶向质体的实施方案中。在一些实施方案中,异源模块dha合酶的表达在胞质溶胶中。在一些实施方案中,异源模块dha合酶的表达在植物的胞质溶胶中或者靶向到植物的质体。其它优选的植物包括已知产生用作药物的化合物、调味剂、营养剂、功能性食物成分或美容活性剂的那些植物或经遗传工程化改造而产生这些化合物/药剂的植物。本发明进一步包括由本文中所述的植物产生的任何种子以及由本文所述的植物或种子产生的任何油。本发明还包括使用本文中所述的植物、种子或油生产的任何产品。因此,本发明的目的是通过对如本文中所述的生物体的遗传操作产生包括dha的pufa以及通过延伸,从包含这些pufa的此类植物获得的油。可由本发明产生的pufa的实例包括但不限于dha、dpa(c22:5,n-6或n-3)、ara、epa、gla、ala、sda及其任何组合。通过经由使用生成dha的模块dha合酶和生成其它pufa的经修饰的模块dha合酶开发经遗传修饰的植物,本发明允许生产富含一种或多种期望(主要)pufa的商业上有价值的脂质。本发明的经遗传修饰的生物体的用途本发明的一个实施方案是通过培养本发明的经遗传修饰的生物体来生产期望的生物活性分子的方法。优选地,生物活性分子是pufa,最优选dha。优选地,经遗传修饰的生物体是经遗传修饰的微生物。此类方法包括,例如,如本文中先前所述和根据本发明在发酵培养基中培养微生物的步骤。上文描述了用于与本发明的模块dha合酶相关的遗传修饰的优选宿主细胞和微生物。本发明的一个实施方案是通过培养本发明的经遗传修饰的微生物来生成期望的pufa的方法。此类方法包括在发酵培养基中且在微生物中有效生产pufa的条件下培养的步骤,所述微生物具有如本文中先前所述和根据本发明的遗传修饰。合适的或有效的培养基是指本发明的经遗传修饰的微生物在培养时能够生成期望的pufa产物的任何培养基。此类培养基通常是包含可同化的碳源、氮源和磷酸源的含水培养基。此类培养基还可以包括适当的盐、矿物质、金属和其它营养物。可以在常规发酵生物反应器中培养本发明的任何微生物。可以通过任何发酵过程来培养微生物,所述发酵过程包括但不限于分批、补料分批、细胞再循环和连续发酵。本发明进一步包括本文中所述的任何微生物或植物和由本文中所述的微生物或植物生成的任何油。在一些实施方案中,生成的油是dha。在一些实施方案中,生成的油是选自dpa、epa、ara、gla、ala、sda和dha的pufa的混合物。本发明还包括使用本文中所述的微生物或植物或油生产的任何产物。本发明的一个实施方案涉及修饰含有至少一种脂肪酸的产品的方法,所述方法包括对产品添加根据本发明且如本文中所述的微生物、植物或由经基因修饰的微生物或植物生成的油(例如已经用模块dha合酶遗传修饰的微生物或植物利用本文中所述的任何改善pufa生成和/或积累的策略,并且具有本文中所述的脂肪酸概貌)。本发明也涵盖通过此方法生成的或通常含有任何微生物或植物,或来自本文中所述的微生物或植物的油的产品。优选地,产品选自下组:食物、膳食补充剂、药物配制剂、饲料、人源化动物乳和婴儿配方食品。合适的药物配制剂包括但不限于抗炎配制剂、化疗剂、活性赋形剂、骨质疏松症药物、抗抑郁药、抗惊厥药、抗幽门螺杆菌药物、用于治疗神经变性性疾病的药物、用于治疗变性性肝病的药物、抗生素和降胆固醇配制剂。在一个实施方案中,使用产品治疗选自下组的病况:慢性炎症、急性炎症、胃肠道病症、癌症、恶病质、心脏再狭窄、神经变性性病症、肝脏变性性病症、血脂障碍、骨质疏松症、骨关节炎、自身免疫性疾病、先兆子痫、早产、年龄相关性黄斑病、肺病症和过氧化物酶体病症。在本发明的一些实施方案中,可以将由经遗传修饰的生物体或本发明中公开的方法产生的pufa掺入食物或饲料的组分(例如食物补充剂)中。可以根据本发明掺入pufa的食物产品的类型没有特别限制,并且包括食物产品如精致烘焙品(finebakeryware)、面包和卷、早餐谷物、加工和未加工的奶酪、调味品(番爷酱和蛋黄酱等)、乳制品(例如乳,酸乳);布丁和明胶甜点、碳酸饮料、茶、粉状饮料混合物、鱼类加工产品、基于水果的饮料、口香糖、硬糖果、冷冻乳制品、肉类加工产品、果仁和基于果仁的涂抹料、面食、家禽加工产品、肉汤和酱、土豆片和其它条或脆片、巧克力和其它糖果、汤和汤料、基于大豆的产品(例如乳制品、饮料、乳脂、和增白剂)、基于植物油的涂抹料、和基于植物的饮料。可掺入根据本发明生产的pufa的饲料的实例包括例如宠物食品如猫食、狗食等、用于水族馆鱼、培养的鱼或甲壳动物的饲料等、农场饲养的动物饲料(包括牲畜,还包括水产养殖饲养的鱼或甲壳动物)。可将根据本发明生产的含有pufa的经遗传修饰的生物体(如经遗传修饰的微生物或植物)直接掺入饲料产品中。提供以下实施例来说明某些具体的特征和/或实施方案。这些实施例不应解释为将本公开限于例示的具体特征或实施方案。实施例以下实施例描述了用于鉴定与寇氏隐甲藻中的dha的合成相关的单一、非常大的蛋白质的生物化学方法。使用分子生物学和生物信息学技术来确定整个蛋白质的氨基酸序列。此外,表征了所述蛋白质中存在的酶促域,并呈现了合成dha分子的基本原理。蛋白质的鉴定通过如下完成:1)在源自选定寇氏隐甲藻菌株的无细胞提取物中证明体外dha合成,2)使用分级方法富集合成活性;3)通过将各种级分中的dha合成活性与存在于那些相同级分中的蛋白质相关联来鉴定蛋白质候选物。使用源自纯化的候选蛋白质的胰蛋白酶肽的基于ms的测序获得初始蛋白质序列数据。通过使用虚拟蛋白质数据库来促进肽测序,所述虚拟蛋白质数据库通过对源自从寇氏隐甲藻的细胞分离的总rna样品的cdna的高通量测序获得。通过生物信息学方法使用来自额外一轮cdna测序的数据获得编码与dha合成活性有关的蛋白质的acdna重叠群的序列。蛋白质具有模块i型pks的特征,并且在此称为模块dha合酶。还提供了适合于通过模块dha合酶和辅助蛋白质的表达在异源生物体中生产dha和其它pufa的方法。实施例1以下实施例描述了体外测定法的开发,所述体外测定法证明了源自选定的寇氏隐甲藻菌株的无细胞提取物中从丙二酰基-coa从头合成dha。使用源自寇氏隐甲藻atcc原种培养物(atccno.30340)的两种菌株开发体外dha合成活性测定法。在源自atcc样品的单细胞菌落中观察到一些异质性。在含有“50:6培养基”[50g/l葡萄糖和6g/ltastonetm154酵母提取物(sensientflavors,indianapolis,in)in100%重建instantoceantm盐混合物(aquariumsystems,mentor,oh)]中的2%琼脂的板上从atcc样品中划线出细胞后从单一“湿润外形”菌落选择本研究中使用的称为“ko”的第一种菌株。通过紫外放射诱导的随机诱变后从“ko”菌株衍生第二种菌株。此第二种菌株,称为“ko-5”,仅能够在供应中等链长度饱和脂肪酸时生长,这提示了此菌株中的突变已经降低了其合成那些脂肪酸的能力。在含有1l50:6培养基的2.8l平底fernbach烧瓶中培养两种菌株的细胞。为了培养“ko-5”菌株,将0.5mm与随机甲基化的环糊精复合的c14:0脂肪酸(nucheckprep,elysian,mn)添加到培养基。将1l培养基与10ml3天培养物一起温育,并且于25℃,以135rpm温育4天,之后收集细胞。使用以下方案制备初始测定法中测试的样品。于4℃以3,000xg将1l培养物中的细胞旋下15分钟。将所得的细胞团粒在250ml50mmtris缓冲液(ph8.0)中清洗两次,然后250ml50mm用含有10%甘油的tris(ph8.0)清洗,之后在含有100mmkcl的冰冷的缓冲液a[50mmtris(ph8.0)、10%甘油、2mmdtt、1mmedta]中重悬以形成浆体,并且将10ml等分试样转移到50mlfalcon管。将经酸清洗的0.5mm玻璃珠添加到每个管,直至32.5ml体积标记。通过用手剧烈振荡2分钟破坏细胞,接着将样品置于冰上2分钟。这重复10次。通过弃去将所得的匀浆与珠分离,并且再用10ml缓冲液漂洗珠。用含有100mmkcl的缓冲液a将来自每种样品的组合材料的体积调节到32.5ml,然后通过于4℃离心分级。首先以500xg将样品离心5分钟。然后,以20,000xg将所得的无细胞上清液(用含有100mmkcl的缓冲液a调节到32.5ml)离心20分钟。以100,000xg将所得的上清液(用含有100mmkcl的缓冲液a调节到32.5ml)再离心90分钟。用含有100mmkcl的缓冲液a将所得的上清液体积再调节到32.5ml。还将所有团粒级分重悬,并且用含有100mmkcl的缓冲液a调节到32.5ml。然后,使用[1-14c]-丙二酰基-coa作为底物评估各种级分中的脂肪酸的合成。初始测定法混合物组分和条件基于那些经常用于脂肪酸合酶(fas)、聚酮化合物合酶(pks)和一些海洋细菌和一些破囊壶菌中找到的pufa合酶的测定法的。一旦证明了dha的体外合成,将测定混合物简化,并且针对所述dna的生成优化。对于初始测定法,通常遵循以下方案。将每种样品的100μl部分与100μl混合物混合,所述混合物含有2.4mmnadh、2.4mmnadph、4mmdtt、120μm乙酰基-coa、120μm[1-14c]-丙二酰基-coa、5mmatp和10mmmgcl2。于25℃将混合物温育1小时。停止反应,并且使用最初由morrison和smith(morrisonandsmith,j.lipidresearch,第5卷(1964年10月),第600-608页)描述的甲醇三氟化硼(bf3)方法将样品中存在的脂肪酸转化成。通常,将300μl新鲜甲苯/bht和800μlnaoh/甲醇添加到样品,然后将样品于100℃温育5分钟。然后,添加1mlbf3/甲醇,并且于100℃将样品温育30分钟。然后,将样品短暂置于冰上,之后,用2ml己烷提取脂质。使用银离子层析,遵循nikolova-damyanova(nikolova-damyanova,b.“silverionchromatographyandlipids.”于:advancesinlipidmethodology-one.(ed.w.w.christie,oilypress,ayr,1992)第181-237页)描述的指导分级提取的脂质。将己烷提取物加载到ag-ionspe筒(sigma-aldrich)上,并且通过用两种不同的溶剂洗脱将与筒结合的fame分成两种类别。使用溶剂a(其由97%丙酮和3%乙腈组成)洗脱具有中等链长度饱和脂肪酸和那些具有脂肪酸链中多达3个双键的fame。使用溶剂b(其由60%丙酮和40%乙腈组成)洗脱含有具有4个以上双键的较长链脂肪酸,如dha的fame。使洗脱级分的体积相等,并且通过样品的一部分的液体闪烁计数(lsc)测量每种样品中的放射性。图1a中显示了源自ko和ko-5菌株的样品的分级方案(和参考号)。图1b的柱形图中显示了源自两种菌株的各种样品的体外测定法期间产生的与脂质相关的放射性(在ag-ionspe筒上分成两种级分后)。图1c显示了通过一些代表性ag-ionspe筒级分的反相tlc得到的分析结果。用放射分析扫描仪检测并且评估板上存在的放射性。图1b中呈现的数据指示在体外温育期间,将来自[1-14c]-丙二酰基-coa的放射性掺入可以通过己烷提取并且在测定的各种级分中显示所述活性分布的材料中。对于每种测定法,通过使用ag-ionspe筒将产物分成2个级分。图1c中的数据显示了使用反相tlc分析代表性样品中存在的放射性标记的脂质。在tlc板上将样品中存在的放射性分成独特条带,并且大多数那些条带与同一板上运行的放射性标记的fame标准品之一共迁移。此外,清楚的是,通过溶剂a从ag-ionspe筒洗脱的材料包括与c16:0和c14:0fame标准品共迁移的化合物。可能的是,这些fame的脂肪酸组分源自fas系统的产物。比较而言,通过溶剂b洗脱的材料中的主要放射性标记的条带与dha-fame标准品共迁移。这作为这些无细胞提取物中发生的从放射性标记的丙二酰基-coa从头合成dha的证据采用。在图1a中概述的方案中显示的大多数级分中注意到对推定的dha-fame中掺入的放射性的出现,包括100,000xg上清液级分中的一些活性。这些观察鼓励进行使用各种方法富集活性的尝试。当与来自ko菌株的提取物相比时,从[1-14c]-丙二酰基-coa将放射性掺入较短链脂肪酸中在来自ko-5菌株的提取物中大大降低。因此,决定使用源自ko-5菌株的提取物以进一步尝试富集dha合成活性。对于优化测定法,dha合成活性继之以通过溶剂b从ag-ionspe筒洗脱的材料中的放射性的出现(遵循上文描述的方案)。实施例2以下实施例描述了体外寇氏隐甲藻dha合成活性的表征和最初优化。如实施例1中指示,选择源自寇氏隐甲藻ko-5菌株的提取物以进一步表征dha合成活性。对于图2中显示的数据,利用来自图1a中概述的方案的级分6(重悬的100,000xg团粒级分)。在一些另外的测试后,调节测定混合物,使得反应混合物中的其组分的终浓度如下:1.2mmnadph、1.2mmnadh、2mmdtt、60μm乙酰基-coa、25μmatp、0.5mmmgcl2和15μm[1-14c]-丙二酰基-coa。通常于25℃将反应运行50分钟。停止反应,将脂肪酸转化为fame,将样品中存在的脂质提取到己烷中,应用到ag-ionspe筒,并且使用溶剂a和b洗脱,如上文描述。通过lsc测定通过溶剂b洗脱的放射性。图2中的柱形图显示了在各种测定条件下通过溶剂b洗脱的级分中存在的放射性。图2中的第一个柱形显示了来自测定法的放射性,所述测定法含有所有指示的反应组分(对照)。对于每种其它测定法,省略测定混合物的组分之一(在图2中的适当柱形的顶部指示)。图2中显示的数据指示:1),nadph是体外dha合成中优选的还原剂–nadh是不需要的;2),除去atp或mgcl2不降低活性;3),除去乙酰基-coa导致活性降低。基于这些结果;从后续实验中的反应混合物中排除atp、mgcl2和nadh,而保留nadph和乙酰基-coa。作为努力使用层析技术来富集dha合成活性的前奏,进行几种其它探索性测试。例如,使用ko-5提取物的图1a中显示的级分7来获得对于dha合成活性的ph最佳值的指示。简言之,测试了几种不同ph数值的缓冲液(范围为ph6.0-ph9.4)。在每种情况下,使用脱盐旋转柱(pierce,inc.)用具有期望ph的缓冲液更换级分7的部分中的缓冲液。然后,在存在nadph、乙酰基-coa和[1-14c]-丙二酰基-coa的情况下如上文所述实施酶活性测定法。确定体外模块dha合酶活性的最佳ph介于ph7.5和8.5之间。后续测定法利用用50mmtris-hclph8.0缓冲的溶液。还有,测试了纳入各种水平的kcl对dha合成活性的影响。对于ph测试,利用级分7来测试此效果。确定kcl的适度水平(例如100mm)可以显著抑制放射性对通过溶剂b从ag-ionspe筒洗脱的材料中的掺入,并且此抑制随kcl浓度增加而增加。可以通过后续除去kcl完全恢复dha合成活性。通常,使用脱盐旋转柱(pierce,inc.)实现kcl除去。基于这些数据,将可以含有高水平kcl的任何层析级分脱盐,之后进行dha合成体外测定法。完善建立的是,将双键引入预先形成的脂肪酸链中是具有分子氧(o2)需要的反应。为了确定此类反应是否参与本文监测的体外反应中的dha合成,在缺乏o2的情况下进行测定法,其利用源自上文描述的ko-5的级分6。在组合之前以及还在反应的全部时间期间用氩气冲洗生物样品和混合物。确定了此程序在测定法中对将放射性掺入dhafame中没有影响。这指示o2依赖性脱饱和酶不参与寇氏隐甲藻dha合酶反应。实施例3以下实施例描述了用于鉴定与体外寇氏隐甲藻dha合成活性相关的蛋白质的方法。一旦在无细胞提取物中建立了体外寇氏隐甲藻dha合成活性并且确定了一些基本酶促特征,开始努力鉴定与所述活性相关的蛋白质。测试几种缓冲溶液组分以增加将充当层析分离的起始材料的100,000xg上清液级分中保留的活性比例。另外,探索多种多样的一组层析介质和分离程序。发现利用阴离子交换和大小排阻层析的这些中的两种分离方法是特别有用的并且并入富集程序中。以下是用于富集dha合成活性以及鉴定与所述活性关联的候选蛋白质的方案的描述。于25℃在补充有0.5mmc14:0的50:6培养基中将几升寇氏隐甲藻ko-5菌株培养4天,如上文描述。通过1l瓶中的离心(于4℃,3,000xg达15分钟)收集细胞。在250ml冰冷的50mmtris(ph8.0)中将所得的团粒清洗两次,并且重复离心步骤。将所得的团粒在250ml冰冷的50mm含有10%甘油的tris(ph8.0)中重悬,并且再次离心。将所得的团粒各自在25ml冰冷的缓冲液a[50mmtris(ph8.0)、10%甘油、2mmdtt、1mmedta]中重悬,并且转移到冰上的50mlfalcon管。将经酸清洗的0.5mm玻璃珠添加到管,直至32.5ml体积标记,并且手动摇动样品10次达2分钟,其间在冰上静置2分钟。将细胞匀浆弃入新管中。用25ml缓冲液a漂洗玻璃珠,将液体添加到细胞提取物的第一部分,然后于4℃以10,000xg离心10分钟。将所得的上清液转移到12.5ml快速密封罐,以于4℃以100,000xg超速离心30分钟。将所得的上清液流过0.22μm滤器,等分取样,并且于-80℃冷冻,直至进一步使用。那些样品称作s2级分。然后,利用两种层析方法富集dha合成活性。首先,将约10mls2级分加载到已经用缓冲液a[50mmtris(ph8.0)、10%甘油、2mmdtt、1mmedta]预平衡的uno1柱(bio-radlaboratories,inc.)上。用平衡缓冲液清洗柱,然后应用线性盐梯度,缓冲液a中的0至1mkcl,接着几ml含有2mkcl的缓冲液a。收集级分,并且在除去kcl后对跨越线性kcl梯度的那些级分测定dha合成活性。图3中显示了此柱分离的层析图。层析图上的迹线代表:选定级分的280nm的吸光度(右侧的标度)、来自电导率计的读数(标度未显示)和体外dha合成活性测定法的结果[在左侧标示为己烷可溶性材料中的放射性(cpm)]。在图的顶部标示收集的级分的编号,并且在底部标示了层析时间(从样品注射起测量)。在应用的kcl梯度的中间部分中洗脱dha合成活性。在本文显示的实施例中,合并级分29到33以用于接着的层析步骤。将来自uno1柱的合并级分浓缩,并且使用centriprepym-50过滤装置经由超滤降低kcl水平。将浓缩的样品(约0.5ml)加载到预先填充有superose6b(gehealthcarelifesciences,inc.)的tricorn柱上,并且用相同的缓冲液洗脱,所述tricorn柱已经用含有50mmkcl的缓冲液a[50mmtris(ph8.0)、10%(w/v)甘油、2mmdtt、1mmedta]平衡。收集级分,并且对合适的级分测定dha合成活性。通过在这些条件下的柱基质保留dha合成活性。图4显示了来自此特定的柱运行的层析信息。柱的流速是每分钟0.5ml,并且收集1.0ml级分。对选定级分的部分测定dha合成活性,并且在图中标示了结果。在图4的顶部标示了收集级分的编号,并且在底部标示了层析时间(从样品注射起测量)。dha合成活性在谱中早期以对称峰出现。通过与曲线比较估计活性峰的分子量为约180万道尔顿,所述曲线通过绘制已知分子量的蛋白质标准品的洗脱体积产生。来自这些实验的数据指示寇氏隐甲藻dha合成活性与可溶性蛋白质,或蛋白质复合物(如100,000xg上清液级分中的保留限定)有关,它可以与阴离子交换基质结合并且从阴离子交换基质洗脱,并且天然“酶”保留于superose6柱上(排阻限为约5x106道尔顿),但是具有较大的表观分子量(约180万da)。使用sds聚丙烯酰胺凝胶电泳(sds-page)实施从图4中显示的superose6b柱分离选择的级分的蛋白质组成的分析。简言之,用microconym-30离心过滤装置(emd-millipore)浓缩100μl每份级分,并且将保留物的终体积调节到10μl。制备样品以在变性3-8%丙烯酰胺,tris-乙酸盐凝胶(使用nupage技术指导,invitrogen/lifetechnologies中推荐的溶液和程序制备)上进行sds-page。在分离后,通过用考马斯亮蓝染色显示凝胶中的蛋白质条带。图5中显示了含有来自上文描述的superose6b珠的样品的染色凝胶。在图的顶部标示参考柱级分号。在凝胶的任一侧上包括蛋白质标准品。在图的左侧标示最大标准品的分子量(500kda)。如图中标示,鉴定出单一条带,即候选dha合酶,其在各个条带上的染色强度似乎与那些相同级分中检出的dha合成活性的水平相关。候选蛋白质条带的迁移率显著慢于凝胶上运行的最大分子量标准品的迁移率,指示它是非常大的多肽。实施例4以下实施例描述了用于获得编码与寇氏隐甲藻dha合成有关的蛋白质,即候选dha合酶的cdna重叠群的序列的方法。一旦鉴定出候选dha合酶蛋白质,使用肽测序和分子生物学和生物信息方法的组合测定其完整的氨基酸序列。使用先前实施例中描述的方法,将候选蛋白质中富集的层析级分制备,浓缩,并且在三个不同的凝胶上进行sds-page。用考马斯亮蓝染色凝胶,并且提交给克里夫兰临床基金会(clevelandclinicfoundation)的lerner研究所的蛋白质测序质谱法实验室。在实验室,从凝胶切出感兴趣的条带(即,那些与候选蛋白质有关的那些条带),用胰蛋白酶消化,并且将片段进行经由质谱法的测序。用公开可用的蛋白质数据库使用mascot程序对质谱数据的解读没有产生有意义的肽序列数据。为了促进谱信息的解读,制备源自寇氏隐甲藻自身的数据库。此数据库基于从分离自寇氏隐甲藻的总rna样品合成cdna和使用454技术的测序。简言之,在50:6培养基上培养寇氏隐甲藻ko菌株的细胞,如实施例1中描述。使用商品化的试剂盒(purezol试剂盒,bio-radlaboratories,hercules,california)并且遵循其推荐的方案从冷冻的1ml细胞团粒提取总rna。将总rna样品发送到外部供应商(eurofinsmwgoperon),在那里对它检查质量,制备cdna,降低与核糖体rna(rrna)内容有关的序列,并且实施剩余cdna的测序。获得了超过600万个单独的测序读段,并且装配重叠的区域(重叠群)。将源自此项成果的重叠群和单一读段的数据库提供给lerner研究所,并且再次分析从dha合酶候选蛋白质获得的谱数据。用新的数据库作为参照,鉴定出总共71种有意义的肽序列。这些肽与13种独特的核苷酸重叠群有关。使用blastx程序分析重叠群序列指示它们中的大多数含有编码与已知的聚酮化合物和脂肪酸核酶具有同源性的蛋白质的可读框(orf)。基于这些令人鼓舞的结果,制备额外的总rna样品,并且提交给另一家外部供应商(seqwrightgenomicservices)。对样品检查质量,降低rrna含量,并且合成cdna。使用illumina技术进行此情况下cdna文库的测序。装配的重叠群和原始序列数据两者用于接着的步骤。使用454测序数据和试验性的dha合酶重叠群,使用来自mira包的mirabait实用程序从完整的454数据集中提取匹配候选dha合酶重叠群的所有454个读段。然后,使用mira软件装配读段。然后,将所得的重叠群加载到来自staden包的开源精整工具gap4中。使用读段的低质量修整部分将重叠群手动扩展到最大值。进行低质量区域中的手动重叠群连接。重复操作,直至使结果不变。然后,利用来自第二轮rna衍生测序(使用illumina250bpmiseq和100bphiseq法进行)的数据。从完整的miseq和454数据集提取(使用mirabait)匹配先前重叠群的所有miseq和454读段。再次用mira装配读段,并且产生一个“主重叠群”,其经手动检查(gap4)含有所有先前已知的试验性重叠群。再次重复操作,直至“主重叠群”不生长。使用可用hiseq的子集加所有miseq和454读段,使用mirabait提取匹配“主重叠群”或先前的“试验性dha重叠群”的所有读段。用mira装配读段,并且再次产生一个重叠群,其经检查(gap4)与先前的“主重叠群”相同。已经保证miseq和454“主重叠群”是有效的,使用mira将匹配“主重叠群”的hiseq数据的子集定位到主重叠群,并且没有发现差异。声明“主重叠群”是最终的。所有6个框中的翻译揭示了框之一中的一个长的连续orf,进一步确认“主重叠群”中不存在移码。seqidno:3中显示了“主重叠群”的序列。虽然在此序列的3’端检出一串腺苷酸碱基(即聚a尾),但是seqidno:3中显示的序列中不包括那些核苷酸,因为难以准确测定重复区域中的核苷酸的数目。长的连续orf的序列分开显示为seqidno:2。实施例5在此实施例中,描述了与编码候选dha合酶蛋白质的mrna有关的“主重叠群”的特征。如实施例4中指示,通过源自从寇氏隐甲藻分离的rna样品的cdna的高通量测序的分析装配单一大重叠群seqidno:3。装配依赖于基于来自候选dha合酶蛋白质的肽的测序的重叠群的初始鉴定。使用生物信息技术装配全长重叠群。数据提示了seqidno:3中显示的核苷酸序列代表源自单一大mrna的cdna的编码链,所述单一大mrna编码实施例3中鉴定的候选dha合酶蛋白质。seqidno:3中显示的序列含有47,866个碱基。如实施例4中指示,seqidno:3不包含“a”串,其在重叠群中检出(即聚a尾),但是其长度先前未确定。mrna序列中包埋了可读框(orf),其从atg(甲硫氨酸)密码子(a存在于seqidno:3中的第97位)一直延伸到tga终止密码子(t存在于seqidno:3中的第47,785位)。因此,orf由47,688个碱基(排除终止密码子)组成,代表15,896个密码子(分开显示为seqidno:2)。已经显示了涡鞭藻的几个物种通过将前导物剪接到rna的5’端而修饰核编码的mrna(zhang等,proc.natl.acad.sci.,第104卷,第11期(2007年3月13日),第4618-4623页)。此反式剪接前导物长度通常是约22个核苷酸,并且具有特征性(保守)序列。seqid1的5’端显示了与其它涡鞭藻中找到的剪接前导物序列的同源性。剪接前导物序列的存在和与重叠群有关的聚a尾的检出指示与细胞器dna中编码形成对比,mrna来源的基因是在寇氏隐甲藻的核dna中编码的。另外,虽然涡鞭藻基因组经常含有多个串联的基因拷贝,但是来自生物信息方法的数据提示了仅一个拷贝的此基因存在于寇氏隐甲藻基因组中。实施例6在此实施例中,描述了候选dha合酶蛋白质的特征。显示了蛋白质是模块i型聚酮化合物合酶,其拥有多个独特的域。使用特定域的酶促类别以及其在蛋白质中的线性构造提供关于生成dha作为终产物的原理。数据与被描述为模块dha合酶的蛋白质一致。如上文指示,seqidno:3含有以seqidno:2列出的47,688个核苷酸的orf(排除终止密码子)。seqidno:1中显示了该orf的翻译。导出的蛋白质含有15,896氨基酸,具有预测的分子量1,698,964.9道尔顿(约170万da)。蛋白质的预测大小与变性sds-page期间观察到的候选条带的迁移率一致。虽然通过凝胶过滤评估的天然酶的质量接近此数目(即,约180万da),但是与此方法的不确定性是相当大的,尤其对于非常大的酶。不能排除天然酶具有超过一条多链链(例如同二聚体)的可能性。在蛋白质的n端部分中检测不到信号或细胞器靶向信号序列。推测酶存在于胞质溶胶中。凭借手头的候选dha合酶蛋白质的完整氨基酸序列,启动分析以确定其结果是否可以与其提出的功能相关。使用与pfam数据库的比较来测定蛋白质区域的潜在酶促功能。由于蛋白质的较大尺寸,使用蛋白质的序贯部分作为询问(例如有时约1,500个氨基酸)。分析揭示了49个独特的域的存在,其中48个是那些通常与i型pks系统有关的。另外,以i型pks系统的方式构造域。模块ipks型系统最初在细菌中检出,并且具有含有多个生物合成模块的大的蛋白质。这些系统的关键特征在于合酶蛋白质的中间产物的化学结构可以经常基于个别模块的酶促活性组分和那些模块的序贯次序预测。在候选dha合酶蛋白质中检出7个独特类别的pks相关域。这些酶类别以及它们催化的反应类型和可以存在于序列中的保守基序记载于“发明详述”部分。表1中显示了候选模块dha合酶蛋白质中检出的域的序列列表。表1中的数据包括:通过与pfam数据库比较检出的酶促家族、与那些酶具有同源性的区域的近似边界的指示、与域(若存在的话)有关的基序,包括参照氨基酸位置。seqidno:1的前约430个氨基酸不与pfam数据库中的任何酶促类别匹配,并且没有通过公开可用数据库的blastp搜索揭示的任何显著匹配。蛋白质中检测的第一个域在约450-540个氨基酸的区域中,并且与氧依赖性脱饱和酶酶家族具有同源性。“发明详述”部分中描述了此“drid”域的特征以及其牵涉提出的dha合成机制。以下的48个域与那些通常在pks系统中找到的域相关,如上文描述。通过与其它模块i型pks系统(例如经典的6-脱氧红霉内酯b合酶;schwecke等,proc.natl.acad.sci.,第92卷,第17期(1995年8月15日),第7839-7843页)类比,设计候选dha合酶系统的构造的模型,并且在表2中显示。模型含有总共12个模块。这些模块中的10个(称为m1-m10)与碳链延伸和新添加单元的修饰有关。第一个模块(称为m0)含有drid域和acp域。最后的模块(m-最终)含有te域。在此模型中,在延伸模块的右侧替换acp域。此构造与对6-脱氧红霉内酯b合酶提出的模块构造相似。其它模型是可能的(例如在延伸模块的左侧放置acp域),然而,这不会改变关于合酶产物的结构的预测。在seqidno:1蛋白中检出总共12个acp域,包括两个串联集(表2中加下划线)。在蛋白质中仅检出三个at域(表2中斜体)。at反应通常与起始单元(例如来自乙酰基-coa或丙二酰基-coa)和延伸单元(例如来自丙二酰基-coa)对acp的加载相关。在一些模块i型pks系统中,at域与每个延伸模块有关。已经表征了其它情况,其中募集分开编码的at以进行这些活性(cheng等,proc.natl.acad.sci.,第100卷,第6期(2003年3月18日),第3149-3154页)。在进行了阴离子交换和大小排阻柱上的层析的材料中检出dha合成活性,指示需要的at活性与候选蛋白质有关。这暗示了上文列出的一个或多个at域会接近蛋白质的内部acp域。seqidno:1中鉴定的最后的域与硫酯酶具有同源性。这提示了合酶的产物会以游离的脂肪酸释放。在蛋白质中检出不到ppt酶域。这指示分开的基因中编码的ppt酶进行寇氏隐甲藻模块dha合酶的acp域的活化。如“发明详述”部分中描述,可以使用与模块m1到m10有关的域以及体外合成数据(指示碳源自丙二酰基-coa)预测每个延伸单元的β碳的状态。图6中显示了模块m1到m10的反应会产生的分子的预测结果。序列显示于seqidno:1的蛋白质的鉴定基于dha,而非图6中显示的分子的体外合成。然而,所述蛋白质,即drid域中检出的初始域的特征提供了从该分子生成dha的原理。氧依赖性脱饱和酶属于实施多种多样的一组反应的大的酶家族。此家族中包括能够反-顺双键异构化和羟基化/脱水反应的酶(例如broadwater等,j.biol.chem.,第277卷,第18期(2002年5月3日),第15613-15620页和shanklin,等,j.biol.chem.,第284卷(2009年7月10日),第18559-18563页)。对于所有这些酶,初始的反应步骤牵涉从脂肪酸碳链的内部饱和的部分提取氢。此反应是需要能量的,并且通过与二铁活性位点结合的分子氧的活化实现。已经鉴定了含有三个簇中排列的8个组氨酸残基的保守基序,其与所述活性有关。seqidno:1的脱饱和酶相关域(即以seqidno:4列出的drid域)与建立的脱饱和酶的序列的比对揭示了仅存在8个组氨酸中的2个。建立的是,可以在厌氧条件(实施例2)下发生在来自寇氏隐甲藻的提取物中体外合成dha。另外,模块m1到m10的提出产物已经含有羟基基团和双键,其已经在延伸循环期间引入(图6)。图7中呈现了显示将图6中显示的分子转化为dha的方案。方案包括异构化和脱水反应,其可以似真地与如上文描述的“drid”域有关。实施例7本实施例描述了在异源生物体中表达模块dha合酶。先前实施例中呈现的数据指示模块dha合酶从头生成dha,其使用丙二酸盐(自丙二酰基-coa)进行延伸反应,可能使用乙酸盐(自乙酰基-coa)作为引发分子并且使用nadph作为还原剂。这提出了在能够合成脂肪酸的任何异源系统中表达活性模块dha合酶可以导致由该引入系统生成dha(或合酶的其它产物)。寇氏隐甲藻模块dha合酶的酶促域均包含在一个非常大的蛋白质上(与pufa合酶的3或4个亚基形成对比)。可能的是,需要编码区的一些再合成来实现异源宿主中所述大蛋白质的表达。若新宿主细胞的内源ppt酶不能活化模块dha合酶的acp域,则将有必要共表达合适的ppt酶。合适的ppt酶可以是sfp(来自枯草芽孢杆菌)或svp(来自轮丝链霉菌)。已经显示了这些ppt酶识别一大批acp底物。另一种方法可以利用来自寇氏隐甲藻自身的ppt酶,即活化寇氏隐甲藻模块dha合酶acp域的内源ppt酶。用已知的ppt酶序列询问寇氏隐甲藻来源的cdna数据库(记载于实施例4)用于鉴定编码与那些酶具有同源性的蛋白质的重叠群。seqidno:5中显示了通过此搜索鉴定的寇氏隐甲藻ppt酶的氨基酸序列。使用记载于(jiang等,j.am.chem.soc.,第130卷,第20期(2008年4月29日),第6336-6337页)的方法的体外测定法指示此酶能够使寇氏隐甲藻模块dha合酶的acp域酰巯基乙胺基化,并且因此它将适合于此应用。根据意图的用途,其它辅助酶也可以用于促进dha(或合酶的其它产物)在异源宿主中的积累增加。例如,数据指示寇氏隐甲藻模块dha合酶的产物以游离的脂肪酸释放。若期望使那些产物进入新宿主中的磷脂或中性脂质合成途径,则可以包括合适的酶的共表达以将游离的脂肪酸转化为酰基-coa(即酰基-coa合成酶),使得它可以进入那些途径。还有,可以识别dha-coa(或其它产物coa),如dgat或lpaat的各种酰基转移酶的添加可以导致异源宿主的磷脂和中性脂质中的产物积累增加(参见例如metz等,美国专利7,759,548(2010年7月20日))。适合于模块dha合酶的异源宿主之一是裂殖壶菌。以下段落中描述了此生物体中寇氏隐甲藻模块dha合酶表达的实例。在此实验中,再合成寇氏隐甲藻模块dha合酶的编码区,使得密码子选择更紧密匹配裂殖壶菌的密码子选择。裂殖壶菌中引入寇氏隐甲藻模块dha合酶依赖于已经显示在此生物体中发生的同源重组(参见美国专利申请流水号10/124,807,见上文)。已经广泛表征了裂殖壶菌pufa合酶基因(pfa1、pfa2和pfa3)的基因座。已知破坏pfa3基因例如导致不能合成dha,使菌株在pufa上营养缺陷(apt等,美国专利8,940,884(2015年1月27日))。使用此位点作为靶位置以在pfa3基因的启动子和终止子之间插入寇氏隐甲藻dha合酶转基因。由于序列的较大尺寸(47,688个碱基),在合适的载体中掺入寇氏隐甲藻模块dha合酶基因以作为3种大致相同大小的经密码子优化的片段进行系列转化。第一个片段(f1)包含编码序列的第一部分直至模块3(m3)的末端,如表2(和seqidno:2)中描述。将它克隆到载体1中,所述载体1含有pfa3基因的立即上游区域(1901bp)、sv40终止子、微管蛋白启动子(源自pmon50000,参见apt等,美国专利8,940,884(2015年1月27日)中的实例),接着是新霉素磷酸转移酶(npt)基因(记载于所述相同专利)和pfa3基因的立即下游区域(1979bp)。遵循标准分子工程化程序,在pfa3基因的上游区域的3’端和sv40终止子的5’端之间将f1插入在3’端具有v5标签的载体1中。第二个片段(f2)包含从模块4(m4)开始到模块7(m7)末端的dha合酶编码序列的中间部分(表2和seqidno:2)。将它克隆到载体2中,所述载体2含有f1的3’-端(1998bp)、sv40终止子、微管蛋白启动子,接着是zeocintm抗性基因(记载于apt等,美国专利8,940,884(2015年1月27日))和pfa3基因的立即下游区域(1979bp)。在f1的3’端和sv40终止子的5’端之间将f2插入在3’端具有聚组氨酸标签的载体2中。第三个片段(f3)包含从模块8(m8)开始到表2和seqidno:2中描述的编码序列末端的dha合酶编码序列的末端。将它克隆到载体3中,所述载体3含有f2的3’端(1998bp)、sv40终止子、微管蛋白启动子,接着是新霉素磷酸转移酶(npt)基因和pfa3基因的立即下游区域(1979bp)。遵循标准分子工程化程序,在3’-端f2和sv40终止子的5’端之间将f3插入在3’端具有或没有v5标签的载体3中。使三种最终的构建体线性化,并且用于经由颗粒轰击连续转化裂殖壶菌细胞。使用来自转基因裂殖壶菌的细胞,所述转基因裂殖壶菌表达寇氏隐甲藻的ppt酶(seqidno:5),或另一种感兴趣的ppt酶,如het1或sfp,在胡萝卜素合酶基因座(记载于weaver等,美国专利7,585,659)处整合。在含有巴龙霉素和pufa供应两者的板上涂布用含有寇氏隐甲藻模块dha合酶的第一部分(f1)的第一构建体轰击的细胞。然后,将这些板上生长的菌落划线到未补充有pufa的巴龙霉素板上。通过pcr进一步表征对巴龙霉素有抗性并且需要pufa补充的几个菌落,以确认转基因的存在。还通过使用抗性的免疫印迹表征酶的第一部分(f1)的表达,所述抗体识别位于f1的3’端的v5表位标签。然后,用含有寇氏隐甲藻模块dha合酶的第二部分(f2)的第二构建体轰击含有寇氏隐甲藻模块dha合酶的第一部分的转基因菌株的细胞。构建体的适当整合导致除去f1v5标签和终止密码子。与上文类似,然后在含有zeocin和pufa供应两者的板上涂布细胞。然后,将在这些板上生长的菌落划线到未补充有pufa的zeocin板和补充有pufa的巴龙霉素板上。通过pcr进一步表征对zeocin有抗性,对巴龙霉素敏感,并且需要pufa补充的几个菌落以确认dha合酶基因的第二部分的存在。还可以通过使用抗体的免疫印迹表征模块dha合酶直至模块7末端(即f1+f2)的表达,所述抗体识别位于f2的3’端的聚组氨酸标签。然后,用含有寇氏隐甲藻模块dha合酶序列的第三片段(f3)的第三构建体轰击含有寇氏隐甲藻模块dha合酶序列的f1和f2两者的转基因菌株的细胞。与上文类似,然后在含有巴龙霉素和pufa供应两者的板上涂布细胞。然后,在未补充有pufa的巴龙霉素板和补充有pufa的zeocin板上划线这些板上生长的菌落。通过pcr和测序进一步表征对巴龙霉素有抗性并且对zeocin敏感的几个菌落以确认以正确构造整合完整模块dha合酶序列。可以通过使用抗体的免疫印迹分析表征全长蛋白质的表达,所述抗体识别位于完整序列的3’端的v5表位标签(若使用的话)。还可以通过毛细管柱液相层析-串联质谱法的肽序列分析确认了蛋白质的身份(表3)。表3:考马斯蓝染色凝胶条带的液相层析-质谱法分析中鉴定并且通过sds-page分离的肽的实例,所述考马斯蓝染色凝胶条带获自来自表达寇氏隐甲藻模块dha合酶的转基因裂殖壶菌的部分纯化的蛋白质提取物。残基编号指seqidno:1。预期表达全长寇氏隐甲藻模块dha合酶以及选择的ppt酶的细胞不一定在转化后在标准选择程序期间在没有pufa的情况下生长。然后,调节生长条件以促进dha的生成,其然后通过fame分析检测,如上文描述。还可通过用普遍标记的c14-乙酸盐的脉冲标记表征通过寇氏隐甲藻模块dha合酶的体内dha合成。序列表<110>帝斯曼知识产权资产管理有限公司(dsmipassetsb.v.)<120>使用新模块二十二碳六烯酸(dha)合酶生成多不饱和脂肪酸(pufas)<130>30926-wo-pct<140>tbd<141>2016-06-06<150>62/172,049<151>2015-06-06<160>22<170>patentin3.5版<210>1<211>15896<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>1metargargserglyglumetlysglyalaserglyserserglyser151015serglyproserlysargserglyleulysargserglyglyasnthr202530glyserglnserglnleualaaspmetvalaspglnleuservalthr354045thrserthrglyserileargmetleualaargalaglyleucysleu505560sermetglyilevalleualametglyarghisthrprotrptrpleu65707580ilepropheglyvalvalphegluglyvalserleualatrpphehis859095leuileglnlysglucysgluglnglylyspheleuproserproglu100105110leuasnargvalleualaalaleuleuargtrpgluvalcysserala115120125leuvalilevalleupheleuserglyalatrpaspiletyrserile130135140phelystyrtrpleuleuproleuleuvalthrglnalathrpheser145150155160thrserseralathrglulysprolyssergluseralagluglyser165170175glyargleuserlysthrprosermetserserleuaspleuleuphe180185190progluleugluseralaalaserglnilesergluleuleugluala195200205alaglnhisalaaspglnserasnmetphethrhishisvalglyala210215220aspaspalaserserglyaspasptrphispheglyvalalaleuhis225230235240glnilepromettyrhisleuglnserleuserargasnleuasnlys245250255gluleulysargalaargpropheglyserseralaasnleualaala260265270leumetglyglyglyserglnaspalagluproglyglygluglnasp275280285gluglyleuargglnargargserlysproalaalaarglyslysglu290295300glulysglylyslysaspalavalglnglnthrprotrpalaglnval305310315320metasnleuileglytrpproalaargtyrleupheargglumettrp325330335leutrpthrglulysaspleuthrleutyralavalvalalailephe340345350leuleugluvaltyrileglythrlystyrpheserphealaproile355360365cysleuleutyrproleuleuserserserserglyalaargmetala370375380sergluleuglnglugluilevalmetvalmetglyleugluhisarg385390395400phetrpargargleuhisileprovalalaleuglnvalleuvalcys405410415hisasnmetvalvaltyrpheilepheserglnileilepheglygly420425430valaspprotyrvalglyvalalaprolystrpglnthrpheleuphe435440445glyvalvalleutyrvalleusermetvalglymetileglymetasn450455460leuvaltrpalacysglyalavalvalleuaspleuproglnlysval465470475480pheleumetilecysalaserthralaasnglnglyserilephearg485490495trpcysargasphisargalahisleumetasnlysglythrvalala500505510aspprotyrasptyrasnargglyalathrphealatyrileglytrp515520525phevalglnglnlysthrargargalaileglualaserargserval530535540aspmetseraspleuleualaaspglnvalvalmetpheglnalaasp545550555560valaspthrtrptrpasnleusertrpcyshisalaileproalaphe565570575leuthrleumettrpglygluaspleupheleuglytrpvalilecys580585590glycyspheargtyrvalleualaleuhisserasnleuleuleuval595600605tyrhisglnhisalatrpglyprometgluvallysalaglnproval610615620leuthrglygluvalthralaalaalathrglyargargthrglygly625630635640serglnmetleuargseralaserilealagluglnleuglnserval645650655progluthrgluvalalaproasnargproalaproleuaspthrala660665670alaalailealaglnglnalaargasnalagluaspglyglyvalphe675680685vallystyrlysvalglyglnalaseralaglyglygluproserleu690695700gluvalargleugluproleutrpargargserthrleuileaspleu705710715720alalysaspalavalalaaspileleulysvalglnserserglnval725730735argproaspargproleumetaspleuglypheaspseralaserala740745750leuargleuargasplysleuserargargleuasnvalgluleupro755760765prothrleuleupheasphisprothrileasnaspmetvalaspasn770775780glyleuthrlysphealaglnargprometthrproserglyilethr785790795800proaspglnlysalaalaalametproaspleuvalvalthrserthr805810815alacysasnmetprolysalaglyserproglygluleutrpasnmet820825830leuvalthrlysthraspalavalvalgluvalproleualaargtrp835840845asphiscysglutyrtyrserprogluproglngluglyglnthrtyr850855860alaarghisglyglypheileaspasnalaaspleupheaspvalpro865870875880phepheglyleuthralaalaglualalysalathraspproglngln885890895argleuileleuthrthralatyrasncysphetyrglyaspglytyr900905910asplysalaalaleualaglyaspasnileglyvalphevalglyleu915920925serasnleuasptrptyrhisleuserleuserlysproservaltyr930935940thrglythrglyvalalaseralailealaserasnargilesertyr945950955960valpheglyleulysglyprosermetthrvalaspthralacysser965970975serserileseralaleuthrserglyilealaserileasnlysser980985990hisalavalargglualaleuvalalaglyalagluleuilehisgly99510001005proasnserpheileleuargservalalaglymetleuserpro101010151020gluglyargcyslysthrpheasnalathralaaspglytyrile102510301035argglygluglyalaalaalaalaileilelysleualaserasp104010451050alagluglulysargcysalavalvalalaaspvallysserala105510601065valmetasnglnaspglylysseralathrleuthralaproasn107010751080glyproserglnglugluvalleualathralaleuarggluala108510901095alametglnproasnglnvallysalaileglucyshisglythr110011051110glythralaleuglyaspproilegluvalseralailelysala111511201125valleuglyalagluserlysglualaprolysleumetleucys113011351140alaglylysserasnhisglyhisleugluglyseralaglyphe114511501155alaglyleumetlysvalpheglycysleuthrglnsergluval116011651170proproasnilehisphegluargleuasnprohismetserleu117511801185gluglyserargleuthrvalalaglualaglnthrthrilepro119011951200lysglyasnthrvalmetglyvalserserpheglypheglygly120512101215thrasnalahisalaleuleualahisserilearglyslyspro122012251230lyslysleusergluhisargvalalapheleuphethrglygln123512401245glyserglnargglnalametglylysargleutyrlysvalasp125012551260glualaphelysvalalaleuaspglualaalavalilecyslys126512701275aspleuileaspglnaspleuleuaspleumetphesergluasp128012851290argglumetleuglulysleuasnthrthrtyrtyrserglnile129513001305alailepheserileglutyralaleuserlysmettrpalaala131013151320lysglyilethrprophealavalleuglyhisservalglyglu132513301335tyrthralaalavalvalalaglyserleuserleulysaspala134013451350leulysalaleualathrargglyargleuileglnglulyscys135513601365aspproalaileglyasnmetcysserilephealaseralaala137013751380aspvalgluseralaileargservalaspleuglnglygluthr138513901395valasnilealaalaileasnglyproseralathrvalvalser140014051410glyhislyslysalavalglulysvalcyslysglnvalasnala141514201425glyasnlysgluleualaileglnhisalamethisserlysleu143014351440thrglucysileleuproaspleulyslysvalleuaspthrcys144514501455gluleulyslysproserseraspilehisphevalserthrleu146014651470thrglythrgluileserasngluleuthrlysalaalahistrp147514801485valglyhisaspgluasplysprometleupheleuglnglymet149014951500gluthrleuglulysleuglycysthralaphevalgluleugly150515101515proglnprovalleumetlysmetglyargargcysvalglnthr152015251530alaalathrasnpheglutrpleuserserleuthrproglyarg153515401545aspgluvalgluasnileleuleuileserargalaleuglyala155015551560alatyraspargvalsergluleulysprothrproleuprotrp156515701575argalaproleuleuhisproleuleuglylyslysglnglnasp158015851590alaserglyalathrvalphegluserglyalailelyssergly159516001605alaalametgluleuphegluglnhiscysvalpheglyglnval161016151620valleuproglyalaserhisileleuleualaalaalaalagln162516301635leugluseralathrthrargvalglyalaglyalaalavalglu164016451650leuasnaspalavalphegluargprophevalvalprogluasp165516601665seraspleuthrvalargcysargalathrvalaspthrthrglu167016751680valalaserserthraspglyalaalaprovalvalhisalaarg168516901695pheglyseralaargvalvalglyalaproalaleualathrpro170017051710valglngluargleuseralaleugluthrproproseralaglu171517201725glyvallysaspleutyrlysalaphegluasplysglyleugly173017351740tyrglyproserpheglnproleuglnglupheserpheglnser174517501755serglyalaleualaargleuglyilethrleulysthrtrpglu176017651770glnserleuglnmetleuhisproalaleuleuaspglyalaleu177517801785glnleuleuvalgluseralathrargargvalgluglulyscys179017951800thrpheleuprophealavallyslysalailevalalaalagln180518101815cysprothrglygluleutrpalaservallysvalleuaspser182018251830thralathrserleuasnalaaspvalgluvalpheasnalaglu183518401845glylysleualaileargleugluglyalasercysargargval185018551860glugluglyalaalaalaglulysaspasnglyaspglncysleu186518701875tyrserilesertrpvalglyalaglugluaspserargglyile188018851890leuvalthrglythrthrleuvalvalalaproglusergluile189519001905proalailealalysalaileglyvalsergluserargcysser191019151920alavalserthralagluglualavallysthralaalaasparg192519301935procysasnthrilevaltyrglnalaalaglysergluileasp194019451950alaleugluvalalaleulysleuthrglnglyvalalalysphe195519601965aspglyaspvalproargilevalleuvalthrthralaalagln197019751980glnproaspleulysasplysgluhisaspprolyshissergly198519901995leutrpglyphealaargalaalaargleuglutyrprohismet200020052010glnvalsercysvalaspleugluglysersergluvalalaala201520202025prothrproseralaalaleuseralaalagluvalgluvalser203020352040valargasnglyalaserleuglyalaargleualaargserser204520502055metalaprolysargproleuargleuasnmetalaargarggly206020652070serleumetasnleuargprovalproglnthrlysarglysala207520802085proglualaglygluilegluvalargvalglyalaileglyleu209020952100asnpheargaspvalleuasnvalmetglyleutyrproglyasp210521102115proglygluproglymetaspcysserglythrvalvalasnval212021252130glygluglycysprolysgluleuargcysglyaspaspalaphe213521402145glyileiletrpglycysleucysthrtyrglylysthrlyshis215021552160glnleumetalaproargproasnasptrpaspalaalaserala216521702175alaalaleuprothrvaltyrthrthrvalaspvalalapheala218021852190gluleualalysleulyslysglyglulysvalleuilehisgly219522002205alathrglyglyvalglyleuilealavalglntyralaglnlys221022152220leuglyalavalvaltyralathralaglylysgluglulysarg222522302235glnhisleuargaspleuglyvallyspheilethrserserarg224022452250serglyaspglupheglualaaspmetlyslyspheleuglylys225522602265glulysileaspvalvalleuasnsermetserhisaspasptyr227022752280ileproargserleuargleuleuglylysglyglyargpheval228522902295gluileglylysargaspalatrpthrprogluglnvalalalys230023052310glupheproaspvalhistyrtyrproleualaileasphisval231523202325cysgluphegluproaspargtyrglnglyleuleulysargleu233023352340gluglyalametarggluglytrplysproleuprometlysthr234523502355phegluglyleugluglnglyvalalaalapheglnpheleugln236023652370argalaglnhisileglylysvalvalleuthrvalproglnarg237523802385metglyleuglnlysaspalasertyrmetleuserglyglymet239023952400glyalaleuglyilevalthralaglnthrmetvalgluglugly240524102415alalysgluleuileleuleuserargserglylysvalproala242024252430gluvalglngluglntrpalatrpleugluasnseralaalaglu243524402445valilesertrplyscysaspvalglylysglyseraspaspile245024552460leulyslysleulysglylyslysglyasnglyleulysglyleu246524702475leuhisleualaglyvalleuaspaspglymetileproaspleu248024852490alaargserasnphegluasnalatyrglyprolysvalphegly249525002505alahishisleuargglualaalalyslysasnglyserthrleu251025152520aspphephealaleutyrserserthralaserleuleuglyala252525302535alaglyglnalaasntyrcysalaalaasnseralaleuaspala254025452550leualaasnalatrpargcysglnglygluservalglnserval255525602565glntrpglyprotrpleuservalglymetalaalaglnasnasn257025752580serphealaargleulysleuglyglyileserasngluleugly258525902595leuservalleuserseralailethrserglyalacysvalval260026052610glycysalailevalglntrpproglypheleulysglnphepro261526202625lysthrproleutyrleugluserphelysaspthralaalagly263026352640alaglyglyalaglyargalaglyglyserglumetglumetthr264526502655progluglyileleualatrpvalserservalalaalaaspval266026652670valglythrgluvalserproaspgluproleumetalaalagly267526802685metaspserleuserservalglupheargasnargleuthrala269026952700glucysserphealalyspheproasnthrleumetpheasphis270527102715prothrleuargalavalthrgluleuvalthrserglnleuser272027252730progluleuvalalaseralathrseralavalalathralagly273527402745proalaseraspileglnvalvalalaargglyleupheserarg275027552760pheproserglyaspglyleuglnalaasntrpgluasntrpgln276527702775lyslysmetaspserileilegluvalprophealaargtrpasp278027852790leuleugluphetrpasnproaspmetglualaserglyasnval279528002805thrtyrserarghisglyserpheilealaaspalaglumetphe281028152820aspproglyphepheglymetseralavalglualalysthrile282528302835aspproglnglnarghisleuleugluvalsertyralaalacys284028452850hishisalaglymetserlysglulysleuleualathraspthr285528602865glyvalphevalglyglncysasnasnasptrpalalyspheser287028752880seraspargproalaasnprotyrthrglyproglythrhisala288528902895serileserserasnargilesertyrasnleuglyleuarggly290029052910proseralaserileaspthralacysserserserleuvalala291529202925leuaspilealacysasnlysleulysglyserleuileglyser293029352940alaileglyalaglycysglnleuasnleuilealagluprophe294529502955valalapheglylysalaargmetleualaproaspglyargcys296029652970lysthrpheaspalaseralaasnglytyrvalargglyglugly297529802985cysglyalavaltyrleuvalglyalaalaalaserlysglnasp299029953000gluleualaileleuproglyilealaalathralathrasngln300530103015aspglyargserserthrleuthralaproasnglyprosergln302030253030glnaspvalilearglysalaleualaglnalaglnvalleuala303530403045tyralaleuglyphevalglucyshisglythrglythralaleu305030553060glyaspproilegluvalglyalaleulysalavalleualapro306530703075asnargthrthrproleuileleuglythrvallysthrasnile308030853090glyhisleugluglyalaalaglyilealaglymetvallysala309531003105metleuservalglnasnsergluvalproproasnleuhisphe311031153120asnthrleuasnproasnileaspleugluasppheprothrthr312531303135ileprothrserilegluasnleuthrglyaspglnprothrala314031453150glyleuserserpheglypheglyglythrasnalahisleuthr315531603165pheargalaalaprolysproleugluasnalaglnaspserglu317031753180glyglyalalysargargvalalapheleuphethrglyglngly318531903195serglntyrileasnmetglylysglnleutyrglualaglupro320032053210valphelysservalleuglulyscysalagluleuleuasnpro321532203225leuleugluglnproleuleugluvalilepheaspalaglygly323032353240lyspheglylysleuleuaspglnthrhismetserglnproala324532503255ilephealailegluvalalaleualasermettrplysalalys326032653270glyphegluprogluvalvalmetglyhisservalglyglutyr327532803285alaalaalavalthrcysglyvalmetserleugluaspglycys329032953300lysmetilealaalaargglylysleuilealaasplyscysglu330533103315alaglyvalglyalametvalalathrphealaproglualaala332033253330ileilealaalaileaspserleuseraspasnglulyslysglu333533403345valalailealaglyvalasnglyprolysmetcysvalvalser335033553360glyarglysaspvalvalglulysvalvalalaalathrglyala336533703375glyasnlysalaleuasnvalserhisalaphehisserproleu338033853390metalaprometleuaspserpheargglnthralaargalaala339534003405aspleulysthrproserserglyargphevalserthrvalthr341034153420glylysalavalthrthrgluleuglnaspalaglutyrtrpval342534303435lyshisvalalaglnthrvalargphealaaspalametserthr344034453450leuglulysgluglyvalaspalapheleugluileglyproglu345534603465prothrleuvallysmetglyargargcysvalserglythrgly347034753480tyrglntrpleuthrserilegluglylysglyalaprovalser348534903495gluvalaspalavallysglnalaalaalavalmetargglygly350035053510leuproproleuthrtyrlyslysglnalapheprotrpargasp351535203525alaglyproargmetleuargargargalathrthrasplysglu353035353540alahispheaspvalprovalargseraspleuphealavalala354535503555alagluhisvalvaltyrglygluilevalvalproglyvalile356035653570phevalglumetalaleugluservalargalahisleuglyglu357535803585hisvalglnleuargaspvalsermetvaltrpproleuvalval359035953600prolysasnalaaspcysgluglulysglnvaltrpmetargleu360536103615alaileileglnasnlysargphegluleuargserglnthrpro362036253630glyaspasplystrpthrthrhiscysgluglylysleuaspleu363536403645asnglyproalaalaprovalvalglugluserpheaspgluile365036553660arggluargcysprogluaspvalaspgluthrlysleutyrpro366536703675leuvalaspservalglyleutrpleuglyprolyspheglnval368036853690valserglumetlysargserlysglugluilesercyslysmet369537003705metleuhisproaspvalileasnasnglytyrileilehispro371037153720serleumetaspglythrilehisalavalcysalathrmetleu372537303735aspglnasppropropheleulysilephealaglyvalglyarg374037453750ilealamethisalalysalaalaprolysasnvallysvalasn375537603765leuhisleulysilesergluleuseraspglnglnglnilephe377037753780glncysvalvalthraspaspasplyslysvalleutrpvalmet378537903795gluaspvalleuphearglysvalleuprogluglnileglnlys380038053810alaleualaalathrlysglulysaspalavalasntyrpheglu381538203825alaglntrpglnproalathrvalaspasnleuserglyglyphe383038353840ileglulysglyprometleuvalilecysgluaspalaaspval384538503855leugluglymetglnalagluleuserglugluhisserleugly386038653870thrphealagluglytyrproglualaleuglugluphesergln387538803885valleucysvalalaserprovalalaglyprovalasppheleu389038953900glyglyalaleugluleuleuglnlysvalilelyslyslysmet390539103915aspglylysaspvalprogluvaltrpphevalleuasnserthr392039253930thralavalasnleusergluleulysglylysalavalprolys393539403945hisalaglyleutrpglyleuserargcysleuargleugluhis395039553960proaspilealacysglyvalileaspleuglyserlysvalhis396539703975valaspaspalaalaglyileleugluargleualaseralalys398039853990thrleuglnaspaspalapheglualagluvalleumetgluasp399540004005serglnglntyrvalalaargleuvalgluthrthrserglnleu401040154020glnasnleuprosergluglnserpheserlysaspalasertyr402540304035valvalthrglyglythrglyglyleuglyleuleuphealagln404040454050trpmetalaaspglnglyalaglyhisleuglyleuleuserarg405540604065thrglylysalaproalaglyproalatyrlyslysleualaser407040754080thrproglyvalgluvalalavalargsercysaspvalhisser408540904095glugluservalargserileileglygluleuserlysthrala410041054110alavallysglyvalleuhisalaalaglyvalleugluasphis411541204125leuilevalaspleulyslysgluhisleuaspprovalleuarg413041354140prolysileaspglythrleuasnleuhisglyalathrserasp414541504155leuaspphephevalmetpheserserilealaalametleugly416041654170serproglyglnalaasntyrcysserglyasnalaphemetasp417541804185alaphethrleuhisargargalaglnglyglnseralavalser419041954200valglntrpglyprotrpalagluvalglymetalaalaargala420542104215glythrsergluthrsertyrglnargleuaspprothralaser422042254230leualaalametglyalaileleuglyalaglyserglualaval423542404245thrasnglyilevalglyvalalaargvalasntrpserasnphe425042554260leualaglypheprothrleuproprotyrleuglnasnphelys426542704275asnpheargseralaglyvallysmetthraspglyvalserlys428042854290thrvalvalargaspthrileglualavalleucysaspvalleu429543004305glyaspproaspleualaasppheservalproleumetaspmet431043154320glyleuaspserleuseralavalglupheargasnargvalgln432543304335alaalaphegluglyleuhisleuthralathrvalmetpheasp434043454350tyrprothrvalalaaspleuthraspphevalcysserglnphe435543604365sergluglygluglugluglualaalaglyglyalaalaarggly437043754380gluvalasnalaglngluproleualametleuglyvalalaala438543904395argpheproglycysargthrasnasnprogluglutyrtrpasn440044054410metleuleuleuglyargaspmetileglngluvalproileglu441544204425argtrpaspvalaspleutyrtyraspgluasphisseralapro443044354440glylysmettyralaargasnglyglypheileleuglyleuglu444544504455glypheaspalalysmetpheglyilealaaspserglualahis446044654470alametaspprohisglnargileleuleugluvalalatyrglu447544804485serphetrpasnalaglypheasnlysaspaspleumetasnser449044954500aspthrglycyspheileglycysalathrleuglyglyileser450545104515valgluaspaspaspileglyprophethrasnileglyserphe452045254530proserglyasnserglyargvalserhisalaleuglyleuarg453545404545glyprocysphethrleuaspthralacysseralathrileval455045554560alaleuaspcysalaalaglnalametargleuasnlysglyglu456545704575argsercysvalalaglyserasnleuglnleuglnalaasnthr458045854590trpileglyphecyslysmetglyalaleuservalaspglyarg459546004605cyslysthrpheaspalaseralaasnglyphethrargserglu461046154620glyalaglysermetileleugluleuglnaspalaalaleuarg462546304635lysglyargthrgluilealathrvalleuglyalacysvalasn464046454650glnaspglyargseralathrilethralaproserglyproala465546604665glnglnargcysileglnseralaleualaaspglyservalasp467046754680proleuaspvalthrmetilegluvalhisglythrglythrala468546904695leuglyaspproilegluileglyglyleulysserthrvalgly470047054710lysglyargseralaaspserproleuileleuglyalavallys471547204725serileileglyhisglugluglyalaalaglyvalalaglyval473047354740ilelysmetvalcysgluphelystyrargglnileprolysasn474547504755leuhisleuhislysleuasnproasnileaspleuseraspphe476047654770alaservalvalmetproaspserileileasptrplysserthr477547804785serthrlysserglythrserserpheglypheserglythrasn479047954800serhisalaileleuglualavalaspglyaspgluileglygly480548104815valalaleuglnasnserthrproleulystrpalaargvalpro482048254830hisargmetserthrglutrpserserglyleutrptrpserleu483548404845glutrplysasnthrproleualathrglyserleuaspaspleu485048554860procysleuleuvalglyglyglygluilealalysalavalala486548704875lysvalileseraspvalthrvalvalaspilelysasnalaala488048854890lysalailegluglulysglutrpalathrileleuilethrglu489549004905proilethrserthraspaspcysleugluglyalaalailemet491049154920glnleuilegluvalthrlysalavalvalalaserglyargala492549304935leuargphevalvalalathralaglyalaglnseralaserthr494049454950gluaspserlysleuserglnglycysleuglyalaalaalatrp495549604965glyleumetargthrileiletrpglualaproserleulysleu497049754980glnthrileaspleuproserglnalaseralagluglumetala498549904995thrleuleulysaspgluleuseralagluglyaspileglupro500050055010gluilealatyrmetserglyglnargservalproargleuser501550205025serthrargleuglnglnthrsertrpserleulyslysproglu503050355040glythrglnleuleuthrglyglypheglyglyleuglyleuleu504550505055cysalaglnthrleuvalglnleuglyserlysserileleuleu506050655070valserarglysglylysilealaaspglyaspaspvalileala507550805085asphismetlyslysleuglngluthraspalagluilehisala509050955100trpsercysaspvalserserargthrasnvallyslysleuval510551105115aspargvalglnglngluleuprogluasnproleuserglyval512051255130valhisalaalaglyileleuasptyralagluileprosergln513551405145thrsergluargleuserservaltyrlysalalysvalalagly515051555160alatrpasnleuhissergluserglnasnthrgluleugluasn516551705175pheilevalpheserservalseralaleuileglyleuthrarg518051855190glyalasertyrserserserasnalatyrleuaspglyleuval519552005205leutrpargargalaargglyleualaalaserserleuglntrp521052155220glyprovalalagluvalglymetalaalalysaspaspleuala522552305235thralaaspserproleulystyrleulysproserglnvalgln524052455250alaalaphelysglnserileleuseralaserglnproserser525552605265leuleuphealalyscysasptrpproargphevalglnserleu527052755280glythrgluvalprovalleulysaspphevalglyalagluglu528552905295gluvalserserglyalalysthralavalserseralaphegln530053055310glymetserlyssergluvalgluserargvalglyaspmetval531553205325leuservalalacysthrvalleuglyileaspaspleuserpro533053355340glualaproleumetgluserglyleuaspserleuseralaval534553505355asppheargasnglnvalalalysthrleuproglyleulysleu536053655370proserthrleumetpheasptyrprothrthrseralaileala537553805385asnphealaalaserglnleualaproalagluserserarggln539053955400alavalvalalaalaproalaglyseralaleugluthrthrglu540554105415proilealaleuargalaglyalatyrargpheproileglugly542054255430gluasnleuglnglntyrtrpaspalaleuvalasnlysvalasn543554405445glyvalthrgluileproleugluargtrpaspvalaspalatyr545054555460pheaspalaasnprogluthrproglylysmettyrvalarghis546554705475glyserphevallysasnalaaspglnpheaspcysglyphephe548054855490glyleuserproalagluserlysvalmetaspproglnglnarg549555005505leuleuleugluvaliletyrargglyphehisgluhisglyleu551055155520argglnaspthrleulysglymetaspglycysilealavalgly552555305535glncysasnasnasptrpglyhismetglypheserproaspglu554055455550alaaspvalileglyprotyrthrglyleualavalserthrser555555605565ileserserasnargvalsertyrileleuglyleulysglypro557055755580serleuthrvalaspthralacysserserserleuthralaala558555905595aspilealaileserasnleuargargargargcysgluileser560056055610alaalaalaglyvalasnleuasnleuileproglypropheile561556205625alacysserlysalahismetleusergluaspglyphecyslys563056355640thrpheaspalaseralaasnglytyrvalargglygluglycys564556505655glyvalalaileleuglnargleualaaspleuglythrglylys566056655670seralaleuvalvalvalhisglyseralavalasnglnaspgly567556805685argserserserglnthralaprohisglyproserglnglnasp569056955700valilemetthralavalasnglualaglyleuleualaserlys570557105715valasnileileglucyshisglythrglythralaleuglyasp572057255730proilegluvalglyalaleulysasnthrleuglygluglyarg573557405745glugluserasnproleualaleualaalavallysserasnile575057555760glyhisleugluglyalaalaglyvalalaglyleuleulysval576557705775alacysmetleuproarglysglnvalproserasnleuhisphe578057855790lysgluleuasnprohisileaspleuaspasppheproserthr579558005805ileprothraspvalvalserilelysglnalaglyvalleuser581058155820alaglyleuserserpheglypheglyglythrasnalahisile582558305835valserlysglnphegluglygluprogluserglnproglnglu584058455850leuthrtyrthrargglnserphealatrpglnglnthrarghis585558605865thrleuleualalysargphelysthralagluasnvalglnval587058755880pheseralapropheglnglyargleuleuglnleuvalserhis588558905895hisileilepheglygluilevalvalproglyalathrtyrleu590059055910glumetvalleualaalaglygluphehisleuglyglylysgly591559205925thrglutrptyrilelysasnvalglypheglnalaproleuval593059355940leulysthrseraspthrglylysleuserarggluileaspleu594559505955tyrleugluvalpheproaspglyhistrpalametsersertrp596059655970aspvalalaglnglnarglysalaalathrhissergluglyglu597559805985valgluphethrglyargalavalalaasplysglnthrileasp599059956000ileglualavallysalaargcysaspgluaspvalvalleuglu600560106015argleutyrleupropheserlysileglyleuproleuglnpro602060256030argpheargthrvalarghisileleuargglyaspaspgluval603560406045ilecyslysvalglualagluasnaspserthrasnglnglyphe605060556060leupheasnproalavalleuaspglythrpheglnglysermet606560706075alaleumetleualaargargalathrgluvalaspaspleuthr608060856090serleuargileproleuleucysglnlysilethrasntyrser609561006105glnglyhisserthrseriletrpvalasnhisserleuargglu611061156120ilethrasplysgluasncysvalaspalalysilecyslysasp612561306135aspglythrvalleuleualametaspthrleulyspheargglu614061456150valargprogluhisileglnlysmetleuglnglnalathrglu615561606165aspasngluglnaspvalleugluglnglutrpthrthrleuglu617061756180glylysleuglythralaglyproleuserglylysvalilephe618561906195valglyalaseralaalametglulysalaleuargvallystyr620062056210serseralaserphevalargglyglygluaspleuglyaspcys621562206225alalysalalysilevalphevalglualaleucysglugluala623062356240glyglumetgluileilehishisalametleuleuvalglnval624562506255valmetlysmetalaasplysaspseraspthralaproalaleu626062656270trptrpilethrargglythrglnalavalglyalacysserser627562806285tyralathralaglyleutrpglymetalaargthralaargleu629062956300glugluargserleulysleuargcysleuaspleuaspthrthr630563106315glnglythrgluglualaalaglualaleuserthrtrpleugly632063256330thrleuserglyasnalaasnvalaspalaglualagluvalala633563406345leuargilealaaspglygluthrlysalatyrilealaargleu635063556360alaargserasnthrgluvallyslysprometglnleulysmet636563706375serserargglyserleualaasnleuargprovalproglnthr638063856390asnargargalaproglyalaglyglucysgluleuargvalarg639564006405alaileglyleuasnpheargaspvalleuasnvalmetglymet641064156420tyrproglyaspproglyasnproglyglyaspcysalaglythr642564306435valthralaileglygluglyvalgluhisleuargproglymet644064456450aspvalpheglyilealatrpglyserleuglnthrtyrvalthr645564606465thrasnalaleuleumetvalglulysphelysasptrpserphe647064756480gluglnmetalaalatrpservalthrphealathrthrgluglu648564906495alapheglngluleualaproleuvallysglygluargvalleu650065056510ilehisalaalathrglyglyvalglyleuvalalavalglnphe651565206525alaglnargvalglyalathrilephealathrcysseralaser653065356540lysvalgluhisleulysglymetglyvallystyrilethrthr654565506555thrargaspglyalaalapheglualaaspmetglnlyspheleu656065656570lysgluaspglyalaaspglyileaspcysvalmetasnserleu657565806585serhisaspasptyrileproargserleulysleuleulyslys659065956600glyglyargphemetgluileglylysargglyiletrpthrhis660566106615gluglnmetalaglngluargproaspvalmettyrglulysile662066256630alametasptrpvalmetgluhisglnprogluargtyrasnser663566406645leumetlysargleuvalgluglnileglylysglytrptrpala665066556660prometprothrthrprophevalglyleugluasnglyvalasp666566706675alaleuargtyrleuglnargalaglnglnileglylysvalval668066856690leuthrglnproserargmetsercysgluglnaspglycystyr669567006705leuleuserglyglyvalglyalaleuglyleuvalthralagln671067156720thrmetalaglugluglyalalysserleuvalleumetserarg672567306735argglyalaileproseraspleuglualaglntrpalalysleu674067456750glnglnphelysvalaspleuhisleulyssercysaspvalala675567606765asnmetaspservalglnleumetleuasnglyleulyslysglu677067756780leuprothrlysthrvalileargglyleuleuhisleualaala678567906795valleuaspaspalathrleuprolysleuthrargserhisleu680068056810glulysalatyrglyalalysvaltyrglyalalyshisleuhis681568206825thralaleualaseralalysthrproleuasppheleuvalleu683068356840pheserserthralaglyleuleuglyserproglyglnalaasn684568506855tyrseralaalaasnvalthrleuaspalaalaalaasncystrp686068656870glnglyargglyglulysalavalalavalglntrpglyprotrp687568806885argglualaglymetalaalaglnlysglythrvalgluargleu689068956900lysalaglnglyleuglyserleuglyasnvalvalglymetser690569106915valleualaglyserleuglyalathralaglyvalvalalaala692069256930cysprovaltyrtrpglyvaltyrleulysglnpheglyserser693569406945valproargpheleuserargpheglnlysglualaglyalagly695069556960serserglyproargproilethrglyglnglnaspargglyleu696569706975serilealaproalaaspvallysasnleuvalhisthrileala698069856990valgluvalmetglyserthrservalaspaspthrgluproleu699570007005metglualaglymetaspserleualaalavalglupheargasn701070157020argleuserserglnleuproglyilelysleuproasnthrleu702570307035ilepheasptyrprothrvalasnalaileglyasptyralaala704070457050alaglnvalvalprovalserglyglyalagluproalaglyile705570607065serpheserargseraspvalgluglnleuvalleuserthrala707070757080ilegluvalmetglyserserthrvalaspvalsergluproleu708570907095metglualaglymetaspserleualaalavalgluleuargasn710071057110argleuserserglnleuproglyvallysleuproasnthrleu711571207125ilepheasphisprothrvalseralailethraspphealaala713071357140serglnilealaproseralaglyserargglyalaseralaala714571507155leuglyglyalathrglnglulyslysleuleuaspvalarggly716071657170metserserilepheproglyserargaspalaalatyrtrplys717571807185aspphevalasplyslysaspservalilegluileprotyrthr719071957200argtrpaspvalaspalatyrpheasplysaspglnaspalapro720572107215glylysmettyrthrarghisglyglypheileaspglyalaglu722072257230metpheaspalaglymetpheserleuseralaalaglualaala723572407245metmetaspproglnglnargleuileleugluvalthrasnthr725072557260alapheasnleualaglyargasplysalaserleumetglyala726572707275aspvalglyvalpheileglyglncysglntyrasptrppheval728072857290metlysseralaglyasphispheasnthrtyrthrglythrgly729573007305ileseralaserileserserasnargthrsertyrilephegly731073157320phelysglyproserleuthrcysaspthralacysserserser732573307335leuvalalametaspalaglytyrserserileglnargglyval734073457350serglumetalaleuileglyglythrasnleumetleuglnpro735573607365serprotyrileserpheserlysalaargmetleusergluasp737073757380glyargcysphethrpheasnalathralaasnglytyralaarg738573907395glygluglyvalglyglyilevalvalglyvalalaglyaspala740074057410seralaaspvalseralametleuargalathralaalaasngln741574207425aspglyargseralaserleuthralaproasnglyprosergln743074357440glnalavalilealaargalaleumetgluglyserilealaala744574507455lysaspvalasnvalvalglucyshisglythrglythralaleu746074657470glyaspproilegluvalaspalaleulysasnthrleuasnval747574807485aspargserglnthrleumetleuthrseralalysthrasnile749074957500alahisleugluglyseralaglyilealaglyphevallysala750575107515alatyrmetmetargtyrglyglncysproserasnleuhisphe752075257530lysgluleuasnprohisileaspleugluasppheaspcysglu753575407545ilealathrgluleulysproleualaglylysprovalalagly755075557560leuserserpheglypheglyglythrasnthrhisvalvalleu756575707575sersersergluthrleuglythrglnalaalagluglualapro758075857590lysglnilethrphethrargglnserpheprotrplysasparg759576007605iletyrargleuleuprolysargleuglngluglyargaspthr761076157620hisphegluvalalailelysthraspvalpheasnilecysala762576307635gluhisvalvalpheasngluilevalvalproglyvalvaltyr764076457650thrglumetalaileglualathrargvalileileglylysglu765576607665alathrleulysaspleuthrmetthrtrpproleuvalvalpro767076757680lysasnalaaspglyproasnalathrthrvaltrpleuargphe768576907695alaglnmetglyserglulysphegluvalargserargarggly770077057710aspseraspglumetilethrhiscysgluglyargileglyarg771577207725serleusergluproglyvalmetaspilealaglyleuglnser773077357740argcysaspargasnvalaspprolysaspvaltyralaalaile774577507755hislysglyglyleutyrleuglyprolyspheglnvalcysarg776077657770hismetileargasnaspasphisvalleucyslysleuvalhis777577807785seraspglucysglyproasnglnglytyrphemethisprogly779077957800metleuaspglythrilehisthrleuglycysthrmetvalgly780578107815trpaspalaproleulysvalphealaglyileglylysleuval782078257830ilelysasphisthrasppheserargasnglusertyrtrpcys783578407845hisleuhisleulysthrphesergluglngluglnilephethr785078557860serthrvalalaasnglugluglyasnileleuphevalglyglu786578707875aspvalserphearglysvalthrprogluglnilearglysala788078857890metgluserglnalaalagluaspaspglnlysleutyrgluval789579007905glutrpthrserleuserthralaalaserserglugluaspglu791079157920aspalalystrpleuvalilealagluthraspservalleuala792579307935aspleulyslysglupheglyglualahisthrtyrthrlysleu794079457950alaglyalaaspleuglyglumetgluasntyrserlysvalval795579607965seralaileglyleugluthrservalasncysleuaspglyleu797079757980asphisalaleuglnleumetlysalaleuprolysseralaser798579907995thralaproglumettrppheleuthrhisglnalavalglnala800080058010vallysglyaspmetlysaspalaalaileprovalhisalagly801580208025leutrpglyleuserlysalapheargalaglupheprogluleu803080358040lysvalalacyspheaspleugluglyglylysilethrserleu804580508055lysglulyspheglnglnalaleuaspglnalaalaalaserphe806080658070gluprogluleualaleuargalaglyserleutyralaproarg807580808085leuvalaspserthrthrasnleuglualalysalaleuaspile809080958100pheaspalaaspalaserhisvalileserglyglythrglyala810581108115leuglyleuleuthralalystrpmetalaglulysglyalalys812081258130asnphevalleualaserargserglylysvalglngluaspala813581408145glnalametpheaspgluvalserservalalathrvallyslys815081558160leuasnmetserserleuaspaspvallysargleuphethrglu816581708175valalalyssermetproalaileglyglyilethrhisalaala818081858190glyileleuaspasphisleuilealaaspleuglnargserhis819582008205leuglualavalleuglyalalysvalaspglythrleuasnleu821082158220hisgluglyserlysaspmetlysleulystyrphesermetphe822582308235serserleualaserleuileglythralaglyglnalaasntyr824082458250cysalaalaasnglyphemetaspserphealaalatyrargile825582608265aspserglylysproalavalalaileglntrpglyprotrpala827082758280aspileglymetalaalaargalaglythrsergluservalval828582908295leuargileaspileglugluglyleuargalametgluvalile830083058310leuserasnserglyaspleumetthrglyalaileglyvalala831583208325argilelystrplysserpheleualaglnmetproalaleupro833083358340propheleuaspasnphelysglnphelyslysaspalaglylys834583508355lysseralavalalaleuglyalaalaproserlysaspvalval836083658370argglyglyilegluasnileleulysgluvalleuglyaspasp837583808385thrleuaspasppheserserproleumetaspleuglyleuasp839083958400serleualaalavalglupheargasnargvalglnseralaphe840584108415aspglyvalargleualaserthrvalmetpheasptyrprothr842084258430valalaaspleuthrasppheileleuserglnphealaproglu843584408445gluaspgluvalalaglyglyglyleuglyaspproalaalaser845084558460leuargaspsermetalavalileglyvalserglyargtyrpro846584708475glymetserpheserasnaspleugluglutyrtrpthralaleu848084858490cysserglyasnaspproileglngluileproilegluargphe849585008505aspvalaspgluiletyraspgluaspargseralaproglylys851085158520valtyrvalargasnglyglypheileglnglyvalglngluphe852585308535aspasnglyphepheglyilealaaspthrglualalysalamet854085458550aspalahisglnargleuglnleugluvalalatyraspserphe855585608565hisleualaglypheasnlysgluserleuserglymetgluval857085758580glyvaltyrvalglycyscysthrleuthrglyileaspvalglu858585908595seraspaspileglyprophethrasnileglyalaglyileser860086058610glyleuserglyargileserhisalaleuglyleuargglypro861586208625cysphealaileaspthralacysserserthrleuvalalaleu863086358640aspcysalaalaglnalaserargleuglyargglnglumetala864586508655cysvalalaglythrasnleuglnleuargthraspmettrpile866086658670glyphecyslysmetthrglyleualaalaaspglyargcyslys867586808685thrpheaspvalseralaaspglyphealaargsergluglyser869086958700glysermetileleuargmetargalahisalaglualalysgly870587108715glualaservalmetmetvalargglythrcysvalasnglnasp872087258730glyargseralathrilethralaproserglyproalaglngln873587408745argalaleualaalaserleuargaspglyaspleulysalaleu875087558760gluvalserleuileglucyshisglythrglythrserleugly876587708775aspproilegluvalglyalaglnglulysiletyrglylysglu878087858790argmetgluglnaspthrilevalleualaalavallyssercys879588008805ileglyhisleugluglyalaalaglyvalalaglyleualalys881088158820leuvallysmetilegluhislyslysvalproproasnleuhis882588308835leulyssermetasnproasnileaspileserasnpheproval884088458850asnileprothrserglyalaileasptrpserasnproglypro885588608865vallysalaglyileserserpheglypheserglythrasnser887088758880hisvalasnthrglugluproserasnalagluglyvalglupro888588908895prolysvalglnproleuvaltrpglnargargaspleusertyr890089058910argasptrpthrlysglyleuphethrserileglutrplyspro891589208925alaalailelysalathrglylysileaspalaalaalathrleu893089358940ileileglyglyglyaspilealalysalaleualagluileile894589508955proglycysilevalvalalaproglylysalaalalysthrser896089658970glyaspvaltyrsermetaspphethrlysalaaspglnvalser897589808985gluvalleuaspasnlysglutrpserthrvalvalphealaglu899089959000serleuvalalaaspgluprothrleugluglyglnalavalser900590109015glyleuleuleuthrleuglnalametserglntrplysargser902090259030alathrleuvalalaleuthralaglyalaglnthralagluala903590409045glyglylysmetglyvalglyvalvalglyalaalavaltrpgly905090559060phemetargservalargleuglualaalaasnvalgluproarg906590709075valileasppheseralaaspalathrseraspalaseralaleu908090859090alathrvalileserglugluleualaalaseraspalagluile909591009105alatyrvalasnglyasnargserthrproargleuvalalathr911091159120asnvallysasnglyglylysprogluglyilegluglythrtyr912591309135leuilethrglyglypheglyglyleuglyleuvalilealagln914091459150glnleuvalaspmetglyalathrservalalaleuvalserarg915591609165serglylysthrproalaglyaspglulysleualaglumetleu917091759180gluglnvalglnserserseralathrvalhisalatrpalacys918591909195aspvalseraspserlysargvalalaaspleuvallyslysser920092059210lyslysgluleuseralaasphisproleuserthrvalvalhis921592209225alaalaglyileileasphiscysalaleualaaspleuthrval923092359240aspserilealaasnvalphelysprolysvalglyglyalatrp924592509255hisleuhisseralathrlysaspaspglyleulysasppheval926092659270leupheserservalseralaleuileglyleuserargglyval927592809285thrtyrserthrserasnalaalaleuaspglyleualaleutrp929092959300argargalagluserleualaalathrserileglntrpglypro930593109315valsergluvalglymetserthrlysalaasphisalaalaser932093259330alaaspphealaleulysmetvalthrprolysglnvalglnala933593409345alapheglnargleuleuseralaproprolysalathrserval935093559360leuphealaargalaasptrpglylystyrleugluglnmetgly936593709375valaspvalprovalleualaasptyralaserthrglyglyala938093859390alaalaglyglyalathralaserseralapheserglymetser939594009405ileaspgluilegluserlysvalthrglumetvalvalaspcys941094159420valargthrvalleuglyaspaspservalglualagluserpro942594309435leumetgluserglyleuaspserleuseralavalaspphearg944094459450asnglnvalserlysglnleuproglyleulysleuproasnthr945594609465leumetpheasptyrprothralaglyalailealaglytyrala947094759480alaserglnleualaproalathrserserglyglyalaalaarg948594909495alathrthrglnilevalseralaalaglualaargglyproval950095059510serileleuglymetalacysglnpheproglyaspalaaspser951595209525leuaspasnphetrpasnvalvalvalasnlysvalaspcysval953095359540glyasnileproprogluargtrpaspalaaspglutyrphegln954595509555gluglyglyglyvalglylysmettyrvallysglnalaalaphe956095659570valargaspvalgluserpheaspalaserleuphealaileser957595809585seralaglualatyrthrmetaspproglnglnargmetleuleu959095959600gluthrvalhisthralatrpglnleuglythrglyglylyslys960596109615valserleuaspvalglyserphevalglyglucysasnasnasp962096259630trpglyhisphelysasnleugluvalglulysmetasnprophe963596409645serglythrglyglysermetserileseralaasnargleuala965096559660tyrvalpheglyphelysglyproservalthrseraspthrala966596709675cysserserserleuvalalavalaspglnalavalserasnleu968096859690trpargglyargcysseralaservalalaalaglyvalasnleu969597009705asnleuileproglyprophevalalacyscysglnalaargmet971097159720leualagluaspglyargcyslysthrpheaspalaalaalaasp972597309735glytyrserargglygluglycysglyalailealailearggly974097459750glnserserthrgluasnalaalaserphevalalavalvalgly975597609765thrglyvalasnglnaspglyargserserserleuthralapro977097759780asnglyproserglnglngluvalileasnmetalatrpglnglu978597909795alaglyilealaproseralaalaasppheilegluthrhisgly980098059810thrglythrglyleuglyaspproilegluileglyalaleuasn981598209825asnthrmetalagluglyargthrsergluvalvalileglyala983098359840vallysthrasnileserhisleugluglyalaalaglyileala984598509855glyleuleulysglyalametvalleugluasncyslysvalpro986098659870proasnleuhisleulyslysleuasnprohisleuaspvalglu987598809885asppheaspvalserpheprothrgluleuvalglulysserarg989098959900gluglnleulysserserglyleuserserpheglypheglygly990599109915thrasnthrhiscysvalthrthralaprothrgluglylysval992099259930aspglnglnglnglualavalvalpheasnlysglnargpheala993599409945trpserglnvallyshisproleuservalvalglyarglysgly995099559960alaaspproasnleuthrvalphethralaproileargglylys996599709975valvalglnleuleuserhishisileiletyrglygluileval998099859990valproglyalathrtyrleuglumetvalilealathrthrala99951000010005pheargleuglylysaspglythrlyspheservalgluglyval100101001510020glypheglnasnproleuvalleuargthralathrprothrglu100251003010035leugluargproilegluleuthrleuhismettyraspasngly100401004510050lystrpsermetasnserserglualaglygluvalleualathr100551006010065hisalagluglyservalserphealaasnprothrproglulys100701007510080lysmetleugluleuglugluilelysserargcysprogluval100851009010095valglnaspgluargmettyrvalprophealaasnileglyleu101001010510110proleuglnproargpheargthrvalargthrileaspargser101151012010125seraspgluileilealatrpvalalaalaglugluaspglythr101301013510140asnalaglypheilepheglyproalavalileaspglyserphe101451015010155glnalasercysalapheglnasnleuglualaleuproserleu101601016510170argileproleuserileasplysvalthriletyrglyglngly101751018010185tyrserglnlysvaltrpvalhishislysleuleugluasnthr101901019510200glulysthrmetalathrasnvalglnleualaargaspasplys102051021010215thrileileleuthrmetaspargmetargleuarggluvalarg102201022510230progluhisilealalysmetleualaglnalaalaglyaspglu102351024010245aspgluaspleuleugluvalglutrpalaalametaspthrlys102501025510260asnalalysalavalgluleuglylysthrleuvalileglyala102651027010275asnaspalaleulysglualaleuserlysgluilelysthrala102801028510290thrphealaaspseralaglualaleualaglualathrglyval102951030010305lysgluvalleuphevalglyalaleuvalaspseralaproglu103101031510320metgluvalleuhisthralaleuserleualaglnglualaile103251033010335lysphealaalaserlyslyslysgluserproprothrvaltrp103401034510350trpalathrlysglythrglnalaalaglyleuglyaspsertyr103551036010365tyrhisalaglyleutrpglyleualaargthrpheargmetglu103701037510380gluargservalasnleuargcysleuaspleuaspilesermet103851039010395glyseralaglualaalaalaalaalaleulysglutrpleupro104001040510410leuleuseralaalaasnleuvalglygluthrgluvalthrleu104151042010425argprolysgluaspserlysglumetalaproleuvalserarg104301043510440leualathrserthralalysserglnlysalaglymetleumet104451045010455metserserargglyserleuserasnleuargprovalleugln104601046510470gluserargprolyscysglyproasnaspalagluleuargile104751048010485argalavalglyleuasnpheargaspvalleuasnvalmetgly104901049510500leutyrproglyaspproglyproproglyalaaspthrsergly105051051010515thrvalleuthrvalglyglygluvalserhisileargprogly105201052510530aspaspvalpheglygluserproglycysleuargthrtyrasn105351054010545alaglyproalaproleuleuthrglnlysproprothrtrpser105501055510560phegluaspalaserthrmetprovalilephevalthrvalglu105651057010575gluserleuglyaspleualalysleulyslysglygluileval105801058510590leuilehisalaalaalaglyglyvalglyleuvalalailegln105951060010605tyralaglnphevalglyalathrileileglythralaglyser106101061510620gluglulyshisglupheleuargasnleuglyvallyshisile106251063010635thrserthrargasnglyglnlysphegluaspaspmetlysthr106401064510650ileleulysgluleulysvalaspglyileaspvalvalleuasn106551066010665serleuserhisaspasptyrileproargserleualaleuleu106701067510680lyslysglyglyargphemetgluileglylysargglyiletrp106851069010695serhisgluglnmetpheglualaargproaspvalmettyrglu107001070510710lysilealaalaaspthrmetmetaspleuglusertrplystyr107151072010725asnalatyrmetlysargleuleuthrargvalglugluglygly107301073510740leuvalproileasnlyshisvalphethraspileglulysgly107451075010755valthralametglnpheleuglnargalaglnasnileglylys107601076510770valvalilealaleuproserargmetaspcyslysproaspser107751078010785glutyrleuleuserglyglymetglyalaleuglymetvalthr107901079510800alaglntyrleuvalglugluglyalalyshisilethrleuleu108051081010815serargserglylysproserasnaspvalleuaspleutrpglu108201082510830trpleuglnlysserserileasnvalseralalysalacysasp108351084010845ilealaglnmetaspservalthrgluleualavalthrleuser108501085510860lysaspglyglnlysargserprolysthrhisvalglyglyval108651087010875ilehisleualaalavalleuaspaspalathrleuprolysleu108801088510890thrargglyhisleugluargserphealaalalysvaltrpgly108951090010905alaarghisleuhiscysalatyralalysgluleuaspphemet109101091510920leuleupheserserthrseralaleuleuglyserproglygln109251093010935alaasntyrseralaserasnserserleuaspalahisalaarg109401094510950tyrtrpargglnserglymetglnalathrservalglntrpgly109551096010965protrparggluvalglymetalaalaglnlysglythrvalglu109701097510980argleuargglnserglyvalglyserleuthrasnalaalagly109851099010995metalaalaleualaglyalaleuthralasercysprothrile110001100511010valalaglnprometargtrpalaasntyrleulysglntyrpro110151102011025lysilepropropheleuserargpheseralagluleulysthr110301103511040lyslysproalaalaproalaargproalaglnglymetmetmet110451105011055metglnglnalaalaproseralaproalaileservalthrasp110601106511070leulyssermetleuglnglnilealaseraspvalalaglygly110751108011085glyvalvalaspgluaspserproleumetgluserglymetasp110901109511100serleuseralavalglupheargasnargphethralalysval111051111011115proglnileasnleuproasnthrleuilepheasptyrprothr111201112511130ileseralailealaaspphealavalglyglnmetglyproala111351114011145thralaalaproalaglytyralametglnalaalaproalaala111501115511160proglymetthralaaspalailemetgluleuleuasnargile111651117011175alathraspthrthrglyglyalavalgluvalasplysproleu111801118511190metgluserglymetaspserleuseralavalglupheargasn111951120011205argleusersergluleuproserleuglnleuproasnthrleu112101121511220ilepheasptyrprothrileseralavalalaasptyralaval112251123011235gluglnleuglyalaserthrvalalavalprothrglyglyala112401124511250metvalprometalaalaglyalaserserglyalapheaspglu112551126011265proleualaileserglythralacyshispheproalaglyser112701127511280thrglyproasnvalphetyrlysglnleualaglnglyalaasp112851129011295glyilevalgluvalprophethrargtrpgluleuglugluval113001130511310tyraspproasnproaspalaproglylysmettyrproarghis113151132011325glyalapheileglnglyalagluglnpheaspalaserphephe113301133511340glyileseralaproglualaargalametaspproglnglnarg113451135011355leuleuleugluvalalatyraspserleuvalaspserglyphe113601136511370thrlysserserleuleuserserasnilealavalleuvalgly113751138011385glnalaasnasnasptrpileglnmetglnsertrpaspleulys113901139511400lysvalasnprotyrthralathrglymetseralaserileser114051141011415alaalaargilesertyrserleuglymetlysglyalasertyr114201142511430ileileaspthralacysserseralaleuvalalaleuaspala114351144011445alaalavalthrleuargargthrargcysthralaalavalasn114501145511460alaalaalaasnvalmetvalserproserthrtyrileserphe114651147011475serlysproargmetleusergluserglyargcysleuthrphe114801148511490aspglnseralaasnglytyrvalargglygluglyglyglyser114951150011505alaalaleuargleuvalalaaspalaglyaspphealaargser115101151511520ilevalargglyvalservalasnglnaspglyargserserthr115251153011535leuthralaproasnglyproserglnglnmetvalmetmetala115401154511550alaleuasnglualalysleuserproglnservalglyhisleu115551156011565glucyshisglythrglythrproleuglyaspproilegluleu115701157511580glyalaleuglnalavalasnalaglyargsergluasnvalpro115851159011595leuvalleualaalavallysthrasnvalglyhisleuglugly116001160511610alaalaalaserthrglyleuilelysilealaservalleugln116151162011625hisglyalaalalysproglyilehisleulysthrleuasnpro116301163511640asnilealaalaleuseralaleuproalavalphealaserglu116451165011655serleuproleuproserglyglyalatyrargthrserglyleu116601166511670serserpheglypheglyglythrasnalahisservalthrser116751168011685glualagluvalproalagluprovalargthrvalileprogly116901169511700lysglutyrlysarglysalapheprotrparggluvalglyphe117051171011715argleuleuargserserproseraspasnvalphegluvalval117201172511730metileseraspvaltyraspvalvalserhishisvalvalphe117351174011745serserilevalvalproglyvalvaltyrvalglumetalaleu117501175511760glualathrarglysilepheglyhisglyalalysleuthrasp117651177011775pheglymetvalpheprophevalilepropheargthrthrgly117801178511790valgluproalaalathrmetargphevalleuargglygluser117951180011805argphegluileglnserthrseralathrglyalavalthrval118101181511820hisalagluglyglyileaspargserprometlysaspproser118251183011835argalagluprovalaspleuaspmetvalarglysargvalthr118401184511850glugluileproalaservalvaltyrglyalaileaspglyval118551186011865glyleutrpleuglyprometpheglnvalalalysglnleutrp118701187511880argtyrglugluglyaspserilegluvalleuglyargleuglu118851189011895leuasplysthrileproasngluglytyrvalvalhisproala119001190511910leuleuaspglythrilehisthrleuglythralaserilegly119151192011925lysasnvalasnaspleulysilepheglyglyvalglyargval119301193511940thrilevalglugluserasnpheserlysalaaspglutyrtrp119451195011955iletrpmetaspilelysglulysleuglualasergluthrphe119601196511970aspvalargvalmetasnserserglylysvalleumetphemet119751198011985aspaspvalvalphearglysvalleuprogluglnileglnmet119901199512000alailealaalaglnseralasergluaspalaglnlysleutyr120051201012015gluvalasptrpthralaalaglugluleuglugluvalalaglu120201202512030gluaspaspglyglntrpleuvalleualaprogluglualaala120351204012045alalysgluleulyslysgluleuglyasplyshisasptyrlys120501205512060lysleuserglualaprothrgluglyleuglulystyrserlys120651207012075ilevalleualaalaglusergluargglythrprovalaspval120801208512090leuaspglyalaleulysleupheglnserleualahisalagln120951210012105gluglythrprogluthrtrppheleuthralaalathrglnala121101211512120alaalaserasngluaspleulysglyalaalaileprothrthr121251213012135alaglyleutrpglyleuserlysalapheargasngluhishis121401214512150aspvalglumetglyileleuaspleualaserserglyaspleu121551216012165lyslysproleuthrglulysleuthrasnalaseralaleumet121701217512180lysalalyslysaspalagluvalalaalaargalaaspglyleu121851219012195metvalproargleuvalglucysthrserargmetprovalgln122001220512210aspvalserpheprogluaspglythrphevalileserglygly122151222012225valglyalaleuglyleuvalphealaglutrpmetalaalaasn122301223512240glyalalyshisphealaleumetserargserglylyspropro122451225012255alaaspglnlysserthrleuarglysleuserservalalathr122601226512270vallyslyscysaspilealaserlysaspservalleualaleu122751228012285metlysgluilealalysglumetproprovallysglyalaile122901229512300hisalaalaglythrleualaaspglyleuleuvalaspleuasp123051231012315argglulysleuglualavalcysglyalalysileaspglythr123201232512330leuasnleuhisglualaleulysseralaproleugluhisphe123351234012345trpleupheserservalalaalametileglyservalglygln123501235512360glyasntyrcysalaalaasnalaphemetaspserphealaala123651237012375tyrargseralaglnglyleuproalaileservalglntrpgly123801238512390protrpalaaspvalglymetalaalaargalaglythrserglu123951240012405glyserilealaargilegluilealalysglyleuglualamet124101241512420glnserileleuglyalaserserasnleuhisglyglyvalval124251243012435glyvalalaargilelystrplysmetleuleuglyglnmetpro124401244512450lysvalproproleuleuthrlyspheseralaglualaglygly124551246012465lyslysalaseralavalsermetalaglyilethrglnaspasp124701247512480valglnasnleuvalvalglyvalleulysaspvalmetsergly124851249012495aspaspmetgluleuaspleuserserproleumetglumetgly125001250512510leuaspserleualaglyvalglupheargasnargleuglnala125151252012525serphegluglyleuserleuserserthrleumetpheasptyr125301253512540prothrvalproaspleuvalasppheiletrpserglnvalgly125451255012555proalagluaspglugluvalglyglyalavalalaglyglyasp125601256512570alaglyglymetleucysleuserglytyralaglyargphepro125751258012585glyserhisthrasnaspilegluglutyrtrphisthrleuser125901259512600hisglypheaspthrthrthrgluleuproprogluargtrpasp126051261012615ileasnalatyrpheaspseraspileaspalaproglylysthr126201262512630tyrvallysleuglyhispheileproglyileasphispheasp126351264012645glygluphepheglyvalseraspalagluglnargalametasp126501265512660prohisglntrpleualaleugluilesertyrgluglyleutyr126651267012675alaalaglyleuthrlysgluthrmetserglymetglucysgly126801268512690valtyrvalglyalacysasnleuglyglyasnaspvalaspleu126951270012705glualaleuglypropheserasnileglyalaalatyrsergly127101271512720cysserglyargvalserhisvalleuserleuargglyprocys127251273012735phethrvalaspthralacysserserthrilevalalaleuasp127401274512750serglycysglnalavalargleuglylyscyslysseralaleu127551276012765alaserglyvalasnvalglnilealaalaseriletrpilegly127701277512780pheserlysmetargglyleualametaspglyargcyslysthr127851279012795pheaspalaargalaaspglyphealaargglygluglyleugly128001280512810alavaltyrileglnalaalaalaasncysthraspalaasnpro128151282012825alailealametilethrglycysserthrasnhisaspglyarg128301283512840alaalathrilethralaproasnglythralaglnglnargval128451285012855leuargseralaleualagluargglythrleualagluaspval128601286512870alacysileglucyshisglythrglythralaleuglyasppro128751288012885ilegluvalglyalaglnlysalavaltyrasnlysglyargser128901289512900alaalaargproleuvalleualaalaglylysseralametgly129051291012915hisleugluglyseralaglyvalalaglyilecyslysvalile129201292512930cysthrphelyshisseralaileproproasnleumetleuglu129351294012945lysleuasnproasnileaspleuserglypheaspvalleumet129501295512960proaspserleuvalasptrplysalavalproargalaglyval129651297012975serserpheglypheserglythrasnglyhisalaileleuglu129801298512990alaproprothrproglyaspglnleuprogluarglysilegln129951300013005lyspheasnargservallysprotrphisglntrpleugluasn130101301513020valleutyrgluglualatrpasnthrcysgluleuvalproval130251303013035thralapheaspalasercysilevalvalglyserglyserile130401304513050alaglulysilearglysleualalysalaserthrvalvalpro130551306013065alaglythrseralalysaspvalseralaalametasplysala130701307513080asnalaglnvalalailephealathrseralaaspgluproasp130851309013095glygluileproglyalaargleuvalgluleuleuserpheleu131001310513110glnglyalaglnseralasergluthrprolysmetvalvalval131151312013125valthrlysglyalaglnaspalaserargprolyspheaspala131301313513140glyalathrleutrpglyleuvalargseralaargileglumet131451315013155proargthrthrilelysalaileaspvalprovalaspalaala131601316513170alaaspalaalaalalysilevalvalglugluleualaalaala131751318013185glualagluvalgluvalalahisilealaglylysglyargcys131901319513200valprovalvalthrglualaproglnthralalysserleugln132051321013215argglnaspalametleuasplyslysileleusergluglyleu132201322513230glnilevalthrglyglyleuglyglyleuglyleuvalserala132351324013245argglnleualagluleuglyalathrthrvalmetleuthrser132501325513260argserglylysvalproalaglyglnglyleuglugluhisleu132651327013275argtrpleuglualaileprothrthrgluvalvalilelyslys132801328513290cysaspvalserserserserservalsergluleumetlysglu132951330013305alathraspserlysglyprovalalaglyileilehisalaala133101331513320glyvalleuaspargcysproleualaglumetalalysgluasn133251333013335leuasplysvalcysgluprolysalaserglyalatrptyrleu133401334513350hissersersergluglnseraspleulysleuphevalleuphe133551336013365serservalseralathrvalglyleualaglyglyalasertyr133701337513380seralaalaasnalatyrleuaspalaleualaleutrpargarg133851339013395glulysproleualaalaleuseralalystrpglyprovalser134001340513410gluvalglymetthralaalaserglyseraspsermetleuglu134151342013425alametalaleulysalaleuserproalaglnvalglyserala134301343513440metargleuleuleuthrglnglnglyalaglyvalasnleuarg134451345013455alagluleumetleualaargvalasntrpalaaspphevalarg134601346513470gluvalglyvalgluileproglnvallysglupheglnsergln134751348013485glualaleualavalthrglylysgluserlysalaseralamet134901349513500alaglymetthraspaspaspargglnalaalavalleulysser135051351013515ileargseralaalaglnglymetglyleuglumetaspaspglu135201352513530thrproleumetglualaglyileaspserleuseralavalglu135351354013545pheargasnlysvalsersergluphearggluvalargleupro135501355513560serthrleumetpheasptyrprothrleuthralaleualagln135651357013575tyrvalserglyglnleuservalalaalaglyglyglnalaala135801358513590serseralaalaalaalavalalaleuproserlysproalaala135951360013605alaglyglyasnilealavalleuglyglyalacyshisleupro136101361513620glyaspsertrpserleuglualapheserhisthrleuvallys136251363013635glyvalaspcysilevalgluileprotyraspargtrpaspala136401364513650aspglutyrtyraspproglualaserthrglyleulysmettyr136551366013665vallyshisalaglypheilegluglyalagluleuphealaala136701367513680serserpheasnilevallysalaglualagluthrmetasppro136851369013695glnglnarghisleuleugluthrserpheglualaphevalval137001370513710glyglyphethrlysglnserleumetglyserphethrglyval137151372013725phevalglyglnasplyscysasptrpasnargmetilesergly137301373513740sermetglyglyprotyralaalathrglyglyserserserile137451375013755seralaasnargilesertyrserleuglyleulysglyproser137601376513770alathrmetaspthralacysserserserleuvalalaalaasp137751378013785thralaalaalathrleuargargargargcysaspilealathr137901379513800valcysglyvalasnmetleuleuleuproglnthrpheileala138051381013815cyscysglnalahismetleuseralapheglyargcyslysthr138201382513830pheaspgluseralaserglytyrvalargglygluglycysgly138351384013845alaglnthrleumetglnvalserasplysproalatyralaglu138501385513860metserglyseralaleuasnglnaspglyargserserasnleu138651387013875thrserproasnglyproserglnglnalavalvalleualaala138801388513890leualaglualaglyvalalaproseralaleuaspcysleuglu138951390013905thrhisglythrglythrgluleuglyaspproilegluvalgly139101391513920alaleuglnalaalaleuglyglyalaalaargglnlysalaleu139251393013935leuleuglyalavallysthrasnileglyhisleugluglygly139401394513950alaglyilealaglyleuthrlysleuvalcysmetleuasnmet139551396013965argthrmetvalproasnleuhisleuarggluileasnasphis139701397513980ileaspgluaspleuglnserphealavalargleuprothrglu139851399013995alathrlysleualaserlysglyileilethrserservalser140001400514010serpheglypheglyglythrasnglyhisvalvalleuglnthr140151402014025alaserlysglumetprolysthralalysproasnlysasnval140301403514040valpheleuphethrglyglnglyserglntyrileglymetgly140451405014055argglyleutyraspserglnprovalphelysglnalaleuasp140601406514070lyscysalagluvalleuasplysleuleuprothrproleumet140751408014085gluvalleutyrproalaaspgluserlysleuileaspglnthr140901409514100glnpheserglnproalailepheserileglutyralaleuala141051411014115thrleutrpargsermetglyvalgluprovalalavalleugly141201412514130hisservalglyglutyrcysalaalavalvalalaglyvalleu141351414014145proleugluaspalaleulysleuilealaleuargglyglncys141501415514160ilealaglulyscysglualaglyileglysermetalaalaval141651417014175phealaserglualaaspvalglnlysalailealalysvalgly141801418514190serlysaspvalservalalaalavalasnglyprolysmetthr141951420014205valvalserglyargseralaaspvalasplysvalvalalagln142101421514220thrglyalathrserargproleuthrvalserhisglyphehis142251423014235serproleumetlysproalaleuglupropheargalaglnala142401424514250gluthrvalthrpheserargproservallysphepheserthr142551426014265leuleuglyarggluvalthraspgluleualaglnproglntyr142701427514280trpvalasphisilegluasnalavallysphemetproalathr142851429014295metalaleuaspglualaleuserproaspleutyrleugluile143001430514310glyalaserprovalleuvalasnmetalalysargpheleuser143151432014325argservalglutrpmetproserleuaspasnlysvalserasp143301433514340glnaspalaphelyslysalaglnglnalaleuglyalaserala143451435014355glyargprolysalaaspleulysargthralapheprotrparg143601436514370glualaglyhisproleuleuargserlyslysthrleuproasp143751438014385glythrvalvalpheglyvalhispheglyglyhisvalleuglu143901439514400leuleuserhishisilevalhisglygluvalvalvalprogly144051441014415alacystyrleuglumetilevalalaglycysthrthrphephe144201442514430glyargaspglnprotrpcysvalgluglnleuglyphealalys144351444014445proleuvalleuargleuserprogluglylysleuaspglupro144501445514460thrgluleuargleuvalileargproaspmetargilegluval144651447014475glusergluileglyaspaspproaspaspserilevalalathr144801448514490hisvalglualaileleuvallysglnthrglythrtrpalaser144951450014505asnargproglulysaspalapheserleuaspglnleulyslys145101451514520glncysalagluprovalaspileaspleumettyrserphegly145251453014535lysasnserglyleuproleuglnargargpheargthrvalarg145401454514550hisvalglnlysglyasplysgluserileglyargleuglumet145551456014565gluargaspglythrglnvalglyphetrpleuglyproserleu145701457514580ileaspglyserpheglnalasermetalaleualaaspalaasp145851459014595valglyileglythrleulysileproleuserileargargleu146001460514610glnprothrglyargalatyrasnileservaltrpsertyrphe146151462014625glnleuileaspphethraspargserthrvalpheargsertrp146301463514640leuleuasnaspalaglyglualaleuleutyrpheasphisval146451465014655hisleuglngluvalargaspgluhisileglnlysvalleugln146601466514670serserglyargglnglythrgluglnserasnleutyraspval146751468014685glutrpargglnleugluleualaglylysproalaserleupro146901469514700asngluglupheleuvalvalglyglylysalaalaleuglulys147051471014715leuasnleuglylysserproglnphesercysmetglnilegly147201472514730lysaspileaspileasnaspaspaspservalasnlysalaleu147351474014745leuglylysalatrpalaglyilevalleualagluglyleuala147501475514760glulysvalglyaspvalaspvalvalthrglualametileile147651477014775vallysvalleuthrlysalaglyserlysalaproproleutrp147801478514790leuleuthrserglyserglnproleualaseralaaspalaglu147951480014805glnarglysalaglycysalathrhisserglyleutrpglyphe148101481514820alaargalavalargmetglutyrproglymetvalargvalser148251483014835cysleuasppheaspprothrserserlysserthrglyaspglu148401484514850leuseralaargleuserserleuthralaaspthrgluaspglu148551486014865valalaleuargseraspseralaalaseralaargleuvalarg148701487514880sergluleuglnphevalglyproserargleuasnmetalaala148851489014895argglyalaleuserasnleuargleuvalserglnglylysarg149001490514910glnthrproileproglyphevalglnglnargileargalaile149151492014925glyleuasnpheargaspvalleuasnvalmetglyleutyrpro149301493514940glyaspproglyalaproglyalaaspserserglythrileval149451495014955gluleuglyaspargvalaspthrleulysilealaaspaspval149601496514970pheglygluserproglycysleuserthrtyrasnasnglypro149751498014985alaalaleuleualaarglysproprosertrpsertyrgluglu149901499515000alacysalametprovalilephevalthrvalgluglualaleu150051501015015glyaspleualalysleulyslysglygluthrvalleuilehis150201502515030alaalaalaglyglyvalglyleuvalalaileglntyralagln150351504015045trpvalglyalalysvaltyralathralaglysergluglulys150501505515060hisalapheleuarglysleuglyvalaspargilethrserthr150651507015075argaspglyalalyspheglualaglumetglulysmetleulys150801508515090gluasplysleugluglyvalaspvalvalleuasnserleuser150951510015105hisaspasptyrileproargserleulysvalleulyslysgly151101511515120glyargphemetgluileglylysargglyiletrpserhisglu151251513015135glumetphelysalaargproaspilemettyrglulysileala151401514515150alaaspthrmetmetglulysglucystrpargtyrasnalatyr151551516015165leuasnargleuleugluargalagluthrglyglyleulyspro151701517515180ileasnasphisargphegluglyleuglulysglyvalalaala151851519015195leuglnpheleuglnargalaasnasnileglylysvalvalile152001520515210sergluproserargleuglncysasnproalaasnileserval152151522015225leuserglyglymetglyalaleuglyilevalthralaglnphe152301523515240leuvalglugluglycyslyslysleuserleuleuserargser152451525015255glythrproserseraspalaleualaglnpheglutrpleulys152601526515270alaalaalailegluvalglyvalserlyscysaspvalserser152751528015285gluthrservallysalaphealaserglyleuglnserproile152901529515300aspcysleumethisleualaglyvalleualaaspglymetleu153051531015315prothrleuthrarggluhispheglulyssertyralaprolys153201532515330valhisglyleutyrhismetvallyshistrplysmetserglu153351534015345aspthrlysphemetleupheserserthrseralaleuphegly153501535515360serproglyglnalaasntyrseralaserasnservalleuasp153651537015375serleualaproiletrpseralaglnglyargglnsertrpthr153801538515390valglntrpglyprotrpalagluvalglymetalavalglnlys153951540015405asnthrleuserargalalysalametglyvalglyalaleuser154101541515420thralavalglymetserilemetglyserileleuglyserala154251543015435serhisvalvalglyalavalprovalargtrpalalystyrleu154401544515450argseralatyrglngluthrprometpheleuthraspmetglu154551546015465alagluvalargargalaalaproalavalglygluglyglygly154701547515480asnserleualaleualaasnleuseralaglugluargleuglu154851549015495alavalarggluserleuleuthrmetalaarggluvalvalasp155001550515510asnaspthrleuseralagluaspalaleuleugluserglymet155151552015525aspserleuserglyvalglupheargasnargleuvalthrglu155301553515540phegluglyvalargmetglyasnserleuilepheasphispro155451555015555thrvalasngluleualaalapheileserglugluleuglyasn155601556515570thrleuproalaalaaspserseralaalaproalaalaleugln155751558015585asnglyalaserhisprovalglualaprogluserseralaser155901559515600phevalgluserleuasnserargalaserglythrproiletyr156051561015615phevalproglyalaglymetglnalaglyglypheargproleu156201562515630alaglnileleuprovalproalatyrglyleusertrpprolys156351564015645glyalavalproarggluglutrpprothrthrileaspglyleu156501565515660alaargvalpheleuthrgluvallyslysthrglnprothrgly156651567015675protyrargphealaglyhisserpheglyalaalavalalaleu156801568515690glumetalalysilealaglnalaglnglyleugluvalthrphe156951570015705valalaleuleuaspproarghismetglyglylysthrthrval157101571515720aspvalglyglualapheserthrthraspleualaaspserleu157251573015735glyleuleualaglnthrvalproaspglyserlystyrvalgln157401574515750alaleuglugluilevallysseraspaspargaspalaalaala157551576015765lyslysvalleuserproalavalleualaserleugluhisval157701577515780hisgluthrthrlystrptyrserthrleuleualaglyaspasn157851579015795leuglnproaspalaserleulysalaargilealavalleuarg158001580515810alaprogluthrtrpleuserproglyaspasngluthrileala158151582015825asplysmetvalargglupheglnalalysthrpheglnglyasp158301583515840aspgluvalthrlysleuvalaspglutrpcysglyvalalapro158451585015855pheleuasnmetlysvalproglyserhisphethrmetleuhis158601586515870gluprohisvalvalserleualametargleucysargalaval158751588015885aspglusergluglyglugluleu1589015895<210>2<211>47688<212>dna<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>2atgaggcgcagtggtgaaatgaaaggcgcctctggaagttccggatcctccggcccttcc60aagcgatccggcttgaagaggtctggtggaaacactggatctcagtcccaattggcggac120atggtcgaccaactgtcggtcaccaccagcacaggatccatcaggatgctcgcacgagca180ggcctttgcctctcgatgggcatcgttctagcgatgggacgacatacgccgtggtggttg240atccccttcggcgtcgtcttcgaaggagtttccctagcttggtttcacctcatccaaaaa300gagtgtgaacagggcaagtttttgccttctcccgagttgaatagagtattggccgctctc360ctgcgatgggaggtgtgctcggccttggttatcgtgttgttcttgtcgggagcctgggac420atctattctatcttcaaatactggctgcttcctcttctcgttacccaagccaccttttcg480acatccagtgcaacagagaagccaaaatccgagtctgcagaaggctcgggcagattgtcc540aagactccctcaatgtcttcgttggatctgctgtttcccgagttggaatccgcagcaagc600caaatttcggagttgttggaagcggcgcagcatgcggaccagagcaacatgttcacacac660cacgttggcgctgacgatgccagcagtggcgatgactggcacttcggtgtcgctctgcat720cagatcccgatgtaccacctgcagtcactctcccgaaatttgaacaaggagctgaagcgc780gcgcgcccttttgggtccagcgccaatttagcagctctcatgggtgggggcagccaagat840gctgaaccaggtggcgaacaggacgaaggcctccgacagcgacgctccaaaccagctgcc900aggaagaaggaggagaaaggaaagaaagatgctgtgcagcaaactccttgggcccaggtc960atgaacctcatcggctggccagccaggtacttgttcagagaaatgtggctctggactgag1020aaggacctcaccctctatgccgtcgtcgctattttcttgctggaggtctacatcggaacg1080aagtacttttctttcgcaccaatctgcctgctctacccgctgctgtcgagttcctccgga1140gcccgaatggcctctgaactgcaggaggagatcgttatggtgatgggcctcgagcatcgc1200ttttggcgtcgcttgcacatcccggtggctctgcaggtgttggtgtgccacaacatggtt1260gtgtatttcattttctctcaaatcatctttggtggagtcgatccttacgtcggtgttgcc1320cccaagtggcaaacctttctttttggcgtggtgctctacgttttgtccatggtcggcatg1380atcggaatgaacttggtctgggcctgcggtgccgtcgttttggacctcccccagaaagtc1440ttcctcatgatctgtgcctctaccgcgaaccaaggcagcatcttccgatggtgccgagat1500catcgtgcccaccttatgaacaagggcacggtggccgatccttacgactacaaccgtggc1560gctaccttcgcctacatcggctggtttgtgcagcagaagactcgccgtgcgatcgaagcg1620tcaagatctgtcgacatgtccgacctccttgccgaccaggttgtgatgttccaggctgat1680gtggacacctggtggaatttgtcttggtgccatgccattccggcattcttgaccttgatg1740tggggcgaagatttgtttttgggttgggtcatctgcggctgcttccgatatgtgctcgcc1800ttgcactccaacctcctccttgtctaccatcagcatgcctggggccccatggaggtgaag1860gcccagccagtcttgacaggagaagtgactgccgccgccactggccgcagaactggtggc1920agccagatgttgcgttctgcctcgatcgcagagcagctgcaatctgtgcccgaaacagaa1980gtcgcccccaaccgaccggccccactggacactgctgctgcaattgcccaacaagcccga2040aacgccgaggacggcggtgtcttcgtcaagtacaaggtcggccaggcctccgctggcggc2100gagccctctttggaggtccgtttggagcccctctggagacgctccacgttgatcgatttg2160gccaaggatgctgtcgccgacatcctgaaggtccagtccagccaggtccgacccgaccgt2220cctttgatggacttgggctttgattcggccagtgctctcaggctcagggacaagctcagc2280aggcgattgaacgttgaattgccacctaccttgctgttcgatcacccaacgatcaatgac2340atggtcgacaacggcctgaccaagtttgctcagcgcccgatgaccccctccggcatcacc2400cccgatcagaaggctgctgccatgccagatctggtggtgacttccactgcctgcaacatg2460cccaaggcgggctcccctggtgagctctggaacatgcttgtgacgaagaccgatgcggtt2520gtggaggttcctctcgcccgttgggatcattgcgagtactactctccagagcctcaggag2580ggccagacctacgctcgacacggaggcttcatcgacaacgccgatctgttcgatgtgcct2640ttcttcggtcttaccgcggcagaggccaaggctacggatccccagcagcgcctcatcctc2700acaacggcctacaactgcttctatggagatggatacgacaaggccgctttggcgggcgac2760aacattggtgtcttcgtcggtttgagcaacttggactggtaccacctcagcctcagcaag2820cccagtgtctacacaggcaccggtgtcgccagtgctatcgcctcgaaccgaatttcttac2880gtcttcggactcaagggacccagcatgaccgtcgacacggcttgctcttcctccatttcg2940gccttgacctccggtatcgcctctatcaacaagtcccacgctgtgcgcgaggcgttggtg3000gcgggtgccgagcttattcatggccccaactctttcatccttcgatccgtggcgggcatg3060ctgagccccgaggggcgctgtaagaccttcaatgccaccgccgatggctacattcgagga3120gaaggtgccgcagcggctatcattaagttggcctctgacgccgaggaaaagaggtgtgcc3180gtcgtggccgacgtgaagagcgccgtcatgaaccaggacggaaagagtgcgaccctgacc3240gcgcccaacggtccctcccaggaagaggtgctggccaccgccctcagggaggccgccatg3300cagccgaaccaagtcaaggccatcgaatgccacggaacaggcactgcattgggcgacccc3360atcgaggtcagcgccatcaaggctgtcctcggagccgagagcaaggaggccccgaagctg3420atgctctgcgctggcaagtcgaaccatggtcacttggagggatccgccggcttcgccggc3480ctgatgaaggtcttcgggtgcctcacccaaagcgaagtgcctccaaacatccacttcgaa3540cgactgaacccccacatgagcttggagggctctagattgacagttgcggaggcccagacc3600accatccccaagggcaacacagtgatgggcgtttcctccttcggctttggcggcaccaac3660gcgcatgcgctgctcgcccactccatccgcaagaagcccaagaaattgtccgagcaccgg3720gtcgccttccttttcactggacagggctcccagcgacaggccatgggcaagaggctctac3780aaggtcgatgaggccttcaaagtcgccctcgatgaggcagctgtcatctgcaaggacctc3840atcgaccaggacctcttggacctcatgttcagcgaggaccgagagatgttggagaagttg3900aacaccacctactactcccagatcgccatcttctccatcgagtacgccctcagcaagatg3960tgggccgccaagggcatcacgcccttcgcagtcttgggacacagcgtcggcgagtacacg4020gccgctgtcgtggccggctctctctccttgaaggacgcgctgaaggctctggctactcga4080ggtcgcttgatccaggagaagtgcgaccctgccatcggcaacatgtgctccatctttgcc4140tctgccgccgatgtggaatctgccatccgctccgtggaccttcagggcgagactgtcaac4200atcgccgctatcaacggcccctctgccacggtcgtctccggccacaagaaggcagtcgag4260aaggtgtgcaagcaggtcaatgctggcaacaaggagcttgccatccagcacgccatgcac4320tccaagctcaccgagtgcatcttgcccgacttgaagaaggtcttggacacttgcgagttg4380aagaagccctccagcgacatccacttcgtctccacgctcaccggtactgagatctccaac4440gagctcacaaaggccgcccactgggtcggccacgacgaggacaagccgatgctcttcctt4500cagggtatggagactttggagaagttgggctgcaccgccttcgtcgagttgggaccacag4560ccagtgttgatgaagatgggacgtcgctgcgtccagacggccgccaccaacttcgaatgg4620ctgtcttccttgacgccaggccgcgacgaggtcgagaacattctgttgatctctcgtgcc4680ttgggcgctgcgtacgatcgtgtctccgaactgaagcccacgcccctcccttggcgcgcg4740cctctcctccaccctctgttgggcaagaagcagcaggacgcctccggcgccaccgtcttc4800gagtctggtgccatcaagagtggcgccgcgatggaacttttcgagcagcattgcgtcttc4860ggacaggtcgtgctgcctggagcgagccacatccttcttgcagccgccgcccagttggag4920agcgccaccacgcgcgtcggtgctggagctgccgtggagctcaacgatgctgtcttcgag4980cgacccttcgtcgttcctgaggactccgacctcaccgtccgctgcagggcgactgtcgac5040accaccgaagtcgccagctccactgacggggccgcgcccgtggtccatgctcgattcggc5100agtgctcgcgtcgtcggtgctcccgccctggctacccctgtccaggaacgtttgtcggcc5160ctcgagacacctccctccgcagagggagtcaaggacctttacaaggccttcgaggacaag5220ggcttgggctacggaccgtccttccagcccctgcaggagttcagcttccagtcttccggt5280gctttggctcgcctgggcatcaccttgaagacctgggagcagtctctccagatgttgcac5340ccggccctcttggatggagctcttcagctcttggtcgagagcgccacccgacgcgtcgag5400gaaaagtgcaccttcttgccatttgcggtgaagaaggccatcgtggcagcccagtgccca5460accggcgagctttgggccagcgtcaaggttctggacagcaccgccacctctttgaatgcc5520gatgtggaggttttcaatgccgagggcaagttggcgatccgcctcgagggcgccagctgc5580cgacgagttgaggagggtgccgccgcagagaaggacaacggagatcagtgcctctactcc5640atcagctgggtcggagcggaagaggacagccgcggcatcttggtcactggaaccaccctc5700gtcgttgcccctgaatcagagatccccgcgatcgccaaggccatcggcgtctcggagtcc5760cgctgcagcgctgtcagcacagcagaagaagctgtcaagactgctgccgaccgaccctgc5820aacaccatcgtgtaccaagctgctggctcagagatcgatgctctggaagttgcgctcaag5880ctcacacagggagttgcgaagttcgatggcgatgtgccccgaatcgtcttggtcactact5940gccgcccagcagccggacttgaaggacaaggaacacgaccccaagcactctggtctgtgg6000ggtttcgcccgcgctgcccgtttggagtacccccacatgcaggtctcttgcgtggacttg6060gagggatcttccgaagtcgctgctcccacaccttccgctgcgctttccgcagcagaggtc6120gaagtcagtgtgcgaaatggtgcctctttgggtgccaggctcgcccgcagcagcatggcg6180ccgaagcgccccttgaggctcaacatggcccgtcgaggcagcctcatgaacctccgaccc6240gtcccccagaccaagcgcaaggcccccgaggctggcgagatcgaagtccgagttggcgcc6300attggtctcaacttccgagatgtcctcaacgtcatgggcctctaccccggagaccccggt6360gagcctggtatggactgctccggcactgtcgtgaacgtcggcgagggctgccccaaggag6420cttcgatgcggggacgatgctttcggtatcatctggggctgcctctgcacctatggcaag6480accaagcaccagctcatggcccccagacccaacgactgggacgccgcctcggccgcggcc6540ttgccgaccgtctacaccaccgtggacgtggccttcgcagagctcgccaagctgaagaag6600ggcgagaaggtcttgatccacggcgccaccggcggcgtcggtctcatcgcagtgcagtac6660gctcagaagctcggagccgtcgtctacgcgacagcaggcaaggaggagaagcgacagcac6720ttgcgcgacctcggtgtcaagttcatcacgagctcccgaagcggcgacgaattcgaggct6780gacatgaagaagttcttgggcaaggagaagatcgatgttgtgctcaacagcatgagccac6840gacgactacatcccgaggtctttgcgcctcttggggaagggtggccgattcgtcgagatc6900ggcaagcgagatgcttggacccctgagcaggtggcaaaggagttccccgacgtgcactac6960taccccttggccattgaccacgtctgcgagttcgagcccgacaggtaccagggtctgctc7020aagcgcttggagggtgccatgcgcgagggctggaagcctctgccaatgaagactttcgag7080ggcttggagcagggcgtcgctgccttccagttcttgcagcgagctcagcacatcggaaag7140gtcgtcttgactgttcctcagcgaatgggcttgcagaaggacgcctcctacatgctctcc7200ggaggcatgggagctttgggtattgtgactgcacagaccatggtcgaggagggagccaag7260gagctcatcctcctgtctcgaagcggcaaggtccctgccgaggtccaggagcagtgggcc7320tggctggagaactctgctgctgaagtcatctcctggaagtgcgacgttggcaagggcagc7380gacgacatcctcaagaagctgaagggcaagaagggcaacggcttgaagggtctcttgcac7440ctggccggtgtcttggacgatggcatgattccggacttggcccgctccaacttcgagaat7500gcctatggacccaaggtcttcggagcccaccacctcagggaggctgccaagaagaacggc7560tccaccttggacttcttcgccttgtactcatccactgcctcgcttttgggcgctgcaggt7620caggcgaactactgtgccgccaactctgccctcgatgccttggccaacgcctggcgatgc7680cagggcgaatccgtccagagcgtgcagtggggcccttggctctcggtcggcatggccgcc7740cagaacaactccttcgctcgattgaagctcggaggcatcagcaacgagttgggtctctcc7800gtcctcagctctgccatcaccagcggcgcctgcgtcgtcggctgcgccatcgtgcagtgg7860ccaggattcctcaagcagttccccaagacgccgctctacctggagagcttcaaggacacc7920gctgctggcgccggcggtgctggtcgggctggcggcagcgagatggagatgacaccagaa7980ggcatcctcgcgtgggttagctccgtcgcagccgacgtcgtcggcacagaggtctccccc8040gatgagcctctcatggctgccggcatggactcgctctcctcggttgagttccgaaatcgc8100ttgactgccgagtgcagcttcgccaagttccccaacaccttgatgttcgaccacccgacc8160ctgcgagcggtcacggagcttgtcacttctcagctctcccccgagttggtcgcctctgcc8220accagcgctgtcgccaccgccggccccgcctccgacatccaggtcgtggctcgcggcttg8280ttctcccgcttccccagcggcgatggcttgcaggccaattgggagaactggcagaagaag8340atggactccatcatcgaagtcccctttgctcgctgggatctcctcgagttctggaatcct8400gacatggaggccagcggcaatgtgacctactcccgtcatggaagtttcatcgccgacgcc8460gaaatgttcgacccaggcttcttcggcatgtcggctgtggaagcgaagaccatcgatccc8520cagcagcgtcacctcttggaggtctcctacgcagcctgccaccacgctggcatgtccaag8580gagaagctcttggccactgacactggcgtcttcgtcggacagtgcaacaacgattgggcc8640aagttctccagcgaccgacctgccaacccctacactggaccgggcactcacgcctccatc8700agttccaaccgaatctcctacaatttgggtctccgaggccccagtgcttccatcgacacg8760gcttgctcctcgtccttggtcgctctggacatcgcctgcaacaagctcaagggctccctc8820atcggctccgccattggtgctgggtgccagttgaacttgatcgccgagccctttgtcgcc8880ttcggaaaggcccgcatgttggcccccgatggacgttgtaagacattcgatgcctctgcc8940aacggctacgtgcgaggtgagggttgcggagccgtttacttggtcggagctgctgcatcg9000aagcaggacgagctcgcgatcttgcccggcatcgcagccaccgcgacgaaccaggatgga9060cgaagctccaccttgacggcccccaacggcccctcccagcaggatgtgatcaggaaggct9120ttggcccaggcgcaggtgcttgcctacgccctcggcttcgtcgaatgccacggaactggc9180actgctttgggagaccctatcgaggttggcgccttgaaagctgtcctggctccaaaccgc9240acaactcctctgatcctgggaacagtcaagaccaacattggtcacttggaaggtgcagcg9300ggcattgccggtatggtcaaggccatgctgtctgtgcagaactccgaggtgcctcccaat9360ttgcacttcaacaccctcaaccccaacatcgatctggaggacttccccaccacaattccc9420acaagcattgagaacttgactggagaccagcctacagccggcctctcctctttcggcttc9480ggcggcacgaacgcccatctcaccttcagggctgcccccaaaccattggagaacgcccag9540gattccgagggtggtgccaaacgtcgagtggcattcctcttcactggccaagggtctcag9600tacatcaacatgggcaagcagctctacgaggccgagcctgtcttcaagtctgtgctcgag9660aagtgcgccgagttgctcaaccccttgctggagcagccactcttggaagtcatcttcgat9720gcaggtggcaagttcggtaaattgctggaccagactcacatgtcccagccagcgatcttc9780gccatcgaggtcgccttggccagcatgtggaaagcaaagggcttcgaacccgaggtcgtg9840atgggacacagtgtcggcgagtacgccgctgcggtcacctgtggtgtcatgagcttggaa9900gatggctgcaagatgattgctgcccgtggcaagctcatcgcggacaagtgcgaggccgga9960gtgggcgccatggtcgccaccttcgcccccgaggccgccatcattgcggcaatcgacagc10020ttgagcgacaacgagaagaaggaagtcgccattgctggcgtcaatggaccgaagatgtgc10080gttgtctctggtcgcaaggatgttgtggagaaggtcgttgccgccaccggcgctggcaac10140aaagccctgaacgtctcccatgctttccactcgcctctcatggccccaatgttggacagc10200ttccgacagacggctcgggccgccgaccttaagaccccaagctctggccgttttgtctcc10260accgtcactggcaaggccgtcactaccgagttgcaggatgccgaatactgggtgaagcat10320gtcgcccagactgtccgattcgccgacgccatgtctaccttggagaaagaaggtgttgat10380gccttcttggagatcggtcctgagccgacccttgtgaagatgggccgtcgctgtgtctct10440ggcaccggctaccagtggctcacctccatcgagggcaaaggagctcccgtaagcgaggtg10500gacgccgtgaagcaggctgctgccgtgatgcgaggaggactgcctcctctgacctacaag10560aagcaggccttcccctggagggatgccggacctagaatgttgaggaggcgcgccactacc10620gacaaggaggcccactttgacgtccccgtgcgcagcgatctcttcgctgtggccgccgag10680cacgtcgtctacggcgagatcgtcgtgccaggtgtcatcttcgtggaaatggccttggag10740tccgttcgcgctcacctcggcgagcatgtccagctccgcgacgtgtccatggtctggccc10800ctcgtcgtacccaagaacgccgactgcgaggagaagcaggtctggatgcgattggccatc10860attcagaacaagcgcttcgaactccgatcccagacgcccggcgacgacaagtggaccacg10920cactgcgagggcaagttggatttgaacggaccggctgcacccgtcgtcgaggagtccttc10980gacgagatccgcgagcgctgccccgaggatgtcgacgagaccaagttgtatcctttggtg11040gacagcgtcggcctgtggttgggaccgaagttccaggtggtcagcgaaatgaagcgaagc11100aaggaggaaatctcctgcaagatgatgctacaccccgacgtcatcaacaacggctacatc11160atccatccttccttgatggacggaaccatccatgctgtctgcgccaccatgctcgaccag11220gatcctcctttcctcaagattttcgccggcgtcggtcgaatcgccatgcacgcgaaagct11280gccccgaagaacgtgaaggtcaacctccacctcaagatcagcgaactgtccgaccagcag11340caaatcttccagtgcgtcgtcaccgacgacgacaagaaagttctctgggtcatggaggac11400gtcctcttcaggaaggtcctgcccgagcagatccagaaggccctcgcggccacgaaggag11460aaggatgcagtgaactacttcgaggcccagtggcagcctgccactgtcgacaacctctcc11520ggcggattcatcgagaagggaccgatgctggtcatctgcgaggatgccgatgtcttggaa11580ggcatgcaggcagagctctcagaggagcacagcctcggcaccttcgccgagggctatccc11640gaggccctggaagagttctcgcaggtgctctgcgtcgcctcccctgttgccggcccagtg11700gacttcctcggcggagccctcgagctgctgcagaaggtcatcaagaagaagatggatggc11760aaggacgtccccgaagtttggttcgtcctcaactccaccacagcggtcaatttgtcggaa11820ctcaagggaaaagctgtgcccaagcatgcaggcctttggggtctctctcgctgcctccga11880ctcgagcatcctgacatcgcctgcggcgtcatcgacctcggctcgaaggtgcatgtcgac11940gatgcggccggcattttggaaaggctcgcctctgccaagactctccaagacgatgccttc12000gaggccgaagtcttgatggaggactcccagcagtacgtggctcgcttggtcgagacaact12060tcccaactccagaaccttccctccgagcagtctttctccaaggacgcctcctacgttgtc12120actggaggcactggtggattgggcctgctgttcgcgcagtggatggctgatcagggcgct12180ggccacttgggcctgctctcccgaactggaaaagcgccagctggacctgcctacaagaag12240ttggccagcactccaggcgtcgaggtggctgttcgctcttgcgatgtccactccgaggag12300agtgtccgaagcatcattggcgaactcagcaagactgccgccgttaagggcgtgctgcac12360gctgccggcgtcttggaagatcacttgattgttgacctgaagaaggaacacttggaccca12420gtcttgcgacctaagatcgacggaactttgaacttgcacggtgctacctccgacttggac12480ttcttcgtcatgttctcgtccattgctgccatgcttggttctccgggccaggctaactat12540tgctctggcaacgccttcatggacgccttcaccttgcaccgacgagctcaggggcagtcc12600gcggtcagcgttcagtggggtccttgggctgaagtgggcatggccgctcgcgccggcacc12660tctgagacctcctaccagaggttggaccccacagcctccttggcagccatgggcgccatc12720ttgggcgccggtagcgaggccgtcaccaacggcatcgtgggcgtcgcccgagtcaactgg12780agcaacttcttggccggcttccctacgctgccgccctacttgcagaacttcaagaacttc12840aggagtgccggagtcaagatgaccgacggcgtgtcgaagactgtggtgcgggacaccatc12900gaagcagtgttgtgcgacgtcctgggcgaccccgacttggccgacttctctgttcctctc12960atggacatgggtctcgactccctctcggccgtcgagttccgaaatcgtgttcaggcagcc13020ttcgagggcttgcacctcactgcgacggtcatgttcgactaccccactgtggccgacctc13080acggacttcgtctgctcgcagttcagcgagggcgaggaggaggaggccgccgggggcgct13140gcacgaggcgaggtcaatgcgcaggagccactcgccatgctgggcgtggccgccaggttc13200cctggatgcaggaccaacaaccccgaggagtactggaacatgctcttgctgggtcgcgac13260atgatccaagaagtcccgatcgagagatgggatgtggacttgtactacgacgaggaccat13320tctgccccaggcaagatgtacgcccgaaacggaggcttcattttgggcctcgaaggtttc13380gatgcgaaaatgttcggaattgccgacagcgaagctcacgccatggacccccatcaacga13440atcttgctggaagttgcctacgagtccttctggaacgctggtttcaacaaggacgacctc13500atgaacagcgacaccggctgcttcatcggctgcgcgacgctgggcggcatcagcgtcgag13560gacgacgacatcgggcctttcacgaacatcggctccttcccctcggggaattctggacgt13620gtctctcacgccctcggcctccgaggtccttgcttcaccctcgacaccgcatgctccgcc13680accatcgtcgccttggactgcgccgcccaggctatgcgcctcaacaagggcgagcgaagc13740tgcgtggcaggaagcaacctgcagctgcaggcgaacacttggatcggtttctgcaagatg13800ggagcactctccgtggatggacgctgtaagaccttcgacgccagcgccaatggcttcacc13860aggagcgaaggtgcaggctcgatgatcttggagttgcaagatgcagccctgcgaaaggga13920cgaaccgagatcgcgactgtcttgggcgcctgcgtcaaccaggatggccgaagtgctacg13980atcaccgcccccagtggacctgcccagcagcgatgcatccagtccgctctcgcggacggg14040tccgtcgaccctctggacgtcaccatgatcgaagtccacggaacaggaactgccttgggc14100gaccccatcgagatcggcggcttgaagtcgaccgtcggcaagggacgaagtgccgacagc14160cccctgattttgggagcagtcaagtcaatcatcggtcacgaagagggagccgccggcgtc14220gcaggcgtcatcaagatggtctgcgaattcaagtaccgacagatccccaagaacttgcac14280ctccacaagttgaacccgaacatcgacctcagcgacttcgcctccgttgtcatgccagac14340agcatcatcgattggaagtctacttcgacaaagtctggcacttcgtctttcggcttcagc14400ggtaccaactcccacgccatcttggaggcggtcgacggggacgagattggaggcgtcgca14460ctgcagaactccacgcccctcaagtgggcaagggtccctcaccgcatgtccaccgagtgg14520tcctccggtctctggtggtccctggagtggaaaaacacacctttggcgactggctcgctc14580gacgaccttccttgcttgttggtgggtggcggcgagattgccaaggccgttgcgaaggtc14640atctcggatgtcacagttgtggacatcaagaacgctgccaaggccatcgaggagaaggaa14700tgggcaacgatcctcatcaccgagcccatcacctccaccgacgattgcttggagggtgct14760gccatcatgcagctcatcgaggtcaccaaggcagttgtggcaagtggccgagccttgcgc14820ttcgtcgtcgccaccgctggtgcacagagtgccagcactgaggactcaaagctgtcgcag14880ggctgcctgggcgccgccgcttggggcctgatgaggacgatcatctgggaggctcctagc14940ctcaagttgcagaccatcgacctgccttcccaggcctccgccgaggaaatggccacgctc15000ttgaaggacgagctctccgctgagggagatatcgagcccgagattgcctacatgtctggc15060cagcgctctgtcccacgcttgagctccacccggctccagcagacgtcgtggtccctgaag15120aagcccgagggcacgcagctcttgactggtggcttcggtggactcggcttgctgtgtgcg15180cagaccttggtgcagttgggcagcaagagcatcttgttggtttccaggaagggaaagatc15240gccgatggcgacgacgtcatcgcagaccacatgaagaagttgcaggagaccgacgccgag15300atccacgcgtggagctgcgacgtctccagccgcaccaacgtcaagaagttggtcgaccgc15360gtgcagcaggagctgcccgagaaccccctcagtggagtcgtgcatgccgctggcatcttg15420gactacgccgaaattccctcccagacctcagagaggctctcctctgtctacaaggccaag15480gtcgcaggcgcttggaaccttcattcggagtcccagaacacagagctggagaacttcatc15540gttttctcctccgtatccgccctcattggactcacaaggggtgccagctactcgtcttcc15600aacgcctacctggatggtttggtcctgtggcgcagagctcgtggccttgctgcatccagt15660cttcaatggggacctgtggcggaggtcggaatggccgccaaggacgatttggccactgca15720gattcccctctcaagtacctcaaaccttcccaagtccaggccgctttcaagcagtcgatc15780ctgtctgcctcgcagccgtcgtcgttgctgttcgccaagtgcgactggcctcgctttgtg15840cagtccttgggcaccgaggtgcctgtcttgaaggacttcgtgggtgccgaggaagaagtc15900tccagcggcgccaagacagccgtctcgtcggcattccagggcatgtccaagtctgaagtc15960gagtcccgcgtcggtgacatggtcttgagcgtggcctgtactgtcctcggcatcgacgac16020ctttctccagaggccccattgatggaatctggcttggattctctgtcggccgtggacttc16080cgcaaccaagtggccaagactctcccaggactgaagctccccagcactctgatgttcgac16140taccccaccacgtctgctatcgccaacttcgccgcctctcagctcgccccagccgagagc16200tccaggcaagctgtcgttgccgcccctgctggatcggctcttgagaccactgagcccatc16260gctctcagggccggtgcctaccgcttccccatcgagggagagaaccttcagcagtactgg16320gatgctttggtcaacaaggttaacggtgtcacagagattcccctggaacgctgggatgtg16380gatgcctacttcgatgccaaccccgagacgccaggcaaaatgtacgtgcgacatggctct16440ttcgtcaagaacgccgaccagttcgactgcggcttcttcggcctgtcccctgccgaatcc16500aaggttatggatccccagcagcgcctgctcctggaggtcatctaccggggtttccacgag16560cacggcttgcgtcaggacaccctcaagggcatggacggctgcatcgcggtcggtcagtgc16620aacaacgattggggacacatgggattctctcccgacgaagctgatgtgattggcccatac16680acaggcttggcggtctccacctccatctcctccaaccgagtctcctacatcttgggcttg16740aagggtcccagcttgactgtggacacggcctgctcgtcttctttgacagctgccgacatc16800gccatctcgaacttgcgccgccgaaggtgcgagatcagtgcagcggcaggcgtgaacttg16860aacctcatccctggaccgttcatcgcttgctccaaggctcacatgctctccgaggatggc16920ttctgcaagaccttcgatgcgtctgccaacggctacgtccgaggcgaaggctgcggcgtc16980gccattcttcagcgcttggctgatctcggcacaggcaagagcgccctcgtcgttgtgcac17040ggctctgccgtcaaccaggacggccgcagctcctcgcagacagcgcctcacggtccttcc17100cagcaggacgtcatcatgaccgcagtgaacgaggctggacttctggcttcgaaggtcaac17160atcatcgagtgccatggaaccggcactgctttgggtgaccccatcgaggttggagcattg17220aagaacaccctgggcgagggacgcgaggagagcaaccctcttgctttggctgctgtgaag17280agcaacatcggacacttggagggcgccgctggcgttgctggactcttgaaggtcgcctgc17340atgctgcccaggaagcaggttccttccaacttgcacttcaaggagctgaacccccacatc17400gacttggacgacttcccttcgacgatccccacggacgtggtcagcatcaagcaggcagga17460gtgctgtctgccggcctctcctccttcggcttcggaggcaccaacgctcacatcgtctcc17520aagcagttcgaaggcgagcccgagagccagccccaggagctcacctacactcgacagagc17580ttcgcctggcagcagacgcgccacacgctgctcgccaagcgcttcaagaccgccgagaac17640gtgcaggtcttcagtgcgcccttccaaggccgactgctgcagttggtctcccaccacatc17700atcttcggagagatcgtcgtgcccggcgcaacctacctggaaatggttttggcagctgga17760gagttccacctgggtggcaagggcaccgaatggtacatcaagaacgtcggcttccaggcg17820cctttggtgctgaagaccagcgacaccggcaagctgagccgagagatcgacctctacttg17880gaagtcttcccagacgggcattgggccatgagcagctgggatgtcgcccagcagcgcaag17940gccgccacccactccgagggagaagtcgaattcaccggacgggccgttgcggacaagcag18000accatcgacatcgaggccgtcaaagcgcgctgcgacgaggacgtcgtgctggagcgcctc18060tacctccccttctccaagatcggactgcctctgcagcctcgcttccgaaccgtccgccac18120atcttgcgcggcgacgacgaggtcatctgcaaggtcgaggccgagaacgacagcaccaac18180cagggcttcctcttcaacccggccgtgctcgatggaaccttccagggaagcatggcgctc18240atgctcgcgcgccgcgccacggaggttgacgacttgaccagcttgaggattcctctgttg18300tgccagaagatcaccaactactctcagggccactcgacaagcatctgggtcaaccactct18360ctgcgagagatcaccgacaaggaaaattgcgtcgacgccaagatctgcaaggacgatgga18420actgtgctcttggccatggacaccctcaaattccgagaggtccgccccgagcacatccag18480aagatgctccagcaggccaccgaggacaacgagcaggacgtgctcgagcaggaatggacc18540actttggaaggcaagctgggcacagctggtcctctcagcggcaaggtcatcttcgtgggc18600gcttcggcagccatggagaaagctctccgagtcaagtactccagcgcctctttcgtgcga18660ggaggagaggacttgggagattgcgccaaggccaagatcgtctttgtcgaggccctctgc18720gaggaggctggcgaaatggaaatcatccaccacgccatgctgctggttcaggtcgtgatg18780aagatggccgacaaggactccgacaccgcccccgccctctggtggatcactcgaggcacc18840caggccgttggagcatgcagcagctacgccactgcaggactttggggtatggctcgcacc18900gccaggctcgaggagaggagcctcaagctgcgctgcttggacttggacaccacccaaggc18960acagaggaggcggccgaggctttgtccacatggctgggcactttgagcggcaacgccaat19020gttgatgctgaggctgaagttgctctcaggatcgccgacggtgagaccaaggcctacatc19080gcacgcctcgccaggagcaacactgaggtgaagaagccgatgcagctgaagatgtcgtct19140cgcggctctttggccaacttgcgacctgtcccccagaccaacaggcgtgcccctggagcc19200ggagagtgcgagcttcgagtgcgagccatcggtctcaacttccgagatgtcctcaacgtc19260atgggcatgtaccccggcgaccctggaaaccccggcggcgattgtgccggcactgtcact19320gccatcggcgagggtgtcgagcacttgcgccctggcatggatgtcttcggcatcgcctgg19380ggcagcttgcagacgtacgtcaccaccaacgcgctgctcatggtcgagaagttcaaggac19440tggtctttcgagcagatggccgcctggagcgtcactttcgcgaccaccgaggaggccttc19500caagagctggctcctctcgtgaagggcgagcgagtcttgatccacgctgccaccggcggc19560gtcggcctcgtggcggttcagttcgcgcagcgcgtcggtgctaccatcttcgccacttgc19620agtgcctccaaggtcgagcacctgaagggcatgggcgtgaagtacatcaccaccacccgc19680gacggcgccgcattcgaagcggacatgcagaagttcctgaaggaggatggtgctgatggc19740atcgactgcgtcatgaacagcttgagccacgacgactacatccctcgctccttgaagcta19800ctgaagaagggtggccgcttcatggaaatcggcaagcgtggcatctggactcatgagcag19860atggcccaagagcgacccgacgtcatgtacgagaagatcgccatggactgggtcatggag19920caccagccggagcgctacaacagcttgatgaagcgattggtcgagcagatcggcaagggc19980tggtgggcaccaatgccaacaacgcccttcgtcggcttggagaacggagtggatgccctc20040aggtacctgcagcgcgcccagcagatcggaaaggtcgtgctcactcagccctctcgcatg20100tcctgcgagcaggatggatgctacctcttgtctggcggcgtcggcgccctcggattggtc20160actgctcagaccatggccgaggagggagcgaagagcttggtcctcatgtctcgtcgcggc20220gccattccttccgacctggaagcacagtgggccaagctgcagcagttcaaggtggacttg20280cacttgaagtcctgcgacgtcgccaacatggacagcgtgcagctcatgctcaacggcctc20340aagaaggagctccccacgaagaccgtcatccgcggtctcttgcaccttgccgccgtcctc20400gacgacgccacgctgccgaagctcacccgaagccacttggagaaagcctacggagcgaag20460gtctacggagccaagcacttgcacaccgccctcgcctcagcgaagacgcctctggacttc20520ttggtgctcttctcctccactgcgggccttttgggctcccccggccaggcaaactactcc20580gctgccaacgtcactttggacgctgctgcgaactgctggcagggacgcggagagaaggcc20640gtcgctgttcagtggggaccttggcgtgaagccggcatggctgcccagaagggcaccgtg20700gagcgactcaaagctcagggcttgggaagcttgggcaacgtcgtcggcatgtccgtcctc20760gccggaagcttgggcgccaccgcaggcgtcgtcgccgcctgccctgtctattggggagtc20820tacctcaagcagttcggctcttccgtgccgaggttcttgtcccgattccagaaggaggcc20880ggcgccggcagcagcggccctcggcccatcacgggccagcaggatcgcggcttgtccatc20940gcccctgcggacgtcaagaacttggtgcacaccatcgccgtcgaggtgatgggcagcacc21000agcgtggacgacaccgaacccctcatggaggctggcatggactccttggccgccgtggag21060ttccgaaaccgcctctcctctcagttgcctggcatcaagctccccaacacgctcatcttc21120gactacccgacggtcaacgccatcggagactacgctgccgcccaagtcgttcccgtttct21180ggcggcgcggagcctgcaggcatctccttcagccgcagcgacgtcgagcagttggtgctc21240tccacggccatcgaggtcatgggaagctccaccgtggacgtcagcgagcccctcatggag21300gccggcatggactccctcgccgcagtcgagctccgaaaccgactttcctcgcagttgcct21360ggtgtcaagctgccgaacacgctcatcttcgaccacccaactgtctccgccatcaccgac21420ttcgctgcctctcagatcgccccttcggcaggctctcgaggcgcctctgccgccctcggc21480ggagcgacgcaggagaagaagcttctggacgtccgcggcatgtcttccatcttccccgga21540agccgtgacgcagcctactggaaggactttgtggacaagaaggacagtgtcatcgagatc21600ccttacactcgctgggacgtggatgcgtacttcgacaaggaccaggacgcacctggcaag21660atgtacacacgacatggaggcttcattgacggcgccgagatgttcgacgcaggcatgttc21720tcgctctctgcggccgaggctgccatgatggaccctcagcagaggttgatcttggaggtc21780accaacaccgctttcaacttggccggtcgggacaaggcaagcttgatgggcgccgacgtc21840ggcgttttcatcggtcagtgccagtacgactggttcgtgatgaagagcgctggagaccac21900ttcaacacctacacaggcaccggcatctctgcctccatctcctccaaccgaacttcgtac21960atcttcggcttcaagggccccagcctcacgtgcgacacggcctgctcttcgtccttggtg22020gcgatggatgccggctactcctccatccagaggggcgtgtccgagatggccttgatcgga22080ggaaccaacttgatgttgcagccttctccttacatctccttcagcaaggcccgcatgctc22140agcgaagacggacgatgcttcaccttcaacgccaccgccaacggctacgcccgaggagaa22200ggcgtgggaggcatcgtcgtcggcgtcgcgggcgacgcctcggccgatgtttctgccatg22260ctgcgagccaccgccgcgaaccaggacggccgcagcgcatccctcacagcgcccaacgga22320ccttctcagcaagccgtcatcgctcgggccctcatggagggatctatcgctgccaaggat22380gtcaacgtcgtcgagtgtcacggaacaggcactgccttgggtgaccccatcgaggtggat22440gccctcaagaacaccctcaacgtcgacaggagccagacgctcatgctcacctcggccaag22500accaacatcgcccacttggagggttctgccggcatcgccggcttcgtgaaggccgcctac22560atgatgcgctatggccagtgccccagcaacttgcacttcaaggaactcaaccctcacatc22620gacttggaggacttcgactgcgagatcgccaccgaattgaagcctttggcaggcaagcca22680gtggccggcctctcctccttcggcttcggcggcaccaacacgcacgtcgtcctcagctcc22740tccgagacactcggcacccaggccgcggaagaggccccgaagcagatcaccttcactcgc22800cagtccttcccctggaaggatcgcatctacaggttgctgccaaagagactccaagaaggt22860cgggacacccacttcgaggtggccatcaagaccgatgtcttcaacatctgcgccgagcac22920gtcgtcttcaacgagatcgtcgtgcctggtgtcgtctacactgagatggccatcgaggcc22980actcgcgtcatcatcggcaaggaggctaccctgaaggacttgaccatgacttggcctctg23040gtcgtgcccaagaacgctgacggacccaacgccaccacggtctggctgcgcttcgcgcag23100atgggctccgagaagttcgaggttcgcagccgccgcggcgacagcgacgagatgatcaca23160cattgcgaaggccgcatcggccgaagtttgtcggagcctggtgtcatggacatcgccggc23220ctgcagtctcgttgcgaccgcaacgtcgaccccaaggacgtctacgcagccatccacaag23280ggaggtctgtacttgggaccaaagttccaggtctgccgccacatgatcaggaacgacgac23340cacgtgctctgcaagctcgtccactccgacgagtgcggaccgaaccagggctacttcatg23400caccctggcatgttggatggaaccatccacactctcggatgcaccatggtcggctgggac23460gccccgctcaaggtgttcgccggcatcggcaagctcgtcatcaaggaccacacagacttc23520agcaggaacgagtcctactggtgccacctgcacctcaagaccttctccgagcaggaacag23580atcttcacgtccaccgtcgccaacgaggagggcaacatcctcttcgtcggcgaggacgtc23640tccttcagaaaggtcacgcccgagcagatccgaaaagccatggagagccaggccgccgag23700gacgaccagaagctctacgaggtcgagtggacatctctgtccacagcggccagctccgag23760gaggacgaggacgccaagtggttggtcatcgcagagaccgacagtgtcctggcagatttg23820aagaaggagttcggagaggcccacacctacaccaagttggcgggcgcagacctcggcgag23880atggagaactacagcaaggtcgtcagcgccatcggcctcgagacctccgtgaattgcttg23940gacggcttggaccacgccctgcagctgatgaaggcgctgcctaagtctgccagcaccgca24000cccgagatgtggttcctgacacaccaggctgtgcaggcagtgaagggagacatgaaggac24060gccgccatccctgtgcacgcaggtctctggggtctgtcgaaggccttccgcgcagagttc24120cccgaactcaaggtggcttgcttcgacctggagggcggaaagatcacttcgctcaaggag24180aagttccagcaggccttggatcaggccgccgcctccttcgaacccgagctcgcgctccgc24240gctggctcgctctacgcacctcgcttggtggactccacgaccaatttggaagcgaaagcc24300ctggacatcttcgacgccgacgcctcccacgtcatctccggcggcaccggcgccttgggc24360ttgctcaccgcgaagtggatggccgagaagggcgccaagaacttcgtcctcgcctcccga24420agcggcaaggtgcaggaggacgcccaggccatgttcgacgaggtctcctctgtcgccacc24480gtcaagaagctcaacatgtccagcttggacgacgtcaagcgcctcttcacggaggtcgcg24540aagtcgatgcctgccatcggtggcatcacccacgccgctggtatcttggacgatcacctc24600atcgccgacttgcagaggtcgcacttggaggcagtcttgggcgccaaggtggacggcaca24660ttgaacttgcacgagggctcgaaggacatgaagttgaagtacttcagcatgttctcctct24720ttggcttccttgattggtactgccggccaggccaactactgcgctgccaacggcttcatg24780gacagcttcgcagcataccgaatcgactctggaaagcccgccgtcgccattcagtgggga24840ccttgggctgacattggtatggctgctcgcgctggcacttccgagagcgtggtcttgagg24900atcgacatcgaggagggtctccgtgctatggaggttatcttgagcaactctggcgacttg24960atgaccggcgccattggtgtggcccgaatcaagtggaagtctttcttggcccagatgcct25020gccctgccgccattcctggacaacttcaagcagttcaagaaggacgctggcaagaagtcg25080gctgtcgctttgggcgccgcaccttccaaggacgtcgtccgcggcggcatcgaaaacatc25140ctgaaggaggtcttgggagacgacactttggacgacttctcctcccctctcatggatctg25200ggtctcgactccctggctgccgtcgagttcagaaacagagttcagtccgccttcgatgga25260gtccgactggcctcgaccgtcatgttcgactaccccacggttgccgacctcaccgacttc25320atcctgtcccagttcgcccccgaggaggacgaggtcgccggtggaggcttgggagatccc25380gccgcgagccttcgggactcgatggccgttatcggcgtctcgggccgctacccaggcatg25440tctttcagcaacgacttggaggagtattggacagccctctgcagtggaaacgaccccatc25500caagagatccccatcgaacgcttcgacgtggacgagatctacgacgaagatcgctcggcc25560ccagggaaagtctacgtccgcaacggcggcttcatccagggcgtccaggagttcgacaac25620ggcttcttcggcatcgccgacaccgaggcgaaggccatggacgcgcatcagaggctgcag25680ttggaggtcgcctacgacagtttccacctggctggcttcaacaaggagtccctgagtggc25740atggaggttggcgtctacgtcggctgctgcactttgacaggtatcgatgtggagtctgac25800gacatcggacctttcaccaacatcggtgccggcatcagtggcctctccggccgcatctcg25860cacgccttgggtctgcgcggtccatgcttcgccatcgacaccgcctgctcctccacgctc25920gtggccttggactgcgcggcgcaggccagcagattgggacgacaggaaatggcttgcgtg25980gcaggaacgaacctgcagttgcgaacggacatgtggatcggtttctgtaagatgactggt26040ctggctgccgatggccgctgtaagactttcgacgtctccgccgacggcttcgcgcgatcc26100gagggctcaggctccatgatcctccgcatgcgcgcccacgccgaggcgaagggagaggcc26160tctgtgatgatggtccgaggcacgtgcgtgaaccaggacggccgcagcgccaccatcacg26220gccccgagcggtcctgcacagcagcgagccttggccgcctccttgagggacggcgacttg26280aaggccctggaagtctctttgatcgaatgccacggaaccggtacctccttgggcgacccc26340atcgaggtcggagctcaagagaagatctacggcaaggagcgcatggagcaggacacgatc26400gtcttggcggcggtgaagtcttgcatcggccacttggagggcgccgccggcgtcgctggc26460ctcgccaagctcgtgaagatgatagagcacaagaaggtgcctccgaacttgcacttgaag26520agcatgaaccccaacatcgacatctcgaacttccctgtcaacatcccgaccagcggcgcc26580atcgactggagcaaccctggcccagtcaaggctggtatcagttctttcggcttcagcgga26640acgaactcgcacgtcaacaccgaggagccctccaacgccgagggcgtcgagcctcccaag26700gtccagcctctcgtctggcagcgccgggacctctcctaccgcgactggacgaagggtctc26760ttcaccagcatcgagtggaagcctgctgccatcaaggccaccggcaagatcgatgctgct26820gccaccctcatcattggcggcggcgacattgccaaggccctggccgagatcatccctggc26880tgcatcgtcgtcgcgccgggcaaggcggccaagacctcgggcgacgtctacagcatggac26940ttcaccaaggccgaccaggtgtccgaggttctggacaacaaggagtggagcaccgtcgtc27000ttcgccgaatctttggtcgccgacgaacccaccctggagggccaggccgtcagcggtctc27060ctcctcactctccaagccatgtcccagtggaagcgctccgccacgctcgtggcattgacg27120gcaggtgctcagactgcggaagctggcggaaagatgggtgtcggagttgtgggagccgca27180gtgtggggcttcatgcgctccgtgcgcctggaggccgcgaacgtggagcctcgcgtcatc27240gacttcagcgccgacgcgaccagcgatgcctcggctttggctacggtcatcagcgaggag27300ctcgcggccagcgacgctgagattgcgtacgtcaacggcaaccgctccacccctcgcttg27360gtcgccaccaacgtcaagaacggcggcaagcccgagggcatcgaaggaacctacctcatc27420accggcggctttggcggcctcggcctcgtcatcgcacagcagttggtggacatgggagcc27480acctctgtggccttggtctcccgaagtggcaagacgcccgccggcgacgagaagttggcc27540gagatgctggagcaggtccagtcctcttccgccaccgtccacgcctgggcctgcgacgtc27600tccgactcgaagagagttgcagacttggtcaagaagtcgaagaaggagctcagtgcggac27660catcccctcagcactgtggtgcacgccgctggcatcatcgaccactgcgcactggccgac27720ctcaccgtcgacagcattgccaacgtcttcaagcccaaggtcggcggcgcctggcacctg27780cacagcgccaccaaggacgacggcctcaaagacttcgtgctcttctcctctgtcagcgcc27840ctcatcggcctcagccgaggagtcacgtactccacctcgaacgccgccctcgatggtctc27900gcgctctggcgacgggccgagagcttggctgccacaagcatccagtggggacccgtgtcc27960gaggtcggcatgtcgacgaaggcggaccacgcggcctccgcagacttcgccctcaagatg28020gtcacccccaagcaggtccaggccgccttccagcgcctcttgtccgcgcctccgaaagcc28080acatccgtgctcttcgcccgcgccgactggggcaagtacctcgaacagatgggcgtggac28140gtccctgtgcttgcggactacgcctccacagggggcgcggctgcgggcggcgccactgcc28200agcagcgctttcagcggcatgagcatcgacgagatcgagagcaaagtcacggagatggtt28260gtggactgcgtccgaaccgtcctcggcgacgattccgtcgaagccgagtcccctctcatg28320gagtccggcctcgactcgctgtcggccgtggacttcaggaaccaggtctcgaagcagctg28380ccgggcctcaagttgccgaacaccttgatgttcgactaccccactgcaggagccatcgcc28440ggctacgctgcctctcagctggcaccggcaacaagctcgggaggagcagctcgcgccacc28500actcagatcgtctctgcggccgaagctcgcggccctgtctccatcttgggcatggcctgc28560cagttccctggagatgctgactccctggacaacttctggaacgtggtcgtcaacaaggtc28620gactgcgttggcaacatcccgcccgagcgatgggatgccgacgagtacttccaggagggc28680ggcggcgtcggcaagatgtacgtcaagcaggccgccttcgtccgcgacgtcgagtccttc28740gacgccagcctcttcgccatctcttctgccgaggcctacaccatggacccccagcagagg28800atgctcttggagaccgtgcacactgcttggcagttgggcactggcggaaagaaggtctct28860ttggacgtcggaagcttcgtcggagagtgcaacaacgattggggccatttcaagaatttg28920gaggtcgaaaagatgaaccccttcagcggaaccggtggatccatgagcatctctgccaat28980cgtctggcctacgtctttggcttcaagggcccgagcgtcacgtccgacaccgcatgctcc29040tcgtccttggtggcggtggatcaggccgtttcgaacctctggcgtggacgatgctccgcc29100tccgtcgcggccggcgtcaacttgaacctcatcccaggacccttcgtggcctgctgccag29160gcccgcatgctcgcagaagatggccgatgtaagacgttcgacgccgcggccgacggctac29220tctcgaggagaaggttgcggcgctatcgcgatccgcggccagagctccactgagaacgcc29280gcgagcttcgtcgccgttgtgggaaccggtgtgaaccaggatggccgcagctccagtctg29340actgcgcccaacggcccctcacagcaggaggtcatcaacatggcttggcaggaagccggc29400attgcacccagcgccgccgacttcatcgagacccatggaacgggcactggcttgggcgat29460cctatcgaaatcggagccctcaacaacaccatggcagagggacgaaccagcgaggtcgtc29520atcggagccgtcaagaccaacatcagccacttggagggcgccgccggcatcgctggcttg29580ctcaagggcgccatggtgctcgagaactgcaaggtgcctccgaacctgcacttgaagaag29640ctcaacccccacctggacgtcgaggacttcgacgtctccttccccaccgagttggtcgag29700aagtccagagagcagctcaagagctctggtctctcctccttcggcttcggcggtacgaac29760acgcactgcgtcaccacggcccccacagagggcaaggtcgatcagcagcaggaggctgtt29820gtcttcaacaagcagcgtttcgcctggtctcaggtcaagcaccctctctcggtcgtcggc29880cgcaagggtgccgaccccaaccttactgtcttcactgccccgatccgaggaaaggtggtt29940cagctcctatctcaccacatcatctacggcgagattgtcgtgccgggcgccacctatttg30000gaaatggtcatcgccaccactgctttcaggctcggcaaggacggcaccaagttctccgtc30060gagggtgtcggcttccagaaccccctcgtgttgaggactgccacccccaccgagctggag30120cgaccgattgaactgaccctgcacatgtacgacaacggcaaatggtccatgaacagctcc30180gaagccggcgaggtcctcgccacgcacgcggagggctccgtgagcttcgcgaacccgacg30240cctgagaagaaaatgctcgagctggaggagatcaagagccgctgccctgaggttgtgcaa30300gacgagcgcatgtacgttcccttcgccaacatcggtctgcccctgcagccccgcttcagg30360actgtccgaaccatcgaccgcagctccgacgagatcatcgcttgggtcgcagcagaagag30420gacggcaccaatgccggcttcatcttcggccccgccgtcatcgatggatccttccaggcc30480tcctgcgccttccagaacctggaggccctgcccagcttgcgaattccgctctccatcgac30540aaggtcacgatctacggccagggctacagccagaaggtctgggtccaccacaagctgctc30600gagaacaccgagaagaccatggccacgaacgtgcagttggcgcgcgacgacaagacgatc30660atcttgaccatggaccgcatgcgcctgcgcgaagtcaggcccgagcacatcgccaagatg30720ctggcccaggccgcaggcgacgaggacgaggacctgttggaggtcgagtgggctgccatg30780gacaccaagaacgctaaggccgtcgaattgggaaagaccttggtcatcggtgccaacgat30840gctctcaaggaagccctcagcaaggagatcaagacagccaccttcgcagactctgcagag30900gccctcgccgaggccacgggcgtcaaggaggtgctgttcgtcggggcgctcgtggacagc30960gcaccagagatggaggtcttgcacaccgcgctctccctcgcccaggaggccatcaagttc31020gccgccagcaagaagaaggagagccctcccaccgtctggtgggccaccaagggcacccag31080gcggctggcttgggcgacagctactaccatgcgggcttgtggggtctggccaggaccttc31140cgcatggaagagcgttcggtgaacttgcgatgcttggacttggacatcagcatgggctcg31200gccgaggccgccgcggccgccctcaaggaatggctgcctctgctctccgccgccaacttg31260gtcggcgagaccgaggtgactttgaggcccaaggaagacagcaaagagatggcgccgctg31320gtgtctcgattggcgaccagcaccgccaagtcccagaaggccggcatgctgatgatgtcc31380tctcgaggaagcttgtccaacttgcgacccgtgctccaggagagtcgacccaagtgcgga31440cccaacgacgccgaacttcgaattcgagccgtcggtctcaatttccgagatgtgctcaac31500gtcatgggtctctaccctggcgaccctggaccacctggcgccgacacctccggcaccgtc31560ctcaccgtgggaggcgaagtcagtcacatccgtcctggcgacgatgtgttcggtgagtct31620cctggttgcttgaggacctacaacgccggcccagccccgctgctcacgcagaagcctcct31680acctggagcttcgaggatgcctcaaccatgcccgtgatcttcgtcaccgtcgaggagtct31740ctcggagacctggccaagctgaagaagggcgaaatcgtcctcatccatgctgctgcaggc31800ggcgtcggcttggtggccatccagtacgctcagttcgtcggtgcgactatcatcggaact31860gccggatccgaggagaagcacgagttcctgcgcaacttgggcgtgaagcacatcaccagc31920acccgaaatggccagaagttcgaggacgacatgaagaccattctcaaggagttgaaggtg31980gatggcatcgacgttgtcttgaacagtttgagccacgacgactacatcccgagatccctg32040gcattgctcaagaagggcggacgcttcatggagatcggcaagcgcggcatctggagccac32100gaacagatgttcgaggcccgacctgacgtcatgtacgagaagatcgccgccgacaccatg32160atggacttggaatcctggaagtacaatgcctacatgaaacgcctgctcacccgagtggaa32220gaaggtggtctcgtgcccatcaacaagcacgtcttcacggacatcgagaagggagtcacc32280gccatgcagttcttgcagcgagctcagaacatcggcaaggtcgtcatcgcactgcccagc32340cgaatggattgcaagccagactccgagtacctgctctctggtggtatgggagcattggga32400atggtcaccgcccagtacttggtcgaggaaggtgcaaagcacatcacgctgctttctcga32460agcggcaagccatccaacgacgtgctcgacctctgggagtggctgcagaagagcagcatc32520aacgtctctgcgaaggcttgcgacatcgcccagatggacagcgtcaccgaacttgcggtt32580accttgtccaaggacggccagaagcgcagccccaagactcatgtcggaggcgtcatccac32640ttggccgccgtcctcgacgacgccactctccccaagctcactcgaggccacctcgagcgc32700tcgttcgcagccaaggtttggggcgccaggcacctccattgcgcctacgccaaggagttg32760gacttcatgctcctcttctcctccacctcggcgctcttgggatcgcccggccaggccaac32820tactccgcttccaactcctctttggacgcccacgcccgctactggcgccagagtggcatg32880caggccacgagcgtgcagtggggcccctggagggaggtcggcatggctgcgcagaagggt32940accgtcgagcgcttgcgccagagcggtgtcggctctctcaccaacgctgcaggcatggcc33000gccttggccggtgccttgaccgccagctgccccaccatcgtggctcagccgatgaggtgg33060gccaactacctgaagcagtaccccaagatcccccccttcctgtcccgcttctcggccgag33120ctcaagacgaagaagccggctgctcccgcccgaccggcccagggcatgatgatgatgcag33180caggccgccccctcggctcctgccatcagcgtcaccgacctcaagagcatgctccagcag33240atcgccagcgatgtcgccggcggcggtgttgtcgacgaggacagccctctcatggaatct33300ggcatggactcgctctccgccgtcgagttccgcaaccgcttcacggccaaggtccctcag33360atcaatttgccgaacacgctcatcttcgactaccccacgatctctgccatcgcggacttc33420gctgtcggccagatgggccccgccaccgcggcccctgccggctacgccatgcaggctgcc33480cctgcagcacccggcatgactgctgacgcgatcatggagttgctgaaccgcatcgccacc33540gacaccaccggaggagctgtcgaggtcgacaagccattgatggagtctggcatggactcc33600ctgtctgctgtcgagttcaggaaccgcctctcctctgagctcccaagcttgcagttgccc33660aacaccctcatcttcgactaccccacgatctctgctgtcgcagactacgcggtcgagcaa33720ttgggcgccagcaccgtggctgttcctactggcggcgcaatggtgccaatggctgctgga33780gcctcttctggggccttcgacgagcctttggccatctcaggcaccgcctgccacttccct33840gccggctcgacgggtccgaacgtcttctacaagcagcttgcgcagggcgccgacggcatc33900gtcgaagtgcctttcacccgctgggagctcgaggaggtttacgaccccaaccccgacgct33960cctggaaagatgtacccccgacacggagccttcattcagggtgccgagcagttcgatgct34020tccttcttcggaatctccgcacctgaagctcgcgccatggatccccagcagaggctgttg34080ttggaggtggcctacgactcgttggtcgactctggcttcaccaagagctctctgttgagt34140agcaacatcgccgtcttggtcggacaggcgaacaacgactggatccagatgcagagttgg34200gacctgaagaaggtgaacccctacactgccactggcatgtccgcttccatctctgccgcc34260cgcatctcctactccttgggcatgaagggcgcaagttacatcatcgatactgcctgctcc34320tctgccttggtggccttggatgctgccgccgtgaccttgcgccgaaccaggtgcaccgct34380gccgtcaacgcggctgccaacgtcatggtgagtccttccacctacatcagcttcagcaag34440ccgcgcatgctctccgagtcaggccgctgcctcaccttcgaccagagcgcgaacggctac34500gtccgaggagaaggaggcggctctgccgctctcaggctcgtggccgatgccggcgacttc34560gctcgctccatcgttcgcggcgtctcggtgaaccaggacggacgaagctccactttgacc34620gcccccaacggacccagccagcagatggtcatgatggccgccctcaacgaggcgaagctc34680tcacctcagagtgtcggccacctggagtgccatggcactggcacgccgctcggagacccc34740atcgagttgggcgccttgcaggccgtcaacgcaggccgctcggagaacgtccctctggtc34800ctcgctgcggtcaagaccaacgttggtcacttggagggtgccgcagcatccaccggattg34860atcaagatcgcctctgtgctccagcatggggcagccaagccaggcatccacctcaagacc34920ctgaaccccaacatcgccgcgctctccgcgctgcctgccgtcttcgccagcgagtccctg34980cccctcccctcgggtggtgcctacaggactagcggcctctcctccttcggcttcggagga35040acgaacgcgcactccgtgaccagcgaggccgaggtgcccgccgagcccgtgcgaaccgtg35100atcccaggaaaggagtacaagaggaaggccttcccttggagggaggtcggcttcagactg35160ctccgctcctcgccttccgacaacgtcttcgaggtcgtgatgatctccgacgtctacgac35220gtcgtgagccaccacgtcgtcttcagctcgatcgtcgtgcctggcgtggtctacgtggag35280atggccttggaggccactcgcaagatcttcggccacggtgcgaagctcacagacttcgga35340atggtcttccccttcgtgatccccttccgcaccacgggcgtcgagcctgccgccacgatg35400cgcttcgtgctgcgcggcgagtcccgcttcgagatccagagcacctcggccacaggggcc35460gtgacggtccacgccgaaggaggcatcgacagatcgcccatgaaagatccttccagggcg35520gagcctgtggacttggacatggtccgcaagcgagtcacagaagagattccggcaagcgtc35580gtctacggggccatcgacggagtcggcttgtggctcggacctatgttccaggttgccaag35640cagctctggcgatatgaggagggagattccatcgaagtgctcggccgattggagttggac35700aagacgatccccaacgaaggctacgttgtgcaccccgccctcttggatggaacgatccac35760accttgggaaccgcctccatcggcaagaacgtgaacgacttgaagatctttggaggtgtc35820ggtcgcgtcacaatcgtcgaggagagcaatttctcgaaggccgacgagtactggatttgg35880atggacattaaggagaagttggaggcctctgagaccttcgacgttcgcgtgatgaacagc35940tccggcaaggtcctcatgttcatggacgacgtcgtcttcaggaaggtcttgcccgagcag36000atccagatggcgatcgccgcccagagcgcctccgaggacgctcagaagctctacgaagtg36060gattggactgctgccgaggaactggaggaagtcgccgaagaggacgacggacagtggctg36120gtcctcgctcccgaggaggccgctgcgaaggaactgaagaaggagcttggcgacaagcac36180gactacaagaagctctcggaggcccccaccgaaggcttggagaaatactccaagatcgtc36240ttggccgcggagagcgagcgaggcacccctgtcgatgtcctcgacggtgctctcaagctc36300ttccagtctttggcccatgctcaggagggcacgcccgagacctggttcttgaccgccgcc36360actcaggccgccgcctccaacgaggacttgaagggcgctgcgatcccgaccactgctggc36420ttgtggggtctctcgaaggccttccgcaacgaacaccacgacgtcgagatgggcatcttg36480gatctggcctccagcggcgatttgaagaaacctttgaccgagaagttgaccaatgcctcc36540gccctcatgaaggccaagaaggatgccgaggtcgccgcgcgagccgacggcttgatggtg36600cctcgattggtggagtgcaccagccgcatgccggtccaggatgtcagcttccccgaggat36660ggaactttcgtcatcagcggtggtgtcggtgccttgggtctcgtcttcgccgaatggatg36720gccgccaacggcgccaaacatttcgcgctcatgtcgcgaagcggcaagccccctgcagac36780cagaagagcacgctcaggaagttgagctcggtcgccactgtgaagaagtgcgacatcgcc36840tccaaggacagcgtgcttgctttgatgaaggaaatcgctaaggagatgccccctgtgaag36900ggcgccatccacgctgcaggcactttggccgacggactcttggtcgacttggaccgcgag36960aagttggaagccgtttgcggcgcgaagatcgacggaaccctgaacttgcacgaggccctc37020aagagcgctccattggagcacttctggctcttctcctccgtggccgccatgatcggctcg37080gtgggtcagggcaactattgcgcagccaacgccttcatggactcgttcgctgcctaccga37140tcggcgcaaggcttgcctgccatcagcgtccagtggggtccttgggccgacgtcggtatg37200gccgctcgggccggcaccagcgaaggcagcatcgccaggatcgagatcgccaagggcttg37260gaggccatgcagtccatcttgggagccagctccaacttgcacggaggcgtcgtcggcgtc37320gcccgcatcaagtggaagatgctcctcggacagatgccaaaggtcccccctctgctcacg37380aagttcagcgccgaggccggaggcaagaaggcctctgccgtctcgatggctggcatcacg37440caggacgacgtgcagaacttggtggttggcgtgttgaaggacgtcatgtccggagacgac37500atggagctcgacctcagctctcctttgatggagatgggtctggattccttggccggcgtc37560gagttccgaaaccgcttgcaggcctccttcgaaggcctctcgctctcgtcgaccttgatg37620ttcgactaccccacggtgcccgatttggtggacttcatctggtcccaagtgggccccgcc37680gaggacgaggaagttggtggcgccgtcgctggcggcgacgctggcggcatgctttgcctg37740tccggctatgcaggacgattccccggaagccacaccaacgacatcgaggagtactggcac37800actctcagccacggtttcgacaccaccaccgagctgccgcctgagcgatgggacatcaac37860gcctacttcgactccgacatcgatgcgccgggcaagacctacgtcaagctcggtcacttc37920atccctggtatcgaccacttcgatggtgagttcttcggtgtttcggacgccgaacagcga37980gccatggatcctcaccagtggttggcattggaaatttcctacgaaggcttgtacgctgca38040ggcttgaccaaggagaccatgtctggcatggagtgcggcgtctacgtgggagcctgtaat38100ttgggtggaaacgacgtggacttggaagcactcggacccttctccaacatcggtgccgcc38160tactctggctgctccggccgtgtctcgcacgtcctctctcttcgtggtccttgcttcacc38220gtcgacaccgcttgctcctccaccatcgttgccctggactctggttgccaggccgtccgc38280ttgggcaagtgcaagagcgccctcgcctcgggtgtcaacgtgcagattgccgcttccatc38340tggatcggcttctctaagatgcgaggtttggccatggacggaaggtgtaagactttcgat38400gcccgcgcagatggcttcgcccgaggagaaggtctcggcgccgtctacatccaggccgca38460gccaattgcactgatgcgaaccctgcgatcgccatgatcaccggctgctcgaccaaccac38520gacggccgcgccgccaccatcactgcgcccaacggcaccgcccagcagcgcgtcctgcgc38580tccgccttggcggagcgaggcaccttggccgaggacgtcgcctgcatcgagtgccacggt38640actggtaccgccttgggagatcctatcgaggtcggcgcccagaaggctgtctacaacaag38700ggccgcagcgccgctcgtccgctcgtcttggccgcaggcaagtcggcgatgggtcacttg38760gagggctctgccggcgtcgccggtatctgcaaggtcatctgcaccttcaagcactctgct38820attcctccgaacttgatgctcgagaagctcaaccccaacatcgacctctctggcttcgac38880gtcttgatgcctgactccttggtcgactggaaggctgtgcctcgcgcgggcgtctcctcc38940ttcggtttctctggaaccaacggccacgccatcttggaggcccctcccacccccggagac39000cagctgcccgagaggaagattcagaagttcaaccgttccgtcaagccctggcaccagtgg39060ctcgagaacgtcctctacgaagaggcctggaacacttgcgagttggtgcccgtcaccgcc39120ttcgatgcttcttgcatcgtcgtcggcagcggcagcatcgccgaaaagatccgaaagctg39180gccaaggcctccacggtcgtccctgcaggcacctccgccaaggacgtttctgctgccatg39240gataaggccaatgctcaggtcgccatcttcgccacttccgcggacgagccggatggcgag39300atcccaggcgcccgattggtcgagctcctctccttcttgcagggcgcccagagcgcctcg39360gagacacccaagatggtcgtcgttgtgaccaagggagcccaggatgccagccgacccaaa39420ttcgatgctggcgccactctctggggtcttgtccgctccgcgcgcatcgagatgccccga39480accaccatcaaggccatcgacgtccccgtcgacgccgccgccgacgccgcagcaaagatc39540gttgttgaggagttggccgctgcagaggccgaggtcgaggttgctcacattgcaggaaag39600ggacgatgcgtgcccgtcgtcacagaggcccctcagacagccaagagcctccagaggcag39660gacgccatgctggacaagaagatcctcagcgaaggcttgcagatcgtcactggcggtctc39720ggaggtctcggactggtgtctgccaggcagttggctgagttgggcgccacgacagtgatg39780ctcacgagccgatctggcaaggtgccagcaggacaaggattggaagagcacctccgatgg39840ttggaggccatccccaccaccgaagtcgtgatcaagaagtgcgatgtctcctccagcagc39900tccgtctctgagctcatgaaggaggcgaccgactccaagggacctgtggccggcatcatt39960cacgctgctggagtcctcgacaggtgccccttggccgagatggcaaaggagaatttggac40020aaggtctgcgagcccaaggccagcggcgcctggtacctccacagcagctccgagcagagc40080gacttgaagctcttcgtgctgttctcgtccgtctctgccactgtcggcttggccggtgga40140gcctcctactctgcggccaacgcgtacctcgatgccctcgccctctggcgcagagagaag40200cccctcgcagccctcagcgccaagtggggacctgtctccgaagtcggcatgaccgcggcc40260tcgggcagcgactccatgttggaagcgatggctctcaaggccctctcgccagcccaggtt40320ggctccgccatgcgtttgttgctcacgcaacagggcgccggtgtgaacttgcgagctgag40380ctgatgctcgcccgcgtgaactgggcggacttcgtgcgcgaggtcggtgtcgagatccct40440caagtgaaggagttccagagccaagaggccctcgccgtgacaggcaaggagagcaaggcc40500agcgcgatggccggcatgaccgacgacgaccgccaggctgccgtgctgaagagcatccga40560agcgccgcgcaaggcatgggcttggaaatggacgatgagactcctttgatggaggccgga40620atcgactccctgtctgccgtcgagttccgcaacaaggtctcctccgagttccgcgaggtt40680cgtctcccaagcaccttgatgttcgactaccccacgctcaccgcgctcgcgcagtacgtc40740tcaggccagttgagcgtcgccgccggcggccaggctgcctccagcgccgctgctgctgtg40800gcccttccttccaagcctgccgctgctggaggaaacatcgctgtcttgggtggcgcttgc40860cacttgcccggagacagctggtcattggaagccttcagccacaccttggtcaagggagtg40920gattgcatcgtggagattccttacgacaggtgggatgccgacgagtactacgaccctgag40980gccagcaccggattgaagatgtacgtcaagcacgccggtttcatcgaaggcgccgagctc41040ttcgccgcctcgagcttcaacatcgtcaaggccgaggccgagaccatggatccccagcag41100aggcacctcttggagacctccttcgaggccttcgtcgtcggtggcttcaccaagcagtcc41160ttgatgggaagcttcacaggagtcttcgtcggtcaggacaagtgcgattggaaccgcatg41220atcagcggaagcatgggaggtccttacgctgccactggcggctcttcgtctatctcggcg41280aaccgcatctcctactccttgggcttgaagggcccgagtgcgacaatggacacagcttgc41340tcttcctcgctcgtcgctgcggacaccgccgctgccacgctgcgaaggaggcgttgcgac41400atcgcgaccgtctgcggcgtcaacatgctcttgctgcctcagaccttcatcgcctgctgc41460caggcgcacatgctcagcgccttcggtcgctgcaagaccttcgacgaaagtgcctctggc41520tacgttcgtggagagggctgcggcgcgcagaccttgatgcaggtctcggacaagcccgcc41580tacgcggagatgtccggcagcgccctgaaccaggatggacgaagttccaacttgacctca41640cccaacggaccttcccagcaggccgtcgtgttggctgccttggccgaagctggcgttgct41700ccctcggctttggactgcctcgagacgcacggcacgggcacggagctcggagatccgatc41760gaggtcggcgccctgcaggccgccttgggcggcgccgcgaggcagaaggccctcttgctt41820ggcgctgtcaagaccaacatcggtcacttggagggcggtgctggcatcgctggcctcacg41880aagttggtgtgcatgctcaacatgaggacgatggtgcccaacttgcacttgcgcgaaatc41940aacgaccacatcgacgaggacctgcagagcttcgccgttcgactgcctaccgaagcgacc42000aagctcgcatccaagggcatcatcacttccagcgtctcctcgttcggcttcggcggaacc42060aacggacacgtcgtcttgcagaccgcttccaaggaaatgccaaagacagcgaagcctaac42120aagaacgttgtcttcctcttcacaggtcaaggatcgcagtacatcggtatgggccgtggc42180ttgtacgactcgcagcctgtcttcaagcaggccctggacaagtgcgccgaggttctggac42240aagttgctgccaacgcctttgatggaggtgctctaccctgccgacgagtccaaattgatc42300gaccagacgcagttctcgcagccggccattttctccatcgagtatgccctcgctacgctc42360tggcgctccatgggagtcgagcccgttgccgtcttgggtcacagcgtcggcgagtattgc42420gccgccgtcgttgctggagtgctgcctctcgaggacgccctcaagctcatcgccctccgc42480ggccagtgcatcgccgagaagtgcgaggctggaatcggctccatggccgctgtcttcgca42540agcgaggcggacgtgcagaaggcgatcgcgaaggtcggaagcaaggacgtctctgtggct42600gctgtcaacggacccaagatgacggtcgtcagtggccgcagcgccgacgttgacaaggtg42660gttgcccagactggagctaccagccgaccattgacggtctctcacggcttccactcgccg42720ctcatgaagcctgctctggagcccttccgagcacaggccgagaccgtgactttctccaga42780ccatccgtcaagttcttctctaccctcttgggccgagaagtcacagacgagcttgctcag42840cctcagtactgggtcgaccacatcgagaacgcggtcaagttcatgcctgccaccatggcc42900ctggacgaggctctcagccccgatctctacttggaaatcggtgcgtcccccgtcttggtg42960aatatggcgaagcgcttcttgtcgaggagcgtcgagtggatgccttctttggacaacaag43020gtcagtgaccaggacgccttcaagaaggctcagcaggccctgggagcctccgccggccgc43080cctaaggccgacctcaagcgaactgccttcccctggagagaggcaggccaccccttgctg43140cgctccaagaagaccctccctgatggcaccgtcgtcttcggcgtccacttcggaggacat43200gtgctcgagcttctctcccaccacatcgtgcacggagaggtcgtcgtgcctggcgcttgc43260tatctcgagatgatcgttgctggctgcaccaccttcttcggacgcgaccagccttggtgc43320gtcgaacagttgggcttcgccaagcctttggtcttgcgcttgagccctgaaggaaagttg43380gacgagccgaccgaattgcgattggtcatccgtccggatatgcgtatcgaggtcgagtcc43440gagatcggcgacgaccccgacgacagcatcgtcgcgacgcacgtcgaggccatcttggtg43500aagcagaccggcacttgggcaagcaaccgacccgagaaggatgcgttcagcttggatcag43560ttgaagaaacagtgtgccgagcctgtcgacatcgacctcatgtactccttcggaaagaac43620agcggcttgccactgcagcgccgattccgcaccgtgcgacacgtgcagaagggtgacaag43680gagagtatcggccgcttggagatggagagggacggcactcaagtcggattctggctgggt43740ccttccttgatcgacggctccttccaggcctccatggctctcgcagatgcagatgttgga43800atcggcactctgaagattcctctctccatccgacgcttgcagccaacaggccgagcctac43860aacatctctgtctggtcttacttccagctcattgacttcaccgacaggagcaccgtcttc43920cgctcgtggttgctcaacgacgctggcgaggctttgttgtacttcgaccacgtccacttg43980caggaggtccgagacgagcacatccagaaggtcttgcagtcttcaggccgtcagggcacc44040gagcagtccaacttgtacgatgtcgaatggcggcagttggagcttgccggaaagcctgcc44100tccctgccgaacgaagagttcctcgtcgttggtggcaaggccgccctcgagaagctcaac44160ttgggcaagagtcctcagttctcttgcatgcagatcggtaaggacatcgacatcaatgat44220gacgacagtgtgaacaaggctctcttgggcaaggcctgggccggcatcgtcttggccgaa44280ggtttggccgagaaggtcggcgacgttgatgttgtcaccgaggccatgatcatagttaag44340gtcctgaccaaggcaggctccaaggcccctcctctctggctcctcaccagtggctctcag44400cctctcgcctccgcagacgccgagcagcgcaaggccggttgtgcaacacactccggtctc44460tggggtttcgcccgcgctgtgcgcatggagtaccccggaatggtgcgagtcagttgcttg44520gatttcgaccccacaagttcgaagagcaccggagacgagttgtccgctcgcctgtctagc44580ttgaccgctgacactgaggacgaggtcgccctccgaagcgactccgccgccagcgctcgc44640ttagtgcgttccgagctccagttcgtgggtcccagccgcttgaacatggccgcgcgcggc44700gccttgagcaacttgaggctcgtgtcgcagggcaagcgccagacccccatccctggcttc44760gtccagcagaggatccgagccatcggcttgaacttccgtgacgtgctcaatgtgatggga44820ctctaccctggcgaccctggagccccaggcgccgactcctccggaaccatcgtcgagttg44880ggtgaccgcgtcgacaccctcaagatcgccgatgacgtcttcggagagtctccaggctgc44940ctcagcacctacaacaatggccccgcggccctcttggccaggaagcccccctcttggtcg45000tacgaggaggcctgcgcaatgccggtcatcttcgtcaccgtcgaggaggcgctcggagac45060ctggcgaagctgaagaagggtgagacggtcttgatccacgctgccgccggcggtgtcggc45120ctcgtcgccatccagtacgcccagtgggtcggtgccaaggtctatgccactgctggatct45180gaggagaagcacgccttcctgcgcaagttgggcgtcgatcgcatcaccagcacccgagac45240ggcgccaagttcgaagcggagatggagaagatgttgaaggaggacaagctcgagggcgtc45300gacgtcgtcttgaacagcttgagccacgacgactacatcccacgctccctgaaggtcttg45360aagaagggtggacgcttcatggagatcggcaagcgaggcatctggagccacgaggagatg45420ttcaaggccaggcctgacatcatgtacgagaagatcgccgccgataccatgatggagaag45480gagtgctggaggtacaacgcctacctgaaccgactcttggagcgcgccgagacaggcggc45540ttgaagcccatcaacgaccaccgattcgagggtcttgagaagggagtcgccgccctgcag45600ttcttgcagcgcgccaacaacatcggaaaggtcgtcatctccgagcccagccgactccag45660tgcaaccctgcgaacatctccgtcctctcaggcggcatgggcgccttgggcatcgtcacc45720gcgcagttcttggttgaagaaggctgcaagaagctcagcttgctgtcccgaagcggcaca45780ccttcctcggatgccttggcgcagttcgagtggctgaaggcagctgctatcgaagtcggc45840gtgagcaagtgcgatgtctcttccgagactagcgtcaaggccttcgccagtggcttgcag45900agccccatcgactgcctgatgcacctcgccggcgttctcgccgacggcatgctgcctacc45960ttgacgagggagcacttcgagaagtcgtacgcgccaaaggttcacggtctgtaccacatg46020gtcaagcactggaagatgagcgaggacaccaagttcatgctcttctcttccacctccgct46080ctcttcggatcgccgggccaggccaactactccgcatccaactctgtcttggactccttg46140gctcctatctggagtgcccagggacgacagtcttggacggtgcagtggggtccttgggcc46200gaagtcggaatggccgtgcagaagaacaccttgtcccgagccaaggctatgggcgtgggt46260gccttgagcactgccgtcggtatgtccatcatgggaagcatcctcggctctgcctcgcac46320gtcgtcggtgctgtgcctgtcaggtgggctaagtacctccgaagtgcctaccaggagact46380cctatgttcttgactgacatggaggccgaggtccgccgtgccgccccagccgttggtgag46440ggaggtggcaattccttggccttggccaacctgtcggcagaggagcgcttggaggccgtc46500cgcgagagcctcctcaccatggctcgcgaggtcgtcgacaacgacactctctctgctgaa46560gacgcattgttggagagcggtatggactccctgtctggtgtcgagttccgaaaccgattg46620gtcaccgagttcgaaggtgtccgcatgggcaactccctcatcttcgaccaccccaccgtc46680aacgagctcgcggcgttcatctcggaggagttgggcaacaccttgccagcggccgactcg46740tctgctgccccagcggccttgcagaacggcgcctcccaccctgtggaggcccccgagtcc46800agcgccagcttcgtggagagcttgaactcacgcgccagcggcactccgatctacttcgtc46860cccggagccggcatgcaggccggaggcttccgtccgttggcccagatcttgccggtgcct46920gcctacggtctttcttggccgaagggcgccgtgccgcgcgaggagtggcctaccaccatc46980gacggcctcgcacgagtcttcctcacagaggtcaagaagacgcagcccactggaccgtac47040cgcttcgctggacactccttcggagccgcggtcgccctcgagatggccaagatcgcacag47100gcccaaggtctggaggttactttcgtggccctcttggaccccaggcacatgggtggaaag47160accaccgtcgacgtcggcgaagccttctccacgaccgacctcgccgactccttgggcctt47220ttggcccaaaccgtgccagacggctcgaagtacgtgcaggccttggaggagatcgtcaag47280tccgacgaccgcgatgccgctgctaagaaggtattgagcccagccgtgttggcttctttg47340gagcatgttcacgagaccacgaagtggtacagcaccctgttggcaggagacaacttgcag47400cctgacgcaagcttgaaggcccgaattgcggtgctccgagcccctgagacttggttgagc47460ccaggtgacaacgagacgatcgctgacaagatggtccgggaattccaggccaagacgttc47520cagggcgatgatgaggtcaccaagctcgtggacgagtggtgcggcgttgcccccttcttg47580aacatgaaggttcctggcagccatttcacgatgttgcacgaacctcacgtggtctcgctc47640gccatgcgcttgtgccgcgcagtcgacgagtccgagggtgaggagctc47688<210>3<211>47866<212>dna<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>3tggctcaagtcgtttttgctcaagatcgagcatctcccatatttatatattggcgctgtg60ccgaggttttgttagtgtgccgactttgaaagcacgatgaggcgcagtggtgaaatgaaa120ggcgcctctggaagttccggatcctccggcccttccaagcgatccggcttgaagaggtct180ggtggaaacactggatctcagtcccaattggcggacatggtcgaccaactgtcggtcacc240accagcacaggatccatcaggatgctcgcacgagcaggcctttgcctctcgatgggcatc300gttctagcgatgggacgacatacgccgtggtggttgatccccttcggcgtcgtcttcgaa360ggagtttccctagcttggtttcacctcatccaaaaagagtgtgaacagggcaagtttttg420ccttctcccgagttgaatagagtattggccgctctcctgcgatgggaggtgtgctcggcc480ttggttatcgtgttgttcttgtcgggagcctgggacatctattctatcttcaaatactgg540ctgcttcctcttctcgttacccaagccaccttttcgacatccagtgcaacagagaagcca600aaatccgagtctgcagaaggctcgggcagattgtccaagactccctcaatgtcttcgttg660gatctgctgtttcccgagttggaatccgcagcaagccaaatttcggagttgttggaagcg720gcgcagcatgcggaccagagcaacatgttcacacaccacgttggcgctgacgatgccagc780agtggcgatgactggcacttcggtgtcgctctgcatcagatcccgatgtaccacctgcag840tcactctcccgaaatttgaacaaggagctgaagcgcgcgcgcccttttgggtccagcgcc900aatttagcagctctcatgggtgggggcagccaagatgctgaaccaggtggcgaacaggac960gaaggcctccgacagcgacgctccaaaccagctgccaggaagaaggaggagaaaggaaag1020aaagatgctgtgcagcaaactccttgggcccaggtcatgaacctcatcggctggccagcc1080aggtacttgttcagagaaatgtggctctggactgagaaggacctcaccctctatgccgtc1140gtcgctattttcttgctggaggtctacatcggaacgaagtacttttctttcgcaccaatc1200tgcctgctctacccgctgctgtcgagttcctccggagcccgaatggcctctgaactgcag1260gaggagatcgttatggtgatgggcctcgagcatcgcttttggcgtcgcttgcacatcccg1320gtggctctgcaggtgttggtgtgccacaacatggttgtgtatttcattttctctcaaatc1380atctttggtggagtcgatccttacgtcggtgttgcccccaagtggcaaacctttcttttt1440ggcgtggtgctctacgttttgtccatggtcggcatgatcggaatgaacttggtctgggcc1500tgcggtgccgtcgttttggacctcccccagaaagtcttcctcatgatctgtgcctctacc1560gcgaaccaaggcagcatcttccgatggtgccgagatcatcgtgcccaccttatgaacaag1620ggcacggtggccgatccttacgactacaaccgtggcgctaccttcgcctacatcggctgg1680tttgtgcagcagaagactcgccgtgcgatcgaagcgtcaagatctgtcgacatgtccgac1740ctccttgccgaccaggttgtgatgttccaggctgatgtggacacctggtggaatttgtct1800tggtgccatgccattccggcattcttgaccttgatgtggggcgaagatttgtttttgggt1860tgggtcatctgcggctgcttccgatatgtgctcgccttgcactccaacctcctccttgtc1920taccatcagcatgcctggggccccatggaggtgaaggcccagccagtcttgacaggagaa1980gtgactgccgccgccactggccgcagaactggtggcagccagatgttgcgttctgcctcg2040atcgcagagcagctgcaatctgtgcccgaaacagaagtcgcccccaaccgaccggcccca2100ctggacactgctgctgcaattgcccaacaagcccgaaacgccgaggacggcggtgtcttc2160gtcaagtacaaggtcggccaggcctccgctggcggcgagccctctttggaggtccgtttg2220gagcccctctggagacgctccacgttgatcgatttggccaaggatgctgtcgccgacatc2280ctgaaggtccagtccagccaggtccgacccgaccgtcctttgatggacttgggctttgat2340tcggccagtgctctcaggctcagggacaagctcagcaggcgattgaacgttgaattgcca2400cctaccttgctgttcgatcacccaacgatcaatgacatggtcgacaacggcctgaccaag2460tttgctcagcgcccgatgaccccctccggcatcacccccgatcagaaggctgctgccatg2520ccagatctggtggtgacttccactgcctgcaacatgcccaaggcgggctcccctggtgag2580ctctggaacatgcttgtgacgaagaccgatgcggttgtggaggttcctctcgcccgttgg2640gatcattgcgagtactactctccagagcctcaggagggccagacctacgctcgacacgga2700ggcttcatcgacaacgccgatctgttcgatgtgcctttcttcggtcttaccgcggcagag2760gccaaggctacggatccccagcagcgcctcatcctcacaacggcctacaactgcttctat2820ggagatggatacgacaaggccgctttggcgggcgacaacattggtgtcttcgtcggtttg2880agcaacttggactggtaccacctcagcctcagcaagcccagtgtctacacaggcaccggt2940gtcgccagtgctatcgcctcgaaccgaatttcttacgtcttcggactcaagggacccagc3000atgaccgtcgacacggcttgctcttcctccatttcggccttgacctccggtatcgcctct3060atcaacaagtcccacgctgtgcgcgaggcgttggtggcgggtgccgagcttattcatggc3120cccaactctttcatccttcgatccgtggcgggcatgctgagccccgaggggcgctgtaag3180accttcaatgccaccgccgatggctacattcgaggagaaggtgccgcagcggctatcatt3240aagttggcctctgacgccgaggaaaagaggtgtgccgtcgtggccgacgtgaagagcgcc3300gtcatgaaccaggacggaaagagtgcgaccctgaccgcgcccaacggtccctcccaggaa3360gaggtgctggccaccgccctcagggaggccgccatgcagccgaaccaagtcaaggccatc3420gaatgccacggaacaggcactgcattgggcgaccccatcgaggtcagcgccatcaaggct3480gtcctcggagccgagagcaaggaggccccgaagctgatgctctgcgctggcaagtcgaac3540catggtcacttggagggatccgccggcttcgccggcctgatgaaggtcttcgggtgcctc3600acccaaagcgaagtgcctccaaacatccacttcgaacgactgaacccccacatgagcttg3660gagggctctagattgacagttgcggaggcccagaccaccatccccaagggcaacacagtg3720atgggcgtttcctccttcggctttggcggcaccaacgcgcatgcgctgctcgcccactcc3780atccgcaagaagcccaagaaattgtccgagcaccgggtcgccttccttttcactggacag3840ggctcccagcgacaggccatgggcaagaggctctacaaggtcgatgaggccttcaaagtc3900gccctcgatgaggcagctgtcatctgcaaggacctcatcgaccaggacctcttggacctc3960atgttcagcgaggaccgagagatgttggagaagttgaacaccacctactactcccagatc4020gccatcttctccatcgagtacgccctcagcaagatgtgggccgccaagggcatcacgccc4080ttcgcagtcttgggacacagcgtcggcgagtacacggccgctgtcgtggccggctctctc4140tccttgaaggacgcgctgaaggctctggctactcgaggtcgcttgatccaggagaagtgc4200gaccctgccatcggcaacatgtgctccatctttgcctctgccgccgatgtggaatctgcc4260atccgctccgtggaccttcagggcgagactgtcaacatcgccgctatcaacggcccctct4320gccacggtcgtctccggccacaagaaggcagtcgagaaggtgtgcaagcaggtcaatgct4380ggcaacaaggagcttgccatccagcacgccatgcactccaagctcaccgagtgcatcttg4440cccgacttgaagaaggtcttggacacttgcgagttgaagaagccctccagcgacatccac4500ttcgtctccacgctcaccggtactgagatctccaacgagctcacaaaggccgcccactgg4560gtcggccacgacgaggacaagccgatgctcttccttcagggtatggagactttggagaag4620ttgggctgcaccgccttcgtcgagttgggaccacagccagtgttgatgaagatgggacgt4680cgctgcgtccagacggccgccaccaacttcgaatggctgtcttccttgacgccaggccgc4740gacgaggtcgagaacattctgttgatctctcgtgccttgggcgctgcgtacgatcgtgtc4800tccgaactgaagcccacgcccctcccttggcgcgcgcctctcctccaccctctgttgggc4860aagaagcagcaggacgcctccggcgccaccgtcttcgagtctggtgccatcaagagtggc4920gccgcgatggaacttttcgagcagcattgcgtcttcggacaggtcgtgctgcctggagcg4980agccacatccttcttgcagccgccgcccagttggagagcgccaccacgcgcgtcggtgct5040ggagctgccgtggagctcaacgatgctgtcttcgagcgacccttcgtcgttcctgaggac5100tccgacctcaccgtccgctgcagggcgactgtcgacaccaccgaagtcgccagctccact5160gacggggccgcgcccgtggtccatgctcgattcggcagtgctcgcgtcgtcggtgctccc5220gccctggctacccctgtccaggaacgtttgtcggccctcgagacacctccctccgcagag5280ggagtcaaggacctttacaaggccttcgaggacaagggcttgggctacggaccgtccttc5340cagcccctgcaggagttcagcttccagtcttccggtgctttggctcgcctgggcatcacc5400ttgaagacctgggagcagtctctccagatgttgcacccggccctcttggatggagctctt5460cagctcttggtcgagagcgccacccgacgcgtcgaggaaaagtgcaccttcttgccattt5520gcggtgaagaaggccatcgtggcagcccagtgcccaaccggcgagctttgggccagcgtc5580aaggttctggacagcaccgccacctctttgaatgccgatgtggaggttttcaatgccgag5640ggcaagttggcgatccgcctcgagggcgccagctgccgacgagttgaggagggtgccgcc5700gcagagaaggacaacggagatcagtgcctctactccatcagctgggtcggagcggaagag5760gacagccgcggcatcttggtcactggaaccaccctcgtcgttgcccctgaatcagagatc5820cccgcgatcgccaaggccatcggcgtctcggagtcccgctgcagcgctgtcagcacagca5880gaagaagctgtcaagactgctgccgaccgaccctgcaacaccatcgtgtaccaagctgct5940ggctcagagatcgatgctctggaagttgcgctcaagctcacacagggagttgcgaagttc6000gatggcgatgtgccccgaatcgtcttggtcactactgccgcccagcagccggacttgaag6060gacaaggaacacgaccccaagcactctggtctgtggggtttcgcccgcgctgcccgtttg6120gagtacccccacatgcaggtctcttgcgtggacttggagggatcttccgaagtcgctgct6180cccacaccttccgctgcgctttccgcagcagaggtcgaagtcagtgtgcgaaatggtgcc6240tctttgggtgccaggctcgcccgcagcagcatggcgccgaagcgccccttgaggctcaac6300atggcccgtcgaggcagcctcatgaacctccgacccgtcccccagaccaagcgcaaggcc6360cccgaggctggcgagatcgaagtccgagttggcgccattggtctcaacttccgagatgtc6420ctcaacgtcatgggcctctaccccggagaccccggtgagcctggtatggactgctccggc6480actgtcgtgaacgtcggcgagggctgccccaaggagcttcgatgcggggacgatgctttc6540ggtatcatctggggctgcctctgcacctatggcaagaccaagcaccagctcatggccccc6600agacccaacgactgggacgccgcctcggccgcggccttgccgaccgtctacaccaccgtg6660gacgtggccttcgcagagctcgccaagctgaagaagggcgagaaggtcttgatccacggc6720gccaccggcggcgtcggtctcatcgcagtgcagtacgctcagaagctcggagccgtcgtc6780tacgcgacagcaggcaaggaggagaagcgacagcacttgcgcgacctcggtgtcaagttc6840atcacgagctcccgaagcggcgacgaattcgaggctgacatgaagaagttcttgggcaag6900gagaagatcgatgttgtgctcaacagcatgagccacgacgactacatcccgaggtctttg6960cgcctcttggggaagggtggccgattcgtcgagatcggcaagcgagatgcttggacccct7020gagcaggtggcaaaggagttccccgacgtgcactactaccccttggccattgaccacgtc7080tgcgagttcgagcccgacaggtaccagggtctgctcaagcgcttggagggtgccatgcgc7140gagggctggaagcctctgccaatgaagactttcgagggcttggagcagggcgtcgctgcc7200ttccagttcttgcagcgagctcagcacatcggaaaggtcgtcttgactgttcctcagcga7260atgggcttgcagaaggacgcctcctacatgctctccggaggcatgggagctttgggtatt7320gtgactgcacagaccatggtcgaggagggagccaaggagctcatcctcctgtctcgaagc7380ggcaaggtccctgccgaggtccaggagcagtgggcctggctggagaactctgctgctgaa7440gtcatctcctggaagtgcgacgttggcaagggcagcgacgacatcctcaagaagctgaag7500ggcaagaagggcaacggcttgaagggtctcttgcacctggccggtgtcttggacgatggc7560atgattccggacttggcccgctccaacttcgagaatgcctatggacccaaggtcttcgga7620gcccaccacctcagggaggctgccaagaagaacggctccaccttggacttcttcgccttg7680tactcatccactgcctcgcttttgggcgctgcaggtcaggcgaactactgtgccgccaac7740tctgccctcgatgccttggccaacgcctggcgatgccagggcgaatccgtccagagcgtg7800cagtggggcccttggctctcggtcggcatggccgcccagaacaactccttcgctcgattg7860aagctcggaggcatcagcaacgagttgggtctctccgtcctcagctctgccatcaccagc7920ggcgcctgcgtcgtcggctgcgccatcgtgcagtggccaggattcctcaagcagttcccc7980aagacgccgctctacctggagagcttcaaggacaccgctgctggcgccggcggtgctggt8040cgggctggcggcagcgagatggagatgacaccagaaggcatcctcgcgtgggttagctcc8100gtcgcagccgacgtcgtcggcacagaggtctcccccgatgagcctctcatggctgccggc8160atggactcgctctcctcggttgagttccgaaatcgcttgactgccgagtgcagcttcgcc8220aagttccccaacaccttgatgttcgaccacccgaccctgcgagcggtcacggagcttgtc8280acttctcagctctcccccgagttggtcgcctctgccaccagcgctgtcgccaccgccggc8340cccgcctccgacatccaggtcgtggctcgcggcttgttctcccgcttccccagcggcgat8400ggcttgcaggccaattgggagaactggcagaagaagatggactccatcatcgaagtcccc8460tttgctcgctgggatctcctcgagttctggaatcctgacatggaggccagcggcaatgtg8520acctactcccgtcatggaagtttcatcgccgacgccgaaatgttcgacccaggcttcttc8580ggcatgtcggctgtggaagcgaagaccatcgatccccagcagcgtcacctcttggaggtc8640tcctacgcagcctgccaccacgctggcatgtccaaggagaagctcttggccactgacact8700ggcgtcttcgtcggacagtgcaacaacgattgggccaagttctccagcgaccgacctgcc8760aacccctacactggaccgggcactcacgcctccatcagttccaaccgaatctcctacaat8820ttgggtctccgaggccccagtgcttccatcgacacggcttgctcctcgtccttggtcgct8880ctggacatcgcctgcaacaagctcaagggctccctcatcggctccgccattggtgctggg8940tgccagttgaacttgatcgccgagccctttgtcgccttcggaaaggcccgcatgttggcc9000cccgatggacgttgtaagacattcgatgcctctgccaacggctacgtgcgaggtgagggt9060tgcggagccgtttacttggtcggagctgctgcatcgaagcaggacgagctcgcgatcttg9120cccggcatcgcagccaccgcgacgaaccaggatggacgaagctccaccttgacggccccc9180aacggcccctcccagcaggatgtgatcaggaaggctttggcccaggcgcaggtgcttgcc9240tacgccctcggcttcgtcgaatgccacggaactggcactgctttgggagaccctatcgag9300gttggcgccttgaaagctgtcctggctccaaaccgcacaactcctctgatcctgggaaca9360gtcaagaccaacattggtcacttggaaggtgcagcgggcattgccggtatggtcaaggcc9420atgctgtctgtgcagaactccgaggtgcctcccaatttgcacttcaacaccctcaacccc9480aacatcgatctggaggacttccccaccacaattcccacaagcattgagaacttgactgga9540gaccagcctacagccggcctctcctctttcggcttcggcggcacgaacgcccatctcacc9600ttcagggctgcccccaaaccattggagaacgcccaggattccgagggtggtgccaaacgt9660cgagtggcattcctcttcactggccaagggtctcagtacatcaacatgggcaagcagctc9720tacgaggccgagcctgtcttcaagtctgtgctcgagaagtgcgccgagttgctcaacccc9780ttgctggagcagccactcttggaagtcatcttcgatgcaggtggcaagttcggtaaattg9840ctggaccagactcacatgtcccagccagcgatcttcgccatcgaggtcgccttggccagc9900atgtggaaagcaaagggcttcgaacccgaggtcgtgatgggacacagtgtcggcgagtac9960gccgctgcggtcacctgtggtgtcatgagcttggaagatggctgcaagatgattgctgcc10020cgtggcaagctcatcgcggacaagtgcgaggccggagtgggcgccatggtcgccaccttc10080gcccccgaggccgccatcattgcggcaatcgacagcttgagcgacaacgagaagaaggaa10140gtcgccattgctggcgtcaatggaccgaagatgtgcgttgtctctggtcgcaaggatgtt10200gtggagaaggtcgttgccgccaccggcgctggcaacaaagccctgaacgtctcccatgct10260ttccactcgcctctcatggccccaatgttggacagcttccgacagacggctcgggccgcc10320gaccttaagaccccaagctctggccgttttgtctccaccgtcactggcaaggccgtcact10380accgagttgcaggatgccgaatactgggtgaagcatgtcgcccagactgtccgattcgcc10440gacgccatgtctaccttggagaaagaaggtgttgatgccttcttggagatcggtcctgag10500ccgacccttgtgaagatgggccgtcgctgtgtctctggcaccggctaccagtggctcacc10560tccatcgagggcaaaggagctcccgtaagcgaggtggacgccgtgaagcaggctgctgcc10620gtgatgcgaggaggactgcctcctctgacctacaagaagcaggccttcccctggagggat10680gccggacctagaatgttgaggaggcgcgccactaccgacaaggaggcccactttgacgtc10740cccgtgcgcagcgatctcttcgctgtggccgccgagcacgtcgtctacggcgagatcgtc10800gtgccaggtgtcatcttcgtggaaatggccttggagtccgttcgcgctcacctcggcgag10860catgtccagctccgcgacgtgtccatggtctggcccctcgtcgtacccaagaacgccgac10920tgcgaggagaagcaggtctggatgcgattggccatcattcagaacaagcgcttcgaactc10980cgatcccagacgcccggcgacgacaagtggaccacgcactgcgagggcaagttggatttg11040aacggaccggctgcacccgtcgtcgaggagtccttcgacgagatccgcgagcgctgcccc11100gaggatgtcgacgagaccaagttgtatcctttggtggacagcgtcggcctgtggttggga11160ccgaagttccaggtggtcagcgaaatgaagcgaagcaaggaggaaatctcctgcaagatg11220atgctacaccccgacgtcatcaacaacggctacatcatccatccttccttgatggacgga11280accatccatgctgtctgcgccaccatgctcgaccaggatcctcctttcctcaagattttc11340gccggcgtcggtcgaatcgccatgcacgcgaaagctgccccgaagaacgtgaaggtcaac11400ctccacctcaagatcagcgaactgtccgaccagcagcaaatcttccagtgcgtcgtcacc11460gacgacgacaagaaagttctctgggtcatggaggacgtcctcttcaggaaggtcctgccc11520gagcagatccagaaggccctcgcggccacgaaggagaaggatgcagtgaactacttcgag11580gcccagtggcagcctgccactgtcgacaacctctccggcggattcatcgagaagggaccg11640atgctggtcatctgcgaggatgccgatgtcttggaaggcatgcaggcagagctctcagag11700gagcacagcctcggcaccttcgccgagggctatcccgaggccctggaagagttctcgcag11760gtgctctgcgtcgcctcccctgttgccggcccagtggacttcctcggcggagccctcgag11820ctgctgcagaaggtcatcaagaagaagatggatggcaaggacgtccccgaagtttggttc11880gtcctcaactccaccacagcggtcaatttgtcggaactcaagggaaaagctgtgcccaag11940catgcaggcctttggggtctctctcgctgcctccgactcgagcatcctgacatcgcctgc12000ggcgtcatcgacctcggctcgaaggtgcatgtcgacgatgcggccggcattttggaaagg12060ctcgcctctgccaagactctccaagacgatgccttcgaggccgaagtcttgatggaggac12120tcccagcagtacgtggctcgcttggtcgagacaacttcccaactccagaaccttccctcc12180gagcagtctttctccaaggacgcctcctacgttgtcactggaggcactggtggattgggc12240ctgctgttcgcgcagtggatggctgatcagggcgctggccacttgggcctgctctcccga12300actggaaaagcgccagctggacctgcctacaagaagttggccagcactccaggcgtcgag12360gtggctgttcgctcttgcgatgtccactccgaggagagtgtccgaagcatcattggcgaa12420ctcagcaagactgccgccgttaagggcgtgctgcacgctgccggcgtcttggaagatcac12480ttgattgttgacctgaagaaggaacacttggacccagtcttgcgacctaagatcgacgga12540actttgaacttgcacggtgctacctccgacttggacttcttcgtcatgttctcgtccatt12600gctgccatgcttggttctccgggccaggctaactattgctctggcaacgccttcatggac12660gccttcaccttgcaccgacgagctcaggggcagtccgcggtcagcgttcagtggggtcct12720tgggctgaagtgggcatggccgctcgcgccggcacctctgagacctcctaccagaggttg12780gaccccacagcctccttggcagccatgggcgccatcttgggcgccggtagcgaggccgtc12840accaacggcatcgtgggcgtcgcccgagtcaactggagcaacttcttggccggcttccct12900acgctgccgccctacttgcagaacttcaagaacttcaggagtgccggagtcaagatgacc12960gacggcgtgtcgaagactgtggtgcgggacaccatcgaagcagtgttgtgcgacgtcctg13020ggcgaccccgacttggccgacttctctgttcctctcatggacatgggtctcgactccctc13080tcggccgtcgagttccgaaatcgtgttcaggcagccttcgagggcttgcacctcactgcg13140acggtcatgttcgactaccccactgtggccgacctcacggacttcgtctgctcgcagttc13200agcgagggcgaggaggaggaggccgccgggggcgctgcacgaggcgaggtcaatgcgcag13260gagccactcgccatgctgggcgtggccgccaggttccctggatgcaggaccaacaacccc13320gaggagtactggaacatgctcttgctgggtcgcgacatgatccaagaagtcccgatcgag13380agatgggatgtggacttgtactacgacgaggaccattctgccccaggcaagatgtacgcc13440cgaaacggaggcttcattttgggcctcgaaggtttcgatgcgaaaatgttcggaattgcc13500gacagcgaagctcacgccatggacccccatcaacgaatcttgctggaagttgcctacgag13560tccttctggaacgctggtttcaacaaggacgacctcatgaacagcgacaccggctgcttc13620atcggctgcgcgacgctgggcggcatcagcgtcgaggacgacgacatcgggcctttcacg13680aacatcggctccttcccctcggggaattctggacgtgtctctcacgccctcggcctccga13740ggtccttgcttcaccctcgacaccgcatgctccgccaccatcgtcgccttggactgcgcc13800gcccaggctatgcgcctcaacaagggcgagcgaagctgcgtggcaggaagcaacctgcag13860ctgcaggcgaacacttggatcggtttctgcaagatgggagcactctccgtggatggacgc13920tgtaagaccttcgacgccagcgccaatggcttcaccaggagcgaaggtgcaggctcgatg13980atcttggagttgcaagatgcagccctgcgaaagggacgaaccgagatcgcgactgtcttg14040ggcgcctgcgtcaaccaggatggccgaagtgctacgatcaccgcccccagtggacctgcc14100cagcagcgatgcatccagtccgctctcgcggacgggtccgtcgaccctctggacgtcacc14160atgatcgaagtccacggaacaggaactgccttgggcgaccccatcgagatcggcggcttg14220aagtcgaccgtcggcaagggacgaagtgccgacagccccctgattttgggagcagtcaag14280tcaatcatcggtcacgaagagggagccgccggcgtcgcaggcgtcatcaagatggtctgc14340gaattcaagtaccgacagatccccaagaacttgcacctccacaagttgaacccgaacatc14400gacctcagcgacttcgcctccgttgtcatgccagacagcatcatcgattggaagtctact14460tcgacaaagtctggcacttcgtctttcggcttcagcggtaccaactcccacgccatcttg14520gaggcggtcgacggggacgagattggaggcgtcgcactgcagaactccacgcccctcaag14580tgggcaagggtccctcaccgcatgtccaccgagtggtcctccggtctctggtggtccctg14640gagtggaaaaacacacctttggcgactggctcgctcgacgaccttccttgcttgttggtg14700ggtggcggcgagattgccaaggccgttgcgaaggtcatctcggatgtcacagttgtggac14760atcaagaacgctgccaaggccatcgaggagaaggaatgggcaacgatcctcatcaccgag14820cccatcacctccaccgacgattgcttggagggtgctgccatcatgcagctcatcgaggtc14880accaaggcagttgtggcaagtggccgagccttgcgcttcgtcgtcgccaccgctggtgca14940cagagtgccagcactgaggactcaaagctgtcgcagggctgcctgggcgccgccgcttgg15000ggcctgatgaggacgatcatctgggaggctcctagcctcaagttgcagaccatcgacctg15060ccttcccaggcctccgccgaggaaatggccacgctcttgaaggacgagctctccgctgag15120ggagatatcgagcccgagattgcctacatgtctggccagcgctctgtcccacgcttgagc15180tccacccggctccagcagacgtcgtggtccctgaagaagcccgagggcacgcagctcttg15240actggtggcttcggtggactcggcttgctgtgtgcgcagaccttggtgcagttgggcagc15300aagagcatcttgttggtttccaggaagggaaagatcgccgatggcgacgacgtcatcgca15360gaccacatgaagaagttgcaggagaccgacgccgagatccacgcgtggagctgcgacgtc15420tccagccgcaccaacgtcaagaagttggtcgaccgcgtgcagcaggagctgcccgagaac15480cccctcagtggagtcgtgcatgccgctggcatcttggactacgccgaaattccctcccag15540acctcagagaggctctcctctgtctacaaggccaaggtcgcaggcgcttggaaccttcat15600tcggagtcccagaacacagagctggagaacttcatcgttttctcctccgtatccgccctc15660attggactcacaaggggtgccagctactcgtcttccaacgcctacctggatggtttggtc15720ctgtggcgcagagctcgtggccttgctgcatccagtcttcaatggggacctgtggcggag15780gtcggaatggccgccaaggacgatttggccactgcagattcccctctcaagtacctcaaa15840ccttcccaagtccaggccgctttcaagcagtcgatcctgtctgcctcgcagccgtcgtcg15900ttgctgttcgccaagtgcgactggcctcgctttgtgcagtccttgggcaccgaggtgcct15960gtcttgaaggacttcgtgggtgccgaggaagaagtctccagcggcgccaagacagccgtc16020tcgtcggcattccagggcatgtccaagtctgaagtcgagtcccgcgtcggtgacatggtc16080ttgagcgtggcctgtactgtcctcggcatcgacgacctttctccagaggccccattgatg16140gaatctggcttggattctctgtcggccgtggacttccgcaaccaagtggccaagactctc16200ccaggactgaagctccccagcactctgatgttcgactaccccaccacgtctgctatcgcc16260aacttcgccgcctctcagctcgccccagccgagagctccaggcaagctgtcgttgccgcc16320cctgctggatcggctcttgagaccactgagcccatcgctctcagggccggtgcctaccgc16380ttccccatcgagggagagaaccttcagcagtactgggatgctttggtcaacaaggttaac16440ggtgtcacagagattcccctggaacgctgggatgtggatgcctacttcgatgccaacccc16500gagacgccaggcaaaatgtacgtgcgacatggctctttcgtcaagaacgccgaccagttc16560gactgcggcttcttcggcctgtcccctgccgaatccaaggttatggatccccagcagcgc16620ctgctcctggaggtcatctaccggggtttccacgagcacggcttgcgtcaggacaccctc16680aagggcatggacggctgcatcgcggtcggtcagtgcaacaacgattggggacacatggga16740ttctctcccgacgaagctgatgtgattggcccatacacaggcttggcggtctccacctcc16800atctcctccaaccgagtctcctacatcttgggcttgaagggtcccagcttgactgtggac16860acggcctgctcgtcttctttgacagctgccgacatcgccatctcgaacttgcgccgccga16920aggtgcgagatcagtgcagcggcaggcgtgaacttgaacctcatccctggaccgttcatc16980gcttgctccaaggctcacatgctctccgaggatggcttctgcaagaccttcgatgcgtct17040gccaacggctacgtccgaggcgaaggctgcggcgtcgccattcttcagcgcttggctgat17100ctcggcacaggcaagagcgccctcgtcgttgtgcacggctctgccgtcaaccaggacggc17160cgcagctcctcgcagacagcgcctcacggtccttcccagcaggacgtcatcatgaccgca17220gtgaacgaggctggacttctggcttcgaaggtcaacatcatcgagtgccatggaaccggc17280actgctttgggtgaccccatcgaggttggagcattgaagaacaccctgggcgagggacgc17340gaggagagcaaccctcttgctttggctgctgtgaagagcaacatcggacacttggagggc17400gccgctggcgttgctggactcttgaaggtcgcctgcatgctgcccaggaagcaggttcct17460tccaacttgcacttcaaggagctgaacccccacatcgacttggacgacttcccttcgacg17520atccccacggacgtggtcagcatcaagcaggcaggagtgctgtctgccggcctctcctcc17580ttcggcttcggaggcaccaacgctcacatcgtctccaagcagttcgaaggcgagcccgag17640agccagccccaggagctcacctacactcgacagagcttcgcctggcagcagacgcgccac17700acgctgctcgccaagcgcttcaagaccgccgagaacgtgcaggtcttcagtgcgcccttc17760caaggccgactgctgcagttggtctcccaccacatcatcttcggagagatcgtcgtgccc17820ggcgcaacctacctggaaatggttttggcagctggagagttccacctgggtggcaagggc17880accgaatggtacatcaagaacgtcggcttccaggcgcctttggtgctgaagaccagcgac17940accggcaagctgagccgagagatcgacctctacttggaagtcttcccagacgggcattgg18000gccatgagcagctgggatgtcgcccagcagcgcaaggccgccacccactccgagggagaa18060gtcgaattcaccggacgggccgttgcggacaagcagaccatcgacatcgaggccgtcaaa18120gcgcgctgcgacgaggacgtcgtgctggagcgcctctacctccccttctccaagatcgga18180ctgcctctgcagcctcgcttccgaaccgtccgccacatcttgcgcggcgacgacgaggtc18240atctgcaaggtcgaggccgagaacgacagcaccaaccagggcttcctcttcaacccggcc18300gtgctcgatggaaccttccagggaagcatggcgctcatgctcgcgcgccgcgccacggag18360gttgacgacttgaccagcttgaggattcctctgttgtgccagaagatcaccaactactct18420cagggccactcgacaagcatctgggtcaaccactctctgcgagagatcaccgacaaggaa18480aattgcgtcgacgccaagatctgcaaggacgatggaactgtgctcttggccatggacacc18540ctcaaattccgagaggtccgccccgagcacatccagaagatgctccagcaggccaccgag18600gacaacgagcaggacgtgctcgagcaggaatggaccactttggaaggcaagctgggcaca18660gctggtcctctcagcggcaaggtcatcttcgtgggcgcttcggcagccatggagaaagct18720ctccgagtcaagtactccagcgcctctttcgtgcgaggaggagaggacttgggagattgc18780gccaaggccaagatcgtctttgtcgaggccctctgcgaggaggctggcgaaatggaaatc18840atccaccacgccatgctgctggttcaggtcgtgatgaagatggccgacaaggactccgac18900accgcccccgccctctggtggatcactcgaggcacccaggccgttggagcatgcagcagc18960tacgccactgcaggactttggggtatggctcgcaccgccaggctcgaggagaggagcctc19020aagctgcgctgcttggacttggacaccacccaaggcacagaggaggcggccgaggctttg19080tccacatggctgggcactttgagcggcaacgccaatgttgatgctgaggctgaagttgct19140ctcaggatcgccgacggtgagaccaaggcctacatcgcacgcctcgccaggagcaacact19200gaggtgaagaagccgatgcagctgaagatgtcgtctcgcggctctttggccaacttgcga19260cctgtcccccagaccaacaggcgtgcccctggagccggagagtgcgagcttcgagtgcga19320gccatcggtctcaacttccgagatgtcctcaacgtcatgggcatgtaccccggcgaccct19380ggaaaccccggcggcgattgtgccggcactgtcactgccatcggcgagggtgtcgagcac19440ttgcgccctggcatggatgtcttcggcatcgcctggggcagcttgcagacgtacgtcacc19500accaacgcgctgctcatggtcgagaagttcaaggactggtctttcgagcagatggccgcc19560tggagcgtcactttcgcgaccaccgaggaggccttccaagagctggctcctctcgtgaag19620ggcgagcgagtcttgatccacgctgccaccggcggcgtcggcctcgtggcggttcagttc19680gcgcagcgcgtcggtgctaccatcttcgccacttgcagtgcctccaaggtcgagcacctg19740aagggcatgggcgtgaagtacatcaccaccacccgcgacggcgccgcattcgaagcggac19800atgcagaagttcctgaaggaggatggtgctgatggcatcgactgcgtcatgaacagcttg19860agccacgacgactacatccctcgctccttgaagctactgaagaagggtggccgcttcatg19920gaaatcggcaagcgtggcatctggactcatgagcagatggcccaagagcgacccgacgtc19980atgtacgagaagatcgccatggactgggtcatggagcaccagccggagcgctacaacagc20040ttgatgaagcgattggtcgagcagatcggcaagggctggtgggcaccaatgccaacaacg20100cccttcgtcggcttggagaacggagtggatgccctcaggtacctgcagcgcgcccagcag20160atcggaaaggtcgtgctcactcagccctctcgcatgtcctgcgagcaggatggatgctac20220ctcttgtctggcggcgtcggcgccctcggattggtcactgctcagaccatggccgaggag20280ggagcgaagagcttggtcctcatgtctcgtcgcggcgccattccttccgacctggaagca20340cagtgggccaagctgcagcagttcaaggtggacttgcacttgaagtcctgcgacgtcgcc20400aacatggacagcgtgcagctcatgctcaacggcctcaagaaggagctccccacgaagacc20460gtcatccgcggtctcttgcaccttgccgccgtcctcgacgacgccacgctgccgaagctc20520acccgaagccacttggagaaagcctacggagcgaaggtctacggagccaagcacttgcac20580accgccctcgcctcagcgaagacgcctctggacttcttggtgctcttctcctccactgcg20640ggccttttgggctcccccggccaggcaaactactccgctgccaacgtcactttggacgct20700gctgcgaactgctggcagggacgcggagagaaggccgtcgctgttcagtggggaccttgg20760cgtgaagccggcatggctgcccagaagggcaccgtggagcgactcaaagctcagggcttg20820ggaagcttgggcaacgtcgtcggcatgtccgtcctcgccggaagcttgggcgccaccgca20880ggcgtcgtcgccgcctgccctgtctattggggagtctacctcaagcagttcggctcttcc20940gtgccgaggttcttgtcccgattccagaaggaggccggcgccggcagcagcggccctcgg21000cccatcacgggccagcaggatcgcggcttgtccatcgcccctgcggacgtcaagaacttg21060gtgcacaccatcgccgtcgaggtgatgggcagcaccagcgtggacgacaccgaacccctc21120atggaggctggcatggactccttggccgccgtggagttccgaaaccgcctctcctctcag21180ttgcctggcatcaagctccccaacacgctcatcttcgactacccgacggtcaacgccatc21240ggagactacgctgccgcccaagtcgttcccgtttctggcggcgcggagcctgcaggcatc21300tccttcagccgcagcgacgtcgagcagttggtgctctccacggccatcgaggtcatggga21360agctccaccgtggacgtcagcgagcccctcatggaggccggcatggactccctcgccgca21420gtcgagctccgaaaccgactttcctcgcagttgcctggtgtcaagctgccgaacacgctc21480atcttcgaccacccaactgtctccgccatcaccgacttcgctgcctctcagatcgcccct21540tcggcaggctctcgaggcgcctctgccgccctcggcggagcgacgcaggagaagaagctt21600ctggacgtccgcggcatgtcttccatcttccccggaagccgtgacgcagcctactggaag21660gactttgtggacaagaaggacagtgtcatcgagatcccttacactcgctgggacgtggat21720gcgtacttcgacaaggaccaggacgcacctggcaagatgtacacacgacatggaggcttc21780attgacggcgccgagatgttcgacgcaggcatgttctcgctctctgcggccgaggctgcc21840atgatggaccctcagcagaggttgatcttggaggtcaccaacaccgctttcaacttggcc21900ggtcgggacaaggcaagcttgatgggcgccgacgtcggcgttttcatcggtcagtgccag21960tacgactggttcgtgatgaagagcgctggagaccacttcaacacctacacaggcaccggc22020atctctgcctccatctcctccaaccgaacttcgtacatcttcggcttcaagggccccagc22080ctcacgtgcgacacggcctgctcttcgtccttggtggcgatggatgccggctactcctcc22140atccagaggggcgtgtccgagatggccttgatcggaggaaccaacttgatgttgcagcct22200tctccttacatctccttcagcaaggcccgcatgctcagcgaagacggacgatgcttcacc22260ttcaacgccaccgccaacggctacgcccgaggagaaggcgtgggaggcatcgtcgtcggc22320gtcgcgggcgacgcctcggccgatgtttctgccatgctgcgagccaccgccgcgaaccag22380gacggccgcagcgcatccctcacagcgcccaacggaccttctcagcaagccgtcatcgct22440cgggccctcatggagggatctatcgctgccaaggatgtcaacgtcgtcgagtgtcacgga22500acaggcactgccttgggtgaccccatcgaggtggatgccctcaagaacaccctcaacgtc22560gacaggagccagacgctcatgctcacctcggccaagaccaacatcgcccacttggagggt22620tctgccggcatcgccggcttcgtgaaggccgcctacatgatgcgctatggccagtgcccc22680agcaacttgcacttcaaggaactcaaccctcacatcgacttggaggacttcgactgcgag22740atcgccaccgaattgaagcctttggcaggcaagccagtggccggcctctcctccttcggc22800ttcggcggcaccaacacgcacgtcgtcctcagctcctccgagacactcggcacccaggcc22860gcggaagaggccccgaagcagatcaccttcactcgccagtccttcccctggaaggatcgc22920atctacaggttgctgccaaagagactccaagaaggtcgggacacccacttcgaggtggcc22980atcaagaccgatgtcttcaacatctgcgccgagcacgtcgtcttcaacgagatcgtcgtg23040cctggtgtcgtctacactgagatggccatcgaggccactcgcgtcatcatcggcaaggag23100gctaccctgaaggacttgaccatgacttggcctctggtcgtgcccaagaacgctgacgga23160cccaacgccaccacggtctggctgcgcttcgcgcagatgggctccgagaagttcgaggtt23220cgcagccgccgcggcgacagcgacgagatgatcacacattgcgaaggccgcatcggccga23280agtttgtcggagcctggtgtcatggacatcgccggcctgcagtctcgttgcgaccgcaac23340gtcgaccccaaggacgtctacgcagccatccacaagggaggtctgtacttgggaccaaag23400ttccaggtctgccgccacatgatcaggaacgacgaccacgtgctctgcaagctcgtccac23460tccgacgagtgcggaccgaaccagggctacttcatgcaccctggcatgttggatggaacc23520atccacactctcggatgcaccatggtcggctgggacgccccgctcaaggtgttcgccggc23580atcggcaagctcgtcatcaaggaccacacagacttcagcaggaacgagtcctactggtgc23640cacctgcacctcaagaccttctccgagcaggaacagatcttcacgtccaccgtcgccaac23700gaggagggcaacatcctcttcgtcggcgaggacgtctccttcagaaaggtcacgcccgag23760cagatccgaaaagccatggagagccaggccgccgaggacgaccagaagctctacgaggtc23820gagtggacatctctgtccacagcggccagctccgaggaggacgaggacgccaagtggttg23880gtcatcgcagagaccgacagtgtcctggcagatttgaagaaggagttcggagaggcccac23940acctacaccaagttggcgggcgcagacctcggcgagatggagaactacagcaaggtcgtc24000agcgccatcggcctcgagacctccgtgaattgcttggacggcttggaccacgccctgcag24060ctgatgaaggcgctgcctaagtctgccagcaccgcacccgagatgtggttcctgacacac24120caggctgtgcaggcagtgaagggagacatgaaggacgccgccatccctgtgcacgcaggt24180ctctggggtctgtcgaaggccttccgcgcagagttccccgaactcaaggtggcttgcttc24240gacctggagggcggaaagatcacttcgctcaaggagaagttccagcaggccttggatcag24300gccgccgcctccttcgaacccgagctcgcgctccgcgctggctcgctctacgcacctcgc24360ttggtggactccacgaccaatttggaagcgaaagccctggacatcttcgacgccgacgcc24420tcccacgtcatctccggcggcaccggcgccttgggcttgctcaccgcgaagtggatggcc24480gagaagggcgccaagaacttcgtcctcgcctcccgaagcggcaaggtgcaggaggacgcc24540caggccatgttcgacgaggtctcctctgtcgccaccgtcaagaagctcaacatgtccagc24600ttggacgacgtcaagcgcctcttcacggaggtcgcgaagtcgatgcctgccatcggtggc24660atcacccacgccgctggtatcttggacgatcacctcatcgccgacttgcagaggtcgcac24720ttggaggcagtcttgggcgccaaggtggacggcacattgaacttgcacgagggctcgaag24780gacatgaagttgaagtacttcagcatgttctcctctttggcttccttgattggtactgcc24840ggccaggccaactactgcgctgccaacggcttcatggacagcttcgcagcataccgaatc24900gactctggaaagcccgccgtcgccattcagtggggaccttgggctgacattggtatggct24960gctcgcgctggcacttccgagagcgtggtcttgaggatcgacatcgaggagggtctccgt25020gctatggaggttatcttgagcaactctggcgacttgatgaccggcgccattggtgtggcc25080cgaatcaagtggaagtctttcttggcccagatgcctgccctgccgccattcctggacaac25140ttcaagcagttcaagaaggacgctggcaagaagtcggctgtcgctttgggcgccgcacct25200tccaaggacgtcgtccgcggcggcatcgaaaacatcctgaaggaggtcttgggagacgac25260actttggacgacttctcctcccctctcatggatctgggtctcgactccctggctgccgtc25320gagttcagaaacagagttcagtccgccttcgatggagtccgactggcctcgaccgtcatg25380ttcgactaccccacggttgccgacctcaccgacttcatcctgtcccagttcgcccccgag25440gaggacgaggtcgccggtggaggcttgggagatcccgccgcgagccttcgggactcgatg25500gccgttatcggcgtctcgggccgctacccaggcatgtctttcagcaacgacttggaggag25560tattggacagccctctgcagtggaaacgaccccatccaagagatccccatcgaacgcttc25620gacgtggacgagatctacgacgaagatcgctcggccccagggaaagtctacgtccgcaac25680ggcggcttcatccagggcgtccaggagttcgacaacggcttcttcggcatcgccgacacc25740gaggcgaaggccatggacgcgcatcagaggctgcagttggaggtcgcctacgacagtttc25800cacctggctggcttcaacaaggagtccctgagtggcatggaggttggcgtctacgtcggc25860tgctgcactttgacaggtatcgatgtggagtctgacgacatcggacctttcaccaacatc25920ggtgccggcatcagtggcctctccggccgcatctcgcacgccttgggtctgcgcggtcca25980tgcttcgccatcgacaccgcctgctcctccacgctcgtggccttggactgcgcggcgcag26040gccagcagattgggacgacaggaaatggcttgcgtggcaggaacgaacctgcagttgcga26100acggacatgtggatcggtttctgtaagatgactggtctggctgccgatggccgctgtaag26160actttcgacgtctccgccgacggcttcgcgcgatccgagggctcaggctccatgatcctc26220cgcatgcgcgcccacgccgaggcgaagggagaggcctctgtgatgatggtccgaggcacg26280tgcgtgaaccaggacggccgcagcgccaccatcacggccccgagcggtcctgcacagcag26340cgagccttggccgcctccttgagggacggcgacttgaaggccctggaagtctctttgatc26400gaatgccacggaaccggtacctccttgggcgaccccatcgaggtcggagctcaagagaag26460atctacggcaaggagcgcatggagcaggacacgatcgtcttggcggcggtgaagtcttgc26520atcggccacttggagggcgccgccggcgtcgctggcctcgccaagctcgtgaagatgata26580gagcacaagaaggtgcctccgaacttgcacttgaagagcatgaaccccaacatcgacatc26640tcgaacttccctgtcaacatcccgaccagcggcgccatcgactggagcaaccctggccca26700gtcaaggctggtatcagttctttcggcttcagcggaacgaactcgcacgtcaacaccgag26760gagccctccaacgccgagggcgtcgagcctcccaaggtccagcctctcgtctggcagcgc26820cgggacctctcctaccgcgactggacgaagggtctcttcaccagcatcgagtggaagcct26880gctgccatcaaggccaccggcaagatcgatgctgctgccaccctcatcattggcggcggc26940gacattgccaaggccctggccgagatcatccctggctgcatcgtcgtcgcgccgggcaag27000gcggccaagacctcgggcgacgtctacagcatggacttcaccaaggccgaccaggtgtcc27060gaggttctggacaacaaggagtggagcaccgtcgtcttcgccgaatctttggtcgccgac27120gaacccaccctggagggccaggccgtcagcggtctcctcctcactctccaagccatgtcc27180cagtggaagcgctccgccacgctcgtggcattgacggcaggtgctcagactgcggaagct27240ggcggaaagatgggtgtcggagttgtgggagccgcagtgtggggcttcatgcgctccgtg27300cgcctggaggccgcgaacgtggagcctcgcgtcatcgacttcagcgccgacgcgaccagc27360gatgcctcggctttggctacggtcatcagcgaggagctcgcggccagcgacgctgagatt27420gcgtacgtcaacggcaaccgctccacccctcgcttggtcgccaccaacgtcaagaacggc27480ggcaagcccgagggcatcgaaggaacctacctcatcaccggcggctttggcggcctcggc27540ctcgtcatcgcacagcagttggtggacatgggagccacctctgtggccttggtctcccga27600agtggcaagacgcccgccggcgacgagaagttggccgagatgctggagcaggtccagtcc27660tcttccgccaccgtccacgcctgggcctgcgacgtctccgactcgaagagagttgcagac27720ttggtcaagaagtcgaagaaggagctcagtgcggaccatcccctcagcactgtggtgcac27780gccgctggcatcatcgaccactgcgcactggccgacctcaccgtcgacagcattgccaac27840gtcttcaagcccaaggtcggcggcgcctggcacctgcacagcgccaccaaggacgacggc27900ctcaaagacttcgtgctcttctcctctgtcagcgccctcatcggcctcagccgaggagtc27960acgtactccacctcgaacgccgccctcgatggtctcgcgctctggcgacgggccgagagc28020ttggctgccacaagcatccagtggggacccgtgtccgaggtcggcatgtcgacgaaggcg28080gaccacgcggcctccgcagacttcgccctcaagatggtcacccccaagcaggtccaggcc28140gccttccagcgcctcttgtccgcgcctccgaaagccacatccgtgctcttcgcccgcgcc28200gactggggcaagtacctcgaacagatgggcgtggacgtccctgtgcttgcggactacgcc28260tccacagggggcgcggctgcgggcggcgccactgccagcagcgctttcagcggcatgagc28320atcgacgagatcgagagcaaagtcacggagatggttgtggactgcgtccgaaccgtcctc28380ggcgacgattccgtcgaagccgagtcccctctcatggagtccggcctcgactcgctgtcg28440gccgtggacttcaggaaccaggtctcgaagcagctgccgggcctcaagttgccgaacacc28500ttgatgttcgactaccccactgcaggagccatcgccggctacgctgcctctcagctggca28560ccggcaacaagctcgggaggagcagctcgcgccaccactcagatcgtctctgcggccgaa28620gctcgcggccctgtctccatcttgggcatggcctgccagttccctggagatgctgactcc28680ctggacaacttctggaacgtggtcgtcaacaaggtcgactgcgttggcaacatcccgccc28740gagcgatgggatgccgacgagtacttccaggagggcggcggcgtcggcaagatgtacgtc28800aagcaggccgccttcgtccgcgacgtcgagtccttcgacgccagcctcttcgccatctct28860tctgccgaggcctacaccatggacccccagcagaggatgctcttggagaccgtgcacact28920gcttggcagttgggcactggcggaaagaaggtctctttggacgtcggaagcttcgtcgga28980gagtgcaacaacgattggggccatttcaagaatttggaggtcgaaaagatgaaccccttc29040agcggaaccggtggatccatgagcatctctgccaatcgtctggcctacgtctttggcttc29100aagggcccgagcgtcacgtccgacaccgcatgctcctcgtccttggtggcggtggatcag29160gccgtttcgaacctctggcgtggacgatgctccgcctccgtcgcggccggcgtcaacttg29220aacctcatcccaggacccttcgtggcctgctgccaggcccgcatgctcgcagaagatggc29280cgatgtaagacgttcgacgccgcggccgacggctactctcgaggagaaggttgcggcgct29340atcgcgatccgcggccagagctccactgagaacgccgcgagcttcgtcgccgttgtggga29400accggtgtgaaccaggatggccgcagctccagtctgactgcgcccaacggcccctcacag29460caggaggtcatcaacatggcttggcaggaagccggcattgcacccagcgccgccgacttc29520atcgagacccatggaacgggcactggcttgggcgatcctatcgaaatcggagccctcaac29580aacaccatggcagagggacgaaccagcgaggtcgtcatcggagccgtcaagaccaacatc29640agccacttggagggcgccgccggcatcgctggcttgctcaagggcgccatggtgctcgag29700aactgcaaggtgcctccgaacctgcacttgaagaagctcaacccccacctggacgtcgag29760gacttcgacgtctccttccccaccgagttggtcgagaagtccagagagcagctcaagagc29820tctggtctctcctccttcggcttcggcggtacgaacacgcactgcgtcaccacggccccc29880acagagggcaaggtcgatcagcagcaggaggctgttgtcttcaacaagcagcgtttcgcc29940tggtctcaggtcaagcaccctctctcggtcgtcggccgcaagggtgccgaccccaacctt30000actgtcttcactgccccgatccgaggaaaggtggttcagctcctatctcaccacatcatc30060tacggcgagattgtcgtgccgggcgccacctatttggaaatggtcatcgccaccactgct30120ttcaggctcggcaaggacggcaccaagttctccgtcgagggtgtcggcttccagaacccc30180ctcgtgttgaggactgccacccccaccgagctggagcgaccgattgaactgaccctgcac30240atgtacgacaacggcaaatggtccatgaacagctccgaagccggcgaggtcctcgccacg30300cacgcggagggctccgtgagcttcgcgaacccgacgcctgagaagaaaatgctcgagctg30360gaggagatcaagagccgctgccctgaggttgtgcaagacgagcgcatgtacgttcccttc30420gccaacatcggtctgcccctgcagccccgcttcaggactgtccgaaccatcgaccgcagc30480tccgacgagatcatcgcttgggtcgcagcagaagaggacggcaccaatgccggcttcatc30540ttcggccccgccgtcatcgatggatccttccaggcctcctgcgccttccagaacctggag30600gccctgcccagcttgcgaattccgctctccatcgacaaggtcacgatctacggccagggc30660tacagccagaaggtctgggtccaccacaagctgctcgagaacaccgagaagaccatggcc30720acgaacgtgcagttggcgcgcgacgacaagacgatcatcttgaccatggaccgcatgcgc30780ctgcgcgaagtcaggcccgagcacatcgccaagatgctggcccaggccgcaggcgacgag30840gacgaggacctgttggaggtcgagtgggctgccatggacaccaagaacgctaaggccgtc30900gaattgggaaagaccttggtcatcggtgccaacgatgctctcaaggaagccctcagcaag30960gagatcaagacagccaccttcgcagactctgcagaggccctcgccgaggccacgggcgtc31020aaggaggtgctgttcgtcggggcgctcgtggacagcgcaccagagatggaggtcttgcac31080accgcgctctccctcgcccaggaggccatcaagttcgccgccagcaagaagaaggagagc31140cctcccaccgtctggtgggccaccaagggcacccaggcggctggcttgggcgacagctac31200taccatgcgggcttgtggggtctggccaggaccttccgcatggaagagcgttcggtgaac31260ttgcgatgcttggacttggacatcagcatgggctcggccgaggccgccgcggccgccctc31320aaggaatggctgcctctgctctccgccgccaacttggtcggcgagaccgaggtgactttg31380aggcccaaggaagacagcaaagagatggcgccgctggtgtctcgattggcgaccagcacc31440gccaagtcccagaaggccggcatgctgatgatgtcctctcgaggaagcttgtccaacttg31500cgacccgtgctccaggagagtcgacccaagtgcggacccaacgacgccgaacttcgaatt31560cgagccgtcggtctcaatttccgagatgtgctcaacgtcatgggtctctaccctggcgac31620cctggaccacctggcgccgacacctccggcaccgtcctcaccgtgggaggcgaagtcagt31680cacatccgtcctggcgacgatgtgttcggtgagtctcctggttgcttgaggacctacaac31740gccggcccagccccgctgctcacgcagaagcctcctacctggagcttcgaggatgcctca31800accatgcccgtgatcttcgtcaccgtcgaggagtctctcggagacctggccaagctgaag31860aagggcgaaatcgtcctcatccatgctgctgcaggcggcgtcggcttggtggccatccag31920tacgctcagttcgtcggtgcgactatcatcggaactgccggatccgaggagaagcacgag31980ttcctgcgcaacttgggcgtgaagcacatcaccagcacccgaaatggccagaagttcgag32040gacgacatgaagaccattctcaaggagttgaaggtggatggcatcgacgttgtcttgaac32100agtttgagccacgacgactacatcccgagatccctggcattgctcaagaagggcggacgc32160ttcatggagatcggcaagcgcggcatctggagccacgaacagatgttcgaggcccgacct32220gacgtcatgtacgagaagatcgccgccgacaccatgatggacttggaatcctggaagtac32280aatgcctacatgaaacgcctgctcacccgagtggaagaaggtggtctcgtgcccatcaac32340aagcacgtcttcacggacatcgagaagggagtcaccgccatgcagttcttgcagcgagct32400cagaacatcggcaaggtcgtcatcgcactgcccagccgaatggattgcaagccagactcc32460gagtacctgctctctggtggtatgggagcattgggaatggtcaccgcccagtacttggtc32520gaggaaggtgcaaagcacatcacgctgctttctcgaagcggcaagccatccaacgacgtg32580ctcgacctctgggagtggctgcagaagagcagcatcaacgtctctgcgaaggcttgcgac32640atcgcccagatggacagcgtcaccgaacttgcggttaccttgtccaaggacggccagaag32700cgcagccccaagactcatgtcggaggcgtcatccacttggccgccgtcctcgacgacgcc32760actctccccaagctcactcgaggccacctcgagcgctcgttcgcagccaaggtttggggc32820gccaggcacctccattgcgcctacgccaaggagttggacttcatgctcctcttctcctcc32880acctcggcgctcttgggatcgcccggccaggccaactactccgcttccaactcctctttg32940gacgcccacgcccgctactggcgccagagtggcatgcaggccacgagcgtgcagtggggc33000ccctggagggaggtcggcatggctgcgcagaagggtaccgtcgagcgcttgcgccagagc33060ggtgtcggctctctcaccaacgctgcaggcatggccgccttggccggtgccttgaccgcc33120agctgccccaccatcgtggctcagccgatgaggtgggccaactacctgaagcagtacccc33180aagatcccccccttcctgtcccgcttctcggccgagctcaagacgaagaagccggctgct33240cccgcccgaccggcccagggcatgatgatgatgcagcaggccgccccctcggctcctgcc33300atcagcgtcaccgacctcaagagcatgctccagcagatcgccagcgatgtcgccggcggc33360ggtgttgtcgacgaggacagccctctcatggaatctggcatggactcgctctccgccgtc33420gagttccgcaaccgcttcacggccaaggtccctcagatcaatttgccgaacacgctcatc33480ttcgactaccccacgatctctgccatcgcggacttcgctgtcggccagatgggccccgcc33540accgcggcccctgccggctacgccatgcaggctgcccctgcagcacccggcatgactgct33600gacgcgatcatggagttgctgaaccgcatcgccaccgacaccaccggaggagctgtcgag33660gtcgacaagccattgatggagtctggcatggactccctgtctgctgtcgagttcaggaac33720cgcctctcctctgagctcccaagcttgcagttgcccaacaccctcatcttcgactacccc33780acgatctctgctgtcgcagactacgcggtcgagcaattgggcgccagcaccgtggctgtt33840cctactggcggcgcaatggtgccaatggctgctggagcctcttctggggccttcgacgag33900cctttggccatctcaggcaccgcctgccacttccctgccggctcgacgggtccgaacgtc33960ttctacaagcagcttgcgcagggcgccgacggcatcgtcgaagtgcctttcacccgctgg34020gagctcgaggaggtttacgaccccaaccccgacgctcctggaaagatgtacccccgacac34080ggagccttcattcagggtgccgagcagttcgatgcttccttcttcggaatctccgcacct34140gaagctcgcgccatggatccccagcagaggctgttgttggaggtggcctacgactcgttg34200gtcgactctggcttcaccaagagctctctgttgagtagcaacatcgccgtcttggtcgga34260caggcgaacaacgactggatccagatgcagagttgggacctgaagaaggtgaacccctac34320actgccactggcatgtccgcttccatctctgccgcccgcatctcctactccttgggcatg34380aagggcgcaagttacatcatcgatactgcctgctcctctgccttggtggccttggatgct34440gccgccgtgaccttgcgccgaaccaggtgcaccgctgccgtcaacgcggctgccaacgtc34500atggtgagtccttccacctacatcagcttcagcaagccgcgcatgctctccgagtcaggc34560cgctgcctcaccttcgaccagagcgcgaacggctacgtccgaggagaaggaggcggctct34620gccgctctcaggctcgtggccgatgccggcgacttcgctcgctccatcgttcgcggcgtc34680tcggtgaaccaggacggacgaagctccactttgaccgcccccaacggacccagccagcag34740atggtcatgatggccgccctcaacgaggcgaagctctcacctcagagtgtcggccacctg34800gagtgccatggcactggcacgccgctcggagaccccatcgagttgggcgccttgcaggcc34860gtcaacgcaggccgctcggagaacgtccctctggtcctcgctgcggtcaagaccaacgtt34920ggtcacttggagggtgccgcagcatccaccggattgatcaagatcgcctctgtgctccag34980catggggcagccaagccaggcatccacctcaagaccctgaaccccaacatcgccgcgctc35040tccgcgctgcctgccgtcttcgccagcgagtccctgcccctcccctcgggtggtgcctac35100aggactagcggcctctcctccttcggcttcggaggaacgaacgcgcactccgtgaccagc35160gaggccgaggtgcccgccgagcccgtgcgaaccgtgatcccaggaaaggagtacaagagg35220aaggccttcccttggagggaggtcggcttcagactgctccgctcctcgccttccgacaac35280gtcttcgaggtcgtgatgatctccgacgtctacgacgtcgtgagccaccacgtcgtcttc35340agctcgatcgtcgtgcctggcgtggtctacgtggagatggccttggaggccactcgcaag35400atcttcggccacggtgcgaagctcacagacttcggaatggtcttccccttcgtgatcccc35460ttccgcaccacgggcgtcgagcctgccgccacgatgcgcttcgtgctgcgcggcgagtcc35520cgcttcgagatccagagcacctcggccacaggggccgtgacggtccacgccgaaggaggc35580atcgacagatcgcccatgaaagatccttccagggcggagcctgtggacttggacatggtc35640cgcaagcgagtcacagaagagattccggcaagcgtcgtctacggggccatcgacggagtc35700ggcttgtggctcggacctatgttccaggttgccaagcagctctggcgatatgaggaggga35760gattccatcgaagtgctcggccgattggagttggacaagacgatccccaacgaaggctac35820gttgtgcaccccgccctcttggatggaacgatccacaccttgggaaccgcctccatcggc35880aagaacgtgaacgacttgaagatctttggaggtgtcggtcgcgtcacaatcgtcgaggag35940agcaatttctcgaaggccgacgagtactggatttggatggacattaaggagaagttggag36000gcctctgagaccttcgacgttcgcgtgatgaacagctccggcaaggtcctcatgttcatg36060gacgacgtcgtcttcaggaaggtcttgcccgagcagatccagatggcgatcgccgcccag36120agcgcctccgaggacgctcagaagctctacgaagtggattggactgctgccgaggaactg36180gaggaagtcgccgaagaggacgacggacagtggctggtcctcgctcccgaggaggccgct36240gcgaaggaactgaagaaggagcttggcgacaagcacgactacaagaagctctcggaggcc36300cccaccgaaggcttggagaaatactccaagatcgtcttggccgcggagagcgagcgaggc36360acccctgtcgatgtcctcgacggtgctctcaagctcttccagtctttggcccatgctcag36420gagggcacgcccgagacctggttcttgaccgccgccactcaggccgccgcctccaacgag36480gacttgaagggcgctgcgatcccgaccactgctggcttgtggggtctctcgaaggccttc36540cgcaacgaacaccacgacgtcgagatgggcatcttggatctggcctccagcggcgatttg36600aagaaacctttgaccgagaagttgaccaatgcctccgccctcatgaaggccaagaaggat36660gccgaggtcgccgcgcgagccgacggcttgatggtgcctcgattggtggagtgcaccagc36720cgcatgccggtccaggatgtcagcttccccgaggatggaactttcgtcatcagcggtggt36780gtcggtgccttgggtctcgtcttcgccgaatggatggccgccaacggcgccaaacatttc36840gcgctcatgtcgcgaagcggcaagccccctgcagaccagaagagcacgctcaggaagttg36900agctcggtcgccactgtgaagaagtgcgacatcgcctccaaggacagcgtgcttgctttg36960atgaaggaaatcgctaaggagatgccccctgtgaagggcgccatccacgctgcaggcact37020ttggccgacggactcttggtcgacttggaccgcgagaagttggaagccgtttgcggcgcg37080aagatcgacggaaccctgaacttgcacgaggccctcaagagcgctccattggagcacttc37140tggctcttctcctccgtggccgccatgatcggctcggtgggtcagggcaactattgcgca37200gccaacgccttcatggactcgttcgctgcctaccgatcggcgcaaggcttgcctgccatc37260agcgtccagtggggtccttgggccgacgtcggtatggccgctcgggccggcaccagcgaa37320ggcagcatcgccaggatcgagatcgccaagggcttggaggccatgcagtccatcttggga37380gccagctccaacttgcacggaggcgtcgtcggcgtcgcccgcatcaagtggaagatgctc37440ctcggacagatgccaaaggtcccccctctgctcacgaagttcagcgccgaggccggaggc37500aagaaggcctctgccgtctcgatggctggcatcacgcaggacgacgtgcagaacttggtg37560gttggcgtgttgaaggacgtcatgtccggagacgacatggagctcgacctcagctctcct37620ttgatggagatgggtctggattccttggccggcgtcgagttccgaaaccgcttgcaggcc37680tccttcgaaggcctctcgctctcgtcgaccttgatgttcgactaccccacggtgcccgat37740ttggtggacttcatctggtcccaagtgggccccgccgaggacgaggaagttggtggcgcc37800gtcgctggcggcgacgctggcggcatgctttgcctgtccggctatgcaggacgattcccc37860ggaagccacaccaacgacatcgaggagtactggcacactctcagccacggtttcgacacc37920accaccgagctgccgcctgagcgatgggacatcaacgcctacttcgactccgacatcgat37980gcgccgggcaagacctacgtcaagctcggtcacttcatccctggtatcgaccacttcgat38040ggtgagttcttcggtgtttcggacgccgaacagcgagccatggatcctcaccagtggttg38100gcattggaaatttcctacgaaggcttgtacgctgcaggcttgaccaaggagaccatgtct38160ggcatggagtgcggcgtctacgtgggagcctgtaatttgggtggaaacgacgtggacttg38220gaagcactcggacccttctccaacatcggtgccgcctactctggctgctccggccgtgtc38280tcgcacgtcctctctcttcgtggtccttgcttcaccgtcgacaccgcttgctcctccacc38340atcgttgccctggactctggttgccaggccgtccgcttgggcaagtgcaagagcgccctc38400gcctcgggtgtcaacgtgcagattgccgcttccatctggatcggcttctctaagatgcga38460ggtttggccatggacggaaggtgtaagactttcgatgcccgcgcagatggcttcgcccga38520ggagaaggtctcggcgccgtctacatccaggccgcagccaattgcactgatgcgaaccct38580gcgatcgccatgatcaccggctgctcgaccaaccacgacggccgcgccgccaccatcact38640gcgcccaacggcaccgcccagcagcgcgtcctgcgctccgccttggcggagcgaggcacc38700ttggccgaggacgtcgcctgcatcgagtgccacggtactggtaccgccttgggagatcct38760atcgaggtcggcgcccagaaggctgtctacaacaagggccgcagcgccgctcgtccgctc38820gtcttggccgcaggcaagtcggcgatgggtcacttggagggctctgccggcgtcgccggt38880atctgcaaggtcatctgcaccttcaagcactctgctattcctccgaacttgatgctcgag38940aagctcaaccccaacatcgacctctctggcttcgacgtcttgatgcctgactccttggtc39000gactggaaggctgtgcctcgcgcgggcgtctcctccttcggtttctctggaaccaacggc39060cacgccatcttggaggcccctcccacccccggagaccagctgcccgagaggaagattcag39120aagttcaaccgttccgtcaagccctggcaccagtggctcgagaacgtcctctacgaagag39180gcctggaacacttgcgagttggtgcccgtcaccgccttcgatgcttcttgcatcgtcgtc39240ggcagcggcagcatcgccgaaaagatccgaaagctggccaaggcctccacggtcgtccct39300gcaggcacctccgccaaggacgtttctgctgccatggataaggccaatgctcaggtcgcc39360atcttcgccacttccgcggacgagccggatggcgagatcccaggcgcccgattggtcgag39420ctcctctccttcttgcagggcgcccagagcgcctcggagacacccaagatggtcgtcgtt39480gtgaccaagggagcccaggatgccagccgacccaaattcgatgctggcgccactctctgg39540ggtcttgtccgctccgcgcgcatcgagatgccccgaaccaccatcaaggccatcgacgtc39600cccgtcgacgccgccgccgacgccgcagcaaagatcgttgttgaggagttggccgctgca39660gaggccgaggtcgaggttgctcacattgcaggaaagggacgatgcgtgcccgtcgtcaca39720gaggcccctcagacagccaagagcctccagaggcaggacgccatgctggacaagaagatc39780ctcagcgaaggcttgcagatcgtcactggcggtctcggaggtctcggactggtgtctgcc39840aggcagttggctgagttgggcgccacgacagtgatgctcacgagccgatctggcaaggtg39900ccagcaggacaaggattggaagagcacctccgatggttggaggccatccccaccaccgaa39960gtcgtgatcaagaagtgcgatgtctcctccagcagctccgtctctgagctcatgaaggag40020gcgaccgactccaagggacctgtggccggcatcattcacgctgctggagtcctcgacagg40080tgccccttggccgagatggcaaaggagaatttggacaaggtctgcgagcccaaggccagc40140ggcgcctggtacctccacagcagctccgagcagagcgacttgaagctcttcgtgctgttc40200tcgtccgtctctgccactgtcggcttggccggtggagcctcctactctgcggccaacgcg40260tacctcgatgccctcgccctctggcgcagagagaagcccctcgcagccctcagcgccaag40320tggggacctgtctccgaagtcggcatgaccgcggcctcgggcagcgactccatgttggaa40380gcgatggctctcaaggccctctcgccagcccaggttggctccgccatgcgtttgttgctc40440acgcaacagggcgccggtgtgaacttgcgagctgagctgatgctcgcccgcgtgaactgg40500gcggacttcgtgcgcgaggtcggtgtcgagatccctcaagtgaaggagttccagagccaa40560gaggccctcgccgtgacaggcaaggagagcaaggccagcgcgatggccggcatgaccgac40620gacgaccgccaggctgccgtgctgaagagcatccgaagcgccgcgcaaggcatgggcttg40680gaaatggacgatgagactcctttgatggaggccggaatcgactccctgtctgccgtcgag40740ttccgcaacaaggtctcctccgagttccgcgaggttcgtctcccaagcaccttgatgttc40800gactaccccacgctcaccgcgctcgcgcagtacgtctcaggccagttgagcgtcgccgcc40860ggcggccaggctgcctccagcgccgctgctgctgtggcccttccttccaagcctgccgct40920gctggaggaaacatcgctgtcttgggtggcgcttgccacttgcccggagacagctggtca40980ttggaagccttcagccacaccttggtcaagggagtggattgcatcgtggagattccttac41040gacaggtgggatgccgacgagtactacgaccctgaggccagcaccggattgaagatgtac41100gtcaagcacgccggtttcatcgaaggcgccgagctcttcgccgcctcgagcttcaacatc41160gtcaaggccgaggccgagaccatggatccccagcagaggcacctcttggagacctccttc41220gaggccttcgtcgtcggtggcttcaccaagcagtccttgatgggaagcttcacaggagtc41280ttcgtcggtcaggacaagtgcgattggaaccgcatgatcagcggaagcatgggaggtcct41340tacgctgccactggcggctcttcgtctatctcggcgaaccgcatctcctactccttgggc41400ttgaagggcccgagtgcgacaatggacacagcttgctcttcctcgctcgtcgctgcggac41460accgccgctgccacgctgcgaaggaggcgttgcgacatcgcgaccgtctgcggcgtcaac41520atgctcttgctgcctcagaccttcatcgcctgctgccaggcgcacatgctcagcgccttc41580ggtcgctgcaagaccttcgacgaaagtgcctctggctacgttcgtggagagggctgcggc41640gcgcagaccttgatgcaggtctcggacaagcccgcctacgcggagatgtccggcagcgcc41700ctgaaccaggatggacgaagttccaacttgacctcacccaacggaccttcccagcaggcc41760gtcgtgttggctgccttggccgaagctggcgttgctccctcggctttggactgcctcgag41820acgcacggcacgggcacggagctcggagatccgatcgaggtcggcgccctgcaggccgcc41880ttgggcggcgccgcgaggcagaaggccctcttgcttggcgctgtcaagaccaacatcggt41940cacttggagggcggtgctggcatcgctggcctcacgaagttggtgtgcatgctcaacatg42000aggacgatggtgcccaacttgcacttgcgcgaaatcaacgaccacatcgacgaggacctg42060cagagcttcgccgttcgactgcctaccgaagcgaccaagctcgcatccaagggcatcatc42120acttccagcgtctcctcgttcggcttcggcggaaccaacggacacgtcgtcttgcagacc42180gcttccaaggaaatgccaaagacagcgaagcctaacaagaacgttgtcttcctcttcaca42240ggtcaaggatcgcagtacatcggtatgggccgtggcttgtacgactcgcagcctgtcttc42300aagcaggccctggacaagtgcgccgaggttctggacaagttgctgccaacgcctttgatg42360gaggtgctctaccctgccgacgagtccaaattgatcgaccagacgcagttctcgcagccg42420gccattttctccatcgagtatgccctcgctacgctctggcgctccatgggagtcgagccc42480gttgccgtcttgggtcacagcgtcggcgagtattgcgccgccgtcgttgctggagtgctg42540cctctcgaggacgccctcaagctcatcgccctccgcggccagtgcatcgccgagaagtgc42600gaggctggaatcggctccatggccgctgtcttcgcaagcgaggcggacgtgcagaaggcg42660atcgcgaaggtcggaagcaaggacgtctctgtggctgctgtcaacggacccaagatgacg42720gtcgtcagtggccgcagcgccgacgttgacaaggtggttgcccagactggagctaccagc42780cgaccattgacggtctctcacggcttccactcgccgctcatgaagcctgctctggagccc42840ttccgagcacaggccgagaccgtgactttctccagaccatccgtcaagttcttctctacc42900ctcttgggccgagaagtcacagacgagcttgctcagcctcagtactgggtcgaccacatc42960gagaacgcggtcaagttcatgcctgccaccatggccctggacgaggctctcagccccgat43020ctctacttggaaatcggtgcgtcccccgtcttggtgaatatggcgaagcgcttcttgtcg43080aggagcgtcgagtggatgccttctttggacaacaaggtcagtgaccaggacgccttcaag43140aaggctcagcaggccctgggagcctccgccggccgccctaaggccgacctcaagcgaact43200gccttcccctggagagaggcaggccaccccttgctgcgctccaagaagaccctccctgat43260ggcaccgtcgtcttcggcgtccacttcggaggacatgtgctcgagcttctctcccaccac43320atcgtgcacggagaggtcgtcgtgcctggcgcttgctatctcgagatgatcgttgctggc43380tgcaccaccttcttcggacgcgaccagccttggtgcgtcgaacagttgggcttcgccaag43440cctttggtcttgcgcttgagccctgaaggaaagttggacgagccgaccgaattgcgattg43500gtcatccgtccggatatgcgtatcgaggtcgagtccgagatcggcgacgaccccgacgac43560agcatcgtcgcgacgcacgtcgaggccatcttggtgaagcagaccggcacttgggcaagc43620aaccgacccgagaaggatgcgttcagcttggatcagttgaagaaacagtgtgccgagcct43680gtcgacatcgacctcatgtactccttcggaaagaacagcggcttgccactgcagcgccga43740ttccgcaccgtgcgacacgtgcagaagggtgacaaggagagtatcggccgcttggagatg43800gagagggacggcactcaagtcggattctggctgggtccttccttgatcgacggctccttc43860caggcctccatggctctcgcagatgcagatgttggaatcggcactctgaagattcctctc43920tccatccgacgcttgcagccaacaggccgagcctacaacatctctgtctggtcttacttc43980cagctcattgacttcaccgacaggagcaccgtcttccgctcgtggttgctcaacgacgct44040ggcgaggctttgttgtacttcgaccacgtccacttgcaggaggtccgagacgagcacatc44100cagaaggtcttgcagtcttcaggccgtcagggcaccgagcagtccaacttgtacgatgtc44160gaatggcggcagttggagcttgccggaaagcctgcctccctgccgaacgaagagttcctc44220gtcgttggtggcaaggccgccctcgagaagctcaacttgggcaagagtcctcagttctct44280tgcatgcagatcggtaaggacatcgacatcaatgatgacgacagtgtgaacaaggctctc44340ttgggcaaggcctgggccggcatcgtcttggccgaaggtttggccgagaaggtcggcgac44400gttgatgttgtcaccgaggccatgatcatagttaaggtcctgaccaaggcaggctccaag44460gcccctcctctctggctcctcaccagtggctctcagcctctcgcctccgcagacgccgag44520cagcgcaaggccggttgtgcaacacactccggtctctggggtttcgcccgcgctgtgcgc44580atggagtaccccggaatggtgcgagtcagttgcttggatttcgaccccacaagttcgaag44640agcaccggagacgagttgtccgctcgcctgtctagcttgaccgctgacactgaggacgag44700gtcgccctccgaagcgactccgccgccagcgctcgcttagtgcgttccgagctccagttc44760gtgggtcccagccgcttgaacatggccgcgcgcggcgccttgagcaacttgaggctcgtg44820tcgcagggcaagcgccagacccccatccctggcttcgtccagcagaggatccgagccatc44880ggcttgaacttccgtgacgtgctcaatgtgatgggactctaccctggcgaccctggagcc44940ccaggcgccgactcctccggaaccatcgtcgagttgggtgaccgcgtcgacaccctcaag45000atcgccgatgacgtcttcggagagtctccaggctgcctcagcacctacaacaatggcccc45060gcggccctcttggccaggaagcccccctcttggtcgtacgaggaggcctgcgcaatgccg45120gtcatcttcgtcaccgtcgaggaggcgctcggagacctggcgaagctgaagaagggtgag45180acggtcttgatccacgctgccgccggcggtgtcggcctcgtcgccatccagtacgcccag45240tgggtcggtgccaaggtctatgccactgctggatctgaggagaagcacgccttcctgcgc45300aagttgggcgtcgatcgcatcaccagcacccgagacggcgccaagttcgaagcggagatg45360gagaagatgttgaaggaggacaagctcgagggcgtcgacgtcgtcttgaacagcttgagc45420cacgacgactacatcccacgctccctgaaggtcttgaagaagggtggacgcttcatggag45480atcggcaagcgaggcatctggagccacgaggagatgttcaaggccaggcctgacatcatg45540tacgagaagatcgccgccgataccatgatggagaaggagtgctggaggtacaacgcctac45600ctgaaccgactcttggagcgcgccgagacaggcggcttgaagcccatcaacgaccaccga45660ttcgagggtcttgagaagggagtcgccgccctgcagttcttgcagcgcgccaacaacatc45720ggaaaggtcgtcatctccgagcccagccgactccagtgcaaccctgcgaacatctccgtc45780ctctcaggcggcatgggcgccttgggcatcgtcaccgcgcagttcttggttgaagaaggc45840tgcaagaagctcagcttgctgtcccgaagcggcacaccttcctcggatgccttggcgcag45900ttcgagtggctgaaggcagctgctatcgaagtcggcgtgagcaagtgcgatgtctcttcc45960gagactagcgtcaaggccttcgccagtggcttgcagagccccatcgactgcctgatgcac46020ctcgccggcgttctcgccgacggcatgctgcctaccttgacgagggagcacttcgagaag46080tcgtacgcgccaaaggttcacggtctgtaccacatggtcaagcactggaagatgagcgag46140gacaccaagttcatgctcttctcttccacctccgctctcttcggatcgccgggccaggcc46200aactactccgcatccaactctgtcttggactccttggctcctatctggagtgcccaggga46260cgacagtcttggacggtgcagtggggtccttgggccgaagtcggaatggccgtgcagaag46320aacaccttgtcccgagccaaggctatgggcgtgggtgccttgagcactgccgtcggtatg46380tccatcatgggaagcatcctcggctctgcctcgcacgtcgtcggtgctgtgcctgtcagg46440tgggctaagtacctccgaagtgcctaccaggagactcctatgttcttgactgacatggag46500gccgaggtccgccgtgccgccccagccgttggtgagggaggtggcaattccttggccttg46560gccaacctgtcggcagaggagcgcttggaggccgtccgcgagagcctcctcaccatggct46620cgcgaggtcgtcgacaacgacactctctctgctgaagacgcattgttggagagcggtatg46680gactccctgtctggtgtcgagttccgaaaccgattggtcaccgagttcgaaggtgtccgc46740atgggcaactccctcatcttcgaccaccccaccgtcaacgagctcgcggcgttcatctcg46800gaggagttgggcaacaccttgccagcggccgactcgtctgctgccccagcggccttgcag46860aacggcgcctcccaccctgtggaggcccccgagtccagcgccagcttcgtggagagcttg46920aactcacgcgccagcggcactccgatctacttcgtccccggagccggcatgcaggccgga46980ggcttccgtccgttggcccagatcttgccggtgcctgcctacggtctttcttggccgaag47040ggcgccgtgccgcgcgaggagtggcctaccaccatcgacggcctcgcacgagtcttcctc47100acagaggtcaagaagacgcagcccactggaccgtaccgcttcgctggacactccttcgga47160gccgcggtcgccctcgagatggccaagatcgcacaggcccaaggtctggaggttactttc47220gtggccctcttggaccccaggcacatgggtggaaagaccaccgtcgacgtcggcgaagcc47280ttctccacgaccgacctcgccgactccttgggccttttggcccaaaccgtgccagacggc47340tcgaagtacgtgcaggccttggaggagatcgtcaagtccgacgaccgcgatgccgctgct47400aagaaggtattgagcccagccgtgttggcttctttggagcatgttcacgagaccacgaag47460tggtacagcaccctgttggcaggagacaacttgcagcctgacgcaagcttgaaggcccga47520attgcggtgctccgagcccctgagacttggttgagcccaggtgacaacgagacgatcgct47580gacaagatggtccgggaattccaggccaagacgttccagggcgatgatgaggtcaccaag47640ctcgtggacgagtggtgcggcgttgcccccttcttgaacatgaaggttcctggcagccat47700ttcacgatgttgcacgaacctcacgtggtctcgctcgccatgcgcttgtgccgcgcagtc47760gacgagtccgagggtgaggagctctgaagagtcttcctctagaagctcctcgatggttgt47820tgttccttccttctcgctctctttttatgtgtgggattgctattgc47866<210>4<211>91<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>4valvalleutyrvalleusermetvalglymetileglymetasnleu151015valtrpalacysglyalavalvalleuaspleuproglnlysvalphe202530leumetilecysalaserthralaasnglnglyserilepheargtrp354045cysargasphisargalahisleumetasnlysglythrvalalaasp505560protyrasptyrasnargglyalathrphealatyrileglytrpphe65707580valglnglnlysthrargargalailegluala8590<210>5<211>389<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>5metalaglyglnglnleuglngluvalserprosermetalaserpro151015sersersersersertyrcysproglnargleuglnalaserilearg202530serglyargleuargtrpalavalasnsergluasptrpalaproile354045glyalaglulysglyproglupheglnpheleuleuserleuilegln505560gluthraspaspargglnglnvalthrlystyrmetargpheglnasp65707580glnlysargalaleuileserargleuleuvalarghisalaserala859095servalleuglyleuserserpheargaspvalgluilealaargthr100105110lysglylyslyspropheleuarglysproargprovalaspileala115120125alaalaalaalaalathralaalaalaproaspcysserglyglugly130135140thrthrargthrthrthrserseralaserservalalaalaleuala145150155160asnpheasnpheservalserhisgluglyasptrpvalvalleuala165170175sergluproilecysvalcysglyvalaspvalalaalaproglnglu180185190valargproglyglycysserprosergluilepheargaspleuglu195200205aspglnleuthrglualaglutrpgluphevalarglysglnglyala210215220serserglyglyprogluglygluaspproleutyrseralaphegln225230235240arghistrpcysleulysglualatyrvallysalaargglyaspgly245250255leugluphepropheasnargileglupheglnleuargproalaser260265270leuleuaspgluglualaalaalaglyargargleuglyphealagly275280285argvalaspglyvalaspleuasnproargtrpargphetyrglngln290295300argleuproglyasnhistrpthralavalalaargglyprothrthr305310315320gluvalileaspalapheglygluphelysargthrphethrargpro325330335thraspglnleuproprosergluvalthralagluleuglualaglu340345350gluproprophegluileleuprovalalapheleuvalprothrasp355360365hisilegluglytyrglualaalaglyglyglnlystrpglnalaile370375380aspalaalaalaala385<210>6<211>273<212>dna<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>6gtggtgctctacgttttgtccatggtcggcatgatcggaatgaacttggtctgggcctgc60ggtgccgtcgttttggacctcccccagaaagtcttcctcatgatctgtgcctctaccgcg120aaccaaggcagcatcttccgatggtgccgagatcatcgtgcccaccttatgaacaagggc180acggtggccgatccttacgactacaaccgtggcgctaccttcgcctacatcggctggttt240gtgcagcagaagactcgccgtgcgatcgaagcg273<210>7<211>12<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>7thralavalserseralapheglnglymetserlys1510<210>8<211>23<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>8gluleuasnprohisileaspleuaspasppheproserthrilepro151015thraspvalvalserilelys20<210>9<211>11<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>9asnvalglypheglnalaproleuvalleulys1510<210>10<211>14<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>10glyalaseralaalaleuglyglyalathrglnglulyslys1510<210>11<211>10<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>11aspservalilegluileprotyrthrarg1510<210>12<211>14<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>12argglyaspseraspglumetilethrhiscysgluglyarg1510<210>13<211>18<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>13glyvalthrtyrserthrserasnalaalaleuaspglyleualaleu151015trparg<210>14<211>12<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>14alathrthrglnilevalseralaalaglualaarg1510<210>15<211>15<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>15pheservalgluglyvalglypheglnasnproleuvalleuarg151015<210>16<211>19<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>16leuvalgluleuleuserpheleuglnglyalaglnseralaserglu151015thrprolys<210>17<211>13<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>17glupheglnserglnglualaleualavalthrglylys1510<210>18<211>18<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>18alaseralametalaglymetthraspaspaspargglnalaalaval151015leulys<210>19<211>13<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>19alaglnglnalaleuglyalaseralaglyargprolys1510<210>20<211>22<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>20alaproproleutrpleuleuthrserglyserglnproleualaser151015alaaspalagluglnarg20<210>21<211>12<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>21seralaaspserproleuileleuglyalavallys1510<210>22<211>15<212>prt<213>寇氏隐甲藻(crypthecodiniumcohnii)<400>22mettyrvalprophealaasnileglyleuproleuglnproarg151015当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1