真菌产生FDCA的制作方法

文档序号:15102760发布日期:2018-08-04 16:08阅读:374来源:国知局
本发明涉及分子遗传学、代谢工程、生物转化和发酵
技术领域
。具体而言,本发明涉及经遗传修饰的真菌从羟甲基糠醛产生2,5-呋喃二羧酸。本发明进一步涉及这种真菌在将羟甲基糠醛生物转化成2,5-呋喃二羧酸的方法中的用途。
背景技术
:2,5-呋喃二羧酸(FDCA)是一种单体化合物,可用于产生具有巨大经济影响的聚酯。该领域一个非常重要的化合物是由对苯二甲酸(PTA)和乙二醇产生的聚对苯二甲酸乙二醇酯(PET)。FDCA在聚酯PET中可代替PTA,在这种情况中产生聚呋喃二甲酸乙二醇酯(PEF)。PEF具有在大型聚酯市场中取代PET的良好潜力。不仅因为它与PET相比时具有更优秀的性质,还因为它可以衍生自可再生原料。FDCA可以通过化学(DeJongetal.,2012.In:BiobasedMonomers,Polymers,andMaterials;Smith,P.,etal.;ACSSymposiumSeries;AmericanChemicalSociety:Washington,DC)或组合的化学-生物学途径(Wiercksetal.,2011.ApplMicrobiolBiotechnol92:1095-1105)从糖中生产。在后一种情况中,将单体糖诸如葡萄糖或果糖化学转化成5-(羟甲基)-2-糠醛(HMF),其随后可被酶氧化成FDCA。基于HMF降解菌株CupriavidusbasilensisHMF14的分离(Wierckxetal.,2010.MicrobialTechnology3:336-343),已经开发了由HMF产生FDCA的生物学途径。鉴定了编码在C.basilensisHMF14中参与HMF降解途径的酶的基因簇,并且在恶臭假单胞菌(Pseudomonasputida)S12菌株中异源表达相关基因(Koopmanetal.,2010.PNAS107:4919-4924),由此获得代谢HMF的能力。仅编码HMF氧化还原酶的hmfH基因的异源表达主要在HMF-酸(HMFCA)处起氧化酶的作用,但其也可氧化HMF或FFCA,使恶臭假单胞菌S12能够由HMF产生FDCA(Koopmanetal.,2010.BioresourceTechnology101:6291-6296;和WO2011/026913)。在进一步的优化工作中(Wierckxetal.,2011,同上;和WO2012/064195),两种额外的基因在恶臭假单胞菌S12中表达,其分别编码HMFCA转运蛋白和具有未知的特异性的醛脱氢酶。酵母菌在乙醇生产方法中将HMF还原为相应的死端产物5-羟甲基糠醇(HMF-醇)的能力已经被广泛研究(ParawiraandTekere,2011,CriticalReviewsinBiotechnology31:20-31)。到目前为止还没有发布能够完全氧化HMF并利用该化合物用于生长的酵母的报道。US7,067,303公开了真菌木生锥毛壳(Coniochaetaligniaria)(有性型)或其Lecythophora无性型态能够显著消耗农业生物质水解产物中毒性水平的呋喃、特别是糠醛和HMF。木生锥毛壳作为生物试剂来解毒含糖水解产物的用途在许多随后的论文中被进一步证明(etal.,2004.Appl.MicrobiolBiotechnol64:125-131;Nicholsetal.,2005.ApplBiochemBiotechnol.Spring;121-124:379-90;Nicholsetal.,2008.EnzymeandMicrobialTechnology42:624-630;Nicholsetal.,2010.BioresourceTechnol19:7545-50;Nicholsetal.,2014.BiomassandBioenergy67:79-88)。除了将HMF解毒成较低毒性的化合物之外,生物体还能够代谢HMF用于生长。Zhangetal.(2010,BiotechnologyforBiofuels3:26)描述了分离两种解毒其玉米秸秆水解产物的代谢HMF的真菌,其分别被鉴定为Amorphothecaresinae和Eupenicilliumbaarnense。据报道,在随后的文章中(Ranetal.,2014,BiotechnologyforBiofuels7:51),称为ZN1的A.resinae菌株的生长被许多化合物包括HMF所支持。随着时间的推移HMF被降解并且HMF醇和HMFCA积累,但没有报道FDCA的积累。GovindaRajuluetal.(2014,MycologicalProgress13:1049-1056)类似地分离了许多具有利用糠醛和/或HMF作为唯一碳源的能力的真菌,但是同样没有报道FDCA的积累。因此,已经描述的几种真菌以消耗HMF生长或解毒含HMF的原料。与酵母一样,从将HMF还原成HMF-醇的角度研究生物体,用于对原料进行解毒的目的。然而,尚未描述通过酵母或丝状真菌产生FDCA。但是,真菌从HMF产生FDCA将提供超过本领域细菌方法的若干内在优点。例如,许多真菌耐受低至pH=3或更低的低pH值用于生长,而大多数细菌偏好中性pH环境。在大规模生产FDCA的特定情况下,由于下游方法(DSP)和防治感染的优势,如果在低pH值的全细胞生产方法,将是非常有利的。因此,本发明的目标是提供真菌细胞及其在由HMF产生FDCA的方法中的用途。发明概述在第一方面,本发明涉及包含遗传修饰的真菌细胞,所述遗传修饰是以下至少一种:a)与缺乏遗传修饰的相应野生型细胞相比,赋予细胞将5-羟甲基-2-呋喃羧酸(HMFCA)氧化成5-甲酰-2-糠酸(FFCA)的能力或增加细胞中将HMFCA氧化成FFCA的酶的比活性的遗传修饰;和b)与缺乏遗传修饰的相应野生型细胞相比,降低或消除参与2,5-呋喃二羧酸分解代谢的酶的比活性的遗传修饰。优选地,真菌细胞还包含:c)与缺乏遗传修饰的相应野生型细胞相比,赋予细胞将呋喃醛氧化成相应的呋喃羧酸的能力的遗传修饰,或增加细胞中将呋喃醛氧化成相应的呋喃羧酸的酶的比活性的遗传修饰。在根据本发明的真菌细胞中;a)a)中的遗传修饰是以下至少一种:i)增加编码具有HMFCA脱氢酶活性的多肽的核苷酸序列的表达的修饰,该多肽包含与SEQIDNO:1-4中至少一个的氨基酸序列具有至少45%序列相同性的氨基酸序列;和ii)增加编码具有呋喃氧化酶活性的多肽的核苷酸序列的表达的修饰,该多肽包含与SEQIDNO.7-9中至少一个的氨基酸序列具有至少45%序列相同性的氨基酸序列;b)b)中的遗传修饰是降低或消除以下至少一种的表达的修饰:i)编码FDCA脱羧单加氧酶的基因,其中优选的基因是编码与SEQIDNO.:10和11中的至少一个具有至少45%序列相同性的氨基酸序列的基因;ii)编码FDCA脱羧酶的基因,其中优选的基因是编码与SEQIDNO:12具有至少45%序列相同性的氨基酸序列的基因;iii)编码FDCA脱羧脱氢酶的基因,其中优选的基因是编码与SEQIDNO:13具有至少45%序列相同性的氨基酸序列的基因;和iv)编码内酯酶的基因,所述内酯酶水解由FDCA脱羧导致的内酯,其中优选的基因是编码与SEQIDNO:14具有至少45%序列相同性的氨基酸序列的基因,和c)c)中的遗传修饰是增加编码具有呋喃醛脱氢酶活性的多肽的核苷酸序列的表达的修饰,该醛脱氢酶具有以下能力中的至少一种:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA和iii)将FFCA氧化成FDCA,该多肽包含与SEQIDNO.:5和6中至少一个的氨基酸序列具有至少45%序列相同性的氨基酸序列。根据本发明的真菌细胞还优选包含选自以下的遗传修饰:a)降低或消除编码将HMF和/或FFCA还原为相应醇的短链脱氢酶的基因的表达的遗传修饰,其中优选的基因是编码包含与SEQIDNO:15具有至少45%序列相同性的氨基酸序列的多肽的基因;b)增加编码转运至少一种呋喃化合物的多肽的核苷酸序列的表达的遗传修饰,所述多肽优选包含与SEQIDNO:16-18中至少一个的氨基酸序列具有至少45%序列相同性的氨基酸序列;和c)改变编码参与呋喃分解代谢的基因的转录激活物的基因表达的遗传修饰,其中优选的基因是编码包含与SEQIDNO:19具有至少45%序列相同性的氨基酸序列的多肽的基因。根据本发明的优选真菌细胞是选自以下属的丝状真菌细胞:支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、Filibasidium、镰刀菌属(Fusarium)、腐殖霉属(Humicola)、稻瘟菌属(Magnaporthe)、毛霉菌属(Mucor)、毁丝霉属(Myceliophthora)、新丽鞭毛菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)和黑粉菌属(Ustilago),更优选选自以下物种的丝状真菌细胞是:黑曲霉(Aspergillusniger)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillusfoetidus)、酱油曲霉(Aspergillussojae)、烟曲霉(Aspergillusfumigatus)、埃默森踝节菌(Talaromycesemersonii)、米曲霉(Aspergillusoryzae)、嗜热毁丝霉(Myceliophthorathermophila)、里氏木霉(Trichodermareesei)、产黄青霉(Penicilliumchrysogenum)、单纯青霉(Penicilliumsimplicissimum)和巴西青霉(Penicilliumbrasilianum);或选自以下属的酵母细胞:酵母菌属(Saccharomyces)、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克氏酵母属(Kloeckera)、许旺氏酵母属(Schwanniomyces)、耶氏酵母属(Yarrowia)、隐球酵母属(Cryptococcus)、Debaromyces、Saccharomycecopsis、类糖酵母属(Saccharomycodes)、威克酵母属(Wickerhamia)、Debayomyces、有孢汉逊氏酵母属(Hanseniaspora)、Ogataea、Kuraishia、Komagataella、梅奇酵母属(Metschnikowia)、拟威尔氏酵母属(Williopsis)、Nakazawaea、有孢圆酵母属(Torulaspora)、布氏弹孢酵母属(Bullera)、红酵母属(Rhodotorula)和掷孢酵母属(Sporobolomyces),更优选选自以下物种的酵母细胞:乳酸克鲁维酵母(Kluyveromyceslactis)、酿酒酵母(S.cerevisiae)、多形汉逊酵母(Hansenulapolymorpha)、解脂耶氏酵母(Yarrowialipolytica)、热带假丝酵母(Candidatropicalis)和巴斯德毕赤酵母(Pichiapastoris)。在第二方面,本发明涉及用于制备如上述本发明第一方面所定义的多肽的方法,其中所述多肽是:a)HMFCA脱氢酶;b)将呋喃醛氧化成相应的呋喃羧酸的醛脱氢酶;c)呋喃醇/醛氧化酶;d)FDCA脱羧单加氧酶;e)FDCA脱羧酶;f)FDCA脱羧脱氢酶;g)水解由FDCA脱羧导致的内酯的内酯酶;h)将HMF和/或FFCA还原成相应醇的短链脱氢酶;i)至少一种呋喃化合物的转运蛋白;或j)参与呋喃分解代谢的基因的转录激活物,所述方法包含在有助于表达所述多肽的条件下培养如上述本发明的第一方面所定义的真菌细胞的步骤,并且任选地回收所述多肽。在第三方面,本发明涉及将HMFCA氧化成FFCA的方法,所述方法包含在存在HMFCA的有助于细胞氧化HMFCA的条件下,孵育表达具有将HMFCA氧化成FFCA能力的酶的真菌细胞的步骤,其中优选的真菌细胞是如上述本发明的第一方面所定义的真菌细胞。在第四方面,本发明涉及产生FDCA的方法,所述方法包含以下步骤:在包含FDCA的一种或多种呋喃前体的培养基中孵育如上述本发明第一方面所定义的真菌细胞,优选在有助于细胞将FDCA的呋喃前体氧化成FDCA的条件下,并且任选地回收FDCA,其中优选的至少一种FDCA的呋喃前体选自HMF、2,5-二羟甲基呋喃(DHF)、HMFCA、FFCA和2,5-二甲酰呋喃(DFF),其中HMF是最优选的,其中FDCA的呋喃前体得自一种或多种己糖,优选一种或多种得自木质纤维素生物质的己糖,优选通过酸催化脱水获得,并且其中优选通过包含酸沉淀然后冷却结晶和/或溶剂萃取的方法从培养基中回收FDCA。在第五方面,本发明涉及产生FDCA的方法,所述方法包含以下步骤:在pH值范围为2.0-3.0和包含一种或多种FDCA的呋喃前体的培养基中,孵育表达一种或多种具有将FDCA的呋喃前体转化成FDCA的能力的酶的真菌细胞,优选在有助于细胞将FDCA的呋喃前体氧化成FDCA的条件下,其中优选的至少一种FDCA的呋喃前体选自HMF、2,5-二羟甲基呋喃(DHF)、HMFCA、FFCA和2,5-二甲酰呋喃(DFF),其中HMF是最优选的,其中FDCA的呋喃前体得自一种或多种己糖,优选一种或多种得自木质纤维素生物质的己糖,优选通过酸催化脱水获得,其中优选FDCA从产生FDCA的酸性培养基中沉淀,并通过包括酸沉淀然后冷却结晶的方法从所述培养基中回收。优选地,在根据本发明第五方面的方法中,真菌细胞是如上述在本发明第一方面中所定义的真菌细胞或表达一种或多种具有将FDCA的呋喃前体转化成FDCA能力的细菌酶的真菌细胞。在第六方面,本发明涉及由一种或多种或至少两种FDCA单体产生聚合物的方法,所述方法包含以下步骤:在根据本发明第四或第五方面的方法中制备FDCA单体;并且由a)中获得的FDCA单体产生聚合物。在第七方面,本发明涉及真菌细胞的用途,优选如上述在本发明第一方面中所定义的真菌细胞或表达一种或多种具有将FDCA的呋喃前体转化成FDCA能力的细菌酶的真菌细胞,用于一种或多种FDCA的呋喃前体的生物转化,其中优选地,至少一种FDCA的呋喃前体选自HMF、DHF、HMFCA、FFCA和DFF,其中HMF是最优选的。在第八方面,本发明涉及选自以下的多肽:a)HMFCA脱氢酶,其具有将HMFCA氧化成FFCA的能力并且包含以下至少一种的氨基酸序列:i)与SEQIDNO:1的氨基酸序列具有至少73.9%序列相同性的氨基酸序列;ii)与SEQIDNO:2的氨基酸序列具有至少69.4%序列相同性的氨基酸序列;iii)与SEQIDNO:3的氨基酸序列具有至少84.5%序列相同性的氨基酸序列;和iv)与SEQIDNO:4的氨基酸序列具有至少88%序列相同性的氨基酸序列;b)呋喃醛脱氢酶,其具有以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA,并包含以下至少一种的氨基酸序列:i)与SEQIDNO:5的氨基酸序列具有至少70.9%序列相同性的氨基酸序列;和ii)与SEQIDNO:6的氨基酸序列具有至少85%序列相同性的氨基酸序列;c)呋喃氧化酶活性,其具有以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA和v)将FFCA氧化成FDCA,并且包含以下至少一种的氨基酸序列:i)与SEQIDNO:7的氨基酸序列具有至少62.7%序列相同性的氨基酸序列;ii)与SEQIDNO:8的氨基酸序列具有至少49.3%序列相同性的氨基酸序列;和ii)与SEQIDNO:9的氨基酸序列具有至少66.9%序列相同性的氨基酸序列;d)FDCA脱羧单加氧酶,其包含以下至少一种的氨基酸序列:i)与SEQIDNO:10的氨基酸序列具有至少82.3%序列相同性的氨基酸序列;和ii)与SEQIDNO:11的氨基酸序列具有至少43.4%序列相同性的氨基酸序列;e)FDCA脱羧酶,其包含与SEQIDNO:12的氨基酸序列具有至少62.9%序列相同性的氨基酸序列;和f)FDCA脱羧脱氢酶,其包含与SEQIDNO:13的氨基酸序列具有至少85.4%序列相同性的氨基酸序列;g)内酯酶,其具有水解由FDCA脱羧导致的内酯的能力,其中所述内酯酶包含与SEQIDNO:14的氨基酸序列具有至少67.5%序列相同性的氨基酸序列;h)短链脱氢酶,其能够将HMF和FFCA中的至少一个还原成相应醇并且包含与SEQIDNO:15的氨基酸序列具有至少73.6%序列相同性的氨基酸序列;i)呋喃化合物的转运蛋白,所述氨基酸序列为以下至少一种:i)与SEQIDNO:16的氨基酸序列具有至少85.2%序列相同性的氨基酸序列;ii)与SEQIDNO:17的氨基酸序列具有至少69%序列相同性的氨基酸序列;和ii)与SEQIDNO:18的氨基酸序列具有至少84.1%序列相同性的氨基酸序列;和j)参与呋喃分解代谢的基因的转录激活物,其包含与SEQIDNO:19的氨基酸序列具有至少52.4%序列相同性的氨基酸序列。在第九方面,本发明涉及核酸分子,其包含以下至少一种:a)编码如本发明第八方面所定义的多肽的核苷酸序列;b)SEQIDNO:20-35所示的核苷酸序列;c)(a)或(b)中所定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和e)核苷酸序列,其是a)至d)中所定义的核苷酸序列的反向补体,其中,优选该核酸分子是载体。发明详述定义术语“同源性”“序列相同性”等在本文中可互换使用。序列相同性在本文中定义为通过比较序列确定的两个或更多个氨基酸(多肽或蛋白质)序列或两个或更多个核酸(多核苷酸)序列之间的关系。在本领域中,“相同性”也意指氨基酸或核酸序列之间的序列相关性程度,视情况而定,如通过这些序列的串(string)之间的匹配所确定。两个氨基酸序列之间的“相似性”通过比较一个多肽的氨基酸序列及其保守氨基酸取代物与第二多肽的序列来确定。“相同性”和“相似性”可以通过已知的方法容易地计算出来。根据两个序列的长度,可以通过使用全局或局部比对算法比对两个肽或两个核苷酸序列以确定“序列相同性”和“序列相似性”。优选使用全局比对算法(例如NeedlemanWunsch)比对相似长度的序列,所述全局比对算法在整个长度上最优地比对序列,而优选使用局部比对算法(例如SmithWaterman)比对基本上不同长度的序列。然后,当序列(当通过例如使用默认参数的程序GAP或BESTFIT最优地比对)共有至少某个最小百分比的序列相同性(如下所定义)时,可以将序列称为“基本上相同”或“基本上相似”。GAP使用Needleman和Wunsch全局比对算法将两个序列在其整个长度(全长)上进行比对,从而最大化匹配数量并最小化缺口数量。当两个序列具有相似长度时,全局比对适用于确定序列相同性。通常,使用GAP默认参数,缺口生成罚分=50(核苷酸)/8(蛋白质)和缺口延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵是nwsgapdna,对于蛋白质,默认评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS89,915-919)。使用计算机程序,可以确定百分比序列相同性的序列比对和评分,诸如可从AccelrysInc.,9685ScrantonRoad,SanDiego,CA92121-3752USA获得的GCGWisconsinPackage,版本10.3或使用开源软件,诸如程序“needle”(使用全局NeedlemanWunsch算法)或EmbossWIN版本2.10.0中的“water”(使用局部SmithWaterman算法),使用与上述GAP相同的参数,或使用默认设置(用于“needle”和“water”并均用于蛋白质和用于DNA比对,默认缺口开放罚分是10.0,默认缺口延伸罚分是0.5;默认评分矩阵对于蛋白质为Blossum62,对于DNA为DNAFull)。当序列具有基本不同的总长度时,局部比对(例如使用SmithWaterman算法的比对)是优选的。可选地,百分比相似性或相同性可以通过使用算法(诸如FASTA、BLAST等)检索公共数据库来确定。因此,本发明的核酸和蛋白质序列可以进一步用作“查询序列”以对公共数据库进行检索,例如,来鉴定其他家族成员或相关序列。这种检索可以使用Altschul,etal.(1990)J.Mol.Biol.215:403-10的BLASTn和BLASTx程序(版本2.0)进行。可以用NBLAST程序进行BLAST核苷酸检索,得分=100、字长=12,以获得与本发明的氧化还原酶核酸分子同源的核苷酸序列。可以用BLASTx程序进行BLAST蛋白质检索,得分=50、字长=3,以获得与本发明的蛋白质分子同源的氨基酸序列。为了获得用于比较目的的缺口比对,可以使用GappedBLAST,如Altschuletal.,(1997)NucleicAcidsRes.25(17):3389-3402中所述。当使用BLAST和GappedBLAST程序时,可以使用各个程序(例如BLASTx和BLASTn)的默认参数。参见NationalCenterforBiotechnologyInformation的主页http://www.ncbi.nlm.nih.gov/。任选地,在确定氨基酸相似性程度时,本领域技术人员将会清楚,本领域技术人员还可以考虑所谓的“保守”氨基酸取代。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代基是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸、和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是其中在公开的序列中的至少一个残基已经除去且在此位置插入一个不同残基的那些。优选地,所述氨基酸改变是保守的。优选的每种天然存在的氨基酸的保守取代如下:丙氨酸至丝氨酸;精氨酸至赖氨酸;天冬酰胺至谷氨酰胺或组氨酸;天冬氨酸至谷氨酸;半胱氨酸至丝氨酸或丙氨酸;谷氨酰胺至天冬酰胺;谷氨酸至天冬氨酸;甘氨酸至脯氨酸;组氨酸至天冬酰胺或谷氨酰胺;异亮氨酸至亮氨酸或缬氨酸;亮氨酸至异亮氨酸或缬氨酸;赖氨酸至精氨酸;谷氨酰胺至谷氨酸;甲硫氨酸至亮氨酸或异亮氨酸;苯丙氨酸至甲硫氨酸、亮氨酸或酪氨酸;丝氨酸至苏氨酸;苏氨酸至丝氨酸;色氨酸至酪氨酸;酪氨酸至色氨酸或苯丙氨酸;以及缬氨酸至异亮氨酸或亮氨酸。如本文所用,术语“选择性杂交”“选择性地杂交”和相似术语意图描述用于杂交和洗涤的条件,在此条件下,彼此至少66%、至少70%、至少75%、至少80%、更优选至少85%、甚至更优选至少90%、优选至少95%、更优选至少98%或更优选至少99%同源的核苷酸序列通常保持彼此杂交。也就是说,这种杂交序列可以共有至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、更优选至少85%、甚至更优选至少90%、更优选至少95%、更优选至少98%或更优选至少99%序列相同性。这种杂交条件的优选的非限制性的实例是在约45℃在6×氯化钠/柠檬酸钠(SSC)中杂交,接着在约50℃、优选在约55℃、优选在约60℃、甚至更优选在约65℃在1×SSC、0.1%SDS中洗涤一次或多次。高度严格的条件包括例如在5×SSC/5×Denhardt′s溶液/1.0%SDS中在约68℃杂交,并在室温在0.2×SSC/0.1%SDS中洗涤。或者,洗涤可以在42℃进行。本领域技术人员将知道哪些条件应用于严格和高度严格的杂交条件。关于这些条件的额外指导在本领域中是容易获得的,例如见于Sambrooketal.,1989,MolecularCloning,ALaboratoryManual,ColdSpringHarborPress,N.Y.;和Ausubeletal.(eds.),SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork1995,CurrentProtocolsinMolecularBiology,(JohnWiley&Sons,N.Y.)。当然,仅与多聚A序列(诸如mRNA的3′末端poly(A)区)或与T(或U)残基的互补节段序列杂交的多核苷酸不包含在用于与本发明的核酸的一部分特异性杂交的本发明的多核苷酸中,因为这种多核苷酸将与含有poly(A)节段序列或其补体(例如实际上任何双链cDNA克隆)的任何核酸分子杂交。“核酸构建体”或“核酸载体”在本文应理解为是指由使用重组DNA技术获得的人工核酸分子。因此,术语“核酸构建体”不包括天然存在的核酸分子,尽管核酸构建体可包含(部分)天然存在的核酸分子。术语“表达载体”或“表达构建体”是指能够影响基因在与这种序列相容的宿主细胞或宿主生物体中表达的核苷酸序列。这些表达载体通常包括至少合适的转录调控调节序列及任选包括3’转录终止信号。也可以存在实现表达必需的或者有益的其他因子,例如表达增强子元件。将表达载体导入合适的宿主细胞并能够在宿主细胞的体外细胞培养物中实现编码序列的表达。表达载体适于在本发明的宿主细胞或生物体中复制。如本文所用,术语“启动子”或“转录调节序列”是指作用为控制一个或多个编码序列转录的核酸片段,并且其位于转录起始位点的转录方向上游,并且通过DNA依赖性RNA聚合酶的结合位点、转录起始位点和任何其他DNA序列(包括但不限于转录因子结合位点、阻抑物和激活物蛋白结合位点、以及本领域技术人员已知的直接或间接作用以调节从启动子的转录量的任何其他核苷酸序列)的存在来结构性鉴定。“组成型”启动子是在大多数生理和发育条件下在大多数组织中有活性的启动子。“诱导型”启动子是受生理或发育调节的启动子,例如通过应用化学诱导剂。术语“选择标记”是本领域普通技术人员熟知的术语,并且在本文用于描述任何遗传实体,当其表达时可用于选择细胞或含有该选择标记的细胞。术语“报道子”可以与标记互换使用,尽管它主要用于指可见标记,如绿色荧光蛋白(GFP)。选标记可以是显性或隐性或双向的。如本文所用,术语“可操作地连接”是指核苷酸元件的功能关系连接。当核酸置于与另一核酸序列的功能关系中时,核酸是“可操作地连接”的。例如,如果转录调节序列影响编码序列的转录,则其与编码序列是可操作地连接的。可操作地连接意味着所连接的DNA序列通常是连续的,并且在需要时连接连续的及符合阅读框的两个蛋白质编码区。术语“蛋白质”或“多肽”可互换使用,并且指由氨基酸链组成的分子,而不涉及特定的作用模式、尺寸、三维结构或来源。术语“基因”是指包含一个区域(转录区)的DNA片段,其在细胞中被转录为RNA分子(例如mRNA),与合适的调节区(例如启动子)可操作地连接。基因通常包含几个可操作地连接的片段,例如启动子、5’前导序列、编码区和包含聚腺苷酸化位点的3’-非翻译序列(3’-末端)。“基因的表达”是指其中与合适的调节区、特别是启动子可操作地连接的DNA区域被转录为RNA(其是生物活性的,即其能翻译为生物活性蛋白或肽)的过程。术语“同源”当用于表示给定(重组)核酸或多肽分子与给定宿主生物体或宿主细胞之间的关系时,应理解为表示在自然界中,核酸或多肽分子由相同物种、优选相同品种或株系的宿主细胞或生物体产生。如果与宿主细胞同源,则编码多肽的核酸序列通常(但非必需地)将与另一(异源)启动子序列和(如果适用的话)另一(异源)分泌信号序列和/或终止子序列可操作地连接,而不是其在自然环境中的启动子序列和分泌信号序列和/或终止子序列。应该理解调节序列、信号序列、终止子序列等也可以与宿主细胞同源。在这种情况下,仅使用“同源”序列元件允许构建“自克隆的”遗传修饰生物体(GMO’s)(自克隆在本文中如EuropeanDirective98/81/ECAnnexII中所定义的)。当用于指示两条核酸序列的相关性时,术语“同源”意指一条单链核酸序列可与互补的单链核酸序列杂交。杂交的程度可能取决于许多因素,包括序列之间相同性的量和杂交条件如后面所讨论的温度和盐浓度。术语“异源”和“外源”当用于关于核酸(DNA或RNA)或蛋白质时是指不是作为其存在于之中的生物体、细胞、基因组或DNA或RNA序列的一部分而天然存在的核酸或蛋白质,或者被发现于不同于其在自然界中发现的细胞或基因组中一个或多个位置或或DNA或RNA序列中。异源和外源核酸或蛋白质对其所导入的细胞来说不是内源的,而是得自另一细胞或者合成或重组产生的。通常,虽然不是必需的,但这种核酸编码的蛋白质(即外源蛋白质)正常地不由DNA被转录或表达在其中的细胞产生。相似地,外源RNA编码在外源RNA存在的细胞中通常不表达的蛋白质。异源/外源核酸和蛋白质也可以被称为外来核酸或蛋白质。本领域技术人员将认识到对于表达其的细胞是外来的任何核酸或蛋白质在本文中都包括在术语异源或外源核酸或蛋白质中。异源和外源的术语也应用于核酸或氨基酸序列的非天然组合,即其中组合序列的至少两个彼此是外来的。本文中酶的“比活性”应理解为是指特定酶的活性量/宿主细胞蛋白质总量,通常以酶活性单位/mg宿主总蛋白质表示。在本发明的上下文中,特定酶的比活性与所述酶在野生型宿主细胞(其他方面相同的)中的比活性相比,可以增加或降低。本文中“呋喃化合物”应理解为2,5-呋喃-二羧酸(FDCA)以及具有呋喃基团的可被氧化成FDCA的任何化合物,后者在本文中称为“FDCA的前体”或“FDCA的呋喃前体”。FDCA的前体至少包括:5-羟甲基糠醛(HMF)、称为HMF-OH的2,5-二羟甲基呋喃(DHF)或2,5-二(羟甲基)呋喃(BHF)、5-羟甲基-2-呋喃羧酸或5-羟甲基-2-糠酸(HMFCA)、5-甲酰-2-糠酸(FFCA)和2,5-二甲酰呋喃(DFF)。还应该理解的是,在“呋喃化合物”中,呋喃环或任何或其可取代的侧基可以在呋喃环中任何可利用的位置例如用OH、C1-C10烷基、烷基、烯丙基、芳基或RO-醚组分(包括环状基团)取代。“需氧条件”“有氧条件”或需氧或有氧发酵方法在本文中定义为条件或发酵方法在氧气存在下运行并且其中消耗氧气,优选以至少0.5、1、2、5、10、20或50mmol/L/h,并且其中有机分子充当电子供体并且氧气充当电子受体。“厌氧或无氧条件”或“厌氧或无氧发酵方法”在本文中定义为条件或发酵方法基本上在氧气不存在下运行并且其中有机分子既充当电子供体又充当电子受体。在无氧条件下,基本上不消耗氧气,优选消耗少于5、2、1或0.5mmol/L/h、更优选0mmol/L/h(即氧消耗不可检测),或在发酵培养基中基本上没有溶解氧可以被检测到,优选培养基中的溶解氧浓度小于空气饱和度的2、1、0.5、0.2、0.1%,即低于商业氧探针的检测极限。本文对公开序列数据库中可访问的核苷酸或氨基酸序列的引用是指在本文件的提交日期可获得的序列条目的版本。发明详述亲本宿主细胞本发明涉及宿主细胞的遗传修饰,以使宿主细胞能够从合适的呋喃前体产生2,5-呋喃二羧酸(FDCA)。为此目的,根据本发明可以在亲本宿主细胞中引入许多遗传修饰。这些修饰包括引入许多异源基因的表达,以及通过降低或消除一些内源基因和/或通过增加(即过表达)其他内源基因以修饰已经存在于亲本宿主细胞中的许多内源基因的表达。这些遗传修饰在下文进一步阐述。因此在将根据本发明的任何遗传修饰引入宿主细胞之前,亲本宿主细胞被理解为宿主细胞。本发明的亲本宿主细胞可以是任何合适的宿主细胞,包括例如真核细胞如哺乳动物、昆虫、植物、真菌或藻类细胞。优选的哺乳动物细胞包括如中国仓鼠卵巢(CHO)细胞、COS细胞、293细胞、PerC6细胞和杂交瘤。优选的昆虫细胞包括如Sf9和Sf21细胞及其衍生物。但是,优选宿主细胞是微生物细胞。微生物宿主细胞也可以是原核细胞,优选细菌细胞。术语“细菌细胞”包括革兰氏阴性和革兰氏阳性微生物。合适的细菌可以选自以下属:埃希氏菌属(Escherichia)、鱼腥藻属(Anabaena)、Aeribacillus、解硫胺素杆菌属(Aneurinibacillus)、伯克霍尔德氏菌属(Burkholderia)、慢生根瘤菌属(Bradyrhizobium)、柄杆菌属(Caulobacter)、贪铜菌属(Cupriavidus)、脱硫肠状菌属(Desulfotomaculum)、Desulfurispora、葡糖杆菌属(Gluconobacter)、红杆菌属(Rhodobacter)、Pelotomaculum、假单胞菌属(Pseudomonas)、副球菌属(Paracoccus)、芽孢杆菌属(Bacillus)、地芽孢杆菌属(Geobacillus)、短小芽孢杆菌属(Brevibacillus)、短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、根瘤菌属(Rhizobium(中华根瘤菌属(Sinorhizobium))、黄杆菌属(Flavobacterium)、克雷伯氏菌属(Klebsiella)、肠杆菌属(Enterobacter)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、甲基杆菌属(Methylobacterium)、罗尔斯通氏菌属(Ralstonia)、红假单胞菌属(RhodoPseudomonas)、葡萄球菌属(Staphylococcus)及链霉菌属(Streptomyces)。优选地,细菌细胞选自以下物种:A.pallidus、A.terranovensis、枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B.amyloliquefaciens)、凝结芽孢杆菌(B.coagulans)、克里不所类芽孢杆菌(B.kribbensis)、地衣芽孢杆菌(B.licheniformis)、B.puntis、巨大芽孢杆菌(B.megaterium)、耐盐芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus)、热红短小芽孢杆菌(B.thermoruber)、B.panacihumi、C.basilensis、库氏脱硫肠状菌(D.kuznetsovii)、D.thermophila、嗜热地芽孢杆菌(G.kaustophilus)、氧化葡糖杆菌(Gluconobacteroxydans)、新月柄杆菌(Caulobactercrescentus)CB15、扭托甲基杆菌(Methylobacteriumextorquens)、类球红细菌(Rhodobactersphaeroides)、Pelotomaculumthermopropionicum、Pseudomonaszeaxanthinifaciens、恶臭假单胞菌、Paracoccusdenitrificans、大肠杆菌(E.coli)、谷氨酸棒杆菌(C.glutamicum)、肉葡萄球菌(Staphylococcuscarnosus)、变铅青链霉菌(Streptomyceslividans)、苜蓿中华根瘤菌(Sinorhizobiummelioti)和Rhizobiumradiobacter。在恶臭假单胞菌物种中,优选恶臭假单胞菌S12和恶臭假单胞菌KT2440菌株。然而,更优选地,本发明的亲代宿主细胞是真核微生物宿主细胞,例如,真菌宿主细胞。根据本发明待修饰的最优选的亲本宿主细胞是酵母或丝状真菌宿主细胞。“真菌”在本文中定义为真核微生物并且包括真菌亚门所有物种(Alexopoulos,C.J.,1962,In:IntroductoryMycology,JohnWiley&Sons,Inc.,NewYork)。因此术语“真菌”和“真菌的”包括或指丝状真菌和酵母。“丝状真菌”在本文中定义为包括真菌亚门和卵菌门的全部丝状形式(如“DictionaryofTheFungi”,第10版,2008,CABI,UK,www.cabi.org中所定义)的真核微生物。丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝壁。营养生长是通过菌丝延长并且碳分解代谢是专性需氧的。丝状真菌菌株包括但不限于支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、Filibasidium、镰刀菌属(Fusarium)、腐殖霉属(Humicola)、稻瘟菌属(Magnaporthe)、毛霉菌属(Mucor)、毁丝霉属(Myceliophthora)、新丽鞭毛菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)和黑粉菌属(Ustilago)。作为本发明的亲本宿主细胞的优选丝状真菌物种属于以下属的物种:曲霉属、毁丝霉属、青霉菌属、踝节菌属和木霉属,更优选选自以下物种:黑曲霉(Aspergillusniger)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillusfoetidus)、酱油曲霉(Aspergillussrojae)、烟曲霉(Aspergillusfumigatus)、埃默森踝节菌(Talaromycesemersonii)、米曲霉(Aspergillusoryzae)、嗜热毁丝霉(Myceliophthorathermophila)、里氏木霉(Trichodermareesei)、产黄青霉(Penicilliumchrysogenum)、单纯青霉(Penicilliumsimplicissimum)和巴西青霉(Penicilliumbrasilianum)。“酵母”在本文中定义为真核微生物,并且包括真菌亚门的所有物种(Yeasts:characteristicsandidentification,J.A.Barnett,R.W.Payne,D.Yarrow,2000,3rded.,CambridgeUniversityPress,CambridgeUK;和Theyeasts,ataxonomicstudy,CP.KurtzmanandJ.W.Fell(eds)1998,4thed.,ElsevierSciencePubl.B.V.,Amsterdam,TheNetherlands),其主要以单细胞形式生长。酵母可通过单细胞菌体出芽生长,或者可通过生物体的裂殖生长。用于本发明的优选酵母细胞属于以下属:酵母菌属(Saccharomyces)、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克氏酵母属Kloeckera)、许旺氏酵母属(Schwanniomyces)、耶氏酵母属(Yarrowia)、隐球酵母属(Cryptococcus)、Debaromyces、Saccharomycecopsis、类糖酵母属(Saccharomycodes)、威克酵母属(Wickerhamia)、Debayomyces、有孢汉逊氏酵母属(Hanseniaspora)、Ogataea、Kuraishia、Komagataella、梅奇酵母属(Metschnikowia)、拟威尔氏酵母属(Williopsis)、Nakazawaea、有孢圆酵母属(Torulaspora)、布氏弹孢酵母属(Bullera)、红酵母属(Rhodotorula)和掷孢酵母属(Sporobolomyces)。亲本酵母宿主细胞可以是天然能够厌氧发酵的细胞,更优选醇发酵、最优选厌氧醇发酵。更优选酵母来自以下物种:诸如乳酸克鲁维酵母(Kluyveromyceslactis)、酿酒酵母(S.cerevisiae)、多形汉逊酵母(Hansenulapolymorpha)(新名称:Ogataeahenricii)、解脂耶氏酵母(Yarrowialipolytica)、热带假丝酵母(Candidatropicalis)和巴斯德毕赤酵母(Pichiapastoris)(新名称:Komagataellapastoris)。特别是当与细菌相比时,真菌具有用于工业发酵方法的许多有吸引力的特征,包括例如它们对酸、乙醇和其他有害化合物的高耐受性,它们的高渗透耐受性、它们的高发酵能力以及一些酵母菌具有厌氧生长能力。宿主细胞还优选具有对低pH的高耐受性,即能够在等于或低于5.0、4.0、3.0、2.9、2.8、2.7、2.6、2.5或2.4的pH生长并且对有机酸如乳酸、乙酸或甲酸和呋喃酸类有高耐受性,以及对升高的温度的高耐受性。宿主细胞的任何这些特征或活性可以天然存在于宿主细胞中,或者可以通过遗传修饰、优选通过自克隆或通过下述本发明的方法引入或修饰。合适的细胞是培养的细胞,可在发酵方法中(例如,在深层或固态发酵中)培养的细胞。对于根据本发明的真菌宿主细胞中产生的化合物的具体用途,可以根据这种用途来选择宿主细胞。例如,在根据本发明的宿主细胞中产生的化合物将被用于食品应用中,宿主细胞可以选自食品级生物体,例如,酵母菌属物种(例如酿酒酵母)、食品级青霉菌属物种或解脂耶氏酵母。具体用途包括但不限于食物、(动物)饲料、药物、农业如作物保护和/或个人护理应用。遗传修饰的细胞在第一方面,本发明涉及细胞,优选包含遗传修饰的真菌细胞。细胞的遗传修饰优选为以下至少一种:a)与缺乏遗传修饰的相应野生型细胞相比,赋予细胞将5-羟甲基-2-呋喃羧酸(HMFCA)氧化成5-甲酰-2-糠酸(FFCA)的能力,或者增加细胞中将HMFCA氧化成FFCA的酶的比活性的遗传修饰;和b)与缺乏遗传修饰的相应野生型细胞相比,降低或消除催化2,5-呋喃二羧酸降解的酶的比活性的遗传修饰。具有a)和b)的遗传修饰的优选细胞在下文进一步说明。本发明的细胞还优选包含c)与缺乏遗传修饰的相应野生型细胞相比,赋予细胞将呋喃醛氧化成相应呋喃羧酸的能力或增加细胞中将呋喃醛氧化成相应呋喃羧酸的酶的比活性的遗传修饰。具有c)的遗传修饰的优选细胞也在下文进一步说明。引入或增加HMFCA脱氢酶活性本发明的细胞优选的是具有将5-羟甲基-2-呋喃羧酸(HMFCA)氧化成5-甲酰糠酸(FFCA)的能力的细胞。细胞将HMFCA氧化成FFCA的能力可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过对细胞进行遗传修饰(例如,用包含编码脱氢酶或具有将HMFCA氧化成FFCA的能力的氧化酶的核苷酸序列的核酸构建体转化细胞)。脱氢酶优选是醇脱氢酶(即具有EC1.1活性)赋予细胞或增加细胞内将HMFCA氧化成FFCA的能力。因此,细胞优选为包含用于表达编码脱氢酶或具有将HMFCA氧化成FFCA的能力的氧化酶的核苷酸序列的表达构建体的细胞。在本发明优选的细胞中,与缺乏表达构建体的相应细胞(例如野生型细胞)相比,表达构建体在细胞中是可表达的,并且脱氢酶或氧化酶的表达优选赋予细胞中将HMFCA氧化成FFCA的能力、或增加细胞中将HMFCA氧化成FFCA的酶的比活性。与缺乏表达构建体的相应细胞相比,将HMFCA氧化成FFCA的酶的比活性优选在细胞中增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。具有将HMFCA氧化成FFCA的能力的酶可以是醇脱氢酶或可以是如下文所述的氧化酶的酶。具有将HMFCA氧化成FFCA的能力的优选酶是具有HMFCA脱氢酶活性的醇脱氢酶。可以通过在不能将HMFCA氧化成FFCA的合适宿主细胞中表达多肽,并检测多肽的表达是否赋予细胞将HMFCA氧化成FFCA的能力,来测定多肽是否具有HMFCA脱氢酶活性。HMFCA脱氢酶活性可以例如使用表达构建体测定,其中编码待测定HMFCA脱氢酶活性的多肽的核苷酸序列替换pBT’hmfH-adh(描述于WO2012/064195中)中的C.basilensishmfH基因,之后包含待测定HMFCA脱氢酶活性的多肽的编码序列引入含有pJNNhmfT1(t)(也描述于WO2012/064195中)的恶臭假单胞菌KT2440Δgcd中。将表达待测定HMFCA脱氢酶活性的多肽的恶臭假单胞菌转化体与HMF一起孵育,并且以一定间隔抽取样品用于分析FDCA。与缺乏待测定HMFCA脱氢酶活性的多肽(和C.burilensishmfH基因)的相应恶臭假单胞菌转化体相比,FDCA产生的增加被认为是该多肽具有HMFCA脱氢酶活性的指标。或者,编码待测定HMFCA脱氢酶活性的多肽的核苷酸序列可以在真菌宿主细胞(优选酿酒酵母宿主细胞)中表达,例如,如本文实施例7所述,并检测多肽的表达是否赋予真菌宿主细胞从HMF产生FFCA和/或FDCA的能力。在本发明的细胞中表达的HMFCA脱氢酶优选是依赖于辅因子的脱氢酶,所述辅因子选自腺嘌呤二核苷酸如NADH或NADPH、黄素腺嘌呤二核苷酸(FAD)、黄素单核苷酸(FMN)和吡咯喹啉喹诺酮(PQQ)。在本发明的细胞中表达的HMFCA脱氢酶优选结合二价阳离子,更优选HMFCA脱氢酶是锌结合脱氢酶。在本发明的细胞中表达的HMFCA脱氢酶进一步优选为醇脱氢酶,(也)具有将其他呋喃醇、优选在2-位具有羟基的呋喃醇氧化成相应的醛的能力。因此,HMFCA脱氢酶优选具有将5-羟甲基糠醛(HMF)氧化成2,5-二甲酰呋喃(DFF)的能力。在一个实施方案中,编码具有将HMFCA氧化成FFCA的能力的脱氢酶的核苷酸序列选自以下:(a)编码具有HMFCA脱氢酶活性的多肽的核苷酸序列,该多肽包含的氨基酸序列与SEQIDNO:1-4(分别为hmfL1、hmfL2、hmfL3和hmfL4)中的至少一个、更优选SEQIDNO:1和2中的至少一个的氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、67、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性;(b)其互补链与(a)的核苷酸序列杂交的核苷酸序列;和,(c)由于遗传密码的简并性,其序列与(b)的核苷酸序列的序列不同的核苷酸序列。因此,本发明优选的核苷酸序列编码HMFCA脱氢酶,其氨基酸序列与得自(或天然存在于)选自以下属的真菌的HMFCA脱氢酶的氨基酸序列相同:曲霉属(Aspergillus)、丝衣霉属(Byssochlamys)、球孢菌菌(Coccidioides)、毛壳霉属(Chaetomium)、弯孢壳属(Eutypa)、Endocarpon、镰刀菌属(Fusarium)、小孢子菌属(Microsporum)、Neosartorya、青霉菌属(Penicillium)、Sporothrix和发癣菌属(Trichophyton),更优选地,真菌选自以下物种:粗球孢菌(Coccidioidesimmitis)、Coccidioidesposadasii、Endocarponpusillum、石膏状小孢子菌(Microsporumgypseum)、巴西青霉(Penicilliumbrasilianum)和Sporothrixschenckii,最优选地,真菌是菌株巴西青霉C1(P.brasilianumC1)。在一个实施方案中,所述核苷酸序列如其在自然界中存在的那样(例如它可以从野生型来源生物体中分离)编码具有HMFCA脱氢酶活性的多肽。或者,所述核苷酸序列可以编码上述定义的任何HMFCA脱氢酶的工程化形式,并且与相应的天然存在的HMFCA脱氢酶相比包含一个或多个氨基酸取代、插入和/或缺失,但是在本文定义的相同性或相似性的范围内。因此,在一个实施方案中,本发明的核苷酸序列编码HMFCA脱氢酶,其氨基酸序列至少在每个不可变位置中(在表1-4中用“*”表示)包含存在于不可变位置的氨基酸。优选地,氨基酸序列在强保守位置(在表1-4中以“:”表示)包含存在于强保守位置的氨基酸之一。更优选地,氨基酸序列还进一步在次强保守位置(在表1-4中用“.”表示)包含存在于次强保守位置的氨基酸之一。这些不可变和保守位置以外的氨基酸取代不太可能影响HMFCA脱氢酶活性。表1-4显示了巴西青霉hmfL1、hmfL2、hmfL3和hmfL4各自分别与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表1A-4A提供了巴西青霉序列及其直向同源物之间氨基酸相同性的百分比,以及直向同源物的登记号。编码具有HMFCA脱氢酶活性的多肽的本发明的核苷酸序列可使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork),得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物体的基因组和/或cDNA以产生包含部分编码具有HMFCA脱氢酶活性的多肽的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码具有HMFCA脱氢酶活性的多肽的核苷酸序列的cDNA或基因组DNA。为了增加本发明的HMFCA脱氢酶在本发明的细胞中以足够的水平和活性形式表达的可能性,编码这些酶以及本发明的其它酶(参见下文)的核苷酸序列优选地适应以对讨论中的宿主细胞优化它们的密码子使用。编码多肽的核苷酸序列对宿主细胞的密码子使用的适应性可以表示为密码子适应指数(CAI)。密码子适应指数在本文中定义为基因的密码子使用对特定宿主细胞或生物体中高度表达基因的密码子使用的相对适应性的度量。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸的最丰富密码子的使用的比率。CAI指数被定义为这些相对适应性值的几何平均值。排除非同义密码子和终止密码子(取决于遗传密码)。CAI值范围从0到1,较高的值表示最丰富的密码子的较高比例(参见SharpandLi,1987,NucleicAcidsResearch15:1281-1295;也参见:Jansenetal.,2003,NucleicAcidsRes.31(8):2242-51)。适应的核苷酸序列优选具有至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9的CAI。最优选的是如SEQIDNO:57-59中所列的序列,其已被密码子优化用于在酵母细胞、优选酿酒酵母细胞中表达。待用表达编码本发明的HMFCA脱氢酶的核苷酸序列的核酸构建体转化的真菌宿主细胞原则上可以是任何在其中可以适当地表达HMFCA脱氢酶(优选以功能性即活性形成)发明的真菌宿主细胞。本发明的真菌宿主细胞优选是能够将呋喃化合物主动或被动地转运入细胞以及转运出细胞的宿主细胞。本发明优选的宿主细胞缺乏或没有可检测的降解(例如脱羧)羧化呋喃化合物(例如特别是HMFCA、FFCA和FDCA)的活性。这种宿主细胞优选天然地缺乏降解羧化呋喃化合物的能力。或者,可以对真菌宿主细胞进行遗传修饰以降低或消除一种或多种催化羧化呋喃化合物降解的酶的比活性,如下文所述。用于表达编码本发明HMFCA脱氢酶的核苷酸序列的表达构建体优选是与用该构建体转化的宿主细胞异源或外源的表达构建体。当该构建体包含至少一个不天然存在于宿主细胞中的序列或序列元件时,和/或构建体以组合和/或顺序包含至少两个不天然存在于宿主细胞中的序列元件时,即使元件本身不天然存在于宿主细胞中构建体在本文中被理解为与包含构建体的宿主细胞是异源或外源的。下文更详细地描述了用于在合适的宿主细胞中表达编码本发明的HMFCA脱氢酶的核苷酸序列的载体和表达构建体。引入或增加呋喃醛脱氢酶活性如上所述,表达本发明的HMFCA脱氢酶的细胞还优选具有醛脱氢酶活性(即具有EC1.2活性)。优选地,醛脱氢酶能够转化呋喃醛。更优选地,醛脱氢酶活性能够将呋喃醛氧化成相应的呋喃羧酸。更具体而言,醛脱氢酶活性优选能够具有以下至少一种:i)将HMF氧化成HMFCA,ii)将2,5-二甲酰呋喃(DFF)氧化成5-甲酰-2-糠酸(FFCA),和iii)将FFCA氧化成FDCA。这种呋喃醛脱氢酶活性可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过用表达构建体转化细胞来赋予或增加呋喃醛脱氢酶活性,例如如果细胞已经包含用于表达HMFCA脱氢酶的第一表达构建体,则所述表达构建体为第二表达构建体。在本发明的优选细胞中,用于表达呋喃醛脱氢酶的表达构建体在细胞中是可表达的,并且与缺乏表达构建体的相应细胞例如野生型细胞相比,呋喃醛脱氢酶的表达优选赋予以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA,或者增加细胞中具有至少一种这些能力的呋喃醛脱氢酶的比活性。与缺乏表达构建体的相应细胞相比,呋喃醛脱氢酶的比活性优选在细胞中增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。多肽将以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA,可以通过在恶臭假单胞菌宿主细胞中、优选恶臭假单胞菌KT2440宿主细胞中共表达编码多肽的核苷酸序列和来自C.basilensis的HMF14的HmfH和HmfT1基因来测定,在10mMHMF中孵育恶臭假单胞菌细胞,并且与相应的不表达多肽的恶臭假单胞菌相比检测累积FDCA的增加,例如如WO2012/064195的实施例IV中所述。多肽将HMF氧化成HMFCA的能力也可以如Koopmanetal2010,PNAS(同上)进行测定。表达来自C.basilensisHMF14的HmfT1基因的菌株在本文中理解为表达具有SEQIDNO:53的氨基酸序列的基因产物。或者,与不表达多肽的相应真菌宿主细胞相比,编码待测定其将以下至少一种的氧化能力的多肽可与HMFCA脱氢酶(例如如本文实施例7所述)共表达于真菌宿主细胞(优选酿酒酵母宿主细胞):i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA检测多肽的表达是否导致累积FDCA增加。在本发明的细胞中表达的呋喃醛脱氢酶优选为依赖于辅因子的脱氢酶,所述辅因子选自腺嘌呤二核苷酸如NADH或NADPH、黄素腺嘌呤二核苷酸(FAD)、黄素单核苷酸(FMN)和吡咯喹啉喹诺酮(PQQ)。在一个实施方案中,编码呋喃醛脱氢酶或氧化酶的核苷酸序列选自以下:a)编码具有以下能力中的至少一个的多肽的核苷酸序列:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA的能力中的至少一种,所述多肽包含的氨基酸序列与SEQIDNO:5和6(分别为醛脱氢酶hmfN1和hmfN2)的至少一个的氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70,71,72,73,74,75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性,其中SEQIDNO:5是优选的;b)其互补链与(a)的核苷酸序列杂交的核苷酸序列;和,c)由于遗传密码的简并性,其序列与(b)的核苷酸序列的序列不同的核苷酸序列。因此,本发明优选的核苷酸序列编码呋喃醛脱氢酶,其氨基酸序列与得自(或天然存在于)选自以下属的真菌的呋喃醛脱氢酶的氨基酸序列相同:曲霉属、弯孢壳属、Neosartorya、青霉菌属、Podospora、Scedosporium和Sporothrix,更优选地,真菌选自以下物种:Eutypalata、巴西青霉、Podosporaanserina、Scedosporiumapiospermum和Sporothrixschenckii,最优选地,真菌是菌株巴西青霉C1。在一个实施方案中,所述核苷酸序列如其在自然界中存在的那样(例如它可以从野生型来源生物体中分离)编码具有呋喃醛脱氢酶活性的多肽。或者,所述核苷酸序列可以编码上述定义的任何呋喃醛脱氢酶的工程化形式,并且与相应的天然存在的呋喃醛脱氢酶相比包含一个或多个氨基酸取代、插入和/或缺失,但是在本文定义的相同性或相似性的范围内。因此,在一个实施方案中,本发明的核苷酸序列编码呋喃醛脱氢酶,其氨基酸序列至少在每个不可变位置中(在表5和6中用“*”表示)包含存在于不可变的位置的氨基酸。优选地,氨基酸序列在强保守位置(在表5和6中用“:”表示)包含存在于强保守位置的氨基酸之一。更优选地,氨基酸序列还进一步在次强保守位置(在表5和6中用“.”表示)包含存在于次强保守位置的氨基酸之一。这些不可变和保守位置以外的氨基酸取代不太可能影响呋喃醛脱氢酶活性。表5和6分别显示了巴西青霉hmfN1和hmfN2各自分别与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表5A和6A提供了巴西青霉序列及其直向同源物之间氨基酸相同性的百分比,以及直向同源物的登记号。编码具有呋喃醛脱氢酶活性的多肽的本发明的核苷酸序列可使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork),得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物体的基因组和/或cDNA以产生包含部分编码具有呋喃醛脱氢酶活性的多肽的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码具有呋喃醛脱氢酶活性的多肽的核苷酸序列的cDNA或基因组DNA。待用表达编码本发明的呋喃醛脱氢酶的核苷酸序列的核酸构建体转化的真菌宿主细胞优选为上述用于用核酸构建体转化以表达编码HMFCA脱氢酶并且其中呋喃醛脱氢酶也可适当地表达(优选以功能性即活性形成)的核苷酸序列的真菌宿主细胞。优选地,待用用于表达编码呋喃醛脱氢酶的核苷酸序列的核酸构建体转化的真菌宿主细胞也表达编码HMFCA脱氢酶的核苷酸序列,更优选地,所述细胞包含HMFCA脱氢酶的表达构建体,其赋予或增加细胞中将HMFCA氧化成FFCA的能力。如上所述,这种真菌宿主细胞优选能够将呋喃化合物主动或被动地转运入细胞以及转运出细胞,并且优选缺乏或没有可检测的降解(例如脱羧)羧化呋喃化合物的活性。用于表达编码本发明呋喃醛脱氢酶的核苷酸序列的表达构建体优选是与用该构建体转化的宿主细胞异源或外源的表达构建体。当该构建体包含至少一个不天然存在于宿主细胞中的序列或序列元件时,和/或构建体以组合和/或顺序包含至少两个不天然存在于宿主细胞中的序列元件时,即使元件本身不天然存在于宿主细胞中,构建体在本文中被理解为与包含构建体的宿主细胞是异源或外源的。下文更详细地描述了用于在合适的宿主细胞中表达编码本发明的呋喃醛脱氢酶的核苷酸序列的载体和表达构建体。引入或增加呋喃醇/醛氧化酶活性在一个实施方案中,具有将HMFCA氧化成FFCA的能力的本发明的细胞是表达具有将HMFCA氧化成FFCA的能力的氧化酶的细胞。氧化酶优选能够氧化醇和醛基(位于呋喃化合物C2和C5位)的包含这些基团的呋喃化合物(即具有EC1.1和EC1.2活性)。更具体而言,氧化酶活性优选能够具有以下至少一种:i)将HMF氧化成HMFCA,ii)将HMF氧化成2,5-二甲酰呋喃(DFF),iii)将DFF氧化成5-甲酰-2-糠酸(FFCA),iv)将HMFCA氧化成FFCA,和v)将FFCA氧化成FDCA。这种呋喃氧化酶活性可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过用表达构建体转化细胞来赋予或增加细胞中的呋喃氧化酶活性。用于表达呋喃氧化酶的表达构建体可以是已经包含用于表达HMFCA脱氢酶的表达构建体和用于表达呋喃醛脱氢酶的表达构建体中的至少一种的细胞中的另外的表达构建体。在本发明优选的细胞中,用于表达呋喃氧化酶的表达构建体在细胞中是可表达的,并且与缺乏表达构建体的相应细胞(例如野生型细胞)相比,呋喃氧化酶的表达优选赋予以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA,和v)将FFCA氧化成FDCA,或增加细胞中具有至少一种这些能力的呋喃氧化酶的比活性。与缺乏表达构建体的相应细胞相比,呋喃氧化酶的比活性优选在细胞中增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。可以使用表达构建体测定多肽将以下至少一种的氧化能力:i)将HMF中的氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA,和v)将FFCA氧化成FDCA,其中编码待测定的呋喃氧化酶活性的多肽的核苷酸序列替换pBT’hmfH-adh(描述于WO2012/064195中)中的C.basilensishmfH基因,之后包含待测定氧化酶活性的多肽的编码序列被引入含有pJNNhmfT1(t)(也描述于WO2012/064195)的恶臭假单胞菌KT2440Δgcd中。将表达待测定呋喃氧化酶活性的多肽的恶臭假单胞菌转化体与HMF一起孵育,并且以规则间隔抽取样品以分析FDCA。与缺乏待测定呋喃氧化酶活性的多肽(和C.basilensishmfH基因)的相应恶臭假单胞菌转化体相比,FDCA产生的增加被认为是该多肽具有呋喃氧化酶活性的指标。或者,可以在真菌宿主细胞(优选酿酒酵母宿主细胞)中表达编码待测定多肽将以下至少一种的氧化能力的核苷酸序列:i)将HMF氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA,和v)将FFCA氧化成FDCA,例如,如本文实施例7中所述,并检测多肽的表达是否赋予真菌宿主细胞从HMF产生两种FDCA的能力。在本发明的细胞中表达的呋喃氧化酶优选是依赖于辅因子的氧化酶,所述辅因子选自腺嘌呤二核苷酸如NADH或NADPH、黄素腺嘌呤二核苷酸(FAD)、黄素单核苷酸(FMN)和吡咯喹啉喹诺酮(PQQ)。在一个实施方案中,编码呋喃氧化酶的核苷酸序列选自以下:a)编码具有以下的能力中的至少一种的多肽的核苷酸序列:i)将HMF氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA,和v)将FFCA氧化成FDCA,该多肽包含的氨基酸序列与SEQIDNO:7-9(分别为hmfP1、hmfP2和hmfP3)中的至少一个的氨基酸序列具有45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性;b)其互补链与(a)的核苷酸序列杂交的核苷酸序列;和,c)由于遗传密码的简并性,其序列与(b)的核苷酸序列的序列不同的核苷酸序列。因此,本发明优选的核苷酸序列编码呋喃氧化酶,其氨基酸序列与得自(或天然存在于)选自以下属的真菌的呋喃氧化酶的氨基酸序列相同:曲霉属、节皮菌属(Arthroderma)、小孢子菌属、Neosartorya、青霉菌属、踝节菌属和发癣菌属,更优选地,真菌选自以下物种:Arthrodermaotae、石膏状小孢子菌和巴西青霉菌,最优选的真菌为巴西青霉C1菌株。在一个实施方案中,所述核苷酸序列编码如其在自然界中存在的那样(例如它可以从野生型来源生物体中分离)编码具有呋喃氧化酶活性的多肽。或者,所述核苷酸序列可以编码上述定义的任何呋喃氧化酶的工程化形式,并且与相应的天然存在的呋喃氧化酶相比包含一个或多个氨基酸取代,插入和/或缺失,但是在本文所定义的相同性或相似性的范围内。因此,在一个实施方案中,本发明的核苷酸序列编码呋喃氧化酶,其氨基酸序列至少在每个不可变位置(在表7-9中用“*”表示)包含存在于不可变位置的氨基酸。优选地,氨基酸序列还在强保守位置(在表7-9中用“:”指示)包含存在于强保守位置的氨基酸之一。更优选地,氨基酸序列还进一步在次强保守位置(在表7-9中以“.”表示)包含存在于进一步次强保守位置的氨基酸之一。这些不可变和保守位置以外的氨基酸取代不太可能影响呋喃醛脱氢酶或氧化酶活性。表7-9显示了巴西青霉hmfP1、hmfP2和hmfP3各自分别与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表7A-9A提供了巴西青霉序列及其直向同源物之间氨基酸相同性的百分比,以及直向同源物的登记号。编码具有呋喃氧化酶活性的多肽的本发明的核苷酸序列可使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork),得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物的基因组和/或cDNA以产生包含部分编码具有呋喃氧化酶活性的多肽的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码具有呋喃氧化酶活性的多肽的核苷酸序列的cDNA或基因组DNA。待用表达编码本发明的呋喃氧化酶的核苷酸序列的核酸构建体转化的真菌宿主细胞,优选是上述用于用核酸构建体转化以表达编码HMFCA脱氢酶并且其中呋喃氧化酶可以适当地表达(优选以功能性即活性形成)的核苷酸序列的真菌宿主细胞,。如上所述,这种真菌宿主细胞优选能够将呋喃化合物主动或被动地转运入细胞以及转运出细胞,并且优选缺乏或没有可检测的降解(例如脱羧)羧化呋喃化合物的活性。用于表达编码本发明的呋喃氧化酶的核苷酸序列的表达构建体优选是与用该构建体转化的宿主细胞异源或外源的表达构建体。当该构建体包含至少一个不天然存在于宿主细胞中的序列或序列元件时,和/或构建体以组合和/或顺序包含至少两个不天然存在于宿主细胞中的序列元件时,即使元件本身不天然存在于宿主细胞中,构建体在本文中被理解为与包含构建体的宿主细胞是异源或外源的。下文更详细地描述了用于在合适的宿主细胞中表达编码本发明的呋喃氧化酶的核苷酸序列的载体和表达构建体。缺少或降低或消除FDCA分解代谢和/或HMF代谢的替代途径本发明的细胞优选是缺乏降解FDCA能力的细胞。细胞可以是天然缺乏降解FDCA能力的真菌物种的。或者,细胞可以是天然具有降解FDCA能力的真菌物种的遗传修饰的细胞,该细胞已被遗传修饰以降低或消除其降解FDCA的天然能力。给定的真菌菌株是否天然具有降解FDCA的能力可以通过测定菌株消耗HMF、HMF-醇、HMFCA和FDCA中的一种或多种作为唯一碳源来生长的能力,例如,如本文实施例中所述。如本文实施例所示,天然具有降解FDCA能力的真菌物种的实例是巴西青霉。相反,酵母如酵母菌属和耶氏酵母属物种是天然缺乏降解FDCA能力的真菌物种的实例。因此,在本发明的一个实施方案中,细胞被遗传修饰以降低或消除细胞降解FDCA的天然能力。用于降低或消除细胞降解FDCA的能力的待修饰基因可以是以下至少一种:编码FDCA脱羧单加氧酶的基因、编码FDCA脱羧酶的基因、编码FDCA脱羧脱氢酶的基因和编码内酯酶(能够水解由FDCA脱羧导致的内酯)的基因。编码FDCA脱羧单加氧酶的基因将被修饰以降低或消除本发明细胞中FDCA脱羧单加氧酶的比活性,优选编码与SEQIDNO:10和11(分别为hmfK1和hmfK2)中的至少一个具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的的氨基酸序列的基因,其中优选SEQIDNO:10。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,FDCA脱羧单加氧酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。编码FDCA脱羧酶的基因将被修饰以降低或消除本发明细胞中FDCA脱羧酶的比活性,优选编码与SEQIDNO:12(hmfQ)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列的基因。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,FDCA脱羧酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。编码FDCA脱羧脱氢酶的基因将被修饰以降低或消除本发明细胞中FDCA脱羧脱氢酶的比活性,优选编码与SEQIDNO:13(hmfU)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列的基因。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,FDCA脱羧脱氢酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。不希望受理论束缚,由FDCA脱羧导致的内酯被认为对FDCA羧化酶产生产物抑制。因此,用于降低或消除细胞降解FDCA的能力的替代手段是降低或消除本发明细胞中能够水解由FDCA脱羧产生的内酯的内酯酶的比活性。编码这种将被修饰以降低或消除能够水解由FDCA脱羧产生的内酯的内酯酶的比活性的内酯酶的基因,优选编码与SEQIDNO:14(hmfO)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列的基因。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,内酯酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。用于代谢HMF和其他FDCA的呋喃前体的替代内源途径也可存在于本发明的细胞中。这种替代途径与从HMF和其他FDCA的呋喃前体产生FDCA相竞争。因此,优选地,在本发明的细胞中,这种替代途径中的酶的比活性也被降低或消除。一种这种内源替代途径是例如将HMF和/或FFCA通过脱氢酶(例如短链脱氢酶)还原成相应的醇。编码这种短链脱氢酶的基因将被修饰以降低或消除用于代谢HMF和其他FDCA的呋喃前体的替代途径的比活性,优选编码与SEQIDNO:15(hmfM)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列的基因。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,短链脱氢酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。已知将HMF还原成HMF-醇的另一种内源脱氢酶是由Peterssonetal.(2006、Yeast、23:455-464)描述的由酿酒酵母ADH6基因编码的NADPH依赖性醇脱氢酶。因此,为了降低或消除用于代谢HMF的替代途径的比活性而被修饰的基因优选是酿酒酵母ADH6基因或其在另一真菌宿主物种中的直向同源物。因此,优选地,为了降低或消除NADPH依赖性HMF-还原脱氢酶的比活性而修饰的基因是编码与SEQIDNO:69(酿酒酵母ADH6)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列的基因。在本发明的细胞中,与除了导致活性降低的遗传修饰之外的遗传上相同的菌株的细胞相比,NADPH依赖性HMF-还原脱氢酶的比活性优选降低至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。编码在本发明的细胞中酶的比活性优选降低或消除的酶的本发明的核苷酸序列,得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA并可在其中鉴定,并且可以使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork)。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物体的基因组和/或cDNA以产生包含部分编码在本发明的细胞中酶的比活性优选降低或消除的酶的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码在本发明的细胞中酶的比活性优选降低或消除的酶的核苷酸序列的cDNA或基因组DNA。这些保守序列可以在表10-15中给出的序列比对中鉴定,其中不可变位置用“*”表示,而强保守位置用“:”表示。本发明合适的宿主细胞也可以衍生自表10-15,其中宿主优选属于与在表10-15中鉴定的直向同源物的来源生物体相同的门、纲、目、科或属的非致病性真菌或酵母。表10-15显示了巴西青霉hmfK1、hmfK2、hmfQ、hmfU和hmfM各自分别与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表10A-15A提供了巴西青霉序列及其直向同源物之间氨基酸相同性的百分比,以及直向同源物的登记号。表达呋喃化合物转运蛋白的细胞如上所述,本发明的细胞进一步优选表达编码具有呋喃化合物转运能力的多肽的一个或多个核苷酸序列。这种具有呋喃化合物转运能力的多肽可以是细胞的内源活性或者是赋予细胞的外源活性。优选地,通过用表达构建体转化细胞来赋予或增加细胞中具有呋喃化合物转运能力的多肽的活性,例如如果细胞已经包含用于表达HMFCA脱氢酶或氧化酶的第一表达构建体和用于表达呋喃醛脱氢酶或氧化酶的第二表达构建体,则所述表达构建体为第三表达构建体。优选地,用表达构建体转化细胞以表达编码具有呋喃化合物转运能力的多肽的核苷酸序列。具有呋喃化合物转运能力的多肽优选地是具有HMFCA转运能力的多肽,其至少包括将HMFCA转运入细胞中的能力。优选地,细胞包含表达构建体用于表达编码具有至少将HMFCA转运入细胞的能力的多肽的核苷酸序列,所述多肽包含与SEQIDNO:16-18(分别为hmfT3、hmfT4和hmfT5)中的至少一个具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列,其中所述表达构建体在细胞中是可表达的,并且与缺乏表达构建体的相应野生型细胞相比,所述多肽的表达赋予或增加细胞中至少将HMFCA转运入细胞中的能力。多肽将呋喃化合物、特别是HMFCA转运入细胞的能力可以通过在酵母宿主细胞(优选酿酒酵母CEN.PK宿主细胞)中共表达编码转运蛋白多肽的核苷酸序列与来自C.basilensisHMF14的HmfH基因和编码与来自C.basilensisHMF14(具有WO2012/064195SEQIDNO:19的氨基酸序列)的HMF-降解操纵子相关的呋喃醛脱氢酶的基因来测定,在4mMHMF中孵育转化的酿酒酵母细胞,并且与不表达转运蛋白多肽的相应(即其他方面相同)酿酒酵母细胞相比,检测到累积FDCA的增加,例如如本文实施例6中所述。因此,本发明优选的核苷酸序列编码呋喃化合物转运蛋白多肽,其氨基酸序列与得自(或天然存在于)选自以下属的真菌的呋喃化合物转运蛋白多肽的氨基酸序列相同:曲霉属、镰刀菌属、丛赤壳菌属(Nectria)、青霉菌属、Sporothrix和Togninia,更优选地,真菌选自以下物种:土曲霉(Aspergillusterreus)、巴西青霉、指状青霉(Penicilliumdigitatum)、Penicilliumrubens、Sporothrixschenckii和Togniniaminima,最优选地,真菌为菌株巴西青霉C1。在一个实施方案中,所述核苷酸序列如其在自然界中存在的那样(例如它可以从野生型来源生物体中分离)编码呋喃化合物转运蛋白多肽。或者,所述核苷酸序列可以编码上述定义的任何呋喃化合物转运蛋白多肽的工程化形式,并且与相应的天然存在的呋喃化合物转运蛋白多肽相比包含一个或多个氨基酸取代、插入和/或缺失,但是在本文定义的相同性或相似性的范围内。因此,在一个实施方案中,本发明的核苷酸序列编码呋喃化合物转运蛋白多肽,其氨基酸序列至少在每个不可变位置(在表16-18中用“*”表示)包含存在于不可变位置的氨基酸。优选地,氨基酸序列还在强保守位置(在表16-18中用“:”指示)包含存在于强保守位置的氨基酸之一。更优选地,氨基酸序列还进一步在次强保守位置(在表16-18中以“.”表示)包含存在于次强保守位置的氨基酸之一。这些不可变和保守位置以外的氨基酸取代不太可能影响呋喃化合物转运蛋白多肽活性。表16-18分别显示了巴西青霉hmfT3、hmfT4和hmfT5各自分别与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表16A-18A提供了巴西青霉序列及其直向同源物之间氨基酸相同性百分比,以及直向同源物的登记号。编码具有呋喃化合物转运蛋白活性的多肽的本发明的核苷酸序列可使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork),得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物体的基因组和/或cDNA以产生包含部分编码具有呋喃化合物转运蛋白活性的多肽的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码具有呋喃化合物转运蛋白活性的多肽的核苷酸序列的cDNA或基因组DNA。待用表达编码呋喃化合物转运蛋白多肽的核苷酸序列的核酸构建体转化的真菌宿主细胞优选为如上所述的本发明的真菌宿主细胞。用于表达编码呋喃化合物转运蛋白多肽的核苷酸序列的表达构建体优选是与用该构建体转化的宿主细胞异源或外源的表达构建体。当该构建体包含至少一个不天然存在于宿主细胞中的序列或序列元件时,和/或构建体以组合和/或顺序包含至少两个不天然存在于宿主细胞中的序列元件时,即使元件本身不天然存在于宿主细胞中,构建体在本文中被理解为与包含构建体的宿主细胞是异源或外源的。下文更详细地描述了用于在合适的宿主细胞中表达编码本发明的呋喃化合物转运蛋白多肽的核苷酸序列的载体和表达构建体。具有改变的转录激活物表达调节的细胞在本发明的细胞的一个实施方案中,参与呋喃分解代谢的基因的转录激活物的表达调节被改变。可以降低或消除转录激活物的表达,以防止含有FDCA降解的内源基因的细胞中FDCA的降解,并且优选含有编码用于将HMF转化成FDCA的酶的基因(其表达独立于转录激活物)。或者,可以在遗传修饰的细胞中增加转录激活物的表达和/或成为组成型以防止FDCA降解,从而增加用于将HMF和/或其他呋喃前体转化成FDCA的内源基因的表达。优选地,在本发明的细胞中,转录激活物(其表达调节被改变)由编码包含氨基酸序列的多肽的核苷酸序列编码,所述氨基酸序列与SEQIDNO:19(hmfR)具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性,其中所述多肽具有激活参与呋喃分解代谢的至少一个基因的转录的能力。因此,本发明优选的核苷酸序列编码转录激活物,其氨基酸序列与得自(或天然存在于)镰刀菌属、青霉菌属、Scedosporium、Sporothrix和Stachybotrys,更优选地,真菌选自以下物种:尖孢镰孢(Fusariumoxysporum)、巴西青霉、Scedosporiumapiospermum、Sporothrixschenckii和Stachybotryschlorohalonata,最优选地,真菌为菌株巴西青霉C1。在一个实施方案中,所述核苷酸序列如其在自然界中存在的那样(例如它可以从野生型来源生物体中分离)编码转录激活物。或者,所述核苷酸序列可以编码上述定义的任何转录激活物多肽的工程化形式,并且与相应的天然存在的转录激活物多肽相比包含一个或多个氨基酸取代、插入和/或缺失,但是在本文定义的相同性或相似性的范围内。因此,在一个实施方案中,本发明的核苷酸序列编码转录激活物多肽,其氨基酸序列至少在每个不可变位置中(在表19中用“*”表示)包含存在于不可变位置的氨基酸。优选地,氨基酸序列在强保守位置(在表19中以“:”表示)包含存在于强保守位置的氨基酸之一。更优选地,氨基酸序列还进一步在次强保守位置(在表19中用“.”表示)包含存在于次强保守位置的氨基酸之一。这些不可变和保守位置以外的氨基酸取代不太可能影响转录激活物活性。表19显示了巴西青霉hmfR与其在公共数据库中可用的10个最接近的直向同源物的氨基酸序列比对。表19A提供了巴西青霉序列及其直向同源物之间氨基酸相同性的百分比,以及直向同源物的登记号。编码具有转录激活物活性的多肽的本发明的核苷酸序列可使用本领域本身熟知的分离核苷酸序列的方法(参见例如SambrookandRussell(2001)″MolecularCloning:ALaboratoryManual(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress,NewYork),得自真菌、酵母或细菌(例如一种属于与上述来源生物体相同的门、纲或属)的基因组和/或cDNA。本发明的核苷酸序列例如可以通过以下方法获得:a)简并PCR引物(基于保守氨基酸序列设计)是用于合适生物体的基因组和/或cDNA以产生包含部分编码具有转录激活物活性的多肽的核苷酸序列的PCR片段;b)将a)中获得的PCR片段用作探针以筛选生物体的cDNA和/或基因组文库;和c)产生包含编码呋喃转录激活物的多肽的核苷酸序列的cDNA或基因组DNA。待用表达编码呋喃转录激活物多肽的核苷酸序列的核酸构建体转化的真菌宿主细胞优选是如上所述的本发明的真菌宿主细胞。用于表达编码呋喃转录激活物多肽的核苷酸序列的表达构建体优选是与用该构建体转化的宿主细胞异源或外源的表达构建体。当该构建体包含至少一个不天然存在于宿主细胞中的序列或序列元件时,和/或构建体以组合和/或顺序包含至少两个不天然存在于宿主细胞中的序列元件时,即使元件本身不天然存在于宿主细胞中,构建体在本文中被理解为与包含构建体的宿主细胞是异源或外源的。下文更详细地描述了用于在合适的宿主细胞中表达编码本发明的呋喃转录激活物多肽的核苷酸序列的载体和表达构建体。用于本发明细胞的遗传修饰的载体、遗传构建体和方法用于本发明的亲本宿主细胞的遗传修饰,即用于构建本发明的修饰的宿主细胞,使用本领域通常已知的标准遗传和分子生物学技术,并且已描述于例如SambrookandRussell(2001,″Molecularcloning:alaboratorymanual″(3rdedition),ColdSpringHarborLaboratory,ColdSpringHarborLaboratoryPress)和Ausubeletal.(1987,eds.,″Currentprotocolsinmolecularbiology″,GreenPublishingandWileyInterscience,NewYork)。更具体地,用于酵母遗传修饰的手段和方法是标准的并且是本领域技术人员已知的,包括例如用于(过)表达基因的启动子、游离型和/或整合型表达构建体和载体、选择标记、用于破坏和/或缺失内源酵母基因或其部分的方法和遗传构建体、以及用于转化酵母的方法。这些手段和方法描述于例如:Shermanetal,MethodsYeastGenetics,ColdSpringHarborLaboratory,NY(1978);Guthrieetal.(Eds.)GuideToYeastGeneticsandMolecularBiologyVol.194,AcademicPress,SanDiego(1991);Sudbery,P.E.(2001)GeneticEngineeringofYeast,inBiotechnologySet,SecondEdition(edsH.-J.RehmandG.Reed),Wiley-VCHVerlagGmbH,Weinheim,Germany.doi:10.1002/9783527620999.chi3a;和Gaillardin,C.andHeslot,H.(1988),GeneticengineeringinYarrowialipolytica.J.BasicMicrobiol.,28:161-174.doi:10.1002/jobm.3620280303;所有这些通过引用并入本文。相似地,用于丝状真菌遗传修饰的手段和方法是标准的并且是本领域技术人员已知的,包括例如用于(过)表达基因的启动子、游离型和/或整合型表达构建体和载体、选择标记、用于破坏和/或缺失内源真菌基因或其部分的方法和遗传构建体、以及用于转化丝状真菌的方法。这些手段和方法描述于例如Moore,M.M.(2007,“Geneticengineeringoffungalcells”,InBiotechnologyVol.III.(Ed.H.W.DoelleandE.J.Dasilva),EOLSS,Ontario,Canada.pp.36-63;Lubertozzi,D.,&Keasling,J.D.(2009),“DevelopingAspergillusasahostforheterologousexpression”,Biotechnologyadvances,27(1),53-75;Meyer,V.(2008)“Geneticengineeringoffilamentousfungi--progress,obstaclesandfuturetrends”,BiotechnologyAdvances,(26),177-85;KückandHoff(2010)“Newtoolsforthegeneticmanipulationoffilamentousfungi.Appliedmicrobiologyandbiotechnology”,86(1),51-62;和WO2014/142647,所有这些通过引用并入本文。因此,在另一方面,本发明涉及核酸构建体,例如载体,包括克隆和表达载体,其包含本发明的多核苷酸,例如编码本发明HMFCA脱氢酶或呋喃醛脱氢酶或其功能等价的核苷酸序列,以及用此类载体转化或转染合适的宿主细胞的方法。如本文所用,术语“载体”和“构建体”可互换使用,并且是指包含本发明多核苷酸的构建的核酸分子。根据本发明的载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒。或者,载体可以是当被引入宿主细胞时整合到宿主细胞基因组中并与已整合到其中的染色体一起复制的载体。为了方便起见,载体可以是穿梭载体,并且其包含用于细菌如大肠杆菌的复制起点和选择标记,以易于操作和生产。在一个实施方案中,核酸构建体是包含编码待(过)表达的本发明多肽的核苷酸序列的表达构建体或表达载体,并且其中编码多肽的核苷酸序列可操作地连接至能够影响和控制讨论中的宿主细胞中编码核苷酸序列的表达(速率)的调节序列上。这种调节序列通常至少包括作用于控制编码序列转录的启动子,其通常位于编码序列的上游,并且优选可操作地连接编码序列。除启动子外,上游转录调节序列还可包含其他元件,例如增强子、上游激活序列、转录因子结合位点、阻抑物和激活物蛋白结合位点等。启动子序列通常包括(一或多个)转录起始位点。在上述引用的参考文献中描述了用于在酵母或丝状真菌中表达编码序列的合适启动子和转录调节序列。在启动子和(一或多个)转录起始位点的下游,表达构建体将包含翻译起始密码子(即编码序列的第一个密码子)周围的翻译起始序列,例如真核Kozak共有序列。编码序列以翻译终止密码子终止。在编码序列的下游,表达构建体可包含含有一个或多个转录终止位点的3’非翻译区,例如终止子,其优选还包括聚腺苷酸化位点。终止子的来源并不重要。例如终止子可对编码多肽的DNA序列而言是天然的。然而,优选在酵母宿主细胞中使用酵母终止子,并且在丝状真菌宿主细胞中使用丝状真菌终止子。更优选地,终止子对于宿主细胞而言是内源的(其中编码多肽的核苷酸序列将被表达)。包含与适当的上游和下游调节序列可操作地连接的编码序列的功能性表达单元可以称为表达盒。本发明的表达载体或表达构建体可包含多于一个表达盒,任选地用于表达多于一个不同的编码序列。除了至少一个表达盒之外,本发明的表达载体或表达构建体优选还包含用于选择用载体或构建体转化的宿主细胞的选择标记。在一个优选的实施方案中,在表达载体或表达载体中的选择标记处于一旦在初始选择转化体后的宿主细胞中,允许从所述表达构建体/载体中切除标记的构型中,例如使用如EP0635574中所述的同源重组或使用Güildeneretal.(1996,NucleicAcidsRes.24:2519-2524)所述的Cre-lox系统。本发明进一步涉及制备本发明多肽的方法,例如,具有HMFCA脱氢酶活性的多肽、具有呋喃醛脱氢酶活性的多肽和包括在本发明的细胞中其表达将被降低/消除的多肽。该方法包含在有助于表达多肽的条件下培养根据本发明的细胞,并且任选地回收所表达的多肽。本发明还涉及通过这种方法获得的多肽。因此,另一方面,本发明涉及用于修饰本发明细胞中的内源靶基因以降低或消除所编码的靶蛋白的表达和/或活性的手段和方法。可用于降低或消除靶蛋白表达的修饰是破坏,包括但不限于缺失整个基因或编码靶蛋白的基因的一部分,(在启动子或编码区中)将DNA片段插入靶基因使得蛋白质不表达或以较低水平表达,向靶编码区引入突变(其添加终止密码子或移码)使得功能性蛋白不被表达,并且将一或多个突变引入靶编码区以改变氨基酸从而表达非功能性靶蛋白或具有降低的酶活性的靶蛋白。此外,靶基因的表达可以通过反义RNA或干扰RNA的表达来阻断,并且可以引入导致共抑制的构建体。此外,可以合成靶编码序列,由于罕用密码子取代了丰富密码子,所以其表达将会变低。优选地,这种次优编码序列将具有小于0.5、0.4、0.3、0.2或0.1的密码子适应指数(见上文)。这种次优编码序列将产生相同的多肽,但由于效率低的翻译而以较低的速率产生。另外,转录物的合成或稳定性可以通过突变而降低。相似地,可以通过突变来调节蛋白质从mRNA翻译的效率,例如,通过使用次优翻译起始密码子。本领域技术人员利用编码靶蛋白的序列可以容易地实施所有这些方法。具体而言,围绕靶编码序列的基因组DNA序列对使用同源重组的修饰方法是有用的。例如,在该方法中,将靶基因侧翼的序列置于选择标记基因的任一位点上以介导同源重组,由此标记基因取代靶基因。也可以使用部分靶基因序列和与选择标记基因结合的靶基因侧翼序列来介导同源重组,由此标记基因置换靶基因的一部分。另外,失活构建体中的选择标记可以以这样的方式构型,以便一旦整合到宿主细胞的基因组中时,允许从失活构建体表达构建体/载体中切除标记,例如,使用如EP0635574中所述的同源重组,或使用Güldeneretal.(1996,NucleicAcidsRes.24:2519-2524)所述的Cre-lox系统。靶基因的缺失也可使用有丝分裂重组来实现,如描述于Wachetal.(1994,Yeast10:1793-1808)。该方法涉及制备在基因组区域之间含有选择标记的DNA片段,其可以短至20bp,并且其结合,即位于靶DNA序列的侧翼。该DNA片段可以通过使用作为与标记基因的末端杂交并且包括可以与真菌基因组重组的基因组区域的引物寡核苷酸通过PCR扩增选择标记基因来制备。线性DNA片段可被有效地转化到酵母或丝状真菌中,并重组到基因组中,导致包括缺失靶DNA序列的基因置换(如MethodsinEnzymology,1991,v194,pp281-301所述)。此外,可使用启动子置换方法来交换内源转录控制元件,从而允许另一种调节表达的手段,如Mnaimnehetal.(2004,Cell118(1):31-44)和本文的实施例中所描述的。另外,可以使用随机诱变破坏任何细胞中的靶蛋白或基因的活性,然后进行筛选以鉴定具有降低的靶蛋白活性的菌株。使用这种类型的方法,编码靶蛋白或影响该靶蛋白表达的任何其他基因组区域的DNA序列都不需要知道。产生遗传突变的方法在本领域中是常见的并且是熟知的,并且可以应用于产生突变体的实践。常用的随机遗传修饰方法(综述于MethodsinYeastGenetics,2005,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.)包括自发诱变、由增变基因引起的诱变、化学诱变、用UV或X-射线照射、或转座子诱变。真菌的化学诱变通常涉及用以下DNA诱变剂之一处理细胞:甲磺酸乙酯(EMS)、亚硝酸、硫酸二乙酯或N-甲基-N’-硝基-N-亚硝基胍(MNNG)。Spenceretal(MutagenesisinYeast,1996,YeastProtocols:MethodsinCellandMolecularBiology.HumanaPress,Totowa,N.J.)中已对这些诱变方法进行了综述。可以按照MethodsinYeastGenetics,2005,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.中所述进行用EMS进行化学诱变。也可以使用紫外线(UV)光或X射线照射在酵母细胞中产生随机诱变。通过UV照射诱变的主要作用是形成破坏DNA复制保真性的嘧啶二聚体。Spenceretal(MutagenesisinYeast,1996,YeastProtocols:MethodsinCellandMolecularBiology.HumanaPress,Totowa,N.J.)中可找到用于酵母UV诱变的方案。引入增变表型也可用于在酵母中产生随机染色体突变。常见的增变表型可通过破坏以下一种或多种基因获得:PMS1、MAG1、RAD18或RAD51。通过插入野生型等位基因可以容易地获得非增变表型的恢复。可以筛选由任何这些或其他已知的随机诱变方法产生的修饰细胞的集合来降低靶蛋白的活性(US20090305363)。呋喃化合物氧化的方法另一方面,本发明涉及氧化呋喃化合物的方法。特别地,本发明涉及其中FDCA的呋喃前体被氧化的方法。本发明的方法可包含产生产物的单个氧化反应步骤(例如将HMFCA氧化成FFCA)。或者,本发明的方法可包含多于一个的氧化反应步骤,每个步骤产生中间体,其中最后的中间体是终产物。这种一系列步骤(其中HMF在连续氧化步骤中被氧化成FDCA)的实例包括例如:1)HMF首先被氧化成HMFCA,其在第二步中被氧化成FFCA,然后其最终被氧化成FDCA,或者可选地,如Dijkmanetal.(2014,Angew.Chem.53(2014)6515-8)2)所述,HMF首先被氧化成DFF,其在第二步中被氧化成FFCA,然后其最终被氧化成FDCA。因此,在本发明的优选方法中,FDCA的一种或多种呋喃前体在一系列步骤中被氧化成最终的FDCA。在一个实施方案中,本发明涉及至少包含将HMFCA氧化成FFCA的方法。优选地,该方法是用于将HMFCA氧化成FFCA的方法,其中该方法包含在HMFCA的存在下孵育细胞的步骤。细胞优选是表达具有将HMFCA氧化成FFCA的能力的酶的细胞。细胞可以是经遗传修饰以具有将HMFCA氧化成FFCA的能力的细胞。在优选的实施方案中,细胞是如上文或下文所定义的真菌。优选地,细胞在HMFCA存在下,在有助于细胞氧化HMFCA的条件下孵育,例如,如下所述。在另一个实施方案中,本发明涉及产生FDCA的方法。产生FDCA的方法优选包括在包含FDCA的一种或多种呋喃前体的培养基中孵育细胞的步骤。细胞优选是表达一种或多种具有将FDCA的呋喃前体转化成FDCA的能力的细胞。具有将FDCA的呋喃前体转化成FDCA的能力的酶可以是具有如上所述的具有醇和/或醛脱氢酶活性、和/或醇和/或醛氧化酶活性的酶,包括示例性的真菌酶。因此,在优选的实施方案中,细胞是如上文所定义的细胞,优选真菌细胞。然而,或者,细胞优选真菌细胞表达具有将FDCA的呋喃前体转化成FDCA的能力的细菌酶。这种细菌酶例如包括如WO2011/26913中所述的来自Cupriavidusbasilensis菌株HMF14的HmfH氧化酶和/相关氧化酶。因此,优选真菌细胞表达在FDCA的呋喃前体上具有EC1.1和EC1.2中的至少一种活性的氧化酶,其中所述氧化酶优选包含与SEQIDNO:44(C.basilensisHMF14HmfH氧化酶的氨基酸序列)的氨基酸序列具有至少45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列相同性的氨基酸序列。细胞,优选真菌细胞,可以进一步表达具有醛脱氢酶活性(即EC1.2活性)的细菌酶,例如,如WO2012/64195中所述的来自Cupriavidusbasilensis菌株HMF14的醛脱氢酶和相关脱氢酶。优选地,醛脱氢酶活性能够转化呋喃醛。更优选地,醛脱氢酶活性能够将呋喃醛氧化成相应的呋喃羧酸。更具体而言,醛脱氢酶活性优选能够具有以下至少一种:i)将HMF氧化成HMFCA,ii)将2,5-二甲酰呋喃(DFF)氧化成5-甲酰-2-糠酸(FFCA),和iii)将FFCA氧化成FDCA。优选地,所述醛脱氢酶包含与SEQIDNO:45、46、47、48、49、50和51中任一氨基酸序列具有至少45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列相同性的氨基酸序列。细胞,优选真菌细胞,可以进一步表达具有呋喃化合物转运能力的多肽,优选具有HMFCA转运能力的多肽,例如,如WO2012/64195中所述来自Cupriavidusbasilensis菌株HMF14的HmfT转运蛋白和相关转运蛋白。HMFCA转运能力被理解为至少包括将HMFCA转运到细胞中的能力。优选地,具有呋喃化合物转运能力的多肽包含与SEQIDNO:52、53、54、55和56中任一氨基酸序列具有至少45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99或100%序列相同性的氨基酸序列。优选地,细胞在FDCA的一种或多种呋喃前体的存在下,在有助于细胞将FDCA的呋喃前体氧化成FDCA的条件下孵育。如下所述。优选在该方法中,至少一种FDCA的呋喃前体选自HMF、DHF,HMFCA、FFCA和DFF,其中HMF是最优选的。FDCA的呋喃前体优选得自一种或多种己糖,优选以常规方式通过酸催化脱水获得,例如在酸存在下通过加热。由果糖生成HMF的技术已经很好地建立并且稳健(参见例如vanPuttenetal.,2013,Chem.Rev.113,1499-1597)。也可以使用富含葡萄糖的原料,但从果糖更有效地热化学形成HMF进行。因此,可包括额外的酶促步骤以使用葡萄糖异构酶的将葡萄糖转化成果糖。后一种方法在食品工业中已经很好地建立,例如从水解淀粉产生高果糖玉米糖浆(HFCS)。葡萄糖也可以通过使用催化剂和溶剂的组合经化学异构为果糖,例如如vanPuttenetal.(2013,同上)所述。己糖通常得自生物质。术语“生物质”被理解为意指来自农业(包括植物如作物残余物和动物物质)、林业(如木材资源)和相关产业(包括渔业和水产业)的生物来源的可生物降解的产物、废物和残余物级分,以及可生物降解的工业和城市废物如城市固体废物或废纸的级分。在一个优选的实施方案中,生物质是植物生物质,更优选是(可发酵的)己糖/葡萄糖/富含糖的生物质,例如甘蔗,含淀粉的生物质,例如小麦籽粒或玉米秸秆,或甚至谷物如玉米、小麦、大麦或其混合物。优选天然富含果聚糖的农作物(例如洋姜或菊苣根)。己糖可以通过水解这种生物质而获得。水解生物质的方法本身在本领域中是已知的,并且包括使用例如蒸气和/或糖酶如葡糖淀粉酶。用于本发明方法的另一种优选类型的生物质是所谓的“第二代”木质纤维素原料,如果以更可持续的方式产生大量的FDCA,则这是优选的。木质纤维素原料可以得自专用能源作物,例如,在边缘土地上种植,因此不会直接与粮食作物竞争。或木质纤维素原料可作为副产物获得,例如,可以考虑城市固体废物、废纸、木材残余物(包括锯木和造纸废弃物)和作物残余物。农作物残余物的实例包括来自甘蔗的甘蔗渣以及几种玉米和小麦的废物。在玉米副产物的情况下,三种废物是纤维、玉米棒和秸秆。此外,林业生物质可用作原料。为了将第二代原料转化成本发明的发酵产物,纤维素和半纤维素需要释放为单糖。至此,应用热化学方法(通常称为预处理)、酶促方法或两种方法的组合。预处理可以完全释放糖,或使聚合化合物更容易受到随后的酶攻击。不同类型的预处理包括液体热水、蒸汽喷发、酸预处理、碱预处理和离子液体预处理。各种化合物的相对量取决于所用的原料和采用的预处理。为了从这种木质纤维素原料中释放单糖,采用适当的糖酶,包括例如阿拉伯糖酶、木聚糖酶、葡聚糖酶、淀粉酶、纤维素酶、葡聚糖酶等。本发明的氧化方法优选在对细胞和/或细胞中包含的氧化还原酶最佳的温度中进行。因此,在嗜热细胞和/或嗜热酶的情况下,温度优选在40至65℃的范围,例如,至少40、42或45℃和/或不高于例如65、60、55或50℃。但是,在来自嗜常温微生物的嗜常温细胞和/或酶的情况中,氧化反应优选在相对温和的温度中进行,例如,在10-45℃的范围,更优选在20-40℃的范围,例如至少10、15、18、20、22或25℃和/或不高于例如45、42、40、38、35、32或30℃。本发明的氧化方法优选在酸性pH进行。下游方法(DSP),即回收和纯化,在任何生物技术方法中都受到普遍关注,但特别是在用于聚合物产生的单体化合物的产生中,因为单体的纯度在受控聚合物形成中是必不可少的。在pH值低于3时(具有约2.28的pKa),FDCA具有有限的溶解度。当该过程在酸性pH进行时,所产生的FDCA将从其产生的培养基中沉淀出来,优选已经在其产生过程中沉淀出来,由此极大地促进其回收。因此,优选地,在本发明的方法中,将细胞,优选真菌细胞在pH等于或低于5.0、4.0、3.0、2.9、2.8、2.7、2.6、2.5或2.4时,并且优选在pH等于或高于2.0、2.1、2.2或2.25、2.27或2.28时,在一种或多种呋喃存在下孵育。优选地,在本发明的方法中,选择对此范围内的pH具有高耐受性的细胞,优选真菌宿主细胞。在酸性pH进行该方法的额外优点是该方法的微生物污染将不太成问题,因为在低pH几乎所有细菌都受到不利影响。与作为感染源的细菌相比,酵母菌和真菌不太成问题,并且相对容易处理。反应时间可以是6-150小时,更优选6-18小时。优选地,氧从氧源(例如分子氧,例如作为纯氧或在空气中、或水中、或取决于呋喃氧化酶的要求是不同来源的氧)供应到反应培养基中的细胞。空气可以方便地用作分子氧的来源。反应器可以是任何合适的(充气的)生物反应器。它可以分批、连续或优选以补料分批操作。本发明的方法进一步优选包含回收在该方法中产生的氧化产物(例如FDCA或HMFCA)的步骤。优选地,氧化产物从孵育进行氧化步骤的细胞的培养基中回收。氧化产物如FDCA、HMFCA等可以通过例如(酸)沉淀、随后的冷却结晶、以及分离结晶的氧化产物(例如结晶的FDCA),从反应混合物或培养基中回收。然而,其他回收方法是合适的,例如,如本领域已知的酸沉淀和溶剂萃取。用于氧化呋喃化合物的本发明方法可以有利地应用于从认为其中的呋喃化合物是有害的原料(例如用于发酵生产生物燃料和生物化学品的原料)中消除呋喃化合物。更优选地,用于氧化呋喃化合物的方法应用于FDCA的生物生产,其作为单体前体用于生产聚酯(塑料),其中FDCA在聚酯PET中可以取代PTA,在这种情况中获得生物基聚呋喃二甲酸乙二醇酯(PEF)。FDCA也可用作大量有价值化合物的底物,包括例如作为生产琥珀酸、2,5-二(氨基甲基)-四氢呋喃、2,5-二羟甲基-四氢呋喃、2,5-二羟甲基呋喃和2,5-呋喃二甲醛(2,5-furandicarbaldehyde)的底物。FDCA可以用于生产涂层,例如在醇酸树脂和热塑涂层中。它也可以用作生物燃料和溶剂中的二甲苯等价物。FDCA可以被酯化,并且所述酯可以用作增塑剂。FDCA可以转化成其二醇,其可以用于PET样聚酯和聚氨酯中。进一步地,FDCA可以转化成其二胺,二胺可以用作扩链剂,并且二胺可以转化成二异氰酸酯,其可以用于聚氨酯的生产。因此,在另一方面,本发明涉及由一个或多个或至少两个FDCA单体生产聚合物的方法,所述方法包括以下步骤:a)如上文所述用本发明的氧化方法制备FDCA单体;和b)由a)中获得的FDCA单体产生聚合物。优选所述聚合物是聚呋喃二甲酸乙二醇酯(PEF)。另一方面,本发明涉及细胞、优选本发明的细胞用于将一或多个FDCA的呋喃前体生物转化成FDCA的用途,其中所述细胞是表达本文所定义的HMFCA脱氢酶的细胞、或表达具有呋喃化合物转运能力并且还包含如上文定义的HMFCA脱氢酶或氧化酶活性的多肽的细胞。优选地,被生物转化成FDCA的至少一种FDCA的呋喃前体选自HMF、DHF、HMFCA、FFCA和DFF,其中HMF是最优选的。具有将HMFCA氧化成FFCA的能力的多肽和编码这些多肽的核酸另一方面,本发明涉及具有HMFCA脱氢酶活性的多肽。优选地,多肽是具有将HMFCA氧化成FFCA能力的醇脱氢酶。具有HMFCA脱氢酶活性的多肽优选包含或者与SEQIDNO:1-4中的至少一个氨基酸序列具有至少69、69.4、70、71、72、73、73.9、74、75、76、77、78、79、80、81、82、83、84、84.5、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有HMFCA脱氢酶活性的多肽的核苷酸序列,该多肽包含或者与SEQIDNO:1-4中的至少一个氨基酸序列具有至少69、69.4、70、71、72、73、73.9、74、75、76、77、78、79、80、81、82、83、84、84.5、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:22、23、57和58中的至少一个所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上文所述。再一方面,本发明涉及包含以下至少一种的细胞:i)具有如本节中上述定义的HMFCA脱氢酶活性的多肽,和ii)本节中上述定义的核酸分子。优选地,所述细胞是包含本节上述a)至e)中定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选为分离的细胞或培养的细胞,所述细胞优选其他方面如上所述,并且优选所述细胞包含一种或多种上述所述的遗传修饰。所述细胞可以用于如上所述的任何方法、过程和用途中。具有呋喃醛脱氢酶活性的多肽和编码这些多肽的核酸另一方面,本发明涉及具有呋喃醛脱氢酶活性的多肽,即将呋喃醛氧化成相应的呋喃羧酸的脱氢酶。优选地,呋喃醛脱氢酶具有以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将DFF氧化成FFCA,和iii)将FFCA氧化成FDCA,并且优选地包含或者由与SEQIDNO:5和6中的至少一个氨基酸序列具有至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、70.9、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有呋喃醛脱氢酶活性的多肽的核苷酸序列,该多肽包含或者由与SEQIDNO.5和6的氨基酸序列具有至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、70.9、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:24、25和59中至少一个所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸的;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,所述载体包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。再一方面,本发明涉及包含以下至少一种的细胞:i)具有如本节中上述所定义的具有呋喃醛脱氢酶活性的多肽,以及ii)如本节上述定义的核酸分子。优选地,所述细胞是包含本节上述a)至e)中定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选为分离的细胞或培养的细胞,所述细胞优选其他方面如上所述,并且优选所述细胞包含一种或多种上述所述的遗传修饰。所述细胞可以用于如上所述的任何方法、过程和用途中。具有呋喃醇/醛氧化酶活性的多肽和编码这些多肽的核酸另一方面,本发明涉及具有呋喃醇/醛氧化酶活性的多肽。多肽优选具有能够氧化醇和醛基(位于呋喃化合物C2和C5位)的包含这些基团的呋喃化合物。多肽因此优选具有EC1.1和EC1.2活性。优选地,具有呋喃氧化酶活性的多肽具有以下至少一种的氧化能力:i)将HMF氧化成HMFCA,ii)将HMF氧化成DFF,iii)将DFF氧化成FFCA,iv)将HMFCA氧化成FFCA和v)将FFCA氧化成FDCA,优选包含或或者由与SEQIDNO.7-9中的至少一个氨基酸序列具有至少49.3、50、51、52、53、54、55、56、57、58、59、60、61、62、62.7、63、64、65、66、66.9、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有呋喃氧化酶活性的多肽的核苷酸序列,该多肽包含或者由与SEQIDNO.7-9中至少一个的氨基酸序列具有至少49.3、50、51、52、53、54、55、56、57、58、59、60、61、62、62.7、63、64、65、66、66.9、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:26-28所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。再一方面,本发明涉及包含以下至少一种的细胞:i)具有如本节中上述所定义的具有呋喃氧化酶活性的多肽,以及ii)如本节上述定义的核酸分子。优选地,所述细胞是包含本节上述a)至e)中定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选为分离的细胞或培养的细胞,所述细胞优选其他方面如上所述,并且优选所述细胞包含一种或多种上述所述的遗传修饰。所述细胞可以用于如上所述的任何方法、过程和用途中。参与FDCA分解代谢的多肽和/或参与HMF代谢的替代途径的多肽和编码这些多肽的核酸另一方面,本发明涉及具有降解FDCA能力的多肽。优选地,具有降解FDCA能力的多肽至少是具有FDCA脱羧单加氧酶活性的多肽、具有FDCA脱羧酶活性的多肽、具有FDCA脱羧脱氢酶活性的多肽和内酯酶活性多肽(即具有水解由FDCA脱羧导致的内酯)中的至少一种。在一个实施方案中,所述多肽具有FDCA脱羧单加氧酶活性,并且优选包含或者由与SEQIDNO:10和11中的至少一个氨基酸序列具有至少43.4、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、82.3、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有FDCA脱羧单加氧酶活性的多肽的核苷酸序列,该多肽或与SEQIDNO.:10和11中的至少一个氨基酸序列具有至少43.4、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、82.3、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%的序列相同性的氨基酸序列组成;b)SEQIDNO:29和30中的至少一个所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。在一个实施方案中,所述多肽具有FDCA脱羧酶活性并且优选包含或由与SEQIDNO:12的氨基酸序列具有至少62.9、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有FDCA脱羧酶活性的多肽的核苷酸序列,该多肽包含或者由与SEQIDNO:12的氨基酸序列具有至少62.9、63、64、65、66、67、68、69、70、61、72、73、74、75、76、77、78、78、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:31所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。在一个实施方案中,所述多肽具有FDCA脱羧脱氢酶活性,并且优选包含或由与SEQIDNO:13的氨基酸序列具有至少85、85.4、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有FDCA脱羧脱氢酶活性的多肽的核苷酸序列,该多肽包含或由与SEQIDNO:13的氨基酸序列具有至少85、85.4、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:32所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。在一个实施方案中,多肽具有内酯酶活性,即它具有水解由FDCA脱羧导致的内酯的能力,并且优选包含或由与SEQIDNO:14的氨基酸序列具有至少67.5、68、69、70、71、72、73、74、75、76、77、78、78、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有内酯酶活性的多肽的核苷酸序列,该多肽包含或者由与SEQIDNO:14的氨基酸序列具有至少67.5、68、69、70、71、72、73、74、75、76、77、78、78、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:33所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。再一方面,本发明涉及用于代谢HMF和其他FDCA的呋喃前体的替代内源途径的多肽,所述替代途径与从HMF和其他FDCA的呋喃前体产生FDCA竞争。一种这样的多肽是能够将HMF和/或FFCA还原成相应醇的脱氢酶,例如短链脱氢酶。优选地,该多肽具有短链醇脱氢酶活性。在一个实施方案中,所述多肽具有短链醇脱氢酶活性,并且优选包含或由与SEQIDNO:15的氨基酸序列具有至少73.6、74、75、76、77、78、79、80、81、82、83、84、85、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有FDCA脱羧脱氢酶活性的多肽的核苷酸序列,该多肽包含或由与SEQIDNO:15的氨基酸序列具有至少73.6、74、75、76、77、78、79、80、81、82、83、84、85、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:34所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。具体包括在本发明中的是失活构建体,用于失活本节中描述的靶编码序列,其失活构建体优选包含如上述所述的围绕或位于靶编码序列侧翼的基因组DNA序列。具有呋喃转运蛋白的多肽和编码这些多肽的核酸另一方面,本发明涉及如上述所定义的具有呋喃化合物转运能力的多肽。优选地,所述多肽具有转运呋喃化合物的能力,并且优选包含或由与SEQIDNO.:16-18中的至少一个氨基酸序列具有至少69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、84.1、85、85.2、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%的序列相同性但在其他方面如上文所定义的氨基酸序列组成。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有呋喃化合物转运能力的多肽的核苷酸序列,该多肽包含或与SEQIDNO.:16-18中的至少一个氨基酸序列具有至少69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、84.1、85、85.2、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%的序列相同性的氨基酸序列组成;b)SEQIDNO.:35-37中列出的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,所述载体如上述所述,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列。再一方面,本发明涉及包含以下至少一种的细胞:i)具有如本节上述所定义的呋喃化合物转运能力的多肽,和ii)如本节中所定义的核酸分子。优选地,所述细胞是包含本节上述a)至e)中定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选为分离的细胞或培养的细胞,所述细胞优选其他方面如上所述,并且优选所述细胞包含一种或多种上述所述的遗传修饰。所述细胞可以用于如上所述的任何方法、过程和用途中。具有调节物呋喃醛脱氢酶或氧化酶活性的多肽和编码这些多肽的核酸另一方面,本发明涉及参与呋喃分解代谢的基因的转录激活物,如上述所定义。优选地,转录激活物具有激活参与呋喃分解代谢的至少一个基因的转录的能力,并且优选包含或由与SEQIDNO:19的氨基酸序列具有至少52.4、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但在其他方面如上文所定义的氨基酸序列组成,否则定义如上。优选地,所述多肽是分离的多肽。本发明进一步涉及包含以下至少一种的核酸分子:a)编码具有激活参与呋喃分解代谢的至少一种基因转录的能力的多肽的核苷酸序列,该多肽包含或与SEQIDNO:19的氨基酸序列具有至少52.4、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;b)SEQIDNO:38所示的核苷酸序列;c)(a)或(b)中定义的核苷酸序列片段,其长度为10、15、20、30、50或100个核苷酸;d)由于遗传密码的简并性,其序列与b)或c)的核苷酸序列的序列不同的核苷酸序列;和,e)核苷酸序列,其是a)至d)中定义的核苷酸序列的反向补体。本发明的另一方面涉及载体,包括克隆和表达载体,其包含本节上述a)至e)中定义的核苷酸序列,所述载体其他方面如上述所述。再一方面,本发明涉及一种细胞,其包含以下至少一种:i)具有激活至少一种本节上述所定义的参与呋喃分解代谢的基因的转录的能力的多肽,和ii)如在本节中上述所定义的核酸分子。优选地,所述细胞是包含本节上面a)至e)中定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或由其转化的细胞。所述细胞优选为分离的细胞或培养的细胞,所述细胞优选其他方面如上所述,并且优选所述细胞包含一种或多种上述所述的遗传修饰。如上所述,所述细胞可以用于如上所述的任何方法、过程和用途中。在本文档和其权利要求书中,动词“包括”及其变形以其非限制性含义使用,意味着包括该词后面的项目,但未特别提及的项目不排除在外。此外,不定冠词“一”或“一个”对元素的引用并不排除存在多于一个元素的可能性,除非上下文明确要求存在一个且仅有一个元素。因此,不定冠词“一”或“一个”通常意味着“至少一个”。本说明书中引用的所有专利和参考文献都以其全部内容通过引用并入本文。提供以下实施例仅用于说明目的,并不意图以任何方式限制本发明的范围。表1巴西青霉hmfL1和10个最接近的直向同源物的氨基酸序列比对。表2巴西青霉hmfL2和10个最接近的直向同源物的氨基酸序列比对。表3巴西青霉hmfL3和10个最接近的直向同源物的氨基酸序列比对。表4巴西青霉hmfL4和10个最接近的直向同源物的氨基酸序列比对。表5巴西青霉hmfN1和10个最接近的直向同源物的氨基酸序列比对。表6巴西青霉hmfN2和10个最接近的直向同源物的氨基酸序列比对。表7巴西青霉hmfP1和10个最接近的直向同源物的氨基酸序列比对。表8巴西青霉hmfP2和10个最接近的直向同源物的氨基酸序列比对。表9巴西青霉hmfP3和10个最接近的直向同源物的氨基酸序列比对。表10巴西青霉hmfK1和10个最接近的直向同源物的氨基酸序列比对。表11巴西青霉hmfK2和10个最接近的直向同源物的氨基酸序列比对。表12巴西青霉hmfQ和10个最接近的直向同源物的氨基酸序列比对。表13巴西青霉hmfU和10个最接近的直向同源物的氨基酸序列比对。表14巴西青霉hmfO和10个最接近的直向同源物的氨基酸序列比对。表15巴西青霉hmfM和10个最接近的直向同源物的氨基酸序列比对。表16巴西青霉hmfT3和10个最接近的直向同源物的氨基酸序列比对。表17巴西青霉hmfT4和10个最接近的直向同源物的氨基酸序列比对。表18巴西青霉hmfT5和10个最接近的直向同源物的氨基酸序列比对。表19巴西青霉hmfR和10个最接近的直向同源物的氨基酸序列比对。实施例方法和材料培养程序采用的矿物培养基含有以下(每升去矿质水):(NH4)2SO4,5g;K2HPO4,1.55g;NaH2PO42H2O,0.85g;MgSO4.7H2O,0.5g;EDTA,15mg;ZnSO4.7H2O,4.5mg;CoCl26H2O,0.3mg;MnCl24H2O,1mg;CuSO45H2O,0.3mg;CaCl2.2H2O,4.5mg;FeSO47H2O,3mg;Na2MoO4.2H2O,0.4mg;H3BO3,1mg;KI,0.1mg。在120℃加热灭菌并冷却后,加入无菌碳源。葡萄糖溶液分别在110℃加热灭菌20分钟,而其他碳源在120℃灭菌。在必需矿物培养基中补充维生素。平板的培养基(1.5%琼脂)含有以指定浓度加入碳源的矿物培养基。小规模分批培养在30℃的100-ml锥形瓶中进行。它们中含有补充有碳源的20ml矿物盐培养基。将它们在静置或在旋转摇床上以各种实验所示的速率孵育。空气可以通过棉塞进入瓶中。在30℃在具有1升工作体积的发酵罐中分批培养真菌并且可以控制搅拌速度。K2HPO4从无机盐培养基中省略。通过用4MNaOH或4MH2SO4滴定,将pH值自动控制在所需的pH值。空气以每分钟最多1升的速率供应。巴西青霉的恒化培养也在具有1升的工作体积的发酵罐中。除了现在添加0.1g/l酵母提取物,使用相同的培养基。/用来自小规模分批培养中的巴西青霉预培养物接种培养容器(1g/lHMF)。在过夜分批孵育后,以所需的速率从培养基储存器开始泵送。培养基储存器中的碳底物浓度为1g/l。通过调节搅拌器速度来自动控制液体中的氧气水平。空气以每分钟最多1升的速率供应。酵母菌株的恒化培养是在1升工作体积的发酵罐中进行。用来自小规模分批培养的酵母预培养物接种培养容器。在过夜分批孵育后,以所需的速率从培养基储存器开始泵送。通过调节搅拌器速度来自动控制液体中的氧气水平。空气以每分钟最多1升的速率供应。菌株使用以下菌株:酿酒酵母CEN.PK113-1A(MATalpha;his3D1;leu2-3_112;ura3-52;trp1-289;MAL2-8c;SUC2;EuroscarfNo.30000BOrf2463);解脂耶氏酵母Polg(可从YeasternBiotechCo.Ltd.,www.yeastern.com购买);马克斯克鲁维酵母(Kluyveromycesmarxianus)Ky-003,DSM70073(模式菌株,从黄油乳中分离);大肠杆菌NEB5-α(可从NewEnglandBiolabs,www.neb.com购买);恶臭假单胞菌S12(ATCC700801);CupriavidusbasilensisHMF14(Wierckx等,2010,MicrobBiotechnol.3(3):336-43);巴西青霉C1(如实施例1中所述从荷兰土壤中分离)。分子克隆这里使用的所有分子克隆技术与描述于MolecularCloning:ALaboratoryManual,4thEditionManualbyMichaelR.Green,HowardHughesMedicalInstitute,UniversityofMassachusettsMedica1School;JosephSambrook,PeterMacCallumCancerInstitute,Melbourne,Australia.ColdSpringHarbourLaboratoryPress,2012中的相似或等价。代谢物分析通过HPLC分析通过离心和/或过滤培养物样品获得的上清液的呋喃。使用Agilent1100系统进行分析。使用ZorbaxeclipseXDBC8柱(孔径180m2/g、在25℃操作)测量呋喃化合物。在配备有二极管阵列检测器的Thermo系统上定量化合物。使用的两种洗脱液是pH7的12mMPO4缓冲剂(每升1.293gK2HPO4和0.543gNaH2PO4)和乙腈(HPLC级,SigmaEchromasolv)。根据以下方案,流动速率设定为1.2ml/min,梯度运行时间为8分钟:1)在3.5分钟的初始阶段,5%的乙腈;2)在2.5分钟内,线性增加乙腈以达到40%乙腈;3)在0.5分钟内,40%的乙腈恒定水平;4)在0.5分钟内,线性减少乙腈以达到5%乙腈;和5)在1分钟内,5%的乙腈恒定水平。各种呋喃化合物的保留时间和波长在下表20中给出。表20各种呋喃化合物的HPLC保留时间和波长化合物波长(nm)保留时间(min)FDCA2301.12HMFCA2501.56FFCA2851.99HMF-OH2304.15HMF2854.51通过测量当D-葡萄糖被氧化成葡萄糖-6-磷酸时形成的NADPH的吸收,酶促测定上清液中的葡萄糖浓度(D-葡萄糖UV-测试,BoehringerMannheim/R-Biopharm)。分析前上清液稀释至102。通过测量当乙醇被氧化成乙醛及随后的乙酸时形成的NADH的吸收,酶促测定上清液中的乙醇浓度(乙醇UV-测试,BoehringerMannheim/R-Biopharm)。分析前将上清液稀释至103。实施例1:分离巴西青霉Batista具有在低pH值以消耗HMF生长的能力的真菌菌株从荷兰土壤中富集并分离。将1克经空气干燥的土壤提供到含有20毫升已省去K2HPO4的溶液的100ml锥形瓶中。通过用HCl溶液滴定将培养基的pH降低至pH=3。初始HMF浓度为1g/l。为了抑制细菌生长,培养基中包含萘啶酮酸(naladixicacid)(20mg/l)。将瓶在30℃在空气下静置孵育。孵育2周后,将来自富集培养物的物质(1ml)转移至具有相同初始组成的新鲜培养基中。从第二次培养中,琼脂平板划线,包含矿物培养基和0.5g/lHMF。在空气下于30℃孵育10天后出现的菌落在具有相同初始培养基的平板上重新划线,直至生物体被纯化。通过在矿物盐培养基中生长生物体来测试分离物消耗HMF的生长。采用含有20ml液体的100ml锥形瓶,并将分离物在存在或不存在1g/lHMF的该培养基中孵育。消耗HMF显示良好生长的一种特殊菌株被用于进一步研究。该生物体在CBS-KNAW的FungalBiodiversityCenter鉴定和表征。在25℃的黑暗中,将其在麦芽提取琼脂上培养3天。根据制造商的说明使用MoBio-UltraCleanTMMicrobialDNAIsolationKit提取DNA。使用引物LS266(GCATTCCCAAACAACTCGACTC;SEQIDNO:39)和V9G(TTACGTCCCTGCCCTTTGTA;SEQIDNO:40)扩增含有ITS区域的片段(GerritsvandenEndeanddeHoog,1999,StudiesinMycology,43:151-162)。使用引物Bt2a(GGTAACCAAATCGGTGCTGCTTTC;SEQIDNO:41)和Bt2b(ACCCTCAGTGTAGTGACCCTTGGC;SEQIDNO:42)扩增部分β-微管蛋白基因(GlassandDonaldson,1995,ApplEnvironMicrobiol.61(4):1323-1330)。用ABIPrismBigDyeTMTerminatorv.3.0ReadyReactionCycle测序试剂盒对PCR片段的两条链进行测序。样品在ABIPRISM3700遗传分析仪上分析,重叠群(contig)使用正向和反向序列与来自LaserGene软件包中的程序SeqMan组装。在NCBInucleotidedatabase和CBS-KNAW的内部数据库上进行同源性检索。这使得该分离物与巴西青霉Batista模式菌株100%匹配。该生物体被命名为巴西青霉(巴西青霉)C1并且如本文所述用于进一步研究。除HMF之外,生物体也消耗HMF-醇、HMFCA、FDCA、葡萄糖、果糖、蔗糖、木糖、淀粉和柠檬酸在矿物培养基中生长。实施例2:在低pH值巴西青霉生长的限制通过在初始pH=3的培养基中孵育土壤以分离巴西青霉C1菌株。然而,在生长过程中培养基的pH变化,也在后续的纯培养物的分批实验中变化。为了验证生长的pH值限制,进行恒化培养以允许在恒定的预定pH值中以预定的生长速率。生长速率设定为0.08h-1,并且pH保持在pH=2.9。在3个单独的实验中,使用HMF、HMFCA或FDCA作为碳源。生物体能够的三个条件中的每一个条件下建立自己处于稳定状态;没有发生洗涤。培养容器中3种呋喃中任一种的浓度低于三次运行中的任一次的检测极限。结果显示出生物体在低于3的pH值生长的能力,这是在低pH值由HMF产生FDCA的理想特性。此外,生物体在均匀的悬浮液中生长,进一步增加了菌株的有用性。实施例3:鉴定编码参与HMF分解代谢的酶的巴西青霉C1基因巴西青霉C1基因组的测序和注释分离来自巴西青霉C1的DNA并送至BaseClear使用IlluminaHiSeq2500系统进行双末端测序。在质检、过滤和去除接头之后,将read序列组装成重叠群并连接并置于scaffold中。使用BaseClear注释流水线进行基因组注释,该流水线基于用于结构注释的Augustus(StankeandWaack,2003,Bioinformatics.19Supp12:ii215-25)和用于功能注释的ProkkaProkaryoticAnnotation系统(http://vicbioinformatics.com)的组合。一组青霉菌属物种被用作注释的参考,注释包括关于rRNA、tRNA、信号肽、Pfam蛋白质家族预测、细胞定位和保守结构域的信息。在HMF和柠檬酸上培养的巴西青霉C1细胞的RNA测序用于比较RNA测序的细胞通过在两种不同碳源上的恒化培养物中的巴西青霉C1获得。生长速率设定为0.1h-1,pH保持在pH=7。使用2g/l的HMF或柠檬酸作为碳源,并获得两种情况的稳定状态。用100ml的巴西青霉C1的预培养物接种恒化器。24小时后,启动进料泵并在36小时后(稳定状态),在无RNA’se的Eppendorf管中以15000rpm在0℃离心50秒获得6ml细胞。弃去上清液,将1ml用于RNA稳定化和储存的溶液加入到沉淀中。将样品短暂涡旋并在4℃下储存过夜,然后转移至-80℃冰箱中。基于使用IlluminaHiSeq2500系统的单末端测序,由BaseClear进行RNA测序。在质量检查、过滤和修整之后,将read与注释的基因组进行比对。基于这种比对,计算绝对表达值,并随后标准化RPKM(每千个碱基的read每百万映射的read)表达测量,以在基因之间和样品之间进行标准化。为了比较两个不同的样品,进行了统计检验(Kal’sZ检验和Baggerly’sbeta-二项检验)以指定样品间表达差异的显著性。鉴定编码参与HMF分解代谢的酶的巴西青霉C1基因基于针对公共数据库的基因组注释和blasting基因以及差异表达RNA测序结果,列出了参与编码参与巴西青霉C1降解HMF的酶的候选基因的列表。首先,通过自动注释预测的功能将基因(来自RNAseq数据)分组(脱氢酶、单加氧酶等)。其次,在HMF上生长期间,通过绝对表达水平(RPKM值;基因长度校正的转录物丰度)对基因进行分组。表达最高的前100个基因进行标记。第三,与在柠檬酸盐上的生长相比,在HMF上生长期间通过倍数变化将基因分组。对上调最高的前100个基因进行标记。第四,选择在绝对表达水平和倍数变化方面得分高的基因。第五,根据功能应用过滤器(如自动注释所预测的):选择可能与推定的HMF降解途径有关的功能(参见表21),并丢弃具有不明指定的命中。最后,对最高命中(hmfK1、hmfL1、hmfM、hmfN1、hmfO、hmfL2、hmfP1和hmfP2;参见表21)进行排名,预期这些是参与HMF代谢的实际基因和额外的潜在相关命中(中度高度表达或上调但已预测与HMF代谢(例如,“经典”脱羧酶和脱羧脱氢酶;hmfP3、hmfK2、hmfL3、hmfL4、hmfN2、hmfQ和hmfU)(可能的替代)途径有关的功能)。此外,还选择了一些“accesory基因”(转运/调节)(hmfR、hmfT3、hmfT4和hmfT5)。表21巴西青霉C1基因组中被鉴定为参与HMF分解代谢的基因实施例4:通过含有异源表达来自巴西青霉C1的hmfK1的恶臭假单胞菌S12降解FDCA选择上述巴西青霉C1hmfK1基因(显示与水杨酸1-单加氧酶nahG的同源性)以在恶臭假单胞菌S12中表达。通过该基因编码的酶(EC1.14.13.1)预期在通过FDCA降解HMF中具有关键作用并且作为FDCA上的脱羧单加氧酶。为了测试这个假设,该基因在恶臭假单胞菌S12中表达。随后,通过含有巴西青霉hmfK1基因的菌株(恶臭假单胞菌S12ΔGCD;pBT’nahG_aldH/pjNNhmfT1)以及含有空载体的对照菌株(恶臭假单胞菌S12ΔGCD;pBT‘hmfH_aldH/pjNNhmfT1)监测FDCA的降解。恶臭假单胞菌转化体在含有补充有50mg/L卡那霉素和30mg/L庆大霉素和156mg/LFDCA(1mM)的10mlMM+160mM葡萄糖的100-ml摇瓶中生长过夜。起始pH值测量为约7.0。在对数中期(OD600≈0.6)收集细胞,洗涤并重新悬浮于补充有160mM葡萄糖和50mg/L卡那霉素、30mg/L庆大霉素的MM中。将细胞悬浮液的等分试样(10ml)(相当于0.84gCDW)与1mlFDCA在100ml锥形瓶中孵育,并且定期抽取样品以分析FDCA。表22中显示的结果清楚地表明了巴西青霉hmfK1编码的酶参与FDCA的降解。表22与缺乏hmfK1基因的对照菌株相比,表达巴西青霉hmfK1基因的恶臭假单胞菌S12降解FDCA。实施例5:在生长的培养物和缓冲溶液中的细胞悬浮液中的巴西青霉的HMF代谢结果巴西青霉C1用矿物培养基和0.5g/lHMF在小分批培养物中培养。作为存在HMF的初始反应,生物体产生HMF-醇和HMFCA,随后降解所有三种化合物。这种行为让人想起几种已知生物体对HMF的降解。在这种生长的培养物中没有检测到FDCA。为了令人信服地证明提高整个细胞从HMF形成FDCA,用浓缩的细胞悬浮液在缓冲溶液中进行实验。将该菌株在含有100ml含有0.5g/l初始HMF的矿物培养基的500ml锥形瓶中培养过夜。将培养物离心并在磷酸盐缓冲剂(1.55g/l的K2HPO4和0.85g/l的NaH2PO42H2O)中洗涤两次。将所得沉淀重悬于10ml含有HMF的相同缓冲剂中。将该缓冲剂中的这些细胞放入100-ml锥形瓶中,在旋转摇床上以400rpm摇动。在120分钟的时间内,从该孵育中取出样品并通过HPLC分析HMF、HMF-OH、HMFCA和FDCA。表23中的结果显示HMF随时间降解并形成HMF-OH和HMFCA。最重要的是,显示FDCA积累到0.20mM的浓度,表明真菌巴西青霉C1能够从最初的HMF产生FDCA。没有初始HMF的空白孵育不积累三种中间化合物。表23在缓冲溶液中通过巴西青霉C1降解HMF以及FDCA的时间累积。实施例6:通过酿酒酵母和马克斯克鲁维酵母异源表达来自CupriavidusbasilensisHMFCA氧化酶和醛脱氢酶基因由HMF产生FDCA编码来自CupriavidusbasilensisHMF14的hmfHHMF-氧化酶和醛脱氢酶(HMF/FFCA脱氢酶)的基因先前已在恶臭假单胞菌S12中功能性表达(WO2012/064195)。然而,细菌菌株如恶臭假单胞菌不能在低pH(例如,低于pH5)范围使用。由于各种原因,在pH值远低于pH5使用微生物用于FDCA产生将是有利的。因此,我们测试了酵母酿酒酵母和马克斯克鲁维酵母是否可以被修饰以从HMF产生FDCA并且在低pH使用。为此效果,分别将编码氧化酶和醛脱氢酶的两种C.basilensis基因在酿酒酵母CEN.PK113-1A和马克斯克鲁维酵母Ky-003中表达,并测试重组菌株从HMF产生FDCA的能力。初始测试在中性pH和分批培养进行。随后,在不同pH值的恒化器中培养重组菌株。制备用于在酵母酿酒酵母和马克斯克鲁维酵母中表达C.basilensishmfH和HMF/FFCA醛脱氢酶基因的表达构建体。在该表达构建体中,C.basilensishmfH基因从TEF1启动子表达并且转录由CYC1终止子终止,并且C.basilensisHMF/FFCA醛脱氢酶基因从TDH3启动子表达并且转录由TDH3终止子(SEQIDNO:43所示的串联构建体)终止。表达构建体还包含用于染色体整合到酿酒酵母和马克斯克鲁维酵母URA3基因座中的G418抗性标记和URA3同源位点。使用Gietz和Woods的标准“lithiumacetate/single-strandedcarrierDNA/polyethyleneglycol”方法(2002,MethodsinEnzymology,Volume350,pages87-96),用该构建体转化酵母菌株酿酒酵母CEN.PK和马克斯克鲁维酵母Ky-003,并在含有300μg/ml遗传霉素(G418)的YE琼脂平板上选择转化体。平板孵育在30℃下进行至少3天。通过菌落PCR检查转化体。获得了几种表达酶的克隆,并且酿酒酵母CEN.PK克隆2和马克斯克鲁维酵母Ky-003克隆3用于进一步研究。亲本CEN.PK菌株以及克隆2的分批培养在补充有1g/l葡萄糖和4mMHMF的矿物培养基中进行。对于串联克隆2,G418(200μg/ml)被加入到培养基中。以150rpm摇动孵育。从这些孵育中取出样品并通过HPLC分析HMF、HMF-OH、HMFCA、FFCA和FDCA。实验开始时克隆2和亲本菌株酵母细胞密度分别为的OD2.2和OD4.1。表24中给出的结果清楚地证明了克隆2从HMF产生FFCA和FDCA的能力。表24在含葡萄糖的矿物培养基中孵育时,通过CEN.PK和重组CEN.PK克隆2的HMF降解和FDCA积累。亲本Ky-003菌株以及克隆3的分批培养在补充有1g/l葡萄糖和4mMHMF的矿物培养基中进行。对于串联克隆3,G418(200μg/ml)被加入到培养基中。以150rpm摇动孵育。从这些孵育中取出样品并通过HPLC分析HMF、HMF-OH、HMFCA、FFCA和FDCA。实验开始时克隆3和亲本菌株的的酵母细胞密度分别为OD2和OD2.5。用马克斯克鲁维酵母Ky-003克隆3获得了用酿酒酵母CEN.PK克隆2获得的相似结果(数据未显示):马克斯克鲁维酵母也能够从HMF产生FFCA和FDCA。随后,酿酒酵母菌株CEN.PK和CEN.PK克隆2在恒化培养中以0.08h-1的稀释速率培养。除了0.3g/l的K2HPO4且添加0.2g/l酵母提取物之外,使用矿物培养基。用NaOH(4M)和H2SO4(4M)将发酵容器中的pH自动控制在pH=4.0,并且在这些条件下液体中的氧浓度保持在其最大溶解度的45%至50%之间。每当需要时使用消泡剂(structol10%)。加入到培养基储存器的葡萄糖量在每次运行中为2g/l。第一次运行包含葡萄糖但不含HMF。其他运行除葡萄糖之外在培养基储存器中还含有0.5g/l的HMF。对于每次运行,在4次体积变化后建立稳定状态。测定培养基储存器中和发酵容器液体中的葡萄糖、乙醇、HMF、HMF-OH、HMFCA、FFCA和FDCA在的实际浓度(细胞分离后)。此外,通过测量OD值来估计酵母生物量。结果在表25中给出,并且证实当在低至pH=4.0的pH生长时,CEN.PK克隆2能够由HMF产生FDCA。表25在恒化培养中测量的以细胞干重(CDW)产生的酵母的浓度和培养基储存器(培养基进)中和生长容器的发酵液(培养基出)中的代谢物浓度。实施例7:通过表达巴西青霉hmfL1、hmfL2和/或hmfN1基因的酿酒酵母CEN.PK从HMF产生FDCA编码巴西青霉醇脱氢酶基因hmfL1(SEQIDNO:57)和/或hmfL2(SEQIDNO:58)的密码子优化的核苷酸序列,以及巴西青霉醛脱氢酶基因hmfN1(SEQIDNO:59)在酿酒酵母CEN.PK113-1A中表达,并测试重组菌株从HMF产生FDCA的能力。初始测试在中性pH和分批培养进行。该序列经过密码子优化用于在酵母中表达。如下制备用于表达巴西青霉hmfL1、hmfL2和/或hmfN1基因的表达载体。用限制性内切酶XmaI和SpeI处理含密码子优化的巴西青霉hmfN1编码序列(SEQIDNO:60)的合成DNA片段,以产生克隆到酵母/大肠杆菌穿梭载体pTT2(SEQIDNO:61)的片段,其在用XmaI和SpeI处理后用小牛肠磷酸酶(CIP)去磷酸化。连接并转化感受态大肠杆菌后,所得构建体(pTT2-hmfN1,SEQIDNO:62)用作由SEQIDNO:63(hmfL1)表示的合成DNA片段的受体。为此,用限制性内切酶Ascl和MluI处理这两个DNA分子(pTT2-hmfN1和包含hmfL1编码序列的SEQIDNO:63的DNA片段)。随后用CIP处理质粒。将连接产物pTT2-hmfLN1-hmfL1(SEQIDNO:64)转化到大肠杆菌中。在产生能够表达hmfN1和hmfL2的质粒的方法中,将质粒pTT2-hmfN1(SEQIDNO:62)和SEQIDNO:65所示的合成DNA片段(包含hmfL2编码序列)与BsmBI和AatII孵育。随后将质粒与CIP一起孵育并与消化的hmfL2-片段连接以产生pTT2-hmfN1-hmfL2(SEQIDNO:66)。用BsmBI和AatII消化pTT2-hmfLN1-hmfL1(SEQIDNO:64)和合成DNA片段(SEQIDNO:65)。再次在限制性内切酶之后用CIP处理质粒,将两个DNA片段连接以产生pTT2-hmfN1-hmfL1-hmfL2(SEQIDNO:67)。通过用限制性内切酶SmaI和PacI消化以切掉含有TDH3启动子和醛脱氢酶基因hmfN1的片段,来从pTT2-hmfLN1-hmfL1(SEQIDNO:64)衍生pTT2-hmfL1。使用DNA聚合酶I、Large(Klenow)片段填补所得到的5’突出端。然后连接DNA片段并转化到感受态大肠杆菌中以产生pTT2-hmfL1(SEQIDNO:68)。该质粒仅允许表达巴西青霉hmfL1醇脱氢酶。该质粒允许并行地在酵母中共表达全部三种HMF转化的巴西青霉的酶。酿酒酵母CEN.PK用pTT2、pTT2-hmfN1-hmfL1-hmfL2、pTT2-hmfN1-hmfL1和pTT2-hmfL1转化。获得每个转化体的若干克隆,且每种转化体的一个克隆用于进一步研究。在补充有1g/l葡萄糖和3mMHMF的矿物培养基中进行转化体的分批培养。将Histidin(100mg/L)和尿嘧啶(100mg/L)加入培养基中。以150rpm摇动孵育。从这些孵育中取出样品并通过HPLC分析HMF、HMF-OH、HMFCA、FFCA和FDCAT。表26中给出的结果清楚地表明用pTT2转化的CEN.PK不能从HMF产生FFCA和FDCA,但是pTT2-hmfN1-hmfL1-hmfL2、pTT2-hmfN1-hmfL1和pTT2-hmfL1中的每一个均赋予CEN.PK宿主细胞从HMF产生FFCA和FDCA的能力。表26在含有葡萄糖的补充有3mMHMF的矿物培养基中分别孵育的CEN.PK/pTT2、CEN.PK/pTT2-hmfN1-hmfL1-hmfL2、CEN.PK/pTT2-hmfN1-hmfL1和CEN.PK/pTT2-hmfL1中测定HMF代谢物。随后,将酿酒酵母CEN.PK转化体CEN.PK/pTT2和CEN.PK/pTT2-hmfN1-hmfL1在与上述实施例6中所述相同的条件下在恒化培养中培养。表27中呈现的结果清楚地证明,在提供足够的氧气时,用pTT2-hmfN1-hmfL1转化的CEN.PK具有有效地从HMF产生FDCA的能力。表27在具有CEN.PK/pTT2和CEN.PK/pTT2-hmfN1-hmfL1的恒化培养中测量的以细胞干重(CDW)产生的酵母的浓度以及培养基储存器(培养基进)中和生长容器的发酵液(培养基出)中的代谢物浓度。实施例8:通过解脂耶氏酵母异源表达来自巴西青霉编码HMFCA脱氢酶的基因从HMF产生FDCA。为了在解脂耶氏酵母中表达,从作为模板DNA的pTT2-hmfN1-hmfL1通过PCR扩增巴西青霉hmfL1密码子优化的密码子序列,其中寡核苷酸在3’末端引入BamHI限制性位点,并在5’末端引入平末端。然后使用BamHI和PmlI作为克隆位点将PCR片段克隆到pYLEX1表达载体(得自YeasternBiotechCo.Ltd.,www.yeastern.com)中并转化到大肠杆菌中。在鉴定阳性大肠杆菌克隆后,通过将载体用NotI线性化来制备携带巴西青霉hmfL1基因的pYLEX1-hmfL1表达载体以整合进解脂耶氏酵母Polg菌株(也得自YeasternBiotechCo.Ltd.)。使用乙酸锂转化方案和亮氨酸作为营养缺陷标记将线性化载体整合到Polg中。通过PCR检测转化子中hmfL1基因的存在。在补充有1g/l葡萄糖和4mMHMF的矿物培养基中进行转化体的分批培养。以150rpm摇动孵育。从这些孵育中取出样品并通过HPLC分析HMF、HMF-OH、HMFCA、FFCA和FDCA。表28中所示的结果清楚地表明,在解脂耶氏酵母Polg菌株中巴西青霉hmfL1的异源表达赋予该酵母菌株从HMF产生FDCA的能力。表28在补充有4mMHMF的含葡萄糖的矿物培养基中,孵育分别用空载体或用pYLEX1-hmfL1转化的解脂耶氏酵母Polg时测定HMF代谢物。序列表<110>普拉克生化公司<120>真菌产生FDCA<130>P6054296PCT<150>NL2015469<151>2015-09-21<160>69<170>PatentInversion3.3<210>1<211>351<212>PRT<213>Penicilliumbrasilianum<400>1MetGlySerLeuSerLeuProGluThrSerLeuAlaAlaIleGlnAsp151015LysGluThrLysAlaIleSerValAlaLysArgProThrProValPro202530ValGlyThrGlnValLeuValLysLeuHisTyrSerGlyValCysAla354045ThrAspLeuHisLeuAlaArgGlySerValProTyrLeuGlnProLys505560ValSerValGlyGlyHisGluGlyThrGlyValIleAlaSerLeuGly65707580ProAspValAspAlaAlaGluTrpHisValGlyAspArgValAlaVal859095ArgTrpValHisIleValCysGlyLysCysGluValCysThrThrGly100105110PheGluAsnLeuCysGlnSerArgLysLeuAlaGlyLysAspValGlu115120125GlyThrPheAlaGluTyrAlaIleAlaAspSerSerTyrMetValArg130135140LeuProAlaGlyValSerAspAlaAspAlaAlaProIleLeuCysAla145150155160GlyValThrValTyrLysAlaLeuLysIleAlaSerLeuArgAlaGly165170175SerTrpValAlaValAlaGlyAlaGlyGlyGlyLeuGlyHisLeuAla180185190IleGlnTyrAlaArgAlaMetGlyLeuLysValValAlaLeuAspAla195200205ArgLysArgAspLeuCysLeuSerLeuGlyAlaGluSerTyrIleAsp210215220ValLeuGluThrAspAspCysValAlaGlnValIleLysValThrAsp225230235240GlyGlyAlaHisGlyAlaLeuIleCysAlaSerSerGlyGlnAlaTyr245250255AspAspAlaValLysPheLeuArgTrpThrGlyThrLeuValCysIle260265270GlyLeuProProLysProThrLeuLeuSerLeuGlyProAlaAspPhe275280285ValAlaArgGlyIleLysValMetGlyThrSerThrGlyAspArgGln290295300AspThrValGluAlaLeuAlaPheValAlaLysGlyGlnValLysPro305310315320GlnLeuThrGluArgArgLeuGluAspValGluGluIleLeuLysGlu325330335IleGluAsnGlyThrMetGlnGlyLysAlaValIleArgIleAla340345350<210>2<211>339<212>PRT<213>Penicilliumbrasilianum<400>2MetSerLeuProSerHisTyrLysArgAlaAlaPheLysGluAlaGly151015GlyProLeuThrIleGluGluValAspLeuThrMetProAspAlaGly202530GluValLeuValLysValGluAlaCysGlyValCysPheSerAspThr354045ValProGlnAlaHisGlyLeuGlyGlyLysPheProIleValProGly505560HisGluIleIleGlyHisValValAlaThrGlyAspGlyValSerAsp65707580TrpGluValGlyAspArgIleGlyGluGlyTrpHisGlyGlyHisAsp859095GlyThrCysProSerCysArgGlnGlyHisPheGlnMetCysAspAsn100105110GlnSerIleAsnGlyValThrLysAsnGlyGlyTyrAlaGlnTyrCys115120125IleLeuArgSerGluAlaAlaValArgIleProThrHisValSerAla130135140AlaGluTyrAlaProIleLeuCysAlaGlyValThrValPheAsnSer145150155160MetArgGlnIleGlyValLysProGlySerThrValAlaIleGlnGly165170175LeuGlyGlyLeuGlyHisLeuAlaIleGlnTyrAlaAsnArgPheGly180185190PheArgValValAlaIleSerArgAspAspGlnLysGluArgPheVal195200205ArgAspLeuGlyAlaHisGluTyrIleAsnThrSerGluGluAspVal210215220GlySerAlaLeuGlnLysLeuGlyGlyAlaSerLeuIleValAlaThr225230235240AlaProAsnAlaArgAlaIleSerProLeuLeuLysGlyLeuArgPro245250255LeuGlyLysLeuLeuIleLeuAlaValProGlyGluIleProLeuAsp260265270ThrArgLeuMetValAlaArgGlyLeuSerValHisGlyTrpProSer275280285GlyHisAlaLeuAspSerGluGluThrIleArgPheThrGluLeuGlu290295300AspIleLysCysMetIleGlnThrTyrSerLeuAspArgAlaAsnGlu305310315320AlaPheAspAlaMetIleSerGlySerValArgPheArgAlaValIle325330335ThrMetGlu<210>3<211>389<212>PRT<213>Penicilliumbrasilianum<400>3MetAlaProGlnIleProGluLysGlnTrpAlaGlnValValGluLys151015LysGlyGlyProProValTyrLysGluIleProValProLysProGly202530ProAspGluValLeuLeuLysIleLysTyrSerGlyValCysHisThr354045AspLeuHisAlaMetAsnGlyAspTrpProLeuProValLysMetPro505560LeuValGlyGlyHisGluGlyAlaGlyIleValValAlaLysGlyGlu65707580LeuAlaGluGlyValGluIleGlyAspHisAlaGlyIleLysTrpLeu859095AsnGlySerCysLeuAlaCysGluTyrCysLysThrSerAspGluPro100105110LeuCysAlaThrProGlnLeuSerGlyTyrThrValAspGlyThrPhe115120125GlnGlnTyrAlaIleGlyLysAlaAlaHisValThrIleLeuProLys130135140AspIleProLeuAspGlyIleAlaProIleLeuCysAlaGlyLeuThr145150155160ValTyrLysGlyLeuLysGluSerAsnAlaArgProGlyGlnThrVal165170175AlaIleValGlyAlaGlyGlyGlyLeuGlyValMetAlaGlnGlnTyr180185190AlaLysAlaMetGlyLeuArgValIleSerIleAspGlyGlyAspGlu195200205LysArgGlnValCysGluLysLeuAspSerGluAlaTyrIleAspPhe210215220ThrLysSerLysAspLeuValSerAspValLysAlaAlaThrProGlu225230235240GlyLeuGlyAlaHisAlaValIleLeuLeuAlaValSerGluLysPro245250255PheGlnGlnAlaValGluTyrSerArgProArgGlyThrIleValAla260265270IleGlyMetProAlaAsnAlaPheLeuLysAlaSerValPheGluThr275280285ValValLysMetIleThrIleLysGlySerTyrValGlyAsnArgGln290295300AspAlaSerGluAlaValAspPheTyrAlaArgGlyLeuIleLysAla305310315320ProPheLysThrValProLeuGluGluLeuProLysValPheGluLeu325330335MetGlyLysLeuProAsnSerAsnLeuLeuLeuHisLysLeuLeuIle340345350CysPheSerGlnSerLysAlaArgLeuProValValMetPheSerArg355360365CysGlnSerLysCysIleAsnArgArgAlaValHisAsnArgGlnHis370375380ArgMetSerIleSer385<210>4<211>330<212>PRT<213>Penicilliumbrasilianum<400>4MetSerLeuProThrThrMetArgAlaValIleValGluGlnThrGly151015GlyProGluValLeuGlnPheLysThrAspHisProValProThrPro202530GlyGluGlyGlnLeuLeuValHisAsnAsnIleSerGlyValAsnTyr354045IleAspThrTyrPheArgThrGlyLeuTyrAlaSerProLysProGlu505560IleLeuGlyArgGluGlyAlaGlyIleValAlaAlaIleGlyProAsn65707580ThrSerGlyPheAsnValGlyAspArgValAlaTrpLeuAlaThrGly859095GlyTyrAlaGluTyrThrAlaValProAlaAlaLysThrValLysIle100105110ProGluGlyValSerAspGluAspValValAlaSerPheLeuSerGly115120125LeuThrValLeuSerPheAlaLysGluThrTyrProValGlnLysGly130135140AspTrpValLeuLeuHisAlaAlaAlaGlyGlyAlaGlyPheLeuMet145150155160ThrGlnIleLeuLysSerIleGlyAlaLysValIleGlyThrAlaGly165170175GlyAlaGluLysCysAlaLeuValLysSerLeuGlyAlaAspValVal180185190IleAspTyrArgSerGluGluGlyLysAspTrpValLysLeuValLys195200205GluAlaThrGlyGlyArgGlyValAspValValTyrAspSerValGly210215220LysAspThrTrpGluGlySerLeuGluAlaValLysArgLysGlyThr225230235240IleValTrpPheGlyAsnAlaSerGlyProValProProIleProLeu245250255ProLysLeuSerProLysAsnValLysIleAlaArgProThrLeuPhe260265270GlyTyrIleGluThrArgGluGluPheGluTyrTyrThrAsnGluLeu275280285PheSerLeuLeuGlnSerGlyGlnLeuLysThrLysIleHisLysVal290295300TyrProLeuGluAspIleAlaGlnValHisLysAspLeuGluGlyArg305310315320LysThrMetGlyLysSerLeuLeuLysPro325330<210>5<211>505<212>PRT<213>Penicilliumbrasilianum<400>5MetThrGlnThrAsnValHisValAsnLysSerAspThrSerLeuAla151015AlaProGlnGlnLeuPheIleSerGlyLysTyrGlnAsnSerGlnArg202530AsnGlyThrPheProValLysAsnProMetThrGlyGluThrIleTyr354045GluCysValSerAlaSerLeuAspAspTyrAlaAlaAlaIleGluGlu505560AlaAspAlaAlaGlnProSerTrpAlaArgLeuGlyProSerAlaArg65707580ArgLeuIleLeuLeuLysAlaAlaAspIleMetGluThrTyrIleGlu859095ThrAspAlaProAlaIleLeuSerAlaGluValSerAlaThrArgGly100105110TrpValArgAlaAsnIleLeuSerThrAlaGlyValPheArgGluThr115120125AlaAlaLeuAlaThrHisIleLysGlyGluIleValProAlaAspArg130135140ProGlyThrThrIleLeuValSerArgGluProValGlyValValLeu145150155160AlaIleSerProTrpAsnMetProAlaThrLeuThrAlaArgAlaIle165170175CysCysProLeuIleCysGlyAsnSerValValLeuArgProSerGlu180185190PheSerProLysSerGlnHisLeuValValArgAlaLeuThrGluAla195200205GlyLeuProAlaGlyCysLeuGlnPheLeuProThrSerThrAlaAsp210215220ThrProArgAlaIleGluPheAlaIleArgHisProLysValSerArg225230235240AlaAsnPheThrGlySerAspArgValGlyArgIleIleAlaGlyLeu245250255SerAlaSerCysLeuLysProCysValLeuGluLeuGlyGlyLysAla260265270ProValValValLeuGluAspAlaAspValGluAlaAlaValGluAla275280285ValValTyrGlyAlaMetSerAsnSerGlyGlnIleCysMetSerThr290295300GluArgAlaIleValHisArgSerLeuAlaAlaAspPheLysAlaLeu305310315320LeuValLysArgAlaGluSerLeuArgValGlyAsnHisLeuGluAsp325330335ProAspValGlnLeuSerGlyLeuPheThrAlaAlaSerAlaGluArg340345350ValLeuGlyLeuIleLysGlyAlaValAsnAlaGlyAlaThrLeuLeu355360365AlaGlyAspLeuAlaLeuHisGlyProCysGlnThrIleMetAlaPro370375380HisIleLeuThrGlyValThrArgAspMetAspLeuPheHisArgGlu385390395400ThrPheGlyProValLeuPheValSerGluPheAspThrAspAspGlu405410415AlaIleAlaGlnAlaAsnAspThrGluPheSerLeuCysAlaSerVal420425430PheSerArgAspValLeuArgAlaMetAspThrAlaLysArgIleArg435440445ThrGlySerCysHisValAsnGlyProThrValTyrIleGluAlaPro450455460LeuProAsnGlyGlyValGlyGlyGlySerGlyTyrGlyArgPheGly465470475480GlyValAlaGlyIleGluGluPheThrGluArgGlnIleValSerLeu485490495AlaLysProGlyIleLysTyrAlaPhe500505<210>6<211>479<212>PRT<213>Penicilliumbrasilianum<400>6MetSerGlnAsnAspSerLysAlaValThrProLeuLeuIleAsnAsn151015GluSerValMetThrAspIleLysPheGluValHisAlaProAlaThr202530GlyGluLeuSerSerTyrCysAlaGlyAlaSerValGluAspAlaVal354045ArgAlaValAspAsnAlaLysAlaAlaPheProAlaTrpSerLysThr505560LysAlaTyrAspArgArgAspIleLeuLeuLysAlaAlaGluIleMet65707580IleSerArgLysGluGluLeuIleAlaTyrGlnGlnGluGluThrGly859095AlaGlyArgProPheCysGluHisThrPheAsnMetGlyValAsnPhe100105110IleLysAspPheAlaGlyArgIleSerThrIleGluGlyValValPro115120125SerValThrLeuAspGlyGluGlyAlaMetIleTyrLysGluProTyr130135140GlyValIleLeuSerIleAlaProTrpAsnAlaProPheIleLeuGly145150155160ThrArgAlaValAlaLeuProLeuAlaAlaGlyAsnThrValValLeu165170175LysGlySerGluLeuSerProLysCysPheTrpAlaLeuGlyAspIle180185190PheArgGlnAlaGlyLeuProAspGlyCysPheAsnValIlePheHis195200205GlnProSerAspAlaAlaAlaValThrThrAlaLeuIleAlaHisPro210215220AlaValArgLysValAsnPheThrGlySerThrAsnValGlySerIle225230235240IleAlaSerThrAlaGlyLysTyrIleLysProValLeuLeuGluLeu245250255GlyGlyLysAlaSerAlaIleValLeuAspAspAlaAspLeuAspLys260265270AlaAlaMetSerCysAlaLeuGlySerPheLeuHisSerGlyGlnIle275280285CysMetSerThrGluArgIleValValGlnArgAlaIleAlaAspGlu290295300PheArgGlnLysValAlaAlaAsnAlaGluLysLeuPheGlyLysAsp305310315320AlaProAlaLeuGlyLeuValAsnAlaAlaAlaValThrLysAsnLys325330335LysLeuValAlaAspAlaValSerArgGlyAlaAsnIleLeuPheGly340345350AspAlaSerAlaAsnGluSerValAsnThrCysMetArgProIleIle355360365ValAspGlyValSerLysGluMetAspLeuTyrAlaThrGluSerPhe370375380GlyProThrValSerLeuIleValValAspThrGluGluGluAlaIle385390395400AlaValAlaAsnAspThrGluTyrGlyLeuThrGlyAlaValTyrThr405410415GlnAsnLeuPheArgGlyLeuArgValAlaLysGlnIleGluSerGly420425430AlaIleHisIleAsnAlaLeuThrValHisAspGluProThrLeuPro435440445HisGlyGlyTrpLysSerSerGlyPheGlyArgPheGlyGlyValAla450455460GlyTyrAspGluPheLeuGlnThrLysThrValThrTrpMetGlu465470475<210>7<211>473<212>PRT<213>Penicilliumbrasilianum<400>7MetThrValThrThrThrLeuSerLeuIleAlaProProGluHisArg151015HisGluProSerProPheAspProAlaValAspIleLysAspAlaPro202530SerIleIleThrAlaLeuAsnAlaAlaAspProSerLeuLysValTyr354045ThrArgSerSerProAsnPheGluThrLeuArgGlyValTyrAsnLys505560LeuIleThrHisGlnProLeuAlaIleCysArgProGlnThrIleGlu65707580GlnIleGlnLeuIleValArgThrAlaArgAlaAlaAsnProProVal859095ProIleValProArgCysGlyGlyHisAspValTyrGlyArgGlyLeu100105110LysProAspSerLeuSerIleAspMetArgGluLeuAspThrGlnThr115120125LeuAlaGluAspArgGlnSerValArgIleGlyGlyGlyValThrSer130135140GlnAsnPheValGlyPheLeuAspGluHisGlyLeuCysThrAlaAsn145150155160GlyThrAlaGlyAsnValGlyTrpThrGlyTrpAlaValTrpGlyGly165170175TyrGlyProPheAsnAspTyrValGlyLeuGlyValAspAsnIleLeu180185190SerAlaArgLeuValLeuAlaAspGlySerLeuValGluAlaGlyPro195200205GlySerGluLeuLeuTrpGlyValArgGlyAlaGlyGlySerLeuGly210215220ValIleValAspValThrValLysValTyrProMetProValIleLeu225230235240AlaGlyPheIleAlaTyrGlnTrpGlyGluSerAlaLysValLeuSer245250255GlyLeuGlnGluLeuLeuAspArgGlyIleProAspThrMetCysLeu260265270GlnMetGlyPheMetLysThrLysTrpGlyValGlyMetSerLeuIle275280285PheAlaTrpProAspSerGluThrLeuAspGluGlyArgThrTrpLeu290295300GluThrValArgGlyLeuGlyAlaIleGlnValAspThrValGlyGlu305310315320ThrThrPheLysAlaPheGlnGlyIleThrSerArgValValAspGlu325330335ProValAsnValCysThrArgSerAlaSerValProArgPheThrPro340345350GluThrIleAlaLeuLeuGlnLysTyrSerGluAlaIleProAspGly355360365ArgGlnTyrAsnValIleAlaHisIleGlyHisGlyLysSerThrArg370375380ProAsnProAspThrSerPheAlaThrArgGluProHisValLeuPhe385390395400HisIleAsnAlaCysAspGluProGluArgMetAspGluAlaArgSer405410415TrpValAspGlyLeuMetLysGluMetAsnAlaThrArgGlnAlaMet420425430LysProValTyrValSerPheMetGlyGluAspGluAspProArgVal435440445SerPheGlySerHisTrpGluArgLeuGlnAlaLeuLysGlnSerVal450455460AspProAspAsnValPheArgPhePro465470<210>8<211>475<212>PRT<213>Penicilliumbrasilianum<400>8MetProPheLeuProPhePheLysValLeuArgLeuArgArgGluLeu151015AspGlyThrLysAlaGluIlePheThrTrpGlyCysAspGlyTyrAsp202530GluSerIleLysGlnTrpAsnAlaTyrLeuThrGlnGlyAlaThrVal354045ArgValThrSerSerAspGluAlaAlaThrValValArgPheAlaAla505560CysHisLysIleProPheThrValLysGlyGlyGlyTyrSerThrThr65707580GlyAlaSerSerAlaHisGlyValThrAlaGlnGlyGlyAlaLeuTrp859095GluAspIleAspValAlaAlaAlaGlnHisArgLeuAlaValValGly100105110SerThrLeuAsnHisIleGlyValAlaGlyAlaThrLeuGlyGlyGly115120125TyrGlyTrpLeuThrGlyGlnTyrGlyLeuAlaIleAspAsnLeuLeu130135140TrpValLysMetIleLeuAlaAspGlySerValIleIleValSerGlu145150155160GluGlnTyrProAspLeuPheTrpAlaIleArgGlyAlaGlyGlnSer165170175PheGlyValAlaIleGluLeuAlaPheArgAlaHisArgGlnAspHis180185190ProValPheAlaGlyThrLeuLeuPheSerAlaSerLysLeuSerAla195200205IleValGluPheAlaAsnAsnPheGluThrLeuThrAsnGlyAsnGln210215220GlyPheTrpPheGlyPheThrMetProProSerMetAspArgCysAla225230235240IleLeuValValValPheTyrAsnGlyProGlnIleAlaAlaArgGln245250255PhePheSerProLeuLeuSerIleGlyProValValAsnGluThrGly260265270MetLeuProTyrAspSerLeuAsnGlyIleLeuAsnMetMetAspThr275280285ValSerArgArgArgIleLeuArgGlyAlaAspIleThrLeuProThr290295300AspGluAsnValGlyThrArgLysSerLeuArgGlySerAsnIleThr305310315320LeuProLeuAspIleAsnPheThrAlaSerIleTyrSerGluPheAsp325330335GlyIleLeuArgGluPheThrGlnAlaArgAspSerIleLeuLeuPhe340345350GluLeuLeuProTyrThrGlnIleThrLysValProAsnAspAlaThr355360365AlaPheAlaSerArgGlyProTyrHisAsnValIleSerLeuPheGly370375380TrpGlnAspLysAspLeuAspGluArgMetHisSerLeuGlnGluAsp385390395400IleMetAsnGlnIleGlyLysArgAlaGlyIleAlaCysThrProPhe405410415TyrAsnValSerLysHisGlyThrGlyLeuTyrAlaAsnTyrAlaGly420425430HisAsnValProLeuGluAlaIlePheGlyAspAsnLeuArgArgLeu435440445GlnGluLeuLysLysLysPheAspProAsnAsnValPheLysLysTrp450455460HisAsnLeuAsnThrThrIleGlyThrProAla465470475<210>9<211>401<212>PRT<213>Penicilliumbrasilianum<400>9MetMetThrProProIleLeuAlaPheHisLeuPheLysAspPheGlu151015LeuGlnArgThrLysAsnTyrPheArgValLeuAsnIleAsnTyrLys202530AlaAspHisHisProHisGlnLeuPheHisAspGluPheThrIleAsn354045ThrIleAspAspCysThrLeuAlaAsnCysCysLysAlaThrAspLeu505560SerLeuProGlyArgSerHisLeuLeuArgGlyArgSerHisAsnAsp65707580GlnLeuPheMetSerArgGlnThrThrLeuPheThrMetTyrLeuHis859095IleGluThrSerAspLeuLeuAsnAlaSerSerSerAspGlnArgIle100105110LeuProSerSerCysLysProArgSerGluArgGlyAspTyrGlyMet115120125ValAlaSerAspTyrHisSerTyrThrGluAlaGlnMetAsnAsnVal130135140LysIleAlaHisArgGluAlaThrAsnTrpSerAspTrpValAlaLeu145150155160GlyThrValArgPhePheArgTrpGlyMetAspLeuAlaThrGlyTyr165170175LysHisProGlnProGlyGlnGluAlaSerGluLysPheLysMetThr180185190GluHisLysTrpLeuThrArgPheIlePheLeuGluSerValAlaGly195200205ValProGlyMetValGlyGlyMetLeuArgHisLeuArgSerLeuArg210215220ArgMetLysArgAspAsnGlyTrpIleGluThrLeuLeuGluGluAla225230235240PheAsnGluArgMetHisLeuLeuThrPheLeuLysLeuAlaGluPro245250255GlyTrpPheMetArgLeuMetValLeuGlyAlaGlnGlyValPhePhe260265270AsnGlyPhePheLeuSerTyrLeuIleSerProArgIleCysHisArg275280285PheValGlyTyrLeuGluGluGluAlaValLeuThrTyrThrArgAla290295300IleGlnGluLeuGluAspGlyHisLeuProGluTrpLysGluLeuGln305310315320AlaProGluIleAlaValHisTyrTrpGlnMetProGluAsnGlnArg325330335ThrMetArgAspLeuLeuLeuTyrIleArgAlaAspGluAlaLysHis340345350ArgGluValAsnHisThrLeuSerAsnLeuAspGlnAlaAlaAspPro355360365AsnProTyrGlnThrGluTyrGlnAspProArgLysAspHisProThr370375380ArgGlyIleAspAsnLeuLysAlaThrGlyTrpGluArgLysAspIle385390395400Phe<210>10<211>427<212>PRT<213>Penicilliumbrasilianum<400>10MetProHisAlaSerArgSerLeuAsnValLeuIleValGlyAlaGly151015LeuGlyGlyLeuAlaAlaGlyLeuAlaLeuGlnThrAspGlyHisLys202530ValThrIleIleAspAlaAlaProGluPheAlaGluAlaGlyAlaGly354045IleArgIleProProAsnSerSerArgLeuLeuMetArgTrpGlyVal505560AspLeuGluArgMetLysLysSerThrSerGlnArgTyrHisPheIle65707580ArgTrpLysAspGlySerThrIlePheAspLeuProPheAsnAsnIle859095ValGluThrHisGlyAlaProTyrTrpLeuValHisArgAlaAspLeu100105110HisAlaAlaLeuLeuAspAlaThrLeuLysAlaGlyValLysValLeu115120125AsnAsnLysLeuValThrSerTyrAspPheGluAlaProSerAlaThr130135140ThrGlnAspGlyGluThrPheLysAlaAspLeuIleValGlyAlaAsp145150155160GlyIleLysSerIleCysArgProLeuLeuThrGlyGlnProAspVal165170175ProArgAspThrGlyAspValAlaTyrArgIleLeuIleProGlyGlu180185190LysLeuLeuAlaAspProAspLeuAlaHisLeuIleArgAspProCys195200205ThrThrSerTrpCysGlyProAspAlaHisLeuValGlyTyrProIle210215220ArgAsnGlyGluMetTyrAsnIleValMetCysAlaThrSerTyrAsn225230235240GluThrThrAspGluValTrpValValLysGlyAspAsnSerGluLeu245250255CysLysArgPheAlaSerTrpGluProGlnValArgLysLeuCysAla260265270LeuThrGlyAspPheMetLysTrpArgLeuCysAspLeuProAsnLeu275280285AlaArgTrpThrHisProSerGlyLysAlaValLeuLeuGlyAspSer290295300CysHisProMetLeuProTyrLeuAlaGlnGlyAlaAlaGlnAlaVal305310315320GluAspAlaAlaValLeuArgGlnValLeuAlaGlnAspMetAspMet325330335AlaAlaAlaLeuLysGlnTyrGluGlnIleArgMetProArgAlaSer340345350LeuValGlnAlaLysThrArgGluHisGlnTyrIleLeuHisValAsp355360365AspGlyHisGluGlnGlnAspArgAspLysLysLeuAlaLeuAspAla370375380AlaGluAsnProValPheTrpGlyTyrAspAspArgArgLysTrpLeu385390395400PheSerHisAspAlaGluValIleGlnLysGluGlyAlaAsnTrpArg405410415AspGlyProAsnMetAsnGlyValHisValAla420425<210>11<211>460<212>PRT<213>Penicilliumbrasilianum<400>11MetSerProSerValThrProGluArgTyrProIleAlaIleValGly151015GlyGlyIleAlaGlyLeuThrLeuAlaLeuAlaLeuGluLysLeuGly202530ValArgTyrValLeuPheGluSerGlnSerSerLeuAlaProAspArg354045GlyAlaSerValGlyLeuGlnProAsnGlyLeuArgIleLeuAspGln505560LeuGlyLeuIleAspLysIleGluGlnHisThrGlyThrLeuGlnArg65707580TrpArgHisLeuAspGlyGlnGlyGluLeuIleSerGluThrLysAla859095LeuGlyTyrTyrGlnSerLeuIleGlyTyrGlyProLeuPheLeuGlu100105110ArgArgLysLeuLeuGluIleMetAlaAspGluLeuGlnAspLysThr115120125AlaAlaLysThrSerLeuArgValValSerAlaAsnGluSerSerAsp130135140GlyValGluLeuAlaLeuSerAspGlyHisSerIleThrAlaAspLeu145150155160ValIleGlyAlaAspGlyValArgSerCysIleArgGluAlaIleAsp165170175MetSerArgThrGluTrpHisSerGluAlaAsnGluTyrIleAsnThr180185190GlnPheAlaCysIleTyrGlyIleSerGlyAlaIleGlnGlyIleVal195200205GluGlyAspCysPheSerValTyrArgProGluAlaThrValLeuIle210215220PheThrGlyArgAsnGlyThrIlePheTrpPheValPheGluAspLeu225230235240GlyGlnThrTyrGlyLeuSerThrThrProArgTyrThrAsnAspAsp245250255PheAspAlaLeuCysAspSerIleAlaHisLeuArgLeuThrAlaSer260265270ValArgPheGlyAspValTyrGlyAsnArgSerValAlaMetLysVal275280285ProLeuGluGluGlyLeuAlaProSerTrpHisThrAspArgMetVal290295300IleValGlyAspAlaAlaHisLysMetValProAsnAlaAlaMetGly305310315320AlaAsnGlnAlaIleGluSerSerAlaThrLeuLeuAsnGluLeuGly325330335AsnIlePheThrAlaLysAspGlyGlySerProGlnProGluIleLeu340345350AlaAsnAlaLeuLysArgTyrAlaAspIleArgLysPheArgAlaSer355360365GluIleValLysArgAlaGlyThrIleCysArgAlaGlnLeuSerHis370375380SerGlyProAlaAlaAlaValArgGluGluLeuProSerLeuThrAsp385390395400GlyAspTrpLeuPheArgGlyPheMetGlyLeuSerGluSerProVal405410415IleAspAlaLeuProValProProArgGlyLysPhePheGlyGlnAla420425430ValGluLysPheTrpLysArgPheArgAlaArgGlnAlaSerGlyPhe435440445LysThrSerAsnLeuGluLeuPheGlyIleGluAla450455460<210>12<211>347<212>PRT<213>Penicilliumbrasilianum<400>12MetSerSerHisThrLeuSerLeuLeuGluAlaLysProTyrTyrSer151015ThrGluLeuGlySerLeuArgAlaValThrAlaGluGlnLeuProIle202530LeuLysAsnLeuSerIleLysArgValValLeuAlaProSerAlaIle354045ArgGluProHisTrpHisSerAsnAlaAsnGluLeuAlaTyrCysLeu505560ArgGlyLysLeuMetValSerIleLeuAspSerGlyAsnValPheAla65707580AsnPheValIleGluAlaGlyGlnMetPheHisIleGluSerGlySer859095LeuHisHisPheGluAsnIleCysAspGluGluAlaGluIleIleIle100105110CysPheArgHisGluLysProThrAspPheAlaLeuSerAlaSerMet115120125GlyAlaMetThrAspGlyValLeuGlyAsnThrTyrGlyHisHisSer130135140SerAspTrpAlaLysIleAsnArgHisThrHisProLysTyrIleVal145150155160ArgArgAsnGlyArgProThrIleProSerThrAlaTyrLeuProAsp165170175ProHisLysPheAspValGluGluMetAsnProProValSerSerGlu180185190PheGlySerAsnArgThrAlaArgAsnGlnPheTrpProAlaLeuHis195200205AsnMetSerMetTyrSerLeuArgIleGluAspThrGlyMetArgGlu210215220AlaHisTrpHisProGluThrSerGluLeuGlyTyrValAlaGluGly225230235240GluAlaArgMetThrValLeuAspProAspGlySerThrAspThrTyr245250255TyrLeuLysGlnGlyAspMetTyrTyrValProThrAlaTyrProHis260265270GlnIleGluValIleGlySerGluArgMetHisPheLeuIlePhePhe275280285AspGlnProTyrProLysAspValGlyTyrArgThrSerAlaThrAla290295300LeuProArgGluThrLeuAlaSerThrLeuGluValAlaGluLysAsp305310315320LeuProLysPheProLeuThrValLysAspProLeuPheValGluLys325330335LysAsnProValAspAsnLeuArgProLysLeu340345<210>13<211>313<212>PRT<213>Penicilliumbrasilianum<400>13MetAlaGlyIleArgValAlaTrpIleGlyLeuGlyAsnIleGlyArg151015GlyMetSerSerAsnIleAlaGlnLysGlyProGlnSerSerLeuIle202530LeuPheAsnArgThrThrSerArgAlaThrAlaHisAlaGluLysLeu354045GlyGlyAsnValThrValAlaIleSerLeuIleGluAlaValLysAla505560SerAspLeuIlePheThrCysValGlyAspAspProAlaIleAspSer65707580IleThrGluThrIleLeuSerAspLysGluLeuAspLeuSerThrLys859095ThrPheValAspCysSerThrValHisProAspThrSerArgArgThr100105110GluAlaAlaTyrGluAlaArgGlyAlaSerPheValAlaCysProVal115120125PheGlyAlaProAsnMetAlaAspAlaGlyGlnMetIleValValPro130135140AlaGlyLysGlnSerAlaIleThrLysValLysProPhePheGluGly145150155160ValValAlaLysAlaThrIleAspLeuSerAlaGlyThrGlyAlaAsp165170175IleAspValGlyArgAlaSerThrLeuLysValLeuGlyAsnThrPhe180185190IleLeuAsnThrValGlyValLeuAlaGluAlaLeuThrAlaAlaAsp195200205AlaThrGlyLeuGlyThrAlaProPheArgGlnTrpLeuGluLeuPhe210215220AsnProGlyProPheAlaLysTyrAlaAspArgMetIleSerGlyAsp225230235240TyrTyrGlnArgGluGluProLeuPheAlaValAspLeuAlaArgLys245250255AspLeuArgHisAlaSerAsnIleAlaLysGluGlyGlyGlnArgMet260265270ArgAsnValGluValThrAspHisPheLeuGlnGluValLysAlaGlu275280285LysGlyGluLysGlyAspIleAlaAlaValTyrGlyAlaAlaArgLys290295300AspAlaGlyLeuLysPheGluAsnGln305310<210>14<211>290<212>PRT<213>Penicilliumbrasilianum<400>14MetSerSerThrSerGluSerPheThrLeuProAsnGlyArgGlnMet151015AlaTyrThrLeuSerProGlyGlySerSerAspArgValValLeuLeu202530SerAsnSerLeuAlaGluAspLeuThrSerTrpGluArgValValPro354045ValValGluAsnGlnGlyPheArgValLeuArgTyrAspGlnProGly505560HisGlyArgSerGlyAlaProThrGluAlaGluLeuThrSerMetThr65707580PheGluThrLeuValAspAspValTyrArgLeuLeuGlyHisLeuLys859095IleAsnAsnLeuHisAlaTrpValGlyValSerMetGlyGlyIleLys100105110AlaValTyrPheThrAlaArgHisProGlyIleValAsnLysIleVal115120125ValAlaAspAlaIleAlaAlaSerProSerValValCysIleProAsp130135140AsnPheAlaAlaArgValSerAlaValLysGlnSerGlySerIleSer145150155160AspAspLeuSerAsnThrArgLysArgTrpPheGlyGluAspTrpMet165170175AlaLysHisProGluGluThrAlaArgMetGluLysSerMetAlaThr180185190ThrThrIleGlnGlyLeuGluAlaCysCysAlaAlaLeuSerSerPro195200205SerPheAspLeuArgProLeuTyrThrLysValGlyHisGlyCysGlu210215220GluAlaLeuIleValAlaGlyGluLysAspAlaAspLeuProValLys225230235240MetGlnGluMetArgGlnAlaIleGluGluSerLeuArgSerCysGly245250255LysLysValProValArgMetGluIleIleLysGlyAlaGlyHisVal260265270ProTyrIleAspGlyPheGluAspPheCysGluIleIleThrLysPhe275280285LeuAla290<210>15<211>245<212>PRT<213>Penicilliumbrasilianum<400>15MetSerLeuSerGlyLysValValLeuIleThrGlySerSerLysGly151015IleGlyLysAlaAlaAlaLeuArgValAlaSerGluGlyAlaAsnVal202530ValIleAsnTyrLeuArgAspProValAlaAlaAsnAsnLeuValAsp354045GlnIleGlyAlaAspArgAlaLeuAlaValGlnAlaAspAlaSerLys505560LeuAlaAspLeuAspArgLeuValAsnAlaAlaValAlaGlnPheGly65707580LysIleAspValLeuIleProAsnAlaGlyIleLeuProLeuArgAsp859095LeuGluHisThrSerGluGluAspPheAspArgThrTyrAsnLeuMet100105110ValLysGlyProTyrPheLeuAlaGlnLysAlaValLysHisMetPro115120125ProGlyGlyArgIleIlePheValSerThrSerThrAlaArgPheAla130135140SerValAlaProAlaTyrLeuLeuTyrThrSerSerLysGlyAlaIle145150155160GluGlnMetThrArgIleMetAlaLysAspLeuAlaArgLysGlyIle165170175LeuValAsnAlaValAlaProGlyProThrSerThrGluLeuPheLeu180185190GluGlyLysProGluGlnMetIleLysAlaIleSerGlyPheSerPro195200205PheAsnArgIleGlyGluProGluGluIleAlaAlaValMetAlaPhe210215220LeuSerGlyLysAspSerSerTrpIleSerGlyGlnValValAlaVal225230235240AsnGlyAlaMetAla245<210>16<211>581<212>PRT<213>Penicilliumbrasilianum<400>16MetAlaSerLeuIleArgGluAlaProPheGlyGlnIleValArgTyr151015LeuThrAsnAsnLysTyrPheGlnTyrProGluGluLysProAspPhe202530LysLeuProAspThrTrpLeuGlnLeuLeuAsnGluSerAspAlaAla354045ThrIleAlaAspProGluLysThrGluProGluProGluGlyGlnGly505560TyrAspAlaThrSerGluAlaIleSerArgAlaSerThrGlnAsnSer65707580LeuProPheThrGluAlaArgLeuGluAlaAspGluGlnHisGluIle859095GluLysIleLysSerIleProIleGlnProLysLysThrLysAspGly100105110AlaIleLeuValAspTrpTyrTyrThrAspAspAlaGluAsnProHis115120125AsnTrpSerAsnArgLysArgAlaLeuLeuThrThrLeuIleCysLeu130135140TyrThrPheValValTyrThrThrSerAlaIleTyrThrSerSerVal145150155160ProGlyIleMetLysGluPheGlyValSerAspLeuValAlaThrLeu165170175GlyLeuSerLeuTyrValLeuGlyTyrGlyThrGlyProLeuIlePhe180185190SerProLeuSerGluIleProValIleGlyArgAsnProValTyrIle195200205ValThrMetPheLeuPheValIleLeuSerIleProThrAlaPheVal210215220GlyAsnPheAlaGlyLeuMetValLeuArgPheLeuGlnGlyPhePhe225230235240GlySerProCysLeuAlaSerGlyGlyAlaSerIleGlyAspMetTyr245250255SerLeuMetSerLeuProTyrAlaMetMetSerTrpValSerAlaAla260265270TyrCysGlyProAlaLeuGlyProLeuIleSerGlyPheAlaValPro275280285AlaGluThrTrpArgTrpSerLeuPheGluSerIleTrpMetSerAla290295300ProValLeuIleLeuMetPhePhePheLeuProGluThrSerSerAla305310315320ThrIleLeuLeuArgArgAlaAlaArgLeuArgLysIleHisAsnAsn325330335AlaArgPheMetAlaGlnSerGluIleAspGlnArgAsnMetLysVal340345350SerAlaValAlaValAspAlaLeuIleLysProLeuGluIleThrIle355360365LysAspProAlaValLeuPheValGlnValTyrThrAlaIleIleTyr370375380GlyIleTyrTyrSerPhePheGluValPheProLeuValTyrProVal385390395400AspTyrGlyMetAsnLeuGlyGlnValGlyLeuValPheLeuCysIle405410415LeuValSerCysIleIleGlyIleAlaIleTyrTrpSerTyrLeuTyr420425430PheTrpMetAsnProArgIleGluArgPheGlyPheProAlaGlnGlu435440445SerArgLeuIleProAlaLeuProAlaSerIleGlyProThrIleGly450455460LeuPheLeuPheAlaTrpThrAlaArgAlaSerIleHisTrpIleAla465470475480ProThrIleGlyIleThrIleTyrGlyAlaThrValPheIleValMet485490495GlnCysLeuPheValTyrIleProLeuSerTyrProMetTyrAlaAla500505510SerLeuPheAlaAlaAsnAspPhePheArgSerAlaLeuAlaCysGly515520525SerValLeuPheAlaHisProLeuPheGlyAsnLeuGlyValAlaArg530535540GlyThrSerLeuLeuGlyGlyLeuSerValIleGlyIleIleGlyIle545550555560TrpLeuLeuTyrTyrTyrGlyAlaArgLeuArgSerLeuSerLysPhe565570575AlaIleSerAspAsp580<210>17<211>513<212>PRT<213>Penicilliumbrasilianum<400>17MetSerThrThrLysGluAlaPheProHisThrAspSerAspIleMet151015GluAspSerGluLysAsnLeuProGluCysGluHisIleValSerVal202530GluProThrLeuLysMetArgAspGlyIleValLeuMetProGlnPro354045SerAspAspProAsnAspProLeuAsnTrpSerTrpPheArgLysHis505560AlaAlaMetPheThrLeuSerTyrLeuAlaLeuValCysTyrValAla65707580ValThrThrLeuValThrGlyThrValProLeuAlaLysSerMetHis859095ValSerLysSerThrAlaValTyrLeuGlyAsnThrProValAlaLeu100105110TyrAlaValAlaProTrpPheTrpSerProLeuSerHisPheIleGly115120125ArgArgProValLeuLeuMetCysAsnIleIleAlaValValGlyAla130135140ValValValThrThrSerLysThrTyrAlaSerCysMetValGlyArg145150155160ValIleLeuGlyAlaGlyGlySerAlaPheTrpThrLeuGlyProAla165170175SerIleGlyAspIlePhePheArgHisGluLysGlyLysLysIleGly180185190ValSerThrLeuAlaIleValIleAlaProPheLeuGlyThrIleIle195200205GlyGlyProIleIleGluAsnGluLysLeuGlyTrpProAlaSerGln210215220TrpIleProLeuIlePheMetAlaAlaGlyPheIleMetGlnIlePhe225230235240PheLeuProGluThrIleTyrIleArgGluThrArgAlaHisProAla245250255IleMetSerThrSerThrProGlyLysProThrPheTrpAspArgTyr260265270GlyIleHisIleProLysArgSerGluGluLysGlnHisSerPheLeu275280285PheIleAlaThrArgProPheValLeuPheLysPheProAlaValIle290295300LeuSerAlaPheTrpPheGlyIleAlaTyrMetMetHisValGlyIle305310315320ThrSerGluIleProLeuIlePheGluGluHisTyrAspPheSerVal325330335LeuGluIleGlyLeuSerGlyPheSerGlyLeuIleGlyAlaLeuLeu340345350GlyGluValTyrAlaGlyProSerLeuAspPheIleAlaLysArgThr355360365MetLysGlnGlyArgGluTrpArgProGluTyrArgLeuGlnAlaIle370375380TrpProAlaLeuIleThrValProAlaGlyLeuIleMetPheGlyThr385390395400SerIleGlnPheGlyAsnValTrpIleThrProLeuIleGlyGlnAla405410415ValTyrIlePheGlyIleGluIleAlaThrThrValIleGlnThrTyr420425430IleLeuGluCysTyrProArgGlnGlyAlaGluAlaAsnLeuValPhe435440445AsnLeuIleArgAsnLeuPheSerTyrIleSerProPhePheValGln450455460ProMetIleAlaThrLeuGlyThrThrSerProPheGlyLeuSerAla465470475480AlaLeuThrAlaPhePhePheProPheThrValGlyValLeuMetTrp485490495ArgGlyLysGlnIleArgAspLysGlyGlyAspProGlyTrpSerArg500505510Asp<210>18<211>1435<212>PRT<213>Penicilliumbrasilianum<400>18MetGluAspHisGluLysGluTyrAspSerThrSerProProGlyThr151015AlaThrGluGluGlyAsnGlyGlyTyrPheAsnThrLeuThrValPro202530GluIleAsnLeuArgGluAlaSerSerAlaGluThrLeuThrProHis354045AlaSerValValGlnProProLysLysAlaAlaGluTrpHisMetThr505560ProGlnValIleArgAsnAlaGluArgAspGluAlaAlaGlyPheLys65707580ArgArgGluLeuGlyValThrTrpGlnAspLeuSerValGluValLeu859095AlaAlaGluAlaAlaValLysGluAsnMetIleSerGlnPheAsnVal100105110ProGlnLeuIleLysAspPheArgArgLysProProLeuLysSerIle115120125LeuSerAsnSerHisGlyCysValLysProGlyGluMetLeuLeuVal130135140LeuGlyArgProGlySerGlyCysThrThrLeuLeuLysMetLeuAla145150155160AsnArgArgGluGlyTyrGlnAsnIleThrGlyAspValArgPheGly165170175AsnMetThrProGluGluAlaSerArgTyrGlnGlyGlnIleValMet180185190AsnThrGluGluGluLeuPheTyrProArgLeuThrValGlyGlnThr195200205MetAspPheAlaThrLysLeuLysValProTyrHisLeuProGlyGlu210215220GlyLysSerValAlaGluTyrThrAlaGluThrLysGlnPheLeuLeu225230235240GluSerMetGlyIleAlaHisThrAlaAspThrLysValGlyAsnGlu245250255PheValArgGlyValSerGlyGlyGluArgLysArgValSerIleIle260265270GluCysLeuAlaThrArgGlySerValPheThrTrpAspAsnSerThr275280285ArgGlyLeuAspAlaSerThrAlaLeuGluTrpAlaLysAlaLeuArg290295300AlaMetThrAspValGlnGlyLeuSerThrIleValThrLeuTyrGln305310315320AlaGlyAsnGlyIleTyrAsnLeuPheAspLysValLeuValLeuAsp325330335GluGlyLysGlnIleTyrTyrGlyProAlaAlaGluAlaLysProPhe340345350MetGluAsnLeuGlyPheValTyrThrAspGlyAlaAsnIleGlyAsp355360365PheLeuThrGlyLeuThrValProThrGluArgLysIleArgProGly370375380TrpGluAsnArgPheProArgThrAlaAspAlaIleLeuThrGluTyr385390395400GlnAsnSerAlaThrTyrLysAsnGluValSerLeuTyrGlyTyrPro405410415AspThrAspLeuAlaAlaGluArgThrGluAlaPheLysGluSerVal420425430AlaTrpGluLysSerLysHisLeuProLysGlySerAspLeuThrThr435440445SerPheTrpAlaGlnLeuMetSerCysThrAlaArgGlnTyrGlnIle450455460LeuTrpGlyGluLysSerThrPheLeuIleLysGlnIleLeuSerCys465470475480ValMetAlaLeuIleAlaGlySerCysPheTyrAsnSerProAspThr485490495SerAlaGlyLeuPheThrLysGlyGlyAlaValPhePheSerLeuLeu500505510TyrAsnCysIleValAlaMetSerGluValThrGluSerPheLysGly515520525ArgProIleLeuThrLysHisLysSerPheAlaMetTyrHisProAla530535540AlaPheCysLeuAlaGlnIleThrAlaAspPheProValLeuLeuPhe545550555560GlnCysThrIlePheSerValValIleTyrTrpMetValGlyLeuLys565570575HisThrAlaAlaAlaPhePheThrPheTrpAlaIleLeuPheThrThr580585590ThrLeuCysIleThrAlaLeuPheArgPheIleGlyAlaAlaPheSer595600605SerPheGluAlaAlaSerLysIleSerGlyThrAlaValLysAlaIle610615620ValMetTyrAlaGlyTyrMetIleProLysProGluIleLysAsnTrp625630635640PheLeuGluPheTyrTyrThrAsnProPheAlaTyrAlaPheGlnAla645650655AlaLeuThrAsnGluPheHisAspGlnHisIleAspCysValGlyGly660665670AsnLeuIleProSerGlyProGlyTyrGluAspValGlySerGlyTyr675680685LysAlaCysAlaGlyValGlyGlyAlaLeuProGlyAlaAspTyrVal690695700ThrGlyAspGlnTyrLeuSerSerLeuHisTyrLysHisSerGlnLeu705710715720TrpArgAsnPheGlyValValTrpAlaTrpTrpGlyPhePheAlaVal725730735LeuThrValValPheThrCysPheTrpLysSerGlyAlaAlaSerGly740745750SerSerLeuLeuIleProArgGluAsnLeuLysLysHisGlnValGly755760765AsnAspGluGluAlaGlnAsnAsnGluLysHisAlaAlaArgThrThr770775780ThrAspGluProValGlnValGluAspAspAsnLeuValArgAsnThr785790795800SerIlePheThrTrpLysAsnLeuThrTyrThrValLysThrProThr805810815GlyAspArgValLeuLeuAspAsnIleAsnGlyTrpValLysProGly820825830MetLeuGlyAlaLeuMetGlySerSerGlyAlaGlyLysThrThrLeu835840845LeuAspValLeuAlaGlnArgLysThrGluGlyThrIleLysGlySer850855860IleLeuValAspGlyArgGluLeuProValSerPheGlnArgMetAla865870875880GlyTyrCysGluGlnLeuAspValHisGluSerTyrAlaThrValArg885890895GluAlaLeuGluPheSerAlaLeuLeuArgGlnSerArgAspThrPro900905910LysAlaGluLysLeuLysTyrValAspThrIleIleAspLeuLeuGlu915920925LeuHisAspLeuAlaAspThrLeuIleGlySerValGlyAsnGlyLeu930935940SerValGluGlnArgLysArgValThrIleGlyValGluLeuValSer945950955960LysProSerIleLeuIlePheLeuAspGluProThrSerGlyLeuAsp965970975GlyGlnSerAlaTyrAsnThrValArgPheLeuArgLysLeuAlaAsp980985990ValGlyGlnAlaValLeuValThrIleHisGlnProSerAlaGlnLeu99510001005PheAlaGlnPheAspThrLeuLeuLeuLeuAlaArgGlyGlyLys101010151020ThrValTyrPheGlyAspIleGlyAspAsnGlySerThrIleLys102510301035GlnTyrPheGlyAsnTyrGlyAlaIleCysProGlnGluAlaAsn104010451050ProAlaGluPheMetIleAspValValThrGlyGlyIleGlnGlu105510601065ValLysAspLysAspTrpHisGlnIleTrpLeuAspSerProGlu107010751080GlnHisGlnMetIleThrGluLeuAspArgMetIleAlaAspAla108510901095AlaSerLysProProGlyThrValAsnAspGlyTyrGluPheSer110011051110MetProLeuTrpGluGlnIleLysIleValThrGlnArgMetAsn111511201125ValSerLeuPheArgAsnThrAlaTyrValAsnAsnLysPheSer113011351140LeuHisIleIleSerAlaLeuLeuAsnGlyPheSerPheTrpArg114511501155ProGlyProSerValSerAlaLeuGlnLeuLysMetPheThrIle116011651170PheAsnPheValPheValAlaProGlyValIleAsnGlnLeuGln117511801185ProLeuPheIleGlnArgArgAspIleTyrAspAlaArgGluLys119011951200LysSerLysMetTyrSerTrpValAlaPheValThrGlyLeuIle120512101215ValSerGluPheProTyrLeuCysIleCysAlaValLeuTyrPhe122012251230ValCysTrpTyrTrpProValTrpArgLeuProHisAspSerAsp123512401245ArgSerGlyAlaIlePhePheMetMetLeuIleTyrGluPheIle125012551260TyrThrGlyIleGlyGlnPheIleAlaAlaTyrAlaProAsnPro126512701275ThrPheAlaAlaLeuValAsnProLeuIleIleSerValLeuVal128012851290LeuPheCysGlyValPheValProTyrAspGlnLeuAsnValPhe129513001305TrpLysTyrTrpMetTyrTyrLeuAsnProPheAsnTyrValVal131013151320AsnGlyMetLeuThrPheGlyLeuTrpGlyGlnLysValThrCys132513301335AsnGluSerGluTyrAlaValPheAspProLeuAsnGlyThrCys134013451350GlyGluTyrLeuAlaThrTyrMetSerGlyLysGlySerGlyVal135513601365AsnLeuLeuAsnProAspAlaThrSerSerCysLysValCysGlu137013751380TyrThrThrGlySerAspPheLeuGlnThrLeuAsnIleAsnHis138513901395TyrTyrTyrGlyTrpArgAspAlaGlyIleThrValIleTyrAla140014051410IleSerGlyTyrAlaLeuValPheGlyLeuMetLysLeuArgThr141514201425LysAlaSerLysLysAlaGlu14301435<210>19<211>872<212>PRT<213>Penicilliumbrasilianum<400>19MetCysGlnAspHisAspLeuGluCysSerTyrThrLeuProArgLys151015ThrArgPheTyrGlySerValAspAspLeuSerAspArgTyrLysCys202530LeuGluAlaIleValArgAlaAlaPheProAsnAspGlyIleSerThr354045ValProGluLeuIleArgLeuGlyGluArgMetGlyTyrAlaMetPro505560AspLeuSerGlnLysSerGlyGluSerProArgIleGluGluLeuVal65707580ArgAspPheProThrGluAlaGlyAspGlnGlyLeuAlaGlySerThr859095GlnCysThrSerSerProProArgThrGlyAlaValAsnValProThr100105110GluSerGluArgArgHisSerSerSerGlnValGlnGluAsnAsnSer115120125CysProAspGluProValGlyLeuIleArgAspThrThrGlyArgGlu130135140HisPheIleGlyProSerGlySerLeuGlnPheLeuGlyGlnLeuArg145150155160ArgLeuLeuLeuIleSerArgSerGlyAspAlaValGluSerArgAla165170175ProAlaArgLeuThrAlaThrPheThrAspGluAspAlaAlaGlnAla180185190LeuGluAlaAspGlyAspGlnSerGluLeuAlaAlaLeuProSerGly195200205GlyThrGlyAsnGlyGlyAspGluGlyGlnGluIleAspGluArgSer210215220ProAlaSerLeuGlySerAlaLeuValArgAspPheSerSerIlePro225230235240ValAsnAspIleAspGluMetArgArgGlnLeuProProArgHisVal245250255LeuAspSerLeuMetArgValTyrPheLysAsnValHisProAspPhe260265270AlaLeuPheHisArgGlyThrPheGluGluGluTyrGluThrPheMet275280285SerLysGlyArgTyrTyrHisGlnHisAlaArgAlaGlyValHisLeu290295300SerSerProThrLeuProGluProGlyTrpLeuGlyCysLeuHisMet305310315320MetIleAlaPheAlaSerLeuAsnGlySerValAspValAlaProAsp325330335LeuAspLeuThrSerLeuCysArgHisCysAlaSerLeuThrArgGln340345350LeuLeuProGlnPheIleSerLysCysThrLeuSerAsnValArgAla355360365LeuLeuLeuLeuSerLeuPheLeuHisAsnHisAsnGluArgAsnAla370375380AlaTrpAsnLeuValGlyThrAlaMetArgLeuSerPheAlaMetGly385390395400LeuHisArgAlaSerAspAsnGlySerHisPheArgProIleGluArg405410415GluValArgLysArgValPheCysThrLeuTyrGlyPheGluGlnPhe420425430LeuAlaSerSerLeuGlyArgProSerGlyPheTyrAspPheGluAsp435440445ValGluIleValProProArgGluGlyValLeuAspSerGlyGlnAsp450455460GluAspAspGluValMetLysLeuSerLeuArgLeuGlnValIleLeu465470475480AlaLysAlaArgValSerLeuAlaValLysThrLeuAlaValAlaAsn485490495GluArgGlyAsnIleAspGlyLeuAlaArgGlnGlnGlnSerSerArg500505510GluThrLeuGluIleLeuLysAlaTrpArgGluAspLeuAlaSerHis515520525HisIleLeuAsnIleProLeuIleSerGluThrAspAspProLeuCys530535540GlnTyrAlaGluGluIleProArgMetSerLeuGlnAspLeuLysAla545550555560MetMetGlyTrpGlnSerArgProArgLeuArgAlaAlaLeuValLeu565570575HisLeuGlnTyrArgTyrIleAlaValLeuValThrArgSerSerLeu580585590LeuArgTyrValAlaSerAlaGlnArgGlyGluProGluHisGluAla595600605LeuLeuSerArgAsnGluAlaArgThrAspProTyrAsnSerGluAla610615620GlyGluArgLeuSerAspIleCysValThrHisAlaThrGlnLeuCys625630635640ArgLeuIleLeuLeuAlaAspSerPheGlyLeuValAsnGlyIleSer645650655AlaMetAspValPheTyrValTyrCysGlyValMetValLeuIleLeu660665670ArgSerLeuArgIleSerSerSerAlaSerHisTyrHisAspGlnArg675680685GluAlaHisLeuGlnLeuGluLeuArgLysLeuIleAlaGlnThrArg690695700GluValLeuIleArgValAsnLysCysSerThrMetLysArgPheAla705710715720ArgValValAlaThrPheGluAspGlySerArgGlnAspAsnIleArg725730735ProAlaAspGlySerThrAsnArgSerThrAlaAsnCysGluMetArg740745750ThrAlaArgGlnAlaSerArgAspProArgGlyArgPheAsnHisSer755760765IleHisAlaAlaLeuAspGlyGlyArgAlaSerAsnLeuAlaIlePhe770775780ProGlyAlaGlyGlySerLeuAspThrSerSerSerLeuProValSer785790795800GlnGlnGluProLeuAsnPheGlnHisGlyTyrGlyAsnGlyIleGly805810815ProArgLeuGlyIleSerAspProPheTrpGlnProAsnLeuLeuThr820825830SerPheAspGlyGluProGluAlaAsnGlyTrpMetMetAspProPhe835840845LeuAlaMetAspGlyThrGlyValValAspTrpGlyAspIleGluSer850855860LeuLeuSerArgAsnProGlyGln865870<210>20<211>1056<212>DNA<213>Penicilliumbrasilianum<400>20atgggctcgctatctctaccggagacgtctcttgcggcaatccaagataaggagaccaag60gccatctccgtcgccaaacgcccaactccagtccccgtcggcactcaagtcctcgtcaag120ctacactactccggtgtctgcgccacagatctccatctggcccgcggcagcgtcccctat180ctgcagcccaaggtctcggtaggcggccatgagggcacgggggtaatcgccagcctcggc240cccgacgtggacgccgcggagtggcacgtcggcgaccgggtcgcggtgcggtgggtgcac300atcgtctgcgggaagtgcgaggtgtgcactaccggctttgagaacctgtgccaaagccgg360aagctcgctggcaaggacgttgagggcacctttgccgagtacgctattgcggacagctcg420tacatggtccgcctgccggctggggtgagcgacgccgatgccgctccgatactgtgcgcc480ggtgtcaccgtctacaaggcgctcaagatcgccagcctccgggcgggctcgtgggtcgcc540gtggccggggctggtggcggcttgggtcatctggctattcaatatgcacgtgccatgggg600ctcaaggtcgtggccctggatgctaggaaacgggatctctgcctgagcctgggcgcggaa660tcgtacatcgacgtgctcgaaacggacgactgcgtagcccaggtgatcaaggtcacggat720gggggcgctcatggcgcactcatctgcgcctcgtccggccaggcctatgacgatgccgtc780aaattcctaagatggaccggcaccctggtgtgtatcggcctccccccaaagccgacactg840ctctccctaggccccgcggacttcgtcgcccgtggcatcaaggtcatgggcacatccaca900ggtgaccgccaggacacggtggaggccctcgcctttgtcgccaagggccaggtaaaaccg960cagttaactgagagaaggctggaggatgttgaggagatcttaaaggagatcgagaatggg1020actatgcagggtaaagctgtgatcaggatagcctga1056<210>21<211>1020<212>DNA<213>Penicilliumbrasilianum<400>21atgagtctgccgtctcactacaaacgggccgcctttaaagaggctggcggcccgctcacc60attgaagaagtcgacttgaccatgccggatgctggcgaagtgctggtgaaggtggaagct120tgcggagtttgtttctccgacacggttccacaggctcatggcctgggggggaaatttcca180atcgtacccggtcatgaaatcatcggacatgtggttgcgacaggtgacggtgtctcggac240tgggaggttggcgatcgtatcggcgaaggatggcacggcggccatgacggaacttgtccc300tcctgtcgccagggccatttccaaatgtgcgacaatcagagcatcaatggggtgaccaaa360aacggcggatatgcccaatactgcattctccgtagtgaagctgctgtcagaattcccact420catgtctcagccgccgagtatgccccaattctctgcgcgggcgtgaccgtcttcaactca480atgcgtcaaataggggtcaaacctggctctaccgttgccattcagggtctgggaggtctc540ggccatcttgccatccaatatgcgaatcgcttcggcttccgagtggtggccatctctcgc600gatgatcaaaaggagcgatttgtgcgagacctcggtgcccacgagtatatcaatacaagc660gaagaagatgtcggaagcgcgctccagaaactgggaggtgcttctctgattgtagccacc720gcgcccaatgcccgggccatttcccctctattgaagggccttagacctctgggtaagctt780cttattctcgccgttccgggtgaaatccccctcgatacacggcttatggtcgcccgaggt840ctttctgtccacggatggccgagtgggcatgcacttgattctgaggaaaccattcgcttt900acagaattagaggatatcaagtgtatgatccagacatattctcttgatcgtgccaatgaa960gcattcgatgccatgatttcggggtcggttcgattccgtgcggtgattaccatggagtaa1020<210>22<211>1170<212>DNA<213>Penicilliumbrasilianum<400>22atggctcctcaaattcctgagaagcagtgggcacaggttgtcgagaaaaaaggtgggcca60ccggtctacaaggaaattcccgtccccaagcctggccccgatgaagtcctgctgaagatc120aagtactccggcgtctgccacaccgatctgcacgccatgaacggcgactggcctcttcct180gtcaagatgcctctggttggtggccacgagggtgccggtatcgttgtcgccaagggcgaa240ctggctgagggcgtcgagatcggcgaccacgcaggtatcaagtggctgaacggatcgtgc300ctggcgtgcgaatactgcaagacctcggacgaaccactttgcgccaccccccagctctcg360ggttacaccgtcgacggcacattccagcagtatgcgattggcaaggctgcccacgtcact420attctaccaaaggacattcctctggatgggattgcgccaattctttgtgccggacttacc480gtgtacaagggtctgaaggagtctaatgctcgtcctggtcagaccgttgccatcgttggt540gctggtggtggcctcggtgtgatggctcagcaatatgccaaggccatggggctgcgcgtc600atttccattgatggtggtgacgagaagcgtcaggtctgcgagaagcttgactcggaggcc660tacatcgacttcaccaaatccaaggatctcgtctctgacgtgaaggctgccacccctgag720ggtttaggtgcacacgctgtgatcctgctcgccgtctccgagaagcccttccagcaggcg780gttgaatactcccgtccccgcggtacaatcgtcgccattggtatgccagccaacgcattc840ctcaaggcttcagttttcgagactgttgtcaagatgatcactatcaagggtagctacgtg900ggcaaccgccaggatgcttcagaggcggttgatttctatgctcgtggtttgatcaaggca960ccattcaagacggttccccttgaggagcttcccaaggtgttcgagttgatgggtaagtta1020ccgaattcgaatttactgttacacaagttgctaatatgcttttcacagagcaaggcaaga1080ttgccggtcgttatgttctccagatgccagagtaaatgcatcaatcgacgggcggtgcat1140aaccgacaacatcgtatgagcatatcttag1170<210>23<211>993<212>DNA<213>Penicilliumbrasilianum<400>23atgtccctcccaaccaccatgagagctgtgatagtcgaacaaaccggcggcccagaagtc60ctccaattcaaaactgaccacccggtcccgacacccggggaaggccaactcctcgtccac120aacaacatctccggcgtcaactatatcgacacctacttccgcacgggtctctacgcctct180cccaagcccgagattctcggccgggagggcgccggtatcgtcgcagccataggccctaat240acctccggcttcaatgtcggagatcgtgttgcctggctggccacgggtgggtacgcagag300tacactgccgtgccagcggccaagaccgtcaagatccccgagggagtcagtgacgaggac360gtcgtggcctcgttcttgagtggtctgaccgttttgtcctttgcgaaggagacgtatccc420gtgcagaagggcgattgggtacttttgcatgccgcggctggtggagccgggttcttgatg480acgcagattctcaagtcgattggggctaaggttattggtaccgctggtggtgcggagaag540tgtgccctcgtcaagagcttgggggcagacgtggtgattgattatcgcagtgaggagggt600aaggattgggtgaaattggtcaaggaggccaccggagggaggggtgtcgatgttgtttat660gactccgtcggcaaagatacgtgggagggtagcttggaggctgtcaagcgcaagggtacg720attgtctggtttggtaatgccagcggtcccgtgccccctattcctctgcccaaactctcg780cccaagaatgtcaagattgctcgccctactctctttggctacatcgagacccgcgaggag840tttgaatactacaccaacgagctgtttagtctgctccagtctggccagttgaagaccaag900atccacaaggtttaccctctcgaggacatcgctcaggtccacaaggacctggagggtcgc960aagaccatgggtaagtctcttctgaagccttag993<210>24<211>1518<212>DNA<213>Penicilliumbrasilianum<400>24atgactcaaaccaacgtccatgtcaacaagtctgatacttcactggcagctccgcaacag60ttattcatctcgggaaaataccagaacagccagaggaatgggaccttccccgtgaagaac120cccatgacgggcgagaccatatacgagtgcgtctcagcctctctagacgactacgccgcc180gccatcgaggaagcagatgcagcccaaccttcgtgggctcgcctcggcccctcagcccgg240cggttgatccttctcaaggccgccgacatcatggagacgtacatcgagacagacgcgccg300gccatcctttcagccgaggtttcggccactaggggatgggtcagggccaacattctgtcc360acagccggcgtcttccgcgagaccgccgccctggcaacgcatatcaagggagagatcgtt420cccgcggaccggccgggcaccacgatcctggtgagccgcgagcccgtcggcgtggtcctg480gccatcagcccctggaatatgcccgccacactgacggccagggcgatctgctgcccgctg540atctgcgggaatagcgtggtcctgaggccgtctgagttcagccccaagtcgcagcacctc600gtcgtgcgcgctctgaccgaggctggactgccggcggggtgcctgcagttcctgcccacc660agcaccgccgacacgccgcgagcgatcgagtttgcaatccgacacccgaaggtgagccgc720gcaaacttcacgggcagcgaccgcgttggccgcatcatcgccgggctatcggcatcctgt780ctgaagccgtgcgtgctggagctaggcggcaaggcgcccgtcgtggtcctggaggatgcc840gatgtggaggccgccgtggaggcagtggtgtatggcgcgatgtccaacagcgggcagata900tgtatgtccacagagcgggcgatcgtgcatcgctccctggcagcggacttcaaggccctg960ttggtgaaacgggcggagagcctgcgggtagggaaccacctcgaggacccggacgtgcag1020ctctcgggccttttcactgccgcctccgccgagcgtgtactcggcctgatcaagggcgcc1080gtcaacgcaggtgccacgctcctggcgggcgatctggctcttcacggaccgtgccagaca1140atcatggctccccacatcctcacgggcgtcacgcgggatatggacctcttccatcgggag1200acgttcggccccgtgctcttcgtgtccgagttcgacacggacgatgaggccatcgcgcag1260gccaacgacaccgagttctctctgtgtgccagcgtcttctcgcgtgacgtcctgcgcgcc1320atggacacggccaagcggatccggacagggagctgccacgtcaatgggccgaccgtgtac1380atcgaggcgccgctgcccaacgggggtgtcggcggcgggagcggctacggccggttcggt1440ggtgtggcgggcatcgaggagtttacggagaggcagatcgtgagcttagcgaagccgggg1500attaagtatgcgttctag1518<210>25<211>1440<212>DNA<213>Penicilliumbrasilianum<400>25atgtctcagaacgactccaaggcggtgactccgctgcttattaacaatgaatccgtcatg60actgatattaagttcgaggtccacgcccccgctactggcgaattgtcgagttactgtgct120ggtgcctcggttgaggatgcggtgcgcgcggtcgacaatgcaaaggcggccttcccggcc180tggagcaagaccaaggcttatgatcgccgcgatattttgctcaaggccgccgagatcatg240atctcgcgcaaggaggagctgatcgcataccagcaggaggagactggtgcggggcggccc300ttttgcgagcacaccttcaacatgggtgtcaacttcatcaaggactttgcggggcgcatt360tccaccattgagggtgtcgtacccagtgtgaccttggatggtgagggggcgatgatttat420aaggagccttatggtgtgattttgtcaattgccccatggaacgctcccttcatcttgggc480actcgcgcagtcgctctccccctcgctgccggtaacaccgtcgtcctcaagggttccgag540ctctcgcccaagtgcttctgggctctcggtgatatcttccgccaggctggtcttcctgat600gggtgcttcaacgtcattttccaccaaccttccgatgccgcggctgtcacgaccgccctg660attgctcaccctgccgttcgcaaggtcaacttcactggcagcaccaatgtcggttccatt720attgcctcgactgctggcaagtacatcaagcccgttcttttggagctgggtggaaaggct780tccgcgattgtcttggacgatgcagacctcgataaggcggccatgagctgtgcgctcgga840tcattcctgcactctggacaaatttgcatgtccactgagcgcatcgtcgtgcagcgtgct900atcgccgacgaattccgtcagaaggttgccgcaaatgcggagaagctctttggcaaggat960gctccagctttgggccttgtcaacgctgccgcagtcaccaagaataagaaactcgttgcg1020gatgccgtctcgcgcggtgccaacatcctgttcggagatgccagtgccaacgagtccgtc1080aacacctgcatgcgccccatcatcgtcgatggagtcagcaaagagatggacctgtatgcg1140accgagtctttcggcccgaccgtgtccttgatcgtcgtcgataccgaggaggaggccatc1200gcagtggccaatgacaccgaatacggcctgaccggggcggtctacactcaaaacttgttc1260cgcggtcttcgtgtcgccaagcagatcgagtctggtgccattcacattaacgccctgacc1320gttcacgatgagcctaccctgccccacggtggctggaagagcagcggtttcggccgcttt1380ggcggcgttgccggctatgatgagttcctgcagaccaagaccgtcacctggatggagtaa1440<210>26<211>1422<212>DNA<213>Penicilliumbrasilianum<400>26atgaccgtcaccacaactctctccctcatcgctcctccagagcaccgccatgagccatcc60cccttcgacccggctgtcgacatcaaagacgcaccctccatcatcaccgcactcaatgcc120gccgatccgagtctcaaagtgtacactcgatcttctcccaacttcgagaccctccgcggc180gtctacaacaaactaatcacccaccagcctctggcaatctgccgcccccagaccattgaa240caaatccaactcatcgtgcgcactgcccgtgccgcgaacccccccgtacccatcgtcccg300cgctgtgggggccacgatgtctacggacgaggcttgaagcctgatagcctcagcattgac360atgcgcgagctcgacacgcaaactctcgccgaagatcgccagtccgttcgcatcggcggc420ggcgtgacgtcgcagaattttgtcggattcctcgacgaacacggtctctgcactgcgaat480gggaccgcggggaacgtgggatggacgggatgggccgtgtggggcggatacgggcccttc540aatgactacgttggcctgggagtcgacaatatcttgtctgcacgtctggtacttgcggat600ggatcgctggtcgaggcgggtcctgggtcggagctgttgtggggagttcgaggcgccggt660ggcagtctcggggtcatcgttgatgtgaccgtgaaagtatacccgatgcccgttattctg720gcgggtttcattgcgtaccagtggggggagagtgcgaaggtgctctcgggtctgcaggag780ttgctggatcggggaattcccgacacgatgtgtttgcagatgggcttcatgaagactaag840tggggggttggcatgagtttgatctttgcctggcccgattcggagactctcgatgagggt900cgcacttggctggagactgttaggggcctgggcgcgatccaggttgataccgtcggtgaa960accacgtttaaggcgtttcaagggattacctcccgtgtagtggacgagccagtcaatgtc1020tgcactcgcagcgcctcggtccctcggtttacccccgagactatcgcgctacttcaaaag1080tactccgaggccatccccgacggtcgtcaatacaatgtgatcgcgcatattggacacgga1140aaaagtacacgaccgaaccccgacacgtcgtttgccacgcgggaaccccacgtgctgttt1200catatcaacgcgtgcgatgagccagagcgcatggacgaggcccggagctgggtcgacgga1260ctgatgaaggagatgaatgctacccgccaagccatgaagcctgtatacgtgagttttatg1320ggtgaagacgaggaccctcgtgtgagcttcgggtcgcattgggagcggttgcaagctctc1380aagcaatcggtggacccggacaacgttttccgcttcccctag1422<210>27<211>1428<212>DNA<213>Penicilliumbrasilianum<400>27atgccttttctacccttcttcaaggtactcaggctgcgaagggagctggatgggacaaag60gcggaaatcttcacctggggatgtgacgggtatgatgaaagcatcaagcaatggaatgct120taccttacccagggcgcgaccgtccgggtcacatcatccgatgaagccgccacagtcgtt180cgctttgctgcatgccacaaaattcctttcacggttaaaggaggggggtactccaccacc240ggtgcctcgagcgctcatggcgtcaccgctcaaggtggcgccctatgggaagatattgat300gtcgcagccgctcaacataggctagcagtcgtcggaagcacactaaaccacatcggggtg360gccggagcaacattaggaggaggttatggatggctgactggccagtatggcttagcgata420gataacttgctctgggtgaagatgatattagccgatggcagcgttatcatcgtatcagaa480gagcaatatccagacctattttgggccattcgaggagctggtcagagcttcggggtggcc540attgagttagccttccgggctcacagacaggaccaccctgtatttgccgggacccttctc600ttctcggcgagcaagttatccgctattgtggagtttgccaacaacttcgagactctcaca660aacggtaatcaggggttctggtttgggtttaccatgccgccctcaatggaccggtgcgcc720attctcgtggtggtcttctacaatgggccccagatagccgcgcggcagttcttttctcca780ttgctctcgataggaccggtggtgaatgagacaggaatgctgccgtatgatagtctcaat840ggtatactgaatatgatggatacagtgtcccgacgcagaatccttagaggtgccgatatc900accctccctaccgatgaaaacgtgggtactcgaaaaagtcttcgaggatcaaacattact960ctccccctggatatcaattttacggcatccatatacagtgaatttgatggcatcttgagg1020gagttcacacaggccagggacagcatattacttttcgagctcctgccatatacacagatc1080accaaagttcccaacgatgctaccgcatttgctagccgtggtccttatcataatgtcatt1140tctctatttggatggcaggataaagatctggacgagagaatgcactcactgcaagaggat1200attatgaatcagatcggaaaacgcgcaggtatcgcatgcaccccattttataacgtttca1260aagcacgggacaggattatatgcgaactatgctggacacaacgtgcctttagaggcaata1320tttggagacaatcttcgacgtctccaagagttgaagaagaagtttgatcccaacaacgta1380tttaaaaagtggcacaaccttaacacgactatcggtaccccggcatag1428<210>28<211>1206<212>DNA<213>Penicilliumbrasilianum<400>28atgatgacgccgcctatacttgcttttcatcttttcaaagacttcgaactacaacgaaca60aagaattactttcgagtattgaacataaactacaaagctgatcatcacccacaccagctt120tttcatgatgaattcactatcaacactatcgacgactgcacccttgcgaattgctgcaag180gccacagacttatctcttcctggccgttcgcacctactccggggtcgcagccacaacgat240cagctcttcatgtctcgccagacaacgctcttcacaatgtacctacacatcgaaacgtct300gatctcctcaacgcctcatcctcagatcaaagaatacttccctcctcctgcaaaccccgc360agtgaaagaggtgactacggcatggtcgcatccgattaccacagctataccgaggcgcag420atgaataacgtgaaaatcgcgcatcgcgaggccaccaactggtccgattgggttgcactg480ggcacagttcgcttcttccgatggggtatggacttggcgacgggatacaaacacccacag540ccgggccaggaagcatcggagaagtttaagatgacagagcacaagtggttgacccgtttc600atcttcctggagagtgtcgcgggtgtacctgggatggttggtggtatgctgagacatctg660cggagtttacgacgcatgaagcgtgataatggatggatcgagactctcctggaagaagca720ttcaacgagcgaatgcatctcctcaccttcctcaaactggccgagcctggctggttcatg780cgcttgatggtgctcggcgcccagggtgtcttctttaatggcttcttcctgtcgtatctc840atctctccacgaatctgccaccgcttcgtgggttacctggaagaagaggcggtgttgaca900tacacacgggccattcaggaactcgaagacggccatttacccgagtggaaggagctccag960gcacccgagattgcagtgcattactggcagatgcccgagaatcagcgcacgatgcgagac1020ttgttgctctatatccgtgccgacgaggccaagcaccgcgaggttaatcatacgctgtca1080aatctggaccaggcggctgaccccaatccctatcagacggagtatcaggatccgagaaag1140gaccatcccactcggggcattgataacctgaaggcgacgggatgggagcgaaaagacatc1200ttttag1206<210>29<211>1284<212>DNA<213>Penicilliumbrasilianum<400>29atgcctcacgcatccagatcattgaacgttctcatcgtcggtgctggcttgggcggcctc60gcggcgggattagctttgcagacggacggccacaaggtcacaatcattgatgccgctcct120gagttcgcagaggccggagcggggatcaggatcccacccaactcgagccggctgctcatg180cgatggggcgttgatctggagaggatgaagaagtcgacttcacagagatatcacttcatc240cgctggaaggatggcagcaccatcttcgacttgcccttcaacaatatcgtcgagacacac300ggggcgccttactggcttgtccatagagccgacttgcacgccgctctgctcgatgcgacc360ctgaaggccggtgtcaaggttctaaacaacaagcttgtcacgtcctacgacttcgaggca420ccgagcgccaccacacaggatggcgagaccttcaaggccgatcttatcgtcggtgcggac480ggcataaagtccatctgccgaccccttcttaccggtcagccggacgtcccgcgggacacg540ggcgacgtcgcctatcggattctcatccctggtgagaaactgctggccgacccggacctg600gcccatctgatccgcgacccttgcacgacatcgtggtgtggcccggacgcgcacctggtc660ggctacccgatccgcaacggcgagatgtacaacatcgtcatgtgtgccacctcctacaac720gagaccacggacgaggtctgggtcgtcaagggcgacaacagcgagctgtgcaagcgcttc780gccagctgggaaccccaggtgcggaagctctgcgccctcacgggcgacttcatgaagtgg840cgcctgtgcgacctgcccaacctcgcccgctggacgcacccctcgggcaaggccgtgctg900ctgggcgacagctgccaccccatgctgccttacctggcccagggcgctgcccaggccgtc960gaggatgccgccgtcctgcgccaggtgctcgcccaggacatggacatggccgcggcccta1020aagcagtatgagcagatccgcatgccgcgggcgagcctggtgcaggccaagactcgcgag1080caccagtacatcctccacgtcgacgacggtcacgagcagcaagaccgggacaagaagttg1140gctctcgatgcggcggagaacccggtcttctggggctacgacgaccggagaaaatggctc1200tttagccatgatgcagaggtgatccaaaaagaaggtgcgaactggagagacgggcccaac1260atgaatggcgtgcatgttgcttag1284<210>30<211>1383<212>DNA<213>Penicilliumbrasilianum<400>30atgtctccgtccgtgactcctgagcgttatccaatcgcgatcgttgggggcggcatcgcc60gggctgacactggcgttagcactggaaaagctgggtgttcgctatgttctctttgagtcc120caaagctccctggctcctgataggggtgcaagcgttggtttacagccaaatggcttgcgt180attcttgatcagctcggtctgatcgacaagattgagcaacataccgggacgttgcagcgc240tggcgccatctagatggccaaggcgagctcatctcagaaaccaaagctctaggctattac300caatcattaattggttatggtcctctgttcctggaacgtcgcaagctcctcgagataatg360gcagatgagctccaagacaaaacggccgccaagacaagcctgcgtgttgtgtcggccaac420gaaagttcagacggtgttgagctagcactaagtgatggccattcaatcacagccgatctc480gtaattggggcagatggtgtgcgtagctgcatccgtgaagctattgatatgagcaggaca540gagtggcattctgaagcgaatgagtatataaacacccagtttgcttgcatctatggtatc600tcgggtgccatccaaggcattgttgaaggtgactgtttttcggtataccgccccgaggca660acggtcctgatctttaccggccgcaacggcactatattttggtttgtttttgaagatttg720ggtcagacatatggcctatcaacaacaccaagatatacaaatgacgacttcgacgcgctt780tgtgactcaatcgcccatctccgcctcactgcttcagtccgttttggtgatgtgtatgga840aatagatcagtggcaatgaaagtccccttggaggaaggcttggcgccctcatggcatacg900gaccgcatggtgattgttggggacgctgcccacaagatggttccaaatgccgcgatggga960gcaaatcaggcaattgagtcatccgcaactctgctgaacgagctcggaaatatatttact1020gcgaaagatggtggctctccacagccggaaatacttgcgaatgccttgaagagatacgca1080gatattcgcaagttccgagccagtgagattgttaaaagagcaggaacaatttgcagagct1140cagctttcgcacagtggtcctgctgcagctgtacgagaagaacttccgtctttgaccgat1200ggtgattggctcttccgcggtttcatgggcttatcagaatcgcctgtcattgatgccctg1260cctgtgccaccaaggggaaagttcttcggccaagccgtggagaaattctggaaacgtttc1320cgagcccgacaagcttcgggcttcaagacttccaacttggagttgttcggaattgaagca1380tag1383<210>31<211>1044<212>DNA<213>Penicilliumbrasilianum<400>31atgtcttctcatacactttctcttctcgaggccaagccttactacagcactgaacttggc60tcactccgagcagtgactgccgagcagcttccaattctcaaaaacctttctatcaaaaga120gtggttcttgcgccgtctgcaattcgggagccccactggcattcaaatgcaaacgagcta180gcatactgcttgcgtggaaaattgatggtcagcattcttgactcgggtaatgtattcgca240aattttgtcattgaagcgggtcaaatgttccacatcgaatccggctcgttgcatcacttc300gagaacatttgcgatgaagaggcggagatcattatctgtttccgtcatgaaaagcccacg360gacttcgccctatctgcctcgatgggagctatgacagatggtgtcctgggcaatacgtac420ggccaccattcttctgactgggcaaaaatcaaccgacacacccacccgaagtacattgtt480cgccgcaatggcaggcccacaattccatccacggcttatctgccggatccacataagttt540gacgttgaggagatgaatccgcccgtttcatcggaatttggatccaacagaactgcgcgc600aatcagttctggccagctcttcacaatatgtcgatgtactcacttcgaatcgaggatact660ggtatgagagaggcacactggcatccagaaacgtcggagctcggttatgttgctgagggc720gaagcccgtatgaccgtcctggatccagatggatccactgatacgtattacctgaagcaa780ggcgatatgtattacgttccaacagcgtaccctcaccagattgaggtgattggatctgag840agaatgcatttcttgattttctttgatcagccctaccccaaggatgttggataccggacc900tctgctacagcgctaccccgcgagacgttagcgtctacattggaagtagcggagaaggat960ctccctaaatttcctctcactgttaaggatcccctatttgtcgagaagaaaaatcctgtg1020gataatttgcgaccgaagttgtga1044<210>32<211>942<212>DNA<213>Penicilliumbrasilianum<400>32atggctggtattcgtgtagcatggatcggcctcggcaacatcggccggggcatgagcagc60aatatcgctcagaagggaccccaatccagcctcatcctcttcaaccgcaccacctcacgc120gccaccgcacacgccgagaaactgggcggcaacgtcaccgtcgcaatctccctcatcgaa180gccgtcaaagcctccgatctcattttcacctgcgtcggcgatgaccccgccatcgactcc240atcaccgagaccatcctctccgacaaggaactcgacctctcaacaaagaccttcgtcgac300tgctccaccgttcacccggacacctcgcgccgcacggaagccgcctacgaagcccgcggc360gcctccttcgtcgcatgccccgtcttcggtgcccccaacatggccgacgcaggtcaaatg420atcgtcgtgcccgccggcaaacaatccgctatcaccaaggtcaagcccttctttgaaggt480gtcgtggccaaggccacgattgatctctccgccggtacgggcgcggacatcgacgtcggc540cgcgcgtccaccctcaaagtcctcggcaacacgttcatcctcaacaccgtcggcgtgctg600gccgaggctctcaccgccgcggacgcaacgggcctgggaacggctccgttccggcagtgg660ctggagctgttcaacccggggccgtttgccaagtatgcggatcggatgattagtggagat720tactatcagcgagaggagccgttgtttgcggttgatcttgcgcggaaggatttgagacat780gcgtctaatattgccaaggagggtggtcagcggatgcgcaatgtagaggttaccgatcac840tttttgcaggaggtcaaggccgagaagggggagaagggtgatattgccgctgtgtatggt900gcggcacggaaggatgctggcttgaagtttgagaatcagtga942<210>33<211>873<212>DNA<213>Penicilliumbrasilianum<400>33atgtcgtctacaagcgagtccttcactctcccaaatgggcgacagatggcttataccctc60tcgcccggtggttcctccgatcgcgtggtccttctctccaactccttggccgaagatctg120acctcctgggagcgcgtcgtacctgtggtggaaaaccaaggcttccgcgtcctccgctac180gaccagccaggccatggacgctcgggtgcacctactgaagccgaattgacctccatgaca240ttcgagaccttggtcgatgacgtctaccgccttctcggacacctcaaaatcaacaatttg300catgcctgggtcggcgtctcgatgggcggcatcaaggccgtgtacttcaccgcgcgccac360ccaggcatcgtgaacaagatcgtcgtggccgacgccatcgccgcttccccgtccgtggtc420tgcatccccgataacttcgccgcgcgggtaagcgctgtgaagcagtcgggttccatctcg480gacgacctgtcaaatactcggaagcggtggttcggtgaagactggatggcgaagcatccg540gaggagacggcgaggatggagaagtccatggcgacaactacaattcagggtctcgaggcg600tgctgtgctgcccttagcagcccgtcttttgacctgaggccgctatatacgaaggtggga660catggctgcgaagaagcactcattgtcgccggggagaaggatgcggaccttccagtcaag720atgcaggagatgcggcaggcaatcgaggagagcctccggagctgtggaaagaaggtgccc780gtgaggatggagattatcaagggtgccgggcatgttccctacattgatggtttcgaggac840ttctgcgaaatcatcaccaaattccttgcctag873<210>34<211>738<212>DNA<213>Penicilliumbrasilianum<400>34atgtctctgtctggcaaagtcgtcctcatcaccggctcctccaagggaatcggcaaagct60gctgcccttcgtgtcgccagcgaaggtgccaacgtcgtgatcaactatcttcgtgacccg120gttgcagccaacaatctcgtcgaccaaatcggtgccgaccgcgcccttgctgttcaagct180gatgcttcaaagctggccgacctcgatcgcctcgtcaatgccgctgtcgcccagttcggc240aagatagatgttcttattccaaatgccggaatcctcccgcttagagacttggagcatact300agcgaagaggactttgacagaacctacaatctaatggtaaagggaccatacttcctggcc360cagaaagccgtgaagcatatgccccctggaggacgaatcatctttgtctctacctcaacc420gcccgattcgcaagcgtggctcccgcatacctactctacacctcctccaaaggcgcgatc480gagcagatgacccgaatcatggccaaggatttggcgcgaaagggaatcttggtgaatgcg540gtcgctcccggtccaacttcaaccgaactcttcctcgagggaaagccggagcaaatgatc600aaggctatctctgggtttagtccattcaatcggatcggagagcccgaggaaattgccgca660gtcatggcgttcttgtctgggaaggacagcagttggatctcaggacaggttgtggctgtg720aacggagctatggcatga738<210>35<211>1746<212>DNA<213>Penicilliumbrasilianum<400>35atggcatctctcattcgagaggccccctttgggcaaatagttcgatatctcaccaacaac60aaatatttccaatatcccgaagaaaagccggacttcaaacttcccgatacatggcttcaa120ttattgaacgaatcggatgccgcgacgatagccgatcccgagaaaacggagccggagcca180gagggtcagggctacgatgcaaccagcgaggcgattagtcgcgcatcaacccaaaactcc240ttgcccttcacagaagctcgactggaagcggatgagcagcatgagatcgaaaagatcaag300tccattcctattcagcctaaaaagaccaaggatggtgcgattttggtcgactggtactat360accgatgatgcagagaacccacacaattggtcgaatcgaaagcgagcacttctgacgacg420ctcatttgtctttatacctttgtggtatacacgacctctgcaatttacacatcctccgtg480cccgggatcatgaaggagttcggcgtcagtgacttggttgctacactgggactgtccttg540tatgtccttggctatggaacgggtcccctgatcttctcgcctctgagtgagatccccgtg600attggtcggaacccggtctatatcgtgaccatgttcctctttgtgattctctccattccc660actgcttttgtgggtaactttgcaggactcatggtgcttcgtttcctgcaaggattcttc720ggctcgccctgtctcgcttctggaggtgcttcaattggcgacatgtacagtctcatgtct780ctcccttatgccatgatgagctgggtgtctgccgcttactgtggtcccgccctgggtcct840ctcatcagtggcttcgcagttcccgccgagacctggcgctggtccctgtttgaatccatt900tggatgtcagctccagtcctcattctgatgttcttcttcctccccgagactagcagtgca960actatcctgctccgtcgtgccgctcgtctccgcaagatccataacaacgcacgcttcatg1020gctcagtccgagattgaccagcgtaacatgaaggtctcggccgttgctgtcgacgccctg1080attaagcctttggagattaccatcaaggatcccgcggtgctcttcgtccaggtctacacc1140gccattatctacggcatctactactccttcttcgaggtcttccccctggtctaccccgtc1200gattatggcatgaatcttggccaagttggcctggtcttcctgtgtatcctggtgtcctgc1260atcatcggtatcgccatctactggtcttacctttacttctggatgaaccctcgcattgaa1320cgcttcggattcccagctcaagagtcccgtcttatccccgccctgccagcttctattgga1380cccaccattggcttgttcctctttgcctggacagcccgtgcctcaatccactggattgcc1440ccgacaatcggaatcaccatctacggtgcgacggtcttcatcgtgatgcagtgcttgttt1500gtctacatccccttgagctatccaatgtacgccgctagtctgttcgctgcgaacgacttc1560ttccgcagtgctctggcttgcggtagtgtcctgtttgctcacccgttgtttggcaacctc1620ggtgtcgctcggggtaccagtctactcggtggtctgagtgtgattggtattatcggaata1680tggctgctttactactatggtgcccggcttcgctctttgagcaagtttgccatctccgat1740gattga1746<210>36<211>1542<212>DNA<213>Penicilliumbrasilianum<400>36atgagcacgaccaaggaagctttcccacatacggatagcgacataatggaggactcggag60aagaatctcccagagtgcgagcatatcgtctccgtggagcccaccctcaagatgcgcgac120ggcatcgtcctgatgccgcaaccgtccgacgaccccaacgacccgctcaactggtcctgg180ttccgcaagcacgccgccatgttcaccctctcgtatttggccctcgtctgttacgtggct240gtgaccacgctggttacgggaacagtgcccctagccaagtccatgcatgtctccaagtcg300acggccgtctatctgggcaacacgcccgtcgctctctacgccgtggcgccctggttctgg360agcccgctgagccactttataggccgtcgcccggtgctgctgatgtgtaatatcatcgcc420gtcgtcggggcggtcgttgttacgacgtccaagacatatgcgtcttgcatggttggccgc480gtcatcctcggtgccggtggttcggccttctggacactggggccagccagtattggggac540attttcttccgccacgagaagggcaagaagattggtgtgtcgaccttggccattgtgatc600gccccattcttggggacaatcatcggcggacccatcatagaaaacgagaagctgggctgg660ccggcctcccagtggatccccctgattttcatggccgccggcttcatcatgcagatcttc720ttcctcccggagaccatctacatccgagagacacgcgcgcatcctgcaatcatgtccaca780tctacgccgggcaagcccacgttctgggaccgctatgggatccacatccccaagcgctcg840gaggagaagcagcacagctttctcttcatcgcgacgcgccctttcgtcctcttcaagttc900cccgcggtgatactgtcggccttctggttcggcatcgcctacatgatgcacgtgggcatc960acgtccgagatcccgctcatcttcgaggagcactacgatttctccgtgctcgagatcggg1020ctgtcgggcttctcgggactcatcggcgccctgctcggcgaggtatacgcgggaccctcg1080ctggatttcatcgctaagcggaccatgaagcagggtcgcgagtggcgccccgagtaccgc1140ctgcaggcgatctggccggcgcttattaccgtgccggctggtctgatcatgttcggcaca1200tcgatccagttcggaaatgtttggatcactcctctgatcgggcaggccgtttatatcttc1260ggcatcgagattgccaccacggttattcaaacctacattttagaatgttaccctcgccag1320ggcgccgaggcgaacttggtcttcaacctcatccgcaacctgttctcctatataagtccg1380ttctttgtgcagccaatgatcgccaccctcggtaccacctctccgtttggtctctctgct1440gccttgactgccttcttcttccctttcactgtgggtgtcttgatgtggcggggcaaacag1500atccgggataaaggaggcgacccgggctggagcagggattaa1542<210>37<211>4308<212>DNA<213>Penicilliumbrasilianum<400>37atggaggaccacgaaaaagaatacgatagtacctcacctcccggaacggccacggaagaa60gggaatggaggttacttcaataccctcaccgttcctgaaatcaacctccgagaagccagc120agtgccgaaaccttaactcctcacgcctccgtcgtccaacctcccaaaaaggccgcagaa180tggcatatgacaccacaagtcattcgcaatgccgaacgtgatgaagcagctggttttaaa240aggcgtgagctgggtgtcacttggcaagacctgtcggtcgaggttctcgctgctgaagcg300gctgtcaaagagaacatgatctcccaattcaacgttcctcaactcatcaaggatttccgc360cgcaaaccaccactcaagtcgatcttgtccaacagccatggatgtgttaagcctggagaa420atgcttctcgttcttggaagacccggatccggatgcactacccttctcaaaatgcttgcc480aaccgtcgtgagggatatcagaacatcaccggagatgtaagattcggaaatatgactccg540gaagaagcatcaagatatcaaggccagattgtgatgaataccgaggaggagcttttctac600cctcgtttgacggtgggtcagacaatggattttgctaccaagcttaaggtcccatatcac660cttcctggagaagggaagagcgttgctgagtataccgccgaaacgaagcaattcctcctc720gagtctatgggaatcgcccatactgccgatacaaaagttggcaatgaattcgtccgaggt780gtcagtggtggagaaagaaagcgagtgtctattattgagtgccttgccacaagaggctct840gtttttacttgggataactcaacgagaggactcgatgcttccacggccttagagtgggcc900aaagcccttcgcgccatgaccgacgtccaaggtctttcgactattgtaacgctctatcaa960gctggaaatggaatttataatcttttcgacaaagttctcgtcctcgacgaaggaaagcag1020atctattacggccctgccgcggaagcgaaacctttcatggagaaccttggctttgtttac1080actgatggtgccaacattggtgatttcctcacggggttgactgttccgaccgagcgaaag1140atcagacctggttgggaaaatcggttccccaggacggccgacgccattttgaccgagtac1200cagaactcggcgacatataagaatgaagtctcactatacggatatcccgacactgacctt1260gctgccgaacgcactgaggccttcaaggaatctgtggcctgggaaaagtctaaacactta1320cccaagggtagtgacctgactactagtttctgggcccagctcatgtcatgcacggctaga1380cagtaccagatcctctggggcgagaagagcacgttcctgatcaaacagattctgtcttgt1440gtcatggccttgattgccgggtcttgcttctacaactctccagatacctctgcaggtctc1500ttcaccaagggtggtgccgttttcttctcgttgctttacaactgcattgtggccatgtcc1560gaggtcaccgaatctttcaaaggtcgtcctattttgacgaaacacaaatcttttgccatg1620tatcacccggctgctttctgtctggcccaaattactgcggatttcccggtgttactgttc1680caatgcacgatcttctcggtcgttatctattggatggttggattgaagcataccgcggct1740gcatttttcactttctgggcaatccttttcactacgaccttgtgcatcacagcgttattc1800agatttatcggcgctgctttcagtagcttcgaagctgcatccaagatcagtggcaccgct1860gttaaggcaatcgtcatgtatgcaggttacatgattccaaagccagagatcaagaactgg1920ttcctcgagttctactacaccaatccgtttgcttatgcattccaagctgctttgaccaac1980gaattccacgaccagcatatcgactgcgttggcggtaatcttattcccagtggtcctgga2040tacgaggatgttggatccggctataaagcatgtgctggagttggtggtgctcttcctggt2100gcagattatgtgactggagatcagtatctttcttctctacactacaagcattctcaattg2160tggcgaaacttcggcgttgtctgggcctggtggggcttcttcgctgttctcacggtcgtc2220ttcacttgcttctggaaatctggtgctgcatctggatcttcgcttctcattccccgcgag2280aaccttaagaaacaccaagttggcaatgatgaggaagcccaaaacaatgagaaacatgcc2340gctcggacgaccaccgatgagccagttcaagtcgaggatgacaatcttgtgcgcaacaca2400tctatcttcacatggaagaatctcacctatacagtcaaaacaccaactggcgaccgagtc2460ctcctggacaacatcaatggatgggtgaaacctggtatgcttggtgcactcatgggatct2520tccggagccggcaaaacaactctacttgatgttcttgcacagcgcaagacggaaggtacc2580atcaaaggctccattttggttgacggtcgcgaattacctgtctctttccaaagaatggcc2640ggctactgtgagcaattggatgttcatgagtcttacgccactgtgagagaagccctggag2700ttttctgctctcctgcgacagtctcgagatactcctaaagctgagaaacttaaatacgtc2760gacacaattattgacctcttggagctgcatgatctcgccgacactctgatcggttccgtg2820ggtaatggcttgtctgttgaacagcgcaaacgtgtgacaatcggtgtggagctcgtgtcg2880aagcctagtattctcatcttcttggatgagcccacttcaggtcttgatggtcaatctgcg2940tataacactgtcagatttcttcggaaactagccgatgtgggccaagcagttcttgtcacg3000attcaccagccttcagctcagctattcgctcaattcgatacccttctactccttgcgaga3060ggtggcaaaacggtctactttggtgacatcggggacaatggatccacgattaagcagtac3120tttggcaattacggggctatctgccctcaagaggcaaatccagcagagttcatgattgac3180gtcgttaccggtggtatccaagaagtgaaggacaaggattggcatcagatctggcttgac3240tctcccgagcagcatcagatgatcaccgaattggacagaatgattgcagatgccgctagt3300aagccaccgggaactgtcaatgatggctatgagttttcaatgcctctctgggaacagatc3360aagattgtcactcagcgcatgaacgtctcgcttttccgtaatacggcctatgtcaacaac3420aagttctcgcttcacatcatctcagcattgttgaacggattctctttctggcgacctggt3480cctagtgtgagtgcgttgcagctgaagatgttcaccatcttcaattttgttttcgtcgct3540ccaggtgtcatcaatcaactccaacccctcttcatccagcgccgcgatatctacgatgct3600cgcgaaaagaagtccaagatgtattcctgggtagctttcgtcactgggcttatcgtttcg3660gagttcccatatctctgcatctgcgcagttctatactttgtttgctggtactggcccgtc3720tggagattgcctcatgactctgaccgttctggagccatcttcttcatgatgttgatctac3780gagttcatctacactggtattggccagttcattgctgcgtatgcaccgaacccaaccttt3840gcggcacttgtcaacccacttatcatcagtgttcttgttctcttctgcggtgtgtttgtg3900ccatatgaccagctgaacgtattctggaagtactggatgtattacctcaacccattcaac3960tatgtcgtcaacggcatgttgactttcggtctctggggccagaaagtcacctgcaatgag4020agcgagtatgcagtctttgatccgctcaatggtacttgcggcgagtatctggcgacttac4080atgagtggcaagggcagcggagtcaatctgctcaacccggacgctacctcgagctgcaag4140gtctgtgagtacacaactggaagtgacttcctacagacgctcaacatcaaccattactat4200tatggatggagagatgcgggcatcactgttatctatgctatctcgggctatgcacttgtg4260tttggtctgatgaagctccggaccaaggcgtccaagaaggcagagtaa4308<210>38<211>2619<212>DNA<213>Penicilliumbrasilianum<400>38atgtgccaggaccacgacctggaatgttcttatacacttccgcgaaagaccaggttctac60ggcagcgtggatgatctgagtgatcgatataaatgcttagaggccatagtacgtgctgca120tttcccaatgacggcatctccaccgtcccggagctcatccggctgggagagcgcatggga180tatgccatgccggacctatctcagaaatcaggggagtcacctaggatagaggagctggtg240agagacttccccaccgaagctggagaccagggccttgctgggtccacacagtgtacctct300tcgccaccaagaacgggtgccgtgaatgtccctactgagagtgaaagaaggcactcttcc360agccaagtccaggaaaacaactcctgtccagatgaacctgtcggactaattagagacacc420actgggcgagaacatttcatcggcccgtctggaagcctgcagtttctgggccagctccgg480aggctacttcttatatcccgcagcggggatgccgtggagtcccgggcacccgctcgcctt540acggccacgttcaccgatgaagatgcagcgcaagccctggaagcagacggtgaccagagt600gagctcgccgctttgccttctggaggcactggcaacggtggcgatgaaggccaggagatt660gacgagcgctcccctgcctccttgggttctgctcttgtcagggatttttccagcattccc720gtcaatgacatcgacgagatgagaaggcagcttccgcctcgccacgttctcgattctctg780atgcgagtatatttcaagaatgtccatccggactttgccctattccaccgcggtaccttc840gaggaagaatacgagaccttcatgtccaaagggcggtactatcatcagcacgctcgagct900ggtgtacatttatcctctcccacgttacctgaaccaggctggttaggctgtttgcacatg960atgattgcctttgcctcgctaaatggctctgtcgatgtcgctcccgacctggatcttact1020tccctctgtcgccattgtgccagtcttacccgccagctcctgcctcaatttatctcaaag1080tgcaccctctccaacgtccgggccctcctacttctatcccttttccttcataaccacaat1140gaacgtaacgcggcttggaacctggttgggactgccatgcgcctttccttcgccatgggg1200ctgcaccgggccagcgacaacgggtcgcacttccggcctatagaaagggaggtgcgcaag1260cgcgtcttctgcacgctctacggctttgagcaattcctcgcgtccagcctggggagacca1320agcgggttctacgacttcgaggatgtggagatagttcctccgcgtgagggagtgctggac1380agtgggcaggacgaggacgacgaggtcatgaaactttcgctgaggctgcaagttatcctg1440gccaaggccagggtctcccttgccgtcaagacactggccgtggccaatgagaggggcaac1500atcgacggtctggctcggcaacagcagtcttcaagggagacgctggagatcttgaaggcg1560tggagggaggatcttgcctcccaccacatcttaaacatcccgttgatcagtgagacagat1620gatccgctttgccagtacgccgaggagataccgcgaatgtcactccaagatctcaaggcc1680atgatgggttggcaaagccgacctcgacttcgggctgccctggtcctgcacctccaatac1740aggtacattgctgtcttggtgacgcggtcttctttgctgcgatacgtcgcgtccgcgcaa1800cgtggtgaaccagagcacgaagccctgctcagccggaacgaggctagaaccgacccgtat1860aacagcgaggcaggagaacggctatcggacatctgcgtcacgcacgccacgcagctatgc1920cggctcatcttgcttgcagactcctttggcttggtgaatggcatatcggccatggacgtc1980ttctacgtctactgcggcgtcatggtgctcatattgcggtcgctacggatttctagctct2040gcaagccactaccatgaccagcgcgaggcgcatctgcagctggagttgcgcaagctgatc2100gcacaaacgagagaagtgctcatacgtgtgaacaaatgcagcacaatgaagcgattcgcg2160cgcgtggtggctaccttcgaggatggatcaaggcaggataacatcaggcctgccgatggt2220tctaccaatcggtcaacggccaactgtgagatgcgaacggctcggcaggcatctcgtgac2280cctcggggccggttcaaccattctatccacgccgccttagatggcgggcgagcgagcaac2340ctggcaatctttccgggtgcaggaggatcgctggacacgtcctcctccctgccagtctcg2400cagcaagagccgcttaacttccagcacggatatggtaatggaattgggccgaggctcggt2460atatcagatcctttctggcaaccaaacttattgacgtcctttgacggggagccagaggca2520aacggttggatgatggacccattcctcgcgatggacgggaccggcgttgtggactggggc2580gatattgagtccctcttgtcacggaatcctggtcaatag2619<210>39<211>22<212>DNA<213>Artificial<220><223>primersLS266<400>39gcattcccaaacaactcgactc22<210>40<211>20<212>DNA<213>Artificial<220><223>primerV9G<400>40ttacgtccctgccctttgta20<210>41<211>24<212>DNA<213>Artificial<220><223>primerBt2a<400>41ggtaaccaaatcggtgctgctttc24<210>42<211>24<212>DNA<213>Artificial<220><223>primerBt2b<400>42accctcagtgtagtgacccttggc24<210>43<211>6752<212>DNA<213>Artificial<220><223>ExpressionconstructforexpressionoftheC.basilensishmfHandHMF/FFAaldehydedehydrogenasegenesintheyeast<400>43cggaattcactgggatgtcgaaagctacatataaggaacgtgctgctactcatcctagtc60ctgttgctgccaagctatttaatatcatgcacgaaaagcaaacaaacttgtgtgcttcat120tggatgttcgtaccaccaaggaattactggagttagttgaagcaataacttcgtataatg180tatgctatacgaagttattaggtctagagatctgtttagcttgcctcgtccccgccgggt240cacccggccagcgacatggaggcccagaataccctccttgacagtcttgacgtgcgcagc300tcaggggcatgatgtgactgtcgcccgtacatttagcccatacatccccatgtataatca360tttgcatccatacattttgatggccgcacggcgcgaagcaaaaattacggctcctcgctg420cagacctgcgagcagggaaacgctcccctcacagacgcgttgaattgtccccacgccgcg480cccctgtagagaaatataaaaggttaggatttgccactgaggttcttctttcatatactt540ccttttaaaatcttgctaggatacagttctcacatcacatccgaacataaacaaccatgg600gtaaggaaaagactcacgtttcgaggccgcgattaaattccaacatggatgctgatttat660atgggtataaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgt720atgggaagcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatg780atgttacagatgagatggtcagactaaactggctgacggaatttatgcctcttccgacca840tcaagcattttatccgtactcctgatgatgcatggttactcaccactgcgatccccggca900aaacagcattccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgc960tggcagtgttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcg1020atcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcga1080gtgattttgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcata1140agcttttgccattctcaccggattcagtcgtcactcatggtgatttctcacttgataacc1200ttatttttgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcag1260accgataccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattac1320agaaacggctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttc1380atttgatgctcgatgagtttttctaatcagtactgacaataaaaagattcttgttttcaa1440gaacttgtcatttgtatagtttttttatattgtagttgttctattttaatcaaatgttag1500cgtgatttatattttttttcgcctcgacatcatctgcccagatgcgaagttaagtgcgca1560gaaagtaatatcatgcgtcaatcgtatgtgaatgctggtcgctatactgctgtcgattcg1620atactaacgccgccatccagtgtcgaaaacgagctgtcgagaacccttaatataacttcg1680tataatgtatgctatacgaagttatggccggcctacgtagaaggcgcgcccatatgcaca1740caccatagcttcaaaatgtttctactccttttttactcttccagattttctcggactccg1800cgcatcgccgtaccacttcaaaacacccaagcacagcatactaaatttcccctctttctt1860cctctagggtgtcgttaattacccgtactaaaggtttggaaaagaaaaaagagaccgcct1920cgtttctttttcttcgtcgaaaaaggcaataaaaatttttatcacgtttctttttcttga1980aaatttttttttttgatttttttctctttcgatgacctcccattgatatttaagttaata2040aacggtcttcaatttctcaagtttcagtttcatttttcttgttctattacaacttttttt2100acttcttgctcattagaaagaaagcatagcaatctaatctaagttttaattacaaaatgg2160atacccctagagaaagattcgattatgtcattgtcggtggtggttcagcaggttgtgttt2220tagcaaatagattgtcccaagatccagcaataagagtcgccttaatcgaagctggtgtag2280ataccccacctgacgccgttcctgctgaaatcttagattcttatccaatgcctttgtttt2340tcggtgacagatacatttggccatccttacaagcaagagccgttgctggtggtagatcta2400aggtatacgaacaaggtagagttatgggtggtggttcttctattaatgttcaagctgcaa2460acagaggtttgcctagagattacgacgaatgggccgctagtggtgcttctggttggtcat2520ggcaagatgtcttgccttacttcagacatttggaaagagatgtagactacggtaattccc2580cattacatggtagtcacggtccagttcctattagaagaatattgcctcaagcatggccac2640ctttttgtacagaatttgcacacgccatgggtagatccggtttgagtgctttagcagatc2700aaaatgctgaatttggtgacggttggtttccagcagccttctccaacttagatgacaaaa2760gagttagtacagccatagcttatttggatgcagacaccagaagaagagccaacttgagaa2820tctacgctgaaactacagttagaaagttggttgtctctggtagagaagctagaggtgtca2880ttgcaatgagagccgatggttcaagattggctttagacgcaggtgaagtcatagtatctg2940caggtgccttgcaatcaccagccattttaatgagagctggtataggtgacgctggtgcat3000tgcaagcattaggtattgaagtagttgccgatagacctggtgttggtagaaatttgcaag3060accatccagctttaactttttgtcaattcttggcaccacaatatagaatgcctttgtcta3120gaagaagagcatcaatgacagctgcaagattttccagtggtgttcctggtggtgaagctt3180ctgatatgtacttgtcttcatccactagagcaggttggcacgccttaggtaatagattgg3240gtttatttttcttgtggtgcaacagacctttctccagaggtcaagttagtttggccggtg3300ctcaaccagatgtcccacctatggtagaattaaatttgttggatgacgaaagagatttga3360gaagaatggttgctggtgtcagaaaattagtacaaatagttggtgcatccgccttgcatc3420aacatccaggtgactttttccctgccacattttctccaagagttaaggctttatctagag3480tttcaagaggtaatgttttgttaaccgaattgttaggtgcagtcttggatgtatccggtc3540cattgagaagaagtttaattgctagattcgtcactggtggtgccaacttagcttctttgt3600taacagatgaatcagctttggaaggttttgttagacaatctgttttcggtgtctggcatg3660catcaggtacctgcagaatgggtgctcacgcagatagatctgctgtaactgacgccgctg3720gtagagtacatgatgttggtagattaagagttatcgacgcatcattgatgccaagattac3780ctaccgctaatactaacatcccaacaattatgttggctgaaaagattgcagatacaatgc3840aagccgaaagaagagcagttagaccagcaagttcagaagtcgcacacccatcatagtaag3900gtaccatcatgtaattagttatgtcacgcttacattcacgccctcctcccacatccgctc3960taaccgaaaaggaaggagttagacaacctgaagtctaggtccctatttattttttttaat4020agttatgttagtattaagaacgttatttatatttcaaatttttcttttttttctgtacaa4080acgcctgtacgcatgtaacattatactgaaaaccttgcttgagaaggttttgggacgctc4140gaaggctttaatttggagctcttagtcaaaaaattagccttttaattctgctgtaacccg4200tacatgcccaaaatagggggcgggttacacagaatatataacatcgtaggtgtctgggtg4260aacagtttattcctggcatccactaaatataatggagcccgctttttaagctggcatcca4320gaaaaaaaaagaatcccagcaccaaaatattgttttcttcaccaaccatcagttcatagg4380tccattctcttagcgcaactacagagaacaggggcacaaacaggcaaaaaacgggcacaa4440cctcaatggagtgatgcaacctgcctggagtaaatgatgacacaaggcaattgacccacg4500catgtatctatctcattttcttacaccttctattaccttctgctctctctgatttggaaa4560aagctgaaaaaaaaggttgaaaccagttccctgaaattattcccctacttgactaataag4620tatataaagacggtaggtattgattgtaattctgtaaatctatttcttaaacttcttaaa4680ttctacttttatagttagtcttttttttagttttaaaacaccaagaacttagtttcgaat4740aaacacacataaacaaacaaaatgaacgcccaacactggatcgccggtgcctggactggt4800gaaccatctgccgactctgtaaaccctgctgacggtacattgatcggtcaatttgctgat4860ggtggtacatggcaagcagaagctgcaattgccgctgcaagacatgttttcgaaagaact4920acatggggtcaagatgctagattaagacaagacgttttgttagcttgggcaggtgcctta4980gaagcagaaagagaaagattggcttccttgttaactgcagaaaatggtaaaccagtagct5040caagcaagaggtgaagttggtgccgctataagtgaagtcagatattacgctggtttagca5100agacatatcccaggtcacgttttggaaccagaacctggtactatttccacaatattgaga5160gaacctgctggtgtcgcagccattatagtaccatggaatgcccctgctgtattgttagtt5220agatctttagcaccagccttggctgcaggttgtacagctgttgtcaagtcagccgctcaa5280accactttgtttactgcagccatgttgagattattcgaaagaacagcattacctgctggt5340gcagtcaacttggtatgcgaaaccggttatgctgcagccgatcatttggttagatctaga5400gatgtcgacgtagtttcctttactggtagtacagctaccggtaaaaagatcatgattgct5460gcagccgattctgttaaaaagttgtcattagaattgggtggtaaatcttgttgcttagtt5520ttcgatgatgttgacgcccaagctgtcgcaaagagattagctttggctgcaacagttatt5580tcaggtcaacaatgtaccgccgctagaagagtcttggtacatgaagccatagctccacaa5640atgagaagacacttaacagaagctttggcagccttaagattgggtccaggtattgaacct5700gatacccaaatcggtccattaattgaccatcctactagagccatggtatcagctcaagtt5760gaaagagcatgtgatgaagccgacaccgttttgttaagaggtactatgccaggtggtgca5820ttggctagaggtgcatttttgtccccaactttggttgaacacagtgatcctggtgcattt5880ttctgccaagaagaaatttttggtcctttcgttacctttgaaactttcgctacagaagat5940gaagctttagcaaaagccaataacacagtatttggtttgtctgcttcagtttggacccat6000cacggtgaaagagcaattagattagctagagcattgagaaacggtactgtttgggtcaat6060gatcataacagattatttgccgaagctgaaacaggtggttatagacaatctggtttaggt6120agattgcatggttacgatgcattagccgacttcactgaattgaaacacatatgtatccaa6180gctggtttgcctaagggtatgtcccaagcaggttgtagattgagtggtgttgccgctaga6240gaaagaatgggtgtctccgtctagtaactagtgtgaatttactttaaatcttgcatttaa6300ataaattttctttttatagctttatgacttagtttcaatttatatactattttaatgaca6360ttttcgattcattgattgaaagctttgtgttttttcttgatgcgctattgcattgttctt6420gtctttttcgccacatgtaatatctgtagtagatacctgatacattgtggatgctgagtg6480aaattttagttaataatggaggcgctcttaataattttggggatattggctttttttttt6540aaagtttacaaatgaattttttccgccaggatctcgagttaattaaaccgtggatgatgt6600ggtctctacaggatctgacattattattgttggaagaggactatttgcaaagggaaggga6660tgctaaggtagagggtgaacgttacagaaaagcaggctgggaagcatatttgagaagatg6720cggccagcaaaactaacccagtggatccagtc6752<210>44<211>579<212>PRT<213>Cupriavidusbasilensis<400>44MetAspThrProArgGluArgPheAspTyrValIleValGlyGlyGly151015SerAlaGlyCysValLeuAlaAsnArgLeuSerGlnAspProAlaIle202530ArgValAlaLeuIleGluAlaGlyValAspThrProProAspAlaVal354045ProAlaGluIleLeuAspSerTyrProMetProLeuPhePheGlyAsp505560ArgTyrIleTrpProSerLeuGlnAlaArgAlaValAlaGlyGlyArg65707580SerLysValTyrGluGlnGlyArgValMetGlyGlyGlySerSerIle859095AsnValGlnAlaAlaAsnArgGlyLeuProArgAspTyrAspGluTrp100105110AlaAlaSerGlyAlaSerGlyTrpSerTrpGlnAspValLeuProTyr115120125PheArgHisLeuGluArgAspValAspTyrGlyAsnSerProLeuHis130135140GlySerHisGlyProValProIleArgArgIleLeuProGlnAlaTrp145150155160ProProPheCysThrGluPheAlaHisAlaMetGlyArgSerGlyLeu165170175SerAlaLeuAlaAspGlnAsnAlaGluPheGlyAspGlyTrpPhePro180185190AlaAlaPheSerAsnLeuAspAspLysArgValSerThrAlaIleAla195200205TyrLeuAspAlaAspThrArgArgArgAlaAsnLeuArgIleTyrAla210215220GluThrThrValArgLysLeuValValSerGlyArgGluAlaArgGly225230235240ValIleAlaMetArgAlaAspGlySerArgLeuAlaLeuAspAlaGly245250255GluValIleValSerAlaGlyAlaLeuGlnSerProAlaIleLeuMet260265270ArgAlaGlyIleGlyAspAlaGlyAlaLeuGlnAlaLeuGlyIleGlu275280285ValValAlaAspArgProGlyValGlyArgAsnLeuGlnAspHisPro290295300AlaLeuThrPheCysGlnPheLeuAlaProGlnTyrArgMetProLeu305310315320SerArgArgArgAlaSerMetThrAlaAlaArgPheSerSerGlyVal325330335ProGlyGlyGluAlaSerAspMetTyrLeuSerSerSerThrArgAla340345350GlyTrpHisAlaLeuGlyAsnArgLeuGlyLeuPhePheLeuTrpCys355360365AsnArgProPheSerArgGlyGlnValSerLeuAlaGlyAlaGlnPro370375380AspValProProMetValGluLeuAsnLeuLeuAspAspGluArgAsp385390395400LeuArgArgMetValAlaGlyValArgLysLeuValGlnIleValGly405410415AlaSerAlaLeuHisGlnHisProGlyAspPhePheProAlaThrPhe420425430SerProArgValLysAlaLeuSerArgValSerArgGlyAsnValLeu435440445LeuThrGluLeuLeuGlyAlaValLeuAspValSerGlyProLeuArg450455460ArgSerLeuIleAlaArgPheValThrGlyGlyAlaAsnLeuAlaSer465470475480LeuLeuThrAspGluSerAlaLeuGluGlyPheValArgGlnSerVal485490495PheGlyValTrpHisAlaSerGlyThrCysArgMetGlyAlaHisAla500505510AspArgSerAlaValThrAspAlaAlaGlyArgValHisAspValGly515520525ArgLeuArgValIleAspAlaSerLeuMetProArgLeuProThrAla530535540AsnThrAsnIleProThrIleMetLeuAlaGluLysIleAlaAspThr545550555560MetGlnAlaGluArgArgAlaValArgProAlaSerSerGluValAla565570575HisProSer<210>45<211>500<212>PRT<213>Cupriavidusbasilensis<400>45MetAsnAlaGlnHisTrpIleAlaGlyAlaTrpThrGlyGluProSer151015AlaAspSerValAsnProAlaAspGlyThrLeuIleGlyGlnPheAla202530AspGlyGlyThrTrpGlnAlaGluAlaAlaIleAlaAlaAlaArgHis354045ValPheGluArgThrThrTrpGlyGlnAspAlaArgLeuArgGlnAsp505560ValLeuLeuAlaTrpAlaGlyAlaLeuGluAlaGluArgGluArgLeu65707580AlaSerLeuLeuThrAlaGluAsnGlyLysProValAlaGlnAlaArg859095GlyGluValGlyAlaAlaIleSerGluValArgTyrTyrAlaGlyLeu100105110AlaArgHisIleProGlyHisValLeuGluProGluProGlyThrIle115120125SerThrIleLeuArgGluProAlaGlyValAlaAlaIleIleValPro130135140TrpAsnAlaProAlaValLeuLeuValArgSerLeuAlaProAlaLeu145150155160AlaAlaGlyCysThrAlaValValLysSerAlaAlaGlnThrThrLeu165170175PheThrAlaAlaMetLeuArgLeuPheGluArgThrAlaLeuProAla180185190GlyAlaValAsnLeuValCysGluThrGlyTyrAlaAlaAlaAspHis195200205LeuValArgSerArgAspValAspValValSerPheThrGlySerThr210215220AlaThrGlyLysLysIleMetIleAlaAlaAlaAspSerValLysLys225230235240LeuSerLeuGluLeuGlyGlyLysSerCysCysLeuValPheAspAsp245250255ValAspAlaGlnAlaValAlaLysArgLeuAlaLeuAlaAlaThrVal260265270IleSerGlyGlnGlnCysThrAlaAlaArgArgValLeuValHisGlu275280285AlaIleAlaProGlnMetArgArgHisLeuThrGluAlaLeuAlaAla290295300LeuArgLeuGlyProGlyIleGluProAspThrGlnIleGlyProLeu305310315320IleAspHisProThrArgAlaMetValSerAlaGlnValGluArgAla325330335CysAspGluAlaAspThrValLeuLeuArgGlyThrMetProGlyGly340345350AlaLeuAlaArgGlyAlaPheLeuSerProThrLeuValGluHisSer355360365AspProGlyAlaPhePheCysGlnGluGluIlePheGlyProPheVal370375380ThrPheGluThrPheAlaThrGluAspGluAlaLeuAlaLysAlaAsn385390395400AsnThrValPheGlyLeuSerAlaSerValTrpThrHisHisGlyGlu405410415ArgAlaIleArgLeuAlaArgAlaLeuArgAsnGlyThrValTrpVal420425430AsnAspHisAsnArgLeuPheAlaGluAlaGluThrGlyGlyTyrArg435440445GlnSerGlyLeuGlyArgLeuHisGlyTyrAspAlaLeuAlaAspPhe450455460ThrGluLeuLysHisIleCysIleGlnAlaGlyLeuProLysGlyMet465470475480SerGlnAlaGlyCysArgLeuSerGlyValAlaAlaArgGluArgMet485490495GlyValSerVal500<210>46<211>479<212>PRT<213>Burkholderiasp.CCGE1002<400>46MetAsnAlaArgHisTrpIleAlaGlyGluTrpThrGlyThrProAsn151015IleAspSerIleAspProAlaThrGlyAspAlaIleGlyArgPheAla202530AspGlyGlySerSerGluAlaAspAlaAlaIleAlaAlaAlaArgHis354045AlaPheAspArgThrThrTrpAlaGlnAspAlaArgLeuArgGlnAsp505560ValLeuLeuGlyTrpAlaSerAlaLeuGluAlaGluArgAspMetLeu65707580AlaThrLeuLeuThrArgGluAsnGlyLysAlaIleAlaGlnSerArg859095AspGluIleAlaGlyAlaIleSerGluValArgTyrTyrAlaGlyLeu100105110AlaArgHisIleAlaGlyHisValLeuGluProGluProGlyThrIle115120125SerThrMetLeuArgGluAlaAlaGlyValAlaAlaIleIleValPro130135140TrpAsnAlaProAlaValLeuLeuValArgSerLeuAlaProAlaLeu145150155160AlaAlaGlyCysThrValIleValLysProAlaAlaGlnThrSerLeu165170175LeuThrAlaAlaMetLeuArgCysPheGluHisThrAlaLeuProGlu180185190GlyAlaValAsnLeuValAsnGluArgGlyTyrAlaAlaSerGlnArg195200205LeuValAspSerHisGlyValAspValValSerPheThrGlySerThr210215220AlaThrGlyLysLysIleMetAlaAlaAlaAlaAspSerMetLysLys225230235240LeuSerLeuGluLeuGlyGlyLysSerCysCysValValPheAspAsp245250255AlaAspValAlaAlaIleAlaProArgLeuAlaArgAlaAlaThrIle260265270IleSerGlyGlnGlnCysThrAlaAlaArgArgValLeuValHisAla275280285SerArgAlaAlaGlnMetArgGluGlnLeuAlaSerAlaLeuAlaSer290295300LeuArgValGlyProGlyIleAspProAlaThrAspIleGlyAlaLeu305310315320IleAspGlyThrThrArgAspAlaValAlaArgThrIleGluArgAla325330335CysGlyThrAlaGluArgValLeuLeuArgGlyThrCysSerGlyHis340345350AlaPheLeuSerProThrLeuValGluHisAspAspProLysAlaPhe355360365PheCysGlnAspGluIlePheGlyProPheValThrLeuGluValPhe370375380GluAsnGluMetGluAlaIleGluLysAlaAsnAspThrValPheGly385390395400LeuSerAlaSerValTrpThrHisAspGlyAlaArgAlaLeuArgVal405410415AlaArgAlaLeuArgAsnGlyThrValTrpIleAsnAspHisAsnLys420425430LeuPheAlaGluAlaGluThrGlyGlyTyrArgGlnSerGlyLeuGly435440445ArgLeuHisGlyTyrAspAlaLeuAlaAspPheThrGluLeuLysHis450455460IleCysMetProAlaGlyValAlaGluGlyIleAlaProLeuArg465470475<210>47<211>483<212>PRT<213>BurkholderiagraminisC4D1M<400>47MetGluArgAspAlaMetAsnTrpIleAlaGlyGluTrpAlaGlyLys151015ProValLeuAlaSerSerAspProSerAsnGlyGluThrLeuGlyArg202530PheValSerSerAsnThrGlnAspAlaAspAlaAlaValSerAlaAla354045ArgHisThrPheAspHisThrThrTrpAlaGlnAspAlaArgArgArg505560GlnAspValLeuLeuArgTrpAlaGlnAlaLeuGluLeuSerValGlu65707580ProLeuAlaGluLeuLeuThrHisGluAsnGlyLysThrIleGlyGln859095AlaArgGlyGluMetArgAlaAlaIleSerGluValArgTyrTyrAla100105110GlyLeuAlaArgHisIleAlaGlyHisValIleGluProGluProGly115120125ThrIleSerThrMetLeuArgGluAlaAlaGlyValAlaAlaIleIle130135140ValProTrpAsnAlaProAlaValLeuLeuValArgSerLeuAlaPro145150155160AlaLeuAlaAlaGlyCysThrAlaIleValLysProAlaAlaGlnThr165170175SerLeuIleThrAlaAlaMetIleArgCysLeuAspGlnProAlaLeu180185190ProAlaGlyAlaValAsnLeuLeuLeuGluAsnGlyAlaGluAlaAla195200205AlaArgLeuValGluSerAlaAspValAspValIleSerPheThrGly210215220SerThrGluValGlyLysArgIleMetArgAlaAlaAlaAspSerMet225230235240LysArgLeuSerLeuGluLeuGlyGlyLysSerCysCysLeuValPhe245250255GluAspSerAspValLysAlaIleAlaProArgLeuAlaArgAlaAla260265270ThrIleIleSerGlyGlnGlnCysThrAlaAlaArgArgIleLeuVal275280285HisValSerLysAlaAspGlnMetArgAspGluLeuValLysAlaLeu290295300AlaSerLeuLysValGlyProGlyIleAspProAlaSerAspIleGly305310315320AlaLeuIleAspAlaAlaSerArgAspAlaValGlnThrThrValGlu325330335ArgAlaCysAspLeuAlaAspArgValLeuLeuArgGlyThrSerSer340345350GlyProGlyAlaPheLeuSerProThrLeuValGluHisGlyGluPro355360365HisAlaPhePheCysGlnAspGluIlePheGlyProPheValThrLeu370375380GluThrPheValThrGluLysGluAlaValGluLysAlaAsnAsnThr385390395400ValPheGlyLeuSerAlaSerValTrpThrHisAspSerAlaArgAla405410415PheArgIleAlaArgAlaLeuArgAspGlyThrValTrpIleAsnAsp420425430HisAsnArgLeuPheAlaGluAlaGluThrGlyGlyTyrArgGlnSer435440445GlyLeuGlyArgLeuHisGlyTyrAspAlaLeuAlaAspPheThrGlu450455460IleLysHisIleCysValGlyAlaGlyValLeuGluGlyIleGluVal465470475480LeuGlySer<210>48<211>483<212>PRT<213>Azospirillumsp.B510<400>48MetThrAsnLeuAspSerArgHisTrpIleAspGlyAlaTrpValPro151015GlyThrAspArgPheAlaSerIleAsnProAlaAspGlySerValLeu202530GlyHisAlaAlaAspGlyGlyArgAlaGluAlaGluAlaAlaIleAla354045AlaAlaHisAlaAlaPheAsnArgProAspTrpAlaGlnAsnProArg505560LeuArgGlnSerIleLeuLeuGlyTrpAlaAspArgLeuAspThrGln65707580AlaGluAspLeuAlaArgLeuLeuThrLeuGluAsnGlyLysAlaIle859095AlaGlnSerArgGlyGluIleAlaGlyAlaIleSerGluIleArgTyr100105110TyrGlyGlyLeuAlaArgHisValProGlyHisValLeuGluValGlu115120125ProGlyValLeuSerThrMetLeuArgGluProAlaGlyValAlaAla130135140LeuIleIleProTrpAsnAlaProAlaValLeuLeuAlaArgAlaIle145150155160GlyProAlaLeuAlaCysGlyCysThrValValValLysProAlaAla165170175GlnThrThrLeuLeuThrAlaAlaPheLeuArgAlaLeuSerGluVal180185190ProSerLeuProArgGlyValCysAsnMetIleSerGluThrGlyHis195200205AlaAlaAlaAlaArgLeuValAspSerProLeuValAspValValSer210215220PheThrGlySerThrAlaThrGlyLysArgIleMetValAlaAlaAla225230235240AspThrMetLysLysLeuSerLeuGluLeuGlyGlyLysSerCysCys245250255LeuValPheProAspAlaAspProAlaGluThrAlaAlaArgIleAla260265270ThrAlaAlaThrIleIleSerGlyGlnGlnCysThrAlaAlaArgArg275280285ValLeuValHisAlaSerAlaPheAspAlaMetLysThrHisLeuArg290295300AlaAlaLeuAlaAlaMetThrValGlyAsnGlyLeuAspProAlaIle305310315320ArgMetGlyProLeuIleAspArgProAlaArgAspGlnValGlnThr325330335GlnValGluArgAlaPheAspAlaCysAspGluValLeuLeuArgGly340345350GlyValProThrAspSerProAlaAlaAlaSerPheLeuThrProSer355360365LeuValAlaHisAspAspProSerAlaPhePheCysGlnAspGluIle370375380PheGlyProPheValValLeuGluArgPheGluThrGluAlaGluAla385390395400ValAlaLysAlaAsnAsnThrValPheGlyLeuSerAlaSerValTrp405410415ThrArgAspGlyAlaArgAlaLeuArgMetAlaArgAlaLeuArgAsn420425430GlyThrValTrpIleAsnAspHisAsnArgLeuPheAlaGluAlaGlu435440445ThrGlyGlyTyrArgGlnSerGlyLeuGlyArgLeuHisGlyTyrAsp450455460AlaPheAlaAspPheThrGluLeuLysHisValCysGlnThrValGly465470475480ThrIleGly<210>49<211>480<212>PRT<213>Pseudomonasputida<400>49MetGlnSerGlnHisTyrIleAspGlyGlnTrpThrSerThrAspArg151015TrpThrAspSerLeuAspProAlaSerGlyGluLeuIleGlyCysPhe202530AlaAspGlyGlyGluAlaGluAlaGluAlaAlaValAlaAlaAlaAla354045ArgAlaPheAsnAspProGlnTrpAlaGlnAsnProArgLeuArgGln505560GlnLeuLeuLeuGluTrpAlaAlaGlyLeuLysAlaArgGlnGluGln65707580LeuAlaGlnLeuLeuThrArgGluAsnGlyLysAlaLeuAlaGlnSer859095ArgGlyGluIleGlyGlyAlaIleSerGluIleLeuTyrTyrAlaGly100105110LeuAlaArgHisAsnProGlyHisMetLeuGluValAlaProGlyGlu115120125PheSerSerMetLeuArgGluProAlaGlyValAlaGlyLeuIleIle130135140ProTrpAsnAlaProAlaValLeuLeuValArgAlaLeuAlaProAla145150155160IleAlaAlaGlyCysThrValValIleLysProAlaProGlnThrAla165170175LeuPheAsnAlaAlaMetLeuGluProLeuPheAlaLeuProGlyLeu180185190ProAlaGlyAlaValAsnLeuPheAlaGluSerGlyHisAlaGlyAla195200205AlaHisLeuValAlaSerProArgValAspValLeuSerPheThrGly210215220SerThrAlaThrGlyGlnArgIleMetArgAspCysAlaAlaThrMet225230235240LysLysLeuSerLeuGluLeuGlyGlyLysSerCysCysLeuValPhe245250255GluAspAlaAspIleAlaAlaIleAlaProLysLeuAlaAlaAlaAla260265270ThrIleIleSerGlyGlnGlnCysThrAlaAlaArgArgValLeuVal275280285HisAlaSerArgPheAlaGluMetLysThrAlaLeuSerAlaAlaLeu290295300GlyGlnIleArgLeuGlyAsnGlyLeuAspProAlaAsnAsnMetGly305310315320ProLeuIleAspTrpHisSerArgAspSerValGluArgArgIleGly325330335GluAlaLeuAspSerCysAspGluValLeuLeuAlaGlyGlyArgPro340345350GlnGlyGluLeuSerLysGlyAlaPheLeuAlaProSerLeuIleAla355360365HisArgAspSerSerAlaPhePheCysGlnGluGluIlePheGlyPro370375380LeuLeuValLeuGluSerPheGluAspGluThrGluAlaValAlaArg385390395400AlaAsnHisThrGluPheGlyLeuSerAlaSerValTrpThrAspGln405410415GlyAlaArgAlaTrpArgValAlaArgAlaLeuArgAsnGlyThrVal420425430TrpLeuAsnAspHisAsnArgLeuPheAlaGluAlaGluThrGlyGly435440445TyrArgLysSerGlyLeuGlyArgLeuHisGlyValAspAlaLeuLeu450455460AspPheSerGluLeuLysHisIleTyrGlnAsnValGlyThrLeuGly465470475480<210>50<211>486<212>PRT<213>Rhodopseudomonaspalustris<400>50MetGlyMetThrAlaLeuHisAlaAspAsnLeuIleAspGlyAlaTrp151015GlnProAlaGlnSerGlyAlaThrAlaProSerLeuAspProSerSer202530GlyGlyThrIleGlyGlyPheAlaAlaGlyGlyAlaAlaAspAlaGln354045AlaAlaValAlaAlaAlaArgArgAlaPheGluArgProGluTrpSer505560GlnAsnProArgAlaArgGlnMetValMetLeuArgTrpAlaAspArg65707580MetGluAlaGlnAlaAspGlnLeuAlaArgLeuLeuThrLeuGluAsn859095GlyLysProLeuProGlnSerArgGlyGluIleAlaGlySerValSer100105110GluIleArgTyrTyrAlaGlyLeuThrArgTyrIleProGlyHisVal115120125PheGluValGluProGlySerPheSerThrLeuLeuLysGluProAla130135140GlyValAlaGlyLeuIleIleProTrpAsnAlaProAlaValLeuLeu145150155160IleArgAlaLeuThrProAlaLeuAlaAlaGlyCysThrValValIle165170175LysProAlaProGlnThrAlaGlnIleThrAlaAlaIleIleLysCys180185190LeuHisGluValAspGlyLeuProArgGlyValValAsnLeuValSer195200205GluGlnGlyHisGlnValAlaGluHisLeuValThrSerAsnAspVal210215220AspValIleSerPheThrGlySerAsnAlaThrGlyAlaArgIleMet225230235240AlaAlaAlaAlaProThrMetLysLysLeuSerLeuGluLeuGlyGly245250255LysSerAlaCysLeuValPheAspAspAlaAspIleAlaAspValAla260265270ProLysLeuAlaAlaAlaAlaThrIleIleAlaGlyGlnGlnCysThr275280285AlaAlaArgArgValLeuValHisAlaSerArgTyrAspGluMetLys290295300AlaAlaLeuLysAlaAlaLeuAlaAsnIleArgIleAlaProGlySer305310315320AlaAlaGlyAlaGluMetGlyProLeuIleAspAlaAlaSerLeuAla325330335AlaValAlaLysArgAlaAspGluAlaMetGlnAlaAlaAspGluVal340345350ValLeuArgGlyGlyArgProAlaGlyAspLeuAlaAsnGlyTyrPhe355360365LeuSerProThrLeuValAlaHisArgAspThrSerAlaPhePheVal370375380GlnGluGluIlePheGlyProLeuValValLeuGluLysPheGluAsp385390395400GluLysGluAlaValAlaArgAlaAsnHisSerAspTyrGlyLeuSer405410415AlaSerValTrpThrHisAspGlyAlaArgAlaMetArgValAlaArg420425430AlaLeuArgAsnGlyThrValTrpIleAsnAspHisAsnLysLeuPhe435440445AlaGluAlaGluThrGlyGlyTyrArgArgSerGlyLeuGlyArgLeu450455460HisGlyTyrAspAlaLeuIleAspPheLeuGluIleLysHisValTyr465470475480GlnSerCysGlyValVal485<210>51<211>485<212>PRT<213>DinoroseobactershibaeDFL12<400>51MetThrThrThrAspLeuIleAlaArgHisMetIleGlyGlySerTyr151015SerAspAlaGlyAspLysIleAlaSerIleAsnProAlaThrGlyAla202530ValValGlyHisValArgAlaAspGlyAlaAlaGlnAlaThrAlaAla354045IleAlaAlaAlaArgAlaAlaPheAspThrThrLeuTrpProGlnSer505560ProArgAspArgGlnMetAlaLeuLeuArgTrpAlaAspAlaLeuGlu65707580AlaAspLeuAlaArgLeuAlaGluLeuLeuThrLeuThrAsnGlyLys859095ProLeuGlyAlaSerLysGlyGluLeuGlyAlaAlaIleSerGluIle100105110ArgTyrTyrAlaGlyLeuThrArgHisAsnProGlyHisAlaMetGlu115120125ValAlaProGlyGluLeuSerValMetLeuArgGluProAlaGlyVal130135140AlaGlyIleIleValProTrpAsnAlaProAlaValLeuLeuIleArg145150155160SerLeuAlaProAlaLeuAlaValGlyCysThrThrValThrLysPro165170175AlaProGlnThrAlaLeuPheThrAlaAlaCysMetAlaProLeuPhe180185190GluAspAlaAlaIleProAlaGlyValValAsnValValPheGluVal195200205GlyHisAspAlaAlaGlnThrLeuValThrSerProAspValAspVal210215220IleSerPheThrGlySerAsnAlaValGlyGlnArgIleMetAlaAsp225230235240AlaAlaProThrMetLysLysLeuSerLeuGluLeuGlyGlyLysSer245250255CysCysIleValLeuAspAspAlaAspIleGlyValValAlaProLys260265270LeuAlaAlaAlaAlaThrIleIleSerGlyGlnGlnCysThrAlaAla275280285ArgArgValLeuValHisGluSerArgLeuAspGluAlaLysSerAla290295300LeuSerAlaAlaLeuGlnAlaValSerIleGlyAspGlyMetSerAsp305310315320GlyThrAlaMetGlyProLeuIleAspIleGlnSerArgAspArgVal325330335MetArgAspCysGlyThrValTyrAspThrAlaAspGluValValLeu340345350ArgGlyGlyProLeuAspGlyProLysGlySerAlaPheMetSerPro355360365AlaLeuValValHisSerAspProAsnAlaSerPheValGlnAspGlu370375380IlePheGlyProLeuValValLeuGluThrPheArgAspGluAlaAsp385390395400AlaValAlaLysAlaAsnAsnThrValTyrGlyLeuSerAlaSerIle405410415TrpThrHisArgGlyAspAlaSerTrpArgLeuAlaArgAlaLeuArg420425430AsnGlyThrValTrpIleAsnAspHisAsnArgLeuPheAlaGluAla435440445GluThrGlyGlyTyrArgArgSerGlyLeuGlyArgLeuHisGlyPhe450455460AspGlyLeuLeuAspPheCysGluLeuLysHisValTyrGlnAsnVal465470475480GlyValValGlyHis485<210>52<211>446<212>PRT<213>Aeribacilluspallidus<400>52MetLysAsnIleAlaAsnThrSerThrGluArgProValAsnAspAla151015SerValLysAsnArgGlnMetValArgAlaThrIleAlaSerLeuIle202530GlyTrpSerLeuAspLeuTyrAspLeuPheLeuLeuLeuPheValAla354045ThrThrIleGlyAsnLeuPhePheProAlaSerAsnGlnThrLeuSer505560LeuAlaAlaValTyrAlaSerPheAlaValThrLeuLeuMetArgPro65707580LeuGlySerAlaIlePheGlyIleTyrAlaAspLysAsnGlyArgLys859095LysAlaMetThrValAlaIleIleGlyAlaGlyLeuCysThrAlaAla100105110PheGlyLeuLeuProThrIleHisGlnValGlyValValAlaAlaIle115120125AlaPheLeuIleLeuArgLeuValGlnGlyValPheValGlyGlyVal130135140ValAlaSerThrHisThrIleGlyThrGluSerAlaSerProLysTyr145150155160ArgGlyPheMetSerGlyLeuIleGlyGlyGlyGlyAlaGlyLeuGly165170175AlaLeuPheAlaSerIleSerTyrSerValValThrAlaIlePhePro180185190GlyGluAlaPheAspValTrpGlyTrpArgValMetPhePheThrGly195200205IleIleGlySerLeuPheGlyLeuPheIlePheArgSerLeuGluGlu210215220SerProLeuTrpLysGlnLeuLysGluGluAsnSerLysGlyGluVal225230235240SerGluPheGlnLysAlaProLeuLysThrPhePheThrLysTyrTyr245250255LysValLeuLeuValAsnLeuMetIleValIleGlyGlyGlySerGly260265270TyrTyrLeuThrSerGlyPheIleProThrPheLeuLysValValAsn275280285LysValSerAlaSerValSerSerGlyValLeuIleAlaThrSerIle290295300MetThrIleValAlaAlaValLeuValGlyHisLeuSerGluValIle305310315320GlyArgLysLysThrPheLeuLeuIleGlyIleLeuCysLeuValGly325330335LeuProTyrPheTyrLeuSerLeuAlaAsnSerThrThrThrThrGly340345350IleTyrLeuAsnAlaLeuGlyLeuIlePheLeuGlyAsnAlaAlaTyr355360365AlaProValLeuIlePheLeuAsnGluArgPheProThrSerIleArg370375380SerThrGlyThrGlyLeuSerTrpAsnMetGlyPheAlaIleGlyGly385390395400MetMetProThrPheValAsnLeuAlaSerGlyThrValGluHisIle405410415ProTyrThrLeuMetTyrPheThrIleGlyIleTyrLeuValTyrIle420425430LeuGlySerLeuIleIleProGluThrLysGlyAsnLeuLys435440445<210>53<211>447<212>PRT<213>Cupriavidusbasilensis<400>53MetGluAlaValAlaLysLysArgThrGluThrIleSerGluAlaLeu151015ProAlaAlaThrAsnArgGlnValPheGlyAlaValThrAlaSerCys202530MetGlyTrpAlaLeuAspLeuPheAspLeuPheIleLeuLeuPheVal354045AlaProValIleGlyArgLeuPhePheProSerGluHisAlaMetLeu505560SerLeuAlaAlaValTyrAlaSerPheAlaValThrLeuLeuMetArg65707580ProLeuGlySerAlaIlePheGlyThrTyrAlaAspArgHisGlyArg859095LysGlyAlaMetValValAlaValThrGlyValGlyLeuSerThrAla100105110AlaPheGlyLeuLeuProThrValGlyGlnValGlyLeuLeuAlaPro115120125AlaLeuPheIleLeuLeuArgLeuValGlnGlyIlePheValGlyGly130135140ValValAlaSerThrHisThrIleGlyThrGluSerValProProSer145150155160TrpArgGlyAlaValSerGlyLeuValGlyGlyGlyGlyAlaGlyIle165170175GlyAlaLeuLeuAlaSerIleThrTyrMetAlaMetThrAlaLeuPhe180185190ProGlyGluAlaPheAspAlaTrpGlyTrpArgCysMetPhePheSer195200205GlyIleIleSerSerValLeuGlyLeuPheIlePheAsnSerLeuGlu210215220GluSerProLeuTrpLysGlnLeuGlnAlaAlaLysGlyHisAlaAla225230235240ProValGluAsnProLeuArgValIlePheSerArgGlnTyrArgGly245250255ValLeuPheValAsnIleLeuLeuThrValGlyGlyGlySerAlaTyr260265270TyrLeuThrSerGlyTyrLeuProThrPheLeuLysValValValLys275280285AlaProAlaGlyAlaSerAlaAlaIleLeuMetAlaSerSerValGly290295300ValIleValAlaSerIleIleAlaGlyHisLeuSerThrLeuIleGly305310315320ArgLysArgAlaPheLeuLeuIleGlyAlaLeuAsnValValLeuLeu325330335ProLeuIleTyrGlnArgMetProAlaAlaProAspValThrThrLeu340345350GlyIleTyrAlaValAlaLeuAlaMetLeuGlySerThrGlyPheAla355360365ProIleLeuIlePheLeuAsnGluArgPheProThrSerIleArgAla370375380ThrGlyThrGlyLeuSerTrpAsnIleGlyPheAlaIleGlyGlyMet385390395400MetProThrPheAlaSerLeuCysAlaSerThrProAlaAspLeuPro405410415LysValLeuGlyIlePheValAlaValValThrAlaIleTyrLeuAla420425430GlyAlaAlaIleValProGluThrAlaGlyArgLeuGlyGluLys435440445<210>54<211>449<212>PRT<213>Cupriavidusbasilensis<400>54MetGluAlaValAlaLysLysSerAlaAlaThrIleSerGluAlaLeu151015ProAlaAlaSerAsnArgGlnValPheGlyAlaValAlaAlaSerCys202530MetGlyTrpAlaLeuAspLeuPheAspLeuPheIleLeuLeuPheVal354045AlaProValIleGlyArgLeuPhePheProSerGluHisAlaMetLeu505560SerLeuAlaAlaValTyrAlaSerPheAlaValThrLeuLeuMetArg65707580ProLeuGlySerAlaIlePheGlySerTyrAlaAspArgHisGlyArg859095LysGlyAlaMetValValAlaValThrGlyValGlyLeuSerThrAla100105110AlaPheGlyLeuLeuProThrValGlyGlnValGlyLeuLeuAlaPro115120125AlaLeuPheIleLeuLeuArgLeuValGlnGlyIlePheValGlyGly130135140ValValAlaSerThrHisThrIleGlyThrGluSerValProProSer145150155160TrpArgGlyAlaValSerGlyLeuValGlyGlyGlyGlyAlaGlyLeu165170175GlyAlaLeuLeuAlaSerIleThrTyrMetAlaMetThrAlaLeuPhe180185190ProGlyGluAlaPheAspAlaTrpGlyTrpArgCysMetPhePheSer195200205GlyIleIleSerSerValLeuGlyLeuPheIlePheAsnSerLeuGlu210215220GluSerProLeuTrpLysGlnLeuGlnAlaAlaLysGlyHisAlaAla225230235240ProValGluAsnProLeuArgValIlePheSerArgGlnTyrArgGly245250255ValLeuPheValAsnIleLeuLeuThrValGlyGlyGlySerAlaTyr260265270TyrLeuThrSerGlyTyrLeuProThrPheLeuLysValValValLys275280285AlaSerAlaGlyGluSerAlaAlaIleLeuMetAlaSerSerLeuGly290295300ValIleValAlaSerIleLeuAlaGlyHisLeuSerThrMetIleGly305310315320ArgLysArgAlaPheLeuLeuIleGlyAlaLeuAsnValValValLeu325330335ProLeuLeuTyrGlnTrpMetProAlaAlaProAspThrThrThrLeu340345350GlyLeuTyrAlaValValLeuSerMetLeuGlyCysSerGlyPheAla355360365ProIleLeuIlePheLeuAsnGluArgPheProThrSerIleArgAla370375380ThrGlyThrGlyLeuSerTrpAsnIleGlyPheAlaValGlyGlyMet385390395400MetProThrPheAlaSerLeuCysAlaSerThrProAlaGluLeuPro405410415MetValLeuGlyIlePheLeuAlaValValThrIleIleTyrLeuVal420425430GlyAlaPheIleValProGluThrValGlyArgLeuGlyAspAsnGly435440445Ala<210>55<211>449<212>PRT<213>Methylobacteriumradiotolerans<400>55MetGlnThrAlaAlaThrPheAlaSerAspProProAlaLeuAlaLys151015ProThrGlyArgGlnThrValThrAlaAlaMetAlaSerLeuPheGly202530TrpGlyLeuAspLeuPheAspLeuPheIleLeuLeuTyrValAlaPro354045ValValGlyThrLeuPhePheProAlaAspLysProMetLeuSerLeu505560AlaGlyAlaTyrAlaSerPheAlaValThrLeuLeuIleArgProLeu65707580GlySerAlaLeuPheGlySerTyrAlaAspArgPheGlyArgArgArg859095AlaLeuMetValAlaValValGlyValGlyIleSerThrAlaValPhe100105110GlyLeuLeuProThrValGlyGlnIleGlyTrpLeuAlaThrAlaVal115120125PheLeuPhePheArgLeuValGlnGlyIlePheValGlyGlyValVal130135140AlaAlaSerHisThrIleGlyThrGluSerValProGluArgTrpArg145150155160GlyLeuMetSerGlyAlaValGlyGlyGlyGlySerAlaIleGlyGly165170175LeuLeuAlaSerLeuValPheTyrValValSerLeuMetAlaProGly180185190GluAlaPheAlaGluTrpGlyTrpArgLeuMetPhePheSerGlyLeu195200205LeuThrSerValIleGlyLeuIleLeuPheArgAsnLeuGluGluSer210215220ProIlePheLysGluLeuGlnAlaArgLysAlaAlaLeuArgAlaGly225230235240AlaProAlaGluAlaSerProIleArgSerLeuPheSerProSerAsn245250255ArgGlySerPheAlaValAlaThrLeuIleSerPheGlyGlyGlyAla260265270AlaTyrTyrLeuThrSerGlyTyrLeuProThrLeuLeuLysLeuVal275280285AsnGlyValProAsnAlaThrAlaSerMetIleLeuIleGlyAlaAsn290295300ValAlaAlaAlaIleGlyAlaCysGlyMetGlyGluLeuSerGlnHis305310315320IleGlyArgLysArgSerPheLeuLeuMetGlyValIleArgLeuLeu325330335AlaPheProAlaLeuPheLeuThrMetAlaAsnThrThrSerLeuVal340345350GlyValAlaAlaCysAlaPheLeuLeuAlaLeuIleAlaAsnGlySer355360365TyrGlyProLeuLeuIlePheLeuAsnGluLysPheProThrAlaVal370375380ArgAlaThrGlyThrGlyLeuThrTrpAsnIleGlyPheAlaLeuGly385390395400GlyMetLeuProThrLeuValSerLeuValAlaAspGlyProThrGln405410415IleProMetValLeuAlaValIleThrThrGlyValThrLeuValTyr420425430LeuValGlyAlaPheLeuThrAspGluThrGlnGlyAsnLeuAspArg435440445Ala<210>56<211>443<212>PRT<213>Sulfolobusacidocaldarius<400>56MetLysLysGluGluLysPheThrSerAsnHisPheLysTrpThrLeu151015AlaThrPhePheThrTrpThrPheAspLeuTyrAspLeuPheThrIle202530LeuLeuValAlaProTyrIleSerSerLeuPhePheProSerSerIle354045ThrPheLeuSerIleAlaAlaThrTyrAlaGlyPheAlaThrSerLeu505560IleMetArgProValGlyAlaThrValPheGlySerArgValSerAsp65707580LysValGlyArgLysArgAlaIlePheTyrGlyLeuIleGlyLeuVal859095IleThrSerThrLeuGlnGlyAlaLeuProThrTyrGlnValValGly100105110ValIleAlaProIleLeuLeuLeuAlaValArgLeuIleGlnGlyVal115120125PheIleGlyGlyIleThrAlaGlySerHisValIleGlyProGluSer130135140ValProGluArgTyrArgGlyIleValGlyGlyLeuGlyPheSerAla145150155160AlaGlyValAlaTyrLeuIleAlaAlaGlyTrpPhePheLeuThrThr165170175IleLeuTyrProGlySerSerTyrLeuValTrpGlyTrpArgValMet180185190PhePheGlyGlyLeuLeuSerLeuAlaValLeuGlyPheValAsnTyr195200205LeuValProGluSerGluValTrpThrLysIleLysLysArgGlySer210215220ValValLysSerProLeuLysGluIlePheSerLysTyrArgTyrGln225230235240LeuGlyValAlaLeuLeuLeuSerIleGlyTrpGlyAlaSerPheTyr245250255ValThrAspGlyIleLeuProThrPheLeuSerSerValAsnLysLeu260265270AlaLysThrGluIleAlaIleValMetIleIleGlySerIleGlyMet275280285SerIleGlyProLeuIleGlyGlyGluIleSerGlnIleIleGlyArg290295300LysIleThrSerLeuIleGlyAlaIleIleValLeuAlaValValGly305310315320ProLeuPheLeuSerLeuGlySerLeuLysSerGlyAspLeuAsnGln325330335IleIleLeuHisSerPheAlaIleLeuPheLeuValAspIleGlyGly340345350GlyMetLeuMetThrTyrLeuAsnGluIleTyrProAlaSerValArg355360365GlyThrGlyValGlyPheThrTrpAsnThrGlyPheAlaIleGlyGly370375380ThrIleProThrIleIleSerLeuAlaValAlaSerAlaGlyLeuSer385390395400AlaPheProSerIleMetPheTyrThrLeuIleValValSerValIle405410415IleLeuValGlyThrValLeuThrLysGluThrLysGlyThrIleSer420425430LysGluGluTyrGluIleGlnLysGluThrLeu435440<210>57<211>1056<212>DNA<213>Artificial<220><223>hmfL1codingsequenceoptimisedforexpressioninyeast<400>57atgggttccttatccttaccagaaacatcattagccgcaatccaagacaaagaaacaaaa60gctatctcagtcgccaaaagacctacaccagtacctgttggtacccaagtcttagtaaaa120ttgcattattccggtgtttgtgccactgatttgcacttagctagaggttctgttccatac180ttacaacctaaggtttcagtcggtggtcatgaaggtaccggtgttattgcttctttgggt240ccagatgtcgacgcagcagaatggcatgtaggtgacagagtagcagttagatgggtacac300atagtttgtggtaaatgcgaagtttgtactacaggtttcgaaaatttgtgccaatctaga360aagttggctggtaaagatgttgaaggtactttcgccgaatatgcaattgccgactcttca420tacatggttagattaccagctggtgtctcagatgcagacgccgctcctatcttgtgtgct480ggtgtcacagtatacaaagccttgaagatcgcttctttgagagcaggttcatgggttgct540gtcgcaggtgctggtggtggtttaggtcatttggcaatccaatatgctagagcaatgggt600ttaaaagttgtcgcattggatgccagaaagagagacttgtgcttatccttgggtgctgaa660agttacatcgacgttttagaaactgatgactgtgtcgcacaagtaattaaagttacagat720ggtggtgctcacggtgcattaatatgcgcttccagtggtcaagcctacgatgacgctgtt780aaatttttgagatggaccggtactttagtctgtataggtttgccacctaagccaacattg840ttatccttaggtcctgctgattttgtagccagaggtatcaaggttatgggtacaagtacc900ggtgacagacaagacacagttgaagccttggctttcgtcgctaaaggtcaagtaaagcct960caattaaccgaaagaagattggaagatgttgaagaaatcttaaaggaaatagaaaatggt1020acaatgcaaggtaaagccgtaatcagaatcgcatag1056<210>58<211>1020<212>DNA<213>Artificial<220><223>hmfL2codingsequenceoptimisedforexpressioninyeast<400>58atgagtttgccatcccactacaagagagccgcttttaaggaagcaggtggtccattgact60attgaagaagttgatttgactatgccagatgccggtgaagtcttggtaaaagttgaagct120tgtggtgtatgcttttcagacactgttcctcaagctcatggtttgggtggtaaattccca180atcgttcctggtcatgaaattataggtcacgttgtcgcaacaggtgacggtgtttccgac240tgggaagtcggtgacagaattggtgaaggttggcatggtggtcacgacggtacatgtcca300tcatgcagacaaggtcatttccaaatgtgtgataaccaatccataaacggtgttaccaaa360aatggtggttatgctcaatactgcattttgagaagtgaagcagcagtcagaatacctact420cacgtatctgccgctgaatatgcaccaattttatgtgccggtgtcaccgtttttaattca480atgagacaaatcggtgttaagcctggttccactgtcgcaattcaaggtttgggtggttta540ggtcatttggccattcaatatgctaacagatttggtttcagagtagttgctatatctaga600gatgaccaaaaggaaagattcgttagagatttgggtgcacacgaatacattaatacatct660gaagaagatgtcggttcagctttacaaaagttgggtggtgcaagtttaatagttgcaacc720gccccaaacgctagagcaatctctcctttgttaaaaggtttaagaccattgggtaaattg780ttgatcttggctgttccaggtgaaatccctttagataccagattgatggtagcaagaggt840ttatccgttcatggttggccaagtggtcacgccttggattctgaagaaactataagattc900acagaattagaagatatcaagtgtatgatacaaacttactcattagacagagctaacgaa960gcctttgacgctatgatttcaggttcagttagattcagagcagttattacaatggaatag1020<210>59<211>1518<212>DNA<213>Artificial<220><223>hmfN1codingsequenceoptimisedforexpressioninyeast<400>59atgacccaaaccaatgtccacgtaaacaaatccgacacttccttagctgctccacaacaa60ttattcatctccggtaaatatcaaaactctcaaagaaatggtacatttccagtcaaaaac120cctatgactggtgaaacaatctatgaatgtgtttctgcatcattagatgactacgctgct180gctatagaagaagctgatgccgcacaaccatcatgggctagattaggtccttccgcaaga240agattgattttgttaaaggccgctgatataatggaaacatacatcgaaaccgacgctcca300gcaatcttgagtgctgaagtttctgcaacaagaggttgggtcagagccaatatattatct360accgctggtgttttcagagaaactgctgctttggcaacacatatcaaaggtgaaattgtt420ccagctgatagacctggtactacaatcttagtttcaagagaaccagtcggtgttgtcttg480gctatttccccttggaatatgcctgcaaccttaactgccagagctatctgttgcccttta540atttgtggtaactctgtagttttaagaccatccgaattttctcctaaatctcaacatttg600gtcgtaagagccttaacagaagctggtttgccagcaggttgcttgcaattcttaccaaca660tcaaccgcagatacccctagagccatagaatttgctatcagacaccctaaggttagtaga720gctaatttcactggttctgatagagtcggtagaattatagcaggtttatccgccagttgt780ttgaaaccatgcgttttggaattgggtggtaaagcccctgttgtcgtattagaagatgct840gatgtcgaagctgctgttgaagcagttgtctacggtgccatgtctaactcaggtcaaatt900tgtatgagtacagaaagagctatagttcatagatcattggccgctgattttaaagcattg960ttagtaaagagagccgaatcattaagagttggtaatcacttggaagatccagacgttcaa1020ttgtcaggtttgtttactgctgcttccgcagaaagagtcttgggtttgattaaaggtgct1080gtaaacgcaggtgccaccttgttagctggtgacttggcattacatggtccatgccaaact1140ataatggctcctcacatcttaaccggtgttactagagatatggacttgtttcatagagaa1200acattcggtccagtattgttcgttagtgaatttgatactgatgacgaagctatagcacaa1260gccaatgacacagaattttctttatgtgcttcagtattctccagagatgttttgagagct1320atggataccgctaagagaataagaactggttcatgccacgtcaatggtcctactgtatat1380atcgaagcaccattgcctaacggtggtgttggtggtggttctggttacggtagatttggt1440ggtgttgctggtattgaagagtttacagaaagacaaatagttagtttagccaagccaggt1500atcaagtatgccttttag1518<210>60<211>2139<212>DNA<213>Artificial<220><223>syntheticfragmentcomprisinghmfN1forexpressioninyeast<400>60ctcccccgggttagtcaaaaaattagccttttaattctgctgtaacccgtacatgcccaa60aatagggggcgggttacacagaatatataacatcgtaggtgtctgggtgaacagtttatt120cctggcatccactaaatataatggagcccgctttttaagctggcatccagaaaaaaaaag180aatcccagcaccaaaatattgttttcttcaccaaccatcagttcataggtccattctctt240agcgcaactacagagaacaggggcacaaacaggcaaaaaacgggcacaacctcaatggag300tgatgcaacctgcctggagtaaatgatgacacaaggcaattgacccacgcatgtatctat360ctcattttcttacaccttctattaccttctgctctctctgatttggaaaaagctgaaaaa420aaaggttgaaaccagttccctgaaattattcccctacttgactaataagtatataaagac480ggtaggtattgattgtaattctgtaaatctatttcttaaacttcttaaattctactttta540tagttagtcttttttttagttttaaaacaccaagaacttagtttcgaataaacacacata600aacaaacaaaaatgacccaaaccaatgtccacgtaaacaaatccgacacttccttagctg660ctccacaacaattattcatctccggtaaatatcaaaactctcaaagaaatggtacatttc720cagtcaaaaaccctatgactggtgaaacaatctatgaatgtgtttctgcatcattagatg780actacgctgctgctatagaagaagctgatgccgcacaaccatcatgggctagattaggtc840cttccgcaagaagattgattttgttaaaggccgctgatataatggaaacatacatcgaaa900ccgacgctccagcaatcttgagtgctgaagtttctgcaacaagaggttgggtcagagcca960atatattatctaccgctggtgttttcagagaaactgctgctttggcaacacatatcaaag1020gtgaaattgttccagctgatagacctggtactacaatcttagtttcaagagaaccagtcg1080gtgttgtcttggctatttccccttggaatatgcctgcaaccttaactgccagagctatct1140gttgccctttaatttgtggtaactctgtagttttaagaccatccgaattttctcctaaat1200ctcaacatttggtcgtaagagccttaacagaagctggtttgccagcaggttgcttgcaat1260tcttaccaacatcaaccgcagatacccctagagccatagaatttgctatcagacacccta1320aggttagtagagctaatttcactggttctgatagagtcggtagaattatagcaggtttat1380ccgccagttgtttgaaaccatgcgttttggaattgggtggtaaagcccctgttgtcgtat1440tagaagatgctgatgtcgaagctgctgttgaagcagttgtctacggtgccatgtctaact1500caggtcaaatttgtatgagtacagaaagagctatagttcatagatcattggccgctgatt1560ttaaagcattgttagtaaagagagccgaatcattaagagttggtaatcacttggaagatc1620cagacgttcaattgtcaggtttgtttactgctgcttccgcagaaagagtcttgggtttga1680ttaaaggtgctgtaaacgcaggtgccaccttgttagctggtgacttggcattacatggtc1740catgccaaactataatggctcctcacatcttaaccggtgttactagagatatggacttgt1800ttcatagagaaacattcggtccagtattgttcgttagtgaatttgatactgatgacgaag1860ctatagcacaagccaatgacacagaattttctttatgtgcttcagtattctccagagatg1920ttttgagagctatggataccgctaagagaataagaactggttcatgccacgtcaatggtc1980ctactgtatatatcgaagcaccattgcctaacggtggtgttggtggtggttctggttacg2040gtagatttggtggtgttgctggtattgaagagtttacagaaagacaaatagttagtttag2100ccaagccaggtatcaagtatgccttttagactagtgtga2139<210>61<211>8645<212>DNA<213>Artificial<220><223>yeast/E.colishuttlevectorpTT2<400>61ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctc60attttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccga120gatagggttgagtggccgctacagggcgctcccattcgccattcaggctgcgcaactgtt180gggaagggcgtttcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgt240gctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacg300acggccagtgagcgcgacgtaatacgactcactatagggcgaattggcggaaggccgtca360aggccggtaccggtccttttcatcacgtgctataaaaataattataatttaaatttttta420atataaatatataaattaaaaatagaaagtaaaaaaagaaattaaagaaaaaatagtttt480tgttttccgaagatgtaaaagactctagggggatcgccaacaaatactaccttttatctt540gctcttcctgctctcaggtattaatgccgaattgtttcatcttgtctgtgtagaagacca600cacacgaaaatcctgtgattttacattttacttatcgttaatcgaatgtatatctattta660atctgcttttcttgtctaataaatatatatgtaaagtacgctttttgttgaaatttttta720aacctttgtttatttttttttcttcattccgtaactcttctaccttctttatttactttc780taaaatccaaatacaaaacataaaaataaataaacacagagtaaattcccaaattattcc840atcattaaaagatacgaggcgcgtgtaagttacaggcaagcgatccgtccgtttaaacat900gctttctgaaaacacgactattctgatggctaacggtgaaattaaagacatcgcaaacgg960cgcgccgatttttataatgacgaaaaaaaaaaaattggaaagaaaaagcttaatgcggta1020gtttatcacagttaaattgctaacgcagtcaggcaccgtgtatgaaatctaacaatgcgc1080tcatcgtcatcctcggcaccgtcaccctggatgctgtaggcataggcttggttatgccgg1140tactgccgggcctcttgcgggatatcgtccattccgacagcatcgccagtcactatggcg1200tgctgctagcgctatatgcgttgatgcaatttctatgcgcacccgttctcggagcactgt1260ccgaccgctttggccgccgcccagtcctgctcgcttcgctacttggagccactatcgact1320acgcgatcatggcgaccacacccgtcctgtggatcctctacgccggacgcatcgtggccg1380gcatcaccggcgccacaggtgcggttgctggcgcctatatcgccgacatcaccgatgggg1440aagatcgggctcgccacttcgggctcatgagcgcttgtttcggcgtgggtatggtggcag1500gccccgtggccgggggactgttgggcgccatctccttgcatgcaacttcttttctttttt1560tttcttttctctctcccccgttgttgtctcaccatatccgcaatgacaaaaaaatgatgg1620aagacactaaaggaaaaaattaacgacaaagacagcaccaacagatgtcgttgttccaga1680gctgatgaggggtatctcgaagcacacgaaactttttccttccttcattcacgcacacta1740ctctctaatgagcaacggtatacggccttccttccagttacttgaatttgaaataaaaaa1800aagtttgctgtcttgctatcaagtataaatagacctgcaattattaatcttttgtttcct1860cgtcattgttctcgttccctttcttccttgtttctttttctgcacaatatttcaagctat1920accaagcatacaatcaaggaattcgagctaagcggccgcccatggaagctgcaatcaaat1980cactggtagcaatcttaagacaagaactgacgaacttccgtatcagttgtgtttatcctg2040gtaattttgaaagcgaaggtttcactgtagagcagctaacgaaacccgaaattacaaagt2100tgatcgaaggcccctcagacgctatcccatgcaaacaagcatgtgatatcattgccaagt2160cgctggccagaggtgatgatgacgtttttacagattttgtcggatggatgataatgggga2220tggaccttgggctcaccgcaaagaaaagccgctttgttccgttgcaatggatttttggtg2280tcctatcaaacattctggtcgtgccattctacacgcgtgttattactgagtagtatttat2340ttaagtattgtttgtgcacttgcctgcaggccttttgaaaagcaagcataaaagatctaa2400acataaaatctgtaaaataacaagatgtaaagataatgctaaatcatttggctttttgat2460tgattgtacaggaaaatatacatcgcagggggttgacttttaccatttcaccgcaatgga2520atcaaacttgttgaagagaatgttcacaggcgcatacgctacaatgacccgattcttgct2580agccttttctcggtcttgcaaacaaccgccggcagcttctcgagccgcggaaccgccaga2640tattcattacttgacgcaaaagcgtttgaaataatgacgaaaaagaaggaagaaaaaaaa2700agaaaaataccgcttctaggcgggttatctactgatccgagcttccactaggatagcacc2760caaacacctgcatatttggacgacctttacttacaccaccaaaaaccactttcgcctctc2820ccgcccctgataacgtccactaattgagcgattacctgagcggtcctcttttgtttgcag2880catgagacttgcatactgcaaatcgtaagtagcaacgtctcaaggtcaaaactgtatgga2940aaccttgtcacctcacttaattctagctagcctaccctgcaagtcaagaggtctccgtga3000ttcctagccacctcaaggtatgcctctccccggaaactgtggccttttctggcacacatg3060atctccacgatttcaacatataaatagcttttgataatggcaatattaatcaaatttatt3120ttacttctttcttgtaacatctctcttgtaatcccttattccttctagctatttttcata3180aaaaaccaagcaactgcttatcaacacacaaacactaaatcaaaatgcattcgcgaatat3240ctagaatacacgtcatagaatgcgacgtcagcttttgattaagccttctagtccaaaaaa3300cacgtttttttgtcatttatttcattttcttagaatagtttagtttattcattttatagt3360cacgaatgttttatgattctatatagggttgcaaacaagcatttttcattttatgttaaa3420acaatttcaggtttaccttttattctgcttgtggtgacgcgggtatccgcccgctctttt3480ggtcacccatgtatttaattgcataaataattcttaaaagtggagctagtctatttctat3540ttacatacctctcatttctcatttcctcccccgggttagtcaaaaaattagccttttaat3600tctgctgtaacccgtacatgcccaaaatagggggcgggttacacagaatatataacatcg3660taggtgtctgggtgaacagtttattcctggcatccactaaatataatggagcccgctttt3720taagctggcatccagaaaaaaaaagaatcccagcaccaaaatattgttttcttcaccaac3780catcagttcataggtccattctcttagcgcaactacagagaacaggggcacaaacaggca3840aaaaacgggcacaacctcaatggagtgatgcaacctgcctggagtaaatgatgacacaag3900gcaattgacccacgcatgtatctatctcattttcttacaccttctattaccttctgctct3960ctctgatttggaaaaagctgaaaaaaaaggttgaaaccagttccctgaaattattcccct4020acttgactaataagtatataaagacggtaggtattgattgtaattctgtaaatctatttc4080ttaaacttcttaaattctacttttatagttagtcttttttttagttttaaaacaccaaga4140acttagtttcgaataaacacacataaacaaacaaagagctctgatcaatagtcgacatag4200ggcccatacctaggactagtgtgaatttactttaaatcttgcatttaaataaattttctt4260tttatagctttatgacttagtttcaatttatatactattttaatgacattttcgattcat4320tgattgaaagctttgtgttttttcttgatgcgctattgcattgttcttgtctttttcgcc4380acatgtaatatctgtagtagatacctgatacattgtggatgctgagtgaaattttagtta4440ataatggaggcgctcttaataattttggggatattggcttttttttttaaagtttacaaa4500tgaattttttccgccaggatttaattaattgcagattcccttttatggattcctaaatcc4560tcgaggagaacttctagtatatctacatacctaatattattgccttattaaaaatggaat4620cccaacaattacatcaaaatccacattctcttcaaaatcaattgtcctgtacttccttgt4680tcatgtgtgttcaaaaacgttatatttataggataattatactctatttctcaacaagta4740attggttgtttggccgagcggtctaaggcgcctgattcaagaaatatcttgaccgcagtt4800aactgtgggaatactcaggtatcgtaagatgcaagagttcgaatctcttagcaaccatta4860tttttttcctcaacataacgagaacacacaggggcgctatcgcacagaatcaaattcgat4920gactggaaattttttgttaatttcagaggtcgcctgacgcatatacctttttcaactgaa4980aaattgggagaaaaaggaaaggtgagagcgccggaaccggcttttcatatagaatagaga5040agcgttcatgactaaatgcttgcatcacaatacttgaagttgacaatattatttaaggac5100ctattgttttttccaataggtggttagcaatcgtcttactttctaacttttcttaccttt5160tacatttcagcaatatatatatatatatttcaaggatataccattctaatgtctgcccct5220aagaagatcgtcgttttgccaggtgaccacgttggtcaagaaatcacagccgaagccatt5280aaggttcttaaagctatttctgatgttcgttccaatgtcaagttcgatttcgaaaatcat5340ttaattggtggtgctgctatcgatgctacaggtgttccacttccagatgaggcgctggaa5400gcctccaagaaggctgatgccgttttgttaggtgctgtgggtggtcctaaatggggtacc5460ggtagtgttagacctgaacaaggtttactaaaaatccgtaaagaacttcaattgtacgcc5520aacttaagaccatgtaactttgcatccgactctcttttagacttatctccaatcaagcca5580caatttgctaaaggtactgacttcgttgttgtcagagaattagtgggaggtatttacttt5640ggtaagagaaaggaagacgatggtgatggtgtcgcttgggatagtgaacaatacaccgtt5700ccagaagtgcaaagaatcacaagaatggccgctttcatggccctacaacatgagccacca5760ttgcctatttggtccttggataaagctaatgttttggcctcttcaagattatggagaaaa5820actgtggaggaaaccatcaagaacgaattccctacattgaaggttcaacatcaattgatt5880gattctgccgccatgatcctagttaagaacccaacccacctaaatggtattataatcacc5940agcaacatgtttggtgatatcatctccgatgaagcctccgttatcccaggttccttgggt6000ttgttgccatctgcgtccttggcctctttgccagacaagaacaccgcatttggtttgtac6060gaaccatgccacggttctgctccagatttgccaaagaataaggtcaaccctatcgccact6120atcttgtctgctgcaatgatgttgaaattgtcattgaacttgcctgaagaaggtaaggcc6180attgaagatgcagttaaaaaggttttggatgcaggtatcagaactggtgatttaggtggt6240tccaacagtaccaccgaagtcggtgatgctgtcgccgaagaagttaagaaaatccttgct6300taaaaagattctctttttttatgatatttgtacataaactttataaatgaaattcataat6360agaaacgacacgaaattacaaaatggaatatgttcatagggtagacgaaactatatacgc6420aatctacatacatttatcaagaaggagaaaaaggaggatgtaaaggaatacaggtaagca6480aattgatactaatggctcaacgtgataaggaaaaagaattgcactttaacattaatattg6540acaaggaggagggcaccacacaaaaagttaggtgtaacagaaaatcatgaaactggccgg6600ccgatgctgtccgcgggcctcataagagttgtggtaacaacgcaggtgcgcgcatctgct6660aagtttaaacggtaccggcctcatgggccttccgctcactgcccgctttccagtcgggaa6720acctgtcgtgccagctgcattaacatggtcatagctgtttccttgcgtattgggcgctct6780ccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaaagcctggggtgccta6840atgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttttt6900ccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcg6960aaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctc7020tcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgt7080ggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaa7140gctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaacta7200tcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaa7260caggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaa7320ctacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttacctt7380cggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggttt7440ttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgat7500cttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcat7560gagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatc7620aatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggc7680acctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgta7740gataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgaga7800accacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcg7860cagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagc7920tagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcat7980cgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaag8040gcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgat8100cgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataa8160ttctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaa8220gtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacggga8280taataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggg8340gcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgc8400acccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacagg8460aaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatact8520cttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacat8580atttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagt8640gccac8645<210>62<211>10125<212>DNA<213>Artificial<220><223>pTT2-hmfN1<400>62ctcccccgggttagtcaaaaaattagccttttaattctgctgtaacccgtacatgcccaa60aatagggggcgggttacacagaatatataacatcgtaggtgtctgggtgaacagtttatt120cctggcatccactaaatataatggagcccgctttttaagctggcatccagaaaaaaaaag180aatcccagcaccaaaatattgttttcttcaccaaccatcagttcataggtccattctctt240agcgcaactacagagaacaggggcacaaacaggcaaaaaacgggcacaacctcaatggag300tgatgcaacctgcctggagtaaatgatgacacaaggcaattgacccacgcatgtatctat360ctcattttcttacaccttctattaccttctgctctctctgatttggaaaaagctgaaaaa420aaaggttgaaaccagttccctgaaattattcccctacttgactaataagtatataaagac480ggtaggtattgattgtaattctgtaaatctatttcttaaacttcttaaattctactttta540tagttagtcttttttttagttttaaaacaccaagaacttagtttcgaataaacacacata600aacaaacaaaaatgacccaaaccaatgtccacgtaaacaaatccgacacttccttagctg660ctccacaacaattattcatctccggtaaatatcaaaactctcaaagaaatggtacatttc720cagtcaaaaaccctatgactggtgaaacaatctatgaatgtgtttctgcatcattagatg780actacgctgctgctatagaagaagctgatgccgcacaaccatcatgggctagattaggtc840cttccgcaagaagattgattttgttaaaggccgctgatataatggaaacatacatcgaaa900ccgacgctccagcaatcttgagtgctgaagtttctgcaacaagaggttgggtcagagcca960atatattatctaccgctggtgttttcagagaaactgctgctttggcaacacatatcaaag1020gtgaaattgttccagctgatagacctggtactacaatcttagtttcaagagaaccagtcg1080gtgttgtcttggctatttccccttggaatatgcctgcaaccttaactgccagagctatct1140gttgccctttaatttgtggtaactctgtagttttaagaccatccgaattttctcctaaat1200ctcaacatttggtcgtaagagccttaacagaagctggtttgccagcaggttgcttgcaat1260tcttaccaacatcaaccgcagatacccctagagccatagaatttgctatcagacacccta1320aggttagtagagctaatttcactggttctgatagagtcggtagaattatagcaggtttat1380ccgccagttgtttgaaaccatgcgttttggaattgggtggtaaagcccctgttgtcgtat1440tagaagatgctgatgtcgaagctgctgttgaagcagttgtctacggtgccatgtctaact1500caggtcaaatttgtatgagtacagaaagagctatagttcatagatcattggccgctgatt1560ttaaagcattgttagtaaagagagccgaatcattaagagttggtaatcacttggaagatc1620cagacgttcaattgtcaggtttgtttactgctgcttccgcagaaagagtcttgggtttga1680ttaaaggtgctgtaaacgcaggtgccaccttgttagctggtgacttggcattacatggtc1740catgccaaactataatggctcctcacatcttaaccggtgttactagagatatggacttgt1800ttcatagagaaacattcggtccagtattgttcgttagtgaatttgatactgatgacgaag1860ctatagcacaagccaatgacacagaattttctttatgtgcttcagtattctccagagatg1920ttttgagagctatggataccgctaagagaataagaactggttcatgccacgtcaatggtc1980ctactgtatatatcgaagcaccattgcctaacggtggtgttggtggtggttctggttacg2040gtagatttggtggtgttgctggtattgaagagtttacagaaagacaaatagttagtttag2100ccaagccaggtatcaagtatgccttttagactagtgtgaatttactttaaatcttgcatt2160taaataaattttctttttatagctttatgacttagtttcaatttatatactattttaatg2220acattttcgattcattgattgaaagctttgtgttttttcttgatgcgctattgcattgtt2280cttgtctttttcgccacatgtaatatctgtagtagatacctgatacattgtggatgctga2340gtgaaattttagttaataatggaggcgctcttaataattttggggatattggcttttttt2400tttaaagtttacaaatgaattttttccgccaggatttaattaattgcagattccctttta2460tggattcctaaatcctcgaggagaacttctagtatatctacatacctaatattattgcct2520tattaaaaatggaatcccaacaattacatcaaaatccacattctcttcaaaatcaattgt2580cctgtacttccttgttcatgtgtgttcaaaaacgttatatttataggataattatactct2640atttctcaacaagtaattggttgtttggccgagcggtctaaggcgcctgattcaagaaat2700atcttgaccgcagttaactgtgggaatactcaggtatcgtaagatgcaagagttcgaatc2760tcttagcaaccattatttttttcctcaacataacgagaacacacaggggcgctatcgcac2820agaatcaaattcgatgactggaaattttttgttaatttcagaggtcgcctgacgcatata2880cctttttcaactgaaaaattgggagaaaaaggaaaggtgagagcgccggaaccggctttt2940catatagaatagagaagcgttcatgactaaatgcttgcatcacaatacttgaagttgaca3000atattatttaaggacctattgttttttccaataggtggttagcaatcgtcttactttcta3060acttttcttaccttttacatttcagcaatatatatatatatatttcaaggatataccatt3120ctaatgtctgcccctaagaagatcgtcgttttgccaggtgaccacgttggtcaagaaatc3180acagccgaagccattaaggttcttaaagctatttctgatgttcgttccaatgtcaagttc3240gatttcgaaaatcatttaattggtggtgctgctatcgatgctacaggtgttccacttcca3300gatgaggcgctggaagcctccaagaaggctgatgccgttttgttaggtgctgtgggtggt3360cctaaatggggtaccggtagtgttagacctgaacaaggtttactaaaaatccgtaaagaa3420cttcaattgtacgccaacttaagaccatgtaactttgcatccgactctcttttagactta3480tctccaatcaagccacaatttgctaaaggtactgacttcgttgttgtcagagaattagtg3540ggaggtatttactttggtaagagaaaggaagacgatggtgatggtgtcgcttgggatagt3600gaacaatacaccgttccagaagtgcaaagaatcacaagaatggccgctttcatggcccta3660caacatgagccaccattgcctatttggtccttggataaagctaatgttttggcctcttca3720agattatggagaaaaactgtggaggaaaccatcaagaacgaattccctacattgaaggtt3780caacatcaattgattgattctgccgccatgatcctagttaagaacccaacccacctaaat3840ggtattataatcaccagcaacatgtttggtgatatcatctccgatgaagcctccgttatc3900ccaggttccttgggtttgttgccatctgcgtccttggcctctttgccagacaagaacacc3960gcatttggtttgtacgaaccatgccacggttctgctccagatttgccaaagaataaggtc4020aaccctatcgccactatcttgtctgctgcaatgatgttgaaattgtcattgaacttgcct4080gaagaaggtaaggccattgaagatgcagttaaaaaggttttggatgcaggtatcagaact4140ggtgatttaggtggttccaacagtaccaccgaagtcggtgatgctgtcgccgaagaagtt4200aagaaaatccttgcttaaaaagattctctttttttatgatatttgtacataaactttata4260aatgaaattcataatagaaacgacacgaaattacaaaatggaatatgttcatagggtaga4320cgaaactatatacgcaatctacatacatttatcaagaaggagaaaaaggaggatgtaaag4380gaatacaggtaagcaaattgatactaatggctcaacgtgataaggaaaaagaattgcact4440ttaacattaatattgacaaggaggagggcaccacacaaaaagttaggtgtaacagaaaat4500catgaaactggccggccgatgctgtccgcgggcctcataagagttgtggtaacaacgcag4560gtgcgcgcatctgctaagtttaaacggtaccggcctcatgggccttccgctcactgcccg4620ctttccagtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgtttccttg4680cgtattgggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaa4740agcctggggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgc4800gttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctc4860aagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaag4920ctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttct4980cccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgta5040ggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgc5100cttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggc5160agcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttctt5220gaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgct5280gaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgc5340tggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctca5400agaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgtta5460agggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaa5520atgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatg5580cttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctg5640actccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgc5700aatgataccgcgagaaccacgctcaccggctccagatttatcagcaataaaccagccagc5760cggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaa5820ttgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgc5880cattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccgg5940ttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctc6000cttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttat6060ggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactgg6120tgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgccc6180ggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattgg6240aaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgat6300gtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgg6360gtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatg6420ttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtct6480catgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcac6540atttccccgaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcgcgtta6600aatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttat6660aaatcaaaagaatagaccgagatagggttgagtggccgctacagggcgctcccattcgcc6720attcaggctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgctattacgcc6780agctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttccc6840agtcacgacgttgtaaaacgacggccagtgagcgcgacgtaatacgactcactatagggc6900gaattggcggaaggccgtcaaggccggtaccggtccttttcatcacgtgctataaaaata6960attataatttaaattttttaatataaatatataaattaaaaatagaaagtaaaaaaagaa7020attaaagaaaaaatagtttttgttttccgaagatgtaaaagactctagggggatcgccaa7080caaatactaccttttatcttgctcttcctgctctcaggtattaatgccgaattgtttcat7140cttgtctgtgtagaagaccacacacgaaaatcctgtgattttacattttacttatcgtta7200atcgaatgtatatctatttaatctgcttttcttgtctaataaatatatatgtaaagtacg7260ctttttgttgaaattttttaaacctttgtttatttttttttcttcattccgtaactcttc7320taccttctttatttactttctaaaatccaaatacaaaacataaaaataaataaacacaga7380gtaaattcccaaattattccatcattaaaagatacgaggcgcgtgtaagttacaggcaag7440cgatccgtccgtttaaacatgctttctgaaaacacgactattctgatggctaacggtgaa7500attaaagacatcgcaaacggcgcgccgatttttataatgacgaaaaaaaaaaaattggaa7560agaaaaagcttaatgcggtagtttatcacagttaaattgctaacgcagtcaggcaccgtg7620tatgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctggatgctgtagg7680cataggcttggttatgccggtactgccgggcctcttgcgggatatcgtccattccgacag7740catcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaatttctatgcgc7800acccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgctcgcttcgct7860acttggagccactatcgactacgcgatcatggcgaccacacccgtcctgtggatcctcta7920cgccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctggcgcctatat7980cgccgacatcaccgatggggaagatcgggctcgccacttcgggctcatgagcgcttgttt8040cggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgccatctccttgca8100tgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccatatccg8160caatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacagcacca8220acagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaaactttttcct8280tccttcattcacgcacactactctctaatgagcaacggtatacggccttccttccagtta8340cttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaatagacctgcaa8400ttattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttc8460tgcacaatatttcaagctataccaagcatacaatcaaggaattcgagctaagcggccgcc8520catggaagctgcaatcaaatcactggtagcaatcttaagacaagaactgacgaacttccg8580tatcagttgtgtttatcctggtaattttgaaagcgaaggtttcactgtagagcagctaac8640gaaacccgaaattacaaagttgatcgaaggcccctcagacgctatcccatgcaaacaagc8700atgtgatatcattgccaagtcgctggccagaggtgatgatgacgtttttacagattttgt8760cggatggatgataatggggatggaccttgggctcaccgcaaagaaaagccgctttgttcc8820gttgcaatggatttttggtgtcctatcaaacattctggtcgtgccattctacacgcgtgt8880tattactgagtagtatttatttaagtattgtttgtgcacttgcctgcaggccttttgaaa8940agcaagcataaaagatctaaacataaaatctgtaaaataacaagatgtaaagataatgct9000aaatcatttggctttttgattgattgtacaggaaaatatacatcgcagggggttgacttt9060taccatttcaccgcaatggaatcaaacttgttgaagagaatgttcacaggcgcatacgct9120acaatgacccgattcttgctagccttttctcggtcttgcaaacaaccgccggcagcttct9180cgagccgcggaaccgccagatattcattacttgacgcaaaagcgtttgaaataatgacga9240aaaagaaggaagaaaaaaaaagaaaaataccgcttctaggcgggttatctactgatccga9300gcttccactaggatagcacccaaacacctgcatatttggacgacctttacttacaccacc9360aaaaaccactttcgcctctcccgcccctgataacgtccactaattgagcgattacctgag9420cggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgtaagtagcaacgtct9480caaggtcaaaactgtatggaaaccttgtcacctcacttaattctagctagcctaccctgc9540aagtcaagaggtctccgtgattcctagccacctcaaggtatgcctctccccggaaactgt9600ggccttttctggcacacatgatctccacgatttcaacatataaatagcttttgataatgg9660caatattaatcaaatttattttacttctttcttgtaacatctctcttgtaatcccttatt9720ccttctagctatttttcataaaaaaccaagcaactgcttatcaacacacaaacactaaat9780caaaatgcattcgcgaatatctagaatacacgtcatagaatgcgacgtcagcttttgatt9840aagccttctagtccaaaaaacacgtttttttgtcatttatttcattttcttagaatagtt9900tagtttattcattttatagtcacgaatgttttatgattctatatagggttgcaaacaagc9960atttttcattttatgttaaaacaatttcaggtttaccttttattctgcttgtggtgacgc10020gggtatccgcccgctcttttggtcacccatgtatttaattgcataaataattcttaaaag10080tggagctagtctatttctatttacatacctctcatttctcatttc10125<210>63<211>2017<212>DNA<213>Artificial<220><223>SyntheticfragmentcomprisinghmfL1codingsequence<400>63tgcaggcgcgcctgcggtagtttatcacagttaaattgctaacgcagtcaggcaccgtgt60atgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctggatgctgtaggc120ataggcttggttatgccggtactgccgggcctcttgcgggatatcgtccattccgacagc180atcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaatttctatgcgca240cccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgctcgcttcgcta300cttggagccactatcgactacgcgatcatggcgaccacacccgtcctgtggatcctctac360gccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctggcgcctatatc420gccgacatcaccgatggggaagatcgggctcgccacttcgggctcatgagcgcttgtttc480ggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgccatctccttgcat540gcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccatatccgc600aatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacagcaccaa660cagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaaactttttcctt720ccttcattcacgcacactactctctaatgagcaacggtatacggccttccttccagttac780ttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaatagacctgcaat840tattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttct900gcacaatatttcaagctataccaagcatacaatcaactatctcatacaaaaatgggttcc960ttatccttaccagaaacatcattagccgcaatccaagacaaagaaacaaaagctatctca1020gtcgccaaaagacctacaccagtacctgttggtacccaagtcttagtaaaattgcattat1080tccggtgtttgtgccactgatttgcacttagctagaggttctgttccatacttacaacct1140aaggtttcagtcggtggtcatgaaggtaccggtgttattgcttctttgggtccagatgtc1200gacgcagcagaatggcatgtaggtgacagagtagcagttagatgggtacacatagtttgt1260ggtaaatgcgaagtttgtactacaggtttcgaaaatttgtgccaatctagaaagttggct1320ggtaaagatgttgaaggtactttcgccgaatatgcaattgccgactcttcatacatggtt1380agattaccagctggtgtctcagatgcagacgccgctcctatcttgtgtgctggtgtcaca1440gtatacaaagccttgaagatcgcttctttgagagcaggttcatgggttgctgtcgcaggt1500gctggtggtggtttaggtcatttggcaatccaatatgctagagcaatgggtttaaaagtt1560gtcgcattggatgccagaaagagagacttgtgcttatccttgggtgctgaaagttacatc1620gacgttttagaaactgatgactgtgtcgcacaagtaattaaagttacagatggtggtgct1680cacggtgcattaatatgcgcttccagtggtcaagcctacgatgacgctgttaaatttttg1740agatggaccggtactttagtctgtataggtttgccacctaagccaacattgttatcctta1800ggtcctgctgattttgtagccagaggtatcaaggttatgggtacaagtaccggtgacaga1860caagacacagttgaagccttggctttcgtcgctaaaggtcaagtaaagcctcaattaacc1920gaaagaagattggaagatgttgaagaaatcttaaaggaaatagaaaatggtacaatgcaa1980ggtaaagccgtaatcagaatcgcatagacgcgttgca2017<210>64<211>10774<212>DNA<213>Artificial<220><223>pTT2-hmfLN1-hmfL1<400>64cgcgtgttattactgagtagtatttatttaagtattgtttgtgcacttgcctgcaggcct60tttgaaaagcaagcataaaagatctaaacataaaatctgtaaaataacaagatgtaaaga120taatgctaaatcatttggctttttgattgattgtacaggaaaatatacatcgcagggggt180tgacttttaccatttcaccgcaatggaatcaaacttgttgaagagaatgttcacaggcgc240atacgctacaatgacccgattcttgctagccttttctcggtcttgcaaacaaccgccggc300agcttctcgagccgcggaaccgccagatattcattacttgacgcaaaagcgtttgaaata360atgacgaaaaagaaggaagaaaaaaaaagaaaaataccgcttctaggcgggttatctact420gatccgagcttccactaggatagcacccaaacacctgcatatttggacgacctttactta480caccaccaaaaaccactttcgcctctcccgcccctgataacgtccactaattgagcgatt540acctgagcggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgtaagtagc600aacgtctcaaggtcaaaactgtatggaaaccttgtcacctcacttaattctagctagcct660accctgcaagtcaagaggtctccgtgattcctagccacctcaaggtatgcctctccccgg720aaactgtggccttttctggcacacatgatctccacgatttcaacatataaatagcttttg780ataatggcaatattaatcaaatttattttacttctttcttgtaacatctctcttgtaatc840ccttattccttctagctatttttcataaaaaaccaagcaactgcttatcaacacacaaac900actaaatcaaaatgcattcgcgaatatctagaatacacgtcatagaatgcgacgtcagct960tttgattaagccttctagtccaaaaaacacgtttttttgtcatttatttcattttcttag1020aatagtttagtttattcattttatagtcacgaatgttttatgattctatatagggttgca1080aacaagcatttttcattttatgttaaaacaatttcaggtttaccttttattctgcttgtg1140gtgacgcgggtatccgcccgctcttttggtcacccatgtatttaattgcataaataattc1200ttaaaagtggagctagtctatttctatttacatacctctcatttctcatttcctcccccg1260ggttagtcaaaaaattagccttttaattctgctgtaacccgtacatgcccaaaatagggg1320gcgggttacacagaatatataacatcgtaggtgtctgggtgaacagtttattcctggcat1380ccactaaatataatggagcccgctttttaagctggcatccagaaaaaaaaagaatcccag1440caccaaaatattgttttcttcaccaaccatcagttcataggtccattctcttagcgcaac1500tacagagaacaggggcacaaacaggcaaaaaacgggcacaacctcaatggagtgatgcaa1560cctgcctggagtaaatgatgacacaaggcaattgacccacgcatgtatctatctcatttt1620cttacaccttctattaccttctgctctctctgatttggaaaaagctgaaaaaaaaggttg1680aaaccagttccctgaaattattcccctacttgactaataagtatataaagacggtaggta1740ttgattgtaattctgtaaatctatttcttaaacttcttaaattctacttttatagttagt1800cttttttttagttttaaaacaccaagaacttagtttcgaataaacacacataaacaaaca1860aaaatgacccaaaccaatgtccacgtaaacaaatccgacacttccttagctgctccacaa1920caattattcatctccggtaaatatcaaaactctcaaagaaatggtacatttccagtcaaa1980aaccctatgactggtgaaacaatctatgaatgtgtttctgcatcattagatgactacgct2040gctgctatagaagaagctgatgccgcacaaccatcatgggctagattaggtccttccgca2100agaagattgattttgttaaaggccgctgatataatggaaacatacatcgaaaccgacgct2160ccagcaatcttgagtgctgaagtttctgcaacaagaggttgggtcagagccaatatatta2220tctaccgctggtgttttcagagaaactgctgctttggcaacacatatcaaaggtgaaatt2280gttccagctgatagacctggtactacaatcttagtttcaagagaaccagtcggtgttgtc2340ttggctatttccccttggaatatgcctgcaaccttaactgccagagctatctgttgccct2400ttaatttgtggtaactctgtagttttaagaccatccgaattttctcctaaatctcaacat2460ttggtcgtaagagccttaacagaagctggtttgccagcaggttgcttgcaattcttacca2520acatcaaccgcagatacccctagagccatagaatttgctatcagacaccctaaggttagt2580agagctaatttcactggttctgatagagtcggtagaattatagcaggtttatccgccagt2640tgtttgaaaccatgcgttttggaattgggtggtaaagcccctgttgtcgtattagaagat2700gctgatgtcgaagctgctgttgaagcagttgtctacggtgccatgtctaactcaggtcaa2760atttgtatgagtacagaaagagctatagttcatagatcattggccgctgattttaaagca2820ttgttagtaaagagagccgaatcattaagagttggtaatcacttggaagatccagacgtt2880caattgtcaggtttgtttactgctgcttccgcagaaagagtcttgggtttgattaaaggt2940gctgtaaacgcaggtgccaccttgttagctggtgacttggcattacatggtccatgccaa3000actataatggctcctcacatcttaaccggtgttactagagatatggacttgtttcataga3060gaaacattcggtccagtattgttcgttagtgaatttgatactgatgacgaagctatagca3120caagccaatgacacagaattttctttatgtgcttcagtattctccagagatgttttgaga3180gctatggataccgctaagagaataagaactggttcatgccacgtcaatggtcctactgta3240tatatcgaagcaccattgcctaacggtggtgttggtggtggttctggttacggtagattt3300ggtggtgttgctggtattgaagagtttacagaaagacaaatagttagtttagccaagcca3360ggtatcaagtatgccttttagactagtgtgaatttactttaaatcttgcatttaaataaa3420ttttctttttatagctttatgacttagtttcaatttatatactattttaatgacattttc3480gattcattgattgaaagctttgtgttttttcttgatgcgctattgcattgttcttgtctt3540tttcgccacatgtaatatctgtagtagatacctgatacattgtggatgctgagtgaaatt3600ttagttaataatggaggcgctcttaataattttggggatattggcttttttttttaaagt3660ttacaaatgaattttttccgccaggatttaattaattgcagattcccttttatggattcc3720taaatcctcgaggagaacttctagtatatctacatacctaatattattgccttattaaaa3780atggaatcccaacaattacatcaaaatccacattctcttcaaaatcaattgtcctgtact3840tccttgttcatgtgtgttcaaaaacgttatatttataggataattatactctatttctca3900acaagtaattggttgtttggccgagcggtctaaggcgcctgattcaagaaatatcttgac3960cgcagttaactgtgggaatactcaggtatcgtaagatgcaagagttcgaatctcttagca4020accattatttttttcctcaacataacgagaacacacaggggcgctatcgcacagaatcaa4080attcgatgactggaaattttttgttaatttcagaggtcgcctgacgcatatacctttttc4140aactgaaaaattgggagaaaaaggaaaggtgagagcgccggaaccggcttttcatataga4200atagagaagcgttcatgactaaatgcttgcatcacaatacttgaagttgacaatattatt4260taaggacctattgttttttccaataggtggttagcaatcgtcttactttctaacttttct4320taccttttacatttcagcaatatatatatatatatttcaaggatataccattctaatgtc4380tgcccctaagaagatcgtcgttttgccaggtgaccacgttggtcaagaaatcacagccga4440agccattaaggttcttaaagctatttctgatgttcgttccaatgtcaagttcgatttcga4500aaatcatttaattggtggtgctgctatcgatgctacaggtgttccacttccagatgaggc4560gctggaagcctccaagaaggctgatgccgttttgttaggtgctgtgggtggtcctaaatg4620gggtaccggtagtgttagacctgaacaaggtttactaaaaatccgtaaagaacttcaatt4680gtacgccaacttaagaccatgtaactttgcatccgactctcttttagacttatctccaat4740caagccacaatttgctaaaggtactgacttcgttgttgtcagagaattagtgggaggtat4800ttactttggtaagagaaaggaagacgatggtgatggtgtcgcttgggatagtgaacaata4860caccgttccagaagtgcaaagaatcacaagaatggccgctttcatggccctacaacatga4920gccaccattgcctatttggtccttggataaagctaatgttttggcctcttcaagattatg4980gagaaaaactgtggaggaaaccatcaagaacgaattccctacattgaaggttcaacatca5040attgattgattctgccgccatgatcctagttaagaacccaacccacctaaatggtattat5100aatcaccagcaacatgtttggtgatatcatctccgatgaagcctccgttatcccaggttc5160cttgggtttgttgccatctgcgtccttggcctctttgccagacaagaacaccgcatttgg5220tttgtacgaaccatgccacggttctgctccagatttgccaaagaataaggtcaaccctat5280cgccactatcttgtctgctgcaatgatgttgaaattgtcattgaacttgcctgaagaagg5340taaggccattgaagatgcagttaaaaaggttttggatgcaggtatcagaactggtgattt5400aggtggttccaacagtaccaccgaagtcggtgatgctgtcgccgaagaagttaagaaaat5460ccttgcttaaaaagattctctttttttatgatatttgtacataaactttataaatgaaat5520tcataatagaaacgacacgaaattacaaaatggaatatgttcatagggtagacgaaacta5580tatacgcaatctacatacatttatcaagaaggagaaaaaggaggatgtaaaggaatacag5640gtaagcaaattgatactaatggctcaacgtgataaggaaaaagaattgcactttaacatt5700aatattgacaaggaggagggcaccacacaaaaagttaggtgtaacagaaaatcatgaaac5760tggccggccgatgctgtccgcgggcctcataagagttgtggtaacaacgcaggtgcgcgc5820atctgctaagtttaaacggtaccggcctcatgggccttccgctcactgcccgctttccag5880tcgggaaacctgtcgtgccagctgcattaacatggtcatagctgtttccttgcgtattgg5940gcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaaagcctggg6000gtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctgg6060cgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcaga6120ggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcg6180tgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgg6240gaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttc6300gctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccg6360gtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagcca6420ctggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggt6480ggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccag6540ttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcg6600gtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatc6660ctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattt6720tggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagtt6780ttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatca6840gtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccg6900tcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgatac6960cgcgagaaccacgctcaccggctccagatttatcagcaataaaccagccagccggaaggg7020ccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgcc7080gggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgcta7140caggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaac7200gatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtc7260ctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcac7320tgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtact7380caaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaa7440tacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgtt7500cttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaaccca7560ctcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaa7620aaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatac7680tcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcg7740gatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttcccc7800gaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttg7860ttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaa7920agaatagaccgagatagggttgagtggccgctacagggcgctcccattcgccattcaggc7980tgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgctattacgccagctggcg8040aaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacga8100cgttgtaaaacgacggccagtgagcgcgacgtaatacgactcactatagggcgaattggc8160ggaaggccgtcaaggccggtaccggtccttttcatcacgtgctataaaaataattataat8220ttaaattttttaatataaatatataaattaaaaatagaaagtaaaaaaagaaattaaaga8280aaaaatagtttttgttttccgaagatgtaaaagactctagggggatcgccaacaaatact8340accttttatcttgctcttcctgctctcaggtattaatgccgaattgtttcatcttgtctg8400tgtagaagaccacacacgaaaatcctgtgattttacattttacttatcgttaatcgaatg8460tatatctatttaatctgcttttcttgtctaataaatatatatgtaaagtacgctttttgt8520tgaaattttttaaacctttgtttatttttttttcttcattccgtaactcttctaccttct8580ttatttactttctaaaatccaaatacaaaacataaaaataaataaacacagagtaaattc8640ccaaattattccatcattaaaagatacgaggcgcgtgtaagttacaggcaagcgatccgt8700ccgtttaaacatgctttctgaaaacacgactattctgatggctaacggtgaaattaaaga8760catcgcaaacggcgcgcctgcggtagtttatcacagttaaattgctaacgcagtcaggca8820ccgtgtatgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctggatgct8880gtaggcataggcttggttatgccggtactgccgggcctcttgcgggatatcgtccattcc8940gacagcatcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaatttcta9000tgcgcacccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgctcgct9060tcgctacttggagccactatcgactacgcgatcatggcgaccacacccgtcctgtggatc9120ctctacgccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctggcgcc9180tatatcgccgacatcaccgatggggaagatcgggctcgccacttcgggctcatgagcgct9240tgtttcggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgccatctcc9300ttgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccat9360atccgcaatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacag9420caccaacagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaaacttt9480ttccttccttcattcacgcacactactctctaatgagcaacggtatacggccttccttcc9540agttacttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaatagacc9600tgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttct9660ttttctgcacaatatttcaagctataccaagcatacaatcaactatctcatacaaaaatg9720ggttccttatccttaccagaaacatcattagccgcaatccaagacaaagaaacaaaagct9780atctcagtcgccaaaagacctacaccagtacctgttggtacccaagtcttagtaaaattg9840cattattccggtgtttgtgccactgatttgcacttagctagaggttctgttccatactta9900caacctaaggtttcagtcggtggtcatgaaggtaccggtgttattgcttctttgggtcca9960gatgtcgacgcagcagaatggcatgtaggtgacagagtagcagttagatgggtacacata10020gtttgtggtaaatgcgaagtttgtactacaggtttcgaaaatttgtgccaatctagaaag10080ttggctggtaaagatgttgaaggtactttcgccgaatatgcaattgccgactcttcatac10140atggttagattaccagctggtgtctcagatgcagacgccgctcctatcttgtgtgctggt10200gtcacagtatacaaagccttgaagatcgcttctttgagagcaggttcatgggttgctgtc10260gcaggtgctggtggtggtttaggtcatttggcaatccaatatgctagagcaatgggttta10320aaagttgtcgcattggatgccagaaagagagacttgtgcttatccttgggtgctgaaagt10380tacatcgacgttttagaaactgatgactgtgtcgcacaagtaattaaagttacagatggt10440ggtgctcacggtgcattaatatgcgcttccagtggtcaagcctacgatgacgctgttaaa10500tttttgagatggaccggtactttagtctgtataggtttgccacctaagccaacattgtta10560tccttaggtcctgctgattttgtagccagaggtatcaaggttatgggtacaagtaccggt10620gacagacaagacacagttgaagccttggctttcgtcgctaaaggtcaagtaaagcctcaa10680ttaaccgaaagaagattggaagatgttgaagaaatcttaaaggaaatagaaaatggtaca10740atgcaaggtaaagccgtaatcagaatcgcataga10774<210>65<211>1648<212>DNA<213>Artificial<220><223>syntheticDNAcomprisinghmfL2codingsequenceforexpressioninyeast<400>65gccggcagcttctcgagccgcggaaccgccagatattcattacttgacgcaaaagcgttt60gaaataatgacgaaaaagaaggaagaaaaaaaaagaaaaataccgcttctaggcgggtta120tctactgatccgagcttccactaggatagcacccaaacacctgcatatttggacgacctt180tacttacaccaccaaaaaccactttcgcctctcccgcccctgataacgtccactaattga240gcgattacctgagcggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgta300agtagcaacgtctcaaggtcaaaactgtatggaaaccttgtcacctcacttaattctagc360tagcctaccctgcaagtcaagaggtctccgtgattcctagccacctcaaggtatgcctct420ccccggaaactgtggccttttctggcacacatgatctccacgatttcaacatataaatag480cttttgataatggcaatattaatcaaatttattttacttctttcttgtaacatctctctt540gtaatcccttattccttctagctatttttcataaaaaaccaagcaactgcttatcaacac600acaaacactaaatcaaaaatgagtttgccatcccactacaagagagccgcttttaaggaa660gcaggtggtccattgactattgaagaagttgatttgactatgccagatgccggtgaagtc720ttggtaaaagttgaagcttgtggtgtatgcttttcagacactgttcctcaagctcatggt780ttgggtggtaaattcccaatcgttcctggtcatgaaattataggtcacgttgtcgcaaca840ggtgacggtgtttccgactgggaagtcggtgacagaattggtgaaggttggcatggtggt900cacgacggtacatgtccatcatgcagacaaggtcatttccaaatgtgtgataaccaatcc960ataaacggtgttaccaaaaatggtggttatgctcaatactgcattttgagaagtgaagca1020gcagtcagaatacctactcacgtatctgccgctgaatatgcaccaattttatgtgccggt1080gtcaccgtttttaattcaatgagacaaatcggtgttaagcctggttccactgtcgcaatt1140caaggtttgggtggtttaggtcatttggccattcaatatgctaacagatttggtttcaga1200gtagttgctatatctagagatgaccaaaaggaaagattcgttagagatttgggtgcacac1260gaatacattaatacatctgaagaagatgtcggttcagctttacaaaagttgggtggtgca1320agtttaatagttgcaaccgccccaaacgctagagcaatctctcctttgttaaaaggttta1380agaccattgggtaaattgttgatcttggctgttccaggtgaaatccctttagataccaga1440ttgatggtagcaagaggtttatccgttcatggttggccaagtggtcacgccttggattct1500gaagaaactataagattcacagaattagaagatatcaagtgtatgatacaaacttactca1560ttagacagagctaacgaagcctttgacgctatgatttcaggttcagttagattcagagca1620gttattacaatggaataggacgtcagct1648<210>66<211>11107<212>DNA<213>Artificial<220><223>pTT2-hmfN1-hmfL2<400>66aggtcaaaactgtatggaaaccttgtcacctcacttaattctagctagcctaccctgcaa60gtcaagaggtctccgtgattcctagccacctcaaggtatgcctctccccggaaactgtgg120ccttttctggcacacatgatctccacgatttcaacatataaatagcttttgataatggca180atattaatcaaatttattttacttctttcttgtaacatctctcttgtaatcccttattcc240ttctagctatttttcataaaaaaccaagcaactgcttatcaacacacaaacactaaatca300aaaatgagtttgccatcccactacaagagagccgcttttaaggaagcaggtggtccattg360actattgaagaagttgatttgactatgccagatgccggtgaagtcttggtaaaagttgaa420gcttgtggtgtatgcttttcagacactgttcctcaagctcatggtttgggtggtaaattc480ccaatcgttcctggtcatgaaattataggtcacgttgtcgcaacaggtgacggtgtttcc540gactgggaagtcggtgacagaattggtgaaggttggcatggtggtcacgacggtacatgt600ccatcatgcagacaaggtcatttccaaatgtgtgataaccaatccataaacggtgttacc660aaaaatggtggttatgctcaatactgcattttgagaagtgaagcagcagtcagaatacct720actcacgtatctgccgctgaatatgcaccaattttatgtgccggtgtcaccgtttttaat780tcaatgagacaaatcggtgttaagcctggttccactgtcgcaattcaaggtttgggtggt840ttaggtcatttggccattcaatatgctaacagatttggtttcagagtagttgctatatct900agagatgaccaaaaggaaagattcgttagagatttgggtgcacacgaatacattaataca960tctgaagaagatgtcggttcagctttacaaaagttgggtggtgcaagtttaatagttgca1020accgccccaaacgctagagcaatctctcctttgttaaaaggtttaagaccattgggtaaa1080ttgttgatcttggctgttccaggtgaaatccctttagataccagattgatggtagcaaga1140ggtttatccgttcatggttggccaagtggtcacgccttggattctgaagaaactataaga1200ttcacagaattagaagatatcaagtgtatgatacaaacttactcattagacagagctaac1260gaagcctttgacgctatgatttcaggttcagttagattcagagcagttattacaatggaa1320taggacgtcagcttttgattaagccttctagtccaaaaaacacgtttttttgtcatttat1380ttcattttcttagaatagtttagtttattcattttatagtcacgaatgttttatgattct1440atatagggttgcaaacaagcatttttcattttatgttaaaacaatttcaggtttaccttt1500tattctgcttgtggtgacgcgggtatccgcccgctcttttggtcacccatgtatttaatt1560gcataaataattcttaaaagtggagctagtctatttctatttacatacctctcatttctc1620atttcctcccccgggttagtcaaaaaattagccttttaattctgctgtaacccgtacatg1680cccaaaatagggggcgggttacacagaatatataacatcgtaggtgtctgggtgaacagt1740ttattcctggcatccactaaatataatggagcccgctttttaagctggcatccagaaaaa1800aaaagaatcccagcaccaaaatattgttttcttcaccaaccatcagttcataggtccatt1860ctcttagcgcaactacagagaacaggggcacaaacaggcaaaaaacgggcacaacctcaa1920tggagtgatgcaacctgcctggagtaaatgatgacacaaggcaattgacccacgcatgta1980tctatctcattttcttacaccttctattaccttctgctctctctgatttggaaaaagctg2040aaaaaaaaggttgaaaccagttccctgaaattattcccctacttgactaataagtatata2100aagacggtaggtattgattgtaattctgtaaatctatttcttaaacttcttaaattctac2160ttttatagttagtcttttttttagttttaaaacaccaagaacttagtttcgaataaacac2220acataaacaaacaaaaatgacccaaaccaatgtccacgtaaacaaatccgacacttcctt2280agctgctccacaacaattattcatctccggtaaatatcaaaactctcaaagaaatggtac2340atttccagtcaaaaaccctatgactggtgaaacaatctatgaatgtgtttctgcatcatt2400agatgactacgctgctgctatagaagaagctgatgccgcacaaccatcatgggctagatt2460aggtccttccgcaagaagattgattttgttaaaggccgctgatataatggaaacatacat2520cgaaaccgacgctccagcaatcttgagtgctgaagtttctgcaacaagaggttgggtcag2580agccaatatattatctaccgctggtgttttcagagaaactgctgctttggcaacacatat2640caaaggtgaaattgttccagctgatagacctggtactacaatcttagtttcaagagaacc2700agtcggtgttgtcttggctatttccccttggaatatgcctgcaaccttaactgccagagc2760tatctgttgccctttaatttgtggtaactctgtagttttaagaccatccgaattttctcc2820taaatctcaacatttggtcgtaagagccttaacagaagctggtttgccagcaggttgctt2880gcaattcttaccaacatcaaccgcagatacccctagagccatagaatttgctatcagaca2940ccctaaggttagtagagctaatttcactggttctgatagagtcggtagaattatagcagg3000tttatccgccagttgtttgaaaccatgcgttttggaattgggtggtaaagcccctgttgt3060cgtattagaagatgctgatgtcgaagctgctgttgaagcagttgtctacggtgccatgtc3120taactcaggtcaaatttgtatgagtacagaaagagctatagttcatagatcattggccgc3180tgattttaaagcattgttagtaaagagagccgaatcattaagagttggtaatcacttgga3240agatccagacgttcaattgtcaggtttgtttactgctgcttccgcagaaagagtcttggg3300tttgattaaaggtgctgtaaacgcaggtgccaccttgttagctggtgacttggcattaca3360tggtccatgccaaactataatggctcctcacatcttaaccggtgttactagagatatgga3420cttgtttcatagagaaacattcggtccagtattgttcgttagtgaatttgatactgatga3480cgaagctatagcacaagccaatgacacagaattttctttatgtgcttcagtattctccag3540agatgttttgagagctatggataccgctaagagaataagaactggttcatgccacgtcaa3600tggtcctactgtatatatcgaagcaccattgcctaacggtggtgttggtggtggttctgg3660ttacggtagatttggtggtgttgctggtattgaagagtttacagaaagacaaatagttag3720tttagccaagccaggtatcaagtatgccttttagactagtgtgaatttactttaaatctt3780gcatttaaataaattttctttttatagctttatgacttagtttcaatttatatactattt3840taatgacattttcgattcattgattgaaagctttgtgttttttcttgatgcgctattgca3900ttgttcttgtctttttcgccacatgtaatatctgtagtagatacctgatacattgtggat3960gctgagtgaaattttagttaataatggaggcgctcttaataattttggggatattggctt4020ttttttttaaagtttacaaatgaattttttccgccaggatttaattaattgcagattccc4080ttttatggattcctaaatcctcgaggagaacttctagtatatctacatacctaatattat4140tgccttattaaaaatggaatcccaacaattacatcaaaatccacattctcttcaaaatca4200attgtcctgtacttccttgttcatgtgtgttcaaaaacgttatatttataggataattat4260actctatttctcaacaagtaattggttgtttggccgagcggtctaaggcgcctgattcaa4320gaaatatcttgaccgcagttaactgtgggaatactcaggtatcgtaagatgcaagagttc4380gaatctcttagcaaccattatttttttcctcaacataacgagaacacacaggggcgctat4440cgcacagaatcaaattcgatgactggaaattttttgttaatttcagaggtcgcctgacgc4500atatacctttttcaactgaaaaattgggagaaaaaggaaaggtgagagcgccggaaccgg4560cttttcatatagaatagagaagcgttcatgactaaatgcttgcatcacaatacttgaagt4620tgacaatattatttaaggacctattgttttttccaataggtggttagcaatcgtcttact4680ttctaacttttcttaccttttacatttcagcaatatatatatatatatttcaaggatata4740ccattctaatgtctgcccctaagaagatcgtcgttttgccaggtgaccacgttggtcaag4800aaatcacagccgaagccattaaggttcttaaagctatttctgatgttcgttccaatgtca4860agttcgatttcgaaaatcatttaattggtggtgctgctatcgatgctacaggtgttccac4920ttccagatgaggcgctggaagcctccaagaaggctgatgccgttttgttaggtgctgtgg4980gtggtcctaaatggggtaccggtagtgttagacctgaacaaggtttactaaaaatccgta5040aagaacttcaattgtacgccaacttaagaccatgtaactttgcatccgactctcttttag5100acttatctccaatcaagccacaatttgctaaaggtactgacttcgttgttgtcagagaat5160tagtgggaggtatttactttggtaagagaaaggaagacgatggtgatggtgtcgcttggg5220atagtgaacaatacaccgttccagaagtgcaaagaatcacaagaatggccgctttcatgg5280ccctacaacatgagccaccattgcctatttggtccttggataaagctaatgttttggcct5340cttcaagattatggagaaaaactgtggaggaaaccatcaagaacgaattccctacattga5400aggttcaacatcaattgattgattctgccgccatgatcctagttaagaacccaacccacc5460taaatggtattataatcaccagcaacatgtttggtgatatcatctccgatgaagcctccg5520ttatcccaggttccttgggtttgttgccatctgcgtccttggcctctttgccagacaaga5580acaccgcatttggtttgtacgaaccatgccacggttctgctccagatttgccaaagaata5640aggtcaaccctatcgccactatcttgtctgctgcaatgatgttgaaattgtcattgaact5700tgcctgaagaaggtaaggccattgaagatgcagttaaaaaggttttggatgcaggtatca5760gaactggtgatttaggtggttccaacagtaccaccgaagtcggtgatgctgtcgccgaag5820aagttaagaaaatccttgcttaaaaagattctctttttttatgatatttgtacataaact5880ttataaatgaaattcataatagaaacgacacgaaattacaaaatggaatatgttcatagg5940gtagacgaaactatatacgcaatctacatacatttatcaagaaggagaaaaaggaggatg6000taaaggaatacaggtaagcaaattgatactaatggctcaacgtgataaggaaaaagaatt6060gcactttaacattaatattgacaaggaggagggcaccacacaaaaagttaggtgtaacag6120aaaatcatgaaactggccggccgatgctgtccgcgggcctcataagagttgtggtaacaa6180cgcaggtgcgcgcatctgctaagtttaaacggtaccggcctcatgggccttccgctcact6240gcccgctttccagtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgttt6300ccttgcgtattgggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcg6360ggtaaagcctggggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaag6420gccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcga6480cgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccct6540ggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcc6600tttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcg6660gtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgc6720tgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgcca6780ctggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagag6840ttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgct6900ctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaacc6960accgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaagga7020tctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactca7080cgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaat7140taaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttac7200caatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagtt7260gcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagt7320gctgcaatgataccgcgagaaccacgctcaccggctccagatttatcagcaataaaccag7380ccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtct7440attaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgtt7500gttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagc7560tccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggtt7620agctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatg7680gttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtg7740actggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctct7800tgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatc7860attggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagt7920tcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtt7980tctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacgg8040aaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttat8100tgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccg8160cgcacatttccccgaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcg8220cgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcc8280cttataaatcaaaagaatagaccgagatagggttgagtggccgctacagggcgctcccat8340tcgccattcaggctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgctatt8400acgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggtt8460ttcccagtcacgacgttgtaaaacgacggccagtgagcgcgacgtaatacgactcactat8520agggcgaattggcggaaggccgtcaaggccggtaccggtccttttcatcacgtgctataa8580aaataattataatttaaattttttaatataaatatataaattaaaaatagaaagtaaaaa8640aagaaattaaagaaaaaatagtttttgttttccgaagatgtaaaagactctagggggatc8700gccaacaaatactaccttttatcttgctcttcctgctctcaggtattaatgccgaattgt8760ttcatcttgtctgtgtagaagaccacacacgaaaatcctgtgattttacattttacttat8820cgttaatcgaatgtatatctatttaatctgcttttcttgtctaataaatatatatgtaaa8880gtacgctttttgttgaaattttttaaacctttgtttatttttttttcttcattccgtaac8940tcttctaccttctttatttactttctaaaatccaaatacaaaacataaaaataaataaac9000acagagtaaattcccaaattattccatcattaaaagatacgaggcgcgtgtaagttacag9060gcaagcgatccgtccgtttaaacatgctttctgaaaacacgactattctgatggctaacg9120gtgaaattaaagacatcgcaaacggcgcgccgatttttataatgacgaaaaaaaaaaaat9180tggaaagaaaaagcttaatgcggtagtttatcacagttaaattgctaacgcagtcaggca9240ccgtgtatgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctggatgct9300gtaggcataggcttggttatgccggtactgccgggcctcttgcgggatatcgtccattcc9360gacagcatcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaatttcta9420tgcgcacccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgctcgct9480tcgctacttggagccactatcgactacgcgatcatggcgaccacacccgtcctgtggatc9540ctctacgccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctggcgcc9600tatatcgccgacatcaccgatggggaagatcgggctcgccacttcgggctcatgagcgct9660tgtttcggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgccatctcc9720ttgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcaccat9780atccgcaatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacag9840caccaacagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaaacttt9900ttccttccttcattcacgcacactactctctaatgagcaacggtatacggccttccttcc9960agttacttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaatagacc10020tgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttct10080ttttctgcacaatatttcaagctataccaagcatacaatcaaggaattcgagctaagcgg10140ccgcccatggaagctgcaatcaaatcactggtagcaatcttaagacaagaactgacgaac10200ttccgtatcagttgtgtttatcctggtaattttgaaagcgaaggtttcactgtagagcag10260ctaacgaaacccgaaattacaaagttgatcgaaggcccctcagacgctatcccatgcaaa10320caagcatgtgatatcattgccaagtcgctggccagaggtgatgatgacgtttttacagat10380tttgtcggatggatgataatggggatggaccttgggctcaccgcaaagaaaagccgcttt10440gttccgttgcaatggatttttggtgtcctatcaaacattctggtcgtgccattctacacg10500cgtgttattactgagtagtatttatttaagtattgtttgtgcacttgcctgcaggccttt10560tgaaaagcaagcataaaagatctaaacataaaatctgtaaaataacaagatgtaaagata10620atgctaaatcatttggctttttgattgattgtacaggaaaatatacatcgcagggggttg10680acttttaccatttcaccgcaatggaatcaaacttgttgaagagaatgttcacaggcgcat10740acgctacaatgacccgattcttgctagccttttctcggtcttgcaaacaaccgccggcag10800cttctcgagccgcggaaccgccagatattcattacttgacgcaaaagcgtttgaaataat10860gacgaaaaagaaggaagaaaaaaaaagaaaaataccgcttctaggcgggttatctactga10920tccgagcttccactaggatagcacccaaacacctgcatatttggacgacctttacttaca10980ccaccaaaaaccactttcgcctctcccgcccctgataacgtccactaattgagcgattac11040ctgagcggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgtaagtagcaa11100cgtctca11107<210>67<211>11756<212>DNA<213>Artificial<220><223>pTT2-hmfN1-hmfL1-hmfL2<400>67cagcttttgattaagccttctagtccaaaaaacacgtttttttgtcatttatttcatttt60cttagaatagtttagtttattcattttatagtcacgaatgttttatgattctatataggg120ttgcaaacaagcatttttcattttatgttaaaacaatttcaggtttaccttttattctgc180ttgtggtgacgcgggtatccgcccgctcttttggtcacccatgtatttaattgcataaat240aattcttaaaagtggagctagtctatttctatttacatacctctcatttctcatttcctc300ccccgggttagtcaaaaaattagccttttaattctgctgtaacccgtacatgcccaaaat360agggggcgggttacacagaatatataacatcgtaggtgtctgggtgaacagtttattcct420ggcatccactaaatataatggagcccgctttttaagctggcatccagaaaaaaaaagaat480cccagcaccaaaatattgttttcttcaccaaccatcagttcataggtccattctcttagc540gcaactacagagaacaggggcacaaacaggcaaaaaacgggcacaacctcaatggagtga600tgcaacctgcctggagtaaatgatgacacaaggcaattgacccacgcatgtatctatctc660attttcttacaccttctattaccttctgctctctctgatttggaaaaagctgaaaaaaaa720ggttgaaaccagttccctgaaattattcccctacttgactaataagtatataaagacggt780aggtattgattgtaattctgtaaatctatttcttaaacttcttaaattctacttttatag840ttagtcttttttttagttttaaaacaccaagaacttagtttcgaataaacacacataaac900aaacaaaaatgacccaaaccaatgtccacgtaaacaaatccgacacttccttagctgctc960cacaacaattattcatctccggtaaatatcaaaactctcaaagaaatggtacatttccag1020tcaaaaaccctatgactggtgaaacaatctatgaatgtgtttctgcatcattagatgact1080acgctgctgctatagaagaagctgatgccgcacaaccatcatgggctagattaggtcctt1140ccgcaagaagattgattttgttaaaggccgctgatataatggaaacatacatcgaaaccg1200acgctccagcaatcttgagtgctgaagtttctgcaacaagaggttgggtcagagccaata1260tattatctaccgctggtgttttcagagaaactgctgctttggcaacacatatcaaaggtg1320aaattgttccagctgatagacctggtactacaatcttagtttcaagagaaccagtcggtg1380ttgtcttggctatttccccttggaatatgcctgcaaccttaactgccagagctatctgtt1440gccctttaatttgtggtaactctgtagttttaagaccatccgaattttctcctaaatctc1500aacatttggtcgtaagagccttaacagaagctggtttgccagcaggttgcttgcaattct1560taccaacatcaaccgcagatacccctagagccatagaatttgctatcagacaccctaagg1620ttagtagagctaatttcactggttctgatagagtcggtagaattatagcaggtttatccg1680ccagttgtttgaaaccatgcgttttggaattgggtggtaaagcccctgttgtcgtattag1740aagatgctgatgtcgaagctgctgttgaagcagttgtctacggtgccatgtctaactcag1800gtcaaatttgtatgagtacagaaagagctatagttcatagatcattggccgctgatttta1860aagcattgttagtaaagagagccgaatcattaagagttggtaatcacttggaagatccag1920acgttcaattgtcaggtttgtttactgctgcttccgcagaaagagtcttgggtttgatta1980aaggtgctgtaaacgcaggtgccaccttgttagctggtgacttggcattacatggtccat2040gccaaactataatggctcctcacatcttaaccggtgttactagagatatggacttgtttc2100atagagaaacattcggtccagtattgttcgttagtgaatttgatactgatgacgaagcta2160tagcacaagccaatgacacagaattttctttatgtgcttcagtattctccagagatgttt2220tgagagctatggataccgctaagagaataagaactggttcatgccacgtcaatggtccta2280ctgtatatatcgaagcaccattgcctaacggtggtgttggtggtggttctggttacggta2340gatttggtggtgttgctggtattgaagagtttacagaaagacaaatagttagtttagcca2400agccaggtatcaagtatgccttttagactagtgtgaatttactttaaatcttgcatttaa2460ataaattttctttttatagctttatgacttagtttcaatttatatactattttaatgaca2520ttttcgattcattgattgaaagctttgtgttttttcttgatgcgctattgcattgttctt2580gtctttttcgccacatgtaatatctgtagtagatacctgatacattgtggatgctgagtg2640aaattttagttaataatggaggcgctcttaataattttggggatattggctttttttttt2700aaagtttacaaatgaattttttccgccaggatttaattaattgcagattcccttttatgg2760attcctaaatcctcgaggagaacttctagtatatctacatacctaatattattgccttat2820taaaaatggaatcccaacaattacatcaaaatccacattctcttcaaaatcaattgtcct2880gtacttccttgttcatgtgtgttcaaaaacgttatatttataggataattatactctatt2940tctcaacaagtaattggttgtttggccgagcggtctaaggcgcctgattcaagaaatatc3000ttgaccgcagttaactgtgggaatactcaggtatcgtaagatgcaagagttcgaatctct3060tagcaaccattatttttttcctcaacataacgagaacacacaggggcgctatcgcacaga3120atcaaattcgatgactggaaattttttgttaatttcagaggtcgcctgacgcatatacct3180ttttcaactgaaaaattgggagaaaaaggaaaggtgagagcgccggaaccggcttttcat3240atagaatagagaagcgttcatgactaaatgcttgcatcacaatacttgaagttgacaata3300ttatttaaggacctattgttttttccaataggtggttagcaatcgtcttactttctaact3360tttcttaccttttacatttcagcaatatatatatatatatttcaaggatataccattcta3420atgtctgcccctaagaagatcgtcgttttgccaggtgaccacgttggtcaagaaatcaca3480gccgaagccattaaggttcttaaagctatttctgatgttcgttccaatgtcaagttcgat3540ttcgaaaatcatttaattggtggtgctgctatcgatgctacaggtgttccacttccagat3600gaggcgctggaagcctccaagaaggctgatgccgttttgttaggtgctgtgggtggtcct3660aaatggggtaccggtagtgttagacctgaacaaggtttactaaaaatccgtaaagaactt3720caattgtacgccaacttaagaccatgtaactttgcatccgactctcttttagacttatct3780ccaatcaagccacaatttgctaaaggtactgacttcgttgttgtcagagaattagtggga3840ggtatttactttggtaagagaaaggaagacgatggtgatggtgtcgcttgggatagtgaa3900caatacaccgttccagaagtgcaaagaatcacaagaatggccgctttcatggccctacaa3960catgagccaccattgcctatttggtccttggataaagctaatgttttggcctcttcaaga4020ttatggagaaaaactgtggaggaaaccatcaagaacgaattccctacattgaaggttcaa4080catcaattgattgattctgccgccatgatcctagttaagaacccaacccacctaaatggt4140attataatcaccagcaacatgtttggtgatatcatctccgatgaagcctccgttatccca4200ggttccttgggtttgttgccatctgcgtccttggcctctttgccagacaagaacaccgca4260tttggtttgtacgaaccatgccacggttctgctccagatttgccaaagaataaggtcaac4320cctatcgccactatcttgtctgctgcaatgatgttgaaattgtcattgaacttgcctgaa4380gaaggtaaggccattgaagatgcagttaaaaaggttttggatgcaggtatcagaactggt4440gatttaggtggttccaacagtaccaccgaagtcggtgatgctgtcgccgaagaagttaag4500aaaatccttgcttaaaaagattctctttttttatgatatttgtacataaactttataaat4560gaaattcataatagaaacgacacgaaattacaaaatggaatatgttcatagggtagacga4620aactatatacgcaatctacatacatttatcaagaaggagaaaaaggaggatgtaaaggaa4680tacaggtaagcaaattgatactaatggctcaacgtgataaggaaaaagaattgcacttta4740acattaatattgacaaggaggagggcaccacacaaaaagttaggtgtaacagaaaatcat4800gaaactggccggccgatgctgtccgcgggcctcataagagttgtggtaacaacgcaggtg4860cgcgcatctgctaagtttaaacggtaccggcctcatgggccttccgctcactgcccgctt4920tccagtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgtttccttgcgt4980attgggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaaagc5040ctggggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgtt5100gctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaag5160tcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctc5220cctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctccc5280ttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggt5340cgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgcctt5400atccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagc5460agccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaa5520gtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaa5580gccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctgg5640tagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaaga5700agatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagg5760gattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatg5820aagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgctt5880aatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgact5940ccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaat6000gataccgcgagaaccacgctcaccggctccagatttatcagcaataaaccagccagccgg6060aagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattg6120ttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccat6180tgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttc6240ccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctcctt6300cggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggc6360agcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtga6420gtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggc6480gtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaa6540acgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgta6600acccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtg6660agcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttg6720aatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcat6780gagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatt6840tccccgaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcgcgttaaat6900ttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaa6960tcaaaagaatagaccgagatagggttgagtggccgctacagggcgctcccattcgccatt7020caggctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgctattacgccagc7080tggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagt7140cacgacgttgtaaaacgacggccagtgagcgcgacgtaatacgactcactatagggcgaa7200ttggcggaaggccgtcaaggccggtaccggtccttttcatcacgtgctataaaaataatt7260ataatttaaattttttaatataaatatataaattaaaaatagaaagtaaaaaaagaaatt7320aaagaaaaaatagtttttgttttccgaagatgtaaaagactctagggggatcgccaacaa7380atactaccttttatcttgctcttcctgctctcaggtattaatgccgaattgtttcatctt7440gtctgtgtagaagaccacacacgaaaatcctgtgattttacattttacttatcgttaatc7500gaatgtatatctatttaatctgcttttcttgtctaataaatatatatgtaaagtacgctt7560tttgttgaaattttttaaacctttgtttatttttttttcttcattccgtaactcttctac7620cttctttatttactttctaaaatccaaatacaaaacataaaaataaataaacacagagta7680aattcccaaattattccatcattaaaagatacgaggcgcgtgtaagttacaggcaagcga7740tccgtccgtttaaacatgctttctgaaaacacgactattctgatggctaacggtgaaatt7800aaagacatcgcaaacggcgcgcctgcggtagtttatcacagttaaattgctaacgcagtc7860aggcaccgtgtatgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctgg7920atgctgtaggcataggcttggttatgccggtactgccgggcctcttgcgggatatcgtcc7980attccgacagcatcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaat8040ttctatgcgcacccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgc8100tcgcttcgctacttggagccactatcgactacgcgatcatggcgaccacacccgtcctgt8160ggatcctctacgccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctg8220gcgcctatatcgccgacatcaccgatggggaagatcgggctcgccacttcgggctcatga8280gcgcttgtttcggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgcca8340tctccttgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctc8400accatatccgcaatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaa8460gacagcaccaacagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaa8520actttttccttccttcattcacgcacactactctctaatgagcaacggtatacggccttc8580cttccagttacttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaat8640agacctgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttg8700tttctttttctgcacaatatttcaagctataccaagcatacaatcaactatctcatacaa8760aaatgggttccttatccttaccagaaacatcattagccgcaatccaagacaaagaaacaa8820aagctatctcagtcgccaaaagacctacaccagtacctgttggtacccaagtcttagtaa8880aattgcattattccggtgtttgtgccactgatttgcacttagctagaggttctgttccat8940acttacaacctaaggtttcagtcggtggtcatgaaggtaccggtgttattgcttctttgg9000gtccagatgtcgacgcagcagaatggcatgtaggtgacagagtagcagttagatgggtac9060acatagtttgtggtaaatgcgaagtttgtactacaggtttcgaaaatttgtgccaatcta9120gaaagttggctggtaaagatgttgaaggtactttcgccgaatatgcaattgccgactctt9180catacatggttagattaccagctggtgtctcagatgcagacgccgctcctatcttgtgtg9240ctggtgtcacagtatacaaagccttgaagatcgcttctttgagagcaggttcatgggttg9300ctgtcgcaggtgctggtggtggtttaggtcatttggcaatccaatatgctagagcaatgg9360gtttaaaagttgtcgcattggatgccagaaagagagacttgtgcttatccttgggtgctg9420aaagttacatcgacgttttagaaactgatgactgtgtcgcacaagtaattaaagttacag9480atggtggtgctcacggtgcattaatatgcgcttccagtggtcaagcctacgatgacgctg9540ttaaatttttgagatggaccggtactttagtctgtataggtttgccacctaagccaacat9600tgttatccttaggtcctgctgattttgtagccagaggtatcaaggttatgggtacaagta9660ccggtgacagacaagacacagttgaagccttggctttcgtcgctaaaggtcaagtaaagc9720ctcaattaaccgaaagaagattggaagatgttgaagaaatcttaaaggaaatagaaaatg9780gtacaatgcaaggtaaagccgtaatcagaatcgcatagacgcgtgttattactgagtagt9840atttatttaagtattgtttgtgcacttgcctgcaggccttttgaaaagcaagcataaaag9900atctaaacataaaatctgtaaaataacaagatgtaaagataatgctaaatcatttggctt9960tttgattgattgtacaggaaaatatacatcgcagggggttgacttttaccatttcaccgc10020aatggaatcaaacttgttgaagagaatgttcacaggcgcatacgctacaatgacccgatt10080cttgctagccttttctcggtcttgcaaacaaccgccggcagcttctcgagccgcggaacc10140gccagatattcattacttgacgcaaaagcgtttgaaataatgacgaaaaagaaggaagaa10200aaaaaaagaaaaataccgcttctaggcgggttatctactgatccgagcttccactaggat10260agcacccaaacacctgcatatttggacgacctttacttacaccaccaaaaaccactttcg10320cctctcccgcccctgataacgtccactaattgagcgattacctgagcggtcctcttttgt10380ttgcagcatgagacttgcatactgcaaatcgtaagtagcaacgtctcaaggtcaaaactg10440tatggaaaccttgtcacctcacttaattctagctagcctaccctgcaagtcaagaggtct10500ccgtgattcctagccacctcaaggtatgcctctccccggaaactgtggccttttctggca10560cacatgatctccacgatttcaacatataaatagcttttgataatggcaatattaatcaaa10620tttattttacttctttcttgtaacatctctcttgtaatcccttattccttctagctattt10680ttcataaaaaaccaagcaactgcttatcaacacacaaacactaaatcaaaaatgagtttg10740ccatcccactacaagagagccgcttttaaggaagcaggtggtccattgactattgaagaa10800gttgatttgactatgccagatgccggtgaagtcttggtaaaagttgaagcttgtggtgta10860tgcttttcagacactgttcctcaagctcatggtttgggtggtaaattcccaatcgttcct10920ggtcatgaaattataggtcacgttgtcgcaacaggtgacggtgtttccgactgggaagtc10980ggtgacagaattggtgaaggttggcatggtggtcacgacggtacatgtccatcatgcaga11040caaggtcatttccaaatgtgtgataaccaatccataaacggtgttaccaaaaatggtggt11100tatgctcaatactgcattttgagaagtgaagcagcagtcagaatacctactcacgtatct11160gccgctgaatatgcaccaattttatgtgccggtgtcaccgtttttaattcaatgagacaa11220atcggtgttaagcctggttccactgtcgcaattcaaggtttgggtggtttaggtcatttg11280gccattcaatatgctaacagatttggtttcagagtagttgctatatctagagatgaccaa11340aaggaaagattcgttagagatttgggtgcacacgaatacattaatacatctgaagaagat11400gtcggttcagctttacaaaagttgggtggtgcaagtttaatagttgcaaccgccccaaac11460gctagagcaatctctcctttgttaaaaggtttaagaccattgggtaaattgttgatcttg11520gctgttccaggtgaaatccctttagataccagattgatggtagcaagaggtttatccgtt11580catggttggccaagtggtcacgccttggattctgaagaaactataagattcacagaatta11640gaagatatcaagtgtatgatacaaacttactcattagacagagctaacgaagcctttgac11700gctatgatttcaggttcagttagattcagagcagttattacaatggaataggacgt11756<210>68<211>8315<212>DNA<213>Artificial<220><223>pTT2-hmfL1<400>68cgcgtgttattactgagtagtatttatttaagtattgtttgtgcacttgcctgcaggcct60tttgaaaagcaagcataaaagatctaaacataaaatctgtaaaataacaagatgtaaaga120taatgctaaatcatttggctttttgattgattgtacaggaaaatatacatcgcagggggt180tgacttttaccatttcaccgcaatggaatcaaacttgttgaagagaatgttcacaggcgc240atacgctacaatgacccgattcttgctagccttttctcggtcttgcaaacaaccgccggc300agcttctcgagccgcggaaccgccagatattcattacttgacgcaaaagcgtttgaaata360atgacgaaaaagaaggaagaaaaaaaaagaaaaataccgcttctaggcgggttatctact420gatccgagcttccactaggatagcacccaaacacctgcatatttggacgacctttactta480caccaccaaaaaccactttcgcctctcccgcccctgataacgtccactaattgagcgatt540acctgagcggtcctcttttgtttgcagcatgagacttgcatactgcaaatcgtaagtagc600aacgtctcaaggtcaaaactgtatggaaaccttgtcacctcacttaattctagctagcct660accctgcaagtcaagaggtctccgtgattcctagccacctcaaggtatgcctctccccgg720aaactgtggccttttctggcacacatgatctccacgatttcaacatataaatagcttttg780ataatggcaatattaatcaaatttattttacttctttcttgtaacatctctcttgtaatc840ccttattccttctagctatttttcataaaaaaccaagcaactgcttatcaacacacaaac900actaaatcaaaatgcataaaataggacgtcagcttttgattaagccttctagtccaaaaa960acacgtttttttgtcatttatttcattttcttagaatagtttagtttattcattttatag1020tcacgaatgttttatgattctatatagggttgcaaacaagcatttttcattttatgttaa1080aacaatttcaggtttaccttttattctgcttgtggtgacgcgggtatccgcccgctcttt1140tggtcacccatgtatttaattgcataaataattcttaaaagtggagctagtctatttcta1200tttacatacctctcatttctcatttcctcccccctagtgcagattcccttttatggattc1260ctaaatcctcgaggagaacttctagtatatctacatacctaatattattgccttattaaa1320aatggaatcccaacaattacatcaaaatccacattctcttcaaaatcaattgtcctgtac1380ttccttgttcatgtgtgttcaaaaacgttatatttataggataattatactctatttctc1440aacaagtaattggttgtttggccgagcggtctaaggcgcctgattcaagaaatatcttga1500ccgcagttaactgtgggaatactcaggtatcgtaagatgcaagagttcgaatctcttagc1560aaccattatttttttcctcaacataacgagaacacacaggggcgctatcgcacagaatca1620aattcgatgactggaaattttttgttaatttcagaggtcgcctgacgcatataccttttt1680caactgaaaaattgggagaaaaaggaaaggtgagagcgccggaaccggcttttcatatag1740aatagagaagcgttcatgactaaatgcttgcatcacaatacttgaagttgacaatattat1800ttaaggacctattgttttttccaataggtggttagcaatcgtcttactttctaacttttc1860ttaccttttacatttcagcaatatatatatatatatttcaaggatataccattctaatgt1920ctgcccctaagaagatcgtcgttttgccaggtgaccacgttggtcaagaaatcacagccg1980aagccattaaggttcttaaagctatttctgatgttcgttccaatgtcaagttcgatttcg2040aaaatcatttaattggtggtgctgctatcgatgctacaggtgttccacttccagatgagg2100cgctggaagcctccaagaaggctgatgccgttttgttaggtgctgtgggtggtcctaaat2160ggggtaccggtagtgttagacctgaacaaggtttactaaaaatccgtaaagaacttcaat2220tgtacgccaacttaagaccatgtaactttgcatccgactctcttttagacttatctccaa2280tcaagccacaatttgctaaaggtactgacttcgttgttgtcagagaattagtgggaggta2340tttactttggtaagagaaaggaagacgatggtgatggtgtcgcttgggatagtgaacaat2400acaccgttccagaagtgcaaagaatcacaagaatggccgctttcatggccctacaacatg2460agccaccattgcctatttggtccttggataaagctaatgttttggcctcttcaagattat2520ggagaaaaactgtggaggaaaccatcaagaacgaattccctacattgaaggttcaacatc2580aattgattgattctgccgccatgatcctagttaagaacccaacccacctaaatggtatta2640taatcaccagcaacatgtttggtgatatcatctccgatgaagcctccgttatcccaggtt2700ccttgggtttgttgccatctgcgtccttggcctctttgccagacaagaacaccgcatttg2760gtttgtacgaaccatgccacggttctgctccagatttgccaaagaataaggtcaacccta2820tcgccactatcttgtctgctgcaatgatgttgaaattgtcattgaacttgcctgaagaag2880gtaaggccattgaagatgcagttaaaaaggttttggatgcaggtatcagaactggtgatt2940taggtggttccaacagtaccaccgaagtcggtgatgctgtcgccgaagaagttaagaaaa3000tccttgcttaaaaagattctctttttttatgatatttgtacataaactttataaatgaaa3060ttcataatagaaacgacacgaaattacaaaatggaatatgttcatagggtagacgaaact3120atatacgcaatctacatacatttatcaagaaggagaaaaaggaggatgtaaaggaataca3180ggtaagcaaattgatactaatggctcaacgtgataaggaaaaagaattgcactttaacat3240taatattgacaaggaggagggcaccacacaaaaagttaggtgtaacagaaaatcatgaaa3300ctggccggccgatgctgtccgcgggcctcataagagttgtggtaacaacgcaggtgcgcg3360catctgctaagtttaaacggtaccggcctcatgggccttccgctcactgcccgctttcca3420gtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgtttccttgcgtattg3480ggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaaagcctgg3540ggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctg3600gcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcag3660aggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctc3720gtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcg3780ggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgtt3840cgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatcc3900ggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagcc3960actggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtgg4020tggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagcca4080gttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagc4140ggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagat4200cctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggatt4260ttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagt4320tttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatc4380agtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactcccc4440gtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgata4500ccgcgagaaccacgctcaccggctccagatttatcagcaataaaccagccagccggaagg4560gccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgc4620cgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgct4680acaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaa4740cgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggt4800cctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagca4860ctgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtac4920tcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtca4980atacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgt5040tcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaaccc5100actcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagca5160aaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaata5220ctcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagc5280ggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccc5340cgaaaagtgccacctaaattgtaagcgttaatattttgttaaaattcgcgttaaattttt5400gttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaa5460aagaatagaccgagatagggttgagtggccgctacagggcgctcccattcgccattcagg5520ctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgctattacgccagctggc5580gaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacg5640acgttgtaaaacgacggccagtgagcgcgacgtaatacgactcactatagggcgaattgg5700cggaaggccgtcaaggccggtaccggtccttttcatcacgtgctataaaaataattataa5760tttaaattttttaatataaatatataaattaaaaatagaaagtaaaaaaagaaattaaag5820aaaaaatagtttttgttttccgaagatgtaaaagactctagggggatcgccaacaaatac5880taccttttatcttgctcttcctgctctcaggtattaatgccgaattgtttcatcttgtct5940gtgtagaagaccacacacgaaaatcctgtgattttacattttacttatcgttaatcgaat6000gtatatctatttaatctgcttttcttgtctaataaatatatatgtaaagtacgctttttg6060ttgaaattttttaaacctttgtttatttttttttcttcattccgtaactcttctaccttc6120tttatttactttctaaaatccaaatacaaaacataaaaataaataaacacagagtaaatt6180cccaaattattccatcattaaaagatacgaggcgcgtgtaagttacaggcaagcgatccg6240tccgtttaaacatgctttctgaaaacacgactattctgatggctaacggtgaaattaaag6300acatcgcaaacggcgcgcctgcggtagtttatcacagttaaattgctaacgcagtcaggc6360accgtgtatgaaatctaacaatgcgctcatcgtcatcctcggcaccgtcaccctggatgc6420tgtaggcataggcttggttatgccggtactgccgggcctcttgcgggatatcgtccattc6480cgacagcatcgccagtcactatggcgtgctgctagcgctatatgcgttgatgcaatttct6540atgcgcacccgttctcggagcactgtccgaccgctttggccgccgcccagtcctgctcgc6600ttcgctacttggagccactatcgactacgcgatcatggcgaccacacccgtcctgtggat6660cctctacgccggacgcatcgtggccggcatcaccggcgccacaggtgcggttgctggcgc6720ctatatcgccgacatcaccgatggggaagatcgggctcgccacttcgggctcatgagcgc6780ttgtttcggcgtgggtatggtggcaggccccgtggccgggggactgttgggcgccatctc6840cttgcatgcaacttcttttctttttttttcttttctctctcccccgttgttgtctcacca6900tatccgcaatgacaaaaaaatgatggaagacactaaaggaaaaaattaacgacaaagaca6960gcaccaacagatgtcgttgttccagagctgatgaggggtatctcgaagcacacgaaactt7020tttccttccttcattcacgcacactactctctaatgagcaacggtatacggccttccttc7080cagttacttgaatttgaaataaaaaaaagtttgctgtcttgctatcaagtataaatagac7140ctgcaattattaatcttttgtttcctcgtcattgttctcgttccctttcttccttgtttc7200tttttctgcacaatatttcaagctataccaagcatacaatcaactatctcatacaaaaat7260gggttccttatccttaccagaaacatcattagccgcaatccaagacaaagaaacaaaagc7320tatctcagtcgccaaaagacctacaccagtacctgttggtacccaagtcttagtaaaatt7380gcattattccggtgtttgtgccactgatttgcacttagctagaggttctgttccatactt7440acaacctaaggtttcagtcggtggtcatgaaggtaccggtgttattgcttctttgggtcc7500agatgtcgacgcagcagaatggcatgtaggtgacagagtagcagttagatgggtacacat7560agtttgtggtaaatgcgaagtttgtactacaggtttcgaaaatttgtgccaatctagaaa7620gttggctggtaaagatgttgaaggtactttcgccgaatatgcaattgccgactcttcata7680catggttagattaccagctggtgtctcagatgcagacgccgctcctatcttgtgtgctgg7740tgtcacagtatacaaagccttgaagatcgcttctttgagagcaggttcatgggttgctgt7800cgcaggtgctggtggtggtttaggtcatttggcaatccaatatgctagagcaatgggttt7860aaaagttgtcgcattggatgccagaaagagagacttgtgcttatccttgggtgctgaaag7920ttacatcgacgttttagaaactgatgactgtgtcgcacaagtaattaaagttacagatgg7980tggtgctcacggtgcattaatatgcgcttccagtggtcaagcctacgatgacgctgttaa8040atttttgagatggaccggtactttagtctgtataggtttgccacctaagccaacattgtt8100atccttaggtcctgctgattttgtagccagaggtatcaaggttatgggtacaagtaccgg8160tgacagacaagacacagttgaagccttggctttcgtcgctaaaggtcaagtaaagcctca8220attaaccgaaagaagattggaagatgttgaagaaatcttaaaggaaatagaaaatggtac8280aatgcaaggtaaagccgtaatcagaatcgcataga8315<210>69<211>360<212>PRT<213>Saccharomycescerevisiae<400>69MetSerTyrProGluLysPheGluGlyIleAlaIleGlnSerHisGlu151015AspTrpLysAsnProLysLysThrLysTyrAspProLysProPheTyr202530AspHisAspIleAspIleLysIleGluAlaCysGlyValCysGlySer354045AspIleHisCysAlaAlaGlyHisTrpGlyAsnMetLysMetProLeu505560ValValGlyHisGluIleValGlyLysValValLysLeuGlyProLys65707580SerAsnSerGlyLeuLysValGlyGlnArgValGlyValGlyAlaGln859095ValPheSerCysLeuGluCysAspArgCysLysAsnAspAsnGluPro100105110TyrCysThrLysPheValThrThrTyrSerGlnProTyrGluAspGly115120125TyrValSerGlnGlyGlyTyrAlaAsnTyrValArgValHisGluHis130135140PheValValProIleProGluAsnIleProSerHisLeuAlaAlaPro145150155160LeuLeuCysGlyGlyLeuThrValTyrSerProLeuValArgAsnGly165170175CysGlyProGlyLysLysValGlyIleValGlyLeuGlyGlyIleGly180185190SerMetGlyThrLeuIleSerLysAlaMetGlyAlaGluThrTyrVal195200205IleSerArgSerSerArgLysArgGluAspAlaMetLysMetGlyAla210215220AspHisTyrIleAlaThrLeuGluGluGlyAspTrpGlyGluLysTyr225230235240PheAspThrPheAspLeuIleValValCysAlaSerSerLeuThrAsp245250255IleAspPheAsnIleMetProLysAlaMetLysValGlyGlyArgIle260265270ValSerIleSerIleProGluGlnHisGluMetLeuSerLeuLysPro275280285TyrGlyLeuLysAlaValSerIleSerTyrSerAlaLeuGlySerIle290295300LysGluLeuAsnGlnLeuLeuLysLeuValSerGluLysAspIleLys305310315320IleTrpValGluThrLeuProValGlyGluAlaGlyValHisGluAla325330335PheGluArgMetGluLysGlyAspValArgTyrArgPheThrLeuVal340345350GlyTyrAspLysGluPheSerAsp355360当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1