发明领域
本发明涉及酶学、分子遗传学、生物转化和发酵技术领域。特别地,本发明涉及将5-(羟甲基)-2-糠酸氧化为5-甲酰-2-糠酸的脱氢酶,及涉及编码这种脱氢酶的多核苷酸及其在羟甲基糖醛至2,5-呋喃二羧酸的生物转化中的应用。
发明背景
2,5-呋喃二羧酸(fdca)是一种单体化合物,其可以用于产生具有巨大经济影响的聚酯。在该领域中一个非常重要的化合物是聚对苯二甲酸乙二醇酯(pet),其是从对苯二甲酸(pta)和乙二醇产生的。fdca在聚酯pet中可代替pta,在这种情况中产生聚呋喃二甲酸乙二醇酯(pef)。pef具有在聚酯大市场中代替pet的良好潜力。不仅是因为当其与pet相比时具有更优秀的性质,还因为其可以衍生自可再生原料。fdca可以通过化学(dejongetal2012.in:biobasedmonomers,polymers,andmaterials;smith,p.,etal.;acssymposiumseries;americanchemicalsociety:washington,dc)或者组合的化学-生物途径(wiercksetal2011.applmicrobiolbiotechnol92:1095-1105)从糖产生。在后者的情况中,单体糖如葡萄糖或果糖被化学转化为5-(羟甲基)-2-糠醛(hmf),其随后可以由酶氧化为fdca。
从hmf中产生fdca的生物途径已经基于hmf降解株cupriavidusbasilensishmf14的分离(wierckxetal2010.microbialtechnology3:336-343)而开发。鉴别了编码在c.basilensishmf14中参与hmf降解途径的酶的基因簇及在恶臭假单胞菌(pseudomonasputida)菌株中异源表达相关基因(koopmanetal2010.pnas107:4919-4924),由此获得代谢hmf的能力。降解途径的第一个氧化步骤包括形成5-(羟甲基)-2-糠酸(hmfca),其随之被氧化为5-甲酰-2-糠酸(ffa)及进一步氧化为fdca。在随后的研究中(koopmanetal2010.bioresourcetechnology101:6291-6296及wo2011/026913),仅编码hmf氧化还原酶的c.basilensishmf14的hmfli基因被导入恶臭假单胞菌中。所述氧化还原酶主要对于hmfca作为氧化酶,但是其也可以氧化hmf或ffa。仅hmfli基因的异源表达可以使恶臭假单胞菌从hmf产生fdca。在进一步优化的研究中(wierckxetal2011,supra;及wo2012/064195),两个另外的基因在恶臭假单胞菌中表达,其分别编码hmfca转运蛋白和具有未知特异性的醛脱氢酶。
然而,从hmf产生fdca的氧化酶催化途径与脱氢酶催化途径相比具有一些固有的缺点,包括至少产生毒性h2o2、缺少从氧化步骤获得能量和不佳的o2亲和性及相关的系统高需氧量。因此,本发明的目的是通过提供用于从呋喃前体如hmf产生fdca的新的脱氢酶催化途径的手段和方法,以及提供在这种方法中使用新的hmfca转运蛋白的手段和方法,从而解决上述这些缺点。
发明概述
在第一方面,本发明涉及包含表达核苷酸序列的表达构建体的细胞,所述核苷酸序列编码具有与seqidno:1-11任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将5-羟甲基-2-呋喃羧酸(hmfca)氧化为5-甲酰-2-糠酸(ffa)的能力。优选地,所述细胞进一步具有:a)醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸,其中优选所述细胞包含第二表达构建体,表达编码包含与seqidno:24、25、26、27、28、29和30任一氨基酸序列具有至少45%相同性的氨基酸序列的醛脱氢酶的核苷酸序列,其中第二表达构建体可以在细胞中表达,及与没有第二表达构建体的相应野生型细胞相比,所述醛脱氢酶的表达赋予所述细胞或增加所述细胞中如下至少一种能力:i)将5-羟甲基糠醛(hmf)氧化为hmfca,ii)将dff氧化为ffa,及iii)将ffa氧化为fdca;及b)将呋喃化合物转运进/转运出细胞的能力,其中优选所述细胞包含第三表达构建体以表达编码具有将至少fdvifca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与seqidno:17、31、32、33和34任一氨基酸序列具有至少45%相同性的氨基酸序列,其中第三表达构建体可以在细胞中表达,及与没有第三表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少fdvifca转运进细胞的能力。
另一方面,本发明涉及包含表达编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列的表达构建体的细胞,所述多肽包含与seqidno:17氨基酸序列具有至少86.5%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达至少赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力,及其中所述细胞进一步包含将hmf转变为fdca的酶,其中将hmf转变为fdca的酶优选包括如下至少一种:a)醇脱氢酶,其将hmfca氧化为ffa及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及b)氧化还原酶,其将hmf、2,5-二羟甲基呋喃、hmfca、ffa和2,5-二甲酰呋喃的一或多种氧化为fdca,及任选存在的醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。
本发明的细胞优选是微生物细胞,如细菌、酵母或丝状真菌细胞。本发明的酵母或丝状真菌细胞优选选自如下属:假丝酵母属(candida)、汉逊酵母属(hansenula)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、酵母菌属(saccharomyces)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)、支顶孢属(acremonium)、伞菌属(agaricus)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、毁丝霉属(myceliophthora)、金孢子菌属(chrysosporium)、鬼伞属(coprinus)、隐球菌属(cryptococcus)、filibasidium、镰刀菌属(fusarium)、腐殖霉属(humicola)、稻瘟菌属(magnaporthe)、毛霉菌属(mucor)、毁丝霉属(myceliophthora)、新丽鞭毛菌属(neocallimastix)、脉孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉菌属(penicillium)、梨囊鞭菌属(piromyces)、原毛平革菌属(panerochaete)、侧耳属(pleurotus)、裂褶菌属(schizophyllum)、踝节菌属(talaromyces)、热子囊菌属(thermoascus)、梭孢壳属(thielavia)、弯颈霉属(tolypocladium)和木霉属(trichoderma),最优选酵母或丝状真菌细胞选自如下种:乳酸克鲁维酵母(kluyveromyceslactis)、酿酒酵母(s.cerevisiae)、多形汉逊酵母(hansenulapolymorpha)、解脂耶氏酵母(yarrowialipolytica)、巴斯德毕赤酵母(pichiapastoris)、黑曲霉(aspergillusniger)、泡盛曲霉(aspergillusawamori)、臭曲霉(aspergillusfoetidus)、酱油曲霉(aspergillussojae)、烟曲霉(aspergillusfumigatus)、埃默森踝节菌(talaromycesemersonii)、米曲霉(aspergillusoryzae)、嗜热毁丝霉(myceliophthorathermophila)、里氏木霉(trichodermareesei)和产黄青霉菌(penicilliumchrysogenum)。本发明的细菌细胞优选选自如下菌属:埃希氏菌属(escherichia)、鱼腥藻属(anabaena)、aeribacillus、解硫胺素杆菌属(aneurinibacillus)、伯克霍尔德氏菌属(burkholderia)、慢生根瘤菌属(bradyrhizobium)、柄杆菌属(caulobacter)、贪铜菌属(cupriavidus)、脱硫肠状菌属(desulfotomaculum)、desulfurispora、葡糖杆菌属(gluconobacter)、红杆菌属(rhodobacter)、pelotomaculum、假单胞菌属(pseudomonas)、副球菌属(paracoccus)、芽孢杆菌属(bacillus)、地芽孢杆菌属(geobacillus)、短小芽孢杆菌属(brevibacillus)、短杆菌属(brevibacterium)、棒杆菌属(corynebacterium)、根瘤菌属(rhizobium(中华根瘤菌属(sinorhizobium))、黄杆菌属(flavobacterium)、克雷伯氏菌属(klebsiella)、肠杆菌属(enterobacter)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、甲基杆菌属(methylobacterium)、罗尔斯通氏菌属(ralstonia)、红假单胞菌属(rhodopseudomonas)、葡萄球菌属(staphylococcus)及链霉菌属(streptomyces),更优选细菌细胞选自如下菌种:a.pallidus、a.terranovensis、枯草芽孢杆菌(b.subtilis)、解淀粉芽孢杆菌(b.amyloliquefaciens)、凝结芽孢杆菌(b.coagulans)、克里不所类芽孢杆菌(b.kribbensis)、地衣芽孢杆菌(b.licheniformis)、b.puntis、巨大芽孢杆菌(b.megaterium)、耐盐芽孢杆菌(b.halodurans)、短小芽孢杆菌(b.pumilus)、热红短小芽孢杆菌(b.thermoruber)、b.panacihumi、c.basilensis、库氏脱硫肠状菌(d.kuznetsovii)、d.thermophila、嗜热地芽孢杆菌(g.kaustophilus)、氧化葡糖杆菌(gluconobacteroxydans)、新月柄杆菌(caulobactercrescentus)cb15、扭托甲基杆菌(methylobacteriumextorquens)、类球红细菌(rhodobactersphaeroides)、pelotomaculumthermopropionicum、pseudomonaszeaxanthinifaciens、恶臭假单胞菌、paracoccusdenitrificans、大肠杆菌(e.coli)、谷氨酸棒杆菌(c.glutamicum)、肉葡萄球菌(staphylococcuscarnosus)、变铅青链霉菌(streptomyceslividans)、苜蓿中华根瘤菌(sinorhizobiummelioti)和rhizobiumradiobacter。
再一方面,本发明涉及一种制备具有如以上方面定义的hmfca脱氢酶活性的多肽和/或制备具有如以上方面定义的呋喃化合物转运能力的多肽的方法。所述方法优选包括在有益于一或多种多肽表达的条件下培养如上述方面定义的细胞及任选回收所述一或多种多肽的步骤。
另一方面,本发明涉及将hmfca氧化为ffa的方法,所述方法包括在存在hmfca条件下、优选在有益于细胞氧化hmfca的条件下孵育上述任一方面定义的细胞的步骤。
再一方面,本发明涉及一种产生fdca的方法,所述方法包括在包含fdca的一或多个呋喃前体的培养基中孵育上述任一方面的细胞的步骤,优选在有益于细胞将fdca的呋喃前体氧化为fdca的条件下进行,及任选包括回收fdca,其中优选fdca的至少一个呋喃前体选自hmf、2,5-二羟甲基呋喃(dhf或hmf-oh)、hmfca、ffa和2,5-二甲酰呋喃(dff),最优选fdvif,其中fdca的呋喃前体得自一或多种己糖,优选得自木质纤维素生物质的一或多种己糖,优选通过酸催化的脱水获得,及其中优选通过包括酸或盐沉淀及随后冷却结晶和/或溶剂提取的方法从所述培养基中回收fdca。
再一方面,本发明涉及一种从一或多个fdca单体产生聚合物的方法,所述方法包括如下步骤:a)在根据上述方面的方法中制备fdca单体;及从在a)中获得的fdca单体产生聚合物。
本发明还涉及使用上述任何方面的细胞将fdca的一或多种呋喃前体经生物转化为fdca,其中优选fdca的至少一种呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。
另一方面,本发明涉及具有hmfca脱氢酶活性的多肽,所述多肽包含与seqidno:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列。在这个方面,本发明还涉及包含如下至少一个序列的核酸分子:a)编码具有hmfca脱氢酶活性的多肽的核苷酸序列,所述多肽包含与seqidno:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列;b)seqidno:12或13所示核苷酸序列;c)如(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码的简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-c)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。
在最后一方面,本发明涉及具有将至少hmfca转运进细胞的能力的多肽,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列。在这个方面,本发明还涉及核酸分子,其包含如下至少一个序列:a)编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列;b)seqidno:18所示核苷酸序列;c)(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-d)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面中,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。
发明描述
定义
术语“同源性”、“序列相同性”等在本文可互换使用。序列相同性在本文定义为通过序列对比确定的两或更多个氨基酸(多肽或蛋白质)序列或者两或更多个核酸(多核苷酸)序列之间的关系。在本领域中,“相同性”还是指氨基酸或核酸序列之间的序列相关性的程度,可以通过这种序列串之间的匹配确定。两个氨基酸序列之间的“相似性”是通过对比氨基酸序列及一个多肽至另一个多肽序列的保守氨基酸取代而确定的。“相同性”和“相似性”可易于通过已知方法计算。
“序列相同性”和“序列相似性”可以通过根据两个序列的长度使用整体或局部比对算法比对两个多肽或两个核苷酸序列而确定。相似长度的序列优选使用整体比对算法比对(例如needlemanwunsch),这种方法在全长上最佳比对了序列,而显著不同长度的序列优选使用局部比对算法比对(例如smithwaterman)。然后当其(当最佳比对时,例如使用默认参数的gap或bestfit程序)共有至少一定最小百分比的序列相同性时(如下文定义),可以将所述序列称作“基本相同的”或者“基本相似的”。gap使用needleman和wunsch整体比对算法以在完整长度(全长)比对两个序列,使匹配数最大化及缺口数最小化。整体比对适用于确定当两个序列具有相似长度时的序列相同性。通常,使用gap默认参数,缺口产生罚分=50(核苷酸)/8(蛋白质),缺口延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵是nwsgapdna,对于蛋白质,默认评分矩阵是blosum62(henikoff&henikoff,1992,pnas89,915-919)。针对序列相同性百分比的序列比对和评分可以使用计算机程序确定,如gcgwisconsinpackage,version10.3,可得自accelrysinc.(9685scrantonroad,sandiego,ca92121-3752usa),或者使用开源软件如embosswinversion2.10.0中的程序“needle”(使用整体needlemanwunsch算法)或者“water”(使用局部smithwaterman算法),使用与上述gap相同的参数或者使用默认设置(对于“needle”和“water”二者及对于蛋白质和dna比对二者,默认缺口开放罚分是10.0及默认缺口延伸罚分是0.5;默认评分矩阵是blossum62(蛋白质)和dnafull(dna))。当序列的整体长度显著不同时,优选局部比对法如使用smithwaterman算法的那些。
或者,相似性或相同性百分比可以通过使用如fasta、blast等算法搜索公共数据库而确定。因此,本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行公共数据库搜索,以例如鉴别其它家族成员或相关序列。这种搜索可以使用altschul,etal.(1990)j.mol.biol.215:403-10所述blastn和blastx程序(2.0版)进行。blast核苷酸搜索可以使用nblast程序,得分=100,字长=12进行以获得与本发明的氧化还原酶核酸分子同源的核苷酸序列。blast蛋白质搜索可以使用blastx程序,得分=50,字长=3进行以获得与本发明的蛋白质分子同源的氨基酸序列。为了获得缺口比对以进行对比,可以使用如altschuletal.,(1997)nucleicacidsres.25(17):3389-3402所述的gappedblast。当使用blast和gappedblast程序时,可以使用各个程序的默认参数(例如blastx和blastn)。见nationalcenterforbiotechnologyinformation主页http://www.ncbi.nlm.nih.gov/。
任选地,在确定氨基酸相似性程度中,技术人员也可以考虑到所谓的“保守”氨基酸取代,这些为技术人员所已知。保守氨基酸取代是指具有相似侧链的残基的可交换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含有酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,及天冬酰胺-谷氨酰胺。本文揭示的氨基酸序列的取代变体是其中在揭示的序列中至少一个残基已经除去且在此位置插入一个不同残基的那些。优选地,所述氨基酸改变是保守的。优选的每个天然发生的氨基酸的保守取代如下所示:ala至ser,arg至lys,asn至gln或his,asp至glu,cys至ser或ala,gln至asn,glu至asp,gly至pro,his至asn或gln,ile至leu或val,leu至ile或val,lys至arg,gln至glu,met至leu或ile,phe至met,leu至tyr,ser至thr,thr至ser,trp至tyr,tyr至trp或phe,及val至ile或leu。
如本文所用,术语“选择性杂交”等相似用语是描述杂交和洗涤条件,在此条件下彼此至少66%、至少70%、至少75%、至少80%、优选至少85%、更优选至少90%、优选至少95%、更优选至少98%或更优选至少99%同源的核苷酸序列典型保持彼此杂交。也就是说,这种杂交序列可共有至少45%、至少50%、至少55%、至少60%、至少65、至少70%、至少75%、至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少98%或更优选至少99%序列相同性。
优选的非限制性的这种杂交条件例如是在6×氯化钠/柠檬酸钠(ssc)中在大约45℃杂交,随后在1×ssc、0.1%sds中在大约50℃、优选大约55℃、优选大约60℃及更优选大约65℃进行一或多次洗涤。
高度严格条件包括例如在5×ssc/5×denhardt's溶液/1.0%sds中在大约68℃杂交及在0.2×ssc/0.1%sds中在室温洗涤。或者,洗涤可以在42℃进行。
技术人员已知哪种条件应用于严格和高度严格杂交条件。关于这种条件的其它指导在本领域可易于获得,例如见于sambrooketal.,1989,molecularcloning,alaboratorymanual,coldspringharborpress,n.y.;及ausubeletal.(eds.),sambrookandrussell(2001)"molecularcloning:alaboratorymanual(3rdedition),coldspringharborlaboratory,coldspringharborlaboratorypress,newyork1995,currentprotocolsinmolecularbiology,(johnwiley&sons,n.y.)。
当然,仅与聚a序列(如mrna的3’末端poly(a))或者t(或u)残基的互补节段序列杂交的多核苷酸不包含在用于特异性杂交本发明核酸一部分的本发明的多核苷酸中,因为这种多核苷酸将与含有poly(a)节段序列或其补体(例如实际上任何双链cdna克隆)的任何核酸分子杂交。
“核酸构建体”或者“核酸载体”在本文应理解为是指使用重组dna技术获得的人工核酸分子。术语“核酸构建体”因此不包括天然发生的核酸分子,尽管核酸构建体可包含(部分)天然发生的核酸分子。术语“表达载体”或者“表达构建体”是指能影响基因在与这种序列相容的宿主细胞或宿主生物体中表达的核苷酸序列。这些表达载体典型包括至少合适的转录调节序列及任选包括3’转录终止信号。也可以存在实现表达必需的或者有益的其它因子,如表达增强子元件。表达载体将被导入合适的宿主细胞中并能在宿主细胞中和体外细胞培养物中实现编码序列的表达。表达载体适于在本发明的宿主细胞或生物体中复制。
如本文所用,术语“启动子”或者“转录调节序列”是指发挥控制一或多个编码序列转录的核酸片段,其位于编码序列的转录起始位点的转录方向上游,通过存在dna依赖性rna聚合酶的结合位点、转录起始位点及任何其它dna序列包括但不限于转录因子结合位点、阻抑物和激活物蛋白质结合位点及本领域技术人员已知的直接或间接调节从启动子的转录量的任何其它核苷酸序列而结构性鉴别。“组成型”启动子是在大多数组织中在大多数生理和发育条件下具有活性的启动子。“可诱导”启动子是受生理或发育调节的启动子,例如通过使用化学诱导剂调节。
术语“可选择标记”是本领域技术人员熟知的术语,在本文用于描述任何遗传实体,当其表达时可用于选择含有该选择标记的细胞。术语“报道子”可与标记互换使用,但是其主要用于描述可见标记,如绿色荧光蛋白(gfp)。可选择标记可以是显性或隐性或者双向的。
如本文所用,术语“可操纵地连接”是指核苷酸元件的功能关系连接。当核酸与另一核酸序列以功能关系放置时,其是“可操纵地连接的”。例如,如果转录调节序列影响编码序列的转录,则其与编码序列是可操纵地连接的。可操纵地连接是指被连接的dna序列典型是连续的,及在需要时连接连续的及符合读框的两个蛋白质编码区。
术语“蛋白质”或“多肽”可互换使用,是指由氨基酸链组成的分子,不提及特定的作用模式、大小、三维结构或者来源。
术语“基因”是指包含一个区域(转录区)的dna片段,其在细胞中被转录为rna分子(例如mrna),与合适的调节区(例如启动子)可操纵地连接。基因通常包含若干可操纵地连接的片段,如启动子、5’前导序列、编码区及包含聚腺苷酸化位点的3’非翻译序列(3’末端)。“基因的表达”是指其中与合适的调节区、特别是启动子可操纵地连接的dna区被转录为rna(其是生物活性的,即其能翻译为生物活性蛋白或肽)的过程。术语“同源”当用于表示指定(重组)核酸或多肽分子与给定宿主生物体或宿主细胞之间的关系时,应理解为是指事实上所述核酸或多肽分子是由相同物种、优选相同品种或株系的宿主细胞或生物体产生。如果与宿主细胞同源,则编码多肽的核酸序列将典型(但非必需地)与其自然环境中的另一(异源)启动子序列及如果可行则与另一(异源)分泌信号序列和/或终止子序列可操纵地连接。应理解调节序列、信号序列、终止子序列等也可以与宿主细胞同源。在这种情况中,仅使用“同源”序列元件可以构建“自克隆的”遗传修饰的生物体(gmo's)(自克隆在此如europeandirective98/81/ecannexii所述定义)。当用于表示两个核酸序列的关系时,术语“同源”是指一个单链核酸序列可以杂交互补的单链核酸序列。杂交程度可依赖于许多因素,包括序列之间相同性的量及杂交条件如后文讨论的温度和盐浓度。
关于核酸(dna或rna)或蛋白质所用术语“异源”和“外源”是指不是作为其存在于之中的生物体、细胞、基因组或者dna或rna序列的一部分天然发生的核酸或蛋白质,或者是在与其天然发现的细胞或者基因组或dna或rna序列中的位置不同的细胞或位置发现的核酸或蛋白质。异源和外源核酸或蛋白质对于将其导入之中的细胞不是内源的,而是得自另一细胞或合成或重组产生的。通常,虽然不是必需的,这种核酸编码在所述dna在之中被转录或表达的细胞中正常不产生的蛋白质,即外源蛋白质。相似地,外源rna编码在所述外源rna存在于之中的细胞中正常不表达的蛋白质。异源/外源核酸和蛋白质也可以称作外来核酸或蛋白质。本领域技术人员认为对于其在之中表达的细胞是外来的任何核酸或蛋白质在本文由术语异源或外源核酸或蛋白质涵盖。术语异源和外源还用于核酸或氨基酸序列的非天然组合,即其中组合序列的至少两个序列彼此是外来的。
在本文中酶的“比活性”应理解为是指特定酶的活性量/宿主细胞蛋白质总量,通常以酶活性单位/mg宿主总蛋白质表示。在本发明中,特定酶的比活性与所述酶在野生型宿主细胞(其它方面相同的)中的比活性相比可以增加或降低。
“呋喃化合物”是本文应理解为是2,5-呋喃-二羧酸(fdca)以及具有呋喃基团的可被氧化为fdca的任何化合物,后者在本文被称作“fdca的前体”或者“fdca的呋喃前体”。fdca的前体至少包括:5-羟甲基糖醛(hmf)、2,5-二羟甲基呋喃(dhf或hmf-oh)或者2,5-二(羟甲基)呋喃(bhf)、5-羟甲基-2-呋喃羧酸或者5-羟甲基-2-糠酸(hmfca)、5-甲酰-2-糠酸(ffa)和2,5-二甲酰呋喃(dff)。应进一步了解的是在“呋喃化合物”中,呋喃环或者任何或其可取代的侧基可以在呋喃环中任何可利用的位置例如用oh、c1-c10烷基、烷基、烯丙基、芳基或者ro-醚组分、包括环形基团取代。
本文中在公共序列数据库中可获得的任何提及的核苷酸或氨基酸序列是指在本文件的提交日期可获得的序列条目的形式。
发明详述
表达hmfca脱氢酶的细胞
第一方面,本发明涉及具有将5-羟甲基-2-呋喃羧酸(hmfca)氧化为5-甲酰糠酸(ffa)的能力的细胞。将hmfca氧化为ffa的能力优选通过用包含编码具有将hmfca氧化为ffa的能力的脱氢酶的核苷酸序列的核酸构建体转化细胞而赋予所述细胞或者在所述细胞中增加。所述脱氢酶优选是醇脱氢酶(即具有ec1.1活性)。因此,所述细胞优选是包含表达编码具有将hmfca氧化为ffa的能力的脱氢酶的核苷酸序列的表达构建体的细胞。在本发明优选的细胞中,所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,所述脱氢酶的表达优选赋予所述细胞或增加所述细胞中将hmfca氧化为ffa的能力。所述酶将hmfca氧化为ffa的比活性在所述细胞中与在没有所述表达构建体的相应细胞中相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。
具有将hmfca氧化为ffa的能力的脱氢酶因此是具有hmfca脱氢酶活性的醇脱氢酶。多肽是否具有hmfca脱氢酶活性可以通过将所述多肽在不能将hmfca氧化为ffa的合适宿主细胞中表达并检测所述多肽的表达是否赋予细胞将hmfca氧化为ffa的能力而测定。优选地,如本发明实施例iv所述测定hmfca脱氢酶活性,由此编码待测定hmfca脱氢酶活性的多肽的核苷酸序列替代pbt'hmfh-adh中的c.basilensishmfh基因(在wo2012/064195中描述),之后将包含待测定hmfca脱氢酶活性的多肽的编码序列的质粒导入含有pjnnhmft1(t)的恶臭假单胞菌kt2440agcd(在wo2012064195中描述)。将表达待测定hmfca脱氢酶活性的多肽的恶臭假单胞菌转化体与hmp一起孵育,定期取样品进行fdca分析。与没有待测定hmfca脱氢酶活性的多肽(及hmfh基因)的相应恶臭假单胞菌转化体相比,fdca产量增加表示所述多肽具有hmfca脱氢酶活性。
在本发明的细胞中表达的hmfca脱氢酶优选是依赖于辅因子的脱氢酶,所述辅因子选自腺嘌呤二核苷酸,如nadh或nadph,黄素腺嘌呤二核苷酸(fad),黄素单核苷酸(fmn)及吡咯喹啉喹诺酮(pqq)。
在本发明的细胞中表达的fevifca脱氢酶进一步优选是醇脱氢酶,其(也)具有将其它呋喃醇、优选在第2位具有羟基基团的呋喃醇氧化为相应醛的能力。因此,fevifca脱氢酶优选具有将5-羟甲基糠醛(hmf)氧化为2,5-二甲酰呋喃(dff)的能力。
在一个实施方案中,编码具有将fevifca氧化为ffa的能力的脱氢酶的核苷酸序列选自:
(a)编码具有fevifca脱氢酶活性的多肽的核苷酸序列,所述多肽包含与seqidno:1(aeribacilluspallidus)、seqidno:2(克里不所类芽孢杆菌)、seqidno:3(嗜热地芽孢杆菌)、seqidno:4(aneurinibacillusterranovensis)、seqidno:5(热红短小芽孢杆菌(brevibacillusthermoruber))、seqidno:6(brevibacilluspanacihumi)、seqidno:7(芽孢杆菌fjat-14578)、seqidno:8(库氏脱硫肠状菌)、seqidno:9(desulfurisporathermophila)、seqidno:10(芽孢杆菌l1(2012))和seqidno:11(pelotomaculumthermopropionicum)任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列;
(b)互补链与(a)的核苷酸序列杂交的核苷酸序列;及
(c)序列由于遗传密码简并而与(b)的核苷酸序列不同的核苷酸序列。
本发明优选的核苷酸序列因此编码这样的fevifca脱氢酶,所述脱氢酶具有与可得自(或者天然发生于其中)芽孢杆菌目或梭菌目的细菌的fevifca脱氢酶相同的氨基酸序列。在一个优选的实施方案中,所述细菌是芽孢杆菌科,更优选所述细菌是aeribacillus、地芽孢杆菌属和芽孢杆菌属,最优选是aeribacilluspallidus、克里不所类芽孢杆菌、嗜热地芽孢杆菌、aneurinibacillusterranovensis、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)菌种。在另一优选的实施方案中,所述细菌是类芽孢杆菌科细菌,优选解硫胺素杆菌属和短小芽孢杆菌属菌属,最优选aneurinibacillusterranovensis、热红短小芽孢杆菌和brevibacilluspanacihumi菌种。在再一个优选的实施方案中,所述细菌是消化球菌科细菌,优选脱硫肠状菌属、desulfurispora和pelotomaculum菌属,最优选库氏脱硫肠状菌、desulfurisporathermophila和pelotomaculumthermopropionicum菌种。
在一个实施方案中,本发明优选的核苷酸序列编码来自嗜常温菌的hmfca脱氢酶,即在适中温度、典型在20-45℃最佳生长的细菌。优选地,本发明的核苷酸序列编码嗜常温hmfca脱氢酶,其在20-45℃范围具有最佳活性和稳定性。举例的这种嗜常温脱氢酶是例如来自克里不所类芽孢杆菌(30℃)、aneurinibacillusterranovensis(40℃)、热红短小芽孢杆菌(45℃)、brevibacilluspanacihumi(30℃)、芽孢杆菌fjat-14578(30℃)和芽孢杆菌l1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。
在一个实施方案中,本发明的优选核苷酸序列编码来自嗜热细菌的hmfca脱氢酶,即在相对高温、典型在高于45-122℃最佳生长的细菌。优选地,本发明的核苷酸序列因此编码嗜热hmfca脱氢酶,其在高于45℃-122℃具有最佳活性和稳定性。举例的这种嗜热脱氢酶是例如来自aeribacilluspallidus(55℃)、嗜热地芽孢杆菌(55℃)、库氏脱硫肠状菌(60℃)、desulfurisporathermophila(50℃)、pelotomaculumthermopropionicum(55℃)和芽孢杆菌l1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。
在一个实施方案中,所述核苷酸序列编码是天然发生的具有hmfca脱氢酶活性的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可以编码工程化形式的上文定义的任何hmfca脱氢酶,其与相应天然发生的hmfca脱氢酶相比包含一或多个氨基酸取代、插入和/或缺失,但是仍在本文定义的相同性或相似性范围内。因此,在一个实施方案中,本发明的核苷酸序列编码hmfca脱氢酶,其氨基酸序列在每个不变位置(在表2中用“*”表示)至少包含在不变位置存在的氨基酸。优选地,氨基酸序列在强保守位置(在表2中用“:”表示)也包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在低强度保守位置(在表2中用“.”表示)还包含在低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响hmfca脱氢酶活性。
本发明的编码具有hmfca脱氢酶活性的多肽的核苷酸序列通过使用本领域熟知的分离核苷酸序列的方法可得自真菌、酵母或细菌的基因组和/或cdna,例如与上述来源生物体属于相同的门、纲或者属(见例如sambrookandrussell(2001)"molecularcloning:alaboratorymanual(3rdedition),coldspringharborlaboratory,coldspringharborlaboratorypress,newyork)。本发明的核苷酸序列例如可以在这样的方法中获得,其中a)对合适生物体的基因组和/或cdna使用简并pcr引物(基于保守氨基酸序列设计)以产生包含编码具有hmfca脱氢酶活性的多肽的核苷酸序列的一部分的pcr片段;b)在a)中获得的pcr片段用作探针筛选所述生物体的cdna和/或基因组文库;及c)产生包含编码具有hmfca脱氢酶活性的多肽的核苷酸序列的cdna或基因组dna。
为了增加本发明的hmfca脱氢酶在本发明转化的细胞中以足够水平及活性形式表达的可能性,优选调适编码这些酶以及本发明的其它酶(见下文)的核苷酸序列以将其密码子使用优化为在讨论的宿主细胞中的密码子使用。编码多肽的核苷酸序列对于宿主细胞的密码子使用的适应性可以用密码子适应指数(cai)表示。密码子适应指数在本文定义为测量基因的密码子使用相对于在特定宿主细胞或生物体中高表达基因的密码子使用的相对适应性。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸最丰富的密码子的使用的比率。cai指数定义为这些相对适应性值的几何平均数。除外非同义密码子和终止密码子(根据遗传密码而定)。cai值范围是0-1,较高数值表示较高比例的最丰富密码子(见sharpandli,1987,nucleicacidsresearch15:1281-1295;也见jansenetal.,2003,nucleicacidsres.31(8):2242-51)。经调适的核苷酸序列优选cai为至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。最优选是seqidno:13或14所示序列,其已经经过密码子优化以在恶臭假单胞菌细胞中表达。
用核酸构建体转化以表达编码本发明hmfca脱氢酶的核苷酸序列的宿主细胞原则上可以是任何宿主细胞,其中本发明的hmfca脱氢酶可以适当地表达,优选以功能性即以活性形式表达。本发明的宿主细胞优选是能将呋喃化合物主动或者被动转运进细胞以及转运出细胞的宿主。优选的本发明宿主细胞缺乏或者没有可检测的使羧化的呋喃化合物如特别是hmfca、ffa和fdca脱羧的活性。这种宿主细胞优选天然缺乏使羧化的呋喃化合物脱羧的能力。
优选地,所述宿主细胞是培养的细胞,例如可以在发酵方法、优选在深层发酵中培养的细胞。
根据一个实施方案,本发明的宿主细胞是真核宿主细胞。优选地,所述真核细胞是哺乳动物、昆虫、植物、真菌或者藻类细胞。优选的哺乳动物细胞包括例如中国仓鼠卵巢(cho)细胞、cos细胞、293细胞、perc6细胞和杂交瘤。优选的昆虫细胞包括例如sf9和sf21细胞及其衍生物。
然而,优选宿主细胞是微生物细胞。所述细胞可以是真核微生物细胞,优选真菌细胞,如酵母或丝状真菌细胞。优选的酵母宿主细胞包括例如来自如下酵母属的细胞,如假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属及耶氏酵母属。更优选来自如下酵母种的酵母,如乳酸克鲁维酵母、酿酒酵母、多形汉逊酵母、解脂耶氏酵母和巴斯德毕赤酵母。优选的丝状真菌细胞包括例如如下丝状真菌属的细胞:支顶孢属、伞菌属、曲霉属、短梗霉属、毁丝霉属、金孢子菌属、鬼伞属、隐球菌属、filibasidium、镰刀菌属、腐殖霉属、稻瘟菌属、毛霉菌属、毁丝霉属、新丽鞭毛菌属、脉孢菌属、拟青霉属、青霉菌属、梨囊鞭菌属、原毛平革菌属、侧耳属、裂褶菌属、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属和木霉属。优选的丝状真菌细胞属于如下种:曲霉属、毁丝霉属、青霉菌属、毁丝霉属、踝节菌属或者木霉属,最优选选自如下种:黑曲霉、泡盛曲霉、臭曲霉、酱油曲霉、烟曲霉、埃默森踝节菌、米曲霉、嗜热毁丝霉、里氏木霉和产黄青霉菌。
微生物宿主细胞也可以是原核细胞,优选细菌细胞。属于“细菌细胞”包括革兰氏阴性和革兰氏阳性微生物。合适的细菌可选自埃希氏菌属、鱼腥藻属、aeribacillus、解硫胺素杆菌属、伯克霍尔德氏菌属、慢生根瘤菌属、柄杆菌属、贪铜菌属、脱硫肠状菌属、desulfurispora、葡糖杆菌属、红杆菌属、pelotomaculum、假单胞菌属、副球菌属、芽孢杆菌属、地芽孢杆菌属、短小芽孢杆菌属、短杆菌属、棒杆菌属、根瘤菌属(中华根瘤菌属)、黄杆菌属、克雷伯氏菌属、肠杆菌属、乳杆菌属、乳球菌属、甲基杆菌属、罗尔斯通氏菌属、红假单胞菌属、葡萄球菌属和链霉菌属。优选地,细菌细胞选自如下菌种:a.pallidus、a.terranovensis、枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、克里不所类芽孢杆菌、地衣芽孢杆菌、b.puntis、巨大芽孢杆菌、耐盐芽孢杆菌、短小芽孢杆菌、热红短小芽孢杆菌、b.panacihumi、c.basilensis、库氏脱硫肠状菌、d.thermophila、嗜热地芽孢杆菌、氧化葡糖杆菌、新月柄杆菌cb15、扭托甲基杆菌、类球红细菌、pelotomaculumthermopropionicum、pseudomonaszeaxanthinifaciens、恶臭假单胞菌、paracoccusdenitrificans、大肠杆菌、谷氨酸棒杆菌、肉葡萄球菌、变铅青链霉菌、苜蓿中华根瘤菌和rhizobiumradiobacter。在恶臭假单胞菌菌种中,优选恶臭假单胞菌s12和恶臭假单胞菌kt2440菌株。
对于在本发明宿主细胞中产生的化合物的特异性应用,可以根据这种应用选择宿主细胞。在其中例如在本发明的宿主细胞中产生的化合物用于食品应用时,宿主细胞可选自食品级生物体如酿酒酵母。特异性应用包括但不限于食品、(动物)饲料、药物、农业如作物保护,和/或个人护理应用。
表达编码本发明hmfca脱氢酶的核苷酸序列的表达构建体优选是与用所述构建体转化的宿主细胞异源或外源的表达构建体。当构建体包含不是在宿主细胞中天然发生的至少一个序列或序列元件和/或构建体包含不是在宿主细胞中天然发生的组合和/或顺序的至少两个序列元件时,即使所述元件自身在宿主细胞中天然发生,所述构建体在本文应理解为对于包含所述构建体的宿主细胞是异源或外源的。
在适当宿主细胞中表达编码本发明fdvifca脱氢酶的核苷酸序列的载体和表达构建体在下文更详细描述。
表达本发明的fdvifca脱氢酶的转化的细胞进一步优选具有醛脱氢酶活性(即具有ec1.2活性)。优选地,醛脱氢酶活性能转化呋喃醛。更优选地,醛脱氢酶活性能将呋喃醛氧化为相应呋喃羧酸。更特别地,醛脱氢酶活性优选能够进行如下至少之一:i)将hmf氧化为hmfca,ii)将2,5-二甲酰呋喃(dff)氧化为5-甲酰-2-糠酸(ffa),及iii)将ffa变为fdca。这种呋喃醛脱氢酶活性可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过用第二表达构建体转化细胞赋予或者增加细胞的呋喃脱氢酶活性。在本发明优选的细胞中,第二表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃醛脱氢酶的表达优选赋予所述细胞或增加所述细胞中i)将hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca中至少之一的能力。呋喃醛脱氢酶的比活性在所述细胞中与没有所述表达构建体的相应细胞相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。第二表达构建体优选包含编码多肽的核苷酸序列,所述多肽:
a)具有i)将hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca的能力至少之一;及
b)包含与seqidno:24、25、26、27、28、29和30任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。
多肽将i)hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca的至少之一的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌kt2440宿主细胞中将编码所述多肽的核苷酸序列与来自c.basilensishmf14的hmfh和hmft1基因一起共表达而测定,将恶臭假单胞菌细胞在10mmfdvif中孵育并检测与不表达所述多肽的相应恶臭假单胞菌细胞相比fdca累积的增加情况,例如wo2012/064195的实施例iv所述。多肽将hmf氧化为hmfca的能力也可以如koopmanetal2010,pnas(supra)所述测定。表达来自c.basilensishmf14的hmft1基因的菌株在本文应理解为表达具有seqidno:31所示氨基酸序列的基因产物。
表达本发明的hmfca脱氢酶的转化的细胞进一步优选具有将呋喃化合物转运进和/或转运出细胞的能力。优选所述细胞具有将是fdca前体的呋喃化合物转运进细胞的能力及优选将fdca转运出细胞的能力。这种呋喃化合物转运能力可以是细胞的内源能力和/或可以是赋予细胞的外源能力。因此,本发明优选的细胞表达具有呋喃化合物转运能力的多肽。更优选地,所述细胞表达具有hmfca转运能力的多肽。hmfca转运能力应理解为是至少包括将hmfca转运进细胞的能力。具有hmfca转运能力的多肽的表达将增加hmfca转运进细胞,这增加了其在细胞内转化为fdca的可用性。因此可以改良hmfca生物转化。
优选地,将呋喃化合物转运进和/或转运出细胞的能力是通过用第三表达构建体转化细胞而赋予所述细胞或增加的。在本发明优选的细胞中,第三表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃化合物转运多肽的表达优选赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力。第三表达构建体优选包含编码多肽的核苷酸序列,所述多肽:
a)具有至少hmfca转运能力;及
b)包含与seqidno:17、31、32、33和34任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。
多肽将呋喃化合物、特别是hmfca转运进细胞的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌kt2440宿主细胞中将编码所述转运多肽的核苷酸序列与来自c.basilensishmf14的hmfh基因及与来自c.basilensishmf14的hmf-降解操纵子相关的编码呋喃醛脱氢酶的基因(具有wo2012/064195中seqidno:19所示氨基酸序列)一起共表达而测定,将恶臭假单胞菌细胞在10mmhmf中孵育并检测与不表达所述转运多肽的相应恶臭假单胞菌细胞相比fdca累积的增加情况,例如wo2012/064195的实施例iv所述。
在一个实施方案中,所述核苷酸序列编码天然发生的具有hmfca转运能力的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可编码工程化形式的具有上文定义的hmfca转运能力及与相应天然发生的具有hmfca转运能力的多肽相比包含一或多个氨基酸取代、插入和/或缺失但是在本文定义的相同性或相似性范围内的任何多肽。因此,在一个实施方案中,本发明的核苷酸序列编码具有hmfca转运能力的多肽,其氨基酸序列在每个不变位置(在表3中以“*”表示)至少包含在不变位置存在的氨基酸。优选地,所述氨基酸序列在强保守位置(在表3中以“:”表示)还包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在较低强度保守位置(在表3中以“.”表示)还包含在较低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响hmfca转运能力。
本发明的编码具有hmfca转运能力的多肽的核苷酸序列可得自真菌、酵母或细菌的基因组和/或cdna,例如属于与上述来源生物体相同的门、纲或属,使用本领域技术人员熟知的分离核苷酸序列的方法以与上述用于编码本发明hmfca脱氢酶的核苷酸序列的相似方式获得。
表达呋喃化合物转运蛋白的细胞
第二方面,本发明涉及表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的细胞。优选将所述细胞用表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的表达构建体转化。具有呋喃化合物转运能力的多肽优选是具有hmfca转运能力的多肽,其至少包括将hmfca转运进细胞的能力。优选所述细胞包含表达编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列的表达构建体,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力。多肽将呋喃化合物、特别是hmfca转运进细胞的能力可以如上述测定。
优选地,本发明这个方面的表达呋喃化合物转运蛋白的转化的细胞进一步包含将hmf转化为fdca的酶活性。其中将hmf转化为fdca的活性优选包括如下至少之一:
a)醇脱氢酶活性,其将hmfca氧化为ffa,及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及
b)氧化还原酶、优选氧化酶活性,其将hmf、2,5-二羟甲基呋喃、hmfca、ffa和2,5-二甲酰呋喃的一或多个氧化为fdca,及任选醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。
将fdvifca氧化为ffa的醇脱氢酶活性及氧化呋喃醛的醛脱氢酶活性优选如上文定义。将hmf、2,5-二羟甲基呋喃、fdvifca、ffa和2,5-二甲酰呋喃的一或多个氧化为fdca的氧化还原酶是具有ec1.1和ec1.2活性的氧化还原酶,如wo2011/026913所述。
除非特别指出,本发明这方面的表达呋喃化合物转运蛋白的转化的细胞进一步可具有上述本发明第一方面的表达fdvifca脱氢酶的细胞的特性。
表达本发明多肽的载体和构建体和方法
本发明另一方面涉及核酸构建体,如载体,包括克隆和表达载体,其包含本发明的多核苷酸,例如编码hmfca脱氢酶或者本发明的转运蛋白或者其功能等价物的核苷酸序列,及在合适的宿主细胞中生长、转化或转染这种载体的方法,例如在其中发生本发明多肽表达的条件下进行。如本文所用,术语“载体”和“构建体”可互换使用,是指包含及优选能转运本发明的多核苷酸的构建的核酸分子。
本发明的多核苷酸可以掺入重组可复制载体中,例如克隆或表达载体。所述载体可用于在相容的宿主细胞中复制核酸。因此,在进一步的实施方案中,本发明提供了一种产生本发明多核苷酸的方法,通过将本发明的多核苷酸导入可复制载体中,将所述载体导入相容的宿主细胞中,及将所述宿主细胞在使得所述载体复制的条件下生长进行。所述载体可以从宿主细胞中回收。合适的宿主细胞如上文所述。
其中插入本发明的表达盒或多核苷酸的载体可以是可便利地进行重组dna程序的任何载体,所述载体的选择通常依赖于其被导入之中的宿主细胞。
本发明的载体可以是自主复制载体,即以染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒。或者,所述载体可以是当被导入宿主细胞中时整合进宿主细胞基因组中并与其被整合进之中的染色体一起复制的载体。
一种类型的载体是“质粒”,其是指环形双链dna环,其中可以连接另外的dna节段。另一类型载体是病毒载体,其中另外的dna节段可以连接在病毒基因组中。某些载体在其被导入之中的宿主细胞中能自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)在导入宿主细胞中时被整合进宿主细胞基因组中,从而随着宿主基因组一起复制。此外,某些载体能指导其可操纵地连接的基因的表达。这种载体在本文被称作“表达载体”。通常,用于重组dna技术中的表达载体通常是质粒形式。术语“质粒”和“载体”在本文可互换使用,质粒是最常用的载体形式。然而,本发明包括这种其它形式的表达载体,如粘粒、病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺相关病毒)和噬菌体载体,其发挥等价功能。
本发明的载体可在体外用于例如产生rna或者用于转染或转化宿主细胞。
本发明的载体可包含两或更多个、例如3、4或5个本发明的多核苷酸以例如过表达。
本发明的重组表达载体包含以适于在宿主细胞中核酸表达的形式的本发明的核酸,这意味着重组表达载体包含基于用于表达的宿主细胞选择的一或多个调节序列,其与被表达的核酸序列可操纵地连接。与编码序列“可操纵地连接”的调节序列如启动子、增强子或者其它表达调节信号以这样的方式安置,即编码序列的表达在与控制序列相容的条件下实现,或者如此安排序列以便其功能与其指定目的一致,例如转录在启动子起始并经由编码多肽的dna序列继续进行。术语“调节序列”或者“控制序列”包括启动子、增强子及其它表达控制元件(例如聚腺苷酸化信号)。这种调节序列在例如goeddel;geneexpressiontechnology:methodsinenzymology185,academicpress,sandiego,ca(1990)中描述。术语调节或控制序列包括指导核苷酸序列在许多类型宿主细胞中组成型表达的那些序列以及指导核苷酸序列仅在某一宿主细胞中表达的那些序列(例如组织特异性调节序列)。
用于指定宿主细胞的载体或表达构建体因此可以包含从相对于编码本发明多肽的序列的编码链的5’末端至3’末端以连续顺序彼此可操纵地连接的如下元件:(1)启动子序列,其能指导编码多肽的核苷酸序列在指定宿主细胞中转录;(2)翻译起始序列,如真核细胞kozak共有序列或者原核细胞核糖体结合位点/shine-dalgarno序列;(3)任选包括信号序列,其能指导多肽从指定宿主细胞分泌进培养基中;(4)本发明的编码成熟及优选活性形式本发明多肽的dna序列,及优选还包含(5)转录终止区(终止子),其能终止编码多肽的核苷酸序列下游的转录。
本发明核苷酸序列的下游可以是3’非翻译区,其含有一或多个转录终止位点(例如终止子)。终止子的来源不关键。终止子例如对于编码多肽的dna序列可以是天然的。然而,优选酵母终止子用于酵母宿主细胞中,丝状真菌终止子用于丝状真菌宿主细胞中。更优选地,终止子对于宿主细胞(其中编码多肽的核苷酸序列被表达)是内源的。在转录区中,可以存在核糖体结合位点以进行翻译。由构建体表达的成熟转录物的编码部分包括在起始处的翻译起始aug及适当位于被翻译的多肽的末端的终止密码子。
本发明的多核苷酸的增强表达也可以通过选择异源调节区如启动子、分泌前导序列和/或终止区而实现,其可以增加表达,及如果需要时增加感兴趣的蛋白质从表达宿主的分泌水平和/或为本发明多肽的表达提供可诱导的控制。
本领域技术人员应意识到表达载体的设计可以依赖于如转化的宿主细胞的选择、希望的蛋白质表达水平等因素。本发明的载体如表达载体可以被导入宿主细胞中,从而产生由本文所述核酸编码的蛋白质或肽(例如本发明的hmfca脱氢酶或转运蛋白、其突变体形式、片段、变体或者功能等价物、融合蛋白等)。
如上文所述,术语“控制序列”或者“调节序列”在本文定义为包括至少为多肽的表达必需的和/或有利的任何成分。任何控制序列对于本发明编码多肽的核酸序列均可以是天然或外来的。这种控制序列可包括但不限于启动子、前导序列、优化翻译起始序列(如kozak,1991,j.biol.chem.266:19867-19870所述)或者原核细胞shine-delgarno序列、分泌信号序列、前肽序列、聚腺苷酸化序列、转录终止子。控制序列最低限度地典型包括启动子和翻译起始和终止信号。
稳定转化的微生物是具有导入的一或多个dna片段的微生物,由此在生长培养中导入的分子得以维持、复制和隔离。稳定转化可以是由于多个或单一染色体整合或者通过染色体外元件如质粒载体所致。质粒载体能指导由特定dna片段编码的多肽的表达。
表达可以是组成型表达或者由可诱导(可抑制)启动子调节的,使得功能相关的编码特定多肽的dna片段高水平转录。
无论用于表达本发明多肽的实际机制如何,预期这种表达是可以通过使用本领域已知的方法在另一宿主细胞中导入编码这些多肽的基因而转移的。如本文定义的遗传元件包括具有产物如蛋白质、特别是酶的可表达编码序列的核酸(通常为dna或rna),脱辅基蛋白或者反义rna,其表达或调节相关多肽的表达。表达的蛋白质可以发挥酶的功能,抑制或阻抑酶活性或者控制酶的表达或者发挥化合物如代谢物的转运蛋白的功能。编码这些可表达序列的重组dna可以是染色体(通过例如同源重组整合进宿主细胞染色体中)或者染色体外(例如由一或多个质粒、粘粒及能自身复制的其它载体携带)dna。应理解用于转化根据本发明的宿主细胞的重组dna除了结构基因和转录因子之外还可包括表达控制序列,包括启动子、阻抑物和增强子,其控制蛋白质的编码序列、脱辅基蛋白或反义rna的表达或脱阻抑。例如,这种控制序列可以插入野生型宿主细胞中以促进已经在宿主细胞基因组中编码的选择的多肽的过表达,或者另外其可用于控制染色体外编码的多肽的合成。
重组dna可以通过任何方式导入宿主细胞中,包括但不限于质粒、粘粒、噬菌体、酵母人工染色体或者其它载体,其介导遗传元件转移进宿主细胞中。这些载体可包括复制起点,以及顺式作用控制元件,其控制载体及由载体携带的遗传元件的复制。可选择的标记可以存在于载体上以帮助鉴别其中已经导入遗传元件的宿主细胞。
将遗传元件导入宿主细胞的方式(例如克隆)为本领域技术人员熟知。技术人员可利用染色体外多拷贝质粒载体插入根据本发明的遗传元件。遗传元件经质粒导入宿主细胞中包括最初用限制酶裂解质粒载体,随后将质粒与编码根据本发明的靶向酶的遗传元件连接。在连接的重组质粒再环化时,使用感染(例如在噬菌体λ中包装)或其它质粒转移机制(例如电穿孔、显微注射等)将质粒转移进宿主细胞中。适于将遗传元件插入宿主细胞中的质粒为本领域技术人员熟知。
其它基因克隆方法包括但不限于将遗传材料定向整合进染色体中。这可以通过多种方式进行,包括在两侧是宿主染色体的同源dna序列的非复制质粒上克隆本文所述遗传元件;在所述重组质粒转化进宿主中时,遗传元件通过dna重组可以被导入染色体中。如果整合dna片段含有可选择标记如抗生素抗性,则可以回收这种重组菌株。或者,遗传元件可以不使用非复制质粒而直接导入宿主细胞染色体中。这可以通过合成产生也含有宿主染色体的同源dna序列的本发明的遗传元件的dna片段而实现。再次,如果这些合成的dna片段也含有可选择标记,则可以将遗传元件插入宿主染色体中。
本发明进一步涉及制备具有本发明hmfca脱氢酶活性的多肽和/或具有本发明呋喃化合物转运能力的多肽的方法,所述方法包括在有益于所述多肽表达的条件下培养本发明的细胞,及任选回收表达的多肽,本发明还涉及通过这种方法可获得的多肽。
氧化呋喃化合物的方法
再一方面,本发明涉及氧化呋喃化合物的方法。特别地,本发明涉及其中fdca的呋喃前体被氧化的方法。本发明的方法可包括单次氧化反应步骤获得产物(例如hmfca氧化为ffa)。或者,本发明的方法可包括多于一个的氧化反应步骤,每个步骤均获得中间物,其中最后的中间物是终产物。其中hmf在相继的氧化步骤中被氧化为fdca的这种一系列的步骤例如包括:1)首先将hmf氧化为hmfca,后者在第二个步骤中被氧化为ffa,ffa随后最终被氧化为fdca,或者如dijkmanetal.(2014,angew.chem.53(2014)6515-8)所述2)首先将hmf氧化为dff,dff在第二个步骤中被氧化为ffa,ffa随后被最终氧化为fdca。因此,在优选的本发明方法中,fdca的一或多个呋喃前体在一系列步骤中被最终氧化为fdca。
在一个实施方案中,本发明涉及包括至少将hmfca氧化为ffa的方法。优选地,所述方法是将hmfca氧化为ffa的方法,其中所述方法包括将细胞在存在hmfca条件下孵育的步骤,其中所述细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选所述细胞在存在hmfca在有益于细胞氧化hmfca的条件下孵育,如下文详细说明。
在另一个实施方案中,本发明涉及产生fdca的方法。产生fdca的方法优选包括将细胞在包含fdca的一或多种呋喃前体的培养基中孵育的步骤,其中所述细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选将所述细胞在存在hmfca在有益于细胞将fdca的呋喃前体氧化为fdca的条件下孵育,如下文详细说明。
优选在所述方法中,fdca的至少一种呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。fdca的呋喃前体优选得自一或多种己糖,优选通过常规方式的酸催化的脱水获得,例如通过在存在酸的条件下加热。从果糖产生hmf的技术已经充分确立及强力(见例如vanputtenetal.,2013,chem.rev.113,1499-1597)。也可以利用葡萄糖富集的源料,但是从果糖更有效地热化学形成hmf。因此,可包括另外的酶促步骤以使用葡萄糖异构酶将葡萄糖转化为果糖。后一方法在食品工业中充分确立,例如从水解淀粉产生高果糖玉米糖浆(hfcs)。葡萄糖也可以通过使用催化剂与溶剂组合经化学异构为果糖,例如vanputtenetal.(2013,supra)所述。
己糖通常得自生物质。术语“生物质”应理解为是指来自农业(包括植物如作物残余物,及动物物质)、林业(如木材资源)及相关工业包括渔业和水产业的生物学来源的可生物降解的产物、废物和残余物级分,以及可生物降解的工业和城市垃圾如市政固体垃圾或废纸的级分。在一个优选的实施方案中,生物质是植物生物质,更优选(可发酵的)己糖/葡萄糖/糖富集的生物质,例如甘蔗,含有淀粉的生物质,例如小麦粒或者玉米秸秆,或者甚至谷粒如玉米、小麦、大麦或者其混合物。优选的是天然富集果聚糖的农作物(例如洋姜或菊苣根)。
己糖可以通过水解这种生物质而获得。水解生物质的方法为本领域已知,包括使用例如蒸气和/或糖酶如葡糖淀粉酶获得。
用于本发明方法中的另一优选类型的生物质是所谓的“第二代”木质纤维素原料,如果以更持续方式生产大体积fdca,则优选这种生物质。木质纤维素原料可以得自专用的能源作物,例如在边缘土地生长,因此与粮食作物不直接竞争。或者木质纤维素原料可以作为副产物获得,例如市政固体垃圾、废纸、木材剩余物(包括锯木和造纸废物),可以考虑作物残余物。举例的作物残余物包括甘蔗渣及一些玉米和小麦废物。在玉米副产物的情况中,三种废物是纤维、玉米棒和秸秆。此外,林业生物质可用作原料。为了将二代原料转化为本发明的发酵产物,纤维素和半纤维素需要释放为单糖。因此,应用热化学方法(通常称作预处理)、酶促方法或者两种方法的组合。预处理可以完全释放糖,或者使得聚合化合物对于随后的酶攻击更易于接近。不同类型的预处理包括液体热水、蒸汽喷发、酸预处理、碱预处理,以及离子液体预处理。各种化合物的相对量依赖于使用的原料和应用的预处理方法。为了从这种木质纤维素原料释放单糖,应用合适的糖酶,包括例如阿拉伯糖酶、木聚糖酶、葡聚糖酶、淀粉酶、纤维素酶、葡聚糖酶等。
本发明的方法进一步优选包括回收在所述方法中产生的氧化产物如fdca或hmfca的步骤。优选地,从孵育进行氧化步骤的细胞的培养基中回收氧化产物。氧化产物如fdca、fdvifca等可以从反应混合物或者培养基中回收,通过例如(酸或盐)沉淀、随后冷却结晶及分离结晶的氧化产物如结晶的fdca。然而,其它回收方法也是适用的,例如本领域已知的酸或盐沉淀及溶剂提取。回收fdca的盐沉淀方法可以例如使用二价(金属)阳离子如mg2+进行。
氧化反应优选在对于细胞及细胞中包含的氧化还原酶最佳的温度进行。因此,在嗜热细胞和酶的情况中,温度优选是45℃或更高,例如45-122℃的范围,例如高于50、55、60或65℃。然而,在含有来自嗜常温微生物的酶的嗜常温细胞的情况中,氧化反应优选在相对中等温度进行,例如10-80℃,更优选20-45℃,最优选大约25-40℃。
氧化反应优选在其中fdca是中性形式或完全解离形式的ph进行,由此可以控制盐形成。鉴于在fdca中存在两个酸部分,因此有两个单独优选的ph范围。在反应期间的ph可以是ph1-6,优选ph1-4,最优选ph1-3。或者,在反应期间的ph可以是ph5-9,优选ph5-8,最优选ph5-7。技术人员理解宿主细胞的要求也影响所述方法的合适ph值的选择。适于特定宿主细胞的ph值的选择在技术人员的技术范围内,可以得自标准教科书。对于恶臭假单胞菌、包括如恶臭假单胞菌s12或kt2440菌株,优选的ph范围是ph5-7。
反应时间可以是6-150小时,更优选6-18小时。优选从氧源为反应培养基中的细胞提供氧,所述氧源如分子氧,例如纯氧或者于空气中氧,或者水,或者根据呋喃氧化酶的要求而不同的氧源。可以便利地使用空气作为分子氧的来源。
反应器可以是任何合适的(充气)生物反应器。反应器可以分批、持续或者优选补料分批操作。
本发明的氧化呋喃化合物的方法可有利地用于从认为其中的呋喃化合物是有害的原料中消除呋喃化合物,如用于发酵产生生物燃料和生化品的原料。更优选地,氧化呋喃化合物的方法用于fdca的生物生产,其作为单体前体以产生聚酯(塑料),其中fdca在聚酯pet中可以代替pta,在这种情况中获得生物基聚呋喃二甲酸乙二醇酯(pef)。fdca也可以用作大量有价值化合物的底物,包括例如用作生产琥珀酸、2,5-二(氨基甲基)-四氢呋喃、2,5-二羟甲基-四氢呋喃、2,5-二羟甲基呋喃和2,5-呋喃二甲醛(2,5-furandicarbaldehyde)的底物。fdca可用于生产涂层,例如在醇酸树脂和热塑涂层中。其也可以在生物燃料中用作二甲苯等价物及作为溶剂。fdca可以被酯化,所述酯可用作增塑剂。fdca可以转化为其二醇,可用于pet样聚酯和聚氨酯中。进一步地,fdca可以转化为其二胺,二胺可以用作扩链剂,及二胺可以转化为二异氰酸酯,其可用于聚氨酯的生产中。
因此,本发明再一方面涉及从一或多个fdca单体生产聚合物的方法,所述方法包括如下步骤:a)在如上述本发明的氧化方法中制备fdca单体;及b)从在a)中获得的fdca单体产生聚合物。优选所述聚合物是聚呋喃二甲酸乙二醇酯(pef)。
再一方面,本发明涉及本发明细胞在将一或多个fdca呋喃前体生物转化为fdca中的应用,其中细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选地,被生物转化为fdca的至少一种fdca呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。
hmfca脱氢酶多肽及编码hmfca脱氢酶的核酸
另一方面,本发明涉及具有hmfca脱氢酶活性的多肽。具有hmfca脱氢酶活性的多肽包含或者由与seqidno:1(aeribacilluspallidus)所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。
本发明进一步涉及核酸分子,其包含如下至少之一:
a)编码具有hmfca脱氢酶活性的多肽的核苷酸序列,所述多肽包含或者由与seqidno:1所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸组成;
b)seqidno:12或13所示核苷酸序列;
c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所述核苷酸序列不同的核苷酸序列;及
e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。
本发明另一方面涉及载体,包括克隆载体和表达载体,其包含如本章节中上文a)-e)所述核苷酸序列,所述载体其它方面如上文所述。
再一方面,本发明涉及包含i)具有如本章节上文定义的hmfca脱氢酶活性的多肽及ii)本章节上文定义的核酸分子的至少之一的细胞。优选所述细胞是包含本章节上文a)-e)定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或培养的细胞,所述细胞优选其它方面如上文定义及优选所述细胞包含如上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。
呋喃化合物转运多肽及编码这种转运多肽的核酸
再一方面,本发明涉及具有呋喃化合物转运能力的多肽。所述多肽优选至少具有将hmfca转运进细胞的能力。优选所述多肽包含或者由与seqidno:17(aeribacilluspallidus)所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但是其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。
本发明进一步涉及核酸分子,其包含如下至少之一:
a)编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含或者由与seqidno:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;
b)seqidno:18所示核苷酸序列;
c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所示核苷酸序列不同的核苷酸序列;及
e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。
本发明另一方面载体,包括克隆载体和表达载体,其包含如本章节上文a)-e)定义的核苷酸序列,所述载体其它方面如上文所述。
再一方面,本发明涉及包含如下至少之一的细胞:i)如本章节上文定义具有呋喃化合物转运能力的多肽,及ii)如本章节上文定义的核酸分子。优选所述细胞是包含如本章节上文a)-e)定义的核苷酸序列或者用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或者培养的细胞,所述细胞优选其它方面如上文所述及优选所述细胞包含上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。
在本文及其权利要求书中,动词“包含”及其词形变化以非限制性含义使用,意味着包括在该单词后面的项目,但不除外未特别提及的项目。此外,以不定冠词“一个”或“一种”提及某元件时不除外存在超过一个/一种元件的可能性,除非文中明确要求是有一个及仅此一个元件。不定冠词“一个”或“一种”因此通常是指“至少一个/一种”。
本说明书中引用的所有专利及参考文献均以其全部内容并入本文作参考。
如下实施例只是例证本发明,无以任何方式限制本发明范围之意。
附图描述
图1a:恶臭假单胞菌ca2046对hmf的生物转化(恶臭假单胞菌;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。
图1b:恶臭假单胞菌ca2101对hmf的生物转化;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。
图2:恶臭假单胞菌ca2111对hmf的生物转化,共表达yiay与来自c.basilensishmf14的aldh和hmft1;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。图中示出一式两份培养物的平均值。
图3:恶臭假单胞菌ca2112对hmf的生物转化,共表达yiay与来自c.basilensishmf14的aldh和hmft1;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。图中示出一式两份培养物的平均值。
图4:恶臭假单胞菌ca21780对hmf的生物转化,共表达来自克里不所类芽孢杆菌dsm17871的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dbf”。
图5:恶臭假单胞菌ca21781对hmf的生物转化,共表达来自aneurinibacillusterranovensisdsm18919的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dhf”。
图6:恶臭假单胞菌ca21783对hmf的生物转化,共表达来自brevibacilluspanacihumiw25的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dhf”。
实施例
一般方法
菌株与质粒
恶臭假单胞菌s12agcd或者恶臭假单胞菌kt2440agcd(分别为恶臭假单胞菌s12(atcc700801)和恶臭假单胞菌kt2440(dsm6125)的葡萄糖-脱氢酶缺陷型突变体)或者野生型恶臭假单胞菌s12用作宿主以表达来自aeribacilluspallidus菌株ca1828的yiay基因(见下文)。大肠杆菌菌株tg90用于一般克隆目的。
为了附加型表达a.pallidus基因,使用pbbr1mcs衍生的pbt’mcs(koopmanetal.,2010a,biorestechnol101:6291-6196)。在pbt’mcs中,靶基因的表达由组成型tac启动子驱动。
培养基&培养条件
嗜常温无机盐培养基(mmm)含有如下成分(每升去矿物质水):15.52g的k2hpo4、6.52g的nah2po4、2.0g的(nh4)2so4、0.1g的mgcl2.6h2o、10mg的edta、2mg的znso4.7h2o、1mg的cacl2.2h2o、5mg的feso4.7h2o、0.2mg的na2moo4.2h2o、0.2mg的cuso4.5h2o、0.4mg的cocl2.6h2o及1mg的mncl2·2h2o,按照说明补充碳源。
嗜热矿物质盐培养基(tmm)含有如下成分(每升去矿物质水):10g的bis-tris、10μmfeso4·7h2o、4mm三甲基甘氨酸、1.32mmk2hpo4、9.53mmnh4cl、0.2g酵母提取物、5g的nacl、1.47g的na2so4、0.08g的nahco3、0.25g的kcl、1.87g的mgcl2.6h2o、0.41g的cacl2.2h2o、0.008g的srcl2.6h2o、0.008g的h3bo3、0.90g的nano3和1ml的维生素溶液(硫胺素,0.1g/l;核黄素,0.1g/l;烟酸,0.5g/l;泛酸,0.1g/l;吡哆胺-hcl,0.5g/l;吡哆醛-hcl,0.5g/l;d-生物素,0.1g/l;叶酸,0.1g/l;对氨基苯甲酸,0.1g/l;维生素b12,0.1g/l)。按照说明补充碳源。
作为增殖嗜常温微生物的完全培养基,使用luria-bertani(lb)肉汤:10g/lbacto胰蛋白胨(difco)、5g/l酵母提取物(difco)、10g/lnacl。对于平板培养,将lb用1.5%(w/v)琼脂(difco)固化。为了选择携带pbt’mcs衍生质粒的大肠杆菌、恶臭假单胞菌s12或恶臭假单胞菌kt2440转化株,将50μg/ml卡那霉素(km)加入培养基中。抗生素购自sigma-aldrich。将恶臭假单胞菌在30℃培养,大肠杆菌在37℃培养。
作为增殖嗜热微生物的完全培养基,使用tgp肉汤:17g/l胰蛋白胨、3g/l大豆胨、5g/lnacl、2.5g/lk2hpo4、4g/l甘油和4g/l丙酮酸钠(ph7)。对于平板培养,将tgp用1.5%(w/v)琼脂(difco)固化。将aeribacilluspallidus在60℃培养。
测定&分析方法
细胞干重(cdw)测量:
细菌培养物的cdw含量通过使用biowavecelldensitymeter(wpaltd)或者μquantmqx200通用微平板分光光度计(biotek)使用平底96孔微平板(greiner)测量在600nm的光密度(od600)而确定。对于恶臭假单胞菌,1.0的od600相应于0.56gcdw/l(biowave)或者1.4gcdw/l(μquant)。
hplc分析:
如koopmanetal.(2010a,biorestechnol101:6291-6196)所述,通过rp-hplc分析呋喃化合物(fdca、hmf、hmf-醇、hmfca和ffa)。
化学品
5-羟甲基糠醛(hmf)购自eurolabsltd(poynton,uk)。fdca和5-羟甲基-糠酸(fdvifca)的分析标准物分别购自immunosourceb.v.(halle-zoersel,belgium)和matrixscientific(columbiasc,usa)。所有其它化学品购自sigma-aldrichchemieb.v.(zwijndrecht,thenetherlands)。
分子和遗传技术:
使用masterpuretm革兰氏阳性dna纯化试剂盒(epicentre)从a.pallidusca1828分离基因组dna。使用jetstarmaxi质粒纯化试剂盒(genomed,itkdiagnostics)分离质粒dna。使用dnaclean&concentratortm(zymoresearch)分离琼脂糖-捕获的dna片段。使用phusionflashpcrmastermix(thermoscientific)根据厂商指导进行pcr反应。寡核苷酸引物(在实施例中详细说明)由sigma-aldrich合成。使用genepulser电穿孔装置(biorad)将质粒dna导入电感受态细胞中。其它标准分子生物学技术如sambrookandrussell(2001,supra)所述进行。
实施例1:代谢hmf的aeribacilluspallidus菌株的分离
将compost(15g)与15ml的0.9%(w/v)nacl溶液混合并在750rpm和80℃孵育40分钟。所得compost浆在于摇瓶中的补加0.65g/l的hmf的tmm中在60℃和180rpm孵育3天。将培养物定期移至新鲜tmm-hmf中并铺板于固体tmm-hmf上。将单一菌落重新在tmm-hmf和tgp平板上划线培养,及重新评定其代谢hmf及fdca的能力。通过16srdna测序将代谢hmf和fdca二者的两个分离株(菌株ca1809和ca1828)鉴别为aeribacilluspallidus,选择用于进一步研究。
实施例ii:在降解hmf的a.pallidus分离株中新的脱氢酶催化的hmf分解代谢途径的鉴别
通过pacbio测序方法对a.pallidus菌株ca1809和ca1828的基因组进行测序并进行自动orf调用与注释(callingandannotation)。在注释的基因组中,鉴别了cupriavidusbasilensishmf14的hmfabcde基因的同系物,其组成糠酸降解簇(koopmanetal.,2010,procnatacadsciusa107:4919-4924)。
考虑到菌株ca1809和ca1828除了代谢hmf之外还代谢fdca的能力,强烈提示hmf是如在c.basilensishmf14中通过fdca代谢的。然而,意外地未发现组成通过fdca从hmf至糠酸降解途径的c.basilensishmf14的hmffgh簇的同系物。这个结果提示在a.pallidus分离株中存在的将hmf氧化为fdca及可能随后脱羧为糠酸的另一途径。挖掘(mining)包含编码氧化和脱羧活性二者的基因的基因簇的基因组可以鉴别推定的hmf降解簇,包含编码醇脱氢酶、醛脱氢酶和两种脱羧酶的基因(表1a和b)。总之,这些基因编码如在c.basilensishmf14中推定的通过羟甲基糠酸(hmfca)将hmf氧化为fdca的途径,但是包含醇脱氢酶活性而不是氧化酶活性以将hmfca氧化为甲酰糠酸(ffa)。
表1a:推定的a.pallidusca1809的hmf降解簇
表1b:推定的a.pallidusca1828的hmf降解簇
实施例iii:在恶臭假单胞菌s12中表达a.pallidus的yiay赋予将hmf氧化为fdca的能力
将yiay基因在pbt'mcs产生质粒pkw007中克隆为1988-bp的合成的xbai-sali片段(seqidno:15),包括来自凝结芽孢杆菌dsm1的pldhl1启动子区。将质粒pkw007导入恶臭假单胞菌kt2440agcd(ca1877)中,产生恶臭假单胞菌ca2101。携带pbt'mcs的恶臭假单胞菌kt2440agcd(菌株ca2046)作为空载体对照进行检测。
将恶臭假单胞菌菌株ca2101和ca2046在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素的100-ml摇瓶中生长。在对数生长期(od600≈4)结束时收获细胞,洗涤并重悬浮于补加19.4g/l的k2hpo4、8.15g/l的nah2po4、80mm甘油和50mg/l卡那霉素的mm中。将等份的(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样以分析fdca。图1a示出在空载体对照中hmf被迅速氧化为羟甲基糠酸(fdvifca),然而完全不存在fdca形成。当yiay表达时(图1b),积累的fdvifca缓慢氧化为fdca,这表明yiay作为hmfca氧化脱氢酶的功能性。
实施例iv:通过共表达a.pallidus的yiay与c.basilensishmf14的aldh和hmft1优化hmf至fdca的氧化
合成a.pallidusca1828的yiay基因,其包含核糖体结合位点taggaaaggaagattaaccc(seqidno:21)。将yiay片段(seqidno:16)用kpni和xbai消化以置换pbt'hmfh-adh中hmfh基因(wo2012064195),产生质粒pkw010。将质粒pkw010导入携带pjnnhmft1(t)(wo2012064195)的恶臭假单胞菌s12agcd中产生恶臭假单胞菌ca2111,及导入恶臭假单胞菌kt2440agcd(也携带pjnnhmft1(t))中产生恶臭假单胞菌ca2112。因此,可以将yiay编码的氧化hmfca的醇脱氢酶与hmf脱氢酶和c.basilensishmf14的hmfca转运蛋白共表达,以消除hmf氧化为hmfca及hmfca摄取的瓶颈问题。
将恶臭假单胞菌ca2111和ca2112在含有10ml的mm+80mm甘油和2mm葡萄糖补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中生长。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于具有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样品分析fdca。图2和3示出hmf被迅速氧化为hmfca,hmfca被进一步氧化为fdca。显然yiay与aldh和hmft1的共表达显著加速了hmf氧化为fdca。
实施例v:通过共表达嗜常温hmfca醇脱氢酶与c.basilensishmf14的aldh和hmft1构建将hmf氧化为fdca的优化菌株
合成克里不所类芽孢杆菌dsm17871、热红短小芽孢杆菌423、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)的yiay同系物,其包含含有间隔区taggaaaggaagattaaccc(seqidno:21)的核糖体结合位点以及限制酶(kpni、nhei;与xbai相容)识别位点以进行克隆(seqidno:19、36、38和39)。
合成aneurinibacillusterranovensisdsm18919和brevibacilluspanacihumiw25的yiay同系物,包括含有间隔区gaattccacatgacaaggggagaccgc(seqidno:40)的核糖体结合位点以及限制酶(kpni、xbai)的识别位点以进行克隆(seqidno:35和37)。克里不所类芽孢杆菌酶(seqidno:19)、热红短小芽孢杆菌酶(seqidno:36)和两种芽孢杆菌酶(seqidno:38和39)的编码核苷酸序列通过使用http://www.kazusa.or.jp/codon/的恶臭假单胞菌密码子使用表经氨基酸序列逆向翻译(http://www.bioinformatics.org/sms2/rev_trans.html)而获得。a.terranova和b.panacihumi酶的编码序列通过使用大肠杆菌序列优化工具geneart(https://www.thermofisher.com/nl/en/home/life-science/cloning/gene-synthesis/geneart-gene-synthesis/geneoptimizer.html)经氨基酸序列逆向翻译而获得。
将克里不所类芽孢杆菌、热红短小芽孢杆菌、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)的yiay-同系物片段用kpni和nhei(与pbt'hmfh-adh中xbai相容)消化以置换pbt'hmfh-adh(wo2012064195)中hmfh基因,产生质粒pkw2210、pkw2212、pkw2214和pkw2215。将a.terranovensis和b.panacihumi的yiay同系物片段用kpni和xbai消化以置换pbt'hmfh-adh(wo2012064195)中的hmfh基因,产生质粒pkw2211和pkw2213。
将质粒pkw2210、pkw2211、pkw2212、pkw2213、pkw2214和pkw2215导入恶臭假单胞菌kt2440agcd_pjnnhmft1(ca1965)中,分别产生恶臭假单胞菌ca21780、ca21781、ca21782、ca21783、ca21784和ca21785以在包含aldh和hmft1的优化宿主背景中表达yiay同系物。对于性能评估,将恶臭假单胞菌菌株ca21780,ca21781,ca21782,ca21783,ca21784和ca21785在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中生长。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于具有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)的洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样分析fdca。恶臭假单胞菌ca21780、ca21781和ca21783的结果分别在图4、5和6中示出。所有这三种转化的菌株均从fdvif产生fdca。然而,不同菌株示出hmfca的瞬时积累显著不同,部分hmf还原为二羟甲基呋喃(hmf-oh或dhf)。还发现菌株恶臭假单胞菌ca21782、ca21784和ca21785从fdvif产生fdca,表明所有这六种醇脱氢酶酶作为氧化hmfca的酶的功能性。
实施例vi:构建表达aeribacilluspallidusprop编码的hmfca转运蛋白的恶臭假单胞菌菌株
通过pcr使用引物prop(f)(gccgaattcatgaagaatatcgctaatacg;seqidno:22)和prop(r)(gccgctagcttatttgaggtttccttttgtttcc;seqidno:23)从aeribacilluspallidusca1828的基因组dna扩增prop基因(seqidno:18)。将pcr产物作为1350-bpecori-nhei片段(seqidno:20)导入pjnnmcs(t)中,产生pjnnprop(t)。将质粒pbt’hmfh_aldh和pjnnprop(t)相继导入恶臭假单胞菌kt2440agcd(ca1877)中,产生恶臭假单胞菌ca21783。将恶臭假单胞菌ca21783在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中培养。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于含有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样以分析fdca。显然,表达prop编码的hmfca转运蛋白与不表达prop的相应对照菌株相比显著加速hmf氧化为fdca。
表2:yiay氨基酸序列比对
adh_bp=seqidno:6(brevibacilluspanacihumi);adh_bk=seqidno:2(克里不所类芽孢杆菌);adh_bt=seqidno:5(热红短小芽孢杆菌);adh_at=seqidno:4(aneurinibacillusterranovensis);yiay=seqidno:1(aeribacilluspallidus);adh_gk=seqidno:3(嗜热地芽孢杆菌);adh_bsp=seqidno:7(芽孢杆菌fjat-14578);adh_bspl1=seqidno:10(芽孢杆菌l1(2012));adh_pt=seqidno:11(pelotomaculumthermopropionicum);adh_dk=seqidno:8(库氏脱硫肠状菌);adh_dt=seqidno:9(desulfurisporathermophila)。比对下面的符号表示:*=不变位置;:=强保守位置;.=低强度保守位置;无符号表示非保守位置。
序列表
<110>普拉克生化公司
<120>脱氢酶催化的fdca的产生
<130>p6054479pct
<150>ep15155401
<151>2015-02-17
<160>40
<170>patentinversion3.3
<210>1
<211>392
<212>prt
<213>aeribacilluspallidus
<400>1
metileglyasntyralalyslysalaileaspphegluphethrphe
151015
tyrleuprothrleuileglupheglytyrglylysalaserargmet
202530
glyglumetleugluglnmetglyilelysasnvalpheleuvalthr
354045
asplysglyvalglualaalaglyleuleualaglyilevalglnser
505560
leugluserserasnileargtyrvaliletyrseraspvalglupro
65707580
aspproserleugluthrileaspargglyalaservalphelysglu
859095
glnserpheaspcysileleualavalglyglyglyserproileasp
100105110
thralalysglyileargvalvalvalthrasnglyglyasnilegly
115120125
asptyralaglyvalasnargvalalalyslyssergluileproleu
130135140
valalavalprothrthrserglythrglysergluvalthrilephe
145150155160
glyvaltyrserasptrpgluasnglnvallysvalthrvalthrser
165170175
protyrmetalaprogluilealaleuvalaspprogluleuthrmet
180185190
serleuproglnlysmetthralaalaserglyileaspalaleuala
195200205
hisglyilegluthrphepheserleuargserargproalaserasp
210215220
alaleualavalglualametalathrvalseralatyrleuargarg
225230235240
alavalgluaspglythrasplysglualaargileglymetsergln
245250255
glyserleuleualaglymetalapheasnasnglypheleuglyleu
260265270
alahisalaileglyseralaleuserglyhiscyshisvalserhis
275280285
glyvalalaileglyleuleuleuprolysvalvalglupheasnala
290295300
argvalargproglulysalaalalysilealagluleuleuglyval
305310315320
lysglyaspargglugluvalleualagluglnalaalaproalaval
325330335
alaserleuvallysgluileglyleuprothrargleuargaspval
340345350
aspvalsergluglulysleuproaspilealaargaspalaphelys
355360365
serglymetmetlyspheasnproargglnproserleusergluval
370375380
leuthrleuleuglnglniletyr
385390
<210>2
<211>383
<212>prt
<213>bacilluskribbensis
<400>2
metaspvalglupheserphehisleuprothrleuilegluphegly
151015
pheglylysalaserleuleuglygluargleuleulysleuglyval
202530
glyasnvalpheleuvalserasplysglyvalalaseralaglyleu
354045
leuglnlysleugluglnserleuglnthrseraspilehisphelys
505560
thrtyrleugluvalgluproaspproserleugluthrileaspleu
65707580
glyalaglualapheasnserglylystyraspcysilevalalaval
859095
glyglyglyseralaileaspthralalysglyileargvalvalala
100105110
glyasnglyglyserileglyaspphealaglyvalasplysilegly
115120125
lysalaproglnileproleuilealavalprothrthrserglythr
130135140
glysergluvalthrilepheglyvaltyrserasptrpvallysasn
145150155160
vallysvalthrvalthrserglntyrmetalaprothrilealaleu
165170175
valaspprogluleuthrmetargleuproarglysmetthralaala
180185190
serglyileaspalaleualahisglyileglusertyrpheserleu
195200205
argserthrseralaserargalaleuserleuglualaileasnile
210215220
valglyasnhisleuargglnservalalaasnglygluasplysglu
225230235240
alaargcysglymetserhisglyserleuleualaglymetalaphe
245250255
asnasnglypheleuglyleualahisalaileglyseralaleuser
260265270
glyhiscyshisvalprohisglyvalalaileglyleuleuleupro
275280285
hisvalvalglupheasnserserglucysproaspglnalaalaglu
290295300
ilealalysileleuglyvallysalagluaspgluargglnleuala
305310315320
gluglnalaserhisalavalglyaspleuvallysaspileglyleu
325330335
prothrargleuargaspmetasnvalprogluglulysleualaasp
340345350
ilealaargaspserpheglnserglymetmetlyspheasnproarg
355360365
argalaserglusergluvalleugluleuleuhisargvaltyr
370375380
<210>3
<211>391
<212>prt
<213>geobacilluskaustophilus
<400>3
metvalglyhistyrileglnlysgluvalglupheglupheserphe
151015
hisleuprothrserileglnpheglytyrglylysalaserglnleu
202530
glyasnglnleuvalaspmetglyilelysseralapheleuvalthr
354045
aspargglyvalglualathrglyleuleualaglyileileglnser
505560
leugluserserasnileglntyrcysvaltyralaaspvalglupro
65707580
aspproserleugluthrileaspglnglyalaalaalaphelysglu
859095
glnpropheaspcysilevalalaileglyglyglyserproileasp
100105110
thralalysglyileargvalvalalathrasnglyglyserilegly
115120125
asptyralaglyvalasnargilelyslyslyssergluileproleu
130135140
ilealaleuprothrthrserglythrglysergluvalthrilephe
145150155160
glyvaltyrserasptrplysasnasnvallysvalthrvalthrser
165170175
protyrmetalaprogluilealaleuvalaspprolysleuthrmet
180185190
serleuprolyslysilethralaalaserglyileaspalaleuala
195200205
hisglyilegluthrphepheserleuargserglnproileserasp
210215220
valleualaileglualametthrthrvalasnargtyrleuargarg
225230235240
alavalgluaspglythrasnlysglualaargileglymetsertyr
245250255
glyserleuleualaglymetalapheasnasnglypheleuglyleu
260265270
alahisalaileglyseralaleuserglyhiscyshisvalserhis
275280285
glyvalalaileglyleuleuleuprolysvalvalglupheasnser
290295300
valvalglnproglulysalaalalysilealagluleuleuglyarg
305310315320
lysglyasnglnasnthrleuvalglnglnalaalaleualavalala
325330335
serleuvallysgluileglyleuprothrargleuargaspvalasp
340345350
valprolysglulysleuproaspilealalysaspserphelysser
355360365
glymetmetargpheasnproargglnproserglualagluvalmet
370375380
thrleuleuglnglniletyr
385390
<210>4
<211>390
<212>prt
<213>aneurinibacillusterranovensis
<400>4
metserproalavallysalaileasnpheglupheserpheasnleu
151015
prothrleuileglupheglytyrglylysmetglulyspheglygln
202530
glnleuileserileglyvallysargilephemetvalthrasplys
354045
glyvalgluseralaglyleuleualaalaleuthraspserleugln
505560
alaalaalaileglnpheaspiletyrthraspvalgluserasppro
65707580
serleugluthrileaspargglyvalgluvalpheglnglnlyspro
859095
tyraspcysilevalalavalglyglyglyserproileaspthrala
100105110
lysglyileargvalvalalaalaasnglyglyasnileglyhistyr
115120125
alaglyvalasnglnileprovalalaprothrileproleuleuala
130135140
ileprothrthrserglythrglysergluvalthrasnpheglyval
145150155160
tyrserasptrpglnasnasnvallysvalthrvalthrserglntyr
165170175
metalaprothrilealatrpvalaspproalaleuthrmetserleu
180185190
proalalysmetthralaalaserglyileaspalaleualahisgly
195200205
ilegluthrphepheserleuglyserserproalaseraspalaleu
210215220
alaileglualailehisthrvalasnargtyrleuserargalaval
225230235240
hisasnglyseraspmetglualaargileglymetserhisglyser
245250255
leuleualaglymetalapheasnasnglypheleuglyleualahis
260265270
alaileglyseralaleuserglyhiscyshisvalprohisglyval
275280285
alaileglyleuleuleuprolysvalvalglupheasnalathrval
290295300
argproasplysalaalalysilealaglyleumetglymetlysgly
305310315320
gluhisserglugluleualaleuglnalaserproalavalalaarg
325330335
leuvalgluaspileglyleuprothrargleuarggluvalaspval
340345350
thrglulyslysleuphegluilealalysaspserphelyssergly
355360365
metmetlyspheasnproargglnproserglusergluvalleugln
370375380
leuleulysgluilephe
385390
<210>5
<211>390
<212>prt
<213>brevibacillusthermoruber
<400>5
metserglnthrvalglnglythraspphealapheserphehisleu
151015
prothrleuileglupheglytyrglyargalaserargleuglyglu
202530
argleuglnhisleuglyvalthrasnvalphevalvalthrasplys
354045
glyvalglualaalaglyleuleuasnglyleuvalglyserleugln
505560
seralaglyilealapheaspleutyrthrgluvalgluproasppro
65707580
glyleugluthrileaspargglyalaalavalpheargalalyspro
859095
tyraspcysleuvalalavalglyglyglyserproileaspalaala
100105110
lysglymetargvalvalthrsercysglyglyserilealaasptyr
115120125
alaglyvalasnargvalprometalaproalavalproleuvalala
130135140
valprothrthrserglythrglysergluvalthrmetpheglyval
145150155160
tyrserasptrphisasnhisvallysvalthrvalthrserprohis
165170175
metalaprothrilealaleuvalaspproalaleuthrvalserleu
180185190
proalalysmetthralaalaserglyileaspalaleualahisgly
195200205
ilegluthrphepheservalargserargproalaseraspalaleu
210215220
alametglualailealaalavalasnalahisleuargargalaval
225230235240
hisaspglyseraspvalglualaargileglymetserhisglyser
245250255
leuleualaglymetalaphethrasnglypheleuglyleualahis
260265270
alaileglyseralaleuserglyhiscyshisvalprohisglyile
275280285
alaileglyleuleuleuprohisvalvalalapheasnalaproala
290295300
argproasplysalaalaglnleualaargleuleuglyvalgluala
305310315320
asnproargglugluargglyglugluthrseralaalavalalaarg
325330335
metvalalaaspileglyleuprothrargleuargaspvalglyval
340345350
progluglulysleuproalailealalysaspalaphelyssergly
355360365
metmetthrcysasnproargglnprothrgluglngluvalargglu
370375380
leuleuargargalaphe
385390
<210>6
<211>379
<212>prt
<213>brevibacilluspanacihumi
<400>6
metgluserpropheserphehisleuprothrasnvalglnphegly
151015
valglyseralaserargleuglyglumetleuleusermetglyval
202530
argargvalpheleuvalthraspglnglyvalargglnalaglyleu
354045
leuaspgluvalilehisserleugluglulysglyleuhisphegln
505560
iletyralaaspvalgluproaspproserleugluthrileglnala
65707580
glyalaalametpheglnglnglnserpheaspcysmetvalalaile
859095
glyglyglyserproileaspthralalysglyileargvalleuala
100105110
alaasnglyglyglyileglyglntyralaglyvalasnargvalpro
115120125
alaalaseralaileproleuilealaileprothrthrserglythr
130135140
glysergluvalthrilepheglyvaltyrserasptrpgluasnhis
145150155160
vallysilethrvalthrserprohismetalaproserthralaleu
165170175
ileaspproalaleuthrleuserleuproalalysmetthralaala
180185190
thrglyileaspalaleualahisglyilegluthrphepheserleu
195200205
argserserproalaseraspalaleualailehisalametlysmet
210215220
ilealaprohisleuargargalavalargaspglyalaaspmetglu
225230235240
alaargileglymetserglnglyservalleualaglymetalaphe
245250255
asnasnglypheleuglyleualahisalaileglyseralaleuser
260265270
glyhiscyshisvalprohisglyvalalaileglyleuleuleupro
275280285
hisvalvalalapheasnthrprovalargproglulysalagluleu
290295300
ilealaaspvalleuglyservalglnlysgluthrglythralaala
305310315320
gluleuvalglyglnleuvalglnaspileglyleuproglnargleu
325330335
glngluvalglyvalproglualalysleuvalaspilealalysasp
340345350
serphelysserglymetmetlystrpasnproargleuprothrglu
355360365
glngluvalleugluleuleuglnlysalaphe
370375
<210>7
<211>383
<212>prt
<213>bacillussp.fjat-14578
<400>7
mettyrproserphegluphehisleuprothrlysilehisphegly
151015
tyrasnthrilelysglnleuasphisleuprophegluilelysarg
202530
alapheilevalthraspglnglyvalleuasnserglyleuvalglu
354045
asnvalthrasnileleulysasphisglnilesertyrvaliletyr
505560
sergluvalgluproaspproservalgluthrvalasplysalaala
65707580
glnmetpheglnarggluglualaaspalaleuilealaileglygly
859095
glyserproileaspthralalysglyvalargvalilealaglyasn
100105110
glyglyserileargasptyralaglyvalasnleuilelysglnlys
115120125
serasnileproleuilealaileprothrthrserglythrglyser
130135140
gluvalthrilephealavalpheserasptrpglugluasnarglys
145150155160
valthrvalthrserpropheleualaproaspileserilevalasp
165170175
prolysmetthrmetthralaproproalailethralaalasergly
180185190
pheaspalaphealahisglyalagluthrphevalserargalaser
195200205
glnproalaseraspvalleualapheseralametserthrvalser
210215220
lystyrleuargargalavaltyrasnglygluaspvalglualaarg
225230235240
ilelysmetalaglualaserleuleualaglymetalapheasngln
245250255
sertyrleuglyleuthrhisalaileglyseralaleuserglyhis
260265270
alahisvalserhisglyvalalaileglyleuleuleuproglyval
275280285
ileargtyrasnserileserargmetasplyshisileglumetala
290295300
glyalaphearggluileaspargserleuserasptrpgluileile
305310315320
aspglnleuilegluaspvalserargleuargaspaspileglyleu
325330335
proglnargleuglnglnvalglyvallysgluaspglnleulysmet
340345350
ilealaalaaspservallysserglymettrplyspheasnproarg
355360365
glnalasergluglugluileleugluleuleulysgluleutyr
370375380
<210>8
<211>384
<212>prt
<213>desulfotomaculumkuznetsovii
<400>8
metglualaphethrpheglnleulysthrthrvalcyspheglyala
151015
asnvalvalserglyilevalasptrpcysargasntyrasnalalys
202530
argvalleuilevalthraspglnglyvalarglysalaglyileleu
354045
glulysvalglulysileleuseraspalaglyilegluasnvalval
505560
pheaspaspvalgluproaspproglyleugluthrilehisargcys
65707580
alasercysphearggluasnlyscysaspleuileleualavalgly
859095
glyglyserproileaspthralalysglyalaargvalilevalglu
100105110
asnglyglyhisileargasptyralaglyvalasnlysvalproarg
115120125
alaprovalthrproleuilealaileprothrthrserglythrgly
130135140
sergluvalthrthrphealavalleuserasptrpgluasnargmet
145150155160
lysilethrileserserpropheleualaprogluvalalavalval
165170175
aspproleuleuthrmetthralaproproservalthralaalaser
180185190
glyileaspalaleuserhisalailegluthrtyrvalserleulys
195200205
alaglnproproalaglualaleualaleulysalailegluleuile
210215220
glygluserleuargthralavalalaaspglyserasplysgluala
225230235240
argthrargmetserleuglyserleuleualaglymetalapheasn
245250255
asnserleuleuglyleuthrhisserileglyalaalaleusergly
260265270
hisalahisvalserhisglymetalaileglyleuleuleuprotyr
275280285
valmetglupheasnalametalaargmetglulyspheserlysile
290295300
alavalalaleuglygluaspvallysglyleuserleuarggluala
305310315320
alaleuargservallysalavalarggluleuvalgluaspileser
325330335
leuproargargleuglyaspvalglyvalthrglyaspmetileglu
340345350
glymetalalysaspalametglyhisglymetleulyspheasnpro
355360365
argalavalthrglulysaspileilealaileleuarglysalaleu
370375380
<210>9
<211>377
<212>prt
<213>desulfurisporathermophila
<400>9
metlysthrthrvalcyspheglyalaasnilevalserserileasp
151015
aspargcysargasptyrasnalaarghisvalleuilevalthrasp
202530
glnglyvalglulysalaglyileleuglulysvalglulysvalleu
354045
seraspalaglyilegluasnvalvalpheaspaspvalgluproasp
505560
proglyleugluthrilehisargcysalasercysphearggluasn
65707580
lyscysaspleupheleualaileglyglyglyserproileaspthr
859095
alalysglyalaargileilevalaspasnglyglyhisileargasp
100105110
tyralaglyvalasnlysvalproargalaproargthrproleuleu
115120125
alaileprothrthrserglythrglysergluvalthrthrpheala
130135140
valleuserasptrpgluasnargmetlysilethrileserserpro
145150155160
pheleualaprogluvalalavalvalaspproileleuthrleuthr
165170175
alaproproservalthralaalaserglyileaspalaleuserhis
180185190
alailegluthrtyrvalserleulysalaglnproproalagluala
195200205
leualaleulysalailegluleuileglygluserleuargalaala
210215220
valalaaspglyserasnlysglualaargthrlysmetserleugly
225230235240
serleuleualaglymetalapheasnasnserleuleuglyleuthr
245250255
hisserileglyalaalaleuserglyhisalahisvalserhisgly
260265270
metalavalglyleuleuleuprotyrvalmetglupheasnalamet
275280285
alaargleuglulystyrglylysilealailealaleuglygluasp
290295300
vallysglyleuserleuargglualaalaleuargservallysala
305310315320
valarggluleuvalgluaspileserleuproargargleuglyglu
325330335
valglyvalthrglyaspmetilegluglymetalalysaspalamet
340345350
glyhisglymetleulyspheasnproargvalvalthrglulysasp
355360365
ilemetalaileleuglnlysalaleu
370375
<210>10
<211>383
<212>prt
<213>bacillussp.l1(2012)
<400>10
mettyrthrserpheasnphehisleuprothrargileglnphegly
151015
tyrglulysvallysgluleulysasnleupropheglnalaasnarg
202530
alapheilevalthrasplysglyvalglulysalaglyleuleuasn
354045
aspvalileaspalailelysglnalaasnmetthrtyrlysiletyr
505560
argaspvalgluproaspproservalgluthrvalasplysalaala
65707580
lysalaphealaglualaglucysaspleuleuilealavalglygly
859095
glyserproileaspthralalysglyvalargvalvalalaserasn
100105110
glyglyserileargasntyrserglyvalasnleuvallysgluala
115120125
proservalproleuvalalaileprothrthralaglythrglyser
130135140
gluvalthrilephealavalpheseraspasplysgluasnarglys
145150155160
valthrvalthrserserhisleuserproaspvalserileileasp
165170175
prolysleuthrleuthralaproproserilethralaalaalagly
180185190
pheaspalaphealahisalaalaglualaphevalserargileser
195200205
glnproproseraspalaleualaleuseralametlysthrvalhis
210215220
thrtyrleuargargalavaltyrasnglyaspaspileglualaarg
225230235240
metlysmetalaglualaserleuleualaglymetalapheasngln
245250255
sertyrleuglyleualahisalaileglyseralaileservalhis
260265270
alahisvalserhisglyvalvalileglyleuleuleuprolysval
275280285
ileglutyrasnleuvalalalysileasplystyralaglualagly
290295300
lystyrilegluglnserserhisglyleuserasntyrglualaala
305310315320
alaleuphesergluthrvalthrglnleuargasnaspileglyleu
325330335
prolysglnleuarggluvalasnvallysglualaglnleugluala
340345350
ileserlysaspserilelysserglymettrpglnpheasnproarg
355360365
argalasergluglnaspvaltyrglnmetleuargglumetleu
370375380
<210>11
<211>387
<212>prt
<213>pelotomaculumthermopropionicum
<400>11
metalaasptyrasnpheserphealavalargthrlysvalphephe
151015
glyargglyvalvalphegluglnleuproglyalavalargglumet
202530
glycyslyslysalavalleuvalseraspproglyilevalglythr
354045
glyleualaaspargvallysaspleuleualaglyglyglyvalala
505560
valgluvalphesergluvalgluproaspproglyleugluthrval
65707580
hislysalaalaalapheleuglyargthrargproaspcysleuval
859095
alaleuglyglyglyserserileaspvalalalysglyalaargval
100105110
iletyraspasnglyglylysileserasptyralaglyvalasnlys
115120125
vallysvallysproserleuproleumetalavalprothrthrala
130135140
glythrglysergluvalthrvalphealavalleuserasptrpglu
145150155160
glnasnilelysilethrvalthrserglutyrleualaprogluala
165170175
alaphevalaspproleualametvalseralaproproglyilethr
180185190
alaalaserglyileaspalaleuserhisalavalglualatyrval
195200205
serargalaalaserprovalseraspasnleualaleuglyalaval
210215220
gluleuileglyglyhisleuargglnalavalalaasnglyglyasp
225230235240
leualaalaargthrglyalaalaleuglyserleuleualaglymet
245250255
alapheasnasnalapheleuglyleuthrhisserileglyalaala
260265270
leuserglyhisvalhisvalserhisglyvalalavalglyleuleu
275280285
leuprotyrvalmetglutyrasnleumetalalysproasplysphe
290295300
alaargleualaargalametglygluvalthrgluglylysserleu
305310315320
tyrargalaalaserleualaproargalavallysalametvallys
325330335
serileglyleuprovalargleulysgluileglyvalproglugly
340345350
alaleualaalailealagluthralaleulyshisglymetilelys
355360365
pheasnproargvalproserarggluaspileleuaspilevallys
370375380
lysalatyr
385
<210>12
<211>1176
<212>dna
<213>aeribacilluspallidus
<400>12
atgatcggaaattacgcaaaaaaggcgattgatttcgagttcactttttatcttcctaca60
ttgatcgaattcggatacggcaaggcttcccgaatgggagagatgcttgaacagatgggt120
ataaagaacgtttttttggttaccgacaaaggagtggaagctgcgggtctgttggcagga180
atcgttcagtctctggaatcatccaatatccgatatgttatttattcagacgtagaacct240
gacccgagcttagagacgattgatcgtggtgcgtccgtttttaaggagcagtcttttgac300
tgtatcttagctgtgggtggaggaagtccgattgatacagctaaggggatccgtgtcgta360
gtgacgaacggaggaaacatcggtgactatgccggtgttaaccgtgttgcgaaaaaatct420
gaaattcctttggtggctgtgccgactacatccggcacgggcagtgaagtaaccattttc480
ggagtctactccgattgggaaaatcaagtaaaggtgacggtaacaagcccatatatggcg540
ccggagatcgctttggtagaccccgaacttaccatgagtctaccgcaaaaaatgacagca600
gcatcgggaattgatgctctagctcatgggattgaaactttcttctccttgcgttctcga660
cctgcatccgatgccctagcggtcgaagcgatggcgacggtgagtgcttatttgcgccgt720
gcggtggaagatggtacggataaagaagcgaggatcggcatgtcccagggcagtttgttg780
gcagggatggcattcaacaatggcttcttaggtttggcccatgcgatcggtagtgctttg840
tctggccattgtcatgtgtcccatggtgtcgcaatcggtttgttgctaccgaaagtggtg900
gaatttaatgctagggtgcgcccggaaaaagctgcaaaaatcgcagaattgttgggagta960
aaaggggatcgagaggaggttcttgcggagcaggcagctcctgcagtcgcctcgttagtc1020
aaagagattggtcttcccactcgtttgcgtgatgttgatgtttctgaagaaaagctccca1080
gatatcgcaagagatgcatttaaaagcggtatgatgaagtttaacccacgccaaccaagt1140
ttgtcagaagtgcttacacttttgcagcagatttat1176
<210>13
<211>1179
<212>dna
<213>artificial
<220>
<223>syntheticcodonoptimisedforexpressioninp.putida
<400>13
atgatcggcaactacgccaagaaggccatcgacttcgagttcaccttctacctgccgacc60
ctgatcgagttcggctacggcaaggccagccgcatgggcgagatgctggaacaaatgggt120
atcaagaacgtgttcctggtgaccgacaagggcgtggaagccgccggtctgctggccggc180
atcgtgcagagcctggaaagcagcaacatccgctacgtgatctacagcgacgtggaaccg240
gacccgagcctggaaaccatcgaccgcggcgccagcgtgttcaaagaacagagcttcgac300
tgcatcctggccgtgggcggcggcagcccgatcgacaccgccaagggcatccgcgtggtg360
gtgaccaacggcggcaacatcggcgactacgccggcgtgaaccgcgtggccaagaagtcg420
gagatcccgctggtcgccgtgccaaccacctcgggcaccggcagcgaagtgaccatcttc480
ggcgtgtacagcgactgggagaaccaggtgaaggtgaccgtgaccagcccgtacatggcc540
ccggaaatcgccctggtggacccggaactgaccatgagcctgccgcagaagatgaccgcc600
gccagcggcatcgacgccctggcccacggcatcgaaaccttcttcagcctgcgcagccgc660
ccagcctcggatgccctggcggtggaagccatggccaccgtgagcgcctacctgcgccgc720
gccgtcgaggacggcaccgacaaagaagcccgcatcggcatgagccagggcagcctgctg780
gcgggcatggccttcaacaacggcttcctgggcctggcccatgccatcggcagcgccctg840
agcggccattgccatgtgagccacggcgtggccatcggcctgctgctgccgaaggtggtg900
gaattcaacgcccgcgtgcgcccggaaaaggccgccaagatcgccgaactgctgggcgtg960
aagggcgaccgcgaagaggtgctggccgaacaggccgccccagccgtggccagcctggtg1020
aaagaaatcggcctgccgacccgcctgcgcgacgtggacgtgagcgaagagaagctgccg1080
gacatcgcccgcgacgccttcaagagcggcatgatgaagttcaacccgcgccagccgagc1140
ctgagcgaggtgctgaccctgctgcagcagatctactga1179
<210>14
<211>1152
<212>dna
<213>artificial
<220>
<223>syntheticcodonoptimisedforexpressioninp.putida
<400>14
atggacgtggaattcagcttccatctgccgaccctgatcgagttcggcttcggcaaggcc60
agcctgctgggcgagcgcctgctgaagctgggcgtgggcaacgtgttcctggtgagcgac120
aagggcgtggccagcgcaggcctgctgcagaagctggaacagagcctgcagaccagcgac180
atccacttcaagacctacctggaagtggaaccggacccgagcctggaaaccatcgacctg240
ggtgccgaggccttcaacagcggcaagtacgactgcatcgtggccgtgggtggtggcagc300
gccatcgacaccgccaagggcatccgcgtggtggcaggcaacggtggcagcatcggcgac360
ttcgcaggcgtggacaagatcggcaaggcaccgcagatcccgctgatcgccgtgccgacc420
acctcgggcaccggcagcgaagtgaccatcttcggcgtgtacagcgactgggtgaagaac480
gtgaaggtgaccgtgaccagccagtacatggcaccgaccattgccctggtggacccggaa540
ctgaccatgcgcctgccacgcaagatgaccgcagccagcggcatcgacgccctggcccac600
ggcatcgagagctacttcagcctgcgcagcaccagcgccagccgtgccctgtcgctggaa660
gccatcaacatcgtgggcaaccatctgcgccagagcgtggcgaacggcgaggacaaggaa720
gcacgctgcggcatgagccacggcagcctgctggcaggcatggcgttcaacaacggcttc780
ctgggcctggcccatgccatcggcagcgcactgagcggtcactgccacgtgccgcacggc840
gtggccatcggcctgctgctgccgcacgtggtggaattcaacagcagcgagtgcccagac900
caggcagccgagatcgccaagatcctgggcgtgaaggccgaggacgaacgccagctggcc960
gaacaggccagccacgccgtgggcgacctggtgaaggacatcggcctgccgacccgtctg1020
cgcgacatgaacgtgccggaagagaagctggccgacattgcacgcgacagcttccagagc1080
ggcatgatgaagttcaacccacgtcgtgccagcgagagcgaggtgctggaactgctgcac1140
cgcgtgtactga1152
<210>15
<211>1994
<212>dna
<213>artificial
<220>
<223>syntheticxbai-salifragment
<400>15
tctagatcttctttgataataaatgaaagcagccggtatggagagaaaaaagtgcactta60
tatgaagttgattttatggtcggctttattttgcccgtcgtactggctgtccacacgatg120
ttcatttttgatgcacaattgaatggctgtacagttgcgtttttgtcgatgtctggcggg180
cacgcctccatgcatgtgaagcagattcttttaagcgggcagcacccgcttttttggagg240
gcaggcattcaggagcaaaaatggcagagatcagttgggcgggatcagccatttattcct300
ccatccggggcactttgtgaaaatcagcacaagaatgaataacgctttcatatctggctt360
tttcaaataaaaccatttgtgaaaaatgtaaacggatgattttgaaaaaccgtcattttc420
ctttaaaaccgggcatttgggcagataaattttcaaattttcgccataaaatatgtgaat480
ctaatcacaaaaatagtggtatacttacccatgtggaatgaaggaaaatgaacggaacga540
tccatttcagccataaaagggcatgccgtccatctatttcacaaaccgcacggcagcatt600
tgctgcaaaagtttaatcgtcctgctttaaaggaaaagcagtatggaatccattaggagt660
tggcacaatatccatagactggataggggcccgccatgccgggcttgcaaaactgctttc720
atacagtggaaatattttttacttttgatggggaggaagattatatatgatcggaaatta780
cgcaaaaaaggcgattgatttcgagttcactttttatcttcctacattgatcgaattcgg840
atacggcaaggcttcccgaatgggagagatgcttgaacagatgggtataaagaacgtttt900
tttggttaccgacaaaggagtggaagctgcgggtctgttggcaggaatcgttcagtctct960
ggaatcatccaatatccgatatgttatttattcagacgtagaacctgacccgagcttaga1020
gacgattgatcgtggtgcgtccgtttttaaggagcagtcttttgactgtatcttagctgt1080
gggtggaggaagtccgattgatacagctaaggggatccgtgtcgtagtgacgaacggagg1140
aaacatcggtgactatgccggtgttaaccgtgttgcgaaaaaatctgaaattcctttggt1200
ggctgtgccgactacatccggcacgggcagtgaagtaaccattttcggagtctactccga1260
ttgggaaaatcaagtaaaggtgacggtaacaagcccatatatggcgccggagatcgcttt1320
ggtagaccccgaacttaccatgagtctaccgcaaaaaatgacagcagcatcgggaattga1380
tgctctagctcatgggattgaaactttcttctccttgcgttctcgacctgcatccgatgc1440
cctagcggtcgaagcgatggcgacggtgagtgcttatttgcgccgtgcggtggaagatgg1500
tacggataaagaagcgaggatcggcatgtcccagggcagtttgttggcagggatggcatt1560
caacaatggcttcttaggtttggcccatgcgatcggtagtgctttgtctggccattgtca1620
tgtgtcccatggtgtcgcaatcggtttgttgctaccgaaagtggtggaatttaatgctag1680
ggtgcgcccggaaaaagctgcaaaaatcgcagaattgttgggagtaaaaggggatcgaga1740
ggaggttcttgcggagcaggcagctcctgcagtcgcctcgttagtcaaagagattggtct1800
tcccactcgtttgcgtgatgttgatgtttctgaagaaaagctcccagatatcgcaagaga1860
tgcatttaaaagcggtatgatgaagtttaacccacgccaaccaagtttgtcagaagtgct1920
tacacttttgcagcagatttattaattgttcgggtttcagtgttccattttcaaatattc1980
cgttaagggtcgac1994
<210>16
<211>1258
<212>dna
<213>artificial
<220>
<223>synthetickpni-xbaifragment
<400>16
ggtaccttcacacaggaaacaggaggtacaatgatcggaaattacgcaaaaaaggcgatt60
gatttcgagttcactttttatcttcctacattgatcgaattcggatacggcaaggcttcc120
cgaatgggagagatgcttgaacagatgggtataaagaacgtttttttggttaccgacaaa180
ggagtggaagctgcgggtctgttggcaggaatcgttcagtctctggaatcatccaatatc240
cgatatgttatttattcagacgtagaacctgacccgagcttagagacgattgatcgtggt300
gcgtccgtttttaaggagcagtcttttgactgtatcttagctgtgggtggaggaagtccg360
attgatacagctaaggggatccgtgtcgtagtgacgaacggaggaaacatcggtgactat420
gccggtgttaaccgtgttgcgaaaaaatctgaaattcctttggtggctgtgccgactaca480
tccggcacgggcagtgaagtaaccattttcggagtctactccgattgggaaaatcaagta540
aaggtgacggtaacaagcccatatatggcgccggagatcgctttggtagaccccgaactt600
accatgagtctaccgcaaaaaatgacagcagcatcgggaattgatgctctagctcatggg660
attgaaactttcttctccttgcgttctcgacctgcatccgatgccctagcggtcgaagcg720
atggcgacggtgagtgcttatttgcgccgtgcggtggaagatggtacggataaagaagcg780
aggatcggcatgtcccagggcagtttgttggcagggatggcattcaacaatggcttctta840
ggtttggcccatgcgatcggtagtgctttgtctggccattgtcatgtgtcccatggtgtc900
gcaatcggtttgttgctaccgaaagtggtggaatttaatgctagggtgcgcccggaaaaa960
gctgcaaaaatcgcagaattgttgggagtaaaaggggatcgagaggaggttcttgcggag1020
caggcagctcctgcagtcgcctcgttagtcaaagagattggtcttcccactcgtttgcgt1080
gatgttgatgtttctgaagaaaagctcccagatatcgcaagagatgcatttaaaagcggt1140
atgatgaagtttaacccacgccaaccaagtttgtcagaagtgcttacacttttgcagcag1200
atttattaattgttcgggtttcagtgttccattttcaaatattccgttaaggtctaga1258
<210>17
<211>446
<212>prt
<213>aeribacilluspallidus
<400>17
metlysasnilealaasnthrserthrgluargprovalasnaspala
151015
servallysasnargglnmetvalargalathrilealaserleuile
202530
glytrpserleuaspleutyraspleupheleuleuleuphevalala
354045
thrthrileglyasnleuphepheproalaserasnglnthrleuser
505560
leualaalavaltyralaserphealavalthrleuleumetargpro
65707580
leuglyseralailepheglyiletyralaasplysasnglyarglys
859095
lysalametthrvalalaileileglyalaglyleucysthralaala
100105110
pheglyleuleuprothrilehisglnvalglyvalvalalaalaile
115120125
alapheleuileleuargleuvalglnglyvalphevalglyglyval
130135140
valalaserthrhisthrileglythrgluseralaserprolystyr
145150155160
argglyphemetserglyleuileglyglyglyglyalaglyleugly
165170175
alaleuphealaserilesertyrservalvalthralailephepro
180185190
glyglualapheaspvaltrpglytrpargvalmetphephethrgly
195200205
ileileglyserleupheglyleupheilepheargserleugluglu
210215220
serproleutrplysglnleulysglugluasnserlysglygluval
225230235240
serglupheglnlysalaproleulysthrphephethrlystyrtyr
245250255
lysvalleuleuvalasnleumetilevalileglyglyglysergly
260265270
tyrtyrleuthrserglypheileprothrpheleulysvalvalasn
275280285
lysvalseralaservalserserglyvalleuilealathrserile
290295300
metthrilevalalaalavalleuvalglyhisleusergluvalile
305310315320
glyarglyslysthrpheleuleuileglyileleucysleuvalgly
325330335
leuprotyrphetyrleuserleualaasnserthrthrthrthrgly
340345350
iletyrleuasnalaleuglyleuilepheleuglyasnalaalatyr
355360365
alaprovalleuilepheleuasngluargpheprothrserilearg
370375380
serthrglythrglyleusertrpasnmetglyphealaileglygly
385390395400
metmetprothrphevalasnleualaserglythrvalgluhisile
405410415
protyrthrleumettyrphethrileglyiletyrleuvaltyrile
420425430
leuglyserleuileileprogluthrlysglyasnleulys
435440445
<210>18
<211>1338
<212>dna
<213>aeribacilluspallidus
<400>18
gtgaagaatatcgctaatacgagtaccgaacgacctgtaaatgatgcttcagttaagaat60
cgtcaaatggtgcgagctacgattgcctcgctcatagggtggtcactcgatctttacgat120
ttatttctgctgctttttgttgcgacgaccatagggaatttgttttttcccgccagcaat180
caaacactttctttggctgccgtgtatgcttcctttgccgttacgcttttgatgcggcct240
ttgggttccgccattttcggcatttatgcggataaaaacgggagaaagaaagcgatgact300
gtggcaatcattggagcaggcttgtgcacggcggctttcggtctgttacctacgatccac360
caagttggagtggtcgctgcgatcgccttcttgattttacgtttagttcaaggagtgttt420
gtcggcggagtggttgcttccacccatacgataggaacggaatccgcatcgccaaaatat480
cgggggtttatgtcgggattgatcggtggtggcggagcaggattgggagcactgtttgct540
tctatttcttattcggttgtgacggcaatttttccgggagaggcttttgatgtttgggga600
tggcgtgtcatgtttttcacaggcattatcggttccctcttcggccttttcatattccgg660
tcccttgaggaatctcctctctggaaacaattgaaagaagaaaatagtaaaggcgaagtg720
tccgagtttcagaaagcaccgctgaagacgtttttcactaaatattacaaggtattgctc780
gtcaaccttatgatcgtcatcggtggtggctccggttattatctgactagtggatttatt840
cctacatttttaaaggtagttaacaaagtatcagcctctgtttcgtcgggggtactcatt900
gcgacaagtattatgaccattgtagccgccgttctcgtgggacacctgagcgaggtcatc960
ggcagaaagaaaacatttctgttaatcggtattctttgtcttgtcggacttccgtatttt1020
tatctgtcattggcaaactcaactacgacaacgggcatctacttaaatgctcttggactc1080
atattcttggggaatgctgcatatgcaccggtactcatcttcttgaacgaacgttttccc1140
acatcgatccgttcaacaggtaccggattatcatggaacatgggtttcgccattggcggg1200
atgatgccgacgtttgtgaacttagccagtggtacggtggaacatattccttacacgctg1260
atgtattttactatcggaatttacttggtttatatccttggcagcctgattattccggaa1320
acaaaaggaaacctcaaa1338
<210>19
<211>1184
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentwithcodonoptimizedb.kribbensis
yiay
<400>19
ggtacctaggaaaggaagattaacccatggacgtggaattcagcttccatctgccgaccc60
tgatcgagttcggcttcggcaaggccagcctgctgggcgagcgcctgctgaagctgggcg120
tgggcaacgtgttcctggtgagcgacaagggcgtggccagcgcaggcctgctgcagaagc180
tggaacagagcctgcagaccagcgacatccacttcaagacctacctggaagtggaaccgg240
acccgagcctggaaaccatcgacctgggtgccgaggccttcaacagcggcaagtacgact300
gcatcgtggccgtgggtggtggcagcgccatcgacaccgccaagggcatccgcgtggtgg360
caggcaacggtggcagcatcggcgacttcgcaggcgtggacaagatcggcaaggcaccgc420
agatcccgctgatcgccgtgccgaccacctcgggcaccggcagcgaagtgaccatcttcg480
gcgtgtacagcgactgggtgaagaacgtgaaggtgaccgtgaccagccagtacatggcac540
cgaccattgccctggtggacccggaactgaccatgcgcctgccacgcaagatgaccgcag600
ccagcggcatcgacgccctggcccacggcatcgagagctacttcagcctgcgcagcacca660
gcgccagccgtgccctgtcgctggaagccatcaacatcgtgggcaaccatctgcgccaga720
gcgtggcgaacggcgaggacaaggaagcacgctgcggcatgagccacggcagcctgctgg780
caggcatggcgttcaacaacggcttcctgggcctggcccatgccatcggcagcgcactga840
gcggtcactgccacgtgccgcacggcgtggccatcggcctgctgctgccgcacgtggtgg900
aattcaacagcagcgagtgcccagaccaggcagccgagatcgccaagatcctgggcgtga960
aggccgaggacgaacgccagctggccgaacaggccagccacgccgtgggcgacctggtga1020
aggacatcggcctgccgacccgtctgcgcgacatgaacgtgccggaagagaagctggccg1080
acattgcacgcgacagcttccagagcggcatgatgaagttcaacccacgtcgtgccagcg1140
agagcgaggtgctggaactgctgcaccgcgtgtactgagctagc1184
<210>20
<211>1359
<212>dna
<213>artificial
<220>
<223>ecori-nheipcrfragmentwitha.palliduspropcodingsequence
<400>20
gccgaattcatgaagaatatcgctaatacgagtaccgaacgacctgtaaatgatgcttca60
gttaagaatcgtcaaatggtgcgagctacgattgcctcgctcatagggtggtcactcgat120
ctttacgatttatttctgctgctttttgttgcgacgaccatagggaatttgttttttccc180
gccagcaatcaaacactttctttggctgccgtgtatgcttcctttgccgttacgcttttg240
atgcggcctttgggttccgccattttcggcatttatgcggataaaaacgggagaaagaaa300
gcgatgactgtggcaatcattggagcaggcttgtgcacggcggctttcggtctgttacct360
acgatccaccaagttggagtggtcgctgcgatcgccttcttgattttacgtttagttcaa420
ggagtgtttgtcggcggagtggttgcttccacccatacgataggaacggaatccgcatcg480
ccaaaatatcgggggtttatgtcgggattgatcggtggtggcggagcaggattgggagca540
ctgtttgcttctatttcttattcggttgtgacggcaatttttccgggagaggcttttgat600
gtttggggatggcgtgtcatgtttttcacaggcattatcggttccctcttcggccttttc660
atattccggtcccttgaggaatctcctctctggaaacaattgaaagaagaaaatagtaaa720
ggcgaagtgtccgagtttcagaaagcaccgctgaagacgtttttcactaaatattacaag780
gtattgctcgtcaaccttatgatcgtcatcggtggtggctccggttattatctgactagt840
ggatttattcctacatttttaaaggtagttaacaaagtatcagcctctgtttcgtcgggg900
gtactcattgcgacaagtattatgaccattgtagccgccgttctcgtgggacacctgagc960
gaggtcatcggcagaaagaaaacatttctgttaatcggtattctttgtcttgtcggactt1020
ccgtatttttatctgtcattggcaaactcaactacgacaacgggcatctacttaaatgct1080
cttggactcatattcttggggaatgctgcatatgcaccggtactcatcttcttgaacgaa1140
cgttttcccacatcgatccgttcaacaggtaccggattatcatggaacatgggtttcgcc1200
attggcgggatgatgccgacgtttgtgaacttagccagtggtacggtggaacatattcct1260
tacacgctgatgtattttactatcggaatttacttggtttatatccttggcagcctgatt1320
attccggaaacaaaaggaaacctcaaataagctagcggc1359
<210>21
<211>20
<212>dna
<213>artificial
<220>
<223>ribosomebindingsite
<400>21
taggaaaggaagattaaccc20
<210>22
<211>30
<212>dna
<213>artificial
<220>
<223>pcrprimerprop(f)
<400>22
gccgaattcatgaagaatatcgctaatacg30
<210>23
<211>34
<212>dna
<213>artificial
<220>
<223>pcrprimerprop(r)
<400>23
gccgctagcttatttgaggtttccttttgtttcc34
<210>24
<211>500
<212>prt
<213>cupriavidusbasilensis
<400>24
metasnalaglnhistrpilealaglyalatrpthrglygluproser
151015
alaaspservalasnproalaaspglythrleuileglyglnpheala
202530
aspglyglythrtrpglnalaglualaalailealaalaalaarghis
354045
valphegluargthrthrtrpglyglnaspalaargleuargglnasp
505560
valleuleualatrpalaglyalaleuglualagluarggluargleu
65707580
alaserleuleuthralagluasnglylysprovalalaglnalaarg
859095
glygluvalglyalaalailesergluvalargtyrtyralaglyleu
100105110
alaarghisileproglyhisvalleugluprogluproglythrile
115120125
serthrileleuarggluproalaglyvalalaalaileilevalpro
130135140
trpasnalaproalavalleuleuvalargserleualaproalaleu
145150155160
alaalaglycysthralavalvallysseralaalaglnthrthrleu
165170175
phethralaalametleuargleuphegluargthralaleuproala
180185190
glyalavalasnleuvalcysgluthrglytyralaalaalaasphis
195200205
leuvalargserargaspvalaspvalvalserphethrglyserthr
210215220
alathrglylyslysilemetilealaalaalaaspservallyslys
225230235240
leuserleugluleuglyglylyssercyscysleuvalpheaspasp
245250255
valaspalaglnalavalalalysargleualaleualaalathrval
260265270
ileserglyglnglncysthralaalaargargvalleuvalhisglu
275280285
alailealaproglnmetargarghisleuthrglualaleualaala
290295300
leuargleuglyproglyilegluproaspthrglnileglyproleu
305310315320
ileasphisprothrargalametvalseralaglnvalgluargala
325330335
cysaspglualaaspthrvalleuleuargglythrmetproglygly
340345350
alaleualaargglyalapheleuserprothrleuvalgluhisser
355360365
aspproglyalaphephecysglnglugluilepheglypropheval
370375380
thrphegluthrphealathrgluaspglualaleualalysalaasn
385390395400
asnthrvalpheglyleuseralaservaltrpthrhishisglyglu
405410415
argalaileargleualaargalaleuargasnglythrvaltrpval
420425430
asnasphisasnargleuphealaglualagluthrglyglytyrarg
435440445
glnserglyleuglyargleuhisglytyraspalaleualaaspphe
450455460
thrgluleulyshisilecysileglnalaglyleuprolysglymet
465470475480
serglnalaglycysargleuserglyvalalaalaarggluargmet
485490495
glyvalserval
500
<210>25
<211>479
<212>prt
<213>burkholderiasp.ccge1002
<400>25
metasnalaarghistrpilealaglyglutrpthrglythrproasn
151015
ileaspserileaspproalathrglyaspalaileglyargpheala
202530
aspglyglyserserglualaaspalaalailealaalaalaarghis
354045
alapheaspargthrthrtrpalaglnaspalaargleuargglnasp
505560
valleuleuglytrpalaseralaleuglualagluargaspmetleu
65707580
alathrleuleuthrarggluasnglylysalailealaglnserarg
859095
aspgluilealaglyalailesergluvalargtyrtyralaglyleu
100105110
alaarghisilealaglyhisvalleugluprogluproglythrile
115120125
serthrmetleuargglualaalaglyvalalaalaileilevalpro
130135140
trpasnalaproalavalleuleuvalargserleualaproalaleu
145150155160
alaalaglycysthrvalilevallysproalaalaglnthrserleu
165170175
leuthralaalametleuargcysphegluhisthralaleuproglu
180185190
glyalavalasnleuvalasngluargglytyralaalaserglnarg
195200205
leuvalaspserhisglyvalaspvalvalserphethrglyserthr
210215220
alathrglylyslysilemetalaalaalaalaaspsermetlyslys
225230235240
leuserleugluleuglyglylyssercyscysvalvalpheaspasp
245250255
alaaspvalalaalailealaproargleualaargalaalathrile
260265270
ileserglyglnglncysthralaalaargargvalleuvalhisala
275280285
serargalaalaglnmetarggluglnleualaseralaleualaser
290295300
leuargvalglyproglyileaspproalathraspileglyalaleu
305310315320
ileaspglythrthrargaspalavalalaargthrilegluargala
325330335
cysglythralagluargvalleuleuargglythrcysserglyhis
340345350
alapheleuserprothrleuvalgluhisaspaspprolysalaphe
355360365
phecysglnaspgluilepheglyprophevalthrleugluvalphe
370375380
gluasnglumetglualaileglulysalaasnaspthrvalphegly
385390395400
leuseralaservaltrpthrhisaspglyalaargalaleuargval
405410415
alaargalaleuargasnglythrvaltrpileasnasphisasnlys
420425430
leuphealaglualagluthrglyglytyrargglnserglyleugly
435440445
argleuhisglytyraspalaleualaaspphethrgluleulyshis
450455460
ilecysmetproalaglyvalalagluglyilealaproleuarg
465470475
<210>26
<211>483
<212>prt
<213>burkholderiagraminisc4d1m
<400>26
metgluargaspalametasntrpilealaglyglutrpalaglylys
151015
provalleualaserseraspproserasnglygluthrleuglyarg
202530
phevalserserasnthrglnaspalaaspalaalavalseralaala
354045
arghisthrpheasphisthrthrtrpalaglnaspalaargargarg
505560
glnaspvalleuleuargtrpalaglnalaleugluleuservalglu
65707580
proleualagluleuleuthrhisgluasnglylysthrileglygln
859095
alaargglyglumetargalaalailesergluvalargtyrtyrala
100105110
glyleualaarghisilealaglyhisvalilegluprogluprogly
115120125
thrileserthrmetleuargglualaalaglyvalalaalaileile
130135140
valprotrpasnalaproalavalleuleuvalargserleualapro
145150155160
alaleualaalaglycysthralailevallysproalaalaglnthr
165170175
serleuilethralaalametileargcysleuaspglnproalaleu
180185190
proalaglyalavalasnleuleuleugluasnglyalaglualaala
195200205
alaargleuvalgluseralaaspvalaspvalileserphethrgly
210215220
serthrgluvalglylysargilemetargalaalaalaaspsermet
225230235240
lysargleuserleugluleuglyglylyssercyscysleuvalphe
245250255
gluaspseraspvallysalailealaproargleualaargalaala
260265270
thrileileserglyglnglncysthralaalaargargileleuval
275280285
hisvalserlysalaaspglnmetargaspgluleuvallysalaleu
290295300
alaserleulysvalglyproglyileaspproalaseraspilegly
305310315320
alaleuileaspalaalaserargaspalavalglnthrthrvalglu
325330335
argalacysaspleualaaspargvalleuleuargglythrserser
340345350
glyproglyalapheleuserprothrleuvalgluhisglyglupro
355360365
hisalaphephecysglnaspgluilepheglyprophevalthrleu
370375380
gluthrphevalthrglulysglualavalglulysalaasnasnthr
385390395400
valpheglyleuseralaservaltrpthrhisaspseralaargala
405410415
pheargilealaargalaleuargaspglythrvaltrpileasnasp
420425430
hisasnargleuphealaglualagluthrglyglytyrargglnser
435440445
glyleuglyargleuhisglytyraspalaleualaaspphethrglu
450455460
ilelyshisilecysvalglyalaglyvalleugluglyilegluval
465470475480
leuglyser
<210>27
<211>483
<212>prt
<213>azospirillumsp.b510
<400>27
metthrasnleuaspserarghistrpileaspglyalatrpvalpro
151015
glythraspargphealaserileasnproalaaspglyservalleu
202530
glyhisalaalaaspglyglyargalaglualaglualaalaileala
354045
alaalahisalaalapheasnargproasptrpalaglnasnproarg
505560
leuargglnserileleuleuglytrpalaaspargleuaspthrgln
65707580
alagluaspleualaargleuleuthrleugluasnglylysalaile
859095
alaglnserargglygluilealaglyalailesergluileargtyr
100105110
tyrglyglyleualaarghisvalproglyhisvalleugluvalglu
115120125
proglyvalleuserthrmetleuarggluproalaglyvalalaala
130135140
leuileileprotrpasnalaproalavalleuleualaargalaile
145150155160
glyproalaleualacysglycysthrvalvalvallysproalaala
165170175
glnthrthrleuleuthralaalapheleuargalaleusergluval
180185190
proserleuproargglyvalcysasnmetilesergluthrglyhis
195200205
alaalaalaalaargleuvalaspserproleuvalaspvalvalser
210215220
phethrglyserthralathrglylysargilemetvalalaalaala
225230235240
aspthrmetlyslysleuserleugluleuglyglylyssercyscys
245250255
leuvalpheproaspalaaspproalagluthralaalaargileala
260265270
thralaalathrileileserglyglnglncysthralaalaargarg
275280285
valleuvalhisalaseralapheaspalametlysthrhisleuarg
290295300
alaalaleualaalametthrvalglyasnglyleuaspproalaile
305310315320
argmetglyproleuileaspargproalaargaspglnvalglnthr
325330335
glnvalgluargalapheaspalacysaspgluvalleuleuarggly
340345350
glyvalprothraspserproalaalaalaserpheleuthrproser
355360365
leuvalalahisaspaspproseralaphephecysglnaspgluile
370375380
pheglyprophevalvalleugluargphegluthrglualagluala
385390395400
valalalysalaasnasnthrvalpheglyleuseralaservaltrp
405410415
thrargaspglyalaargalaleuargmetalaargalaleuargasn
420425430
glythrvaltrpileasnasphisasnargleuphealaglualaglu
435440445
thrglyglytyrargglnserglyleuglyargleuhisglytyrasp
450455460
alaphealaaspphethrgluleulyshisvalcysglnthrvalgly
465470475480
thrilegly
<210>28
<211>480
<212>prt
<213>pseudomonasputida
<400>28
metglnserglnhistyrileaspglyglntrpthrserthrasparg
151015
trpthraspserleuaspproalaserglygluleuileglycysphe
202530
alaaspglyglyglualaglualaglualaalavalalaalaalaala
354045
argalapheasnaspproglntrpalaglnasnproargleuarggln
505560
glnleuleuleuglutrpalaalaglyleulysalaargglnglugln
65707580
leualaglnleuleuthrarggluasnglylysalaleualaglnser
859095
argglygluileglyglyalailesergluileleutyrtyralagly
100105110
leualaarghisasnproglyhismetleugluvalalaproglyglu
115120125
phesersermetleuarggluproalaglyvalalaglyleuileile
130135140
protrpasnalaproalavalleuleuvalargalaleualaproala
145150155160
ilealaalaglycysthrvalvalilelysproalaproglnthrala
165170175
leupheasnalaalametleugluproleuphealaleuproglyleu
180185190
proalaglyalavalasnleuphealagluserglyhisalaglyala
195200205
alahisleuvalalaserproargvalaspvalleuserphethrgly
210215220
serthralathrglyglnargilemetargaspcysalaalathrmet
225230235240
lyslysleuserleugluleuglyglylyssercyscysleuvalphe
245250255
gluaspalaaspilealaalailealaprolysleualaalaalaala
260265270
thrileileserglyglnglncysthralaalaargargvalleuval
275280285
hisalaserargphealaglumetlysthralaleuseralaalaleu
290295300
glyglnileargleuglyasnglyleuaspproalaasnasnmetgly
305310315320
proleuileasptrphisserargaspservalgluargargilegly
325330335
glualaleuaspsercysaspgluvalleuleualaglyglyargpro
340345350
glnglygluleuserlysglyalapheleualaproserleuileala
355360365
hisargaspserseralaphephecysglnglugluilepheglypro
370375380
leuleuvalleugluserphegluaspgluthrglualavalalaarg
385390395400
alaasnhisthrglupheglyleuseralaservaltrpthraspgln
405410415
glyalaargalatrpargvalalaargalaleuargasnglythrval
420425430
trpleuasnasphisasnargleuphealaglualagluthrglygly
435440445
tyrarglysserglyleuglyargleuhisglyvalaspalaleuleu
450455460
aspphesergluleulyshisiletyrglnasnvalglythrleugly
465470475480
<210>29
<211>486
<212>prt
<213>rhodopseudomonaspalustris
<400>29
metglymetthralaleuhisalaaspasnleuileaspglyalatrp
151015
glnproalaglnserglyalathralaproserleuaspproserser
202530
glyglythrileglyglyphealaalaglyglyalaalaaspalagln
354045
alaalavalalaalaalaargargalaphegluargproglutrpser
505560
glnasnproargalaargglnmetvalmetleuargtrpalaasparg
65707580
metglualaglnalaaspglnleualaargleuleuthrleugluasn
859095
glylysproleuproglnserargglygluilealaglyservalser
100105110
gluileargtyrtyralaglyleuthrargtyrileproglyhisval
115120125
phegluvalgluproglyserpheserthrleuleulysgluproala
130135140
glyvalalaglyleuileileprotrpasnalaproalavalleuleu
145150155160
ileargalaleuthrproalaleualaalaglycysthrvalvalile
165170175
lysproalaproglnthralaglnilethralaalaileilelyscys
180185190
leuhisgluvalaspglyleuproargglyvalvalasnleuvalser
195200205
gluglnglyhisglnvalalagluhisleuvalthrserasnaspval
210215220
aspvalileserphethrglyserasnalathrglyalaargilemet
225230235240
alaalaalaalaprothrmetlyslysleuserleugluleuglygly
245250255
lysseralacysleuvalpheaspaspalaaspilealaaspvalala
260265270
prolysleualaalaalaalathrileilealaglyglnglncysthr
275280285
alaalaargargvalleuvalhisalaserargtyraspglumetlys
290295300
alaalaleulysalaalaleualaasnileargilealaproglyser
305310315320
alaalaglyalaglumetglyproleuileaspalaalaserleuala
325330335
alavalalalysargalaaspglualametglnalaalaaspgluval
340345350
valleuargglyglyargproalaglyaspleualaasnglytyrphe
355360365
leuserprothrleuvalalahisargaspthrseralaphepheval
370375380
glnglugluilepheglyproleuvalvalleuglulysphegluasp
385390395400
glulysglualavalalaargalaasnhisserasptyrglyleuser
405410415
alaservaltrpthrhisaspglyalaargalametargvalalaarg
420425430
alaleuargasnglythrvaltrpileasnasphisasnlysleuphe
435440445
alaglualagluthrglyglytyrargargserglyleuglyargleu
450455460
hisglytyraspalaleuileasppheleugluilelyshisvaltyr
465470475480
glnsercysglyvalval
485
<210>30
<211>485
<212>prt
<213>dinoroseobactershibaedfl12
<400>30
metthrthrthraspleuilealaarghismetileglyglysertyr
151015
seraspalaglyasplysilealaserileasnproalathrglyala
202530
valvalglyhisvalargalaaspglyalaalaglnalathralaala
354045
ilealaalaalaargalaalapheaspthrthrleutrpproglnser
505560
proargaspargglnmetalaleuleuargtrpalaaspalaleuglu
65707580
alaaspleualaargleualagluleuleuthrleuthrasnglylys
859095
proleuglyalaserlysglygluleuglyalaalailesergluile
100105110
argtyrtyralaglyleuthrarghisasnproglyhisalametglu
115120125
valalaproglygluleuservalmetleuarggluproalaglyval
130135140
alaglyileilevalprotrpasnalaproalavalleuleuilearg
145150155160
serleualaproalaleualavalglycysthrthrvalthrlyspro
165170175
alaproglnthralaleuphethralaalacysmetalaproleuphe
180185190
gluaspalaalaileproalaglyvalvalasnvalvalphegluval
195200205
glyhisaspalaalaglnthrleuvalthrserproaspvalaspval
210215220
ileserphethrglyserasnalavalglyglnargilemetalaasp
225230235240
alaalaprothrmetlyslysleuserleugluleuglyglylysser
245250255
cyscysilevalleuaspaspalaaspileglyvalvalalaprolys
260265270
leualaalaalaalathrileileserglyglnglncysthralaala
275280285
argargvalleuvalhisgluserargleuaspglualalysserala
290295300
leuseralaalaleuglnalavalserileglyaspglymetserasp
305310315320
glythralametglyproleuileaspileglnserargaspargval
325330335
metargaspcysglythrvaltyraspthralaaspgluvalvalleu
340345350
argglyglyproleuaspglyprolysglyseralaphemetserpro
355360365
alaleuvalvalhisseraspproasnalaserphevalglnaspglu
370375380
ilepheglyproleuvalvalleugluthrpheargaspglualaasp
385390395400
alavalalalysalaasnasnthrvaltyrglyleuseralaserile
405410415
trpthrhisargglyaspalasertrpargleualaargalaleuarg
420425430
asnglythrvaltrpileasnasphisasnargleuphealagluala
435440445
gluthrglyglytyrargargserglyleuglyargleuhisglyphe
450455460
aspglyleuleuaspphecysgluleulyshisvaltyrglnasnval
465470475480
glyvalvalglyhis
485
<210>31
<211>447
<212>prt
<213>cupriavidusbasilensis
<400>31
metglualavalalalyslysargthrgluthrileserglualaleu
151015
proalaalathrasnargglnvalpheglyalavalthralasercys
202530
metglytrpalaleuaspleupheaspleupheileleuleupheval
354045
alaprovalileglyargleuphepheprosergluhisalametleu
505560
serleualaalavaltyralaserphealavalthrleuleumetarg
65707580
proleuglyseralailepheglythrtyralaasparghisglyarg
859095
lysglyalametvalvalalavalthrglyvalglyleuserthrala
100105110
alapheglyleuleuprothrvalglyglnvalglyleuleualapro
115120125
alaleupheileleuleuargleuvalglnglyilephevalglygly
130135140
valvalalaserthrhisthrileglythrgluservalproproser
145150155160
trpargglyalavalserglyleuvalglyglyglyglyalaglyile
165170175
glyalaleuleualaserilethrtyrmetalametthralaleuphe
180185190
proglyglualapheaspalatrpglytrpargcysmetphepheser
195200205
glyileileserservalleuglyleupheilepheasnserleuglu
210215220
gluserproleutrplysglnleuglnalaalalysglyhisalaala
225230235240
provalgluasnproleuargvalilepheserargglntyrarggly
245250255
valleuphevalasnileleuleuthrvalglyglyglyseralatyr
260265270
tyrleuthrserglytyrleuprothrpheleulysvalvalvallys
275280285
alaproalaglyalaseralaalaileleumetalaserservalgly
290295300
valilevalalaserileilealaglyhisleuserthrleuilegly
305310315320
arglysargalapheleuleuileglyalaleuasnvalvalleuleu
325330335
proleuiletyrglnargmetproalaalaproaspvalthrthrleu
340345350
glyiletyralavalalaleualametleuglyserthrglypheala
355360365
proileleuilepheleuasngluargpheprothrserileargala
370375380
thrglythrglyleusertrpasnileglyphealaileglyglymet
385390395400
metprothrphealaserleucysalaserthrproalaaspleupro
405410415
lysvalleuglyilephevalalavalvalthralailetyrleuala
420425430
glyalaalailevalprogluthralaglyargleuglyglulys
435440445
<210>32
<211>449
<212>prt
<213>cupriavidusbasilensis
<400>32
metglualavalalalyslysseralaalathrileserglualaleu
151015
proalaalaserasnargglnvalpheglyalavalalaalasercys
202530
metglytrpalaleuaspleupheaspleupheileleuleupheval
354045
alaprovalileglyargleuphepheprosergluhisalametleu
505560
serleualaalavaltyralaserphealavalthrleuleumetarg
65707580
proleuglyseralailepheglysertyralaasparghisglyarg
859095
lysglyalametvalvalalavalthrglyvalglyleuserthrala
100105110
alapheglyleuleuprothrvalglyglnvalglyleuleualapro
115120125
alaleupheileleuleuargleuvalglnglyilephevalglygly
130135140
valvalalaserthrhisthrileglythrgluservalproproser
145150155160
trpargglyalavalserglyleuvalglyglyglyglyalaglyleu
165170175
glyalaleuleualaserilethrtyrmetalametthralaleuphe
180185190
proglyglualapheaspalatrpglytrpargcysmetphepheser
195200205
glyileileserservalleuglyleupheilepheasnserleuglu
210215220
gluserproleutrplysglnleuglnalaalalysglyhisalaala
225230235240
provalgluasnproleuargvalilepheserargglntyrarggly
245250255
valleuphevalasnileleuleuthrvalglyglyglyseralatyr
260265270
tyrleuthrserglytyrleuprothrpheleulysvalvalvallys
275280285
alaseralaglygluseralaalaileleumetalaserserleugly
290295300
valilevalalaserileleualaglyhisleuserthrmetilegly
305310315320
arglysargalapheleuleuileglyalaleuasnvalvalvalleu
325330335
proleuleutyrglntrpmetproalaalaproaspthrthrthrleu
340345350
glyleutyralavalvalleusermetleuglycysserglypheala
355360365
proileleuilepheleuasngluargpheprothrserileargala
370375380
thrglythrglyleusertrpasnileglyphealavalglyglymet
385390395400
metprothrphealaserleucysalaserthrproalagluleupro
405410415
metvalleuglyilepheleualavalvalthrileiletyrleuval
420425430
glyalapheilevalprogluthrvalglyargleuglyaspasngly
435440445
ala
<210>33
<211>449
<212>prt
<213>methylobacteriumradiotolerans
<400>33
metglnthralaalathrphealaseraspproproalaleualalys
151015
prothrglyargglnthrvalthralaalametalaserleuphegly
202530
trpglyleuaspleupheaspleupheileleuleutyrvalalapro
354045
valvalglythrleuphepheproalaasplysprometleuserleu
505560
alaglyalatyralaserphealavalthrleuleuileargproleu
65707580
glyseralaleupheglysertyralaaspargpheglyargargarg
859095
alaleumetvalalavalvalglyvalglyileserthralavalphe
100105110
glyleuleuprothrvalglyglnileglytrpleualathralaval
115120125
pheleuphepheargleuvalglnglyilephevalglyglyvalval
130135140
alaalaserhisthrileglythrgluservalprogluargtrparg
145150155160
glyleumetserglyalavalglyglyglyglyseralaileglygly
165170175
leuleualaserleuvalphetyrvalvalserleumetalaprogly
180185190
glualaphealaglutrpglytrpargleumetphepheserglyleu
195200205
leuthrservalileglyleuileleupheargasnleuglugluser
210215220
proilephelysgluleuglnalaarglysalaalaleuargalagly
225230235240
alaproalaglualaserproileargserleupheserproserasn
245250255
argglyserphealavalalathrleuileserpheglyglyglyala
260265270
alatyrtyrleuthrserglytyrleuprothrleuleulysleuval
275280285
asnglyvalproasnalathralasermetileleuileglyalaasn
290295300
valalaalaalaileglyalacysglymetglygluleuserglnhis
305310315320
ileglyarglysargserpheleuleumetglyvalileargleuleu
325330335
alapheproalaleupheleuthrmetalaasnthrthrserleuval
340345350
glyvalalaalacysalapheleuleualaleuilealaasnglyser
355360365
tyrglyproleuleuilepheleuasnglulyspheprothralaval
370375380
argalathrglythrglyleuthrtrpasnileglyphealaleugly
385390395400
glymetleuprothrleuvalserleuvalalaaspglyprothrgln
405410415
ileprometvalleualavalilethrthrglyvalthrleuvaltyr
420425430
leuvalglyalapheleuthraspgluthrglnglyasnleuasparg
435440445
ala
<210>34
<211>443
<212>prt
<213>sulfolobusacidocaldarius
<400>34
metlyslysgluglulysphethrserasnhisphelystrpthrleu
151015
alathrphephethrtrpthrpheaspleutyraspleuphethrile
202530
leuleuvalalaprotyrileserserleuphepheproserserile
354045
thrpheleuserilealaalathrtyralaglyphealathrserleu
505560
ilemetargprovalglyalathrvalpheglyserargvalserasp
65707580
lysvalglyarglysargalailephetyrglyleuileglyleuval
859095
ilethrserthrleuglnglyalaleuprothrtyrglnvalvalgly
100105110
valilealaproileleuleuleualavalargleuileglnglyval
115120125
pheileglyglyilethralaglyserhisvalileglyprogluser
130135140
valprogluargtyrargglyilevalglyglyleuglypheserala
145150155160
alaglyvalalatyrleuilealaalaglytrpphepheleuthrthr
165170175
ileleutyrproglysersertyrleuvaltrpglytrpargvalmet
180185190
phepheglyglyleuleuserleualavalleuglyphevalasntyr
195200205
leuvalproglusergluvaltrpthrlysilelyslysargglyser
210215220
valvallysserproleulysgluilepheserlystyrargtyrgln
225230235240
leuglyvalalaleuleuleuserileglytrpglyalaserphetyr
245250255
valthraspglyileleuprothrpheleuserservalasnlysleu
260265270
alalysthrgluilealailevalmetileileglyserileglymet
275280285
serileglyproleuileglyglygluileserglnileileglyarg
290295300
lysilethrserleuileglyalaileilevalleualavalvalgly
305310315320
proleupheleuserleuglyserleulysserglyaspleuasngln
325330335
ileileleuhisserphealaileleupheleuvalaspileglygly
340345350
glymetleumetthrtyrleuasngluiletyrproalaservalarg
355360365
glythrglyvalglyphethrtrpasnthrglyphealaileglygly
370375380
thrileprothrileileserleualavalalaseralaglyleuser
385390395400
alapheproserilemetphetyrthrleuilevalvalservalile
405410415
ileleuvalglythrvalleuthrlysgluthrlysglythrileser
420425430
lysgluglutyrgluileglnlysgluthrleu
435440
<210>35
<211>1240
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentforexpressionofalcohol
dehydrogenaseofaneurinibacillusterranovensis
<400>35
ggtaccgaattccacatgacaaggggagaccgcatgaccattagtccggcagttaaagcc60
atcaactttgaattttcatttaacctgccgaccctgatcgaatttggttatggtaaaatg120
gaaaaattcggccagcagctgattagcattggtgttaaacgcatttttatggtgaccgat180
aaaggtgttgaaagcgcaggtctgctggcagcactgaccgattcactgcaggcagcagca240
attcagtttgatatctataccgatgtggaaagcgatccgagcctggaaaccattgatcgt300
ggtgttgaagtttttcagcagaaaccgtatgattgcattgttgcagttggtggtggtagc360
ccgattgataccgcaaaaggtattcgtgttgttgcagcaaatggtggtaatattggtcat420
tatgccggtgttaatcagattccggttgcaccgaccattccgctgctggcaattccgacc480
accagtggcaccggtagcgaagttaccaattttggtgtttatagcgattggcagaacaac540
gttaaagttaccgttaccagccagtatatggcaccgacaattgcatgggttgatccggca600
ctgaccatgagcctgcctgcaaaaatgaccgcagcaagcggtattgatgcactggcacat660
ggtattgaaaccttttttagcctgggtagcagtccggcaagtgatgccctggcaattgaa720
gcaattcataccgttaatcgttatctgagccgtgcagttcataatggtagcgatatggaa780
gcacgtattggtatgagccatggtagcctgctggctggcatggcatttaacaatggtttt840
ctgggtctggcccatgccattggtagcgcactgagcggtcattgtcatgttccgcatggt900
gttgcaattggtctgctgctgccgaaagttgttgaatttaatgcaaccgttcgtccggat960
aaagcagcaaaaattgcaggtctgatgggtatgaaaggtgaacatagcgaagaactggcc1020
ctgcaggcatcaccggcagttgcacgtctggttgaagatattggcctgccgacacgtctg1080
cgtgaagttgatgttaccgaaaaaaaactgttcgagatcgccaaagatagctttaaaagc1140
ggcatgatgaaattcaatccgcgtcagccgagcgaaagcgaagttctgcagctgctgaaa1200
gaaatcttttgaagaccgaagcgaattcctcgagtctaga1240
<210>36
<211>1205
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentforexpressionofalcohol
dehydrogenaseofbrevibacillusthermoruber
<400>36
ggtacctaggaaaggaagattaacccatgagccagaccgtgcagggcaccgacttcgcct60
tcagcttccacctgccgaccctgatcgagttcggctacggccgcgccagccgcctgggcg120
agcgcctgcagcacctgggcgtgaccaacgtgttcgtggtgaccgacaagggcgtggagg180
ccgccggcctgctgaacggcctggtgggcagcctgcagagcgccggcatcgccttcgacc240
tgtacaccgaggtggagccggacccgggcctggagaccatcgaccgcggcgccgccgtgt300
tccgcgccaagccgtacgactgcctggtggccgtgggcggcggcagcccgatcgacgccg360
ccaagggcatgcgcgtggtgaccagctgcggcggcagcatcgccgactacgccggcgtga420
accgcgtgccgatggccccggccgtgccgctggtggccgtgccgaccaccagcggcaccg480
gcagcgaggtgaccatgttcggcgtgtacagcgactggcacaaccacgtgaaggtgaccg540
tgaccagcccgcacatggccccgaccatcgccctggtggacccggccctgaccgtgagcc600
tgccggccaagatgaccgccgccagcggcatcgacgccctggcccacggcatcgagacct660
tcttcagcgtgcgcagccgcccggccagcgacgccctggccatggaggccatcgccgccg720
tgaacgcccacctgcgccgcgccgtgcacgacggcagcgacgtggaggcccgcatcggca780
tgagccacggcagcctgctggccggcatggccttcaccaacggcttcctgggcctggccc840
acgccatcggcagcgccctgagcggccactgccacgtgccgcacggcatcgccatcggcc900
tgctgctgccgcacgtggtggccttcaacgccccggcccgcccggacaaggccgcccagc960
tggcccgcctgctgggcgtggaggccaacccgcgcgaggagcgcggcgaggagaccagcg1020
ccgccgtggcccgcatggtggccgacatcggcctgccgacccgcctgcgcgacgtgggcg1080
tgccggaggagaagctgccggccatcgccaaggacgccttcaagagcggcatgatgacct1140
gcaacccgcgccagccgaccgagcaggaggtgcgcgagctgctgcgccgcgccttctgag1200
ctagc1205
<210>37
<211>1228
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentforexpressionofalcohol
dehydrogenaseofbrevibacilluspanacihumi
<400>37
ggtaccgaattccacatgacaaggggagaccgcatgagcgcaaatcagagcgttcagggt60
attgaaagcccgtttagctttcatctgccgaccaatgttcagtttggtgttggtagcgca120
agccgtctgggtgaaatgctgctgagcatgggtgttcgtcgtgtttttctggttaccgat180
cagggtgtgcgtcaggcaggtctgctggatgaagttattcatagcctggaagaaaaaggc240
ctgcactttcagatttatgcagatgttgaaccggatccgagcctggaaaccattcaggca300
ggcgcagcaatgtttcagcagcagagctttgattgtatggttgcaattggtggtggtagt360
ccgattgataccgcaaaaggtattcgtgttctggcagcaaatggtggcggtattggtcag420
tatgccggtgttaatcgcgttccggcagcaagcgcaattccgctgattgcaattccgacc480
accagtggcaccggtagcgaagttaccatttttggtgtttatagcgattgggagaaccac540
gtgaaaattaccgttaccagtccgcatatggcaccgagcaccgcactgattgatccggca600
ctgaccctgagcctgcctgcaaaaatgaccgcagcaaccggtattgatgcactggcacat660
ggcattgaaaccttttttagcctgcgtagcagtccggcaagtgatgccctggcaattcat720
gcaatgaaaatgattgcaccgcatctgcgtcgtgcagttcgtgatggtgcagatatggaa780
gcacgtattggtatgagccagggtagcgtgctggcaggtatggcatttaacaatggtttt840
ctgggtctggcccatgccattggtagtgcactgagcggtcattgtcatgttccgcatggt900
gttgcgattggcctgctgctgccgcatgtggttgcatttaatacaccggttcgtccggaa960
aaagcagaactgattgccgatgttctgggtagcgttcagaaagaaaccggcaccgcagcc1020
gaactggttggtcagctggttcaggatattggtctgccgcagcgtctgcaagaagttggc1080
gttccggaagcgaaactggttgatattgcaaaagatagctttaaaagcggcatgatgaaa1140
tggaatccgcgtctgccgacagaacaagaagttctggaactgctgcagaaagccttttga1200
agaccgaagcgaattcctcgagtctaga1228
<210>38
<211>1184
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentforexpressionofalcohol
dehydrogenaseofbacillussp.fjat-14578
<400>38
ggtacctaggaaaggaagattaacccatgtacccgagcttcgagttccacctgccgacca60
agatccacttcggctacaacaccatcaagcagctggaccacctgccgttcgagatcaagc120
gcgccttcatcgtgaccgaccagggcgtgctgaacagcggcctggtggagaacgtgacca180
acatcctgaaggaccaccagatcagctacgtgatctacagcgaggtggagccggacccga240
gcgtggagaccgtggacaaggccgcccagatgttccagcgcgaggaggccgacgccctga300
tcgccatcggcggcggcagcccgatcgacaccgccaagggcgtgcgcgtgatcgccggca360
acggcggcagcatccgcgactacgccggcgtgaacctgatcaagcagaagagcaacatcc420
cgctgatcgccatcccgaccaccagcggcaccggcagcgaggtgaccatcttcgccgtgt480
tcagcgactgggaggagaaccgcaaggtgaccgtgaccagcccgttcctggccccggaca540
tcagcatcgtggacccgaagatgaccatgaccgccccgccggccatcaccgccgccagcg600
gcttcgacgccttcgcccacggcgccgagaccttcgtgagccgcgccagccagccggcca660
gcgacgtgctggccttcagcgccatgagcaccgtgagcaagtacctgcgccgcgccgtgt720
acaacggcgaggacgtggaggcccgcatcaagatggccgaggccagcctgctggccggca780
tggccttcaaccagagctacctgggcctgacccacgccatcggcagcgccctgagcggcc840
acgcccacgtgagccacggcgtggccatcggcctgctgctgccgggcgtgatccgctaca900
acagcatcagccgcatggacaagcacatcgagatggccggcgccttccgcgagatcgacc960
gcagcctgagcgactgggagatcatcgaccagctgatcgaggacgtgagccgcctgcgcg1020
acgacatcggcctgccgcagcgcctgcagcaggtgggcgtgaaggaggaccagctgaaga1080
tgatcgccgccgacagcgtgaagagcggcatgtggaagttcaacccgcgccaggccagcg1140
aggaggagatcctggagctgctgaaggagctgtactgagctagc1184
<210>39
<211>1184
<212>dna
<213>artificial
<220>
<223>synthetickpni-nheifragmentforexpressionofalcohol
dehydrogenaseofbacillussp.l1(2012)
<400>39
ggtacctaggaaaggaagattaacccatgtacaccagcttcaacttccacctgccgaccc60
gcatccagttcggctacgagaaggtgaaggagctgaagaacctgccgttccaggccaacc120
gcgccttcatcgtgaccgacaagggcgtggagaaggccggcctgctgaacgacgtgatcg180
acgccatcaagcaggccaacatgacctacaagatctaccgcgacgtggagccggacccga240
gcgtggagaccgtggacaaggccgccaaggccttcgccgaggccgagtgcgacctgctga300
tcgccgtgggcggcggcagcccgatcgacaccgccaagggcgtgcgcgtggtggccagca360
acggcggcagcatccgcaactacagcggcgtgaacctggtgaaggaggccccgagcgtgc420
cgctggtggccatcccgaccaccgccggcaccggcagcgaggtgaccatcttcgccgtgt480
tcagcgacgacaaggagaaccgcaaggtgaccgtgaccagcagccacctgagcccggacg540
tgagcatcatcgacccgaagctgaccctgaccgccccgccgagcatcaccgccgccgccg600
gcttcgacgccttcgcccacgccgccgaggccttcgtgagccgcatcagccagccgccga660
gcgacgccctggccctgagcgccatgaagaccgtgcacacctacctgcgccgcgccgtgt720
acaacggcgacgacatcgaggcccgcatgaagatggccgaggccagcctgctggccggca780
tggccttcaaccagagctacctgggcctggcccacgccatcggcagcgccatcagcgtgc840
acgcccacgtgagccacggcgtggtgatcggcctgctgctgccgaaggtgatcgagtaca900
acctggtggccaagatcgacaagtacgccgaggccggcaagtacatcgagcagagcagcc960
acggcctgagcaactacgaggccgccgccctgttcagcgagaccgtgacccagctgcgca1020
acgacatcggcctgccgaagcagctgcgcgaggtgaacgtgaaggaggcccagctggagg1080
ccatcagcaaggacagcatcaagagcggcatgtggcagttcaacccgcgccgcgccagcg1140
agcaggacgtgtaccagatgctgcgcgagatgctgtgagctagc1184
<210>40
<211>27
<212>dna
<213>artificial
<220>
<223>ribosomebindingsitecontainingspacerno.2
<400>40
gaattccacatgacaaggggagaccgc27